CN1688711A

CN1688711A - 在遗传修饰生物中制备酮类胡萝卜素的方法

Info

Publication number: CN1688711A
Application number: CNA038242249A
Authority: CN
Inventors: M·绍尔; R·弗拉赫曼; M·克勒布萨特尔; C·R·朔普费尔
Original assignee: SunGene GmbH
Current assignee: SunGene GmbH
Priority date: 2002-08-20
Filing date: 2003-08-18
Publication date: 2005-10-26
Also published as: CN1688712A; CN1688713A; DE10238980A1

Abstract

本发明涉及通过培养遗传修饰的生物来制备酮类胡萝卜素的方法、还涉及遗传修饰的生物和它们作为食品和饲料的用途以及用于制备酮类胡萝卜素提取物的用途，其中，所述遗传修饰的生物与野生型相比具有改变的酮酶活性。

Description

在遗传修饰生物中制备酮类胡萝卜素的方法

发明领域

本发明涉及通过培养遗传修饰的生物来制备酮类胡萝卜素的方法、还涉及遗传修饰的生物和它们作为人和动物食物的用途，以及用于制备酮类胡萝卜素提取物的用途，所述遗传修饰的生物与野生型相比具有改变的酮酶活性。

背景技术

类胡萝卜素从头合成于细菌、藻类、真菌和植物中。酮类胡萝卜素(ketocarotenoid，即至少含有一个酮基的类胡萝卜素，例如虾青素(Astaxanthin)、角黄素(Canthaxanthin)、海胆酮(echinenone)、3-羟基海胆酮(3-Hydroxyechinenon)、3’-羟基海胆酮(3′-Hydroxyechinenone)、adonirubin和金盏花黄质(adonixanthin))是由一些藻类和微生物作为次生代谢物产生的天然抗氧化剂和色素。

由于其着色特征，酮类胡萝卜素(特别是虾青素)被作为畜禽营养物的色素辅料，特别是用于鲑鱼、大马哈鱼和虾的饲养中。

目前主要通过化学合成方法制备虾青素。天然酮类胡萝卜素(如天然虾青素)目前通过培养藻类(如雨生红球藻(Haematococcus pluvialis))或发酵遗传优化的微生物并随后分离的生物技术方法少量获得。

因此，经济的制备天然酮类胡萝卜素的生物技术方法非常重要。

已从多种生物中分离出编码酮酶的核酸和相应的蛋白质序列，并进行了注释，如来自Agrobacterium aurantiacum(EP 735 137，注册号D58420)、产碱菌属种PC-1(Alcaligenes sp.PC-1)(EP 735137，注册号D58422)、雨生红球藻Flotow em.Wille(Haematococcus pluvialis Flotow em.Wille)、雨生红球藻，NIES-144(EP 725137，WO 98/18910和Lotan等人，FEBS Letters1995，364，125-128，注册号：X86782和D45881)、Paracoccus marcusii(注册号：Y15112)、集胞藻属PC6803株(Synechocystis sp.Strain PC6803)(注册号：NP_442491)、慢生根瘤菌属种(Bradyrhizobium sp.)(注册号：AF218415)和念珠藻属种(Nostoc sp.)PCC 7120(Kaneko等人，DNA Res.2001，8(5)，205-213；注册号：AP003592，BAB74888)的编码酮酶的核酸。

EP 735 137描述了通过向微生物引入来自Agrobacteriumaurantiacum或碱杆菌属PC-1的酮酶基因(crtW)，在微生物(如大肠杆菌)中制备叶黄素(xanthophylls)的方法。

EP 725 137、WO 98/18910、Kajiwara等人(Plant Mol.Biol.1995，29，343-352)和Hirschberg等人(FEBS Letters 1995，364，125-128)公开了通过向大肠杆菌引入来自雨生红球藻的酮酶基因(crtW、crtO或bkt)来制备虾青素的方法。

Hirschberg等人(FEBS Letters 1997，404，129-134)描述了通过引入来自雨生红球藻的酮酶基因(crtO)在聚球藻(Synechococcus)中制备虾青素的方法。Sandmann等人(Photochemistry and Photobiology 2001，73(5)，551-55)描述了一种类似的方法，然而这种方法导致角黄素的产生，并只获得痕量的虾青素。

WO 98/18910和Hirschberg等人(Nature Biotechnology 2000，18(8)，888-892)描述了通过向烟草引入来自雨生红球藻的酮酶基因(crtO)，在烟草花的蜜腺中合成酮类胡萝卜素。

WO 01/20011描述了在油料种子作物(如欧洲油菜、向日葵、大豆和芥菜)的种子中产生酮类胡萝卜素的DNA构建体，所述构建体使用种子特异的启动子和来自雨生红球藻的酮酶。

现有技术中描述的所有制备酮类胡萝卜素的方法(特别是描述的制备虾青素的方法)具有转基因生物产生大量羟化副产物(如玉米黄质和金盏花黄质)的缺点。

发明概述

本发明的目的之一是提供通过培养遗传修饰的生物来制备酮类胡萝卜素的方法，并且还提供产生酮类胡萝卜素的遗传修饰生物，本发明的生物体彻底杜绝以上描述的现有技术的缺点，或将其降到更小的程度。

我们发现利用通过培养遗传修饰的生物来制备酮类胡萝卜素的方法能够实现这一目标，所述遗传修饰生物的酮酶活性相对于野生型的发生改变，改变的酮酶活性来自含有SEQ.ID.NO：2氨基酸序列或对SEQ.ID.NO：2序列进行置换、插入或缺失氨基酸后产生的在氨基酸水平上与这一序列具有至少42％一致性的序列的酮酶。

本发明生物(如微生物或植物)优选能够作为起始生物天然产生类胡萝卜素(如β-胡萝卜素或玉米黄质)或能够通过遗传修饰(如调节代谢途径或互补)来产生类胡萝卜素(如β-胡萝卜素或玉米黄质)。

一些生物作为起始或野生型生物已经能够产生酮类胡萝卜素(如虾青素或角黄素)。这些生物(如雨生红球藻、paracoccus marcusii、Xanthophyllomyces dendrorhous、环状芽孢杆菌(Bacillus circulans)、绿球藻(Chlorococcum)、Phaffia rhodozyma、侧金盏花属(adonis)、Neochloriswimmeri、原管藻(Protosiphon botryoides)、Scotiellopsis oocystiformis、Scenedesmus vacuolatus、Chlorela zofingiensis、Ankistrodesmus braunii、血红裸藻(Euglena sanguinea)、Bacillus atrophaeus、布拉霉(Blakeslea))作为起始或野生型生物已经具有酮酶活性。

因此，在本发明方法的一个实施方案中，使用的起始生物是作为野生型或起始生物已经具有酮酶活性的生物。在此实施方案中，遗传修饰使酮酶活性相对于野生型或起始生物而言增强。

酮酶活性指的是酮酶的酶活性。

酮酶指的是一种蛋白质，该蛋白质具有在类胡萝卜素的β-芷香酮环(任选取代的)上引入酮基的酶活性。

酮酶尤其指具有将β-胡萝卜素转变成角黄素的酶活性的蛋白质。

因此，酮酶活力指一定时间内由酮酶蛋白质转化的β-胡萝卜素的量或生成的角黄素的量。

因此，当酮酶活力相对于野生型增强时，在一定时间内由酮酶蛋白质转化的β-胡萝卜素的量或生成的角黄素的量相对于野生型而言增加。

高出的酮酶活力优选至少是野生型酮酶活力的5％，更优选的至少20％、更优选的至少50％、更优选的至少100％、优选至少300％、更优选至少500％，特别是至少600％。

根据本发明，术语“野生型”指的是相应的起始生物。

根据上下文，术语“生物”可以指起始生物(野生型)或本发明遗传修饰的生物，或指二者。

在任何情况下，“野生型”指用作酮酶活力的增加或产生、此后描述的羟化酶活力的增加、此后描述的β-环化酶活力的增加及酮类胡萝卜素含量的增加的参照的参照生物，优选并且特别是在不能明确指定生物或野生型的情况下。

对于作为野生型已具有酮酶活力的微生物而言，参照生物优选雨生红球藻。

对于作为野生型不具有酮酶活力的微生物而言，参照生物优选布拉霉。

对于作为野生型已具有酮酶活力的植物而言，参照生物优选夏侧金盏花(Adonis aestivalis)、火焰金盏花(Adonis flammeus)或Adonis annuus，特别优选的是夏侧金盏花。

对于作为野生型在花瓣中不具有酮酶活力的植物而言，参照生物优选万寿菊(Tagetes erecta)、孔雀草(Tagetes patula)、香叶万寿菊(Tageteslucida)、Tagetes pringlei、Tagetes palmeri、Tagetes minuta或Tagetescampanulata，特别优选的是万寿菊。

优选在以下条件测定本发明遗传修饰的生物和野生型以及参照生物的酮酶活力：

植物或微生物材料中酮酶活力的测定基于Frazer等人的方法(J.Biol.Chem.272(10)：6128-6135，1997)。使用β-胡萝卜素和角黄素底物，在脂质(大豆卵磷脂)和去污剂(胆酸钠)存在的情况下测定植物或微生物提取物的酮酶活力。通过HPLC手段测量酮酶试验的底物/产物比例。

有多种可以增加酮酶活力的方式，如通过在翻译和蛋白质水平关闭抑制性调节机制或通过相对于野生型增加编码酮酶的核酸的基因表达(如通过激活剂诱导酮酶基因或通过向生物引入编码酮酶的核酸)。

在此实施方案中，根据本发明，增加编码酮酶的核酸的基因表达也指操纵生物体自身的内源酮酶的表达。可以通过如修饰酮酶编码基因的启动子DNA序列来实现这一点。也可以通过缺失或插入DNA序列来实现这类导致至少改变或优选地增加一种内源酮酶基因的表达率的修饰。

如前文所述，可以通过应用外源刺激来改变至少一种内源酮酶的表达。可以通过特定的生理条件(即通过应用外源物质)来实现这一点。

还有的实现至少增加一种内源酮酶基因表达的可能方案是使用在野生型生物中不具有的或被修饰后与酮酶基因的启动子相作用的调节蛋白。

这类调节物可以是如WO 96/06166中所描述的由DNA结合域和转录激活域所组成的嵌合蛋白质。

在一个优选的实施方案中，通过增加编码酮酶的核酸的基因表达来实现酮酶活力相对于野生型的增加，所述核酸编码的酮酶含有SEQ.ID.NO.2氨基酸序列或对SEQ.ID.NO.2序列进行置换、插入或缺失氨基酸后产生的与这一序列在氨基酸水平上具有至少42％一致性的序列。

在另一优选的实施方案中，通过向生物引入编码酮酶的核酸来增加编码酮酶的核酸的基因表达，其中所述酮酶具有SEQ.ID.NO.2氨基酸序列或对SEQ.ID.NO.2序列进行置换、插入或缺失氨基酸后产生的与这一序列在氨基酸水平上具有至少42％一致性的序列。

因此，在此实施方案中，相对于野生型，至少还有一个酮酶基因存在于本发明转基因生物中，该基因编码的酮酶含有SEQ.ID.NO.2氨基酸序列或对SEQ.ID.NO.2序列进行置换、插入或缺失氨基酸后产生的与这一序列在氨基酸水平上具有至少42％一致性的序列。

因此，在此实施方案中，本发明遗传修饰的生物具有至少一个编码酮酶的外源(即异源)核酸，或具有至少两个编码酮酶的内源核酸，其中所述酮酶含有SEQ.ID.NO.2氨基酸序列或对SEQ.ID.NO.2序列进行置换、插入或缺失氨基酸后产生的与这一序列在氨基酸水平上具有至少42％一致性的序列。

在本发明方法的另一优选实施方案中，用作起始生物的生物在野生型时不具有酮酶活性。

在此优选的实施方案中，遗传修饰使生物具有酮酶活性。因此，在此优选的实施方案中，本发明遗传修饰的生物相对于未经遗传修饰的野生型具有酮酶活性，并因此优选能够转基因表达含有SEQ.ID.NO.2氨基酸序列或对SEQ.ID.NO.2序列进行置换、插入或缺失氨基酸后产生的与这一序列在氨基酸水平上具有至少42％一致性的序列的酮酶。

在此优选的实施方案中，类似于前文描述的增加编码酮酶的核酸的基因表达，优选地通过向起始生物引入编码酮酶的核酸来造成编码酮酶的核酸的基因表达，其中所述核酸编码的酮酶含有SEQ.ID.NO.2氨基酸序列或对SEQ.ID.NO.2序列进行置换、插入或缺失氨基酸后产生的与这一序列在氨基酸水平上具有至少42％一致性的序列。

在两个实施方案中对于这一目的而言，原则上可以使用所有编码的酮酶含有SEQ.ID.NO.2氨基酸序列或对SEQ.ID.NO.2序列进行置换、插入或缺失氨基酸后产生的与这一序列在氨基酸水平上具有至少42％一致性的序列的核酸。

令人吃惊的是，相对于应用现有技术中使用的酮酶基因，使用本发明编码酮酶的核酸在本发明方法中导致具有更少量的羟化副产物的酮类胡萝卜素。

在本说明书中提及的所有核酸可以是如RNA、DNA或cDNA序列。

对于来源于真核生物并含有内含子的基因组酮酶序列，在宿主生物不能或不能通过改造来表达相应酮酶时，优选使用已经被加工的核酸序列，如相应的cDNA。

可以有利地用于本发明方法中的编码酮酶的核酸及含有SEQ.ID.NO：2氨基酸序列或对SEQ.ID.NO.2序列进行置换、插入或缺失氨基酸后产生的与这一序列在氨基酸水平上具有至少42％一致性的序列的相应酮酶的例子有来自以下的序列：

念珠藻(Nostoc sp.)PCC7120株(注册号：AP003592、BAB74888；核酸：SEQ ID NO：1，蛋白质SEQID NO：2)，

点形念珠藻(Nostoc punctiforme)ATTC 29133，核酸：Acc.No.NZ_AABC01000195，碱基对55,604到55,392(SEQ ID NO：3)；蛋白质：Acc.No.ZP_00111258(SEQ ID NO：4)(注释为推定的蛋白质)或

点形念珠藻(Nostoc punctiforme)ATTC 29133，核酸：Acc.No.NZ_AABC01000196，碱基对140,571到139,810(SEQ ID NO：5)，蛋白质：(SEQ ID NO：6)(无注释)

聚球藻属种(Synechococcus sp.)WH8102，核酸：Acc.No.NZ_AABD01000001，碱基对1,354,725-1,355,528(SEQ ID NO：46)，蛋白质：Acc.No.ZP_00115639(SEQ ID NO：47)(注释为推定的蛋白质)，

泡沫节球藻(Nodularia spumigena)NSOR10，(注册号：AY210783，AAO64399；核酸：SEQ ID NO：52，蛋白质：SEQ ID NO：53)

或衍生自所述序列的酮酶序列，如：

分别来自例如序列SEQ ID NO：4和SEQ ID NO：3的变异/突变的、序列SEQ ID NO：8或10的酮酶和相应核酸编码序列SEQ ID NO：7或SEQ ID NO：9，

分别来自如序列SEQ ID NO：6和SEQ ID NO：5的变异/突变的、序列SEQ ID NO：12或14的酮酶和相应核酸编码序列SEQ ID NO：11或SEQ ID NO：13，

分别来自如序列SEQ ID NO：47和SEQ ID NO：46的变异/突变的、序列SEQ ID NO：49或51的酮酶和相应核酸编码序列SEQ ID NO：48或SEQ ID NO：50，

可以容易的发现能够用于本发明方法的其它酮酶和酮酶基因的天然例子，例如比较数据库中的氨基酸序列或相应的反向翻译的核酸序列与前文描述的SEQ ID NO：2序列的一致性，可以从多种已知基因组序列的生物中发现其它酮酶和酮酶基因。

此外，还可以根据上述核酸序列，特别是根据SEQ ID NO：1序列，通过众所周知的杂交技术从多种未知基因组序列的生物中容易的发现其它酮酶及酮酶基因的天然例子。

可以在温和(低严紧性)或优选严紧(高严紧性)的条件下进行杂交。

这些类型的杂交条件描述于如Sambrook，J.，Fritsch，E.F.，Maniatis，T.，《Molecular Cloning(A Laboratory Manual)》，第二版，Cold SpringHarbor Laboratory Press，1989，9.31-9.57页或Current Protocols inMolecular Biology，John Wiley & Sons，N.Y.(1989)，6.3.1-6.3.6。

例如，洗涤步骤的条件可以从低严紧性(在50℃使用2X SSC)和高严紧性(在50℃，优选在65℃使用0.2X SSC)所限定的条件范围中选泽(20X SSC：0.3M柠檬酸钠，3M氯化钠，pH 7.0)。

在洗涤步骤中还可以将温度从温和条件的室温(22℃)上升到严紧条件的65℃。

可以同时改变盐浓度和温度参数，也可以保持两参数中的一个恒定，只改变另一个。在杂交过程中也可以使用变性剂，如甲酰胺或SDS。优选在42℃下进行存在50％甲酰胺的杂交。

以下给出了一些杂交条件和洗涤步骤的例子：

(1)杂交条件的例子

(i)65℃、4X SSC，或

(ii)45℃、6X SSC，或

(iii)68℃、6X SSC、100mg/ml变性鱼精DNA，或

(iv)68℃、6X SSC、0.5％ SDS、100mg/ml变性并片段化的鲑精DNA，或

(v)42℃、6X SSC、0.5％ SDS、100mg/ml变性并片段化的鲑精DNA、50％甲酰胺，或

(vi)42℃、50％甲酰胺、4X SSC，或

(vii)42℃、50％(vol/vol)甲酰胺、0.1％牛血清白蛋白、0.1％Ficoll、0.1％聚乙烯吡咯烷酮、50mM磷酸钠缓冲液(pH 6.5)、750mM NaCl、75mM柠檬酸钠，或

(viii)50℃、2X或4X SSC(温和条件)，或

(ix)42℃、30到40％甲酰胺、2X或4X SSC(温和条件)。

(2)使用如下条件的洗涤步骤，各10分钟

(i)50℃、0.015M NaCl/0.0015M柠檬酸钠/0.1％SDS，或

(ii)65℃、0.1X SSC，或

(iii)68℃、0.1X SSC、0.5％SDS，或

(iv)42℃、0.1X SSC、0.5％SDS、50％甲酰胺，或

(v)42℃、0.2X SSC、0.1％SDS，或

(vi)65℃、2X SSC(温和条件)。

在本发明方法的一个优选实施方案中，引入编码酮酶的核酸，其中所述酮酶含有SEQ.ID.NO：2氨基酸序列或对SEQ.ID.NO：2序列进行置换、插入或缺失氨基酸后产生的与这一序列在氨基酸水平上具有至少50％、优选至少60％、优选至少65％、优选至少70％、更优选至少75％、更优选至少80％、更优选至少85％、更优选至少90％、更优选至少95％、特别优选具有至少98％一致性的序列。

酮酶序列还可以是天然序列，该序列可以通过前文描述的方式利用序列一致性比较从其它生物发现，或者酮酶序列可以是对SEQ.ID.NO：2序列通过人工变异(如氨基酸的置换、插入或缺失)进行修饰而成的人工序列。

术语“置换”在本说明书中指一个或多个氨基酸被一个或多个氨基酸所替换。优选实施所谓的保守置换，其中替代的氨基酸与原来的氨基酸具有相似的性质，如Glu被Asp、Gln被Asn、Val被Ile、Leu被Ile、Ser被Thr所置换。

“缺失”是用直接的键接置换氨基酸。优选的缺失位置是多肽的末端和独立的蛋白质结构域之间的连接部位。

“插入”是通过用一个或多个氨基酸在形式上置换直接的键接来向多肽链引入氨基酸。

两个蛋白质之间的一致性指的是跨越各蛋白质全长的氨基酸的一致性，尤其是使用Informax(USA)提供的vector NTI 7.1版软件和clustal方法(Higgins DG，Sharp PM.Fast and sensitive multiple sequencealignments on a microcomputer.Comput Appl.Biosci.1989 Apr；5(2)：151-1)，设定下述参数，通过比较计算出的一致性：

序列多重比对参数：

空位开放罚分(gap opening penalty) 10

空位扩展罚分(gap extension penalty) 10

空位分离罚分范围 8

空位分离罚分(gap separation penalty) 关闭

用于序列比对延迟的一致性％ 40

(％identity for alignment delay)

残基特异性空位(Residue specific gap) 关闭

亲水残基空位(Hydrophilic residue gap) 关闭

转换权重(transition weighing) 0

成对序列比对参数：

FAST运算法则使用

K-tuple尺寸 1

空位罚分 3

窗口尺寸 5

最佳对角线数目(Number of best diagonals) 5

因此，与SEQ ID NO：2序列在氨基酸水平上具有至少42％一致性的酮酶指的是该酮酶的序列与SEQ ID NO：2序列相比(特别是使用基于以上设置的参数的上述程序对数)具有至少42％的一致性。

例如，使用基于以上设置的参数的上述程序对数，来自点形念珠藻(Nostoc punctiforme)A TTC 29133的酮酶序列(SEQ ID NO：4)表现出与来自念珠藻属种PCC7120株的酮酶序列(SEQ ID NO：2)有64％的一致性。

来自梅型念珠藻ATCC 29133的第二种酮酶的序列(SEQ ID NO：6)与例如来自念珠藻属种PCC7120株的酮酶序列(SEQ ID NO：2)具有58％的一致性。

来自聚球藻属种(Synechococcus sp.)WH8102的酮酶的序列(SEQ IDNO：47)与例如来自念珠藻属种PCC7120株的酮酶序列(SEQ ID NO：2)具有44％的一致性。

合适的核酸序列可以例如依据遗传密码，通过反向翻译多肽序列获得。

优选用于这一目的的密码子是基于生物特异的密码子选择被频繁使用的密码子。通过用计算机分析相关生物的其它已知基因，可以容易的发现此密码子选择。

在一特别优选的实施方案中，将含有SEQ ID NO：1序列的核酸引入生物。

此外，通过从核苷酸单元开始进行化学合成，可以以本身已知的方式制备上述所有酮酶基因，例如可以利用各单个重叠互补的双螺旋核酸单元的片段缩合来制备。可以化学合成寡核苷酸，例如通过已知方式的亚磷酰胺法(Voet，Voet，第二版，Wiley Press New York，896-897页)。添加合成的寡核苷酸、使用DNA聚合酶的Klenow片段填补间隙及连接反应和一般的克隆方法被描述于Sambrook等人(1989)，Molecular cloning：Alaboratory manual，Cold Spring Harbor Laboratory Press。

来自念珠藻属PCC7120株的酮酶序列(SEQ ID NO：2)与现有技术方法中使用的酮酶序列表现出39％(Agrobacterium aurantiacum(EP 735137)，注册号：D58420)、40％(产碱菌属种PC-1(EP 735137)，注册号：D58422)和20到21％(雨生红球藻Flotow em.Wille和雨生红球藻，NIES144(EP 725137，WO 98/18910和Lotan等人，FEBS Letters 1995，364，125-128)，注册号：X86782和D45881)的一致性。

在一个优选的实施方案中，培养相对于野生型除具有增强的酮酶活力外，还具有增强的羟化酶活力和/或β-环化酶活力的生物。

羟化酶活力指的是羟化酶的酶活力。

羟化酶指的是一种蛋白质，所述蛋白质具有在类胡萝卜素的β-芷香酮环(任选取代的)上引入羟基的酶活性。

羟化酶尤其指的是这样一种蛋白质，所述蛋白质具有将β-胡萝卜素转化成玉米黄质或将角黄素转化成虾青素的酶活性。

因此，羟化酶活力指的是由羟化酶蛋白质转化的β-胡萝卜素或角黄素的量，或生成的玉米黄质或虾青素的量。

因此，当羟化酶活力相对于野生型增加时，在一定时间内由羟化酶蛋白质转化的β-胡萝卜素或角黄素的量或生成的玉米黄质或虾青素的量相对于野生型而言增加。

高出的羟化酶活力优选至少是野生型羟化酶活力的5％，进一步优选至少20％、进一步优选至少50％、进一步优选至少100％、更优选至少300％、甚至更优选至少500％，特别是至少600％。

β-环化酶活力指的是β-环化酶的酶活力。

β-环化酶指的是一种蛋白质，所述蛋白质具有将末端的线性番茄红素残基转化成β-芷香酮环的酶活性。

β-环化酶尤其指的是这样一种蛋白质，所述蛋白质具有将γ-胡萝卜素转化成β-胡萝卜素的酶活性。

因此，β-环化酶活力指的是在一定时间内由β-环化酶蛋白质转变的γ-胡萝卜素的量，或生成的β-胡萝卜素的量。

因此，当β-环化酶活力相对于野生型增加时，在一定时间内由β-环化酶蛋白质转化的番茄红素或γ-胡萝卜素的量或从番茄红素产生的γ-胡萝卜素的量或从γ-胡萝卜素产生的β-胡萝卜素的量相对于野生型而言增加。

高出的β-环化酶活力优选至少是野生型β-环化酶活力的5％，进一步优选至少20％、进一步优选至少50％、进一步优选至少100％、更优选至少300％、甚至更优选至少500％，特别是至少600％。

优选在以下条件测定本发明遗传修饰生物和野生型以及参照生物的羟化酶活力：

由Bouvier等人的方法(Biochim.Biophys.Acta 1391(1998)，320-328)体外测定羟化酶活力。向规定量的生物提取物加入铁氧还蛋白、铁氧还蛋白-NADP氧化还原酶、过氧化氢酶、NADPH和β-胡萝卜素以及单和双半乳糖甘油酯。

特别优选在Bouvier、Keller、d′Harlingue和Camara(Xanthophyllbiosynthesis：molecular and functional characterization of carotenoidhydroxylases from pepper fruits(Capsicum annuum L.)；Biochim.Biophys.Acta 1391(1998)，320-328)的下述条件测定羟化酶活力：

在0.250ml的体积中进行体外分析。混合物含有50mM磷酸钾(pH7.6)、0.025mg菠菜铁氧还蛋白、0.5单位铁氧还蛋白-NADP⁺氧化还原酶、0.25mM NADPH、0.010mg β-胡萝卜素(在0.1mg Tween 80中乳化)、0.05mM的单和双半乳糖甘油酯混合物(1∶1)、1单位的过氧化氢酶(catalysis)、200单和双半乳糖甘油酯(1∶1)、0.2mg牛血清白蛋白和不同体积的生物提取物。在30℃将反应混合物孵育2小时。使用有机溶剂(如丙酮或氯仿/甲醇(2∶1))抽提反应产物，并通过HPLC测定。

优选在以下条件测定本发明遗传修饰生物和野生型以及参照生物的β-环化酶活力：

由Fraser和Sandmann的方法(Biochem.Biophys.Res.Comm.185(1)(1992)9-15)体外测定β-环化酶活力。向规定量的生物提取物加入作为缓冲液的磷酸钾(pH 7.6)、作为底物的番茄红素、以及红辣椒(paprika)基质蛋白质、NADP⁺、NADPH和ATP。

特别优选在Bouvier、d′Harlingue和Camara (Molecular Analysis ofcarotenoid cyclase inhibition；Arch.Biochem.Biophys.346(1)(1997)53-64)的下述条件测定β-环化酶活力：

在250μl的体积中进行体外分析。混合物含有50mM磷酸钾(pH 7.6)、不同量的生物提取物、20nM番茄红素、250μg红辣椒有色体基质蛋白质、0.2mM NADP⁺、0.2mM NADPH和1mM ATP。将NADP/NADPH和ATP溶解于含有1mg Tween 80的10ml乙醇后立即加入孵育介质。在30℃反应60分钟后，加入氯仿/甲醇(2∶1)终止反应。用氯仿抽提反应产物，并通过HPLC分析。

Fraser和Sandmann描述了一种使用放射性底物的替代性分析(Biochem.Biophys.Res.Comm.185(1)(1992)9-15)。

可以通过多种方式增加羟化酶和/或β-环化酶的活力，如通过在表达和蛋白质水平关闭抑制性调节机制或相对于野生型增加编码羟化酶和/或β-环化酶的核酸的基因表达。

同样有多种方式可以相对于野生型增加编码羟化酶和/或β-环化酶的核酸的基因表达，例如通过激活剂诱导羟化酶基因和/或β-环化酶基因，或向生物引入一个或多个羟化酶基因拷贝和/或β-环化酶基因拷贝，即向生物引入至少一个编码羟化酶的核酸和/或至少一个编码β-环化酶的核酸。

根据本发明，增加编码羟化酶和/或β-环化酶的核酸的基因表达也指操纵生物自身的内源羟化酶和/或β-环化酶的表达。

可以通过如修饰羟化酶和/或β-环化酶编码基因的启动子DNA序列来实现这一点。也可以通过如缺失或插入DNA序列来实现这类导致基因表达率增加的修饰。

如前文所述，可以通过应用外源刺激来修饰内源羟化酶和/或β-环化酶的表达。这可以通过特定生理条件(即通过应用外源物质)来实现。

还有的用于修饰或增加内源羟化酶和/或β-环化酶基因表达的可能方案是使调节蛋白与此基因的启动子相互作用，所述调节蛋白不存在于未转化的生物中。

这类调节物可以是如WO 96/06166中所描述的由DNA结合域和转录激活域组成的嵌合蛋白质。

在一个优选的实施方案中，通过向生物引入至少一个编码羟化酶的核酸和/或引入至少一个编码β-环化酶的核酸来增加编码羟化酶和/或β-环化酶的核酸的基因表达。

原则上，任何羟化酶基因或任何β-环化酶基因(即任何编码羟化酶的核酸和任何编码β-环化酶的核酸)都可用于此目的。

对于来源于真核并含有内含子的羟化酶或β-环化酶基因组核酸序列，在宿主生物不能或不能通过改造来表达相应羟化酶或β-环化酶时，优选使用已经被加工的核酸序列，如相应的cDNA。

羟化酶基因的例子之一是来自雨生红球藻的编码羟化酶的核酸(注册号：AX038729，WO0061764)；(核酸：SEQ ID NO：15，蛋白质：SEQ ID NO：16)。

β-环化酶基因的例子之一是来自番茄的编码β-环化酶的核酸(注册号：X86452)(核酸：SEQ ID NO：17，蛋白质：SEQ ID NO：18)。

因此，在此优选实施方案中，相对于野生型，本发明优选的转基因生物中具有至少一个另外的羟化酶基因和/或β-环化酶基因。

在此优选的实施方案中，遗传修饰的生物具有例如至少一个编码羟化酶的外源核酸，或至少两个编码羟化酶的内源核酸，和/或至少一个编码β-环化酶的外源核酸，或至少两个编码β-环化酶的内源核酸。

用于以上描述的优选实施方案的优选羟化酶基因是编码如下蛋白质的核酸，所述蛋白质含有SEQ ID NO：16氨基酸序列或对此序列进行置换、插入或缺失氨基酸后产生的具有羟化酶的酶学性质并与SEQ ID NO：16序列在氨基酸水平上具有至少30％、优选至少50％、更优选至少70％、甚至更优选至少90％、最优选至少95％的一致性的序列。

羟化酶和羟化酶基因的其他例子可以例如如前文所述，通过将数据库中的氨基酸序列或反向翻译的相应核酸序列与SEQ ID NO：16进行同源性比较，从多种已知基因组序列的生物中容易的发现。

此外，羟化酶和羟化酶基因的其它例子还可以如前文所述，例如基于SEQ ID NO：15，通过杂交和PCR技术，以本身已知的方式从多种未知基因组序列的生物中容易的发现。

在另一特别优选的实施方案中，通过向生物引入编码蛋白质的核酸来增加羟化酶活力，所述蛋白质含有SEQ ID NO：16的羟化酶氨基酸序列。

合适的核酸序列可以例如，依据遗传密码，通过反向翻译多肽序列获得。

用于这一目的的密码子优选是根据生物特异的密码子选择而频繁使用的密码子。通过用计算机分析相关生物的其它已知基因，可以容易的发现此密码子选择。

在一特别优选的实施方案中，将含有SEQ.ID.NO：15序列的核酸引入生物。

优选的用于以上描述的优选实施方案的β-环化酶基因是编码如下蛋白质的核酸，所述蛋白质含有SEQ ID NO：18氨基酸序列或对此序列进行置换、插入或缺失氨基酸后产生的具有β-环化酶的酶学性质并与SEQ ID NO：18序列在氨基酸水平上具有至少30％、优选至少50％、更优选至少70％、甚至更优选至少90％、最优选至少95％的一致性的序列。

β-环化酶和β-环化酶基因的其他例子可以如前文所述，例如通过将数据库中的氨基酸序列或反向翻译的相应核酸序列与SEQ ID NO：18进行同源性比较，从多种已知基因组序列的生物中容易的发现。

此外，β-环化酶和β-环化酶基因的其它例子还可以如前文所述，例如基于SEQ ID NO：17，通过杂交和PCR技术，以本身已知的方式从多种未知基因组序列的生物中容易的发现。

在另一特别优选的实施方案中，通过向生物引入编码蛋白质的核酸来增加β-环化酶活力，所述蛋白质含有SEQ ID NO：18的β-环化酶氨基酸序列。

用于这一目的的密码子优选是依据生物特异的密码子选择而频繁使用的密码子。通过用计算机分析相关生物的其它已知基因，可以容易的发现此密码子选择。

在一特别优选的实施方案中，将含有SEQ.ID.NO：17序列的核酸引入生物。

此外，可以以本身已知的方式，通过化学合成，从核苷酸单元制备上述所有羟化酶或β-环化酶基因，例如通过对各重叠的互补双螺旋核酸单元进行片段缩合来制备。可以化学合成寡核苷酸，例如以已知方式通过亚磷酰胺法(Voet，Voet，第二版，Wiley Press New York，896-897页)制备。添加合成的寡核苷酸、使用DNA聚合酶的Klenow片段填补间隙及连接反应以及一般的克隆方法被描述于Sambrook等人(1989)，Molecular cloning：Alaboratory manual，Cold Spring Harbor Laboratory Press。

特别优选的用于本发明方法的遗传修饰生物具有以下的遗传修饰组合：

遗传修饰的生物相对于野生型具有增加的或造成的酮酶活力以及增加的羟化酶活力。

遗传修饰的生物相对于野生型具有增加的或造成的酮酶活力以及增加的β-环化酶活力，和

遗传修饰的生物相对于野生型具有增加的或造成的酮酶活力以及增加的羟化酶活力和增加的β-环化酶活力。

如此后所描述的，可以通过如引入各单个核酸构建体(表达盒)或引入包含2种或3种所述活力的多重构建体来产生这些遗传修饰生物。

根据本发明，优选地，生物指的是作为野生型或起始生物能够天然产生或通过遗传互补和/或代谢路径的调节来产生类胡萝卜素、特别是β-胡萝卜素和/或玉米黄质和/或新黄素和/或紫黄质和/或黄体素的生物。

还有的优选生物作为野生型或起始生物已经具有羟化酶活力，因此作为野生型或起始生物能够产生玉米黄质。

优选的生物是植物或微生物，如细菌、酵母、藻类或真菌。

能够利用的细菌是由于引入生产类胡萝卜素的生物的类胡萝卜素生物合成基因而能合成叶黄素的细菌(如含有例如欧文氏菌(Erwinia)来源的crt基因的埃希氏杆菌属(Escherichia)细菌)和自身能够合成叶黄素的细菌(如欧文氏菌属、农杆菌属(Agrobacterium)、黄杆菌属(Flavobacterium)、产碱菌属(Alcaligenes)、副球菌属(Paracoccus)、念珠藻属的细菌或集胞藻属的蓝细菌(Cyanobacteria))。

优选的细菌是大肠杆菌(Escherichia coli)、草生欧文氏菌(Erwiniaherbicola)、噬夏孢欧文氏菌(Erwinia uredovora)、Agrobacteriumaurantiacum、产碱菌属种PC-1、黄杆菌属种R1534菌株、集胞藻属蓝细菌PCC6803、Paracoccus marcusii或Paracoccus carotinifaciens。

优选的酵母是假丝酵母(Candida)、酵母(Saccharomyces)、汉逊酵母(Hansenula)、毕赤酵母(Pichia)或法夫酵母(Phaffia)。特别优选的酵母有Xanthophyllomyces dendrorhous或Phaffia rhodozyma。

优选的真菌有曲霉(Aspergillus)、木霉(Trichoderma)、阿舒囊霉(Ashbya)、脉孢菌(Neurospora)、布拉霉(Blakeslea)、须霉(Phycomyces)、镰孢霉(Fusarium)或描述于Indian Chem.Engr.Section B.Vol.37，No.1，2(1995)15页，表6的其它真菌。

优选的藻类有绿藻，如红球藻属(Haematococcus)、三角褐指藻(Phaedactylum tricornatum)、团藻属(Volvox)或杜氏藻属(Dunaliella)的藻。特别优选的藻类有雨生红球藻或Dunaliella bardawil。

为了实行本发明方法，可使用的其它微生物及其制备公开于例如，这里引入为参考的DE-A-199 16 140。

特别优选的植物选自毛茛科(Ranunculaceae)、小檗科(Berberidaceae)、罂粟科(Papaveraceae)、大麻科(Cannabaceae)、蔷薇科(Rosaceae)、Fabaceae、亚麻科(Linaceae)、葡萄科(Vitaceae)、十字花科(Brassicaceae)、葫芦科(Cucurbitaceae)、报春花科(Primulaceae)、石竹科(Caryophyllaceae)、苋科(Amaranthaceae)、龙胆科(Gentianaceae)、牻牛儿苗科(Geraniaceae)、忍冬科(Caprifoliaceae)、木犀科(Oleaceae)、旱金莲科(Tropaeolaceae)、茄科(Solanaceae)、玄参科(Scrophulariaceae)、菊科(Asteraceae)、百合科(Liliaceae)、石蒜科(Amaryllidaceae)、禾本科(Poaceae)、兰科(Orchidaceae)、锦葵科(Malvaceae)、Illiaceae或唇形科(Lamiaceae)。

极其优选的植物选自万寿菊属(Marigold)、万寿菊(Tagetes erecta)、孔雀草(Tagetespatula)、金合欢属(Acacia)、乌头属(Aconitum)、侧金盏花属(Adonis)、阿尼菊属(Arnica)、耧斗菜属(Aquilegia)、紫菀属(Aster)、黄芪属(Astragalus)、紫葳属(Bignonia)、金盏花属(Calendula)、驴蹄草属(Caltha)、风铃草属(Campanula)、美人蕉属(Canna)、矢车菊属(Centaurea)、桂竹香属(Cheiranthus)、茼蒿属(Chrysanthemum)、柑桔属(Citrus)、还阳参属(Crepis)、番红花属(Crocus)、南瓜属(Curcurbita)、金雀儿属(Cytisus)、Delonia属、翠雀属(Delphinium)、石竹属(Dianthus)、康乃馨属(Dimorphotheca)、多榔菊属(Doronicum)、花菱草属(Eschscholtzia)、连翘属(Forsythia)、Fremontia属、勋章菊属(Gazania)、钩吻属(Gelsemium)、染料木属(Genista)、龙胆属(Gentiana)、老鹳草属(Geranium)、非洲菊属(Gerbera)、路边青属(Geum)、银桦属(Grevillea)、堆心菊属(Helenium)、向日葵属(Helianthus)、细辛属(Hepatica)、独活属(Heracleum)、木槿属(Hisbiscus)、赛菊芋属(Heliopsis)、金丝桃属(Hypericum)、黄金菊属(Hypochoeris)、凤仙花属(Impatiens)、鸢尾属(Iris)、蓝花楹属(Jacaranda)、棣堂属(Kerria)、毒豆属(Laburnum)、山黧豆属(Lathyrus)、猫耳草属(Leontodon)、百合属(Lilium)、亚麻属(Linum)、百脉根属(Lotus)、番茄属(Lycopersicon)、珍珠菜属(Lysimachia)、Maratia属、苜蓿属(Medicago)、沟酸浆属(Mimulus)、水仙属(Narcissus)、月见草属(Oenothera)、木犀属(Osmanthus)、碧冬茄属(Petunia)、石楠属(Photinia)、酸浆属(Physalis)、牧根草属(Phyteuma)、委陵草属(Potentilla)、火棘属(Pyracantha)、毛茛属(Ranunculus)、杜鹃花属(Rhododendron)、蔷薇属(Rosa)、金光菊属(Rudbeckia)、千里光属(Senecio)、蝇子草属(Silene)、松香草属(Silphium)、Sinapsis属、花楸属(Sorbus)、鹰爪豆属(Spartium)、黄钟花属(Tecoma)、蝴蝶草属(Torenia)、婆罗们参属(Tragopogon)、金莲花属(Trollius)、旱金莲属(Tropaeolum)、郁金香属(Tulipa)、款冬属(Tussilago)、荆豆属(Ulex)、堇菜属(Viola)或百日草属(Zinnia)植物，特别优选万寿菊属(Marigold)、万寿菊(Tagetes erecta)、孔雀草(Tagetes patula)、番茄属(Lycopersicon)、蔷薇属(Rosa)、金盏花属(Calendula)、酸浆属(Physalis)、苜蓿属(Medicago)、向日葵属(Helianthus)、茼蒿属(Chrysanthemum)、紫菀属(Aster)、郁金香属(Tulipa)、水仙属(Narcissus)、碧冬茄属(Petunia)、老鹳草属(Geranium)、旱金莲属(Tropaeolum)或侧金盏花属(Adonis)植物。

在本发明制备酮类胡萝卜素的方法中，优选在培养遗传修饰的生物之后收获生物，并进一步优选从生物中分离酮类胡萝卜素。

收获生物可以以众所周知的适合特定生物的方式进行。可以通过例如离心、滗析或过滤移走在液体营养培养基中发酵培养的微生物，如细菌、酵母、藻类或真菌或植物细胞。植物可以以众所周知的方式生长于营养培养基中，并适当时收获。

优选在有氧、至少约20℃的培养温度(例如20℃到40℃)、pH约6-9的条件下培养遗传修饰的微生物。对于遗传修饰的微生物，优选最初于有氧条件下复杂培养基(如TB或LB培养基)中在约20℃或更高温度、pH约6到9条件下培养，直到达到足够的细胞密度。为了能更好的控制氧化反应，优选使用可诱导的启动子。诱导酮酶表达后继续在有氧条件下培养如12小时到3天。

可以用已知的方式从收获的生物质中分离酮类胡萝卜素，如通过抽提，并适当时经进一步的化学或物理纯化方法，例如沉淀法、结晶、热分离法(如精馏法)或物理分离法(如层析)。

如以下所提及，可以在本发明遗传修饰的植物中特异地产生酮类胡萝卜素，优选在多种植物组织(如种子、叶、果实、花，特别是花瓣)中产生。

可以以已知的方式从收获的花瓣中分离酮类胡萝卜素，例如通过干燥并随后抽提，以及适当时进一步利用化学或物理纯化方法，例如沉淀法、结晶、热分离法(如精馏法)或物理分离法(如层析)。例如，优选使用有机溶剂(如丙酮、己烷、乙醚或叔-丁基甲基醚)从花瓣中分离酮类胡萝卜素。

还有的分离酮类胡萝卜素的方法(特别是从花瓣中分离)描述于如Egger和Kleinig(Phytochemistry(1967)6，437-440)和Egger(Phytochemistry(1965)4，609-618)中。

优选的酮类胡萝卜素选自虾青素、角黄素、海胆酮、3-羟基海胆酮、3’-羟基海胆酮、adonirubin和金盏花黄质。

虾青素是特别优选的酮类胡萝卜素。

依赖于所使用的生物，获得游离或脂肪酸酯的形式的酮类胡萝卜素。

可以以本发明方法从植物花瓣中获得酮类胡萝卜素与脂肪酸形成的单酯或二酯的形式。一些检测到的脂肪酸的例子是豆蔻酸、棕榈酸、硬脂酸、油酸、亚麻酸和月桂酸(Kamata和Simpson(1987)Comp.Biochem.Physio.Vol.86B(3)，587-591)。

可以在整个植物或特定在含有有色体的植物组织中(在优选的实施方案中)生产酮类胡萝卜素。优选的植物组织例如有根、种子、叶、果实、花，特别是蜜腺和花瓣。

在本发明方法的一个特别优选的实施方案中，使用了在花中表现出最高的酮酶表达率的遗传修饰植物。

优选通过在花特异的启动子的控制下表达酮酶基因来实现这一点。为了这一目的，例如，可以如以下详细描述的，向植物引入前文描述的核酸，其中所述核酸在核酸构建体中与花特异的启动子功能性地连接。

在本发明方法的另一特别优选的实施方案中，使用了在果实中表现出最高的酮酶表达率的遗传修饰植物。

优选通过在果实特异的启动子控制下表达酮酶基因来实现这一点。为了这一目的，例如，可以如以下详细描述的，向植物引入前文描述的核酸，所述核酸在核酸构建体中与果实特异的启动子功能性连接。

在本发明方法的另一特别优选的实施方案中，使用了在种子中表现出最高的酮酶表达率的遗传修饰种子。

优选通过在种子特异的启动子控制下表达酮酶基因来实现这一点。为了这一目的，例如，可以如以下详细描述的，向植物引入前文描述的核酸，所述核酸在核酸构建体中与种子特异的启动子功能性连接。

通过与质体转运肽的功能性连接可以实现向有色体的靶向转移。

通过以下实例描述了具有增加的或造成的酮酶活力的遗传修饰植物的产生。其它活性，如羟化酶活力和/或β-环化酶活力可以使用编码羟化酶或β-环化酶的核酸序列替代编码酮酶的核酸序列以类似方式增加。对于遗传修饰组合，转化可以单个地或通过多重构建体完成。

优选使用含有以上描述的编码酮酶的核酸的核酸构建体转化起始植物来产生转基因植物，所述核酸与一个或多个确保在植物中转录和翻译的调节信号功能性地连接。

以下也将其中的编码核酸序列与一个或多个确保在植物中转录和翻译的调节信号功能性连接的这些核酸构建体称为表达盒。

优选调节信号含有一个或多个确保在植物中转录和翻译的启动子。

表达盒含有调节信号，即控制编码序列在宿主细胞中表达的核酸调节序列。在一个优选的实施方案中，表达盒包含上游启动子(即位于编码序列5’端)和下游多腺苷酸化信号(即位于编码序列3’端)，并在适当时还含有与位于两者之间的至少一种以上描述的基因的编码序列有效连接的其它调节元件。“有效连接”指的是启动子、编码序列、终止子和适当时其它调节元件以各调节元件能够在编码序列的表达中发挥其预期功能的方式依次排列。

以下举例描述了优选的用于植物的核酸构建体、表达盒和载体，以及产生转基因植物的方法和转基因植物自身。

优选的用于有效连接的序列(但并不排除其它)有确保在质外体、液泡、质体、线粒体、内质网(ER)、细胞核、油质体或其它区室中亚细胞定位的靶向序列和翻译增强子(如烟草花叶病毒来源的5’前导序列)(Gallie等人，Nucl.Acids Res.15(1987)，8693-8711)。

原则上任何能够在植物中控制外源基因表达的启动子都适合用于表达盒。

“组成型”启动子指的是在植物发育过程中的相对宽时期(优选植物发育的全部时期)，在许多组织(优选所有组织)中确保表达的启动子。

具体而言，优选使用植物启动子或植物病毒来源的启动子。特别优选花椰菜花叶病毒35S转录物的CaMV启动子(Franck等人(1980)Cell 21：285-294；Odell等人(1985)Nature 313：810-812；Shewmaker等人(1985)Virology 140：281-288；Gardner等人(1986)Plant Mol Biol 6：221-228)、19SCaMV启动子(US 5,352,605；WO 84/02913；Benfey等人(1989)EMBO J 8：2195-2202)、拟南芥(Arabidopsis thaliana)来源的丙糖磷酸转运蛋白(TPT)启动子(Acc.No.AB006698，碱基对53242到55281，起始于bp 55282的基因被注释为“磷酸/丙糖磷酸转运蛋白”)，或玄参(figwort)花叶病毒来源的34S启动子(Acc.No.X16673，碱基对1到554)。

另外的合适的组成型启动子有pds启动子(Pecker等人(1992)Proc.Natl.Acad.Sci USA 89：4962-4966)或核酮糖二磷酸羧化酶-加氧酶小亚基(SSU)启动子(US 4,962,028)、豆球蛋白B启动子(GenBank Acc.No.X03677)、农杆菌胭脂碱合成酶启动子、TR双启动子(dual promoter)、农杆菌OCS(章鱼碱合成酶)启动子、泛素启动子(Holtorf S等人(1995)Plant Mol Biol 29：637-639)、泛素1启动子(Christensen等人(1992)PlantMol Biol 18：675-689；Bruce等人(1989)Proc Natl Acad Sci USA 86：9692-9696)、Smas启动子、桂醇脱氢酶启动子(US 5,683,439)、液泡ATP酶亚基的启动子或小麦来源的富含脯氨酸的蛋白质的启动子(WO91/13991)、Pnit启动子(Y07648.L，Hillebrand等人(1998)，Plant.Mol.Biol.36，89-99，Hillebrand等人(1996)，Gene，170，197-200)和技术人员已知的在植物中组成型表达的其它基因的启动子。

表达盒还可以包含化学诱导型启动子(综述文章：Gatz等人(1997)Annu Rev Plant Physiol Plant Mol Biol 48：89-108)，通过这种启动子可以在特定时间控制酮酶基因在植物中表达。这种类型的启动子，如PRP1启动子(Ward等人(1993)Plant Mol Biol 22：361-366)、水杨酸诱导的启动子(WO 95/19443)、苯磺酰胺诱导的启动子(EP 0 388 186)、四环素诱导的启动子(Gatz等人(1992)Plant J 2：397-404)、脱落酸诱导的启动子(EP 0 335528)或乙醇或环己酮诱导的启动子(WO 93/21334)同样可以使用。

优选的启动子还有被生物或非生物压力诱导的启动子，如PRP1基因的病原体诱导的启动子(Ward等人(1993)Plant Mol Biol 22：361-366)，热诱导的番茄hsp70或hsp80启动子(US 5,187,267)、冷诱导的马铃薯α-淀粉酶启动子(WO 96/12814)、光诱导的PPDK启动子或损伤诱导的pinII启动子(EP375091)。

病原体诱导的启动子包括由病原体攻击诱导的基因的启动子，如PR蛋白质、SAR蛋白质、β-1，3-葡聚糖酶、壳多糖酶等的基因的启动子(例如Redolfi等人(1983)Neth J Plant Pathol 89：245-254；Uknes等人(1992)The Plant Cell 4：645-656；Van Loon(1985)Plant Mol Viral 4：111-116；Marineau等人(1987)Plant Mol Biol 9：335-342；Matton等人(1987)Molecular Plant-Microbe Interactions 2：325-342；Somssich等人(1986)Proc Natl Acad Sci USA 83：2427-2430；Somssich等人(1988)Mol GenGenetics 2：93-98；Chen等人(1996)Plant J 10：955-966；Zhang和Sing(1994)Proc Natl Acad Sci USA 91：2507-2511；Warner等人(1993)Plant J3：191-201；Siebertz等人(1989)Plant Cell 1：961-968(1989))。

也包括损伤诱导的启动子，如pinII基因启动子(Ryan(1990)Ann RevPhytopath 28：425-449；Duan等人(1996)Nat Biotech 14：494-498)、wun1和wun2基因启动子(US 5,428,148)、win1和win2基因启动子(Stanford等人(1989)Mol Gen Genet 215：200-208)、系统素(systemin)基因启动子(McGurl等人(1992)Science 225：1570-1573)、WIP1基因启动子(Rohmeier等人(1993)Plant Mol Biol 22：783-792；Ekelkamp等人(1993)FEBSLetters 323：73-76)、MPI基因启动子(Corderok等人(1994)The Plant J 6(2)：141-150)等。

其它合适的启动子的例子有果实成熟特异性启动子，如番茄果实成熟特异性启动子(WO 94/21794、EP 409 625)。发育依赖的启动子包括某些组织特异性启动子，因为一些组织的形成天然依赖于发育。

还有的特别优选的启动子是确保在例如生物合成酮类胡萝卜素或其前体的植物组织或部位中表达的启动子。优选的例子有特异于花药、子房、花瓣、萼片、花、叶、茎、种子和根以及它们的组合的启动子。

对块茎、贮藏根或根特异的启动子的例子有I类patatin启动子(B33)或马铃薯组织蛋白酶D抑制物启动子。

叶特异的启动子的例子有马铃薯胞质FBP酶启动子(WO 97/05900)、核酮糖二磷酸羧化酶-加氧酶(核酮糖-1，5-二磷酸羧化酶)SSU启动子(小亚基)或马铃薯ST-LSI启动子(Stockhaus等人(1989)EMBO J 8：2445-2451)。

花特异的启动子的例子有八氢番茄红素合成酶启动子(WO 92/16635)或P-rr基因启动子(WO 98/22593)、拟南芥AP3启动子(见实施例5)、CHRC启动子(黄瓜(Cucumis sativus)来源的有色体特异的类胡萝卜素相关蛋白质(CHRC)基因启动子Acc.No.AF099501，碱基对1到1532)、EPSP合成酶启动子(碧冬茄(Petunia hybrida)来源的5-烯醇丙酮酸莽草酸-3-磷酸合成酶基因启动子Acc.No.M37029，碱基对1到1788)、PDS启动子(番茄(Solanum Lycopersicum)来源的八氢番茄红素去饱和酶基因启动子Acc.No.U46919，碱基对1到2078)、DFR-A启动子(碧冬茄来源的二氢黄酮醇4-还原酶基因A启动子，Acc.No.X79723，碱基对32到1902)或FBP1启动子(碧冬茄来源的花结合蛋白1基因启动子，Acc.No.L10115，碱基对52到1069)。

花药特异的启动子的例子有5126启动子(US 5,689,049、US 5,689,051)、glob-I启动子或g-玉米醇溶蛋白启动子。

种子特异的启动子的例子有ACP05启动子(酰基载体蛋白基因，WO9218634)、拟南芥属AtS1和AtS3启动子(WO 9920775)、蚕豆(Vicia faba)LeB4启动子(WO 9729200和US 06403371)、欧洲油菜(Brassica napus)启动子(US 5608152；EP 255378；US 5420034)、蚕豆SBP启动子(DE 9903432)或玉米End1和End2启动子(WO 0011177)。

其它适宜在植物中表达的启动子描述于Rogers等人(1987)Meth inEnzymol 153：253-277；Schardl等人(1987)Gene 61：1-11和Berger等人(1989)Proc Natl Acad Sci USA 86：8402-8406。

本发明方法中特别优选种子特异、果实特异、花特异、特别是花瓣特异的组成型启动子。

因此，本发明尤其涉及含有功能性连接的花特异性或特别是花瓣特异性启动子和编码酮酶的核酸的核酸构建体，其中所述酮酶含有SEQ.ID.NO：2氨基酸序列或对SEQ.ID.NO：2序列进行置换、插入或缺失氨基酸后产生的与这一序列在氨基酸水平上具有至少42％一致性的序列。

优选通过如T.Maniatis、E.F.Fritsch和J.Sambrook，MolecularCloning：A Laboratory Manual，Cold Spring Harbor Laboratory，ColdSpring Harbor，NY(1989)及T.J.Silhavy、M.L.Berman和L.W.Enquist，Experiments with Gene Fusions，Cold Spring Harbor Laboratory，ColdSpring Harbor，NY(1984)和Ausubel，F.M.等人，Current Protocols inMolecular Biology，Greene Publishing Assoc.and Wiley-Interscience(1987)描述的常规重组和克隆技术，将合适的启动子与上文描述的编码酮酶的核酸及优选地与在启动子与核酸序列之间插入的编码质体特异性转运肽的核酸及与多腺苷酸化信号相融合来生成表达盒。

优选插入的编码质体转运肽的核酸确保定位于质体(特别是有色体)。

也可以使用其核酸序列编码酮酶融合蛋白质的表达盒，其中融合蛋白质的一部分是控制多肽转运的转运肽。转运肽可以是有色体特异的，并且在酮酶转移进有色体之后其可以被酶从酮酶部分中除去。

特别优选的转运肽来自烟草(Nicotiana tabacum)质体转酮酶或其它转运肽(如核酮糖二磷酸羧化酶-加氧酶小亚基(rbcS)的转运肽或铁氧还蛋白-NADP氧化还原酶的转运肽，以及异戊烯-焦磷酸异构酶2的转运肽)或它的功能等价物。

特别优选KpnI/BamHI片段形式的处于三种读框中的三种烟草质体转酮酶质体转运肽盒子的核酸序列，其中ATG密码子位于NcoI切割位点中：

pTP09

KpnI_GGTACCATGGCGTCTTCTTCTTCTCTCACTCTCTCTCAAGCTATCCTCTCTCGTTCTGTC

CCTCGCCATGGCTCTGCCTCTTCTTCTCAACTTTCCCCTTCTTCTCTCACTTTTTCCGGCCTTAA

ATCCAATCCCAATATCACCACCTCCCGCCGCCGTACTCCTTCCTCCGCCGCCGCCGCCGCCGT

CGTAAGGTCACCGGCGATTCGTGCCTCAGCTGCAACCGAAACCATAGAGAAAACTGAGACTGC

GGGATCC_BamHI

pTP10

KpnI_GGTACCATGGCGTCTTCTTCTTCTCTCACTCTCTCTCAAGCTATCCTCTCTCGTTCTGTC

CCTCGCCATGGCTCTGCCTCTTCTTCTCAACTTTCCCCTTCTTCTCTCACTTTTTCCGGCCTTAA

ATCCAATCCCAATATCACCACCTCCCGCCGCCGTACTCCTTCCTCCGCCGCCGCCGCCGCCGT

CGTAAGGTCACCGGCGATTCGTGCCTCAGCTGCAACCGAAACCATAGAGAAAACTGAGACTGC

GCTGGATCC_BamHI

pTP11

KpnI_GGTACCATGGCGTCTTCTTCTTCTCTCACTCTCTCTCAAGCTATCCTCTCTCGTTCTGTC

CCTCGCCATGGCTCTGCCTCTTCTTCTCAACTTTCCCCTTCTTCTCTCACTTTTTCCGGCCTTAA

ATCCAATCCCAATATCACCACCTCCCGCCGCCGTACTCCTTCCTCCGCCGCCGCCGCCGCCGT

CGTAAGGTCACCGGCGATTCGTGCCTCAGCTGCAACCGAAACCATAGAGAAAACTGAGACTGC

GGGGATCC_BamHI

其它的质体转运肽的例子有拟南芥质体异戊烯-焦磷酸异构酶2(IPP-2)的转运肽和豌豆来源的核酮糖二磷酸羧化酶小亚基(rbcS)的转运肽(Guerineau，F，Woolston，S，Brooks，L，Mullineaux，P(1988)An expressioncassette for targeting foreign proteins into the chloroplasts.Nucl.Acids Res.16：11380)。

本发明核酸可以通过合成方式制备或从天然获得，或者可以含有由合成的和天然的核酸组分组成的混合物，并可以由不同生物来源的多个异源基因部分组成。

如上所述，优选具有植物优选的密码子的合成核苷酸序列。可以从表达于大多数感兴趣的植物物种中的具有最高蛋白质频率的密码子中鉴定植物优选的密码子。

为了制备表达盒，可以利用多种DNA片段以便获得便于从正确方向阅读并装备有正确阅读框的核苷酸序列。可以在片段上附加衔接子或接头，以便DNA片段的彼此连接。

可以且适宜的是，以转录的方向提供具有接头或多接头的启动子和终止子区域，所述接头含有用于插入该核酸序列的一个或多个限制位点。一般地，接头具有1到10，通常1到8，优选2到6个限制位点。接头在调节区内一般小于100bp，常常小于60bp，但至少长5bp。对于宿主植物，启动子可以是天然的(或同源的)和外源的(或异源的)。优选表达盒以5’-3’转录方向含有启动子、核酸编码序列或核酸构建体，以及转录终止区。各种终止区可以按需要互换。

终止子的例子有35S终止子(Guerineau等人(1988)Nucl Acids Res.16：11380)、nos终止子(Depicker A，Stachel S，Dhaese P，Zambryski P，Goodman HM.Nopaline synthase：transcript mapping and DNA sequence.J Mol Appl Genet.1982；1(6)：561-73)或ocs终止子(Gielen，J，deBeuckeleer，M，Seurinck，J，Debroek，H，de Greve，H，Lemmers，M，vanMontagu，M，Schell，J(1984)The complete sequence of the TL-DNA of theAgrobacterium tumefaciens plasmid pTiAch5.EMBO J.3：835-846)。

此外还可以使用提供适当的限制性切割位点或删除冗余DNA或限制性切割位点的操作。关于插入、缺失或置换(如转换和颠换)，可以使用体外诱变、引物修补、限制(性酶切)或连接。

可以通过适当的操作(如限制(性酶切)、回嚼(chewing back)或将突出端填补成平端)来提供片段的互补末端以进行连接。

优选的多腺苷酸化信号是植物多腺苷酸化信号，优选那些基本上相应于根癌农杆菌来源的T-DNA多腺苷酸化信号的信号，特别是Ti质粒pTiACH5(Gielen等人，EMBO J.3(1984)，835ff)的T-DNA(章鱼碱合成酶)基因3的多腺苷酸化信号或其功能等价物。

将外源基因转移进植物基因组被称为转化。

为此目的，可以使用本身已知的转化和从植物组织或植物细胞再生植物的方法，以便实现瞬时或稳定转化。

适合转化植物的方法有通过聚乙二醇诱导DNA摄取的原生质体转化、使用基因枪的生物轰击法——称为粒子轰击法——电穿孔、在含有DNA的溶液中孵育干胚、显微注射及上文所述农杆菌介导的基因转移。所述方法描述于例如B.Jenes等人，Techniques for Gene Transfer，《TransgenicPlants》，Vol.1，Engineering and Utilization，S.D.Kung和R.Wu编辑，Academic Press(1993)，128-143和Potrykus，Annu.Rev.Plant Physiol.Plant Molec.Biol.42(1991)，205-225。

优选将要表达的构建体克隆进适宜转化根癌农杆菌的载体，如pBin19(Bevan等人，Nucl.Acids Res.12(1984)，8711)或特别优选的pSUN2、pSUN3、pSUN4或pSUN5(WO 02/00900)。

用表达质粒转化的农杆菌可以通过已知的方式用于转化植物，例如在农杆菌溶液中浸浴损伤的叶子或叶子的片段，并随后在适当的培养基中培育。

对于遗传修饰植物(此后也称为转基因植物)的优选制备而言，表达酮酶的融合表达盒被克隆进适于转化根癌农杆菌的载体，如pBin19，或特别是pSUN5和pSUN3。然后可以通过在农杆菌溶液中浸浴损伤的叶子或叶子的片段，并随后在适当的培养基中培养，从而以已知方式将使用所述载体转化的农杆菌用于转化植物(特别是农作物)。

通过农杆菌的植物转化尤其公开于F.F.White，Vectors for GeneTransfer in Higher Plants；in Transgenic Plants，Vol.1，Engineering andUtilization，S.D.Kung和R.Wu编辑，Academic Press，1993，15-38页。可以以已知的方式从损伤的叶子或叶片段的转化细胞再生转基因植物，所述转基因植物含有整合进表达盒用于表达编码酮酶的核酸的基因。

为了用编码酮酶的核酸转化宿主细胞，组建表达盒并将表达盒插入其DNA中含有额外的功能调节信号(如用于复制或整合的序列)的重组载体。合适的载体尤其描述于″Methods in Plant Molecular Biology andBiotechnology″(CRC Press)，6/7章，71-119页(1993)。

使用上文引用的重组和克隆技术，可以将表达盒克隆进能够在如大肠杆菌中复制的适当载体中。合适的克隆载体有例如pJIT117(Guerineau等人(1988)Nucl.Acids Res.16：11380)、pBR332、pUC系列、M13mp系列和pACYC184。特别适宜的是能够在大肠杆菌和农杆菌中复制的二元载体。

以下更详细的描述了本发明遗传修饰微生物的产生：

优选将上文描述的编码酮酶或β-羟化酶或β-环化酶的核酸整合进表达构建体(该构建体含有处于核酸调节序列遗传控制之下的编码本发明酶的核酸序列)和载体(该载体至少含有一个这样的表达构建体)。

优选本发明的这类构建体含有上游启动子(即位于特定编码序列5’端)和下游终止子信号(即位于3’端)，并且适当时还含有与编码序列有效连接的其它常规调节元件。“有效连接”指的是启动子、编码序列、终止子及适当时其它调节元件以各调节元件能够在编码序列的表达中发挥其预期功能的方式依次排列。

可有效连接的序列的例子有引导序列和翻译增强子、增强子、多腺苷酸化信号等等。其它的调节元件包括选择性标记、扩增信号、复制起点等等。

除了人工调节序列之外，在实际的结构基因前面还可以仍然保留天然的调节序列。适当时可以通过遗传修饰关闭这一天然调节作用，并增加或降低基因的表达。然而基因构建体也可以具有更简单的结构，即在结构基因的前面没有插入额外的调节信号，并且没有除去天然启动子及其调节作用。反之，天然的调节序列可以被突变，以便不再产生调节作用，从而增加或降低基因表达。基因构建体中可以具有单或多拷贝的这些核酸序列。

可以使用的启动子有例如：有利于用于革兰氏阴性细菌的cos、tac、trp、tet、trp-tet、lpp、lac、lpp-lac、laclq、T7、T5、T3、gal、trc、ara、SP6、λ-PR或λ-PL启动子；和革兰氏阳性启动子amy和SPO2或酵母启动子ADC1、MFα、AC、P-60、CYC1、GAPDH。特别优选使用可诱导的启动子，如光、特别是温度诱导的启动子(如P_rP_l启动子)。

原则上可以使用所有天然的启动子和它们的调节序列。此外，也可以有利的使用合成的启动子。

所述调节序列旨在使核酸序列可以特异表达以及蛋白质可以表达。这可能意味着，例如，取决于宿主生物，基因只在诱导之后被表达或过表达，或者立即被表达和/或过表达。

此外，可能优选调节序列或因子具有正面影响，并因此增加或降低表达。因此，通过使用如启动子和/或增强子之类的强转录信号，可以在转录水平上有利地实现调节元件的增强作用。然而，也可以例如通过提高mRNA的稳定性，增强翻译。

通过将适当的启动子与以上描述的编码酮酶、β-羟化酶或β-环化酶的核酸序列和终止子信号或多腺苷酸化信号融合，产生表达盒。如描述于T.Maniatis，E.F.Fritsch和J.Sambrook，Molecular Cloning：A LaboratoryManual，Cold Spring Harbor Laboratory，Cold Spring Harbor，NY(1989)及T.J.Silhavy，M.L.Berman和L.W.Enquist，Experiments with GeneFusions，Cold Spring Harbor Laboratory，Cold Spring Harbor，NY(1984)以及Ausubel，F.M.等人，Current Protocols in Molecular Biology，GreenePublishing Assoc.and Wiley-Interscience(1987)的常规重组和克隆技术被用于此目的。

为了在合适的宿主生物中表达，将重组核酸构建体或基因构建体有利的插入能够使基因在宿主中最佳表达的宿主特异载体。载体是本领域技术人员所熟知的，并且可以在例如″Cloning Vectors″(Pouwels P.H.等人，编辑，Elsevier，Amsterdam-New York-Oxford，1985)中找到。载体不仅指质粒，也指本领域技术人员已知的所有其它载体，如噬菌体、病毒(如SV40、CMV、杆状病毒和腺病毒)、转座子、IS元件、质粒、粘粒和线性或环状DNA。这些载体可以在宿主生物中自主复制或随染色体复制。

可以提及的合适的表达载体的例子有：

常规融合表达载体，如pGEX(Pharmacia Biotech Inc；Smith，D.B.和Johnson，K.S.(1988)Gene 67：31-40)、pMAL(New England Biolabs，Beverly，MA)和pRIT 5(Pharmacia，Piscataway，NJ)，这些载体中重组目的蛋白质分别与谷胱甘肽S-转移酶(GST)、麦芽糖E-结合蛋白和蛋白质A融合。

非融合蛋白质表达载体，如pTrc(Amann等人，(1988)Gene 69：301-315)和pET 11d(Studier等人Gene Expression Technology：Methodsin Enzymology 185，Academic Press，San Diego，California(1990)60-89)。

用于在酿酒酵母中表达的酵母表达载体，如pYepSecl(Baldari等人，(1987)Embo J.6：229-234)、pMFα(Kurjan和Herskowitz(1982)Cell 30：933-943)、pJRY88(Schultz等人(1987)Gene 54：113-123)和pYES2(Invitrogen Corporation，San Diego，CA)。

适合用于其它真菌(如丝状真菌)的载体以及构建载体的方法包括详细描述于：van den Hondel，C.A.M.J.J.& Punt，P.J.(1991)″Genetransfer systems and vector development for filamentous fungi.《AppliedMolecular Genetics of Fungi》，J.F.Peberdy等人编辑，pp.1-28，Cambridge University Press：Camb ridge的载体和方法。

可用于在培养的昆虫细胞(如Sf9细胞)中表达蛋白质的杆状病毒载体，包括pAc系列(Smith等人，(1983)Mol.Cell Biol.3：2156-2165)和pVL系列(Lucklow和Summers(1989)Virology 170：31-39)。

其它合适的原核和真核细胞表达系统描述于Sambrook，J.，Fritsch，E.F.和Maniatis，T.，Molecular cloning：A Laboratory Manual，第二版，ColdSpring Harbor Laboratory，Cold Spring Harbor Laboratory Press，ColdSpring Harbor，NY，1989的第16和17章。

本发明表达构建体或载体可用于产生遗传修饰微生物，所述微生物被例如至少一种本发明载体所转化。

将上述本发明重组构建体有利地引入合适的宿主系统，并在其中表达。优选使用技术人员熟悉的克隆和转染方法(如共沉淀、原生质体融合、电穿孔、逆转录病毒转染等)来引起所述核酸在特定表达系统中的表达。合适的系统描述于如Current Protocols in Molecular Biology，F.Ausubel等人编辑，Wiley Interscience，New York 1997。

可以通过同样存在于载体或表达盒中的标记基因来挑选成功转化的生物。这类标记基因例如有抗生素抗性基因、催化导致转染细胞染色的颜色形成反应的酶基因。然后可以通过自动细胞分拣进行挑选。

可以通过含有适当抗生素的培养基或营养培养基来选择被载体成功转化并带有适当抗生素抗性基因(如G418或潮霉素)的微生物。存在于细胞表面的标记蛋白质可被用于通过亲和层析手段的选择。

宿主生物与适用于生物的载体(如质粒、病毒或噬菌体，如具有RNA聚合酶/启动子系统的质粒、噬菌体8或其它温和噬菌体或转座子)和/或其它有利的调节序列的组合形成了表达系统。

本发明还涉及产生遗传修饰生物的方法，包括向起始生物的基因组中或以染色体外形式向起始生物中引入含有功能连接的启动子和编码酮酶的核酸的核酸构建体，适当时，构建体也含有终止子，其中所述酮酶含有SEQ.ID.NO：2氨基酸序列或对SEQ.ID.NO：2序列进行置换、插入或缺失氨基酸后产生的与这一序列在氨基酸水平上具有至少42％的一致性的序列。

本发明还涉及遗传修饰的生物，其中遗传修饰：

A在野生型生物已经具有酮酶活力的情况下，相对于野生型增加酮酶活力，和

B在野生型生物不具有酮酶活力的情况下，相对于野生型造成酮酶活力，

并且在A中增加的或在B中造成的酮酶活力，是由含有SEQ.ID.NO.2氨基酸序列或对SEQ.ID.NO.2序列进行置换、插入或缺失氨基酸后产生的与这一序列在氨基酸水平上具有至少42％一致性的序列的酮酶引起的。

如上所述，酮酶活力的增加或出现是通过相比于野生型增加或造成编码酮酶的核酸的基因表达来实现的，其中所述酮酶含有SEQ.ID.NO.2氨基酸序列或对SEQ.ID.NO.2序列进行置换、插入或缺失氨基酸后产生的与这一序列在氨基酸水平上具有至少42％的一致性的序列。

在另一优选的实施方案中，如上所述，通过向植物引入编码酮酶的核酸来增加或造成编码酮酶的核酸的基因表达，并因此优选过表达或转基因表达编码如下酮酶的核酸，所述酮酶含有SEQ.ID.NO.2氨基酸序列或对SEQ.ID.NO.2序列进行置换、插入或缺失氨基酸后产生的与这一序列在氨基酸水平上具有至少42％的一致性的序列。

本发明还涉及至少含有一个编码酮酶的转基因核酸的遗传修饰的生物，所述酮酶含有SEQ.ID.NO.2氨基酸序列或对SEQ.ID.NO.2序列进行置换、插入或缺失氨基酸后产生的与这一序列在氨基酸水平上具有至少42％的一致性的序列。这是起始生物不具有酮酶或内源酮酶，并且转基因酮酶被过表达时的情况。

本发明还涉及至少含有两个编码酮酶的内源核酸的遗传修饰生物，所述酮酶含有SEQ.ID.NO：2氨基酸序列或对SEQ.ID.NO：2序列进行置换、插入或缺失氨基酸后产生的与这一序列在氨基酸水平上具有至少42％的一致性的序列。这是起始生物具有内源酮酶，并且内源酮酶被过表达时的情况。

如上提及的，特别优选的遗传修饰的生物相比于野生型生物还具有增加的羟化酶活力和/或β-环化酶活力。其它的优选的实施方案描述于前文本发明方法中。

根据本发明，优选地，生物指的是作为野生型或起始生物能够天然产生或通过遗传互补和/或代谢路径的调节产生类胡萝卜素、特别是β-胡萝卜素和/或玉米黄质和/或新黄素和/或紫黄质和/或黄体素的生物。

优选的生物是植物或微生物，如细菌、酵母、藻类或真菌。

能够使用的细菌是由于引入生产类胡萝卜素的生物的类胡萝卜素生物合成基因而能合成叶黄素的细菌(如含有例如欧文氏菌来源的crt基因的埃希氏菌属细菌)和自身能够合成叶黄素的细菌(如欧文氏菌属、农杆菌属、黄杆菌属、产碱菌属、副球菌属、念珠藻属的细菌，或集胞藻属的蓝细菌)。

优选的细菌有大肠杆菌、草生欧文氏菌、噬夏孢欧文氏菌、Agrobacterium aurantiacum、产碱菌属(Alcaligenes sp.)PC-1、黄杆菌属R1534菌株、集胞藻属蓝细菌PCC6803、Paracoccus marcusii或Paracoccuscarotinifaciens。

优选的酵母有假丝酵母、酵母、汉逊酵母、毕赤酵母或法夫酵母(Phaffia)。特别优选的酵母有Xanthophyllomyces dendrorhous或Phaffiarhodozyma。

优选的真菌有曲霉、木霉、阿舒囊霉、脉孢菌、布拉霉、须霉、镰孢霉或描述于Indian Chem.Engr.Section B.Vol.37，No.1，2(1995)15页，表6的其它真菌。

优选的藻类有绿藻，如红球藻属、三角褐指藻、团藻属或杜氏藻属。特别优选的藻类有雨生红球藻或Dunaliella bardawil。

为了实行本发明方法，其它可使用的微生物及其制备被例如这里引入为参考的(例如)DE-A-199 16 140所公开。

特别优选的植物选自毛茛科、小檗科、罂粟科、大麻科、蔷薇科、Fabaceae、亚麻科、葡萄科、十字花科、葫芦科、报春花科、石竹科、苋科、龙胆科、牻牛儿苗科、忍冬科、木犀科、旱金莲科、茄科、玄参科、菊科、百合科、石蒜科、禾本科、兰科、锦葵科、Illiaceae或唇形科。

极其优选的植物选自万寿菊属(Marigold)、万寿菊(Tagetes errecta)、孔雀草、金合欢属、乌头属、侧金盏花属、阿尼菊属、耧斗菜属、紫菀属、黄芪属、紫葳属、金盏花属、驴蹄草属、风铃草属、美人蕉属、矢车菊属、桂竹香属、茼蒿属、柑桔属、还阳参属、番红花属、南瓜属、金雀儿属、Delonia属、翠雀属、石竹属、康乃馨属、多榔菊属、花菱草属、连翘属、Fremontia属、勋章菊属、钩吻属、染料木属、龙胆属、老鹳草属、非洲菊属、路边青属、银桦属、堆心菊属、向日葵属、细辛属、独活属、木槿属、赛菊芋属、金丝桃属、黄金菊属、凤仙花属、鸢尾属、蓝花楹属、棣堂属、毒豆属、山黧豆属、猫耳草属、百合属、亚麻属、百脉根属、番茄属、珍珠菜属、Maratia、苜蓿属、沟酸浆属、水仙属、月见草属、木犀属、碧冬茄属、石楠属、酸浆属、牧根草属、委陵草属、火棘属、毛茛属、杜鹃花属、蔷薇属、金光菊属、千里光属、蝇子草属、松香草属、Sinapsis、花楸属、鹰爪豆属、黄钟花属、蝴蝶草属、婆罗们参属、金莲花属、旱金莲属、郁金香属、款冬属、荆豆属、堇菜属或百日草属植物，特别优选万寿菊属(Marigold)、万寿菊(Tagetes errecta)、孔雀草、番茄属、蔷薇属、金盏花属、酸浆属、苜蓿属、向日葵属、茼蒿属、紫菀属、郁金香属、水仙属、碧冬茄属、老鹳草属、旱金莲属或侧金盏花属植物。

极其特别优选的遗传修饰的植物选自万寿菊属(Marigold)、万寿菊(Tagetes errecta)、孔雀草、侧金盏花属、番茄属、蔷薇属、金盏花属、酸浆属、苜蓿属、向日葵属、茼蒿属、紫菀属、郁金香属、水仙属、碧冬茄属、老鹳草属或旱金莲属植物，遗传修饰植物至少含有一个编码酮酶的转基因核酸。

本发明还涉及转基因植物、它们的繁殖材料和它们的植物细胞、组织或部分，特别是它们的果实、种子、花和花瓣。

如上所述，可以使用遗传修饰的植物制备酮类胡萝卜素，特别是虾青素。

可以被人或动物食用的具有增加的酮类胡萝卜素(特别是虾青素)含量的本发明遗传修饰生物，特别是植物或植物的部分(例如特别是花瓣)，可以直接使用或经过已知的方式加工后作为人或动物的食品或人和动物的食品增补剂使用。

也可以使用遗传修饰生物制备含有酮类胡萝卜素的生物提取物和/或制备动物和人的食品增补剂。

相比于野生型，遗传修饰生物的酮类胡萝卜素含量增加。

酮类胡萝卜素含量的增加通常指酮类胡萝卜素总含量的增加。

然而，酮类胡萝卜素含量的增加还尤其指优选的酮类胡萝卜素的含量改变，而总的类胡萝卜素含量无需增加。

在一个特别优选的实施方案中，本发明遗传修饰的植物相比于野生型具有增加的虾青素含量。

在这种情况下，增加的含量也指造成的酮类胡萝卜素(如虾青素)的含量。

本发明还涉及新的酮酶和编码其的新核酸。

本发明尤其涉及含有SEQ.ID NO：8氨基酸序列的酮酶或含有对SEQ.ID NO：8序列进行置换、插入或缺失氨基酸后产生的与SEQ.ID.NO：2序列在氨基酸水平上具有至少70％、优选至少75％、特别优选至少80％、更优选至少85％、更优选至少90％、更优选至少95％一致性的序列的酮酶，前提是不存在SEQ ID NO：8的氨基酸序列。如上所述，SEQ.ID NO：4序列在数据库中被注释为推定的蛋白质。

本发明还涉及含有SEQ.ID.NO：6氨基酸序列或对SEQ.ID.NO：6序列进行置换、插入或缺失氨基酸后产生的与SEQ.ID.NO：6序列在氨基酸水平上具有至少70％一致性的序列的酮酶。如上所述，SEQ.ID.NO：6序列在数据库中没有注释。

在另一实施方案中，本发明涉及含有SEQ ID NO：12的氨基酸序列的酮酶或含有对SEQ ID.NO：12序列进行置换、插入或缺失氨基酸后产生的与SEQ.ID.NO：12序列在氨基酸水平上具有至少70％、优选至少75％、特别优选至少80％、更优选至少85％、更优选至少90％、更优选至少95％一致性的序列的酮酶，前提是不存在SEQ ID NO：6氨基酸序列。

本发明还涉及含有SEQ ID NO：49氨基酸序列的酮酶或含有对SEQ.ID.NO：49序列进行置换、插入或缺失氨基酸后产生的在氨基酸水平上与SEQ ID NO：49具有至少50％、优选至少60％、特别优选至少70％、更优选至少80％、更优选至少90％、更优选至少95％一致性的序列的酮酶，前提是不存在氨基酸序列SEQ ID NO：47。如上所述，SEQ ID NO：47序列在数据库中被注释为推定的蛋白质。

本发明还涉及编码以上所述蛋白质的核酸，条件是所述核酸不包括序列SEQ ID NO：5。

已令人惊奇的发现，含有SEQ ID NO.4氨基酸序列或对SEQ ID NO.4序列进行置换、插入或缺失氨基酸后产生的与SEQ.ID.NO：4序列在氨基酸水平上具有至少70％、优选至少75％、特别优选至少80％、更优选至少85％、更优选至少90％、更优选至少95％一致性并具有酮酶性质的序列的蛋白质具有酮酶的性质。

本发明因此也涉及含有SEQ.ID.NO.4氨基酸序列或对SEQ.ID.NO.4序列进行置换、插入或缺失氨基酸后产生的与SEQ.ID.NO：4序列在氨基酸水平上具有至少70％、优选至少75％、特别优选至少80％、更优选至少85％、更优选至少90％、更优选至少95％一致性并具有酮酶性质的序列的蛋白质作为酮酶的用途。

还令人惊奇的发现，含有SEQ.ID.NO.6氨基酸序列或对SEQ.ID.NO.6序列进行置换、插入或缺失氨基酸后产生的序列的蛋白质具有酮酶的性质，其中所述修饰的序列与SEQ.ID.NO.6序列在氨基酸水平上具有至少65％、优选至少70％、优选至少75％、特别优选至少80％、更优选至少85％、更优选至少90％、更优选至少95％的一致性，并具有酮酶的性质。

本发明因此也涉及含有SEQ.ID.NO：6氨基酸序列或对SEQ.ID.NO：6序列进行置换、插入或缺失氨基酸后产生的序列的蛋白质作为酮酶的用途，其中所述修饰的序列与SEQ.ID.NO：6序列在氨基酸水平上具有至少65％、优选至少70％、优选至少75％、特别优选至少80％、更优选至少85％、更优选至少90％、更优选至少95％的一致性，并具有酮酶的性质。

还令人惊奇的发现，含有SEQ ID NO：47氨基酸序列或对SEQ ID NO：47序列进行置换、插入或缺失氨基酸后产生的序列的蛋白质具有酮酶的性质，其中所述修饰的序列与SEQ ID NO：47序列在氨基酸水平上具有至少50％、优选至少60％、优选至少70％、特别优选至少80％、更优选至少85％、更优选至少90％、更优选至少95％的一致性，并具有酮酶的性质。

本发明因此也涉及含有SEQ ID NO：47氨基酸序列或对SEQ ID NO：47序列进行置换、插入或缺失氨基酸后产生的序列的蛋白质作为酮酶的用途，其中所述修饰的序列与SEQ ID NO：47序列在氨基酸水平上具有至少50％、优选至少60％、优选至少70％、特别优选至少80％、更优选至少85％、更优选至少90％、更优选至少95％的一致性，并具有酮酶的性质。

与现有技术的方法相比，本发明方法更大量的提供具有少量羟化副产物的酮类胡萝卜素，特别是虾青素。

现在通过以下实施例来解释本发明，但并不限于此：

一般实验条件：

重组DNA的序列分析

使用来自Licor(MWG Biotech所售，Ebersbach，Germany)的激光荧光DNA测序仪，按照Sanger的方法(Sanger等人，Proc.Natl.Acad.Sci.USA 74 (1977)，5463-5467)对重组DNA分子进行测序。

实施例1

扩增编码NOST酮酶完整一级序列的DNA，所述酮酶来自念珠藻属PCC 7120。

通过PCR手段从念珠藻属PCC 7120(″Pasteur Culture Collection ofCyanobacterium″菌株)中扩增编码念珠藻属PCC 7120 NOST酮酶的DNA。

为了从在25℃、恒定振荡(150rpm)并连续光照条件下生长于BG11培养基(1.5g/l NaNO₃、0.04g/l K₂PO₄x3H₂O、0.075g/l MgSO₄xH₂O、0.036g/l CaCl₂x2H₂O、0.006g/l柠檬酸、0.006g/l柠檬酸铁铵、0.001g/l EDTA二钠镁、0.04g/l Na₂CO₃、1ml痕量金属混合物A5+Co(2.86g/l H₃BO₃、1.81g/l MnCl₂x4H₂O、0.222g/l ZnSO₄x7H₂O、0.39g/l NaMoO₄x2H₂O、0.079g/lCuSO₄x5H₂O、0.0494g/l Co(NO₃)₂x6H₂O))中1周的念珠藻属PCC 7120悬浮培养物制备基因组DNA，离心收集细胞，冷冻于液氮，并在研钵中将细胞碾磨成粉。

从念珠藻PCC 7120中分离DNA的方法：

通过8000rpm离心10分钟，从10ml液体培养物中沉淀细菌细胞。然后用研钵在液氮中破碎并碾磨细胞。用1ml 10mM Tris HCI(pH 7.5)重悬浮细胞材料，并转移到Eppendorf反应试管(体积2ml)内。加入100μl蛋白酶K(浓度：20mg/ml)后，将细胞悬浮液在37℃孵育3小时。然后用500μl苯酚抽提悬浮液。13000rpm离心5分钟后将上层水相转移到新的2ml Eppendorf反应试管中。用苯酚反复抽提3次。加入1/10体积的3M醋酸钠(pH 5.2)和0.6体积的异丙醇沉淀DNA，然后用70％的乙醇洗涤。在室温干燥DNA沉淀，加入25μl水，并加热到65℃溶解。

通过聚合酶链式反应(PCR)的手段，使用有义特异引物(NOSTF，SEQID NO.19)和反义特异引物(NOSTG SEQ ID NO.20)从念珠藻属PCC 7120中扩增编码念珠藻属PCC 7120酮酶的核酸。

PCR条件如下：

在50μl反应混合物中进行扩增DNA的PCR，所述DNA编码由完整一级序列组成的酮酶蛋白质，PCR反应混合物含有：

-1μl念珠藻属PCC 7120 DNA(按如上描述制备)

-0.25mM dNTPs

-0.2mM NOSTF(SEQ ID NO.19)

-0.2mM NOSTG(SEQ ID NO.20)

-5μl 10X PCR缓冲液(TAKARA)

-0.25μl R Taq聚合酶(TAKARA)

-25.8μl蒸馏水

在以下循环条件下进行PCR：

1X 94℃ 2分钟

35X 94℃ 1分钟

55℃ 1分钟

72℃ 3分钟

1X 72℃ 10分钟

使用SEQ ID NO.19和SEQ ID NO.20的PCR扩增产生了805bp的片段，所述片段编码由完整一级序列组成的蛋白质(SEQ ID NO.21)。使用标准方法，将扩增子克隆进PCR克隆载体pGEM-T(Promega)，产生pNOSTF-G克隆。

使用M 13F和M 13R引物对pNOSTF-G克隆的测序确证了与数据库条目AP003592的88,886-89,662之DNA序列一致的序列。在独立扩增实验中此核苷酸序列重复产生并由此代表使用的念珠藻属PCC 7120中的核苷酸序列。

因此，所述pNOSTF-G克隆被用于克隆进表达载体pJIT117(Guerineau等人1988，Nucl.Acids Res.16：11380)。通过从pNOSTF-G分离799 bp SphI片段并连接进SphI切割的pJIT117载体，从而完成克隆。以正确方向含有念珠藻属PCC 7120酮酶的克隆被称为pJNOST，所述酮酶的N-末端与rbcS转运肽翻译融合。

实施例2

用于在大肠杆菌中合成玉米黄质的质粒pMCL-CrtYIBZ/idi/gps的构建。

经中间体pMCL-CrtYIBZ和pMCL-CrtYIBZ/idi，通过3个步骤构建成pMCL-CrtYIBZ/idi/gps。使用的载体是与高拷贝数载体相容的pMCL200质粒(Nakano，Y.，Yoshida，Y.，Yamashita，Y.和Koga，T.；Construction of a series of pACYC-derived plasmid vectors；Gene 162(1995)，157-158)。

实施例2.1：pMCL-CrtYIBZ的构建

生物合成基因crtY、crtB、crtI和crtZ来自噬夏孢欧文氏菌，并通过PCR手段扩增。作为提供服务的一部分，Deutsche Sammlung vonMikroorganismen und Zellkuturen(DSMZ，Brunswick，Germany)制备噬夏孢欧文氏菌(DSM 30080)基因组DNA。根据制造商提供的信息进行PCR(Roche，Long Template PCR：Procedure for amplification of 5-20kbtargets with the expand long template PCR system)。扩增噬夏孢欧文氏菌生物合成簇的PCR条件如下：

Master Mix 1：

-1.75μl dNTPs(终浓度350μM)

-0.3μM引物Crt1(SEQ ID NO.22)

-0.3μM引物Crt2(SEQ ID NO.23)

-250-500ng DSM 30080基因组DNA

加蒸馏水至总体积50μl

Master Mix 2：

-5μl 10x PCR缓冲液1(终浓度1x，含1.75mM Mg2+)

-10x PCR缓冲液2(终浓度1x，含2.25mM Mg2+)

-10x PCR缓冲液3(终浓度1x，含2.25mM Mg2+)

-0.75μl Expand Long Template Enzyme Mix(终浓度2.6单位)

加蒸馏水至总体积50μl

用吸管将两种混合物“Master Mix 1”和“Master Mix 2”混合。在50μl的总体积中以如下循环条件进行PCR：

1X 94℃两分钟

30X 94℃30秒

58℃1分钟

68℃4分钟

1X 72℃10分钟

使用SEQ ID NO.22和SEQ ID NO.23的PCR扩增产生了编码基因CrtY(蛋白质：SEQ ID NO.25)、CrtI(蛋白质：SET NID NO.26)、crtB(蛋白质：SEQ ID NO.27)和CrtZ(iDNA)的片段(SEQ ID NO.24)。使用标准方法，将扩增子克隆进PCR克隆载体pCR2.1(Invitrogen)，产生pCR2.1-CrtYIBZ克隆。

用SalI和HindIII切割pCR2.1-CrtYIBZ质粒，分离产生的SalI/HindIII片段，并通过连接将其转移进SalI/HindIII切割的pMCL200载体。克隆进pMCL 200的pCR2.1-CrtYIBZ SalI/HindIII片段长为4624bp，编码CrtY、CrtI、crtB和CrtZ基因，相应于D90087中2295位点到6918位点的序列(SEQ ID NO.24)。产生的克隆被称为pMCL-CrtYIBZ。

实施例2.2：pMCL-CrtYIBZ/idi的构建

通过PCR手段从大肠杆菌中扩增idi(异戊烯-二磷酸异构酶；IPP异构酶)基因。使用有义特异引物(sense-specific primer)(5′-idi SEQ ID NO.28)和反义特异引物(antisense-specific primer)(3′-idi SEQ ID NO.29)，通过聚合酶链式反应(PCR)的手段，从大肠杆菌中扩增包括idi启动子和核糖体结合位点的编码完整idi基因的核酸。

PCR条件如下：

在50μl反应混合物中进行扩增DNA的PCR，反应混合物含有：

-1μl大肠杆菌TOP10悬浮液

-0.25mM dNTPs

-0.2mM 5′-idi(SEQ ID NO.28)

-0.2mM 3′-idi(SEQ ID NO.29)

-5μl 10X PCR缓冲液(TAKARA)

-0.25μl R Taq聚合酶(TAKARA)

-28.8μl蒸馏水

以如下循环条件进行PCR：

1X 94℃两分钟

20X 94℃1分钟

62℃1分钟

72℃1分钟

1X 72℃10分钟

使用SEQ ID NO.28和SEQ ID NO.29的PCR扩增产生679bp的片段，所述片段编码由完整一级序列(SEQ ID NO.30)组成的蛋白质。使用标准方法，将扩增子克隆进PCR克隆载体pCR2.1(Invitrogen)，产生pCR2.1-idi克隆。

对pCR2.1-idi克隆的测序确证了与发表的AE000372序列8774到9440位点无异的序列。这一区域包括启动子区域、可能的核糖体结合位点和完整的IPP异构酶开放阅读框。由于在idi基因的5’端插入了XhoI切割位点和在3’端插入了SalI切割位点，克隆进pCR2.1-idi的片段总长679bp。

因此，使用这一克隆将idi基因克隆进pMCL-CrtYIBZ载体。通过从pCR2.1-idi分离XhoI/SalI片段并连接进XhoI/SalI切割的pMCL-CrtYIBZ载体进行克隆。产生的克隆被称为pMCL-CrtYIBZ/idi。

实施例2.3.：pMCL-CrtYIBZ/idi/gps的构建

通过PCR手段从Archaeoglobus fulgidus中扩增gps(香叶基香叶基-焦磷酸合酶；GGPP合酶)基因。使用有义特异引物(5′-gps SEQ ID NO.32)和反义特异引物(5′-gps SEQ ID NO.33)，通过聚合酶链式反应(PCR)的手段扩增Archaeoglobus fulgidus gps基因。

作为提供服务的一部分，Deutschen Sammlung von Mikroorganismenund Zellkuturen(DSMZ，Brunswick，Germany)制备Archaeoglobusfulgidus DNA。PCR条件如下：

在50μl反应混合物中进行扩增DNA的PCR，所述DNA编码由完整一级序列组成的GGPP合酶蛋白质，PCR反应混合物含有：

-1μl Archaeoglobus fulgidus DNA

-0.25mM dNTPs

-0.2mM 5′-gps(SEQ ID NO.32)

-0.2mM 3′-gps(SEQ ID NO.33)

-5μl 10X PCR缓冲液(TAKARA)

-0.25μl R Taq聚合酶(TAKARA)

-28.8μl蒸馏水

以如下循环条件进行PCR：

1X 94℃两分钟

20X 94℃1分钟

56℃1分钟

72℃1分钟

1X 72℃10分钟

用已知方法从琼脂糖凝胶中洗脱通过PCR手段和SEQ ID NO.32和SEQ ID NO.33引物扩增的DNA片段，并用限制酶NcoI和HindIII切割。由此产生962bp的片段，此片段编码由完整一级序列(SEQ ID NO.34)组成的蛋白质。使用标准方法将NcoI/HindIII切割的扩增子克隆进pCB97-30载体，产生pCB-gps克隆。

对pCB-gps克隆的测序确证了与发表的AF120272序列有一个核苷酸差异的A.fulgidus GGPP合酶序列。在gps基因中引入一个NcoI切点改变了GGPP合酶的第二个密码子。在发表的AF120272序列中，CTG(4-6位点)编码亮氨酸。使用SEQ ID NO.32和SEQ ID NO.33两引物的扩增将此第二密码子改变为编码缬氨酸的GTG。

因此，使用pCB-gps克隆将gps基因克隆进pMCL-CrtYIBZ/idi载体。通过从pCB-gps中分离KpnI/XhoI片段并连接进用KpnI和XhoI切割的pMCL-CrtYIBZ/idi载体来进行克隆。克隆的KpnI/XhoI片段(SEQ ID NO.34)携带rbcL的最小5’UTR序列及Prrn 16启动子、延伸GGPP合酶N末端的前6个rbcL密码子和gps基因3’端的psbA序列。因此不同于具有Met-Leu-Lys-Glu的天然氨基酸序列(AF120272的1到4位氨基酸)，此GGPP合酶的N末端具有改变的氨基酸序列Met-Thr-Pro-Gln-Thr-Ala-Met-Val-Lys-Glu。这导致重组GGPP合酶，其从位点3(在AF120272中)的Lys开始在氨基酸序列上具有一致性，并且不具有其它改变。根据Eibl等人的参考文献(Plant J.19.(1999)，1-13)使用rbcL和psbA序列。产生的克隆被称为pMCL-CrtYIBZ/idi/gps。

实施例3：

在重组大肠杆菌菌株中生物转化玉米黄质

通过制备由于异源互补而能产生玉米黄质的重组大肠杆菌菌株来进行玉米黄质的生物转化。以大肠杆菌TOP10菌株作为用质粒pNOSTF-G和pMCL-CrtYIBZ/idi/gps进行互补实验的宿主细胞。

为了制备能够合成高浓度玉米黄质的大肠杆菌菌株，构建了pMCL-CrtYIBZ/idi/gps质粒。所述质粒携带噬夏孢欧文氏菌的生物合成基因crtY、crtB、crtI和crtY、Archaeoglobus fulgidus基因gps(香叶基香叶基-焦磷酸合成酶)和大肠杆菌idi(异戊烯-二磷酸异构酶)基因。此构建体用于消除限制类胡萝卜素以及它们的生物合成前体高聚积的步骤。这一点已被Wang等人在之前以相似的方式，使用若干质粒进行了描述(Wang，C.-W.，Oh，M.-K.和Liao，J.C.；Engineered isoprenoid pathway enhancesastaxanthin production in Escherichia coli.Biotechnology andBioengineering 62(1999)，235-241)。

使用pNOSTF-G和pMCL-CrtYIBZ/idi/gps两种质粒，以已知的方式转化大肠杆菌TOP10培养物，并分别过夜培养于30℃和37℃的LB培养基。同样地以已知的方式在过夜培养中加入氨苄青霉素(50μg/ml)、氯霉素(50μg/ml)和异丙基-β-硫代半乳糖苷(1mmol)。

通过用丙酮抽提细胞，蒸发有机溶剂至干燥，并通过HPLC的手段使用C30柱对类胡萝卜素进行分级分离，从重组菌株中分离类胡萝卜素。设置了以下的工艺条件。

分离柱：Prontosil C30柱、250×4.6mm(Bischoff，Leonberg，Germany)

流速：1.0ml/min

洗脱液：洗脱液A-100％甲醇

洗脱液B-80％甲醇、0.2％醋酸胺

洗脱液C-100％叔丁基甲基醚

梯度曲线：

时间	流速	％洗脱液A	％洗脱液B	％洗脱液C
时间	流速	％洗脱液A	％洗脱液B	％洗脱液C	1.00	1.0	95.0	5.0	0
1.05	1.0	80.0	5.0	15.0	1.00	1.0	95.0	5.0	0
1.05	1.0	80.0	5.0	15.0	14.00	1.0	42.0	5.0	53.0
14.05	1.0	95.0	5.0	0	14.00	1.0	42.0	5.0	53.0
14.05	1.0	95.0	5.0	0	17.00	1.0	95.0	5.0	0
18.00	1.0	95.0	5.0	0	17.00	1.0	95.0	5.0	0

检测：300-500nm

使用光(电)二极管阵列检测器直接从洗脱峰检测光谱。

通过与标准样品比较，由吸收光谱和保留时间来鉴定分离的物质。

图1描述样品的层析分析结果，所述样品来自用pNOSTF-G和pMCL-CrtYIBZ/idi/gps转化的大肠杆菌菌株。由于异源互补，这一菌株表现出能够合成多种酮类胡萝卜素。随停留时间的增加，洗脱出虾青素(峰1)、adonirubin(峰2)和角黄素(峰3)。

实施例3.1

比较实施例

作为比较实施例，相似于先前的实施例制备大肠杆菌菌株，所述大肠杆菌菌株表达雨生红球藻Flotow em.Wille来源的酮酶。为此目的，扩增编码雨生红球藻Flotow em.Wille酮酶完整一级序列的cDNA，并将此cDNA按照实施例1克隆进同样的表达载体。通过PCR手段，从雨生红球藻(″Sammlung von Algenkulturen der Universitt Gttingen″的192.80菌株)悬浮培养物中扩增编码雨生红球藻酮酶的cDNA。为了从在室温间接日光条件下于红球藻培养基(1.2g/l醋酸钠、2g/l酵母提取物、0.2g/lMgCl₂x6H₂O、0.02 CaCl₂x2H₂O；pH 6.8；高压灭菌后加入400mg/l的L-天冬酰胺、10mg/l FeSO₄xH2O)中生长两周的雨生红球藻(192.80菌株)悬浮培养物中制备总RNA，收获细胞，在液氮中冷冻，并在研钵中碾磨成粉。随后将100mg冷冻的藻类细胞粉末转移到反应容器内并加入0.8ml Trizol缓冲液(Life Technologies)。用0.2ml氯仿抽提悬浮液。12000g离心15分钟后，将水相上清液转移到干净的反应容器内，并用一体积的乙醇抽提。用一体积异丙醇沉淀RNA，用75％的乙醇洗涤并将沉淀溶解于DEPC水(用1/1000体积焦碳酸二乙酯在室温孵育水过夜，然后高压灭菌)。通过分光光度法测定RNA浓度。

为合成cDNA，在60℃将2.5μg总RNA变性10分钟，冰上冷却两分钟，并按照制造商的信息，使用反义特异引物PR1(gcaagctcga cagctacaaacc)，通过cDNA试剂盒(Ready-to-go-you-prime-beads，Pharmacia Biotech)转录成cDNA。

通过聚合酶链式反应(PCR)的手段，使用有义特异引物PR2(gaagcatgca gctagcagcg acag)和反义特异引物PR1从雨生红球藻扩增编码雨生红球藻(192.80菌株)的酮酶的核酸。

PCR条件如下：

在50ml反应混合物中进行扩增cDNA的PCR，此cDNA编码由完整一级序列组成的酮酶蛋白质，PCR反应混合物含有：

-4ml雨生红球藻cDNA(按如上描述制备)

-0.25mM dNTPs

-0.2mM PR1

-0.2mM PR2

-5ml 10X PCR缓冲液(TAKARA)

-0.25ml R Taq聚合酶(TAKARA)

-28.8ml蒸馏水

以如下循环条件进行PCR：

1X 94℃两分钟

35X 94℃1分钟

53℃2分钟

72℃3分钟

1X 72℃10分钟

使用PR1和PR2的PCR扩增产生1155bp的片段，此片段编码由完整一级序列组成的蛋白质：

gaagcatgca gctagcagcg acagtaatgt tggagcagct taccggaagc gctgaggcac 60

tcaaggagaa ggagaaggag gttgcaggca gctctgacgt gttgcgtaca tgggcgaccc 120

agtactcgct tccgtcagag gagtcagacg cggcccgccc gggactgaag aatgcctaca 180

agccaccacc ttccgacaca aagggcatca caatggcgct agctgtcatc ggctcctggg 240

ccgcagtgtt cctccacgcc atttttcaaa tcaagcttcc gacctccttg gaccagctgc 300

actggctgcc cgtgtcagat gccacagctc agctggttag cggcagcagc agcctgctgc 360

acatcgtcgt agtattcttt gtcctggagt tcctgtacac aggccttttt atcaccacgc 420

atgatgctat gcatggcacc atcgccatga gaaacaggca gcttaatgac ttcttgggca 480

gagtatgcat ctccttgtac gcctggtttg attacaacat gctgcaccgc aagcattggg 540

agcaccacaa ccacactggc gaggtgggca aggaccctga cttccacagg ggaaaccctg 600

gcattgtgcc ctggtttgcc agcttcatgt ccagctacat gtcgatgtgg cagtttgcgc 660

gcctcgcatg gtggacggtg gtcatgcagc tgctgggtgc gccaatggcg aacctgctgg 720

tgttcatggc ggccgcgccc atcctgtccg ccttccgctt gttctacttt ggcacgtaca 780

tgccccacaa gcctgagcct ggcgccgcgt caggctctcc accagccgtc atgaactggt 840

ggaagtcgcg cactagccag gcgtccgacc tggtcagctt tctgacctgc taccacttcg 900

acctgcactg ggagcaccac cgctggccct ttgccccctg gtgggagctg cccaactgcc 960

gccgcctgtc tggccgaggt ctggttcctg cctagctgga cacactgcag tgggccctgc 1020

tgccagctgg gcatgcaggt tgtggcagga ctgggtgagg tgaaaagctg caggcgctgc 1080

tgccggacac gctgcatggg ctaccctgtg tagctgccgc cactagggga gggggtttgt 1140

agctgtcgag cttgc

使用标准方法，将扩增子克隆进PCR克隆载体pGEM-Teasy(Promega)，产生pGKETO2克隆。

使用T7和SP6引物对pGKETO2克隆测序，确证了仅在73、114和119三个密码子中各有一个碱基与发表的X86782序列不同的序列。在独立的扩增实验中这些核苷酸置换重复产生，并因此代表在所用雨生红球藻192.80菌株中的核苷酸序列。

这一克隆被用于克隆进实施例1中描述的表达载体。以相似于实施例1中描述的方式进行克隆。按照实施例3中的描述进行大肠杆菌菌株的转化、培养和类胡萝卜素分布图的分析。

图2描述样品的层析分析，此样品得自用所述表达载体和pMCL-CrtYIBZ/idi/gps转化的大肠杆菌菌株。使用如EP 725137中描述的雨生红球藻酮酶，随停留时间的增加洗脱出虾青素(峰1)、金盏花黄质(峰2)和未反应的玉米黄质(峰3)。EP 0725137中已经描述了这一类胡萝卜素分布图。

表1比较了细菌产生的类胡萝卜素量：

表1：比较使用两种不同酮酶，即根据本发明(实施例3)的念珠藻属PCC7120 NOST酮酶和作为比较实施例(实施例3.1)的雨生红球藻酮酶时的细菌酮类胡萝卜素合成。类胡萝卜素的量以ng/ml培养物液体表示。

酮酶来源	虾青素	adonirubin	金盏花黄质	角黄素	玉米黄质
酮酶来源	虾青素	adonirubin	金盏花黄质	角黄素	玉米黄质	雨生红球藻Flotow em.Wille(比较实施例)	13	102	738
念珠藻PCC7120株	491	186		120		雨生红球藻Flotow em.Wille(比较实施例)	13	102	738

根据本发明的念珠藻属PCC7120株酮酶的表达产生了一种类胡萝卜素模式，所述模式与雨生红球藻酮酶表达之后的类胡萝卜素模式显著不同。尽管现有技术的酮酶只能以数量非常有限的方式提供目的类萝卜素酮虾青素，但当使用根据本发明的酮酶时，虾青素是主要的产物。本发明方法中出现明显更少量的羟化副产物。

实施例4：制备在番茄(Lycopersicon esculentum)和万寿菊中组成性表达念珠藻属PCC7120株NOST酮酶的表达载体。

在拟南芥来源的组成型启动子FNR(铁氧还蛋白NADPH氧化还原酶，数据库条目AB011474，70127到69493位点；WO03/006660)的控制下，于番茄和万寿菊中表达念珠藻属PCC7120株NOST酮酶。FNR基因起始于69492碱基对，并被注释为“铁氧还蛋白-NADP+还原酶”。使用豌豆转运肽rbcS(Anderson等人1986，Biochem J.240：709-715)进行表达。

通过PCR手段，使用基因组DNA(通过标准方法从拟南芥中分离)和引物FNR-A(SEQ ID NO.38)及FNR-B(SEQ ID NO.39)制备含有拟南芥FNR启动子区域的DNA片段。

PCR条件如下：

在50μl反应混合物中进行扩增DNA的PCR，此DNA包含FNR启动子片段FNR#1，反应混合物含有：

-100ng拟南芥基因组DNA

-0.25mM dNTPs

-0.2mM FNR-A(SEQ ID NO.38)

-0.2mM FNR-B(SEQ ID NO.39)

-5μl 10X PCR缓冲液(Stratagene)

-0.25μl Pfu聚合酶(Stratagene)

-28.8μl蒸馏水

以如下循环条件进行PCR：

1X 94℃两分钟

35X 94℃1分钟

50℃1分钟

72℃1分钟

1X 72℃10分钟

使用标准方法将647bp扩增子克隆进PCR克隆载体PCR 2.1(Invitrogen)，产生pFNR#1质粒。

对pFNR#1克隆的测序确证了相应于拟南芥染色体5上从70127到69493位点之序列部分(数据库条目AB011474；WO03/006660)的序列。FNR基因起始于碱基对69492并被注释名为“铁氧还蛋白-NADP+还原酶”。

因此，pFNR被用于克隆进表达载体pJIT117(Guerineau等人1988，Nucl.Acids Res.16：11380)。

通过从pFNR#1分离637bp SacI-HindIII片段(SacI部分水解)并连接进SacI-HindIII切割的pJIT117载体，从而进行克隆。含有FNR#1启动子而不是原初的d35S启动子的克隆被称为pJITFNR。

通过将799bp的SpHI片段NOSTF-G(描述于实施例1)克隆进SpHI切割的pJITFNR载体，制备成表达盒pJFNRNOST。以正确方向含有NOSTF-G片段的克隆被称为pJFNRNOST，其中所述片段的N-末端与rbcS转运肽融合。

使用二元载体pSUN3(WO02/00900)制备用于通过农杆菌介导向番茄转化念珠藻酮酶的表达盒。

通过将来自pJFNRNOST的2.425bp SacI-XhoI片段(SacI部分水解)与SacI-XhoI切割的pSUN3载体连接，从而制备表达载体pS3FNR:NOST(MSP101)(图3，构建体图谱)。在图3中，FNR启动子片段含有FNR启动子(635bp)，rbcS TP片段含有豌豆rbcS转运肽(194bp)，Nost酮酶CDS片段(777bp)含有编码念珠藻酮酶的完整一级序列，35S Term片段(746bp)含有CaMV多聚腺苷酸化信号。

使用二元载体pSUN5(WO02/00900)制备用于通过农杆菌介导向万寿菊转化含有念珠藻酮酶的表达载体的表达盒。

通过将来自pJFNRNOST的2.425bp SacI-XhoI片段(SacI部分水解)与SacI-XhoI切割的pSUN5载体连接，从而制备万寿菊表达载体pS5FNR：NOST(MSP102)(图4，构建体图谱)。在图4中，FNR启动子片段含有FNR启动子(635bp)，rbcS转运肽片段含有豌豆rbcS转运肽(194bp)，Nost酮酶片段(777bp)含有编码念珠藻酮酶的完整一级序列，35S终止子片段(746bp)含有CaMV多聚腺苷酸化信号。

实施例5：

制备用于在番茄和万寿菊的花中特异性表达念珠藻属PCC 7120株NOST酮酶的表达载体。

使用豌豆rbcS转运肽(Anderson等人1986，Biochem J.240：709-715)实现念珠藻酮酶在番茄和万寿菊中的表达。在修改形式的花特异性拟南芥AP3启动子AP3P(AL132971：9298-10200核苷酸区域；Hill等人(1998)Development 125：1711-1721)的控制下进行表达。

通过PCR手段，使用基因组DNA(通过标准方法从拟南芥中分离)及引物AP3-1(SEQ ID NO.41)和AP3-2(SEQ ID NO.42)制备含有拟南芥AP3启动子区域(-902到+15)的DNA片段。

PCR条件如下：

在50μl反应混合物中进行扩增DNA的PCR，此DNA含有AP3启动子片段(-902到+15)，反应混合物含有：

-100ng拟南芥基因组DNA

-0.25mM dNTPs

-0.2mM AP3-1(SEQ ID NO.41)

-0.2mM AP3-2(SEQ ID NO.42)

-5μl 10X PCR缓冲液(Stratagene)

-0.25μl Pfu聚合酶(Stratagene)

-28.8μl蒸馏水

以如下循环条件进行PCR：

1X 94℃两分钟

35X 94℃1分钟

50℃1分钟

72℃1分钟

1X 72℃10分钟

使用标准方法将929bp扩增子克隆进PCR克隆载体PCR 2.1(Invitrogen)，产生pAP3质粒。

对pAP3克隆的测序确证了所述序列仅因一个插入(在AL132971序列的9765位点插入一个G)和一个碱基置换(AL132971序列9765位点的A被G置换)而不同于发表的AP3序列(AL132971，9298-10200核苷酸区域)。在独立扩增实验中这些核苷酸差异重复产生，并因此代表在所用拟南芥植物中实际的核苷酸序列。

通过重组PCR手段，使用pAP3质粒制备修饰的形式AP3P。使用引物AP3-1(SEQ ID NO.41)和引物AP3-4(SEQ ID NO.44)扩增10200-9771区域(扩增子A1/4)，并使用AP3-3(SEQ ID NO.43)和AP3-2(SEQ ID NO.42)扩增9526-9285区域(扩增子A2/3)。

PCR条件如下：

在50μl反应混合物中进行PCR，以扩增含有AP3启动子10200-9771区域和9526-9285区域的DNA片段，反应混合物含有：

-100ng AP3扩增子(如上描述)

-0.25mM dNTPs

-0.2mM有义引物(AP3-1 SEQ ID NO.41或AP3-3 SEQ ID NO.43)

-0.2mM反义引物(AP3-4 SEQ ID NO.44或AP3-2 SEQ ID NO.42)

-5μl 10X PCR缓冲液(Stratagene)

-0.25μl Pfu Taq聚合酶(Stratagene)

-28.8μl蒸馏水

以如下循环条件进行PCR：

1X 94℃两分钟

35X 94℃1分钟

50℃1分钟

72℃1分钟

1X 72℃10分钟

重组PCR包括将有25个核苷酸相重叠的A1/4和A2/3扩增子退火、完善成双链并随后扩增。由此产生缺失9670-9526位点的修饰形式的AP3启动子AP3P。

在17.6μl反应混合物中变性(95℃，5分钟)和退火(于室温缓慢冷却到40℃)A1/4和A2/3两扩增子，反应混合物含有：

-0.5μg A1/4扩增子

-0.25μg A2/3扩增子

在20μl反应混合物中填补3’端(30℃，30分钟)，反应混合物含有：

-17.6μl A1/4和A2/3退火反应物(按如上描述制备)

-50μM dNTPs

-2μl 1X Klenow缓冲液

-2U Klenow酶

使用有义特异引物(AP3-1 SEQ ID NO.41)和反义特异引物(AP3-2SEQ ID NO.42)，通过PCR手段扩增编码修饰的启动子形式(AP3P)的核酸。

PCR条件如下：

在50μl反应混合物中进行扩增AP3P片段的PCR，反应混合物含有：

-1μl退火反应产物(按如上描述制备)

-0.25mM dNTPs

-0.2mM AP3-1(SEQ ID NO.41)

-0.2mM AP3-2(SEQ ID NO.42)

-5μl 10X PCR缓冲液(Stratagene)

-0.25μl Pfu Taq聚合酶(Stratagene)

-28.8μl蒸馏水

以如下循环条件进行PCR：

1X 94℃两分钟

35X 94℃1分钟

50℃1分钟

72℃1分钟

1X 72℃10分钟

使用SEQ ID NO.41(AP3-1)和SEQ ID NO.42(AP3-2)的PCR扩增产生777bp片段，该片段编码修饰的启动子形式——AP3P。将扩增子克隆进克隆载体pCR2.1(Invitrogen)，产生pAP3P质粒。使用引物T7和M13的测序反应确证了与已缺失9285-9526内部区域的AL132971序列10200-9298区域一致的序列。由此，此克隆被用于克隆进表达载体pJIT117(Guerineau等人1988，Nucl.Acids Res.16：11380)。

通过从pAP3P分离767bp的SacI-HindIII片段，并将其连接进SacI-HindIII切割的pJIT117载体来完成克隆。含有AP3P启动子而不是原初的d35S启动子的克隆被称为pJITAP3P。通过将799bp的SpHI片段——NOSTF-G(描述于实施例1)克隆进SpHI切割的pJITAP3P载体，从而制备表达盒pJAP3NOST。以正确方向含有NOSTF-G片段的克隆被称为pJAP3PNOST，其中所述片段的N-末端与rbcS转运肽融合。

使用二元载体pSUN3(WO02/00900)制备用于通过农杆菌介导向番茄转化AP3P控制的念珠藻酮酶的表达载体。

通过将来自pJAP3PNOST的2.555bp SacI-XhoI片段与SacI-XhoI切割的pSUN3载体连接，从而制备表达载体pS3AP3：NOST(MSP103)(图5，构建体图谱)。在图5中，AP3P PROMOTER片段含有修饰的AP3P启动子(765bp)，rbcS TP FRAGMENT片段含有豌豆rbcS转运肽(194bp)，Nost KETOLASE CDS片段(777bp)含有编码念珠藻酮酶的完整一级序列，35S TERM片段(746bp)含有CaMV多聚腺苷酸化信号。

使用二元载体pSUN5(WO02/00900)制备用于通过农杆菌介导向万寿菊转化AP3P控制的念珠藻酮酶的表达载体。

通过将来自pS5AP3PNOST的2.555bp SacI-XhoI片段与SacI-XhoI切割的pSUN5载体连接，从而制备表达载体pS5AP3：NOST(MSP104)(图6，构建体图谱)。在图6中，AP3P PROMOTER片段含有修饰的AP3P启动子(765bp)，rbcS TP FRAGMENT片段含有豌豆rbcS转运肽(207bp)，Nost KETOLASE CDS片段(777bp)含有编码念珠藻酮酶的完整一级序列，35S TERM片段(746bp)含有CaMV多聚腺苷酸化信号。

实施例6：

扩增编码点形念珠藻ATCC 29133来源的NP196酮酶完整一级序列的DNA。

通过PCR手段，从点形念珠藻ATCC 29133(″美国典型培养物保葳中心″菌株)扩增编码点形念珠藻ATCC 29133 NP196酮酶的DNA。0

为了从在25℃、恒定振荡(150rpm)并连续光照下于BG11培养基(1.5g/l NaNO₃、0.04g/l k₂PO₄x3H₂O、0.075g/l MgSO₄xH₂O、0.036g/lCaCl₂x2H₂O、0.006g/l柠檬酸、0.006g/l柠檬酸铁铵、0.001g/l EDTA二钠镁、0.04g/l Na₂CO₃、1ml痕量金属混合物A5+Co(2.86g/l H₃BO₃、1.81g/l MnCl₂x4H₂O、0.222g/l ZnSO₄x7H₂O、0.39g/l NaMoO₄x2H₂O、0.079g/lCuSO₄x5H₂O、0.0494g/l Co(NO₃)₂x6H₂O)生长1周的点形念珠藻ATCC29133悬浮培养物中制备基因组DNA，离心收集细胞，于液氮冷冻，并在研钵中碾磨成粉。

从点形念珠藻ATCC 29133中分离DNA的方法：

通过8000rpm离心10分钟从10ml液体培养物中沉淀细菌细胞。然后用研钵在液氮中破碎并碾磨细菌细胞。用1ml 10mM Tris HCI(pH 7.5)重悬浮细胞材料，并转移进Eppendorf反应试管(体积2ml)。加入100μl蛋白酶K(浓度：20mg/ml)后，将细胞悬浮液在37℃孵育3小时。然后用500μl苯酚抽提悬浮液。13000rpm离心5分钟后将上层水相转移到新的2ml Eppendorf反应试管中。用苯酚反复抽提3次。加入1/10体积的3M醋酸钠(pH 5.2)和0.6体积的异丙醇沉淀DNA，然后用70％的乙醇洗涤。在室温干燥DNA沉淀，加入25μl水，并加热到65℃溶解。

通过聚合酶链式反应(PCR)的手段，使用有义特异引物(NP196-1，SEQID NO.54)和反义特异引物(NP196-2 SEQ ID NO.55)从点形念珠藻ATCC29133中扩增编码点形念珠藻ATCC 29133酮酶的核酸。

PCR条件如下：

在50μl反应混合物中进行扩增DNA的PCR，此DNA编码由完整一级序列组成的酮酶蛋白质，反应混合物含有：

-1μl点形念珠藻ATCC 29133 DNA(按如上描述制备)

-0.25mM dNTPs

-0.2mM NP196-1(SEQ ID NO.54)

-0.2mM NP196-2(SEQ ID NO.55)

-5μl 10X PCR缓冲液(TAKARA)

-0.25μl R Taq聚合酶(TAKARA)

-25.8μl蒸馏水

在以下循环条件下进行PCR：

1X 94℃2分钟

35X 94℃1分钟

55℃1分钟

72℃3分钟

1X 72℃10分钟

使用SEQ ID NO.54和SEQ ID NO.55的PCR扩增产生792bp的片段，所述片段编码由完整一级序列(NP196，SEQ ID NO.56)组成的蛋白质。使用标准方法，将扩增子克隆进PCR克隆载体pCR 2.1(Invitrogen)，产生pNP196克隆。

使用引物M13F和M13R对pNP196克隆的测序确证了与数据库NZ AABC01000196条目140,571-139,810的DNA序列一致(除在140,571位点的G被A替代以产生标准的ATG起始密码子外)的序列(与发表的数据库条目方向相反)。在独立扩增实验中此核苷酸序列重复产生，并因此代表所用的点形念珠藻ATCC 29133中的核苷酸序列。

因此，所述pNP196克隆被用于克隆进pJIT117表达载体(Guerineau等人1988，Nucl.Acids Res.16：11380)。

用根癌农杆菌Ti质粒pTi15955的OCS终止子(章鱼碱合酶)(数据库条目X00493，12,541-12,350位点，Gielen等人(1984)EMBO J.3 835-846)替换35S终止子来修饰pJIT117。

使用质粒pHELLSGATE(数据库条目AJ311874，Wesley等人(2001)Plant J.27 581-590，通过标准方法从大肠杆菌中分离)以及引物OCS-1(SEQ ID NO.58)和OCS-2(SEQ ID NO.59)，通过PCR手段制备含有OCT终止子区域的DNA片段。

PCR条件如下：

在50μl反应混合物中进行PCR，以扩增含有章鱼碱合酶(OCS)终止子区域(SEQ ID NO：60)的DNA，反应混合物含有：

-1ng pHELLSGATE质粒DNA

-0.25mM dNTPs

-0.2mM OCS-1(SEQ ID NO.58)

-0.2mM OCS-2(SEQ ID NO.59)

-5μl 10X PCR缓冲液(Stratagene)

-0.25μl Pfu聚合酶(Stratagene)

-28.8μl蒸馏水

在以下循环条件下进行PCR：

1X 94℃2分钟

35X 94℃1分钟

50℃1分钟

72℃1分钟

1X 72℃10分钟

使用标准方法，将210bp扩增子克隆进PCR克隆载体pCR 2.1(Invitrogen)，产生pOCS质粒。

对pOCS克隆测序确证了所述序列相应于根癌农杆菌Ti质粒pTi15955(数据库条目X00493)12541-12350位点的序列部分。

从pOCS分离210bp的SalI-XhoI片段，并将其与SalI-XhoI切割的pJIT117载体连接，从而完成克隆。

这一克隆被称为pJO，并因此用于克隆进表达载体pJONP196。

从pNP 196分离782bp的SphI片段，并将其与SphI切割的pJO载体连接，从而完成克隆。以正确方向含有点形念珠藻NP196酮酶的这一克隆被称为pJONP196，所述酮酶的N-末端与rbcS转运肽翻译融合。

实施例7：

制备在番茄和万寿菊中组成性表达点形念珠藻ATCC 29133来源的NP196酮酶的表达载体。

在拟南芥来源的组成型启动子FNR(铁氧还蛋白NADPH氧化还原酶，数据库条目AB011474，70127到69493位点；WO03/006660)的控制下，于番茄和万寿菊中表达点形念珠藻NP196酮酶。FNR基因起始于69492碱基对并被命名为“铁氧还蛋白-NADP+还原酶”。使用豌豆转运肽rbcS(Anderson等人1986，Biochem J.240：709-715)进行表达。

使用基因组DNA(通过标准方法从拟南芥中分离)及引物FNR-1(SEQID NO.61)和FNR-2(SEQ ID NO.62)，通过PCR手段制备含有拟南芥FNR启动子区域的DNA片段。

PCR条件如下：

在50μl反应混合物中进行PCR，以扩增含有FNR启动子片段FNR的DNA(SEQ ID NO.63)，反应混合物含有：

-100ng拟南芥基因组DNA

-0.25mM dNTPs

-0.2mM FNR-1(SEQ ID NO.61)

-0.2mM FNR-2(SEQ ID NO.62)

-5μl 10X PCR缓冲液(Stratagene)

-0.25μl Pfu聚合酶(Stratagene)

-28.8μl蒸馏水

以如下循环条件进行PCR：

1X 94℃两分钟

35X 94℃1分钟

50℃1分钟

72℃1分钟

1X 72℃10分钟

使用标准方法将652bp的扩增子克隆进PCR克隆载体pCR 2.1(Invitrogen)，产生pFNR质粒。

对pFNR克隆的测序确证了相应于拟南芥染色体5上从70127到69493位点的序列片段(数据库条目AB011474)。

这一克隆被称为pFNR，并因此被用于克隆进表达载体pJONP196(描述于实施例6)。

通过从pFNR分离644bp的SmaI-HindIII片段，并将其连接进Ecl136II-HindIII切割的pJONP196载体来完成克隆。含有FNR启动子而不是原初的d35S启动子并且以正确方向含有NP196片段的这一克隆被称为pJOFNR：NP196，所述NP196片段的N-末端与rbcS转运肽融合。

使用二元载体pSUN3(WO02/00900)制备用于通过农杆菌介导向番茄转化念珠藻NP196酮酶的表达盒。

通过将来自pJOFNR：NP196的1839bp的EcoRI-XhoI片段与EcoRI-XhoI切割的pSUN3载体连接，从而制备MSP105表达载体(图7，构建体图谱)。在图7中，FNR启动子片段含有FNR启动子(635bp)，rbcSTP FRAGMENT片段含有豌豆rbcS转运肽(194bp)，NP196 KETO CDS片段(761bp)编码点形念珠藻NP196酮酶，OCS终止子片段(192bp)含有章鱼碱合酶的多聚腺苷酸化信号。

使用二元载体pSUN5(WO02/00900)制备表达盒，所述表达盒用于通过农杆菌介导向万寿菊转化含有点形念珠藻NP196酮酶的表达载体。

通过将来自pJOFNR：NP196的1839bp的EcoRI-XhoI片段与EcoRI-XhoI切割的pSUN5载体连接，从而制备MSP106万寿菊表达载体(图8，构建体图谱)。在图8中，FNR启动子片段含有FNR启动子(635bp)，rbcS TP FRA GMENT片段含有豌豆rbcS转运肽(194bp)，NP196KETO CDS片段(761bp)编码点形念珠藻NP196酮酶，OCS终止子片段(192bp)含有章鱼碱合酶的多聚腺苷酸化信号。

实施例8：

制备用于在番茄和万寿菊的花中特异表达点形念珠藻ATCC 29133来源的NP196酮酶的表达载体。

使用豌豆rbcS转运肽(Anderson等人1986，Biochem J.240：709-715)，在番茄和万寿菊中表达点形念珠藻NP196酮酶。在碧冬茄来源的花特异性EPSPS启动子(数据库条目M37029；核苷酸区域7-1787；Benfey等人(1990)Plant Cell 2：849-856)的控制下进行表达。

使用基因组DNA(通过标准方法从碧冬茄中分离)及引物EPSPS-1(SEQ ID NO.64)和EPSPS-2(SEQ ID NO.65)，通过PCR手段制备含有碧冬茄EPSPS启动子区域的DNA片段(SEQ ID NO.66)。

PCR条件如下：

在50μl反应混合物中进行PCR，以扩增含有EPSPS启动子片段(数据库条目M37029：核苷酸区域7-1787)的DNA，反应混合物含有：

-100ng拟南芥基因组DNA

-0.25mM dNTPs

-0.2mM EPSPS-1(SEQ ID NO.64)

-0.2mM EPSPS-2(SEQ ID NO.65)

-5μl 10X PCR缓冲液(Stratagene)

-0.25μl Pfu聚合酶(Stratagene)

-28.8μl蒸馏水

以如下循环条件进行PCR：

1X 94℃两分钟

35X 94℃1分钟

50℃1分钟

72℃2分钟

1X 72℃10分钟

使用标准方法将1773bp扩增子克隆进PCR克隆载体pCR 2.1(Invitrogen)，产生pEPSPS质粒。

对pEPSPS克隆的测序确证了所述序列仅由于两个缺失(M37029序列46-58位点的ctaagtttcagga碱基；M37029序列1422-1429位点的aaaaatat碱基)和碱基置换(T替代M37029序列1447位点的G；A替代M37029序列1525位点的C；A替代M37029序列1627位点的G)而不同于发表的EPSPS序列(数据库条目M37029：核苷酸区域7-1787)。在独立扩增实验中此两缺失和M37029序列1447及1627位点的两个碱基置换重复产生，并因此代表所用的碧冬茄植物中的实际核苷酸序列。

因此，pEPSPS克隆被用于克隆进pJONP196表达载体(描述于实施例6)。

通过从pEPSPS分离1763 bp的SacI-HindIII片段，并将其连接进SacI-HindIII切割的JONP196载体来完成克隆。含有EPSPS启动子而不是原初的d35S启动子的克隆被称为pJOESP：NP196。这一表达盒以正确方向含有NP196片段，其中所述片段的N-末端与rbcS转运肽融合。

使用二元载体pSUN3(WO02/00900)制备表达载体，所述载体用于通过农杆菌介导向番茄转化EPSPS控制的点形念珠藻ATCC 29133 NP196酮酶。

将来自pJOESP：NP196的2961bp的SachI-XhoI片段与SacI-XhoI切割的pSUN3载体连接，从而制备MSP107表达载体(图9，构建体图谱)。在图9中，EPSPS片段含有EPSPS启动子(1761bp)，rbcS TP FRAGMENT片段含有豌豆rbcS转运肽(194bp)，NP196 KETO CDS片段(761bp)编码点形念珠藻NP196酮酶，OCS终止子片段(192bp)含有章鱼碱合酶的多聚腺苷酸化信号。

使用二元载体pSUN5(WO02/00900)制备表达载体，所述载体用于通过农杆菌介导向万寿菊转化EPSPS控制的点形念珠藻NP196酮酶。

将来自pJOESP：NP196的2961 kbp的SachI-XhoI片段与SacI-XhoI切割的pSUN5载体连接，从而制备MSP108表达载体(图10，构建体图谱)。在图10中，EPSPS片段含有EPSPS启动子(1761bp)，rbcS TPFRAGMENT片段含有豌豆rbcS转运肽(194bp)，NP196 KETO CDS片段(761bp)编码点形念珠藻NP196酮酶，OCS终止子片段(192bp)含有章鱼碱合酶的多聚腺苷酸化信号。

实施例9：

扩增编码点形念珠藻ATCC 29133来源的NP195酮酶完整一级序列的DNA。

通过PCR手段，从点形念珠藻ATCC 29133(美国典型培养物保藏中心菌株)扩增DNA，所述DNA编码点形念珠藻ATCC 29133的NP195酮酶。从点形念珠藻ATCC 29133悬浮培养物中制备基因组DNA已被描述于实施例19。

使用有义特异引物(NP195-1，SEQ ID NO.67)和反义特异引物(NP195-2 SEQ ID NO.68)，通过聚合酶链式反应(PCR)的手段从点形念珠藻ATCC 29133中扩增编码点形念珠藻ATCC 29133酮酶的核酸。

PCR条件如下：

在50μl反应混合物中进行扩增DNA的PCR，所述DNA编码由完整一级序列组成的酮酶蛋白质，反应混合物含有：

-1μl点形念珠藻ATCC 29133 DNA(按如上描述制备)

-0.25mM dNTPs

-0.2mM NP195-1(SEQ ID NO.67)

-0.2mM NP195-2(SEQ ID NO.68)

-5μl 10X PCR缓冲液(TAKARA)

-0.25μl R Taq聚合酶(TAKARA)

-25.8μl蒸馏水

在以下循环条件下进行PCR：

1X 94℃2分钟

35X 94℃1分钟

55℃1分钟

72℃3分钟

1X 72℃10分钟

使用SEQ ID NO.67和SEQ ID NO.68的PCR扩增产生819bp的片段，所述片段编码由完整一级序列(NP195，SEQ ID NO.69)组成的蛋白质。使用标准方法，将扩增子克隆进PCR克隆载体pCR 2.1(Invitrogen)，产生pNP195克隆。

使用M13F和M13R引物对pNP195克隆的测序确证了与数据库NZ_AABC01000195条目55604-56392的DNA序列一致(除在55604位点的T被A替代以产生标准的ATG起始密码子外)的序列。在独立扩增实验中此核苷酸序列重复产生并因此代表所用的点形念珠藻ATCC 29133中的核苷酸序列。

因此，所述pNP195克隆被用于克隆进表达载体pJO(描述于实施例6)。通过从pNP195分离809bp的SphI片段，并将其连接进SphI切割的pJO载体来完成克隆。以正确方向含有点形念珠藻NP195酮酶的克隆被称为pJONP195，所述酮酶的N-末端与rbcS转运肽翻译融合。

实施例10：

制备在番茄和万寿菊中组成性表达点形念珠藻ATCC 29133来源的NP195酮酶的表达载体。

在拟南芥来源的组成型启动子FNR(铁氧还蛋白NADPH氧化还原酶，数据库条目AB011474，70127到69493位点；WO03/006660)的控制下，于番茄和万寿菊中表达点形念珠藻NP195酮酶。FNR基因起始于69492碱基对，并被注释为“铁氧还蛋白-NADP+还原酶”。使用豌豆转运肽rbcS(Anderson等人1986，Biochem J.240：709-715)进行表达。

因此，将pFNR克隆(描述于实施例7)用于克隆进表达载体pJONP195(描述于实施例10)。

通过从pFNR分离644bp的Sma-HindIII片段，并将其连接进Ecl136II-HindIII切割的pJONP195载体来完成克隆。含有FNR启动子而不是原初的d35S启动子并以正确方向含有NP195片段的克隆被称为pJOFNR:NP195，所述NP195片段的N-末端与rbcS转运肽融合。

使用二元载体pSUN3(WO02/00900)制备表达盒，所述表达盒用于通过农杆菌介导向番茄转化点形念珠藻NP195酮酶。

通过将来自pJOFNR:NP195的1866bp的EcoRI-XhoI片段与EcoRI-XhoI切割的pSUN3载体连接，从而制备MSP109表达载体(图11，构建体图谱)。在图11中，FNR启动子片段含有FNR启动子(635bp)，rbcS TP FRAGMENT片段含有豌豆rbcS转运肽(194bp)，NP195 KETOCDS片段(789bp)编码点形念珠藻NP195酮酶，OCS终止子片段(192bp)含有章鱼碱合酶的多聚腺苷酸化信号。

使用二元载体pSUN5(WO02/00900)制备表达盒，所述表达盒用于通过农杆菌介导向万寿菊转化含有点形念珠藻NP195酮酶的表达载体。

通过将来自pJOFNR：NP195的1866bp的EcoRI-XhoI片段与EcoRI-XhoI切割的pSUN5载体连接，从而制备MSP110万寿菊表达载体(图12，构建体图谱)。在图12中，FNR启动子片段含有FNR启动子(635bp)，rbcS TP FRAGMENT片段含有豌豆rbcS转运肽(194bp)，NP195KETO CDS片段(789bp)编码点形念珠藻NP195酮酶，OCS终止子片段(192bp)含有章鱼碱合酶的多聚腺苷酸化信号。

实施例11：

制备用于在番茄和万寿菊中花特异性表达点形念珠藻ATCC 29133来源的NP195酮酶的表达载体。

使用豌豆rbcS转运肽(Anderson等人1986，Biochem J.240：709-715)在番茄和万寿菊中表达点形念珠藻NP195酮酶。在碧冬茄来源的花特异性EPSPS启动子(数据库条目M37029；核苷酸区域7-1787；Benfey等人(1990)Plant Cell 2：849-856)的控制下进行表达。

因此，将pEPSPS克隆(描述于实施例8)用于克隆进表达载体pJONP195(描述于实施例10)。

通过从pEPSPS分离1763bp的SacI-HindIII片段，并将其连接进SacI-HindIII切割的pJONP195载体来完成克隆。含有EPSPS启动子而不是原初的d35S启动子的克隆被称为pJOESP：NP195。这一表达盒以正确方向含有NP195片段，所述片段的N-末端与rbcS转运肽融合。

使用二元载体pSUN3(WO02/00900)制备表达载体，所述载体用于通过农杆菌介导向番茄转化EPSPS控制的点形念珠藻ATCC 29133 NP195酮酶。

将来自pJOESP：NP195的2988kbp的SachI-XhoI片段与SacI-XhoI切割的pSUN3载体连接，从而制备MSP111表达载体(图13，构建体图谱)。在图13中，EPSPS片段含有EPSPS启动子(1761bp)，rbcS TPFRAGMENT片段含有豌豆rbcS转运肽(194bp)，NP195 KETO CDS片段(789bp)编码点形念珠藻NP195酮酶，OCS终止子片段(192bp)含有章鱼碱合酶的多聚腺苷酸化信号。

使用二元载体pSUN5(WO02/00900)制备表达载体，所述载体用于通过农杆菌介导向万寿菊转化EPSPS控制的点形念珠藻NP195酮酶。

将来自pJOESP：NP195的2988kbp的SachI-XhoI片段与SacI-XhoI切割的pSUN5载体连接，从而制备MSP112表达载体(图14，构建体图谱)。在图14中，EPSPS片段含有EPSPS启动子(1761bp)，rbcS TPFRAGMENT片段含有豌豆rbcS转运肽(194bp)，NP195 KETO CDS片段(789bp)编码点形念珠藻NP195酮酶，OCS终止子片段(192bp)含有章鱼碱合酶的多聚腺苷酸化信号。

实施例12：

扩增编码泡沫节球藻NSOR10来源的NODK酮酶完整一级序列的DNA。

通过PCR手段，从泡沫节球藻NSOR10扩增编码泡沫节球藻NSOR10酮酶的DNA。

为了从在25℃、恒定振荡(150rpm)并连续光照下于BG 11培养基(1.5g/l NaNO₃、0.04g/l K₂PO₄x3H₂O、0.075g/l MgSO₄xH₂O、0.036g/lCaCl₂x2H₂O、0.006g/l柠檬酸、0.006g/l柠檬酸铁铵、0.001g/l EDTA二钠镁、0.04g/l Na₂CO₃、1ml痕量金属混合物A5+Co(2.86g/l H₃BO₃、1.81g/lMnCl₂x4H₂O、0.222g/l ZnSO₄x7H₂O、0.39g/l NaMoO₄x2H₂O、0.079g/lCuSO₄x5H₂O、0.0494g/l Co(NO₃)₂x6H₂O)生长1周的泡沫节球藻NSOR10悬浮培养物中制备基因组DNA，通过离心收集细胞，于液氮中冷冻，并在研钵中碾磨成粉。

从泡沫节球藻NSOR10中分离DNA的方法：

通过在8000rpm离心10分钟，从10ml液体培养物中沉淀细菌细胞。然后用研钵在液氮中破碎并碾磨细胞。用1ml 10mM Tris HCI(pH 7.5)重悬浮细胞材料，并转移进Eppendorf反应试管(体积2ml)。加入100μl蛋白酶K(浓度：20mg/ml)后，将细胞悬浮液在37℃孵育3小时。然后用500μl苯酚抽提悬浮液。13000rpm离心5分钟后将上层水相转移到新的2ml Eppendorf反应试管中。用苯酚反复抽提3次。加入1/10体积的3M醋酸钠(pH 5.2)和0.6体积的异丙醇沉淀DNA，然后用70％的乙醇洗涤。在室温干燥DNA沉淀，加入25μl水，并在加热到65℃溶解。

使用有义特异引物(NODK-1，SEQ ID NO.71)和反义特异引物(NODK-2，SEQ ID NO.72)，通过聚合酶链式反应(PCR)的手段从泡沫节球藻NSOR10中扩增编码泡沫节球藻NSOR10酮酶的核酸。

PCR条件如下：

-1μl泡沫节球藻NSOR10 DNA(按如上描述制备)

-0.25mM dNTPs

-0.2mM NODK-1(SEQ ID NO.71)

-0.2mM NODK-2(SEQ ID NO.72)

-5μl 10X PCR缓冲液(TAKARA)

-0.25μl R Taq聚合酶(TAKARA)

-25.8μl蒸馏水

在以下循环条件下进行PCR：

1X 94℃2分钟

35X 94℃1分钟

55℃ 1分钟

72℃ 3分钟

1X 72℃ 10分钟

使用SEQ ID NO.71和SEQ ID NO.72的PCR扩增产生720bp的片段，此片段编码由完整一级序列(NODK，SEQ ID NO.73)组成的蛋白质。使用标准方法，将扩增子克隆进PCR克隆载体pCR 2.1(Invitrogen)，产生pNODK克隆。

使用M13F和M13R引物对pNODK克隆的测序确证了与数据库AY210783条目2130-2819的DNA序列一致的序列(与发表的数据库条目方向相反)。在独立扩增实验中此核苷酸序列重复产生，并因代表所用的泡沫节球藻NSOR10中的核苷酸序列。

因此，所述pNODK克隆被用于克隆进表达载体pJO(描述于实施例6)。通过从pNODK分离710bp的SphI片段并将其与SphI切割的pJO载体连接，从而完成克隆。以正确方向含有泡沫节球藻NODK酮酶的克隆被称为pJONODK，所述酮酶的N-末端与rbcS转运肽翻译融合。

实施例13：

制备在番茄和万寿菊中组成性表达泡沫节球藻NSOR10来源的NODK酮酶的表达载体。

在拟南芥来源的组成型启动子FNR(铁氧还蛋白NADPH氧化还原酶，数据库条目AB011474，70127到69493位点；WO03/006660)的控制下，于番茄和万寿菊中表达泡沫节球藻NSOR10 NODK酮酶。FNR基因起始于69492碱基对并被命名为“铁氧还蛋白-NADP+还原酶”。使用豌豆转运肽rbcS(Anderson等人1986，Biochem J.240：709-715)进行表达。

因此，将pFNR克隆(描述于实施例7)用于克隆进表达载体pJONODK(描述于实施例12)。

通过从pFNR分离644bp的Sma-HindIII片段，并将其连接进Ecl136II-HindIII切割的pJONODK载体来完成克隆。含有FNR启动子而不是原初的d35S启动子并且以正确方向含有NODK片段的克隆被称为pJOFNR：NODK，所述NODK片段的N-末端与rbcS转运肽融合。

使用二元载体pSUN3(WO02/00900)制备表达盒，所述表达盒用于通过农杆菌介导向番茄转化泡沫节球藻NSOR10 NODK酮酶。

通过将来自pJOFNR：NODK的1767bp的EcoRI-XhoI片段与EcoRI-XhoI切割的pSUN3载体连接，从而制备MSP113表达载体(图15，构建体图谱)。在图15中，FNR启动子片段含有FNR启动子(635bp)，rbcS TP FRAGMENT片段含有豌豆rbcS转运肽(194bp)，NODK KETOCDS片段(690bp)编码泡沫节球藻NSOR10 NODK酮酶，OCS终止子片段(192bp)含有章鱼碱合酶的多聚腺苷酸化信号。

使用二元载体pSUN5(WO02/00900)制备表达盒，所述表达盒用于通过农杆菌介导向万寿菊转化含有泡沫节球藻NSOR10 NODK酮酶的表达载体。

通过将来自pJOFNR：NODK的1767bp的EcoRI-XhoI片段与EcoRI-XhoI切割的pSUN5载体连接，从而制备MSP114万寿菊表达载体(图16，构建体图谱)。在图16中，FNR启动子片段含有FNR启动子(635bp)，rbcS TP FRAGMENT片段含有豌豆rbcS转运肽(194bp)，NODKKETO CDS片段(690bp)编码泡沫节球藻NSOR10 NODK酮酶，OCS终止子片段(192bp)含有章鱼碱合酶的多聚腺苷酸化信号。

实施例14：

制备用于在番茄和万寿菊中花特异性表达泡沫节球藻NSOR10来源的NODK酮酶的表达载体。

使用豌豆rbcS转运肽(Anderson等人1986，Biochem J.240：709-715)在番茄和万寿菊中表达泡沫节球藻NSOR10 NODK酮酶。在碧冬茄来源的花特异性EPSPS启动子(数据库条目M37029；核苷酸区域7-1787；Benfey等人(1990)Plant Cell 2：849-856)的控制下进行表达。

因此，将pEPSPS克隆(描述于实施例8)用于克隆进pJONODK表达载体(描述于实施例12)。

通过从pEPSPS分离1763bp的SacI-HindIII片段，并将其连接进SacI-HindIII切割的pJONODK载体来完成克隆。含有EPSPS启动子而不是原初的d35S启动子的克隆被称为pJOESP：NODK。这一表达盒以正确方向含有NODK片段，所述片段的N-末端与rbcS转运肽融合。

使用二元载体pSUN3(WO02/00900)制备表达载体，所述载体用于通过农杆菌介导向番茄转化EPSPS控制的泡沫节球藻NSOR10 NODK酮酶。

将来自pJOESP：NODK的2889kbp的SachI-XhoI片段与SacI-XhoI切割的pSUN3载体连接，从而制备MSP115表达载体(图17，构建体图谱)。在图17中，EPSPS片段含有EPSPS启动子(1761bp)，rbcS TPFRAGMENT片段含有豌豆rbcS转运肽(194bp)，NODK KETO CDS片段(690bp)编码泡沫节球藻NSOR10NODK酮酶，OCS终止子片段(192bp)含有章鱼碱合酶的多聚腺苷酸化信号。

使用二元载体pSUN5(WO02/00900)制备表达载体，所述载体用于通过农杆菌介导向万寿菊转化EPSPS控制的泡沫节球藻NSOR10 NODK酮酶。

将来自pJOESP：NODK的2889kbp的SachI-XhoI片段与SacI-XhoI切割的pSUN5载体连接，从而制备MSP116表达载体(图18，构建体图谱)。在图18中，EPSPS片段含有EPSPS启动子(1761bp)，rbcS TPFRAGMENT片段含有豌豆rbcS转运肽(194bp)，NODK KETO CDS片段(690bp)编码泡沫节球藻NSOR10 NODK酮酶，OCS终止子片段(192bp)含有章鱼碱合酶的多聚腺苷酸化信号。

实施例15：

转基因番茄植物的制备

根据Ling及其合作者发表的方法(Plant Cell Reports(1998)，17：843-847)转化并再生番茄植物。对于品种Microtom，使用更高浓度的卡那霉素(100mg/l)进行选择。使用Microtom系的7到10天龄幼苗的子叶和下胚轴作为用于转化的最初外植体。萌发使用含2％蔗糖、pH 6.1的Murashige和Skoog的培养基(1962：Murashige and Skoog，1962，Physiol.Plant 15，473-)。在21℃、低光照(20-100μE)的情况下进行萌发。7到10天后，横向分割子叶，将下胚轴切成约5-10mm长的节段，并置于MSBN培养基(MS，pH 6.1，3％蔗糖+1mg/l BAP，0.1mg/l NAA)上，在一天前预先对所述培养基装载悬浮培养的番茄细胞。用无菌滤纸覆盖番茄细胞(无气泡)。在所述培养基上将外植体预培养3到5天。单独使用pS3FNR：NOST、pS3AP3：NOST、pS3FNR：NP196、pS3EPS：NP196、pS3FNR：NP195、pS3EPS：NP195、pS3FNR：NODK和pS3EPS：NODK质粒分别转化根癌农杆菌LBA4404株细胞。在每种情况下，将用二元载体pS3FNRNOST、pS3AP3NOST、pS3FNR：NP196、pS3EPS：NP196、pS3FNR：NP195、pS3EPS：NP195、pS3FNR：NODK和pS3EPS：NODK转化的各农杆菌菌株的过夜培养物在28℃培养于含有卡那霉素(20mg/l)的YEB培养基中，离心细胞。将细菌沉淀重悬浮于液体MS培养基(3％蔗糖，pH 6.1)，并调节到0.3的光密度(在600nm)。将预培养的外植体转移到悬浮液中，并在室温于温和振荡的条件下孵育30分钟。随后，用无菌滤纸干燥外植体，并将其返回预培养培养基共培养3天(21℃)。

共培养后，将外植体转移到MSZ2培养基(MS pH 6.1+3％蔗糖、2mg/l玉米素、100mg/l卡那霉素、160mg/l替曼汀(timentin))并储存，用于在21℃、弱光条件(20-100μE、光节律16h/8h)下选择性再生。在芽形成以前每两到3周转移一次外植体。可以从外植体上分离小芽，并让其在MS(pH 6.1+3％蔗糖)、160mg/l替曼汀、30mg/l卡那霉素、0.1mg/lIAA上生根。将生根的植物转移到温室。

根据以上描述的转化方法，用以下表达构建体获得了如下株系：

用pS3FNR：NOST获得的株系是：MSP101-1、MSP101-2、MSP101-3

用pS3AP3：NOST获得的株系是：MSP103-1、MSP103-2、MSP103-3

用pS3FNR：NP196获得的株系是：MSP105-1、MSP105-2、MSP105-3

用pS3EPS：NP196获得的株系是：MSP107-1、MSP107-2、MSP107-3

用pS3FNR：NP195获得的株系是：MSP109-1、MSP109-2、MSP109-3

用pS3EPS：NP195获得的株系是：MSP111-1、MSP111-2、MSP111-3

用pS3FNR：NODK获得的株系是：MSP113-1、MSP113-2、MSP113-3

用pS3EPS：NODK获得的株系是：MSP115-1、MSP115-2、MSP115-3

实施例16：

转基因万寿菊植物的制备

将万寿菊种子灭菌并置于萌发培养基(MS培养基；Murashige和Skoog，Physio.Plant.15(1962)，473-497)pH 5.8，2％蔗糖)上。萌发发生的温度/光照/时间间隔为18-28℃/20-200μE/3-16周、但是优选在21℃、20-70μE、持续4-8周。

到时收获体外发育的植物的所有叶子，并从中部横切。在制备过程中将由此产生的10-60mm²大小的叶外植体储存于室温下的液体MS培养基中，并且不超过两小时。

过夜培养任何一种具有适当二元质粒的根癌农杆菌菌株，并用于与叶子材料共培养，其中优选超毒力菌株，如EHA 105，所述二元质粒可以携带选择性标记基因(优选bar或pat)和一种或多种性状或报告基因(pS5FNR：NOST、pS5AP3：NOST、pS5FNR：NP196、pS5EPS：NP196、pS5FNR：NP195、pS5EPS：NP195、pS5FNR：NODK和pS5EPS：NODK)。可以如下培养细菌菌株：将适当菌株的单菌落接种于具有25mg/l卡那霉素的YEB(0.1％酵母提取物、0.5％牛肉膏、0.5％蛋白胨、0.5％蔗糖、0.5％硫酸镁x 7 H₂O)，并在28℃培养16到20小时。然后以6000g离心10分钟收获细菌悬浮液，并重新悬浮于液体MS培养基，以至产生约0.1到0.8的OD₆₀₀。将这一悬浮液与叶子材料共培养。

临在共培养之前，用细菌悬浮液替换储存叶子的MS培养基。以室温下温和振荡30分钟在农杆菌悬浮液中孵育叶子。然后将感染的外植体置于用琼脂(如0.8％的植物琼脂(Duchefa，NL))固化的具有生长调节剂(如3mg/l的苄基氨基嘌呤(Benzylaminopurin)(BAP)和1mg/l吲哚乙酸(IAA))的MS培养基上。叶子在培养基上的方向是无关紧要的。外植体的培养进行1到8天，但是优选6天，在此过程中可应用以下条件：光强度：30-80μmol/m² x秒，温度：22-24℃，16/8小时明/暗交替。然后，将共培养的外植体转移到新鲜MS培养基，优选具有同样的生长调节剂，此第二培养基额外含有抗生素来抑制细菌生长。浓度为200到500mg/l的替曼汀特别适合这一目的。使用的第二选择性组分用于选择成功的转化。1到5mg/l浓度的膦丝菌素选择特别有效，但是也可以根据所用方法考虑其它选择性组分。

在每种情况下1到3周后，将外植体转移到新鲜培养基直到发育出胚芽和小芽，然后将其转移到具生长调节剂(即如0.5mg/l的吲哚丁酸(IBA)和0.5mg/l的赤霉酸GA₃)的同样基础培养基进行生根，所述培养基含有替曼汀和PPT或含有替代组分。生根的芽可以被转移到温室。

除了描述的方法，可以进行以下有利的修改：

在用细菌感染外植体以前，可以将外植体预孵育于上述用于共培养的培养基上1到12天(优选3-4天)。随后是如上描述的感染、共培养和选择性再生。

可以将用于再生的pH值(通常为5.8)降到5.2。这样能提高对农杆菌生长的控制。

向再生培养基加入AgNO₃(3-10mg/l)能提高包括再生自身在内的培养条件。

技术人员所知的降低苯酚形成的组分(如柠檬酸、抗坏血酸、PVP和许多其它组分)对于培养具有有利的作用。

整个方法可以使用液体培养基。也可以在置于液体培养基上的商业可获得的支持物上孵育培养物。

根据以上描述的转化方法，用以下表达构建体获得了下述株系：

用pS5FNR：NOST获得的株系是：例如MSP102-1、MSP102-2、MSP102-3

用pS5AP3：NOST获得的株系是：例如MSP104-1、MSP104-2、MSP104-3

用pS5FNR：NP196获得的株系是：MSP106-1、MSP106-2、MSP106-3

用pS5EPS：NP196获得的株系是：MSP108-1、MSP108-2、MSP108-3

用pS5FNR：NP195获得的株系是：MSP110-1、MSP110-2、MSP110-3

用pS5EPS：NP195获得的株系是：MSP112-1、MSP112-2、MSP112-3

用pS5FNR：NODK获得的株系是：MSP114-1、MSP114-2、MSP114-3

用pS5EPS：NODK获得的株系是：MSP116-1、MSP116-2、MSP116-3

实施例17

转基因植物花的特征描述

实施例9.1

从转基因植物的花瓣中分离类胡萝卜素酯

一般方法：

在液氮中碾磨转基因植物的花瓣，并用100％的丙酮(3次，每次500μl)抽提花瓣粉末(约40mg)。蒸发掉溶剂并将类胡萝卜素重悬浮于100-200μl的石油醚/丙酮(5∶1，v/v)。

根据类胡萝卜素的疏水性(phobicity)，通过Silica60 F254平板(Merck)上的薄层层析(TLC)，在有机溶剂(石油醚/丙酮；5∶1)中以浓缩形式对类胡萝卜素进行分级分离。挖取TLC上黄色(叶黄素酯)、红素(酮类胡萝卜素酯)和橙色(叶黄素和酮类胡萝卜素酯的混合物)的带。

用500μl丙酮对与二氧化硅结合的类胡萝卜素进行3次洗脱，蒸发掉溶剂，并通过HPLC的手段分级分离和鉴定类胡萝卜素。

可以通过C30反相柱区分类胡萝卜素的单酯和二酯。HPLC运行条件与发表的方法(Frazer等人(2000)，Plant Journal 24(4)：551-558)实质上一致。设定了以下方法条件。

分离柱：Prontosil C30柱，250×4.6mm，(Bischoff，Leonberg，Germany)

流速：1.0ml/min

洗脱液：洗脱液A-100％甲醇

洗脱液B-80％甲醇、0.2％乙酸铵

洗脱液C-100％叔丁基甲基醚

梯度曲线：

时间	流速	％洗脱液A	％洗脱液B	％洗脱液C
时间	流速	％洗脱液A	％洗脱液B	％洗脱液C	12.0	1.0	95.0	5.0	0
12.1	1.0	80.0	5.0	15.0	12.0	1.0	95.0	5.0	0
12.1	1.0	80.0	5.0	15.0	22.0	1.0	76.0	5.0	19.0
22.0	1.0	66.5	5.0	28.5	22.0	1.0	76.0	5.0	19.0
22.0	1.0	66.5	5.0	28.5	38.0	1.0	15.0	5.0	80.0
45.0	1.0	95.0	5.0	0	38.0	1.0	15.0	5.0	80.0
45.0	1.0	95.0	5.0	0	46.0	1.0	95.0	5.0	0
46.1	1.0	95.0	5.0	0	46.0	1.0	95.0	5.0	0

检测：300-500nm

可以基于UV-VIS光谱鉴定类胡萝卜素。

碾磨转基因番茄植物的花瓣材料并用丙酮抽提。通过TLC手段对抽提的类胡萝卜素进行分级分离，在此品系中可以检测到酮类胡萝卜素的单酯和二酯；单酯具有比二酯明显更低的浓度。

实施例18

类胡萝卜素酯的酶水解以及类胡萝卜素的鉴定

一般的方法

用100％的丙酮抽提(3次500μl；每次振荡约15分钟)碾磨的花瓣材料(30-100mg鲜重)。蒸发掉溶剂。然后用495μl丙酮吸收类胡萝卜素，在加入4.95ml磷酸钾缓冲液(100mM，pH 7.4)后彻底混合。然后加入17mg胆汁盐(Sigma)和149μl NaCl/CaCl₂溶液(3M NaCl和75mMCaCl₂)。将悬浮液在37℃孵育30分钟。为了酶促水解类胡萝卜素酯，加入595μl脂酶溶液(50mg/ml Candida rugosa来源的7型脂酶(Sigma))并在振荡下孵育于37℃。约21小时后，进一步加入595μl脂酶，再度在37℃孵育至少5小时。然后在溶液中溶解约700mg Na₂SO₄x10H₂O。加入1800μl石油醚后，通过剧烈混合将类胡萝卜素抽提进有机相。重复这一抽提，直到有机相保持无色。合并石油醚级分并蒸发掉石油醚。用100-120μl丙酮吸收游离的类胡萝卜素。可以通过HPLC和C30反相柱的手段，基于停留时间和UV-VIS光谱鉴定游离的类胡萝卜素。

序列表

<110>太阳基因两合公司(SunGene GmbH & Co.KgaA)

<120>在遗传修饰生物中制备酮类胡萝卜素的方法

<130>20020636

<160>74

<170>PatentIn version 3.1

<210>1

<211>777

<212>DNA

<213>念珠藻PCC7120

<220>

<221>CDS

<222>(1)..(777)

<223>

<400>1

atg gtt cag tgt caa cca tca tct ctg cat tca gaa aaa ctg gtg tta 48

Met Val Gln Cys Gln Pro Ser Ser Leu His Ser Glu Lys Leu Val Leu

1 5 10 15

ttg tca tcg aca atc aga gat gat aaa aat att aat aag ggt ata ttt 96

Leu Ser Ser Thr Ile Arg Asp Asp Lys Asn Ile Asn Lys Gly Ile Phe

20 25 30

att gcc tgc ttt atc tta ttt tta tgg gca att agt tta atc tta tta 144

Ile Ala Cys Phe Ile Leu Phe Leu Trp Ala Ile Ser Leu Ile Leu Leu

35 40 45

ctc tca ata gat aca tcc ata att cat aag agc tta tta ggt ata gcc 192

Leu Ser Ile Asp Thr Ser Ile Ile His Lys Ser Leu Leu Gly Ile Ala

50 55 60

atg ctt tgg cag acc ttc tta tat aca ggt tta ttt att act gct cat 240

Met Leu Trp Gln Thr Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ala His

65 70 75 80

gat gcc atg cac ggc gta gtt tat ccc aaa aat ccc aga ata aat aat 288

Asp Ala Met His Gly Val Val Tyr Pro Lys Asn Pro Arg Ile Asn Asn

85 90 95

ttt ata ggt aag ctc act cta atc ttg tat gga cta ctc cct tat aaa 336

Phe Ile Gly Lys Leu Thr Leu Ile Leu Tyr Gly Leu Leu Pro Tyr Lys

100 105 110

gat tta ttg aaa aaa cat tgg tta cac cac gga cat cct ggt act gat 384

Asp Leu Leu Lys Lys His Trp Leu His His Gly His Pro Gly Thr Asp

115 120 125

tta gac cct gat tat tac aat ggt cat ccc caa aac ttc ttt ctt tgg 432

Leu Asp Pro Asp Tyr Tyr Asn Gly His Pro Gln Asn Phe Phe Leu Trp

130 135 140

tat cta cat ttt atg aag tct tat tgg cga tgg acg caa att ttc gga 480

Tyr Leu His Phe Met Lys Ser Tyr Trp Arg Trp Thr Gln Ile Phe Gly

145 150 155 160

tta gtg atg att ttt cat gga ctt aaa aat ctg gtg cat ata cca gaa 528

Leu Val Met Ile Phe His Gly Leu Lys Asn Leu Val His Ile Pro Glu

165 170 175

aat aat tta att ata ttt tgg atg ata cct tct att tta agt tca gta 576

Asn Asn Leu Ile Ile Phe Trp Met Ile Pro Ser Ile Leu Ser Ser Val

180 185 190

caa cta ttt tat ttt ggt aca ttt ttg cct cat aaa aag cta gaa ggt 624

Gln Leu Phe Tyr Phe Gly Thr Phe Leu Pro His Lys Lys Leu Glu Gly

195 200 205

ggt tat act aac ccc cat tgt gcg cgc agt atc cca tta cct ctt ttt 672

Gly Tyr Thr Asn Pro His Cys Ala Arg Ser Ile Pro Leu Pro Leu Phe

210 215 220

tgg tct ttt gtt act tgt tat cac ttc ggc tac cac aag gaa cat cac 720

Trp Ser Phe Val Thr Cys Tyr His Phe Gly Tyr His Lys Glu His His

225 230 235 240

gaa tac cct caa ctt cct tgg tgg aaa tta cct gaa gct cac aaa ata 768

Glu Tyr Pro Gln Leu Pro Trp Trp Lys Leu Pro Glu Ala His Lys Ile

245 250 255

tct tta taa 777

Ser Leu

<210>2

<211>258

<212>PRT

<213>念珠藻PCC7120

<400>2

Met Val Gln Cys Gln Pro Ser Ser Leu His Ser Glu Lys Leu Val Leu

1 5 10 15

Leu Ser Ser Thr Ile Arg Asp Asp Lys Asn Ile Asn Lys Gly Ile Phe

20 25 30

Ile Ala Cys Phe Ile Leu Phe Leu Trp Ala Ile Ser Leu Ile Leu Leu

35 40 45

Leu Ser Ile Asp Thr Ser Ile Ile His Lys Ser Leu Leu Gly Ile Ala

50 55 60

Met Leu Trp Gln Thr Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ala His

65 70 75 80

Asp Ala Met His Gly Val Val Tyr Pro Lys Asn Pro Arg Ile Asn Asn

85 90 95

Phe Ile Gly Lys Leu Thr Leu I1e Leu Tyr Gly Leu Leu Pro Tyr Lys

100 105 110

Asp Leu Leu Lys Lys His Trp Leu His His Gly His Pro Gly Thr Asp

115 120 125

Leu Asp Pro Asp Tyr Tyr Asn Gly His Pro Gln Asn Phe Phe Leu Trp

130 135 140

Tyr Leu His Phe Met Lys Ser Tyr Trp Arg Trp Thr Gln Ile Phe Gly

145 150 155 160

Leu Val Met Ile Phe His Gly Leu Lys Asn Leu Val His Ile Pro Glu

165 170 175

Asn Asn Leu Ile Ile Phe Trp Met Ile Pro Ser Ile Leu Ser Ser Val

180 185 190

Gln Leu Phe Tyr Phe Gly Thr Phe Leu Pro His Lys Lys Leu Glu Gly

195 200 205

Gly Tyr Thr Asn Pro His Cys Ala Arg Ser Ile Pro Leu Pro Leu Phe

210 215 220

Trp Ser Phe Val Thr Cys Tyr His Phe Gly Tyr His Lys Glu His His

225 230 235 240

Glu Tyr Pro Gln Leu Pro Trp Trp Lys Leu Pro Glu Ala His Lys Ile

245 250 255

Ser Leu

<210>3

<211>789

<212>DNA

<213>点形念珠藻

<220>

<221>CDS

<222>(1)..(789)

<223>

<400>3

ttg aat ttt tgt gat aaa cca gtt agc tat tat gtt gca ata gag caa 48

Leu Asn Phe Cys Asp Lys Pro Val Ser Tyr Tyr Val Ala Ile Glu Gln

1 5 10 15

tta agt gct aaa gaa gat act gtt tgg ggg ctg gtg att gtc ata gta 96

Leu Ser Ala Lys Glu Asp Thr Val Trp Gly Leu Val Ile Val Ile Val

20 25 30

att att agt ctt tgg gta gct agt ttg gct ttt tta cta gct att aat 144

Ile Ile Ser Leu Trp Val Ala Ser Leu Ala Phe Leu Leu Ala Ile Asn

35 40 45

tat gcc aaa gtc cca att tgg ttg ata cct att gca ata gtt tgg caa 192

Tyr Ala Lys Val Pro Ile Trp Leu Ile Pro Ile Ala Ile Val Trp Gln

50 55 60

atg ttc ctt tat aca ggg cta ttt att act gca cat gat gct atg cat 240

Met Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ala His Asp Ala Met His

65 70 75 80

ggg tca gtt tat cgt aaa aat ccc aaa att aat aat ttt atc ggt tca 288

Gly Ser Val Tyr Arg Lys Asn Pro Lys Ile Asn Asn Phe Ile Gly Ser

85 90 95

cta gct gta gcg ctt tac gct gtg ttt cca tat caa cag atg tta aag 336

Leu Ala Val Ala Leu Tyr Ala Val Phe Pro Tyr Gln Gln Met Leu Lys

100 105 110

aat cat tgc tta cat cat cgt cat cct gct agc gaa gtt gac cca gat 384

Asn His Cys Leu His His Arg His Pro Ala Ser Glu Val Asp Pro Asp

115 120 125

ttt cat gat ggt aag aga aca aac gct att ttc tgg tat ctc cat ttc 432

Phe His Asp Gly Lys Arg Thr Asn Ala Ile Phe Trp Tyr Leu His Phe

130 135 140

atg ata gaa tac tcc agt tgg caa cag tta ata gta cta act atc cta 480

Met Ile Glu Tyr Ser Ser Trp Gln Gln Leu Ile Val Leu Thr Ile Leu

145 150 155 160

ttt aat tta gct aaa tac gtt ttg cac atc cat caa ata aat ctc atc 528

Phe Asn Leu Ala Lys Tyr Val Leu His Ile His Gln Ile Asn Leu Ile

165 170 175

tta ttt tgg agt att cct cca att tta agt tcc att caa ctg ttt tat 576

Leu Phe Trp Ser Ile Pro Pro Ile Leu Ser Ser Ile Gln Leu Phe Tyr

180 185 190

ttc gga aca ttt ttg cct cat cga gaa ccc aag aaa gga tat gtt tat 624

Phe Gly Thr Phe Leu Pro His Arg Glu Pro Lys Lys Gly Tyr Val Tyr

195 200 205

ccc cat tgc agc caa aca ata aaa ttg cca act ttt ttg tca ttt atc 672

Pro His Cys Ser Gln Thr Ile Lys Leu Pro Thr Phe Leu Ser Phe Ile

210 215 220

gct tgc tac cac ttt ggt tat cat gaa gaa cat cat gag tat ccc cat 720

Ala Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His

225 230 235 240

gta cct tgg tgg caa ctt cca tct gta tat aag cag aga gta ttc aac 768

Val Pro Trp Trp Gln Leu Pro Ser Val Tyr Lys Gln Arg Val Phe Asn

245 250 255

aat tca gta acc aat tcg taa 789

Asn Ser Val Thr Asn Ser

260

<210>4

<211>262

<212>PRT

<213>点形念珠藻

<400>4

Leu Asn Phe Cys Asp Lys Pro Val Ser Tyr Tyr Val Ala Ile Glu Gln

1 5 10 15

Leu Ser Ala Lys Glu Asp Thr Val Trp Gly Leu Val Ile Val Ile Val

20 25 30

Ile Ile Ser Leu Trp Val Ala Ser Leu Ala Phe Leu Leu Ala Ile Asn

35 40 45

Tyr Ala Lys Val Pro Ile Trp Leu Ile Pro Ile Ala Ile Val Trp Gln

50 55 60

Met Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ala His Asp Ala Met His

65 70 75 80

Gly Ser Val Tyr Arg Lys Asn Pro Lys Ile Asn Asn Phe Ile Gly Ser

85 90 95

Leu Ala Val Ala Leu Tyr Ala Val Phe Pro Tyr Gln Gln Met Leu Lys

100 105 110

Asn His Cys Leu His His Arg His Pro Ala Ser Glu Val Asp Pro Asp

115 120 125

Phe His Asp Gly Lys Arg Thr Asn Ala Ile Phe Trp Tyr Leu His Phe

130 135 140

Met Ile Glu Tyr Ser Ser Trp Gln Gln Leu Ile Val Leu Thr Ile Leu

145 150 155 160

Phe Asn Leu Ala Lys Tyr Val Leu His Ile His Gln Ile Asn Leu Ile

165 170 175

Leu Phe Trp Ser Ile Pro Pro Ile Leu Ser Ser Ile Gln Leu Phe Tyr

180 185 190

Phe Gly Thr Phe Leu Pro His Arg Glu Pro Lys Lys Gly Tyr Val Tyr

195 200 205

Pro His Cys Ser Gln Thr Ile Lys Leu Pro Thr Phe Leu Ser Phe Ile

210 215 220

Ala Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His

225 230 235 240

Val Pro Trp Trp Gln Leu Pro Ser Val Tyr Lys Gln Arg Val Phe Asn

245 250 255

Asn Ser Val Thr Asn Ser

260

<210>5

<211>762

<212>DNA

<213>点形念珠藻

<220>

<221>CDS

<222>(1)..(762)

<223>

<400>5

gtg atc cag tta gaa caa cca ctc agt cat caa gca aaa ctg act cca 48

Val Ile Gln Leu Glu Gln Pro Leu Ser His Gln Ala Lys Leu Thr Pro

1 5 10 15

gta ctg aga agt aaa tct cag ttt aag ggg ctt ttc att gct att gtc 96

Val Leu Arg Ser Lys Ser Gln Phe Lys Gly Leu Phe Ile Ala Ile Val

20 25 30

att gtt agc gca tgg gtc att agc ctg agt tta tta ctt tcc ctt gac 144

Ile Val Ser Ala Trp Val Ile Ser Leu Ser Leu Leu Leu Ser Leu Asp

35 40 45

atc tca aag cta aaa ttt tgg atg tta ttg cct gtt ata cta tgg caa 192

Ile Ser Lys Leu Lys Phe Trp Met Leu Leu Pro Val Ile Leu Trp Gln

50 55 60

aca ttt tta tat acg gga tta ttt att aca tct cat gat gcc atg cat 240

Thr Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ser His Asp Ala Met His

65 70 75 80

ggc gta gta ttt ccc caa aac acc aag att aat cat ttg att gga aca 288

Gly Val Val Phe Pro Gln Asn Thr Lys Ile Asn His Leu Ile Gly Thr

85 90 95

ttg acc cta tcc ctt tat ggt ctt tta cca tat caa aaa cta ttg aaa 336

Leu Thr Leu Ser Leu Tyr Gly Leu Leu Pro Tyr Gln Lys Leu Leu Lys

100 105 110

aaa cat tgg tta cac cac cac aat cca gca agc tca ata gac ccg gat 384

Lys His Trp Leu His His His Asn Pro Ala Ser Ser Ile Asp Pro Asp

115 120 125

ttt cac aat ggt aaa cac caa agt ttc ttt gct tgg tat ttt cat ttt 432

Phe His Asn Gly Lys His Gln Ser Phe Phe Ala Trp Tyr Phe His Phe

130 135 140

atg aaa ggt tac tgg agt tgg ggg caa ata att gcg ttg act att att 480

Met Lys Gly Tyr Trp Ser Trp Gly Gln Ile Ile Ala Leu Thr Ile Ile

145 150 155 160

tat aac ttt gct aaa tac ata ctc cat atc cca agt gat aat cta act 528

Tyr Asn Phe Ala Lys Tyr Ile Leu His Ile Pro Ser Asp Asn Leu Thr

165 170 175

tac ttt tgg gtg cta ccc tcg ctt tta agt tca tta caa tta ttc tat 576

Tyr Phe Trp Val Leu Pro Ser Leu Leu Ser Ser Leu Gln Leu Phe Tyr

180 185 190

ttt ggt act ttt tta ccc cat agt gaa cca ata ggg ggt tat gtt cag 624

Phe Gly Thr Phe Leu Pro His Ser Glu Pro Ile Gly Gly Tyr Val Gln

195 200 205

cct cat tgt gcc caa aca att agc cgt cct att tgg tgg tca ttt atc 672

Pro His Cys Ala Gln Thr Ile Ser Arg Pro Ile Trp Trp Ser Phe Ile

210 215 220

acg tgc tat cat ttt ggc tac cac gag gaa cat cac gaa tat cct cat 720

Thr Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His

225 230 235 240

att tct tgg tgg cag tta cca gaa att tac aaa gca aaa tag 762

Ile Ser Trp Trp Gln Leu Pro Glu Ile Tyr Lys Ala Lys

245 250

<210>6

<211>253

<212>PRT

<213>点形念珠藻

<400>6

Val Ile Gln Leu Glu Gln Pro Leu Ser His Gln Ala Lys Leu Thr Pro

1 5 10 15

Val Leu Arg Ser Lys Ser Gln Phe Lys Gly Leu Phe Ile Ala Ile Val

20 25 30

Ile Val Ser Ala Trp Val Ile Ser Leu Ser Leu Leu Leu Ser Leu Asp

35 40 45

Ile Ser Lys Leu Lys Phe Trp Met Leu Leu Pro Val Ile Leu Trp Gln

50 55 60

Thr Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ser His Asp Ala Met His

65 70 75 80

Gly Val Val Phe Pro Gln Asn Thr Lys Ile Asn His Leu Ile Gly Thr

85 90 95

Leu Thr Leu Ser Leu Tyr Gly Leu Leu Pro Tyr Gln Lys Leu Leu Lys

100 105 110

Lys His Trp Leu His His His Asn Pro Ala Ser Ser Ile Asp Pro Asp

115 120 125

Phe His Asn Gly Lys His Gln Ser Phe Phe Ala Trp Tyr Phe His Phe

130 135 140

Met Lys Gly Tyr Trp Ser Trp Gly Gln Ile Ile Ala Leu Thr Ile Ile

145 150 155 160

Tyr Asn Phe Ala Lys Tyr Ile Leu His Ile Pro Ser Asp Asn Leu Thr

165 170 175

Tyr Phe Trp Val Leu Pro Ser Leu Leu Ser Ser Leu Gln Leu Phe Tyr

180 185 190

Phe Gly Thr Phe Leu Pro His Ser Glu Pro Ile Gly Gly Tyr Val Gln

195 200 205

Pro His Cys Ala Gln Thr Ile Ser Arg Pro Ile Trp Trp Ser Phe Ile

210 215 220

Thr Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His

225 230 235 240

Ile Ser Trp Trp Gln Leu Pro Glu Ile Tyr Lys Ala Lys

245 250

<210>7

<211>789

<212>DNA

<213>人工序列

<220>

<221>CDS

<222>(1)..(789)

<223>

<400>7

atg aat ttt tgt gat aaa cca gtt agc tat tat gtt gca ata gag caa 48

Met Asn Phe Cys Asp Lys Pro Val Ser Tyr Tyr Val Ala Ile Glu Gln

1 5 10 15

tta agt gct aaa gaa gat act gtt tgg ggg ctg gtg att gtc ata gta 96

Leu Ser Ala Lys Glu Asp Thr Val Trp Gly Leu Val Ile Val Ile Val

20 25 30

att att agt ctt tgg gta gct agt ttg gct ttt tta cta gct att aat 144

Ile Ile Ser Leu Trp Val Ala Ser Leu Ala Phe Leu Leu Ala Ile Asn

35 40 45

tat gcc aaa att cat aag tgg ttg ata cct att gca ata gtt tgg caa 192

Tyr Ala Lys Ile His Lys Trp Leu Ile Pro Ile Ala Ile Val Trp Gln

50 55 60

atg ttc ctt tat aca ggg cta ttt att act gca cat gat gct atg cat 240

Met Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ala His Asp Ala Met His

65 70 75 80

ggg tca gtt tat cgt aaa aat ccc aaa att aat aat ttt atc ggt tca 288

Gly Ser Val Tyr Arg Lys Asn Pro Lys Ile Asn Asn Phe Ile Gly Ser

85 90 95

cta gct gta gcg ctt tac gct gtg ttt cca tat caa cag atg tta aag 336

Leu Ala Val Ala Leu Tyr Ala Val Phe Pro Tyr Gln Gln Met Leu Lys

100 105 110

aat cat tgc tta cat cat cgt cat cct gct agc gaa gtt gac cca gat 384

Asn His Cys Leu His His Arg His Pro Ala Ser Glu Val Asp Pro Asp

115 120 125

ttt cat gat ggt aag aga aca aac gct att ttc tgg tat ctc cat ttc 432

Phe His Asp Gly Lys Arg Thr Asn Ala Ile Phe Trp Tyr Leu His Phe

130 135 140

atg ata gaa tac tcc agt tgg caa cag tta ata gta cta act atc cta 480

Met Ile Glu Tyr Ser Ser Trp Gln Gln Leu Ile Val Leu Thr Ile Leu

145 150 155 160

ttt aat tta gct aaa tac gtt ttg cac atc cat caa ata aat ctc atc 528

Phe Asn Leu Ala Lys Tyr Val Leu His Ile His Gln Ile Asn Leu Ile

165 170 175

tta ttt tgg agt att cct cca att tta agt tcc att caa ctg ttt tat 576

Leu Phe Trp Ser Ile Pro Pro Ile Leu Ser Ser Ile Gln Leu Phe Tyr

180 185 190

ttc gga aca ttt ttg cct cat cga gaa ccc aag aaa gga tat gtt tat 624

Phe Gly Thr Phe Leu Pro His Arg Glu Pro Lys Lys Gly Tyr Val Tyr

195 200 205

ccc cat tgc agc caa aca ata aaa ttg cca act ttt ttg tca ttt atc 672

Pro His Cys Ser Gln Thr Ile Lys Leu Pro Thr Phe Leu Ser Phe Ile

210 215 220

gct tgc tac cac ttt ggt tat cat gaa gaa cat cat gag tat ccc cat 720

Ala Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His

225 230 235 240

gta cct tgg tgg caa ctt cca tct gta tat aag cag aga gta ttc aac 768

Val Pro Trp Trp Gln Leu Pro Ser Val Tyr Lys Gln Arg Val Phe Asn

245 250 255

aat tca gta acc aat tcg taa 789

Asn Ser Val Thr Asn Ser

260

<210>8

<211>262

<212>PRT

<213>人工序列

<400>8

Met Asn Phe Cys Asp Lys Pro Val Ser Tyr Tyr Val Ala Ile Glu Gln

1 5 10 15

Leu Ser Ala Lys Glu Asp Thr Val Trp Gly Leu Val Ile Val Ile Val

20 25 30

Ile Ile Ser Leu Trp Val Ala Ser Leu Ala Phe Leu Leu Ala Ile Asn

35 40 45

Tyr Ala Lys Ile His Lys Trp Leu Ile Pro Ile Ala Ile Val Trp Gln

50 55 60

Met Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ala His Asp Ala Met His

65 70 75 80

Gly Ser Val Tyr Arg Lys Asn Pro Lys Ile Asn Asn Phe Ile Gly Ser

85 90 95

Leu Ala Val Ala Leu Tyr Ala Val Phe Pro Tyr Gln Gln Met Leu Lys

100 105 110

Asn His Cys Leu His His Arg His Pro Ala Ser Glu Val Asp Pro Asp

115 120 125

Phe His Asp Gly Lys Arg Thr Asn Ala Ile Phe Trp Tyr Leu His Phe

130 135 140

Met Ile Glu Tyr Ser Ser Trp Gln Gln Leu Ile Val Leu Thr Ile Leu

145 150 155 160

Phe Asn Leu Ala Lys Tyr Val Leu His Ile His Gln Ile Asn Leu Ile

165 170 175

Leu Phe Trp Ser Ile Pro Pro Ile Leu Ser Ser Ile Gln Leu Phe Tyr

180 185 190

Phe Gly Thr Phe Leu Pro His Arg Glu Pro Lys Lys Gly Tyr Val Tyr

195 200 205

Pro His Cys Ser Gln Thr Ile Lys Leu Pro Thr Phe Leu Ser Phe Ile

210 215 220

Ala Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His

225 230 235 240

Val Pro Trp Trp Gln Leu Pro Ser Val Tyr Lys Gln Arg Val Phe Asn

245 250 255

Asn Ser Val Thr Asn Ser

260

<210>9

<211>789

<212>DNA

<213>人工序列

<220>

<221>CDS

<222>(1)..(789)

<223>

<400>9

atg aat ttt tgt gat aaa cca gtt agc tat tat gtt gca ata gag caa 48

Met Asn Phe Cys Asp Lys Pro Val Ser Tyr Tyr Val Ala Ile Glu Gln

1 5 10 15

tta agt gct aaa gaa gat act gtt tgg ggg ctg gtg att gtc ata gta 96

Leu Ser Ala Lys Glu Asp Thr Val Trp Gly Leu Val Ile Val Ile Val

20 25 30

att att agt ctt tgg gta gct agt ttg gct ttt tta cta gct att aat 144

Ile Ile Ser Leu Trp Val Ala Ser Leu Ala Phe Leu Leu Ala Ile Asn

35 40 45

tat gcc aaa gtc cca att tgg ttg ata cct att gca ata gtt tgg caa 192

Tyr Ala Lys Val Pro Ile Trp Leu Ile Pro Ile Ala Ile Val Trp Gln

50 55 60

atg ttc ctt tat aca ggg cta ttt att act gca cat gat gct atg cat 240

Met Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ala His Asp Ala Met His

65 70 75 80

ggg tca gtt tat cgt aaa aat ccc aaa att aat aat ttt atc ggt tca 288

Gly Ser Val Tyr Arg Lys Asn Pro Lys Ile Asn Asn Phe Ile Gly Ser

85 90 95

cta gct gta gcg ctt tac gct gtg ttt cca tat caa cag atg tta aag 336

Leu Ala Val Ala Leu Tyr Ala Val Phe Pro Tyr Gln Gln Met Leu Lys

100 105 110

aat cat tgc tta cat cat cgt cat cct gct agc gat tta gac cca gat 384

Asn His Cys Leu His His Arg His Pro Ala Ser Asp Leu Asp Pro Asp

115 120 125

ttt cat gat ggt aag aga aca aac gct att ttc tgg tat ctc cat ttc 432

Phe His Asp Gly Lys Arg Thr Asn Ala Ile Phe Trp Tyr Leu His Phe

130 135 140

atg ata gaa tac tcc agt tgg caa cag tta ata gta cta act atc cta 480

Met Ile Glu Tyr Ser Ser Trp Gln Gln Leu Ile Val Leu Thr Ile Leu

145 150 155 160

ttt aat tta gct aaa tac gtt ttg cac atc cat caa ata aat ctc atc 528

Phe Asn Leu Ala Lys Tyr Val Leu His Ile His Gln Ile Asn Leu Ile

165 170 175

tta ttt tgg agt att cct cca att tta agt tcc att caa ctg ttt tat 576

Leu Phe Trp Ser Ile Pro Pro Ile Leu Ser Ser Ile Gln Leu Phe Tyr

180 185 190

ttc gga aca ttt ttg cct cat cga gaa ccc aag aaa gga tat gtt tat 624

Phe Gly Thr Phe Leu Pro His Arg Glu Pro Lys Lys Gly Tyr Val Tyr

195 200 205

ccc cat tgc agc caa aca ata aaa ttg cca act ttt ttg tca ttt atc 672

Pro His Cys Ser Gln Thr Ile Lys Leu Pro Thr Phe Leu Ser Phe Ile

210 215 220

gct tgc tac cac ttt ggt tat cat gaa gaa cat cat gag tat ccc cat 720

Ala Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His

225 230 235 240

gta cct tgg tgg caa ctt cca tct gta tat aag cag aga gta ttc aac 768

Val Pro Trp Trp Gln Leu Pro Ser Val Tyr Lys Gln Arg Val Phe Asn

245 250 255

aat tca gta acc aat tcg taa 789

Asn Ser Val Thr Asn Ser

260

<210>10

<211>262

<212>PRT

<213>人工序列

<400>10

Met Asn Phe Cys Asp Lys Pro Val Ser Tyr Tyr Val Ala Ile Glu Gln

1 5 10 15

Leu Ser Ala Lys Glu Asp Thr Val Trp Gly Leu Val Ile Val Ile Val

20 25 30

Ile Ile Ser Leu Trp Val Ala Ser Leu Ala Phe Leu Leu Ala Ile Asn

35 40 45

Tyr Ala Lys Val Pro Ile Trp Leu Ile Pro Ile Ala Ile Val Trp Gln

50 55 60

Met Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ala His Asp Ala Met His

65 70 75 80

Gly Ser Val Tyr Arg Lys Asn Pro Lys Ile Asn Asn Phe Ile Gly Ser

85 90 95

Leu Ala Val Ala Leu Tyr Ala Val Phe Pro Tyr Gln Gln Met Leu Lys

100 105 110

Asn His Cys Leu His His Arg His Pro Ala Ser Asp Leu Asp Pro Asp

115 120 125

Phe His Asp Gly Lys Arg Thr Asn Ala Ile Phe Trp Tyr Leu His Phe

130 135 140

Met Ile Glu Tyr Ser Ser Trp Gln Gln Leu Ile Val Leu Thr Ile Leu

145 150 155 160

Phe Asn Leu Ala Lys Tyr Val Leu His Ile His Gln Ile Asn Leu Ile

165 170 175

Leu Phe Trp Ser Ile Pro Pro Ile Leu Ser Ser Ile Gln Leu Phe Tyr

180 185 190

Phe Gly Thr Phe Leu Pro His Arg Glu Pro Lys Lys Gly Tyr Val Tyr

195 200 205

Pro His Cys Ser Gln Thr Ile Lys Leu Pro Thr Phe Leu Ser Phe Ile

210 215 220

Ala Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His

225 230 235 240

Val Pro Trp Trp Gln Leu Pro Ser Val Tyr Lys Gln Arg Val Phe Asn

Asn Ser Val Thr Asn Ser

260

<210>11

<211>762

<212>DNA

<213>人工序列

<220>

<221>CDS

<222>(1)..(762)

<223>

<400>11

atg atc cag tta gaa caa cca ctc agt cat caa gca aaa ctg act cca 48

Met Ile Gln Leu Glu Gln Pro Leu Ser His Gln Ala Lys Leu Thr Pro

1 5 10 15

gta ctg aga agt aaa tct cag ttt aag ggg ctt ttc att gct att gtc 96

Val Leu Arg Ser Lys Ser Gln Phe Lys Gly Leu Phe Ile Ala Ile Val

20 25 30

att gtt agc gca tgg gtc att agc ctg agt tta tta ctt tcc ctt gac 144

Ile Val Ser Ala Trp Val Ile Ser Leu Ser Leu Leu Leu Ser Leu Asp

35 40 45

atc tca aag att cat aag tgg atg tta ttg cct gtt ata cta tgg caa 192

Ile Ser Lys Ile His Lys Trp Met Leu Leu Pro Val Ile Leu Trp Gln

50 55 60

aca ttt tta tat acg gga tta ttt att aca tct cat gat gcc atg cat 240

Thr Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ser His Asp Ala Met His

65 70 75 80

ggc gta gta ttt ccc caa aac acc aag att aat cat ttg att gga aca 288

Gly Val Val Phe Pro Gln Asn Thr Lys Ile Asn His Leu Ile Gly Thr

85 90 95

ttg acc cta tcc ctt tat ggt ctt tta cca tat caa aaa cta ttg aaa 336

Leu Thr Leu Ser Leu Tyr Gly Leu Leu Pro Tyr Gln Lys Leu Leu Lys

100 105 110

aaa cat tgg tta cac cac cac aat cca gca agc tca ata gac ccg gat 384

Lys His Trp Leu His His His Asn Pro Ala Ser Ser Ile Asp Pro Asp

115 120 125

ttt cac aat ggt aaa cac caa agt ttc ttt gct tgg tat ttt cat ttt 432

Phe His Asn Gly Lys His Gln Ser Phe Phe Ala Trp Tyr Phe His Phe

130 135 140

atg aaa ggt tac tgg agt tgg ggg caa ata att gcg ttg act att att 480

Met Lys Gly Tyr Trp Ser Trp Gly Gln Ile Ile Ala Leu Thr Ile Ile

145 150 155 160

tat aac ttt gct aaa tac ata ctc cat atc cca agt gat aat cta act 528

Tyr Asn Phe Ala Lys Tyr Ile Leu His Ile Pro Ser Asp Asn Leu Thr

165 170 175

tac ttt tgg gtg cta ccc tcg ctt tta agt tca tta caa tta ttc tat 576

Tyr Phe Trp Val Leu Pro Ser Leu Leu Ser Ser Leu Gln Leu Phe Tyr

180 185 190

ttt ggt act ttt tta ccc cat agt gaa cca ata ggg ggt tat gtt cag 624

Phe Gly Thr Phe Leu Pro His Ser Glu Pro Ile Gly Gly Tyr Val Gln

195 200 205

cct cat tgt gcc caa aca att agc cgt cct att tgg tgg tca ttt atc 672

Pro His Cys Ala Gln Thr Ile Ser Arg Pro Ile Trp Trp Ser Phe Ile

210 215 220

acg tgc tat cat ttt ggc tac cac gag gaa cat cac gaa tat cct cat 720

Thr Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His

225 230 235 240

att tct tgg tgg cag tta cca gaa att tac aaa gca aaa tag 762

Ile Ser Trp Trp Gln Leu Pro Glu Ile Tyr Lys Ala Lys

245 250

<210>12

<211>253

<212>PRT

<213>人工序列

<400>12

Met Ile Gln Leu Glu Gln Pro Leu Ser His Gln Ala Lys Leu Thr Pro

1 5 10 15

Val Leu Arg Ser Lys Ser Gln Phe Lys Gly Leu Phe Ile Ala Ile Val

20 25 30

Ile Val Ser Ala Trp Val Ile Ser Leu Ser Leu Leu Leu Ser Leu Asp

35 40 45

Ile Ser Lys Ile His Lys Trp Met Leu Leu Pro Val Ile Leu Trp Gln

50 55 60

Thr Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ser His Asp Ala Met His

65 70 75 80

Gly Val Val Phe Pro Gln Asn Thr Lys Ile Asn His Leu Ile Gly Thr

85 90 95

Leu Thr Leu Ser Leu Tyr Gly Leu Leu Pro Tyr Gln Lys Leu Leu Lys

100 105 110

Lys His Trp Leu His His His Asn Pro Ala Ser Ser Ile Asp Pro Asp

115 120 125

Phe His Asn Gly Lys His Gln Ser Phe Phe Ala Trp Tyr Phe His Phe

130 135 140

Met Lys Gly Tyr Trp Ser Trp Gly Gln Ile Ile Ala Leu Thr Ile Ile

145 150 155 160

Tyr Asn Phe Ala Lys Tyr Ile Leu His Ile Pro Ser Asp Asn Leu Thr

165 170 175

Tyr Phe Trp Val Leu Pro Ser Leu Leu Ser Ser Leu Gln Leu Phe Tyr

180 185 190

Phe Gly Thr Phe Leu Pro His Ser Glu Pro Ile Gly Gly Tyr Val Gln

195 200 205

Pro His Cys Ala Gln Thr Ile Ser Arg Pro Ile Trp Trp Ser Phe Ile

210 215 220

Thr Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His

225 230 235 240

Ile Ser Trp Trp Gln Leu Pro Glu Ile Tyr Lys Ala Lys

245 250

<210>13

<211>762

<212>DNA

<213>人工序列

<220>

<221>CDS

<222>(1)..(762)

<223>

<400>13

atg atc cag tta gaa caa cca ctc agt cat caa gca aaa ctg act cca 48

Met Ile Gln Leu Glu Gln Pro Leu Ser His Gln Ala Lys Leu Thr Pro

1 5 10 15

gta ctg aga agt aaa tct cag ttt aag ggg ctt ttc att gct att gtc 96

Val Leu Arg Ser Lys Ser Gln Phe Lys Gly Leu Phe Ile Ala Ile Val

20 25 30

att gtt agc gca tgg gtc att agc ctg agt tta tta ctt tcc ctt gac 144

Ile Val Ser Ala Trp Val Ile Ser Leu Ser Leu Leu Leu Ser Leu Asp

35 40 45

atc tca aag cta aaa ttt tgg atg tta ttg cct gtt ata cta tgg caa 192

Ile Ser Lys Leu Lys phe Trp Met Leu Leu Pro Val Ile Leu Trp Gln

50 55 60

aca ttt tta tat acg gga tta ttt att aca tct cat gat gcc atg cat 240

Thr Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ser His Asp Ala Met His

65 70 75 80

ggc gta gta ttt ccc caa aac acc aag att aat cat ttg att gga aca 288

Gly Val Val Phe Pro Gln Asn Thr Lys Ile Asn His Leu Ile Gly Thr

85 90 95

ttg acc cta tcc ctt tat ggt ctt tta cca tat caa aaa cta ttg aaa 336

Leu Thr Leu Ser Leu Tyr Gly Leu Leu Pro Tyr Gln Lys Leu Leu Lys

100 105 110

aaa cat tgg tta cac cac cac aat cca gca agc gat tta gac ccg gat 384

Lys His Trp Leu His His His Asn Pro Ala Ser Asp Leu Asp Pro Asp

115 120 125

ttt cac aat ggt aaa cac caa agt ttc ttt gct tgg tat ttt cat ttt 432

Phe His Asn Gly Lys His Gln Ser Phe Phe Ala Trp Tyr Phe His Phe

130 135 140

atg aaa ggt tac tgg agt tgg ggg caa ata att gcg ttg act att att 480

Met Lys Gly Tyr Trp Ser Trp Gly Gln Ile Ile Ala Leu Thr Ile Ile

145 150 155 160

tat aac ttt gct aaa tac ata ctc cat atc cca agt gat aat cta act 528

Tyr Asn Phe Ala Lys Tyr Ile Leu His Ile Pro Ser Asp Asn Leu Thr

165 170 175

tac ttt tgg gtg cta ccc tcg ctt tta agt tca tta caa tta ttc tat 576

Tyr Phe Trp Val Leu Pro Ser Leu Leu Ser Ser Leu Gln Leu Phe Tyr

180 185 190

ttt ggt act ttt tta ccc cat agt gaa cca ata ggg ggt tat gtt cag 624

Phe Gly Thr Phe Leu Pro His Ser Glu Pro Ile Gly Gly Tyr Val Gln

195 200 205

cct cat tgt gcc caa aca att agc cgt cct att tgg tgg tca ttt atc 672

Pro His Cys Ala Gln Thr Ile Ser Arg Pro Ile Trp Trp Ser Phe Ile

210 215 220

acg tgc tat cat ttt ggc tac cac gag gaa cat cac gaa tat cct cat 720

Thr Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His

225 230 235 240

att tct tgg tgg cag tta cca gaa att tac aaa gca aaa tag 762

Ile Ser Trp Trp Gln Leu Pro Glu Ile Tyr Lys Ala Lys

245 250

<210>14

<211>253

<212>PRT

<213>人工序列

<400>14

Met Ile Gln Leu Glu Gln Pro Leu Ser His Gln Ala Lys Leu Thr Pro

1 5 10 15

Val Leu Arg Ser Lys Ser Gln Phe Lys Gly Leu Phe Ile Ala Ile Val

20 25 30

Ile Val Ser Ala Trp Val Ile Ser Leu Ser Leu Leu Leu Ser Leu Asp

35 40 45

Ile Ser Lys Leu Lys Phe Trp Met Leu Leu Pro Val Ile Leu Trp Gln

50 55 60

Thr Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ser His Asp Ala Met His

65 70 75 80

Gly Val Val Phe Pro Gln Asn Thr Lys Ile Asn His Leu Ile Gly Thr

85 90 95

Leu Thr Leu Ser Leu Tyr Gly Leu Leu Pro Tyr Gln Lys Leu Leu Lys

100 105 110

Lys His Trp Leu His His His Asn Pro Ala Ser Asp Leu Asp Pro Asp

115 120 125

Phe His Asn Gly Lys His Gln Ser Phe Phe Ala Trp Tyr Phe His Phe

130 135 140

Met Lys Gly Tyr Trp Ser Trp Gly Gln Ile Ile Ala Leu Thr Ile Ile

145 150 155 160

Tyr Asn Phe Ala Lys Tyr Ile Leu His Ile Pro Ser Asp Asn Leu Thr

165 170 175

Tyr Phe Trp Val Leu Pro Ser Leu Leu Ser Ser Leu Gln Leu Phe Tyr

180 185 190

Phe Gly Thr Phe Leu Pro His Ser Glu Pro Ile Gly Gly Tyr Val Gln

195 200 205

Pro His Cys Ala Gln Thr Ile Ser Arg Pro Ile Trp Trp Ser Phe Ile

210 215 220

Thr Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His

225 230 235 240

Ile Ser Trp Trp Gln Leu Pro Glu Ile Tyr Lys Ala Lys

245 250

<210>15

<211>1608

<212>DNA

<213>雨生红球藻(Haematococcus pluvialis)

<220>

<221>CDS

<222>(3)..(971)

<223>

<400>15

ct aca ttt cac aag ccc gtg agc ggt gca agc gct ctg ccc cac atc 47

Thr Phe His Lys Pro Val Ser Gly Ala Ser Ala Leu Pro His Ile

1 5 10 15

ggc cca cct cct cat ctc cat cgg tca ttt gct gct acc acg atg ctg 95

Gly Pro Pro Pro His Leu His Arg Ser Phe Ala Ala Thr Thr Met Leu

20 25 30

tcg aag ctg cag tca atc agc gtc aag gcc cgc cgc gtt gaa cta gcc 143

Ser Lys Leu Gln Ser Ile Ser Val Lys Ala Arg Arg Val Glu Leu Ala

35 40 45

cgc gac atc acg cgg ccc aaa gtc tgc ctg cat gct cag cgg tgc tcg 191

Arg Asp Ile Thr Arg Pro Lys Val Cys Leu His Ala Gln Arg Cys Ser

50 55 60

tta gtt cgg ctg cga gtg gca gca cca cag aca gag gag gcg ctg gga 239

Leu Val Arg Leu Arg Val Ala Ala Pro Gln Thr Glu Glu Ala Leu Gly

65 70 75

acc gtg cag gct gcc ggc gcg ggc gat gag cac agc gcc gat gta gca 287

Thr Val Gln Ala Ala Gly Ala Gly Asp Glu His Ser Ala Asp Val Ala

80 85 90 95

ctc cag cag ctt gac cgg gct atc gca gag cgt cgt gcc cgg cgc aaa 335

Leu Gln Gln Leu Asp Arg Ala Ile Ala Glu Arg Arg Ala Arg Arg Lys

100 105 110

cgg gag cag ctg tca tac cag gct gcc gcc att gca gca tca att ggc 383

Arg Glu Gln Leu Ser Tyr Gln Ala Ala Ala Ile Ala Ala Ser Ile Gly

115 120 125

gtg tca ggc att gcc atc ttc gcc acc tac ctg aga ttt gcc atg cac 431

Val Ser Gly Ile Ala Ile Phe Ala Thr Tyr Leu Arg Phe Ala Met His

130 135 140

atg acc gtg ggc ggc gca gtg cca tgg ggt gaa gtg gct ggc act ctc 479

Met Thr Val Gly Gly Ala Val Pro Trp Gly Glu Val Ala Gly Thr Leu

145 150 155

ctc ttg gtg gtt ggt ggc gcg ctc ggc atg gag atg tat gcc cgc tat 527

Leu Leu Val Val Gly Gly Ala Leu Gly Met Glu Met Tyr Ala Arg Tyr

160 165 170 175

gca cac aaa gcc atc tgg cat gag tcg cct ctg ggc tgg ctg ctg cac 575

Ala His Lys Ala Ile Trp His Glu Ser Pro Leu Gly Trp Leu Leu His

180 185 190

aag agc cac cac aca cct cgc act gga ccc ttt gaa gcc aac gac ttg 623

Lys Ser His His Thr Pro Arg Thr Gly Pro Phe Glu Ala Asn Asp Leu

195 200 205

ttt gca atc atc aat gga ctg ccc gcc atg ctc ctg tgt acc ttt ggc 671

Phe Ala Ile Ile Asn Gly Leu Pro Ala Met Leu Leu Cys Thr Phe Gly

210 215 220

ttc tgg ctg ccc aac gtc ctg ggg gcg gcc tgc ttt gga gcg ggg ctg 719

Phe Trp Leu Pro Asn Val Leu Gly Ala Ala Cys Phe Gly Ala Gly Leu

225 230 235

ggc atc acg cta tac ggc atg gca tat atg ttt gta cac gat ggc ctg 767

Gly Ile Thr Leu Tyr Gly Met Ala Tyr Met Phe Val His Asp Gly Leu

240 245 250 255

gtg cac agg cgc ttt ccc acc ggg ccc atc gct ggc ctg ccc tac atg 815

Val His Arg Arg Phe Pro Thr Gly Pro Ile Ala Gly Leu Pro Tyr Met

260 265 270

aag cgc ctg aca gtg gcc cac cag cta cac cac agc ggc aag tac ggt 863

Lys Arg Leu Thr Val Ala His Gln Leu His His Ser Gly Lys Tyr Gly

275 280 285

ggc gcg ccc tgg ggt atg ttc ttg ggt cca cag gag ctg cag cac att 911

Gly Ala Pro Trp Gly Met Phe Leu Gly Pro Gln Glu Leu Gln His Ile

290 295 300

cca ggt gcg gcg gag gag gtg gag cga ctg gtc ctg gaa ctg gac tgg 959

Pro Gly Ala Ala Glu Glu Val Glu Arg Leu Val Leu Glu Leu Asp Trp

305 310 315

tcc aag cgg tag ggtgcggaac caggcacgct ggtttcacac ctcatgcctg 1011

Ser Lys Arg

320

tgataaggtg tggctagagc gatgcgtgtg agacgggtat gtcacggtcg actggtctga 1071

tggccaatgg catcggccat gtctggtcat cacgggctgg ttgcctgggt gaaggtgatg 1131

cacatcatca tgtgcggttg gaggggctgg cacagtgtgg gctgaactgg agcagttgtc 1191

caggctggcg ttgaatcagt gagggtttgt gattggcggt tgtgaagcaa tgactccgcc 1251

catattctat ttgtgggagc tgagatgatg gcatgcttgg gatgtgcatg gatcatggta 1311

gtgcagcaaa ctatattcac ctagggctgt tggtaggatc aggtgaggcc ttgcacattg 1371

catgatgtac tcgtcatggt gtgttggtga gaggatggat gtggatggat gtgtattctc 1431

agacgtagac cttgactgga ggcttgatcg agagagtggg ccgtattctt tgagagggga 1491

ggctcgtgcc agaaatggtg agtggatgac tgtgacgctg tacattgcag gcaggtgaga 1551

tgcactgtct cgattgtaaa atacattcag atgcaaaaaa aaaaaaaaaa aaaaaaa 1608

<210>16

<211>322

<212>PRT

<213>雨生红球藻

<400>16

Thr Phe His Lys Pro Val Ser Gly Ala Ser Ala Leu Pro His Ile Gly

1 5 10 15

Pro Pro Pro His Leu His Arg Ser Phe Ala Ala Thr Thr Met Leu Ser

20 25 30

Lys Leu Gln Ser Ile Ser Val Lys Ala Arg Arg Val Glu Leu Ala Arg

35 40 45

Asp Ile Thr Arg Pro Lys Val Cys Leu His Ala Gln Arg Cys Ser Leu

50 55 60

Val Arg Leu Arg Val Ala Ala Pro Gln Thr Glu Glu Ala Leu Gly Thr

65 70 75 80

Val Gln Ala Ala Gly Ala Gly Asp Glu His Ser Ala Asp Val Ala Leu

85 90 95

Gln Gln Leu Asp Arg Ala Ile Ala Glu Arg Arg Ala Arg Arg Lys Arg

100 105 110

Glu Gln Leu Ser Tyr Gln Ala Ala Ala Ile Ala Ala Ser Ile Gly Val

115 120 125

Ser Gly Ile Ala Ile Phe Ala Thr Tyr Leu Arg Phe Ala Met His Met

130 135 140

Thr Val Gly Gly Ala Val Pro Trp Gly Glu Val Ala Gly Thr Leu Leu

145 150 155 160

Leu Val Val Gly Gly Ala Leu Gly Met Glu Met Tyr Ala Arg Tyr Ala

165 170 175

His Lys Ala Ile Trp His Glu Ser Pro Leu Gly Trp Leu Leu His Lys

180 185 190

Ser His His Thr Pro Arg Thr Gly Pro Phe Glu Ala Asn Asp Leu Phe

195 200 205

Ala Ile Ile Asn Gly Leu Pro Ala Met Leu Leu Cys Thr Phe Gly Phe

210 215 220

Trp Leu Pro Asn Val Leu Gly Ala Ala Cys Phe Gly Ala Gly Leu Gly

225 230 235 240

Ile Thr Leu Tyr Gly Met Ala Tyr Met Phe Val His Asp Gly Leu Val

245 250 255

His Arg Arg Phe Pro Thr Gly Pro Ile Ala Gly Leu Pro Tyr Met Lys

260 265 270

Arg Leu Thr Val Ala His Gln Leu His His Ser Gly Lys Tyr Gly Gly

275 280 285

Ala Pro Trp Gly Met Phe Leu Gly Pro Gln Glu Leu Gln His Ile Pro

290 295 300

Gly Ala Ala Glu Glu Val Glu Arg Leu Val Leu Glu Leu Asp Trp Ser

305 310 315 320

Lys Arg

<210>17

<211>1650

<212>DNA

<213>番茄(Lycopersicon esculentum)

<220>

<221>CDS

<222>(112)..(1614)

<223>

<400>17

ggcacgagga aacttttctc tcttcactag ctgtttacat gcttgaaatt tcaagatttt 60

aggaccccat ttgaagtttt cttgaaacaa atattaccct gttggaaaaa g atg gat 117

Met Asp

1

act ttg ttg aaa acc cca aat aac ctt gaa ttt ctg aac cca cat cat 165

Thr Leu Leu Lys Thr Pro Asn Asn Leu Glu Phe Leu Asn Pro His His

5 10 15

ggt ttt gct gtt aaa gct agt acc ttt aga tct gag aag cat cat aat 213

Gly Phe Ala Val Lys Ala Ser Thr Phe Arg Ser Glu Lys His His Asn

20 25 30

ttt ggt tct agg aag ttt tgt gaa act ttg ggt aga agt gtt tgt gtt 261

Phe Gly Ser Arg Lys Phe Cys Glu Thr Leu Gly Arg Ser Val Cys Val

35 40 45 50

aag ggt agt agt agt gct ctt tta gag ctt gta cct gag acc aaa aag 309

Lys Gly Ser Ser Ser Ala Leu Leu Glu Leu Val Pro Glu Thr Lys Lys

55 60 65

gag aat ctt gat ttt gag ctt cct atg tat gac cct tca aaa ggg gtt 357

Glu Asn Leu Asp Phe Glu Leu Pro Met Tyr Asp Pro Ser Lys Gly Val

70 75 80

gtt gtg gat ctt gct gtg gtt ggt ggt ggc cct gca gga ctt gct gtt 405

Val Val Asp Leu Ala Val Val Gly Gly Gly Pro Ala Gly Leu Ala Val

85 90 95

gca cag caa gtt tct gaa gca gga ctc tct gtt tgt tca att gat ccg 453

Ala Gln Gln Val Ser Glu Ala Gly Leu Ser Val Cys Ser Ile Asp Pro

100 105 110

aat cct aaa ttg ata tgg cct aat aac tat ggt gtt tgg gtg gat gaa 501

Asn Pro Lys Leu Ile Trp Pro Asn Asn Tyr Gly Val Trp Val Asp Glu

115 120 125 130

ttt gag gct atg gac ttg tta gat tgt cta gat gct acc tgg tct ggt 549

Phe Glu Ala Met Asp Leu Leu Asp Cys Leu Asp Ala Thr Trp Ser Gly

135 140 145

gca gca gtg tac att gat gat aat acg gct aaa gat ctt cat aga cct 597

Ala Ala Val Tyr Ile Asp Asp Asn Thr Ala Lys Asp Leu His Arg Pro

150 155 160

tat gga agg gtt aac cgg aaa cag ctg aaa tcg aaa atg atg cag aaa 645

Tyr Gly Arg Val Asn Arg Lys Gln Leu Lys Ser Lys Met Met Gln Lys

165 170 175

tgt ata atg aat ggt gtt aaa ttc cac caa gcc aaa gtt ata aag gtg 693

Cys Ile Met Asn Gly Val Lys Phe His Gln Ala Lys Val Ile Lys Val

180 185 190

att cat gag gaa tcg aaa tcc atg ttg ata tgc aat gat ggt att act 741

Ile His Glu Glu Ser Lys Ser Met Leu Ile Cys Asn Asp Gly Ile Thr

195 200 205 210

att cag gca acg gtg gtg ctc gat gca act ggc ttc tct aga tct ctt 789

Ile Gln Ala Thr Val Val Leu Asp Ala Thr Gly Phe Ser Arg Ser Leu

215 220 225

gtt cag tat gat aag cct tat aac ccc ggg tat caa gtt gct tat ggc 837

Val Gln Tyr Asp Lys Pro Tyr Asn Pro Gly Tyr Gln Val Ala Tyr Gly

230 235 240

att ttg gct gaa gtg gaa gag cac ccc ttt gat gta aac aag atg gtt 885

Ile Leu Ala Glu Val Glu Glu His Pro Phe Asp Val Asn Lys Met Val

245 250 255

ttc atg gat tgg cga gat tct cat ttg aag aac aat act gat ctc aag 933

Phe Met Asp Trp Arg Asp Ser His Leu Lys Asn Asn Thr Asp Leu Lys

260 265 270

gag aga aat agt aga ata cca act ttt ctt tat gca atg cca ttt tca 981

Glu Arg Asn Ser Arg Ile Pro Thr Phe Leu Tyr Ala Met Pro Phe Ser

275 280 285 290

tcc aac agg ata ttt ctt gaa gaa aca tca ctc gta gct cgt cct ggc 1029

Ser Asn Arg Ile Phe Leu Glu Glu Thr Ser Leu Val Ala Arg Pro Gly

295 300 305

ttg cgt ata gat gat att caa gaa cga atg gtg gct cgt tta aac cat 1077

Leu Arg Ile Asp Asp Ile Gln Glu Arg Met Val Ala Arg Leu Asn His

310 315 320

ttg ggg ata aaa gtg aag agc att gaa gaa gat gaa cat tgt cta ata 1125

Leu Gly Ile Lys Val Lys Ser Ile Glu Glu Asp Glu His Cys Leu Ile

325 330 335

cca atg ggt ggt cca ctt cca gta tta cct cag aga gtc gtt gga atc 1173

Pro Met Gly Gly Pro Leu Pro Val Leu Pro Gln Arg Val Val Gly Ile

340 345 350

ggt ggt aca gct ggc atg gtt cat cca tcc acc ggt tat atg gtg gca 1221

Gly Gly Thr Ala Gly Met Val His Pro Ser Thr Gly Tyr Met Val Ala

355 360 365 370

agg aca cta gct gcg gct cct gtt gtt gcc aat gcc ata att caa tac 1269

Arg Thr Leu Ala Ala Ala Pro Val Val Ala Asn Ala Ile Ile Gln Tyr

375 380 385

ctc ggt tct gaa aga agt cat tcg ggt aat gaa tta tcc aca gct gtt 1317

Leu Gly Ser Glu Arg Ser His Ser Gly Asn Glu Leu Ser Thr Ala Val

390 395 400

tgg aaa gat ttg tgg cct ata gag agg aga cgt caa aga gag ttc ttc 1365

Trp Lys Asp Leu Trp Pro Ile Glu Arg Arg Arg Gln Arg Glu Phe Phe

405 410 415

tgc ttc ggt atg gat att ctt ctg aag ctt gat tta cct gct aca aga 1413

Cys Phe Gly Met Asp Ile Leu Leu Lys Leu Asp Leu Pro Ala Thr Arg

420 425 430

agg ttc ttt gat gca ttc ttt gac tta gaa cct cgt tat tgg cat ggc 1461

Arg Phe Phe Asp Ala Phe Phe Asp Leu Glu Pro Arg Tyr Trp His Gly

435 440 445 450

ttc tta tcg tct cga ttg ttt cta cct gaa ctc ata gtt ttt ggg ctg 1509

Phe Leu Ser Ser Arg Leu Phe Leu Pro Glu Leu Ile Val Phe Gly Leu

455 460 465

tct cta ttc tct cat gct tca aat act tct aga ttt gag ata atg aca 1557

Ser Leu Phe Ser His Ala Ser Asn Thr Ser Arg Phe Glu Ile Met Thr

470 475 480

aag gga act gtt cca tta gta aat atg atc aac aat ttg tta cag gat 1605

Lys Gly Thr Val Pro Leu Val Asn Met Ile Asn Asn Leu Leu Gln Asp

485 490 495

aaa gaa tga atccgagtaa ttcggaatct tgtccaatct cgtgcc 1650

Lys Glu

500

<210>18

<211>500

<212>PRT

<213>番茄

<400>18

Met Asp Thr Leu Leu Lys Thr Pro Asn Asn Leu Glu Phe Leu Asn Pro

1 5 10 15

His His Gly Phe Ala Val Lys Ala Ser Thr Phe Arg Ser Glu Lys His

20 25 30

His Asn Phe Gly Ser Arg Lys Phe Cys Glu Thr Leu Gly Arg Ser Val

35 40 45

Cys Val Lys Gly Ser Ser Ser Ala Leu Leu Glu Leu Val Pro Glu Thr

50 55 60

Lys Lys Glu Asn Leu Asp Phe Glu Leu Pro Met Tyr Asp Pro Ser Lys

65 70 75 80

Gly Val Val Val Asp Leu Ala Val Val Gly Gly Gly Pro Ala Gly Leu

85 90 95

Ala Val Ala Gln Gln Val Ser Glu Ala Gly Leu Ser Val Cys Ser Ile

100 105 110

Asp Pro Asn Pro Lys Leu Ile Trp Pro Asn Asn Tyr Gly Val Trp Val

115 120 125

Asp Glu Phe Glu Ala Met Asp Leu Leu Asp Cys Leu Asp Ala Thr Trp

130 135 140

Ser Gly Ala Ala Val Tyr Ile Asp Asp Asn Thr Ala Lys Asp Leu His

145 150 155 160

Arg Pro Tyr Gly Arg Val Asn Arg Lys Gln Leu Lys Ser Lys Met Met

165 170 175

Gln Lys Cys Ile Met Asn Gly Val Lys Phe His Gln Ala Lys Val Ile

180 185 190

Lys Val Ile His Glu Glu Ser Lys Ser Met Leu Ile Cys Asn Asp Gly

195 200 205

Ile Thr Ile Gln Ala Thr Val Val Leu Asp Ala Thr Gly Phe Ser Arg

210 215 220

Ser Leu Val Gln Tyr Asp Lys Pro Tyr Asn Pro Gly Tyr Gln Val Ala

225 230 235 240

Tyr Gly Ile Leu Ala Glu Val Glu Glu His Pro Phe Asp Val Asn Lys

245 250 255

Met Val Phe Met Asp Trp Arg Asp Ser His Leu Lys Asn Asn Thr Asp

260 265 270

Leu Lys Glu Arg Asn Ser Arg Ile Pro Thr Phe Leu Tyr Ala Met Pro

275 280 285

Phe Ser Ser Asn Arg Ile Phe Leu Glu Glu Thr Ser Leu Val Ala Arg

290 295 300

Pro Gly Leu Arg Ile Asp Asp Ile Gln Glu Arg Met Val Ala Arg Leu

305 310 315 320

Asn His Leu Gly Ile Lys Val Lys Ser Ile Glu Glu Asp Glu His Cys

325 330 335

Leu Ile Pro Met Gly Gly Pro Leu Pro Val Leu Pro Gln Arg Val Val

340 345 350

Gly Ile Gly Gly Thr Ala Gly Met Val His Pro Ser Thr Gly Tyr Met

355 360 365

Val Ala Arg Thr Leu Ala Ala Ala Pro Val Val Ala Asn Ala Ile Ile

370 375 380

Gln Tyr Leu Gly Ser Glu Arg Ser His Ser Gly Asn Glu Leu Ser Thr

385 390 395 400

Ala Val Trp Lys Asp Leu Trp Pro Ile Glu Arg Arg Arg Gln Arg Glu

405 410 415

Phe Phe Cys Phe Gly Met Asp Ile Leu Leu Lys Leu Asp Leu Pro Ala

420 425 430

Thr Arg Arg Phe Phe Asp Ala Phe Phe Asp Leu Glu Pro Arg Tyr Trp

435 440 445

His Gly Phe Leu Ser Ser Arg Leu Phe Leu Pro Glu Leu Ile Val Phe

450 455 460

Gly Leu Ser Leu Phe Ser His Ala Ser Asn Thr Ser Arg Phe Glu Ile

465 470 475 480

Met Thr Lys Gly Thr Val Pro Leu Val Asn Met Ile Asn Asn Leu Leu

485 490 495

Gln Asp Lys Glu

500

<210>19

<211>33

<212>DNA

<213>人工序列

<220>

<221>primer_bind

<222>(1)..(33)

<223>

<400>19

gcatgctcta gaccttataa agatattttg tga 33

<210>20

<211>33

<212>DNA

<213>人工序列

<220>

<221>primer_bind

<222>(1)..(33)

<223>

<400>20

gcatgcatct agaaatggtt cagtgtcaac cat 33

<210>21

<211>805

<212>DNA

<213>念珠藻PCC7120

<220>

<221>variation

<222>(1)..(805)

<223>

<400>21

gcatgcatct agaaatggtt cagtgtcaac catcatctct gcattcagaa aaactggtgt 60

tattgtcatc gacaatcaga gatgataaaa atattaataa gggtatattt attgcctgct 120

ttatcttatt tttatgggca attagtttaa tcttattact ctcaatagat acatccataa 180

ttcataagag cttattaggt atagccatgc tttggcagac cttcttatat acaggtttat 240

ttattactgc tcatgatgcc atgcacggcg tagtttatcc caaaaatccc agaataaata 300

attttatagg taagctcact ctaatcttgt atggactact cccttataaa gatttattga 360

aaaaacattg gttacaccac ggacatcctg gtactgattt agaccctgat tattacaatg 420

gtcatcccca aaacttcttt ctttggtatc tacattttat gaagtcttat tggcgatgga 480

cgcaaatttt cggattagtg atgatttttc atggacttaa aaatctggtg catataccag 540

aaaataattt aattatattt tggatgatac cttctatttt aagttcagta caactatttt 600

attttggtac atttttgcct cataaaaagc tagaaggtgg ttatactaac ccccattgtg 660

cgcgcagtat cccattacct cttttttggt cttttgttac ttgttatcac ttcggctacc 720

acaaggaaca tcacgaatac cctcaacttc cttggtggaa attacctgaa gctcacaaaa 780

tatctttata aggtctagag catgc 805

<210>22

<211>24

<212>DNA

<213>人工序列

<220>

<221>primer_bind

<222>(1)..(24)

<223>

<400>22

aggtaccgca cggtctgcca atcc 24

<210>23

<211>26

<212>DNA

<213>人工序列

<220>

<221>primer_bind

<222>(1)..(26)

<223>

<400>23

aagcttgacc tgattatcag cacggt 26

<210>24

<211>4624

<212>DNA

<213>噬夏孢欧文氏菌(Erwinia uredovora)

<220>

<221>CDS

<222>(128)..(1267)

<223>

<220>

<221>CDS

<222>(1288)..(2766)

<223>

<220>

<221>CDS

<222>(2802)..(3689)

<223>

<220>

<221>iDNA

<222>(3631)..(4158)

<223>

<400>24

gtcgactttc agcagcgcat ggcgaaaatc cagacagccc ttcgtttggc agggggcacc 60

atggccgctg ccgatatcat tgagcaggtt atgtgcaccg gtcagcctgt cttaagtggg 120

agcggct atg caa ccg cat tat gat ctg att ctc gtg ggg gct gga ctc 169

Met Gln Pro His Tyr Asp Leu Ile Leu Val Gly Ala Gly Leu

1 5 10

gcg aat ggc ctt atc gcc ctg cgt ctt cag cag cag caa cct gat atg 217

Ala Asn Gly Leu Ile Ala Leu Arg Leu Gln Gln Gln Gln Pro Asp Met

15 20 25 30

cgt att ttg ctt atc gac gcc gca ccc cag gcg ggc ggg aat cat acg 265

Arg Ile Leu Leu Ile Asp Ala Ala Pro Gln Ala Gly Gly Asn His Thr

35 40 45

tgg tca ttt cac cac gat gat ttg act gag agc caa cat cgt tgg ata 313

Trp Ser Phe His His Asp Asp Leu Thr Glu Ser Gln His Arg Trp Ile

50 55 60

gct ccg ctg gtg gtt cat cac tgg ccc gac tat cag gta cgc ttt ccc 361

Ala Pro Leu Val Val His His Trp Pro Asp Tyr Gln Val Arg Phe Pro

65 70 75

aca cgc cgt cgt aag ctg aac agc ggc tac ttt tgt att act tct cag 409

Thr Arg Arg Arg Lys Leu Asn Ser Gly Tyr Phe Cys Ile Thr Ser Gln

80 85 90

cgt ttc gct gag gtt tta cag cga cag ttt ggc ccg cac ttg tgg atg 457

Arg Phe Ala Glu Val Leu Gln Arg Gln Phe Gly Pro His Leu Trp Met

95 100 105 110

gat acc gcg gtc gca gag gtt aat gcg gaa tct gtt cgg ttg aaa aag 505

Asp Thr Ala Val Ala Glu Val Asn Ala Glu Ser Val Arg Leu Lys Lys

115 120 125

ggt cag gtt atc ggt gcc cgc gcg gtg att gac ggg cgg ggt tat gcg 553

Gly Gln Val Ile Gly Ala Arg Ala Val Ile Asp Gly Arg Gly Tyr Ala

130 135 140

gca aat tca gca ctg agc gtg ggc ttc cag gcg ttt att ggc cag gaa 601

Ala Asn Ser Ala Leu Ser Val Gly Phe Gln Ala Phe Ile Gly Gln Glu

145 150 155

tgg cga ttg agc cac ccg cat ggt tta tcg tct ccc att atc atg gat 649

Trp Arg Leu Ser His Pro His Gly Leu Ser Ser Pro Ile Ile Met Asp

160 165 170

gcc acg gtc gat cag caa aat ggt tat cgc ttc gtg tac agc ctg ccg 697

Ala Thr Val Asp Gln Gln Asn Gly Tyr Arg Phe Val Tyr Ser Leu Pro

175 180 185 190

ctc tcg ccg acc aga ttg tta att gaa gac acg cac tat att gat aat 745

Leu Ser Pro Thr Arg Leu Leu Ile Glu Asp Thr His Tyr Ile Asp Asn

195 200 205

gcg aca tta gat cct gaa tgc gcg cgg caa aat att tgc gac tat gcc 793

Ala Thr Leu Asp Pro Glu Cys Ala Arg Gln Asn Ile Cys Asp Tyr Ala

210 215 220

gcg caa cag ggt tgg cag ctt cag aca ctg ctg cga gaa gaa cag ggc 841

Ala Gln Gln Gly Trp Gln Leu Gln Thr Leu Leu Arg Glu Glu Gln Gly

225 230 235

gcc tta ccc att act ctg tcg ggc aat gcc gac gca ttc tgg cag cag 889

Ala Leu Pro Ile Thr Leu Ser Gly Asn Ala Asp Ala Phe Trp Gln Gln

240 245 250

cgc ccc ctg gcc tgt agt gga tta cgt gcc ggt ctg ttc cat cct acc 937

Arg Pro Leu Ala Cys Ser Gly Leu Arg Ala Gly Leu Phe His Pro Thr

255 260 265 270

acc ggc tat tca ctg ccg ctg gcg gtt gcc gtg gcc gac cgc ctg agt 985

Thr Gly Tyr Ser Leu Pro Leu Ala Val Ala Val Ala Asp Arg Leu Ser

275 280 285

gca ctt gat gtc ttt acg tcg gcc tca att cac cat gcc att acg cat 1033

Ala Leu Asp Val Phe Thr Ser Ala Ser Ile His His Ala Ile Thr His

290 295 300

ttt gcc cgc gag cgc tgg cag cag cag ggc ttt ttc cgc atg ctg aat 1081

Phe Ala Arg Glu Arg Trp Gln Gln Gln Gly Phe Phe Arg Met Leu Asn

305 310 315

cgc atg ctg ttt tta gcc gga ccc gcc gat tca cgc tgg cgg gtt atg 1129

Arg Met Leu Phe Leu Ala Gly Pro Ala Asp Ser Arg Trp Arg Val Met

320 325 330

cag cgt ttt tat ggt tta cct gaa gat tta att gcc cgt ttt tat gcg 1177

Gln Arg Phe Tyr Gly Leu Pro Glu Asp Leu Ile Ala Arg Phe Tyr Ala

335 340 345 350

gga aaa ctc acg ctg acc gat cgg cta cgt att ctg agc ggc aag ccg 1225

Gly Lys Leu Thr Leu Thr Asp Arg Leu Arg Ile Leu Ser Gly Lys Pro

355 360 365

cct gtt ccg gta tta gca gca ttg caa gcc att atg acg act 1267

Pro Val Pro Val Leu Ala Ala Leu Gln Ala Ile Met Thr Thr

370 375 380

catcgttaaa gagcgactac atg aaa cca act acg gta att ggt gca ggc ttc 1320

Met Lys Pro Thr Thr Val Ile Gly Ala Gly Phe

385 390

ggt ggc ctg gca ctg gca att cgt cta caa gct gcg ggg atc ccc gtc 1368

Gly Gly Leu Ala Leu Ala Ile Arg Leu Gln Ala Ala Gly Ile Pro Val

395 400 405

tta ctg ctt gaa caa cgt gat aaa ccc ggc ggt cgg gct tat gtc tac 1416

Leu Leu Leu Glu Gln Arg Asp Lys Pro Gly Gly Arg Ala Tyr Val Tyr

410 415 420

gag gat cag ggg ttt acc ttt gat gca ggc ccg acg gtt atc acc gat 1464

Glu Asp Gln Gly Phe Thr Phe Asp Ala Gly Pro Thr Val Ile Thr Asp

425 430 435

ccc agt gcc att gaa gaa ctg ttt gca ctg gca gga aaa cag tta aaa 1512

Pro Ser Ala Ile Glu Glu Leu Phe Ala Leu Ala Gly Lys Gln Leu Lys

440 445 450 455

gag tat gtc gaa ctg ctg ccg gtt acg ccg ttt tac cgc ctg tgt tgg 1560

Glu Tyr Val Glu Leu Leu Pro Val Thr Pro Phe Tyr Arg Leu Cys Trp

460 465 470

gag tca ggg aag gtc ttt aat tac gat aac gat caa acc cgg ctc gaa 1608

Glu Ser Gly Lys Val Phe Asn Tyr Asp Asn Asp Gln Thr Arg Leu Glu

475 480 485

gcg cag att cag cag ttt aat ccc cgc gat gtc gaa ggt tat cgt cag 1656

Ala Gln Ile Gln Gln Phe Asn Pro Arg Asp Val Glu Gly Tyr Arg Gln

490 495 500

ttt ctg gac tat tca cgc gcg gtg ttt aaa gaa ggc tat cta aag ctc 1704

Phe Leu Asp Tyr Ser Arg Ala Val Phe Lys Glu Gly Tyr Leu Lys Leu

505 510 515

ggt act gtc cct ttt tta tcg ttc aga gac atg ctt cgc gcc gca cct 1752

Gly Thr Val Pro Phe Leu Ser Phe Arg Asp Met Leu Arg Ala Ala Pro

520 525 530 535

caa ctg gcg aaa ctg cag gca tgg aga agc gtt tac agt aag gtt gcc 1800

Gln Leu Ala Lys Leu Gln Ala Trp Arg Ser Val Tyr Ser Lys Val Ala

540 545 550

agt tac atc gaa gat gaa cat ctg cgc cag gcg ttt tct ttc cac tcg 1848

Ser Tyr Ile Glu Asp Glu His Leu Arg Gln Ala Phe Ser Phe His Ser

555 560 565

ctg ttg gtg ggc ggc aat ccc ttc gcc acc tca tcc att tat acg ttg 1896

Leu Leu Val Gly Gly Asn Pro Phe Ala Thr Ser Ser Ile Tyr Thr Leu

570 575 580

ata cac gcg ctg gag cgt gag tgg ggc gtc tgg ttt ccg cgt ggc ggc 1944

Ile His Ala Leu Glu Arg Glu Trp Gly Val Trp Phe Pro Arg Gly Gly

585 590 595

acc ggc gca tta gtt cag ggg atg ata aag ctg ttt cag gat ctg ggt 1992

Thr Gly Ala Leu Val Gln Gly Met Ile Lys Leu Phe Gln Asp Leu Gly

600 605 610 615

ggc gaa gtc gtg tta aac gcc aga gtc agc cat atg gaa acg aca gga 2040

Gly Glu Val Val Leu Asn Ala Arg Val Ser His Met Glu Thr Thr Gly

620 625 630

aac aag att gaa gcc gtg cat tta gag gac ggt cge agg ttc ctg acg 2088

Asn Lys Ile Glu Ala Val His Leu Glu Asp Gly Arg Arg Phe Leu Thr

635 640 645

caa gcc gtc gcg tca aat gca gat gtg gtt cat acc tat cgc gac ctg 2136

Gln Ala Val Ala Ser Asn Ala Asp Val Val His Thr Tyr Arg Asp Leu

650 655 660

tta agc cag cac cct gcc gcg gtt aag cag tcc aac aaa ctg cag act 2184

Leu Ser Gln His Pro Ala Ala Val Lys Gln Ser Asn Lys Leu Gln Thr

665 670 675

aag cgc atg agt aac tct ctg ttt gtg ctc tat ttt ggt ttg aat cac 2232

Lys Arg Met Ser Asn Ser Leu Phe Val Leu Tyr Phe Gly Leu Asn His

680 685 690 695

cat cat gat cag ctc gcg cat cac acg gtt tgt ttc ggc ccg cgt tac 2280

His His Asp Gln Leu Ala His His Thr Val Cys Phe Gly Pro Arg Tyr

700 705 710

cgc gag ctg att gac gaa att ttt aat cat gat ggc ctc gca gag gac 2328

Arg Glu Leu Ile Asp Glu Ile Phe Asn His Asp Gly Leu Ala Glu Asp

715 720 725

ttc tca ctt tat ctg cac gcg ccc tgt gtc acg gat tcg tca ctg gcg 2376

Phe Ser Leu Tyr Leu His Ala Pro Cys Val Thr Asp Ser Ser Leu Ala

730 735 740

cct gaa ggt tgc ggc agt tac tat gtg ttg gcg ccg gtg ccg cat tta 2424

Pro Glu Gly Cys Gly Ser Tyr Tyr Val Leu Ala Pro Val Pro His Leu

745 750 755

ggc acc gcg aac ctc gac tgg acg gtt gag ggg cca aaa cta cgc gac 2472

Gly Thr Ala Asn Leu Asp Trp Thr Val Glu Gly Pro Lys Leu Arg Asp

760 765 770 775

cgt att ttt gcg tac ctt gag cag cat tac atg cct ggc tta cgg agt 2520

Arg Ile Phe Ala Tyr Leu Glu Gln His Tyr Met Pro Gly Leu Arg Ser

780 785 790

cag ctg gtc acg cac cgg atg ttt acg ccg ttt gat ttt cgc gac cag 2568

Gln Leu Val Thr His Arg Met Phe Thr Pro Phe Asp Phe Arg Asp Gln

795 800 805

ctt aat gcc tat cat ggc tca gcc ttt tct gtg gag ccc gtt ctt acc 2616

Leu Asn Ala Tyr His Gly Ser Ala Phe Ser Val Glu Pro Val Leu Thr

810 815 820

cag agc gcc tgg ttt cgg ccg cat aac cgc gat aaa acc att act aat 2664

Gln Ser Ala Trp Phe Arg Pro His Asn Arg Asp Lys Thr Ile Thr Asn

825 830 835

ctc tac ctg gtc ggc gca ggc acg cat ccc ggc gca ggc att cct ggc 2712

Leu Tyr Leu Val Gly Ala Gly Thr His Pro Gly Ala Gly Ile Pro Gly

840 845 850 855

gtc atc ggc tcg gca aaa gcg aca gca ggt ttg atg ctg gag gat ctg 2760

Val Ile Gly Ser Ala Lys Ala Thr Ala Gly Leu Met Leu Glu Asp Leu

860 865 870

att tga ataatccgtc gttactcaat catgcggtcg aaacg atg gca gtt ggc 2813

Ile Met Ala Val Gly

875

tcg aaa agt ttt gcg aca gcc tca aag tta ttt gat gca aaa acc cgg 2861

Ser Lys Ser Phe Ala Thr Ala Ser Lys Leu Phe Asp Ala Lys Thr Arg

880 885 890

cgc agc gta ctg atg ctc tac gcc tgg tgc cgc cat tgt gac gat gtt 2909

Arg Ser Val Leu Met Leu Tyr Ala Trp Cys Arg His Cys Asp Asp Val

895 900 905

att gac gat cag acg ctg ggc ttt cag gcc cgg cag cct gcc tta caa 2957

Ile Asp Asp Gln Thr Leu Gly Phe Gln Ala Arg Gln Pro Ala Leu Gln

910 915 920

acg ccc gaa caa cgt ctg atg caa ctt gag atg aaa acg cgc cag gcc 3005

Thr Pro Glu Gln Arg Leu Met Gln Leu Glu Met Lys Thr Arg Gln Ala

925 930 935 940

tat gca gga tcg cag atg cac gaa ccg gcg ttt gcg gct ttt cag gaa 3053

Tyr Ala Gly Ser Gln Met His Glu Pro Ala Phe Ala Ala Phe Gln Glu

945 950 955

gtg gct atg gct cat gat atc gcc ccg gct tac gcg ttt gat cat ctg 3101

Val Ala Met Ala His Asp Ile Ala Pro Ala Tyr Ala Phe Asp His Leu

960 965 970

gaa ggc ttc gcc atg gat gta cgc gaa gcg caa tac agc caa ctg gat 3149

Glu Gly Phe Ala Met Asp Val Arg Glu Ala Gln Tyr Ser Gln Leu Asp

975 980 985

gat acg ctg cgc tat tgc tat cac gtt gca ggc gtt gtc ggc ttg atg 3197

Asp Thr Leu Arg Tyr Cys Tyr His Val Ala Gly Val Val Gly Leu Met

990 995 1000

atg gcg caa atc atg ggc gtg cgg gat aac gcc acg ctg gac cgc 3242

Met Ala Gln Ile Met Gly Val Arg Asp Asn Ala Thr Leu Asp Arg

1005 1010 1015

gcc tgt gac ctt ggg ctg gca ttt cag ttg acc aat att gct cgc 3287

Ala Cys Asp Leu Gly Leu Ala Phe Gln Leu Thr Asn Ile Ala Arg

1020 1025 1030

gat att gtg gac gat gcg cat gcg ggc cgc tgt tat ctg ccg gca 3332

Asp Ile Val Asp Asp Ala His Ala Gly Arg Cys Tyr Leu Pro Ala

1035 1040 1045

agc tgg ctg gag cat gaa ggt ctg aac aaa gag aat tat gcg gca 3377

Ser Trp Leu Glu His Glu Gly Leu Asn Lys Glu Asn Tyr Ala Ala

1050 1055 1060

cct gaa aac cgt cag gcg ctg agc cgt atc gcc cgt cgt ttg gtg 3422

Pro Glu Asn Arg Gln Ala Leu Ser Arg Ile Ala Arg Arg Leu Val

1065 1070 1075

cag gaa gca gaa cct tac tat ttg tct gcc aca gcc ggc ctg gca 3467

Gln Glu Ala Glu Pro Tyr Tyr Leu Ser Ala Thr Ala Gly Leu Ala

1080 1085 1090

ggg ttg ccc ctg cgt tcc gcc tgg gca atc gct acg gcg aag cag 3512

Gly Leu Pro Leu Arg Ser Ala Trp Ala Ile Ala Thr Ala Lys Gln

1095 1100 1105

gtt tac cgg aaa ata ggt gtc aaa gtt gaa cag gcc ggt cag caa 3557

Val Tyr Arg Lys Ile Gly Val Lys Val Glu Gln Ala Gly Gln Gln

1110 1115 1120

gcc tgg gat cag cgg cag tca acg acc acg ccc gaa aaa tta acg 3602

Ala Trp Asp Gln Arg Gln Ser Thr Thr Thr Pro Glu Lys Leu Thr

1125 1130 1135

ctg ctg ctg gcc gcc tct ggt cag gcc ctt act tcc cgg atg cgg 3647

Leu Leu Leu Ala Ala Ser Gly Gln Ala Leu Thr Ser Arg Met Arg

1140 1145 1150

gct cat cct ccc cgc cct gcg cat ctc tgg cag cgc ccg ctc 3689

Ala His Pro Pro Arg Pro Ala His Leu Trp Gln Arg Pro Leu

1155 1160 1165

tagcgccatg tctttcccgg agcgtcgcct gaagttttga caggggcggc gcatagagga 3749

agccaaaaga aacacaacct tctttgcccc tgacggcgtg atgcatacgg tgcgccatat 3809

acaaccgttt gaggtagccc ttgcgtggaa tatagcggaa tggccaacgt tgatgcacca 3869

gcccgtcgtg caccataaaa tagagtaatc catacgccgt catacctgcg ccaatccact 3929

ggagcggcca cattcctgta ctgcccagat aaatcagcag gatcgataat gcagcaaaaa 3989

ccacggcata aagatcgtta acttcaaacg cacctttacg cggttcatga tgtgaaagat 4049

gccatcccca accccagccg tgcatgatgt atttgtgtgc cagtgcagca atcacttcca 4109

tgccaatcac ggtaacgaaa acgatcaggg cattccaaat ccacaacata atttctccgg 4169

tagagacgtc tggcagcagg cttaaggatt caattttaac agagattagc cgatctggcg 4229

gcgggaaggg aaaaaggcgc gccagaaagg cgcgccaggg atcagaagtc ggctttcaga 4289

accacacggt agttggcttt acctgcacga acatggtcca gtgcatcgtt gattttcgac 4349

atcgggaagt actccactgt cggcgcaata tctgtacggc cagccagctt cagcagtgaa 4409

cgcagctgcg caggtgaacc ggttgaagaa cccgtcacgg cgcggtcgcc taaaatcagg 4469

ctgaaagccg ggcacgtcaa acggcttcag tacggcaccc acggtatgga acttaccgcg 4529

aggcgccagg gccgcaaagt agggttgcca gtcgagatcg acggcgaccg tgctgataat 4589

caggtcaaac tggcccgcca ggctttttaa agctt 4624

<210>25

<211>380

<212>PRT

<213>噬夏孢欧文氏菌

<400>25

Met Gln Pro His Tyr Asp Leu Ile Leu Val Gly Ala Gly Leu Ala Asn

1 5 10 15

Gly Leu Ile Ala Leu Arg Leu Gln Gln Gln Gln Pro Asp Met Arg Ile

20 25 30

Leu Leu Ile Asp Ala Ala Pro Gln Ala Gly Gly Asn His Thr Trp Ser

35 40 45

Phe His His Asp Asp Leu Thr Glu Ser Gln His Arg Trp Ile Ala Pro

50 55 60

Leu Val Val His His Trp Pro Asp Tyr Gln Val Arg Phe Pro Thr Arg

65 70 75 80

Arg Arg Lys Leu Asn Ser Gly Tyr Phe Cys Ile Thr Ser Gln Arg Phe

85 90 95

Ala Glu Val Leu Gln Arg Gln Phe Gly Pro His Leu Trp Met Asp Thr

100 105 110

Ala Val Ala Glu Val Asn Ala Glu Ser Val Arg Leu Lys Lys Gly Gln

115 120 125

Val Ile Gly Ala Arg Ala Val Ile Asp Gly Arg Gly Tyr Ala Ala Asn

130 135 140

Ser Ala Leu Ser Val Gly Phe Gln Ala Phe Ile Gly Gln Glu Trp Arg

145 150 155 160

Leu Ser His Pro His Gly Leu Ser Ser Pro Ile Ile Met Asp Ala Thr

165 170 175

Val Asp Gln Gln Asn Gly Tyr Arg Phe Val Tyr Ser Leu Pro Leu Ser

180 185 190

Pro Thr Arg Leu Leu Ile Glu Asp Thr His Tyr Ile Asp Asn Ala Thr

195 200 205

Leu Asp Pro Glu Cys Ala Arg Gln Asn Ile Cys Asp Tyr Ala Ala Gln

210 215 220

Gln Gly Trp Gln Leu Gln Thr Leu Leu Arg Glu Glu Gln Gly Ala Leu

225 230 235 240

Pro Ile Thr Leu Ser Gly Asn Ala Asp Ala Phe Trp Gln Gln Arg Pro

245 250 255

Leu Ala Cys Ser Gly Leu Arg Ala Gly Leu Phe His Pro Thr Thr Gly

260 265 270

Tyr Ser Leu Pro Leu Ala Val Ala Val Ala Asp Arg Leu Ser Ala Leu

275 280 285

Asp Val Phe Thr Ser Ala Ser Ile His His Ala Ile Thr His Phe Ala

290 295 300

Arg Glu Arg Trp Gln Gln Gln Gly Phe Phe Arg Met Leu Asn Arg Met

305 310 315 320

Leu Phe Leu Ala Gly Pro Ala Asp Ser Arg Trp Arg Val Met Gln Arg

325 330 335

Phe Tyr Gly Leu Pro Glu Asp Leu Ile Ala Arg Phe Tyr Ala Gly Lys

340 345 350

Leu Thr Leu Thr Asp Arg Leu Arg Ile Leu Ser Gly Lys Pro Pro Val

355 360 365

Pro Val Leu Ala Ala Leu Gln Ala Ile Met Thr Thr

370 375 380

<210>26

<211>492

<212>PRT

<213>噬夏孢欧文氏菌

<400>26

Met Lys Pro Thr Thr Val Ile Gly Ala Gly Phe Gly Gly Leu Ala Leu

1 5 10 15

Ala Ile Arg Leu Gln Ala Ala Gly Ile Pro Val Leu Leu Leu Glu Gln

20 25 30

Arg Asp Lys Pro Gly Gly Arg Ala Tyr Val Tyr Glu Asp Gln Gly Phe

35 40 45

Thr Phe Asp Ala Gly Pro Thr Val Ile Thr Asp Pro Ser Ala Ile Glu

50 55 60

Glu Leu Phe Ala Leu Ala Gly Lys Gln Leu Lys Glu Tyr Val Glu Leu

65 70 75 80

Leu Pro Val Thr Pro Phe Tyr Arg Leu Cys Trp Glu Ser Gly Lys Val

85 90 95

Phe Asn Tyr Asp Asn Asp Gln Thr Arg Leu Glu Ala Gln Ile Gln Gln

100 105 110

Phe Asn Pro Arg Asp Val Glu Gly Tyr Arg Gln Phe Leu Asp Tyr Ser

115 120 125

Arg Ala Val Phe Lys Glu Gly Tyr Leu Lys Leu Gly Thr Val Pro Phe

130 135 140

Leu Ser Phe Arg Asp Met Leu Arg Ala Ala Pro Gln Leu Ala Lys Leu

145 150 155 160

Gln Ala Trp Arg Ser Val Tyr Ser Lys Val Ala Ser Tyr Ile Glu Asp

165 170 175

Glu His Leu Arg Gln Ala Phe Ser Phe His Ser Leu Leu Val Gly Gly

180 185 190

Asn Pro Phe Ala Thr Ser Ser Ile Tyr Thr Leu Ile His Ala Leu Glu

195 200 205

Arg Glu Trp Gly Val Trp Phe Pro Arg Gly Gly Thr Gly Ala Leu Val

210 215 220

Gln Gly Met Ile Lys Leu Phe Gln Asp Leu Gly Gly Glu Val Val Leu

225 230 235 240

Asn Ala Arg Val Ser His Met Glu Thr Thr Gly Asn Lys Ile Glu Ala

245 250 255

Val His Leu Glu Asp Gly Arg Arg Phe Leu Thr Gln Ala Val Ala Ser

260 265 270

Asn Ala Asp Val Val His Thr Tyr Arg Asp Leu Leu Ser Gln His Pro

275 280 285

Ala Ala Val Lys Gln Ser Asn Lys Leu Gln Thr Lys Arg Met Ser Asn

290 295 300

Ser Leu Phe Val Leu Tyr Phe Gly Leu Asn His His His Asp Gln Leu

305 310 315 320

Ala His His Thr Val Cys Phe Gly Pro Arg Tyr Arg Glu Leu Ile Asp

325 330 335

Glu Ile Phe Asn His Asp Gly Leu Ala Glu Asp Phe Ser Leu Tyr Leu

340 345 350

His Ala Pro Cys Val Thr Asp Ser Ser Leu Ala Pro Glu Gly Cys Gly

355 360 365

Ser Tyr Tyr Val Leu Ala Pro Val Pro His Leu Gly Thr Ala Asn Leu

370 375 380

Asp Trp Thr Val Glu Gly Pro Lys Leu Arg Asp Arg Ile Phe Ala Tyr

385 390 395 400

Leu Glu Gln His Tyr Met Pro Gly Leu Arg Ser Gln Leu Val Thr His

405 410 415

Arg Met Phe Thr Pro Phe Asp Phe Arg Asp Gln Leu Asn Ala Tyr His

420 425 430

Gly Ser Ala Phe Ser Val Glu Pro Val Leu Thr Gln Ser Ala Trp Phe

435 440 445

Arg Pro His Asn Arg Asp Lys Thr Ile Thr Asn Leu Tyr Leu Val Gly

450 455 460

Ala Gly Thr His Pro Gly Ala Gly Ile Pro Gly Val Ile Gly Ser Ala

465 470 475 480

Lys Ala Thr Ala Gly Leu Met Leu Glu Asp Leu Ile

485 490

<210>27

<211>296

<212>PRT

<213>噬夏孢欧文氏菌

<400>27

Met Ala Val Gly Ser Lys Ser Phe Ala Thr Ala Ser Lys Leu Phe Asp

1 5 10 15

Ala Lys Thr Arg Arg Ser Val Leu Met Leu Tyr Ala Trp Cys Arg His

20 25 30

Cys Asp Asp Val Ile Asp Asp Gln Thr Leu Gly Phe Gln Ala Arg Gln

35 40 45

Pro Ala Leu Gln Thr Pro Glu Gln Arg Leu Met Gln Leu Glu Met Lys

50 55 60

Thr Arg Gln Ala Tyr Ala Gly Ser Gln Met His Glu Pro Ala Phe Ala

65 70 75 80

Ala Phe Gln Glu Val Ala Met Ala His Asp Ile Ala Pro Ala Tyr Ala

85 90 95

Phe Asp His Leu Glu Gly Phe Ala Met Asp Val Arg Glu Ala Gln Tyr

100 105 110

Ser Gln Leu Asp Asp Thr Leu Arg Tyr Cys Tyr His Val Ala Gly Val

115 120 125

Val Gly Leu Met Met Ala Gln Ile Met Gly Val Arg Asp Asn Ala Thr

130 135 140

Leu Asp Arg Ala Cys Asp Leu Gly Leu Ala Phe Gln Leu Thr Asn Ile

145 150 155 160

Ala Arg Asp Ile Val Asp Asp Ala His Ala Gly Arg Cys Tyr Leu Pro

165 170 175

Ala Ser Trp Leu Glu His Glu Gly Leu Asn Lys Glu Asn Tyr Ala Ala

180 185 190

Pro Glu Asn Arg Gln Ala Leu Ser Arg Ile Ala Arg Arg Leu Val Gln

195 200 205

Glu Ala Glu Pro Tyr Tyr Leu Ser Ala Thr Ala Gly Leu Ala Gly Leu

210 215 220

Pro Leu Arg Ser Ala Trp Ala Ile Ala Thr Ala Lys Gln Val Tyr Arg

225 230 235 240

Lys Ile Gly Val Lys Val Glu Gln Ala Gly Gln Gln Ala Trp Asp Gln

245 250 255

Arg Gln Ser Thr Thr Thr Pro Glu Lys Leu Thr Leu Leu Leu Ala Ala

260 265 270

Ser Gly Gln Ala Leu Thr Ser Arg Met Arg Ala His Pro Pro Arg Pro

275 280 285

Ala His Leu Trp Gln Arg Pro Leu

290 295

<210>28

<211>32

<212>DNA

<213>人工序列

<220>

<221>primer_bind

<222>(1)..(32)

<223>

<400>28

tttttctcga gcgataaacg ctcacttggt ta 32

<210>29

<211>32

<212>DNA

<213>人工序列

<220>

<221>primer_bind

<222>(1)..(32)

<223>

<400>29

tttttgtcga cacgttatgc tcacaacccc gg 32

<210>30

<211>679

<212>DNA

<213>大肠杆菌(Escherichia coli)

<220>

<221>CDS

<222>(87)..(635)

<223>

<400>30

ctcgagcgat aaacgctcac ttggttaatc atttcactct tcaattatct ataatgatga 60

gtgatcagaa ttacatgtga gaaatt atg caa acg gaa cac gtc att tta ttg 113

Met Gln Thr Glu His Val Ile Leu Leu

1 5

aat gca cag gga gtt ccc acg ggt acg ctg gaa aag tat gcc gca cac 161

Asn Ala Gln Gly Val Pro Thr Gly Thr Leu Glu Lys Tyr Ala Ala His

10 15 20 25

acg gca gac acc cgc tta cat ctc gcg ttc tcc agt tgg ctg ttt aat 209

Thr Ala Asp Thr Arg Leu His Leu Ala Phe Ser Ser Trp Leu Phe Asn

30 35 40

gcc aaa gga caa tta tta gtt acc cgc cgc gca ctg agc aaa aaa gca 257

Ala Lys Gly Gln Leu Leu Val Thr Arg Arg Ala Leu Ser Lys Lys Ala

45 50 55

tgg cct ggc gtg tgg act aac tcg gtt tgt ggg cac cca caa ctg gga 305

Trp Pro Gly Val Trp Thr Asn Ser Val Cys Gly His Pro Gln Leu Gly

60 65 70

gaa agc aac gaa gac gca gtg atc cgc cgt tgc cgt tat gag ctt ggc 353

Glu Ser Asn Glu Asp Ala Val Ile Arg Arg Cys Arg Tyr Glu Leu Gly

75 80 85

gtg gaa att acg cct cct gaa tct atc tat cct gac ttt cgc tac cgc 401

Val Glu Ile Thr Pro Pro Glu Ser Ile Tyr Pro Asp Phe Arg Tyr Arg

90 95 100 105

gcc acc gat ccg agt ggc att gtg gaa aat gaa gtg tgt ccg gta ttt 449

Ala Thr Asp Pro Ser Gly Ile Val Glu Asn Glu Val Cys Pro Val Phe

110 115 120

gcc gca cgc acc act agt gcg tta cag atc aat gat gat gaa gtg atg 497

Ala Ala Arg Thr Thr Ser Ala Leu Gln Ile Asn Asp Asp Glu Val Met

125 130 135

gat tat caa tgg tgt gat tta gca gat gta tta cac ggt att gat gcc 545

Asp Tyr Gln Trp Cys Asp Leu Ala Asp Val Leu His Gly Ile Asp Ala

140 145 150

acg ccg tgg gcg ttc agt ccg tgg atg gtg atg cag gcg aca aat cgc 593

Thr Pro Trp Ala Phe Ser Pro Trp Met Val Met Gln Ala Thr Asn Arg

155 160 165

gaa gcc aga aaa cga tta tct gca ttt acc cag ctt aaa taa 635

Glu Ala Arg Lys Arg Leu Ser Ala Phe Thr Gln Leu Lys

170 175 180

aaaaaccccg acatttgccg gggttgtgag cataacgtgt cgac 679

<210>31

<211>182

<212>PRT

<213>大肠杆菌

<400>31

Met Gln Thr Glu His Val Ile Leu Leu Asn Ala Gln Gly Val Pro Thr

1 5 10 15

Gly Thr Leu Glu Lys Tyr Ala Ala His Thr Ala Asp Thr Arg Leu His

20 25 30

Leu Ala Phe Ser Ser Trp Leu Phe Asn Ala Lys Gly Gln Leu Leu Val

35 40 45

Thr Arg Arg Ala Leu Ser Lys Lys Ala Trp Pro Gly Val Trp Thr Asn

50 55 60

Ser Val Cys Gly His Pro Gln Leu Gly Glu Ser Asn Glu Asp Ala Val

65 70 75 80

Ile Arg Arg Cys Arg Tyr Glu Leu Gly Val Glu Ile Thr Pro Pro Glu

85 90 95

Ser Ile Tyr Pro Asp Phe Arg Tyr Arg Ala Thr Asp Pro Ser Gly Ile

100 105 110

Val Glu Asn Glu Val Cys Pro Val Phe Ala Ala Arg Thr Thr Ser Ala

115 120 125

Leu Gln Ile Asn Asp Asp Glu Val Met Asp Tyr Gln Trp Cys Asp Leu

130 135 140

Ala Asp Val Leu His Gly Ile Asp Ala Thr Pro Trp Ala Phe Ser Pro

145 150 155 160

Trp Met Val Met Gln Ala Thr Asn Arg Glu Ala Arg Lys Arg Leu Ser

165 170 175

Ala Phe Thr Gln Leu Lys

180

<210>32

<211>31

<212>DNA

<213>人工序列

<220>

<221>primer_bind

<222>(1)..(31)

<223>

<400>32

tttttccatg gtgaaggagg aaatagcgaa a 31

<210>33

<211>32

<212>DNA

<213>人工序列

<220>

<221>primer_bind

<222>(1)..(32)

<223>

<400>33

tttttaagct ttcacttttt tcttgtaacc aa 32

<210>34

<211>962

<212>DNA

<213>Archaeoglobus fulgidus

<220>

<221>CDS

<222>(3)..(956)

<223>

<400>34

cc atg gtg aag gag gaa ata gcg aaa agg gcc gaa ata atc aac aaa 47

Met Val Lys Glu Glu Ile Ala Lys Arg Ala Glu Ile Ile Asn Lys

1 5 10 15

gcc att gaa gag ctt ctg ccc gaa agg gag ccg att gga ctc tac aaa 95

Ala Ile Glu Glu Leu Leu Pro Glu Arg Glu Pro Ile Gly Leu Tyr Lys

20 25 30

gcc gca agg cat ctg atc aaa gca ggt ggc aag agg cta agg cct gta 143

Ala Ala Arg His Leu Ile Lys Ala Gly Gly Lys Arg Leu Arg Pro Val

35 40 45

ata agc ctc tta gca gtc gaa gcc ctt ggg aaa gac tac aga aag att 191

Ile Ser Leu Leu Ala Val Glu Ala Leu Gly Lys Asp Tyr Arg Lys Ile

50 55 60

atc ccg gct gct gtc agc att gaa aca atc cac aac ttc acc ctc gtg 239

Ile Pro Ala Ala Val Ser Ile Glu Thr Ile His Asn Phe Thr Leu Val

65 70 75

cat gac gac ata atg gac agg gac gag atg agg agg gga gtt ccg acg 287

His Asp Asp Ile Met Asp Arg Asp Glu Met Arg Arg Gly Val Pro Thr

80 85 90 95

gta cac agg gtt tat ggg gaa gcg acg gcc att tta gca ggc gac aca 335

Val His Arg Val Tyr Gly Glu Ala Thr Ala Ile Leu Ala Gly Asp Thr

100 105 110

ctc ttt gct gaa gcc ttc aag ctg ctg aca aag tgc gat gtt gag agc 383

Leu Phe Ala Glu Ala Phe Lys Leu Leu Thr Lys Cys Asp Val Glu Ser

115 120 125

gag gga atc aga aaa gct aca gaa atg ctt tcg gac gtt tgc ata aaa 431

Glu Gly Ile Arg Lys Ala Thr Glu Met Leu Ser Asp Val Cys Ile Lys

130 135 140

ata tgc gag ggg cag tac tac gac atg agc ttt gag aaa aag gag agc 479

Ile Cys Glu Gly Gln Tyr Tyr Asp Met Ser Phe Glu Lys Lys Glu Ser

145 150 155

gtt tcc gag gag gag tat ctc agg atg gtc gag ctg aag acc gga gtg 527

Val Ser Glu Glu Glu Tyr Leu Arg Met Val Glu Leu Lys Thr Gly Val

160 165 170 175

ctg att gca gct tct gca gca tta cct gcg gtg ctt ttt ggg gag agc 575

Leu Ile Ala Ala Ser Ala Ala Leu Pro Ala Val Leu Phe Gly Glu Ser

180 185 190

gag gaa att gta aag gcg ctg tgg gac tac gga gtt ctt agc ggt att 623

Glu Glu Ile Val Lys Ala Leu Trp Asp Tyr Gly Val Leu Ser Gly Ile

195 200 205

ggc ttc cag atc cag gac gac ctg ctt gac ctg act gag gag acc gga 671

Gly Phe Gln Ile Gln Asp Asp Leu Leu Asp Leu Thr Glu Glu Thr Gly

210 215 220

aag gac tgg gga agc gac ctg ctt aaa ggg aag aaa acc ctg att gtc 719

Lys Asp Trp Gly Ser Asp Leu Leu Lys Gly Lys Lys Thr Leu Ile Val

225 230 235

ata aag gcg ttc gaa aag gga gtg aag cta aag acg ttt gga aag gaa 767

Ile Lys Ala Phe Glu Lys Gly Val Lys Leu Lys Thr Phe Gly Lys Glu

240 245 250 255

aag gcg gac gtc tct gag att aga gat gat atc gaa aag tta aga gag 815

Lys Ala Asp Val Ser Glu Ile Arg Asp Asp Ile Glu Lys Leu Arg Glu

260 265 270

tgt ggt gcg att gat tac gct gcc agc atg gca aga aag atg gct gaa 863

Cys Gly Ala Ile Asp Tyr Ala Ala Ser Met Ala Arg Lys Met Ala Glu

275 280 285

gag gcg aaa aga aag ctc gaa gtt ctg cct gaa agc aaa gcc aag gaa 911

Glu Ala Lys Arg Lys Leu Glu Val Leu Pro Glu Ser Lys Ala Lys Glu

290 295 300

aca ctg ctg gaa ctt acc gac ttc ttg gtt aca aga aaa aag tga 956

Thr Leu Leu Glu Leu Thr Asp Phe Leu Val Thr Arg Lys Lys

305 310 315

aagctt 962

<210>35

<211>317

<212>PRT

<213>Archaeoglobus fulgidus

<400>35

Met Val Lys Glu Glu Ile Ala Lys Arg Ala Glu Ile Ile Asn Lys Ala

1 5 10 15

Ile Glu Glu Leu Leu Pro Glu Arg Glu Pro Ile Gly Leu Tyr Lys Ala

20 25 30

Ala Arg His Leu Ile Lys Ala Gly Gly Lys Arg Leu Arg Pro Val Ile

35 40 45

Ser Leu Leu Ala Val Glu Ala Leu Gly Lys Asp Tyr Arg Lys Ile Ile

50 55 60

Pro Ala Ala Val Ser Ile Glu Thr Ile His Asn Phe Thr Leu Val His

65 70 75 80

Asp Asp Ile Met Asp Arg Asp Glu Met Arg Arg Gly Val Pro Thr Val

85 90 95

His Arg Val Tyr Gly Glu Ala Thr Ala Ile Leu Ala Gly Asp Thr Leu

100 105 110

Phe Ala Glu Ala Phe Lys Leu Leu Thr Lys Cys Asp Val Glu Ser Glu

115 120 125

Gly Ile Arg Lys Ala Thr Glu Met Leu Ser Asp Val Cys Ile Lys Ile

130 135 140

Cys Glu Gly Gln Tyr Tyr Asp Met Ser Phe Glu Lys Lys Glu Ser Val

145 150 155 160

Ser Glu Glu Glu Tyr Leu Arg Met Val Glu Leu Lys Thr Gly Val Leu

165 170 175

Ile Ala Ala Ser Ala Ala Leu Pro Ala Val Leu Phe Gly Glu Ser Glu

180 185 190

Glu Ile Val Lys Ala Leu Trp Asp Tyr Gly Val Leu Ser Gly Ile Gly

195 200 205

Phe Gln Ile Gln Asp Asp Leu Leu Asp Leu Thr Glu Glu Thr Gly Lys

210 215 220

Asp Trp Gly Ser Asp Leu Leu Lys Gly Lys Lys Thr Leu Ile Val Ile

225 230 235 240

Lys Ala Phe Glu Lys Gly Val Lys Leu Lys Thr Phe Gly Lys Glu Lys

245 250 255

Ala Asp Val Ser Glu Ile Arg Asp Asp Ile Glu Lys Leu Arg Glu Cys

260 265 270

Gly Ala Ile Asp Tyr Ala Ala Ser Met Ala Arg Lys Met Ala Glu Glu

275 280 285

Ala Lys Arg Lys Leu Glu Val Leu Pro Glu Ser Lys Ala Lys Glu Thr

290 295 300

Leu Leu Glu Leu Thr Asp Phe Leu Val Thr Arg Lys Lys

305 310 315

<210>36

<211>1293

<212>DNA

<213>Archaeoglobus fulgidus

<220>

<221>CDS

<222>(206)..(1159)

<223>

<400>36

taaaacgacg gccagtgagc gcgcgtaata cgactcacta tagggcgaat tgggtaccgg 60

gccccccctc gacgccgtcg ttcaatgaga atggataaga ggctcgtggg attgacgtga 120

gggggcaggg atggctatat ttctgggagc gaactccggg cgaggatcta gttgtaggga 180

gggattcatg acaccacaaa cagcc atg gtg aag gag gaa ata gcg aaa agg 232

Met Val Lys Glu Glu Ile Ala Lys Arg

1 5

gcc gaa ata atc aac aaa gcc att gaa gag ctt ctg ccc gaa agg gag 280

Ala Glu Ile Ile Asn Lys Ala Ile Glu Glu Leu Leu Pro Glu Arg Glu

10 15 20 25

ccg att gga ctc tac aaa gcc gca agg cat ctg atc aaa gca ggt ggc 328

Pro Ile Gly Leu Tyr Lys Ala Ala Arg His Leu Ile Lys Ala Gly Gly

30 35 40

aag agg cta agg cct gta ata agc ctc tta gca gtc gaa gcc ctt ggg 376

Lys Arg Leu Arg Pro Val Ile Ser Leu Leu Ala Val Glu Ala Leu Gly

45 50 55

aaa gac tac aga aag att atc ccg gct gct gtc agc att gaa aca atc 424

Lys Asp Tyr Arg Lys Ile Ile Pro Ala Ala Val Ser Ile Glu Thr Ile

60 65 70

cac aac ttc acc ctc gtg cat gac gac ata atg gac agg gac gag atg 472

His Asn Phe Thr Leu Val His Asp Asp Ile Met Asp Arg Asp Glu Met

75 80 85

agg agg gga gtt ccg acg gta cac agg gtt tat ggg gaa gcg acg gcc 520

Arg Arg Gly Val Pro Thr Val His Arg Val Tyr Gly Glu Ala Thr Ala

90 95 100 105

att tta gca ggc gac aca ctc ttt gct gaa gcc ttc aag ctg ctg aca 568

Ile Leu Ala Gly Asp Thr Leu Phe Ala Glu Ala Phe Lys Leu Leu Thr

110 115 120

aag tgc gat gtt gag agc gag gga atc aga aaa gct aca gaa atg ctt 616

Lys Cys Asp Val Glu Ser Glu Gly Ile Arg Lys Ala Thr Glu Met Leu

125 130 135

tcg gac gtt tgc ata aaa ata tgc gag ggg cag tac tac gac atg agc 664

Ser Asp Val Cys Ile Lys Ile Cys Glu Gly Gln Tyr Tyr Asp Met Ser

140 145 150

ttt gag aaa aag gag agc gtt tcc gag gag gag tat ctc agg atg gtc 712

Phe Glu Lys Lys Glu Ser Val Ser Glu Glu Glu Tyr Leu Arg Met Val

155 160 165

gag ctg aag acc gga gtg ctg att gca gct tct gca gca tta cct gcg 760

Glu Leu Lys Thr Gly Val Leu Ile Ala Ala Ser Ala Ala Leu Pro Ala

170 175 180 185

gtg ctt ttt ggg gag agc gag gaa att gta aag gcg ctg tgg gac tac 808

Val Leu Phe Gly Glu Ser Glu Glu Ile Val Lys Ala Leu Trp Asp Tyr

190 195 200

gga gtt ctt agc ggt att ggc ttc cag atc cag gac gac ctg ctt gac 856

Gly Val Leu Ser Gly Ile Gly Phe Gln Ile Gln Asp Asp Leu Leu Asp

205 210 215

ctg act gag gag acc gga aag gac tgg gga agc gac ctg ctt aaa ggg 904

Leu Thr Glu Glu Thr Gly Lys Asp Trp Gly Ser Asp Leu Leu Lys Gly

220 225 230

aag aaa acc ctg att gtc ata aag gcg ttc gaa aag gga gtg aag cta 952

Lys Lys Thr Leu Ile Val Ile Lys Ala Phe Glu Lys Gly Val Lys Leu

235 240 245

aag acg ttt gga aag gaa aag gcg gac gtc tct gag att aga gat gat 1000

Lys Thr Phe Gly Lys Glu Lys Ala Asp Val Ser Glu Ile Arg Asp Asp

250 255 260 265

atc gaa aag tta aga gag tgt ggt gcg att gat tac gct gcc agc atg 1048

Ile Glu Lys Leu Arg Glu Cys Gly Ala Ile Asp Tyr Ala Ala Ser Met

270 275 280

gca aga aag atg gct gaa gag gcg aaa aga aag ctc gaa gtt ctg cct 1096

Ala Arg Lys Met Ala Glu Glu Ala Lys Arg Lys Leu Glu Val Leu Pro

285 290 295

gaa agc aaa gcc aag gaa aca ctg ctg gaa ctt acc gac ttc ttg gtt 1144

Glu Ser Lys Ala Lys Glu Thr Leu Leu Glu Leu Thr Asp Phe Leu Val

300 305 310

aca aga aaa aag tga aagcttcaat tgcatgctct agatgatcaa agaattcctg 1199

Thr Arg Lys Lys

315

gcctagtcta taggaggttt tgaaaagaaa ggagcaataa tcattttctt gttctatcaa 1259

gagggtgcta ttgctccttt ctttttttct cgag 1293

<210>37

<211>317

<212>PRT

<213>Archaeoglobus fulgidus

<400>37

Met Val Lys Glu Glu Ile Ala Lys Arg Ala Glu Ile Ile Asn Lys Ala

1 5 10 15

Ile Glu Glu Leu Leu Pro Glu Arg Glu Pro Ile Gly Leu Tyr Lys Ala

20 25 30

Ala Arg His Leu Ile Lys Ala Gly Gly Lys Arg Leu Arg Pro Val Ile

35 40 45

Ser Leu Leu Ala Val Glu Ala Leu Gly Lys Asp Tyr Arg Lys Ile Ile

50 55 60

Pro Ala Ala Val Ser Ile Glu Thr Ile His Asn Phe Thr Leu Val His

65 70 75 80

Asp Asp Ile Met Asp Arg Asp Glu Met Arg Arg Gly Val Pro Thr Val

85 90 95

His Arg Val Tyr Gly Glu Ala Thr Ala Ile Leu Ala Gly Asp Thr Leu

100 105 110

Phe Ala Glu Ala Phe Lys Leu Leu Thr Lys Cys Asp Val Glu Ser Glu

115 120 125

Gly Ile Arg Lys Ala Thr Glu Met Leu Ser Asp Val Cys Ile Lys Ile

130 135 140

Cys Glu Gly Gln Tyr Tyr Asp Met Ser Phe Glu Lys Lys Glu Ser Val

145 150 155 160

Ser Glu Glu Glu Tyr Leu Arg Met Val Glu Leu Lys Thr Gly Val Leu

165 170 175

Ile Ala Ala Ser Ala Ala Leu Pro Ala Val Leu Phe Gly Glu Ser Glu

180 185 190

Glu Ile Val Lys Ala Leu Trp Asp Tyr Gly Val Leu Ser Gly Ile Gly

195 200 205

Phe Gln Ile Gln Asp Asp Leu Leu Asp Leu Thr Glu Glu Thr Gly Lys

210 215 220

Asp Trp Gly Ser Asp Leu Leu Lys Gly Lys Lys Thr Leu Ile Val Ile

225 230 235 240

Lys Ala Phe Glu Lys Gly Val Lys Leu Lys Thr Phe Gly Lys Glu Lys

245 250 255

Ala Asp Val Ser Glu Ile Arg Asp Asp Ile Glu Lys Leu Arg Glu Cys

260 265 270

Gly Ala Ile Asp Tyr Ala Ala Ser Met Ala Arg Lys Met Ala Glu Glu

275 280 285

Ala Lys Arg Lys Leu Glu Val Leu Pro Glu Ser Lys Ala Lys Glu Thr

290 295 300

Leu Leu Glu Leu Thr Asp Phe Leu Val Thr Arg Lys Lys

305 310 315

<210>38

<211>35

<212>DNA

<213>人工序列

<220>

<221>primer_bind

<222>(1)..(35)

<223>

<400>38

gagctcttca ttatttcgat tttgatttcg tgacc 35

<210>39

<211>38

<212>DNA

<213>人工序列

<220>

<221>引物

<222>(1)..(38)

<223>

<400>39

aagcttggtt gatcagaaga agaagaagaa gatgaact 38

<210>40

<211>647

<212>DNA

<213>拟南芥(Arabidopsis thaliana)

<220>

<221>启动子

<222>(1)..(647)

<223>

<400>40

gagctcttca ttatttcgat tttgatttcg tgaccagcga acgcagaata ccttgttgtg 60

taatacttta cccgtgtaaa tcaaaaacaa aaaggctttt gagctttttg tagttgaatt 120

tctctggctg atcttttctg tacagattca tatatctgca gagacgatat cattgattat 180

ttgagcttct tttgaactat ttcgtgtaat ttgggatgag agctctatgt atgtgtgtaa 240

actttgaaga caacaagaaa ggtaacaagt gagggaggga tgactccatg tcaaaataga 300

tgtcataaga ggcccatcaa taagtgcttg agcccattag ctagcccagt aactaccaga 360

ttgtgagatg gatgtgtgaa cagttttttt tttgatgtag gactgaaatg tgaacaacag 420

gcgcatgaaa ggctaaatta ggacaatgat aagcagaaat aacttatcct ctctaacact 480

tggcctcaca ttgcccttca cacaatccac acacatccaa tcacaacctc atcatatatc 540

tcccgctaat ctttttttct ttgatctttt tttttttgct tattattttt ttgactttga 600

tctcccatca gttcatcttc ttcttcttct tctgatcaac caagctt 647

<210>41

<211>28

<212>DNA

<213>人工序列

<220>

<221>primer_bind

<222>(1)..(28)

<223>

<400>41

gagctcactc actgatttcc attgcttg 28

<210>42

<211>23

<212>DNA

<213>人工序列

<220>

<221>引物

<222>(1)..(23)

<223>

<400>42

aagcttttgt tgaagagatt tgg 23

<210>43

<211>37

<212>DNA

<213>人工序列

<220>

<221>primer_bind

<222>(1)..(37)

<223>

<400>43

cgccgttaag tcgatgtccg ttgatttaaa cagtgtc 37

<210>44

<211>34

<212>DNA

<213>人工序列

<220>

<221>primer_bind

<222>(1)..(34)

<223>

<400>44

atcaacggac atcgacttaa cggcgtttgt aaac 34

<210>45

<211>777

<212>DNA

<213>拟南芥

<220>

<221>启动子

<222>(1)..(777)

<223>

<400>45

gagctcactc actgatttcc attgcttgaa aattgatgat gaactaagat caatccatgt 60

tagtttcaaa acaacagtaa ctgtggccaa cttagttttg aaacaacact aactggtcga 120

agcaaaaaga aaaaagagtt tcatcatata tctgatttga tggactgttt ggagttagga 180

ccaaacatta tctacaaaca aagacttttc tcctaacttg tgattccttc ttaaacccta 240

ggggtaatat tctattttcc aaggatcttt agttaaaggc aaatccggga aattattgta 300

atcatttggg gaaacatata aaagatttga gttagatgga agtgacgatt aatccaaaca 360

tatatatctc tttcttctta tttcccaaat taacagacaa aagtagaata ttggctttta 420

acaccaatat aaaaacttgc ttcacaccta aacacttttg tttactttag ggtaagtgca 480

aaaagccaac caaatccacc tgcactgatt tgacgtttac aaacgccgtt aagtcgatgt 540

ccgttgattt aaacagtgtc ttgtaattaa aaaaatcagt ttacataaat ggaaaattta 600

tcacttagtt ttcatcaact tctgaactta cctttcatgg attaggcaat actttccatt 660

tttagtaact caagtggacc ctttacttct tcaactccat ctctctcttt ctatttcact 720

tctttcttct cattatatct cttgtcctct ccaccaaatc tcttcaacaa aaagctt 777

<210>46

<211>804

<212>DNA

<213>聚球藻(Synechococcus)WH8102

<220>

<221>CDS

<222>(1)..(804)

<223>

<400>46

atg aaa acg aca aga tct att tcg tgg cca tcg act tgc tgg cat cac 48

Met Lys Thr Thr Arg Ser Ile Ser Trp Pro Ser Thr Cys Trp His His

1 5 10 15

cag ccg agt tgc tca agc tgg gtg gca aat gag ttc agc cct cag gcc 96

Gln Pro Ser Cys Ser Ser Trp Val Ala Asn Glu Phe Ser Pro Gln Ala

20 25 30

ctc aaa ggg ttg gct ctg gct ggt ctg att gga tca gcc tgg ctg ctc 144

Leu Lys Gly Leu Ala Leu Ala Gly Leu Ile Gly Ser Ala Trp Leu Leu

35 40 45

tcc ctg ggc ctg agc tac acc ctg cca ctt gat cag acg cct ggg ctg 192

Ser Leu Gly Leu Ser Tyr Thr Leu Pro Leu Asp Gln Thr Pro Gly Leu

50 55 60

ttg att ggc agc ttg att ctg ctc aga gca ttt ctg cac acc ggg ctg 240

Leu Ile Gly Ser Leu Ile Leu Leu Arg Ala Phe Leu His Thr Gly Leu

65 70 75 80

ttc atc gtt gcc cac gat tcc atg cac gcc agt ctg gtt ccg ggt cat 288

Phe Ile Val Ala His Asp Ser Met His Ala Ser Leu Val Pro Gly His

85 90 95

ccc gga ttg aac cgc tgg atc ggc aaa gtg tat ttg ttg gtg tat gca 336

Pro Gly Leu Asn Arg Trp Ile Gly Lys Val Tyr Leu Leu Val Tyr Ala

100 105 110

ggc ttg tct tat gag cgt tgt tcc cgc aac cac aga cgt cat cac ctg 384

Gly Leu Ser Tyr Glu Arg Cys Ser Arg Asn His Arg Arg His His Leu

115 120 125

gca ccg gag acg ttc cag gat cct gac tac caa cgt tgc acc aat aac 432

Ala Pro Glu Thr Phe Gln Asp Pro Asp Tyr Gln Arg Cys Thr Asn Asn

130 135 140

aac atc cta gat tgg tat gtt cac ttc atg ggc aac tat ctg ggc atg 480

Asn Ile Leu Asp Trp Tyr Val His Phe Met Gly Asn Tyr Leu Gly Met

145 150 155 160

cgg caa ctg tta aat cta agc tgt ctt tgg ctg gcg cta atc att ctc 528

Arg Gln Leu Leu Asn Leu Ser Cys Leu Trp Leu Ala Leu Ile Ile Leu

165 170 175

aac ggt tct gat ctc cct gct cag atc atg cat ctg ctg ttg ttc agc 576

Asn Gly Ser Asp Leu Pro Ala Gln Ile Met His Leu Leu Leu Phe Ser

180 185 190

gtt ctg ccg ttg atc atc agt tcc tgt caa ttg ttt cta gtg gga acc 624

Val Leu Pro Leu Ile Ile Ser Ser Cys Gln Leu Phe Leu Val Gly Thr

195 200 205

tgg tta ccc cac cga cgt ggg gcc acg aca cga ccg ggc gtg aca acg 672

Trp Leu Pro His Arg Arg Gly Ala Thr Thr Arg Pro Gly Val Thr Thr

210 215 220

cgc agc ctg gct ttg cat cca gcc ctc tct ttc gca gct tgt tac aac 720

Arg Ser Leu Ala Leu His Pro Ala Leu Ser Phe Ala Ala Cys Tyr Asn

225 230 235 240

ttt ggc tat cat cgt gaa cat cat gaa tcg cct tcc aca ccc tgg ttt 768

Phe Gly Tyr His Arg Glu His His Glu Ser Pro Ser Thr Pro Trp Phe

245 250 255

cag ctg cca caa ctt cga aat gaa tca ttc act tga 804

Gln Leu Pro Gln Leu Arg Asn Glu Ser Phe Thr

260 265

<210>47

<211>267

<212>PRT

<213>聚球藻WH8102

<400>47

Met Lys Thr Thr Arg Ser Ile Ser Trp Pro Ser Thr Cys Trp His His

1 5 10 15

Gln Pro Ser Cys Ser Ser Trp Val Ala Asn Glu Phe Ser Pro Gln Ala

20 25 30

Leu Lys Gly Leu Ala Leu Ala Gly Leu Ile Gly Ser Ala Trp Leu Leu

35 40 45

Ser Leu Gly Leu Ser Tyr Thr Leu Pro Leu Asp Gln Thr Pro Gly Leu

50 55 60

Leu Ile Gly Ser Leu Ile Leu Leu Arg Ala Phe Leu His Thr Gly Leu

65 70 75 80

Phe Ile Val Ala His Asp Ser Met His Ala Ser Leu Val Pro Gly His

85 90 95

Pro Gly Leu Asn Arg Trp Ile Gly Lys Val Tyr Leu Leu Val Tyr Ala

100 105 110

Gly Leu Ser Tyr Glu Arg Cys Ser Arg Asn His Arg Arg His His Leu

115 120 125

Ala Pro Glu Thr Phe Gln Asp Pro Asp Tyr Gln Arg Cys Thr Asn Asn

130 135 140

Asn Ile Leu Asp Trp Tyr Val His Phe Met Gly Asn Tyr Leu Gly Met

145 150 155 160

Arg Gln Leu Leu Asn Leu Ser Cys Leu Trp Leu Ala Leu Ile Ile Leu

165 170 175

Asn Gly Ser Asp Leu Pro Ala Gln Ile Met His Leu Leu Leu Phe Ser

180 185 190

Val Leu Pro Leu Ile Ile Ser Ser Cys Gln Leu Phe Leu Val Gly Thr

195 200 205

Trp Leu Pro His Arg Arg Gly Ala Thr Thr Arg Pro Gly Val Thr Thr

210 215 220

Arg Ser Leu Ala Leu His Pro Ala Leu Ser Phe Ala Ala Cys Tyr Asn

225 230 235 240

Phe Gly Tyr His Arg Glu His His Glu Ser Pro Ser Thr Pro Trp Phe

245 250 255

Gln Leu Pro Gln Leu Arg Asn Glu Ser Phe Thr

260 265

<210>48

<211>804

<212>DNA

<213>人工变体

<220>

<221>CDS

<222>(1)..(804)

<223>

<400>48

atg aaa acg aca aga tct att tcg tgg cca tcg act tgc tgg cat cac 48

Met Lys Thr Thr Arg Ser Ile Ser Trp Pro Ser Thr Cys Trp His His

1 5 10 15

cag ccg agt tgc tca agc tgg gtg gca aat gag ttc agc cct cag gcc 96

Gln Pro Ser Cys Ser Ser Trp Val Ala Asn Glu Phe Ser Pro Gln Ala

20 25 30

ctc aaa ggg ttg gct ctg gct ggt ctg att gga tca gcc tgg ctg ctc 144

Leu Lys Gly Leu Ala Leu Ala Gly Leu Ile Gly Ser Ala Trp Leu Leu

35 40 45

tcc ctg ggc ctg agc tac acc ctg cca ctt gat cag acg cct ggg ctg 192

Ser Leu Gly Leu Ser Tyr Thr Leu Pro Leu Asp Gln Thr Pro Gly Leu

50 55 60

ttg att ggc agc ttg att ctg tgg cag acc ttt ctg cac acc ggg ctg 240

Leu Ile Gly Ser Leu Ile Leu Trp Gln Thr Phe Leu His Thr Gly Leu

65 70 75 80

ttc atc gtt gcc cac gat tcc atg cac gcc agt ctg gtt ccg ggt cat 288

Phe Ile Val Ala His Asp Ser Met His Ala Ser Leu Val Pro Gly His

85 90 95

ccc gga ttg aac cgc tgg atc ggc aaa gtg tat ttg ttg gtg tat gca 336

Pro Gly Leu Asn Arg Trp Ile Gly Lys Val Tyr Leu Leu Val Tyr Ala

100 105 110

ggc ttg tct tat gag cgt tgt tcc cgc aac cac aga cgt cat cac ctg 384

Gly Leu Ser Tyr Glu Arg Cys Ser Arg Asn His Arg Arg His His Leu

115 120 125

gca ccg gag acg ttc cag gat cct gac tac caa cgt tgc acc aat aac 432

Ala Pro Glu Thr Phe Gln Asp Pro Asp Tyr Gln Arg Cys Thr Asn Asn

130 135 140

aac atc cta gat tgg tat gtt cac ttc atg ggc aac tat ctg ggc atg 480

Asn Ile Leu Asp Trp Tyr Val His Phe Met Gly Asn Tyr Leu Gly Met

145 150 155 160

cgg caa ctg tta aat cta agc tgt ctt tgg ctg gcg cta atc att ctc 528

Arg Gln Leu Leu Asn Leu Ser Cys Leu Trp Leu Ala Leu Ile Ile Leu

165 170 175

aac ggt tct gat ctc cct gct cag atc atg cat ctg ctg ttg ttc agc 576

Asn Gly Ser Asp Leu Pro Ala Gln Ile Met His Leu Leu Leu Phe Ser

180 185 190

gtt ctg ccg ttg atc atc agt tcc tgt caa ttg ttt cta gtg gga acc 624

Val Leu Pro Leu Ile Ile Ser Ser Cys Gln Leu Phe Leu Val Gly Thr

195 200 205

tgg tta ccc cac cga cgt ggg gcc acg aca cga ccg ggc gtg aca acg 672

Trp Leu Pro His Arg Arg Gly Ala Thr Thr Arg Pro Gly Val Thr Thr

210 215 220

cgc agc ctg gct ttg cat cca gcc ctc tct ttc gca gct tgt tac aac 720

Arg Ser Leu Ala Leu His Pro Ala Leu Ser Phe Ala Ala Cys Tyr Asn

225 230 235 240

ttt ggc tat cat cgt gaa cat cat gaa tcg cct tcc aca ccc tgg ttt 768

Phe Gly Tyr His Arg Glu His His Glu Ser Pro Ser Thr Pro Trp Phe

245 250 255

cag ctg cca caa ctt cga aat gaa tca ttc act tga 804

Gln Leu Pro Gln Leu Arg Asn Glu Ser Phe Thr

260 265

<210>49

<211>267

<212>PRT

<213>人工变体

<400>49

Met Lys Thr Thr Arg Ser Ile Ser Trp Pro Ser Thr Cys Trp His His

1 5 10 15

Gln Pro Ser Cys Ser Ser Trp Val Ala Asn Glu Phe Ser Pro Gln Ala

20 25 30

Leu Lys Gly Leu Ala Leu Ala Gly Leu Ile Gly Ser Ala Trp Leu Leu

35 40 45

Ser Leu Gly Leu Ser Tyr Thr Leu Pro Leu Asp Gln Thr Pro Gly Leu

50 55 60

Leu Ile Gly Ser Leu Ile Leu Trp Gln Thr Phe Leu His Thr Gly Leu

65 70 75 80

Phe Ile Val Ala His Asp Ser Met His Ala Ser Leu Val Pro Gly His

85 90 95

Pro Gly Leu Asn Arg Trp Ile Gly Lys Val Tyr Leu Leu Val Tyr Ala

100 105 110

Gly Leu Ser Tyr Glu Arg Cys Ser Arg Asn His Arg Arg His His Leu

115 120 125

Ala Pro Glu Thr Phe Gln Asp Pro Asp Tyr Gln Arg Cys Thr Asn Asn

130 135 140

Asn Ile Leu Asp Trp Tyr Val His Phe Met Gly Asn Tyr Leu Gly Met

145 150 155 160

Arg Gln Leu Leu Asn Leu Ser Cys Leu Trp Leu Ala Leu Ile Ile Leu

165 170 175

Asn Gly Ser Asp Leu Pro Ala Gln Ile Met His Leu Leu Leu Phe Ser

180 185 190

Val Leu Pro Leu Ile Ile Ser Ser Cys Gln Leu Phe Leu Val Gly Thr

195 200 205

Trp Leu Pro His Arg Arg Gly Ala Thr Thr Arg Pro Gly Val Thr Thr

210 215 220

Arg Ser Leu Ala Leu His Pro Ala Leu Ser Phe Ala Ala Cys Tyr Asn

225 230 235 240

Phe Gly Tyr His Arg Glu His His Glu Ser Pro Ser Thr Pro Trp Phe

245 250 255

Gln Leu Pro Gln Leu Arg Asn Glu Ser Phe Thr

260 265

<210>50

<211>804

<212>DNA

<213>人工变体

<220>

<221>CDS

<222>(1)..(804)

<223>

<400>50

atg aaa acg aca aga tct att tcg tgg cca tcg act tgc tgg cat cac 48

Met Lys Thr Thr Arg Ser Ile Ser Trp Pro Ser Thr Cys Trp His His

1 5 10 15

cag ccg agt tgc tca agc tgg gtg gca aat gag ttc agc cct cag gcc 96

Gln Pro Ser Cys Ser Ser Trp Val Ala Asn Glu Phe Ser Pro Gln Ala

20 25 30

ctc aaa ggg ttg gct ctg gct ggt ctg att gga tca gcc tgg ctg ctc 144

Leu Lys Gly Leu Ala Leu Ala Gly Leu Ile Gly Ser Ala Trp Leu Leu

35 40 45

tcc ctg ggc ctg agc tac acc ctg cca ctt gat cag acg cct ggg ctg 192

Ser Leu Gly Leu Ser Tyr Thr Leu Pro Leu Asp Gln Thr Pro Gly Leu

50 55 60

ttg att ggc agc ttg att ctg ctc aga gca ttt ctg cac acc ggg ctg 240

Leu Ile Gly Ser Leu Ile Leu Leu Arg Ala Phe Leu His Thr Gly Leu

65 70 75 80

ttc atc gtt gcc cac gat tcc atg cac gcc agt ctg gtt ccg ggt cat 288

Phe Ile Val Ala His Asp Ser Met His Ala Ser Leu Val Pro Gly His

85 90 95

ccc gga ttg aac cgc tgg atc ggc aaa gtg tat ttg ttg gtg tat gca 336

Pro Gly Leu Asn Arg Trp Ile Gly Lys Val Tyr Leu Leu Val Tyr Ala

100 105 110

ggc ttg tct tat gag cgt tgt tcc cgc aac cac aga cgt cat cac gga 384

Gly Leu Ser Tyr Glu Arg Cys Ser Arg Asn His Arg Arg His His Gly

115 120 125

cat cct ggt act gat tta gat cct gac tac caa cgt tgc acc aat aac 432

His Pro Gly Thr Asp Leu Asp Pro Asp Tyr Gln Arg Cys Thr Asn Asn

130 135 140

aac atc cta gat tgg tat gtt cac ttc atg ggc aac tat ctg ggc atg 480

Asn Ile Leu Asp Trp Tyr Val His Phe Met Gly Asn Tyr Leu Gly Met

145 150 155 160

cgg caa ctg tta aat cta agc tgt ctt tgg ctg gcg cta atc att ctc 528

Arg Gln Leu Leu Asn Leu Ser Cys Leu Trp Leu Ala Leu Ile Ile Leu

165 170 175

aac ggt tct gat ctc cct gct cag atc atg cat ctg ctg ttg ttc agc 576

Asn Gly Ser Asp Leu Pro Ala Gln Ile Met His Leu Leu Leu Phe Ser

180 185 190

gtt ctg ccg ttg atc atc agt tcc tgt caa ttg ttt cta gtg gga acc 624

Val Leu Pro Leu Ile Ile Ser Ser Cys Gln Leu Phe Leu Val Gly Thr

195 200 205

tgg tta ccc cac cga cgt ggg gcc acg aca cga ccg ggc gtg aca acg 672

Trp Leu Pro His Arg Arg Gly Ala Thr Thr Arg Pro Gly Val Thr Thr

210 215 220

cgc agc ctg gct ttg cat cca gcc ctc tct ttc gca gct tgt tac aac 720

Arg Ser Leu Ala Leu His Pro Ala Leu Ser Phe Ala Ala Cys Tyr Asn

225 230 235 240

ttt ggc tat cat cgt gaa cat cat gaa tcg cct tcc aca ccc tgg ttt 768

Phe Gly Tyr His Arg Glu His His Glu Ser Pro Ser Thr Pro Trp Phe

245 250 255

cag ctg cca caa ctt cga aat gaa tca ttc act tga 804

Gln Leu Pro Gln Leu Arg Asn Glu Ser Phe Thr

260 265

<210>51

<211>267

<212>PRT

<213>人工变体

<400>51

Met Lys Thr Thr Arg Ser Ile Ser Trp Pro Ser Thr Cys Trp His His

1 5 10 15

Gln Pro Ser Cys Ser Ser Trp Val Ala Asn Glu Phe Ser Pro Gln Ala

20 25 30

Leu Lys Gly Leu Ala Leu Ala Gly Leu Ile Gly Ser Ala Trp Leu Leu

35 40 45

Ser Leu Gly Leu Ser Tyr Thr Leu Pro Leu Asp Gln Thr Pro Gly Leu

50 55 60

Leu Ile Gly Ser Leu Ile Leu Leu Arg Ala Phe Leu His Thr Gly Leu

65 70 75 80

Phe Ile Val Ala His Asp Ser Met His Ala Ser Leu Val Pro Gly His

85 90 95

Pro Gly Leu Asn Arg Trp Ile Gly Lys Val Tyr Leu Leu Val Tyr Ala

100 105 110

Gly Leu Ser Tyr Glu Arg Cys Ser Arg Asn His Arg Arg His His Gly

115 120 125

His Pro Gly Thr Asp Leu Asp Pro Asp Tyr Gln Arg Cys Thr Asn Asn

130 135 140

Asn Ile Leu Asp Trp Tyr Val His Phe Met Gly Asn Tyr Leu Gly Met

145 150 155 160

Arg Gln Leu Leu Asn Leu Ser Cys Leu Trp Leu Ala Leu Ile Ile Leu

165 170 175

Asn Gly Ser Asp Leu Pro Ala Gln Ile Met His Leu Leu Leu Phe Ser

180 185 190

Val Leu Pro Leu Ile Ile Ser Ser Cys Gln Leu Phe Leu Val Gly Thr

195 200 205

Trp Leu Pro His Arg Arg Gly Ala Thr Thr Arg Pro Gly Val Thr Thr

210 215 220

Arg Ser Leu Ala Leu His Pro Ala Leu Ser Phe Ala Ala Cys Tyr Asn

225 230 235 240

Phe Gly Tyr His Arg Glu His His Glu Ser Pro Ser Thr Pro Trp Phe

245 250 255

Gln Leu Pro Gln Leu Arg Asn Glu Ser Phe Thr

260 265

<210>52

<211>690

<212>DNA

<213>泡沫节球藻(Nodularia spumigena)NSOR10

<220>

<221>CDS

<222>(1)..(690)

<223>

<400>52

atg gcg atc gcc att att agt ata tgg gct atc agc cta ggt ttg tta 48

Met Ala Ile Ala Ile Ile Ser Ile Trp Ala Ile Ser Leu Gly Leu Leu

1 5 10 15

ctt tat att gat ata tcc caa ttc aag ttt tgg atg ttg tta ccg ctc 96

Leu Tyr Ile Asp Ile Ser Gln Phe Lys Phe Trp Met Leu Leu Pro Leu

20 25 30

ata ttt tgg caa aca ttt tta tat acg gga tta ttt att aca gct cat 144

Ile Phe Trp Gln Thr Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ala His

35 40 45

gat gcc atg cat ggg gta gtt ttt ccc aaa aat ccc aaa atc aac cat 192

Asp Ala Met His Gly Val Val Phe Pro Lys Asn Pro Lys Ile Asn His

50 55 60

ttc att ggc tca ttg tgc ctg ttt ctt tat ggt ctt tta cct tat caa 240

Phe Ile Gly Ser Leu Cys Leu Phe Leu Tyr Gly Leu Leu Pro Tyr Gln

65 70 75 80

aaa ctt tta aaa aag cat tgg cta cat cac cat aat cca gcc agt gaa 288

Lys Leu Leu Lys Lys His Trp Leu His His His Asn Pro Ala Ser Glu

85 90 95

aca gat cca gat ttt cac aac ggg aag cag aaa aac ttt ttt gct tgg 336

Thr Asp Pro Asp Phe His Asn Gly Lys Gln Lys Asn Phe Phe Ala Trp

100 105 110

tat tta tat ttt atg aag cgt tac tgg agt tgg tta caa att atc aca 384

Tyr Leu Tyr Phe Met Lys Arg Tyr Trp Ser Trp Leu Gln Ile Ile Thr

115 120 125

tta atg att att tat aac tta cta aaa tat ata tgg cat ttt cca gag 432

Leu Met Ile Ile Tyr Asn Leu Leu Lys Tyr Ile Trp His Phe Pro Glu

130 135 140

gat aat atg act tat ttt tgg gta gtt ccc tca att tta agt tct tta 480

Asp Asn Met Thr Tyr Phe Trp Val Val Pro Ser Ile Leu Ser Ser Leu

145 150 155 160

caa tta ttt tat ttt gga act ttt cta ccc cac agt gag cct gta gaa 528

Gln Leu Phe Tyr Phe Gly Thr Phe Leu Pro His Ser Glu Pro Val Glu

165 170 175

ggt tat aaa gag cct cat cgt tcc caa act att agc cgt ccc att tgg 576

Gly Tyr Lys Glu Pro His Arg Ser Gln Thr Ile Ser Arg Pro Ile Trp

180 185 190

tgg tca ttt ata act tgt tac cat ttt ggt tat cat tac gaa cat cat 624

Trp Ser Phe Ile Thr Cys Tyr His Phe Gly Tyr His Tyr Glu His His

195 200 205

gaa tac ccc cat gtt cct tgg tgg caa tta cca gaa att tat aaa atg 672

Glu Tyr Pro His Val Pro Trp Trp Gln Leu Pro Glu Ile Tyr Lys Met

210 215 220

tct aaa tca aat ttg tga 690

Ser Lys Ser Asn Leu

225

<210>53

<211>229

<212>PRT

<213>泡沫节球藻NSOR10

<400>53

Met Ala Ile Ala Ile Ile Ser Ile Trp Ala Ile Ser Leu Gly Leu Leu

1 5 10 15

Leu Tyr Ile Asp Ile Ser Gln Phe Lys Phe Trp Met Leu Leu Pro Leu

20 25 30

Ile Phe Trp Gln Thr Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ala His

35 40 45

Asp Ala Met His Gly Val Val Phe Pro Lys Asn Pro Lys Ile Asn His

50 55 60

Phe Ile Gly Ser Leu Cys Leu Phe Leu Tyr Gly Leu Leu Pro Tyr Gln

65 70 75 80

Lys Leu Leu Lys Lys His Trp Leu His His His Asn Pro Ala Ser Glu

85 90 95

Thr Asp Pro Asp Phe His Asn Gly Lys Gln Lys Asn Phe Phe Ala Trp

100 105 110

Tyr Leu Tyr Phe Met Lys Arg Tyr Trp Ser Trp Leu Gln Ile Ile Thr

115 120 125

Leu Met Ile Ile Tyr Asn Leu Leu Lys Tyr Ile Trp His Phe Pro Glu

130 135 140

Asp Asn Met Thr Tyr Phe Trp Val Val Pro Ser Ile Leu Ser Ser Leu

145 150 155 160

Gln Leu Phe Tyr Phe Gly Thr Phe Leu Pro His Ser Glu Pro Val Glu

165 170 175

Gly Tyr Lys Glu Pro His Arg Ser Gln Thr Ile Ser Arg Pro Ile Trp

180 185 190

Trp Ser Phe Ile Thr Cys Tyr His Phe Gly Tyr His Tyr Glu His His

195 200 205

Glu Tyr Pro His Val Pro Trp Trp Gln Leu Pro Glu Ile Tyr Lys Met

210 215 220

Ser Lys Ser Asn Leu

225

<210>54

<211>37

<212>DNA

<213>人工序列

<220>

<221>引物

<222>(1)..(37)

<223>

<400>54

gcgcatgcat ctagaaatga tccagttaga acaacca 37

<210>55

<211>37

<212>DNA

<213>人工序列

<220>

<221>引物

<222>(1)..(37)

<223>

<400>55

gcgcatgctc tagactattt tgctttgtaa atttctg 37

<210>56

<211>792

<212>DNA

<213>点形念珠藻ATCC 29133

<220>

<221>CDS

<222>(5)..(775)

<223>

<400>56

gcgc atg cat cta gaa atg atc cag tta gaa caa cca ctc agt cat caa 49

Met His Leu Glu Met Ile Gln Leu Glu Gln Pro Leu Ser His Gln

1 5 10 15

gca aaa ctg act cca gta ctg aga agt aaa tct cag ttt aag ggg ctt 97

Ala Lys Leu Thr Pro Val Leu Arg Ser Lys Ser Gln Phe Lys Gly Leu

20 25 30

ttc att gct att gtc att gtt agc gca tgg gtc att agc ctg agt tta 145

Phe Ile Ala Ile Val Ile Val Ser Ala Trp Val Ile Ser Leu Ser Leu

35 40 45

tta ctt tcc ctt gac atc tca aag cta aaa ttt tgg atg tta ttg cct 193

Leu Leu Ser Leu Asp Ile Ser Lys Leu Lys Phe Trp Met Leu Leu Pro

50 55 60

gtt ata cta tgg caa aca ttt tta tat acg gga tta ttt att aca tct 241

Val Ile Leu Trp Gln Thr Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ser

65 70 75

cat gat gcc atg cat ggc gta gta ttt ccc caa aac acc aag att aat 289

His Asp Ala Met His Gly Val Val Phe Pro Gln Asn Thr Lys Ile Asn

80 85 90 95

cat ttg att gga aca ttg acc cta tcc ctt tat ggt ctt tta cca tat 337

His Leu Ile Gly Thr Leu Thr Leu Ser Leu Tyr Gly Leu Leu Pro Tyr

100 105 110

caa aaa cta ttg aaa aaa cat tgg tta cac cac cac aat cca gca agc 385

Gln Lys Leu Leu Lys Lys His Trp Leu His His His Asn Pro Ala Ser

115 120 125

tca ata gac ccg gat ttt cac aat ggt aaa cac caa agt ttc ttt gct 433

Ser Ile Asp Pro Asp Phe His Asn Gly Lys His Gln Ser Phe Phe Ala

130 135 140

tgg tat ttt cat ttt atg aaa ggt tac tgg agt tgg ggg caa ata att 481

Trp Tyr Phe His Phe Met Lys Gly Tyr Trp Ser Trp Gly Gln Ile Ile

145 150 155

gcg ttg act att att tat aac ttt gct aaa tac ata ctc cat atc cca 529

Ala Leu Thr Ile Ile Tyr Asn Phe Ala Lys Tyr Ile Leu His Ile Pro

160 165 170 175

agt gat aat cta act tac ttt tgg gtg cta ccc tcg ctt tta agt tca 577

Ser Asp Asn Leu Thr Tyr Phe Trp Val Leu Pro Ser Leu Leu Ser Ser

180 185 190

tta caa tta ttc tat ttt ggt act ttt tta ccc cat agt gaa cca ata 625

Leu Gln Leu Phe Tyr Phe Gly Thr Phe Leu Pro His Ser Glu Pro Ile

195 200 205

ggg ggt tat gtt cag cct cat tgt gcc caa aca att agc cgt cct att 673

Gly Gly Tyr Val Gln Pro His Cys Ala Gln Thr Ile Ser Arg Pro Ile

210 215 220

tgg tgg tca ttt atc acg tgc tat cat ttt ggc tac cac gag gaa cat 72l

Trp Trp Ser Phe Ile Thr Cys Tyr His Phe Gly Tyr His Glu Glu His

225 230 235

cac gaa tat cct cat att tct tgg tgg cag tta cca gaa att tac aaa 769

His Glu Tyr Pro His Ile Ser Trp Trp Gln Leu Pro Glu Ile Tyr Lys

240 245 250 255

gca aaa tagtctagag catgcgc 792

Ala Lys

<210>57

<211>257

<212>PRT

<213>点形念珠藻ATCC 29133

<400>57

Met His Leu Glu Met Ile Gln Leu Glu Gln Pro Leu Ser His Gln Ala

1 5 10 15

Lys Leu Thr Pro Val Leu Arg Ser Lys Ser Gln Phe Lys Gly Leu Phe

20 25 30

Ile Ala Ile Val Ile Val Ser Ala Trp Val Ile Ser Leu Ser Leu Leu

35 40 45

Leu Ser Leu Asp Ile Ser Lys Leu Lys Phe Trp Met Leu Leu Pro Val

50 55 60

Ile Leu Trp Gln Thr Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ser His

65 70 75 80

Asp Ala Met His Gly Val Val Phe Pro Gln Asn Thr Lys Ile Asn His

85 90 95

Leu Ile Gly Thr Leu Thr Leu Ser Leu Tyr Gly Leu Leu Pro Tyr Gln

100 105 110

Lys Leu Leu Lys Lys His Trp Leu His His His Asn Pro Ala Ser Ser

115 120 125

Ile Asp Pro Asp Phe His Asn Gly Lys His Gln Ser Phe Phe Ala Trp

130 135 140

Tyr Phe His Phe Met Lys Gly Tyr Trp Ser Trp Gly Gln Ile Ile Ala

145 150 155 160

Leu Thr Ile Ile Tyr Asn Phe Ala Lys Tyr Ile Leu His Ile Pro Ser

165 170 175

Asp Asn Leu Thr Tyr Phe Trp Val Leu Pro Ser Leu Leu Ser Ser Leu

180 185 190

Gln Leu Phe Tyr Phe Gly Thr Phe Leu Pro His Ser Glu Pro Ile Gly

195 200 205

Gly Tyr Val Gln Pro His Cys Ala Gln Thr Ile Ser Arg Pro Ile Trp

210 215 220

Trp Ser Phe Ile Thr Cys Tyr His Phe Gly Tyr His Glu Glu His His

225 230 235 240

Glu Tyr Pro His Ile Ser Trp Trp Gln Leu Pro Glu Ile Tyr Lys Ala

245 250 255

Lys

<210>58

<211>26

<212>DNA

<213>人工序列

<220>

<221>引物

<222>(1)..(26)

<223>

<400>58

gtcgaccctg ctttaatgag atatgc 26

<210>59

<211>27

<212>DNA

<213>人工序列

<220>

<221>引物

<222>(1)..(27)

<223>

<400>59

ctcgagcttg gacaatcagt aaattga 27

<210>60

<211>210

<212>DNA

<213>根癌农杆菌(Agrobacterium tumefaciens)

<220>

<221>终止子

<222>(1)..(210)

<223>

<400>60

gtcgaccctg ctttaatgag atatgcgaga cgcctatgat cgcatgatat ttgctttcaa 60

ttctgttgtg cacgttgtaa aaaacctgag catgtgtagc tcagatcctt accgccggtt 120

tcggttcatt ctaatgaata tatcacccgt tactatcgta tttttatgaa taatattctc 180

cgttcaattt actgattgtc caagctcgag 210

<210>61

<211>37

<212>DNA

<213>人工序列

<220>

<221>引物

<222>(1)..(37)

<223>

<400>61

cccgggaatt cttcattatt tcgattttga tttcgtg 37

<210>62

<211>38

<212>DNA

<213>人工序列

<220>

<221>引物

<222>(1)..(38)

<223>

<400>62

aagcttggtt gatcagaaga agaagaagaa gatgaact 38

<210>63

<211>652

<212>DNA

<213>拟南芥

<220>

<221>启动子

<222>(1)..(652)

<223>

<400>63

cccgggaatt cttcattatt tcgattttga tttcgtgacc agcgaacgca gaataccttg 60

ttgtgtaata ctttacccgt gtaaatcaaa aacaaaaagg cttttgagct ttttgtagtt 120

gaatttctct ggctgatctt ttctgtacag attcatatat ctgcagagac gatatcattg 180

attatttgag cttcttttga actatttcgt gtaatttggg atgagagctc tatgtatgtg 240

tgtaaacttt gaagacaaca agaaaggtaa caagtgaggg agggatgact ccatgtcaaa 300

atagatgtca taagaggccc atcaataagt gcttgagccc attagctagc ccagtaacta 360

ccagattgtg agatggatgt gtgaacagtt ttttttttga tgtaggactg aaatgtgaac 420

aacaggcgca tgaaaggcta aattaggaca atgataagca gaaataactt atcctctcta 480

acacttggcc tcacattgcc cttcacacaa tccacacaca tccaatcaca acctcatcat 540

atatctcccg ctaatctttt tttctttgat cttttttttt ttgcttatta tttttttgac 600

tttgatctcc catcagttca tcttcttctt cttcttctga tcaaccaagc tt 652

<210>64

<211>29

<212>DNA

<213>人工序列

<220>

<221>引物

<222>(1)..(29)

<223>

<400>64

gagctctagc gcaatcttat gtggtacaa 29

<210>65

<211>29

<212>DNA

<213>人工序列

<220>

<221>引物

<222>(1)..(29)

<223>

<400>65

aagcttttct tgaaagtaaa gattgagtc 29

<210>66

<211>1773

<212>DNA

<213>碧冬茄(Petunia hybrida)

<220>

<221>启动子

<222>(1)..(1773)

<223>

<400>66

gagctctagc gcaatcttat gtggtacaaa tcttgattag tcgggaaaaa atgatgtggc 60

cctacaaatg gttggaggat gggagatttg gctctatcta gagttatgtg gttgttgaag 120

catttggtta ctctctgctg tggtagttgg catatccaca ttgtctcctt ccacttttat 180

gacaattacg tgaaagttat gggttgtttt gtctattttt gtcgaggcct ttcttttcct 240

tccaggttgt tgaagatggt ccaattcgat tagaataatg ttttgagctt tagcatattc 300

tctctcgttt acacgattat agtaataatg atataggatg acagaagttg acacataaat 360

tttttattct ctccatttac tttaatccaa atctcaccta ccctaaactt ctttaatatg 420

tattcaatag tctatccgag taaattgtaa atttaacaac cattgataat attgacacct 480

actaacatat actagtaaag agaatattaa catggcacat ataatttgat gcaaaatgag 540

tatgatgaaa tttaaaccca aaatctcttg attttgacag tgtcaccttg acttgttaac 600

taataagtca tgttttagtg gcagaaagac aaactcatcc accaactgta tagcaataaa 660

aaatagaaga atcttcctga ggcaaagttt tggaaaaatt aagagtggct gagatttaat 720

ttcaacagga attagttcca cttaactttt aggttacgat acagtgctaa ttaaataact 780

taattgtatt agatatttct tgcacctaaa aaatttaaaa actgaaaaaa ggtagcaatc 840

aaaataaaca aaaggacaaa ataagtgaaa ggtacagcca ccaaccctgg cggctcactg 900

tttgttggtt aaaacgtaga cttacaccta ccaaaatcta caactaaaat gaggcaataa 960

tactttgccc aaaattacca agaaaagaaa aagaaaggaa tcccttaata ttactctcct 1020

ccatttcaca ataaatatcc tagtttgact taaattagag tttaaaaaat gaaagacgac 1080

ttttaaaact tgtaatctaa aataaatcat agttaaatgt gtggctataa atcattgtat 1140

taacggtaaa gtggtaagtt taaaagttaa ttgttttcaa atataaaatt gtactatcat 1200

tctttttgga atggactaat aagaaaacta tgacatccat tatggagcgg agggagtatc 1260

tccttttaac aataaccttt gtcccttcaa ttcaattatc agtatgcaaa cattaaaaat 1320

tattattgat gttaagtacc acatcatcct taatgataga atcatcgtag aacgcttttc 1380

caggcacaca ttcaaactag ttagaccagt accacacatc gaatattcca gacttctttg 1440

tttgaatagt cgactacatt ggataatgga acttctcgaa ttaacttcga attagtcgag 1500

cccaaaataa tatatacgtc gggtggaaaa ctataaaatg tttgacaaaa atgtcaaatt 1560

aatatatcaa tctgcaacaa ccttttcacc ttgagaacac agctgaaatt ttttacaaag 1620

gtagttggtg aagctagtca gcgaatccca ttaccttcca ctctacctaa cccccttcac 1680

caacaacaaa tttctgtaat ttaaaaacta gccaaaaaag aactctcttt tacaaagagc 1740

caaagactca atctttactt tcaagaaaag ctt 1773

<210>67

<211>39

<212>DNA

<213>人工序列

<220>

<221>引物

<222>(1)..(39)

<223>

<400>67

gcgcatgcat ctagaaatga atttttgtga taaaccagt 39

<210>68

<211>37

<212>DNA

<213>人工序列

<220>

<221>引物

<222>(1)..(37)

<223>

<400>68

gcgcatgctc tagattacga attggttact gaattgt 37

<210>69

<211>819

<212>DNA

<213>点形念珠藻ATCC 29133

<220>

<221>CDS

<222>(5)..(802)

<223>

<400>69

gcgc atg cat cta gaa atg aat ttt tgt gat aaa cca gtt agc tat tat 49

Met His Leu Glu Met Asn Phe Cys Asp Lys Pro Val Ser Tyr Tyr

1 5 10 15

gtt gca ata gag caa tta agt gct aaa gaa gat act gtt tgg ggg ctg 97

Val Ala Ile Glu Gln Leu Ser Ala Lys Glu Asp Thr Val Trp Gly Leu

20 25 30

gtg att gtc ata gta att att agt ctt tgg gta gct agt ttg gct ttt 145

Val Ile Val Ile Val Ile Ile Ser Leu Trp Val Ala Ser Leu Ala Phe

35 40 45

tta cta gct att aat tat gcc aaa gtc cca att tgg ttg ata cct att 193

Leu Leu Ala Ile Asn Tyr Ala Lys Val Pro Ile Trp Leu Ile Pro Ile

50 55 60

gca ata gtt tgg caa atg ttc ctt tat aca ggg cta ttt att act gca 241

Ala Ile Val Trp Gln Met Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ala

65 70 75

cat gat gct atg cat ggg tca gtt tat cgt aaa aat ccc aaa att aat 289

His Asp Ala Met His Gly Ser Val Tyr Arg Lys Asn Pro Lys Ile Asn

80 85 90 95

aat ttt atc ggt tca cta gct gta gcg ctt tac gct gtg ttt cca tat 337

Asn Phe Ile Gly Ser Leu Ala Val Ala Leu Tyr Ala Val Phe Pro Tyr

100 105 110

caa cag atg tta aag aat cat tgc tta cat cat cgt cat cct gct agc 385

Gln Gln Met Leu Lys Asn His Cys Leu His His Arg His Pro Ala Ser

115 120 125

gaa gtt gac cca gat ttt cat gat ggt aag aga aca aac gct att ttc 433

Glu Val Asp Pro Asp Phe His Asp Gly Lys Arg Thr Asn Ala Ile Phe

130 135 140

tgg tat ctc cat ttc atg ata gaa tac tcc agt tgg caa cag tta ata 481

Trp Tyr Leu His Phe Met Ile Glu Tyr Ser Ser Trp Gln Gln Leu Ile

145 150 155

gta cta act atc cta ttt aat tta gct aaa tac gtt ttg cac atc cat 529

Val Leu Thr Ile Leu Phe Asn Leu Ala Lys Tyr Val Leu His Ile His

160 165 170 175

caa ata aat ctc atc tta ttt tgg agt att cct cca att tta agt tcc 577

Gln Ile Asn Leu Ile Leu Phe Trp Ser Ile Pro Pro Ile Leu Ser Ser

180 185 190

att caa ctg ttt tat ttc gga aca ttt ttg cct cat cga gaa ccc aag 625

Ile Gln Leu Phe Tyr Phe Gly Thr Phe Leu Pro His Arg Glu Pro Lys

195 200 205

aaa gga tat gtt tat ccc cat tgc agc caa aca ata aaa ttg cca act 673

Lys Gly Tyr Val Tyr Pro His Cys Ser Gln Thr Ile Lys Leu Pro Thr

210 215 220

ttt ttg tca ttt atc gct tgc tac cac ttt ggt tat cat gaa gaa cat 721

Phe Leu Ser Phe Ile Ala Cys Tyr His Phe Gly Tyr His Glu Glu His

225 230 235

cat gag tat ccc cat gta cct tgg tgg caa ctt cca tct gta tat aag 769

His Glu Tyr Pro His Val Pro Trp Trp Gln Leu Pro Ser Val Tyr Lys

240 245 250 255

cag aga gta ttc aac aat tca gta acc aat tcg taatctagag catgcgc 819

Gln Arg Val Phe Asn Asn Ser Val Thr Asn Ser

260 265

<210>70

<211>266

<212>PRT

<213>点形念珠藻ATCC 29133

<400>70

Met His Leu Glu Met Asn Phe Cys Asp Lys Pro Val Ser Tyr Tyr Val

1 5 10 15

Ala Ile Glu Gln Leu Ser Ala Lys Glu Asp Thr Val Trp Gly Leu Val

20 25 30

Ile Val Ile Val Ile Ile Ser Leu Trp Val Ala Ser Leu Ala Phe Leu

35 40 45

Leu Ala Ile Asn Tyr Ala Lys Val Pro Ile Trp Leu Ile Pro Ile Ala

50 55 60

Ile Val Trp Gln Met Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ala His

65 70 75 80

Asp Ala Met His Gly Ser Val Tyr Arg Lys Asn Pro Lys Ile Asn Asn

85 90 95

Phe Ile Gly Ser Leu Ala Val Ala Leu Tyr Ala Val Phe Pro Tyr Gln

100 105 110

Gln Met Leu Lys Asn His Cys Leu His His Arg His Pro Ala Ser Glu

115 120 125

Val Asp Pro Asp Phe His Asp Gly Lys Arg Thr Asn Ala Ile Phe Trp

130 135 140

Tyr Leu His Phe Met Ile Glu Tyr Ser Ser Trp Gln Gln Leu Ile Val

145 150 155 160

Leu Thr Ile Leu Phe Asn Leu Ala Lys Tyr Val Leu His Ile His Gln

165 170 175

Ile Asn Leu Ile Leu Phe Trp Ser Ile Pro Pro Ile Leu Ser Ser Ile

180 185 190

Gln Leu Phe Tyr Phe Gly Thr Phe Leu Pro His Arg Glu Pro Lys Lys

195 200 205

Gly Tyr Val Tyr Pro His Cys Ser Gln Thr Ile Lys Leu Pro Thr Phe

210 215 220

Leu Ser Phe Ile Ala Cys Tyr His Phe Gly Tyr His Glu Glu His His

225 230 235 240

Glu Tyr Pro His Val Pro Trp Trp Gln Leu Pro Ser Val Tyr Lys Gln

245 250 255

Arg Val Phe Asn Asn Ser Val Thr Asn Ser

260 265

<210>71

<211>33

<212>DNA

<213>人工序列

<220>

<221>引物

<222>(1)..(33)

<223>

<400>71

gcgcatgcat ctagaaatgg cgatcgccat tat 33

<210>72

<211>32

<212>DNA

<213>人工序列

<220>

<221>引物

<222>(1)..(32)

<223>

<400>72

gcgcatgctc tagatcacaa atttgattta ga 32

<210>73

<211>720

<212>DNA

<213>泡沫节球藻NSOR10

<220>

<221>CDS

<222>(5)..(703)

<223>

<400>73

gcgc atg cat cta gaa atg gcg atc gcc att att agt ata tgg gct atc 49

Met His Leu Glu Met Ala Ile Ala Ile Ile Ser Ile Trp Ala Ile

1 5 10 15

agc cta ggt ttg tta ctt tat att gat ata tcc caa ttc aag ttt tgg 97

Ser Leu Gly Leu Leu Leu Tyr Ile Asp Ile Ser Gln Phe Lys Phe Trp

20 25 30

atg ttg tta ccg ctc ata ttt tgg caa aca ttt tta tat acg gga tta 145

Met Leu Leu Pro Leu Ile Phe Trp Gln Thr Phe Leu Tyr Thr Gly Leu

35 40 45

ttt att aca gct cat gat gcc atg cat ggg gta gtt ttt ccc aaa aat 193

Phe Ile Thr Ala His Asp Ala Met His Gly Val Val Phe Pro Lys Asn

50 55 60

ccc aaa atc aac cat ttc att ggc tca ttg tgc ctg ttt ctt tat ggt 241

Pro Lys Ile Asn His Phe Ile Gly Ser Leu Cys Leu Phe Leu Tyr Gly

65 70 75

ctt tta cct tat caa aaa ctt tta aaa aag cat tgg cta cat cac cat 289

Leu Leu Pro Tyr Gln Lys Leu Leu Lys Lys His Trp Leu His His His

80 85 90 95

aat cca gcc agt gaa aca gat cca gat ttt cac aac ggg aag cag aaa 337

Asn Pro Ala Ser Glu Thr Asp Pro Asp Phe His Asn Gly Lys Gln Lys

100 105 110

aac ttt ttt gct tgg tat tta tat ttt atg aag cgt tac tgg agt tgg 385

Asn Phe Phe Ala Trp Tyr Leu Tyr Phe Met Lys Arg Tyr Trp Ser Trp

115 120 125

tta caa att atc aca tta atg att att tat aac tta cta aaa tat ata 433

Leu Gln Ile Ile Thr Leu Met Ile Ile Tyr Asn Leu Leu Lys Tyr Ile

130 135 140

tgg cat ttt cca gag gat aat atg act tat ttt tgg gta gtt ccc tca 481

Trp His Phe Pro Glu Asp Asn Met Thr Tyr Phe Trp Val Val Pro Ser

145 150 155

att tta agt tct tta caa tta ttt tat ttt gga act ttt cta ccc cac 529

Ile Leu Ser Ser Leu Gln Leu Phe Tyr Phe Gly Thr Phe Leu Pro His

160 165 170 175

agt gag cct gta gaa ggt tat aaa gag cct cat cgt tcc caa act att 577

Ser Glu Pro Val Glu Gly Tyr Lys Glu Pro His Arg Ser Gln Thr Ile

180 185 190

agc cgt ccc att tgg tgg tca ttt ata act tgt tac cat ttt ggt tat 625

Ser Arg Pro Ile Trp Trp Ser Phe Ile Thr Cys Tyr His Phe Gly Tyr

195 200 205

cat tac gaa cat cat gaa tac ccc cat gtt cct tgg tgg caa tta cca 673

His Tyr Glu His His Glu Tyr Pro His Val Pro Trp Trp Gln Leu Pro

210 215 220

gaa att tat aaa atg tct aaa tca aat ttg tgatctagag catgcgc 720

Glu Ile Tyr Lys Met Ser Lys Ser Asn Leu

225 230

<210>74

<211>233

<212>PRT

<213>泡沫节球藻NSOR10

<400>74

Met His Leu Glu Met Ala Ile Ala Ile Ile Ser Ile Trp Ala Ile Ser

1 5 10 15

Leu Gly Leu Leu Leu Tyr Ile Asp Ile Ser Gln Phe Lys Phe Trp Met

20 25 30

Leu Leu Pro Leu Ile Phe Trp Gln Thr Phe Leu Tyr Thr Gly Leu Phe

35 40 45

Ile Thr Ala His Asp Ala Met His Gly Val Val Phe Pro Lys Asn Pro

50 55 60

Lys Ile Asn His Phe Ile Gly Ser Leu Cys Leu Phe Leu Tyr Gly Leu

65 70 75 80

Leu Pro Tyr Gln Lys Leu Leu Lys Lys His Trp Leu His His His Asn

85 90 95

Pro Ala Ser Glu Thr Asp Pro Asp Phe His Asn Gly Lys Gln Lys Asn

100 105 110

Phe Phe Ala Trp Tyr Leu Tyr Phe Met Lys Arg Tyr Trp Ser Trp Leu

115 120 125

Gln Ile Ile Thr Leu Met Ile Ile Tyr Asn Leu Leu Lys Tyr Ile Trp

130 135 140

His Phe Pro Glu Asp Asn Met Thr Tyr Phe Trp Val Val Pro Ser Ile

145 150 155 160

Leu Ser Ser Leu Gln Leu Phe Tyr Phe Gly Thr Phe Leu Pro His Ser

165 170 175

Glu Pro Val Glu Gly Tyr Lys Glu Pro His Arg Ser Gln Thr Ile Ser

180 185 190

Arg Pro Ile Trp Trp Ser Phe Ile Thr Cys Tyr His Phe Gly Tyr His

195 200 205

Tyr Glu His His Glu Tyr Pro His Val Pro Trp Trp Gln Leu Pro Glu

210 215 220

Ile Tyr Lys Met Ser Lys Ser Asn Leu

225 230

Claims

1.通过培养遗传修饰的生物制备酮类胡萝卜素的方法，所述遗传修饰的生物与野生型相比具有改变的酮酶活力，此改变的酮酶活力由含有SEQ.ID.NO.2氨基酸序列或对SEQ.ID.NO.2序列进行置换、插入或缺失氨基酸后产生的与SEQ.ID.NO.2序列在氨基酸水平上具有至少42％一致性的序列的酮酶引起。

2.权利要求1的方法，其中使用作为野生型已经具有酮酶活力而遗传修饰使得相对于野生型而言酮酶活力增加的生物。

3.权利要求1的方法，其中相比于野生型，通过增加编码酮酶的核酸的基因表达来增强酮酶活力，其中所述酮酶含有SEQ.ID.NO.2氨基酸序列或对SEQ.ID.NO.2序列进行置换、插入或缺失氨基酸后产生的与SEQ.ID.NO.2序列在氨基酸水平上具有至少42％一致性的序列。

4.权利要求3的方法，其中相比于野生型，通过向生物引入编码酮酶的核酸来增强酮酶活力，所述酮酶含有SEQ.ID.NO.2氨基酸序列或对SEQ.ID.NO.2序列进行置换、插入或缺失氨基酸后产生的与SEQ.ID.NO.2序列在氨基酸水平上具有至少42％一致性的序列。

5.权利要求1的方法，其中使用作为野生型不具有酮酶活力的生物，而相对于此野生型而言遗传修饰造成酮酶活力。

6.权利要求5的方法，其中使用遗传修饰的生物，所述生物转基因表达含有SEQ.ID.NO.2氨基酸序列或对SEQ.ID.NO.2序列进行置换、插入或缺失氨基酸后产生的与SEQ.ID.NO.2序列在氨基酸水平上具有至少42％一致性的序列的酮酶。

7.权利要求5或6的方法，其中通过向生物引入编码酮酶的核酸造成基因表达，所述酮酶含有SEQ.ID.NO.2氨基酸序列或对SEQ.ID.NO.2序列进行置换、插入或缺失氨基酸后产生的与SEQ.ID.NO.2序列在氨基酸水平上具有至少42％一致性的序列。

8.权利要求5或7的方法，其中引入含有SEQ.ID.NO.1序列的核酸。

9.权利要求1到8之任一项的方法，其中所述生物相比于野生型还具有增加的至少一种选自羟化酶活力和β-环化酶活力的活力。

10.权利要求9的方法，其中为了额外增加至少一种所述活力，相比于野生型而言增加至少一种选自编码羟化酶的核酸和编码β-环化酶的核酸的核酸的基因表达。

11.权利要求10的方法，其中通过向生物引入至少一种核酸来增加基因表达，所述核酸选自编码羟化酶的核酸和编码β-环化酶的核酸。

12.权利要求11的方法，其中引入编码含有SEQ ID NO：16氨基酸序列或对SEQ ID NO：16序列进行置换、插入或缺失氨基酸后产生的与SEQID NO：16序列在氨基酸水平上具有至少20％一致性的序列的羟化酶的核酸作为编码羟化酶的核酸。

13.权利要求12的方法，其中引入含有SEQ ID NO：15序列的核酸。

14.权利要求11的方法，其中引入编码含有SEQ.ID.NO：18氨基酸序列或对SEQ.ID.NO：18序列进行置换、插入或缺失氨基酸后产生的与SEQ ID NO：18序列在氨基酸水平上具有至少20％一致性的序列的β-环化酶的核酸作为编码β-环化酶的核酸。

15.权利要求14的方法，其中引入含有SEQ ID NO：17序列的核酸。

16.权利要求1到15中任一项的方法，其中在培养后收获遗传修饰的生物，并随后从生物中分离酮类胡萝卜素。

17.权利要求1到16中任一项的方法，其中使用作为起始生物能够天然产生类胡萝卜素或通过遗传互补或代谢途径的调节而产生类胡萝卜素的生物。

18.权利要求1到17中任一项的方法，其中使用的生物是微生物或植物。

19.权利要求18的方法，其中使用的微生物是细菌、酵母、藻类或真菌。

20.权利要求19的方法，其中微生物选自埃希氏杆菌属、欧文氏菌属、农杆菌属、黄杆菌属、产碱菌属、副球菌属、念珠藻属、集胞藻属蓝细菌、假丝酵母属、酵母属、汉逊酵母属、法夫酵母属、毕赤酵母属、曲霉属、木霉属、阿舒囊霉属、脉孢菌属、布拉霉属、须霉属、镰孢霉属、红球藻属、三角褐指藻、团藻属和杜氏藻属。

21.权利要求18的方法，其中使用的生物是植物。

22.权利要求21的方法，其中使用选自毛茛科、小檗科、罂粟科、大麻科、蔷薇科、Fabaceae、亚麻科、葡萄科、十字花科、葫芦科、报春花科、石竹科、苋科、龙胆科、牻牛儿苗科、忍冬科、木犀科、旱金莲科、茄科、玄参科、菊科、百合科、石蒜科、禾本科、兰科、锦葵科、Illiaceae和唇形科的植物。

23.权利要求22的方法，其中使用选自万寿菊属、万寿菊、孔雀草、金合欢属、乌头属、侧金盏花属、阿尼菊属、耧斗菜属、紫菀属、黄芪属、紫葳属、金盏花属、驴蹄草属、风铃草属、美人蕉属、矢车菊属、桂竹香属、茼蒿属、柑桔属、还阳参属、番红花属、南瓜属、金雀儿属、Delonia属、翠雀属、石竹属、康乃馨属、多榔菊属、花菱草属、连翘属、Fremontia属、勋章菊属、钩吻属、染料木属、龙胆属、老鹳草属、非洲菊属、路边青属、银桦属、堆心菊属、向日葵属、细辛属、独活属、木槿属、赛菊芋属、金丝桃属、黄金菊属、凤仙花属、鸢尾属、蓝花楹属、棣堂属、毒豆属、山黧豆属、猫耳草属、百合属、亚麻属、百脉根属、番茄属、珍珠菜属、Maratia、苜蓿属、沟酸浆属、水仙属、月见草属、木犀属、碧冬茄属、石楠属、酸浆属、牧根草属、委陵草属、火棘属、毛茛属、杜鹃花属、蔷薇属、金光菊属、千里光属、蝇子草属、松香草属、Sinapsis、花楸属、鹰爪豆属、黄钟花属、蝴蝶草属、婆罗们参属、金莲花属、旱金莲属、郁金香属、款冬属、荆豆属、堇菜属或百日草属的植物。

24.权利要求1到23中任一项的方法，其中酮类胡萝卜素选自虾青素、角黄素、海胆酮、3-羟基海胆酮、3’-羟基海胆酮、adonirubin和金盏花黄质。

25.遗传修饰的生物，其中遗传修饰：

并且在A中增加的或在B中造成的酮酶活力是由含有SEQ.ID.NO.2氨基酸序列或对SEQ.ID.NO.2序列进行置换、插入或缺失氨基酸后产生的与SEQ ID NO：2序列在氨基酸水平上具有至少42％一致性的序列的酮酶引起的。

26.如权利要求25的遗传修饰生物，其中酮酶活力的增加或造成是通过相比于野生型，增加或造成编码酮酶的核酸的基因表达来实现的，其中所述核酸编码的酮酶含有SEQ.ID.NO.2氨基酸序列或对SEQ.ID.NO.2序列进行置换、插入或缺失氨基酸后产生的与SEQ.ID.NO.2序列在氨基酸水平上具有至少42％一致性的序列。

27.如权利要求26的遗传修饰生物，其中向生物引入编码酮酶的核酸来增加或造成该基因表达，所述酮酶含有SEQ.ID.NO.2氨基酸序列或对SEQ.ID.NO.2序列进行置换、插入或缺失氨基酸后产生的与SEQ.ID.NO.2序列在氨基酸水平上具有至少42％一致性的序列。

28.含有至少一个转基因核酸的遗传修饰的生物，所述核酸编码含有SEQ.ID.NO.2氨基酸序列或对SEQ.ID.NO.2序列进行置换、插入或缺失氨基酸后产生的与SEQ.ID.NO.2序列在氨基酸水平上具有至少42％一致性的序列的酮酶。

29.含有至少两个编码酮酶的内源核酸的遗传修饰的生物，所述核酸编码含有SEQ.ID.NO.2氨基酸序列或对SEQ.ID.NO.2序列进行置换、插入或缺失氨基酸后产生的与SEQ.ID.NO.2序列在氨基酸水平上具有至少42％一致性的序列的酮酶。

30.如权利要求25到29中任一项的遗传修饰的生物，其中相比于野生型，遗传修饰还使至少一种选自羟化酶活力和β-环化酶活力的活力增加。

31.如权利要求25到30中任一项的遗传修饰的生物，其中作为起始生物时所述生物已能够天然产生类胡萝卜素或通过遗传互补来产生类胡萝卜素。

32.如权利要求25到31中任一项的遗传修饰的生物，其中所述生物选自微生物和植物。

33.权利要求32的遗传修饰的生物，其中微生物选自细菌、酵母、藻类和真菌。

34.权利要求33的遗传修饰的微生物，其中所述微生物选自埃希氏杆菌属、欧文氏菌属、农杆菌属、黄杆菌属、产碱菌属、副球菌属、念珠藻属、集胞藻属蓝细菌、假丝酵母属、酵母属、汉逊酵母属、毕赤酵母属、曲霉属、木霉属、阿舒囊霉属、脉孢菌属、布拉霉属、须霉属、镰孢霉属、红球藻属、三角褐指藻、团藻属和杜氏藻属。

35.权利要求32的遗传修饰的植物，其中所述植物选自毛茛科、小檗科、罂粟科、大麻科、蔷薇科、Fabaceae、亚麻科、葡萄科、十字花科、葫芦科、报春花科、石竹科、苋科、龙胆科、牻牛儿苗科、忍冬科、木犀科、旱金莲科、茄科、玄参科、菊科、百合科、石蒜科、禾本科、兰科、锦葵科、Illiaceae和唇形科。

36.权利要求35的遗传修饰的植物，其中所述植物选自万寿菊属、万寿菊、孔雀草、金合欢属、乌头属、侧金盏花属、阿尼菊属、耧斗菜属、紫菀属、黄芪属、紫葳属、金盏花属、驴蹄草属、风铃草属、美人蕉属、矢车菊属、桂竹香属、茼蒿属、柑桔属、还阳参属、番红花属、南瓜属、金雀儿属、Delonia属、翠雀属、石竹属、康乃馨属、多榔菊属、花菱草属、连翘属、Fremontia属、勋章菊属、钩吻属、染料木属、龙胆属、老鹳草属、非洲菊属、路边青属、银桦属、堆心菊属、向日葵属、细辛属、独活属、木槿属、赛菊芋属、金丝桃属、黄金菊属、凤仙花属、鸢尾属、蓝花楹属、棣堂属、毒豆属、山黧豆属、猫耳草属、百合属、亚麻属、百脉根属、番茄属、珍珠菜属、Maratia、苜蓿属、沟酸浆属、水仙属、月见草属、木犀属、碧冬茄属、石楠属、酸浆属、牧根草属、委陵草属、火棘属、毛茛属、杜鹃花属、蔷薇属、金光菊属、千里光属、蝇子草属、松香草属、Sinapsis、花楸属、鹰爪豆属、黄钟花属、蝴蝶草属、婆罗们参属、金莲花属、旱金莲属、郁金香属、款冬属、荆豆属、堇菜属和百日草属植物。

37.如权利要求25到36中任一项的遗传修饰的生物作为动物或人类食品的用途。

38.如权利要求25到36中任一项的遗传修饰的生物在生产含有酮类胡萝卜素的提取物或生产动物和人类食品增补剂中的用途。

39.一种酮酶，其含有SEQ.ID.NO.8的氨基酸序列或含有对SEQ.ID.NO.8序列进行置换、插入或缺失氨基酸后产生的与SEQ.ID.NO.8序列在氨基酸水平上具有至少70％一致性的序列，条件是SEQ.ID NO.4氨基酸序列不存在。

40.一种酮酶，其含有SEQ.ID.NO.6的氨基酸序列或含有对SEQ.ID.NO.6序列进行置换、插入或缺失氨基酸后产生的与SEQ.ID.NO.6序列在氨基酸水平上具有至少70％一致性的序列。

41.一种酮酶，其含有SEQ ID NO.12的氨基酸序列或含有对SEQ IDNO.12序列进行置换、插入或缺失氨基酸后产生的与SEQ ID NO.12序列在氨基酸水平上具有至少70％一致性的序列，条件是SEQ ID NO.6氨基酸序列不存在。

42.一种酮酶，其含有SEQ ID NO.49的氨基酸序列或含有对SEQ IDNO.49序列进行置换、插入或缺失氨基酸后产生的与SEQ ID NO.49序列在氨基酸水平上具有至少50％一致性的序列，条件是SEQ ID NO.47氨基酸序列不存在。

43.编码权利要求39到42中任一项的蛋白质的核酸，条件是SEQ IDNO：5序列不存在。

44.含有SEQ.ID.NO.4的氨基酸序列或对SEQ.ID.NO.4序列进行置换、插入或缺失氨基酸后产生的与SEQ.ID.NO.4序列在氨基酸水平上具有至少70％一致性并具有酮酶性质的序列的蛋白质作为酮酶的用途。

45.含有SEQ.ID.NO.6氨基酸序列或对SEQ.ID.NO.6序列进行置换、插入或缺失氨基酸后产生的与SEQ.ID.NO.6序列在氨基酸水平上具有至少65％一致性并具有酮酶性质的序列的蛋白质作为酮酶的用途。

46.含有SEQ ID NO.47氨基酸序列或对SEQ ID NO.47序列进行置换、插入或缺失氨基酸后产生的与SEQ ID NO.47序列在氨基酸水平上具有至少50％一致性并具有酮酶性质的序列的蛋白质作为酮酶的用途。