CN1863922A - 在遗传修饰的非人生物中制备酮类胡萝卜素的方法 - Google Patents

在遗传修饰的非人生物中制备酮类胡萝卜素的方法 Download PDF

Info

Publication number
CN1863922A
CN1863922A CNA2004800290687A CN200480029068A CN1863922A CN 1863922 A CN1863922 A CN 1863922A CN A2004800290687 A CNA2004800290687 A CN A2004800290687A CN 200480029068 A CN200480029068 A CN 200480029068A CN 1863922 A CN1863922 A CN 1863922A
Authority
CN
China
Prior art keywords
sequence
nucleic acid
coding
seq
activity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2004800290687A
Other languages
English (en)
Inventor
R·弗拉赫曼
C·R·朔普费尔
K·赫伯斯
I·孔策
M·绍尔
M·克勒布萨特尔
T·卢克
D·弗斯特
A-M·皮菲弗尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SunGene GmbH
Original Assignee
SunGene GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from PCT/EP2003/009102 external-priority patent/WO2004018693A2/de
Application filed by SunGene GmbH filed Critical SunGene GmbH
Publication of CN1863922A publication Critical patent/CN1863922A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明涉及通过培养遗传修饰的生物来制备酮类胡萝卜素的方法,所述遗传修饰的生物与野生型相比具有修饰的酮酶活性及修饰的β环化酶活性。本发明也涉及经过遗传修饰的生物和它们作为食品和饲料的用途,以及它们在生产酮类胡萝卜素提取物中的用途。

Description

在遗传修饰的非人生物中制备酮类胡萝卜素的方法
技术领域
本发明涉及培养遗传修饰的生物来制备酮类胡萝卜素的方法,所述遗传修饰生物与野生型相比具有修饰的酮酶活性及修饰的β环化酶活性;还涉及经过遗传修饰的生物和它们作为用以生产酮类胡萝卜素提取物的食品和饲料的用途。
背景技术
类胡萝卜素是在细菌、藻类、真菌及植物中从头合成的。酮类胡萝卜素,即含有至少一个酮基的类胡萝卜素,例如虾青素(Astaxanthin)、角黄素(Canthaxanthin)、海胆酮(echinenone)、3-羟基海胆酮(3-Hydroxyechinenon)、3’-羟基海胆酮(3’-Hydroxyechinenone)、金盏花玉红质(adonirubin)和金盏花黄质(adonixanthin)等天然抗氧化剂和色素,是某些藻类和微生物产生的次级代谢产物。
鉴于其着色特性,酮类胡萝卜素(尤其是虾青素)被用作动物饲料的色素添加剂,特别是用于鳟鱼、鲑鱼和虾的养殖中。
目前虾青素的制备主要是通过化学合成的方法进行的。现在,通过培养藻类(如雨生红球藻(Haematococcus pluvialis))或发酵基因工程最优化的微生物并加以分离的生物技术方法,可以获取少量天然酮类胡萝卜素(例如天然虾青素)。
因此,经济的用于制备天然酮类胡萝卜素的生物技术方法至关重要。
业已从多种生物中分离出编码酮酶的核酸以及相应蛋白质序列,并注释为如编码橙黄农杆菌(Agrobacterium aurantiacum)来源酮酶的核酸(EP735 137,登陆号:D58420),来源于产碱菌属种PC-1(Alcaligenes sp.PC-1)(EP 735137,登陆号:D58422),雨生红球藻Flotow em.Wille和雨生红球藻,NIES-144(EP 725137,WO 98/18910;Lotan等,FEBS Letters 1995,364,125-128,登陆号:X86782及D45881),Paracoccus marcusii(登陆号:Y15112),聚球藻属(Synechocystis sp.)PC6803株(登陆号:NP_442491),慢生根瘤菌属(Bradyrhizobium sp.)(登陆号:AF218415)以及念珠藻属(Nostocsp.)PCC 7120(Kaneko等,DNA Res.2001,8(5),205-213;登陆号:AP003592,BAB74888)的核酸。
EP735 137描述了将橙黄农杆菌或产碱菌属PC-1来源的酮酶基因(crtW)插入微生物,从而在微生物(如 E.coli)中制备叶黄素(xanthophylls)的方法。
从EP 725137、WO 98/18910、Kajiwara等(Plant Mol.Biol.1995,29,343-352)及Hirschberg等(FEBS Letters 1995,364,125-128)可知将雨生红球藻来源的酮酶基因(crtW,crtO或bkt)插入E.coli,以制备虾青素的方法。
Hirschberg等(FEBS Letters 1997,404,129-134)描述了将雨生红球藻来源的酮酶基因(crtO)插入聚球藻(Synechococcus)中制备虾青素。Sandmann等(Photochemistry and Photobiology 2001,73(5),551-55)描述了类似的方法,但其导致了角黄素的产生,且仅能产出微量的虾青素。
WO 98/18910及Hirschberg等(Nature Biotechnology 2000,18(8),888-892)描述了将雨生红球藻来源的酮酶基因(crtO)插入烟草中,在烟草花的蜜腺中合成酮类胡萝卜素。
WO 01/20011描述了在油料种子植物(如油菜籽、向日葵、大豆以及大麻)的种子中,使用种子特异性的启动子以及雨生红球藻来源的酮酶,通过DNA构建体生产酮类胡萝卜素,尤其是虾青素。
现有技术中描述的制备酮类胡萝卜素的所有方法,尤其是所述的用于制备虾青素的方法具有以下不足之处。一方面,产率仍然不如人意;另一方面,转基因生物产生了大量的羟基化副产物(例如玉米黄质和金盏花黄质)。
发明内容
因此,本发明的目标在于提供通过培养遗传修饰的非人生物制备酮类胡萝卜素的方法;或进一步提供经过遗传修饰的能产生酮类胡萝卜素的非人生物,其减轻或不再具有上述现有技术的不足,或者能以更高产率生产所需的酮类胡萝卜素。
据此,已经发现了通过培养遗传修饰的生物来制备酮类胡萝卜素的方法,所述遗传修饰生物与野生型相比具有修饰的酮酶活性及修饰的β环化酶活性,而其修饰的β环化酶活性是由于该β环化酶含有SEQ ID NO:2氨基酸序列,或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO:2序列至少有70%的同一性。
“与野生型相比修饰的酮酶活性”,在起始生物或野生型不具酮酶活性的情况下,应优选理解为“与野生型相比造成的酮酶活性”。
“与野生型相比修饰的酮酶活性”,在起始生物或野生型具有酮酶活性的情况下,应优选理解为“与野生型相比增加的酮酶活性”。
“与野生型相比修饰的β环化酶活性”,在起始生物或野生型不具β环化酶活性的情况下,应优选理解为“与野生型相比造成的β环化酶活性”。
“与野生型相比修饰的β环化酶活性”,在起始生物或野生型具有β环化酶活性的情况下,应优选理解为“与野生型相比增加的β环化酶活性”。
本发明的非人生物(如微生物或植物)优选起始生物时能够天然产生类胡萝卜素(如β-胡萝卜素或玉米黄质),或能够通过遗传修饰(例如代谢途径的再调节或互补)生产类胡萝卜素(如β-胡萝卜素或玉米黄质)。
作为起始或野生型生物,一些生物已经能够产生酮类胡萝卜素,例如虾青素或角黄素。这些生物,如雨生红球藻、Paracoccus marcusii、Xanthophyllomyces dendrorhous、环状芽孢杆菌(Bacillus circulans)、绿球藻(Chlorococcum)、Phaffia rhodozyma、pheasant′s-eye、Neochloris wimmeri、原管藻(Protosiphon botryoides)、Scotiellopsis oocystiformis、Scenedesmusvacuolatus、Chlorela zofingiensis、Ankistrodesmus braunii、血红裸藻(Euglena sanguinea)和Bacillus atrophaeus,作为起始或野生型生物,已经具有酮酶活性和β环化酶活性。
术语“野生型”,根据本发明应理解为相应的起始生物。
根据上下文,术语“生物”可以理解为非人起始生物(野生型),或本发明中经过遗传修饰的非人生物,或二者兼之。
优选地,特别是在不能明确指定植物或野生型的情况下,“野生型”在每种情况下是指用于判定下列活性变化的参照生物:即酮酶活性的增加或造成、下文描述的羟化酶活性的增加或造成、下文描述的β环化酶活性的增加或造成、下文描述的HMG-CoA还原酶活性的增加、下文描述的(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶活性的增加、下文描述的1-脱氧-D-木糖-5-磷酸合酶活性的增加、下文描述的1-脱氧-D-木糖-5-磷酸还原异构酶活性的增加、下文描述的异戊烯二磷酸酯Δ-异构酶活性的增加、下文描述的牻牛儿基二磷酸酯合酶活性的增加、下文描述的法呢基二磷酸酯合酶活性的增加、下文描述的牻牛儿基牻牛儿基二磷酸酯合酶活性的增加、下文描述的八氢番茄红素合酶活性的增加、下文描述的八氢番茄红素去饱和酶活性的增加、下文描述的ζ-胡萝卜素去饱和酶活性的增加、下文描述的crtISO活性的增加、下文描述的FtsZ活性的增加、下文描述的MinD活性的增加、下文描述的ε-环化酶活性的增加和下文描述的内源β-羟化酶活性的降低,以及酮类胡萝卜素含量的增加。
对于野生型已具有酮酶活性的微生物而言,该参照生物优选雨生红球藻。
对于野生型不具有酮酶活性的微生物而言,该参照生物优选布拉霉(Blakeslea)。
对于野生型即已具有酮酶活性的植物而言,该参照生物优选夏侧金盏花(Adonis aestivalis)、火焰金盏花(Adonis flammeus)或Adonis annuus,特别优选夏侧金盏花。
对于野生型其花瓣中不具有酮酶活性的植物而言,该参照生物优选万寿菊(Tagetes erecta)、孔雀草(Tagetes patula)、香叶万寿菊(Tagetes lucida)、普林万寿菊(Tagetes Pringlei)、Tagetes palmeri、小万寿菊(Tagetes minuta)或钟形万寿菊(Tagetes campanulata),特别优选万寿菊。
酮酶活性应理解为酮酶的酶活性。
酮酶是指一种蛋白质,其具有在任选取代的类胡萝卜素β-芷香酮环上引入酮基的酶活性。
特别地,酮酶指具有将β-胡萝卜素转变成角黄素的酶活性的蛋白质。
据此,酮酶活性是指一定时间内由酮酶蛋白质反应的β-胡萝卜素的量或生成的角黄素的量。
本发明方法的实施方案之一使用的起始生物为作为野生型或起始生物已经具有一定酮酶活性的非人生物(如如雨生红球藻、Paracoccusmarcusii、Xanthophyllomyces dendrorhous、环状芽孢杆菌(Bacilluscirculans)、绿球藻(Chlorococcum)、Phaffia rhodozyma、pheasant′s-eye、Neochloris wimmeri、原管藻(Protosiphon botryoides)、Scotiellopsisoocystiformis、Scenedesmus vacuolatus、Chlorela zofingiensis、Ankistrodesmus braunii、血红裸藻(Euglena sanguinea)或Bacillusatrophaeus。在该实施方案中,遗传修饰导致了与野生型或起始生物相比酮酶活性的增加。
当相比于野生型酮酶活性增加时,与野生型相比,在一定时间内由酮酶蛋白质酮酶反应的β-胡萝卜素的量或生成的角黄素的量也因之增加。
优选地,该酮酶活性的增加至少为野生型酮酶活性的5%,进一步优选为至少20%,进一步优选为至少50%、进一步优选为至少100%,更优选为至少300%,更为优选为至少500%,特别是至少600%。
优选在以下条件下测定本发明中经过遗传修饰的生物以及野生型或参照生物的酮酶活性:
对植物或微生物材料中酮酶活性的测定,是基于Frazer等(J.Biol.Chem.272(10):6128-6135,1997)的方法。通过使用β-胡萝卜素和角黄素底物,在脂质(大豆卵磷脂)和去污剂(胆酸钠)存在的情况下测定植物或微生物提取物的酮酶活性。酮酶分析的底物/产物比例通过HPLC手段检测。
有多种可以增加酮酶活性的途径,如通过在翻译和蛋白质水平关闭抑制性调节机制,或通过提高编码酮酶核酸相对于野生型的基因表达(例如通过活化剂诱导酮酶基因或通过向生物插入编码酮酶核酸)。
根据本发明,该实施方案中“提高编码酮酶核酸的基因表达”也指对该生物自身的内源酮酶表达的调控。这一点可以通过如修饰酮酶编码基因的启动子DNA序列来实现。这一修饰可以通过DNA序列的缺失或插入来实现,从而改变或优选增加至少一个内源酮酶基因的表达率。
如上所述,可以通过应用外源刺激来改变至少一种内源酮酶的表达。这一点可以通过特定的生理条件(即通过应用外源物质)来实现。
此外,还可以通过使用野生型生物中不具有的或经修饰的调节蛋白质,与酮酶基因的启动子相互作用,以增加至少一个内源酮酶基因的表达。
此类调节物可以是如WO 96/06166所描述的由DNA结合结构域和转录激活结构域所组成的嵌合蛋白质。
在优选实施方案中,通过提高编码酮酶核酸的基因表达,较野生型增加酮酶活性。
在另一优选实施方案中,通过向生物插入编码酮酶核酸来增加编码酮酶核酸的基因表达。
该实施方案中,与野生型相比,本发明的转基因生物中至少还存在一另一个酮酶基因。该实施方案中,本发明的遗传修饰的生物优选具有至少一个编码酮酶的外源(即异源)核酸,或具有至少两个编码酮酶的内源核酸。
根据本发明,在本方法的另一优选实施方案中,使用的起始生物为野生型并不具有酮酶活性的非人生物(如布拉霉、Marigold、万寿菊、香叶万寿菊、小万寿菊、普林万寿菊、Tagetes palmeri及钟形万寿菊)。
在该优选实施方案中,遗传修饰造成了这些生物中的酮酶活性。该优选实施方案中,与未经遗传修饰的野生型相比,本发明的遗传修饰的生物具有酮酶活性,因而优选能够转基因表达酮酶。
在该优选实施方案中,与前述增加编码酮酶核酸的基因表达类似,优选通过向起始生物插入编码酮酶核酸,造成编码酮酶核酸的基因表达。
为此,在两个实施方案中,原则上可以使用各种酮酶基因,即编码酮酶的各种核酸。
本说明书中提到的所有核酸可以为如RNA、DNA或cDNA序列。
对于真核生物来源的含有内含子的基因组酮酶序列,在宿主生物不能或不能通过改造来表达相应酮酶时,优选使用已经加工的核酸序列,如相应的cDNA。
可以用于本发明方法中的编码酮酶的核酸及相应酮酶的实例为如以下来源的序列:
雨生红球藻,特别是雨生红球藻Flotow em.Wille(登陆号:X86782;核酸:SEQ ID NO:3,蛋白质SEQ ID NO:4),
雨生红球藻,NIES-144(登陆号:D45881;核酸:SEQ ID NO:35,蛋白质SEQ ID NO:36),
橙黄农杆菌(登陆号:D58420;核酸:SEQ ID NO:37,蛋白质SEQ IDNO:38),
产碱菌属种(登陆号:D58422;核酸:SEQ ID NO:39,蛋白质SEQ IDNO:40),
Paracoccus marcusii(登陆号:Y15112;核酸:SEQ ID NO:41,蛋白质SEQ ID NO:42)。
聚球藻属PC6803株(登陆号:NP442491;核酸:SEQ ID NO:43,蛋白质SEQ ID NO:44)。
慢生根瘤菌属(登陆号:AF218415;核酸:SEQ ID NO:45,蛋白质SEQ ID NO:46)。
念珠藻PCC7120株(登陆号:AP003592,BAB74888;核酸:SEQ IDNO:47,蛋白质:SEQ ID NO:48)。
雨生红球藻
(登陆号:AF534876,AAN03484;核酸:SEQ ID NO:49,蛋白质:SEQID NO:50)
副球藻菌MBIC1143
(登陆号:D58420,P54972;核酸:SEQ ID NO:51,蛋白质:SEQ IDNO:52)
橙黄短波单胞菌(Brevundimonas aurantiaca)
(登陆号:AY166610,AAN86030;核酸:SEQ ID NO:53,蛋白质:SEQID NO:54)
泡沫节球藻(Nodularia spumigena)NSOR10
(登陆号:AY210783,AAO64399;核酸:SEQ ID NO:55,蛋白质:SEQ ID NO:56)
点形念珠藻(Nostoc punctiforme)ATCC 29133
(登陆号:NZ_AABC01000195,ZP_00111258;核酸:SEQ ID NO:57,蛋白质:SEQ ID NO:58)
点形念珠藻(Nostoc punctiforme)ATCC 29133
(登陆号:NZ_AABC01000196;核酸:SEQ ID NO:59,蛋白质:SEQID NO:60)
耐辐射奇异球菌(Deinococcus radiodurans)RI
(登陆号:E75561,AE001872;核酸:SEQ ID NO:61,蛋白质:SEQ IDNO:62),
聚球藻属种WH 8102,
核酸:Acc.No.NZ_AABD01000001,碱基对1,354,725-1,355,528(SEQID NO:75),蛋白质:Acc.No.ZP_00115639(SEQ ID NO:76)(注释为推定的蛋白质),
或自上述序列衍生的序列,例如:
通过对如序列SEQ ID NO:58或SEQ ID NO:57的变异/突变产生序列为SEQ ID NO:64或66的酮酶以及相应的编码核酸序列SEQ ID NO:63或SEQ ID NO:65,
通过对如序列SEQ ID NO:60或SEQ ID NO:59的变异/突变产生序列为SEQ ID NO:68或70的酮酶以及相应的编码核酸序列SEQ ID NO:67或SEQ ID NO:69,或
通过对如序列SEQ ID NO:76或SEQ ID NO:75的变异/突变产生序列为SEQ ID NO:72或74的酮酶以及相应的编码核酸序列SEQ ID NO:71或SEQ ID NO:73。
容易发现可用于本发明方法的其它酮酶和酮酶基因的天然实例,例如通过比较数据库中的氨基酸序列或其相应的反向翻译核酸序列的同源性(所述数据库含有前述序列,特别是具有SEQ ID NO:4和/或48和/或58和/60的序列),可以从多种已知基因组序列的生物中发现其它酮酶和酮酶基因。
通过众所周知的杂交技术,从前述核酸序列起始,特别是从多种基因组序列未知生物的SEQ ID NO:3和/或47和/或57和/59的序列起始,可以容易地发现其它酮酶和酮酶基因的天然实例。
该杂交可以在温和(低严紧性)或优选在严紧(高严紧性)的条件下进行。
该类杂交条件可以应用于该说明书中的所有核酸,在如Sambrook,J.,Fritsch,E.F,Maniatis,T.,《Molecular Cloning(A Laboratory Manual)》,第二版,Cold Spring Harbor Laboratory Press,1989,9.31-9.57或CurrentProtocols in Molecular Biology,John Wiley & Sons,N.Y.(1989),6.3.1-6.3.6中有所描述。
例如,洗涤步骤的条件可以从低严紧性(在50℃使用2X SSC)和高严紧性(在50℃,优选在65℃使用0.2X SSC)所限定的条件范围中选择(20X SSC:0.3M柠檬酸钠,3M氯化钠,pH7.0)。
此外,还可以将洗涤步骤中的温度从温和条件的室温(22℃)升至严紧条件的65℃。
可以同时改变盐浓度和温度两参数,也可以保持其中之一恒定,只改变另一个。在杂交过程中也可以使用变性剂(如甲酰胺或SDS)。若为50%甲酰胺,优选在42℃下进行杂交。
以下给出了一些杂交条件和洗涤步骤的代表性条件:
(1)杂交条件,例如
(i)65℃、4X SSC,或
(ii)45℃、6X SSC,或
(iii)68℃、6X SSC、100mg/ml变性鱼精DNA,或
(iv)68℃、6X SSC、0.5%SDS、100mg/ml变性且片段化的鲑精DNA,或
(v)42℃、6X SSC、0.5%SDS、100mg/ml变性且片段化的鲑精DNA、50%甲酰胺,或
(vi)42℃、50%甲酰胺、4X SSC,或
(vii)42℃、50%(vol/vol)甲酰胺、0.1%牛血清白蛋白、0.1%Ficoll、0.1%聚乙烯吡咯烷酮、50mM磷酸钠缓冲液(pH 6.5)、750mM NaCl、75mM柠檬酸钠,或
(viii)50℃、2X或4X SSC(温和条件),或
(ix)42℃、30至40%甲酰胺、2X或4X SSC(温和条件)。
(2)在以下条件进行10分钟的洗涤步骤,例如,
(i)50℃、0.015M NaCl/0.0015M柠檬酸钠/0.1%SDS,或
(ii)65℃、0.1X SSC,或
(iii)68℃、0.1X SSC、0.5%SDS,或
(iv)42℃、0.1X SSC、0.5%SDS、50%甲酰胺,或
(v)42℃、0.2X SSC、0.1%SDS,或
(vi)65℃、2X SSC(温和条件)。
在本发明方法的一个优选实施方案中,插入编码蛋白质的核酸,所述蛋白质中含有SEQ ID NO:4氨基酸序列,或含有对该序列进行氨基酸替换、插入或缺失后产生的序列,后者与SEQ ID NO:4序列在氨基酸水平上的同一性为至少70%、优选至少80%、更优选至少85%、更优选至少90%、更优选至少95%、更优选至少97%、更优选至少98%,特别优选至少99%,且所述蛋白质具有酮酶的酶促性质。
同时,该酮酶序列可以为天然序列,该序列可以如前述通过与其它生物来源的序列同一性比较获得;或酮酶序列可以是对SEQ ID NO:4序列通过合成变异(如氨基酸的替换、插入或缺失)修饰而成的合成序列。
本发明方法的另一个优选实施方案应用编码蛋白质的核酸,所述蛋白质中含有SEQ ID NO:48氨基酸序列,或含有对该序列进行氨基酸替换、插入或缺失后产生的序列,后者与SEQ ID NO:48序列在氨基酸水平上的同一性为至少70%、优选至少80%、更优选至少85%、更优选至少90%、更优选至少95%、更优选至少97%、更优选至少98%,特别优选至少99%,且所述蛋白质具有酮酶的酶促性质。
同时,该酮酶序列可以为天然序列,该序列可以如前述通过与其它生物来源的序列同一性比较获得;或酮酶序列可以是对SEQ ID NO:48序列通过合成变异(如氨基酸的替换、插入或缺失)修饰而成的合成序列。
在本发明方法的另一个优选实施方案中,插入编码蛋白质的核酸,所述蛋白质中含有SEQ ID NO:58氨基酸序列,或含有对该序列进行氨基酸替换、插入或缺失后产生的序列,后者与SEQ ID NO:58序列在氨基酸水平上的同一性为至少70%、优选至少80%、更优选至少85%、更优选至少90%、更优选至少95%、更优选至少97%、更优选至少98%,特别优选至少99%,且所述蛋白质具有酮酶的酶促性质。
同时,该酮酶序列可以为天然序列,该序列可以如前述通过与其它生物来源的序列同一性比较获得;或酮酶序列可以是对SEQ ID NO:58序列通过合成变异(如氨基酸的替换、插入或缺失)修饰而成的合成序列。
在本发明方法的另一个优选实施方案中,插入编码蛋白质的核酸,所述蛋白质中含有SEQ ID NO:60氨基酸序列,或含有对该序列进行氨基酸替换、插入或缺失后产生的序列,后者与SEQ ID NO:60序列在氨基酸水平上的同一性为至少70%、优选至少80%、更优选至少85%、更优选至少90%、更优选至少95%、更优选至少97%、更优选至少98%,特别优选至少99%,且所述蛋白质具有酮酶的酶促性质。
同时,该酮酶序列可以为天然序列,该序列可以如前述通过与其它生物来源的序列同一性比较获得;或酮酶序列可以是对SEQ ID NO:60序列通过合成变异(如氨基酸的替换、插入或缺失)修饰而成的合成序列。
对于本说明书中的所有蛋白质,术语“替换”是指一个或多个氨基酸被一个或多个氨基酸所替换。优选进行“保守性取代”,其中替换的氨基酸与原始氨基酸具有相似的性质,如Glu被Asp、Gln被Asn、Val被Ile、Leu被Ile、Ser被Thr所替换。
“缺失”是指一个氨基酸直接被键所取代。优选的缺失位置为多肽的末端,以及单独蛋白质结构域间的连接处。
“插入”是指将氨基酸插入多肽链中,其中原直接连接被一个或多个氨基酸所取代。
“两种蛋白质间的同一性”是指各蛋白质全长中的氨基酸同一性,尤其是使用Informax(USA)提供的vector NTI 7.1版软件和clustal方法(Higgins DG,Sharp PM.Fast and sensitive multiple sequence alignmentson a microcomputer.Comput Appl.Biosci.1989Apr;5(2):151-1),设定下述参数,通过比较计算出的同一性:
多重比对参数:
空位开放罚分(gap opening penalty)        10
空位扩展罚分(gap extension penalty)      10
空位分离罚分范围                         8
空位分离罚分(gap separation penalty)     关闭
校正延迟的同一性%                       40
(%identity for alignment delay)
残基特异性空位(Residae specific gap)     关闭
亲水残基空位(Hydrophilic rdsidae gap)    关闭
转换权重(transition weighing)            0
成对比对参数:
FAST运算法则                             使用
K-tuple尺寸                              1
空位罚分                                 3
窗口尺寸                                      5
最佳对角线数目(Number of best diagonals)      5
因此,在氨基酸水平上与序列SEQ ID NO:4或48或58或60具有至少70%同一性的蛋白质,是指其序列与SEQ ID NO:4或48或58或60的序列相比较(特别是根据上述程序对数)具有至少70%上述设置参数的同一性。
可以通过如根据遗传密码反向翻译多肽序列的方法,获取合适的核酸序列。
优选为此使用的密码子是根据生物特异性的密码子使用情况选择其中频繁使用者。借助计算机分析相关生物的其他已知基因,可以容易地确定密码子的使用。
在特别优选的实施方案中,将含有SEQ ID NO:3序列的核酸插入植物中。
在另一个特别优选的实施方案中,将含有SEQ ID NO:48序列的核酸插入植物中。
在另一个特别优选的实施方案中,将含有SEQ ID NO:58序列的核酸插入植物中。
在另一个特别优选的实施方案中,将含有SEQ ID NO:60序列的核酸插入植物中。
还可以通过公知的方法,从核苷酸结构单元开始进行化学合成来制备上述所有酮酶基因,例如利用单个重叠互补的双螺旋核酸结构单元的片段缩合来制备。通过如已知的亚磷酰胺法(Voet,Voet,第二版,Wiley PressNew York,896-897页)可以化学合成寡核苷酸。添加合成的寡核苷酸、使用DNA聚合酶的Klenow片段填补空位、连接反应和一般的克隆方法如Sambrook等(1989),《Molecular cloning:A laboratory manual》,ColdSpring Harbor Laboratory Press所述。
如上所述,本发明的方法中使用的非人生物与野生型相比具有修饰的酮酶活性以及修饰的β环化酶活性,该修饰的β环化酶活性源于该β环化酶含有SEQ ID NO:2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO:2序列至少有70%的同一性。
根据本发明,该方法的实施方案之一使用的起始生物为作为野生型或起始生物已经具有一定β环化酶活性的非人生物。在该实施方案中,遗传修饰引入了高于野生型或起始生物的β环化酶活性。该增加的β环化酶活性源于该β环化酶含有SEQ ID NO:2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO:2序列至少有70%的同一性。
β环化酶活性是指β环化酶的酶活性。
β环化酶是指一种蛋白质,其具有将末端的番茄红素线性残基转化为β-芷香酮环的酶活性。
具体而言,β环化酶指具有将γ-胡萝卜素转化成β-胡萝卜素的酶活性的蛋白质。
因此,β环化酶活性是指在一定时间内由β环化酶蛋白质转化的γ-胡萝卜素的量,或生成的β-胡萝卜素的量。
当β环化酶活性相对于野生型增加时,与野生型相比,在一定时间内由β环化酶蛋白质转化的番茄红素或γ-胡萝卜素的量或由番茄红素生成的γ-胡萝卜素的量或由γ-胡萝卜素生成的β-胡萝卜素的量也因之增加。
优选增加的β环化酶活性至少为野生型β环化酶活性的5%,进一步优选为至少20%、进一步优选为至少50%、进一步优选为至少100%、更优选为至少300%、甚至更优选为至少500%,特别是至少600%。
优选在以下条件下测定本发明中经过遗传修饰的生物,以及野生型或参照生物的β环化酶活性:
根据Fraser和Sandmann的方法(Biochem.Biophys.Res.Comm.185(1)(1992)9-15)在体外测定β环化酶活性。将作为缓冲液的磷酸钾(pH 7.6)、作为底物的番茄红素、及红辣椒(paprika)基质蛋白质、NADP+、NADPH和ATP加入特定量的生物提取物中。
特别优选在Bouvier、d′Harlingue和Camara(Molecular Analysis ofcarotenoid cyclase inhibition;Arch.Biochem.Biophys.346(1)(1997)53-64)的下述条件测定β环化酶活性:
在250μl的体积中进行体外测定。反应物含有50mM磷酸钾(pH 7.6)、不同量的生物提取物、20nM番茄红素、250μg红辣椒有色体基质蛋白质、0.2mM NADP+、0.2mM NADPH和1mM ATP。将NADP/NADPH和ATP溶解于含有1mg Tween 80的10ml乙醇后加入孵育介质。30℃下反应60分钟后,加入氯仿/甲醇(2∶1)终止反应。反应产物经氯仿抽提后通过HPLC分析。
Fraser和Sandmann描述了另一种使用放射性底物的测定(Biochem.Biophys.Res.Comm.185(1)(1992)9-15)。
可以通过多种途径增加β环化酶的活性,如通过关闭在表达及蛋白质水平的抑制性调节机制或增加编码β环化酶的核酸相对于野生型的基因表达,所述β环化酶中含有SEQ ID NO:2氨基酸序列、或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO:2序列至少有70%的同一性。
同样,有多种途径可以相对于野生型增加编码β环化酶核酸的基因表达,例如通过活化剂诱导β环化酶基因,或向生物插入一个或多个β环化酶基因拷贝,即向生物插入至少一个编码β环化酶的核酸,所述β环化酶中含有SEQ ID NO:2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO:2序列至少有70%的同一性。
根据本发明,增加编码β环化酶核酸的基因表达也指对该生物自身的内源β环化酶表达的调控,所述β环化酶中含有SEQ ID NO:2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO:2序列至少有70%的同一性。
可以通过如修饰β环化酶编码基因的启动子DNA序列来实现这一调控。所述修饰可以通过如DNA序列的缺失或插入来完成,从而提高基因的表达率。
如上所述,可以通过应用外源刺激来改变内源β环化酶的表达。这一点可以通过特定的生理条件(即通过应用外源物质)来实现。
此外,还可以通过使用未转化生物中不具有的调节蛋白质,与该基因的启动子相互作用,以修饰或增加内源β环化酶基因的表达。
此类调节物可以是如WO 96/06166所描述的由DNA结合结构域和转录激活结构域所组成的嵌合蛋白质。
在优选实施方案中,通过向生物插入至少一个编码β环化酶的核酸来增加编码β环化酶核酸的基因表达,所述β环化酶中含有SEQ ID NO:2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO:2序列至少有70%的同一性。
该实施方案中,与野生型相比,本发明的转基因生物中至少还存在另一个β环化酶基因。该实施方案中,本发明的遗传修饰的生物优选具有至少一个编码β环化酶的外源(即异源)核酸,或具有至少两个编码β环化酶的内源核酸。
在本发明方法的另一优选实施方案中,使用的起始生物为野生型并不具有β环化酶活性的非人生物。在该次优选的实施方案中,遗传修饰造成了生物中的β环化酶活性。该实施方案中,与未遗传修饰的野生型相比,本发明的遗传修饰的生物具有β环化酶活性,因而优选能够转基因表达β环化酶。
在该优选实施方案中,与前述增加编码β环化酶核酸的基因表达类似,优选通过向起始生物插入编码β环化酶的核酸造成编码β环化酶核酸的基因表达。
为此,在两个实施方案中,原则上可以使用各种β环化酶基因,即编码β环化酶的各种核酸,所述β环化酶中含有SEQ ID NO:2氨基酸序列,或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO:2序列至少有70%的同一性。
对于真核生物来源的含有内含子的基因组β环化酶序列,在宿主生物不能或不能通过改造来表达相应β环化酶时,优选使用已经加工的核酸序列,如相应的cDNA。
特别优选的β环化酶为番茄来源的色素细胞特异性β环化酶(AAG21133)(核酸:SEQ ID NO:1;蛋白质:SEQ ID NO:2)。
根据本发明,可以使用的β环化酶基因是编码如下蛋白质的核酸,所述蛋白质中含有SEQ ID NO:2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者与SEQ ID NO:2序列在氨基酸水平上的同一性为至少70%、优选至少80%、更优选至少85%、更优选至少90%、最优选至少95%,且所述蛋白质具有β环化酶的酶促性质。
容易发现可用于本发明方法的β环化酶和β环化酶基因的其他实例,例如如上所述比较数据库中的氨基酸序列或其相应的反向翻译核酸序列与SEQ ID NO:2的同一性,可以从多种已知基因组序列的生物中发现其它β环化酶和β环化酶基因。
利用杂交和PCR技术,从多种基因组序列未知生物的SEQ ID NO:1序列起始,通过已知的方法可以容易地发现其它β环化酶和β环化酶基因的实例。
在另一个特别优选的实施方案中,为增加β环化酶的活性,向生物中插入编码蛋白质的核酸,所述蛋白质含有SEQ ID NO:2序列的β环化酶氨基酸序列。
可以通过如根据遗传密码反向翻译多肽序列的方法,获得合适的核酸序列。
优选为此使用的密码子,是根据生物特异性的密码子使用情况选择其中频繁使用者。借助计算机分析相关生物的其他已知基因,可以容易地确定密码子的使用。
在特别优选的实施方案中,将含有SEQ ID NO:1序列的核酸插入生物中。
还可以通过公知的方法,从核苷酸结构单元开始进行化学合成来制备上述所有β环化酶基因,例如利用单个重叠互补的双螺旋核酸结构单元的片段缩合来制备。通过如已知的亚磷酰胺法(Voet,Voet,第二版,WileyPress New York,896-897页)可以化学合成寡核苷酸。添加合成的寡核苷酸、使用DNA聚合酶的Klenow片段填补空位、连接反应和一般的克隆方法如Sambrook等(1989),《Molecular cloning:A laboratory manual》,ColdSpring Harbor Laboratory Press所述。
在优选实施方案中培养非人生物,所述生物与其野生型相比,除了具有修饰的酮酶活性和修饰的β环化酶活性,还具有改良的羟化酶活性。
“与野生型相比改良的羟化酶活性”,在起始生物或野生型不具羟化酶活性的情况下,应优选理解为“与野生型相比造成的羟化酶活性”。
“与野生型相比改良的羟化酶活性”,在起始生物或野生型具有羟化酶活性的情况下,应优选理解为“与野生型相比增加的羟化酶活性”。
因此,在优选实施方案中培养非人生物,所述生物与其野生型相比,除了具有修饰的酮酶活性和修饰的β环化酶活性,还具有造成的或增加的羟化酶活性。
羟化酶活性是指羟化酶的酶活性。
羟化酶是指一种蛋白质,其具有在任选取代的类胡萝卜素β-芷香酮环上引入羟基的酶活性。
具体而言,羟化酶指具有将β-胡萝卜素转化成玉米黄质或将角黄素转化成虾青素的酶活性的蛋白质。
据此,羟化酶活性是指在一定时间内由羟化酶蛋白质转化的β-胡萝卜素或角黄素的量,或生成的玉米黄质或虾青素的量。
当羟化酶活性相对于野生型增加时,与野生型相比,在一定时间内由蛋白质羟化酶转化的β-胡萝卜素或角黄素的量或生成的玉米黄质或虾青素的量也因之增加。
优选地,该羟化酶活性的增加至少为野生型羟化酶活性的5%,进一步优选为至少20%,进一步优选为至少50%、进一步优选为至少100%,更优选为至少300%,甚至更优选至少为500%,特别是至少600%。
优选在以下条件下测定本发明中经过遗传修饰的生物以及野生型或参照生物的羟化酶活性:
根据Bouvier等的方法(Biochim.Biophys.Acta 1391(1998),320-328)在体外测定羟化酶活性。将铁氧化还原蛋白、铁氧化还原蛋白-NADP氧化还原酶、过氧化氢酶、NADPH和β-胡萝卜素及单-和双半乳糖苷甘油加入特定量的生物提取物中。
特别优选在Bouvier、Keller、d′Harlingue和Camara(Xanthophyllbiosynthesis:molecular and functional characterization of carotenoidhydroxylases from pepper fruits(Capsicum annuum L.);Biochim.Biophys.Acta 1391(1998),320-328)的下述条件测定羟化酶活性:
在0.250ml的体积中进行体外测定。反应物含有50mM磷酸钾(pH7.6)、0.025mg菠菜铁氧化还原蛋白、0.5单位铁氧化还原蛋白-NADP+氧化还原酶、0.25mM NADPH、0.010mg β-胡萝卜素(在0.1mg Tween 80中乳化)、0.05mM的单/双半乳糖苷甘油混合物(1∶1)、1单位过氧化氢酶、0.2mg胎牛血清白蛋白和不同体积的生物提取物。将反应混合物在30℃孵育2小时。反应产物经有机溶剂(如丙酮或氯仿/甲醇(2∶1))抽提后通过HPLC测定。
可以通过多种途径实现羟化酶活性的增加或造成,如通过关闭在表达及蛋白质水平的抑制性调节机制或相对于野生型增加或造成羟化酶编码核酸的基因表达。
同样,有多种途径可以实现羟化酶编码核酸的基因表达相对于野生型的增加或造成,例如通过活化剂诱导羟化酶基因,或向生物插入一个或多个羟化酶基因拷贝,即向生物插入至少一个编码羟化酶的核酸。
根据本发明,增加羟化酶编码核酸的基因表达也指对该生物自身的内源羟化酶表达的调控。
可以通过如修饰羟化酶编码基因的启动子DNA序列来实现这一调控。所述修饰可以通过如DNA序列的缺失或插入来完成,从而提高基因的表达率。
如上所述,可以通过应用外源刺激来改变内源β环化酶的表达。这一点可以通过特定的生理条件(即通过应用外源物质)来实现。
此外,还可以通过使用未转化生物中不具有的调节蛋白质,与该基因的启动子相互作用,以造成或增加内源羟化酶基因的表达。
此类调节物可以是如WO 96/06166所描述的由一个DNA结合结构域和一个转录激活结构域所组成的嵌合蛋白质。
在优选的实施方案中,通过向生物插入至少一个羟化酶编码核酸来增加或造成羟化酶编码核酸的基因表达。
为此,原则上可以使用各种羟化酶基因,即编码羟化酶的各种核酸。
对于真核生物来源的含有内含子的基因组羟化酶序列,在宿主生物不能或不能通过改造来表达相应羟化酶时,优选使用已经加工的核酸序列,如相应的cDNA。
羟化酶基因的实例如:
雨生红球藻来源的羟化酶编码核酸(登陆号:AX038729,WO 0061764);(核酸:SEQ ID NO:77,蛋白质:SEQ ID NO:78)。
以及以下登陆号的羟化酶:
|emb|CAB55626.1、CAA70427.1、CAA70888.1、CAB55625.1、AF499108_1、AF315289_1、AF296158_1、AAC49443.1、NP_94300.1、NP_200070.1、AAG10430.1、CAC06712.1、AAM88619.1、CAC95130.1、AAL80006.1、AF162276_1、AAO53295.1、AAN85601.1、CRTZ_ERWHE、CRTZ_PANAN、BAB79605.1、CRTZ_ALCSP、CRTZ_AGRAU、CAB56060.1、ZP_00094836.1、AAC44852.1、BAC77670.1、NP_745389.1、NP_344225.1、NP_849490.1、ZP_00087019.1、NP_503072.1、NP_852012.1、NP_115929.1、ZP_00013255.1。
此外,特别优选的羟化酶为番茄来源的羟化酶(登陆Y14810)(核酸:SEQ ID NO:5;蛋白质:SEQ ID NO:6)。
该优选实施方案中,与野生型相比,本发明的优选转基因生物中至少还存在另一个羟化酶基因。
该优选实施方案中,遗传修饰的生物具有如至少一个编码羟化酶的外源(即异源)核酸,或具有至少两个编码羟化酶的内源核酸。
优选地,上述优选实施方案中可以使用的羟化酶基因是编码如下蛋白质的核酸,所述蛋白质中含有SEQ ID NO:6氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者与SEQ ID NO:6序列在氨基酸水平上的同一性为至少70%、优选至少80%、更优选至少85%、更优选至少90%、最优选至少95%,且所述蛋白质具有羟化酶的酶促性质。
容易发现羟化酶和羟化酶基因的其他实例,例如如上所述比较数据库中的氨基酸序列或其相应的反向翻译核酸序列与SEQ ID NO:6的同一性,可以从多种已知基因组序列的生物中发现其它羟化酶和羟化酶基因。
利用杂交和PCR技术,从多种基因组序列未知生物的SEQ ID NO:5序列起始,通过已知的方法可以容易地发现其它羟化酶和羟化化酶基因的实例。
在另一个特别优选的实施方案中,为增加羟化酶的活性,向生物中插入编码蛋白质的核酸,所述蛋白质含有序列SEQ ID NO:6的羟化酶氨基酸序列。
可以通过如根据遗传密码反向翻译多肽序列的方法,获得合适的核酸序列。
优选为此使用的密码子是根据生物特异性的密码子使用情况选择其中频繁使用者。借助计算机分析相关生物的其他已知基因,可以容易地确定密码子的使用。
在特别优选的实施方案中,将含有SEQ ID NO:5序列的核酸插入生物中。
还可以通过公知的方法,从核苷酸结构单元开始进行化学合成来制备上述所有羟化酶基因,例如利用单个重叠互补的双螺旋核酸结构单元的片段缩合来制备。通过如已知的亚磷酰胺法(Voet,Voet,第二版,Wiley PressNew York,896-897页)可以化学合成寡核苷酸。添加合成的寡核苷酸、使用DNA聚合酶的Klenow片段填补空位、连接反应和一般的克隆方法如Sambrook等(1989),《Molecular cloning:A laboratory manual)》,ColdSpring Harbor Laboratory Press所述。
特别优选地,本发明的方法使用起始生物时具有β环化酶活性而无酮酶活性的遗传修饰的非人生物,与野生型相比,遗传修饰的生物的β环化酶活性有所增加,且具有造成的酮酶活性,其中β环化酶活性增加是由于β环化酶所致,该β环化酶含有SEQ ID NO:2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO:2序列至少有70%的同一性。
特别优选地,本发明的方法还使用起始生物时缺乏β环化酶活性及酮酶活性的遗传修饰的非人生物,与野生型相比,遗传修饰的生物具有造成的β环化酶活性及酮酶活性,其中β环化酶活性的造成是由于β环化酶所致,该β环化酶含有SEQ ID NO:2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO:2序列至少有70%的同一性。
特别优选地,本发明的方法还使用起始生物时具有β环化酶活性及酮酶活性的遗传修饰的非人生物,与野生型相比,遗传修饰的生物的β环化酶活性及酮酶活性均有所增加,其中β环化酶活性的增加是由于β环化酶所致,所述β环化酶含有SEQ ID NO:2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO:2序列至少有70%的同一性。
特别优选地,本发明的方法还使用起始生物时具有β环化酶活性但不具有酮酶活性及羟化酶活性的遗传修饰的非人生物,与野生型相比,遗传修饰的生物的β环化酶活性有所增加,具有造成的酮酶活性及羟化酶活性,其中β环化酶活性的增加是由于β环化酶所致,所述β环化酶含有SEQ IDNO:2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO:2序列至少有70%的同一性。
特别优选地,本发明的方法还使用起始生物时具有β环化酶及羟化酶活性但不具有酮酶活性的遗传修饰的非人生物,与野生型相比,遗传修饰的生物的β环化酶活性及羟化酶活性有所增加,具有造成酮酶活性。其中β环化酶活性的增加是由于β环化酶所致,所述β环化酶含有SEQ ID NO:2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO:2序列至少有70%的同一性。
特别优选地,本发明的方法还使用起始生物时缺乏β环化酶活性、羟化酶活性及酮酶活性的遗传修饰的非人生物,与野生型相比,遗传修饰的生物具有造成的β环化酶活性、羟化酶活性及酮酶活性。其中β环化酶活性的造成是由于β环化酶所致,所述β环化酶含有SEQ ID NO:2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO:2序列至少有70%的同一性。
特别优选地,本发明的方法还使用起始生物时具有β环化酶活性、羟化酶活性及酮酶活性的遗传修饰的非人生物,与野生型相比,遗传修饰的生物的β环化酶活性、羟化酶活性及酮酶活性均有所增加。其中β环化酶活性的增加是由于β环化酶所致所述β环化酶含有SEQ ID NO:2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO:2序列至少有70%的同一性。
在另一个优选实施方案中,培养遗传修饰的非人生物,所述生物与野生型相比还具有至少一种选自以下的活性增加:HMG-CoA还原酶活性、(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶活性、1-脱氧-D-木糖-5-磷酸合酶活性、1-脱氧-D-木糖-5-磷酸还原异构酶活性、异戊烯二磷酸酯Δ-异构酶活性、牻牛儿基二磷酸酯合酶活性、法呢基二磷酸酯合酶活性、牻牛儿基牻牛儿基二磷酸酯合酶活性、八氢番茄红素合酶活性、八氢番茄红素去饱和酶活性、ζ-胡萝卜素去饱和酶活性、crtISO活性、FtsZ活性以及MinD活性。
HMG-CoA还原酶活性是指HMG-CoA还原酶(3-羟基-3-甲基戊二酰辅酶A还原酶)的酶活性。
HMG-CoA还原酶是指一种蛋白质,其具有可将3-羟基-3-甲基戊二酰辅酶A转化为甲羟戊酸的酶活性。
据此,HMG-CoA还原酶活性是指一定时间内由HMG-CoA还原酶蛋白质反应的3-羟基-3-甲基戊二酰辅酶A的量或生成的甲羟戊酸的量。
当HMG-CoA还原酶活性相对于野生型增加时,与野生型相比,在一定时间内由蛋白质HMG-CoA还原酶转化的3-羟基-3-甲基戊二酰辅酶A的量或生成的甲羟戊酸的量也因之增加。
优选增加的HMG-CoA还原酶活性至少为野生型HMG-CoA还原酶活性的5%,进一步优选为至少20%、进一步优选为至少50%、进一步优选为至少100%、更优选为至少300%、甚至更优选为至少500%,特别是至少600%。
优选在以下条件下测定本发明中经过遗传修饰的生物,以及野生型或参照生物的HMG-CoA还原酶活性:
在研钵中加入液氮,通过强烈研磨匀浆冷冻生物材料,并用比率从1∶1至1∶20的提取缓冲液进行抽提。具体的比率取决于可获得的生物材料中的酶活性,以便能在线性测量的范围内进行酶活性的测定和量化。通常提取缓冲液中含有50mM HEPES-KOH(pH 7.4)、10mM MgCl2、10mM KCl、1mM EDTA、1mM EGTA、0.1%(v/v)Triton X-100、2mMε-氨基己酸、10%甘油、5mM KHCO3。加入2mM DTT和0.5mM PMSF后立即进行提取。
根据已发表的描述(如Schaller,Grausem,Benveniste,Chye,Tan,Song和Chua,Plant Physiol.109(1995),761-770;Chappell,Wolf,Proulx,Cuellar和Saunders,Plant Physiol.109(1995)1337-1343),能够测定HMG-CoA还原酶活性。可以在冷缓冲液(100mM磷酸钾(pH 7.0)、4mMMgCl2、5mM DTT)中对生物组织进行匀浆和抽提。将匀浆液在4℃、10 000g离心15分钟。随后将上清液以100 000g离心45-60分钟。测定上清液和微粒体级分的沉淀(重悬于100mM磷酸钾(pH 7.0)和50mMDTT之后)中HMG-CoA还原酶活性。将溶液和悬浮液(悬浮液中蛋白质含量相当于约1-10μg)的等分试样于30℃在100mM磷酸钾缓冲液(pH 7.0,含3mM NADPH和20μM(14C)HMG-CoA(58μCi/μM),理想体积为26μl)中孵育15-60分钟。加入5μl甲羟戊酸内酯(1mg/ml)和6NHCl终止反应。随后将混合物在室温下孵育15分钟。加入125μl饱和磷酸钾溶液(pH 6.0)及300μl乙酸乙酯,以定量反应中形成的(14C)甲羟戊酸。将混合物充分混合并离心。通过闪烁测量测定放射性。
(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶(也称作lytB或IspH)活性,是指(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶的酶活性。
(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶是指一种蛋白质,其具有可将(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯转化为异戊烯基二磷酸酯和二甲基烯丙基二磷酸酯的酶活性。
据此,(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯活性是指一定时间内由(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶蛋白质反应的(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯的量或生成的异戊烯基二磷酸酯和/或二甲基烯丙基二磷酸酯的量。
当(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶活性相对于野生型增加时,与野生型相比,在一定时间内由蛋白质(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶转化的(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯的量或生成的异戊烯基二磷酸酯和/或二甲基烯丙基二磷酸酯的量也因之增加。
优选增加的(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶活性至少为野生型(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶活性的5%,进一步优选为至少20%、进一步优选为至少50%、进一步优选为至少100%、更优选为至少300%、甚至更优选为至少500%,特别是至少600%。
优选在以下条件下测定本发明中经过遗传修饰的生物,以及野生型或参照生物的(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶活性:
在研钵中加入液氮,通过强烈研磨匀浆冷冻生物材料,并用比率从1∶1至1∶20的提取缓冲液进行抽提。具体的比率取决于可获得的生物材料中的酶活性,以便能在线性测量的范围内进行酶活性的测定和量化。通常提取缓冲液中含有50mM HEPES-KOH(pH 7.4)、10mM MgCl2、10mM KCl、1mM EDTA、1mM EGTA、0.1%(v/v)Triton X-100、2mM ε-氨基己酸、10%甘油、5mM KHCO3。加入2mM DTT和0.5mM PMSF后立即进行提取。
通过免疫检测方法可以测定(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶的活性。Rohdich及其同事(Rohdich,Hecht,G_rtner,Adam,Krieger,Amslinger,Arigoni,Bacher和Eisenreich:Studies on the nonmevalonateterpene biosynthetic pathway:metabolic role of IspH(LytB)protein,Natl.Acad.Natl.Sci.USA 99(2002),1158-1163)已经描述了特异性抗体的制备。关于催化活性的测定,Altincicek及其同事(Altincicek,Duin,Reichenberg,Hedderich,Kollas,Hintz,Wagne,Wiesner,Beck和Jomaa:LytB proteincatalyzes the terminal step of the 2-C-methyl-D-erythritol-4-phosphatepathway of isoprenoid biosynthesis;FEBS Letters 532(2002)437-440)描述了一种监测(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原为异戊烯基二磷酸酯和二甲基烯丙基二磷酸酯的体外系统。
1-脱氧-D-木糖-5-磷酸合酶活性是指1-脱氧-D-木糖-5-磷酸合酶的酶活性。
1-脱氧-D-木糖-5-磷酸合酶是指一种蛋白质,其具有将羟乙基ThPP和3-磷酸甘油醛转化为1-脱氧-D-木糖-5-磷酸的酶活性。
据此,1-脱氧-D-木糖-5-磷酸合酶活性是指在一定时间内由1-脱氧-D-木糖-5-磷酸合酶蛋白质转化的羟乙基ThPP和/或3-磷酸甘油醛的量或形成的1-脱氧-D-木糖-5-磷酸的量。
当1-脱氧-D-木糖-5-磷酸合酶活性相对于野生型增加时,与野生型相比,在一定时间内由蛋白质1-脱氧-D-木糖-5-磷酸合酶转化的羟乙基ThPP和/或3-磷酸甘油醛的量,或形成的1-脱氧-D-木糖-5-磷酸的量也因之增加。
优选增加的1-脱氧-D-木糖-5-磷酸合酶活性至少为野生型1-脱氧-D-木糖-5-磷酸合酶活性的5%,进一步优选为至少20%、进一步优选为至少50%、进一步优选为至少100%、更优选为至少300%、甚至更优选为至少500%,特别是至少600%。
优选在以下条件下测定本发明中经过遗传修饰的生物,以及野生型或参照生物的1-脱氧-D-木糖-5-磷酸合酶活性:
在研钵中加入液氮,通过强烈研磨匀浆冷冻生物材料,并用比率从1∶1至1∶20的提取缓冲液进行抽提。具体的比率取决于可获得的生物材料中的酶活性,以便能在线性测量的范围内进行酶活性的测定和量化。通常提取缓冲液中含有50mM HEPES-KOH(pH 7.4)、10mM MgCl2、10mM KCl、1mM EDTA、1mM EGTA、0.1%(v/v)Triton X-100、2mMε-氨基己酸、10%甘油、5mM KHCO3。加入2mM DTT和0.5mM PMSF后立即进行提取。
用于测定D-1-脱氧木酮糖-5-磷酸合酶活性(DXS)的反应混合物(50-200μl)中含有:100mM Tris-HCl(pH 8.0)、3mM MgCl2、3mM MnCl2、3mM ATP、1mM硫胺素二磷酸酯、0.1%Tween-60、1mM氟化钾、30μM(2-14C)丙酮酸(0.5μCi)、0.6mM DL-3-磷酸甘油醛。37℃下将生物提取物在反应溶液中孵育1-2小时。随后加热至80℃持续3分钟以终止反应。在13 000转/分钟下离心5分钟后,蒸发上清液,将残留物重悬于50μl甲醇,铺于TLC板进行薄层层析(硅胶60,Merck,Darmstadt),并在正丙醇/乙酸乙酯/水(6∶1∶3;v/v/v)中进行分离。在此过程中,放射性标记的D-1-脱氧木酮糖-5-磷酸(或D-1-脱氧木酮糖)与(2-14C)-丙酮酸得以分离。利用闪烁计数器进行定量。该法描述于Harker和Bramley(FEBS Letters 448(1999)115-119)。另外,测定DXS合酶活性的荧光测定法已由Querol及其同事描述(Analytical Biochemistry 296(2001)101-105)。
1-脱氧-D-木糖-5-磷酸还原异构酶(也称为1-脱氧-D-木酮糖-5-磷酸还原异构酶)活性是指1-脱氧-D-木糖-5-磷酸还原异构酶的酶活性。
1-脱氧-D-木糖-5-磷酸还原异构酶是指一种蛋白质,其具有将1-脱氧-D-木糖-5-磷酸转化为2-C-甲基-D-赤藻糖醇4-磷酸的酶活性。
据此,1-脱氧-D-木糖-5-磷酸还原异构酶活性是指在一定时间内由蛋白质1-脱氧-D-木糖-5-磷酸还原异构酶转化的1-脱氧-D-木糖-5-磷酸的量,或形成的2-C-甲基-D-赤藻糖醇4-磷酸的量。
当1-脱氧-D-木糖-5-磷酸还原异构酶活性相对于野生型增加时,与野生型相比,在一定时间内由蛋白质1-脱氧-D-木糖-5-磷酸还原异构酶转化的1-脱氧-D-木糖-5-磷酸的量或形成的2-C-甲基-D-赤藻糖醇4-磷酸的量也因之增加。
优选增加的1-脱氧-D-木糖-5-磷酸还原异构酶活性至少为野生型1-脱氧-D-木糖-5-磷酸还原异构酶活性的5%,进一步优选为至少20%、进一步优选为至少50%、进一步优选为至少100%、更优选为至少300%、甚至更优选为至少500%,特别是至少600%。
优选在以下条件下测定本发明中经过遗传修饰的生物,以及野生型或参照生物的1-脱氧-D-木糖-5-磷酸还原异构酶活性:
在研钵中加入液氮,通过强烈研磨匀浆冷冻生物材料,并用比率从1∶1至1∶20的提取缓冲液进行抽提。具体的比率取决于可获得的生物材料中的酶活性,以便能在线性测量的范围内进行酶活性的测定和量化。通常提取缓冲液中含有50mM HEPES-KOH(pH 7.4)、10mM MgCl2、10mM KCl、1mM EDTA、1mM EGTA、0.1%(v/v)Triton X-100、2mMε-氨基己酸、10%甘油、5mM KHCO3。加入2mM DTT和0.5mM PMSF后立即进行提取。
在下述缓冲液中测定D-1-脱氧木酮糖-5-磷酸还原异构酶(DXR)的活性,所述缓冲液含有100mM Tris-HCl(pH 7.5)、1mM MnCl2、0.3mMNADPH和0.3mM 1-脱氧-D-木酮糖-4-磷酸,其中1-脱氧-D-木酮糖-4-磷酸能够经酶合成(如Kuzuyama,Takahashi,Watanabe和Seto:Tetrahedonletters 39(1998)4509-4512)。加入生物提取物开始反应。反应体积一般可为0.2至0.5ml;37℃孵育30-60分钟。此间,用分光光度计在340nm处监控NADPH的氧化。
异戊烯基二磷酸酯Δ-异构酶活性是指异戊烯基二磷酸酯Δ-异构酶的酶活性。
异戊烯基二磷酸酯Δ-异构酶是指一种蛋白质,其具有将异戊烯基二磷酸酯转化为二甲基烯丙基磷酸酯的酶活性。
据此,异戊烯基二磷酸酯Δ-异构酶活性是指在一定时间内由异戊烯基二磷酸酯Δ-异构酶转化的异戊烯基二磷酸酯的量或形成的二甲基烯丙基磷酸酯的量。
当异戊烯基二磷酸酯Δ-异构酶活性相对于野生型增加时,与野生型相比,在一定时间内由蛋白质异戊烯基二磷酸酯Δ-异构酶转化的异戊烯基二磷酸酯的量或形成的二甲基烯丙基磷酸酯的量也因之增加。
优选增加的异戊烯基二磷酸酯Δ-异构酶活性至少为野生型异戊烯基二磷酸酯Δ-异构酶活性的5%,进一步优选为至少20%、进一步优选为至少50%、进一步优选为至少100%、更优选为至少300%、甚至更优选为至少500%,特别是至少600%。
优选在以下条件下测定本发明中经过遗传修饰的生物,以及野生型或参照生物的异戊烯基二磷酸酯Δ-异构酶活性:
在研钵中加入液氮,通过强烈研磨匀浆冷冻生物材料,并用比率从1∶1至1∶20的提取缓冲液进行抽提。具体的比率取决于可获得的生物材料中的酶活性,以便能在线性测量的范围内进行酶活性的测定和量化。通常提取缓冲液中含有50mM HEPES-KOH(pH 7.4)、10mM MgCl2、10mM KCl、1mM EDTA、1mM EGTA、0.1%(v/v)Triton X-100、2mMε-氨基己酸、10%甘油、5mM KHCO3。加入2mM DTT和0.5mM PMSF后立即进行提取。
根据Fraser及其同事公开的方法(Fraser,R_mer,Shipton,Mills,Kiano,Misawa,Drake,Schuch和Bramley:Evaluation of transgenictomato plants expressing an additional phytoene synthase in a fruit-specificmanner;Proc.Natl.Acad.Sci.USA 99(2002),1092-1097,基于Fraser,Pinto,Holloway和Bramley,Plant Journal 24(2000),551-558),可以测定异戊烯基二磷酸酯异构酶(IPP异构酶)的活性。为进行酶测定,在含有1mM DTT、4mM MgCl2、6mM MnCl2、3mM ATP、0.1%Tween-60、1mM氟化钾的0.4M Tris-HCl(pH 8.0)中(体积为大约150-500μl),以0.5μCi(1-14C)IPP(异戊烯基焦磷酸酯)(56mCi/mmol,Amersham plc)为底物进行孵育。将提取物与缓冲液混合(例如以1∶1的比例)并在28℃孵育至少5小时。随后加入约200μl甲醇,并通过加入浓盐酸(终浓度为25%)在37℃进行约1小时酸水解。然后使用石油醚(与10%二乙醚混合)进行两次抽提(每次500μl)。利用闪烁计数器测定上层等分试样中的放射性。通过5分钟的短期孵育能够测定特异酶活性,因为短的反应时间抑制反应副产物生成(见Lützow和Beyer:The isopentenyl phosphate Δ-isomeraseand its relation to the phytoene synthase complex in daffodil chromoplasts;Biochim.Biophys.Acta 959(1988),118-126)。
牻牛儿基二磷酸酯合酶活性是指牻牛儿基二磷酸酯合酶的酶活性。
牻牛儿基二磷酸酯合酶是指一种蛋白质,其具有将异戊烯基二磷酸酯和二甲基烯丙基磷酸酯转化为牻牛儿基二磷酸酯的酶活性。
据此,牻牛儿基二磷酸酯合酶活性是指在一定时间内由牻牛儿基二磷酸酯合酶蛋白质转化的异戊烯基二磷酸酯和/或二甲基烯丙基磷酸酯的量或形成的牻牛儿基二磷酸酯的量。
当牻牛儿基二磷酸酯合酶活性相对于野生型增加时,与野生型相比,在一定时间内由蛋白质牻牛儿基二磷酸酯合酶转化的异戊烯基二磷酸酯和/或二甲基烯丙基磷酸酯的量,或形成的牻牛儿基二磷酸酯的量也因之增加。
优选增加的牻牛儿基二磷酸酯合酶活性至少为野生型牻牛儿基二磷酸酯合酶活性的5%,进一步优选为至少20%、进一步优选为至少50%、进一步优选为至少100%、更优选为至少300%、甚至更优选为至少500%,特别是至少600%。
优选在以下条件下测定本发明中经过遗传修饰的生物以及野生型或参照生物的牻牛儿基二磷酸酯合酶的活性:
在研钵中加入液氮,通过强烈研磨匀浆冷冻生物材料,并用比率从1∶1至1∶20的提取缓冲液进行抽提。具体的比率取决于可获得的生物材料中的酶活性,以便能在线性测量的范围内进行酶活性的测定和量化。通常提取缓冲液中含有50mM HEPES-KOH(pH 7.4)、10mM MgCl2、10mM KCl、1mM EDTA、1mM EGTA、0.1%(v/v)Triton X-100、2mM ε-氨基己酸、10%甘油、5mM KHCO3。加入2mM DTT和0.5mM PMSF后立即进行提取。
向50mM Tris-HCl(pH 7.6)、10mM MgCl2、5mM MnCl2、2mMDTT、1mMATP、0.2%Tween-20、5μM(14C)IPP和50μM DMAPP(二甲基烯丙基焦磷酸酯)中加入生物提取物,能够测定牻牛儿基二磷酸酯合酶(GPP合酶)的活性(根据Bouvier,Suire,d’Harlingue,Backhaus和Camara:Molecular cloning of geranyl diphosphate synthase and compartmentationof monoterpene synthesis in plant cells,Plant Journal 24(2000)241-252)。在如37℃下孵育2小时后,将反应产物去磷酸化(根据Koyama、Fuji和Ogura:Enzymatic hydrolysis of polyprenyl pyrophosphates,MethodsEnzymol.110(1985),153-155),利用薄层层析法和放射性掺入测定法进行分析(Dogbo,Bardat,Quennemet和Camara:Metabolism of plastidterpenoids:In vitro inhibition of phytoene synthesis by phenethylpyrophosphate derivates,FEBS Letters 219(1987)211-215)。
法呢基二磷酸酯合酶活性是指法呢基二磷酸酯合酶的酶活性。
法呢基二磷酸酯合酶是指一种蛋白质,其具有依次将2分子异戊烯基二磷酸酯与二甲基烯丙基二磷酸酯反应,所生成的牻牛儿基二磷酸酯再转化为法呢基二磷酸酯的酶活性。
据此,法呢基二磷酸酯合酶活性是指在一定时间内由蛋白质法呢基二磷酸酯合酶转化的二甲基烯丙基二磷酸酯和/或异戊烯基二磷酸酯的量,或形成的法呢基二磷酸酯的量。
当法呢基二磷酸酯合酶活性相对于野生型增加时,与野生型相比,在一定时间内由蛋白质法呢基二磷酸酯合酶转化的二甲基烯丙基二磷酸酯和/或异戊烯基二磷酸酯的量,或形成的法呢基二磷酸酯的量也因之增加。
优选增加的法呢基二磷酸酯合酶活性至少为野生型法呢基二磷酸酯合酶活性的5%,进一步优选为至少20%、进一步优选为至少50%、进一步优选为至少100%、更优选为至少300%、甚至更优选为至少500%,特别是至少600%。
优选在以下条件下测定本发明中经过遗传修饰的生物,以及野生型或参照生物的法呢基二磷酸酯合酶的活性:
在研钵中加入液氮,通过强烈研磨匀浆冷冻生物材料,并用比率从1∶1至1∶20的提取缓冲液进行抽提。具体的比率取决于可获得的生物材料中的酶活性,以便能在线性测量的范围内进行酶活性的测定和量化。通常提取缓冲液中含有50mM HEPES-KOH(pH 7.4)、10mM MgCl2、10mM KCl、1mM EDTA、1mM EGTA、0.1%(0.1%(v/v)Triton X-100、2mM ε-氨基己酸、10%甘油、5mM KHCO3。加入2mM DTT和0.5mM PMSF后立即进行提取。
根据Joly和Edwards的方法能够测定法尼基焦磷酸酯合酶(FPP合酶)的活性(Journal of Biological Chemistry 268(1993),26983-26989)。即,在含有10mM HEPES(pH 7.2)、1mM MgCl2、1mM二硫苏糖醇、20μM牻牛儿基焦磷酸酯和40μM(1-14C)异戊烯基焦磷酸酯(4Ci/mmol)的缓冲液中测定酶活性。将反应混合物在37℃孵育;加入2.5N HCl(在含有19μg/ml法呢醇的70%乙醇中)终止反应。随后通过酸水解在37℃水解反应产物30分钟。加入10%NaOH中和混合物,并通过与己烷振荡进行抽提。利用闪烁计数器测量己烷相的等分试样以确定掺入的放射性。
或者,将生物提取物与放射性标记的IPP孵育之后,在苯/甲醇(9∶1)中通过薄层层析(Silica-Gel SE60,Merck)分离反应产物。洗脱放射性标记的产物并测定其放射活性(根据Gaffe,Bru,Causse,Vidal,Stamitti-Bert,Carde和Gallusci:LEFPS1,a tomato farnesyl pyrophosphate gene highlyexpressed during early fruit development;Plant Physiology 123(2000)1351-1362)。
牻牛儿基牻牛儿基二磷酸酯合酶活性是指牻牛儿基牻牛儿基二磷酸酯合酶的酶活性。
牻牛儿基牻牛儿基二磷酸酯合酶是指一种蛋白质,其具有将法呢基二磷酸酯和异戊烯基二磷酸酯转化为牻牛儿基牻牛儿基二磷酸酯的酶活性。
据此,牻牛儿基牻牛儿基二磷酸酯合酶活性是指在一定时间内由蛋白质牻牛儿基牻牛儿基二磷酸酯合酶转化的法呢基二磷酸酯和/或异戊烯基二磷酸酯的量,或形成的牻牛儿基牻牛儿基二磷酸酯的量。
当牻牛儿基牻牛儿基二磷酸酯合酶活性相对于野生型增加时,与野生型相比,在一定时间内由蛋白质牻牛儿基牻牛儿基二磷酸酯合酶转化的法呢基二磷酸酯和/或异戊烯基二磷酸酯的量,或形成的牻牛儿基牻牛儿基二磷酸酯的量也因之增加。
优选增加的牻牛儿基牻牛儿基二磷酸酯合酶活性至少为野生型活性的5%,进一步优选为至少20%、进一步优选为至少50%、进一步优选为至少100%、更优选为至少300%、甚至更优选为至少500%,特别是至少600%。
优选在以下条件下测定本发明中经过遗传修饰的生物,以及野生型或参照生物的牻牛儿基牻牛儿基二磷酸酯合酶的活性:
在研钵中加入液氮,通过强烈研磨匀浆冷冻生物材料,并用比率从1∶1至1∶20的提取缓冲液进行抽提。具体的比率取决于可获得的生物材料中的酶活性,以便能在线性测量的范围内进行酶活性的测定和量化。通常提取缓冲液中含有50mM HEPES-KOH(pH 7.4)、10mM MgCl2、10mM KCl、1mM EDTA、1mM EGTA、0.1%(v/v)Triton X-100、2mM ε-氨基己酸、10%甘油、5mM KHCO3。加入2mM DTT和0.5mM PMSF后立即进行提取。
可以根据Dogbo和Camara所述的方法测定牻牛儿基牻牛儿基焦磷酸酯合酶(GGPP合酶)的活性(Biochim.Biophys.Acta 920(1987),140-148:Purification of isopentenyl pyrophosphate isomerase and geranylgeranylpyrophosphate synthase from Capsicum chromoplasts by affinitychromatography)。为此,将总体积约为200μl的生物提取物加入缓冲液(50mM Tris-HCl(pH 7.6)、2mM MgCl2、1mM MnCl2、2mM二硫苏糖醇、(1-14C)IPP(0.1μCi、10μM)、15μM DMAPP、GPP或FPP)中。在30℃孵育1-2小时(或更长)。加入0.5ml乙醇和0.1ml 6N HCl终止反应。37℃孵育10分钟之后,用6N NaOH中和反应混合物,与1ml水混合并用4ml乙醚振荡进行抽提。利用闪烁计数测定乙醚相等分试样(如0.2ml)中的放射活性。或者在酸水解之后,可通过在乙醚中振荡抽提放射性标记的异戊二烯醇,并利用HPLC(25cm Spherisorb ODS-1柱,5μm;用甲醇/水(90∶10;v/v)以1ml/分钟的流速洗脱)分离,并通过放射活性监测进行定量(Wiedemann,Misawa和Sandmann:Purification and enzymaticcharacterization of the geranylgeranyl pyrophosphate synthase fromErwinia uredovora after expression in Escherichia coli;ArchivesBiochemistry and Biophysics 306(1993),152-157)。
八氢番茄红素合酶活性是指八氢番茄红素合酶的酶活性。
具体而言,八氢番茄红素合酶是指一种具有将牻牛儿基牻牛儿基二磷酸酯转化为八氢番茄红素的酶活性的蛋白质。
据此,八氢番茄红素合酶活性是指在一定时间内由蛋白质八氢番茄红素合酶转化的牻牛儿基牻牛儿基二磷酸酯的量,或形成的八氢番茄红素的量。
当八氢番茄红素合酶活性相对于野生型增加时,与野生型相比,在一定时间内由蛋白质八氢番茄红素合酶转化的牻牛儿基牻牛儿基二磷酸酯的量,或形成的八氢番茄红素的量也因之增加。
优选增加的八氢番茄红素合酶活性至少为野生型八氢番茄红素合酶活性的5%,进一步优选为至少20%、进一步优选为至少50%、进一步优选为至少100%、更优选为至少300%、甚至更优选为至少500%,特别是至少600%。
优选在以下条件下测定本发明中经过遗传修饰的生物,以及野生型或参照生物的八氢番茄红素合酶的活性:
在研钵中加入液氮,通过强烈研磨匀浆冷冻生物材料,并用比率从1∶1至1∶20的提取缓冲液进行抽提。具体的比率取决于可获得的生物材料中的酶活性,以便能在线性测量的范围内进行酶活性的测定和量化。通常提取缓冲液中含有50mM HEPES-KOH(pH 7-4)、10mM MgCl2、10mM KCl、1mM EDTA、1mM EGTA、0.1%(v/v)Triton X-100、2mMε-氨基己酸、10%甘油、5mM KHCO3。加入2mM DTT和0.5mM PMSF后立即进行提取。
根据Fraser及其同事所发表的方法能够测定八氢番茄红素合酶(PSY)活性(Fraser,Romer,Shipton,Mills,Kiano,Misawa,Drake,Schuch和Bramley:Evaluation of transgenic tomato plants expressing an additionalphytoene synthase in a fruit-specific manner,Proc.Natl.Acad.Sci.USA 99(2002),1092-1097,基于Fraser,Pinto,Holloway和Bramley,Plant Journal24(2000)551-558)。为测定酶,在含有1mM DTT、4mM MgCl2、6mMMnCl2、3mM ATP、0.1%Tween-60、1mM氟化钾的0.4M Tris-HCl(pH 8.0)中,以(3H)牻牛儿基牻牛儿基焦磷酸酯(15mCi/mM,AmericanRadiolabeled Chemicals,St.Louis)为底物进行孵育。将生物提取物与缓冲液混合,例如将295μl缓冲液与提取物混合使总体积为500μl。该混合物在28℃孵育至少5小时。随后用氯仿两次(每次500μl)振荡抽提八氢番茄红素。通过薄层层析法,在甲醇/水(95∶5;v/v)的二氧化硅板上分离反应中形成的放射性标记的八氢番茄红素。富碘环境下(通过加热几块碘晶体)可以在二氧化硅板上鉴定八氢番茄红素。以八氢番茄红素标准品作为参照。通过闪烁计数器测定法检测放射性标记产物的量。或者,也可以利用装有放射性探测器的HPLC定量八氢番茄红素(Fraser、Albrecht和Sandmann:Development of high performance liquid chromatographic systems for theseparation of radiolabeled carotenes and precursors formed in specificenzymatic reactions;J.Chromatogr.645(1993)265-272)。
八氢番茄红素去饱和酶活性是指八氢番茄红素去饱和酶的酶活性。
八氢番茄红素去饱和酶是指一种蛋白质,其具有将八氢番茄红素转化为六氢番茄红素和/或将六氢番茄红素转化为ζ-胡萝卜素(zeta-胡萝卜素)的酶活性。
据此,八氢番茄红素去饱和酶活性是指在一定时间内由蛋白质八氢番茄红素去饱和酶转化的八氢番茄红素或六氢番茄红素的量,或形成的六氢番茄红素或ζ-胡萝卜素的量。
当八氢番茄红素去饱和酶活性相对于野生型增加时,与野生型相比,在一定时间内由蛋白质八氢番茄红素去饱和酶转化的八氢番茄红素或六氢番茄红素的量,或形成的六氢番茄红素或ζ-胡萝卜素的量也因之增加。
优选增加的八氢番茄红素去饱和酶活性至少为野生型八氢番茄红素去饱和酶活性的5%,进一步优选为至少20%、进一步优选为至少50%、进一步优选为至少100%、更优选为至少300%、甚至更优选为至少500%,特别是至少600%。
优选在以下条件下测定本发明中经过遗传修饰的生物,以及野生型或参照生物的八氢番茄红素去饱和酶活性:
在研钵中加入液氮,通过强烈研磨匀浆冷冻生物材料,并用比率从1∶1至1∶20的提取缓冲液进行抽提。具体的比率取决于可获得的生物材料中的酶活性,以便能在线性测量的范围内进行酶活性的测定和量化。通常提取缓冲液中含有50mM HEPES-KOH(pH 7.4)、10mM MgCl2、10mM KCl、1mM EDTA、1mM EGTA、0.1%(v/v)Triton X-100、2mMε-氨基己酸、10%甘油、5mM KHCO3。加入2mM DTT和0.5mM PMSF后立即进行提取。
将放射性标记的(14C)-八氢番茄红素插入不饱和胡萝卜素中能够测定八氢番茄红素去饱和酶(PDS)的活性(根据R_mer,Fraser,Kiano,Shipton,Misawa,Schuch和Bramley Elevation of the provitamin A content oftransgenic tomato plants;Nature Biotechnology 18(2000)666-669)。可如Fraser所述合成放射性标记的八氢番茄红素(Fraser,De la Rivas,Mackenzie,Bramley:Phycomyces blakesleanus CarB mutants:their use inassays of phytoene desaturase;Phytochemistry 30(1991),3971-3976)。可在含有10mM MgCl2和1mM二硫苏糖醇的100mM MES缓冲液(pH 6.0)(总体积为1ml)中孵育靶组织的质体膜。加入溶于丙酮中的(14C)八氢番茄红素(每例中每次孵育约100000裂变/分钟),其中丙酮浓度不超过5%(v/v)。将混合物在28℃下暗处振荡孵育约6-7小时。随后,用约5ml石油醚(与10%乙醚混合)抽提色素三次并通过HPLC法分离并定量。
或者,可根据Fraser等(Fraser,Misawa,Linden,Yamano,Kobayashi和Sandmann:Expression in Escherichia coli,purification,and reactivationof the recombinant Erwinia uredovora phytoene desaturase,Journal ofBiological Chemistry 267(1992),19891-19895)的方法,测定八氢番茄红素去饱和酶的活性。
ζ-胡萝卜素去饱和酶活性是指ζ-胡萝卜素去饱和酶的酶活性。
ζ-胡萝卜素去饱和酶是指一种蛋白质,其具有将ζ-胡萝卜素转化为四氢番茄红素和/或将四氢番茄红素转化为番茄红素的酶活性。
据此,ζ-胡萝卜素去饱和酶活性是指在一定时间内由蛋白质ζ-胡萝卜素去饱和酶转化的ζ-胡萝卜素或四氢番茄红素的量或形成的四氢番茄红素或番茄红素的量。
当ζ-胡萝卜素去饱和酶活性相对于野生型增加时,与野生型相比,在一定时间内由蛋白质ζ-胡萝卜素去饱和酶转化的ζ-胡萝卜素或四氢番茄红素的量,或形成的四氢番茄红素或番茄红素的量也因之增加。
优选增加的ζ-胡萝卜素去饱和酶活性至少为野生型ζ-胡萝卜素去饱和酶活性的5%,进一步优选为至少20%、进一步优选为至少50%、进一步优选为至少100%、更优选为至少300%、甚至更优选为至少500%,特别是至少600%。
优选在以下条件下测定本发明中经过遗传修饰的生物,以及野生型或参照生物的ζ-胡萝卜素去饱和酶活性:
在研钵中加入液氮,通过强烈研磨匀浆冷冻生物材料,并用比率从1∶1至1∶20的提取缓冲液进行抽提。具体的比率取决于可获得的生物材料中的酶活性,以便能在线性测量的范围内进行酶活性的测定和量化。通常提取缓冲液中含有50mM HEPES-KOH(pH 7.4)、10mM MgCl2、10mM KCl、1mM EDTA、1mM EGTA、0.1%(v/v)Triton X-100、2mMε-氨基己酸、10%甘油、5mM KHCO3。加入2mM DTT和0.5mM PMSF后立即进行提取。
可在0.2M磷酸钾(pH 7.8,缓冲液体积大约1ml)中进行测定ζ-胡萝卜素去饱和酶(ZDS去饱和酶)的分析。其分析方法已由Breitenbach及其同事发表(Breitenbach,Kuntz,Takaichi和Sandmann:Catalytic propertiesof an expressed and purified higher plant type ζ-carotene desaturase fromCapsicum annuum;European Journal of Biochemistry.265(1):376-383,1999)。每种分析混合物含有3mg悬浮于0.4M磷酸钾缓冲液(pH 7.8)中的磷脂酰胆碱、5μgζ-胡萝卜素或四氢番茄红素、0.02%丁基羟基甲苯、10μl癸基质体醌(1mM甲醇贮存液)及生物提取物。生物提取物的体积需根据存在的ZDS去饱和酶活性进行调节,以便能在线性测量范围内进行定量。孵育一般在暗处、约28℃下,剧烈振荡(200转/分钟)进行约17小时。加入4ml丙酮在50℃时振荡10分钟抽提类胡萝卜素。将类胡萝卜素从该混合物转移至石油醚相(含有10%乙醚)。在氮气中蒸发乙醚/石油醚相,将类胡萝卜素重新溶为20μl并通过HPLC法进行分离和定量。
crtISO活性是指crtISO蛋白的酶活性。
crtISO蛋白是指一种蛋白质,其具有将7,9,7’,9’-四顺式番茄红素转化为全反式番茄红素的酶活性。
据此,crtISO活性是指在一定时间内由蛋白质crtISO转化的7,9,7’,9’-四顺式番茄红素的量或形成的全反式番茄红素的量。
当crtISO活性相对于野生型增加时,与野生型相比,在一定时间内由crtISO蛋白转化的7,9,7’,9’-四顺式番茄红素的量或形成的全反式番茄红素的量也因之增加。
优选增加的crtISO活性至少为野生型crtISO活性的5%,进一步优选为至少20%、进一步优选为至少50%、进一步优选为至少100%、更优选为至少300%、甚至更优选为至少500%,特别是至少600%。
FtsZ活性是指FtsZ蛋白的生理学活性。
FtsZ蛋白是指一种蛋白质,其具有促进细胞分裂和质体分裂的活性,且与微管蛋白质同源。
MinD活性是指MinD蛋白的生理学活性。
MinD蛋白是指一种在细胞分裂中具有多功能作用的蛋白质。它是一种膜相关ATP酶并且在细胞内可表现为从一极到另一极的振动运动。
另外,非甲羟戊酸途径的酶活性的增加能够导致目的酮类胡萝卜素终产物的进一步增加。其实例包括,4-二磷酸胞苷(diphosphocytidyl)-2-C-甲基-D-赤藓醇合酶、4-二磷酸胞苷-2-C-甲基-D-赤藓醇激酶和2-C-甲基-D-赤藓醇-2,4-环二磷酸酯合酶。通过修饰相应基因的基因表达,可以提高所述酶的活性。以标准方式通过抗体和相应印迹技术能够检测相应蛋白质的浓度改变。
可以通过多种途径,增加HMG-CoA还原酶活性和/或(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶活性和/或1-脱氧-D-木糖-5-磷酸合酶活性和/或1-脱氧-D-木糖-5-磷酸还原异构酶活性和/或异戊烯基二磷酸酯Δ-异构酶活性和/或牻牛儿基二磷酸酯合酶活性和/或法呢基二磷酸酯合酶活性和/或牻牛儿基牻牛儿基二磷酸酯合酶活性和/或八氢番茄红素合酶活性和/或八氢番茄红素去饱和酶活性和/或ζ-胡萝卜素去饱和酶活性和/或crtISO活性和/或FtsZ活性和/或MinD活性,例如通过在表达和蛋白质水平关闭抑制性调节机制,或通过提高编码HMG-CoA还原酶的核酸和/或编码(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶的核酸和/或编码1-脱氧-D-木糖-5-磷酸合酶的核酸和/或编码1-脱氧-D-木糖-5-磷酸还原异构酶的核酸和/或编码异戊烯基二磷酸酯Δ-异构酶的核酸和/或编码牻牛儿基二磷酸酯合酶的核酸和/或编码法呢基二磷酸酯合酶的核酸和/或编码牻牛儿基牻牛儿基二磷酸酯合酶的核酸和/或编码八氢番茄红素合酶的核酸和/或编码八氢番茄红素去饱和酶的核酸和/或编码ζ-胡萝卜素去饱和酶的核酸和/或编码crtISO蛋白的核酸和/或编码FtsZ蛋白的核酸和/或编码MinD蛋白的核酸相对于野生型的基因表达。
也可通过多种途径提高编码HMG-CoA还原酶的核酸和/或编码(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶的核酸和/或编码1-脱氧-D-木糖-5-磷酸合酶的核酸和/或编码1-脱氧-D-木糖-5-磷酸还原异构酶的核酸和/或编码异戊烯基二磷酸酯Δ-异构酶的核酸和/或编码牻牛儿基二磷酸酯合酶的核酸和/或编码法呢基二磷酸酯合酶的核酸和/或编码牻牛儿基牻牛儿基二磷酸酯合酶的核酸和/或编码八氢番茄红素合酶的核酸和/或编码八氢番茄红素去饱和酶的核酸和/或编码ζ-胡萝卜素去饱和酶的核酸和/或编码crtISO蛋白的核酸和/或编码FtsZ蛋白的核酸和/或编码MinD蛋白的核酸相对于野生型的基因表达,例如通过活化剂诱导HMG-CoA还原酶基因和/或(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶基因和/或1-脱氧-D-木糖-5-磷酸合酶基因和/或1-脱氧-D-木糖-5-磷酸还原异构酶基因和/或异戊烯基二磷酸酯Δ-异构酶基因和/或牻牛儿基二磷酸酯合酶基因和/或法呢基二磷酸酯合酶基因和/或牻牛儿基牻牛儿基二磷酸酯合酶基因和/或八氢番茄红素合酶基因和/或八氢番茄红素去饱和酶基因和/或ζ-胡萝卜素去饱和酶基因和/或crtISO基因和/或Fts基因和/或MinD基因,或者通过插入一个或多个拷贝的HMG-CoA还原酶基因和/或(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶基因和/或1-脱氧-D-木糖-5-磷酸合酶基因和/或1-脱氧-D-木糖-5-磷酸还原异构酶基因和/或异戊烯基二磷酸酯Δ-异构酶基因和/或牻牛儿基二磷酸酯合酶基因和/或法呢基二磷酸酯合酶基因和/或牻牛儿基牻牛儿基二磷酸酯合酶基因和/或八氢番茄红素合酶基因和/或八氢番茄红素去饱和酶基因和/或ζ-胡萝卜素去饱和酶基因和/或crtISO基因和/或Fts基因和/或MinD基因,即向植物中插入至少一个编码HMG-CoA还原酶的核酸和/或至少一个编码(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶的核酸和/或至少一个编码1-脱氧-D-木糖-5-磷酸合酶的核酸和/或至少一个编码1-脱氧-D-木糖-5-磷酸还原异构酶的核酸和/或至少一个编码异戊烯基二磷酸酯Δ-异构酶的核酸和/或至少一个编码牻牛儿基二磷酸酯合酶的核酸和/或至少一个编码法呢基二磷酸酯合酶的核酸和/或至少一个编码牻牛儿基牻牛儿基二磷酸酯合酶的核酸和/或至少一个编码八氢番茄红素合酶的核酸和/或至少一个编码八氢番茄红素去饱和酶的核酸和/或至少一个编码ζ-胡萝卜素去饱和酶的核酸和/或至少一个编码crtISO蛋白的核酸和/或至少一个编码FtsZ蛋白的核酸和/或至少一个编码MinD蛋白的核酸。
根据本发明,编码HMG-CoA还原酶的核酸和/或编码(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶的核酸和/或编码1-脱氧-D-木糖-5-磷酸合酶的核酸和/或编码1-脱氧-D-木糖-5-磷酸还原异构酶的核酸和/或编码异戊烯基二磷酸酯Δ-异构酶的核酸和/或编码牻牛儿基二磷酸酯合酶的核酸和/或编码法呢基二磷酸酯合酶的核酸和/或编码牻牛儿基牻牛儿基二磷酸酯合酶的核酸和/或编码八氢番茄红素合酶的核酸和/或编码八氢番茄红素去饱和酶的核酸和/或编码ζ-胡萝卜素去饱和酶的核酸和/或编码crtISO蛋白的核酸和/或编码FtsZ蛋白的核酸和/或编码MinD蛋白的核酸的基因表达的增加,也指对该生物自身的内源HMG-CoA还原酶和/或(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶和/或1-脱氧-D-木糖-5-磷酸合酶和/或1-脱氧-D-木糖-5-磷酸还原异构酶和/或异戊烯基二磷酸酯Δ-异构酶和/或牻牛儿基二磷酸酯合酶和/或法呢基二磷酸酯合酶和/或牻牛儿基牻牛儿基二磷酸酯合酶和/或八氢番茄红素合酶和/或八氢番茄红素去饱和酶和/或ζ-胡萝卜素去饱和酶和/或crtISO蛋白和/或FtsZ蛋白和/或MinD蛋白表达的调控。
这一点可以通过如修饰相应启动子DNA序列来实现。这一修饰可以通过DNA序列的缺失或插入来实现,从而增加该基因的表达率。
在优选实施方案中,编码HMG-CoA还原酶核酸的基因表达的增加和/或编码(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶核酸的基因表达的增加和/或编码1-脱氧-D-木糖-5-磷酸合酶核酸的基因表达的增加和/或编码1-脱氧-D-木糖-5-磷酸还原异构酶核酸的基因表达的增加和/或编码异戊烯基二磷酸酯Δ-异构酶核酸的基因表达的增加和/或编码牻牛儿基二磷酸酯合酶核酸的基因表达的增加和/或编码法呢基二磷酸酯合酶核酸的基因表达的增加和/或编码牻牛儿基牻牛儿基二磷酸酯合酶核酸的基因表达的增加和/或编码八氢番茄红素合酶核酸的基因表达的增加和/或编码八氢番茄红素去饱和酶核酸的基因表达的增加和/或编码ζ-胡萝卜素去饱和酶核酸的基因表达的增加和/或编码crtISO蛋白核酸的基因表达的增加和/或编码FtsZ蛋白核酸的基因表达的增加和/或编码MinD蛋白核酸的基因表达的增加是通过向植物中插入至少一个编码HMG-CoA还原酶的核酸和/或至少一个编码(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶的核酸和/或至少一个编码1-脱氧-D-木糖-5-磷酸合酶的核酸和/或至少一个编码1-脱氧-D-木糖-5-磷酸还原异构酶的核酸和/或至少一个编码异戊烯基二磷酸酯Δ-异构酶的核酸和/或至少一个编码牻牛儿基二磷酸酯合酶的核酸和/或至少一个编码法呢基二磷酸酯合酶的核酸和/或至少一个编码牻牛儿基牻牛儿基二磷酸酯合酶的核酸和/或至少一个编码八氢番茄红素合酶的核酸和/或至少一个编码八氢番茄红素去饱和酶的核酸和/或至少一个编码ζ-胡萝卜素去饱和酶的核酸和/或至少一个编码crtISO蛋白的核酸和/或至少一个编码FtsZ蛋白的核酸和/或至少一个编码MinD蛋白的核酸而实现。
为此,原则上可以使用任何HMG-CoA还原酶基因或(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶基因或1-脱氧-D-木糖-5-磷酸合酶基因或1-脱氧-D-木糖-5-磷酸还原异构酶基因或异戊烯基二磷酸酯Δ-异构酶基因或牻牛儿基二磷酸酯合酶基因或法呢基二磷酸酯合酶基因或牻牛儿基牻牛儿基二磷酸酯合酶基因或八氢番茄红素合酶基因或八氢番茄红素去饱和酶基因或ζ-胡萝卜素去饱和酶基因或crtISO基因或FtsZ基因或MinD基因。
对于真核生物来源的含有内含子的基因组HMG-CoA还原酶序列或(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶序列或1-脱氧-D-木糖-5-磷酸合酶序列或1-脱氧-D-木糖-5-磷酸还原异构酶序列或异戊烯基二磷酸酯Δ-异构酶序列或牻牛儿基二磷酸酯合酶序列或法呢基二磷酸酯合酶序列或牻牛儿基牻牛儿基二磷酸酯合酶序列或八氢番茄红素合酶序列或八氢番茄红素去饱和酶序列或ζ-胡萝卜素去饱和酶序列或crtISO序列或FtsZ序列或MinD序列,在宿主生物不能或不能通过改造来表达相应酮酶时,优选使用已经加工的核酸序列,如相应的cDNA。
该优选的实施方案中,与野生型相比,本发明优选的转基因生物中至少还存在另一个HMG-CoA还原酶基因和/或(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶基因和/或1-脱氧-D-木糖-5-磷酸合酶基因和/或1-脱氧-D-木糖-5-磷酸还原异构酶基因和/或异戊烯基二磷酸酯Δ-异构酶基因和/或牻牛儿基二磷酸酯合酶基因和/或法呢基二磷酸酯合酶基因和/或牻牛儿基牻牛儿基二磷酸酯合酶基因和/或八氢番茄红素合酶基因和/或八氢番茄红素去饱和酶基因和/或ζ-胡萝卜素去饱和酶基因和/或crtISO基因和/或FtsZ基因和/或MinD基因。
在该优选实施方案中,遗传修饰的植物具有,例如至少一个编码HMG-CoA还原酶的外源核酸或至少两个编码HMG-CoA还原酶的内源核酸,和/或至少一个编码(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶的外源核酸或至少两个编码(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶的内源核酸,和/或至少一个编码1-脱氧-D-木糖-5-磷酸合酶的外源核酸或至少两个编码1-脱氧-D-木糖-5-磷酸合酶的内源核酸,和/或至少一个编码1-脱氧-D-木糖-5-磷酸还原异构酶的外源核酸或至少两个编码1-脱氧-D-木糖-5-磷酸还原异构酶的内源核酸,和/或至少一个编码异戊烯基二磷酸酯Δ-异构酶的外源核酸或至少一个编码异戊烯基二磷酸酯Δ-异构酶的内源核酸,和/或至少一个编码牻牛儿基二磷酸酯合酶的外源核酸或至少两个编码牻牛儿基二磷酸酯合酶的内源核酸,和/或至少一个编码法呢基二磷酸酯合酶的外源核酸或至少两个编码法呢基二磷酸酯合酶的内源核酸,和/或至少一个编码牻牛儿基牻牛儿基二磷酸酯合酶的外源核酸或至少两个编码牻牛儿基牻牛儿基二磷酸酯合酶的内源核酸,和/或至少一个编码八氢番茄红素合酶的外源核酸或至少一个编码八氢番茄红素合酶的内源核酸,和/或至少一个编码八氢番茄红素去饱和酶的外源核酸或至少两个编码八氢番茄红素去饱和酶的内源核酸,和/或至少一个编码ζ-胡萝卜素去饱和酶的外源核酸或至少两个编码ζ-胡萝卜素去饱和酶的内源核酸,和/或至少一个编码crtISO蛋白的外源核酸或至少两个编码crtISO蛋白的内源核酸,和/或至少一个编码FtsZ蛋白的外源核酸或至少两个编码FtsZ蛋白的内源核酸,和/或至少一个编码MinD蛋白的外源核酸或至少两个编码MinD蛋白的内源核酸。
HMG-CoA还原酶基因的实例为:
拟南芥(Arabidopsis thaliana)来源的编码HMG-CoA还原酶的核酸,登录号NM_106299(核酸:SEQ ID NO:7,蛋白质:SEQ ID NO:8),
还包括其他生物来源的登录号如下的其他HMG-CoA还原酶基因:
P54961、P54870、P54868、P54869、O02734、P22791、P54873、P54871、P23228、P13704、P54872、Q01581、P17425、P54874、P54839、P14891、P34135、O64966、P29057、P48019、P48020、P12683、P43256、Q9XEL8、P34136、O64967、P29058、P48022、Q41437、P12684、Q00583、Q9XHL5、Q41438、Q9YAS4、O76819、O28538、Q9Y7D2、P54960、O51628、P48021、Q03163、P00347、P14773、Q12577、Q59468、P04035、O24594、P09610、Q58116、O26662、Q01237、Q01559、Q12649、O74164、O59469、P51639、Q10283、O08424、P20715、P13703、P13702、Q96UG4、Q8SQZ9、O15888、Q9TUM4、P93514、Q39628、P93081、P93080、Q944T9、Q40148、Q84MM0、Q84LS3、Q9Z9N4、Q9KLM0。
(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶基因的实例为:
拟南芥来源的编码(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶的核酸(lytB/ISPH),登录号AY168881,(核酸:SEQ ID NO:9,蛋白质:SEQ ID NO:102),
还包括其他生物来源的登录号如下的其他(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶基因:
T04781、AF270978_1、NP_485028.1、NP_442089.1、NP_681832.1、ZP_00110421.1、ZP_00071594.1、ZP_00114706.1、ISPH_SYNY3、ZP_00114087.1、ZP_00104269.1、AF398145_1、AF398146_1、AAD55762.1、AF514843_1、NP_622970.1、NP_348471.1、NP_562001.1、NP_223698.1、NP_781941.1、ZP_00080042.1、NP_859669.1、NP_214191.1、ZP_00086191.1、ISPH_VIBCH、NP_230334.1、NP_742768.1、NP_302306.1、ISPH_MYCLE、NP_602581.1、ZP_00026966.1、NP_520563.1、NP_253247.1、NP_282047.1、ZP_00038210.1、ZP_00064913.1、CAA61555.1、ZP_00125365.1、ISPH_ACICA、EAA24703.1、ZP_00013067.1、ZP_00029164.1、NP_790656.1、NP_217899.1、NP_641592.1、NP_636532.1、NP_719076.1、NP_660497.1、NP_422155.1、NP_715446.1、ZP_00090692.1、NP_759496.1、ISPH_BURPS、ZP_00129657.1、NP_215626.1、NP_335584.1、ZP_00135016.1、NP_789585.1、NP_787770.1、NP_769647.1、ZP_00043336.1、NP_242248.1、ZP_00008555.1、NP_246603.1、ZP_00030951.1、NP_670994.1、NP_404120.1、NP_540376.1、NP_733653.1、NP_697503.1、NP_840730.1、NP_274828.1、NP_796916.1、ZP_00123390.1、NP_824386.1、NP_737689.1、ZP_00021222.1、NP_757521.1、NP_390395.1、ZP_00133322.1、CAD76178.1、NP_600249.1、NP_454660.1、NP_712601.1、NP_385018.1、NP_751989.1。
1-脱氧-D-木糖-5-磷酸合酶基因的实例为:
食用番茄(Lycopersicon esculentum)来源的编码1-脱氧-D-木糖-5-磷酸合酶的核酸,登录号#AF143812(核酸:SEQ ID NO:103,蛋白质:SEQ IDNO:12),
还包括其他生物体来源的登录号如下的其他1-脱氧-D-木糖-5-磷酸合酶基因:
AF143812_1、DXS_CAPAN、CAD22530.1、AF182286_1、NP_193291.1、T52289、AAC49368.1、AAP14353.1、D71420、DXS_ORYSA、AF443590_1、BAB02345.1、CAA09804.2、NP_850620.1、CAD22155.2、AAM65798.1、NP_566686.1、CAD22531.1、AAC33513.1、CAC08458.1、AAG10432.1、T08140、AAP14354.1、AF428463_1、ZP_00010537.1、NP_769291.1、AAK59424.1、NP_107784.1、NP_697464.1、NP_540415.1、NP_196699.1、NP_384986.1、ZP_00096461.1、ZP_00013656.1、NP_353769.1、BAA83576.1、ZP_00005919.1、ZP_00006273.1、NP_420871.1、AAM48660.1、DXS_RHOCA、ZP_00045608.1、ZP_00031686.1、NP_841218.1、ZP_00022174.1、ZP_00086851.1、NP_742690.1、NP_520342.1、ZP_00082120.1、NP_790545.1、ZP_00125266.1、CAC17468.1、NP_252733.1、ZP_00092466.1、NP_439591.1、NP_414954.1、NP_752465.1、NP_622918.1、NP_286162.1、NP_836085.1、NP_706308.1、ZP_00081148.1、NP_797065.1、NP_213598.1、NP_245469.1、ZP_00075029.1、NP_455016.1、NP_230536.1、NP_459417.1、NP_274863.1、NP_283402.1、NP_759318.1、NP_406652.1、DXS_SYNLE、DXS_SYNP7、NP_440409.1、ZP_00067331.1、ZP_00122853.1、NP_717142.1、ZP_00104889.1、NP_243645.1、NP_681412.1、DXS_SYNEL、NP_637787.1、DXS_CHLTE、ZP_00129863.1、NP_661241.1、DXS_XANCP、NP_470738.1、NP_484643.1、ZP_00108360.1、NP_833890.1、NP_846629.1、NP_658213.1、NP_642879.1、ZP_00039479.1、ZP_00060584.1、ZP_00041364.1、ZP_00117779.1、NP_299528.1。
1-脱氧-D-木糖-5-磷酸还原异构酶基因的实例为:
拟南芥来源的编码1-脱氧-D-木糖-5-磷酸还原异构酶的核酸,登录号#AF148852,(核酸:SEQ ID NO:13,蛋白质:SEQ ID NO:14),
还包括其他生物体来源的登录号如下的其他1-脱氧-D-木糖-5-磷酸还原异构酶基因:
AF148852、AY084775、AY054682、AY050802、AY045634、AY081453、AY091405、AY098952、AJ242588、AB009053、AY202991、NP_201085.1、T52570、AF331705_1、BAB16915.1、AF367205_1、AF250235_1、CAC03581.1、CAD22156.1、AF182287_1、DXR_MENPI、ZP_00071219.1、NP_488391.1、ZP_00111307.1、DXR_SYNLE、AAP56260.1、NP_681831.1、NP_442113.1、ZP_00115071.1、ZP_00105106.1、ZP_00113484.1、NP_833540.1、NP_657789.1、NP_661031.1、DXR_BACHD、NP_833080.1、NP_845693.1、NP_562610.1、NP_623020.1、NP_810915.1、NP_243287.1、ZP_00118743.1、NP_464842.1、NP_470690.1、ZP_00082201.1、NP_781898.1、ZP_00123667.1、NP_348420.1、NP_604221.1、ZP_00053349.1、ZP_00064941.1、NP_246927.1、NP_389537.1、ZP_00102576.1、NP_519531.1、AF124757_19、DXR_ZYMMO、NP_713472.1、NP_459225.1、NP_454827.1、ZP_00045738.1、NP_743754.1、DXR_PSEPK、ZP_00130352.1、NP_702530.1、NP_841744.1、NP_438967.1、AF514841_1、NP_706118.1、ZP_00125845.1、NP_404661.1、NP_285867.1、NP_240064.1、NP_414715.1、ZP_00094058.1、NP_791365.1、ZP_00012448.1、ZP_00015132.1、ZP_00091545.1、NP_629822.1、NPP_798691.1、NP_231885.1、NP_252340.1、ZP_00022353.1、NP_355549.1、NP_420724.1、ZP_00085169.1、EAA17616.1、NP_273242.1、NP_219574.1、NP_387094.1、NP_296721.1、ZP_00004209.1、NP_823739.1、NP_282934.1、BAA77848.1、NP_660577.1、NP_760741.1、NP_641750.1、NP_636741.1、NP_829309.1、NP_298338.1、NP_444964.1、NP_717246.1、NP_224545.1、ZP_00038451.1、DXR_KITGR、NP_778563.1。
异戊烯基二磷酸酯Δ-异构酶基因的实例为:
巴勒斯提纳侧金盏花(Adonis palaestina)克隆ApIPI28来源的编码异戊烯基二磷酸酯Δ-异构酶的核酸(ipiAa1),登录号#AF188060,由Cunningham、F.X.Jr.和Gantt,E.发表:Identification of multi-gene familiesencoding isopentenyl diphosphate isomerase in plants by heterologouscomplementation in Escherichia coli,Plant Cell Physiol.41(1)、119-123(2000)(核酸:SEQ ID NO:15,蛋白质:SEQ ID NO:16),
还包括其他生物体来源的登录号如下的其他异戊烯基二磷酸酯Δ-异构酶基因:
Q38929、O48964、Q39472、Q13907、O35586、P58044、O42641、O35760、Q10132、P15496、Q9YB30、Q8YNH4、Q42553、O27997、P50740、O51627、O48965、Q8KFR5、Q39471、Q39664、Q9RVE2、Q01335、Q9HHE4、Q9BXS1、Q9KWF6、Q9CIF5、Q88WB6、Q92BX2、Q8Y7A5、Q8TT35 Q9KK75、Q8NN99、Q8XD58、Q8FE75、Q46822、Q9HP40、P72002、P26173、Q9Z5D3、Q8Z3X9、Q8ZM82、Q9X7Q6、O13504、Q9HFW8、Q8NJL9、Q9UUQ1、Q9NH02、Q9M6K9、Q9M6K5、Q9FXR6、O81691、Q9S7C4、Q8S3L8、Q9M592、Q9M6K3、Q9M6K7、Q9FV48、Q9LLB6、Q9AVJ1、Q9AVG8、Q9M6K6、Q9AVJ5、Q9M6K2、Q9AYS5、Q9M6K8、Q9AVG7、Q8S3L7、Q8W250、Q94IE 1、Q9AVI8、Q9AYS6、Q9SAY0、Q9M6K4、Q8GVZ0、Q84RZ8、Q8KZ12、Q8KZ66、Q8FND7、Q88QC9、Q8BFZ6、BAC26382、CAD94476。
牻牛儿基二磷酸酯合酶基因的实例为:
拟南芥来源的编码牻牛儿基二磷酸酯合酶的核酸,登录号#Y17376,Bouvier,F.、Suire,C.、d’Harlingue,A.、Backhaus,R.A.和Camara,B.:Molecular cloning of geranyl phosphate synthase and compartmentation ofmonoterpene synthesis in plant cells,Plant J.24(2),241-252(2000)(核酸:SEQ ID NO:17,蛋白质:SEQ ID NO:18),
还包括其他生物体来源的登录号如下的其他牻牛儿基二磷酸酯合酶基因:
Q9FT89、Q8LKJ2、Q9FSW8、Q8LKJ3、Q9SBR3、Q9SBR4、Q9FET8、Q8LKJ1、Q84LG1、Q9JK86。
法呢基二磷酸酯合酶基因的实例为:
拟南芥来源的编码法呢基二磷酸酯合酶的核酸(FPS1),登录号#U80605,发表于Cunillera,N.、Arro,M.、Delourme,D.、Karst,E、Boronat,A.和Ferrer,A.:Arabidopsis thaliana contains two differentially expressedfarnesyl phosphate synthase genes,J.Biol Chem.271(13),7774-7780(1996)(核酸:SEQ ID NO:19,蛋白质:SEQ ID NO:112),
还包括其他生物体来源的登录号如下的其他法呢基二磷酸酯合酶基因:
P53799、P37268、Q02769、Q09152、P49351、O24241、Q43315、P49352、O24242、P49350、P08836、P14324、P49349、P08524、O66952、Q08291、P54383、Q45220、P57537、Q8K9A0、P22939、P45204、O66126、P55539、Q9SWH9、Q9AVI7、Q9FRX2、Q9AYS7、Q94IE8、Q9FXR9、Q9ZWF6、Q9FXR8、Q9AR37、O50009,Q94IE9,Q8RVK7、Q8RVQ7、O04882、Q93RA8、Q93RB0、Q93RB4、Q93RB5,Q93RB3、Q93RB1、Q93RB2、Q920E5。
牻牛儿基牻牛儿基二磷酸酯合酶基因的实例为:
白芥(Sinapis alba)来源的编码牻牛儿基牻牛儿基二磷酸酯合酶的核酸,登录号#X98795,发表于Bonk,M.、Hoffmann,B.、Von Lintig,J.、Schledz,M.、Al-Babili,S.、Hobeika,E.、Kleinig,H.和Beyer,P.:Chloroplastimport of four carotenoid biosynthetic enzymes in vitro reveals differentialfates prior to membrane binding and oligomeric assembly,Eur.J.Biochem.247(3),942-950(1997)(核酸:SEQ ID NO:21,蛋白质:SEQ ID NO:114),
还包括其他生物体来源的登录号如下的其他牻牛儿基牻牛儿基二磷酸酯合酶基因:
P22873、P34802,P56966、P80042、Q42698、Q92236、O95749、Q9WTN0、Q50727、P24322、P39464、Q9FXR3、Q9AYN2、Q9FXR2、Q9AVG6、Q9FRW4、Q9SXZ5、Q9AVJ7、Q9AYN1、Q9AVJ4、Q9FXR7、Q8LSC5、Q9AVJ6、Q8LSC4、Q9AVJ3、Q9SSU0、Q9SXZ6、Q9SST9、Q9AVJ0、Q9AVI9、Q9FRW3、Q9FXR5、Q94IF0、Q9FRX1、Q9K567、Q93RA9、Q93QX8、CAD95619、EAA31459。
八氢番茄红素合酶基因的实例为:
噬夏孢欧文菌(Erwinia uredovora)来源的编码八氢番茄红素合酶的核酸,登录号#D90087,发表于Misawa,N.、Nakagawa,M.、Kobayashi,K.、Yamano,S.、Izawa,Y.、Nakamura,K.和Harashima,K.:Elucidation of theErwinia uredovora carotenoid biosynthetic pathway by functional analysisof gene products expressed in Escherichia coli;J.Bacteriol.172(12),6704-6712(1990)(核酸:SEQ ID NO:23,蛋白质:SEQ ID NO:24),
还包括其他生物体来源的登录号如下的其他八氢番茄红素合酶基因:
CAB39693、BAC69364、AAF10440、CAA45350、BAA20384、AAM72615、BAC09112、CAA48922、P_001091、CAB84588、AAF41518、CAA48155、AAD38051、AAF33237、AAG10427、AAA34187、BAB73532、CAC19567、AAM62787、CAA55391、AAB65697、AAM45379、CAC27383、AAA32836、AAK07735、BAA84763、P_000205、AAB60314、P_001163、P_000718、AAB71428、AAA34153、AAK07734、CAA42969、CAD76176、CAA68575、P_000130、P_001142、CAA47625、CAA85775、BAC14416、CAA79957、BAC76563、P_000242、P_000551、AAL02001、AAK15621、CAB94795、AAA91951、P_000448。
八氢番茄红素去饱和酶基因的实例为:
噬夏孢欧文菌来源的编码八氢番茄红素去饱和酶的核酸,登录号#D90087;发表于Misawa,N.、Nakagawa,M.、Kobayashi,K.、Yamano,S.、Izawa,Y.、Nakamura,K.和Harashima,K.:Elucidation of the Erwiniauredovora carotenoid biosynthetic pathway by functional analysis of geneproducts expressed in Escherichia coli;J.Bacteriol. 172(12),6704-6712(1990)(核酸:SEQ ID NO:25,蛋白质:SEQ ID NO:26),
还包括其他生物体来源的登录号如下的其他八氢番茄红素去饱和酶基因:
AAL15300、A39597、CAA42573、AAK51545、BAB08179、CAA48195、BAB82461、AAK92625、CAA55392、AAG10426、AAD02489、AAO24235、AAC12846、AAA99519、AAL38046、CAA60479、CAA75094、ZP_001041、ZP_001163、CAA39004、CAA44452、ZP_001142、ZP_000718、BAB82462、AAM45380、CAB56040、ZP_001091、BAC09113、AAP79175、AAL80005、AAM72642、AAM72043、ZP_000745、ZP_001141、BAC07889、CAD55814、ZP_001041、CAD27442、CAE00192、ZP_001163、ZP_000197、BAA18400、AAG10425、ZP_001119、AAF13698、2121278A、AAB35386、AAD02462、BAB68552、CAC85667、AAK51557、CAA12062、AAG51402、AAM63349、AAF85796、BAB74081、AAA91161、CAB56041、AAC48983、AAG14399、CAB65434、BAB73487、ZP_001117、ZP_000448、CAB39695、CAD76175、BAC69363、BAA17934、ZP_000171、AAF65586、ZP_000748、BAC07074、ZP_001133、CAA64853、BAB74484、ZP_001156、AAF23289、AAG28703、AAP09348、AAM71569、BAB69140、ZP_000130、AAF41516、AAG18866、CAD95940、NP_656310、AAG10645、ZP_000276、ZP_000192、ZP_000186、AAM94364、EAA31371、ZP_000612、BAC75676、AAF65582。
ζ-胡萝卜素去饱和酶基因的实例为:
黄水仙(Narcissus pseudonarcissus)来源的编码ζ-胡萝卜素去饱和酶的核酸,登录号#AJ224683,发表于Al-Babili,S.、Oelschlegel,J.和Beyer,P.:A cDNA encoding for beta carotene desaturase(Aceession No.AJ224683)from Narcissus pseudonarcissus L..(PGR98-103),Plant Physiol.117,719-719(1998)(核酸:SEQ ID NO:119,蛋白质:SEQ ID NO:28),
还包括其他生物体来源的登录号如下的其他ζ-胡萝卜素去饱和酶基因:
Q9R6X4、Q38893、Q9SMJ3、Q9SE20、Q9ZTP4、O49901、P74306、Q9FV46、Q9RCT2、ZDS_NARPS、BAB68552.1、CAC85667.1、AF372617_1、ZDS_TARER、CAD55814.1、CAD27442.1、2121278A、ZDS_CAPAN、ZDS_LYCES、NP_187138.1、AAM63349.1、ZDS_ARATH、AAA91161.1、ZDS_MAIZE、AAG14399.1、NP_441720.1、NP_486422.1、ZP_00111920.1、CAB56041.1、ZP_00074512.1、ZP_00116357.1、NP_681127.1、ZP_00114185.1、ZP_00104126.1、CAB65434.1、NP_662300.1。
crtISO基因的实例为:
食用番茄来源的编码crtISO的核酸;登录号#AF416727,发表于Isaacson,T.、Ronen,G.、Zamir,D.和Hirschberg,J.:Cloning of tangerinefrom tomato reveals a carotenoid isomerase essential for the production ofbeta-carotene and xanthophylls in plants;Plant Cell 14(2),333-342(2002)(核酸:SEQ ID NO:29,蛋白质:SEQ ID NO:122),
还包括其他生物体来源的登录号如下的其他crtISO基因:
AAM53952
FtsZ基因的实例为:
万寿菊来源的编码FtsZ的核酸,登录号#AF251346,发表于Moehs,C.P.、Tian,L.、Osteryoung,K.W.和Dellapenna,D.:Analysis of carotenoidbiosynthetic gene expression during marigold petal development;PlantMol.Biol.45(3),281-293(2001)(核酸:SEQ ID NO:31,蛋白质:SEQ IDNO:32),
还包括其他生物体来源的登录号如下的其他FtsZ基因:
CAB89286.1、AF205858_1、NP_200339.1、CAB89287.1、CAB41987.1、AAA82068.1、T06774,AF383876_1、BAC57986.1、CAD22047.1、BAB91150.1、ZP_00072546.1、NP_440816.1、T51092、NP_683172.1、BAA85116.1、NP_487898.1、JC4289、BAA82871.1、NP_781763.1、BAC57987.1、ZP_00111461.1、T51088、NP_190843.1、ZP_00060035.1、NP_846285.1、AAL07180.1、NP_243424.1、NP_833626.1、AAN04561.1、AAN04557.1、CAD22048.1、T51089、NP_692394.1、NP_623237.1、NP_565839.1、T51090、CAA07676.1、NP_113397.1、T51087、CAC44257.1、E84778、ZP_00105267.1、BAA82091.1、ZP_00112790.1、BAA96782.1、NP_348319.1、NP_471472.1、ZP_00115870.1、NP_465556.1、NP_389412.1、BAA82090.1、NP_562681.1、AAM22891.1、NP_371710.1、NP_764416.1、CAB95028.1、FTSZ_STRGR、AF120117_1、NP_827300.1、JE0282、NP_626341.1、AAC45639.1、NP_785689.1、NP_336679.1、NP_738660.1、ZP_00057764.1、AAC32265.1、NP_814733.1、FTSZ_MYCKA、NP_216666.1、CAA75616.1、NP_301700.1、NP_601357.1、ZP_00046269.1、CAA70158.1、ZP_00037834.1、NP_268026.1、FTSZ_ENTHR、NP_787643.1、NP_346105.1、AAC32264.1、JC5548、AAC95440.1、NP_710793.1、NP_687509.1、NP_269594.1、AAC32266.1、NP_720988.1、NP_657875.1、ZP_00094865.1、ZP_00080499.1、ZP_00043589.1、JC7087、NP_660559.1、AAC46069.1、AF179611_14、AAC44223.1、NP_404201.1。
MinD基因的实例为:
万寿菊来源的编码MinD的核酸,登录号#AF251019,发表于Moehs,C.P.、Tian,L.、Osteryoung,K.W.和Dellapenna,D.:Analysis of carotenoidbiosynthetic gene expression during marigold petal development;PlantMol.Biol.45(3),281-293(2001)(核酸:SEQ ID NO:33,蛋白质:SEQ IDNO:34),
还包括其他生物体来源的登录号如下的其他MinD基因:
NP_197790.1、BAA90628.1、NP_038435.1、NP_045875.1、AAN33031.1、NP_050910.1、CAB53105.1、NP_050687.1、NP_682807.1、NP_487496.1、ZP_00111708.1、ZP_00071109.1、NP_442592.1、NP_603083.1、NP_782631.1、ZP_00097367.1、ZP_00104319.1、NP_294476.1、NP_622555.1、NP_563054.1、NP_347881.1、ZP_00113908.1、NP_834154.1、NP_658480.1、ZP_00059858.1、NP_470915.1、NP_243893.1、NP_465069.1、ZP_00116155.1、NP_390677.1、NP_692970.1、NP_298610.1、NP_207129.1、ZP_00038874.1、NP_778791.1、NP_223033.1、NP_641561.1、NP_636499.1、ZP_00088714.1、NP_213595.1、NP_743889.1、NP_231594.1、ZP_00085067.1、NP_797252.1、ZP_00136593.1、NP_251934.1、NP_405629.1、NP_759144.1、ZP_00102939.1、NP_793645.1、NP_699517.1、NP_460771.1、NP_860754.1、NP_456322.1、NP_718163.1、NP_229666.1、NP_357356.1、NP_541904.1、NP_287414.1、NP_660660.1、ZP_00128273.1、NP_103411.1、NP_785789.1、NP_715361.1、AF149810_1、NP_841854.1、NP_437893.1、ZP_00022726.1、EAA24844.1、ZP_00029547.1、NP_521484.1、NP_240148.1、NP_770852.1、AF345908_2、NP_777923.1、ZP_00048879.1、NP_579340.1、NP_143455.1、NP_126254.1、NP_142573.1、NP_613505.1、NP_127112.1、NP_712786.1、NP_578214.1、NP_069530.1、NP_247526.1、AAA85593.1、NP_212403.1、NP_782258.1、ZP_00058694.1、NP_247137.1、NP_219149.1、NP_276946.1、NP_614522.1、ZP_00019288.1、CAD78330.1。
上述优选的实施方案中优选使用的HMG-CoA还原酶基因为编码以下蛋白质的核酸,所述蛋白质中含有SEQ ID NO:8氨基酸序列,或含有对该序列进行氨基酸替换、插入或缺失后产生的序列,后者与SEQ ID NO:8序列在氨基酸水平上的同一性为至少30%、优选至少50%、更优选至少70%、甚至更优选至少90%、最优选至少95%,且所述蛋白质具有HMG-CoA还原酶的酶促性质。
可以从多种已知基因组序列的生物中容易地发现HMG-CoA还原酶和HMG-CoA还原酶基因的其他实例,例如如上所述比较含有SEQ ID NO:8的数据库中的氨基酸序列或其相应的反向翻译核酸序列的同源性。
如上所述,利用杂交和PCR技术,以SEQ ID NO:7序列起始,通过已知的方法可以从多种基因组序列未知的生物中容易地发现其它HMG-CoA还原酶和HMG-CoA还原酶基因的实例。
在另一个特别优选的实施方案中,为增加HMG-CoA还原酶的活性,向生物中插入编码蛋白质的核酸,所述蛋白质含有序列SEQ ID NO:8的HMG-CoA还原酶氨基酸序列。
可以通过如根据遗传密码反向翻译多肽序列的方法获得合适的核酸序列。
优选为此使用的密码子是根据生物特异性的密码子使用情况选择其中频繁使用者。借助计算机分析相关生物的其他已知基因,可以容易地确定密码子的使用。
在特别优选的实施方案中,将含有SEQ ID NO:7序列的核酸插入生物中。
上述优选实施方案中优选使用的(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶基因为编码以下蛋白质的核酸,所述蛋白质中含有SEQ ID NO:10氨基酸序列,或含有对该序列进行氨基酸替换、插入或缺失后产生的序列,后者与SEQ ID NO:10序列在氨基酸水平上的同一性为至少30%、优选至少50%,更优选至少70%、甚至更优选至少90%、最优选至少95%,且所述蛋白质具有(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶的酶促性质。
可以从多种已知基因组序列的生物中容易地发现(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶和(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶基因的其他实例,例如如上所述比较含有SEQ ID NO:10的数据库中的氨基酸序列或其相应的反向翻译核酸序列的同源性。
如上所述,利用杂交和PCR技术,以SEQ ID NO:9序列起始,通过已知的方法可以从多种基因组序列未知的生物中容易地发现其它(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶和(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶基因的实例。
在另一个特别优选的实施方案中,为增加(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶的活性,向生物中插入编码蛋白质的核酸,所述蛋白质含有序列SEQ ID NO:10的(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶氨基酸序列。
可以通过如根据遗传密码反向翻译多肽序列的方法获得合适的核酸序列。
优选为此使用的密码子是根据生物特异性的密码子使用情况选择其中频繁使用者。借助计算机分析相关生物的其他已知基因,可以容易地确定密码子的使用。
在特别优选的实施方案中,将含有SEQ ID NO:9序列的核酸插入生物中。
上述优选实施方案中优选使用的1-脱氧-D-木糖-5-磷酸合酶基因为编码以下蛋白质的核酸,所述蛋白质中含有SEQ ID NO:12氨基酸序列,或含有对该序列进行氨基酸替换、插入或缺失后产生的序列,后者与SEQ IDNO:12序列在氨基酸水平上的同一性为至少30%、优选至少50%、更优选至少70%、甚至更优选至少90%、最优选至少95%,且所述蛋白质具有1-脱氧-D-木糖-5-磷酸合酶的酶促性质。
可以从多种已知基因组序列的生物中容易地发现1-脱氧-D-木糖-5-磷酸合酶和1-脱氧-D-木糖-5-磷酸合酶基因的其他实例,例如如上所述比较含有SEQ ID NO:12的数据库中的氨基酸序列或其相应的反向翻译核酸序列的同源性。
如上所述,利用杂交和PCR技术,以SEQ ID NO:11序列起始,通过已知的方法可以从多种基因组序列未知的生物中容易地发现其它1-脱氧-D-木糖-5-磷酸合酶和1-脱氧-D-木糖-5-磷酸合酶基因的实例。
在另一个特别优选的实施方案中,为增加1-脱氧-D-木糖-5-磷酸合酶的活性,向生物中插入编码蛋白质的核酸,所述蛋白质含有序列SEQ IDNO:12的1-脱氧-D-木糖-5-磷酸合酶氨基酸序列。
可以通过如根据遗传密码反向翻译多肽序列的方法获得合适的核酸序列。
优选为此使用的密码子是根据生物特异性的密码子使用情况选择其中频繁使用者。借助计算机分析相关生物的其他已知基因,可以容易地确定密码子的使用。
在特别优选的实施方案中,将含有SEQ ID NO:11序列的核酸插入生物中。
上述优选实施方案中优选使用的1-脱氧-D-木糖-5-磷酸还原异构酶基因为编码以下蛋白质的核酸,所述蛋白质中含有SEQ ID NO:14氨基酸序列,或含有对该序列进行氨基酸替换、插入或缺失后产生的序列,后者与SEQ ID NO:14序列在氨基酸水平上的同一性为至少30%、优选至少50%、更优选至少70%、甚至更优选至少90%、最优选至少95%,且所述蛋白质具有1-脱氧-D-木糖-5-磷酸还原异构酶的酶促性质。
可以从多种已知基因组序列的生物中容易地发现1-脱氧-D-木糖-5-磷酸还原异构酶和1-脱氧-D-木糖-5-磷酸还原异构酶基因的其他实例,例如如上所述比较含有SEQ ID NO:14的数据库中的氨基酸序列或其相应的反向翻译核酸序列的同源性。
如上所述,利用杂交和PCR技术,以SEQ ID NO:13序列起始,通过已知的方法可以从多种基因组序列未知的生物中容易地发现其它1-脱氧-D-木糖-5-磷酸还原异构酶和1-脱氧-D-木糖-5-磷酸还原异构酶基因的实例。
在另一个特别优选的实施方案中,为增加1-脱氧-D-木糖-5-磷酸还原异构酶的活性,向生物中插入编码蛋白质的核酸,所述蛋白质含有序列SEQ ID NO:14的1-脱氧-D-木糖-5-磷酸还原异构酶氨基酸序列。
可以通过如根据遗传密码反向翻译多肽序列的方法获得合适的核酸序列。
优选为此使用的密码子是根据生物特异性的密码子使用情况选择其中频繁使用者。借助计算机分析相关生物的其他已知基因,可以容易地确定密码子的使用。
在特别优选的实施方案中,将含有SEQ ID NO:13序列的核酸插入生物中。
上述优选实施方案中优选使用的异戊烯基-D-异构酶基因为编码以下蛋白质的核酸,所述蛋白质中含有SEQ ID NO:16氨基酸序列,或含有对该序列进行氨基酸替换、插入或缺失后产生的序列,后者与SEQ ID NO:16序列在氨基酸水平上的同一性为至少30%、优选至少50%、更优选至少70%、甚至更优选至少90%、最优选至少95%,且所述蛋白质具有异戊烯基-D-异构酶的酶促性质。
可以从多种已知基因组序列的生物中容易地发现异戊烯基-D-异构酶和异戊烯基-D-异构酶基因的其他实例,例如如上所述比较含有SEQ IDNO:16的数据库中的氨基酸序列或其相应的反向翻译核酸序列的同源性。
如上所述,利用杂交和PCR技术,以SEQ ID NO:15序列起始,通过已知的方法可以从多种基因组序列未知的生物中容易地发现其它异戊烯基-D-异构酶和异戊烯基-D-异构酶基因的实例。
在另一个特别优选的实施方案中,为增加异戊烯基-D-异构酶的活性,向生物中插入编码蛋白质的核酸,所述蛋白质含有序列SEQ ID NO:16的异戊烯基-D-异构酶氨基酸序列。
可以通过如根据遗传密码反向翻译多肽序列的方法获得合适的核酸序列。
优选为此使用的密码子,是根据生物特异性的密码子使用情况选择其中频繁使用者。借助计算机分析相关生物的其他已知基因,可以容易地确定密码子的使用。
在特别优选的实施方案中,将含有SEQ ID NO:15序列的核酸插入生物中。
上述优选实施方案中优选使用的牻牛儿基二磷酸酯合酶基因为编码以下蛋白质的核酸,所述蛋白质中含有SEQ ID NO:18氨基酸序列,或含有对该序列进行氨基酸替换、插入或缺失后产生的序列,后者与SEQ ID NO:18序列在氨基酸水平上的同一性为至少30%、优选至少50%、更优选至少70%、甚至更优选至少90%、最优选至少95%;且所述蛋白质具有牻牛儿基二磷酸酯合酶的酶促性质。
可以从多种已知基因组序列的生物中容易地发现牻牛儿基二磷酸酯合酶和牻牛儿基二磷酸酯合酶基因的其他实例,例如如上所述比较含有SEQID NO:18的数据库中的氨基酸序列或其相应的反向翻译核酸序列的同源性。
如上所述,利用杂交和PCR技术,以SEQ ID NO:17序列起始,通过已知的方法可以从多种基因组序列未知的生物中容易地发现其它牻牛儿基二磷酸酯合酶和牻牛儿基二磷酸酯合酶基因的实例。
在另一个特别优选的实施方案中,为增加牻牛儿基二磷酸酯合酶的活性,向生物中插入编码蛋白质的核酸,所述蛋白质含有序列SEQ ID NO:18的牻牛儿基二磷酸酯合酶氨基酸序列。
可以通过如根据遗传密码反向翻译多肽序列的方法获得合适的核酸序列。
优选为此使用的密码子是根据生物特异性的密码子使用情况选择其中频繁使用者。借助计算机分析相关生物的其他已知基因,可以容易地确定密码子的使用。
在特别优选的实施方案中,将含有SEQ ID NO:17序列的核酸插入生物中。
上述优选实施方案中优选使用的法呢基二磷酸酯合酶基因为编码以下蛋白质的核酸,所述蛋白质中含有SEQ ID NO:20氨基酸序列,或含有对该序列进行氨基酸替换、插入或缺失后产生的序列,后者与SEQ ID NO:20序列在氨基酸水平上的同一性为至少30%、优选至少50%、更优选至少70%、甚至更优选至少90%、最优选至少95%,且所述蛋白质具有法呢基二磷酸酯合酶的酶促性质。
可以从多种已知基因组序列的生物中容易地发现法呢基二磷酸酯合酶和法呢基二磷酸酯合酶基因的其他实例,例如如上所述比较含有SEQ IDNO:20的数据库中的氨基酸序列或其相应的反向翻译核酸序列的同源性。
如上所述,利用杂交和PCR技术,以SEQ ID NO:19序列起始,通过已知的方法可以从多种基因组序列未知的生物中容易地发现其它法呢基二磷酸酯合酶和法呢基二磷酸酯合酶基因的实例。
在另一个特别优选的实施方案中,为增加法呢基二磷酸酯合酶的活性,向生物中插入编码蛋白质的核酸,所述蛋白质含有序列SEQ ID NO:20的法呢基二磷酸酯合酶氨基酸序列。
可以通过如根据遗传密码反向翻译多肽序列的方法获得合适的核酸序列。
优选为此使用的密码子是根据生物特异性的密码子使用情况选择其中频繁使用者。借助计算机分析相关生物的其他已知基因,可以容易地确定密码子的使用。
在特别优选的实施方案中,将含有SEQ ID NO:19序列的核酸插入生物中。
上述优选实施方案中优选使用的牻牛儿基牻牛儿基二磷酸酯合酶基因为编码以下蛋白质的核酸,所述蛋白质中含有SEQ ID NO:22氨基酸序列,或含有对该序列进行氨基酸替换、插入或缺失后产生的序列,后者与SEQID NO:22序列在氨基酸水平上的同一性为至少30%、优选至少50%、更优选至少70%、甚至更优选至少90%、最优选至少95%,且所述蛋白质具有牻牛儿基牻牛儿基二磷酸酯合酶的酶促性质。
可以从多种已知基因组序列的生物中容易地发现牻牛儿基牻牛儿基二磷酸酯合酶和牻牛儿基牻牛儿基二磷酸酯合酶基因的其他实例,例如如上所述比较含有SEQ ID NO:22的数据库中的氨基酸序列或其相应的反向翻译核酸序列的同源性。
如上所述,利用杂交和PCR技术,以SEQ ID NO:21序列起始,通过已知的方法可以从多种基因组序列未知的生物中容易地发现其它牻牛儿基牻牛儿基二磷酸酯合酶和牻牛儿基牻牛儿基二磷酸酯合酶基因的实例。
在另一个特别优选的实施方案中,为增加牻牛儿基牻牛儿基二磷酸酯合酶的活性,向生物中插入编码蛋白质的核酸,所述蛋白质含有序列SEQID NO:22的牻牛儿基牻牛儿基二磷酸酯合酶氨基酸序列。
可以通过如根据遗传密码反向翻译多肽序列的方法获得合适的核酸序列。
优选为此使用的密码子是根据生物特异性的密码子使用情况选择其中频繁使用者。借助计算机分析相关生物的其他已知基因,可以容易地确定密码子的使用。
在特别优选的实施方案中,将含有SEQ ID NO:21序列的核酸插入生物中。
上述优选实施方案中优选使用的八氢番茄红素合酶基因为编码以下蛋白质的核酸,所述蛋白质中含有SEQ ID NO:24氨基酸序列,或含有对该序列进行氨基酸替换、插入或缺失后产生的序列,后者与SEQ ID NO:24序列在氨基酸水平上的同一性为至少30%、优选至少50%、更优选至少70%、甚至更优选至少90%、最优选至少95%,且所述蛋白质具有八氢番茄红素合酶的酶促性质。
可以从多种已知基因组序列的生物中容易地发现八氢番茄红素合酶和八氢番茄红素合酶基因的其他实例,例如如上所述比较含有SEQ ID NO:24的数据库中的氨基酸序列或其相应的反向翻译核酸序列的同源性。
如上所述,利用杂交和PCR技术,以SEQ ID NO:23序列起始,通过已知的方法可以从多种基因组序列未知的生物中容易地发现其它八氢番茄红素合酶和八氢番茄红素合酶基因的实例。
在另一个特别优选的实施方案中,为增加八氢番茄红素合酶的活性,向生物中插入编码蛋白质的核酸,所述蛋白质含有序列SEQ ID NO:24的八氢番茄红素合酶氨基酸序列。
可以通过如根据遗传密码反向翻译多肽序列的方法获得合适的核酸序列。
优选为此使用的密码子,是根据生物特异性的密码子使用情况选择其中频繁使用者。借助计算机分析相关生物的其他已知基因,可以容易地确定密码子的使用。
在特别优选的实施方案中,将含有SEQ ID NO:23序列的核酸插入生物中。
上述优选实施方案中优选使用的八氢番茄红素去饱和酶基因为编码以下蛋白质的核酸,所述蛋白质中含有SEQ ID NO:26氨基酸序列,或含有对该序列进行氨基酸替换、插入或缺失后产生的序列,后者与SEQ ID NO:26序列在氨基酸水平上的同一性为至少30%、优选至少50%、更优选至少70%、甚至更优选至少90%、最优选至少95%,且所述蛋白质具有八氢番茄红素去饱和酶的酶促性质。
可以从多种已知基因组序列的生物中容易地发现八氢番茄红素去饱和酶和八氢番茄红素去饱和酶基因的其他实例,例如如上所述比较含有SEQID NO:26的数据库中的氨基酸序列或其相应的反向翻译核酸序列的同源性。
如上所述,利用杂交和PCR技术,以SEQ ID NO:25序列起始,通过已知的方法可以从多种基因组序列未知的生物中容易地发现其它八氢番茄红素去饱和酶和八氢番茄红素去饱和酶基因的实例。
在另一个特别优选的实施方案中,为增加八氢番茄红素去饱和酶的活性,向生物中插入编码蛋白质的核酸,所述蛋白质含有序列SEQ ID NO:26的八氢番茄红素去饱和酶氨基酸序列。
可以通过如根据遗传密码反向翻译多肽序列的方法获得合适的核酸序列。
优选为此使用的密码子是根据生物特异性的密码子使用情况选择其中频繁使用者。借助计算机分析相关生物的其他已知基因,可以容易地确定密码子的使用。
在特别优选的实施方案中,将含有SEQ ID NO:25序列的核酸插入生物中。
上述优选实施方案中优选使用的ζ-胡萝卜素去饱和酶基因为编码以下蛋白质的核酸,所述蛋白质中含有SEQ ID NO:28氨基酸序列,或含有对该序列进行氢基酸替换、插入或缺失后产生的序列,后者与SEQ ID NO:28序列在氨基酸水平上的同一性为至少30%、优选至少50%、更优选至少70%、甚至更优选至少90%、最优选至少95%,且所述蛋白质具有ζ-胡萝卜素去饱和酶的酶促性质。
可以从多种已知基因组序列的生物中容易地发现ζ-胡萝卜素去饱和酶和ζ-胡萝卜素去饱和酶基因的其他实例,例如如上所述比较含有SEQ IDNO:28的数据库中的氨基酸序列或其相应的反向翻译核酸序列的同源性。
如上所述,利用杂交和PCR技术,以SEQ ID NO:119序列起始,通过已知的方法可以从多种基因组序列未知的生物中容易地发现其它ζ-胡萝卜素去饱和酶和ζ-胡萝卜素去饱和酶基因的实例。
在另一个特别优选的实施方案中,为增加ζ-胡萝卜素去饱和酶的活性,向生物中插入编码蛋白质的核酸,所述蛋白质含有序列SEQ ID NO:28的ζ-胡萝卜素去饱和酶氨基酸序列。
可以通过如根据遗传密码反向翻译多肽序列的方法获得合适的核酸序列。
优选为此使用的密码子是根据生物特异性的密码子使用情况选择其中频繁使用者。借助计算机分析相关生物的其他已知基因,可以容易地确定密码子的使用。
在特别优选的实施方案中,将含有SEQ ID NO:119序列的核酸插入生物中。
上述优选实施方案中优选使用的CrtISO基因为编码以下蛋白质的核酸,所述蛋白质中含有SEQ ID NO:30氨基酸序列,或含有对该序列进行氨基酸替换、插入或缺失后产生的序列,后者与SEQ ID NO:30序列在氨基酸水平上的同一性为至少30%、优选至少50%、更优选至少70%、甚至更优选至少90%、最优选至少95%,且所述蛋白质具有CrtIso的酶促性质。
可以从多种已知基因组序列的生物中容易地发现CrtISO和CrtISO基因的其他实例,例如如上所述比较含有SEQ ID NO:30的数据库中的氨基酸序列或其相应的反向翻译核酸序列的同源性。
如上所述,利用杂交和PCR技术,以SEQ ID NO:29序列起始,通过已知的方法可以从多种基因组序列未知的生物中容易地发现其它CrtISO和CrtISO基因的实例。
在另一个特别优选的实施方案中,为增加CrtISO的活性,向生物中插入编码蛋白质的核酸,所述蛋白质含有序列SEQ ID NO:30的CrtISO氨基酸序列。
可以通过如根据遗传密码反向翻译多肽序列的方法获得合适的核酸序列。
优选为此使用的密码子是根据生物特异性的密码子使用情况选择其中频繁使用者。借助计算机分析相关生物的其他已知基因,可以容易地确定密码子的使用。
在特别优选的实施方案中,将含有SEQ ID NO:29序列的核酸插入生物中。
上述优选实施方案中优选使用的FtsZ基因为编码以下蛋白质的核酸,所述蛋白质中含有SEQ ID NO:32氨基酸序列,或含有对该序列进行氨基酸替换、插入或缺失后产生的序列,后者与SEQ ID NO:32序列在氨基酸水平上的同一性为至少30%、优选至少50%、更优选至少70%、甚至更优选至少90%、最优选至少95%,且所述蛋白质具有FtsZ的酶促性质。
可以从多种已知基因组序列的生物中容易地发现FtsZn和FtsZ基因的其他实例,例如如上所述比较含有SEQ ID NO:32的数据库中的氨基酸序列或其相应的反向翻译核酸序列的同源性。
如上所述,利用杂交和PCR技术,以SEQ ID NO:31序列起始,通过已知的方法可以从多种基因组序列未知的生物中容易地发现其它FtsZn和FtsZ基因的实例。
在另一个特别优选的实施方案中,为增加FtsZ的活性,向生物中插入编码蛋白质的核酸,所述蛋白质含有序列SEQ ID NO:32的FtsZ氨基酸序列。
可以通过如根据遗传密码反向翻译多肽序列的方法,获取合适的核酸序列。
优选为此使用的密码子是根据生物特异性的密码子使用情况选择其中频繁使用者。借助计算机分析相关生物的其他已知基因,可以容易地确定密码子的使用。
在特别优选的实施方案中,将含有SEQ ID NO:31序列的核酸插入生物中。
上述优选实施方案中优选使用的MinD基因为编码以下蛋白质的核酸,所述蛋白质中含有SEQ ID NO:34氨基酸序列,或含有对该序列进行氨基酸替换、插入或缺失后产生的序列,后者与SEQ ID NO:34序列在氨基酸水平上的同一性为至少30%、优选至少50%、更优选至少70%、甚至更优选至少90%、最优选至少95%,且所述蛋白质具有MinD的酶促性质。
可以从多种已知基因组序列的生物中容易地发现MinDn和MinD基因的其他实例,例如如上所述比较含有SEQ IDNO:34的数据库中的氨基酸序列或其相应的反向翻译核酸序列的同源性。
如上所述,利用杂交和PCR技术,以SEQ ID NO:33序列起始,通过已知的方法可以从多种基因组序列未知的生物中容易地发现其它MinDn和MinD基因的实例。
在另一个特别优选的实施方案中,为增加MinD的活性,向生物中插入编码蛋白质的核酸,所述蛋白质含有序列SEQ ID NO:34的MinD氨基酸序列。
可以通过如根据遗传密码反向翻译多肽序列的方法获得合适的核酸序列。
优选为此使用的密码子是根据生物特异性的密码子使用情况选择其中频繁使用者。借助计算机分析相关生物的其他已知基因,可以容易地确定密码子的使用。
在特别优选的实施方案中,将含有SEQ ID NO:33序列的核酸插入生物中。
还可以通过公知的方法,从核苷酸结构单元开始进行化学合成来制备上述所有HMG-CoA还原酶基因、(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶基因、1-脱氧-D-木糖-5-磷酸合酶基因、1-脱氧-D-木糖-5-磷酸还原异构酶基因、异戊烯基二磷酸酯Δ-异构酶基因、牻牛儿基二磷酸酯合酶基因、法呢基二磷酸酯合酶基因、牻牛儿基牻牛儿基二磷酸酯合酶基因、八氢番茄红素合酶基因、八氢番茄红素去饱和酶基因、ζ-胡萝卜素去饱和酶基因、crtISO基因、FtsZ基因或MinD基因,例如利用单个重叠互补的双螺旋核酸结构单元的片段缩合来制备。通过如已知的亚磷酰胺法(Voet,Voet,第二版,Wiley Press New York,896-897页),可以化学合成寡核苷酸。添加合成的寡核苷酸、使用DNA聚合酶的Klenow片段填补空位、连接反应和一般的克隆方法如Sambrook等(1989),《Molecular cloning:A laboratorymanual》,Cold Spring Harbor Laboratory Press所述。
编码酮酶的核酸、编码β-羟化酶的核酸、编码β环化酶的核酸(含有SEQ ID NO:2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO:2序列至少有70%的同一性),以及编码HMG-CoA还原酶的核酸、编码(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶的核酸、编码1-脱氧-D-木糖-5-磷酸合酶的核酸、编码1-脱氧-D-木糖-5-磷酸还原异构酶的核酸、编码异戊烯基二磷酸酯Δ-异构酶的核酸、编码牻牛儿基二磷酸酯合酶的核酸、编码法呢基二磷酸酯合酶的核酸、编码牻牛儿基牻牛儿基二磷酸酯合酶的核酸、编码八氢番茄红素合酶的核酸、编码八氢番茄红素去饱和酶的核酸、编码ζ-胡萝卜素去饱和酶的核酸、编码crtISO蛋白的核酸、编码FtsZ蛋白的核酸和/或编码MinD蛋白的核酸在以下也称为“作用基因”。
可以通过下述途径产生遗传修饰的非人生物,如插入含有一个作用基因的单个核酸构建体(表达盒)、或插入包含上至2个或3个作用基因或多于3个作用基因的多重构建体。
本发明的生物优选指野生型或起始生物时可天然产生或能够通过遗传互补和/或代谢途径的再调节生产类胡萝卜素(特别是β-胡萝卜素和/或玉米黄质和/或新叶黄素和/或紫黄质(violaxanthin)和/或叶黄素)的生物。
其他优选的生物在野生型或起始生物时已经具有羟化酶的活性,因此其野生型或起始生物即能产生玉米黄质。
优选生物为植物或微生物,例如,细菌、酵母、藻类或真菌。
使用的细菌可以是由于插入产类胡萝卜素生物的类胡萝卜素生物合成基因而能合成叶黄素的细菌(例如含有例如欧文氏菌(Erwinia)来源的crt基因的埃希氏杆菌属(Escherichia)细菌),以及自身即能够合成叶黄素的细菌(如欧文氏菌属、农杆菌属(Agrobacterium)、黄杆菌属(Flavobacterium)、产碱菌属、副球菌属、念珠藻属的细菌或集胞藻属的蓝细菌(Cyanobacteria))。
优选的细菌为大肠杆菌(Escherichia coli)、草生欧文氏菌(Erwiniaherbicola)、噬夏孢欧文氏菌、橙黄农杆菌、产碱菌属种PC-1、黄杆菌属种R1534菌株、集胞藻属蓝细菌PCC6803、Paracoccus marcusii或Paracoccus carotinifaciens。
优选的酵母为假丝酵母(Candida)、酵母(Saccharomyces)、汉逊酵母(Hansenula)、毕赤酵母(Pichia)或法夫酵母(Phaffia)。特别优选的酵母为Xanthophyllomyces dendrorhous或Phaffia rhodozyma。
优选的真菌为曲霉(Aspergillus)、木霉(Trichoderma)、阿舒嚢霉(Ashbya)、脉孢菌(Neurospora)、布拉霉(特别是Blakeslea trispora)、须霉(Phycomyces)、镰孢霉(Fusarium)或如Indian Chem.Engr.B部分卷37,No.1,2(1995)15页,表6中描述的其它真菌。
优选的藻类有绿藻,如红球藻属(Haematococcus)、三角褐指藻(Phaedactylum tricornatum)、团藻属(Volvox)或杜氏藻属(Dunaliella)的藻类。特别优选的藻类有雨生红球藻或杜氏藻属巴德成藻(Dunaliellabardawil)。
其它可用于实施本发明方法的微生物及其生产,公开于如此处引用作为参考的DE-A-199 16 140。
特别优选的植物选自苋科(Amaranthaceae)、石蒜科(Amaryllidaceae)、夹竹桃科(Apocynaceae)、紫菀科(Asteraceae)、凤仙花科(Balsaminaceae)、秋海棠科(Begoniaceae)、小檗科(Berberidaceae)、十字花科(Brassicaceae)、大麻科(Cannabaceae)、忍冬科(Caprifoliaceae)、石竹科(Caryophyllaceae)、藜科(Chenopodiaceae)、菊科(Compositae)、葫芦科(Cucurbitaceae)、十字花科(Cruciferae)、大戟属(Euphorbiaceae)、豆科(Fabaceae)、龙胆科(Gentianaceae)、牻牛儿苗科(Geraniaceae)、禾本科(Graminae)、Illiaceae、唇形科(Labiatae)、薄荷科(Lamiaceae)、豆科(Leguminosae)、百合科(Liliaceae)、亚麻科(Linaceae)、山梗菜属(Lobeliaceae)、锦葵科(Malvaceae)、木犀科(Oleaceae)、兰科(Orchidaceae)、罂粟科(Papaveraceae)、白花丹科(Plumbaginaceae)、禾本科(Poaceae)、花荵科(Polemoniaceae)、报春花科(Primulaceae)、毛茛科(Ranunculaceae)、蔷薇科(Rosaceae)、茜草科(Rubiaceae)、玄参科(Scrophulariaceae)、茄科(Solanaceae)、旱金莲科(Tropaeolaceae)、伞状花科(Umbelliferae)、毛蕊花科(Verbanaceae)、葡萄科(Vitaceae)及紫罗兰科(Violaceae)。
极其优选的植物选自万寿菊属(Marigold、万寿菊(Tagetes erecta)、孔雀草(Tagetes patula)、金合欢属(Acacia)、乌头属(Aconitum)、侧金盏花属(Adonis)、阿尼菊属(Arnica)、耧斗菜属(Aquilegia)、紫菀属(Aster)、黄芪属(Astragalus)、紫葳属(Bignonia)、金盏花属(Calendula)、驴蹄草属(Caltha)、风铃草属(Campanula)、美人蕉属(Canna)、矢车菊属(Centaurea)、桂竹香属(Cheiranthus)、茼蒿属(Chrysanthemum)、柑桔属(Citrus)、还阳参属(Crepis)、番红花属(Crocus)、南瓜属(Curcurbita)、金雀儿属(Cytisus)、Delonia属、翠雀属(Delphinium)、石竹属(Dianthus)、康乃馨属(Dimorphotheca)、多榔菊属(Doronicum)、花菱草属(Eschscholtzia)、连翘属(Forsythia)、Fremontia属、勋章菊属(Gazania)、钩吻属(Gelsemium)、染料木属(Genista)、龙胆属(Gentiana)、老鹳草属(Geranium)、非洲菊属(Gerbera)、路边青属(Geum)、银桦属(Grevillea)、堆心菊属(Helenium)、向日葵属(Helianthus)、细辛属(Hepatica)、独活属(Heracleum)、木槿属(Hisbiscus)、赛菊芋属(Heliopsis)、金丝桃属(Hypericum)、黄金菊属(Hypochoeris)、凤仙花属(Impatiens)、鸢尾属(Iris)、蓝花楹属(Jacaranda)、棣堂属(Kerria)、毒豆属(Laburnum)、山黧豆属(Lathyrus)、猫耳草属(Leontodon)、百合属(Lilium)、亚麻属(Linum)、百脉根属(Lotus)、番茄属(Lycopersicon)、珍珠菜属(Lysimachia)、Maratia属、苜蓿属(Medicago)、沟酸浆属(Mimulus)、水仙属(Narcissus)、月见草属(Oenothera)、木犀属(Osmanthus)、碧冬茄属(Petunia)、石楠属(Photina)、酸浆属(Physalis)、牧根草属(Phyteuma)、委陵草属(Potentilla)、火棘属(Pyracantha)、毛茛属(Raunculus)、杜鹃花属(Rhododendron)、蔷薇属(Rosa)、金光菊属(Rudbeckia)、千里光属(Senecio)、蝇子草属(Silene)、松香草属(Silphium)、Sinapsis属、花楸属(Sorbus)、鹰爪豆属(Spartium)、黄钟花属(Tecoma)、蝴蝶草属(Torenia)、婆罗们参属(Tragopogon)、金莲花属(Trollius)、旱金莲属(Tropaeolum)、郁金香属(Tulipa)、款冬属(Tussilago)、荆豆属(Ulex)、堇菜属(Viola)或百日草属(Zinnia)植物,特别优选万寿菊属(Marigold)、万寿菊(Tagetes erecta)、孔雀草(Tagetespatula)、番茄属(Lycopersicon)、蔷薇属(Rosa)、金盏花属(Calendula)、酸浆属(Physalis)、苜蓿属(Medicago)、向日葵属(Helianthus)、茼蒿属(Chrysanthemum)、紫菀属(Aster)、郁金香属(Tulipa)、水仙属(Narcissus)、碧冬茄属(Petunia)、老鹳草属(Geranium)、旱金莲属(Tropaeolum)或侧金盏花属(Adonis)植物之一。
在本发明制备酮类式胡萝卜素的方法中,优选在培养遗传修饰的生物之后收获生物、并进一步优选从生物中分离酮类胡萝卜素。
可以通过众所周知的适合特定生物的方式收获生物。在液体营养培养基中发酵培养的微生物(如细菌、酵母、藻类或真菌)或植物细胞,可以通过例如离心、滗析或过滤分离。通过已知的方式将植物生长于营养培养基中并适当时收获。
优选在有氧、至少约20℃的培养温度(例如20℃到40℃)、pH约6-9的条件下培养遗传修饰的微生物。对于遗传修饰的微生物,优选先在有氧、合成培养基(如TB或LB培养基)中、约20℃或更高温度的培养温度、pH约6至9的条件下培养,直到达到足够的细胞密度。为了能更好地控制氧化反应,优选使用可诱导的启动子。诱导酮酶表达后继续在有氧条件下培养如12小时到3天。
可以通过已知的方式从收获的生物质中分离酮类胡萝卜素,如通过抽提,并适当时经进一步的化学或物理纯化方法,例如沉淀法、结晶、热分离法(如精馏法)或物理分离法(如层析)。
可如下所述在本发明遗传修饰的植物中特异地产生酮类胡萝卜素,优选在多种植物组织中产生,如种子、叶、果实、花,特别是花瓣。
可以通过已知的方式从收集的花瓣中分离酮类胡萝卜素,例如通过干燥并随后抽提,以及适当时进一步利用化学或物理纯化方法,例如沉淀法、结晶、热分离法(如精馏法)或物理分离法(如层析)。例如,优选使用有机溶剂(如丙酮、己烷、乙醚或叔-甲基丁基醚)从花瓣中分离酮类胡萝卜素。
其他分离酮类胡萝卜素(特别是从花瓣中分离)的方法描述于如Egger和Kleinig(Phytochemistry(1967)6,437-440)以及Egger(Phytochemistry(1965)4,609-618)中。
优选的酮类胡萝卜素选自虾青素、角黄素、海胆酮、3-羟基海胆酮、3’-羟基海胆酮、金盏花玉红质和金盏花黄质。
特别优选的酮类胡萝卜素为虾青素。
取决于使用生物的不同,获取的酮类胡萝卜素为游离的或脂肪酸酯或二葡萄糖苷形式。
利用本发明方法从植物花瓣中获得的酮类胡萝卜素为其与脂肪酸形成的单酯或二酯的形式。一些检测到的脂肪酸的实例为肉豆蔻酸、棕榈酸、硬脂酸、油酸、亚麻酸和月桂酸(Kamata和Simpson(1987)Comp.Biochem.Physio.卷86B(3),587-591)。
酮类胡萝卜素的生产可以在整个植物中进行,或在优选实施方案中,特定在含有有色体的植物组织中进行。优选的植物组织例如根、种子、叶、果实、花,特别是蜜腺和花瓣。
在本发明方法的一个特别优选的实施方案中,使用了在花中酮酶表达速率最高的遗传修饰植物。
优选使用花特异性的启动子控制酮酶基因表达来实现这一点。例如,为此可如下文详细描述的,向植物中与花特异性启动子功能性连接的核酸构建体中插入前述核酸。
在本发明方法的另一特别优选的实施方案中,使用了在果实中酮酶表达速率最高的遗传修饰植物。
优选使用果实特异性的启动子控制酮酶基因表达来实现这一点。例如,为此可如下文详细描述的,向植物中与果实特异性启动子功能性连接的核酸构建体中插入前述核酸。
在本发明方法的另一特别优选的实施方案中,使用了在种子中酮酶表达速率最高的遗传修饰植物。
优选使用种子特异性的启动子控制酮酶基因表达来实现这一点。例如,为此可如下文详细描述的,向植物中与种子特异性启动子功能性连接的核酸构建体中插入前述核酸。
通过功能性连接的质体转运肽可以实现对有色体的靶向定位。
以下通过实施例描述遗传修饰植物的产生,所述遗传修饰的植物具有增加的或造成的酮酶活性,以及增加的或造成的β环化酶活性(其修饰的β环化酶活性是由于该β环化酶含有SEQ ID NO:2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ IDNO:2序列至少有70%的同一性)。
其他活性,如羟化酶活性、HMG-CoA还原酶活性、(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶活性、1-脱氧-D-木糖-5-磷酸合酶活性、1-脱氧-D-木糖-5-磷酸还原异构酶活性、异戊烯二磷酸酯Δ-异构酶活性、牻牛儿基二磷酸酯合酶活性、法呢基二磷酸酯合酶活性、牻牛儿基牻牛儿基二磷酸酯合酶活性、八氢番茄红素合酶活性、八氢番茄红素去饱和酶活性、ζ-胡萝卜素去饱和酶活性、crtISO活性、FtsZ活性和/或MinD活性,可以通过使用相应的作用基因,得到类似的增加。
在组合的遗传修饰中,转化可以逐个进行,或通过多重构建体完成。
优选使用含有上述的编码酮酶及编码β环化酶核酸的核酸构建体转化起始植物来产生转基因植物,所述核酸与一个或多个确保在植物中转录和翻译的调节信号功能性连接;所述核酸编码的β环化酶含有SEQ ID NO:2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO:2序列至少有70%的同一性。
另外,也优选使用两个核酸构建体转化起始植物来产生转基因植物。一个核酸构建体含有至少一个上述编码酮酶的核酸,其与一个或多个确保在植物中转录和翻译的调节信号功能性连接。另一个核酸构建体含有至少一个上述编码β环化酶的核酸,其与一个或多个确保在植物中转录和翻译的调节信号功能性连接,所述核酸编码的β环化酶含有SEQ ID NO:2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO:2序列至少有70%的同一性。
以下也将这些作用基因与一个或多个确保在植物中转录和翻译的调节信号功能性连接的核酸构建体称为表达盒。
优选调节信号含有一个或多个确保在植物中转录和翻译的启动子。
表达盒含有调节信号,即控制作用基因在宿主细胞中表达的调节性核酸序列。根据优选实施方案之一,表达盒包含上游启动子(即位于编码序列5’端)和下游多腺苷酸化信号(即位于编码序列3’端),并在适当时还含有与至少一个上述基因有效连接的其它调节元件,其中作用基因的编码序列存在于所述调节元件中。“有效连接”是指启动子、编码序列、终止子和适当时的其它调节元件以各调节元件能够在编码序列的表达中发挥其预期功能的方式依次排列。
以下举例描述了优选的用于植物的核酸构建体、表达盒和载体,以及产生转基因植物的方法及转基因植物自身。
用于有效连接的优选序列(但并不仅限于此)为确保在质外体、液泡、质体、线粒体、内质网(ER)、细胞核、油质体或其它区室中亚细胞定位的靶向序列,以及翻译增强子(如烟草花叶病毒来源的5’前导序列)(Gallie等,Nucl.Acids Res.15(1987),8693-8711)。
原则上能够控制外源基因在植物中表达的任何启动子都适合用作表达盒启动子。
“组成型”启动子是指在植物发育过程中的相对长时期(优选植物发育的全部时期),确保在许多组织(优选所有组织)中表达的启动子。
具体而言,优选使用植物启动子或植物病毒来源的启动子。特别优选花椰菜嵌合病毒35S转录物的CaMV启动子(Franck等(1980)Cell 21:285-294;Odell等(1985)Nature 313:810-812;Shewmaker等(1985)Virology 140:281-288;Gardner等(1986)Plant Mol Biol 6:221-228)、19SCaMV启动子(US 5,352,605;WO 84/02913;Benfey等(1989)EMBO J 8:2195-2202)、拟南芥(Arabidopsis thaliana)来源的丙糖磷酸转运蛋白(TPT)启动子(Acc.No.AB006698,碱基对53242至55281,起始于bp 55282的基因被注释为“磷酸/丙糖磷酸转运蛋白”),或玄参(figwort)嵌合病毒来源的34S启动子(Acc.No.X16673,碱基对1到554)。
其他合适的组成型启动子为pds启动子(Pecker等(1992)Proc.Natl.Acad.Sci USA 89:4962-4966)或核酮糖二磷酸羧化酶/加氧酶小亚基(SSU)启动子(US 4,962,028)、豆球蛋白B启动子(GenBank Acc.No.X03677)、农杆菌胭脂碱合成酶启动子、TR双重启动子、农杆菌OCS(章鱼碱合成酶)启动子、泛素启动子(Holtorf S等(1995)Plant Mol Biol 29:637-639)、泛素1启动子(Christensen等(1992)Plant Mol Biol 18:675-689;Bruce等(1989)Proc Natl Acad Sci USA 86:9692-9696)、Smas启动子、桂醇脱氢酶启动子(US 5,683,439)、液泡ATP酶亚基的启动子或小麦来源富含脯氨酸的蛋白质的启动子(WO 91/13991)、Pnit启动子(Y07648.L,Hillebrand等(1998),Plant.Mol.Biol.36,89-99,Hillebrand等(1996),Gene,170,197-200),以及本领域技术人员已知的在植物中组成型表达的其它基因的启动子。
表达盒也可以含有化学诱导型启动子(综述文章:Gatz等(1997)AnnuRev Plant Physiol Plant Mol Biol 48:89-108),通过这种启动子可以在某一特定时间点控制作用基因在植物中的表达。该类启动子,例如PRP1启动子(Ward等(1993)Plant Mol Biol 22:361-366)、水杨酸诱导的启动子(WO95/19443)、苯磺酰胺诱导的启动子(EP 0 388 186)、四环素诱导的启动子(Gatz等(1992)Plant J 2:397-404)、脱落酸诱导的启动子(EP 0 335 528)或乙醇或环己酮诱导的启动子(WO 93/21334)也同样可使用。
优选的启动子还有为生物或非生物应激所诱导的启动子,例如病原体诱导的PRP1基因启动子(Ward等(1993)Plant Mol Biol 22:361-366),热诱导的番茄hsp70或hsp80启动子(US 5,187,267)、冷诱导的马铃薯α-淀粉酶启动子(WO 96/12814)、光诱导的PPDK启动子或损伤诱导的pinII启动子(EP375091)。
病原体诱导的启动子包括受病原体攻击诱导产生的基因的启动子,如PR蛋白质、SAR蛋白质、β-1,3-葡聚糖酶、壳多糖酶等的基因的启动子(例如Redolfi等(1983)Neth J Plant Pathol 89:245-254;Uknes等(1992)ThePlant Cell 4:645-656;Van Loon(1985)Plant Mol Viral 4:111-116;Marineau等(1987)Plant Mol Biol 9:335-342;Matton等(1987)MolecularPlant-Microbe Interactions 2:325-342;Somssich等(1986)Proc Natl AcadSci USA 83:2427-2430;Somssich等(1988)Mol Gen Genetics 2:93-98;Chen等(1996)Plant J 10:955-966;Zhang和Sing(1994)Proc Natl AcadSci USA 91:2507-2511;Warner等(1993)Plant J 3:191-201;Siebertz等(1989)Plant Cell 1:961-968(1989))。
也包括损伤诱导的启动子,如pinII基因启动子(Ryan(1990)Ann RevPhytopath 28:425-449;Duan等(1996)Nat Biotech 14:494-498)、wun1和wun2基因启动子(US 5,428,148)、win1和win2基因启动子(Stanford等(1989)Mol Gen Genet 215:200-208)、系统素(systemin)基因启动子(McGurl等(1992)Science 225:1570-1573)、WIP1基因启动子(Rohmeier等(1993)Plant Mol Biol 22:783-792;Ekelkamp等(1993)FEBS Letters 323:73-76)、MPI基因启动子(Corderok等(1994)The Plant J 6(2):141-150)等。
其它合适的启动子有如果实成熟特异性启动子,例如番茄果实成熟特异性启动子(WO 94/21794、EP 409 625)。发育依赖的启动子部分地包括组织特异性启动子,因为个体组织的天然形成依赖于发育。
此外,特别优选那些确保在组织或植物部位中表达(例如生物合成酮类胡萝卜素或其前体)的启动子。优选启动子有花药、子房、花瓣、萼片、花、叶、茎、种子和根以及其组合特异性的启动子。
球茎、块茎、贮藏根或根特异性启动子,例如I类patatin启动子(B33)或马铃薯组织蛋白酶D抑制物启动子。
叶特异性启动子例如马铃薯胞质FBP酶启动子(WO 97/05900)、核酮糖二磷酸羧化酶/加氧酶(核酮糖-1,5-二磷酸羧化酶)SSU启动子(小亚基)或马铃薯ST-LSI启动子(Stockhaus等(1989)EMBO J 8:2445-2451)。
花特异性启动子例如八氢番茄红素合成酶启动子(WO 92/16635)或P-rr基因启动子(WO 98/22593)、拟南芥AP3启动子、CHRC启动子(黄瓜(Cucumis sativus)来源的有色体特异的类胡萝卜素相关蛋白质(CHRC)基因启动子,Acc.No.AF099501,碱基对1至1532)、EPSP合成酶启动子(碧冬茄(Petunia hybrida)来源的5-烯醇丙酮酸莽草酸-3-磷酸合成酶基因启动子Acc.No.M37029,碱基对1至1788)、PDS启动子(番茄(SolanumLycopersicum)来源的八氢番茄红素去饱和酶基因启动子Acc.No.U46919,碱基对1至2078)、DFR-A启动子(碧冬茄来源的二氢黄酮醇4-还原酶基因A启动子,Acc.No.X79723,碱基对32至1902),或FBP1启动子(碧冬茄来源的花结合蛋白1基因启动子,Acc.No.L10115,碱基对52至1069)。
花药特异性启动子例如5126启动子(US 5,689,049、US 5,689,051)、glob-I启动子或g-玉米醇溶蛋白启动子。
种子特异性启动子,例如ACP05启动子(酰基载体蛋白基因,WO9218634)、拟南芥属AtS1和AtS3启动子(WO 9920775)、蚕豆(Vicia faba)LeB4启动子(WO 9729200和US 06403371)、欧洲油菜(Brassica napus)启动子(US 5608152;EP 255378;US 5420034)、蚕豆SBP启动子(DE 9903432)或玉米End1和End2启动子(WO 0011177)。
其它适合在植物中表达的启动子如Rogers等(1987)Meth in Enzymol153:253-277;Schardl等(1987)Gene 61:1-11和Berger等(1989)Proc NatlAcad Sci USA 86:8402-8406中所述。
本发明方法中特别优选种子特异性、果实特异性、花特异性、特别是花瓣特异性的组成型启动子。
优选通过如T.Maniatis、E.F.Fritsch和J.Sambrook,《MolecularCloning:A Laboratory Manual》,Cold Spring Harbor Laboratory,ColdSpring Harbor,NY(1989)及T.J.Silhavy、M.L.Berman和L.W.Enquist,Experiments with Gene Fusiohs,Cold Spring Harbor Laboratory,ColdSpring Harbor,NY(1984)和Ausubel,F.M.等,《Current Protocols inMolecular Biology》,G reene Publishing Assoc.and Wiley-Interscience(1987)描述的常规重组和克隆技术,将合适的启动子与至少一个上述作用基因融合并优选在启动子与核酸序列之间插入的编码质体特异性转运肽的核酸及多腺苷酸化信号,来生成表达盒。
优选插入的编码质体转运肽的核酸能确保在质体(特别是有色体)中的定位。
也可以使用其核酸序列编码作用基因产物融合蛋白的表达盒,其中融合蛋白质的一部分为控制多肽易位的转运肽。优选有色体特异的转运肽,其在作用基因转移进有色体之后,可被酶解从作用基因产物部分中除去。
特别优选的转运肽来自烟草(Nicotiana tabacum)质体转酮酶或其它转运肽(如核酮糖二磷酸羧化酶-加氧酶小亚基(rbcS)的转运肽或铁氧还蛋白-NADP氧化还原酶的转运肽,以及异戊烯-焦磷酸异构酶2的转运肽)或其功能等价物。
特别优选三种烟草质体转酮酶质体转运肽盒的核酸序列,其以KpnI/BamHI片段的形式处于三个读码框中,其中ATG密码子位于NcoI切割位点:
pTP09
KpnI_GGTACCATGGCGTCTTCTTCTTCTCTCACTCTCTCTCAAGCTATCCTCTCTC
GTTCTGTCCCTCGCCATGGCTCTGCCTCTTCTTCTCAACTTTCCCCTTCTTCTCT-
CACTTTTTCCGGCCTTAAATCCAATCCCAATATCACCACCTCCCGCCGCCG-
TACTCCTTCCTCCGCCGCCGCCGCCGCCGTCGTAAGGTCACCGGC-
GATTCGTGCCTCAGCTGCAACCGAAACCATAGAGAAAACTGAGACTGCGG-
GATCC_BamHI
pTP10
KpnI_GGTACCATGGCGTCTTCTTCTTCTCTCACTCTCTCTCAAGCTATCCTCTCTC
GTTCTGTCCCTCGCCATGGCTCTGCCTCTTCTTCTCAACTTTCCCCTTCTTCTCT-
CACTTTTTCCGGCCTTAAATCCAATCCCAATATCACCACCTCCCGCCGCCG-
TACTCCTTCCTCCGCCGCCGCCGCCGCCGTCGTAAGGTCACCGGC-
GATTCGTGCCTCAGCTGCAACCGAAACCATAGAGAAAACTGAGACTGCGCTG-
GATCC_BamHI
pTP11
KpnI_GGTACCATGGCGTCTTCTTCTTCTCTCACTCTCTCTCAAGCTATCCTCTCTC
GTTCTGTCCCTCGCCATGGCTCTGCCTCTTCTTCTCAACTTTCCCCTTCTTCTCT-
CACTTTTTCCGGCCTTAAATCCAATCCCAATATCACCACCTCCCGCCGCCG-
TACTCCTTCCTCCGCCGCCGCCGCCGCCGTCGTAAGGTCACCGGC-
GATTCGTGCCTCAGCTGCAACCGAAACCATAGAGAAAACTGAGACTGCGGG-
GATCC_BamHI
其它质体转运肽的实例有拟南芥质体异戊烯-焦磷酸异构酶2(IPP-2)的转运肽,以及豌豆来源的核酮糖二磷酸羧化酶小亚基(rbcS)的转运肽(Guerineau,F,Woolston,S,Brooks,L,Mullineaux,P(1988)An expressioncassette for targeting foreign proteins into the chloroplasts.Nucl.Acids Res.16:11380)。
本发明核酸可以合成制备或从天然获得,或者可以包含合成及天然核酸组分的混合物,并可以由多种生物来源的多个异源基因部分组成。
如上所述,优选具有植物优选密码子的合成核苷酸序列。这些植物优选的密码子,可以从大多数目的植物物种表达蛋白质时出现频率最高的密码子中确定。
在制备表达盒时,可以利用多种DNA片段以便获得便于从正确方向阅读并带有正确阅读框的核苷酸序列。可以在片段上附加连接子或接头,将DNA片段彼此相连。
方便起见,以转录的方向提供具有接头或多聚接头的启动子和终止子区域,所述接头含有用于插入该核酸序列的一个或多个限制位点。一般地,接头含有1至10,通常1至8,优选2至6个限制位点。接头在调节区内的大小一般小于100bp,常常小于60bp,但至少长5bp。对于宿主植物而言,启动子可以是天然的(或同源的)或外源的(或异源的)。表达盒优选以5’-3’转录方向含有启动子、编码核酸序列或核酸构建体,以及转录终止区。不同的终止区可以按需要互换。
终止子的实例有35S终止子(Guerineau等(1988)Nucl Acids Res.16:11380)、nos终止子(Depicker A,Stachel S,Dhaese P,Zambryski P,Goodman HM.Nopaline synthase:transcript mapping and DNA sequence.J Mol Appl Genet.1982;1(6):561-73)或ocs终止子(Gielen,J,deBeuckeleer,M,Seurinck,J,Debroek,H,de Greve,H,Lemmers,M,vanMontagu,M,Schell,J(1984)The complete sequence of the TL-DNA of theAgrobacterium tumefaciens plasmid pTiAch5.EMBO J.3:835-846)。
此外还可以进行操作,以提供适当的限制性切割位点,或删除冗余DNA或限制性切割位点。可能进行插入、缺失或替换(如转换和颠换)时,可以使用如体外诱变、引物修补、限制性酶切或连接的方法。
通过适当的操作(如限制性酶切、回嚼(chewing back)或将突出端填补成平端),可提供进行连接的片段互补末端。
优选的多腺苷酸化信号是植物多腺苷酸化信号,优选那些基本上与根癌农杆菌(Agrobacterium tumefaciens)来源的T-DNA多腺苷酸化信号对应的信号,特别是Ti质粒pTiACH5(Gielen等,EMBO J.3(1984),835 ff)的T-DNA(章鱼碱合成酶)基因3的多腺苷酸化信号或其功能等价物。
将外源基因转移进植物基因组称为转化。
为此,可以使用已知的转化和从植物组织或植物细胞再生植物的方法,以进行瞬时或稳定转化。
适于转化植物的方法有通过聚乙二醇诱导DNA摄取的原生质体转化、使用基因枪的生物轰击法——“粒子轰击”法、电穿孔、在含有DNA的溶液中孵育干胚、显微注射及上文所述农杆菌介导的基因转移。所述方法描述于例如B.Jenes等,Techniques for Gene Transfer,《Transgenic Plants》,卷1,Engineering and Utilization,S.D.Kung和R.Wu编辑,AcademicPress(1993),128-143和Potrykus,Annu.Rev.Plant Physiol.Plant Molec.Biol.42(1991),205-225。
优选将要表达的构建体克隆入适于转化根癌农杆菌的载体,如pBin19(Bevan等,Nucl.Acids Res.12(1984),8711),或特别优选pSUN2、pSUN3、pSUN4或pSUN5(WO 02/00900)。
用表达质粒转化的农杆菌可以通过已知的方式用于转化植物,例如在农杆菌溶液中浸浴损伤的叶子或叶子的碎片,并随后培养在适当的培养基中。
为了优选制备遗传修饰的植物(下文也称为转基因植物),将融合表达盒克隆入适于在根癌农杆菌中转化的载体,如pBin19,或特别是pSUN5和pSUN3。此后将通过已知方式将这种载体转化的农杆菌用于转化植物(特别是农作物),例如,通过在农杆菌溶液中浸浴损伤的叶子或叶子的碎片,并随后在适当的培养基中培养。
利用农杆菌进行植物转化特别公开于F.F.White,Vectors for GeneTransfer in Higher Plants;《Transgenic Plants》,卷1中“Engineering andUtilization”,S.D.Kung和R.Wu编辑,Academic Press,1993,15-38页。可以通过已知的方式从损伤的叶子或叶片段的转化细胞进行转基因植物再生,所述转基因植物含有整合入表达盒的一个或多个基因。
为了用一个或多个本发明的作用基因转化宿主植物,将表达盒插入其DNA中含有额外功能调节信号(如用于复制或整合的序列)的重组载体。合适的载体特别描述于《Methods in Plant Molecular Biology andBiotechnology》(CRC Press),6/7章,71-119页(1993)。
使用上文引用的重组和克隆技术,可以将表达盒克隆进能够在如大肠杆菌中复制的适当载体中。合适的克隆载体有例如pJIT117(Guerineau等(1988)Nucl.Acids Res.16:11380)、pBR332、pUC系列、M13mp系列和pACYC184。特别合适的是能够在大肠杆菌和农杆菌中复制的二元载体。
以下将通过实施例更为详细地描述本发明中遗传修饰微生物的产生,所述遗传修饰的微生物具有增加的或造成的酮酶活性,以及增加的或造成的β环化酶活性(其修饰的β环化酶活性是由于该β环化酶含有SEQ IDNO:2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO:2序列至少有70%的同一性)。
其他活性,如羟化酶活性、HMG-CoA还原酶活性、(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶活性、1-脱氧-D-木糖-5-磷酸合酶活性、1-脱氧-D-木糖-5-磷酸还原异构酶活性、异戊烯二磷酸酯Δ-异构酶活性、牻牛儿基二磷酸酯合酶活性、法呢基二磷酸酯合酶活性、牻牛儿基牻牛儿基二磷酸酯合酶活性、八氢番茄红素合酶活性、八氢番茄红素去饱和酶活性、ζ-胡萝卜素去饱和酶活性、crtISO活性、FtsZ活性和/或MinD活性,可以通过使用相应的作用基因得到类似的增加。
优选将上述编码酮酶、β-羟化酶或β环化酶的核酸,以及编码HMG-CoA还原酶的核酸、编码(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶的核酸、编码1-脱氧-D-木糖-5-磷酸合酶的核酸、编码1-脱氧-D-木糖-5-磷酸还原异构酶的核酸、编码异戊烯基二磷酸酯Δ-异构酶的核酸、编码牻牛儿基二磷酸酯合酶的核酸、编码法呢基二磷酸酯合酶的核酸、编码牻牛儿基牻牛儿基二磷酸酯合酶的核酸、编码八氢番茄红素合酶的核酸、编码八氢番茄红素去饱和酶的核酸、编码ζ-胡萝卜素去饱和酶的核酸、编码crtISO蛋白的核酸、编码FtsZ蛋白的核酸和/或编码MinD蛋白的核酸插入表达构建体及载体中,其中所述构建体含有处在调节性核酸序列遗传控制下的编码本发明中酶的核酸序列,所述载体至少含有一个这类表达构建体。
优选本发明的这类构建体含有,位于特定编码序列5’上游端的启动子和3’端下游的终止子序列,并在适当时还含有每种情况下与作用基因有效连接的其它常规调节元件。“有效连接”指的是启动子、编码序列、终止子及适当时其它调节元件以各调节元件能够在编码序列的表达中发挥其预期功能的方式依次排列。
有效连接的序列的实例有靶向序列和翻译增强子、增强子、多腺苷酸化信号等等。其它的调节元件包括选择性标记、扩增信号、复制起点等等。
除了人工调节序列之外,在实际的作用基因前仍可以存在天然的调节序列。通过遗传修饰可在需要时关闭这一天然调节作用,并增加或降低基因的表达。然而基因构建体也可以具有更简单的结构,即在结构基因的前面没有插入额外的调节信号,也没有除去天然启动子及其调节作用。反之则可以突变天然的调节序列使其不再产生调节作用,从而增加或降低基因表达。基因构建体中可以具有一个或多个拷贝的此类核酸序列。
可以使用的微生物启动子有例如在革兰氏阴性细菌中优先使用的cos-、tac-、trp-、tet-、trp-tet-、lpp-、lac-、lpp-lac-、laclq-、T7-、T5-、T3-、gal-、trc、ara-、SP6-、λ-PR-或λ-PL-启动子,及革兰氏阳性启动子amy和SPO2或酵母启动子ADC1、MFα、AC、P-60、CYC1、GAPDH。特别优选使用可诱导的启动子,如光、特别是温度诱导的启动子(如PrPl启动子)。
原则上可以使用所有天然的启动子及其调节序列。此外,也可以有利地使用合成的启动子。
所述调节序列可使核酸序列的选择性表达及蛋白质的表达成为可能。这可能意味着(例如取决于宿主生物的不同)基因只在诱导后表达或过表达,或是立即表达和/或过表达。
既然如此,可优选调节序列或因子使其正面影响表达,从而增加或降低之。因此,通过使用如启动子和/或增强子之类的强转录信号,可以在转录水平上有利的实现调节元件的增强作用。然而,也可以例如通过提高mRNA的稳定性,增强翻译。
通过将适当的启动子与以上描述的编码酮酶、β-羟化酶、β环化酶、HMG-CoA还原酶、(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶、1-脱氧-D-木糖-5-磷酸合酶、1-脱氧-D-木糖-5-磷酸还原异构酶、异戊烯二磷酸酯Δ-异构酶、牻牛儿基二磷酸酯合酶、法呢基二磷酸酯合酶、牻牛儿基牻牛儿基二磷酸酯合酶、八氢番茄红素合酶、八氢番茄红素去饱和酶、ζ-胡萝卜素去饱和酶、crtISO蛋白质、FtsZ蛋白质和/或MinD蛋白质的核酸序列,以及终止子或多腺苷酸化信号融合以产生表达盒。为此可使用如描述于T.Maniatis,E.F.Fritsch和J.Sambrook,《Molecular Cloning:A LaboratoryManual》,Cold Spring Harbor Laboratory,Cold Spring Harbor,NY(1989)及T.J.Silhavy,M.L.Berman和L.W.Enquist,Experiments with GeneFusions,Cold Spring Harbor Laboratory,Cold Spring Harbor,NY(1984)以及Ausubel,F.M.等,《Current Protocols in Molecular Biology》,GreenePublishing Assoc.and Wiley-Interscience(1987)的常规重组和克隆技术。
为了在合适的宿主生物中表达,将重组核酸构建体或基因构建体有利的插入能使基因在宿主中最佳表达的宿主特异性载体。载体是本领域技术人员所熟知的,并可见于如《Cloning Vectors》(Pouwels P.H.等,编辑,Elsevier,Amsterdam-New York-Oxford,1985)。载体不仅指质粒,也指本领域技术人员已知的所有其它载体,如噬菌体、病毒(如SV40、CMV、杆状病毒和腺病毒)、转座子、IS元件、质粒、粘粒和线性或环状DNA。这些载体可以在宿主生物中自主复制或随染色体复制。
可以提及的合适的表达载体的实例为:
常规融合表达载体,如pGEX(Pharmacia Biotech Inc;Smith,D.B.和Johnson,K.S.(1988)Gene 67:31-40)、pMAL(New England Biolabs,Beverly,MA)和pRIT 5(Pharmacia,Piscataway,NJ),其中重组目的蛋白质分别与谷胱甘肽S-转移酶(GST)、麦芽糖E-结合蛋白和A蛋白融合。
非融合蛋白表达载体,如pTrc(Amann等,(1988)Gene 69:301-315)和pET 11d(Studier等Gene Expression Technology:Methods inEnzymology 185,Academic Press,San Diego,California(1990)60-89),或pBluescript及pUC载体。
用于在酿酒酵母中表达的酵母表达载体,如pYepSecl(Baldari等,(1987)Embo J.6:229-234)、pMFα(Kurjan和Herskowitz(1982)Cell 30:933-943)、pJRY88(Schultz等(1987)Gene 54:113-123)和pYES2(Invitrogen Corporation,San Diego,CA)。
适合用于其它真菌(如丝状真菌)的载体以及构建载体的方法包括,van den Hondel,C.A.M.J.J.& Punt,P.J.(1991)″Gene transfer systemsand vector development for filamentous fungi″,《Applied MolecularGenetics of Fungi》,J.F.Peberdy等编辑,1-28页,Cambridge UniversityPress:Cambridge中详细描述的载体和方法。
可用于在培养的昆虫细胞(如Sf9细胞)中表达蛋白质的杆状病毒载体,包括pAc系列(Smith等,(1983)Mol.Cell Biol.3:2156-2165)和pVL系列(Lucklow和Summers(1989)Virology 170:31-39)。
其它合适的原核和真核细胞表达系统描述于Sambrook,J.,Fritsch,E.F.和Maniatis,T.,《Molecular cloning:A Laboratory Manual》,第二版,Cold Spring Harbor Laboratory,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N Y,1989的第16和17章。
借助于本发明的表达构建体或载体,可以利用如至少一种本发明的载体进行转化,制备遗传修饰的生物。
将上述的本发明重组构建体有利的引入合适的宿主系统,并加以表达。这一步中,优选使用本领域技术人员熟悉的克隆和转染方法(如共沉淀、原生质体融合、电穿孔、逆转录病毒转染等),以在特定表达系统中表达所述核酸。合适的系统如《Current Protocols in Molecular Biology》,F.Ausub等编辑,Wiley Interscience,New York 1997中所述。
可以通过同样存在于载体或表达盒中的标记基因来挑选成功转化的生物。这类标记基因的实例如抗生素耐药基因及催化成色反应(使转化细胞染色)的酶基因。然后可以通过自动细胞分选进行选择。
可以通过含有适当抗生素的培养基或营养培养基来选择被载体成功转化的微生物,所述载体具有适当抗生素耐药基因(如G418或潮霉素)。存在于细胞表面的标记蛋白质可用于亲和层析法进行选择。
宿主生物与适用于该生物的载体(如质粒、病毒或噬菌体,如具有RNA聚合酶/启动子系统的质粒、噬菌体8或其它温和噬菌体或转座子)和/或其它有利的调节序列的组合形成了表达系统。
本发明还涉及遗传修饰的非人生物,其中该遗传修饰
A对于已经具有酮酶活性的野生型生物,与野生型相比增加其酮酶活性,且
B对于不具有酮酶活性的野生型生物,与野生型相比造成酮酶活性,
且其中该遗传修饰
C对于已经具有β环化酶活性的野生型生物,与野生型相比增加其β环化酶活性,且
D对于不具有β环化酶活性的野生型生物,与野生型相比造成β环化酶活性,
而C中增加的β环化酶活性或D中造成的β环化酶活性源于以下β环化酶,该β环化酶含有SEQ ID NO:2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO:2序列至少有70%的同一性。
如上所述,优选通过提高编码酮酶的核酸的基因表达,以相对于野生型增加(A中)或造成(B中)酮酶活性。
在另一个优选实施方案中,通过将编码酮酶的核酸引入生物,提高编码酮酶的核酸的基因表达。
该实施方案中,与野生型相比,本发明的转基因生物中至少还存在一个酮酶基因。该实施方案中,本发明的遗传修饰的生物优选具有至少一个编码酮酶的外源(=异源)核酸,或具有至少两个编码酮酶的内源核酸。
为此,原则上可以使用任何酮酶基因,即编码酮酶的任何核酸。
优选的编码酮酶的核酸如上面本发明方法所述。
如上所述,优选通过相对于野生型提高编码β环化酶的核酸的基因表达,以增加或造成β环化酶活性,所述β环化酶中含有SEQ ID NO:2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO:2序列至少有70%的同一性。
在优选实施方案中,通过向生物中插入至少一个编码β环化酶的核酸,提高编码β环化酶的核酸的基因表达,所述β环化酶中含有SEQ ID NO:2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO:2序列至少有70%的同一性。
该实施方案中,与野生型相比,本发明的转基因生物中至少还存在一个β环化酶基因。该实施方案中,本发明的遗传修饰的生物优选具有至少一个编码β环化酶的外源(=异源)核酸,或具有至少两个编码β环化酶的内源核酸。
为此,原则上可以使用任何β环化酶基因,即编码β环化酶的任何核酸,所述β环化酶中含有SEQ ID NO:2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO:2序列至少有70%的同一性。
优选的β环化酶如上所述。
如上所述,特别优选的遗传修饰生物还具有相对于野生型生物增加或造成的羟化酶活性。其他优选实施方案如上面本发明方法所述。
此外,如上所述,特别优选的遗传修饰的非人生物相对于野生型还具有选自HMG-CoA还原酶活性、(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶活性、1-脱氧-D-木糖-5-磷酸合酶活性、1-脱氧-D-木糖-5-磷酸还原异构酶活性、异戊烯二磷酸酯Δ-异构酶活性、牻牛儿基二磷酸酯合酶活性、法呢基二磷酸酯合酶活性、牻牛儿基牻牛儿基二磷酸酯合酶活性、八氢番茄红素合酶活性、八氢番茄红素去饱和酶活性、ζ-胡萝卜素去饱和酶活性、crtISO活性、FtsZ活性及MinD活性中至少一种增加的活性。其他优选实施方案如上面本发明方法所述。
本发明的生物优选指野生型或起始生物可天然产生或能够通过遗传互补和/或代谢途径的再调节生产类胡萝卜素,特别是β-胡萝卜素和/或玉米黄质和/或新叶黄素和/或紫黄质和/或叶黄素的生物。
其他优选的生物,野生型或起始生物已经具有羟化酶的活性,因此其野生型或起始生物即能产生玉米黄质。
优选生物为植物或微生物,例如,细菌、酵母、藻类或真菌。
使用的细菌可以是由于插入生产类胡萝卜素的生物的类胡萝卜素生物合成基因而能合成叶黄素的细菌(例如含有例如欧文氏菌来源的crt基因的埃希氏杆菌属细菌),以及自身即能够合成叶黄素的细菌(如欧文氏菌属、农杆菌属、黄杆菌属、产碱菌属、副球菌属、念珠藻属的细菌或集胞藻属的蓝细菌)。
优选的细菌为大肠杆菌、草生欧文氏菌、噬夏孢欧文氏菌、橙黄农杆菌、产碱菌属种PC-1、黄杆菌属种R1534菌株、集胞藻属蓝细菌PCC6803、Paracoccus marcusii或Paracoccus carotinifaciens。
优选的酵母为假丝酵母、酵母、汉逊酵母、毕赤酵母)或法夫酵母。特别优选的酵母为Xanthopyvllomyces dendrorhous或Phaffia rhodozyma。
优选的真菌为曲霉、木霉、阿舒囊霉、脉孢菌、布拉霉(特别是Blakesleatrispora)、须霉、镰孢霉或如Indian Chem.Engr.B部分卷37,No.1,2(1995)15页表6中描述的其它真菌。
优选的藻类有绿藻,如红球藻属、三角褐指藻、团藻属或杜氏藻属的藻类。特别优选的藻类有雨生红球藻或杜氏藻属巴德成藻。
其它可用于实施本发明方法的微生物及其生产,公开于如,此处引用作为参考的DE-A-19916140。
特别优选的植物选自苋科、石蒜科、夹竹桃科、紫菀科、凤仙花科、秋海棠科、小檗科、十字花科、大麻科、忍冬科、石竹科、藜科、菊科、葫芦科、十字花科、大戟属、豆科、龙胆科、牻牛儿苗科、禾本科、Illiaceae、唇形科、薄荷科、豆科、百合科、亚麻科、山梗菜属、锦葵科、木犀科、兰科、罂粟科、白花丹科、禾本科、花荵科、报春花科、毛茛科、蔷薇科、茜草科、玄参科、茄科、旱金莲科、伞状花科、毛蕊花科、葡萄科及紫罗兰科。
极其优选的植物选自万寿菊属、万寿菊、孔雀草、金合欢属、乌头属、侧金盏花属、阿尼菊属、耧斗菜属、紫菀属、黄芪属、紫葳属、金盏花属、驴蹄草属、风铃草属、美人蕉属、矢车菊属、桂竹香属、苘蒿属、柑桔属、还阳参属、番红花属、南瓜属、金雀儿属、Delonia属、翠雀属、石竹属、康乃馨属、多榔菊属、花菱草属、连翘属、Fremontia属、勋章菊属、钩吻属、染料木属、龙胆属、老鹳草属、非洲菊属、路边青属、银桦属、堆心菊属、向日葵属、细辛属、独活属、木槿属、赛菊芋属、金丝桃属、黄金菊属、凤仙花属、鸢尾属、蓝花楹属、棣堂属、毒豆属、山黧豆属、猫耳草属、百合属、亚麻属、百脉根属、番茄属、珍珠菜属、Maraia属、苜蓿属、沟酸浆属、水仙属、月见草属、木犀属、碧冬茄属、石楠属、酸浆属、牧根草属、委陵草属、火棘属、毛茛属、杜鹃花属、蔷薇属、金光菊属、千里光属、蝇子草属、松香草属、Sinapsis属、花楸属、鹰爪豆属、黄钟花属、蝴蝶草属、婆罗们参属、金莲花属、旱金莲属、郁金香属、款冬属、荆豆属、堇菜属或百日草属植物,特别优选万寿菊属、万寿菊、孔雀草、番茄属、蔷薇属、金盏花属、酸浆属、苜蓿属、向日葵属、苘蒿属、紫菀属、郁金香属、水仙属、碧冬茄属、老鹳草属、旱金莲属或侧金盏花属植物之一。
极其特别优选的遗传修饰的植物选自万寿菊属、万寿菊、孔雀草、侧金盏花属、番茄属、蔷薇属、金盏花属、酸浆属、苜蓿属、向日葵属、茼蒿属、紫菀属、郁金香属、水仙属、碧冬茄属、老鹳草属或旱金莲属,遗传修饰的植物含有至少一个编码酮酶的转基因核酸。
本发明还涉及转基因植物、其繁殖物质以及其植物细胞、组织或部分,特别是其果实、种子、花及花瓣。
如上所述,遗传修饰的植物可用于产生酮类胡萝卜素,特别是虾青素。
可以被人或动物食用的的本发明遗传修饰生物,特别是植物或植物的部分(例如特别是酮类胡萝卜素(特别是虾青素)含量增加的花瓣),也可以直接或经过已知的方式加工后用作食品和饲料或食品和饲料的添加剂。
此外,遗传修饰生物也可以用于制备含有酮类胡萝卜素的生物提取物和/或制备食品和饲料添加剂。
与野生型相比,遗传修饰生物的酮类胡萝卜素含量增加。
酮类胡萝卜素含量的增加通常指酮类胡萝卜素总含量的增加。
然而,酮类胡萝卜素含量的增加也特别指优选的酮类胡萝卜素含量的改变,而总的类胡萝卜素含量不一定增加。
在特别优选的实施方案中,相对于野生型,本发明遗传修饰的植物的虾青素含量增加。
在这种情况下,增加的含量也指造成的酮类胡萝卜素(如虾青素)的含量。
通过以下的实施例(但并不仅限于此)对本发明进行说明。
一般实验条件:
重组DNA序列分析
根据Sanger的方法(Sanger等,Proc.Natl.Acad.Sci.USA 74(1977),5463-5467),利用Licor激光荧光DNA测序仪(MWG Biotech,Ebersbach所售)对重组DNA分子测序。
实施例1:
扩增念珠藻属PCC 7120来源的编码NOST酮酶的完整一级序列DNA
通过PCR从念珠藻属PCC 7120(″Pasteur Culture Collection ofCyanobacterium″菌株)中扩增编码念珠藻属PCC 7120的NOST酮酶DNA。
为了从念珠藻属PCC 7120悬浮培养物制备基因组DNA,将细胞离心收集,冷冻于液氮,并在研钵中碾磨成粉。所述悬浮培养物在25℃、连续光照且恒定振荡(150rpm)条件下于BG 11培养基(1.5g/l NaNO3、0.04g/lK2PO4×3H2O、0.075g/l MgSO4×H2O、0.036g/l CaCl2×2H2O、0.006g/l柠檬酸、0.006g/l柠檬酸铁铵、0.001g/l EDTA二钠镁、0.04g/l Na2CO3、1ml痕量金属混合物A5+Co(2.86g/l H3BO3、1.81g/l MnCl2×4H2O、0.222g/lZnSO4×7H2O、0.39g/l NaMoO4×2H2O、0.079g/l CuSO4×5H2O、0.0494g/lCo(NO3)2×6H2O))中生长1周。
从念珠藻PCC 7120中分离DNA的方法:
在8000rpm离心10分钟,从10ml液体培养物中沉淀细菌细胞。然后用研钵在液氮中粉碎并碾磨细胞。将细胞材料重悬浮于1ml 10mM TrisHCl(pH 7.5),并转移至Eppendorf反应试管(容积2ml)内。加入100μl蛋白酶K(浓度:20mg/ml)后,将细胞悬浮液在37℃孵育3小时。随后用500μl苯酚抽提悬浮液。在13000rpm离心5分钟后,将上层水相转移到新的2ml Eppendorf反应试管中。用苯酚反复抽提3次。加入1/10体积的3M醋酸钠(pH 5.2)和0.6体积的异丙醇沉淀DNA,然后用70%的乙醇洗涤。在室温干燥DNA沉淀,加入25μl水,并加热至65℃溶解。
通过聚合酶链式反应(PCR),使用正义特异引物(NOSTF,SEQ ID NO:79)和反义特异引物(NOSTG SEQ ID NO:80)从念珠藻属PCC 7120中扩增编码念珠藻属PCC 7120酮酶的核酸。
使用的PCR条件如下:
在50μl反应混合物中用PCR扩增编码由完整一级序列组成的酮酶蛋白质的DNA,所述混合物含有:
-1μl念珠藻属PCC 7120 DNA(如上述制备)
-0.25mM dNTP
-0.2mM NOSTF(SEQ ID NO.79)
-0.2mM NOSTG(SEQ ID NO:80)
-5μl 10X PCR缓冲液(TAKARA)
-0.25μl R Taq聚合酶(TAKARA)
-25.8μl蒸馏水
在以下循环条件下进行PCR:
1X    94℃ 2分钟
35X   94℃ 1分钟
      55℃ 1分钟
      72℃ 3分钟
1X    72℃ 10分钟
利用SEQ ID NO.79和SEQ ID NO:80进行PCR扩增产生了805bp的片段,所述片段编码由完整一级序列组成的蛋白质(SEQ ID NO:81)。使用标准方法,将扩增子克隆进PCR克隆载体pGEM-T(Promega),获得pNOSTF-G克隆。
使用M 13F和M 13R引物对pNOSTF-G克隆的测序确证了与数据库条目AP003592的88,886-89,662之DNA序列一致的序列。此核苷酸序列在独立的扩增实验中可以重复,因此代表使用的念珠藻属PCC 7120中的核苷酸序列。
因此,该pNOSTF-G克隆被用于克隆进表达载体pJIT117(Guerineau等1988,Nucl.Acids Res.16:11380)。通过从pNOSTF-G分离799bp SphI片段并连接进SphI切割的pJIT117载体,完成这一克隆。以正确方向含有念珠藻属PCC 7120酮酶的克隆被称为pJNOST,其中酮酶的N-末端与rbcS转运肽翻译融合。
实施例2:
构建质粒pMCL-CrtYIBZ/idi/gps,用于在大肠杆菌中合成玉米黄质。
经中间体pMCL-CrtYIBZ和pMCL-CrtYIBZ/idi,通过3个步骤构建pMCL-CrtYIBZ/idi/gps。使用的载体是与高拷贝数载体相容的pMCL200质粒(Nakano,Y.,Yoshida,Y.,Yamashita,Y.和Koga,T.;Construction of a series of pACYC-derived plasmid vectors;Gene 162(1995),157-158)。
实施例2.1:构建pMCL-CrtYIBZ
生物合成基因crtY、crtB、crtI和crtZ来自噬夏孢欧文氏菌,并通过PCR方法扩增。噬夏孢欧文氏菌(DSM 30080)的基因组DNA由GermanCollection of Microorganisms and Cell Culture(DSMZ,Brunswick,Germany)作为提供的服务而制备。根据制造商提供的详细信息进行PCR(Roche,Long Template PCR:Procedure for amplification of 5-20kbtargets with the expand long template PCR system)。扩增噬夏孢欧文氏菌生物合成簇的PCR条件如下:
Master Mix 1:
-1.75μl dNTP(终浓度350μM)
-0.3μM引物Crt1(SEQ ID NO:82)
-0.3μM引物Crt2(SEQ ID NO:83)
-250-500ng DSM 30080基因组DNA
加蒸馏水至总体积50μl
Master Mix 2:
-5μl 10x PCR缓冲液1(终浓度1x,含1.75mM Mg2+)
-10x PCR缓冲液2(终浓度1x,含2.25mM Mg2+)
-10x PCR缓冲液3(终浓度1x,含2.25mM Mg2+)
-0.75μl Expand Long Template Enzyme Mix(终浓度2.6单位)
加蒸馏水至总体积50μl
用移液器将两种混合物“Master Mix 1”和“Master Mix 2”混合。在50μl总体积中以如下循环条件进行PCR:
1X      94℃ 两分钟
30X     94℃ 30秒
        58℃ 1分钟
        68℃ 4分钟
1X      72℃ 10分钟
使用SEQ ID NO:82和SEQ ID NO:83进行PCR扩增产生了编码基因CrtY(蛋白质:SEQ ID NO:85)、CrtI(蛋白质:SET NID NO.86)、crtB(蛋白质:SEQ ID NO:87)和CrtZ(iDNA)的片段(SEQ ID NO:84)。使用标准方法,将扩增子克隆进PCR克隆载体pCR2.1(Invitrogen),获得pCR2.1-CrtYIBZ克隆。
用SalI和HindIII切割pCR2.1-CrtYIBZ质粒,分离所产生的SalI/HindIII片段,并通过连接将其转移进SalI/HindIII切割的pMCL200载体。克隆入pMCL 200的pCR2.1-CrtYIBZ SalI/HindIII片段长度为4624bp,编码CrtY、CrtI、crtB和CrtZ基因,对应D90087中2295位点到6918位点的序列(SEQ ID NO:84)。通过CrtZ基因内源性启动子,逆CrtY、CrtI和CrtB基因的阅读框方向转录该基因。产生的克隆被称为pMCL-CrtYIBZ。
实施例2.2:构建pMCL-CrtYIBZ/idi
通过PCR方法从大肠杆菌中扩增idi(异戊烯二磷酸异构酶;IPP异构酶)基因。使用正义特异引物(5′-idi SEQ ID NO:88)和反义特异引物(3′-idi SEQ ID NO:89),通过聚合酶链式反应(PCR),从大肠杆菌中扩增包含idi启动子和核糖体结合位点的编码完整idi基因的核酸。
PCR条件如下:
扩增DNA的PCR在50μl反应混合物中进行,其中含有:
-1μl大肠杆菌TOP10悬浮液
-0.25mM dNTP
-0.2mM 5′-idi(SEQ ID NO:88)
-0.2mM 3′-idi(SEQ ID NO:89)
-5μl 10X PCR缓冲液(TAKARA)
-0.25μl R Taq聚合酶(TAKARA)
-28.8μl蒸馏水
以下循环条件中进行PCR:
1X        94℃ 2分钟
20X       94℃ 1分钟
          62℃ 1分钟
          72℃ 1分钟
1X        72℃ 10分钟
利用SEQ ID NO:88和SEQ ID NO:89进行PCR扩增产生679bp的片段,该片段编码由完整一级序列(SEQ ID NO:90)组成的蛋白质。使用标准方法,将扩增子克隆进PCR克隆载体pCR2.1(Invitrogen),获得pCR2.1-idi克隆。
对pCR2.1-idi克隆的测序确证了与发表的AE000372序列8774到9440位置无异的序列。这一区域包括启动子区域、可能的核糖体结合位点和完整的IPP异构酶开放阅读框。由于在idi基因的5,端插入了XhoI切割位点、3’端插入了SalI切割位点,克隆进pCR2.1-idi的片段总长为679bp。
因此,使用该克隆将idi基因克隆进pMCL-CrtYIBZ载体。通过从pCR2.1-idi分离XhoI/SalI片段并连接进XhoI/SalI切割的pMCL-CrtYIBZ载体完成这一克隆。产生的克隆被称为pMCL-CrtYIBZ/idi。
实施例2.3.:构建pMCL-CrtYIBZ/idi/gps
通过PCR方法从嗜超高温硫酸根还原古细菌(Archaeglobus fulgidus)中扩增gps(牻牛儿基牻牛儿基焦磷酸合酶;GGPP合酶)基因。使用正义特异引物(5′-gps SEQ ID NO:92)和反义特异引物(5′-gps SEQ ID NO:93),通过聚合酶链式反应(PCR)扩增嗜超高温硫酸根还原古细菌gps基因。
嗜超高温硫酸根还原古细菌DNA由German Collection ofMicroorganisms and Cell Culture(DSMZ,Brunswick,Germany)作为提供的服务而制备。PCR条件如下:
在50μl反应混合物中用PCR扩增编码由完整一级序列组成的GGPP合酶蛋白质的DNA,所述混合物含有:
-1μl嗜超高温硫酸根还原古细菌DNA
-0.25mM dNTP
-0.2mM 5′-gps(SEQ ID NO:92)
-0.2mM 3′-gps(SEQ ID NO:93)
-5μl 10X PCR缓冲液(TAKARA)
-0.25μl R Taq聚合酶(TAKARA)
-28.8μl蒸馏水
在以下循环条件进行PCR:
1X     94℃ 2分钟
20X    94℃ 1分钟
       56℃ 1分钟
       72℃ 1分钟
1X     72℃ 10分钟
用已知方法从琼脂糖凝胶中洗脱利用PCR和SEQ ID NO:92及SEQID NO:93引物扩增的DNA片段,并用限制酶NcoI和HindIII切割之。由此产生编码由完整一级序列(SEQ ID NO:94)组成蛋白质的962bp片段。使用标准方法,将NcoI/HindIII切割的扩增子克隆进pCB97-30载体,获得pCB-gps克隆。
对pCB-gps克隆的测序确证了与发表的AF120272序列有一个核苷酸差异的A.fulgidus GGPP合酶序列。在gps基因中引入一个NcoI切割位点,改变GGPP合酶的第二个密码子。在发表的AF120272序列中,CTG(4-6位点)编码亮氨酸。使用SEQ ID NO:92和SEQ ID NO:93两种引物的扩增将此第二密码子改变为编码缬氨酸的GTG。
因此,使用pCB-gps克隆将gps基因克隆进pMCL-CrtYIBZ/idi载体。通过从pCB-gps中分离KpnI/XhoI片段并连接进用KpnI和XhoI切割的pMCL-CrtYIBZ/idi载体完成这一克隆。克隆的KpnI/XhoI片段(SEQ IDNO:94)带有Prrn 16启动子和rbcL的最小5’UTR序列、延伸GGPP合酶N末端的前6个rbcL密码子和gps基因3’端的psbA序列。因此该GGPP合酶的N末端具有改变的氨基酸序列Met-Thr-Pro-Gln-Thr-Ala-Met-Val-Lys-Glu,而不是天然氨基酸序列Met-Leu-Lys-Glu(AF120272的1到4位氨基酸)。这使得重组GGPP合酶从位点3(在AF120272中)的Lys开始在氨基酸序列上具有同一性,并且没有更多改变。参考Eibl等(Plant J.19.(1999),1-13)使用rbcL和psbA序列。产生的克隆被称为pMCL-CrtYIBZ/idi/gps。
实施例3:
在重组大肠杆菌菌株中生物转化玉米黄质
为进行玉米黄质的生物转化,通过异源互补制备能产生玉米黄质的重组大肠杆菌菌株。大肠杆菌TOP10菌株作为宿主细胞,用于用质粒pNOSTF-G和pMCL-CrtYIBZ/idi/gps的互补实验。
为了制备可合成高浓度玉米黄质的大肠杆菌菌株,构建pMCL-CrtYIBZ/idi/gps质粒。该质粒带有噬夏孢欧文氏菌的生物合成基因crtY、crtB、crtI和crtY、嗜超高温硫酸根还原古细菌的gps(牻牛儿基牻牛儿基焦磷酸合成酶)基因和大肠杆菌idi(异戊烯二磷酸异构酶)基因。该构建体解除了类胡萝卜素以及其生物合成前体大量聚积的限速步骤。这一点已由Wang等之前使用若干质粒以相似的方式描述(Wang,C.-W.,Oh,M.-K.和Liao,J.C.;Engineered isoprenoid pathway enhances astaxanthinproduction in Escherichia coli,Biotechnology and Bioengineering 62(1999),235-241)。
使用pNOSTF-G和pMCL-CrtYIBZ/idi/gps两种质粒,以已知的方式转化大肠杆菌TOP 10培养物,并在30℃或37℃的LB培养基培养过夜。同样通过已知的方式加入氨苄青霉素(50μg/ml)、氯霉素(50μg/ml)和异丙基-β-硫代半乳糖苷(1mmol)培养过夜。
为从重组菌株中分离类胡萝卜素,用丙酮抽提细胞,将有机溶剂蒸干,并通过HPLC方法在C30柱上分离类胡萝卜素。条件设置如下。
分离柱:Prontosil C30柱、250×4.6mm(Bischoff,Leonberg)
流速:1.0ml/min
洗脱液:洗脱液A-100%甲醇
洗脱液B-80%甲醇、0.2%醋酸胺
洗脱液C-100%叔丁基甲基醚
梯度曲线:
  时间   流速  %洗脱液A  %洗脱液B  %洗脱液C
  1.00   1.0   95.0   5.0   0
  1.05   1.0   80.0   5.0   15.0
  14.00   1.0   42.0   5.0   53.0
  14.05   1.0   95.0   5.0   0
  17.00   1.0   95.0   5.0   0
  18.00   1.0   95.0   5.0   0
检测:300-500nm
使用光(电)二极管矩阵检测器直接从洗脱峰检测光谱。
通过与标准样品比较吸收光谱和保留时间,鉴定分离的物质。
实施例4:
与先前的实施例类似,制备表达雨生红球藻Flotow em.Wille来源的酮酶大肠杆菌菌株。为此,扩增编码雨生红球藻Flotow em.Wille酮酶完整一级序列的cDNA,并将此cDNA克隆进与实施例1相同的表达载体中。
通过对雨生红球藻(″Collection of algal cultures of the University ofG_ttingen″的192.80菌株)悬浮培养物进行PCR,扩增编码雨生红球藻酮酶的cDNA。为了从雨生红球藻(192.80菌株)悬浮培养物中制备总RNA,收集细胞,在液氮中冷冻,并在研钵中碾磨成粉,所述悬浮培养物在室温间接日光条件下于红球藻培养基(1.2g/l醋酸钠、2g/l酵母提取物、0.2g/lMgCl2×6H2O、0.02CaCl2×2H2O;pH 6.8;高压灭菌后加入400mg/l L-天冬酰胺、10mg/1FeSO4×H2O)中生长两周。随后将100mg冷冻的藻类细胞研磨粉末转移到反应试管内,并加入0.8ml Trizol缓冲液(LifeTechnologies)。用0.2ml氯仿抽提悬浮液。12000g离心15分钟后,将水相上清液转移到新的反应试管内,并用一体积的乙醇抽提。用一体积异丙醇沉淀RNA,用75%的乙醇洗涤并将沉淀溶解于DEPC水(用1/1000体积焦碳酸二乙酯水在室温孵育过夜,然后高压灭菌)。通过分光光度法测定RNA浓度。
为合成cDNA,将2.5μg总RNA在60℃变性10分钟,冰上冷却2分钟,并按照制造商说明,使用反义特异引物PR1(gcaagctcga cagctacaaa cc),通过cDNA试剂盒(Ready-to-go-you-prime-beads,Pharmacia Biotech)转录成cDNA。
利用正义特异引物PR2(gaagcatgca gctagcagcgacag)和反义特异引物PR1,对雨生红球藻进行聚合酶链式反应(PCR),扩增编码雨生红球藻(192.80菌株)酮酶的核酸。
PCR条件如下:
在50μl反应混合物中用PCR扩增编码由完整一级序列组成的酮酶蛋
白质的DNA,所述混合物含有:
-4ml雨生红球藻cDNA(如上述制备)
-0.25mM dNTP
-0.2mM PR1
-0.2mM PR2
-5ml 10X PCR缓冲液(TAKARA)
-0.25ml R Taq聚合酶(TAKARA)
-25.8ml蒸馏水
在以下循环条件进行PCR:
1X         94℃ 2分钟
35X        94℃ 1分钟
           53℃ 2分钟
           72℃ 3分钟
1X         72℃ 10分钟
利用PR1和PR2进行PCR扩增产生编码由完整一级序列组成蛋白质的1155bp片段:
gaagcatgca gctagcagcg acagtaatgt tggagcagct taccggaagc gctgaggcac         60
tcaaggagaa ggagaaggag gttgcaggca gctctgacgt gttgcgtaca tgggcgaccc        120
agtactcgct tccgtcagag gagtcagacg cggcccgccc gggactgaag aatgcctaca        180
agccaccacc ttccgacaca aagggcatca caatggcgct agctgtcatc ggctcctggg        240
ccgcagtgtt cctccacgcc atttttcaaa tcaagcttcc gacctccttg gaccagctgc        300
actggctgcc cgtgtcagat gccacagctc agctggttag cggcagcagc agcctgctgc        360
acatcgtcgt agtattcttt gtcctggagt tcctgtacac aggccttttt atcaccacgc        420
atgatgctat ccatggcacc atcgccatga gaaacaggca gcttaatgac ttcttgggca        480
gagtatgcat ctccttgtac gcctggtttg attacaacat gctgcaccgc aagcattggg        540
agcaccacaa ccacactggc gaggtgggca aggaccctga cttccacagg ggaaaccctg        600
gcattgtgcc ctggtttgcc agcttcatgt ccagctacat gtcgatgtgg cagtttgcgc        660
gcctcgcatg gtggacggtg gtcatgcagc tgctgggtgc gccaatggcg aacctgctgg        720
tgttcatggc ggccgcgccc atcctgtccg ccttccgctt gttctacttt ggcacgtaca        780
tgccccacaa gcctgagcct ggcgccgcgt caggctcttc accagccgtc atgaactggt        840
ggaagtcgcg cactagccag gcgtccgacc tggtcagctt tctgacctgc taccacttcg        900
acctgcactg ggagcaccac cgctggccct ttgccccctg gtgggagctg cccaactgcc        960
gccgcctgtc tggccgaggt ctggttcctg cctagctgga cacactgcag tgggccctgc       1020
tgccagctgg gcatgcaggt tgtggcagga ctgggtgagg tgaaaagctg caggcgctgc       1080
tgccggacac gctgcatggg ctaccctgtg tagctgccgc cactagggga gggggtttgt       1140
agctgtcgag cttgc
使用标准方法,将扩增子克隆进PCR克隆载体pGEM-Teasy(Promega),获得pGKETO2克隆。
利用T7和SP6引物对pGKETO2克隆的测序,确证了仅在73、114和119三个密码子中各有一个碱基与发表的X86782序列不同的序列。这些核苷酸置换可以在独立的扩增实验中重复,因此代表所用雨生红球藻192.80菌株中的核苷酸序列。
该克隆被用于雨生红球藻酮酶的表达。如实施例3所述进行大肠杆菌菌株的转化、培养和类胡萝卜素谱的分析。
表1比较了细菌产生的类胡萝卜素量:
表1:比较使用两种不同酮酶---念珠藻属PCC7120NOST酮酶(实施例1)和雨生红球藻酮酶(实施例4)---的细菌酮类胡萝卜素合成。类胡萝卜素的量以ng/ml培养液表示。
  酮酶来源   虾青素   金盏花玉红质   金盏花黄质   角黄素   玉米黄质
  雨生红球藻Flotow em.Wille   13   102   738
  念珠藻属PCC7120株   491   186   120
实施例5:
扩增编码点形念珠藻ATCC 29133来源的NP196酮酶完整一级序列的DNA
通过PCR方法,从点形念珠藻ATCC 29133(美国典型培养物保藏中心菌株)扩增编码点形念珠藻ATCC 29133 NP196酮酶的DNA。
为了从点形念珠藻ATCC 29133悬浮培养物中制备基因组DNA,离心收集细胞,在液氮中冷冻,并在研钵中碾磨成粉,所述悬浮培养物在25℃、连续光照及恒定振荡(150rpm)下于BG 11培养基(1.5g/l NaNO3、0.04g/lK2PO4×3H2O、0.075g/l MgSO4×H2O、0.036g/l CaCl2×2H2O、0.006g/l柠檬酸、0.006g/l柠檬酸铁铵、0.001g/l EDTA二钠镁、0.04g/l Na2CO3、1ml痕量金属混合物A5+Co(2.86g/l H3BO3、1.81g/l MnCl2×4H2O、0.222g/lZnSO4×7H2O、0.39g/l NaMoO4×2H2O、0.079g/l CuSO4×5H2O、0.0494g/1Co(NO3)2×6H2O))中生长1周。
从点形念珠藻ATCC 29133中分离DNA的方法:
在8000rpm离心10分钟,从10ml液体培养物中沉淀细菌细胞。然后用研钵在液氮中粉碎并碾磨细菌细胞。将细胞材料重悬浮于1ml 10mMTris HCI(pH7.5),并转移至Eppendorf反应试管(容积2ml)。加入100μl蛋白酶K(浓度:20mg/ml)后,将细胞悬浮液在37℃孵育3小时。随后用500μl苯酚抽提悬浮液。在13000rpm离心5分钟后,将上层水相转移到新的2ml Eppendorf反应试管中。用苯酚反复抽提3次。加入1/10体积的3M醋酸钠(pH 5.2)和0.6体积的异丙醇沉淀DNA,然后用70%的乙醇洗涤。在室温干燥DNA沉淀,加入25μl水,并加热至65℃溶解。
通过聚合酶链式反应(PCR),使用正义特异引物(NP196-1,SEQ ID NO:100)和反义特异引物(NP196-2SEQ ID NO:101)从点形念珠藻ATCC29133中扩增编码点形念珠藻ATCC 29133酮酶的核酸。
PCR条件如下:
在50μl反应混合物中用PCR扩增编码由完整一级序列组成的酮酶蛋白质的DNA,所述混合物含有:
-1μl点形念珠藻ATCC29133DNA(如上述制备)
-0.25mM dNTP
-0.2mM NP196-1(SEQ ID NO:100)
-0.2mM NP196-2(SEQ ID NO:101)
-5μl 10X PCR缓冲液(TAKARA)
-0.25μl R Taq聚合酶(TAKARA)
-25.8μl蒸馏水
在以下循环条件下进行PCR:
1X          94℃ 2分钟
35X         94℃ 1分钟
            55℃ 1分钟
            72℃ 3分钟
1X          72℃ 10分钟
利用SEQ ID NO:100和SEQ ID NO:101进行PCR扩增产生792bp的片段,所述片段编码由完整一级序列(NP196,SEQ ID NO:102)组成的蛋白质。使用标准方法,将扩增子克隆进PCR克隆载体pCR 2.1(Invitrogen),获得pNP196克隆。
使用引物M13F和M13R对pNP196克隆的测序确证了与数据库NZ AABC01000196条目140,571-139,810的DNA序列一致的序列(与发表的数据库条目方向相反),只是其中140,571位点的G被A取代以产生标准的起始密码子ATG。该核苷酸序列在独立扩增实验中可以重复,因此代表所用的点形念珠藻ATCC 29133中的核苷酸序列。
因此,该pNP196克隆被用于克隆进表达载体pJIT117(Guerineau等1988,Nucl.Acids Res.16:11380)。
用根癌农杆菌Ti质粒pTi15955的OCS终止子(章鱼碱合酶)(数据库条目X00493,12,541-12,350位点,Gielen等(1984)EMBO J.3835-846)替换35S终止子,对pJIT117进行修饰。
使用质粒pHELLSGATE(数据库条目AJ311874,Wesley等(2001)Plant J.27581-590,用标准方法从大肠杆菌中分离)以及引物OCS-1(SEQ ID NO:133)和OCS-2(SEQ ID NO:134),通过PCR方法制备含有OCT终止子区域的DNA片段。
PCR条件如下:
在50μl反应混合物中进行扩增含有章鱼碱合酶(OCS)终止子区域DNA(SEQ ID NO:106)的PCR,所述混合物中含有:
-100ng pHELLSGATE质粒DNA
-0.25mM dNTP
-0.2mM OCS-1(SEQ ID NO:104)
-0.2mM OCS-2(SEQ ID NO:105)
-5μl 10X PCR缓冲液(Stratagene)
-0.25μl Pfu聚合酶(Stratagene)
-28.8μl蒸馏水
在以下循环条件下进行PCR:
1X         94℃ 2分钟
35X        94℃ 1分钟
           50℃ 1分钟
           72℃ 1分钟
1X         72℃ 10分钟
使用标准方法,将210bp扩增子克隆进PCR克隆载体pCR 2.1(Invitrogen),获得pOCS质粒。
对pOCS克隆测序确证了与根癌农杆菌Ti质粒pTi15955(数据库条目X00493)上12,541-12,350位点对应的序列部分。
从pOCS分离210bp的SalI-XhoI片段并将其连入SalI-XhoI切割的pJIT117载体,完成这一克隆。
该克隆被称为pJO,并用于克隆进表达载体pJONP196。
从pNP196分离782bp的SphI片段,并将其连入SphI切割的pJO载体,从而完成克隆。以正确方向含有点形念珠藻NP196酮酶的克隆被称为pJONP196,其中酮酶的N-末端与rbcS转运肽翻译融合。
实施例6:
制备用于在食用番茄和万寿菊中组成性表达点形念珠藻ATCC 29133来源的NP196酮酶的表达载体
食用番茄和万寿菊中点形念珠藻NP196酮酶的表达,是在拟南芥来源的组成型启动子FNR(铁氧还蛋白NADPH氧化还原酶,数据库条目AB011474,70127到69493位;WO 03/006660)控制下进行的。FNR基因起始于69492碱基对,并被命名为“铁氧还蛋白-NADP+还原酶”。使用豌豆转运肽rbcS(Anderson等1986,Biochem J.240:709-715)进行表达。
使用基因组DNA(通过标准方法从拟南芥中分离)及引物FNR-1(SEQID NO:107)和FNR-2(SEQ ID NO:108),通过PCR方法制备含有拟南芥FNR启动子区域的DNA片段。
PCR条件如下:
在50μl反应混合物中进行扩增含有FNR启动子片段FNR的DNA(SEQ ID NO:109)的PCR,所述混合物含有:
-100ng拟南芥基因组DNA
-0.25mM dNTP
-0.2mM FNR-1(SEQ ID NO:107)
-0.2mM FNR-2(SEQ ID NO:108)
-5μl 10X PCR缓冲液(Stratagene)
-0.25μl Pfu聚合酶(Stratagene)
-28.8μl蒸馏水
在以下循环条件下进行PCR:
1X          94℃ 2分钟
35X         94℃ 1分钟
            50℃ 1分钟
            72℃ 1分钟
IX          72℃ 10分钟
使用标准方法将652bp扩增子克隆进PCR克隆载体pCR 2.1(Invitrogen),获得pFNR质粒。
对pFNR克隆的测序确证了与拟南芥5号染色体上70127到69493位点(数据库条目AB011474)对应的序列片段。
该克隆被称为pFNR,并因此被用于克隆进表达载体pJONP196(如实施例5所述)。
从pFNR分离644bp的SmaI-HindIII片段,并将其连入Ecl136II-HindIII切割的pJONP196载体来完成克隆。含有FNR启动子而非原始d35S启动子且以正确方向含有NP196片段的克隆被称为pJOFNR:NP196,所述NP196片段的N-末端与rbcS转运肽融合。
使用二元载体pSUN3(WO 02/00900)制备用于农杆菌介导下向食用番茄转化念珠藻NP196酮酶的表达盒。
为制备表达载体MSP105,将来自pJOFNR:NP196的1839bpEcoRI-XhoI片段与EcoRI-XhoI切割的pSUN3载体相连。表达载体MSP105含有FNR启动子片段--FNR启动子(635bp)、rbcS TP FRA GMENT片段--豌豆rbcS转运肽(194bp)、NP196 KETO CDS片段(761bp)--编码点形念珠藻NP196酮酶、OCS终止子片段(192bp)--章鱼碱合酶的多聚腺苷酸化信号。
使用二元载体pSUN5(WO 02/00900)制备用于农杆菌介导下向万寿菊转化含有点形念珠藻NP196酮酶的表达载体的表达盒。
为制备万寿菊表达载体MSP106,将来自pJOFNR:NP196的1839bp的EcoRI-XhoI片段与EcoRI-XhoI切割的pSUN5载体相连。MSP106含有FNR启动子片段--FNR启动子(635bp)、rbcS TP FRAGMENT片段--豌豆rbcS转运肽(194bp)、NP196 KETO CDS片段(761bp)--编码点形念珠藻NP196酮酶、OCS终止子片段(192bp)--章鱼碱合酶的多聚腺苷酸化信号。
实施例7:
制备用于在食用番茄和万寿菊中花特异性表达点形念珠藻ATCC29133来源的NP196酮酶的表达载体
使用豌豆rbcS转运肽(Anderson等1986,Biochem J.240:709-715),在食用番茄和万寿菊中表达点形念珠藻NP196酮酶。该表达在碧冬茄来源的花特异性启动子EPSPS(数据库条目M37029;核苷酸区域7-1787;Benfey等(1990)Plant Cell 2:849-856)的控制下进行。
使用基因组DNA(通过标准方法从碧冬茄中分离)及引物EPSPS-1(SEQ ID NO:110)和EPSPS-2(SEQ ID NO:111),通过PCR方法制备含有碧冬茄EPSPS启动子区域的DNA片段(SEQ ID NO:112)。
PCR条件如下:
在50μl反应混合物中进行扩增含有EPSPS启动子片段(数据库条目M37029:核苷酸区域7-1787)DNA的PCR,所述混合物含有:
-100ng拟南芥基因组DNA
-0.25mM dNTP
-0.2mM EPSPS-1(SEQ ID NO:110)
-0.2mM EPSPS-2(SEQ ID NO:111)
-5μl 10X PCR缓冲液(Stratagene)
-0.25μl Pfu聚合酶(Stratagene)
-28.8μl蒸馏水
在以下循环条件下进行PCR:
1X      94℃ 2分钟
35X     94℃ 1分钟
        50℃ 1分钟
        72℃ 2分钟
1X      72℃ 10分钟
使用标准方法将1773bp扩增子克隆进PCR克隆载体pCR 2.1(Invitrogen),获得pEPSPS质粒。
对pEPSPS克隆的测序确证了与发表的EPSPS序列(数据库条目M37029:核苷酸区域7-1787)仅相差两个缺失(M37029序列46-58位点的ctaagtttcagga碱基;M37029序列1422-1429位点的aaaaatat碱基)及碱基置换(T替换M37029序列1447位点的G;A替换M37029序列1525位点的C;A替换M37029序列1627位点的G)的序列。这两个缺失和M37029序列1447及1627位点的两个碱基置换在独立扩增实验中可以重复,因此代表实际所用的碧冬茄植物的核苷酸序列。
因此,pEPSPS克隆被用于克隆进pJONP196表达载体(如实施例5所述)。
通过从pEPSPS分离1763bp的SacI-HindIII片段,并将其连接进SacI-HindIII切割的JONP196载体来完成克隆。含有EPSPS启动子而非原始d35S启动子的克隆被称为pJOESP:NP196。该表达盒以正确方向含有NP196片段,所述片段的N-末端与rbcS转运肽融合。
使用二元载体pSUN3(WO 02/00900)制备用于农杆菌介导下向食用番茄转化EPSPS控制的点形念珠藻ATCC 29133 NP196酮酶的表达载体。
为制备表达载体MSP107,将来自pJOESP:NP196的2961KBbpSachI-XhoI片段与SacI-XhoI切割的pSUN3载体相连。表达载体MSP107含有EPSPS片段--EPSPS启动子(1761bp)、rbcS TP FRAGMENT片段--豌豆rbcS转运肽(194bp)、NP196 KETO CDS片段(761bp)--编码点形念珠藻NP196酮酶、OCS终止子片段(192bp)--章鱼碱合酶的多聚腺苷酸化信号。
使用二元载体pSUN5(WO 02/00900)制备用于农杆菌介导下向万寿菊转化EPSPS控制的点形念珠藻NP196酮酶的表达载体。
为制备表达载体MSP108,将来自pJOESP:NP196的2961 KBbp的SachI-XhoI片段与SacI-XhoI切割的pSUN5载体相连。表达载体MSP108含有EPSPS片段--EPSPS启动子(1761bp)、rbcS TP FRAGMENT片段--豌豆rbcS转运肽(194bp)、NP196 KETO CDS片段(761bp)--编码点形念珠藻NP196酮酶、OCS终止子片段(192bp)--章鱼碱合酶的多聚腺苷酸化信号。
实施例8:
扩增编码点形念珠藻ATCC 29133 NP195酮酶完整一级序列的DNA
通过PCR方法,从点形念珠藻ATCC 29133(美国典型培养物保藏中心菌株)扩增编码点形念珠藻ATCC 29133 NP195酮酶的DNA。从点形念珠藻ATCC 29133的悬浮培养物中制备基因组DNA已在实施例5中描述。
使用正义特异引物(NP195-1,SEQ ID NO:113)和反义特异引物(NP195-2SEQ ID NO:114),通过聚合酶链式反应(PCR)从点形念珠藻ATCC 29133中扩增编码点形念珠藻ATCC 29133酮酶的核酸。
PCR条件如下:
在50μl反应混合物中用PCR扩增编码由完整一级序列组成的酮酶蛋白质的DNA,所述混合物含有:
-1μl点形念珠藻ATCC 29133 DNA(如上述制备)
-0.25mM dNTP
-0.2mM NP195-1(SEQ ID NO:113)
-0.2mM NP195-2(SEQ ID NO:114)
-5μl 10X PCR缓冲液(TAKARA)
-0.25μl R Taq聚合酶(TAKARA)
-25.8μl蒸馏水
在以下循环条件下进行PCR:
1X          94℃ 2分钟
35X         94℃ 1分钟
            55℃ 1分钟
            72℃ 3分钟
1X          72℃ 10分钟
利用SEQ ID NO:113和SEQ ID NO:114进行PCR扩增产生819bp的片段,所述片段编码由完整一级序列(NP195,SEQ ID NO:115)组成的蛋白质。使用标准方法,将扩增子克隆进PCR克隆载体pCR 2.1(Invitrogen),获得pNP195克隆。
使用M13F和M13R引物对pNP195克隆的测序确证了与数据库NZ AABC010001965条目55,604-56,392的DNA序列一致的序列,只是其中55,604位点的T被A替换以产生标准的起始密码子ATG。该核苷酸序列在独立扩增实验中可以重复,因此代表所用的点形念珠藻ATCC 29133中的核苷酸序列。
因此,该pNP195克隆被用于克隆进表达载体pJO(如实施例5所述)。通过从pNP195分离809bp的SphI片段,并将其连入SphI切割的pJO载体来完成克隆。以正确方向含有点形念珠藻NP195酮酶的克隆被称为pJONP195,其中所述酮酶的N-末端与rbcS转运肽翻译融合。
实施例9:
制备用于在食用番茄和万寿菊中组成性表达点形念珠藻ATCC 29133来源的NP195酮酶的表达载体
食用番茄和万寿菊中点形念珠藻NP195酮酶的表达是在拟南芥来源的组成型启动子FNR(铁氧还蛋白NADPH氧化还原酶,数据库条目AB011474,70127到69493位;WO 03/006660)的控制进行的。FNR基因起始于69492碱基对,并被命名为“铁氧还蛋白-NADP+还原酶”。使用豌豆转运肽rbcS(Anderson等1986,Biochem J.240:709-715)进行表达。
因此,将pFNR克隆(如实施例6所述)用于克隆进表达载体pJONP195(如实施例8所述)。
通过从pFNR分离644bp的Sma-HindIII片段,并将其连入Ecl136II-HindIII切割的pJONP195载体来完成克隆。含有FNR启动子而非原始d35S启动子并以正确方向含有NP195片段的克隆被称为pJOFNR:NP195,所述NP195片段的N-末端与rbcS转运肽融合。
使用二元载体pSUN3(WO 02/00900)制备用于农杆菌介导下向食用番茄转化点形念珠藻NP195酮酶的表达盒。
为制备表达载体MSP109,将来自pJOFNR:NP195的1866bpEcoRI-XhoI片段与EcoRI-XhoI切割的pSUN3载体相连。表达载体MSP109含有FNR启动子片段--FNR启动子(635bp)、rbcS TPFRAGMENT片段--豌豆rbcS转运肽(194bp)、NP195 KETO CDS片段(789bp)--编码点形念珠藻NP195酮酶、OCS终止子片段(192bp)--章鱼碱合酶的多聚腺苷酸化信号。
使用二元载体pSUN5(WO 02/00900)制备用于通过农杆菌介导下向万寿菊转化含有点形念珠藻NP195酮酶的表达载体的表达盒。
为制备MSP110万寿菊表达载体,将来自pJOFNR:NP195的1866bp的EcoRI-XhoI片段与EcoRI-XhoI切割的pSUN5载体相连。表达载体MSP110含有FNR启动子片段--FNR启动子(635bp)、rbcS TP
FRAGMENT片段--豌豆rbcS转运肽(194bp)、NP195KETO CDS片段(789bp)--编码点形念珠藻NP195酮酶、OCS终止子片段(192bp)--章鱼碱合酶的多聚腺苷酸化信号。
实施例10:
制备用于在食用番茄和万寿菊中花特异性表达点形念珠藻ATCC29133来源的NP195酮酶的表达载体
使用豌豆rbcS转运肽(Anderson等1986,Biochem J.240:709-715)在食用番茄和万寿菊中表达点形念珠藻NP195酮酶。该表达在碧冬茄来源的花特异性启动子EPSPS(数据库条目M37029;核苷酸区域7-1787;Benfey等(1990)Plant Cell 2:849-856)的控制下进行。
因此,将pEPSPS克隆(如实施例7所述)用于克隆进表达载体pJONP195(如实施例8所述)。
通过从pEPSPS分离1763bp的SacI-HindIII片段,并将其连入SacI-HindIII切割的pJONP195载体来完成克隆。含有EPSPS启动子而非原始d35S启动子的克隆被称为pJOESP:NP195。该表达盒以正确方向含有NP195片段,所述片段的N-末端与rbcS转运肽融合。
使用二元载体pSUN3(WO 02/00900)制备用于通过农杆菌介导下向食用番茄转化EPSPS控制的点形念珠藻ATCC 29133 NP195酮酶的表达载体。
为制备MSP111表达载体,将来自pJOESP:NP195的2988KB bp的SachI-XhoI片段与SacI-XhoI切割的pSUN3载体相连。表达载体MSP111含有EPSPS片段--EPSPS启动子(1761bp)、rbcS TPFRAGMENT片段--豌豆rbcS转运肽(194bp)、NP195 KETO CDS片段(789bp)--编码点形念珠藻NP195酮酶、OCS终止子片段(192bp)--章鱼碱合酶的多聚腺苷酸化信号。
使用二元载体pSUN5(WO 02/00900)制备用于农杆菌介导下向万寿菊转化EPSPS控制的点形念珠藻NP195酮酶的表达载体。
为制备MSP112表达载体,将来自pJOESP:NP195的2988KBbp的SachI-XhoI片段与SacI-XhoI切割的pSUN5载体相连。表达载体MSP112含有EPSPS片段--EPSPS启动子(1761bp)、rbcS TP FRAGMENT片段--豌豆rbcS转运肽(194bp)、NP195 KETO CDS片段(789bp)--编码点形念珠藻NP195酮酶、OCS终止子片段(192bp)--章鱼碱合酶的多聚腺苷酸化信号。
实施例11:
制备用于花特异性过量表达食用番茄色素体特异的β-羟化酶的表达盒
在矮牵牛的花特异性启动子EPSPS(实施例7)的控制下,进行万寿菊中食用番茄色素体特异的β-羟化酶的表达。使用蚕豆(Vicia faba)来源的LB3为终止子元件。通过分离RNA、反转录和PCR制备色素体特异的β-羟化酶的序列。
为了制备蚕豆LB3终止子序列,按照标准方法从蚕豆组织中分离基因组DNA,并利用引物PR206和PR207对其进行基因组PCR。在50μl反应混合物中进行PCR扩增该LB3DNA片段,所述混合物含有:
-1μl cDNA(如上述制备)
-0.25mM dNTP
-0.2μM PR206(SEQ ID NO:116)
-0.2μM PR207(SEQ ID NO:117)
-5μl 10X PCR缓冲液(TAKARA)
-0.25μl R Taq聚合酶(TAKARA)
-28.8μl蒸馏水
利用PR206和PR207进行PCR扩增得到含有LB终止子的0.3kb片段。将扩增子克隆到克隆载体pCR-BluntII(Invitrogen)中。使用引物T7和M13测序确证了与序列SEQ ID NO:118一致的序列。该克隆被命名为pTA-LB3,并因此用于克隆到载体pJIT117中(见下文)。
从番茄制备总RNA,以制备β-羟化酶序列。为此,将100mg冰冻粉碎的花转移到反应试管中,并加入0.8ml Trizol缓冲液(Life Technologies)。用0.2ml氯仿抽提悬浮液。以12000g离心15分钟后,将水相上清液取出并转移到新反应试管中并用1体积乙醇抽提。用1体积异丙醇沉淀RNA,以75%乙醇洗涤之,并将沉淀溶于DEPC水(水与1/1000体积焦碳酸二乙酯在室温下过夜孵育,然后高压灭菌)中。通过光度法测定RNA浓度。为合成cDNA,将2.5μg总RNA在60℃变性10分钟,冰上冷却2分钟并根据生产商详细说明使用cDNA试剂盒(Ready-to-go-you-prime-beads,Pharmacia Biotech)、利用反义特异引物(PR215 SEQ ID NO:119)转录成cDNA。
随后的PCR条件如下:
在50μl反应混合物中进行PCR扩增编码β-羟化酶的VPR203-PR215DNA片段,所述混合物含有:
-1μl cDNA(如上述制备)
-0.25mM dNTP
-0.2μM VPR203(SEQ ID NO:120)
-0.2μM PR215(SEQ ID NO:119)
-5μl 10X PCR缓冲液(TAKARA)
-0.25μl R Taq聚合酶(TAKARA)
-28.8μl蒸馏水
利用VPR203和PR215进行PCR扩增得到编码β-羟化酶的0.9kb片段。将扩增子克隆到克隆载体pCR-BluntII(Invitrogen)中。使用引物T7和M13的测序确证了与序列SEQ ID NO:121一致的序列。该克隆被命名为pTA-CrtR-b2,并因此用于克隆到载体pCSP02中(见下文)。
使用质粒MSP107(见实施例7)以及引物VPR001和VPR002,通过PCR扩增制备来自矮牵牛的EPSPS启动子序列。在50μl反应混合物中进行PCR扩增该EPSPS DNA片段,所述混合物含有:
-1μl cDNA(如上述制备)
-0.25mM dNTP
-0.2μM VPR001(SEQ ID NO:122)
-0.2μM VPR002(SEQ ID NO:123)
-5μl 10X PCR缓冲液(TAKARA)
-0.25μl R Taq聚合酶(TAKARA)
-28.8μl蒸馏水
利用 VPR001和PR002进行PCR扩增得到编码EPSPS启动子的1.8kb片段。将扩增子克隆到克隆载体pCR-BluntII(Invitrogen)中。使用引物T7和M13的测序确证了与序列SEQ ID NO:124一致的序列。该克隆被命名为pTA-EPSPS,并因此用于克隆到载体pCSP03中(见下文)。
从衍生自克隆载体pCR-BluntII(Invitrogen)的pTA-LB3中分离0.3kbPR206-PR207EcoRI-XhoI片段,并与EcoRI-XhoI切割的载体pJIT117连接,进行克隆第一步。该含有0.3kb终止子LB3的克隆被命名为pCSP02。
从衍生自克隆载体pCR-BluntII(Invitrogen)的pTA-CrtR-b2分离0.9kb VPR003-PR215EcoRI-HindIII片段,并与EcoRI-HindIII切割的载体pCSP02连接进行克隆第二步。该含有0.9kbβ-羟化酶片段CrtR-b2的克隆被命名为pCSP03。通过连接,在终止子LB3和β-羟化酶片段CrtR-b2间形成了转录融合。
从衍生自克隆载体pCR-BluntII(Invitrogen)的pTA-EPSPS上分离1.8kb VPR001-VPR002 NcoI-SacI片段,并与NcoI-SacI切割的载体pCSP03连接完成克隆第三步。该含有1.8kb EPSPS启动子片段的克隆被命名为pCSP04。通过连接,在EPSPS启动子和β-羟化酶片段CrtR-b2之间形成了转录融合。pCSP04含有片段EPSPS(1792bp)--EPSPS启动子、片段crtRb2(929bp)--β-羟化酶CrtRb2、LB3片段(301bp)--LB3终止子。
为将该β-羟化酶过量表达盒克隆到用于农杆菌介导下转化万寿菊的表达载体中,以3103bp Ecl136II-XhoI片段分离β-羟化酶盒。通过标准方法(Klenow填补)补平3’末端(30℃,30分钟)。
该表达载体被命名为pCSEbhyd。
实施例12:
制备用于在启动子P76控制下花特异性表达食用番茄色素体特异的番茄红素β环化酶以及在EPSPS启动子控制下花特异性表达点形念珠藻ATCC 29133酮酶NP196的表达载体
通过PCR,以拟南芥基因组DNA为模板分离启动子P76(SEQ ID NO:125)。
为此使用寡核苷酸引物P76for(SEQ ID NO:126)和P76rev(SEQ IDNO:127)。在合成过程中,提供具有5’-磷酸残基的寡核苷酸。
P76for 5’-CCCGGGTGCCAAAGTAACTCTTTAT-3’
P76rev 5’-GTCGACAGGTGCATGACCAAGTAAC-3’
如已描述的(Galbiati M等,Funct.Integr.Genomics 2000,201:25-34)从拟南芥分离基因组DNA。
如下进行PCR扩增:
80ng基因组DNA
1x Expand Long Template PCR缓冲液
2.5mM MgCl2
dATP、dCTP、dGTP、dTTp各350μM
300nM各引物
2.5单位Expand Long Template聚合酶
终体积为25μl
使用下面的温度程序:
94℃120秒1个循环
94℃ 10秒,48℃ 30秒,68℃ 3分钟35个循环
68℃ 10分钟1个循环。
通过琼脂糖凝胶电泳分离PCR产物,并通过凝胶洗脱分离1032bp片段。
用限制性内切酶EcoRV消化载体pSUN5,也同样用琼脂糖凝胶电泳纯化和凝胶洗脱回收。
将纯化的PCR产物克隆到如此处理的载体中。
将该构建体命名为p76。对代表拟南芥启动子P76的长为1032bp的片断(SEQ ID NO:131)进行测序。
使用限制性内切酶Kpn1和SmaI消化,从pJIT117得到35ST终止子。用琼脂糖凝胶电泳纯化该法所得的969bp片段,并以凝胶洗脱分离。
同样用限制性内切酶Kpn1和SmaI消化载体p76。用琼脂糖凝胶电泳纯化所得的7276bp片段,并以凝胶洗脱分离。
将所得35ST片段克隆到如此处理的p76中。
所得载体被命名为p7635ST。
以食用番茄的基因组DNA为模板,通过PCR方法分离Bgene(SEQ IDNO:128)。
为此使用寡核苷酸引物BgeneFor(SEQ ID NO:129)和BgeneRev(SEQ ID NO:130)。在合成过程中,提供了具有5’-磷酸残基的寡核苷酸。
SEQ ID NO 129:Bgenefor:5’-CTATTGCTAGATTGCCAATCAG-3’
SEQ ID NO 130:Bgeneves:5’-ATGGAAGCTCTTCTCAAG-3’
如已描述的(Galbiati M等,Funct.Integr.Genomics 2000,201:25-34)从食用番茄分离基因组DNA。
如下进行PCR扩增:
80ng基因组DNA
1x Expand Long Template PCR缓冲液
2.5mM MgCl2
dATP、dCTP、dGTP、dTTp各350μM
300nM各引物
2.5单位Expand Long Template聚合酶
终体积为25μl
使用下面的温度程序:
94℃120秒1个循环
94℃ 10秒,48℃ 30秒,68℃ 3分钟35个循环
68℃ 10分钟1个循环。
利用琼脂糖凝胶电泳纯化PCR产物,并通过凝胶洗脱分离1665bp片段。
用限制性内切酶SmaI消化载体p7635ST,并同样通过琼脂糖凝胶电泳纯化和凝胶洗脱回收。
将纯化的PCR产物克隆到如此处理的载体中。
该构建体被命名为pB。对代表番茄Bgene的长为1486bp的片断进行测序,其核苷酸序列与数据库条目AF254793(SEQ ID NO:1)一致。
使用限制性内切酶PmeI和SspI消化pB,并通过琼脂糖凝胶电泳纯化和凝胶洗脱回收含有启动子P76、Bgene和35ST的3906bp片段。
用限制性内切酶Ecl126II消化MSP108(实施例7),通过琼脂糖凝胶电泳纯化和凝胶洗脱回收。
将纯化的来自pB的含有启动子P76、Bgene和35ST的3906bp片段克隆到如此处理的载体MSP108中。
该构建体被命名为pMKP1。
实施例13:
转基因食用番茄植物的制备和分析
根据Ling等发表的方法(Plant Cell Reports(1998),17:843-847)转化并再生番茄植物。对于品种Microtom,使用更高浓度的卡那霉素(100mg/l)进行选择。
使用Microtom系的7到10天龄幼苗的子叶和下胚轴作为转化用的起始外植体。萌发使用Murashige和Skoog所述含2%蔗糖、pH 6.1的培养基(1962:Murashige and Skoog,1962,Physiol.Plant 15,473-)。在21℃、低光照(20-100μE)的条件下进行萌发。7到10天后,横向分割子叶并将下胚轴切成约5-10mm长的节段,并置于一天前预先涂布悬浮培养番茄细胞的MSBN培养基(MS,pH 6.1,3%蔗糖+1mg/1BAP、0.1mg/l NAA)上。所述番茄细胞用无菌滤纸无气泡覆盖。在上述培养基上将外植体预培养3到5天。分别用质粒独立转化根癌农杆菌LBA4404株细胞。每一次,将用二元载体转化的各农杆菌菌株在28℃含卡那霉素(20mg/l)的YEB培养基中过夜培养,并离心细胞。将细菌沉淀重悬浮于液体MS培养基(3%蔗糖、pH 6.1),并调节到光密度为0.3(600nm处)。将预培养的外植体转移到悬浮液中,并在室温温和振荡的条件下孵育30分钟。随后,用无菌滤纸干燥外植体,并重置于其预培养基进行3天共培养(21℃)。
共培养后,将外植体转移到MSZ2培养基(MS pH 6.1+3%蔗糖、2mg/l玉米素、100mg/l卡那霉素、160mg/l替曼汀(timentin))并储存,以在21℃、弱光条件(20-100μE、光节律16h/8h)下选择性再生。在芽形成以前每两到3周转移一次外植体。可以从外植体上分离小芽,并使其在MS(pH 6.1+3%蔗糖)、160mg/l替曼汀、30mg/l卡那霉素、0.1mg/l IAA上生根。将生根的植物转移到温室。
根据上述转化方法,用以下表达构建体获得了如下株系:
用MSP105获得:MSP105-1、MSP105-2、MSP105-3
用MSP107获得:MSP107-1、MSP107-2、MSP107-3
用MSP109获得:MSP109-1、MSP109-2、MSP109-3
用MSP111获得:MSP111-1、MSP111-2、MSP111-3
实施例14:
转基因万寿菊植物的制备
将万寿菊种子灭菌并置于萌发培养基(MS培养基;Murashige和Skoog,Physio.Plant.15(1962),473-497)pH 5.8,2%蔗糖)上。萌发的温度/光照/时间间隔为18-28℃/20-200μE/3-16周,但是优选在21℃、20-70μE、持续4-8周。
到时收获体外发育的植物的所有叶子,并从中部横切。制备过程中将由此得到的10-60mm2大小的叶外植体储存于室温下的液体MS培养基中最多两小时。
过夜培养任何一种所需的根癌农杆菌菌株,并用于与叶子材料共培养,其中优选超毒力菌株,如具有适当二元质粒的EHA 105,所述二元质粒可以携带选择性标记基因(优选bar或pat)和一种或多种性状或报告基因。可以如下培养细菌菌株:将适当菌株的单菌落接种于具有25mg/l卡那霉素的YEB(0.1%酵母提取物、0.5%牛肉膏、0.5%蛋白胨、0.5%蔗糖、0.5%硫酸镁x7H2O),并在28℃培养16到20小时。然后以6000g离心10分钟收获细菌悬浮液,并以产生约0.1到0.8的OD600的方式重悬浮于液体MS培养基。这一悬浮液用于与叶子材料共培养。
紧邻共培养之前,用细菌悬浮液替换储存叶子的MS培养基。室温及温和振荡下在农杆菌悬浮液中孵育叶子30分钟。然后将感染的外植体置于用琼脂(如0.8%的植物琼脂(Duchefa,NL))固化的具有生长调节剂(如3mg/l的苄氨基嘌呤(BAP)和1mg/l吲哚乙酸(IAA))的MS培养基上。叶子在培养基上的方向并不重要。外植体的培养进行1到8天,但优选6天,此过程中可使用以下条件:光强度:30-80μmol/m2x秒,温度:22-24℃,16/8小时明/暗交替。然后,将共培养的外植体转移到新鲜MS培养基,优选具有相同生长调节剂,此第二培养基额外含有抑制细菌生长的抗生素。浓度为200到500mg/l的替曼汀特别适合这一目的。使用可用于选择成功转化的第二选择性组分。1到5mg/l浓度的膦丝菌素选择特别有效,但是也可以根据所用方法考虑其它选择性组分。
每次在1到3周后,将外植体转移到新鲜培养基直至形成胚芽和小芽,此后将其转移以植根于相同基础培养基,所述培养基含有替曼汀和PPT或替代组分,以及生长调节剂(即如0.5mg/l的吲哚丁酸(IBA)和0.5mg/l的赤霉酸GA3)。已生根的芽可以被转移到温室。
除所述方法外,可以进行以下有利的修改:
●在用细菌感染外植体以前,可以将其于上述共培养用的培养基上预孵育1到12天(优选3-4天)。然后如上述进行感染、共培养和选择性再生。
●再生的pH值(通常为5.8)可降为5.2。这样能改善对农杆菌生长的控制。
●向再生培养基加入AgNO3(3-10mg/l)能改善包括再生自身在内的培养条件。
●技术人员所知的减少苯酚形成的组分(如柠檬酸、抗坏血酸、PVP和许多其它组分)对于培养有利。
●整个过程可以使用液体培养基。也可以将培养物孵育在置于液体培养基上的可购支持物上。
根据上述转化方法,用以下表达构建体获得了下述株系:
用MSP106获得:MSP106-1、MSP106-2、MSP106-3
用MSP108获得:MSP108-1、MSP108-2、MSP108-3
用MSP110获得:MSP110-1、MSP110-2、MSP110-3
用MSP112获得:MSP112-1、MSP112-2、MSP112-3
用pCSEbhyd获得:csebhyd-1、csebhyd1-2、csebhyd1-3
用pMKP1获得:mkp-1、mkp1-2、mkp1-3
实施例15:植物材料来源的类胡萝卜素酯的脂酶催化水解以及类胡萝卜素的鉴定
一般方法
a)用100%的丙酮抽提(3次500μl;每次振荡约15分钟)在研钵中碾磨的植物材料(湿重30-100mg)。将溶剂蒸发。然后将类胡萝卜素溶解于495μl丙酮,加入4.95ml磷酸钾缓冲液(100mM,pH 7.4)后充分混合溶液。然后加入约17mg胆汁盐(Sigma)以及149μl NaCl/CaCl2溶液(3MNaCl和75mM CaCl2)。将悬浮液在37℃孵育30分钟。为了酶促水解类胡萝卜素酯,加入595μl脂酶溶液(50mg/ml皱褶假丝酵母(Candidarugosa)来源的7型脂酶(Sigma))并在37℃振荡下孵育。约21小时后,再次加入595μl脂酶在37℃再孵育至少5小时。然后在溶液中溶解约700mgNa2SO4。加入1800μl石油醚后,通过剧烈振荡将类胡萝卜素抽提至有机相。重复这一振荡抽提直至有机相变为无色。合并石油醚级分并蒸发掉石油醚。用100-120μl丙酮吸收游离的类胡萝卜素。通过HPLC和C30反相柱方法,根据滞留时间和UV-VIS光谱鉴定游离的类胡萝卜素。
所用的胆汁盐或胆酸盐为胆酸盐与脱氧胆酸盐1∶1的混合物。
b)当植物材料中仅存在少量类胡萝卜素酯时采用的方法
另外,也可以利用薄层层析法分离的皱褶假丝酵母来源的脂酶水解类胡萝卜素酯。为此,用约750μl丙酮抽提50-100mg植物材料3次。将溶剂抽提物在旋转蒸发器的真空中浓缩(可耐受升高温度至40-50℃)。随后加入300ul石油醚∶丙酮(比例5∶1)并充分混合。然后将悬浮物离心(1-2分钟)沉淀。将上层相转移到新的反应试管中。残留物再次用200ul石油醚∶丙酮(比例5∶1)抽提并离心去除悬浮物。将两次抽提物混合(体积500ul)并蒸发掉溶剂。残余物在30ul石油醚∶丙酮(比例5∶1)中重悬浮并铺在薄层板上(silica gel 60,Merck)。如果为制备/分析目的需要使用一次以上,每次应当按照薄层层析法分离所述的方法准备湿重为50-100mg的若干等分试样。
薄层板在石油醚∶丙酮(比例5∶1)中展开。可根据其颜色肉眼鉴别类胡萝卜素条带。刮下单个类胡萝卜素条带,并可为制备/分析目的而富集。用丙酮将类胡萝卜素从硅材料上洗脱;将溶剂在真空中蒸发。为水解类胡萝卜素酯,将残留物溶解于495μl丙酮中,并加入17mg胆汁盐(Sigma)、4.95ml 0.1M磷酸钾缓冲液(pH 7.4)以及149μl 3M NaCl+75mM CaCl2。充分混合后,将溶液在37℃平衡30分钟。随后加入595μl皱褶假丝酵母脂酶(Sigma,5mM CaCl2贮藏液中50mg/ml),并在37℃时振荡孵育过夜。约21小时后,再次加入等量的脂酶;将此混合物在37℃时再次振荡孵育至少5小时。然后加入约700mg Na2SO4(无水),加入1800μl石油醚振荡抽提该混合物约1分钟并在3500转/分钟下离心5分钟。将上层相转移到新的反应试管中,重复振荡抽提直至上层相变为无色。合并石油醚相在真空中浓缩(温度可以为40-50℃)。残余物溶解于120μl丙酮中,如需要可使用超声。利用C30柱通过HPLC方法分离溶解的类胡萝卜素,并借助参照物质定量。
实施例16:游离类胡萝卜素的HPLC分析
在以下条件下分析根据实施例15的工作步骤获取的样品:
设定了以下HPLC条件。
分离柱:Prontosil C30柱,250×4.6mm,(Bischoff,Leonberg,Germany)
流速:1.0ml/min
洗脱液:洗脱液A-100%甲醇
洗脱液B-80%甲醇、0.2%乙酸铵
洗脱液C-100%叔丁基甲基醚
检测:300-530nm
梯度曲线:
  时间   流速  %洗脱液A  %洗脱液B  %洗脱液C
  1.00   1.0   95.0   5.0   0
  12.00   1.0   95.0   5.0   0
  12.10   1.0   80.0   5.0   15.0
  22.00   1.0   76.0   5.0   19.0
  22.10   1.0   66.5   5.0   28.5
  38.00   1.0   15.0   5.0   80.0
  45.00   1.0   95.0   5.0   0
  46.0   1.0   95.0   5.0   0
某些根据本发明形成的类胡萝卜素特征性的迟滞时间为,例如,紫黄质11.7分钟,虾青素17.7分钟,金盏花黄质19分钟,金盏花玉红质19.9分钟,玉米黄质21分钟。
                   序列表
                   序列表
<110>太阳基因有限公司
<120>在遗传修饰的非人类生物中制备酮式类胡萝卜素的方法
<130>PF 55340
<160>131
<170>PatentIn版本3.1
<210>1
<211>1666
<212>DNA
<213>食用番茄
<220>
<221>CDS
<222>(1)..(1494)
<223>
<400>1
atg gaa gct ctt ctc aag cct ttt cca tct ctt tta ctt tcc tct cct     48
Met Glu Ala Leu Leu Lys Pro Phe Pro Ser Leu Leu Leu Ser Ser Pro
1           5                       10              15
aca ccc cat agg tct att ttc caa caa aat ccc tct ttt cta agt ccc               96
Thr Pro His Arg Ser Ile Phe Gln Gln Asn Pro Ser Phe Leu Ser Pro
            20              25                      30
acc acc aaa aaa aaa tca aga aaa tgt ctt ctt aga aac aaa agt agt              144
Thr Thr Lys Lys Lys Ser Arg Lys Cys Leu Leu Arg Asn Lys Ser Ser
        35                  40                  45
aaa ctt ttt tgt agc ttt ctt gat tta gca ccc aca tca aag cca gag              192
Lys Leu Phe Cys Ser Phe Leu Asp Leu Ala Pro Thr Ser Lys Pro Glu
    50                  55                  60
tct tta gat gtt aac atc tca tgg gtt gat cct aat tcg aat cgg gct              240
Ser Leu Asp Val Asn Ile Ser Trp Val Asp Pro Asn Ser Asn Arg Ala
65                  70                  75                  80
caa ttc gac gtg atc att atc gga gct ggc cct gct ggg ctc agg cta              288
Gln Phe Asp Val Ile Ile Ile Gly Ala Gly Pro Ala Gly Leu Arg Leu
                85          90                          95
gct gaa caa gtt tct aaa tat ggt att aag gta tgt tgt gtt gac cct              336
Ala Glu Gln Val Ser Lys Tyr Gly Ile Lys Val Cys Cys Val Asp Pro
            100                 105                 110
tca cca ctc tcc atg tgg cca aat aat tat ggt gtt tgg gtt gat gag              384
Ser Pro Leu Ser Met Trp Pro Asn Asn Tyr Gly Val Trp Val Asp Glu
        115                 120                 125
ttt gag aat tta gga ctg gaa aat tgt tta gat cat aaa tgg cct atg              432
Phe Glu Asn Leu Gly Leu Glu Asn Cys Leu Asp His Lys Trp Pro Met
    130                 135                 140
act tgt gtg cat ata aat gat aac aaa act aag tat ttg gga aga cca              480
Thr Cys Val His Ile Asn Asp Asn Lys Thr Lys Tyr Leu Gly Arg Pro
145                 150                 155                 160
tat ggt aga gtt agt aga aag aag ctg aag ttg aaa ttg ttg aat agt              528
Tyr Gly Arg Val Ser Arg Lys Lys Leu Lys Leu Lys Leu Leu Asn Ser
                165             170                     175
tgt gtt gag aac aga gtg aag ttt tat aaa gct aag gtt tgg aaa gtg              576
Cys Val Glu Asn Arg Val Lys Phe Tyr Lys Ala Lys Val Trp Lys Val
            180                 185                 190
gaa cat gaa gaa ttt gag tct tca att gtt tgt gat gat ggt aag aag              624
Glu His Glu Glu Phe Glu Ser Ser Ile Val Cys Asp Asp Gly Lys Lys
        195             200                 205
ata aga ggt agt ttg gtt gtg gat gca agt ggt ttt gct agt gat ttt             672
Ile Arg Gly Ser Leu Val Val Asp Ala Ser Gly Phe Ala Ser Asp Phe
    210             215                     220
ata gag tat gac agg cca aga aac cat ggt tat caa att gct cat ggg             720
Ile Glu Tyr Asp Arg Pro Arg Asn His Gly Tyr Gln Ile Ala His Gly
225                 230                 235                 240
gtt tta gta gaa gtt gat aat cat cca ttt gat ttg gat aaa atg gtg             768
Val Leu Val Glu Val Asp Asn His Pro Phe Asp Leu Asp Lys Met Val
                245                 250                 255
ctt atg gat tgg agg gat tct cat ttg ggt aat gag cca tat tta agg             816
Leu Met Asp Trp Arg Asp Ser His Leu Gly Asn Glu Pro Tyr Leu Arg
            260                 265                 270
gtg aat aat gct aaa gaa cca aca ttc ttg tat gca atg cca ttt gat             864
Val Asn Asn Ala Lys Glu Pro Thr Phe Leu Tyr Ala Met Pro Phe Asp
        275                 280                 285
aga gat ttg gtt ttc ttg gaa gag act tct ttg gtg agt cgt cct gtt             912
Arg Asp Leu Val Phe Leu Glu Glu Thr Ser Leu Val Ser Arg Pro Val
    290                 295                 300
tta tcg tat atg gaa gta aaa aga agg atg gtg gca aga tta agg cat             960
Leu Ser Tyr Met Glu Val Lys Arg Arg Met Val Ala Arg Leu Arg His
305                 310                 315                 320
ttg ggg atc aaa gtg aaa agt gtt att gag gaa gag aaa tgt gtg atc            1008
Leu Gly Ile Lys Val Lys Ser Val Ile Glu Glu Glu Lys Cys Val Ile
                325                 330                 335
cct atg gga gga cca ctt ccg cgg att cct caa aat gtt atg gct att            1056
Pro Met Gly Gly Pro Leu Pro Arg Ile Pro Gln Asn Val Met Ala Ile
        340                     345                 350
ggt ggg aat tca ggg ata gtt cat cca tca aca ggg tac atg gtg gct            1104
Gly Gly Asn Ser Gly Ile Val His Pro Ser Thr Gly Tyr Met Val Ala
        355                 360                 365
agg agc atg gct tta gca cca gta cta gct gaa gcc atc gtc gag ggg            1152
Arg Ser Met Ala Leu Ala Pro Val Leu Ala Glu Ala Ile Val Glu Gly
    370                 375                 380
ctt ggc tca aca aga atg ata aga ggg tct caa ctt tac cat aga gtt            1200
Leu Gly Ser Thr Arg Met Ile Arg Gly Ser Gln Leu Tyr His Arg Val
385                 390                 395                 400
tgg aat ggt ttg tgg cct ttg gat aga aga tgt gtt aga gaa tgt tat        1248
Trp Asn Gly Leu Trp Pro Leu Asp Arg Arg Cys Val Arg Glu Cys Tyr
                405             410                     415
tca ttt ggg atg gag aca ttg ttg aag ctt gat ttg aaa ggg act agg        1296
Ser Phe Gly Met Glu Thr Leu Leu Lys Leu Asp Leu Lys Gly Thr Arg
            420                 425                 430
aga ttg ttt gac gct ttc ttt gat ctt gat cct aaa tac tgg caa ggg        1344
Arg Leu Phe Asp Ala Phe Phe Asp Leu Asp Pro Lys Tyr Trp Gln Gly
        435                 440                 445
ttc ctt tct tca aga ttg tct gtc aaa gaa ctt ggt tta ctc agc ttg        1392
Phe Leu Ser Ser Arg Leu Ser Val Lys Glu Leu Gly Leu Leu Ser Leu
    450                 455                 460
tgt ctt ttc gga cat ggc tca aac atg act agg ttg gat att gtt aca        1440
Cys Leu Phe Gly His Gly Ser Asn Met Thr Arg Leu Asp Ile Val Thr
465         470                         475                 480
aaa tgt cct ctt cct ttg gtt aga ctg att ggc aat cta gca ata gag        1488
Lys Cys Pro Leu Pro Leu Val Arg Leu Ile Gly Asn Leu Ala Ile Glu
                485                 490                 495
agc ctt tgaatgtgaa aagtttgaat cattttcttc attttaattt ctttgattat         1544
Ser Leu
tttcatattt tctcaattgc aaaagtgaga taagagctac atactgtcaa caaataaact      1604
actattggaa agttaaaata tgtgtttgtt gtatgttatt ctaatggaat ggattttgta      1664
aa                                                                     1666
<210>2
<211>498
<212>PRT
<213>食用番茄
<400>2
Met Glu Ala Leu Leu Lys pro Phe Pro Ser Leu Leu Leu Ser Ser Pro
1               5                   10                  15
Thr Pro His Arg Ser Ile Phe Gln Gln Asn Pro Ser Phe Leu Ser Pro
            20                  25                  30
Thr Thr Lys Lys Lys Ser Arg Lys Cys Leu Leu Arg Asn Lys Ser Ser
        35                  40                  45
Lys Leu Phe Cys Ser Phe Leu Asp Leu Ala Pro Thr Ser Lys Pro Glu
    50                  55                  60
Ser Leu Asp Val Asn Ile Ser Trp Val Asp Pro Asn Ser Asn Arg Ala
65                  70                  75                  80
Gln Phe Asp Val Ile Ile Ile Gly Ala Gly Pro Ala Gly Leu Arg Leu
                85                  90                  95
Ala Glu Gln Val Ser Lys Tyr Gly Ile Lys Val Cys Cys Val Asp Pro
            100                 105                 110
Ser Pro Leu Ser Met Trp Pro Asn Asn Tyr Gly Val Trp Val Asp Glu
        115                 120                 125
Phe Glu Asn Leu Gly Leu Glu Asn Cys Leu Asp His Lys Trp Pro Met
    130                 135                 140
Thr Cys Val His Ile Asn Asp Asn Lys Thr Lys Tyr Leu Gly Arg Pro
145                 150                 155                 160
Tyr Gly Arg Val Ser Arg Lys Lys Leu Lys Leu Lys Leu Leu Asn Ser
                165                 170                 175
Cys Val Glu Asn Arg Val Lys Phe Tyr Lys Ala Lys Val Trp Lys Val
            180                 185                 190
Glu His Glu Glu Phe Glu Ser Ser Ile Val Cys Asp Asp Gly Lys Lys
        195             200                     205
Ile Arg Gly Ser Leu Val Val Asp Ala Ser Gly Phe Ala Ser Asp Phe
    210             215                     220
Ile Glu Tyr Asp Arg Pro Arg Asn His Gly Tyr Gln Ile Ala His Gly
225                 230                 235                 240
Val Leu Val Glu Val Asp Asn His Pro Phe Asp Leu Asp Lys Met Val
        245                     250                     255
Leu Met Asp Trp Arg Asp Ser His Leu Gly Asn Glu Pro Tyr Leu Arg
            260                 265                 270
Val Asn Asn Ala Lys Glu Pro Thr Phe Leu Tyr Ala Met Pro Phe Asp
        275                 280                 285
Arg Asp Leu Val Phe Leu Glu Glu Thr Ser Leu Val Ser Arg Pro Val
    290                 295                 300
Leu Ser Tyr Met Glu Val Lys Arg Arg Met Val Ala Arg Leu Arg His
305                 310                 315                 320
Leu Gly Ile Lys Val Lys Ser Val Ile Glu Glu Glu Lys Cys Val Ile
                325                 330                 335
Pro Met Gly Gly Pro Leu Pro Arg Ile Pro Gln Asn Val Met Ala Ile
        340                     345                 350
Gly Gly Asn Ser Gly Ile Val His Pro Ser Thr Gly Tyr Met Val Ala
        355                 360                 365
Arg Ser Met Ala Leu Ala Pro Val Leu Ala Glu Ala Ile Val Glu Gly
    370                 375                 380
Leu Gly Ser Thr Arg Met Ile Arg Gly Ser Gln Leu Tyr His Arg Val
385                 390                 395                 400
Trp Asn Gly Leu Trp Pro Leu Asp Arg Arg Cys Val Arg Glu Cys Tyr
                405         410                         415
Ser Phe Gly Met Glu Thr Leu Leu Lys Leu Asp Leu Lys Gly Thr Arg
            420                 425                 430
Arg Leu Phe Asp Ala Phe Phe Asp Leu Asp Pro Lys Tyr Trp Gln Gly
        435                 440                 445
Phe Leu Ser Ser Arg Leu Ser Val Lys Glu Leu Gly Leu Leu Ser Leu
    450                 455                 460
Cys Leu Phe Gly His Gly Ser Asn Met Thr Arg Leu Asp Ile Val Thr
465                 470                 475                 480
Lys Cys Pro Leu Pro Leu Val Arg Leu Ile Gly Asn Leu Ala Ile Glu
                485                 490                 495
Ser Leu
<210>3
<211>1771
<212>DNA
<213>雨生红球藻
<220>
<221>CDS
<222>(166)..(1155)
<223>
<400>3
ggcacgagct tgcacgcaag tcagcgcgcg caagtcaaca cctgccggtc cacagcctca       60
aataataaag agctcaagcg tttgtgcgcc tcgacgtggc cagtctgcac tgccttgaac       120
ccgcgagtct cccgccgcac tgactgccat agcacagcta gacga atg cag cta gca       177
                                                  Met Gln Leu Ala
                                                  1
gcg aca gta atg ttg gag cag ctt acc gga agc gct gag gca ctc aag         225
Ala Thr Val Met Leu Glu Gln Leu Thr Gly Ser Ala Glu Ala Leu Lys
5                   10                  15                  20
gag aag gag aag gag gtt gca ggc agc tct gac gtg ttg cgt aca tgg         273
Glu Lys Glu Lys Glu Val Ala Gly Ser Ser Asp Val Leu Arg Thr Trp
        25                      30                      35
gcg acc cag tac tcg ctt ccg tca gaa gag tca gac gcg gcc cgc ccg         321
Ala Thr Gln Tyr Ser Leu Pro Ser Glu Glu Ser Asp Ala Ala Arg Pro
            40                  45                  50
gga ctg aag aat gcc tac aag cca cca cct tcc gac aca aag ggc atc         369
Gly Leu Lys Asn Ala Tyr Lys Pro Pro Pro Ser Asp Thr Lys Gly Ile
        55                  60                  65
aca atg gcg cta cgt gtc atc ggc tcc tgg gcc gca gtg ttc ctc cac         417
Thr Met Ala Leu Arg Val Ile Gly Ser Trp Ala Ala Val Phe Leu His
    70                  75                  80
gcc att ttt caa atc aag ctt ccg acc tcc ttg gac cag ctg cac tgg         465
Ala Ile Phe Gln Ile Lys Leu Pro Thr Ser Leu Asp Gln Leu His Trp
85                  90                  95                  100
ctg ccc gtg tca gat gcc aca gct cag ctg gtt agc ggc acg agc agc         513
Leu Pro Val Ser Asp Ala Thr Ala Gln Leu Val Ser Gly Thr Ser Ser
                105                 110                 115
ctg ctc gac atc gtc gta gta ttc ttt gtc ctg gag ttc ctg tac aca         561
Leu Leu Asp Ile Val Val Val Phe Phe Val Leu Glu Phe Leu Tyr Thr
            120             125                     130
ggc ctt ttt atc acc acg cat gat gct atg cat ggc acc atc gcc atg         609
Gly Leu Phe Ile Thr Thr His Asp Ala Met His Gly Thr Ile Ala Met
        135                 140                 145
aga aac agg cag ctt aat gac ttc ttg ggc aga gta tgc atc tcc ttg         657
Arg Asn Arg Gln Leu Asn Asp Phe Leu Gly Arg Val Cys Ile Ser Leu
    150                 155                 160
tac gcc tgg ttt gat tac aac atg ctg cac cgc aag cat tgg gag cac         705
Tyr Ala Trp phe Asp Tyr Asn Met Leu His Arg Lys His Trp Glu His
165                 170                 175                 180
cac aac cac act ggc gag gtg ggc aag gac cct gac ttc cac agg gga        753
His Asn His Thr Gly Glu Val Gly Lys Asp Pro Asp Phe His Arg Gly
                185                 190                 195
aac cct ggc att gtg ccc tgg ttt gcc agc ttc atg tcc agc tac atg        801
Asn Pro Gly Ile Val Pro Trp Phe Ala Ser Phe Met Ser Ser Tyr Met
            200                 205                 210
tcg atg tgg cag ttt gcg cgc ctc gca tgg tgg acg gtg gtc atg cag        849
Ser Met Trp Gln Phe Ala Arg Leu Ala Trp Trp Thr Val Val Met Gln
        215                 220                 225
ctg ctg ggt gcg cca atg gcg aac ctg ctg gtg ttc atg gcg gcc gcg        897
Leu Leu Gly Ala Pro Met Ala Asn Leu Leu Val Phe Met Ala Ala Ala
    230                 235                 240
ccc atc ctg tcc gcc ttc cgc ttg ttc tac ttt ggc acg tac atg ccc        945
pro Ile Leu Ser Ala Phe Arg Leu Phe Tyr Phe Gly Thr Tyr Met Pro
245                 250                 255                 260
cac aag cct gag cct ggc gcc gcg tca ggc tct tca cca gcc gtc atg        993
His Lys Pro Glu Pro Gly Ala Ala Ser Gly Ser Ser Pro Ala Val Met
        265                         270                 275
aac tgg tgg aag tcg cgc act agc cag gcg tcc gac ctg gtc agc ttt        1041
Asn Trp Trp Lys Ser Arg Thr Ser Gln Ala Ser Asp Leu Val Ser Phe
            280                 285                 290
ctg acc tgc tac cac ttc gac ctg cac tgg gag cac cac cgc tgg ccc        1089
Leu Thr Cys Tyr His Phe Asp Leu His Trp Glu His His Arg Trp Pro
        295                 300                 305
ttc gcc ccc tgg tgg gag ctg ccc aac tgc cgc cgc ctg tct ggc cga        1137
Phe Ala Pro Trp Trp Glu Leu Pro Asn Cys Arg Arg Leu Ser Gly Arg
    310                 315                 320
ggt ctg gtt cct gcc tag ctggacacac tgcagtgggc cctgctgcca               1185
Gly Leu Val Pro Ala
325
gctgggcatg caggttgtgg caggactggg tgaggtgaaa agctgcaggc gctgctgccg      1245
gacacgctgc atgggctacc ctgtgtagct gccgccacta ggggaggggg tttgtagctg      1305
tcgagcttgc cccatggatg aagctgtgta gtggtgcagg gagtacaccc acaggccaac      1365
acccttgcag gagatgtctt gcgtcgggag gagtgttggg cagtgtagat gctatgattg      1425
tatcttaatg ctgaagcctt taggggagcg acacttagtg ctgggcaggc aacgccctgc      1485
aaggtgcagg cacaagctag gctggacgag gactcggtgg caggcaggtg aagaggtgcg      1545
ggagggtggt gccacaccca ctgggcaaga ccatgctgca atgctggcgg tgtggcagtg      1605
agagctgcgt gattaactgg gctatggatt gtttgagcag tctcacttat tctttgatat      1665
agatactggt caggcaggtc aggagagtga gtatgaacaa gttgagaggt ggtgcgctgc      1725
ccctgcgctt atgaagctgt aacaataaag tggttcaaaa aaaaaa                     1771
<210>4
<211>329
<212>PRT
<213>雨生红球藻
<400>4
Met Gln Leu Ala Ala Thr Val Met Leu Glu Gln Leu Thr Gly Ser Ala
1               5                   10                  15
Glu Ala Leu Lys Glu Lys Glu Lys Glu Val Ala Gly Ser Ser Asp Val
            20          25                          30
Leu Arg Thr Trp Ala Thr Gln Tyr Ser Leu Pro Ser Glu Glu Ser Asp
        35                  40                  45
Ala Ala Arg Pro Gly Leu Lys Asn Ala Tyr Lys Pro Pro Pro Ser Asp
    50                  55                  60
Thr Lys Gly Ile Thr Met Ala Leu Arg Val Ile Gly Ser Trp Ala Ala
65                  70                  75                  80
Val Phe Leu His Ala Ile Phe Gln Ile Lys Leu Pro Thr Ser Leu Asp
                85                  90                  95
Gln Leu His Trp Leu Pro Val Ser Asp Ala Thr Ala Gln Leu Val Ser
            100                 105                 110
Gly Thr Ser Ser Leu Leu Asp Ile Val Val Val Phe Phe Val Leu Glu
        115                 120                 125
Phe Leu Tyr Thr Gly Leu Phe Ile Thr Thr His Asp Ala Met His Gly
    130                 135                 140
Thr Ile Ala Met Arg Asn Arg Gln Leu Asn Asp Phe Leu Gly Arg Val
145                 150                 155                 160
Cys Ile Ser Leu Tyr Ala Trp Phe Asp Tyr Asn Met Leu His Arg Lys
                165                 170                 175
His Trp Glu His His Asn His Thr Gly Glu Val Gly Lys Asp Pro Asp
            180                 185                 190
Phe His Arg Gly Asn Pro Gly Ile Val Pro Trp Phe Ala Ser Phe Met
        195                 200                 205
Ser Ser Tyr Met Ser Met Trp Gln Phe Ala Arg Leu Ala Trp Trp Thr
    210                 215                 220
Val Val Met Gln Leu Leu Gly Ala pro Met Ala Asn Leu Leu Val Phe
225             230         235                             240
Met Ala Ala Ala Pro Ile Leu Ser Ala Phe Arg Leu Phe Tyr Phe Gly
                245                 250                 255
Thr Tyr Met Pro His Lys Pro Glu Pro Gly Ala Ala Ser Gly Ser Ser
            260                 265                 270
Pro Ala Val Met Asn Trp Trp Lys Ser Arg Thr Ser Gln Ala Ser Asp
        275                 280                 285
Leu Val Ser Phe Leu Thr Cys Tyr His Phe Asp Leu His Trp Glu His
    290                 295                 300
His Arg Trp Pro Phe Ala Pro Trp Trp Glu Leu Pro Asn Cys Arg Arg
305                 310                 315                 320
Leu Ser Gly Arg Gly Leu Val Pro Ala
                325
<210>5
<211>1163
<212>DNA
<213>食用番茄
<220>
<221>CDS
<222>(1)..(942)
<223>
<400>5
att cgg cac gag att tca gcc tcc gct agt tcc cga acc att cgc ctc         48
Ile Arg His Glu Ile Ser Ala Ser Ala Ser Ser Arg Thr Ile Arg Leu
1               5                   10                  15
cgt cat aac ccg ttt ctc agt cca aaa tcc gcc tca acc gcc ccg ccg         96
Arg His Asn Pro Phe Leu Ser Pro Lys Ser Ala Ser Thr Ala Pro Pro
            20                  25                  30
gtt ctg ttc ttc tct ccg tta act cgc aat ttt ggc gca att ttg ctg         144
Val Leu Phe Phe Ser pro Leu Thr Arg Asn Phe Gly Ala Ile Leu Leu
        35                  40                  45
tct aga aga aag ccg aga ttg gcg gtt tgt ttt gtg ctg gag aat gag         192
Ser Arg Arg Lys Pro Arg Leu Ala Val Cys Phe Val Leu Glu Asn Glu
    50                  55                  60
aaa ttg aat agt act atc gaa agt gag agt gaa gta ata gag gat cgg         240
Lys Leu Asn Ser Thr Ile Glu Ser Glu Ser Glu Val Ile Glu Asp Arg
65                  70                  75                  80
ata caa gta gag att aat gag gag aag agt tta gct gcc agt tgg ctg        288
Ile Gln Val Glu Ile Asn Glu Glu Lys Ser Leu Ala Ala Ser Trp Leu
                85                  90                  95
gcg gag aaa ttg gcg agg aag aaa tcg gag agg ttt act tat ctt gtg        336
Ala Glu Lys Leu Ala Arg Lys Lys Ser Glu Arg Phe Thr Tyr Leu Val
            100                 105                 110
gca gct gtg atg tct agt ttg ggg att act tct atg gcg att ttg gcg        384
Ala Ala Val Met Ser Ser Leu Gly Ile Thr Ser Met Ala Ile Leu Ala
        115                 120                 125
gtt tat tac aga ttt tca tgg caa atg gag ggt gga gaa gtg cct ttt        432
Val Tyr Tyr Arg Phe Ser Trp Gln Met Glu Gly Gly Glu Val Pro Phe
    130                 135                 140
tct gaa atg tta gct aca ttc act ctc tcg ttt ggc gct gcc gta gga        480
Ser Glu Met Leu Ala Thr Phe Thr Leu Ser Phe Gly Ala Ala Val Gly
145                 150                 155                 160
atg gag tac tgg gcg aga tgg gct cat aga gca cta tgg cat gct tct        528
Met Glu Tyr Trp Ala Arg Trp Ala His Arg Ala Leu Trp His Ala Ser
                165                 170                 175
tta tgg cac atg cac gag tcg cac cat aga cca aga gaa gga cct ttt        576
Leu Trp His Met His Glu Ser His His Arg Pro Arg Glu Gly Pro Phe
            180                 185                 190
gag atg aac gac gtt ttc gcc ata aca aat gct gtt cca gct ata ggt        624
Glu Met Asn Asp Val Phe Ala Ile Thr Asn Ala Val Pro Ala Ile Gly
       195                  200                 205
ctt ctt tcc tac ggt ttc ttc cat aaa ggg atc gtc cct ggc ctc tgt        672
Leu Leu Ser Tyr Gly Phe Phe His Lys Gly Ile Val Pro Gly Leu Cys
    210             215                     220
ttc ggc gct gga ttg ggg atc aca gta ttt ggg atg gct tac atg ttc        720
Phe Gly Ala Gly Leu Gly Ile Thr Val Phe Gly Met Ala Tyr Met Phe
225                 230                 235                 240
gtt cac gat gga ctg gtt cat aag aga ttt ccc gta ggg cct att gcc        768
Val His Asp Gly Leu Val His Lys Arg Phe pro Val Gly Pro Ile Ala
                245                 250                 255
aac gtg cct tac ttt cgg agg gta gct gca gca cat cag ctt cat cac        816
Asn Val Pro Tyr Phe Arg Arg Val Ala Ala Ala His Gln Leu His His
            260             265                     270
tcg gac aaa ttt gat ggt gtc cca tat ggc ttg ttt cta gga cct aag        864
Ser Asp Lys Phe Asp Gly Val Pro Tyr Gly Leu Phe Leu Gly Pro Lys
        275                 280                 285
gaa ttg gaa gaa gta gga gga ctt gaa gag tta gaa aag gaa gtc aac        912
Glu Leu Glu Glu Val Gly Gly Leu Glu Glu Leu Glu Lys Glu Val Asn
    290                 295                 300
cga agg att aaa att tct aag gga tta tta tgatcaaaag atacgtctga          962
Arg Arg Ile Lys Ile Ser Lys Gly Leu Leu
305                 310
taataataaa atgcgattgt atttaggctg tagattatta ttgggaaaaa gatagaaaga     1022
tatatatatg aatataatat aaaatgcaac aagctttcta tggagaagac cttttctttt     1082
ttggtacctg tacgtaaaag gtgaacaatt tgatgtccta gtacttgttg acaaaccaga     1142
agaacgataa ttcaaaacaa a                                               1163
<210>6
<211>314
<212>PRT
<213>食用番茄
<400>6
Ile Arg His Glu Ile Ser Ala Ser Ala Ser Ser Arg Thr Ile Arg Leu
1               5                       10              15
Arg His Asn pro Phe Leu Ser Pro Lys Ser Ala Ser Thr Ala Pro Pro
            20                  25                  30
Val Leu phe phe Ser Pro Leu Thr Arg Asn Phe Gly Ala Ile Leu Leu
        35                  40                  45
Ser Arg Arg Lys Pro Arg Leu Ala Val Cys Phe Val Leu Glu Asn Glu
    50                  55                  60
Lys Leu Asn Ser Thr Ile Glu Ser Glu Ser Glu Val Ile Glu Asp Arg
65                  70                  75                  80
Ile Gln Val Glu Ile Asn Glu Glu Lys Ser Leu Ala Ala Ser Trp Leu
                85                  90                  95
Ala Glu Lys Leu Ala Arg Lys Lys Ser Glu Arg Phe Thr Tyr Leu Val
            100                 105             110
Ala Ala Val Met Ser Ser Leu Gly Ile Thr Ser Met Ala Ile Leu Ala
        115                 120                 125
Val Tyr Tyr Arg Phe Ser Trp Gln Met Glu Gly Gly Glu Val Pro Phe
    130                 135                 140
Ser Glu Met Leu Ala Thr Phe Thr Leu Ser Phe Gly Ala Ala Val Gly
145                 150                 155                 160
Met Glu Tyr Trp Ala Arg Trp Ala His Arg Ala Leu Trp His Ala Ser
                165                 170                 175
Leu Trp His Met His Glu Ser His His Arg Pro Arg Glu Gly Pro Phe
            180                 185                 190
Glu Met Asn Asp Val Phe Ala Ile Thr Asn Ala Val Pro Ala Ile Gly
        195                 200                 205
Leu Leu Ser Tyr Gly Phe Phe His Lys Gly Ile Val pro Gly Leu Cys
    210             215                     220
Phe Gly Ala Gly Leu Gly Ile Thr Val Phe Gly Met Ala Tyr Met phe
225                 230                 235                 240
Val His Asp Gly Leu Val His Lys Arg Phe Pro Val Gly Pro Ile Ala
                245                 250                 255
Asn Val Pro Tyr Phe Arg Arg Val Ala Ala Ala His Gln Leu His His
            260                 265                 270
Ser Asp Lys Phe Asp Gly Val Pro Tyr Gly Leu Phe Leu Gly Pro Lys
        275                 280                 285
Glu Leu Glu Glu Val Gly Gly Leu Glu Glu Leu Glu Lys Glu Val Asn
    290                 295                 300
Arg Arg Ile Lys Ile Ser Lys Gly Leu Leu
305                 310
<210>7
<211>1779
<212>DNA
<213>拟南芥
<220>
<221>CDS
<222>(1)..(1779)
<223>
<400>7
atg gat ctc cgt cgg agg cct cct aaa cca ccg gtt acc aac aac aac        48
Met Asp Leu Arg Arg Arg Pro Pro Lys Pro Pro Val Thr Asn Asn Asn
1               5                   10                  15
aac tcc aac gga tct ttc cgt tct tat cag cct cgc act tcc gat gac        96
Asn Ser Asn Gly Ser Phe Arg Ser Tyr Gln Pro Arg Thr Ser Asp Asp
            20                  25                  30
gat cat cgt cgc cgg gct aca aca att gct cct cca ccg aaa gca tcc        144
Asp His Arg Arg Arg Ala Thr Thr Ile Ala Pro Pro Pro Lys Ala Ser
        35                  40                  45
gac gcg ctt cct ctt ccg tta tat ctc aca aac gcc gtt ttc ttc acg        192
Asp Ala Leu Pro Leu Pro Leu Tyr Leu Thr Asn Ala Val Phe Phe Thr
    50                  55                  60
ctc ttc ttc tcc gtc gcg tat tac ctc ctc cac cgg tgg cgt gac aag        240
Leu Phe Phe Ser Val Ala Tyr Tyr Leu Leu His Arg Trp Arg Asp Lys
65                  70                  75                  80
atc cgt tac aat acg cct ctt cac gtc gtc act atc aca gaa ctc ggc        288
Ile Arg Tyr Asn Thr Pro Leu His Val Val Thr Ile Thr Glu Leu Gly
                85                  90                  95
gcc att att gct ctc atc gct tcg ttt atc tat ctc cta ggg ttt ttt        336
Ala Ile Ile Ala Leu Ile Ala Ser Phe Ile Tyr Leu Leu Gly Phe Phe
            100                 105                 110
ggt att gac ttt gtt cag tca ttt atc tca cgt gcc tct ggt gat gct        384
Gly Ile Asp Phe Val Gln Ser Phe Ile Ser Arg Ala Ser Gly Asp Ala
        115                 120                 125
tgg gat ctc gcc gat acg atc gat gat gat gac cac cgc ctt gtc acg        432
Trp Asp Leu Ala Asp Thr Ile Asp Asp Asp Asp His Arg Leu Val Thr
    130                 135                 140
tgc tct cca ccg act ccg atc gtt tcc gtt gct aaa tta cct aat ccg        480
Cys Ser Pro Pro Thr Pro Ile Val Ser Val Ala Lys Leu Pro Asn Pro
145                 150                 155                 160
gaa cct att gtt acc gaa tcg ctt cct gag gaa gac gag gag att gtg        528
Glu Pro Ile Val Thr Glu Ser Leu Pro Glu Glu Asp Glu Glu Ile Val
                165                 170                 175
aaa tcg gtt atc gac gga gtt att cca tcg tac tcg ctt gaa tct cgt        576
Lys Ser Val Ile Asp Gly Val Ile Pro Ser Tyr Ser Leu Glu Ser Arg
            180                 185                 190
ctc ggt gat tgc aaa aga gcg gcg tcg att cgt cgt gag gcg ttg cag        624
Leu Gly Asp Cys Lys Arg Ala Ala Ser Ile Arg Arg Glu Ala Leu Gln
        195                 200                 205
aga gtc acc ggg aga tcg att gaa ggg tta ccg ttg gat gga ttt gat        672
Arg Val Thr Gly Arg Ser Ile Glu Gly Leu Pro Leu Asp Gly Phe Asp
    210                 215                 220
tat gaa tcg att ttg ggg caa tgc tgt gag atg cct gtt gga tac att        720
Tyr Glu Ser Ile Leu Gly Gln Cys Cys Glu Met Pro Val Gly Tyr Ile
225                 230                235                240
cag att cct gtt ggg act gct ggt cca ttg ttg ctt gat ggt tat gag        768
Gln Ile Pro Val Gly Ile Ala Gly Pro Leu Leu Leu Asp Gly Tyr Glu
                245                 250                 255
tac tct gtt cct atg gct aca acc gaa ggt tgt ttg gtt gct agc act        816
Tyr Ser Val Pro Met Ala Thr Thr Glu Gly Cys Leu Val Ala Ser Thr
            260                 265                 270
aac aga ggc tgc aag gct atg ttt atc tct ggt ggc gcc acc agt acc        864
Asn Arg Gly Cys Lys Ala Met Phe Ile Ser Gly Gly Ala Thr Ser Thr
        275                 280                 285
gtt ctt aag gac ggt atg acc cga gca cct gtt gtt cgg ttc gct tcg        912
Val Leu Lys Asp Gly Met Thr Arg Ala Pro Val Val Arg Phe Ala Ser
    290                 295                 300
gcg aga cga gct tcg gag ctt aag ttt ttc ttg gag aat cca gag aac        960
Ala Arg Arg Ala Ser Glu Leu Lys Phe Phe Leu Glu Agn Pro Glu Asn
305                 310                 315                 320
ttt gat act ttg gca gta gtc ttc aac agg tcg agt aga ttt gca aga        1008
Phe Asp Thr Leu Ala Val Val Phe Asn Arg Ser Ser Arg Phe Ala Arg
                325                 330                 335
ctg caa agt gtt aaa tgc aca atc gcg ggg aag aat gct tat gta agg        1056
Leu Gln Ser Val Lys Cys Thr Ile Ala Gly Lys Asn Ala Tyr Val Arg
            340                 345                 350
ttc tgt tgt agt act ggt gat gct atg ggg atg aat atg gtt tct aaa        1104
Phe Cys Cys Ser Thr Gly Asp Ala Met Gly Met Asn Met Val Ser Lys
        355                 360                 365
ggt gtg cag aat gtt ctt gag tat ctt acc gat gat ttc cct gac atg        1152
Gly Val Gln Asn Val Leu Glu Tyr Leu Thr Asp Asp Phe Pro Asp Met
    370                 375                 380
gat gtg att gga atc tct ggt aac ttc tgt tcg gac aag aaa cct gct        1200
Asp Val Ile Gly Ile Ser Gly Asn Phe Cys Ser Asp Lys Lys Pro Ala
385                 390                 395                 400
gct gtg aac tgg att gag gga cgt ggt aaa tca gtt gtt tgc gag gct        1248
Ala Val Asn Trp Ile Glu Gly Arg Gly Lys Ser Val Val Cys Glu Ala
                405                 410                 415
gta atc aga gga gag atc gtg aac aag gtc ttg aaa acg agc gtg gct        1296
Val Ile Arg Gly Glu Ile Val Asn Lys Val Leu Lys Thr Ser Val Ala
            420                 425                 430
gct tta gtc gag ctc aac atg ctc aag aac cta gct ggc tct gct gtt        1344
Ala Leu Val Glu Leu Asn Met Leu Lys Asn Leu Ala Gly Ser Ala Val
        435                 440                 445
gca ggc tct cta ggt gga ttc aac gct cat gcc agt aac ata gtg tct        1392
Ala Gly Ser Leu Gly Gly Phe Asn Ala His Ala Ser Asn Ile Val Ser
    450                 455                 460
gct gta ttc ata gct act ggc caa gat cca gct caa aac gtg gag agt        1440
Ala Val Phe Ile Ala Thr Gly Gln Asp Pro Ala Gln Asn Val Glu Ser
465                 470         475                         480
tct caa tgc atc acc atg atg gaa gct att aat gac ggc aaa gat atc        1488
Ser Gln Cys Ile Thr Met Met Glu Ala Ile Asn Asp Gly Lys Asp Ile
                485                 490                 495
cat atc tca gtc act atg cca tct atc gag gtg ggg aca gtg gga gga        1536
His Ile Ser Val Thr Met Pro Ser Ile Glu Val Gly Thr Val Gly Gly
            500                 505                 510
gga aca cag ctt gca tct caa tca gcg tgt tta aac ctg ctc gga gtt        1584
Gly Thr Gln Leu Ala Ser Gln Ser Ala Cys Leu Asn Leu Leu Gly Val
        515                 520                 525
aaa gga gca agc aca gag tcg ccg gga atg aac gca agg agg cta gcg        1632
Lys Gly Ala Ser Thr Glu Ser Pro Gly Met Asn Ala Arg Arg Leu Ala
    530                 535                 540
acg atc gta gcc gga gca gtt tta gct gga gag tta tct tta atg tca        1680
Thr Ile Val Ala Gly Ala Val Leu Ala Gly Glu Leu Ser Leu Met Ser
545                 550                 555                 560
gca att gca gct gga cag ctt gtg aga agt cac atg aaa tac aat aga        1728
Ala Ile Ala Ala Gly Gln Leu Val Arg Ser His Met Lys Tyr Asn Arg
                565                 570                 575
tcc agc cga gac atc tct gga gca acg aca acg aca aca aca aca aca        1776
Ser Ser Arg Asp Ile Ser Gly Ala Thr Thr Thr Thr Thr Thr Thr Thr
            580                 585                 590
tga                                                                    1779
<210>8
<211>592
<212>PRT
<213>拟南芥
<400>8
Met Asp Leu Arg Arg Arg Pro Pro Lys Pro Pro Val Thr Asn Asn Asn
1               5                   10                  15
Asn Ser Asn Gly Ser Phe Arg Ser Tyr Gln Pro Arg Thr Ser Asp Asp
            20                  25                  30
Asp His Arg Arg Arg Ala Thr Thr Ile Ala Pro Pro Pro Lys Ala Ser
        35                  40                  45
Asp Ala Leu Pro Leu Pro Leu Tyr Leu Thr Asn Ala Val Phe Phe Thr
    50                  55                  60
Leu Phe Phe Ser Val Ala Tyr Tyr Leu Leu His Arg Trp Arg Asp Lys
65                  70                  75                  80
Ile Arg Tyr Asn Thr Pro Leu His Val Val Thr Ile Thr Glu Leu Gly
                85                  90                  95
Ala Ile Ile Ala Leu Ile Ala Ser Phe Ile Tyr Leu Leu Gly Phe Phe
            100                 105                 110
Gly Ile Asp Phe Val Gln Ser Phe Ile Ser Arg Ala Ser Gly Asp Ala
        115                 120                 125
Trp Asp Leu Ala Asp Thr Ile Asp Asp Asp Asp His Arg Leu Val Thr
    130                 135                 140
Cys Ser Pro Pro Thr Pro Ile Val Ser Val Ala Lys Leu Pro Asn Pro
l45                 1S0                 155                 160
Glu Pro Ile Val Thr Glu Ser Leu Pro Glu Glu Asp Glu Glu Ile Val
                165                 170                 175
Lys Ser Val Ile Asp Gly Val Ile Pro Ser Tyr Ser Leu Glu Ser Arg
            180                 185                 190
Leu Gly Asp Cys Lys Arg Ala Ala Ser Ile Arg Arg Glu Ala Leu Gln
        195                 200                 205
Arg Val Thr Gly Arg Ser Ile Glu Gly Leu Pro Leu Asp Gly Phe Asp
    210                 215                 220
Tyr Glu Ser Ile Leu Gly Gln Cys Cys Glu Met Pro Val Gly Tyr Ile
225                 230                 235                 240
Gln Ile Pro Val Gly Ile Ala Gly Pro Leu Leu Leu Asp Gly Tyr Glu
                245                 250                 255
Tyr Ser Val Pro Met Ala Thr Thr Glu Gly Cys Leu Val Ala Ser Thr
            260                 265                 270
Asn Arg Gly Cys Lys Ala Met Phe Ile Ser Gly Gly Ala Thr Ser Thr
        275                 280                 285
Val Leu Lys Asp Gly Met Thr Arg Ala Pro Val Val Arg Phe Ala Ser
    290                 295                 300
Ala Arg Arg Ala Ser Glu Leu Lys Phe Phe Leu Glu Asn Pro Glu Asn
305                 310                 315                 320
Phe Asp Thr Leu Ala Val Val Phe Asn Arg Ser Ser Arg Phe Ala Arg
                325                 330                 335
Leu Gln Ser Val Lys Cys Thr Ile Ala Gly Lys Asn Ala Tyr Val Arg
            340                 345                 350
Phe Cys Cys Ser Thr Gly Asp Ala Met Gly Met Asn Met Val Ser Lys
        355                 360                 365
Gly Val Gln Asn Val Leu Glu Tyr Leu Thr Asp Asp Phe Pro Asp Met
    370                 375                 380
Asp Val Ile Gly Ile Ser Gly Asn Phe Cys Ser Asp Lys Lys Pro Ala
385                 390                 395                 400
Ala Val Asn Trp Ile Glu Gly Arg Gly Lys Ser Val Val Cys Glu Ala
                405                 410                 415
Val Ile Arg Gly Glu Ile Val Asn Lys Val Leu Lys Thr Ser Val Ala
            420                 425                 430
Ala Leu Val Glu Leu Asn Met Leu Lys Asn Leu Ala Gly Ser Ala Val
        435                 440                 445
Ala Gly Ser Leu Gly Gly Phe Asn Ala His Ala Ser Asn Ile Val Ser
    450                 455                 460
Ala Val Phe Ile Ala Thr Gly Gln Asp Pro Ala Gln Asn Val Glu Ser
465                 470                 475                 480
Ser Gln Cys Ile Thr Met Met Glu Ala Ile Asn Asp Gly Lys Asp Ile
                485                 490                 495
His Ile Ser Val Thr Met Pro Ser Ile Glu Val Gly Thr Val Gly Gly
            500                 505                 510
Gly Thr Gln Leu Ala Ser Gln Ser Ala Cys Leu Asn Leu Leu Gly Val
        515                 520                 525
Lys Gly Ala Ser Thr Glu Ser Pro Gly Met Asn Ala Arg Arg Leu Ala
    530                 535                 540
Thr Ile Val Ala Gly Ala Val Leu Ala Gly Glu Leu Ser Leu Met Ser
545                 550                 555                 560
Ala Ile Ala Ala Gly Gln Leu Val Arg Ser His Met Lys Tyr Asn Arg
                565                 570                 575
Ser Ser Arg Asp Ile Ser Gly Ala Thr Thr Thr Thr Thr Thr Thr Thr
            580                 585                 590
<210>9
<21l>1401
<212>DNA
<213>拟南芥ISPH
<220>
<221>CDS
<222>(1)..(1401)
<223>
<400>9
atg gct gtt gcg ctc caa ttc agc cga tta tgc gtt cga ccg gat act         48
Met Ala Val Ala Leu Gln Phe Ser Arg Leu Cys Val Arg Pro Asp Thr
1               5                   10                  15
ttc gtg cgg gag aat cat ctc tct gga tcc gga tct ctc cgc cgc cgg         96
Phe Val Arg Glu Asn His Leu Ser Gly Ser Gly Ser Leu Arg Arg Arg
            20                  25                  30
aaa gct tta tca gtc cgg tgc tcg tct ggc gat gag aac gct cct tcg        144
Lys Ala Leu Ser Val Arg Cys Ser Ser Gly Asp Glu Asn Ala Pro Ser
        35                  40                  45
cca tcg gtg gtg atg gac tcc gat ttc gac gcc aag gtg ttc cgt aag        192
Pro Ser Val Val Met Asp Ser Asp Phe Asp Ala Lys Val Phe Arg Lys
    50                  55                  60
aac ttg acg aga agc gat aat tac aat cgt aaa ggg ttc ggt cat aag        240
Asn Leu Thr Arg Ser Asp Asn Tyr Asn Arg Lys Gly Phe Gly His Lys
65                  70                  75                  80
gag gag aca ctc aag ctc atg aat cga gag tac acc agt gat ata ttg        288
Glu Glu Thr Leu Lys Leu Met Asn Arg Glu Tyr Thr Ser Asp Ile Leu
                85                  90                  95
gag aca ctg aaa aca aat ggg tat act tat tct tgg gga gat gtt act        336
Glu Thr Leu Lys Thr Asn Gly Tyr Thr Tyr Ser Trp Gly Asp Val Thr
            100                 105                 110
gtg aaa ctc gct aaa gca tat ggt ttt tgc tgg ggt gtt gag cgt gct        384
Val Lys Leu Ala Lys Ala Tyr Gly Phe Cys Trp Gly Val Glu Arg Ala
        115                 120                 125
gtt cag att gca tat gaa gca cga aag cag ttt cca gag gag agg ctt        432
Val Gln Ile Ala Tyr Glu Ala Arg Lys Gln Phe Pro Glu Glu Arg Leu
    130                 135                 140
tgg att act aac gaa atc att cat aac ccg acc gtc aat aag agg ttg        480
Trp Ile Thr Asn Glu Ile Ile His Asn Pro Thr Val Asn Lys Arg Leu
145                 150                 155                 160
gaa gat atg gat gtt aaa att att ccg gtt gag gat tca aag aaa cag        528
Glu Asp Met Asp Val Lys Ile Ile Pro Val Glu Asp Ser Lys Lys Gln
                165                 170                 175
ttt gat gta gta gag aaa gat gat gtg gtt atc ctt cct gcg ttt gga        576
Phe Asp Val Val Glu Lys Asp Asp Val Val Ile Leu Pro Ala Phe Gly
            180                 185                 190
gct ggt gtt gac gag atg tat gtt ctt aat gat aaa aag gtg caa att        624
Ala Gly Val Asp Glu Met Tyr Val Leu Asn Asp Lys Lys Val Gln Ile
        195                 200                 205
gtt gac acg act tgt cct tgg gtg aca aag gtc tgg aac acg gtt gag        672
Val Asp Thr Thr Cys Pro Trp Val Thr Lys Val Trp Asn Thr Val Glu
    210                 215                 220
aag cac aag aag ggg gaa tac aca tca gta atc cat ggt aaa tat aat        720
Lys His Lys Lys Gly Glu Tyr Thr Ser Val Ile His Gly Lys Tyr Asn
225                 230                 235                 240
cat gaa gag acg att gca act gcg tct ttt gca gga aag tac atc att        768
His Glu Glu Thr Ile Ala Thr Ala Ser Phe Ala Gly Lys Tyr Ile Ile
                245                 250                 255
gta aag aac atg aaa gag gca aat tac gtt tgt gat tac att ctc ggt        816
Val Lys Asn Met Lys Glu Ala Asn Tyr Val Cys Asp Tyr Ile Leu Gly
            260                 265                 270
ggc caa tac gat gga tct agc tcc aca aaa gag gag ttc atg gag aaa        864
Gly Gln Tyr Asp Gly Ser Ser Ser Thr Lys Glu Glu Phe Met Glu Lys
        275             280                     285
ttc aaa tac gca att tcg aag ggt ttc gat ccc gac aat gac ctt gtc        912
Phe Lys Tyr Ala Ile Ser Lys Gly Phe Asp Pro Asp Asn Asp Leu Val
    290                 295                 300
aaa gtt ggt att gca aac caa aca acg atg cta aag gga gaa aca gag         960
Lys Val Gly Ile Ala Asn Gln Thr Thr Met Leu Lys Gly Glu Thr Glu
305                 310                 315                 320
gag ata gga aga tta ctc gag aca aca atg atg cgc aag tat gga gtg        1008
Glu Ile Gly Arg Leu Leu Glu Thr Thr Met Met Arg Lys Tyr Gly Val
                325                 330                 335
gaa aat gta agc gga cat ttc atc agc ttc aac aca ata tgc gac gct        1056
Glu Asn Val Ser Gly His Phe Ile Ser Phe Asn Thr Ile Cys Asp Ala
            340                 345                 350
act caa gag cga caa gac gca atc tat gag cta gtg gaa gag aag att        1104
Thr Gln Glu Arg Gln Asp Ala Ile Tyr Glu Leu Val Glu Glu Lys Ile
        355                 360                 365
gac ctc atg cta gtg gtt ggc gga tgg aat tca agt aac acc tct cac        1152
Asp Leu Met Leu Val Val Gly Gly Trp Asn Ser Ser Asn Thr Ser His
    370                 375                 380
ctt cag gaa atc tca gag gca cgg gga atc cca tct tac tgg atc gat        1200
Leu Gln Glu Ile Ser Glu Ala Arg Gly Ile Pro Ser Tyr Trp Ile Asp
385                 390                 395                 400
agt gag aaa cgg ata gga cct ggg aat aaa ata gcc tat aag ctc cac        1248
Ser Glu Lys Arg Ile Gly Pro Gly Asn Lys Ile Ala Tyr Lys Leu His
                405                 410                 415
tat gga gaa ctg gtc gag aag gaa aac ttt ctc cca aag gga cca ata        1296
Tyr Gly Glu Leu Val Glu Lys Glu Asn Phe Leu Pro Lys Gly Pro Ile
            420                 425                 430
aca atc ggt gtg aca tca ggt gca tca acc ccg gat aag gtc gtg gaa        1344
Thr Ile Gly Val Thr Ser Gly Ala Ser Thr Pro Asp Lys Val Val Glu
        435                 440                 445
gat gct ttg gtg aag gtg ttc gac att aaa cgt gaa gag tta ttg cag        1392
Asp Ala Leu Val Lys Val Phe Asp Ile Lys Arg Glu Glu Leu Leu Gln
    450                 455                 460
ctg gct tga                                                            1401
Leu Ala
465
<210>10
<211>466
<212>PRT
<213>拟南芥ISPH
<400>10
Met Ala Val Ala Leu Gln Phe Ser Arg Leu Cys Val Arg Pro Asp Thr
1               5                   10                  15
Phe Val Arg Glu Asn His Leu Ser Gly Ser Gly Ser Leu Arg Arg Arg
            20                  25                  30
Lys Ala Leu Ser Val Arg Cys Ser Ser Gly Asp Glu Asn Ala Pro Ser
        35                  40                  45
Pro Ser Val Val Met Asp Ser Asp Phe Asp Ala Lys Val Phe Arg Lys
    50                  55                  60
Asn Leu Thr Arg Ser Asp Asn Tyr Asn Arg Lys Gly Phe Gly His Lys
65                  70                  75                  80
Glu Glu Thr Leu Lys Leu Met Asn Arg Glu Tyr Thr Ser Asp Ile Leu
                85                  90                  95
Glu Thr Leu Lys Thr Asn Gly Tyr Thr Tyr Ser Trp Gly Asp Val Thr
            100                 105                 110
Val Lys Leu Ala Lys Ala Tyr Gly Phe Cys Trp Gly Val Glu Arg Ala
        115                 120                 125
Val Gln Ile Ala Tyr Glu Ala Arg Lys Gln Phe Pro Glu Glu Arg Leu
    130                 135                 140
Trp Ile Thr Asn Glu Ile Ile His Asn Pro Thr Val Asn Lys Arg Leu
145                 150                 155                 160
Glu Asp Met Asp Val Lys Ile Ile Pro Val Glu Asp Ser Lys Lys Gln
                165                 170                 175
Phe Asp Val Val Glu Lys Asp Asp Val Val Ile Leu Pro Ala Phe Gly
            180                 185                 190
Ala Gly Val Asp Glu Met Tyr Val Leu Asn Asp Lys Lys Val Gln Ile
        195                 200                 205
Val Asp Thr Thr Cys Pro Trp Val Thr Lys Val Trp Asn Thr Val Glu
    210                 215                 220
Lys His Lys Lys Gly Glu Tyr Thr Ser Val Ile His Gly Lys Tyr Asn
225                 230                 235                 240
His Glu Glu Thr Ile Ala Thr Ala Ser Phe Ala Gly Lys Tyr Ile Ile
                245                 250                 255
Val Lys Asn Met Lys Glu Ala Asn Tyr Val Cys Asp Tyr Ile Leu Gly
            260                 265                 270
Gly Gln Tyr Asp Gly Ser Ser Ser Thr Lys Glu Glu Phe Met Glu Lys
        275                 280                 285
Phe Lys Tyr Ala Ile Ser Lys Gly Phe Asp Pro Asp Asn Asp Leu Val
    290                 295                 300
Lys Val Gly Ile Ala Asn Gln Thr Thr Met Leu Lys Gly Glu Thr Glu
305                 310                 315                 320
Glu Ile Gly Arg Leu Leu Glu Thr Thr Met Met Arg Lys Tyr Gly Val
                325                 330                 335
Glu Asn Val Ser Gly His Phe Ile Ser Phe Asn Thr Ile Cys Asp Ala
            340                 345                 350
Thr Gln Glu Arg Gln Asp Ala Ile Tyr Glu Leu Val Glu Glu Lys Ile
        355                 360                 365
Asp Leu Met Leu Val Val Gly Gly Trp Asn Ser Ser Asn Thr Ser His
    370                 375                 380
Leu Gln Glu Ile Ser Glu Ala Arg Gly Ile Pro Ser Tyr Trp Ile Asp
385                 390                 395                 400
Ser Glu Lys Arg Ile Gly Pro Gly Asn Lys Ile Ala Tyr Lys Leu His
                405                 410                 415
Tyr Gly Glu Leu Val Glu Lys Glu Asn Phe Leu Pro Lys Gly Pro Ile
            420                 425                 430
Thr Ile Gly Val Thr Ser Gly Ala Ser Thr Pro Asp Lys Val Val Glu
        435                 440                 445
Asp Ala Leu Val Lys Val Phe Asp Ile Lys Arg Glu Glu Leu Leu Gln
    450                 455                 460
Leu Ala
465
<210>11
<211>2160
<212>DNA
<213>食用番茄
<220>
<221>CDS
<222>(1)..(2160)
<223>
<400>11
atg gct ttg tgt gct tat gca ttt cct ggg att ttg aac agg act ggt         48
Met Ala Leu Cys Ala Tyr Ala Phe Pro Gly Ile Leu Asn Arg Thr Gly
1               5                   10                  15
gtg gtt tca gat tct tct aag gca acc cct ttg ttc tct gga tgg att         96
Val Val Ser Asp Ser Ser Lys Ala Thr Pro Leu Phe Ser Gly Trp Ile
            20                  25                  30
cat gga aca gat ctg cag ttt ttg ttc caa cac aag ctt act cat gag        144
His Gly Thr Asp Leu Gln Phe Leu Phe Gln His Lys Leu Thr His Glu
        35                  40                  45
gtc aag aaa aggtca cgt gtg gtt cag gct tcc tta tca gaa tct gga         192
Va1 Lys Lys Arg Ser Arg Val Val Gln Ala Ser Leu Ser Glu Ser Gly
    50                  55                  60
gaa tac tac aca cag aga ccg cca acg cct att ttg gac act gtg aac        240
Glu Tyr Tyr Thr Gln Arg Pro pro Thr Pro Ile Leu Asp Thr Val Asn
65                  70                  75                  80
tat ccc att cat atg aaa aat ctg tct ctg aag gaa ctt aaa caa cta        288
Tyr Pro Ile His Met Lys Asn Leu Ser Leu Lys Glu Leu Lys Gln Leu
                85                  90                  95
gca gat gaa cta agg tca gat aca att ttc aat gta tca aag act ggg        336
Ala Asp Glu Leu Arg Ser Asp Thr Ile Phe Asn Val Ser Lys Thr Gly
            100             105                     110
ggt cac ctt ggc tca agt ctt ggt gtt gtt gag ctg act gtt gct ctt        384
Gly His Leu Gly Ser Ser Leu Gly Val Val Glu Leu Thr Val Ala Leu
        115                 120                 125
cat tat gtc ttc aat gca ccg caa gat agg att ctc tgg gat gtt ggt        432
His Tyr Val Phe Asn Ala Pro Gln Asp Arg Ile Leu Trp Asp Val Gly
    130                 135                 140
cat cag tct tat cct cac aaa atc ttg act ggt aga agg gac aag atg        480
His Gln Ser Tyr Pro His Lys Ile Leu Thr Gly Arg Arg Asp Lys Met
145                 150                 155                 160
tcg aca tta agg cag aca gat ggt ctt gca gga ttt act aag cga tcg        528
Ser Thr Leu Arg Gln Thr Asp Gly Leu Ala Gly phe Thr Lys Arg Ser
                165                 170                 175
gag agt gaa tat gat tgc ttt ggc acc ggc cac agt tcc acc acc atc        576
Glu Ser Glu Tyr Asp Cys Phe Gly Thr Gly His Ser Ser Thr Thr Ile
            180                 185                 190
tca gca ggc cta ggg atg gct gtt ggt aga gat cta aaa gga aga aac         624
Ser Ala Gly Leu Gly Met Ala Val Gly Arg Asp Leu Lys Gly Arg Asn
        195                 200                 205
aac aat gtt att gcc gta ata ggt gat ggt gcc atg aca gca ggt caa         672
Asn Asn Val Ile Ala Val Ile Gly Asp Gly Ala Met Thr Ala Gly Gln
    210                 215                 220
gct tat gaa gcc atg aat aat gct ggt tac ctg gac tct gac atg att         720
Ala Tyr Glu Ala Met Asn Asn Ala Gly Tyr Leu Asp Ser Asp Met Ile
225                 230                 235                 240
gtt atc tta aac gac aat aga caa gtt tct tta cct act gct act ctg         768
Val Ile Leu Asn Asp Asn Arg Gln Val Ser Leu Pro Thr Ala Thr Leu
                245                 250                 255
gat ggg cca gtt gct cct gtt gga gct cta agt agt gct ttg agc agg         816
Asp Gly Pro Val Ala Pro Val Gly Ala Leu Ser Ser Ala Leu Ser Arg
            260                 265                 270
tta cag tct aat agg cct ctc aga gaa cta aga gaa gtc gca aag gga         864
Leu Gln Ser Asn Arg Pro Leu Arg Glu Leu Arg Glu Val Ala Lys Gly
        275                 280                 285
gtt act aag cag att ggt ggt cct atg cat gag ctt gct gca aaa gtt         912
Val Thr Lys Gln Ile Gly Gly Pro Met His Glu Leu Ala Ala Lys Val
    290                 295                 300
gat gaa tat gct cgt ggc atg att agt ggt tct gga tca aca ttg ttt         960
Asp Glu Tyr Ala Arg Gly Met Ile Ser Gly Ser Gly Ser Thr Leu Phe
305                 310                 315                 320
gaa gaa ctt gga ctt tac tat att ggt cct gtg gat ggt cac aac att        1008
Glu Glu Leu Gly Leu Tyr Tyr Ile Gly Pro Val Asp Gly His Asn Ile
                325                 330                 335
gat gat cta att gcg att ctc aaa gag gtt aga agt act aaa aca aca        1056
Asp Asp Leu Ile Ala Ile Leu Lys Glu Val Arg Ser Thr Lys Thr Thr
            340                 345                 350
ggt cca gta ctg atc cat gtt gtc act gag aaa ggc aga ggt tat cca        1104
Gly Pro Val Leu Ile His Val Val Thr Glu Lys Gly Arg Gly Tyr Pro
        355                 360                 365
tat gct gag aga gct gca gat aag tat cat gga gtt gcc aag ttt gat        1152
Tyr Ala Glu Arg Ala Ala Asp Lys Tyr His Gly Val Ala Lys Phe Asp
    370                 375                 380
cca gca aca gga aag caa ttc aaa gcc agt gcc aag aca cag tcc tat        1200
Pro Ala Thr Gly Lys Gln Phe Lys Ala Ser Ala Lys Thr Gln Ser Tyr
385                 390                 395                 400
aca aca tat ttt gcc gag gct tta att gca gaa gca gaa gca gat aaa        1248
Thr Thr Tyr phe Ala Glu Ala Leu Ile Ala Glu Ala Glu Ala Asp Lys
                405                 410                 415
gac att gtt gca atc cat gct gcc atg ggg ggt ggg acc gga atg aac        1296
Asp Ile Val Ala Ile His Ala Ala Met Gly Gly Gly Thr Gly Met Asn
            420                 425                 430
ctt ttc cat cgt cgc ttc cca aca agg tgt ttt gat gtt gga ata gca        1344
Leu Phe His Arg Arg Phe Pro Thr Arg Cys Phe Asp Val Gly Ile Ala
        435                 440                 445
gaa caa cat gca gta acc ttt gct gct gga ttg gct tgt gaa ggc att        1392
Glu Gln His Ala Val Thr Phe Ala Ala Gly Leu Ala Cys Glu Gly Ile
    450                 455                 460
aaa cct ttc tgt gca atc tat tcg tct ttc atg cag agg gct tat gac        1440
Lys Pro Phe Cys Ala Ile Tyr Ser Ser Phe Met Gln Arg Ala Tyr Asp
465                 470                 475                 480
cag gta gtg cat gac gtt gat ttg caa aag ctg ccc gtg agg ttt gca        1488
Gln Va1 Val His Asp Val Asp Leu Gln Lys Leu Pro Val Arg Phe Ala
                485                 490                 495
atg gac aga gca ggt ctt gtt gga gca gat ggt cca aca cat tgt ggt        1536
Met Asp Arg Ala Gly Leu Val Gly Ala Asp Gly Pro Thr His Cys Gly
            500                 505                 510
gca ttt gat gtt act tac atg gca tgt ctt cct aac atg gtt gta atg        1584
Ala Phe Asp Val Thr Tyr Met Ala Cys Leu Pro Asn Met Val Val Met
        515                 520                 525
gct cct tct gat gaa gcg gag cta ttt cac atg gta gca act gct gcc        1632
Ala Pro Ser Asp Glu Ala Glu Leu Phe His Met Val Ala Thr Ala Ala
    530                 535                 540
gcc att gat gac aga cca agt tgt ttt aga tac cca aga gga aat ggg        1680
Ala Ile Asp Asp Arg Pro Ser Cys Phe Arg Tyr Pro Arg Gly Asn Gly
545                 550                 555                 560
atc ggt gta gag ctt ccg gct gga aac aaa gga att cct ctt gag gtt        1728
Ile Gly Val Glu Leu Pro Ala Gly Asn Lys Gly Ile Pro Leu Glu Val
                565                 570                 575
ggt aaa ggt agg ata ttg att gag ggg gag aga gtg gct cta ttg gga        1776
Gly Lys Gly Arg Ile Leu Ile Glu Gly Glu Arg Val Ala Leu Leu Gly
            580                 585                 590
tat ggc tca gca gtg cag aac tgt ttg gat gct gct att gtg cta gaa        1824
Tyr Gly Ser Ala Val Gln Asn Cys Leu Asp Ala Ala Ile Val Leu Glu
        595                 600                 605
tcc cgc ggc tta caa gta aca gtt gca gat gca cgt ttc tgc aaa cca        1872
Ser Arg Gly Leu Gln Val Thr Val Ala Asp Ala Arg Phe Cys Lys Pro
    610                 615                 620
ctg gac cat gcc ctc ata agg agc ctt gca aaa tca cat gaa gtg cta        1920
Leu Asp His Ala Leu Ile Arg Ser Leu Ala Lys Ser His Glu Val Leu
625                 630                 635                 640
atc act gtc gaa gaa gga tca att gga ggt ttt gga tct cat gtt gtt        1968
Ile Thr Val Glu Glu Gly Ser Ile Gly Gly Phe Gly Ser His Val Val
            645                 650                     655
cag ttc atg gcc tta gat ggg ctt ctt gat ggc aag ttg aag tgg aga        2016
Gln Phe Met Ala Leu Asp Gly Leu Leu Asp Gly Lys Leu Lys Trp Arg
        660                 665                     670
cca ata gtt ctt cct gat cga tac att gac cat gga tct cct gtt gat        2064
Pro Ile Val Leu Pro Asp Arg Tyr Ile Asp His Gly Ser Pro Val Asp
        675                 680                 685
cag ttg gcg gaa gct ggc cta aca cca tct cac att gca gca aca gta        2112
Gln Leu Ala Glu Ala Gly Leu Thr pro Ser His Ile Ala Ala Thr Val
    690                 695                 700
ttt aac ata ctt gga caa acc aga gag gct cta gag gtc atg aca taa        2160
Phe Asn Ile Leu Gly Gln Thr Arg Glu Ala Leu Glu Val Met Thr
705             710                     715
<210>12
<211>719
<212>pRT
<213>食用番茄
<400>12
Met Ala Leu Cys Ala Tyr Ala Phe Pro Gly Ile Leu Asn Arg Thr Gly
1               5                   10                  15
Val Val Ser Asp Ser Ser Lys Ala Thr Pro Leu phe Ser Gly Trp Ile
            20                  25                  30
His Gly Thr Asp Leu Gln Phe Leu Phe Gln His Lys Leu Thr His Glu
        35                  40                  45
Val Lys Lys Arg Ser Arg Val Val Gln Ala Ser Leu Ser Glu Ser Gly
    50                  55                  60
Glu Tyr Tyr Thr Gln Arg Pro Pro Thr Pro Ile Leu Asp Thr Val Asn
65                  70                  75                  80
Tyr Pro Ile His Met Lys Asn Leu Ser Leu Lys Glu Leu Lys Gln Leu
                85                  90                  95
Ala Asp Glu Leu Arg Ser Asp Thr Ile Phe Asn Val Ser Lys Thr Gly
            100                 105                 110
Gly His Leu Gly Ser Ser Leu Gly Val Val Glu Leu Thr Val Ala Leu
        115                 120                 125
His Tyr Val Phe Asn Ala Pro Gln Asp Arg Ile Leu Trp Asp Val Gly
    130                 135                 140
His Gln Ser Tyr Pro His Lys Ile Leu Thr Gly Arg Arg Asp Lys Met
145                 150                 155                 160
Ser Thr Leu Arg Gln Thr Asp Gly Leu Ala Gly Phe Thr Lys Arg Ser
                165                 170                 175
Glu Ser Glu Tyr Asp Cys Phe Gly Thr Gly His Ser Ser Thr Thr Ile
            180                 185                 190
Ser Ala Gly Leu Gly Met Ala Val Gly Arg Asp Leu Lys Gly Arg Asn
        l95                 200                 205
Asn Asn Val Ile Ala Val Ile Gly Asp Gly Ala Met Thr Ala Gly Gln
    210                 215                 220
Ala Tyr Glu Ala Met Asn Asn Ala Gly Tyr Leu Asp Ser Asp Met Ile
225                 230                 235                 240
Val Ile Leu Asn Asp Asn Arg Gln Val Ser Leu Pro Thr Ala Thr Leu
                245                 250                 255
Asp Gly Pro Val Ala Pro Val Gly Ala Leu Ser Ser Ala Leu Ser Arg
            260                 265                 270
Leu Gln Ser Asn Arg Pro Leu Arg Glu Leu Arg Glu Val Ala Lys Gly
        275                 280                 285
Val Thr Lys Gln Ile Gly Gly Pro Met His Glu Leu Ala Ala Lys Val
    290                 295                 300
Asp Glu Tyr Ala Arg Gly Met Ile Ser Gly Ser Gly Ser Thr Leu Phe
305                 310                 315                 320
Glu Glu Leu Gly Leu Tyr Tyr Ile Gly Pro Val Asp Gly His Asn Ile
        325                         330                 335
Asp Asp Leu Ile Ala Ile Leu Lys Glu Val Arg Ser Thr Lys Thr Thr
            340                 345                 350
Gly Pro Val Leu Ile His Val Val Thr Glu Lys Gly Arg Gly Tyr Pro
        355             360                     365
Tyr Ala Glu Arg Ala Ala Asp Lys Tyr His Gly Val Ala Lys Phe Asp
    370                 375                 380
Pro Ala Thr Gly Lys Gln Phe Lys Ala Ser Ala Lys Thr Gln Ser Tyr
385                 390                 395                 400
Thr Thr Tyr Phe Ala Glu Ala Leu Ile Ala Glu Ala Glu Ala Asp Lys
                405                 410                 4l5
Asp Ile Val Ala Ile His Ala Ala Met Gly Gly Gly Thr Gly Met Asn
            420                 425                 430
Leu Phe His Arg Arg Phe Pro Thr Arg Cys Phe Asp Val Gly Ile Ala
        435                 440                 445
Glu Gln His Ala Val Thr Phe Ala Ala Gly Leu Ala Cys Glu Gly Ile
    450                 455                 460
Lys Pro Phe Cys Ala Ile Tyr Ser Ser Phe Met Gln Arg Ala Tyr Asp
465                 470                 475                 480
Gln Val Val His Asp Val Asp Leu Gln Lys Leu Pro Val Arg Phe Ala
                485                 490                 495
Met Asp Arg Ala Gly Leu Val Gly Ala Asp Gly Pro Thr His Cys Gly
            500                 505                 510
Ala Phe Asp Val Thr Tyr Met Ala Cys Leu Pro Asn Met Val Val Met
        515                 520                 525
Ala Pro Ser Asp Glu Ala Glu Leu Phe His Met Val Ala Thr Ala Ala
    530                 535                 540
Ala Ile Asp Asp Arg Pro Ser Cys Phe Arg Tyr Pro Arg Gly Asn Gly
545                 550                 555                 560
Ile Gly Val Glu Leu Pro Ala Gly Asn Lys Gly Ile Pro Leu Glu Val
                565                 570                 575
Gly Lys Gly Arg Ile Leu Ile Glu Gly Glu Arg Val Ala Leu Leu Gly
            580                 585                 590
Tyr Gly Ser Ala Val Gln Asn Cys Leu Asp Ala Ala Ile Val Leu Glu
        595                 600                 605
Ser Arg Gly Leu Gln Val Thr Val Ala Asp Ala Arg Phe Cys Lys Pro
    610                 615                 620
Leu Asp His Ala Leu Ile Arg Ser Leu Ala Lys Ser His Glu Val Leu
625                 630                 635                 640
Ile Thr Val Glu Glu Gly Ser Ile Gly Gly Phe Gly Ser His Val Val
                645             650                     655
Gln Phe Met Ala Leu Asp Gly Leu Leu Asp Gly Lys Leu Lys Trp Arg
            660             665                     670
Pro Ile Val Leu Pro Asp Arg Tyr Ile Asp His Gly Ser Pro Val Asp
        675                 680                 685
Gln Leu Ala Glu Ala Gly Leu Thr Pro Ser His Ile Ala Ala Thr Val
    690                 695                 700
Phe Asn Ile Leu Gly Gln Thr Arg Glu Ala Leu Glu Val Met Thr
705                 710                 715
<210>13
<211>l434
<212>DNA
<213>拟南芥
<220>
<221>CDS
<222>(1)..(1434)
<223>
<400>13
atg atg aca tta aac tca cta tct cca gct gaa tcc aaa gct att tct         48
Met Met Thr Leu Asn Ser Leu Ser Pro Ala Glu Ser Lys Ala Ile Ser
1               5                   10                  15
ttc ttg gat acc tcc agg ttc aat cca atc cct aaa ctc tca ggt ggg         96
Phe Leu Asp Thr Ser Arg Phe Asn Pro Ile Pro Lys Leu Ser Gly Gly
            20                  25                  30
ttt agt ttg agg agg agg aat caa ggg aga ggt ttt gga aaa ggt gtt        144
Phe Ser Leu Arg Arg Arg Asn Gln Gly Arg Gly Phe Gly Lys Gly Val
        35                  40                  45
aag tgt tca gtg aaa gtg cag cag caa caa caa cct cct cca gca tgg        192
Lys Cys Ser Val Lys Val Gln Gln Gln Gln Gln Pro Pro Pro Ala Trp
    50                  55                  60
cct ggg aga gct gtc cct gag gcg cct cgt caa tct tgg gat gga cca        240
Pro Gly Arg Ala Val Pro Glu Ala Pro Arg Gln Ser Trp Asp Gly Pro
65                  70                  75                  80
aaa ccc atc tct atc gtt gga tct act ggt tct att ggc act cag aca        288
Lys Pro Ile Ser Ile Val Gly Ser Thr Gly Ser Ile Gly Thr Gln Thr
                85                  90                  95
ttg gat att gtg gct gag aat cct gac aaa ttc aga gtt gtg gct cta        336
Leu Asp Ile Val Ala Glu Ash Pro Asp Lys Phe Arg Val Val Ala Leu
            100                 105                 110
gct gct ggt tcg aat gtt act cta ctt gct gat cag gta agg aga ttt        384
Ala Ala Gly Ser Asn Val Thr Leu Leu Ala Asp Gln Val Arg Arg phe
        115                 120                 125
aag cct gca ttg gtt gct gtt aga aac gag tca ctg att aat gag ctt        432
Lys Pro Ala Leu Val Ala Val Arg Asn Glu Ser Leu Ile Asn Glu Leu
    130                 135                 140
aaa gag gct tta gct gat ttg gac tat aaa ctc gag att att cca gga        480
Lys Glu Ala Leu Ala Asp Leu Asp Tyr Lys Leu Glu Ile Ile Pro Gly
145                 150                 155                 160
gag caa gga gtg att gag gtt gcc cga cat cct gaa gct gta acc gtt        528
Glu Gln Gly Val Ile Glu Val Ala Arg His Pro Glu Ala Val Thr Val
                165                 170                 175
gtt acc gga ata gta ggt tgt gcg gga cta aag cct acg gtt gct gca        576
Val Thr Gly Ile Val Gly Cys Ala Gly Leu Lys Pro Thr Val Ala Ala
            180                 185                 190
att gaa gca gga aag gac att gct ctt gca aac aaa gag aca tta atc         624
Ile Glu Ala Gly Lys Asp Ile Ala Leu Ala Asn Lys Glu Thr Leu Ile
        195                 200                 205
gca ggt ggt cct ttc gtg ctt ccg ctt gcc aac aaa cat aat gta aag         672
Ala Gly Gly Pro Phe Val Leu Pro Leu Ala Asn Lys His Asn Val Lys
    210                 215                 220
att ctt ccg gca gat tca gaa cat tct gcc ata ttt cag tgt att caa         720
Ile Leu Pro Ala Asp Ser Glu His Ser Ala Ile Phe Gln Cys Ile Gln
225                 230                 235                 240
ggt ttg cct gaa ggc gct ctg cgc aag ata atc ttg act gca tct ggt         768
Gly Leu Pro Glu Gly Ala Leu Arg Lys Ile Ile Leu Thr Ala Ser Gly
                245                 250                 255
gga gct ttt agg gat tgg cct gtc gaa aag cta aag gaa gtt aaa gta         816
Gly Ala Phe Arg Asp Trp Pro Val Glu Lys Leu Lys Glu Val Lys Val
            260                 265                 270
gcg gat gcg ttg aag cat cca aac tgg aac atg gga aag aaa atc act         864
Ala Asp Ala Leu Lys His Pro Asn Trp Asn Met Gly Lys Lys Ile Thr
        275                 280                 285
gtg gac tct gct acg ctt ttc aac aag ggt ctt gag gtc att gaa gcg         912
Val Asp Ser Ala Thr Leu Phe Asn Lys Gly Leu Glu Val Ile Glu Ala
    290                 295                 300
cat tat ttg ttt gga gct gag tat gac gat ata gag att gtc att cat         960
His Tyr Leu Phe Gly Ala Glu Tyr Asp Asp Ile Glu Ile Val Ile His
305                 310                 315                 320
ccg caa agt atc ata cat tcc atg att gaa aca cag gat tca tct gtg        1008
Pro Gln Ser Ile Ile His Ser Met Ile Glu Thr Gln Asp Ser Ser Val
                325                 330                 335
ctt gct caa ttg ggt tgg cct gat atg cgt tta ccg att ctc tac acc        1056
Leu Ala Gln Leu Gly Trp Pro Asp Met Arg Leu Pro Ile Leu Tyr Thr
            340                 345                 350
atg tca tgg ccc gat aga gtt cct tgt tct gaa gta act tgg cca aga        1104
Met Ser Trp Pro Asp Arg Val Pro Cys Ser Glu Val Thr Trp Pro Arg
        355                 360                 365
ctt gac ctt tgc aaa ctc ggt tca ttg act ttc aag aaa cca gac aat        1152
Leu Asp Leu Cys Lys Leu Gly Ser Leu Thr Phe Lys Lys Pro Asp Asn
    370                 375                 380
gtg aaa tac cca tcc atg gat ctt gct tat gct gct gga cga gct gga        1200
Val Lys Tyr Pro Ser Met Asp Leu Ala Tyr Ala Ala Gly Arg Ala Gly
385                 390                 395                 400
ggc aca atg act gga gtt ctc agc gcc gcc aat gag aaa gct gtt gaa        1248
Gly Thr Met Thr Gly Val Leu Ser Ala Ala Asn Glu Lys Ala Val Glu
                405                 410                 415
atg ttc att gat gaa aag ata agc tat ttg gat atc ttc aag gtt gtg        1296
Met Phe Ile Asp Glu Lys Ile Ser Tyr Leu Asp Ile phe Lys Val Val
            420                 425                 430
gaa tta aca tgc gat aaa cat cga aac gag ttg gta aca tca ccg tct        1344
Glu Leu Thr Cys Asp Lys His Arg Asn Glu Leu Val Thr Ser Pro Ser
        435                 440                 445
ctt gaa gag att gtt cac tat gac ttg tgg gca cgt gaa tat gcc gcg        1392
Leu Glu Glu Ile Val His Tyr Asp Leu Trp Ala Arg Glu Tyr Ala Ala
    450                 455                 460
aat gtg cag ctt tct tct ggt gct agg cca gtt cat gca tga                1434
Asn Val Gln Leu Ser Ser Gly Ala Arg Pro Val His Ala
465                 470                 475
<210>14
<211>477
<212>PRT
<213>拟南芥
<400>14
Met Met Thr Leu Asn Ser Leu Ser Pro Ala Glu Ser Lys Ala Ile Ser
1               5                   10                  15
Phe Leu Asp Thr Ser Arg Phe Asn Pro Ile Pro Lys Leu Ser Gly Gly
            20                  25                  30
Phe Ser Leu Arg Arg Arg Asn Gln Gly Arg Gly Phe Gly Lys Gly Val
    35                      40                  45
Lys Cys Ser Val Lys Val Gln Gln Gln Gln Gln Pro Pro Pro Ala Trp
    50                  55                  60
Pro Gly Arg Ala Val Pro Glu Ala Pro Arg Gln Ser Trp Asp Gly Pro
65                  70                  75                  80
Lys Pro Ile Ser Ile Val Gly Ser Thr Gly Ser Ile Gly Thr Gln Thr
                85                  90                  95
Leu Asp Ile Val Ala Glu Asn Pro Asp Lys Phe Arg Val Val Ala Leu
            100                 105                 110
Ala Ala Gly Ser Asn Val Thr Leu Leu Ala Asp Gln Val Arg Arg Phe
        115                 120                 125
Lys Pro Ala Leu Val Ala Val Arg Asn Glu Ser Leu Ile Asn Glu Leu
    130                 135                 140
Lys Glu Ala Leu Ala Asp Leu Asp Tyr Lys Leu Glu Ile Ile Pro Gly
145                 150                 155                 160
Glu Gln Gly Val Ile Glu Val Ala Arg His Pro Glu Ala Val Thr Val
                165                 170                 175
Val Thr Gly Ile Val Gly Cys Ala Gly Leu Lys Pro Thr Val Ala Ala
            180                 185                 190
Ile Glu Ala Gly Lys Asp Ile Ala Leu Ala Asn Lys Glu Thr Leu Ile
        195                 200                 205
Ala Gly Gly Pro Phe Val Leu Pro Leu Ala Asn Lys His Asn Val Lys
    210                 215                 220
Ile Leu Pro Ala Asp Ser Glu His Ser Ala Ile Phe Gln Cys Ile Gln
225                 230                 235                 240
Gly Leu Pro Glu Gly Ala Leu Arg Lys Ile Ile Leu Thr Ala Ser Gly
            245                 250                     255
Gly Ala Phe Arg Asp Trp Pro Val Glu Lys Leu Lys Glu Val Lys Val
            260                 265                 270
Ala Asp Ala Leu Lys His Pro Asn Trp Asn Met Gly Lys Lys Ile Thr
        275                 280                 285
Val Asp Ser Ala Thr Leu Phe Asn Lys Gly Leu Glu Val Ile Glu Ala
    290                 295                 300
His Tyr Leu Phe Gly Ala Glu Tyr Asp Asp Ile Glu Ile Val Ile His
305                 310                 315                 320
Pro Gln Ser Ile Ile His Ser Met Ile Glu Thr Gln Asp Ser Ser Val
            325                     330                 335
Leu Ala Gln Leu Gly Trp Pro Asp Met Arg Leu Pro Ile Leu Tyr Thr
            340                 345                 350
Met Ser Trp Pro Asp Arg Val Pro Cys Ser Glu Val Thr Trp Pro Arg
        355                 360                 365
Leu Asp Leu Cys Lys Leu Gly Ser Leu Thr Phe Lys Lys Pro Asp Asn
    370                 375                     380
Val Lys Tyr Pro Ser Met Asp Leu Ala Tyr Ala Ala Gly Arg Ala Gly
385                 390         395                         400
Gly Thr Met Thr Gly Val Leu Ser Ala Ala Asn Glu Lys Ala Val Glu
                405             410                     415
Met Phe Ile Asp Glu Lys Ile Ser Tyr Leu Asp Ile Phe Lys Val Val
            420                 425                 430
Glu Leu Thr Cys Asp Lys His Arg Asn Glu Leu Val Thr Ser Pro Ser
        435                 440                 445
Leu Glu Glu Ile Val His Tyr Asp Leu Trp Ala Arg Glu Tyr Ala Ala
    450                 455                 460
Asn Val Gln Leu Ser Ser Gly Ala Arg Pro Val His Ala
465                 470                 475
<210>15
<211>884
<212>DNA
<213>巴勒斯提纳侧金盏花克隆ApIPI28
<220>
<221>CDS
<222>(180)..(884)
<223>
<400>15
cgtcgatcag gattaatcct ttatatagta tcttctccac caccactaaa acattatcag       60
cttcgtgttc ttctcccgct gttcatcttc agcagcgttg tcgtactctt tctatttctt      120
cttccatcac taacagtcct cgccgagggt tgaatcggct gttcgcctca acgtcgact       179
atg ggt gaa gtc gct gat gct ggt atg gat gcc gtc cag aag cgg ctt        227
Met Gly Glu Val Ala Asp Ala Gly Met Asp Ala Val Gln Lys Arg Leu
1               5                   10                  15
atg ttc gac gat gaa tgt att ttg gtg gat gag aat gac aag gtc gtc        275
Met Phe Asp Asp Glu Cys Ile Leu Val Asp Glu Asn Asp Lys Val Val
        20                      25                  30
gga cat gat tcc aaa tac aac tgt cat ttg atg gaa aag ata gag gca        323
Gly His Asp Ser Lys Tyr Asn Cys His Leu Met Glu Lys Ile Glu Ala
        35                  40                  45
gaa aac ttg ctt cac aga gcc ttc agt gtt ttc tta ttc aac tca aaa        37l
Glu Asn Leu Leu His Arg Ala Phe Ser Val Phe Leu Phe Asn Ser Lys
    50                  55                  60
tac gag ttg ctt ctt cag caa cga tct gca acg aag gta aca ttc ccg        419
Tyr Glu Leu Leu Leu Gln Gln Arg Ser Ala Thr Lys Val Thr Phe Pro
65                  70                  75                  80
ctc gta tgg aca aac acc tgt tgc agc cat ccc ctc ttc cgt gat tcc        467
Leu Val Trp Thr Asn Thr Cys Cys Ser His Pro Leu Phe Arg Asp Ser
                85                  90                  95
gaa ctc ata gaa gaa aat ttt ctc ggg gta cga aac gct gca caa agg        515
Glu Leu Ile Glu Glu Asn Phe Leu Gly Val Arg Asn Ala Ala Gln Arg
            100                 105                 1l0
aag ctt tta gac gag cta ggc att cca gct gaa gac gta cca gtt gat        563
Lys Leu Leu Asp Glu Leu Gly Ile Pro Ala Glu Asp Val Pro Val Asp
        115                 120                 125
gaa ttc act cct ctt ggt cgc att ctt tac aaa gct cca tct gac gga        611
Glu Phe Thr Pro Leu Gly Arg Ile Leu Tyr Lys Ala Pro Ser Asp Gly
    130                 135                 140
aaa tgg gga gag cac gaa ctg gac tat ctt ctg ttt att gtc cga gat        659
Lys Trp Gly Glu His Glu Leu Asp Tyr Leu Leu Phe Ile Val Arg Asp
145                 150             155                     160
gtg aaa tac gat cca aac cca gat gaa gtt gct gac gct aag tac gtt        707
Val Lys Tyr Asp Pro Asn Pro Asp Glu Val Ala Asp Ala Lys Tyr Val
                165                 170                 175
aat cgc gag gag ttg aaa gag ata ctg aga aaa gct gat gca ggt gaa        755
Asn Arg Glu Glu Leu Lys Glu Ile Leu Arg Lys Ala Asp Ala Gly Glu
            180                 185                 190
gag gga ata aag ttg tct cct tgg ttt aga ttg gtt gtg gat aac ttt        803
Glu Gly Ile Lys Leu Ser Pro Trp Phe Arg Leu Val Val Asp Asn Phe
        195                 200             205
ttg ttc aag tgg tgg gat cat gta gag gag ggg aag att aag gac gtc        851
Leu Phe Lys Trp Trp Asp His Val Glu Glu Gly Lys Ile Lys Asp Val
    2l0                 215                 220
gcc gac atg aaa act atc cac aag ttg act taa                            884
Ala Asp Met Lys Thr Ile His Lys Leu Thr
225                 230
<210>16
<211>234
<212>PRT
<213>巴勒斯提纳侧金盏花克隆ApIPI28
<400>16
Met Gly Glu Val Ala Asp Ala Gly Met Asp Ala Val Gln Lys Arg Leu
1               5                   10                  15
Met Phe Asp Asp Glu Cys Ile Leu Val Asp Glu Asn Asp Lys Val Val
        20                      25                  30
Gly His Asp Ser Lys Tyr Asn Cys His Leu Met Glu Lys Ile Glu Ala
        35                  40                  45
Glu Asn Leu Leu His Arg Ala Phe Ser Val Phe Leu Phe Asn Ser Lys
    50                  55                  60
Tyr Glu Leu Leu Leu Gln Gln Arg Ser Ala Thr Lys Val Thr Phe Pro
65                  70                  75                  80
Leu Val Trp Thr Asn Thr Cys Cys Ser His Pro Leu Phe Arg Asp Ser
                85                  90                  95
Glu Leu Ile Glu Glu Asn Phe Leu Gly Val Arg Asn Ala Ala Gln Arg
            100                 105                 110
Lys Leu Leu Asp Glu Leu Gly Ile Pro Ala Glu Asp Val Pro Val Asp
        115                 120                 125
Glu Phe Thr Pro Leu Gly Arg Ile Leu Tyr Lys Ala Pro Ser Asp Gly
    130                 135                 140
Lys Trp Gly Glu His Glu Leu Asp Tyr Leu Leu Phe Ile Val Arg Asp
145                 150             155                     160
Val Lys Tyr Asp Pro Asn Pro Asp Glu Val Ala Asp Ala Lys Tyr Val
                165                 170                 175
Asn Arg Glu Glu Leu Lys Glu Ile Leu Arg Lys Ala Asp Ala Gly Glu
            180                 185                 190
Glu Gly Ile Lys Leu Ser Pro Trp Phe Arg Leu Val Val Asp Asn Phe
        195                 200                 205
Leu Phe Lys Trp Trp Asp His Val Glu Glu Gly Lys Ile Lys Asp Val
    210                 215                 220
Ala Asp Met Lys Thr Ile His Lys Leu Thr
225                 230
<210>17
<211>1402
<212>DNA
<213>拟南芥
<220>
<221>CDS
<222>(52)..(1317)
<223>
<400>17
aagtctttgc ctctttggtt tactttcctc tgttttcgat ccatttagaa a atg tta       57
                                                         Met Leu
                                                         1
ttc acg agg agt gtt gct cgg att tct tct aag ttt ctg aga aac cgt        105
Phe Thr Arg Ser Val Ala Arg Ile Ser Ser Lys Phe Leu Arg Asn Arg
        5                   10                  15
agc ttc tat ggc tcc tct caa tct ctc gcc tct cat cgg ttc gca atc        153
Ser Phe Tyr Gly Ser Ser Gln Ser Leu Ala Ser His Arg Phe Ala Ile
    20                  25                  30
att ccc gat cag ggt cac tct tgt tct gac tct cca cac aag ggt tac        201
Ile Pro Asp Gln Gly His Ser Cys Ser Asp Ser Pro His Lys Gly Tyr
35                  40          45                          50
gtt tgc aga aca act tat tca ttg aaa tct ccg gtt ttt ggt gga ttt        249
Val Cys Arg Thr Thr Tyr Ser Leu Lys Ser Pro Val Phe Gly Gly Phe
                55                  60                  65
agt cat caa ctc tat cac cag agt agc tcc ttg gtt gag gag gag ctt        297
Ser His Gln Leu Tyr His Gln Ser Ser Ser Leu Val Glu Glu Glu Leu
            70                  75                  80
gac cca ttt tcg ctt gtt gcc gat gag ctg tca ctt ctt agt aat aag        345
Asp Pro Phe Ser Leu Val Ala Asp Glu Leu Ser Leu Leu Ser Asn Lys
        85                  90                  95
ttg aga gag atg gta ctt gcc gag gtt cca aag ctt gcc tct gct gct        393
Leu Arg Glu Met Val Leu Ala Glu Val Pro Lys Leu Ala Ser Ala Ala
    100                 105                 110
gag tac ttc ttc aaa agg ggt gtg caa gga aaa cag ttt cgt tca act        441
Glu Tyr Phe Phe Lys Arg Gly Val Gln Gly Lys Gln Phe Arg Ser Thr
115                 120                 125                 130
att ttg ctg ctg atg gcg aca gct ctg gat gta cga gtt cca gaa gca        489
Ile Leu Leu Leu Met Ala Thr Ala Leu Asp Val Arg Val Pro Glu Ala
                135                 140                 145
ttg att ggg gaa tca aca gat ata gtc aca tca gaa tta cgc gta agg        537
Leu Ile Gly Glu Ser Thr Asp Ile Val Thr Ser Glu Leu Arg Val Arg
            150                 155                 160
caa cgg ggt att gct gaa atc act gaa atg ata cac gtc gca agt cta        585
Gln Arg Gly Ile Ala Glu Ile Thr Glu Met Ile His Val Ala Ser Leu
        165                 170                 175
ctg cac gat gat gtc ttg gat gat gcc gat aca agg cgt ggt gtt ggt        633
Leu His Asp Asp Val Leu Asp Asp Ala Asp Thr Arg Arg Gly Val Gly
    180                 185                 190
tcc tta aat gtt gta atg ggt aac aag atg tcg gta tta gca gga gac         681
Ser Leu Asn Val Val Met Gly Asn Lys Met Ser Val Leu Ala Gly Asp
195                 200             205                     210
ttc ttg ctc tcc cgg gct tgt ggg gct ctc gct gct tta aag aac aca         729
Phe Leu Leu Ser Arg Ala Cys Gly Ala Leu Ala Ala Leu Lys Asn Thr
                215                 220                 225
gag gtt gta gca tta ctt gca act gct gta gaa cat ctt gtt acc ggt         777
Glu Val Val Ala Leu Leu Ala Thr Ala Val Glu His Leu Val Thr Gly
            230                 235                 240
gaa acc atg gag ata act agt tca acc gag cag cgt tat agt atg gac         825
Glu Thr Met Glu Ile Thr Ser Ser Thr Glu Gln Arg Tyr Ser Met Asp
        245             250                     255
tac tac atg cag aag aca tat tat aag aca gca tcg cta atc tct aac         873
Tyr Tyr Met Gln Lys Thr Tyr Tyr Lys Thr Ala Ser Leu Ile Ser Asn
    260                 265                 270
agc tgc aaa gct gtt gcc gtt ctc act gga caa aca gca gaa gtt gcc         921
Ser Cys Lys Ala Val Ala Val Leu Thr Gly Gln Thr Ala Glu Val Ala
275                 280                 285                 290
gtg tta gct ttt gag tat ggg agg aat ctg ggt tta gca ttc caa tta         969
Val Leu Ala Phe Glu Tyr Gly Arg Asn Leu Gly Leu Ala Phe Gln Leu
                295                 300                 305
ata gac gac att ctt gat ttc acg ggc aca tct gcc tct ctc gga aag        1017
Ile Asp Asp Ile Leu Asp Phe Thr Gly Thr Ser Ala Ser Leu Gly Lys
            310                 315                 320
gga tcg ttg tca gat att cgc cat gga gtc ata aca gcc cca atc ctc        1065
Gly Ser Leu Ser Asp Ile Arg His Gly Val Ile Thr Ala Pro Ile Leu
        325                 330                 335
ttt gcc atg gaa gag ttt cct caa cta cgc gaa gtt gtt gat caa gtt        1113
Phe Ala Met Glu Glu Phe Pro Gln Leu Arg Glu Val Val Asp Gln Val
    340                 345                 350
gaa aaa gat cct agg aat gtt gac att gct tta gag tat ctt ggg aag        1161
Glu Lys Asp Pro Arg Asn Val Asp Ile Ala Leu Glu Tyr Leu Gly Lys
355                 360                 365                 370
agc aag gga ata cag agg gca aga gaa tta gcc atg gaa cat gcg aat        1209
Ser Lys Gly Ile Gln Arg Ala Arg Glu Leu Ala Met Glu His Ala Asn
                375                 380                 385
cta gca gca gct gca atc ggg tct cta cct gaa aca gac aat gaa gat        1257
Leu Ala Ala Ala Ala Ile Gly Ser Leu Pro Glu Thr Asp Asn Glu Asp
            390                 395                 400
gtc aaa aga tcg agg cgg gca ctt att gac ttg acc cat aga gtc atc        1305
Val Lys Arg Ser Arg Arg Ala Leu Ile Asp Leu Thr His Arg Val Ile
        405                 410                 415
acc aga aac aag tgagattaag taatgtttct ctctatacac caaaacattc            1357
Thr Arg Asn Lys
    420
ctcatttcat ttgtaggatt ttgttggtcc aattcgtttc acgaa                      1402
<210>18
<211>422
<212>PRT
<213>拟南芥
<400>18
Met Leu Phe Thr Arg Ser Val Ala Arg Ile Ser Ser Lys Phe Leu Arg
1               5                   10                  15
Asn Arg Ser Phe Tyr Gly Ser Ser Gln Ser Leu Ala Ser His Arg Phe
            20                  25                  30
Ala Ile Ile Pro Asp Gln Gly His Ser Cys Ser Asp Ser Pro His Lys
        35                  40                  45
Gly Tyr Val Cys Arg Thr Thr Tyr Ser Leu Lys Ser Pro Val Phe Gly
    50                  55                  60
Gly Phe Ser His Gln Leu Tyr His Gln Ser Ser Ser Leu Val Glu Glu
65                  70              75                      80
Glu Leu Asp Pro Phe Ser Leu Val Ala Asp Glu Leu Ser Leu Leu Ser
                85                  90                  95
Asn Lys Leu Arg Glu Met Val Leu Ala Glu Val Pro Lys Leu Ala Ser
            100                 105                 110
Ala Ala Glu Tyr Phe Phe Lys Arg Gly Val Gln Gly Lys Gln Phe Arg
        115                 120                 125
Ser Thr Ile Leu Leu Leu Met Ala Thr Ala Leu Asp Val Arg Val Pro
    130                 135                 140
Glu Ala Leu Ile Gly Glu Ser Thr Asp Ile Val Thr Ser Glu Leu Arg
145                 150                 155                 160
Val Arg Gln Arg Gly Ile Ala Glu Ile Thr Glu Met Ile His Val Ala
                165                 170                 175
Ser Leu Leu His Asp Asp Val Leu Asp Asp Ala Asp Thr Arg Arg Gly
            180                 185                 190
Val Gly Ser Leu Asn Val Val Met Gly Asn Lys Met Ser Val Leu Ala
        195                 200                 205
Gly Asp Phe Leu Leu Ser Arg Ala Cys Gly Ala Leu Ala Ala Leu Lys
    210                 215                 220
Asn Thr Glu Val Val Ala Leu Leu Ala Thr Ala Val Glu His Leu Val
225                 230                 235                 240
Thr Gly Glu Thr Met Glu Ile Thr Ser Ser Thr Glu Gln Arg Tyr Ser
                245                 250                 255
Met Asp Tyr Tyr Met Gln Lys Thr Tyr Tyr Lys Thr Ala Ser Leu Ile
            260                 265                 270
Ser Asn Ser Cys Lys Ala Val Ala Val Leu Thr Gly Gln Thr Ala Glu
        275                 280                 285
Val Ala Val Leu Ala Phe Glu Tyr Gly Arg Asn Leu Gly Leu Ala Phe
    290                 295                 300
Gln Leu Ile Asp Asp Ile Leu Asp Phe Thr Gly Thr Ser Ala Ser Leu
305                 310                 315                 320
Gly Lys Gly Ser Leu Ser Asp Ile Arg His Gly Val Ile Thr Ala Pro
                325                 330                 335
Ile Leu Phe Ala Met Glu Glu Phe Pro Gln Leu Arg Glu Val Val Asp
            340             345                     350
Gln Val Glu Lys Asp Pro Arg Asn Val Asp Ile Ala Leu Glu Tyr Leu
        355                 360                 365
Gly Lys Ser Lys Gly Ile Gln Arg Ala Arg Glu Leu Ala Met Glu His
    370                 375                 380
Ala Asn Leu Ala Ala Ala Ala Ile Gly Ser Leu Pro Glu Thr Asp Asn
385                 390                 395                 400
Glu Asp Val Lys Arg Ser Arg Arg Ala Leu Ile Asp Leu Thr His Arg
                        405         410                 415
Val Ile Thr Arg Asn Lys
420
<210>19
<211>1155
<212>DNA
<213>拟南芥
<220>
<221>CDS
<222>(1)..(1155)
<223>
<400>19
atg agt gtg agt tgt tgt tgt agg aat ctg ggc aag aca ata aaa aag        48
Met Ser Val Ser Cys Cys Cys Arg Asn Leu Gly Lys Thr Ile Lys Lys
1               5                   10                  15
gca ata cct tca cat cat ttg cat ctg aga agt ctt ggt ggg agt ctc         96
Ala Ile Pro Ser His His Leu His Leu Arg Ser Leu Gly Gly Ser Leu
            20                  25                  30
tat cgt cgt cgt atc caa agc tct tca atg gag acc gat ctc aag tca        144
Tyr Arg Arg Arg Ile Gln Ser Ser Ser Met Glu Thr Asp Leu Lys Ser
        35                  40                  45
acc ttt ctc aac gtt tat tct gtt ctc aag tct gac ctt ctt cat gac        192
Thr Phe Leu Asn Val Tyr Ser Val Leu Lys Ser Asp Leu Leu His Asp
    50                  55                  60
cct tcc ttc gaa ttc acc aat gaa tct cgt ctc tgg gtt gat cgg atg        240
Pro Ser Phe Glu Phe Thr Asn Glu Ser Arg Leu Trp Val Asp Arg Met
65                  70                  75                  80
ctg gac tac aat gta cgt gga ggg aaa ctc aat cgg ggt ctc tct gtt        288
Leu Asp Tyr Asn Val Arg Gly Gly Lys Leu Asn Arg Gly Leu Ser Val
                85                  90                  95
gtt gac agt ttc aaa ctt ttg aag caa ggc aat gat ttg act gag caa        336
Val Asp Ser Phe Lys Leu Leu Lys Gln Gly Asn Asp Leu Thr Glu Gln
            100                 105                 110
gag gtt ttc ctc tct tgt gct ctc ggt tgg tgc att gaa tgg ctc caa        384
Glu Val Phe Leu Ser Cys Ala Leu Gly Trp Cys Ile Glu Trp Leu Gln
        115                 120                 125
gct tat ttc ctt gtg ctt gat gat att atg gat aac tct gtc act cgc        432
Ala Tyr Phe Leu Val Leu Asp Asp Ile Met Asp Asn Ser Val Thr Arg
    130                 135                 140
cgt ggt caa cct tgc tgg ttc aga gtt cct cag gtt ggt atg gtt gcc        480
Arg Gly Gln Pro Cys Trp Phe Arg Val Pro Gln Val Gly Met Val Ala
145                 150                 155                 160
atc aat gat ggg att cta ctt cgc aat cac atc cac agg att ctc aaa        528
Ile Asn Asp Gly Ile Leu Leu Arg Asn His Ile His Arg Ile Leu Lys
                165                 170                 175
aag cat ttc cgt gat aag cct tac tat gtt gac ctt gtt gat ttg ttt        576
Lys His Phe Arg Asp Lys Pro Tyr Tyr Val Asp Leu Val Asp Leu Phe
            180                 185                 190
aat gag gtt gag ttg caa aca gct tgt ggc cag atg ata gat ttg atc        624
Asn Glu Val Glu Leu Gln Thr Ala Cys Gly Gln Met Ile Asp Leu Ile
        195                 200                 205
acc acc ttt gaa gga gaa aag gat ttg gcc aag tac tca ttg tca atc        672
Thr Thr Phe Glu Gly Glu Lys Asp Leu Ala Lys Tyr Ser Leu Ser Ile
    210                 215                 220
cac cgt cgt att gtc cag tac aaa acg gct tat tac tca ttt tat ctc        720
His Arg Arg Ile Val Gln Tyr Lys Thr Ala Tyr Tyr Ser Phe Tyr Leu
225                 230                 235                 240
cct gtt gct tgt gcg ttg ctt atg gcg ggc gaa aat ttg gaa aac cat        768
Pro Val Ala Cys Ala Leu Leu Met Ala Gly Glu Asn Leu Glu Asn His
                245                 250                 255
att gac gtg aaa aat gtt ctt gtt gac atg gga atc tac ttc caa gtg        816
Ile Asp Val Lys Asn Val Leu Val Asp Met Gly Ile Tyr Phe Gln Val
            260                 265                 270
cag gat gat tat ctg gat tgt ttt gct gat ccc gag acg ctt ggc aag        864
Gln Asp Asp Tyr Leu Asp Cys Phe Ala Asp Pro Glu Thr Leu Gly Lys
        275                 280                 285
ata gga aca gat ata gaa gat ttc aaa tgc tcg tgg ttg gtg gtt aag        912
Ile Gly Thr Asp Ile Glu Asp Phe Lys Cys Ser Trp Leu Val Val Lys
    290                 295                 300
gca tta gag cgc tgc agc gaa gaa caa act aag ata tta tat gag aac        960
Ala Leu Glu Arg Cys Ser Glu Glu Gln Thr Lys Ile Leu Tyr Glu Asn
305                 310                 315                 320
tat ggt aaa ccc gac cca tcg aac gtt gct aaa gtg aag gat ctc tac       1008
Tyr Gly Lys Pro Asp Pro Ser Asn Val Ala Lys Val Lys Asp Leu Tyr
                325                 330                 335
aaa gag ctg gat ctt gag gga gtt ttc atg gag tat gag agc aaa agc       1056
Lys Glu Leu Asp Leu Glu Gly Val Phe Met Glu Tyr Glu Ser Lys Ser
            340                 345                 350
tac gag aag ctg act gga gcg att gag gga cac caa agt aaa gca atc        1104
Tyr Glu Lys Leu Thr Gly Ala Ile Glu Gly His Gln Ser Lys Ala Ile
        355                 360                 365
caa gca gtg cta aaa tcc ttc ttg gct aag atc tac aag agg cag aag        1152
Gln Ala Val Leu Lys Ser Phe Leu Ala Lys Ile Tyr Lys Arg Gln Lys
    370                 375                 380
tag                                                                    1155
<210>20
<211>384
<212>PRT
<213>拟南芥
<400>20
Met Ser Val Ser Cys Cys Cys Arg Asn Leu Gly Lys Thr Ile Lys Lys
1               5                   10                  15
Ala Ile Pro Ser His His Leu His Leu Arg Ser Leu Gly Gly Ser Leu
            20                  25                  30
Tyr Arg Arg Arg Ile Gln Ser Ser Ser Met Glu Thr Asp Leu Lys Ser
        35                  40                  45
Thr Phe Leu Asn Val Tyr Ser Val Leu Lys Ser Asp Leu Leu His Asp
    50                  55                  60
Pro Ser Phe Glu Phe Thr Asn Glu Ser Arg Leu Trp Val Asp Arg Met
65                  70                  75                  80
Leu Asp Tyr Asn Val Arg Gly Gly Lys Leu Asn Arg Gly Leu Ser Val
                85                  90                  95
Val Asp Ser Phe Lys Leu Leu Lys Gln Gly Asn Asp Leu Thr Glu Gln
            100                 105                 110
Glu Val Phe Leu Ser Cys Ala Leu Gly Trp Cys Ile Glu Trp Leu Gln
        115                 120                 125
Ala Tyr Phe Leu Val Leu Asp Asp Ile Met Asp Asn Ser Val Thr Arg
    130         135                         140
Arg Gly Gln Pro Cys Trp Phe Arg Val Pro Gln Val Gly Met Val Ala
145                 150                 155                 160
Ile Asn Asp Gly Ile Leu Leu Arg Asn His Ile His Arg Ile Leu Lys
                165                 170                 175
Lys His Phe Arg Asp Lys Pro Tyr Tyr Val Asp Leu Val Asp Leu Phe
            180                 185                 190
Asn Glu Val Glu Leu Gln Thr Ala Cys Gly Gln Met Ile Asp Leu Ile
        195                 200                 205
Thr Thr Phe Glu Gly Glu Lys Asp Leu Ala Lys Tyr Ser Leu Ser Ile
    210                 215                 220
His Arg Arg Ile Val Gln Tyr Lys Thr Ala Tyr Tyr Ser Phe Tyr Leu
225                 230                 235                 240
Pro Val Ala Cys Ala Leu Leu Met Ala Gly Glu Asn Leu Glu Asn His
                245                 250                 255
Ile Asp Val Lys Asn Val Leu Val Asp Met Gly Ile Tyr Phe Gln Val
            260                 265                 270
Gln Asp Asp Tyr Leu Asp Cys Phe Ala Asp Pro Glu Thr Leu Gly Lys
        275                 280                 285
Ile Gly Thr Asp Ile Glu Asp Phe Lys Cys Ser Trp Leu Val Val Lys
    290                 295                 300
Ala Leu Glu Arg Cys Ser Glu Glu Gln Thr Lys Ile Leu Tyr Glu Asn
305                 310                 315                 320
Tyr Gly Lys Pro Asp Pro Ser Asn Val Ala Lys Val Lys Asp Leu Tyr
                325                 330                 335
Lys Glu Leu Asp Leu Glu Gly Val Phe Met Glu Tyr Glu Ser Lys Ser
            340                 345                 350
Tyr Glu Lys Leu Thr Gly Ala Ile Glu Gly His Gln Ser Lys Ala Ile
        355                 360                 365
Gln Ala Val Leu Lys Ser Phe Leu Ala Lys Ile Tyr Lys Arg Gln Lys
    370                 375                 380
<210>21
<211>1101
<212>DNA
<213>Sinabs alba
<220>
<221>CDS
<222>(1)..(1101)
<223>
<400>21
atg gct tct tca gtg act cct cta ggt tca tgg gtt ctt ctt cac cat        48
Met Ala Ser Ser Val Thr Pro Leu Gly Ser Trp Val Leu Leu His His
1               5                   10                  15
cat cct tca act atc tta acc caa tcc aga tcc aga tct cct cct tct        96
His Pro Ser Thr Ile Leu Thr Gln Ser Arg Ser Arg Ser Pro Pro Ser
            20                  25                  30
ctc atc acc ctt aaa ccc atc tcc ctc act cca aaa cgc acc gtt tcg        144
Leu Ile Thr Leu Lys Pro Ile Ser Leu Thr Pro Lys Arg Thr Val Ser
        35                  40                  45
tct tct tcc tcc tct tcc ctc atc acc aaa gaa gac aac aac ctc aaa        192
Ser Ser Ser Ser Ser Ser Leu Ile Thr Lys Glu Asp Asn Asn Leu Lys
    50                  55                  60
tcc tct tcc tct tcc ttc gat ttc atg tct tac atc atc cgc aaa gcc        240
Ser Ser Ser Ser Ser Phe Asp Phe Met Ser Tyr Ile Ile Arg Lys Ala
65                          70          75                  80
gac tcc gtc aac aaa gcc tta gac tcc gcc gtc cct ctc cgg gag cca        288
Asp Ser Val Asn Lys Ala Leu Asp Ser Ala Val Pro Leu Arg Glu Pro
                85                  90                  95
ctc aag atc cac gaa gcg atg cgt tac tct ctc ctc gcc gga gga aaa        336
Leu Lys Ile His Glu Ala Met Arg Tyr Ser Leu Leu Ala Gly Gly Lys
            100                 105                 110
cgc gtc aga cca gtt ctc tgc atc gcc gcg tgc gag cta gtc gga gga        384
Arg Val Arg Pro Val Leu Cys Ile Ala Ala Cys Glu Leu Val Gly Gly
        115                 120                 125
gaa gag tct tta gct atg ccg gcg cgt tgc gcc gtg gaa atg atc cac        432
Glu Glu Ser Leu Ala Met Pro Ala Arg Cys Ala Val Glu Met Ile His
    130                 135                 140
acc atg tcg ttg atc cac gac gac ttg cct tgt atg gat aac gac gat        480
Thr Met Ser Leu Ile His Asp Asp Leu Pro Cys Met Asp Asn Asp Asp
145                 150                 155                 160
ctc cgc cgc gga aag ccc acg aat cac aaa gtt tac ggc gaa gac gtg        528
Leu Arg Arg Gly Lys Pro Thr Asn His Lys Val Tyr Gly Glu Asp Val
                165                 170                 175
gcg gtt tta gcc gga gac gcg ctt ctt tcg ttc gcc ttc gag cat tta        576
Ala Val Leu Ala Gly Asp Ala Leu Leu Ser Phe Ala Phe Glu His Leu
            180                 185                 190
gcg tcg gct acg agc tcg gag gtt tct ccg gcg aga gtg gtt aga gct        624
Ala Ser Ala Thr Ser Ser Glu Val Ser Pro Ala Arg Val Val Arg Ala
        195                 200                 205
gtg gga gag ttg gct aaa gcc atc ggc acc gaa ggg ctc gtg gcg gga        672
Val Gly Glu Leu Ala Lys Ala Ile Gly Thr Glu Gly Leu Val Ala Gly
    210                 215                 220
caa gtg gtg gat ata agc agt gaa ggg ttg gac tta aac aac gtc gga        720
Gln Val Val Asp Ile Ser Ser Glu Gly Leu Asp Leu Asn Asn Val Gly
225                 230                 235                 240
ttg gag cat ttg aag ttt ata cat ttg cat aaa acg gcg gcg ttg ctt        768
Leu Glu His Leu Lys Phe Ile His Leu His Lys Thr Ala Ala Leu Leu
                245                 250                 255
gaa gct tca gcg gtt ttg ggt ggg atc atc ggt gga ggg agt gat gaa        816
Glu Ala Ser Ala Val Leu Gly Gly Ile Ile Gly Gly Gly Ser Asp Glu
            260                 265                 270
gag atc gag agg ctg agg aag ttc gcg agg tgt att ggg ttg ttg ttt        864
Glu Ile Glu Arg Leu Arg Lys Phe Ala Arg Cys Ile Gly Leu Leu Phe
        275                 280                 285
cag gtg gtt gat gat atc ttg gac gtg acg aaa tcg tct caa gaa ctg        912
Gln Val Val Asp Asp Ile Leu Asp Val Thr Lys Ser Ser Gln Glu Leu
    290                 295                 300
ggg aaa acc gct ggg aaa gat ttg att gct gat aag ttg act tat ccg        960
Gly Lys Thr Ala Gly Lys Asp Leu Ile Ala Asp Lys Leu Thr Tyr Pro
305                 310                 315                 320
aag ctc atg ggt ttg gag aaa tcg aga gag ttc gct gag aag ttg aat       1008
Lys Leu Met Gly Leu Glu Lys Ser Arg Glu Phe Ala Glu Lys Leu Asn
                325                 330                 335
aca gag gca cgt gat cag ctt tta ggg ttt gat tcc gac aag gtt gct       1056
Thr Glu Ala Arg Asp Gln Leu Leu Gly Phe Asp Ser Asp Lys Val Ala
            340                 345                 350
cct ttg ttg gct ttg gct aat tac att gcc aat aga cag aac tga           1101
Pro Leu Leu Ala Leu Ala Asn Tyr Ile Ala Asn Arg Gln Asn
        355                 360                 365
<210>22
<211>366
<212>PRT
<213>Sinabs alba
<400>22
Met Ala Ser Ser Val Thr Pro Leu Gly Ser Trp Val Leu Leu His His
1               5                   10                  15
His Pro Ser Thr Ile Leu Thr Gln Ser Arg Ser Arg Ser Pro Pro Ser
            20                  25                  30
Leu Ile Thr Leu Lys Pro Ile Ser Leu Thr Pro Lys Arg Thr Val Ser
        35                  40                  45
Ser Ser Ser Ser Ser Ser Leu Ile Thr Lys Glu Asp Asn Asn Leu Lys
    50                  55                  60
Ser Ser Ser Ser Ser Phe Asp Phe Met Ser Tyr Ile Ile Arg Lys Ala
65                  70                  75                  80
Asp Ser Val Asn Lys Ala Leu Asp Ser Ala Val Pro Leu Arg Glu Pro
                85                  90                  95
Leu Lys Ile His Glu Ala Met Arg Tyr Ser Leu Leu Ala Gly Gly Lys
            100                 105                 110
Arg Val Arg Pro Val Leu Cys Ile Ala Ala Cys Glu Leu Val Gly Gly
        115                 120                 125
Glu Glu Ser Leu Ala Met Pro Ala Arg Cys Ala Val Glu Met Ile His
    130                 135                 140
Thr Met Ser Leu Ile His Asp Asp Leu Pro Cys Met Asp Asn Asp Asp
145                 150                 155                 160
Leu Arg Arg Gly Lys Pro Thr Asn His Lys Val Tyr Gly Glu Asp Val
                165                 170                 175
Ala Val Leu Ala Gly Asp Ala Leu Leu Ser Phe Ala Phe Glu His Leu
            180                 185                 190
Ala Ser Ala Thr Ser Ser Glu Val Ser Pro Ala Arg Val Val Arg Ala
        195                 200                 205
Val Gly Glu Leu Ala Lys Ala Ile Gly Thr Glu Gly Leu Val Ala Gly
    210                 215                 220
Gln Val Val Asp Ile Ser Ser Glu Gly Leu Asp Leu Asn Asn Val Gly
225                 230                 235                 240
Leu Glu His Leu Lys Phe Ile His Leu His Lys Thr Ala Ala Leu Leu
                245                 250                 255
Glu Ala Ser Ala Val Leu Gly Gly Ile Ile Gly Gly Gly Ser Asp Glu
            260                 265                 270
Glu Ile Glu Arg Leu Arg Lys Phe Ala Arg Cys Ile Gly Leu Leu Phe
        275                 280                 285
Gln Val Val Asp Asp Ile Leu Asp Val Thr Lys Ser Ser Gln Glu Leu
    290                 295                 300
Gly Lys Thr Ala Gly Lys Asp Leu Ile Ala Asp Lys Leu Thr Tyr Pro
305                 310                 315                 320
Lys Leu Met Gly Leu Glu Lys Ser Arg Glu Phe Ala Glu Lys Leu Asn
                325                 330                 335
Thr Glu Ala Arg Asp Gln Leu Leu Gly Phe Asp Ser Asp Lys Val Ala
            340                 345                 350
Pro Leu Leu Ala Leu Ala Asn Tyr Ile Ala Asn Arg Gln Asn
        355                 360                 365
<210>23
<211>930
<212>DNA
<213>噬夏孢欧文菌
<220>
<221>CDS
<222>(1)..(930)
<223>
<400>23
atg aat aat ccg tcg tta ctc aat cat gcg gtc gaa acg atg gca gtt         48
Met Asn Asn Pro Ser Leu Leu Asn His Ala Val Glu Thr Met Ala Val
1               5                   10                  15
ggc tcg aaa agt ttt gcg aca gcc tca aag tta ttt gat gca aaa acc         96
Gly Ser Lys Ser Phe Ala Thr Ala Ser Lys Leu Phe Asp Ala Lys Thr
            20                  25                  30
cgg cgc agc gta ctg atg ctc tac gcc tgg tgc cgc cat tgt gac gat        144
Arg Arg Ser Val Leu Met Leu Tyr Ala Trp Cys Arg His Cys Asp Asp
        35                  40                  45
gtt att gac gat cag acg ctg ggc ttt cag gcc cgg cag cct gcc tta        192
Val Ile Asp Asp Gln Thr Leu Gly Phe Gln Ala Arg Gln Pro Ala Leu
    50                  55                  60
caa acg ccc gaa caa cgt ctg atg caa ctt gag atg aaa acg cgc cag        240
Gln Thr Pro Glu Gln Arg Leu Met Gln Leu Glu Met Lys Thr Arg Gln
65                  70                  75                  80
gcc tat gca gga tcg cag atg cac gaa ccg gcg ttt gcg gct ttt cag        288
Ala Tyr Ala Gly Ser Gln Met His Glu Pro Ala Phe Ala Ala Phe Gln
                85                  90                  95
gaa gtg gct atg gct cat gat atc gcc ccg gct tac gcg ttt gat cat        336
Glu Val Ala Met Ala His Asp Ile Ala Pro Ala Tyr Ala Phe Asp His
            100                 105                 110
ctg gaa ggc ttc gcc atg gat gta cgc gaa gcg caa tac agc caa ctg        384
Leu Glu Gly Phe Ala Met Asp Val Arg Glu Ala Gln Tyr Ser Gln Leu
        115                 120                 125
gat gat acg ctg cgc tat tgc tat cac gtt gca ggc gtt gtc ggc ttg        432
Asp Asp Thr Leu Arg Tyr Cys Tyr His Val Ala Gly Val Val Gly Leu
    130                 135                 140
atg atg gcg caa atc atg ggc gtg cgg gat aac gcc acg ctg gac cgc        480
Met Met Ala Gln Ile Met Gly Val Arg Asp Asn Ala Thr Leu Asp Arg
145                 150             155                     160
gcc tgt gac ctt ggg ctg gca ttt cag ttg acc aat att gct cgc gat        528
Ala Cys Asp Leu Gly Leu Ala Phe Gln Leu Thr Asn Ile Ala Arg Asp
                165                 170                 175
att gtg gac gat gcg cat gcg ggc cgc tgt tat ctg ccg gca agc tgg        576
Ile Val Asp Asp Ala His Ala Gly Arg Cys Tyr Leu Pro Ala Ser Trp
            180                 185                 190
ctg gag cat gaa ggt ctg aac aaa gag aat tat gcg gca cct gaa aac        624
Leu Glu His Glu Gly Leu Asn Lys Glu Asn Tyr Ala Ala Pro Glu Asn
        195                 200                 205
cgt cag gcg ctg agc cgt atc gcc cgt cgt ttg gtg cag gaa gca gaa        672
Arg Gln Ala Leu Ser Arg Ile Ala Arg Arg Leu Val Gln Glu Ala Glu
    210                 215                 220
cct tac tat ttg tct gcc aca gcc ggc ctg gca ggg ttg ccc ctg cgt        720
Pro Tyr Tyr Leu Ser Ala Thr Ala Gly Leu Ala Gly Leu Pro Leu Arg
225                 230                 235                 240
tcc gcc tgg gca atc gct acg gcg aag cag gtt tac cgg aaa ata ggt        768
Ser Ala Trp Ala Ile Ala Thr Ala Lys Gln Val Tyr Arg Lys Ile Gly
                245                 250                 255
gtc aaa gtt gaa cag gcc ggt cag caa gcc tgg gat cag cgg cag tca        816
Val Lys Val Glu Gln Ala Gly Gln Gln Ala Trp Asp Gln Arg Gln Ser
            260                 265                 270
acg acc acg ccc gaa aaa tta acg ctg ctg ctg gcc gcc tct ggt cag        864
Thr Thr Thr Pro Glu Lys Leu Thr Leu Leu Leu Ala Ala Ser Gly Gln
        275                 280                 285
gcc ctt act tcc cgg atg cgg gct cat cct ccc cgc cct gcg cat ctc        912
Ala Leu Thr Ser Arg Met Arg Ala His Pro Pro Arg Pro Ala His Leu
    290                 295                 300
tgg cag cgc ccg ctc tag                                                930
Trp Gln Arg Pro Leu
305
<210>24
<211>309
<212>PRT
<213>噬夏孢欧文菌
<400>24
Met Asn Asn Pro Ser Leu Leu Asn His Ala Val Glu Thr Met Ala Val
1               5                   10                  15
Gly Ser Lys Ser Phe Ala Thr Ala Ser Lys Leu Phe Asp Ala Lys Thr
            20                  25                  30
Arg Arg Ser Val Leu Met Leu Tyr Ala Trp Cys Arg His Cys Asp Asp
        35                  40                  45
Val Ile Asp Asp Gln Thr Leu Gly Phe Gln Ala Arg Gln Pro Ala Leu
    50                  55                  60
Gln Thr Pro Glu Gln Arg Leu Met Gln Leu Glu Met Lys Thr Arg Gln
65                  70                  75                  80
Ala Tyr Ala Gly Ser Gln Met His Glu Pro Ala Phe Ala Ala Phe Gln
                85                  90                  95
Glu Val Ala Met Ala His Asp Ile Ala Pro Ala Tyr Ala Phe Asp His
            100                 105                 110
Leu Glu Gly Phe Ala Met Asp Val Arg Glu Ala Gln Tyr Ser Gln Leu
        115                 120                 125
Asp Asp Thr Leu Arg Tyr Cys Tyr His Val Ala Gly Val Val Gly Leu
    130                 135                 140
Met Met Ala Gln Ile Met Gly Val Arg Asp Asn Ala Thr Leu Asp Arg
145                 150                 155                 160
Ala Cys Asp Leu Gly Leu Ala Phe Gln Leu Thr Asn Ile Ala Arg Asp
                165                 170                 175
Ile Val Asp Asp Ala His Ala Gly Arg Cys Tyr Leu Pro Ala Ser Trp
        180                     185                 190
Leu Glu His Glu Gly Leu Asn Lys Glu Asn Tyr Ala Ala Pro Glu Asn
        195                 200                 205
Arg Gln Ala Leu Ser Arg Ile Ala Arg Arg Leu Val Gln Glu Ala Glu
    210                 215                 220
Pro Tyr Tyr Leu Ser Ala Thr Ala Gly Leu Ala Gly Leu Pro Leu Arg
225                 230                 235                 240
Ser Ala Trp Ala Ile Ala Thr Ala Lys Gln Val Tyr Arg Lys Ile Gly
                245                 250                 255
Val Lys Val Glu Gln Ala Gly Gln Gln Ala Trp Asp Gln Arg Gln Ser
            260                 265                 270
Thr Thr Thr Pro Glu Lys Leu Thr Leu Leu Leu Ala Ala Ser Gly Gln
        275                 280                 285
Ala Leu Thr Ser Arg Met Arg Ala His Pro Pro Arg Pro Ala His Leu
    290                 295                 300
Trp Gln Arg Pro Leu
305
<210>25
<2l1>1479
<212>DNA
<213>噬夏孢欧文菌
<220>
<221>CDS
<222>(1)..(1479)
<223>
<400>25
atg aaa cca act acg gta att ggt gca ggc ttc ggt ggc ctg gca ctg         48
Met Lys Pro Thr Thr Val Ile Gly Ala Gly Phe Gly Gly Leu Ala Leu
1               5                   10                  15
gca att cgt cta caa gct gcg ggg atc ccc gtc tta ctg ctt gaa caa         96
Ala Ile Arg Leu Gln Ala Ala Gly Ile Pro Val Leu Leu Leu Glu Gln
            20                  25                  30
cgt gat aaa ccc ggc ggt cgg gct tat gtc tac gag gat cag ggg ttt        144
Arg Asp Lys Pro Gly Gly Arg Ala Tyr Val Tyr Glu Asp Gln Gly Phe
        35                  40                  45
acc ttt gat gca ggc ccg acg gtt atc acc gat ccc agt gcc att gaa        192
Thr Phe Asp Ala Gly Pro Thr Val Ile Thr Asp Pro Ser Ala Ile Glu
    50                  55                  60
gaa ctg ttt gca ctg gca gga aaa cag tta aaa gag tat gtc gaa ctg        240
Glu Leu Phe Ala Leu Ala Gly Lys Gln Leu Lys Glu Tyr Val Glu Leu
65                  70                  75                  80
ctg ccg gtt acg ccg ttt tac cgc ctg tgt tgg gag tca ggg aag gtc        288
Leu Pro Val Thr Pro Phe Tyr Arg Leu Cys Trp Glu Ser Gly Lys Val
                85                  90                  95
ttt aat tac gat aac gat caa acc cgg ctc gaa gcg cag att cag cag        336
Phe Asn Tyr Asp Asn Asp Gln Thr Arg Leu Glu Ala Gln Ile Gln Gln
            100                 105                 110
ttt aat ccc cgc gat gtc gaa ggt tat cgt cag ttt ctg gac tat tca        384
Phe Asn Pro Arg Asp Val Glu Gly Tyr Arg Gln Phe Leu Asp Tyr Ser
        115                 120                 125
cgc gcg gtg ttt aaa gaa ggc tat cta aag ctc ggt act gtc cct ttt        432
Arg Ala Val Phe Lys Glu Gly Tyr Leu Lys Leu Gly Thr Val Pro Phe
    130                 135                 140
tta tcg ttc aga gac atg ctt cgc gcc gca cct caa ctg gcg aaa ctg        480
Leu Ser Phe Arg Asp Met Leu Arg Ala Ala Pro Gln Leu Ala Lys Leu
145                 150                 155                 160
cag gca tgg aga agc gtt tac agt aag gtt gcc agt tac atc gaa gat        528
Gln Ala Trp Arg Ser Val Tyr Ser Lys Val Ala Ser Tyr Ile Glu Asp
                165                 170                 175
gaa cat ctg cgc cag gcg ttt tct ttc cac tcg ctg ttg gtg ggc ggc        576
Glu His Leu Arg Gln Ala Phe Ser Phe His Ser Leu Leu Val Gly Gly
            180                 185                 190
aat ccc ttc gcc acc tca tcc att tat acg ttg ata cac gcg ctg gag        624
Asn Pro Phe Ala Thr Ser Ser Ile Tyr Thr Leu Ile His Ala Leu Glu
        195                 200                 205
cgt gag tgg ggc gtc tgg ttt ccg cgt ggc ggc acc ggc gca tta gtt        672
Arg Glu Trp Gly Val Trp Phe Pro Arg Gly Gly Thr Gly Ala Leu Val
    210                 215                 220
cag ggg atg ata aag ctg ttt cag gat ctg ggt ggc gaa gtc gtg tta        720
Gln Gly Met Ile Lys Leu Phe Gln Asp Leu Gly Gly Glu Val Val Leu
225                 230                 235                 240
aac gcc aga gtc agc cat atg gaa acg aca gga aac aag att gaa gcc        768
Asn Ala Arg Val Ser His Met Glu Thr Thr Gly Asn Lys Ile Glu Ala
                245                 250                 255
gtg cat tta gag gac ggt cgc agg ttc ctg acg caa gcc gtc gcg tca        816
Val His Leu Glu Asp Gly Arg Arg Phe Leu Thr Gln Ala Val Ala Ser
            260                 265                 270
aat gca gat gtg gtt cat acc tat cgc gac ctg tta agc cag cac cct        864
Asn Ala Asp Val Val His Thr Tyr Arg Asp Leu Leu Ser Gln His Pro
        275                 280                 285
gcc gcg gtt aag cag tcc aac aaa ctg cag act aag cgc atg agt aac        912
Ala Ala Val Lys Gln Ser Asn Lys Leu Gln Thr Lys Arg Met Ser Asn
    290                 295                 300
tct ctg ttt gtg ctc tat ttt ggt ttg aat cac cat cat gat cag ctc        960
Ser Leu Phe Val Leu Tyr Phe Gly Leu Asn His His His Asp Gln Leu
305                 310                 315                 320
gcg cat cac acg gtt tgt ttc ggc ccg cgt tac cgc gag ctg att gac        1008
Ala His His Thr Val Cys Phe Gly Pro Arg Tyr Arg Glu Leu Ile Asp
                325                 330                 335
gaa att ttt aat cat gat ggc ctc gca gag gac ttc tca ctt tat ctg        1056
Glu Ile Phe Asn His Asp Gly Leu Ala Glu Asp Phe Ser Leu Tyr Leu
            340                 345                 350
cac gcg ccc tgt gtc acg gat tcg tca ctg gcg cct gaa ggt tgc ggc        1104
His Ala Pro Cys Val Thr Asp Ser Ser Leu Ala Pro Glu Gly Cys Gly
        355                 360                 365
agt tac tat gtg ttg gcg ccg gtg ccg cat tta ggc acc gcg aac ctc        1152
Ser Tyr Tyr Val Leu Ala Pro Val Pro His Leu Gly Thr Ala Asn Leu
    370                 375                 380
gac tgg acg gtt gag ggg cca aaa cta cgc gac cgt att ttt gcg tac        1200
Asp Trp Thr Val Glu Gly Pro Lys Leu Arg Asp Arg Ile Phe Ala Tyr
385                 390                 395                 400
ctt gag cag cat tac atg cct ggc tta cgg agt cag ctg gtc acg cac        1248
Leu Glu Gln His Tyr Met Pro Gly Leu Arg Ser Gln Leu Val Thr His
                405                 410                 415
cgg atg ttt acg ccg ttt gat ttt cgc gac cag ctt aat gcc tat cat        1296
Arg Met Phe Thr Pro Phe Asp Phe Arg Asp Gln Leu Asn Ala Tyr His
            420                 425                 430
ggc tca gcc ttt tct gtg gag ccc gtt ctt acc cag agc gcc tgg ttt        1344
Gly Ser Ala Phe Ser Val Glu Pro Val Leu Thr Gln Ser Ala Trp Phe
        435                 440                 445
cgg ccg cat aac cgc gat aaa acc att act aat ctc tac ctg gtc ggc        1392
Arg Pro His Asn Arg Asp Lys Thr Ile Thr Asn Leu Tyr Leu Val Gly
    450                 455                 460
gca ggc acg cat ccc ggc gca ggc att cct ggc gtc atc ggc tcg gca        1440
Ala Gly Thr His Pro Gly Ala Gly Ile Pro Gly Val Ile Gly Ser Ala
465                 470                 475                 480
aaa gcg aca gca ggt ttg atg ctg gag gat ctg ata tga                    1479
Lys Ala Thr Ala Gly Leu Met Leu Glu Asp Leu Ile
                485                 490
<210>26
<211>492
<212>PRT
<213>噬夏孢欧文菌
<400>26
Met Lys Pro Thr Thr Val Ile Gly Ala Gly Phe Gly Gly Leu Ala Leu
1               5                   10                  15
Ala Ile Arg Leu Gln Ala Ala Gly Ile Pro Val Leu Leu Leu Glu Gln
            20                  25                  30
Arg Asp Lys Pro Gly Gly Arg Ala Tyr Val Tyr Glu Asp Gln Gly Phe
        35                  40                  45
Thr Phe Asp Ala Gly Pro Thr Val Ile Thr Asp Pro Ser Ala Ile Glu
    50                  55                  60
Glu Leu Phe Ala Leu Ala Gly Lys Gln Leu Lys Glu Tyr Val Glu Leu
65                  70                  75                  80
Leu Pro Val Thr Pro Phe Tyr Arg Leu Cys Trp Glu Ser Gly Lys Val
                85                  90                  95
Phe Asn Tyr Asp Asn Asp Gln Thr Arg Leu Glu Ala Gln Ile Gln Gln
            100                 105                 110
Phe Asn Pro Arg Asp Val Glu Gly Tyr Arg Gln Phe Leu Asp Tyr Ser
        115                 120                 125
Arg Ala Val phe Lys Glu Gly Tyr Leu Lys Leu Gly Thr Val Pro Phe
    130                 135                 140
Leu Ser Phe Arg Asp Met Leu Arg Ala Ala Pro Gln Leu Ala Lys Leu
145                 150                 155                 160
Gln Ala Trp Arg Ser Val Tyr Ser Lys Val Ala Ser Tyr Ile Glu Asp
                165                 170                 175
Glu His Leu Arg Gln Ala Phe Ser phe His Ser Leu Leu Val Gly Gly
            180                 185                 190
Asn Pro Phe Ala Thr Ser Ser Ile Tyr Thr Leu Ile His Ala Leu Glu
        195                 200                 205
Arg Glu Trp Gly Val Trp Phe pro Arg Gly Gly Thr Gly Ala Leu Val
    210                 215                 220
Gln Gly Met Ile Lys Leu Phe Gln Asp Leu Gly Gly Glu Val Val Leu
225                 230                 235                 240
Asn Ala Arg Val Ser His Met Glu Thr Thr Gly Asn Lys Ile Glu Ala
                245                 250                 255
Val His Leu Glu Asp Gly Arg Arg Phe Leu Thr Gln Ala Val Ala Ser
            260                 265                 270
Asn Ala Asp Val Val His Thr Tyr Arg Asp Leu Leu Ser Gln His Pro
        275                 280                 285
Ala Ala Val Lys Gln Ser Asn Lys Leu Gln Thr Lys Arg Met Ser Asn
    290                 295                 300
Ser Leu Phe Val Leu Tyr Phe Gly Leu Asn His His His Asp Gln Leu
305                 310                 315                 320
Ala His His Thr Val Cys Phe Gly Pro Arg Tyr Arg Glu Leu Ile Asp
                325                 330                 335
Glu Ile Phe Asn His Asp Gly Leu Ala Glu Asp Phe Ser Leu Tyr Leu
            340                 345                 350
His Ala Pro Cys Val Thr Asp Ser Ser Leu Ala Pro Glu Gly Cys Gly
        355                 360                 365
Ser Tyr Tyr Val Leu Ala Pro Val Pro His Leu Gly Thr Ala Asn Leu
    370                 375                 380
Asp Trp Thr Val Glu Gly Pro Lys Leu Arg Asp Arg Ile Phe Ala Tyr
385                 390                 395                 400
Leu Glu Gln His Tyr Met Pro Gly Leu Arg Ser Gln Leu Val Thr His
                405                 410                 415
Arg Met Phe Thr Pro Phe Asp Phe Arg Asp Gln Leu Asn Ala Tyr His
            420                 425                 430
Gly Ser Ala Phe Ser Val Glu Pro Val Leu Thr Gln Ser Ala Trp Phe
        435                 440                 445
Arg Pro His Asn Arg Asp Lys Thr Ile Thr Asn Leu Tyr Leu Val Gly
    450                 455                 460
Ala Gly Thr His Pro Gly Ala Gly Ile Pro Gly Val Ile Gly Ser Ala
465                 470                 475                 480
Lys Ala Thr Ala Gly Leu Met Leu Glu Asp Leu Ile
                485                 490
<210>27
<211>1725
<212>DNA
<213>黄水仙
<220>
<221>CDS
<222>(1)..(1725)
<223>
<400>27
atg gct tct tcc act tgt tta att cat tct tcc tct ttt ggg gtt gga         48
Met Ala Ser Ser Thr Cys Leu Ile His Ser Ser Ser Phe Gly Val Gly
1               5                   10                  15
gga aag aaa gtg aag atg aac acg atg att cga tcg aag ttg ttt tca         96
Gly Lys Lys Val Lys Met Asn Thr Met Ile Arg Ser Lys Leu Phe Ser
            20                  25                  30
att cgg tcg gct ttg gac act aag gtg tct gat atg agc gtc aat gct        144
Ile Arg Ser Ala Leu Asp Thr Lys Val Ser Asp Met Ser Val Asn Ala
        35                  40                  45
cca aaa gga ttg ttt cca cca gag cct gag cac tac agg ggg cca aag        192
Pro Lys Gly Leu Phe Pro Pro Glu Pro Glu His Tyr Arg Gly Pro Lys
    50                  55                  60
ctt aaa gtg gct atc att gga gct ggg ctc gct ggc atg tca act gca        240
Leu Lys Val Ala Ile Ile Gly Ala Gly Leu Ala Gly Met Ser Thr Ala
65                  70                  75                  80
gtg gag ctt ttg gat caa ggg cat gag gtt gac ata tat gaa tcc aga        288
Val Glu Leu Leu Asp Gln Gly His Glu Val Asp Ile Tyr Glu Ser Arg
                85                  90                  95
caa ttt att ggt ggt aaa gtc ggt tct ttt gta gat aag cgt gga aac        336
Gln Phe Ile Gly Gly Lys Val Gly Ser Phe Val Asp Lys Arg Gly Asn
            100                 105                 110
cat att gaa atg gga ctc cat gtg ttt ttt ggt tgc tat aac aat ctt        384
His Ile Glu Met Gly Leu His Val Phe Phe Gly Cys Tyr Asn Asn Leu
        115                 120                 125
ttc aga ctt atg aaa aag gta ggt gca gat gaa aat tta ctg gtg aag        432
Phe Arg Leu Met Lys Lys Val Gly Ala Asp Glu Asn Leu Leu Val Lys
    130                 135                 140
gat cat act cat acc ttt gta aac cga ggt gga gaa att ggt gaa ctt        480
Asp His Thr His Thr Phe Val Asn Arg Gly Gly Glu Ile Gly Glu Leu
145                 150                 155                 160
gat ttc cga ctt ccg atg ggt gca cca tta cat ggt att cgt gca ttt        528
Asp Phe Arg Leu Pro Met Gly Ala Pro Leu His Gly Ile Arg Ala Phe
                165                 170                 175
cta aca act aat caa ctg aag cct tat gat aaa gca agg aat gct gtg        576
Leu Thr Thr Asn Gln Leu Lys Pro Tyr Asp Lys Ala Arg Asn Ala Val
            l80                 185                 190
gct ctt gcc ctt agc cca gtt gta cgt gct ctt att gat cca aat ggt        624
Ala Leu Ala Leu Ser Pro Val Val Arg Ala Leu Ile Asp Pro Asn Gly
        195                 200                 205
gca atg cag gat ata agg aac tta gat aat att agc ttt tct gat tgg        672
Ala Met Gln Asp Ile Arg Asn Leu Asp Asn Ile Ser Phe Ser Asp Trp
    210                 215                 220
ttc tta tcc aaa ggc ggt acc cgc atg agc atc caa agg atg  tgg gat       720
Phe Leu Ser Lys Gly Gly Thr Arg Met Ser Ile Gln Arg Met Trp Asp
225                 230                 235                 240
cca gtt gct tat gcc ctc gga ttt att gac tgt gat aat atc agt gcc        768
Pro Val Ala Tyr Ala Leu Gly Phe Ile Asp Cys Asp Asn Ile Ser Ala
        245                         250                 255
cgt tgt atg ctt act ata ttt tct cta ttt gct act aag aca gaa gct        816
Arg Cys Met Leu Thr Ile Phe Ser Leu Phe Ala Thr Lys Thr Glu Ala
            260                 265                 270
tct ctg ttg cgt atg ttg aag ggt tcg cct gat gtt tac tta agc ggt        864
Ser Leu Leu Arg Met Leu Lys Gly Ser Pro Asp Val Tyr Leu Ser Gly
        275                 280                 285
cct ata aga aag tat att aca gat aaa ggt gga agg ttt cac cta agg        912
Pro Ile Arg Lys Tyr Ile Thr Asp Lys Gly Gly Arg Phe His Leu Arg
    290                 295                 300
tgg ggg tgt aga gag ata ctt tat gat gaa cta tca aat ggc gac aca        960
Trp Gly Cys Arg Glu Ile Leu Tyr Asp Glu Leu Ser Asn Gly Asp Thr
305                 310                 315                 320
tat atc aca ggc att gca atg tcg aag gct acc aat aaa aaa ctt gtg       1008
Tyr Ile Thr Gly Ile Ala Met Ser Lys Ala Thr Asn Lys Lys Leu Val
                325                 330                 335
aaa gct gac gtg tat gtt gca gca tgt gat gtt cct gga ata aaa agg       1056
Lys Ala Asp Val Tyr Val Ala Ala Cys Asp Val Pro Gly Ile Lys Arg
            340                 345                 350
ttg atc cca tcg gag tgg aga gaa tgg gat cta ttt gac aat atc tat       1104
Leu Ile Pro Ser Glu Trp Arg Glu Trp Asp Leu Phe Asp Asn Ile Tyr
        355                 360                 365
aaa cta gtt gga gtt cca gtt gtc act gtt cag ctt agg tac aat ggt    1152
Lys Leu Val Gly Val Pro Val Val Thr Val Gln Leu Arg Tyr Asn Gly
    370                 375                 380
tgg gtg aca gag atg caa gat ctg gaa aaa tca agg cag ttg aga gct    1200
Trp Val Thr Glu Met Gln Asp Leu Glu Lys Ser Arg Gln Leu Arg Ala
385                 390                 395                 400
gca gta gga ttg gat aat ctt ctt tat act cca gat gca gac ttt tct    1248
Ala Val Gly Leu Asp Asn Leu Leu Tyr Thr Pro Asp Ala Asp Phe Ser
                405                 410                 415
tgt ttt tct gat ctt gca ctc tcg tcg cct gaa gat tat tat att gaa    1296
Cys Phe Ser Asp Leu Ala Leu Ser Ser Pro Glu Asp Tyr Tyr Ile Glu
            420                 425                 430
gga caa ggg tcc cta ata cag gct gtt ctc acg cca ggg gat cca tac    1344
Gly Gln Gly Ser Leu Ile Gln Ala Val Leu Thr Pro Gly Asp Pro Tyr
        435                 440                 445
atg ccc cta cct aat gat gca att ata gaa aga gtt cgg aaa cag gtt    1392
Met Pro Leu Pro Asn Asp Ala Ile Ile Glu Arg Val Arg Lys Gln Val
    450                 455                 460
ttg gat tta ttc cca tcc tct caa ggc ctg gaa gtt cta tgg tct tcg    1440
Leu Asp Leu Phe Pro Ser Ser Gln Gly Leu Glu Val Leu Trp Ser Ser
465                 470                 475                 480
gtg gtt aaa atc gga caa tcc cta tat cgg gag ggg cct gga aag gac    1488
Val Val Lys Ile Gly Gln Ser Leu Tyr Arg Glu Gly Pro Gly Lys Asp
                485                 490                 495
cca ttc aga cct gat cag aag aca cca gta aaa aat ttc ttc ctt gca    1536
Pro Phe Arg Pro Asp Gln Lys Thr Pro Val Lys Asn Phe Phe Leu Ala
            500                 505                 510
ggt tca tac acc aaa cag gat tac att gac agt atg gaa gga gcg acc    1584
Gly Ser Tyr Thr Lys Gln Asp Tyr Ile Asp Ser Met Glu Gly Ala Thr
        515                 520                 525
cta tcg ggg aga caa gca gct gca tat atc tgc agc gcc ggt gaa gat    1632
Leu Ser Gly Arg Gln Ala Ala Ala Tyr Ile Cys Ser Ala Gly Glu Asp
    530                 535                 540
ctg gca gca ctt cgc aag aag atc gct gct gat cat cca gag caa ctg    1680
Leu Ala Ala Leu Arg Lys Lys Ile Ala Ala Asp His Pro Glu Gln Leu
545                 550                 555                 560
atc aac aaa gat tct aac gtg tcg gat gaa ctg agt ctc gta taa    1725
Ile Asn Lys Asp Ser Asn Val Ser Asp Glu Leu Ser Leu Val
                565                 570
<210>28
<211>574
<212>PRT
<213>黄水仙
<400>28
Met Ala Ser Ser Thr Cys Leu Ile His Ser Ser Ser Phe Gly Val Gly
1               5                   10                  15
Gly Lys Lys Val Lys Met Asn Thr Met Ile Arg Ser Lys Leu Phe Ser
            20                  25                  30
Ile Arg Ser Ala Leu Asp Thr Lys Val Ser Asp Met Ser Val Asn Ala
        35                  40                  45
Pro Lys Gly Leu Phe Pro Pro Glu Pro Glu His Tyr Arg Gly Pro Lys
    50                  55                  60
Leu Lys Val Ala Ile Ile Gly Ala Gly Leu Ala Gly Met Ser Thr Ala
65                  70                  75                  80
Val Glu Leu Leu Asp Gln Gly His Glu Val Asp Ile Tyr Glu Ser Arg
                85                  90                  95
Gln Phe Ile Gly Gly Lys Val Gly Ser Phe Val Asp Lys Arg Gly Asn
            100                 105                 110
His Ile Glu Met Gly Leu His Val Phe Phe Gly Cys Tyr Asn Asn Leu
        115                 120                 125
Phe Arg Leu Met Lys Lys Val Gly Ala Asp Glu Asn Leu Leu Val Lys
    130                 135                 140
Asp His Thr His Thr Phe Val Asn Arg Gly Gly Glu Ile Gly Glu Leu
145                 150                 155                 160
Asp Phe Arg Leu Pro Met Gly Ala Pro Leu His Gly Ile Arg Ala Phe
                165                 170                 175
Leu Thr Thr Asn Gln Leu Lys Pro Tyr Asp Lys Ala Arg Asn Ala Val
            180                 185                 190
Ala Leu Ala Leu Ser Pro Val Val Arg Ala Leu Ile Asp Pro Asn Gly
        195                 200                 205
Ala Met Gln Asp Ile Arg Asn Leu Asp Asn Ile Ser Phe Ser Asp Trp
    210                 215                 220
Phe Leu Ser Lys Gly Gly Thr Arg Met Ser Ile Gln Arg Met Trp Asp
225                 230                 235                 240
Pro Val Ala Tyr Ala Leu Gly Phe Ile Asp Cys Asp Asn Ile Ser Ala
                245                 250                 255
Arg Cys Met Leu Thr Ile Phe Ser Leu Phe Ala Thr Lys Thr Glu Ala
            260                 265                 270
Ser Leu Leu Arg Met Leu Lys Gly Ser Pro Asp Val Tyr Leu Ser Gly
        275                 280                 285
Pro Ile Arg Lys Tyr Ile Thr Asp Lys Gly Gly Arg Phe His Leu Arg
    290                 295                 300
Trp Gly Cys Arg Glu Ile Leu Tyr Asp Glu Leu Ser Asn Gly Asp Thr
305                 310                 315                 320
Tyr Ile Thr Gly Ile Ala Met Ser Lys Ala Thr Asn Lys Lys Leu Val
                325                 330                 335
Lys Ala Asp Val Tyr Val Ala Ala Cys Asp Val Pro Gly Ile Lys Arg
            340                 345                 350
Leu Ile Pro Ser Glu Trp Arg Glu Trp Asp Leu Phe Asp Asn Ile Tyr
        355                 360                 365
Lys Leu Val Gly Val Pro Val Val Thr Val Gln Leu Arg Tyr Asn Gly
    370                 375                 380
Trp Val Thr Glu Met Gln Asp Leu Glu Lys Ser Arg Gln Leu Arg Ala
385                 390                 395                 400
Ala Val Gly Leu Asp Asn Leu Leu Tyr Thr Pro Asp Ala Asp Phe Ser
                405                 410                 415
Cys Phe Ser Asp Leu Ala Leu Ser Ser Pro Glu Asp Tyr Tyr Ile Glu
            420                 425                 430
Gly Gln Gly Ser Leu Ile Gln Ala Val Leu Thr Pro Gly Asp Pro Tyr
        435                 440                 445
Met Pro Leu Pro Asn Asp Ala Ile Ile Glu Arg Val Arg Lys Gln Val
    450                 455                 460
Leu Asp Leu Phe Pro Ser Ser Gln Gly Leu Glu Val Leu Trp Ser Ser
465                 470                 475                 480
Val Val Lys Ile Gly Gln Ser Leu Tyr Arg Glu Gly Pro Gly Lys Asp
                485                 490                 495
Pro Phe Arg Pro Asp Gln Lys Thr Pro Val Lys Asn Phe Phe Leu Ala
            500                 505                 510
Gly Ser Tyr Thr Lys Gln Asp Tyr Ile Asp Ser Met Glu Gly Ala Thr
        515                 520                 525
Leu Ser Gly Arg Gln Ala Ala Ala Tyr Ile Cys Ser Ala Gly Glu Asp
    530                 535                 540
Leu Ala Ala Leu Arg Lys Lys Ile Ala Ala Asp His Pro Glu Gln Leu
545                 550                 555                 560
Ile Asn Lys Asp Ser Asn Val Ser Asp Glu Leu Ser Leu Val
                565                 570
<210>29
<211>1848
<212>DNA
<213>食用番茄
<220>
<221>CDS
<222>(1)..(1848)
<223>
<400>29
atg tgt acc ttg agt ttt atg tat cct aat tca ctt ctt gat ggt acc    48
Met Cys Thr Leu Ser Phe Met Tyr Pro Asn Ser Leu Leu Asp Gly Thr
1               5                   10                  15
tgc aag act gta gct ttg ggt gat agc aaa cca aga tac aat aaa cag    96
Cys Lys Thr Val Ala Leu Gly Asp Ser Lys Pro Arg Tyr Asn Lys Gln
            20                  25                  30
aga agt tct tgt ttt gac cct ttg ata att gga aat tgt act gat cag    144
Arg Ser Ser Cys Phe Asp Pro Leu Ile Ile Gly Asn Cys Thr Asp Gln
        35                  40                  45
cag cag ctt tgt ggc ttg agt tgg ggg gtg gac aag gct aag gga aga    192
Gln Gln Leu Cys Gly Leu Ser Trp Gly Val Asp Lys Ala Lys Gly Arg
    50                  55                  60
aga ggg ggt act gtt tcc aat ttg aaa gca gtt gta gat gta gac aaa    240
Arg Gly Gly Thr Val Ser Asn Leu Lys Ala Val Val Asp Val Asp Lys
65                  70                  75                  80
aga gtg gag agc tat ggc agt agt gat gta gaa gga aat gag agt ggc    288
Arg Val Glu Ser Tyr Gly Ser Ser Asp Val Glu Gly Asn Glu Ser Gly
                85                  90                  95
agc tat gat gcc att gtt ata ggt tca gga ata ggt gga ttg gtg gca    336
Ser Tyr Asp Ala Ile Val Ile Gly Ser Gly Ile Gly Gly Leu Val Ala
            100                 105                 110
gcg acg cag ctg gcg gtt aag gga gct aag gtt tta gtt ctg gag aag    384
Ala Thr Gln Leu Ala Val Lys Gly Ala Lys Val Leu Val Leu Glu Lys
        115                 120                 125
tat gtt att cct ggt gga agc tct ggc ttt tac gag agg gat ggt tat    432
Tyr Val Ile Pro Gly Gly Ser Ser Gly Phe Tyr Glu Arg Asp Gly Tyr
    130                 135                 140
aag ttt gat gtt ggt tca tca gtg atg ttt gga ttc agt gat aag gga    480
Lys Phe Asp Val Gly Ser Ser Val Met Phe Gly Phe Ser Asp Lys Gly
145                 150                 155                 160
aac ctc aat tta att act caa gca ttg gca gca gta gga cgt aaa tta    528
Asn Leu Asn Leu Ile Thr Gln Ala Leu Ala Ala Val Gly Arg Lys Leu
                165                 170                 175
gaa gtt ata cct gac cca aca act gta cat ttc cac ctg cca aat gac    576
Glu Val Ile Pro Asp Pro Thr Thr Val His Phe His Leu Pro Asn Asp
            180                 185                 190
ctt tct gtt cgt ata cac cga gag tat gat gac ttc att gaa gag ctt    624
Leu Ser Val Arg Ile His Arg Glu Tyr Asp Asp Phe Ile Glu Glu Leu
        195                 200                 205
gtg agt aaa ttt cca cat gaa aag gaa ggg att atc aaa ttt tac agt    672
Val Ser Lys Phe Pro His Glu Lys Glu Gly Ile Ile Lys Phe Tyr Ser
    210                 215                 220
gaa tgc tgg aag atc ttt aat tct ctg aat tca ttg gaa ctg aag tct    720
Glu Cys Trp Lys Ile Phe Asn Ser Leu Asn Ser Leu Glu Leu Lys Ser
225                 230                 235                 240
ttg gag gaa ccc atc tac ctt ttt ggc cag ttc ttt aag aag ccc ctt    768
Leu Glu Glu Pro Ile Tyr Leu Phe Gly Gln Phe Phe Lys Lys Pro Leu
                245                 250                 255
gaa tgc ttg act ctt gcc tac tat ttg ccc cag aat gct ggt agc atc    816
Glu Cys Leu Thr Leu Ala Tyr Tyr Leu Pro Gln Asn Ala Gly Ser Ile
            260                 265                 270
gct cgg aag tat ata aga gat cct ggg ttg ctg tct ttt ata gat gca    864
Ala Arg Lys Tyr Ile Arg Asp Pro Gly Leu Leu Ser Phe Ile Asp Ala
        275                 280                 285
gag tgc ttt atc gtg agt aca gtt aat gca tta caa aca cca atg atc    912
Glu Cys Phe Ile Val Ser Thr Val Asn Ala Leu Gln Thr Pro Met Ile
    290                 295                 300
aat gca agc atg gtt cta tgt gac aga cat ttt ggc gga atc aac tac    960
Asn Ala Ser Met Val Leu Cys Asp Arg His Phe Gly Gly Ile Asn Tyr
305                 310                 315                 320
ccc gtt ggt gga gtt ggc gag atc gcc aaa tcc tta gca aaa ggc ttg    1008
Pro Val Gly Gly Val Gly Glu Ile Ala Lys Ser Leu Ala Lys Gly Leu
                325                 330                 335
gat gat cac gga agt cag ata ctt tat agg gca aat gtt aca agt atc    1056
Asp Asp His Gly Ser Gln Ile Leu Tyr Arg Ala Asn Val Thr Ser Ile
            340                 345                 350
att ttg gac aat ggc aaa gct gtg gga gtg aag ctt tct gac ggg agg    1104
Ile Leu Asp Asn Gly Lys Ala Val Gly Val Lys Leu Ser Asp Gly Arg
        355                 360                 365
aag ttt tat gct aaa acc ata gta tcg aat gct acc aga tgg gat act    1152
Lys Phe Tyr Ala Lys Thr Ile Val Ser Asn Ala Thr Arg Trp Asp Thr
    370                 375                 380
ttt gga aag ctt tta aaa gct gag aat ctg cca aaa gaa gaa gaa aat    1200
Phe Gly Lys Leu Leu Lys Ala Glu Asn Leu Pro Lys Glu Glu Glu Asn
385                 390                 395                 400
ttc cag aaa gct tat gta aaa gca cct tct ttt ctt tct att cat atg    1248
Phe Gln Lys Ala Tyr Val Lys Ala Pro Ser Phe Leu Ser Ile His Met
                405                 410                 415
gga gtt aaa gca gat gta ctc cca cca gac aca gat tgt cac cat ttt    1296
Gly Val Lys Ala Asp Val Leu Pro Pro Asp Thr Asp Cys His His Phe
            420                 425                 430
gtc ctc gag gat gat tgg aca aat ttg gag aaa cca tat gga agt ata    1344
Val Leu Glu Asp Asp Trp Thr Asn Leu Glu Lys Pro Tyr Gly Ser Ile
        435                 440                 445
ttc ttg agt att cca aca gtt ctt gat tcc tca ttg gcc cca gaa gga    1392
Phe Leu Ser Ile Pro Thr Val Leu Asp Ser Ser Leu Ala Pro Glu Gly
    450                 455                 460
cac cat att ctt cac att ttt aca aca tcg agc att gaa gat tgg gag    1440
His His Ile Leu His Ile Phe Thr Thr Ser Ser Ile Glu Asp Trp Glu
465                 470                 475                 480
gga ctc tct ccg aaa gac tat gaa gcg aag aaa gag gtt gtt gct gaa    1488
Gly Leu Ser Pro Lys Asp Tyr Glu Ala Lys Lys Glu Val Val Ala Glu
                485                 490                 495
agg att ata agc aga ctt gaa aaa aca ctc ttc cca ggg ctt aag tca    1536
Arg Ile Ile Ser Arg Leu Glu Lys Thr Leu Phe Pro Gly Leu Lys Ser
            500                 505                 510
tct att ctc ttt aag gag gtg gga act cca aag acc cac aga cga tac    1584
Ser Ile Leu Phe Lys Glu Val Gly Thr Pro Lys Thr His Arg Arg Tyr
        515                 520                 525
ctt gct cgt gat agt ggt acc tat gga cca atg cca cgc gga aca cct    1632
Leu Ala Arg Asp Ser Gly Thr Tyr Gly Pro Met Pro Arg Gly Thr Pro
    530                 535                 540
aag gga ctc ctg gga atg cct ttc aat acc act gct ata gat ggt cta    1680
Lys Gly Leu Leu Gly Met Pro Phe Asn Thr Thr Ala Ile Asp Gly Leu
545                 550                 555                 560
tat tgt gtt ggc gat agt tgc ttc cca gga caa ggt gtt ata gct gta    1728
Tyr Cys Val Gly Asp Ser Cys Phe Pro Gly Gln Gly Val Ile Ala Val
                565                 570                 575
gcc ttt tca gga gta atg tgc gct cat cgt gtt gca gct gac tta ggg    1776
Ala Phe Ser Gly Val Met Cys Ala His Arg Val Ala Ala Asp Leu Gly
            580                 585                 590
ttt gaa aaa aaa tca gat gtg ctg gac agt gct ctt ctt aga cta ctt    1824
Phe Glu Lys Lys Ser Asp Val Leu Asp Ser Ala Leu Leu Arg Leu Leu
        595                 600                 605
ggt tgg tta agg aca cta gca tga                                    1848
Gly Trp Leu Arg Thr Leu Ala
    610                 615
<210>30
<211>615
<212>PRT
<213>食用番茄
<400>30
Met Cys Thr Leu Ser Phe Met Tyr Pro Asn Ser Leu Leu Asp Gly Thr
1               5                   10                  15
Cys Lys Thr Val Ala Leu Gly Asp Ser Lys Pro Arg Tyr Asn Lys Gln
            20                  25                  30
Arg Ser Ser Cys Phe Asp Pro Leu Ile Ile Gly Asn Cys Thr Asp Gln
        35                  40                  45
Gln Gln Leu Cys Gly Leu Ser Trp Gly Val Asp Lys Ala Lys Gly Arg
    50                  55                  60
Arg Gly Gly Thr Val Ser Asn Leu Lys Ala Val Val Asp Val Asp Lys
65                  70                  75                  80
Arg Val Glu Ser Tyr Gly Ser Ser Asp Val Glu Gly Asn Glu Ser Gly
                85                  90                  95
Ser Tyr Asp Ala Ile Val Ile Gly Ser Gly Ile Gly Gly Leu Val Ala
            100                 105                 110
Ala Thr Gln Leu Ala Val Lys Gly Ala Lys Val Leu Val Leu Glu Lys
        115                 120                 125
Tyr Val Ile Pro Gly Gly Ser Ser Gly Phe Tyr Glu Arg Asp Gly Tyr
    130                 135                 140
Lys Phe Asp Val Gly Ser Ser Val Met Phe Gly Phe Ser Asp Lys Gly
145                 150                 155                 160
Asn Leu Asn Leu Ile Thr Gln Ala Leu Ala Ala Val Gly Arg Lys Leu
                165                 170                 175
Glu Val Ile Pro Asp Pro Thr Thr Val His Phe His Leu Pro Asn Asp
            180                 185                 190
Leu Ser Val Arg Ile His Arg Glu Tyr Asp Asp Phe Ile Glu Glu Leu
        195                 200                 205
Val Ser Lys Phe Pro His Glu Lys Glu Gly Ile Ile Lys Phe Tyr Ser
    210                 215                 220
Glu Cys Trp Lys Ile Phe Asn Ser Leu Asn Ser Leu Glu Leu Lys Ser
225                 230                 235                 240
Leu Glu Glu Pro Ile Tyr Leu Phe Gly Gln Phe Phe Lys Lys Pro Leu
                245                 250                 255
Glu Cys Leu Thr Leu Ala Tyr Tyr Leu Pro Gln Asn Ala Gly Ser Ile
            260                 265                 270
Ala Arg Lys Tyr Ile Arg Asp Pro Gly Leu Leu Ser Phe Ile Asp Ala
        275                 280                 285
Glu Cys Phe Ile Val Ser Thr Val Asn Ala Leu Gln Thr Pro Met Ile
    290                 295                 300
Asn Ala Ser Met Val Leu Cys Asp Arg His Phe Gly Gly Ile Asn Tyr
305                 310                 315                 320
Pro Val Gly Gly Val Gly Glu Ile Ala Lys Ser Leu Ala Lys Gly Leu
                325                 330                 335
Asp Asp His Gly Ser Gln Ile Leu Tyr Arg Ala Asn Val Thr Ser Ile
            340                 345                 350
Ile Leu Asp Asn Gly Lys Ala Val Gly Val Lys Leu Ser Asp Gly Arg
        355                 360                 365
Lys Phe Tyr Ala Lys Thr Ile Val Ser Asn Ala Thr Arg Trp Asp Thr
    370                 375                 380
Phe Gly Lys Leu Leu Lys Ala Glu Asn Leu Pro Lys Glu Glu Glu Asn
385                 390                 395                 400
Phe Gln Lys Ala Tyr Val Lys Ala Pro Ser Phe Leu Ser Ile His Met
                405                 410                 415
Gly Val Lys Ala Asp Val Leu Pro Pro Asp Thr Asp Cys His His Phe
            420                 425                 430
Val Leu Glu Asp Asp Trp Thr Asn Leu Glu Lys Pro Tyr Gly Ser Ile
        435                 440                 445
Phe Leu Ser Ile Pro Thr Val Leu Asp Ser Ser Leu Ala Pro Glu Gly
    450                 455                 460
His His Ile Leu His Ile Phe Thr Thr Ser Ser Ile Glu Asp Trp Glu
465                 470                 475                 480
Gly Leu Ser Pro Lys Asp Tyr Glu Ala Lys Lys Glu Val Val Ala Glu
                485                 490                 495
Arg Ile Ile Ser Arg Leu Glu Lys Thr Leu Phe Pro Gly Leu Lys Ser
            500                 505                 510
Ser Ile Leu Phe Lys Glu Val Gly Thr Pro Lys Thr His Arg Arg Tyr
        515                 520                 525
Leu Ala Arg Asp Ser Gly Thr Tyr Gly Pro Met Pro Arg Gly Thr Pro
    530                 535                 540
Lys Gly Leu Leu Gly Met Pro Phe Asn Thr Thr Ala Ile Asp Gly Leu
545                 550                 555                 560
Tyr Cys Val Gly Asp Ser Cys Phe Pro Gly Gln Gly Val Ile Ala Val
                565                 570                 575
Ala Phe Ser Gly Val Met Cys Ala His Arg Val Ala Ala Asp Leu Gly
            580                 585                 590
Phe Glu Lys Lys Ser Asp Val Leu Asp Ser Ala Leu Leu Arg Leu Leu
        595                 600                 605
Gly Trp Leu Arg Thr Leu Ala
    610                 615
<210>31
<211>1233
<212>DNA
<213>万寿菊
<220>
<221>CDS
<222>(1)..(1233)
<223>
<400>31
atg gcc aca cac aaa ctc ctt caa ttc acc acc aat ctc cca cca tct    48
Met Ala Thr His Lys Leu Leu Gln Phe Thr Thr Asn Leu Pro Pro Ser
1               5                   10                  15
tct tct tca atc tct act ggc tgt tca ctc tcc ccc ttc ttc ctc aaa    96
Ser Ser Ser Ile Ser Thr Gly Cys Ser Leu Ser Pro Phe Phe Leu Lys
            20                  25                  30
tca tct tct cat tcc cct aac cct cgc cga cac cgc cgc tcc gcc gta    144
Ser Ser Ser His Ser Pro Asn Pro Arg Arg His Arg Arg Ser Ala Val
        35                  40                  45
tgc tgc tct ttc gcc tca ctc gac tct gca aaa atc aaa gtc gtt ggc    192
Cys Cys Ser Phe Ala Ser Leu Asp Ser Ala Lys Ile Lys Val Val Gly
    50                  55                  60
gtc ggt ggt ggt ggc aac aat gcc gtt aac cgc atg att ggt agc ggc    240
Val Gly Gly Gly Gly Asn Asn Ala Val Asn Arg Met Ile Gly Ser Gly
65                  70                  75                  80
tta cag ggt gtt gat ttt tac gcc att aac acg gac tca caa gcg ctt    288
Leu Gln Gly Val Asp Phe Tyr Ala Ile Asn Thr Asp Ser Gln Ala Leu
                85                  90                  95
ctg caa tct gtt gca cat aac cct att caa att ggg gag ctt ttg act    336
Leu Gln Ser Val Ala His Asn Pro Ile Gln Ile Gly Glu Leu Leu Thr
            100                 105                 110
cgt gga tta ggt act ggt ggg aac ccg ctt ttg gga gaa cag gct gcg    384
Arg Gly Leu Gly Thr Gly Gly Asn Pro Leu Leu Gly Glu Gln Ala Ala
        115                 120                 125
gag gag tcg aag gaa gcg att ggg aat gcg ctt aaa ggg tcg gat ctt    432
Glu Glu Ser Lys Glu Ala Ile Gly Asn Ala Leu Lys Gly Ser Asp Leu
    130                 135                 140
gtg ttt ata aca gca ggt atg ggt ggt ggg acg ggt tcg ggt gct gct    480
Val Phe Ile Thr Ala Gly Met Gly Gly Gly Thr Gly Ser Gly Ala Ala
145                 150                 155                 160
cca gtt gta gcg cag ata gcg aaa gaa gca ggg tat tta act gtt ggt    528
Pro Val Val Ala Gln Ile Ala Lys Glu Ala Gly Tyr Leu Thr Val Gly
                165                 170                 175
gtt gta acg tac cca ttc agc ttt gaa ggc cgt aaa aga tca gta cag    576
Val Val Thr Tyr Pro Phe Ser Phe Glu Gly Arg Lys Arg Ser Val Gln
            180                 185                 190
gcg tta gag gct att gag aag ctg caa aag aac gtt gac aca ctt ata    624
Ala Leu Glu Ala Ile Glu Lys Leu Gln Lys Asn Val Asp Thr Leu Ile
        195                 200                 205
gtg att cca aat gac cgt ttg ctg gat att gct gat gaa aac acg cct    672
Val Ile Pro Asn Asp Arg Leu Leu Asp Ile Ala Asp Glu Asn Thr Pro
    210                 215                 220
ctt cag gat gct ttt ctt ctt gct gat gat gta ctc cgc caa gga gtt    720
Leu Gln Asp Ala Phe Leu Leu Ala Asp Asp Val Leu Arg Gln Gly Val
225                 230                 235                 240
caa gga atc tca gat ata att aca ata cct ggg ctg gta aat gtg gac    768
Gln Gly Ile Ser Asp Ile Ile Thr Ile Pro Gly Leu Val Asn Val Asp
                245                 250                 255
ttt gca gac gtt aaa gca gtc atg aaa gat tct gga act gca atg ctt    816
Phe Ala Asp Val Lys Ala Val Met Lys Asp Ser Gly Thr Ala Met Leu
            260                 265                 270
ggt gtc ggt gtt tcc tca agt aaa aac cga gct gaa gaa gca gct gaa    864
Gly Val Gly Val Ser Ser Ser Lys Asn Arg Ala Glu Glu Ala Ala Glu
        275                 280                 285
caa gca act ctt gct cct ttg att gga tca tca att caa tct gct aca    912
Gln Ala Thr Leu Ala Pro Leu Ile Gly Ser Ser Ile Gln Ser Ala Thr
    290                 295                 300
ggt gtt gtt tat aat att acc gga ggg aag gac ata act cta caa gaa    960
Gly Val Val Tyr Asn Ile Thr Gly Gly Lys Asp Ile Thr Leu Gln Glu
305                 310                 315                 320
gtc aac agg gtt tct cag gtg gta aca agt ttg gca gat cca tca gca    1008
Val Asn Arg Val Ser Gln Val Val Thr Ser Leu Ala Asp Pro Ser Ala
                325                 330                 335
aac att ata ttc ggg gca gtg gta gat gag aga tac aac ggg gag att    1056
Asn Ile Ile Phe Gly Ala Val Val Asp Glu Arg Tyr Asn Gly Glu Ile
            340                 345                 350
cat gtg acc att gtt gct act ggc ttt gcc cag tcg ttt cag aaa tct    1104
His Val Thr Ile Val Ala Thr Gly Phe Ala Gln Ser Phe Gln Lys Ser
        355                 360                 365
ctt ctt gct gac ccg aaa gga gca aaa ctt gtt gat aga aat caa gaa    1152
Leu Leu Ala Asp Pro Lys Gly Ala Lys Leu Val Asp Arg Asn Gln Glu
    370                 375                 380
cct aca caa cct ttg act tcc gcg aga tct ttg aca aca cct tct cct    1200
Pro Thr Gln Pro Leu Thr Ser Ala Arg Ser Leu Thr Thr Pro Ser Pro
385                 390                 395                 400
gct ccg tct cgg tct agg aaa ctc ttc ttt taa                        1233
Ala Pro Ser Arg Ser Arg Lys Leu Phe Phe
                405                 410
<210>32
<211>410
<212>PRT
<213>万寿菊
<400>32
Met Ala Thr His Lys Leu Leu Gln Phe Thr Thr Asn Leu Pro Pro Ser
1               5                   10                  15
Ser Ser Ser Ile Ser Thr Gly Cys Ser Leu Ser Pro Phe Phe Leu Lys
            20                  25                  30
Ser Ser Ser His Ser Pro Asn Pro Arg Arg His Arg Arg Ser Ala Val
        35                  40                  45
Cys Cys Ser Phe Ala Ser Leu Asp Ser Ala Lys Ile Lys Val Val Gly
    50                  55                  60
Val Gly Gly Gly Gly Asn Asn Ala Val Asn Arg Met Ile Gly Ser Gly
65                  70                  75                  80
Leu Gln Gly Val Asp Phe Tyr Ala Ile Asn Thr Asp Ser Gln Ala Leu
                85                  90                  95
Leu Gln Ser Val Ala His Asn Pro Ile Gln Ile Gly Glu Leu Leu Thr
            100                 105                 110
Arg Gly Leu Gly Thr Gly Gly Asn Pro Leu Leu Gly Glu Gln Ala Ala
        115                 120                 125
Glu Glu Ser Lys Glu Ala Ile Gly Asn Ala Leu Lys Gly Ser Asp Leu
    130                 135                 140
Val Phe Ile Thr Ala Gly Met Gly Gly Gly Thr Gly Ser Gly Ala Ala
145                 150                 155                 160
Pro Val Val Ala Gln Ile Ala Lys Glu Ala Gly Tyr Leu Thr Val Gly
                165                 170                 175
Val Val Thr Tyr Pro Phe Ser Phe Glu Gly Arg Lys Arg Ser Val Gln
            180                 185                 190
Ala Leu Glu Ala Ile Glu Lys Leu Gln Lys Asn Val Asp Thr Leu Ile
        195                 200                 205
Val Ile Pro Asn Asp Arg Leu Leu Asp Ile Ala Asp Glu Asn Thr Pro
    210                 215                 220
Leu Gln Asp Ala Phe Leu Leu Ala Asp Asp Val Leu Arg Gln Gly Val
225                 230                 235                 240
Gln Gly Ile Ser Asp Ile Ile Thr Ile Pro Gly Leu Val Asn Val Asp
                245                 250                 255
Phe Ala Asp Val Lys Ala Val Met Lys Asp Ser Gly Thr Ala Met Leu
            260                 265                 270
Gly Val Gly Val Ser Ser Ser Lys Asn Arg Ala Glu Glu Ala Ala Glu
        275                 280                 285
Gln Ala Thr Leu Ala Pro Leu Ile Gly Ser Ser Ile Gln Ser Ala Thr
    290                 295                 300
Gly Val Val Tyr Asn Ile Thr Gly Gly Lys Asp Ile Thr Leu Gln Glu
305                 310                 315                 320
Val Asn Arg Val Ser Gln Val Val Thr Ser Leu Ala Asp Pro Ser Ala
                325                 330                 335
Asn Ile Ile Phe Gly Ala Val Val Asp Glu Arg Tyr Asn Gly Glu Ile
            340                 345                 350
His Val Thr Ile Val Ala Thr Gly Phe Ala Gln Ser Phe Gln Lys Ser
        355                 360                 365
Leu Leu Ala Asp Pro Lys Gly Ala Lys Leu Val Asp Arg Asn Gln Glu
    370                 375                 380
Pro Thr Gln Pro Leu Thr Ser Ala Arg Ser Leu Thr Thr Pro Ser Pro
385                 390                 395                 400
Ala Pro Ser Arg Ser Arg Lys Leu Phe Phe
                405                 410
<210>33
<211>891
<212>DNA
<213>万寿菊
<220>
<221>CDS
<222>(1)..(891)
<223>
<400>33
atg aca tcc ctg agg ttt cta aca gaa ccc tca ctt gta tgc tca tcc    48
Met Thr Ser Leu Arg Phe Leu Thr Glu Pro Ser Leu Val Cys Ser Ser
1               5                   10                  15
act ttc ccc aca ttc aat ccc cta cac aaa acc cta act aaa cca aca    96
Thr Phe Pro Thr Phe Asn Pro Leu His Lys Thr Leu Thr Lys Pro Thr
            20                  25                  30
cca aaa ccc tac cca aag cca cca cca att cgc tcc gtc ctt caa tac    144
Pro Lys Pro Tyr Pro Lys Pro Pro Pro Ile Arg Ser Val Leu Gln Tyr
        35                  40                  45
aat cgc aaa cca gag ctc gcc gga gac act cca cga gtc gtc gca atc    192
Asn Arg Lys Pro Glu Leu Ala Gly Asp Thr Pro Arg Val Val Ala Ile
    50                  55                  60
gac gcc gac gtt ggt cta cgt aac ctc gat ctt ctt ctc ggt ctc gaa    240
Asp Ala Asp Val Gly Leu Arg Asn Leu Asp Leu Leu Leu Gly Leu Glu
65                  70                  75                  80
aac cgc gtc aat tac acc gtc gtt gaa gtt ctc aac ggc gat tgc aga    288
Asn Arg Val Asn Tyr Thr Val Val Glu Val Leu Asn Gly Asp Cys Arg
                85                  90                  95
ctc gac caa gcc cta gtt cgt gat aaa cgc tgg tca aat ttc gaa ttg    336
Leu Asp Gln Ala Leu Val Arg Asp Lys Arg Trp Ser Asn Phe Glu Leu
            100                 105                 110
ctt tgt att tca aaa cct agg tca aaa ttg cct tta gga ttt ggg gga    384
Leu Cys Ile Ser Lys Pro Arg Ser Lys Leu Pro Leu Gly Phe Gly Gly
        115                 120                 125
aaa gct tta gtt tgg ctt gat gca tta aaa gat agg caa gaa ggt tgc    432
Lys Ala Leu Val Trp Leu Asp Ala Leu Lys Asp Arg Gln Glu Gly Cys
    130                 135                 140
ccg gat ttt ata ctt ata gat tgt cct gca ggt att gat gcc ggg ttc    480
Pro Asp Phe Ile Leu Ile Asp Cys Pro Ala Gly Ile Asp Ala Gly Phe
145                 150                 155                 160
ata acc gcc att aca ccg gct aac gaa gcc gta tta gtt aca aca cct    528
Ile Thr Ala Ile Thr Pro Ala Asn Glu Ala Val Leu Val Thr Thr Pro
                165                 170                 175
gat att act gca ttg aga gat gca gat aga gtt aca ggc ttg ctt gaa    576
Asp Ile Thr Ala Leu Arg Asp Ala Asp Arg Val Thr Gly Leu Leu Glu
            180                 185                 190
tgt gat gga att agg gat att aaa atg att gtg aac aga gtt aga act    624
Cys Asp Gly Ile Arg Asp Ile Lys Met Ile Val Asn Arg Val Arg Thr
        195                 200                 205
gat ttg ata agg ggt gaa gat atg atg tca gtt ctt gat gtt caa gag    672
Asp Leu Ile Arg Gly Glu Asp Met Met Ser Val Leu Asp Val Gln Glu
    210                 215                 220
atg ttg gga ttg tca ttg ttg agt gat acc cga gga ttc gaa gtg att    720
Met Leu Gly Leu Ser Leu Leu Ser Asp Thr Arg Gly Phe Glu Val Ile
225                 230                 235                 240
cgg agt acg aat aga ggg ttt ccg ctt gtg ttg aac aag cct ccg act    768
Arg Ser Thr Asn Arg Gly Phe Pro Leu Val Leu Asn Lys Pro Pro Thr
                245                 250                 255
tta gca gga ttg gca ttt gag cag gct gct tgg aga ttg gtt gag caa    816
Leu Ala Gly Leu Ala Phe Glu Gln Ala Ala Trp Arg Leu Val Glu Gln
            260                 265                 270
gat agc atg aag gct gtg atg gtg gag gaa gaa cct aaa aag agg gga    864
Asp Ser Met Lys Ala Val Met Val Glu Glu Glu Pro Lys Lys Arg Gly
        275                 280                 285
ttt ttc tcg ttt ttt gga ggt tag tga                                891
Phe Phe Ser Phe Phe Gly Gly
    290                 295
<210>34
<211>295
<212>PRT
<213>万寿菊
<400>34
Met Thr Ser Leu Arg Phe Leu Thr Glu Pro Ser Leu Val Cys Ser Ser
1               5                   10                  15
Thr Phe Pro Thr Phe Asn Pro Leu His Lys Thr Leu Thr Lys Pro Thr
            20                  25                  30
Pro Lys Pro Tyr Pro Lys Pro Pro Pro Ile Arg Ser Val Leu Gln Tyr
        35                  40                  45
Asn Arg Lys Pro Glu Leu Ala Gly Asp Thr Pro Arg Val Val Ala Ile
    50                  55                  60
Asp Ala Asp Val Gly Leu Arg Asn Leu Asp Leu Leu Leu Gly Leu Glu
65                  70                  75                  80
Asn Arg Val Asn Tyr Thr Val Val Glu Val Leu Asn Gly Asp Cys Arg
                85                  90                  95
Leu Asp Gln Ala Leu Val Arg Asp Lys Arg Trp Ser Asn Phe Glu Leu
            100                 105                 110
Leu Cys Ile Ser Lys Pro Arg Ser Lys Leu Pro Leu Gly Phe Gly Gly
        115                 120                 125
Lys Ala Leu Val Trp Leu Asp Ala Leu Lys Asp Arg Gln Glu Gly Cys
    130                 135                 140
Pro Asp Phe Ile Leu Ile Asp Cys Pro Ala Gly Ile Asp Ala Gly Phe
145                 150                 155                 160
Ile Thr Ala Ile Thr Pro Ala Asn Glu Ala Val Leu Val Thr Thr Pro
                165                 170                 175
Asp Ile Thr Ala Leu Arg Asp Ala Asp Arg Val Thr Gly Leu Leu Glu
            180                 185                 190
Cys Asp Gly Ile Arg Asp Ile Lys Met Ile Val Asn Arg Val Arg Thr
        195                 200                 205
Asp Leu Ile Arg Gly Glu Asp Met Met Ser Val Leu Asp Val Gln Glu
    210                 215                 220
Met Leu Gly Leu Ser Leu Leu Ser Asp Thr Arg Gly Phe Glu Val Ile
225                 230                 235                 240
Arg Ser Thr Asn Arg Gly Phe Pro Leu Val Leu Asn Lys Pro Pro Thr
                245                 250                 255
Leu Ala Gly Leu Ala Phe Glu Gln Ala Ala Trp Arg Leu Val Glu Gln
            260                 265                 270
Asp Ser Met Lys Ala Val Met Val Glu Glu Glu Pro Lys Lys Arg Gly
        275                 280                 285
Phe Phe Ser Phe Phe Gly Gly
    290                 295
<210>35
<211>1662
<212>DNA
<213>雨生红球藻
<220>
<221>CDS
<222>(168)..(1130)
<223>
<400>35
cggggcaact caagaaattc aacagctgca agcgcgcccc agcctcacag cgccaagtga  60
gctatcgacg tggttgtgag cgctcgacgt ggtccactga cgggcctgtg agcctctgcg  120
ctccgtcctc tgccaaatct cgcgtcgggg cctgcctaag tcgaaga atg cac gtc    176
                                                    Met His Val
                                                    1
gca tcg gca cta atg gtc gag cag aaa ggc agt gag gca gct gct tcc    224
Ala Ser Ala Leu Met Val Glu Gln Lys Gly Ser Glu Ala Ala Ala Ser
    5                   10                  15
agc cca gac gtc ttg aga gcg tgg gcg aca cag tat cac atg cca tcc    272
Ser Pro Asp Val Leu Arg Ala Trp Ala Thr Gln Tyr His Met Pro Ser
20                  25                  30                  35
gag tcg tca gac gca gct cgt cct gcg cta aag cac gcc tac aaa cct    320
Glu Ser Ser Asp Ala Ala Arg Pro Ala Leu Lys His Ala Tyr Lys Pro
                40                  45                  50
cca gca tct gac gcc aag ggc atc acg atg gcg ctg acc atc att ggc    368
Pro Ala Ser Asp Ala Lys Gly Ile Thr Met Ala Leu Thr Ile Ile Gly
            55                  60                  65
acc tgg acc gca gtg ttt tta cac gca ata ttt caa atc agg cta ccg    416
Thr Trp Thr Ala Val Phe Leu His Ala Ile Phe Gln Ile Arg Leu Pro
        70                  75                  80
aca tcc atg gac cag ctt cac tgg ttg cct gtg tcc gaa gcc aca gcc    464
Thr Ser Met Asp Gln Leu His Trp Leu Pro Val Ser Glu Ala Thr Ala
    85                  90                  95
cag ctt ttg ggc gga agc agc agc cta ctg cac atc gct gca gtc ttc    512
Gln Leu Leu Gly Gly Ser Ser Ser Leu Leu His Ile Ala Ala Val Phe
100                 105                 110                 115
att gta ctt gag ttc ctg tac act ggt cta ttc atc acc aca cat gac    560
Ile Val Leu Glu Phe Leu Tyr Thr Gly Leu Phe Ile Thr Thr His Asp
                120                 125                 130
gca atg cat ggc acc ata gct ttg agg cac agg cag ctc aat gat ctc    608
Ala Met His Gly Thr Ile Ala Leu Arg His Arg Gln Leu Asn Asp Leu
            135                 140                 145
ctt ggc aac atc tgc ata tca ctg tac gcc tgg ttt gac tac agc atg    656
Leu Gly Asn Ile Cys Ile Ser Leu Tyr Ala Trp Phe Asp Tyr Ser Met
        150                 155                 160
ctg cat cgc aag cac tgg gag cac cac aac cat act ggc gaa gtg ggg    704
Leu His Arg Lys His Trp Glu His His Asn His Thr Gly Glu Val Gly
    165                 170                 175
aaa gac cct gac ttc cac aag gga aat ccc ggc ctt gtc ccc tgg ttc    752
Lys Asp Pro Asp Phe His Lys Gly Asn Pro Gly Leu Val Pro Trp Phe
180                 185                 190                 195
gcc agc ttc atg tcc agc tac atg tcc ctg tgg cag ttt gcc cgg ctg    800
Ala Ser Phe Met Ser Ser Tyr Met Ser Leu Trp Gln Phe Ala Arg Leu
                200                 205                 210
gca tgg tgg gca gtg gtg atg caa atg ctg ggg gcg ccc atg gca aat    848
Ala Trp Trp Ala Val Val Met Gln Met Leu Gly Ala Pro Met Ala Asn
            215                 220                 225
ctc cta gtc ttc atg gct gca gcc cca atc ttg tca gca ttc cgc ctc    896
Leu Leu Val Phe Met Ala Ala Ala Pro Ile Leu Ser Ala Phe Arg Leu
        230                 235                 240
ttc tac ttc ggc act tac ctg cca cac aag cct gag cca ggc cct gca    944
Phe Tyr Phe Gly Thr Tyr Leu Pro His Lys Pro Glu Pro Gly Pro Ala
    245                 250                 255
gca ggc tct cag gtg atg gcc tgg ttc agg gcc aag aca agt gag gca    992
Ala Gly Ser Gln Val Met Ala Trp Phe Arg Ala Lys Thr Ser Glu Ala
260                 265                 270                 275
tct gat gtg atg agt ttc ctg aca tgc tac cac ttt gac ctg cac tgg    1040
Ser Asp Val Met Ser Phe Leu Thr Cys Tyr His Phe Asp Leu His Trp
                280                 285                 290
gag cac cac agg tgg ccc ttt gcc ccc tgg tgg cag ctg ccc cac tgc    1088
Glu His His Arg Trp Pro Phe Ala Pro Trp Trp Gln Leu Pro His Cys
            295                 300                 305
cgc cgc ctg tcc ggg cgt ggc ctg gtg cct gcc ttg gca tga            1130
Arg Arg Leu Ser Gly Arg Gly Leu Val Pro Ala Leu Ala
        310                 315                 320
cctggtccct ccgctggtga cccagcgtct gcacaagagt gtcatgctac agggtgctgc  1190
ggccagtggc agcgcagtgc actctcagcc tgtatggggc taccgctgtg ccactgagca  1250
ctgggcatgc cactgagcac tgggcgtgct actgagcaat gggcgtgcta ctgagcaatg  1310
ggcgtgctac tgacaatggg cgtgctactg gggtctggca gtggctagga tggagtttga  1370
tgcattcagt agcggtggcc aacgtcatgt ggatggtgga agtgctgagg ggtttaggca  1430
gccggcattt gagagggcta agttataaat cgcatgctgc tcatgcgcac atatctgcac  1490
acagccaggg aaatcccttc gagagtgatt atgggacact tgtattggtt tcgtgctatt  1550
gttttattca gcagcagtac ttagtgaggg tgagagcagg gtggtgagag tggagtgagt  1610
gagtatgaac ctggtcagcg aggtgaacag cctgtaatga atgactctgt ct          1662
<210>36
<211>320
<212>PRT
<213>雨生红球藻
<400>36
Met His Val Ala Ser Ala Leu Met Val Glu Gln Lys Gly Ser Glu Ala
1               5                   10                  15
Ala Ala Ser Ser Pro Asp Val Leu Arg Ala Trp Ala Thr Gln Tyr His
            20                  25                  30
Met Pro Ser Glu Ser Ser Asp Ala Ala Arg Pro Ala Leu Lys His Ala
        35                  40                  45
Tyr Lys Pro Pro Ala Ser Asp Ala Lys Gly Ile Thr Met Ala Leu Thr
    50                  55                  60
Ile Ile Gly Thr Trp Thr Ala Val Phe Leu His Ala Ile Phe Gln Ile
65                  70                  75                  80
Arg Leu Pro Thr Ser Met Asp Gln Leu His Trp Leu Pro Val Ser Glu
                85                  90                  95
Ala Thr Ala Gln Leu Leu Gly Gly Ser Ser Ser Leu Leu His Ile Ala
            100                 105                 110
Ala Val Phe Ile Val Leu Glu Phe Leu Tyr Thr Gly Leu Phe Ile Thr
        115                 120                 125
Thr His Asp Ala Met His Gly Thr Ile Ala Leu Arg His Arg Gln Leu
    130                 135                 140
Asn Asp Leu Leu Gly Asn Ile Cys Ile Ser Leu Tyr Ala Trp Phe Asp
145                 150                 155                 160
Tyr Ser Met Leu His Arg Lys His Trp Glu His His Asn His Thr Gly
                165                 170                 175
Glu Val Gly Lys Asp Pro Asp Phe His Lys Gly Asn Pro Gly Leu Val
            180                 185                 190
Pro Trp Phe Ala Ser Phe Met Ser Ser Tyr Met Ser Leu Trp Gln Phe
        195                 200                 205
Ala Arg Leu Ala Trp Trp Ala Val Val Met Gln Met Leu Gly Ala Pro
    210                 215                 220
Met Ala Asn Leu Leu Val Phe Met Ala Ala Ala Pro Ile Leu Ser Ala
225                 230                 235                 240
Phe Arg Leu Phe Tyr Phe Gly Thr Tyr Leu Pro His Lys Pro Glu Pro
                245                 250                 255
Gly Pro Ala Ala Gly Ser Gln Val Met Ala Trp Phe Arg Ala Lys Thr
            260                 265                 270
Ser Glu Ala Ser Asp Val Met Ser Phe Leu Thr Cys Tyr His Phe Asp
        275                 280                 285
Leu His Trp Glu His His Arg Trp Pro Phe Ala Pro Trp Trp Gln Leu
    290                 295                 300
Pro His Cys Arg Arg Leu Ser Gly Arg Gly Leu Val Pro Ala Leu Ala
305                 310                 315                 320
<210>37
<211>729
<212>DNA
<213>橙黄农杆菌
<220>
<221>CDS
<222>(1)..(729)
<223>
<400>37
atg agc gca cat gcc ctg ccc aag gca gat ctg acc gcc acc agc ctg    48
Met Ser Ala His Ala Leu Pro Lys Ala Asp Leu Thr Ala Thr Ser Leu
1               5                   10                  15
atc gtc tcg ggc ggc atc atc gcc gct tgg ctg gcc ctg cat gtg cat    96
Ile Val Ser Gly Gly Ile Ile Ala Ala Trp Leu Ala Leu His Val His
            20                  25                  30
gcg ctg tgg ttt ctg gac gca gcg gcg cat ccc atc ctg gcg atc gca    144
Ala Leu Trp Phe Leu Asp Ala Ala Ala His Pro Ile Leu Ala Ile Ala
        35                  40                  45
aat ttc ctg ggg ctg acc tgg ctg tcg gtc gga ttg ttc atc atc gcg    192
Asn Phe Leu Gly Leu Thr Trp Leu Ser Val Gly Leu Phe Ile Ile Ala
    50                  55                  60
cat gac gcg atg cac ggg tcg gtg gtg ccg ggg cgt ccg cgc gcc aat    240
His Asp Ala Met His Gly Ser Val Val Pro Gly Arg Pro Arg Ala Asn
65                  70                  75                  80
gcg gcg atg ggc cag ctt gtc ctg tgg ctg tat gcc gga ttt tcg tgg    288
Ala Ala Met Gly Gln Leu Val Leu Trp Leu Tyr Ala Gly Phe Ser Trp
                85                  90                  95
cgc aag atg atc gtc aag cac atg gcc cat cac cgc cat gcc gga acc    336
Arg Lys Met Ile Val Lys His Met Ala His His Arg His Ala Gly Thr
            100                 105                 110
gac gac gac ccc gat ttc gac cat ggc ggc ccg gtc cgc tgg tac gcc    384
Asp Asp Asp Pro Asp Phe Asp His Gly Gly Pro Val Arg Trp Tyr Ala
        115                 120                 125
cgc ttc atc ggc acc tat ttc ggc tgg cgc gag ggg ctg ctg ctg ccc    432
Arg Phe Ile Gly Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro
    130                 135                 140
gtc atc gtg acg gtc tat gcg ctg atc ctt ggg gat cgc tgg atg tac    480
Val Ile Val Thr Val Tyr Ala Leu Ile Leu Gly Asp Arg Trp Met Tyr
145                 150                 155                 160
gtg gtc ttc tgg ccg ctg ccg tcg atc ctg gcg tcg atc cag ctg ttc    528
Val Val Phe Trp Pro Leu Pro Ser Ile Leu Ala Ser Ile Gln Leu Phe
                165                 170                 175
gtg ttc ggc acc tgg ctg ccg cac cgc ccc ggc cac gac gcg ttc ccg    576
Val Phe Gly Thr Trp Leu Pro His Arg Pro Gly His Asp Ala Phe Pro
            180                 185                 190
gac cgc cac aat gcg cgg tcg tcg cgg atc agc gac ccc gtg tcg ctg    624
Asp Arg His Asn Ala Arg Ser Ser Arg Ile Ser Asp Pro Val Ser Leu
        195                 200                 205
ctg acc tgc ttt cac ttt ggc ggt tat cat cac gaa cac cac ctg cac    672
Leu Thr Cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His
    210                 215                 220
ccg acg gtg ccg tgg tgg cgc ctg ccc agc acc cgc acc aag ggg gac    720
Pro Thr Val Pro Trp Trp Arg Leu Pro Ser Thr Arg Thr Lys Gly Asp
225                 230                 235                 240
acc gca tga                                                        729
Thr Ala
<210>38
<211>242
<212>PRT
<213>橙黄农杆菌
<400>38
Met Ser Ala His Ala Leu Pro Lys Ala Asp Leu Thr Ala Thr Ser Leu
1               5                   10                  15
Ile Val Ser Gly Gly Ile Ile Ala Ala Trp Leu Ala Leu His Val His
            20                  25                  30
Ala Leu Trp Phe Leu Asp Ala Ala Ala His Pro Ile Leu Ala Ile Ala
        35                  40                  45
Asn Phe Leu Gly Leu Thr Trp Leu Ser Val Gly Leu Phe Ile Ile Ala
    50                  55                  60
His Asp Ala Met His Gly Ser Val Val Pro Gly Arg Pro Arg Ala Asn
65                  70                  75                  80
Ala Ala Met Gly Gln Leu Val Leu Trp Leu Tyr Ala Gly Phe Ser Trp
                85                  90                  95
Arg Lys Met Ile Val Lys His Met Ala His His Arg His Ala Gly Thr
            100                 105                 110
Asp Asp Asp Pro Asp Phe Asp His Gly Gly Pro Val Arg Trp Tyr Ala
        115                 120                 125
Arg Phe Ile Gly Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro
    130                 135                 140
Val Ile Val Thr Val Tyr Ala Leu Ile Leu Gly Asp Arg Trp Met Tyr
145                 150                 155                 160
Val Val Phe Trp Pro Leu Pro Ser Ile Leu Ala Ser Ile Gln Leu Phe
                165                 170                 175
Val Phe Gly Thr Trp Leu Pro His Arg Pro Gly His Asp Ala Phe Pro
            180                 185                 190
Asp Arg His Asn Ala Arg Ser Ser Arg Ile Ser Asp Pro Val Ser Leu
        195                 200                 205
Leu Thr Cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His
    210                 215                 220
Pro Thr Val Pro Trp Trp Arg Leu Pro Ser Thr Arg Thr Lys Gly Asp
225                 230                 235                 240
Thr Ala
<210>39
<211>1631
<212>DNA
<213>产碱菌属
<220>
<221>CDS
<222>(99)..(827)
<223>
<400>39
ctgcaggccg ggcccggtgg ccaatggtcg caaccggcag gactggaaca ggacggcggg  60
ccggtctagg ctgtcgccct acgcagcagg agtttcgg atg tcc gga cgg aag cct  116
                                          Met Ser Gly Arg Lys Pro
                                          1               5
ggc aca act ggc gac acg atc gtc aat ctc ggt ctg acc gcc gcg atc    164
Gly Thr Thr Gly Asp Thr Ile Val Asn Leu Gly Leu Thr Ala Ala Ile
            10                  15                  20
ctg ctg tgc tgg ctg gtc ctg cac gcc ttt acg cta tgg ttg cta gat    212
Leu Leu Cys Trp Leu Val Leu His Ala Phe Thr Leu Trp Leu Leu Asp
        25                  30                  35
gcg gcc gcg cat ccg ctg ctt gcc gtg ctg tgc ctg gct ggg ctg acc    260
Ala Ala Ala His Pro Leu Leu Ala Val Leu Cys Leu Ala Gly Leu Thr
    40                  45                  50
tgg ctg tcg gtc ggg ctg ttc atc atc gcg cat gac gca atg cac ggg    308
Trp Leu Ser Val Gly Leu Phe Ile Ile Ala His Asp Ala Met His Gly
55                  60                  65                  70
tcc gtg gtg ccg ggg cgg ccg cgc gcc aat gcg gcg atc ggg caa ctg    356
Ser Val Val Pro Gly Arg Pro Arg Ala Asn Ala Ala Ile Gly Gln Leu
                75                  80                  85
gcg ctg tgg ctc tat gcg ggg ttc tcg tgg ccc aag ctg atc gcc aag    404
Ala Leu Trp Leu Tyr Ala Gly Phe Ser Trp Pro Lys Leu Ile Ala Lys
            90                  95                  100
cac atg acg cat cac cgg cac gcc ggc acc gac aac gat ccc gat ttc    452
His Met Thr His His Arg His Ala Gly Thr Asp Asn Asp Pro Asp Phe
        105                 110                 115
ggt cac gga ggg ccc gtg cgc tgg tac ggc agc ttc gtc tcc acc tat    500
Gly His Gly Gly Pro Val Arg Trp Tyr Gly Ser Phe Val Ser Thr Tyr
    120                 125                 130
ttc ggc tgg cga gag gga ctg ctg cta ccg gtg atc gtc acc acc tat    548
Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro Val Ile Val Thr Thr Tyr
135                 140                 145                 150
gcg ctg atc ctg ggc gat cgc tgg atg tat gtc atc ttc tgg ccg gtc    596
Ala Leu Ile Leu Gly Asp Arg Trp Met Tyr Val Ile Phe Trp Pro Val
                155                 160                 165
ccg gcc gtt ctg gcg tcg atc cag att ttc gtc ttc gga act tgg ctg    644
Pro Ala Val Leu Ala Ser Ile Gln Ile Phe Val Phe Gly Thr Trp Leu
            170                 175                 180
ccc cac cgc ccg gga cat gac gat ttt ccc gac cgg cac aac gcg agg    692
Pro His Arg Pro Gly His Asp Asp Phe Pro Asp Arg His Asn Ala Arg
        185                 190                 195
tcg acc ggc atc ggc gac ccg ttg tca cta ctg acc tgc ttc cat ttc    740
Ser Thr Gly Ile Gly Asp Pro Leu Ser Leu Leu Thr Cys Phe His Phe
    200                 205                 210
ggc ggc tat cac cac gaa cat cac ctg cat ccg cat gtg ccg tgg tgg    788
Gly Gly Tyr His His Glu His His Leu His Pro His Val Pro Trp Trp
215                 220                 225                 230
cgc ctg cct cgt aca cgc aag acc gga ggc cgc gca tga cgcaattcct     837
Arg Leu Pro Arg Thr Arg Lys Thr Gly Gly Arg Ala
                235                 240
cattgtcgtg gcgacagtcc tcgtgatgga gctgaccgcc tattccgtcc accgctggat  897
tatgcacggc cccctaggct ggggctggca caagtcccat cacgaagagc acgaccacgc  957
gttggagaag aacgacctct acggcgtcgt cttcgcggtg ctggcgacga tcctcttcac 1017
cgtgggcgcc tattggtggc cggtgctgtg gtggatcgcc ctgggcatga cggtctatgg 1077
gttgatctat ttcatcctgc acgacgggct tgtgcatcaa cgctggccgt ttcggtatat 1137
tccgcggcgg ggctatttcc gcaggctcta ccaagctcat cgcctgcacc acgcggtcga 1197
ggggcgggac cactgcgtca gcttcggctt catctatgcc ccacccgtgg acaagctgaa 1257
gcaggatctg aagcggtcgg gtgtcctgcg cccccaggac gagcgtccgt cgtgatctct 1317
gatcccggcg tggccgcatg aaatccgacg tgctgctggc aggggccggc cttgccaacg 1377
gactgatcgc gctggcgatc cgcaaggcgc ggcccgacct tcgcgtgctg ctgctggacc 1437
gtgcggcggg cgcctcggac gggcatactt ggtcctgcca cgacaccgat ttggcgccgc 1497
actggctgga ccgcctgaag ccgatcaggc gtggcgactg gcccgatcag gaggtgcggt  1557
tcccagacca ttcgcgaagg ctccgggccg gatatggctc gatcgacggg cgggggctga  1617
tgcgtgcggt gacc                                                    1631
<210>40
<211>242
<212>PRT
<213>产碱菌属
<400>40
Met Ser Gly Arg Lys Pro Gly Thr Thr Gly Asp Thr Ile Val Asn Leu
1               5                   10                  15
Gly Leu Thr Ala Ala Ile Leu Leu Cys Trp Leu Val Leu His Ala Phe
            20                  25                  30
Thr Leu Trp Leu Leu Asp Ala Ala Ala His Pro Leu Leu Ala Val Leu
        35                  40                  45
Cys Leu Ala Gly Leu Thr Trp Leu Ser Val Gly Leu Phe Ile Ile Ala
    50                  55                  60
His Asp Ala Met His Gly Ser Val Val Pro Gly Arg Pro Arg Ala Asn
65                  70                  75                  80
Ala Ala Ile Gly Gln Leu Ala Leu Trp Leu Tyr Ala Gly Phe Set Trp
                85                  90                  95
Pro Lys Leu Ile Ala Lys His Met Thr His His Arg His Ala Gly Thr
            100                 105                 110
Asp Asn Asp Pro Asp Phe Gly His Gly Gly Pro Val Arg Trp Tyr Gly
        115                 120                 125
Ser Phe Val Ser Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro
    130                 135                 140
Val Ile Val Thr Thr Tyr Ala Leu Ile Leu Gly Asp Arg Trp Met Tyr
145                 150                 155                 160
Val Ile Phe Trp Pro Val Pro Ala Val Leu Ala Ser Ile Gln Ile Phe
                165                 170                 175
Val Phe Gly Thr Trp Leu Pro His Arg Pro Gly His Asp Asp Phe Pro
            180                 185                 190
Asp Arg His Asn Ala Arg Ser Thr Gly Ile Gly Asp Pro Leu Ser Leu
        195                 200                 205
Leu Thr Cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His
    210                 215                 220
Pro His Val Pro Trp Trp Arg Leu Pro Arg Thr Arg Lys Thr Gly Gly
225                 230                 235                 240
Arg Ala
<210>41
<211>729
<212>DNA
<213>Paracoccus marcusii
<220>
<221>CDS
<222>(1)..(729)
<223>
<400>41
atg agc gca cat gcc ctg ccc aag gca gat ctg acc gcc aca agc ctg    48
Met Ser Ala His Ala Leu Pro Lys Ala Asp Leu Thr Ala Thr Ser Leu
1               5                   10                  15
atc gtc tcg ggc ggc atc atc gcc gca tgg ctg gcc ctg cat gtg cat    96
Ile Val Ser Gly Gly Ile Ile Ala Ala Trp Leu Ala Leu His Val His
            20                  25                  30
gcg ctg tgg ttt ctg gac gcg gcg gcc cat ccc atc ctg gcg gtc gcg    144
Ala Leu Trp Phe Leu Asp Ala Ala Ala His Pro Ile Leu Ala Val Ala
        35                  40                  45
aat ttc ctg ggg ctg acc tgg ctg tcg gtc gga ttg ttc atc atc gcg    192
Asn Phe Leu Gly Leu Thr Trp Leu Ser Val Gly Leu Phe Ile Ile Ala
    50                  55                  60
cat gac gcg atg cac ggg tcg gtc gtg ccg ggg cgt ccg cgc gcc aat    240
His Asp Ala Met His Gly Ser Val Val Pro Gly Arg Pro Arg Ala Asn
65                  70                  75                  80
gcg gcg atg ggc cag ctt gtc ctg tgg ctg tat gcc gga ttt tcg tgg    288
Ala Ala Met Gly Gln Leu Val Leu Trp Leu Tyr Ala Gly Phe Ser Trp
                85                  90                  95
cgc aag atg atc gtc aag cac atg gcc cat cac cgc cat gcc gga acc    336
Arg Lys Met Ile Val Lys His Met Ala His His Arg His Ala Gly Thr
            100                 105                 110
gac gac gac cca gat ttc gac cat ggc ggc ccg gtc cgc tgg tac gcc    384
Asp Asp Asp Pro Asp Phe Asp His Gly Gly Pro Val Arg Trp Tyr Ala
        115                 120                 125
cgc ttc atc ggc acc tat ttc ggc tgg cgc gag ggg ctg ctg ctg ccc    432
Arg Phe Ile Gly Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro
    130                 135                 140
gtc atc gtg acg gtc tat gcg ctg atc ctg ggg gat cgc tgg atg tac    480
Val Ile Val Thr Val Tyr Ala Leu Ile Leu Gly Asp Arg Trp Met Tyr
145                 150                 155                 160
gtg gtc ttc tgg ccg ttg ccg tcg atc ctg gcg tcg atc cag ctg ttc    528
Val Val Phe Trp Pro Leu Pro Ser Ile Leu Ala Ser Ile Gln Leu Phe
                165                 170                 175
gtg ttc ggc act tgg ctg ccg cac cgc ccc ggc cac gac gcg ttc ccg    576
Val Phe Gly Thr Trp Leu Pro His Arg Pro Gly His Asp Ala Phe Pro
            180                 185                 190
gac cgc cat aat gcg cgg tcg tcg cgg atc agc gac cct gtg tcg ctg    624
Asp Arg His Asn Ala Arg Ser Ser Arg Ile Ser Asp Pro Val Ser Leu
        195                 200                 205
ctg acc tgc ttt cat ttt ggc ggt tat cat cac gaa cac cac ctg cac    672
Leu Thr Cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His
    210                 215                 220
ccg acg gtg ccg tgg tgg cgc ctg ccc agc acc cgc acc aag ggg gac    720
Pro Thr Val Pro Trp Trp Arg Leu Pro Ser Thr Arg Thr Lys Gly Asp
225                 230                 235                 240
acc gca tga                                                        729
Thr Ala
<210>42
<211>242
<212>PRT
<213>Paracoccus marcusii
<400>42
Met Ser Ala His Ala Leu Pro Lys Ala Asp Leu Thr Ala Thr Ser Leu
1               5                   10                  15
Ile Val Ser Gly Gly Ile Ile Ala Ala Trp Leu Ala Leu His Val His
            20                  25                  30
Ala Leu Trp Phe Leu Asp Ala Ala Ala His Pro Ile Leu Ala Val Ala
        35                  40                  45
Asn Phe Leu Gly Leu Thr Trp Leu Ser Val Gly Leu Phe Ile Ile Ala
    50                  55                  60
His Asp Ala Met His Gly Ser Val Val Pro Gly Arg Pro Arg Ala Asn
65                  70                  75                  80
Ala Ala Met Gly Gln Leu Val Leu Trp Leu Tyr Ala Gly Phe Ser Trp
                85                  90                  95
Arg Lys Met Ile Val Lys His Met Ala His His Arg His Ala Gly Thr
            100                 105                 110
Asp Asp Asp Pro Asp Phe Asp His Gly Gly Pro Val Arg Trp Tyr Ala
        115                 120                 125
Arg Phe Ile Gly Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro
    130                 135                 140
Val Ile Val Thr Val Tyr Ala Leu Ile Leu Gly Asp Arg Trp Met Tyr
145                 150                 155                 160
Val Val Phe Trp Pro Leu Pro Ser Ile Leu Ala Ser Ile Gln Leu Phe
                165                 170                 175
Val Phe Gly Thr Trp Leu Pro His Arg Pro Gly His Asp Ala Phe Pro
            180                 185                 190
Asp Arg His Asn Ala Arg Ser Ser Arg Ile Ser Asp Pro Val Ser Leu
        195                 200                 205
Leu Thr Cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His
    210                 215                 220
Pro Thr Val Pro Trp Trp Arg Leu Pro Ser Thr Arg Thr Lys Gly Asp
225                 230                 235                 240
Thr Ala
<210>43
<211>1629
<212>DNA
<213>Synechococystis
<220>
<221>CDS
<222>(1)..(1629)
<223>
<400>43
atg atc acc acc gat gtt gtc att att ggg gcg ggg cac aat ggc tta    48
Met Ile Thr Thr Asp Val Val Ile Ile Gly Ala Gly His Asn Gly Leu
1               5                   10                  15
gtc tgt gca gcc tat ttg ctc caa cgg ggc ttg ggg gtg acg tta cta    96
Val Cys Ala Ala Tyr Leu Leu Gln Arg Gly Leu Gly Val Thr Leu Leu
            20                  25                  30
gaa aag cgg gaa gta cca ggg ggg gcg gcc acc aca gaa gct ctc atg    144
Glu Lys Arg Glu Val Pro Gly Gly Ala Ala Thr Thr Glu Ala Leu Met
        35                  40                  45
ccg gag cta tcc ccc cag ttt cgc ttt aac cgc tgt gcc att gac cac    192
Pro Glu Leu Ser Pro Gln Phe Arg Phe Asn Arg Cys Ala Ile Asp His
    50                  55                  60
gaa ttt atc ttt ctg ggg ccg gtg ttg cag gag cta aat tta gcc cag    240
Glu Phe Ile Phe Leu Gly Pro Val Leu Gln Glu Leu Asn Leu Ala Gln
65                  70                  75                  80
tat ggt ttg gaa tat tta ttt tgt gac ccc agt gtt ttt tgt ccg ggg    288
Tyr Gly Leu Glu Tyr Leu Phe Cys Asp Pro Ser Val Phe Cys Pro Gly
                85                  90                  95
ctg gat ggc caa gct ttt atg agc tac cgt tcc cta gaa aaa acc tgt    336
Leu Asp Gly Gln Ala Phe Met Ser Tyr Arg Ser Leu Glu Lys Thr Cys
            100                 105                 110
gcc cac att gcc acc tat agc ccc cga gat gcg gaa aaa tat cgg caa    384
Ala His Ile Ala Thr Tyr Ser Pro Arg Asp Ala Glu Lys Tyr Arg Gln
        115                 120                 125
ttt gtc aat tat tgg acg gat ttg ctc aac gct gtc cag cct gct ttt    432
Phe Val Asn Tyr Trp Thr Asp Leu Leu Asn Ala Val Gln Pro Ala Phe
    130                 135                 140
aat gct ccg ccc cag gct tta cta gat tta gcc ctg aac tat ggt tgg    480
Asn Ala Pro Pro Gln Ala Leu Leu Asp Leu Ala Leu Asn Tyr Gly Trp
145                 150                 155                 160
gaa aac tta aaa tcc gtg ctg gcg atc gcc ggg tcg aaa acc aag gcg    528
Glu Asn Leu Lys Ser Val Leu Ala Ile Ala Gly Ser Lys Thr Lys Ala
                165                 170                 175
ttg gat ttt atc cgc act atg atc ggc tcc ccg gaa gat gtg ctc aat    576
Leu Asp Phe Ile Arg Thr Met Ile Gly Ser Pro Glu Asp Val Leu Asn
            180                 185                 190
gaa tgg ttc gac agc gaa cgg gtt aaa gct cct tta gct aga cta tgt    624
Glu Trp Phe Asp Ser Glu Arg Val Lys Ala Pro Leu Ala Arg Leu Cys
        195                 200                 205
tcg gaa att ggc gct ccc cca tcc caa aag ggt agt agc tcc ggc atg    672
Ser Glu Ile Gly Ala Pro Pro Ser Gln Lys Gly Ser Ser Ser Gly Met
    210                 215                 220
atg atg gtg gcc atg cgg cat ttg gag gga att gcc aga cca aaa gga    720
Met Met Val Ala Met Arg His Leu Glu Gly Ile Ala Arg Pro Lys Gly
225                 230                 235                 240
ggc act gga gcc ctc aca gaa gcc ttg gtg aag tta gtg caa gcc caa    768
Gly Thr Gly Ala Leu Thr Glu Ala Leu Val LVs Leu Val Gln Ala Gln
                245                 250                 255
ggg gga aaa atc ctc act gac caa acc gtc aaa cgg gta ttg gtg gaa    816
Gly Gly Lys Ile Leu Thr Asp Gln Thr Val Lys Arg Val Leu Val Glu
            260                 265                 270
aac aac cag gcg atc ggg gtg gag gta gct aac gga gaa cag tac cgg    864
Asn Asn Gln Ala Ile Gly Val Glu Val Ala Asn Gly Glu Gln Tyr Arg
        275                 280                 285
gcc aaa aaa ggc gtg att tct aac atc gat gcc cgc cgt tta ttt ttg    912
Ala Lys Lys Gly Val Ile Ser Asn Ile Asp Ala Arg Arg Leu Phe Leu
    290                 295                 300
caa ttg gtg gaa ccg ggg gcc cta gcc aag gtg aat caa aac cta ggg    960
Gln Leu Val Glu Pro Gly Ala Leu Ala Lys Val Asn Gln Asn Leu Gly
305                 310                 315                 320
gaa cga ctg gaa cgg cgc act gtg aac aat aac gaa gcc att tta aaa    1008
Glu Arg Leu Glu Arg Arg Thr Val Asn Asn Asn Glu Ala Ile Leu Lys
                325                 330                 335
atc gat tgt gcc ctc tcc ggt tta ccc cac ttc act gcc atg gcc ggg    1056
Ile Asp Cys Ala Leu Ser Gly Leu Pro His Phe Thr Ala Met Ala Gly
            340                 345                 350
ccg gag gat cta acg gga act att ttg att gcc gac tcg gta cgc cat    1104
Pro Glu Asp Leu Thr Gly Thr Ile Leu Ile Ala Asp Ser Val Arg His
        355                 360                 365
gtc gag gaa gcc cac gcc ctc att gcc ttg ggg caa att ccc gat gct    1152
Val Glu Glu Ala His Ala Leu Ile Ala Leu Gly Gln Ile Pro Asp Ala
    370                 375                 380
aat ccg tct tta tat ttg gat att ccc act gta ttg gac ccc acc atg    1200
Asn Pro Ser Leu Tyr Leu Asp Ile Pro Thr Val Leu Asp Pro Thr Met
385                 390                 395                 400
gcc ccc cct ggg cag cac acc ctc tgg atc gaa ttt ttt gcc ccc tac    1248
Ala Pro Pro Gly Gln His Thr Leu Trp Ile Glu Phe Phe Ala Pro Tyr
                405                 410                 415
cgc atc gcc ggg ttg gaa ggg aca ggg tta atg ggc aca ggt tgg acc    1296
Arg Ile Ala Gly Leu Glu Gly Thr Gly Leu Met Gly Thr Gly Trp Thr
            420                 425                 430
gat gag tta aag gaa aaa gtg gcg gat cgg gtg att gat aaa tta acg    1344
Asp Glu Leu Lys Glu Lys Val Ala Asp Arg Val Ile Asp Lys Leu Thr
        435                 440                 445
gac tat gcc cct aac cta aaa tct ctg atc att ggt cgc cga gtg gaa    1392
Asp Tyr Ala Pro Asn Leu Lys Ser Leu Ile Ile Gly Arg Arg Val Glu
    450                 455                 460
agt ccc gcc gaa ctg gcc caa cgg ctg gga agt tac aac ggc aat gtc    1440
Ser Pro Ala Glu Leu Ala Gln Arg Leu Gly Ser Tyr Asn Gly Asn Val
465                 470                 475                 480
tat cat ctg gat atg agt ttg gac caa atg atg ttc ctc cgg cct cta    1488
Tyr His Leu Asp Met Ser Leu Asp Gln Met Met Phe Leu Arg Pro Leu
                485                 490                 495
ccg gaa att gcc aac tac caa acc ccc atc aaa aat ctt tac tta aca    1536
Pro Glu Ile Ala Asn Tyr Gln Thr Pro Ile Lys Asn Leu Tyr Leu Thr
            500                 505                 510
ggg gcg ggt acc cat ccc ggt ggc tcc ata tca ggt atg ccc ggt aga    1584
Gly Ala Gly Thr His Pro Gly Gly Ser Ile Ser Gly Met Pro Gly Arg
        515                 520                 525
aat tgc gct cgg gtc ttt tta aaa caa caa cgt cgt ttt tgg taa        1629
Asn Cys Ala Arg Val Phe Leu Lys Gln Gln Arg Arg Phe Trp
    530                 535                 540
<210>44
<211>542
<212>PRT
<213>Synechococystis
<400>44
Met Ile Thr Thr Asp Val Val Ile Ile Gly Ala Gly His Asn Gly Leu
1               5                   10                  15
Val Cys Ala Ala Tyr Leu Leu Gln Arg Gly Leu Gly Val Thr Leu Leu
            20                  25                  30
Glu Lys Arg Glu Val Pro Gly Gly Ala Ala Thr Thr Glu Ala Leu Met
        35                  40                  45
Pro Glu Leu Ser Pro Gln Phe Arg Phe Asn Arg Cys Ala Ile Asp His
    50                  55                  60
Glu Phe Ile Phe Leu Gly Pro Val Leu Gln Glu Leu Asn Leu Ala Gln
65                  70                  75                  80
Tyr Gly Leu Glu Tyr Leu Phe Cys Asp Pro Ser Val Phe Cys Pro Gly
                85                  90                  95
Leu Asp Gly Gln Ala Phe Met Ser Tyr Arg Ser Leu Glu Lys Thr Cys
            100                 105                 110
Ala His Ile Ala Thr Tyr Ser Pro Arg Asp Ala Glu Lys Tyr Arg Gln
        115                 120                 125
Phe Val Asn Tyr Trp Thr Asp Leu Leu Asn Ala Val Gln Pro Ala Phe
    130                 135                 140
Asn Ala Pro Pro Gln Ala Leu Leu Asp Leu Ala Leu Asn Tyr Gly Trp
145                 150                 155                 160
Glu Asn Leu Lys Ser Val Leu Ala Ile Ala Gly Ser Lys Thr Lys Ala
                165                 170                 175
Lau Asp Phe Ile Arg Thr Met Ile Gly Ser Pro Glu Asp Val Leu Asn
            180                 185                 190
Glu Trp Phe Asp Ser Glu Arg Val Lys Ala Pro Leu Ala Arg Leu Cys
        195                 200                 205
Ser Glu Ile Gly Ala Pro Pro Ser Gln Lys Gly Ser Ser Ser Gly Met
    210                 215                 220
Met Met Val Ala Met Arg His Leu Glu Gly Ile Ala Arg Pro Lys Gly
225                 230                 235                 240
Gly Thr Gly Ala Leu Thr Glu Ala Leu Val Lys Leu Val Gln Ala Gln
                245                 250                 255
Gly Gly Lys Ile Leu Thr Asp Gln Thr Val Lys Arg Val Leu Val Glu
            260                 265                 270
Asn Asn Gln Ala Ile Gly Val Glu Val Ala Asn Gly Glu Gln Tyr Arg
        275                 280                 285
Ala Lys Lys Gly Val Ile Ser Asn Ile Asp Ala Arg Arg Leu Phe Leu
    290                 295                 300
Gln Leu Val Glu Pro Gly Ala Leu Ala Lys Val Asn Gln Asn Leu Gly
305                 310                 315                 320
Glu Arg Leu Glu Arg Arg Thr Val Asn Asn Asn Glu Ala Ile Leu Lys
                325                 330                 335
Ile Asp Cys Ala Leu Ser Gly Leu Pro His Phe Thr Ala Met Ala Gly
            340                 345                 350
Pro Glu Asp Leu Thr Gly Thr Ile Leu Ile Ala Asp Ser Val Arg His
        355                 360                 365
Val Glu Glu Ala His Ala Leu Ile Ala Leu Gly Gln Ile Pro Asp Ala
    370                 375                 380
Asn Pro Ser Leu Tyr Leu Asp Ile Pro Thr Val Leu Asp Pro Thr Met
385                 390                 395                 400
Ala Pro Pro Gly Gln His Thr Leu Trp Ile Glu Phe Phe Ala Pro Tyr
                405                 410                 415
Arg Ile Ala Gly Leu Glu Gly Thr Gly Leu Met Gly Thr Gly Trp Thr
            420                 425                 430
Asp Glu Leu Lys Glu Lys Val Ala Asp Arg Val Ile Asp Lys Leu Thr
        435                 440                 445
Asp Tyr Ala Pro Asn Leu Lys Ser Leu Ile Ile Gly Arg Arg Val Glu
    450                 455                 460
Ser Pro Ala Glu Leu Ala Gln Arg Leu Gly Ser Tyr Asn Gly Asn Val
465                 470                 475                 480
Tyr His Leu Asp Met Ser Leu Asp Gln Met Met Phe Leu Arg Pro Leu
                485                 490                 495
Pro Glu Ile Ala Asn Tyr Gln Thr Pro Ile Lys Asn Leu Tyr Leu Thr
            500                 505                 510
Gly Ala Gly Thr His Pro Gly Gly Ser Ile Ser Gly Met Pro Gly Arg
        515                 520                 525
Asn Cys Ala Arg Val Phe Leu Lys Gln Gln Arg Arg Phe Trp
    530                 535                 540
<210>45
<211>776
<212>DNA
<213>慢生根瘤菌属
<220>
<221>CDS
<222>(1)..(774)
<223>
<400>45
atg cat gca gca acc gcc aag gct act gag ttc ggg gcc tct cgg cgc    48
Met His Ala Ala Thr Ala Lys Ala Thr Glu Phe Gly Ala Ser Arg Arg
1               5                   10                  15
gac gat gcg agg cag cgc cgc gtc ggt ctc acg ctg gcc gcg gtc atc    96
Asp Asp Ala Arg Gln Arg Arg Val Gly Leu Thr Leu Ala Ala Val Ile
            20                  25                  30
atc gcc gcc tgg ctg gtg ctg cat gtc ggt ctg atg ttc ttc tgg ccg    144
Ile Ala Ala Trp Leu Val Leu His Val Gly Leu Met Phe Phe Trp Pro
        35                  40                  45
ctg acc ctt cac agc ctg ctg ccg gct ttg cct ctg gtg gtg ctg cag    192
Leu Thr Leu His Ser Leu Leu Pro Ala Leu Pro Leu Val Val Leu Gln
    50                  55                  60
acc tgg ctc tat gta ggc ctg ttc atc atc gcg cat gac tgc atg cac    240
Thr Trp Leu Tyr Val Gly Leu Phe Ile Ile Ala His Asp Cys Met His
65                  70                  75                  80
ggc tcg ctg gtg ccg ttc aag ccg cag gtc aac cgc cgt atc gga cag    288
Gly Ser Leu Val Pro Phe Lys Pro Gln Val Asn Arg Arg Ile Gly Gln
                85                  90                  95
ctc tgc ctg ttc ctc tat gcc ggg ttc tcc ttc gac gct ctc aat gtc    336
Leu Cys Leu Phe Leu Tyr Ala Gly Phe Ser Phe Asp Ala Leu Asn Val
            100                 105                 110
gag cac cac aag cat cac cgc cat ccc ggc acg gcc gag gat ccc gat    384
Glu His His Lys His His Arg His Pro Gly Thr Ala Glu Asp Pro Asp
        115                 120                 125
ttc gac gag gtg ccg ccg cac ggc ttc tgg cac tgg ttc gcc agc ttt    432
Phe Asp Glu Val Pro Pro His Gly Phe Trp His Trp Phe Ala Ser Phe
    130                 135                 140
ttc ctg cac tat ttc ggc tgg aag cag gtc gcg atc atc gca gcc gtc    480
Phe Leu His Tyr Phe Gly Trp Lys Gln Val Ala Ile Ile Ala Ala Val
145                 150                 155                 160
tcg ctg gtt tat cag ctc gtc ttc gcc gtt ccc ttg cag aac atc ctg    528
Ser Leu Val Tyr Gln Leu Val Phe Ala Val Pro Leu Gln Asn Ile Leu
                165                 170                 175
ctg ttc tgg gcg ctg ccc ggg ctg ctg tcg gcg ctg cag ctg ttc acc    576
Leu Phe Trp Ala Leu Pro Gly Leu Leu Ser Ala Leu Gln Leu Phe Thr
            180                 185                 190
ttc ggc acc tat ctg ccg cac aag ccg gcc acg cag ccc ttc gcc gat    624
Phe Gly Thr Tyr Leu Pro His Lys Pro Ala Thr Gln Pro Phe Ala Asp
        195                 200                 205
cgc cac aac gcg cgg acg agc gaa ttt ccc gcg tgg ctg tcg ctg ctg    672
Arg His Asn Ala Arg Thr Ser Glu Phe Pro Ala Trp Leu Ser Leu Leu
    210                 215                 220
acc tgc ttc cac ttc ggc ttt cat cac gag cat cat ctg cat ccc gat    720
Thr Cys Phe His Phe Gly Phe His His Glu His His Leu His Pro Asp
225                 230                 235                 240
gcg ccg tgg tgg cgg ctg ccg gag atc aag cgg cgg gcc ctg gaa agg    768
Ala Pro Trp Trp Arg Leu Pro Glu Ile Lys Arg Arg Ala Leu Glu Arg
                245                 250                 255
cgt gac ta                                                         776
Arg Asp
<210>46
<211>258
<212>PRT
<213>慢生根瘤菌属
<400>46
Met His Ala Ala Thr Ala Lys Ala Thr Glu Phe Gly Ala Ser Arg Arg
1               5                   10                  15
Asp Asp Ala Arg Gln Arg Arg Val Gly Leu Thr Leu Ala Ala Val Ile
            20                  25                  30
Ile Ala Ala Trp Leu Val Leu His Val Gly Leu Met Phe Phe Trp Pro
        35                  40                  45
Leu Thr Leu His Ser Leu Leu Pro Ala Leu Pro Leu Val Val Leu Gln
    50                  55                  60
Thr Trp Leu Tyr Val Gly Leu Phe Ile Ile Ala His Asp Cys Met His
65                  70                  75                  80
Gly Ser Leu Val Pro Phe Lys Pro Gln Val Asn Arg Arg Ile Gly Gln
                85                  90                  95
Leu Cys Leu Phe Leu Tyr Ala Gly Phe Ser Phe Asp Ala Leu Asn Val
            100                 105                 110
Glu His His Lys His His Arg His Pro Gly Thr Ala Glu Asp Pro Asp
        115                 120                 125
Phe Asp Glu Val Pro Pro His Gly Phe Trp His Trp Phe Ala Ser Phe
    130                 135                 140
Phe Leu His Tyr Phe Gly Trp Lys Gln Val Ala Ile Ile Ala Ala Val
145                 150                 155                 160
Ser Leu Val Tyr Gln Leu Val Phe Ala Val Pro Leu Gln Asn Ile Leu
                165                 170                 175
Leu Phe Trp Ala Leu Pro Gly Leu Leu Ser Ala Leu Gln Leu Phe Thr
            180                 185                 190
Phe Gly Thr Tyr Leu Pro His Lys Pro Ala Thr Gln Pro Phe Ala Asp
        195                 200                 205
Arg His Asn Ala Arg Thr Ser Glu Phe Pro Ala Trp Leu Ser Leu Leu
    210                 215                 220
Thr Cys Phe His Phe Gly Phe His His Glu His His Leu His Pro Asp
225                 230                 235                 240
Ala Pro Trp Trp Arg Leu Pro Glu Ile Lys Arg Arg Ala Leu Glu Arg
                245                 250                 255
Arg Asp
<210>47
<211>777
<212>DNA
<213>念珠藻属
<220>
<221>CDS
<222>(1)..(777)
<223>
<400>47
atg gtt cag tgt caa cca tca tct ctg cat tca gaa aaa ctg gtg tta    48
Met Val Gln Cys Gln Pro Ser Ser Leu His Ser Glu Lys Leu Val Leu
1               5                   10                  15
ttg tca tcg aca atc aga gat gat aaa aat att aat aag ggt ata ttt    96
Leu Ser Ser Thr Ile Arg Asp Asp Lys Asn Ile Asn Lys Gly Ile Phe
            20                  25                  30
att gcc tgc ttt atc tta ttt tta tgg gca att agt tta atc tta tta    144
Ile Ala Cys Phe Ile Leu Phe Leu Trp Ala Ile Ser Leu Ile Leu Leu
        35                  40                  45
ctc tca ata gat aca tcc ata att cat aag agc tta tta ggt ata gcc    192
Leu Ser Ile Asp Thr Ser Ile Ile His Lys Ser Leu Leu Gly Ile Ala
    50                  55                  60
atg ctt tgg cag acc ttc tta tat aca ggt tta ttt att act gct cat    240
Met Leu Trp Gln Thr Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ala His
65                  70                  75                  80
gat gcc atg cac ggc gta gtt tat ccc aaa aat ccc aga ata aat aat    288
Asp Ala Met His Gly Val Val Tyr Pro Lys Asn Pro Arg Ile Asn Asn
                85                  90                  95
ttt ata ggt aag ctc act cta atc ttg tat gga cta ctc cct tat aaa    336
Phe Ile Gly Lys Leu Thr Leu Ile Leu Tyr Gly Leu Leu Pro Tyr Lys
            100                 105                 110
gat tta ttg aaa aaa cat tgg tta cac cac gga cat cct ggt act gat    384
Asp Leu Leu Lys Lys His Trp Leu His His Gly His Pro Gly Thr Asp
        115                 120                 125
tta gac cct gat tat tac aat ggt cat ccc caa aac ttc ttt ctt tgg    432
Leu Asp Pro Asp Tyr Tyr Asn Gly His Pro Gln Asn Phe Phe Leu Trp
    130                 135                 140
tat cta cat ttt atg aag tct tat tgg cga tgg acg caa att ttc gga    480
Tyr Leu His Phe Met Lys Ser Tyr Trp Arg Trp Thr Gln Ile Phe Gly
145                 150                 155                 160
tta gtg atg att ttt cat gga ctt aaa aat ctg gtg cat ata cca gaa    528
Leu Val Met Ile Phe His Gly Leu Lys Asn Leu Val His Ile Pro Glu
                165                 170                 175
aat aat tta att ata ttt tgg atg ata cct tct att tta agt tca gta    576
Asn Asn Leu Ile Ile Phe Trp Met Ile Pro Ser Ile Leu Ser Ser Val
            180                 185                 190
caa cta ttt tat ttt ggt aca ttt ttg cct cat aaa aag cta gaa ggt    624
Gln Leu Phe Tyr Phe Gly Thr Phe Leu Pro His Lys Lys Leu Glu Gly
        195                 200                 205
ggt tat act aac ccc cat tgt gcg cgc agt atc cca tta cct ctt ttt    672
Gly Tyr Thr Asn Pro His Cys Ala Arg Ser Ile Pro Leu Pro Leu Phe
    210                 215                 220
tgg tct ttt gtt act tgt tat cac ttc ggc tac cac aag gaa cat cac    720
Trp Ser Phe Val Thr Cys Tyr His Phe Gly Tyr His Lys Glu His His
225                 230                 235                 240
gaa tac cct caa ctt cct tgg tgg aaa tta cct gaa gct cac aaa ata    768
Glu Tyr Pro Gln Leu Pro Trp Trp Lys Leu Pro Glu Ala His Lys Ile
                245                 250                 255
tct tta taa                                                        777
Ser Leu
<210>48
<211>258
<212>PRT
<213>念珠藻属
<400>48
Met Val Gln Cys Gln Pro Ser Ser Leu His Ser Glu Lys Leu Val Leu
1               5                   10                  15
Leu Ser Ser Thr Ile Arg Asp Asp Lys Asn Ile Asn Lys Gly Ile Phe
            20                  25                  30
Ile Ala Cys Phe Ile Leu Phe Leu Trp Ala Ile Ser Leu Ile Leu Leu
        35                  40                  45
Leu Ser Ile Asp Thr Ser Ile Ile His Lys Ser Leu Leu Gly Ile Ala
    50                  55                  60
Met Leu Trp Gln Thr Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ala His
65                  70                  75                  80
Asp Ala Met His Gly Val Val Tyr Pro Lys Asn Pro Arg Ile Asn Asn
                85                  90                  95
Phe Ile Gly Lys Leu Thr Leu Ile Leu Tyr Gly Leu Leu Pro Tyr Lys
            100                 105                 110
Asp Leu Leu Lys Lys His Trp Leu His His Gly His Pro Gly Thr Asp
        115                 120                 125
Leu Asp Pro Asp Tyr Tyr Asn Gly His Pro Gln Asn Phe Phe Leu Trp
    130                 135                 140
Tyr Leu His Phe Met Lys Ser Tyr Trp Arg Trp Thr Gln Ile Phe Gly
145                 150                 155                 160
Leu Val Met Ile Phe His Gly Leu Lys Asn Leu Val His Ile Pro Glu
                165                 170                 175
Asn Asn Leu Ile Ile Phe Trp Met Ile Pro Ser Ile Leu Ser Ser Val
            180                 185                 190
Gln Leu Phe Tyr Phe Gly Thr Phe Leu Pro His Lys Lys Leu Glu Gly
        195                 200                 205
Gly Tyr Thr Asn Pro His Cys Ala Arg Ser Ile Pro Leu Pro Leu Phe
    210                 215                 220
Trp Ser Phe Val Thr Cys Tyr His Phe Gly Tyr His Lys Glu His His
225                 230                 235                 240
Glu Tyr Pro Gln Leu Pro Trp Trp Lys Leu Pro Glu Ala His Lys Ile
                245                 250                 255
Ser Leu
<210>49
<211>831
<212>DNA
<213>雨生红球藻
<220>
<221>CDS
<222>(1)..(831)
<223>
<400>49
atg cca tcc gag tcg tca gac gca gct cgt cct gtg ttg aag cac gcc    48
Met Pro Ser Glu Ser Ser Asp Ala Ala Arg Pro Val Leu Lys His Ala
1               5                   10                  15
tat aaa cct cca gca tct gac gcc aag ggc atc act atg gcg ctg acc    96
Tyr Lys Pro Pro Ala Ser Asp Ala Lys Gly Ile Thr Met Ala Leu Thr
            20                  25                  30
atc att ggc acc tgg acc gca gtg ttt tta cac gca ata ttc caa atc    144
Ile Ile Gly Thr Trp Thr Ala Val Phe Leu His Ala Ile Phe Gln Ile
        35                  40                  45
agg cta ccg aca tcc atg gac cag ctt cac tgg ttg cct gtg tcc gaa    192
Arg Leu Pro Thr Ser Met Asp Gln Leu His Trp Leu Pro Val Ser Glu
    50                  55                  60
gcc aca gcc cag ctg ttg ggc gga agc agc agc cta ttg cac atc gcc    240
Ala Thr Ala Gln Leu Leu Gly Gly Ser Ser Ser Leu Leu His Ile Ala
65                  70                  75                  80
gca gtc ttc att gta ctt gag ttt ctg tac act ggt cta ttc atc acc    288
Ala Val Phe Ile Val Leu Glu Phe Leu Tyr Thr Gly Leu Phe Ile Thr
                85                  90                  95
acg cat gat gca atg cat ggc acc ata gct ttg agg aac agg cag ctc    336
Thr His Asp Ala Met His Gly Thr Ile Ala Leu Arg Asn Arg Gln Leu
            100                 105                 110
aat gat ctc ctt ggc aac atc tgc ata tca ctg tac gcc tgg ttt gac    384
Asn Asp Leu Leu Gly Asn Ile Cys Ile Ser Leu Tyr Ala Trp Phe Asp
        115                 120                 125
tac agc atg cac tgg gag cac cac aac cat act ggc gaa gtg ggg aaa    432
Tyr Ser Met His Trp Glu His His Asn His Thr Gly Glu Val Gly Lys
    130                 135                 140
gac cct gac ttc cac aaa gga aat cct ggc ctt gtc ccc tgg ttc gcc    480
Asp Pro Asp Phe His Lys Gly Asn Pro Gly Leu Val Pro Trp Phe Ala
145                 150                 155                 160
agc ttc atg tcc agc tac atg tcc ctg tgg cag ttt gcc cgg ctg gca    528
Ser Phe Met Ser Ser Tyr Met Ser Leu Trp Gln Phe Ala Arg Leu Ala
                165                 170                 175
tgg tgg gca gtg gtg atg caa acg ttg ggg gcc ccc atg gcg aat ctc    576
Trp Trp Ala Val Val Met Gln Thr Leu Gly Ala Pro Met Ala Asn Leu
            180                 185                 190
cta gtc ttc atg gct gca gcc cca atc ttg tca gca ttc cgc ctc ttc    624
Leu Val Phe Met Ala Ala Ala Pro Ile Leu Ser Ala Phe Arg Leu Phe
        195                 200                 205
tac ttc ggc act tac ctg cca cac aag cct gag cca ggc cct gca gca    672
Tyr Phe Gly Thr Tyr Leu Pro His Lys Pro Glu Pro Gly Pro Ala Ala
    210                 215                 220
ggc tct cag gtc atg tct tgg ttc agg gcc aag aca agt gag gca tct    720
Gly Ser Gln Val Met Ser Trp Phe Arg Ala Lys Thr Ser Glu Ala Ser
225                 230                 235                 240
gat gtg atg agc ttc ctg aca tgc tac cac ttt gac ctg ttt gcc ccc    768
Asp Val Met Ser Phe Leu Thr Cys Tyr His Phe Asp Leu Phe Ala Pro
                245                 250                 255
tgg tgg cag ctg ccc cac tgc cgc cgc ctg tct ggg cgt ggc ctg gtg    816
Trp Trp Gln Leu Pro His Cys Arg Arg Leu Ser Gly Arg Gly Leu Val
            260                 265                 270
cct gcc ttg gca tga                                                831
Pro Ala Leu Ala
        275
<210>50
<211>276
<212>PRT
<213>雨生红球藻
<400>50
Met Pro Ser Glu Ser Ser Asp Ala Ala Arg Pro Val Leu Lys His Ala
1               5                   10                  15
Tyr Lys Pro Pro Ala Ser Asp Ala Lys Gly Ile Thr Met Ala Leu Thr
            20                  25                  30
Ile Ile Gly Thr Trp Thr Ala Val Phe Leu His Ala Ile Phe Gln Ile
        35                  40                  45
Arg Leu Pro Thr Ser Met Asp Gln Leu His Trp Leu Pro Val Ser Glu
    50                  55                  60
Ala Thr Ala Gln Leu Leu Gly Gly Ser Ser Ser Leu Leu His Ile Ala
65                  70                  75                  80
Ala Val Phe Ile Val Leu Glu Phe Leu Tyr Thr Gly Leu Phe Ile Thr
                85                  90                  95
Thr His Asp Ala Met His Gly Thr Ile Ala Leu Arg Asn Arg Gln Leu
            100                 105                 110
Asn Asp Leu Leu Gly Asn Ile Cys Ile Ser Leu Tyr Ala Trp Phe Asp
        115                 120                 125
Tyr Ser Met His Trp Glu His His Asn His Thr Gly Glu Val Gly Lys
    130                 135                 140
Asp Pro Asp Phe His Lys Gly Asn Pro Gly Leu Val Pro Trp Phe Ala
145                 150                 155                 160
Ser Phe Met Ser Ser Tyr Met Ser Leu Trp Gln Phe Ala Arg Leu Ala
                165                 170                 175
Trp Trp Ala Val Val Met Gln Thr Leu Gly Ala Pro Met Ala Asn Leu
            180                 185                 190
Leu Val Phe Met Ala Ala Ala Pro Ile Leu Ser Ala Phe Arg Leu Phe
        195                 200                 205
Tyr Phe Gly Thr Tyr Leu Pro His Lys Pro Glu Pro Gly Pro Ala Ala
    210                 215                 220
Gly Ser Gln Val Met Ser Trp Phe Arg Ala Lys Thr Ser Glu Ala Ser
225                 230                 235                 240
Asp Val Met Ser Phe Leu Thr Cys Tyr His Phe Asp Leu Phe Ala Pro
                245                 250                 255
Trp Trp Gln Leu Pro His Cys Arg Arg Leu Ser Gly Arg Gly Leu Val
            260                 265                 270
Pro Ala Leu Ala
        275
<210>51
<211>729
<212>DNA
<213>副球菌属MBIC1143
<220>
<221>CDS
<222>(1)..(729)
<223>
<400>51
atg agc gca cat gcc ctg ccc aag gca gat ctg acc gcc acc agc ctg    48
Met Ser Ala His Ala Leu Pro Lys Ala Asp Leu Thr Ala Thr Ser Leu
1               5                   10                  15
atc gtc tcg ggc ggc atc atc gcc gct tgg ctg gcc ctg cat gtg cat    96
Ile Val Ser Gly Gly Ile Ile Ala Ala Trp Leu Ala Leu His Val His
            20                  25                  30
gcg ctg tgg ttt ctg gac gca gcg gcg cat ccc atc ctg gcg atc gca    144
Ala Leu Trp Phe Leu Asp Ala Ala Ala His Pro Ile Leu Ala Ile Ala
        35                  40                  45
aat ttc ctg ggg ctg acc tgg ctg tcg gtc gga ttg ttc atc atc gcg    192
Asn Phe Leu Gly Leu Thr Trp Leu Ser Val Gly Leu Phe Ile Ile Ala
    50                  55                  60
cat gac gcg atg cac ggg tcg gtg gtg ccg ggg cgt ccg cgc gcc aat    240
His Asp Ala Met His Gly Ser Val Val Pro Gly Arg Pro Arg Ala Asn
65                  70                  75                  80
gcg gcg atg ggc cag ctt gtc ctg tgg ctg tat gcc gga ttt tcg tgg    288
Ala Ala Met Gly Gln Leu Val Leu Trp Leu Tyr Ala Gly Phe Ser Trp
                85                  90                  95
cgc aag atg atc gtc aag cac atg gcc cat cac cgc cat gcc gga acc    336
Arg Lys Met Ile Val Lys His Met Ala His His Arg His Ala Gly Thr
            100                 105                 110
gac gac gac ccc gat ttc gac cat ggc ggc ccg gtc cgc tgg tac gcc    384
Asp Asp Asp Pro Asp Phe Asp His Gly Gly Pro Val Arg Trp Tyr Ala
        115                 120                 125
cgc ttc atc ggc acc tat ttc ggc tgg cgc gag ggg ctg ctg ctg ccc    432
Arg Phe Ile Gly Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro
    130                 135                 140
gtc atc gtg acg gtc tat gcg ctg atc ctt ggg gat cgc tgg atg tac    480
Val Ile Val Thr Val Tyr Ala Leu Ile Leu Gly Asp Arg Trp Met Tyr
145                 150                 155                 160
gtg gtc ttc tgg ccg ctg ccg tcg atc ctg gcg tcg atc cag ctg ttc    528
Val Val Phe Trp Pro Leu Pro Ser Ile Leu Ala Ser Ile Gln Leu Phe
                165                 170                 175
gtg ttc ggc acc tgg ctg ccg cac cgc ccc ggc cac gac gcg ttc ccg    576
Val Phe Gly Thr Trp Leu Pro His Arg Pro Gly His Asp Ala Phe Pro
            180                 185                 190
gac cgc cac aat gcg cgg tcg tcg cgg atc agc gac ccc gtg tcg ctg    624
Asp Arg His Asn Ala Arg Ser Ser Arg Ile Ser Asp Pro Val Ser Leu
        195                 200                 205
ctg acc tgc ttt cac ttt ggc ggt tat cat cac gaa cac cac ctg cac    672
Leu Thr Cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His
    210                 215                 220
ccg acg gtg ccg tgg tgg cgc ctg ccc agc acc cgc acc aag ggg gac    720
Pro Thr Val Pro Trp Trp Arg Leu Pro Ser Thr Arg Thr Lys Gly Asp
225                 230                 235                 240
acc gca tga                                                        729
Thr Ala
<210>52
<211>242
<212>PRT
<213>副球菌属MBIC1143
<400>52
Met Ser Ala His Ala Leu Pro Lys Ala Asp Leu Thr Ala Thr Ser Leu
1               5                   10                  15
Ile Val Ser Gly Gly Ile Ile Ala Ala Trp Leu Ala Leu His Val His
            20                  25                  30
Ala Leu Trp Phe Leu Asp Ala Ala Ala His Pro Ile Leu Ala Ile Ala
        35                  40                  45
Asn Phe Leu Gly Leu Thr Trp Leu Ser Val Gly Leu Phe Ile Ile Ala
    50                  55                  60
His Asp Ala Met His Gly Ser Val Val Pro Gly Arg Pro Arg Ala Asn
65                  70                  75                  80
Ala Ala Met Gly Gln Leu Val Leu Trp Leu Tyr Ala Gly Phe Ser Trp
                85                  90                  95
Arg Lys Met Ile Val Lys His Met Ala His His Arg His Ala Gly Thr
            100                 105                 110
Asp Asp Asp Pro Asp Phe Asp His Gly Gly Pro Val Arg Trp Tyr Ala
        115                 120                 125
Arg Phe Ile Gly Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro
    130                 135                 140
Val Ile Val Thr Val Tyr Ala Leu Ile Leu Gly Asp Arg Trp Met Tyr
145                 150                 155                 160
Val Val Phe Trp Pro Leu Pro Ser Ile Leu Ala Ser Ile Gln Leu Phe
                165                 170                 175
Val Phe Gly Thr Trp Leu Pro His Arg Pro Gly His Asp Ala Phe Pro
            180                 185                 190Asp Arg His Asn Ala Arg Ser Ser Arg Ile Ser Asp Pro Val Ser Leu
       195                 200                 205
Leu Thr Cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His
    210                 215                 220
Pro Thr Val Pro Trp Trp Arg Leu Pro Ser Thr Arg Thr Lys Gly Asp
225                 230                 235                 240
Thr Ala
<210>53
<211>735
<212>DNA
<213>橙黄短波单胞菌
<220>
<221>CDS
<222>(1)..(735)
<223>
<400>53
atg acc gcc gcc gtc gcc gag cca cgc acc gtc ccg cgc cag acc tgg    48
Met Thr Ala Ala Val Ala Glu Pro Arg Thr Val Pro Arg Gln Thr Trp
1               5                   10                  15
atc ggt ctg acc ctg gcg gga atg atc gtg gcg gga tgg gcg gtt ctg    96
Ile Gly Leu Thr Leu Ala Gly Met Ile Val Ala Gly Trp Ala Val Leu
            20                  25                  30
cat gtc tac ggc gtc tat ttt cac cga tgg ggg ccg ttg acc ctg gtg    144
His Val Tyr Gly Val Tyr Phe His Arg Trp Gly Pro Leu Thr Leu Val
        35                  40                  45
atc gcc ccg gcg atc gtg gcg gtc cag acc tgg ttg tcg gtc ggc ctt    192
Ile Ala Pro Ala Ile Val Ala Val Gln Thr Trp Leu Ser Val Gly Leu
    50                  55                  60
ttc atc gtc gcc cat gac gcc atg tac ggc tcc ctg gcg ccg gga cgg    240
Phe Ile Val Ala His Asp Ala Met Tyr Gly Ser Leu Ala Pro Gly Arg
65                  70                  75                  80
ccg cgg ctg aac gcc gca gtc ggc cgg ctg acc ctg ggg ctc tat gcg    288
Pro Arg Leu Asn Ala Ala Val Gly Arg Leu Thr Leu Gly Leu Tyr Ala
                85                  90                  95
ggc ttc cgc ttc gat cgg ctg aag acg gcg cac cac gcc cac cac gcc    336
Gly Phe Arg Phe Asp Arg Leu Lys Thr Ala His His Ala His His Ala
            100                 105                 110
gcg ccc ggc acg gcc gac gac ccg gat ttt cac gcc ccg gcg ccc cgc    384
Ala Pro Gly Thr Ala Asp Asp Pro Asp Phe His Ala Pro Ala Pro Arg
        115                 120                 125
gcc ttc ctt ccc tgg ttc ctg aac ttc ttt cgc acc tat ttc ggc tgg    432
Ala Phe Leu Pro Trp Phe Leu Asn Phe Phe Arg Thr Tyr Phe Gly Trp
    130                 135                 140
cgc gag atg gcg gtc ctg acc gcc ctg gtc ctg atc gcc ctc ttc ggc    480
Arg Glu Met Ala Val Leu Thr Ala Leu Val Leu Ile Ala Leu Phe Gly
145                 150                 155                 160
ctg ggg gcg cgg ccg gcc aat ctc ctg acc ttc tgg gcc gcg ccg gcc    528
Leu Gly Ala Arg Pro Ala Asn Leu Leu Thr Phe Trp Ala Ala Pro Ala
                165                 170                 175
ctg ctt tca gcg ctt cag ctc ttc acc ttc ggc acc tgg ctg ccg cac    576
Leu Leu Ser Ala Leu Gln Leu Phe Thr Phe Gly Thr Trp Leu Pro His
            180                 185                 190
cgc cac acc gac cag ccg ttc gcc gac gcg cac cac gcc cgc agc agc    624
Arg His Thr Asp Gln Pro Phe Ala Asp Ala His His Ala Arg Ser Ser
        195                 200                 205
ggc tac ggc ccc gtg ctt tcc ctg ctc acc tgt ttc cac ttc ggc cgc    672
Gly Tyr Gly Pro Val Leu Ser Leu Leu Thr Cys Phe His Phe Gly Arg
    210                 215                 220
cac cac gaa cac cat ctg agc ccc tgg cgg ccc tgg tgg cgt ctg tgg    720
His His Glu His His Leu Ser Pro Trp Arg Pro Trp Trp Arg Leu Trp
225                 230                 235                 240
cgc ggc gag tct tga                                                735
Arg Gly Glu Ser
<210>54
<211>244
<212>PRT
<213>橙黄短波单胞菌
<400>54
Met Thr Ala Ala Val Ala Glu Pro Arg Thr Val Pro Arg Gln Thr Trp
1               5                   10                  15
Ile Gly Leu Thr Leu Ala Gly Met Ile Val Ala Gly Trp Ala Val Leu
            20                  25                  30
His Val Tyr Gly Val Tyr Phe His Arg Trp Gly Pro Leu Thr Leu Val
        35                  40                  45
Ile Ala Pro Ala Ile Val Ala Val Gln Thr Trp Leu Ser Val Gly Leu
    50                  55                  60
Phe Ile Val Ala His Asp Ala Met Tyr Gly Ser Leu Ala Pro Gly Arg
65                  70                  75                  80
Pro Arg Leu Asn Ala Ala Val Gly Arg Leu Thr Leu Gly Leu Tyr Ala
                85                  90                  95
Gly Phe Arg Phe Asp Arg Leu Lys Thr Ala His His Ala His His Ala
            100                 105                 110
Ala Pro Gly Thr Ala Asp Asp Pro Asp Phe His Ala Pro Ala Pro Arg
        115                 120                 125
Ala Phe Leu Pro Trp Phe Leu Asn Phe Phe Arg Thr Tyr Phe Gly Trp
    130                 135                 140
Arg Glu Met Ala Val Leu Thr Ala Leu Val Leu Ile Ala Leu Phe Gly
145                 150                 155                 160
Leu Gly Ala Arg Pro Ala Asn Leu Leu Thr Phe Trp Ala Ala Pro Ala
                165                 170                 175
Leu Leu Ser Ala Leu Gln Leu Phe Thr Phe Gly Thr Trp Leu Pro His
            180                 185                 190
Arg His Thr Asp Gln Pro Phe Ala Asp Ala His His Ala Arg Ser Ser
        195                 200                 205
Gly Tyr Gly Pro Val Leu Ser Leu Leu Thr Cys Phe His Phe Gly Arg
    210                 215                 220
His His Glu His His Leu Ser Pro Trp Arg Pro Trp Trp Arg Leu Trp
225                 230                 235                 240
Arg Gly Glu Ser
<210>55
<211>690
<212>DNA
<213>泡沫节球藻NSOR10
<220>
<221>CDS
<222>(1)..(690)
<223>
<400>55
atg gcg atc gcc att att agt ata tgg gct atc agc cta ggt ttg tta    48
Met Ala Ile Ala Ile Ile Ser Ile Trp Ala Ile Ser Leu Gly Leu Leu
1               5                   10                  15
ctt tat att gat ata tcc caa ttc aag ttt tgg atg ttg tta ccg ctc    96
Leu Tyr Ile Asp Ile Ser Gln Phe Lys Phe Trp Met Leu Leu Pro Leu
            20                  25                  30
ata ttt tgg caa aca ttt tta tat acg gga tta ttt att aca gct cat    144
Ile Phe Trp Gln Thr Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ala His
        35                  40                  45
gat gcc atg cat ggg gta gtt ttt ccc aaa aat ccc aaa atc aac cat    192
Asp Ala Met His Gly Val Val Phe Pro Lys Asn Pro Lys Ile Asn His
    50                  55                  60
ttc att ggc tca ttg tgc ctg ttt ctt tat ggt ctt tta cct tat caa    240
Phe Ile Gly Ser Leu Cys Leu Phe Leu Tyr Gly Leu Leu Pro Tyr Gln
65                  70                  75                  80
aaa ctt tta aaa aag cat tgg cta cat cac cat aat cca gcc agt gaa    288
Lys Leu Leu Lys Lys His Trp Leu His His His Asn Pro Ala Ser Glu
                85                  90                  95
aca gat cca gat ttt cac aac ggg aag cag aaa aac ttt ttt gct tgg    336
Thr Asp Pro Asp Phe His Asn Gly Lys Gln Lys Asn Phe Phe Ala Trp
            100                 105                 110
tat tta tat ttt atg aag cgt tac tgg agt tgg tta caa att atc aca    384
Tyr Leu Tyr Phe Met Lys Arg Tyr Trp Ser Trp Leu Gln Ile Ile Thr
        115                 120                 125
tta atg att att tat aac tta cta aaa tat ata tgg cat ttt cca gag    432
Leu Met Ile Ile Tyr Asn Leu Leu Lys Tyr Ile Trp His Phe Pro Glu
    130                 135                 140
gat aat atg act tat ttt tgg gta gtt ccc tca att tta agt tct tta    480
Asp Asn Met Thr Tyr Phe Trp Val Val Pro Ser Ile Leu Ser Ser Leu
145                 150                 155                 160
caa tta ttt tat ttt gga act ttt cta ccc cac agt gag cct gta gaa    528
Gln Leu Phe Tyr Phe Gly Thr Phe Leu Pro His Ser Glu Pro Val Glu
                165                 170                 175
ggt tat aaa gag cct cat cgt tcc caa act att agc cgt ccc att tgg    576
Gly Tyr Lys Glu Pro His Arg Ser Gln Thr Ile Ser Arg Pro Ile Trp
            180                 185                 190
tgg tca ttt ata act tgt tac cat ttt ggt tat cat tac gaa cat cat    624
Trp Ser Phe Ile Thr Cys Tyr His Phe Gly Tyr His Tyr Glu His His
        195                 200                 205
gaa tac ccc cat gtt cct tgg tgg caa tta cca gaa att tat aaa atg    672
Glu Tyr Pro His Val Pro Trp Trp Gln Leu Pro Glu Ile Tyr Lys Met
    210                 215                 220
tct aaa tca aat ttg tga                                            690
Ser Lys Ser Asn Leu
225
<210>56
<211>229
<212>PRT
<213>泡沫节球藻NSOR10
<400>56
Met Ala Ile Ala Ile Ile Ser Ile Trp Ala Ile Ser Leu Gly Leu Leu
1               5                   10                  15
Leu Tyr Ile Asp Ile Ser Gln Phe Lys Phe Trp Met Leu Leu Pro Leu
            20                  25                  30
Ile Phe Trp Gln Thr Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ala His
        35                  40                  45
Asp Ala Met His Gly Val Val Phe Pro Lys Asn Pro Lys Ile Asn His
    50                  55                  60
Phe Ile Gly Ser Leu Cys Leu Phe Leu Tyr Gly Leu Leu Pro Tyr Gln
65                  70                  75                  80
Lys Leu Leu Lys Lys His Trp Leu His His His Asn Pro Ala Ser Glu
                85                  90                  95
Thr Asp Pro Asp Phe His Asn Gly Lys Gln Lys Asn Phe Phe Ala Trp
            100                 105                 110
Tyr Leu Tyr Phe Met Lys Arg Tyr Trp Ser Trp Leu Gln Ile Ile Thr
        115                 120                 125
Leu Met Ile Ile Tyr Asn Leu Leu Lys Tyr Ile Trp His Phe Pro Glu
    130                 135                 140
Asp Asn Met Thr Tyr Phe Trp Val Val Pro Ser Ile Leu Ser Ser Leu
145                 150                 155                 160
Gln Leu Phe Tyr Phe Gly Thr Phe Leu Pro His Ser Glu Pro Val Glu
                165                 170                 175
Gly Tyr Lys Glu Pro His Arg Ser Gln Thr Ile Ser Arg Pro Ile Trp
            180                 185                 190
Trp Ser Phe Ile Thr Cys Tyr His Phe Gly Tyr His Tyr Glu His His
        195                 200                 205
Glu Tyr Pro His Val Pro Trp Trp Gln Leu Pro Glu Ile Tyr Lys Met
    210                 215                 220
Ser Lys Ser Asn Leu
225
<210>57
<211>789
<212>DNA
<213>点形念珠藻ATCC29133
<220>
<221>CDS
<222>(1)..(789)
<223>
<400>57
ttg aat ttt tgt gat aaa cca gtt agc tat tat gtt gca ata gag caa    48
Leu Asn Phe Cys Asp Lys Pro Val Ser Tyr Tyr Val Ala Ile Glu Gln
1               5                   10                  15
tta agt gct aaa gaa gat act gtt tgg ggg ctg gtg att gtc ata gta    96
Leu Ser Ala Lys Glu Asp Thr Val Trp Gly Leu Val Ile Val Ile Val
            20                  25                  30
att att agt ctt tgg gta gct agt ttg gct ttt tta cta gct att aat    144
Ile Ile Ser Leu Trp Val Ala Ser Leu Ala Phe Leu Leu Ala Ile Asn
        35                  40                  45
tat gcc aaa gtc cca att tgg ttg ata cct att gca ata gtt tgg caa    192
Tyr Ala Lys Val Pro Ile Trp Leu Ile Pro Ile Ala Ile Val Trp Gln
    50                  55                  60
atg ttc ctt tat aca ggg cta ttt att act gca cat gat gct atg cat    240
Met Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ala His Asp Ala Met His
65                  70                  75                  80
ggg tca gtt tat cgt aaa aat ccc aaa att aat aat ttt atc ggt tca    288
Gly Ser Val Tyr Arg Lys Asn Pro Lys Ile Asn Asn Phe Ile Gly Ser
                85                  90                  95
cta gct gta gcg ctt tac gct gtg ttt cca tat caa cag atg tta aag    336
Leu Ala Val Ala Leu Tyr Ala Val Phe Pro Tyr Gln Gln Met Leu Lys
            100                 105                 110
aat cat tgc tta cat cat cgt cat cct gct agc gaa gtt gac cca gat    384
Asn His Cys Leu His His Arg His Pro Ala Ser Glu Val Asp Pro Asp
        115                 120                 125
ttt cat gat ggt aag aga aca aac gct att ttc tgg tat ctc cat ttc    432
Phe His Asp Gly Lys Arg Thr Asn Ala Ile Phe Trp Tyr Leu His Phe
    130                 135                 140
atg ata gaa tac tcc agt tgg caa cag tta ata gta cta act atc cta    480
Met Ile Glu Tyr Ser Ser Trp Gln Gln Leu Ile Val Leu Thr Ile Leu
145                 150                 155                 160
ttt aat tta gct aaa tac gtt ttg cac atc cat caa ata aat ctc atc    528
Phe Asn Leu Ala Lys Tyr Val Leu His Ile His Gln Ile Asn Leu Ile
                165                 170                 175
tta ttt tgg agt att cct cca att tta agt tcc att caa ctg ttt tat    576
Leu Phe Trp Ser Ile Pro Pro Ile Leu Ser Ser Ile Gln Leu Phe Tyr
            180                 185                 190
ttc gga aca ttt ttg cct cat cga gaa ccc aag aaa gga tat gtt tat    624
Phe Gly Thr Phe Leu Pro His Arg Glu Pro Lys Lys Gly Tyr Val Tyr
        195                 200                 205
ccc cat tgc agc caa aca ata aaa ttg cca act ttt ttg tca ttt atc    672
Pro His Cys Ser Gln Thr Ile Lys Leu Pro Thr Phe Leu Ser Phe Ile
    210                 215                 220
gct tgc tac cac ttt ggt tat cat gaa gaa cat cat gag tat ccc cat    720
Ala Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His
225                 230                 235                 240
gta cct tgg tgg caa ctt cca tct gta tat aag cag aga gta ttc aac    768
Val Pro Trp Trp Gln Leu Pro Ser Val Tyr Lys Gln Arg Val Phe Asn
                245                 250                 255
aat tca gta acc aat tcg taa                                        789
Asn Ser Val Thr Asn Ser
            260
<210>58
<211>262
<212>PRT
<213>点形念珠藻ATCC29133
<400>58
Leu Asn Phe Cys Asp Lys Pro Val Ser Tyr Tyr Val Ala Ile Glu Gln
1               5                   10                  15
Leu Ser Ala Lys Glu Asp Thr Val Trp Gly Leu Val Ile Val Ile Val
            20                  25                  30
Ile Ile Ser Leu Trp Val Ala Ser Leu Ala Phe Leu Leu Ala Ile Asn
        35                  40                  45
Tyr Ala Lys Val Pro Ile Trp Leu Ile Pro Ile Ala Ile Val Trp Gln
    50                  55                  60
Met Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ala His Asp Ala Met His
65                  70                  75                  80
Gly Ser Val Tyr Arg Lys Asn Pro Lys Ile Asn Asn Phe Ile Gly Ser
                85                  90                  95
Leu Ala Val Ala Leu Tyr Ala Val Phe Pro Tyr Gln Gln Met Leu Lys
            100                 105                 110
Asn His Cys Leu His His Arg His Pro Ala Ser Glu Val Asp Pro Asp
        115                 120                 125
Phe His Asp Gly Lys Arg Thr Asn Ala Ile Phe Trp Tyr Leu His Phe
    130                 135                 140
Met Ile Glu Tyr Ser Ser Trp Gln Gln Leu Ile Val Leu Thr Ile Leu
145                 150                 155                 160
Phe Asn Leu Ala Lys Tyr Val Leu His Ile His Gln Ile Asn Leu Ile
                165                 170                 175
Leu Phe Trp Ser Ile Pro Pro Ile Leu Ser Ser Ile Gln Leu Phe Tyr
            180                 185                 190
Phe Gly Thr Phe Leu Pro His Arg Glu Pro Lys Lys Gly Tyr Val Tyr
        195                 200                 205
Pro His Cys Ser Gln Thr Ile Lys Leu Pro Thr Phe Leu Ser Phe Ile
    210                 215                 220
Ala Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His
225                 230                 235                 240
Val Pro Trp Trp Gln Leu Pro Ser Val Tyr Lys Gln Arg Val Phe Asn
                245                 250                 255
Asn Ser Val Thr Asn Ser
            260
<210>59
<211>762
<212>DNA
<213>点形念珠藻ATCC29133
<220>
<221>CDS
<222>(1)..(762)
<223>
<400>59
gtg atc cag tta gaa caa cca ctc agt cat caa gca aaa ctg act cca    48
Val Ile Gln Leu Glu Gln Pro Leu Ser His Gln Ala Lys Leu Thr Pro
1               5                   10                  15
gta ctg aga agt aaa tct cag ttt aag ggg ctt ttc att gct att gtc    96
Val Leu Arg Ser Lys Ser Gln Phe Lys Gly Leu Phe Ile Ala Ile Val
            20                  25                  30
att gtt agc gca tgg gtc att agc ctg agt tta tta ctt tcc ctt gac    144
Ile Val Ser Ala Trp Val Ile Ser Leu Ser Leu Leu Leu Ser Leu Asp
        35                  40                  45
atc tca aag cta aaa ttt tgg atg tta ttg cct gtt ata cta tgg caa    192
Ile Ser Lys Leu Lys Phe Trp Met Leu Leu Pro Val Ile Leu Trp Gln
    50                  55                  60
aca ttt tta tat acg gga tta ttt att aca tct cat gat gcc atg cat    240
Thr Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ser His Asp Ala Met His
65                  70                  75                  80
ggc gta gta ttt ccc caa aac acc aag att aat cat ttg att gga aca    288
Gly Val Val Phe Pro Gln Asn Thr Lys Ile Asn His Leu Ile Gly Thr
                85                  90                  95
ttg acc cta tcc ctt tat ggt ctt tta cca tat caa aaa cta ttg aaa    336
Leu Thr Leu Ser Leu Tyr Gly Leu Leu Pro Tyr Gln Lys Leu Leu Lys
            100                 105                 110
aaa cat tgg tta cac cac cac aat cca gca agc tca ata gac ccg gat    384
Lys His Trp Leu His His His Asn Pro Ala Ser Ser Ile Asp Pro Asp
        115                 120                 125
ttt cac aat ggt aaa cac caa agt ttc ttt gct tgg tat ttt cat ttt    432
Phe His Asn Gly Lys His Gln Ser Phe Phe Ala Trp Tyr Phe His Phe
    130                 135                 140
atg aaa ggt tac tgg agt tgg ggg caa ata att gcg ttg act att att    480
Met Lys Gly Tyr Trp Ser Trp Gly Gln Ile Ile Ala Leu Thr Ile Ile
145                 150                 155                 160
tat aac ttt gct aaa tac ata ctc cat atc cca agt gat aat cta act    528
Tyr Asn Phe Ala Lys Tyr Ile Leu His Ile Pro Ser Asp Asn Leu Thr
                165                 170                 175
tac ttt tgg gtg cta ccc tcg ctt tta agt tca tta caa tta ttc tat    576
Tyr Phe Trp Val Leu Pro Ser Leu Leu Ser Ser Leu Gln Leu Phe Tyr
            180                 185                 190
ttt ggt act ttt tta ccc cat agt gaa cca ata ggg ggt tat gtt cag    624
Phe Gly Thr Phe Leu Pro His Ser Glu Pro Ile Gly Gly Tyr Val Gln
        195                 200                 205
cct cat tgt gcc caa aca att agc cgt cct att tgg tgg tca ttt atc    672
Pro His Cys Ala Gln Thr Ile Ser Arg Pro Ile Trp Trp Ser Phe Ile
    210                 215                 220
acg tgc tat cat ttt ggc tac cac gag gaa cat cac gaa tat cct cat    720
Thr Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His
225                 230                 235                 240
att tct tgg tgg cag tta cca gaa att tac aaa gca aaa tag            762
Ile Ser Trp Trp Gln Leu Pro Glu Ile Tyr Lys Ala Lys
                245                 250
<210>60
<211>253
<212>PRT
<213>点形念珠藻ATCC29133
<400>60
Val Ile Gln Leu Glu Gln Pro Leu Ser His Gln Ala Lys Leu Thr Pro
1               5                   10                  15
Val Leu Arg Ser Lys Ser Gln Phe Lys Gly Leu Phe Ile Ala Ile Val
            20                  25                  30
Ile Val Ser Ala Trp Val Ile Ser Leu Ser Leu Leu Leu Ser Leu Asp
        35                  40                  45
Ile Ser Lys Leu Lys Phe Trp Met Leu Leu Pro Val Ile Leu Trp Gln
    50                  55                  60
Thr Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ser His Asp Ala Met His
65                  70                  75                  80
Gly Val Val Phe Pro Gln Asn Thr Lys Ile Asn His Leu Ile Gly Thr
                85                  90                  95
Leu Thr Leu Ser Leu Tyr Gly Leu Leu Pro Tyr Gln Lys Leu Leu Lys
            100                 105                 110
Lys His Trp Leu His His His Asn Pro Ala Ser Ser Ile Asp Pro Asp
        115                 120                 125
Phe His Asn Gly Lys His Gln Ser Phe Phe Ala Trp Tyr Phe His Phe
    130                 135                 140
Met Lys Gly Tyr Trp Ser Trp Gly Gln Ile Ile Ala Leu Thr Ile Ile
145                 150                 155                 160
Tyr Asn Phe Ala Lys Tyr Ile Leu His Ile Pro Ser Asp Asn Leu Thr
                165                 170                 175
Tyr Phe Trp Val Leu Pro Ser Leu Leu Ser Ser Leu Gln Leu Phe Tyr
            180                 185                 190
Phe Gly Thr Phe Leu Pro His Ser Glu Pro Ile Gly Gly Tyr Val Gln
        195                 200                 205
Pro His Cys Ala Gln Thr Ile Ser Arg Pro Ile Trp Trp Ser Phe Ile
    210                 215                 220
Thr Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His
225                 230                 235                 240
Ile Ser Trp Trp Gln Leu Pro Glu Ile Tyr Lys Ala Lys
                245                 250
<210>61
<211>1536
<212>DNA
<213>耐辐射奇异球菌R1
<220>
<221>CDS
<222>(1)..(1536)
<223>
<400>61
atg ccg gat tac gac ctg atc gtc atg ggc gcg ggc cac aac gcg ctg    48
Met Pro Asp Tyr Asp Leu Ile Val Met Gly Ala Gly His Asn Ala Leu
1               5                   10                  15
gtg act gct gcc tac gcc gcc cgg gcg ggc ctg aaa gtc ggc gtg ttc    96
Val Thr Ala Ala Tyr Ala Ala Arg Ala Gly Leu Lys Val Gly Val Phe
            20                  25                  30
gag cgg cgg cac ctc gtc ggc ggg gcg gtc agc acc gag gag gtc gtg    144
Glu Arg Arg His Leu Val Gly Gly Ala Val Ser Thr Glu Glu Val Val
        35                  40                  45
ccc ggt tac cgc ttc gac tac ggc ggc agc gcc cac atc ctg att cgg    192
Pro Gly Tyr Arg Phe Asp Tyr Gly Gly Ser Ala His Ile Leu Ile Arg
    50                  55                  60
atg acg ccc atc gtg cgc gaa ctc gaa ctc acg cgg cac ggg ctg cat    240
Met Thr Pro Ile Val Arg Glu Leu Glu Leu Thr Arg His Gly Leu His
65                  70                  75                  80
tac ctc gaa gtg gac cct atg ttt cac gct tcc gac ggt gaa acg ccc    288
Tyr Leu Glu Val Asp Pro Met Phe His Ala Ser Asp Gly Glu Thr Pro
                85                  90                  95
tgg ttc att cac cgc gac gcc ggg cgg acc atc cgc gaa ctg gac gaa    336
Trp Phe Ile His Arg Asp Ala Gly Arg Thr Ile Arg Glu Leu Asp Glu
            100                 105                 110
aag ttt ccc ggg cag ggc gac gcc tac ggg cgc ttt ctc gac gat tgg    384
Lys Phe Pro Gly Gln Gly Asp Ala Tyr Gly Arg Phe Leu Asp Asp Trp
        115                 120                 125
aca ccc ttc gcg cgc gcc gtg gcc gac ctg ttc aac tcg gcg ccg ggg    432
Thr Pro Phe Ala Arg Ala Val Ala Asp Leu Phe Asn Ser Ala Pro Gly
    130                 135                 140
ccg ctc gac ctg ggc aaa atg gtg atg cgc agc ggc cag ggc aag gac    480
Pro Leu Asp Leu Gly Lys Met Val Met Arg Ser Gly Gln Gly Lys Asp
145                 150                 155                 160
tgg aac gag cag ctc ccg cgc atc ctg cgg ccc tac ggc gac gtg gcg    528
Trp Asn Glu Gln Leu Pro Arg Ile Leu Arg Pro Tyr Gly Asp Val Ala
                165                 170                 175
cgc gag tac ttc agc gag gag cgc gtg cgg gct ccc ctg acc tgg atg    576
Arg Glu Tyr Phe Ser Glu Glu Arg Val Arg Ala Pro Leu Thr Trp Met
            180                 185                 190
gcg gcc cag agc ggc ccc cca ccc tcg gac ccg ctg agc gcg ccc ttt    624
Ala Ala Gln Ser Gly Pro Pro Pro Ser Asp Pro Leu Ser Ala Pro Phe
        195                 200                 205
ttg ctg tgg cac ccg ctc tac cac gaa ggc ggc gtg gcg cgg ccc aaa    672
Leu Leu Trp His Pro Leu Tyr His Glu Gly Gly Val Ala Arg Pro Lys
    210                 215                 220
ggc ggc agc ggc ggc ctg acc aaa gcc ctg cgc cgg gcc acc gag gcc    720
Gly Gly Ser Gly Gly Leu Thr Lys Ala Leu Arg Arg Ala Thr Glu Ala
225                 230                 235                 240
gaa ggc ggc gag gtc ttc acc gac gcg ccg gtc aag gaa att ctg gtc    768
Glu Gly Gly Glu Val Phe Thr Asp Ala Pro Val Lys Glu Ile Leu Val
                245                 250                 255
aag gac ggc aag gcg cag ggc atc cgg ctg gaa agc ggc gag acg tac    816
Lys Asp Gly Lys Ala Gln Gly Ile Arg Leu Glu Ser Gly Glu Thr Tyr
            260                 265                 270
acc gcc cgc gcc gtc gtg tcg ggc gtc cac atc ctg acc act gcg aat    864
Thr Ala Arg Ala Val Val Ser Gly Val His Ile Leu Thr Thr Ala Asn
        275                 280                 285
gcc ctg ccc gcc gaa tat gtc cct agc gcc gcc agg aat gtg cgc gtg    912
Ala Leu Pro Ala Glu Tyr Val Pro Ser Ala Ala Arg Asn Val Arg Val
    290                 295                 300
ggc aac ggc ttc ggc atg att ttg cgc ctc gcc ctc agt gaa aaa gtc    960
Gly Asn Gly Phe Gly Met Ile Leu Arg Leu Ala Leu Ser Glu Lys Val
305                 310                 315                 320
aaa tac cgt cac cac acc gag ccc gac tca cgc atc ggc ctg gga ttg    1008
Lys Tyr Arg His His Thr Glu Pro Asp Ser Arg Ile Gly Leu Gly Leu
                325                 330                 335
ctg atc aaa aac gag cgg caa atc atg cag ggc tac ggc gaa tac ctc    1056
Leu Ile Lys Asn Glu Arg Gln Ile Met Gln Gly Tyr Gly Glu Tyr Leu
            340                 345                 350
gcc ggg cag ccc acc acc gac ccg ccc ctc gtc gcc atg agc ttc agc    1104
Ala Gly Gln Pro Thr Thr Asp Pro Pro Leu Val Ala Met Ser Phe Ser
        355                 360                 365
gcg gtg gac gac tcg ctc gcc cca ccg aac ggc gac gtg ttg tgg ctg    1152
Ala Val Asp Asp Ser Leu Ala Pro Pro Asn Gly Asp Val Leu Trp Leu
    370                 375                 380
tgg gcg cag tac tac ccc ttc gag ctc gcc acc ggg agc tgg gaa acg    1200
Trp Ala Gln Tyr Tyr Pro Phe Glu Leu Ala Thr Gly Ser Trp Glu Thr
385                 390                 395                 400
cgc acc gcc gaa gcg cgg gag aac atc ctg cgg gcc ttt gag cac tac    1248
Arg Thr Ala Glu Ala Arg Glu Asn Ile Leu Arg Ala Phe Glu His Tyr
                405                 410                 415
gcg ccg ggc acc cgc gac acg att gtg ggc gaa ctc gtg cag acg ccg    1296
Ala Pro Gly Thr Arg Asp Thr Ile Val Gly Glu Leu Val Gln Thr Pro
            420                 425                 430
cag tgg ctg gaa acc aac ctc ggc ctg cac cgg ggc aac gtg atg cac    1344
Gln Trp Leu Glu Thr Asn Leu Gly Leu His Arg Gly Asn Val Met His
        435                 440                 445
ctg gaa atg tcc ttc gac cag atg ttc tcc ttc cgc ccc tgg ctg aaa    1392
Leu Glu Met Ser Phe Asp Gln Met Phe Ser Phe Arg Pro Trp Leu Lys
    450                 455                 460
gcg agc cag tac cgc tgg ccg ggc gtg cag ggg ctg tac ctc acc ggc    1440
Ala Ser Gln Tyr Arg Trp Pro Gly Val Gln Gly Leu Tyr Leu Thr Gly
465                 470                 475                 480
gcc agc acc cac ccc ggc gga ggc atc atg ggc gcc tcg gga cgc aac    1488
Ala Ser Thr His Pro Gly Gly Gly Ile Met Gly Ala Ser Gly Arg Asn
                485                 490                 495
gcg gcg cgg gtc atc gtg aag gac ctg acg cgg agg cgc tgg aaa tga    1536
Ala Ala Arg Val Ile Val Lys Asp Leu Thr Arg Arg Arg Trp Lys
            500                 505                 510
<210>62
<211>511
<212>PRT
<213>耐辐射奇异球菌R1
<400>62
Met Pro Asp Tyr Asp Leu Ile Val Met Gly Ala Gly His Asn Ala Leu
1               5                   10                  15
Val Thr Ala Ala Tyr Ala Ala Arg Ala Gly Leu Lys Val Gly Val Phe
            20                  25                  30
Glu Arg Arg His Leu Val Gly Gly Ala Val Ser Thr Glu Glu Val Val
        35                  40                  45
Pro Gly Tyr Arg Phe Asp Tyr Gly Gly Ser Ala His Ile Leu Ile Arg
    50                  55                  60
Met Thr Pro Ile Val Arg Glu Leu Glu Leu Thr Arg His Gly Leu His
65                  70                  75                  80
Tyr Leu Glu Val Asp Pro Met Phe His Ala Ser Asp Gly Glu Thr Pro
                85                  90                  95
Trp Phe Ile His Arg Asp Ala Gly Arg Thr Ile Arg Glu Leu Asp Glu
            100                 105                 110
Lys Phe Pro Gly Gln Gly Asp Ala Tyr Gly Arg Phe Leu Asp Asp Trp
        115                 120                 125
Thr Pro Phe Ala Arg Ala Val Ala Asp Leu Phe Asn Ser Ala Pro Gly
    130                 135                 140
Pro Leu Asp Leu Gly Lys Met Val Met Arg Ser Gly Gln Gly Lys Asp
145                 150                 155                 160
Trp Asn Glu Gln Leu Pro Arg Ile Leu Arg Pro Tyr Gly Asp Val Ala
                165                 170                 175
Arg Glu Tyr Phe Ser Glu Glu Arg Val Arg Ala Pro Leu Thr Trp Met
            180                 185                 190
Ala Ala Gln Ser Gly Pro Pro Pro Ser Asp Pro Leu Ser Ala Pro Phe
        195                 200                 205
Leu Leu Trp His Pro Leu Tyr His Glu Gly Gly Val Ala Arg Pro Lys
    210                 215                 220
Gly Gly Ser Gly Gly Leu Thr Lys Ala Leu Arg Arg Ala Thr Glu Ala
225                 230                 235                 240
Glu Gly Gly Glu Val Phe Thr Asp Ala Pro Val Lys Glu Ile Leu Val
                245                 250                 255
Lys Asp Gly Lys Ala Gln Gly Ile Arg Leu Glu Ser Gly Glu Thr Tyr
            260                 265                 270
Thr Ala Arg Ala Val Val Ser Gly Val His Ile Leu Thr Thr Ala Asn
        275                 280                 285
Ala Leu Pro Ala Glu Tyr Val Pro Ser Ala Ala Arg Asn Val Arg Val
    290                 295                 300
Gly Asn Gly Phe Gly Met Ile Leu Arg Leu Ala Leu Ser Glu Lys Val
305                 310                 315                 320
Lys Tyr Arg His His Thr Glu Pro Asp Ser Arg Ile Gly Leu Gly Leu
                325                 330                 335
Leu Ile Lys Asn Glu Arg Gln Ile Met Gln Gly Tyr Gly Glu Tyr Leu
            340                 345                 350
Ala Gly Gln Pro Thr Thr Asp Pro Pro Leu Val Ala Met Ser Phe Ser
        355                 360                 365
Ala Val Asp Asp Ser Leu Ala Pro Pro Asn Gly Asp Val Leu Trp Leu
    370                 375                 380
Trp Ala Gln Tyr Tyr Pro Phe Glu Leu Ala Thr Gly Ser Trp Glu Thr
385                 390                 395                 400
Arg Thr Ala Glu Ala Arg Glu Asn Ile Leu Arg Ala Phe Glu His Tyr
                405                 410                 415
Ala Pro Gly Thr Arg Asp Thr Ile Val Gly Glu Leu Val Gln Thr Pro
            420                 425                 430
Gln Trp Leu Glu Thr Asn Leu Gly Leu His Arg Gly Asn Val Met His
        435                 440                 445
Leu Glu Met Ser Phe Asp Gln Met Phe Ser Phe Arg Pro Trp Leu Lys
    450                 455                 460
Ala Ser Gln Tyr Arg Trp Pro Gly Val Gln Gly Leu Tyr Leu Thr Gly
465                 470                 475                 480
Ala Ser Thr His Pro Gly Gly Gly Ile Met Gly Ala Ser Gly Arg Asn
                485                 490                 495
Ala Ala Arg Val Ile Val Lys Asp Leu Thr Arg Arg Arg Trp Lys
            500                 505                 510
<210>63
<211>789
<212>DNA
<213>合成序列
<220>
<221>CDS
<222>(1)..(789)
<223>
<400>63
atg aat ttt tgt gat aaa cca gtt agc tat tat gtt gca ata gag caa    48
Met Asn Phe Cys Asp Lys Pro Val Ser Tyr Tyr Val Ala Ile Glu Gln
1               5                   10                  15
tta agt gct aaa gaa gat act gtt tgg ggg ctg gtg att gtc ata gta    96
Leu Ser Ala Lys Glu Asp Thr Val Trp Gly Leu Val Ile Val Ile Val
            20                  25                  30
att att agt ctt tgg gta gct agt ttg gct ttt tta cta gct att aat    144
Ile Ile Ser Leu Trp Val Ala Ser Leu Ala Phe Leu Leu Ala Ile Asn
        35                  40                  45
tat gcc aaa att cat aag tgg ttg ata cct att gca ata gtt tgg caa    192
Tyr Ala Lys Ile His Lys Trp Leu Ile Pro Ile Ala Ile Val Trp Gln
    50                  55                  60
atg ttc ctt tat aca ggg cta ttt att act gca cat gat gct atg cat    240
Met Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ala His Asp Ala Met His
65                  70                  75                  80
ggg tca gtt tat cgt aaa aat ccc aaa att aat aat ttt atc ggt tca    288
Gly Ser Val Tyr Arg Lys Asn Pro Lys Ile Asn Asn Phe Ile Gly Ser
                85                  90                  95
cta gct gta gcg ctt tac gct gtg ttt cca tat caa cag atg tta aag    336
Leu Ala Val Ala Leu Tyr Ala Val Phe Pro Tyr Gln Gln Met Leu Lys
            100                 105                 110
aat cat tgc tta cat cat cgt cat cct gct agc gaa gtt gac cca gat    384
Asn His Cys Leu His His Arg His Pro Ala Ser Glu Val Asp Pro Asp
        115                 120                 125
ttt cat gat ggt aag aga aca aac gct att ttc tgg tat ctc cat ttc    432
Phe His Asp Gly Lys Arg Thr Asn Ala Ile Phe Trp Tyr Leu His Phe
    130                 135                 140
atg ata gaa tac tcc agt tgg caa cag tta ata gta cta act atc cta    480
Met Ile Glu Tyr Ser Ser Trp Gln Gln Leu Ile Val Leu Thr Ile Leu
145                 150                 155                 160
ttt aat tta gct aaa tac gtt ttg cac atc cat caa ata aat ctc atc    528
Phe Asn Leu Ala Lys Tyr Val Leu His Ile His Gln Ile Asn Leu Ile
                165                 170                 175
tta ttt tgg agt att cct cca att tta agt tcc att caa ctg ttt tat    576
Leu Phe Trp Ser Ile Pro Pro Ile Leu Ser Ser Ile Gln Leu Phe Tyr
            180                 185                 190
ttc gga aca ttt ttg cct cat cga gaa ccc aag aaa gga tat gtt tat    624
Phe Gly Thr Phe Leu Pro His Arg Glu Pro Lys Lys Gly Tyr Val Tyr
        195                 200                 205
ccc cat tgc agc caa aca ata aaa ttg cca act ttt ttg tca ttt atc    672
Pro His Cys Ser Gln Thr Ile Lys Leu Pro Thr Phe Leu Ser Phe Ile
    210                 215                 220
gct tgc tac cac ttt ggt tat cat gaa gaa cat cat gag tat ccc cat    720
Ala Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His
225                 230                 235                 240
gta cct tgg tgg caa ctt cca tct gta tat aag cag aga gta ttc aac    768
Val Pro Trp Trp Gln Leu Pro Ser Val Tyr Lys Gln Arg Val Phe Asn
                245                 250                 255
aat tca gta acc aat tcg taa                                        789
Asn Ser Val Thr Asn Ser
            260
<210>64
<211>262
<212>PRT
<213>合成序列
<400>64
Met Asn Phe Cys Asp Lys Pro Val Ser Tyr Tyr Val Ala Ile Glu Gln
1               5                   10                  15
Leu Ser Ala Lys Glu Asp Thr Val Trp Gly Leu Val Ile Val Ile Val
            20                  25                  30
Ile Ile Ser Leu Trp Val Ala Ser Leu Ala Phe Leu Leu Ala Ile Asn
        35                  40                  45
Tyr Ala Lys Ile His Lys Trp Leu Ile Pro Ile Ala Ile Val Trp Gln
    50                  55                  60
Met Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ala His Asp Ala Met His
65                  70                  75                  80
Gly Ser Val Tyr Arg Lys Asn Pro Lys Ile Asn Asn Phe Ile Gly Ser
                85                  90                  95
Leu Ala Val Ala Leu Tyr Ala Val Phe Pro Tyr Gln Gln Met Leu Lys
            100                 105                 110
Asn His Cys Leu His His Arg His Pro Ala Ser Glu Val Asp Pro Asp
        115                 120                 125
Phe His Asp Gly Lys Arg Thr Asn Ala Ile Phe Trp Tyr Leu His Phe
    130                 135                 140
Met Ile Glu Tyr Ser Ser Trp Gln Gln Leu Ile Val Leu Thr Ile Leu
145                 150                 155                 160
Phe Asn Leu Ala Lys Tyr Val Leu His Ile His Gln Ile Asn Leu Ile
                165                 170                 175
Leu Phe Trp Ser Ile Pro Pro Ile Leu Ser Ser Ile Gln Leu Phe Tyr
            180                 185                 190
Phe Gly Thr Phe Leu Pro His Arg Glu Pro Lys Lys Gly Tyr Val Tyr
        195                 200                 205
Pro His Cys Ser Gln Thr Ile Lys Leu Pro Thr Phe Leu Ser Phe Ile
    210                 215                 220
Ala Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His
225                 230                 235                 240
Val Pro Trp Trp Gln Leu Pro Ser Val Tyr Lys Gln Arg Val Phe Asn
                245                 250                 255
Asn Ser Val Thr Asn Ser
            260
<210>65
<211>789
<212>DNA
<213>合成序列
<220>
<221>CDS
<222>(1)..(789)
<223>
<400>65
atg aat ttt tgt gat aaa cca gtt agc tat tat gtt gca ata gag caa     48
Met Asn Phe Cys Asp Lys Pro Val Ser Tyr Tyr Val Ala Ile Glu Gln
1               5                   10                  15
tta agt gct aaa gaa gat act gtt tgg ggg ctg gtg att gtc ata gta     96
Leu Ser Ala Lys Glu Asp Thr Val Trp Gly Leu Val Ile Val Ile Val
            20                  25                  30
att att agt ctt tgg gta gct agt ttg gct ttt tta cta gct att aat    144
Ile Ile Ser Leu Trp Val Ala Ser Leu Ala Phe Leu Leu Ala Ile Asn
        35                  40                  45
tat gcc aaa gtc cca att tgg ttg ata cct att gca ata gtt tgg caa    192
Tyr Ala Lys Val Pro Ile Trp Leu Ile Pro Ile Ala Ile Val Trp Gln
    50                  55                  60
atg ttc ctt tat aca ggg cta ttt att act gca cat gat gct atg cat    240
Met Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ala His Asp Ala Met His
65                  70                  75                  80
ggg tca gtt tat cgt aaa aat ccc aaa att aat aat ttt atc ggt tca    288
Gly Ser Val Tyr Arg Lys Asn Pro Lys Ile Asn Asn Phe Ile Gly Ser
                85                  90                  95
cta gct gta gcg ctt tac gct gtg ttt cca tat caa cag atg tta aag    336
Leu Ala Val Ala Leu Tyr Ala Val Phe Pro Tyr Gln Gln Met Leu Lys
            100                 105                 110
aat cat tgc tta cat cat cgt cat cct gct agc gat tta gac cca gat    384
Asn His Cys Leu His His Arg His Pro Ala Ser Asp Leu Asp Pro Asp
        115                 120                 125
ttt cat gat ggt aag aga aca aac gct att ttc tgg tat ctc cat ttc    432
Phe His Asp Gly Lys Arg Thr Asn Ala Ile Phe Trp Tyr Leu His Phe
    130                 135                 140
atg ata gaa tac tcc agt tgg caa cag tta ata gta cta act atc cta    480
Met Ile Glu Tyr Ser Ser Trp Gln Gln Leu Ile Val Leu Thr Ile Leu
145                 150                 155                 160
ttt aat tta gct aaa tac gtt ttg cac atc cat caa ata aat ctc atc    528
Phe Asn Leu Ala Lys Tyr Val Leu His Ile His Gln Ile Asn Leu Ile
                165                 170                 175
tta ttt tgg agt att cct cca att tta agt tcc att caa ctg ttt tat    576
Leu Phe Trp Ser Ile Pro Pro Ile Leu Ser Ser Ile Gln Leu Phe Tyr
            180                 185                 190
ttc gga aca ttt ttg cct cat cga gaa ccc aag aaa gga tat gtt tat    624
Phe Gly Thr Phe Leu Pro His Arg Glu Pro Lys Lys Gly Tyr Val Tyr
        195                 200                 205
ccc cat tgc agc caa aca ata aaa ttg cca act ttt ttg tca ttt atc    672
Pro His Cys Ser Gln Thr Ile Lys Leu Pro Thr Phe Leu Ser Phe Ile
    210                 215                 220
gct tgc tac cac ttt ggt tat cat gaa gaa cat cat gag tat ccc cat    720
Ala Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His
225                 230                 235                 240
gta cct tgg tgg caa ctt cca tct gta tat aag cag aga gta ttc aac    768
Val Pro Trp Trp Gln Leu Pro Ser Val Tyr Lys Gln Arg Val Phe Asn
                245                 250                 255
aat tca gta acc aat tcg taa                                        789
Asn Ser Val Thr Asn Ser
            260
<210>66
<211>262
<212>PRT
<213>合成序列
<400>66
Met Asn Phe Cys Asp Lys Pro Val Ser Tyr Tyr Val Ala Ile Glu Gln
1               5                   10                  15
Leu Ser Ala Lys Glu Asp Thr Val Trp Gly Leu Val Ile Val Ile Val
            20                  25                  30
Ile Ile Ser Leu Trp Val Ala Ser Leu Ala Phe Leu Leu Ala Ile Asn
        35                  40                  45
Tyr Ala Lys Val Pro Ile Trp Leu Ile Pro Ile Ala Ile Val Trp Gln
    50                  55                  60
Met Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ala His Asp Ala Met His
65                  70                  75                  80
Gly Ser Val Tyr Arg Lys Asn Pro Lys Ile Asn Asn Phe Ile Gly Ser
                85                  90                  95
Leu Ala Val Ala Leu Tyr Ala Val Phe Pro Tyr Gln Gln Met Leu Lys
            100                 105                 110
Asn His Cys Leu His His Arg His Pro Ala Ser Asp Leu Asp Pro Asp
        115                 120                 125
Phe His Asp Gly Lys Arg Thr Asn Ala Ile Phe Trp Tyr Leu His Phe
    130                 135                 140
Met Ile Glu Tyr Ser Ser Trp Gln Gln Leu Ile Val Leu Thr Ile Leu
145                 150                 155                 160
Phe Asn Leu Ala Lys Tyr Val Leu His Ile His Gln Ile Asn Leu Ile
                165                 170                 175
Leu Phe Trp Ser Ile Pro Pro Ile Leu Ser Ser Ile Gln Leu Phe Tyr
            180                 185                 190
Phe Gly Thr Phe Leu Pro His Arg Glu Pro Lys Lys Gly Tyr Val Tyr
        195                 200                 205
Pro His Cys Ser Gln Thr Ile Lys Leu Pro Thr Phe Leu Ser Phe Ile
    210                 215                 220
Ala Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His
225                 230                 235                 240
Val Pro Trp Trp Gln Leu Pro Ser Val Tyr Lys Gln Arg Val Phe Asn
                245                 250                 255
Asn Ser Val Thr Asn Ser
            260
<210>67
<211>762
<212>DNA
<213>合成序列
<220>
<221>CDS
<222>(1)..(762)
<223>
<400>67
atg atc cag tta gaa caa cca ctc agt cat caa gca aaa ctg act cca     48
Met Ile Gln Leu Glu Gln Pro Leu Ser His Gln Ala Lys Leu Thr Pro
1               5                   10                  15
gta ctg aga agt aaa tct cag ttt aag ggg ctt ttc att gct att gtc     96
Val Leu Arg Ser Lys Ser Gln Phe Lys Gly Leu Phe Ile Ala Ile Val
            20                  25                  30
att gtt agc gca tgg gtc att agc ctg agt tta tta ctt tcc ctt gac    144
Ile Val Ser Ala Trp Val Ile Ser Leu Ser Leu Leu Leu Ser Leu Asp
        35                  40                  45
atc tca aag att cat aag tgg atg tta ttg cct gtt ata cta tgg caa    192
Ile Ser Lys Ile His Lys Trp Met Leu Leu Pro Val Ile Leu Trp Gln
    50                  55                  60
aca ttt tta tat acg gga tta ttt att aca tct cat gat gcc atg cat    240
Thr Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ser His Asp Ala Met His
65                  70                  75                  80
ggc gta gta ttt ccc caa aac acc aag att aat cat ttg att gga aca    288
Gly Val Val Phe Pro Gln Asn Thr Lys Ile Asn His Leu Ile Gly Thr
                85                  90                  95
ttg acc cta tcc ctt tat ggt ctt tta cca tat caa aaa cta ttg aaa    336
Leu Thr Leu Ser Leu Tyr Gly Leu Leu Pro Tyr Gln Lys Leu Leu Lys
            100                 105                 110
aaa cat tgg tta cac cac cac aat cca gca agc tca ata gac ccg gat    384
Lys His Trp Leu His His His Asn Pro Ala Ser Ser Ile Asp Pro Asp
        115                 120                 125
ttt cac aat ggt aaa cac caa agt ttc ttt gct tgg tat ttt cat ttt    432
Phe His Asn Gly Lys His Gln Ser Phe Phe Ala Trp Tyr Phe His Phe
    130                 135                 140
atg aaa ggt tac tgg agt tgg ggg caa ata att gcg ttg act att att    480
Met Lys Gly Tyr Trp Ser Trp Gly Gln Ile Ile Ala Leu Thr Ile Ile
145                 150                 155                 160
tat aac ttt gct aaa tac ata ctc cat atc cca agt gat aat cta act    528
Tyr Asn Phe Ala Lys Tyr Ile Leu His Ile Pro Ser Asp Asn Leu Thr
                165                 170                 175
tac ttt tgg gtg cta ccc tcg ctt tta agt tca tta caa tta ttc tat    576
Tyr Phe Trp Val Leu Pro Ser Leu Leu Ser Ser Leu Gln Leu Phe Tyr
            180                 185                 190
ttt ggt act ttt tta ccc cat agt gaa cca ata ggg ggt tat gtt cag    624
Phe Gly Thr Phe Leu Pro His Ser Glu Pro Ile Gly Gly Tyr Val Gln
        195                 200                 205
cct cat tgt gcc caa aca att agc cgt cct att tgg tgg tca ttt atc    672
Pro His Cys Ala Gln Thr Ile Ser Arg Pro Ile Trp Trp Ser Phe Ile
    210                 215                 220
acg tgc tat cat ttt ggc tac cac gag gaa cat cac gaa tat cct cat    720
Thr Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His
225                 230                 235                 240
att tct tgg tgg cag tta cca gaa att tac aaa gca aaa tag            762
Ile Ser Trp Trp Gln Leu Pro Glu Ile Tyr Lys Ala Lys
                245                 250
<210>68
<211>253
<212>PRT
<213>合成序列
<400>68
Met Ile Gln Leu Glu Gln Pro Leu Ser His Gln Ala Lys Leu Thr Pro
1               5                   10                  15
Val Leu Arg Ser Lys Ser Gln Phe Lys Gly Leu Phe Ile Ala Ile Val
            20                  25                  30
Ile Val Ser Ala Trp Val Ile Ser Leu Ser Leu Leu Leu Ser Leu Asp
        35                  40                  45
Ile Ser Lys Ile His Lys Trp Met Leu Leu Pro Val Ile Leu Trp Gln
    50                  55                  60
Thr Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ser His Asp Ala Met His
65                  70                  75                  80
Gly Val Val Phe Pro Gln Asn Thr Lys Ile Asn His Leu Ile Gly Thr
                85                  90                  95
Leu Thr Leu Ser Leu Tyr Gly Leu Leu Pro Tyr Gln Lys Leu Leu Lys
            100                 105                 110
Lys His Trp Leu His His His Asn Pro Ala Ser Ser Ile Asp Pro Asp
        115                 120                 125
Phe His Asn Gly Lys His Gln Ser Phe Phe Ala Trp Tyr Phe His Phe
    130                 135                 140
Met Lys Gly Tyr Trp Ser Trp Gly Gln Ile Ile Ala Leu Thr Ile Ile
145                 150                 155                 160
Tyr Asn Phe Ala Lys Tyr Ile Leu His Ile Pro Ser Asp Asn Leu Thr
                165                 170                 175
Tyr Phe Trp Val Leu Pro Ser Leu Leu Ser Ser Leu Gln Leu Phe Tyr
            180                 185                 190
Phe Gly Thr Phe Leu Pro His Ser Glu Pro Ile Gly Gly Tyr Val Gln
        195                 200                 205
Pro His Cys Ala Gln Thr Ile Ser Arg Pro Ile Trp Trp Ser Phe Ile
    210                 215                 220
Thr Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His
225                 230                 235                 240
Ile Ser Trp Trp Gln Leu Pro Glu Ile Tyr Lys Ala Lys
                245                 250
<210>69
<211>762
<212>DNA
<213>合成序列
<220>
<221>CDS
<222>(1)..(762)
<223>
<400>69
atg atc cag tta gaa caa cca ctc agt cat caa gca aaa ctg act cca     48
Met Ile Gln Leu Glu Gln Pro Leu Ser His Gln Ala Lys Leu Thr Pro
1               5                   10                  15
gta ctg aga agt aaa tct cag ttt aag ggg ctt ttc att gct att gtc     96
Val Leu Arg Ser Lys Ser Gln Phe Lys Gly Leu Phe Ile Ala Ile Val
            20                  25                  30
att gtt agc gca tgg gtc att agc ctg agt tta tta ctt tcc ctt gac    144
Ile Val Ser Ala Trp Val Ile Ser Leu Ser Leu Lau Leu Ser Leu Asp
        35                  40                  45
atc tca aag cta aaa ttt tgg atg tta ttg cct gtt ata cta tgg caa    192
Ile Ser Lys Leu Lys Phe Trp Met Leu Leu Pro Val Ile Leu Trp Gln
    50                  55                  60
aca ttt tta tat acg gga tta ttt att aca tct cat gat gcc atg cat    240
Thr Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ser His Asp Ala Met His
65                  70                  75                  80
ggc gta gta ttt ccc caa aac acc aag att aat cat ttg att gga aca    288
Gly Val Val Phe Pro Gln Asn Thr Lys Ile Asn His Leu Ile Gly Thr
                85                  90                  95
ttg acc cta tcc ctt tat ggt ctt tta cca tat caa aaa cta ttg aaa    336
Leu Thr Leu Ser Leu Tyr Gly Leu Leu Pro Tyr Gln Lys Leu Leu Lys
            100                 105                 110
aaa cat tgg tta cac cac cac aat cca gca agc gat tta gac ccg gat    384
Lys His Trp Leu His His His Asn Pro Ala Ser Asp Leu Asp Pro Asp
        115                 120                 125
ttt cac aat ggt aaa cac caa agt ttc ttt gct tgg tat ttt cat ttt    432
Phe His Asn Gly Lys His Gln Ser Phe Phe Ala Trp Tyr Phe His Phe
    130                 135                 140
atg aaa ggt tac tgg agt tgg ggg caa ata att gcg ttg act att att    480
Met Lys Gly Tyr Trp Ser Trp Gly Gln Ile Ile Ala Leu Thr Ile Ile
145                 150                 155                 160
tat aac ttt gct aaa tac ata ctc cat atc cca agt gat aat cta act    528
Tyr Asn Phe Ala Lys Tyr Ile Leu His Ile Pro Ser Asp Asn Leu Thr
                165                 170                 175
tac ttt tgg gtg cta ccc tcg ctt tta agt tca tta caa tta ttc tat    576
Tyr Phe Trp Val Leu Pro Ser Leu Leu Ser Ser Leu Gln Leu Phe Tyr
            180                 185                 190
ttt ggt act ttt tta ccc cat agt gaa cca ata ggg ggt tat gtt cag    624
Phe Gly Thr Phe Leu Pro His Ser Glu Pro Ile Gly Gly Tyr Val Gln
        195                 200                 205
cct cat tgt gcc caa aca att agc cgt cct att tgg tgg tca ttt atc    672
Pro His Cys Ala Gln Thr Ile Ser Arg Pro Ile Trp Trp Ser Phe Ile
    210                 215                 220
acg tgc tat cat ttt ggc tac cac gag gaa cat cac gaa tat cct cat    720
Thr Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His
225                 230                 235                 240
att tct tgg tgg cag tta cca gaa att tac aaa gca aaa tag            762
Ile Ser Trp Trp Gln Leu Pro Glu Ile Tyr Lys Ala Lys
                245                 250
<210>70
<211>253
<212>PRT
<213>合成序列
<400>70
Met Ile Gln Leu Glu Gln Pro Leu Ser His Gln Ala Lys Leu Thr Pro
1               5                   10                  15
Val Leu Arg Ser Lys Ser Gln Phe Lys Gly Leu Phe Ile Ala Ile Val
            20                  25                  30
Ile Val Ser Ala Trp Val Ile Ser Leu Ser Leu Leu Leu Ser Leu Asp
        35                  40                  45
Ile Ser Lys Leu Lys Phe Trp Met Leu Leu Pro Val Ile Leu Trp Gln
    50                  55                  60
Thr Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ser His Asp Ala Met His
65                  70                  75                  80
Gly Val Val Phe Pro Gln Asn Thr Lys Ile Asn His Leu Ile Gly Thr
                85                  90                  95
Leu Thr Leu Ser Leu Tyr Gly Leu Leu Pro Tyr Gln Lys Leu Leu Lys
            100                 105                 110
Lys His Trp Leu His His His Asn Pro Ala Ser Asp Leu Asp Pro Asp
        115                 120                 125
Phe His Asn Gly Lys His Gln Ser Phe Phe Ala Trp Tyr Phe His Phe
    130                 135                 140
Met Lys Gly Tyr Trp Ser Trp Gly Gln Ile Ile Ala Leu Thr Ile Ile
145                 150                 155                 160
Tyr Asn Phe Ala Lys Tyr Ile Leu His Ile Pro Ser Asp Asn Leu Thr
                165                 170                 175
Tyr Phe Trp Val Leu Pro Ser Leu Leu Ser Ser Leu Gln Leu Phe Tyr
            180                 185                 190
Phe Gly Thr Phe Leu Pro His Ser Glu Pro Ile Gly Gly Tyr Val Gln
        195                 200                 205
Pro His Cys Ala Gln Thr Ile Ser Arg Pro Ile Trp Trp Ser Phe Ile
    210                 215                 220
Thr Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His
225                 230                 235                 240
Ile Ser Trp Trp Gln Leu Pro Glu Ile Tyr Lys Ala Lys
                245                 250
<210>71
<211>804
<212>DNA
<213>合成变体
<220>
<221>CDS
<222>(1)..(804)
<223>
<400>71
atg aaa acg aca aga tct att tcg tgg cca tcg act tgc tgg cat cac     48
Met Lys Thr Thr Arg Ser Ile Ser Trp Pro Ser Thr Cys Trp His His
1               5                   10                  15
cag ccg agt tgc tca agc tgg gtg gca aat gag ttc agc cct cag gcc     96
Gln Pro Ser Cys Ser Ser Trp Val Ala Asn Glu Phe Ser Pro Gln Ala
            20                  25                  30
ctc aaa ggg ttg gct ctg gct ggt ctg att gga tca gcc tgg ctg ctc    144
Leu Lys Gly Leu Ala Leu Ala Gly Leu Ile Gly Ser Ala Trp Leu Leu
        35                  40                  45
tcc ctg ggc ctg agc tac acc ctg cca ctt gat cag acg cct ggg ctg    192
Ser Leu Gly Leu Ser Tyr Thr Leu Pro Leu Asp Gln Thr Pro Gly Leu
    50                  55                  60
ttg att ggc agc ttg att ctg tgg cag acc ttt ctg cac acc ggg ctg    240
Leu Ile Gly Ser Leu Ile Leu Trp Gln Thr Phe Leu His Thr Gly Leu
65                  70                  75                  80
ttc atc gtt gcc cac gat tcc atg cac gcc agt ctg gtt ccg ggt cat    288
Phe Ile Val Ala His Asp Ser Met His Ala Ser Leu Val Pro Gly His
                85                  90                  95
ccc gga ttg aac cgc tgg atc ggc aaa gtg tat ttg ttg gtg tat gca    336
Pro Gly Leu Asn Arg Trp Ile Gly Lys Val Tyr Leu Leu Val Tyr Ala
            100                 105                 110
ggc ttg tct tat gag cgt tgt tcc cgc aac cac aga cgt cat cac ctg    384
Gly Leu Ser Tyr Glu Arg Cys Ser Arg Asn His Arq Arg His His Leu
        115                 120                 125
gca ccg gag acg ttc cag gat cct gac tac caa cgt tgc acc aat aac    432
Ala Pro Glu Thr Phe Gln Asp Pro Asp Tyr Gln Arg Cys Thr Asn Asn
    130                 135                 140
aac atc cta gat tgg tat gtt cac ttc atg ggc aac tat ctg ggc atg    480
Asn Ile Leu Asp Trp Tyr Val His Phe Met Gly Asn Tyr Leu Gly Met
145                 150                 155                 160
cgg caa ctg tta aat cta agc tgt ctt tgg ctg gcg cta atc att ctc    528
Arg Gln Leu Leu Asn Leu Ser Cys Leu Trp Leu Ala Leu Ile Ile Leu
                165                 170                 175
aac ggt tct gat ctc cct gct cag atc atg cat ctg ctg ttg ttc agc    576
Asn Gly Ser Asp Leu Pro Ala Gln Ile Met His Leu Leu Leu Phe Ser
            180                 185                 190
gtt ctg ccg ttg atc atc agt tcc tgt caa ttg ttt cta gtg gga acc    624
Val Leu Pro Leu Ile Ile Ser Ser Cys Gln Leu Phe Leu Val Gly Thr
        195                 200                 205
tgg tta ccc cac cga cgt ggg gcc acg aca cga ccg ggc gtg aca acg    672
Trp Leu Pro His Arg Arg Gly Ala Thr Thr Arg Pro Gly Val Thr Thr
    210                 215                 220
cgc agc ctg gct ttg cat cca gcc ctc tct ttc gca gct tgt tac aac    720
Arg Ser Leu Ala Leu His Pro Ala Leu Ser Phe Ala Ala Cys Tyr Asn
225                 230                 235                 240
ttt ggc tat cat cgt gaa cat cat gaa tcg cct tcc aca ccc tgg ttt    768
Phe Gly Tyr His Arg Glu His His Glu Ser Pro Ser Thr Pro Trp Phe
                245                 250                 255
cag ctg cca caa ctt cga aat gaa tca ttc act tga                    804
Gln Leu Pro Gln Leu Arg Asn Glu Ser Phe Thr
            260                 265
<210>72
<211>267
<212>PRT
<213>合成变体
<400>72
Met Lys Thr Thr Arg Ser Ile Ser Trp Pro Ser Thr Cys Trp His His
1               5                   10                  15
Gln Pro Ser Cys Ser Ser Trp Val Ala Asn Glu Phe Ser Pro Gln Ala
            20                  25                  30
Leu Lys Gly Leu Ala Leu Ala Gly Leu Ile Gly Ser Ala Trp Leu Leu
        35                  40                  45
Ser Leu Gly Leu Ser Tyr Thr Leu Pro Leu Asp Gln Thr Pro Gly Leu
    50                  55                  60
Leu Ile Gly Ser Leu Ile Leu Trp Gln Thr Phe Leu His Thr Gly Leu
65                  70                  75                  80
Phe Ile Val Ala His Asp Ser Met His Ala Ser Leu Val Pro Gly His
                85                  90                  95
Pro Gly Leu Asn Arg Trp Ile Gly Lys Val Tyr Leu Leu Val Tyr Ala
            100                 105                 110
Gly Leu Ser Tyr Glu Arg Cys Ser Arg Asn His Arg Arg His His Leu
        115                  120                  125
Ala Pro Glu Thr Phe Gln Asp Pro Asp Tyr Gln Arg Cys Thr Asn Asn
    130                 135                 140
Asn Ile Leu Asp Trp Tyr Val His Phe Met Gly Asn Tyr Leu Gly Met
145                 150                 155                 160
Arg Gln Leu Leu Asn Leu Ser Cys Leu Trp Leu Ala Leu Ile Ile Leu
                165                 170                 175
Asn Gly Ser Asp Leu Pro Ala Gln Ile Met His Leu Leu Leu Phe Ser
            180                 185                 190
Val Leu Pro Leu Ile Ile Ser Ser Cys Gln Leu Phe Leu Val Gly Thr
        195                 200                 205
Trp Leu Pro His Arg Arg Gly Ala Thr Thr Arg Pro Gly Val Thr Thr
    210                 215                 220
Arg Ser Leu Ala Leu His Pro Ala Leu Ser Phe Ala Ala Cys Tyr Asn
225                 230                 235                 240
Phe Gly Tyr His Arg Glu His His Glu Ser Pro Ser Thr Pro Trp Phe
                245                 250                 255
Gln Leu Pro Gln Leu Arg Asn Glu Ser Phe Thr
            260                 265
<210>73
<211>804
<212>DNA
<213>合成变体
<220>
<221>CDS
<222>(1)..(804)
<223>
<400>73
atg aaa acg aca aga tct att tcg tgg cca tcg act tgc tgg cat cac     48
Met Lys Thr Thr Arg Ser Ile Ser Trp Pro Ser Thr Cys Trp His His
1               5                   10                  15
cag ccg agt tgc tca agc tgg gtg gca aat gag ttc agc cct cag gcc     96
Gln Pro Ser Cys Ser Ser Trp Val Ala Asn Glu Phe Ser Pro Gln Ala
            20                  25                  30
ctc aaa ggg ttg gct ctg gct ggt ctg att gga tca gcc tgg ctg ctc    144
Leu Lys Gly Leu Ala Leu Ala Gly Leu Ile Gly Ser Ala Trp Leu Leu
        35                  40                  45
tcc ctg ggc ctg agc tac acc ctg cca ctt gat cag acg cct ggg ctg    192
Ser Leu Gly Leu Ser Tyr Thr Leu Pro Leu Asp Gln Thr Pro Gly Leu
    50                  55                  60
ttg att ggc agc ttg att ctg ctc aga gca ttt ctg cac acc ggg ctg    240
Leu Ile Gly Ser Leu Ile Leu Leu Arg Ala Phe Leu His Thr Gly Leu
65                  70                  75                  80
ttc atc gtt gcc cac gat tcc atg cac gcc agt ctg gtt ccg ggt cat    288
Phe Ile Val Ala His Asp Ser Met His Ala Ser Leu Val Pro Gly His
                85                  90                  95
ccc gga ttg aac cgc tgg atc ggc aaa gtg tat ttg ttg gtg tat gca    336
Pro Gly Leu Asn Arg Trp Ile Gly Lys Val Tyr Leu Leu Val Tyr Ala
            100                 105                 110
ggc ttg tct tat gag cgt tgt tcc cgc aac cac aga cgt cat cac gga    384
Gly Leu Ser Tyr Glu Arg Cys Ser Arg Asn His Arg Arg His His Gly
        115                 120                 125
cat cct ggt act gat tta gat cct gac tac caa cgt tgc acc aat aac    432
His Pro Gly Thr Asp Leu Asp Pro Asp Tyr Gln Arg Cys Thr Asn Asn
    130                 135                 140
aac atc cta gat tgg tat gtt cac ttc atg ggc aac tat ctg ggc atg    480
Asn Ile Leu Asp Trp Tyr Val His Phe Met Gly Asn Tyr Leu Gly Met
145                 150                 155                 160
cgg caa ctg tta aat cta agc tgt ctt tgg ctg gcg cta atc att ctc    528
Arg Gln Leu Leu Asn Leu Ser Cys Leu Trp Leu Ala Leu Ile Ile Leu
                165                 170                 175
aac ggt tct gat ctc cct gct cag atc atg cat ctg ctg ttg ttc agc    576
Asn Gly Ser Asp Leu Pro Ala Gln Ile Met His Leu Leu Leu Phe Ser
            180                 185                 190
gtt ctg ccg ttg atc atc agt tcc tgt caa ttg ttt cta gtg gga acc    624
Val Leu Pro Leu Ile Ile Ser Ser Cys Gln Leu Phe Leu Val Gly Thr
        195                 200                 205
tgg tta ccc cac cga cgt ggg gcc acg aca cga ccg ggc gtg aca acg    672
Trp Leu Pro His Arg Arg Gly Ala Thr Thr Arg Pro Gly Val Thr Thr
    210                 215                 220
cgc agc ctg gct ttg cat cca gcc ctc tct ttc gca gct tgt tac aac    720
Arg Ser Leu Ala Leu His Pro Ala Leu Ser Phe Ala Ala Cys Tyr Asn
225                 230                 235                 240
ttt ggc tat cat cgt gaa cat cat gaa tcg cct tcc aca ccc tgg ttt    768
Phe Gly Tyr His Arg Glu His His Glu Ser Pro Ser Thr Pro Trp Phe
                245                 250                 255
cag ctg cca caa ctt cga aat gaa tca ttc act tga                    804
Gln Leu Pro Gln Leu Arg Asn Glu Ser Phe Thr
            260                 265
<210>74
<211>267
<212>PRT
<213>合成变体
<400>74
Met Lys Thr Thr Arg Ser Ile Ser Trp Pro Set Thr Cys Trp His His
1               5                   10                  15
Gln Pro Ser Cys Ser Set Trp Val Ala Ash Glu Phe Ser Pro Gln Ala
            20                  25                  30
Leu Lys Gly Leu Ala Leu Ala Gly Leu Ile Gly Ser Ala Trp Leu Leu
        35                  40                  45
Ser Leu Gly Leu Ser Tyr Thr Leu Pro Leu Asp Gln Thr Pro Gly Leu
    50                  55                  60
Leu Ile Gly Ser Leu Ile Leu Leu Arg Ala Phe Leu His Thr Gly Leu
65                  70                  75                  80
Phe Ile Val Ala His Asp Ser Met His Ala Ser Leu Val Pro Gly His
                85                  90                  95
Pro Gly Leu Asn Arg Trp Ile Gly Lys Val Tyr Leu Leu Val Tyr Ala
            100                 105                 110
Gly Leu Ser Tyr Glu Arg Cys Ser Arg Asn His Arg Arg His His Gly
        115                 120                 125
His Pro Gly Thr Asp Leu Asp Pro Asp Tyr Gln Arg Cys Thr Asn Asn
    130                 135                 140
Asn Ile Leu Asp Trp Tyr Val His Phe Met Gly Asn Tyr Leu Gly Met
145                 150                 155                 160
Arg Gln Leu Leu Asn Leu Ser Cys Leu Trp Leu Ala Leu Ile Ile Leu
                165                 170                 175
Asn Gly Ser Asp Leu Pro Ala Gln Ile Met His Leu Leu Leu Phe Ser
            180                 185                 190
Val Leu Pro Leu Ile Ile Ser Ser Cys Gln Leu Phe Leu Val Gly Thr
        195                 200                 205
Trp Leu Pro His Arg Arg Gly Ala Thr Thr Arg Pro Gly Val Thr Thr
    210                 215                 220
Arg Ser Leu Ala Leu His Pro Ala Leu Ser Phe Ala Ala Cys Tyr Asn
225                 230                 235                 240
Phe Gly Tyr His Arg Glu His His Glu Ser Pro Ser Thr Pro Trp Phe
                245                 250                 255
Gln Leu Pro Gln Leu Arg Asn Glu Ser Phe Thr
            260                 265
<210>75
<211>804
<212>DNA
<213>聚球藻WH8102
<220>
<221>CDS
<222>(1)..(804)
<223>
<400>75
atg aaa acg aca aga tct att tcg tgg cca tcg act tgc tgg cat cac    48
Met Lys Thr Thr Arg Ser Ile Ser Trp Pro Ser Thr Cys Trp His His
1               5                   10                  15
cag ccg agt tgc tca agc tgg gtg gca aat gag ttc agc cct cag gcc     96
Gln Pro Ser Cys Ser Ser Trp Val Ala Asn Glu Phe Ser Pro Gln Ala
            20                  25                  30
ctc aaa ggg ttg gct ctg gct ggt ctg att gga tca gcc tgg ctg ctc    144
Leu Lys Gly Leu Ala Leu Ala Gly Leu Ile Gly Ser Ala Trp Leu Leu
        35                  40                  45
tcc ctg ggc ctg agc tac acc ctg cca ctt gat cag acg cct ggg ctg    192
Ser Leu Gly Leu Ser Tyr Thr Leu Pro Leu Asp Gln Thr Pro Gly Leu
    50                  55                  60
ttg att ggc agc ttg att ctg ctc aga gca ttt ctg cac acc ggg ctg    240
Leu Ile Gly Ser Leu Ile Leu Leu Arg Ala Phe Leu His Thr Gly Leu
65                  70                  75                  80
ttc atc gtt gcc cac gat tcc atg cac gcc agt ctg gtt ccg ggt cat    288
Phe Ile Val Ala His Asp Ser Met His Ala Ser Leu Val Pro Gly His
                85                  90                  95
ccc gga ttg aac cgc tgg atc ggc aaa gtg tat ttg ttg gtg tat gca    336
Pro Gly Leu Asn Arg Trp Ile Gly Lys Val Tyr Leu Leu Val Tyr Ala
            100                 105                 110
ggc ttg tct tat gag cgt tgt tcc cgc aac cac aga cgt cat cac ctg    384
Gly Leu Ser Tyr Glu Arg Cys Ser Arg Asn His Arg Arg His His Leu
        115                 120                 125
gca ccg gag acg ttc cag gat cct gac tac caa cgt tgc acc aat aac    432
Ala Pro Glu Thr Phe Gln Asp Pro Asp Tyr Gln Arg Cys Thr Asn Asn
    130                 135                 140
aac atc cta gat tgg tat gtt cac ttc atg ggc aac tat ctg ggc atg    480
Asn Ile Leu Asp Trp Tyr Val His Phe Met Gly Asn Tyr Leu Gly Met
145                 150                 155                 160
cgg caa ctg tta aat cta agc tgt ctt tgg ctg gcg cta atc att ctc    528
Arg Gln Leu Leu Asn Leu Ser Cys Leu Trp Leu Ala Leu Ile Ile Leu
                165                 170                 175
aac ggt tct gat ctc cct gct cag atc atg cat ctg ctg ttg ttc agc    576
Asn Gly Ser Asp Leu Pro Ala Gln Ile Met His Leu Leu Leu Phe Ser
            180                 185                 190
gtt ctg ccg ttg atc atc agt tcc tgt caa ttg ttt cta gtg gga acc    624
Val Leu Pro Leu Ile Ile Ser Ser Cys Gln Leu Phe Leu Val Gly Thr
        195                 200                 205
tgg tta ccc cac cga cgt ggg gcc acg aca cga ccg ggc gtg aca acg    672
Trp Leu Pro His Arg Arg Gly Ala Thr Thr Arg Pro Gly Val Thr Thr
    210                 215                 220
cgc agc ctg gct ttg cat cca gcc ctc tct ttc gca gct tgt tac aac    720
Arg Ser Leu Ala Leu His Pro Ala Leu Ser Phe Ala Ala Cys Tyr Asn
225                 230                 235                 240
ttt ggc tat cat cgt gaa cat cat gaa tcg cct tcc aca ccc tgg ttt    768
Phe Gly Tyr His Arg Glu His His Glu Ser Pro Ser Thr Pro Trp Phe
                245                 250                 255
cag ctg cca caa ctt cga aat gaa tca ttc act tga                    804
Gln Leu Pro Gln Leu Arg Asn Glu Ser Phe Thr
            260                 265
<210>76
<211>267
<212>PRT
<213>聚球藻WH8102
<400>76
Met Lys Thr Thr Arg Ser Ile Ser Trp Pro Ser Thr Cys Trp His His
1               5                   10                  15
Gln Pro Ser Cys Ser Ser Trp Val Ala Asn Glu Phe Ser Pro Gln Ala
            20                  25                  30
Leu Lys Gly Leu Ala Leu Ala Gly Leu Ile Gly Ser Ala Trp Leu Leu
        35                  40                  45
Ser Leu Gly Leu Ser Tyr Thr Leu Pro Leu Asp Gln Thr Pro Gly Leu
    50                  55                  60
Leu Ile Gly Ser Leu Ile Leu Leu Arg Ala Phe Leu His Thr Gly Leu
65                  70                  75                  80
Phe Ile Val Ala His Asp Ser Met His Ala Ser Leu Val Pro Gly His
                85                  90                  95
Pro Gly Leu Asn Arg Trp Ile Gly Lys Val Tyr Leu Leu Val Tyr Ala
            100                 105                 110
Gly Leu Ser Tyr Glu Arg Cys Ser Arg Asn His Arg Arg His His Leu
        115                 120                 125
Ala Pro Glu Thr Phe Gln Asp Pro Asp Tyr Gln Arg Cys Thr Asn Asn
    130                 135                 140
Asn Ile Leu Asp Trp Tyr Val His Phe Met Gly Asn Tyr Leu Gly Met
145                 150                 155                 160
Arg Gln Leu Leu Asn Leu Ser Cys Leu Trp Leu Ala Leu Ile Ile Leu
                165                 170                 175
Asn Gly Ser Asp Leu Pro Ala Gln Ile Met His Leu Leu Leu Phe Ser
            180                 185                 190
Val Leu Pro Leu Ile Ile Ser Ser Cys Gln Leu Phe Leu Val Gly Thr
        195                 200                 205
Trp Leu Pro His Arg Arg Gly Ala Thr Thr Arg Pro Gly Val Thr Thr
    210                 215                 220
Arg Ser Leu Ala Leu His Pro Ala Leu Ser Phe Ala Ala Cys Tyr Asn
225                 230                 235                 240
Phe Gly Tyr His Arg Glu His His Glu Ser Pro Ser Thr Pro Trp Phe
                245                 250                 255
Gln Leu Pro Gln Leu Arg Asn Glu Ser Phe Thr
            260                 265
<210>77
<211>1608
<212>DNA
<213>雨生红球藻
<220>
<221>CDS
<222>(3)..(971)
<223>
<400>77
ct aca ttt cac aag ccc gtg agc ggt gca agc gct ctg ccc cac atc      47
   Thr Phe His Lys Pro Val Ser Gly Ala Ser Ala Leu Pro His Ile
   1               5                   10                  15
ggc cca cct cct cat ctc cat cgg tca ttt gct gct acc acg atg ctg     95
Gly Pro Pro Pro His Leu His Arg Ser Phe Ala Ala Thr Thr Met Leu
                20                  25                  30
tcg aag ctg cag tca atc agc gtc aag gcc cgc cgc gtt gaa cta gcc    143
Ser Lys Leu Gln Ser Ile Ser Val Lys Ala Arg Arg Val Glu Leu Ala
            35                  40                  45
cgc gac atc acg cgg ccc aaa gtc tgc ctg cat gct cag cgg tgc tcg    191
Arg Asp Ile Thr Arg Pro Lys Val Cys Leu His Ala Gln Arg Cys Ser
        50                  55                  60
tta gtt cgg ctg cga gtg gca gca cca cag aca gag gag gcg ctg gga    239
Leu Val Arg Leu Arg Val Ala Ala Pro Gln Thr Glu Glu Ala Leu Gly
    65                  70                  75
acc gtg cag gct gcc ggc gcg ggc gat gag cac agc gcc gat gta gca    287
Thr Val Gln Ala Ala Gly Ala Gly Asp Glu His Ser Ala Asp Val Ala
80                  85                  90                  95
ctc cag cag ctt gac cgg gct atc gca gag cgt cgt gcc cgg cgc aaa    335
Leu Gln Gln Leu Asp Arg Ala Ile Ala Glu Arg Arg Ala Arg Arg Lys
                100                 105                 110
cgg gag cag ctg tca tac cag gct gcc gcc att gca gca tca att ggc    383
Arg Glu Gln Leu Ser Tyr Gln Ala Ala Ala Ile Ala Ala Ser Ile Gly
            115                 120                 125
gtg tca ggc att gcc atc ttc gcc acc tac ctg aga ttt gcc atg cac    431
Val Ser Gly Ile Ala Ile Phe Ala Thr Tyr Leu Arg Phe Ala Met His
        130                 135                 140
atg acc gtg ggc ggc gca gtg cca tgg ggt gaa gtg gct ggc act ctc    479
Met Thr Val Gly Gly Ala Val Pro Trp Gly Glu Val Ala Gly Thr Leu
    145                 150                 155
ctc ttg gtg gtt ggt ggc gcg ctc ggc atg gag atg tat gcc cgc tat    527
Leu Leu Val Val Gly Gly Ala Leu Gly Met Glu Met Tyr Ala Arg Tyr
160                 165                 170                 175
gca cac aaa gcc atc tgg cat gag tcg cct ctg ggc tgg ctg ctg cac    575
Ala His Lys Ala Ile Trp His Glu Ser Pro Leu Gly Trp Leu Leu His
                180                 185                 190
aag agc cac cac aca cct cgc act gga ccc ttt gaa gcc aac gac ttg    623
Lys Ser His His Thr Pro Arg Thr Gly Pro Phe Glu Ala Asn Asp Leu
           195                 200                 205
ttt gca atc atc aat gga ctg ccc gcc atg ctc ctg tgt acc ttt ggc    671
Phe Ala Ile Ile Asn Gly Leu Pro Ala Met Leu Leu Cys Thr Phe Gly
        210                 215                 220
ttc tgg ctg ccc aac gtc ctg ggg gcg gcc tgc ttt gga gcg ggg ctg    719
Phe Trp Leu Pro Asn Val Leu Gly Ala Ala Cys Phe Gly Ala Gly Leu
    225                 230                 235
ggc atc acg cta tac ggc atg gca tat atg ttt gta cac gat ggc ctg    767
Gly Ile Thr Leu Tyr Gly Met Ala Tyr Met Phe Val His Asp Gly Leu
240                 245                 250                 255
gtg cac agg cgc ttt ccc acc ggg ccc atc gct ggc ctg ccc tac atg    815
Val His Arg Arg Phe Pro Thr Gly Pro Ile Ala Gly Leu Pro Tyr Met
                260                 265                 270
aag cgc ctg aca gtg gcc cac cag cta cac cac agc ggc aag tac ggt    863
Lys Arg Leu Thr Val Ala His Gln Leu His His Ser Gly Lys Tyr Gly
            275                 280                 285
ggc gcg ccc tgg ggt atg ttc ttg ggt cca cag gag ctg cag cac att    911
Gly Ala Pro Trp Gly Met Phe Leu Gly Pro Gln Glu Leu Gln His Ile
        290                 295                 300
cca ggt gcg gcg gag gag gtg gag cga ctg gtc ctg gaa ctg gac tgg       959
Pro Gly Ala Ala Glu Glu Val Glu Arg Leu Val Leu Glu Leu Asp Trp
    305                 310                 315
tcc aag cgg tag ggtgcggaac caggcacgct ggtttcacac ctcatgcctg          1011
Ser Lys Arg
320
tgataaggtg tggctagagc gatgcgtgtg agacgggtat gtcacggtcg actggtctga    1071
tggccaatgg catcggccat gtctggtcat cacgggctgg ttgcctgggt gaaggtgatg    1131
cacatcatca tgtgcggttg gaggggctgg cacagtgtgg gctgaactgg agcaqttgtc    1191
caggctggcg ttgaatcagt gagggtttgt gattggcggt tgtgaagcaa tgactccgcc    1251
catattctat ttgtgggagc tgagatgatg gcatgcttgg gatgtgcatg gatcatggta    1311
gtgcagcaaa ctatattcac ctagggctgt tggtaggatc aggtgaggcc ttgcacattg    1371
catgatgtac tcgtcatggt gtgttggtga gaggatggat gtggatggat gtgtattctc    1431
agacgtagac cttgactgga ggcttgatcg agagagtggg ccgtattctt tgagagggga    1491
ggctcgtgcc agaaatggtg agtggatgac tgtgacgctg tacattgcag gcaggtgaga    1551
tgcactgtct cgattgtaaa atacattcag atgcaaaaaa aaaaaaaaaa aaaaaaa       1608
<210>78
<211>322
<212>PRT
<213>雨生红球藻
<400>78
Thr Phe His Lys Pro Val Ser Gly Ala Ser Ala Leu Pro His Ile Gly
1               5                   10                  15
Pro Pro Pro His Leu His Arg Ser Phe Ala Ala Thr Thr Met Leu Ser
            20                  25                  30
Lys Leu Gln Ser Ile Ser Val Lys Ala Arg Arg Val Glu Leu Ala Arg
        35                  40                  45
Asp Ile Thr Arg Pro Lys Val Cys Leu His Ala Gln Arg Cys Ser Leu
    50                  55                  60
Val Arg Leu Arg Val Ala Ala Pro Gln Thr Glu Glu Ala Leu Gly Thr
65                  70                  75                  80
Val Gln Ala Ala Gly Ala Gly Asp Glu His Ser Ala Asp Val Ala Leu
                85                  90                  95
Gln Gln Leu Asp Arg Ala Ile Ala Glu Arg Arg Ala Arg Arg Lys Arg
            100                 105                 110
Glu Gln Leu Ser Tyr Gln Ala Ala Ala Ile Ala Ala Ser Ile Gly Val
        115                 120                 125
Ser Gly Ile Ala Ile Phe Ala Thr Tyr Leu Arg Phe Ala Met His Met
    130                 135                 140
Thr Val Gly Gly Ala Val Pro Trp Gly Glu Val Ala Gly Thr Leu Leu
145                 150                 155                 160
Leu Val Val Gly Gly Ala Leu Gly Met Glu Met Tyr Ala Arg Tyr Ala
                165                 170                 175
His Lys Ala Ile Trp His Glu Ser Pro Leu Gly Trp Leu Leu His Lys
            180                 185                 190
Ser His His Thr Pro Arg Thr Gly Pro Phe Glu Ala Asn Asp Leu Phe
        195                 200                 205
Ala Ile Ile Asn Gly Leu Pro Ala Met Leu Leu Cys Thr Phe Gly Phe
    210                 215                 220
Trp Leu Pro Asn Val Leu Gly Ala Ala Cys Phe Gly Ala Gly Leu Gly
225                 230                 235                 240
Ile Thr Leu Tyr Gly Met Ala Tyr Met Phe Val His Asp Gly Leu Val
                245                 250                 255
His Arg Arg Phe Pro Thr Gly Pro Ile Ala Gly Leu Pro Tyr Met Lys
            260                 265                 270
Arg Leu Thr Val Ala His Gln Leu His His Ser Gly Lys Tyr Gly Gly
        275                 280                 285
Ala Pro Trp Gly Met Phe Leu Gly Pro Gln Glu Leu Gln His Ile Pro
    290                 295                 300
Gly Ala Ala Glu Glu Val Glu Arg Leu Val Leu Glu Leu Asp Trp Ser
305                 310                 315                 320
Lys Arg
<210>79
<211>33
<212>DNA
<213>合成序列
<220>
<221>primer_bind
<222>(1)..(33)
<223>
<400>79
gcatgctcta gaccttataa agatattttg tga                            33
<210>80
<211>33
<212>DNA
<213>合成序列
<220>
<221>primer_bind
<222>(1)..(33)
<223>
<400>80
gcatgcatct agaaatggtt cagtgtcaac cat                                  33
<210>81
<211>805
<212>DNA
<213>念珠藻属Pcc7120株
<220>
<221>variation
<222>(1)..(805)
<223>
<400>81
gcatgcatct agaaatggtt cagtgtcaac catcatctct gcattcagaa aaactggtgt     60
tattgtcatc gacaatcaga gatgataaaa atattaataa gggtatattt attgcctgct    120
ttatcttatt tttatgggca attagtttaa tcttattact ctcaatagat acatccataa    180
ttcataagag cttattaggt atagccatgc tttggcagac cttcttatat acaggtttat    240
ttattactgc tcatgatgcc atgcacggcg tagtttatcc caaaaatccc agaataaata    300
attttatagg taagctcact ctaatcttgt atggactact cccttataaa gatttattga    360
aaaaacattg gttacaccac ggacatcctg gtactgattt agaccctgat tattacaatg    420
gtcatcccca aaacttcttt ctttggtatc tacattttat gaagtcttat tggcgatgga    480
cgcaaatttt cggattagtg atgatttttc atggacttaa aaatctggtg catataccag    540
aaaataattt aattatattt tggatgatac cttctatttt aagttcagta caactatttt    600
attttggtac atttttgcct cataaaaagc tagaaggtgg ttatactaac ccccattgtg    660
cgcgcagtat cccattacct cttttttggt cttttgttac ttgttatcac ttcggctacc    720
acaaggaaca tcacgaatac cctcaacttc cttggtggaa attacctgaa gctcacaaaa    780
tatctttata aggtctagag catgc                                          805
<210>82
<211>24
<212>DNA
<213>合成序列
<220>
<221>primer_bind
<222>(1)..(24)
<223>
<400>82
aggtaccgca cggtctgcca atcc                                            24
<210>83
<211>26
<212>DNA
<213>合成序列
<220>
<221>primer_bind
<222>(1)..(26)
<223>
<400>83
aagcttgacc tgattatcag cacggt                                          26
<210>84
<211>4624
<212>DNA
<213>噬夏孢欧文菌
<220>
<221>CDS
<222>(128)..(1267)
<223>
<220>
<221>misc_feature
<222>(1288)..(2766)
<223>
<220>
<221>misc_feature
<222>(2802)..(3689)
<223>
<220>
<221>misc_feature
<222>(3631)..(4158)
<223>
<400>84
gtcgactttc agcagcgcat ggcgaaaatc cagacagccc ttcgtttggc agggggcacc   60
atggccgctg ccgatatcat tgagcaggtt atgtgcaccg gtcagcctgt cttaagtggg  120
agcggct atg caa ccg cat tat gat ctg att ctc gtg ggg gct gga ctc    169
        Met Gln Pro His Tyr Asp Leu Ile Leu Val Gly Ala Gly Leu
        1               5                   10
gcg aat ggc ctt atc gcc ctg cgt ctt cag cag cag caa cct gat atg    217
Ala Asn Gly Leu Ile Ala Leu Arg Leu Gln Gln Gln Gln Pro Asp Met
15                  20                  25                  30
cgt att ttg ctt atc gac gcc gca ccc cag gcg ggc ggg aat cat acg    265
Arg Ile Leu Leu Ile Asp Ala Ala Pro Gln Ala Gly Gly Asn His Thr
                35                  40                  45
tgg tca ttt cac cac gat gat ttg act gag agc caa cat cgt tgg ata    313
Trp Ser Phe His His Asp Asp Leu Thr Glu Ser Gln His Arg Trp Ile
            50                  55                  60
gct ccg ctg gtg gtt cat cac tgg ccc gac tat cag gta cgc ttt ccc    361
Ala Pro Leu Val Val His His Trp Pro Asp Tyr Gln Val Arg Phe Pro
        65                  70                  75
aca cgc cgt cgt aag ctg aac agc ggc tac ttt tgt att act tct cag    409
Thr Arg Arg Arg Lys Leu Asn Ser Gly Tyr Phe Cys Ile Thr Ser Gln
    80                  85                  90
cgt ttc gct gag gtt tta cag cga cag ttt ggc ccg cac ttg tgg atg    457
Arg Phe Ala Glu Val Leu Gln Arg Gln Phe Gly Pro His Leu Trp Met
95                  100                 105                 110
gat acc gcg gtc gca gag gtt aat gcg gaa tct gtt cgg ttg aaa aag    505
Asp Thr Ala Val Ala Glu Val Asn Ala Glu Ser Val Arg Leu Lys Lys
                115                 120                 125
ggt cag gtt atc ggt gcc cgc gcg gtg att gac ggg cgg ggt tat gcg    553
Gly Gln Val Ile Gly Ala Arg Ala Val Ile Asp Gly Arg Gly Tyr Ala
            130                 135                 140
gca aat tca gca ctg agc gtg ggc ttc cag gcg ttt att ggc cag gaa    601
Ala Asn Ser Ala Leu Ser Val Gly Phe Gln Ala Phe Ile Gly Gln Glu
        145                 150                 155
tgg cga ttg agc cac ccg cat ggt tta tcg tct ccc att atc atg gat    649
Trp Arg Leu Ser His Pro His Gly Leu Ser Ser Pro Ile Ile Met Asp
    160                 165                 170
gcc acg gtc gat cag caa aat ggt tat cgc ttc gtg tac agc ctg ccg    697
Ala Thr Val Asp Gln Gln Asn Gly Tyr Arg Phe Val Tyr Ser Leu Pro
175                 180                 185                 190
ctc tcg ccg acc aga ttg tta att gaa gac acg cac tat att gat aat    745
Leu Ser Pro Thr Arg Leu Leu Ile Glu Asp Thr His Tyr Ile Asp Asn
                195                 200                 205
gcg aca tta gat cct gaa tgc gcg cgg caa aat att tgc gac tat gcc    793
Ala Thr Leu Asp Pro Glu Cys Ala Arg Gln Asn Ile Cys Asp Tyr Ala
            210                 215                 220
gcg caa cag ggt tgg cag ctt cag aca ctg ctg cga gaa gaa cag ggc    841
Ala Gln Gln Gly Trp Gln Leu Gln Thr Leu Leu Arg Glu Glu Gln Gly
        225                 230                 235
gcc tta ccc att act ctg tcg ggc aat gcc gac gca ttc tgg cag cag    889
Ala Leu Pro Ile Thr Leu Ser Gly Asn Ala Asp Ala Phe Trp Gln Gln
    240                 245                 250
cgc ccc ctg gcc tgt agt gga tta cgt gcc ggt ctg ttc cat cct acc    937
Arg Pro Leu Ala Cys Ser Gly Leu Arg Ala Gly Leu Phe His Pro Thr
255                 260                 265                 270
acc ggc tat tca ctg ccg ctg gcg gtt gcc gtg gcc gac cgc ctg agt       985
Thr Gly Tyr Ser Leu Pro Leu Ala Val Ala Val Ala Asp Arg Leu Ser
                275                 280                 285
gca ctt gat gtc ttt acg tcg gcc tca att cac cat gcc att acg cat      1033
Ala Leu Asp Val Phe Thr Ser Ala Ser Ile His His Ala Ile Thr His
            290                 295                 300
ttt gcc cgc gag cgc tgg cag cag cag ggc ttt ttc cgc atg ctg aat      1081
Phe Ala Arg Glu Arg Trp Gln Gln Gln Gly Phe Phe Arg Met Leu Asn
        305                 310                 315
cgc atg ctg ttt tta gcc gga ccc gcc gat tca cgc tgg cgg gtt atg      1129
Arg Met Leu Phe Leu Ala Gly Pro Ala Asp Ser Arg Trp Arg Val Met
    320                 325                 330
cag cgt ttt tat ggt tta cct gaa gat tta att gcc cgt ttt tat gcg      1177
Gln Arg Phe Tyr Gly Leu Pro Glu Asp Leu Ile Ala Arg Phe Tyr Ala
335                 340                 345                 350
gga aaa ctc acg ctg acc gat cgg cta cgt att ctg agc ggc aag ccg      1225
Gly Lys Leu Thr Leu Thr Asp Arg Leu Arg Ile Leu Ser Gly Lys Pro
                355                 360                 365
cct gtt ccg gta tta gca gca ttg caa gcc att atg acg act              1267
Pro Val Pro Val Leu Ala Ala Leu Gln Ala Ile Met Thr Thr
        370                 375                 380
catcgttaaa gagcgactac atgaaaccaa ctacggtaat tggtgcaggc ttcggtggcc    1327
tggcactggc aattcgtcta caagctgcgg ggatccccgt cttactgctt gaacaacgtg    1387
ataaacccgg cggtcgggct tatgtctacg aggatcaggg gtttaccttt gatgcaggcc    1447
cgacggttat caccgatccc agtgccattg aagaactgtt tgcactggca ggaaaacagt    1507
taaaagagta tgtcgaactg ctgccggtta cgccgtttta ccgcctgtgt tgggagtcag    1567
ggaaggtctt taattacgat aacgatcaaa cccggctcga agcgcagatt cagcagttta    1627
atccccgcga tgtcgaaggt tatcgtcagt ttctggacta ttcacgcgcg gtgtttaaag    1687
aaggctatct aaagctcggt actgtccctt ttttatcgtt cagagacatg cttcgcgccg    1747
cacctcaact ggcgaaactg caggcatgga gaagcgttta cagtaaggtt gccagttaca    1807
tcgaagatga acatctgcgc caggcgtttt ctttccactc gctgttggtg ggcggcaatc    1867
ccttcgccac ctcatccatt tatacgttga tacacgcgct ggagcgtgag tggggcgtct    1927
ggtttccgcg tggcggcacc ggcgcattag ttcaggggat gataaagctg tttcaggatc    1987
tgggtggcga agtcgtgtta aacgccagag tcagccatat ggaaacgaca ggaaacaaga    2047
ttgaagccgt gcatttagag gacggtcgca ggttcctgac gcaagccgtc gcgtcaaatg    2107
cagatgtggt tcatacctat cgcgacctgt taagccagca ccctgccgcg gttaagcagt    2167
ccaacaaact gcagactaag cgcatgagta actctctgtt tgtgctctat tttggtttga    2227
atcaccatca tgatcagctc gcgcatcaca cggtttgttt cggcccgcgt taccgcgagc    2287
tgattgacga aatttttaat catgatggcc tcgcagagga cttctcactt tatctgcacg    2347
cgccctgtgt cacggattcg tcactggcgc ctgaaggttg cggcagttac tatgtgttgg    2407
cgccggtgcc gcatttaggc accgcgaacc tcgactggac ggttgagggg ccaaaactac    2467
gcgaccgtat ttttgcgtac cttgagcagc attacatgcc tggcttacgg agtcagctgg    2527
tcacgcaccg gatgtttacg ccgtttgatt ttcgcgacca gcttaatgcc tatcatggct    2587
cagccttttc tgtggagccc gttcttaccc agagcgcctg gtttcggccg cataaccgcg    2647
ataaaaccat tactaatctc tacctggtcg gcgcaggcac gcatcccggc gcaggcattc    2707
ctggcgtcat cggctcggca aaagcgacag caggtttgat gctggaggat ctgatttgaa    2767
taatccgtcg ttactcaatc atgcggtcga aacgatggca gttggctcga aaagttttgc    2827
gacagcctca aagttatttg atgcaaaaac ccggcgcagc gtactgatgc tctacgcctg    2887
gtgccgccat tgtgacgatg ttattgacga tcagacgctg ggctttcagg cccgqcagcc    2947
tgccttacaa acgcccgaac aacgtctgat gcaacttgag atgaaaacgc gccaggccta    3007
tgcaggatcg cagatgcacg aaccggcgtt tgcggctttt caggaagtgg ctatggctca    3067
tgatatcgcc ccggcttacg cgtttgatca tctggaaggc ttcgccatgg atgtacgcga    3127
agcgcaatac agccaactgg atgatacgct gcgctattgc tatcacgttg caggcgttgt    3187
cggcttgatg atggcgcaaa tcatgggcgt gcgggataac gccacgctgg accgcgcctg    3247
tgaccttggg ctggcatttc agttgaccaa tattgctcgc gatattgtgg acgatgcgca    3307
tgcgggccgc tgttatctgc cggcaagctg gctggagcat gaaggtctga acaaagagaa    3367
ttatgcggca cctgaaaacc gtcaggcgct gagccgtatc gcccgtcgtt tggtgcagga    3427
agcagaacct tactatttgt ctgccacagc cggcctggca gggttgcccc tgcgttccgc    3487
ctgggcaatc gctacggcga agcaggttta ccggaaaata ggtgtcaaag ttgaacaggc    3547
cggtcagcaa gcctgggatc agcggcagtc aacgaccacg cccgaaaaat taacgctgct    3607
gctggccgcc tctggtcagg cccttacttc ccggatgcgg gctcatcctc cccgccctgc    3667
gcatctctgg cagcgcccgc tctagcgcca tgtctttccc ggagcgtcgc ctgaagtttt    3727
gacaggggcg gcgcatagag gaagccaaaa gaaacacaac cttctttgcc cctgacggcg    3787
tgatgcatac ggtgcgccat atacaaccgt ttgaggtagc ccttgcgtgg aatatagcgg    3847
aatggccaac gttgatgcac cagcccgtcg tgcaccataa aatagagtaa tccatacgcc    3907
gtcatacctg cgccaatcca ctggagcgqc cacattcctg tactgcccag ataaatcagc    3967
aggatcgata atgcagcaaa aaccacggca taaagatcgt taacttcaaa cgcaccttta    4027
cgcggttcat gatgtgaaag atgccatccc caaccccagc cgtgcatgat gtatttgtgt    4087
gccagtgcag caatcacttc catgccaatc acggtaacga aaacgatcag ggcattccaa    4147
atccacaaca taatttctcc ggtagagacg tctggcagca ggcttaagga ttcaatttta    4207
acagagatta gccgatctgg cggcgggaag ggaaaaaggc gcgccagaaa ggcgcgccag    4267
ggatcagaag tcggctttca gaaccacacg gtagttggct ttacctgcac gaacatggtc    4327
cagtgcatcg ttgattttcg acatcgggaa gtactccact gtcggcgcaa tatctgtacg    4387
gccagccagc ttcagcagtg aacgcagctg cgcaggtgaa ccggttgaag aacccgtcac    4447
ggcgcggtcg cctaaaatca ggctgaaagc cgggcacgtc aaacggcttc agtacggcac    4507
ccacggtatg gaacttaccg cgaggcgcca gggccgcaaa gtagggttgc cagtcgagat    4567
cgacggcgac cgtgctgata atcaggtcaa actggcccgc caggcttttt aaagctt       4624
<210>85
<211>380
<212>PRT
<213>噬夏孢欧文菌
<220>
<221>misc_feature
<222>(1288)..(2766)
<223>
<220>
<221>misc_feature
<222>(2802)..(3689)
<223>
<220>
<221>misc_feature
<222>(3631)..(4158)
<223>
<400>85
Met Gln Pro His Tyr Asp Leu Ile Leu Val Gly Ala Gly Leu Ala Asn
1               5                   10                  15
Gly Leu Ile Ala Leu Arg Leu Gln Gln Gln Gln Pro Asp Met Arg Ile
            20                  25                  30
Leu Leu Ile Asp Ala Ala Pro Gln Ala Gly Gly Asn His Thr Trp Ser
        35                  40                  45
Phe His His Asp Asp Leu Thr Glu Ser Gln His Arg Trp Ile Ala Pro
    50                  55                  60
Leu Val Val His His Trp Pro Asp Tyr Gln Val Arg Phe Pro Thr Arg
65                  70                  75                  80
Arg Arg Lys Leu Asn Ser Gly Tyr Phe Cys Ile Thr Ser Gln Arg Phe
                85                  90                  95
Ala Glu Val Leu Gln Arg Gln Phe Gly Pro His Leu Trp Met Asp Thr
            100                 105                 110
Ala Val Ala Glu Val Asn Ala Glu Ser Val Arg Leu Lys Lys Gly Gln
        115                 120                 125
Val Ile Gly Ala Arg Ala Val Ile Asp Gly Arg Gly Tyr Ala Ala Asn
    130                 135                 140
Ser Ala Leu Ser Val Gly Phe Gln Ala Phe Ile Gly Gln Glu Trp Arg
145                 150                 155                 160
Leu Ser His Pro His Gly Leu Ser Ser Pro Ile Ile Met Asp Ala Thr
                165                 170                 175
Val Asp Gln Gln Asn Gly Tyr Arg Phe Val Tyr Ser Leu Pro Leu Ser
            180                 185                 190
Pro Thr Arg Leu Leu Ile Glu Asp Thr His Tyr Ile Asp Asn Ala Thr
        195                 200                 205
Leu Asp Pro Glu Cys Ala Arg Gln Asn Ile Cys Asp Tyr Ala Ala Gln
    210                 215                 220
Gln Gly Trp Gln Leu Gln Thr Leu Leu Arg Glu Glu Gln Gly Ala Leu
225                 230                 235                 240
Pro Ile Thr Leu Ser Gly Asn Ala Asp Ala Phe Trp Gln Gln Arg Pro
                245                 250                 255
Leu Ala Cys Ser Gly Leu Arg Ala Gly Leu Phe His Pro Thr Thr Gly
            260                 265                 270
Tyr Ser Leu Pro Leu Ala Val Ala Val Ala Asp Arg Leu Ser Ala Leu
        275                 280                 285
Asp Val Phe Thr Ser Ala Ser Ile His His Ala Ile Thr His Phe Ala
    290                 295                 300
Arg Glu Arg Trp Gln Gln Gln Gly Phe Phe Arg Met Leu Asn Arg Met
305                 310                 315                 320
Leu Phe Leu Ala Gly Pro Ala Asp Ser Arg Trp Arg Val Met Gln Arg
                325                 330                 335
Phe Tyr Gly Leu Pro Glu Asp Leu Ile Ala Arg Phe Tyr Ala Gly Lys
            340                 345                 350
Leu Thr Leu Thr Asp Arg Leu Arg Ile Leu Ser Gly Lys Pro Pro Val
        355                 360                 365
Pro Val Leu Ala Ala Leu Gln Ala Ile Met Thr Thr
    370                 375                 380
<210>86
<211>32
<212>DNA
<213>合成序列
<220>
<221>primer_bind
<222>(1)..(32)
<223>
<400>86
tttttctcga gcgataaacg ctcacttggt ta                                32
<210>87
<211>32
<212>DNA
<213>合成序列
<220>
<221>primer_bind
<222>(1)..(32)
<223>
<400>87
tttttgtcga cacgttatgc tcacaacccc gg                                  32
<210>88
<211>679
<212>DNA
<213>大肠杆菌
<220>
<221>CDS
<222>(87)..(635)
<223>
<400>88
ctcgagcgat aaacgctcac ttggttaatc atttcactct tcaattatct ataatgatga    60
gtgatcagaa ttacatgtga gaaatt atg caa acg gaa cac gtc att tta ttg    113
                             Met Gln Thr Glu His Val Ile Leu Leu
                             1               5
aat gca cag gga gtt ccc acg ggt acg ctg gaa aag tat gcc gca cac    161
Asn Ala Gln Gly Val Pro Thr Gly Thr Leu Glu Lys Tyr Ala Ala His
10                  15                  20                  25
acg gca gac acc cgc tta cat ctc gcg ttc tcc agt tgg ctg ttt aat    209
Thr Ala Asp Thr Arg Leu His Leu Ala Phe Ser Ser Trp Leu Phe Asn
                30                  35                  40
gcc aaa gga caa tta tta gtt acc cgc cgc gca ctg agc aaa aaa gca    257
Ala Lys Gly Gln Leu Leu Val Thr Arg Arg Ala Leu Ser Lys Lys Ala
            45                  50                  55
tgg cct ggc gtg tgg act aac tcg gtt tgt ggg cac cca caa ctg gga    305
Trp Pro Gly Val Trp Thr Asn Ser Val Cys Gly His Pro Gln Leu Gly
        60                  65                  70
gaa agc aac gaa gac gca gtg atc cgc cgt tgc cgt tat gag ctt ggc    353
Glu Ser Asn Glu Asp Ala Val Ile Arg Arg Cys Arg Tyr Glu Leu Gly
    75                  80                  85
gtg gaa att acg cct cct gaa tct atc tat cct gac ttt cgc tac cgc    401
Val Glu Ile Thr Pro Pro Glu Ser Ile Tyr Pro Asp Phe Arg Tyr Arg
90                  95                  100                 105
gcc acc gat ccg agt ggc att gtg gaa aat gaa gtg tgt ccg gta ttt    449
Ala Thr Asp Pro Ser GlyIle Val Glu Asn Glu Val Cys  Pro Val Phe
                110                 115                 120
gcc gca cgc acc act agt gcg tta cag atc aat gat gat gaa gtg atg    497
Ala Ala Arg Thr Thr Ser Ala Leu Gln Ile Asn Asp Asp Glu Val Met
            125                 130                 135
gat tat caa tgg tgt gat tta gca gat gta tta cac ggt att gat gcc    545
Asp Tyr Gln Trp Cys Asp Leu Ala Asp Val Leu His Gly Ile Asp Ala
        140                 145                 150
acg ccg tgg gcg ttc agt ccg tgg atg gtg atg cag gcg aca aat cgc    593
Thr Pro Trp Ala Phe Ser Pro Trp Met Val Met Gln Ala Thr Asn Arg
    155                 160                 165
gaa gcc aga aaa cga tta tct gca ttt acc cag ctt aaa taa            635
Glu Ala Arg Lys Arg Leu Ser Ala Phe Thr Gln Leu Lys
170                 175                 180
aaaaaccccg acatttgccg  gggttgtgag cataacgtgt  cgac                 679
<210>89
<211>182
<212>PRT
<213>大肠杆菌
<400>89
Met Gln Thr Glu His Val Ile Leu Leu Asn Ala Gln Gly Val Pro Thr
1               5                   10                  15
Gly Thr Leu Glu Lys Tyr Ala Ala His Thr Ala Asp Thr Arg Leu His
            20                  25                  30
Leu Ala Phe Ser Ser Trp Leu Phe Asn Ala Lys Gly Gln Leu Leu Val
        35                  40                  45
Thr Arg Arg Ala Leu Ser Lys Lys Ala Trp Pro Gly Val Trp Thr Asn
    50                  55                  60
Ser Val Cys Gly His Pro Gln Leu Gly Glu Ser Asn Glu Asp Ala Val
65                  70                  75                  80
Ile Arg Arg Cys Arg Tyr Glu Leu Gly Val Glu Ile Thr Pro Pro Glu
                85                  90                  95
Ser Ile Tyr Pro Asp Phe Arg Tyr Arg Ala Thr Asp Pro Ser Gly Ile
            100                 105                 110
Val Glu Asn Glu Val Cys Pro Val Phe Ala Ala Arg Thr Thr Ser Ala
        115                 120                 125
Leu Gln Ile Asn Asp Asp Glu Val Met Asp Tyr Gln Trp Cys Asp Leu
    130                 135                 140
Ala Asp Val Leu His Gly Ile Asp Ala Thr Pro Trp Ala Phe Ser Pro
145                 150                 155                 160
Trp Met Val Met Gln Ala Thr Asn Arg Glu Ala Arg Lys Arg Leu Ser
                165                 170                 175
Ala Phe Thr Gln Leu Lys
            180
<210>90
<211>31
<212>DNA
<213>合成序列
<220>
<221>primer_bind
<222>(1)..(31)
<223>
<400>90
tttttccatg gtgaaggagg aaatagcgaa a                                 31
<210>91
<211>32
<212>DNA
<213>合成序列
<220>
<221>primer_bind
<222>(1)..(32)
<223>
<400>91
tttttaagct ttcacttttt tcttgtaacc aa                                 32
<210>92
<211>962
<212>DNA
<213>嗜超高温硫酸根还原古细菌(Archaeoglobus fulgidus)
<220>
<221>CDS
<222>(3)..(956)
<223>
<400>92
cc atg gtg aag gag gaa ata gcg aaa agg gcc gaa ata atc aac aaa      47
   Met Val Lys Glu Glu Ile Ala Lys Arg Ala Glu Ile Ile Asn Lys
   1               5                   10                  15
gcc att gaa gag ctt ctg ccc gaa agg gag ccg att gga ctc tac aaa     95
Ala Ile Glu Glu Leu Leu Pro Glu Arg Glu Pro Ile Gly Leu Tyr Lys
                20                  25                  30
gcc gca agg cat ctg atc aaa gca ggt ggc aag agg cta agg cct gta    143
Ala Ala Arg His Leu Ile Lys Ala Gly Gly Lys Arg Leu Arg Pro Val
            35                  40                  45
ata agc ctc tta gca gtc gaa gcc ctt ggg aaa gac tac aga aag att    191
Ile Ser Leu Leu Ala Val Glu Ala Leu Gly Lys Asp Tyr Arg Lys Ile
        50                  55                  60
atc ccg gct gct gtc agc att gaa aca atc cac aac ttc acc ctc gtg    239
Ile Pro Ala Ala Val Ser Ile Glu Thr Ile His Asn Phe Thr Leu Val
    65                  70                  75
cat gac gac ata atg gac agg gac gag atg agg agg gga gtt ccg acg    287
His Asp Asp Ile Met Asp Arg Asp Glu Met Arg Arg Gly Val Pro Thr
80                  85                  90                  95
gta cac agg gtt tat ggg gaa gcg acq gcc att tta gca ggc gac aca    335
Val His Arg Val Tyr Gly Glu Ala Thr Ala Ile Leu Ala Gly Asp Thr
                100                 105                 110
ctc ttt gct gaa gcc ttc aag ctg ctg aca aag tgc gat gtt gag agc    383
Leu Phe Ala Glu Ala Phe Lys Leu Leu Thr Lys Cys Asp Val Glu Ser
            115                 120                 125
gag gga atc aga aaa gct aca gaa atg ctt tcg gac gtt tgc ata aaa    431
Glu Gly Ile Arg Lys Ala Thr Glu Met Leu Ser Asp Val Cys Ile Lys
        130                 135                 140
ata tgc gag ggg cag tac tac gac atg agc ttt gag aaa aag gag agc    479
Ile Cys Glu Gly Gln Tyr Tyr Asp Met Ser Phe Glu Lys Lys Glu Ser
    145                 150                 155
gtt tcc gag gag gag tat ctc agg atg gtc gag ctg aag acc gga gtg    527
Val Ser Glu Glu Glu Tyr Leu Arg Met Val Glu Leu Lys Thr Gly Val
160                 165                 170                 175
ctg att gca gct tct gca gca tta cct gcg gtg ctt ttt ggg gag agc    575
Leu Ile Ala Ala Ser Ala Ala Leu Pro Ala Val Leu Phe Gly Glu Ser
                180                 185                 190
gag gaa att gta aag gcg ctg tgg gac tac gga gtt ctt agc ggt att    623
Glu Glu Ile Val Lys Ala Leu Trp Asp Tyr Gly Val Leu Ser Gly Ile
            195                 200                 205
ggc ttc cag atc cag gac gac ctg ctt gac ctg act gag gag acc gga    671
Gly Phe Gln Ile Gln Asp Asp Leu Leu Asp Leu Thr Glu Glu Thr Gly
        210                 215                 220
aag gac tgg gga agc gac ctg ctt aaa ggg aag aaa acc ctg att gtc    719
Lys Asp Trp Gly Ser Asp Leu Leu Lys Gly Lys Lys Thr Leu Ile Val
    225                 230                 235
ata aag gcg ttc gaa aag gga gtg aag cta aag acg ttt gga aag gaa    767
Ile Lys Ala Phe Glu Lys Gly Val Lys Leu Lys Thr Phe Gly Lys Glu
240                 245                 250                 255
aag gcg gac gtc tct gag att aga gat gat atc gaa aag tta aga gag    815
Lys Ala Asp Val Ser Glu Ile Arg Asp Asp Ile Glu Lys Leu Arg Glu
                260                 265                 270
tgt ggt gcg att gat tac gct gcc agc atg gca aga aag atg gct gaa    863
Cys Gly Ala Ile Asp Tyr Ala Ala Ser Met Ala Arg Lys Met Ala Glu
            275                 280                 285
gag gcg aaa aga aag ctc gaa gtt ctg cct gaa agc aaa gcc aag gaa    911
Glu Ala Lys Arq Lys Leu Glu Val Leu Pro Glu Ser Lys Ala Lys Glu
        290                 295                 300
aca ctg ctg gaa ctt acc gac ttc ttg gtt aca aga aaa aag tga        956
Thr Leu Leu Glu Leu Thr Asp Phe Leu Val Thr Arg Lys Lys
    305                 310                 315
aagctt                                                             962
<210>93
<211>317
<212>PRT
<213>嗜超高温硫酸根还原古细菌
<400>93
Met Val Lys Glu Glu Ile Ala Lys Arg Ala Glu Ile Ile Asn Lys Ala
1               5                   10                  15
Ile Glu Glu Leu Leu Pro Glu Arg Glu Pro Ile Gly Leu Tyr Lys Ala
            20                  25                  30
Ala Arg His Leu Ile Lys Ala Gly Gly Lys Arg Leu Arg Pro Val Ile
        35                  40                  45
Ser Leu Leu Ala Val Glu Ala Leu Gly Lys Asp Tyr Arg Lys Ile Ile
    50                  55                  60
Pro Ala Ala Val Ser Ile Glu Thr Ile His Asn Phe Thr Leu Val His
65                  70                  75                  80
Asp Asp Ile Met Asp Arg Asp Glu Met Arg Arg Gly Val Pro Thr Val
                85                  90                  95
His Arg Val Tyr Gly Glu Ala Thr Ala Ile Leu Ala Gly Asp Thr Leu
            100                 105                 110
Phe Ala Glu Ala Phe Lys Leu Leu Thr Lys Cys Asp Val Glu Ser Glu
        115                 120                 125
Gly Ile Arg Lys Ala Thr Glu Met Leu Ser Asp Val Cys Ile Lys Ile
    130                 135                 140
Cys Glu Gly Gln Tyr Tyr Asp Met Ser Phe Glu Lys Lys Glu Ser Val
145                 150                 155                 160
Ser Glu Glu Glu Tyr Leu Arg Met Val Glu Leu Lys Thr Gly Val Leu
                165                 170                 175
Ile Ala Ala Ser Ala Ala Leu Pro Ala Val Leu Phe Gly Glu Ser Glu
            180                 185                 190
Glu Ile Val Lys Ala Leu Trp Asp Tyr Gly Val Leu Ser Gly Ile Gly
        195                 200                 205
Phe Gln Ile Gln Asp Asp Leu Leu Asp Leu Thr Glu Glu Thr Gly Lys
    210                 215                 220
Asp Trp Gly Ser Asp Leu Leu Lys Gly Lys Lys Thr Leu Ile Val Ile
225                 230                 235                 240
Lys Ala Phe Glu Lys Gly Val Lys Leu Lys Thr Phe Gly Lys Glu Lys
                245                 250                 255
Ala Asp Val Ser Glu Ile Arg Asp Asp Ile Glu Lys Leu Arg Glu Cys
            260                 265                 270
Gly Ala Ile Asp Tyr Ala Ala Ser Met Ala Arg Lys Met Ala Glu Glu
        275                 280                 285
Ala Lys Arg Lys Leu Glu Val Leu Pro Glu Ser Lys Ala Lys Glu Thr
    290                 295                 300
Leu Leu Glu Leu Thr Asp Phe Leu Val Thr Arg Lys Lys
305                 310                 315
<210>94
<211>1293
<212>DNA
<213>嗜超高温硫酸根还原古细菌
<220>
<221>CDS
<222>(206)..(1159)
<223>
<400>94
taaaacgacg gccagtgagc gcgcgtaata cgactcacta tagggcgaat tgggtaccgg     60
gccccccctc gacgccgtcg ttcaatgaga atggataaga ggctcgtggg attgacgtga    120
gggggcaggg atggctatat ttctgggagc gaactccggg cgaggatcta gttgtaggga    180
gggattcatg acaccacaaa cagcc atg gtg aag gag gaa ata gcg aaa agg      232
                            Met Val Lys Glu Glu Ile Ala Lys Arg
                            1               5
gcc gaa ata atc aac aaa gcc att gaa gag ctt ctg ccc gaa agg gag      280
Ala Glu Ile Ile Asn Lys Ala Ile Glu Glu Leu Leu Pro Glu Arg Glu
10                  15                  20                  25
ccg att gga ctc tac aaa gcc gca agg cat ctg atc aaa gca ggt ggc      328
Pro Ile Gly Leu Tyr Lys Ala Ala Arg His Leu Ile Lys Ala Gly Gly
                30                  35                  40
aag agg cta agg cct gta ata agc ctc tta gca gtc gaa gcc ctt ggg    376
Lys Arg Leu Arg Pro Val Ile Ser Leu Leu Ala Val Glu Ala Leu Gly
            45                  50                  55
aaa gac tac aga aag att atc ccg gct gct gtc agc att gaa aca atc    424
Lys Asp Tyr Arg Lys Ile Ile Pro Ala Ala Val Ser Ile Glu Thr Ile
        60                  65                  70
cac aac ttc acc ctc gtg cat gac gac ata atg gac agg gac gag atg    472
His Asn Phe Thr Leu Val His Asp Asp Ile Met Asp Arg Asp Glu Met
    75                  80                  85
agg agg gga gtt ccg acg gta cac agg gtt tat ggg gaa gcg acg gcc    520
Arg Arg Gly Val Pro Thr Val His Arg Val Tyr Gly Glu Ala Thr Ala
90                  95                  100                 105
att tta gca ggc gac aca ctc ttt gct gaa gcc ttc aag ctg ctg aca    568
Ile Leu Ala Gly Asp Thr Leu Phe Ala Glu Ala Phe Lys Leu Leu Thr
                110                 115                 120
aag tgc gat gtt gag agc gag gga atc aga aaa gct aca gaa atg ctt    616
Lys Cys Asp Val Glu Ser Glu Gly Ile Arg Lys Ala Thr Glu Met Leu
           125                  130                  135
tcg gac gtt tgc ata aaa ata tgc gag ggg cag tac tac gac atg agc    664
Ser Asp Val Cys Ile Lys Ile Cys Glu Gly Gln Tyr Tyr Asp Met Ser
        140                 145                 150
ttt gag aaa aag gag agc gtt tcc gag gag gag tat ctc agg atg gtc    712
Phe Glu Lys Lys Glu Ser Val Ser Glu Glu Glu Tyr Leu Arg Met Val
    155                 160                 165
gag ctg aag acc gga gtg ctg att gca gct tct gca gca tta cct gcg    760
Glu Leu Lys Thr Gly Val Leu Ile Ala Ala Ser Ala Ala Leu Pro Ala
170                 175                 180                 185
gtg ctt ttt ggg gag agc gag gaa att gta aag gcg ctg tgg gac tac    808
Val Leu Phe Gly Glu Ser Glu Glu Ile Val Lys Ala Leu Trp Asp Tyr
                190                 195                 200
gga gtt ctt agc ggt att ggc ttc cag atc cag gac gac ctg ctt gac    856
Gly Val Leu Ser Gly Ile Gly Phe Gln Ile Gln Asp Asp Leu Leu Asp
            205                 210                 215
ctg act gag gag acc gga aag gac tgg gga agc gac ctg ctt aaa ggg    904
Leu Thr Glu Glu Thr Gly Lys Asp Trp Gly Ser Asp Leu Leu Lys Gly
         220                 225                 230
aag aaa acc ctg att gtc ata aag gcg ttc gaa aag gga gtg aag cta       952
Lys Lys Thr Leu Ile Val Ile Lys Ala Phe Glu Lys Gly Val Lys Leu
    235                 240                 245
aag acg ttt gga aag gaa aag gcg gac gtc tct gag att aga gat gat      1000
Lys Thr Phe Gly Lys Glu Lys Ala Asp Val Ser Glu Ile Arg Asp Asp
250                 255                 260                 265
atc gaa aag tta aga gag tgt ggt gcg att gat tac gct gcc agc atg      1048
Ile Glu Lys Leu Arg Glu Cys Gly Ala Ile Asp Tyr Ala Ala Ser Met
                270                 275                 280
gca aga aag atg gct gaa gag gcg aaa aga aag ctc gaa gtt ctg cct      1096
Ala Arg Lys Met Ala Glu Glu Ala Lys Arg Lys Leu Glu Val Leu Pro
            285                 290                 295
gaa agc aaa gcc aag gaa aca ctg ctg gaa ctt acc gac ttc ttg gtt      1144
Glu Ser Lys Ala Lys Glu Thr Leu Leu Glu Leu Thr Asp Phe Leu Val
        300                 305                 310
aca aga aaa aag tga aagcttcaat tgcatgctct agatgatcaa agaattcctg      1199
Thr Arg Lys Lys
    315
gcctagtcta taggaggttt tgaaaagaaa ggagcaataa tcattttctt gttctatcaa    1259
gagggtgcta ttgctccttt ctttttttct cgag                                1293
<210>95
<211>317
<212>PRT
<213>嗜超高温硫酸根还原古细菌
<400>95
Met Val Lys Glu Glu Ile Ala Lys Arg Ala Glu Ile Ile Asn Lys Ala
1               5                   10                  15
Ile Glu Glu Leu Leu Pro Glu Arg Glu Pro Ile Gly Leu Tyr Lys Ala
            20                  25                  30
Ala Arg His Leu Ile Lys Ala Gly Gly Lys Arg Leu Arg Pro Val Ile
        35                  40                  45
Ser Leu Leu Ala Val Glu Ala Leu Gly Lys Asp Tyr Arg Lys Ile Ile
    50                  55                  60
Pro Ala Ala Val Ser Ile Glu Thr Ile His Asn Phe Thr Leu Val His
65                  70                  75                  80
Asp Asp Ile Met Asp Arg Asp Glu Met Arg Arg Gly Val Pro Thr Val
                85                  90                  95
His Arg Val Tyr Gly Glu Ala Thr Ala Ile Leu Ala Gly Asp Thr Leu
            100                 105                 110
Phe Ala Glu Ala Phe Lys Leu Leu Thr Lys Cys Asp Val Glu Ser Glu
        115                 120                 125
Gly Ile Arg Lys Ala Thr Glu Met Leu Ser Asp Val Cys Ile Lys Ile
    130                 135                 140
Cys Glu Gly Gln Tyr Tyr Asp Met Ser Phe Glu Lys Lys Glu Ser Val
145                 150                 155                 160
Ser Glu Glu Glu Tyr Leu Arg Met Val Glu Leu Lys Thr Gly Val Leu
                165                 170                 175
Ile Ala Ala Ser Ala Ala Leu Pro Ala Val Leu Phe Gly Glu Ser Glu
            180                 185                 190
Glu Ile Val Lys Ala Leu Trp Asp Tyr Gly Val Leu Ser Gly Ile Gly
        195                 200                 205
Phe Gln Ile Gln Asp Asp Leu Leu Asp Leu Thr Glu Glu Thr Gly Lys
    210                 215                 220
Asp Trp Gly Ser Asp Leu Leu Lys Gly Lys Lys Thr Leu Ile Val Ile
225                 230                 235                 240
Lys Ala Phe Glu Lys Gly Val Lys Leu Lys Thr Phe Gly Lys Glu Lys
                245                 250                 255
Ala Asp Val Ser Glu Ile Arg Asp Asp Ile Glu Lys Leu Arg Glu Cys
            260                 265                 270
Gly Ala Ile Asp Tyr Ala Ala Ser Met Ala Arg Lys Met Ala Glu Glu
        275                 280                 285
Ala Lys Arg Lys Leu Glu Val Leu Pro Glu Ser Lys Ala Lys Glu Thr
        290                 295                 300
Leu Leu Glu Leu Thr Asp Phe Leu Val Thr Arg Lys Lys
305                 310                 315
<210>96
<211>35
<212>DNA
<213>合成序列
<220>
<221>primer_bind
<222>(1)..(35)
<223>
<400>96
gagctcttca ttatttcgat tttgatttcg tgacc                             35
<210>97
<211>38
<212>DNA
<213>合成序列
<220>
<221>Primer
<222>(1)..(38)
<223>
<400>97
aagcttggttgatcagaaga agaagaagaa gatgaact                             38
<210>98
<211>647
<212>DNA
<213>拟南芥
<220>
<221>启动子
<222>(1)..(647)
<223>
<400>98
gagctcttca ttatttcgat tttgatttcg tgaccagcga acgcagaata ccttgttgtg     60
taatacttta cccgtgtaaa tcaaaaacaa aaaggctttt gagctttttg tagttgaatt    120
tctctggctg atcttttctg tacagattca tatatctgca gagacgatat cattgattat    180
ttgagcttct tttgaactat ttcgtgtaat ttgggatgag agctctatgt atgtgtgtaa    240
actttgaaga caacaagaaa ggtaacaagt gagggaggga tgactccatg tcaaaataga    300
tgtcataaga ggcccatcaa taagtgcttg agcccattag ctagcccagt aactaccaga    360
ttgtgagatg gatgtgtgaa cagttttttt tttgatgtag gactgaaatg tgaacaacag    420
gcgcatgaaa ggctaaatta ggacaatgat aagcagaaat aacttatcct ctctaacact    480
tggcctcaca ttgcccttca cacaatccac acacatccaa tcacaacctc atcatatatc    540
tcccgctaat ctttttttct ttgatctttt tttttttgct tattattttt ttgactttga    600
tctcccatca gttcatcttc ttcttcttct tctgatcaac caagctt                  647
<210>99
<211>28
<212>DNA
<213>合成序列
<220>
<221>primer_bind
<222>(1)..(28)
<223>
<400>99
gagctcactc actgatttcc attgcttg                                       28
<210>100
<211>37
<212>DNA
<213>合成序列
<220>
<221>引物
<222>(1)..(37)
<223>
<400>100
gcgcatgcat ctagaaatga tccagttaga acaacca                             37
<210>101
<211>37
<212>DNA
<213>合成序列
<220>
<221>引物
<222>(1)..(37)
<223>
<400>101
gcgcatgctc tagactattt tgctttgtaa atttctg                             37
<210>102
<211>792
<212>DNA
<213>点形念珠藻ATCC 29133
<220>
<221>CDS
<222>(5)..(775)
<223>
<400>102
gcgc atg cat cta gaa atg atc cag tta gaa caa cca ctc agt cat caa    49
     Met His Leu Glu Met Ile Gln Leu Glu Gln Pro Leu Ser His Gln
     1               5                   10                  15
gca aaa ctg act cca gta ctg aga agt aaa tct cag ttt aag ggg ctt     97
Ala Lys Leu Thr Pro Val Leu Arg Ser Lys Ser Gln Phe Lys Gly Leu
                20                  25                  30
ttc att gct att gtc att gtt agc gca tgg gtc att agc ctg agt tta    145
Phe Ile Ala Ile Val Ile Val Ser Ala Trp Val Ile Ser Leu Ser Leu
            35                  40                  45
tta ctt tcc ctt gac atc tca aag cta aaa ttt tgg atg tta ttg cct    193
Leu Leu Ser Leu Asp Ile Ser Lys Leu Lys Phe Trp Met Leu Leu Pro
        50                  55                  60
gtt ata cta tgg caa aca ttt tta tat acg gga tta ttt att aca tct    241
Val Ile Leu Trp Gln Thr Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ser
    65                  70                  75
cat gat gcc atg cat ggc gta gta ttt ccc caa aac acc aag att aat    289
His Asp Ala Met His Gly Val Val Phe Pro Gln Asn Thr Lys Ile Asn
80                  85                  90                  95
cat ttg att gga aca ttg acc cta tcc ctt tat ggt ctt tta cca tat    337
His Leu Ile Gly Thr Leu Thr Leu Ser Leu Tyr Gly Leu Leu Pro Tyr
                100                 105                 110
caa aaa cta ttg aaa aaa cat tgg tta cac cac cac aat cca gca agc    385
Gln Lys Leu Leu Lys Lys His Trp Leu His His His Asn Pro Ala Ser
            115                 120                 125
tca ata gac ccg gat ttt cac aat ggt aaa cac caa agt ttc ttt gct    433
Ser Ile Asp Pro Asp Phe His Asn Gly Lys His Gln Ser Phe Phe Ala
        130                 135                 140
tgg tat ttt cat ttt atg aaa ggt tac tgg agt tgg ggg caa ata att    481
Trp Tyr Phe His Phe Met Lys Gly Tyr Trp Ser Trp Gly Gln Ile Ile
    145                 150                 155
gcg ttg act att att tat aac ttt gct aaa tac ata ctc cat atc cca    529
Ala Leu Thr Ile Ile Tyr Asn Phe Ala Lys Tyr Ile Leu His Ile Pro
160                 165                 170                 175
agt gat aat cta act tac ttt tgg gtg cta ccc tcg ctt tta agt tca    577
Ser Asp Asn Leu Thr Tyr Phe Trp Val Leu Pro Ser Leu Leu Ser Ser
                180                 185                 190
tta caa tta ttc tat ttt ggt act ttt tta ccc cat agt gaa cca ata    625
Leu Gln Leu Phe Tyr Phe Gly Thr Phe Leu Pro His Ser Glu Pro Ile
            195                 200                 205
ggg ggt tat gtt cag cct cat tgt gcc caa aca att agc cgt cct att    673
Gly Gly Tyr Val Gln Pro His Cys Ala Gln Thr Ile Ser Arg Pro Ile
        210                 215                 220
tgg tgg tca ttt atc acg tgc tat cat ttt ggc tac cac gag gaa cat    721
Trp Trp Ser Phe Ile Thr Cys Tyr His Phe Gly Tyr His Glu Glu His
    225                 230                 235
cac gaa tat cct cat att tct tgg tgg cag tta cca gaa att tac aaa    769
His Glu Tyr Pro His Ile Ser Trp Trp Gln Leu Pro Glu Ile Tyr Lys
240                 245                 250                 255
gca aaa tagtctagag catgcgc                                         792
Ala Lys
<210>103
<211>257
<212>PRT
<213>点形念珠藻ATCC 29133
<400>103
Met His Leu Glu Met Ile Gln Leu Glu Gln Pro Leu Ser His Gln Ala
1               5                   10                  15
Lys Leu Thr Pro Val Leu Arg Ser Lys Ser Gln Phe Lys Gly Leu Phe
            20                  25                  30
Ile Ala Ile Val Ile Val Ser Ala Trp Val Ile Ser Leu Ser Leu Leu
        35                  40                  45
Leu Ser Leu Asp Ile Ser Lys Leu Lys Phe Trp Met Leu Leu Pro Val
    50                  55                  60
Ile Leu Trp Gln Thr Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ser His
65                  70                  75                  80
Asp Ala Met His Gly Val Val Phe Pro Gln Asn Thr Lys Ile Asn His
                85                  90                  95
Leu Ile Gly Thr Leu Thr Leu Ser Leu Tyr Gly Leu Leu Pro Tyr Gln
            100                 105                 110
Lys Leu Leu Lys Lys His Trp Leu His His His Asn Pro Ala Ser Ser
        115                 120                 125
Ile Asp Pro Asp Phe His Asn Gly Lys His Gln Ser Phe Phe Ala Trp
    130                 135                 140
Tyr Phe His Phe Met Lys Gly Tyr Trp Ser Trp Gly Gln Ile Ile Ala
145                 150                 155                 160
Leu Thr Ile Ile Tyr Asn Phe Ala Lys Tyr Ile Leu His Ile Pro Ser
                165                 170                 175
Asp Asn Leu Thr Tyr Phe Trp Val Leu Pro Ser Leu Leu Ser Ser Leu
            180                 185                 190
Gln Leu Phe Tyr Phe Gly Thr Phe Leu Pro His Ser Glu Pro Ile Gly
        195                 200                 205
Gly Tyr Val Gln Pro His Cys Ala Gln Thr Ile Ser Arg Pro Ile Trp
    210                 215                 220
Trp Ser Phe Ile Thr Cys Tyr His Phe Gly Tyr His Glu Glu His His
225                 230                 235                 240
Glu Tyr Pro His Ile Ser Trp Trp Gln Leu Pro Glu Ile Tyr Lys Ala
                245                 250                 255
Lys
<210>104
<211>26
<212>DNA
<213>合成序列
<220>
<221>引物
<222>(1)..(26)
<223>
<400>104
gtcgaccctg ctttaatgag atatgc                                       26
<210>105
<211>27
<212>DNA
<213>合成序列
<220>
<221>引物
<222>(1)..(27)
<223>
<400>105
ctcgagcttg gacaatcagt aaattga                                        27
<210>106
<211>210
<212>DNA
<213>根癌农杆菌
<220>
<221>终止子
<222>(1)..(210)
<223>
<400>106
gtcgaccctg ctttaatgag atatgcgaga cgcctatgat cgcatgatat ttgctttcaa     60
ttctgttgtg cacgttgtaa aaaacctgag catgtgtagc tcagatcctt accgccggtt    120
tcggttcatt ctaatgaata tatcacccgt tactatcgta tttttatgaa taatattctc    180
cgttcaattt actgattqtc caagctcgag                                     210
<210>107
<211>37
<212>DNA
<213>合成序列
<220>
<221>引物
<222>(1)..(37)
<223>
<400>107
cccgggaatt cttcattatt tcgattttga tttcgtg                           37
<210>108
<211>38
<212>DNA
<213>合成序列
<220>
<221>引物
<222>(1)..(38)
<223>
<400>108
aagcttggtt gatcagaaga agaagaagaa gatgaact                          38
<210>109
<211>652
<212>DNA
<213>拟南芥
<220>
<221>启动子
<222>(1)..(652)
<223>
<400>109
cccgggaatt cttcattatt tcgattttga tttcgtgacc agcgaacgca gaataccttg     60
ttgtgtaata ctttacccgt gtaaatcaaa aacaaaaagg cttttgagct ttttgtagtt    120
gaatttctct ggctgatctt ttctgtacag attcatatat ctgcagagac gatatcattg    180
attatttgag cttcttttga actatttcgt gtaatttggg atgagagctc tatgtatgtg    240
tgtaaacttt gaagacaaca agaaaggtaa caagtgaggg agggatgact ccatgtcaaa    300
atagatgtca taagaggccc atcaataagt gcttgagccc attagctagc ccagtaacta    360
ccagattgtg agatggatgt gtgaacagtt ttttttttga tgtaggactg aaatgtgaac    420
aacaggcgca tgaaaggcta aattaggaca atgataagca gaaataactt atcctctcta    480
acacttggcc tcacattgcc cttcacacaa tccacacaca tccaatcaca acctcatcat    540
atatctcccg ctaatctttt tttctttgat cttttttttt ttgcttatta tttttttgac    600
tttgatctcc catcagttca tcttcttctt cttcttctga tcaaccaagc tt            652
<210>110
<211>29
<212>DNA
<213>合成序列
<220>
<221>引物
<222>(1)..(29)
<223>
<400>110
gagctctagc gcaatcttat gtggtacaa                                    29
<210>111
<211>29
<212>DNA
<213>合成序列
<220>
<221>引物
<222>(1)..(29)
<223>
<400>111
aagcttttct tgaaagtaaa gattgagtc                                    29
<210>112
<211>1773
<212>DNA
<213>碧冬茄
<220>
<221>启动子
<222>(1)..(1773)
<223>
<400>112
gagctctagc gcaatcttat gtggtacaaa tcttgattag tcgggaaaaa atgatgtggc      60
cctacaaatg gttggaggat gggagatttg gctctatcta gagttatgtg gttgttgaag     120
catttggtta ctctctgctg tggtagttgg catatccaca ttgtctcctt ccacttttat     180
gacaattacg tgaaagttat gggttgtttt gtctattttt gtcgagqcct ttcttttcct     240
tccaggttgt tgaagatggt ccaattcgat tagaataatg ttttgagctt tagcatattc     300
tctctcgttt acacgattat agtaataatg atataggatg acagaagttg acacataaat     360
tttttattct ctccatttac tttaatccaa atctcaccta ccctaaactt ctttaatatg     420
tattcaatag tctatccgag taaattgtaa atttaacaac cattgataat attgacacct     480
actaacatat actagtaaag agaatattaa catggcacat ataatttgat gcaaaatgag     540
tatgatgaaa tttaaaccca aaatctcttg attttgacag tgtcaccttg acttgttaac     600
taataagtca tgttttagtg gcagaaagac aaactcatcc accaactgta tagcaataaa     660
aaatagaaga atcttcctga ggcaaagttt tggaaaaatt aagagtggct gagatttaat     720
ttcaacagga attagttcca cttaactttt aggttacgat acagtgctaa ttaaataact     780
taattgtatt agatatttct tqcacctaaa aaatttaaaa actgaaaaaa ggtagcaatc     840
aaaataaaca aaaggacaaa ataagtgaaa ggtacagcca ccaaccctgg cggctcactg     900
tttgttggtt aaaacgtaga cttacaccta ccaaaatcta caactaaaat gagqcaataa     960
tactttgccc aaaattacca agaaaagaaa aagaaaggaa tcccttaata ttactctcct    1020
ccatttcaca ataaatatcc tagtttgact taaattagag tttaaaaaat gaaagacgac    1080
ttttaaaact tgtaatctaa aataaatcat agttaaatgt gtggctataa atcattgtat    1140
taacggtaaa gtggtaagtt taaaagttaa ttgttttcaa atataaaatt gtactatcat    1200
tctttttgga atggactaat aagaaaacta tgacatccat tatggagcgg agggagtatc    1260
tccttttaac aataaccttt gtcccttcaa ttcaattatc agtatgcaaa cattaaaaat    1320
tattattgat gttaagtacc acatcatcct taatgataga atcatcgtag aacgcttttc    1380
caggcacaca ttcaaactag ttagaccagt accacacatc gaatattcca gacttctttg    1440
tttgaatagt cgactacatt ggataatgga acttctcgaa ttaacttcga attagtcgag    1500
cccaaaataa tatatacgtc gggtggaaaa ctataaaatg tttgacaaaa atgtcaaatt    1560
aatatatcaa tctgcaacaa ccttttcacc ttgagaacgc agctgaaatt ttttacaaag    1620
gtagttggtg aagctagtca gcgaatccca ttaccttcca ctctacctaa cccccttcac    1680
caacaacaaa tttctgtaat ttaaaaacta gccaaaaaag aactctcttt tacaaagagc    1740
caaagactca atctttactt tcaagaaaag ctt                                 1773
<210>113
<211>39
<212>DNA
<213>合成序列
<220>
<221>引物
<222>(1)..(39)
<223>
<400>113
gcgcatgcat ctagaaatga atttttgtga taaaccagt                           39
<210>114
<211>37
<212>DNA
<213>合成序列
<220>
<221>引物
<222>(1)..(37)
<223>
<400>114
gcgcatgctc tagattacga attggttact gaattgt                             37
<210>115
<211>819
<212>DNA
<213>点形念珠藻ATCC 29133
<220>
<221>misc_feature
<222>(5)..(802)
<223>
<400>115
gcgcatgcat ctagaaatga atttttgtga taaaccagtt agctattatg ttgcaataga     60
gcaattaagt gctaaagaag atactgtttg ggggctggtg attgtcatag taattattag    120
tctttgggta gctagtttgg cttttttact agctattaat tatgccaaag tcccaatttg    180
gttgatacct attgcaatag tttggcaaat gttcctttat acagggctat ttattactgc    240
acatgatgct atgcatgggt cagtttatcg taaaaatccc aaaattaata attttatcgg    300
ttcactagct gtagcgcttt acgctgtgtt tccatatcaa cagatgttaa agaatcattg    360
cttacatcat cgtcatcctg ctagcgaagt tgacccagat tttcatgatg gtaagagaac    420
aaacgctatt ttctggtatc tccatttcat gatagaatac tccagttggc aacagttaat    480
agtactaact atcctattta atttagctaa atacgttttg cacatccatc aaataaatct    540
catcttattt tggagtattc ctccaatttt aagttccatt caactgtttt atttcggaac    600
atttttgcct catcgagaac ccaagaaagg atatgtttat ccccattgca gccaaacaat    660
aaaattgcca acttttttgt catttatcgc ttgctaccac tttggttatc atgaagaaca    720
tcatgagtat ccccatgtac cttggtggca acttccatct gtatataagc agagagtatt    780
caacaattca gtaaccaatt cgtaatctag agcatgcgc                           819
<210>116
<211>24
<212>DNA
<213>合成序列
<220>
<221>引物
<222>(1)..(24)
<223>
<400>116
gaattcctgc aatagaatgt tgag                                           24
<210>117
<211>25
<212>DNA
<213>合成序列
<220>
<221>引物
<222>(1)..(25)
<223>
<400>117
ctcgagctta cgagcatttt ctaag                                          25
<210>118
<211>307
<212>DNA
<213>蚕豆
<220>
<221>终止子
<222>(1)..(307)
<223>
<400>118
gaattcctgc aatagaatgt tgaggtgacc actttctgta ataaaataat tataaaataa     60
atttagaatt gctgtagtca agaacatcag ttctaaaata ttaataaagt tatggccttt    120
tgacatatgt gtttcgataa aaaaatcaaa ataaattgag atttattcga aatacaatga    180
aagtttgcag atatgagata tgtttctaca aaataataac ttaaaactca actatatgct    240
aatgtttttc ttggtgtgtt tcatagaaaa ttgtatccgt ttcttagaaa atgctcgtaa    300
gctcgag                                                              307
<210>119
<211>25
<212>DNA
<213>合成序列
<220>
<221>引物
<222>(1)..(25)
<223>
<400>119
gaattcccaa taataatcta cagcc                                          25
<210>120
<211>25
<212>DNA
<213>合成序列
<220>
<221>引物
<222>(1)..(25)
<223>
<400>120
aagcttccat gqcggccgga atttc                                          25
<210>121
<211>1020
<212>DNA
<213>食用番茄
<220>
<221>misc_feature
<222>(1)..(1020)
<223>编码β-羟化酶的核酸
<400>121
aagcttccat ggcggccgga atttcagcct ccgctagttc ccgaaccatt cgcctccgtc     60
ataacccgtt tctcagtcca aaatccgcct caaccgcccc gccggttctg ttcttctctc    120
cgttaactcg caattttggc gcaattttgc tgtctagaag aaagccgaga ttggcggttt    180
gttttgtgct ggagaatgag aaattgaata gtactatcga aagtgagagt gaagtaatag    240
aggatcggat acaagtagag attaatgagg agaagagttt agctgccagt tggctggcgg    300
agaaattggc gaggaagaaa tcggagaggt ttacttatct tgtggcagct gtgatgtcta    360
gtttggggat tacttctatg gcgattttgg cggtttatta cagattttca tggcaaatgg    420
agggtggaga agtgcctttt tctgaaatgt tagctacatt cactctctcg tttggcgctg    480
ccgtaggaat ggagtactgg gcgagatggg ctcatagagc actatggcat gcttctttat    540
ggcacatgca cgagtcgcac catagaccaa gagaaggacc ttttgagatg aacgacgttt    600
tcgccataac aaatgctgtt ccagctatag gtcttctttc ctacggtttc ttccataaag     660
ggatcgtccc tggcctctgt ttcggcgctg gattggggat cacagtattt gggatggctt     720
acatgttcgt tcacgatgga ctggttcata agagatttcc cgtagggcct attgccaacg     780
tgccttactt tcggagggta gctgcagcac atcagcttca tcactcggac aaatttgatg     840
gtgtcccata tggcttgttt ctaggaccta aggaattgga agaagtagga ggacttgaag     900
agttagaaaa ggaagtcaac cgaaggatta aaatttctaa gggattatta tgatcaaaag     960
atacgtctga taataataaa atgcgattgt atttaggctg tagattatta ttgggaattc    1020
<210>122
<211>24
<212>DNA
<213>合成序列
<220>
<221>引物
<222>(1)..(24)
<223>
<400>122
gagctctagc gcaatcttat gtgg                                           24
<210>123
<211>22
<212>DNA
<213>合成序列
<220>
<221>引物
<222>(1)..(22)
<223>
<400>123
ccatggttct cacttctgta tg                                             22
<210>124
<211>1802
<212>DNA
<213>碧冬茄
<220>
<221>启动子
<222>(1)..(1802)
<223>
<400>124
gagctctagc gcaatcttat gtggtacaaa tcttgattag tcgggaaaaa atgatgtggc     60
cctacaaatg gttggaggat gggagatttg gctctatcta gagttatgtg gttgttgaag    120
catttggtta ctctctgctg tggtagttgg catatccaca ttgtctcctt ccacttttat    180
gacaattacg tgaaagttat gggttgtttt gtctattttt gtcgaggcct ttcttttcct    240
tccaggttgt tgaagatggt ccaattcgat tagaataatg ttttgagctt tagcatattc    300
tctctcgttt acacgattat agtaataatg atataggatg acagaagttg acacataaat    360
tttttattct ctccatttac tttaatccaa atctcaccta ccctaaactt ctttaatatg    420
tattcaatag tctatccgag taaattgtaa atttaacaac cattgataat attgacacct     480
actaacatat actagtaaag agaatattaa catggcacat ataatttgat gcaaaatgag     540
tatgatgaaa tttaaaccca aaatctcttg attttgacag tgtcaccttg acttgttaac     600
taataagtca tgttttagtg gcagaaagac aaactcatcc accaactgta tagcaataaa     660
aaatagaaga atcttcctga ggcaaagttt tggaaaaatt aagagtggct gagatttaat     720
ttcaacagga attagttcca cttaactttt aggttacgat acagtgctaa ttaaataact     780
taattgtatt agatatttct tgcacctaaa aaatttaaaa actgaaaaaa ggtagcaatc     840
aaaataaaca aaaggacaaa ataagtgaaa ggtacagcca ccaaccctgg cggctcactg     900
tttgttggtt aaaacgtaga cttacaccta ccaaaatcta caactaaaat gaggcaataa     960
tactttgccc aaaattacca agaaaagaaa aagaaaggaa tcccttaata ttactctcct    1020
ccatttcaca ataaatatcc tagtttgact taaattagag tttaaaaaat gaaagacgac    1080
ttttaaaact tgtaatctaa aataaatcat agttaaatgt gtggctataa atcattgtat    1140
taacggtaaa gtggtaagtt taaaagttaa ttgttttcaa atataaaatt gtactatcat    1200
tctttttgga atggactaat aagaaaacta tgacatccat tatggagcgg agggagtatc    1260
tccttttaac aataaccttt gtcccttcaa ttcaattatc agtatgcaaa cattaaaaat    1320
tattattgat gttaagtacc acatcatcct taatgataga atcatcgtag aacgcttttc    1380
caggcacaca ttcaaactag ttagaccagt accacacatc gaatattcca gacttctttg    1440
tttgaatagt cgactacatt ggataatgga acttctcgaa ttaacttcga attagtcgag    1500
cccaaaataa tatatacgtc gggtggaaaa ctataaaatg tttgacaaaa atgtcaaatt    1560
aatatatcaa tctgcaacaa ccttttcacc ttgagaacac agctgaaatt ttttacaaag    1620
gtagttggtg aagctagtca gcgaatccca ttaccttcca ctctacctaa cccccttcac    1680
caacaacaaa tttctgtaat ttaaaaacta gccaaaaaag aactctcttt tacaaagagc    1740
caaagactca atctttactt tcaagaaaag ctttgcaatt catacagaag tgagaaccat    1800
gg                                                                   1802
<210>125
<211>1033
<212>DNA
<213>拟南芥
<220>
<221>启动子
<222>(1)..(1033)
<223>P76
<400>125
aggtgcatga ccaagtaaca atttgattcc tttccagcat aacgtcatgt tggttgcaaa     60
aagaaggcaa agtagagcaa gcaagcaagc aaagcatttt tcttatttta tattttgttg    120
cggattccac cacccacttg aaaaattgac atgtcacaat gatttcgtat cctagtcttt    180
tattatttaa cactctcaca atcccattac tctacacctc tttcattaag tcaacacacg    240
gttttcaaaa atccactacc ctcccaccac ctagaatctt ttgttaccta ccaacaccct    300
cctttgttct ctttatatat tggtccaact aaatcaataa gggaaagcat ccttttggtt    360
ggaggaattg ctttcattct cactctttgt gtgttgatca atggactagc taataacaag    420
ttcctcctct atatatttca aaagaatgga acagaaacat aaacgaaaga cagagtacct    480
gatgttgatg attcattgtc tgtctggagc tcccaaatgc cttttatgct tacatattca    540
taaccaacaa cggctattaa ttataaacca aaaacacgaa ataagtttgt agcaaagtga    600
aattaggaat cttggagatg gatccattag tagtaggata ataggatatg atggaatttg    660
gttggggaac agtgataact tacgcttgct tccggcgccg ggaaagttgg aaaacctaca    720
aagtacagaa atggatctgg gccttgaagt gggcttttta ttaaagaaaa aaatacatct    780
ccgttatcaa tcaccatctt cttctatcta caaattaaag aaggtaacaa cagaacgtgg    840
tggatcatgt ggttaggcat taattatttg ctttgtttcg ccgttttggt aacacacaga     900
cacagttccg gtaagagctt ttgcagccac tctttatagt tatttagaat tggcgatcga     960
atcaatctca ctccctccct cccttaagtc ttgttgaatc tgctgaattg ttttataaag    1020
agttactttg gca                                                       1033
<210>126
<211>19
<212>DNA
<213>合成序列
<220>
<221>引物
<222>(1)..(19)
<223>
<400>126
tgccaaagta actctttat                                                 19
<210>127
<211>19
<212>DNA
<213>合成序列
<220>
<221>引物
<222>(1)..(19)
<223>
<400>127
aggtgcatga ccaagtaac                                                 19
<210>128
<211>996
<212>DNA
<213>合成序列
<220>
<221>misc_feature
<222>(1)..(996)
<223>
<400>128
ggcacgagcc tctctctatt tttacacttc aatggcggca gcaattgctg tcccttgtag     60
ctcaagacca tttggcttag gtcgaatgcg gttacttggt cataaaccca caaccataac    120
ttgtcacttc cccttttctt tttctatcaa atcatttacc ccaattgtta ggggcagaag    180
atgtactgtt tgttttgttg ccggtggcga cagtaatagt aacagtaata ataatagtga    240
cagtaatagt aataatccgg gtctggattt aaacccggcg gttatgaacc gtaaccgttt    300
ggttgaagaa aaaatggaga ggaaaaaatc ggaacgattt acttatcttg ttgcagctat    360
tatgtctact tttggaatta cttcaatggc ggttatggcg gtttattacc ggttttcatg    420
gcaaatggag ggtggagaaa ttccttatgt ggagatgttt ggtacatttg ctctctccgt    480
tggtgctgcg gtaggaatgg agtattgggc aagatgggct catgaggcac tatggcatgc    540
ttctttgtgg cacatgcatg agtcacacca taagccacga gaaggtccgt ttgagcttaa    600
tgatgtgttt gctataacaa atgcggtccc ggccattgcg ttgcttagtt atgggttttt    660
ccacaaaggc ataattccgg gtctttgttt tggggcggga ctgggaatta cggtgtttgg    720
aatggcgtat atgttcgtcc acgacgggct agttcacaga agattccaag tgggtccgat    780
tgcgaatgtt ccctatcttc gaagggttgc agcggctcat cagctgcatc acacggaaaa    840
atttaatggt gttccttatg gcttgttctt gggacctaag gagctagaag aagtgggtgg    900
tacggaagaa ttggacaagg agattcaaag aagaattaaa ttgtataata atactaaata    960
aataaatttt gtataaaatt aatataattt aatgat                              996
<210>129
<211>18
<212>DNA
<213>合成序列
<220>
<221>引物
<222>(1)..(18)
<223>
<400>129
atggaagctc ttctcaag                                                   18
<210>130
<211>18
<212>DNA
<213>合成序列
<220>
<221>引物
<222>(1)..(18)
<223>
<400>130
accttaccta aaacattt                                                  18
<210>131
<21I>1045
<212>DNA
<213>拟南芥
<220>
<221>启动子
<222>(1)..(1045)
<223>
<400>131
gtcgacaggt gcatgaccaa gtaacaattt gattcctttc cagcataacg tcatgttggt     60
tgcaaaaaga aggcaaagta gagcaagcaa gcaagcaaag catttttctt attttatatt    120
ttgttgcgga ttccaccacc cacttgaaaa attgacatgt cacaatgatt tcgtatccta    180
gtcttttatt atttaacact ctcacaatcc cattactcta cacctctttc attaagtcaa    240
cacacggttt tcaaaaatcc actaccctcc caccacctag aatcttttgt tacctaccaa    300
caccctcctt tgttctcttt atatattggt ccaactaaat caataaggga aagcatcctt    360
ttggttggag gaattgcttt cattctcact ctttgtgtgt tgatcaatgg actagctaat    420
aacaagttcc tcctctatat atttcaaaag aatggaacag aaacataaac gaaagacaga     480
gtacctgatg ttgatgattc attgtctgtc tggagctccc aaatgccttt tatgcttaca     540
tattcataac caacaacggc tattaattat aaaccaaaaa cacgaaataa gtttgtagca     600
aagtgaaatt aggaatcttg gagatggatc cattagtagt aggataatag gatatgatgg     660
aatttggttg gggaacagtg ataacttacg cttgcttccg gcgccgggaa agttggaaaa     720
cctacaaagt acagaaatgg atctgggcct tgaagtgggc tttttattaa agaaaaaaat     780
acatctccgt tatcaatcac catcttcttc tatctacaaa ttaaagaagg taacaacaga     840
acgtggtgga tcatgtggtt aggcattaat tatttgcttt gtttcgccgt tttggtaaca     900
cacagacaca gttccggtaa gagcttttgc agccactctt tatagttatt tagaattggc     960
gatcgaatca atctcactcc ctccctccct taagtcttgt tgaatctgct gaattgtttt    1020
ataaagagtt actttggcac ccggg                                          1045

Claims (71)

1.通过培养遗传修饰的非人生物制备酮类胡萝卜素的方法,所述遗传修饰的生物与野生型相比具有修饰的酮酶活性及修饰的β环化酶活性,而其修饰的β环化酶活性是由于β环化酶造成,其含有SEQ ID NO:2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO:2序列至少有70%的同一性。
2.如权利要求1的方法,其中使用野生型具有酮酶活性而遗传修饰使其酮酶活性相对于野生型增加的非人生物。
3.如权利要求2的方法,其中通过提高编码酮酶的核酸相对于野生型的基因表达来增加酮酶活性。
4.如权利要求3的方法,其中通过向生物中插入编码酮酶的核酸来增加基因表达。
5.如权利要求4的方法,其中插入的编码酮酶的核酸所编码的酮酶含有SEQ ID NO:4氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO:4序列至少有70%的同一性。
6.如权利要求1的方法,其中使用野生型不具有酮酶活性而遗传修饰使其相对于野生型造成酮酶活性的非人生物。
7.如权利要求6的方法,其中使用转基因表达酮酶的遗传修饰生物。
8.如权利要求6或7的方法,其中通过向生物中插入编码酮酶的核酸来造成基因表达。
9.如权利要求8的方法,其中插入的核酸编码的酮酶含有SEQ ID NO:4氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO:4序列至少有70%的同一性。
10.如权利要求5或9的方法,其中插入含有序列SEQ ID NO:3的核酸。
11.如权利要求1至10中任一项的方法,其中使用野生型已经具有β环化酶活性而遗传修饰使其β环化酶活性相对于野生型增加的生物。
12.如权利要求11的方法,其中通过提高编码β环化酶的核酸相对于野生型的基因表达来增加β环化酶活性,所述β环化酶含有SEQ ID NO:2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO:2序列至少有70%的同一性。
13.如权利要求12的方法,其中通过向生物中插入编码β环化酶的核酸来增加基因表达,所述β环化酶含有SEQ ID NO:2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO:2序列至少有70%的同一性。
14.如权利要求1至10中任一项的方法,其中使用野生型不具有β环化酶活性而遗传修饰使其相对于野生型造成β环化酶活性的生物。
15.如权利要求14的方法,其中使用转基因表达β环化酶的遗传修饰生物,所述β环化酶含有SEQ ID NO:2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO:2序列至少有70%的同一性。
16.如权利要求14或15的方法,其中通过向生物中插入编码β环化酶的核酸来造成基因表达,所述β环化酶含有SEQ ID NO:2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO:2序列至少有70%的同一性。
17.如权利要求13或16的方法,其中插入含有序列SEQ ID NO:1的核酸。
18.如权利要求1至17中任一项的方法,其中使用相对于野生型额外具有增加的或造成的羟化酶活性的非人生物。
19.如权利要求18的方法,其中通过增加或造成编码羟化酶的核酸相对于野生型的基因表达来额外增加或造成羟化酶活性。
20.如权利要求19的方法,其中通过向生物中插入编码羟化酶的核酸来增加或造成基因表达。
21.如权利要求20的方法,其中插入的编码羟化酶的核酸,其编码的羟化酶含有SEQ ID NO:6氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO:6序列至少有70%的同一性。
22.如权利要求21的方法,其中插入含有序列SEQ ID NO:5的核酸。
23.如权利要求1至22中任一项的方法,其中使用相对于野生型额外具有增加的或造成的选自HMG-CoA还原酶活性、(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶活性、1-脱氧-D-木糖-5-磷酸合酶活性、1-脱氧-D-木糖-5-磷酸还原异构酶活性、异戊烯二磷酸酯Δ-异构酶活性、牻牛儿基二磷酸酯合酶活性、法呢基二磷酸酯合酶活性、牻牛儿基牻牛儿基二磷酸酯合酶活性、八氢番茄红素合酶活性、八氢番茄红素去饱和酶活性、ζ-胡萝卜素去饱和酶活性、crtISO活性、FtsZ活性以及MinD活性中至少一种的生物。
24.如权利要求23的方法,其中通过增加选自编码HMG-CoA还原酶的核酸、编码(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶的核酸、编码1-脱氧-D-木糖-5-磷酸合酶的核酸、编码1-脱氧-D-木糖-5-磷酸还原异构酶的核酸、编码异戊烯基二磷酸酯Δ-异构酶的核酸、编码牻牛儿基二磷酸酯合酶的核酸、编码法呢基二磷酸酯合酶的核酸、编码牻牛儿基牻牛儿基二磷酸酯合酶的核酸、编码八氢番茄红素合酶的核酸、编码八氢番茄红素去饱和酶的核酸、编码ζ-胡萝卜素去饱和酶的核酸、编码crtISO蛋白的核酸、编码FtsZ蛋白的核酸、编码MinD蛋白的核酸中至少一种相对于野生型的基因表达来额外增加或造成至少一种活性。
25.如权利要求24的方法,其中通过向非人生物中插入选自编码HMG-CoA还原酶的核酸、编码(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶的核酸、编码1-脱氧-D-木糖-5-磷酸合酶的核酸、编码1-脱氧-D-木糖-5-磷酸还原异构酶的核酸、编码异戊烯基二磷酸酯Δ-异构酶的核酸、编码牻牛儿基二磷酸酯合酶的核酸、编码法呢基二磷酸酯合酶的核酸、编码牻牛儿基牻牛儿基二磷酸酯合酶的核酸、编码八氢番茄红素合酶的核酸、编码八氢番茄红素去饱和酶的核酸、编码ζ-胡萝卜素去饱和酶的核酸、编码crtISO蛋白的核酸、编码FtsZ蛋白的核酸、编码MinD蛋白的核酸中至少一种来增加或造成至少一种核酸的基因表达。
26.如权利要求25的方法,其中插入编码HMG-CoA还原酶的核酸,其编码的HMG-CoA还原酶含有SEQ ID NO:8氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO:8序列至少有20%的同一性。
27.如权利要求26的方法,其中插入含有序列SEQ ID NO:7的核酸。
28.如权利要求25的方法,其中插入编码(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶的核酸,其编码的(E)-4-羟基-3-甲基丁-2-烯基二磷酸酯还原酶含有SEQ ID NO:10氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO:10序列至少有20%的同一性。
29.如权利要求28的方法,其中插入含有序列SEQ ID NO:9的核酸。
30.如权利要求25的方法,其中插入编码1-脱氧-D-木糖-5-磷酸合酶的核酸,其编码的1-脱氧-D-木糖-5-磷酸合酶含有SEQ ID NO:12氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO:12序列至少有20%的同一性。
31.如权利要求30的方法,其中插入含有序列SEQ ID NO:11的核酸。
32.如权利要求25的方法,其中插入编码1-脱氧-D-木糖-5-磷酸还原异构酶的核酸,其编码的1-脱氧-D-木糖-5-磷酸还原异构酶含有SEQ IDNO:14氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO:14序列至少有20%的同一性。
33.如权利要求32的方法,其中插入含有序列SEQ ID NO:13的核酸。
34.如权利要求25的方法,其中插入编码异戊烯基二磷酸酯Δ-异构酶的核酸,其编码的异戊烯基二磷酸酯Δ-异构酶含有SEQ ID NO:16氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO:16序列至少有20%的同一性。
35.如权利要求34的方法,其中插入含有序列SEQ ID NO:15的核酸。
36.如权利要求25的方法,其中插入编码牻牛儿基二磷酸酯合酶的核酸,其编码的牻牛儿基二磷酸酯合酶含有SEQ ID NO:18氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO:18序列至少有20%的同一性。
37.如权利要求36的方法,其中插入含有序列SEQ ID NO:17的核酸。
38.如权利要求25的方法,其中插入编码法呢基二磷酸酯合酶的核酸,其编码的法呢基二磷酸酯合酶含有SEQ ID NO:20氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQID NO:20序列至少有20%的同一性。
39.如权利要求38的方法,其中插入含有序列SEQ ID NO:19的核酸。
40.如权利要求25的方法,其中插入编码牻牛儿基牻牛儿基二磷酸酯合酶的核酸,其编码的牻牛儿基牻牛儿基二磷酸酯合酶含有SEQ ID NO:22氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO:22序列至少有20%的同一性。
41.如权利要求40的方法,其中插入含有序列SEQ ID NO:21的核酸。
42.如权利要求25的方法,其中插入编码八氢番茄红素合酶的核酸,其编码的八氢番茄红素合酶含有SEQ ID NO:24氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO:24序列至少有20%的同一性。
43.如权利要求42的方法,其中插入含有序列SEQ ID NO:23的核酸。
44.如权利要求25的方法,其中插入编码八氢番茄红素去饱和酶的核酸,其编码的八氢番茄红素去饱和酶含有SEQ ID NO:26氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO:26序列至少有20%的同一性。
45.如权利要求44的方法,其中插入含有序列SEQ ID NO:25的核酸。
46.如权利要求25的方法,其中插入编码ζ-胡萝卜素去饱和酶的核酸,其编码的ζ-胡萝卜素去饱和酶含有SEQ ID NO:28氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQID NO:28序列至少有20%的同一性。
47.如权利要求46的方法,其中插入含有序列SEQ ID NO:27的核酸。
48.如权利要求25的方法,其中插入编码crtISO蛋白的核酸,其编码的crtISO蛋白含有SEQ ID NO:30氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO:30序列至少有20%的同一性。
49.如权利要求48的方法,其中插入含有序列SEQ ID NO:29的核酸。
50.如权利要求25的方法,其中插入编码FtsZ蛋白的核酸,其编码的FtsZ蛋白含有SEQ ID NO:32氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO:32序列至少有20%的同一性。
51.如权利要求50的方法,其中插入含有序列SEQ ID NO:31的核酸。
52.如权利要求25的方法,其中插入编码MinD蛋白的核酸,其编码的MinD蛋白含有SEQ ID NO:34氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO:34序列至少有20%的同一性。
53.如权利要求52的方法,其中插入含有序列SEQ ID NO:33的核酸。
54.如权利要求1至53中任一项的方法,其中在培养后收集遗传修饰的生物并随后从生物中分离酮类胡萝卜素。
55.如权利要求1至54中任一项的方法,其中使用起始生物可天然产生或能够通过遗传互补或代谢途径的再调节生产类胡萝卜素的生物。
56.如权利要求1至55中任一项的方法,其中使用的生物是微生物或植物。
57.如权利要求56的方法,其中使用的微生物为细菌、酵母、藻类或真菌。
58.如权利要求57的方法,其中微生物选自埃希氏杆菌属、欧文氏菌属、农杆菌属、黄杆菌属、产碱菌属、副球菌属、念珠藻属、集胞藻属蓝细菌、假丝酵母属、酵母属、汉逊酵母属、法夫酵母属、毕赤酵母属、曲霉属、木霉属、阿舒囊霉属、脉孢菌属、布拉霉属、须霉属、镰孢霉属、红球藻属、三角褐指藻、团藻属或杜氏藻属。
59.如权利要求56的方法,其中使用的生物为植物。
60.如权利要求59的方法,其中使用的植物选自苋科、石蒜科、夹竹桃科、紫菀科、凤仙花科、秋海棠科、小檗科、十字花科、大麻科、忍冬科、石竹科、藜科、菊科、葫芦科、十字花科、大戟属、豆科、龙胆科、牻牛儿苗科、禾本科、Illiaceae、唇形科、薄荷科、豆科、百合科、亚麻科、山梗菜属、锦葵科、木犀科、兰科、罂粟科、白花丹科、禾本科、花荵科、报春花科、毛茛科、蔷薇科、茜草科、玄参科、茄科、旱金莲科、伞状花科、毛蕊花科、葡萄科或紫罗兰科。
61.如权利要求60的方法,其中使用的植物选自万寿菊属、万寿菊、孔雀草、金合欢属、乌头属、侧金盏花属、阿尼菊属、耧斗菜属、紫菀属、黄芪属、紫葳属、金盏花属、驴蹄草属、风铃草属、美人蕉属、矢车菊属、桂竹香属、茼蒿属、柑桔属、还阳参属、番红花属、南瓜属、金雀儿属、Delonia属、翠雀属、石竹属、康乃馨属、多榔菊属、花菱草属、连翘属、Fremontia属、勋章菊属、钩吻属、染料木属、龙胆属、老鹳草属、非洲菊属、路边青属、银桦属、堆心菊属、向日葵属、细辛属、独活属、木槿属、赛菊芋属、金丝桃属、黄金菊属、凤仙花属、鸢尾属、蓝花楹属、棣堂属、毒豆属、山黧豆属、猫耳草属、百合属、亚麻属、百脉根属、番茄属、珍珠菜属、Maratia、苜蓿属、沟酸浆属、水仙属、月见草属、木犀属、碧冬茄属、石楠属、酸浆属、牧根草属、委陵草属、火棘属、毛茛属、杜鹃花属、蔷薇属、金光菊属、千里光属、蝇子草属、松香草属、Sinapsis、花楸属、鹰爪豆属、黄钟花属、蝴蝶草属、婆罗们参属、金莲花属、旱金莲属、郁金香属、款冬属、荆豆属、堇菜属或百日草属植物。
62.如权利要求1至61中任一项的方法,其中酮类胡萝卜素选自虾青素、角黄素、海胆酮、3-羟基海胆酮、3’-羟基海胆酮、金盏花玉红质和金盏花黄质。
63.遗传修饰的非人生物,其中该遗传修饰,
A.对于已经具有酮酶活性的野生型生物,与野生型相比增加其酮酶活性,且
B.对于不具有酮酶活性的野生型生物,与野生型相比造成酮酶活性,且其中该遗传修饰
C.对于已经具有β环化酶活性的野生型生物,与野生型相比增加其β环化酶活性,且
D.对于不具有β环化酶活性的野生型生物,与野生型相比造成β环化酶活性,
而C中增加的β环化酶活性或D中造成的β环化酶活性源于以下β环化酶,该β环化酶含有SEQ ID NO:2氨基酸序列或对该序列替换、插入或删除氨基酸而衍生的序列,后者在氨基酸水平上与SEQ ID NO:2序列至少有70%的同一性。
64.如权利要求63的遗传修饰的生物,所述生物的起始生物可天然产生或能够通过遗传互补产生类胡萝卜素。
65.如权利要求63或64的遗传修饰的生物,选自微生物或植物。
66.如权利要求65的遗传修饰的生物,其中微生物选自细菌、酵母、藻类或真菌。
67.如权利要求66的遗传修饰的生物,其中微生物选自埃希氏杆菌属、欧文氏菌属、农杆菌属、黄杆菌属、产碱菌属、副球菌属、念珠藻属、集胞藻属蓝细菌、假丝酵母属、酵母属、汉逊酵母属、毕赤酵母属、曲霉属、木霉属、阿舒囊霉属、脉孢菌属、布拉霉属、须霉属、镰孢霉属、红球藻属、三角褐指藻、团藻属或杜氏藻属。
68.如权利要求65的遗传修饰的生物,其中使用的植物选自苋科、石蒜科、夹竹桃科、紫菀科、凤仙花科、秋海棠科、小檗科、十字花科、大麻科、忍冬科、石竹科、藜科、菊科、葫芦科、十字花科、大戟属、豆科、龙胆科、牻牛儿苗科、禾本科、Illiaceae、唇形科、薄荷科、豆科、百合科、亚麻科、山梗菜属、锦葵科、木犀科、兰科、罂粟科、白花丹科、禾本科、花荵科、报春花科、毛茛科、蔷薇科、茜草科、玄参科、茄科、旱金莲科、伞状花科、毛蕊花科、葡萄科及紫罗兰科。
69.如权利要求68的遗传修饰的生物,其中使用的植物选自万寿菊属、万寿菊、孔雀草、金合欢属、乌头属、侧金盏花属、阿尼菊属、耧斗菜属、紫菀属、黄芪属、紫葳属、金盏花属、驴蹄草属、风铃草属、美人蕉属、矢车菊属、桂竹香属、茼蒿属、柑桔属、还阳参属、番红花属、南瓜属、金雀儿属、Delonia属、翠雀属、石竹属、康乃馨属、多榔菊属、花菱草属、连翘属、Fremontia属、勋章菊属、钩吻属、染料木属、龙胆属、老鹳草属、非洲菊属、路边青属、银桦属、堆心菊属、向日葵属、细辛属、独活属、木槿属、赛菊芋属、金丝桃属、黄金菊属、凤仙花属、鸢尾属、蓝花楹属、棣堂属、毒豆属、山黧豆属、猫耳草属、百合属、亚麻属、百脉根属、番茄属、珍珠菜属、Maratia、苜蓿属、沟酸浆属、水仙属、月见草属、木犀属、碧冬茄属、石楠属、酸浆属、牧根草属、委陵草属、火棘属、毛茛属、杜鹃花属、蔷薇属、金光菊属、千里光属、蝇子草属、松香草属、Sinapsis、花楸属、鹰爪豆属、黄钟花属、蝴蝶草属、婆罗们参属、金莲花属、旱金莲属、郁金香属、款冬属、荆豆属、堇菜属或百日草属植物。
70.如权利要求63至69中任一项的遗传修饰生物作为饲料或食品的用途。
71.如权利要求63至69中任一项的遗传修饰生物在生产含酮类胡萝卜素提取物或生产饲料添加剂或食品添加剂中的用途。
CNA2004800290687A 2003-08-18 2004-07-31 在遗传修饰的非人生物中制备酮类胡萝卜素的方法 Pending CN1863922A (zh)

Applications Claiming Priority (8)

Application Number Priority Date Filing Date Title
EPPCT/EP03/09102 2003-08-18
EPPCT/EP03/09109 2003-08-18
EPPCT/EP03/09105 2003-08-18
EPPCT/EP03/09101 2003-08-18
PCT/EP2003/009102 WO2004018693A2 (de) 2002-08-20 2003-08-18 Verfahren zur herstellung von ketocarotinoiden in blütenblättern von pflanzen
EPPCT/EP03/09106 2003-08-18
EPPCT/EP03/09107 2003-08-18
DE102004007622.7 2004-02-17

Publications (1)

Publication Number Publication Date
CN1863922A true CN1863922A (zh) 2006-11-15

Family

ID=37390835

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2004800290687A Pending CN1863922A (zh) 2003-08-18 2004-07-31 在遗传修饰的非人生物中制备酮类胡萝卜素的方法

Country Status (1)

Country Link
CN (1) CN1863922A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110168096A (zh) * 2016-12-16 2019-08-23 德诺芙公司 生产八氢番茄红素的方法
CN111454854A (zh) * 2020-05-02 2020-07-28 昆明理工大学 一株产虾青素的红冬孢酵母基因工程菌株
CN112239777A (zh) * 2019-07-16 2021-01-19 汕头大学 一种类胡萝卜素生产细菌的定性和定量检测方法
CN114173817A (zh) * 2019-05-31 2022-03-11 塔夫茨大学信托人 使用基因修饰细胞的培养肉产品

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110168096A (zh) * 2016-12-16 2019-08-23 德诺芙公司 生产八氢番茄红素的方法
CN114173817A (zh) * 2019-05-31 2022-03-11 塔夫茨大学信托人 使用基因修饰细胞的培养肉产品
CN112239777A (zh) * 2019-07-16 2021-01-19 汕头大学 一种类胡萝卜素生产细菌的定性和定量检测方法
CN111454854A (zh) * 2020-05-02 2020-07-28 昆明理工大学 一株产虾青素的红冬孢酵母基因工程菌株

Similar Documents

Publication Publication Date Title
ZA200602230B (en) Method for producing ketocarotinoids in genetically modified, non-human organisms
ZA200506324B (en) Method for producing ketocarotenoids by cultivating genetically modified organisms
CN1551914A (zh) 脂肪酸去饱和酶家族成员fad4、fad5、fad5-2和fad6及它们的应用
CN1656226A (zh) 用于产生不饱和脂肪酸的方法
WO2010079032A1 (en) Production of ketocarotenoids in plants
CN1688711A (zh) 在遗传修饰生物中制备酮类胡萝卜素的方法
US20060194274A1 (en) Method for producing ketocarotinoids in genetically modified, non-human organisms
JP2007502605A6 (ja) 遺伝子的に改変された非ヒト生物におけるケトカロテノイドの製造方法
CN1863922A (zh) 在遗传修饰的非人生物中制备酮类胡萝卜素的方法
CN1688206A (zh) 含虾青素的万寿菊属植物或植物部分作为饲料的用途
US20080060096A1 (en) Novel Ketolases and Method for Producing Ketocarotinoids
CN1717173A (zh) 花瓣中的4-酮类胡萝卜素
EP2199399A1 (en) Production of ketocarotenoids in plants
AU2004267196A1 (en) Method for producing ketocarotinoids in genetically modified, non-human organisms
EP1658372A2 (de) Ketolasen und verfahren zur herstellung von ketocarotinoiden
EP1658377A1 (de) VERFAHREN ZUR HERSTELLUNG VON KETOCAROTINOIDEN IN GENETISCH VER&amp;Auml;NDERTEN, NICHTHUMANEN ORGANISMEN

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication