CN101848996A

CN101848996A - △9延伸酶及其在制备多不饱和脂肪酸中的用途

Info

Publication number: CN101848996A
Application number: CN200880020395A
Authority: CN
Inventors: H·G·达穆德; Q·Q·朱
Original assignee: EI Du Pont de Nemours and Co
Current assignee: EIDP Inc
Priority date: 2007-04-16
Filing date: 2008-04-16
Publication date: 2010-09-29
Anticipated expiration: 2028-04-16
Also published as: AU2008240029A1; EP2137304B1; US8298797B2; US20100267098A1; WO2008128241A1; WO2008128240A1; AU2008240029B2; JP2010524468A; AU2008240028A1; CA2682962A1; US20100162435A1; DK2137304T3; EP2134837A1; CA2679485A1; EP2137304A1; US8119860B2; US20120100595A1; BRPI0807291A2; CN101848996B; US8377673B2

Abstract

本发明涉及Δ9延伸酶，所述Δ9延伸酶具有将亚油酸(LA；18:2ω-6)转化成二十碳二烯酸(EDA；20:2ω-6)和/或将α-亚麻酸(ALA；18:3ω-3)转化成二十碳三烯酸(ETrA；20:3ω-3)的能力。公开了分离的核酸片段和包含这种编码Δ9延伸酶的片段的重组构建体，以及用这些Δ9延伸酶在含油酵母中制备长链多不饱和脂肪酸(PUFA)的方法。

Description

Δ9延伸酶及其在制备多不饱和脂肪酸中的用途

本申请要求提交于2007年4月16日的美国临时专利申请60/911,925的优先权，将该专利的全文以引用的方式并入本文中。

发明领域

本发明属于生物技术领域。更具体地讲，本发明涉及编码Δ9脂肪酸延伸酶的多核苷酸序列的鉴定以及这些延伸酶在制备长链多不饱和脂肪酸PUFA中的用途。

背景技术

现今，人们正研究包括植物、藻类、真菌、原生藻菌(stramenopiles)和酵母在内的多种不同宿主作为商业化PUFA生产的手段。基因工程已经证明，一些宿主(即便是天然受限于亚油酸(LA；18:2 ω-6)和α-亚麻酸(ALA；18:3 ω-3)脂肪酸产生的那些宿主)的天然能力可以被显著改变，以导致高水平地产生多种长链ω-3/ω-6 PUFA。不论这是天然能力的结果还是重组技术的结果，花生四烯酸(ARA；20:4 ω-6)、二十碳五烯酸(EPA；20:5 ω-3)和二十二碳六烯酸(DHA；22:6 ω-3)的产生可能均需要表达Δ9延伸酶。

迄今为止鉴定的大多数Δ9延伸酶既具有将LA转化成二十碳二烯酸(EDA；20:2 ω-6)的能力又具有将ALA转化成二十碳三烯酸(ETrA；20:3 ω-3)的能力(其中在与Δ8去饱和酶反应之后，EDA和ETrA随后分别被合成二高-γ-亚麻酸(DGLA；20:3 ω-6)和二十碳四烯酸(ETA；20:4 ω-3)；在与Δ5去饱和酶反应后，DGLA和ETA随后分别被合成ARA和EPA；并且，DHA合成需要后续表达额外的C_20/22延伸酶和Δ4去饱和酶)。

尽管需要用于产生ARA、EPA和DHA的新方法，但仅少量的Δ9延伸酶得以鉴定。来自绿光等鞭金藻(Isochrysis galbana)的Δ9延伸酶是公开可获得的(在基因库编号(GenBank Accession No)AAL37626以及PCT公开WO 02/077213、WO 2005/083093、WO 2005/012316和WO2004/057001中有描述)。PCT公开WO 2007/061845和WO 2007/061742(申请人的受让人的共同未决的申请)公开了来自小眼虫(Euglenagracilis)和Eutreptiella sp.CCMP389的Δ9延伸酶，以及Δ9延伸酶的基序。

因此，需要鉴定和分离出另外的编码Δ9延伸酶的基因，该基因将适用于在多种宿主生物中异源表达以用于产生ω-3/ω-6脂肪酸。

本申请人通过从Euglena anabaena中分离出编码Δ9脂肪酸延伸酶的基因而解决了这里所说的需要。

发明内容

本发明涉及编码具有Δ9延伸酶活性的多肽的新的遗传构建体，以及它们在藻类、细菌、酵母、类眼虫、原生藻菌和真菌中的使用，用于产生PUFA。因此，本发明提供包含分离的多核苷酸的微生物宿主细胞，该多核苷酸包含：

(a)编码具有Δ9延伸酶活性的多肽的核苷酸序列，其中基于ClustalV比对方法在与SEQ ID NO：13或SEQ ID NO：14中示出的氨基酸序列进行比较时，该多肽具有至少80％的氨基酸同一性；

(b)编码具有Δ9延伸酶活性的多肽的核苷酸序列，其中基于BLASTN比对方法在与SEQ ID NO：11、SEQ ID NO：12或SEQ ID NO：26中示出的核苷酸序列进行比较时，该核苷酸序列具有至少80％的序列同一性；

(c)编码具有Δ9延伸酶活性的多肽的核苷酸序列，其中该核苷酸序列在严格条件下与SEQ ID NO：11、SEQ ID NO：12或SEQ ID NO：26中示出的核苷酸序列杂交；或

(d)(a)、(b)或(c)的核苷酸序列的互补序列，其中该互补序列与该核苷酸序列由相同数目的核苷酸组成并且100％互补。

在另一个实施方案中，本发明提供用于产生二十碳二烯酸的方法，该方法包括：

a)提供微生物宿主细胞，该微生物宿主细胞包含：

(i)编码Δ9延伸酶多肽的重组核苷酸分子，基于Clustal V比对方法在与SEQ ID NO：13或SEQ ID NO：14中示出的氨基酸序列进行比较时，该延伸酶多肽具有至少80％的氨基酸同一性；和

(ii)亚油酸源；

b)使步骤(a)的微生物宿主细胞在使编码Δ9延伸酶多肽的核酸片段表达并使亚油酸转化成二十碳二烯酸的条件下生长；以及

c)任选回收步骤(b)的二十碳二烯酸。

在另一个实施方案中，本发明提供用于产生二十碳三烯酸的方法，该方法包括：

a)提供微生物宿主细胞，该微生物宿主细胞包含：

(ii)α-亚麻酸源；

b)使步骤(a)的微生物宿主细胞在使编码Δ9延伸酶多肽的核酸片段表达并使α-亚麻酸转化成二十碳三烯酸的条件下生长；以及

c)任选回收步骤(b)的二十碳三烯酸。

在另一个实施方案中，本发明提供如SEQ ID NO：26中示出的编码Δ9延伸酶的分离的核酸分子，在该序列中至少98个密码子被密码子最优化以便在耶氏酵母属(Yarrowia)物种中表达。

附图简述和序列表

图1是代表性的ω-3和ω-6脂肪酸生物合成途径，该途径提供了肉豆蔻酸经过多种中间产物向DHA的转化。

图2示出了如实施例中所述的Euglena anabaena细胞提取物的脂质概况的色谱图。

图3提供了下列质粒的质粒图谱：(A)pY115(SEQ ID NO：19)；(B)pY159(SEQ ID NO：23)；(C)pY173(SEQ ID NO：24)和(D)pY174(SEQID NO：25)。

图4A和4B示出了EaD9Elo(SEQ ID NO：11)和EaD9ES(SEQ IDNO：26)的核苷酸序列的比较。

图5提供了下列质粒的质粒图谱：(A)pEaD9ES(SEQ ID NO：28)；和(B)pZUFmEaD9eS(SEQ ID NO：29)。

根据下面的详细描述和附带的序列描述可以更充分地理解本发明，下面的详细描述和所附的序列描述形成了本申请的一部分。

下面的序列遵循37C.F.R.§1.821-1.825(“对包含核苷酸序列和/或氨基酸序列公开内容的专利申请的要求-序列规则”(“Requirementsfor Patent Applications Containing Nuceotide Sequences and/or AminoAcid Sequence Disclosures-the Sequence Rules”))，并且符合世界知识产权组织(World Intellectual Property Organization)(WIPO)ST.25标准(1998)以及EPO和PCT的序列表要求(规则5.2和49.5(a-bis)以及行政指令(Administrative Instructions)的208节和附录C)。用于核苷酸和氨基酸序列数据的符号和格式遵循在37C.F.R.§1.822中示出的规则。

SEQ ID NO：1-4、9-19和22-29为编码基因或蛋白质(或其部分)或质粒的ORF，如表1中所示。

表1

核酸和蛋白质SEQ ID号总汇

描述和缩写	核酸SEQ ID NO	蛋白质SEQ ID NO
描述和缩写	核酸SEQ ID NO	蛋白质SEQ ID NO	Euglena anabaenaΔ9延伸酶的cDNA序列(“EaD9Elo1”)	1(1129bp)	--
Euglena anabaenaΔ9延伸酶的cDNA序列(“EaD9Elo2”)	2(1145bp)	--	Euglena anabaenaΔ9延伸酶的cDNA序列(“EaD9Elo1”)	1(1129bp)	--
Euglena anabaenaΔ9延伸酶的cDNA序列(“EaD9Elo2”)	2(1145bp)	--	小眼虫Δ9延伸酶编码序列(“EgD9e”)	3(774bp)	4(258AA)
质粒pLF121-1	9(3668bp)	--	小眼虫Δ9延伸酶编码序列(“EgD9e”)	3(774bp)	4(258AA)
质粒pLF121-1	9(3668bp)	--	质粒pLF121-2	10(3684bp)	--
Euglena anabaenaΔ9延伸酶编码序列(分别为“EaD8Des1 CDS”或“EaD9Elo1”)	11(774bp)	13(258AA)	质粒pLF121-2	10(3684bp)	--
Euglena anabaenaΔ9延伸酶编码序列(分别为“EaD8Des1 CDS”或“EaD9Elo1”)	11(774bp)	13(258AA)	Euglena anabaenaΔ9延伸酶编码序列(分别为“EaD8Des2 CDS”或“EaD9Elo2”)	12(774bp)	14(258AA)

描述和缩写	核酸SEQ ID NO	蛋白质SEQ ID NO
描述和缩写	核酸SEQ ID NO	蛋白质SEQ ID NO	质粒pKR906	15(4311bp)	--
绿光等鞭金藻Δ9延伸酶(IgD9e)	--	16(263AA)	质粒pKR906	15(4311bp)	--
绿光等鞭金藻Δ9延伸酶(IgD9e)	--	16(263AA)	质粒pDMW263	17(9472bp)	--
质粒pDMW237	18(7879bp)	--	质粒pDMW263	17(9472bp)	--
质粒pDMW237	18(7879bp)	--	质粒pY115	19(7783bp)	--
质粒pY158	22(6992bp)	--	质粒pY115	19(7783bp)	--
质粒pY158	22(6992bp)	--	质粒pY159	23(8707bp)	--
质粒pY173	24(8219bp)	--	质粒pY159	23(8707bp)	--
质粒pY173	24(8219bp)	--	质粒pY174	25(8235bp)	--
来源于Euglena anabaena的、经密码子最优化以便在解脂耶氏酵母(Yarrowialipolytica)中表达的合成的Δ9延伸酶(“EaD9eS”)	26(774bp)	27(258AA)	质粒pY174	25(8235bp)	--
	26(774bp)	27(258AA)	质粒pEaD9ES	28(3497bp)	--
质粒pZUFmEaD9eS	29(7769bp)	--	质粒pEaD9ES	28(3497bp)	--

SEQ ID NO：5和6分别对应寡核苷酸oEugEL1-1和oEugEL1-2，用于扩增小眼虫Δ9延伸酶。

SEQ ID NO：7和8分别对应M13F通用引物和引物M13-28Rev，用于对Euglena anabaena DNA插入物进行末端测序。

SEQ ID NO：20和21分别对应引物oYFBA1和oYFBA1-6，用于扩增质粒pY115的FBAINm启动子。

发明详述

本文中公开了新的Euglena anabaenaΔ9延伸酶和编码这种延伸酶的基因，其可用于操纵产生健康的PUFA的生化途径。

PUFA或其衍生物可用作膳食替代品或补充剂，尤其是婴儿代乳品(formula)，用于接受静脉内营养法的患者或用来预防或治疗营养不良。或者，可以将纯化的PUFA(或其衍生物)掺入食用油、脂肪或调配的人造黄油中，以便食用者在正常使用中将获得所需量的膳食补充。PUFA还可以掺入婴儿代乳品、营养补充剂或其他食品中，并且可用作抗炎或降胆固醇剂。任选地，该组合物可以用于药用(人药或兽药)。

定义

在本公开的上下文中使用了大量术语和缩写。给出了如下定义。

“可读框”缩写为ORF。

“聚合酶链反应”缩写为PCR。

“美国典型培养物保藏中心”缩写为ATCC。

“多不饱和脂肪酸”缩写为PUFA。

“三酰基甘油”缩写为TAG。

如本文所用，术语“发明”或“本发明”不旨在局限于本发明的任一具体实施方案，而是在一般情况下适用于如权利要求和说明书中所描述的本发明的任何实施方案和所有实施方案。

本文所用的以及所附权利要求书中所用的单数形式“一个”、“一种”和“所述”包括复数指代，除非上下文中清楚地指明其他涵义。因此，例如，“一株植物”的涵义包括多株此类植物，“一个细胞”的涵义包括一个或多个细胞及其本领域的技术人员已知的等同物，等等。

术语“脂肪酸”指不同链长的长链脂族酸(链烷酸)，链长为约C₁₂至C₂₂(尽管更长和更短链长的酸均是已知的)。主要的链长介于C₁₆和C₂₂之间。另外的关于“饱和脂肪酸”与“不饱和脂肪酸”、“单不饱和脂肪酸”与“多不饱和脂肪酸”(或“PUFA”)以及“ω-6脂肪酸”(ω-6或n-6)与“ω-3脂肪酸”(ω-3或n-3)之间的区别的详细信息在美国专利7,238,482中有提供。

本文通过简单的记号系统“X:Y”来描述脂肪酸，其中X表示特定脂肪酸中碳(c)原子的总数，而Y为双键的数目。脂肪酸名称后面的数字表示从脂肪酸羧基端计数的双键的位置，词缀“c”表示双键的顺式构型(例如，棕榈酸(16:0)、硬脂酸(18:0)、油酸(18:1，9c)、岩芹酸(18:1，6c)、LA(18:2，9c，12c)、GLA(18:3，6c，9c，12c)和ALA(18:3，9c，12c，15c))。除非另外指明，否则18:1、18:2和18:3分别指油酸、LA和ALA脂肪酸。如果没有另外明确地写明，则认为双键为顺式构型。例如，18:2(9，12)中的双键将被认为是顺式构型。

在本公开内容中用于描述PUFA的命名在下面的表2中示出。在标题为“简化符号”一栏中，ω-指代系统用于表明碳数目、双键的数目和最接近ω碳的双键位置，双键位置的计数从ω碳开始(为此ω碳的编号为1)。该表的其余部分汇总了ω-3和ω-6脂肪酸及其前体的俗名、将在整个说明书的其余部分中使用的缩写以及每种化合物的化学名称。

表2

多不饱和脂肪酸和前体的命名

俗名	缩写	化学名称	简化符号
俗名	缩写	化学名称	简化符号	肉豆蔻酸	--	十四酸	14:0
棕榈酸	PA或Palmitate	十六酸	16:0	肉豆蔻酸	--	十四酸	14:0
棕榈酸	PA或Palmitate	十六酸	16:0	棕榈油酸	--	9-十六碳烯酸	16:1
硬脂酸	--	十八酸	18:0	棕榈油酸	--	9-十六碳烯酸	16:1
硬脂酸	--	十八酸	18:0	油酸	--	顺式-9-十八碳烯酸	18:1
亚油酸	LA	顺式-9，12-十八碳二烯酸	18:2 ω-6	油酸	--	顺式-9-十八碳烯酸	18:1
亚油酸	LA	顺式-9，12-十八碳二烯酸	18:2 ω-6	γ-亚麻酸	GLA	顺式-6，9，12-十八碳三烯酸	18:3 ω-6
二十碳二烯酸	EDA	顺式-11，14-二十碳二烯酸	20:2 ω-6	γ-亚麻酸	GLA	顺式-6，9，12-十八碳三烯酸	18:3 ω-6
二十碳二烯酸	EDA	顺式-11，14-二十碳二烯酸	20:2 ω-6	二高-γ-亚麻酸	DGLA	顺式-8，11，14-二十碳三烯酸	20:3 ω-6
Sciadonic	SCI	顺式-5，11，14-二十碳三烯酸	20:3b ω-6	二高-γ-亚麻酸	DGLA	顺式-8，11，14-二十碳三烯酸	20:3 ω-6
Sciadonic	SCI	顺式-5，11，14-二十碳三烯酸	20:3b ω-6	花生四烯酸	ARA	顺式-5，8，11，14-二十碳四烯酸	20:4 ω-6
α-亚麻酸	ALA	顺式-9，12，15-十八碳三烯酸	18:3 ω-3	花生四烯酸	ARA	顺式-5，8，11，14-二十碳四烯酸	20:4 ω-6
α-亚麻酸	ALA	顺式-9，12，15-十八碳三烯酸	18:3 ω-3	十八碳四烯酸	STA	顺式-6，9，12，15-十八碳四烯酸	18:4 ω-3

俗名	缩写	化学名称	简化符号
俗名	缩写	化学名称	简化符号	二十碳三烯酸	ETrA或ERA	顺式-11，14，17-二十碳三烯酸	20:3 ω-3
二十碳四烯酸	ETA	顺式-8，11，14，17-二十碳四烯酸	20:4 ω-3	二十碳三烯酸	ETrA或ERA	顺式-11，14，17-二十碳三烯酸	20:3 ω-3
二十碳四烯酸	ETA	顺式-8，11，14，17-二十碳四烯酸	20:4 ω-3	Juniperonic	JUP	顺式-5，11，14，17-二十碳三烯酸	20:4b ω-3
二十碳五烯酸	EPA	顺式-5，8，11，14，17-二十碳五烯酸	20:5 ω-3	Juniperonic	JUP	顺式-5，11，14，17-二十碳三烯酸	20:4b ω-3
二十碳五烯酸	EPA	顺式-5，8，11，14，17-二十碳五烯酸	20:5 ω-3	二十二碳三烯酸	DRA	顺式-10，13，16-二十二碳三烯酸	22:3 ω-6
二十二碳四烯酸	DTA	顺式-7，10，13，16-二十二碳四烯酸	22:4 ω-6	二十二碳三烯酸	DRA	顺式-10，13，16-二十二碳三烯酸	22:3 ω-6
二十二碳四烯酸	DTA	顺式-7，10，13，16-二十二碳四烯酸	22:4 ω-6	二十二碳五烯酸	DPAn-6	顺式-4，7，10，13，16-二十二碳五烯酸	22:5 ω-6
二十二碳五烯酸	DPA	顺式-7，10，13，16，19-二十二碳五烯酸	22:5 ω-3	二十二碳五烯酸	DPAn-6	顺式-4，7，10，13，16-二十二碳五烯酸	22:5 ω-6
二十二碳五烯酸	DPA	顺式-7，10，13，16，19-二十二碳五烯酸	22:5 ω-3	二十二碳六烯酸	DHA	顺式-4，7，10，13，16，19-二十二碳六烯酸	22:6 ω-3

术语“三酰基甘油”、“油”和“TAG”指由与甘油分子酯化的三个脂肪酰残基组成的中性脂质(并且这些术语在整个本公开内容中将可互换使用)。这些油可含有长链PUFA以及较短的饱和的和不饱和的脂肪酸以及较长链的饱和脂肪酸。因此，“油的生物合成”一般指细胞中TAG的合成。

“总脂质和油级分中的PUFA百分比(％)”指PUFA相对于在那些级分中的总脂肪酸的百分比。术语“总脂质级分”或“脂质级分”两者均指含油生物内所有脂质(即中性和极性脂质)的总和，因此包括位于磷脂酰胆碱(PC)级分、磷脂酰乙醇胺(PE)级分和三酰基甘油(TAG或油)级分中的那些脂质。然而，术语“脂质”和“油”将可在整个说明书中互换使用。

代谢途径或生物合成途径在生物化学意义上可以认为是发生于细胞内由酶催化的一系列化学反应，以实现细胞待使用的或待贮存的代谢产物的形成，或启动另一代谢途径(因而称作流量产生步骤)。很多此类途径均很精细，并涉及对起始物质的逐步修饰以使之形成具有期望的精确化学结构的产物。

术语“PUFA生物合成途径”指将油酸转化成诸如LA、EDA、GLA、DGLA、ARA、DRA、DTA和DPAn-6之类的ω-6脂肪酸和诸如ALA、STA、ETrA、ETA、EPA、DPA和DHA之类的ω-3脂肪酸的代谢过程。该过程在文献中已有详细的描述(如参见PCT公开WO 2006/052870)。简而言之，该过程涉及通过添加碳原子来延长碳链和通过加入双键来使分子去饱和，这通过存在于内质网膜内的一系列特异性去饱和酶和延伸酶(即“PUFA生物合成途径酶”)进行。更具体地讲，“PUFA生物合成途径酶”指如下与PUFA生物合成相关的任何酶(以及编码所述酶的基因)，包括：Δ9延伸酶、C_14/16延伸酶、C_16/18延伸酶、C_18/20延伸酶、C_20/22延伸酶、Δ4去饱和酶、Δ5去饱和酶、Δ6去饱和酶、Δ12去饱和酶、Δ15去饱和酶、Δ17去饱和酶、Δ9去饱和酶和/或Δ8去饱和酶。

术语“ω-3/ω-6脂肪酸生物合成途径”指在合适条件下表达时编码催化产生ω-3和ω-6脂肪酸二者之一或两者的酶的一组基因。通常，参与ω-3/ω-6脂肪酸生物合成途径的基因编码PUFA生物合成途径酶。图1示出了代表性的途径，提供了肉豆蔻酸经过多种中间产物向DHA的转化，这展示了ω-3和ω-6脂肪酸两者是如何可以从共同来源而产生。自然，该途径分成两部分，其中一部分将产生ω-3脂肪酸而另一部分产生ω-6脂肪酸。

如本文关于ω-3/ω-6脂肪酸生物合成途径的上下文中所用，术语“功能性的”指该途径中的一些(或全部)基因表达活性酶，从而导致体内催化或底物转化。应当理解，“ω-3/ω-6脂肪酸生物合成途径”或“功能性ω-3/ω-6脂肪酸生物合成途径”并不意味着所有的PUFA生物合成途径酶基因均是必需的，因为许多脂肪酸产物将仅需要表达该途径中的一亚组基因。

术语“Δ6去饱和酶/Δ6延伸酶途径”将指最低程度包括至少一种Δ6去饱和酶和至少一种C_18/20延伸酶(也称为Δ6延伸酶)的PUFA生物合成途径，从而使得能分别从LA和ALA开始，以GLA和/或ETA作为脂肪酸中间产物生物来合成DGLA和/或ETA。通过其他去饱和酶和延伸酶的表达，还可以合成ARA、EPA、DPA和DHA。

术语“Δ9延伸酶/Δ8去饱和酶途径”将指最低程度包括至少一种Δ9延伸酶和至少一种Δ8去饱和酶的PUFA生物合成途径，从而使得能分别从LA和ALA开始，以ETA和/或DGLA作为脂肪酸中间产物来生物合成DGLA和/或ETA。通过其他去饱和酶和延伸酶的表达，还可以合成ARA、EPA、DPA和DHA。

术语“脂肪酸中间产物”指在脂肪酸代谢途径中产生的任何脂肪酸，其可以通过其他代谢途径酶的作用进一步转化成本途径的目的脂肪酸产物。例如，当利用Δ9延伸酶/Δ8去饱和酶途径产生EPA时，可以产生EDA、ETrA、DGLA、ETA和ARA并被认为是“脂肪酸中间产物”，因为这些脂肪酸可通过其他代谢途径酶的作用进一步转化成EPA。

术语“脂肪酸副产物”指在脂肪酸代谢途径中产生的既非该途径的目的脂肪酸产物又非该途径的“脂肪酸中间产物”的任何脂肪酸。例如，当利用Δ9延伸酶/Δ8去饱和酶途径中产生EPA时，sciadonic酸(SCI)和juniperonic酸(JUP)也可通过Δ5去饱和酶分别作用于EDA或ETrA而产生。它们被认为是“脂肪酸副产物”，因为两者均不能通过其他代谢途径酶的作用进一步转化成EPA。

术语“去饱和酶”指可以在一种或多种脂肪酸中去饱和(即引入双键)而产生所关注的脂肪酸或前体的多肽。尽管在整个说明书中使用ω-指代系统来指代特定的脂肪酸，但使用Δ-系统从底物的羧基端计数来表示去饱和酶的活性更方便。所关注的去饱和酶包括(例如)：(1)使脂肪酸在从该分子的羧基端计数的第8个和第9个碳原子之间去饱和并且可以(例如)催化EDA转化成DGLA和/或催化ETrA转化成ETA的Δ8去饱和酶；(2)Δ5去饱和酶，该去饱和酶催化DGLA转化成ARA和/或催化ETA转化成EPA；(3)Δ6去饱和酶，该去饱和酶催化LA转化成GLA和/或催化ALA转化成STA；(4)Δ4去饱和酶，该去饱和酶催化DPA转化成DHA和/或催化DTA转化成DPAn-6；(5)Δ12去饱和酶，该去饱和酶催化油酸转化成LA；(6)Δ15去饱和酶，该去饱和酶催化LA转化成ALA和/或催化GLA转化成STA；(7)Δ17去饱和酶，该去饱和酶催化ARA转化成EPA和/或催化DGLA转化成ETA；以及(8)Δ9去饱和酶，该去饱和酶催化棕榈酸转化成棕榈油酸(16:1)和/或催化硬脂酸转化成油酸(18:1)。在本领域中，基于Δ15和Δ17去饱和酶将ω-6脂肪酸转化成它们的ω-3对应物的能力(如分别将LA转化成ALA和将ARA转化成EPA)，偶尔也将它们称作“ω-3去饱和酶”、“ω-3去饱和酶”和/或“ω-3去饱和酶”。在一些实施方案中，最理想的是，通过用脂肪酸去饱和酶的基因来转化合适的宿主并测定它对该宿主脂肪酸概况的作用，从而经验性地测定特定脂肪酸去饱和酶的特异性。

为了本文的目的，通常将催化第一缩合反应(即丙二酰辅酶A和长链酰基辅酶A转化成β-酮脂酰辅酶A)的酶称为“延伸酶”。一般来讲，延伸酶的底物选择性有些广泛，但由链长度和不饱和程度两者来区分。因此，延伸酶可具有不同的特异性。例如，C_14/16延伸酶将会利用C₁₄底物(如肉豆蔻酸)，C_16/18延伸酶将会利用C₁₆底物(如棕榈酸)，C_18/20延伸酶(也称为Δ6延伸酶，两个术语可以互换使用)将会利用C₁₈底物(如GLA、STA)，而C_20/22延伸酶将会利用C₂₀底物(如ARA、EPA)。同样，并且本文尤其关注的是，“Δ9延伸酶”催化LA转化成EDA和/或催化ALA转化成ETrA。重要的是，须注意一些延伸酶具有广泛的特异性并因而单个酶可能能够催化几种延伸酶反应。因此，例如，Δ9延伸酶还可以用作C_16/18延伸酶、C_18/20延伸酶和/或C_20/22延伸酶，并且可以分别对诸如EPA和/或GLA之类的Δ5和Δ6脂肪酸具有备选的但非优选的特异性。在优选的实施方案中，理想的是，通过用脂肪酸延伸酶的基因来转化合适的宿主并测定它对该宿主脂肪酸概况的作用，从而经验性地测定该脂肪酸延伸酶的特异性。延伸酶体系通常包括四种酶，这些酶负责脂肪酸碳链延长而产生比该延伸酶体系所作用的脂肪酸底物长两个碳原子的脂肪酸。更具体地讲，延长过程与脂肪酸合酶相关联进行，其中辅酶A是酰基载体(Lassner等人，Plant Cell，8：281-292(1996))。在第一步骤(已发现该步骤既是底物特异性的又是限速的)中，丙二酰辅酶A与长链酰基辅酶A缩合产生二氧化碳(CO₂)和β-酮脂酰辅酶A(其中脂酰基部分已经延长了两个碳原子)。后续的反应包括还原成β-羟酰辅酶A、脱水成烯酰辅酶A以及第二还原反应以产生延长的酰基辅酶A。由延伸酶体系催化的反应的实例是将GLA转化成DGLA、将STA转化成ETA、将LA转化成EDA、将ALA转化成ETrA、将ARA转化成DTA和将EPA转化成DPA。

为了本文目的，术语“EaD9Elo1”指从Euglena anabaena分离的、由SEQ ID NO：11编码的Δ9延伸酶(SEQ ID NO：13)。术语“EaD9Elo2”指从E.anabaena分离的、由SEQ ID NO：12编码的Δ9延伸酶(SEQ IDNO：14)。同样，术语“EaD9eS”指来源于E.anabaena的经密码子最优化以便在解脂耶氏酵母中表达的合成的Δ9延伸酶(即SEQ ID NO：26和27)。

术语“转化效率”和“底物转化百分比”指特定酶(如延伸酶)能够将底物转化成产物的效率。转化效率根据下面的公式测量：([产物]/[底物+产物])*100，其中‘产物’包括中间产物和该途径中来源于它的所有产物。

术语“含油的”指那些往往以脂质形式贮存它们的能源的生物(Weete，Fungal Lipid Biochemistry，第二版，Plenum，1980)。在含油微生物内，细胞油或TAG含量通常符合S形曲线，其中脂质浓度增加直至晚对数生长晚期或稳定生长早期时它达到最高浓度，随后在稳定生长晚期和死亡期期间逐渐下降(Yongrmanitchai和Ward，Appl.Environ.Microbiol.，57：419-25(1991))。含油微生物积累油超过它们的干细胞重量的约25％的情形并不鲜见。

术语“含油酵母”指那些能够产油并被归类为酵母的微生物。含油酵母的实例包括但不限于如下属：耶氏酵母属、假丝酵母属、红酵母属、红冬孢酵母属、隐球酵母属、丝孢酵母属和油脂酵母属。

术语“裸藻纲(Euglenophyceae)”指发现生活在淡水环境、海洋环境、土壤环境和寄生环境中的一群单细胞的无色或光合鞭毛虫(“类眼虫”)。该纲的特征为孤立的单细胞，其中大多数是自由游动的并且具有从称为储存器的前内陷长出的两条鞭毛(其中一条可能不露出)。光合类眼虫含有一个至多个叶绿体，叶绿体从微小的盘状至延伸的板状或带状而不同。无色类眼虫依赖于渗透营养或吞噬营养来进行营养同化作用。已经描述了约1000种物种并将它们分为约40个属和6个目。裸藻纲的实例包括但不限于如下属：裸藻属(Euglena)、Eutreptiella和Tetruetreptia。

如本文所用，“核酸”意指多核苷酸，并包括单链或双链的脱氧核糖核苷酸或核糖核苷酸碱基聚合物。核酸也可以包括片段和经修饰的核苷酸。因此，术语“多核苷酸”、“核酸序列”、“核苷酸序列”或“核酸片段”可互换使用，并且指作为单链或双链的RNA或DNA聚合物，任选含有合成的、非天然的或改变的核苷酸碱基。DNA聚合物形式的多核苷酸可由cDNA、基因组DNA、合成DNA或它们的混合物的一个或多个片段构成。核苷酸(通常以它们的5′-单磷酸形式存在)可以用如下它们的单字母名称指代：“A”表示腺苷酸或脱氧腺苷酸(分别针对RNA或DNA)，“C”表示胞苷酸或脱氧胞苷酸，“G”表示鸟苷酸或脱氧鸟苷酸，“U”表示尿苷酸，“T”表示脱氧胸苷酸，“R”表示嘌呤(A或G)，“Y”表示嘧啶(C或T)，“K”表示G或T，“H”表示A或C或T，“I”表示肌苷，“N”表示任何核苷酸。

术语“保守结构域”或“基序”指进化上相关的蛋白质的比对序列中在特定位置处保守的一组氨基酸。虽然同源蛋白质之间在其他位置的氨基酸可以发生变化，但在特定位置高度保守的氨基酸表明对蛋白质的结构、稳定性或活性来说是必需的氨基酸。因为它们可通过它们在蛋白质同系物家族的比对序列中的高度保守来鉴定，所以它们可用作识别标签或“签名”来确定具有新的测定序列的蛋白质是否属于以前鉴定的蛋白质家族。PCT公开WO 2007/061845和WO 2007/061742描述了七种不同的与Δ9延伸酶相关的基序。

术语“同源性”、“同源的”、“基本上类似的”和“基本上对应的”在本文中可互换使用。它们指这样的核酸片段，即其中一个或多个核苷酸碱基改变并不会影响该核酸片段介导基因表达或产生某种表型的能力。这些术语也指本发明的核酸片段的修饰(例如缺失或插入一个或多个核苷酸)，相对于初始的未经修饰的核酸片段，该修饰基本上不会改变所得核酸片段的功能特性。因此，正如本领域技术人员应当理解的，本发明涵盖的不仅仅是具体的示例性序列。

此外，技术人员认识到，本发明所涵盖的基本上类似的核苷酸序列也通过它们(在中等严格条件如0.5X SSC，0.1％SDS，60℃下)与本文所示例的序列杂交的能力，或杂交至本文所公开的核苷酸序列的任何部分以及杂交至与本文所公开的任何核苷酸序列功能相当的序列的能力所限定。可以调节严格性条件以筛选中度相似的片段(例如来自远缘生物的同源序列)，到筛选高度相似的片段(例如从近缘生物复制功能性酶的基因)。杂交后的洗涤可确定严格性条件。

术语“选择性杂交”包括指在严格杂交条件下，核酸序列与特定核酸靶序列以比其与非靶核酸序列的杂交更高的可检测程度(例如至少两倍于背景)杂交，并指基本排除了非靶核酸。选择性杂交的序列通常彼此具有约至少80％的序列同一性，或90％的序列同一性，最多并包括100％的序列同一性(即完全互补)。

术语“严格条件”或“严格杂交条件”包括指探针将会选择性杂交至其靶序列的条件。严格条件是序列依赖性的，并将因不同的环境而异。通过控制杂交和/或洗涤条件的严格性，可鉴定与探针100％互补的靶序列(同源探测)。或者，可调节严格条件以允许序列中的一些错配，以便检测到更低程度的相似性(异源探测)。通常，探针的长度少于约1000个核苷酸，任选长度少于500个核苷酸。

通常，严格条件将是如下那些条件：在pH7.0至8.3下盐浓度低于约1.5M钠离子，通常约0.01至1.0M钠离子浓度(或其他盐)，并且对于短探针(例如10至50个核苷酸)温度为至少约30℃，而对于长的探针(例如多于50个核苷酸)温度为至少约60℃。严格条件也可以通过加入诸如甲酰胺之类的去稳定剂来实现。示例性的低严格条件包括在37℃下于含30至35％甲酰胺、1M NaCl、1％SDS(十二烷基硫酸钠)的缓冲液中杂交，以及在50至55℃下用1X至2X SSC(20X SSC＝3.0MNaCl/0.3M柠檬酸三钠)洗涤。示例性的中等严格条件包括在37℃下于40至45％甲酰胺、1M NaCl、1％SDS中杂交，以及在55至60℃下用0.5X至1X SSC洗涤。示例性的高严格条件包括在37℃下于50％甲酰胺、1M NaCl、1％SDS中杂交，以及在60至65℃下用0.1X SSC洗涤。

特异性通常取决于杂交后洗涤，最终洗涤溶液的离子强度和温度是关键因素。对于DNA-DNA杂交体，T_m可以用Meinkoth等人，Anal.Biochem.，138：267-284(1984)中的等式估算：T_m＝81.5℃+16.6(log M)+0.41(％GC)-0.61(％form)-500/L；其中M是单价阳离子的体积摩尔浓度，％GC是DNA中鸟苷和胞嘧啶核苷酸的百分比，％form是杂交溶液中甲酰胺的百分比，而L是以碱基对表示的杂交体的长度。T_m是(在确定的离子强度和pH下)50％的互补靶序列与完全匹配的探针杂交时的温度。每出现1％的错配，T_m降低约1℃；因此，可调节T_m、杂交和/或洗涤条件以与具有期望同一性的序列杂交。例如，如果要寻求具有≥90同一性百分比(％)的序列，则可将T_m降低10℃。通常，在确定的离子强度和pH下，严格条件选择为比特定序列及其互补序列的热解链温度(T_m)低约5℃。然而，极严格条件可采用在比热解链温度(T_m)低1、2、3或4℃的温度下杂交和/或洗涤；中等严格条件可采用在比热解链温度(T_m)低6、7、8、9或10℃的温度下杂交和/或洗涤；而低严格条件可采用在比热解链温度(T_m)低11、12、13、14、15或20℃的温度下杂交和/或洗涤。利用上述等式、杂交和洗涤组合物以及所需的T_m，一般技术人员将会理解，杂交和/或洗涤溶液的严格性的变化已经在本质上得以描述。如果所需的错配程度导致T_m低于45℃(水溶液)或32℃(甲酰胺溶液)，则优选增加SSC的浓度以便能使用更高的温度。对核酸杂交的详尽指导可在以下文献中找到：Tijssen，LaboratoryTechniques in Biochemistry and Molecular Biology--Hybridization withNucleic Acid Probes，第I部分，第2章“Overview of principles ofhybridization and the strategy of nucleic acid probe assays”，Elsevier，NewYork(1993)；以及Current Protocols in Molecular Biology，第2章，Ausubel等人编辑，Greene Publishing and Wiley-Interscience，New York(1995)。杂交和/或洗涤条件可进行至少10、30、60、90、120或240分钟。

上下文中核酸序列或多肽序列的“序列同一性”或“同一性”指在特定比较窗口上进行比对以寻求最大对应时，两个序列中相同的核酸碱基或氨基酸残基。

因此，“序列同一性百分比”指通过在比较窗口上比较两个最佳对齐的序列而测得的值，其中与参考序列(其不包括添加或缺失)相比较，比较窗口中的多核苷酸或多肽序列部分可包括添加或缺失(即缺口)以实现两个序列的最佳比对。该百分比通过如下计算：测定相同核酸碱基或氨基酸残基在两个序列中出现的位置的数目，以获得匹配位置的数目，将匹配位置的数目除以比较窗口中的总位置数目并将所得结果乘以100而获得序列同一性百分比。序列同一性百分比的可用的实例包括但不限于50％、55％、60％、65％、70％、75％、80％、85％、90％或95％，或50％至100％的任何整数百分比。这些同一性可以用本文描述的任何程序测定。

序列比对和百分比同一性或相似性的计算可以用设计用于检测同源序列的多种比较方法来确定，这些方法包括但不限于LASERGENE生物信息学计算软件包(DNASTAR Inc.，Madison，WI)的MegAlign^TM程序。在本专利申请的上下文中应当理解，使用序列分析软件进行分析时，除非另外指明，否则分析结果将基于所参考程序的“默认值”。在此所用的“默认值”将指在首次初始化软件时软件最初加载的任何值或参数集。

“Clustal V比对方法”对应于称为Clustal V(在Higgins和Sharp，CABIOS，5：151-153(1989)；Higgins，D.G.等人，Comput.Appl.Biosci.，8：189-191(1992)中有所描述)并且可以在LASERGENE生物信息学计算软件包(同上)的MegAlign^TM程序中找到的比对方法。对于多重比对，默认值对应于缺口罚分(GAP PENALTY)＝10和缺口长度罚分(GAPLENGTH PENALTY)＝10。用Clustal V方法进行成对比对和蛋白质序列的百分比同一性计算的默认参数为KTUPLE＝1、缺口罚分＝3、窗口(WINDOW)＝5和DIAGONALS SAVED＝5。对于核酸，这些参数为KTUPLE＝2，缺口罚分＝5，窗口＝4和DIAGONALS SAVED＝4。在用Clustal V程序进行序列比对后，有可能通过观察相同程序中的“序列距离”表来获得“百分比同一性”。

“BLASTN比对方法”是由国家生物技术信息中心(National Centerfor Biotechnology Information，NCBI)提供的用以采用默认参数比较核苷酸序列的算法。

本领域的技术人员非常清楚，多种程度的序列同一性可用于从其他物种中鉴定多肽，其中这类多肽具有相同或相似的功能或活性。同一性百分比的可用的实例包括但不限于50％、55％、60％、65％、70％、75％、80％、85％、90％或95％，或50％至100％的任何整数百分比。实际上，50％至100％的任何整数氨基酸同一性可用于描述本发明，例如51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％。而且，所关注的是这种分离的核苷酸片段的任何全长或部分互补的序列。

“密码子简并性”指允许核苷酸序列在不影响所编码的多肽的氨基酸序列的情况下发生变化的遗传密码的性质。因此，本发明涉及编码氨基酸序列的全部或基本部分的任何核酸片段，该氨基酸序列编码在SEQID NO：13和SEQ ID NO：14中示出的本发明的类眼虫多肽。技术人员非常了解具体宿主细胞在使用核苷酸密码子以确定给定氨基酸时所表现出的“密码子偏倚性”。因此，当合成基因用以改善在宿主细胞中的表达时，希望对基因进行设计，使得其密码子使用频率接近该宿主细胞优选的密码子使用频率。

“合成的基因”可由使用本领域技术人员已知的方法化学合成的寡核苷酸构件装配而成。将这些构件进行连接并退火以形成基因节段，该基因节段随后在酶促作用下装配而构建成完整的基因。因此，基于最优化核苷酸序列以反映宿主细胞的密码子偏倚性，可以定制基因用以最优化基因表达。如果密码子使用偏向于宿主偏好的那些密码子，则技术人员会理解成功的基因表达的可能性。优选的密码子的确定可基于对来源于宿主细胞的基因(其中序列信息可获得)的检测。

“基因”指表达特定蛋白质的核酸片段，并且该核酸片段可以指单独的编码区或可以包括位于编码序列之前的调控序列(5′非编码区)和之后的调控序列(3′非编码区)。“天然基因”是指天然存在的具有其自己的调控序列的基因。“嵌合基因”是指不是天然基因的任何基因，包含在天然情况下不是一起存在的调控序列和编码序列。因此，嵌合基因可包括源于不同来源的调控序列和编码序列，或者包括源于同一来源但以不同于天然存在的方式排列的调控序列和编码序列。“内源性基因”指位于生物的基因组内它的天然位置的天然基因。“外来基因”指正常情况下不存在于宿主生物中的基因，它通过基因转移导入宿主生物内。外来基因可以包含插入到非天然生物内的天然基因，或嵌合基因。“转基因”是已通过转化方法导入基因组内的基因。“经密码子最优化的基因”是其密码子使用频率经设计用以模仿宿主细胞优选的密码子使用频率的基因。

“编码序列”指编码特定氨基酸序列的DNA序列。“调控序列”指位于编码序列上游(5′非编码序列)、中间或下游(3′非编码序列)的核苷酸序列，并且该核苷酸序列影响相关编码序列的转录、RNA加工或稳定性或翻译。调控序列可包括但不限于：启动子、翻译前导序列、内含子、多腺苷酸化识别序列、RNA加工位点、效应子结合位点和茎环结构。

“启动子”指能够控制编码序列或功能性RNA表达的DNA序列。一般来讲，编码序列位于启动子序列的3′端。启动子可整个源于天然基因，或者由源于不同的天然存在的启动子的不同元件组成，或者甚至包含合成的DNA片段。本领域内的技术人员应当理解，不同的启动子可以在不同的组织或细胞类型中，或者在不同的发育阶段，或者响应不同的环境条件而引导基因的表达。导致基因在几乎所有发展阶段中表达的启动子通常称为“组成型启动子”。还应当认识到，由于在大多数情况下调控序列的确切边界(特别是它的5’端)尚未完全确定，因此一些改变形式的DNA片段可能具有相同的启动子活性。

启动子序列可以由邻近的和更远处的上游元件组成，后一类元件常称为增强子和/或沉默子。因此，“增强子”是能刺激启动子活性的DNA序列，并且可以是启动子的固有的元件或插入的异源元件，用以增强启动子的水平或阶段特异性。“沉默子”是能抑制启动子活性的DNA序列，并且可以是启动子的固有的元件或插入的异源元件，用以抑制启动子的水平或阶段特异性。

“翻译前导序列”指位于基因的转录起始位点和编码序列之间的多核苷酸序列。翻译前导序列存在于翻译起始序列的经完全加工后的mRNA上游。翻译前导序列可影响mRNA的初级转录过程、mRNA稳定性或翻译效率。已经描述了翻译前导序列的实例(Turner，R.和Foster，G.D.，Mol.Biotechnol.，3：225-236(1995))。

术语“3′非编码序列”、“转录终止子”和“终止序列”指位于编码序列下游的DNA序列。这包括多腺苷酸化识别序列和编码能影响mRNA加工或基因表达的调节信号的其他序列。多腺苷酸化信号通常表征为影响多腺苷酸片添加到mRNA前体的3′末端。3′区可影响相关编码序列的转录、RNA加工或稳定性或翻译。

“RNA转录物”指由RNA聚合酶催化的DNA序列转录所产生的产物。当RNA转录物与DNA序列拷贝完全互补时，它指初级转录物。当RNA转录物是来源于初级转录物的转录后加工的RNA序列时，它指成熟的RNA。“信使RNA”或“mRNA”指无内含子并且可以由细胞翻译成蛋白质的RNA。“cDNA”指与mRNA模板互补并用反转录酶从mRNA模板合成的DNA。cDNA可以是单链，或使用DNA聚合酶I的Klenow片段转化成双链。“有义”RNA指包含mRNA并且能在细胞内或体外翻译成蛋白质的RNA转录物。“反义RNA”指与靶初级转录物或mRNA的全部或部分互补并且可阻断靶基因的表达的RNA转录物(美国专利5,107,065)。反义RNA可以与特定基因转录物的任何部分，即5′非编码序列、3′非编码序列、内含子或编码序列互补。“功能性RNA”指反义RNA、核酶RNA或其他不能翻译但是对细胞过程有影响作用的RNA。术语“互补的”和“反向互补的”对mRNA转录来说可互换使用，并且用以定义信使反义RNA。

术语“可操作地连接”指单个核酸片段上的核酸序列的关联，使得其中一个核酸序列的功能受到另一个核酸序列的影响。例如，当启动子能够影响编码序列的表达(即，该编码序列受到该启动子的转录控制)时，则该启动子与该编码序列可操作地连接。编码序列可能以有义或反义的取向可操作地连接至调控序列。

术语“重组体”指(例如)通过化学合成或通过用基因工程技术操纵分离的核酸片段而实现的两个原本分离的序列片段的人工组合。

如本文所用，术语“表达”指源于本发明的核酸片段的有义RNA(mRNA)或反义RNA的转录和稳定积聚。表达也可指mRNA翻译成蛋白质(其为前体蛋白或成熟蛋白)。

“成熟”蛋白指经翻译后加工的多肽(即已经去除了存在于初始翻译产物中的任何前肽或肽原的多肽)。“前体”蛋白质指mRNA的初级翻译产物(即前肽和肽原仍然存在)。前肽和肽原可以是(但不限于)细胞内定位信号。

术语“质粒”和“载体”指通常携带有不属于细胞中心代谢的部分的基因的染色体外元件，并且常常是环状双链DNA片段的形式。这类元件可以是源自任何来源的自主复制序列、基因组整合序列、噬菌体或单链或双链DNA或RNA的核苷酸序列(线性或环状)，其中多个核苷酸序列已连接或重组为一种独特构建体，该独特构建体能够将表达盒引入细胞中。

术语“表达盒”指包含如下序列的DNA片段：所选基因的编码序列和所选基因产物表达所需的位于编码序列之前(5′非编码序列)和之后(3′非编码序列)的调控序列。因此，表达盒通常由如下序列构成：(1)启动子序列；(2)编码序列(即ORF)；和(3)3′非翻译区(即终止子)，在真核生物中其通常含有多腺苷酸化位点。表达盒通常包含于载体中以有利于克隆和转化。可以将不同表达盒转化进包括细菌、酵母、植物和哺乳动物细胞在内的不同生物体中，只要能针对每种宿主使用正确的调控序列。

“重组DNA构建体”(在本文中也可互换地称为“表达构建体”和“构建体”)包含核酸片段(如在天然条件下不会一起存在的调控序列和编码序列)的人工组合。因此，重组DNA构建体可以包含源于不同来源的调控序列和编码序列，或源于相同来源但以不同于天然存在的方式排列的调控序列和编码序列。此类构建体可独自使用或与载体组合使用。如果使用载体，则载体的选择取决于本领域技术人员熟知的将要用于转化宿主细胞的方法。例如可以使用质粒载体。技术人员十分了解必须存在于载体上以成功地转化、选择和繁殖含本发明任何分离的核酸片段的宿主细胞的遗传元件。技术人员还将认识到，不同的独立转化事件将导致不同水平和模式的表达(Jones等人，EMBO J.，4：2411-2418(1985)；DeAlmeida等人，Mol.Gen.Genetics 218：78-86(1989))，因此，必须筛选多次事件以获得显示期望表达水平和模式的品系。这样的筛选可以通过DNA的Southern印迹分析、mRNA表达的Northern印迹分析、蛋白表达的免疫印迹分析或表型分析等完成。

术语“导入”指将核酸(例如表达盒)或蛋白质提供至细胞中。导入包括指将核酸整合进真核或原核细胞中，在该细胞中核酸可以整合进细胞的基因组内，并且包括指将核酸或蛋白暂时提供给细胞。导入包括指稳定的或瞬时的转化方法以及有性杂交。因此，将核酸片段(如重组DNA构建体或表达盒)插入细胞内的情况下的“导入”意指“转染”或“转化”或“转导”，并且包括指将核酸片段整合进真核或原核细胞中，在该细胞中核酸片段可以整合进细胞的基因组(如染色体、质粒、质体或线粒体DNA)内、转变成自主的复制子或瞬时表达(例如转染的mRNA)。

如本文所用，“转基因”指其基因组内含有异源多核苷酸的细胞。优选的是，异源多核苷酸被稳定地整合进基因组中，使得该多核苷酸能传递至连续的世代。异源多核苷酸可以单独地或作为表达盒的部分整合进基因组中。本文所用的转基因包括因异源核酸存在而已经改变了基因型的任何细胞或细胞系，包括初始进行此类改变的那些转基因以及通过初始的转基因与不同配型交配而产生的那些。在此使用的术语“转基因”不涵盖通过诸如随机异花受精、非重组病毒感染、非重组细菌转化、非重组转座或自发突变之类的自然发生事件导致的基因组(染色体基因组或染色体外基因组)改变。

本文使用的标准重组DNA和分子克隆技术是本领域所熟知的并且在如下文献中有更全面的描述：Sambrook，J.，Fritsch，E.F.和Maniatis，T.，Molecular Cloning：A Laboratory Manual；Cold Spring Harbor Laboratory：Cold Spring Harbor，NY(1989)；Silhavy，T.J.、Bennan，M.L.和Enquist，L.W.，Experiments with Gene Fusions，Cold Spring Harbor Laboratory：Cold Spring Harbor，NY(1984)；以及Ausubel，F.M.等人，CurrentProtocols in Molecular Biology，Greene Publishing Assoc.andWiley-Interscience出版，Hoboken，NJ(1987)。转化方法是本领域技术人员熟知的并且在下文中有所描述：“综述：脂肪酸和三酰基甘油的微生物生物合成”

通常，含油微生物的脂质蓄积是响应存在于生长培养基中的总的碳氮比而触发。该过程(导致含油微生物中游离棕榈酸(16:0)的从头合成)在美国专利7,238,482中有详细描述。棕榈酸是长链饱和和不饱和脂肪酸衍生物的前体，这些脂肪酸衍生物通过延伸酶和去饱和酶的作用形成(图1)。

TAG(脂肪酸的主要贮存单位)通过涉及如下反应的一系列反应形成：(1)一分子的酰基辅酶A和甘油-3-磷酸通过酰基转移酶酯化而生成溶血磷脂酸；(2)第二分子的酰基辅酶A通过酰基转移酶酯化而生成1，2-二酰基甘油磷酸(通常称为磷脂酸)；(3)通过磷脂酸磷酸酶除去磷酸而生成1，2-二酰基甘油(DAG)；以及(4)在酰基转移酶的作用下加入第三个脂肪酸以形成TAG。广谱的脂肪酸可被整合进TAG中，包括饱和和不饱和脂肪酸以及短链和长链脂肪酸。

ω脂肪酸的生物合成

其中油酸转化成ω-3/ω-6脂肪酸的代谢过程涉及通过添加碳原子使碳链延长和通过加入双键使分子去饱和。这需要存在于内质网膜内的一系列特殊去饱和酶和延伸酶。然而，如图1中看到的和如下所述的，通常存在多个用于产生特定ω-3/ω-6脂肪酸的替代途径。

具体地讲，所有途径均需要最初通过Δ12去饱和酶将油酸转化成LA(第一种ω-6脂肪酸)。然后，利用“Δ9延伸酶/Δ8去饱和酶途径”并将LA用作底物来如下形成长链ω-6脂肪酸：(1)通过Δ9延伸酶将LA转化成ETA；(2)通过Δ8去饱和酶将ETA转化成DGLA；和(3)通过Δ5去饱和酶将DGLA转化成ARA；(4)通过C_20/22延伸酶将ARA转化成DTA；以及(5)通过Δ4去饱和酶将DTA转化成DPAn-6。作为另外一种选择，“Δ9延伸酶/Δ8去饱和酶途径”可以将ALA用作底物来如下产生长链ω-3脂肪酸：(1)通过Δ15去饱和酶将LA转化成ALA(第一种ω-3脂肪酸)；(2)通过Δ9延伸酶将ALA转化成DGLA；(3)通过Δ8去饱和酶将DGLA转化成ETA；(4)通过Δ5去饱和酶将ETA转化成EPA；(5)通过C_20/22延伸酶将EPA转化成DPA；和(6)通过Δ4去饱和酶将DPA转化成DHA。任选地，ω-6脂肪酸可转化成ω-3脂肪酸；例如，ALA可通过Δ15去饱和酶活性由LA生成；ETA和EPA可通过Δ17去饱和酶活性分别由DGLA和ARA生成。

用于ω-3/ω-6脂肪酸生物合成的替代途径利用Δ6去饱和酶和C_18/20延伸酶(即“Δ6去饱和酶/Δ6延伸酶途径”)。更具体地讲，LA和ALA可通过Δ6去饱和酶分别转化成GLA和ETA；然后，C_18/20延伸酶将GLA转化成DGLA和/或将STA转化成ETA。随后如上所述形成下游PUFA。

预期需要导入特定宿主生物中用以产生ω-3/ω-6脂肪酸的特定功能将取决于宿主细胞(及其天然的PFUA概况和/或去饱和酶/延伸酶概况)、底物的可利用性和所需终产物。例如，在一些实施方案中优选的是Δ9延伸酶/Δ8去饱和酶途径的表达，而不是Δ6去饱和酶/Δ6延伸酶途径的表达，因为通过前面的途径产生的PUFA无GLA和/或ETA。

本领域技术人员将能够鉴定多种编码ω-3/ω-6脂肪酸生物合成所需的每种酶的候选基因。可用的去饱和酶和延伸酶序列可源自任何来源，例如，分离自天然来源(来自细菌、藻类、真菌、植物、动物等)、经由半合成途径产生或从头合成。尽管导入宿主的去饱和酶和延伸酶基因的具体来源不是关键的，但选择具有去饱和酶或延伸酶活性的特定多肽的考虑事项包括：(1)多肽的底物特异性；(2)多肽或其组分是否为限速酶；(3)去饱和酶或延伸酶是否是合成所需PUFA所必需的；(4)多肽所需的辅因子；和/或(5)多肽在其产生后是否被修饰(例如，通过激酶或异戊烯转移酶修饰)。表达的多肽优选具有与它在宿主细胞中的位置的生化环境相容的参数(对于另外的详细内容，参见美国专利7,238,482)。

在另外的实施方案中，考虑每种特定的去饱和酶和/或延伸酶的转化效率也将是有用的。更具体地讲，由于每种酶极少能以100％的效率将底物转化成产物，宿主细胞所产生的未纯化的油的最终脂质概况通常将是由期望的ω-3/ω-6脂肪酸及多种上游PUFA中间产物组成的多种PUFA的混合物。因此，当使所需脂肪酸的生物合成最优化时，每种酶的转换效率也是要考虑的变量。

考虑到上述各个考虑事项，具有合适去饱和酶和延伸酶活性(如Δ6去饱和酶、C_18/20延伸酶、Δ5去饱和酶、Δ17去饱和酶、Δ15去饱和酶、Δ9去饱和酶、Δ12去饱和酶、C_14/16延伸酶、C_16/18延伸酶、Δ9延伸酶、Δ8去饱和酶、Δ4去饱和酶和C_20/22延伸酶)的候选基因可根据可公开获得的文献(如GenBank)、专利文献和对具有产生PUFA的能力的生物的实验分析来鉴定。这些基因将适用于导入到特定的宿主生物中，以使该生物能合成PUFA或增强生物的PUFA合成。

新的Δ9延伸酶的序列鉴定

在本发明中，已经从Euglena anabaena中分离出编码Δ9延伸酶的核苷酸序列，汇总于下面的表3中。

表3

Euglena anabaenaΔ9延伸酶的汇总

缩写	核苷酸SEQ ID NO	氨基酸SEQ ID NO
缩写	核苷酸SEQ ID NO	氨基酸SEQ ID NO	EaD9Elo1	11	13
EaD9Elo2	12	14	EaD9Elo1	11	13
EaD9Elo2	12	14	EaD9eS	26	27

*注意：SEQ ID NO：27与SEQ ID NO：13的序列相同。

因此，本发明涉及分离的多核苷酸，该多核苷酸包含：

(b)编码具有Δ9延伸酶活性的多肽的核苷酸序列，其中基于BLASTN比对方法在与SEQ ID NO：11、SEQ ID NO：12或SEQ ID NO：26中示出的核苷酸序列进行比较时，该核苷酸序列具有至少80％的序列同一性；或

(c)(a)、(b)或的核苷酸序列的互补序列，其中该互补序列与该核苷酸序列由相同数目的核苷酸组成并且100％互补。

在另一个方面，本发明涉及分离的多核苷酸，该多核苷酸包含编码具有Δ9延伸酶活性的多肽的核苷酸序列，其中基于BLASTN比对方法在与SEQ ID NO：11、SEQ ID NO：12或SEQ ID NO：26中示出的核苷酸序列进行比较时，该核苷酸序列具有至少90％的序列同一性。

具有至少约80％-90同一性百分比(％)的更优选的氨基酸片段是特别合适的，并且具有至少约90％-95同一性百分比(％)的那些序列是最优选的。类似地，对应本发明ORF的编码Δ9延伸酶的优选核酸序列是编码活性蛋白的那些序列并且其具有至少约80％-90％的同一性；具有至少约90％-95同一性百分比(％)的那些序列是最优选的。

在备选的实施方案中，本发明的EaD9Elo1和/或EaD9Elo2序列可以经密码子最优化以便在特定的宿主生物中表达。如本领域所熟知的，这可以成为进一步优化酶在候选宿主中的表达的有用手段，因为使用宿主优选的密码子可以显著提高编码该多肽的外源基因的表达。通常，宿主优选的密码子可在所关注的具体宿主物种中通过检查蛋白质(优选那些最大量表达的蛋白质)中的密码子使用以及确定哪些密码子的使用频率最高来测定。然后，可利用宿主物种中优选的密码子整个或部分地合成具有(例如)延伸酶活性的所关注的多肽的编码序列。也可以合成DNA的全部(或部分)以去除将存在于转录的mRNA中的二级结构的任何去稳定序列或区域。也可以合成DNA的全部(或部分)以将碱基组成改变成期望宿主细胞中更优选的碱基组成。

在本文中的本发明的一个实施方案中，EaD9Elo1(SEQ ID NO：11)经密码子最优化以便在解脂耶氏酵母中表达。基于先前对解脂耶氏酵母密码子使用概况的确定、对那些优选的密码子的鉴定以及对‘ATG’起始密码子周围的共有序列的确定(参见美国专利7,238,482和美国专利7,125,672)，这是可能的。所得的合成基因称为EaD9ES(SEQ ID NO：26)。由经密码子最优化的Δ9延伸酶基因编码的蛋白质序列(即SEQ IDNO：27)与野生型蛋白质序列(即SEQ ID NO：13)相同。可以利用类似的技术来产生源自EaD9Elo2(SEQ ID NO：12)的合成的Δ9延伸酶，以用于在解脂耶氏酵母中表达。

基于野生型EaD9Elo1和/或EaD9Elo2序列，本领域的技术人员应当能够利用本文中的教导内容来产生多种适用于在候选宿主中最佳表达的其他经密码子最优化的Δ9延伸酶蛋白。因此，本发明涉及任何经密码子最优化的Δ9延伸酶蛋白，该延伸酶蛋白来源于野生型核苷酸序列EaD9Elo1(SEQ ID NO：11)或EaD9Elo2(SEQ ID NO：12)。这包括但不限于SEQ ID NO：26中示出的核苷酸序列，该核苷酸序列编码经密码子最优化以便在解脂耶氏酵母中表达的合成的Δ9延伸酶蛋白(即EaD9eS)。在备选的实施方案中，期望修饰编码EaD9Elo1和/或EaD9Elo2的密码子的部分，以增强基因在宿主生物(包括但不限于植物或植物部分、藻类、细菌、侯选的酵母、类眼虫、原生藻菌或真菌)中的表达。

同源物的鉴定和分离

任何本发明的延伸酶序列(即EaD9Elo1、EaD9Elo2或EaD9eS)或其部分均可用于利用序列分析软件来搜索相同或其他细菌、藻类、真菌、类眼虫或植物物种中的Δ9延伸酶同源物。通常，这种计算机软件通过将同源程度赋予多种置换、缺失和其他修饰来匹配相似的序列。

作为另外一种选择，也可将任何本发明的延伸酶序列或其部分用作杂交试剂用以鉴定Δ9延伸酶同源物。核酸杂交试验的基本组成包括探针、怀疑含有所关注的基因或基因片段的样品及特定的杂交方法。本发明的探针通常是与待检测核酸序列互补的单链核酸序列。探针与待检测的核酸序列是“可杂交的”。尽管探针的长度可在5个碱基到数万个碱基之间变化，但通常约15个碱基到约30个碱基的探针长度是合适的。只需要探针分子的部分与待检测的核酸序列互补。另外，探针和靶序列之间不需要完全互补。杂交确实可以在并不完全互补的分子之间发生，结果是杂交区内的一定比率的碱基未与正确的互补碱基配对。

杂交方法是非常确实的。通常探针和样品必须在允许核酸杂交的条件下混合。这涉及在正确浓度和温度条件下在存在无机或有机盐时使探针和样品接触。探针和样品核酸必须接触足够长的时间，使探针和样品核酸之间的任何可能的杂交均可发生。混合物中的探针或标记的浓度将决定杂交发生所需的时间。探针或靶标的浓度越高，所需的杂交孵育时间就越短。任选地，可以加入离液剂(如氯化胍、硫氰酸胍、硫氰酸钠、四氯乙酸锂、高氯酸钠、四氯乙酸铷、碘化钾和三氟乙酸铯)。如果需要，可以将甲酰胺加入到杂交混合物中，通常为30-50％(v/v)。

可以采用多种杂交溶液。通常，这些杂交溶液包含约20％至60％体积，优选30％体积的极性有机溶剂。普通的杂交溶液采用约30-50％v/v甲酰胺、约0.15至1M氯化钠、约0.05至0.1M缓冲液(如柠檬酸钠、Tris-HCl、PIPES或HEPES(pH范围约6-9))、约0.05至0.2％去污剂(如十二烷基硫酸钠)或0.5-20mM的EDTA、FICOLL(Pharmacia Inc.)(约300-500千道尔顿)、聚乙烯吡咯烷酮(约250-500千道尔顿)和血清白蛋白。一般的杂交溶液还将包含约0.1至5mg/mL未经标记的载体核酸、片段化的核酸DNA(如小牛胸腺或鲑精DNA或酵母RNA)，以及任选约0.5％至2％重量/体积的甘氨酸。还可以包含其他添加剂，例如包括多种极性水溶性或可膨胀试剂(如聚乙二醇)、阴离子聚合物(如聚丙烯酸酯或聚甲基丙烯酸酯)和阴离子糖类聚合物(如硫酸葡聚糖)在内的体积排阻剂。

核酸杂交可适用于多种测定形式。最合适的形式之一是夹心测定形式。夹心测定尤其适用于在非变性条件下杂交。夹心型测定的主要成分是固体支持体。固体支持体具有吸附或共价连接至其上的固定核酸探针，该探针未经标记并且与序列的一部分互补。

在另外的实施方案中，本文描述的任何Δ9延伸酶核酸片段(或其经鉴定的任何同源物)均可用于从相同的或其他细菌、藻类、真菌、类眼虫或植物物种中分离编码同源蛋白质的基因。使用序列依赖性规程分离同源基因是本领域熟知的。序列依赖性规程的实例包括但不限于：(1)核酸杂交方法；(2)DNA和RNA扩增方法，这可通过核酸扩增技术的多种用法来举例说明[如聚合酶链反应(PCR)，Mullis等人，美国专利4,683,202；连接酶链反应(LCR)，Tabor，S.等人，Proc.Acad.Sci.U.S.A.，82：1074(1985)；或链置换扩增(SDA)，Walker等人，Proc.Natl.Acad.Sci.U.S.A.，89：392(1992)]；以及(3)文库构建和互补筛选方法。

例如，编码与本文描述的Δ9延伸酶相似的蛋白质或多肽的基因可以用本领域技术人员熟知的方法，通过将本发明的核酸片段的全部或部分用作DNA杂交探针来筛选来自(例如)任何期望的酵母或真菌(其中那些产生EDA和/或ETrA的生物将是优选的)的文库而得以直接分离。基于本发明核酸序列的特异性寡核苷酸探针可通过本领域已知的方法(Maniatis，同上)设计和合成。而且，整个序列可直接用于通过熟练技术人员已知的方法(如随机引物DNA标记、切口平移或末端标记技术)合成DNA探针，或使用可获得的体外转录体系合成RNA探针。另外，可设计特异性引物并将其用于扩增部分(或全长)的本发明序列。所得的扩增产物可在扩增反应过程中直接标记或在扩增反应后标记，并用作探针来在合适的严格条件下分离全长的DNA片段。

通常，在PCR类型的扩增技术中，引物具有不同的序列而且彼此之间不互补。取决于所需的检测条件，应当设计引物序列以提供既有效又可靠的靶核酸的复制。PCR引物设计方法是本领域常见且熟知的(Thein和Wallace，“The use of oligonucleotide as specific hybridization probes inthe Diagnosis of Genetic Disorders”，Human Genetic Diseases：A PracticalApproach，K.E.Davis编辑，(1986)第33-50页，IRL：Herndon，VA；以及Rychlik，W.，Methods in Molecular Biology，White，B.A.编辑，(1993)第15卷，第31-39页，PCR Protocols：Current Methods and Applications.Humania：Totowa，NJ)。

通常，可以将本发明序列的两个短片段在PCR规程中用于从DNA或RNA扩增编码同源基因的更长的核酸片段。PCR也可以用克隆的核酸片段的文库进行，其中一个引物的序列源自本发明的核酸片段，而另一个引物的序列利用编码真核基因的mRNA前体3′端的多腺苷酸尾的存在。

备选地，第二个引物序列可以基于来源于克隆载体的序列。例如，技术人员可以按照RACE规程(Frohman等人，Proc.Acad.Sci.U.S.A.，85：8998(1988))，通过用PCR扩增在转录物内单个位点与3′或5′端之间的区域的拷贝来产生cDNA。以3′和5′方向取向的引物可用本发明的序列设计。使用可商业获得的3′RACE或5′RACE体系(Gibco/BRL，Gaithersburg，MD)可以分离特异性的3′或5′cDNA片段(Ohara等人，Proc.Acad.Sci.U.S.A.，86：5673(1989)；Loh等人，Science，243：217(1989))。

在其他实施方案中，任何本文所述的Δ9延伸酶核酸片段(或其经鉴定的任何同源物)均可用于产生新的和/或改良的脂肪酸延伸酶。如本领域所熟知的，体外诱变和选择、化学诱变、“基因改组(gene shuffling)”法或其他手段可用于获得天然存在的延伸酶基因的突变(其中这种突变可以包括缺失、插入和点突变或它们的组合)。这将使得能分别在体内产生具有延伸酶活性的多肽，该多肽在宿主细胞内具有更佳的物理参数和动力参数，例如更长的半衰期或更高的所需PUFA的产生速率。或者，如果需要，可以通过常规诱变、所得突变多肽的表达及其活性的测定来确定所关注的多肽(即Δ9延伸酶)对酶活性重要的区域。这些技术的综述在美国专利7,238,482中有描述。源自EaD9Elo1、EaD9Elo2和EaD9eS的所有这类突变蛋白和编码它们的核苷酸序列均在本发明的范围内。

备选地，改良的脂肪酸可以通过结构域交换合成，在该方法中将来自本文所述的任何Δ9延伸酶核酸片段的功能结构域与备选的延伸酶基因的功能结构域交换，从而产生新的蛋白质。如本文所用，“结构域”或“功能结构域”指能够引起微生物中的生物学应答的核酸序列。

用于产生多种ω-3和/或ω-6脂肪酸的方法

预计引入编码本文所述的Δ9延伸酶(即EaD9Elo1、EaD9Elo2、EaD9eS或其他突变酶、经密码子最优化的酶或它们的同源物)的嵌合基因，处于合适的启动子控制下，将会分别导致EDA和/或ETrA在转化的宿主生物中的产生增加。就这一点而论，本发明涵盖了用于直接产生PUFA的方法，该方法包括将脂肪酸底物(即LA和/或ALA)暴露给本文所述的延伸酶(例如，EaD9Elo1、EaD9Elo2或EaD9eS)，使得底物被转化成所需的脂肪酸产物(即分别为EDA和/或ETrA)。

更具体地讲，本发明的目的是提供用于在微生物宿主细胞(如酵母、藻类、细菌、类眼虫、原生藻菌和真菌)中产生EDA的方法，其中微生物宿主细胞包含：

(a)编码Δ9延伸酶多肽的重组核苷酸分子，基于Clustal V比对方法在与具有SEQ ID NO：13或SEQ ID NO：14中示出的氨基酸序列的多肽进行比较时，该延伸酶多肽具有至少80％的氨基酸同一性；和

(b)LA源；

其中使微生物宿主细胞在使编码Δ9延伸酶的核酸片段表达并使LA转化成EDA的条件下生长，并且其中可任选回收EDA。

在本发明的备选实施方案中，Δ9延伸酶可用于将ALA转化成ETrA。因此，本发明提供了用于产生ETrA的方法，其中微生物宿主细胞包含：

(b)ALA源；

其中使微生物宿主细胞在使编码Δ9延伸酶的核酸片段表达并使ALA转化成ETrA的条件下生长，而且其中可任选回收ETrA。

作为另外一种选择，本文描述的每种Δ9延伸酶基因及其相应的酶产物可间接用于产生多种ω-6和ω-3PUFA(参见图1和美国专利7,238,482)。如果脂肪酸底物经由中间步骤或途径中间产物间接转化成所需的脂肪酸产物，则间接产生了ω-3/ω-6PUFA。因此，预期可以将本文描述的Δ9延伸酶(即EaD9Elo1、EaD9Elo2、EaD9eS或其他突变酶、经密码子最优化的酶或它们的同源物)与另外的编码PUFA生物合成途径的酶(如Δ6去饱和酶、C_18/20延伸酶、Δ17去饱和酶、Δ8去饱和酶、Δ15去饱和酶、Δ9去饱和酶、Δ12去饱和酶、C_14/16延伸酶、C_16/18延伸酶、Δ9延伸酶、Δ5去饱和酶、Δ4去饱和酶、C_20/22延伸酶)的基因结合表达以导致更高水平地产生长链ω-3/ω-6脂肪酸(如ARA、EPA、DTA、DPAn-6、DPA和/或DHA)。

在优选的实施方案中，本发明的Δ9延伸酶将与Δ8去饱和酶(例如，来自小眼虫的去饱和酶[Wallis等人，Arch.Biochem.and Biophys.，365(2)：307-316(May 1999)；PCT公开WO 2000/34439；美国专利6,825,017；PCT公开WO 2004/057001；PCT公开WO 2006/012325；美国专利7,256,033；美国专利申请11/635258]；来自卡氏棘变形虫(Acanthamoeba castellanii)的去饱和酶[Sayanova等人，FEBS Lett.，580：1946-1952(2006)]；来自盐生巴夫藻(Pavlova salina)的去饱和酶[PCT公开WO 2005/103253]；来自路氏巴夫藻(Pavlova lutheri)的去饱和酶[PCT公开WO 2007/127381]；来自Tetruetreptia pomquetensisCCMP1491的去饱和酶[美国专利申请11/876115]；来自Eutreptiellasp.CCMP389的去饱和酶[美国专利申请11/876115]；来自Eutreptiellacf_gymnastica CCMP1594的去饱和酶[美国专利申请11/876115；以及来自Euglena anabaena的去饱和酶[在共同未决的美国专利申请12/099799和12/099811中有描述])最低程度地一起表达。然而，包含于具体表达盒中的具体基因将取决于宿主细胞(及其PUFA概况和/或去饱和酶/延伸酶概况)、底物的可利用性和所需的终产物。

在备选的实施方案中，基于本文所述的完整序列、那些完整序列的互补序列、那些序列的基本部分、源于它们的经密码子最优化的延伸酶以及与它们基本同源的那些序列，破坏宿主生物的天然Δ9延伸酶可能是有用的。

微生物表达系统、表达盒和载体

本文描述的Δ9延伸酶基因和基因产物(即EaD9Elo1、EaD9Elo2、EaD9eS或其他突变酶、经密码子最优化的酶或其同源物)可以在异源微生物宿主细胞中表达，特别是在含油酵母(如解脂耶氏酵母)的细胞中表达。

含有引导外来蛋白质高水平表达的调控序列的微生物表达系统和表达载体是本领域技术人员熟知的。这些表达系统和表达载体的任一种均可用于构建用于产生本发明序列的任何基因产物的嵌合基因。然后可以将这些嵌合基因通过转化导入合适的微生物中以提供所编码的酶的高水平表达。

可用于转化合适的微生物宿主细胞的载体(如构建体、质粒)和DNA表达盒是本领域熟知的。存在于构建体中的序列的具体选择取决于所需的表达产物(同上)、宿主细胞的性质以及提出的相对于未转化细胞分离转化细胞的手段。然而，通常载体含有至少一个表达盒、选择标记和允许自主复制或染色体整合的序列。合适的表达盒包含基因控制转录的5′区(如启动子)、基因编码序列和控制转录终止的DNA片段3′区(如终止子)。最优选的是，这两个控制区均来源于来自转化的微生物宿主细胞的基因，但应当了解这种控制区不必源自选作生产宿主的特定物种的天然基因。

可用于驱动本发明的Δ9延伸酶ORF在期望的微生物宿主细胞中表达的转录控制区(也称为起始控制区或启动子)有许多并且是本领域技术人员所熟悉的。事实上，能够引导这些基因在所选宿主细胞中表达的任何启动子(即天然的、合成的或嵌合的启动子)均适用于本发明，但来自宿主物种的转录和翻译区是尤其有用的。在微生物宿主细胞中的表达可以诱导型或组成型的方式来实现。诱导型表达可通过诱导可操作地连接至所关注的基因的可调节启动子的活性来完成，而组成型表达可通过利用可操作地连接至所关注的基因的组成型启动子来实现。例如，当宿主细胞为酵母时，则提供在酵母细胞中起作用的转录和翻译区，尤其是来自宿主物种的转录和翻译区(例如，对于在解脂耶氏酵母中使用的优选的转录起始调节区，参见专利公开US-2006-0115881-A1)。可以使用许多调控序列的任意一种，这取决于是期望组成型转录还是诱导型转录、启动子在表达所关注的ORF中的效率、构建的容易性等。

已经发现围绕翻译起始密码子‘ATG’的核苷酸序列影响酵母细胞的表达。如果所需多肽在酵母中表达差，则可以修饰外源基因的核苷酸序列以包括有效的酵母翻译起始序列来获得最佳的基因表达。对酵母中的表达而言，这可以通过使无效表达基因框内融合至内源酵母基因(优选高度表达的基因)而使其定点诱变来完成。作为另外一种选择，可以测定宿主中的共有翻译起始序列并将该序列引入异源基因中，以便它们在所关注宿主中最优化表达。

终止区可源于起始区从其获得的基因的3′区或源于不同的基因。大量的终止区是已知的并且(在用于与它们源自的属和物种相同和不同的属和物种两者时)在多种宿主中发挥的功能令人满意。终止区的选择通常更多是为了方便而不是因为任何特殊的性质。终止控制区也可以源于优选宿主的天然的多种基因。在备选的实施方案中，3′-区也可以是合成的，因为本领域的技术人员可利用可用的信息来设计和合成用作转录终止子的3′-区序列。任选地，终止位点可以是非必需的；然而，如果包括则是最优选的。

如本领域的技术人员所意识到的，仅仅将基因插入到克隆载体中不能保证它将被成功地以所需要的水平表达。根据对高表达率的需要，通过操作许多控制转录、翻译、蛋白质稳定性、氧限制和从微生物宿主细胞分泌方面的不同遗传元件，已经建立了许多专用的表达载体。更具体地讲，已经被操作以控制基因表达的一些分子特征包括：相关转录启动子和终止子序列的性质；所克隆基因的拷贝数目(其中可以在单个表达构建体中克隆另外的拷贝和/或将另外的拷贝通过增加质粒拷贝数或通过将克隆基因多次整合进基因组中来引入宿主细胞中)；基因是质粒携带的还是整合进了宿主细胞的基因组中；所合成的外来蛋白质的最终细胞定位；蛋白质在宿主生物内的翻译和正确折叠的效率；所克隆基因的mRNA和蛋白质在宿主细胞内的固有稳定性；以及所克隆基因中的密码子使用，使得其频率与宿主细胞的优选密码子使用频率接近。这些类型的修饰的每一种均涵盖在本发明中，作为进一步优化本文所述的Δ9延伸酶的表达的手段。

微生物宿主细胞的转化

一旦已经获得适用于在合适的微生物宿主细胞中表达的DNA盒(例如包含启动子、ORF和终止子的嵌合基因)，则将其置于能够在宿主细胞中自主复制的质粒载体中，或将其直接整合进宿主细胞的基因组中。表达盒的整合可以在宿主基因组中随机地发生或者可以通过使用这样的构建体来靶向，即该构建体含有足以靶向宿主基因座中的重组的与宿主基因组同源的区。如果构建体靶向内源性基因座，则转录和翻译调控区的全部或某些可以由内源性基因座提供。

如果两个或更多个基因从独立的复制载体表达，则希望每个载体具有不同的选择手段并且应当缺乏与其他构建体的同源性以便维持稳定表达和防止元件在构建体之间重配(reassortment)。可用实验方法确定对调控区、选择手段和所引入的构建体的增殖方法的正确选择，以便所有导入的基因均以需要的水平表达从而提供所需产品的合成。

包含所关注的基因的构建体可以通过任何标准技术导入微生物宿主细胞中。这些技术包括转化(如醋酸锂转化[Methods in Enzymology，194：186-187(1991)])、原生质体转化、基因枪轰击(bolistic impact)、电穿孔、显微注射或将所关注的基因引入宿主细胞中的任何其他方法。

为方便起见，已通过任何方法操纵来吸收DNA序列(如表达盒)的宿主细胞在本文中将称为“转化的”、“转化体”或“重组体”。因此，术语“转化的”和“转化体”在本文中可互换使用。转化的宿主将具有至少一个拷贝的表达构建体，而且可以具有两个或更多个拷贝，这取决于该表达盒是整合进基因组内还是存在于具有多拷贝数的染色体外元件上。

转化的宿主细胞可以通过多种选择技术来鉴定，如美国专利7,238,482、美国专利7,259,255和PCT公开WO 2006/052870中所述。

转化后，适用于本发明的Δ9延伸酶(以及任选在宿主细胞中共表达的其他PUFA酶)的底物可以由宿主自然产生或通过转基因产生，或者它们可以由外部来源提供。

用于重组表达的优选的微生物宿主

用于表达本发明基因和核酸片段的微生物宿主细胞可以包括在多种原料(包括简单或复杂的碳水化合物、脂肪酸、有机酸、油、甘油和醇，和/或碳氢化合物)上于宽的温度和pH值范围内生长的宿主。基于申请人的受让人的需要，本发明描述的基因已经在含油酵母(并且特别是解脂耶氏酵母)中表达；然而预期的是，由于转录、翻译和蛋白质生物合成结构是高度保守的，因此任何细菌、酵母、藻类、类眼虫、原生藻菌和/或真菌均将是用于表达本发明的核酸片段的合适微生物宿主。

然而，优选的微生物宿主是含油生物，例如含油酵母。这些生物天然能够合成并积聚油，其中油可构成超过约25％的细胞干重，更优选超过约30％的细胞干重，而最优选超过约40％的细胞干重。通常鉴定为含油酵母的属包括但不限于：耶氏酵母属、假丝酵母属、红酵母属、红冬孢酵母属、隐球酵母属、丝孢酵母属和油脂酵母属。更具体地讲，示例性的油合成酵母包括：圆红冬孢酵母、斯达氏油脂酵母、产油油脂酵母、拉可夫氏假丝酵母、铁红假丝酵母、热带假丝酵母、产朊假丝酵母、茁芽丝孢酵母、皮状丝孢酵母、胶粘红酵母、牧草红酵母和解脂耶氏酵母(以前归类为解脂假丝酵母(Candida lipolytica))。在备选的实施方案中，可以通过基因工程进行油的生物合成，使得微生物宿主细胞(如酵母)产生多于25％细胞干重的油，从而被认为是含油的。

最优选的是含油酵母解脂耶氏酵母；并且，在又一个实施方案中，最优选的是命名为ATCC #20362、ATCC #8862、ATCC #18944、ATCC#76982和/或LGAM S(7)1的解脂耶氏酵母菌株(Papanikolaou S.和Aggelis G.，Bioresour.Technol.，82(1)：43-9(2002))。

历史上，已经使用多种解脂耶氏酵母菌株用于加工和生产：异柠檬酸裂解酶；脂肪酶；聚羟基链烷酸酯；柠檬酸；赤藓醇；2-酮戊二酸；γ-癸内酯；γ-十二内酯；以及丙酮酸。可用于转化含油酵母(即解脂耶氏酵母)的具体教导内容包括美国专利4,880,741和美国专利5,071,764，以及Chen，D.C.等人(Appl.Microbiol.Biotechnol.，48(2)：232-235(1997))。可用于在解脂耶氏酵母中工程化生产ARA、EPA和DHA的具体教导内容分别在美国专利申请11/264784、美国专利申请11/265761和美国专利申请11/264737中提供。在这种酵母中表达基因的优选方法是将线性DNA整合到宿主的基因组中；而且，当期望基因高水平表达时，则整合到基因组中的多个位置是尤其有用的[如在Ura3基因座(基因库编号AJ306421)、Leu2基因座(基因库编号AF260230)、Lys5基因座(基因库编号M34929)、Aco2基因座(基因库编号AJ001300)、Pox3基因座(Pox3：基因库编号XP_503244；或Aco3：基因库编号AJ001301)、Δ12去饱和酶基因座(美国专利7,214,491)、Lip1基因座(基因库编号Z50020)、Lip2基因座(基因库编号AJ012632)、SCP2基因座(基因库编号AJ431362)和/或Pex10基因座(基因库编号CAG81606)]。

用于解脂耶氏酵母的优选选择方法是对卡那霉素、潮霉素和氨基糖苷G418抗性以及在缺乏尿嘧啶、亮氨酸、赖氨酸、色氨酸或组氨酸的培养基上生长的能力。在备选的实施方案中，5-氟乳清酸(5-氟尿嘧啶-6-羧酸一水合物；“5-FOA”)可用于选择酵母Ura^-突变体。该化合物对具有编码乳清苷5′-单磷酸脱羧酶(OMP脱羧酶)的功能性URA3基因的酵母细胞有毒性；因此，基于这种毒性，5-FOA特别可用于选择和鉴定Ura^-突变型酵母菌株(Bartel，P.L.和Fields，S.，Yeast 2-Hybrid System，Oxford University：New York，v.7，第109-147页，1997；对于5-FOA在耶氏酵母中的使用，还可参见PCT公开WO 2006/052870)。

用于耶氏酵母的备选的优选选择方法依赖于用于解脂耶氏酵母的基于磺酰脲(氯嘧磺隆；E.I.duPont de Nemours & Co.，Inc.，Wilmington，DE)抗性的显性非抗生素标记。更具体地讲，该标记基因是具有单个氨基酸改变(W497L)的天然乙酰羟酸合酶(AHAS或乙酰乳酸合酶；E.C.4.1.3.18)，从而赋予了磺酰脲除草剂抗性(PCT公布WO 2006/052870)。AHAS是用于生物合成支链氨基酸(即缬氨酸、亮氨酸、异亮氨酸)的途径中的第一常用酶，并且它是磺酰脲和咪唑啉酮除草剂的靶标。

其他优选的微生物宿主包括含油的细菌、藻类、类眼虫、原生藻菌和其他真菌；并且，在这一广泛的微生物宿主群组中，特别关注的是合成ω-3/ω-6脂肪酸的微生物(或可以为该目的进行基因工程改造的那些微生物[例如，诸如啤酒糖酵母(Saccharomyces cerevisiae)之类的其他酵母])。因此，例如，用处于诱导型或调节型启动子控制下的任何本发明的Δ9延伸酶基因转化高山被孢霉(Mortierella alpina)(其在商业上用于生产ARA)可以产生能够合成增加量的EDA的转化生物；EDA可以转化成增加量的DGLA，如果Δ8去饱和酶基因被共表达的话。Mackenzie等人(Appl.Environ.Microbiol.，66：4655(2000))描述了转化高山被孢霉的方法。类似地，用于转化破囊壶菌目(Thraustochytriales)微生物(例如破囊壶菌(Thraustochytrium)、裂殖壶菌(Schizochytrium))的方法在U.S.7,001,772中公开。

不论选择哪种宿主用于表达本文描述的Δ9延伸酶，均需要筛选多个转化体以获得显示期望表达水平和模式的菌株。这种筛选可以通过DNA印迹的Southern分析(Southern，J.Mol.Biol.，98：503(1975))、mRNA表达的Northern分析(Kroczek，J.Chromatogr.Biomed.Appl.，618(1-2)：133-145(1993))、蛋白质表达的Western和/或Elisa分析、PUFA产物的表型分析或GC分析来完成。

基于上述教导内容，在一个实施方案中，本发明描写了分别产生EDA或ETrA的方法，该方法包括：

(a)提供含油酵母(例如解脂耶氏酵母)，其包含：

(i)编码Δ9延伸酶多肽的第一重组核苷酸分子，该核苷酸分子可操作地连接至至少一个调控序列；和

(ii)分别由LA和/或ALA组成的延伸酶底物源；和

(b)在存在合适的可发酵碳源的情况下使步骤(a)的酵母生长，其中编码Δ9延伸酶多肽的基因得以表达而且分别将LA转化成EDA和/或将ALA转化成ETrA；以及，

(c)任选地分别回收步骤(b)中的EDA和/或ETrA。可能需要供给底物。

编码Δ9延伸酶的基因的核苷酸序列可以选自SEQ ID NO：11和SEQ ID NO：12。在备选的实施方案中，编码Δ9延伸酶多肽的基因的核苷酸序列在SEQ ID NO：26中示出(其中相对于SEQ ID NO：11，至少98个密码子已经被最优化以便在耶氏酵母属中表达)。

由于含油酵母中天然产生的PUFA仅限于18:2脂肪酸(即LA)和通常较少的18:3脂肪酸(即ALA)，因此除了本文所述的Δ9延伸酶之外，还将对含油酵母进行基因工程改造以表达多种对长链PUFA生物合成所必需的酶(由此使得能产生例如ARA、EPA、DPA和DHA)。

具体地讲，在本发明的一个实施方案中涉及的含油酵母包含：

(a)包含分离的多核苷酸的第一重组DNA构建体，该多核苷酸编码Δ9延伸酶多肽，并被可操作地连接至至少一个调控序列；和

(b)至少一个另外的重组DNA构建体，该构建体包含可操作地连接至至少一个调控序列的分离的多核苷酸，其编码的多肽选自如下酶：Δ4去饱和酶、Δ5去饱和酶、Δ6去饱和酶、Δ9去饱和酶、Δ12去饱和酶、Δ15去饱和酶、Δ17去饱和酶、Δ8去饱和酶、C_14/16延伸酶、C_16/18延伸酶、C_18/20延伸酶和C_20/22延伸酶。

在特别优选的实施方案中，至少一个另外的重组DNA构建体编码具有Δ8去饱和酶活性的多肽。

微生物中的ω-3和/或ω-6脂肪酸生物合成的代谢工程

有关本发明的Δ9延伸酶序列的知识将可用于操纵多种宿主细胞中的ω-3和/或ω-6脂肪酸的生物合成。操纵生化途径的方法是本领域的技术人员所熟知的；而且，预计很多操纵方法将可能使含油酵母并且尤其是解脂耶氏酵母中的ω-3和/或ω-6脂肪酸的生物合成达到最大程度。这种操纵可能需要直接在PUFA生物合成途径中进行代谢工程改造，或者需要另外对为PUFA生物合成途径提供碳的途径进行操纵。可用于上调期望的生化途径和下调不期望的生化途径的方法是本领域技术人员熟知的。

例如，与ω-3和/或ω-6脂肪酸生物合成途径竞争能量或碳的生化途径或干扰特定PUFA终产物产生的天然PUFA生物合成途径中的酶可以通过基因破坏来去除或通过其他手段(如反义mRNA)来下调。

在PUFA生物合成途径中作为增加ARA、EPA或DHA的手段的操纵(及其相关技术)的详细讨论分别在美国专利公开2006-0094092-A1、美国专利公开2006-0115881-A1和美国专利公开2006-0110806-A1中给出，在TAG生物合成途径和TAG降解途径中的理想的操纵(及其相关技术)也在其中给出。

在本发明的上下文中，通过上述策略中的任意一种来调节脂肪酸生物合成途径的表达均可能是有用的。例如，本发明提供了方法，通过该方法，将编码Δ9延伸酶/Δ8去饱和酶生物合成途径中的关键酶的基因引入含油酵母中用以产生ω-3和/或ω-6脂肪酸。利用对宿主生物进行代谢工程改造的多种手段，使本发明的Δ9延伸酶基因在天然条件下不具有ω-3和/或ω-6脂肪酸生物合成途径的含油酵母中表达并协调这些基因的表达，以最大程度地产生优选的PUFA产物将是特别有用的。

用于PUFA生产的微生物发酵过程

使转化的微生物宿主细胞在使嵌合的去饱和酶和延伸酶基因的表达最优化而且产生的所需PUFA的产率最大且最经济的条件下生长。通常，可以被优化的培养基条件包括碳源的类型和量、氮源的类型和量、碳氮比、不同矿物离子的量、氧水平、生长温度、pH、生物量生产期的时长、油积聚期的时长以及细胞收获的时间和方法。使所关注的微生物(例如含油酵母，如解脂耶氏酵母)通常在复合培养基(例如酵母提取物-蛋白胨-葡萄糖肉汤培养基(YPD))或缺乏生长所必需的成分并由此强迫选择所需表达盒的确定成分的极限培养基(如Yeast NitrogenBase(DIFCO Laboratories，Detroit，MI))中生长。

本发明的发酵培养基必须含有合适的碳源。美国专利7,238,482中教导了合适的碳源。尽管预期本发明中利用的碳源可以涵盖许多种含碳源，但优选的碳源是糖类(如葡萄糖)、甘油和/或脂肪酸。

氮可以由无机源(如(NH₄)₂SO₄)或有机源(如尿素或谷氨酸)提供。除了合适的碳源和氮源之外，发酵培养基还必须含有合适的矿物质、盐、辅因子、缓冲液、维生素和本领域技术人员已知的适合含油宿主生长并促进PUFA产生所必需的酶促途径的其他组分。要特别注意促进脂质和PUFA合成的几种金属离子(如Fe⁺²、Cu⁺²、Mn⁺²、Co⁺²、Zn⁺²、Mg⁺²)(Nakahara，T.等人，Ind.Appl.Single Cell Oils，D.J.Kyle和R.Colin(编辑).第61-97页(1992))。

本发明中优选的生长培养基是普通的商业制备的培养基，例如Yeast Nitrogen Base(DIFCO Laboratories，Detroit，MI)。也可以使用其他确定成分的生长培养基或合成的生长培养基，适于转化宿主细胞生长的培养基对微生物学或发酵科学领域的技术人员来说将是已知的。适于发酵的pH范围通常介于约pH4.0至pH8.0之间，其中优选将pH5.5至pH7.5作为初始生长条件的范围。发酵可以在有氧或厌氧条件下进行，其中优选为微好氧条件。

通常，在含油酵母细胞中积聚高水平的PUFA需要一个包括两个阶段的过程，因为代谢状态必须在生长和脂肪的合成/贮存之间达到“平衡”。因此，最优选的是，包括两个阶段的发酵过程是在含油酵母(如解脂耶氏酵母)中产生PUFA所必需的。这种方法在美国专利7,238,482中有所描述，其也描述了多种合适的发酵工艺设计(即分批式、补料分批式和连续式)和生长过程中的注意事项。

PUFA油的纯化和处理

PUFA可以游离脂肪酸或以酯化的形式(例如酰基甘油、磷脂、硫脂或糖脂)存在于宿主微生物中，并且可以通过本领域熟知的多种手段从宿主细胞提取。关于酵母脂质的提取技术、质量分析和可接受标准的一篇综述是Z.Jacobs(Critical Reviews in Biotechnology，12(5/6)：463-491(1992))的综述。有关下游加工的简述也可由A.Singh和O.Ward(Adv.Appl.Microbiol.，45：271-312(1997))提供。

通常，用于纯化PUFA的手段可包括用有机溶剂萃取(例如，美国专利6,797,303和美国专利5,648,564)、超声处理、超临界流体萃取(如使用二氧化碳)、皂化和物理手段(例如挤压)，或它们的组合。另外的详细信息可参考美国专利7,238,482的教导内容。

含PUFA的油在食品、保健食品、药物和动物饲料中的用途

市场目前支持各种掺入了ω-3和/或ω-6脂肪酸(尤其是例如ALA、GLA、ARA、EPA、DPA和DHA)的食物和饲料产品。预期包含长链PUFA的微生物量、部分纯化的包含PUFA的微生物量、纯化的包含PUFA的微生物油和/或纯化的PUFA将在食物和饲料产品中起作用以赋予该制剂的健康益处。更具体地讲，本发明的含有ω-3和/或ω-6脂肪酸的油将适用于多种食物和饲料产品，包括但不限于：食物模拟物、肉产品、谷类产品、烘焙食物、小吃和乳制品(关于详细内容请参见专利公开US-2006-0094092)。

此外，本发明的组合物可用于制剂中以在医疗食物(包括医疗营养品、膳食补充剂、婴儿代乳品以及药物产品)中赋予健康益处。食物加工和食物配制领域的技术人员将了解所述各种油的量和组成如何加入食物或饲料产品中。该量在本文中将称为“有效”量并将取决于食物或饲料产品、期望补充该产品的膳食或医疗食物或医疗营养品旨在纠正或治疗的医学状况。

实施例

本发明将在下面的实施例中得以进一步说明，其中份数和百分比是以重量计并且度数是摄氏度，除非另外说明。应当理解，尽管这些实施例说明了本发明的优选实施方案，但仅是以例证的方式给出的。根据上面的论述和这些实施例，本领域的技术人员可确定本发明的基本特征，并在不脱离本发明的精神和范围的情况下，可对本发明做出多种改变和修饰，以使其适用于多种用途和条件。因此，除了本文所示和描述的那些之外，根据前文所述，本发明的各种修改形式对本领域的技术人员来说将是显而易见的。这些修改形式也旨在涵盖于所附权利要求书的范围内。

一般方法

实施例中使用的标准重组DNA技术和分子克隆技术是本领域所熟知的并且在如下文献中有所描述：1.)Sambrook，J.，Fritsch，E.F.和Maniatis，T.Molecular Cloning：A Laboratory Manual；Cold Spring HarborLaboratory：Cold Spring Harbor，NY(1989)(Maniatis)；2.)T.J.Silhavy，M.L.Bennan和L.W.Enquist，Experiments with Gene Fusions；Cold SpringHarbor Laboratory：Cold Spring Harbor，NY(1984)；以及3.)Ausubel，F.M.等人，Current Protocols in Molecular Biology，由Greene Publishing Assoc.and Wiley-Interscience出版(1987)。

适用于微生物培养物的维持和生长的材料和方法是本领域熟知的。适用于下面实施例的技术可在Manual of Methods for GeneralBacteriology(Phillipp Gerhardt，R.G.E.Murray，Ralph N.Costilow，Eugene W.Nester，Willis A.Wood，Noel R.Krieg和G.Briggs Phillips编辑)，American Society for Microbiology：Washington，D.C.(1994))；或Thomas D.Brock in Biotechnology：A Textbook of IndustrialMicrobiology，第2版，Sinauer Associates：Sunderland，MA(1989)的描述中找到。用于微生物细胞的生长和维持的所有试剂、限制性内切酶和材料均获自Aldrich Chemicals(Milwaukee，WI)、DIFCO Laboratories(Detroit，MI)、GIBCO/BRL(Gaithersburg，MD)或Sigma ChemicalCompany(St.Louis，MO)，除非另外说明。通常于37℃下在Luria Bertani(LB)平板上培养大肠杆菌(E.coli)菌株。

一般的分子克隆根据标准方法(Sambrook等人，同上)来完成。DNA序列是在ABI自动测序仪上采用染料终止剂技术(美国专利5,366,860；EP272,007)使用载体和插入片段特异性引物的组合来产生的。序列编辑是在Sequencher(Gene Codes Corporation，Ann Arbor，MI)中进行的。所有序列在两个方向上覆盖至少两次。基因序列的比较是使用DNASTAR软件(DNAStar Inc.，Madison，WI)来完成。

缩写的含义如下：“sec”表示秒，“min”表示分钟，“h”或“hr”表示小时，“d”表示天，“μL”表示微升，“mL”表示毫升，“L”表示升，“μM”表示微摩尔，“mM”表示毫摩尔，“M”表示摩尔，“mmol”表示毫摩尔，“μmole”表示微摩尔，“g”表示克，“μg”表示微克，“ng”表示纳克，“U”表示单位，“bp”表示碱基对并且“kB”表示千碱基。

表达盒的命名：

表达盒的结构将通过简单的记号系统“X::Y::Z”表示，其中X描述启动子片段，Y描述基因片段而Z描述终止子片段，它们均彼此可操作地连接。

解脂耶氏酵母的转化和培养：

ATCC登录号为#20362、#76982和#90812的解脂耶氏酵母菌株可购自美国典型培养物保藏中心(Rockville，MD)。解脂耶氏酵母菌株通常是在根据下面所示的配方的数种培养基中于28-30℃下培育。根据标准方法，按需要通过将20g/L琼脂添加到每种液体培养基中来制备琼脂平板。

YPD琼脂培养基(每升)：10g酵母提取物[Difco]，20g细菌用蛋白胨[Difco]；以及20g葡萄糖。

极限培养基(MM)(每升)：20g/L葡萄糖；1.7g无氨基酸的酵母氮源基础；无氨基酸的基础培养基；1.0g脯氨酸；并且pH为6.1(未调节)。

极限培养基+5-氟乳清酸(MM+5-FOA)(每升)：20g葡萄糖、6.7g酵母氮源基础、75mg尿嘧啶、75mg尿苷，并且基于对一系列从100mg/L至1000mg/L的浓度的FOA活性试验(因为供应商提供的每批料中会发生改变)，选用适量的FOA(Zymo Research Corp.，Orange，CA)。

解脂耶氏酵母的转化是根据Chen，D.C.等人(Appl.Microbiol.Biotechnol.，48(2)：232-235(1997))的方法实施，除非另外指明。简而言之，将耶氏酵母划线接种到YPD平板上，并在30℃下培育大约18小时。从平板上刮掉数个大环量的细胞并将其重悬浮于1mL含有如下成分的转化缓冲液中：2.25mL 50％的PEG，平均分子量为3350；0.125mL 2M的醋酸锂，pH 6.0；0.125mL 2M的DTT；以及(可任选)50μg已剪切的鲑精DNA。然后，将大约500ng线性化的DNA(优选包含至少一种嵌合基因)(或100ng环状质粒)在100μL重悬浮的细胞中孵育，并将其在39℃下保持1小时，每间隔15分钟进行涡旋混合。将细胞铺在选择培养基平板上并在30℃下保持2至3天。

解脂耶氏酵母的脂肪酸分析：

对于脂肪酸分析，将细胞通过离心收集并如Bligh，E.G.&Dyer，W.J.(Can.J.Biochem.Physiol.，37：911-9171959))中所述提取脂质。通过将脂质提取物与甲醇钠进行酯交换反应而制备脂肪酸甲酯(Roughan，G.和Nishida I.，Arch Biochem Biophys.，276(1)：38-46(1990))并随后将其用配有30mx0.25mm(内径)HP-INNOWAX(Hewlett-Packard)柱的Hewlett-Packard 6890气相色谱仪(GC)进行分析。烘箱温度以3.5℃/分钟从170℃(保持25分钟)升到185℃。

为了进行直接的碱催化酯交换反应，收获耶氏酵母培养物(3mL)，在蒸馏水中洗涤一次，并在Speed-Vac中在真空下干燥5-10分钟。将甲醇钠(100μl，1％)加入样品中，然后将样品涡旋振荡20分钟。在加入3滴1M氯化钠和400μl己烷后，涡旋样品并离心。移出上层并如上所述用GC进行分析。

实施例1

来自Euglena anabaena UTEX 373的cDNA文库的合成

本实施例描述了来自Euglena anabaenaUTEX 373的cDNA文库的合成。该工作包括制备RNA、合成cDNA和产生cDNA文库。

Euglena anabaena UTEX 373的培育和RNA制备

Euglena anabaena UTEX 373可获自密西根州立大学RichardTriemer博士的实验室(East Lansing，MI)。移出约2ml培养物用于液体分析，将其以1,800xg离心5分钟。用水洗涤沉淀一次并再次离心。将所得沉淀真空干燥5分钟，重悬浮于100μL三甲基氢氧化硫(TMSH)中，在室温下摇动孵育15分钟。孵育后，加入0.5mL己烷并将该小瓶在室温下另外摇动孵育15分钟。使用配有Omegawax 320熔融石英毛细柱的Hewlett-Packard 6890气相色谱(Supelco Inc.，目录号24152)对脂肪酸甲酯(从己烷层取5μL注射上样)进行分离和定量。用程序控制烘箱温度在170℃保持1.0分钟，以5℃/分钟上升到240℃，然后另外保持1.0分钟。载气通过Whatman氢发生器供应。将保留时间与那些市售的甲酯标准样品(Nu-Chek Prep，Inc.，目录号U-99-A)的保留时间进行比较，所得的色谱图在图2中示出。脂肪酸概况中存在EDA、ETrA、EPA和DHA且不存在GLA和STA表明，Euglena anabaena采用Δ9延伸酶/Δ8去饱和酶途径来用于长链(LC)PUFA的生物合成，并且将会是LC-PUFA生物合成基因(例如但不限于Δ9延伸酶)的良好来源。

将剩余的5mL活跃生长的培养物转移至125mL玻璃烧瓶中的25mLAF-6培养基(Watanabe & Hiroki，NIES-Collection List of Strains，第5版，National Institute for Environmental Studies，Tsukuba，第127页(2004))中。采用16小时光照8小时黑暗周期并进行非常轻微的搅动，使小眼虫培养物在22℃下生长2周。

2周后，将培养物(25mL)转移至500mL玻璃瓶中的100mL AF-6培养基中，如上所述使培养物生长1个月。在这之后，将两份50mL的等份试样转移进两个分开的装有250mL AF-6培养基的500mL玻璃瓶中，如上所述将培养物培育2个月(得到总共约600mL的培养物)。接下来，以1,800xg离心10分钟获得培养物的沉淀颗粒，将其用水洗涤一次并再次离心。使用RNA STAT-60^TM试剂(TEL-TEST，Inc.，Friendswood，TX)，按照制造商提供的规程(使用5mL试剂，将RNA溶解于0.5mL水中)从一份所得的沉淀中提取总RNA。这样，从沉淀中获得340μg的总RNA(680ug/mL)。将剩余的沉淀在液氮中冷冻并在-80℃下保存。使用mRNA纯化试剂盒(Amersham Biosciences，Piscataway，NJ)按照制造商提供的规程从340μg总RNA中来分离mRNA。这样，获得9.0μg mRNA。

Euglena anabaena cDNA的制备和cDNA文库eug1c的产生

使用Cloneminer^TM cDNA文库构建试剂盒(目录号18249-029，Invitrogen Corporation，Carlsbad，CA)，按照制造商提供的规程(VersionB，25-0608)产生cDNA文库。使用非放射标记方法，从5.12μg mRNA(上文所述的mRNA)中用生物素-attB2-Oligo(dT)引物来合成cDNA。在合成第一链和第二链后，加入attB1衔接子进行连接，并用柱色谱对cDNA按照大小进行分级。将来自级分的DNA浓缩，重组进pDONR^TM222中，并转化进大肠杆菌ElectroMAX^TM DH10B^TM T1噬菌体抗性细胞(Invitrogen Corporation)中。将该Euglena anabaena文库命名为eug1c。

将cDNA文库eug1c铺在LB+卡那霉素平板(约100,000个菌落)上，刮下菌落，使用QIAprepSpin Miniprep Kit(Qiagen Inc.，Valencia，CA)按照制造商提供的规程来分离DNA。这样，获得来自eug1c的质粒DNA子文库。

实施例2

从Euglena anabaena UTEX 373分离全长的Δ9延伸酶

本实施例描述了鉴定编码来自Euglena anabaena UTEX 373的Δ9延伸酶的cDNA(SEQ ID NO：1和2)。这一工作包括产生源自小眼虫Δ9延伸酶(EgD9e；SEQ ID NO：3)的探针以及让该探针与cDNA文库eug1c杂交以鉴定来自Euglena anabaena UTEX 373的Δ9延伸酶同源物。

小眼虫Δ9延伸酶(EgD9e)

将来自裸藻属cDNA文库(eeg1c)的克隆(称为eeg1c.pk001.n5f，含有小眼虫Δ9延伸酶(EgD9e；SEQ ID NO：3；其在美国申请11/601,563中有描述))用作模板，使用寡核苷酸引物oEugEL1-1(SEQ ID NO：5)和oEugEL1-2(SEQ ID NO：6)，用VentR

DNA聚合酶(目录号M0254S，New England Biolabs Inc.，Beverly，MA)按照制造商的规程扩增EgD9e。使用Zero Blunt

PCR克隆试剂盒(Invitrogen Corporation)，按照制造商的规程将所得DNA片段克隆进pCR-Blunt克隆载体中，以产生pKR906(SEQ ID NO：15)。

菌落转移

将Euglena anabaena cDNA文库eug1c的大约17,000个克隆铺在三个大的正方形(24cm×24cm)Petri平板(Corning，Corning，NY)上，每个平板装有LB+50μg/mL卡那霉素琼脂培养基。使细胞在37℃下生长过夜，然后使平板冷却至室温。

将Biodyne B 0.45μm膜(目录号60207，Pall Corporation，Pensacola，FL)修剪成大约22cm×22cm，并将该膜小心地铺放在琼脂上面以避免气泡。在室温下孵育2分钟后，将膜标记取向，用镊子将膜提起并将菌落面朝上放在用0.5M氢氧化钠和1.5M氯化钠浸湿的滤纸上。变性4分钟后，通过将膜置于用0.5M Tris-HCL(pH7.5)和1.5M氯化钠浸湿的滤纸上4分钟来中和氢氧化钠。重复该步骤，将膜在2XSSC缓冲液(20XSSC是3M的氯化钠、0.3M的柠檬酸钠；pH 7.0)中简单冲洗并在滤纸上风干。

杂交

将膜在200mL杂交溶液中于65℃下预杂交2小时。杂交溶液含有6X SSPE(20X SSPE是3M的氯化钠、0.2M的磷酸钠、20mM的EDTA；pH 7.4)、5X Denhardt试剂(100X Denhardt试剂是2％(w/v)Ficoll、2％(w/v)聚乙烯吡咯烷酮、2％(w/v)乙酰化的牛血清白蛋白)、0.5％十二烷基硫酸钠(SDS)、100μg/mL已剪切的鲑精DNA和5％硫酸葡聚糖。

用来自pKR906(SEQ ID NO：15)的经琼脂糖凝胶纯化过的NcoI/NotIDNA片段(其含有小眼虫Δ9延伸酶基因)来制备DNA探针，使用RadPrime DNA标记系统(Catalog No.18428-011，Invitrogen，Carlsbad，CA)按照制造商的说明书用P³² dCTP标记该DNA片段。使用NICK柱(目录号17-0855-02，Amersham Biosciences，Piscataway，NJ)，按照制造商的说明书分离未整合的P³²dCTP。将探针在100℃下变性5分钟，置于冰上3分钟，并将其一半加入到杂交溶液中。

将膜在65℃下与探针轻微摇动地杂交过夜，然后在次日用含0.5％SDS的2XSSC洗涤两次(每次5分钟)，并用含0.1％SDS的0.2XSSC洗涤两次(每次15分钟)。洗涤后，将hyperfilm(目录号RPN30K，Amersham Biosciences，Piscataway，NJ)在-80℃下暴露于该膜过夜。

根据将平板与暴露的hyperfilm对齐，用巴斯德吸管的钝头将阳性菌落挑选至1mL水中并进行涡旋。制备数份稀释液，并将其铺在装有LB培养基和50μg/mL卡那霉素的小圆形培养皿(82mm)上以在单个平板上获得约100个分离得很好的菌落。如上所述进行转移，不同的是使用NytranN膜圆片(membrane circles)(目录号10416116，Schleicher&Schuell，Keene，NH)并且用剩余的经放射标记过的探针在100mL杂交溶液中杂交。以这种方式，确认了阳性克隆。

使各阳性克隆在LB+50μg/mL卡那霉素液体培养基中于37℃下生长，用QIAprep

Spin Miniprep试剂盒(Qiagen Inc.)按照制造商的规程来纯化质粒。

使用载体引发的M13F通用引物(SEQ ID NO：7)、M13rev-28引物(SEQ ID NO：8)和聚腺苷酸尾引发的WobbleT寡核苷酸，用ABIBigDye version 3Prism测序试剂盒对384-孔平板中的DNA插入物进行末端测序。对于测序反应，使用100-200ng模板和6.4pmol引物，重复以下反应条件25次：96℃10秒，50℃5秒，60℃4分钟。在基于乙醇的纯化后，将循环测序反应的产物在Perkin-Elmer ABI 3700自动测序仪上分离并检测。WobbleT引物是21mer聚(T)A、聚(T)C和聚(T)G的克分子数相等的混合物，用于对cDNA克隆的3′末端进行测序。

使用Sequencher^TM(版本4.2，Gene Codes Corporation，Ann Arbor，MI)对序列进行比对和比较，这样，基于插入序列可以将克隆归类为两种不同组中的一种(称为EaD9Elo1和EaD9Elo2)。选择含有每一类序列的cDNA的代表性克隆用于进一步的研究，每种代表性质粒(即pLF121-1和pLF121-2)的序列分别在SEQ ID NO：9和SEQ ID NO：10中示出。用一串NNNN表示的序列表示未进行测序的聚腺苷酸尾区域。EaD9Elo1和EaD9Elo2的编码序列分别在SEQ ID NO：11和SEQ ID NO：12中示出。EaD9Elo1和EaD9Elo2的相应氨基酸序列分别在SEQ ID NO：13和SEQ ID NO：14中示出。

实施例3

Euglena anabaena UTEX 373的Δ9延伸酶序列(EaD9Elo1和 EaD9Elo2)的一级序列分析和与其他公开的Δ9延伸酶序列的比较

使用Clustal V方法(Higgins，D.G.和Sharp，P.M.，Comput.Appl.Biosci.，5：151-153(1989)；Higgins等人，Comput.Appl.Biosci.，8：189-191(1992))，用LASERGENE生物信息学计数软件包(DNASTAR Inc.，Madison，WI)的MegAlign^TM v6.1程序比较EaD9Elo1(SEQ ID NO：13)和EaD9Elo2(SEQ ID NO：14)的氨基酸序列，该程序采用用于成对比对的默认参数(KTUPLE＝1，缺口罚分＝3，窗口＝5，DIAGONALS SAVED＝5，缺口长度罚分＝10)。

与EaD9Elo1(SEQ ID NO：13)相比较，EaD9Elo2(SEQ ID NO：14)具有1个氨基酸置换(即，基于EaD9Elo1的编号，254位的R被置换成Q)。EaD9Elo1(SEQ ID NO：11)和EaD9Elo2(SEQ ID NO：12)的核苷酸序列在全长774bp的长度范围内有6个碱基对不同。

通过BLASTP(基本的局部比对搜索工具(Basic Local AlignmentSearch Tool)；Altschul等人，J.Mol.Biol.，215：403-410(1993))搜索与BLAST“nr”数据库(包括所有非冗余GenBank CDS翻译物、来源于3-维结构Brookhaven Protein Data Bank的序列、SWISS-PROT蛋白质序列数据库的最新的主要公开版本、EMBL和DDBJ数据库)中所包含的序列的相似性(采用默认参数并关闭过滤器)来评估EaD9Elo1(SEQ IDNO：13)和EaD9Elo2(SEQ ID NO：14)的氨基酸序列。为方便起见，由BLAST所计算的、观察到cDNA序列与所搜索数据库中包含的序列仅偶然匹配的P-值(概率)在本文中报导为“pLog”值，该值代表了所报导的P-值的负对数。因此，pLog值越大，cDNA序列和BLAST的“命中序列”代表同源蛋白的可能性就越大。

当与“nr”数据库进行比较时，相对于绿光等鞭金藻长链多不饱和脂肪酸延伸酶(IgD9e；SEQ ID NO：16)(NCBI编号(NCBI Accession No.)AAL37626(GI 17226123)，基因座AAL37626，CDS AF390174；Qi等人，FEBS Lett.，510：159-165(2002))，这两种序列均产生了38.70的pLog值(P值为2e-39)。BLAST打分和概率表明，本核酸片段编码整个EuglenaanabaenaΔ9脂肪酸延伸酶。

使用BlastP、Clustal V和Jotun Hein序列比较方法，将EaD9Elo1(SEQ ID NO：13)和EaD9Elo2(SEQ ID NO：14)的氨基酸序列与IgD9e(SEQ ID NO：16)和小眼虫Δ9延伸酶氨基酸序列(EgD9e；SEQID NO：4；PCT公开WO 2007/061845)进行比较。用每种方法确定的与IgD9e和EgD9e的百分比同一性分别在表4和表5中示出。

序列百分比同一性计算是通过BlastP和Clustal V方法来完成的，如上所述。用Jotun Hein方法(Hein，J.J.，Meth.Enz.，183：626-645(1990))进行的序列百分比同一性计算是用LASERGENE生物信息学计算软件包(DNASTAR Inc.，Madison，WI)的MegAlign^TM v6.1程序来完成的，该程序采用用于成对比对的默认参数(KTUPLE＝2)。

表4

EaD9Elo1(SEQ ID NO：13)和

Ead9elo2(SEQ ID NO：14)与IgD9e(SEQ ID NO：16)的序列比较

去饱和酶	通过BLASTP确定的与IgD9e的同一性百分比(％)	通过Jotun Hein方法确定的与IgD9e的同一性百分比(％)	通过Clustal V方法确定的与IgD9e的同一性百分比(％)
去饱和酶	通过BLASTP确定的与IgD9e的同一性百分比(％)	通过Jotun Hein方法确定的与IgD9e的同一性百分比(％)	通过Clustal V方法确定的与IgD9e的同一性百分比(％)	EaD9Elo1	37％	40.4％	32.9％
EaD9Elo2	37％	41.2％	32.9％	EaD9Elo1	37％	40.4％	32.9％

表5

EaD9Elo1(SEQ ID NO：13)和

EaD9Elo2(SEQ ID NO：14)与EgD9e(SEQ ID NO：4)的序列比较

去饱和酶	通过BLASTP确定的与EgD9e的同一性百分比(％)	通过Jotun Hein方法确定的与EgD9e的同一性百分比(％)	通过Clustal V方法确定的与EgD9e的同一性百分比(％)
去饱和酶	通过BLASTP确定的与EgD9e的同一性百分比(％)	通过Jotun Hein方法确定的与EgD9e的同一性百分比(％)	通过Clustal V方法确定的与EgD9e的同一性百分比(％)	EaD9Elo	77％	77.2％	77.1％
EaD9Elo2	77％	77.2％	77.1％	EaD9Elo	77％	77.2％	77.1％

实施例4

解脂耶氏酵母中Euglena anabaena UTEX 373Δ9延伸酶的功能分析

本实施例描述了EaD9Elo1(SEQ ID NO：13)和EaD9Elo2(SEQ IDNO：14)在解脂耶氏酵母中的功能分析。该工作包括如下步骤：(1)构建Gateway

-相容的耶氏酵母表达载体pY159；(2)将EaD9Elo1和EaD9Elo2转入pY159中以产生pY173和pY174；以及(3)比较含pY173和pY174的转化生物内的脂质概况。

构建Gateway -相容的耶氏酵母表达载体pY159

质粒pY5-30(其以前在美国专利7,259,255中有描述)是既可在大肠杆菌中复制又可在解脂耶氏酵母中复制的穿梭质粒。质粒pY5-30包含如下组分：耶氏酵母自主复制序列(ARS18)；ColE1质粒的复制起点；用于在大肠杆菌中选择的氨苄青霉素抗性基因(Amp^R)；用于在耶氏酵母中选择的耶氏酵母LEU2基因；以及TEF::GUS::XPR嵌合基因。质粒pDMW263(SEQ ID NO：17)由pY5-30产生，这通过使用本领域技术人员所熟知的技术将TEF启动子替换为解脂耶氏酵母FBAINm启动子(美国专利7,202,356)而实现。简而言之，该启动子指经修饰的启动子，其位于由fba1基因编码的果糖二磷酸醛缩酶(E.C.4.1.2.13)的‘ATG’翻译起始密码子前面的5’上游非翻译区，并且该启动子加上具有内含子的5’编码区部分是表达所必需的，其中FBAINm在ATG翻译起始密码子和FBAIN启动子的内含子之间具有52bp的缺失(从而只包含N端的22个氨基酸)，并且在内含子后面具有新的翻译共有基序。表6汇总了pDMW263(SEQ ID NO：17)的组分。

表6

质粒pDMW263(SEQ ID NO：17)的组分

SEQ ID NO：17内的RE位点和核苷酸	片段和嵌合基因组分的描述
SEQ ID NO：17内的RE位点和核苷酸	片段和嵌合基因组分的描述	4992-4296	ARS18序列(基因库编号A17608)
SalI/SacII(8505-2014)	FBAINm::GUS::XPR，包含：·FBAINm：解脂耶氏酵母FBAINm启动子(美国专利7,202,356)；·GUS：编码β-葡糖苷酸酶的大肠杆菌基因(Jefferson，R.A.Nature，14：342：837-838(1989))；·XPR：耶氏酵母Xpr基因(基因库编号M17741)的约100bp的3’区	4992-4296	ARS18序列(基因库编号A17608)
SalI/SacII(8505-2014)		6303-8505	耶氏酵母Leu2基因(基因库编号AF260230)

将来自pDMW263(SEQ ID NO：17)的NcoI/SalI DNA片段(其含有解脂耶氏酵母FBAINm启动子)克隆进pDMW237(SEQ ID NO：18)的NcoI/SalI DNA片段中以产生pY115(SEQ ID NO：19；图3A)，该pDMW237此前在PCT公开WO 2006/012325中有描述(因此将该专利的内容以引用的方式并入)，含有来源于绿光等鞭金藻的经密码子最优化以便在解脂耶氏酵母中表达的合成的Δ9延伸酶基因(IgD9eS)。在图3A中，经修饰的FBAINm启动子标记为FBA1+内含子，而该启动子在图3B、3C和3D中标记为YAR FBA1PRO+内含子。

使用寡核苷酸引物oYFBA1(SEQ ID NO：20)和oYFBA1-6(SEQ IDNO：21)，采用PCR从质粒pY115(SEQ ID NO：19)扩增FBAINm启动子。引物oYFBA1(SEQ ID NO：20)被设计成在启动子的5’端引入BglII位点，而引物oYFBA1-6(SEQ ID NO：21)被设计成在启动子的3’端引入NotI位点，同时移除NcoI位点，并因而移除了ATG起始密码子。将所得PCR片段用BglII和NotI消化，并克隆进pY115的BglII/NotI片段(其含有载体骨架)中以形成pY158(SEQ ID NO：22)。

将质粒pY158(SEQ ID NO：22)用NotI消化，并补足所产生的DNA末端。在补足而形成平端后，将该DNA片段用牛小肠碱性磷酸酶处理并用琼脂糖凝胶电泳分离。从琼脂糖凝胶中切下6992bp的含有解脂耶氏酵母FBAINm启动子的片段并用QIAquick

Gel Extraction试剂盒(Qiagen Inc，Valencia，CA)按照制造商的规程进行纯化。使用GatewayVector Conversion System(目录号11823-029，Invitrogen Corporation)，按照制造商的规程将纯化过的6992bp片段与rfA盒连接，以形成解脂耶氏酵母Gateway

目的载体(destination vector)pY159(SEQ ID NO：23；图3B)。

构建耶氏酵母表达载体pY173和pY174

使用GatewayLR Clonase^TMII酶混合物(目录号11791-020，InvitrogenCorporation)，按照制造商的规程将来自pLF121-1(SEQ ID NO：9；实施例2)和pLF121-2(SEQ ID NO：10；实施例2)的cDNA插入物转进pY159(SEQ ID NO：23)中，以分别形成pY173(SEQ ID NO：24；图3C)和pY174(SEQ ID NO：25；图3D)。

EaD9Elo1和EaD9Elo2在解脂耶氏酵母菌株Y2224中的功能分析以如下方式分离菌株Y2224：将来自YPD琼脂平板(1％酵母提取物、2％细菌用蛋白胨、2％葡萄糖、2％琼脂)的解脂耶氏酵母ATCC#20362细胞划线接种至含250mg/L 5-FOA(Zymo Research)的MM平板(尿嘧啶和尿苷各75mg/L，6.7g/L具有硫酸铵且无氨基酸的YNB，以及20g/L葡萄糖)上。将平板在28℃下孵育并将四个得到的菌落分别贴在含有200mg/mL 5-FOA的MM平板上和无尿嘧啶和尿苷的MM平板上以确定尿嘧啶Ura3营养缺陷型。

如在“一般方法”中所述，将菌株Y2224用pY173(SEQ ID NO：24；图3C)和pY174(SEQ ID NO：25；图3D)转化。

使含有pY173和pY174的解脂耶氏酵母转化株的单菌落在不含尿嘧啶的3mL极限培养基中于30℃生长16h，之后，将细胞以250rpm离心以形成沉淀。将细胞用水洗涤一次，通过离心沉淀并风干。在50℃下用500μL 1％的甲醇钠对该沉淀进行酯交换反应(Roughan，G.和Nishida，I.，Arch.Biochem.Biophys.，276(1)：38-46(1990))30分钟，之后加入500μL 1M的氯化钠和100μL庚烷。在彻底混合并离心后，通过GC来分析脂肪酸甲酯(FAME)。使用配有Omegawax 320熔融石英毛细柱的Hewlett-Packard 6890气相色谱(目录号24152，Supelco Inc.)对FAME(从己烷层取5μL注射上样)进行分离和定量。用程序控制烘箱温度在220℃保持2.6分钟，以20℃/分钟升温至240℃，然后另外保持2.4分钟。载气通过Whatman氢发生器供应。将保留时间与那些市售的甲酯标准样品(Nu-Chek Prep，Inc)的保留时间进行比较。

表达pY173和pY174的解脂耶氏酵母的脂肪酸概况在表7中示出。脂肪酸确定为16:0、16:1、18:0、18:1(油酸)、LA、20:0、20:1(11)、EDA、22:0、24:0和24:1。通过如下方式计算Δ9延长百分比(Δ9％Elong)：将EDA的重量百分比除以EDA和LA的总重量百分比再乘以100以表示为百分比形式。Ave表示平均值。

表7

表达pY173(EaD9Elo1)和pY174(EaD9Elo2)的解脂耶氏酵母的脂肪酸组分(重量％)

实施例5

用于解脂耶氏酵母的经密码子最优化的Δ9延伸酶基因(EaD9ES)的合成

以与PCT公开WO 2004/101753和美国专利7,125,672中所描述的类似方式，将Euglena anabaena的Δ9延伸酶基因(EaD9Elo1)的密码子使用最优化以便在解脂耶氏酵母中表达。具体地讲，基于EaD9Elo1(SEQID NO：11)的编码序列，根据耶氏酵母密码子使用模式(PCT公开WO 2004/101753)、‘ATG’翻译起始密码子周围的共有序列以及RNA稳定性的一般规则(Guhaniyogi，G.和J.Brewer，Gene，265(1-2)：11-23(2001))，设计经密码子最优化的Δ9延伸酶基因(称为“EaD9ES”，SEQ ID NO：26)。除了修饰翻译起始位点之外，还对774bp编码区中的106bp进行了修饰(13.7％)并最优化了98个密码子(38.0％)。野生型基因(即EaD9Elo1)和合成基因(即EaD9ES)的GC含量(52.1％)几乎相同。分别将NcoI位点和NotI位点整合到EaD9ES(SEQ ID NO：26)的翻译起始密码子的周围和终止密码子之后。图4A和4B示出了EaD9Elo1(SEQ ID NO：11)和EaD9ES(SEQ ID NO：26)的核苷酸序列的比较。由经密码子最优化的基因编码的蛋白质序列(即SEQ ID NO：27)与野生型蛋白质序列(即SEQ ID NO：13)相同。设计的EaD9ES基因由GenScript Corporation(Piscataway，NJ)合成并将其克隆到pUC57(基因库编号Y14837)中，以产生pEaD9ES(SEQ ID NO：28；图5A)。

实施例6

包含经密码子最优化以在解脂耶氏酵母中表达的合成的Δ9延伸酶基因(来源于Euglena anabaena)(EaD9ES)的解脂耶氏酵母表达载体 pZUFmEaD9ES的构建和功能分析

本实施例描述了包含FBAINm::EaD9ES::Pex20嵌合基因的解脂耶氏酵母载体pZUFmEaD9ES的功能性表达，其中EaD9ES是来源于Euglena anabaena的经密码子最优化以便在耶氏酵母属中表达的合成的Δ9延伸酶。质粒pZUFmEaD9ES(图5B)含有如下组分：

表8

质粒pZUFmEaD9ES(SEQ ID NO：29)的组分

SEQ ID NO：29内的RE位点和核苷酸	片段和嵌合基因组分的描述
SEQ ID NO：29内的RE位点和核苷酸	片段和嵌合基因组分的描述	Swa I/BsiW I(6067-318)	FBAINm::EaD9ES::Pex20，包含·FBAINm：解脂耶氏酵母FBAIN启动子(美国专利7,202,356)·EaD9ES：来源于Euglena anabaena的经密码子最优化的Δ9延伸酶(SEQ ID NO：26)·Pex20：耶氏酵母Pex20基因(基因库编号AF054613)的Pex20终止子序列
1354-474	ColE1质粒复制起点	Swa I/BsiW I(6067-318)
1354-474	ColE1质粒复制起点	2284-1424	用于在大肠杆菌中选择的氨苄青霉素抗性基因(Amp^R)
3183-4487	耶氏酵母自主复制序列(ARS18；基因库编号A17608)	2284-1424	用于在大肠杆菌中选择的氨苄青霉素抗性基因(Amp^R)
3183-4487	耶氏酵母自主复制序列(ARS18；基因库编号A17608)	6031-4530	耶氏酵母Ura 3基因(基因库编号AJ306421)

包含pZUFmEaD9ES的解脂耶氏酵母转化株的功能分析

如“一般方法”中所述，将质粒pZUFmEaD9ES转化进菌株Y2224(由野生型耶氏酵母菌株ATCC#20362的Ura3基因自发突变而产生的FOA抗性突变体)中。在MM平板上选择转化株。在30℃下培育2天后，挑取转化株并将其再次划线至新鲜的MM平板上。生长之后，将这些菌株单个地接种在30℃下的3mL液体MM中，以250rpm/min摇动2天。离心收集细胞，提取脂质，通过酯交换反应来制备脂肪酸甲酯，并随后用Hewlett-Packard 6890GC进行分析。

GC分析显示，在所有5个转化株中产生了占总脂质约2.2％的C20:2(EDA)和15.3％的C18:2(LA)，其中测得这5个菌株中C18:2转化成C20:2的转化效率为约13％。因此，该实验数据表明，经密码子最优化以便在解脂耶氏酵母中表达的合成的Euglena anabaenaΔ9延伸酶(即EaD9ES，在SEQ ID NO：26和27中示出)有效地将LA延长成了EDA。

序列表

<110>E.I.duPont de Nemours and Company，Inc.

<120>Δ9延伸酶及其在制备多不饱和脂肪酸中的用途

<130>CL3923

<150>US 60/911,925

<151>2007-04-16

<160>29

<170>PatentIn版本3.4

<210>1

<211>1129

<212>DNA

<213>Euglenaanabaena

<400>1

tttttttcgg tctaaaatgg aagcagccaa agaattggtt tccatcgtcc aagaggagct 60

ccccaaggtg gactatgccc agctttggca ggatgccagc agctgtgagg tcctttacct 120

ctcggtggca ttcgtggcga tcaagttcat gctgcgccca ctggacctga agcgccaggc 180

caccttgaag aagctgttca cagcatacaa cttcctcatg tcgatctatt cctttggctc 240

cttcctggcc atggcctatg ccctatcagt aactggcatc ctctccggcg actgtgagac 300

ggcgttcaac aacgatgtgt tcaggatcac aactcagctg ttctacctca gcaagttcgt 360

agagtacatc gactccttct accttcccct tatggacaag ccactgtcgt tccttcagtt 420

cttccatcat ttgggggccc ccattgacat gtggctattc tacaaatacc gcaacgaagg 480

agtctggatc tttgtcctgt tgaatgggtt cattcactgg atcatgtacg gttactattg 540

gacgcggctc atcaagctga acttccccat gcccaagaac ctgatcacct ccatgcagat 600

catccagttc aatgtcgggt tctacatcgt ctggaagtac cgcaatgtgc catgctaccg 660

ccaggatggg atgcgcatgt ttgcctggat cttcaactac tggtatgtcg ggacggtctt 720

gctgctgttc ctcaactttt acgtgcagac gtacatccgg aagccgagga agaaccgagg 780

gaagaaggag taggccacat ggcgcctgcg ctggaggaaa cggtacgctc ggatggtgca 840

ctgcacttgc actccgccgt ttctagcctc ccctcgctct aaccactgcg gcatgcctgc 900

ttgaggcgtg acgttgcctc gtatgataca gtttacaccc ttcccacagc ccacggagct 960

ggtgactgtt tccagcgtct gcagatcatt gatctggtgc aatgtgcaca gaccaagccc 1020

ctctaacgtc ttgcggtgta ccgctcgaca ctcactgcaa gagacagatg gctgagcatg 1080

ttatagcccc ttacattcta cccttcgtcc caacctgacc gtcacattc 1129

<210>2

<211>1145

<212>DNA

<213>Euglena anabaena

<400>2

attttttttc ggtctaaaat ggaagcagcc aaagaattgg tttccatcgt ccaagaggag 60

ctccccaagg tggactatgc ccagctttgg caggacgcca gcagctgtga ggtcctttac 120

ctctcggtgg cattcgtggc gatcaagttc atgctgcgcc cactggacct gaagcgccag 180

gccaccttga agaagctgtt cacagcatac aacttcctca tgtcgatcta ttcctttggc 240

tccttcctgg ccatggccta tgccctatca gtaactggca tcctctccgg cgactgtgag 300

acagcgttca acaacgatgt gttcaggatc acaactcagc tgttctacct cagcaagttc 360

gtagagtaca tcgactcctt ctaccttccc cttatggaca agccactgtc gttccttcag 420

ttcttccatc atttgggggc tcccattgac atgtggctat tctacaaata ccgcaacgaa 480

ggagtctgga tctttgtcct gttgaatggg ttcattcact ggatcatgta cggttactac 540

tggacgcggc tcatcaagct gaacttcccc atgcccaaga acctgatcac ctccatgcag 600

atcatccagt tcaatgtcgg gttctacatc gtctggaagt accgcaatgt gccatgctac 660

cgccaggatg ggatgcgcat gtttgcctgg atcttcaact actggtacgt cgggacggtc 720

ttgctgctgt tcctcaactt ttacgtgcag acgtacatcc ggaagccgag gaagaaccaa 780

gggaagaagg agtaggccac atggcgcctg cgctggagga aacggtacgc tcggatggtg 840

cactgcactt gcactccgcc gcttctagcc tcccctcgct ctaacctctg cgacatgcct 900

gcttgaggcg tgacgttgcc tcgtgcgata cagtttacac ccttcccatg gcccacggag 960

caggtgactg tctccagcgt ctgcaattct gatcattggt ctggtgcaat gtgcgcagac 1020

caagcccctc taacgtcttg cggtgtaccg ctcgacactc actgcacgag acagatggct 1080

gagcatgtta tagcccctga cattctaccc ttcgtcctta cctgaccgtc acattcatgc 1140

ttacc 1145

<210>3

<211>774

<212>DNA

<213>小眼虫

<220>

<221>CDS

<222>(1)..(774)

<223>Δ9延伸酶

<300>

<302>Δ9延伸酶及其在制备多不饱和脂肪酸中的用途

<310>WO 2007/061742

<311>2006-11-16

<312>2007-05-31

<313>(1)..(774)

<300>

<302>Δ9延伸酶及其在制备多不饱和脂肪酸中的用途

<310>US 2007-0117190-A1

<311>2006-1116

<312>2007-05-24

<313>(1)..(774)

<400>3

atg gag gtg gtg aat gaa ata gtc tca att ggg cag gaa gtt tta ccc 48

Met Glu Val Val Asn Glu Ile Val Ser Ile Gly Gln Glu Val Leu Pro

1 5 10 15

aaa gtt gat tat gcc caa ctc tgg agt gat gcc agt cac tgt gag gtg 96

Lys Val Asp Tyr Ala Gln Leu Trp Ser Asp Ala Ser His Cys Glu Val

20 25 30

ctt tac ttg tcc atc gca ttt gtc atc ttg aag ttc act ctt ggc ccc 144

Leu Tyr Leu Ser Ile Ala Phe Va1 Ile Leu Lys Phe Thr Leu Gly Pro

35 40 45

ctt ggt cca aaa ggt cag tct cgt atg aag ttt gtt ttc acc aat tac 192

Leu Gly Pro Lys Gly Gln Ser Arg Met Lys Phe Val Phe Thr Asn Tyr

50 55 60

aac ctt ctc atg tcc att tat tcg ttg gga tca ttc ctc tca atg gca 240

Asn Leu Leu Met Ser Ile Tyr Ser Leu Gly Ser Phe Leu Ser Met Ala

65 70 75 80

tat gcc atg tac acc atc ggt gtt atg tct gac aac tgc gag aag gct 288

Tyr Ala Met Tyr Thr Ile Gly Val Met Ser Asp Asn Cys Glu Lys Ala

85 90 95

ttt gac aac aac gtc ttc agg atc acc acg cag ttg ttc tat ttg agc 336

Phe Asp Asn Asn Val Phe Arg Ile Thr Thr Gln Leu Phe Tyr Leu Ser

100 105 110

aag ttc ctg gag tat att gac tcc ttc tat ttg cca ctg atg ggc aag 384

Lys Phe Leu Glu Tyr Ile Asp Ser Phe Tyr Leu Pro Leu Met Gly Lys

115 120 125

cct ctg acc tgg ttg caa ttc ttc cat cat ttg ggg gca ccg atg gat 432

Pro Leu Thr Trp Leu Gln Phe Phe His His Leu Gly Ala Pro Met Asp

130 135 140

atg tgg ctg ttc tat aat tac cga aat gaa gct gtt tgg att ttt gtg 480

Met Trp Leu Phe Tyr Asn Tyr Arg Asn Glu Ala Val Trp Ile Phe Val

145 150 155 160

ctg ttg aat ggt ttc atc cac tgg atc atg tac ggt tat tat tgg acc 528

Leu Leu Asn Gly Phe Ile His Trp Ile Met Tyr Gly Tyr Tyr Trp Thr

165 170 175

aga ttg atc aag ctg aag ttc ccc atg cca aaa tcc ctg att aca tca 576

Arg Leu Ile Lys Leu Lys Phe Pro Met Pro Lys Ser Leu Ile Thr Ser

180 185 190

atg cag atc att caa ttc aat gtt ggt ttc tac att gtc tgg aag tac 624

Met Gln Ile Ile Gln Phe Asn Val Gly Phe Tyr Ile Val Trp Lys Tyr

195 200 205

agg aac att ccc tgt tat cgc caa gat ggg atg agg atg ttt ggc tgg 672

Arg Asn Ile Pro Cys Tyr Arg Gln Asp Gly Met Arg Met Phe Gly Trp

210 215 220

ttc ttc aat tac ttt tat gtt ggc aca gtc ttg tgt ttg ttc ttg aat 720

Phe Phe Asn Tyr Phe Tyr Val Gly Thr Val Leu Cys Leu Phe Leu Asn

225 230 235 240

ttc tat gtg caa acg tat atc gtc agg aag cac aag gga gcc aaa aag 768

Phe Tyr Val Gln Thr Tyr Ile Val Arg Lys His Lys Gly Ala Lys Lys

245 250 255

att cag 774

Ile Gln

<210>4

<211>258

<212>PRT

<213>小眼虫

<400>4

Met Glu Val Val Asn Glu Ile Val Ser Ile Gly Gln Glu Val Leu Pro

1 5 10 15

Lys Val Asp Tyr Ala Gln Leu Trp Ser Asp Ala Ser His Cys Glu Val

20 25 30

Leu Tyr Leu Ser Ile Ala Phe Val Ile Leu Lys Phe Thr Leu Gly Pro

35 40 45

Leu Gly Pro Lys Gly Gln Ser Arg Met Lys Phe Val Phe Thr Asn Tyr

50 55 60

Asn Leu Leu Met Ser Ile Tyr Ser Leu Gly Ser Phe Leu Ser Met Ala

65 70 75 80

Tyr Ala Met Tyr Thr Ile Gly Val Met Ser Asp Asn Cys Glu Lys Ala

85 90 95

Phe Asp Asn Asn Val Phe Arg Ile Thr Thr Gln Leu Phe Tyr Leu Ser

100 105 110

Lys Phe Leu Glu Tyr Ile Asp Ser Phe Tyr Leu Pro Leu Met Gly Lys

115 120 125

Pro Leu Thr Trp Leu Gln Phe Phe His His Leu Gly Ala Pro Met Asp

130 135 140

Met Trp Leu Phe Tyr Asn Tyr Arg Asn Glu Ala Val Trp Ile Phe Val

145 150 155 160

Leu Leu Asn Gly Phe Ile His Trp Ile Met Tyr Gly Tyr Tyr Trp Thr

165 170 175

Arg Leu Ile Lys Leu Lys Phe Pro Met Pro Lys Ser Leu Ile Thr Ser

180 185 190

Met Gln Ile Ile Gln Phe Asn Val Gly Phe Tyr Ile Val Trp Lys Tyr

195 200 205

Arg Asn Ile Pro Cys Tyr Arg Gln Asp Gly Met Arg Met Phe Gly Trp

210 215 220

Phe Phe Asn Tyr Phe Tyr Val Gly Thr Val Leu Cys Leu Phe Leu Asn

225 230 235 240

Phe Tyr Val Gln Thr Tyr Ile Val Arg Lys His Lys Gly Ala Lys Lys

245 250 255

Ile Gln

<210>5

<211>30

<212>DNA

<213>人工序列

<220>

<223>有义寡核苷酸oEugEL1-1

<400>5

agcggccgca ccatggaggt ggtgaatgaa 30

<210>6

<211>30

<212>DNA

<213>人工序列

<220>

<223>有义寡核苷酸oEugEL1-2

<400>6

tgcggccgct cactgaatct ttttggctcc 30

<210>7

<211>18

<212>DNA

<213>人工序列

<220>

<223>M13F通用引物

<400>7

tgtaaaacga cggccagt 18

<210>8

<211>22

<212>DNA

<213>人工序列

<220>

<223>引物M1328Rev

<400>8

gtaatacgac tcactatagg gc 22

<210>9

<211>3668

<212>DNA

<213>人工序列

<220>

<223>质粒pLF121-1

<220>

<221>misc_feature

<222>(3616)..(3655)

<223>n为a，c，g，或t

<400>9

gtacaaagtt ggcattataa gaaagcattg cttatcaatt tgttgcaacg aacaggtcac 60

tatcagtcaa aataaaatca ttatttgcca tccagctgat atcccctata gtgagtcgta 120

ttacatggtc atagctgttt cctggcagct ctggcccgtg tctcaaaatc tctgatgtta 180

cattgcacaa gataaaaata tatcatcatg ttagaaaaac tcatcgagca tcaaatgaaa 240

ctgcaattta ttcatatcag gattatcaat accatatttt tgaaaaagcc gtttctgtaa 300

tgaaggagaa aactcaccga ggcagttcca taggatggca agatcctggt atcggtctgc 360

gattccgact cgtccaacat caatacaacc tattaatttc ccctcgtcaa aaataaggtt 420

atcaagtgag aaatcaccat gagtgacgac tgaatccggt gagaatggca aaagcttatg 480

catttctttc cagacttgtt caacaggcca gccattacgc tcgtcatcaa aatcactcgc 540

atcaaccaaa ccgttattca ttcgtgattg cgcctgagcg agacgaaata cgcgatcgct 600

gttaaaagga caattacaaa caggaatcga atgcaaccgg cgcaggaaca ctgccagcgc 660

atcaacaata ttttcacctg aatcaggata ttcttctaat acctggaatg ctgttttccc 720

ggggatcgca gtggtgagta accatgcatc atcaggagta cggataaaat gcttgatggt 780

cggaagaggc ataaattccg tcagccagtt tagtctgacc atctcatctg taacatcatt 840

ggcaacgcta cctttgccat gtttcagaaa caactctggc gcatcgggct tcccatacaa 900

tcgatagatt gtcgcacctg attgcccgac attatcgcga gcccatttat acccatataa 960

atcagcatcc atgttggaat ttaatcgcgg cctcgagcaa gacgtttccc gttgaatatg 1020

gctcatagat cttttctcca tcactgatag ggagtggtaa aataactcca tcaatgatag 1080

agtgtcaaca acatgaccaa aatcccttaa cgtgagttac gcgtattaat tgcgttgcgc 1140

tcactgcccg ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa 1200

cgcgcgggga gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg 1260

ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg 1320

ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag 1380

gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac 1440

gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga 1500

taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt 1560

accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca atgctcacgc 1620

tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc 1680

cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta 1740

agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat 1800

gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggttacac tagaagaaca 1860

gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct 1920

tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt 1980

acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct 2040

cagggaacga cgcgtaccgc tagccaggaa gagtttgtag aaacgcaaaa aggccatccg 2100

tcaggatggc cttctgctta gtttgatgcc tggcagttta tggcgggcgt cctgcccgcc 2160

accctccggg ccgttgcttc acaacgttca aatccgctcc cggcggattt gtcctactca 2220

ggagagcgtt caccgacaaa caacagataa aacgaaaggc ccagtcttcc gactgagcct 2280

ttcgttttat ttgatgcctg gcagttccct actctcgcgt taacgctagc atggatgttt 2340

tcccagtcac gacgttgtaa aacgacggcc agtcttaagc tcgggcccca aataatgatt 2400

ttattttgac tgatagtgac ctgttcgttg caacaaattg atgagcaatg cttttttata 2460

atgccaactt tgtacaaaaa agttggtttt tttcggtcta aaatggaagc agccaaagaa 2520

ttggtttcca tcgtccaaga ggagctcccc aaggtggact atgcccagct ttggcaggat 2580

gccagcagct gtgaggtcct ttacctctcg gtggcattcg tggcgatcaa gttcatgctg 2640

cgcccactgg acctgaagcg ccaggccacc ttgaagaagc tgttcacagc atacaacttc 2700

ctcatgtcga tctattcctt tggctccttc ctggccatgg cctatgccct atcagtaact 2760

ggcatcctct ccggcgactg tgagacggcg ttcaacaacg atgtgttcag gatcacaact 2820

cagctgttct acctcagcaa gttcgtagag tacatcgact ccttctacct tccccttatg 2880

gacaagccac tgtcgttcct tcagttcttc catcatttgg gggcccccat tgacatgtgg 2940

ctattctaca aataccgcaa cgaaggagtc tggatctttg tcctgttgaa tgggttcatt 3000

cactggatca tgtacggtta ctattggacg cggctcatca agctgaactt ccccatgccc 3060

aagaacctga tcacctccat gcagatcatc cagttcaatg tcgggttcta catcgtctgg 3120

aagtaccgca atgtgccatg ctaccgccag gatgggatgc gcatgtttgc ctggatcttc 3180

aactactggt atgtcgggac ggtcttgctg ctgttcctca acttttacgt gcagacgtac 3240

atccggaagc cgaggaagaa ccgagggaag aaggagtagg ccacatggcg cctgcgctgg 3300

aggaaacggt acgctcggat ggtgcactgc acttgcactc cgccgtttct agcctcccct 3360

cgctctaacc actgcggcat gcctgcttga ggcgtgacgt tgcctcgtat gatacagttt 3420

acacccttcc cacagcccac ggagctggtg actgtttcca gcgtctgcag atcattgatc 3480

tggtgcaatg tgcacagacc aagcccctct aacgtcttgc ggtgtaccgc tcgacactca 3540

ctgcaagaga cagatggctg agcatgttat agccccttac attctaccct tcgtcccaac 3600

ctgaccgtca cattcnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnaccca 3660

actttctt 3668

<210>10

<211>3684

<212>DNA

<213>人工序列

<220>

<223>质粒pLF121-2

<220>

<221>misc_feature

<222>(3632)..(3671)

<223>n为a，c，g，或t

<400>10

gtacaaagtt ggcattataa gaaagcattg cttatcaatt tgttgcaacg aacaggtcac 60

tatcagtcaa aataaaatca ttatttgcca tccagctgat atcccctata gtgagtcgta 120

ttacatggtc atagctgttt cctggcagct ctggcccgtg tctcaaaatc tctgatgtta 180

cattgcacaa gataaaaata tatcatcatg ttagaaaaac tcatcgagca tcaaatgaaa 240

ctgcaattta ttcatatcag gattatcaat accatatttt tgaaaaagcc gtttctgtaa 300

tgaaggagaa aactcaccga ggcagttcca taggatggca agatcctggt atcggtctgc 360

gattccgact cgtccaacat caatacaacc tattaatttc ccctcgtcaa aaataaggtt 420

atcaagtgag aaatcaccat gagtgacgac tgaatccggt gagaatggca aaagattatg 480

catttctttc cagacttgtt caacaggcca gccattacgc tcgtcatcaa aatcactcgc 540

atcaaccaaa ccgttattca ttcgtgattg cgcctgagcg agacgaaata cgcgatcgct 600

gttaaaagga caattacaaa caggaatcga atgcaaccgg cgcaggaaca ctgccagcgc 660

atcaacaata ttttcacctg aatcaggata ttcttctaat acctggaatg ctgttttccc 720

ggggatcgca gtggtgagta accatgcatc atcaggagta cggataaaat gcttgatggt 780

cggaagaggc ataaattccg tcagccagtt tagtctgacc atctcatctg taacatcatt 840

ggcaacgcta cctttgccat gtttcagaaa caactctggc gcatcgggct tcccatacaa 900

tcgatagatt gtcgcacctg attgcccgac attatcgcga gcccatttat acccatataa 960

atcagcatcc atgttggaat ttaatcgcgg cctcgagcaa gacgtttccc gttgaatatg 1020

gctcatagat cttttctcca tcactgatag ggagtggtaa aataactcca tcaatgatag 1080

agtgtcaaca acatgaccaa aatcccttaa cgtgagttac gcgtattaat tgcgttgcgc 1140

tcactgcccg ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa 1200

cgcgcgggga gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg 1260

ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg 1320

ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag 1380

gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac 1440

gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga 1500

taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt 1560

accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca atgctcacgc 1620

tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc 1680

cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta 1740

agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat 1800

gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggttacac tagaagaaca 1860

gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct 1920

tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt 1980

acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct 2040

cagggaacga cgcgtaccgc tagccaggaa gagtttgtag aaacgcaaaa aggccatccg 2100

tcaggatggc cttctgctta gtttgatgcc tggcagttta tggcgggcgt cctgcccgcc 2160

accctccggg ccgttgcttc acaacgttca aatccgctcc cggcggattt gtcctactca 2220

ggagagcgtt caccgacaaa caacagataa aacgaaaggc ccagtcttcc gactgagcct 2280

ttcgttttat ttgatgcctg gcagttccct actctcgcgt taacgctagc atggatgttt 2340

tcccagtcac gacgttgtaa aacgacggcc agtcttaagc tcgggcccca aataatgatt 2400

ttattttgac tgatagtgac ctgttcgttg caacaaattg atgagcaatg cttttttata 2460

atgccaactt tgtacaaaaa agttggattt tttttcggtc taaaatggaa gcagccaaag 2520

aattggtttc catcgtccaa gaggagctcc ccaaggtgga ctatgcccag ctttggcagg 2580

acgccagcag ctgtgaggtc ctttacctct cggtggcatt cgtggcgatc aagttcatgc 2640

tgcgcccact ggacctgaag cgccaggcca ccttgaagaa gctgttcaca gcatacaact 2700

tcctcatgtc gatctattcc tttggctcct tcctggccat ggcctatgcc ctatcagtaa 2760

ctggcatcct ctccggcgac tgtgagacag cgttcaacaa cgatgtgttc aggatcacaa 2820

ctcagctgtt ctacctcagc aagttcgtag agtacatcga ctccttctac cttcccctta 2880

tggacaagcc actgtcgttc cttcagttct tccatcattt gggggctccc attgacatgt 2940

ggctattcta caaataccgc aacgaaggag tctggatctt tgtcctgttg aatgggttca 3000

ttcactggat catgtacggt tactactgga cgcggctcat caagctgaac ttccccatgc 3060

ccaagaacct gatcacctcc atgcagatca tccagttcaa tgtcgggttc tacatcgtct 3120

ggaagtaccg caatgtgcca tgctaccgcc aggatgggat gcgcatgttt gcctggatct 3180

tcaactactg gtacgtcggg acggtcttgc tgctgttcct caacttttac gtgcagacgt 3240

acatccggaa gccgaggaag aaccaaggga agaaggagta ggccacatgg cgcctgcgct 3300

ggaggaaacg gtacgctcgg atggtgcact gcacttgcac tccgccgctt ctagcctccc 3360

ctcgctctaa cctctgcgac atgcctgctt gaggcgtgac gttgcctcgt gcgatacagt 3420

ttacaccctt cccatggccc acggagcagg tgactgtctc cagcgtctgc aattctgatc 3480

attggtctgg tgcaatgtgc gcagaccaag cccctctaac gtcttgcggt gtaccgctcg 3540

acactcactg cacgagacag atggctgagc atgttatagc ccctgacatt ctacccttcg 3600

tccttacctg accgtcacat tcatgcttac cnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3660

nnnnnnnnnn nacccaactt tctt 3684

<210>11

<211>774

<212>DNA

<213>Euglena anabaena

<400>11

atggaagcag ccaaagaatt ggtttccatc gtccaagagg agctccccaa ggtggactat 60

gcccagcttt ggcaggatgc cagcagctgt gaggtccttt acctctcggt ggcattcgtg 120

gcgatcaagt tcatgctgcg cccactggac ctgaagcgcc aggccacctt gaagaagctg 180

ttcacagcat acaacttcct catgtcgatc tattcctttg gctccttcct ggccatggcc 240

tatgccctat cagtaactgg catcctctcc ggcgactgtg agacggcgtt caacaacgat 300

gtgttcagga tcacaactca gctgttctac ctcagcaagt tcgtagagta catcgactcc 360

ttctaccttc cccttatgga caagccactg tcgttccttc agttcttcca tcatttgggg 420

gcccccattg acatgtggct attctacaaa taccgcaacg aaggagtctg gatctttgtc 480

ctgttgaatg ggttcattca ctggatcatg tacggttact attggacgcg gctcatcaag 540

ctgaacttcc ccatgcccaa gaacctgatc acctccatgc agatcatcca gttcaatgtc 600

gggttctaca tcgtctggaa gtaccgcaat gtgccatgct accgccagga tgggatgcgc 660

atgtttgcct ggatcttcaa ctactggtat gtcgggacgg tcttgctgct gttcctcaac 720

ttttacgtgc agacgtacat ccggaagccg aggaagaacc gagggaagaa ggag 774

<210>12

<211>774

<212>DNA

<213>Euglena anabaena

<400>12

atggaagcag ccaaagaatt ggtttccatc gtccaagagg agctccccaa ggtggactat 60

gcccagcttt ggcaggacgc cagcagctgt gaggtccttt acctctcggt ggcattcgtg 120

gcgatcaagt tcatgctgcg cccactggac ctgaagcgcc aggccacctt gaagaagctg 180

ttcacagcat acaacttcct catgtcgatc tattcctttg gctccttcct ggccatggcc 240

tatgccctat cagtaactgg catcctctcc ggcgactgtg agacagcgtt caacaacgat 300

gtgttcagga tcacaactca gctgttctac ctcagcaagt tcgtagagta catcgactcc 360

ttctaccttc cccttatgga caagccactg tcgttccttc agttcttcca tcatttgggg 420

gctcccattg acatgtggct attctacaaa taccgcaacg aaggagtctg gatctttgtc 480

ctgttgaatg ggttcattca ctggatcatg tacggttact actggacgcg gctcatcaag 540

ctgaacttcc ccatgcccaa gaacctgatc acctccatgc agatcatcca gttcaatgtc 600

gggttctaca tcgtctggaa gtaccgcaat gtgccatgct accgccagga tgggatgcgc 660

atgtttgcct ggatcttcaa ctactggtac gtcgggacgg tcttgctgct gttcctcaac 720

ttttacgtgc agacgtacat ccggaagccg aggaagaacc aagggaagaa ggag 774

<210>13

<211>258

<212>PRT

<213>Euglena anabaena

<400>13

Met Glu Ala Ala Lys Glu Leu Val Ser Ile Val Gln Glu Glu Leu Pro

1 5 10 15

Lys Val Asp Tyr Ala Gln Leu Trp Gln Asp Ala Ser Ser Cys Glu Val

20 25 30

Leu Tyr Leu Ser Val Ala Phe Val Ala Ile Lys Phe Met Leu Arg Pro

35 40 45

Leu Asp Leu Lys Arg Gln Ala Thr Leu Lys Lys Leu Phe Thr Ala Tyr

50 55 60

Asn Phe Leu Met Ser Ile Tyr Ser Phe Gly Ser Phe Leu Ala Met Ala

65 70 75 80

Tyr Ala Leu Ser Val Thr Gly Ile Leu Ser Gly Asp Cys Glu Thr Ala

85 90 95

Phe Asn Asn Asp Val Phe Arg Ile Thr Thr Gln Leu Phe Tyr Leu Ser

100 105 110

Lys Phe Val Glu Tyr Ile Asp Ser Phe Tyr Leu Pro Leu Met Asp Lys

115 120 125

Pro Leu Ser Phe Leu Gln Phe Phe His His Leu Gly Ala Pro Ile Asp

130 135 140

Met Trp Leu Phe Tyr Lys Tyr Arg Asn Glu Gly Val Trp Ile Phe Val

145 150 155 160

Leu Leu Asn Gly Phe Ile His Trp Ile Met Tyr Gly Tyr Tyr Trp Thr

165 170 175

Arg Leu Ile Lys Leu Asn Phe Pro Met Pro Lys Asn Leu Ile Thr Ser

180 185 190

Met Gln Ile Ile Gln Phe Asn Val Gly Phe Tyr Ile Val Trp Lys Tyr

195 200 205

Arg Asn Val Pro Cys Tyr Arg Gln Asp Gly Met Arg Met Phe Ala Trp

210 215 220

Ile Phe Asn Tyr Trp Tyr Val Gly Thr Val Leu Leu Leu Phe Leu Asn

225 230 235 240

Phe Tyr Val Gln Thr Tyr Ile Arg Lys Pro Arg Lys Asn Arg Gly Lys

245 250 255

Lys Glu

<210>14

<211>258

<212>PRT

<213>Euglena anabaena

<400>14

Met Glu Ala Ala Lys Glu Leu Val Ser Ile Val Gln Glu Glu Leu Pro

1 5 10 15

Lys Val Asp Tyr Ala Gln Leu Trp Gln Asp Ala Ser Ser Cys Glu Val

20 25 30

Leu Tyr Leu Ser Val Ala Phe Val Ala Ile Lys Phe Met Leu Arg Pro

35 40 45

Leu Asp Leu Lys Arg Gln Ala Thr Leu Lys Lys Leu Phe Thr Ala Tyr

50 55 60

Asn Phe Leu Met Ser Ile Tyr Ser Phe Gly Ser Phe Leu Ala Met Ala

65 70 75 80

Tyr Ala Leu Ser Val Thr Gly Ile Leu Ser Gly Asp Cys Glu Thr Ala

85 90 95

Phe Asn Asn Asp Val Phe Arg Ile Thr Thr Gln Leu Phe Tyr Leu Ser

100 105 110

Lys Phe Val Glu Tyr Ile Asp Ser Phe Tyr Leu Pro Leu Met Asp Lys

115 120 125

Pro Leu Ser Phe Leu Gln Phe Phe His His Leu Gly Ala Pro Ile Asp

130 135 140

Met Trp Leu Phe Tyr Lys Tyr Arg Asn Glu Gly Val Trp Ile Phe Val

145 150 155 160

Leu Leu Asn Gly Phe Ile His Trp Ile Met Tyr Gly Tyr Tyr Trp Thr

165 170 175

Arg Leu Ile Lys Leu Asn Phe Pro Met Pro Lys Asn Leu Ile Thr Ser

180 185 190

Met Gln Ile Ile Gln Phe Asn Val Gly Phe Tyr Ile Val Trp Lys Tyr

195 200 205

Arg Asn Val Pro Cys Tyr Arg Gln Asp Gly Met Arg Met Phe Ala Trp

210 215 220

Ile Phe Asn Tyr Trp Tyr Val Gly Thr Val Leu Leu Leu Phe Leu Asn

225 230 235 240

Phe Tyr Val Gln Thr Tyr Ile Arg Lys Pro Arg Lys Asn Gln Gly Lys

245 250 255

Lys Glu

<210>15

<211>4311

<212>DNA

<213>人工序列

<220>

<223>质粒pKR906

<400>15

agcggccgca ccatggaggt ggtgaatgaa atagtctcaa ttgggcagga agttttaccc 60

aaagttgatt atgcccaact ctggagtgat gccagtcact gtgaggtgct ttacttgtcc 120

atcgcatttg tcatcttgaa gttcactctt ggcccccttg gtccaaaagg tcagtctcgt 180

atgaagtttg ttttcaccaa ttacaacctt ctcatgtcca tttattcgtt gggatcattc 240

ctctcaatgg catatgccat gtacaccatc ggtgttatgt ctgacaactg cgagaaggct 300

tttgacaaca acgtcttcag gatcaccacg cagttgttct atttgagcaa gttcctggag 360

tatattgact ccttctattt gccactgatg ggcaagcctc tgacctggtt gcaattcttc 420

catcatttgg gggcaccgat ggatatgtgg ctgttctata attaccgaaa tgaagctgtt 480

tggatttttg tgctgttgaa tggtttcatc cactggatca tgtacggtta ttattggacc 540

agattgatca agctgaagtt ccccatgcca aaatccctga ttacatcaat gcagatcatt 600

caattcaatg ttggtttcta cattgtctgg aagtacagga acattccctg ttatcgccaa 660

gatgggatga ggatgtttgg ctggttcttc aattactttt atgttggcac agtcttgtgt 720

ttgttcttga atttctatgt gcaaacgtat atcgtcagga agcacaaggg agccaaaaag 780

attcagtgag cggccgcacc tgaattccag cacactggcg gccgttacta gtggatccga 840

gctcggtacc aagcttgatg catagcttga gtattctaac gcgtcaccta aatagcttgg 900

cgtaatcatg gtcatagctg tttcctgtgt gaaattgtta tccgctcaca attccacaca 960

acatacgagc cggaagcata aagtgtaaag cctggggtgc ctaatgagtg agctaactca 1020

cattaattgc gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg tgccagctgc 1080

attaatgaat cggccaacgc gcggggagag gcggtttgcg tattgggcgc tcttccgctt 1140

cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact 1200

caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag 1260

caaaaggcca gcaaaagccc aggaaccgta aaaaggccgc gttgctggcg tttttccata 1320

ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc 1380

cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg 1440

ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc 1500

tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg 1560

gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc 1620

ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga 1680

ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg 1740

gctacactag aaggacagta tttggtatct gcgctctgct gaagccagtt accttcggaa 1800

aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg 1860

tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt 1920

ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat 1980

tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt agcacgtgtc 2040

agtcctgctc ctcggccacg aagtgcacgc agttgccggc cgggtcgcgc agggcgaact 2100

cccgccccca cggctgctcg ccgatctcgg tcatggccgg cccggaggcg tcccggaagt 2160

tcgtggacac gacctccgac cactcggcgt acagctcgtc caggccgcgc acccacaccc 2220

aggccagggt gttgtccggc accacctggt cctggaccgc gctgatgaac agggtcacgt 2280

cgtcccggac cacaccggcg aagtcgtcct ccacgaagtc ccgggagaac ccgagccggt 2340

cggtccagaa ctcgaccgct ccggcgacgt cgcgcgcggt gagcaccgga acggcactgg 2400

tcaacttggc catggtggcc ctcctcacgt gctattattg aagcatttat cagggttatt 2460

gtctcatgag cggatacata tttgaatgta tttagaaaaa taaacaaata ggggttccgc 2520

gcacatttcc ccgaaaagtg ccacctgtat gcggtgtgaa ataccgcaca gatgcgtaag 2580

gagaaaatac cgcatcagga aattgtaagc gttaataatt cagaagaact cgtcaagaag 2640

gcgatagaag gcgatgcgct gcgaatcggg agcggcgata ccgtaaagca cgaggaagcg 2700

gtcagcccat tcgccgccaa gctcttcagc aatatcacgg gtagccaacg ctatgtcctg 2760

atagcggtcc gccacaccca gccggccaca gtcgatgaat ccagaaaagc ggccattttc 2820

caccatgata ttcggcaagc aggcatcgcc atgggtcacg acgagatcct cgccgtcggg 2880

catgctcgcc ttgagcctgg cgaacagttc ggctggcgcg agcccctgat gctcttcgtc 2940

cagatcatcc tgatcgacaa gaccggcttc catccgagta cgtgctcgct cgatgcgatg 3000

tttcgcttgg tggtcgaatg ggcaggtagc cggatcaagc gtatgcagcc gccgcattgc 3060

atcagccatg atggatactt tctcggcagg agcaaggtga gatgacagga gatcctgccc 3120

cggcacttcg cccaatagca gccagtccct tcccgcttca gtgacaacgt cgagcacagc 3180

tgcgcaagga acgcccgtcg tggccagcca cgatagccgc gctgcctcgt cttgcagttc 3240

attcagggca ccggacaggt cggtcttgac aaaaagaacc gggcgcccct gcgctgacag 3300

ccggaacacg gcggcatcag agcagccgat tgtctgttgt gcccagtcat agccgaatag 3360

cctctccacc caagcggccg gagaacctgc gtgcaatcca tcttgttcaa tcatgcgaaa 3420

cgatcctcat cctgtctctt gatcagagct tgatcccctg cgccatcaga tccttggcgg 3480

cgagaaagcc atccagttta ctttgcaggg cttcccaacc ttaccagagg gcgccccagc 3540

tggcaattcc ggttcgcttg ctgtccataa aaccgcccag tctagctatc gccatgtaag 3600

cccactgcaa gctacctgct ttctctttgc gcttgcgttt tcccttgtcc agatagccca 3660

gtagctgaca ttcatccggg gtcagcaccg tttctgcgga ctggctttct acgtgaaaag 3720

gatctaggtg aagatccttt ttgataatct catgcctgac atttatattc cccagaacat 3780

caggttaatg gcgtttttga tgtcattttc gcggtggctg agatcagcca cttcttcccc 3840

gataacggag accggcacac tggccatatc ggtggtcatc atgcgccagc tttcatcccc 3900

gatatgcacc accgggtaaa gttcacggga gactttatct gacagcagac gtgcactggc 3960

cagggggatc accatccgtc gccccggcgt gtcaataata tcactctgta catccacaaa 4020

cagacgataa cggctctctc ttttataggt gtaaacctta aactgccgta cgtataggct 4080

gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa 4140

agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg 4200

ttgtaaaacg acggccagtg aattgtaata cgactcacta tagggcgaat tgggccctct 4260

agatgcatgc tcgagcggcc gccagtgtga tggatatctg cagaattcag g 4311

<210>16

<211>263

<212>PRT

<213>绿光等鞭金藻

<400>16

Met Ala Leu Ala Asn Asp Ala Gly Glu Arg Ile Trp Ala Ala Val Thr

1 5 10 15

Asp Pro Glu Ile Leu Ile Gly Thr Phe Ser Tyr Leu Leu Leu Lys Pro

20 25 30

Leu Leu Arg Asn Ser Gly Leu Val Asp Glu Lys Lys Gly Ala Tyr Arg

35 40 45

Thr Ser Met Ile Trp Tyr Asn Val Leu Leu Ala Leu Phe Ser Ala Leu

50 55 60

Ser Phe Tyr Val Thr Ala Thr Ala Leu Gly Trp Asp Tyr Gly Thr Gly

65 70 75 80

Ala Trp Leu Arg Arg Gln Thr Gly Asp Thr Pro Gln Pro Leu Phe Gln

85 90 95

Cys Pro Ser Pro Val Trp Asp Ser Lys Leu Phe Thr Trp Thr Ala Lys

100 105 110

Ala Phe Tyr Tyr Ser Lys Tyr Val Glu Tyr Leu Asp Thr Ala Trp Leu

115 120 125

Val Leu Lys Gly Lys Arg Val Ser Phe Leu Gln Ala Phe His His Phe

130 135 140

Gly Ala Pro Trp Asp Val Tyr Leu Gly Ile Arg Leu His Asn Glu Gly

145 150 155 160

Val Trp Ile Phe Met Phe Phe Asn Ser Phe Ile His Thr Ile Met Tyr

165 170 175

Thr Tyr Tyr Gly Leu Thr Ala Ala Gly Tyr Lys Phe Lys Ala Lys Pro

180 185 190

Leu Ile Thr Ala Met Gln Ile Cys Gln Phe Val Gly Gly Phe Leu Leu

195 200 205

Val Trp Asp Tyr Ile Asn Val Pro Cys Phe Asn Ser Asp Lys Gly Lys

210 215 220

Leu Phe Ser Trp Ala Phe Asn Tyr Ala Tyr Val Gly Ser Val Phe Leu

225 230 235 240

Leu Phe Cys His Phe Phe Tyr Gln Asp Asn Leu Ala Thr Lys Lys Ser

245 250 255

Ala Lys Ala Gly Lys Gln Leu

260

<210>17

<211>9472

<212>DNA

<213>人工序列

<220>

<223>质粒pDMW263

<400>17

catggcatgg atggtacgtc ctgtagaaac cccaacccgt gaaatcaaaa aactcgacgg 60

cctgtgggca ttcagtctgg atcgcgaaaa ctgtggaatt gatcagcgtt ggtgggaaag 120

cgcgttacaa gaaagccggg caattgctgt gccaggcagt tttaacgatc agttcgccga 180

tgcagatatt cgtaattatg cgggcaacgt ctggtatcag cgcgaagtct ttataccgaa 240

aggttgggca ggccagcgta tcgtgctgcg tttcgatgcg gtcactcatt acggcaaagt 300

gtgggtcaat aatcaggaag tgatggagca tcagggcggc tatacgccat ttgaagccga 360

tgtcacgccg tatgttattg ccgggaaaag tgtacgtatc accgtttgtg tgaacaacga 420

actgaactgg cagactatcc cgccgggaat ggtgattacc gacgaaaacg gcaagaaaaa 480

gcagtcttac ttccatgatt tctttaacta tgccgggatc catcgcagcg taatgctcta 540

caccacgccg aacacctggg tggacgatat caccgtggtg acgcatgtcg cgcaagactg 600

taaccacgcg tctgttgact ggcaggtggt ggccaatggt gatgtcagcg ttgaactgcg 660

tgatgcggat caacaggtgg ttgcaactgg acaaggcact agcgggactt tgcaagtggt 720

gaatccgcac ctctggcaac cgggtgaagg ttatctctat gaactgtgcg tcacagccaa 780

aagccagaca gagtgtgata tctacccgct tcgcgtcggc atccggtcag tggcagtgaa 840

gggcgaacag ttcctgatta accacaaacc gttctacttt actggctttg gtcgtcatga 900

agatgcggac ttacgtggca aaggattcga taacgtgctg atggtgcacg accacgcatt 960

aatggactgg attggggcca actcctaccg tacctcgcat tacccttacg ctgaagagat 1020

gctcgactgg gcagatgaac atggcatcgt ggtgattgat gaaactgctg ctgtcggctt 1080

taacctctct ttaggcattg gtttcgaagc gggcaacaag ccgaaagaac tgtacagcga 1140

agaggcagtc aacggggaaa ctcagcaagc gcacttacag gcgattaaag agctgatagc 1200

gcgtgacaaa aaccacccaa gcgtggtgat gtggagtatt gccaacgaac cggatacccg 1260

tccgcaagtg cacgggaata tttcgccact ggcggaagca acgcgtaaac tcgacccgac 1320

gcgtccgatc acctgcgtca atgtaatgtt ctgcgacgct cacaccgata ccatcagcga 1380

tctctttgat gtgctgtgcc tgaaccgtta ttacggatgg tatgtccaaa gcggcgattt 1440

ggaaacggca gagaaggtac tggaaaaaga acttctggcc tggcaggaga aactgcatca 1500

gccgattatc atcaccgaat acggcgtgga tacgttagcc gggctgcact caatgtacac 1560

cgacatgtgg agtgaagagt atcagtgtgc atggctggat atgtatcacc gcgtctttga 1620

tcgcgtcagc gccgtcgtcg gtgaacaggt atggaatttc gccgattttg cgacctcgca 1680

aggcatattg cgcgttggcg gtaacaagaa agggatcttc actcgcgacc gcaaaccgaa 1740

gtcggcggct tttctgctgc aaaaacgctg gactggcatg aacttcggtg aaaaaccgca 1800

gcagggaggc aaacaatgat taattaacta gagcggccgc caccgcggcc cgagattccg 1860

gcctcttcgg ccgccaagcg acccgggtgg acgtctagag gtacctagca attaacagat 1920

agtttgccgg tgataattct cttaacctcc cacactcctt tgacataacg atttatgtaa 1980

cgaaactgaa atttgaccag atattgtgtc cgcggtggag ctccagcttt tgttcccttt 2040

agtgagggtt aatttcgagc ttggcgtaat catggtcata gctgtttcct gtgtgaaatt 2100

gttatccgct cacaattcca cacaacatac gagccggaag cataaagtgt aaagcctggg 2160

gtgcctaatg agtgagctaa ctcacattaa ttgcgttgcg ctcactgccc gctttccagt 2220

cgggaaacct gtcgtgccag ctgcattaat gaatcggcca acgcgcgggg agaggcggtt 2280

tgcgtattgg gcgctcttcc gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc 2340

tgcggcgagc ggtatcagct cactcaaagg cggtaatacg gttatccaca gaatcagggg 2400

ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg 2460

ccgcgttgct ggcgtttttc cataggctcc gcccccctga cgagcatcac aaaaatcgac 2520

gctcaagtca gaggtggcga aacccgacag gactataaag ataccaggcg tttccccctg 2580

gaagctccct cgtgcgctct cctgttccga ccctgccgct taccggatac ctgtccgcct 2640

ttctcccttc gggaagcgtg gcgctttctc atagctcacg ctgtaggtat ctcagttcgg 2700

tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct 2760

gcgccttatc cggtaactat cgtcttgagt ccaacccggt aagacacgac ttatcgccac 2820

tggcagcagc cactggtaac aggattagca gagcgaggta tgtaggcggt gctacagagt 2880

tcttgaagtg gtggcctaac tacggctaca ctagaaggac agtatttggt atctgcgctc 2940

tgctgaagcc agttaccttc ggaaaaagag ttggtagctc ttgatccggc aaacaaacca 3000

ccgctggtag cggtggtttt tttgtttgca agcagcagat tacgcgcaga aaaaaaggat 3060

ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc tcagtggaac gaaaactcac 3120

gttaagggat tttggtcatg agattatcaa aaaggatctt cacctagatc cttttaaatt 3180

aaaaatgaag ttttaaatca atctaaagta tatatgagta aacttggtct gacagttacc 3240

aatgcttaat cagtgaggca cctatctcag cgatctgtct atttcgttca tccatagttg 3300

cctgactccc cgtcgtgtag ataactacga tacgggaggg cttaccatct ggccccagtg 3360

ctgcaatgat accgcgagac ccacgctcac cggctccaga tttatcagca ataaaccagc 3420

cagccggaag ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc atccagtcta 3480

ttaattgttg ccgggaagct agagtaagta gttcgccagt taatagtttg cgcaacgttg 3540

ttgccattgc tacaggcatc gtggtgtcac gctcgtcgtt tggtatggct tcattcagct 3600

ccggttccca acgatcaagg cgagttacat gatcccccat gttgtgcaaa aaagcggtta 3660

gctccttcgg tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg 3720

ttatggcagc actgcataat tctcttactg tcatgccatc cgtaagatgc ttttctgtga 3780

ctggtgagta ctcaaccaag tcattctgag aatagtgtat gcggcgaccg agttgctctt 3840

gcccggcgtc aatacgggat aataccgcgc cacatagcag aactttaaaa gtgctcatca 3900

ttggaaaacg ttcttcgggg cgaaaactct caaggatctt accgctgttg agatccagtt 3960

cgatgtaacc cactcgtgca cccaactgat cttcagcatc ttttactttc accagcgttt 4020

ctgggtgagc aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg gcgacacgga 4080

aatgttgaat actcatactc ttcctttttc aatattattg aagcatttat cagggttatt 4140

gtctcatgag cggatacata tttgaatgta tttagaaaaa taaacaaata ggggttccgc 4200

gcacatttcc ccgaaaagtg ccacctgacg cgccctgtag cggcgcatta agcgcggcgg 4260

gtgtggtggt tacgcgcagc gtgaccgcta cacttgccag cgccctagcg cccgctcctt 4320

tcgctttctt cccttccttt ctcgccacgt tcgccggctt tccccgtcaa gctctaaatc 4380

gggggctccc tttagggttc cgatttagtg ctttacggca cctcgacccc aaaaaacttg 4440

attagggtga tggttcacgt agtgggccat cgccctgata gacggttttt cgccctttga 4500

cgttggagtc cacgttcttt aatagtggac tcttgttcca aactggaaca acactcaacc 4560

ctatctcggt ctattctttt gatttataag ggattttgcc gatttcggcc tattggttaa 4620

aaaatgagct gatttaacaa aaatttaacg cgaattttaa caaaatatta acgcttacaa 4680

tttccattcg ccattcaggc tgcgcaactg ttgggaaggg cgatcggtgc gggcctcttc 4740

gctattacgc cagctggcga aagggggatg tgctgcaagg cgattaagtt gggtaacgcc 4800

agggttttcc cagtcacgac gttgtaaaac gacggccagt gaattgtaat acgactcact 4860

atagggcgaa ttgggtaccg ggccccccct cgaggtcgat ggtgtcgata agcttgatat 4920

cgaattcatg tcacacaaac cgatcttcgc ctcaaggaaa cctaattct acatccgagag 4980

actgccgaga tccagtctac actgattaat tttcgggcca ataatttaaa aaaatcgtgt 5040

tatataatat tatatgtatt atatatatac atcatgatga tactgacagt catgtcccat 5100

tgctaaatag acagactcca tctgccgcct ccaactgatg ttctcaatat ttaaggggtc 5160

atctcgcatt gtttaataat aaacagactc catctaccgc ctccaaatga tgttctcaaa 5220

atatattgta tgaacttatt tttattactt agtattatta gacaacttac ttgctttatg 5280

aaaaacactt cctatttagg aaacaattta taatggcagt tcgttcattt aacaatttat 5340

gtagaataaa tgttataaat gcgtatggga aatcttaaat atggatagca taaatgatat 5400

ctgcattgcc taattcgaaa tcaacagcaa cgaaaaaaat cccttgtaca acataaatag 5460

tcatcgagaa atatcaacta tcaaagaaca gctattcaca cgttactatt gagattatta 5520

ttggacgaga atcacacact caactgtctt tctctcttct agaaatacag gtacaagtat 5580

gtactattct cattgttcat acttctagtc atttcatccc acatattcct tggatttctc 5640

tccaatgaat gacattctat cttgcaaatt caacaattat aataagatat accaaagtag 5700

cggtatagtg gcaatcaaaa agcttctctg gtgtgcttct cgtatttatt tttattctaa 5760

tgatccatta aaggtatata tttatttctt gttatataat ccttttgttt attacatggg 5820

ctggatacat aaaggtattt tgatttaatt ttttgcttaa attcaatccc ccctcgttca 5880

gtgtcaactg taatggtagg aaattaccat acttttgaag aagcaaaaaa aatgaaagaa 5940

aaaaaaaatc gtatttccag gttagacgtt ccgcagaatc tagaatgcgg tatgcggtac 6000

attgttcttc gaacgtaaaa gttgcgctcc ctgagatatt gtacattttt gcttttacaa 6060

gtacaagtac atcgtacaac tatgtactac tgttgatgca tccacaacag tttgttttgt 6120

ttttttttgt tttttttttt tctaatgatt cattaccgct atgtatacct acttgtactt 6180

gtagtaagcc gggttattgg cgttcaatta atcatagact tatgaatctg cacggtgtgc 6240

gctgcgagtt acttttagct tatgcatgct acttgggtgt aatattggga tctgttcgga 6300

aatcaacgga tgctcaaccg atttcgacag taataatttg aatcgaatcg gagcctaaaa 6360

tgaacccgag tatatctcat aaaattctcg gtgagaggtc tgtgactgtc agtacaaggt 6420

gccttcatta tgccctcaac cttaccatac ctcactgaat gtagtgtacc tctaaaaatg 6480

aaatacagtg ccaaaagcca aggcactgag ctcgtctaac ggacttgata tacaaccaat 6540

taaaacaaat gaaaagaaat acagttcttt gtatcatttg taacaattac cctgtacaaa 6600

ctaaggtatt gaaatcccac aatattccca aagtccaccc ctttccaaat tgtcatgcct 6660

acaactcata taccaagcac taacctacca aacaccacta aaaccccaca aaatatatct 6720

taccgaatat acagtaacaa gctaccacca cactcgttgg gtgcagtcgc cagcttaaag 6780

atatctatcc acatcagcca caactccctt cctttaataa accgactaca cccttggcta 6840

ttgaggttat gagtgaatat actgtagaca agacactttc aagaagactg tttccaaaac 6900

gtaccactgt cctccactac aaacacaccc aatctgcttc ttctagtcaa ggttgctaca 6960

ccggtaaatt ataaatcatc atttcattag cagggcaggg ccctttttat agagtcttat 7020

acactagcgg accctgccgg tagaccaacc cgcaggcgcg tcagtttgct ccttccatca 7080

atgcgtcgta gaaacgactt actccttctt gagcagctcc ttgaccttgt tggcaacaag 7140

tctccgacct cggaggtgga ggaagagcct ccgatatcgg cggtagtgat accagcctcg 7200

acggactcct tgacggcagc ctcaacagcg tcaccggcgg gcttcatgtt aagagagaac 7260

ttgagcatca tggcggcaga cagaatggtg gcaatggggt tgaccttctg cttgccgaga 7320

tcgggggcag atccgtgaca gggctcgtac agaccgaacg cctcgttggt gtcgggcaga 7380

gaagccagag aggcggaggg cagcagaccc agagaaccgg ggatgacgga ggcctcgtcg 7440

gagatgatat cgccaaacat gttggtggtg atgatgatac cattcatctt ggagggctgc 7500

ttgatgagga tcatggcggc cgagtcgatc agctggtggt tgagctcgag ctgggggaat 7560

tcgtccttga ggactcgagt gacagtcttt cgccaaagtc gagaggaggc cagcacgttg 7620

gccttgtcaa gagaccacac gggaagaggg gggttgtgct gaagggccag gaaggcggcc 7680

attcgggcaa ttcgctcaac ctcaggaacg gagtaggtct cggtgtcgga agcgacgcca 7740

gatccgtcat cctcctttcg ctctccaaag tagatacctc cgacgagctc tcggacaatg 7800

atgaagtcgg tgccctcaac gtttcggatg ggggagagat cggcgagctt gggcgacagc 7860

agctggcagg gtcgcaggtt ggcgtacagg ttcaggtcct ttcgcagctt gaggagaccc 7920

tgctcgggtc gcacgtcggt tcgtccgtcg ggagtggtcc atacggtgtt ggcagcgcct 7980

ccgacagcac cgagcataat agagtcagcc tttcggcaga tgtcgagagt agcgtcggtg 8040

atgggctcgc cctccttctc aatggcagct cctccaatga gtcggtcctc aaacacaaac 8100

tcggtgccgg aggcctcagc aacagacttg agcaccttga cggcctcggc aatcacctcg 8160

gggccacaga agtcgccgcc gagaagaaca atcttcttgg agtcagtctt ggtcttctta 8220

gtttcgggtt ccattgtgga tgtgtgtggt tgtatgtgtg atgtggtgtg tggagtgaaa 8280

atctgtggct ggcaaacgct cttgtatata tacgcacttt tgcccgtgct atgtggaaga 8340

ctaaacctcc gaagattgtg actcaggtag tgcggtatcg gctagggacc caaaccttgt 8400

cgatgccgat agcgctatcg aacgtacccc agccggccgg gagtatgtcg gaggggacat 8460

acgagatcgt caagggtttg tggccaactg gtaaataaat gatgtcgacg tttaaacagt 8520

gtacgcagat ctactataga ggaacattta aattgccccg gagaagacgg ccaggccgcc 8580

tagatgacaa attcaacaac tcacagctga ctttctgcca ttgccactag gggggggcct 8640

ttttatatgg ccaagccaag ctctccacgt cggttgggct gcacccaaca ataaatgggt 8700

agggttgcac caacaaaggg atgggatggg gggtagaaga tacgaggata acggggctca 8760

atggcacaaa taagaacgaa tactgccatt aagactcgtg atccagcgac tgacaccatt 8820

gcatcatcta agggcctcaa aactacctcg gaactgctgc gctgatctgg acaccacaga 8880

ggttccgagc actttaggtt gcaccaaatg tcccaccagg tgcaggcaga aaacgctgga 8940

acagcgtgta cagtttgtct taacaaaaag tgagggcgct gaggtcgagc agggtggtgt 9000

gacttgttat agcctttaga gctgcgaaag cgcgtatgga tttggctcat caggccagat 9060

tgagggtctg tggacacatg tcatgttagt gtacttcaat cgccccctgg atatagcccc 9120

gacaataggc cgtggcctca tttttttgcc ttccgcacat ttccattgct cgatacccac 9180

accttgcttc tcctgcactt gccaacctta atactggttt acattgacca acatcttaca 9240

agcggggggc ttgtctaggg tatatataaa cagtggctct cccaatcggt tgccagtctc 9300

ttttttcctt tctttcccca cagattcgaa atctaaacta cacatcacag aattccgagc 9360

cgtgagtatc cacgacaaga tcagtgtcga gacgacgcgt tttgtgtaat gacacaatcc 9420

gaaagtcgct agcaacacac actctctaca caaactaacc cagctctggt ac 9472

<210>18

<211>7879

<212>DNA

<213>人工序列

<220>

<223>质粒pDMW237

<400>18

ggccgcaagt gtggatgggg aagtgagtgc ccggttctgt gtgcacaatt ggcaatccaa 60

gatggatgga ttcaacacag ggatatagcg agctacgtgg tggtgcgagg atatagcaac 120

ggatatttat gtttgacact tgagaatgta cgatacaagc actgtccaag tacaatacta 180

aacatactgt acatactcat actcgtaccc gggcaacggt ttcacttgag tgcagtggct 240

agtgctctta ctcgtacagt gtgcaatact gcgtatcata gtctttgatg tatatcgtat 300

tcattcatgt tagttgcgta cgagccggaa gcataaagtg taaagcctgg ggtgcctaat 360

gagtgagcta actcacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc 420

tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg 480

ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag 540

cggtatcagc tcactcaaag gcggtaatac ggttatccac agaatcaggg gataacgcag 600

gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc 660

tggcgttttt ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc 720

agaggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc 780

tcgtgcgctc tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt 840

cgggaagcgt ggcgctttct catagctcac gctgtaggta tctcagttcg gtgtaggtcg 900

ttcgctccaa gctgggctgt gtgcacgaac cccccgttca gcccgaccgc tgcgccttat 960

ccggtaacta tcgtcttgag tccaacccgg taagacacga cttatcgcca ctggcagcag 1020

ccactggtaa caggattagc agagcgaggt atgtaggcgg tgctacagag ttcttgaagt 1080

ggtggcctaa ctacggctac actagaagga cagtatttgg tatctgcgct ctgctgaagc 1140

cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc accgctggta 1200

gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag 1260

atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca cgttaaggga 1320

ttttggtcat gagattatca aaaaggatct tcacctagat ccttttaaat taaaaatgaa 1380

gttttaaatc aatctaaagt atatatgagt aaacttggtc tgacagttac caatgcttaa 1440

tcagtgaggc acctatctca gcgatctgtc tatttcgttc atccatagtt gcctgactcc 1500

ccgtcgtgta gataactacg atacgggagg gcttaccatc tggccccagt gctgcaatga 1560

taccgcgaga cccacgctca ccggctccag atttatcagc aataaaccag ccagccggaa 1620

gggccgagcg cagaagtggt cctgcaactt tatccgcctc catccagtct attaattgtt 1680

gccgggaagc tagagtaagt agttcgccag ttaatagttt gcgcaacgtt gttgccattg 1740

ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc tccggttccc 1800

aacgatcaag gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt agctccttcg 1860

gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg gttatggcag 1920

cactgcataa ttctcttact gtcatgccat ccgtaagatg cttttctgtg actggtgagt 1980

actcaaccaa gtcattctga gaatagtgta tgcggcgacc gagttgctct tgcccggcgt 2040

caatacggga taataccgcg ccacatagca gaactttaaa agtgctcatc attggaaaac 2100

gttcttcggg gcgaaaactc tcaaggatct taccgctgtt gagatccagt tcgatgtaac 2160

ccactcgtgc acccaactga tcttcagcat cttttacttt caccagcgtt tctgggtgag 2220

caaaaacagg aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa 2280

tactcatact cttccttttt caatattatt gaagcattta tcagggttat tgtctcatga 2340

gcggatacat atttgaatgt atttagaaaa ataaacaaat aggggttccg cgcacatttc 2400

cccgaaaagt gccacctgac gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg 2460

ttacgcgcag cgtgaccgct acacttgcca gcgccctagc gcccgctcct ttcgctttct 2520

tcccttcctt tctcgccacg ttcgccggct ttccccgtca agctctaaat cgggggctcc 2580

ctttagggtt ccgatttagt gctttacggc acctcgaccc caaaaaactt gattagggtg 2640

atggttcacg tagtgggcca tcgccctgat agacggtttt tcgccctttg acgttggagt 2700

ccacgttctt taatagtgga ctcttgttcc aaactggaac aacactcaac cctatctcgg 2760

tctattcttt tgatttataa gggattttgc cgatttcggc ctattggtta aaaaatgagc 2820

tgatttaaca aaaatttaac gcgaatttta acaaaatatt aacgcttaca atttccattc 2880

gccattcagg ctgcgcaact gttgggaagg gcgatcggtg cgggcctctt cgctattacg 2940

ccagctggcg aaagggggat gtgctgcaag gcgattaagt tgggtaacgc cagggttttc 3000

ccagtcacga cgttgtaaaa cgacggccag tgaattgtaa tacgactcac tatagggcga 3060

attgggtacc gggccccccc tcgaggtcga tggtgtcgat aagcttgata tcgaattcat 3120

gtcacacaaa ccgatcttcg cctcaaggaa acctaattct acatccgaga gactgccgag 3180

atccagtcta cactgattaa ttttcgggcc aataatttaa aaaaatcgtg ttatataata 3240

ttatatgtat tatatatata catcatgatg atactgacag tcatgtccca ttgctaaata 3300

gacagactcc atctgccgcc tccaactgat gttctcaata tttaaggggt catctcgcat 3360

tgtttaataa taaacagact ccatctaccg cctccaaatg atgttctcaa aatatattgt 3420

atgaacttat ttttattact tagtattatt agacaactta cttgctttat gaaaaacact 3480

tcctatttag gaaacaattt ataatggcag ttcgttcatt taacaattta tgtagaataa 3540

atgttataaa tgcgtatggg aaatcttaaa tatggatagc ataaatgata tctgcattgc 3600

ctaattcgaa atcaacagca acgaaaaaaa tcccttgtac aacataaata gtcatcgaga 3660

aatatcaact atcaaagaac agctattcac acgttactat tgagattatt attggacgag 3720

aatcacacac tcaactgtct ttctctcttc tagaaataca ggtacaagta tgtactattc 3780

tcattgttca tacttctagt catttcatcc cacatattcc ttggatttct ctccaatgaa 3840

tgacattcta tcttgcaaat tcaacaatta taataagata taccaaagta gcggtatagt 3900

ggcaatcaaa aagcttctct ggtgtgcttc tcgtatttat ttttattcta atgatccatt 3960

aaaggtatat atttatttct tgttatataa tccttttgtt tattacatgg gctggataca 4020

taaaggtatt ttgatttaat tttttgctta aattcaatcc cccctcgttc agtgtcaact 4080

gtaatggtag gaaattacca tacttttgaa gaagcaaaaa aaatgaaaga aaaaaaaaat 4140

cgtatttcca ggttagacgt tccgcagaat ctagaatgcg gtatgcggta cattgttctt 4200

cgaacgtaaa agttgcgctc cctgagatat tgtacatttt tgcttttaca agtacaagta 4260

catcgtacaa ctatgtacta ctgttgatgc atccacaaca gtttgttttg tttttttttg 4320

tttttttttt ttctaatgat tcattaccgc tatgtatacc tacttgtact tgtagtaagc 4380

cgggttattg gcgttcaatt aatcatagac ttatgaatct gcacggtgtg cgctgcgagt 4440

tacttttagc ttatgcatgc tacttgggtg taatattggg atctgttcgg aaatcaacgg 4500

atgctcaatc gatttcgaca gtaattaatt aagtcataca caagtcagct ttcttcgagc 4560

ctcatataag tataagtagt tcaacgtatt agcactgtac ccagcatctc cgtatcgaga 4620

aacacaacaa catgccccat tggacagatc atgcggatac acaggttgtg cagtatcata 4680

catactcgat cagacaggtc gtctgaccat catacaagct gaacaagcgc tccatacttg 4740

cacgctctct atatacacag ttaaattaca tatccatagt ctaacctcta acagttaatc 4800

ttctggtaag cctcccagcc agccttctgg tatcgcttgg cctcctcaat aggatctcgg 4860

ttctggccgt acagacctcg gccgacaatt atgatatccg ttccggtaga catgacatcc 4920

tcaacagttc ggtactgctg tccgagagcg tctcccttgt cgtcaagacc caccccgggg 4980

gtcagaataa gccagtcctc agagtcgccc ttaggtcggt tctgggcaat gaagccaacc 5040

acaaactcgg ggtcggatcg ggcaagctca atggtctgct tggagtactc gccagtggcc 5100

agagagccct tgcaagacag ctcggccagc atgagcagac ctctggccag cttctcgttg 5160

ggagagggga ctaggaactc cttgtactgg gagttctcgt agtcagagac gtcctccttc 5220

ttctgttcag agacagtttc ctcggcacca gctcgcaggc cagcaatgat tccggttccg 5280

ggtacaccgt gggcgttggt gatatcggac cactcggcga ttcggtgaca ccggtactgg 5340

tgcttgacag tgttgccaat atctgcgaac tttctgtcct cgaacaggaa gaaaccgtgc 5400

ttaagagcaa gttccttgag ggggagcaca gtgccggcgt aggtgaagtc gtcaatgatg 5460

tcgatatggg ttttgatcat gcacacataa ggtccgacct tatcggcaag ctcaatgagc 5520

tccttggtgg tggtaacatc cagagaagca cacaggttgg ttttcttggc tgccacgagc 5580

ttgagcactc gagcggcaaa ggcggacttg tggacgttag ctcgagcttc gtaggagggc 5640

attttggtgg tgaagaggag actgaaataa atttagtctg cagaactttt tatcggaacc 5700

ttatctgggg cagtgaagta tatgttatgg taatagttac gagttagttg aacttataga 5760

tagactggac tatacggcta tcggtccaaa ttagaaagaa cgtcaatggc tctctgggcg 5820

tcgcctttgc cgacaaaaat gtgatcatga tgaaagccag caatgacgtt gcagctgata 5880

ttgttgtcgg ccaaccgcgc cgaaaacgca gctgtcagac ccacagcctc caacgaagaa 5940

tgtatcgtca aagtgatcca agcacactca tagttggagt cgtactccaa aggcggcaat 6000

gacgagtcag acagatactc gtcgactcag gcgacgacgg aattcctgca gcccatctgc 6060

agaattcagg agagaccggg ttggcggcgt atttgtgtcc caaaaaacag ccccaattgc 6120

cccggagaag acggccaggc cgcctagatg acaaattcaa caactcacag ctgactttct 6180

gccattgcca ctaggggggg gcctttttat atggccaagc caagctctcc acgtcggttg 6240

ggctgcaccc aacaataaat gggtagggtt gcaccaacaa agggatggga tggggggtag 6300

aagatacgag gataacgggg ctcaatggca caaataagaa cgaatactgc cattaagact 6360

cgtgatccag cgactgacac cattgcatca tctaagggcc tcaaaactac ctcggaactg 6420

ctgcgctgat ctggacacca cagaggttcc gagcacttta ggttgcacca aatgtcccac 6480

caggtgcagg cagaaaacgc tggaacagcg tgtacagttt gtcttaacaa aaagtgaggg 6540

cgctgaggtc gagcagggtg gtgtgacttg ttatagcctt tagagctgcg aaagcgcgta 6600

tggatttggc tcatcaggcc agattgaggg tctgtggaca catgtcatgt tagtgtactt 6660

caatcgcccc ctggatatag ccccgacaat aggccgtggc ctcatttttt tgccttccgc 6720

acatttccat tgctcggtac ccacaccttg cttctcctgc acttgccaac cttaatactg 6780

gtttacattg accaacatct tacaagcggg gggcttgtct agggtatata taaacagtgg 6840

ctctcccaat cggttgccag tctctttttt cctttctttc cccacagatt cgaaatctaa 6900

actacacatc acacaatgcc tgttactgac gtccttaagc gaaagtccgg tgtcatcgtc 6960

ggcgacgatg tccgagccgt gagtatccac gacaagatca gtgtcgagac gacgcgtttt 7020

gtgtaatgac acaatccgaa agtcgctagc aacacacact ctctacacaa actaacccag 7080

ctctccatgg ctctggccaa cgacgctggc gagcgaatct gggctgccgt caccgatccc 7140

gaaatcctca ttggcacctt ctcctacctg ctcctgaagc ctctcctgcg aaactctggt 7200

ctcgtggacg agaagaaagg agcctaccga acctccatga tctggtacaa cgtcctcctg 7260

gctctcttct ctgccctgtc cttctacgtg actgccaccg ctctcggctg ggactacggt 7320

actggagcct ggctgcgaag acagaccggt gatactcccc agcctctctt tcagtgtccc 7380

tctcctgtct gggactccaa gctgttcacc tggactgcca aggccttcta ctattctaag 7440

tacgtggagt acctcgacac cgcttggctg gtcctcaagg gcaagcgagt gtcctttctg 7500

caggccttcc atcactttgg agctccctgg gacgtctacc tcggcattcg actgcacaac 7560

gagggtgtgt ggatcttcat gttctttaac tcgttcattc acaccatcat gtacacctac 7620

tatggactga ctgccgctgg ctacaagttc aaggccaagc ctctgatcac tgccatgcag 7680

atttgccagt tcgtcggtgg ctttctcctg gtctgggact acatcaacgt tccctgcttc 7740

aactctgaca agggcaagct gttctcctgg gctttcaact acgcctacgt cggatctgtc 7800

tttctcctgt tctgtcactt cttttaccag gacaacctgg ccaccaagaa atccgctaag 7860

gctggtaagc agctttagc 7879

<210>19

<211>7783

<212>DNA

<213>人工序列

<220>

<223>质粒pY115

<400>19

catggctctg gccaacgacg ctggcgagcg aatctgggct gccgtcaccg atcccgaaat 60

cctcattggc accttctcct acctgctcct gaagcctctc ctgcgaaact ctggtctcgt 120

ggacgagaag aaaggagcct accgaacctc catgatctgg tacaacgtcc tcctggctct 180

cttctctgcc ctgtccttct acgtgactgc caccgctctc ggctgggact acggtactgg 240

agcctggctg cgaagacaga ccggtgatac tccccagcct ctctttcagt gtccctctcc 300

tgtctgggac tccaagctgt tcacctggac tgccaaggcc ttctactatt ctaagtacgt 360

ggagtacctc gacaccgctt ggctggtcct caagggcaag cgagtgtcct ttctgcaggc 420

cttccatcac tttggagctc cctgggacgt ctacctcggc attcgactgc acaacgaggg 480

tgtgtggatc ttcatgttct ttaactcgtt cattcacacc atcatgtaca cctactatgg 540

actgactgcc gctggctaca agttcaaggc caagcctctg atcactgcca tgcagatttg 600

ccagttcgtc ggtggctttc tcctggtctg ggactacatc aacgttccct gcttcaactc 660

tgacaagggc aagctgttct cctgggcttt caactacgcc tacgtcggat ctgtctttct 720

cctgttctgt cacttctttt accaggacaa cctggccacc aagaaatccg ctaaggctgg 780

taagcagctt tagcggccgc aagtgtggat ggggaagtga gtgcccggtt ctgtgtgcac 840

aattggcaat ccaagatgga tggattcaac acagggatat agcgagctac gtggtggtgc 900

gaggatatag caacggatat ttatgtttga cacttgagaa tgtacgatac aagcactgtc 960

caagtacaat actaaacata ctgtacatac tcatactcgt acccgggcaa cggtttcact 1020

tgagtgcagt ggctagtgct cttactcgta cagtgtgcaa tactgcgtat catagtcttt 1080

gatgtatatc gtattcattc atgttagttg cgtacgagcc ggaagcataa agtgtaaagc 1140

ctggggtgcc taatgagtga gctaactcac attaattgcg ttgcgctcac tgcccgcttt 1200

ccagtcggga aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg cggggagagg 1260

cggtttgcgt attgggcgct cttccgcttc ctcgctcact gactcgctgc gctcggtcgt 1320

tcggctgcgg cgagcggtat cagctcactc aaaggcggta atacggttat ccacagaatc 1380

aggggataac gcaggaaaga acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa 1440

aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa 1500

tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc 1560

ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc 1620

cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag 1680

ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga 1740

ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc 1800

gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac 1860

agagttcttg aagtggtggc ctaactacgg ctacactaga aggacagtat ttggtatctg 1920

cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca 1980

aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa 2040

aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa 2100

ctcacgttaa gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt 2160

aaattaaaaa tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacag 2220

ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat 2280

agttgcctga ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc 2340

cagtgctgca atgataccgc gagacccacg ctcaccggct ccagatttat cagcaataaa 2400

ccagccagcc ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca 2460

gtctattaat tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa 2520

cgttgttgcc attgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt 2580

cagctccggt tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc 2640

ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact 2700

catggttatg gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc 2760

tgtgactggt gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg 2820

ctcttgcccg gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct 2880

catcattgga aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc 2940

cagttcgatg taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag 3000

cgtttctggg tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac 3060

acggaaatgt tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg 3120

ttattgtctc atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt 3180

tccgcgcaca tttccccgaa aagtgccacc tgacgcgccc tgtagcggcg cattaagcgc 3240

ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt gccagcgccc tagcgcccgc 3300

tcctttcgct ttcttccctt cctttctcgc cacgttcgcc ggctttcccc gtcaagctct 3360

aaatcggggg ctccctttag ggttccgatt tagtgcttta cggcacctcg accccaaaaa 3420

acttgattag ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg tttttcgccc 3480

tttgacgttg gagtccacgt tctttaatag tggactcttg ttccaaactg gaacaacact 3540

caaccctatc tcggtctatt cttttgattt ataagggatt ttgccgattt cggcctattg 3600

gttaaaaaat gagctgattt aacaaaaatt taacgcgaat tttaacaaaa tattaacgct 3660

tacaatttcc attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc 3720

tcttcgctat tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta 3780

acgccagggt tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt gtaatacgac 3840

tcactatagg gcgaattggg taccgggccc cccctcgagg tcgatggtgt cgataagctt 3900

gatatcgaat tcatgtcaca caaaccgatc ttcgcctcaa ggaaacctaa ttctacatcc 3960

gagagactgc cgagatccag tctacactga ttaattttcg ggccaataat ttaaaaaaat 4020

cgtgttatat aatattatat gtattatata tatacatcat gatgatactg acagtcatgt 4080

cccattgcta aatagacaga ctccatctgc cgcctccaac tgatgttctc aatatttaag 4140

gggtcatctc gcattgttta ataataaaca gactccatct accgcctcca aatgatgttc 4200

tcaaaatata ttgtatgaac ttatttttat tacttagtat tattagacaa cttacttgct 4260

ttatgaaaaa cacttcctat ttaggaaaca atttataatg gcagttcgtt catttaacaa 4320

tttatgtaga ataaatgtta taaatgcgta tgggaaatct taaatatgga tagcataaat 4380

gatatctgca ttgcctaatt cgaaatcaac agcaacgaaa aaaatccctt gtacaacata 4440

aatagtcatc gagaaatatc aactatcaaa gaacagctat tcacacgtta ctattgagat 4500

tattattgga cgagaatcac acactcaact gtctttctct cttctagaaa tacaggtaca 4560

agtatgtact attctcattg ttcatacttc tagtcatttc atcccacata ttccttggat 4620

ttctctccaa tgaatgacat tctatcttgc aaattcaaca attataataa gatataccaa 4680

agtagcggta tagtggcaat caaaaagctt ctctggtgtg cttctcgtat ttatttttat 4740

tctaatgatc cattaaaggt atatatttat ttcttgttat ataatccttt tgtttattac 4800

atgggctgga tacataaagg tattttgatt taattttttg cttaaattca atcccccctc 4860

gttcagtgtc aactgtaatg gtaggaaatt accatacttt tgaagaagca aaaaaaatga 4920

aagaaaaaaa aaatcgtatt tccaggttag acgttccgca gaatctagaa tgcggtatgc 4980

ggtacattgt tcttcgaacg taaaagttgc gctccctgag atattgtaca tttttgcttt 5040

tacaagtaca agtacatcgt acaactatgt actactgttg atgcatccac aacagtttgt 5100

tttgtttttt tttgtttttt ttttttctaa tgattcatta ccgctatgta tacctacttg 5160

tacttgtagt aagccgggtt attggcgttc aattaatcat agacttatga atctgcacgg 5220

tgtgcgctgc gagttacttt tagcttatgc atgctacttg ggtgtaatat tgggatctgt 5280

tcggaaatca acggatgctc aatcgatttc gacagtaatt aattaagtca tacacaagtc 5340

agctttcttc gagcctcata taagtataag tagttcaacg tattagcact gtacccagca 5400

tctccgtatc gagaaacaca acaacatgcc ccattggaca gatcatgcgg atacacaggt 5460

tgtgcagtat catacatact cgatcagaca ggtcgtctga ccatcataca agctgaacaa 5520

gcgctccatacttgcacgct ctctatatac acagttaaat tacatatcca tagtctaacc 5580

tctaacagtt aatcttctgg taagcctccc agccagcctt ctggtatcgc ttggcctcct 5640

caataggatc tcggttctgg ccgtacagac ctcggccgac aattatgata tccgttccgg 5700

tagacatgac atcctcaaca gttcggtact gctgtccgag agcgtctccc ttgtcgtcaa 5760

gacccacccc gggggtcaga ataagccagt cctcagagtc gcccttaggt cggttctggg 5820

caatgaagcc aaccacaaac tcggggtcgg atcgggcaag ctcaatggtc tgcttggagt 5880

actcgccagt ggccagagag cccttgcaag acagctcggc cagcatgagc agacctctgg 5940

ccagcttctc gttgggagag gggactagga actccttgta ctgggagttc tcgtagtcag 6000

agacgtcctc cttcttctgt tcagagacag tttcctcggc accagctcgc aggccagcaa 6060

tgattccggt tccgggtaca ccgtgggcgt tggtgatatc ggaccactcg gcgattcggt 6120

gacaccggta ctggtgcttg acagtgttgc caatatctgc gaactttctg tcctcgaaca 6180

ggaagaaacc gtgcttaaga gcaagttcct tgagggggag cacagtgccg gcgtaggtga 6240

agtcgtcaat gatgtcgata tgggttttga tcatgcacac ataaggtccg accttatcgg 6300

caagctcaat gagctccttg gtggtggtaa catccagaga agcacacagg ttggttttct 6360

tggctgccac gagcttgagc actcgagcgg caaaggcgga cttgtggacg ttagctcgag 6420

cttcgtagga gggcattttg gtggtgaaga ggagactgaa ataaatttag tctgcagaac 6480

tttttatcgg aaccttatct ggggcagtga agtatatgtt atggtaatag ttacgagtta 6540

gttgaactta tagatagact ggactatacg gctatcggtc caaattagaa agaacgtcaa 6600

tggctctctg ggcgtcgcct ttgccgacaa aaatgtgatc atgatgaaag ccagcaatga 6660

cgttgcagct gatattgttg tcggccaacc gcgccgaaaa cgcagctgtc agacccacag 6720

cctccaacga agaatgtatc gtcaaagtga tccaagcaca ctcatagttg gagtcgtact 6780

ccaaaggcgg caatgacgag tcagacagat actcgtcgac gtttaaacag tgtacgcaga 6840

tctactatag aggaacattt aaattgcccc ggagaagacg gccaggccgc ctagatgaca 6900

aattcaacaa ctcacagctg actttctgcc attgccacta ggggggggcc tttttatatg 6960

gccaagccaa gctctccacg tcggttgggc tgcacccaac aataaatggg tagggttgca 7020

ccaacaaagg gatgggatgg ggggtagaag atacgaggat aacggggctc aatggcacaa 7080

ataagaacga atactgccat taagactcgt gatccagcga ctgacaccat tgcatcatct 7140

aagggcctca aaactacctc ggaactgctg cgctgatctg gacaccacag aggttccgag 7200

cactttaggt tgcaccaaat gtcccaccag gtgcaggcag aaaacgctgg aacagcgtgt 7260

acagtttgtc ttaacaaaaa gtgagggcgc tgaggtcgag cagggtggtg tgacttgtta 7320

tagcctttag agctgcgaaa gcgcgtatgg atttggctca tcaggccaga ttgagggtct 7380

gtggacacat gtcatgttag tgtacttcaa tcgccccctg gatatagccc cgacaatagg 7440

ccgtggcctc atttttttgc cttccgcaca tttccattgc tcgataccca caccttgctt 7500

ctcctgcact tgccaacctt aatactggtt tacattgacc aacatcttac aagcgggggg 7560

cttgtctagg gtatatataa acagtggctc tcccaatcgg ttgccagtct cttttttcct 7620

ttctttcccc acagattcga aatctaaact acacatcaca gaattccgag ccgtgagtat 7680

ccacgacaag atcagtgtcg agacgacgcg ttttgtgtaa tgacacaatc cgaaagtcgc 7740

tagcaacaca cactctctac acaaactaac ccagctctgg tac 7783

<210>20

<211>19

<212>DNA

<213>人工序列

<220>

<223>引物oYFBA1

<400>20

acgcagatc t ac tatagag 19

<210>21

<211>27

<212>DNA

<213>人工序列

<220>

<223>引物oYFBA1-6

<400>21

agcggccgct ggtaccagag ctgggtt 27

<210>22

<211>6992

<212>DNA

<213>人工序列

<220>

<223>质粒pY158

<400>22

ggccgcaagt gtggatgggg aagtgagtgc ccggttctgt gtgcacaatt ggcaatccaa 60

gatggatgga ttcaacacag ggatatagcg agctacgtgg tggtgcgagg atatagcaac 120

ggatatttat gtttgacact tgagaatgta cgatacaagc actgtccaag tacaatacta 180

aacatactgt acatactcat actcgtaccc ggcaacggtt tcacttgagt gcagtggcta 240

gtgctcttac tcgtacagtg tgcaatactg cgtatcatag tctttgatgt atatcgtatt 300

cattcatgtt agttgcgtac gagccggaag cataaagtgt aaagcctggg gtgcctaatg 360

agtgagctaa ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct 420

gtcgtgccag ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg 480

gcgctcttcc gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc 540

ggtatcagct cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg 600

aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct 660

ggcgtttttc cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca 720

gaggtggcga aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct 780

cgtgcgctct cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc 840

gggaagcgtg gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt 900

tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc 960

cggtaactat cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc 1020

cactggtaac aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg 1080

gtggcctaac tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc 1140

agttaccttc ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag 1200

cggtggtttt tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga 1260

tcctttgatc ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat 1320

tttggtcatg agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag 1380

ttttaaatca atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat 1440

cagtgaggca cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc 1500

cgtcgtgtag ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat 1560

accgcgagac ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag 1620

ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg 1680

ccgggaagct agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc 1740

tacaggcatc gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca 1800

acgatcaagg cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg 1860

tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc 1920

actgcataat tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta 1980

ctcaaccaag tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc 2040

aatacgggat aataccgcgc cacatagcag aactttaaaa gtgctcatca ttggaaaacg 2100

ttcttcgggg cgaaaactct caaggatctt accgctgttg agatccagtt cgatgtaacc 2160

cactcgtgca cccaactgat cttcagcatc ttttactttc accagcgttt ctgggtgagc 2220

aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat 2280

actcatactc ttcctttttc aatattattg aagcatttat cagggttatt gtctcatgag 2340

cggatacata tttgaatgta tttagaaaaa taaacaaata ggggttccgc gcacatttcc 2400

ccgaaaagtg ccacctgacg cgccctgtag cggcgcatta agcgcggcgg gtgtggtggt 2460

tacgcgcagc gtgaccgcta cacttgccag cgccctagcg cccgctcctt tcgctttctt 2520

cccttccttt ctcgccacgt tcgccggctt tccccgtcaa gctctaaatc gggggctccc 2580

tttagggttc cgatttagtg ctttacggca cctcgacccc aaaaaacttg attagggtga 2640

tggttcacgt agtgggccat cgccctgata gacggttttt cgccctttga cgttggagtc 2700

cacgttcttt aatagtggac tcttgttcca aactggaaca acactcaacc ctatctcggt 2760

ctattctttt gatttataag ggattttgcc gatttcggcc tattggttaa aaaatgagct 2820

gatttaacaa aaatttaacg cgaattttaa caaaatatta acgcttacaa tttccattcg 2880

ccattcaggc tgcgcaactg ttgggaaggg cgatcggtgc gggcctcttc gctattacgc 2940

cagctggcga aagggggatg tgctgcaagg cgattaagtt gggtaacgcc agggttttcc 3000

cagtcacgac gttgtaaaac gacggccagt gaattgtaat acgactcact atagggcgaa 3060

ttgggtaccg ggccccccct cgaggtcgat ggtgtcgata agcttgatat cgaattcatg 3120

tcacacaaac cgatcttcgc ctcaaggaaa cctaattcta catccgagag actgccgaga 3180

tccagtctac actgattaat tttcgggcca ataatttaaa aaaatcgtgt tatataatat 3240

tatatgtatt atatatatac atcatgatga tactgacagt catgtcccat tgctaaatag 3300

acagactcca tctgccgcct ccaactgatg ttctcaatat ttaaggggtc atctcgcatt 3360

gtttaataat aaacagactc catctaccgc ctccaaatga tgttctcaaa atatattgta 3420

tgaacttatt tttattactt agtattatta gacaacttac ttgctttatg aaaaacactt 3480

cctatttagg aaacaattta taatggcagt tcgttcattt aacaatttat gtagaataaa 3540

tgttataaat gcgtatggga aatcttaaat atggatagca taaatgatat ctgcattgcc 3600

taattcgaaa tcaacagcaa cgaaaaaaat cccttgtaca acataaatag tcatcgagaa 3660

atatcaacta tcaaagaaca gctattcaca cgttactatt gagattatta ttggacgaga 3720

atcacacact caactgtctt tctctcttct agaaatacag gtacaagtat gtactattct 3780

cattgttcat acttctagtc atttcatccc acatattcct tggatttctc tccaatgaat 3840

gacattctat cttgcaaatt caacaattat aataagatat accaaagtag cggtatagtg 3900

gcaatcaaaa agcttctctg gtgtgcttct cgtatttatt tttattctaa tgatccatta 3960

aaggtatata tttatttctt gttatataat ccttttgttt attacatggg ctggatacat 4020

aaaggtattt tgatttaatt ttttgcttaa attcaatccc ccctcgttca gtgtcaactg 4080

taatggtagg aaattaccat acttttgaag aagcaaaaaa aatgaaagaa aaaaaaaatc 4140

gtatttccag gttagacgtt ccgcagaatc tagaatgcgg tatgcggtac attgttcttc 4200

gaacgtaaaa gttgcgctcc ctgagatatt gtacattttt gcttttacaa gtacaagtac 4260

atcgtacaac tatgtactac tgttgatgca tccacaacag tttgttttgt ttttttttgt 4320

tttttttttt tctaatgatt cattaccgct atgtatacct acttgtactt gtagtaagcc 4380

gggttattgg cgttcaatta atcatagact tatgaatctg cacggtgtgc gctgcgagtt 4440

acttttagct tatgcatgct acttgggtgt aatattggga tctgttcgga aatcaacgga 4500

tgctcaatcg atttcgacag taattaatta agtcatacac aagtcagctt tcttcgagcc 4560

tcatataagt ataagtagtt caacgtatta gcactgtacc cagcatctcc gtatcgagaa 4620

acacaacaac atgccccatt ggacagatca tgcggataca caggttgtgc agtatcatac 4680

atactcgatc agacaggtcg tctgaccatc atacaagctg aacaagcgct ccatacttgc 4740

acgctctcta tatacacagt taaattacat atccatagtc taacctctaa cagttaatct 4800

tctggtaagc ctcccagcca gccttctggt atcgcttggc ctcctcaata ggatctcggt 4860

tctggccgta cagacctcgg ccgacaatta tgatatccgt tccggtagac atgacatcct 4920

caacagttcg gtactgctgt ccgagagcgt ctcccttgtc gtcaagaccc accccggggg 4980

tcagaataag ccagtcctca gagtcgccct taggtcggtt ctgggcaatg aagccaacca 5040

caaactcggg gtcggatcgg gcaagctcaa tggtctgctt ggagtactcg ccagtggcca 5100

gagagccctt gcaagacagc tcggccagca tgagcagacc tctggccagc ttctcgttgg 5160

gagaggggac taggaactcc ttgtactggg agttctcgta gtcagagacg tcctccttct 5220

tctgttcaga gacagtttcc tcggcaccag ctcgcaggcc agcaatgatt ccggttccgg 5280

gtacaccgtg ggcgttggtg atatcggacc actcggcgat tcggtgacac cggtactggt 5340

gcttgacagt gttgccaata tctgcgaact ttctgtcctc gaacaggaag aaaccgtgct 5400

taagagcaag ttccttgagg gggagcacag tgccggcgta ggtgaagtcg tcaatgatgt 5460

cgatatgggt tttgatcatg cacacataag gtccgacctt atcggcaagc tcaatgagct 5520

ccttggtggt ggtaacatcc agagaagcac acaggttggt tttcttggct gccacgagct 5580

tgagcactcg agcggcaaag gcggacttgt ggacgttagc tcgagcttcg taggagggca 5640

ttttggtggt gaagaggaga ctgaaataaa tttagtctgc agaacttttt atcggaacct 5700

tatctggggc agtgaagtat atgttatggt aatagttacg agttagttga acttatagat 5760

agactggact atacggctat cggtccaaat tagaaagaac gtcaatggct ctctgggcgt 5820

cgcctttgcc gacaaaaatg tgatcatgat gaaagccagc aatgacgttg cagctgatat 5880

tgttgtcggc caaccgcgcc gaaaacgcag ctgtcagacc cacagcctcc aacgaagaat 5940

gtatcgtcaa agtgatccaa gcacactcat agttggagtc gtactccaaa ggcggcaatg 6000

acgagtcaga cagatactcg tcgacgttta aacagtgtac gcagatctac tatagaggaa 6060

catttaaatt gccccggaga agacggccag gccgcctaga tgacaaattc aacaactcac 6120

agctgacttt ctgccattgc cactaggggg gggccttttt atatggccaa gccaagctct 6180

ccacgtcggt tgggctgcac ccaacaataa atgggtaggg ttgcaccaac aaagggatgg 6240

gatggggggt agaagatacg aggataacgg ggctcaatgg cacaaataag aacgaatact 6300

gccattaaga ctcgtgatcc agcgactgac accattgcat catctaaggg cctcaaaact 6360

acctcggaac tgctgcgctg atctggacac cacagaggtt ccgagcactt taggttgcac 6420

caaatgtccc accaggtgca ggcagaaaac gctggaacag cgtgtacagt ttgtcttagc 6480

aaaaagtgaa ggcgctgagg tcgagcaggg tggtgtgact tgttatagcc tttagagctg 6540

cgaaagcgcg tatggatttg gctcatcagg ccagattgag ggtctgtgga cacatgtcat 6600

gttagtgtac ttcaatcgcc ccctggatat agccccgaca ataggccgtg gcctcatttt 6660

tttgccttcc gcacatttcc attgctcgat acccacacct tgcttctcct gcacttgcca 6720

accttaatac tggtttacat tgaccaacat cttacaagcg gggggcttgt ctagggtata 6780

tataaacagt ggctctccca atcggttgcc agtctctttt ttcctttctt tccccacaga 6840

ttcgaaatct aaactacaca tcacagaatt ccgagccgtg agtatccacg acaagatcag 6900

tgtcgagacg acgcgttttg tgtaatgaca caatccgaaa gtcgctagca acacacactc 6960

tctacacaaa ctaacccagc tctggtacca gc 6992

<210>23

<211>8707

<212>DNA

<213>人工序列

<220>

<223>质粒pY159

<400>23

ggccgcaagt gtggatgggg aagtgagtgc ccggttctgt gtgcacaatt ggcaatccaa 60

gatggatgga ttcaacacag ggatatagcg agctacgtgg tggtgcgagg atatagcaac 120

ggatatttat gtttgacact tgagaatgta cgatacaagc actgtccaag tacaatacta 180

aacatactgt acatactcat actcgtaccc ggcaacggtt tcacttgagt gcagtggcta 240

gtgctcttac tcgtacagtg tgcaatactg cgtatcatag tctttgatgt atatcgtatt 300

cattcatgtt agttgcgtac gagccggaag cataaagtgt aaagcctggg gtgcctaatg 360

agtgagctaa ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct 420

gtcgtgccag ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg 480

gcgctcttcc gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc 540

ggtatcagct cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg 600

aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct 660

ggcgtttttc cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca 720

gaggtggcga aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct 780

cgtgcgctct cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc 840

gggaagcgtg gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt 900

tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc 960

cggtaactat cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc 1020

cactggtaac aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg 1080

gtggcctaac tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc 1140

agttaccttc ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag 1200

cggtggtttt tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga 1260

tcctttgatc ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat 1320

tttggtcatg agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag 1380

ttttaaatca atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat 1440

cagtgaggca cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc 1500

cgtcgtgtag ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat 1560

accgcgagac ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag 1620

ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg 1680

ccgggaagct agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc 1740

tacaggcatc gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca 1800

acgatcaagg cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg 1860

tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc 1920

actgcataat tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta 1980

ctcaaccaag tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc 2040

aatacgggat aataccgcgc cacatagcag aactttaaaagtgctcatca ttggaaaacg 2100

ttcttcgggg cgaaaactct caaggatctt accgctgttg agatccagtt cgatgtaacc 2160

cactcgtgca cccaactgat cttcagcatc ttttactttc accagcgttt ctgggtgagc 2220

aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat 2280

actcatactc ttcctttttc aatattattg aagcatttat cagggttatt gtctcatgag 2340

cggatacata tttgaatgta tttagaaaaa taaacaaata ggggttccgc gcacatttcc 2400

ccgaaaagtg ccacctgacg cgccctgtag cggcgcatta agcgcggcgg gtgtggtggt 2460

tacgcgcagc gtgaccgcta cacttgccag cgccctagcg cccgctcctt tcgctttctt 2520

cccttccttt ctcgccacgt tcgccggctt tccccgtcaa gctctaaatc gggggctccc 2580

tttagggttc cgatttagtg ctttacggca cctcgacccc aaaaaacttg attagggtga 2640

tggttcacgt agtgggccat cgccctgata gacggttttt cgccctttga cgttggagtc 2700

cacgttcttt aatagtggac tcttgttcca aactggaaca acactcaacc ctatctcggt 2760

ctattctttt gatttataag ggattttgcc gatttcggcc tattggttaa aaaatgagct 2820

gatttaacaa aaatttaacg cgaattttaa caaaatatta acgcttacaa tttccattcg 2880

ccattcaggc tgcgcaactg ttgggaaggg cgatcggtgc gggcctcttc gctattacgc 2940

cagctggcga aagggggatg tgctgcaagg cgattaagtt gggtaacgcc agggttttcc 3000

cagtcacgac gttgtaaaac gacggccagt gaattgtaat acgactcact atagggcgaa 3060

ttgggtaccg ggccccccct cgaggtcgat ggtgtcgata agcttgatat cgaattcatg 3120

tcacacaaac cgatcttcgc ctcaaggaaa cctaattcta catccgagag actgccgaga 3180

tccagtctac actgattaat tttcgggcca ataatttaaa aaaatcgtgt tatataatat 3240

tatatgtatt atatatatac atcatgatga tactgacagt catgtcccat tgctaaatag 3300

acagactcca tctgccgcct ccaactgatg ttctcaatat ttaaggggtc atctcgcatt 3360

gtttaataat aaacagactc catctaccgc ctccaaatga tgttctcaaa atatattgta 3420

tgaacttatt tttattactt agtattatta gacaacttac ttgctttatg aaaaacactt 3480

cctatttagg aaacaattta taatggcagt tcgttcattt aacaatttat gtagaataaa 3540

tgttataaat gcgtatggga aatcttaaat atggatagca taaatgatat ctgcattgcc 3600

taattcgaaa tcaacagcaa cgaaaaaaat cccttgtaca acataaatag tcatcgagaa 3660

atatcaacta tcaaagaaca gctattcaca cgttactatt gagattatta ttggacgaga 3720

atcacacact caactgtctt tctctcttct agaaatacag gtacaagtat gtactattct 3780

cattgttcat acttctagtc atttcatccc acatattcct tggatttctc tccaatgaat 3840

gacattctat cttgcaaatt caacaattat aataagatat accaaagtag cggtatagtg 3900

gcaatcaaaa agcttctctg gtgtgcttct cgtatttatt tttattctaa tgatccatta 3960

aaggtatata tttatttctt gttatataat ccttttgttt attacatggg ctggatacat 4020

aaaggtattt tgatttaatt ttttgcttaa attcaatccc ccctcgttca gtgtcaactg 4080

taatggtagg aaattaccat acttttgaag aagcaaaaaa aatgaaagaa aaaaaaaatc 4140

gtatttccag gttagacgtt ccgcagaatc tagaatgcgg tatgcggtac attgttcttc 4200

gaacgtaaaa gttgcgctcc ctgagatatt gtacattttt gcttttacaa gtacaagtac 4260

atcgtacaac tatgtactac tgttgatgca tccacaacag tttgttttgt ttttttttgt 4320

tttttttttt tctaatgatt cattaccgct atgtatacct acttgtactt gtagtaagcc 4380

gggttattgg cgttcaatta atcatagact tatgaatctg cacggtgtgc gctgcgagtt 4440

acttttagct tatgcatgct acttgggtgt aatattggga tctgttcgga aatcaacgga 4500

tgctcaatcg atttcgacag taattaatta agtcatacac aagtcagctt tcttcgagcc 4560

tcatataagt ataagtagtt caacgtatta gcactgtacc cagcatctcc gtatcgagaa 4620

acacaacaac atgccccatt ggacagatca tgcggataca caggttgtgc agtatcatac 4680

atactcgatc agacaggtcg tctgaccatc atacaagctg aacaagcgct ccatacttgc 4740

acgctctcta tatacacagt taaattacat atccatagtc taacctctaa cagttaatct 4800

tctggtaagc ctcccagcca gccttctggt atcgcttggc ctcctcaata ggatctcggt 4860

tctggccgta cagacctcgg ccgacaatta tgatatccgt tccggtagac atgacatcct 4920

caacagttcg gtactgctgt ccgagagcgt ctcccttgtc gtcaagaccc accccggggg 4980

tcagaataag ccagtcctca gagtcgccct taggtcggtt ctgggcaatg aagccaacca 5040

caaactcggg gtcggatcgg gcaagctcaa tggtctgctt ggagtactcg ccagtggcca 5100

gagagccctt gcaagacagc tcggccagca tgagcagacc tctggccagc ttctcgttgg 5160

gagaggggac taggaactcc ttgtactggg agttctcgta gtcagagacg tcctccttct 5220

tctgttcaga gacagtttcc tcggcaccag ctcgcaggcc agcaatgatt ccggttccgg 5280

gtacaccgtg ggcgttggtg atatcggacc actcggcgat tcggtgacac cggtactggt 5340

gcttgacagt gttgccaata tctgcgaact ttctgtcctc gaacaggaag aaaccgtgct 5400

taagagcaag ttccttgagg gggagcacag tgccggcgta ggtgaagtcg tcaatgatgt 5460

cgatatgggt tttgatcatg cacacataag gtccgacctt atcggcaagc tcaatgagct 5520

ccttggtggt ggtaacatcc agagaagcac acaggttggt tttcttggct gccacgagct 5580

tgagcactcg agcggcaaag gcggacttgt ggacgttagc tcgagcttcg taggagggca 5640

ttttggtggt gaagaggaga ctgaaataaa tttagtctgc agaacttttt atcggaacct 5700

tatctggggc agtgaagtat atgttatggt aatagttacg agttagttga acttatagat 5760

agactggact atacggctat cggtccaaat tagaaagaac gtcaatggct ctctgggcgt 5820

cgcctttgcc gacaaaaatg tgatcatgat gaaagccagc aatgacgttg cagctgatat 5880

tgttgtcggc caaccgcgcc gaaaacgcag ctgtcagacc cacagcctcc aacgaagaat 5940

gtatcgtcaa agtgatccaa gcacactcat agttggagtc gtactccaaa ggcggcaatg 6000

acgagtcaga cagatactcg tcgacgttta aacagtgtac gcagatctac tatagaggaa 6060

catttaaatt gccccggaga agacggccag gccgcctaga tgacaaattc aacaactcac 6120

agctgacttt ctgccattgc cactaggggg gggccttttt atatggccaa gccaagctct 6180

ccacgtcggt tgggctgcac ccaacaataa atgggtaggg ttgcaccaac aaagggatgg 6240

gatggggggt agaagatacg aggataacgg ggctcaatgg cacaaataag aacgaatact 6300

gccattaaga ctcgtgatcc agcgactgac accattgcat catctaaggg cctcaaaact 6360

acctcggaac tgctgcgctg atctggacac cacagaggtt ccgagcactt taggttgcac 6420

caaatgtccc accaggtgca ggcagaaaac gctggaacag cgtgtacagt ttgtcttagc 6480

aaaaagtgaa ggcgctgagg tcgagcaggg tggtgtgact tgttatagcc tttagagctg 6540

cgaaagcgcg tatggatttg gctcatcagg ccagattgag ggtctgtgga cacatgtcat 6600

gttagtgtac ttcaatcgcc ccctggatat agccccgaca ataggccgtg gcctcatttt 6660

tttgccttcc gcacatttcc attgctcgat acccacacct tgcttctcct gcacttgcca 6720

accttaatac tggtttacat tgaccaacat cttacaagcg gggggcttgt ctagggtata 6780

tataaacagt ggctctccca atcggttgcc agtctctttt ttcctttctt tccccacaga 6840

ttcgaaatct aaactacaca tcacagaatt ccgagccgtg agtatccacg acaagatcag 6900

tgtcgagacg acgcgttttg tgtaatgaca caatccgaaa gtcgctagca acacacactc 6960

tctacacaaa ctaacccagc tctggtacca gcggccatca caagtttgta caaaaaagct 7020

gaacgagaaa cgtaaaatga tataaatatc aatatattaa attagatttt gcataaaaaa 7080

cagactacat aatactgtaa aacacaacat atccagtcat attggcggcc gcattaggca 7140

ccccaggctt tacactttat gcttccggct cgtataatgt gtggattttg agttaggatc 7200

cgtcgagatt ttcaggagct aaggaagcta aaatggagaa aaaaatcact ggatatacca 7260

ccgttgatat atcccaatgg catcgtaaag aacattttga ggcatttcag tcagttgctc 7320

aatgtaccta taaccagacc gttcagctgg atattacggc ctttttaaag accgtaaaga 7380

aaaataagca caagttttat ccggccttta ttcacattct tgcccgcctg atgaatgctc 7440

atccggaatt ccgtatggca atgaaagacg gtgagctggt gatatgggat agtgttcacc 7500

cttgttacac cgttttccat gagcaaactg aaacgttttc atcgctctgg agtgaatacc 7560

acgacgattt ccggcagttt ctacacatat attcgcaaga tgtggcgtgt tacggtgaaa 7620

acctggccta tttccctaaa gggtttattg agaatatgtt tttcgtctca gccaatccct 7680

gggtgagttt caccagtttt gatttaaacg tggccaatat ggacaacttc ttcgcccccg 7740

ttttcaccat gggcaaatat tatacgcaag gcgacaaggt gctgatgccg ctggcgattc 7800

aggttcatca tgccgtttgt gatggcttcc atgtcggcag aatgcttaat gaattacaac 7860

agtactgcga tgagtggcag ggcggggcgt aaacgcgtgg atccggctta ctaaaagcca 7920

gataacagta tgcgtatttg cgcgctgatt tttgcggtat aagaatatat actgatatgt 7980

atacccgaag tatgtcaaaa agaggtatgc tatgaagcag cgtattacag tgacagttga 8040

cagcgacagc tatcagttgc tcaaggcata tatgatgtca atatctccgg tctggtaagc 8100

acaaccatgc agaatgaagc ccgtcgtctg cgtgccgaac gctggaaagc ggaaaatcag 8160

gaagggatgg ctgaggtcgc ccggtttatt gaaatgaacg gctcttttgc tgacgagaac 8220

aggggctggt gaaatgcagt ttaaggttta cacctataaa agagagagcc gttatcgtct 8280

gtttgtggat gtacagagtg atattattga cacgcccggg cgacggatgg tgatccccct 8340

ggccagtgca cgtctgctgt cagataaagt ctcccgtgaa ctttacccgg tggtgcatat 8400

cggggatgaa agctggcgca tgatgaccac cgatatggcc agtgtgccgg tctccgttat 8460

cggggaagaa gtggctgatc tcagccaccg cgaaaatgac atcaaaaacg ccattaacct 8520

gatgttctgg ggaatataaa tgtcaggctc ccttatacac agccagtctg caggtcgacc 8580

atagtgactg gatatgttgt gttttacagc attatgtagt ctgtttttta tgcaaaatct 8640

aatttaatat attgatattt atatcatttt acgtttctcg ttcagctttc ttgtacaaag 8700

tggtgat 8707

<210>24

<211>8219

<212>DNA

<213>人工序列

<220>

<223>质粒pY173

<220>

<221>misc_feature

<222>(8170)..(8209)

<223>n为a，c，g，或t

<400>24

cttgtacaaa gtggtgatgg ccgcaagtgt ggatggggaa gtgagtgccc ggttctgtgt 60

gcacaattgg caatccaaga tggatggatt caacacaggg atatagcgag ctacgtggtg 120

gtgcgaggat atagcaacgg atatttatgt ttgacacttg agaatgtacg atacaagcac 180

tgtccaagta caatactaaa catactgtac atactcatac tcgtacccgg caacggtttc 240

acttgagtgc agtggctagt gctcttactc gtacagtgtg caatactgcg tatcatagtc 300

tttgatgtat atcgtattca ttcatgttag ttgcgtacga gccggaagca taaagtgtaa 360

agcctggggt gcctaatgag tgagctaact cacattaatt gcgttgcgct cactgcccgc 420

tttccagtcg ggaaacctgt cgtgccagct gcattaatga atcggccaac gcgcggggag 480

aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt 540

cgttcggctg cggcgagcgg tatcagctcactcaaaggcgg taatacggtt atccacaga 600

atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg 660

taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa 720

aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt 780

tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct 840

gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct 900

cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc 960

cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt 1020

atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc 1080

tacagagttc ttgaagtggt ggcctaacta cggctacact agaaggacag tatttggtat 1140

ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa 1200

acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa 1260

aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga 1320

aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct 1380

tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga 1440

cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc 1500

catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct taccatctgg 1560

ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt tatcagcaat 1620

aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat ccgcctccat 1680

ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta atagtttgcg 1740

caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc 1800

attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa 1860

agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg cagtgttatc 1920

actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg taagatgctt 1980

ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc ggcgaccgag 2040

ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa ctttaaaagt 2100

gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac cgctgttgag 2160

atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt ttactttcac 2220

cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc 2280

gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa gcatttatca 2340

gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata aacaaatagg 2400

ggttccgcgc acatttcccc gaaaagtgcc acctgacgcg ccctgtagcg gcgcattaag 2460

cgcggcgggt gtggtggtta cgcgcagcgt gaccgctaca cttgccagcg ccctagcgcc 2520

cgctcctttc gctttcttcc cttcctttct cgccacgttc gccggctttc cccgtcaagc 2580

tctaaatcgg gggctccctt tagggttccg atttagtgct ttacggcacc tcgaccccaa 2640

aaaacttgat tagggtgatg gttcacgtag tgggccatcg ccctgataga cggtttttcg 2700

ccctttgacg ttggagtcca cgttctttaa tagtggactc ttgttccaaa ctggaacaac 2760

actcaaccct atctcggtct attcttttga tttataaggg attttgccga tttcggccta 2820

ttggttaaaa aatgagctga tttaacaaaa atttaacgcg aattttaaca aaatattaac 2880

gcttacaatt tccattcgcc attcaggctg cgcaactgtt gggaagggcg atcggtgcgg 2940

gcctcttcgc tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg 3000

gtaacgccag ggttttccca gtcacgacgt tgtaaaacga cggccagtga attgtaatac 3060

gactcactat agggcgaatt gggtaccggg ccccccctcg aggtcgatgg tgtcgataag 3120

cttgatatcg aattcatgtc acacaaaccg atcttcgcct caaggaaacc taattctaca 3180

tccgagagac tgccgagatc cagtctacac tgattaattt tcgggccaat aatttaaaaa 3240

aatcgtgtta tataatatta tatgtattat atatatacat catgatgata ctgacagtca 3300

tgtcccattg ctaaatagac agactccatc tgccgcctcc aactgatgtt ctcaatattt 3360

aaggggtcat ctcgcattgt ttaataataa acagactcca tctaccgcct ccaaatgatg 3420

ttctcaaaat atattgtatg aacttatttt tattacttag tattattaga caacttactt 3480

gctttatgaa aaacacttcc tatttaggaa acaatttata atggcagttc gttcatttaa 3540

caatttatgt agaataaatg ttataaatgc gtatgggaaa tcttaaatat ggatagcata 3600

aatgatatct gcattgccta attcgaaatc aacagcaacg aaaaaaatcc cttgtacaac 3660

ataaatagtc atcgagaaat atcaactatc aaagaacagc tattcacacg ttactattga 3720

gattattatt ggacgagaat cacacactca actgtctttc tctcttctag aaatacaggt 3780

acaagtatgt actattctca ttgttcatac ttctagtcat ttcatcccac atattccttg 3840

gatttctctc caatgaatga cattctatct tgcaaattca acaattataa taagatatac 3900

caaagtagcg gtatagtggc aatcaaaaag cttctctggt gtgcttctcg tatttatttt 3960

tattctaatg atccattaaa ggtatatatt tatttcttgt tatataatcc ttttgtttat 4020

tacatgggct ggatacataa aggtattttg atttaatttt ttgcttaaat tcaatccccc 4080

ctcgttcagt gtcaactgta atggtaggaa attaccatac ttttgaagaa gcaaaaaaaa 4140

tgaaagaaaa aaaaaatcgt atttccaggt tagacgttcc gcagaatcta gaatgcggta 4200

tgcggtacat tgttcttcga acgtaaaagt tgcgctccct gagatattgt acatttttgc 4260

ttttacaagt acaagtacat cgtacaacta tgtactactg ttgatgcatc cacaacagtt 4320

tgttttgttt ttttttgttt tttttttttc taatgattca ttaccgctat gtatacctac 4380

ttgtacttgt agtaagccgg gttattggcg ttcaattaat catagactta tgaatctgca 4440

cggtgtgcgc tgcgagttac ttttagctta tgcatgctac ttgggtgtaa tattgggatc 4500

tgttcggaaa tcaacggatg ctcaatcgat ttcgacagta attaattaag tcatacacaa 4560

gtcagctttc ttcgagcctc atataagtat aagtagttca acgtattagc actgtaccca 4620

gcatctccgt atcgagaaac acaacaacat gccccattgg acagatcatg cggatacaca 4680

ggttgtgcag tatcatacat actcgatcag acaggtcgtc tgaccatcat acaagctgaa 4740

caagcgctcc atacttgcac gctctctata tacacagtta aattacatat ccatagtcta 4800

acctctaaca gttaatcttc tggtaagcct cccagccagc cttctggtat cgcttggcct 4860

cctcaatagg atctcggttc tggccgtaca gacctcggcc gacaattatg atatccgttc 4920

cggtagacat gacatcctca acagttcggt actgctgtcc gagagcgtct cccttgtcgt 4980

caagacccac cccgggggtc agaataagcc agtcctcaga gtcgccctta ggtcggttct 5040

gggcaatgaa gccaaccaca aactcggggt cggatcgggc aagctcaatg gtctgcttgg 5100

agtactcgcc agtggccaga gagcccttgc aagacagctc ggccagcatg agcagacctc 5160

tggccagctt ctcgttggga gaggggacta ggaactcctt gtactgggag ttctcgtagt 5220

cagagacgtc ctccttcttc tgttcagaga cagtttcctc ggcaccagct cgcaggccag 5280

caatgattcc ggttccgggt acaccgtggg cgttggtgat atcggaccac tcggcgattc 5340

ggtgacaccg gtactggtgc ttgacagtgt tgccaatatc tgcgaacttt ctgtcctcga 5400

acaggaagaa accgtgctta agagcaagtt ccttgagggg gagcacagtg ccggcgtagg 5460

tgaagtcgtc aatgatgtcg atatgggttt tgatcatgca cacataaggt ccgaccttat 5520

cggcaagctc aatgagctcc ttggtggtgg taacatccag agaagcacac aggttggttt 5580

tcttggctgc cacgagcttg agcactcgag cggcaaaggc ggacttgtgg acgttagctc 5640

gagcttcgta ggagggcatt ttggtggtga agaggagact gaaataaatt tagtctgcag 5700

aactttttat cggaacctta tctggggcag tgaagtatat gttatggtaa tagttacgag 5760

ttagttgaac ttatagatag actggactat acggctatcg gtccaaatta gaaagaacgt 5820

caatggctct ctgggcgtcg cctttgccga caaaaatgtg atcatgatga aagccagcaa 5880

tgacgttgca gctgatattg ttgtcggcca accgcgccga aaacgcagct gtcagaccca 5940

cagcctccaa cgaagaatgt atcgtcaaag tgatccaagc acactcatag ttggagtcgt 6000

actccaaagg cggcaatgac gagtcagaca gatactcgtc gacgtttaaa cagtgtacgc 6060

agatctacta tagaggaaca tttaaattgc cccggagaag acggccaggc cgcctagatg 6120

acaaattcaa caactcacag ctgactttct gccattgcca ctaggggggg gcctttttat 6180

atggccaagc caagctctcc acgtcggttg ggctgcaccc aacaataaat gggtagggtt 6240

gcaccaacaa agggatggga tggggggtag aagatacgag gataacgggg ctcaatggca 6300

caaataagaa cgaatactgc cattaagact cgtgatccag cgactgacac cattgcatca 6360

tctaagggcc tcaaaactac ctcggaactg ctgcgctgat ctggacacca cagaggttcc 6420

gagcacttta ggttgcacca aatgtcccac caggtgcagg cagaaaacgc tggaacagcg 6480

tgtacagttt gtcttagcaa aaagtgaagg cgctgaggtc gagcagggtg gtgtgacttg 6540

ttatagcctt tagagctgcg aaagcgcgta tggatttggc tcatcaggcc agattgaggg 6600

tctgtggaca catgtcatgt tagtgtactt caatcgcccc ctggatatag ccccgacaat 6660

aggccgtggc ctcatttttt tgccttccgc acatttccat tgctcgatac ccacaccttg 6720

cttctcctgc acttgccaac cttaatactg gtttacattg accaacatct tacaagcggg 6780

gggcttgtct agggtatata taaacagtgg ctctcccaat cggttgccag tctctttttt 6840

cctttctttc cccacagatt cgaaatctaa actacacatc acagaattcc gagccgtgag 6900

tatccacgac aagatcagtg tcgagacgac gcgttttgtg taatgacaca atccgaaagt 6960

cgctagcaac acacactctc tacacaaact aacccagctc tggtaccagc ggccatcaca 7020

agtttgtaca aaaaagttgg tttttttcgg tctaaaatgg aagcagccaa agaattggtt 7080

tccatcgtcc aagaggagct ccccaaggtg gactatgccc agctttggca ggatgccagc 7140

agctgtgagg tcctttacct ctcggtggca ttcgtggcga tcaagttcat gctgcgccca 7200

ctggacctga agcgccaggc caccttgaag aagctgttca cagcatacaa cttcctcatg 7260

tcgatctatt cctttggctc cttcctggcc atggcctatg ccctatcagt aactggcatc 7320

ctctccggcg actgtgagac ggcgttcaac aacgatgtgt tcaggatcac aactcagctg 7380

ttctacctca gcaagttcgt agagtacatc gactccttct accttcccct tatggacaag 7440

ccactgtcgt tccttcagtt cttccatcat ttgggggccc ccattgacat gtggctattc 7500

tacaaatacc gcaacgaagg agtctggatc tttgtcctgt tgaatgggtt cattcactgg 7560

atcatgtacg gttactattg gacgcggctc atcaagctga acttccccat gcccaagaac 7620

ctgatcacct ccatgcagat catccagttc aatgtcgggt tctacatcgt ctggaagtac 7680

cgcaatgtgc catgctaccg ccaggatggg atgcgcatgt ttgcctggat cttcaactac 7740

tggtatgtcg ggacggtctt gctgctgttc ctcaactttt acgtgcagac gtacatccgg 7800

aagccgagga agaaccgagg gaagaaggag taggccacat ggcgcctgcg ctggaggaaa 7860

cggtacgctc ggatggtgca ctgcacttgc actccgccgt ttctagcctc ccctcgctct 7920

aaccactgcg gcatgcctgc ttgaggcgtg acgttgcctc gtatgataca gtttacaccc 7980

ttcccacagc ccacggagct ggtgactgtt tccagcgtct gcagatcatt gatctggtgc 8040

aatgtgcaca gaccaagccc ctctaacgtc ttgcggtgta ccgctcgaca ctcactgcaa 8100

gagacagatg gctgagcatg ttatagcccc ttacattcta cccttcgtcc caacctgacc 8160

gtcacattcn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnna cccaacttt 8219

<210>25

<211>8235

<212>DNA

<213>人工序列

<220>

<223>质粒pY174

<220>

<221>misc_feature

<222>(8186)..(8225)

<223>n为a，c，g，或t

<400>25

cttgtacaaa gtggtgatgg ccgcaagtgt ggatggggaa gtgagtgccc ggttctgtgt 60

gcacaattgg caatccaaga tggatggatt caacacaggg atatagcgag ctacgtggtg 120

gtgcgaggat atagcaacgg atatttatgt ttgacacttg agaatgtacg atacaagcac 180

tgtccaagta caatactaaa catactgtac atactcatac tcgtacccgg caacggtttc 240

acttgagtgc agtggctagt gctcttactc gtacagtgtg caatactgcg tatcatagtc 300

tttgatgtat atcgtattca ttcatgttag ttgcgtacga gccggaagca taaagtgtaa 360

agcctggggt gcctaatgag tgagctaact cacattaatt gcgttgcgct cactgcccgc 420

tttccagtcg ggaaacctgt cgtgccagct gcattaatga atcggccaac gcgcggggag 480

aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt 540

cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga 600

atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg 660

taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa 720

aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt 780

tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct 840

gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct 900

cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc 960

cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt 1020

atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc 1080

tacagagttc ttgaagtggt ggcctaacta cggctacact agaaggacag tatttggtat 1140

ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa 1200

acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa 1260

aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga 1320

aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct 1380

tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga 1440

cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc 1500

catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct taccatctgg 1560

ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt tatcagcaat 1620

aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat ccgcctccat 1680

ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta atagtttgcg 1740

caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc 1800

attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa 1860

agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg cagtgttatc 1920

actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg taagatgctt 1980

ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc ggcgaccgag 2040

ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa ctttaaaagt 2100

gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac cgctgttgag 2160

atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt ttactttcac 2220

cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc 2280

gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa gcatttatca 2340

gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata aacaaatagg 2400

ggttccgcgc acatttcccc gaaaagtgcc acctgacgcg ccctgtagcg gcgcattaag 2460

cgcggcgggt gtggtggtta cgcgcagcgt gaccgctaca cttgccagcg ccctagcgcc 2520

cgctcctttc gctttcttcc cttcctttct cgccacgttc gccggctttc cccgtcaagc 2580

tctaaatcgg gggctccctt tagggttccg atttagtgct ttacggcacc tcgaccccaa 2640

aaaacttgat tagggtgatg gttcacgtag tgggccatcg ccctgataga cggtttttcg 2700

ccctttgacg ttggagtcca cgttctttaa tagtggactc ttgttccaaa ctggaacaac 2760

actcaaccct atctcggtct attcttttga tttataaggg attttgccga tttcggccta 2820

ttggttaaaa aatgagctga tttaacaaaa atttaacgcg aattttaaca aaatattaac 2880

gcttacaatt tccattcgcc attcaggctg cgcaactgtt gggaagggcg atcggtgcgg 2940

gcctcttcgc tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg 3000

gtaacgccag ggttttccca gtcacgacgt tgtaaaacga cggccagtga attgtaatac 3060

gactcactat agggcgaatt gggtaccggg ccccccctcg aggtcgatgg tgtcgataag 3120

cttgatatcg aattcatgtc acacaaaccg atcttcgcct caaggaaacc taattctaca 3180

tccgagagac tgccgagatc cagtctacac tgattaattt tcgggccaat aatttaaaaa 3240

aatcgtgtta tataatatta tatgtattat atatatacat catgatgata ctgacagtca 3300

tgtcccattg ctaaatagac agactccatc tgccgcctcc aactgatgtt ctcaatattt 3360

aaggggtcat ctcgcattgt ttaataataa acagactcca tctaccgcct ccaaatgatg 3420

ttctcaaaat atattgtatg aacttatttt tattacttag tattattaga caacttactt 3480

gctttatgaa aaacacttcc tatttaggaa acaatttata atggcagttc gttcatttaa 3540

caatttatgt agaataaatg ttataaatgc gtatgggaaa tcttaaatat ggatagcata 3600

aatgatatct gcattgccta attcgaaatc aacagcaacg aaaaaaatcc cttgtacaac 3660

ataaatagtc atcgagaaat atcaactatc aaagaacagc tattcacacg ttactattga 3720

gattattatt ggacgagaat cacacactca actgtctttc tctcttctag aaatacaggt 3780

acaagtatgt actattctca ttgttcatac ttctagtcat ttcatcccac atattccttg 3840

gatttctctc caatgaatga cattctatct tgcaaattca acaattataa taagatatac 3900

caaagtagcg gtatagtggc aatcaaaaag cttctctggt gtgcttctcg tatttatttt 3960

tattctaatg atccattaaa ggtatatatt tatttcttgt tatataatcc ttttgtttat 4020

tacatgggct ggatacataa aggtattttg atttaatttt ttgcttaaat tcaatccccc 4080

ctcgttcagt gtcaactgta atggtaggaa attaccatac ttttgaagaa gcaaaaaaaa 4140

tgaaagaaaa aaaaaatcgt atttccaggt tagacgttcc gcagaatcta gaatgcggta 4200

tgcggtacat tgttcttcga acgtaaaagt tgcgctccct gagatattgt acatttttgc 4260

ttttacaagt acaagtacat cgtacaacta tgtactactg ttgatgcatc cacaacagtt 4320

tgttttgttt ttttttgttt tttttttttc taatgattca ttaccgctat gtatacctac 4380

ttgtacttgt agtaagccgg gttattggcg ttcaattaat catagactta tgaatctgca 4440

cggtgtgcgc tgcgagttac ttttagctta tgcatgctac ttgggtgtaa tattgggatc 4500

tgttcggaaa tcaacggatg ctcaatcgat ttcgacagta attaattaag tcatacacaa 4560

gtcagctttc ttcgagcctc atataagtat aagtagttca acgtattagc actgtaccca 4620

gcatctccgt atcgagaaac acaacaacat gccccattgg acagatcatg cggatacaca 4680

ggttgtgcag tatcatacat actcgatcag acaggtcgtc tgaccatcat acaagctgaa 4740

caagcgctcc atacttgcac gctctctata tacacagtta aattacatat ccatagtcta 4800

acctctaaca gttaatcttc tggtaagcct cccagccagc cttctggtat cgcttggcct 4860

cctcaatagg atctcggttc tggccgtaca gacctcggcc gacaattatg atatccgttc 4920

cggtagacat gacatcctca acagttcggt actgctgtcc gagagcgtct cccttgtcgt 498O

caagacccac cccgggggtc agaataagcc agtcctcagagtcgccctta ggtcggttct 5040

gggcaatgaa gccaaccaca aactcggggt cggatcgggc aagctcaatg gtctgcttgg 5100

agtactcgcc agtggccaga gagcccttgc aagacagctc ggccagcatg agcagacctc 5160

tggccagctt ctcgttggga gaggggacta ggaactcctt gtactgggag ttctcgtagt 5220

cagagacgtc ctccttcttc tgttcagaga cagtttcctc ggcaccagct cgcaggccag 5280

caatgattcc ggttccgggt acaccgtggg cgttggtgat atcggaccac tcggcgattc 5340

ggtgacaccg gtactggtgc ttgacagtgt tgccaatatc tgcgaacttt ctgtcctcga 5400

acaggaagaa accgtgctta agagcaagtt ccttgagggg gagcacagtg ccggcgtagg 5460

tgaagtcgtc aatgatgtcg atatgggttt tgatcatgca cacataaggt ccgaccttat 5520

cggcaagctc aatgagctcc ttggtggtgg taacatccag agaagcacac aggttggttt 5580

tcttggctgc cacgagcttg agcactcgag cggcaaaggc ggacttgtgg acgttagctc 5640

gagcttcgta ggagggcatt ttggtggtga agaggagact gaaataaatt tagtctgcag 5700

aactttttat cggaacctta tctggggcag tgaagtatat gttatggtaa tagttacgag 5760

ttagttgaac ttatagatag actggactat acggctatcg gtccaaatta gaaagaacgt 5820

caatggctct ctgggcgtcg cctttgccga caaaaatgtg atcatgatga aagccagcaa 5880

tgacgttgca gctgatattg ttgtcggcca accgcgccga aaacgcagct gtcagaccca 5940

cagcctccaa cgaagaatgt atcgtcaaag tgatccaagc acactcatag ttggagtcgt 6000

actccaaagg cggcaatgac gagtcagaca gatactcgtc gacgtttaaa cagtgtacgc 6060

agatctacta tagaggaaca tttaaattgc cccggagaag acggccaggc cgcctagatg 6120

acaaattcaa caactcacag ctgactttct gccattgcca ctaggggggg gcctttttat 6180

atggccaagc caagctctcc acgtcggttg ggctgcaccc aacaataaat gggtagggtt 6240

gcaccaacaa agggatggga tggggggtag aagatacgag gataacgggg ctcaatggca 6300

caaataagaa cgaatactgc cattaagact cgtgatccag cgactgacac cattgcatca 6360

tctaagggcc tcaaaactac ctcggaactg ctgcgctgat ctggacacca cagaggttcc 6420

gagcacttta ggttgcacca aatgtcccac caggtgcagg cagaaaacgc tggaacagcg 6480

tgtacagttt gtcttagcaa aaagtgaagg cgctgaggtc gagcagggtg gtgtgacttg 6540

ttatagcctt tagagctgcg aaagcgcgta tggatttggc tcatcaggcc agattgaggg 6600

tctgtggaca catgtcatgt tagtgtactt caatcgcccc ctggatatag ccccgacaat 6660

aggccgtggc ctcatttttt tgccttccgc acatttccat tgctcgatac ccacaccttg 6720

cttctcctgc acttgccaac cttaatactg gtttacattg accaacatct tacaagcggg 6780

gggcttgtct agggtatata taaacagtgg ctctcccaat cggttgccag tctctttttt 6840

cctttctttc cccacagatt cgaaatctaa actacacatc acagaattcc gagccgtgag 6900

tatccacgac aagatcagtg tcgagacgac gcgttttgtg taatgacaca atccgaaagt 6960

cgctagcaac acacactctc tacacaaact aacccagctc tggtaccagc ggccatcaca 7020

agtttgtaca aaaaagttgg attttttttc ggtctaaaat ggaagcagcc aaagaattgg 7080

tttccatcgt ccaagaggag ctccccaagg tggactatgc ccagctttgg caggacgcca 7140

gcagctgtga ggtcctttac ctctcggtgg cattcgtggc gatcaagttc atgctgcgcc 7200

cactggacct gaagcgccag gccaccttga agaagctgtt cacagcatac aacttcctca 7260

tgtcgatcta ttcctttggc tccttcctgg ccatggccta tgccctatca gtaactggca 7320

tcctctccgg cgactgtgag acagcgttca acaacgatgt gttcaggatc acaactcagc 7380

tgttctacct cagcaagttc gtagagtaca tcgactcctt ctaccttccc cttatggaca 7440

agccactgtc gttccttcag ttcttccatc atttgggggc tcccattgac atgtggctat 7500

tctacaaata ccgcaacgaa ggagtctgga tctttgtcct gttgaatggg ttcattcact 7560

ggatcatgta cggttactac tggacgcggc tcatcaagct gaacttcccc atgcccaaga 7620

acctgatcac ctccatgcag atcatccagt tcaatgtcgg gttctacatc gtctggaagt 7680

accgcaatgt gccatgctac cgccaggatg ggatgcgcat gtttgcctgg atcttcaact 7740

actggtacgt cgggacggtc ttgctgctgt tcctcaactt ttacgtgcag acgtacatcc 7800

ggaagccgag gaagaaccaa gggaagaagg agtaggccac atggcgcctg cgctggagga 7860

aacggtacgc tcggatggtg cactgcactt gcactccgcc gcttctagcc tcccctcgct 7920

ctaacctctg cgacatgcct gcttgaggcg tgacgttgcc tcgtgcgata cagtttacac 7980

ccttcccatg gcccacggag caggtgactg tctccagcgt ctgcaattct gatcattggt 8040

ctggtgcaat gtgcgcagac caagcccctc taacgtcttg cggtgtaccg ctcgacactc 8100

actgcacgag acagatggct gagcatgtta tagcccctga cattctaccc ttcgtcctta 8160

cctgaccgtc acattcatgc ttaccnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 8220

nnnnnaccca acttt 8235

<210>26

<211>774

<212>DNA

<213>Euglena anabaena

<220>

<221>CDS

<222>(1)..(774)

<223>Δ9延伸酶(经密码子优化用于在解脂耶氏酵母属中表达)

<400>26

atg gag gct gcc aag gag ctg gtc tcc atc gtc cag gag gaa ctt ccc 48

Met Glu Ala Ala Lys Glu Leu Val Ser Ile Val Gln Glu Glu Leu Pro

1 5 10 15

aag gtg gac tac gcc cag ctc tgg cag gac gcc tcc tct tgc gag gtt 96

Lys Val Asp Tyr Ala Gln Leu Trp Gln Asp Ala Ser Ser Cys Glu Val

20 25 30

ctg tac ctc tcg gtc gct ttc gtg gcc atc aag ttc atg ctt cga cct 144

Leu Tyr Leu Ser Val Ala Phe Val Ala Ile Lys Phe Met Leu Arg Pro

35 40 45

ctg gac ctc aag cga caa gcc acc ctc aaa aag ctg ttc acc gca tac 192

Leu Asp Leu Lys Arg Gln Ala Thr Leu Lys Lys Leu Phe Thr Ala Tyr

50 55 60

aac ttt ctc atg tcc atc tac tcg ttc ggc tcc ttc ctg gcg atg gcc 240

Asn Phe Leu Met Ser Ile Tyr Ser Phe Gly Ser Phe Leu Ala Met Ala

65 70 75 80

tac gct ctc tct gtc act ggt att ctt tcc ggc gat tgt gag act gcc 288

Tyr Ala Leu Ser Val Thr Gly Ile Leu Ser Gly Asp Cys Glu Thr Ala

85 90 95

ttc aac aat gac gtg ttc cga atc acc act cag ctg ttc tac ctc agc 336

Phe Asn Asn Asp Val Phe Arg Ile Thr Thr Gln Leu Phe Tyr Leu Ser

100 105 110

aag ttc gtc gag tac atc gac tcc ttc tac ctt ccc ctc atg gac aag 384

Lys Phe Val Glu Tyr Ile Asp Ser Phe Tyr Leu Pro Leu Met Asp Lys

115 120 125

ccc ttg tcg ttt ctg cag ttc ttt cac cat ctc gga gct ccc atc gac 432

Pro Leu Ser Phe Leu Gln Phe Phe His His Leu Gly Ala Pro Ile Asp

130 135 140

atg tgg ctg ttc tac aag tat cga aac gaa ggc gtc tgg atc ttt gtt 480

Met Trp Leu Phe Tyr Lys Tyr Arg Asn Glu Gly Val Trp Ile Phe Val

145 150 155 160

ctg ctc aac ggc ttc att cac tgg atc atg tac ggt tac tat tgg acg 528

Leu Leu Asn Gly Phe Ile His Trp Ile Met Tyr Gly Tyr Tyr Trp Thr

165 170 175

cga ctc atc aag ctg aac ttc cct atg ccc aag aac ctc att acc tcc 576

Arg Leu Ile Lys Leu Asn Phe Pro Met Pro Lys Asn Leu Ile Thr Ser

180 185 190

atg caa att atc cag ttc aac gtc gga ttc tac atc gtc tgg aag tac 624

Met Gln Ile Ile Gln Phe Asn Val Gly Phe Tyr Ile Val Trp Lys Tyr

195 200 205

cga aac gtg ccc tgc tac cgg cag gac ggt atg cga atg ttt gcc tgg 672

Arg Asn Val Pro Cys Tyr Arg Gln Asp Gly Met Arg Met Phe Ala Trp

210 215 220

atc ttc aac tac tgg tat gtc ggc acg gtg ctg ctt ctg ttc ctc aac 720

Ile Phe Asn Tyr Trp Tyr Val Gly Thr Val Leu Leu Leu Phe Leu Asn

225 230 235 240

ttc tac gtc cag acc tac att cgg aag cct cga aag aac cga ggc aaa 768

Phe Tyr Val Gln Thr Tyr Ile Arg Lys Pro Arg Lys Asn Arg Gly Lys

245 250 255

aag gag 774

Lys Glu

<210>27

<211>258

<212>PRT

<213>Euglena anabaena

<400>27

Met Glu Ala Ala Lys Glu Leu Val Ser Ile Val Gln Glu Glu Leu Pro

1 5 10 15

Lys Val Asp Tyr Ala Gln Leu Trp Gln Asp Ala Ser Ser Cys Glu Val

20 25 30

Leu Tyr Leu Ser Val Ala Phe Val Ala Ile Lys Phe Met Leu Arg Pro

35 40 45

Leu Asp Leu Lys Arg Gln Ala Thr Leu Lys Lys Leu Phe Thr Ala Tyr

50 55 60

Asn Phe Leu Met Ser Ile Tyr Ser Phe Gly Ser Phe Leu Ala Met Ala

65 70 75 80

Tyr Ala Leu Ser Val Thr Gly Ile Leu Ser Gly Asp Cys Glu Thr Ala

85 90 95

Phe Asn Asn Asp Val Phe Arg Ile Thr Thr Gln Leu Phe Tyr Leu Ser

100 105 110

Lys Phe Val Glu Tyr Ile Asp Ser Phe Tyr Leu Pro Leu Met Asp Lys

115 120 125

Pro Leu Ser Phe Leu Gln Phe Phe His His Leu Gly Ala Pro Ile Asp

130 135 140

Met Trp Leu Phe Tyr Lys Tyr Arg Asn Glu Gly Val Trp Ile Phe Val

145 150 155 160

Leu Leu Asn Gly Phe Ile His Trp Ile Met Tyr Gly Tyr Tyr Trp Thr

165 170 175

Arg Leu Ile Lys Leu Asn Phe Pro Met Pro Lys Asn Leu Ile Thr Ser

180 185 190

Met Gln Ile Ile Gln Phe Asn Val Gly Phe Tyr Ile Val Trp Lys Tyr

195 200 205

Arg Asn Val Pro Cys Tyr Arg Gln Asp Gly Met Arg Met Phe Ala Trp

210 215 220

Ile Phe Asn Tyr Trp Tyr Val Gly Thr Val Leu Leu Leu Phe Leu Asn

225 230 235 240

Phe Tyr Val Gln Thr Tyr Ile Arg Lys Pro Arg Lys Asn Arg Gly Lys

245 250 255

Lys Glu

<210>28

<211>3497

<212>DNA

<213>人工序列

<220>

<223>质粒pEaD9ES

<400>28

tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60

cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120

ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180

accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240

attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300

tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360

tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt cgagctcggt acctcgcgaa 420

tgcatctaga tccatggagg ctgccaagga gctggtctcc atcgtccagg aggaacttcc 480

caaggtggac tacgcccagc tctggcagga cgcctcctct tgcgaggttc tgtacctctc 540

ggtcgctttc gtggccatca agttcatgct tcgacctctg gacctcaagc gacaagccac 600

cctcaaaaag ctgttcaccg catacaactt tctcatgtcc atctactcgt tcggctcctt 660

cctggcgatg gcctacgctc tctctgtcac tggtattctt tccggcgatt gtgagactgc 720

cttcaacaat gacgtgttcc gaatcaccac tcagctgttc tacctcagca agttcgtcga 780

gtacatcgac tccttctacc ttcccctcat ggacaagccc ttgtcgtttc tgcagttctt 840

tcaccatctc ggagctccca tcgacatgtg gctgttctac aagtatcgaa acgaaggcgt 900

ctggatcttt gttctgctca acggcttcat tcactggatc atgtacggtt actattggac 960

gcgactcatc aagctgaact tccctatgcc caagaacctc attacctcca tgcaaattat 1020

ccagttcaac gtcggattct acatcgtctg gaagtaccga aacgtgccct gctaccggca 1080

ggacggtatg cgaatgtttg cctggatctt caactactgg tatgtcggca cggtgctgct 1140

tctgttcctc aacttctacg tccagaccta cattcggaag cctcgaaaga accgaggcaa 1200

aaaggagtaa gcggccgcat cggatcccgg gcccgtcgac tgcagaggcc tgcatgcaag 1260

cttggcgtaa tcatggtcat agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc 1320

acacaacata cgagccggaa gcataaagtg taaagcctgg ggtgcctaat gagtgagcta 1380

actcacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca 1440

gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg ggcgctcttc 1500

cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc 1560

tcactcaaag gcggtaatac ggttatccac agaatcaggg gataacgcag gaaagaacat 1620

gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt 1680

ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg 1740

aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc 1800

tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt 1860

ggcgctttct catagctcac gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa 1920

gctgggctgt gtgcacgaac cccccgttca gcccgaccgc tgcgccttat ccggtaacta 1980

tcgtcttgag tccaacccgg taagacacga cttatcgcca ctggcagcag ccactggtaa 2040

caggattagc agagcgaggt atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa 2100

ctacggctac actagaagaa cagtatttgg tatctgcgct ctgctgaagc cagttacctt 2160

cggaaaaaga gttggtagct cttgatccgg caaacaaacc accgctggta gcggtggttt 2220

ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag atcctttgat 2280

cttttctacg gggtctgacg ctcagtggaa cgaaaactca cgttaaggga ttttggtcat 2340

gagattatca aaaaggatct tcacctagat ccttttaaat taaaaatgaa gttttaaatc 2400

aatctaaagt atatatgagt aaacttggtc tgacagttac caatgcttaa tcagtgaggc 2460

acctatctca gcgatctgtc tatttcgttc atccatagtt gcctgactcc ccgtcgtgta 2520

gataactacg atacgggagg gcttaccatc tggccccagt gctgcaatga taccgcgaga 2580

cccacgctca ccggctccag atttatcagc aataaaccag ccagccggaa gggccgagcg 2640

cagaagtggt cctgcaactt tatccgcctc catccagtct attaattgtt gccgggaagc 2700

tagagtaagt agttcgccag ttaatagttt gcgcaacgtt gttgccattg ctacaggcat 2760

cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc tccggttccc aacgatcaag 2820

gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat 2880

cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg gttatggcag cactgcataa 2940

ttctcttact gtcatgccat ccgtaagatg cttttctgtg actggtgagt actcaaccaa 3000

gtcattctga gaatagtgta tgcggcgacc gagttgctct tgcccggcgt caatacggga 3060

taataccgcg ccacatagca gaactttaaa agtgctcatc attggaaaac gttcttcggg 3120

gcgaaaactc tcaaggatct taccgctgtt gagatccagt tcgatgtaac ccactcgtgc 3180

acccaactga tcttcagcat cttttacttt caccagcgtt tctgggtgag caaaaacagg 3240

aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa tactcatact 3300

cttccttttt caatattatt gaagcattta tcagggttat tgtctcatga gcggatacat 3360

atttgaatgt atttagaaaa ataaacaaat aggggttccg cgcacatttc cccgaaaagt 3420

gccacctgac gtctaagaaa ccattattat catgacatta acctataaaa ataggcgtat 3480

cacgaggccc tttcgtc 3497

<210>29

<211>7769

<212>DNA

<213>人工序列

<220>

<223>质粒pZUFmEaD9ES

<400>29

ggccgcaagt gtggatgggg aagtgagtgc ccggttctgt gtgcacaatt ggcaatccaa 60

gatggatgga ttcaacacag ggatatagcg agctacgtgg tggtgcgagg atatagcaac 120

ggatatttat gtttgacact tgagaatgta cgatacaagc actgtccaag tacaatacta 180

aacatactgt acatactcat actcgtaccc gggcaacggt ttcacttgag tgcagtggct 240

agtgctctta ctcgtacagt gtgcaatact gcgtatcata gtctttgatg tatatcgtat 300

tcattcatgt tagttgcgta cgagccggaa gcataaagtg taaagcctgg ggtgcctaat 360

gagtgagcta actcacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc 420

tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg 480

ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag 540

cggtatcagc tcactcaaag gcggtaatac ggttatccac agaatcaggg gataacgcag 600

gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc 660

tggcgttttt ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc 720

agaggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc 780

tcgtgcgctc tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt 840

cgggaagcgt ggcgctttct catagctcac gctgtaggta tctcagttcg gtgtaggtcg 900

ttcgctccaa gctgggctgt gtgcacgaac cccccgttca gcccgaccgc tgcgccttat 960

ccggtaacta tcgtcttgag tccaacccgg taagacacga cttatcgcca ctggcagcag 1020

ccactggtaa caggattagc agagcgaggt atgtaggcgg tgctacagag ttcttgaagt 1080

ggtggcctaa ctacggctac actagaagga cagtatttgg tatctgcgct ctgctgaagc 1140

cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc accgctggta 1200

gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag 1260

atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca cgttaaggga 1320

ttttggtcat gagattatca aaaaggatct tcacctagat ccttttaaat taaaaatgaa 1380

gttttaaatc aatctaaagt atatatgagt aaacttggtc tgacagttac caatgcttaa 1440

tcagtgaggc acctatctca gcgatctgtc tatttcgttc atccatagtt gcctgactcc 1500

ccgtcgtgta gataactacg atacgggagg gcttaccatc tggccccagt gctgcaatga 1560

taccgcgaga cccacgctca ccggctccag atttatcagc aataaaccag ccagccggaa 1620

gggccgagcg cagaagtggt cctgcaactt tatccgcctc catccagtct attaattgtt 1680

gccgggaagc tagagtaagt agttcgccag ttaatagttt gcgcaacgtt gttgccattg 1740

ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc tccggttccc 1800

aacgatcaag gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt agctccttcg 1860

gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg gttatggcag 1920

cactgcataa ttctcttact gtcatgccat ccgtaagatg cttttctgtg actggtgagt 1980

actcaaccaa gtcattctga gaatagtgta tgcggcgacc gagttgctct tgcccggcgt 2040

caatacggga taataccgcg ccacatagca gaactttaaa agtgctcatc attggaaaac 2100

gttcttcggg gcgaaaactc tcaaggatct taccgctgtt gagatccagt tcgatgtaac 2160

ccactcgtgc acccaactga tcttcagcat cttttacttt caccagcgtt tctgggtgag 2220

caaaaacagg aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa 2280

tactcatact cttccttttt caatattatt gaagcattta tcagggttat tgtctcatga 2340

gcggatacat atttgaatgt atttagaaaa ataaacaaat aggggttccg cgcacatttc 2400

cccgaaaagt gccacctgac gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg 2460

ttacgcgcag cgtgaccgct acacttgcca gcgccctagc gcccgctcct ttcgctttct 2520

tcccttcctt tctcgccacg ttcgccggct ttccccgtca agctctaaat cgggggctcc 2580

ctttagggtt ccgatttagt gctttacggc acctcgaccc caaaaaactt gattagggtg 2640

atggttcacg tagtgggcca tcgccctgat agacggtttt tcgccctttg acgttggagt 2700

ccacgttctt taatagtgga ctcttgttcc aaactggaac aacactcaac cctatctcgg 2760

tctattcttt tgatttataa gggattttgc cgatttcggc ctattggtta aaaaatgagc 2820

tgatttaaca aaaatttaac gcgaatttta acaaaatatt aacgcttaca atttccattc 2880

gccattcagg ctgcgcaact gttgggaagg gcgatcggtg cgggcctctt cgctattacg 2940

ccagctggcg aaagggggat gtgctgcaag gcgattaagt tgggtaacgc cagggttttc 3000

ccagtcacga cgttgtaaaa cgacggccag tgaattgtaa tacgactcac tatagggcga 3060

attgggtacc gggccccccc tcgaggtcga tggtgtcgat aagcttgata tcgaattcat 3120

gtcacacaaa ccgatcttcg cctcaaggaa acctaattct acatccgaga gactgccgag 3180

atccagtcta cactgattaa ttttcgggcc aataatttaa aaaaatcgtg ttatataata 3240

ttatatgtat tatatatata catcatgatg atactgacag tcatgtccca ttgctaaata 3300

gacagactcc atctgccgcc tccaactgat gttctcaata tttaaggggt catctcgcat 3360

tgtttaataa taaacagact ccatctaccg cctccaaatg atgttctcaa aatatattgt 3420

atgaacttat ttttattact tagtattatt agacaactta cttgctttat gaaaaacact 3480

tcctatttag gaaacaattt ataatggcag ttcgttcatt taacaattta tgtagaataa 3540

atgttataaa tgcgtatggg aaatcttaaa tatggatagc ataaatgata tctgcattgc 3600

ctaattcgaa atcaacagca acgaaaaaaa tcccttgtac aacataaata gtcatcgaga 3660

aatatcaact atcaaagaac agctattcac acgttactat tgagattatt attggacgag 3720

aatcacacac tcaactgtct ttctctcttc tagaaataca ggtacaagta tgtactattc 3780

tcattgttca tacttctagt catttcatcc cacatattcc ttggatttct ctccaatgaa 3840

tgacattcta tcttgcaaat tcaacaatta taataagata taccaaagta gcggtatagt 3900

ggcaatcaaa aagcttctct ggtgtgcttc tcgtatttat ttttattcta atgatccatt 3960

aaaggtatat atttatttct tgttatataa tccttttgtt tattacatgg gctggataca 4020

taaaggtatt ttgatttaat tttttgctta aattcaatcc cccctcgttc agtgtcaact 4080

gtaatggtag gaaattacca tacttttgaa gaagcaaaaa aaatgaaaga aaaaaaaaat 4140

cgtatttcca ggttagacgt tccgcagaat ctagaatgcg gtatgcggta cattgttctt 4200

cgaacgtaaa agttgcgctc cctgagatat tgtacatttt tgcttttaca agtacaagta 4260

catcgtacaa ctatgtacta ctgttgatgc atccacaaca gtttgttttg tttttttttg 4320

tttttttttt ttctaatgat tcattaccgc tatgtatacc tacttgtact tgtagtaagc 4380

cgggttattg gcgttcaatt aatcatagac ttatgaatct gcacggtgtg cgctgcgagt 4440

tacttttagc ttatgcatgc tacttgggtg taatattggg atctgttcgg aaatcaacgg 4500

atgctcaatc gatttcgaca gtaattaatt aagtcataca caagtcagct ttcttcgagc 4560

ctcatataag tataagtagt tcaacgtatt agcactgtac ccagcatctc cgtatcgaga 4620

aacacaacaa catgccccat tggacagatc atgcggatac acaggttgtg cagtatcata 4680

catactcgat cagacaggtc gtctgaccat catacaagct gaacaagcgc tccatacttg 4740

cacgctctct atatacacag ttaaattaca tatccatagt ctaacctcta acagttaatc 4800

ttctggtaag cctcccagcc agccttctgg tatcgcttgg cctcctcaat aggatctcgg 4860

ttctggccgt acagacctcg gccgacaatt atgatatccg ttccggtaga catgacatcc 4920

tcaacagttc ggtactgctg tccgagagcg tctcccttgt cgtcaagacc caccccgggg 4980

gtcagaataa gccagtcctc agagtcgccc ttaggtcggt tctgggcaat gaagccaacc 5040

acaaactcgg ggtcggatcg ggcaagctca atggtctgct tggagtactc gccagtggcc 5100

agagagccct tgcaagacag ctcggccagc atgagcagac ctctggccag cttctcgttg 5160

ggagagggga ctaggaactc cttgtactgg gagttctcgt agtcagagac gtcctccttc 5220

ttctgttcag agacagtttc ctcggcacca gctcgcaggc cagcaatgat tccggttccg 5280

ggtacaccgt gggcgttggt gatatcggac cactcggcga ttcggtgaca ccggtactgg 5340

tgcttgacag tgttgccaat atctgcgaac tttctgtcct cgaacaggaa gaaaccgtgc 5400

ttaagagcaa gttccttgag ggggagcaca gtgccggcgt aggtgaagtc gtcaatgatg 5460

tcgatatggg ttttgatcat gcacacataa ggtccgacct tatcggcaag ctcaatgagc 5520

tccttggtgg tggtaacatc cagagaagca cacaggttgg ttttcttggc tgccacgagc 5580

ttgagcactc gagcggcaaa ggcggacttg tggacgttag ctcgagcttc gtaggagggc 5640

attttggtgg tgaagaggag actgaaataa atttagtctg cagaactttt tatcggaacc 5700

ttatctgggg cagtgaagta tatgttatgg taatagttac gagttagttg aacttataga 5760

tagactggac tatacggcta tcggtccaaa ttagaaagaa cgtcaatggc tctctgggcg 5820

tcgcctttgc cgacaaaaat gtgatcatga tgaaagccag caatgacgtt gcagctgata 5880

ttgttgtcgg ccaaccgcgc cgaaaacgca gctgtcagac ccacagcctc caacgaagaa 5940

tgtatcgtca aagtgatcca agcacactca tagttggagt cgtactccaa aggcggcaat 6000

gacgagtcag acagatactc gtcgacgttt aaacagtgta cgcagatcta ctatagagga 6060

acatttaaat tgccccggag aagacggcca ggccgcctag atgacaaatt caacaactca 6120

cagctgactt tctgccattg ccactagggg ggggcctttt tatatggcca agccaagctc 6180

tccacgtcgg ttgggctgca cccaacaata aatgggtagg gttgcaccaa caaagggatg 6240

ggatgggggg tagaagatac gaggataacg gggctcaatg gcacaaataa gaacgaatac 6300

tgccattaag actcgtgatc cagcgactga caccattgca tcatctaagg gcctcaaaac 6360

tacctcggaa ctgctgcgct gatctggaca ccacagaggt tccgagcact ttaggttgca 6420

ccaaatgtcc caccaggtgc aggcagaaaa cgctggaaca gcgtgtacag tttgtcttaa 6480

caaaaagtga gggcgctgag gtcgagcagg gtggtgtgac ttgttatagc ctttagagct 6540

gcgaaagcgc gtatggattt ggctcatcag gccagattga gggtctgtgg acacatgtca 6600

tgttagtgta cttcaatcgc cccctggata tagccccgac aataggccgt ggcctcattt 6660

ttttgccttc cgcacatttc cattgctcga tacccacacc ttgcttctcc tgcacttgcc 6720

aaccttaata ctggtttaca ttgaccaaca tcttacaagc ggggggcttg tctagggtat 6780

atataaacag tggctctccc aatcggttgc cagtctcttt tttcctttct ttccccacag 6840

attcgaaatc taaactacac atcacagaat tccgagccgt gagtatccac gacaagatca 6900

gtgtcgagac gacgcgtttt gtgtaatgac acaatccgaa agtcgctagc aacacacact 6960

ctctacacaa actaacccag ctctggtacc atggaggctg ccaaggagct ggtctccatc 7020

gtccaggagg aacttcccaa ggtggactac gcccagctct ggcaggacgc ctcctcttgc 7080

gaggttctgt acctctcggt cgctttcgtg gccatcaagt tcatgcttcg acctctggac 7140

ctcaagcgac aagccaccct caaaaagctg ttcaccgcat acaactttct catgtccatc 7200

tactcgttcg gctccttcct ggcgatggcc tacgctctct ctgtcactgg tattctttcc 7260

ggcgattgtg agactgcctt caacaatgac gtgttccgaa tcaccactca gctgttctac 7320

ctcagcaagt tcgtcgagta catcgactcc ttctaccttc ccctcatgga caagcccttg 7380

tcgtttctgc agttctttca ccatctcgga gctcccatcg acatgtggct gttctacaag 7440

tatcgaaacg aaggcgtctg gatctttgtt ctgctcaacg gcttcattca ctggatcatg 7500

tacggttact attggacgcg actcatcaag ctgaacttcc ctatgcccaa gaacctcatt 7560

acctccatgc aaattatcca gttcaacgtc ggattctaca tcgtctggaa gtaccgaaac 7620

gtgccctgct accggcagga cggtatgcga atgtttgcct ggatcttcaa ctactggtat 7680

gtcggcacgg tgctgcttct gttcctcaac ttctacgtcc agacctacat tcggaagcct 7740

cgaaagaacc gaggcaaaaa ggagtaagc 7769

Claims

1.包含分离的多核苷酸的微生物宿主细胞，所述分离的多核苷酸包含：

(a)编码具有Δ9延伸酶活性的多肽的核苷酸序列，其中基于ClustalV比对方法在与SEQ ID NO：13或SEQ ID NO：14中示出的氨基酸序列进行比较时，所述多肽具有至少80％的氨基酸同一性；

(b)编码具有Δ9延伸酶活性的多肽的核苷酸序列，其中基于BLASTN比对方法在与SEQ ID NO：11、SEQ ID NO：12或SEQ ID NO：26中示出的核苷酸序列进行比较时，所述核苷酸序列具有至少80％的序列同一性；

(c)编码具有Δ9延伸酶活性的多肽的核苷酸序列，其中所述核苷酸序列在严格条件下与SEQ ID NO：11、SEQ ID NO：12或SEQ ID NO：26中示出的核苷酸序列杂交；或

(d)(a)、(b)或(c)的核苷酸序列的互补序列，其中所述互补序列与所述核苷酸序列由相同数目的核苷酸组成并且100％互补。

2.权利要求1的微生物宿主细胞，其中所述分离的多核苷酸编码SEQ ID NO：13或SEQ ID NO：14中示出的氨基酸序列。

3.权利要求1的微生物宿主细胞，其中所述微生物宿主细胞选自酵母、藻类、细菌、类眼虫、原生藻菌和真菌。

4.权利要求3的微生物宿主细胞，其中所述细胞是被孢霉属物种的真菌。

5.权利要求3的微生物宿主细胞，其中所述细胞是选自下列的原生藻菌：破囊壶菌属物种和裂殖壶菌属物种。

6.权利要求3的微生物宿主细胞，其中所述酵母是含油酵母。

7.权利要求6的微生物宿主细胞，其中所述含油酵母选自：耶氏酵母属、假丝酵母属、红酵母属、红冬孢酵母属、隐球酵母属、丝孢酵母属和油脂酵母属。

8.用于产生二十碳二烯酸的方法，所述方法包括：

a)提供微生物宿主细胞，所述微生物宿主细胞包含：

(i)编码Δ9延伸酶多肽的重组核苷酸分子，基于Clustal V比对方法在与SEQ ID NO：13或SEQ ID NO：14中示出的氨基酸序列进行比较时，所述延伸酶多肽具有至少80％的氨基酸同一性；和

(ii)亚油酸源；

b)使步骤(a)的微生物宿主细胞在使编码Δ9延伸酶多肽的核酸片段表达并使所述亚油酸转化成二十碳二烯酸的条件下生长；以及，

c)任选回收步骤(b)的二十碳二烯酸。

9.用于产生二十碳三烯酸的方法，所述方法包括：

a)提供微生物宿主细胞，所述微生物宿主细胞包含：

(ii)α-亚麻酸源；

b)使步骤(a)的微生物宿主细胞在使编码Δ9延伸酶多肽的核酸片段表达并使所述α-亚麻酸转化成二十碳三烯酸的条件下生长；以及，

c)任选回收步骤(b)的二十碳三烯酸。

10.权利要求8或9的方法，其中所述微生物宿主细胞是包含如SEQID NO：26中示出的编码Δ9延伸酶多肽的重组核苷酸分子的耶氏酵母属物种，其中所述重组核苷酸分子包含至少98个经最优化以便在耶氏酵母属中表达的密码子。

11.权利要求8或9的方法，其中：

a.)所述重组核酸分子具有选自SEQ ID NO：11、SEQ ID NO：12或SEQ ID NO：26的核酸序列；并且

b.)所述宿主细胞是解脂耶氏酵母。

12.如SEQ ID NO：26中示出的编码Δ9延伸酶的分离的核酸分子，其中至少98个密码子经密码子最优化以便在耶氏酵母属物种中表达。