CN101848996A - △9延伸酶及其在制备多不饱和脂肪酸中的用途 - Google Patents

△9延伸酶及其在制备多不饱和脂肪酸中的用途 Download PDF

Info

Publication number
CN101848996A
CN101848996A CN200880020395A CN200880020395A CN101848996A CN 101848996 A CN101848996 A CN 101848996A CN 200880020395 A CN200880020395 A CN 200880020395A CN 200880020395 A CN200880020395 A CN 200880020395A CN 101848996 A CN101848996 A CN 101848996A
Authority
CN
China
Prior art keywords
seq
sequence
acid
host cell
enzyme
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200880020395A
Other languages
English (en)
Other versions
CN101848996B (zh
Inventor
H·G·达穆德
Q·Q·朱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
EIDP Inc
Original Assignee
EI Du Pont de Nemours and Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by EI Du Pont de Nemours and Co filed Critical EI Du Pont de Nemours and Co
Publication of CN101848996A publication Critical patent/CN101848996A/zh
Application granted granted Critical
Publication of CN101848996B publication Critical patent/CN101848996B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1025Acyltransferases (2.3)
    • C12N9/1029Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23DEDIBLE OILS OR FATS, e.g. MARGARINES, SHORTENINGS, COOKING OILS
    • A23D9/00Other edible oils or fats, e.g. shortenings, cooking oils
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23DEDIBLE OILS OR FATS, e.g. MARGARINES, SHORTENINGS, COOKING OILS
    • A23D9/00Other edible oils or fats, e.g. shortenings, cooking oils
    • A23D9/007Other edible oils or fats, e.g. shortenings, cooking oils characterised by ingredients other than fatty acid triglycerides
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23KFODDER
    • A23K20/00Accessory food factors for animal feeding-stuffs
    • A23K20/10Organic substances
    • A23K20/158Fatty acids; Fats; Products containing oils or fats
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23LFOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
    • A23L33/00Modifying nutritive qualities of foods; Dietetic products; Preparation or treatment thereof
    • A23L33/10Modifying nutritive qualities of foods; Dietetic products; Preparation or treatment thereof using additives
    • A23L33/115Fatty acids or derivatives thereof; Fats or oils
    • A23L33/12Fatty acids or derivatives thereof
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23VINDEXING SCHEME RELATING TO FOODS, FOODSTUFFS OR NON-ALCOHOLIC BEVERAGES AND LACTIC OR PROPIONIC ACID BACTERIA USED IN FOODSTUFFS OR FOOD PREPARATION
    • A23V2002/00Food compositions, function of food ingredients or processes for food or foodstuffs

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Polymers & Plastics (AREA)
  • Food Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Oil, Petroleum & Natural Gas (AREA)
  • Zoology (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Animal Husbandry (AREA)
  • Mycology (AREA)
  • Nutrition Science (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明涉及Δ9延伸酶,所述Δ9延伸酶具有将亚油酸(LA;18:2ω-6)转化成二十碳二烯酸(EDA;20:2ω-6)和/或将α-亚麻酸(ALA;18:3ω-3)转化成二十碳三烯酸(ETrA;20:3ω-3)的能力。公开了分离的核酸片段和包含这种编码Δ9延伸酶的片段的重组构建体,以及用这些Δ9延伸酶在含油酵母中制备长链多不饱和脂肪酸(PUFA)的方法。

Description

Δ9延伸酶及其在制备多不饱和脂肪酸中的用途
本申请要求提交于2007年4月16日的美国临时专利申请60/911,925的优先权,将该专利的全文以引用的方式并入本文中。
发明领域
本发明属于生物技术领域。更具体地讲,本发明涉及编码Δ9脂肪酸延伸酶的多核苷酸序列的鉴定以及这些延伸酶在制备长链多不饱和脂肪酸PUFA中的用途。
背景技术
现今,人们正研究包括植物、藻类、真菌、原生藻菌(stramenopiles)和酵母在内的多种不同宿主作为商业化PUFA生产的手段。基因工程已经证明,一些宿主(即便是天然受限于亚油酸(LA;18:2 ω-6)和α-亚麻酸(ALA;18:3 ω-3)脂肪酸产生的那些宿主)的天然能力可以被显著改变,以导致高水平地产生多种长链ω-3/ω-6 PUFA。不论这是天然能力的结果还是重组技术的结果,花生四烯酸(ARA;20:4 ω-6)、二十碳五烯酸(EPA;20:5 ω-3)和二十二碳六烯酸(DHA;22:6 ω-3)的产生可能均需要表达Δ9延伸酶。
迄今为止鉴定的大多数Δ9延伸酶既具有将LA转化成二十碳二烯酸(EDA;20:2 ω-6)的能力又具有将ALA转化成二十碳三烯酸(ETrA;20:3 ω-3)的能力(其中在与Δ8去饱和酶反应之后,EDA和ETrA随后分别被合成二高-γ-亚麻酸(DGLA;20:3 ω-6)和二十碳四烯酸(ETA;20:4 ω-3);在与Δ5去饱和酶反应后,DGLA和ETA随后分别被合成ARA和EPA;并且,DHA合成需要后续表达额外的C20/22延伸酶和Δ4去饱和酶)。
尽管需要用于产生ARA、EPA和DHA的新方法,但仅少量的Δ9延伸酶得以鉴定。来自绿光等鞭金藻(Isochrysis galbana)的Δ9延伸酶是公开可获得的(在基因库编号(GenBank Accession No)AAL37626以及PCT公开WO 02/077213、WO 2005/083093、WO 2005/012316和WO2004/057001中有描述)。PCT公开WO 2007/061845和WO 2007/061742(申请人的受让人的共同未决的申请)公开了来自小眼虫(Euglenagracilis)和Eutreptiella sp.CCMP389的Δ9延伸酶,以及Δ9延伸酶的基序。
因此,需要鉴定和分离出另外的编码Δ9延伸酶的基因,该基因将适用于在多种宿主生物中异源表达以用于产生ω-3/ω-6脂肪酸。
本申请人通过从Euglena anabaena中分离出编码Δ9脂肪酸延伸酶的基因而解决了这里所说的需要。
发明内容
本发明涉及编码具有Δ9延伸酶活性的多肽的新的遗传构建体,以及它们在藻类、细菌、酵母、类眼虫、原生藻菌和真菌中的使用,用于产生PUFA。因此,本发明提供包含分离的多核苷酸的微生物宿主细胞,该多核苷酸包含:
(a)编码具有Δ9延伸酶活性的多肽的核苷酸序列,其中基于ClustalV比对方法在与SEQ ID NO:13或SEQ ID NO:14中示出的氨基酸序列进行比较时,该多肽具有至少80%的氨基酸同一性;
(b)编码具有Δ9延伸酶活性的多肽的核苷酸序列,其中基于BLASTN比对方法在与SEQ ID NO:11、SEQ ID NO:12或SEQ ID NO:26中示出的核苷酸序列进行比较时,该核苷酸序列具有至少80%的序列同一性;
(c)编码具有Δ9延伸酶活性的多肽的核苷酸序列,其中该核苷酸序列在严格条件下与SEQ ID NO:11、SEQ ID NO:12或SEQ ID NO:26中示出的核苷酸序列杂交;或
(d)(a)、(b)或(c)的核苷酸序列的互补序列,其中该互补序列与该核苷酸序列由相同数目的核苷酸组成并且100%互补。
在另一个实施方案中,本发明提供用于产生二十碳二烯酸的方法,该方法包括:
a)提供微生物宿主细胞,该微生物宿主细胞包含:
(i)编码Δ9延伸酶多肽的重组核苷酸分子,基于Clustal V比对方法在与SEQ ID NO:13或SEQ ID NO:14中示出的氨基酸序列进行比较时,该延伸酶多肽具有至少80%的氨基酸同一性;和
(ii)亚油酸源;
b)使步骤(a)的微生物宿主细胞在使编码Δ9延伸酶多肽的核酸片段表达并使亚油酸转化成二十碳二烯酸的条件下生长;以及
c)任选回收步骤(b)的二十碳二烯酸。
在另一个实施方案中,本发明提供用于产生二十碳三烯酸的方法,该方法包括:
a)提供微生物宿主细胞,该微生物宿主细胞包含:
(i)编码Δ9延伸酶多肽的重组核苷酸分子,基于Clustal V比对方法在与SEQ ID NO:13或SEQ ID NO:14中示出的氨基酸序列进行比较时,该延伸酶多肽具有至少80%的氨基酸同一性;和
(ii)α-亚麻酸源;
b)使步骤(a)的微生物宿主细胞在使编码Δ9延伸酶多肽的核酸片段表达并使α-亚麻酸转化成二十碳三烯酸的条件下生长;以及
c)任选回收步骤(b)的二十碳三烯酸。
在另一个实施方案中,本发明提供如SEQ ID NO:26中示出的编码Δ9延伸酶的分离的核酸分子,在该序列中至少98个密码子被密码子最优化以便在耶氏酵母属(Yarrowia)物种中表达。
附图简述和序列表
图1是代表性的ω-3和ω-6脂肪酸生物合成途径,该途径提供了肉豆蔻酸经过多种中间产物向DHA的转化。
图2示出了如实施例中所述的Euglena anabaena细胞提取物的脂质概况的色谱图。
图3提供了下列质粒的质粒图谱:(A)pY115(SEQ ID NO:19);(B)pY159(SEQ ID NO:23);(C)pY173(SEQ ID NO:24)和(D)pY174(SEQID NO:25)。
图4A和4B示出了EaD9Elo(SEQ ID NO:11)和EaD9ES(SEQ IDNO:26)的核苷酸序列的比较。
图5提供了下列质粒的质粒图谱:(A)pEaD9ES(SEQ ID NO:28);和(B)pZUFmEaD9eS(SEQ ID NO:29)。
根据下面的详细描述和附带的序列描述可以更充分地理解本发明,下面的详细描述和所附的序列描述形成了本申请的一部分。
下面的序列遵循37C.F.R.§1.821-1.825(“对包含核苷酸序列和/或氨基酸序列公开内容的专利申请的要求-序列规则”(“Requirementsfor Patent Applications Containing Nuceotide Sequences and/or AminoAcid Sequence Disclosures-the Sequence Rules”)),并且符合世界知识产权组织(World Intellectual Property Organization)(WIPO)ST.25标准(1998)以及EPO和PCT的序列表要求(规则5.2和49.5(a-bis)以及行政指令(Administrative Instructions)的208节和附录C)。用于核苷酸和氨基酸序列数据的符号和格式遵循在37C.F.R.§1.822中示出的规则。
SEQ ID NO:1-4、9-19和22-29为编码基因或蛋白质(或其部分)或质粒的ORF,如表1中所示。
表1
核酸和蛋白质SEQ ID号总汇
  描述和缩写  核酸SEQ ID NO  蛋白质SEQ ID NO
  Euglena anabaenaΔ9延伸酶的cDNA序列(“EaD9Elo1”)  1(1129bp)  --
  Euglena anabaenaΔ9延伸酶的cDNA序列(“EaD9Elo2”)  2(1145bp)  --
  小眼虫Δ9延伸酶编码序列(“EgD9e”)  3(774bp)  4(258AA)
  质粒pLF121-1  9(3668bp)  --
  质粒pLF121-2  10(3684bp)  --
  Euglena anabaenaΔ9延伸酶编码序列(分别为“EaD8Des1 CDS”或“EaD9Elo1”)  11(774bp)  13(258AA)
  Euglena anabaenaΔ9延伸酶编码序列(分别为“EaD8Des2 CDS”或“EaD9Elo2”)  12(774bp)  14(258AA)
  描述和缩写  核酸SEQ ID NO  蛋白质SEQ ID NO
  质粒pKR906  15(4311bp)  --
  绿光等鞭金藻Δ9延伸酶(IgD9e) --  16(263AA)
  质粒pDMW263   17(9472bp)  --
  质粒pDMW237   18(7879bp)  --
  质粒pY115   19(7783bp)  --
  质粒pY158   22(6992bp)  --
  质粒pY159   23(8707bp)  --
  质粒pY173   24(8219bp)  --
  质粒pY174   25(8235bp)  --
  来源于Euglena anabaena的、经密码子最优化以便在解脂耶氏酵母(Yarrowialipolytica)中表达的合成的Δ9延伸酶(“EaD9eS”)   26(774bp)  27(258AA)
  质粒pEaD9ES   28(3497bp)  --
  质粒pZUFmEaD9eS   29(7769bp)  --
SEQ ID NO:5和6分别对应寡核苷酸oEugEL1-1和oEugEL1-2,用于扩增小眼虫Δ9延伸酶。
SEQ ID NO:7和8分别对应M13F通用引物和引物M13-28Rev,用于对Euglena anabaena DNA插入物进行末端测序。
SEQ ID NO:20和21分别对应引物oYFBA1和oYFBA1-6,用于扩增质粒pY115的FBAINm启动子。
发明详述
本文中公开了新的Euglena anabaenaΔ9延伸酶和编码这种延伸酶的基因,其可用于操纵产生健康的PUFA的生化途径。
PUFA或其衍生物可用作膳食替代品或补充剂,尤其是婴儿代乳品(formula),用于接受静脉内营养法的患者或用来预防或治疗营养不良。或者,可以将纯化的PUFA(或其衍生物)掺入食用油、脂肪或调配的人造黄油中,以便食用者在正常使用中将获得所需量的膳食补充。PUFA还可以掺入婴儿代乳品、营养补充剂或其他食品中,并且可用作抗炎或降胆固醇剂。任选地,该组合物可以用于药用(人药或兽药)。
定义
在本公开的上下文中使用了大量术语和缩写。给出了如下定义。
“可读框”缩写为ORF。
“聚合酶链反应”缩写为PCR。
“美国典型培养物保藏中心”缩写为ATCC。
“多不饱和脂肪酸”缩写为PUFA。
“三酰基甘油”缩写为TAG。
如本文所用,术语“发明”或“本发明”不旨在局限于本发明的任一具体实施方案,而是在一般情况下适用于如权利要求和说明书中所描述的本发明的任何实施方案和所有实施方案。
本文所用的以及所附权利要求书中所用的单数形式“一个”、“一种”和“所述”包括复数指代,除非上下文中清楚地指明其他涵义。因此,例如,“一株植物”的涵义包括多株此类植物,“一个细胞”的涵义包括一个或多个细胞及其本领域的技术人员已知的等同物,等等。
术语“脂肪酸”指不同链长的长链脂族酸(链烷酸),链长为约C12至C22(尽管更长和更短链长的酸均是已知的)。主要的链长介于C16和C22之间。另外的关于“饱和脂肪酸”与“不饱和脂肪酸”、“单不饱和脂肪酸”与“多不饱和脂肪酸”(或“PUFA”)以及“ω-6脂肪酸”(ω-6或n-6)与“ω-3脂肪酸”(ω-3或n-3)之间的区别的详细信息在美国专利7,238,482中有提供。
本文通过简单的记号系统“X:Y”来描述脂肪酸,其中X表示特定脂肪酸中碳(c)原子的总数,而Y为双键的数目。脂肪酸名称后面的数字表示从脂肪酸羧基端计数的双键的位置,词缀“c”表示双键的顺式构型(例如,棕榈酸(16:0)、硬脂酸(18:0)、油酸(18:1,9c)、岩芹酸(18:1,6c)、LA(18:2,9c,12c)、GLA(18:3,6c,9c,12c)和ALA(18:3,9c,12c,15c))。除非另外指明,否则18:1、18:2和18:3分别指油酸、LA和ALA脂肪酸。如果没有另外明确地写明,则认为双键为顺式构型。例如,18:2(9,12)中的双键将被认为是顺式构型。
在本公开内容中用于描述PUFA的命名在下面的表2中示出。在标题为“简化符号”一栏中,ω-指代系统用于表明碳数目、双键的数目和最接近ω碳的双键位置,双键位置的计数从ω碳开始(为此ω碳的编号为1)。该表的其余部分汇总了ω-3和ω-6脂肪酸及其前体的俗名、将在整个说明书的其余部分中使用的缩写以及每种化合物的化学名称。
表2
多不饱和脂肪酸和前体的命名
  俗名  缩写   化学名称   简化符号
  肉豆蔻酸  --   十四酸   14:0
  棕榈酸  PA或Palmitate   十六酸   16:0
  棕榈油酸  --   9-十六碳烯酸   16:1
  硬脂酸  --   十八酸   18:0
  油酸  --   顺式-9-十八碳烯酸   18:1
  亚油酸  LA   顺式-9,12-十八碳二烯酸   18:2 ω-6
  γ-亚麻酸  GLA   顺式-6,9,12-十八碳三烯酸   18:3 ω-6
  二十碳二烯酸  EDA   顺式-11,14-二十碳二烯酸   20:2 ω-6
  二高-γ-亚麻酸  DGLA   顺式-8,11,14-二十碳三烯酸   20:3 ω-6
  Sciadonic  SCI   顺式-5,11,14-二十碳三烯酸   20:3b ω-6
  花生四烯酸  ARA   顺式-5,8,11,14-二十碳四烯酸   20:4 ω-6
  α-亚麻酸  ALA   顺式-9,12,15-十八碳三烯酸   18:3 ω-3
  十八碳四烯酸  STA   顺式-6,9,12,15-十八碳四烯酸   18:4 ω-3
  俗名  缩写   化学名称   简化符号
二十碳三烯酸  ETrA或ERA 顺式-11,14,17-二十碳三烯酸 20:3 ω-3
  二十碳四烯酸  ETA   顺式-8,11,14,17-二十碳四烯酸   20:4 ω-3
  Juniperonic   JUP   顺式-5,11,14,17-二十碳三烯酸   20:4b ω-3
二十碳五烯酸 EPA   顺式-5,8,11,14,17-二十碳五烯酸 20:5 ω-3
  二十二碳三烯酸 DRA 顺式-10,13,16-二十二碳三烯酸 22:3 ω-6
  二十二碳四烯酸 DTA   顺式-7,10,13,16-二十二碳四烯酸 22:4 ω-6
  二十二碳五烯酸 DPAn-6   顺式-4,7,10,13,16-二十二碳五烯酸   22:5 ω-6
  二十二碳五烯酸 DPA   顺式-7,10,13,16,19-二十二碳五烯酸 22:5 ω-3
  二十二碳六烯酸 DHA   顺式-4,7,10,13,16,19-二十二碳六烯酸 22:6 ω-3
术语“三酰基甘油”、“油”和“TAG”指由与甘油分子酯化的三个脂肪酰残基组成的中性脂质(并且这些术语在整个本公开内容中将可互换使用)。这些油可含有长链PUFA以及较短的饱和的和不饱和的脂肪酸以及较长链的饱和脂肪酸。因此,“油的生物合成”一般指细胞中TAG的合成。
“总脂质和油级分中的PUFA百分比(%)”指PUFA相对于在那些级分中的总脂肪酸的百分比。术语“总脂质级分”或“脂质级分”两者均指含油生物内所有脂质(即中性和极性脂质)的总和,因此包括位于磷脂酰胆碱(PC)级分、磷脂酰乙醇胺(PE)级分和三酰基甘油(TAG或油)级分中的那些脂质。然而,术语“脂质”和“油”将可在整个说明书中互换使用。
代谢途径或生物合成途径在生物化学意义上可以认为是发生于细胞内由酶催化的一系列化学反应,以实现细胞待使用的或待贮存的代谢产物的形成,或启动另一代谢途径(因而称作流量产生步骤)。很多此类途径均很精细,并涉及对起始物质的逐步修饰以使之形成具有期望的精确化学结构的产物。
术语“PUFA生物合成途径”指将油酸转化成诸如LA、EDA、GLA、DGLA、ARA、DRA、DTA和DPAn-6之类的ω-6脂肪酸和诸如ALA、STA、ETrA、ETA、EPA、DPA和DHA之类的ω-3脂肪酸的代谢过程。该过程在文献中已有详细的描述(如参见PCT公开WO 2006/052870)。简而言之,该过程涉及通过添加碳原子来延长碳链和通过加入双键来使分子去饱和,这通过存在于内质网膜内的一系列特异性去饱和酶和延伸酶(即“PUFA生物合成途径酶”)进行。更具体地讲,“PUFA生物合成途径酶”指如下与PUFA生物合成相关的任何酶(以及编码所述酶的基因),包括:Δ9延伸酶、C14/16延伸酶、C16/18延伸酶、C18/20延伸酶、C20/22延伸酶、Δ4去饱和酶、Δ5去饱和酶、Δ6去饱和酶、Δ12去饱和酶、Δ15去饱和酶、Δ17去饱和酶、Δ9去饱和酶和/或Δ8去饱和酶。
术语“ω-3/ω-6脂肪酸生物合成途径”指在合适条件下表达时编码催化产生ω-3和ω-6脂肪酸二者之一或两者的酶的一组基因。通常,参与ω-3/ω-6脂肪酸生物合成途径的基因编码PUFA生物合成途径酶。图1示出了代表性的途径,提供了肉豆蔻酸经过多种中间产物向DHA的转化,这展示了ω-3和ω-6脂肪酸两者是如何可以从共同来源而产生。自然,该途径分成两部分,其中一部分将产生ω-3脂肪酸而另一部分产生ω-6脂肪酸。
如本文关于ω-3/ω-6脂肪酸生物合成途径的上下文中所用,术语“功能性的”指该途径中的一些(或全部)基因表达活性酶,从而导致体内催化或底物转化。应当理解,“ω-3/ω-6脂肪酸生物合成途径”或“功能性ω-3/ω-6脂肪酸生物合成途径”并不意味着所有的PUFA生物合成途径酶基因均是必需的,因为许多脂肪酸产物将仅需要表达该途径中的一亚组基因。
术语“Δ6去饱和酶/Δ6延伸酶途径”将指最低程度包括至少一种Δ6去饱和酶和至少一种C18/20延伸酶(也称为Δ6延伸酶)的PUFA生物合成途径,从而使得能分别从LA和ALA开始,以GLA和/或ETA作为脂肪酸中间产物生物来合成DGLA和/或ETA。通过其他去饱和酶和延伸酶的表达,还可以合成ARA、EPA、DPA和DHA。
术语“Δ9延伸酶/Δ8去饱和酶途径”将指最低程度包括至少一种Δ9延伸酶和至少一种Δ8去饱和酶的PUFA生物合成途径,从而使得能分别从LA和ALA开始,以ETA和/或DGLA作为脂肪酸中间产物来生物合成DGLA和/或ETA。通过其他去饱和酶和延伸酶的表达,还可以合成ARA、EPA、DPA和DHA。
术语“脂肪酸中间产物”指在脂肪酸代谢途径中产生的任何脂肪酸,其可以通过其他代谢途径酶的作用进一步转化成本途径的目的脂肪酸产物。例如,当利用Δ9延伸酶/Δ8去饱和酶途径产生EPA时,可以产生EDA、ETrA、DGLA、ETA和ARA并被认为是“脂肪酸中间产物”,因为这些脂肪酸可通过其他代谢途径酶的作用进一步转化成EPA。
术语“脂肪酸副产物”指在脂肪酸代谢途径中产生的既非该途径的目的脂肪酸产物又非该途径的“脂肪酸中间产物”的任何脂肪酸。例如,当利用Δ9延伸酶/Δ8去饱和酶途径中产生EPA时,sciadonic酸(SCI)和juniperonic酸(JUP)也可通过Δ5去饱和酶分别作用于EDA或ETrA而产生。它们被认为是“脂肪酸副产物”,因为两者均不能通过其他代谢途径酶的作用进一步转化成EPA。
术语“去饱和酶”指可以在一种或多种脂肪酸中去饱和(即引入双键)而产生所关注的脂肪酸或前体的多肽。尽管在整个说明书中使用ω-指代系统来指代特定的脂肪酸,但使用Δ-系统从底物的羧基端计数来表示去饱和酶的活性更方便。所关注的去饱和酶包括(例如):(1)使脂肪酸在从该分子的羧基端计数的第8个和第9个碳原子之间去饱和并且可以(例如)催化EDA转化成DGLA和/或催化ETrA转化成ETA的Δ8去饱和酶;(2)Δ5去饱和酶,该去饱和酶催化DGLA转化成ARA和/或催化ETA转化成EPA;(3)Δ6去饱和酶,该去饱和酶催化LA转化成GLA和/或催化ALA转化成STA;(4)Δ4去饱和酶,该去饱和酶催化DPA转化成DHA和/或催化DTA转化成DPAn-6;(5)Δ12去饱和酶,该去饱和酶催化油酸转化成LA;(6)Δ15去饱和酶,该去饱和酶催化LA转化成ALA和/或催化GLA转化成STA;(7)Δ17去饱和酶,该去饱和酶催化ARA转化成EPA和/或催化DGLA转化成ETA;以及(8)Δ9去饱和酶,该去饱和酶催化棕榈酸转化成棕榈油酸(16:1)和/或催化硬脂酸转化成油酸(18:1)。在本领域中,基于Δ15和Δ17去饱和酶将ω-6脂肪酸转化成它们的ω-3对应物的能力(如分别将LA转化成ALA和将ARA转化成EPA),偶尔也将它们称作“ω-3去饱和酶”、“ω-3去饱和酶”和/或“ω-3去饱和酶”。在一些实施方案中,最理想的是,通过用脂肪酸去饱和酶的基因来转化合适的宿主并测定它对该宿主脂肪酸概况的作用,从而经验性地测定特定脂肪酸去饱和酶的特异性。
为了本文的目的,通常将催化第一缩合反应(即丙二酰辅酶A和长链酰基辅酶A转化成β-酮脂酰辅酶A)的酶称为“延伸酶”。一般来讲,延伸酶的底物选择性有些广泛,但由链长度和不饱和程度两者来区分。因此,延伸酶可具有不同的特异性。例如,C14/16延伸酶将会利用C14底物(如肉豆蔻酸),C16/18延伸酶将会利用C16底物(如棕榈酸),C18/20延伸酶(也称为Δ6延伸酶,两个术语可以互换使用)将会利用C18底物(如GLA、STA),而C20/22延伸酶将会利用C20底物(如ARA、EPA)。同样,并且本文尤其关注的是,“Δ9延伸酶”催化LA转化成EDA和/或催化ALA转化成ETrA。重要的是,须注意一些延伸酶具有广泛的特异性并因而单个酶可能能够催化几种延伸酶反应。因此,例如,Δ9延伸酶还可以用作C16/18延伸酶、C18/20延伸酶和/或C20/22延伸酶,并且可以分别对诸如EPA和/或GLA之类的Δ5和Δ6脂肪酸具有备选的但非优选的特异性。在优选的实施方案中,理想的是,通过用脂肪酸延伸酶的基因来转化合适的宿主并测定它对该宿主脂肪酸概况的作用,从而经验性地测定该脂肪酸延伸酶的特异性。延伸酶体系通常包括四种酶,这些酶负责脂肪酸碳链延长而产生比该延伸酶体系所作用的脂肪酸底物长两个碳原子的脂肪酸。更具体地讲,延长过程与脂肪酸合酶相关联进行,其中辅酶A是酰基载体(Lassner等人,Plant Cell,8:281-292(1996))。在第一步骤(已发现该步骤既是底物特异性的又是限速的)中,丙二酰辅酶A与长链酰基辅酶A缩合产生二氧化碳(CO2)和β-酮脂酰辅酶A(其中脂酰基部分已经延长了两个碳原子)。后续的反应包括还原成β-羟酰辅酶A、脱水成烯酰辅酶A以及第二还原反应以产生延长的酰基辅酶A。由延伸酶体系催化的反应的实例是将GLA转化成DGLA、将STA转化成ETA、将LA转化成EDA、将ALA转化成ETrA、将ARA转化成DTA和将EPA转化成DPA。
为了本文目的,术语“EaD9Elo1”指从Euglena anabaena分离的、由SEQ ID NO:11编码的Δ9延伸酶(SEQ ID NO:13)。术语“EaD9Elo2”指从E.anabaena分离的、由SEQ ID NO:12编码的Δ9延伸酶(SEQ IDNO:14)。同样,术语“EaD9eS”指来源于E.anabaena的经密码子最优化以便在解脂耶氏酵母中表达的合成的Δ9延伸酶(即SEQ ID NO:26和27)。
术语“转化效率”和“底物转化百分比”指特定酶(如延伸酶)能够将底物转化成产物的效率。转化效率根据下面的公式测量:([产物]/[底物+产物])*100,其中‘产物’包括中间产物和该途径中来源于它的所有产物。
术语“含油的”指那些往往以脂质形式贮存它们的能源的生物(Weete,Fungal Lipid Biochemistry,第二版,Plenum,1980)。在含油微生物内,细胞油或TAG含量通常符合S形曲线,其中脂质浓度增加直至晚对数生长晚期或稳定生长早期时它达到最高浓度,随后在稳定生长晚期和死亡期期间逐渐下降(Yongrmanitchai和Ward,Appl.Environ.Microbiol.,57:419-25(1991))。含油微生物积累油超过它们的干细胞重量的约25%的情形并不鲜见。
术语“含油酵母”指那些能够产油并被归类为酵母的微生物。含油酵母的实例包括但不限于如下属:耶氏酵母属、假丝酵母属、红酵母属、红冬孢酵母属、隐球酵母属、丝孢酵母属和油脂酵母属。
术语“裸藻纲(Euglenophyceae)”指发现生活在淡水环境、海洋环境、土壤环境和寄生环境中的一群单细胞的无色或光合鞭毛虫(“类眼虫”)。该纲的特征为孤立的单细胞,其中大多数是自由游动的并且具有从称为储存器的前内陷长出的两条鞭毛(其中一条可能不露出)。光合类眼虫含有一个至多个叶绿体,叶绿体从微小的盘状至延伸的板状或带状而不同。无色类眼虫依赖于渗透营养或吞噬营养来进行营养同化作用。已经描述了约1000种物种并将它们分为约40个属和6个目。裸藻纲的实例包括但不限于如下属:裸藻属(Euglena)、Eutreptiella和Tetruetreptia。
如本文所用,“核酸”意指多核苷酸,并包括单链或双链的脱氧核糖核苷酸或核糖核苷酸碱基聚合物。核酸也可以包括片段和经修饰的核苷酸。因此,术语“多核苷酸”、“核酸序列”、“核苷酸序列”或“核酸片段”可互换使用,并且指作为单链或双链的RNA或DNA聚合物,任选含有合成的、非天然的或改变的核苷酸碱基。DNA聚合物形式的多核苷酸可由cDNA、基因组DNA、合成DNA或它们的混合物的一个或多个片段构成。核苷酸(通常以它们的5′-单磷酸形式存在)可以用如下它们的单字母名称指代:“A”表示腺苷酸或脱氧腺苷酸(分别针对RNA或DNA),“C”表示胞苷酸或脱氧胞苷酸,“G”表示鸟苷酸或脱氧鸟苷酸,“U”表示尿苷酸,“T”表示脱氧胸苷酸,“R”表示嘌呤(A或G),“Y”表示嘧啶(C或T),“K”表示G或T,“H”表示A或C或T,“I”表示肌苷,“N”表示任何核苷酸。
术语“保守结构域”或“基序”指进化上相关的蛋白质的比对序列中在特定位置处保守的一组氨基酸。虽然同源蛋白质之间在其他位置的氨基酸可以发生变化,但在特定位置高度保守的氨基酸表明对蛋白质的结构、稳定性或活性来说是必需的氨基酸。因为它们可通过它们在蛋白质同系物家族的比对序列中的高度保守来鉴定,所以它们可用作识别标签或“签名”来确定具有新的测定序列的蛋白质是否属于以前鉴定的蛋白质家族。PCT公开WO 2007/061845和WO 2007/061742描述了七种不同的与Δ9延伸酶相关的基序。
术语“同源性”、“同源的”、“基本上类似的”和“基本上对应的”在本文中可互换使用。它们指这样的核酸片段,即其中一个或多个核苷酸碱基改变并不会影响该核酸片段介导基因表达或产生某种表型的能力。这些术语也指本发明的核酸片段的修饰(例如缺失或插入一个或多个核苷酸),相对于初始的未经修饰的核酸片段,该修饰基本上不会改变所得核酸片段的功能特性。因此,正如本领域技术人员应当理解的,本发明涵盖的不仅仅是具体的示例性序列。
此外,技术人员认识到,本发明所涵盖的基本上类似的核苷酸序列也通过它们(在中等严格条件如0.5X SSC,0.1%SDS,60℃下)与本文所示例的序列杂交的能力,或杂交至本文所公开的核苷酸序列的任何部分以及杂交至与本文所公开的任何核苷酸序列功能相当的序列的能力所限定。可以调节严格性条件以筛选中度相似的片段(例如来自远缘生物的同源序列),到筛选高度相似的片段(例如从近缘生物复制功能性酶的基因)。杂交后的洗涤可确定严格性条件。
术语“选择性杂交”包括指在严格杂交条件下,核酸序列与特定核酸靶序列以比其与非靶核酸序列的杂交更高的可检测程度(例如至少两倍于背景)杂交,并指基本排除了非靶核酸。选择性杂交的序列通常彼此具有约至少80%的序列同一性,或90%的序列同一性,最多并包括100%的序列同一性(即完全互补)。
术语“严格条件”或“严格杂交条件”包括指探针将会选择性杂交至其靶序列的条件。严格条件是序列依赖性的,并将因不同的环境而异。通过控制杂交和/或洗涤条件的严格性,可鉴定与探针100%互补的靶序列(同源探测)。或者,可调节严格条件以允许序列中的一些错配,以便检测到更低程度的相似性(异源探测)。通常,探针的长度少于约1000个核苷酸,任选长度少于500个核苷酸。
通常,严格条件将是如下那些条件:在pH7.0至8.3下盐浓度低于约1.5M钠离子,通常约0.01至1.0M钠离子浓度(或其他盐),并且对于短探针(例如10至50个核苷酸)温度为至少约30℃,而对于长的探针(例如多于50个核苷酸)温度为至少约60℃。严格条件也可以通过加入诸如甲酰胺之类的去稳定剂来实现。示例性的低严格条件包括在37℃下于含30至35%甲酰胺、1M NaCl、1%SDS(十二烷基硫酸钠)的缓冲液中杂交,以及在50至55℃下用1X至2X SSC(20X SSC=3.0MNaCl/0.3M柠檬酸三钠)洗涤。示例性的中等严格条件包括在37℃下于40至45%甲酰胺、1M NaCl、1%SDS中杂交,以及在55至60℃下用0.5X至1X SSC洗涤。示例性的高严格条件包括在37℃下于50%甲酰胺、1M NaCl、1%SDS中杂交,以及在60至65℃下用0.1X SSC洗涤。
特异性通常取决于杂交后洗涤,最终洗涤溶液的离子强度和温度是关键因素。对于DNA-DNA杂交体,Tm可以用Meinkoth等人,Anal.Biochem.,138:267-284(1984)中的等式估算:Tm=81.5℃+16.6(log M)+0.41(%GC)-0.61(%form)-500/L;其中M是单价阳离子的体积摩尔浓度,%GC是DNA中鸟苷和胞嘧啶核苷酸的百分比,%form是杂交溶液中甲酰胺的百分比,而L是以碱基对表示的杂交体的长度。Tm是(在确定的离子强度和pH下)50%的互补靶序列与完全匹配的探针杂交时的温度。每出现1%的错配,Tm降低约1℃;因此,可调节Tm、杂交和/或洗涤条件以与具有期望同一性的序列杂交。例如,如果要寻求具有≥90同一性百分比(%)的序列,则可将Tm降低10℃。通常,在确定的离子强度和pH下,严格条件选择为比特定序列及其互补序列的热解链温度(Tm)低约5℃。然而,极严格条件可采用在比热解链温度(Tm)低1、2、3或4℃的温度下杂交和/或洗涤;中等严格条件可采用在比热解链温度(Tm)低6、7、8、9或10℃的温度下杂交和/或洗涤;而低严格条件可采用在比热解链温度(Tm)低11、12、13、14、15或20℃的温度下杂交和/或洗涤。利用上述等式、杂交和洗涤组合物以及所需的Tm,一般技术人员将会理解,杂交和/或洗涤溶液的严格性的变化已经在本质上得以描述。如果所需的错配程度导致Tm低于45℃(水溶液)或32℃(甲酰胺溶液),则优选增加SSC的浓度以便能使用更高的温度。对核酸杂交的详尽指导可在以下文献中找到:Tijssen,LaboratoryTechniques in Biochemistry and Molecular Biology--Hybridization withNucleic Acid Probes,第I部分,第2章“Overview of principles ofhybridization and the strategy of nucleic acid probe assays”,Elsevier,NewYork(1993);以及Current Protocols in Molecular Biology,第2章,Ausubel等人编辑,Greene Publishing and Wiley-Interscience,New York(1995)。杂交和/或洗涤条件可进行至少10、30、60、90、120或240分钟。
上下文中核酸序列或多肽序列的“序列同一性”或“同一性”指在特定比较窗口上进行比对以寻求最大对应时,两个序列中相同的核酸碱基或氨基酸残基。
因此,“序列同一性百分比”指通过在比较窗口上比较两个最佳对齐的序列而测得的值,其中与参考序列(其不包括添加或缺失)相比较,比较窗口中的多核苷酸或多肽序列部分可包括添加或缺失(即缺口)以实现两个序列的最佳比对。该百分比通过如下计算:测定相同核酸碱基或氨基酸残基在两个序列中出现的位置的数目,以获得匹配位置的数目,将匹配位置的数目除以比较窗口中的总位置数目并将所得结果乘以100而获得序列同一性百分比。序列同一性百分比的可用的实例包括但不限于50%、55%、60%、65%、70%、75%、80%、85%、90%或95%,或50%至100%的任何整数百分比。这些同一性可以用本文描述的任何程序测定。
序列比对和百分比同一性或相似性的计算可以用设计用于检测同源序列的多种比较方法来确定,这些方法包括但不限于LASERGENE生物信息学计算软件包(DNASTAR Inc.,Madison,WI)的MegAlignTM程序。在本专利申请的上下文中应当理解,使用序列分析软件进行分析时,除非另外指明,否则分析结果将基于所参考程序的“默认值”。在此所用的“默认值”将指在首次初始化软件时软件最初加载的任何值或参数集。
“Clustal V比对方法”对应于称为Clustal V(在Higgins和Sharp,CABIOS,5:151-153(1989);Higgins,D.G.等人,Comput.Appl.Biosci.,8:189-191(1992)中有所描述)并且可以在LASERGENE生物信息学计算软件包(同上)的MegAlignTM程序中找到的比对方法。对于多重比对,默认值对应于缺口罚分(GAP PENALTY)=10和缺口长度罚分(GAPLENGTH PENALTY)=10。用Clustal V方法进行成对比对和蛋白质序列的百分比同一性计算的默认参数为KTUPLE=1、缺口罚分=3、窗口(WINDOW)=5和DIAGONALS SAVED=5。对于核酸,这些参数为KTUPLE=2,缺口罚分=5,窗口=4和DIAGONALS SAVED=4。在用Clustal V程序进行序列比对后,有可能通过观察相同程序中的“序列距离”表来获得“百分比同一性”。
“BLASTN比对方法”是由国家生物技术信息中心(National Centerfor Biotechnology Information,NCBI)提供的用以采用默认参数比较核苷酸序列的算法。
本领域的技术人员非常清楚,多种程度的序列同一性可用于从其他物种中鉴定多肽,其中这类多肽具有相同或相似的功能或活性。同一性百分比的可用的实例包括但不限于50%、55%、60%、65%、70%、75%、80%、85%、90%或95%,或50%至100%的任何整数百分比。实际上,50%至100%的任何整数氨基酸同一性可用于描述本发明,例如51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%。而且,所关注的是这种分离的核苷酸片段的任何全长或部分互补的序列。
“密码子简并性”指允许核苷酸序列在不影响所编码的多肽的氨基酸序列的情况下发生变化的遗传密码的性质。因此,本发明涉及编码氨基酸序列的全部或基本部分的任何核酸片段,该氨基酸序列编码在SEQID NO:13和SEQ ID NO:14中示出的本发明的类眼虫多肽。技术人员非常了解具体宿主细胞在使用核苷酸密码子以确定给定氨基酸时所表现出的“密码子偏倚性”。因此,当合成基因用以改善在宿主细胞中的表达时,希望对基因进行设计,使得其密码子使用频率接近该宿主细胞优选的密码子使用频率。
“合成的基因”可由使用本领域技术人员已知的方法化学合成的寡核苷酸构件装配而成。将这些构件进行连接并退火以形成基因节段,该基因节段随后在酶促作用下装配而构建成完整的基因。因此,基于最优化核苷酸序列以反映宿主细胞的密码子偏倚性,可以定制基因用以最优化基因表达。如果密码子使用偏向于宿主偏好的那些密码子,则技术人员会理解成功的基因表达的可能性。优选的密码子的确定可基于对来源于宿主细胞的基因(其中序列信息可获得)的检测。
“基因”指表达特定蛋白质的核酸片段,并且该核酸片段可以指单独的编码区或可以包括位于编码序列之前的调控序列(5′非编码区)和之后的调控序列(3′非编码区)。“天然基因”是指天然存在的具有其自己的调控序列的基因。“嵌合基因”是指不是天然基因的任何基因,包含在天然情况下不是一起存在的调控序列和编码序列。因此,嵌合基因可包括源于不同来源的调控序列和编码序列,或者包括源于同一来源但以不同于天然存在的方式排列的调控序列和编码序列。“内源性基因”指位于生物的基因组内它的天然位置的天然基因。“外来基因”指正常情况下不存在于宿主生物中的基因,它通过基因转移导入宿主生物内。外来基因可以包含插入到非天然生物内的天然基因,或嵌合基因。“转基因”是已通过转化方法导入基因组内的基因。“经密码子最优化的基因”是其密码子使用频率经设计用以模仿宿主细胞优选的密码子使用频率的基因。
“编码序列”指编码特定氨基酸序列的DNA序列。“调控序列”指位于编码序列上游(5′非编码序列)、中间或下游(3′非编码序列)的核苷酸序列,并且该核苷酸序列影响相关编码序列的转录、RNA加工或稳定性或翻译。调控序列可包括但不限于:启动子、翻译前导序列、内含子、多腺苷酸化识别序列、RNA加工位点、效应子结合位点和茎环结构。
“启动子”指能够控制编码序列或功能性RNA表达的DNA序列。一般来讲,编码序列位于启动子序列的3′端。启动子可整个源于天然基因,或者由源于不同的天然存在的启动子的不同元件组成,或者甚至包含合成的DNA片段。本领域内的技术人员应当理解,不同的启动子可以在不同的组织或细胞类型中,或者在不同的发育阶段,或者响应不同的环境条件而引导基因的表达。导致基因在几乎所有发展阶段中表达的启动子通常称为“组成型启动子”。还应当认识到,由于在大多数情况下调控序列的确切边界(特别是它的5’端)尚未完全确定,因此一些改变形式的DNA片段可能具有相同的启动子活性。
启动子序列可以由邻近的和更远处的上游元件组成,后一类元件常称为增强子和/或沉默子。因此,“增强子”是能刺激启动子活性的DNA序列,并且可以是启动子的固有的元件或插入的异源元件,用以增强启动子的水平或阶段特异性。“沉默子”是能抑制启动子活性的DNA序列,并且可以是启动子的固有的元件或插入的异源元件,用以抑制启动子的水平或阶段特异性。
“翻译前导序列”指位于基因的转录起始位点和编码序列之间的多核苷酸序列。翻译前导序列存在于翻译起始序列的经完全加工后的mRNA上游。翻译前导序列可影响mRNA的初级转录过程、mRNA稳定性或翻译效率。已经描述了翻译前导序列的实例(Turner,R.和Foster,G.D.,Mol.Biotechnol.,3:225-236(1995))。
术语“3′非编码序列”、“转录终止子”和“终止序列”指位于编码序列下游的DNA序列。这包括多腺苷酸化识别序列和编码能影响mRNA加工或基因表达的调节信号的其他序列。多腺苷酸化信号通常表征为影响多腺苷酸片添加到mRNA前体的3′末端。3′区可影响相关编码序列的转录、RNA加工或稳定性或翻译。
“RNA转录物”指由RNA聚合酶催化的DNA序列转录所产生的产物。当RNA转录物与DNA序列拷贝完全互补时,它指初级转录物。当RNA转录物是来源于初级转录物的转录后加工的RNA序列时,它指成熟的RNA。“信使RNA”或“mRNA”指无内含子并且可以由细胞翻译成蛋白质的RNA。“cDNA”指与mRNA模板互补并用反转录酶从mRNA模板合成的DNA。cDNA可以是单链,或使用DNA聚合酶I的Klenow片段转化成双链。“有义”RNA指包含mRNA并且能在细胞内或体外翻译成蛋白质的RNA转录物。“反义RNA”指与靶初级转录物或mRNA的全部或部分互补并且可阻断靶基因的表达的RNA转录物(美国专利5,107,065)。反义RNA可以与特定基因转录物的任何部分,即5′非编码序列、3′非编码序列、内含子或编码序列互补。“功能性RNA”指反义RNA、核酶RNA或其他不能翻译但是对细胞过程有影响作用的RNA。术语“互补的”和“反向互补的”对mRNA转录来说可互换使用,并且用以定义信使反义RNA。
术语“可操作地连接”指单个核酸片段上的核酸序列的关联,使得其中一个核酸序列的功能受到另一个核酸序列的影响。例如,当启动子能够影响编码序列的表达(即,该编码序列受到该启动子的转录控制)时,则该启动子与该编码序列可操作地连接。编码序列可能以有义或反义的取向可操作地连接至调控序列。
术语“重组体”指(例如)通过化学合成或通过用基因工程技术操纵分离的核酸片段而实现的两个原本分离的序列片段的人工组合。
如本文所用,术语“表达”指源于本发明的核酸片段的有义RNA(mRNA)或反义RNA的转录和稳定积聚。表达也可指mRNA翻译成蛋白质(其为前体蛋白或成熟蛋白)。
“成熟”蛋白指经翻译后加工的多肽(即已经去除了存在于初始翻译产物中的任何前肽或肽原的多肽)。“前体”蛋白质指mRNA的初级翻译产物(即前肽和肽原仍然存在)。前肽和肽原可以是(但不限于)细胞内定位信号。
术语“质粒”和“载体”指通常携带有不属于细胞中心代谢的部分的基因的染色体外元件,并且常常是环状双链DNA片段的形式。这类元件可以是源自任何来源的自主复制序列、基因组整合序列、噬菌体或单链或双链DNA或RNA的核苷酸序列(线性或环状),其中多个核苷酸序列已连接或重组为一种独特构建体,该独特构建体能够将表达盒引入细胞中。
术语“表达盒”指包含如下序列的DNA片段:所选基因的编码序列和所选基因产物表达所需的位于编码序列之前(5′非编码序列)和之后(3′非编码序列)的调控序列。因此,表达盒通常由如下序列构成:(1)启动子序列;(2)编码序列(即ORF);和(3)3′非翻译区(即终止子),在真核生物中其通常含有多腺苷酸化位点。表达盒通常包含于载体中以有利于克隆和转化。可以将不同表达盒转化进包括细菌、酵母、植物和哺乳动物细胞在内的不同生物体中,只要能针对每种宿主使用正确的调控序列。
“重组DNA构建体”(在本文中也可互换地称为“表达构建体”和“构建体”)包含核酸片段(如在天然条件下不会一起存在的调控序列和编码序列)的人工组合。因此,重组DNA构建体可以包含源于不同来源的调控序列和编码序列,或源于相同来源但以不同于天然存在的方式排列的调控序列和编码序列。此类构建体可独自使用或与载体组合使用。如果使用载体,则载体的选择取决于本领域技术人员熟知的将要用于转化宿主细胞的方法。例如可以使用质粒载体。技术人员十分了解必须存在于载体上以成功地转化、选择和繁殖含本发明任何分离的核酸片段的宿主细胞的遗传元件。技术人员还将认识到,不同的独立转化事件将导致不同水平和模式的表达(Jones等人,EMBO J.,4:2411-2418(1985);DeAlmeida等人,Mol.Gen.Genetics 218:78-86(1989)),因此,必须筛选多次事件以获得显示期望表达水平和模式的品系。这样的筛选可以通过DNA的Southern印迹分析、mRNA表达的Northern印迹分析、蛋白表达的免疫印迹分析或表型分析等完成。
术语“导入”指将核酸(例如表达盒)或蛋白质提供至细胞中。导入包括指将核酸整合进真核或原核细胞中,在该细胞中核酸可以整合进细胞的基因组内,并且包括指将核酸或蛋白暂时提供给细胞。导入包括指稳定的或瞬时的转化方法以及有性杂交。因此,将核酸片段(如重组DNA构建体或表达盒)插入细胞内的情况下的“导入”意指“转染”或“转化”或“转导”,并且包括指将核酸片段整合进真核或原核细胞中,在该细胞中核酸片段可以整合进细胞的基因组(如染色体、质粒、质体或线粒体DNA)内、转变成自主的复制子或瞬时表达(例如转染的mRNA)。
如本文所用,“转基因”指其基因组内含有异源多核苷酸的细胞。优选的是,异源多核苷酸被稳定地整合进基因组中,使得该多核苷酸能传递至连续的世代。异源多核苷酸可以单独地或作为表达盒的部分整合进基因组中。本文所用的转基因包括因异源核酸存在而已经改变了基因型的任何细胞或细胞系,包括初始进行此类改变的那些转基因以及通过初始的转基因与不同配型交配而产生的那些。在此使用的术语“转基因”不涵盖通过诸如随机异花受精、非重组病毒感染、非重组细菌转化、非重组转座或自发突变之类的自然发生事件导致的基因组(染色体基因组或染色体外基因组)改变。
本文使用的标准重组DNA和分子克隆技术是本领域所熟知的并且在如下文献中有更全面的描述:Sambrook,J.,Fritsch,E.F.和Maniatis,T.,Molecular Cloning:A Laboratory Manual;Cold Spring Harbor Laboratory:Cold Spring Harbor,NY(1989);Silhavy,T.J.、Bennan,M.L.和Enquist,L.W.,Experiments with Gene Fusions,Cold Spring Harbor Laboratory:Cold Spring Harbor,NY(1984);以及Ausubel,F.M.等人,CurrentProtocols in Molecular Biology,Greene Publishing Assoc.andWiley-Interscience出版,Hoboken,NJ(1987)。转化方法是本领域技术人员熟知的并且在下文中有所描述:“综述:脂肪酸和三酰基甘油的微生物生物合成”
通常,含油微生物的脂质蓄积是响应存在于生长培养基中的总的碳氮比而触发。该过程(导致含油微生物中游离棕榈酸(16:0)的从头合成)在美国专利7,238,482中有详细描述。棕榈酸是长链饱和和不饱和脂肪酸衍生物的前体,这些脂肪酸衍生物通过延伸酶和去饱和酶的作用形成(图1)。
TAG(脂肪酸的主要贮存单位)通过涉及如下反应的一系列反应形成:(1)一分子的酰基辅酶A和甘油-3-磷酸通过酰基转移酶酯化而生成溶血磷脂酸;(2)第二分子的酰基辅酶A通过酰基转移酶酯化而生成1,2-二酰基甘油磷酸(通常称为磷脂酸);(3)通过磷脂酸磷酸酶除去磷酸而生成1,2-二酰基甘油(DAG);以及(4)在酰基转移酶的作用下加入第三个脂肪酸以形成TAG。广谱的脂肪酸可被整合进TAG中,包括饱和和不饱和脂肪酸以及短链和长链脂肪酸。
ω脂肪酸的生物合成
其中油酸转化成ω-3/ω-6脂肪酸的代谢过程涉及通过添加碳原子使碳链延长和通过加入双键使分子去饱和。这需要存在于内质网膜内的一系列特殊去饱和酶和延伸酶。然而,如图1中看到的和如下所述的,通常存在多个用于产生特定ω-3/ω-6脂肪酸的替代途径。
具体地讲,所有途径均需要最初通过Δ12去饱和酶将油酸转化成LA(第一种ω-6脂肪酸)。然后,利用“Δ9延伸酶/Δ8去饱和酶途径”并将LA用作底物来如下形成长链ω-6脂肪酸:(1)通过Δ9延伸酶将LA转化成ETA;(2)通过Δ8去饱和酶将ETA转化成DGLA;和(3)通过Δ5去饱和酶将DGLA转化成ARA;(4)通过C20/22延伸酶将ARA转化成DTA;以及(5)通过Δ4去饱和酶将DTA转化成DPAn-6。作为另外一种选择,“Δ9延伸酶/Δ8去饱和酶途径”可以将ALA用作底物来如下产生长链ω-3脂肪酸:(1)通过Δ15去饱和酶将LA转化成ALA(第一种ω-3脂肪酸);(2)通过Δ9延伸酶将ALA转化成DGLA;(3)通过Δ8去饱和酶将DGLA转化成ETA;(4)通过Δ5去饱和酶将ETA转化成EPA;(5)通过C20/22延伸酶将EPA转化成DPA;和(6)通过Δ4去饱和酶将DPA转化成DHA。任选地,ω-6脂肪酸可转化成ω-3脂肪酸;例如,ALA可通过Δ15去饱和酶活性由LA生成;ETA和EPA可通过Δ17去饱和酶活性分别由DGLA和ARA生成。
用于ω-3/ω-6脂肪酸生物合成的替代途径利用Δ6去饱和酶和C18/20延伸酶(即“Δ6去饱和酶/Δ6延伸酶途径”)。更具体地讲,LA和ALA可通过Δ6去饱和酶分别转化成GLA和ETA;然后,C18/20延伸酶将GLA转化成DGLA和/或将STA转化成ETA。随后如上所述形成下游PUFA。
预期需要导入特定宿主生物中用以产生ω-3/ω-6脂肪酸的特定功能将取决于宿主细胞(及其天然的PFUA概况和/或去饱和酶/延伸酶概况)、底物的可利用性和所需终产物。例如,在一些实施方案中优选的是Δ9延伸酶/Δ8去饱和酶途径的表达,而不是Δ6去饱和酶/Δ6延伸酶途径的表达,因为通过前面的途径产生的PUFA无GLA和/或ETA。
本领域技术人员将能够鉴定多种编码ω-3/ω-6脂肪酸生物合成所需的每种酶的候选基因。可用的去饱和酶和延伸酶序列可源自任何来源,例如,分离自天然来源(来自细菌、藻类、真菌、植物、动物等)、经由半合成途径产生或从头合成。尽管导入宿主的去饱和酶和延伸酶基因的具体来源不是关键的,但选择具有去饱和酶或延伸酶活性的特定多肽的考虑事项包括:(1)多肽的底物特异性;(2)多肽或其组分是否为限速酶;(3)去饱和酶或延伸酶是否是合成所需PUFA所必需的;(4)多肽所需的辅因子;和/或(5)多肽在其产生后是否被修饰(例如,通过激酶或异戊烯转移酶修饰)。表达的多肽优选具有与它在宿主细胞中的位置的生化环境相容的参数(对于另外的详细内容,参见美国专利7,238,482)。
在另外的实施方案中,考虑每种特定的去饱和酶和/或延伸酶的转化效率也将是有用的。更具体地讲,由于每种酶极少能以100%的效率将底物转化成产物,宿主细胞所产生的未纯化的油的最终脂质概况通常将是由期望的ω-3/ω-6脂肪酸及多种上游PUFA中间产物组成的多种PUFA的混合物。因此,当使所需脂肪酸的生物合成最优化时,每种酶的转换效率也是要考虑的变量。
考虑到上述各个考虑事项,具有合适去饱和酶和延伸酶活性(如Δ6去饱和酶、C18/20延伸酶、Δ5去饱和酶、Δ17去饱和酶、Δ15去饱和酶、Δ9去饱和酶、Δ12去饱和酶、C14/16延伸酶、C16/18延伸酶、Δ9延伸酶、Δ8去饱和酶、Δ4去饱和酶和C20/22延伸酶)的候选基因可根据可公开获得的文献(如GenBank)、专利文献和对具有产生PUFA的能力的生物的实验分析来鉴定。这些基因将适用于导入到特定的宿主生物中,以使该生物能合成PUFA或增强生物的PUFA合成。
新的Δ9延伸酶的序列鉴定
在本发明中,已经从Euglena anabaena中分离出编码Δ9延伸酶的核苷酸序列,汇总于下面的表3中。
表3
Euglena anabaenaΔ9延伸酶的汇总
  缩写  核苷酸SEQ ID NO  氨基酸SEQ ID NO
  EaD9Elo1  11  13
  EaD9Elo2  12  14
  EaD9eS  26  27
*注意:SEQ ID NO:27与SEQ ID NO:13的序列相同。
因此,本发明涉及分离的多核苷酸,该多核苷酸包含:
(a)编码具有Δ9延伸酶活性的多肽的核苷酸序列,其中基于ClustalV比对方法在与SEQ ID NO:13或SEQ ID NO:14中示出的氨基酸序列进行比较时,该多肽具有至少80%的氨基酸同一性;
(b)编码具有Δ9延伸酶活性的多肽的核苷酸序列,其中基于BLASTN比对方法在与SEQ ID NO:11、SEQ ID NO:12或SEQ ID NO:26中示出的核苷酸序列进行比较时,该核苷酸序列具有至少80%的序列同一性;或
(c)(a)、(b)或的核苷酸序列的互补序列,其中该互补序列与该核苷酸序列由相同数目的核苷酸组成并且100%互补。
在另一个方面,本发明涉及分离的多核苷酸,该多核苷酸包含编码具有Δ9延伸酶活性的多肽的核苷酸序列,其中基于BLASTN比对方法在与SEQ ID NO:11、SEQ ID NO:12或SEQ ID NO:26中示出的核苷酸序列进行比较时,该核苷酸序列具有至少90%的序列同一性。
具有至少约80%-90同一性百分比(%)的更优选的氨基酸片段是特别合适的,并且具有至少约90%-95同一性百分比(%)的那些序列是最优选的。类似地,对应本发明ORF的编码Δ9延伸酶的优选核酸序列是编码活性蛋白的那些序列并且其具有至少约80%-90%的同一性;具有至少约90%-95同一性百分比(%)的那些序列是最优选的。
在备选的实施方案中,本发明的EaD9Elo1和/或EaD9Elo2序列可以经密码子最优化以便在特定的宿主生物中表达。如本领域所熟知的,这可以成为进一步优化酶在候选宿主中的表达的有用手段,因为使用宿主优选的密码子可以显著提高编码该多肽的外源基因的表达。通常,宿主优选的密码子可在所关注的具体宿主物种中通过检查蛋白质(优选那些最大量表达的蛋白质)中的密码子使用以及确定哪些密码子的使用频率最高来测定。然后,可利用宿主物种中优选的密码子整个或部分地合成具有(例如)延伸酶活性的所关注的多肽的编码序列。也可以合成DNA的全部(或部分)以去除将存在于转录的mRNA中的二级结构的任何去稳定序列或区域。也可以合成DNA的全部(或部分)以将碱基组成改变成期望宿主细胞中更优选的碱基组成。
在本文中的本发明的一个实施方案中,EaD9Elo1(SEQ ID NO:11)经密码子最优化以便在解脂耶氏酵母中表达。基于先前对解脂耶氏酵母密码子使用概况的确定、对那些优选的密码子的鉴定以及对‘ATG’起始密码子周围的共有序列的确定(参见美国专利7,238,482和美国专利7,125,672),这是可能的。所得的合成基因称为EaD9ES(SEQ ID NO:26)。由经密码子最优化的Δ9延伸酶基因编码的蛋白质序列(即SEQ IDNO:27)与野生型蛋白质序列(即SEQ ID NO:13)相同。可以利用类似的技术来产生源自EaD9Elo2(SEQ ID NO:12)的合成的Δ9延伸酶,以用于在解脂耶氏酵母中表达。
基于野生型EaD9Elo1和/或EaD9Elo2序列,本领域的技术人员应当能够利用本文中的教导内容来产生多种适用于在候选宿主中最佳表达的其他经密码子最优化的Δ9延伸酶蛋白。因此,本发明涉及任何经密码子最优化的Δ9延伸酶蛋白,该延伸酶蛋白来源于野生型核苷酸序列EaD9Elo1(SEQ ID NO:11)或EaD9Elo2(SEQ ID NO:12)。这包括但不限于SEQ ID NO:26中示出的核苷酸序列,该核苷酸序列编码经密码子最优化以便在解脂耶氏酵母中表达的合成的Δ9延伸酶蛋白(即EaD9eS)。在备选的实施方案中,期望修饰编码EaD9Elo1和/或EaD9Elo2的密码子的部分,以增强基因在宿主生物(包括但不限于植物或植物部分、藻类、细菌、侯选的酵母、类眼虫、原生藻菌或真菌)中的表达。
同源物的鉴定和分离
任何本发明的延伸酶序列(即EaD9Elo1、EaD9Elo2或EaD9eS)或其部分均可用于利用序列分析软件来搜索相同或其他细菌、藻类、真菌、类眼虫或植物物种中的Δ9延伸酶同源物。通常,这种计算机软件通过将同源程度赋予多种置换、缺失和其他修饰来匹配相似的序列。
作为另外一种选择,也可将任何本发明的延伸酶序列或其部分用作杂交试剂用以鉴定Δ9延伸酶同源物。核酸杂交试验的基本组成包括探针、怀疑含有所关注的基因或基因片段的样品及特定的杂交方法。本发明的探针通常是与待检测核酸序列互补的单链核酸序列。探针与待检测的核酸序列是“可杂交的”。尽管探针的长度可在5个碱基到数万个碱基之间变化,但通常约15个碱基到约30个碱基的探针长度是合适的。只需要探针分子的部分与待检测的核酸序列互补。另外,探针和靶序列之间不需要完全互补。杂交确实可以在并不完全互补的分子之间发生,结果是杂交区内的一定比率的碱基未与正确的互补碱基配对。
杂交方法是非常确实的。通常探针和样品必须在允许核酸杂交的条件下混合。这涉及在正确浓度和温度条件下在存在无机或有机盐时使探针和样品接触。探针和样品核酸必须接触足够长的时间,使探针和样品核酸之间的任何可能的杂交均可发生。混合物中的探针或标记的浓度将决定杂交发生所需的时间。探针或靶标的浓度越高,所需的杂交孵育时间就越短。任选地,可以加入离液剂(如氯化胍、硫氰酸胍、硫氰酸钠、四氯乙酸锂、高氯酸钠、四氯乙酸铷、碘化钾和三氟乙酸铯)。如果需要,可以将甲酰胺加入到杂交混合物中,通常为30-50%(v/v)。
可以采用多种杂交溶液。通常,这些杂交溶液包含约20%至60%体积,优选30%体积的极性有机溶剂。普通的杂交溶液采用约30-50%v/v甲酰胺、约0.15至1M氯化钠、约0.05至0.1M缓冲液(如柠檬酸钠、Tris-HCl、PIPES或HEPES(pH范围约6-9))、约0.05至0.2%去污剂(如十二烷基硫酸钠)或0.5-20mM的EDTA、FICOLL(Pharmacia Inc.)(约300-500千道尔顿)、聚乙烯吡咯烷酮(约250-500千道尔顿)和血清白蛋白。一般的杂交溶液还将包含约0.1至5mg/mL未经标记的载体核酸、片段化的核酸DNA(如小牛胸腺或鲑精DNA或酵母RNA),以及任选约0.5%至2%重量/体积的甘氨酸。还可以包含其他添加剂,例如包括多种极性水溶性或可膨胀试剂(如聚乙二醇)、阴离子聚合物(如聚丙烯酸酯或聚甲基丙烯酸酯)和阴离子糖类聚合物(如硫酸葡聚糖)在内的体积排阻剂。
核酸杂交可适用于多种测定形式。最合适的形式之一是夹心测定形式。夹心测定尤其适用于在非变性条件下杂交。夹心型测定的主要成分是固体支持体。固体支持体具有吸附或共价连接至其上的固定核酸探针,该探针未经标记并且与序列的一部分互补。
在另外的实施方案中,本文描述的任何Δ9延伸酶核酸片段(或其经鉴定的任何同源物)均可用于从相同的或其他细菌、藻类、真菌、类眼虫或植物物种中分离编码同源蛋白质的基因。使用序列依赖性规程分离同源基因是本领域熟知的。序列依赖性规程的实例包括但不限于:(1)核酸杂交方法;(2)DNA和RNA扩增方法,这可通过核酸扩增技术的多种用法来举例说明[如聚合酶链反应(PCR),Mullis等人,美国专利4,683,202;连接酶链反应(LCR),Tabor,S.等人,Proc.Acad.Sci.U.S.A.,82:1074(1985);或链置换扩增(SDA),Walker等人,Proc.Natl.Acad.Sci.U.S.A.,89:392(1992)];以及(3)文库构建和互补筛选方法。
例如,编码与本文描述的Δ9延伸酶相似的蛋白质或多肽的基因可以用本领域技术人员熟知的方法,通过将本发明的核酸片段的全部或部分用作DNA杂交探针来筛选来自(例如)任何期望的酵母或真菌(其中那些产生EDA和/或ETrA的生物将是优选的)的文库而得以直接分离。基于本发明核酸序列的特异性寡核苷酸探针可通过本领域已知的方法(Maniatis,同上)设计和合成。而且,整个序列可直接用于通过熟练技术人员已知的方法(如随机引物DNA标记、切口平移或末端标记技术)合成DNA探针,或使用可获得的体外转录体系合成RNA探针。另外,可设计特异性引物并将其用于扩增部分(或全长)的本发明序列。所得的扩增产物可在扩增反应过程中直接标记或在扩增反应后标记,并用作探针来在合适的严格条件下分离全长的DNA片段。
通常,在PCR类型的扩增技术中,引物具有不同的序列而且彼此之间不互补。取决于所需的检测条件,应当设计引物序列以提供既有效又可靠的靶核酸的复制。PCR引物设计方法是本领域常见且熟知的(Thein和Wallace,“The use of oligonucleotide as specific hybridization probes inthe Diagnosis of Genetic Disorders”,Human Genetic Diseases:A PracticalApproach,K.E.Davis编辑,(1986)第33-50页,IRL:Herndon,VA;以及Rychlik,W.,Methods in Molecular Biology,White,B.A.编辑,(1993)第15卷,第31-39页,PCR Protocols:Current Methods and Applications.Humania:Totowa,NJ)。
通常,可以将本发明序列的两个短片段在PCR规程中用于从DNA或RNA扩增编码同源基因的更长的核酸片段。PCR也可以用克隆的核酸片段的文库进行,其中一个引物的序列源自本发明的核酸片段,而另一个引物的序列利用编码真核基因的mRNA前体3′端的多腺苷酸尾的存在。
备选地,第二个引物序列可以基于来源于克隆载体的序列。例如,技术人员可以按照RACE规程(Frohman等人,Proc.Acad.Sci.U.S.A.,85:8998(1988)),通过用PCR扩增在转录物内单个位点与3′或5′端之间的区域的拷贝来产生cDNA。以3′和5′方向取向的引物可用本发明的序列设计。使用可商业获得的3′RACE或5′RACE体系(Gibco/BRL,Gaithersburg,MD)可以分离特异性的3′或5′cDNA片段(Ohara等人,Proc.Acad.Sci.U.S.A.,86:5673(1989);Loh等人,Science,243:217(1989))。
在其他实施方案中,任何本文所述的Δ9延伸酶核酸片段(或其经鉴定的任何同源物)均可用于产生新的和/或改良的脂肪酸延伸酶。如本领域所熟知的,体外诱变和选择、化学诱变、“基因改组(gene shuffling)”法或其他手段可用于获得天然存在的延伸酶基因的突变(其中这种突变可以包括缺失、插入和点突变或它们的组合)。这将使得能分别在体内产生具有延伸酶活性的多肽,该多肽在宿主细胞内具有更佳的物理参数和动力参数,例如更长的半衰期或更高的所需PUFA的产生速率。或者,如果需要,可以通过常规诱变、所得突变多肽的表达及其活性的测定来确定所关注的多肽(即Δ9延伸酶)对酶活性重要的区域。这些技术的综述在美国专利7,238,482中有描述。源自EaD9Elo1、EaD9Elo2和EaD9eS的所有这类突变蛋白和编码它们的核苷酸序列均在本发明的范围内。
备选地,改良的脂肪酸可以通过结构域交换合成,在该方法中将来自本文所述的任何Δ9延伸酶核酸片段的功能结构域与备选的延伸酶基因的功能结构域交换,从而产生新的蛋白质。如本文所用,“结构域”或“功能结构域”指能够引起微生物中的生物学应答的核酸序列。
用于产生多种ω-3和/或ω-6脂肪酸的方法
预计引入编码本文所述的Δ9延伸酶(即EaD9Elo1、EaD9Elo2、EaD9eS或其他突变酶、经密码子最优化的酶或它们的同源物)的嵌合基因,处于合适的启动子控制下,将会分别导致EDA和/或ETrA在转化的宿主生物中的产生增加。就这一点而论,本发明涵盖了用于直接产生PUFA的方法,该方法包括将脂肪酸底物(即LA和/或ALA)暴露给本文所述的延伸酶(例如,EaD9Elo1、EaD9Elo2或EaD9eS),使得底物被转化成所需的脂肪酸产物(即分别为EDA和/或ETrA)。
更具体地讲,本发明的目的是提供用于在微生物宿主细胞(如酵母、藻类、细菌、类眼虫、原生藻菌和真菌)中产生EDA的方法,其中微生物宿主细胞包含:
(a)编码Δ9延伸酶多肽的重组核苷酸分子,基于Clustal V比对方法在与具有SEQ ID NO:13或SEQ ID NO:14中示出的氨基酸序列的多肽进行比较时,该延伸酶多肽具有至少80%的氨基酸同一性;和
(b)LA源;
其中使微生物宿主细胞在使编码Δ9延伸酶的核酸片段表达并使LA转化成EDA的条件下生长,并且其中可任选回收EDA。
在本发明的备选实施方案中,Δ9延伸酶可用于将ALA转化成ETrA。因此,本发明提供了用于产生ETrA的方法,其中微生物宿主细胞包含:
(a)编码Δ9延伸酶多肽的重组核苷酸分子,基于Clustal V比对方法在与具有SEQ ID NO:13或SEQ ID NO:14中示出的氨基酸序列的多肽进行比较时,该延伸酶多肽具有至少80%的氨基酸同一性;和
(b)ALA源;
其中使微生物宿主细胞在使编码Δ9延伸酶的核酸片段表达并使ALA转化成ETrA的条件下生长,而且其中可任选回收ETrA。
作为另外一种选择,本文描述的每种Δ9延伸酶基因及其相应的酶产物可间接用于产生多种ω-6和ω-3PUFA(参见图1和美国专利7,238,482)。如果脂肪酸底物经由中间步骤或途径中间产物间接转化成所需的脂肪酸产物,则间接产生了ω-3/ω-6PUFA。因此,预期可以将本文描述的Δ9延伸酶(即EaD9Elo1、EaD9Elo2、EaD9eS或其他突变酶、经密码子最优化的酶或它们的同源物)与另外的编码PUFA生物合成途径的酶(如Δ6去饱和酶、C18/20延伸酶、Δ17去饱和酶、Δ8去饱和酶、Δ15去饱和酶、Δ9去饱和酶、Δ12去饱和酶、C14/16延伸酶、C16/18延伸酶、Δ9延伸酶、Δ5去饱和酶、Δ4去饱和酶、C20/22延伸酶)的基因结合表达以导致更高水平地产生长链ω-3/ω-6脂肪酸(如ARA、EPA、DTA、DPAn-6、DPA和/或DHA)。
在优选的实施方案中,本发明的Δ9延伸酶将与Δ8去饱和酶(例如,来自小眼虫的去饱和酶[Wallis等人,Arch.Biochem.and Biophys.,365(2):307-316(May 1999);PCT公开WO 2000/34439;美国专利6,825,017;PCT公开WO 2004/057001;PCT公开WO 2006/012325;美国专利7,256,033;美国专利申请11/635258];来自卡氏棘变形虫(Acanthamoeba castellanii)的去饱和酶[Sayanova等人,FEBS Lett.,580:1946-1952(2006)];来自盐生巴夫藻(Pavlova salina)的去饱和酶[PCT公开WO 2005/103253];来自路氏巴夫藻(Pavlova lutheri)的去饱和酶[PCT公开WO 2007/127381];来自Tetruetreptia pomquetensisCCMP1491的去饱和酶[美国专利申请11/876115];来自Eutreptiellasp.CCMP389的去饱和酶[美国专利申请11/876115];来自Eutreptiellacf_gymnastica CCMP1594的去饱和酶[美国专利申请11/876115;以及来自Euglena anabaena的去饱和酶[在共同未决的美国专利申请12/099799和12/099811中有描述])最低程度地一起表达。然而,包含于具体表达盒中的具体基因将取决于宿主细胞(及其PUFA概况和/或去饱和酶/延伸酶概况)、底物的可利用性和所需的终产物。
在备选的实施方案中,基于本文所述的完整序列、那些完整序列的互补序列、那些序列的基本部分、源于它们的经密码子最优化的延伸酶以及与它们基本同源的那些序列,破坏宿主生物的天然Δ9延伸酶可能是有用的。
微生物表达系统、表达盒和载体
本文描述的Δ9延伸酶基因和基因产物(即EaD9Elo1、EaD9Elo2、EaD9eS或其他突变酶、经密码子最优化的酶或其同源物)可以在异源微生物宿主细胞中表达,特别是在含油酵母(如解脂耶氏酵母)的细胞中表达。
含有引导外来蛋白质高水平表达的调控序列的微生物表达系统和表达载体是本领域技术人员熟知的。这些表达系统和表达载体的任一种均可用于构建用于产生本发明序列的任何基因产物的嵌合基因。然后可以将这些嵌合基因通过转化导入合适的微生物中以提供所编码的酶的高水平表达。
可用于转化合适的微生物宿主细胞的载体(如构建体、质粒)和DNA表达盒是本领域熟知的。存在于构建体中的序列的具体选择取决于所需的表达产物(同上)、宿主细胞的性质以及提出的相对于未转化细胞分离转化细胞的手段。然而,通常载体含有至少一个表达盒、选择标记和允许自主复制或染色体整合的序列。合适的表达盒包含基因控制转录的5′区(如启动子)、基因编码序列和控制转录终止的DNA片段3′区(如终止子)。最优选的是,这两个控制区均来源于来自转化的微生物宿主细胞的基因,但应当了解这种控制区不必源自选作生产宿主的特定物种的天然基因。
可用于驱动本发明的Δ9延伸酶ORF在期望的微生物宿主细胞中表达的转录控制区(也称为起始控制区或启动子)有许多并且是本领域技术人员所熟悉的。事实上,能够引导这些基因在所选宿主细胞中表达的任何启动子(即天然的、合成的或嵌合的启动子)均适用于本发明,但来自宿主物种的转录和翻译区是尤其有用的。在微生物宿主细胞中的表达可以诱导型或组成型的方式来实现。诱导型表达可通过诱导可操作地连接至所关注的基因的可调节启动子的活性来完成,而组成型表达可通过利用可操作地连接至所关注的基因的组成型启动子来实现。例如,当宿主细胞为酵母时,则提供在酵母细胞中起作用的转录和翻译区,尤其是来自宿主物种的转录和翻译区(例如,对于在解脂耶氏酵母中使用的优选的转录起始调节区,参见专利公开US-2006-0115881-A1)。可以使用许多调控序列的任意一种,这取决于是期望组成型转录还是诱导型转录、启动子在表达所关注的ORF中的效率、构建的容易性等。
已经发现围绕翻译起始密码子‘ATG’的核苷酸序列影响酵母细胞的表达。如果所需多肽在酵母中表达差,则可以修饰外源基因的核苷酸序列以包括有效的酵母翻译起始序列来获得最佳的基因表达。对酵母中的表达而言,这可以通过使无效表达基因框内融合至内源酵母基因(优选高度表达的基因)而使其定点诱变来完成。作为另外一种选择,可以测定宿主中的共有翻译起始序列并将该序列引入异源基因中,以便它们在所关注宿主中最优化表达。
终止区可源于起始区从其获得的基因的3′区或源于不同的基因。大量的终止区是已知的并且(在用于与它们源自的属和物种相同和不同的属和物种两者时)在多种宿主中发挥的功能令人满意。终止区的选择通常更多是为了方便而不是因为任何特殊的性质。终止控制区也可以源于优选宿主的天然的多种基因。在备选的实施方案中,3′-区也可以是合成的,因为本领域的技术人员可利用可用的信息来设计和合成用作转录终止子的3′-区序列。任选地,终止位点可以是非必需的;然而,如果包括则是最优选的。
如本领域的技术人员所意识到的,仅仅将基因插入到克隆载体中不能保证它将被成功地以所需要的水平表达。根据对高表达率的需要,通过操作许多控制转录、翻译、蛋白质稳定性、氧限制和从微生物宿主细胞分泌方面的不同遗传元件,已经建立了许多专用的表达载体。更具体地讲,已经被操作以控制基因表达的一些分子特征包括:相关转录启动子和终止子序列的性质;所克隆基因的拷贝数目(其中可以在单个表达构建体中克隆另外的拷贝和/或将另外的拷贝通过增加质粒拷贝数或通过将克隆基因多次整合进基因组中来引入宿主细胞中);基因是质粒携带的还是整合进了宿主细胞的基因组中;所合成的外来蛋白质的最终细胞定位;蛋白质在宿主生物内的翻译和正确折叠的效率;所克隆基因的mRNA和蛋白质在宿主细胞内的固有稳定性;以及所克隆基因中的密码子使用,使得其频率与宿主细胞的优选密码子使用频率接近。这些类型的修饰的每一种均涵盖在本发明中,作为进一步优化本文所述的Δ9延伸酶的表达的手段。
微生物宿主细胞的转化
一旦已经获得适用于在合适的微生物宿主细胞中表达的DNA盒(例如包含启动子、ORF和终止子的嵌合基因),则将其置于能够在宿主细胞中自主复制的质粒载体中,或将其直接整合进宿主细胞的基因组中。表达盒的整合可以在宿主基因组中随机地发生或者可以通过使用这样的构建体来靶向,即该构建体含有足以靶向宿主基因座中的重组的与宿主基因组同源的区。如果构建体靶向内源性基因座,则转录和翻译调控区的全部或某些可以由内源性基因座提供。
如果两个或更多个基因从独立的复制载体表达,则希望每个载体具有不同的选择手段并且应当缺乏与其他构建体的同源性以便维持稳定表达和防止元件在构建体之间重配(reassortment)。可用实验方法确定对调控区、选择手段和所引入的构建体的增殖方法的正确选择,以便所有导入的基因均以需要的水平表达从而提供所需产品的合成。
包含所关注的基因的构建体可以通过任何标准技术导入微生物宿主细胞中。这些技术包括转化(如醋酸锂转化[Methods in Enzymology,194:186-187(1991)])、原生质体转化、基因枪轰击(bolistic impact)、电穿孔、显微注射或将所关注的基因引入宿主细胞中的任何其他方法。
为方便起见,已通过任何方法操纵来吸收DNA序列(如表达盒)的宿主细胞在本文中将称为“转化的”、“转化体”或“重组体”。因此,术语“转化的”和“转化体”在本文中可互换使用。转化的宿主将具有至少一个拷贝的表达构建体,而且可以具有两个或更多个拷贝,这取决于该表达盒是整合进基因组内还是存在于具有多拷贝数的染色体外元件上。
转化的宿主细胞可以通过多种选择技术来鉴定,如美国专利7,238,482、美国专利7,259,255和PCT公开WO 2006/052870中所述。
转化后,适用于本发明的Δ9延伸酶(以及任选在宿主细胞中共表达的其他PUFA酶)的底物可以由宿主自然产生或通过转基因产生,或者它们可以由外部来源提供。
用于重组表达的优选的微生物宿主
用于表达本发明基因和核酸片段的微生物宿主细胞可以包括在多种原料(包括简单或复杂的碳水化合物、脂肪酸、有机酸、油、甘油和醇,和/或碳氢化合物)上于宽的温度和pH值范围内生长的宿主。基于申请人的受让人的需要,本发明描述的基因已经在含油酵母(并且特别是解脂耶氏酵母)中表达;然而预期的是,由于转录、翻译和蛋白质生物合成结构是高度保守的,因此任何细菌、酵母、藻类、类眼虫、原生藻菌和/或真菌均将是用于表达本发明的核酸片段的合适微生物宿主。
然而,优选的微生物宿主是含油生物,例如含油酵母。这些生物天然能够合成并积聚油,其中油可构成超过约25%的细胞干重,更优选超过约30%的细胞干重,而最优选超过约40%的细胞干重。通常鉴定为含油酵母的属包括但不限于:耶氏酵母属、假丝酵母属、红酵母属、红冬孢酵母属、隐球酵母属、丝孢酵母属和油脂酵母属。更具体地讲,示例性的油合成酵母包括:圆红冬孢酵母、斯达氏油脂酵母、产油油脂酵母、拉可夫氏假丝酵母、铁红假丝酵母、热带假丝酵母、产朊假丝酵母、茁芽丝孢酵母、皮状丝孢酵母、胶粘红酵母、牧草红酵母和解脂耶氏酵母(以前归类为解脂假丝酵母(Candida lipolytica))。在备选的实施方案中,可以通过基因工程进行油的生物合成,使得微生物宿主细胞(如酵母)产生多于25%细胞干重的油,从而被认为是含油的。
最优选的是含油酵母解脂耶氏酵母;并且,在又一个实施方案中,最优选的是命名为ATCC #20362、ATCC #8862、ATCC #18944、ATCC#76982和/或LGAM S(7)1的解脂耶氏酵母菌株(Papanikolaou S.和Aggelis G.,Bioresour.Technol.,82(1):43-9(2002))。
历史上,已经使用多种解脂耶氏酵母菌株用于加工和生产:异柠檬酸裂解酶;脂肪酶;聚羟基链烷酸酯;柠檬酸;赤藓醇;2-酮戊二酸;γ-癸内酯;γ-十二内酯;以及丙酮酸。可用于转化含油酵母(即解脂耶氏酵母)的具体教导内容包括美国专利4,880,741和美国专利5,071,764,以及Chen,D.C.等人(Appl.Microbiol.Biotechnol.,48(2):232-235(1997))。可用于在解脂耶氏酵母中工程化生产ARA、EPA和DHA的具体教导内容分别在美国专利申请11/264784、美国专利申请11/265761和美国专利申请11/264737中提供。在这种酵母中表达基因的优选方法是将线性DNA整合到宿主的基因组中;而且,当期望基因高水平表达时,则整合到基因组中的多个位置是尤其有用的[如在Ura3基因座(基因库编号AJ306421)、Leu2基因座(基因库编号AF260230)、Lys5基因座(基因库编号M34929)、Aco2基因座(基因库编号AJ001300)、Pox3基因座(Pox3:基因库编号XP_503244;或Aco3:基因库编号AJ001301)、Δ12去饱和酶基因座(美国专利7,214,491)、Lip1基因座(基因库编号Z50020)、Lip2基因座(基因库编号AJ012632)、SCP2基因座(基因库编号AJ431362)和/或Pex10基因座(基因库编号CAG81606)]。
用于解脂耶氏酵母的优选选择方法是对卡那霉素、潮霉素和氨基糖苷G418抗性以及在缺乏尿嘧啶、亮氨酸、赖氨酸、色氨酸或组氨酸的培养基上生长的能力。在备选的实施方案中,5-氟乳清酸(5-氟尿嘧啶-6-羧酸一水合物;“5-FOA”)可用于选择酵母Ura-突变体。该化合物对具有编码乳清苷5′-单磷酸脱羧酶(OMP脱羧酶)的功能性URA3基因的酵母细胞有毒性;因此,基于这种毒性,5-FOA特别可用于选择和鉴定Ura-突变型酵母菌株(Bartel,P.L.和Fields,S.,Yeast 2-Hybrid System,Oxford University:New York,v.7,第109-147页,1997;对于5-FOA在耶氏酵母中的使用,还可参见PCT公开WO 2006/052870)。
用于耶氏酵母的备选的优选选择方法依赖于用于解脂耶氏酵母的基于磺酰脲(氯嘧磺隆;E.I.duPont de Nemours & Co.,Inc.,Wilmington,DE)抗性的显性非抗生素标记。更具体地讲,该标记基因是具有单个氨基酸改变(W497L)的天然乙酰羟酸合酶(AHAS或乙酰乳酸合酶;E.C.4.1.3.18),从而赋予了磺酰脲除草剂抗性(PCT公布WO 2006/052870)。AHAS是用于生物合成支链氨基酸(即缬氨酸、亮氨酸、异亮氨酸)的途径中的第一常用酶,并且它是磺酰脲和咪唑啉酮除草剂的靶标。
其他优选的微生物宿主包括含油的细菌、藻类、类眼虫、原生藻菌和其他真菌;并且,在这一广泛的微生物宿主群组中,特别关注的是合成ω-3/ω-6脂肪酸的微生物(或可以为该目的进行基因工程改造的那些微生物[例如,诸如啤酒糖酵母(Saccharomyces cerevisiae)之类的其他酵母])。因此,例如,用处于诱导型或调节型启动子控制下的任何本发明的Δ9延伸酶基因转化高山被孢霉(Mortierella alpina)(其在商业上用于生产ARA)可以产生能够合成增加量的EDA的转化生物;EDA可以转化成增加量的DGLA,如果Δ8去饱和酶基因被共表达的话。Mackenzie等人(Appl.Environ.Microbiol.,66:4655(2000))描述了转化高山被孢霉的方法。类似地,用于转化破囊壶菌目(Thraustochytriales)微生物(例如破囊壶菌(Thraustochytrium)、裂殖壶菌(Schizochytrium))的方法在U.S.7,001,772中公开。
不论选择哪种宿主用于表达本文描述的Δ9延伸酶,均需要筛选多个转化体以获得显示期望表达水平和模式的菌株。这种筛选可以通过DNA印迹的Southern分析(Southern,J.Mol.Biol.,98:503(1975))、mRNA表达的Northern分析(Kroczek,J.Chromatogr.Biomed.Appl.,618(1-2):133-145(1993))、蛋白质表达的Western和/或Elisa分析、PUFA产物的表型分析或GC分析来完成。
基于上述教导内容,在一个实施方案中,本发明描写了分别产生EDA或ETrA的方法,该方法包括:
(a)提供含油酵母(例如解脂耶氏酵母),其包含:
(i)编码Δ9延伸酶多肽的第一重组核苷酸分子,该核苷酸分子可操作地连接至至少一个调控序列;和
(ii)分别由LA和/或ALA组成的延伸酶底物源;和
(b)在存在合适的可发酵碳源的情况下使步骤(a)的酵母生长,其中编码Δ9延伸酶多肽的基因得以表达而且分别将LA转化成EDA和/或将ALA转化成ETrA;以及,
(c)任选地分别回收步骤(b)中的EDA和/或ETrA。可能需要供给底物。
编码Δ9延伸酶的基因的核苷酸序列可以选自SEQ ID NO:11和SEQ ID NO:12。在备选的实施方案中,编码Δ9延伸酶多肽的基因的核苷酸序列在SEQ ID NO:26中示出(其中相对于SEQ ID NO:11,至少98个密码子已经被最优化以便在耶氏酵母属中表达)。
由于含油酵母中天然产生的PUFA仅限于18:2脂肪酸(即LA)和通常较少的18:3脂肪酸(即ALA),因此除了本文所述的Δ9延伸酶之外,还将对含油酵母进行基因工程改造以表达多种对长链PUFA生物合成所必需的酶(由此使得能产生例如ARA、EPA、DPA和DHA)。
具体地讲,在本发明的一个实施方案中涉及的含油酵母包含:
(a)包含分离的多核苷酸的第一重组DNA构建体,该多核苷酸编码Δ9延伸酶多肽,并被可操作地连接至至少一个调控序列;和
(b)至少一个另外的重组DNA构建体,该构建体包含可操作地连接至至少一个调控序列的分离的多核苷酸,其编码的多肽选自如下酶:Δ4去饱和酶、Δ5去饱和酶、Δ6去饱和酶、Δ9去饱和酶、Δ12去饱和酶、Δ15去饱和酶、Δ17去饱和酶、Δ8去饱和酶、C14/16延伸酶、C16/18延伸酶、C18/20延伸酶和C20/22延伸酶。
在特别优选的实施方案中,至少一个另外的重组DNA构建体编码具有Δ8去饱和酶活性的多肽。
微生物中的ω-3和/或ω-6脂肪酸生物合成的代谢工程
有关本发明的Δ9延伸酶序列的知识将可用于操纵多种宿主细胞中的ω-3和/或ω-6脂肪酸的生物合成。操纵生化途径的方法是本领域的技术人员所熟知的;而且,预计很多操纵方法将可能使含油酵母并且尤其是解脂耶氏酵母中的ω-3和/或ω-6脂肪酸的生物合成达到最大程度。这种操纵可能需要直接在PUFA生物合成途径中进行代谢工程改造,或者需要另外对为PUFA生物合成途径提供碳的途径进行操纵。可用于上调期望的生化途径和下调不期望的生化途径的方法是本领域技术人员熟知的。
例如,与ω-3和/或ω-6脂肪酸生物合成途径竞争能量或碳的生化途径或干扰特定PUFA终产物产生的天然PUFA生物合成途径中的酶可以通过基因破坏来去除或通过其他手段(如反义mRNA)来下调。
在PUFA生物合成途径中作为增加ARA、EPA或DHA的手段的操纵(及其相关技术)的详细讨论分别在美国专利公开2006-0094092-A1、美国专利公开2006-0115881-A1和美国专利公开2006-0110806-A1中给出,在TAG生物合成途径和TAG降解途径中的理想的操纵(及其相关技术)也在其中给出。
在本发明的上下文中,通过上述策略中的任意一种来调节脂肪酸生物合成途径的表达均可能是有用的。例如,本发明提供了方法,通过该方法,将编码Δ9延伸酶/Δ8去饱和酶生物合成途径中的关键酶的基因引入含油酵母中用以产生ω-3和/或ω-6脂肪酸。利用对宿主生物进行代谢工程改造的多种手段,使本发明的Δ9延伸酶基因在天然条件下不具有ω-3和/或ω-6脂肪酸生物合成途径的含油酵母中表达并协调这些基因的表达,以最大程度地产生优选的PUFA产物将是特别有用的。
用于PUFA生产的微生物发酵过程
使转化的微生物宿主细胞在使嵌合的去饱和酶和延伸酶基因的表达最优化而且产生的所需PUFA的产率最大且最经济的条件下生长。通常,可以被优化的培养基条件包括碳源的类型和量、氮源的类型和量、碳氮比、不同矿物离子的量、氧水平、生长温度、pH、生物量生产期的时长、油积聚期的时长以及细胞收获的时间和方法。使所关注的微生物(例如含油酵母,如解脂耶氏酵母)通常在复合培养基(例如酵母提取物-蛋白胨-葡萄糖肉汤培养基(YPD))或缺乏生长所必需的成分并由此强迫选择所需表达盒的确定成分的极限培养基(如Yeast NitrogenBase(DIFCO Laboratories,Detroit,MI))中生长。
本发明的发酵培养基必须含有合适的碳源。美国专利7,238,482中教导了合适的碳源。尽管预期本发明中利用的碳源可以涵盖许多种含碳源,但优选的碳源是糖类(如葡萄糖)、甘油和/或脂肪酸。
氮可以由无机源(如(NH4)2SO4)或有机源(如尿素或谷氨酸)提供。除了合适的碳源和氮源之外,发酵培养基还必须含有合适的矿物质、盐、辅因子、缓冲液、维生素和本领域技术人员已知的适合含油宿主生长并促进PUFA产生所必需的酶促途径的其他组分。要特别注意促进脂质和PUFA合成的几种金属离子(如Fe+2、Cu+2、Mn+2、Co+2、Zn+2、Mg+2)(Nakahara,T.等人,Ind.Appl.Single Cell Oils,D.J.Kyle和R.Colin(编辑).第61-97页(1992))。
本发明中优选的生长培养基是普通的商业制备的培养基,例如Yeast Nitrogen Base(DIFCO Laboratories,Detroit,MI)。也可以使用其他确定成分的生长培养基或合成的生长培养基,适于转化宿主细胞生长的培养基对微生物学或发酵科学领域的技术人员来说将是已知的。适于发酵的pH范围通常介于约pH4.0至pH8.0之间,其中优选将pH5.5至pH7.5作为初始生长条件的范围。发酵可以在有氧或厌氧条件下进行,其中优选为微好氧条件。
通常,在含油酵母细胞中积聚高水平的PUFA需要一个包括两个阶段的过程,因为代谢状态必须在生长和脂肪的合成/贮存之间达到“平衡”。因此,最优选的是,包括两个阶段的发酵过程是在含油酵母(如解脂耶氏酵母)中产生PUFA所必需的。这种方法在美国专利7,238,482中有所描述,其也描述了多种合适的发酵工艺设计(即分批式、补料分批式和连续式)和生长过程中的注意事项。
PUFA油的纯化和处理
PUFA可以游离脂肪酸或以酯化的形式(例如酰基甘油、磷脂、硫脂或糖脂)存在于宿主微生物中,并且可以通过本领域熟知的多种手段从宿主细胞提取。关于酵母脂质的提取技术、质量分析和可接受标准的一篇综述是Z.Jacobs(Critical Reviews in Biotechnology,12(5/6):463-491(1992))的综述。有关下游加工的简述也可由A.Singh和O.Ward(Adv.Appl.Microbiol.,45:271-312(1997))提供。
通常,用于纯化PUFA的手段可包括用有机溶剂萃取(例如,美国专利6,797,303和美国专利5,648,564)、超声处理、超临界流体萃取(如使用二氧化碳)、皂化和物理手段(例如挤压),或它们的组合。另外的详细信息可参考美国专利7,238,482的教导内容。
含PUFA的油在食品、保健食品、药物和动物饲料中的用途
市场目前支持各种掺入了ω-3和/或ω-6脂肪酸(尤其是例如ALA、GLA、ARA、EPA、DPA和DHA)的食物和饲料产品。预期包含长链PUFA的微生物量、部分纯化的包含PUFA的微生物量、纯化的包含PUFA的微生物油和/或纯化的PUFA将在食物和饲料产品中起作用以赋予该制剂的健康益处。更具体地讲,本发明的含有ω-3和/或ω-6脂肪酸的油将适用于多种食物和饲料产品,包括但不限于:食物模拟物、肉产品、谷类产品、烘焙食物、小吃和乳制品(关于详细内容请参见专利公开US-2006-0094092)。
此外,本发明的组合物可用于制剂中以在医疗食物(包括医疗营养品、膳食补充剂、婴儿代乳品以及药物产品)中赋予健康益处。食物加工和食物配制领域的技术人员将了解所述各种油的量和组成如何加入食物或饲料产品中。该量在本文中将称为“有效”量并将取决于食物或饲料产品、期望补充该产品的膳食或医疗食物或医疗营养品旨在纠正或治疗的医学状况。
实施例
本发明将在下面的实施例中得以进一步说明,其中份数和百分比是以重量计并且度数是摄氏度,除非另外说明。应当理解,尽管这些实施例说明了本发明的优选实施方案,但仅是以例证的方式给出的。根据上面的论述和这些实施例,本领域的技术人员可确定本发明的基本特征,并在不脱离本发明的精神和范围的情况下,可对本发明做出多种改变和修饰,以使其适用于多种用途和条件。因此,除了本文所示和描述的那些之外,根据前文所述,本发明的各种修改形式对本领域的技术人员来说将是显而易见的。这些修改形式也旨在涵盖于所附权利要求书的范围内。
一般方法
实施例中使用的标准重组DNA技术和分子克隆技术是本领域所熟知的并且在如下文献中有所描述:1.)Sambrook,J.,Fritsch,E.F.和Maniatis,T.Molecular Cloning:A Laboratory Manual;Cold Spring HarborLaboratory:Cold Spring Harbor,NY(1989)(Maniatis);2.)T.J.Silhavy,M.L.Bennan和L.W.Enquist,Experiments with Gene Fusions;Cold SpringHarbor Laboratory:Cold Spring Harbor,NY(1984);以及3.)Ausubel,F.M.等人,Current Protocols in Molecular Biology,由Greene Publishing Assoc.and Wiley-Interscience出版(1987)。
适用于微生物培养物的维持和生长的材料和方法是本领域熟知的。适用于下面实施例的技术可在Manual of Methods for GeneralBacteriology(Phillipp Gerhardt,R.G.E.Murray,Ralph N.Costilow,Eugene W.Nester,Willis A.Wood,Noel R.Krieg和G.Briggs Phillips编辑),American Society for Microbiology:Washington,D.C.(1994));或Thomas D.Brock in Biotechnology:A Textbook of IndustrialMicrobiology,第2版,Sinauer Associates:Sunderland,MA(1989)的描述中找到。用于微生物细胞的生长和维持的所有试剂、限制性内切酶和材料均获自Aldrich Chemicals(Milwaukee,WI)、DIFCO Laboratories(Detroit,MI)、GIBCO/BRL(Gaithersburg,MD)或Sigma ChemicalCompany(St.Louis,MO),除非另外说明。通常于37℃下在Luria Bertani(LB)平板上培养大肠杆菌(E.coli)菌株。
一般的分子克隆根据标准方法(Sambrook等人,同上)来完成。DNA序列是在ABI自动测序仪上采用染料终止剂技术(美国专利5,366,860;EP272,007)使用载体和插入片段特异性引物的组合来产生的。序列编辑是在Sequencher(Gene Codes Corporation,Ann Arbor,MI)中进行的。所有序列在两个方向上覆盖至少两次。基因序列的比较是使用DNASTAR软件(DNAStar Inc.,Madison,WI)来完成。
缩写的含义如下:“sec”表示秒,“min”表示分钟,“h”或“hr”表示小时,“d”表示天,“μL”表示微升,“mL”表示毫升,“L”表示升,“μM”表示微摩尔,“mM”表示毫摩尔,“M”表示摩尔,“mmol”表示毫摩尔,“μmole”表示微摩尔,“g”表示克,“μg”表示微克,“ng”表示纳克,“U”表示单位,“bp”表示碱基对并且“kB”表示千碱基。
表达盒的命名
表达盒的结构将通过简单的记号系统“X::Y::Z”表示,其中X描述启动子片段,Y描述基因片段而Z描述终止子片段,它们均彼此可操作地连接。
解脂耶氏酵母的转化和培养
ATCC登录号为#20362、#76982和#90812的解脂耶氏酵母菌株可购自美国典型培养物保藏中心(Rockville,MD)。解脂耶氏酵母菌株通常是在根据下面所示的配方的数种培养基中于28-30℃下培育。根据标准方法,按需要通过将20g/L琼脂添加到每种液体培养基中来制备琼脂平板。
YPD琼脂培养基(每升):10g酵母提取物[Difco],20g细菌用蛋白胨[Difco];以及20g葡萄糖。
极限培养基(MM)(每升):20g/L葡萄糖;1.7g无氨基酸的酵母氮源基础;无氨基酸的基础培养基;1.0g脯氨酸;并且pH为6.1(未调节)。
极限培养基+5-氟乳清酸(MM+5-FOA)(每升):20g葡萄糖、6.7g酵母氮源基础、75mg尿嘧啶、75mg尿苷,并且基于对一系列从100mg/L至1000mg/L的浓度的FOA活性试验(因为供应商提供的每批料中会发生改变),选用适量的FOA(Zymo Research Corp.,Orange,CA)。
解脂耶氏酵母的转化是根据Chen,D.C.等人(Appl.Microbiol.Biotechnol.,48(2):232-235(1997))的方法实施,除非另外指明。简而言之,将耶氏酵母划线接种到YPD平板上,并在30℃下培育大约18小时。从平板上刮掉数个大环量的细胞并将其重悬浮于1mL含有如下成分的转化缓冲液中:2.25mL 50%的PEG,平均分子量为3350;0.125mL 2M的醋酸锂,pH 6.0;0.125mL 2M的DTT;以及(可任选)50μg已剪切的鲑精DNA。然后,将大约500ng线性化的DNA(优选包含至少一种嵌合基因)(或100ng环状质粒)在100μL重悬浮的细胞中孵育,并将其在39℃下保持1小时,每间隔15分钟进行涡旋混合。将细胞铺在选择培养基平板上并在30℃下保持2至3天。
解脂耶氏酵母的脂肪酸分析
对于脂肪酸分析,将细胞通过离心收集并如Bligh,E.G.&Dyer,W.J.(Can.J.Biochem.Physiol.,37:911-9171959))中所述提取脂质。通过将脂质提取物与甲醇钠进行酯交换反应而制备脂肪酸甲酯(Roughan,G.和Nishida I.,Arch Biochem Biophys.,276(1):38-46(1990))并随后将其用配有30mx0.25mm(内径)HP-INNOWAX(Hewlett-Packard)柱的Hewlett-Packard 6890气相色谱仪(GC)进行分析。烘箱温度以3.5℃/分钟从170℃(保持25分钟)升到185℃。
为了进行直接的碱催化酯交换反应,收获耶氏酵母培养物(3mL),在蒸馏水中洗涤一次,并在Speed-Vac中在真空下干燥5-10分钟。将甲醇钠(100μl,1%)加入样品中,然后将样品涡旋振荡20分钟。在加入3滴1M氯化钠和400μl己烷后,涡旋样品并离心。移出上层并如上所述用GC进行分析。
实施例1
来自Euglena anabaena UTEX 373的cDNA文库的合成
本实施例描述了来自Euglena anabaenaUTEX 373的cDNA文库的合成。该工作包括制备RNA、合成cDNA和产生cDNA文库。
Euglena anabaena UTEX 373的培育和RNA制备
Euglena anabaena UTEX 373可获自密西根州立大学RichardTriemer博士的实验室(East Lansing,MI)。移出约2ml培养物用于液体分析,将其以1,800xg离心5分钟。用水洗涤沉淀一次并再次离心。将所得沉淀真空干燥5分钟,重悬浮于100μL三甲基氢氧化硫(TMSH)中,在室温下摇动孵育15分钟。孵育后,加入0.5mL己烷并将该小瓶在室温下另外摇动孵育15分钟。使用配有Omegawax 320熔融石英毛细柱的Hewlett-Packard 6890气相色谱(Supelco Inc.,目录号24152)对脂肪酸甲酯(从己烷层取5μL注射上样)进行分离和定量。用程序控制烘箱温度在170℃保持1.0分钟,以5℃/分钟上升到240℃,然后另外保持1.0分钟。载气通过Whatman氢发生器供应。将保留时间与那些市售的甲酯标准样品(Nu-Chek Prep,Inc.,目录号U-99-A)的保留时间进行比较,所得的色谱图在图2中示出。脂肪酸概况中存在EDA、ETrA、EPA和DHA且不存在GLA和STA表明,Euglena anabaena采用Δ9延伸酶/Δ8去饱和酶途径来用于长链(LC)PUFA的生物合成,并且将会是LC-PUFA生物合成基因(例如但不限于Δ9延伸酶)的良好来源。
将剩余的5mL活跃生长的培养物转移至125mL玻璃烧瓶中的25mLAF-6培养基(Watanabe & Hiroki,NIES-Collection List of Strains,第5版,National Institute for Environmental Studies,Tsukuba,第127页(2004))中。采用16小时光照8小时黑暗周期并进行非常轻微的搅动,使小眼虫培养物在22℃下生长2周。
2周后,将培养物(25mL)转移至500mL玻璃瓶中的100mL AF-6培养基中,如上所述使培养物生长1个月。在这之后,将两份50mL的等份试样转移进两个分开的装有250mL AF-6培养基的500mL玻璃瓶中,如上所述将培养物培育2个月(得到总共约600mL的培养物)。接下来,以1,800xg离心10分钟获得培养物的沉淀颗粒,将其用水洗涤一次并再次离心。使用RNA STAT-60TM试剂(TEL-TEST,Inc.,Friendswood,TX),按照制造商提供的规程(使用5mL试剂,将RNA溶解于0.5mL水中)从一份所得的沉淀中提取总RNA。这样,从沉淀中获得340μg的总RNA(680ug/mL)。将剩余的沉淀在液氮中冷冻并在-80℃下保存。使用mRNA纯化试剂盒(Amersham Biosciences,Piscataway,NJ)按照制造商提供的规程从340μg总RNA中来分离mRNA。这样,获得9.0μg mRNA。
Euglena anabaena cDNA的制备和cDNA文库eug1c的产生
使用CloneminerTM cDNA文库构建试剂盒(目录号18249-029,Invitrogen Corporation,Carlsbad,CA),按照制造商提供的规程(VersionB,25-0608)产生cDNA文库。使用非放射标记方法,从5.12μg mRNA(上文所述的mRNA)中用生物素-attB2-Oligo(dT)引物来合成cDNA。在合成第一链和第二链后,加入attB1衔接子进行连接,并用柱色谱对cDNA按照大小进行分级。将来自级分的DNA浓缩,重组进pDONRTM222中,并转化进大肠杆菌ElectroMAXTM DH10BTM T1噬菌体抗性细胞(Invitrogen Corporation)中。将该Euglena anabaena文库命名为eug1c。
将cDNA文库eug1c铺在LB+卡那霉素平板(约100,000个菌落)上,刮下菌落,使用QIAprepSpin Miniprep Kit(Qiagen Inc.,Valencia,CA)按照制造商提供的规程来分离DNA。这样,获得来自eug1c的质粒DNA子文库。
实施例2
从Euglena anabaena UTEX 373分离全长的Δ9延伸酶
本实施例描述了鉴定编码来自Euglena anabaena UTEX 373的Δ9延伸酶的cDNA(SEQ ID NO:1和2)。这一工作包括产生源自小眼虫Δ9延伸酶(EgD9e;SEQ ID NO:3)的探针以及让该探针与cDNA文库eug1c杂交以鉴定来自Euglena anabaena UTEX 373的Δ9延伸酶同源物。
小眼虫Δ9延伸酶(EgD9e)
将来自裸藻属cDNA文库(eeg1c)的克隆(称为eeg1c.pk001.n5f,含有小眼虫Δ9延伸酶(EgD9e;SEQ ID NO:3;其在美国申请11/601,563中有描述))用作模板,使用寡核苷酸引物oEugEL1-1(SEQ ID NO:5)和oEugEL1-2(SEQ ID NO:6),用VentR
Figure G2008800203954D00422
DNA聚合酶(目录号M0254S,New England Biolabs Inc.,Beverly,MA)按照制造商的规程扩增EgD9e。使用Zero Blunt
Figure G2008800203954D00431
PCR克隆试剂盒(Invitrogen Corporation),按照制造商的规程将所得DNA片段克隆进pCR-Blunt克隆载体中,以产生pKR906(SEQ ID NO:15)。
菌落转移
将Euglena anabaena cDNA文库eug1c的大约17,000个克隆铺在三个大的正方形(24cm×24cm)Petri平板(Corning,Corning,NY)上,每个平板装有LB+50μg/mL卡那霉素琼脂培养基。使细胞在37℃下生长过夜,然后使平板冷却至室温。
将Biodyne B 0.45μm膜(目录号60207,Pall Corporation,Pensacola,FL)修剪成大约22cm×22cm,并将该膜小心地铺放在琼脂上面以避免气泡。在室温下孵育2分钟后,将膜标记取向,用镊子将膜提起并将菌落面朝上放在用0.5M氢氧化钠和1.5M氯化钠浸湿的滤纸上。变性4分钟后,通过将膜置于用0.5M Tris-HCL(pH7.5)和1.5M氯化钠浸湿的滤纸上4分钟来中和氢氧化钠。重复该步骤,将膜在2XSSC缓冲液(20XSSC是3M的氯化钠、0.3M的柠檬酸钠;pH 7.0)中简单冲洗并在滤纸上风干。
杂交
将膜在200mL杂交溶液中于65℃下预杂交2小时。杂交溶液含有6X SSPE(20X SSPE是3M的氯化钠、0.2M的磷酸钠、20mM的EDTA;pH 7.4)、5X Denhardt试剂(100X Denhardt试剂是2%(w/v)Ficoll、2%(w/v)聚乙烯吡咯烷酮、2%(w/v)乙酰化的牛血清白蛋白)、0.5%十二烷基硫酸钠(SDS)、100μg/mL已剪切的鲑精DNA和5%硫酸葡聚糖。
用来自pKR906(SEQ ID NO:15)的经琼脂糖凝胶纯化过的NcoI/NotIDNA片段(其含有小眼虫Δ9延伸酶基因)来制备DNA探针,使用RadPrime DNA标记系统(Catalog No.18428-011,Invitrogen,Carlsbad,CA)按照制造商的说明书用P32 dCTP标记该DNA片段。使用NICK柱(目录号17-0855-02,Amersham Biosciences,Piscataway,NJ),按照制造商的说明书分离未整合的P32dCTP。将探针在100℃下变性5分钟,置于冰上3分钟,并将其一半加入到杂交溶液中。
将膜在65℃下与探针轻微摇动地杂交过夜,然后在次日用含0.5%SDS的2XSSC洗涤两次(每次5分钟),并用含0.1%SDS的0.2XSSC洗涤两次(每次15分钟)。洗涤后,将hyperfilm(目录号RPN30K,Amersham Biosciences,Piscataway,NJ)在-80℃下暴露于该膜过夜。
根据将平板与暴露的hyperfilm对齐,用巴斯德吸管的钝头将阳性菌落挑选至1mL水中并进行涡旋。制备数份稀释液,并将其铺在装有LB培养基和50μg/mL卡那霉素的小圆形培养皿(82mm)上以在单个平板上获得约100个分离得很好的菌落。如上所述进行转移,不同的是使用NytranN膜圆片(membrane circles)(目录号10416116,Schleicher&Schuell,Keene,NH)并且用剩余的经放射标记过的探针在100mL杂交溶液中杂交。以这种方式,确认了阳性克隆。
使各阳性克隆在LB+50μg/mL卡那霉素液体培养基中于37℃下生长,用QIAprep
Figure G2008800203954D00441
Spin Miniprep试剂盒(Qiagen Inc.)按照制造商的规程来纯化质粒。
使用载体引发的M13F通用引物(SEQ ID NO:7)、M13rev-28引物(SEQ ID NO:8)和聚腺苷酸尾引发的WobbleT寡核苷酸,用ABIBigDye version 3Prism测序试剂盒对384-孔平板中的DNA插入物进行末端测序。对于测序反应,使用100-200ng模板和6.4pmol引物,重复以下反应条件25次:96℃10秒,50℃5秒,60℃4分钟。在基于乙醇的纯化后,将循环测序反应的产物在Perkin-Elmer ABI 3700自动测序仪上分离并检测。WobbleT引物是21mer聚(T)A、聚(T)C和聚(T)G的克分子数相等的混合物,用于对cDNA克隆的3′末端进行测序。
使用SequencherTM(版本4.2,Gene Codes Corporation,Ann Arbor,MI)对序列进行比对和比较,这样,基于插入序列可以将克隆归类为两种不同组中的一种(称为EaD9Elo1和EaD9Elo2)。选择含有每一类序列的cDNA的代表性克隆用于进一步的研究,每种代表性质粒(即pLF121-1和pLF121-2)的序列分别在SEQ ID NO:9和SEQ ID NO:10中示出。用一串NNNN表示的序列表示未进行测序的聚腺苷酸尾区域。EaD9Elo1和EaD9Elo2的编码序列分别在SEQ ID NO:11和SEQ ID NO:12中示出。EaD9Elo1和EaD9Elo2的相应氨基酸序列分别在SEQ ID NO:13和SEQ ID NO:14中示出。
实施例3
Euglena anabaena UTEX 373的Δ9延伸酶序列(EaD9Elo1和 EaD9Elo2)的一级序列分析和与其他公开的Δ9延伸酶序列的比较
使用Clustal V方法(Higgins,D.G.和Sharp,P.M.,Comput.Appl.Biosci.,5:151-153(1989);Higgins等人,Comput.Appl.Biosci.,8:189-191(1992)),用LASERGENE生物信息学计数软件包(DNASTAR Inc.,Madison,WI)的MegAlignTM v6.1程序比较EaD9Elo1(SEQ ID NO:13)和EaD9Elo2(SEQ ID NO:14)的氨基酸序列,该程序采用用于成对比对的默认参数(KTUPLE=1,缺口罚分=3,窗口=5,DIAGONALS SAVED=5,缺口长度罚分=10)。
与EaD9Elo1(SEQ ID NO:13)相比较,EaD9Elo2(SEQ ID NO:14)具有1个氨基酸置换(即,基于EaD9Elo1的编号,254位的R被置换成Q)。EaD9Elo1(SEQ ID NO:11)和EaD9Elo2(SEQ ID NO:12)的核苷酸序列在全长774bp的长度范围内有6个碱基对不同。
通过BLASTP(基本的局部比对搜索工具(Basic Local AlignmentSearch Tool);Altschul等人,J.Mol.Biol.,215:403-410(1993))搜索与BLAST“nr”数据库(包括所有非冗余GenBank CDS翻译物、来源于3-维结构Brookhaven Protein Data Bank的序列、SWISS-PROT蛋白质序列数据库的最新的主要公开版本、EMBL和DDBJ数据库)中所包含的序列的相似性(采用默认参数并关闭过滤器)来评估EaD9Elo1(SEQ IDNO:13)和EaD9Elo2(SEQ ID NO:14)的氨基酸序列。为方便起见,由BLAST所计算的、观察到cDNA序列与所搜索数据库中包含的序列仅偶然匹配的P-值(概率)在本文中报导为“pLog”值,该值代表了所报导的P-值的负对数。因此,pLog值越大,cDNA序列和BLAST的“命中序列”代表同源蛋白的可能性就越大。
当与“nr”数据库进行比较时,相对于绿光等鞭金藻长链多不饱和脂肪酸延伸酶(IgD9e;SEQ ID NO:16)(NCBI编号(NCBI Accession No.)AAL37626(GI 17226123),基因座AAL37626,CDS AF390174;Qi等人,FEBS Lett.,510:159-165(2002)),这两种序列均产生了38.70的pLog值(P值为2e-39)。BLAST打分和概率表明,本核酸片段编码整个EuglenaanabaenaΔ9脂肪酸延伸酶。
使用BlastP、Clustal V和Jotun Hein序列比较方法,将EaD9Elo1(SEQ ID NO:13)和EaD9Elo2(SEQ ID NO:14)的氨基酸序列与IgD9e(SEQ ID NO:16)和小眼虫Δ9延伸酶氨基酸序列(EgD9e;SEQID NO:4;PCT公开WO 2007/061845)进行比较。用每种方法确定的与IgD9e和EgD9e的百分比同一性分别在表4和表5中示出。
序列百分比同一性计算是通过BlastP和Clustal V方法来完成的,如上所述。用Jotun Hein方法(Hein,J.J.,Meth.Enz.,183:626-645(1990))进行的序列百分比同一性计算是用LASERGENE生物信息学计算软件包(DNASTAR Inc.,Madison,WI)的MegAlignTM v6.1程序来完成的,该程序采用用于成对比对的默认参数(KTUPLE=2)。
表4
EaD9Elo1(SEQ ID NO:13)和
Ead9elo2(SEQ ID NO:14)与IgD9e(SEQ ID NO:16)的序列比较
去饱和酶  通过BLASTP确定的与IgD9e的同一性百分比(%)   通过Jotun Hein方法确定的与IgD9e的同一性百分比(%)  通过Clustal V方法确定的与IgD9e的同一性百分比(%)
  EaD9Elo1  37%   40.4%  32.9%
  EaD9Elo2  37%   41.2%  32.9%
表5
EaD9Elo1(SEQ ID NO:13)和
EaD9Elo2(SEQ ID NO:14)与EgD9e(SEQ ID NO:4)的序列比较
去饱和酶   通过BLASTP确定的与EgD9e的同一性百分比(%)   通过Jotun Hein方法确定的与EgD9e的同一性百分比(%)  通过Clustal V方法确定的与EgD9e的同一性百分比(%)
  EaD9Elo   77%   77.2%  77.1%
  EaD9Elo2   77%   77.2%  77.1%
实施例4
解脂耶氏酵母中Euglena anabaena UTEX 373Δ9延伸酶的功能分析
本实施例描述了EaD9Elo1(SEQ ID NO:13)和EaD9Elo2(SEQ IDNO:14)在解脂耶氏酵母中的功能分析。该工作包括如下步骤:(1)构建Gateway
Figure G2008800203954D00461
-相容的耶氏酵母表达载体pY159;(2)将EaD9Elo1和EaD9Elo2转入pY159中以产生pY173和pY174;以及(3)比较含pY173和pY174的转化生物内的脂质概况。
构建Gateway -相容的耶氏酵母表达载体pY159
质粒pY5-30(其以前在美国专利7,259,255中有描述)是既可在大肠杆菌中复制又可在解脂耶氏酵母中复制的穿梭质粒。质粒pY5-30包含如下组分:耶氏酵母自主复制序列(ARS18);ColE1质粒的复制起点;用于在大肠杆菌中选择的氨苄青霉素抗性基因(AmpR);用于在耶氏酵母中选择的耶氏酵母LEU2基因;以及TEF::GUS::XPR嵌合基因。质粒pDMW263(SEQ ID NO:17)由pY5-30产生,这通过使用本领域技术人员所熟知的技术将TEF启动子替换为解脂耶氏酵母FBAINm启动子(美国专利7,202,356)而实现。简而言之,该启动子指经修饰的启动子,其位于由fba1基因编码的果糖二磷酸醛缩酶(E.C.4.1.2.13)的‘ATG’翻译起始密码子前面的5’上游非翻译区,并且该启动子加上具有内含子的5’编码区部分是表达所必需的,其中FBAINm在ATG翻译起始密码子和FBAIN启动子的内含子之间具有52bp的缺失(从而只包含N端的22个氨基酸),并且在内含子后面具有新的翻译共有基序。表6汇总了pDMW263(SEQ ID NO:17)的组分。
表6
质粒pDMW263(SEQ ID NO:17)的组分
  SEQ ID NO:17内的RE位点和核苷酸 片段和嵌合基因组分的描述
  4992-4296   ARS18序列(基因库编号A17608)
SalI/SacII(8505-2014)   FBAINm::GUS::XPR,包含:·FBAINm:解脂耶氏酵母FBAINm启动子(美国专利7,202,356);·GUS:编码β-葡糖苷酸酶的大肠杆菌基因(Jefferson,R.A.Nature,14:342:837-838(1989));·XPR:耶氏酵母Xpr基因(基因库编号M17741)的约100bp的3’区
  6303-8505   耶氏酵母Leu2基因(基因库编号AF260230)
将来自pDMW263(SEQ ID NO:17)的NcoI/SalI DNA片段(其含有解脂耶氏酵母FBAINm启动子)克隆进pDMW237(SEQ ID NO:18)的NcoI/SalI DNA片段中以产生pY115(SEQ ID NO:19;图3A),该pDMW237此前在PCT公开WO 2006/012325中有描述(因此将该专利的内容以引用的方式并入),含有来源于绿光等鞭金藻的经密码子最优化以便在解脂耶氏酵母中表达的合成的Δ9延伸酶基因(IgD9eS)。在图3A中,经修饰的FBAINm启动子标记为FBA1+内含子,而该启动子在图3B、3C和3D中标记为YAR FBA1PRO+内含子。
使用寡核苷酸引物oYFBA1(SEQ ID NO:20)和oYFBA1-6(SEQ IDNO:21),采用PCR从质粒pY115(SEQ ID NO:19)扩增FBAINm启动子。引物oYFBA1(SEQ ID NO:20)被设计成在启动子的5’端引入BglII位点,而引物oYFBA1-6(SEQ ID NO:21)被设计成在启动子的3’端引入NotI位点,同时移除NcoI位点,并因而移除了ATG起始密码子。将所得PCR片段用BglII和NotI消化,并克隆进pY115的BglII/NotI片段(其含有载体骨架)中以形成pY158(SEQ ID NO:22)。
将质粒pY158(SEQ ID NO:22)用NotI消化,并补足所产生的DNA末端。在补足而形成平端后,将该DNA片段用牛小肠碱性磷酸酶处理并用琼脂糖凝胶电泳分离。从琼脂糖凝胶中切下6992bp的含有解脂耶氏酵母FBAINm启动子的片段并用QIAquick
Figure G2008800203954D00481
Gel Extraction试剂盒(Qiagen Inc,Valencia,CA)按照制造商的规程进行纯化。使用GatewayVector Conversion System(目录号11823-029,Invitrogen Corporation),按照制造商的规程将纯化过的6992bp片段与rfA盒连接,以形成解脂耶氏酵母Gateway
Figure G2008800203954D00482
目的载体(destination vector)pY159(SEQ ID NO:23;图3B)。
构建耶氏酵母表达载体pY173和pY174
使用GatewayLR ClonaseTMII酶混合物(目录号11791-020,InvitrogenCorporation),按照制造商的规程将来自pLF121-1(SEQ ID NO:9;实施例2)和pLF121-2(SEQ ID NO:10;实施例2)的cDNA插入物转进pY159(SEQ ID NO:23)中,以分别形成pY173(SEQ ID NO:24;图3C)和pY174(SEQ ID NO:25;图3D)。
EaD9Elo1和EaD9Elo2在解脂耶氏酵母菌株Y2224中的功能分析以如下方式分离菌株Y2224:将来自YPD琼脂平板(1%酵母提取物、2%细菌用蛋白胨、2%葡萄糖、2%琼脂)的解脂耶氏酵母ATCC#20362细胞划线接种至含250mg/L 5-FOA(Zymo Research)的MM平板(尿嘧啶和尿苷各75mg/L,6.7g/L具有硫酸铵且无氨基酸的YNB,以及20g/L葡萄糖)上。将平板在28℃下孵育并将四个得到的菌落分别贴在含有200mg/mL 5-FOA的MM平板上和无尿嘧啶和尿苷的MM平板上以确定尿嘧啶Ura3营养缺陷型。
如在“一般方法”中所述,将菌株Y2224用pY173(SEQ ID NO:24;图3C)和pY174(SEQ ID NO:25;图3D)转化。
使含有pY173和pY174的解脂耶氏酵母转化株的单菌落在不含尿嘧啶的3mL极限培养基中于30℃生长16h,之后,将细胞以250rpm离心以形成沉淀。将细胞用水洗涤一次,通过离心沉淀并风干。在50℃下用500μL 1%的甲醇钠对该沉淀进行酯交换反应(Roughan,G.和Nishida,I.,Arch.Biochem.Biophys.,276(1):38-46(1990))30分钟,之后加入500μL 1M的氯化钠和100μL庚烷。在彻底混合并离心后,通过GC来分析脂肪酸甲酯(FAME)。使用配有Omegawax 320熔融石英毛细柱的Hewlett-Packard 6890气相色谱(目录号24152,Supelco Inc.)对FAME(从己烷层取5μL注射上样)进行分离和定量。用程序控制烘箱温度在220℃保持2.6分钟,以20℃/分钟升温至240℃,然后另外保持2.4分钟。载气通过Whatman氢发生器供应。将保留时间与那些市售的甲酯标准样品(Nu-Chek Prep,Inc)的保留时间进行比较。
表达pY173和pY174的解脂耶氏酵母的脂肪酸概况在表7中示出。脂肪酸确定为16:0、16:1、18:0、18:1(油酸)、LA、20:0、20:1(11)、EDA、22:0、24:0和24:1。通过如下方式计算Δ9延长百分比(Δ9%Elong):将EDA的重量百分比除以EDA和LA的总重量百分比再乘以100以表示为百分比形式。Ave表示平均值。
表7
表达pY173(EaD9Elo1)和pY174(EaD9Elo2)的解脂耶氏酵母的脂肪 酸组分(重量%)
Figure G2008800203954D00501
实施例5
用于解脂耶氏酵母的经密码子最优化的Δ9延伸酶基因(EaD9ES)的 合成
以与PCT公开WO 2004/101753和美国专利7,125,672中所描述的类似方式,将Euglena anabaena的Δ9延伸酶基因(EaD9Elo1)的密码子使用最优化以便在解脂耶氏酵母中表达。具体地讲,基于EaD9Elo1(SEQID NO:11)的编码序列,根据耶氏酵母密码子使用模式(PCT公开WO 2004/101753)、‘ATG’翻译起始密码子周围的共有序列以及RNA稳定性的一般规则(Guhaniyogi,G.和J.Brewer,Gene,265(1-2):11-23(2001)),设计经密码子最优化的Δ9延伸酶基因(称为“EaD9ES”,SEQ ID NO:26)。除了修饰翻译起始位点之外,还对774bp编码区中的106bp进行了修饰(13.7%)并最优化了98个密码子(38.0%)。野生型基因(即EaD9Elo1)和合成基因(即EaD9ES)的GC含量(52.1%)几乎相同。分别将NcoI位点和NotI位点整合到EaD9ES(SEQ ID NO:26)的翻译起始密码子的周围和终止密码子之后。图4A和4B示出了EaD9Elo1(SEQ ID NO:11)和EaD9ES(SEQ ID NO:26)的核苷酸序列的比较。由经密码子最优化的基因编码的蛋白质序列(即SEQ ID NO:27)与野生型蛋白质序列(即SEQ ID NO:13)相同。设计的EaD9ES基因由GenScript Corporation(Piscataway,NJ)合成并将其克隆到pUC57(基因库编号Y14837)中,以产生pEaD9ES(SEQ ID NO:28;图5A)。
实施例6
包含经密码子最优化以在解脂耶氏酵母中表达的合成的Δ9延伸酶 基因(来源于Euglena anabaena)(EaD9ES)的解脂耶氏酵母表达载体 pZUFmEaD9ES的构建和功能分析
本实施例描述了包含FBAINm::EaD9ES::Pex20嵌合基因的解脂耶氏酵母载体pZUFmEaD9ES的功能性表达,其中EaD9ES是来源于Euglena anabaena的经密码子最优化以便在耶氏酵母属中表达的合成的Δ9延伸酶。质粒pZUFmEaD9ES(图5B)含有如下组分:
表8
质粒pZUFmEaD9ES(SEQ ID NO:29)的组分
 SEQ ID NO:29内的RE位点和核苷酸   片段和嵌合基因组分的描述
 Swa I/BsiW I(6067-318)   FBAINm::EaD9ES::Pex20,包含·FBAINm:解脂耶氏酵母FBAIN启动子(美国专利7,202,356)·EaD9ES:来源于Euglena anabaena的经密码子最优化的Δ9延伸酶(SEQ ID NO:26)·Pex20:耶氏酵母Pex20基因(基因库编号AF054613)的Pex20终止子序列
 1354-474   ColE1质粒复制起点
 2284-1424   用于在大肠杆菌中选择的氨苄青霉素抗性基因(AmpR)
 3183-4487   耶氏酵母自主复制序列(ARS18;基因库编号A17608)
 6031-4530   耶氏酵母Ura 3基因(基因库编号AJ306421)
包含pZUFmEaD9ES的解脂耶氏酵母转化株的功能分析
如“一般方法”中所述,将质粒pZUFmEaD9ES转化进菌株Y2224(由野生型耶氏酵母菌株ATCC#20362的Ura3基因自发突变而产生的FOA抗性突变体)中。在MM平板上选择转化株。在30℃下培育2天后,挑取转化株并将其再次划线至新鲜的MM平板上。生长之后,将这些菌株单个地接种在30℃下的3mL液体MM中,以250rpm/min摇动2天。离心收集细胞,提取脂质,通过酯交换反应来制备脂肪酸甲酯,并随后用Hewlett-Packard 6890GC进行分析。
GC分析显示,在所有5个转化株中产生了占总脂质约2.2%的C20:2(EDA)和15.3%的C18:2(LA),其中测得这5个菌株中C18:2转化成C20:2的转化效率为约13%。因此,该实验数据表明,经密码子最优化以便在解脂耶氏酵母中表达的合成的Euglena anabaenaΔ9延伸酶(即EaD9ES,在SEQ ID NO:26和27中示出)有效地将LA延长成了EDA。
序列表
<110>E.I.duPont de Nemours and Company,Inc.
 
<120>Δ9延伸酶及其在制备多不饱和脂肪酸中的用途
 
<130>CL3923
 
<150>US 60/911,925
<151>2007-04-16
 
<160>29
 
<170>PatentIn版本3.4
 
<210>1
<211>1129
<212>DNA
<213>Euglenaanabaena
 
<400>1
tttttttcgg tctaaaatgg aagcagccaa agaattggtt tccatcgtcc aagaggagct    60
ccccaaggtg gactatgccc agctttggca ggatgccagc agctgtgagg tcctttacct    120
ctcggtggca ttcgtggcga tcaagttcat gctgcgccca ctggacctga agcgccaggc    180
caccttgaag aagctgttca cagcatacaa cttcctcatg tcgatctatt cctttggctc    240
cttcctggcc atggcctatg ccctatcagt aactggcatc ctctccggcg actgtgagac    300
ggcgttcaac aacgatgtgt tcaggatcac aactcagctg ttctacctca gcaagttcgt    360
agagtacatc gactccttct accttcccct tatggacaag ccactgtcgt tccttcagtt    420
cttccatcat ttgggggccc ccattgacat gtggctattc tacaaatacc gcaacgaagg    480
agtctggatc tttgtcctgt tgaatgggtt cattcactgg atcatgtacg gttactattg    540
gacgcggctc atcaagctga acttccccat gcccaagaac ctgatcacct ccatgcagat    600
catccagttc aatgtcgggt tctacatcgt ctggaagtac cgcaatgtgc catgctaccg    660
ccaggatggg atgcgcatgt ttgcctggat cttcaactac tggtatgtcg ggacggtctt    720
gctgctgttc ctcaactttt acgtgcagac gtacatccgg aagccgagga agaaccgagg    780
gaagaaggag taggccacat ggcgcctgcg ctggaggaaa cggtacgctc ggatggtgca    840
ctgcacttgc actccgccgt ttctagcctc ccctcgctct aaccactgcg gcatgcctgc    900
ttgaggcgtg acgttgcctc gtatgataca gtttacaccc ttcccacagc ccacggagct    960
ggtgactgtt tccagcgtct gcagatcatt gatctggtgc aatgtgcaca gaccaagccc    1020
ctctaacgtc ttgcggtgta ccgctcgaca ctcactgcaa gagacagatg gctgagcatg    1080
ttatagcccc ttacattcta cccttcgtcc caacctgacc gtcacattc              1129
 
<210>2
<211>1145
<212>DNA
<213>Euglena anabaena
 
<400>2
attttttttc ggtctaaaat ggaagcagcc aaagaattgg tttccatcgt ccaagaggag  60
ctccccaagg tggactatgc ccagctttgg caggacgcca gcagctgtga ggtcctttac  120
ctctcggtgg cattcgtggc gatcaagttc atgctgcgcc cactggacct gaagcgccag  180
gccaccttga agaagctgtt cacagcatac aacttcctca tgtcgatcta ttcctttggc  240
tccttcctgg ccatggccta tgccctatca gtaactggca tcctctccgg cgactgtgag  300
acagcgttca acaacgatgt gttcaggatc acaactcagc tgttctacct cagcaagttc  360
gtagagtaca tcgactcctt ctaccttccc cttatggaca agccactgtc gttccttcag  420
ttcttccatc atttgggggc tcccattgac atgtggctat tctacaaata ccgcaacgaa  480
ggagtctgga tctttgtcct gttgaatggg ttcattcact ggatcatgta cggttactac  540
tggacgcggc tcatcaagct gaacttcccc atgcccaaga acctgatcac ctccatgcag  600
atcatccagt tcaatgtcgg gttctacatc gtctggaagt accgcaatgt gccatgctac  660
cgccaggatg ggatgcgcat gtttgcctgg atcttcaact actggtacgt cgggacggtc  720
ttgctgctgt tcctcaactt ttacgtgcag acgtacatcc ggaagccgag gaagaaccaa  780
gggaagaagg agtaggccac atggcgcctg cgctggagga aacggtacgc tcggatggtg  840
cactgcactt gcactccgcc gcttctagcc tcccctcgct ctaacctctg cgacatgcct  900
gcttgaggcg tgacgttgcc tcgtgcgata cagtttacac ccttcccatg gcccacggag  960
caggtgactg tctccagcgt ctgcaattct gatcattggt ctggtgcaat gtgcgcagac  1020
caagcccctc taacgtcttg cggtgtaccg ctcgacactc actgcacgag acagatggct  1080
gagcatgtta tagcccctga cattctaccc ttcgtcctta cctgaccgtc acattcatgc  1140
ttacc                                                              1145
 
<210>3
<211>774
<212>DNA
<213>小眼虫
 
<220>
 
<221>CDS
<222>(1)..(774)
<223>Δ9延伸酶
 
<300>
<302>Δ9延伸酶及其在制备多不饱和脂肪酸中的用途
<310>WO 2007/061742
<311>2006-11-16
<312>2007-05-31
<313>(1)..(774)
 
<300>
<302>Δ9延伸酶及其在制备多不饱和脂肪酸中的用途
<310>US 2007-0117190-A1
<311>2006-1116
<312>2007-05-24
<313>(1)..(774)
 
<400>3
atg gag gtg gtg aat gaa ata gtc tca att ggg cag gaa gtt tta ccc    48
Met Glu Val Val Asn Glu Ile Val Ser Ile Gly Gln Glu Val Leu Pro
1               5                   10                  15
aaa gtt gat tat gcc caa ctc tgg agt gat gcc agt cac tgt gag gtg    96
Lys Val Asp Tyr Ala Gln Leu Trp Ser Asp Ala Ser His Cys Glu Val
            20                  25                  30
ctt tac ttg tcc atc gca ttt gtc atc ttg aag ttc act ctt ggc ccc    144
Leu Tyr Leu Ser Ile Ala Phe Va1 Ile Leu Lys Phe Thr Leu Gly Pro
        35                  40                  45
ctt ggt cca aaa ggt cag tct cgt atg aag ttt gtt ttc acc aat tac    192
Leu Gly Pro Lys Gly Gln Ser Arg Met Lys Phe Val Phe Thr Asn Tyr
    50                  55                  60
aac ctt ctc atg tcc att tat tcg ttg gga tca ttc ctc tca atg gca    240
Asn Leu Leu Met Ser Ile Tyr Ser Leu Gly Ser Phe Leu Ser Met Ala
65                  70                  75                  80
tat gcc atg tac acc atc ggt gtt atg tct gac aac tgc gag aag gct    288
Tyr Ala Met Tyr Thr Ile Gly Val Met Ser Asp Asn Cys Glu Lys Ala
                85                  90                  95
ttt gac aac aac gtc ttc agg atc acc acg cag ttg ttc tat ttg agc    336
Phe Asp Asn Asn Val Phe Arg Ile Thr Thr Gln Leu Phe Tyr Leu Ser
            100                 105                 110
aag ttc ctg gag tat att gac tcc ttc tat ttg cca ctg atg ggc aag    384
Lys Phe Leu Glu Tyr Ile Asp Ser Phe Tyr Leu Pro Leu Met Gly Lys
        115                 120                 125
cct ctg acc tgg ttg caa ttc ttc cat cat ttg ggg gca ccg atg gat    432
Pro Leu Thr Trp Leu Gln Phe Phe His His Leu Gly Ala Pro Met Asp
    130                 135                 140
atg tgg ctg ttc tat aat tac cga aat gaa gct gtt tgg att ttt gtg    480
Met Trp Leu Phe Tyr Asn Tyr Arg Asn Glu Ala Val Trp Ile Phe Val
145                 150                 155                 160
ctg ttg aat ggt ttc atc cac tgg atc atg tac ggt tat tat tgg acc    528
Leu Leu Asn Gly Phe Ile His Trp Ile Met Tyr Gly Tyr Tyr Trp Thr
                165                 170                 175
aga ttg atc aag ctg aag ttc ccc atg cca aaa tcc ctg att aca tca    576
Arg Leu Ile Lys Leu Lys Phe Pro Met Pro Lys Ser Leu Ile Thr Ser
            180                 185                 190
atg cag atc att caa ttc aat gtt ggt ttc tac att gtc tgg aag tac    624
Met Gln Ile Ile Gln Phe Asn Val Gly Phe Tyr Ile Val Trp Lys Tyr
        195                 200                 205
agg aac att ccc tgt tat cgc caa gat ggg atg agg atg ttt ggc tgg    672
Arg Asn Ile Pro Cys Tyr Arg Gln Asp Gly Met Arg Met Phe Gly Trp
    210                 215                 220
ttc ttc aat tac ttt tat gtt ggc aca gtc ttg tgt ttg ttc ttg aat    720
Phe Phe Asn Tyr Phe Tyr Val Gly Thr Val Leu Cys Leu Phe Leu Asn
225                 230                 235                 240
ttc tat gtg caa acg tat atc gtc agg aag cac aag gga gcc aaa aag    768
Phe Tyr Val Gln Thr Tyr Ile Val Arg Lys His Lys Gly Ala Lys Lys
                245                 250                 255
att cag                                                            774
Ile Gln
 
<210>4
<211>258
<212>PRT
<213>小眼虫
 
<400>4
 
Met Glu Val Val Asn Glu Ile Val Ser Ile Gly Gln Glu Val Leu Pro
1               5                   10                  15
Lys Val Asp Tyr Ala Gln Leu Trp Ser Asp Ala Ser His Cys Glu Val
            20                  25                  30
Leu Tyr Leu Ser Ile Ala Phe Val Ile Leu Lys Phe Thr Leu Gly Pro
        35                  40                  45
Leu Gly Pro Lys Gly Gln Ser Arg Met Lys Phe Val Phe Thr Asn Tyr
    50                  55                  60
Asn Leu Leu Met Ser Ile Tyr Ser Leu Gly Ser Phe Leu Ser Met Ala
65                  70                  75                  80
Tyr Ala Met Tyr Thr Ile Gly Val Met Ser Asp Asn Cys Glu Lys Ala
                85                  90                  95
Phe Asp Asn Asn Val Phe Arg Ile Thr Thr Gln Leu Phe Tyr Leu Ser
            100                 105                 110
Lys Phe Leu Glu Tyr Ile Asp Ser Phe Tyr Leu Pro Leu Met Gly Lys
        115                 120                 125
Pro Leu Thr Trp Leu Gln Phe Phe His His Leu Gly Ala Pro Met Asp
    130                 135                 140
Met Trp Leu Phe Tyr Asn Tyr Arg Asn Glu Ala Val Trp Ile Phe Val
145                 150                 155                 160
Leu Leu Asn Gly Phe Ile His Trp Ile Met Tyr Gly Tyr Tyr Trp Thr
                165                 170                 175
Arg Leu Ile Lys Leu Lys Phe Pro Met Pro Lys Ser Leu Ile Thr Ser
            180                 185                 190
Met Gln Ile Ile Gln Phe Asn Val Gly Phe Tyr Ile Val Trp Lys Tyr
        195                 200                 205
Arg Asn Ile Pro Cys Tyr Arg Gln Asp Gly Met Arg Met Phe Gly Trp
    210                 215                 220
Phe Phe Asn Tyr Phe Tyr Val Gly Thr Val Leu Cys Leu Phe Leu Asn
225                 230                 235                 240
Phe Tyr Val Gln Thr Tyr Ile Val Arg Lys His Lys Gly Ala Lys Lys
                245                 250                 255
Ile Gln
 
<210>5
<211>30
<212>DNA
<213>人工序列
 
<220>
<223>有义寡核苷酸oEugEL1-1
 
<400>5
agcggccgca ccatggaggt ggtgaatgaa                        30
<210>6
<211>30
<212>DNA
<213>人工序列
 
<220>
<223>有义寡核苷酸oEugEL1-2
 
<400>6
tgcggccgct cactgaatct ttttggctcc      30
 
<210>7
<211>18
<212>DNA
<213>人工序列
 
<220>
<223>M13F通用引物
 
<400>7
tgtaaaacga cggccagt                   18
 
<210>8
<211>22
<212>DNA
<213>人工序列
 
<220>
<223>引物M1328Rev
 
<400>8
gtaatacgac tcactatagg gc               22
 
<210>9
<211>3668
<212>DNA
<213>人工序列
 
<220>
<223>质粒pLF121-1
 
<220>
<221>misc_feature
<222>(3616)..(3655)
<223>n为a,c,g,或t
 
<400>9
gtacaaagtt ggcattataa gaaagcattg cttatcaatt tgttgcaacg aacaggtcac    60
tatcagtcaa aataaaatca ttatttgcca tccagctgat atcccctata gtgagtcgta    120
ttacatggtc atagctgttt cctggcagct ctggcccgtg tctcaaaatc tctgatgtta    180
cattgcacaa gataaaaata tatcatcatg ttagaaaaac tcatcgagca tcaaatgaaa    240
ctgcaattta ttcatatcag gattatcaat accatatttt tgaaaaagcc gtttctgtaa    300
tgaaggagaa aactcaccga ggcagttcca taggatggca agatcctggt atcggtctgc    360
gattccgact cgtccaacat caatacaacc tattaatttc ccctcgtcaa aaataaggtt    420
atcaagtgag aaatcaccat gagtgacgac tgaatccggt gagaatggca aaagcttatg    480
catttctttc cagacttgtt caacaggcca gccattacgc tcgtcatcaa aatcactcgc    540
atcaaccaaa ccgttattca ttcgtgattg cgcctgagcg agacgaaata cgcgatcgct    600
gttaaaagga caattacaaa caggaatcga atgcaaccgg cgcaggaaca ctgccagcgc    660
atcaacaata ttttcacctg aatcaggata ttcttctaat acctggaatg ctgttttccc    720
ggggatcgca gtggtgagta accatgcatc atcaggagta cggataaaat gcttgatggt    780
cggaagaggc ataaattccg tcagccagtt tagtctgacc atctcatctg taacatcatt    840
ggcaacgcta cctttgccat gtttcagaaa caactctggc gcatcgggct tcccatacaa    900
tcgatagatt gtcgcacctg attgcccgac attatcgcga gcccatttat acccatataa    960
atcagcatcc atgttggaat ttaatcgcgg cctcgagcaa gacgtttccc gttgaatatg    1020
gctcatagat cttttctcca tcactgatag ggagtggtaa aataactcca tcaatgatag    1080
agtgtcaaca acatgaccaa aatcccttaa cgtgagttac gcgtattaat tgcgttgcgc    1140
tcactgcccg ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa    1200
cgcgcgggga gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg    1260
ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg    1320
ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag    1380
gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac    1440
gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga    1500
taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt    1560
accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca atgctcacgc    1620
tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc    1680
cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta    1740
agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat    1800
gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggttacac tagaagaaca    1860
gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct    1920
tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt    1980
acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct    2040
cagggaacga cgcgtaccgc tagccaggaa gagtttgtag aaacgcaaaa aggccatccg    2100
tcaggatggc cttctgctta gtttgatgcc tggcagttta tggcgggcgt cctgcccgcc    2160
accctccggg ccgttgcttc acaacgttca aatccgctcc cggcggattt gtcctactca    2220
ggagagcgtt caccgacaaa caacagataa aacgaaaggc ccagtcttcc gactgagcct    2280
ttcgttttat ttgatgcctg gcagttccct actctcgcgt taacgctagc atggatgttt    2340
tcccagtcac gacgttgtaa aacgacggcc agtcttaagc tcgggcccca aataatgatt    2400
ttattttgac tgatagtgac ctgttcgttg caacaaattg atgagcaatg cttttttata    2460
atgccaactt tgtacaaaaa agttggtttt tttcggtcta aaatggaagc agccaaagaa    2520
ttggtttcca tcgtccaaga ggagctcccc aaggtggact atgcccagct ttggcaggat    2580
gccagcagct gtgaggtcct ttacctctcg gtggcattcg tggcgatcaa gttcatgctg    2640
cgcccactgg acctgaagcg ccaggccacc ttgaagaagc tgttcacagc atacaacttc    2700
ctcatgtcga tctattcctt tggctccttc ctggccatgg cctatgccct atcagtaact    2760
ggcatcctct ccggcgactg tgagacggcg ttcaacaacg atgtgttcag gatcacaact    2820
cagctgttct acctcagcaa gttcgtagag tacatcgact ccttctacct tccccttatg    2880
gacaagccac tgtcgttcct tcagttcttc catcatttgg gggcccccat tgacatgtgg    2940
ctattctaca aataccgcaa cgaaggagtc tggatctttg tcctgttgaa tgggttcatt    3000
cactggatca tgtacggtta ctattggacg cggctcatca agctgaactt ccccatgccc    3060
aagaacctga tcacctccat gcagatcatc cagttcaatg tcgggttcta catcgtctgg    3120
aagtaccgca atgtgccatg ctaccgccag gatgggatgc gcatgtttgc ctggatcttc    3180
aactactggt atgtcgggac ggtcttgctg ctgttcctca acttttacgt gcagacgtac    3240
atccggaagc cgaggaagaa ccgagggaag aaggagtagg ccacatggcg cctgcgctgg    3300
aggaaacggt acgctcggat ggtgcactgc acttgcactc cgccgtttct agcctcccct    3360
cgctctaacc actgcggcat gcctgcttga ggcgtgacgt tgcctcgtat gatacagttt    3420
acacccttcc cacagcccac ggagctggtg actgtttcca gcgtctgcag atcattgatc    3480
tggtgcaatg tgcacagacc aagcccctct aacgtcttgc ggtgtaccgc tcgacactca    3540
ctgcaagaga cagatggctg agcatgttat agccccttac attctaccct tcgtcccaac    3600
ctgaccgtca cattcnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnaccca    3660
actttctt                                                      3668
 
<210>10
<211>3684
<212>DNA
<213>人工序列
 
<220>
<223>质粒pLF121-2
 
<220>
<221>misc_feature
<222>(3632)..(3671)
<223>n为a,c,g,或t
 
<400>10
gtacaaagtt ggcattataa gaaagcattg cttatcaatt tgttgcaacg aacaggtcac  60
tatcagtcaa aataaaatca ttatttgcca tccagctgat atcccctata gtgagtcgta  120
ttacatggtc atagctgttt cctggcagct ctggcccgtg tctcaaaatc tctgatgtta  180
cattgcacaa gataaaaata tatcatcatg ttagaaaaac tcatcgagca tcaaatgaaa  240
ctgcaattta ttcatatcag gattatcaat accatatttt tgaaaaagcc gtttctgtaa  300
tgaaggagaa aactcaccga ggcagttcca taggatggca agatcctggt atcggtctgc  360
gattccgact cgtccaacat caatacaacc tattaatttc ccctcgtcaa aaataaggtt  420
atcaagtgag aaatcaccat gagtgacgac tgaatccggt gagaatggca aaagattatg  480
catttctttc cagacttgtt caacaggcca gccattacgc tcgtcatcaa aatcactcgc  540
atcaaccaaa ccgttattca ttcgtgattg cgcctgagcg agacgaaata cgcgatcgct  600
gttaaaagga caattacaaa caggaatcga atgcaaccgg cgcaggaaca ctgccagcgc  660
atcaacaata ttttcacctg aatcaggata ttcttctaat acctggaatg ctgttttccc  720
ggggatcgca gtggtgagta accatgcatc atcaggagta cggataaaat gcttgatggt  780
cggaagaggc ataaattccg tcagccagtt tagtctgacc atctcatctg taacatcatt  840
ggcaacgcta cctttgccat gtttcagaaa caactctggc gcatcgggct tcccatacaa  900
tcgatagatt gtcgcacctg attgcccgac attatcgcga gcccatttat acccatataa  960
atcagcatcc atgttggaat ttaatcgcgg cctcgagcaa gacgtttccc gttgaatatg  1020
gctcatagat cttttctcca tcactgatag ggagtggtaa aataactcca tcaatgatag  1080
agtgtcaaca acatgaccaa aatcccttaa cgtgagttac gcgtattaat tgcgttgcgc  1140
tcactgcccg ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa  1200
cgcgcgggga gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg    1260
ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg    1320
ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag    1380
gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac    1440
gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga    1500
taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt    1560
accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca atgctcacgc    1620
tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc    1680
cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta    1740
agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat    1800
gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggttacac tagaagaaca    1860
gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct    1920
tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt    1980
acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct    2040
cagggaacga cgcgtaccgc tagccaggaa gagtttgtag aaacgcaaaa aggccatccg    2100
tcaggatggc cttctgctta gtttgatgcc tggcagttta tggcgggcgt cctgcccgcc    2160
accctccggg ccgttgcttc acaacgttca aatccgctcc cggcggattt gtcctactca    2220
ggagagcgtt caccgacaaa caacagataa aacgaaaggc ccagtcttcc gactgagcct    2280
ttcgttttat ttgatgcctg gcagttccct actctcgcgt taacgctagc atggatgttt    2340
tcccagtcac gacgttgtaa aacgacggcc agtcttaagc tcgggcccca aataatgatt    2400
ttattttgac tgatagtgac ctgttcgttg caacaaattg atgagcaatg cttttttata    2460
atgccaactt tgtacaaaaa agttggattt tttttcggtc taaaatggaa gcagccaaag    2520
aattggtttc catcgtccaa gaggagctcc ccaaggtgga ctatgcccag ctttggcagg    2580
acgccagcag ctgtgaggtc ctttacctct cggtggcatt cgtggcgatc aagttcatgc    2640
tgcgcccact ggacctgaag cgccaggcca ccttgaagaa gctgttcaca gcatacaact    2700
tcctcatgtc gatctattcc tttggctcct tcctggccat ggcctatgcc ctatcagtaa    2760
ctggcatcct ctccggcgac tgtgagacag cgttcaacaa cgatgtgttc aggatcacaa    2820
ctcagctgtt ctacctcagc aagttcgtag agtacatcga ctccttctac cttcccctta    2880
tggacaagcc actgtcgttc cttcagttct tccatcattt gggggctccc attgacatgt    2940
ggctattcta caaataccgc aacgaaggag tctggatctt tgtcctgttg aatgggttca    3000
ttcactggat catgtacggt tactactgga cgcggctcat caagctgaac ttccccatgc    3060
ccaagaacct gatcacctcc atgcagatca tccagttcaa tgtcgggttc tacatcgtct    3120
ggaagtaccg caatgtgcca tgctaccgcc aggatgggat gcgcatgttt gcctggatct    3180
tcaactactg gtacgtcggg acggtcttgc tgctgttcct caacttttac gtgcagacgt    3240
acatccggaa gccgaggaag aaccaaggga agaaggagta ggccacatgg cgcctgcgct    3300
ggaggaaacg gtacgctcgg atggtgcact gcacttgcac tccgccgctt ctagcctccc    3360
ctcgctctaa cctctgcgac atgcctgctt gaggcgtgac gttgcctcgt gcgatacagt    3420
ttacaccctt cccatggccc acggagcagg tgactgtctc cagcgtctgc aattctgatc    3480
attggtctgg tgcaatgtgc gcagaccaag cccctctaac gtcttgcggt gtaccgctcg    3540
acactcactg cacgagacag atggctgagc atgttatagc ccctgacatt ctacccttcg    3600
tccttacctg accgtcacat tcatgcttac cnnnnnnnnn nnnnnnnnnn nnnnnnnnnn    3660
nnnnnnnnnn nacccaactt tctt                                           3684
 
<210>11
<211>774
<212>DNA
<213>Euglena anabaena
 
<400>11
atggaagcag ccaaagaatt ggtttccatc gtccaagagg agctccccaa ggtggactat    60
gcccagcttt ggcaggatgc cagcagctgt gaggtccttt acctctcggt ggcattcgtg    120
gcgatcaagt tcatgctgcg cccactggac ctgaagcgcc aggccacctt gaagaagctg    180
ttcacagcat acaacttcct catgtcgatc tattcctttg gctccttcct ggccatggcc    240
tatgccctat cagtaactgg catcctctcc ggcgactgtg agacggcgtt caacaacgat    300
gtgttcagga tcacaactca gctgttctac ctcagcaagt tcgtagagta catcgactcc    360
ttctaccttc cccttatgga caagccactg tcgttccttc agttcttcca tcatttgggg    420
gcccccattg acatgtggct attctacaaa taccgcaacg aaggagtctg gatctttgtc    480
ctgttgaatg ggttcattca ctggatcatg tacggttact attggacgcg gctcatcaag    540
ctgaacttcc ccatgcccaa gaacctgatc acctccatgc agatcatcca gttcaatgtc    600
gggttctaca tcgtctggaa gtaccgcaat gtgccatgct accgccagga tgggatgcgc    660
atgtttgcct ggatcttcaa ctactggtat gtcgggacgg tcttgctgct gttcctcaac    720
ttttacgtgc agacgtacat ccggaagccg aggaagaacc gagggaagaa ggag          774
<210>12
<211>774
<212>DNA
<213>Euglena anabaena
 
<400>12
atggaagcag ccaaagaatt ggtttccatc gtccaagagg agctccccaa ggtggactat    60
gcccagcttt ggcaggacgc cagcagctgt gaggtccttt acctctcggt ggcattcgtg    120
gcgatcaagt tcatgctgcg cccactggac ctgaagcgcc aggccacctt gaagaagctg    180
ttcacagcat acaacttcct catgtcgatc tattcctttg gctccttcct ggccatggcc    240
tatgccctat cagtaactgg catcctctcc ggcgactgtg agacagcgtt caacaacgat    300
gtgttcagga tcacaactca gctgttctac ctcagcaagt tcgtagagta catcgactcc    360
ttctaccttc cccttatgga caagccactg tcgttccttc agttcttcca tcatttgggg    420
gctcccattg acatgtggct attctacaaa taccgcaacg aaggagtctg gatctttgtc    480
ctgttgaatg ggttcattca ctggatcatg tacggttact actggacgcg gctcatcaag    540
ctgaacttcc ccatgcccaa gaacctgatc acctccatgc agatcatcca gttcaatgtc    600
gggttctaca tcgtctggaa gtaccgcaat gtgccatgct accgccagga tgggatgcgc    660
atgtttgcct ggatcttcaa ctactggtac gtcgggacgg tcttgctgct gttcctcaac    720
ttttacgtgc agacgtacat ccggaagccg aggaagaacc aagggaagaa ggag          774
 
<210>13
<211>258
<212>PRT
<213>Euglena anabaena
 
<400>13
 
Met Glu Ala Ala Lys Glu Leu Val Ser Ile Val Gln Glu Glu Leu Pro
1               5                   10                  15
Lys Val Asp Tyr Ala Gln Leu Trp Gln Asp Ala Ser Ser Cys Glu Val
            20                  25                  30
Leu Tyr Leu Ser Val Ala Phe Val Ala Ile Lys Phe Met Leu Arg Pro
        35                  40                  45
Leu Asp Leu Lys Arg Gln Ala Thr Leu Lys Lys Leu Phe Thr Ala Tyr
    50                  55                  60
Asn Phe Leu Met Ser Ile Tyr Ser Phe Gly Ser Phe Leu Ala Met Ala
65                  70                  75                  80
Tyr Ala Leu Ser Val Thr Gly Ile Leu Ser Gly Asp Cys Glu Thr Ala
                85                  90                  95
Phe Asn Asn Asp Val Phe Arg Ile Thr Thr Gln Leu Phe Tyr Leu Ser
            100                 105                 110
Lys Phe Val Glu Tyr Ile Asp Ser Phe Tyr Leu Pro Leu Met Asp Lys
        115                 120                 125
Pro Leu Ser Phe Leu Gln Phe Phe His His Leu Gly Ala Pro Ile Asp
    130                 135                 140
Met Trp Leu Phe Tyr Lys Tyr Arg Asn Glu Gly Val Trp Ile Phe Val
145                 150                 155                 160
Leu Leu Asn Gly Phe Ile His Trp Ile Met Tyr Gly Tyr Tyr Trp Thr
                165                 170                 175
Arg Leu Ile Lys Leu Asn Phe Pro Met Pro Lys Asn Leu Ile Thr Ser
            180                 185                 190
Met Gln Ile Ile Gln Phe Asn Val Gly Phe Tyr Ile Val Trp Lys Tyr
        195                 200                 205
Arg Asn Val Pro Cys Tyr Arg Gln Asp Gly Met Arg Met Phe Ala Trp
    210                 215                 220
Ile Phe Asn Tyr Trp Tyr Val Gly Thr Val Leu Leu Leu Phe Leu Asn
225                 230                 235                 240
Phe Tyr Val Gln Thr Tyr Ile Arg Lys Pro Arg Lys Asn Arg Gly Lys
                245                 250                 255
 
Lys Glu
<210>14
<211>258
<212>PRT
<213>Euglena anabaena
 
<400>14
Met Glu Ala Ala Lys Glu Leu Val Ser Ile Val Gln Glu Glu Leu Pro
1               5                   10                  15
Lys Val Asp Tyr Ala Gln Leu Trp Gln Asp Ala Ser Ser Cys Glu Val
            20                  25                  30
Leu Tyr Leu Ser Val Ala Phe Val Ala Ile Lys Phe Met Leu Arg Pro
        35                  40                  45
Leu Asp Leu Lys Arg Gln Ala Thr Leu Lys Lys Leu Phe Thr Ala Tyr
    50                  55                  60
Asn Phe Leu Met Ser Ile Tyr Ser Phe Gly Ser Phe Leu Ala Met Ala
65                  70                  75                  80
Tyr Ala Leu Ser Val Thr Gly Ile Leu Ser Gly Asp Cys Glu Thr Ala
                85                  90                  95
Phe Asn Asn Asp Val Phe Arg Ile Thr Thr Gln Leu Phe Tyr Leu Ser
            100                 105                 110
Lys Phe Val Glu Tyr Ile Asp Ser Phe Tyr Leu Pro Leu Met Asp Lys
        115                 120                 125
Pro Leu Ser Phe Leu Gln Phe Phe His His Leu Gly Ala Pro Ile Asp
    130                 135                 140
Met Trp Leu Phe Tyr Lys Tyr Arg Asn Glu Gly Val Trp Ile Phe Val
145                 150                 155                 160
Leu Leu Asn Gly Phe Ile His Trp Ile Met Tyr Gly Tyr Tyr Trp Thr
                165                 170                 175
Arg Leu Ile Lys Leu Asn Phe Pro Met Pro Lys Asn Leu Ile Thr Ser
            180                 185                 190
Met Gln Ile Ile Gln Phe Asn Val Gly Phe Tyr Ile Val Trp Lys Tyr
        195                 200                 205
Arg Asn Val Pro Cys Tyr Arg Gln Asp Gly Met Arg Met Phe Ala Trp
    210                 215                 220
Ile Phe Asn Tyr Trp Tyr Val Gly Thr Val Leu Leu Leu Phe Leu Asn
225                 230                 235                 240
Phe Tyr Val Gln Thr Tyr Ile Arg Lys Pro Arg Lys Asn Gln Gly Lys
                245                 250                 255
Lys Glu
 
<210>15
<211>4311
<212>DNA
<213>人工序列
 
<220>
<223>质粒pKR906
 
<400>15
agcggccgca ccatggaggt ggtgaatgaa atagtctcaa ttgggcagga agttttaccc  60
aaagttgatt atgcccaact ctggagtgat gccagtcact gtgaggtgct ttacttgtcc  120
atcgcatttg tcatcttgaa gttcactctt ggcccccttg gtccaaaagg tcagtctcgt  180
atgaagtttg ttttcaccaa ttacaacctt ctcatgtcca tttattcgtt gggatcattc  240
ctctcaatgg catatgccat gtacaccatc ggtgttatgt ctgacaactg cgagaaggct  300
tttgacaaca acgtcttcag gatcaccacg cagttgttct atttgagcaa gttcctggag  360
tatattgact ccttctattt gccactgatg ggcaagcctc tgacctggtt gcaattcttc  420
catcatttgg gggcaccgat ggatatgtgg ctgttctata attaccgaaa tgaagctgtt  480
tggatttttg tgctgttgaa tggtttcatc cactggatca tgtacggtta ttattggacc  540
agattgatca agctgaagtt ccccatgcca aaatccctga ttacatcaat gcagatcatt  600
caattcaatg ttggtttcta cattgtctgg aagtacagga acattccctg ttatcgccaa  660
gatgggatga ggatgtttgg ctggttcttc aattactttt atgttggcac agtcttgtgt  720
ttgttcttga atttctatgt gcaaacgtat atcgtcagga agcacaaggg agccaaaaag  780
attcagtgag cggccgcacc tgaattccag cacactggcg gccgttacta gtggatccga  840
gctcggtacc aagcttgatg catagcttga gtattctaac gcgtcaccta aatagcttgg  900
cgtaatcatg gtcatagctg tttcctgtgt gaaattgtta tccgctcaca attccacaca  960
acatacgagc cggaagcata aagtgtaaag cctggggtgc ctaatgagtg agctaactca  1020
cattaattgc gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg tgccagctgc  1080
attaatgaat cggccaacgc gcggggagag gcggtttgcg tattgggcgc tcttccgctt  1140
cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact    1200
caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag    1260
caaaaggcca gcaaaagccc aggaaccgta aaaaggccgc gttgctggcg tttttccata    1320
ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc    1380
cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg    1440
ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc    1500
tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg    1560
gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc    1620
ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga    1680
ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg    1740
gctacactag aaggacagta tttggtatct gcgctctgct gaagccagtt accttcggaa    1800
aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg    1860
tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt    1920
ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat    1980
tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt agcacgtgtc    2040
agtcctgctc ctcggccacg aagtgcacgc agttgccggc cgggtcgcgc agggcgaact    2100
cccgccccca cggctgctcg ccgatctcgg tcatggccgg cccggaggcg tcccggaagt    2160
tcgtggacac gacctccgac cactcggcgt acagctcgtc caggccgcgc acccacaccc    2220
aggccagggt gttgtccggc accacctggt cctggaccgc gctgatgaac agggtcacgt    2280
cgtcccggac cacaccggcg aagtcgtcct ccacgaagtc ccgggagaac ccgagccggt    2340
cggtccagaa ctcgaccgct ccggcgacgt cgcgcgcggt gagcaccgga acggcactgg    2400
tcaacttggc catggtggcc ctcctcacgt gctattattg aagcatttat cagggttatt    2460
gtctcatgag cggatacata tttgaatgta tttagaaaaa taaacaaata ggggttccgc    2520
gcacatttcc ccgaaaagtg ccacctgtat gcggtgtgaa ataccgcaca gatgcgtaag    2580
gagaaaatac cgcatcagga aattgtaagc gttaataatt cagaagaact cgtcaagaag    2640
gcgatagaag gcgatgcgct gcgaatcggg agcggcgata ccgtaaagca cgaggaagcg    2700
gtcagcccat tcgccgccaa gctcttcagc aatatcacgg gtagccaacg ctatgtcctg    2760
atagcggtcc gccacaccca gccggccaca gtcgatgaat ccagaaaagc ggccattttc    2820
caccatgata ttcggcaagc aggcatcgcc atgggtcacg acgagatcct cgccgtcggg    2880
catgctcgcc ttgagcctgg cgaacagttc ggctggcgcg agcccctgat gctcttcgtc  2940
cagatcatcc tgatcgacaa gaccggcttc catccgagta cgtgctcgct cgatgcgatg  3000
tttcgcttgg tggtcgaatg ggcaggtagc cggatcaagc gtatgcagcc gccgcattgc  3060
atcagccatg atggatactt tctcggcagg agcaaggtga gatgacagga gatcctgccc  3120
cggcacttcg cccaatagca gccagtccct tcccgcttca gtgacaacgt cgagcacagc  3180
tgcgcaagga acgcccgtcg tggccagcca cgatagccgc gctgcctcgt cttgcagttc  3240
attcagggca ccggacaggt cggtcttgac aaaaagaacc gggcgcccct gcgctgacag  3300
ccggaacacg gcggcatcag agcagccgat tgtctgttgt gcccagtcat agccgaatag  3360
cctctccacc caagcggccg gagaacctgc gtgcaatcca tcttgttcaa tcatgcgaaa  3420
cgatcctcat cctgtctctt gatcagagct tgatcccctg cgccatcaga tccttggcgg  3480
cgagaaagcc atccagttta ctttgcaggg cttcccaacc ttaccagagg gcgccccagc  3540
tggcaattcc ggttcgcttg ctgtccataa aaccgcccag tctagctatc gccatgtaag  3600
cccactgcaa gctacctgct ttctctttgc gcttgcgttt tcccttgtcc agatagccca  3660
gtagctgaca ttcatccggg gtcagcaccg tttctgcgga ctggctttct acgtgaaaag  3720
gatctaggtg aagatccttt ttgataatct catgcctgac atttatattc cccagaacat  3780
caggttaatg gcgtttttga tgtcattttc gcggtggctg agatcagcca cttcttcccc  3840
gataacggag accggcacac tggccatatc ggtggtcatc atgcgccagc tttcatcccc  3900
gatatgcacc accgggtaaa gttcacggga gactttatct gacagcagac gtgcactggc  3960
cagggggatc accatccgtc gccccggcgt gtcaataata tcactctgta catccacaaa  4020
cagacgataa cggctctctc ttttataggt gtaaacctta aactgccgta cgtataggct  4080
gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa  4140
agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg  4200
ttgtaaaacg acggccagtg aattgtaata cgactcacta tagggcgaat tgggccctct  4260
agatgcatgc tcgagcggcc gccagtgtga tggatatctg cagaattcag g           4311
 
<210>16
<211>263
<212>PRT
<213>绿光等鞭金藻
 
<400>16
 
Met Ala Leu Ala Asn Asp Ala Gly Glu Arg Ile Trp Ala Ala Val Thr
1               5                   10                  15
Asp Pro Glu Ile Leu Ile Gly Thr Phe Ser Tyr Leu Leu Leu Lys Pro
            20                  25                  30
Leu Leu Arg Asn Ser Gly Leu Val Asp Glu Lys Lys Gly Ala Tyr Arg
        35                  40                  45
Thr Ser Met Ile Trp Tyr Asn Val Leu Leu Ala Leu Phe Ser Ala Leu
    50                  55                  60
Ser Phe Tyr Val Thr Ala Thr Ala Leu Gly Trp Asp Tyr Gly Thr Gly
65                  70                  75                  80
Ala Trp Leu Arg Arg Gln Thr Gly Asp Thr Pro Gln Pro Leu Phe Gln
                85                  90                  95
Cys Pro Ser Pro Val Trp Asp Ser Lys Leu Phe Thr Trp Thr Ala Lys
            100                 105                 110
Ala Phe Tyr Tyr Ser Lys Tyr Val Glu Tyr Leu Asp Thr Ala Trp Leu
        115                 120                 125
Val Leu Lys Gly Lys Arg Val Ser Phe Leu Gln Ala Phe His His Phe
    130                 135                 140
Gly Ala Pro Trp Asp Val Tyr Leu Gly Ile Arg Leu His Asn Glu Gly
145                 150                 155                 160
Val Trp Ile Phe Met Phe Phe Asn Ser Phe Ile His Thr Ile Met Tyr
                165                 170                 175
Thr Tyr Tyr Gly Leu Thr Ala Ala Gly Tyr Lys Phe Lys Ala Lys Pro
            180                 185                 190
Leu Ile Thr Ala Met Gln Ile Cys Gln Phe Val Gly Gly Phe Leu Leu
        195                 200                 205
Val Trp Asp Tyr Ile Asn Val Pro Cys Phe Asn Ser Asp Lys Gly Lys
    210                 215                 220
Leu Phe Ser Trp Ala Phe Asn Tyr Ala Tyr Val Gly Ser Val Phe Leu
225                 230                 235                 240
Leu Phe Cys His Phe Phe Tyr Gln Asp Asn Leu Ala Thr Lys Lys Ser
                245                 250                 255
Ala Lys Ala Gly Lys Gln Leu
            260
 
<210>17
<211>9472
<212>DNA
<213>人工序列
 
<220>
<223>质粒pDMW263
 
<400>17
catggcatgg atggtacgtc ctgtagaaac cccaacccgt gaaatcaaaa aactcgacgg    60
cctgtgggca ttcagtctgg atcgcgaaaa ctgtggaatt gatcagcgtt ggtgggaaag    120
cgcgttacaa gaaagccggg caattgctgt gccaggcagt tttaacgatc agttcgccga    180
tgcagatatt cgtaattatg cgggcaacgt ctggtatcag cgcgaagtct ttataccgaa    240
aggttgggca ggccagcgta tcgtgctgcg tttcgatgcg gtcactcatt acggcaaagt    300
gtgggtcaat aatcaggaag tgatggagca tcagggcggc tatacgccat ttgaagccga    360
tgtcacgccg tatgttattg ccgggaaaag tgtacgtatc accgtttgtg tgaacaacga    420
actgaactgg cagactatcc cgccgggaat ggtgattacc gacgaaaacg gcaagaaaaa    480
gcagtcttac ttccatgatt tctttaacta tgccgggatc catcgcagcg taatgctcta    540
caccacgccg aacacctggg tggacgatat caccgtggtg acgcatgtcg cgcaagactg    600
taaccacgcg tctgttgact ggcaggtggt ggccaatggt gatgtcagcg ttgaactgcg    660
tgatgcggat caacaggtgg ttgcaactgg acaaggcact agcgggactt tgcaagtggt    720
gaatccgcac ctctggcaac cgggtgaagg ttatctctat gaactgtgcg tcacagccaa    780
aagccagaca gagtgtgata tctacccgct tcgcgtcggc atccggtcag tggcagtgaa    840
gggcgaacag ttcctgatta accacaaacc gttctacttt actggctttg gtcgtcatga    900
agatgcggac ttacgtggca aaggattcga taacgtgctg atggtgcacg accacgcatt    960
aatggactgg attggggcca actcctaccg tacctcgcat tacccttacg ctgaagagat    1020
gctcgactgg gcagatgaac atggcatcgt ggtgattgat gaaactgctg ctgtcggctt    1080
taacctctct ttaggcattg gtttcgaagc gggcaacaag ccgaaagaac tgtacagcga    1140
agaggcagtc aacggggaaa ctcagcaagc gcacttacag gcgattaaag agctgatagc    1200
gcgtgacaaa aaccacccaa gcgtggtgat gtggagtatt gccaacgaac cggatacccg    1260
tccgcaagtg cacgggaata tttcgccact ggcggaagca acgcgtaaac tcgacccgac    1320
gcgtccgatc acctgcgtca atgtaatgtt ctgcgacgct cacaccgata ccatcagcga    1380
tctctttgat gtgctgtgcc tgaaccgtta ttacggatgg tatgtccaaa gcggcgattt    1440
ggaaacggca gagaaggtac tggaaaaaga acttctggcc tggcaggaga aactgcatca    1500
gccgattatc atcaccgaat acggcgtgga tacgttagcc gggctgcact caatgtacac    1560
cgacatgtgg agtgaagagt atcagtgtgc atggctggat atgtatcacc gcgtctttga    1620
tcgcgtcagc gccgtcgtcg gtgaacaggt atggaatttc gccgattttg cgacctcgca    1680
aggcatattg cgcgttggcg gtaacaagaa agggatcttc actcgcgacc gcaaaccgaa    1740
gtcggcggct tttctgctgc aaaaacgctg gactggcatg aacttcggtg aaaaaccgca    1800
gcagggaggc aaacaatgat taattaacta gagcggccgc caccgcggcc cgagattccg    1860
gcctcttcgg ccgccaagcg acccgggtgg acgtctagag gtacctagca attaacagat    1920
agtttgccgg tgataattct cttaacctcc cacactcctt tgacataacg atttatgtaa    1980
cgaaactgaa atttgaccag atattgtgtc cgcggtggag ctccagcttt tgttcccttt    2040
agtgagggtt aatttcgagc ttggcgtaat catggtcata gctgtttcct gtgtgaaatt    2100
gttatccgct cacaattcca cacaacatac gagccggaag cataaagtgt aaagcctggg    2160
gtgcctaatg agtgagctaa ctcacattaa ttgcgttgcg ctcactgccc gctttccagt    2220
cgggaaacct gtcgtgccag ctgcattaat gaatcggcca acgcgcgggg agaggcggtt    2280
tgcgtattgg gcgctcttcc gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc    2340
tgcggcgagc ggtatcagct cactcaaagg cggtaatacg gttatccaca gaatcagggg    2400
ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg    2460
ccgcgttgct ggcgtttttc cataggctcc gcccccctga cgagcatcac aaaaatcgac    2520
gctcaagtca gaggtggcga aacccgacag gactataaag ataccaggcg tttccccctg    2580
gaagctccct cgtgcgctct cctgttccga ccctgccgct taccggatac ctgtccgcct    2640
ttctcccttc gggaagcgtg gcgctttctc atagctcacg ctgtaggtat ctcagttcgg    2700
tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct    2760
gcgccttatc cggtaactat cgtcttgagt ccaacccggt aagacacgac ttatcgccac    2820
tggcagcagc cactggtaac aggattagca gagcgaggta tgtaggcggt gctacagagt    2880
tcttgaagtg gtggcctaac tacggctaca ctagaaggac agtatttggt atctgcgctc    2940
tgctgaagcc agttaccttc ggaaaaagag ttggtagctc ttgatccggc aaacaaacca    3000
ccgctggtag cggtggtttt tttgtttgca agcagcagat tacgcgcaga aaaaaaggat    3060
ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc tcagtggaac gaaaactcac    3120
gttaagggat tttggtcatg agattatcaa aaaggatctt cacctagatc cttttaaatt    3180
aaaaatgaag ttttaaatca atctaaagta tatatgagta aacttggtct gacagttacc    3240
aatgcttaat cagtgaggca cctatctcag cgatctgtct atttcgttca tccatagttg    3300
cctgactccc cgtcgtgtag ataactacga tacgggaggg cttaccatct ggccccagtg    3360
ctgcaatgat accgcgagac ccacgctcac cggctccaga tttatcagca ataaaccagc    3420
cagccggaag ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc atccagtcta    3480
ttaattgttg ccgggaagct agagtaagta gttcgccagt taatagtttg cgcaacgttg    3540
ttgccattgc tacaggcatc gtggtgtcac gctcgtcgtt tggtatggct tcattcagct    3600
ccggttccca acgatcaagg cgagttacat gatcccccat gttgtgcaaa aaagcggtta    3660
gctccttcgg tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg    3720
ttatggcagc actgcataat tctcttactg tcatgccatc cgtaagatgc ttttctgtga    3780
ctggtgagta ctcaaccaag tcattctgag aatagtgtat gcggcgaccg agttgctctt    3840
gcccggcgtc aatacgggat aataccgcgc cacatagcag aactttaaaa gtgctcatca    3900
ttggaaaacg ttcttcgggg cgaaaactct caaggatctt accgctgttg agatccagtt    3960
cgatgtaacc cactcgtgca cccaactgat cttcagcatc ttttactttc accagcgttt    4020
ctgggtgagc aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg gcgacacgga    4080
aatgttgaat actcatactc ttcctttttc aatattattg aagcatttat cagggttatt    4140
gtctcatgag cggatacata tttgaatgta tttagaaaaa taaacaaata ggggttccgc    4200
gcacatttcc ccgaaaagtg ccacctgacg cgccctgtag cggcgcatta agcgcggcgg    4260
gtgtggtggt tacgcgcagc gtgaccgcta cacttgccag cgccctagcg cccgctcctt    4320
tcgctttctt cccttccttt ctcgccacgt tcgccggctt tccccgtcaa gctctaaatc    4380
gggggctccc tttagggttc cgatttagtg ctttacggca cctcgacccc aaaaaacttg    4440
attagggtga tggttcacgt agtgggccat cgccctgata gacggttttt cgccctttga    4500
cgttggagtc cacgttcttt aatagtggac tcttgttcca aactggaaca acactcaacc    4560
ctatctcggt ctattctttt gatttataag ggattttgcc gatttcggcc tattggttaa    4620
aaaatgagct gatttaacaa aaatttaacg cgaattttaa caaaatatta acgcttacaa    4680
tttccattcg ccattcaggc tgcgcaactg ttgggaaggg cgatcggtgc gggcctcttc    4740
gctattacgc cagctggcga aagggggatg tgctgcaagg cgattaagtt gggtaacgcc    4800
agggttttcc cagtcacgac gttgtaaaac gacggccagt gaattgtaat acgactcact    4860
atagggcgaa ttgggtaccg ggccccccct cgaggtcgat ggtgtcgata agcttgatat    4920
cgaattcatg tcacacaaac cgatcttcgc ctcaaggaaa cctaattct acatccgagag    4980
actgccgaga tccagtctac actgattaat tttcgggcca ataatttaaa aaaatcgtgt    5040
tatataatat tatatgtatt atatatatac atcatgatga tactgacagt catgtcccat    5100
tgctaaatag acagactcca tctgccgcct ccaactgatg ttctcaatat ttaaggggtc    5160
atctcgcatt gtttaataat aaacagactc catctaccgc ctccaaatga tgttctcaaa    5220
atatattgta tgaacttatt tttattactt agtattatta gacaacttac ttgctttatg    5280
aaaaacactt cctatttagg aaacaattta taatggcagt tcgttcattt aacaatttat    5340
gtagaataaa tgttataaat gcgtatggga aatcttaaat atggatagca taaatgatat    5400
ctgcattgcc taattcgaaa tcaacagcaa cgaaaaaaat cccttgtaca acataaatag    5460
tcatcgagaa atatcaacta tcaaagaaca gctattcaca cgttactatt gagattatta    5520
ttggacgaga atcacacact caactgtctt tctctcttct agaaatacag gtacaagtat    5580
gtactattct cattgttcat acttctagtc atttcatccc acatattcct tggatttctc    5640
tccaatgaat gacattctat cttgcaaatt caacaattat aataagatat accaaagtag    5700
cggtatagtg gcaatcaaaa agcttctctg gtgtgcttct cgtatttatt tttattctaa    5760
tgatccatta aaggtatata tttatttctt gttatataat ccttttgttt attacatggg    5820
ctggatacat aaaggtattt tgatttaatt ttttgcttaa attcaatccc ccctcgttca    5880
gtgtcaactg taatggtagg aaattaccat acttttgaag aagcaaaaaa aatgaaagaa    5940
aaaaaaaatc gtatttccag gttagacgtt ccgcagaatc tagaatgcgg tatgcggtac    6000
attgttcttc gaacgtaaaa gttgcgctcc ctgagatatt gtacattttt gcttttacaa    6060
gtacaagtac atcgtacaac tatgtactac tgttgatgca tccacaacag tttgttttgt    6120
ttttttttgt tttttttttt tctaatgatt cattaccgct atgtatacct acttgtactt    6180
gtagtaagcc gggttattgg cgttcaatta atcatagact tatgaatctg cacggtgtgc    6240
gctgcgagtt acttttagct tatgcatgct acttgggtgt aatattggga tctgttcgga    6300
aatcaacgga tgctcaaccg atttcgacag taataatttg aatcgaatcg gagcctaaaa    6360
tgaacccgag tatatctcat aaaattctcg gtgagaggtc tgtgactgtc agtacaaggt    6420
gccttcatta tgccctcaac cttaccatac ctcactgaat gtagtgtacc tctaaaaatg    6480
aaatacagtg ccaaaagcca aggcactgag ctcgtctaac ggacttgata tacaaccaat    6540
taaaacaaat gaaaagaaat acagttcttt gtatcatttg taacaattac cctgtacaaa    6600
ctaaggtatt gaaatcccac aatattccca aagtccaccc ctttccaaat tgtcatgcct    6660
acaactcata taccaagcac taacctacca aacaccacta aaaccccaca aaatatatct    6720
taccgaatat acagtaacaa gctaccacca cactcgttgg gtgcagtcgc cagcttaaag    6780
atatctatcc acatcagcca caactccctt cctttaataa accgactaca cccttggcta    6840
ttgaggttat gagtgaatat actgtagaca agacactttc aagaagactg tttccaaaac    6900
gtaccactgt cctccactac aaacacaccc aatctgcttc ttctagtcaa ggttgctaca    6960
ccggtaaatt ataaatcatc atttcattag cagggcaggg ccctttttat agagtcttat    7020
acactagcgg accctgccgg tagaccaacc cgcaggcgcg tcagtttgct ccttccatca    7080
atgcgtcgta gaaacgactt actccttctt gagcagctcc ttgaccttgt tggcaacaag    7140
tctccgacct cggaggtgga ggaagagcct ccgatatcgg cggtagtgat accagcctcg    7200
acggactcct tgacggcagc ctcaacagcg tcaccggcgg gcttcatgtt aagagagaac    7260
ttgagcatca tggcggcaga cagaatggtg gcaatggggt tgaccttctg cttgccgaga    7320
tcgggggcag atccgtgaca gggctcgtac agaccgaacg cctcgttggt gtcgggcaga    7380
gaagccagag aggcggaggg cagcagaccc agagaaccgg ggatgacgga ggcctcgtcg    7440
gagatgatat cgccaaacat gttggtggtg atgatgatac cattcatctt ggagggctgc    7500
ttgatgagga tcatggcggc cgagtcgatc agctggtggt tgagctcgag ctgggggaat    7560
tcgtccttga ggactcgagt gacagtcttt cgccaaagtc gagaggaggc cagcacgttg    7620
gccttgtcaa gagaccacac gggaagaggg gggttgtgct gaagggccag gaaggcggcc    7680
attcgggcaa ttcgctcaac ctcaggaacg gagtaggtct cggtgtcgga agcgacgcca    7740
gatccgtcat cctcctttcg ctctccaaag tagatacctc cgacgagctc tcggacaatg    7800
atgaagtcgg tgccctcaac gtttcggatg ggggagagat cggcgagctt gggcgacagc    7860
agctggcagg gtcgcaggtt ggcgtacagg ttcaggtcct ttcgcagctt gaggagaccc    7920
tgctcgggtc gcacgtcggt tcgtccgtcg ggagtggtcc atacggtgtt ggcagcgcct    7980
ccgacagcac cgagcataat agagtcagcc tttcggcaga tgtcgagagt agcgtcggtg    8040
atgggctcgc cctccttctc aatggcagct cctccaatga gtcggtcctc aaacacaaac    8100
tcggtgccgg aggcctcagc aacagacttg agcaccttga cggcctcggc aatcacctcg    8160
gggccacaga agtcgccgcc gagaagaaca atcttcttgg agtcagtctt ggtcttctta    8220
gtttcgggtt ccattgtgga tgtgtgtggt tgtatgtgtg atgtggtgtg tggagtgaaa 8280
atctgtggct ggcaaacgct cttgtatata tacgcacttt tgcccgtgct atgtggaaga 8340
ctaaacctcc gaagattgtg actcaggtag tgcggtatcg gctagggacc caaaccttgt 8400
cgatgccgat agcgctatcg aacgtacccc agccggccgg gagtatgtcg gaggggacat 8460
acgagatcgt caagggtttg tggccaactg gtaaataaat gatgtcgacg tttaaacagt 8520
gtacgcagat ctactataga ggaacattta aattgccccg gagaagacgg ccaggccgcc 8580
tagatgacaa attcaacaac tcacagctga ctttctgcca ttgccactag gggggggcct 8640
ttttatatgg ccaagccaag ctctccacgt cggttgggct gcacccaaca ataaatgggt 8700
agggttgcac caacaaaggg atgggatggg gggtagaaga tacgaggata acggggctca 8760
atggcacaaa taagaacgaa tactgccatt aagactcgtg atccagcgac tgacaccatt 8820
gcatcatcta agggcctcaa aactacctcg gaactgctgc gctgatctgg acaccacaga 8880
ggttccgagc actttaggtt gcaccaaatg tcccaccagg tgcaggcaga aaacgctgga 8940
acagcgtgta cagtttgtct taacaaaaag tgagggcgct gaggtcgagc agggtggtgt 9000
gacttgttat agcctttaga gctgcgaaag cgcgtatgga tttggctcat caggccagat 9060
tgagggtctg tggacacatg tcatgttagt gtacttcaat cgccccctgg atatagcccc 9120
gacaataggc cgtggcctca tttttttgcc ttccgcacat ttccattgct cgatacccac 9180
accttgcttc tcctgcactt gccaacctta atactggttt acattgacca acatcttaca 9240
agcggggggc ttgtctaggg tatatataaa cagtggctct cccaatcggt tgccagtctc 9300
ttttttcctt tctttcccca cagattcgaa atctaaacta cacatcacag aattccgagc 9360
cgtgagtatc cacgacaaga tcagtgtcga gacgacgcgt tttgtgtaat gacacaatcc 9420
gaaagtcgct agcaacacac actctctaca caaactaacc cagctctggt ac         9472
 
<210>18
<211>7879
<212>DNA
<213>人工序列
 
<220>
<223>质粒pDMW237
 
<400>18
ggccgcaagt gtggatgggg aagtgagtgc ccggttctgt gtgcacaatt ggcaatccaa    60
gatggatgga ttcaacacag ggatatagcg agctacgtgg tggtgcgagg atatagcaac    120
ggatatttat gtttgacact tgagaatgta cgatacaagc actgtccaag tacaatacta    180
aacatactgt acatactcat actcgtaccc gggcaacggt ttcacttgag tgcagtggct    240
agtgctctta ctcgtacagt gtgcaatact gcgtatcata gtctttgatg tatatcgtat    300
tcattcatgt tagttgcgta cgagccggaa gcataaagtg taaagcctgg ggtgcctaat    360
gagtgagcta actcacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc    420
tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg    480
ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag    540
cggtatcagc tcactcaaag gcggtaatac ggttatccac agaatcaggg gataacgcag    600
gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc    660
tggcgttttt ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc    720
agaggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc    780
tcgtgcgctc tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt    840
cgggaagcgt ggcgctttct catagctcac gctgtaggta tctcagttcg gtgtaggtcg    900
ttcgctccaa gctgggctgt gtgcacgaac cccccgttca gcccgaccgc tgcgccttat    960
ccggtaacta tcgtcttgag tccaacccgg taagacacga cttatcgcca ctggcagcag    1020
ccactggtaa caggattagc agagcgaggt atgtaggcgg tgctacagag ttcttgaagt    1080
ggtggcctaa ctacggctac actagaagga cagtatttgg tatctgcgct ctgctgaagc    1140
cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc accgctggta    1200
gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag    1260
atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca cgttaaggga    1320
ttttggtcat gagattatca aaaaggatct tcacctagat ccttttaaat taaaaatgaa    1380
gttttaaatc aatctaaagt atatatgagt aaacttggtc tgacagttac caatgcttaa    1440
tcagtgaggc acctatctca gcgatctgtc tatttcgttc atccatagtt gcctgactcc    1500
ccgtcgtgta gataactacg atacgggagg gcttaccatc tggccccagt gctgcaatga    1560
taccgcgaga cccacgctca ccggctccag atttatcagc aataaaccag ccagccggaa    1620
gggccgagcg cagaagtggt cctgcaactt tatccgcctc catccagtct attaattgtt    1680
gccgggaagc tagagtaagt agttcgccag ttaatagttt gcgcaacgtt gttgccattg    1740
ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc tccggttccc    1800
aacgatcaag gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt agctccttcg    1860
gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg gttatggcag    1920
cactgcataa ttctcttact gtcatgccat ccgtaagatg cttttctgtg actggtgagt    1980
actcaaccaa gtcattctga gaatagtgta tgcggcgacc gagttgctct tgcccggcgt    2040
caatacggga taataccgcg ccacatagca gaactttaaa agtgctcatc attggaaaac    2100
gttcttcggg gcgaaaactc tcaaggatct taccgctgtt gagatccagt tcgatgtaac    2160
ccactcgtgc acccaactga tcttcagcat cttttacttt caccagcgtt tctgggtgag    2220
caaaaacagg aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa    2280
tactcatact cttccttttt caatattatt gaagcattta tcagggttat tgtctcatga    2340
gcggatacat atttgaatgt atttagaaaa ataaacaaat aggggttccg cgcacatttc    2400
cccgaaaagt gccacctgac gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg    2460
ttacgcgcag cgtgaccgct acacttgcca gcgccctagc gcccgctcct ttcgctttct    2520
tcccttcctt tctcgccacg ttcgccggct ttccccgtca agctctaaat cgggggctcc    2580
ctttagggtt ccgatttagt gctttacggc acctcgaccc caaaaaactt gattagggtg    2640
atggttcacg tagtgggcca tcgccctgat agacggtttt tcgccctttg acgttggagt    2700
ccacgttctt taatagtgga ctcttgttcc aaactggaac aacactcaac cctatctcgg    2760
tctattcttt tgatttataa gggattttgc cgatttcggc ctattggtta aaaaatgagc    2820
tgatttaaca aaaatttaac gcgaatttta acaaaatatt aacgcttaca atttccattc    2880
gccattcagg ctgcgcaact gttgggaagg gcgatcggtg cgggcctctt cgctattacg    2940
ccagctggcg aaagggggat gtgctgcaag gcgattaagt tgggtaacgc cagggttttc    3000
ccagtcacga cgttgtaaaa cgacggccag tgaattgtaa tacgactcac tatagggcga    3060
attgggtacc gggccccccc tcgaggtcga tggtgtcgat aagcttgata tcgaattcat    3120
gtcacacaaa ccgatcttcg cctcaaggaa acctaattct acatccgaga gactgccgag    3180
atccagtcta cactgattaa ttttcgggcc aataatttaa aaaaatcgtg ttatataata    3240
ttatatgtat tatatatata catcatgatg atactgacag tcatgtccca ttgctaaata    3300
gacagactcc atctgccgcc tccaactgat gttctcaata tttaaggggt catctcgcat    3360
tgtttaataa taaacagact ccatctaccg cctccaaatg atgttctcaa aatatattgt    3420
atgaacttat ttttattact tagtattatt agacaactta cttgctttat gaaaaacact    3480
tcctatttag gaaacaattt ataatggcag ttcgttcatt taacaattta tgtagaataa    3540
atgttataaa tgcgtatggg aaatcttaaa tatggatagc ataaatgata tctgcattgc    3600
ctaattcgaa atcaacagca acgaaaaaaa tcccttgtac aacataaata gtcatcgaga    3660
aatatcaact atcaaagaac agctattcac acgttactat tgagattatt attggacgag    3720
aatcacacac tcaactgtct ttctctcttc tagaaataca ggtacaagta tgtactattc    3780
tcattgttca tacttctagt catttcatcc cacatattcc ttggatttct ctccaatgaa    3840
tgacattcta tcttgcaaat tcaacaatta taataagata taccaaagta gcggtatagt    3900
ggcaatcaaa aagcttctct ggtgtgcttc tcgtatttat ttttattcta atgatccatt    3960
aaaggtatat atttatttct tgttatataa tccttttgtt tattacatgg gctggataca    4020
taaaggtatt ttgatttaat tttttgctta aattcaatcc cccctcgttc agtgtcaact    4080
gtaatggtag gaaattacca tacttttgaa gaagcaaaaa aaatgaaaga aaaaaaaaat    4140
cgtatttcca ggttagacgt tccgcagaat ctagaatgcg gtatgcggta cattgttctt    4200
cgaacgtaaa agttgcgctc cctgagatat tgtacatttt tgcttttaca agtacaagta    4260
catcgtacaa ctatgtacta ctgttgatgc atccacaaca gtttgttttg tttttttttg    4320
tttttttttt ttctaatgat tcattaccgc tatgtatacc tacttgtact tgtagtaagc    4380
cgggttattg gcgttcaatt aatcatagac ttatgaatct gcacggtgtg cgctgcgagt    4440
tacttttagc ttatgcatgc tacttgggtg taatattggg atctgttcgg aaatcaacgg    4500
atgctcaatc gatttcgaca gtaattaatt aagtcataca caagtcagct ttcttcgagc    4560
ctcatataag tataagtagt tcaacgtatt agcactgtac ccagcatctc cgtatcgaga    4620
aacacaacaa catgccccat tggacagatc atgcggatac acaggttgtg cagtatcata    4680
catactcgat cagacaggtc gtctgaccat catacaagct gaacaagcgc tccatacttg    4740
cacgctctct atatacacag ttaaattaca tatccatagt ctaacctcta acagttaatc    4800
ttctggtaag cctcccagcc agccttctgg tatcgcttgg cctcctcaat aggatctcgg    4860
ttctggccgt acagacctcg gccgacaatt atgatatccg ttccggtaga catgacatcc    4920
tcaacagttc ggtactgctg tccgagagcg tctcccttgt cgtcaagacc caccccgggg    4980
gtcagaataa gccagtcctc agagtcgccc ttaggtcggt tctgggcaat gaagccaacc    5040
acaaactcgg ggtcggatcg ggcaagctca atggtctgct tggagtactc gccagtggcc    5100
agagagccct tgcaagacag ctcggccagc atgagcagac ctctggccag cttctcgttg    5160
ggagagggga ctaggaactc cttgtactgg gagttctcgt agtcagagac gtcctccttc    5220
ttctgttcag agacagtttc ctcggcacca gctcgcaggc cagcaatgat tccggttccg    5280
ggtacaccgt gggcgttggt gatatcggac cactcggcga ttcggtgaca ccggtactgg    5340
tgcttgacag tgttgccaat atctgcgaac tttctgtcct cgaacaggaa gaaaccgtgc    5400
ttaagagcaa gttccttgag ggggagcaca gtgccggcgt aggtgaagtc gtcaatgatg    5460
tcgatatggg ttttgatcat gcacacataa ggtccgacct tatcggcaag ctcaatgagc    5520
tccttggtgg tggtaacatc cagagaagca cacaggttgg ttttcttggc tgccacgagc    5580
ttgagcactc gagcggcaaa ggcggacttg tggacgttag ctcgagcttc gtaggagggc    5640
attttggtgg tgaagaggag actgaaataa atttagtctg cagaactttt tatcggaacc    5700
ttatctgggg cagtgaagta tatgttatgg taatagttac gagttagttg aacttataga    5760
tagactggac tatacggcta tcggtccaaa ttagaaagaa cgtcaatggc tctctgggcg    5820
tcgcctttgc cgacaaaaat gtgatcatga tgaaagccag caatgacgtt gcagctgata    5880
ttgttgtcgg ccaaccgcgc cgaaaacgca gctgtcagac ccacagcctc caacgaagaa    5940
tgtatcgtca aagtgatcca agcacactca tagttggagt cgtactccaa aggcggcaat    6000
gacgagtcag acagatactc gtcgactcag gcgacgacgg aattcctgca gcccatctgc    6060
agaattcagg agagaccggg ttggcggcgt atttgtgtcc caaaaaacag ccccaattgc    6120
cccggagaag acggccaggc cgcctagatg acaaattcaa caactcacag ctgactttct    6180
gccattgcca ctaggggggg gcctttttat atggccaagc caagctctcc acgtcggttg    6240
ggctgcaccc aacaataaat gggtagggtt gcaccaacaa agggatggga tggggggtag    6300
aagatacgag gataacgggg ctcaatggca caaataagaa cgaatactgc cattaagact    6360
cgtgatccag cgactgacac cattgcatca tctaagggcc tcaaaactac ctcggaactg    6420
ctgcgctgat ctggacacca cagaggttcc gagcacttta ggttgcacca aatgtcccac    6480
caggtgcagg cagaaaacgc tggaacagcg tgtacagttt gtcttaacaa aaagtgaggg    6540
cgctgaggtc gagcagggtg gtgtgacttg ttatagcctt tagagctgcg aaagcgcgta    6600
tggatttggc tcatcaggcc agattgaggg tctgtggaca catgtcatgt tagtgtactt    6660
caatcgcccc ctggatatag ccccgacaat aggccgtggc ctcatttttt tgccttccgc    6720
acatttccat tgctcggtac ccacaccttg cttctcctgc acttgccaac cttaatactg    6780
gtttacattg accaacatct tacaagcggg gggcttgtct agggtatata taaacagtgg    6840
ctctcccaat cggttgccag tctctttttt cctttctttc cccacagatt cgaaatctaa    6900
actacacatc acacaatgcc tgttactgac gtccttaagc gaaagtccgg tgtcatcgtc    6960
ggcgacgatg tccgagccgt gagtatccac gacaagatca gtgtcgagac gacgcgtttt    7020
gtgtaatgac acaatccgaa agtcgctagc aacacacact ctctacacaa actaacccag    7080
ctctccatgg ctctggccaa cgacgctggc gagcgaatct gggctgccgt caccgatccc  7140
gaaatcctca ttggcacctt ctcctacctg ctcctgaagc ctctcctgcg aaactctggt  7200
ctcgtggacg agaagaaagg agcctaccga acctccatga tctggtacaa cgtcctcctg  7260
gctctcttct ctgccctgtc cttctacgtg actgccaccg ctctcggctg ggactacggt  7320
actggagcct ggctgcgaag acagaccggt gatactcccc agcctctctt tcagtgtccc  7380
tctcctgtct gggactccaa gctgttcacc tggactgcca aggccttcta ctattctaag  7440
tacgtggagt acctcgacac cgcttggctg gtcctcaagg gcaagcgagt gtcctttctg  7500
caggccttcc atcactttgg agctccctgg gacgtctacc tcggcattcg actgcacaac  7560
gagggtgtgt ggatcttcat gttctttaac tcgttcattc acaccatcat gtacacctac  7620
tatggactga ctgccgctgg ctacaagttc aaggccaagc ctctgatcac tgccatgcag  7680
atttgccagt tcgtcggtgg ctttctcctg gtctgggact acatcaacgt tccctgcttc  7740
aactctgaca agggcaagct gttctcctgg gctttcaact acgcctacgt cggatctgtc  7800
tttctcctgt tctgtcactt cttttaccag gacaacctgg ccaccaagaa atccgctaag  7860
gctggtaagc agctttagc                                               7879
 
<210>19
<211>7783
<212>DNA
<213>人工序列
 
<220>
<223>质粒pY115
 
<400>19
catggctctg gccaacgacg ctggcgagcg aatctgggct gccgtcaccg atcccgaaat  60
cctcattggc accttctcct acctgctcct gaagcctctc ctgcgaaact ctggtctcgt  120
ggacgagaag aaaggagcct accgaacctc catgatctgg tacaacgtcc tcctggctct  180
cttctctgcc ctgtccttct acgtgactgc caccgctctc ggctgggact acggtactgg  240
agcctggctg cgaagacaga ccggtgatac tccccagcct ctctttcagt gtccctctcc  300
tgtctgggac tccaagctgt tcacctggac tgccaaggcc ttctactatt ctaagtacgt  360
ggagtacctc gacaccgctt ggctggtcct caagggcaag cgagtgtcct ttctgcaggc  420
cttccatcac tttggagctc cctgggacgt ctacctcggc attcgactgc acaacgaggg  480
tgtgtggatc ttcatgttct ttaactcgtt cattcacacc atcatgtaca cctactatgg  540
actgactgcc gctggctaca agttcaaggc caagcctctg atcactgcca tgcagatttg  600
ccagttcgtc ggtggctttc tcctggtctg ggactacatc aacgttccct gcttcaactc    660
tgacaagggc aagctgttct cctgggcttt caactacgcc tacgtcggat ctgtctttct    720
cctgttctgt cacttctttt accaggacaa cctggccacc aagaaatccg ctaaggctgg    780
taagcagctt tagcggccgc aagtgtggat ggggaagtga gtgcccggtt ctgtgtgcac    840
aattggcaat ccaagatgga tggattcaac acagggatat agcgagctac gtggtggtgc    900
gaggatatag caacggatat ttatgtttga cacttgagaa tgtacgatac aagcactgtc    960
caagtacaat actaaacata ctgtacatac tcatactcgt acccgggcaa cggtttcact    1020
tgagtgcagt ggctagtgct cttactcgta cagtgtgcaa tactgcgtat catagtcttt    1080
gatgtatatc gtattcattc atgttagttg cgtacgagcc ggaagcataa agtgtaaagc    1140
ctggggtgcc taatgagtga gctaactcac attaattgcg ttgcgctcac tgcccgcttt    1200
ccagtcggga aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg cggggagagg    1260
cggtttgcgt attgggcgct cttccgcttc ctcgctcact gactcgctgc gctcggtcgt    1320
tcggctgcgg cgagcggtat cagctcactc aaaggcggta atacggttat ccacagaatc    1380
aggggataac gcaggaaaga acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa    1440
aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa    1500
tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc    1560
ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc    1620
cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag    1680
ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga    1740
ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc    1800
gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac    1860
agagttcttg aagtggtggc ctaactacgg ctacactaga aggacagtat ttggtatctg    1920
cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca    1980
aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa    2040
aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa    2100
ctcacgttaa gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt    2160
aaattaaaaa tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacag    2220
ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat    2280
agttgcctga ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc    2340
cagtgctgca atgataccgc gagacccacg ctcaccggct ccagatttat cagcaataaa    2400
ccagccagcc ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca    2460
gtctattaat tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa    2520
cgttgttgcc attgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt    2580
cagctccggt tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc    2640
ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact    2700
catggttatg gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc    2760
tgtgactggt gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg    2820
ctcttgcccg gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct    2880
catcattgga aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc    2940
cagttcgatg taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag    3000
cgtttctggg tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac    3060
acggaaatgt tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg    3120
ttattgtctc atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt    3180
tccgcgcaca tttccccgaa aagtgccacc tgacgcgccc tgtagcggcg cattaagcgc    3240
ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt gccagcgccc tagcgcccgc    3300
tcctttcgct ttcttccctt cctttctcgc cacgttcgcc ggctttcccc gtcaagctct    3360
aaatcggggg ctccctttag ggttccgatt tagtgcttta cggcacctcg accccaaaaa    3420
acttgattag ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg tttttcgccc    3480
tttgacgttg gagtccacgt tctttaatag tggactcttg ttccaaactg gaacaacact    3540
caaccctatc tcggtctatt cttttgattt ataagggatt ttgccgattt cggcctattg    3600
gttaaaaaat gagctgattt aacaaaaatt taacgcgaat tttaacaaaa tattaacgct    3660
tacaatttcc attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc    3720
tcttcgctat tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta    3780
acgccagggt tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt gtaatacgac    3840
tcactatagg gcgaattggg taccgggccc cccctcgagg tcgatggtgt cgataagctt    3900
gatatcgaat tcatgtcaca caaaccgatc ttcgcctcaa ggaaacctaa ttctacatcc    3960
gagagactgc cgagatccag tctacactga ttaattttcg ggccaataat ttaaaaaaat    4020
cgtgttatat aatattatat gtattatata tatacatcat gatgatactg acagtcatgt    4080
cccattgcta aatagacaga ctccatctgc cgcctccaac tgatgttctc aatatttaag    4140
gggtcatctc gcattgttta ataataaaca gactccatct accgcctcca aatgatgttc    4200
tcaaaatata ttgtatgaac ttatttttat tacttagtat tattagacaa cttacttgct    4260
ttatgaaaaa cacttcctat ttaggaaaca atttataatg gcagttcgtt catttaacaa    4320
tttatgtaga ataaatgtta taaatgcgta tgggaaatct taaatatgga tagcataaat    4380
gatatctgca ttgcctaatt cgaaatcaac agcaacgaaa aaaatccctt gtacaacata    4440
aatagtcatc gagaaatatc aactatcaaa gaacagctat tcacacgtta ctattgagat    4500
tattattgga cgagaatcac acactcaact gtctttctct cttctagaaa tacaggtaca    4560
agtatgtact attctcattg ttcatacttc tagtcatttc atcccacata ttccttggat    4620
ttctctccaa tgaatgacat tctatcttgc aaattcaaca attataataa gatataccaa    4680
agtagcggta tagtggcaat caaaaagctt ctctggtgtg cttctcgtat ttatttttat    4740
tctaatgatc cattaaaggt atatatttat ttcttgttat ataatccttt tgtttattac    4800
atgggctgga tacataaagg tattttgatt taattttttg cttaaattca atcccccctc    4860
gttcagtgtc aactgtaatg gtaggaaatt accatacttt tgaagaagca aaaaaaatga    4920
aagaaaaaaa aaatcgtatt tccaggttag acgttccgca gaatctagaa tgcggtatgc    4980
ggtacattgt tcttcgaacg taaaagttgc gctccctgag atattgtaca tttttgcttt    5040
tacaagtaca agtacatcgt acaactatgt actactgttg atgcatccac aacagtttgt    5100
tttgtttttt tttgtttttt ttttttctaa tgattcatta ccgctatgta tacctacttg    5160
tacttgtagt aagccgggtt attggcgttc aattaatcat agacttatga atctgcacgg    5220
tgtgcgctgc gagttacttt tagcttatgc atgctacttg ggtgtaatat tgggatctgt    5280
tcggaaatca acggatgctc aatcgatttc gacagtaatt aattaagtca tacacaagtc    5340
agctttcttc gagcctcata taagtataag tagttcaacg tattagcact gtacccagca    5400
tctccgtatc gagaaacaca acaacatgcc ccattggaca gatcatgcgg atacacaggt    5460
tgtgcagtat catacatact cgatcagaca ggtcgtctga ccatcataca agctgaacaa    5520
gcgctccatacttgcacgct  ctctatatac acagttaaat tacatatcca tagtctaacc    5580
tctaacagtt aatcttctgg taagcctccc agccagcctt ctggtatcgc ttggcctcct    5640
caataggatc tcggttctgg ccgtacagac ctcggccgac aattatgata tccgttccgg    5700
tagacatgac atcctcaaca gttcggtact gctgtccgag agcgtctccc ttgtcgtcaa    5760
gacccacccc gggggtcaga ataagccagt cctcagagtc gcccttaggt cggttctggg    5820
caatgaagcc aaccacaaac tcggggtcgg atcgggcaag ctcaatggtc tgcttggagt    5880
actcgccagt ggccagagag cccttgcaag acagctcggc cagcatgagc agacctctgg    5940
ccagcttctc gttgggagag gggactagga actccttgta ctgggagttc tcgtagtcag    6000
agacgtcctc cttcttctgt tcagagacag tttcctcggc accagctcgc aggccagcaa    6060
tgattccggt tccgggtaca ccgtgggcgt tggtgatatc ggaccactcg gcgattcggt    6120
gacaccggta ctggtgcttg acagtgttgc caatatctgc gaactttctg tcctcgaaca    6180
ggaagaaacc gtgcttaaga gcaagttcct tgagggggag cacagtgccg gcgtaggtga    6240
agtcgtcaat gatgtcgata tgggttttga tcatgcacac ataaggtccg accttatcgg    6300
caagctcaat gagctccttg gtggtggtaa catccagaga agcacacagg ttggttttct    6360
tggctgccac gagcttgagc actcgagcgg caaaggcgga cttgtggacg ttagctcgag    6420
cttcgtagga gggcattttg gtggtgaaga ggagactgaa ataaatttag tctgcagaac    6480
tttttatcgg aaccttatct ggggcagtga agtatatgtt atggtaatag ttacgagtta    6540
gttgaactta tagatagact ggactatacg gctatcggtc caaattagaa agaacgtcaa    6600
tggctctctg ggcgtcgcct ttgccgacaa aaatgtgatc atgatgaaag ccagcaatga    6660
cgttgcagct gatattgttg tcggccaacc gcgccgaaaa cgcagctgtc agacccacag    6720
cctccaacga agaatgtatc gtcaaagtga tccaagcaca ctcatagttg gagtcgtact    6780
ccaaaggcgg caatgacgag tcagacagat actcgtcgac gtttaaacag tgtacgcaga    6840
tctactatag aggaacattt aaattgcccc ggagaagacg gccaggccgc ctagatgaca    6900
aattcaacaa ctcacagctg actttctgcc attgccacta ggggggggcc tttttatatg    6960
gccaagccaa gctctccacg tcggttgggc tgcacccaac aataaatggg tagggttgca    7020
ccaacaaagg gatgggatgg ggggtagaag atacgaggat aacggggctc aatggcacaa    7080
ataagaacga atactgccat taagactcgt gatccagcga ctgacaccat tgcatcatct    7140
aagggcctca aaactacctc ggaactgctg cgctgatctg gacaccacag aggttccgag    7200
cactttaggt tgcaccaaat gtcccaccag gtgcaggcag aaaacgctgg aacagcgtgt    7260
acagtttgtc ttaacaaaaa gtgagggcgc tgaggtcgag cagggtggtg tgacttgtta    7320
tagcctttag agctgcgaaa gcgcgtatgg atttggctca tcaggccaga ttgagggtct    7380
gtggacacat gtcatgttag tgtacttcaa tcgccccctg gatatagccc cgacaatagg    7440
ccgtggcctc atttttttgc cttccgcaca tttccattgc tcgataccca caccttgctt    7500
ctcctgcact tgccaacctt aatactggtt tacattgacc aacatcttac aagcgggggg    7560
cttgtctagg gtatatataa acagtggctc tcccaatcgg ttgccagtct cttttttcct  7620
ttctttcccc acagattcga aatctaaact acacatcaca gaattccgag ccgtgagtat  7680
ccacgacaag atcagtgtcg agacgacgcg ttttgtgtaa tgacacaatc cgaaagtcgc  7740
tagcaacaca cactctctac acaaactaac ccagctctgg tac                    7783
 
<210>20
<211>19
<212>DNA
<213>人工序列
 
<220>
<223>引物oYFBA1
 
<400>20
acgcagatc t ac tatagag          19
 
<210>21
<211>27
<212>DNA
<213>人工序列
 
<220>
<223>引物oYFBA1-6
 
<400>21
agcggccgct ggtaccagag ctgggtt     27
 
<210>22
<211>6992
<212>DNA
<213>人工序列
 
<220>
<223>质粒pY158
 
<400>22
ggccgcaagt gtggatgggg aagtgagtgc ccggttctgt gtgcacaatt ggcaatccaa    60
gatggatgga ttcaacacag ggatatagcg agctacgtgg tggtgcgagg atatagcaac    120
ggatatttat gtttgacact tgagaatgta cgatacaagc actgtccaag tacaatacta    180
aacatactgt acatactcat actcgtaccc ggcaacggtt tcacttgagt gcagtggcta    240
gtgctcttac tcgtacagtg tgcaatactg cgtatcatag tctttgatgt atatcgtatt    300
cattcatgtt agttgcgtac gagccggaag cataaagtgt aaagcctggg gtgcctaatg    360
agtgagctaa ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct    420
gtcgtgccag ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg    480
gcgctcttcc gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc    540
ggtatcagct cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg    600
aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct    660
ggcgtttttc cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca    720
gaggtggcga aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct    780
cgtgcgctct cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc    840
gggaagcgtg gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt    900
tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc    960
cggtaactat cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc    1020
cactggtaac aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg    1080
gtggcctaac tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc    1140
agttaccttc ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag    1200
cggtggtttt tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga    1260
tcctttgatc ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat    1320
tttggtcatg agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag    1380
ttttaaatca atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat    1440
cagtgaggca cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc    1500
cgtcgtgtag ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat    1560
accgcgagac ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag    1620
ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg    1680
ccgggaagct agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc    1740
tacaggcatc gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca    1800
acgatcaagg cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg    1860
tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc    1920
actgcataat tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta    1980
ctcaaccaag tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc    2040
aatacgggat aataccgcgc cacatagcag aactttaaaa gtgctcatca ttggaaaacg    2100
ttcttcgggg cgaaaactct caaggatctt accgctgttg agatccagtt cgatgtaacc    2160
cactcgtgca cccaactgat cttcagcatc ttttactttc accagcgttt ctgggtgagc    2220
aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat    2280
actcatactc ttcctttttc aatattattg aagcatttat cagggttatt gtctcatgag    2340
cggatacata tttgaatgta tttagaaaaa taaacaaata ggggttccgc gcacatttcc    2400
ccgaaaagtg ccacctgacg cgccctgtag cggcgcatta agcgcggcgg gtgtggtggt    2460
tacgcgcagc gtgaccgcta cacttgccag cgccctagcg cccgctcctt tcgctttctt    2520
cccttccttt ctcgccacgt tcgccggctt tccccgtcaa gctctaaatc gggggctccc    2580
tttagggttc cgatttagtg ctttacggca cctcgacccc aaaaaacttg attagggtga    2640
tggttcacgt agtgggccat cgccctgata gacggttttt cgccctttga cgttggagtc    2700
cacgttcttt aatagtggac tcttgttcca aactggaaca acactcaacc ctatctcggt    2760
ctattctttt gatttataag ggattttgcc gatttcggcc tattggttaa aaaatgagct    2820
gatttaacaa aaatttaacg cgaattttaa caaaatatta acgcttacaa tttccattcg    2880
ccattcaggc tgcgcaactg ttgggaaggg cgatcggtgc gggcctcttc gctattacgc    2940
cagctggcga aagggggatg tgctgcaagg cgattaagtt gggtaacgcc agggttttcc    3000
cagtcacgac gttgtaaaac gacggccagt gaattgtaat acgactcact atagggcgaa    3060
ttgggtaccg ggccccccct cgaggtcgat ggtgtcgata agcttgatat cgaattcatg    3120
tcacacaaac cgatcttcgc ctcaaggaaa cctaattcta catccgagag actgccgaga    3180
tccagtctac actgattaat tttcgggcca ataatttaaa aaaatcgtgt tatataatat    3240
tatatgtatt atatatatac atcatgatga tactgacagt catgtcccat tgctaaatag    3300
acagactcca tctgccgcct ccaactgatg ttctcaatat ttaaggggtc atctcgcatt    3360
gtttaataat aaacagactc catctaccgc ctccaaatga tgttctcaaa atatattgta    3420
tgaacttatt tttattactt agtattatta gacaacttac ttgctttatg aaaaacactt    3480
cctatttagg aaacaattta taatggcagt tcgttcattt aacaatttat gtagaataaa    3540
tgttataaat gcgtatggga aatcttaaat atggatagca taaatgatat ctgcattgcc    3600
taattcgaaa tcaacagcaa cgaaaaaaat cccttgtaca acataaatag tcatcgagaa    3660
atatcaacta tcaaagaaca gctattcaca cgttactatt gagattatta ttggacgaga    3720
atcacacact caactgtctt tctctcttct agaaatacag gtacaagtat gtactattct    3780
cattgttcat acttctagtc atttcatccc acatattcct tggatttctc tccaatgaat    3840
gacattctat cttgcaaatt caacaattat aataagatat accaaagtag cggtatagtg    3900
gcaatcaaaa agcttctctg gtgtgcttct cgtatttatt tttattctaa tgatccatta    3960
aaggtatata tttatttctt gttatataat ccttttgttt attacatggg ctggatacat    4020
aaaggtattt tgatttaatt ttttgcttaa attcaatccc ccctcgttca gtgtcaactg    4080
taatggtagg aaattaccat acttttgaag aagcaaaaaa aatgaaagaa aaaaaaaatc    4140
gtatttccag gttagacgtt ccgcagaatc tagaatgcgg tatgcggtac attgttcttc    4200
gaacgtaaaa gttgcgctcc ctgagatatt gtacattttt gcttttacaa gtacaagtac    4260
atcgtacaac tatgtactac tgttgatgca tccacaacag tttgttttgt ttttttttgt    4320
tttttttttt tctaatgatt cattaccgct atgtatacct acttgtactt gtagtaagcc    4380
gggttattgg cgttcaatta atcatagact tatgaatctg cacggtgtgc gctgcgagtt    4440
acttttagct tatgcatgct acttgggtgt aatattggga tctgttcgga aatcaacgga    4500
tgctcaatcg atttcgacag taattaatta agtcatacac aagtcagctt tcttcgagcc    4560
tcatataagt ataagtagtt caacgtatta gcactgtacc cagcatctcc gtatcgagaa    4620
acacaacaac atgccccatt ggacagatca tgcggataca caggttgtgc agtatcatac    4680
atactcgatc agacaggtcg tctgaccatc atacaagctg aacaagcgct ccatacttgc    4740
acgctctcta tatacacagt taaattacat atccatagtc taacctctaa cagttaatct    4800
tctggtaagc ctcccagcca gccttctggt atcgcttggc ctcctcaata ggatctcggt    4860
tctggccgta cagacctcgg ccgacaatta tgatatccgt tccggtagac atgacatcct    4920
caacagttcg gtactgctgt ccgagagcgt ctcccttgtc gtcaagaccc accccggggg    4980
tcagaataag ccagtcctca gagtcgccct taggtcggtt ctgggcaatg aagccaacca    5040
caaactcggg gtcggatcgg gcaagctcaa tggtctgctt ggagtactcg ccagtggcca    5100
gagagccctt gcaagacagc tcggccagca tgagcagacc tctggccagc ttctcgttgg    5160
gagaggggac taggaactcc ttgtactggg agttctcgta gtcagagacg tcctccttct    5220
tctgttcaga gacagtttcc tcggcaccag ctcgcaggcc agcaatgatt ccggttccgg    5280
gtacaccgtg ggcgttggtg atatcggacc actcggcgat tcggtgacac cggtactggt    5340
gcttgacagt gttgccaata tctgcgaact ttctgtcctc gaacaggaag aaaccgtgct    5400
taagagcaag ttccttgagg gggagcacag tgccggcgta ggtgaagtcg tcaatgatgt    5460
cgatatgggt tttgatcatg cacacataag gtccgacctt atcggcaagc tcaatgagct    5520
ccttggtggt ggtaacatcc agagaagcac acaggttggt tttcttggct gccacgagct    5580
tgagcactcg agcggcaaag gcggacttgt ggacgttagc tcgagcttcg taggagggca    5640
ttttggtggt gaagaggaga ctgaaataaa tttagtctgc agaacttttt atcggaacct    5700
tatctggggc agtgaagtat atgttatggt aatagttacg agttagttga acttatagat  5760
agactggact atacggctat cggtccaaat tagaaagaac gtcaatggct ctctgggcgt  5820
cgcctttgcc gacaaaaatg tgatcatgat gaaagccagc aatgacgttg cagctgatat  5880
tgttgtcggc caaccgcgcc gaaaacgcag ctgtcagacc cacagcctcc aacgaagaat  5940
gtatcgtcaa agtgatccaa gcacactcat agttggagtc gtactccaaa ggcggcaatg  6000
acgagtcaga cagatactcg tcgacgttta aacagtgtac gcagatctac tatagaggaa  6060
catttaaatt gccccggaga agacggccag gccgcctaga tgacaaattc aacaactcac  6120
agctgacttt ctgccattgc cactaggggg gggccttttt atatggccaa gccaagctct  6180
ccacgtcggt tgggctgcac ccaacaataa atgggtaggg ttgcaccaac aaagggatgg  6240
gatggggggt agaagatacg aggataacgg ggctcaatgg cacaaataag aacgaatact  6300
gccattaaga ctcgtgatcc agcgactgac accattgcat catctaaggg cctcaaaact  6360
acctcggaac tgctgcgctg atctggacac cacagaggtt ccgagcactt taggttgcac  6420
caaatgtccc accaggtgca ggcagaaaac gctggaacag cgtgtacagt ttgtcttagc  6480
aaaaagtgaa ggcgctgagg tcgagcaggg tggtgtgact tgttatagcc tttagagctg  6540
cgaaagcgcg tatggatttg gctcatcagg ccagattgag ggtctgtgga cacatgtcat  6600
gttagtgtac ttcaatcgcc ccctggatat agccccgaca ataggccgtg gcctcatttt  6660
tttgccttcc gcacatttcc attgctcgat acccacacct tgcttctcct gcacttgcca  6720
accttaatac tggtttacat tgaccaacat cttacaagcg gggggcttgt ctagggtata  6780
tataaacagt ggctctccca atcggttgcc agtctctttt ttcctttctt tccccacaga  6840
ttcgaaatct aaactacaca tcacagaatt ccgagccgtg agtatccacg acaagatcag  6900
tgtcgagacg acgcgttttg tgtaatgaca caatccgaaa gtcgctagca acacacactc  6960
tctacacaaa ctaacccagc tctggtacca gc                                6992
 
<210>23
<211>8707
<212>DNA
<213>人工序列
 
<220>
<223>质粒pY159
 
<400>23
ggccgcaagt gtggatgggg aagtgagtgc ccggttctgt gtgcacaatt ggcaatccaa    60
gatggatgga ttcaacacag ggatatagcg agctacgtgg tggtgcgagg atatagcaac    120
ggatatttat gtttgacact tgagaatgta cgatacaagc actgtccaag tacaatacta    180
aacatactgt acatactcat actcgtaccc ggcaacggtt tcacttgagt gcagtggcta    240
gtgctcttac tcgtacagtg tgcaatactg cgtatcatag tctttgatgt atatcgtatt    300
cattcatgtt agttgcgtac gagccggaag cataaagtgt aaagcctggg gtgcctaatg    360
agtgagctaa ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct    420
gtcgtgccag ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg    480
gcgctcttcc gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc    540
ggtatcagct cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg    600
aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct    660
ggcgtttttc cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca    720
gaggtggcga aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct    780
cgtgcgctct cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc    840
gggaagcgtg gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt    900
tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc    960
cggtaactat cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc    1020
cactggtaac aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg    1080
gtggcctaac tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc    1140
agttaccttc ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag    1200
cggtggtttt tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga    1260
tcctttgatc ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat    1320
tttggtcatg agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag    1380
ttttaaatca atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat    1440
cagtgaggca cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc    1500
cgtcgtgtag ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat    1560
accgcgagac ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag    1620
ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg    1680
ccgggaagct agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc    1740
tacaggcatc gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca    1800
acgatcaagg cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg    1860
tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc    1920
actgcataat tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta    1980
ctcaaccaag tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc    2040
aatacgggat aataccgcgc cacatagcag aactttaaaagtgctcatca  ttggaaaacg    2100
ttcttcgggg cgaaaactct caaggatctt accgctgttg agatccagtt cgatgtaacc    2160
cactcgtgca cccaactgat cttcagcatc ttttactttc accagcgttt ctgggtgagc    2220
aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat    2280
actcatactc ttcctttttc aatattattg aagcatttat cagggttatt gtctcatgag    2340
cggatacata tttgaatgta tttagaaaaa taaacaaata ggggttccgc gcacatttcc    2400
ccgaaaagtg ccacctgacg cgccctgtag cggcgcatta agcgcggcgg gtgtggtggt    2460
tacgcgcagc gtgaccgcta cacttgccag cgccctagcg cccgctcctt tcgctttctt    2520
cccttccttt ctcgccacgt tcgccggctt tccccgtcaa gctctaaatc gggggctccc    2580
tttagggttc cgatttagtg ctttacggca cctcgacccc aaaaaacttg attagggtga    2640
tggttcacgt agtgggccat cgccctgata gacggttttt cgccctttga cgttggagtc    2700
cacgttcttt aatagtggac tcttgttcca aactggaaca acactcaacc ctatctcggt    2760
ctattctttt gatttataag ggattttgcc gatttcggcc tattggttaa aaaatgagct    2820
gatttaacaa aaatttaacg cgaattttaa caaaatatta acgcttacaa tttccattcg    2880
ccattcaggc tgcgcaactg ttgggaaggg cgatcggtgc gggcctcttc gctattacgc    2940
cagctggcga aagggggatg tgctgcaagg cgattaagtt gggtaacgcc agggttttcc    3000
cagtcacgac gttgtaaaac gacggccagt gaattgtaat acgactcact atagggcgaa    3060
ttgggtaccg ggccccccct cgaggtcgat ggtgtcgata agcttgatat cgaattcatg    3120
tcacacaaac cgatcttcgc ctcaaggaaa cctaattcta catccgagag actgccgaga    3180
tccagtctac actgattaat tttcgggcca ataatttaaa aaaatcgtgt tatataatat    3240
tatatgtatt atatatatac atcatgatga tactgacagt catgtcccat tgctaaatag    3300
acagactcca tctgccgcct ccaactgatg ttctcaatat ttaaggggtc atctcgcatt    3360
gtttaataat aaacagactc catctaccgc ctccaaatga tgttctcaaa atatattgta    3420
tgaacttatt tttattactt agtattatta gacaacttac ttgctttatg aaaaacactt    3480
cctatttagg aaacaattta taatggcagt tcgttcattt aacaatttat gtagaataaa    3540
tgttataaat gcgtatggga aatcttaaat atggatagca taaatgatat ctgcattgcc    3600
taattcgaaa tcaacagcaa cgaaaaaaat cccttgtaca acataaatag tcatcgagaa    3660
atatcaacta tcaaagaaca gctattcaca cgttactatt gagattatta ttggacgaga    3720
atcacacact caactgtctt tctctcttct agaaatacag gtacaagtat gtactattct    3780
cattgttcat acttctagtc atttcatccc acatattcct tggatttctc tccaatgaat    3840
gacattctat cttgcaaatt caacaattat aataagatat accaaagtag cggtatagtg    3900
gcaatcaaaa agcttctctg gtgtgcttct cgtatttatt tttattctaa tgatccatta    3960
aaggtatata tttatttctt gttatataat ccttttgttt attacatggg ctggatacat    4020
aaaggtattt tgatttaatt ttttgcttaa attcaatccc ccctcgttca gtgtcaactg    4080
taatggtagg aaattaccat acttttgaag aagcaaaaaa aatgaaagaa aaaaaaaatc    4140
gtatttccag gttagacgtt ccgcagaatc tagaatgcgg tatgcggtac attgttcttc    4200
gaacgtaaaa gttgcgctcc ctgagatatt gtacattttt gcttttacaa gtacaagtac    4260
atcgtacaac tatgtactac tgttgatgca tccacaacag tttgttttgt ttttttttgt    4320
tttttttttt tctaatgatt cattaccgct atgtatacct acttgtactt gtagtaagcc    4380
gggttattgg cgttcaatta atcatagact tatgaatctg cacggtgtgc gctgcgagtt    4440
acttttagct tatgcatgct acttgggtgt aatattggga tctgttcgga aatcaacgga    4500
tgctcaatcg atttcgacag taattaatta agtcatacac aagtcagctt tcttcgagcc    4560
tcatataagt ataagtagtt caacgtatta gcactgtacc cagcatctcc gtatcgagaa    4620
acacaacaac atgccccatt ggacagatca tgcggataca caggttgtgc agtatcatac    4680
atactcgatc agacaggtcg tctgaccatc atacaagctg aacaagcgct ccatacttgc    4740
acgctctcta tatacacagt taaattacat atccatagtc taacctctaa cagttaatct    4800
tctggtaagc ctcccagcca gccttctggt atcgcttggc ctcctcaata ggatctcggt    4860
tctggccgta cagacctcgg ccgacaatta tgatatccgt tccggtagac atgacatcct    4920
caacagttcg gtactgctgt ccgagagcgt ctcccttgtc gtcaagaccc accccggggg    4980
tcagaataag ccagtcctca gagtcgccct taggtcggtt ctgggcaatg aagccaacca    5040
caaactcggg gtcggatcgg gcaagctcaa tggtctgctt ggagtactcg ccagtggcca    5100
gagagccctt gcaagacagc tcggccagca tgagcagacc tctggccagc ttctcgttgg    5160
gagaggggac taggaactcc ttgtactggg agttctcgta gtcagagacg tcctccttct    5220
tctgttcaga gacagtttcc tcggcaccag ctcgcaggcc agcaatgatt ccggttccgg    5280
gtacaccgtg ggcgttggtg atatcggacc actcggcgat tcggtgacac cggtactggt    5340
gcttgacagt gttgccaata tctgcgaact ttctgtcctc gaacaggaag aaaccgtgct    5400
taagagcaag ttccttgagg gggagcacag tgccggcgta ggtgaagtcg tcaatgatgt    5460
cgatatgggt tttgatcatg cacacataag gtccgacctt atcggcaagc tcaatgagct    5520
ccttggtggt ggtaacatcc agagaagcac acaggttggt tttcttggct gccacgagct    5580
tgagcactcg agcggcaaag gcggacttgt ggacgttagc tcgagcttcg taggagggca    5640
ttttggtggt gaagaggaga ctgaaataaa tttagtctgc agaacttttt atcggaacct    5700
tatctggggc agtgaagtat atgttatggt aatagttacg agttagttga acttatagat    5760
agactggact atacggctat cggtccaaat tagaaagaac gtcaatggct ctctgggcgt    5820
cgcctttgcc gacaaaaatg tgatcatgat gaaagccagc aatgacgttg cagctgatat    5880
tgttgtcggc caaccgcgcc gaaaacgcag ctgtcagacc cacagcctcc aacgaagaat    5940
gtatcgtcaa agtgatccaa gcacactcat agttggagtc gtactccaaa ggcggcaatg    6000
acgagtcaga cagatactcg tcgacgttta aacagtgtac gcagatctac tatagaggaa    6060
catttaaatt gccccggaga agacggccag gccgcctaga tgacaaattc aacaactcac    6120
agctgacttt ctgccattgc cactaggggg gggccttttt atatggccaa gccaagctct    6180
ccacgtcggt tgggctgcac ccaacaataa atgggtaggg ttgcaccaac aaagggatgg    6240
gatggggggt agaagatacg aggataacgg ggctcaatgg cacaaataag aacgaatact    6300
gccattaaga ctcgtgatcc agcgactgac accattgcat catctaaggg cctcaaaact    6360
acctcggaac tgctgcgctg atctggacac cacagaggtt ccgagcactt taggttgcac    6420
caaatgtccc accaggtgca ggcagaaaac gctggaacag cgtgtacagt ttgtcttagc    6480
aaaaagtgaa ggcgctgagg tcgagcaggg tggtgtgact tgttatagcc tttagagctg    6540
cgaaagcgcg tatggatttg gctcatcagg ccagattgag ggtctgtgga cacatgtcat    6600
gttagtgtac ttcaatcgcc ccctggatat agccccgaca ataggccgtg gcctcatttt    6660
tttgccttcc gcacatttcc attgctcgat acccacacct tgcttctcct gcacttgcca    6720
accttaatac tggtttacat tgaccaacat cttacaagcg gggggcttgt ctagggtata    6780
tataaacagt ggctctccca atcggttgcc agtctctttt ttcctttctt tccccacaga    6840
ttcgaaatct aaactacaca tcacagaatt ccgagccgtg agtatccacg acaagatcag    6900
tgtcgagacg acgcgttttg tgtaatgaca caatccgaaa gtcgctagca acacacactc    6960
tctacacaaa ctaacccagc tctggtacca gcggccatca caagtttgta caaaaaagct    7020
gaacgagaaa cgtaaaatga tataaatatc aatatattaa attagatttt gcataaaaaa    7080
cagactacat aatactgtaa aacacaacat atccagtcat attggcggcc gcattaggca    7140
ccccaggctt tacactttat gcttccggct cgtataatgt gtggattttg agttaggatc    7200
cgtcgagatt ttcaggagct aaggaagcta aaatggagaa aaaaatcact ggatatacca    7260
ccgttgatat atcccaatgg catcgtaaag aacattttga ggcatttcag tcagttgctc    7320
aatgtaccta taaccagacc gttcagctgg atattacggc ctttttaaag accgtaaaga    7380
aaaataagca caagttttat ccggccttta ttcacattct tgcccgcctg atgaatgctc    7440
atccggaatt ccgtatggca atgaaagacg gtgagctggt gatatgggat agtgttcacc    7500
cttgttacac cgttttccat gagcaaactg aaacgttttc atcgctctgg agtgaatacc    7560
acgacgattt ccggcagttt ctacacatat attcgcaaga tgtggcgtgt tacggtgaaa    7620
acctggccta tttccctaaa gggtttattg agaatatgtt tttcgtctca gccaatccct    7680
gggtgagttt caccagtttt gatttaaacg tggccaatat ggacaacttc ttcgcccccg    7740
ttttcaccat gggcaaatat tatacgcaag gcgacaaggt gctgatgccg ctggcgattc    7800
aggttcatca tgccgtttgt gatggcttcc atgtcggcag aatgcttaat gaattacaac    7860
agtactgcga tgagtggcag ggcggggcgt aaacgcgtgg atccggctta ctaaaagcca    7920
gataacagta tgcgtatttg cgcgctgatt tttgcggtat aagaatatat actgatatgt    7980
atacccgaag tatgtcaaaa agaggtatgc tatgaagcag cgtattacag tgacagttga    8040
cagcgacagc tatcagttgc tcaaggcata tatgatgtca atatctccgg tctggtaagc    8100
acaaccatgc agaatgaagc ccgtcgtctg cgtgccgaac gctggaaagc ggaaaatcag    8160
gaagggatgg ctgaggtcgc ccggtttatt gaaatgaacg gctcttttgc tgacgagaac    8220
aggggctggt gaaatgcagt ttaaggttta cacctataaa agagagagcc gttatcgtct    8280
gtttgtggat gtacagagtg atattattga cacgcccggg cgacggatgg tgatccccct    8340
ggccagtgca cgtctgctgt cagataaagt ctcccgtgaa ctttacccgg tggtgcatat    8400
cggggatgaa agctggcgca tgatgaccac cgatatggcc agtgtgccgg tctccgttat    8460
cggggaagaa gtggctgatc tcagccaccg cgaaaatgac atcaaaaacg ccattaacct    8520
gatgttctgg ggaatataaa tgtcaggctc ccttatacac agccagtctg caggtcgacc    8580
atagtgactg gatatgttgt gttttacagc attatgtagt ctgtttttta tgcaaaatct    8640
aatttaatat attgatattt atatcatttt acgtttctcg ttcagctttc ttgtacaaag    8700
tggtgat                                                              8707
 
<210>24
<211>8219
<212>DNA
<213>人工序列
 
<220>
<223>质粒pY173
 
<220>
<221>misc_feature
<222>(8170)..(8209)
<223>n为a,c,g,或t
 
<400>24
cttgtacaaa gtggtgatgg ccgcaagtgt ggatggggaa gtgagtgccc ggttctgtgt    60
gcacaattgg caatccaaga tggatggatt caacacaggg atatagcgag ctacgtggtg    120
gtgcgaggat atagcaacgg atatttatgt ttgacacttg agaatgtacg atacaagcac    180
tgtccaagta caatactaaa catactgtac atactcatac tcgtacccgg caacggtttc    240
acttgagtgc agtggctagt gctcttactc gtacagtgtg caatactgcg tatcatagtc    300
tttgatgtat atcgtattca ttcatgttag ttgcgtacga gccggaagca taaagtgtaa    360
agcctggggt gcctaatgag tgagctaact cacattaatt gcgttgcgct cactgcccgc    420
tttccagtcg ggaaacctgt cgtgccagct gcattaatga atcggccaac gcgcggggag    480
aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt    540
cgttcggctg cggcgagcgg tatcagctcactcaaaggcgg taatacggtt atccacaga     600
atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg    660
taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa    720
aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt    780
tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct    840
gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct    900
cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc    960
cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt    1020
atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc    1080
tacagagttc ttgaagtggt ggcctaacta cggctacact agaaggacag tatttggtat    1140
ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa    1200
acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa    1260
aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga    1320
aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct    1380
tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga    1440
cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc    1500
catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct taccatctgg    1560
ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt tatcagcaat    1620
aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat ccgcctccat    1680
ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta atagtttgcg    1740
caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc    1800
attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa    1860
agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg cagtgttatc    1920
actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg taagatgctt    1980
ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc ggcgaccgag    2040
ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa ctttaaaagt    2100
gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac cgctgttgag    2160
atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt ttactttcac    2220
cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc    2280
gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa gcatttatca    2340
gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata aacaaatagg    2400
ggttccgcgc acatttcccc gaaaagtgcc acctgacgcg ccctgtagcg gcgcattaag    2460
cgcggcgggt gtggtggtta cgcgcagcgt gaccgctaca cttgccagcg ccctagcgcc    2520
cgctcctttc gctttcttcc cttcctttct cgccacgttc gccggctttc cccgtcaagc    2580
tctaaatcgg gggctccctt tagggttccg atttagtgct ttacggcacc tcgaccccaa    2640
aaaacttgat tagggtgatg gttcacgtag tgggccatcg ccctgataga cggtttttcg    2700
ccctttgacg ttggagtcca cgttctttaa tagtggactc ttgttccaaa ctggaacaac    2760
actcaaccct atctcggtct attcttttga tttataaggg attttgccga tttcggccta    2820
ttggttaaaa aatgagctga tttaacaaaa atttaacgcg aattttaaca aaatattaac    2880
gcttacaatt tccattcgcc attcaggctg cgcaactgtt gggaagggcg atcggtgcgg    2940
gcctcttcgc tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg    3000
gtaacgccag ggttttccca gtcacgacgt tgtaaaacga cggccagtga attgtaatac    3060
gactcactat agggcgaatt gggtaccggg ccccccctcg aggtcgatgg tgtcgataag    3120
cttgatatcg aattcatgtc acacaaaccg atcttcgcct caaggaaacc taattctaca    3180
tccgagagac tgccgagatc cagtctacac tgattaattt tcgggccaat aatttaaaaa    3240
aatcgtgtta tataatatta tatgtattat atatatacat catgatgata ctgacagtca    3300
tgtcccattg ctaaatagac agactccatc tgccgcctcc aactgatgtt ctcaatattt    3360
aaggggtcat ctcgcattgt ttaataataa acagactcca tctaccgcct ccaaatgatg    3420
ttctcaaaat atattgtatg aacttatttt tattacttag tattattaga caacttactt    3480
gctttatgaa aaacacttcc tatttaggaa acaatttata atggcagttc gttcatttaa    3540
caatttatgt agaataaatg ttataaatgc gtatgggaaa tcttaaatat ggatagcata    3600
aatgatatct gcattgccta attcgaaatc aacagcaacg aaaaaaatcc cttgtacaac    3660
ataaatagtc atcgagaaat atcaactatc aaagaacagc tattcacacg ttactattga    3720
gattattatt ggacgagaat cacacactca actgtctttc tctcttctag aaatacaggt    3780
acaagtatgt actattctca ttgttcatac ttctagtcat ttcatcccac atattccttg    3840
gatttctctc caatgaatga cattctatct tgcaaattca acaattataa taagatatac    3900
caaagtagcg gtatagtggc aatcaaaaag cttctctggt gtgcttctcg tatttatttt    3960
tattctaatg atccattaaa ggtatatatt tatttcttgt tatataatcc ttttgtttat    4020
tacatgggct ggatacataa aggtattttg atttaatttt ttgcttaaat tcaatccccc    4080
ctcgttcagt gtcaactgta atggtaggaa attaccatac ttttgaagaa gcaaaaaaaa    4140
tgaaagaaaa aaaaaatcgt atttccaggt tagacgttcc gcagaatcta gaatgcggta    4200
tgcggtacat tgttcttcga acgtaaaagt tgcgctccct gagatattgt acatttttgc    4260
ttttacaagt acaagtacat cgtacaacta tgtactactg ttgatgcatc cacaacagtt    4320
tgttttgttt ttttttgttt tttttttttc taatgattca ttaccgctat gtatacctac    4380
ttgtacttgt agtaagccgg gttattggcg ttcaattaat catagactta tgaatctgca    4440
cggtgtgcgc tgcgagttac ttttagctta tgcatgctac ttgggtgtaa tattgggatc    4500
tgttcggaaa tcaacggatg ctcaatcgat ttcgacagta attaattaag tcatacacaa    4560
gtcagctttc ttcgagcctc atataagtat aagtagttca acgtattagc actgtaccca    4620
gcatctccgt atcgagaaac acaacaacat gccccattgg acagatcatg cggatacaca    4680
ggttgtgcag tatcatacat actcgatcag acaggtcgtc tgaccatcat acaagctgaa    4740
caagcgctcc atacttgcac gctctctata tacacagtta aattacatat ccatagtcta    4800
acctctaaca gttaatcttc tggtaagcct cccagccagc cttctggtat cgcttggcct    4860
cctcaatagg atctcggttc tggccgtaca gacctcggcc gacaattatg atatccgttc    4920
cggtagacat gacatcctca acagttcggt actgctgtcc gagagcgtct cccttgtcgt    4980
caagacccac cccgggggtc agaataagcc agtcctcaga gtcgccctta ggtcggttct    5040
gggcaatgaa gccaaccaca aactcggggt cggatcgggc aagctcaatg gtctgcttgg    5100
agtactcgcc agtggccaga gagcccttgc aagacagctc ggccagcatg agcagacctc    5160
tggccagctt ctcgttggga gaggggacta ggaactcctt gtactgggag ttctcgtagt    5220
cagagacgtc ctccttcttc tgttcagaga cagtttcctc ggcaccagct cgcaggccag    5280
caatgattcc ggttccgggt acaccgtggg cgttggtgat atcggaccac tcggcgattc    5340
ggtgacaccg gtactggtgc ttgacagtgt tgccaatatc tgcgaacttt ctgtcctcga    5400
acaggaagaa accgtgctta agagcaagtt ccttgagggg gagcacagtg ccggcgtagg    5460
tgaagtcgtc aatgatgtcg atatgggttt tgatcatgca cacataaggt ccgaccttat    5520
cggcaagctc aatgagctcc ttggtggtgg taacatccag agaagcacac aggttggttt    5580
tcttggctgc cacgagcttg agcactcgag cggcaaaggc ggacttgtgg acgttagctc    5640
gagcttcgta ggagggcatt ttggtggtga agaggagact gaaataaatt tagtctgcag    5700
aactttttat cggaacctta tctggggcag tgaagtatat gttatggtaa tagttacgag    5760
ttagttgaac ttatagatag actggactat acggctatcg gtccaaatta gaaagaacgt    5820
caatggctct ctgggcgtcg cctttgccga caaaaatgtg atcatgatga aagccagcaa    5880
tgacgttgca gctgatattg ttgtcggcca accgcgccga aaacgcagct gtcagaccca    5940
cagcctccaa cgaagaatgt atcgtcaaag tgatccaagc acactcatag ttggagtcgt    6000
actccaaagg cggcaatgac gagtcagaca gatactcgtc gacgtttaaa cagtgtacgc    6060
agatctacta tagaggaaca tttaaattgc cccggagaag acggccaggc cgcctagatg    6120
acaaattcaa caactcacag ctgactttct gccattgcca ctaggggggg gcctttttat    6180
atggccaagc caagctctcc acgtcggttg ggctgcaccc aacaataaat gggtagggtt    6240
gcaccaacaa agggatggga tggggggtag aagatacgag gataacgggg ctcaatggca    6300
caaataagaa cgaatactgc cattaagact cgtgatccag cgactgacac cattgcatca    6360
tctaagggcc tcaaaactac ctcggaactg ctgcgctgat ctggacacca cagaggttcc    6420
gagcacttta ggttgcacca aatgtcccac caggtgcagg cagaaaacgc tggaacagcg    6480
tgtacagttt gtcttagcaa aaagtgaagg cgctgaggtc gagcagggtg gtgtgacttg    6540
ttatagcctt tagagctgcg aaagcgcgta tggatttggc tcatcaggcc agattgaggg    6600
tctgtggaca catgtcatgt tagtgtactt caatcgcccc ctggatatag ccccgacaat    6660
aggccgtggc ctcatttttt tgccttccgc acatttccat tgctcgatac ccacaccttg    6720
cttctcctgc acttgccaac cttaatactg gtttacattg accaacatct tacaagcggg    6780
gggcttgtct agggtatata taaacagtgg ctctcccaat cggttgccag tctctttttt    6840
cctttctttc cccacagatt cgaaatctaa actacacatc acagaattcc gagccgtgag    6900
tatccacgac aagatcagtg tcgagacgac gcgttttgtg taatgacaca atccgaaagt    6960
cgctagcaac acacactctc tacacaaact aacccagctc tggtaccagc ggccatcaca    7020
agtttgtaca aaaaagttgg tttttttcgg tctaaaatgg aagcagccaa agaattggtt    7080
tccatcgtcc aagaggagct ccccaaggtg gactatgccc agctttggca ggatgccagc    7140
agctgtgagg tcctttacct ctcggtggca ttcgtggcga tcaagttcat gctgcgccca    7200
ctggacctga agcgccaggc caccttgaag aagctgttca cagcatacaa cttcctcatg    7260
tcgatctatt cctttggctc cttcctggcc atggcctatg ccctatcagt aactggcatc    7320
ctctccggcg actgtgagac ggcgttcaac aacgatgtgt tcaggatcac aactcagctg    7380
ttctacctca gcaagttcgt agagtacatc gactccttct accttcccct tatggacaag    7440
ccactgtcgt tccttcagtt cttccatcat ttgggggccc ccattgacat gtggctattc    7500
tacaaatacc gcaacgaagg agtctggatc tttgtcctgt tgaatgggtt cattcactgg    7560
atcatgtacg gttactattg gacgcggctc atcaagctga acttccccat gcccaagaac    7620
ctgatcacct ccatgcagat catccagttc aatgtcgggt tctacatcgt ctggaagtac    7680
cgcaatgtgc catgctaccg ccaggatggg atgcgcatgt ttgcctggat cttcaactac    7740
tggtatgtcg ggacggtctt gctgctgttc ctcaactttt acgtgcagac gtacatccgg    7800
aagccgagga agaaccgagg gaagaaggag taggccacat ggcgcctgcg ctggaggaaa    7860
cggtacgctc ggatggtgca ctgcacttgc actccgccgt ttctagcctc ccctcgctct    7920
aaccactgcg gcatgcctgc ttgaggcgtg acgttgcctc gtatgataca gtttacaccc    7980
ttcccacagc ccacggagct ggtgactgtt tccagcgtct gcagatcatt gatctggtgc    8040
aatgtgcaca gaccaagccc ctctaacgtc ttgcggtgta ccgctcgaca ctcactgcaa    8100
gagacagatg gctgagcatg ttatagcccc ttacattcta cccttcgtcc caacctgacc    8160
gtcacattcn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnna cccaacttt     8219
 
<210>25
<211>8235
<212>DNA
<213>人工序列
 
<220>
<223>质粒pY174
 
<220>
<221>misc_feature
<222>(8186)..(8225)
<223>n为a,c,g,或t
 
<400>25
cttgtacaaa gtggtgatgg ccgcaagtgt ggatggggaa gtgagtgccc ggttctgtgt  60
gcacaattgg caatccaaga tggatggatt caacacaggg atatagcgag ctacgtggtg  120
gtgcgaggat atagcaacgg atatttatgt ttgacacttg agaatgtacg atacaagcac  180
tgtccaagta caatactaaa catactgtac atactcatac tcgtacccgg caacggtttc  240
acttgagtgc agtggctagt gctcttactc gtacagtgtg caatactgcg tatcatagtc  300
tttgatgtat atcgtattca ttcatgttag ttgcgtacga gccggaagca taaagtgtaa  360
agcctggggt gcctaatgag tgagctaact cacattaatt gcgttgcgct cactgcccgc  420
tttccagtcg ggaaacctgt cgtgccagct gcattaatga atcggccaac gcgcggggag  480
aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt  540
cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga  600
atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg  660
taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa  720
aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt  780
tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct  840
gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct  900
cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc  960
cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt  1020
atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc  1080
tacagagttc ttgaagtggt ggcctaacta cggctacact agaaggacag tatttggtat  1140
ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa  1200
acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa  1260
aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga  1320
aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct    1380
tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga    1440
cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc    1500
catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct taccatctgg    1560
ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt tatcagcaat    1620
aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat ccgcctccat    1680
ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta atagtttgcg    1740
caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc    1800
attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa    1860
agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg cagtgttatc    1920
actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg taagatgctt    1980
ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc ggcgaccgag    2040
ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa ctttaaaagt    2100
gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac cgctgttgag    2160
atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt ttactttcac    2220
cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc    2280
gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa gcatttatca    2340
gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata aacaaatagg    2400
ggttccgcgc acatttcccc gaaaagtgcc acctgacgcg ccctgtagcg gcgcattaag    2460
cgcggcgggt gtggtggtta cgcgcagcgt gaccgctaca cttgccagcg ccctagcgcc    2520
cgctcctttc gctttcttcc cttcctttct cgccacgttc gccggctttc cccgtcaagc    2580
tctaaatcgg gggctccctt tagggttccg atttagtgct ttacggcacc tcgaccccaa    2640
aaaacttgat tagggtgatg gttcacgtag tgggccatcg ccctgataga cggtttttcg    2700
ccctttgacg ttggagtcca cgttctttaa tagtggactc ttgttccaaa ctggaacaac    2760
actcaaccct atctcggtct attcttttga tttataaggg attttgccga tttcggccta    2820
ttggttaaaa aatgagctga tttaacaaaa atttaacgcg aattttaaca aaatattaac    2880
gcttacaatt tccattcgcc attcaggctg cgcaactgtt gggaagggcg atcggtgcgg    2940
gcctcttcgc tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg    3000
gtaacgccag ggttttccca gtcacgacgt tgtaaaacga cggccagtga attgtaatac    3060
gactcactat agggcgaatt gggtaccggg ccccccctcg aggtcgatgg tgtcgataag    3120
cttgatatcg aattcatgtc acacaaaccg atcttcgcct caaggaaacc taattctaca    3180
tccgagagac tgccgagatc cagtctacac tgattaattt tcgggccaat aatttaaaaa    3240
aatcgtgtta tataatatta tatgtattat atatatacat catgatgata ctgacagtca    3300
tgtcccattg ctaaatagac agactccatc tgccgcctcc aactgatgtt ctcaatattt    3360
aaggggtcat ctcgcattgt ttaataataa acagactcca tctaccgcct ccaaatgatg    3420
ttctcaaaat atattgtatg aacttatttt tattacttag tattattaga caacttactt    3480
gctttatgaa aaacacttcc tatttaggaa acaatttata atggcagttc gttcatttaa    3540
caatttatgt agaataaatg ttataaatgc gtatgggaaa tcttaaatat ggatagcata    3600
aatgatatct gcattgccta attcgaaatc aacagcaacg aaaaaaatcc cttgtacaac    3660
ataaatagtc atcgagaaat atcaactatc aaagaacagc tattcacacg ttactattga    3720
gattattatt ggacgagaat cacacactca actgtctttc tctcttctag aaatacaggt    3780
acaagtatgt actattctca ttgttcatac ttctagtcat ttcatcccac atattccttg    3840
gatttctctc caatgaatga cattctatct tgcaaattca acaattataa taagatatac    3900
caaagtagcg gtatagtggc aatcaaaaag cttctctggt gtgcttctcg tatttatttt    3960
tattctaatg atccattaaa ggtatatatt tatttcttgt tatataatcc ttttgtttat    4020
tacatgggct ggatacataa aggtattttg atttaatttt ttgcttaaat tcaatccccc    4080
ctcgttcagt gtcaactgta atggtaggaa attaccatac ttttgaagaa gcaaaaaaaa    4140
tgaaagaaaa aaaaaatcgt atttccaggt tagacgttcc gcagaatcta gaatgcggta    4200
tgcggtacat tgttcttcga acgtaaaagt tgcgctccct gagatattgt acatttttgc    4260
ttttacaagt acaagtacat cgtacaacta tgtactactg ttgatgcatc cacaacagtt    4320
tgttttgttt ttttttgttt tttttttttc taatgattca ttaccgctat gtatacctac    4380
ttgtacttgt agtaagccgg gttattggcg ttcaattaat catagactta tgaatctgca    4440
cggtgtgcgc tgcgagttac ttttagctta tgcatgctac ttgggtgtaa tattgggatc    4500
tgttcggaaa tcaacggatg ctcaatcgat ttcgacagta attaattaag tcatacacaa    4560
gtcagctttc ttcgagcctc atataagtat aagtagttca acgtattagc actgtaccca    4620
gcatctccgt atcgagaaac acaacaacat gccccattgg acagatcatg cggatacaca    4680
ggttgtgcag tatcatacat actcgatcag acaggtcgtc tgaccatcat acaagctgaa    4740
caagcgctcc atacttgcac gctctctata tacacagtta aattacatat ccatagtcta    4800
acctctaaca gttaatcttc tggtaagcct cccagccagc cttctggtat cgcttggcct    4860
cctcaatagg atctcggttc tggccgtaca gacctcggcc gacaattatg atatccgttc    4920
cggtagacat gacatcctca acagttcggt actgctgtcc gagagcgtct cccttgtcgt    498O
caagacccac cccgggggtc agaataagcc agtcctcagagtcgccctta  ggtcggttct    5040
gggcaatgaa gccaaccaca aactcggggt cggatcgggc aagctcaatg gtctgcttgg    5100
agtactcgcc agtggccaga gagcccttgc aagacagctc ggccagcatg agcagacctc    5160
tggccagctt ctcgttggga gaggggacta ggaactcctt gtactgggag ttctcgtagt    5220
cagagacgtc ctccttcttc tgttcagaga cagtttcctc ggcaccagct cgcaggccag    5280
caatgattcc ggttccgggt acaccgtggg cgttggtgat atcggaccac tcggcgattc    5340
ggtgacaccg gtactggtgc ttgacagtgt tgccaatatc tgcgaacttt ctgtcctcga    5400
acaggaagaa accgtgctta agagcaagtt ccttgagggg gagcacagtg ccggcgtagg    5460
tgaagtcgtc aatgatgtcg atatgggttt tgatcatgca cacataaggt ccgaccttat    5520
cggcaagctc aatgagctcc ttggtggtgg taacatccag agaagcacac aggttggttt    5580
tcttggctgc cacgagcttg agcactcgag cggcaaaggc ggacttgtgg acgttagctc    5640
gagcttcgta ggagggcatt ttggtggtga agaggagact gaaataaatt tagtctgcag    5700
aactttttat cggaacctta tctggggcag tgaagtatat gttatggtaa tagttacgag    5760
ttagttgaac ttatagatag actggactat acggctatcg gtccaaatta gaaagaacgt    5820
caatggctct ctgggcgtcg cctttgccga caaaaatgtg atcatgatga aagccagcaa    5880
tgacgttgca gctgatattg ttgtcggcca accgcgccga aaacgcagct gtcagaccca    5940
cagcctccaa cgaagaatgt atcgtcaaag tgatccaagc acactcatag ttggagtcgt    6000
actccaaagg cggcaatgac gagtcagaca gatactcgtc gacgtttaaa cagtgtacgc    6060
agatctacta tagaggaaca tttaaattgc cccggagaag acggccaggc cgcctagatg    6120
acaaattcaa caactcacag ctgactttct gccattgcca ctaggggggg gcctttttat    6180
atggccaagc caagctctcc acgtcggttg ggctgcaccc aacaataaat gggtagggtt    6240
gcaccaacaa agggatggga tggggggtag aagatacgag gataacgggg ctcaatggca    6300
caaataagaa cgaatactgc cattaagact cgtgatccag cgactgacac cattgcatca    6360
tctaagggcc tcaaaactac ctcggaactg ctgcgctgat ctggacacca cagaggttcc    6420
gagcacttta ggttgcacca aatgtcccac caggtgcagg cagaaaacgc tggaacagcg    6480
tgtacagttt gtcttagcaa aaagtgaagg cgctgaggtc gagcagggtg gtgtgacttg    6540
ttatagcctt tagagctgcg aaagcgcgta tggatttggc tcatcaggcc agattgaggg    6600
tctgtggaca catgtcatgt tagtgtactt caatcgcccc ctggatatag ccccgacaat    6660
aggccgtggc ctcatttttt tgccttccgc acatttccat tgctcgatac ccacaccttg    6720
cttctcctgc acttgccaac cttaatactg gtttacattg accaacatct tacaagcggg    6780
gggcttgtct agggtatata taaacagtgg ctctcccaat cggttgccag tctctttttt    6840
cctttctttc cccacagatt cgaaatctaa actacacatc acagaattcc gagccgtgag    6900
tatccacgac aagatcagtg tcgagacgac gcgttttgtg taatgacaca atccgaaagt    6960
cgctagcaac acacactctc tacacaaact aacccagctc tggtaccagc ggccatcaca    7020
agtttgtaca aaaaagttgg attttttttc ggtctaaaat ggaagcagcc aaagaattgg    7080
tttccatcgt ccaagaggag ctccccaagg tggactatgc ccagctttgg caggacgcca    7140
gcagctgtga ggtcctttac ctctcggtgg cattcgtggc gatcaagttc atgctgcgcc    7200
cactggacct gaagcgccag gccaccttga agaagctgtt cacagcatac aacttcctca    7260
tgtcgatcta ttcctttggc tccttcctgg ccatggccta tgccctatca gtaactggca    7320
tcctctccgg cgactgtgag acagcgttca acaacgatgt gttcaggatc acaactcagc    7380
tgttctacct cagcaagttc gtagagtaca tcgactcctt ctaccttccc cttatggaca    7440
agccactgtc gttccttcag ttcttccatc atttgggggc tcccattgac atgtggctat    7500
tctacaaata ccgcaacgaa ggagtctgga tctttgtcct gttgaatggg ttcattcact    7560
ggatcatgta cggttactac tggacgcggc tcatcaagct gaacttcccc atgcccaaga    7620
acctgatcac ctccatgcag atcatccagt tcaatgtcgg gttctacatc gtctggaagt    7680
accgcaatgt gccatgctac cgccaggatg ggatgcgcat gtttgcctgg atcttcaact    7740
actggtacgt cgggacggtc ttgctgctgt tcctcaactt ttacgtgcag acgtacatcc    7800
ggaagccgag gaagaaccaa gggaagaagg agtaggccac atggcgcctg cgctggagga    7860
aacggtacgc tcggatggtg cactgcactt gcactccgcc gcttctagcc tcccctcgct    7920
ctaacctctg cgacatgcct gcttgaggcg tgacgttgcc tcgtgcgata cagtttacac    7980
ccttcccatg gcccacggag caggtgactg tctccagcgt ctgcaattct gatcattggt    8040
ctggtgcaat gtgcgcagac caagcccctc taacgtcttg cggtgtaccg ctcgacactc    8100
actgcacgag acagatggct gagcatgtta tagcccctga cattctaccc ttcgtcctta    8160
cctgaccgtc acattcatgc ttaccnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn    8220
nnnnnaccca acttt                                                     8235
<210>26
<211>774
<212>DNA
<213>Euglena anabaena
 
<220>
<221>CDS
<222>(1)..(774)
<223>Δ9延伸酶(经密码子优化用于在解脂耶氏酵母属中表达)
 
<400>26
atg gag gct gcc aag gag ctg gtc tcc atc gtc cag gag gaa ctt ccc    48
Met Glu Ala Ala Lys Glu Leu Val Ser Ile Val Gln Glu Glu Leu Pro
1               5                   10                  15
aag gtg gac tac gcc cag ctc tgg cag gac gcc tcc tct tgc gag gtt    96
Lys Val Asp Tyr Ala Gln Leu Trp Gln Asp Ala Ser Ser Cys Glu Val
            20                  25                  30
ctg tac ctc tcg gtc gct ttc gtg gcc atc aag ttc atg ctt cga cct    144
Leu Tyr Leu Ser Val Ala Phe Val Ala Ile Lys Phe Met Leu Arg Pro
        35                  40                  45
ctg gac ctc aag cga caa gcc acc ctc aaa aag ctg ttc acc gca tac    192
Leu Asp Leu Lys Arg Gln Ala Thr Leu Lys Lys Leu Phe Thr Ala Tyr
    50                  55                  60
aac ttt ctc atg tcc atc tac tcg ttc ggc tcc ttc ctg gcg atg gcc    240
Asn Phe Leu Met Ser Ile Tyr Ser Phe Gly Ser Phe Leu Ala Met Ala
65                  70                  75                  80
tac gct ctc tct gtc act ggt att ctt tcc ggc gat tgt gag act gcc    288
Tyr Ala Leu Ser Val Thr Gly Ile Leu Ser Gly Asp Cys Glu Thr Ala
                85                  90                  95
ttc aac aat gac gtg ttc cga atc acc act cag ctg ttc tac ctc agc    336
Phe Asn Asn Asp Val Phe Arg Ile Thr Thr Gln Leu Phe Tyr Leu Ser
            100                 105                 110
aag ttc gtc gag tac atc gac tcc ttc tac ctt ccc ctc atg gac aag    384
Lys Phe Val Glu Tyr Ile Asp Ser Phe Tyr Leu Pro Leu Met Asp Lys
        115                 120                 125
ccc ttg tcg ttt ctg cag ttc ttt cac cat ctc gga gct ccc atc gac    432
Pro Leu Ser Phe Leu Gln Phe Phe His His Leu Gly Ala Pro Ile Asp
    130                 135                 140
atg tgg ctg ttc tac aag tat cga aac gaa ggc gtc tgg atc ttt gtt    480
Met Trp Leu Phe Tyr Lys Tyr Arg Asn Glu Gly Val Trp Ile Phe Val
145                 150                 155                 160
ctg ctc aac ggc ttc att cac tgg atc atg tac ggt tac tat tgg acg    528
Leu Leu Asn Gly Phe Ile His Trp Ile Met Tyr Gly Tyr Tyr Trp Thr
                165                 170                 175
cga ctc atc aag ctg aac ttc cct atg ccc aag aac ctc att acc tcc    576
Arg Leu Ile Lys Leu Asn Phe Pro Met Pro Lys Asn Leu Ile Thr Ser
            180                 185                 190
atg caa att atc cag ttc aac gtc gga ttc tac atc gtc tgg aag tac    624
Met Gln Ile Ile Gln Phe Asn Val Gly Phe Tyr Ile Val Trp Lys Tyr
        195                 200                 205
cga aac gtg ccc tgc tac cgg cag gac ggt atg cga atg ttt gcc tgg    672
Arg Asn Val Pro Cys Tyr Arg Gln Asp Gly Met Arg Met Phe Ala Trp
    210                 215                 220
atc ttc aac tac tgg tat gtc ggc acg gtg ctg ctt ctg ttc ctc aac    720
Ile Phe Asn Tyr Trp Tyr Val Gly Thr Val Leu Leu Leu Phe Leu Asn
225                 230                 235                 240
ttc tac gtc cag acc tac att cgg aag cct cga aag aac cga ggc aaa    768
Phe Tyr Val Gln Thr Tyr Ile Arg Lys Pro Arg Lys Asn Arg Gly Lys
                245                 250                 255
aag gag                                                            774
Lys Glu
 
<210>27
<211>258
<212>PRT
<213>Euglena anabaena
 
<400>27
 
Met Glu Ala Ala Lys Glu Leu Val Ser Ile Val Gln Glu Glu Leu Pro
1               5                   10                  15
Lys Val Asp Tyr Ala Gln Leu Trp Gln Asp Ala Ser Ser Cys Glu Val
            20                  25                  30
Leu Tyr Leu Ser Val Ala Phe Val Ala Ile Lys Phe Met Leu Arg Pro
        35                  40                  45
Leu Asp Leu Lys Arg Gln Ala Thr Leu Lys Lys Leu Phe Thr Ala Tyr
    50                  55                  60
Asn Phe Leu Met Ser Ile Tyr Ser Phe Gly Ser Phe Leu Ala Met Ala
65                  70                  75                  80
Tyr Ala Leu Ser Val Thr Gly Ile Leu Ser Gly Asp Cys Glu Thr Ala
                85                  90                  95
Phe Asn Asn Asp Val Phe Arg Ile Thr Thr Gln Leu Phe Tyr Leu Ser
            100                 105                 110
Lys Phe Val Glu Tyr Ile Asp Ser Phe Tyr Leu Pro Leu Met Asp Lys
        115                 120                 125
Pro Leu Ser Phe Leu Gln Phe Phe His His Leu Gly Ala Pro Ile Asp
    130                 135                 140
Met Trp Leu Phe Tyr Lys Tyr Arg Asn Glu Gly Val Trp Ile Phe Val
145                 150                 155                 160
Leu Leu Asn Gly Phe Ile His Trp Ile Met Tyr Gly Tyr Tyr Trp Thr
                165                 170                 175
Arg Leu Ile Lys Leu Asn Phe Pro Met Pro Lys Asn Leu Ile Thr Ser
            180                 185                 190
Met Gln Ile Ile Gln Phe Asn Val Gly Phe Tyr Ile Val Trp Lys Tyr
        195                 200                 205
Arg Asn Val Pro Cys Tyr Arg Gln Asp Gly Met Arg Met Phe Ala Trp
    210                 215                 220
Ile Phe Asn Tyr Trp Tyr Val Gly Thr Val Leu Leu Leu Phe Leu Asn
225                 230                 235                 240
Phe Tyr Val Gln Thr Tyr Ile Arg Lys Pro Arg Lys Asn Arg Gly Lys
                245                 250                 255
Lys Glu
 
<210>28
<211>3497
<212>DNA
<213>人工序列
 
<220>
<223>质粒pEaD9ES
 
<400>28
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca    60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg    120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc    180
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc    240
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat    300
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt    360
tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt cgagctcggt acctcgcgaa    420
tgcatctaga tccatggagg ctgccaagga gctggtctcc atcgtccagg aggaacttcc    480
caaggtggac tacgcccagc tctggcagga cgcctcctct tgcgaggttc tgtacctctc    540
ggtcgctttc gtggccatca agttcatgct tcgacctctg gacctcaagc gacaagccac    600
cctcaaaaag ctgttcaccg catacaactt tctcatgtcc atctactcgt tcggctcctt    660
cctggcgatg gcctacgctc tctctgtcac tggtattctt tccggcgatt gtgagactgc    720
cttcaacaat gacgtgttcc gaatcaccac tcagctgttc tacctcagca agttcgtcga    780
gtacatcgac tccttctacc ttcccctcat ggacaagccc ttgtcgtttc tgcagttctt    840
tcaccatctc ggagctccca tcgacatgtg gctgttctac aagtatcgaa acgaaggcgt    900
ctggatcttt gttctgctca acggcttcat tcactggatc atgtacggtt actattggac    960
gcgactcatc aagctgaact tccctatgcc caagaacctc attacctcca tgcaaattat    1020
ccagttcaac gtcggattct acatcgtctg gaagtaccga aacgtgccct gctaccggca    1080
ggacggtatg cgaatgtttg cctggatctt caactactgg tatgtcggca cggtgctgct    1140
tctgttcctc aacttctacg tccagaccta cattcggaag cctcgaaaga accgaggcaa    1200
aaaggagtaa gcggccgcat cggatcccgg gcccgtcgac tgcagaggcc tgcatgcaag    1260
cttggcgtaa tcatggtcat agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc    1320
acacaacata cgagccggaa gcataaagtg taaagcctgg ggtgcctaat gagtgagcta    1380
actcacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca    1440
gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg ggcgctcttc    1500
cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc    1560
tcactcaaag gcggtaatac ggttatccac agaatcaggg gataacgcag gaaagaacat    1620
gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt    1680
ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg    1740
aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc    1800
tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt    1860
ggcgctttct catagctcac gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa    1920
gctgggctgt gtgcacgaac cccccgttca gcccgaccgc tgcgccttat ccggtaacta    1980
tcgtcttgag tccaacccgg taagacacga cttatcgcca ctggcagcag ccactggtaa  2040
caggattagc agagcgaggt atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa  2100
ctacggctac actagaagaa cagtatttgg tatctgcgct ctgctgaagc cagttacctt  2160
cggaaaaaga gttggtagct cttgatccgg caaacaaacc accgctggta gcggtggttt  2220
ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag atcctttgat  2280
cttttctacg gggtctgacg ctcagtggaa cgaaaactca cgttaaggga ttttggtcat  2340
gagattatca aaaaggatct tcacctagat ccttttaaat taaaaatgaa gttttaaatc  2400
aatctaaagt atatatgagt aaacttggtc tgacagttac caatgcttaa tcagtgaggc  2460
acctatctca gcgatctgtc tatttcgttc atccatagtt gcctgactcc ccgtcgtgta  2520
gataactacg atacgggagg gcttaccatc tggccccagt gctgcaatga taccgcgaga  2580
cccacgctca ccggctccag atttatcagc aataaaccag ccagccggaa gggccgagcg  2640
cagaagtggt cctgcaactt tatccgcctc catccagtct attaattgtt gccgggaagc  2700
tagagtaagt agttcgccag ttaatagttt gcgcaacgtt gttgccattg ctacaggcat  2760
cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc tccggttccc aacgatcaag  2820
gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat  2880
cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg gttatggcag cactgcataa  2940
ttctcttact gtcatgccat ccgtaagatg cttttctgtg actggtgagt actcaaccaa  3000
gtcattctga gaatagtgta tgcggcgacc gagttgctct tgcccggcgt caatacggga  3060
taataccgcg ccacatagca gaactttaaa agtgctcatc attggaaaac gttcttcggg  3120
gcgaaaactc tcaaggatct taccgctgtt gagatccagt tcgatgtaac ccactcgtgc  3180
acccaactga tcttcagcat cttttacttt caccagcgtt tctgggtgag caaaaacagg  3240
aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa tactcatact  3300
cttccttttt caatattatt gaagcattta tcagggttat tgtctcatga gcggatacat  3360
atttgaatgt atttagaaaa ataaacaaat aggggttccg cgcacatttc cccgaaaagt  3420
gccacctgac gtctaagaaa ccattattat catgacatta acctataaaa ataggcgtat  3480
cacgaggccc tttcgtc                                                 3497
 
<210>29
<211>7769
<212>DNA
<213>人工序列
<220>
<223>质粒pZUFmEaD9ES
 
<400>29
ggccgcaagt gtggatgggg aagtgagtgc ccggttctgt gtgcacaatt ggcaatccaa  60
gatggatgga ttcaacacag ggatatagcg agctacgtgg tggtgcgagg atatagcaac  120
ggatatttat gtttgacact tgagaatgta cgatacaagc actgtccaag tacaatacta  180
aacatactgt acatactcat actcgtaccc gggcaacggt ttcacttgag tgcagtggct  240
agtgctctta ctcgtacagt gtgcaatact gcgtatcata gtctttgatg tatatcgtat  300
tcattcatgt tagttgcgta cgagccggaa gcataaagtg taaagcctgg ggtgcctaat  360
gagtgagcta actcacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc  420
tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg  480
ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag  540
cggtatcagc tcactcaaag gcggtaatac ggttatccac agaatcaggg gataacgcag  600
gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc  660
tggcgttttt ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc  720
agaggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc  780
tcgtgcgctc tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt  840
cgggaagcgt ggcgctttct catagctcac gctgtaggta tctcagttcg gtgtaggtcg  900
ttcgctccaa gctgggctgt gtgcacgaac cccccgttca gcccgaccgc tgcgccttat  960
ccggtaacta tcgtcttgag tccaacccgg taagacacga cttatcgcca ctggcagcag  1020
ccactggtaa caggattagc agagcgaggt atgtaggcgg tgctacagag ttcttgaagt  1080
ggtggcctaa ctacggctac actagaagga cagtatttgg tatctgcgct ctgctgaagc  1140
cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc accgctggta  1200
gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag  1260
atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca cgttaaggga  1320
ttttggtcat gagattatca aaaaggatct tcacctagat ccttttaaat taaaaatgaa  1380
gttttaaatc aatctaaagt atatatgagt aaacttggtc tgacagttac caatgcttaa  1440
tcagtgaggc acctatctca gcgatctgtc tatttcgttc atccatagtt gcctgactcc  1500
ccgtcgtgta gataactacg atacgggagg gcttaccatc tggccccagt gctgcaatga  1560
taccgcgaga cccacgctca ccggctccag atttatcagc aataaaccag ccagccggaa  1620
gggccgagcg cagaagtggt cctgcaactt tatccgcctc catccagtct attaattgtt    1680
gccgggaagc tagagtaagt agttcgccag ttaatagttt gcgcaacgtt gttgccattg    1740
ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc tccggttccc    1800
aacgatcaag gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt agctccttcg    1860
gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg gttatggcag    1920
cactgcataa ttctcttact gtcatgccat ccgtaagatg cttttctgtg actggtgagt    1980
actcaaccaa gtcattctga gaatagtgta tgcggcgacc gagttgctct tgcccggcgt    2040
caatacggga taataccgcg ccacatagca gaactttaaa agtgctcatc attggaaaac    2100
gttcttcggg gcgaaaactc tcaaggatct taccgctgtt gagatccagt tcgatgtaac    2160
ccactcgtgc acccaactga tcttcagcat cttttacttt caccagcgtt tctgggtgag    2220
caaaaacagg aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa    2280
tactcatact cttccttttt caatattatt gaagcattta tcagggttat tgtctcatga    2340
gcggatacat atttgaatgt atttagaaaa ataaacaaat aggggttccg cgcacatttc    2400
cccgaaaagt gccacctgac gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg    2460
ttacgcgcag cgtgaccgct acacttgcca gcgccctagc gcccgctcct ttcgctttct    2520
tcccttcctt tctcgccacg ttcgccggct ttccccgtca agctctaaat cgggggctcc    2580
ctttagggtt ccgatttagt gctttacggc acctcgaccc caaaaaactt gattagggtg    2640
atggttcacg tagtgggcca tcgccctgat agacggtttt tcgccctttg acgttggagt    2700
ccacgttctt taatagtgga ctcttgttcc aaactggaac aacactcaac cctatctcgg    2760
tctattcttt tgatttataa gggattttgc cgatttcggc ctattggtta aaaaatgagc    2820
tgatttaaca aaaatttaac gcgaatttta acaaaatatt aacgcttaca atttccattc    2880
gccattcagg ctgcgcaact gttgggaagg gcgatcggtg cgggcctctt cgctattacg    2940
ccagctggcg aaagggggat gtgctgcaag gcgattaagt tgggtaacgc cagggttttc    3000
ccagtcacga cgttgtaaaa cgacggccag tgaattgtaa tacgactcac tatagggcga    3060
attgggtacc gggccccccc tcgaggtcga tggtgtcgat aagcttgata tcgaattcat    3120
gtcacacaaa ccgatcttcg cctcaaggaa acctaattct acatccgaga gactgccgag    3180
atccagtcta cactgattaa ttttcgggcc aataatttaa aaaaatcgtg ttatataata    3240
ttatatgtat tatatatata catcatgatg atactgacag tcatgtccca ttgctaaata    3300
gacagactcc atctgccgcc tccaactgat gttctcaata tttaaggggt catctcgcat    3360
tgtttaataa taaacagact ccatctaccg cctccaaatg atgttctcaa aatatattgt    3420
atgaacttat ttttattact tagtattatt agacaactta cttgctttat gaaaaacact    3480
tcctatttag gaaacaattt ataatggcag ttcgttcatt taacaattta tgtagaataa    3540
atgttataaa tgcgtatggg aaatcttaaa tatggatagc ataaatgata tctgcattgc    3600
ctaattcgaa atcaacagca acgaaaaaaa tcccttgtac aacataaata gtcatcgaga    3660
aatatcaact atcaaagaac agctattcac acgttactat tgagattatt attggacgag    3720
aatcacacac tcaactgtct ttctctcttc tagaaataca ggtacaagta tgtactattc    3780
tcattgttca tacttctagt catttcatcc cacatattcc ttggatttct ctccaatgaa    3840
tgacattcta tcttgcaaat tcaacaatta taataagata taccaaagta gcggtatagt    3900
ggcaatcaaa aagcttctct ggtgtgcttc tcgtatttat ttttattcta atgatccatt    3960
aaaggtatat atttatttct tgttatataa tccttttgtt tattacatgg gctggataca    4020
taaaggtatt ttgatttaat tttttgctta aattcaatcc cccctcgttc agtgtcaact    4080
gtaatggtag gaaattacca tacttttgaa gaagcaaaaa aaatgaaaga aaaaaaaaat    4140
cgtatttcca ggttagacgt tccgcagaat ctagaatgcg gtatgcggta cattgttctt    4200
cgaacgtaaa agttgcgctc cctgagatat tgtacatttt tgcttttaca agtacaagta    4260
catcgtacaa ctatgtacta ctgttgatgc atccacaaca gtttgttttg tttttttttg    4320
tttttttttt ttctaatgat tcattaccgc tatgtatacc tacttgtact tgtagtaagc    4380
cgggttattg gcgttcaatt aatcatagac ttatgaatct gcacggtgtg cgctgcgagt    4440
tacttttagc ttatgcatgc tacttgggtg taatattggg atctgttcgg aaatcaacgg    4500
atgctcaatc gatttcgaca gtaattaatt aagtcataca caagtcagct ttcttcgagc    4560
ctcatataag tataagtagt tcaacgtatt agcactgtac ccagcatctc cgtatcgaga    4620
aacacaacaa catgccccat tggacagatc atgcggatac acaggttgtg cagtatcata    4680
catactcgat cagacaggtc gtctgaccat catacaagct gaacaagcgc tccatacttg    4740
cacgctctct atatacacag ttaaattaca tatccatagt ctaacctcta acagttaatc    4800
ttctggtaag cctcccagcc agccttctgg tatcgcttgg cctcctcaat aggatctcgg    4860
ttctggccgt acagacctcg gccgacaatt atgatatccg ttccggtaga catgacatcc    4920
tcaacagttc ggtactgctg tccgagagcg tctcccttgt cgtcaagacc caccccgggg    4980
gtcagaataa gccagtcctc agagtcgccc ttaggtcggt tctgggcaat gaagccaacc    5040
acaaactcgg ggtcggatcg ggcaagctca atggtctgct tggagtactc gccagtggcc    5100
agagagccct tgcaagacag ctcggccagc atgagcagac ctctggccag cttctcgttg    5160
ggagagggga ctaggaactc cttgtactgg gagttctcgt agtcagagac gtcctccttc    5220
ttctgttcag agacagtttc ctcggcacca gctcgcaggc cagcaatgat tccggttccg    5280
ggtacaccgt gggcgttggt gatatcggac cactcggcga ttcggtgaca ccggtactgg    5340
tgcttgacag tgttgccaat atctgcgaac tttctgtcct cgaacaggaa gaaaccgtgc    5400
ttaagagcaa gttccttgag ggggagcaca gtgccggcgt aggtgaagtc gtcaatgatg    5460
tcgatatggg ttttgatcat gcacacataa ggtccgacct tatcggcaag ctcaatgagc    5520
tccttggtgg tggtaacatc cagagaagca cacaggttgg ttttcttggc tgccacgagc    5580
ttgagcactc gagcggcaaa ggcggacttg tggacgttag ctcgagcttc gtaggagggc    5640
attttggtgg tgaagaggag actgaaataa atttagtctg cagaactttt tatcggaacc    5700
ttatctgggg cagtgaagta tatgttatgg taatagttac gagttagttg aacttataga    5760
tagactggac tatacggcta tcggtccaaa ttagaaagaa cgtcaatggc tctctgggcg    5820
tcgcctttgc cgacaaaaat gtgatcatga tgaaagccag caatgacgtt gcagctgata    5880
ttgttgtcgg ccaaccgcgc cgaaaacgca gctgtcagac ccacagcctc caacgaagaa    5940
tgtatcgtca aagtgatcca agcacactca tagttggagt cgtactccaa aggcggcaat    6000
gacgagtcag acagatactc gtcgacgttt aaacagtgta cgcagatcta ctatagagga    6060
acatttaaat tgccccggag aagacggcca ggccgcctag atgacaaatt caacaactca    6120
cagctgactt tctgccattg ccactagggg ggggcctttt tatatggcca agccaagctc    6180
tccacgtcgg ttgggctgca cccaacaata aatgggtagg gttgcaccaa caaagggatg    6240
ggatgggggg tagaagatac gaggataacg gggctcaatg gcacaaataa gaacgaatac    6300
tgccattaag actcgtgatc cagcgactga caccattgca tcatctaagg gcctcaaaac    6360
tacctcggaa ctgctgcgct gatctggaca ccacagaggt tccgagcact ttaggttgca    6420
ccaaatgtcc caccaggtgc aggcagaaaa cgctggaaca gcgtgtacag tttgtcttaa    6480
caaaaagtga gggcgctgag gtcgagcagg gtggtgtgac ttgttatagc ctttagagct    6540
gcgaaagcgc gtatggattt ggctcatcag gccagattga gggtctgtgg acacatgtca    6600
tgttagtgta cttcaatcgc cccctggata tagccccgac aataggccgt ggcctcattt    6660
ttttgccttc cgcacatttc cattgctcga tacccacacc ttgcttctcc tgcacttgcc    6720
aaccttaata ctggtttaca ttgaccaaca tcttacaagc ggggggcttg tctagggtat    6780
atataaacag tggctctccc aatcggttgc cagtctcttt tttcctttct ttccccacag    6840
attcgaaatc taaactacac atcacagaat tccgagccgt gagtatccac gacaagatca    6900
gtgtcgagac gacgcgtttt gtgtaatgac acaatccgaa agtcgctagc aacacacact    6960
ctctacacaa actaacccag ctctggtacc atggaggctg ccaaggagct ggtctccatc    7020
gtccaggagg aacttcccaa ggtggactac gcccagctct ggcaggacgc ctcctcttgc    7080
gaggttctgt acctctcggt cgctttcgtg gccatcaagt tcatgcttcg acctctggac    7140
ctcaagcgac aagccaccct caaaaagctg ttcaccgcat acaactttct catgtccatc    7200
tactcgttcg gctccttcct ggcgatggcc tacgctctct ctgtcactgg tattctttcc    7260
ggcgattgtg agactgcctt caacaatgac gtgttccgaa tcaccactca gctgttctac    7320
ctcagcaagt tcgtcgagta catcgactcc ttctaccttc ccctcatgga caagcccttg    7380
tcgtttctgc agttctttca ccatctcgga gctcccatcg acatgtggct gttctacaag    7440
tatcgaaacg aaggcgtctg gatctttgtt ctgctcaacg gcttcattca ctggatcatg    7500
tacggttact attggacgcg actcatcaag ctgaacttcc ctatgcccaa gaacctcatt    7560
acctccatgc aaattatcca gttcaacgtc ggattctaca tcgtctggaa gtaccgaaac    7620
gtgccctgct accggcagga cggtatgcga atgtttgcct ggatcttcaa ctactggtat    7680
gtcggcacgg tgctgcttct gttcctcaac ttctacgtcc agacctacat tcggaagcct    7740
cgaaagaacc gaggcaaaaa ggagtaagc                                      7769

Claims (12)

1.包含分离的多核苷酸的微生物宿主细胞,所述分离的多核苷酸包含:
(a)编码具有Δ9延伸酶活性的多肽的核苷酸序列,其中基于ClustalV比对方法在与SEQ ID NO:13或SEQ ID NO:14中示出的氨基酸序列进行比较时,所述多肽具有至少80%的氨基酸同一性;
(b)编码具有Δ9延伸酶活性的多肽的核苷酸序列,其中基于BLASTN比对方法在与SEQ ID NO:11、SEQ ID NO:12或SEQ ID NO:26中示出的核苷酸序列进行比较时,所述核苷酸序列具有至少80%的序列同一性;
(c)编码具有Δ9延伸酶活性的多肽的核苷酸序列,其中所述核苷酸序列在严格条件下与SEQ ID NO:11、SEQ ID NO:12或SEQ ID NO:26中示出的核苷酸序列杂交;或
(d)(a)、(b)或(c)的核苷酸序列的互补序列,其中所述互补序列与所述核苷酸序列由相同数目的核苷酸组成并且100%互补。
2.权利要求1的微生物宿主细胞,其中所述分离的多核苷酸编码SEQ ID NO:13或SEQ ID NO:14中示出的氨基酸序列。
3.权利要求1的微生物宿主细胞,其中所述微生物宿主细胞选自酵母、藻类、细菌、类眼虫、原生藻菌和真菌。
4.权利要求3的微生物宿主细胞,其中所述细胞是被孢霉属物种的真菌。
5.权利要求3的微生物宿主细胞,其中所述细胞是选自下列的原生藻菌:破囊壶菌属物种和裂殖壶菌属物种。
6.权利要求3的微生物宿主细胞,其中所述酵母是含油酵母。
7.权利要求6的微生物宿主细胞,其中所述含油酵母选自:耶氏酵母属、假丝酵母属、红酵母属、红冬孢酵母属、隐球酵母属、丝孢酵母属和油脂酵母属。
8.用于产生二十碳二烯酸的方法,所述方法包括:
a)提供微生物宿主细胞,所述微生物宿主细胞包含:
(i)编码Δ9延伸酶多肽的重组核苷酸分子,基于Clustal V比对方法在与SEQ ID NO:13或SEQ ID NO:14中示出的氨基酸序列进行比较时,所述延伸酶多肽具有至少80%的氨基酸同一性;和
(ii)亚油酸源;
b)使步骤(a)的微生物宿主细胞在使编码Δ9延伸酶多肽的核酸片段表达并使所述亚油酸转化成二十碳二烯酸的条件下生长;以及,
c)任选回收步骤(b)的二十碳二烯酸。
9.用于产生二十碳三烯酸的方法,所述方法包括:
a)提供微生物宿主细胞,所述微生物宿主细胞包含:
(i)编码Δ9延伸酶多肽的重组核苷酸分子,基于Clustal V比对方法在与SEQ ID NO:13或SEQ ID NO:14中示出的氨基酸序列进行比较时,所述延伸酶多肽具有至少80%的氨基酸同一性;和
(ii)α-亚麻酸源;
b)使步骤(a)的微生物宿主细胞在使编码Δ9延伸酶多肽的核酸片段表达并使所述α-亚麻酸转化成二十碳三烯酸的条件下生长;以及,
c)任选回收步骤(b)的二十碳三烯酸。
10.权利要求8或9的方法,其中所述微生物宿主细胞是包含如SEQID NO:26中示出的编码Δ9延伸酶多肽的重组核苷酸分子的耶氏酵母属物种,其中所述重组核苷酸分子包含至少98个经最优化以便在耶氏酵母属中表达的密码子。
11.权利要求8或9的方法,其中:
a.)所述重组核酸分子具有选自SEQ ID NO:11、SEQ ID NO:12或SEQ ID NO:26的核酸序列;并且
b.)所述宿主细胞是解脂耶氏酵母。
12.如SEQ ID NO:26中示出的编码Δ9延伸酶的分离的核酸分子,其中至少98个密码子经密码子最优化以便在耶氏酵母属物种中表达。
CN2008800203954A 2007-04-16 2008-04-16 △9延伸酶及其在制备多不饱和脂肪酸中的用途 Expired - Fee Related CN101848996B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US91192507P 2007-04-16 2007-04-16
US60/911,925 2007-04-16
PCT/US2008/060396 WO2008128241A1 (en) 2007-04-16 2008-04-16 Delta 9 elongases and their use in making polyunsaturated fatty acids

Publications (2)

Publication Number Publication Date
CN101848996A true CN101848996A (zh) 2010-09-29
CN101848996B CN101848996B (zh) 2013-05-29

Family

ID=39619289

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008800203954A Expired - Fee Related CN101848996B (zh) 2007-04-16 2008-04-16 △9延伸酶及其在制备多不饱和脂肪酸中的用途

Country Status (9)

Country Link
US (5) US8119860B2 (zh)
EP (2) EP2137304B1 (zh)
JP (1) JP5501954B2 (zh)
CN (1) CN101848996B (zh)
AU (2) AU2008240029B2 (zh)
BR (1) BRPI0807291A2 (zh)
CA (2) CA2679485A1 (zh)
DK (1) DK2137304T3 (zh)
WO (2) WO2008128241A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103080316A (zh) * 2010-08-26 2013-05-01 纳幕尔杜邦公司 突变δ9延伸酶和它们在制备多不饱和脂肪酸中的用途
CN106916796A (zh) * 2015-12-28 2017-07-04 丰益(上海)生物技术研发中心有限公司 裂殖壶菌delta-12脂肪酸脱饱和酶相关序列及其应用

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102559364B (zh) 2004-04-22 2016-08-17 联邦科学技术研究组织 用重组细胞合成长链多不饱和脂肪酸
BRPI0510132A (pt) 2004-04-22 2007-10-02 Commw Scient Ind Res Org sìntese de ácidos graxos poliinsaturados de cadeia longa por células recombinantes
EP2059588A4 (en) 2006-08-29 2010-07-28 Commw Scient Ind Res Org FATTY ACID SYNTHESIS
US8119860B2 (en) * 2007-04-16 2012-02-21 E. I. Du Pont De Nemours And Company Delta-9 elongases and their use in making polyunsaturated fatty acids
RU2507263C2 (ru) * 2007-05-25 2014-02-20 Сантори Холдингз Лимитед Новые гены ацилтрансферазы лизофосфатидной кислоты
US8168858B2 (en) 2008-06-20 2012-05-01 E. I. Du Pont De Nemours And Company Delta-9 fatty acid elongase genes and their use in making polyunsaturated fatty acids
CN114045301A (zh) 2008-11-18 2022-02-15 联邦科学技术研究组织 产生ω-3脂肪酸的酶和方法
WO2010080388A1 (en) * 2008-12-18 2010-07-15 E. I. Du Pont De Nemours And Company Reducing byproduction of malonates in a fermentation process
CA2765911C (en) 2009-06-16 2018-12-18 E.I. Du Pont De Nemours And Company High eicosapentaenoic acid oils from improved optimized strains of yarrowia lipolytica
US8188335B2 (en) * 2009-07-17 2012-05-29 Abbott Laboratories Δ9-elongase for production of polyunsaturated fatty acid-enriched oils
US20130129902A1 (en) 2009-11-03 2013-05-23 Dsm Ip Assets B.V. Composition comprising cells and a polyunsaturated fatty acid having at least 20 carbon atoms (lc-pufa)
CA2779552C (en) 2009-11-03 2019-04-09 Dsm Ip Assets B.V. Vegetable oil comprising a polyunsaturated fatty acid having at least 20 carbon atoms
EP2561050A1 (en) 2010-04-22 2013-02-27 E.I. Du Pont De Nemours And Company Method for obtaining polyunsaturated fatty acid-containing compositions from microbial biomass
CN103080317B (zh) 2010-08-26 2017-07-11 纳幕尔杜邦公司 突变型hpgg基序和hdash基序δ‑5去饱和酶以及它们在制备多不饱和脂肪酸中的用途
CN103249834B (zh) 2010-08-26 2016-10-26 纳幕尔杜邦公司 生产高水平二十碳五烯酸的重组微生物宿主细胞
CN103443266A (zh) 2010-12-30 2013-12-11 纳幕尔杜邦公司 在解脂耶氏酵母中使用啤酒糖酵母suc2基因以利用蔗糖
US20130040340A1 (en) 2011-02-07 2013-02-14 E. I. Du Pont De Nemours And Company Production of alcohol esters in situ using alcohols and fatty acids produced by microorganisms
US8816111B2 (en) 2012-06-15 2014-08-26 Commonwealth Scientific And Industrial Research Organisation Lipid comprising polyunsaturated fatty acids
JP2016502851A (ja) 2012-12-21 2016-02-01 イー・アイ・デュポン・ドウ・ヌムール・アンド・カンパニーE.I.Du Pont De Nemours And Company 微生物細胞中における脂質生成を改変するためのsou2ソルビトール利用タンパク質をコードするポリヌクレオチドの下方制御
WO2015061548A1 (en) 2013-10-25 2015-04-30 Pioneer Hi-Bred International, Inc. Stem canker tolerant soybeans and methods of use
CN104726473B (zh) 2013-12-18 2020-02-14 联邦科学技术研究组织 包含二十二碳六烯酸的提取的植物脂质
CN105219789B (zh) 2014-06-27 2023-04-07 联邦科学技术研究组织 包含二十二碳五烯酸的提取的植物脂质
CA3004914A1 (en) 2016-02-05 2017-08-10 Pioneer Hi-Bred International, Inc. Genetic loci associated with brown stem rot resistance in soybean and methods of use
US20200015500A1 (en) 2016-12-15 2020-01-16 Dsm Ip Assets B.V. Blend formulation comprising silicate and microbial and / or plant cells comprising a polyunsaturated fatty acid having at least 20 carbon atoms (lc-pufa)

Family Cites Families (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4670285A (en) 1982-08-06 1987-06-02 The University Of Toronto Innovations Foundation Infant formula
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US5107065A (en) 1986-03-28 1992-04-21 Calgene, Inc. Anti-sense regulation of gene expression in plant cells
US5188958A (en) 1986-05-29 1993-02-23 Calgene, Inc. Transformation and foreign gene expression in brassica species
US5004863B2 (en) 1986-12-03 2000-10-17 Agracetus Genetic engineering of cotton plants and lines
JP2527340B2 (ja) 1986-12-15 1996-08-21 アプライド バイオシステムズ インコーポレイテッド ロ―ダミン染料の5−及び6−スクシニミジルカルボキシレ―ト異性体
US5416011A (en) 1988-07-22 1995-05-16 Monsanto Company Method for soybean transformation and regeneration
US5366860A (en) 1989-09-29 1994-11-22 Applied Biosystems, Inc. Spectrally resolvable rhodamine dyes for nucleic acid sequence determination
AU1871492A (en) 1991-03-29 1992-11-02 Board Of Trustees Of The University Of Illinois, The Production fo transgenic soybean plants
US6372965B1 (en) 1992-11-17 2002-04-16 E.I. Du Pont De Nemours And Company Genes for microsomal delta-12 fatty acid desaturases and hydroxylases from plants
US5648564A (en) 1995-12-21 1997-07-15 Kemin Industries, Inc. Process for the formation, isolation and purification of comestible xanthophyll crystals from plants
JP4087460B2 (ja) 1997-04-11 2008-05-21 カルジーン エル エル シー 植物における長鎖多不飽和脂肪酸の合成のための方法および組成物
US6075183A (en) 1997-04-11 2000-06-13 Abbott Laboratories Methods and compositions for synthesis of long chain poly-unsaturated fatty acids in plants
US5968809A (en) 1997-04-11 1999-10-19 Abbot Laboratories Methods and compositions for synthesis of long chain poly-unsaturated fatty acids
US6051754A (en) 1997-04-11 2000-04-18 Abbott Laboratories Methods and compositions for synthesis of long chain poly-unsaturated fatty acids in plants
US6432684B1 (en) 1997-04-11 2002-08-13 Abbott Laboratories Human desaturase gene and uses thereof
US5972664A (en) 1997-04-11 1999-10-26 Abbott Laboratories Methods and compositions for synthesis of long chain poly-unsaturated fatty acids
US6403349B1 (en) 1998-09-02 2002-06-11 Abbott Laboratories Elongase gene and uses thereof
DE69935162T2 (de) 1998-12-07 2007-11-22 Washington State University Research Foundation, Pullman Desaturasen und verfahren ihrer anwendung zur synthese von mehrfach ungesättigten fettsäuren
US6825017B1 (en) 1998-12-07 2004-11-30 Washington State University Research Foundation Desaturases and methods of using them for synthesis of polyunsaturated fatty acids
WO2002000904A2 (en) 2000-06-23 2002-01-03 E. I. Du Pont De Nemours And Company Recombinant constructs and their use in reducing gene expression
JP2004513623A (ja) 2000-07-21 2004-05-13 イー・アイ・デュポン・ドウ・ヌムール・アンド・カンパニー 植物の脂肪酸におけるδ12−エポキシ基の合成に関連するシトクロムp450酵素
ATE540575T1 (de) * 2001-03-16 2012-01-15 Basf Plant Science Gmbh Regulatoren des zucker- und lipidstoffwechsels in pflanzen
GB0107510D0 (en) 2001-03-26 2001-05-16 Univ Bristol New elongase gene and a process for the production of -9-polyunsaturated fatty acids
TWI324181B (en) 2001-04-16 2010-05-01 Martek Biosciences Corp Product and process for transformation of thraustochytriales microorganisms
US6797303B2 (en) 2001-09-04 2004-09-28 Lycored Natural Products Industries Ltd. Carotenoid extraction process
WO2004057001A2 (en) * 2002-12-19 2004-07-08 University Of Bristol Method for the production of polyunsaturated fatty acids
US7129089B2 (en) 2003-02-12 2006-10-31 E. I. Du Pont De Nemours And Company Annexin and P34 promoters and use in expression of transgenic genes in plants
US20040172682A1 (en) 2003-02-12 2004-09-02 Kinney Anthony J. Production of very long chain polyunsaturated fatty acids in oilseed plants
US7125672B2 (en) * 2003-05-07 2006-10-24 E. I. Du Pont De Nemours And Company Codon-optimized genes for the production of polyunsaturated fatty acids in oleaginous yeasts
US7238482B2 (en) * 2003-05-07 2007-07-03 E. I. Du Pont De Nemours And Company Production of polyunsaturated fatty acids in oleaginous yeasts
US7259255B2 (en) 2003-06-25 2007-08-21 E. I. Du Pont De Nemours And Company Glyceraldehyde-3-phosphate dehydrogenase and phosphoglycerate mutase promoters for gene expression in oleaginous yeast
EP2169053B1 (de) 2003-08-01 2015-09-09 BASF Plant Science GmbH Verfahren zur Herstellung mehrfach ungesättigter Fettsäuren in transgenen Organismen
WO2005047479A2 (en) 2003-11-12 2005-05-26 E.I. Dupont De Nemours And Company Delta-15 desaturases suitable for altering levels of polyunsaturated fatty acids in oilseed plants and oleaginous yeast
WO2005049805A2 (en) 2003-11-14 2005-06-02 E.I. Dupont De Nemours And Company Fructose-bisphosphate aldolase regulatory sequences for gene expression in oleaginous yeast
PL1723220T3 (pl) 2004-02-27 2013-09-30 Basf Plant Science Gmbh Sposób wytwarzania wielokrotnie nienasyconych kwasów tłuszczowych w roślinach transgenicznych
BRPI0510132A (pt) 2004-04-22 2007-10-02 Commw Scient Ind Res Org sìntese de ácidos graxos poliinsaturados de cadeia longa por células recombinantes
CN102559364B (zh) 2004-04-22 2016-08-17 联邦科学技术研究组织 用重组细胞合成长链多不饱和脂肪酸
WO2006012325A1 (en) 2004-06-25 2006-02-02 E.I. Dupont De Nemours And Company Delta-8 desaturase and its use in making polyunsaturated fatty acids
US7465564B2 (en) * 2004-08-10 2008-12-16 E.I. Du Pont De Nemours And Company Production of γ-linolenic acid in oleaginous yeast
US7550286B2 (en) * 2004-11-04 2009-06-23 E. I. Du Pont De Nemours And Company Docosahexaenoic acid producing strains of Yarrowia lipolytica
DK1951866T3 (da) 2005-11-23 2014-10-27 Du Pont Delta-9-elongaser og anvendelse heraf til fremstilling af flerumættede fedtsyrer
US7465793B2 (en) * 2006-04-20 2008-12-16 E.I. Du Pont De Nemours And Company Synthetic Δ17 desaturase derived from Phytophthora ramourum and its use in making polyunsaturated fatty acids
US7943823B2 (en) 2006-04-28 2011-05-17 E.I. Du Pont De Nemours And Company Delta-8 desaturase and its use in making polyunsaturated fatty acids
US7678560B2 (en) 2006-05-17 2010-03-16 E.I. Du Pont De Nemours And Company Δ 5 desaturase and its use in making polyunsaturated fatty acids
CA2675207A1 (en) * 2007-02-12 2008-07-21 E. I. Du Pont De Nemours And Company Production of arachidonic acid in oilseed plants
CA2679988A1 (en) * 2007-04-03 2008-10-16 E. I. Du Pont De Nemours And Company Multizymes and their use in making polyunsaturated fatty acids
US8188338B2 (en) * 2007-04-10 2012-05-29 E. I. Du Pont De Nemours And Company Delta-8 desaturases and their use in making polyunsaturated fatty acids
US8119860B2 (en) * 2007-04-16 2012-02-21 E. I. Du Pont De Nemours And Company Delta-9 elongases and their use in making polyunsaturated fatty acids
US20090117253A1 (en) * 2007-10-03 2009-05-07 E. I. Du Pont De Nemours And Company Peroxisome biogenesis factor protein (pex) disruptions for altering polyunsaturated fatty acids and total lipid content in oleaginous eukaryotic organisms
EP2274429B1 (en) * 2008-04-03 2014-10-22 E. I. du Pont de Nemours and Company Multizymes
CA2779386C (en) 2009-10-30 2018-09-11 Sound Interventions, Inc. Method and apparatus for treatment of hypertension through percutaneous ultrasound renal denervation
WO2015152822A1 (en) 2014-03-31 2015-10-08 Agency For Science, Technology And Research Image processing devices and image processing methods

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103080316A (zh) * 2010-08-26 2013-05-01 纳幕尔杜邦公司 突变δ9延伸酶和它们在制备多不饱和脂肪酸中的用途
CN103080316B (zh) * 2010-08-26 2016-08-31 纳幕尔杜邦公司 突变δ9延伸酶和它们在制备多不饱和脂肪酸中的用途
CN106916796A (zh) * 2015-12-28 2017-07-04 丰益(上海)生物技术研发中心有限公司 裂殖壶菌delta-12脂肪酸脱饱和酶相关序列及其应用

Also Published As

Publication number Publication date
US20100267098A1 (en) 2010-10-21
CA2682962A1 (en) 2008-10-23
US20100162435A1 (en) 2010-06-24
US8298797B2 (en) 2012-10-30
US20120100595A1 (en) 2012-04-26
JP2010524468A (ja) 2010-07-22
WO2008128240A1 (en) 2008-10-23
EP2134837A1 (en) 2009-12-23
US20080254522A1 (en) 2008-10-16
JP5501954B2 (ja) 2014-05-28
AU2008240029A1 (en) 2008-10-23
DK2137304T3 (da) 2013-11-11
US8119860B2 (en) 2012-02-21
EP2137304B1 (en) 2013-08-14
US7794701B2 (en) 2010-09-14
CA2679485A1 (en) 2008-10-23
AU2008240029B2 (en) 2013-05-02
AU2008240028B2 (en) 2014-03-06
EP2137304A1 (en) 2009-12-30
CN101848996B (zh) 2013-05-29
US20080254195A1 (en) 2008-10-16
US8377673B2 (en) 2013-02-19
WO2008128241A1 (en) 2008-10-23
EP2134837B1 (en) 2014-01-01
BRPI0807291A2 (pt) 2014-04-29
AU2008240028A1 (en) 2008-10-23

Similar Documents

Publication Publication Date Title
CN101848996B (zh) △9延伸酶及其在制备多不饱和脂肪酸中的用途
CA2683497C (en) .delta.8 desaturases and their use in making polyunsaturated fatty acids
DK2140006T3 (en) DELTA-5 desaturases AND USE THEREOF FOR THE PRODUCTION OF polyunsaturated fatty acids
DK2087106T3 (en) MUTATING DELTA8 DESATURATION GENES CONSTRUCTED BY TARGETED MUTAGENES AND USE THEREOF IN THE MANUFACTURE OF MULTI-Saturated FAT ACIDS
CN101365788B (zh) Δ-9延伸酶及其在制备多不饱和脂肪酸中的用途
CN107002020B (zh) 使用rna引导的内切核酸酶在非常规酵母中基因靶向
CN101437953B (zh) 用于改变含油生物的多不饱和脂肪酸和油含量的二酰基甘油酰基转移酶
CN110402085A (zh) 用于生物控制植物病原体的系统和方法
DK2087105T3 (da) Delta 17-desaturase og anvendelse heraf ved fremstilling af flerumættede fedtsyrer
CN108026556A (zh) 在具有经改造的输入/输出的微生物宿主中人乳寡糖的产生
CN101646766B (zh) △17去饱和酶及其用于制备多不饱和脂肪酸的用途
KR20130138760A (ko) 고농도의 에이코사펜타엔산 생성을 위한 재조합 미생물 숙주 세포
DK2443248T3 (en) IMPROVEMENT OF LONG-CHAIN POLYUM Saturated OMEGA-3 AND OMEGA-6 FATTY ACID BIOS SYNTHESIS BY EXPRESSION OF ACYL-CoA LYSOPHOSPHOLIPID ACYL TRANSFERASES
KR20130045330A (ko) 부탄올의 생성에서 추출 발효 전에 용해되지 않은 고형물을 제거하는 방법 및 시스템
DK2931918T5 (en) PROCEDURE FOR IDENTIFYING A CELL WITH INCREASED CONCENTRATION OF A PARTICULAR METABOLIT COMPARED TO THE SIMILAR WILD TYPE CELL .....
CN101827938A (zh) 涉及rt1基因、相关的构建体和方法的具有改变的根构造的植物
KR20130132405A (ko) 형질전환 빈도를 증가시키기 위해 변형된 아그로박테리움 균주
CN101815432A (zh) 涉及编码核苷二磷酸激酶(ndk)多肽及其同源物的基因的用于修改植物根构造的方法
CN109996874A (zh) 10-甲基硬脂酸的异源性产生
KR102096592B1 (ko) 신규한 crispr 연관 단백질 및 이의 용도
CN113584033B (zh) 一种CRISPR/Cpf1基因编辑系统及其构建方法和在赤霉菌中的应用
CN101883843A (zh) 破坏过氧化物酶体生物合成因子蛋白(pex)以改变含油真核生物中多不饱和脂肪酸和总脂质含量
DK2609201T3 (en) Mutant DELTA-9 elongases AND USE THEREOF FOR THE PRODUCTION OF polyunsaturated fatty acids
DK2475679T3 (da) Forbedrede, optimerede stammer af yarrowia lipolytica til fremstilling af højkoncentreret eicosapentaensyre
CN101868545A (zh) 具有改变的根构造的植物、涉及编码富含亮氨酸重复序列激酶(llrk)多肽及其同源物的基因的相关构建体和方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130529

CF01 Termination of patent right due to non-payment of annual fee