CN108138121B - 用微生物高水平生产长链二羧酸 - Google Patents

用微生物高水平生产长链二羧酸 Download PDF

Info

Publication number
CN108138121B
CN108138121B CN201680055065.3A CN201680055065A CN108138121B CN 108138121 B CN108138121 B CN 108138121B CN 201680055065 A CN201680055065 A CN 201680055065A CN 108138121 B CN108138121 B CN 108138121B
Authority
CN
China
Prior art keywords
lcda
enzyme
seq
cell
strain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201680055065.3A
Other languages
English (en)
Other versions
CN108138121A (zh
Inventor
Q.Q.朱
X.范
S-P.洪
D.博吉奥考
D.谢
H.H.德哈曼卡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
EIDP Inc
Original Assignee
EI Du Pont de Nemours and Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by EI Du Pont de Nemours and Co filed Critical EI Du Pont de Nemours and Co
Publication of CN108138121A publication Critical patent/CN108138121A/zh
Application granted granted Critical
Publication of CN108138121B publication Critical patent/CN108138121B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/64Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
    • C12P7/6409Fatty acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/93Ligases (6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y602/00Ligases forming carbon-sulfur bonds (6.2)
    • C12Y602/01Acid-Thiol Ligases (6.2.1)
    • C12Y602/01003Long-chain-fatty-acid-CoA ligase (6.2.1.3)

Abstract

披露了包含工程化的LCDA生产途径的重组微生物细胞,所述LCDA生产途径包括至少一种上调的长链酰基辅酶A合成酶(ACoS)。这些重组微生物细胞能够从含有长链脂肪酸的底物生产一种或多种长链二羧酸(LCDA)产物。还披露了使用重组微生物细胞来生产LCDA的方法。

Description

用微生物高水平生产长链二羧酸
本申请要求美国临时申请号62/195,340(2016年7月22日提交)和62/195,338(2016年7月22日提交)的权益,这两个申请以其全文通过引用结合在此。
技术领域
本披露属于分子生物学领域。例如,本披露涉及被基因工程化以从含有脂肪酸的底物生产长链二羧酸(LCDA)的微生物(例如酵母)。
以电子方式提交的序列表的引用
该序列表的官方副本经由EFS-Web作为ASCII格式的序列表以电子方式提交,文件名为“CL6467WOPCT_SequenceListing_ST25”,创建于2016年7月18日,且具有480千字节大小,并与本说明书同时提交。包括在该ASCII格式的文件中的序列表是本说明书的一部分并且以其全文通过引用结合在此。
背景技术
包含十个或更多个碳原子的二羧酸可以被称为长链二羧酸(LCDA)。LCDA可用作各种合成材料(例如聚酰胺(尼龙)、聚氨酯、和聚酯)的组成单体。LCDA的其他用途包括,例如生产某些聚碳酸酯、粉末涂料、芳香剂、个人护理用品、食品添加剂、溶剂、清洁添加剂、热熔粘合剂、润滑剂、杀昆虫剂和杀真菌剂。例如,还可以将LCDA用作工程塑料的增塑剂和用作金属加工技术中的缓蚀剂。
通常在自然界未发现许多适合于执行诸如上文所述的商业应用的LCDA。某些LCDA(例如十二烷二酸(DDDA))可以经由各种合成过程进行制备。然而,生物过程(例如微生物发酵)还可以用于生产LCDA。含有油或游离脂肪酸的原料,例如可能适合用作发酵LCDA产物的底物。已经进行了用酵母生物催化剂发酵LCDA的努力(美国专利申请公开号2004/0146999、2010/0041115、2013/0267012、2014/0228586)。
脂肪酸可以在酵母中被活化用于β-氧化和其他下游途径,从而将脂肪酸从ω-氧化的途径中带走。因此,已经将一些酵母生物催化剂进行修饰以展示降低的脂肪酸活化,例如通过下调长链脂肪酰基辅酶A合成酶的表达,从而经由ω-氧化增加LCDA产物的发酵(例如,参见美国专利申请公开号2014/0228586和2013/0267012)。
尽管有上述披露内容,现在已经令人惊讶地发现,通过上调长链脂肪酰基辅酶A合成酶来增加酵母中的脂肪酸活化允许高LCDA生产。因此,本文披露了将微生物生物催化剂工程化用于高水平的LCDA生产。
发明内容
在一个实施例中,本披露涉及包括工程化的LCDA生产途径的重组微生物细胞,该LCDA生产途径包括编码长链酰基辅酶A合成酶(ACoS酶)的多核苷酸序列的上调,其中该微生物细胞能够从含有长链脂肪酸的底物生产一种或多种长链二羧酸(LCDA)。
另一个实施例涉及重组微生物细胞,该重组微生物细胞包括:
(i)编码细胞色素P450单加氧酶(CYP酶)的多核苷酸序列的上调和/或编码细胞色素P450还原酶(CPR酶)的多核苷酸序列的上调,
(ii)编码长链酰基辅酶A合成酶(ACoS酶)的多核苷酸序列的上调,和
(iii)下调编码过氧化物酶体生物合成因子-3的内源多核苷酸序列,
其中该微生物细胞能够从含有长链脂肪酸的底物生产一种或多种长链二羧酸(LCDA)产物。
另一种实施例涉及生产长链二羧酸(LCDA)的方法。该方法包括:a)使如在本文中披露的重组微生物细胞与含有长链脂肪酸的底物接触,其中该微生物细胞从该底物合成LCDA;并且b)任选地回收步骤(a)的LCDA。
附图和序列的简述
图1:描绘了脂质代谢途径,包括脂质代谢的脂肪酸β-氧化和ω-氧化方面。虚线/箭头表示解脂耶氏酵母(Y.lipolytica)的低或弱活性。
图2:显示用于工程化解脂耶氏酵母以从油、油衍生的脂肪酸、和/或脂肪酸酯生产LCDA的策略。
图3:来自酿酒酵母(S.cerevisiae)、解脂耶氏酵母(Y.lipolytica)和热带假丝酵母(C.tropicalis)的候选酰基辅酶A合成酶的系统树。在该图中使用的某些缩写:FAA1和FAA2分别表示酿酒酵母Faa1p和Faa2p。YA-1表示YlFaa1p。“YA-”表示“YlACoS-”。参考实例1。
图4:由菌株D0145在烧瓶试验中生产LCDA。DCA,二羧酸。参考实例2。
图5A:质粒构建体pZP2-YlACoS-3Ps(SEQ ID NO:63)。
图5B:质粒构建体pZP2-YlACoS-5Ps(SEQ ID NO:64)。
图5C:质粒构建体pZP2-YlACoS-6Ps(SEQ ID NO:65)。
图5D:质粒构建体pZP2-YlACoS-10Ps(SEQ ID NO:66)。
图5E:质粒构建体pZKL7A-FYlFAAs(SEQ ID NO:67)。
图5F:质粒构建体pZP2-YlACoS-5PS3s(SEQ ID NO:68)。
图6A:转化以过表达推定的脂肪酰基辅酶A合成酶的大肠杆菌细胞的可溶性和不可溶性部分的SDS-PAGE分析。泳道1、2、3、4、5、6:分别来自过表达YlACoS-3P(SEQ ID NO:39)、YlACoS-5P(SEQ ID NO:42)、YlACoS-6P(SEQ ID NO:44)、YlACoS-10P(SEQ ID NO:49)、YlFAA(SEQ ID NO:36)、或YlACoS-5PS3(SEQ ID NO:56)的大肠杆菌细胞的样品。泳道C:来自用单独的pET23d载体转化的大肠杆菌细胞的样品(阴性对照)。泳道M:蛋白质标记。参考实例5。
图6B:在推定的脂肪酰基辅酶A合成酶的IPTG-诱导的过表达之前和之后大肠杆菌细胞的裂解物的SDS-PAGE。泳道1、2、3、4:分别来自过表达YlACoS-3P(SEQ ID NO:39)、YlACoS-5P(SEQ ID NO:42)、YlACoS-6P(SEQ ID NO:44)、或YlACoS-10P(SEQ ID NO:49)的大肠杆菌细胞的样品。泳道C:来自用单独的pET23d载体转化的大肠杆菌细胞的样品(阴性对照)。泳道M:蛋白质标记。参考实例5。
图7A:显示了描绘在表7中列出的某些菌株谱系的图。参考实例6。
图7B:显示了描绘在本文披露的某些菌株谱系的图。
图8A:质粒构建体p12_3-B-Pex3del1(SEQ ID NO:76)。
图8B:质粒构建体p70_Pox2::Leu2(SEQ ID NO:77)。
图9A:质粒构建体pZKLY-FCtR17U(SEQ ID NO:82)。
图9B:质粒构建体pZKADn-C2F1U(SEQ ID NO:87)。
图10:在2-L发酵实验中由耶氏酵母属(Yarrowia)菌株D1308生产LCDA的时间进程。将棕榈酸乙酯用作LCDA生产的底物。菱形表示在时间进程中测量的总LCDA量,并且正方形表示C16:0 LCDA的量。参考实例8。
图11A:质粒构建体pYRH213(SEQ ID NO:92)。
图11B:质粒构建体pZSCPn-3FAOBU(SEQ ID NO:98)。
图12:在2-L发酵实验中由耶氏酵母属菌株D2300生产LCDA的时间进程。将棕榈酸乙酯用作LCDA生产的底物。正方形表示在时间进程中测量的总LCDA量,并且圆圈表示C16:0LCDA的量。参考实例9。
图13.在5-L补料分批发酵实验中由耶氏酵母属菌株D3928生产LCDA的时间进程。将棕榈酸乙酯用作LCDA生产的底物。正方形表示在时间进程中测量的总LCDA量,并且菱形表示C16:0 LCDA的量。参考实例12。
表1.核酸和蛋白质SEQ ID号的汇总
Figure BDA0001604529540000051
Figure BDA0001604529540000061
Figure BDA0001604529540000071
Figure BDA0001604529540000081
Figure BDA0001604529540000091
Figure BDA0001604529540000101
具体实施方式
本文引用的所有专利和非专利文献的披露内容以其全文通过引用结合在此。
除非另有披露,否则如本文所使用的术语“一个/一种”旨在涵盖参考特征的一个/一种或多个/多种(即至少一个/一种)。
在存在的情况下,所有范围是包含性的和可组合的,除非另有说明。例如,当列举“1至5”的范围时,所列举的范围应解释为包括“1至4”、“1至3”、“1至2”、“1至2和4至5”、“1至3和5”等范围。
本文中,术语“长链酰基辅酶A合成酶”、“长链脂肪酰基辅酶A合成酶”、“长链脂肪酸辅酶A连接酶”等可互换地使用,并且可以被缩写为“ACoS”。使用由ATP提供的能量,本文中具有EC条目6.2.1.3的ACoS酶可以催化长脂肪酸链活化为脂肪酰基辅酶A。具体地,由ACoS酶催化的反应如下(“ACoS活性”):ATP+长链羧酸酯+CoA(辅酶A)→AMP+二磷酸(PPi)+酰基辅酶A。通常,在真核细胞中ACoS酶是过氧化物酶体蛋白质。本文中编码ACoS酶的多核苷酸序列的上调导致提高量的ACoS酶的表达,该表达反过来又可用于将提高量的长链脂肪酸活化为长链酰基辅酶A。本文中ACoS酶不是“脂肪-酰基辅酶A合酶”,其具有EC条目2.3.1.86。
术语“细胞色素P450单加氧酶”,“CYP酶”等在本文中可互换地使用。本文中CYP酶可以催化二原子氧(O2)的原子转移到有机底物(通常产生醇基)上,然而其他氧原子被还原为水。CYP酶具有酶学委员会(EC)条目1.14.14.1。可以将CYP酶包含在ω-羟化酶复合物内(下文)。本文中通常将CYP酶分类为II类P450酶,其利用CPR酶用于电子传递。通常,CYP酶是膜结合的。总体上,CYP酶描述于Urlacher和Girhard(Cell[细胞]30:26-36)以及vanBogaert等人(欧洲生物化学联合会杂志(FEBS dournal)278:206-221),将其通过引用结合在此。本文中编码CYP酶的多核苷酸序列的上调导致提高量的CYP酶的表达,该表达反过来可用于形成提高量的ω-羟化酶复合物。
术语“细胞色素P450还原酶”、“NADPH-细胞色素P450还原酶”、“CPR酶”、“NADPH-高铁血红蛋白还原酶(NADPH-ferrihemoprotein reductase)”等在本文中可互换地使用。CPR酶,经由FAD(黄素腺嘌呤二核苷酸)和FMN(黄素单核苷酸)氧化还原辅因子,通过对其转移电子可以催化细胞色素P450单加氧酶中亚铁血红素-硫醇盐部分的还原。CPR酶具有EC条目1.6.2.4。可以将CPR酶包含在ω-羟化酶复合物(下文)中。通常,CPR酶是膜结合的。总体上,CPR酶功能描述于Porter和Kasper(Biochemistry[生物化学]25:1682-1687)以及Elmore和Porter(J.Biol.Chem.[生物化学杂志]277:48960-48964)中,将其通过引用结合在此。本文中编码CPR酶的多核苷酸序列的上调导致提高量的CPR酶的表达,该表达反过来可用于形成提高量的ω-羟化酶复合物。
术语“ω-羟化酶复合物”、“羟化酶复合物”、“羟化酶的酶复合物”、“CPR-P450系统”等在本文中可互换地使用。本文中ω-羟化酶复合物包含CYP酶和CPR酶,并且可以执行某些有机底物(例如烷烃、脂肪醇、脂肪醛、和脂肪酸)的ω-羟化。通常,ω-羟化酶复合物是膜结合的。在酵母的内质网(ER)膜中发生的ω-羟化典型地是ω-氧化的第一步。
术语“脂肪醇氧化酶”(FAO)、“长链脂肪酸氧化酶”、“长链醇氧化酶”、“FAO酶”等在本文中可互换地使用。FAO酶具有EC条目1.1.3.20。本文中FAO酶可以催化以下反应:脂肪醇+O2→脂肪醛+H2O2,其中脂肪醇优选地是ω-羟基长链脂肪酸,并且脂肪醛优选地是ω-醛长链脂肪酸,各自具有至少10(例如,10-24个碳)的碳链长度。通常,FAO酶是酵母细胞中的过氧化物酶体蛋白质。
术语“脂肪醇脱氢酶”(FADH)、“长链脂肪酸脱氢酶”、“ADH酶”、“FADH酶”等在本文中可互换地使用。FADH酶具有EC条目1.1.1.1。本文中FADH酶可以催化以下反应:脂肪醇+NAD+→脂肪醛+NADH,其中脂肪醇优选地是ω-羟基长链脂肪酸,并且脂肪醛优选地是ω-醛长链脂肪酸,各自具有至少10(例如,10-24个碳)的碳链长度。通常,FADH酶是酵母细胞中的内质网膜蛋白。FADH酶典型地使用Zn2+或Fe阳离子作为辅因子。
术语“脂肪醛脱氢酶”(FALDH)、“长链醛脱氢酶”、“FALDH酶”等在本文中可互换地使用。FALDH酶具有EC条目1.2.1.48。本文中FALDH酶可以催化以下反应:脂肪醛+NAD++H2O→LCDA+NADH+2H+,其中脂肪醛优选地是具有碳链长度为至少10(例如,10-24个碳)的ω-醛长链脂肪酸(在本文中进一步披露了优选的LCDA)。通常,FALDH酶是酵母细胞中的过氧化物酶体蛋白质和/或内质网膜蛋白。
本文中“工程化的LCDA生产途径”可以包括,例如:
(i)编码ACoS酶的多核苷酸序列的上调,和
(ii)编码CYP酶和/或CPR酶的多核苷酸序列的上调(即,ω-羟化酶的上调)。例如,这样的途径可以生产来自含有长链脂肪酸的底物的LCDA产物。
如本文中所使用,术语“ω-氧化”是指其中ω碳(距离脂肪酸的羧基基团最远的碳)被氧化为羧基基团的脂肪酸代谢途径(参考图1)。通过ω-羟化酶复合物进行ω-氧化的第一步,该复合物催化向ω碳中添加羟基(OH)基团,从而产生ω-羟基脂肪酸。ω-氧化的下一步包括通过脂肪醇氧化酶(例如,EC条目1.1.3.20)或脂肪醇脱氢酶(例如,EC条目1.1.1.66、1.1.1.192)将ω-羟基基团氧化为醛(C=O)基团,从而产生ω-醛脂肪酸。ω-氧化的最后一步包括通过脂肪醛脱氢酶(例如,EC条目1.2.1.3、1.2.1.48)将醛基团氧化为羧基(COOH)基团(羧酸基团),从而产生二羧酸。长链脂肪酸的ω-氧化的产物是长链二羧酸(LCDA)。
本文中术语“β-氧化”是指其中通过从脂肪酸的羧基端一次去除两个碳而分解代谢脂肪酸的过程。β-氧化典型地仅仅发生在酵母的过氧化物酶体中。过氧化物酶体是膜封闭的,是含有多种氧化还原酶的细胞质细胞器。阻断本文中脂肪酸的β-氧化可以例如通过破坏过氧化物酶体发育和/或下调一种或多种β-氧化途径酶的表达来实现。
术语“过氧化物酶体蛋白质”、“过氧化物酶体相关的蛋白质”等在本文中可互换地使用。过氧化物酶体蛋白质是参与过氧化物酶体发育和/或位于过氧化物酶体中的蛋白质,在过氧化物酶体中该蛋白质参与维持过氧化物酶体结构和/或代谢功能(例如,β-氧化途径)。本文中过氧化物酶体蛋白质的实例包括Pex蛋白质和Pox蛋白质。
术语“过氧化物酶体生物合成因子”、“过氧化物酶体生物合成因子蛋白质”、“过氧化物酶体生成蛋白(peroxin)”、“Pex蛋白质”等在本文中可互换地使用,并且是指参与过氧化物酶体生物合成和/或参与将细胞蛋白质输入过氧化物酶体中的过程的蛋白质。例如,编码Pex蛋白质的多核苷酸序列(例如基因或可读框)的缩写可以被称为“PEX”或“PEX多核苷酸”或“PEX基因”。由Distel等人(J.Cell Biol.[细胞生物学杂志]135:1-3)描述了PEX序列命名的系统。迄今为止已经在多种真核生物有机体中鉴定了至少32种不同的PEX序列。Kiel等人(Traffic[运输]7:1291-1303)鉴定了以下真菌Pex蛋白质:Pex1p、Pex2p、Pex3p、Pex3Bp、Pex4p、Pex5p、Pex5Bp、Pex5Cp、Pex5/20p、Pex6p、Pex7p、Pex8p、Pex1Op、Pex12p、Pex13p、Pex14p、Pex15p、Pex16p、Pex17p、Pex14/17p、Pex18p、Pex19p、Pex20p、Pex21p、Pex21Bp、Pex22p、Pex22p类和Pex26p。Hong等人(美国专利申请公开号2009/0117253)披露了在酵母中的某些PEX序列的下调增强了脂质和脂肪酸的积累。
本文中术语“PEX3”是指编码过氧化物酶体生物合成因子-3(Pex3蛋白[“Pex3p”])的多核苷酸序列。Pex3蛋白质是过氧化物酶体膜内在蛋白质,被认为在过氧化物酶体生物合成过程中在过氧化物酶体膜形成中发挥作用(例如,Baerends等人,J.Biol.Chem.[生物化学杂志]271:8887-8894;Bascom等人,Mol.Biol.Cell[细胞的分子生物学]14:939-957)。
术语“过氧化物酶体酰基辅酶A氧化酶”、“Pox蛋白质”、“Aox蛋白质”等在本文中可互换地使用,并且是指包含在过氧化物酶体中发生的β-氧化途径中的蛋白质。本文中属于EC条目EC:1.3.3.6的Pox蛋白质典型地催化以下反应:脂肪酰基辅酶A+O2→反式-2,3-脱氢酰基辅酶A+H2O2。编码Pox蛋白质的多核苷酸序列(例如基因或可读框)的缩写可以被称为例如“POX”、“POX多核苷酸”、或“POX基因”(例如,POX4)。Pox蛋白质的实例是Pox-1、-2、-3、-4、-5和-6。
术语“二酰基甘油酰基转移酶”、“酰基辅酶A:二酰基甘油酰基转移酶”、“二酰基甘油O-酰基转移酶”、“DGAT”、“DAGAT”等在本文中可互换地使用。DGAT酶具有EC条目2.3.1.20,并且将酰基辅酶A和1,2-二酰基甘油(DAG)转化为三酰基甘油(TAG)和辅酶A(从而参与TAG生物合成的最终步骤)。DGAT1和DGAT2是本文中DGATS的实例。DGAT1酶与酰基辅酶A:胆固醇酰基转移酶共享同源性(Lardizabal等人,J.Biol.Chem.[生物化学杂志]276:38862-38869)。
术语“香豆酰辅酶A合成酶”、“4-香豆酰辅酶A合成酶”、“4-香豆酸辅酶A连接酶”等在本文中可互换地使用。本文中具有EC条目6.2.1.12的香豆酰辅酶A合成酶可以催化以下反应(“香豆酰辅酶A合成酶活性”):ATP+4-香豆酸+辅酶A→AMP+二磷酸+4-香豆酰辅酶A。
如本文中所使用,术语“长链”是指至少10个碳原子的直链,并且典型地高达24个碳原子。例如,“长链脂肪酸”可以具有长度为10至24个碳原子的链。在长链脂肪酸的碳链中的碳原子数目由其脂肪族碳(CH3-、-CH2-、和=CH-(如果存在))和羧基基团碳(COOH)组成。
术语“长链二羧酸”(LCDA)、“长链二酸”、“长链二元酸”、“长链α,ω-二羧酸”、“长链脂肪二羧酸”等在本文中可互换地使用。LCDA由长链脂肪酸的完整的ω-氧化产生,并且因此具有α和ω羧酸基团(即,COOH在碳链的每个末端)。例如,本文中LCDA可以具有长度为10至24个碳原子的链。在LCDA的碳链中的碳原子数目由其脂肪族碳(-CH2-、和=CH-(如果存在))和两个羧基基团的碳组成。举例而言,C18:0 LCDA(18个碳的链长度,无双键)具有16个CH2和2个羧基基团;并且C18:1 LCDA(18个碳的链长度,1个双键)具有14个CH2、2个CH、和2个羧基基团。本文中LCDA优选地是线性的而没有任何脂肪族碳的有机侧链。
本文中“长链酰基辅酶A”或“长链脂肪酰基辅酶A”是指其中长链脂肪酸是在与辅酶A(CoA)的硫酯键中的化合物。长链酰基辅酶A是长链酰基辅酶A合成酶活性在长链脂肪酸底物上的产物。本文中“长链脂肪酸活化”是指经由长链酰基辅酶A合成酶活性在细胞中将长链脂肪酸转化为长链酰基辅酶A的过程。
术语“含有长链脂肪酸的底物”(long-chain fatty acid-comprisingsubstrate、substrate comprising a long-chain fatty acid)、“含有长链脂肪酸的原料”等在本文中可互换地使用。如果需要,可以将本文中从生物来源或生物衍生来源获得的任何包含长链脂肪酸的底物表征为“可再生的”或“生物可再生的”。例如,含有长链脂肪酸的底物可以包含“游离的长链脂肪酸”(例如,非酯化的或非酰胺连接的长链脂肪酸)或“连接的长链脂肪酸”(例如,酯化的或酰胺连接的长链脂肪酸)。
本文中游离的长链脂肪酸的COOH基团不涉及键,例如酯键(即,游离的长链脂肪酸是非酯化的)或酰胺键(即,游离的长链脂肪酸不是酰胺连接的)。
例如,连接的长链脂肪酸可以是“酯化的长链脂肪酸”或“酰胺连接的长链脂肪酸”。
长链脂肪酸的结构可以由“X:Y”的简单的记法系统表示,其中X是脂肪酸中碳(C)原子的总数,并且Y是双键数目(如果有的话)。例如,在美国专利号7238482中提供了关于“饱和的脂肪酸”与“不饱和的脂肪酸”、“单不饱和的脂肪酸”与“多不饱和的脂肪酸”(PUFA)、以及“ω-6脂肪酸”与“ω-3脂肪酸”之间的差异的另外的信息,将该专利通过引用结合在此。
本文中“甘油酯分子”或“甘油酯”是指分别包含一个、两个、或三个脂肪酸、与甘油(分别可替代地被称为单酰基甘油、二酰基甘油、和/或三酰基甘油)酯化的单-、二-和/或三酸甘油酯。甘油酯分子是中性脂质的实例。
本文中“脂肪酸烷基酯”是指由脂肪酸的羧基基团和烷基醇的羟基基团之间的酯键形成的酯。举例而言,本文中脂肪酸烷基酯可以是脂肪酸甲基酯,例如,该脂肪酸甲基酯通过将脂肪酸与甲醇酯化而产生。脂肪酸烷基酯是脂肪酯的实例。
如本文中所使用,“酯基”是指具有与醚键邻近的羰基基团(C=O)的有机部分。酯基的通式是:
Figure BDA0001604529540000171
关于酯化的长链脂肪酸,在酯的上式中的R包含酯化的脂肪酸的脂肪族碳原子的直链。例如,R’基团是指烷基基团、芳基基团、或其他有机基团。酯基的实例发现于分别包含一个、两个、或三个脂肪酸、与甘油酯化的单-、二-、和三酸甘油酯。关于上式,单酸甘油酯的R’基团将是指该分子的甘油部分;二酸甘油酯或三酸甘油酯的R’基团将是指分别分别进一步与一个或两个其他脂肪酸酯连接的甘油部分。
如本文中所使用,术语“脂质”是指脂溶性的(即,亲脂性的)分子。在美国专利申请公开号2009/0093543(参见其中的表2)中提供了脂质的总体概述,将该专利通过引用结合在此。在本文中可用作含有长链脂肪酸的底物的脂质的实例包括甘油酯(例如,单-、二-和三酰基甘油);脂肪酰基(例如,脂肪酯、脂肪酰胺);甘油磷脂(例如,磷脂酰胆碱、磷脂酰乙醇胺、磷脂酰丝氨酸、磷脂酰肌醇、磷脂酸);鞘脂(例如,神经酰胺、磷酸-鞘脂(例如鞘磷脂)、鞘糖脂(例如神经节苷脂和脑苷脂));以及糖脂(其中脂肪酸直接连接至糖主链的化合物)(例如,酰基氨基-糖、酰基氨基-聚醣、酰基海藻糖)。含有脂肪酸的底物可以被表征(如果需要)为含有脂肪酸的脂质。
如本文中所使用,术语“油”是指在25℃为液体的脂质;油是疏水性的,并且可溶于有机溶剂。油典型地主要由三酰基甘油组成,但是还可能含有其他中性脂质,以及磷脂和游离的脂肪酸。
如本文中所使用,术语“脂肪酸馏出物”、“油的脂肪酸馏出物”等是指包含特定类型油的脂肪酸的组合物。例如,棕榈脂肪酸馏出物包含存在于棕榈油中的脂肪酸。脂肪酸馏出物通常是植物油精炼过程的副产物。
本文中的术语“细胞”是指任何类型的细胞,例如原核细胞或真核细胞。真核细胞具有细胞核和其他膜封闭的结构(细胞器),而原核细胞缺乏细胞核。本文中的“微生物细胞”(微生物)可以是指例如真菌细胞(例如酵母细胞)、原核细胞、原生生物细胞(例如,藻类细胞)、眼虫藻细胞、原生藻菌细胞或卵菌细胞。本文中的原核细胞典型地是指细菌细胞。
本文中的术语“酵母”是指主要以单细胞形式存在的真菌物种。可替代地,酵母可以被称为“酵母细胞”。本文中的酵母可以被表征为例如常规酵母或非常规酵母。
本文中的术语“常规酵母”(“模式酵母”)通常是指酵母属(Saccharomyces)或裂殖酵母属(Schizosaccharomyces)酵母物种。在某些实施例中,常规酵母是偏爱同源重组(HR)DNA修复过程超过由非同源末端连接(NHEJ)介导的修复过程的酵母。
本文中的术语“非常规酵母”是指不是酵母属或裂殖酵母属酵母物种的任何酵母。非常规酵母描述于Non-Conventional Yeasts in Genetics,Biochemistry and Biotechnology:Practical Protocols[遗传学、生物化学和生物技术中的非常规酵母:实 践方案](K.Wolf、K.D.Breunig、G.Barth,编辑,Springer-Verlag,Berlin,Germany[德国柏林施普林格出版社],2003)以及Spencer等人(Appl.Microbiol.Biotechnol.[应用微生物与生物技术]58:147-156)中,将这些文献通过引用结合在此。非常规酵母的一些菌株可能另外地(或可替代地)是偏爱NHEJ DNA修复过程超过由HR介导的修复过程的酵母。按照这些原则,非常规酵母的定义-偏好NHEJ超过HR-被Chen等人(PLoS ONE 8:e57952,其通过引用结合在此)进一步披露。本文中优选的非常规酵母是耶氏酵母属的那些(例如解脂耶氏酵母)。
当用于描述基因或多核苷酸序列的表达时,术语“下调的”、“下调”、“破坏”、“抑制”、“失活”和“沉默”等在本文中可互换地使用,是指当多核苷酸序列的转录被降低或消除时的情况。这导致来自多核苷酸序列的RNA转录物的降低或消除,其引起源自于该多核苷酸序列的蛋白质表达的降低或消除(如果该基因包含ORF)。可替代地,下调可能是指从由多核苷酸序列产生的转录物的蛋白质翻译被降低或消除的情况。可替代地,下调可能是指由多核苷酸序列表达的蛋白质具有降低的活性的情况。在细胞中任何上述过程(转录、翻译、蛋白质活性)的降低可以是相对于合适的对照细胞中的对应过程的至少约20%、30%、40%、50%、60%、70%、80%、90%、95%或100%。例如,下调可以由靶向事件(例如,插入缺失、敲除、敲入)引起或由使用反义或RNAi技术引起。
术语“靶向”、“基因靶向”、“DNA靶向”、“编辑”、“基因编辑”和“DNA编辑”等在本文中可互换地使用。本文中的DNA靶向可以是在特定的DNA序列(例如细胞的染色体)中引入插入缺失、敲除或敲入。在微生物细胞中靶向的方式(例如,同源重组(HR))在本领域中是已知的,并且可以相应地应用。可以在酵母细胞中进行的各种HR程序,例如披露于DNA Recombination:Methods and Protocols:1st Edition[DNA重组:方法与方案(第1版)](H.Tsubouchi,编辑,Springer-Verlag,New York[纽约施普林格出版社],2011)中,将其通过引用结合在此。可以将HR过程用于在DNA靶位点处引入例如插入缺失、敲除或敲入。
术语“敲除”、“基因敲除”、“遗传敲除”、“破坏”等在本文中可互换地使用。敲除表示已经通过DNA靶向使得本文中细胞的DNA序列部分或完全无效;例如,这样的DNA序列在敲除之前可能已编码氨基酸序列,或可能已具有调节功能(例如启动子)。例如,敲除表示用于提供DNA序列缺失的特定方式。敲除可以例如通过诱变过程(例如导致插入缺失形成)或通过特异性去除序列(例如通过HR)产生,并且减少或完全破坏DNA序列(例如编码蛋白质和/或其调节序列的多核苷酸)的功能。本文中敲除的DNA多核苷酸序列还可以被表征为被部分或完全破坏了或被部分或完全下调了。
术语“敲入”、“基因敲入”、“遗传敲入”等在本文中可互换地使用。敲入表示通过DNA靶向在细胞中的特定DNA序列上DNA序列的置换或插入。敲入的实例包括将异源性氨基酸编码序列特异性插入多核苷酸序列和/或其调节序列的蛋白质编码区中。例如,这样的插入可能导致靶向的序列的下调。例如,敲入可能通过序列的特异性插入(例如,通过HR)产生。
本文中的术语“插入缺失”是指在靶DNA序列中插入或缺失一个或多个核苷酸碱基。这样的插入或缺失可以是例如1、2、3、4、5、6、7、8、9、10或更多个碱基。在某些实施例中,插入缺失可以甚至更大,至少约20、30、40、50、60、70、80、90或100个碱基。如果在基因的可读框(ORF)中引入插入缺失,通常该插入缺失会通过产生移码突变来破坏由ORF编码的蛋白质的野生型表达。例如,使用诱变过程可以产生插入缺失。
术语“体积百分比”(percent by volume和volume percent)、“vol%”、“v/v%”等在本文中可互换地使用。在溶液中溶质的体积百分比可以使用以下公式确定:[(溶质体积)/(溶液体积)]×100%。
术语“重量百分比”(percent by weight)、“重量百分比(weight percentage,wt%)”、“重量-重量百分比(%w/w)”等在本文中可互换地使用。重量百分比是指当包含在组合物、混合物或溶液中时,材料在质量基础上的百分比。
术语“多核苷酸”、“多核苷酸序列”、“核酸序列”等在本文中可互换地使用。这些术语涵盖核苷酸序列等。多核苷酸可以是单链或双链的DNA或RNA的聚合物,其任选地包含合成的、非天然的或改变的核苷酸碱基。多核苷酸可以由cDNA、基因组DNA、合成DNA或其混合物的一个或多个区段组成。核苷酸(核糖核苷酸或脱氧核糖核苷酸)可以按单字母名称简称如下:“A”表示腺苷酸或脱氧腺苷酸(分别用于RNA或DNA),“C”表示胞苷酸或脱氧胞苷酸(分别用于RNA或DNA),“G”表示鸟苷酸或脱氧鸟苷酸(分别用于RNA或DNA),“U”表示尿苷酸(用于RNA),“T”表示脱氧胸苷酸(用于DNA),“R”表示嘌呤(A或G),“Y”表示嘧啶(C或T),“K”表示G或T,“H”表示A或C或T,“I”表示肌苷,“W”表示A或T,并且“N”表示任何核苷酸(例如,如果提及DNA序列,N可以是A、C、T或G;如果提及RNA序列,N可以是A、C、U或G)。
如本文中所使用,术语“基因”是指从编码区表达RNA(RNA从DNA多核苷酸序列转录)的DNA多核苷酸序列,该RNA可以是信使RNA(编码蛋白质)或非蛋白质编码RNA。基因可以是指单独的编码区,或者可以包括编码区上游和/或下游的调节序列(例如启动子、5’-非翻译区、3’-转录终止子区)。可替代地,编码蛋白质的编码区在本文中可以被称为“可读框”(ORF)。“天然”或“内源”的基因是指自然界中发现的具有其自身调节序列的基因;这样的基因位于宿主细胞基因组中的天然位置。“嵌合”基因是指不是天然基因的任何基因,该基因包括在自然界中未一起发现的调节序列和编码序列(即,调节区和编码区彼此是异源的)。因此,嵌合基因可以包含源自于不同来源的调节序列和编码序列,或者包含源自于同一来源但以不同于天然存在的方式排列的调节序列和编码序列。“外来”或“异源”的基因是指通过基因转移引入宿主生物体的基因。外来/异源基因可以包含插入非天然生物体内的天然基因、引入天然宿主内的新位置的天然基因、或嵌合基因。在某些实施例中本文披露的多核苷酸序列是异源的。“转基因”是通过基因递送程序(例如,转化)已经引入基因组中的基因。“密码子优化的”可读框的密码子使用频率被设计为模拟宿主细胞的优选密码子使用的频率。
本文中包含在细胞或生物体中的“非天然”氨基酸序列或多核苷酸序列不会发生在这样的细胞或生物体的天然的(自然的)对应物中。
如本文中所使用,“调节序列”是指位于基因转录起始位点(例如启动子)上游的核苷酸序列、5’非翻译区、内含子和3’非编码区,并且该调节序列可能影响转录、加工或稳定性、和/或从该基因转录的RNA的翻译。本文中,调节序列可以包括启动子、增强子、沉默子、5′非翻译前导序列、内含子、聚腺苷酸化识别序列、RNA加工位点、效应子结合位点、茎环结构以及涉及调节基因表达的其他元件。本文中的一个或多个调节元件可以与本文中的编码区异源。
如本文中所使用的“启动子”是指能够控制从基因转录RNA的DNA序列。通常,启动子序列位于基因的转录起始位点的上游。启动子可以全部来源于天然基因,或者由源自于在自然界发现的不同启动子的不同元件构成,或者甚至包含合成的DNA区段。在所有情况下在多数时候引起基因在细胞中表达的启动子通常称为“组成型启动子”。本文中的一个或多个启动子可以与本文中的编码区异源。
如本文中所使用,“诱导型启动子”是指在某些特定条件下(即,通过生物或非生物因子的存在或不存在)能够控制从基因转录RNA的启动子。这些类型的启动子在诱导条件不存在的条件下典型地不具有或具有非常低的活性。
如本文中所使用的“强启动子”是指可以指导每单位时间相对大量的生产性启动的启动子,和/或是驱动比在细胞中基因的平均转录水平更高的基因转录水平的启动子。
如本文中所使用,术语“3’非编码序列”、“转录终止子”和“终止子”是指位于编码序列下游的DNA序列。这包括多腺苷酸化识别序列和编码能够影响mRNA加工或基因表达的调节信号的其他序列。
术语“盒”、“表达盒”、“基因盒”等在本文中可互换地使用。盒可以是指启动子有效地连接至编码蛋白质编码RNA或非蛋白质编码RNA的DNA序列。盒可以任选地有效地连接至3′非编码序列。本文中盒的结构可以任选地由“X::Y::Z”的简单的记法系统来表示。具体地,X描述启动子,Y描述编码序列,并且Z描述终止子(任选的);X有效地连接至Y,并且Y有效地连接至Z。
如本文中所使用,术语“表达”是指(i)从编码区转录RNA(例如,mRNA或非蛋白质编码RNA),和/或(ii)从mRNA翻译多肽。在某些实施例中,多核苷酸序列的编码区的表达可以被上调或下调。
如本文中所使用,术语“有效地连接”是指两个或更多个核酸序列的缔合,这样使得一个核酸序列的功能受到另一个核酸序列的影响。例如,当启动子能够影响编码序列的表达时,该启动子与该编码序列有效地连接。即,编码序列处于启动子的转录控制下。例如,编码序列可以与一个(例如,启动子)或多个(例如,启动子和终止子)调节序列有效地连接。
当本文中用于表征DNA序列例如质粒、载体或构建体时,术语“重组”是指例如通过化学合成和/或通过用基因工程技术操纵分离的核酸区段来将两个原本分离的序列区段进行人工组合。本文中用于制备重组构建体/载体的方法可以遵循标准的重组DNA和分子克隆技术,如由J.Sambrook和D.Raroell(Molecular Cloning:A Laboratorv Manual[分子克 隆:实验手册],第3版,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY[纽约冷泉港冷泉港实验室出版社],2001);T.J.Silhavy等人(Experiments with Gene Fusions[使用基因融合的实验],冷泉港实验室出版社:冷泉港,纽约州,1984);以及F.M.Ausubel等人(Short Protocols in Molecular Biology[简明分子生物学试验方案],第5版,Current Protocols[当前试验方案],John Wiley and Sons,Inc.,NY[纽约州约翰威利父子公司],2002)描述的。
如本文中所使用,术语“转化”是指通过任何方法将核酸分子转移到宿主生物体或宿主细胞中。已经转化到生物体/细胞中的核酸分子可以是在生物体/细胞中自主复制、或整合到生物体/细胞的基因组中、或瞬时存在于细胞中而不进行复制或整合的核酸分子。在本文中披露了适合于转化的核酸分子的非限制性实例,例如质粒和线性DNA分子。本文中含有转化核酸序列的宿主生物体/细胞可以被称为例如“转基因的”、“重组的”、“转化的”、“工程化的”、被称为“转化体”、和/或被称为“被修饰用于外源基因表达”。
可以通过任何标准技术将包含本文所述的多核苷酸的构建体或载体引入细胞中。这些技术包括例如转化(例如,乙酸锂转化[Methods in Enzymology[酶学方法],194:186-187(1991)])、基因枪冲击、电穿孔和显微注射。作为一个实例,美国专利号4880741和5071764,以及Chen等人(1997,Appl.Microbiol.Biotechnol.[应用微生物学与生物技术]48:232-235),披露了基于DNA的线性化片段针对解脂耶氏酵母的整合技术。
术语“对照细胞”和“合适的对照细胞”在本文中可互换地使用,并且可以关于已经进行了特定修饰(例如,多核苷酸的过表达、多核苷酸的下调)的细胞(即,“实验细胞”)进行参比。对照细胞可以是不具有或不表达实验细胞的特定修饰的任何细胞。因此,对照细胞可以是未转化的野生型细胞,或者可以进行遗传转化但不表达特定修饰。例如,对照细胞可以是实验细胞的直接亲本,该直接亲本细胞不具有在实验细胞中的特定修饰。可替代地,对照细胞可以是通过一个或多个世代移除的实验细胞的亲本。仍可替代地,对照细胞可以是实验细胞的同胞,该同胞不包括存在于实验细胞中的特定修饰。对照细胞可以任选地被表征为在修饰成为实验细胞之前存在的细胞。
如本文中所使用,关于多核苷酸或多肽序列的术语“序列同一性”或“同一性”是指在两个序列中的核酸碱基或氨基酸残基当在指定的比较窗口上比对最大对应度时是相同的。因此,“序列同一性百分比”或“百分比同一性”是指通过在比较窗口上比较两个最佳比对的序列所确定的值,其中与参比序列(其不包含添加或缺失)比较两个序列的最佳比对时,该多核苷酸或多肽序列在比较窗口中的部分可以包含添加或缺失(即空位)。通过以下方式计算该百分比:确定在两个序列中出现相同核酸碱基或氨基酸残基的位置的数目以产生匹配位置的数目,将匹配位置的数目除以比较窗口中的位置的总数目,然后将该结果乘以100以产生序列同一性百分比。应当理解,当计算DNA序列和RNA序列之间的序列同一性时,DNA序列的T残基与RNA序列的U残基比对,并且可以被认为与其“同一”。出于确定第一和第二多核苷酸的百分比互补性的目的,可以通过确定(i)第一多核苷酸和第二多核苷酸的互补序列之间的百分比同一性(或反之亦然),例如和/或(ii)将产生规范的沃森和克里克碱基对的第一和第二多核苷酸之间的碱基百分比来获得。
可以使用在美国国家生物技术信息中心(NCRI)网站上在线获得的基本局部比对搜索工具(BLAST),例如,来测量在两个或更多个多核苷酸序列(BLASTN算法)或多肽序列(BLASTP算法)之间的百分比同一性。可替代地,使用Clustal算法(例如,ClustalW、ClustalV或Clustal-欧米加)可以进行序列之间的百分比同一性比对。对于使用Clustal比对方法的多重比对,默认值可以对应于空位罚分(GAP PENALTY)=10和空位长度罚分(GAPLENGTH PENALTY)=10。使用Clustal方法进行逐对比对和蛋白质序列的百分比同一性计算的默认参数可以是KTUPLE=1、空位罚分=3、窗口(WINDOW)=5、以及存储的对角线(DIAGONALS SAVED)=5。对于核酸,这些参数可以是KTUPLE=2、空位罚分=5、窗口=4、以及存储的对角线=4。仍可替代地,序列之间的百分比同一性可以使用BLOSUM矩阵(例如,BLOSUM62),使用具有参数例如空位开始(GAP OPEN)=10、空位延伸(GAP EXTEND)=0.5、最终空位罚分(END GAP PENALTY)=错误(false)、最终空位开始(END GAP OPEN)=10、最终空位延伸(END GAP EXTEND)=0.5的EMBOSS算法(例如,needle)来执行。
本文中,与第二序列“互补”的第一序列可替代地可以被称为处于第二序列的“反义”取向。
作为某些实施例的特征,本文披露了各种多肽氨基酸序列和多核苷酸序列。可以使用或引用与本文披露的序列具有至少约70%-85%、85%-90%、或90%-95%同一性的这些序列的变体。可替代地,变体氨基酸序列或多核苷酸序列可以与本文披露的序列具有至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。变体氨基酸序列或多核苷酸序列具有所披露的序列的相同功能/活性,或具有所披露的序列的功能/活性的至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的功能/活性。典型地,本文披露的不以甲硫氨酸开始的任何多肽氨基酸序列可以在氨基酸序列的N-末端进一步包含至少一个起始甲硫氨酸。
在本文披露的蛋白质的每个氨基酸位置处的所有氨基酸残基都是实例。鉴于某些氨基酸彼此共享类似的结构和/或电荷特征(即,保守的),本文中蛋白质的每个位置处的氨基酸可以是如所披露的序列中提供的或被如下保守的氨基酸残基取代(“保守的氨基酸取代”):
1.以下小脂肪族的、非极性的或轻微极性的残基可以相互取代:Ala(A)、Ser(S)、Thr(T)、Pro(P)、Gly(G);
2.以下极性的、带负电荷的残基和它们的酰胺可以相互取代:Asp(D)、Asn(N)、Glu(E)、Gln(Q);
3.以下极性的、带正电荷的残基可以相互取代:His(H)、Arg(R)、Lys(K);
4.以下脂肪族的、非极性的残基可以相互取代:Ala(A)、Leu(L)、Ile(I)、Val(V)、Cys(C)、Met(M);和
5.以下大的芳香族残基可以相互取代:Phe(F)、Tyr(Y)、Trp(W)。
如本文中所使用,术语“分离的”是指已经从其天然来源完全或部分纯化的多核苷酸或多肽分子。在一些情况下,分离的多核苷酸或多肽分子是更大的组合物、缓冲系统或试剂混合物的一部分。例如,分离的多核苷酸或多肽分子能以异源方式包含在细胞或生物体内。在自然界中不会出现这样的含有异源组分和/或一种或多种遗传缺失的细胞或生物体。本文中“分离的”还可以表征合成的/人造的,和/或具有非天然存在的性质的实施例。
如本文中所使用的术语“增加”可以是指比该增加的量或活性与之进行比较的量或活性多至少约1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、50%、100%、或200%的量或活性。术语“增加的”、“提高的”、“增强的”、“大于”、“改进的”等在本文中可互换地使用。例如,可以将这些术语用于表征编码蛋白质的多核苷酸的“过表达”或“上调”。
具有增强的LCDA发酵能力的新的微生物生物催化剂是令人希望的。因此,本文披露的一些实施例涉及包括工程化的LCDA生产途径的重组微生物细胞,该LCDA生产途径包括编码长链酰基辅酶A合成酶(ACoS酶)的多核苷酸序列的上调。值得注意的是,这样的微生物细胞可以从含有长链脂肪酸的底物产生一种或多种长链二羧酸(LCDA)产物。
本文披露的一些实施例涉及重组微生物细胞(例如酵母细胞),包括:
(i)编码细胞色素P450单加氧酶(CYP酶)的多核苷酸序列的上调和/或编码细胞色素P450还原酶(CPR酶)的多核苷酸序列的上调,
(ii)编码长链酰基辅酶A合成酶(ACoS酶)的多核苷酸序列的上调,和
(iii)下调编码过氧化物酶体生物合成因子-3的内源多核苷酸序列。
值得注意的是,这样的微生物细胞可以从含有长链脂肪酸的底物产生一种或多种长链二羧酸(LCDA)产物。
通过编码该酶的多核苷酸的上调对本文中重组细胞中的ACoS酶进行上调被认为导致细胞中的长链酰基辅酶A的水平增加。此代谢产物的这样的增加反映出细胞中长链脂肪酸活化的水平增加。
在本文的某些方面,对ACoS酶的上调可以通过上调编码ACoS酶的多核苷酸序列来进行。可以通过各种方法中的一种或多种来完成这样的上调,该上调导致ACoS酶的过表达。例如,可以将编码ACoS的多核苷酸以多拷贝瞬时地或稳定地提供给细胞(将这样的多核苷酸序列有效地连接至启动子序列[例如,异源启动子])。通过向细胞提供一个或多个拷贝(例如,至少1、2、3、4、5、6、7、8、9、10、15、20、25、或50个拷贝)的多核苷酸可以实现以多拷贝提供多核苷酸序列。应当理解,与以瞬时方式提供的多核苷酸序列相比,以稳定方式提供的多核苷酸序列典型地具有较低拷贝数。作为另一个实例,通过有效地连接至组成型启动子、强启动子、或诱导型启动子(这些启动子中的任一个可以是异源的)可以上调编码ACoS的多核苷酸序列。
可以任选地考虑,相对于合适的对照细胞,本文中的细胞中的ACoS酶的上调(例如,过表达)。例如,在本文中细胞中的ACoS酶的水平增加可以被表征为高于合适的对照细胞中的ACoS酶的表达至少约5%、10%、20%、30%、40%、50%、60%、75%、80%、90%、100%、150%、200%、500%、或1000%。合适的对照细胞的实例是在其被修饰以具有上调的ACoS酶表达之前存在的细胞(例如亲本细胞)。
例如,本文中的ACoS酶对细胞而言可以是异源的。异源的ACoS酶的实例可以是来源于与其中ACoS酶被上调的细胞的物种或菌株不同的物种或菌株的那种。
可替代地,在细胞中被上调的ACoS酶对细胞而言可以是天然的。例如,使用上文关于多核苷酸序列上调所披露的任何方式,可以对天然的ACoS酶进行上调。例如,可以将对细胞而言是天然的编码该酶的多核苷酸序列(有效地连接至启动子序列[例如,异源启动子])以稳定的或瞬时的方式提供给细胞(但多核苷酸序列的位置将位于非天然位点[即,异源位点])。作为另一个实例,可以将天然存在于细胞基因组中的编码ACoS酶的多核苷酸序列进行修饰,这样使得一种或多种天然多核苷酸序列过表达。这可以例如,通过修饰含有编码ACoS酶的多核苷酸序列的基因的一种或多种调节元件(例如,启动子)实现。
在本文中的细胞中通过提供两组、三组、四组、或更多组(拷贝)编码一种或多种ACoS酶的多核苷酸序列,可以任选地将一种、两种、三种、四种、或更多种ACoS酶进行上调。例如,通过引入(i)编码相同ACoS酶的多核苷酸序列的多个拷贝,和/或(ii)编码不同ACoS酶的多核苷酸序列(例如,过表达酵母属ACoS和耶氏酵母属ACoS二者)可以将ACoS酶提供给细胞。
本文中的ACoS酶可以来源于真核生物,例如像,如下披露的任何真核生物:本文中的真核生物可以是动物、植物、真菌、或原生生物。本文中的动物可以是例如哺乳动物、鸟类、两栖动物、爬行动物、鱼类或无脊椎动物(例如,昆虫、甲壳动物、软体动物、线虫)。本文中的哺乳动物可以是例如人类或啮齿动物(例如小鼠、大鼠)。本文中的植物可以是例如单子叶植物或双子叶植物。本文中的单子叶植物的实例包括玉米、水稻、黑麦、高粱、粟、小麦、甘蔗、燕麦、大麦和柳枝稷。本文中的双子叶植物的实例包括大豆、低芥酸菜籽、苜蓿、烟草、拟南芥属(例如,拟南芥(A.thaliana)、琴叶拟南芥(A.lyrata))、向日葵、棉花、花生、番茄、马铃薯和巢菜(common vetch)(例如,箭舌豌豆)。本文中的真菌可以是例如担子菌纲(Basidiomycetes)、接合菌纲(Zygomycetes)、壶菌纲(Chytridiomycetes)或子囊菌纲(Ascomycetes)真菌。在某些实施例中真菌可以是酵母或丝状真菌。酵母的实例包括以下披露的那些物种中的任一个(例如,耶氏酵母属物种,例如解脂耶氏酵母;假丝酵母属物种,例如热带假丝酵母;酵母属物种,例如酿酒酵母),在本文的某些方面,可以将这些物种用于制备重组酵母细胞。本文中的丝状真菌的实例包括以下属的那些物种:支顶孢属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、金孢子菌属(Chrysosporium)、丛赤壳属(Cryphonectria)、隐球菌属(Cryptococcus)、线黑粉菌属(Filibasidium)、镰孢霉属(Fusarium)、赤霉菌属(Gibberella)、腐质霉属(Humicola)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、脉孢菌属(Neurospora)、青霉属(Penicillium)、梨囊鞭菌属(Piromyces)、柱顶孢霉属(Scytalidium)、裂褶菌属(Schizophyllum)、侧孢霉属(Sporotrtchum)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、和木霉属(Trichoderma)。本文中的原生生物的实例包括藻类细胞(例如,绿藻、褐藻、红藻)以及纤毛纲(Ciliata)、鞭毛纲(Mastigophora)亚门(鞭毛虫)、植鞭毛纲(Phytomastigophorea)、动鞭纲(Zoomastigophorea)、根足纲(Rhizopoda)总纲、叶足纲(Lobosea)、和真胶丝菌纲(Eumycetozoea)的原生生物。
在某些实施例中,ACoS酶可以来源于原核生物,例如像,如下披露的任何原核生物:本文中的原核生物可以是例如细菌或古细菌。细菌的实例包括那些是革兰氏阴性和革兰氏阳性的细菌。细菌的仍其他的实例包括以下属的那些:无色杆菌属(Achromobacter)、氨基酸球菌属(Acidaminococcus)、不动杆菌属(Acinetobacter)、放线杆菌属(Actinobacillus)、马杜拉放线菌属(Actinomadura)、放线菌属(Actinomyces)、气球菌属(Aerococcus)、气单胞菌属(Aeromonas)、阿菲波菌属(Afipia)、农杆菌属(Agrobacterium)、产碱杆菌属(Alcaligenes)、隐秘杆菌属(Arcanobacterium)、弓形杆菌属(Arcobacter)、芽孢杆菌属(Bacillus)(例如,枯草芽孢杆菌(B.subtilis)、巨大芽孢杆菌(B.megaterium))、拟杆菌属(Bacteroides)、巴尔通氏体属(Bartonella)、双歧杆菌属(Bifidobacterium)、嗜胆菌属(Bilophila)、博代氏杆菌属(Bordetella)、包柔氏螺旋体属(Borrelia)、布鲁氏菌属(Brucella)、鞘杆菌属(Calymmatobacterium)、弯曲菌属(Campylobacter)、心杆菌属(Cardiobacterium)、衣原体(Chlamydiae)、单胞菌属(Chryseomonas)、柠檬酸杆菌属(Citrobacter)、梭菌属(Clostridium)、丛毛单胞菌属(Comamonas)、粪球菌属(Coprococcus)、柯克斯氏体属(Coxiella)、棒状杆菌属(Corynebacterium)、爱德华菌属(Edwardsiella)、埃立克体属(Ehrlichia)、艾肯菌属(Eikenella)、肠杆菌属(Enterobacter)、肠球菌属(Enterococcus)、丹毒丝菌属(Erysipelothrix)、埃希氏杆菌属(Escherichia)(例如,大肠杆菌(E.coli))、真细菌属(Eubacterium)、爱文氏菌属(Ewingella)、黄色单胞菌属(Flavimonas)、黄杆菌属(Flavobacterium)、弗朗西斯氏菌属(Franciesella)、梭菌属(Fusobacterium)、加德纳菌属(Gardnerella)、孪生菌属(Gemella)、嗜血杆菌属(Haemophilus)、哈夫尼菌属(Hafnia)、螺杆菌属(Helicobacter)(例如,幽门螺杆菌(H.pylori))、克雷伯菌属(Klebsiella)、克吕沃氏菌属(Kluyvera)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、军团菌属(Legionella)、钩端螺旋体属(Leptospira)、纤毛菌属(Leptotrichia)、明串珠菌属(Leuconostoc)、李斯特菌属(Listeria)、巨型球菌属(Megasphaera)、分支杆菌属(Mycobacterium)、微球菌属(Micrococcus)、小多孢菌属(Micropolysporas)、动弯杆菌属(Mobiluncus)、莫拉克斯氏菌属(Moraxella)、摩根氏菌属(Morganella)、支原体(Mycoplasma)、奈瑟氏菌属(Neisseria)、诺卡氏菌(Norcardia)、拟诺卡氏菌属(Norcardiopsis)、寡源杆菌属(Oligella)、巴斯德菌属(Pasteurella)、片球菌属(Pedicoccus)、消化球菌属(Peptococcus)、消化链球菌属(Peptostreptococcus)、动性球菌属(Planococcus)、毗邻单胞菌属(Plessiomonas)、卟啉单胞菌属(Porphyromonas)、普氏菌属(Prevotella)、变形杆菌属(Proteus)、普罗维登斯菌属(Providencia)、丙酸菌属(Propionibacterium)、假单胞菌属(Pseudomonas)、红球菌属(Rhodococcus)、立克次氏体(Rickettsia)、罗沙利马体属(Rochalimaea)、罗氏菌属(Rothia)、瘤胃球菌属(Ruminococcus)、Sarcinia、沙门氏菌属(Salmonella)、希瓦氏菌属(Shewanella)、志贺氏菌属(Shigella)、沙雷氏菌属(Serratia)、螺菌属(Spirillum)、葡萄球菌属(Staphylococcus)、口腔球菌属(Stomatococcus)、链杆菌属(Streptobacillus)、链球菌属(Streptococcus)、链霉菌属(Streptomyces)、高温放线菌属(Thermoactinomycetes)、密螺旋体属(Treponema)、脲原体属(Ureaplasma)、韦荣氏球菌属(Veillonella)、弧菌属(Vibrio)、威克斯氏菌属(Weeksella)、沃廉菌属(Wolinella)、黄单胞菌属(Xanthomonas)、或耶尔森氏菌属(Yersinia)。
在一些实施例中,ACoS酶可以被表征为是微生物的(即,来源于:细菌细胞;原生生物细胞(例如藻类细胞);真菌细胞(例如酵母细胞);眼虫藻细胞;原生藻菌(stramenopile)细胞;或卵菌细胞)。
本文中的ACoS酶的氨基酸序列可以包含,例如,在以下基因库登录号中披露的任一个氨基酸序列:XP_503862.1、XP_503608.1、XP_502959.1、AJT71734.1、NP_014962.3、AJU13255.1、NP_010931.3、EWG91402.1、EJT42092.1、NP_001153101.1、NP_001273637.1、XP_001146361.1、XP_003829365.1、XP_004033324.1、NP_001125625.1、XP_003266954.1、XP_001363547.2、XP_007422758.1、XP_002880290.1、NP_631034.1、O14975.2、CAH21295.1、CAL20709.1、AEV18827.1、CEM58466.1、CBA20954.1、BAK25224.1、AIU33175.1、CBJ51928.1、CAL93650.1、CAL09544.1、CEE01548.1、GAE33988.1、AAY81441.1、BAH81064.1、CCA89166.1、KJX89569.1、WP_023306469.1、EAZ59428.1、EFH75916.1、EFG64803.1、EFF13066.1、AIE60968.1、KJF31148.1、WP_023290211.1、AGC43083.1、GAL05408.1、KGM65079.1、CEE01549.1、KDL77549.1、BAO70678.1、EPY53810.1、EEB08740.1、GAF10677.1、CCG43904.1、WP_042268578.1、KGG85769.1、CNO88241.1、KKE73357.1、WP_001055160.1、WP_003239466.1、WP_028742371.1、WP_027325346.1、和KBA42642.1,将这些登录号通过引用结合在此。可以使用这些ACoS氨基酸序列中任一个的变体,但应当具有相应的非变体ACoS酶参考序列的一些(例如,至少30%、40%、50%、60%、70%、80%、或90%)或全部的酶活性(参见上述定义)。这样的变体ACoS酶可以包含与相应的非变体ACoS酶参考序列的氨基酸序列具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列。
在本文的某些方面,ACoS酶可以包含SEQ ID NO:44(解脂耶氏酵母ACoS)、SEQ IDNO:49(解脂耶氏酵母ACoS)、SEQ ID NO:36(解脂耶氏酵母ACoS)、SEQ ID NO:33(酿酒酵母ACoS)、或SEQ ID NO:34(酿酒酵母ACoS)的氨基酸序列。据信,在一些其他方面,包含在表2和3(下文)中所列出的任一个氨基酸序列的蛋白质作为ACoS酶可能是有用的。可替代地,例如本文中的ACoS酶可以包含与前述ACoS酶氨基酸序列中的任一个具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列。这样的变体ACoS酶应当具有相应的非变体ACoS酶参考序列的一些(例如,至少约30%、40%、50%、60%、70%、80%、或90%)或全部的酶活性(参见上述定义)。本领域中可用的(例如,Galton和Fraser,Analytical Biochemistry[分析生物化学]28:59-64,通过引用结合在此),或如在以下实例5中披露的测量ACoS酶活性的方法可以在本文中相应地应用。
在某些实施例中,本文中的ACoS酶具有长链酰基辅酶A合成酶活性和香豆酰辅酶A合成酶活性两者。如目前披露的这样的ACoS酶的实例包含与SEQ ID NO:44或49具有至少90%同一性的氨基酸序列。
本文中的重组细胞可以任选地被表征为包括工程化的LCDA生产途径,该LCDA生产途径包含至少一种上调的ACoS酶。在一些方面,进一步包括:(i)编码细胞色素P450单加氧酶(CYP酶)的多核苷酸序列的上调,和/或(ii)编码细胞色素P450还原酶(CPR酶)的多核苷酸序列工程化的LCDA生产途径的上调。预期这些上调([i]和/或[ii])中的任一者或者两者导致ω-羟化酶上调。在一些其他实施例中,工程化的LCDA生产途径进一步包括(任选地除了上调[i]和/或[ii])以下各项中的至少一种:(iii)编码脂肪醇氧化酶(FAO酶)的多核苷酸序列的上调,(iv)编码脂肪醇脱氢酶(FADH酶)的多核苷酸序列的上调,和/或(v)编码脂肪醛脱氢酶(FALDH酶)的多核苷酸序列的上调。
例如,在某些实施例中重组细胞可以具有上调的CYP酶和CPR酶两者。可替代地,CYP酶可以被上调,或CPR酶可以被上调。在CYP酶被上调、但CPR酶在野生型水平上表达的实施例中,上调的ω-羟化酶复合物可能由于CYP酶上调而产生。在CPR酶被上调、但CYP酶在野生型水平上表达的实施例中,上调的ω-羟化酶复合物可能由于CPR酶上调而产生。
在本文的某些方面,CYP酶和/或CPR酶的上调可以通过编码CYP酶的多核苷酸序列的上调和/或编码CPR酶的多核苷酸序列的上调进行。可以通过各种方法中的一种或多种来完成这样的上调,该上调导致CYP酶和/或CPR酶过表达。例如,可以将编码CYP的多核苷酸和/或编码CYP酶的多核苷酸以多拷贝瞬时地或稳定地提供给细胞(这样的多核苷酸序列有效地连接至启动子序列[例如,异源启动子])。通过向细胞提供一个或多个拷贝(例如,至少1、2、3、4、5、6、7、8、9、10、15、20、25、或50个拷贝)的多核苷酸可以实现以多拷贝提供多核苷酸序列。应当理解,与以瞬时方式提供的多核苷酸序列相比,以稳定方式提供的多核苷酸序列典型地具有较低拷贝数。作为另一个实例,通过有效地连接至组成型启动子、强启动子、或诱导型启动子(这些启动子中的任一个可以是异源的),可以对编码CYP酶的多核苷酸序列和/或编码CPR酶的多核苷酸进行上调。
在某些实施例中,编码CYP酶的多核苷酸序列和编码CPR酶的多核苷酸序列都被上调;例如,遵循本文披露的一种过表达策略或过表达策略的组合,可以进行此上调。例如,可以使用单独的多核苷酸(例如,载体,如质粒)-一种编码CYP酶并且另一种编码CPR酶。作为另一个实例,可以使用单个多核苷酸(例如,载体,如质粒),包含每个CYP和CPR编码序列;例如,可以将每个编码序列包含在其自身的表达盒中(例如,启动子--编码序列--终止子)或包含在二顺反子表达盒内。
可以任选地考虑相对于合适的对照细胞,细胞中的CYP酶和/或CPR酶的上调(例如,过表达)。例如,在本文中细胞中的CYP酶和/或CPR酶的水平增加可以被表征为高于合适的对照细胞中的CYP酶和/或CPR酶的表达至少约5%、10%、20%、30%、40%、50%、60%、75%、80%、90%、100%、150%、200%、500%、或1000%。合适的对照细胞的实例是在其被修饰以具有上调的CYP酶和/或CPR酶表达之前存在的细胞(例如亲本细胞)。
例如,CYP酶和/或CPR酶对细胞而言可以是异源的。异源CYP酶(和/或CPR酶)的实例可以是来源于与其中CYP酶(和/或CPR酶)被上调的细胞的物种或菌株不同的物种或菌株的那种。在某些方面,CYP酶和CPR酶两者对细胞而言是异源的。细胞中的CYP酶和/或CPR酶的异源表达可以任选地被表征为向细胞提供异源ω-羟化酶复合物。异源ω-羟化酶复合物包含异源CYP酶或CPR酶中的一种、或两种。
可替代地,在细胞中被上调的CYP酶和/或CPR酶对于细胞而言可能是天然的。例如,使用上文关于多核苷酸序列上调所披露的任何方式,可以对天然的CYP酶和/或CPR酶进行上调。例如,可以将对细胞而言是天然的编码这些酶的各自的多核苷酸序列(有效地连接至启动子序列)以稳定的或瞬时的方式提供给细胞(但一种或多种多核苷酸序列的位置将位于非天然位点[即,异源位点])。作为另一个实例,可以将编码如天然存在于细胞的基因组中的CYP酶和/或CPR酶的各自的多核苷酸序列进行修饰,这样使得一种或多种天然多核苷酸序列过表达。这可以例如通过修饰含有编码CYP酶或CPR酶的多核苷酸序列的一种或多种基因的一种或多种调节元件(例如,启动子)实现。
在本文中的细胞中通过分别提供两组、三组、四组、或更多组(例如拷贝)的编码CYP和/或CPR酶的多核苷酸序列,可以任选地将两种、三种、四种、或更多种ω-羟化酶复合物进行上调。例如,通过引入(i)多个拷贝的编码CYP和/或CPR酶(例如,用两个拷贝的编码CYP/CPR的序列转化酵母细胞)的多核苷酸序列以过表达相同的ω-羟化酶,和/或(ii)多组的编码不同ω-羟化酶(例如,鼠科动物和植物ω-羟化酶二者的过表达)的CYP和/或CPR酶的多核苷酸序列,可以将多种ω-羟化酶提供给细胞。在一些实施例中,本文中的细胞包含两个、或至少两个上调的编码CYP和CPR的多核苷酸序列(例如,VsCYP和VsCPR)。
在其中本文中的细胞中CYP酶和CPR酶二者被上调的实施例中,编码这些酶的多核苷酸序列可以来源于相同的物种/来源。可替代地,编码这些酶的多核苷酸序列可以来源于不同的物种/来源。实例是这样的实施例,其中CYP酶由哺乳动物序列编码,并且CPR酶由植物序列编码。另一个实例是这样的实施例,其中这些酶中的一种(例如,CYP)对细胞而言可以是异源的,并且另一种酶(例如,CPR)对细胞而言是天然的。在这些后面的实施例类型中,其中编码CYP和CPR酶的多核苷酸序列来源于不同的物种/来源,所得的ω-羟化酶(含有不同来源的CYP和CPR酶组分)可以任选地被表征为嵌合的ω-羟化酶复合物。
例如,本文中的CYP酶和/或CPR酶可以来源于真核生物或原核生物。关于ACoS酶的衍生物,上文披露了此类真核生物和原核生物的实例。在一些方面,本文中可用的具有CYP和CPR活性两者的CYP酶可以来源于原核生物。在一些实施例中,CYP酶和/或CPR酶可以被表征为是微生物的(即,来源于:细菌细胞;原生生物细胞(例如藻类细胞);真菌细胞(例如酵母细胞);眼虫藻细胞;原生藻菌(stramenopile)细胞;或卵菌细胞)。
在其中ω-羟化酶复合物具有来源于相同物种或菌株(例如,本文披露的任何物种/菌株,例如小鼠、大鼠、人类、植物、拟南芥属(Arabidopsis)、巢菜、酵母、假丝酵母属)的CYP和CPR酶组分的那些实施例中,这样的ω-羟化酶复合物可以任选地被表征为来自那个物种或菌株。例如,含有小鼠CYP和CPR酶组分的ω-羟化酶复合物可以任选地被表征为小鼠ω-羟化酶复合物。同样,本文中的某些ω-羟化酶复合物可以分别被表征为例如大鼠、人类、植物、拟南芥属、巢菜、或假丝酵母属ω-羟化酶复合物。
在某些实施例中,CYP酶可以来自特定的CYP酶亚家族。例如,CYP酶可以来自以下亚家族:CYP4(例如,哺乳动物CYP4(例如CYP4A1和CYP4A10))、CYP86(例如,植物CYP86)、CYP94(例如,植物CYP94(例如CYP94A1))、CYP96(例如,植物CYP96(例如CYP96A4))、CYP52(例如,酵母CYP52(例如CYP52A4和CYP52A1))、或CYP102(例如,细菌CYP102)。
本文中的CYP酶的氨基酸序列可以包含,例如,在以下基因库登录号中披露的CYP氨基酸序列中的任一个:BAA31435、BAA31437、BAA31439、P16496、P16141、Q12586、EEQ43763、P10615、P30609、P30610、AAO73952、AAO73953、AAO73954、AAO73955、AAO73958、AAO73959、NP_200694、NM_100042、NP_182121、DQ099538、AAD10204、P98188、Q9FMV7、Q9SMP5、Q9ZUX1、NP_200045、XP_002865907、NM_175837、P20816、NP_786936、AAH81771、NP_034141、和Q02928,将这些登录号通过引用结合在此。可以使用这些CYP氨基酸序列中任一个的变体,但应具有相应的非变体CYP酶参考序列的一些(例如,至少30%、40%、50%、60%、70%、80%、或90%)或全部的酶活性(参见上述定义)。这样的变体CYP酶可以包含与相应的非变体CYP酶参考序列的氨基酸序列具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列。
在本文的某些方面,CYP酶可以包含SEQ ID NO:84(热带假丝酵母CYP)或SEQ IDNO:94(箭舌豌豆CYP)的氨基酸序列。可替代地,例如,本文中的CYP酶可以包含与前述CYP酶氨基酸序列的任一个具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列。这样的变体CYP酶应具有相应的非变体CYP酶参考序列的一些(例如,至少约30%、40%、50%、60%、70%、80%、或90%)或全部的酶活性(参见上述定义)。
本文中的CPR酶的氨基酸序列可以包含,例如,在以下基因库登录号中披露的CPR氨基酸序列中的任一个:X76226、P37201、X66016、X66017、NM_008898、M12516、和Z26252,将这些登录号通过引用结合在此。可以使用这些CPR氨基酸序列中任一个的变体,但应具有相应的非变体CPR酶参考序列的一些(例如,至少30%、40%、50%、60%、70%、80%、或90%)或全部的酶活性(参见上述定义)。这样的变体CPR酶可以包含与相应的非变体CPR酶参考序列的氨基酸序列具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列。
在本文的某些方面,CPR酶可以包含SEQ ID NO:86(热带假丝酵母CPR)或SEQ IDNO:96(箭舌豌豆CPR)的氨基酸序列。可替代地,例如,本文中的CPR酶可以包含与前述CPR酶氨基酸序列中的任一个具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列。这样的变体CPR酶应具有相应的非变体CPR酶参考序列的一些(例如,至少30%、40%、50%、60%、70%、80%、或90%)或全部的酶活性(参见上述定义)。
在本文中的一些方面,重组细胞可以包含(1)脂肪醇氧化酶(FAO酶)的上调,和/或(2)脂肪醇脱氢酶(FADH酶)的上调,和/或(3)脂肪醛脱氢酶(FALDH酶)的上调。FAO和/或FADH的上调提供了在长链脂肪酸ω-氧化途径中将ω-羟基脂肪酸上调地转化为ω-醛脂肪酸(图1和2)。FALDH的上调提供了在长链脂肪酸ω-氧化途径中将ω-醛脂肪酸上调地转化为LCDA(图1和2)。
在本文中的重组细胞中的FAO、FADH、和/或FALDH酶的上调可以是如下,例如:
(i)至少一种FAO酶被上调,
(ii)至少一种FADH酶被上调,
(iii)至少一种FALDH酶被上调,
(iv)至少一种FAO和至少一种FADH酶被上调,
(v)至少一种FAO和至少一种FALDH酶被上调,
(vi)至少一种FADH和至少一种FALDH酶被上调,或
(vii)至少一种FAO、至少一种FADH、和至少一种FALDH酶被上调。
在本文的某些方面,FAO、FADH、和/或FALDH酶的上调可以通过(1)编码FAO酶的多核苷酸序列的上调,(2)编码FADH酶的多核苷酸序列的上调,和/或(3)编码FALDH酶的多核苷酸序列的上调进行。可以通过各种方法中的一种或多种来完成这样的上调,该上调导致FAO、FADH、和/或FALDH酶过表达。例如,可以将编码FAO、FADH、和/或FALDH的多核苷酸以多拷贝瞬时地或稳定地提供给细胞(这样的多核苷酸序列有效地连接至启动子序列[例如,异源启动子])。通过向细胞提供一个或多个拷贝(例如,至少1、2、3、4、5、6、7、8、9、10、15、20、25、或50个拷贝)的多核苷酸可以实现以多拷贝提供多核苷酸序列。作为另一个实例,通过有效地连接至组成型启动子或强启动子(这些启动子中的任一个可以是异源的)可以对编码FAO、FADH、和/或FALDH的多核苷酸序列进行上调。在上述(i)-(vii)中所列出的任何FAO、FADH和/或FALDH酶的上调可以经由一种或多种多核苷酸序列的上调。
例如,遵循本文披露的一种过表达策略或过表达策略的组合可以进行多核苷酸序列的上调。例如,可以使用编码FAO、FADH、或FALDH酶的单独的多核苷酸(例如,载体,例如质粒)。作为另一个实例,可以使用包含两种或更多种FAO、FADH、或FALDH编码序列的单个多核苷酸(例如,载体,例如质粒);例如,可以将每个编码序列包含在其自身的表达盒中(例如,启动子--编码序列--终止子)或包含在二顺反子表达盒内。
可以任选地考虑相对于合适的对照细胞,本文中的细胞中的FAO、FADH、和/或FALDH酶的上调(例如,过表达)。例如,在本文中的细胞中的FAO、FADH、和/或FALDH酶的水平增加可以被表征为高于合适的对照细胞中的FAO、FADH、和/或FALDH酶的表达至少约5%、10%、20%、30%、40%、50%、60%、75%、80%、90%、100%、150%、200%、500%、或1000%。合适的对照细胞的实例是在其被修饰以具有上调的FAO、FADH、和/或FALDH酶表达之前存在的细胞(例如亲本细胞)。
例如,FAO、FADH、和/或FALDH酶对细胞而言可以是异源的。异源FAO、FADH、或FALDH酶的实例可以是来源于与其中FAO、FADH、和/或FALDH酶被上调的细胞的物种或菌株不同的物种或菌株的那种。在某些方面,FAO、FADH、和FALDH酶中的至少一种、两种、或全部对细胞而言是异源的(例如,在上述(i)-(vii)中所列出的任何上调)。
可替代地,在细胞中被上调的FAO、FADH、和FALDH酶对细胞而言可以是天然的。例如,使用上文关于多核苷酸序列上调所披露的任何方式可以对天然的FAO、FADH、和FALDH酶进行上调。例如,可以将对细胞而言是天然的编码这些酶的各自的多核苷酸序列(有效地连接至启动子序列[例如,异源启动子])以稳定的或瞬时的方式提供给细胞(但一种或多种多核苷酸序列的位置将位于非天然位点[即,异源位点])。作为另一个实例,可以将编码天然存在于细胞的基因组中的FAO、FADH、和/或FALDH酶的各自的多核苷酸序列进行修饰,这样使得一种或多种天然多核苷酸序列过表达。这可以例如通过修饰含有编码FAO、FADH、和/或FALDH酶的多核苷酸序列的一种或多种基因的一种或多种调节元件(例如,启动子)实现。
在本文中的细胞中通过分别提供一组、两组、三组、四组、或更多组(例如拷贝)的编码FAO、FADH、和/或FALDH酶的多核苷酸序列,可以任选地将一种、两种、三种、四种、或更多种FAO、FADH、和/或FALDH酶进行上调。例如通过引入(i)多个拷贝的编码FAO、FADH、和/或FALDH酶的多核苷酸序列(例如,用两个拷贝的编码FAO、FADH、和/或FALDH的序列转化细胞)以过表达相同的FAO、FADH、和/或FALDH酶,和/或(ii)多组编码不同的FAO、FADH、和/或FALDH酶的多核苷酸序列(例如,鼠科动物FAO和植物FAO二者的过表达)可以将多个FAO、FADH、和/或FALDH酶提供给细胞。在一些实施例中,本文中的细胞包含三种、或至少三种不同的上调的编码FAO的多核苷酸序列(例如,CtFAO1M、CcFAO1、和CcFAO2)。
例如,本文中的FAO、FADH、和/或FALDH酶可以来源于真核生物或原核生物。关于ACoS酶的衍生物,上文披露了此类真核生物和原核生物的实例。在一些实施例中,FAO、FADH、和/或FALDH酶可以被表征为是微生物的(即,来源于:细菌细胞;原生生物细胞(例如藻类细胞);真菌细胞(例如酵母细胞);眼虫藻细胞;原生藻菌(stramenopile)细胞;或卵菌细胞)。
FAO、FADH、和/或FALDH酶可以来自特定的酶家族或亚家族。例如,FAO酶可以是FAO1、FAO2、FAO3、或FAO4酶。例如,FADH酶可以是ADH、ADH1、ADH2、ADH3、FADH1、FADH2、或FADH3酶。例如,FALDH酶可以是FALDH1、FALDH2、FALDH3、或FALDH4酶。
本文中的FAO酶的氨基酸序列包含,例如,在以下基因库登录号中披露的氨基酸序列中的任一个:XP_001389382、XP_002867943、Q9ZWB9、CAA18625、AEE76762.1、AEE84174、AEE85508、XP_007158083、XP_007132926、XP_003540021、XP_003554295、XP_003534338、XP_009102621、EAK93199、CAB75351、CAB75352、XP_002422236、CCG23291、CCG23293、CCE42799、CCE42800、AAS46878、AAS46879、AAS46880、CAB75353、EGV61357、XP_459506、EFX04185、JX879776、XP_001525361、CAP15762.1、KEH23950、EGW33941、和XP_001386087,将这些登录号通过引用结合在此。可以使用这些FAO氨基酸序列中任一个的变体,但应具有相应的非变体FAO酶参考序列的一些(例如,至少30%、40%、50%、60%、70%、80%、或90%)或全部的酶活性(参见上述定义)。这样的变体FAO酶可以包含与相应的非变体FAO酶参考序列的氨基酸序列具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列。
在本文的某些方面,FAO酶可以包含SEQ ID NO:100(热带假丝酵母FAO)、SEQ IDNO:102(阴沟假丝酵母FAO)、或SEQ ID NO:104(阴沟假丝酵母FAO)的氨基酸序列。可替代地,例如,本文中的FAO酶可以包含与前述FAO酶氨基酸序列中的任一个具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列。这样的变体FAO酶应具有相应的非变体FAO酶参考序列的一些(例如,至少约30%、40%、50%、60%、70%、80%、或90%)或全部的酶活性(参见上述定义)。
本文中的FADH(ADH)酶的氨基酸序列可以包含,例如,在以下基因库登录号中披露的氨基酸序列中的任一个:NP_982625、EEQ46516、EEQ42383、XM_712556、BAD12482、CD36_07850、ABD60084、ABD60084、XP_002619012、ADM08005、ADM08008、XP_003870523、AFD29185、XP_006683745、XP_002546635、XP-002550829、GU056282、GU056283、GU056286、GU056287、XP_460537、WP_024173607、AHC53987、AAP51040、XP_001524974、AAP51047、AAP51048、AAP51049、XP_001485610、ESW95881、AFH35136、KGK40277、EJS44121、AAP51043、EHN00693、EJT43588、XP_007377163、AGO10074、CAA73690、XP_001382922、XP_003686595、XP_001642939、CCH41227、XP_503282、F2Z678、XP_500127、XP_500087、和XP_503672,将这些登录号通过引用结合在此。可以使用这些氨基酸序列中任一个的变体,但应具有相应的非变体FADH(ADH)酶参考序列的一些(例如,至少30%、40%、50%、60%、70%、80%、或90%)或全部的酶活性(参见上述定义)。这样的变体FADH(ADH)酶可以包含与相应的非变体FADH(ADH)酶参考序列的氨基酸序列具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列。
本文中的FALDH酶的氨基酸序列可以包含,例如,在以下基因库登录号中披露的氨基酸序列中的任一个:XP_719028、KGQ84508、KGQ98444、XP_002421401、EMG46594、EMG47675、XP_003868193、XP_002550173、XP_002550712、XP_505802、XP_500380、XP_503981、BAP82457、XP_500179、和CCH41136,将这些登录号通过引用结合在此。可以使用这些FALDH氨基酸序列中任一个的变体,但应具有相应的非变体FALDH酶参考序列的一些(例如,至少30%、40%、50%、60%、70%、80%、或90%)或全部的酶活性(参见上述定义)。这样的变体FALDH酶可以包含与相应的非变体FALDH酶参考序列的氨基酸序列具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列。
在本文的某些方面,FALDH酶可以包含SEQ ID NO:91(热带假丝酵母FALDH)的氨基酸序列,或与SEQ ID NO:91具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列。这样的变体FALDH酶应具有SEQ ID NO:91的FALDH酶的一些(例如,至少约30%、40%、50%、60%、70%、80%、或90%)或全部的酶活性(参见上述定义)。
在一些实施例中,重组细胞可以包括对过氧化物酶体生物合成因子(Pex蛋白质)的下调。例如,重组细胞可以包括对编码过氧化物酶体生物合成因子-3(Pex3蛋白质)的内源多核苷酸序列的下调。尽管不旨在受任何具体的理论或机制约束,但是预期Pex蛋白质下调由于损害正常的过氧化物酶体功能(例如过氧化物酶体膜功能)而导致重组细胞中的β-氧化水平被阻断或降低。预期阻断或降低的β-氧化水平导致将脂肪酸重新定向到ω-氧化途径,在该ω-氧化途径中脂肪酸用作LCDA合成的底物(参见图1和2)。在某些实施例中,可以下调一种或多种以下Pex蛋白质的表达:Pex1p、Pex2p、Pex3p、Pex3Bp、Pex4p、Pex5p、Pex5Bp、Pex5Cp、Pex5/20p、Pex6p、Pex7p、Pex8p、Pex10p、Pex12p、Pex13p、Pex14p、Pex15p、Pex16p、Pex17p、Pex14/17p、Pex18p、Pex19p、Pex20p、Pex21p、Pex21Bp、Pex22p、Pex22p类、和Pex26p。
可以例如通过下调编码这样的蛋白质的多核苷酸序列被下调的Pex3蛋白质的实例披露于以下基因库登录号中:CAG78565(解脂耶氏酵母,本文中还披露为SEQ ID NO:107)、NP_010616.3(酿酒酵母S288)、AHY75303.1(酿酒酵母YJM993)、EWH19033.1(酿酒酵母P283)、EWG96624.1(酿酒酵母R103)、EWG87344.1(酿酒酵母R008)、EGA75546.1(酿酒酵母AWRI796)、CAB10141(粟酒裂殖酵母(S.pombe))、EKD00377.1(阿氏丝孢酵母(Trichosporonasahii))、AAC49471(多形汉逊酵母(Hansenula polymorpha))、XP_569751.1(新型隐球菌(Cryptococcus neoformans))、XP_003193133.1(格特隐球菌(Cryptococcus gattii))、XP_713871.1(白色念珠菌(Candida albicans))、CCG21168.1(拟平滑念珠菌(Candidaorthopsilosis))、CAX44998.1(杜氏假丝酵母(Candida dubliniensis))、CCA39066.1(巴斯德驹田氏酵母(Komagataella pastoris))、Q6BK00.1(汉逊德巴利酵母(Debaryomyceshansenii))、O94227.1(乳酸克鲁维酵母(Kluyveromyces lactis))、Q01497.1(Ogataeaangusta)、ABN67699.2(Scheffersomyces stipitis)、AAS52217.1(棉阿舒囊霉(Ashbyagossypii))、和CCH44061.1(Wickerhamomyces ciferrii),将这些登录号通过引用结合在此。应当理解,这些Pex3蛋白质中的每一种都将被靶向在表达Pex3蛋白质的相应细胞中进行下调(例如酿酒酵母Pex3蛋白质将在酿酒酵母中被下调)。
在其他实施例的细胞中,可以下调例如包含与前述Pex3蛋白质中的任一个具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列的Pex3蛋白质。例如,可以将表达Pex3蛋白质的耶氏酵母属细胞或本文中任何其他类型的酵母细胞进行修饰以具有这样的Pex3蛋白质的下调的表达,该Pex3蛋白质包含与SEQ ID NO:107具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列。
在一些实施例中,例如使用耶氏酵母属细胞,下调的内源多核苷酸序列可能编码包含与SEQ ID NO:107具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列的Pex3蛋白质。在某些其他实施例中,下调的编码Pex3蛋白质的内源多核苷酸序列包含与SEQ ID NO:106具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的核苷酸序列。
在本文的某些方面,编码Pex蛋白质(例如Pex3)的内源多核苷酸序列的下调可能归因于多核苷酸序列的突变。例如,这样的突变可以是取代、缺失、或插入。
例如,缺失可以去除(i)来自编码Pex蛋白质的可读框(即,PEX可读框)的一个或多个核苷酸,和/或(ii)位于编码Pex蛋白质的可读框的5’-端的500或1000个碱基对内的非蛋白质编码序列的一个或多个核苷酸。在某些实施例中,插入可以发生在(i)编码Pex蛋白质的可读框,或(ii)位于编码Pex蛋白质的可读框的5’-端的500或1000个碱基对内的非蛋白质编码序列中。如果需要,还可以将其他类型的突变用于下调编码Pex蛋白质的内源多核苷酸序列。例如,可以相应地使用将单个核苷酸交换为另一个(即,核苷酸取代)的一个或多个点突变。
实例6披露了缺失解脂耶氏酵母中编码Pex3蛋白质的内源多核苷酸序列。在这项工作的一个方面,通过基于同源重组的靶向去除PEX3可读框,并且将其用合适的供体DNA用URA3盒替换。此替换致使下调的(破坏的、或敲除的)包含SEQ ID NO:71的序列,该序列包含在LoxP-侧翼的URA3盒侧翼的5’-和3’-非编码PEX3同源臂序列(每个100-bp)部分。这项工作的另一个方面涉及通过表达Cre重组酶(LoxP序列之间被刺激的重组,留下一个LoxP序列)去除URA3盒,以致使下调的(破坏的、或敲除的)包含SEQ ID NO:72的序列。SEQ ID NO:72包含在一个LoxP序列侧翼的5’-和3’-非编码PEX3同源臂序列(每个100-bp)的部分。因此,本文中的某些实施例涉及包含下调的编码Pex3蛋白质的内源多核苷酸序列的重组耶氏酵母属酵母细胞,其中该下调是由于编码Pex3蛋白质的内源多核苷酸序列的破坏(敲除);此破坏(敲除)包含SEQ ID NO:71或72,或与SEQ ID NO:71或72具有至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的核苷酸序列。
不改变由密码子(即,沉默突变)编码的氨基酸的PEX可读框的密码子中的突变典型地不是如本文所述的下调PEX多核苷酸的突变。典型地,也不是将由密码子编码的氨基酸改变为相关氨基酸的突变,该相关氨基酸不改变Pex蛋白质的野生型功能(例如,保守性突变)。在某些实施例中,相关氨基酸具有共享结构和/或电荷的侧基,并且可以如下分组:脂肪族(甘氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸);芳香族(苯丙氨酸、酪氨酸、色氨酸);含羟基基团(丝氨酸、苏氨酸);含硫基团(sulfur group)(半胱氨酸、甲硫氨酸);含羧酸基团(天冬氨酸、谷氨酸);含酰胺基团(天冬酰胺、谷氨酰胺)和含氨基基团(组氨酸、赖氨酸、精氨酸)。然而,下调PEX多核苷酸的转录和/或翻译(例如,通过抑制反式激活转录和/或翻译因子)的此类突变中的任一种(沉默突变或保守突变)在本文中典型地被认为是下调PEX多核苷酸的突变。
本领域普通技术人员应当理解的是,通过参考在合适的对照细胞中相应的内源Pex蛋白质编码序列,可以确定任何针对编码Pex蛋白质的内源多核苷酸序列所披露的突变可以以构成下调的突变。例如,可以将经修饰的细胞中的PEX多核苷酸序列与从中衍生出修饰的细胞的对应细胞(例如亲本细胞)的内源相应PEX多核苷酸序列进行比较。
在某些实施例中,相对于在合适的对照细胞(例如,亲本细胞)中对应的编码Pex蛋白质的多核苷酸序列的转录和/或翻译,编码Pex蛋白质的内源多核苷酸序列的下调是内源多核苷酸序列的转录和/或翻译降低了至少约20%、30%、40%、50%、60%、70%、80%、90%、95%、或100%。在其他实施例中,相对于在合适的对照细胞(例如,亲本细胞)中对应的Pex蛋白质的功能,编码Pex蛋白质的内源多核苷酸序列的下调通过编码的Pex蛋白质的功能(例如,蛋白质定位和/或活性)降低至少约20%、30%、40%、50%、60%、70%、80%、90%、95%、或100%来反映。
尽管不旨在受任何具体的理论或机制约束,但是预期下调本文中的重组细胞中编码Pex蛋白质的多核苷酸序列由于损害正常的过氧化物酶体功能(例如,过氧化物酶体膜功能)导致重组细胞中阻断或降低的β-氧化水平。例如,与合适的对照细胞(例如没有经历下调的亲本细胞)相比,在包含下调的编码Pex蛋白质的多核苷酸序列的细胞中,β-氧化可以被降低至少约40%、50%、60%、70%、80%、90%、95%、或100%。
在本文的某些方面,下调编码Pex3蛋白质(例如,SEQ ID NO:107)、但不编码Pex10蛋白质(例如,SEQ ID NO:108)或Pex16蛋白质(例如,SEQ ID NO:109)的多核苷酸适合用于制备可以从含有长链脂肪酸的底物产生一种或多种LCDA产物的重组酵母细胞(例如,解脂耶氏酵母,参考实例14)。因此,在一些实施例中,酵母细胞不包含下调的编码Pex10蛋白质的多核苷酸、编码Pex16蛋白质的多核苷酸、和/或下调的编码Pex-1、-2、-4、-5、-6、-7、-8、-12、-13、-14、-15、-17、-18、-19、-20、-21、-22、或-26蛋白质的多核苷酸。本文中Pex10蛋白质或Pex16蛋白质的实例分别包含SEQ ID NO:108或SEQ ID NO:109,或与SEQ ID NO:108或SEQ ID NO:109具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列。
在一些实施例中,编码Pex3蛋白质的多核苷酸序列的下调可以是对重组酵母细胞产生LCDA产物必需的编码过氧化物酶体蛋白质的多核苷酸序列的唯一修饰。实际上,以下实例14证明了仅具有下调的PEX3多核苷酸、但直接参与过氧化物酶体功能(例如,过氧化物酶体发育和/或维持;代谢途径,例如在过氧化物酶体中发生的β-氧化)的任何其他蛋白质不下调的重组酵母能够从含有脂肪酸的底物生产LCDA。因此,本文披露的某些实施例涉及重组酵母细胞,其中下调的PEX3多核苷酸是对编码过氧化物酶体蛋白质的多核苷酸的唯一修饰。
在某些方面,过氧化物酶体蛋白质可以是在发育和/或维持过氧化物酶体结构/功能中发挥作用的那种,例如Pex蛋白质(例如,Pex-1、-2、-3、-4、-5、-6、-7、-8、-12、-13、-14、-15、-16、-17、-18、-19、-20、-21、-22、和/或-26蛋白质)。本文中的过氧化物酶体蛋白质的另一个实例是在过氧化物酶体中进行的代谢活动(例如β-氧化)中发挥作用的那种。涉及β-氧化的过氧化物酶体蛋白质的实例包括Pox蛋白质(例如,Pox-1、-2、-3、-4、-5、-6)。在本文的一些方面,酵母细胞不具有Pex蛋白质(除了Pex3)的下调的表达,和/或Pox蛋白质的下调的表达。在一些其他方面,酵母细胞不具有以下各项的下调的表达:(i)Pox-1、-2、-3、-4、-5和-6蛋白质;(ii)Pox-1、-2、-3、-4和-5蛋白质;(iii)Pox-2、-3、-4和-5蛋白质;(iv)Pox-2、-3和-5蛋白质;或(v)Pox-4和-5蛋白质。
尽管预期Pex3蛋白质是在本文中的重组酵母细胞中下调的唯一Pex蛋白质,一种或多种另外的Pex蛋白质可以任选地被下调。本文中所列出的任何Pex-蛋白质,例如,可以被下调;这样的其他Pex蛋白质的具体实例列于美国专利申请公开号2009/0117253的表4中,该申请通过引用结合在此。例如,除了下调Pex3蛋白质之外,Pex10和/或Pex16蛋白质可以被下调。
在一些实施例中,如目前披露的重组细胞可以包括编码过氧化物酶体酰基辅酶A氧化酶(Pox蛋白质)的内源多核苷酸序列的下调。例如,Pox-1、-2、-3、-4、-5、或-6中的一种或多种可能适合用于下调。根据需要,可以使用下调这些Pox蛋白质中的任何一种、两种、三种、四种、五种或六种、或其任何组合。本文中用于下调的Pox蛋白质的组合的实例包括:(i)Pox-2、-3、-4;(ii)Pox-2、-3、-4、-5;(iii)Pox-1、-2、-3、-4、-5;(iv)Pox-1、-2、-3、-4、-5、-6;(v)Pox-1、-2、-3、-4;以及(vi)Pox-2、-3、-4、-5、-6。作为另外的实例,重组细胞可以包括酰基辅酶A氧化酶-2、-3、和/或-4酶的下调。本文中一种或多种Pox蛋白的下调可以使用目前披露的任何策略进行,该策略用于下调例如Pex3蛋白质表达(例如缺失、插入、其他类型的突变)。而且,这样的下调的水平和确定下调的方式可以遵循上文关于下调Pex3蛋白质表达所披露的相关实施例。在一些方面,重组细胞任选地不包括Pox蛋白质的下调。
本文中任何前述Pox蛋白质可以被下调,例如通过下调一种或多种编码内源Pox蛋白质的多核苷酸序列。在某些实施例中,相对于在合适的对照细胞(例如,亲本细胞)中对应的编码Pox蛋白质的多核苷酸序列的转录和/或翻译,编码Pox蛋白质的内源多核苷酸序列的下调是内源多核苷酸序列的转录和/或翻译降低了至少约20%、30%、40%、50%、60%、70%、80%、90%、95%、或100%。在其他实施例中,相对于在合适的对照细胞(例如,亲本细胞)中对应的Pox蛋白质的功能,编码Pox蛋白质的内源多核苷酸序列的下调通过编码的Pox蛋白质的功能(例如,蛋白质定位和/或活性)降低至少约20%、30%、40%、50%、60%、70%、80%、90%、95%、或100%来反映。
本文中可以被下调的Pox4蛋白质(例如通过下调编码这样的蛋白质的多核苷酸序列)的实例披露于以下基因库登录号中:CAG80078(解脂耶氏酵母(Y.lipolytica),本文中还披露为SEQ ID NO:111)、P06598(热带假丝酵母(Candida tropicalis))、P05335(麦芽糖假丝酵母(Candida maltosa))、KHC52040(白色念珠菌(Candida albicans))、EIF46613(布鲁塞尔酒香酵母(Brettanomyces bruxellensis))、XP_007376225(Spathasporapassalidarum)、XP_001526373(长孢洛德酵母(Lodderomyces elongisporus))、XP_001387042(Scheffersomyces stipitis)、XP_011276972(Wickerhamomyces ciferrii)、以及ENH66703(尖孢镰刀菌(Fusarium oxysporum)),将这些登录号通过引用结合在此。应当理解,这些Pox4蛋白质中的每一种都将被靶向在表达Pox4蛋白质的相应细胞中进行下调(例如,热带假丝酵母Pox4蛋白质将在热带假丝酵母中下调)。
在某些实施例中,在细胞中可以下调包含与前述Pox4蛋白质中任一个具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性、并且具有Pox4活性的的氨基酸序列的Pox4蛋白质。例如,可以将表达Pox4蛋白质的耶氏酵母属细胞或本文中任何其他类型的细胞进行修饰以具有这样的Pox4蛋白质的下调的表达,该Pox4蛋白质包含与SEQ ID NO:111具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列。
实例6披露了缺失解脂耶氏酵母中编码Pox4蛋白质的内源多核苷酸序列。在这项工作的一个方面,通过基于同源重组的靶向去除POX4可读框。该靶向致使下调的(破坏的、或敲除的)包含SEQ ID NO:74的序列,该序列包含5’和3’POX4同源臂序列的某些部分。具体地,SEQ ID NO:74的碱基位置1-455和464-957分别与某些5’和3’POx4基因序列对应。因此,本文中的某些实施例涉及包含下调的编码Pox4蛋白质的内源多核苷酸序列的重组耶氏酵母属酵母细胞,其中该下调是由于编码Pox4蛋白质的内源多核苷酸序列的破坏(敲除);此破坏(敲除)包含SEQ ID NO:74,或与SEQ ID NO:74具有至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的核苷酸序列。
本文中可以被下调的Pox2蛋白质(例如通过下调编码这样的蛋白质的多核苷酸序列)的实例披露于以下基因库登录号中:Q00468.1(麦芽糖假丝酵母(Candida maltosa))、P11356.3(热带假丝酵母(Candida tropicalis))、O74935.1(解脂耶氏酵母(Y.lipolytica),本文还披露为SEQ ID NO:79)、CCA37459.1(巴斯德驹田氏酵母(Komagataella pastoris))、CAX42707.1(杜氏假丝酵母(Candida dubliniensis))、和XP_721613.1(白色念珠菌(Candida albicans)),将这些登录号通过引用结合在此。应当理解,这些Pox2蛋白质中的每一种都将被靶向在表达Pox2蛋白质的相应细胞中进行下调。
在某些实施例中,在细胞中可以下调包含与前述Pox2蛋白质中任一个具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性、并且具有Pox2活性的氨基酸序列的Pox2蛋白质。例如,可以将表达Pox2蛋白质的耶氏酵母属细胞或本文中任何其他类型的细胞进行修饰以具有这样的Pox2蛋白质的下调的表达,该Pox2蛋白质包含与SEQ ID NO:79具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列。
在本文中可以被下调的Pox3蛋白质(例如通过下调编码这样的蛋白质的多核苷酸序列)的实例包含与SEQ ID NO:81具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列。
在本披露的某些方面,重组细胞可以具有降低的脂质(油)合成和/或储存能力。例如(与合适的对照细胞(例如亲本细胞)相比),脂质合成和/或储存能力可以被降低至少约40%、50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%。可以使用本领域已知的任何数量的手段,例如细胞脂质含量的色谱分析(例如气相色谱)和/或某些视觉分析(例如,脂质体的显微评估)来确定细胞中降低的脂质合成和/或储存。
具有降低的脂质合成和/或储存能力的重组细胞可以具有例如低于作为干细胞重量(DCW)百分比测量的约50%、25%、10%、5%、4%、3%、2.5%、2.0%、1.5%、或1.0%总脂质。
在一些实施例中,将二酰基甘油(DAG)转化成三酰基甘油(TAG)的内源活性可以被降低以实现脂质合成和/或储存能力的降低。这反映出TAG通常代表细胞中主要的脂质储存分子。降低TAG合成的实例可以是通过下调至少一种编码二酰基甘油酰基转移酶(DGAT)的内源多核苷酸序列。本文中用于下调的DGAT的实例包括DGAT1和DGAT2。在本文的一些方面,DGAT1和DGAT2中的任一者或二者可以被下调。可以使用本文披露的可用于下调Pex3蛋白质表达的任何策略(例如,缺失、插入、其他类型的突变)来进行DGAT1和/或DGAT2的下调。而且,这样的下调的水平和确定下调的方式可以遵循上文关于下调Pex3蛋白质表达所披露的相关实施例。
在本文中可以被下调的DGAT1酶的实例是SEQ ID NO:113,其代表解脂耶氏酵母DGATl酶。可以将表达包含与SEQ ID NO:113具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列的DGAT1酶的耶氏酵母属细胞或本文中任何其他细胞进行修饰以具有这样的DGAT1酶的下调的表达。作为另一个实例,可以将表达具有SEQ ID NO:113的DGAT1的至少80%、90%、95%、或100%活性的酶的耶氏酵母属细胞或本文中任何其他细胞进行修饰以具有这样的DGAT1酶的下调的表达。
在本文中可以被下调的DGAT2酶的实例是SEQ ID NO:115,其代表解脂耶氏酵母DGAT2酶。可以将表达包含与SEQ ID NO:115具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列的DGAT2酶的耶氏酵母属细胞或本文中任何其他细胞进行修饰以具有这样的DGAT2酶的下调的表达。作为另一个实例,可以将表达具有SEQ ID NO:115的DGAT2的至少80%、90%、95%、或100%活性的酶的耶氏酵母属细胞或本文中任何其他细胞进行修饰以具有这样的DGAT2酶的下调的表达。
本文中的DGAT酶可以被下调,例如,通过下调一种或多种编码内源DGAT的多核苷酸序列。在某些实施例中,相对于在合适的对照细胞(例如,亲本细胞)中对应的编码DGAT的多核苷酸序列的转录和/或翻译,编码DGAT的内源多核苷酸序列的下调是内源多核苷酸序列的转录和/或翻译降低了至少约20%、30%、40%、50%、60%、70%、80%、90%、95%、或100%。在其他实施例中,相对于在合适的对照细胞(例如,亲本细胞)中对应的DGAT的功能,编码DGAT的内源多核苷酸序列的下调通过编码的DGAT的功能(例如,蛋白质定位和/或活性)降低至少约20%、30%、40%、50%、60%、70%、80%、90%、95%、或100%来反映。
如果需要,在本文的重组细胞中可以下调其他类型的酰基转移酶以实现脂质合成和/或储存能力的降低。这样的下调可以是独立于下调DGAT1和/或DGAT2酶,或者可以是除了下调DGAT1和/或DGAT2酶之外的。可以任选地被靶向用于下调的其他酰基转移酶包括卵磷脂-胆固醇酰基转移酶(EC 2.3.1.43;还被称为磷脂酰胆碱-固醇O-酰基转移酶)和磷脂:二酰基甘油酰基转移酶(PDAT,EC 2.3.1.158),这二者可以通常催化磷脂和DAG向溶血磷脂和TAG的转化。
本文中的重组微生物细胞可以是指例如真菌细胞(例如酵母细胞)、原核细胞、原生生物细胞(例如,藻类细胞)、眼虫藻细胞、原生藻菌细胞或卵菌细胞。本文中的原核细胞可以是指例如细菌细胞或古细菌细胞。酵母细胞可以是如目前披露的任何酵母。例如,酵母可以是耶氏酵母属(例如,解脂耶氏酵母)、假丝酵母属(例如,热带假丝酵母)、德巴利酵母属(例如,汉逊德巴利酵母(D.hansenii))、酵母属(例如,酿酒酵母)、裂殖酵母属(例如,粟酒裂殖酵母(S.pombe))、或毕赤酵母属(Pichia)(例如,巴斯德毕赤酵母(P.pastoris))酵母物种。
本文中的真菌细胞可以是酵母(例如,下文)或任何其他真菌类型例如丝状真菌。例如,本文中的真菌可以是担子菌纲(Basidiomycetes)、接合菌纲(Zygomycetes)、壶菌纲(Chytridiomycetes)或子囊菌纲(Ascomycetes)。本文中的丝状真菌的实例包括以下属的那些:木霉属(Trichoderma)(例如,里氏木霉(T.reesei));金孢子菌属(Chrysosporium);梭孢壳属(Thielavia);脉孢菌属(Neurospora)(例如,粗糙脉孢菌(N.crassa)、好食脉孢霉(N.sitophila));丛赤壳属(Cryphonectria)(例如,栗丛赤壳菌(C.parasitica));短梗霉属(Aureobasidium)(例如,出芽短梗霉菌(A.pullulans));黑粉酵母属(Filibasidium);瘤胃壶菌属(Piromyces);隐球菌属(Cryplococcus);枝顶孢属(Acremonium);弯颈霉属(Toypocladium);柱顶孢霉(Scytalidium);裂褶菌属(Schizophyllum);侧孢霉属(Sporotrichum);青霉属(Penicillium)(例如,P.bilaiae、沙门柏干酪青霉(P.camemberti)、白青霉(P.candidum)、产黄青霉(P.chrysogenum)、扩展青霉(P.expansum)、绳状青霉(P.funiculosum)、灰绿青霉(P.glaucum)、马尔尼菲青霉(P.marneffei)、娄地青霉(P.roqueforti)、疣孢青霉(P.verrucosum)、鲜绿青霉(P.viridicatum));赤霉菌属(Gibberella)(例如,G.acuminata、燕麦赤霉菌(G.avenacea)、G.baccata、G.circinata、G.cyanogena、藤仓赤霉(G.fujikuroi)、错综赤霉(G.intricans)、虱状赤霉(G.pulicaris)、G.stilboides、G.tricmcta、玉米赤霉(G.zeae));毁丝霉属(Myceltophthora);毛霉属(Mucor)(例如,鲁西氏毛霉菌(M.rouxii)、卷枝毛霉(M.circinelloides);曲霉属(Aspergillus)(例如,黑曲霉(A.niger)、米曲霉(A.oryzae)、构巢曲霉(A.nidulans)、黄曲霉(A.flavus)、A.lentulus、土曲霉(A.terreus)、棒曲霉(A.clavatus)、烟曲霉(A.fumigatus));镰刀菌属(Fusarium)(例如,禾谷镰刀菌(F.graminearum)、尖孢镰刀菌(F.oxysporum)、F.bubigenum、腐皮镰刀菌(F.solani)、尖孢镰刀菌(F.oxysporum)、轮枝镰刀菌(F.verticillioides)、层生镰刀菌(F.proliferatum)、镶片镰刀菌(F.venenatum));以及腐质霉属(Humicola),及其无性型和有性型。必要时,可以通过Barnett和Hunter(Illustrated Genera of Imperfect Fungi, 3rd Edition,Burgess Publishing Company,1972[不完全真菌的示例性属(第3版),伯吉斯出版公司,1972)]中披露通过形态来定义本文中的真菌的属和物种。
在某些方面,本文中的酵母可以是无性生殖(无性型)或有性生殖(有性型)的酵母。虽然本文中的酵母通常以单细胞形式存在,但是某些类型的这些酵母可任选地能够形成假菌丝(连接的芽殖细胞的串)。在仍另外的方面,酵母可以是单倍体或二倍体,和/或可以具有以这些倍性形式中的任一者存在的能力。
本文中酵母的实例包括常规酵母和非常规酵母。例如,本文中的常规酵母包括以下属的物种:酵母属(Saccharomyces)(例如,酿酒酵母(S.cerevisiae),其也被称为芽殖酵母、烘焙酵母、和/或啤酒酵母;贝酵母(S.bayanus);布拉酵母(S.boulardii);S.bulderi;S.cariocanus;S.cariocus;薛瓦酵母(S.chevalieri);S.dairenensis;葡萄酒酵母(S.ellipsoideus);真贝酵母(S.eubayanus);少孢酵母(S.exiguus);S.florentinus;克鲁弗酵母(S.kluyveri);S.martiniae;S.monacensis;S.norbensis;奇异酵母(S.paradoxus);巴氏酵母(S.pastorianus);S.spencerorum;S.turicensis;单孢酵母(S.unisporus);葡萄汁酵母(S.uvarum);S.zonatus)以及裂殖酵母属(Schizosaccharomyces)(例如,粟酒裂殖酵母(S.pombe),其也被称为裂殖酵母;S.cryophilus;S.japonicus;八孢裂殖酵母(S.octosporus))。
本文中的非常规酵母不是常规酵母,例如酵母属(例如酿酒酵母)或裂殖酵母属(例如粟酒裂殖酵母)物种。本文中的非常规酵母可以按照本领域已知的任何手段进行培兼,这些手段是例如在以下文献中所描述的:Non-Conventional Yeasts in Genetics, Biochemistry and Biotechnology:Practical Protocols(K.Wolf,K.D.Breunig,G.Barth,Eds.,Springer-Verlag,Berlin,Germany,2003)[遗传学、生物化学和生物技术中 的非常规酵母:实践方案(K.Wolf、K.D.Breunig、G.Barth,编辑,德国柏林施普林格出版社,2003)],Yeasts in Natural and Artificial Habitats(J.F.T.Spencer,D.M.Spencer,Eds.,Springer-Verlag,Berlin,Germany,1997)[在天然和人工栖息地的酵母(J.F.T.Spencer、D.M.Spencer,编辑,德国柏林施普林格出版社,1997)]和/或Yeast Biotechnology:Diversity and Applications(T.Satyanarayana,G.Kunze,Eds.,Springer,2009)[酵母生物技术:多样性与应用(T.Satyanarayana、G.Kunze,编辑,施普林格出版社,2009)],其全部通过引用结合在此。
本文中的非常规酵母的非限制性实例包括以下属的酵母:耶氏酵母属(Yarrowia)、毕赤酵母属(Pichia)、许旺酵母属(Schwanniomyces)、克鲁维酵母属(Kluyveromyces)、Arxula、毛孢子菌属(Trichosporon)、假丝酵母属(Candida)、黑粉菌属(Ustilago)、球拟酵母属(Torulopsis)、接合酵母属(Zygosaccharomyces)、三角酵母属(Trigonopsis)、隐球菌属(Cryptococcus)、红酵母属(Rhodotorula)、法夫酵母属(Phaffia)、掷孢酵母属(Sporobolomyces)、管囊酵母属(Pachysolen)、和小丛梗孢属(Moniliella)。耶氏酵母属(Yarrowia)物种的合适的实例是解脂耶氏酵母(Y.lipolytica)。毕赤酵母属(Pichia)物种的合适的实例包括巴斯德毕赤酵母(P.pastoris)(还被称为巴斯德驹田氏酵母(Komagataella pastoris))、甲醇毕赤酵母(P.methanolica)、树干毕赤酵母(P.stipitis)、异常毕赤酵母(P.anomala)和安格斯毕赤酵母(P.angusta)(还被称为多形汉逊酵母(Hansenula polymorpha))。许旺酵母属(Schwanniomyces)物种的合适的实例包括S.castellii、S.alluvius、S.hominis、S.occidentalis、S.capriottii、S.etchellsii、多形许旺酵母(S.polymorphus)、假多形许旺酵母(S.pseudopolymorphus)、S.vanrijiae和S.yamadae。克鲁维酵母属(Kluyveromyces)物种的合适的实例包括乳酸克鲁维酵母(K.lactis)、马克斯克鲁维酵母(K.marxianus)、脆弱克鲁维酵母(K.fragilis)、K.drosophilarum、耐热克鲁维酵母(K.thermotolerans)、K.phaseolosporus、K.vanudenii、K.waltii、非洲克鲁维酵母(K.africanus)和多孔克鲁维酵母(K.polysporus)。Arxula物种的合适的实例包括A.adeninivorans和A.terrestre。毛孢子菌属(Trichosporon)物种的合适的实例包括皮状丝孢酵母(T.cutaneum)、头状丝孢酵母(T.capitatum)、墨汁丝孢酵母(T.inkin)和T.beemeri。假丝酵母属(Candida)物种的合适的实例包括白色念珠菌(C.albicans)、C.ascalaphidarum、C.amphixiae、南极洲假丝酵母(C.antarctica)、蜂生假丝酵母(C.apicola)、C.argentea、大西洋假丝酵母(C.atlantica)、大气假丝酵母(C.atmosphaerica)、C.blattae、C.bromeliacearum、C.carpophila、C.carvajalis、C.cerambycidarum、C.chauliodes、C.corydali、C.dosseyi、杜氏假丝酵母(C.dubliniensis)、C.ergatensis、果实假丝酵母(C.fructus)、光滑假丝酵母(C.glabrata)、发酵假丝酵母(C.fermentati)、吉利蒙念珠菌(C.guilliermondii)、希木龙假丝酵母(C.haemulonii)、C.insectamens、昆虫假丝酵母(C.insectorum)、中间假丝酵母(C.intermedia)、C.jeffresii、乳酒假丝酵母(C.kefyr)、C.keroseneae、克鲁斯假丝酵母(C.krusei)、葡萄牙假丝酵母(C.lusitaniae)、C.lyxosophila、麦芽糖假丝酵母(C.maltosa)、海洋假丝酵母(C.marina)、膜醭假丝酵母(C.membranifaciens)、梅林假丝酵母(C.milleri)、莫格假丝酵母(C.mogii)、C.oleophila、C.oregonensis、近平滑念珠菌(C.parapsilosis)、桔假丝酵母(C.quercitrusa)、皱褶念珠菌(C.rugosa)、清酒假丝酵母(C.sake)、休哈塔假丝酵母(C.sheharea)、C.temnochilae、纤细假丝酵母(C.tenuis)、C.theae、C.tolerans、热带假丝酵母(C.tropicalis)、C.tsuchiyae、C.sinolaborantium、C.sojae、C.subhashii、维斯假丝酵母(C.viswanathii)、产朊假丝酵母(C.utilis)、C.ubatubensis和C.zemplinina。黑粉菌属(Ustilago)物种的合适的实例包括燕麦散黑粉菌(U.avenae)、茭白黑粉菌(U.esculenta)、大麦坚黑粉菌(U.hordei)、玉蜀黍黑粉菌(U.maydis)、裸黑粉(U.nuda)和小麦散黑粉菌(U.tritici)。球拟酵母属(Torulopsis)物种的合适的实例包括T.geochares、T.azyma、光滑球拟酵母(T.glabrata)和白色球拟酵母(T.candida)。接合酵母属(Zygosaccharomyces)物种的合适的实例包括拜耳接合酵母(Z.bailii)、双孢接合酵母(Z.bisporus)、Z.cidri、发酵型结合酵母(Z.fermentati)、Z.florentinus、Z.kombuchaensis、Z.lentus、Z.mellis、Z.microellipsoides、Z.mrakii、Z.pseudorouxii和鲁氏接合酵母(Z.rouxii)。三角酵母属(Trigonopsis)物种的合适的实例包括变异三角酵母(T.variabilis)。隐球菌属(Cryptococcus)物种的合适的实例包括罗伦隐球酵母(C.laurentii)、浅白隐球酵母(C.albidus)、新型隐球菌(C.neoformans)、格特隐球菌(C.gattii)、单咽隐球菌(C.unlguttulatus)、C.adeliensis、C.aerius、C.albidosimilis、C.antarcticus、C.aquaticus、黑隐球酵母(C.ater)、C.bhutanensis、C.consortionis、弯曲隐球菌(C.curvatus)、C.phenolicus、C.skinneri、地生隐球酵母(C.terreus)和C.vishniacci。红酵母属(Rhodotorula)物种的合适的实例包括瘦果红酵母(R.acheniorum)、R.tula、R.acuta、北美红酵母(R.americana)、R.araucariae、北极红酵母(R.arctica)、R.armeniaca、橙黄红酵母(R.aurantiaca)、R.auriculariae、高产酵母菌株(R.bacarum)、海洋红酵母(R.benthica)、R.biourgei、R.bogoriensis、支气管红酵母(R.bronchialis)、R.buffonii、R.calyptogenae、R.chungnamensis、R.cladiensis、珊瑚藻红酵母(R.corallina)、R.cresolica、R.crocea、R.cycloclastica、R.dairenensis、分流红酵母(R.diffluens)、R.evergladiensis、R.ferulica、R.foliorum、草莓红酵母(R.fragaria)、R.fujisanensis、R.futronensis、胶状红酵母(R.gelatinosa)、冰河红酵母(R.glacialis)、粘红酵母(R.glutinis)、瘦弱红酵母(R.gracilis)、牧草红酵母(R.granunis)、R.grinbergsii、R.himalayensis、R.hinnulea、落组织红酵母(R.histolytica)、袋唇兰红酵母(R.hylophila)、肉色红酵母(R.incarnata)、R.ingeniosa、R.javanica、R.koishikawensis、R.lactosa、R.lamellibrachiae、喉小囊红酵母(R.laryngis)、嗜木红酵母(R.lignophila)、R.lini、R.longissima、R.ludwigii、R.lysinophila、海洋红酵母(R.marina)、R.martyniae-fragantis、R.matritensis、R.meli、小红酵母(R.minuta)、粘质红酵母(R.mucilaginosa)、R.nitens、R.nothofagi、稻红酵母(R.oryzae)、太平洋红酵母(R.pacifica)、浅红酵母(R.pallida)、R.peneaus、R.philyla、R.phylloplana、R.pilatii、果蝇红酵母(R.pilimanae)、R.pinicola、褶皱红酵母(R.plicata)、多形红酵母(R.polymorpha)、R.psychrophenolica、嗜冷红酵母(R.psychrophila)、R.pustula、R.retinophila、R.rosacea、R.rosulata、发红红酵母(R.rubefaciens)、R.rubella、变红红酵母(R.rubescens)、深红酵母(R.rubra)、R.rubrorugosa、R.rufula、R.rutila、血红色红酵母(R.sanguinea)、R.sanniei、R.sartoryi、R.silvestris、R.simplex、R.sinensis、斯鲁菲亚红酵母(R.slooffiae)、R.sonckii、R.straminea、R.subericola、R.suganii、台湾红酵母(R.taiwanensis)、R.taiwaniana、R.terpenoidalis、土地红酵母(R.terrea)、R.texensis、东京红酵母(R.tokyoensis)、R.ulzamae、香草红酵母(R.vanillica)、R.vuilleminii、欧蓍草红酵母(R.yarrowii)、R.yunnanensis和R.zsoltii。法夫酵母属(Phaffia)物种的合适的实例包括红法夫酵母(P.rhodozyma)。掷孢酵母属(Sporobolomyces)物种的合适的实例包括S.alborubescens、S.bannaensis、北京掷孢酵母(S.beijingensis)、S.bischofiae、S.clavatus、S.coprosmae、S.coprosmicola、S.corallinus、S.dimmenae、S.dracophylli、S.elongatus、S.gracilis、S.inositophilus、S.johnsonii、S.koalae、S.magnisporus、S.novozealandicus、香掷孢酵母(S.odorus)、S.patagonicus、长生蜿掷孢酵母(S.productus)、玫瑰掷孢酵母(S.roseus)、(S.sasicola)、S.shibatanus、S.singularis、(S.subbrunneus)、匀称掷孢酵母(S.symmetricus)、S.syzygii、S.taupoensis、S.tsugae、克桑托斯掷孢酵母(S.xanthus)和云南掷孢酵母(S.yunnanensis)。管囊酵母属(Pachysolen)和小丛梗孢属(Moniliella)物种的合适的实例分别包括嗜鞣管囊酵母(P.tannophilus)和丛梗孢酵母(M.pollinis)。本文中的非常规酵母的其他实例还包括Pseudozyma属物种(例如,S.antarctica)、Thodotorula属物种(例如,T.bogoriensis)、Wickerhamiella属物种(例如,W.domercqiae)、Starmerella属物种(例如,S.bombicola)、Debaryomyces属物种(例如,D.hansenii)、Ogataea属物种(例如,O.angusta)、和阿舒囊霉属(Ashbya)属物种(例如,棉阿舒囊霉(A.gossypii))。
在某些实施例中,酵母是耶氏酵母属酵母(例如解脂耶氏酵母)。合适的解脂耶氏酵母的实例包括可获得自美国典型培养物保藏中心(American Type CultureCollection)(ATCC,弗吉尼亚州马纳萨斯)的以下分离株:菌株名称ATCC#20362、#8862、#8661、#8662、#9773、#15586、#16617、#16618、#18942、#18943、#18944、#18945、#20114、#20177、#20182、#20225、#20226、#20228、#20327、#20255、#20287、#20297、#20315、#20320、#20324、#20336、#20341、#20346、#20348、#20363、#20364、#20372、#20373、#20383、#20390、#20400、#20460、#20461、#20462、#20496、#20510、#20628、#20688、#20774、#20775、#20776、#20777、#20778、#20779、#20780、#20781、#20794、#20795、#20875、#20241、#20422、#20423、#32338、#32339、#32340、#32341、#34342、#32343、#32935、#34017、#34018、#34088、#34922、#34922、#38295、#42281、#44601、#46025、#46026、#46027、#46028、#46067、#46068、#46069、#46070、#46330、#46482、#46483、#46484、#46436、#60594、#62385、#64042、#74234、#76598、#76861、#76862、#76982、#90716、#90811、#90812、#90813、#90814、#90903、#90904、#90905、#96028、#201241、#201242、#201243、#201244、#201245、#201246、#201247、#201249、和/或#201847。
在某些实施例中,微生物细胞是藻类细胞。例如,藻类细胞可以来自以下各项中的任一种:绿藻门(Chlorophyta)(绿藻)、红藻门(Rhodophyta)(红藻)、褐藻纲(Phaeophyceae)(褐藻)、硅藻纲(Bacillariophycaeae)(矽藻)和涡鞭藻(Dinoflagellata)(鞭毛藻类)。在其他方面,藻类细胞可以是微藻类(例如,浮游植物、微小植物、或浮游藻类)或大型藻类(巨藻、海草)。作为另外的实例,本文中的藻类细胞可以是以下属的物种:衣藻属(Chlamydomonas)(例如,莱茵衣藻(C.reinhardtii));紫菜属(Porphyra)(紫菜);第三腕板属(Palmaria)(例如,掌形藻(P.palmata)[掌状红皮藻]);节旋藻属(Arthrospira)(例如,钝顶节旋藻(A.platensis)[螺旋藻属(spirulina)]);小球藻属(Chlorella)(例如,原始小球藻(C.protothecoides),小球藻(C.vulgaris));角叉菜属(Chondrus)(例如,皱波角叉菜(C.crispus)[爱尔兰藓]);丝囊藻属(Aphanizomenon);马尾藻属(Sargassum);海茸属(Cochayuyo);葡萄藻属(Botryococcus)(例如,布朗葡萄藻(B.braunii));杜氏藻属(Dunaliella)(例如,杜氏盐藻(D.tertiolecta)、盐生杜氏藻(D.salina));江蓠属(Gracilaria);Pleurochrysis(例如,P.carterae);纤维藻属(Ankistrodesmus);小环藻属(Cyclotella);菱板藻属(Hantzschia);微球藻属(Nannochloris);微拟球藻属(Nannochloropsis);菱形藻属(Nitzschia);褐指藻属(Phaeodactylum)(例如,三角褐指藻(P.tricornutum));栅列藻属(Scenedesmus)(例如,斜生栅藻(S.obliquus));裂丝藻属(Stichococcus);扁藻属(Tetraselmis)(例如,T.suecica);海链藻属(Thalassiosira)(例如,假微型海链藻(T.pseudonana));隐甲藻属(Crypthecodinium)(例如,寇氏隐甲藻(C.cohnii));新绿藻属(Neochloris)(例如,富油新绿藻(N.oleoabundans));或Schiochytrium。可以如例如在Thompson(Algal Cell Culture.Encvclopedia of Life Support System(EOLSS),Biotechnology Vol 1[藻类细胞培养,生命支持系统百科全书 (EOLSS),生物技术,第1卷],可获自eolss.net/sample-chapters互联网网站)(其通过引用结合在此)中所述的培养和/或操作藻类物种。
在某些实施例中,细菌细胞可以是球菌、杆菌、螺旋体、原生质球、原生质体等形式的细菌细胞。细菌的仍其他非限制性实例包括以下属中的那些:沙门氏菌属(Salmonella)(例如,伤寒沙门氏菌(S.typhi)、肠炎沙门氏菌(S.enteritidis))、志贺氏菌属(Shigella)(例如,痢疾志贺氏菌(S.dysenteriae))、埃希氏菌属(Fscherichia)(例如,大肠杆菌(E.coli))、肠杆菌属(Enterobacter)、沙雷氏菌属(Serratia)、变形杆菌属(Proteus)、柠檬酸杆菌属(Citrobacter)、爱德华菌属(Edwardsiella)、普罗维登斯菌属(Providencia)、克雷伯菌属(Klebsiella)、哈夫尼菌属(Hafnia)、爱文菌属(Ewingella)、克吕沃氏菌属(Kluyvera)、摩根氏菌属(Morganella)、动性球菌属(Planococcus)、口腔球菌属(Stomatococcus)、微球菌属(Micrococcus)、葡萄球菌属(Staphylococcus)(例如,金黄色葡萄球菌(S.aureus))、弧菌属(Vibrio)(例如,霍乱弧菌(V.cholerae))、气单胞菌属(Aeromonas)、毗邻单胞菌属(Plessiomonas)、嗜血杆菌属(Actinobacillus)、巴斯德氏菌属(Pasteurella)、脲原体属(Ureaplasma)、柯克斯氏体属(Coxiella)、罗沙利马体属(Rochalimaea)、埃立克体属(Ehrlichia)、链球菌属(Streptococcus)(例如,化脓性链球菌(S.pyogenes)、变异链球菌(S.mutans)、肺炎链球菌(S.pneumoniae))、肠球菌属(Enterococcus)(例如,粪肠球菌(E.faecalis))、气球菌属(Aerococcus)、兼性双球菌属(Gemella)、乳球菌属(Lactococcus)(例如,乳酸乳球菌(L.lactis))、明串珠菌属(Leuconostoc)(例如,肠膜明串珠菌(L.mesenteroides))、片球菌属(Pedicoccus)、芽孢杆菌属(Bacillus)(例如,蜡样芽孢杆菌(B.cereus)、枯草芽孢杆菌(B.subtilis)、苏云金芽孢杆菌(B.thuringiensis))、棒状杆菌属(Corynebacterium)(例如,白喉棒状杆菌(C.diphtheriae))、隐秘杆菌属(Arcanobacterium)、放线菌属(Actinomyces)、红球菌属(Rhodococcus)、李斯特菌属(Listeria)(例如,单核细胞增生李斯特菌(L.monocytogenes))、丹毒杆菌属(Erysipelothrix)、加德纳菌属(Gardnerella)、弯曲菌属(Campylobacter)、弓形杆菌属(Arcobacter)、沃廉菌属(Wolinella)、无色杆菌属(Achromobacter)、不动杆菌属(Acinetobacter)、农杆菌属(Agrobacterium)(例如,根癌农杆菌(A.tumefaciens))、产碱杆菌属(Alcaligenes)、华丽单胞菌属(Chryseomonas)、丛毛单胞菌属(Comamonas)、埃肯菌属(Eikenella)、黄色单胞菌(Flavimonas)、黄杆菌属(Flavobacterium)、摩拉克氏菌属(Moraxella)、寡源杆菌属(Oligella)、假单胞菌属(Pseudomonas)(例如,铜绿假单胞菌(P.aeruginosa))、希瓦氏菌属(Shewanella)、威克氏菌(Weeksella)、黄单胞杆菌属(Xanthomonas)、弗朗西斯氏菌属(Franciesella)、阿菲波菌属(Afipia)、巴尔通氏体属(Bartonella)、荚膜菌属(Calymmatobacterium)、心杆菌属(Cardiobacterium)、链杆菌属(Streptobacillus)、螺旋状菌属(Spirillum)、消化链球菌属(Peptostreptococcus)、消化球菌(Peptococcus)、Sarcinia、粪球菌属(Coprococcus)、瘤胃球菌属(Ruminococcus)、丙酸杆菌属(Propionibacterium)、动弯杆菌属(Mobiluncus)、双歧杆菌属(Bifidobacterium)、真细菌属(Eubacterium)、乳杆菌属(Lactobacillus)(例如,乳酸乳杆菌(L.lactis)、嗜酸乳杆菌(L.acidophilus))、罗思氏菌属(Rothia)、梭菌属(Clostridium)(例如,肉毒梭菌(C.botulinum)、产气荚膜梭菌(C.perfringens))、多形杆状菌属(Bacteroides)、卟啉单胞菌属(Porphyromonas)、普雷沃菌属(Prevotella)、梭形杆菌属(Fusobacterium)、嗜胆菌属(Bilophila)、纤毛菌属(Leptotrichia)、沃林氏菌属(Wolinella)、氨基酸球菌属(Acidaminococcus)、巨球型菌属(Megasphaera)、韦荣氏球菌属(Veilonella)、诺卡氏菌属(Norcardia)、马杜拉放线菌属(Actinomadura)、拟诺卡氏菌属(Norcardiopsis)、链霉菌属(Streptomyces)、小多孢菌属(Micropolysporas)、高温放线菌属(Thermoactinomycetes)、密螺旋体属(Treponema)、细螺旋体属(Leptospira)、和衣原体(Chlamydiae)。
本文中的重组细胞可以从含有长链脂肪酸的底物产生一种或多种LCDA产物。例如,如目前披露的可由细胞在一定体积的培养基中产生的LCDA的总量可以是约或至少约10g/L、20g/L、30g/L、40g/L、50g/L、60g/L、70g/L、80g/L、90g/L、100g/L、110g/L、或120g/L(或者在5g/L与120g/L之间的任何整数)。如与合适的对照细胞(例如,亲本细胞)相比,当在相同的发酵条件下生长时,本披露的重组细胞的实例可以表现出在LCDA生产中至少10倍至1000倍的增加。例如,这样的增加可以是约或至少约10倍、25倍、50倍、75倍、100倍、150倍、200倍、250倍、300倍、400倍、500倍、750倍、或1000倍。
通过本文中的细胞产生的LCDA的同质性或异质性的程度典型地取决于向细胞供给的含有长链脂肪酸的底物的性质。例如,用包含一种类型的长链脂肪酸的底物(含有同质的脂肪酸的底物)生长的细胞可以典型地生产主要含有(例如,至少50wt%、55wt%、60wt%、65wt%、70wt%、或75wt%)与底物中的脂肪酸具有相同的碳链长度的LCDA的LCDA产物。举例而言,在一些方面,在具有仅含有棕榈酸(C16:0)或油酸(C18:1)的底物的培养基中生长的细胞典型地可以生产含有至少50wt%的分别具有碳链长度为16或18的LCDA产物的LCDA。
在一些方面,用包含超过一种类型的长链脂肪酸的底物(含有异质的脂肪酸的底物)生长的细胞可以典型地生产具有通常与底物中脂肪酸的对应的碳链长度成比例的碳链长度的LCDA产物分布。例如,本文中与大豆油生长的细胞可以生产主要含有(例如,至少50wt%、55wt%、60wt%、65wt%、70wt%、或75wt%)具有碳链长度为18的LCDA产物,该大豆油典型地包含约7%α-亚麻酸(C18:3)、约55%亚油酸(C18:2)、约23%油酸(C18:1)、约4%硬脂酸(C18:0)、和约11%棕榈酸(C16:0)的脂肪酸(因此,约89%的脂肪酸是C18,并且约11%是C16)。
例如,在本文中的LCDA可以具有10至24的碳链长度。例如,LCDA可以是C10、C11、C12、C13、C14、C15、C16、C17、C18、C19、C20、C21、C22、C23、或C24LCDA。在一些实施例中,LCDA可以具有10-22、12-22、14-22、16-22、18-22、20-22、16-18、16-20、或16-22个碳原子的链长度。在某些方面,LCDA产物的实例是饱和的(其碳链不包含任何双键),并且在表A中列出。
表A
LCDA产物的实例
Figure BDA0001604529540000711
本文中的LCDA产物的仍其他的实例是不饱和的。不饱和的LCDA可以包含例如具有1、2、3、4、5、或6个双键的脂肪族碳链。本文中的不饱和的LCDA的实例包括C16:1、C16:2、C18:1、C18:2、C18:3、C18:4、C20:1、C20:2、C20:3、C20:4、C20:5、C22:1、C22:2、C22:3、C22:4、C22:5和C22:6。可以例如通过用包含具有相应的链长度和饱和/不饱和分布的脂肪酸的底物使目前披露的重组细胞生长来生产任何前述LCDA。在LCDA产物的碳链中不饱和的一个或多个位置可以对应于例如用于制备LCDA的包含脂肪酸的底物中不饱和的一个或多个位置。
例如,如在本文中含有长链脂肪酸的底物中提供的长链脂肪酸可以具有至少10的碳链长度,或10至24个碳原子的长度。长链脂肪酸可以是例如C10、C11、C12、C13、C14、C15、C16、C17、C18、C19、C20、C21、C22、C23、或C24长链脂肪酸。在一些实施例中,长链脂肪酸可以具有10-24、12-24、14-24、16-24、18-24、20-24、10-22、12-22、14-22、16-22、18-22、20-22、16-18、16-20、或16-22个碳原子的链长度。尽管目前披露的底物包含具有碳链长度为至少10或在10至24个碳原子范围的脂肪酸,但是如果需要,底物中还可以存在其他类型的脂肪酸。例如,底物可以进一步包含一种或多种类型的具有碳链长度小于10的脂肪酸。
本文中的长链脂肪酸可以是饱和的或不饱和的。不饱和的长链脂肪酸的实例是单不饱和的脂肪酸(MUFA)(如果脂肪酸碳链中仅存在一个双键)、和多不饱和的脂肪酸(PUFA)(如果该脂肪酸碳链具有两个或更多个双键)。本文中的长链脂肪酸的实例提供在表B中。
表B
可以被包含在底物中的长链脂肪酸的实例
Figure BDA0001604529540000721
Figure BDA0001604529540000731
在一些情况下,长链脂肪酸可以是经取代的脂肪酸,只要该脂肪酸对细胞是无毒的或仅展示出低毒性。例如,脂肪酸的脂肪族链中的一个或多个氢可以任选地被卤素、乙酰基、OR、NR2、或SR基团取代,其中R独立地是H或C1-C8烷基基团。本文中经取代的脂肪酸的某些实例包括具有ω-醇或ω-醛基团的脂肪酸。
在本文的一些方面,如目前披露的含有长链脂肪酸的底物可以包含游离的长链脂肪酸。这样的脂肪酸可以任选地被表征为非酯化的长链脂肪酸或非连接的长链脂肪酸。例如,本文披露的任何长链脂肪酸(例如,如在表B中列出)可以包含在这样的底物中。含有游离的长链脂肪酸的底物的其他实例包括油的脂肪酸馏出物。脂肪酸馏出物可以是本文披露的任何油,例如植物油(例如,棕榈油脂肪酸馏出物[PFAD])。
在一些方面,如目前披露的含有长链脂肪酸的底物可以包含酯化的长链脂肪酸。例如,本文披露的任何长链脂肪酸(例如,如在表B中列出)可以包含在这样的底物中。本文中酯化的长链脂肪酸的一些实例包括长链脂肪酸,该长链脂肪酸包括在甘油酯分子或脂肪酸烷基酯内。
本文中的甘油酯分子可以是单-、二-、或三酸甘油酯、或其混合物。在那些实施例中,其中含有长链脂肪酸的底物包含二-和/或三酸甘油酯,并非其所有酯化的脂肪酸必需是长链脂肪酸。在一些实施例中,将本文中的甘油酯分子典型地作为油提供,尽管还可以将该分子作为脂肪提供。因此,含有长链脂肪酸的底物可以任选地被表征为含有一种或多种类型的油和/或脂肪。
在本文中适合使用的油(或脂肪)的实例可以来源于植物、微生物、酵母、真菌、细菌、藻类、眼虫藻、原生藻菌、动物、家禽和鱼。植物油(蔬菜油)的实例包括低芥酸菜籽油、玉米油、棕榈仁油、cheru籽油、野生杏仁油、芝麻油、高粱油、大豆油、油菜籽油、黄豆油、菜籽油、妥尔油、向日葵油、大麻籽油、橄榄油、亚麻籽油、椰子油、蓖麻油、花生油、棕榈油、芥子油、棉籽油、亚麻籽油、麻疯果油和海甘蓝油。本文中的油和脂肪的其他实例包括提炼的脂肪和油;餐厅油脂;黄色和棕色油脂;废工业炸油;牛脂;猪油;鲸油;奶中的脂肪;鱼油;藻油;酵母油;微生物油;来自酵母生物质、微生物生物质、污泥的油/脂肪;以及磷脂(例如,如在皂料中提供的)。在本文中可使用的油的仍其他实例包括(i)化石燃料衍生的油(例如来自石油基产品的油)、废机油和工业润滑剂、煤衍生的液体;(ii)作为来自石化和化学工艺的副产物产生的合成油;和(iii)来自工业废物和/或农业废物的油。
例如本文中的脂肪酸烷基酯可以包括C1-C10烷基基团,例如分别是甲基、乙基、丙基、丁基、戊基、己基、庚基、辛基、壬基或癸基基团。实例包括脂肪酸甲基酯和脂肪酸乙基酯。然而本文中披露的任何长链脂肪酸可以被包括在脂肪酸烷基酯中,一些实例包括C16(例如,棕榈酸)和C18(例如,油酸)脂肪酸。可以将脂肪酸烷基酯的一种或其混合物与本文中的细胞一起使用用于LCDA生产。在一些方面,使用本领域中已知的任何适当的方法,可以通过本文披露的任何油或脂肪(即,脂质)与醇(例如,甲醇或乙醇)进行化学反应提供脂肪酸烷基酯的混合物来产生脂肪酸酯。这样的混合物的实例是生物柴油,该生物柴油典型地来源于蔬菜油或动物油脂(例如,牛脂)。
在一些方面,如目前披露的含有长链脂肪酸的底物可以包含酰胺连接的长链脂肪酸。本文中酰胺连接的长链脂肪酸的实例包括脂肪酰胺、酰基氨基-糖和酰基氨基-聚糖。例如,可以将本文披露的任何长链脂肪酸(例如,如在表B中列出)作为酰胺连接的长链脂肪酸提供。
据信本文中的细胞,尽管描述为从含有长链脂肪酸的底物生产LCDA,还能够从其他有机底物(例如烷烃、脂肪醇、和/或脂肪醛)生产LCDA。这样的其他底物可以具有如本文披露的针对含有长链脂肪酸的底物的相同的碳链长度。
本披露还涉及产生一种或多种长链二羧酸(LCDA)的方法。此方法包括使如本文披露的重组细胞(例如,微生物细胞,例如酵母细胞)与含有长链脂肪酸的底物接触,其中该细胞从底物合成LCDA。此方法进一步包括回收由细胞合成的LCDA的任选的步骤。
例如,可以使用上文披露的实施例或下文实例的一种或多种特征中的任一种(例如,与细胞类型有关的特征;ACoS酶序列;CYP和/或CPR酶序列;FAO、FADH、和/或FALDH酶序列;Pex3蛋白质序列等)来实践该方法。因此,可以适当地使用在上文或实例中披露的任何特征或这些特征的任意组合来表征本文的LCDA生产方法的实施例。以下的方法特征是另外的实例。
如目前披露的LCDA生产方法包括使重组细胞与含有长链脂肪酸的底物接触的步骤,其中该细胞从底物合成LCDA。这样的接触步骤可以任选地被表征为在包含含有脂肪酸的底物的培养基中孵育、培养重组细胞、和/或使重组细胞生长。如果需要,此接触步骤还可以被表征为发酵步骤(例如,从含有长链脂肪酸的底物发酵LCDA)(例如,LCDA发酵方法)。
例如,用于发酵本文中的LCDA的合适的pH(例如,使细胞与含有长链脂肪酸的底物接触的培养基的pH)是在约pH 4.0至9.0之间。在此范围的合适的pH可以是例如,约4.0、4.5、5.0、5.5、6.0、6.5、7.0、7.5、8.0、8.5、或9.0。在一些其他方面,可以使用在约pH 7.5至8.5的范围内的pH。有时可以将约5.5至7.5的pH用于初始生长条件。
用于发酵本文的LCDA的合适的温度(例如,使细胞与含有长链脂肪酸的底物接触的培养基的温度)可以是本文中的重组细胞展示出最佳生长的温度。合适的温度的实例包括约15℃、16℃、17℃、18℃、19℃、20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、或35℃。在一些情况下,可以使用的合适的温度范围包括25℃-32℃、28℃-32℃、和28℃-30℃。
用一种或多种含有长链脂肪酸的底物使重组细胞生长用于发酵一种或多种LCDA的时间的量可以是约或至少约36、48、60、72、84、96、108、120、132、144、156、168、180、192、204、216、228、或240小时。在某些其他实施例中,发酵时间段可以是约3-7、4-6、或5天。在与一种或多种含有长链脂肪酸的底物初始接触之前,可以任选地使细胞生长约12-24小时。
在使本文的重组微生物细胞与一种或多种这样的底物接触的培养基中,一种或多种含有长链脂肪酸的底物的浓度可以是例如约或至少约1g/L、3g/L、5g/L、10g/L、15g/L、20g/L、25g/L、30g/L、35g/L、40g/L、45g/L、50g/L、55g/L、60g/L、65g/L、70g/L、75g/L、80g/L、85g/L、90g/L、95g/L、或100g/L(或者在1g/L至100g/L之间的任何整数)。在某些其他实施例中,这样的浓度可以是约3g/L-30g/L或5g/L-20g/L。这些浓度中的任一种都可以是初始浓度(起始浓度),该浓度是刚添加到用微生物细胞发酵LCDA的培养基中之后存在的底物的浓度。例如,初始的含有长链脂肪酸的底物浓度可以任选地表征在脉冲进料或连续进料开始时的浓度。
在一些实施例中,可以使用分批、补料分批、或连续发酵过程进行LCDA发酵方法。分批发酵方法典型地包括封闭系统,其中将培养基(包括含有长链脂肪酸的底物)在过程开始时固定,并且除了在发酵期间维持pH和/或氧气水平可能需要的那些以外不进行进一步的添加/修改。本文中的补料分批过程类似于分批过程,除了对该过程进行除了在发酵期间维持pH和/或氧气水平可能需要的那些以外的一种或多种添加/修改。例如,在该过程期间可以将含有长链脂肪酸的底物添加至该系统中;这样的添加可以是交错的/周期性的或连续的。分批和补料分批培养方法在本领域中是已知的(例如,Brock,Biotechnology:A Textbook of Industrial Microbiology[生物技术:工业微生物学的教科书],第2版,(Sinauer协会:桑德兰,马萨诸塞州(Sunderland,Mass),1989;Deshpande,Appl.Biochem.Biotechnol.[应用生物化学与生物技术]36:227-234)。本文中的连续发酵过程通常可以通过向发酵容器连续添加限定的培养基来进行,同时去除等量的用于LCDA产物回收的培养体积。Brock披露了连续发酵方法。
还可以任选地应用其他培养条件来执行本文的LCDA生产方法。例如,重组细胞可以在需氧(例如微氧)或厌氧条件下培养,其中前者在一些情况下是优选的。可以向培养物任选地应用处于摇动或旋转形式的搅动,例如以约100rpm、150rpm、200rpm、300rpm、500rpm、800rpm、1000rpm、1200rpm、1500rpm、1800rpm、或2000rpm的速率。在另一个实例中,可以使用两阶段过程,其中第一阶段促进细胞增殖,并且第二阶段促进LCDA生产。在又其他实例中,可以使用如目前披露的两种、三种、四种或更多种不同类型的重组细胞(优选相同的物种、属或科)。
例如,如目前披露的LCDA生产方法中生产的一种或多种LCDA的总量可以是约或至少约10g/L、20g/L、30g/L、40g/L、50g/L、60g/L、70g/L、80g/L、90g/L、100g/L、110g/L、或120g/L(或者在5g/L至120g/L之间的任何整数)。这些浓度可以是如在使本文的微生物细胞与含有长链脂肪酸的底物接触的培养基中和在任何上文披露的生长阶段测量的。在本文中的某些LCDA生产方法中LCDA生产的速率可以是约或至少约0.10g/L/小时、0.15g/L/小时、0.20g/L/小时、0.25g/L/小时、0.30g/L/小时、0.35g/L/小时、0.40g/L/小时、0.45g/L/小时、0.50g/L/小时、0.55g/L/小时、0.60g/L/小时、0.65g/L/小时、0.70g/L/小时、0.75g/L/小时、0.80g/L/小时、0.85g/L/小时、0.90g/L/小时、0.95g/L/小时、1.00g/L/小时、1.05g/L/小时、1.10g/L/小时、1.15g/L/小时、或1.20g/L/小时。在某些方面,导致任何LCDA输出量的这些测量的微生物细胞的起始量可以是以下实例中测试的那些量中的任何量。
可以任选地分离在本文中的LCDA生产方法中由细胞合成的一种或多种LCDA产物。可以应用用于从发酵液中分离LCDA的在本领域中已知的任何方法,例如像在美国专利申请公开号2014/0228587和2012/0253069中披露的方法,将这些申请通过引用结合在此。而且,例如可以使用在以下实例中披露的任何LCDA分离方法。
在本文中的LCDA合成方法期间,一种或多种ω-羟基长链脂肪酸和/或ω-醛长链脂肪酸作为中间物产生(参考图1和2)。因此,在本披露的某些可替代的实施例中,可以将合成LCDA的方法任选地表征为生产ω-羟基长链脂肪酸和/或ω-醛长链脂肪酸的方法。例如,这样的一种或多种LCDA代谢产物可以具有对应于任何目前披露的LCDA和长链脂肪酸的碳数目。
本文披露的组合物和方法的非限制性实例包括:
1.一种包括工程化的LCDA生产途径的重组微生物细胞,该LCDA生产途径包括编码长链酰基辅酶A合成酶(ACoS酶)的多核苷酸序列的上调,其中该微生物细胞可以从含有长链脂肪酸的底物生产一种或多种长链二羧酸(LCDA)。
2.如实施例1所述的重组微生物细胞,其中该ACoS酶包含与SEQ ID NO:44、49、36、33、或34具有至少90%同一性的氨基酸序列。
3.如实施例1或2所述的重组微生物细胞,其中该ACoS酶具有长链酰基辅酶A合成酶活性和香豆酰辅酶A合成酶活性两者。
4.如实施例3所述的重组微生物细胞,其中该ACoS酶包含与SEQ ID NO:44或49具有至少90%同一性的氨基酸序列。
5.如实施例1、2、3、或4所述的重组微生物细胞,其中该工程化的LCDA生产途径进一步包括以下特征中的一种或多种:
(i)编码细胞色素P450单加氧酶(CYP酶)的多核苷酸序列的上调,
(ii)编码细胞色素P450还原酶(CPR酶)的多核苷酸序列的上调,
(iii)编码脂肪醇氧化酶(FAO酶)的多核苷酸序列的上调,
(iv)编码脂肪醇脱氢酶(FADH酶)的多核苷酸序列的上调,和/或
(v)编码脂肪醛脱氢酶(FALDH酶)的多核苷酸序列的上调。
6.如实施例5所述的重组微生物细胞,其中编码该CYP酶的多核苷酸序列和编码该CPR酶的多核苷酸序列之一或两者被上调。
7.如实施例1、2、3、4、5、或6所述的重组微生物细胞,其中该微生物细胞进一步包括编码过氧化物酶体生物合成因子的内源多核苷酸序列的下调。
8.如实施例7所述的重组微生物细胞,其中该过氧化物酶体生物合成因子是过氧化物酶体生物合成因子-3。
9.如实施例1、2、3、4、5、6、7、或8所述的重组微生物细胞,其中该微生物细胞进一步包括编码过氧化物酶体酰基辅酶A氧化酶的内源多核苷酸序列的下调。
10.如实施例9所述的重组微生物细胞,其中该过氧化物酶体酰基辅酶A氧化酶是过氧化物酶体酰基辅酶A氧化酶-2、-3、和/或-4。
11.如实施例1、2、3、4、5、6、7、8、9、或10所述的重组微生物细胞,其中该微生物细胞具有降低的脂质合成和/或储存能力。
12.如实施例11所述的重组微生物细胞,其中该降低的脂质合成和储存能力是由于编码二酰基甘油酰基转移酶(DGAT酶)的至少一种内源多核苷酸序列的下调。
13.如实施例1、2、3、4、5、6、7、8、9、10、11、或12所述的重组微生物细胞,其中该微生物细胞是酵母细胞。
14.如实施例13所述的重组微生物细胞,其中该酵母细胞是耶氏酵母属细胞。
15.如实施例1、2、3、4、5、6、7、8、9、10、11、12、13、或14所述的重组微生物细胞,其中该LCDA产物具有10至24个碳原子的链长度,和/或该含有长链脂肪酸的底物包含游离的长链脂肪酸或酯化的长链脂肪酸。
16.一种生产长链二羧酸(LCDA)的方法,该方法包括:a)使实施例1、2、3、4、5、6、7、8、9、10、11、12、13、14、或15所述的重组微生物细胞与含有长链脂肪酸的底物接触,其中该微生物细胞从该底物合成LCDA;并且b)任选地回收步骤(a)的LCDA。
17.如实施例16所述的方法,其中该微生物细胞是酵母细胞,并且任选地其中该酵母细胞是耶氏酵母属细胞。
实例
本披露在以下实例中进一步示例。应该理解,这些实例尽管说明了本文的某些优选方面,但仅是以例证的方式给出的。从上述论述和这些实例中,本领域的技术人员可确定所披露的实施例的必要特征,并且在不脱离其精神和范围的情况下,可进行各种变化和修改以使所披露的实施例适应多种用途和条件。
一般方法
在实例中使用的标准重组DNA和分子克隆技术是在本领域中熟知的,并且由例如:1)J.Sambrook和D.Russell(Molecular Cloning:A Laboratory Manual[分子克隆:实验室 手册],第3版,冷泉港实验室出版社:冷泉港,纽约州,2001);2)T.J.Silhavy等人(Experiments with Gene Fusions[使用基因融合的实验],冷泉港实验室出版社:冷泉港,纽约州,1984);以及3)F.M.Ausubel等人(Short Protocols in Molecular Biology[简明 分子生物学试验方案],第5版,Current Protocols[当前试验方案],John Wiley andSons,Inc.,NY[纽约州约翰威利父子公司],2002)进行了描述。
适合用于微生物培养物的维持和生长的材料和方法是本领域熟知的。如在例如Manual of Methods for General Bacteriology[普通细菌学的方法手册](P.Gerhardt、R.G.E.Murray、R.N.Costilow、E.W.Nester、W.A.Wood、N.R.Krieg和G.B.Phillips,编辑,美国微生物学会:华盛顿,1994);和/或Thomas D.Brock,在Biotechnology:A Textbook of Industrial Microbiology[生物技术:工业微生物学的教科书],第2版(Sinauer协会:桑德兰,马萨诸塞州(Sunderland,MA),1989)中列出的可以发现在以下实例中适合使用的技术。除非另外说明,所有的试剂、限制性内切酶和细胞生长材料获得自DIFCO实验室(底特律,密歇根州)、新英格兰生物学实验室有限公司(New England Biolabs,Inc.)(贝弗利,马萨诸塞州)、GIBCO/BRL(盖瑟斯堡,马里兰州)、或西格玛奥德里奇公司(Sigma-Aldrich)(圣路易斯,密苏里州)。使大肠杆菌菌株典型地在Luria Bertani(LB)平板上在37℃生长。
根据标准方法(例如,Sambrook和Russell)来进行一般的分子克隆。由西格玛-吉诺思公司(Sigma-Genosys)(斯普林,德克萨斯州(Spring,TX))合成寡核苷酸。除非另外说明,将单独的PCR扩增反应在50-μl总体积中进行,包括:PCR缓冲液(含有10mM KCl、10mM(NH4)2SO4、20mM Tris-HCl(pH 8.75)、2mM MgSO4、0.1%Triton X-100)、100μg/mL BSA、200μM的每种脱氧核糖核苷三磷酸、10pmole的每种引物、以及1μl的Pfu DNA聚合酶(安捷伦科技公司(Agilent Technologies),圣克拉拉,加利福尼亚州)。使用安捷伦科技公司的定点诱变试剂盒,按照制造商的说明书进行定点诱变。当PCR或定点诱变涉及亚克隆时,对构建体进行测序以确认未将错配引入序列。将PCR产物克隆到
Figure BDA0001604529540000821
-T简单载体(普洛麦格公司(Promega),麦迪逊,威斯康星州)和/或
Figure BDA0001604529540000831
4-
Figure BDA0001604529540000832
载体(英杰公司(Invitrogen),卡尔斯巴德,加利福尼亚州)中。由金斯瑞公司(GenScript)(皮斯卡塔韦,新泽西州)合成所有的密码子优化的基因。
使用染料终止子技术,使用载体-和插入-特异性引物的组合在ABI自动测序仪上产生DNA序列。使用SEQUENCHER软件(基因编码公司(Gene Codes Corporation),安阿伯市,密歇根州)进行序列编辑和分析。使用DNASTAR软件(DNA Star,Inc.)实现基因序列的比较。可替代地,使用获得自生命技术公司(LifeTechnologies)(格兰德岛,纽约州)的VectorNTI
Figure BDA0001604529540000833
10程序实现基因序列的操纵。
根据百分比同一性、百分比相似性、和/或期望(E)值报道了概括与查询序列具有最大相似性的序列的比对比较的结果。“期望值”估计匹配的统计显著性,指定匹配数目,具有给定分数,这是在绝对偶然地搜索这种大小的数据库中预期的。
本文中使用的某些缩写的含义如下:“sec”意指秒、“min”意指分钟、“h”意指小时、“d”意指天、“μL”意指微升、“mL”意指毫升、“L”意指升、“μM”意指微摩尔、“mM”意指毫摩尔、“M”意指摩尔、“mmol”意指毫摩尔、“μmole”微摩尔、“g”意指克、“μg”意指微克、“ng”意指纳克、“U”意指单位、“bp”意指碱基对、“kb”意指千碱基、“DCW”意指干细胞重量、并且“TFA”意指总脂肪酸。
解脂耶氏酵母的培养和转化
解脂耶氏酵母菌株ATCC#20362和#ATCC 90812购自美国典型培养物保藏中心(罗克维尔,马里兰州)。根据下文所示的配方,常规地将解脂耶氏酵母菌株在若干个培养基中在28℃-30℃生长。通过将20g/L琼脂添加到每种液体培养基中来制备琼脂平板。
YPD琼脂培养基(每升):10g酵母提取物(DIFCO)、20g BactoTM蛋白胨(DIFCO)、20g葡萄糖。
基本培养基(MM)(每升):20g葡萄糖、1.7g无氨基酸的酵母氮源、1.0g脯氨酸、pH6.1(未调节的)。
基本培养基+尿嘧啶(MM+尿嘧啶或MMU)(每升):如上制备MM培养基,并且添加0.1g尿嘧啶和0.1g尿苷。
基本培养基+尿嘧啶+磺酰脲(MMU+SU)(每升):如上制备MMU培养基,并且添加280mg磺酰脲。
基本培养基+亮氨酸+赖氨酸(MMLeuLys)(每升):如上制备MM培养基,并且添加0.1g亮氨酸和0.1g赖氨酸。
基本培养基+5-氟乳清酸(MM+5-FOA)(每升):20g葡萄糖、6.7g酵母氮源、75mg尿嘧啶、75mg尿苷和适当量的FOA(加利福尼亚州橙市Zymo研究公司(Zymo Research Corp.,Orange,CA)),基于针对从100mg/L至1000mg/L的浓度范围测试的FOA活性(因为在从供应商处接收的每个批次内发生变化)。
MF培养基(每升):14.3g酵母提取物、7.15g蛋白胨、0.82g KH2PO4、16.37g K2HPO4、20g葡萄糖、1.2mL微量金属(100X)、3mL MgSO4(1M)、0.6mL硫胺素HCl(1.5g/L)。
MF缓冲液1培养基(每升):150g葡萄糖、100.12g KHCO3、4.29g尿素。
YM培养基:0.5%蛋白胨、0.3%酵母提取物、0.3%麦芽糖提取物。
YNB培养基(每升):20g葡萄糖、1.7g无氨基酸的酵母氮源、20g琼脂、pH 6.1(未调节的)。
YPD2-B培养基:10g酵母提取物、10g蛋白胨、20g葡萄糖、94mL K2HPO4(1M)、6mLKH2PO4(1M)、200μL微量金属(100X)、1mL硫胺素-HCl(75mg/ml)、1mL MgSO4-7H2O(12.5g/100mL)。
YPD4-B培养基:10g酵母提取物、10g蛋白胨、40g葡萄糖、94ml K2HPO4(1M)、6mLKH2PO4(1M)、200μL微量金属(100X)、1mL硫胺素-HCl(75mg/mL)、1mL MgSO4-7H2O(12.5g/100mL)。
Y2P1D2-B培养基:20g酵母提取物、10g蛋白胨、20g葡萄糖、94ml K2HPO4(1M)、6mLKH2PO4(1M)、200μL微量金属(100X)、1mL硫胺素-HCl(75mg/mL)、1mL MgSO4-7H2O(12.5g/100mL)。
微量金属配方(100X):10.0g/L柠檬酸、1.5g/L CaCl2·2H2O、10.0g/L FeSO4·7H2O、0.39g/L ZnSO4·7H2O、0.38g/L CuSO4·5H2O、0.20g/L CoCl2·6H2O、0.30g/L MnCl2·4H2O。
耶氏酵母属转化
除非另外说明,否则解脂耶氏酵母的转化根据Chen等人(Appl.Microbiol.Biotechnol.[应用微生物与生物技术]48:232-235)的方法进行。简言之,将耶氏酵母属划线到YPD平板上,并在30℃生长大约18h。将几大环量的细胞从平板上刮下并重悬浮于含有2.25mL 50%PEG(平均MW 3350)、0.125mL 2M乙酸锂、pH 6.0和0.125mL2M DTT的1mL转化缓冲液中。然后,将大约500ng线性.化的质粒DNA在100μL重悬浮的细胞中孵育,并且在39℃下维持1h,同时以15min间隔进行涡旋混合。将这些细胞接种在选择培养基平板上并在30℃下维持2至3天。
用于长链二羧酸(LCDA)生产的烧瓶培养物:
将一环量新鲜划线的耶氏酵母属细胞接种到在15-mL FalconTM培养管的3mL MM培养基中,并在30℃伴随摇动(250rpm)生长过夜(约20小时)。将过夜培养的细胞用于在250-mL带挡板的烧瓶中接种50mL的液体Y2P1D2-B培养基,并以250rpm在30℃摇动。24小时后,通过添加2.0mL的1M NaHCO3和1.0mL葡萄糖溶液(200g/L)将培养物调节至pH 8.0。然后,将1.5mL棕榈酸乙酯(底物)直接添加至培养基中至终浓度为23mg mL-1,并将该培养物以250rpm在30℃摇动4天。将来自每个烧瓶培养物的全发酵液样品进行LCDA分析。
用于LCDA生产的微量发酵:
使用于微发酵罐分析的菌株在YPD琼脂平板上从冷冻原液生长成单菌落。将单菌落接种到15-mL FALCON培养管中的3mL基本培养基上,并在30℃以250rpm生长过夜。从这些培养物中,用1mL种子培养物和1mL50%甘油原液构建发酵小瓶,并储存在-80℃。将发酵小瓶解冻并将200μL培养物用于在24孔盒的每个孔中接种4mL MF培养基。在30℃、700rpm下操作微发酵罐,其中DO为20持续最初的24小时,并且DO为75持续运行72小时。在24小时(200μL)、32小时(150μL)、48小时(150μL)、56小时(150μL)、和72小时(50μL)将MF缓冲液1培养基添加至每个孔中。在24小时(20μL)、32小时(30μL)、48小时(20μL)、56小时(30μL)、72小时(20μL)、和80小时(30μL)将棕榈酸乙酯底物添加至每个孔中。在96小时时收获微发酵罐培养物,并且取等分试样用于LCDA分析。
从250-mL烧瓶培养物中进行LCDA提取和分析:
将全发酵液样品(1.0mL)收获在具有TEFLON隔膜的螺旋盖玻璃小瓶中。通过添加1M HCl将样品酸化至pH为3.0,并然后用含有5.0mg/mL肉豆蔻酸内部标准品的1.0mL叔丁基甲基醚(MTBE,西格玛-奥德里奇公司(Sigma-Aldrich))萃取一次。将样品涡旋,其后通过以4500rpm离心5-min将水相和有机相分离。将等分试样(0.5mL)的有机、MTBE相(含有LCDA)转移至新的小瓶中,并且通过添加0.5mL甲醇的H2SO4(5%v/v)来进行具有甲基基团的LCDA产物的衍生化,并在80℃加热1小时。衍生化之后,添加在水中的1M NaCl(0.5mL),将样品涡旋,并且在静止时分离相。收集含有甲基-衍生的LCDA产物的上层MTBE有机层用于通过气相色谱(GC)与火焰离子化检测器(FID)进行分析。将化合物停留时间和质谱数据与针对来自商业标准品的甲基酯(Ultra Scientific公司,北金斯敦,罗德岛州)测量的那些数据进行比较。使用配备有
Figure BDA0001604529540000871
320融合的二氧化硅毛细管柱(30m x 0.32mm x 0.25μm)(Supelco公司,贝尔丰特,宾夕法尼亚州)的7890GC(安捷伦科技公司(AgilentTechnologies),圣克拉拉,加利福尼亚州)进行GC分析。将氢气用作以5.5mL min-1恒流的气体载体,其中分传比为10∶1,并且进气压为18.0psi。将烘箱温度最初程序控制在200℃,并且然后以25℃min-1立即增加至240℃;检测器是在260℃。
从2-L发酵样品中进行LCDA提取和分析:
该方法涉及将100μL全发酵液样品转移至反应小瓶中。使用分析天平测量样品重量并记录为±0.1mg。转移后立即通过添加100μL的20mg/mL肉豆蔻酸内部标准(在甲苯中提供)和2.0mL甲醇的H2SO4(5%v/v)和在80℃加热反应小瓶1小时来进行具有甲基基团的LCDA产物的衍生化。衍生化之后,通过向反应混合物中添加在水中的2.0mL的1M NaCl和2.0mL己烷来进行溶剂萃取。收集含有衍生的产物的上层己烷有机层用于通过GC和FID进行分析。将化合物停留时间和质谱数据与针对来自商业标准品的甲基酯(Ultra Scientific公司,北金斯敦,罗德岛州)测量的那些数据进行比较。关于肉豆蔻酸内部标准计算样品中LCDA产物的浓度。使用配备有
Figure BDA0001604529540000872
320融合的二氧化硅毛细管柱(30m x 0.32mm x 0.25μm)(Supelco公司)的6890GC(安捷伦科技公司)进行GC分析。将氦气用作以2.8mL min-1恒流的气体载体,其中分传比为20∶1,并且进气压为18.0psi。将烘箱温度最初程序控制在160℃,并然后以5℃min-1立即增加至200℃,以10℃min-1增加至240℃,并保持4min。检测器是在260℃。
工程化耶氏酵母属酵母从基于植物油的底物生产LCDA的策略
当在用葡萄糖作为碳源的氮限制的条件下生长时,解脂耶氏酵母是以超过25%干细胞重量(DCW)生产脂质的非常规的产油酵母。因为解脂耶氏酵母具有强的β-氧化能力,该酵母可以容易地使用疏水性底物(例如正烷烃、油、脂肪、和脂肪酸)作为唯一的碳源。当向解脂耶氏酵母供给脂肪酸或脂肪酸酯时,该解脂耶氏酵母可以以超过40%DCW生产脂质。向耶氏酵母属供给的大多数脂肪酸和/或脂肪酸酯以三酰基甘油的形式储存。
图1描绘了包括脂肪酸β-氧化和ω-氧化方面的脂质代谢途径。解脂耶氏酵母具有非常弱的ω-氧化能力(在图1中用虚线表示)。因为该低活性,当向酵母(野生型)供给植物油、植物油衍生的脂肪酸、或脂肪酸酯时,不存在可检测的LCDA。用于工程化解脂耶氏酵母以将植物油、植物油衍生的脂肪酸、和/或脂肪酸酯转化为LCDA的策略在图2中阐明,并且包括:(1)通过敲除编码二酰基甘油酰基转移酶1(DGAT1)、二酰基甘油酰基转移酶2(DGAT2)、和磷脂二酰基甘油酰基转移酶(PDAT)的基因来降低储存脂质;(2)通过敲除编码一种或多种过氧化物酶体生物合成因子蛋白质(PEX)的基因来降低或消除过氧化物酶体中的β-氧化;(3)通过过表达细胞色素P450单加氧酶(CYP)和细胞色素P450还原酶(CPR)基因来增强ω-氧化。
另外,如在图1和2中描绘的,据信,由于脂肪酸转运蛋白和长链脂肪酰基辅酶A合成酶活性,脂肪酸跨过细胞膜转运至细胞质的速度和程度影响工程化解脂耶氏酵母细胞中LCDA的生产。实际上,如下文披露的,发现长链脂肪酰基辅酶A合成酶上调增加工程化耶氏酵母属细胞中的LCDA生产。
实例1
编码来自解脂耶氏酵母的推定的长链脂肪酰基辅酶A合成酶的基因
该实例描述了鉴定解脂耶氏酵母中长链酰基辅酶A合成酶的候选序列,用于在微生物中生产长链酰基辅酶A代谢产物。
脂肪酸必须通过酯化被活化才能被运输到细胞中。长链脂肪酰基辅酶A合成酶的酶通过将脂肪酸轭合至辅酶A催化该活化步骤,从而形成脂肪酰基辅酶A。存在四种在酿酒酵母中编码对中链和长链脂肪酸具有特异性的酰基辅酶A合成酶的的基因(FAA-1、-2、-3、-4)。例如,FAA1编码优选具有C12至C16的链长度的脂肪酸的酰基辅酶A合成酶ScFaalp(SEQID NO:33),并且FAA2编码优选具有C9至C13的链长度的脂肪酸的酶ScFaa2p(SEQ ID NO:34)(J.Cell Biol.[细胞生物学杂志]127:751-762;Biochim.Biophys.Acta[生物化学与生物物理学学报]1486:18-27)。
为了鉴定解脂耶氏酵母中的FAA同系物,将由解脂耶氏酵母基因组数据库(www.genolevures.org/yali.html)中的预测可读框(ORF)序列编码的氨基酸序列与酿酒酵母Faalp(SEQ ID NO:33)和Faa2p(SEQ ID NO:34)的预测的氨基酸序列进行比对。通过这些BLAST分析鉴定十五种解脂耶氏酵母ORF(表2)。由这些ORF编码的十五种Faa1p和Faa2p同系物中,预测其中十二种是过氧化物酶体(含有过氧化物酶体定位信号),然而其中三种具有未知的细胞定位信息。
表2
解脂耶氏酵母中的长链脂肪酰基辅酶A合成酶候选者
Figure BDA0001604529540000891
Figure BDA0001604529540000901
分别地,将酿酒酵母Faalp(SEQ ID NO:33)和Faa2p(SEQ ID NO:34)氨基酸序列与由热带假丝酵母基因组(www.candidagenome.org/cgi-bin/compute/blast_clade.pl#Select_Target_Organisms)编码的氨基酸序列进行比对。鉴定了总共六种候选ORF。这些ORF中的其中三种编码含有推定的过氧化物酶体定位信号的氨基酸序列,并因此被预测编码过氧化物酶体蛋白质。表3列出了这些候选序列中的每一种。
表3
在热带假丝酵母(Candida tropicalis)中的长链脂肪酰基辅酶A合成酶候选者
Figure BDA0001604529540000911
使用VECTOR NTI软件,比对了酿酒酵母Faa1p(SEQ ID NO:33)和Faa2p(SEQ IDNO:34)、十五种解脂耶氏酵母长链酰基辅酶A合成酶候选者、和六种热带假丝酵母长链酰基辅酶A合成酶候选者的氨基酸序列。将从该比对得到的系统树显示在图3中。将耶氏酵母属候选者YlAcoS-2P(SEQ ID NO:37)、-3P(SEQ ID NO:39)、-4P(SEQ ID NO:40)、-5P(SEQIDNO:42)、-6P(SEQ ID NO:44)、-7P(SEQ ID NO:45)、-9P(SEQ ID NO:47)、-10P(SEQ IDNO:49)、-11P(SEQ ID NO:50)和-12P(SEQ ID NO:51)聚集在一起形成一组。将所有的这些序列预测为过氧化物酶体蛋白质。将六种假丝酵母属长链酰基辅酶A合成酶候选者和耶氏酵母属长链酰基辅酶A合成酶候选者YlFaa1(SEQ ID NO:36)、YlAcoS-8(SEQ ID NO:46)、-13P(SEQ ID NO:52)、-14(SEQ ID NO:53)、-15P(SEQ ID NO:54)与两种酿酒酵母酰基辅酶A合成酶聚集在一起。ScFaa1(SEQ ID NO:33)与CA-1(SEQ ID NO:57)和YlFaal(SEQ ID NO:36,在图3中“YA-1”)密切相关。ScFaa2(SEQ ID NO:34)和CA-2至-6形成一组,并且YlAcoS-8(SEQ ID NO:46)、-13P(SEQ ID NO:52)、-14(SEQ ID NO:53)和-15P(SEQ ID NO:54)形成第三组。
因此,鉴定了在解脂耶氏酵母中的候选者长链脂肪酰基辅酶A合成酶的序列。
实例2
在工程化解脂耶氏酵母细胞中候选者长链脂肪酰基辅酶A合成酶的表达模式
该实例描述了通过qRT-PCR筛选实例1中鉴定的解脂耶氏酵母长链酰基辅酶A合成酶候选者,以鉴定在底物添加至培养基的条件下诱导的序列。其表达由含有脂肪酸的底物诱导的任何长链酰基辅酶A合成酶序列可以是用于促进底物输入的候选酶。
使生产LCDA的解脂耶氏酵母菌株D0145(下面实例13描述了此菌株的构建)按一式三份在具有Y2P2D2生长培养基(20g/L酵母提取物;20g/L BACTO-PEPTONE;20g/L葡萄糖)的250-mL烧瓶中的50mL培养物中在30℃、以起始OD600 0.15、摇动速度250rpm进行生长。24小时后,收集0.5mL和1mL的“第0天”培养物样品分别用于RNA提取和LCDA定量。对于剩余的培养物,添加1M NaHCO3将pH调节至8.0,其后添加棕榈酸乙酯底物至终浓度3%。添加底物后24小时,收集0.5mL和1mL的“第1天”样品分别用于RNA提取和LCDA定量。图4显示在不同的时间点由菌株D0145生产的LCDA。在向培养基中添加棕榈酸乙酯之前没有LCDA生产,但是在底物添加之后有这样的生产,该生产以稳定的速率增加到大约第2天(图4)。
为了制备RNA样品,通过在13,000x g下离心1min收获在第0天和第1天来自每个培养物的0.5-mL等分试样。将细胞沉淀物立即冷冻并储存在-80℃下。使用TRIzolTM试剂(生命技术公司(Life Technologies),卡尔斯巴德,加利福尼亚州)从每种细胞沉淀物中制备总RNA。使用MINI-BEADBEATER-8(BSP,巴特尔斯维尔,俄克拉何马州)进行细胞破碎。然后,使用Qiagen RNeasyTM试剂盒将从每个样品提取的总RNA进行纯化。为了去除任何残余的基因组DNA,用无RNA酶活性的DNA酶(凯杰公司(Qiagen),希尔登,德国)处理3μg的总RNA。然后,通过添加1mM EDTA并加热至75℃持续5分钟将DNA酶灭活。使用大容量cDNA逆转录试剂盒(应用生物系统公司(Applied Biosystems),福斯特城,加利福尼亚州),按照制造商的说明书,然后将1μg DNA酶处理的RNA转化为互补DNA(cDNA)。然后将cDNA以1:10稀释在不含RNA酶的水中用于定量PCR(qPCR)分析。
进行qPCR来检测在表4中列出的靶基因的表达。利用PRIMER EXPRESS v 3.0.1软件(应用生物系统公司(Applied Biosystems))设计在表4中列出的所有引物。通过针对解脂耶氏酵母Genolevures数据库(genolevures.org/yali.html)的BLAST分析评估引物的特异性,并使用基因组DNA验证定量(未显示数据)。具有PCR效率在0.85-1.15之间的引物被验证用于定量。使用
Figure BDA0001604529540000931
Green一式三份地进行所有的qPCR反应,该
Figure BDA0001604529540000932
Green用于在ABI 7900 SDS仪器(应用生物系统公司(Applied Biosystems),福斯特城,加利福尼亚州)上进行检测。使用数据辅助软件v3.01和ΔΔCt方法(应用生物系统公司,福斯特城,加利福尼亚州)计算相对表达(RQ)。通过软件将编码18S rRNA的基因鉴定为最佳内源对照基因,并用于数据归一化。然后,通过将在第1天每个基因的表达与其被设置为1.0的第0天的表达比较,计算在第1天每个基因的相对表达。
表4
用于qPCR分析的引物
Figure BDA0001604529540000941
Figure BDA0001604529540000951
表5(下文)显示qRT-PCR分析的结果。针对每个第0天(D0)和第1天(D1)样品的表达测量(SYBR)是相对于被设置为1.00的样品第0-1天(‘D0-1’)的测量。通过三种独立的PCR反应运行每个数据点并将其归一化至耶氏酵母属18S rRNA表达。“SYBR SD”值是PCR反应的每个三件套(trio)的标准偏差。与第0天的表达(在表5中用灰色小格表示)相比,编码YlAcoS-10P(SEQ ID NO:49)、YlAcoS-6P(SEQ ID NO:44)、和YlAcoS-3P(SEQ ID NO:39)长链酰基辅酶A合成酶的转录物表现出相对于第1天的表达超过4倍的增加。
Figure BDA0001604529540000961
基于在表5中的数据,用含有长链脂肪酸的底物处理时,在解脂耶氏酵母中诱导YlAcoS-10P(SEQ ID NO:49)、YlAcoS-6P(SEQ ID NO:44)、和YlAcoS-3P(SEQ ID NO:39)推定的长链酰基辅酶A合成酶的表达。这些长链酰基辅酶A合成酶可能因此可用于促进含有长链脂肪酸的底物的输入。
实例3
对编码推定的长链酰基辅酶A合成酶的多核苷酸序列进行密码子优化用于在解脂 耶氏酵母中表达
根据在美国专利号7125672(将该专利通过引用结合在此)中披露的方法学,将编码长链酰基辅酶A合成酶候选者YlACoS-3P(SEQ ID NO:39)、YlACoS-5P(SEQ ID NO:42)、YlACoS-6P(SEQ ID NO:44)、YlACoS-10P(SEQ ID NO:49)、和YlFAA(SEQ ID NO:36)的DNA可读框进行密码子优化用于在解脂耶氏酵母中高表达。因此,制备多核苷酸序列YlACoS-3Ps(SEQ ID NO:38)、YlACoS-5Ps(SEQ ID NO:41)、YlACoS-6Ps(SEQ ID NO:43)、YlACoS-10Ps(SEQ ID NO:48)、和YlFAA1s(SEQ ID NO:35),这些多核苷酸序列分别编码YlACoS-3P(SEQID NO:39)、YlACoS-5P(SEQ ID NO:42)、YlACoS-6P(SEQ ID NO:44)、YlACoS-10P(SEQ IDNO:49)、和YlFaa1(SEQ ID NO:36)。将每个密码子优化的DNA序列单独地合成并通过金斯瑞公司(GenScript)(皮斯卡塔韦,新泽西州(Piscataway,NJ))克隆进表达载体中以产生pZP2-YlACoS-3Ps(SEQ ID NO:63)、pZP2-YlACoS-5Ps(SEQ ID NO:64)、pZP2-YlACoS-6Ps(SEQ ID NO:65)、pZP2-YlACoS-10Ps(SEQ ID NO:66)、和pZKL7A-FYlFAAs(SEQ ID NO:67)(分别在图5A-E中)。还制备了另一种载体pZP2-YlACoS-5PS3s(SEQ ID NO:68,图5F),该载体允许表达YlACoS-5PS3(SEQ ID NO:56),其是YlAcoS-5P(SEQ ID NO:42)的截短版本(六个氨基酸C-末端截短)。
可以将以上构建体用于过表达耶氏酵母属中的长链酰基辅酶A合成酶候选者。
实例4
长链酰基辅酶A合成酶候选者在大肠杆菌中的表达
此实例披露了在大肠杆菌(Escherichia coli)中T7诱导型启动子下过表达酰基辅酶A合成酶候选者YlACoS-3P(SEQ ID NO:39)、YlACoS-5P(SEQ ID NO:42)、YlACoS-6P(SEQ ID NO:44)、YlACoS-10P(SEQ ID NO:49)、YlACoS-5PS3(SEQ ID NO:56,YlACoS-5P的六个氨基酸C-末端截短的版本)和YlFAA(SEQ ID NO:36)。
首先,使用NcoI/NotI限制性内切核酸酶将YlACoS-3Ps(SEQ ID NO:38)、YlACoS-5Ps(SEQ ID NO:41)、YlACoS-6Ps(SEQ ID NO:43)、YlACoS-10Ps(SEQ ID NO:48)、YlACoS-5PS3s(SEQ ID NO:55)和YlFAAs(SEQ ID NO:35)(将每一种进行密码子优化用于在耶氏酵母属中表达)的多核苷酸序列分别从pZP2-YlACoS-3Ps(SEQ ID NO:63)、pZP2-YlACoS-5Ps(SEQ ID NO:64)、pZP2-YlACoS-6Ps(SEQ ID NO:65)、pZP2-YlACoS-10Ps(SEQ ID NO:66)、pZP2-YlACoS-5PS3s(SEQ ID NO:68)、和pZKL7A-FYlFAAs(SEQ ID NO:67)(图5A-F)切除,并且单独地连接至在NcoI/NotI内切核酸酶位点处的pET23d载体(SEQ ID NO:69)(Novagen公司,麦迪逊,威斯康星州)中。限制性分析用于证实每个连接(数据未显示)。
为了过表达每个推定的长链酰基辅酶A合成酶,用合适的基于pET23d的质粒转化并在LBAMP培养基(AMP:氨苄西林,终浓度为100μg/mL)中生长的大肠杆菌BL(DE3)的8小时培养物在500-mL烧瓶中的100mL相同的培养基中按1∶50稀释。在37℃将每个培养物摇动直到在600nm下的光密度达到0.8-0.9,其后将烧瓶置于18℃培养箱中保持约20分钟,然后添加异丙硫基-β-D-半乳糖苷(IPTG)至终浓度为100μM。然后,在18℃将每个培养物另外摇动10-12小时。通过离心收集细胞(来自15mL培养物的约100mg湿重量),用磷酸盐缓冲的盐水溶液(PBS)(pH 7.4)洗涤一次,然后重悬浮于400μL的裂解缓冲液(BUGBUSTER HT,含有25%甘油、0.5mg/mL来自Pierce的溶菌酶和蛋白酶抑制剂混合物)中,并在摇动平台上在室温孵育20分钟。通过在4℃以12,000x g离心30分钟去除细胞碎片。为了从上清液中除去可能干扰下述酶测定的小分子,将该上清液置于10-KDa分子量截止(MWCO)离心装置中并在4℃以12,000x g离心30分钟。将保留的蛋白质溶液(约50μL-100μL)重悬浮于400μL(终体积)缓冲液(0.1M KPi、20%甘油,pH 7.5)中并通过在MWCO装置上在4℃以12,000x g离心30分钟再次浓缩一次。将浓缩的蛋白质溶液重悬浮于0.1M KPi、20%甘油,pH 7.5的终体积为约200μL中,转移至新的离心管中,并以最大速度短暂离心以去除任何沉淀的蛋白质。将用于SDS-PAGE分析、蛋白质浓度的测定、和酶测定的澄清的上清液储存在-80℃下。如在图6A和B中所示,所有六种酰基辅酶A合成酶候选者成功地在大肠杆菌中过表达,并且除了YlACoS-3P(SEQ ID NO:39)以外都被发现于大肠杆菌细胞裂解物中的可溶性部分中。
实例5
长链酰基辅酶A合成酶候选者的比活性的确定
此实例披露了长链酰基辅酶A合成酶候选者比活性的分析。具体地,使用棕榈酸或对香豆酸作为底物,测试存在于可溶的大肠杆菌部分(在实例4中产生)中的酰基辅酶A合成酶候选者的活性。
将每种长链酰基辅酶A合成酶候选者对棕榈酸底物的比活性确定如下。如在以下方案(1→4)中的描绘的,在磷酸烯醇丙酮酸盐(PEP)、NADH、肌激酶和丙酮酸激酶的存在下,在澄清的上清液(实例4)中由推定的酰基辅酶A合成酶形成腺苷一磷酸(AMP)与通过乳酸脱氢酶(由340nm处的吸光度监测)氧化NADH偶联:
1.
Figure BDA0001604529540001001
Figure BDA0001604529540001003
2.
Figure BDA0001604529540001002
3. 2 ADP+2 PEP→2 ATP+2丙酮酸(丙酮酸激酶催化的)。
4. 2丙酮酸+2 NADH→2乳酸+2 NAD+(乳酸脱氢酶催化的)。
具体地,在30℃进行每个测定(300μL终体积),并且包含:在100mM Tris-Cl、50mMNaCl、10mM MgCl2、pH 7.2中的1mM棕榈酸(从在DMSO中制得的10mM储备溶液稀释)、4mMATP、1.5mM CoASH、1mM PEP、5单位的丙酮酸激酶、5单位的乳酸脱氢酶、6单位的肌激酶。通过添加适当量的含有候选者长链脂肪酰基辅酶A合成酶的细胞裂解物(实例4)引发该反应过程。添加细胞提取物之后,使用Cary-100 UV-Vis分光光度计(安捷伦公司(Agilent))监测340 nm处NADH的氧化(氧化为NAD+)持续5分钟。通过减去在其中棕榈酸底物被DMSO替代的酶测定中观察到的背景活性来计算初始斜率。
将如上文针对棕榈酸底物测量的推定的长链酰基辅酶A合成酶的比活性汇总在下表6中。以mU/mg提供比活性测量,其中一个单位对应于在1mM棕榈酸、4mM ATP和1.5mM CoA的存在下,在30℃和pH 7.2下每分钟生产1.0μmole棕榈酰辅酶A的酶量;NADH的吸光系数=6,220 M-1cm-1。在从对照细胞(用空pET23d载体转化)制备的上清液和在从表达YlACoS-3P(SEQ ID NO:39)、YlACoS-5P(SEQ ID NO:42)和YlACoS-5PS3(SEQ ID NO:56)的细胞制备的上清液中未检测到(在表6中表示为“n.d.”)高于背景水平的活性。
因为与酰基辅酶A合成酶候选者YlACoS-3P(SEQ ID NO:39)、YlACoS-5P(SEQ IDNO:42)、和YlACoS-10P(SEQ ID NO:49)有关的序列在NCBI基因库数据库中被注释为推定的4-香豆酸-辅酶A连接酶,然而YlFAA(SEQ ID NO:36)显示出与Faa1p(SEQ ID NO:33)(来自酿酒酵母优选C12:0-C16:0脂肪酸的表征良好的长链脂肪酰基辅酶A合成酶)的50%同一性,使用对香豆酸(pCA)作为底物还测试了上述提及的酶的比活性。将每种长链酰基辅酶A合成酶候选者对pCA底物的比活性确定如下。在30℃进行每个测定(250μL终体积),并且包含:在100mM Tris-C1、50mM NaCl、10mM MgCl2、pH7.2中的1mM对香豆酸(从在DMSO中制得的10mM储备溶液稀释)、4mM ATP、1.5mM CoASH。通过添加适当量的含有候选者长链脂肪酰基辅酶A合成酶的细胞裂解物(实例4)引发该反应。添加细胞提取物后,使用Cary-100UV-Vis分光光度计(安捷伦公司(Agilent))监测340nm处吸光度的增加(由于对香豆酰辅酶A的形成)持续10min。通过减去在其中pCA被DMSO替代的酶测定中观察到的背景活性来计算初始斜率。
将如上文针对pCA底物测量的推定的长链酰基辅酶A合成酶的比活性汇总在下表6中。以mU/mg提供比活性测量,其中一个单位对应于在1mM对香豆酸、4mM ATP和1.5mM辅酶A的存在下,在30℃和pH 7.2下每分钟生产1.0μmole对香豆酰辅酶A的酶量;香豆酰辅酶A的吸光系数=21,000M-1cm-1。在从对照细胞(用空pET23d载体转化)制备的上清液和在从表达YlACoS-3P(SEQ ID NO:39)、YlACoS-5P(SEQ ID NO:42)、YlACoS-5PS3(SEQ ID NO:56)和YlFAA(SEQ ID NO:36)的细胞制备的上清液中未检测到(在表6中表示为“n.d.”)高于背景水平的活性。
表6
长链酰基辅酶A合成酶候选者在不同底物上的比活性
Figure BDA0001604529540001021
an.a.(未检测出)。
这些结果支持YlACoS-6P(SEQ ID NO:44)和YlACoS-10P(SEQ ID NO:49)可以接受芳香族羧酸和长链脂肪酸二者作为底物的见解。相反,YlFAA1(SEQ ID NO:36)似乎对棕榈酸具有特异性。在限定的反应条件下,YlACoS-3P(SEQ ID NO:39)和YlACoS-5P(SEQ ID NO:42)均未显示出对两种底物的活性。
实例6
产生从基于植物油的底物生产LCDA的高级解脂耶氏酵母亲本菌株
此实例披露了适于另外的基因工程的解脂耶氏酵母菌株,从而产生可生产大量LCDA的菌株。
如上所述,可以预期解脂耶氏酵母可能需要被工程化以降低或消除脂质储存和β-氧化,从而有效地从植物油、植物油衍生的脂肪酸或脂肪酸酯生产LCDA。还可能的是不同的遗传背景可能有利于LCDA生产。如在表7中所示,一系列解脂耶氏酵母菌株产生自野生型菌株ATCC编号20362和90812。这些菌株中的一些具有降低的脂质储存能力和降低的β-氧化功能。图7A图解了这些菌株中的一些相对于彼此的谱系。
表7
用于LCDA生产的解脂耶氏酵母亲本菌株
Figure BDA0001604529540001031
Figure BDA0001604529540001041
a将每一者通过引用结合在此。
具体地,通过敲除菌株L183中的PEX3基因(编码过氧化物酶体生物合成因子3蛋白质[Pex3p])产生菌株D0004。通过同源重组,用质粒pY157(SEQ ID NO:70,参见美国专利中请号62/140,681中图4A)的含有URA3的AscI/SphI片段转化菌株L183(命名为D0003)以敲除PEX3基因。通过实时PCR将转化体之一(命名为菌株T1876)鉴定为pex3-(即,Δpex3)。预期菌株T1876的PEX3敲除位点包含SEQ ID NO:71(代替野生型PEX3基因座序列)(关于SEQ IDNO:71的描述,参考表1)。用质粒pY117(披露于美国专利申请公开号2012/0142082的表20中,将该申请通过引用结合在此)转化菌株T1876以表达Cre重组酶从而切除LoxP-侧翼的URA3基因(由敲除PEX3的pY157的片段引入)。pY117转化体不能在MM上生长,但可以在MMU上生长,表明该转化体缺少URA3基因;此转化体被命名为菌株D0004(dgat1-、dgat2-、pex3-、ura3-)。预期菌株D0004的PEX3敲除位点包含SEQ ID NO:72(代替野生型PEX3基因座序列)(关于SEQ ID NO:72的描述,参考表1)。
通过“弹入/弹出”(pop-in/pop-out)方法(对于有关此类型敲除策略的更多细节,参见美国专利申请公开号2014/0220645,将该申请通过引用结合在此)通过敲除POX4基因(编码过氧化物酶体酰基辅酶A氧化酶-4[Pox4酶,基因库登录号CAG80078])从菌株D0004产生菌株D0015。简言之,用经XbaI消化的质粒pYRH146-Pox4KO(SEQ ID NO:73,参见美国专利申请号62/140,681中的图4C)转化菌株D0004。总共28个转化体在MM平板上生长。PCR分析检测了两个转化体(#7和#17),其中第一杂交(弹入)是在天然POX4基因和构建体pYRH146-Pox4KO的同源3’-臂序列之间。挑出#7转化体,使其在液体YPD培养基中生长,并然后接种在FOA600平板上(以选择导致ura3-的弹出事件)。PCR分析检测了在FOA600平板上生长的28个菌株中的13个菌株中的第二杂交(在对应的5’-同源臂序列之间)。将这13个菌株之一命名为D0015,该D0015菌株被确定为具有POX4基因的敲除。D0015具有以下基因型:dgat1-、dgat2-、pex3-、pox4-、ura3-。预期POX4敲除位点包含SEQ ID NO:74(代替野生型POX4基因座序列)(关于SEQ ID NO:74的描述,参考表1)。
通过用质粒pYRH72的含有URA3的EcoRI/ClaI片段(SEQ ID NO:75)转化菌株ATCC编号90812来产生菌株W101。
通过将W101与D0004杂交来产生二倍体菌株(1D2373)。
使菌株1D2373形成孢子,并且通过实时PCR将其子代之一(菌株2373I-6)确定为具有交配型B基因型的单倍体。菌株2373I-6不能在SC-1eu培养基上生长,并将该菌株重命名为菌株1B24791。
通过将1B24791与D0004杂交产生二倍体菌株(2D2519)。
使菌株2D2519形成孢子,并且通过实时PCR将其子代之一(菌株2519I-1)确定为具有交配型B基因型的单倍体。菌株2519I-1不能在SC-leu培养基上生长,并将该菌株重命名为菌株2B25831。
通过将2B25831与D0004杂交产生二倍体菌株(3D2653)。
使菌株3D2653形成孢子,并且通过实时PCR将其子代之一(菌株2653I-19)确定为具有基因型dgat2-、MATB的单倍体。菌株2653I-19不能在SC-leu培养基上生长,并将该菌株重命名为菌株3B27021。
将菌株D0015与菌株3B27021杂交以产生二倍体菌株4D2738。
使菌株4D2738形成孢子,并且通过实时PCR将其子代之一(菌株2738Y-14)确定为具有基因型为dgat1-、dgat2-、pox4-、pex3-和MATA的单倍体。菌株2738Y-14不能在MM培养基上生长,并将该菌株命名为D0017。
使菌株4D2738形成孢子,并且通过实时PCR将其子代之一(菌株2738Y-45)确定为具有基因型dgat1-、dgat2-、pox4-和pex3-的单倍体。菌株2738Y-45不能在SC-ura或SC-leu平板上生长。因此,菌株2738Y-45具有基因型:MATA、dgat1-、dgat2-、pex3-、pox4-、ura3-和leu2-。
经由一步骤方法通过从2738Y-45缺失POX3基因产生菌株77T5-5。将菌株2738Y-45用质粒p12_3-B-Pex3del1的AscI/SphI片段(图8A,SEQ ID NO:76)转化。通过实时PCR将转化体中的一种鉴定为pox3-。此转化体被命名为77T5-5(MATA、dgat1-、dgat2-、leu2-、pex3-、pox3-、pox4-、Ura3+)。
经由一步骤方法通过从77T5-5首先缺失POX2基因来产生菌株D0031。将菌株77T5-5用质粒p70_Pox2::Leu(图8B,SEQ ID NO:77)的AscI/SphI片段转化。通过实时PCR将转化体118T1-14中的一种鉴定为pox2-。反过来用质粒pY117(披露于美国专利申请公开号2012/0142082的表20中,将该申请通过引用结合在此)转化菌株118T1-14(MATA、dgat1-、dgat2-、Leu2+、pex3-、pox2-、pox3-、pox4-、Ura3+)以表达Cre重组酶从而切除LoxP-侧翼的URA3基因(在先前的步骤中由p12_3-B-Pex3del1引入)。转化体之一118T1-14-7-1U不能在MM上生长,但可以在MMU上生长,表明该转化体缺少URA3基因;该转化体被命名为菌株D0031(MATA、dgat1-、dgat2-、Leu2+、pex3-、pox2-、pox3-、pox4-、ura3-)。
因此,产生了某些解脂耶氏酵母菌株,包括缺少功能的PEX3(pex3-)、POX2(pox2-)、POX3(pox3-)和POX4(pox4-)基因的一些菌株。这些菌株适合进行另外的基因工程,从而产生可以生产显著量的LCDA的菌株(以下实例)。
实例7
通过过表达CYP和CPR酶产生用于LCDA生产的解脂耶氏酵母菌株D1017此实例披露了通过在菌株D0031中表达编码热带假丝酵母CYP和CPR酶的密码子优化的序列来构建耶氏酵母属菌株D1017。菌株D1017是用于开发菌株D3928的中间体菌株(图7B)。
构建体pZKLY-FCtR17U(图9A,SEQ ID NO:82)包含来自热带假丝酵母的密码子优化的CYP52A17(CtCYPA17s,基因库登录号AAO73958,编码SEQ ID NO:84的SEQ ID NO:83)和CPR(CtCPRs,基因库登录号P37201,编码SEQ ID NO:86的SEQ ID NO:85)编码序列的每一个的一个拷贝。每个编码序列是在异源启动子和3’-终止序列的控制之下。分别将NcoI和NotI内切核酸酶位点添加在编码CtCYPA17或CtCPR的每个密码子优化的序列的翻译起始密码子(ATG)附近和终止密码子之后。将pZKLY-FCtR17U质粒(SEQ ID NO:82)的组分进一步在表8中描述。
表8
质粒pZKLY-FCtR17U(SEQ ID NO:82)的描述
Figure BDA0001604529540001071
Figure BDA0001604529540001081
用AscI/SphI消化质粒pZKLY-FCtR17U(SEQ ID NO:82),并且然后根据一般方法用于转化菌株D0031。将转化体细胞接种在MM平板上并在30℃维持2天。将来自每次转化的单个菌落再次划线到MM平板上,并然后在30℃接种到液体MM中,并以250rpm摇动1天。将过夜培养的细胞用于接种在250-mL烧瓶中的25mL的液体YPD4-B培养基,然后将其在30℃以180rpm摇动。40小时后,添加2.0mL的1M NaHCO3将这些培养物调节至pH 8.0,其后将棕榈酸乙酯(W245100,西格玛奥德里奇公司(Sigma-Aldrich))直接添加至培养基中至终浓度8mgmL-1。然后在30℃,以180rpm将这些培养物再摇动4天,其后根据一般方法将来自每个烧瓶培养物的全发酵液样品进行LCDA分析。
GC分析显示在亲本菌株D0031中没有检测到十六烷二酸(C16:0 LCDA)。然而,亲本菌株D0031的大多数转化体生产超过8g/L C16:0 LCDA。转化体#6、#8、#10和#11分别生产9.5g/L、9.5g/L、12.1g/L和9.1g/L C16:0 LCDA。这四个菌株分别被命名为菌株D1015、D1016、D1017和D1018。
随后进行菌株D1015、D1016和D1017的烧瓶分析。具体地,将D1015、D1016和D1017菌株各自置于250-mL带挡板的烧瓶中的50-mL培养物中,其中添加棕榈酸乙酯至终浓度16mg mL-1。在30℃以180rpm将这些培养物摇动4天。菌株D1015、D1016和D1017分别以约7.4g/L、7.6g/L和9.3g/L产生C16:0 LCDA。
通过微发酵分析还分析了菌株D1017。而对照菌株(D0285,数据未显示)以6.4g/L生产C16:0 LCDA,菌株D1017以约7.4g/L生产C16:0 LCDA。
应注意的是用于转化D0031以产生菌株D1017和其同族的pZKLY-FCtR17U(SEQ IDNO:82)DNA可以潜在地敲除脂肪酶Y基因座(基因库登录号AJ549519)。然而,在这些菌株中这样的敲除没有被证实。D1017和其同族相对于野生型解脂耶氏酵母ATCC#20362的基因型是dgat1-、dgat2-、Leu2+、pex3-、pox2-、pox3-、pox4-、Ura3+、来知1-、FBA::CtCPRs::Lip1、FBAINm1::CtCyPA17s::Pex20。
因此,产生耶氏酵母属菌株D1017,当在烧瓶测定中供给含有长链脂肪酸的底物时该菌株可以生产大于5g/L的LCDA产物。
实例8
通过过表达脂肪醇氧化酶和脂肪醛脱氢酶产生用于LCDA生产的解脂耶氏酵母菌 株D1308
此实例披露了通过表达编码阴沟假丝酵母脂肪醇氧化酶(FAO)和热带假丝酵母脂肪醛脱氢酶(FALDH)的密码子优化的序列构建耶氏酵母属菌株D1308。菌株D1308是用于开发菌株D3928的中间体菌株(图7B)。
首先,从菌株D1017开发菌株D1017U。将质粒pY117用于暂时表达Cre重组酶以切除菌株D1017内的LoxP-侧翼的URA3基因。pY117转化体不能在MM上生长,但可以在MMU上生长,表明该转化体缺少URA3基因;此转化体被命名为菌株D1017U。
接下来,用线性化质粒构建体pZKADn-C2F1U(图9B,SEQ ID NO:87)转化菌株D1017U。此片段包含两种表达盒,一种用于过表达密码子优化的编码FAO酶的序列(CcFAO1s,基因库登录号CAB75351,编码SEQ ID NO:89的SEQ ID NO:88),并且另一种用于过表达密码子优化的编码FALDH酶的序列(CtFALDH2s,基因库登录号XP_002550712,编码SEQ ID NO:91的SEQ ID NO:90)。将pZKADn-C2F1U质粒(SEQ ID NO:87)的组分进一步在表9中描述。
表9
质粒pZKADn-C2F1U(SEO ID NO:87)的描述
Figure BDA0001604529540001101
Figure BDA0001604529540001111
用AscI消化质粒pZKADn-C2F1U(SEQ ID NO:87),并然后根据一般方法用于转化菌株D1017U。将转化体细胞接种在MM平板上并在30℃维持2天。将来自每次转化的单个菌落再次划线到MM平板上,并然后接种到24孔块中的液体YPD2-B培养基中,然后将其在30℃和以375rpm摇动20小时。添加0.12mL的1M NaHCO3将这些培养物调节至pH 8.0,其后将棕榈酸乙酯直接添加至培养基中至终浓度23mg mL-1。然后在30℃,以375rpm将这些培养物再摇动4天,其后根据一般方法将来自每个培养物的全发酵液样品进行LCDA分析。
GC分析显示菌株D1017U的三种转化体生产超过10g/L C16:0 LCDA。具体地,转化体#2、#5、和#10分别生产10.2g/L、14.5g/L、和10.8g/L C16:0 LCDA。将这三种菌株分别命名为菌株D1307、D1308、和D1309。
通过微发酵分析还分析了菌株D1307和D1308。而对照菌株(D0285,数据未显示)以约6.0g/L生产C16:0 LCDA,菌株D1307和D1308分别以约9.7g/L和10.8g/L生产C16:0 LCDA。
使用2-L发酵实验进一步测试菌株D1308。如在表10和图10中所示,发酵162小时后,菌株D1308生产LCDA的总量为约50.9g/L,其中约42.6g/L是C16:0 LCDA。
表10
由在用棕榈酸乙酯作为底物的2-L发酵中生长的菌株D1308生产的LCDA
Figure BDA0001604529540001121
应注意的是用于转化D1017U以产生菌株D1308和其同族的pZKADn-C2F1U(SEQ IDNO:87)DNA可以潜在地敲除醇脱氢酶3基因座(基因库登录号AF175273)。然而,在这些菌株中这样的敲除没有被证实。D1308和其同族相对于野生型解脂耶氏酵母ATCC#20362的基因型是dgat1-、dgat2-、Leu2+、pex3-、pox2-、pox3-、pox4-、Ura3+、未知1-、未知2-、FBA::CtCPRs::Lip1、FBAINm1::CtCYPA17s::Pex20、DG2Pro-715::CtALDH2s::Lip1、FBAlL::CcFAOls::Aco。
因此,产生耶氏酵母属菌株D1308,当供给含有长链脂肪酸的底物时该菌株可以生产大于50g/L的LCDA产物。
实例9
产生用于生产高于70g/L的LCDA的解脂耶氏酵母菌株D2300
此实例披露了通过在菌株D1308中表达编码箭舌豌豆CYP和CPR酶的密码子优化的序列构建耶氏酵母属菌株D2300。菌株D2300是用于开发菌株D3928的中间体菌株(图7B)。
首先,从菌株D1308开发菌株D1308U。将质粒构建体pY117用于暂时表达Cre重组酶以切除菌株D1308内的LoxP-侧翼的URA3基因。pY117转化体不能在MM上生长,但可以在MMU上生长,表明该转化体缺少URA3基因;此转化体被命名为菌株D1308U。
接下来,用来自质粒构建体pYRH213(图11A,SEQ ID NO:92)的DNA片段转化菌株D1308U。此片段包含两种表达盒,一种用于过表达密码子优化的编码CYP酶的序列(VsCYP94A1s,来源于箭舌豌豆,基因库登录号AAD10204,编码SEQ ID NO:94的SEQ ID NO:93),并且另一种用于过表达密码子优化的编码CPR酶的序列(VsCPRs,来源于箭舌豌豆,基因库登录号Z26252,编码SEQ ID NO:96的SEQ ID NO:95)。每个编码序列是在异源启动子和3’-终止序列的控制之下。分别将NcoI和NotI内切核酸酶位点添加在编码VsCYP或VsCPR的每个密码子优化的序列的翻译起始密码子(ATG)附近和终止密码子之后。将pYRH213质粒(SEQ ID NO:92)的组分进一步在表11中描述。
表11
质粒pYRH213(SEQ ID NO:92)的描述
Figure BDA0001604529540001131
Figure BDA0001604529540001141
用AscI/SphI消化质粒pYRH213(SEQ ID NO:92),并然后根据一般方法用于转化菌株D1308U。将转化体细胞接种在MM平板上并在30℃维持2天。将来自每次转化的单个菌落再次划线到MM平板上。使用烧瓶测定,直接分析两种菌株的LCDA生产。具体地,将单个菌落再次划线到MM平板上,并然后接种到24孔块中的液体YPD2-B培养基中,然后将其在30℃和以375rpm摇动20小时。添加0.12mL的1M NaHCO3将这些培养物调节至pH 8.0,其后将棕榈酸乙酯直接添加至培养基中至终浓度23mg mL-1。然后在30℃,以375rpm将这些培养物再摇动4天,其后根据一般方法将来自每个培养物的全发酵液样品进行LCDA分析。
GC分析显示菌株D1308U的两种转化体各自分别生产8.2g/L和12.6g/L C16:0LCDA。将生产12.6g/L C16:0 LCDA的菌株命名为菌株D2300。
使用2-L发酵实验进一步测试菌株D2300。如在表12和图12中所示,发酵163小时后,菌株D2300生产LCDA的总量为约72.7g/L,其中约64.6g/L是C16:0 LCDA。
表12
由在用棕榈酸乙酯作为底物的2-L发酵中生长的菌株D2300生产的LCDA
Figure BDA0001604529540001151
应注意的是用于转化D1308U以产生菌株D2300和其同族的pYRH213(SEQ ID NO:92)DNA可以潜在地敲除脂肪酶Y基因座(基因库登录号AJ549519)。然而,在这些菌株中这样的敲除没有被证实。菌株D2300和其同族相对于野生型解脂耶氏酵母ATCC#20362的基因型是dgat1-、dgat2-、Leu2+、pex3-、pox2-、pox3-、pox4-、Ura3+、未知1-、未知2-、未知3-、FBA::CtCPRs::Lip1、FBA::VsCPRs::Lip1、FBAINm1::CtCYPA17s::Pex20、CPR1::VsCYP94A1s::Pex20、DG2Pro-715::CtALDH2s::Lip1、FBA1L::CcFAO1s::Aco。
因此,产生耶氏酵母属菌株D2300,当供给含有长链脂肪酸的底物时该菌株可以生产大于70g/L的LCDA产物。
实例10
产生用于LCDA生产的解脂耶氏酵母菌株D2882
此实例披露了通过在菌株D2300中表达编码脂肪醇氧化酶(FAO)酶的三种密码子优化的序列构建耶氏酵母属菌株D2882。菌株D2300是用于开发菌株D3928的中间体菌株(图7B)。
首先,由于被pYRH213(SEQ ID NO:92)DNA转化(参见实例9)而为Ura3+的菌株D2300被表现为ura3-。具体地,用质粒pZKUM转化D2300从而将ura3-突变序列整合到完整的URA3序列中。已经描述了构建和使用质粒pZKUM以获得ura-解脂耶氏酵母细胞(美国专利申请公开号2009/0093543,参见其中的表15,将该申请通过引用结合在此)。简言之,用SalI/PacI消化质粒pZKUM,并然后根据一般方法转化到菌株D2300中。转化后,将细胞接种在MM+5-FOA平板上并在30℃维持2-3天。挑出在MM+5-FOA平板上生长的总共8种转化体,并分别再次划线到MM平板和MM+5-FOA平板上。所有的这8种转化体具有ura-表型(即,细胞可以在MM+5-FOA平板上生长,但不能在MM平板上生长)。转化体#1、#2、和#3被命名为D2300U1、D2300U2、和D2300U3,它们被共同命名为D2300U。
为了产生菌株D2882,用来自构建体pZSCPn-3FAOBU(图11B,SEQ ID NO:98)的DNA片段转化菌株D2300U1,该构建体包含三种表达盒以过表达编码FAO酶(CtFAO1、CcFAO1、CcFAO2)的密码子优化的序列。具体地,这些表达盒包含以下序列:(i)CtFAO1Ms(编码SEQID NO:100的SEQ ID NO:99,其是基因库登录号AAS46878的CtFAO1的突变形式)(与野生型CtFAO1相比,CtFAO1M包含在氨基酸位置359处的组氨酸残基而不是酪氨酸残基),(ii)CcFAO1s(编码SEQ ID NO:102的SEQ ID NO:101),和(iii)CcFAO2s(编码SEQ ID NO:104的SEQ ID NO:103)。分别将NcoI和NotI位点添加在编码前述FAO酶的每个密码子优化的序列的翻译起始密码子(ATG)附近和终止密码子之后。将pZSCPn-3FAOBU质粒(SEQ ID NO:98)的组分进一步在表13中描述。
表13
质粒pZSCPn-3FAOBU(SEQ ID NO:98)的描述
Figure BDA0001604529540001171
Figure BDA0001604529540001181
用AscI/SphI消化质粒pZSCPn-3FAOBU(SEQ ID NO:98),并然后根据一般方法用于转化菌株D2300U1。将转化体细胞接种在MM平板上并在30℃维持2天。将来自每次转化的单个菌落再次划线到MM平板上,并然后接种到24孔块中的液体YPD2-B培养基中,然后将其在30℃和以375rpm摇动20小时。然后,添加0.12mL的1M NaHCO3将这些培养物调节至pH 8.0,其后将棕榈酸乙酯直接添加至培养基中至终浓度23mg mL-1。然后在30℃,以375rpm将这些培养物再摇动4天,其后根据一般方法将来自每个培养物的全发酵液样品进行LCDA分析。
将与pZSCPn-3FAOBU(SEQ ID NO:98)各自引起菌株D2300U1的转化的二十四种菌株进行培养并通过GC进行分析。二十四种转化体中的五种以超过10.6g/L生产C16:0 LCDA。具体地,转化体#11、#14、#18、和#21分别以12.1g/L、12.0g/L、12.4g/L、和10.6g/L生产C16:0 LCDA。将这四种菌株分别命名为菌株D2882、D2883、D2884、和D2885。
根据一般方法,通过烧瓶测定还分析了菌株D2882、D2883、D2884和D2885的LCDA生产。如在表14中所示,菌株D2882、D2883、D2884和D2885分别以约15.1g/L、13.2g/L、15.0g/L和15.5g/L生产C16:0 LCDA。
表14
在用棕榈酸乙酯作为底物的烧瓶测定中通过菌株D2882和其同族的LCDA生产
Figure BDA0001604529540001191
根据一般方法,通过微发酵分析进一步分析菌株D2882和D2885的LCDA生产。如在表15中所示,菌株D2882和D2885分别以约23.4g/L和21.0g/L生产C16:0 LCDA。
表15
在用棕榈酸乙酯作为底物的微发酵测定中通过菌株D2882和D2885的LCDA生产
Figure BDA0001604529540001192
应注意的是用于转化D2300U1以产生菌株D2882和其同族的pZSCPn-3FAOBU(SEQID NO:98)DNA可以潜在地敲除解脂耶氏酵母SCP2(固醇载体蛋白)基因座(基因库登录号AJ431362,YALI0E01298g)。然而,在这些菌株中这样的敲除没有被证实。菌株D2882和其同族相对于野生型解脂耶氏酵母ATCC#20362的基因型是dgat1-、dgat2-、Leu2+、pex3-、pox2-、pox3-、pox4-、Ura3+、未知1-、未知2-、未知3-、未知4-、FBA::CtCPRs::Lip1、FBA::VsCPRs::Lip1、FBAINm1::CtCYPA17s::Pex20、CPR1::VsCYP94A1s::Pex20、DG2Pro-715::CtALDH2s::Lip1、FBA1L::CcFAO1s::Aco;;YAT::CtFAO1sM::Pex20、FBA::CcFAO1s::Lip1、ALK2LM-C::CcFAO2s::Aco3。
实例11
通过过表达长链酰基辅酶A合成酶产生解脂耶氏酵母菌株D3928
此实例披露了通过表达编码长链酰基辅酶A合成酶(YLACoS-6P,SEQID NO:44,参见实例5)的密码子优化的序列构建耶氏酵母属菌株D3982。如在实例12中所示,此菌株能够以超过100g/L生产LCDA。
如下,从菌株D2882产生菌株D3928(图7B)。
首先,由于被pZSCPn-3FAOBU(SEQ ID NO:98)DNA转化(参见实例10)而为Ura3+的菌株D2882被表现为ura3-。具体地,将D2882用质粒pY117转化用于暂时表达Cre重组酶以切除菌株D2882内的LoxP-侧翼的URA3基因。pY117转化体不能在MM上生长,但可以在MMU上生长,表明该转化体缺少URA3基因;此转化体被命名为菌株D2882U。
为了产生菌株D3928,用来自构建体pzP2-YlACoS-6Ps(图5C,SEQ ID NO:65)的DNA片段转化菌株D2882U,该构建体包含一个表达盒以过表达编码YLACoS-6P酶(SEQ ID NO:44)的密码子优化的序列。具体地,该表达盒包含编码SEQ ID NO:44的长链酰基辅酶A合成酶序列YLACoS-6Ps(SEQ ID NO:43)。分别将NcoI和NotI位点添加在编码YLACoS-6P(SEQ IDNO:44)的合成序列的翻译起始密码子(ATG)附近和终止密码子之后。将pZP2-YLACoS-6Ps质粒(SEQ ID NO:65)的组分进一步在表16中描述。
表16
质粒pZP2-YLACoS-6Ps(SEQ ID NO:65)的描述
Figure BDA0001604529540001211
用AscI/SphI消化质粒pZP2-YLACoS-6Ps(SEQ ID NO:65),并然后根据一般方法用于转化菌株D2882U。将转化体细胞接种在MM平板上并在30℃维持2天。将来自每次转化的单个菌落再次划线到MM平板上,并然后接种到24孔块中的液体YPD2-B培养基中,然后将其在30℃和以375rpm摇动20小时。然后,添加0.12mL的1M NaHCO3将这些培养物调节至pH 8.0,其后将棕榈酸乙酯直接添加至培养基中至终浓度23mg mL-1。然后在30℃,以375rpm将这些培养物再摇动4天,其后根据一般方法将来自每个培养物的全发酵液样品进行LCDA分析。
将与pZP2-YLACoS-6Ps(SEQ ID NO:65)各自引起菌株D2882U的转化的二十四种菌株进行培养并通过GC进行分析。二十四种转化体中的九种以超过14.5g/L生产C16:0 LCDA。具体地,转化体#6、#7、#8、#9、#10、#11、#12、#13和#20分别以14.8g/L、17.7g/L、18.7g/L、18.3g/L、20.6g/L、17.8g/L、15.4g/L、17.1g/L和14.5g/L生产C16:0 LCDA。将这些转化体分别被命名为菌株D3924、D3925、D3926、D3927、D3928、D3929、D3930、D3931和D3932。
根据一般方法通过微发酵分析进一步分析菌株D3928、D3931和D3932的LCDA生产。如在表17中所示,菌株D3928、D3931和D3932分别以约23.0g/L、21.2g/L和22.7g/L生产C16:0 LCDA。
表17
在用棕榈酸乙酯作为底物的微发酵测定中通过菌株D3928、D3931和D3932的LCDA 生产
Figure BDA0001604529540001221
应注意的是用于转化D2882U以产生菌株D3928和其同族的pZP2-YLACoS-6Ps(SEQID NO:65)DNA可以潜在地敲除Pox2基因(基因库登录号AJ001300)。然而,在这些菌株中这样的敲除没有被证实。菌株D3928和其同族相对于野生型解脂耶氏酵母ATCC#20362的基因型是dgat1-、dgdt2-、Leu2+、pex3-、pox2-、pox3-、pox4-、Ura3+、未知1-、未知2-、未知3-、未知4-、未知5-、FBA::CtCPRs::Lip1、FBA::VsCPRs::Lip1、FBAINm1::CtCYPA17s::Pex20、CPR1::VsCYP94A1s::Pex20、DG2Pro-715::CtALDH2s::Lip1、FBA1L::CcFAO1s::Aco;YAT::CtFAO1sM::Pex20、FBA::CcFAO1s::Lip1、ALK2LM-C::CcFAO2s::Aco3、FBAINm::YlAcoS-6Ps::Pex20。
因此,产生过表达长链酰基辅酶A合成酶的耶氏酵母属菌株,当供给含有长链脂肪酸的底物时该菌株可以合成显著量的LCDA产物。
实例12
在补料分批发酵条件下通过过表达长链酰基辅酶A合成酶的耶氏酵母属的LCDA生
此实例披露了当在补料分批发酵中生长时,过表达长链酰基辅酶A合成酶的耶氏酵母属可以生产大于100g/L的LCDA产物。具体地,在约143小时发酵后,菌株D3928能够以109g/L生产C16:0 LCDA和以119g/L生产总LCDA(表18,图13)。
种子培养方案:将储存在-80℃的工程化耶氏酵母属菌株D3928划线到YPD平板上并在30℃孵育约24小时。将单菌落接种到含有5mL复合培养基(6.7g/L无氨基酸的酵母氮源、5g/L酵母提取物、20g/L D-葡萄糖、6g/L KH2PO4、3.3g/L Na2HPO4·12H2O)的14-mLFALCON管(科宁公司(Corning),纽约州)中。在30℃、以约250-300rpm摇动,使试管培养物生长约24小时。将此培养物的一部分(0.2-5.0mL)转移至含有50mL复合培养基(上述)的250-mL烧瓶中并在30℃另外孵育约20小时至OD600为大约5.0-10.0。将此培养物用作种子培养物以按体积计约3%接种5-L发酵罐。
5-L发酵方案:将以上制备的摇瓶种子培养物转移至5-L发酵罐中(SartoriusBBI,BioStat B plus)以开始发酵(t=0h)。发酵培养基包含50g/L D-葡萄糖、6g/L KH2PO4、3.3g/L Na2HPO4·12H2O、8mL/L微量金属(100X)、40g/L BactoTM酵母提取物、20g/L BactoTM蛋白胨、20mM MgSO4、6mg/L硫胺素·HCl、和15g/L(NH4)2SO4。微量金属(100X)由10g/L柠檬酸、1.5g/L CaCl2·2H2O、10g/L FeSO4·7H2O、0.39g/L 10g/L ZnSO4·7H2O、0.38g/LCuSO4·5H2O、0.2g/L CoCl2·6H2O、和MnCl2·4H2O组成。初始工作体积是3.0L。对于最初的26小时,通过将搅拌速度在300rpm至1200rpm之间级联,将溶解氧水平(pO2)控制在空气饱和度的约20%。在t=26h后,将搅拌速度固定在1200rpm,并然后通过仅与纯氧补充剂级联,将pO2控制在空气饱和度的60%。制备含有700g/L葡萄糖和15-25g/L尿素的葡萄糖补料;当初始加入的葡萄糖被消耗时,在约18小时开始葡萄糖补料。葡萄糖补料速率开始高达20mL/hr,并然后逐渐在发酵结束时(约144小时)降至10mL/hr。贯穿运行过程,将通气速率控制在1.5-2.5L/min,并将温度维持在30℃。对于最初的26小时将pH值控制在6.0,并然后通过KOH补料在运行的剩余部分中将pH增至7.5。从t=28h开始,将棕榈酸乙酯补料至发酵罐中以控制其残余浓度在1-20g/L内。一天取两次发酵样品(在每个时间点处约25mL)以分析OD600、发酵培养基中的残余葡萄糖、残余棕榈酸乙酯和LCDA。
5-L发酵结果:在发酵143.4小时后,产生约119g/L的LCDA。大多数的LCDA产物是十六烷二酸(C16:0二酸)(表18和图13)。
表18
在用棕榈酸乙酯作为底物的5-L补料分批发酵中通过菌株D3928生产的LCDA
Figure BDA0001604529540001241
Figure BDA0001604529540001251
因此,当供给含有长链脂肪酸的底物时,过表达长链酰基辅酶A合成酶的耶氏酵母属可以合成显著量的LCDA产物。
实例13
产生解脂耶氏酵母菌株D0145作为LCDA生产的阳性对照
此实例披露了通过表达编码某些箭舌豌豆(Vicia sativa)(巢菜)CYP和CPR酶的密码子优化的序列构建各种耶氏酵母属菌株。包括菌株D0145的这些菌株中的大多数能够生产LCDA。
产生构建体pZKLY-VsCPR&CYP(SEQ ID NO:105)以整合密码子优化的巢菜CYP(VsCYP94A1s,来源于箭舌豌豆,基因库登录号AAD10204,编码SEQ ID NO:94的SEQ ID NO:93)和CPR(VsCPRs,来源于箭舌豌豆,基因库登录号Z26252,编码SEQ ID NO:96的SEQ IDNO:95)编码序列的每一个的一个拷贝。每个编码序列是在异源启动子和3’-终止序列的控制之下。分别将NcoI和NotI内切核酸酶位点添加在编码VsCYP或VsCPR的每个密码子优化的序列的翻译起始密码子(ATG)附近和终止密码子之后。将pZKLY-VsCPR&CYP(SEQ ID NO:105)质粒的组分进一步在表19中描述。
表19
质粒pZKLY-VsCPR&CYP(SEO ID NO:105)的描述
Figure BDA0001604529540001252
Figure BDA0001604529540001261
用AscI/SphI消化质粒pZKLY-VsCPR&CYP(SEQ ID NO:105),并然后根据一般方法用于转化菌株D0004(dgat1-、dgat2-、pex3-、ura3-)(参考表7)。将转化体细胞接种在MM平板上并在30℃维持2天。将来自每次转化的单个菌落再次划线到MM平板上,并然后在30℃接种到液体MM中,并以250rpm摇动1天。将过夜培养的细胞用于在250-mL带挡板的烧瓶中接种50mL的液体YPD2-B培养基,然后在30℃以250rpm摇动。24小时后,添加2.0mL的1M NaHCO3将这些培养物调节至pH 8.0,其后将棕榈酸乙酯直接添加至培养基中至终浓度16mg mL-1。然后在30℃,以250rpm将这些培养物再摇动4天,其后根据一般方法将来自每个烧瓶培养物的全发酵液样品进行LCDA分析。
将每一种都从用pZKLY-VsCPR&CYP(SEQ ID NO:105)转化亲本菌株D0004产生的四十八种菌株进行培养并通过GC进行分析。几乎所有的48种菌株以超过3g/L生产C16:0LCDA。例如,转化体#12、#15、#20、#23、#28、#29、#31、#37、#39、#44和#48分别以5.0g/L、5.1g/L、5.1g/L、5.0g/L、5.2g/L、4.9g/L、5.5g/L、4.8g/L、5.5g/L、5.0g/L和4.8g/L生产C16:0 LCDA。分别将这十一种转化体命名为菌株D0138、D0139、D0140、D0141、D0142、D0143、D0144、D0145、D0146、D0147和D0148。
应注意的是用于转化D0004以产生菌株D0145和其同族的pZKLY-VsCPR&CYP(SEQID NO:105)DNA可以潜在地敲除脂肪酶Y基因座(基因库登录号AJ549519)。然而,在这些菌株中这样的敲除没有被证实。菌株D0145和其同族相对于野生型解脂耶氏酵母ATCC#20362的基因型是Ura3+、dgat1-、dgat2-、pex3-、未知1-、FBA::VsCPRs::Lip1、FBAINm::VsCYP94A1s::Pex16。
因此,具有上调的羟化酶复合物表达和下调的PEX3表达的酵母(例如,耶氏酵母属)可以从含有脂肪酸的底物生产LCDA。
实例14
pex3-耶氏酵母属可以生产LCDA
此实例披露了通过表达编码热带假丝酵母CYP和CPR酶的密码子优化的序列构建耶氏酵母属菌株D0101。而且,此实例披露了pex3-菌株可以生产LCDA,而PEX3+菌株(例如,不具有PEX基因破坏,或该基因是pex10-或pex16-的菌株)不具有此能力。
产生构建体pZP2N-FCtA1R以整合来自热带假丝酵母的密码子优化的CYP(CtALK1s,基因库登录号P10615)和CPR(CtCPRs,基因库登录号P37201)编码序列的每一个的一个拷贝。每个编码序列是在异源启动子和3’-终止序列的控制之下。分别将NcoI和NotI内切核酸酶位点添加在编码CtALK1或CtCPR的每个密码子优化的序列的翻译起始密码子(ATG)附近和终止密码子之后。将pZP2N-FCtA1R质粒的组分进一步在表12中描述。
表20
质粒pZP2N-FCtA1R的描述
Figure BDA0001604529540001281
用AscI/SphI消化质粒pZP2N-FCtA1R,并且然后根据一般方法用于转化菌株Y2224、D0003、D0004和D0009。将转化体细胞接种在MM平板上并在30℃维持2天。将来自每次转化的单个菌落再次划线到MM平板上,并然后在30℃接种到液体MM中,并以250rpm摇动1天。将过夜培养的细胞用于接种在250-mL烧瓶中的25mL的液体YPD4-B培养基,然后将其在30℃以180rpm摇动。40小时后,添加2.0mL 1M NaHCO3将这些培养物调节至pH 8.0,之后将棕榈酸乙酯(W245100,西格玛奥德里奇公司(Sigma-Aldrich))直接添加至培养基中至终浓度为8mg mL-1。然后在30℃,以180rpm将这些培养物再摇动4天,其后根据一般方法将来自每个烧瓶培养物的全发酵液样品进行LCDA分析。
从用pZP2N-FCtA1R转化每个亲本菌株(Y2224、D0003、D0004、D0009)产生的菌株通过GC进行分析。在亲本菌株Y2224、D0003、或D0009的转化体中未检测到十六烷二酸(C16:0LCDA)。然而,亲本菌株D0004的转化体生产超过1g/L的C16:0 LCDA。将生产1.24g/L C16:0LCDA的一个D0004-转化体命名为菌株D0101。
随后进行菌株D0101的烧瓶分析。具体地,将D0101置于250-mL带挡板的烧瓶中的25-mL培养物中,其中添加棕榈酸乙酯至终浓度16mg mL-1。在30℃以180rpm将培养物摇动4天。该培养物以约5g/L生产C16:0 LCDA。
应注意的是用于转化D0004以产生菌株D0101的pZP2N-FCtA1R DNA可以潜在地敲除Pox2基因(基因库登录号AJ001300)。然而,在D0101中这样的敲除没有被证实。菌株D0101相对于野生型解脂耶氏酵母ATCC#20362的基因型是Ura3+、dgat1-、dgat2-、pex3-、未知1-、FBA1::CtALK1s::Pex20、FBAINm::CtCPRs::Pex16。
值得注意的是亲本菌株D0004(dgat1-、dgat2-、pex3-、urα3-)的转化体(例如,菌株D0101)生产LCDA,而亲本菌株D0009(dgat1-、dgat2-、pex10-、ura3-)的转化体不具有此能力。尽管两种类型的转化体具有(i)下调的PEX基因(导致受损的过氧化物酶体功能和阻断的β-氧化),和(ii)在其他条件下相同的基因型(包括导致降低的油储存的下调的DGAT基因),仅具有下调的PEX3的酵母能够生产LCDA。与pex10-菌株类似,pex16-菌株还缺少生产LCDA的能力(数据未显示)。因此,阻断过氧化物酶体功能和β-氧化的方式对从含有脂肪酸的底物生产LCDA具有显著的影响。
因此,具有下调的PEX3表达的酵母(例如,耶氏酵母属)可以从含有脂肪酸的底物生产LCDA。
序列表
<110> E. I.内穆尔杜邦公司
Zhu, Quinn
<120> 用微生物高水平生产长链二羧酸
<130> CL6467
<150> US 62/195,340
<151> 2015-07-22
<150> US 62/195,338
<151> 2015-07-22
<160> 115
<170> PatentIn版本3.5
<210> 1
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物17864-900F
<400> 1
cacagaccgg cttctcaact t 21
<210> 2
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物17864-967R
<400> 2
aggtgaccat ctcgaacaca aa 22
<210> 3
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物5885-1034F
<400> 3
cttctccctg cgtcactctg t 21
<210> 4
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物5885-1097R
<400> 4
ttgccacaag ccttgatgtg 20
<210> 5
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 引物14234-1341F
<400> 5
ggctccggct gagattga 18
<210> 6
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物14234-1404R
<400> 6
aatgacagcg acatccttta cca 23
<210> 7
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物11979-1248F
<400> 7
tcagctcaaa ctcgacgact tg 22
<210> 8
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物11979-1315R
<400> 8
ccacaggcag aggctcatct 20
<210> 9
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物7755-282F
<400> 9
ttacagctcg ttgccctacc a 21
<210> 10
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 引物7755-343R
<400> 10
tggcgggcga aatgg 15
<210> 11
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 引物12419-1677F
<400> 11
tgctggcatc gtggtgat 18
<210> 12
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物12419-1744R
<400> 12
gcaacaatcg tcgcagaatc t 21
<210> 13
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 引物 20405-626F
<400> 13
ccgtggagct cacccatt 18
<210> 14
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物20405-691R
<400> 14
ggttaggtgc attctttgct gtct 24
<210> 15
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物5456-1758F
<400> 15
ctctgctgct atggttgtcg at 22
<210> 16
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物5456-1825R
<400> 16
tgcaaccctc atcaccagtt c 21
<210> 17
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 引物15103-516F
<400> 17
caaggccgtg cgtgtca 17
<210> 18
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物15103-588R
<400> 18
gagatcggga gccacaattg 20
<210> 19
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物5951-327F
<400> 19
gcattttgcc gcacttgat 19
<210> 20
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 引物5951-399R
<400> 20
gacgagctcc gccacagt 18
<210> 21
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物17314-47F
<400> 21
tgttctgtgg caacattgca 20
<210> 22
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物17314-112R
<400> 22
cacttgtttt ggagctcttg ga 22
<210> 23
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物6556-1321F
<400> 23
gcgttcgaag aggcttctga 20
<210> 24
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物6556-1384R
<400> 24
ttcgcaacca tcgtttcttg 20
<210> 25
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物12859-1002
<400> 25
ccagattctg ctgaacacaa aga 23
<210> 26
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物12859-1071
<400> 26
cgaagagcac gatcgaatga 20
<210> 27
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物9284-924F
<400> 27
tctgcttgtt gacgaccgaa t 21
<210> 28
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物9284-995R
<400> 28
gggttgttca ccagcatgtt g 21
<210> 29
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物16016-1393F
<400> 29
atgggccgat acggtaagct 20
<210> 30
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物/探针16016-1422T
<400> 30
catcctggcc acccgacaga cc 22
<210> 31
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物YL-18S-329F
<400> 31
cctgagaaac ggctaccaca tc 22
<210> 32
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物YL-18S-395R
<400> 32
ccctgtgtca ggattgggta a 21
<210> 33
<211> 700
<212> PRT
<213> 酿酒酵母
<400> 33
Met Val Ala Gln Tyr Thr Val Pro Val Gly Lys Ala Ala Asn Glu His
1 5 10 15
Glu Thr Ala Pro Arg Arg Asn Tyr Gln Cys Arg Glu Lys Pro Leu Val
20 25 30
Arg Pro Pro Asn Thr Lys Cys Ser Thr Val Tyr Glu Phe Val Leu Glu
35 40 45
Cys Phe Gln Lys Asn Lys Asn Ser Asn Ala Met Gly Trp Arg Asp Val
50 55 60
Lys Glu Ile His Glu Glu Ser Lys Ser Val Met Lys Lys Val Asp Gly
65 70 75 80
Lys Glu Thr Ser Val Glu Lys Lys Trp Met Tyr Tyr Glu Leu Ser His
85 90 95
Tyr His Tyr Asn Ser Phe Asp Gln Leu Thr Asp Ile Met His Glu Ile
100 105 110
Gly Arg Gly Leu Val Lys Ile Gly Leu Lys Pro Asn Asp Asp Asp Lys
115 120 125
Leu His Leu Tyr Ala Ala Thr Ser His Lys Trp Met Lys Met Phe Leu
130 135 140
Gly Ala Gln Ser Gln Gly Ile Pro Val Val Thr Ala Tyr Asp Thr Leu
145 150 155 160
Gly Glu Lys Gly Leu Ile His Ser Leu Val Gln Thr Gly Ser Lys Ala
165 170 175
Ile Phe Thr Asp Asn Ser Leu Leu Pro Ser Leu Ile Lys Pro Val Gln
180 185 190
Ala Ala Gln Asp Val Lys Tyr Ile Ile His Phe Asp Ser Ile Ser Ser
195 200 205
Glu Asp Arg Arg Gln Ser Gly Lys Ile Tyr Gln Ser Ala His Asp Ala
210 215 220
Ile Asn Arg Ile Lys Glu Val Arg Pro Asp Ile Lys Thr Phe Ser Phe
225 230 235 240
Asp Asp Ile Leu Lys Leu Gly Lys Glu Ser Cys Asn Glu Ile Asp Val
245 250 255
His Pro Pro Gly Lys Asp Asp Leu Cys Cys Ile Met Tyr Thr Ser Gly
260 265 270
Ser Thr Gly Glu Pro Lys Gly Val Val Leu Lys His Ser Asn Val Val
275 280 285
Ala Gly Val Gly Gly Ala Ser Leu Asn Val Leu Lys Phe Val Gly Asn
290 295 300
Thr Asp Arg Val Ile Cys Phe Leu Pro Leu Ala His Ile Phe Glu Leu
305 310 315 320
Val Phe Glu Leu Leu Ser Phe Tyr Trp Gly Ala Cys Ile Gly Tyr Ala
325 330 335
Thr Val Lys Thr Leu Thr Ser Ser Ser Val Arg Asn Cys Gln Gly Asp
340 345 350
Leu Gln Glu Phe Lys Pro Thr Ile Met Val Gly Val Ala Ala Val Trp
355 360 365
Glu Thr Val Arg Lys Gly Ile Leu Asn Gln Ile Asp Asn Leu Pro Phe
370 375 380
Leu Thr Lys Lys Ile Phe Trp Thr Ala Tyr Asn Thr Lys Leu Asn Met
385 390 395 400
Gln Arg Leu His Ile Pro Gly Gly Gly Ala Leu Gly Asn Leu Val Phe
405 410 415
Lys Lys Ile Arg Thr Ala Thr Gly Gly Gln Leu Arg Tyr Leu Leu Asn
420 425 430
Gly Gly Ser Pro Ile Ser Arg Asp Ala Gln Glu Phe Ile Thr Asn Leu
435 440 445
Ile Cys Pro Met Leu Ile Gly Tyr Gly Leu Thr Glu Thr Cys Ala Ser
450 455 460
Thr Thr Ile Leu Asp Pro Ala Asn Phe Glu Leu Gly Val Ala Gly Asp
465 470 475 480
Leu Thr Gly Cys Val Thr Val Lys Leu Val Asp Val Glu Glu Leu Gly
485 490 495
Tyr Phe Ala Lys Asn Asn Gln Gly Glu Val Trp Ile Thr Gly Ala Asn
500 505 510
Val Thr Pro Glu Tyr Tyr Lys Asn Glu Glu Glu Thr Ser Gln Ala Leu
515 520 525
Thr Ser Asp Gly Trp Phe Lys Thr Gly Asp Ile Gly Glu Trp Glu Ala
530 535 540
Asn Gly His Leu Lys Ile Ile Asp Arg Lys Lys Asn Leu Val Lys Thr
545 550 555 560
Met Asn Gly Glu Tyr Ile Ala Leu Glu Lys Leu Glu Ser Val Tyr Arg
565 570 575
Ser Asn Glu Tyr Val Ala Asn Ile Cys Val Tyr Ala Asp Gln Ser Lys
580 585 590
Thr Lys Pro Val Gly Ile Ile Val Pro Asn His Ala Pro Leu Thr Lys
595 600 605
Leu Ala Lys Lys Leu Gly Ile Met Glu Gln Lys Asp Ser Ser Ile Asn
610 615 620
Ile Glu Asn Tyr Leu Glu Asp Ala Lys Leu Ile Lys Ala Val Tyr Ser
625 630 635 640
Asp Leu Leu Lys Thr Gly Lys Asp Gln Gly Leu Val Gly Ile Glu Leu
645 650 655
Leu Ala Gly Ile Val Phe Phe Asp Gly Glu Trp Thr Pro Gln Asn Gly
660 665 670
Phe Val Thr Ser Ala Gln Lys Leu Lys Arg Lys Asp Ile Leu Asn Ala
675 680 685
Val Lys Asp Lys Val Asp Ala Val Tyr Ser Ser Ser
690 695 700
<210> 34
<211> 744
<212> PRT
<213> 酿酒酵母
<400> 34
Met Ala Ala Pro Asp Tyr Ala Leu Thr Asp Leu Ile Glu Ser Asp Pro
1 5 10 15
Arg Phe Glu Ser Leu Lys Thr Arg Leu Ala Gly Tyr Thr Lys Gly Ser
20 25 30
Asp Glu Tyr Ile Glu Glu Leu Tyr Ser Gln Leu Pro Leu Thr Ser Tyr
35 40 45
Pro Arg Tyr Lys Thr Phe Leu Lys Lys Gln Ala Val Ala Ile Ser Asn
50 55 60
Pro Asp Asn Glu Ala Gly Phe Ser Ser Ile Tyr Arg Ser Ser Leu Ser
65 70 75 80
Ser Glu Asn Leu Val Ser Cys Val Asp Lys Asn Leu Arg Thr Ala Tyr
85 90 95
Asp His Phe Met Phe Ser Ala Arg Arg Trp Pro Gln Arg Asp Cys Leu
100 105 110
Gly Ser Arg Pro Ile Asp Lys Ala Thr Gly Thr Trp Glu Glu Thr Phe
115 120 125
Arg Phe Glu Ser Tyr Ser Thr Val Ser Lys Arg Cys His Asn Ile Gly
130 135 140
Ser Gly Ile Leu Ser Leu Val Asn Thr Lys Arg Lys Arg Pro Leu Glu
145 150 155 160
Ala Asn Asp Phe Val Val Ala Ile Leu Ser His Asn Asn Pro Glu Trp
165 170 175
Ile Leu Thr Asp Leu Ala Cys Gln Ala Tyr Ser Leu Thr Asn Thr Ala
180 185 190
Leu Tyr Glu Thr Leu Gly Pro Asn Thr Ser Glu Tyr Ile Leu Asn Leu
195 200 205
Thr Glu Ala Pro Ile Leu Ile Phe Ala Lys Ser Asn Met Tyr His Val
210 215 220
Leu Lys Met Val Pro Asp Met Lys Phe Val Asn Thr Leu Val Cys Met
225 230 235 240
Asp Glu Leu Thr His Asp Glu Leu Arg Met Leu Asn Glu Ser Leu Leu
245 250 255
Pro Val Lys Cys Asn Ser Leu Asn Glu Lys Ile Thr Phe Phe Ser Leu
260 265 270
Glu Gln Val Glu Gln Val Gly Cys Phe Asn Lys Ile Pro Ala Ile Pro
275 280 285
Pro Thr Pro Asp Ser Leu Tyr Thr Ile Ser Phe Thr Ser Gly Thr Thr
290 295 300
Gly Leu Pro Lys Gly Val Glu Met Ser His Arg Asn Ile Ala Ser Gly
305 310 315 320
Ile Ala Phe Ala Phe Ser Thr Phe Arg Ile Pro Pro Asp Lys Arg Asn
325 330 335
Gln Gln Leu Tyr Asp Met Cys Phe Leu Pro Leu Ala His Ile Phe Glu
340 345 350
Arg Met Val Ile Ala Tyr Asp Leu Ala Ile Gly Phe Gly Ile Gly Phe
355 360 365
Leu His Lys Pro Asp Pro Thr Val Leu Val Glu Asp Leu Lys Ile Leu
370 375 380
Lys Pro Tyr Ala Val Ala Leu Val Pro Arg Ile Leu Thr Arg Phe Glu
385 390 395 400
Ala Gly Ile Lys Asn Ala Leu Asp Lys Ser Thr Val Gln Arg Asn Val
405 410 415
Ala Asn Thr Ile Leu Asp Ser Lys Ser Ala Arg Phe Thr Ala Arg Gly
420 425 430
Gly Pro Asp Lys Ser Ile Met Asn Phe Leu Val Tyr His Arg Val Leu
435 440 445
Ile Asp Lys Ile Arg Asp Ser Leu Gly Leu Ser Asn Asn Ser Phe Ile
450 455 460
Ile Thr Gly Ser Ala Pro Ile Ser Lys Asp Thr Leu Leu Phe Leu Arg
465 470 475 480
Ser Ala Leu Asp Ile Gly Ile Arg Gln Gly Tyr Gly Leu Thr Glu Thr
485 490 495
Phe Ala Gly Val Cys Leu Ser Glu Pro Phe Glu Lys Asp Val Gly Ser
500 505 510
Cys Gly Ala Ile Gly Ile Ser Ala Glu Cys Arg Leu Lys Ser Val Pro
515 520 525
Glu Met Gly Tyr His Ala Asp Lys Asp Leu Lys Gly Glu Leu Gln Ile
530 535 540
Arg Gly Pro Gln Val Phe Glu Arg Tyr Phe Lys Asn Pro Asn Glu Thr
545 550 555 560
Ser Lys Ala Val Asp Gln Asp Gly Trp Phe Ser Thr Gly Asp Val Ala
565 570 575
Phe Ile Asp Gly Lys Gly Arg Ile Ser Val Ile Asp Arg Val Lys Asn
580 585 590
Phe Phe Lys Leu Ala His Gly Glu Tyr Ile Ala Pro Glu Lys Ile Glu
595 600 605
Asn Ile Tyr Leu Ser Ser Cys Pro Tyr Ile Thr Gln Ile Phe Val Phe
610 615 620
Gly Asp Pro Leu Lys Thr Phe Leu Val Gly Ile Val Gly Val Asp Val
625 630 635 640
Asp Ala Ala Gln Pro Ile Leu Ala Ala Lys His Pro Glu Val Lys Thr
645 650 655
Trp Thr Lys Glu Val Leu Val Glu Asn Leu Asn Arg Asn Lys Lys Leu
660 665 670
Arg Lys Glu Phe Leu Asn Lys Ile Asn Lys Cys Thr Asp Gly Leu Gln
675 680 685
Gly Phe Glu Lys Leu His Asn Ile Lys Val Gly Leu Glu Pro Leu Thr
690 695 700
Leu Glu Asp Asp Val Val Thr Pro Thr Phe Lys Ile Lys Arg Ala Lys
705 710 715 720
Ala Ser Lys Phe Phe Lys Asp Thr Leu Asp Gln Leu Tyr Ala Glu Gly
725 730 735
Ser Leu Val Lys Thr Glu Lys Leu
740
<210> 35
<211> 2076
<212> DNA
<213> 人工序列
<220>
<223> YlFaa1
<400> 35
atggtcggat acaccatctc ctcgaagccc gtgtccgtcg aggttggccc cgccaagcct 60
ggcgagactg ctccccgacg gaacgtcatt gccaaggacg ctcctgtggt cttccccgac 120
aacgattcgt ccctcaccac tgtctacaag ctgttcaaaa agtacgccga gatcaactcc 180
gaacgaaagg ctatgggatg gcgagacacc atcgacattc acgtggagac caagcaggtc 240
acaaaggtgg tcgacggcgt ggagaagaaa gtgcccaagg aatggaagta cttcgagatg 300
ggtccttaca agtggctgtc ctacaaggag gccctcaagc tggttcacga ttatggagct 360
ggtcttcgac atctcggcat caagcccaaa gagaagatgc acatttacgc acagacctct 420
caccgatgga tgctttccgg actggcctct ctctcgcagg gcattcccat cgtcactgcc 480
tacgacaccc ttggagagga aggtctcaca cgatctctgc aggagaccaa ctccgtcatc 540
atgttcacgg acaaggctct tctgtcgtct ctcaaggtgt ccctcaaaaa gggcaccgat 600
ctgcgaatca ttatctacgg aggcgacctg actcccgatg acaagaaagc cggaaacacc 660
gagatcgacg ccatcaagga gattgttcca gacatgaaga tctacactat ggacgaggtt 720
gtcgctctcg gtcgagagca tcctcacccc gtggaagagg tcgactacga ggatctggcc 780
ttcatcatgt acacctctgg ctccacagga gttcccaagg gtgtcgtgct gcagcacaag 840
cagatcctcg cctctgtggc cggtgtcacc aagattatcg acagatccat tatcggcaat 900
acagatcgac tgctcaactt tcttcccctc gcacacatct tcgagtttgt gttcgagatg 960
gtcaccttct ggtggggtgc ctctctgggc tacggaactg tcaagaccat ttccgacctg 1020
tcgatgaaga actgcaaggg agacatccga gagctcaagc ccaccatcat ggtcggcgtt 1080
ccagctgtct gggaacccat gcggaagggt attcttggca aaatcaagga gctgtctcct 1140
ctcatgcagc gagtcttctg ggcctccttt gctgccaagc aacgtctcga cgagaacgga 1200
cttcccggtg gctctattct ggattcgctc atcttcaaga aagtcaagga cgccactgga 1260
ggctgtctcc gatacgtgtg caacggaggt gctccagttt ccgtcgacac ccagaagttc 1320
attactaccc ttatctgtcc catgctcatt ggatgcggtc tgaccgagac tacagccaac 1380
accactatca tgtctcccaa gtcctatgcc tttggcacca ttggagagcc tactgcagcc 1440
gtcaccctca agcttatcga cgtgcccgaa gctggctact tcgccgagaa caatcaggga 1500
gagctgtgca tcaagggcaa cgtggtcatg aaggagtatt acaagaacga ggaagagacc 1560
aagaaagcgt tctccgacga tggctacttt ctcaccggag acattgccga gtggactgcc 1620
aatggtcagc ttcgaattat cgacagacga aagaacctcg tcaagaccca gaacggagag 1680
tacattgctc tggagaagct cgaaacacag taccgatcgt cttcctacgt tgccaacctg 1740
tgcgtctacg ccgaccagaa ccgagtcaag cccatcgctc tggtcattcc caacgagggt 1800
cctaccaaaa agcttgccca gagcttgggc gtggattccg acgactggga tgccgtctgt 1860
tccaacaaga aagtggtcaa ggctgttctc aaggacatgc tggataccgg acgatctctc 1920
ggtctgtccg gcatcgagct gctgcaagga atcgtgttgc tgcctggcga gtggactccc 1980
cagaacagct acctcaccgc tgcccagaag ctcaaccgaa agaagattgt cgatgacaac 2040
aaaaaggaga tcgacgagtg ctacgagcag tcctaa 2076
<210> 36
<211> 691
<212> PRT
<213> 解脂耶氏酵母
<400> 36
Met Val Gly Tyr Thr Ile Ser Ser Lys Pro Val Ser Val Glu Val Gly
1 5 10 15
Pro Ala Lys Pro Gly Glu Thr Ala Pro Arg Arg Asn Val Ile Ala Lys
20 25 30
Asp Ala Pro Val Val Phe Pro Asp Asn Asp Ser Ser Leu Thr Thr Val
35 40 45
Tyr Lys Leu Phe Lys Lys Tyr Ala Glu Ile Asn Ser Glu Arg Lys Ala
50 55 60
Met Gly Trp Arg Asp Thr Ile Asp Ile His Val Glu Thr Lys Gln Val
65 70 75 80
Thr Lys Val Val Asp Gly Val Glu Lys Lys Val Pro Lys Glu Trp Lys
85 90 95
Tyr Phe Glu Met Gly Pro Tyr Lys Trp Leu Ser Tyr Lys Glu Ala Leu
100 105 110
Lys Leu Val His Asp Tyr Gly Ala Gly Leu Arg His Leu Gly Ile Lys
115 120 125
Pro Lys Glu Lys Met His Ile Tyr Ala Gln Thr Ser His Arg Trp Met
130 135 140
Leu Ser Gly Leu Ala Ser Leu Ser Gln Gly Ile Pro Ile Val Thr Ala
145 150 155 160
Tyr Asp Thr Leu Gly Glu Glu Gly Leu Thr Arg Ser Leu Gln Glu Thr
165 170 175
Asn Ser Val Ile Met Phe Thr Asp Lys Ala Leu Leu Ser Ser Leu Lys
180 185 190
Val Ser Leu Lys Lys Gly Thr Asp Leu Arg Ile Ile Ile Tyr Gly Gly
195 200 205
Asp Leu Thr Pro Asp Asp Lys Lys Ala Gly Asn Thr Glu Ile Asp Ala
210 215 220
Ile Lys Glu Ile Val Pro Asp Met Lys Ile Tyr Thr Met Asp Glu Val
225 230 235 240
Val Ala Leu Gly Arg Glu His Pro His Pro Val Glu Glu Val Asp Tyr
245 250 255
Glu Asp Leu Ala Phe Ile Met Tyr Thr Ser Gly Ser Thr Gly Val Pro
260 265 270
Lys Gly Val Val Leu Gln His Lys Gln Ile Leu Ala Ser Val Ala Gly
275 280 285
Val Thr Lys Ile Ile Asp Arg Ser Ile Ile Gly Asn Thr Asp Arg Leu
290 295 300
Leu Asn Phe Leu Pro Leu Ala His Ile Phe Glu Phe Val Phe Glu Met
305 310 315 320
Val Thr Phe Trp Trp Gly Ala Ser Leu Gly Tyr Gly Thr Val Lys Thr
325 330 335
Ile Ser Asp Leu Ser Met Lys Asn Cys Lys Gly Asp Ile Arg Glu Leu
340 345 350
Lys Pro Thr Ile Met Val Gly Val Pro Ala Val Trp Glu Pro Met Arg
355 360 365
Lys Gly Ile Leu Gly Lys Ile Lys Glu Leu Ser Pro Leu Met Gln Arg
370 375 380
Val Phe Trp Ala Ser Phe Ala Ala Lys Gln Arg Leu Asp Glu Asn Gly
385 390 395 400
Leu Pro Gly Gly Ser Ile Leu Asp Ser Leu Ile Phe Lys Lys Val Lys
405 410 415
Asp Ala Thr Gly Gly Cys Leu Arg Tyr Val Cys Asn Gly Gly Ala Pro
420 425 430
Val Ser Val Asp Thr Gln Lys Phe Ile Thr Thr Leu Ile Cys Pro Met
435 440 445
Leu Ile Gly Cys Gly Leu Thr Glu Thr Thr Ala Asn Thr Thr Ile Met
450 455 460
Ser Pro Lys Ser Tyr Ala Phe Gly Thr Ile Gly Glu Pro Thr Ala Ala
465 470 475 480
Val Thr Leu Lys Leu Ile Asp Val Pro Glu Ala Gly Tyr Phe Ala Glu
485 490 495
Asn Asn Gln Gly Glu Leu Cys Ile Lys Gly Asn Val Val Met Lys Glu
500 505 510
Tyr Tyr Lys Asn Glu Glu Glu Thr Lys Lys Ala Phe Ser Asp Asp Gly
515 520 525
Tyr Phe Leu Thr Gly Asp Ile Ala Glu Trp Thr Ala Asn Gly Gln Leu
530 535 540
Arg Ile Ile Asp Arg Arg Lys Asn Leu Val Lys Thr Gln Asn Gly Glu
545 550 555 560
Tyr Ile Ala Leu Glu Lys Leu Glu Thr Gln Tyr Arg Ser Ser Ser Tyr
565 570 575
Val Ala Asn Leu Cys Val Tyr Ala Asp Gln Asn Arg Val Lys Pro Ile
580 585 590
Ala Leu Val Ile Pro Asn Glu Gly Pro Thr Lys Lys Leu Ala Gln Ser
595 600 605
Leu Gly Val Asp Ser Asp Asp Trp Asp Ala Val Cys Ser Asn Lys Lys
610 615 620
Val Val Lys Ala Val Leu Lys Asp Met Leu Asp Thr Gly Arg Ser Leu
625 630 635 640
Gly Leu Ser Gly Ile Glu Leu Leu Gln Gly Ile Val Leu Leu Pro Gly
645 650 655
Glu Trp Thr Pro Gln Asn Ser Tyr Leu Thr Ala Ala Gln Lys Leu Asn
660 665 670
Arg Lys Lys Ile Val Asp Asp Asn Lys Lys Glu Ile Asp Glu Cys Tyr
675 680 685
Glu Gln Ser
690
<210> 37
<211> 574
<212> PRT
<213> 解脂耶氏酵母
<400> 37
Met Thr Thr Ile Ile His Lys Ser Thr Phe Pro Asp Ile Glu Leu Phe
1 5 10 15
Gln Gly Ser Ile Thr Asp Phe Ile Arg Thr Gly Ala Tyr Ala Glu Asp
20 25 30
Asp Tyr Lys Pro Cys Met Ile Asp Ala Glu Thr Gly Glu Gln Leu Thr
35 40 45
Gln Lys Gln Ile Leu Asp Cys Ala Asp Gln Phe Arg Ser Leu Leu Tyr
50 55 60
Gln His Gly Val Gln Lys Thr Pro Asn Arg Asp Glu Arg Ile Gly Asp
65 70 75 80
Val Val Ile Pro Phe Ile Asp Asn Asn Ile Tyr Leu Pro Ala Ile His
85 90 95
Tyr Ala Cys Leu Glu Leu Gly Cys Cys Met Asn Pro Ala Ser Thr Gln
100 105 110
Gln Thr Pro Leu Glu Leu Ser Lys Gln Ile Arg Val Thr Asp Pro Lys
115 120 125
Val Ile Ile Tyr Gln Arg Lys Tyr Arg Lys Thr Val Met His Ala Ile
130 135 140
Asp Leu Val Cys Tyr Thr Asn Phe Pro Ile Val Ile Glu Phe Glu Thr
145 150 155 160
Met Leu Phe Leu Arg Asn Ser Val Pro Pro Pro Pro Lys Lys Ala Lys
165 170 175
Phe His Ile Thr Ser Thr Glu Gln Ala Arg Lys Arg Ile Ala Tyr Leu
180 185 190
Gly Met Ser Ser Gly Thr Ser Gly Lys Ser Lys Ala Val Arg Leu Ser
195 200 205
His His Asn Ile Val Ala Cys Ser Gln Val Ser Gln Val Thr Phe Pro
210 215 220
Ala Leu Tyr Lys Ala Ser Asn Val Cys Val Ala Val Leu Pro Ser Cys
225 230 235 240
His Val Phe Gly Leu Tyr Ile Phe Phe Met Val Leu Pro Arg Ser Gly
245 250 255
Gly Thr Thr Ile Met His Thr Lys Phe Asp Leu Lys Gln Leu Leu Glu
260 265 270
Ser Gln Lys Lys Tyr Lys Ala Asn Phe Leu Pro Leu Val Pro Pro Ile
275 280 285
Ala Val Gln Leu Ala Lys Asn Pro Met Val Lys Asn Tyr Ala Asp Ser
290 295 300
Leu Lys Gln Val Lys Leu Ile Met Ser Ala Ala Ala Pro Leu Gly Ala
305 310 315 320
Glu Val Thr Gln Ser Leu Ile Lys Ala Ile Gly Pro Gln Val Arg Val
325 330 335
Val Gln Gly Tyr Gly Met Thr Glu Thr Ser Pro Cys Val Thr Leu Phe
340 345 350
Asp Pro Ala Asp Pro His Leu His Ile Lys Ala Cys Gly Lys Leu Val
355 360 365
Pro Asn Cys Glu Val Arg Ile Val Ala Asp Gly Val Asp Gln Pro Ala
370 375 380
Tyr Ser Gly Ser Val Ser Asp Val Ala Lys Asn Lys Thr Asp Asn Leu
385 390 395 400
Pro Val Gly Glu Ile Trp Val Arg Gly Pro Gln Val Met Asp Gly Tyr
405 410 415
His Lys Asn Lys Ser Ala Thr Ser Glu Ala Phe Val Glu Ala Asn Asp
420 425 430
Ser Ser Val Cys Tyr Asn Thr Lys Trp Leu Arg Thr Gly Asp Val Gly
435 440 445
Leu Val Asp Ser Leu Gly Arg Phe Met Ile Val Asp Arg Thr Lys Glu
450 455 460
Met Ile Lys Ser Met Ser Lys Gln Val Ala Pro Ala Glu Leu Glu Asp
465 470 475 480
Met Leu Leu Ala His Ala Asp Val Ser Asp Ala Ala Val Ile Gly Val
485 490 495
Glu Asn Glu Ala Lys Gly Thr Glu Gln Ile Arg Ala Phe Leu Val Leu
500 505 510
Lys Lys Gly Gly Asp Ala Leu Glu Val Lys Lys Trp Met Asp Ser Lys
515 520 525
Leu Pro Lys Tyr Lys Gln Leu His Gly Gly Val Val Val Ile Asp Gln
530 535 540
Ile Pro Lys Ser Gln Ala Gly Lys Ile Leu Arg Arg Met Leu Arg Leu
545 550 555 560
Arg Gln Asp Asp Val Val Leu Gly Thr Asp Gln Ala Lys Leu
565 570
<210> 38
<211> 1647
<212> DNA
<213> 人工序列
<220>
<223> YlACoS-3P
<400> 38
atggccatca tccactccac cggaactctg cccatcttca acggtaccgt caccgattac 60
ctgcgaacaa agccttctta ctcgtccaca gatccagcct acatcgacgt ggttacaggc 120
aactctatca gctactccga ggtctggaag cttgccgacc gactctcctc tgctctgtac 180
aacgactacg gactcaccga cgccaagccc gacgagaatg tgggtcctgt tgtcatgctg 240
cacgctgtca attcgcctct cctggcatct gttcactacg ctcttctgga tctgggcgtc 300
acaatcactc ccgcagctgc cacctacgag gctggcgatc tcgcacatca aatcaaggtg 360
tgctctccgt ccctggtcat ttgcaaccag cagttcgaac ccaaggtcaa atctgcctcc 420
agcaacacca agctcatttt catcgaggat ctgctcaaaa cccagtcgtc tgctccctgg 480
aaaaagttca ctacctccaa ccccaaccga gttgcctacc tgggcatgtc cagtggaacc 540
tctggtctcc ccaaggcggt tcaacagacc cacatcaaca tgtcgtcttc caccgaagcc 600
gtcatttcct ctcagaccat cttcagcgct cgaaagaacg tcaccgcagc cattgtgccc 660
atgactcatg tctacggact caccaagttt gttttccact ctgtcgcagg ctcaatgacc 720
accgttgtgt tccccaagtt ctccctggtc gacctcctgg aggcccagat caagtacaag 780
atcaacattc tgtatctggt tcctccagtg gtcttggctc tggccaagga ctctcgtgta 840
cagccctaca tcaagtccat ttgcgagctc accactctga ttgccactgg tgcggctccc 900
cttcctccca ctgcaggcga cgcccttctg gagcgactta cgggcaacaa agagggaaac 960
agagacaacg gtatggatcc cttggttctc atccagggct acggactcac agagactctc 1020
caggtgtctg tcttcaagcc agaggatccc gaacgagatc tcaagaccgt gggcaaactg 1080
cttcccaaca ccgaggttcg aattgtcggc gagaagggag atgttccgcg ttccaaatgg 1140
tcgtttgtca ctcctccaac cggcgaaatc tacattcgag gtccccacgt gactcctggt 1200
tacttcaaca acgactctgc caactctgag tcctttgacg gcgagtggct caagaccggc 1260
gatatcggat acatggacct ggaaggtcga ctcaccattg tggaccgaaa caaggagatg 1320
atcaaggtca acggacgtca ggttgctcct gccgagatcg aatctgtgct gctgggtcat 1380
cctatggtca aggatgtggc cgtcattgga gtcaccaatc ccgacagagg cacggagtct 1440
gctcgggcgt ttcttgttac tgaagctcga gctctccctg tcatcaagca gtggtttgac 1500
cgtcgagttc cctcctacaa gcgactttac ggaggcattg tggttgtcga tgccattccc 1560
aagtctgcct cgggcaagat tctgcgacgg gtcctcagag agcgaaaggg cgactccgtg 1620
tttggagagt atgtcgagga agtctaa 1647
<210> 39
<211> 548
<212> PRT
<213> 人工序列
<220>
<223> YlACoS-3P蛋白质
<400> 39
Met Ala Ile Ile His Ser Thr Gly Thr Leu Pro Ile Phe Asn Gly Thr
1 5 10 15
Val Thr Asp Tyr Leu Arg Thr Lys Pro Ser Tyr Ser Ser Thr Asp Pro
20 25 30
Ala Tyr Ile Asp Val Val Thr Gly Asn Ser Ile Ser Tyr Ser Glu Val
35 40 45
Trp Lys Leu Ala Asp Arg Leu Ser Ser Ala Leu Tyr Asn Asp Tyr Gly
50 55 60
Leu Thr Asp Ala Lys Pro Asp Glu Asn Val Gly Pro Val Val Met Leu
65 70 75 80
His Ala Val Asn Ser Pro Leu Leu Ala Ser Val His Tyr Ala Leu Leu
85 90 95
Asp Leu Gly Val Thr Ile Thr Pro Ala Ala Ala Thr Tyr Glu Ala Gly
100 105 110
Asp Leu Ala His Gln Ile Lys Val Cys Ser Pro Ser Leu Val Ile Cys
115 120 125
Asn Gln Gln Phe Glu Pro Lys Val Lys Ser Ala Ser Ser Asn Thr Lys
130 135 140
Leu Ile Phe Ile Glu Asp Leu Leu Lys Thr Gln Ser Ser Ala Pro Trp
145 150 155 160
Lys Lys Phe Thr Thr Ser Asn Pro Asn Arg Val Ala Tyr Leu Gly Met
165 170 175
Ser Ser Gly Thr Ser Gly Leu Pro Lys Ala Val Gln Gln Thr His Ile
180 185 190
Asn Met Ser Ser Ser Thr Glu Ala Val Ile Ser Ser Gln Thr Ile Phe
195 200 205
Ser Ala Arg Lys Asn Val Thr Ala Ala Ile Val Pro Met Thr His Val
210 215 220
Tyr Gly Leu Thr Lys Phe Val Phe His Ser Val Ala Gly Ser Met Thr
225 230 235 240
Thr Val Val Phe Pro Lys Phe Ser Leu Val Asp Leu Leu Glu Ala Gln
245 250 255
Ile Lys Tyr Lys Ile Asn Ile Leu Tyr Leu Val Pro Pro Val Val Leu
260 265 270
Ala Leu Ala Lys Asp Ser Arg Val Gln Pro Tyr Ile Lys Ser Ile Cys
275 280 285
Glu Leu Thr Thr Leu Ile Ala Thr Gly Ala Ala Pro Leu Pro Pro Thr
290 295 300
Ala Gly Asp Ala Leu Leu Glu Arg Leu Thr Gly Asn Lys Glu Gly Asn
305 310 315 320
Arg Asp Asn Gly Met Asp Pro Leu Val Leu Ile Gln Gly Tyr Gly Leu
325 330 335
Thr Glu Thr Leu Gln Val Ser Val Phe Lys Pro Glu Asp Pro Glu Arg
340 345 350
Asp Leu Lys Thr Val Gly Lys Leu Leu Pro Asn Thr Glu Val Arg Ile
355 360 365
Val Gly Glu Lys Gly Asp Val Pro Arg Ser Lys Trp Ser Phe Val Thr
370 375 380
Pro Pro Thr Gly Glu Ile Tyr Ile Arg Gly Pro His Val Thr Pro Gly
385 390 395 400
Tyr Phe Asn Asn Asp Ser Ala Asn Ser Glu Ser Phe Asp Gly Glu Trp
405 410 415
Leu Lys Thr Gly Asp Ile Gly Tyr Met Asp Leu Glu Gly Arg Leu Thr
420 425 430
Ile Val Asp Arg Asn Lys Glu Met Ile Lys Val Asn Gly Arg Gln Val
435 440 445
Ala Pro Ala Glu Ile Glu Ser Val Leu Leu Gly His Pro Met Val Lys
450 455 460
Asp Val Ala Val Ile Gly Val Thr Asn Pro Asp Arg Gly Thr Glu Ser
465 470 475 480
Ala Arg Ala Phe Leu Val Thr Glu Ala Arg Ala Leu Pro Val Ile Lys
485 490 495
Gln Trp Phe Asp Arg Arg Val Pro Ser Tyr Lys Arg Leu Tyr Gly Gly
500 505 510
Ile Val Val Val Asp Ala Ile Pro Lys Ser Ala Ser Gly Lys Ile Leu
515 520 525
Arg Arg Val Leu Arg Glu Arg Lys Gly Asp Ser Val Phe Gly Glu Tyr
530 535 540
Val Glu Glu Val
545
<210> 40
<211> 616
<212> PRT
<213> 解脂耶氏酵母
<400> 40
Met Pro Gln Ile Ile His Lys Ser Ala Trp Gly Asp Ile Pro Leu Ser
1 5 10 15
Thr Phe Phe Tyr Gly Asn Val Thr Asp Tyr Leu Arg Ser Lys Lys Ser
20 25 30
Phe Gly Ser Asp Lys Ile Gly Tyr Ile Asp Ala Glu Thr Gly Glu Gly
35 40 45
Ile Thr Tyr Lys Gln Leu Trp Lys Leu Ala Asn Gly Ile Ser Ala Val
50 55 60
Leu Tyr His His Tyr Gly Ile Gly His Ala Arg Ala Pro Val Ala Ser
65 70 75 80
Asp His Thr Leu Gly Asp Val Val Met Leu His Ala Pro Asn Ser Arg
85 90 95
Phe Phe Pro Ser Leu His Tyr Gly Met Leu Asp Met Gly Cys Thr Ile
100 105 110
Thr Ser Ala Ser Val Ser Tyr Asp Val Ala Asp Leu Ala His Gln Leu
115 120 125
Arg Val Thr Asp Ala Ser Leu Val Leu Cys Tyr Gln Glu Lys Glu Asn
130 135 140
Asn Val Arg Gln Ala Ile Lys Glu Ala Gln Lys Asp Ala Ala Phe Pro
145 150 155 160
Gly Ile Thr His Pro Val Arg Ile Leu Leu Ile Glu Asn Leu Leu Thr
165 170 175
Met Ala Cys Asn Ile Ser Glu Glu Lys Ile Asn Ser Ala Met Ala Arg
180 185 190
Lys Phe Glu Tyr Ser Pro Gln Glu Cys Thr Lys Arg Ile Ala Tyr Leu
195 200 205
Ser Met Ser Ser Gly Thr Thr Gly Gly Ile Pro Lys Ala Val Arg Leu
210 215 220
Thr His Phe Asn Met Ser Ser Cys Asp Thr Leu Gly Thr Leu Ser Thr
225 230 235 240
Pro Ser Phe Ser Thr Gly Asp Asp Ile Arg Val Ala Ala Ile Val Pro
245 250 255
Met Thr His Gln Tyr Gly Leu Thr Lys Phe Ile Phe Asn Met Cys Ser
260 265 270
Ser His Ala Thr Thr Val Val His Arg Gln Phe Asp Leu Val Lys Leu
275 280 285
Leu Glu Ser Gln Lys Lys Tyr Lys Leu Asn Arg Leu Met Leu Val Pro
290 295 300
Pro Val Ile Val Lys Met Ala Lys Asp Pro Ala Val Glu Pro Tyr Ile
305 310 315 320
Pro Ser Leu Tyr Glu His Val Asp Phe Ile Thr Thr Gly Ala Ala Pro
325 330 335
Leu Pro Gly Ser Ala Val Thr Asn Leu Leu Thr Arg Ile Thr Gly Asn
340 345 350
Pro Gln Gly Ile Arg His Ser Gln Ser Gly Arg Pro Pro Leu Thr Ile
355 360 365
Ser Gln Gly Tyr Gly Leu Thr Glu Thr Ser Pro Leu Cys Ala Val Phe
370 375 380
Asp Pro Leu Asp Pro Asp Val Asp Phe Arg Ser Ala Gly Lys Ala Thr
385 390 395 400
Ser His Val Glu Ile Arg Ile Val Ser Glu Asp Gly Val Asp Gln Pro
405 410 415
Gln Leu Lys Leu Asp Asp Leu Ser His Leu Asp Gly Met Leu Lys Arg
420 425 430
Asp Glu Pro Leu Pro Val Gly Glu Val Leu Ile Arg Gly Pro Met Ile
435 440 445
Met Asp Gly Tyr His Lys Asn Arg Gln Ser Ser Glu Glu Ser Phe Asp
450 455 460
Arg Ser Gln Glu Asp Pro Lys Thr Leu Ile His Trp Gln Asp Lys Trp
465 470 475 480
Leu Lys Thr Gly Asp Ile Gly Met Val Asp Gln Lys Gly Arg Leu Met
485 490 495
Ile Val Asp Arg Asn Lys Glu Met Ile Lys Ser Met Ser Lys Gln Val
500 505 510
Ala Pro Ala Glu Leu Glu Ser Leu Leu Leu Asn His Asp Gln Val Ile
515 520 525
Asp Cys Ala Val Ile Gly Val Asn Ser Glu Ala Lys Ala Thr Glu Ser
530 535 540
Ala Arg Ala Phe Leu Val Leu Lys Asp Pro Ser Tyr Asp Ala Val Lys
545 550 555 560
Ile Lys Ala Trp Leu Asp Gly Gln Val Pro Ser Tyr Lys Arg Leu Tyr
565 570 575
Gly Gly Val Val Val Leu Lys Asn Glu Gln Ile Pro Lys Asn Pro Ser
580 585 590
Gly Lys Ile Leu Arg Arg Ile Leu Arg Thr Arg Lys Asp Asp Phe Ile
595 600 605
Gln Gly Ile Asp Val Ser Lys Leu
610 615
<210> 41
<211> 1800
<212> DNA
<213> 人工序列
<220>
<223> YlACoS-5P
<400> 41
atggcctcaa tcattcacaa gtctcctgtg cccgacgttc agctgttcta cggttcctgg 60
ccagatctca tgcgaacctc tcctcatgcc cacaacgact ccaaacccgt ggtctttgac 120
ttcgatacca agcagcaact tacttggaag caggtctggc aactcagcgc tcgactcaga 180
gcccagctgt accacaagta cggaatcggc aaacccggtg ctcttgcacc tttccacaac 240
gatccctctc tcggagacgt ggtcatcttc tacactccca acacctacag ctcgttgccc 300
tatcatctgg ctcttcacga tctcggagcc accatttctc ctgcctccac atcttacgac 360
gtcaaggaca tttgccatca gatcgttact accgatgcgg tcgtggttgt cgctgcagcc 420
gagaaatccg agattgctcg agaggccgtt cagctgtctg gtcgagacgt cagagttgtg 480
gtcatggagg acctcatcaa caatgctccc accgttgcgc agaacgatat cgactcggca 540
cctcatgtgt ccctgtctcg ggaccaggct cgagccaaga ttgcatacct gggcatgtct 600
tccggtacgt ctggcggact tcccaaggct gttcgtctca ctcacttcaa cgttacctcg 660
aactgtctgc aggtctccgc tgccgcaccc aaccttgccc agaacgtggt tgccagcgcc 720
gtcattccaa ccactcacat ctacggtctc accatgtttc tgtcggttct tccctacaac 780
ggttccgtgg tcattcatca caagcaattc aacttgcgag atctgctcga ggctcagaag 840
acatacaagg tctctctgtg gattctcgtt cctcccgtca tcgtgcagct tgccaagaac 900
cctatggtcg acgagtacct ggactccatt cgagcccatg tgcggtgcat cgtctctgga 960
gctgctcctc tcggtggcaa tgtcgtggat caggtttcgg ttcgtcttac cggcaacaag 1020
gaaggcattc tgcccaacgg agacaagctc gtcattcatc aagcctacgg tcttaccgag 1080
tcctctccca tcgttggaat gctcgatcct ctgtcggacc acatcgacgt catgactgtg 1140
ggctgtctca tgcccaatac cgaggctcga attgtcgacg aagagggaaa cgatcagcca 1200
gcagtccacg ttaccgacac acgaggcatc ggtgccgctg tcaagcgagg cgagaagatt 1260
ccctccggag aactctggat tcgaggtcct cagatcatgg acggatacca caagaacccc 1320
gagtcgtctc gtgagtccct ggaacccagc acagagacct acggtctgca acatttccag 1380
gacagatggc ttcgaactgg agacgttgct gtcatcgaca ccttcggacg agtcatggtt 1440
gtggatcgaa ccaaggagct catcaagtcc atgtctcgac aggttgctcc tgccgagctc 1500
gaagctcttc tgctcaacca tccttccgtc aacgatgtgg ctgtcgttgg cgtccacaac 1560
gacgataatg gcacagagtc agcacgagcg tttgtcgttc ttcaaccagg cgacgcctgt 1620
gatcctacta ccatcaagca ctggatggac cagcaagttc cctcctacaa gcggctgtac 1680
ggaggcattg tggtcatcga cactgttccc aagaatgcct ctggcaagat tctgcgaaga 1740
ctgcttcgac agcggagaga cgatcgagtc tggggtctgg ccaaggttgc caagctctaa 1800
<210> 42
<211> 599
<212> PRT
<213> 人工序列
<220>
<223> YlACoS-5P蛋白质
<400> 42
Met Ala Ser Ile Ile His Lys Ser Pro Val Pro Asp Val Gln Leu Phe
1 5 10 15
Tyr Gly Ser Trp Pro Asp Leu Met Arg Thr Ser Pro His Ala His Asn
20 25 30
Asp Ser Lys Pro Val Val Phe Asp Phe Asp Thr Lys Gln Gln Leu Thr
35 40 45
Trp Lys Gln Val Trp Gln Leu Ser Ala Arg Leu Arg Ala Gln Leu Tyr
50 55 60
His Lys Tyr Gly Ile Gly Lys Pro Gly Ala Leu Ala Pro Phe His Asn
65 70 75 80
Asp Pro Ser Leu Gly Asp Val Val Ile Phe Tyr Thr Pro Asn Thr Tyr
85 90 95
Ser Ser Leu Pro Tyr His Leu Ala Leu His Asp Leu Gly Ala Thr Ile
100 105 110
Ser Pro Ala Ser Thr Ser Tyr Asp Val Lys Asp Ile Cys His Gln Ile
115 120 125
Val Thr Thr Asp Ala Val Val Val Val Ala Ala Ala Glu Lys Ser Glu
130 135 140
Ile Ala Arg Glu Ala Val Gln Leu Ser Gly Arg Asp Val Arg Val Val
145 150 155 160
Val Met Glu Asp Leu Ile Asn Asn Ala Pro Thr Val Ala Gln Asn Asp
165 170 175
Ile Asp Ser Ala Pro His Val Ser Leu Ser Arg Asp Gln Ala Arg Ala
180 185 190
Lys Ile Ala Tyr Leu Gly Met Ser Ser Gly Thr Ser Gly Gly Leu Pro
195 200 205
Lys Ala Val Arg Leu Thr His Phe Asn Val Thr Ser Asn Cys Leu Gln
210 215 220
Val Ser Ala Ala Ala Pro Asn Leu Ala Gln Asn Val Val Ala Ser Ala
225 230 235 240
Val Ile Pro Thr Thr His Ile Tyr Gly Leu Thr Met Phe Leu Ser Val
245 250 255
Leu Pro Tyr Asn Gly Ser Val Val Ile His His Lys Gln Phe Asn Leu
260 265 270
Arg Asp Leu Leu Glu Ala Gln Lys Thr Tyr Lys Val Ser Leu Trp Ile
275 280 285
Leu Val Pro Pro Val Ile Val Gln Leu Ala Lys Asn Pro Met Val Asp
290 295 300
Glu Tyr Leu Asp Ser Ile Arg Ala His Val Arg Cys Ile Val Ser Gly
305 310 315 320
Ala Ala Pro Leu Gly Gly Asn Val Val Asp Gln Val Ser Val Arg Leu
325 330 335
Thr Gly Asn Lys Glu Gly Ile Leu Pro Asn Gly Asp Lys Leu Val Ile
340 345 350
His Gln Ala Tyr Gly Leu Thr Glu Ser Ser Pro Ile Val Gly Met Leu
355 360 365
Asp Pro Leu Ser Asp His Ile Asp Val Met Thr Val Gly Cys Leu Met
370 375 380
Pro Asn Thr Glu Ala Arg Ile Val Asp Glu Glu Gly Asn Asp Gln Pro
385 390 395 400
Ala Val His Val Thr Asp Thr Arg Gly Ile Gly Ala Ala Val Lys Arg
405 410 415
Gly Glu Lys Ile Pro Ser Gly Glu Leu Trp Ile Arg Gly Pro Gln Ile
420 425 430
Met Asp Gly Tyr His Lys Asn Pro Glu Ser Ser Arg Glu Ser Leu Glu
435 440 445
Pro Ser Thr Glu Thr Tyr Gly Leu Gln His Phe Gln Asp Arg Trp Leu
450 455 460
Arg Thr Gly Asp Val Ala Val Ile Asp Thr Phe Gly Arg Val Met Val
465 470 475 480
Val Asp Arg Thr Lys Glu Leu Ile Lys Ser Met Ser Arg Gln Val Ala
485 490 495
Pro Ala Glu Leu Glu Ala Leu Leu Leu Asn His Pro Ser Val Asn Asp
500 505 510
Val Ala Val Val Gly Val His Asn Asp Asp Asn Gly Thr Glu Ser Ala
515 520 525
Arg Ala Phe Val Val Leu Gln Pro Gly Asp Ala Cys Asp Pro Thr Thr
530 535 540
Ile Lys His Trp Met Asp Gln Gln Val Pro Ser Tyr Lys Arg Leu Tyr
545 550 555 560
Gly Gly Ile Val Val Ile Asp Thr Val Pro Lys Asn Ala Ser Gly Lys
565 570 575
Ile Leu Arg Arg Leu Leu Arg Gln Arg Arg Asp Asp Arg Val Trp Gly
580 585 590
Leu Ala Lys Val Ala Lys Leu
595
<210> 43
<211> 1788
<212> DNA
<213> 人工序列
<220>
<223> YlACoS-6P
<400> 43
atggccacac agattatcca caacgccacc atccccaata tccccgtcga ccagctctac 60
gacggcaaga tcaccgactt cattcgatcc ggaggccact ccaacgaaac caagccttct 120
gtcatcgacg ccaagacagg ccagactctc tcccaggcgg aaatgtggca gctgtcggac 180
aagtacgcgg cacttctcag ctctcagtac ggtctgtgcc gacacagaga caacgagctg 240
gacccatcta tgggagatgt gctcatcacc ttctttggaa acgttatcct cgctcctgtg 300
gtccattggg ctgccctcga cctcggagca accatttctc ctggatccac aggctactct 360
gcccaggatc tcgctcacca gttccgagtc accactccca aggtcgttgt gtacgccaag 420
gcgttcaagg atgtggtgga cgaggctacg aagctgtaca actccccaaa ccctccagca 480
cttgtcgagc tcgaggcgct ggacaagcag gcccgaatgg ttggaaacca caaggtcgaa 540
cacacccgaa agatcaagct ggctcctcac gagtcccgaa ctcggatcgc gtaccttggc 600
atgtcttcag gtacctccgg tggagtttca aaggctgtcc gactcaccca ttccaatctc 660
acgtcgtgtt ccgaaatctc gaacaaagcc tccgagtctc tcgcaactga ccagcagatc 720
gctgccgcca tcattcccgt gagtcatctg tttggactgt ccaagttcct cattggcaac 780
cctcacgccg gagccaccac tgtctatcac aatggcttcg atctgatcga ggtgctggag 840
gcacagaaga aatacaaagt caactcgtgg accctggttc ctcccatcat tgtcctgctc 900
accaaacacc ccattgtcga gaagtacatt ccttctctcc gtgcccacat gcgagccatc 960
ctctccggag ctgctcctct gggtgccaat gtcacagagg ctcttctcac ccgagtcact 1020
ggcaacaagt ttggcgagtc tcccgagggc ggtctgcgaa tcgttcaggg ctacggactt 1080
acagagacgt ctcccgttgc cactctgttt gaccccgaag acaaggaacg acacattcgg 1140
tcgtgtggaa agctcgtgcc caactctcag gttcgaattg tcaacgaaga cggcgtggat 1200
cagcctgcct acgatgtgga ccccaacgag ctggacgagg ccatcaaaca gggcactctg 1260
ccagtcggag agctttggat cagaggtccc caggttatgg acggctacca taacaacccc 1320
gaggccaacg aagcctgttt cgtcaaggct gacgatgctg aagcagatac tgcctactac 1380
aacagacact ggttccgaac cggagacgtt gctctggtcg acaagcaggg cagatacatg 1440
attgtggacc gaaccaagga gatgatcaag agtcagggta agcaggttgc tcctgccgag 1500
ctcgaagaca tgctcctggg acacgcacag gtggcagata ccgcagtcat cggtattcag 1560
gacgtggaga agggtaacga ggctcctcga gcttttgttg tgctcaagga cccgaagtac 1620
gacgctgtgg agatcaagac atggctggac aagcagcttc ccaagtacaa gcagcttcat 1680
gctggcatcg tggtcattga tgccattccc aagaacgcca gtggcaagat tctgcgacgt 1740
ctgttgcgtg ctagaaagga cgatgttgtt ctgggtctca acaagtaa 1788
<210> 44
<211> 595
<212> PRT
<213> 人工序列
<220>
<223> YlACoS-6P蛋白质
<400> 44
Met Ala Thr Gln Ile Ile His Asn Ala Thr Ile Pro Asn Ile Pro Val
1 5 10 15
Asp Gln Leu Tyr Asp Gly Lys Ile Thr Asp Phe Ile Arg Ser Gly Gly
20 25 30
His Ser Asn Glu Thr Lys Pro Ser Val Ile Asp Ala Lys Thr Gly Gln
35 40 45
Thr Leu Ser Gln Ala Glu Met Trp Gln Leu Ser Asp Lys Tyr Ala Ala
50 55 60
Leu Leu Ser Ser Gln Tyr Gly Leu Cys Arg His Arg Asp Asn Glu Leu
65 70 75 80
Asp Pro Ser Met Gly Asp Val Leu Ile Thr Phe Phe Gly Asn Val Ile
85 90 95
Leu Ala Pro Val Val His Trp Ala Ala Leu Asp Leu Gly Ala Thr Ile
100 105 110
Ser Pro Gly Ser Thr Gly Tyr Ser Ala Gln Asp Leu Ala His Gln Phe
115 120 125
Arg Val Thr Thr Pro Lys Val Val Val Tyr Ala Lys Ala Phe Lys Asp
130 135 140
Val Val Asp Glu Ala Thr Lys Leu Tyr Asn Ser Pro Asn Pro Pro Ala
145 150 155 160
Leu Val Glu Leu Glu Ala Leu Asp Lys Gln Ala Arg Met Val Gly Asn
165 170 175
His Lys Val Glu His Thr Arg Lys Ile Lys Leu Ala Pro His Glu Ser
180 185 190
Arg Thr Arg Ile Ala Tyr Leu Gly Met Ser Ser Gly Thr Ser Gly Gly
195 200 205
Val Ser Lys Ala Val Arg Leu Thr His Ser Asn Leu Thr Ser Cys Ser
210 215 220
Glu Ile Ser Asn Lys Ala Ser Glu Ser Leu Ala Thr Asp Gln Gln Ile
225 230 235 240
Ala Ala Ala Ile Ile Pro Val Ser His Leu Phe Gly Leu Ser Lys Phe
245 250 255
Leu Ile Gly Asn Pro His Ala Gly Ala Thr Thr Val Tyr His Asn Gly
260 265 270
Phe Asp Leu Ile Glu Val Leu Glu Ala Gln Lys Lys Tyr Lys Val Asn
275 280 285
Ser Trp Thr Leu Val Pro Pro Ile Ile Val Leu Leu Thr Lys His Pro
290 295 300
Ile Val Glu Lys Tyr Ile Pro Ser Leu Arg Ala His Met Arg Ala Ile
305 310 315 320
Leu Ser Gly Ala Ala Pro Leu Gly Ala Asn Val Thr Glu Ala Leu Leu
325 330 335
Thr Arg Val Thr Gly Asn Lys Phe Gly Glu Ser Pro Glu Gly Gly Leu
340 345 350
Arg Ile Val Gln Gly Tyr Gly Leu Thr Glu Thr Ser Pro Val Ala Thr
355 360 365
Leu Phe Asp Pro Glu Asp Lys Glu Arg His Ile Arg Ser Cys Gly Lys
370 375 380
Leu Val Pro Asn Ser Gln Val Arg Ile Val Asn Glu Asp Gly Val Asp
385 390 395 400
Gln Pro Ala Tyr Asp Val Asp Pro Asn Glu Leu Asp Glu Ala Ile Lys
405 410 415
Gln Gly Thr Leu Pro Val Gly Glu Leu Trp Ile Arg Gly Pro Gln Val
420 425 430
Met Asp Gly Tyr His Asn Asn Pro Glu Ala Asn Glu Ala Cys Phe Val
435 440 445
Lys Ala Asp Asp Ala Glu Ala Asp Thr Ala Tyr Tyr Asn Arg His Trp
450 455 460
Phe Arg Thr Gly Asp Val Ala Leu Val Asp Lys Gln Gly Arg Tyr Met
465 470 475 480
Ile Val Asp Arg Thr Lys Glu Met Ile Lys Ser Gln Gly Lys Gln Val
485 490 495
Ala Pro Ala Glu Leu Glu Asp Met Leu Leu Gly His Ala Gln Val Ala
500 505 510
Asp Thr Ala Val Ile Gly Ile Gln Asp Val Glu Lys Gly Asn Glu Ala
515 520 525
Pro Arg Ala Phe Val Val Leu Lys Asp Pro Lys Tyr Asp Ala Val Glu
530 535 540
Ile Lys Thr Trp Leu Asp Lys Gln Leu Pro Lys Tyr Lys Gln Leu His
545 550 555 560
Ala Gly Ile Val Val Ile Asp Ala Ile Pro Lys Asn Ala Ser Gly Lys
565 570 575
Ile Leu Arg Arg Leu Leu Arg Ala Arg Lys Asp Asp Val Val Leu Gly
580 585 590
Leu Asn Lys
595
<210> 45
<211> 598
<212> PRT
<213> 解脂耶氏酵母
<400> 45
Met Val Gln Ile Ile His Lys Ala Pro Leu Gly Asp Met Ala Glu Ser
1 5 10 15
Glu Leu Phe Tyr Gly Ser Ile Pro Asp Phe Met Arg Ser Ser Arg Phe
20 25 30
Ala Asp Asp Asp Thr Arg Ile Ser Val Val Asp Tyr Asp Thr Asp Lys
35 40 45
Ala Met Thr Leu Ala Arg Val Phe Lys Val Ser Gly Met Leu Arg Ala
50 55 60
Gln Phe Phe His Thr Tyr Asp Val Gly Lys Lys Lys Asp Gly Asp Ala
65 70 75 80
Asn Pro Lys Val Ile Phe Tyr Val Gly Asn Thr Ala Asp Asn Leu Ala
85 90 95
Cys His Ile Ala Leu His Asp Leu Gly Ala Ile Ile Ser Pro Ala Ser
100 105 110
Thr Ala Tyr Asp Val Asn Asp Leu Leu His Gln Ile Asn Val Val Asp
115 120 125
Ala Ala Leu Ile Val Ala Glu Ala Ala Arg Ala Asp Val Ala Arg Glu
130 135 140
Ala Val Ala Lys Ala Gly Asp Lys Phe Lys His Val Lys Val Val Val
145 150 155 160
Phe Glu Glu Leu Leu Glu Gln Asn Arg Arg Val Arg Pro Asn Leu Ile
165 170 175
Arg Val Ala Pro Ile Val His Leu Ser Lys Glu Gln Ala Tyr Thr Thr
180 185 190
Leu Ala Tyr Leu Gly Met Ser Ser Gly Thr Ser Gly Gly Val Pro Lys
195 200 205
Ala Val Glu Leu Thr His Phe Ala Met Thr Ser Asn Val Gln Gln Thr
210 215 220
Ala Lys Asn Ala Pro Asn Leu Val Asp Asp Asp Thr Val Cys Ser Ala
225 230 235 240
Val Ile Pro Thr Ser His Ile Tyr Gly Leu Ala Leu Phe Met Leu His
245 250 255
Met Pro Phe Leu Gly Ala Lys Val Val Tyr His Lys Lys Phe Asp Leu
260 265 270
Val Glu Met Leu Glu Gly Gln Lys Lys His Gly Val Asn Tyr Trp Val
275 280 285
Leu Val Pro Pro Ile Ile Val Ala Leu Ala Lys His Pro Ile Ile Asp
290 295 300
Arg Tyr Leu Asp Ser Ile Arg Ala Asn Leu Lys Thr Ile Thr Ser Gly
305 310 315 320
Ala Ala Pro Leu Gly Gly Asn Val Val Asp Ala Val Gln Thr Arg Phe
325 330 335
Thr Gly Asn Thr Arg Gly Thr Leu Pro Asn Asn Arg Arg Ile Val Ile
340 345 350
Tyr Gln Gly Tyr Gly Leu Thr Glu Thr Ala Pro Ile Ala Cys Leu Cys
355 360 365
Asp Pro Leu Trp Asp Asn Leu Asn Val Val Thr Val Gly Thr Leu Val
370 375 380
Pro Asn Thr Glu Ala Arg Ile Val Asp Glu Asn Gly Asp Asp Gln Pro
385 390 395 400
Ala Phe Glu Val Thr Asp Ala Arg Ala Leu Gly Asp Ala Val Arg Arg
405 410 415
Gly Asp Lys Ile Pro Ser Gly Glu Leu Tyr Leu Arg Gly Pro Gln Ile
420 425 430
Met Ser Gly Tyr His Lys Asn Pro Lys Ser Thr Glu Glu Ser Phe Glu
435 440 445
Tyr Val Asp Tyr Lys Ala Glu Gly Leu Arg His Tyr Gln Asp Arg Trp
450 455 460
Leu Lys Thr Gly Asp Val Ala Val Ile Asp Asn Phe Gly Arg Ile Gln
465 470 475 480
Ile Val Asp Arg Thr Lys Glu Leu Ile Lys Ser Met Ser Lys Gln Val
485 490 495
Ala Pro Ala Glu Leu Glu Ala Leu Leu Leu Ser His Pro Asp Val Val
500 505 510
Asp Val Ala Val Ile Gly Val Trp Gln Glu Glu Lys Ala Thr Glu Ser
515 520 525
Ala Arg Ala Phe Leu Val Val Arg Asp Pro Lys Val Asp Val Val Ala
530 535 540
Ile Lys Lys Trp Met Asp Glu Gln Val Pro Ser Tyr Lys Arg Leu Tyr
545 550 555 560
Gly Gly Val Val Val Ile Asp Ala Ile Pro Lys Asn Pro Ser Gly Lys
565 570 575
Ile Leu Arg Arg Leu Leu Arg Gln Arg Lys Asp Asp Val Val Gln Gly
580 585 590
Leu Asp Gln Ala Lys Leu
595
<210> 46
<211> 741
<212> PRT
<213> 解脂耶氏酵母
<400> 46
Met Leu Arg Pro Arg Ala Pro Ser Thr Leu Arg Arg Ala Ser Thr Gln
1 5 10 15
Leu Ser Ala Arg Pro Gln Gly Ile Thr Gly Pro Gln Arg Ser Phe His
20 25 30
Leu Ala Cys Ser Arg Pro Thr Arg Ser Thr Thr Ser Glu Glu Asp Arg
35 40 45
Pro Lys Trp Leu Thr Pro Arg Asn Val Arg Leu Gly Ser Leu Pro Phe
50 55 60
Ser Arg Leu Leu Gln Gly His Ser Gln Arg Leu Tyr Ser Gly Leu Ser
65 70 75 80
Thr Pro Gly Ile Ser Glu Val Thr Gly Cys Ser Ser Pro Ala Leu Ile
85 90 95
Glu Ser His Ser Trp Asp Tyr Tyr Thr Thr Pro Ala Gln Arg Glu Leu
100 105 110
Trp Gly Ser Lys Gly Glu Tyr Pro Ala Leu Ile Ser Ala Tyr Gln Gln
115 120 125
Pro Asp Ile Ala Asn Ala Ile Leu Asp Arg Thr Ser Asp Tyr Thr Asn
130 135 140
Glu Thr His Leu Ser Phe Ser Glu Leu Leu Lys Leu Ser Asn Leu Phe
145 150 155 160
Ala Asp Ser Leu Tyr Ala His Ala Arg Glu Gln Gly Leu Val Phe Lys
165 170 175
Ser Gly Asp Ser Val Ala Val Cys Gly Gly Asn Val Trp Glu Tyr Thr
180 185 190
Ala Leu Gln Met Gly Leu Ser Lys Leu Gly Leu Val Leu Val Pro Leu
195 200 205
Asn Pro Ala Phe Thr Ala Asn Gln Phe Ala Ala Ala Leu Ala Ala Thr
210 215 220
Glu Ala Lys Ala Leu Ile Met Thr Ser His Leu Pro Gly Gly Lys Asp
225 230 235 240
Lys Ala Thr Gly Lys Met Thr Leu Lys Ser Ala Ala Pro Ile Cys Gln
245 250 255
Glu Val Ile Asp Asn Leu Asn Ala Ser Gly Lys Ser Lys Leu Lys Leu
260 265 270
Leu Ile Asn Leu Ala Ser Gly Glu Thr Pro Gly Ala Asp Thr Ile Lys
275 280 285
Asp Val Lys Phe Gln Gly Ser Gln Ser Asp Met His Glu Ile Val Phe
290 295 300
Gln His Lys Lys Ala Val Ala Asn Gly Thr Leu Pro Ala Ser Val Pro
305 310 315 320
Thr Glu Ile Arg Arg Leu Thr Ala Thr Val Asn Pro Asp Asp Ile Thr
325 330 335
Asn Met Gln Phe Thr Ser Gly Thr Thr Ser Gln Pro Lys Val Ser Cys
340 345 350
Leu Thr His Arg Asn Leu Leu Asn Asn Gly His Leu Ile Gly Thr Arg
355 360 365
Met Gly Leu Lys Pro Ala Thr Gly Pro Ala Val Asn Gly Ile Ala Pro
370 375 380
Asn Gln Asp Arg Leu Cys Ile Pro Val Pro Met Phe His Cys Phe Gly
385 390 395 400
Leu Val Leu Ser Asn Leu Ala Ala Leu Thr Thr Gly Ala Ala Leu Val
405 410 415
Tyr Pro Ser Glu Trp Phe Cys Ala Arg Ser Ala Ile Asp Asn Val Arg
420 425 430
Lys Tyr Lys Cys Thr Gly Leu His Gly Val Pro Thr Met Tyr Val Ala
435 440 445
Glu Leu Glu Tyr Leu Lys Asp Leu Glu Leu Lys Glu Ala Lys Ala Pro
450 455 460
Gly Gln Asn Phe Leu Pro Gly Phe Glu Leu Leu Arg Thr Gly Ile Ala
465 470 475 480
Ala Gly Ser Ala Val Pro Gly Glu Leu Met Thr Lys Leu Gly Gln Ser
485 490 495
Met Asn Leu Lys Ala Leu Thr Ile Cys Tyr Gly Met Thr Glu Thr Ala
500 505 510
Pro Val Thr Phe Met Thr Arg Pro Asp Asp Pro Val Glu Lys Arg Val
515 520 525
Glu Thr Val Gly Gln Ile Met Pro His Thr Ser Cys Arg Ile Ile Lys
530 535 540
Ser Gln Gln Glu Asp Leu Ser Glu Ser Glu Leu Asp Phe Thr Pro Leu
545 550 555 560
Ala Thr Gly Gln Lys Gly Glu Ile Ile Thr Ser Gly Tyr Ala Leu Gln
565 570 575
Lys Tyr Tyr Lys Asp Asp Pro Lys Lys Thr Ser Ala Ala Met Val Val
580 585 590
Asp Pro Ala Thr Gly Val Arg Trp Met Arg Thr Gly Asp Glu Gly Cys
595 600 605
Met Asp Asn Glu Gly Phe Leu Lys Val Thr Gly Arg Leu Lys Asp Leu
610 615 620
Ile Ile Arg Gly Gly Glu Asn Ile His Pro Leu Glu Ile Glu Asn Val
625 630 635 640
Leu Phe Ala His Asp Lys Ile Ala Gln Ala Ser Val Val Gly Val Lys
645 650 655
Asp Pro Lys Tyr Gly Glu Ala Val Cys Ala Phe Val Thr Pro His Ala
660 665 670
Phe Phe His Lys Gly His Gln His Val Lys His Asp Asp Ser Asp Lys
675 680 685
Leu Thr Ile Glu Gln Val Gln Glu Trp Val Arg Asn Lys Leu Gly His
690 695 700
Tyr Met Val Pro Lys Tyr Val Phe Phe Val Gly Asp Tyr Pro Lys Thr
705 710 715 720
Ala Ser Gly Lys Ile Arg Lys Val Asp Leu Arg Lys Thr Ala Glu Ser
725 730 735
Gln Leu Gly Leu Cys
740
<210> 47
<211> 554
<212> PRT
<213> 解脂耶氏酵母
<400> 47
Met Ala Pro Ser Gln Gly Asp Lys Lys Met Phe Ile Ser Ala Glu Thr
1 5 10 15
Gly Glu Ser Leu Thr Thr Ala Gln Gln Trp Ala Thr Val Glu Leu Phe
20 25 30
Ala Ser Lys Leu Tyr Gln Leu Gly Ile Gly His Ser Leu Arg Pro Asn
35 40 45
Ser Asp Ala His Leu Gly Asp Val Val Leu Leu Tyr Val Lys Asn Ser
50 55 60
Ile Tyr Ile Pro Ala Ala His Trp Ala Leu Leu Asp Leu Gly Ala Thr
65 70 75 80
Val Ala Pro Ala Ala Ala Val Tyr Lys Ala Arg Asp Leu Val His Gln
85 90 95
Ile Glu Leu Val Lys Pro Lys Leu Ile Val Cys Asp Ala Asp Leu Lys
100 105 110
Ser Glu Ala Val Glu Ala Leu Lys Ile Leu Ser Lys Lys Met Pro Ile
115 120 125
Val Thr Met Glu Glu Leu Arg Gln Pro Val Lys Lys Leu Lys Gln Arg
130 135 140
Gln Arg Phe Arg Leu Ser Arg Pro Glu Ala Ala Lys Arg Val Ala Ala
145 150 155 160
Leu Val Met Ser Ser Gly Thr Ser Gly Gly Leu Pro Lys Ala Val Arg
165 170 175
Val Thr His His Val Val Thr Ser Asn Ala Gln Cys Ser Ala Ile Val
180 185 190
Ala Pro Asp Leu Phe Asp Asp Pro Thr Asn Val Ile Ser Ala Val Leu
195 200 205
Pro Met Ser His Ile Tyr Gly Tyr Phe Lys Phe Leu Phe Ala Cys Phe
210 215 220
Tyr Thr Gly Glu Thr Cys Val Val His Gln Ser Phe Asp Leu Lys Ala
225 230 235 240
Val Leu Asp Ala Gln Gln Lys Tyr Gly Ile Thr Ser Phe Phe Met Val
245 250 255
Pro Pro Ile Ile Ile Ala Leu Ala Lys Ser Pro Ile Val Asp Glu Tyr
260 265 270
Ile Pro Ser Leu Gln Lys Leu Arg Phe Ile Thr Ser Gly Ala Ala Pro
275 280 285
Leu Gly Gly Asn Val Ile Glu Asp Val Lys Arg Arg Leu Gly Ser His
290 295 300
Ile Ala Val Thr Gln Met Tyr Gly Met Thr Glu Ser Ile Leu Ser Thr
305 310 315 320
Cys Phe Asn Pro Ser Asp Ala Asp Val Ala Ser Arg Ser Val Gly Lys
325 330 335
Leu Cys Gly Asn Ile Glu Ala Arg Ile Val Gly His Asp Gly Val Asp
340 345 350
Gln Pro Ala Tyr Asn Glu Thr Asp Pro Asp Lys Ile Asp Ala Ala Phe
355 360 365
Lys Arg Gly Asp Ala Leu Pro Ser Gly Glu Leu Trp Leu Arg Gly Pro
370 375 380
Ala Ile Met Ala Gly Tyr His Gly Asn Cys Leu Ala Asn Glu Glu Ser
385 390 395 400
Phe Val Asp Ala Ser Asp Ala Ala Thr Val Pro His Tyr His Arg Lys
405 410 415
Trp Leu Arg Thr Gly Asp Val Ala Val Ile Asp Val Lys Gly Arg Ile
420 425 430
Val Ile Val Asp Arg Thr Lys Glu Met Ile Lys Ser Met Gly Arg Ala
435 440 445
Val Ala Pro Ala Glu Ile Glu Ala Leu Leu Leu Ser His Pro Gln Val
450 455 460
Met Asp Cys Ala Val Ile Gly Val His Val Pro Glu Lys Gly Thr Glu
465 470 475 480
Ala Ala Arg Ala Phe Leu Val Leu Arg Asp Ala Gln Ala Ser Val Ala
485 490 495
Arg Asp Val Ala Ala Trp Leu Asn Asp Gln Val Pro Ser Tyr Lys Arg
500 505 510
Leu His Gly Gly Val Val Val Phe Arg Gly Glu Val Ile Pro Lys Asn
515 520 525
Ala Ser Gly Lys Ile Leu Arg Arg Leu Leu Arg Gln Arg Lys Gly Asp
530 535 540
Glu Val Val Phe Pro Glu Arg Ala Lys Leu
545 550
<210> 48
<211> 1812
<212> DNA
<213> 人工序列
<220>
<223> YlACoS-10P
<400> 48
atggcctccg tcgctccatc ttccaacccc aatccgatcc accatctgtc gcgagtcgaa 60
gacgttcctc tctcccagac gttccgaggc aacattaccg actttgtgcg atctggaggc 120
tttgccgacg acgactccaa gccctgttgc atcgacgcga agactggcca acaacttaca 180
cagaagcaag tctgggacta cgccgacaag ttcagagcac tgctccatca cgacaacaat 240
ctgtgtcctt tcaatgccaa caccaccgat ccagctcttg gagacgtcat gatcaccctc 300
gtgcccaacc atctgttcat tacgtcgctg cactttgccg cactcgatct gggtgcgaca 360
gtttctcctg gctcggctgg atacactgtg gccgagctcg tcaaccagat caatcttacc 420
ggagcttctc tcatcgtgta cactcgaccc gtcttcaagg ttgtgcgaga ggcgcttgct 480
cagatcgtgg taccagtcaa gatcgtggag ttcgagggtc tcatcgaacg agccgagttt 540
gttcagagcc acaagattca gtccacaaag aaagtcacac tttctcctga ggagtcctac 600
tcgagaatcg cctacctggg catgtcttca ggcacctccg gaggtcttcc taaggccgtt 660
cgattgtcgc acttcaacat ggcgagttct gccgagctct ccaagcgagc tgcaccttcg 720
attgccggat ccgagcagat cgcaggtgcc attatccctg tcaaccatgt gtatggtctg 780
gccaagttcc tcattgccat gccaaagtcc ggagccacca cagtcttcca ctccaagttc 840
gacctcatcg agatcctcga ggctcaacag aagtacaagg tcaacatgta cgcccttgtt 900
cctcccatca ttgtcgttct ggccaagcat cctgctgttg agaagtacat cccttcgctg 960
cgagaacacc ttcgatacgt gtcctctgga gctgcacccc tgggtgccaa cgtcatcgag 1020
gcttgcaaca agcgtcttgc cggaactgct tctggcgaga acgagtttgg aggtctcaag 1080
attgttcagg gctacggtct cactgaaacc tcccctgtgg tctccacttt cgatcccaac 1140
gatcctgagc gacacgctcg gtcctgtggc aagctggttc ccaacaccca ggcacgaatc 1200
gtgtcggagg acggagtcga tcagcctgcc tacgagctca aggacctgtc tcagttggag 1260
gccgagctca aaaagggcaa ccttcccacc ggtgagttgt ggcttcgagg tccccagatc 1320
atggatggct accacaagaa cgacgaggcc aacgctgagt cgtttgtcga cgccactgac 1380
tacacttcca acatgccctt ctacatgaag cggtggttcc gaactggcga tgttgctctc 1440
gtcgatactc tgggcagata catgattgtc gatcgaacca aagagatgat caagagcatg 1500
agtaagcagg ttgctcctgc cgagctggag gacatcctgc ttggccatcc ccaggtagcc 1560
gatgctgctg tcatcggtgt tcagcaggtg gagaagggca ctgaggctcc ccgagcgttc 1620
gtggtgcttc gagatcccaa gttcgatgca gtggagatca aaaagtggat ggacgcccag 1680
gtgcccaagt acaaacaact tcatggaggt gtcgtggttc tggatgctgt tcccaagaat 1740
gccagcggca agattctcag acgactgctc cgtcagcgag agaatgacgt cgttcttgga 1800
ctcgacaagt aa 1812
<210> 49
<211> 603
<212> PRT
<213> 人工序列
<220>
<223> YlACoS-10P蛋白质
<400> 49
Met Ala Ser Val Ala Pro Ser Ser Asn Pro Asn Pro Ile His His Leu
1 5 10 15
Ser Arg Val Glu Asp Val Pro Leu Ser Gln Thr Phe Arg Gly Asn Ile
20 25 30
Thr Asp Phe Val Arg Ser Gly Gly Phe Ala Asp Asp Asp Ser Lys Pro
35 40 45
Cys Cys Ile Asp Ala Lys Thr Gly Gln Gln Leu Thr Gln Lys Gln Val
50 55 60
Trp Asp Tyr Ala Asp Lys Phe Arg Ala Leu Leu His His Asp Asn Asn
65 70 75 80
Leu Cys Pro Phe Asn Ala Asn Thr Thr Asp Pro Ala Leu Gly Asp Val
85 90 95
Met Ile Thr Leu Val Pro Asn His Leu Phe Ile Thr Ser Leu His Phe
100 105 110
Ala Ala Leu Asp Leu Gly Ala Thr Val Ser Pro Gly Ser Ala Gly Tyr
115 120 125
Thr Val Ala Glu Leu Val Asn Gln Ile Asn Leu Thr Gly Ala Ser Leu
130 135 140
Ile Val Tyr Thr Arg Pro Val Phe Lys Val Val Arg Glu Ala Leu Ala
145 150 155 160
Gln Ile Val Val Pro Val Lys Ile Val Glu Phe Glu Gly Leu Ile Glu
165 170 175
Arg Ala Glu Phe Val Gln Ser His Lys Ile Gln Ser Thr Lys Lys Val
180 185 190
Thr Leu Ser Pro Glu Glu Ser Tyr Ser Arg Ile Ala Tyr Leu Gly Met
195 200 205
Ser Ser Gly Thr Ser Gly Gly Leu Pro Lys Ala Val Arg Leu Ser His
210 215 220
Phe Asn Met Ala Ser Ser Ala Glu Leu Ser Lys Arg Ala Ala Pro Ser
225 230 235 240
Ile Ala Gly Ser Glu Gln Ile Ala Gly Ala Ile Ile Pro Val Asn His
245 250 255
Val Tyr Gly Leu Ala Lys Phe Leu Ile Ala Met Pro Lys Ser Gly Ala
260 265 270
Thr Thr Val Phe His Ser Lys Phe Asp Leu Ile Glu Ile Leu Glu Ala
275 280 285
Gln Gln Lys Tyr Lys Val Asn Met Tyr Ala Leu Val Pro Pro Ile Ile
290 295 300
Val Val Leu Ala Lys His Pro Ala Val Glu Lys Tyr Ile Pro Ser Leu
305 310 315 320
Arg Glu His Leu Arg Tyr Val Ser Ser Gly Ala Ala Pro Leu Gly Ala
325 330 335
Asn Val Ile Glu Ala Cys Asn Lys Arg Leu Ala Gly Thr Ala Ser Gly
340 345 350
Glu Asn Glu Phe Gly Gly Leu Lys Ile Val Gln Gly Tyr Gly Leu Thr
355 360 365
Glu Thr Ser Pro Val Val Ser Thr Phe Asp Pro Asn Asp Pro Glu Arg
370 375 380
His Ala Arg Ser Cys Gly Lys Leu Val Pro Asn Thr Gln Ala Arg Ile
385 390 395 400
Val Ser Glu Asp Gly Val Asp Gln Pro Ala Tyr Glu Leu Lys Asp Leu
405 410 415
Ser Gln Leu Glu Ala Glu Leu Lys Lys Gly Asn Leu Pro Thr Gly Glu
420 425 430
Leu Trp Leu Arg Gly Pro Gln Ile Met Asp Gly Tyr His Lys Asn Asp
435 440 445
Glu Ala Asn Ala Glu Ser Phe Val Asp Ala Thr Asp Tyr Thr Ser Asn
450 455 460
Met Pro Phe Tyr Met Lys Arg Trp Phe Arg Thr Gly Asp Val Ala Leu
465 470 475 480
Val Asp Thr Leu Gly Arg Tyr Met Ile Val Asp Arg Thr Lys Glu Met
485 490 495
Ile Lys Ser Met Ser Lys Gln Val Ala Pro Ala Glu Leu Glu Asp Ile
500 505 510
Leu Leu Gly His Pro Gln Val Ala Asp Ala Ala Val Ile Gly Val Gln
515 520 525
Gln Val Glu Lys Gly Thr Glu Ala Pro Arg Ala Phe Val Val Leu Arg
530 535 540
Asp Pro Lys Phe Asp Ala Val Glu Ile Lys Lys Trp Met Asp Ala Gln
545 550 555 560
Val Pro Lys Tyr Lys Gln Leu His Gly Gly Val Val Val Leu Asp Ala
565 570 575
Val Pro Lys Asn Ala Ser Gly Lys Ile Leu Arg Arg Leu Leu Arg Gln
580 585 590
Arg Glu Asn Asp Val Val Leu Gly Leu Asp Lys
595 600
<210> 50
<211> 627
<212> PRT
<213> 解脂耶氏酵母
<400> 50
Met Ile Ile His Thr Ser Asp Thr Ser Ser Ile Arg Val Asn Asp Leu
1 5 10 15
Phe Cys Gly Asn Ile Ala Asp Phe Ile Val Lys Gly Gly His Ser Lys
20 25 30
Ser Ser Lys Thr Ser Ala Ile Asp Ala Ala Thr Gly Glu Ser Leu Ser
35 40 45
His Val Asn Gln His Ile Leu Ser Arg Gln Ile Ala Ser Ile Leu Thr
50 55 60
Glu Ser Gly Tyr Glu Pro Asn Phe Asp Pro Lys Ser His Ile Gly Asp
65 70 75 80
Val Leu Val Thr Leu Phe Pro Asn Ser Ile Tyr Ser Ser Pro Val His
85 90 95
Trp Ala Ala Leu Ile Arg Gly Gly Thr Val Ser Pro Ala Ser Val Ser
100 105 110
Tyr Thr Leu Asn Glu Leu Ala His Gln Val Arg Thr Val Arg Pro Lys
115 120 125
Val Ile Val Ala Cys Lys Ser Lys Val Ser Leu Ala Lys Lys Ala Val
130 135 140
Leu Met Ala Arg Val Lys Thr Ala Val Leu Glu Leu Glu His Val Ile
145 150 155 160
Ser Asn Ala Pro Lys Tyr Pro Glu Ser Asp Ser Val Lys Phe Asn Lys
165 170 175
Asn Ser Gly Tyr Arg Arg Val Ala Tyr Leu Ala Met Ser Ser Gly Thr
180 185 190
Ser Gly Gly Ile Phe Lys Ala Val Lys Ile Thr His Phe Asn Ile Thr
195 200 205
Ser Cys Ile Gln Val Cys Gln Lys Ser Ala Pro Asn Arg Asp Thr Ala
210 215 220
Ser Gln Ile Ala Ser Ala Val Ile Pro Val Ser His Leu Tyr Gly Leu
225 230 235 240
Ser Lys Phe Leu Ile Met Ala Pro Tyr Val Gly Ser Thr Thr Val Phe
245 250 255
His Glu Lys Phe Glu Ile Lys Glu Phe Leu Glu Ala Gln Lys Gln Phe
260 265 270
Gln Val Asn Ser Trp Pro Ile Val Pro Pro Leu Val Val Leu Leu Thr
275 280 285
Asn His Pro Leu Val Lys Glu Phe Ser Glu Ser Leu Arg Ala His Leu
290 295 300
Arg Ile Val Cys Cys Gly Ala Ala Pro Leu Gly Glu Lys Ala Ala Arg
305 310 315 320
Asp Phe Leu Thr Ala Ile Thr Gly Ser Pro Asp Gly Ile Ile Gln Pro
325 330 335
Thr Ile Thr Ser Arg Asp Lys Ser Lys Ser Arg Asp Ser Gly Phe Phe
340 345 350
Ser Ser Ile Arg Ala His Val Ala Asp Pro Ala Ala Ala Gly Ile Thr
355 360 365
Ser Ala Asn Thr Ala Glu Ser Ala Gly Gln Ser Arg Asp Ala Pro Arg
370 375 380
Leu Gln Ile Ile Gln Gly Trp Gly Leu Thr Glu Thr Ser Pro Thr Cys
385 390 395 400
Thr Thr Phe Asp Pro Leu Asp Pro Asp Leu His Ile Lys Ala Cys Gly
405 410 415
Lys Ile Val Ala Asn Thr Glu Ile Arg Ile Arg Gly Gln Gly Gln Asp
420 425 430
Leu Gln Lys Ala Pro Ile Leu Ile Glu Asn Tyr Asp Ala Tyr Pro Ser
435 440 445
Lys Glu Thr Leu Pro Ile Gly Asp Ile Tyr Val Arg Gly Pro Gln Val
450 455 460
Thr Leu Gly Tyr Leu Asn Asp Asp His Ala Asp Ser Val Ser Phe Glu
465 470 475 480
Gln Cys Tyr Asp Pro His Val Pro Trp Phe His Leu Lys Trp Phe Lys
485 490 495
Thr Gly Asp Val Gly Phe Ile Asp Ala Lys Gly Arg Val Met Val Val
500 505 510
Asp Arg Thr Lys Glu Met Ile Lys Ser Met Gly Lys Gln Val Ala Pro
515 520 525
Ala Glu Ile Glu Asp Leu Leu Leu Ser His Glu Leu Val Ala Asp Ala
530 535 540
Ala Val Ile Gly Val Ser Asn Glu Lys Leu Gly Thr Glu Ser Pro Arg
545 550 555 560
Ala Phe Val Val Pro Lys Ser Gly Phe Lys Ala Ala Glu Leu Arg Ser
565 570 575
Trp Thr Asp Ser Gln Leu Pro Lys His Lys Gln Leu His Gly Gly Ile
580 585 590
Val Leu Val Asp Lys Val Pro Lys Asn Ala Ser Gly Lys Ile Leu Arg
595 600 605
Arg Val Leu Arg Glu Arg Arg Gly Asp Leu Val Glu Gly Val Lys Leu
610 615 620
Ser Lys Leu
625
<210> 51
<211> 593
<212> PRT
<213> 解脂耶氏酵母
<400> 51
Met Ile Ile His Thr Ser Leu Asn Gln Pro Ile Asp Asp Arg Glu Phe
1 5 10 15
Phe Asp Gly Thr Ile Pro Asp Phe Ile Arg Thr Ser Pro Phe Val Asn
20 25 30
Asp Thr Thr Pro Phe Phe Ile Asp Ala Ala Thr Gly Glu Gln Leu Ser
35 40 45
Gln Arg Gln Leu Trp Lys Met Ser Asn Asp Phe Leu Thr Ile Phe Arg
50 55 60
Gln His Gly Leu Gly Asn Ala Arg Asp Asn Val Ser Asp Pro Ser Met
65 70 75 80
Gly Asp Val Phe Ile Thr Leu Phe Pro Asn Cys Ile Trp Ala Gly Pro
85 90 95
Val His Trp Ala Ala Leu Asp Ala Gly Ala Thr Leu Ser Pro Ala Ser
100 105 110
Cys Ser Tyr Thr Val Gln Glu Phe Ala His Gln Leu Gln Leu Val Val
115 120 125
Pro Lys Met Val Val Tyr Ser Glu Pro Phe Lys Gln Leu Leu Glu Asp
130 135 140
Ala Ile Ile Val Ser Lys Thr Asn Pro Thr Ile Leu Ser Leu Glu Gln
145 150 155 160
Leu Ile Glu Asp Ser Glu Arg Val Pro Leu Ala Gln Ala Asn Phe Gln
165 170 175
Phe Ala Asn Arg Leu Gln Leu Arg Pro Lys Glu Ser Ile Thr Arg Val
180 185 190
Ala Tyr Leu Ala Met Ser Ser Gly Thr Ser Gly Gly Leu Phe Lys Ala
195 200 205
Val Arg Ile Thr His Gly Asn Ile Thr Ser Asn Ala Ile Met Ser Thr
210 215 220
Lys Ser Ser Asn Ala Leu Leu Lys Thr Asn Gln Val Ala Ser Ala Ile
225 230 235 240
Ile Pro Val Ser His Leu Tyr Gly Leu Ala Gln Phe Leu Val Phe Gly
245 250 255
Val His Arg Gly Thr Ala Ala Val Phe His Lys Gly Phe Asp Phe Ile
260 265 270
Glu Phe Leu Asp Ala Ala Val Lys Tyr Lys Val Asn Ile Phe Pro Leu
275 280 285
Val Pro Pro Ile Ile Ile Leu Leu Ala Lys His Pro Phe Thr Gln Lys
290 295 300
Tyr Val Pro Asp Leu Lys Arg Asn Leu Thr Thr Val Leu Ser Gly Ala
305 310 315 320
Ala Pro Leu Gly Val Lys Ala Thr Glu Glu Phe Leu Glu Arg Ile Thr
325 330 335
Gly Arg Lys Asp Gly Val Ser Glu Tyr Gly Thr Leu Arg Val Ile Gln
340 345 350
Gly Trp Gly Met Thr Glu Thr Ser Pro Val Cys Thr Leu Phe Asp Pro
355 360 365
Glu Val Pro Val Ala His Ile Arg Ser Val Gly Lys Leu Val Ser Asn
370 375 380
Thr Glu Ala Arg Val Val Ser Glu Gly Val Asp Gln Pro Ala Cys Asp
385 390 395 400
Val Asp Pro Ala Ser Leu Asp Ala Ala Ile Lys Ala Gly Gly Leu Pro
405 410 415
Thr Gly Glu Ile Leu Ile Arg Gly Pro His Val Met Asp Gly Tyr His
420 425 430
Lys Asn Pro Ser Ala Asn Ala Asp Ala Phe Glu Glu Ala Ser Asp Trp
435 440 445
Thr Pro Asp Met Pro Trp Tyr Lys Lys Arg Trp Leu Arg Thr Gly Asp
450 455 460
Val Gly Phe Phe Asp Leu Gln Gly Arg Val Met Ile Val Asp Arg Thr
465 470 475 480
Lys Glu Leu Ile Lys Ser Met Gly Lys Gln Val Ala Pro Ala Glu Leu
485 490 495
Glu Asp Ala Leu Leu Ala Asn Pro Leu Val Ala Asp Cys Ala Val Ile
500 505 510
Gly Val Met Asp Val Asp Lys Gly Thr Glu Ser Pro Arg Ala Phe Val
515 520 525
Val Leu Arg Asp Pro Lys Ala Asp Ala Val Gly Ile Leu Lys Ser Leu
530 535 540
Asn Ser Gln Met Pro Lys Tyr Lys Asn Leu His Gly Gly Ile Val Val
545 550 555 560
Val Glu Ala Val Pro Arg Asn Pro Ser Gly Lys Val Leu Arg Arg Leu
565 570 575
Leu Arg Asp Arg Lys Asp Asp Val Val Leu Gly Leu Asp Val Ser Lys
580 585 590
Leu
<210> 52
<211> 583
<212> PRT
<213> 解脂耶氏酵母
<400> 52
Met His Arg Arg Pro Asn Cys Pro Val Leu Phe Tyr Thr Ser Ser Ala
1 5 10 15
Ser Tyr Asp Ile Ala Leu Leu Val Leu Asn Thr Leu Ala Leu Pro Leu
20 25 30
Phe Leu Pro Gly Arg Thr Pro Leu Arg Cys Ile Val Phe Arg Leu Pro
35 40 45
Arg Asn Arg Ser Ala Phe Ile Thr His Leu Tyr Ile Thr Pro Leu Ser
50 55 60
Thr Pro Ser Ser His Asp Thr Thr Ser Ile His Thr Met Ala Thr Leu
65 70 75 80
Gln Lys Thr Ile Ser Lys Thr Gly Ala Gly Ile Phe Ile Pro Gly Ala
85 90 95
Gln Glu Leu Thr Tyr Ser Gln Phe Phe Asp Leu Ile Gly Asp Phe Gln
100 105 110
Lys Gln Leu Ala Gln Val Gly Leu Pro Pro Gln Ser Ala Val Ser Ile
115 120 125
Ala Ile Pro Asn Ser Leu Glu Phe Ala Val Thr Phe Leu Ala Val Thr
130 135 140
Phe Ser Arg Tyr Ile Ala Ala Pro Leu Asn Ser Ala Tyr Lys Lys Ser
145 150 155 160
Glu Phe Glu Phe Tyr Ile Asp Asp Leu Lys Ser Lys Leu Val Leu Val
165 170 175
Pro Lys Gly Ala Val Ala Gln Asn Leu Ala Ser Val Gln Ala Ala Arg
180 185 190
Thr Phe Asn Ala Ala Ile Ala Glu Val Tyr Trp Asp Asp Gln Lys Lys
195 200 205
Arg Ile Val Met Asp Ile Lys Glu Gly Pro Thr Asn Pro Pro Val Ala
210 215 220
Val Pro Thr Pro Asp Glu Val Ser Pro Glu Asp Val Ala Leu Val Leu
225 230 235 240
His Thr Ser Gly Thr Thr Gly Arg Pro Lys Ala Val Pro Leu Thr Gln
245 250 255
Arg Asn Leu Cys Arg Thr Met His Asn Ile Val Asp Thr Tyr Lys Leu
260 265 270
Thr Ser Lys Asp Thr Thr Tyr Leu Val Met Pro Leu Phe His Val His
275 280 285
Gly Leu Leu Cys Ala Phe Leu Ala Pro Leu Ala Ser Gly Gly Gly Ile
290 295 300
Val Ile Pro Ser Lys Phe Ser Ala Ser Gln Phe Trp Asp Asp Phe Val
305 310 315 320
Lys Tyr Lys Cys Asn Trp Tyr Thr Ala Val Pro Thr Ile His Gln Ile
325 330 335
Leu Leu Asn Thr Lys Ile Pro Gln Pro Leu Pro Glu Ile Arg Phe Ile
340 345 350
Arg Ser Cys Ser Ser Ala Leu Ala Pro Ala Thr Phe His Gln Ile Glu
355 360 365
Lys Ala Phe Lys Ala Pro Val Leu Glu Ala Tyr Ala Met Thr Glu Ala
370 375 380
Ala His Gln Met Thr Ser Asn Asn Leu Pro Pro Gly Gln Arg Lys Pro
385 390 395 400
Gly Thr Val Gly Val Gly Gln Gly Val Glu Val Ala Ile Leu Asp Asp
405 410 415
Asn Gly Asp Glu Val Pro Gln Gly Lys Ile Ala Glu Ile Cys Ile Arg
420 425 430
Gly Glu Asn Val Thr Lys Gly Tyr Ile Asn Asn Pro Glu Ala Asn Lys
435 440 445
Ser Ser Phe Thr Lys Ser Gly Phe Phe Arg Thr Gly Asp Gln Gly Phe
450 455 460
Leu Asp Lys Asp Gly Phe Val Asn Ile Thr Gly Arg Ile Lys Glu Leu
465 470 475 480
Ile Asn Arg Gly Gly Glu Lys Ile Ser Pro Ile Glu Leu Asp Gly Val
485 490 495
Met Leu Glu His Pro Ala Val Ala Glu Ala Val Cys Phe Gly Ala Pro
500 505 510
Asp Glu Met Tyr Gly Gln Gln Val Asn Ala Ala Ile Val Leu Lys Lys
515 520 525
Asp Ala Lys Ala Thr Glu Gln Asp Ile Lys Asp Phe Met Ala Asp Lys
530 535 540
Val Ala Lys Phe Lys Ile Pro Ala Arg Val Phe Phe Thr Asp Ile Met
545 550 555 560
Pro Lys Thr Ala Thr Gly Lys Ile Gln Arg Arg Phe Val Ala Gln Lys
565 570 575
Phe Leu Asp Lys Ala Lys Leu
580
<210> 53
<211> 585
<212> PRT
<213> 解脂耶氏酵母
<400> 53
Met Ala Lys Gly Lys Leu Ser Ser Gly Gly Val Lys Ser Ser Val Ala
1 5 10 15
Asp Lys Thr Thr Ala Ala Ala Ile His Thr Leu Pro Arg Ile Gln Gly
20 25 30
Asp Asp Thr Val Tyr Val Pro Asp Lys Val Asn Arg His Asn Met Asn
35 40 45
Pro Thr Tyr Phe Leu Pro Arg Ala Ala Glu Ile Glu Pro Asn Ala Lys
50 55 60
Ala Tyr Ile His Lys Gly Ala Asp Gly Val Arg Val Glu Arg Thr Tyr
65 70 75 80
Gly Glu Met Ala Asp Arg Val Leu Gly Leu Ala Thr Tyr Phe Lys Ser
85 90 95
Lys Glu Phe Lys Arg Val Ala Ile Cys Gly Pro Asn Thr Pro Ala His
100 105 110
Leu Glu Thr Met Phe Gly Ala Val Ala Ala Gly Ala Tyr Val Leu Gly
115 120 125
Leu Asn Tyr Arg Leu Thr Met Gly Glu Ile Thr Tyr Lys Met Glu Leu
130 135 140
Gly Asp Ala Asp Cys Val Val Val Asp Arg Glu Phe Val His Leu Ile
145 150 155 160
Ser Pro Glu Ile Arg Ala Lys Cys Gln Val Ile Val Asp Asp Asp Val
165 170 175
Ser Gly Ala Ser Lys Pro Gln Gln Pro Gly Glu Ile Leu Tyr Ser Asn
180 185 190
Val Val Gln Gln Gly Met Gln Leu Ala Lys Glu Gln Lys Thr Thr Trp
195 200 205
Asp Asn Leu His Val Gln Asn Glu Asp Glu Asp Glu Ile Leu Gly Leu
210 215 220
Phe Tyr Thr Ser Gly Thr Thr Gly Lys Pro Lys Ala Val Glu Tyr Thr
225 230 235 240
His Arg Ser Val Tyr Leu Cys Ala Met Ser Asn Ile Ile Glu Ala Gly
245 250 255
Leu Asn Cys Glu Thr Val Asp Gly His Asn Arg Cys His Tyr Leu Trp
260 265 270
Thr Leu Pro Leu Phe His Ala Ala Gly Trp Thr Phe Pro Tyr Ser Val
275 280 285
Thr Ala Val Arg Gly Thr His Val Leu Leu Arg Lys Ile Glu Pro Asp
290 295 300
Tyr Ile Trp Asp Leu Leu Val Asp Asp Arg Ile Thr His Phe Asn Ala
305 310 315 320
Ala Pro Thr Val Asn Asn Met Leu Val Asn Asn Pro Lys Ala Arg Arg
325 330 335
Leu Pro Gln Thr Val Arg Val Thr Val Ala Ala Ser Pro Pro Ser Ala
340 345 350
Ala Leu Phe Asn Lys Met Phe Asp Met Asn Leu His Pro Val His Met
355 360 365
Tyr Gly Leu Thr Glu Ser Tyr Gly Pro Phe Val Arg Asn Tyr Phe Leu
370 375 380
Gln Asp Trp His Gly Ala Thr Gly Asp Glu Arg Tyr Ala Leu Met Ala
385 390 395 400
Arg Gln Gly Phe Ala Phe Val Gly Ser Gln Ser Val Gln Val Ile Ala
405 410 415
Asn Asn Asp Ile Asn Gln Pro Val Pro Arg Asn Gly Gln Glu Ile Gly
420 425 430
Glu Ile Val Cys Arg Gly Asn Ala Val Met Ala Arg Tyr His Lys Asp
435 440 445
Pro Glu Ala Thr Ala Lys Ala Phe Glu Gln Gly Trp Phe His Thr Gly
450 455 460
Asp Leu Ala Val Val Asn Pro Asp Gly Ser Ile Lys Ile Leu Asp Arg
465 470 475 480
Lys Lys Asp Ile Ile Ile Ser Gly Gly Glu Asn Ile Ser Ser Val Ala
485 490 495
Val Glu Gly Ile Ile Cys Lys Tyr Asp Asn Val Leu Glu Val Ala Val
500 505 510
Val Gly Ile Pro Asp Glu Lys Tyr Gly Glu Val Pro Lys Ala Phe Leu
515 520 525
Ile Leu Lys Asp Lys Ser Lys Pro Phe Asp Thr Asp Lys Met Ile Ala
530 535 540
Trp Met Arg Glu Arg Met Gly Ala Tyr Gln Ile Pro Arg Gln Val Ser
545 550 555 560
Val Val Asp Asp Leu Pro Arg Thr Ser Thr Gly Lys Ile Lys Lys Asn
565 570 575
Val Leu Arg Asp Ser Val Gln Ala Ala
580 585
<210> 54
<211> 712
<212> PRT
<213> 解脂耶氏酵母
<400> 54
Met Lys Thr Ile Leu Lys Ile Thr Lys Ser Glu Asn Gln Asn Ala Leu
1 5 10 15
Phe Lys Asn Pro Ile Ser Pro Pro His Pro Pro Gln Thr Arg Thr Pro
20 25 30
Ser Leu Lys Ile Lys Val Gln Pro Gln Ile Pro His Phe Phe His Ala
35 40 45
Gly Pro Tyr Ile Asn Arg Gly Cys Pro Phe Leu Ser Pro Leu Leu His
50 55 60
Tyr His Leu Val Glu Ile Pro Thr Thr Met Thr Ala Gly Leu Val Ala
65 70 75 80
Ala Ala Ala Ile Gly Ala Ala Tyr Leu Glu Ala Lys Thr Leu Ile Ser
85 90 95
Glu Asp Ala Tyr Met Ile Arg Gly Ala Met Thr Asn Gly Leu Asp Phe
100 105 110
Phe Tyr Asn Ala Trp Lys Gly Arg Val Gln Tyr Trp Tyr Ala Phe Glu
115 120 125
Asp Ala Val Lys Lys Tyr Pro Asn Asn Pro Ala Ile Val Tyr Pro Lys
130 135 140
Pro Ile Glu Gly Lys Lys Pro Ser Gly Asp Ser Tyr Asp Asp Leu Phe
145 150 155 160
Asp Val Glu Thr Phe Thr Tyr Gln Gln Leu Tyr Asp Glu Val Leu Lys
165 170 175
Met Ser His Leu Leu Arg Asn Lys Tyr Gly Val Thr Ala Asn Asp Thr
180 185 190
Ile Ala Leu Asn Ala Met Asn Ser Pro Leu Phe Ile Ile Val Trp Phe
195 200 205
Ala Ile Trp Asn Leu Gly Ala Thr Pro Ala Phe Ile Asn Tyr Asn Leu
210 215 220
Ala Asp Lys Ser Leu Leu His Cys Leu Lys Val Gly His Ala Ser Ile
225 230 235 240
Met Phe Val Asp Thr Glu Val Glu Gly Asn Val Arg Pro Ser Leu Ala
245 250 255
Glu Ile Lys Ser Glu Ala Lys Cys Asp Thr Val Phe Met Asp Asp Asp
260 265 270
Phe Leu Ala Ala Tyr Ala Ala Ser Pro Ala Tyr Arg Ala Pro Asp Tyr
275 280 285
Glu Arg His Pro Glu Gln Lys Asp Tyr Asp Thr Ala Val Leu Ile Tyr
290 295 300
Thr Ser Gly Thr Thr Gly Leu Pro Lys Pro Ala Ile Met Ser Trp Lys
305 310 315 320
Lys Ala Lys Leu Met Ser Ser Leu Tyr Gly His Ser Ile Arg Leu Lys
325 330 335
Asn Asn Gly Val Val Tyr Ser Ala Met Pro Leu Tyr His Ser Thr Ala
340 345 350
Ala Ile Leu Gly Cys Leu Pro Cys Leu Asn Arg Gly Ala Ala Tyr Ala
355 360 365
Pro Gly Arg Lys Phe Ser Thr Thr Thr Phe Trp Thr Gln Ala Lys Leu
370 375 380
Thr Asn Ala Thr His Ile Gln Tyr Val Gly Glu Thr Cys Arg Tyr Leu
385 390 395 400
Ile Asn Ala Pro Pro Ser Pro Asp Glu Lys Ser His Gln Ile Lys Val
405 410 415
Ala Phe Gly Asn Gly Met Arg Arg Asp Ile Trp Val Lys Phe Lys Glu
420 425 430
Arg Phe Asn Ile Pro Ala Ile Gly Glu Phe Tyr Ala Ala Thr Glu Gly
435 440 445
Pro Leu Gly Thr Asn Asn Phe Gln Gln Gly Glu Ile Gly Ile Gly Ala
450 455 460
Met Gly Arg Tyr Gly Lys Leu Leu Ala Ala Ile Leu Ala Thr Arg Gln
465 470 475 480
Thr Ile Val Pro Val Asp Pro Glu Asp Glu Thr Glu Leu Trp Arg Asp
485 490 495
Pro Glu Thr Gly Phe Cys Arg Val Ala Gln Ser Asp Glu Pro Gly Glu
500 505 510
Phe Ile Gln Lys Ile Pro Asn Pro Glu Lys Val His Glu Thr Phe Gln
515 520 525
Gly Tyr Leu Gly Asn Asp Lys Ala Thr Asn Ser Lys Ile Met Arg Asp
530 535 540
Val Phe Lys Lys Gly Asp Ala Tyr Tyr Arg Thr Gly Asp Leu Val Arg
545 550 555 560
Leu Asn Asp Glu Gln Cys Tyr Tyr Phe Val Asp Arg Leu Gly Asp Thr
565 570 575
Phe Arg Trp Lys Ser Glu Asn Val Ser Thr Ser Glu Val Glu Glu His
580 585 590
Val Gly Ala Ser Asp Pro Asn Ile Glu Gln Val Val Cys Val Gly Val
595 600 605
Lys Val Pro Glu His Glu Gly Arg Ala Gly Phe Ala Val Val Lys Leu
610 615 620
Lys Asp Ala Ser Val Lys Pro Asn Leu Asp Gln Ile Ala Glu Tyr Ser
625 630 635 640
Leu Lys Gln Leu Pro Lys Tyr Ala Val Pro Leu Phe Ile Lys Phe Val
645 650 655
Asp Glu Ile Glu Arg Thr Gly Asn Asn Lys Val Gln Lys Val Lys Tyr
660 665 670
Lys Asn Gln Lys Met Pro His Glu Glu Gly Glu Ser Pro Ile Tyr Trp
675 680 685
Leu Lys Gly Asn Lys Tyr Val Glu Leu Asp Ala Gly Asp Trp Ala Ser
690 695 700
Leu Gly Ser Gly Lys Ile Lys Leu
705 710
<210> 55
<211> 1782
<212> DNA
<213> 人工序列
<220>
<223> YlACoS-5PS3
<400> 55
atggcctcaa tcattcacaa gtctcctgtg cccgacgttc agctgttcta cggttcctgg 60
ccagatctca tgcgaacctc tcctcatgcc cacaacgact ccaaacccgt ggtctttgac 120
ttcgatacca agcagcaact tacttggaag caggtctggc aactcagcgc tcgactcaga 180
gcccagctgt accacaagta cggaatcggc aaacccggtg ctcttgcacc tttccacaac 240
gatccctctc tcggagacgt ggtcatcttc tacactccca acacctacag ctcgttgccc 300
tatcatctgg ctcttcacga tctcggagcc accatttctc ctgcctccac atcttacgac 360
gtcaaggaca tttgccatca gatcgttact accgatgcgg tcgtggttgt cgctgcagcc 420
gagaaatccg agattgctcg agaggccgtt cagctgtctg gtcgagacgt cagagttgtg 480
gtcatggagg acctcatcaa caatgctccc accgttgcgc agaacgatat cgactcggca 540
cctcatgtgt ccctgtctcg ggaccaggct cgagccaaga ttgcatacct gggcatgtct 600
tccggtacgt ctggcggact tcccaaggct gttcgtctca ctcacttcaa cgttacctcg 660
aactgtctgc aggtctccgc tgccgcaccc aaccttgccc agaacgtggt tgccagcgcc 720
gtcattccaa ccactcacat ctacggtctc accatgtttc tgtcggttct tccctacaac 780
ggttccgtgg tcattcatca caagcaattc aacttgcgag atctgctcga ggctcagaag 840
acatacaagg tctctctgtg gattctcgtt cctcccgtca tcgtgcagct tgccaagaac 900
cctatggtcg acgagtacct ggactccatt cgagcccatg tgcggtgcat cgtctctgga 960
gctgctcctc tcggtggcaa tgtcgtggat caggtttcgg ttcgtcttac cggcaacaag 1020
gaaggcattc tgcccaacgg agacaagctc gtcattcatc aagcctacgg tcttaccgag 1080
tcctctccca tcgttggaat gctcgatcct ctgtcggacc acatcgacgt catgactgtg 1140
ggctgtctca tgcccaatac cgaggctcga attgtcgacg aagagggaaa cgatcagcca 1200
gcagtccacg ttaccgacac acgaggcatc ggtgccgctg tcaagcgagg cgagaagatt 1260
ccctccggag aactctggat tcgaggtcct cagatcatgg acggatacca caagaacccc 1320
gagtcgtctc gtgagtccct ggaacccagc acagagacct acggtctgca acatttccag 1380
gacagatggc ttcgaactgg agacgttgct gtcatcgaca ccttcggacg agtcatggtt 1440
gtggatcgaa ccaaggagct catcaagtcc atgtctcgac aggttgctcc tgccgagctc 1500
gaagctcttc tgctcaacca tccttccgtc aacgatgtgg ctgtcgttgg cgtccacaac 1560
gacgataatg gcacagagtc agcacgagcg tttgtcgttc ttcaaccagg cgacgcctgt 1620
gatcctacta ccatcaagca ctggatggac cagcaagttc cctcctacaa gcggctgtac 1680
ggaggcattg tggtcatcga cactgttccc aagaatgcct ctggcaagat tctgcgaaga 1740
ctgcttcgac agcggagaga cgatcgagtc tggggtctgt aa 1782
<210> 56
<211> 593
<212> PRT
<213> 人工序列
<220>
<223> YlACoS-5PS3蛋白质
<400> 56
Met Ala Ser Ile Ile His Lys Ser Pro Val Pro Asp Val Gln Leu Phe
1 5 10 15
Tyr Gly Ser Trp Pro Asp Leu Met Arg Thr Ser Pro His Ala His Asn
20 25 30
Asp Ser Lys Pro Val Val Phe Asp Phe Asp Thr Lys Gln Gln Leu Thr
35 40 45
Trp Lys Gln Val Trp Gln Leu Ser Ala Arg Leu Arg Ala Gln Leu Tyr
50 55 60
His Lys Tyr Gly Ile Gly Lys Pro Gly Ala Leu Ala Pro Phe His Asn
65 70 75 80
Asp Pro Ser Leu Gly Asp Val Val Ile Phe Tyr Thr Pro Asn Thr Tyr
85 90 95
Ser Ser Leu Pro Tyr His Leu Ala Leu His Asp Leu Gly Ala Thr Ile
100 105 110
Ser Pro Ala Ser Thr Ser Tyr Asp Val Lys Asp Ile Cys His Gln Ile
115 120 125
Val Thr Thr Asp Ala Val Val Val Val Ala Ala Ala Glu Lys Ser Glu
130 135 140
Ile Ala Arg Glu Ala Val Gln Leu Ser Gly Arg Asp Val Arg Val Val
145 150 155 160
Val Met Glu Asp Leu Ile Asn Asn Ala Pro Thr Val Ala Gln Asn Asp
165 170 175
Ile Asp Ser Ala Pro His Val Ser Leu Ser Arg Asp Gln Ala Arg Ala
180 185 190
Lys Ile Ala Tyr Leu Gly Met Ser Ser Gly Thr Ser Gly Gly Leu Pro
195 200 205
Lys Ala Val Arg Leu Thr His Phe Asn Val Thr Ser Asn Cys Leu Gln
210 215 220
Val Ser Ala Ala Ala Pro Asn Leu Ala Gln Asn Val Val Ala Ser Ala
225 230 235 240
Val Ile Pro Thr Thr His Ile Tyr Gly Leu Thr Met Phe Leu Ser Val
245 250 255
Leu Pro Tyr Asn Gly Ser Val Val Ile His His Lys Gln Phe Asn Leu
260 265 270
Arg Asp Leu Leu Glu Ala Gln Lys Thr Tyr Lys Val Ser Leu Trp Ile
275 280 285
Leu Val Pro Pro Val Ile Val Gln Leu Ala Lys Asn Pro Met Val Asp
290 295 300
Glu Tyr Leu Asp Ser Ile Arg Ala His Val Arg Cys Ile Val Ser Gly
305 310 315 320
Ala Ala Pro Leu Gly Gly Asn Val Val Asp Gln Val Ser Val Arg Leu
325 330 335
Thr Gly Asn Lys Glu Gly Ile Leu Pro Asn Gly Asp Lys Leu Val Ile
340 345 350
His Gln Ala Tyr Gly Leu Thr Glu Ser Ser Pro Ile Val Gly Met Leu
355 360 365
Asp Pro Leu Ser Asp His Ile Asp Val Met Thr Val Gly Cys Leu Met
370 375 380
Pro Asn Thr Glu Ala Arg Ile Val Asp Glu Glu Gly Asn Asp Gln Pro
385 390 395 400
Ala Val His Val Thr Asp Thr Arg Gly Ile Gly Ala Ala Val Lys Arg
405 410 415
Gly Glu Lys Ile Pro Ser Gly Glu Leu Trp Ile Arg Gly Pro Gln Ile
420 425 430
Met Asp Gly Tyr His Lys Asn Pro Glu Ser Ser Arg Glu Ser Leu Glu
435 440 445
Pro Ser Thr Glu Thr Tyr Gly Leu Gln His Phe Gln Asp Arg Trp Leu
450 455 460
Arg Thr Gly Asp Val Ala Val Ile Asp Thr Phe Gly Arg Val Met Val
465 470 475 480
Val Asp Arg Thr Lys Glu Leu Ile Lys Ser Met Ser Arg Gln Val Ala
485 490 495
Pro Ala Glu Leu Glu Ala Leu Leu Leu Asn His Pro Ser Val Asn Asp
500 505 510
Val Ala Val Val Gly Val His Asn Asp Asp Asn Gly Thr Glu Ser Ala
515 520 525
Arg Ala Phe Val Val Leu Gln Pro Gly Asp Ala Cys Asp Pro Thr Thr
530 535 540
Ile Lys His Trp Met Asp Gln Gln Val Pro Ser Tyr Lys Arg Leu Tyr
545 550 555 560
Gly Gly Ile Val Val Ile Asp Thr Val Pro Lys Asn Ala Ser Gly Lys
565 570 575
Ile Leu Arg Arg Leu Leu Arg Gln Arg Arg Asp Asp Arg Val Trp Gly
580 585 590
Leu
<210> 57
<211> 696
<212> PRT
<213> 热带假丝酵母
<400> 57
Met Gly Ala Pro Leu Thr Val Ala Val Gly Glu Ala Lys Pro Gly Glu
1 5 10 15
Thr Ala Pro Arg Arg Lys Ala Ser Gln Lys Leu Ala Pro Val Glu Arg
20 25 30
Pro Thr Asp Ser Lys Ala Thr Thr Leu Pro Glu Phe Ile Glu Glu Cys
35 40 45
Phe Thr Arg Asn Gly Asn Arg Asp Ala Met Ala Trp Arg Asp Leu Leu
50 55 60
Glu Val His Val Glu Thr Lys Lys Val Thr Lys Ile Ile Asp Gly Glu
65 70 75 80
Gln Lys Lys Val Asp Lys Glu Trp Ile Tyr Tyr Glu Met Gly Pro Tyr
85 90 95
Asn Tyr Ile Ser Tyr Pro Lys Leu Leu Gln Leu Val Lys Asn Tyr Ser
100 105 110
Lys Gly Leu Leu Glu Leu Gly Leu Leu Pro Asp Gln Gln Ser Lys Leu
115 120 125
Met Ile Phe Ala Ser Thr Ser His Lys Trp Met Gln Thr Phe Leu Ala
130 135 140
Ser Ser Phe Gln Gly Ile Pro Val Val Thr Ala Tyr Asp Thr Leu Gly
145 150 155 160
Glu Ser Gly Leu Thr His Ser Leu Val Gln Thr Glu Ser Asp Ala Ile
165 170 175
Phe Thr Asp Asn Gln Leu Leu Gly Ser Leu Ile Arg Pro Leu Glu Lys
180 185 190
Ala Thr Ala Ile Lys Tyr Ile Ile His Gly Glu Lys Ile Asp Pro Asn
195 200 205
Asp Lys Arg Gln Gly Gly Lys Ile Tyr Gln Asp Ala Glu Lys Ala Lys
210 215 220
Glu Lys Ile Leu Gln Ile Arg Pro Asp Ile Lys Phe Ile Ser Tyr Asn
225 230 235 240
Glu Val Ile Ala Leu Gly Glu Lys Ser Ser Lys Glu Leu His Tyr Pro
245 250 255
Lys Pro Glu Asp Ser Ile Cys Ile Met Tyr Thr Ser Gly Ser Thr Gly
260 265 270
Asp Pro Lys Gly Val Val Ile Thr Asn His Asn Ile Val Ala Ala Val
275 280 285
Gly Gly Ile Ser Thr Asn Ala Thr Arg Asp Leu Val Arg Pro Ser Asp
290 295 300
Lys Val Val Ala Phe Leu Pro Leu Ala His Ile Phe Glu Leu Ala Phe
305 310 315 320
Glu Leu Ile Thr Phe Trp Trp Gly Ala Pro Leu Gly Tyr Ala Asn Val
325 330 335
Lys Thr Leu Thr Asp Ala Ser Cys Arg Asn Cys Gln Pro Asp Leu Ile
340 345 350
Glu Phe Lys Pro Thr Ile Met Val Gly Val Ala Ala Val Trp Glu Ser
355 360 365
Val Arg Lys Gly Val Leu Ser Lys Leu Lys Gln Ala Ser Pro Leu Gln
370 375 380
Gln Lys Ile Phe Trp Ala Ala Phe Lys Ala Lys Ser Thr Leu Asn His
385 390 395 400
Phe Gly Leu Pro Gly Gly Gly Met Phe Asp Val Ile Phe Lys Lys Val
405 410 415
Lys Ala Ala Thr Gly Gly Gln Leu Arg Tyr Val Leu Asn Gly Gly Ser
420 425 430
Pro Ile Ser Ile Asp Ala Gln Val Phe Ile Ser Thr Leu Leu Ala Pro
435 440 445
Met Leu Leu Gly Tyr Gly Leu Thr Glu Thr Cys Ala Asn Thr Thr Ile
450 455 460
Thr Glu His Thr Arg Phe Gln Ile Gly Thr Leu Gly Ala Leu Val Gly
465 470 475 480
Ser Val Thr Ala Lys Leu Val Asp Val Ala Asp Ala Gly Tyr Phe Ala
485 490 495
Lys Asn Asn Gln Gly Glu Ile Trp Leu Lys Gly Gly Pro Val Val Lys
500 505 510
Glu Tyr Tyr Lys Asn Glu Glu Glu Thr Lys Ala Ala Phe Thr Asp Asp
515 520 525
Gly Trp Phe Lys Thr Gly Asp Ile Gly Glu Trp Thr Ser Glu Gly Gly
530 535 540
Leu Asn Ile Ile Asp Arg Lys Lys Asn Leu Val Lys Thr Leu Asn Gly
545 550 555 560
Glu Tyr Ile Ala Leu Glu Lys Leu Glu Ser Val Tyr Arg Ser Asn His
565 570 575
Leu Val Met Asn Leu Cys Val Tyr Ala Asp Gln Thr Lys Val Lys Pro
580 585 590
Ile Ala Ile Val Leu Pro Ile Glu Ala Asn Leu Lys Thr Met Leu Lys
595 600 605
Asp Glu Lys Val Val Pro Asp Ala Asp Thr Gln Glu Leu Ser His Leu
610 615 620
Val His Asn Lys Lys Val Val Gln Ala Val Leu Arg His Leu Leu Gln
625 630 635 640
Thr Gly Lys Gln Gln Gly Leu Lys Gly Ile Glu Leu Leu Gln Asn Ile
645 650 655
Val Leu Leu Asp Glu Glu Trp Thr Pro Gln Asn Gly Phe Val Thr Ser
660 665 670
Ala Gln Lys Leu Gln Arg Lys Lys Ile Leu Glu Ser Cys Arg Lys Glu
675 680 685
Val Asp Glu Ala Tyr Lys Ser Ser
690 695
<210> 58
<211> 718
<212> PRT
<213> 热带假丝酵母
<400> 58
Met Pro Ala Leu Phe Lys Glu Ser Ala Lys His Ile Leu Asp Thr Ile
1 5 10 15
Ala Ala Asp Leu Pro Leu Asp Gln Lys Leu Ala Ser Ile Ala Val Pro
20 25 30
Leu Glu Asn Ser Glu Glu Pro Gly Phe Ser Ala Ile Tyr Arg Asn Lys
35 40 45
Tyr Ser Leu Asp Lys Leu Ile Asp Thr Pro Tyr Pro Gly Val Asp Thr
50 55 60
Leu Tyr Lys Leu Phe Glu Val Ala Thr Glu Ala Tyr Gly Asp Lys Pro
65 70 75 80
Cys Leu Gly Ala Arg Val Lys Asn Gln Asp Gly Thr Phe Gly Glu Tyr
85 90 95
Lys Phe Gln Asp Tyr Asn Thr Ile Arg Gln Arg Arg Asn Asn Leu Gly
100 105 110
Ser Gly Ile Phe Phe Val Leu Gln Asn Asn Pro Tyr Lys Thr Ser Ser
115 120 125
Glu Ala His Ser Lys Leu Lys Tyr Asp Pro Ala Ser Lys Asp Ser Phe
130 135 140
Ile Leu Thr Ile Phe Ser His Asn Arg Pro Glu Trp Glu Leu Cys Asp
145 150 155 160
Leu Thr Ser Val Ala Tyr Ser Ile Thr Asn Thr Ala Leu Tyr Asp Thr
165 170 175
Leu Gly Pro Asp Thr Ser Lys Tyr Ile Leu Gly Leu Thr Glu Ser Pro
180 185 190
Ile Val Ile Cys Ser Lys Asp Lys Ile Lys Gly Leu Ile Asp Leu Lys
195 200 205
Lys Ser Asn Pro Glu Glu Leu Ser Asn Leu Ile Val Leu Val Ser Met
210 215 220
Asp Asp Leu Thr Thr Ala Asp Ser Ser Leu Lys Asn Tyr Gly His Glu
225 230 235 240
His Asn Val Thr Val Phe Asp Met Lys Gln Val Glu Lys Leu Gly Glu
245 250 255
Ile Asn Pro Leu Asp Pro Ile Glu Pro Thr Pro Asp Thr Asp Phe Thr
260 265 270
Ile Thr Phe Thr Ser Gly Thr Thr Gly Ala Asn Pro Lys Gly Val Val
275 280 285
Leu Asn His Arg Asn Ala Val Ala Gly Val Thr Phe Ile Leu Ser Arg
290 295 300
Tyr Asp Gly Lys Phe Asn Pro Arg Ala Tyr Ser Phe Leu Pro Leu Ala
305 310 315 320
His Ile Tyr Glu Arg Ala Ser Ile Gln Phe Ala Leu Ser Ile Gly Ser
325 330 335
Ala Ile Gly Phe Pro Gln Gly Pro Ser Pro Leu Thr Leu Leu Glu Asp
340 345 350
Val Lys Val Leu Gln Pro Asp Gly Leu Ala Leu Val Pro Arg Val Leu
355 360 365
Thr Lys Leu Glu Ala Ala Ile Arg Ser Gln Thr Ile Asn Asn Asp Glu
370 375 380
Lys Pro Leu Val Lys Ser Val Phe Ser Thr Val Ile Asn Ala Lys Met
385 390 395 400
Asp Leu Gln Thr Lys Asp Glu Asn Glu Asn Val Asn Pro Ser Leu Leu
405 410 415
Val Tyr Asp Arg Leu Leu Asn Met Leu Arg Lys Lys Ile Gly Met Gln
420 425 430
Asn Val Gln Tyr Ile Ser Thr Gly Ser Ala Pro Ile Ala Pro Ser Thr
435 440 445
Ile Gln Phe Leu Lys Ala Ala Leu Asn Val Gly Ile Met Gln Gly Tyr
450 455 460
Gly Leu Ser Glu Ser Phe Ala Gly Cys Met Ala Ser Ser Lys Phe Glu
465 470 475 480
Pro Glu Ala Ala Thr Cys Gly Ala Thr Ser Ile Thr Thr Glu Val Lys
485 490 495
Leu Lys Asp Leu Val Glu Met Gly Tyr Thr Ser Lys Asp Glu Gly Gly
500 505 510
Pro Arg Gly Glu Leu Leu Leu Arg Gly Pro Gln Ile Phe Arg Glu Tyr
515 520 525
Tyr Lys Asn Pro Glu Glu Thr Ala Lys Ala Ile Asp Glu Asp Gly Trp
530 535 540
Phe His Thr Gly Asp Val Ala Lys Ile Asn Ser Lys Gly Arg Ile Ser
545 550 555 560
Ile Ile Asp Arg Ala Lys Asn Phe Phe Lys Leu Ala Gln Gly Glu Tyr
565 570 575
Val Thr Pro Glu Lys Ile Glu Gly Leu Tyr Leu Ser Lys Phe Pro Tyr
580 585 590
Ile Ala Gln Leu Phe Val His Gly Asp Ser Lys Glu Ser Phe Leu Val
595 600 605
Ala Val Val Gly Leu Asp Pro Ile Ala Ala Lys Gln Tyr Met Glu His
610 615 620
Arg Phe His Asp Lys Ile Val Lys Glu Asp Asp Ile Val Glu Phe Phe
625 630 635 640
Lys Ser Pro Arg Asn Arg Lys Ile Leu Leu Gln Asp Met Asn Lys Ser
645 650 655
Ile Ala Asp Gln Leu Gln Gly Phe Glu Lys Leu His Asn Ile Tyr Val
660 665 670
Asp Phe Glu Pro Leu Thr Val Asp Arg Gly Val Ile Thr Pro Thr Met
675 680 685
Lys Ile Arg Arg Pro Ile Ala Val Lys Phe Phe Gln Asp Gln Ile Asp
690 695 700
Gly Met Tyr Asn Glu Gly Ser Leu Val Lys Asn Gly Ser Leu
705 710 715
<210> 59
<211> 718
<212> PRT
<213> 热带假丝酵母
<400> 59
Met Pro Ala Leu Phe Lys Glu Ser Pro Gln Gln Ile Ser Gln Ser Leu
1 5 10 15
Lys Ala Lys Phe Ser Asp Pro Tyr Gln Phe Ala Thr Ser Val Pro Leu
20 25 30
Ser Asp Thr Lys Glu Pro Gly Tyr Ser His Ile Tyr Arg Asn Ser Tyr
35 40 45
Asp Pro Thr Thr Leu Ala Thr Cys Pro His Pro Glu Leu Asp Thr Leu
50 55 60
His Lys Ile Phe Glu Phe Ser Asn Thr Ile Tyr Ser Asp Ser Pro Phe
65 70 75 80
Leu Gly His Arg Val Lys Asn Pro Asp Gly Thr Phe Gly Glu Tyr Lys
85 90 95
Phe Gln Thr Tyr Arg Gln Ile Tyr Lys Arg Arg Asn Asp Phe Gly Ser
100 105 110
Gly Ile Tyr Tyr Val Leu Glu Asn Asn Pro Tyr Lys Thr Ser Ser Glu
115 120 125
Ala His Ser Lys Leu Lys Tyr Asp Pro Thr Asn Lys Asp Pro Phe Ile
130 135 140
Leu Ala Val Phe Ser His Asn Arg Pro Glu Trp Ala Leu Cys Asp Leu
145 150 155 160
Thr Thr Asn Ser Phe Gly Ile Ile Asn Thr Ala Leu Tyr Ser Thr Leu
165 170 175
Gly Pro Asp Thr Ser Arg Tyr Ile Leu Gly Val Thr Asp Cys Pro Ile
180 185 190
Val Val Thr Thr Lys Asp Lys Val Lys Gly Ile Ile Ser Leu Lys Asn
195 200 205
Ser Asn Gln Lys Glu Leu Ala Ser Leu Ile Thr Ile Val Ser Met Asp
210 215 220
Glu Leu Thr Glu Glu Asp Lys Glu Leu Arg Ser Phe Gly His Glu Asn
225 230 235 240
Asn Ile Thr Val Tyr Asp Ile Lys Glu Val Glu Asn Phe Gly Glu Lys
245 250 255
Asn Pro Leu Lys Pro Ile Glu Pro Thr Pro Asp Thr Ile Phe Thr Ile
260 265 270
Ser Phe Thr Ser Gly Thr Thr Gly Ala Ala Pro Lys Gly Val Val Leu
275 280 285
Thr Asn Arg Ile Leu Val Ser Gly Ile Thr Thr His Cys Thr Ile Leu
290 295 300
Ser Phe Gly Pro Glu Arg Val His Tyr Ser Phe Leu Pro Leu Ala His
305 310 315 320
Ile Tyr Glu Arg Met Leu Leu Gln Phe Gly Ile Leu Ala Gly Val Lys
325 330 335
Ile Gly Tyr Pro Gln Gly Pro Leu Pro Thr Thr Leu Phe Asp Asp Val
340 345 350
Lys Tyr Leu Gln Pro Thr Phe Leu Cys Leu Val Pro Arg Val Phe Thr
355 360 365
Lys Ile Glu Ala Ala Ile Lys Ala Gln Thr Val Glu Asn Asp Ala Asn
370 375 380
Pro Lys Ile Lys Thr Leu Phe Gln Asn Ile Val Asp Lys Lys Leu Lys
385 390 395 400
Leu Gln Gln Gln Glu Asp Phe Thr Asn Pro Ser Phe Pro Glu Gly Asp
405 410 415
Lys Val Leu Leu Gln Leu Arg Glu Lys Leu Gly Phe Gly Lys Ile Ala
420 425 430
Phe Met Asn Thr Gly Ser Ala Pro Leu Ser Glu Glu Thr Tyr Arg Phe
435 440 445
Leu Gln Ala Ile Leu Asn Leu Pro Asp Gly Phe Arg Ser Gly Tyr Gly
450 455 460
Leu Thr Glu Ser Ala Ser Gly Val Cys Ile Ser Pro Ala Tyr Ala Asn
465 470 475 480
Glu Phe Ser Cys Gly Pro Ile Ser Val Thr Thr Glu Phe Lys Leu Arg
485 490 495
Asp Ile Glu Glu Met Gly Tyr Thr Ser Ser Asp Lys Asp Gly Pro Arg
500 505 510
Gly Glu Leu Leu Leu Arg Gly Pro Gln Ile Phe Pro Tyr Tyr Tyr Lys
515 520 525
Asn Pro Glu Glu Thr Ala Lys Val Ile Asp Lys Asp Gly Trp Phe Tyr
530 535 540
Thr Gly Asp Val Ala Val Val Ser Pro Gln His Gly Asn Arg Leu Gln
545 550 555 560
Ile Ile Asp Arg Val Lys Asn Phe Phe Lys Leu Ser Gln Gly Glu Tyr
565 570 575
Val Ser Pro Glu Lys Ile Glu Asn Val Tyr Leu Ser Gln Phe Pro Tyr
580 585 590
Ile Ser Gln Leu Phe Ala His Gly Asp Ser Thr Glu Ser Tyr Leu Val
595 600 605
Gly Val Val Gly Ile Asp Lys Ala Ser Ile Asp Pro Tyr Leu Lys Lys
610 615 620
Arg Phe Asn Val Ser Ile Glu Lys Gln Ala Asp Ile Val Lys Tyr Phe
625 630 635 640
Glu Asn Pro Lys Asn Arg Arg Ala Leu Leu His Asp Met Asn Glu Ala
645 650 655
Ile Glu Gly Gln Leu Gln Gly Phe Glu Lys Leu His Asn Val Phe Val
660 665 670
Asp Phe Glu Pro Leu Thr Leu Glu Arg Glu Val Ile Thr Pro Thr Ile
675 680 685
Lys Ile Arg Arg Pro Val Ala Val Lys Phe Phe Lys Glu Gln Ile Glu
690 695 700
Asn Met Tyr Arg Glu Gly Ser Leu Ile Lys Gly Ser Asn Leu
705 710 715
<210> 60
<211> 741
<212> PRT
<213> 热带假丝酵母
<400> 60
Met Thr Thr Leu Pro Ser Ile Ser Glu Thr Asp Ile Val Tyr Ala Thr
1 5 10 15
Asp Asp Lys Pro Tyr Val Phe Glu Asn Pro Asn Asp Leu Pro Val Glu
20 25 30
Thr Leu Val Asn His Ile Leu Pro Phe Pro Gln Glu Val Ala Gly Glu
35 40 45
Ser Ile Lys Ile Pro Gly Thr Ala Val Glu Gly Phe Ser Glu Ile Tyr
50 55 60
Arg Asn Ala Ala Thr Pro Asn Gly Ile Lys Ala Ser Leu Ile Lys Gly
65 70 75 80
Leu Asp Thr Tyr His Asp Ile Phe Glu Arg Ser Ala Asp Cys Tyr Ala
85 90 95
Asp Glu Pro Cys Leu Ala Phe His Glu Tyr Asp Tyr Glu Asn Ser Gln
100 105 110
His Leu Glu Arg Tyr Ala Thr Ile Ser Tyr Lys Glu Val Arg Gln Arg
115 120 125
Lys Asp Asp Phe Ala Ala Gly Leu Phe Phe Leu Leu Lys Ser Asn Pro
130 135 140
Phe Lys Asn Asn Ser Leu Glu Ser His Gln Lys Ile Asp Asn His Glu
145 150 155 160
Ala Asn Tyr Lys Ser Tyr Asn Ser Asp Asp Met Ser Phe Ile Ala Thr
165 170 175
Phe Tyr Ala Gly Asn Arg Val Glu Trp Ile Leu Ser Asp Leu Ala Cys
180 185 190
Ser Ser Asn Ser Ile Thr Ser Thr Ala Leu Tyr Asp Thr Leu Gly Pro
195 200 205
Glu Thr Ser Lys Tyr Ile Leu Glu Thr Thr Gln Ser Pro Val Ile Ile
210 215 220
Ser Ser Lys Asp His Ile Arg Gly Leu Ile Glu Leu Lys Arg Lys Tyr
225 230 235 240
Pro Glu Ala Leu Glu Ser Ile Ile Leu Ile Ile Ser Met Asp Pro Leu
245 250 255
Thr Lys Ser Asp Val Gly Leu Val Gln Leu Ala Glu Lys Ser Asn Ile
260 265 270
Lys Leu Tyr Asp Phe Ser Gln Val Glu Arg Thr Gly Ala Ile Phe Pro
275 280 285
His Glu Thr Asn Pro Pro Asn Ser Glu Thr Val Phe Thr Ile Thr Phe
290 295 300
Thr Ser Gly Thr Thr Gly Ala Asn Pro Lys Gly Val Val Leu Pro Gln
305 310 315 320
Arg Cys Ala Ala Ser Ala Met Leu Ala Tyr Ser Leu Leu Met Pro His
325 330 335
His Arg Gly Thr Arg Glu Phe Ala Phe Leu Pro Leu Ala His Ile Phe
340 345 350
Glu Arg Gln Met Val Ala Ser Met Phe Leu Phe Gly Gly Ser Ser Ala
355 360 365
Phe Pro Arg Leu Gly Gly Thr Pro Leu Thr Leu Val Glu Asp Leu Lys
370 375 380
Leu Trp Lys Pro Asn Phe Met Ala Asn Val Pro Arg Ile Phe Thr Lys
385 390 395 400
Ile Glu Ala Gly Ile Lys Ala Ser Thr Ile Asp Ser Thr Ser Gly Leu
405 410 415
Thr Arg Ser Leu Tyr Gly Arg Ala Ile Glu Ala Lys Arg Val Lys Gln
420 425 430
Ile Lys Asn Asp Asp Ser Gly Asp His Phe Ile Tyr Asp Lys Leu Leu
435 440 445
Ile Gln Lys Leu Arg Asn Ala Ile Gly Tyr Asp Lys Leu Glu Phe Cys
450 455 460
Val Thr Gly Ser Ala Pro Ile Ala Pro Glu Thr Ile Lys Phe Leu Lys
465 470 475 480
Ala Ser Leu Gly Ile Gly Phe Ala Gln Gly Tyr Gly Ser Ser Glu Ser
485 490 495
Phe Ala Gly Met Leu Phe Ala Leu Pro Phe Lys Thr Ser Ser Val Gly
500 505 510
Thr Cys Gly Val Ile Ala Pro Thr Met Glu Ala Arg Leu Arg Glu Leu
515 520 525
Pro Asp Met Gly Tyr Met Leu Asp Asp Ala Asn Gly Pro Arg Gly Glu
530 535 540
Leu Gln Ile Arg Gly Ala Gln Leu Phe Thr Lys Tyr Phe Lys Asn Asp
545 550 555 560
Glu Glu Thr Ala Lys Ser Ile Asp Glu Asp Gly Trp Phe Ser Thr Gly
565 570 575
Asp Val Ala Glu Ile Gly Ala Lys Asp Gly Tyr Phe Arg Ile Ile Asp
580 585 590
Arg Val Lys Asn Phe Tyr Lys Leu Ala Gln Gly Glu Tyr Val Ser Pro
595 600 605
Glu Lys Ile Glu Ser Leu Tyr Leu Ser Leu Asn Ser Thr Ile Ser Gln
610 615 620
Leu Phe Val His Gly Asp Ser Thr Lys Ser Tyr Leu Val Gly Val Val
625 630 635 640
Gly Leu Gln Pro Asp Val Ala Ser Lys Tyr Val Asp Leu Ser Ser Gly
645 650 655
Asp Lys Val Val Gln Glu Leu Asn Lys Pro Glu Leu Arg Lys Gln Ile
660 665 670
Leu Ser Asp Leu Asn Gly Lys Val Asn Gly Lys Leu Gln Gly Phe Glu
675 680 685
Lys Leu His Asn Ile Phe Ile Asp Ile Glu Pro Leu Thr Leu Glu Arg
690 695 700
Asn Val Val Thr Pro Thr Met Lys Leu Lys Arg His Phe Ala Ala Lys
705 710 715 720
Phe Phe Arg Ala Gln Ile Asp Ser Met Tyr Glu Glu Gly Ser Ile Val
725 730 735
Ala Asp Tyr Lys Leu
740
<210> 61
<211> 741
<212> PRT
<213> 热带假丝酵母
<400> 61
Met Thr Thr Leu Pro Ser Ile Ser Glu Thr Asp Ile Val Tyr Ala Thr
1 5 10 15
Asp Asp Lys Pro Tyr Val Phe Glu Asn Pro Asn Asp Leu Pro Val Glu
20 25 30
Thr Leu Val Asn His Ile Leu Pro Phe Pro Gln Glu Val Ala Gly Glu
35 40 45
Ser Ile Lys Ile Pro Gly Thr Ala Val Glu Gly Phe Ser Glu Ile Tyr
50 55 60
Arg Asn Ala Ala Thr Pro Asn Gly Ile Lys Ala Ser Leu Ile Lys Gly
65 70 75 80
Leu Asp Thr Tyr His Asp Ile Phe Glu Arg Ser Ala Asp Cys Tyr Ala
85 90 95
Asp Glu Pro Cys Leu Ala Phe His Glu Tyr Asp Tyr Glu Asn Ser Gln
100 105 110
His Leu Glu Arg Tyr Ala Thr Ile Ser Tyr Lys Glu Val Arg Gln Arg
115 120 125
Lys Asp Asp Phe Ala Ala Gly Leu Phe Phe Leu Leu Lys Ser Asn Pro
130 135 140
Phe Lys Asn Asn Ser Leu Glu Ser His Gln Lys Ile Asp Asn His Glu
145 150 155 160
Ala Asn Tyr Lys Ser Tyr Asn Ser Asp Asp Met Ser Phe Ile Ala Thr
165 170 175
Phe Tyr Ala Gly Asn Arg Val Glu Trp Ile Leu Ser Asp Leu Ala Cys
180 185 190
Ser Ser Asn Ser Ile Thr Ser Thr Ala Leu Tyr Asp Thr Leu Gly Pro
195 200 205
Gly Thr Ser Lys Tyr Ile Leu Glu Ala Thr Gln Ser Pro Val Ile Ile
210 215 220
Thr Ser Lys Asp His Ile Lys Gly Leu Ile Glu Leu Lys Arg Lys Tyr
225 230 235 240
Pro Glu Ala Leu Glu Ser Ile Ile Leu Ile Ile Ser Met Asp Pro Leu
245 250 255
Thr Lys Ser Asp Val Gly Leu Val Gln Leu Ala Glu Asn Ser Asn Ile
260 265 270
Lys Leu Tyr Asp Phe Ser Gln Val Glu Arg Ala Gly Ala Ile Phe Pro
275 280 285
His Glu Thr Asn Pro Pro Asn Arg Glu Thr Val Phe Thr Ile Thr Phe
290 295 300
Thr Ser Gly Thr Thr Gly Ala Asn Pro Lys Gly Val Val Leu Ser Gln
305 310 315 320
Gly Ser Ala Ala Ser Ala Ser Phe Val Tyr Ser Leu Leu Met Pro His
325 330 335
Arg Arg Gly Ala Arg Asp Phe Ala Phe Leu Pro Leu Ala His Ile Phe
340 345 350
Gln Arg Gln Met Val Ala Ser Thr Leu Phe Phe Gly Gly Ser Ser Ala
355 360 365
Phe Pro Arg Leu Gly Gly Thr Pro Leu Thr Leu Val Glu Asp Leu Lys
370 375 380
Leu Trp Lys Pro Asn Phe Met Ala Asn Val Pro Arg Ile Phe Thr Lys
385 390 395 400
Ile Glu Ala Gly Ile Lys Ala Ser Thr Ile Asp Ser Thr Ser Gly Leu
405 410 415
Thr Arg Ser Leu Tyr Gly Arg Ala Ile Glu Ala Lys Arg Val Lys Gln
420 425 430
Ile Lys Asn Asp Asp Ser Gly Asp His Phe Ile Tyr Asp Lys Leu Leu
435 440 445
Ile Gln Lys Leu Arg Asn Ala Ile Gly Tyr Asp Lys Leu Glu Phe Leu
450 455 460
Leu Thr Gly Ser Ala Pro Ile Ser Pro Glu Thr Ile Lys Phe Leu Lys
465 470 475 480
Ser Ser Leu Gly Ile Gly Phe Gly Gln Gly Tyr Gly Ser Ser Glu Ser
485 490 495
Phe Gly Gly Ile Leu Phe Ala Leu Pro Phe Lys Asn Ser Ser Leu Gly
500 505 510
Thr Cys Gly Val Ile Ala Pro Thr Met Glu Ala Arg Leu Arg Glu Leu
515 520 525
Pro Asp Met Gly Tyr Met Leu Asp Asp Ala Asn Gly Pro Arg Gly Glu
530 535 540
Leu Gln Ile Arg Gly Ala Gln Leu Phe Ala Lys Tyr Phe Lys Asn Asp
545 550 555 560
Glu Glu Thr Ala Lys Ser Ile Asp Glu Asp Gly Trp Phe Ser Thr Gly
565 570 575
Asp Val Ala Glu Ile Gly Ala Lys Asp Gly Tyr Phe Arg Ile Ile Asp
580 585 590
Arg Val Lys Asn Phe Tyr Lys Leu Ala Gln Gly Glu Tyr Val Ser Pro
595 600 605
Glu Lys Ile Glu Asn Leu Tyr Leu Ser Leu Asn Ser Thr Ile Ser Gln
610 615 620
Leu Phe Ile His Gly Asp Ser Thr Lys Ser Tyr Leu Val Gly Val Val
625 630 635 640
Gly Leu Gln Pro Asp Val Ala Ser Lys Tyr Val Asp Leu Ser Ser Gly
645 650 655
Asp Lys Val Val Gln Glu Leu Asn Lys Pro Glu Leu Arg Lys Gln Ile
660 665 670
Leu Leu Asp Leu Asn Gly Lys Val Asn Gly Lys Leu Gln Gly Phe Glu
675 680 685
Lys Leu His Asn Ile Phe Ile Asp Ile Glu Pro Leu Thr Leu Glu Arg
690 695 700
Asn Val Val Thr Pro Thr Met Lys Leu Lys Arg His Phe Ala Ala Lys
705 710 715 720
Phe Phe Arg Ala Gln Ile Asp Ser Met Tyr Glu Glu Gly Ser Ile Ile
725 730 735
Ala Asp Tyr Lys Leu
740
<210> 62
<211> 749
<212> PRT
<213> 热带假丝酵母
<400> 62
Met Ile Glu Ser Lys Ser Ile Phe Ser Gly Glu Lys Tyr Thr Lys Gln
1 5 10 15
Glu Ala Leu Ser Gln Leu Pro Phe Gly Ser Asp Val Glu Asn Ala Val
20 25 30
Met Ile Asp Glu Pro Val Thr Asn Val Lys Tyr Ser Pro Ile Phe Arg
35 40 45
Asn Lys Ala His Leu Asp Gly Leu Ile Gln Asn Val His Pro Asp Leu
50 55 60
Asn Thr His Tyr Lys Leu Phe Asn Asn Ala Ala Glu Met Tyr His Asp
65 70 75 80
Arg Pro Cys Leu Gly Lys Arg Pro Tyr Asn Tyr Thr Thr His Gln Ser
85 90 95
Asp Asp Tyr Phe Ser His Trp Thr Tyr Gly Glu Val Phe Thr Lys Lys
100 105 110
Asn Asn Leu Gly Ala Gly Phe Ile Arg Ala Leu Leu Glu Asn Pro Phe
115 120 125
Leu Asp Val Gln Leu Glu Ser His Arg Lys Val Val Asn His Leu Arg
130 135 140
Asp Trp Ser Asn Phe Gly Ile Asn Lys Leu Pro Arg Asp Asn Leu Asn
145 150 155 160
Cys Glu Ile Glu Lys Asn Cys Ser Phe Ile Leu Thr Ile Phe Ala Val
165 170 175
Asn Arg Ala Glu Trp Ile Leu Thr Asp Leu Ala Cys Ser Ser Tyr Gly
180 185 190
Ile Thr Asn Thr Ala Leu Tyr Asp Thr Leu Gly Pro Asp Val Ser Gln
195 200 205
Tyr Ile Leu Asn Leu Thr Glu Ser Pro Ile Val Val Cys Thr His Asp
210 215 220
Lys Ile Gln Val Leu Ile Asn Leu Lys Lys Lys Tyr Pro Gln Gln Thr
225 230 235 240
Lys Asn Leu Ile Ser Ile Val Ser Met Asp Pro Ile Asp Leu Val Thr
245 250 255
Gln Gly Thr Ile Glu Asp Ala Tyr Glu Leu Gly Ile Thr Ile Gln Gly
260 265 270
Leu Asn Gln Ile Glu Lys Ile Gly Ala Lys Asn Pro Ile His Gln Leu
275 280 285
Glu Thr Asn Pro Glu Ala Leu Phe Thr Ile Ser Phe Thr Ser Gly Thr
290 295 300
Thr Gly Ser Lys Pro Lys Gly Val Met Ile Ser Gln Gly Gly Ala Ala
305 310 315 320
Ala Tyr Ile Thr Tyr Leu Leu Cys Cys Glu Pro Gln Ala Lys Pro Gly
325 330 335
Asp Lys Ala Phe Ile Phe Leu Pro Leu Thr His Leu Tyr Glu Arg Gln
340 345 350
Thr Cys Gly Phe Ala Phe Ser Ser Gly Tyr Tyr Leu Gly Phe Pro Gln
355 360 365
Val Asn Leu Gly Lys Lys Lys Ile Asn Pro Phe Glu Asn Leu Leu Ala
370 375 380
Asp Leu Arg Ile Phe Lys Pro Thr Tyr Met Ser Met Val Pro Arg Leu
385 390 395 400
Leu Thr Arg Leu Glu Ala Leu Ile Lys Ser Lys Ile Lys Glu Leu Pro
405 410 415
Val Gln Glu Gln Glu Lys Val Asn Ser Ile Ile Glu Ala Lys Ile Lys
420 425 430
Lys Gln Ser Lys Gln Asp Gly Ser Thr Gly Phe Asp Ala Thr Leu Asp
435 440 445
Asn Asp Pro Thr Tyr Lys Ser Leu Ala Gln Phe Val Gly Tyr Asp Asn
450 455 460
Met Arg Trp Val Gln Thr Ala Ser Ala Pro Ile Ala Pro Thr Thr Leu
465 470 475 480
Ile Tyr Leu Lys Ala Ser Leu Asn Ile Gly Thr Arg Gln Gln Tyr Gly
485 490 495
Leu Thr Glu Ser Gly Ala Ala Ile Thr Ser Thr Gly Glu Tyr Glu Ala
500 505 510
Ser Pro Gly Ser Cys Gly Val Ile Leu Pro Thr Gly Gln Tyr Arg Leu
515 520 525
Tyr Ser Val Ser Glu Met Gly Tyr Asp Leu Asn Lys Leu Glu Gly Glu
530 535 540
Val Met Leu Gln Gly Pro Gln Met Phe Lys Gly Tyr Tyr Tyr Asn Tyr
545 550 555 560
Glu Glu Thr Ile Asn Ala Val Thr Glu Asp Gly Trp Phe His Ser Gly
565 570 575
Asp Ile Ala Arg Val Asp Ser Lys Thr Gly Arg Val Thr Ile Ile Asp
580 585 590
Arg Val Lys His Phe Phe Lys Leu Ala Gln Gly Glu Tyr Ile Ser Pro
595 600 605
Glu Arg Ile Glu Asn Arg Tyr Leu Ser Ser Asn Pro Asp Ile Cys Gln
610 615 620
Leu Trp Val His Gly Asp Ser Lys Glu His Tyr Leu Ile Gly Ile Val
625 630 635 640
Gly Val Glu Tyr Glu Lys Gly Leu Lys Phe Ile Asn Thr Glu Phe Gly
645 650 655
Tyr Asn Lys Ile Asp Met Pro Pro Gly Asp Leu Leu Asp Ile Leu Asn
660 665 670
Ser Pro Glu Val Lys Ser Lys Phe Leu Thr Lys Met Asn Gln Ser Val
675 680 685
Arg Asp Lys Leu Asn Gly Phe Glu Ile Leu His Asn Ile Phe Ile Glu
690 695 700
Phe Glu Pro Leu Thr Val Gln Arg Glu Val Val Thr Pro Thr Phe Lys
705 710 715 720
Ile Arg Arg Pro Ile Cys Arg Lys Phe Phe Lys Ser Gln Leu Asp Ala
725 730 735
Met Tyr Asn Glu Gly Ser Leu Ile Asn Asn Ala Lys Leu
740 745
<210> 63
<211> 8902
<212> DNA
<213> 人工序列
<220>
<223> 质粒pZP2-YlACoS-3Ps
<400> 63
ggccgcaagt gtggatgggg aagtgagtgc ccggttctgt gtgcacaatt ggcaatccaa 60
gatggatgga ttcaacacag ggatatagcg agctacgtgg tggtgcgagg atatagcaac 120
ggatatttat gtttgacact tgagaatgta cgatacaagc actgtccaag tacaatacta 180
aacatactgt acatactcat actcgtaccc gggcaacggt ttcacttgag tgcagtggct 240
agtgctctta ctcgtacagt gtgcaatact gcgtatcata gtctttgatg tatatcgtat 300
tcattcatgt tagttgcgta cgggcgtcgt tgcttgtgtg atttttgagg acccatccct 360
ttggtatata agtatactct ggggttaagg ttgcccgtgt agtctaggtt atagttttca 420
tgtgaaatac cgagagccga gggagaataa acgggggtat ttggacttgt ttttttcgcg 480
gaaaagcgtc gaatcaaccc tgcgggcctt gcaccatgtc cacgacgtgt ttctcgcccc 540
aattcgcccc ttgcacgtca aaattaggcc tccatctaga cccctccata acatgtgact 600
gtggggaaaa gtataaggga aaccatgcaa ccatagacga cgtgaaagac ggggaggaac 660
caatggaggc caaagaaatg gggtagcaac agtccaggag acagacaagg agacaaggag 720
agggcgcccg aaagatcgga aaaacaaaca tgtccaattg gggcagtgac ggaaacgaca 780
cggacacttc agtacaatgg accgaccatc tccaagccag ggttattccg gtatcacctt 840
ggccgtaacc tcccgctggt acctgatatt gtacacgttc acattcaata tactttcagc 900
tacaataaga gaggctgttt gtcgggcatg tgtgtccgtc gtatggggtg atgtccgagg 960
gcgaaattcg ctacaagctt aactctggcg cttgtccagt atgaatagac aagtcaagac 1020
cagtggtgcc atgattgaca gggaggtaca agacttcgat actcgagcat tactcggact 1080
tgtggcgatt gaacagacgg gcgatcgctt ctcccccgta ttgccggcgc gccagctgca 1140
ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt attgggcgct cttccgcttc 1200
ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat cagctcactc 1260
aaaggcggta atacggttat ccacagaatc aggggataac gcaggaaaga acatgtgagc 1320
aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag 1380
gctccgcccc cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc 1440
gacaggacta taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt 1500
tccgaccctg ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct 1560
ttctcatagc tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg 1620
ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct 1680
tgagtccaac ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat 1740
tagcagagcg aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg 1800
ctacactaga agaacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa 1860
aagagttggt agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt 1920
ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc 1980
tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt 2040
atcaaaaagg atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta 2100
aagtatatat gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat 2160
ctcagcgatc tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac 2220
tacgatacgg gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg 2280
ctcaccggct ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag 2340
tggtcctgca actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt 2400
aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt 2460
gtcacgctcg tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt 2520
tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt 2580
cagaagtaag ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct 2640
tactgtcatg ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt 2700
ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac gggataatac 2760
cgcgccacat agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa 2820
actctcaagg atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa 2880
ctgatcttca gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca 2940
aaatgccgca aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct 3000
ttttcaatat tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga 3060
atgtatttag aaaaataaac aaataggggt tccgcgcaca tttccccgaa aagtgccacc 3120
tgatgcggtg tgaaataccg cacagatgcg taaggagaaa ataccgcatc aggaaattgt 3180
aagcgttaat attttgttaa aattcgcgtt aaatttttgt taaatcagct cattttttaa 3240
ccaataggcc gaaatcggca aaatccctta taaatcaaaa gaatagaccg agatagggtt 3300
gagtgttgtt ccagtttgga acaagagtcc actattaaag aacgtggact ccaacgtcaa 3360
agggcgaaaa accgtctatc agggcgatgg cccactacgt gaaccatcac cctaatcaag 3420
ttttttgggg tcgaggtgcc gtaaagcact aaatcggaac cctaaaggga gcccccgatt 3480
tagagcttga cggggaaagc cggcgaacgt ggcgagaaag gaagggaaga aagcgaaagg 3540
agcgggcgct agggcgctgg caagtgtagc ggtcacgctg cgcgtaacca ccacacccgc 3600
cgcgcttaat gcgccgctac agggcgcgtc cattcgccat tcaggctgcg caactgttgg 3660
gaagggcgat cggtgcgggc ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct 3720
gcaaggcgat taagttgggt aacgccaggg ttttcccagt cacgacgttg taaaacgacg 3780
gccagtgaat tgtaatacga ctcactatag ggcgaattgg gcccgacgtc gcatgcgctg 3840
atgacacttt ggtctgaaag agatgcattt tgaatcccaa acttgcagtg cccaagtgac 3900
atacatctcc gcgttttgga aaatgttcag aaacagttga ttgtgttgga atggggaatg 3960
gggaatggaa aaatgactca agtatcaatt ccaaaaactt ctctggctgg cagtacctac 4020
tgtccatact actgcatttt ctccagtcag gccactctat actcgacgac acagtagtaa 4080
aacccagata atttcgacat aaacaagaaa acagacccaa taatatttat atatagtcag 4140
ccgtttgtcc agttcagact gtaatagccg aaaaaaaatc caaagtttct attctaggaa 4200
aatatattcc aatattttta attcttaatc tcatttattt tattctagcg aaatacattt 4260
cagctacttg agacatgtga tacccacaaa tcggattcgg actcggttgt tcagaagagc 4320
atatggcatt cgtgctcgct tgttcacgta ttcttcctgt tccatctctt ggccgacaat 4380
cacacaaaaa tggggttttt tttttaattc taatgattca ttacagcaaa attgagatat 4440
agcagaccac gtattccata atcaccaagg aagttcttgg gcgtcttaat taagtcatac 4500
acaagtcagc tttcttcgag cctcatataa gtataagtag ttcaacgtat tagcactgta 4560
cccagcatct ccgtatcgag aaacacaaca acatgcccca ttggacagat catgcggata 4620
cacaggttgt gcagtatcat acatactcga tcagacaggt cgtctgacca tcatacaagc 4680
tgaacaagcg ctccatactt gcacgctctc tatatacaca gttaaattac atatccatag 4740
tctaacctct aacagttaat cttctggtaa gcctcccagc cagccttctg gtatcgcttg 4800
gcctcctcaa taggatctcg gttctggccg tacagacctc ggccgacaat tatgatatcc 4860
gttccggtag acatgacatc ctcaacagtt cggtactgct gtccgagagc gtctcccttg 4920
tcgtcaagac ccaccccggg ggtcagaata agccagtcct cagagtcgcc cttaggtcgg 4980
ttctgggcaa tgaagccaac cacaaactcg gggtcggatc gggcaagctc aatggtctgc 5040
ttggagtact cgccagtggc cagagagccc ttgcaagaca gctcggccag catgagcaga 5100
cctctggcca gcttctcgtt gggagagggg actaggaact ccttgtactg ggagttctcg 5160
tagtcagaga cgtcctcctt cttctgttca gagacagttt cctcggcacc agctcgcagg 5220
ccagcaatga ttccggttcc gggtacaccg tgggcgttgg tgatatcgga ccactcggcg 5280
attcggtgac accggtactg gtgcttgaca gtgttgccaa tatctgcgaa ctttctgtcc 5340
tcgaacagga agaaaccgtg cttaagagca agttccttga gggggagcac agtgccggcg 5400
taggtgaagt cgtcaatgat gtcgatatgg gttttgatca tgcacacata aggtccgacc 5460
ttatcggcaa gctcaatgag ctccttggtg gtggtaacat ccagagaagc acacaggttg 5520
gttttcttgg ctgccacgag cttgagcact cgagcggcaa aggcggactt gtggacgtta 5580
gctcgagctt cgtaggaggg cattttggtg gtgaagagga gactgaaata aatttagtct 5640
gcagaacttt ttatcggaac cttatctggg gcagtgaagt atatgttatg gtaatagtta 5700
cgagttagtt gaacttatag atagactgga ctatacggct atcggtccaa attagaaaga 5760
acgtcaatgg ctctctgggc gtcgcctttg ccgacaaaaa tgtgatcatg atgaaagcca 5820
gcaatgacgt tgcagctgat attgttgtcg gccaaccgcg ccgaaaacgc agctgtcaga 5880
cccacagcct ccaacgaaga atgtatcgtc aaagtgatcc aagcacactc atagttggag 5940
tcgtactcca aaggcggcaa tgacgagtca gacagatact cgtcaaacgg taggttagtg 6000
cttggtatat gagttgtagg catgacaatt tggaaagggg tggactttgg gaatattgtg 6060
ggatttcaat accttagttt gtacagggta attgttacaa atgatacaaa gaactgtatt 6120
tcttttcatt tgttttaatt ggttgtatat caagtccgtt agacgagctc agtgccttgg 6180
cttttggcac tgtatttcat ttttagaggt acactacatt cagtgaggta tggtaaggtt 6240
gagggcataa tgaaggcacc ttgtactgac agtcacagac ctctcaccga gaattttatg 6300
agatatactc gggttcattt taggctcatc gattgccccg gagaagacgg ccaggccgcc 6360
tagatgacaa attcaacaac tcacagctga ctttctgcca ttgccactag gggggggcct 6420
ttttatatgg ccaagccaag ctctccacgt cggttgggct gcacccaaca ataaatgggt 6480
agggttgcac caacaaaggg atgggatggg gggtagaaga tacgaggata acggggctca 6540
atggcacaaa taagaacgaa tactgccatt aagactcgtg atccagcgac tgacaccatt 6600
gcatcatcta agggcctcaa aactacctcg gaactgctgc gctgatctgg acaccacaga 6660
ggttccgagc actttaggtt gcaccaaatg tcccaccagg tgcaggcaga aaacgctgga 6720
acagcgtgta cagtttgtct taacaaaaag tgagggcgct gaggtcgagc agggtggtgt 6780
gacttgttat agcctttaga gctgcgaaag cgcgtatgga tttggctcat caggccagat 6840
tgagggtctg tggacacatg tcatgttagt gtacttcaat cgccccctgg atatagcccc 6900
gacaataggc cgtggcctca tttttttgcc ttccgcacat ttccattgct cggtacccac 6960
accttgcttc tcctgcactt gccaacctta atactggttt acattgacca acatcttaca 7020
agcggggggc ttgtctaggg tatatataaa cagtggctct cccaatcggt tgccagtctc 7080
ttttttcctt tctttcccca cagattcgaa atctaaacta cacatcacag aattccgagc 7140
cgtgagtatc cacgacaaga tcagtgtcga gacgacgcgt tttgtgtaat gacacaatcc 7200
gaaagtcgct agcaacacac actctctaca caaactaacc cagctctggt accatggcca 7260
tcatccactc caccggaact ctgcccatct tcaacggtac cgtcaccgat tacctgcgaa 7320
caaagccttc ttactcgtcc acagatccag cctacatcga cgtggttaca ggcaactcta 7380
tcagctactc cgaggtctgg aagcttgccg accgactctc ctctgctctg tacaacgact 7440
acggactcac cgacgccaag cccgacgaga atgtgggtcc tgttgtcatg ctgcacgctg 7500
tcaattcgcc tctcctggca tctgttcact acgctcttct ggatctgggc gtcacaatca 7560
ctcccgcagc tgccacctac gaggctggcg atctcgcaca tcaaatcaag gtgtgctctc 7620
cgtccctggt catttgcaac cagcagttcg aacccaaggt caaatctgcc tccagcaaca 7680
ccaagctcat tttcatcgag gatctgctca aaacccagtc gtctgctccc tggaaaaagt 7740
tcactacctc caaccccaac cgagttgcct acctgggcat gtccagtgga acctctggtc 7800
tccccaaggc ggttcaacag acccacatca acatgtcgtc ttccaccgaa gccgtcattt 7860
cctctcagac catcttcagc gctcgaaaga acgtcaccgc agccattgtg cccatgactc 7920
atgtctacgg actcaccaag tttgttttcc actctgtcgc aggctcaatg accaccgttg 7980
tgttccccaa gttctccctg gtcgacctcc tggaggccca gatcaagtac aagatcaaca 8040
ttctgtatct ggttcctcca gtggtcttgg ctctggccaa ggactctcgt gtacagccct 8100
acatcaagtc catttgcgag ctcaccactc tgattgccac tggtgcggct ccccttcctc 8160
ccactgcagg cgacgccctt ctggagcgac ttacgggcaa caaagaggga aacagagaca 8220
acggtatgga tcccttggtt ctcatccagg gctacggact cacagagact ctccaggtgt 8280
ctgtcttcaa gccagaggat cccgaacgag atctcaagac cgtgggcaaa ctgcttccca 8340
acaccgaggt tcgaattgtc ggcgagaagg gagatgttcc gcgttccaaa tggtcgtttg 8400
tcactcctcc aaccggcgaa atctacattc gaggtcccca cgtgactcct ggttacttca 8460
acaacgactc tgccaactct gagtcctttg acggcgagtg gctcaagacc ggcgatatcg 8520
gatacatgga cctggaaggt cgactcacca ttgtggaccg aaacaaggag atgatcaagg 8580
tcaacggacg tcaggttgct cctgccgaga tcgaatctgt gctgctgggt catcctatgg 8640
tcaaggatgt ggccgtcatt ggagtcacca atcccgacag aggcacggag tctgctcggg 8700
cgtttcttgt tactgaagct cgagctctcc ctgtcatcaa gcagtggttt gaccgtcgag 8760
ttccctccta caagcgactt tacggaggca ttgtggttgt cgatgccatt cccaagtctg 8820
cctcgggcaa gattctgcga cgggtcctca gagagcgaaa gggcgactcc gtgtttggag 8880
agtatgtcga ggaagtctaa gc 8902
<210> 64
<211> 9055
<212> DNA
<213> 人工序列
<220>
<223> 质粒pZP2-YlACoS-5Ps
<400> 64
ggccgcaagt gtggatgggg aagtgagtgc ccggttctgt gtgcacaatt ggcaatccaa 60
gatggatgga ttcaacacag ggatatagcg agctacgtgg tggtgcgagg atatagcaac 120
ggatatttat gtttgacact tgagaatgta cgatacaagc actgtccaag tacaatacta 180
aacatactgt acatactcat actcgtaccc gggcaacggt ttcacttgag tgcagtggct 240
agtgctctta ctcgtacagt gtgcaatact gcgtatcata gtctttgatg tatatcgtat 300
tcattcatgt tagttgcgta cgggcgtcgt tgcttgtgtg atttttgagg acccatccct 360
ttggtatata agtatactct ggggttaagg ttgcccgtgt agtctaggtt atagttttca 420
tgtgaaatac cgagagccga gggagaataa acgggggtat ttggacttgt ttttttcgcg 480
gaaaagcgtc gaatcaaccc tgcgggcctt gcaccatgtc cacgacgtgt ttctcgcccc 540
aattcgcccc ttgcacgtca aaattaggcc tccatctaga cccctccata acatgtgact 600
gtggggaaaa gtataaggga aaccatgcaa ccatagacga cgtgaaagac ggggaggaac 660
caatggaggc caaagaaatg gggtagcaac agtccaggag acagacaagg agacaaggag 720
agggcgcccg aaagatcgga aaaacaaaca tgtccaattg gggcagtgac ggaaacgaca 780
cggacacttc agtacaatgg accgaccatc tccaagccag ggttattccg gtatcacctt 840
ggccgtaacc tcccgctggt acctgatatt gtacacgttc acattcaata tactttcagc 900
tacaataaga gaggctgttt gtcgggcatg tgtgtccgtc gtatggggtg atgtccgagg 960
gcgaaattcg ctacaagctt aactctggcg cttgtccagt atgaatagac aagtcaagac 1020
cagtggtgcc atgattgaca gggaggtaca agacttcgat actcgagcat tactcggact 1080
tgtggcgatt gaacagacgg gcgatcgctt ctcccccgta ttgccggcgc gccagctgca 1140
ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt attgggcgct cttccgcttc 1200
ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat cagctcactc 1260
aaaggcggta atacggttat ccacagaatc aggggataac gcaggaaaga acatgtgagc 1320
aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag 1380
gctccgcccc cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc 1440
gacaggacta taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt 1500
tccgaccctg ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct 1560
ttctcatagc tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg 1620
ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct 1680
tgagtccaac ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat 1740
tagcagagcg aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg 1800
ctacactaga agaacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa 1860
aagagttggt agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt 1920
ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc 1980
tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt 2040
atcaaaaagg atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta 2100
aagtatatat gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat 2160
ctcagcgatc tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac 2220
tacgatacgg gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg 2280
ctcaccggct ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag 2340
tggtcctgca actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt 2400
aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt 2460
gtcacgctcg tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt 2520
tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt 2580
cagaagtaag ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct 2640
tactgtcatg ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt 2700
ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac gggataatac 2760
cgcgccacat agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa 2820
actctcaagg atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa 2880
ctgatcttca gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca 2940
aaatgccgca aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct 3000
ttttcaatat tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga 3060
atgtatttag aaaaataaac aaataggggt tccgcgcaca tttccccgaa aagtgccacc 3120
tgatgcggtg tgaaataccg cacagatgcg taaggagaaa ataccgcatc aggaaattgt 3180
aagcgttaat attttgttaa aattcgcgtt aaatttttgt taaatcagct cattttttaa 3240
ccaataggcc gaaatcggca aaatccctta taaatcaaaa gaatagaccg agatagggtt 3300
gagtgttgtt ccagtttgga acaagagtcc actattaaag aacgtggact ccaacgtcaa 3360
agggcgaaaa accgtctatc agggcgatgg cccactacgt gaaccatcac cctaatcaag 3420
ttttttgggg tcgaggtgcc gtaaagcact aaatcggaac cctaaaggga gcccccgatt 3480
tagagcttga cggggaaagc cggcgaacgt ggcgagaaag gaagggaaga aagcgaaagg 3540
agcgggcgct agggcgctgg caagtgtagc ggtcacgctg cgcgtaacca ccacacccgc 3600
cgcgcttaat gcgccgctac agggcgcgtc cattcgccat tcaggctgcg caactgttgg 3660
gaagggcgat cggtgcgggc ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct 3720
gcaaggcgat taagttgggt aacgccaggg ttttcccagt cacgacgttg taaaacgacg 3780
gccagtgaat tgtaatacga ctcactatag ggcgaattgg gcccgacgtc gcatgcgctg 3840
atgacacttt ggtctgaaag agatgcattt tgaatcccaa acttgcagtg cccaagtgac 3900
atacatctcc gcgttttgga aaatgttcag aaacagttga ttgtgttgga atggggaatg 3960
gggaatggaa aaatgactca agtatcaatt ccaaaaactt ctctggctgg cagtacctac 4020
tgtccatact actgcatttt ctccagtcag gccactctat actcgacgac acagtagtaa 4080
aacccagata atttcgacat aaacaagaaa acagacccaa taatatttat atatagtcag 4140
ccgtttgtcc agttcagact gtaatagccg aaaaaaaatc caaagtttct attctaggaa 4200
aatatattcc aatattttta attcttaatc tcatttattt tattctagcg aaatacattt 4260
cagctacttg agacatgtga tacccacaaa tcggattcgg actcggttgt tcagaagagc 4320
atatggcatt cgtgctcgct tgttcacgta ttcttcctgt tccatctctt ggccgacaat 4380
cacacaaaaa tggggttttt tttttaattc taatgattca ttacagcaaa attgagatat 4440
agcagaccac gtattccata atcaccaagg aagttcttgg gcgtcttaat taagtcatac 4500
acaagtcagc tttcttcgag cctcatataa gtataagtag ttcaacgtat tagcactgta 4560
cccagcatct ccgtatcgag aaacacaaca acatgcccca ttggacagat catgcggata 4620
cacaggttgt gcagtatcat acatactcga tcagacaggt cgtctgacca tcatacaagc 4680
tgaacaagcg ctccatactt gcacgctctc tatatacaca gttaaattac atatccatag 4740
tctaacctct aacagttaat cttctggtaa gcctcccagc cagccttctg gtatcgcttg 4800
gcctcctcaa taggatctcg gttctggccg tacagacctc ggccgacaat tatgatatcc 4860
gttccggtag acatgacatc ctcaacagtt cggtactgct gtccgagagc gtctcccttg 4920
tcgtcaagac ccaccccggg ggtcagaata agccagtcct cagagtcgcc cttaggtcgg 4980
ttctgggcaa tgaagccaac cacaaactcg gggtcggatc gggcaagctc aatggtctgc 5040
ttggagtact cgccagtggc cagagagccc ttgcaagaca gctcggccag catgagcaga 5100
cctctggcca gcttctcgtt gggagagggg actaggaact ccttgtactg ggagttctcg 5160
tagtcagaga cgtcctcctt cttctgttca gagacagttt cctcggcacc agctcgcagg 5220
ccagcaatga ttccggttcc gggtacaccg tgggcgttgg tgatatcgga ccactcggcg 5280
attcggtgac accggtactg gtgcttgaca gtgttgccaa tatctgcgaa ctttctgtcc 5340
tcgaacagga agaaaccgtg cttaagagca agttccttga gggggagcac agtgccggcg 5400
taggtgaagt cgtcaatgat gtcgatatgg gttttgatca tgcacacata aggtccgacc 5460
ttatcggcaa gctcaatgag ctccttggtg gtggtaacat ccagagaagc acacaggttg 5520
gttttcttgg ctgccacgag cttgagcact cgagcggcaa aggcggactt gtggacgtta 5580
gctcgagctt cgtaggaggg cattttggtg gtgaagagga gactgaaata aatttagtct 5640
gcagaacttt ttatcggaac cttatctggg gcagtgaagt atatgttatg gtaatagtta 5700
cgagttagtt gaacttatag atagactgga ctatacggct atcggtccaa attagaaaga 5760
acgtcaatgg ctctctgggc gtcgcctttg ccgacaaaaa tgtgatcatg atgaaagcca 5820
gcaatgacgt tgcagctgat attgttgtcg gccaaccgcg ccgaaaacgc agctgtcaga 5880
cccacagcct ccaacgaaga atgtatcgtc aaagtgatcc aagcacactc atagttggag 5940
tcgtactcca aaggcggcaa tgacgagtca gacagatact cgtcaaacgg taggttagtg 6000
cttggtatat gagttgtagg catgacaatt tggaaagggg tggactttgg gaatattgtg 6060
ggatttcaat accttagttt gtacagggta attgttacaa atgatacaaa gaactgtatt 6120
tcttttcatt tgttttaatt ggttgtatat caagtccgtt agacgagctc agtgccttgg 6180
cttttggcac tgtatttcat ttttagaggt acactacatt cagtgaggta tggtaaggtt 6240
gagggcataa tgaaggcacc ttgtactgac agtcacagac ctctcaccga gaattttatg 6300
agatatactc gggttcattt taggctcatc gattgccccg gagaagacgg ccaggccgcc 6360
tagatgacaa attcaacaac tcacagctga ctttctgcca ttgccactag gggggggcct 6420
ttttatatgg ccaagccaag ctctccacgt cggttgggct gcacccaaca ataaatgggt 6480
agggttgcac caacaaaggg atgggatggg gggtagaaga tacgaggata acggggctca 6540
atggcacaaa taagaacgaa tactgccatt aagactcgtg atccagcgac tgacaccatt 6600
gcatcatcta agggcctcaa aactacctcg gaactgctgc gctgatctgg acaccacaga 6660
ggttccgagc actttaggtt gcaccaaatg tcccaccagg tgcaggcaga aaacgctgga 6720
acagcgtgta cagtttgtct taacaaaaag tgagggcgct gaggtcgagc agggtggtgt 6780
gacttgttat agcctttaga gctgcgaaag cgcgtatgga tttggctcat caggccagat 6840
tgagggtctg tggacacatg tcatgttagt gtacttcaat cgccccctgg atatagcccc 6900
gacaataggc cgtggcctca tttttttgcc ttccgcacat ttccattgct cggtacccac 6960
accttgcttc tcctgcactt gccaacctta atactggttt acattgacca acatcttaca 7020
agcggggggc ttgtctaggg tatatataaa cagtggctct cccaatcggt tgccagtctc 7080
ttttttcctt tctttcccca cagattcgaa atctaaacta cacatcacag aattccgagc 7140
cgtgagtatc cacgacaaga tcagtgtcga gacgacgcgt tttgtgtaat gacacaatcc 7200
gaaagtcgct agcaacacac actctctaca caaactaacc cagctctggt accatggcct 7260
caatcattca caagtctcct gtgcccgacg ttcagctgtt ctacggttcc tggccagatc 7320
tcatgcgaac ctctcctcat gcccacaacg actccaaacc cgtggtcttt gacttcgata 7380
ccaagcagca acttacttgg aagcaggtct ggcaactcag cgctcgactc agagcccagc 7440
tgtaccacaa gtacggaatc ggcaaacccg gtgctcttgc acctttccac aacgatccct 7500
ctctcggaga cgtggtcatc ttctacactc ccaacaccta cagctcgttg ccctatcatc 7560
tggctcttca cgatctcgga gccaccattt ctcctgcctc cacatcttac gacgtcaagg 7620
acatttgcca tcagatcgtt actaccgatg cggtcgtggt tgtcgctgca gccgagaaat 7680
ccgagattgc tcgagaggcc gttcagctgt ctggtcgaga cgtcagagtt gtggtcatgg 7740
aggacctcat caacaatgct cccaccgttg cgcagaacga tatcgactcg gcacctcatg 7800
tgtccctgtc tcgggaccag gctcgagcca agattgcata cctgggcatg tcttccggta 7860
cgtctggcgg acttcccaag gctgttcgtc tcactcactt caacgttacc tcgaactgtc 7920
tgcaggtctc cgctgccgca cccaaccttg cccagaacgt ggttgccagc gccgtcattc 7980
caaccactca catctacggt ctcaccatgt ttctgtcggt tcttccctac aacggttccg 8040
tggtcattca tcacaagcaa ttcaacttgc gagatctgct cgaggctcag aagacataca 8100
aggtctctct gtggattctc gttcctcccg tcatcgtgca gcttgccaag aaccctatgg 8160
tcgacgagta cctggactcc attcgagccc atgtgcggtg catcgtctct ggagctgctc 8220
ctctcggtgg caatgtcgtg gatcaggttt cggttcgtct taccggcaac aaggaaggca 8280
ttctgcccaa cggagacaag ctcgtcattc atcaagccta cggtcttacc gagtcctctc 8340
ccatcgttgg aatgctcgat cctctgtcgg accacatcga cgtcatgact gtgggctgtc 8400
tcatgcccaa taccgaggct cgaattgtcg acgaagaggg aaacgatcag ccagcagtcc 8460
acgttaccga cacacgaggc atcggtgccg ctgtcaagcg aggcgagaag attccctccg 8520
gagaactctg gattcgaggt cctcagatca tggacggata ccacaagaac cccgagtcgt 8580
ctcgtgagtc cctggaaccc agcacagaga cctacggtct gcaacatttc caggacagat 8640
ggcttcgaac tggagacgtt gctgtcatcg acaccttcgg acgagtcatg gttgtggatc 8700
gaaccaagga gctcatcaag tccatgtctc gacaggttgc tcctgccgag ctcgaagctc 8760
ttctgctcaa ccatccttcc gtcaacgatg tggctgtcgt tggcgtccac aacgacgata 8820
atggcacaga gtcagcacga gcgtttgtcg ttcttcaacc aggcgacgcc tgtgatccta 8880
ctaccatcaa gcactggatg gaccagcaag ttccctccta caagcggctg tacggaggca 8940
ttgtggtcat cgacactgtt cccaagaatg cctctggcaa gattctgcga agactgcttc 9000
gacagcggag agacgatcga gtctggggtc tggccaaggt tgccaagctc taagc 9055
<210> 65
<211> 9043
<212> DNA
<213> 人工序列
<220>
<223> 质粒pZP2-YlACoS-6Ps
<400> 65
ggccgcaagt gtggatgggg aagtgagtgc ccggttctgt gtgcacaatt ggcaatccaa 60
gatggatgga ttcaacacag ggatatagcg agctacgtgg tggtgcgagg atatagcaac 120
ggatatttat gtttgacact tgagaatgta cgatacaagc actgtccaag tacaatacta 180
aacatactgt acatactcat actcgtaccc gggcaacggt ttcacttgag tgcagtggct 240
agtgctctta ctcgtacagt gtgcaatact gcgtatcata gtctttgatg tatatcgtat 300
tcattcatgt tagttgcgta cgggcgtcgt tgcttgtgtg atttttgagg acccatccct 360
ttggtatata agtatactct ggggttaagg ttgcccgtgt agtctaggtt atagttttca 420
tgtgaaatac cgagagccga gggagaataa acgggggtat ttggacttgt ttttttcgcg 480
gaaaagcgtc gaatcaaccc tgcgggcctt gcaccatgtc cacgacgtgt ttctcgcccc 540
aattcgcccc ttgcacgtca aaattaggcc tccatctaga cccctccata acatgtgact 600
gtggggaaaa gtataaggga aaccatgcaa ccatagacga cgtgaaagac ggggaggaac 660
caatggaggc caaagaaatg gggtagcaac agtccaggag acagacaagg agacaaggag 720
agggcgcccg aaagatcgga aaaacaaaca tgtccaattg gggcagtgac ggaaacgaca 780
cggacacttc agtacaatgg accgaccatc tccaagccag ggttattccg gtatcacctt 840
ggccgtaacc tcccgctggt acctgatatt gtacacgttc acattcaata tactttcagc 900
tacaataaga gaggctgttt gtcgggcatg tgtgtccgtc gtatggggtg atgtccgagg 960
gcgaaattcg ctacaagctt aactctggcg cttgtccagt atgaatagac aagtcaagac 1020
cagtggtgcc atgattgaca gggaggtaca agacttcgat actcgagcat tactcggact 1080
tgtggcgatt gaacagacgg gcgatcgctt ctcccccgta ttgccggcgc gccagctgca 1140
ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt attgggcgct cttccgcttc 1200
ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat cagctcactc 1260
aaaggcggta atacggttat ccacagaatc aggggataac gcaggaaaga acatgtgagc 1320
aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag 1380
gctccgcccc cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc 1440
gacaggacta taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt 1500
tccgaccctg ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct 1560
ttctcatagc tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg 1620
ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct 1680
tgagtccaac ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat 1740
tagcagagcg aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg 1800
ctacactaga agaacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa 1860
aagagttggt agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt 1920
ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc 1980
tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt 2040
atcaaaaagg atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta 2100
aagtatatat gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat 2160
ctcagcgatc tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac 2220
tacgatacgg gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg 2280
ctcaccggct ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag 2340
tggtcctgca actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt 2400
aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt 2460
gtcacgctcg tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt 2520
tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt 2580
cagaagtaag ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct 2640
tactgtcatg ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt 2700
ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac gggataatac 2760
cgcgccacat agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa 2820
actctcaagg atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa 2880
ctgatcttca gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca 2940
aaatgccgca aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct 3000
ttttcaatat tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga 3060
atgtatttag aaaaataaac aaataggggt tccgcgcaca tttccccgaa aagtgccacc 3120
tgatgcggtg tgaaataccg cacagatgcg taaggagaaa ataccgcatc aggaaattgt 3180
aagcgttaat attttgttaa aattcgcgtt aaatttttgt taaatcagct cattttttaa 3240
ccaataggcc gaaatcggca aaatccctta taaatcaaaa gaatagaccg agatagggtt 3300
gagtgttgtt ccagtttgga acaagagtcc actattaaag aacgtggact ccaacgtcaa 3360
agggcgaaaa accgtctatc agggcgatgg cccactacgt gaaccatcac cctaatcaag 3420
ttttttgggg tcgaggtgcc gtaaagcact aaatcggaac cctaaaggga gcccccgatt 3480
tagagcttga cggggaaagc cggcgaacgt ggcgagaaag gaagggaaga aagcgaaagg 3540
agcgggcgct agggcgctgg caagtgtagc ggtcacgctg cgcgtaacca ccacacccgc 3600
cgcgcttaat gcgccgctac agggcgcgtc cattcgccat tcaggctgcg caactgttgg 3660
gaagggcgat cggtgcgggc ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct 3720
gcaaggcgat taagttgggt aacgccaggg ttttcccagt cacgacgttg taaaacgacg 3780
gccagtgaat tgtaatacga ctcactatag ggcgaattgg gcccgacgtc gcatgcgctg 3840
atgacacttt ggtctgaaag agatgcattt tgaatcccaa acttgcagtg cccaagtgac 3900
atacatctcc gcgttttgga aaatgttcag aaacagttga ttgtgttgga atggggaatg 3960
gggaatggaa aaatgactca agtatcaatt ccaaaaactt ctctggctgg cagtacctac 4020
tgtccatact actgcatttt ctccagtcag gccactctat actcgacgac acagtagtaa 4080
aacccagata atttcgacat aaacaagaaa acagacccaa taatatttat atatagtcag 4140
ccgtttgtcc agttcagact gtaatagccg aaaaaaaatc caaagtttct attctaggaa 4200
aatatattcc aatattttta attcttaatc tcatttattt tattctagcg aaatacattt 4260
cagctacttg agacatgtga tacccacaaa tcggattcgg actcggttgt tcagaagagc 4320
atatggcatt cgtgctcgct tgttcacgta ttcttcctgt tccatctctt ggccgacaat 4380
cacacaaaaa tggggttttt tttttaattc taatgattca ttacagcaaa attgagatat 4440
agcagaccac gtattccata atcaccaagg aagttcttgg gcgtcttaat taagtcatac 4500
acaagtcagc tttcttcgag cctcatataa gtataagtag ttcaacgtat tagcactgta 4560
cccagcatct ccgtatcgag aaacacaaca acatgcccca ttggacagat catgcggata 4620
cacaggttgt gcagtatcat acatactcga tcagacaggt cgtctgacca tcatacaagc 4680
tgaacaagcg ctccatactt gcacgctctc tatatacaca gttaaattac atatccatag 4740
tctaacctct aacagttaat cttctggtaa gcctcccagc cagccttctg gtatcgcttg 4800
gcctcctcaa taggatctcg gttctggccg tacagacctc ggccgacaat tatgatatcc 4860
gttccggtag acatgacatc ctcaacagtt cggtactgct gtccgagagc gtctcccttg 4920
tcgtcaagac ccaccccggg ggtcagaata agccagtcct cagagtcgcc cttaggtcgg 4980
ttctgggcaa tgaagccaac cacaaactcg gggtcggatc gggcaagctc aatggtctgc 5040
ttggagtact cgccagtggc cagagagccc ttgcaagaca gctcggccag catgagcaga 5100
cctctggcca gcttctcgtt gggagagggg actaggaact ccttgtactg ggagttctcg 5160
tagtcagaga cgtcctcctt cttctgttca gagacagttt cctcggcacc agctcgcagg 5220
ccagcaatga ttccggttcc gggtacaccg tgggcgttgg tgatatcgga ccactcggcg 5280
attcggtgac accggtactg gtgcttgaca gtgttgccaa tatctgcgaa ctttctgtcc 5340
tcgaacagga agaaaccgtg cttaagagca agttccttga gggggagcac agtgccggcg 5400
taggtgaagt cgtcaatgat gtcgatatgg gttttgatca tgcacacata aggtccgacc 5460
ttatcggcaa gctcaatgag ctccttggtg gtggtaacat ccagagaagc acacaggttg 5520
gttttcttgg ctgccacgag cttgagcact cgagcggcaa aggcggactt gtggacgtta 5580
gctcgagctt cgtaggaggg cattttggtg gtgaagagga gactgaaata aatttagtct 5640
gcagaacttt ttatcggaac cttatctggg gcagtgaagt atatgttatg gtaatagtta 5700
cgagttagtt gaacttatag atagactgga ctatacggct atcggtccaa attagaaaga 5760
acgtcaatgg ctctctgggc gtcgcctttg ccgacaaaaa tgtgatcatg atgaaagcca 5820
gcaatgacgt tgcagctgat attgttgtcg gccaaccgcg ccgaaaacgc agctgtcaga 5880
cccacagcct ccaacgaaga atgtatcgtc aaagtgatcc aagcacactc atagttggag 5940
tcgtactcca aaggcggcaa tgacgagtca gacagatact cgtcaaacgg taggttagtg 6000
cttggtatat gagttgtagg catgacaatt tggaaagggg tggactttgg gaatattgtg 6060
ggatttcaat accttagttt gtacagggta attgttacaa atgatacaaa gaactgtatt 6120
tcttttcatt tgttttaatt ggttgtatat caagtccgtt agacgagctc agtgccttgg 6180
cttttggcac tgtatttcat ttttagaggt acactacatt cagtgaggta tggtaaggtt 6240
gagggcataa tgaaggcacc ttgtactgac agtcacagac ctctcaccga gaattttatg 6300
agatatactc gggttcattt taggctcatc gattgccccg gagaagacgg ccaggccgcc 6360
tagatgacaa attcaacaac tcacagctga ctttctgcca ttgccactag gggggggcct 6420
ttttatatgg ccaagccaag ctctccacgt cggttgggct gcacccaaca ataaatgggt 6480
agggttgcac caacaaaggg atgggatggg gggtagaaga tacgaggata acggggctca 6540
atggcacaaa taagaacgaa tactgccatt aagactcgtg atccagcgac tgacaccatt 6600
gcatcatcta agggcctcaa aactacctcg gaactgctgc gctgatctgg acaccacaga 6660
ggttccgagc actttaggtt gcaccaaatg tcccaccagg tgcaggcaga aaacgctgga 6720
acagcgtgta cagtttgtct taacaaaaag tgagggcgct gaggtcgagc agggtggtgt 6780
gacttgttat agcctttaga gctgcgaaag cgcgtatgga tttggctcat caggccagat 6840
tgagggtctg tggacacatg tcatgttagt gtacttcaat cgccccctgg atatagcccc 6900
gacaataggc cgtggcctca tttttttgcc ttccgcacat ttccattgct cggtacccac 6960
accttgcttc tcctgcactt gccaacctta atactggttt acattgacca acatcttaca 7020
agcggggggc ttgtctaggg tatatataaa cagtggctct cccaatcggt tgccagtctc 7080
ttttttcctt tctttcccca cagattcgaa atctaaacta cacatcacag aattccgagc 7140
cgtgagtatc cacgacaaga tcagtgtcga gacgacgcgt tttgtgtaat gacacaatcc 7200
gaaagtcgct agcaacacac actctctaca caaactaacc cagctctggt accatggcca 7260
cacagattat ccacaacgcc accatcccca atatccccgt cgaccagctc tacgacggca 7320
agatcaccga cttcattcga tccggaggcc actccaacga aaccaagcct tctgtcatcg 7380
acgccaagac aggccagact ctctcccagg cggaaatgtg gcagctgtcg gacaagtacg 7440
cggcacttct cagctctcag tacggtctgt gccgacacag agacaacgag ctggacccat 7500
ctatgggaga tgtgctcatc accttctttg gaaacgttat cctcgctcct gtggtccatt 7560
gggctgccct cgacctcgga gcaaccattt ctcctggatc cacaggctac tctgcccagg 7620
atctcgctca ccagttccga gtcaccactc ccaaggtcgt tgtgtacgcc aaggcgttca 7680
aggatgtggt ggacgaggct acgaagctgt acaactcccc aaaccctcca gcacttgtcg 7740
agctcgaggc gctggacaag caggcccgaa tggttggaaa ccacaaggtc gaacacaccc 7800
gaaagatcaa gctggctcct cacgagtccc gaactcggat cgcgtacctt ggcatgtctt 7860
caggtacctc cggtggagtt tcaaaggctg tccgactcac ccattccaat ctcacgtcgt 7920
gttccgaaat ctcgaacaaa gcctccgagt ctctcgcaac tgaccagcag atcgctgccg 7980
ccatcattcc cgtgagtcat ctgtttggac tgtccaagtt cctcattggc aaccctcacg 8040
ccggagccac cactgtctat cacaatggct tcgatctgat cgaggtgctg gaggcacaga 8100
agaaatacaa agtcaactcg tggaccctgg ttcctcccat cattgtcctg ctcaccaaac 8160
accccattgt cgagaagtac attccttctc tccgtgccca catgcgagcc atcctctccg 8220
gagctgctcc tctgggtgcc aatgtcacag aggctcttct cacccgagtc actggcaaca 8280
agtttggcga gtctcccgag ggcggtctgc gaatcgttca gggctacgga cttacagaga 8340
cgtctcccgt tgccactctg tttgaccccg aagacaagga acgacacatt cggtcgtgtg 8400
gaaagctcgt gcccaactct caggttcgaa ttgtcaacga agacggcgtg gatcagcctg 8460
cctacgatgt ggaccccaac gagctggacg aggccatcaa acagggcact ctgccagtcg 8520
gagagctttg gatcagaggt ccccaggtta tggacggcta ccataacaac cccgaggcca 8580
acgaagcctg tttcgtcaag gctgacgatg ctgaagcaga tactgcctac tacaacagac 8640
actggttccg aaccggagac gttgctctgg tcgacaagca gggcagatac atgattgtgg 8700
accgaaccaa ggagatgatc aagagtcagg gtaagcaggt tgctcctgcc gagctcgaag 8760
acatgctcct gggacacgca caggtggcag ataccgcagt catcggtatt caggacgtgg 8820
agaagggtaa cgaggctcct cgagcttttg ttgtgctcaa ggacccgaag tacgacgctg 8880
tggagatcaa gacatggctg gacaagcagc ttcccaagta caagcagctt catgctggca 8940
tcgtggtcat tgatgccatt cccaagaacg ccagtggcaa gattctgcga cgtctgttgc 9000
gtgctagaaa ggacgatgtt gttctgggtc tcaacaagta agc 9043
<210> 66
<211> 9067
<212> DNA
<213> 人工序列
<220>
<223> 质粒pZP2-YlACoS-10Ps
<400> 66
ggccgcaagt gtggatgggg aagtgagtgc ccggttctgt gtgcacaatt ggcaatccaa 60
gatggatgga ttcaacacag ggatatagcg agctacgtgg tggtgcgagg atatagcaac 120
ggatatttat gtttgacact tgagaatgta cgatacaagc actgtccaag tacaatacta 180
aacatactgt acatactcat actcgtaccc gggcaacggt ttcacttgag tgcagtggct 240
agtgctctta ctcgtacagt gtgcaatact gcgtatcata gtctttgatg tatatcgtat 300
tcattcatgt tagttgcgta cgggcgtcgt tgcttgtgtg atttttgagg acccatccct 360
ttggtatata agtatactct ggggttaagg ttgcccgtgt agtctaggtt atagttttca 420
tgtgaaatac cgagagccga gggagaataa acgggggtat ttggacttgt ttttttcgcg 480
gaaaagcgtc gaatcaaccc tgcgggcctt gcaccatgtc cacgacgtgt ttctcgcccc 540
aattcgcccc ttgcacgtca aaattaggcc tccatctaga cccctccata acatgtgact 600
gtggggaaaa gtataaggga aaccatgcaa ccatagacga cgtgaaagac ggggaggaac 660
caatggaggc caaagaaatg gggtagcaac agtccaggag acagacaagg agacaaggag 720
agggcgcccg aaagatcgga aaaacaaaca tgtccaattg gggcagtgac ggaaacgaca 780
cggacacttc agtacaatgg accgaccatc tccaagccag ggttattccg gtatcacctt 840
ggccgtaacc tcccgctggt acctgatatt gtacacgttc acattcaata tactttcagc 900
tacaataaga gaggctgttt gtcgggcatg tgtgtccgtc gtatggggtg atgtccgagg 960
gcgaaattcg ctacaagctt aactctggcg cttgtccagt atgaatagac aagtcaagac 1020
cagtggtgcc atgattgaca gggaggtaca agacttcgat actcgagcat tactcggact 1080
tgtggcgatt gaacagacgg gcgatcgctt ctcccccgta ttgccggcgc gccagctgca 1140
ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt attgggcgct cttccgcttc 1200
ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat cagctcactc 1260
aaaggcggta atacggttat ccacagaatc aggggataac gcaggaaaga acatgtgagc 1320
aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag 1380
gctccgcccc cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc 1440
gacaggacta taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt 1500
tccgaccctg ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct 1560
ttctcatagc tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg 1620
ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct 1680
tgagtccaac ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat 1740
tagcagagcg aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg 1800
ctacactaga agaacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa 1860
aagagttggt agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt 1920
ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc 1980
tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt 2040
atcaaaaagg atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta 2100
aagtatatat gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat 2160
ctcagcgatc tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac 2220
tacgatacgg gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg 2280
ctcaccggct ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag 2340
tggtcctgca actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt 2400
aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt 2460
gtcacgctcg tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt 2520
tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt 2580
cagaagtaag ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct 2640
tactgtcatg ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt 2700
ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac gggataatac 2760
cgcgccacat agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa 2820
actctcaagg atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa 2880
ctgatcttca gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca 2940
aaatgccgca aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct 3000
ttttcaatat tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga 3060
atgtatttag aaaaataaac aaataggggt tccgcgcaca tttccccgaa aagtgccacc 3120
tgatgcggtg tgaaataccg cacagatgcg taaggagaaa ataccgcatc aggaaattgt 3180
aagcgttaat attttgttaa aattcgcgtt aaatttttgt taaatcagct cattttttaa 3240
ccaataggcc gaaatcggca aaatccctta taaatcaaaa gaatagaccg agatagggtt 3300
gagtgttgtt ccagtttgga acaagagtcc actattaaag aacgtggact ccaacgtcaa 3360
agggcgaaaa accgtctatc agggcgatgg cccactacgt gaaccatcac cctaatcaag 3420
ttttttgggg tcgaggtgcc gtaaagcact aaatcggaac cctaaaggga gcccccgatt 3480
tagagcttga cggggaaagc cggcgaacgt ggcgagaaag gaagggaaga aagcgaaagg 3540
agcgggcgct agggcgctgg caagtgtagc ggtcacgctg cgcgtaacca ccacacccgc 3600
cgcgcttaat gcgccgctac agggcgcgtc cattcgccat tcaggctgcg caactgttgg 3660
gaagggcgat cggtgcgggc ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct 3720
gcaaggcgat taagttgggt aacgccaggg ttttcccagt cacgacgttg taaaacgacg 3780
gccagtgaat tgtaatacga ctcactatag ggcgaattgg gcccgacgtc gcatgcgctg 3840
atgacacttt ggtctgaaag agatgcattt tgaatcccaa acttgcagtg cccaagtgac 3900
atacatctcc gcgttttgga aaatgttcag aaacagttga ttgtgttgga atggggaatg 3960
gggaatggaa aaatgactca agtatcaatt ccaaaaactt ctctggctgg cagtacctac 4020
tgtccatact actgcatttt ctccagtcag gccactctat actcgacgac acagtagtaa 4080
aacccagata atttcgacat aaacaagaaa acagacccaa taatatttat atatagtcag 4140
ccgtttgtcc agttcagact gtaatagccg aaaaaaaatc caaagtttct attctaggaa 4200
aatatattcc aatattttta attcttaatc tcatttattt tattctagcg aaatacattt 4260
cagctacttg agacatgtga tacccacaaa tcggattcgg actcggttgt tcagaagagc 4320
atatggcatt cgtgctcgct tgttcacgta ttcttcctgt tccatctctt ggccgacaat 4380
cacacaaaaa tggggttttt tttttaattc taatgattca ttacagcaaa attgagatat 4440
agcagaccac gtattccata atcaccaagg aagttcttgg gcgtcttaat taagtcatac 4500
acaagtcagc tttcttcgag cctcatataa gtataagtag ttcaacgtat tagcactgta 4560
cccagcatct ccgtatcgag aaacacaaca acatgcccca ttggacagat catgcggata 4620
cacaggttgt gcagtatcat acatactcga tcagacaggt cgtctgacca tcatacaagc 4680
tgaacaagcg ctccatactt gcacgctctc tatatacaca gttaaattac atatccatag 4740
tctaacctct aacagttaat cttctggtaa gcctcccagc cagccttctg gtatcgcttg 4800
gcctcctcaa taggatctcg gttctggccg tacagacctc ggccgacaat tatgatatcc 4860
gttccggtag acatgacatc ctcaacagtt cggtactgct gtccgagagc gtctcccttg 4920
tcgtcaagac ccaccccggg ggtcagaata agccagtcct cagagtcgcc cttaggtcgg 4980
ttctgggcaa tgaagccaac cacaaactcg gggtcggatc gggcaagctc aatggtctgc 5040
ttggagtact cgccagtggc cagagagccc ttgcaagaca gctcggccag catgagcaga 5100
cctctggcca gcttctcgtt gggagagggg actaggaact ccttgtactg ggagttctcg 5160
tagtcagaga cgtcctcctt cttctgttca gagacagttt cctcggcacc agctcgcagg 5220
ccagcaatga ttccggttcc gggtacaccg tgggcgttgg tgatatcgga ccactcggcg 5280
attcggtgac accggtactg gtgcttgaca gtgttgccaa tatctgcgaa ctttctgtcc 5340
tcgaacagga agaaaccgtg cttaagagca agttccttga gggggagcac agtgccggcg 5400
taggtgaagt cgtcaatgat gtcgatatgg gttttgatca tgcacacata aggtccgacc 5460
ttatcggcaa gctcaatgag ctccttggtg gtggtaacat ccagagaagc acacaggttg 5520
gttttcttgg ctgccacgag cttgagcact cgagcggcaa aggcggactt gtggacgtta 5580
gctcgagctt cgtaggaggg cattttggtg gtgaagagga gactgaaata aatttagtct 5640
gcagaacttt ttatcggaac cttatctggg gcagtgaagt atatgttatg gtaatagtta 5700
cgagttagtt gaacttatag atagactgga ctatacggct atcggtccaa attagaaaga 5760
acgtcaatgg ctctctgggc gtcgcctttg ccgacaaaaa tgtgatcatg atgaaagcca 5820
gcaatgacgt tgcagctgat attgttgtcg gccaaccgcg ccgaaaacgc agctgtcaga 5880
cccacagcct ccaacgaaga atgtatcgtc aaagtgatcc aagcacactc atagttggag 5940
tcgtactcca aaggcggcaa tgacgagtca gacagatact cgtcaaacgg taggttagtg 6000
cttggtatat gagttgtagg catgacaatt tggaaagggg tggactttgg gaatattgtg 6060
ggatttcaat accttagttt gtacagggta attgttacaa atgatacaaa gaactgtatt 6120
tcttttcatt tgttttaatt ggttgtatat caagtccgtt agacgagctc agtgccttgg 6180
cttttggcac tgtatttcat ttttagaggt acactacatt cagtgaggta tggtaaggtt 6240
gagggcataa tgaaggcacc ttgtactgac agtcacagac ctctcaccga gaattttatg 6300
agatatactc gggttcattt taggctcatc gattgccccg gagaagacgg ccaggccgcc 6360
tagatgacaa attcaacaac tcacagctga ctttctgcca ttgccactag gggggggcct 6420
ttttatatgg ccaagccaag ctctccacgt cggttgggct gcacccaaca ataaatgggt 6480
agggttgcac caacaaaggg atgggatggg gggtagaaga tacgaggata acggggctca 6540
atggcacaaa taagaacgaa tactgccatt aagactcgtg atccagcgac tgacaccatt 6600
gcatcatcta agggcctcaa aactacctcg gaactgctgc gctgatctgg acaccacaga 6660
ggttccgagc actttaggtt gcaccaaatg tcccaccagg tgcaggcaga aaacgctgga 6720
acagcgtgta cagtttgtct taacaaaaag tgagggcgct gaggtcgagc agggtggtgt 6780
gacttgttat agcctttaga gctgcgaaag cgcgtatgga tttggctcat caggccagat 6840
tgagggtctg tggacacatg tcatgttagt gtacttcaat cgccccctgg atatagcccc 6900
gacaataggc cgtggcctca tttttttgcc ttccgcacat ttccattgct cggtacccac 6960
accttgcttc tcctgcactt gccaacctta atactggttt acattgacca acatcttaca 7020
agcggggggc ttgtctaggg tatatataaa cagtggctct cccaatcggt tgccagtctc 7080
ttttttcctt tctttcccca cagattcgaa atctaaacta cacatcacag aattccgagc 7140
cgtgagtatc cacgacaaga tcagtgtcga gacgacgcgt tttgtgtaat gacacaatcc 7200
gaaagtcgct agcaacacac actctctaca caaactaacc cagctctggt accatggcct 7260
ccgtcgctcc atcttccaac cccaatccga tccaccatct gtcgcgagtc gaagacgttc 7320
ctctctccca gacgttccga ggcaacatta ccgactttgt gcgatctgga ggctttgccg 7380
acgacgactc caagccctgt tgcatcgacg cgaagactgg ccaacaactt acacagaagc 7440
aagtctggga ctacgccgac aagttcagag cactgctcca tcacgacaac aatctgtgtc 7500
ctttcaatgc caacaccacc gatccagctc ttggagacgt catgatcacc ctcgtgccca 7560
accatctgtt cattacgtcg ctgcactttg ccgcactcga tctgggtgcg acagtttctc 7620
ctggctcggc tggatacact gtggccgagc tcgtcaacca gatcaatctt accggagctt 7680
ctctcatcgt gtacactcga cccgtcttca aggttgtgcg agaggcgctt gctcagatcg 7740
tggtaccagt caagatcgtg gagttcgagg gtctcatcga acgagccgag tttgttcaga 7800
gccacaagat tcagtccaca aagaaagtca cactttctcc tgaggagtcc tactcgagaa 7860
tcgcctacct gggcatgtct tcaggcacct ccggaggtct tcctaaggcc gttcgattgt 7920
cgcacttcaa catggcgagt tctgccgagc tctccaagcg agctgcacct tcgattgccg 7980
gatccgagca gatcgcaggt gccattatcc ctgtcaacca tgtgtatggt ctggccaagt 8040
tcctcattgc catgccaaag tccggagcca ccacagtctt ccactccaag ttcgacctca 8100
tcgagatcct cgaggctcaa cagaagtaca aggtcaacat gtacgccctt gttcctccca 8160
tcattgtcgt tctggccaag catcctgctg ttgagaagta catcccttcg ctgcgagaac 8220
accttcgata cgtgtcctct ggagctgcac ccctgggtgc caacgtcatc gaggcttgca 8280
acaagcgtct tgccggaact gcttctggcg agaacgagtt tggaggtctc aagattgttc 8340
agggctacgg tctcactgaa acctcccctg tggtctccac tttcgatccc aacgatcctg 8400
agcgacacgc tcggtcctgt ggcaagctgg ttcccaacac ccaggcacga atcgtgtcgg 8460
aggacggagt cgatcagcct gcctacgagc tcaaggacct gtctcagttg gaggccgagc 8520
tcaaaaaggg caaccttccc accggtgagt tgtggcttcg aggtccccag atcatggatg 8580
gctaccacaa gaacgacgag gccaacgctg agtcgtttgt cgacgccact gactacactt 8640
ccaacatgcc cttctacatg aagcggtggt tccgaactgg cgatgttgct ctcgtcgata 8700
ctctgggcag atacatgatt gtcgatcgaa ccaaagagat gatcaagagc atgagtaagc 8760
aggttgctcc tgccgagctg gaggacatcc tgcttggcca tccccaggta gccgatgctg 8820
ctgtcatcgg tgttcagcag gtggagaagg gcactgaggc tccccgagcg ttcgtggtgc 8880
ttcgagatcc caagttcgat gcagtggaga tcaaaaagtg gatggacgcc caggtgccca 8940
agtacaaaca acttcatgga ggtgtcgtgg ttctggatgc tgttcccaag aatgccagcg 9000
gcaagattct cagacgactg ctccgtcagc gagagaatga cgtcgttctt ggactcgaca 9060
agtaagc 9067
<210> 67
<211> 10109
<212> DNA
<213> 人工序列
<220>
<223> 质粒pZKL7A-FYlFAAs
<400> 67
ggccgcaagt gtggatgggg aagtgagtgc ccggttctgt gtgcacaatt ggcaatccaa 60
gatggatgga ttcaacacag ggatatagcg agctacgtgg tggtgcgagg atatagcaac 120
ggatatttat gtttgacact tgagaatgta cgatacaagc actgtccaag tacaatacta 180
aacatactgt acatactcat actcgtaccc gggcaacggt ttcacttgag tgcagtggct 240
agtgctctta ctcgtacagt gtgcaatact gcgtatcata gtctttgatg tatatcgtat 300
tcattcatgt tagttgattt aaatgtaacg aaactgaaca caagcttcca cacaacgtac 360
gatgtattta tacttgacag tgcgggtcgg aggaagttcg gttcgggcca ggtctgccaa 420
gttgactgtt actacgctaa tgcaatcata aggagaactg tagctaattc accgttgcag 480
ttagatctct cgaaggtgtc acgaaccatt atcatgtatg ctattgtaca ctgccctctg 540
tcctggtaag tgtgttattc caagtaagag ctcttcaatc atcctggaaa tgttcaaaga 600
agaaaaaacc ccgatatatt caactattct tgaaaggaaa tcatgaggga ggcaatgccc 660
actcgatttt gtgcttaaat gacagtgtcg tgcatcagtg tgatcctaac catatacagt 720
aattgtgtca agtgtcaggc ccctttcgtg cttgtacaag cctccaacag aagtaccgag 780
tcgcaaaatg gggtcaattg atgttctcac atgttggtcc tatgactctc ggtttcttca 840
acgagactac cctaagaagc gttacatgtg tggtcagggt ggtgtgtcat gtatagatac 900
agagcgagca cgactcacat ggagaacaac ttctgtaaga gcagagaaac cttaacagga 960
taataataaa taaatcgact cttcttgtga tgtcttttcg cttgttgtac cccacatttg 1020
tgatctgacg taaaagtggg cctgtgcttt gttatcgaga atcacatttc acactaatta 1080
gtgcacgact agtagcacgc agagttgcat gtcagtagtt attgtggatc ccgactactg 1140
tacggtatgt agttatgagc gacttatcat gaactagttt gctcgttatg gcgcgccagc 1200
tgcattaatg aatcggccaa cgcgcgggga gaggcggttt gcgtattggg cgctcttccg 1260
cttcctcgct cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc 1320
actcaaaggc ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt 1380
gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc 1440
ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa 1500
acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc 1560
ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg 1620
cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc 1680
tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc 1740
gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca 1800
ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact 1860
acggctacac tagaagaaca gtatttggta tctgcgctct gctgaagcca gttaccttcg 1920
gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt 1980
ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct 2040
tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga 2100
gattatcaaa aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa 2160
tctaaagtat atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac 2220
ctatctcagc gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga 2280
taactacgat acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc 2340
cacgctcacc ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca 2400
gaagtggtcc tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta 2460
gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg 2520
tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc 2580
gagttacatg atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg 2640
ttgtcagaag taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt 2700
ctcttactgt catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt 2760
cattctgaga atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata 2820
ataccgcgcc acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc 2880
gaaaactctc aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac 2940
ccaactgatc ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa 3000
ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct 3060
tcctttttca atattattga agcatttatc agggttattg tctcatgagc ggatacatat 3120
ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc 3180
cacctgatgc ggtgtgaaat accgcacaga tgcgtaagga gaaaataccg catcaggaaa 3240
ttgtaagcgt taatattttg ttaaaattcg cgttaaattt ttgttaaatc agctcatttt 3300
ttaaccaata ggccgaaatc ggcaaaatcc cttataaatc aaaagaatag accgagatag 3360
ggttgagtgt tgttccagtt tggaacaaga gtccactatt aaagaacgtg gactccaacg 3420
tcaaagggcg aaaaaccgtc tatcagggcg atggcccact acgtgaacca tcaccctaat 3480
caagtttttt ggggtcgagg tgccgtaaag cactaaatcg gaaccctaaa gggagccccc 3540
gatttagagc ttgacgggga aagccggcga acgtggcgag aaaggaaggg aagaaagcga 3600
aaggagcggg cgctagggcg ctggcaagtg tagcggtcac gctgcgcgta accaccacac 3660
ccgccgcgct taatgcgccg ctacagggcg cgtccattcg ccattcaggc tgcgcaactg 3720
ttgggaaggg cgatcggtgc gggcctcttc gctattacgc cagctggcga aagggggatg 3780
tgctgcaagg cgattaagtt gggtaacgcc agggttttcc cagtcacgac gttgtaaaac 3840
gacggccagt gaattgtaat acgactcact atagggcgaa ttgggcccga cgtcgcatgc 3900
tcaaatttca agactcatat cgagtctagt cggaacaggc gcgccagagt tgggttgggg 3960
acgatgtatg tccaggtacc ctgctcatac aagtacagta tatcctaggt gcaaaaaaag 4020
aaggtatttg tcttatatac cggtactagc acatgtgaat ctatgtttag tctcaagtat 4080
attcattaac atgccctcaa tcgtttctgt ttactttcag atactccttt ggtgcctatg 4140
gttccacaga atccacaatg atactgtaga aggggactac gtgaagtaga ataaaaccag 4200
cttttctgga aacttgtctg ttctatcacc tgttggtcat gtcagtttcc gcgttcttca 4260
cacccacccc cctaataata caacacaata aaatcattga aacaagagcg atgcgaccct 4320
cagtccagca aaccactctg gaaatattga gaaacaaaag acctacagta atacaattgt 4380
ggcatctata gaataggaaa tttaatatgt gcaactgtcc attctctcga cctgtacttc 4440
tacacgattg tcaaaagata ttatcatagt ctacagtaat ttatacagat tgaaagaggg 4500
tcattcaaat atggaagctg gtggtcaaag atcatcccca gtcactctct tctaccttct 4560
aaaagatggt ggaaccgttg gcaagacctc cgtagagcca agtaccttca aacttgcgcc 4620
ctctctccag atctcgacgt ccaatattga gagtgcataa agagatccag tcaaagtagg 4680
ccaggtggtt cttgacaatg tctaaccgag caagagcgtt aaagtccttt ctgtaacagc 4740
tcatactctt aattaagttg cgacacatgt cttgatagta tcttgaattc tctctcttga 4800
gcttttccat aacaagttct tctgcctcca ggaagtccat cggtggtttg atcatggttt 4860
tggtgtagtg gtagtgcagt ggtggtattg tgactgggga tgtagttgag aataagtcat 4920
acacaagtca gctttcttcg agcctcatat aagtataagt agttcaacgt attagcactg 4980
tacccagcat ctccgtatcg agaaacacaa caacatgccc cattggacag atcatgcgga 5040
tacacaggtt gtgcagtatc atacatactc gatcagacag gtcgtctgac catcatacaa 5100
gctgaacaag cgctccatac ttgcacgctc tctatataca cagttaaatt acatatccat 5160
agtctaacct ctaacagtta atcttctggt aagcctccca gccagccttc tggtatcgct 5220
tggcctcctc aataggatct cggttctggc cgtacagacc tcggccgaca attatgatat 5280
ccgttccggt agacatgaca tcctcaacag ttcggtactg ctgtccgaga gcgtctccct 5340
tgtcgtcaag acccaccccg ggggtcagaa taagccagtc ctcagagtcg cccttaggtc 5400
ggttctgggc aatgaagcca accacaaact cggggtcgga tcgggcaagc tcaatggtct 5460
gcttggagta ctcgccagtg gccagagagc ccttgcaaga cagctcggcc agcatgagca 5520
gacctctggc cagcttctcg ttgggagagg ggactaggaa ctccttgtac tgggagttct 5580
cgtagtcaga gacgtcctcc ttcttctgtt cagagacagt ttcctcggca ccagctcgca 5640
ggccagcaat gattccggtt ccgggtacac cgtgggcgtt ggtgatatcg gaccactcgg 5700
cgattcggtg acaccggtac tggtgcttga cagtgttgcc aatatctgcg aactttctgt 5760
cctcgaacag gaagaaaccg tgcttaagag caagttcctt gagggggagc acagtgccgg 5820
cgtaggtgaa gtcgtcaatg atgtcgatat gggttttgat catgcacaca taaggtccga 5880
ccttatcggc aagctcaatg agctccttgg tggtggtaac atccagagaa gcacacaggt 5940
tggttttctt ggctgccacg agcttgagca ctcgagcggc aaaggcggac ttgtggacgt 6000
tagctcgagc ttcgtaggag ggcattttgg tggtgaagag gagactgaaa taaatttagt 6060
ctgcagaact ttttatcgga accttatctg gggcagtgaa gtatatgtta tggtaatagt 6120
tacgagttag ttgaacttat agatagactg gactatacgg ctatcggtcc aaattagaaa 6180
gaacgtcaat ggctctctgg gcgtcgcctt tgccgacaaa aatgtgatca tgatgaaagc 6240
cagcaatgac gttgcagctg atattgttgt cggccaaccg cgccgaaaac gcagctgtca 6300
gacccacagc ctccaacgaa gaatgtatcg tcaaagtgat ccaagcacac tcatagttgg 6360
agtcgtactc caaaggcggc aatgacgagt cagacagata ctcgtcgacc ttttccttgg 6420
gaaccaccac cgtcagccct tctgactcac gtattgtagc caccgacaca ggcaacagtc 6480
cgtggatagc agaatatgtc ttgtcggtcc atttctcacc aactttaggc gtcaagtgaa 6540
tgttgcagaa gaagtatgtg ccttcattga gaatcggtgt tgctgatttc aataaagtct 6600
tgagatcagt ttggccagtc atgttgtggg gggtaattgg attgagttat cgcctacagt 6660
ctgtacaggt atactcgctg cccactttat actttttgat tccgctgcac ttgaagcaat 6720
gtcgtttacc aaaagtgaga atgctccaca gaacacaccc cagggtatgg ttgagcaaaa 6780
aataaacact ccgatacggg gaatcgaacc ccggtctcca cggttctcaa gaagtattct 6840
tgatgagagc gtatcgatga gcctaaaatg aacccgagta tatctcataa aattctcggt 6900
gagaggtctg tgactgtcag tacaaggtgc cttcattatg ccctcaacct taccatacct 6960
cactgaatgt agtgtacctc taaaaatgaa atacagtgcc aaaagccaag gcactgagct 7020
cgtctaacgg acttgatata caaccaatta aaacaaatga aaagaaatac agttctttgt 7080
atcatttgta acaattaccc tgtacaaact aaggtattga aatcccacaa tattcccaaa 7140
gtccacccct ttccaaattg tcatgcctac aactcatata ccaagcacta acctaccgtt 7200
taaacagtgt acgcagtact atagaggaac aattgccccg gagaagacgg ccaggccgcc 7260
tagatgacaa attcaacaac tcacagctga ctttctgcca ttgccactag gggggggcct 7320
ttttatatgg ccaagccaag ctctccacgt cggttgggct gcacccaaca ataaatgggt 7380
agggttgcac caacaaaggg atgggatggg gggtagaaga tacgaggata acggggctca 7440
atggcacaaa taagaacgaa tactgccatt aagactcgtg atccagcgac tgacaccatt 7500
gcatcatcta agggcctcaa aactacctcg gaactgctgc gctgatctgg acaccacaga 7560
ggttccgagc actttaggtt gcaccaaatg tcccaccagg tgcaggcaga aaacgctgga 7620
acagcgtgta cagtttgtct taacaaaaag tgagggcgct gaggtcgagc agggtggtgt 7680
gacttgttat agcctttaga gctgcgaaag cgcgtatgga tttggctcat caggccagat 7740
tgagggtctg tggacacatg tcatgttagt gtacttcaat cgccccctgg atatagcccc 7800
gacaataggc cgtggcctca tttttttgcc ttccgcacat ttccattgct cggtacccac 7860
accttgcttc tcctgcactt gccaacctta atactggttt acattgacca acatcttaca 7920
agcggggggc ttgtctaggg tatatataaa cagtggctct cccaatcggt tgccagtctc 7980
ttttttcctt tctttcccca cagattcgaa atctaaacta cacatcacac catggtcgga 8040
tacaccatct cctcgaagcc cgtgtccgtc gaggttggcc ccgccaagcc tggcgagact 8100
gctccccgac ggaacgtcat tgccaaggac gctcctgtgg tcttccccga caacgattcg 8160
tccctcacca ctgtctacaa gctgttcaaa aagtacgccg agatcaactc cgaacgaaag 8220
gctatgggat ggcgagacac catcgacatt cacgtggaga ccaagcaggt cacaaaggtg 8280
gtcgacggcg tggagaagaa agtgcccaag gaatggaagt acttcgagat gggtccttac 8340
aagtggctgt cctacaagga ggccctcaag ctggttcacg attatggagc tggtcttcga 8400
catctcggca tcaagcccaa agagaagatg cacatttacg cacagacctc tcaccgatgg 8460
atgctttccg gactggcctc tctctcgcag ggcattccca tcgtcactgc ctacgacacc 8520
cttggagagg aaggtctcac acgatctctg caggagacca actccgtcat catgttcacg 8580
gacaaggctc ttctgtcgtc tctcaaggtg tccctcaaaa agggcaccga tctgcgaatc 8640
attatctacg gaggcgacct gactcccgat gacaagaaag ccggaaacac cgagatcgac 8700
gccatcaagg agattgttcc agacatgaag atctacacta tggacgaggt tgtcgctctc 8760
ggtcgagagc atcctcaccc cgtggaagag gtcgactacg aggatctggc cttcatcatg 8820
tacacctctg gctccacagg agttcccaag ggtgtcgtgc tgcagcacaa gcagatcctc 8880
gcctctgtgg ccggtgtcac caagattatc gacagatcca ttatcggcaa tacagatcga 8940
ctgctcaact ttcttcccct cgcacacatc ttcgagtttg tgttcgagat ggtcaccttc 9000
tggtggggtg cctctctggg ctacggaact gtcaagacca tttccgacct gtcgatgaag 9060
aactgcaagg gagacatccg agagctcaag cccaccatca tggtcggcgt tccagctgtc 9120
tgggaaccca tgcggaaggg tattcttggc aaaatcaagg agctgtctcc tctcatgcag 9180
cgagtcttct gggcctcctt tgctgccaag caacgtctcg acgagaacgg acttcccggt 9240
ggctctattc tggattcgct catcttcaag aaagtcaagg acgccactgg aggctgtctc 9300
cgatacgtgt gcaacggagg tgctccagtt tccgtcgaca cccagaagtt cattactacc 9360
cttatctgtc ccatgctcat tggatgcggt ctgaccgaga ctacagccaa caccactatc 9420
atgtctccca agtcctatgc ctttggcacc attggagagc ctactgcagc cgtcaccctc 9480
aagcttatcg acgtgcccga agctggctac ttcgccgaga acaatcaggg agagctgtgc 9540
atcaagggca acgtggtcat gaaggagtat tacaagaacg aggaagagac caagaaagcg 9600
ttctccgacg atggctactt tctcaccgga gacattgccg agtggactgc caatggtcag 9660
cttcgaatta tcgacagacg aaagaacctc gtcaagaccc agaacggaga gtacattgct 9720
ctggagaagc tcgaaacaca gtaccgatcg tcttcctacg ttgccaacct gtgcgtctac 9780
gccgaccaga accgagtcaa gcccatcgct ctggtcattc ccaacgaggg tcctaccaaa 9840
aagcttgccc agagcttggg cgtggattcc gacgactggg atgccgtctg ttccaacaag 9900
aaagtggtca aggctgttct caaggacatg ctggataccg gacgatctct cggtctgtcc 9960
ggcatcgagc tgctgcaagg aatcgtgttg ctgcctggcg agtggactcc ccagaacagc 10020
tacctcaccg ctgcccagaa gctcaaccga aagaagattg tcgatgacaa caaaaaggag 10080
atcgacgagt gctacgagca gtcctaagc 10109
<210> 68
<211> 9037
<212> DNA
<213> 人工序列
<220>
<223> 质粒pZP2-YlACoS-5PS3s
<400> 68
ggccgcaagt gtggatgggg aagtgagtgc ccggttctgt gtgcacaatt ggcaatccaa 60
gatggatgga ttcaacacag ggatatagcg agctacgtgg tggtgcgagg atatagcaac 120
ggatatttat gtttgacact tgagaatgta cgatacaagc actgtccaag tacaatacta 180
aacatactgt acatactcat actcgtaccc gggcaacggt ttcacttgag tgcagtggct 240
agtgctctta ctcgtacagt gtgcaatact gcgtatcata gtctttgatg tatatcgtat 300
tcattcatgt tagttgcgta cgggcgtcgt tgcttgtgtg atttttgagg acccatccct 360
ttggtatata agtatactct ggggttaagg ttgcccgtgt agtctaggtt atagttttca 420
tgtgaaatac cgagagccga gggagaataa acgggggtat ttggacttgt ttttttcgcg 480
gaaaagcgtc gaatcaaccc tgcgggcctt gcaccatgtc cacgacgtgt ttctcgcccc 540
aattcgcccc ttgcacgtca aaattaggcc tccatctaga cccctccata acatgtgact 600
gtggggaaaa gtataaggga aaccatgcaa ccatagacga cgtgaaagac ggggaggaac 660
caatggaggc caaagaaatg gggtagcaac agtccaggag acagacaagg agacaaggag 720
agggcgcccg aaagatcgga aaaacaaaca tgtccaattg gggcagtgac ggaaacgaca 780
cggacacttc agtacaatgg accgaccatc tccaagccag ggttattccg gtatcacctt 840
ggccgtaacc tcccgctggt acctgatatt gtacacgttc acattcaata tactttcagc 900
tacaataaga gaggctgttt gtcgggcatg tgtgtccgtc gtatggggtg atgtccgagg 960
gcgaaattcg ctacaagctt aactctggcg cttgtccagt atgaatagac aagtcaagac 1020
cagtggtgcc atgattgaca gggaggtaca agacttcgat actcgagcat tactcggact 1080
tgtggcgatt gaacagacgg gcgatcgctt ctcccccgta ttgccggcgc gccagctgca 1140
ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt attgggcgct cttccgcttc 1200
ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat cagctcactc 1260
aaaggcggta atacggttat ccacagaatc aggggataac gcaggaaaga acatgtgagc 1320
aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag 1380
gctccgcccc cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc 1440
gacaggacta taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt 1500
tccgaccctg ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct 1560
ttctcatagc tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg 1620
ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct 1680
tgagtccaac ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat 1740
tagcagagcg aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg 1800
ctacactaga agaacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa 1860
aagagttggt agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt 1920
ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc 1980
tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt 2040
atcaaaaagg atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta 2100
aagtatatat gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat 2160
ctcagcgatc tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac 2220
tacgatacgg gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg 2280
ctcaccggct ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag 2340
tggtcctgca actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt 2400
aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt 2460
gtcacgctcg tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt 2520
tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt 2580
cagaagtaag ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct 2640
tactgtcatg ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt 2700
ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac gggataatac 2760
cgcgccacat agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa 2820
actctcaagg atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa 2880
ctgatcttca gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca 2940
aaatgccgca aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct 3000
ttttcaatat tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga 3060
atgtatttag aaaaataaac aaataggggt tccgcgcaca tttccccgaa aagtgccacc 3120
tgatgcggtg tgaaataccg cacagatgcg taaggagaaa ataccgcatc aggaaattgt 3180
aagcgttaat attttgttaa aattcgcgtt aaatttttgt taaatcagct cattttttaa 3240
ccaataggcc gaaatcggca aaatccctta taaatcaaaa gaatagaccg agatagggtt 3300
gagtgttgtt ccagtttgga acaagagtcc actattaaag aacgtggact ccaacgtcaa 3360
agggcgaaaa accgtctatc agggcgatgg cccactacgt gaaccatcac cctaatcaag 3420
ttttttgggg tcgaggtgcc gtaaagcact aaatcggaac cctaaaggga gcccccgatt 3480
tagagcttga cggggaaagc cggcgaacgt ggcgagaaag gaagggaaga aagcgaaagg 3540
agcgggcgct agggcgctgg caagtgtagc ggtcacgctg cgcgtaacca ccacacccgc 3600
cgcgcttaat gcgccgctac agggcgcgtc cattcgccat tcaggctgcg caactgttgg 3660
gaagggcgat cggtgcgggc ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct 3720
gcaaggcgat taagttgggt aacgccaggg ttttcccagt cacgacgttg taaaacgacg 3780
gccagtgaat tgtaatacga ctcactatag ggcgaattgg gcccgacgtc gcatgcgctg 3840
atgacacttt ggtctgaaag agatgcattt tgaatcccaa acttgcagtg cccaagtgac 3900
atacatctcc gcgttttgga aaatgttcag aaacagttga ttgtgttgga atggggaatg 3960
gggaatggaa aaatgactca agtatcaatt ccaaaaactt ctctggctgg cagtacctac 4020
tgtccatact actgcatttt ctccagtcag gccactctat actcgacgac acagtagtaa 4080
aacccagata atttcgacat aaacaagaaa acagacccaa taatatttat atatagtcag 4140
ccgtttgtcc agttcagact gtaatagccg aaaaaaaatc caaagtttct attctaggaa 4200
aatatattcc aatattttta attcttaatc tcatttattt tattctagcg aaatacattt 4260
cagctacttg agacatgtga tacccacaaa tcggattcgg actcggttgt tcagaagagc 4320
atatggcatt cgtgctcgct tgttcacgta ttcttcctgt tccatctctt ggccgacaat 4380
cacacaaaaa tggggttttt tttttaattc taatgattca ttacagcaaa attgagatat 4440
agcagaccac gtattccata atcaccaagg aagttcttgg gcgtcttaat taagtcatac 4500
acaagtcagc tttcttcgag cctcatataa gtataagtag ttcaacgtat tagcactgta 4560
cccagcatct ccgtatcgag aaacacaaca acatgcccca ttggacagat catgcggata 4620
cacaggttgt gcagtatcat acatactcga tcagacaggt cgtctgacca tcatacaagc 4680
tgaacaagcg ctccatactt gcacgctctc tatatacaca gttaaattac atatccatag 4740
tctaacctct aacagttaat cttctggtaa gcctcccagc cagccttctg gtatcgcttg 4800
gcctcctcaa taggatctcg gttctggccg tacagacctc ggccgacaat tatgatatcc 4860
gttccggtag acatgacatc ctcaacagtt cggtactgct gtccgagagc gtctcccttg 4920
tcgtcaagac ccaccccggg ggtcagaata agccagtcct cagagtcgcc cttaggtcgg 4980
ttctgggcaa tgaagccaac cacaaactcg gggtcggatc gggcaagctc aatggtctgc 5040
ttggagtact cgccagtggc cagagagccc ttgcaagaca gctcggccag catgagcaga 5100
cctctggcca gcttctcgtt gggagagggg actaggaact ccttgtactg ggagttctcg 5160
tagtcagaga cgtcctcctt cttctgttca gagacagttt cctcggcacc agctcgcagg 5220
ccagcaatga ttccggttcc gggtacaccg tgggcgttgg tgatatcgga ccactcggcg 5280
attcggtgac accggtactg gtgcttgaca gtgttgccaa tatctgcgaa ctttctgtcc 5340
tcgaacagga agaaaccgtg cttaagagca agttccttga gggggagcac agtgccggcg 5400
taggtgaagt cgtcaatgat gtcgatatgg gttttgatca tgcacacata aggtccgacc 5460
ttatcggcaa gctcaatgag ctccttggtg gtggtaacat ccagagaagc acacaggttg 5520
gttttcttgg ctgccacgag cttgagcact cgagcggcaa aggcggactt gtggacgtta 5580
gctcgagctt cgtaggaggg cattttggtg gtgaagagga gactgaaata aatttagtct 5640
gcagaacttt ttatcggaac cttatctggg gcagtgaagt atatgttatg gtaatagtta 5700
cgagttagtt gaacttatag atagactgga ctatacggct atcggtccaa attagaaaga 5760
acgtcaatgg ctctctgggc gtcgcctttg ccgacaaaaa tgtgatcatg atgaaagcca 5820
gcaatgacgt tgcagctgat attgttgtcg gccaaccgcg ccgaaaacgc agctgtcaga 5880
cccacagcct ccaacgaaga atgtatcgtc aaagtgatcc aagcacactc atagttggag 5940
tcgtactcca aaggcggcaa tgacgagtca gacagatact cgtcaaacgg taggttagtg 6000
cttggtatat gagttgtagg catgacaatt tggaaagggg tggactttgg gaatattgtg 6060
ggatttcaat accttagttt gtacagggta attgttacaa atgatacaaa gaactgtatt 6120
tcttttcatt tgttttaatt ggttgtatat caagtccgtt agacgagctc agtgccttgg 6180
cttttggcac tgtatttcat ttttagaggt acactacatt cagtgaggta tggtaaggtt 6240
gagggcataa tgaaggcacc ttgtactgac agtcacagac ctctcaccga gaattttatg 6300
agatatactc gggttcattt taggctcatc gattgccccg gagaagacgg ccaggccgcc 6360
tagatgacaa attcaacaac tcacagctga ctttctgcca ttgccactag gggggggcct 6420
ttttatatgg ccaagccaag ctctccacgt cggttgggct gcacccaaca ataaatgggt 6480
agggttgcac caacaaaggg atgggatggg gggtagaaga tacgaggata acggggctca 6540
atggcacaaa taagaacgaa tactgccatt aagactcgtg atccagcgac tgacaccatt 6600
gcatcatcta agggcctcaa aactacctcg gaactgctgc gctgatctgg acaccacaga 6660
ggttccgagc actttaggtt gcaccaaatg tcccaccagg tgcaggcaga aaacgctgga 6720
acagcgtgta cagtttgtct taacaaaaag tgagggcgct gaggtcgagc agggtggtgt 6780
gacttgttat agcctttaga gctgcgaaag cgcgtatgga tttggctcat caggccagat 6840
tgagggtctg tggacacatg tcatgttagt gtacttcaat cgccccctgg atatagcccc 6900
gacaataggc cgtggcctca tttttttgcc ttccgcacat ttccattgct cggtacccac 6960
accttgcttc tcctgcactt gccaacctta atactggttt acattgacca acatcttaca 7020
agcggggggc ttgtctaggg tatatataaa cagtggctct cccaatcggt tgccagtctc 7080
ttttttcctt tctttcccca cagattcgaa atctaaacta cacatcacag aattccgagc 7140
cgtgagtatc cacgacaaga tcagtgtcga gacgacgcgt tttgtgtaat gacacaatcc 7200
gaaagtcgct agcaacacac actctctaca caaactaacc cagctctggt accatggcct 7260
caatcattca caagtctcct gtgcccgacg ttcagctgtt ctacggttcc tggccagatc 7320
tcatgcgaac ctctcctcat gcccacaacg actccaaacc cgtggtcttt gacttcgata 7380
ccaagcagca acttacttgg aagcaggtct ggcaactcag cgctcgactc agagcccagc 7440
tgtaccacaa gtacggaatc ggcaaacccg gtgctcttgc acctttccac aacgatccct 7500
ctctcggaga cgtggtcatc ttctacactc ccaacaccta cagctcgttg ccctatcatc 7560
tggctcttca cgatctcgga gccaccattt ctcctgcctc cacatcttac gacgtcaagg 7620
acatttgcca tcagatcgtt actaccgatg cggtcgtggt tgtcgctgca gccgagaaat 7680
ccgagattgc tcgagaggcc gttcagctgt ctggtcgaga cgtcagagtt gtggtcatgg 7740
aggacctcat caacaatgct cccaccgttg cgcagaacga tatcgactcg gcacctcatg 7800
tgtccctgtc tcgggaccag gctcgagcca agattgcata cctgggcatg tcttccggta 7860
cgtctggcgg acttcccaag gctgttcgtc tcactcactt caacgttacc tcgaactgtc 7920
tgcaggtctc cgctgccgca cccaaccttg cccagaacgt ggttgccagc gccgtcattc 7980
caaccactca catctacggt ctcaccatgt ttctgtcggt tcttccctac aacggttccg 8040
tggtcattca tcacaagcaa ttcaacttgc gagatctgct cgaggctcag aagacataca 8100
aggtctctct gtggattctc gttcctcccg tcatcgtgca gcttgccaag aaccctatgg 8160
tcgacgagta cctggactcc attcgagccc atgtgcggtg catcgtctct ggagctgctc 8220
ctctcggtgg caatgtcgtg gatcaggttt cggttcgtct taccggcaac aaggaaggca 8280
ttctgcccaa cggagacaag ctcgtcattc atcaagccta cggtcttacc gagtcctctc 8340
ccatcgttgg aatgctcgat cctctgtcgg accacatcga cgtcatgact gtgggctgtc 8400
tcatgcccaa taccgaggct cgaattgtcg acgaagaggg aaacgatcag ccagcagtcc 8460
acgttaccga cacacgaggc atcggtgccg ctgtcaagcg aggcgagaag attccctccg 8520
gagaactctg gattcgaggt cctcagatca tggacggata ccacaagaac cccgagtcgt 8580
ctcgtgagtc cctggaaccc agcacagaga cctacggtct gcaacatttc caggacagat 8640
ggcttcgaac tggagacgtt gctgtcatcg acaccttcgg acgagtcatg gttgtggatc 8700
gaaccaagga gctcatcaag tccatgtctc gacaggttgc tcctgccgag ctcgaagctc 8760
ttctgctcaa ccatccttcc gtcaacgatg tggctgtcgt tggcgtccac aacgacgata 8820
atggcacaga gtcagcacga gcgtttgtcg ttcttcaacc aggcgacgcc tgtgatccta 8880
ctaccatcaa gcactggatg gaccagcaag ttccctccta caagcggctg tacggaggca 8940
ttgtggtcat cgacactgtt cccaagaatg cctctggcaa gattctgcga agactgcttc 9000
gacagcggag agacgatcga gtctggggtc tgtaagc 9037
<210> 69
<211> 3663
<212> DNA
<213> 人工序列
<220>
<223> pET23d质粒
<400> 69
atccggatat agttcctcct ttcagcaaaa aacccctcaa gacccgttta gaggccccaa 60
ggggttatgc tagttattgc tcagcggtgg cagcagccaa ctcagcttcc tttcgggctt 120
tgttagcagc cggatctcag tggtggtggt ggtggtgctc gagtgcggcc gcaagcttgt 180
cgacggagct cgaattcgga tccgacccat ttgctgtcca ccagtcatgc tagccatggt 240
atatctcctt cttaaagtta aacaaaatta tttctagagg gaaaccgttg tggtctccct 300
atagtgagtc gtattaattt cgcgggatcg agatctcggg cagcgttggg tcctggccac 360
gggtgcgcat gatcgtgctc ctgtcgttga ggacccggct aggctggcgg ggttgcctta 420
ctggttagca gaatgaatca ccgatacgcg agcgaacgtg aagcgactgc tgctgcaaaa 480
cgtctgcgac ctgagcaaca acatgaatgg tcttcggttt ccgtgtttcg taaagtctgg 540
aaacgcggaa gtcagcgccc tgcaccatta tgttccggat ctgcatcgca ggatgctgct 600
ggctaccctg tggaacacct acatctgtat taacgaagcg ctggcattga ccctgagtga 660
tttttctctg gtcccgccgc atccataccg ccagttgttt accctcacaa cgttccagta 720
accgggcatg ttcatcatca gtaacccgta tcgtgagcat cctctctcgt ttcatcggta 780
tcattacccc catgaacaga aatccccctt acacggaggc atcagtgacc aaacaggaaa 840
aaaccgccct taacatggcc cgctttatca gaagccagac attaacgctt ctggagaaac 900
tcaacgagct ggacgcggat gaacaggcag acatctgtga atcgcttcac gaccacgctg 960
atgagcttta ccgcagctgc ctcgcgcgtt tcggtgatga cggtgaaaac ctctgacaca 1020
tgcagctccc ggagacggtc acagcttgtc tgtaagcgga tgccgggagc agacaagccc 1080
gtcagggcgc gtcagcgggt gttggcgggt gtcggggcgc agccatgacc cagtcacgta 1140
gcgatagcgg agtgtatact ggcttaacta tgcggcatca gagcagattg tactgagagt 1200
gcaccatata tgcggtgtga aataccgcac agatgcgtaa ggagaaaata ccgcatcagg 1260
cgctcttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg 1320
gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga taacgcagga 1380
aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg 1440
gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag 1500
aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc 1560
gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg 1620
ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt 1680
cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc 1740
ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc 1800
actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg 1860
tggcctaact acggctacac tagaaggaca gtatttggta tctgcgctct gctgaagcca 1920
gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc 1980
ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat 2040
cctttgatct tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt 2100
ttggtcatga gattatcaaa aaggatcttc acctagatcc ttttaaatta aaaatgaagt 2160
tttaaatcaa tctaaagtat atatgagtaa acttggtctg acagttacca atgcttaatc 2220
agtgaggcac ctatctcagc gatctgtcta tttcgttcat ccatagttgc ctgactcccc 2280
gtcgtgtaga taactacgat acgggagggc ttaccatctg gccccagtgc tgcaatgata 2340
ccgcgagacc cacgctcacc ggctccagat ttatcagcaa taaaccagcc agccggaagg 2400
gccgagcgca gaagtggtcc tgcaacttta tccgcctcca tccagtctat taattgttgc 2460
cgggaagcta gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt tgccattgct 2520
gcaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc cggttcccaa 2580
cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa aagcggttag ctccttcggt 2640
cctccgatcg ttgtcagaag taagttggcc gcagtgttat cactcatggt tatggcagca 2700
ctgcataatt ctcttactgt catgccatcc gtaagatgct tttctgtgac tggtgagtac 2760
tcaaccaagt cattctgaga atagtgtatg cggcgaccga gttgctcttg cccggcgtca 2820
atacgggata ataccgcgcc acatagcaga actttaaaag tgctcatcat tggaaaacgt 2880
tcttcggggc gaaaactctc aaggatctta ccgctgttga gatccagttc gatgtaaccc 2940
actcgtgcac ccaactgatc ttcagcatct tttactttca ccagcgtttc tgggtgagca 3000
aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa atgttgaata 3060
ctcatactct tcctttttca atattattga agcatttatc agggttattg tctcatgagc 3120
ggatacatat ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg cacatttccc 3180
cgaaaagtgc cacctgaaat tgtaaacgtt aatattttgt taaaattcgc gttaaatttt 3240
tgttaaatca gctcattttt taaccaatag gccgaaatcg gcaaaatccc ttataaatca 3300
aaagaataga ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta 3360
aagaacgtgg actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta 3420
cgtgaaccat caccctaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg 3480
aaccctaaag ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga 3540
aaggaaggga agaaagcgaa aggagcgggc gctagggcgc tggcaagtgt agcggtcacg 3600
ctgcgcgtaa ccaccacacc cgccgcgctt aatgcgccgc tacagggcgc gtcccattcg 3660
cca 3663
<210> 70
<211> 12712
<212> DNA
<213> 人工序列
<220>
<223> pY157质粒
<400> 70
ttgagaagcc cattgtatat tattaggatc gtagcattat tgtggcaaaa aatattcaag 60
tgctcatgtg aattgacacg atcacgtaaa tacctggtga aattgctagt attcgtgatg 120
ttctaataca actctgttca atatttccgg cgctctcttg tatacaagag cacaagacat 180
gcaccccaca ttaaccgagg tcaagtgttt atgtatgaaa agtgacataa atcgtccaaa 240
aaaaagtagc acatagttgt atggctgtaa gttatgtgat tgtcagttct tcggccttcc 300
aactcctatg caccgtcttc aatcatctac ccccgtgccc cacaccccgc actattagag 360
tttatcacag tcagctaaac tgcttgcaca tctacacctc tgactacacc accatggatt 420
tcttcagacg gcaccagaaa aaggtgctgg cactggtagg tgtggcgctg agttcctacc 480
tgtttatcga ctatgtgaag aaaaagttct tcgagatcca gggtcgtttg agctcggagc 540
gaaccgctaa acagaatctc cggcgccgat ttgaacagaa ccagcaggat gcagatttta 600
caatcatggc tctgctatcc agcttgacga caccggtaat ggagcgttac cccgtcgacc 660
agatcaaggc agagttacag agcaagagac gccccacaga ccgggttttg gctctcgaga 720
gctccacctc gtcctcagct accgcacaaa ccgtgcccac catgacaagt ggcgccacag 780
aggagggcga gaagttaatt aactttggcc ggcctttacc tgcaggataa cttcgtataa 840
tgtatgctat acgaagttat gaattctctc tcttgagctt ttccataaca agttcttctg 900
cctccaggaa gtccatgggt ggtttgatca tggttttggt gtagtggtag tgcagtggtg 960
gtattgtgac tggggatgta gttgagaata agtcatacac aagtcagctt tcttcgagcc 1020
tcatataagt ataagtagtt caacgtatta gcactgtacc cagcatctcc gtatcgagaa 1080
acacaacaac atgccccatt ggacagatca tgcggataca caggttgtgc agtatcatac 1140
atactcgatc agacaggtcg tctgaccatc atacaagctg aacaagcgct ccatacttgc 1200
acgctctcta tatacacagt taaattacat atccatagtc taacctctaa cagttaatct 1260
tctggtaagc ctcccagcca gccttctggt atcgcttggc ctcctcaata ggatctcggt 1320
tctggccgta cagacctcgg ccgacaatta tgatatccgt tccggtagac atgacatcct 1380
caacagttcg gtactgctgt ccgagagcgt ctcccttgtc gtcaagaccc accccggggg 1440
tcagaataag ccagtcctca gagtcgccct taggtcggtt ctgggcaatg aagccaacca 1500
caaactcggg gtcggatcgg gcaagctcaa tggtctgctt ggagtactcg ccagtggcca 1560
gagagccctt gcaagacagc tcggccagca tgagcagacc tctggccagc ttctcgttgg 1620
gagaggggac taggaactcc ttgtactggg agttctcgta gtcagagacg tcctccttct 1680
tctgttcaga gacagtttcc tcggcaccag ctcgcaggcc agcaatgatt ccggttccgg 1740
gtacaccgtg ggcgttggtg atatcggacc actcggcgat tcggtgacac cggtactggt 1800
gcttgacagt gttgccaata tctgcgaact ttctgtcctc gaacaggaag aaaccgtgct 1860
taagagcaag ttccttgagg gggagcacag tgccggcgta ggtgaagtcg tcaatgatgt 1920
cgatatgggt tttgatcatg cacacataag gtccgacctt atcggcaagc tcaatgagct 1980
ccttggtggt ggtaacatcc agagaagcac acaggttggt tttcttggct gccacgagct 2040
tgagcactcg agcggcaaag gcggacttgt ggacgttagc tcgagcttcg taggagggca 2100
ttttggtggt gaagaggaga ctgaaataaa tttagtctgc agaacttttt atcggaacct 2160
tatctggggc agtgaagtat atgttatggt aatagttacg agttagttga acttatagat 2220
agactggact atacggctat cggtccaaat tagaaagaac gtcaatggct ctctgggcgt 2280
cgcctttgcc gacaaaaatg tgatcatgat gaaagccagc aatgacgttg cagctgatat 2340
tgttgtcggc caaccgcgcc gaaaacgcag ctgtcagacc cacagcctcc aacgaagaat 2400
gtatcgtcaa agtgatccaa gcacactcat agttggagtc gtactccaaa ggcggcaatg 2460
acgagtcaga cagatactcg tcgactcatc gatataactt cgtataatgt atgctatacg 2520
aagttatcct aggtatagat cttgcacttc ttattttctt cacgcgtttg cagctcaaca 2580
ttctaggacg acgaaactac gtcaacagtg ttgtcgctct ggcgcagcag ggccgagagg 2640
gtaatgccga gggtcgagtg gcgccctcgt ttggtgatct tgcagatatg ggctatttcg 2700
gcgacctttc aggctcgtcc agcttcggag aaactattgt cgatcccgat ctggacgaac 2760
agtaccttac cttttcgtgg tggctgctga acgagggatg ggtgtcgctg agcgagcgag 2820
tggaggaagc ggttcgtcga gtgtgggacc ccgtgtcacc caaggccgaa cttggatttg 2880
acgagttgtc ggaactcatt ggacgaacac agatgctcat tgatcgacct ctcaatccct 2940
cgtcgccact caactttctg agccagctgc tgccaccacg ggagcaggag gagtacgtgc 3000
ttgcccagaa ccccagcgat actgctgccc ccattgtagg acctaccctc cgacggcttc 3060
tggacgagac tgccgacttc atcgagtccc ctaatgccgc agaggtgatt gagcgacttg 3120
ttcactccgg tctctctgtg ttcatggaca agctggctgt cacgtttgga gccacacctg 3180
ctgattcggg ttcgccttat cctgtggtgc tgcctactgc aaaggtcaag ctgccctcca 3240
ttcttgccaa catggctcga caggctggag gcatggccca gggatcgccg ggcgtggaaa 3300
acgagtacat tgacgtgatg aaccaagtgc aggagctgac ctcctttagt gctgtggtct 3360
attcatcttt tgattgggct ctctagaggc tcattcacga aagacacgaa gaacgaagat 3420
ggggactgaa tacagcgctc tcatttgtac acaaatgatt tatgacagag taacttgtac 3480
atcatgtaga gcatacatac tgaaggtgtg atctcacggg atatcttgaa gaccactcgt 3540
agctggaggc ataggtagtg ctagtacgga tacttgcacc gtatccaaca taagtagagg 3600
agcctcctag tggctattgg tacaccgata aagatacaca tacatggcgc gccagctgca 3660
ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt attgggcgct cttccgcttc 3720
ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat cagctcactc 3780
aaaggcggta atacggttat ccacagaatc aggggataac gcaggaaaga acatgtgagc 3840
aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag 3900
gctccgcccc cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc 3960
gacaggacta taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt 4020
tccgaccctg ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct 4080
ttctcatagc tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg 4140
ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct 4200
tgagtccaac ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat 4260
tagcagagcg aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg 4320
ctacactaga agaacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa 4380
aagagttggt agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt 4440
ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc 4500
tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt 4560
atcaaaaagg atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta 4620
aagtatatat gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat 4680
ctcagcgatc tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac 4740
tacgatacgg gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg 4800
ctcaccggct ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag 4860
tggtcctgca actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt 4920
aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt 4980
gtcacgctcg tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt 5040
tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt 5100
cagaagtaag ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct 5160
tactgtcatg ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt 5220
ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac gggataatac 5280
cgcgccacat agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa 5340
actctcaagg atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa 5400
ctgatcttca gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca 5460
aaatgccgca aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct 5520
ttttcaatat tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga 5580
atgtatttag aaaaataaac aaataggggt tccgcgcaca tttccccgaa aagtgccacc 5640
tgatgcggtg tgaaataccg cacagatgcg taaggagaaa ataccgcatc aggaaattgt 5700
aagcgttaat attttgttaa aattcgcgtt aaatttttgt taaatcagct cattttttaa 5760
ccaataggcc gaaatcggca aaatccctta taaatcaaaa gaatagaccg agatagggtt 5820
gagtgttgtt ccagtttgga acaagagtcc actattaaag aacgtggact ccaacgtcaa 5880
agggcgaaaa accgtctatc agggcgatgg cccactacgt gaaccatcac cctaatcaag 5940
ttttttgggg tcgaggtgcc gtaaagcact aaatcggaac cctaaaggga gcccccgatt 6000
tagagcttga cggggaaagc cggcgaacgt ggcgagaaag gaagggaaga aagcgaaagg 6060
agcgggcgct agggcgctgg caagtgtagc ggtcacgctg cgcgtaacca ccacacccgc 6120
cgcgcttaat gcgccgctac agggcgcgtc cattcgccat tcaggctgcg caactgttgg 6180
gaagggcgat cggtgcgggc ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct 6240
gcaaggcgat taagttgggt aacgccaggg ttttcccagt cacgacgttg taaaacgacg 6300
gccagtgaat tgtaatacga ctcactatag ggcgaattgg gcccgacgtc gcatgcttga 6360
gaagcccatt gtatattatt aggatcgtag cattattgtg gcaaaaaata ttcaagtgct 6420
catgtgaatt gacacgatca cgtaaatacc tggtgaaatt gctagtattc gtgatgttct 6480
aatacaactc tgttcaatat ttccggcgct ctcttgtata caagagcaca agacatgcac 6540
cccacattaa ccgaggtcaa gtgtttatgt atgaaaagtg acataaatcg tccaaaaaaa 6600
agtagcacat agttgtatgg ctgtaagtta tgtgattgtc agttcttcgg ccttccaact 6660
cctatgcacc gtcttcaatc atctaccccc gtgccccaca ccccgcacta ttagagttta 6720
tcacagtcag ctaaactgct tgcacatcta cacctctgac tacaccacca tggatttctt 6780
cagacggcac cagaaaaagg tgctggcact ggtaggtgtg gcgctgagtt cctacctgtt 6840
tatcgactat gtgaagaaaa agttcttcga gatccagggt cgtttgagct cggagcgaac 6900
cgctaaacag aatctccggc gccgatttga acagaaccag caggatgcag attttacaat 6960
catggctctg ctatccagct tgacgacacc ggtaatggag cgttaccccg tcgaccagat 7020
caaggcagag ttacagagca agagacgccc cacagaccgg gttttggctc tcgagagctc 7080
cacctcgtcc tcagctaccg cacaaaccgt gcccaccatg acaagtggcg ccacagagga 7140
gggcgagaag ttaattaact ttggccggcc tttacctgca ggataacttc gtataatgta 7200
tgctatacga agttatgaat tctctctctt gagcttttcc ataacaagtt cttctgcctc 7260
caggaagtcc atgggtggtt tgatcatggt tttggtgtag tggtagtgca gtggtggtat 7320
tgtgactggg gatgtagttg agaataagtc atacacaagt cagctttctt cgagcctcat 7380
ataagtataa gtagttcaac gtattagcac tgtacccagc atctccgtat cgagaaacac 7440
aacaacatgc cccattggac agatcatgcg gatacacagg ttgtgcagta tcatacatac 7500
tcgatcagac aggtcgtctg accatcatac aagctgaaca agcgctccat acttgcacgc 7560
tctctatata cacagttaaa ttacatatcc atagtctaac ctctaacagt taatcttctg 7620
gtaagcctcc cagccagcct tctggtatcg cttggcctcc tcaataggat ctcggttctg 7680
gccgtacaga cctcggccga caattatgat atccgttccg gtagacatga catcctcaac 7740
agttcggtac tgctgtccga gagcgtctcc cttgtcgtca agacccaccc cgggggtcag 7800
aataagccag tcctcagagt cgcccttagg tcggttctgg gcaatgaagc caaccacaaa 7860
ctcggggtcg gatcgggcaa gctcaatggt ctgcttggag tactcgccag tggccagaga 7920
gcccttgcaa gacagctcgg ccagcatgag cagacctctg gccagcttct cgttgggaga 7980
ggggactagg aactccttgt actgggagtt ctcgtagtca gagacgtcct ccttcttctg 8040
ttcagagaca gtttcctcgg caccagctcg caggccagca atgattccgg ttccgggtac 8100
accgtgggcg ttggtgatat cggaccactc ggcgattcgg tgacaccggt actggtgctt 8160
gacagtgttg ccaatatctg cgaactttct gtcctcgaac aggaagaaac cgtgcttaag 8220
agcaagttcc ttgaggggga gcacagtgcc ggcgtaggtg aagtcgtcaa tgatgtcgat 8280
atgggttttg atcatgcaca cataaggtcc gaccttatcg gcaagctcaa tgagctcctt 8340
ggtggtggta acatccagag aagcacacag gttggttttc ttggctgcca cgagcttgag 8400
cactcgagcg gcaaaggcgg acttgtggac gttagctcga gcttcgtagg agggcatttt 8460
ggtggtgaag aggagactga aataaattta gtctgcagaa ctttttatcg gaaccttatc 8520
tggggcagtg aagtatatgt tatggtaata gttacgagtt agttgaactt atagatagac 8580
tggactatac ggctatcggt ccaaattaga aagaacgtca atggctctct gggcgtcgcc 8640
tttgccgaca aaaatgtgat catgatgaaa gccagcaatg acgttgcagc tgatattgtt 8700
gtcggccaac cgcgccgaaa acgcagctgt cagacccaca gcctccaacg aagaatgtat 8760
cgtcaaagtg atccaagcac actcatagtt ggagtcgtac tccaaaggcg gcaatgacga 8820
gtcagacaga tactcgtcga ctcatcgata taacttcgta taatgtatgc tatacgaagt 8880
tatcctaggt atagatcttg cacttcttat tttcttcacg cgtttgcagc tcaacattct 8940
aggacgacga aactacgtca acagtgttgt cgctctggcg cagcagggcc gagagggtaa 9000
tgccgagggt cgagtggcgc cctcgtttgg tgatcttgca gatatgggct atttcggcga 9060
cctttcaggc tcgtccagct tcggagaaac tattgtcgat cccgatctgg acgaacagta 9120
ccttaccttt tcgtggtggc tgctgaacga gggatgggtg tcgctgagcg agcgagtgga 9180
ggaagcggtt cgtcgagtgt gggaccccgt gtcacccaag gccgaacttg gatttgacga 9240
gttgtcggaa ctcattggac gaacacagat gctcattgat cgacctctca atccctcgtc 9300
gccactcaac tttctgagcc agctgctgcc accacgggag caggaggagt acgtgcttgc 9360
ccagaacccc agcgatactg ctgcccccat tgtaggacct accctccgac ggcttctgga 9420
cgagactgcc gacttcatcg agtcccctaa tgccgcagag gtgattgagc gacttgttca 9480
ctccggtctc tctgtgttca tggacaagct ggctgtcacg tttggagcca cacctgctga 9540
ttcgggttcg ccttatcctg tggtgctgcc tactgcaaag gtcaagctgc cctccattct 9600
tgccaacatg gctcgacagg ctggaggcat ggcccaggga tcgccgggcg tggaaaacga 9660
gtacattgac gtgatgaacc aagtgcagga gctgacctcc tttagtgctg tggtctattc 9720
atcttttgat tgggctctct agaggctcat tcacgaaaga cacgaagaac gaagatgggg 9780
actgaataca gcgctctcat ttgtacacaa atgatttatg acagagtaac ttgtacatca 9840
tgtagagcat acatactgaa ggtgtgatct cacgggatat cttgaagacc actcgtagct 9900
ggaggcatag gtagtgctag tacggatact tgcaccgtat ccaacataag tagaggagcc 9960
tcctagtggc tattggtaca ccgataaaga tacacataca tggcgcgcca gctgcattaa 10020
tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg ggcgctcttc cgcttcctcg 10080
ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag 10140
gcggtaatac ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa 10200
ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc 10260
cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca 10320
ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg 10380
accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct 10440
catagctcac gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt 10500
gtgcacgaac cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag 10560
tccaacccgg taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc 10620
agagcgaggt atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac 10680
actagaagaa cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga 10740
gttggtagct cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc 10800
aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg 10860
gggtctgacg ctcagtggaa cgaaaactca cgttaaggga ttttggtcat gagattatca 10920
aaaaggatct tcacctagat ccttttaaat taaaaatgaa gttttaaatc aatctaaagt 10980
atatatgagt aaacttggtc tgacagttac caatgcttaa tcagtgaggc acctatctca 11040
gcgatctgtc tatttcgttc atccatagtt gcctgactcc ccgtcgtgta gataactacg 11100
atacgggagg gcttaccatc tggccccagt gctgcaatga taccgcgaga cccacgctca 11160
ccggctccag atttatcagc aataaaccag ccagccggaa gggccgagcg cagaagtggt 11220
cctgcaactt tatccgcctc catccagtct attaattgtt gccgggaagc tagagtaagt 11280
agttcgccag ttaatagttt gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca 11340
cgctcgtcgt ttggtatggc ttcattcagc tccggttccc aacgatcaag gcgagttaca 11400
tgatccccca tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat cgttgtcaga 11460
agtaagttgg ccgcagtgtt atcactcatg gttatggcag cactgcataa ttctcttact 11520
gtcatgccat ccgtaagatg cttttctgtg actggtgagt actcaaccaa gtcattctga 11580
gaatagtgta tgcggcgacc gagttgctct tgcccggcgt caatacggga taataccgcg 11640
ccacatagca gaactttaaa agtgctcatc attggaaaac gttcttcggg gcgaaaactc 11700
tcaaggatct taccgctgtt gagatccagt tcgatgtaac ccactcgtgc acccaactga 11760
tcttcagcat cttttacttt caccagcgtt tctgggtgag caaaaacagg aaggcaaaat 11820
gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa tactcatact cttccttttt 11880
caatattatt gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt 11940
atttagaaaa ataaacaaat aggggttccg cgcacatttc cccgaaaagt gccacctgat 12000
gcggtgtgaa ataccgcaca gatgcgtaag gagaaaatac cgcatcagga aattgtaagc 12060
gttaatattt tgttaaaatt cgcgttaaat ttttgttaaa tcagctcatt ttttaaccaa 12120
taggccgaaa tcggcaaaat cccttataaa tcaaaagaat agaccgagat agggttgagt 12180
gttgttccag tttggaacaa gagtccacta ttaaagaacg tggactccaa cgtcaaaggg 12240
cgaaaaaccg tctatcaggg cgatggccca ctacgtgaac catcacccta atcaagtttt 12300
ttggggtcga ggtgccgtaa agcactaaat cggaacccta aagggagccc ccgatttaga 12360
gcttgacggg gaaagccggc gaacgtggcg agaaaggaag ggaagaaagc gaaaggagcg 12420
ggcgctaggg cgctggcaag tgtagcggtc acgctgcgcg taaccaccac acccgccgcg 12480
cttaatgcgc cgctacaggg cgcgtccatt cgccattcag gctgcgcaac tgttgggaag 12540
ggcgatcggt gcgggcctct tcgctattac gccagctggc gaaaggggga tgtgctgcaa 12600
ggcgattaag ttgggtaacg ccagggtttt cccagtcacg acgttgtaaa acgacggcca 12660
gtgaattgta atacgactca ctatagggcg aattgggccc gacgtcgcat gc 12712
<210> 71
<211> 1947
<212> DNA
<213> 人工序列
<220>
<223> PEX3敲除位点,包括LoxP侧翼的URA3
<400> 71
acagaccggg ttttggctct cgagagctcc acctcgtcct cagctaccgc acaaaccgtg 60
cccaccatga caagtggcgc cacagaggag ggcgagaagt taattaactt tggccggcct 120
ttacctgcag gataacttcg tataatgtat gctatacgaa gttatgaatt ctctctcttg 180
agcttttcca taacaagttc ttctgcctcc aggaagtcca tgggtggttt gatcatggtt 240
ttggtgtagt ggtagtgcag tggtggtatt gtgactgggg atgtagttga gaataagtca 300
tacacaagtc agctttcttc gagcctcata taagtataag tagttcaacg tattagcact 360
gtacccagca tctccgtatc gagaaacaca acaacatgcc ccattggaca gatcatgcgg 420
atacacaggt tgtgcagtat catacatact cgatcagaca ggtcgtctga ccatcataca 480
agctgaacaa gcgctccata cttgcacgct ctctatatac acagttaaat tacatatcca 540
tagtctaacc tctaacagtt aatcttctgg taagcctccc agccagcctt ctggtatcgc 600
ttggcctcct caataggatc tcggttctgg ccgtacagac ctcggccgac aattatgata 660
tccgttccgg tagacatgac atcctcaaca gttcggtact gctgtccgag agcgtctccc 720
ttgtcgtcaa gacccacccc gggggtcaga ataagccagt cctcagagtc gcccttaggt 780
cggttctggg caatgaagcc aaccacaaac tcggggtcgg atcgggcaag ctcaatggtc 840
tgcttggagt actcgccagt ggccagagag cccttgcaag acagctcggc cagcatgagc 900
agacctctgg ccagcttctc gttgggagag gggactagga actccttgta ctgggagttc 960
tcgtagtcag agacgtcctc cttcttctgt tcagagacag tttcctcggc accagctcgc 1020
aggccagcaa tgattccggt tccgggtaca ccgtgggcgt tggtgatatc ggaccactcg 1080
gcgattcggt gacaccggta ctggtgcttg acagtgttgc caatatctgc gaactttctg 1140
tcctcgaaca ggaagaaacc gtgcttaaga gcaagttcct tgagggggag cacagtgccg 1200
gcgtaggtga agtcgtcaat gatgtcgata tgggttttga tcatgcacac ataaggtccg 1260
accttatcgg caagctcaat gagctccttg gtggtggtaa catccagaga agcacacagg 1320
ttggttttct tggctgccac gagcttgagc actcgagcgg caaaggcgga cttgtggacg 1380
ttagctcgag cttcgtagga gggcattttg gtggtgaaga ggagactgaa ataaatttag 1440
tctgcagaac tttttatcgg aaccttatct ggggcagtga agtatatgtt atggtaatag 1500
ttacgagtta gttgaactta tagatagact ggactatacg gctatcggtc caaattagaa 1560
agaacgtcaa tggctctctg ggcgtcgcct ttgccgacaa aaatgtgatc atgatgaaag 1620
ccagcaatga cgttgcagct gatattgttg tcggccaacc gcgccgaaaa cgcagctgtc 1680
agacccacag cctccaacga agaatgtatc gtcaaagtga tccaagcaca ctcatagttg 1740
gagtcgtact ccaaaggcgg caatgacgag tcagacagat actcgtcgac tcatcgatat 1800
aacttcgtat aatgtatgct atacgaagtt atcctaggta tagatcttgc acttcttatt 1860
ttcttcacgc gtttgcagct caacattcta ggacgacgaa actacgtcaa cagtgttgtc 1920
gctctggcgc agcagggccg agagggt 1947
<210> 72
<211> 280
<212> DNA
<213> 人工序列
<220>
<223> PEX3敲除位点,包括单个LoxP (URA3被去除)
<400> 72
acagaccggg ttttggctct cgagagctcc acctcgtcct cagctaccgc acaaaccgtg 60
cccaccatga caagtggcgc cacagaggag ggcgagaagt taattaactt tggccggcct 120
ttacctgcag gataacttcg tataatgtat gctatacgaa gttatcctag gtatagatct 180
tgcacttctt attttcttca cgcgtttgca gctcaacatt ctaggacgac gaaactacgt 240
caacagtgtt gtcgctctgg cgcagcaggg ccgagagggt 280
<210> 73
<211> 5164
<212> DNA
<213> 人工序列
<220>
<223> pYRH146-Pox4KO质粒
<400> 73
cgcgccagct gcattaatga atcggccaac gcgcggggag aggcggtttg cgtattgggc 60
gctcttccgc ttcctcgctc actgactcgc tgcgctcggt cgttcggctg cggcgagcgg 120
tatcagctca ctcaaaggcg gtaatacggt tatccacaga atcaggggat aacgcaggaa 180
agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg 240
cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga 300
ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg 360
tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg 420
gaagcgtggc gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc 480
gctccaagct gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg 540
gtaactatcg tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca 600
ctggtaacag gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt 660
ggcctaacta cggctacact agaagaacag tatttggtat ctgcgctctg ctgaagccag 720
ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg 780
gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc 840
ctttgatctt ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt 900
tggtcatgag attatcaaaa aggatcttca cctagatcct tttaaattaa aaatgaagtt 960
ttaaatcaat ctaaagtata tatgagtaaa cttggtctga cagttaccaa tgcttaatca 1020
gtgaggcacc tatctcagcg atctgtctat ttcgttcatc catagttgcc tgactccccg 1080
tcgtgtagat aactacgata cgggagggct taccatctgg ccccagtgct gcaatgatac 1140
cgcgagaccc acgctcaccg gctccagatt tatcagcaat aaaccagcca gccggaaggg 1200
ccgagcgcag aagtggtcct gcaactttat ccgcctccat ccagtctatt aattgttgcc 1260
gggaagctag agtaagtagt tcgccagtta atagtttgcg caacgttgtt gccattgcta 1320
caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc attcagctcc ggttcccaac 1380
gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc 1440
ctccgatcgt tgtcagaagt aagttggccg cagtgttatc actcatggtt atggcagcac 1500
tgcataattc tcttactgtc atgccatccg taagatgctt ttctgtgact ggtgagtact 1560
caaccaagtc attctgagaa tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa 1620
tacgggataa taccgcgcca catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt 1680
cttcggggcg aaaactctca aggatcttac cgctgttgag atccagttcg atgtaaccca 1740
ctcgtgcacc caactgatct tcagcatctt ttactttcac cagcgtttct gggtgagcaa 1800
aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc gacacggaaa tgttgaatac 1860
tcatactctt cctttttcaa tattattgaa gcatttatca gggttattgt ctcatgagcg 1920
gatacatatt tgaatgtatt tagaaaaata aacaaatagg ggttccgcgc acatttcccc 1980
gaaaagtgcc acctgatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc 2040
atcaggaaat tgtaagcgtt aatattttgt taaaattcgc gttaaatttt tgttaaatca 2100
gctcattttt taaccaatag gccgaaatcg gcaaaatccc ttataaatca aaagaataga 2160
ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg 2220
actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta cgtgaaccat 2280
caccctaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag 2340
ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga 2400
agaaagcgaa aggagcgggc gctagggcgc tggcaagtgt agcggtcacg ctgcgcgtaa 2460
ccaccacacc cgccgcgctt aatgcgccgc tacagggcgc gtccattcgc cattcaggct 2520
gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa 2580
agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg 2640
ttgtaaaacg acggccagtg aattgtaata cgactcacta tagggcgaat tgggcccgac 2700
gtcgcgatcg cgagtatctg tctgactcgt cattgccgcc tttggagtac gactccaact 2760
atgagtgtgc ttggatcact ttgacgatac attcttcgtt ggaggctgtg ggtctgacag 2820
ctgcgttttc ggcgcggttg gccgacaaca atatcagctg caacgtcatt gctggctttc 2880
atcatgatca catttttgtc ggcaaaggcg acgcccagag agccattgac gttctttcta 2940
atttggaccg atagccgtat agtccagtct atctataagt tcaactaact cgtaactatt 3000
accataacat atacttcact gccccagata aggttccgat aaaaagttct gcagactaaa 3060
tttatttcag tctcctcttc accaccaaaa tgccctccta cgaagctcga gctaacgtcc 3120
acaagtccgc ctttgccgct cgagtgctca agctcgtggc agccaagaaa accaacctgt 3180
gtgcttctct ggatgttacc accaccaagg agctcattga gcttgccgat aaggtcggac 3240
cttatgtgtg catgatcaaa acccatatcg acatcattga cgacttcacc tacgccggca 3300
ctgtgctccc cctcaaggaa cttgctctta agcacggttt cttcctgttc gaggacagaa 3360
agttcgcaga tattggcaac actgtcaagc accagtaccg gtgtcaccga atcgccgagt 3420
ggtccgatat caccaacgcc cacggtgtac ccggaaccgg aatcattgct ggcctgcgag 3480
ctggtgccga ggaaactgtc tctgaacaga agaaggagga cgtctctgac tacgagaact 3540
cccagtacaa ggagttccta gtcccctctc ccaacgagaa gctggccaga ggtctgctca 3600
tgctggccga gctgtcttgc aagggctctc tggccactgg cgagtactcc aagcagacca 3660
ttgagcttgc ccgatccgac cccgagtttg tggttggctt cattgcccag aaccgaccta 3720
agggcgactc tgaggactgg cttattctga cccccggggt gggtcttgac gacaagggag 3780
acgctctcgg acagcagtac cgaactgttg aggatgtcat gtctaccgga acggatatca 3840
taattgtcgg ccgaggtctg tacggccaga accgagatcc tattgaggag gccaagcgat 3900
accagaaggc tggctgggag gcttaccaga agattaactg ttagaggtta gactatggat 3960
atgtaattta actgtgtata tagagagcgt gcaagtatgg agcgcttgtt cagcttgtat 4020
gatggtcaga cgacctgtct gatcgagtat gtatgatact gcacaacctg tgtatccgca 4080
tgatctgtcc aatggggcat gttgttgtgt ttctcgatac ggagatgctg ggtacagtgc 4140
taatacgttg aactacttat acttatatga ggctcgaaga aagctgactt gtgtatgacg 4200
catgcttgag cgattgggag agttggttgt gtacaattat tttaatacct cttctgattg 4260
ttttctattg ccttccattt ctatctttac ctgccatctc acgtcgtgtg taccatcccc 4320
acatacggaa ccagtaggtc ttttaggctc tgaacgtgca aatgagtttg gtggggtagg 4380
cagagatcgc atagagacgg gtagaatgag cagttaaaag ctgtgttgag tggtaaaaat 4440
ttacaataag tgttcctcaa ggcatcaagg agacgaaata agccattatg gacacgaacc 4500
aacagtccca ccacgttcta aacacattcc tccactgcca ctcccaaaca ccacgtccca 4560
cataaacttc taccccacat tttgacaagc ctattcgttt aataatcacc ccgaggagac 4620
agaaagccta acagctggag ccactatata gttgcagtgg ttaattaagg agttgtgtgt 4680
aacttgtaca ggtacaccta catactgtac tgtaggtcca aagataggta cactgtggca 4740
ataattatgc gagtacttgt accgtcatcg tagctgctgt aaagagatca gacacaggca 4800
cttttcccca ccatgagatc accactcgtc gtccgagtac ttctatggca cagccacaat 4860
cacatgtact tgtgcatgcc aatgtgtgac atcatcatct agagctatca tcatattccc 4920
gctgcaaatg gtctacgtat tactattaag cagggggggg ggaggaatta tgacgacatt 4980
gtacgtgtac tcgtaccggt acttgtagca cgccgaactg cggtattact gtgcactgta 5040
atttcggacc cctcttatag ccccaagttg gtctatacat ctgaaccggt gcagactcac 5100
tattaaaagt gcggcagcta attttgctga cacagccttg tcgataaaag tagctacttg 5160
tagg 5164
<210> 74
<211> 957
<212> DNA
<213> 人工序列
<220>
<223> POX4敲除位点
<400> 74
ttgagcgatt gggagagttg gttgtgtaca attattttaa tacctcttct gattgttttc 60
tattgccttc catttctatc tttacctgcc atctcacgtc gtgtgtacca tccccacata 120
cggaaccagt aggtctttta ggctctgaac gtgcaaatga gtttggtggg gtaggcagag 180
atcgcataga gacgggtaga atgagcagtt aaaagctgtg ttgagtggta aaaatttaca 240
ataagtgttc ctcaaggcat caaggagacg aaataagcca ttatggacac gaaccaacag 300
tcccaccacg ttctaaacac attcctccac tgccactccc aaacaccacg tcccacataa 360
acttctaccc cacattttga caagcctatt cgtttaataa tcaccccgag gagacagaaa 420
gcctaacagc tggagccact atatagttgc agtggttaat taaggagttg tgtgtaactt 480
gtacaggtac acctacatac tgtactgtag gtccaaagat aggtacactg tggcaataat 540
tatgcgagta cttgtaccgt catcgtagct gctgtaaaga gatcagacac aggcactttt 600
ccccaccatg agatcaccac tcgtcgtccg agtacttcta tggcacagcc acaatcacat 660
gtacttgtgc atgccaatgt gtgacatcat catctagagc tatcatcata ttcccgctgc 720
aaatggtcta cgtattacta ttaagcaggg gggggggagg aattatgacg acattgtacg 780
tgtactcgta ccggtacttg tagcacgccg aactgcggta ttactgtgca ctgtaatttc 840
ggacccctct tatagcccca agttggtcta tacatctgaa ccggtgcaga ctcactatta 900
aaagtgcggc agctaatttt gctgacacag ccttgtcgat aaaagtagct acttgta 957
<210> 75
<211> 6853
<212> DNA
<213> 人工序列
<220>
<223> pYRH72质粒
<400> 75
gcatgcgacg tcgggcccaa ttcgccctat agtgagtcgt attacaattc actggccgtc 60
gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg ccttgcagca 120
catccccctt tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg cccttcccaa 180
cagttgcgca gcctgaatgg cgaatggacg cgccctgtag cggcgcatta agcgcggcgg 240
gtgtggtggt tacgcgcagc gtgaccgcta cacttgccag cgccctagcg cccgctcctt 300
tcgctttctt cccttccttt ctcgccacgt tcgccggctt tccccgtcaa gctctaaatc 360
gggggctccc tttagggttc cgatttagtg ctttacggca cctcgacccc aaaaaacttg 420
attagggtga tggttcacgt agtgggccat cgccctgata gacggttttt cgccctttga 480
cgttggagtc cacgttcttt aatagtggac tcttgttcca aactggaaca acactcaacc 540
ctatctcggt ctattctttt gatttataag ggattttgcc gatttcggcc tattggttaa 600
aaaatgagct gatttaacaa aaatttaacg cgaattttaa caaaatatta acgcttacaa 660
tttcctgatg cggtattttc tccttacgca tctgtgcggt atttcacacc gcatcaggtg 720
gcacttttcg gggaaatgtg cgcggaaccc ctatttgttt atttttctaa atacattcaa 780
atatgtatcc gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga 840
agagtatgag tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc 900
ttcctgtttt tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg 960
gtgcacgagt gggttacatc gaactggatc tcaacagcgg taagatcctt gagagttttc 1020
gccccgaaga acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat 1080
tatcccgtat tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg 1140
acttggttga gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag 1200
aattatgcag tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa 1260
cgatcggagg accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc 1320
gccttgatcg ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca 1380
cgatgcctgt agcaatggca acaacgttgc gcaaactatt aactggcgaa ctacttactc 1440
tagcttcccg gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc 1500
tgcgctcggc ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg 1560
ggtctcgcgg tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta 1620
tctacacgac ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag 1680
gtgcctcact gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga 1740
ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc 1800
tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa 1860
agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa 1920
aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc 1980
cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgttcttcta gtgtagccgt 2040
agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc 2100
tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac 2160
gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca 2220
gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg 2280
ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag 2340
gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt 2400
ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat 2460
ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc 2520
acatgttctt tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt 2580
gagctgatac cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag 2640
cggaagagcg cccaatacgc aaaccgcctc tccccgcgcg ttggccgatt cattaatgca 2700
gctggcgcgc caccatcatt gagaacctca gtaagctcaa gtgggataag accgccatcc 2760
acatccgtgc caccaaacag gcccatgctg gtgccattgt gcgtcatcca gacccgtcct 2820
tctatgaagg taagaccgtt gtcaagcact ggattgacaa caaggcccgt ctttgagagc 2880
agcctgactc ggcctttgta gagcaaggcc attattgatt tatagacatt ataccgggaa 2940
atactaaaca caagaacctt cggcgtgatt atctgcactt gtaccacgct gcagtaagtt 3000
agtaatcgga attcaactgc cattagacat tatttacctg cagacccaat tcgtccagca 3060
acggaggaat gaacgttggg ggttcgggtc taaagatgcg tcctgtaagt gggggcgttg 3120
gtctacgagt agggtcctgc tttagtgtgg aaaatttatc tctttatgtg tttccattgg 3180
ctggtgcgtt ttgttgtttt cctttattca gccaatcaga atgcgtgaga atacctgtta 3240
tgttttcctc acaatatttt tttccaccgc cattttggag agccgccgga aaccagagtg 3300
ccgaaaggct atcttttggg ctggaattat atatcctaag ccagacacaa tcctgactca 3360
ctaaccttgg agtagataga gaaagagcaa gaagctctgt gagtcagaga ggaagaggga 3420
ggcacataat gtgggagtta taggggtatc gtacgttgtg tggaagcttg tgagcggata 3480
acaatttcac acaggaaaca gctatgacca tgattacgcc aagctcgaaa ttaaccctca 3540
ctaaagggaa caaaagctgg agctccaccg cggacacaat atctggtcaa atttcagttt 3600
cgttacattt aaacggtagg ttagtgcttg gtatatgagt tgtaggcatg acaatttgga 3660
aaggggtgga ctttgggaat attgtgggat ttcaatacct tagtttgtac agggtaattg 3720
ttacaaatga tacaaagaac tgtatttctt ttcatttgtt ttaattggtt gtatatcaag 3780
tccgttagac gagctcagtg ccttggcttt tggcactgta tttcattttt agaggtacac 3840
tacattcagt gaggtatggt aaggttgagg gcataatgaa ggcaccttgt actgacagtc 3900
acagacctct caccgagaat tttatgagat atactcgggt tcattttagg ctcatcgata 3960
cgctctcatc aagaatactt cttgagaacc gtggagaccg gggttcgatt ccccgtatcg 4020
gagtgtttat tttttgctca accataccct ggggtgtgtt ctgtggagca ttctcacttt 4080
tggtaaacga cattgcttca agtgcagcgg aatcaaaaag tataaagtgg gcagcgagta 4140
tacctgtaca gactgtaggc gataactcaa tccaattacc ccccacaaca tgactggcca 4200
aactgatctc aagactttat tgaaatcagc aacaccgatt ctcaatgaag gcacatactt 4260
cttctgcaac attcacttga cgcctaaagt tggtgagaaa tggaccgaca agacatattc 4320
tgctatccac ggactgttgc ctgtgtcggt ggctacaata cgtgagtcag aagggctgac 4380
ggtggtggtt cccaaggaaa aggtcgacga gtatctgtct gactcgtcat tgccgccttt 4440
ggagtacgac tccaactatg agtgtgcttg gatcactttg acgatacatt cttcgttgga 4500
ggctgtgggt ctgacagctg cgttttcggc gcggttggcc gacaacaata tcagctgcaa 4560
cgtcattgct ggctttcatc atgatcacat ttttgtcggc aaaggcgacg cccagagagc 4620
cattgacgtt ctttctaatt tggaccgata gccgtatagt ccagtctatc tataagttca 4680
actaactcgt aactattacc ataacatata cttcactgcc ccagataagg ttccgataaa 4740
aagttctgca gactaaattt atttcagtct cctcttcacc accaaaatgc cctcctacga 4800
agctcgagct aacgtccaca agtccgcctt tgccgctcga gtgctcaagc tcgtggcagc 4860
caagaaaacc aacctgtgtg cttctctgga tgttaccacc accaaggagc tcattgagct 4920
tgccgataag gtcggacctt atgtgtgcat gatcaaaacc catatcgaca tcattgacga 4980
cttcacctac gccggcactg tgctccccct caaggaactt gctcttaagc acggtttctt 5040
cctgttcgag gacagaaagt tcgcagatat tggcaacact gtcaagcacc agtaccggtg 5100
tcaccgaatc gccgagtggt ccgatatcac caacgcccac ggtgtacccg gaaccggaat 5160
cattgctggc ctgcgagctg gtgccgagga aactgtctct gaacagaaga aggaggacgt 5220
ctctgactac gagaactccc agtacaagga gttcctagtc ccctctccca acgagaagct 5280
ggccagaggt ctgctcatgc tggccgagct gtcttgcaag ggctctctgg ccactggcga 5340
gtactccaag cagaccattg agcttgcccg atccgacccc gagtttgtgg ttggcttcat 5400
tgcccagaac cgacctaagg gcgactctga ggactggctt attctgaccc ccggggtggg 5460
tcttgacgac aagggagacg ctctcggaca gcagtaccga actgttgagg atgtcatgtc 5520
taccggaacg gatatcataa ttgtcggccg aggtctgtac ggccagaacc gagatcctat 5580
tgaggaggcc aagcgatacc agaaggctgg ctgggaggct taccagaaga ttaactgtta 5640
gaggttagac tatggatatg taatttaact gtgtatatag agagcgtgca agtatggagc 5700
gcttgttcag cttgtatgat ggtcagacga cctgtctgat cgagtatgta tgatactgca 5760
caacctgtgt atccgcatga tctgtccaat ggggcatgtt gttgtgtttc tcgatacgga 5820
gatgctgggt acagtgctaa tacgttgaac tacttatact tatatgaggc tcgaagaaag 5880
ctgacttgtg tatgacttat tctcaactac atccccagtc acaataccac cactgcacta 5940
ccactacacc aaaaccatga tcaaaccacc catggacttc ctggaggcag aagaacttgt 6000
tatggaaaag ctcaagagag agaattcaag atactatcaa gacatgtgtc gcaacttaat 6060
taatgtatct atacctaatc gacatggact gcaccgcatt cgttatctta tcgtagtcct 6120
gcttactttg atccgtatca cattcgtgta tcgcgataag aagtaaacat tgctgcaagt 6180
ataaatcagg tctcaaatct cttcttgaag atagttttaa gctcaccgtg aactgaacgt 6240
gaacactacg agtacgattt tcaatattat taccgtcgat ataacaacca tgcaatttct 6300
atatacatat atacattccc tcattcgtct gtgctgtttg gttcactgca gcaaatcaaa 6360
cagcttttcg tactttctgt gctgcgaatg tttgttacta tccgcgtgca ttctttgcag 6420
cttttgagat cccgtatagt ccttccacac gttggcactc gcctttttcg tcgtcgattg 6480
cagcttcata atcaacttgt cattgtccag cttggccccc tggacctcca tcatcacaat 6540
cttgtctctg tggtgtttga tagacgagtc gttcacttca caggtagcca caacgccgat 6600
gcaagcagct tttgtgcgct gatcatccac aatacgtgct ggtaacatgg gatttgccat 6660
gactccgtta cgagatgtgt gtagcgatcc cttggggaag taggacggtc cagccacggg 6720
tttcgtggat attgagtccc acggaccgaa tttttgtgtt gcagcgtact ctttggcaag 6780
ctggatgaga tactcgccgt ccagagcgct gcgcttgacg cctcggtcgt tgcaccactt 6840
gatgaaggcg taa 6853
<210> 76
<211> 6512
<212> DNA
<213> 人工序列
<220>
<223> p12_3-B-Pex3del1质粒
<400> 76
gtacgataac ttcgtatagc atacattata cgaagttatc gcgtcgacga gtatctgtct 60
gactcgtcat tgccgccttt ggagtacgac tccaactatg agtgtgcttg gatcactttg 120
acgatacatt cttcgttgga ggctgtgggt ctgacagctg cgttttcggc gcggttggcc 180
gacaacaata tcagctgcaa cgtcattgct ggctttcatc atgatcacat ttttgtcggc 240
aaaggcgacg cccagagagc cattgacgtt ctttctaatt tggaccgata gccgtatagt 300
ccagtctatc tataagttca actaactcgt aactattacc ataacatata cttcactgcc 360
ccagataagg ttccgataaa aagttctgca gactaaattt atttcagtct cctcttcacc 420
accaaaatgc cctcctacga agctcgagct aacgtccaca agtccgcctt tgccgctcga 480
gtgctcaagc tcgtggcagc caagaaaacc aacctgtgtg cttctctgga tgttaccacc 540
accaaggagc tcattgagct tgccgataag gtcggacctt atgtgtgcat gatcaaaacc 600
catatcgaca tcattgacga cttcacctac gccggcactg tgctccccct caaggaactt 660
gctcttaagc acggtttctt cctgttcgag gacagaaagt tcgcagatat tggcaacact 720
gtcaagcacc agtaccggtg tcaccgaatc gccgagtggt ccgatatcac caacgcccac 780
ggtgtacccg gaaccggaat cattgctggc ctgcgagctg gtgccgagga aactgtctct 840
gaacagaaga aggaggacgt ctctgactac gagaactccc agtacaagga gttcctagtc 900
ccctctccca acgagaagct ggccagaggt ctgctcatgc tggccgagct gtcttgcaag 960
ggctctctgg ccactggcga gtactccaag cagaccattg agcttgcccg atccgacccc 1020
gagtttgtgg ttggcttcat tgcccagaac cgacctaagg gcgactctga ggactggctt 1080
attctgaccc ccggggtggg tcttgacgac aagggagacg ctctcggaca gcagtaccga 1140
actgttgagg atgtcatgtc taccggaacg gatatcataa ttgtcggccg aggtctgtac 1200
ggccagaacc gagatcctat tgaggaggcc aagcgatacc agaaggctgg ctgggaggct 1260
taccagaaga ttaactgtta gaggttagac tatggatatg taatttaact gtgtatatag 1320
agagcgtgca agtatggagc gcttgttcag cttgtatgat ggtcagacga cctgtctgat 1380
cgagtatgta tgatactgca caacctgtgt atccgcatga tctgtccaat ggggcatgtt 1440
gttgtgtttc tcgatacgga gatgctgggt acagtgctaa tacgttgaac tacttatact 1500
tatatgaggc tcgaagaaag ctgacttgtg tatgacttat tctcaactac atccccagtc 1560
acaataccac cactgcacta ccactacacc aaaaccatga tcaaaccacc catggacttc 1620
ctggaggcag aagaacttgt tatggaaaag ctcaagagag agatcataac ttcgtatagc 1680
atacattata cgaagttatc ctgcaggtaa aggaattcag gagagaccgg gttggcggcg 1740
tatttgtgtc ccaaaaaaca gccccaattg ccccaattga ccccaaattg acccagtagc 1800
gggcccaacc ccggcgagag cccccttcac cccacatatc aaacctcccc cggttcccac 1860
acttgccgtt aagggcgtag ggtactgcag tctggaatct acgcttgttc agactttgta 1920
ctagtttctt tgtctggcca tccgggtaac ccatgccgga cgcaaaatag actactgaaa 1980
atttttttgc tttgtggttg ggactttagc caagggtata aaagaccacc gtccccgaat 2040
tacctttcct cttcttttct ctctctcctt gtcaactcac acccgaaatc gttaagcatt 2100
tccttctgag tataagaatc attcaccatg gacttcctgg aggcagaaga acttgttatg 2160
gaaaagctca agagagagaa gccaagatac tatcaagaca tgtgtcgcaa cttaattaag 2220
atgacgacat ttgcgagctg gacgaggaat agatggagcg tgtgttctga gtcgatgttt 2280
tctatggagt tgtgagtgtt agtagacatg atgggtttat atatgatgaa tgaatagatg 2340
tgattttgat ttgcacgatg gaattgagaa ctttgtaaac gtacatggga atgtatgaat 2400
gtgggggttt tgtgactgga taactgacgg tcagtggacg ccgttgttca aatatccaag 2460
agatgcgaga aactttgggt caagtgaaca tgtcctctct gttcaagtaa accatcaact 2520
atgggtagta tatttagtaa ggacaagagt tgagattctt tggagtccta gaaacgtatt 2580
ttcgcgttcc aagatcaaat tagtagagta atacgggcac gggaatccat tcatagtctc 2640
aattttccca taggtgtgct acaaggtgtt gagatgtggt acagtaccac catgattcga 2700
ggtaaagagc ccagaagtca ttgatgaggt caagaaatac acagatctac agctcaatac 2760
aatgaatatc ttctttcata ttcttcaggt gacaccaagg gtgtctattt tccccagaaa 2820
tgcgtgaaaa ggcgcgtgtg tagcgtggag tatgggttcg gttggcgtat ccttcatata 2880
tcgacgaaat agtagggcaa gagatgacaa aaagtatcta tatgtagaca gcgtagaata 2940
tggatttgat tggtataaat tcatttattg cgtgtctcac aaatactctc gataagttgg 3000
ggttaaactg gagatggaac aatgtcgata tctcgacgca tgcgacgtcg ggcccaattc 3060
gccctatagt gagtcgtatt acaattcact ggccgtcgtt ttacaacgtc gtgactggga 3120
aaaccctggc gttacccaac ttaatcgcct tgcagcacat ccccctttcg ccagctggcg 3180
taatagcgaa gaggcccgca ccgatcgccc ttcccaacag ttgcgcagcc tgaatggcga 3240
atggacgcgc cctgtagcgg cgcattaagc gcggcgggtg tggtggttac gcgcagcgtg 3300
accgctacac ttgccagcgc cctagcgccc gctcctttcg ctttcttccc ttcctttctc 3360
gccacgttcg ccggctttcc ccgtcaagct ctaaatcggg ggctcccttt agggttccga 3420
tttagtgctt tacggcacct cgaccccaaa aaacttgatt agggtgatgg ttcacgtagt 3480
gggccatcgc cctgatagac ggtttttcgc cctttgacgt tggagtccac gttctttaat 3540
agtggactct tgttccaaac tggaacaaca ctcaacccta tctcggtcta ttcttttgat 3600
ttataaggga ttttgccgat ttcggcctat tggttaaaaa atgagctgat ttaacaaaaa 3660
tttaacgcga attttaacaa aatattaacg cttacaattt cctgatgcgg tattttctcc 3720
ttacgcatct gtgcggtatt tcacaccgca tcaggtggca cttttcgggg aaatgtgcgc 3780
ggaaccccta tttgtttatt tttctaaata cattcaaata tgtatccgct catgagacaa 3840
taaccctgat aaatgcttca ataatattga aaaaggaaga gtatgagtat tcaacatttc 3900
cgtgtcgccc ttattccctt ttttgcggca ttttgccttc ctgtttttgc tcacccagaa 3960
acgctggtga aagtaaaaga tgctgaagat cagttgggtg cacgagtggg ttacatcgaa 4020
ctggatctca acagcggtaa gatccttgag agttttcgcc ccgaagaacg ttttccaatg 4080
atgagcactt ttaaagttct gctatgtggc gcggtattat cccgtattga cgccgggcaa 4140
gagcaactcg gtcgccgcat acactattct cagaatgact tggttgagta ctcaccagtc 4200
acagaaaagc atcttacgga tggcatgaca gtaagagaat tatgcagtgc tgccataacc 4260
atgagtgata acactgcggc caacttactt ctgacaacga tcggaggacc gaaggagcta 4320
accgcttttt tgcacaacat gggggatcat gtaactcgcc ttgatcgttg ggaaccggag 4380
ctgaatgaag ccataccaaa cgacgagcgt gacaccacga tgcctgtagc aatggcaaca 4440
acgttgcgca aactattaac tggcgaacta cttactctag cttcccggca acaattaata 4500
gactggatgg aggcggataa agttgcagga ccacttctgc gctcggccct tccggctggc 4560
tggtttattg ctgataaatc tggagccggt gagcgtgggt ctcgcggtat cattgcagca 4620
ctggggccag atggtaagcc ctcccgtatc gtagttatct acacgacggg gagtcaggca 4680
actatggatg aacgaaatag acagatcgct gagataggtg cctcactgat taagcattgg 4740
taactgtcag accaagttta ctcatatata ctttagattg atttaaaact tcatttttaa 4800
tttaaaagga tctaggtgaa gatccttttt gataatctca tgaccaaaat cccttaacgt 4860
gagttttcgt tccactgagc gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat 4920
cctttttttc tgcgcgtaat ctgctgcttg caaacaaaaa aaccaccgct accagcggtg 4980
gtttgtttgc cggatcaaga gctaccaact ctttttccga aggtaactgg cttcagcaga 5040
gcgcagatac caaatactgt tcttctagtg tagccgtagt taggccacca cttcaagaac 5100
tctgtagcac cgcctacata cctcgctctg ctaatcctgt taccagtggc tgctgccagt 5160
ggcgataagt cgtgtcttac cgggttggac tcaagacgat agttaccgga taaggcgcag 5220
cggtcgggct gaacgggggg ttcgtgcaca cagcccagct tggagcgaac gacctacacc 5280
gaactgagat acctacagcg tgagctatga gaaagcgcca cgcttcccga agggagaaag 5340
gcggacaggt atccggtaag cggcagggtc ggaacaggag agcgcacgag ggagcttcca 5400
gggggaaacg cctggtatct ttatagtcct gtcgggtttc gccacctctg acttgagcgt 5460
cgatttttgt gatgctcgtc aggggggcgg agcctatgga aaaacgccag caacgcggcc 5520
tttttacggt tcctggcctt ttgctggcct tttgctcaca tgttctttcc tgcgttatcc 5580
cctgattctg tggataaccg tattaccgcc tttgagtgag ctgataccgc tcgccgcagc 5640
cgaacgaccg agcgcagcga gtcagtgagc gaggaagcgg aagagcgccc aatacgcaaa 5700
ccgcctctcc ccgcgcgttg gccgattcat taatgcagct ggcgcgccac caatcacaat 5760
tctgaaaagc acatcttgat ctcctcattg cggggagtcc aacggtggtc ttattccccc 5820
gaatttcccg ctcaatctcg ttccagaccg acccggacac agtgcttaac gccgttccga 5880
aactctaccg cagatatgct ccaacggact gggctgcata gatgtgatcc tcggcttgga 5940
gaaatggata aaagccggcc aaaaaaaaag cggaaaaaag cggaaaaaaa gagaaaaaaa 6000
atcgcaaaat ttgaaaaata gggggaaaag acgcaaaaac gcaaggaggg gggagtatat 6060
gacactgata agcaagctca caacggttcc tcttattttt ttcctcatct tctgcctagg 6120
ttcccaaaat cccagatgct tctctccagt gccaaaagta agtaccccac aggttttcgg 6180
ccgaaaattc cacgtgcagc aacgtcgtgt ggggtgttaa aatgtggggg gggggaacca 6240
ggacaagagg ctcttgtggg agccgaatga gagcacaaag cgggcgggtg tgataagggc 6300
atttttgccc attttccctt ctcctgtctc tccgacggtg atggcgttgt gcgtcctcta 6360
tttcttttta tttctttttg ttttatttct ctgactaccg atttggtttg atttcctcaa 6420
ccccacacaa ataagctcgg gccgaggaat atatatatac acggacacag tcgccctgtg 6480
gacaacacgt cactacctct acgatacaca cc 6512
<210> 77
<211> 6906
<212> DNA
<213> 人工序列
<220>
<223> p70_Pox2::Leu2质粒
<400> 77
cgatagttgg agcaagggag aaatgtttgt acgggcgtcg ttgcttgtgt gatttttgag 60
gacccatccc tttggtatat aagtatactc tggggttaag gttgcccgtg tagtctaggt 120
tatagttttc atgtgaaata ccgagagccg agggagaata aacgggggta tttggacttg 180
tttttttcgc ggaaaagcgt cgaatcaacc ctgcgggcct tgcaccatgt ccacgacgtg 240
tttctcgccc caattcgccc cttgcacgtc aaaattaggc ctccatctag acccctccat 300
aacatgtgac tgtggggaaa agtataaggg aaaccatgca accatagacg acgtgaaaga 360
cggggaggaa ccaatggagg ccaaagaaat ggggtagcaa cagtccagga gacagacaag 420
gagacaagga gagggcgccc gaaagatcgg aaaaacaaac atgtccaatt ggggcagtga 480
cggaaacgac acggacactt cagtacaatg gaccgaccat ctccaagcca gggttattcc 540
ggtatcacct tggccgtaac ctcccgctgg tacctgatat tgtacacgtt cacattcaat 600
atactttcag ctacaataag agaggctgtt tgtcgggcat gtgtgtccgt cgtatggggt 660
gatgtccgag ggcgaaattc gctacaagct taactctggc gcttgtccag tatgaataga 720
caagtcaaga ccagtggtgc catgattgac agggaggtac aagacttcga tactcgagca 780
ttactcggac ttgtggcgat tgaacagacg ggcgatcgct tctcccccgt attgccggcg 840
cgccagctgc attaatgaat cggccaacgc gcggggagag gcggtttgcg tattgggcgc 900
tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta 960
tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag 1020
aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg 1080
tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg 1140
tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 1200
cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga 1260
agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc 1320
tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt 1380
aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact 1440
ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 1500
cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct gaagccagtt 1560
accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt 1620
ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct 1680
ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg 1740
gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt 1800
aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt 1860
gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc 1920
gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg 1980
cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc 2040
gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg 2100
gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca 2160
ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga 2220
tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct 2280
ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg 2340
cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca 2400
accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata 2460
cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct 2520
tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact 2580
cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa 2640
acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc 2700
atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga 2760
tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga 2820
aaagtgccac ctgatgcggt gtgaaatacc gcacagatgc gtaaggagaa aataccgcat 2880
caggaaattg taagcgttaa tattttgtta aaattcgcgt taaatttttg ttaaatcagc 2940
tcatttttta accaataggc cgaaatcggc aaaatccctt ataaatcaaa agaatagacc 3000
gagatagggt tgagtgttgt tccagtttgg aacaagagtc cactattaaa gaacgtggac 3060
tccaacgtca aagggcgaaa aaccgtctat cagggcgatg gcccactacg tgaaccatca 3120
ccctaatcaa gttttttggg gtcgaggtgc cgtaaagcac taaatcggaa ccctaaaggg 3180
agcccccgat ttagagcttg acggggaaag ccggcgaacg tggcgagaaa ggaagggaag 3240
aaagcgaaag gagcgggcgc tagggcgctg gcaagtgtag cggtcacgct gcgcgtaacc 3300
accacacccg ccgcgcttaa tgcgccgcta cagggcgcgt ccattcgcca ttcaggctgc 3360
gcaactgttg ggaagggcga tcggtgcggg cctcttcgct attacgccag ctggcgaaag 3420
ggggatgtgc tgcaaggcga ttaagttggg taacgccagg gttttcccag tcacgacgtt 3480
gtaaaacgac ggccagtgaa ttgtaatacg actcactata gggcgaattg ggcccgacgt 3540
cgcatgcgct gatgacactt tggtctgaaa gagatgcatt ttgaatccca aacttgcagt 3600
gcccaagtga catacatctc cgcgttttgg aaaatgttca gaaacagttg attgtgttgg 3660
aatggggaat ggggaatgga aaaatgactc aagtatcaat tccaaaaact tctctggctg 3720
gcagtaccta ctgtccatac tactgcattt tctccagtca ggccactcta tactcgacga 3780
cacagtagta aaacccagat aatttcgaca taaacaagaa aacagaccca ataatattta 3840
tatatagtca gccgtttgtc cagttcagac tgtaatagcc gaaaaaaaat ccaaagtttc 3900
tattctagga aaatatattc caatattttt aattcttaat ctcatttatt ttattctagc 3960
gaaatacatt tcagctactt gagacatgtg atacccacaa atcggattcg gactcggttg 4020
ttcagaagag catatggcat tcgtgctcgc ttgttcacgt attcttcctg ttccatctct 4080
tggccgacaa tcacacaaaa atggggtttt ttttttaatt ctaatgattc attacagcaa 4140
aattgagata tagcagacca cgtattccat aatcaccaag gaagttcttg ggcgtcttaa 4200
ttaagttgcg acacatgtct tgatagtatc ttggcttctc tctcttgagc ttttccataa 4260
caagttcttc tgcctccagg aagtccatgg tgaatgattc ttatactcag aaggaaatgc 4320
ttaacgattt cgggtgtgag ttgacaagga gagagagaaa agaagaggaa aggtaattcg 4380
gggacggtgg tcttttatac ccttggctaa agtcccaacc acaaagcaaa aaaattttca 4440
gtagtctatt ttgcgtccgg catgggttac ccggatggcc agacaaagaa actagtacaa 4500
agtctgaaca agcgtagatt ccagactgca gtaccctacg cccttaacgg caagtgtggg 4560
aaccggggga ggtttgatat gtggggtgaa gggggctctc gccggggttg ggcccgctac 4620
tgggtcaatt tggggtcaat tggggcaatt ggggctgttt tttgggacac aaatacgccg 4680
ccaacccggt ctctcctgaa ttctgcagat gggctgcagg aattccgtcg tcgcctgagt 4740
cgacatcatt tatttaccag ttggccacaa acccttgacg atctcgtatg tcccctccga 4800
catactcccg gccggctggg gtacgttcga tagcgctatc ggcatcgaca aggtttgggt 4860
ccctagccga taccgcacta cctgagtcac aatcttcgga ggtttagtct tccacatagc 4920
acgggcaaaa gtgcgtatat atacaagagc gtttgccagc cacagatttt cactccacac 4980
accacatcac acatacaacc acacacatcc acaatggaac ccgaaactaa gaagaccaag 5040
actgactcca agaagattgt tcttctcggc ggcgacttct gtggccccga ggtgattgcc 5100
gaggccgtca aggtgctcaa gtctgttgct gaggcctccg gcaccgagtt tgtgtttgag 5160
gaccgactca ttggaggagc tgccattgag aaggagggcg agcccatcac cgacgctact 5220
ctcgacatct gccgaaaggc tgactctatt atgctcggtg ctgtcggagg cgctgccaac 5280
accgtatgga ccactcccga cggacgaacc gacgtgcgac ccgagcaggg tctcctcaag 5340
ctgcgaaagg acctgaacct gtacgccaac ctgcgaccct gccagctgct gtcgcccaag 5400
ctcgccgatc tctcccccat ccgaaacgtt gagggcaccg acttcatcat tgtccgagag 5460
ctcgtcggag gtatctactt tggagagcga aaggaggatg acggatctgg cgtcgcttcc 5520
gacaccgaga cctactccgt tcctgaggtt gagcgaattg cccgaatggc cgccttcctg 5580
gcccttcagc acaacccccc tcttcccgtg tggtctcttg acaaggccaa cgtgctggcc 5640
tcctctcgac tttggcgaaa gactgtcact cgagtcctca aggacgaatt cccccagctc 5700
gagctcaacc accagctgat cgactcggcc gccatgatcc tcatcaagca gccctccaag 5760
atgaatggta tcatcatcac caccaacatg tttggcgata tcatctccga cgaggcctcc 5820
gtcatccccg gttctctggg tctgctgccc tccgcctctc tggcttctct gcccgacacc 5880
aacgaggcgt tcggtctgta cgagccctgt cacggatctg cccccgatct cggcaagcag 5940
aaggtcaacc ccattgccac cattctgtct gccgccatga tgctcaagtt ctctcttaac 6000
atgaagcccg ccggtgacgc tgttgaggct gccgtcaagg agtccgtcga ggctggtatc 6060
actaccgccg atatcggagg ctcttcctcc acctccgagg tcggagactt gttgccaaca 6120
aggtcaagga gctgctcaag aaggagtaag tcgtttctac gacgcattga tggaaggagc 6180
aaactgacgc gcctgcgggt tggtctaccg gcagggtccg ctagtgtata agactctata 6240
aaaagggccc tgccctgcta atgaaatgat gatttataat ttaccggtgt agcaaccttg 6300
actagaagaa gcagattggg tgtgtttgta gtggaggaca gtggtacgtt ttggaaacag 6360
tcttcttgaa agtgtcttgt ctacagtata ttcactcata acctcaatag ccaagggtgt 6420
agtcggttta ttaaaggaag ggagttgtgg ctgatgtgga tagatatctt taagctggcg 6480
actgcaccca acgagtgtgg tggtagcttg ttagatctgt atattcggta agatatattt 6540
tgtggggttt tagtggtgtt taaacggtag gttagtgctt ggtatatgag ttgtaggcat 6600
gacaatttgg aaaggggtgg actttgggaa tattgtggga tttcaatacc ttagtttgta 6660
cagggtaatt gttacaaatg atacaaagaa ctgtatttct tttcatttgt tttaattggt 6720
tgtatatcaa gtccgttaga cgagctcagt gccttggctt ttggcactgt atttcatttt 6780
tagaggtaca ctacattcag tgaggtatgg taaggttgag ggcataatga aggcaccttg 6840
tactgacagt cacagacctc tcaccgagaa ttttatgaga tatactcggg ttcattttag 6900
gctcat 6906
<210> 78
<211> 2103
<212> DNA
<213> 解脂耶氏酵母
<400> 78
atgaacccca acaacactgg caccattgaa atcaacggta aggagtacaa caccttcacc 60
gagccccccg tggccatggc tcaggagcga gccaagacct ccttccccgt gcgagagatg 120
acctacttcc tcgacggtgg cgagaagaac accctcaaaa acgagcagat catggaggag 180
attgagcgag accctctttt caacaacgac aactactacg atctcaacaa ggagcagatc 240
cgagagctca ccatggagcg agtcgccaag ctgtctctgt ttgtgcgtga tcagcccgag 300
gacgacatca agaagcgatt tgctctcatt ggtatcgccg atatgggaac ctacacccga 360
cttggtgtcc actacggcct cttctttggc gccgtccgag gtaccggaac tgccgagcag 420
tttggccact ggatctccaa gggagccgga gacctgcgaa agttctacgg atgtttctcc 480
atgaccgagc tgggccatgg ctccaacctg gctggtctcg agaccaccgc catctacgat 540
gaggagaccg acgagttcat catcaacacc cctcacattg ccgccaccaa gtggtggatt 600
ggaggagccg cccacaccgc cacccacact gtcgtgttcg cccgactcat tgtcaagggc 660
aaggactacg gtgtcaagac ctttgttgtc cagctgcgaa acatcaacga ccacagcctc 720
aaggtcggta tctctattgg tgatatcgga aagaagatgg gccgagacgg tatcgataac 780
ggatggatcc agttcaccaa cgtgcgaatc ccccgacaga acctgctcat gaagtacaca 840
aaggtcgacc gagagggtaa cgtgacccag cctcctctgg ctcagcttac ctacggttct 900
cttatcactg gtcgagtctc catggcctct gattctcacc aggtcggaaa gcgattcatc 960
accattgctc tgcgatacgc ctgcattcga cgacagttct ccaccacccc cggccagccc 1020
gagaccaaga tcatcgacta cccctaccat cagcgacgac ttctgcctct tctggcctat 1080
gtctatgctc ttaagatgac tgccgatgag gttggagctc tcttctcccg aaccatgctt 1140
aagatggacg acctcaagcc cgacgacaag gccggcctca atgaggttgt ttccgacgtc 1200
aaggagctct tctccgtctc cgccggtctc aaggccttct ccacctgggc ttgtgccgac 1260
gtcattgaca agacccgaca ggcttgcggt ggccacggtt actctggata caacggtttc 1320
ggccaggcct acgccgactg ggttgtccag tgcacctggg agggtgacaa caacattctc 1380
accctttctg ccggccgagc tcttatccag tctgccgttg ctctgcgaaa gggcgagcct 1440
gttggtaacg ccgtttctta cctgaagcga tacaaggatc tggccaacgc taagctcaat 1500
ggccgatctc tcaccgaccc caaggtcctc gtcgaggcct gggaggttgc tgccggtaac 1560
atcatcaacc gagccaccga ccagtacgag aagctcattg gcgagggtct taacgccgac 1620
caggcctttg aggttctgtc tcagcagcga ttccaggccg ccaaggtcca cacacgacga 1680
cacctcattg ccgctttctt ctcccgaatt gacaccgagg ctggcgaggc catcaagcag 1740
cccctgctta acctggctct gctgtttgcc ctgtggtcca tcgaagagga ctctggtctg 1800
ttcctgcgag agggcttcct cgagcccaag gatatcgaca ccgtcaccga gctcgtcaac 1860
aagtactgca ccactgtgcg agaggaggtc attggctaca ccgatgcctt caacctgtcc 1920
gactacttca tcaacgctcc tattggatgc tacgatggtg acgcttaccg acactacttc 1980
cagaaggtca acgagcagaa ccctgcccga gacccccgac ctccttacta cgcctctact 2040
ctcaagccct tccttttccg agaggaggag gatgatgaca tttgcgagct tgatgaggaa 2100
tag 2103
<210> 79
<211> 700
<212> PRT
<213> 解脂耶氏酵母
<400> 79
Met Asn Pro Asn Asn Thr Gly Thr Ile Glu Ile Asn Gly Lys Glu Tyr
1 5 10 15
Asn Thr Phe Thr Glu Pro Pro Val Ala Met Ala Gln Glu Arg Ala Lys
20 25 30
Thr Ser Phe Pro Val Arg Glu Met Thr Tyr Phe Leu Asp Gly Gly Glu
35 40 45
Lys Asn Thr Leu Lys Asn Glu Gln Ile Met Glu Glu Ile Glu Arg Asp
50 55 60
Pro Leu Phe Asn Asn Asp Asn Tyr Tyr Asp Leu Asn Lys Glu Gln Ile
65 70 75 80
Arg Glu Leu Thr Met Glu Arg Val Ala Lys Leu Ser Leu Phe Val Arg
85 90 95
Asp Gln Pro Glu Asp Asp Ile Lys Lys Arg Phe Ala Leu Ile Gly Ile
100 105 110
Ala Asp Met Gly Thr Tyr Thr Arg Leu Gly Val His Tyr Gly Leu Phe
115 120 125
Phe Gly Ala Val Arg Gly Thr Gly Thr Ala Glu Gln Phe Gly His Trp
130 135 140
Ile Ser Lys Gly Ala Gly Asp Leu Arg Lys Phe Tyr Gly Cys Phe Ser
145 150 155 160
Met Thr Glu Leu Gly His Gly Ser Asn Leu Ala Gly Leu Glu Thr Thr
165 170 175
Ala Ile Tyr Asp Glu Glu Thr Asp Glu Phe Ile Ile Asn Thr Pro His
180 185 190
Ile Ala Ala Thr Lys Trp Trp Ile Gly Gly Ala Ala His Thr Ala Thr
195 200 205
His Thr Val Val Phe Ala Arg Leu Ile Val Lys Gly Lys Asp Tyr Gly
210 215 220
Val Lys Thr Phe Val Val Gln Leu Arg Asn Ile Asn Asp His Ser Leu
225 230 235 240
Lys Val Gly Ile Ser Ile Gly Asp Ile Gly Lys Lys Met Gly Arg Asp
245 250 255
Gly Ile Asp Asn Gly Trp Ile Gln Phe Thr Asn Val Arg Ile Pro Arg
260 265 270
Gln Asn Leu Leu Met Lys Tyr Thr Lys Val Asp Arg Glu Gly Asn Val
275 280 285
Thr Gln Pro Pro Leu Ala Gln Leu Thr Tyr Gly Ser Leu Ile Thr Gly
290 295 300
Arg Val Ser Met Ala Ser Asp Ser His Gln Val Gly Lys Arg Phe Ile
305 310 315 320
Thr Ile Ala Leu Arg Tyr Ala Cys Ile Arg Arg Gln Phe Ser Thr Thr
325 330 335
Pro Gly Gln Pro Glu Thr Lys Ile Ile Asp Tyr Pro Tyr His Gln Arg
340 345 350
Arg Leu Leu Pro Leu Leu Ala Tyr Val Tyr Ala Leu Lys Met Thr Ala
355 360 365
Asp Glu Val Gly Ala Leu Phe Ser Arg Thr Met Leu Lys Met Asp Asp
370 375 380
Leu Lys Pro Asp Asp Lys Ala Gly Leu Asn Glu Val Val Ser Asp Val
385 390 395 400
Lys Glu Leu Phe Ser Val Ser Ala Gly Leu Lys Ala Phe Ser Thr Trp
405 410 415
Ala Cys Ala Asp Val Ile Asp Lys Thr Arg Gln Ala Cys Gly Gly His
420 425 430
Gly Tyr Ser Gly Tyr Asn Gly Phe Gly Gln Ala Tyr Ala Asp Trp Val
435 440 445
Val Gln Cys Thr Trp Glu Gly Asp Asn Asn Ile Leu Thr Leu Ser Ala
450 455 460
Gly Arg Ala Leu Ile Gln Ser Ala Val Ala Leu Arg Lys Gly Glu Pro
465 470 475 480
Val Gly Asn Ala Val Ser Tyr Leu Lys Arg Tyr Lys Asp Leu Ala Asn
485 490 495
Ala Lys Leu Asn Gly Arg Ser Leu Thr Asp Pro Lys Val Leu Val Glu
500 505 510
Ala Trp Glu Val Ala Ala Gly Asn Ile Ile Asn Arg Ala Thr Asp Gln
515 520 525
Tyr Glu Lys Leu Ile Gly Glu Gly Leu Asn Ala Asp Gln Ala Phe Glu
530 535 540
Val Leu Ser Gln Gln Arg Phe Gln Ala Ala Lys Val His Thr Arg Arg
545 550 555 560
His Leu Ile Ala Ala Phe Phe Ser Arg Ile Asp Thr Glu Ala Gly Glu
565 570 575
Ala Ile Lys Gln Pro Leu Leu Asn Leu Ala Leu Leu Phe Ala Leu Trp
580 585 590
Ser Ile Glu Glu Asp Ser Gly Leu Phe Leu Arg Glu Gly Phe Leu Glu
595 600 605
Pro Lys Asp Ile Asp Thr Val Thr Glu Leu Val Asn Lys Tyr Cys Thr
610 615 620
Thr Val Arg Glu Glu Val Ile Gly Tyr Thr Asp Ala Phe Asn Leu Ser
625 630 635 640
Asp Tyr Phe Ile Asn Ala Pro Ile Gly Cys Tyr Asp Gly Asp Ala Tyr
645 650 655
Arg His Tyr Phe Gln Lys Val Asn Glu Gln Asn Pro Ala Arg Asp Pro
660 665 670
Arg Pro Pro Tyr Tyr Ala Ser Thr Leu Lys Pro Phe Leu Phe Arg Glu
675 680 685
Glu Glu Asp Asp Asp Ile Cys Glu Leu Asp Glu Glu
690 695 700
<210> 80
<211> 2103
<212> DNA
<213> 解脂耶氏酵母
<400> 80
atgatctccc ccaacctcac agctaacgtc gagattgacg gcaagcagta caacaccttc 60
acagagccac ccaaggcgct cgccggcgag cgagccaagg tcaagttccc catcaaggac 120
atgacggagt ttctgcacgg tggcgaggag aacgtgacca tgatcgagcg actgatgacg 180
gagctcgagc gagaccccgt gctcaacgtg tcgggcgact acgacatgcc caaggagcag 240
ctgcgagaga cggccgtggc gcgaattgcg gcgctgtccg gccactggaa gaaggacaca 300
gaaaaggagg cgctgctgcg gtcccagctg cacggcattg tggacatggg cacccgaatc 360
cgactcggtg tgcacacggg cctgttcatg ggcgccatcc ggggttccgg caccaaggag 420
cagtacgact actgggtgcg aaagggcgcc gcggacgtca agggcttcta cggctgcttt 480
gctatgaccg agctgggcca tggctccaac gtggccggtc ttgagaccac cgccacctac 540
atccaggaca cggacgagtt catcatcaac acccccaaca ctggagccac caagtggtgg 600
attggaggag ccgcccactc ggccacccac accgcctgct ttgctcgtct gcttgtcgac 660
ggcaaggact acggcgtcaa gatctttgtt gtccagctgc gagacgtctc ttctcactct 720
ctcatgcccg gcatcgctct cggcgacatt ggaaagaaga tgggccgaga cgccatcgac 780
aacggctgga tccagttcac caatgtgcga atcccccgac agaacatgct catgaagtac 840
gccaaggtct cgtctaccgg caaggtgtcg cagcctcctc tggcccagct cacctacggc 900
gctctcattg gcggccgagt caccatgatt gccgactcct tctttgtctc ccagcgattc 960
atcaccattg ctctgcgata cgcctgtgtg cgacgacagt ttggcaccac ccccggccag 1020
cccgagacta agatcatcga ctacccctac catcagcgac gtctgctgcc tcttctggcc 1080
ttcacctacg ccatgaagat ggccgccgac cagtcccaga ttcagtacga tcagaccacc 1140
gatctgctgc agaccatcga ccctaaggac aagggcgctc tgggcaaggc cattgtcgac 1200
ctcaaggagc tgtttgcctc ttctgctggt ctcaaggcct tcaccacctg gacctgtgcc 1260
aacatcattg accagtgccg acaggcctgc ggtggccacg gctactctgg ctacaacggc 1320
tttggccagg cctacgccga ctgggttgtc cagtgcacct gggagggtga caacaacgtc 1380
ctgtgtctgt ccatgggccg aggtctcatc cagtcgtgtc tgggccaccg aaagggtaag 1440
cctctgggct cttctgtcgg ctacctggct aacaagggtc ttgagcaggc tactctgagc 1500
ggccgagacc tcaaggaccc caaggttctc atcgaggcct gggagaaggt cgccaacggc 1560
gccatccagc gggccactga caaatttgtc gagctcacca agggcggcct ctctcctgac 1620
caggcctttg aggagctgtc gcagcagcga ttccagtgtg ccaagatcca cacccgaaag 1680
cacctggtga ctgccttcta cgagcgaatc aacgcctctg cgaaggccga cgtcaagcct 1740
tacctcatca acctcgccaa cctcttcact ctgtggtcca ttgaggagga ctctggtctc 1800
ttcctgcgag agggtttcct gcagcccaag gacattgacc aggtgactga gctggtgaac 1860
cactactgca aggaggttcg agaccaggtt gccggctaca ccgatgcctt tggtctgtct 1920
gactggttca tcaacgctcc cattggaaac tacgatggtg acgtttacaa gcattacttt 1980
gccaaggtta accagcagaa ccctgctcag aacccccgac ctccttacta tgagagcact 2040
cttcgacctt tcctgttccg agaggatgag gatgacgaca tttgcgagct ggacgaggaa 2100
tag 2103
<210> 81
<211> 700
<212> PRT
<213> 解脂耶氏酵母
<400> 81
Met Ile Ser Pro Asn Leu Thr Ala Asn Val Glu Ile Asp Gly Lys Gln
1 5 10 15
Tyr Asn Thr Phe Thr Glu Pro Pro Lys Ala Leu Ala Gly Glu Arg Ala
20 25 30
Lys Val Lys Phe Pro Ile Lys Asp Met Thr Glu Phe Leu His Gly Gly
35 40 45
Glu Glu Asn Val Thr Met Ile Glu Arg Leu Met Thr Glu Leu Glu Arg
50 55 60
Asp Pro Val Leu Asn Val Ser Gly Asp Tyr Asp Met Pro Lys Glu Gln
65 70 75 80
Leu Arg Glu Thr Ala Val Ala Arg Ile Ala Ala Leu Ser Gly His Trp
85 90 95
Lys Lys Asp Thr Glu Lys Glu Ala Leu Leu Arg Ser Gln Leu His Gly
100 105 110
Ile Val Asp Met Gly Thr Arg Ile Arg Leu Gly Val His Thr Gly Leu
115 120 125
Phe Met Gly Ala Ile Arg Gly Ser Gly Thr Lys Glu Gln Tyr Asp Tyr
130 135 140
Trp Val Arg Lys Gly Ala Ala Asp Val Lys Gly Phe Tyr Gly Cys Phe
145 150 155 160
Ala Met Thr Glu Leu Gly His Gly Ser Asn Val Ala Gly Leu Glu Thr
165 170 175
Thr Ala Thr Tyr Ile Gln Asp Thr Asp Glu Phe Ile Ile Asn Thr Pro
180 185 190
Asn Thr Gly Ala Thr Lys Trp Trp Ile Gly Gly Ala Ala His Ser Ala
195 200 205
Thr His Thr Ala Cys Phe Ala Arg Leu Leu Val Asp Gly Lys Asp Tyr
210 215 220
Gly Val Lys Ile Phe Val Val Gln Leu Arg Asp Val Ser Ser His Ser
225 230 235 240
Leu Met Pro Gly Ile Ala Leu Gly Asp Ile Gly Lys Lys Met Gly Arg
245 250 255
Asp Ala Ile Asp Asn Gly Trp Ile Gln Phe Thr Asn Val Arg Ile Pro
260 265 270
Arg Gln Asn Met Leu Met Lys Tyr Ala Lys Val Ser Ser Thr Gly Lys
275 280 285
Val Ser Gln Pro Pro Leu Ala Gln Leu Thr Tyr Gly Ala Leu Ile Gly
290 295 300
Gly Arg Val Thr Met Ile Ala Asp Ser Phe Phe Val Ser Gln Arg Phe
305 310 315 320
Ile Thr Ile Ala Leu Arg Tyr Ala Cys Val Arg Arg Gln Phe Gly Thr
325 330 335
Thr Pro Gly Gln Pro Glu Thr Lys Ile Ile Asp Tyr Pro Tyr His Gln
340 345 350
Arg Arg Leu Leu Pro Leu Leu Ala Phe Thr Tyr Ala Met Lys Met Ala
355 360 365
Ala Asp Gln Ser Gln Ile Gln Tyr Asp Gln Thr Thr Asp Leu Leu Gln
370 375 380
Thr Ile Asp Pro Lys Asp Lys Gly Ala Leu Gly Lys Ala Ile Val Asp
385 390 395 400
Leu Lys Glu Leu Phe Ala Ser Ser Ala Gly Leu Lys Ala Phe Thr Thr
405 410 415
Trp Thr Cys Ala Asn Ile Ile Asp Gln Cys Arg Gln Ala Cys Gly Gly
420 425 430
His Gly Tyr Ser Gly Tyr Asn Gly Phe Gly Gln Ala Tyr Ala Asp Trp
435 440 445
Val Val Gln Cys Thr Trp Glu Gly Asp Asn Asn Val Leu Cys Leu Ser
450 455 460
Met Gly Arg Gly Leu Ile Gln Ser Cys Leu Gly His Arg Lys Gly Lys
465 470 475 480
Pro Leu Gly Ser Ser Val Gly Tyr Leu Ala Asn Lys Gly Leu Glu Gln
485 490 495
Ala Thr Leu Ser Gly Arg Asp Leu Lys Asp Pro Lys Val Leu Ile Glu
500 505 510
Ala Trp Glu Lys Val Ala Asn Gly Ala Ile Gln Arg Ala Thr Asp Lys
515 520 525
Phe Val Glu Leu Thr Lys Gly Gly Leu Ser Pro Asp Gln Ala Phe Glu
530 535 540
Glu Leu Ser Gln Gln Arg Phe Gln Cys Ala Lys Ile His Thr Arg Lys
545 550 555 560
His Leu Val Thr Ala Phe Tyr Glu Arg Ile Asn Ala Ser Ala Lys Ala
565 570 575
Asp Val Lys Pro Tyr Leu Ile Asn Leu Ala Asn Leu Phe Thr Leu Trp
580 585 590
Ser Ile Glu Glu Asp Ser Gly Leu Phe Leu Arg Glu Gly Phe Leu Gln
595 600 605
Pro Lys Asp Ile Asp Gln Val Thr Glu Leu Val Asn His Tyr Cys Lys
610 615 620
Glu Val Arg Asp Gln Val Ala Gly Tyr Thr Asp Ala Phe Gly Leu Ser
625 630 635 640
Asp Trp Phe Ile Asn Ala Pro Ile Gly Asn Tyr Asp Gly Asp Val Tyr
645 650 655
Lys His Tyr Phe Ala Lys Val Asn Gln Gln Asn Pro Ala Gln Asn Pro
660 665 670
Arg Pro Pro Tyr Tyr Glu Ser Thr Leu Arg Pro Phe Leu Phe Arg Glu
675 680 685
Asp Glu Asp Asp Asp Ile Cys Glu Leu Asp Glu Glu
690 695 700
<210> 82
<211> 12355
<212> DNA
<213> 人工序列
<220>
<223> pZKLY-FCtR17U质粒
<400> 82
cgatgagcct aaaatgaacc cgagtatatc tcataaaatt ctcggtgaga ggtctgtgac 60
tgtcagtaca aggtgccttc attatgccct caaccttacc atacctcact gaatgtagtg 120
tacctctaaa aatgaaatac agtgccaaaa gccaaggcac tgagctcgtc taacggactt 180
gatatacaac caattaaaac aaatgaaaag aaatacagtt ctttgtatca tttgtaacaa 240
ttaccctgta caaactaagg tattgaaatc ccacaatatt cccaaagtcc acccctttcc 300
aaattgtcat gcctacaact catataccaa gcactaacct accgtttaaa cagtgtacgc 360
agtactatag aggaacaatt gccccggaga agacggccag gccgcctaga tgacaaattc 420
aacaactcac agctgacttt ctgccattgc cactaggggg gggccttttt atatggccaa 480
gccaagctct ccacgtcggt tgggctgcac ccaacaataa atgggtaggg ttgcaccaac 540
aaagggatgg gatggggggt agaagatacg aggataacgg ggctcaatgg cacaaataag 600
aacgaatact gccattaaga ctcgtgatcc agcgactgac accattgcat catctaaggg 660
cctcaaaact acctcggaac tgctgcgctg atctggacac cacagaggtt ccgagcactt 720
taggttgcac caaatgtccc accaggtgca ggcagaaaac gctggaacag cgtgtacagt 780
ttgtcttaac aaaaagtgag ggcgctgagg tcgagcaggg tggtgtgact tgttatagcc 840
tttagagctg cgaaagcgcg tatggatttg gctcatcagg ccagattgag ggtctgtgga 900
cacatgtcat gttagtgtac ttcaatcgcc ccctggatat agccccgaca ataggccgtg 960
gcctcatttt tttgccttcc gcacatttcc attgctcggt acccacacct tgcttctcct 1020
gcacttgcca accttaatac tggtttacat tgaccaacat cttacaagcg gggggcttgt 1080
ctagggtata tataaacagt ggctctccca atcggttgcc agtctctttt ttcctttctt 1140
tccccacaga ttcgaaatct aaactacaca tcacacaatt ccgagccgtg agtatccacg 1200
acaagatcag tgtcgagacg acgcgttttg tgtaatgaca caatccgaaa gtcgctagca 1260
acacacactc tctacacaaa ctaacccagc tctccatggc catcgagcag ctgctcgagt 1320
actggtacgt cgttgtgccc gtcctgtaca ttatcaagca gctccttgcc tacaccaaga 1380
ctcgagtgct gatgaaaaag ctcggagccg ctcccgtcac caacaagctg tacgacaacg 1440
ccttcggtat cgtcaacggc tggaaggctc ttcagttcaa gaaagagggc cgagctcagg 1500
aatacaacga ctacaagttc gatcactcca agaatccttc tgtgggaacc tacgtctcca 1560
ttctgtttgg cactcgaatc gtggttacca aggatcccga gaacatcaag gccattctcg 1620
caacccagtt cggagacttt tcgctgggca agcgacacac tctcttcaag cccttgctgg 1680
gagacggtat cttcacactc gatggagaag gctggaagca ttccagagct atgctgcgac 1740
ctcagtttgc ccgagagcaa gttgctcacg tcaccagcct cgaaccacac ttccagctgc 1800
tcaagaaaca tatcctcaag cacaagggcg agtacttcga cattcaggag ctgttctttc 1860
gattcaccgt ggactctgcc acggagtttc tgttcggcga gtccgttcac tctctcaagg 1920
acgagtcgat tggaatcaac caggacgata tcgacttcgc tggtcggaag gactttgccg 1980
agtccttcaa caaggcacag gaatacttgg ccattcgaac tctggtgcag accttctact 2040
ggctcgtcaa caacaaggag tttcgagact gcaccaagct ggttcacaag ttcaccaact 2100
actatgtcca gaaggctctc gatgcatctc ccgaggaact tgagaagcaa agcggctacg 2160
tgttcctgta cgagcttgtc aagcagacca gagatcccaa cgtgctgcga gaccagtccc 2220
tcaacatctt gctggccgga cgagacacca ctgctggcct cctgtcgttt gcagtcttcg 2280
agttggctcg tcatcccgag atctgggcca agctgcgaga ggaaatcgag caacagttcg 2340
gacttggcga ggactctcgt gtcgaagaga ttaccttcga gagcctcaag cgatgcgagt 2400
acctcaaggc ctttctcaac gaaaccctgc ggatctaccc ttccgttcct cgaaacttca 2460
gaatcgctac caagaacaca acccttcccc gaggcggtgg atcggacggt acttctccaa 2520
tcctcattca gaagggcgag gccgtgtcct acggtatcaa ttctactcat ctggatcctg 2580
tctattacgg acccgacgct gccgagtttc gacccgagcg atggttcgaa ccttcgacca 2640
aaaagctcgg ctgggcctac cttcccttca acggaggtcc acgaatctgt ctgggccaac 2700
agtttgccct caccgaggct ggctacgtgc tggtcagact cgttcaggag ttctcccacg 2760
tccgatccga tcccgacgag gtgtaccctc ccaagcgact tacaaacctg accatgtgtc 2820
tccaggacgg tgccattgtc aagttcgact aagcggccgc aagtgtggat ggggaagtga 2880
gtgcccggtt ctgtgtgcac aattggcaat ccaagatgga tggattcaac acagggatat 2940
agcgagctac gtggtggtgc gaggatatag caacggatat ttatgtttga cacttgagaa 3000
tgtacgatac aagcactgtc caagtacaat actaaacata ctgtacatac tcatactcgt 3060
acccgggcaa cggtttcact tgagtgcagt ggctagtgct cttactcgta cagtgtgcaa 3120
tactgcgtat catagtcttt gatgtatatc gtattcattc atgttagttg atttaaacca 3180
tcatctaagg gcctcaaaac tacctcggaa ctgctgcgct gatctggaca ccacagaggt 3240
tccgagcact ttaggttgca ccaaatgtcc caccaggtgc aggcagaaaa cgctggaaca 3300
gcgtgtacag tttgtcttaa caaaaagtga gggcgctgag gtcgagcagg gtggtgtgac 3360
ttgttatagc ctttagagct gcgaaagcgc gtatggattt ggctcatcag gccagattga 3420
gggtctgtgg acacatgtca tgttagtgta cttcaatcgc cccctggata tagccccgac 3480
aataggccgt ggcctcattt ttttgccttc cgcacatttc cattgctcgg tacccacacc 3540
ttgcttctcc tgcacttgcc aaccttaata ctggtttaca ttgaccaaca tcttacaagc 3600
ggggggcttg tctagggtat atataaacag tggctctccc aatcggttgc cagtctcttt 3660
tttcctttct ttccccacag attcgaaatc taaactacac atcacaccat ggccctggac 3720
aagctcgacc tgtacgtcat cattaccctc gtggttgcta tcgccgctta cttcgccaag 3780
aaccagttcc tggatcagca acaggacact ggctttctca acaccgactc cggagatggc 3840
aactctcgag acatccttca ggctctcaag aaaaacaata agaacaccct gcttctcttc 3900
ggttcccaga ctggcacagc cgaggactac gccaacaagt tgtcgcgaga gctgcactcc 3960
cgatttggct tgaagactat ggtcgcagat ttcgccgatt acgacttcga gaactttgga 4020
gacattaccg aggacatcct cgtgttcttt atcgttgcta cctacggcga aggcgagccc 4080
accgacaatg ccgacgagtt tcacacttgg ctgaccgagg aagcagatac cctgtctaca 4140
ctcaagtata ccgtcttcgg tctgggtaac tccacctacg agtttttcaa cgccatcggt 4200
cgaaagttcg acagactgct cggagagaag ggtggcgacc gatttgccga gtacggcgaa 4260
ggagacgatg gtactggcac tctcgacgag gatttcctgg cttggaagga caacgtgttc 4320
gattctctca agaacgacct gaatttcgaa gagaaggagc tcaaatacga acccaacgtc 4380
aagttgaccg agcgggacga tctgtctggc aacgatcccg acgtttcgct gggcgagcca 4440
aacgtcaagt acatcaagtc cgagggtgtt gaccttacca agggaccttt cgatcacact 4500
catccctttc tggcccgaat cgtcaagacc aaagagctct ttacttccga ggacagacac 4560
tgcgtgcacg tcgagttcga cattagcgag tccaacctca agtatactac cggagatcat 4620
cttgctatct ggccctccaa ttcggacgag aacatcaagc agtttgccaa gtgctttggc 4680
ctggaggaca agctcgatac cgtcatcgag ctgaaggctc tcgattccac ttactccatt 4740
ccatttccca atccaatcac ctacggagcc gtcattcgtc accatttgga gatctctggt 4800
cctgtgtcgc gacagttctt tctgtccatt gccggatttg ctcccgacga agagaccaaa 4860
aagtccttca ctcgaatcgg tggcgacaag caagagttcg ccagcaaggt cacccgtcga 4920
aagttcaaca ttgccgatgc tcttctgttt gcctccaaca atcgaccctg gtccgacgtt 4980
cccttcgagt tccttatcga gaacgtccag catctcactc ctcggtacta ttccatttct 5040
tcgtcctctc tcagcgagaa gcagaccatc aacgttactg ctgtggtcga agccgaggaa 5100
gaggccgatg gacgacccgt tactggtgtc gttaccaacc tgctcaagaa catcgagatt 5160
gaacagaaca agactggcga gacaccaatg gtccactacg acctcaatgg tcccagaggc 5220
aagttctcca agtttcgact gcccgtgcac gtcagacgat ccaacttcaa acttcccaag 5280
aactctacta cccctgtcat cctgattggt ccaggcaccg gtgttgctcc cctgcgaggc 5340
tttgtccggg agcgagtgca gcaagtcaag aacggagtca acgttggtaa gactgtgctg 5400
ttctacggct gtcgaaattc cgaacaggac tttctctaca aacaggagtg gagcgagtat 5460
gcctccgtcc tgggagagaa cttcgaaatg ttcaacgcct tttctcgaca ggaccctacc 5520
aagaaagtgt acgttcaaga caagatcctc gagaactctg ctcttgtcga cgagctcctg 5580
tccagcggtg caattatcta cgtttgcgga gatgcctctc gaatggctcg agacgtgcag 5640
gctgcaattg ccaagatcgt tgccaagtcc cgagacatcc acgaggacaa ggctgccgag 5700
ctggtcaagt cttggaaggt gcagaaccga taccaggagg atgtctggta agcggccgca 5760
tgagaagata aatatataaa tacattgaga tattaaatgc gctagattag agagcctcat 5820
actgctcgga gagaagccaa gacgagtact caaaggggat tacaccatcc atatccacag 5880
acacaagctg gggaaaggtt ctatatacac tttccggaat accgtagttt ccgatgttat 5940
caatgggggc agccaggatt tcaggcactt cggtgtctcg gggtgaaatg gcgttcttgg 6000
cctccatcaa gtcgtaccat gtcttcattt gcctgtcaaa gtaaaacaga agcagatgaa 6060
gaatgaactt gaagtgaagg aatttaaatg taacgaaact gaaatttgac cagatattgt 6120
gtccgcggtg gagctccagc ttttgttccc tttagtgagg gttaatttcg agcttggcgt 6180
aatcatggtc atagctgttt cctgtgtgaa attgttatcc gctcacaagc ttccacacaa 6240
cgtacgttga ttgaggtgga gccagatggg ctattgtttc atatatagac tggcagccac 6300
ctctttggcc cagcatgttt gtatacctgg aagggaaaac taaagaagct ggctagttta 6360
gtttgattat tatagtagat gtcctaatca ctagagatta gaatgtcttg gcgatgatta 6420
gtcgtcgtcc cctgtatcat gtctagacca actgtgtcat gaagttggtg ctggtgtttt 6480
acctgtgtac tacaagtagg tgtcctagat ctagtgtaca gagccgttta gacccatgtg 6540
gacttcacca ttaacgatgg aaaatgttca ttatatgaca gtatattaca atggacttgc 6600
tccatttctt ccttgcatca catgttctcc acctccatag ttgatcaaca catcatagta 6660
gctaaggctg ctgctctccc actacagtcc accacaagtt aagtagcacc gtcagtacag 6720
ctaaaagtac acgtctagta cgtttcataa ctagtcaagt agcccctatt acagatatca 6780
gcactatcac gcacgagttt ttctctgtgc tatctaatca acttgccaag tattcggaga 6840
agatacactt tcttggcatc aggtatacga gggagcctat cagatgaaaa agggtatatt 6900
ggatccattc atatccacct acacgttgtc ataatctcct cattcacgtg attcatttcg 6960
tgacactagt ttctcacttt cccccccgca cctatagtca acttggcgga cacgctactt 7020
gtagctgacg ttgatttata gacccaatca aagcgggtta tcggtcaggt agcacttatc 7080
attcatcgtt catactacga tgagcaatct cgggcatgtc cggaaaagtg tcgggcgcgc 7140
cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat tgggcgctct 7200
tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca 7260
gctcactcaa aggcggtaat acggttatcc acagaatcag gggataacgc aggaaagaac 7320
atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt 7380
ttccataggc tccgcccccc tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg 7440
cgaaacccga caggactata aagataccag gcgtttcccc ctggaagctc cctcgtgcgc 7500
tctcctgttc cgaccctgcc gcttaccgga tacctgtccg cctttctccc ttcgggaagc 7560
gtggcgcttt ctcatagctc acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc 7620
aagctgggct gtgtgcacga accccccgtt cagcccgacc gctgcgcctt atccggtaac 7680
tatcgtcttg agtccaaccc ggtaagacac gacttatcgc cactggcagc agccactggt 7740
aacaggatta gcagagcgag gtatgtaggc ggtgctacag agttcttgaa gtggtggcct 7800
aactacggct acactagaag aacagtattt ggtatctgcg ctctgctgaa gccagttacc 7860
ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt 7920
ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga agatcctttg 7980
atcttttcta cggggtctga cgctcagtgg aacgaaaact cacgttaagg gattttggtc 8040
atgagattat caaaaaggat cttcacctag atccttttaa attaaaaatg aagttttaaa 8100
tcaatctaaa gtatatatga gtaaacttgg tctgacagtt accaatgctt aatcagtgag 8160
gcacctatct cagcgatctg tctatttcgt tcatccatag ttgcctgact ccccgtcgtg 8220
tagataacta cgatacggga gggcttacca tctggcccca gtgctgcaat gataccgcga 8280
gacccacgct caccggctcc agatttatca gcaataaacc agccagccgg aagggccgag 8340
cgcagaagtg gtcctgcaac tttatccgcc tccatccagt ctattaattg ttgccgggaa 8400
gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat tgctacaggc 8460
atcgtggtgt cacgctcgtc gtttggtatg gcttcattca gctccggttc ccaacgatca 8520
aggcgagtta catgatcccc catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg 8580
atcgttgtca gaagtaagtt ggccgcagtg ttatcactca tggttatggc agcactgcat 8640
aattctctta ctgtcatgcc atccgtaaga tgcttttctg tgactggtga gtactcaacc 8700
aagtcattct gagaatagtg tatgcggcga ccgagttgct cttgcccggc gtcaatacgg 8760
gataataccg cgccacatag cagaacttta aaagtgctca tcattggaaa acgttcttcg 8820
gggcgaaaac tctcaaggat cttaccgctg ttgagatcca gttcgatgta acccactcgt 8880
gcacccaact gatcttcagc atcttttact ttcaccagcg tttctgggtg agcaaaaaca 8940
ggaaggcaaa atgccgcaaa aaagggaata agggcgacac ggaaatgttg aatactcata 9000
ctcttccttt ttcaatatta ttgaagcatt tatcagggtt attgtctcat gagcggatac 9060
atatttgaat gtatttagaa aaataaacaa ataggggttc cgcgcacatt tccccgaaaa 9120
gtgccacctg atgcggtgtg aaataccgca cagatgcgta aggagaaaat accgcatcag 9180
gaaattgtaa gcgttaatat tttgttaaaa ttcgcgttaa atttttgtta aatcagctca 9240
ttttttaacc aataggccga aatcggcaaa atcccttata aatcaaaaga atagaccgag 9300
atagggttga gtgttgttcc agtttggaac aagagtccac tattaaagaa cgtggactcc 9360
aacgtcaaag ggcgaaaaac cgtctatcag ggcgatggcc cactacgtga accatcaccc 9420
taatcaagtt ttttggggtc gaggtgccgt aaagcactaa atcggaaccc taaagggagc 9480
ccccgattta gagcttgacg gggaaagccg gcgaacgtgg cgagaaagga agggaagaaa 9540
gcgaaaggag cgggcgctag ggcgctggca agtgtagcgg tcacgctgcg cgtaaccacc 9600
acacccgccg cgcttaatgc gccgctacag ggcgcgtcca ttcgccattc aggctgcgca 9660
actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg 9720
gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta 9780
aaacgacggc cagtgaattg taatacgact cactataggg cgaattgggc ccgacgtcgc 9840
atgcattccg acagcagcga ctgggcacca tgatcaagcg aaacaccttc ccccagctgc 9900
cctggcaaac catcaagaac cctactttca tcaagtgcaa gaacggttct actcttctca 9960
cctccggtgt ctacggctgg tgccgaaagc ctaactacac cgctgatttc atcatgtgcc 10020
tcacctgggc tctcatgtgc ggtgttgctt ctcccctgcc ttacttctac ccggtcttct 10080
tcttcctggt gctcatccac cgagcttacc gagactttga gcgactggag cgaaagtacg 10140
gtgaggacta ccaggagttc aagcgacagg tcccttggat cttcatccct tatgttttct 10200
aaacgataag cttagtgagc gaatggtgag gttacttaat tgagtggcca gcctatggga 10260
ttgtataaca gacagtcaat atattactga aaagactgaa cagccagacg gagtgaggtt 10320
gtgagtgaat cgtagagggc ggctattaca gcaagtctac tctacagtgt actaacacag 10380
cagagaacaa atacaggtgt gcattcggct atctgagaat tagttggaga gctcgagacc 10440
ctcggcgata aactgctcct cggttttgtg tccatacttg tacggaccat tgtaatgggg 10500
caagtcgttg agttctcgtc gtccgacgtt cagagcacag aaaccaatgt aatcaatgta 10560
gcagagatgg ttctgcaaaa gattgatttg tgcgagcagg ttaattaact ttggccggaa 10620
ttcctttacc tgcaggataa cttcgtataa tgtatgctat acgaagttat gatctctctc 10680
ttgagctttt ccataacaag ttcttctgcc tccaggaagt ccatgggtgg tttgatcatg 10740
gttttggtgt agtggtagtg cagtggtggt attgtgactg gggatgtagt tgagaataag 10800
tcatacacaa gtcagctttc ttcgagcctc atataagtat aagtagttca acgtattagc 10860
actgtaccca gcatctccgt atcgagaaac acaacaacat gccccattgg acagatcatg 10920
cggatacaca ggttgtgcag tatcatacat actcgatcag acaggtcgtc tgaccatcat 10980
acaagctgaa caagcgctcc atacttgcac gctctctata tacacagtta aattacatat 11040
ccatagtcta acctctaaca gttaatcttc tggtaagcct cccagccagc cttctggtat 11100
cgcttggcct cctcaatagg atctcggttc tggccgtaca gacctcggcc gacaattatg 11160
atatccgttc cggtagacat gacatcctca acagttcggt actgctgtcc gagagcgtct 11220
cccttgtcgt caagacccac cccgggggtc agaataagcc agtcctcaga gtcgccctta 11280
ggtcggttct gggcaatgaa gccaaccaca aactcggggt cggatcgggc aagctcaatg 11340
gtctgcttgg agtactcgcc agtggccaga gagcccttgc aagacagctc ggccagcatg 11400
agcagacctc tggccagctt ctcgttggga gaggggacta ggaactcctt gtactgggag 11460
ttctcgtagt cagagacgtc ctccttcttc tgttcagaga cagtttcctc ggcaccagct 11520
cgcaggccag caatgattcc ggttccgggt acaccgtggg cgttggtgat atcggaccac 11580
tcggcgattc ggtgacaccg gtactggtgc ttgacagtgt tgccaatatc tgcgaacttt 11640
ctgtcctcga acaggaagaa accgtgctta agagcaagtt ccttgagggg gagcacagtg 11700
ccggcgtagg tgaagtcgtc aatgatgtcg atatgggttt tgatcatgca cacataaggt 11760
ccgaccttat cggcaagctc aatgagctcc ttggtggtgg taacatccag agaagcacac 11820
aggttggttt tcttggctgc cacgagcttg agcactcgag cggcaaaggc ggacttgtgg 11880
acgttagctc gagcttcgta ggagggcatt ttggtggtga agaggagact gaaataaatt 11940
tagtctgcag aactttttat cggaacctta tctggggcag tgaagtatat gttatggtaa 12000
tagttacgag ttagttgaac ttatagatag actggactat acggctatcg gtccaaatta 12060
gaaagaacgt caatggctct ctgggcgtcg cctttgccga caaaaatgtg atcatgatga 12120
aagccagcaa tgacgttgca gctgatattg ttgtcggcca accgcgccga aaacgcagct 12180
gtcagaccca cagcctccaa cgaagaatgt atcgtcaaag tgatccaagc acactcatag 12240
ttggagtcgt actccaaagg cggcaatgac gagtcagaca gatactcgtc gacgcgataa 12300
cttcgtataa tgtatgctat acgaagttat cgtacgatag ttagtagaca acaat 12355
<210> 83
<211> 1557
<212> DNA
<213> 人工序列
<220>
<223> CtCYPs(52A17)
<400> 83
atggccatcg agcagctgct cgagtactgg tacgtcgttg tgcccgtcct gtacattatc 60
aagcagctcc ttgcctacac caagactcga gtgctgatga aaaagctcgg agccgctccc 120
gtcaccaaca agctgtacga caacgccttc ggtatcgtca acggctggaa ggctcttcag 180
ttcaagaaag agggccgagc tcaggaatac aacgactaca agttcgatca ctccaagaat 240
ccttctgtgg gaacctacgt ctccattctg tttggcactc gaatcgtggt taccaaggat 300
cccgagaaca tcaaggccat tctcgcaacc cagttcggag acttttcgct gggcaagcga 360
cacactctct tcaagccctt gctgggagac ggtatcttca cactcgatgg agaaggctgg 420
aagcattcca gagctatgct gcgacctcag tttgcccgag agcaagttgc tcacgtcacc 480
agcctcgaac cacacttcca gctgctcaag aaacatatcc tcaagcacaa gggcgagtac 540
ttcgacattc aggagctgtt ctttcgattc accgtggact ctgccacgga gtttctgttc 600
ggcgagtccg ttcactctct caaggacgag tcgattggaa tcaaccagga cgatatcgac 660
ttcgctggtc ggaaggactt tgccgagtcc ttcaacaagg cacaggaata cttggccatt 720
cgaactctgg tgcagacctt ctactggctc gtcaacaaca aggagtttcg agactgcacc 780
aagctggttc acaagttcac caactactat gtccagaagg ctctcgatgc atctcccgag 840
gaacttgaga agcaaagcgg ctacgtgttc ctgtacgagc ttgtcaagca gaccagagat 900
cccaacgtgc tgcgagacca gtccctcaac atcttgctgg ccggacgaga caccactgct 960
ggcctcctgt cgtttgcagt cttcgagttg gctcgtcatc ccgagatctg ggccaagctg 1020
cgagaggaaa tcgagcaaca gttcggactt ggcgaggact ctcgtgtcga agagattacc 1080
ttcgagagcc tcaagcgatg cgagtacctc aaggcctttc tcaacgaaac cctgcggatc 1140
tacccttccg ttcctcgaaa cttcagaatc gctaccaaga acacaaccct tccccgaggc 1200
ggtggatcgg acggtacttc tccaatcctc attcagaagg gcgaggccgt gtcctacggt 1260
atcaattcta ctcatctgga tcctgtctat tacggacccg acgctgccga gtttcgaccc 1320
gagcgatggt tcgaaccttc gaccaaaaag ctcggctggg cctaccttcc cttcaacgga 1380
ggtccacgaa tctgtctggg ccaacagttt gccctcaccg aggctggcta cgtgctggtc 1440
agactcgttc aggagttctc ccacgtccga tccgatcccg acgaggtgta ccctcccaag 1500
cgacttacaa acctgaccat gtgtctccag gacggtgcca ttgtcaagtt cgactaa 1557
<210> 84
<211> 518
<212> PRT
<213> 人工序列
<220>
<223> CtCYPs(52A17)蛋白质
<400> 84
Met Ala Ile Glu Gln Leu Leu Glu Tyr Trp Tyr Val Val Val Pro Val
1 5 10 15
Leu Tyr Ile Ile Lys Gln Leu Leu Ala Tyr Thr Lys Thr Arg Val Leu
20 25 30
Met Lys Lys Leu Gly Ala Ala Pro Val Thr Asn Lys Leu Tyr Asp Asn
35 40 45
Ala Phe Gly Ile Val Asn Gly Trp Lys Ala Leu Gln Phe Lys Lys Glu
50 55 60
Gly Arg Ala Gln Glu Tyr Asn Asp Tyr Lys Phe Asp His Ser Lys Asn
65 70 75 80
Pro Ser Val Gly Thr Tyr Val Ser Ile Leu Phe Gly Thr Arg Ile Val
85 90 95
Val Thr Lys Asp Pro Glu Asn Ile Lys Ala Ile Leu Ala Thr Gln Phe
100 105 110
Gly Asp Phe Ser Leu Gly Lys Arg His Thr Leu Phe Lys Pro Leu Leu
115 120 125
Gly Asp Gly Ile Phe Thr Leu Asp Gly Glu Gly Trp Lys His Ser Arg
130 135 140
Ala Met Leu Arg Pro Gln Phe Ala Arg Glu Gln Val Ala His Val Thr
145 150 155 160
Ser Leu Glu Pro His Phe Gln Leu Leu Lys Lys His Ile Leu Lys His
165 170 175
Lys Gly Glu Tyr Phe Asp Ile Gln Glu Leu Phe Phe Arg Phe Thr Val
180 185 190
Asp Ser Ala Thr Glu Phe Leu Phe Gly Glu Ser Val His Ser Leu Lys
195 200 205
Asp Glu Ser Ile Gly Ile Asn Gln Asp Asp Ile Asp Phe Ala Gly Arg
210 215 220
Lys Asp Phe Ala Glu Ser Phe Asn Lys Ala Gln Glu Tyr Leu Ala Ile
225 230 235 240
Arg Thr Leu Val Gln Thr Phe Tyr Trp Leu Val Asn Asn Lys Glu Phe
245 250 255
Arg Asp Cys Thr Lys Leu Val His Lys Phe Thr Asn Tyr Tyr Val Gln
260 265 270
Lys Ala Leu Asp Ala Ser Pro Glu Glu Leu Glu Lys Gln Ser Gly Tyr
275 280 285
Val Phe Leu Tyr Glu Leu Val Lys Gln Thr Arg Asp Pro Asn Val Leu
290 295 300
Arg Asp Gln Ser Leu Asn Ile Leu Leu Ala Gly Arg Asp Thr Thr Ala
305 310 315 320
Gly Leu Leu Ser Phe Ala Val Phe Glu Leu Ala Arg His Pro Glu Ile
325 330 335
Trp Ala Lys Leu Arg Glu Glu Ile Glu Gln Gln Phe Gly Leu Gly Glu
340 345 350
Asp Ser Arg Val Glu Glu Ile Thr Phe Glu Ser Leu Lys Arg Cys Glu
355 360 365
Tyr Leu Lys Ala Phe Leu Asn Glu Thr Leu Arg Ile Tyr Pro Ser Val
370 375 380
Pro Arg Asn Phe Arg Ile Ala Thr Lys Asn Thr Thr Leu Pro Arg Gly
385 390 395 400
Gly Gly Ser Asp Gly Thr Ser Pro Ile Leu Ile Gln Lys Gly Glu Ala
405 410 415
Val Ser Tyr Gly Ile Asn Ser Thr His Leu Asp Pro Val Tyr Tyr Gly
420 425 430
Pro Asp Ala Ala Glu Phe Arg Pro Glu Arg Trp Phe Glu Pro Ser Thr
435 440 445
Lys Lys Leu Gly Trp Ala Tyr Leu Pro Phe Asn Gly Gly Pro Arg Ile
450 455 460
Cys Leu Gly Gln Gln Phe Ala Leu Thr Glu Ala Gly Tyr Val Leu Val
465 470 475 480
Arg Leu Val Gln Glu Phe Ser His Val Arg Ser Asp Pro Asp Glu Val
485 490 495
Tyr Pro Pro Lys Arg Leu Thr Asn Leu Thr Met Cys Leu Gln Asp Gly
500 505 510
Ala Ile Val Lys Phe Asp
515
<210> 85
<211> 2043
<212> DNA
<213> 人工序列
<220>
<223> CtCPRs (CPR)
<400> 85
atggccctgg acaagctcga cctgtacgtc atcattaccc tcgtggttgc tatcgccgct 60
tacttcgcca agaaccagtt cctggatcag caacaggaca ctggctttct caacaccgac 120
tccggagatg gcaactctcg agacatcctt caggctctca agaaaaacaa taagaacacc 180
ctgcttctct tcggttccca gactggcaca gccgaggact acgccaacaa gttgtcgcga 240
gagctgcact cccgatttgg cttgaagact atggtcgcag atttcgccga ttacgacttc 300
gagaactttg gagacattac cgaggacatc ctcgtgttct ttatcgttgc tacctacggc 360
gaaggcgagc ccaccgacaa tgccgacgag tttcacactt ggctgaccga ggaagcagat 420
accctgtcta cactcaagta taccgtcttc ggtctgggta actccaccta cgagtttttc 480
aacgccatcg gtcgaaagtt cgacagactg ctcggagaga agggtggcga ccgatttgcc 540
gagtacggcg aaggagacga tggtactggc actctcgacg aggatttcct ggcttggaag 600
gacaacgtgt tcgattctct caagaacgac ctgaatttcg aagagaagga gctcaaatac 660
gaacccaacg tcaagttgac cgagcgggac gatctgtctg gcaacgatcc cgacgtttcg 720
ctgggcgagc caaacgtcaa gtacatcaag tccgagggtg ttgaccttac caagggacct 780
ttcgatcaca ctcatccctt tctggcccga atcgtcaaga ccaaagagct ctttacttcc 840
gaggacagac actgcgtgca cgtcgagttc gacattagcg agtccaacct caagtatact 900
accggagatc atcttgctat ctggccctcc aattcggacg agaacatcaa gcagtttgcc 960
aagtgctttg gcctggagga caagctcgat accgtcatcg agctgaaggc tctcgattcc 1020
acttactcca ttccatttcc caatccaatc acctacggag ccgtcattcg tcaccatttg 1080
gagatctctg gtcctgtgtc gcgacagttc tttctgtcca ttgccggatt tgctcccgac 1140
gaagagacca aaaagtcctt cactcgaatc ggtggcgaca agcaagagtt cgccagcaag 1200
gtcacccgtc gaaagttcaa cattgccgat gctcttctgt ttgcctccaa caatcgaccc 1260
tggtccgacg ttcccttcga gttccttatc gagaacgtcc agcatctcac tcctcggtac 1320
tattccattt cttcgtcctc tctcagcgag aagcagacca tcaacgttac tgctgtggtc 1380
gaagccgagg aagaggccga tggacgaccc gttactggtg tcgttaccaa cctgctcaag 1440
aacatcgaga ttgaacagaa caagactggc gagacaccaa tggtccacta cgacctcaat 1500
ggtcccagag gcaagttctc caagtttcga ctgcccgtgc acgtcagacg atccaacttc 1560
aaacttccca agaactctac tacccctgtc atcctgattg gtccaggcac cggtgttgct 1620
cccctgcgag gctttgtccg ggagcgagtg cagcaagtca agaacggagt caacgttggt 1680
aagactgtgc tgttctacgg ctgtcgaaat tccgaacagg actttctcta caaacaggag 1740
tggagcgagt atgcctccgt cctgggagag aacttcgaaa tgttcaacgc cttttctcga 1800
caggacccta ccaagaaagt gtacgttcaa gacaagatcc tcgagaactc tgctcttgtc 1860
gacgagctcc tgtccagcgg tgcaattatc tacgtttgcg gagatgcctc tcgaatggct 1920
cgagacgtgc aggctgcaat tgccaagatc gttgccaagt cccgagacat ccacgaggac 1980
aaggctgccg agctggtcaa gtcttggaag gtgcagaacc gataccagga ggatgtctgg 2040
taa 2043
<210> 86
<211> 680
<212> PRT
<213> 热带假丝酵母
<400> 86
Met Ala Leu Asp Lys Leu Asp Leu Tyr Val Ile Ile Thr Leu Val Val
1 5 10 15
Ala Ile Ala Ala Tyr Phe Ala Lys Asn Gln Phe Leu Asp Gln Gln Gln
20 25 30
Asp Thr Gly Phe Leu Asn Thr Asp Ser Gly Asp Gly Asn Ser Arg Asp
35 40 45
Ile Leu Gln Ala Leu Lys Lys Asn Asn Lys Asn Thr Leu Leu Leu Phe
50 55 60
Gly Ser Gln Thr Gly Thr Ala Glu Asp Tyr Ala Asn Lys Leu Ser Arg
65 70 75 80
Glu Leu His Ser Arg Phe Gly Leu Lys Thr Met Val Ala Asp Phe Ala
85 90 95
Asp Tyr Asp Phe Glu Asn Phe Gly Asp Ile Thr Glu Asp Ile Leu Val
100 105 110
Phe Phe Ile Val Ala Thr Tyr Gly Glu Gly Glu Pro Thr Asp Asn Ala
115 120 125
Asp Glu Phe His Thr Trp Leu Thr Glu Glu Ala Asp Thr Leu Ser Thr
130 135 140
Leu Lys Tyr Thr Val Phe Gly Leu Gly Asn Ser Thr Tyr Glu Phe Phe
145 150 155 160
Asn Ala Ile Gly Arg Lys Phe Asp Arg Leu Leu Gly Glu Lys Gly Gly
165 170 175
Asp Arg Phe Ala Glu Tyr Gly Glu Gly Asp Asp Gly Thr Gly Thr Leu
180 185 190
Asp Glu Asp Phe Leu Ala Trp Lys Asp Asn Val Phe Asp Ser Leu Lys
195 200 205
Asn Asp Leu Asn Phe Glu Glu Lys Glu Leu Lys Tyr Glu Pro Asn Val
210 215 220
Lys Leu Thr Glu Arg Asp Asp Leu Ser Gly Asn Asp Pro Asp Val Ser
225 230 235 240
Leu Gly Glu Pro Asn Val Lys Tyr Ile Lys Ser Glu Gly Val Asp Leu
245 250 255
Thr Lys Gly Pro Phe Asp His Thr His Pro Phe Leu Ala Arg Ile Val
260 265 270
Lys Thr Lys Glu Leu Phe Thr Ser Glu Asp Arg His Cys Val His Val
275 280 285
Glu Phe Asp Ile Ser Glu Ser Asn Leu Lys Tyr Thr Thr Gly Asp His
290 295 300
Leu Ala Ile Trp Pro Ser Asn Ser Asp Glu Asn Ile Lys Gln Phe Ala
305 310 315 320
Lys Cys Phe Gly Leu Glu Asp Lys Leu Asp Thr Val Ile Glu Leu Lys
325 330 335
Ala Leu Asp Ser Thr Tyr Ser Ile Pro Phe Pro Asn Pro Ile Thr Tyr
340 345 350
Gly Ala Val Ile Arg His His Leu Glu Ile Ser Gly Pro Val Ser Arg
355 360 365
Gln Phe Phe Leu Ser Ile Ala Gly Phe Ala Pro Asp Glu Glu Thr Lys
370 375 380
Lys Ser Phe Thr Arg Ile Gly Gly Asp Lys Gln Glu Phe Ala Ser Lys
385 390 395 400
Val Thr Arg Arg Lys Phe Asn Ile Ala Asp Ala Leu Leu Phe Ala Ser
405 410 415
Asn Asn Arg Pro Trp Ser Asp Val Pro Phe Glu Phe Leu Ile Glu Asn
420 425 430
Val Gln His Leu Thr Pro Arg Tyr Tyr Ser Ile Ser Ser Ser Ser Leu
435 440 445
Ser Glu Lys Gln Thr Ile Asn Val Thr Ala Val Val Glu Ala Glu Glu
450 455 460
Glu Ala Asp Gly Arg Pro Val Thr Gly Val Val Thr Asn Leu Leu Lys
465 470 475 480
Asn Ile Glu Ile Glu Gln Asn Lys Thr Gly Glu Thr Pro Met Val His
485 490 495
Tyr Asp Leu Asn Gly Pro Arg Gly Lys Phe Ser Lys Phe Arg Leu Pro
500 505 510
Val His Val Arg Arg Ser Asn Phe Lys Leu Pro Lys Asn Ser Thr Thr
515 520 525
Pro Val Ile Leu Ile Gly Pro Gly Thr Gly Val Ala Pro Leu Arg Gly
530 535 540
Phe Val Arg Glu Arg Val Gln Gln Val Lys Asn Gly Val Asn Val Gly
545 550 555 560
Lys Thr Val Leu Phe Tyr Gly Cys Arg Asn Ser Glu Gln Asp Phe Leu
565 570 575
Tyr Lys Gln Glu Trp Ser Glu Tyr Ala Ser Val Leu Gly Glu Asn Phe
580 585 590
Glu Met Phe Asn Ala Phe Ser Arg Gln Asp Pro Thr Lys Lys Val Tyr
595 600 605
Val Gln Asp Lys Ile Leu Glu Asn Ser Ala Leu Val Asp Glu Leu Leu
610 615 620
Ser Ser Gly Ala Ile Ile Tyr Val Cys Gly Asp Ala Ser Arg Met Ala
625 630 635 640
Arg Asp Val Gln Ala Ala Ile Ala Lys Ile Val Ala Lys Ser Arg Asp
645 650 655
Ile His Glu Asp Lys Ala Ala Glu Leu Val Lys Ser Trp Lys Val Gln
660 665 670
Asn Arg Tyr Gln Glu Asp Val Trp
675 680
<210> 87
<211> 12573
<212> DNA
<213> 人工序列
<220>
<223> pZKADn-C2F1U质粒
<400> 87
cgatagtgta cgcagtacta tagaggaaca attgccccgg agaagacggc caggccgcct 60
agatgacaaa ttcaacaact cacagctgac tttctgccat tgccactagg ggggggcctt 120
tttatatggc caagccaagc tctccacgtc ggttgggctg cacccaacaa taaatgggta 180
gggttgcacc aacaaaggga tgggatgggg ggtagaagat acgaggataa cggggctcaa 240
tggcacaaat aagaacgaat actgccatta agactcgtga tccagcgact gacaccattg 300
catcatctaa gggcctcaaa actacctcgg aactgctgcg ctgatctgga caccacagag 360
gttccgagca ctttaggttg caccaaatgt cccaccaggt gcaggcagaa aacgctggaa 420
cagcgtgtac agtttgtctt aacaaaaagt gagggcgctg aggtcgagca gggtggtgtg 480
acttgttata gcctttagag ctgcgaaagc gcgtatggat ttggctcatc aggccagatt 540
gagggtctgt ggacacatgt catgttagtg tacttcaatc gccccctgga tatagccccg 600
acaataggcc gtggcctcat ttttttgcct tccgcacatt tccattgctc ggtacccaca 660
ccttgcttct cctgcacttg ccaaccttaa tactggttta cattgaccaa catcttacaa 720
gcggggggct tgtctagggt atatataaac agtggctctc ccaatcggtt gccagtctct 780
tttttccttt ctttccccac agattcgaaa tctaaactac acatcacacc atggcctccc 840
accaggtcga ggaccacgat ctggacgtgt tctgcctcct ggccgacgct gttctccacg 900
agattcctcc ctccgaaatc gtcgagtacc ttcatcccga tttccccaag gacaagatcg 960
aagagtacct gaccggcttt tctcgaccct ccgccgttcc tcagttccga cagtgtgcca 1020
agaaactcat caaccgaggt tccgagctgt cgatcaagct cttcctttac ttgaccactg 1080
ctctggactc tcgaatcctt gcaccagccc tgaccaactc gctcactctg atcagagaca 1140
tggatctttc ccagcgagag gaactgttgc ggtcctggcg agattctcca ctgactgcca 1200
agcgaagact ctttcgagtc tacgcctcct ttaccctgtc tacattcaac aagctcggaa 1260
ccgacttgca cttcaaggcc ctgggctacc ctggtcgaga gctccggacc cagattcaag 1320
actacgaggt cgatcccttt cgatactcgt tcatggagaa gctcaaacac gagggacatg 1380
aactgttcct tcccgatatc gacgttctga tcattggctc tggatccggt gcaggcgtgg 1440
tcgctcagac tcttaccgag agcggactca agtctctggt tctcgagaag ggcaagtact 1500
ttgcctccga agagctgtgc atgaccgatc tcgacggaaa cgaggccctg ttcgaaagcg 1560
gtggcactat tccttccacc aatcaacagt tgttcatgat cgctggatct acttttggtg 1620
gaggctccac cgtcaactgg tctgcctgtc tcaagactcc cttcaaggtt cgaaaggagt 1680
ggtacgacga tttcggactg gactttgtgg ctacccagca atacgacgat tgcatggact 1740
acgtgtggaa gaaaatgggt gcctcgaccg agcacatcga gcattctgct gcaaatgccg 1800
tcatcatgga cggagctgcc aagcttggct acgctcaccg agccctcgag cagaacaccg 1860
gtggccatgt tcacgactgt ggaatgtgcc acctgggctg tcgattcggt atcaagcagg 1920
gaggcgtcaa ctgctggttt cgagaaccct ccgagaaggg ttccaagttc atggagcagg 1980
tcgttgtcga gaagattctg cagcacaagg gcaaggccac tggaattctc tgcagagata 2040
ccgagtctgg catcaagttc aagattactg gacccaagaa atacgtcgtg tccggtggct 2100
ctttgcagac ccctgttctc cttcagaagt ctggcttcaa gaacaagcac attggagcca 2160
acctcaagct gcatcccgtc tcggttgctc ttggcgactt tggtaacgag gtggacttcg 2220
aagcctacaa gcgacccctc atgaccgcag tctgcaatgc cgtggacgat ctggacggca 2280
aggctcacgg aacacgaatc gaggccattc tgcacgctcc ttacgtcact gctcccttct 2340
atccctggca gtccggtgcc caggctcgga agaacttgct caaatacaag cagaccgtgc 2400
ctctgctcct tctgtctcga gacacctcct cgggtaccgt tacatacgac aaacagaagc 2460
cagatgtctt ggtggtcgac tacactgtca acaagttcga tcgaaactcc atcctgcagg 2520
gatttctcgt tgcttccgac attttgtaca tcgagggtgc caaggagatt ctgtctcccc 2580
aggcttgggt gcccaccttc aagagcaaca agcccaagca cgccagatcc atcaaggacg 2640
aggactacgt caagtggcga gaaaccgtgg ccaagattcc ctttgattcc tacggctcgc 2700
cttacggttc tgctcatcag atgtcctcgt gtcgaatgtc tggcaaggga cccggatacg 2760
gtgcctgcga taccaaggga cgactcttcg agtgcaacaa tgtgtacgtt gcagacgcct 2820
ccgtcatgcc tactgcttct ggagtcaacc ccatgattac cacaatggcc tttgcacgac 2880
acgttgctct ctgtctggcc aaggaccttc aaccccagac caagctgtaa gcggccgcat 2940
ggagcgtgtg ttctgagtcg atgttttcta tggagttgtg agtgttagta gacatgatgg 3000
gtttatatat gatgaatgaa tagatgtgat tttgatttgc acgatggaat tgagaacttt 3060
gtaaacgtac atgggaatgt atgaatgtgg gggttttgtg actggataac tgacggtcag 3120
tggacgccgt tgttcaaata tccaagagat gcgagaaact ttgggtcaag tgaacatgtc 3180
ctctctgttc aagtaaacca tcaactatgg gtagtatatt tagtaaggac aagagttgag 3240
attctttgga gtcctagaaa cgtattttcg cgttccaaga tcaaattagt agagtaatac 3300
gggcacggga atccattcat agtctcaagt ttaaaccacg ccaactgata tccccttacg 3360
ttaccccctc atcacctggt gaggcaaaac tgtaaggtga aagctaaaaa tgacatctca 3420
gctgcacgaa ggaccggggc ttaaaagacg ggctggtgct tgtgatttaa aactggacaa 3480
atctcagctt gcttgaaatt ttggtctcca actgtttccg agcgaatcgc acacaaaccg 3540
ggcttctctc tgcagaccac gcccccgaaa ctctttctcc caccaccacc aacactccct 3600
ttccattccc acaccgttcc tctctcatcc ttgcgcaatc atcttcgtct gcgacatatt 3660
gtacgacata cagtaccacg gaacgtttca gaccgtcgac gtgaacacat cttaggaaca 3720
gcaacctgag ctacagaaat ctatctatag gcggataaaa aaacgcaccc actgctcgtc 3780
ctccttgctc ctcgaaaccg actcctctac acacgtcaaa tccgaggttg aaatcttccc 3840
cacatttggc agccaaacca gcacatccca gcaacctcgc acagcgccga aatcgacctg 3900
tcgacttggc cacaaaaaaa agcaccggct ctgcaacagt tctcacgacc aattacgtac 3960
aagtacgaaa tcgttcgtgg accgtgactg ataagctccc actttttctt ctaacaacag 4020
gcaacagaca agtcacacaa aacaaaagcc atggccaagt cctacaagct gcccaagcct 4080
tccaagatcg ctcccatcat tcgaggcaag acctctgcca agaccaaagg ctccactcag 4140
cctcccgagt ctccacctgc ctcggctaag atcacagctc cccagctcga acccgtcgag 4200
cccaccagcg actccgagat tccttctacc aaggtctccg ttcgacgtac atcgaccact 4260
tccagcaaga ccatcacgga cgattccatc tctgccactt ccaccgacca gatgaagtcg 4320
agcaccaacg aagccgagat tccaaacccc aagccagagt ccgtggttgc ccctatgacc 4380
aagcccgtcg aggacgataa actcgaggac cacaccaagc tggagactgc cgaatcgtac 4440
atcaacgttc agaaggaagc tgcaattcct ggcgagacca agagcgtcgt ttcctcgaag 4500
actgcttctg tgctcgagta cacacctctt tccgagatct ctggcggagt caagaaagtg 4560
gtcgacggtt tccacaccgg caagacgcat cccctggagt tcagactcaa gcagcttcga 4620
aacctgtact ttgctatgaa ggacaatcag gaggccatct gcgaagcgct tgccaaggac 4680
tttcaccgag ccccttccga gactcgaaac tacgagctgg tcacaggtct caacgagctg 4740
ctctacacca tgactcaact gcacaagtgg tccaagcccc ttcctgtgga cgcgctgccc 4800
atcaacctca agaccaatcc cgtctacatc gagcggattc cagtcggaac cgttctcgtc 4860
atttctgcct tcaactatcc cttctttgtc tccgtgtctc ccatcgcagg tgctattgcc 4920
gcaggcaact ccgtcgtgtt caagccgtcg gagcttacac cccactttac caagctgttc 4980
acagagttgc tcaccaaggc tctggatccc gagatcttct acgtggtcaa cggtgccgtt 5040
tccgagacta ccgaactgct caaccagaag ttcgacaaga tcgtctacac tggcagcgac 5100
attgtcggca agatcattgc caagaaagca gcggagaccc ttactccagt catcttggag 5160
ctcggtggca agtctcctgc tttcgtgctg gacgatgtct cggacaagga tcttcccgtc 5220
atcgctcgac gtatcgcctg gggacgatac gccaacgctg gtcaaacctg cattggcgtc 5280
gactacgttc tcgtggccga gtccaagcac gagaagttca ttcaggctct gcggaatgtc 5340
atcgaaaacg agttctttcc caacatcgac cagaactcca actttaccca catgatccac 5400
gagcgagcct tcctcaagat gaaaaagatc ctggatacca ctgccggaga gatcattatc 5460
ggtggcaagc tcgacagcga gtccaactac gtgtctccca ccgtcatcga caatgcttcg 5520
tgggacgatt cctcgatgaa ggaggaaatc ttcggtccta ttcttcccat cattacttac 5580
accgacctca agcaggcctg caacgaggtc atttctcatc atgacactcc ccttgctcag 5640
tacatcttca cgtctggctc cacctcgcga aagtacaact ctcagatcaa cacaatctcc 5700
accatgattc gatcgggtgg actggtcatc aacgacgttc tcatgcatat ctcccttcat 5760
aacgctccct tcggtggcgt gggaaagtcc ggctacggtg cctatcacgg agagttctcc 5820
tacagagcct ttacccacga gcgaaccgtc ctcgagcagc atctgtggaa cgattggatt 5880
atcaactctc ggtatcctcc ctactccaac aagaaagaac gactggtggc ctccagccag 5940
tccaactacg gtggcagagt ctggtttggt cgaaagggcg acgttcgaat cgagggaccc 6000
actaccttct tcagcgcctg gaccaacgtg ctcggcgttg ctgccgtcgt tcgagacttc 6060
atcggtgctt ccatgtaagc ggccgcatga gaagataaat atataaatac attgagatat 6120
taaatgcgct agattagaga gcctcatact gctcggagag aagccaagac gagtactcaa 6180
aggggattac accatccata tccacagaca caagctgggg aaaggttcta tatacacttt 6240
ccggaatacc gtagtttccg atgttatcaa tgggggcagc caggatttca ggcacttcgg 6300
tgtctcgggg tgaaatggcg ttcttggcct ccatcaagtc gtaccatgtc ttcatttgcc 6360
tgtcaaagta aaacagaagc agatgaagaa tgaacttgaa gtgaaggaat ttaaatgtaa 6420
cgaaactgaa atttgaccag atattgtgtc cgcggtggag ctccagcttt tgttcccttt 6480
agtgagggtt aatttcgagc ttggcgtaat catggtcata gctgtttcct gtgtgaaatt 6540
gttatccgct cacaagcttc cacacaacgt acgaacgcac ggtatcggag catcggatac 6600
cccacattga gccaacctac tttgtagtgt acatactgta gagaagaggg acgcttcgac 6660
atgattggcc gatgtgggca tgtagaaaca cgatatatgg tgcttactaa tggacacttg 6720
cacaaccatt tctcttctag ggtaacctcg acagtgacag ccgttttttc tgcgctagcg 6780
tgtcgtcgta tttttggttt cgacatgtta agatttgtgg ggcaatcgag cgacattaag 6840
gtgcatcgga tcatcggccc aagggagagt cactggagtc tcgtagggtg gaggaaaaga 6900
gcaatttggg acgatttggg gcgatttgaa gacggattgg ggcaggtgtt tgtcacgtga 6960
ctgtggtatt actattacta atcgtcattg ttcgaaagtc ctgtcaattg tatcactttg 7020
gtgggtctac caaaacactg gtcaaatcta cgccacatga aaatataaag tttcacatta 7080
gccacattga ggggtaccct tagttggaat ctacaaggag ggatgcagtg aaaaatgttc 7140
ctttgatcct tcagagatga aaatgccatt gaccaatcac agcgggttta aagagtggcg 7200
aaaagagccc cttttttgca ccggttggcc cagcagccac gtgactggcc ccttccccat 7260
cccactcaac tgttgaggag gtgggatgcc aagatgcacc gtcaatgtac ttccgtgtat 7320
ccttctgcaa ttgatccgag ataggcgcgc cagctgcatt aatgaatcgg ccaacgcgcg 7380
gggagaggcg gtttgcgtat tgggcgctct tccgcttcct cgctcactga ctcgctgcgc 7440
tcggtcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat acggttatcc 7500
acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca aaaggccagg 7560
aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 7620
cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 7680
gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 7740
tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg 7800
tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 7860
cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 7920
gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 7980
ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag aacagtattt 8040
ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 8100
ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 8160
agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 8220
aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag 8280
atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg 8340
tctgacagtt accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt 8400
tcatccatag ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca 8460
tctggcccca gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca 8520
gcaataaacc agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc 8580
tccatccagt ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt 8640
ttgcgcaacg ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg 8700
gcttcattca gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc 8760
aaaaaagcgg ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg 8820
ttatcactca tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga 8880
tgcttttctg tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga 8940
ccgagttgct cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta 9000
aaagtgctca tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg 9060
ttgagatcca gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact 9120
ttcaccagcg tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata 9180
agggcgacac ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt 9240
tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa 9300
ataggggttc cgcgcacatt tccccgaaaa gtgccacctg atgcggtgtg aaataccgca 9360
cagatgcgta aggagaaaat accgcatcag gaaattgtaa gcgttaatat tttgttaaaa 9420
ttcgcgttaa atttttgtta aatcagctca ttttttaacc aataggccga aatcggcaaa 9480
atcccttata aatcaaaaga atagaccgag atagggttga gtgttgttcc agtttggaac 9540
aagagtccac tattaaagaa cgtggactcc aacgtcaaag ggcgaaaaac cgtctatcag 9600
ggcgatggcc cactacgtga accatcaccc taatcaagtt ttttggggtc gaggtgccgt 9660
aaagcactaa atcggaaccc taaagggagc ccccgattta gagcttgacg gggaaagccg 9720
gcgaacgtgg cgagaaagga agggaagaaa gcgaaaggag cgggcgctag ggcgctggca 9780
agtgtagcgg tcacgctgcg cgtaaccacc acacccgccg cgcttaatgc gccgctacag 9840
ggcgcgtcca ttcgccattc aggctgcgca actgttggga agggcgatcg gtgcgggcct 9900
cttcgctatt acgccagctg gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa 9960
cgccagggtt ttcccagtca cgacgttgta aaacgacggc cagtgaattg taatacgact 10020
cactataggg cgaattgggc ccgacgtcgc atgctacaag tatcgcacca tacttttgct 10080
gacggcgcgc cttcttgcag tgatataatc ggtttcttgg agctgatggg gtgagcatca 10140
tacaagtatg agtacgagaa gtcgcacttg tactccaagt acaaatgccc ggaatggcag 10200
acacacaagt cctacgggtg ttcagagact actgactgga gattgcaact acaagtactg 10260
tacacacagt acaacacaca agttaactca tcattcataa ttatcataaa ctagacggcc 10320
aaaaagtcgt ggccgctcct cagcgtcaat agccgcgctt acttggagca gtccagaacg 10380
tatcgaccgg caatcttgcc ctcctccatg agcttgtaga cggattcgag ctcggagaga 10440
ccaacaataa tgatggggga cttgaccagt cctcgggcaa agaactcaat ggcctcctgg 10500
gagtcggctc ggtttccgac gtaagagccc ttgatctgaa tagatcgagc aacctgctgg 10560
aagatgggcg acttgcagac ggcaccggcg ggcagaccga ccagaacaac ggttcccagg 10620
gttcgcacgt actcaacaga ctggttgacg gcaaactcgg agacagacac gttgatgacg 10680
gcgtggggtc cgcccttggt ggcctcctgg acgtccttga ccagatcctt ggacttggca 10740
aagtcgatga agacctcggc gccgagctcc ttgcacatct tctccttgtc agcgccagtg 10800
tcaatggcca gcactcggtt aattaacttt ggccggaatt cctttacctg caggataact 10860
tcgtataatg tatgctatac gaagttatga tctctctctt gagcttttcc ataacaagtt 10920
cttctgcctc caggaagtcc atgggtggtt tgatcatggt tttggtgtag tggtagtgca 10980
gtggtggtat tgtgactggg gatgtagttg agaataagtc atacacaagt cagctttctt 11040
cgagcctcat ataagtataa gtagttcaac gtattagcac tgtacccagc atctccgtat 11100
cgagaaacac aacaacatgc cccattggac agatcatgcg gatacacagg ttgtgcagta 11160
tcatacatac tcgatcagac aggtcgtctg accatcatac aagctgaaca agcgctccat 11220
acttgcacgc tctctatata cacagttaaa ttacatatcc atagtctaac ctctaacagt 11280
taatcttctg gtaagcctcc cagccagcct tctggtatcg cttggcctcc tcaataggat 11340
ctcggttctg gccgtacaga cctcggccga caattatgat atccgttccg gtagacatga 11400
catcctcaac agttcggtac tgctgtccga gagcgtctcc cttgtcgtca agacccaccc 11460
cgggggtcag aataagccag tcctcagagt cgcccttagg tcggttctgg gcaatgaagc 11520
caaccacaaa ctcggggtcg gatcgggcaa gctcaatggt ctgcttggag tactcgccag 11580
tggccagaga gcccttgcaa gacagctcgg ccagcatgag cagacctctg gccagcttct 11640
cgttgggaga ggggactagg aactccttgt actgggagtt ctcgtagtca gagacgtcct 11700
ccttcttctg ttcagagaca gtttcctcgg caccagctcg caggccagca atgattccgg 11760
ttccgggtac accgtgggcg ttggtgatat cggaccactc ggcgattcgg tgacaccggt 11820
actggtgctt gacagtgttg ccaatatctg cgaactttct gtcctcgaac aggaagaaac 11880
cgtgcttaag agcaagttcc ttgaggggga gcacagtgcc ggcgtaggtg aagtcgtcaa 11940
tgatgtcgat atgggttttg atcatgcaca cataaggtcc gaccttatcg gcaagctcaa 12000
tgagctcctt ggtggtggta acatccagag aagcacacag gttggttttc ttggctgcca 12060
cgagcttgag cactcgagcg gcaaaggcgg acttgtggac gttagctcga gcttcgtagg 12120
agggcatttt ggtggtgaag aggagactga aataaattta gtctgcagaa ctttttatcg 12180
gaaccttatc tggggcagtg aagtatatgt tatggtaata gttacgagtt agttgaactt 12240
atagatagac tggactatac ggctatcggt ccaaattaga aagaacgtca atggctctct 12300
gggcgtcgcc tttgccgaca aaaatgtgat catgatgaaa gccagcaatg acgttgcagc 12360
tgatattgtt gtcggccaac cgcgccgaaa acgcagctgt cagacccaca gcctccaacg 12420
aagaatgtat cgtcaaagtg atccaagcac actcatagtt ggagtcgtac tccaaaggcg 12480
gcaatgacga gtcagacaga tactcgtcga cgcgataact tcgtataatg tatgctatac 12540
gaagttatcg tacgatagtt agtagacaac aat 12573
<210> 88
<211> 2100
<212> DNA
<213> 人工序列
<220>
<223> CcFAO1s (FAO)
<400> 88
atggcctccc accaggtcga ggaccacgat ctggacgtgt tctgcctcct ggccgacgct 60
gttctccacg agattcctcc ctccgaaatc gtcgagtacc ttcatcccga tttccccaag 120
gacaagatcg aagagtacct gaccggcttt tctcgaccct ccgccgttcc tcagttccga 180
cagtgtgcca agaaactcat caaccgaggt tccgagctgt cgatcaagct cttcctttac 240
ttgaccactg ctctggactc tcgaatcctt gcaccagccc tgaccaactc gctcactctg 300
atcagagaca tggatctttc ccagcgagag gaactgttgc ggtcctggcg agattctcca 360
ctgactgcca agcgaagact ctttcgagtc tacgcctcct ttaccctgtc tacattcaac 420
aagctcggaa ccgacttgca cttcaaggcc ctgggctacc ctggtcgaga gctccggacc 480
cagattcaag actacgaggt cgatcccttt cgatactcgt tcatggagaa gctcaaacac 540
gagggacatg aactgttcct tcccgatatc gacgttctga tcattggctc tggatccggt 600
gcaggcgtgg tcgctcagac tcttaccgag agcggactca agtctctggt tctcgagaag 660
ggcaagtact ttgcctccga agagctgtgc atgaccgatc tcgacggaaa cgaggccctg 720
ttcgaaagcg gtggcactat tccttccacc aatcaacagt tgttcatgat cgctggatct 780
acttttggtg gaggctccac cgtcaactgg tctgcctgtc tcaagactcc cttcaaggtt 840
cgaaaggagt ggtacgacga tttcggactg gactttgtgg ctacccagca atacgacgat 900
tgcatggact acgtgtggaa gaaaatgggt gcctcgaccg agcacatcga gcattctgct 960
gcaaatgccg tcatcatgga cggagctgcc aagcttggct acgctcaccg agccctcgag 1020
cagaacaccg gtggccatgt tcacgactgt ggaatgtgcc acctgggctg tcgattcggt 1080
atcaagcagg gaggcgtcaa ctgctggttt cgagaaccct ccgagaaggg ttccaagttc 1140
atggagcagg tcgttgtcga gaagattctg cagcacaagg gcaaggccac tggaattctc 1200
tgcagagata ccgagtctgg catcaagttc aagattactg gacccaagaa atacgtcgtg 1260
tccggtggct ctttgcagac ccctgttctc cttcagaagt ctggcttcaa gaacaagcac 1320
attggagcca acctcaagct gcatcccgtc tcggttgctc ttggcgactt tggtaacgag 1380
gtggacttcg aagcctacaa gcgacccctc atgaccgcag tctgcaatgc cgtggacgat 1440
ctggacggca aggctcacgg aacacgaatc gaggccattc tgcacgctcc ttacgtcact 1500
gctcccttct atccctggca gtccggtgcc caggctcgga agaacttgct caaatacaag 1560
cagaccgtgc ctctgctcct tctgtctcga gacacctcct cgggtaccgt tacatacgac 1620
aaacagaagc cagatgtctt ggtggtcgac tacactgtca acaagttcga tcgaaactcc 1680
atcctgcagg gatttctcgt tgcttccgac attttgtaca tcgagggtgc caaggagatt 1740
ctgtctcccc aggcttgggt gcccaccttc aagagcaaca agcccaagca cgccagatcc 1800
atcaaggacg aggactacgt caagtggcga gaaaccgtgg ccaagattcc ctttgattcc 1860
tacggctcgc cttacggttc tgctcatcag atgtcctcgt gtcgaatgtc tggcaaggga 1920
cccggatacg gtgcctgcga taccaaggga cgactcttcg agtgcaacaa tgtgtacgtt 1980
gcagacgcct ccgtcatgcc tactgcttct ggagtcaacc ccatgattac cacaatggcc 2040
tttgcacgac acgttgctct ctgtctggcc aaggaccttc aaccccagac caagctgtaa 2100
<210> 89
<211> 699
<212> PRT
<213> 人工序列
<220>
<223> CcFAO1s (FAO)蛋白质
<400> 89
Met Ala Ser His Gln Val Glu Asp His Asp Leu Asp Val Phe Cys Leu
1 5 10 15
Leu Ala Asp Ala Val Leu His Glu Ile Pro Pro Ser Glu Ile Val Glu
20 25 30
Tyr Leu His Pro Asp Phe Pro Lys Asp Lys Ile Glu Glu Tyr Leu Thr
35 40 45
Gly Phe Ser Arg Pro Ser Ala Val Pro Gln Phe Arg Gln Cys Ala Lys
50 55 60
Lys Leu Ile Asn Arg Gly Ser Glu Leu Ser Ile Lys Leu Phe Leu Tyr
65 70 75 80
Leu Thr Thr Ala Leu Asp Ser Arg Ile Leu Ala Pro Ala Leu Thr Asn
85 90 95
Ser Leu Thr Leu Ile Arg Asp Met Asp Leu Ser Gln Arg Glu Glu Leu
100 105 110
Leu Arg Ser Trp Arg Asp Ser Pro Leu Thr Ala Lys Arg Arg Leu Phe
115 120 125
Arg Val Tyr Ala Ser Phe Thr Leu Ser Thr Phe Asn Lys Leu Gly Thr
130 135 140
Asp Leu His Phe Lys Ala Leu Gly Tyr Pro Gly Arg Glu Leu Arg Thr
145 150 155 160
Gln Ile Gln Asp Tyr Glu Val Asp Pro Phe Arg Tyr Ser Phe Met Glu
165 170 175
Lys Leu Lys His Glu Gly His Glu Leu Phe Leu Pro Asp Ile Asp Val
180 185 190
Leu Ile Ile Gly Ser Gly Ser Gly Ala Gly Val Val Ala Gln Thr Leu
195 200 205
Thr Glu Ser Gly Leu Lys Ser Leu Val Leu Glu Lys Gly Lys Tyr Phe
210 215 220
Ala Ser Glu Glu Leu Cys Met Thr Asp Leu Asp Gly Asn Glu Ala Leu
225 230 235 240
Phe Glu Ser Gly Gly Thr Ile Pro Ser Thr Asn Gln Gln Leu Phe Met
245 250 255
Ile Ala Gly Ser Thr Phe Gly Gly Gly Ser Thr Val Asn Trp Ser Ala
260 265 270
Cys Leu Lys Thr Pro Phe Lys Val Arg Lys Glu Trp Tyr Asp Asp Phe
275 280 285
Gly Leu Asp Phe Val Ala Thr Gln Gln Tyr Asp Asp Cys Met Asp Tyr
290 295 300
Val Trp Lys Lys Met Gly Ala Ser Thr Glu His Ile Glu His Ser Ala
305 310 315 320
Ala Asn Ala Val Ile Met Asp Gly Ala Ala Lys Leu Gly Tyr Ala His
325 330 335
Arg Ala Leu Glu Gln Asn Thr Gly Gly His Val His Asp Cys Gly Met
340 345 350
Cys His Leu Gly Cys Arg Phe Gly Ile Lys Gln Gly Gly Val Asn Cys
355 360 365
Trp Phe Arg Glu Pro Ser Glu Lys Gly Ser Lys Phe Met Glu Gln Val
370 375 380
Val Val Glu Lys Ile Leu Gln His Lys Gly Lys Ala Thr Gly Ile Leu
385 390 395 400
Cys Arg Asp Thr Glu Ser Gly Ile Lys Phe Lys Ile Thr Gly Pro Lys
405 410 415
Lys Tyr Val Val Ser Gly Gly Ser Leu Gln Thr Pro Val Leu Leu Gln
420 425 430
Lys Ser Gly Phe Lys Asn Lys His Ile Gly Ala Asn Leu Lys Leu His
435 440 445
Pro Val Ser Val Ala Leu Gly Asp Phe Gly Asn Glu Val Asp Phe Glu
450 455 460
Ala Tyr Lys Arg Pro Leu Met Thr Ala Val Cys Asn Ala Val Asp Asp
465 470 475 480
Leu Asp Gly Lys Ala His Gly Thr Arg Ile Glu Ala Ile Leu His Ala
485 490 495
Pro Tyr Val Thr Ala Pro Phe Tyr Pro Trp Gln Ser Gly Ala Gln Ala
500 505 510
Arg Lys Asn Leu Leu Lys Tyr Lys Gln Thr Val Pro Leu Leu Leu Leu
515 520 525
Ser Arg Asp Thr Ser Ser Gly Thr Val Thr Tyr Asp Lys Gln Lys Pro
530 535 540
Asp Val Leu Val Val Asp Tyr Thr Val Asn Lys Phe Asp Arg Asn Ser
545 550 555 560
Ile Leu Gln Gly Phe Leu Val Ala Ser Asp Ile Leu Tyr Ile Glu Gly
565 570 575
Ala Lys Glu Ile Leu Ser Pro Gln Ala Trp Val Pro Thr Phe Lys Ser
580 585 590
Asn Lys Pro Lys His Ala Arg Ser Ile Lys Asp Glu Asp Tyr Val Lys
595 600 605
Trp Arg Glu Thr Val Ala Lys Ile Pro Phe Asp Ser Tyr Gly Ser Pro
610 615 620
Tyr Gly Ser Ala His Gln Met Ser Ser Cys Arg Met Ser Gly Lys Gly
625 630 635 640
Pro Gly Tyr Gly Ala Cys Asp Thr Lys Gly Arg Leu Phe Glu Cys Asn
645 650 655
Asn Val Tyr Val Ala Asp Ala Ser Val Met Pro Thr Ala Ser Gly Val
660 665 670
Asn Pro Met Ile Thr Thr Met Ala Phe Ala Arg His Val Ala Leu Cys
675 680 685
Leu Ala Lys Asp Leu Gln Pro Gln Thr Lys Leu
690 695
<210> 90
<211> 2028
<212> DNA
<213> 人工序列
<220>
<223> CtFALDH2s (FALDH)
<400> 90
atggccaagt cctacaagct gcccaagcct tccaagatcg ctcccatcat tcgaggcaag 60
acctctgcca agaccaaagg ctccactcag cctcccgagt ctccacctgc ctcggctaag 120
atcacagctc cccagctcga acccgtcgag cccaccagcg actccgagat tccttctacc 180
aaggtctccg ttcgacgtac atcgaccact tccagcaaga ccatcacgga cgattccatc 240
tctgccactt ccaccgacca gatgaagtcg agcaccaacg aagccgagat tccaaacccc 300
aagccagagt ccgtggttgc ccctatgacc aagcccgtcg aggacgataa actcgaggac 360
cacaccaagc tggagactgc cgaatcgtac atcaacgttc agaaggaagc tgcaattcct 420
ggcgagacca agagcgtcgt ttcctcgaag actgcttctg tgctcgagta cacacctctt 480
tccgagatct ctggcggagt caagaaagtg gtcgacggtt tccacaccgg caagacgcat 540
cccctggagt tcagactcaa gcagcttcga aacctgtact ttgctatgaa ggacaatcag 600
gaggccatct gcgaagcgct tgccaaggac tttcaccgag ccccttccga gactcgaaac 660
tacgagctgg tcacaggtct caacgagctg ctctacacca tgactcaact gcacaagtgg 720
tccaagcccc ttcctgtgga cgcgctgccc atcaacctca agaccaatcc cgtctacatc 780
gagcggattc cagtcggaac cgttctcgtc atttctgcct tcaactatcc cttctttgtc 840
tccgtgtctc ccatcgcagg tgctattgcc gcaggcaact ccgtcgtgtt caagccgtcg 900
gagcttacac cccactttac caagctgttc acagagttgc tcaccaaggc tctggatccc 960
gagatcttct acgtggtcaa cggtgccgtt tccgagacta ccgaactgct caaccagaag 1020
ttcgacaaga tcgtctacac tggcagcgac attgtcggca agatcattgc caagaaagca 1080
gcggagaccc ttactccagt catcttggag ctcggtggca agtctcctgc tttcgtgctg 1140
gacgatgtct cggacaagga tcttcccgtc atcgctcgac gtatcgcctg gggacgatac 1200
gccaacgctg gtcaaacctg cattggcgtc gactacgttc tcgtggccga gtccaagcac 1260
gagaagttca ttcaggctct gcggaatgtc atcgaaaacg agttctttcc caacatcgac 1320
cagaactcca actttaccca catgatccac gagcgagcct tcctcaagat gaaaaagatc 1380
ctggatacca ctgccggaga gatcattatc ggtggcaagc tcgacagcga gtccaactac 1440
gtgtctccca ccgtcatcga caatgcttcg tgggacgatt cctcgatgaa ggaggaaatc 1500
ttcggtccta ttcttcccat cattacttac accgacctca agcaggcctg caacgaggtc 1560
atttctcatc atgacactcc ccttgctcag tacatcttca cgtctggctc cacctcgcga 1620
aagtacaact ctcagatcaa cacaatctcc accatgattc gatcgggtgg actggtcatc 1680
aacgacgttc tcatgcatat ctcccttcat aacgctccct tcggtggcgt gggaaagtcc 1740
ggctacggtg cctatcacgg agagttctcc tacagagcct ttacccacga gcgaaccgtc 1800
ctcgagcagc atctgtggaa cgattggatt atcaactctc ggtatcctcc ctactccaac 1860
aagaaagaac gactggtggc ctccagccag tccaactacg gtggcagagt ctggtttggt 1920
cgaaagggcg acgttcgaat cgagggaccc actaccttct tcagcgcctg gaccaacgtg 1980
ctcggcgttg ctgccgtcgt tcgagacttc atcggtgctt ccatgtaa 2028
<210> 91
<211> 675
<212> PRT
<213> 热带假丝酵母
<400> 91
Met Ala Lys Ser Tyr Lys Leu Pro Lys Pro Ser Lys Ile Ala Pro Ile
1 5 10 15
Ile Arg Gly Lys Thr Ser Ala Lys Thr Lys Gly Ser Thr Gln Pro Pro
20 25 30
Glu Ser Pro Pro Ala Ser Ala Lys Ile Thr Ala Pro Gln Leu Glu Pro
35 40 45
Val Glu Pro Thr Ser Asp Ser Glu Ile Pro Ser Thr Lys Val Ser Val
50 55 60
Arg Arg Thr Ser Thr Thr Ser Ser Lys Thr Ile Thr Asp Asp Ser Ile
65 70 75 80
Ser Ala Thr Ser Thr Asp Gln Met Lys Ser Ser Thr Asn Glu Ala Glu
85 90 95
Ile Pro Asn Pro Lys Pro Glu Ser Val Val Ala Pro Met Thr Lys Pro
100 105 110
Val Glu Asp Asp Lys Leu Glu Asp His Thr Lys Leu Glu Thr Ala Glu
115 120 125
Ser Tyr Ile Asn Val Gln Lys Glu Ala Ala Ile Pro Gly Glu Thr Lys
130 135 140
Ser Val Val Ser Ser Lys Thr Ala Ser Val Leu Glu Tyr Thr Pro Leu
145 150 155 160
Ser Glu Ile Ser Gly Gly Val Lys Lys Val Val Asp Gly Phe His Thr
165 170 175
Gly Lys Thr His Pro Leu Glu Phe Arg Leu Lys Gln Leu Arg Asn Leu
180 185 190
Tyr Phe Ala Met Lys Asp Asn Gln Glu Ala Ile Cys Glu Ala Leu Ala
195 200 205
Lys Asp Phe His Arg Ala Pro Ser Glu Thr Arg Asn Tyr Glu Leu Val
210 215 220
Thr Gly Leu Asn Glu Leu Leu Tyr Thr Met Thr Gln Leu His Lys Trp
225 230 235 240
Ser Lys Pro Leu Pro Val Asp Ala Leu Pro Ile Asn Leu Lys Thr Asn
245 250 255
Pro Val Tyr Ile Glu Arg Ile Pro Val Gly Thr Val Leu Val Ile Ser
260 265 270
Ala Phe Asn Tyr Pro Phe Phe Val Ser Val Ser Pro Ile Ala Gly Ala
275 280 285
Ile Ala Ala Gly Asn Ser Val Val Phe Lys Pro Ser Glu Leu Thr Pro
290 295 300
His Phe Thr Lys Leu Phe Thr Glu Leu Leu Thr Lys Ala Leu Asp Pro
305 310 315 320
Glu Ile Phe Tyr Val Val Asn Gly Ala Val Ser Glu Thr Thr Glu Leu
325 330 335
Leu Asn Gln Lys Phe Asp Lys Ile Val Tyr Thr Gly Ser Asp Ile Val
340 345 350
Gly Lys Ile Ile Ala Lys Lys Ala Ala Glu Thr Leu Thr Pro Val Ile
355 360 365
Leu Glu Leu Gly Gly Lys Ser Pro Ala Phe Val Leu Asp Asp Val Ser
370 375 380
Asp Lys Asp Leu Pro Val Ile Ala Arg Arg Ile Ala Trp Gly Arg Tyr
385 390 395 400
Ala Asn Ala Gly Gln Thr Cys Ile Gly Val Asp Tyr Val Leu Val Ala
405 410 415
Glu Ser Lys His Glu Lys Phe Ile Gln Ala Leu Arg Asn Val Ile Glu
420 425 430
Asn Glu Phe Phe Pro Asn Ile Asp Gln Asn Ser Asn Phe Thr His Met
435 440 445
Ile His Glu Arg Ala Phe Leu Lys Met Lys Lys Ile Leu Asp Thr Thr
450 455 460
Ala Gly Glu Ile Ile Ile Gly Gly Lys Leu Asp Ser Glu Ser Asn Tyr
465 470 475 480
Val Ser Pro Thr Val Ile Asp Asn Ala Ser Trp Asp Asp Ser Ser Met
485 490 495
Lys Glu Glu Ile Phe Gly Pro Ile Leu Pro Ile Ile Thr Tyr Thr Asp
500 505 510
Leu Lys Gln Ala Cys Asn Glu Val Ile Ser His His Asp Thr Pro Leu
515 520 525
Ala Gln Tyr Ile Phe Thr Ser Gly Ser Thr Ser Arg Lys Tyr Asn Ser
530 535 540
Gln Ile Asn Thr Ile Ser Thr Met Ile Arg Ser Gly Gly Leu Val Ile
545 550 555 560
Asn Asp Val Leu Met His Ile Ser Leu His Asn Ala Pro Phe Gly Gly
565 570 575
Val Gly Lys Ser Gly Tyr Gly Ala Tyr His Gly Glu Phe Ser Tyr Arg
580 585 590
Ala Phe Thr His Glu Arg Thr Val Leu Glu Gln His Leu Trp Asn Asp
595 600 605
Trp Ile Ile Asn Ser Arg Tyr Pro Pro Tyr Ser Asn Lys Lys Glu Arg
610 615 620
Leu Val Ala Ser Ser Gln Ser Asn Tyr Gly Gly Arg Val Trp Phe Gly
625 630 635 640
Arg Lys Gly Asp Val Arg Ile Glu Gly Pro Thr Thr Phe Phe Ser Ala
645 650 655
Trp Thr Asn Val Leu Gly Val Ala Ala Val Val Arg Asp Phe Ile Gly
660 665 670
Ala Ser Met
675
<210> 92
<211> 12572
<212> DNA
<213> 人工序列
<220>
<223> pYRH213质粒
<400> 92
aaaccatcat ctaagggcct caaaactacc tcggaactgc tgcgctgatc tggacaccac 60
agaggttccg agcactttag gttgcaccaa atgtcccacc aggtgcaggc agaaaacgct 120
ggaacagcgt gtacagtttg tcttaacaaa aagtgagggc gctgaggtcg agcagggtgg 180
tgtgacttgt tatagccttt agagctgcga aagcgcgtat ggatttggct catcaggcca 240
gattgagggt ctgtggacac atgtcatgtt agtgtacttc aatcgccccc tggatatagc 300
cccgacaata ggccgtggcc tcattttttt gccttccgca catttccatt gctcggtacc 360
cacaccttgc ttctcctgca cttgccaacc ttaatactgg tttacattga ccaacatctt 420
acaagcgggg ggcttgtcta gggtatatat aaacagtggc tctcccaatc ggttgccagt 480
ctcttttttc ctttctttcc ccacagattc gaaatctaaa ctacacatca caccatggcc 540
acctcctcta actccgacct ggtccgaacc atcgagtccg ccctcggcat ttctctcggc 600
gacagcgtgt ccgattctgt cgttatcatt gccaccactt ctgctgccgt catcattgga 660
cttctggtct tcctctggcg aaagtctccc gacagatcgc gagagctgcg tcctgtcatt 720
gtgcccaagt ttaccgttaa gcacgaggac gatgaagtcg aggtggaccg aggcaaaacc 780
aaggttacag ttttctacgg aactcagacc ggtactgccg agggctttgc aaaggccctt 840
gcggaggaaa tcaaggccag atacgagaag gccgttgtca aggtggttga catggatgac 900
tacgctattg acgatgacca gtacgaggaa aagctcaaaa aggagaccct ggtcttcttt 960
atgcttgcca cctatggaga cggcgaaccc accgataacg ctgcacgatt ctacaagtgg 1020
tttaccgagg gcaaggagga acgaggaacc tggctgcagc aactcactta cggtgtgttc 1080
gccttgggca accgacagta cgagcatttc aacaagatcg gcaagattgt cgacgaggat 1140
cttaccgagc agggagccaa gcgtctggtt cccgtcggtc tcggcgacga tgaccagtcc 1200
atcgaggacg atttcaacgc ttggaaggaa accttgtggc cagagctgga ccaacttctc 1260
cgagacgagg atgacgtcaa cactgcttcg accccttaca ctgccgctat ctccgagtat 1320
cgtgtcgtta tccacgatcc taccgtgtct ccctcctacg agaaccattt caatgttgcc 1380
aacggtggag cagtgttcga cattcaccat ccctgtcgag tcaacgttgc cgtgcgacgg 1440
gaacttcaca agccccagtc cgaccgatct tgcattcacc tggagtttga tctctccggt 1500
actggcgtta catacgagac tggcgaccac gtcggagtgt acgccgagaa ctgcgacgaa 1560
actgtcgagg aagctggcaa gctgctcggt cagtcgctgg atcttctctt ttctctgcat 1620
accgacaagg aggatggcac aagccttggt ggatctctgc tccctccatt tcctggaccc 1680
tgtaccgttc gaactgccct cgcttgctac gccgaccttc ttaatcctcc acggaaagcc 1740
gctatcgtgg cacttgctgc ccatgcttcc gagcccagcg aggccgaacg actcaagttt 1800
ctttcttcgc ctcagggcaa ggacgagtac tccaagtggg tcgttggatc tcagcgatcg 1860
ctgctcgaag tcatggccga ttttccctcc gccaagcctc cactgggagt gttctttgct 1920
gccattgcac ctcgactgca gcctcgatac tattctatct cctcttcgcc cagaccagct 1980
ccccagcgag tgcacgttac ctgtgccctt gtcgagggac ccactcctac cggtcggatt 2040
cacaagggtg tgtgctccac ctggatgaag tctgctactc ccttggagaa gtctcacgac 2100
tgttcccgag cacctatctt cattcgaccc tccaacttca agcttcctgc cgaccattcg 2160
attcccatta tcatggtcgg acctggtaca ggtctggctc cctttcgagg attcctccag 2220
gaacgacttg ccctcaagga ggatggagtt cagcttggac ctgccctgct cttctttggt 2280
tgccgaaaca gacagatgga cttcatctac gaggacgaac tcaacaattt cgttcagcaa 2340
ggtgccattt ccgagctcat cgttgcgttt tctcgagagg gcccagaaaa ggagtacgtg 2400
cagcacaaga tgatggacaa ggccgagtat ctgtggtctc tcatttcgca gggaggctac 2460
ctgtacgtct gtggtgatgc caaaggcatg gctcgagacg tgcaccgatc ccttcatacc 2520
attgttcagc aacaggagaa cgcagattct tcgaaggctg aggccactgt caagaaactc 2580
cagatggacg gaagatacct gcgagacgtg tggtaagcgg ccgcatgaga agataaatat 2640
ataaatacat tgagatatta aatgcgctag attagagagc ctcatactgc tcggagagaa 2700
gccaagacga gtactcaaag gggattacac catccatatc cacagacaca agctggggaa 2760
aggttctata tacactttcc ggaataccgt agtttccgat gttatcaatg ggggcagcca 2820
ggatttcagg cacttcggtg tctcggggtg aaatggcgtt cttggcctcc atcaagtcgt 2880
accatgtctt catttgcctg tcaaagtaaa acagaagcag atgaagaatg aacttgaagt 2940
gaaggaattt aaatgtaacg aaactgaaat ttgaccagat attgtgtccg cggtggagct 3000
ccagcttttg ttccctttag tgagggttaa tttcgagctt ggcgtaatca tggtcatagc 3060
tgtttcctgt gtgaaattgt tatccgctca caagcttcca cacaacgtac gttgattgag 3120
gtggagccag atgggctatt gtttcatata tagactggca gccacctctt tggcccagca 3180
tgtttgtata cctggaaggg aaaactaaag aagctggcta gtttagtttg attattatag 3240
tagatgtcct aatcactaga gattagaatg tcttggcgat gattagtcgt cgtcccctgt 3300
atcatgtcta gaccaactgt gtcatgaagt tggtgctggt gttttacctg tgtactacaa 3360
gtaggtgtcc tagatctagt gtacagagcc gtttagaccc atgtggactt caccattaac 3420
gatggaaaat gttcattata tgacagtata ttacaatgga cttgctccat ttcttccttg 3480
catcacatgt tctccacctc catagttgat caacacatca tagtagctaa ggctgctgct 3540
ctcccactac agtccaccac aagttaagta gcaccgtcag tacagctaaa agtacacgtc 3600
tagtacgttt cataactagt caagtagccc ctattacaga tatcagcact atcacgcacg 3660
agtttttctc tgtgctatct aatcaacttg ccaagtattc ggagaagata cactttcttg 3720
gcatcaggta tacgagggag cctatcagat gaaaaagggt atattggatc cattcatatc 3780
cacctacacg ttgtcataat ctcctcattc acgtgattca tttcgtgaca ctagtttctc 3840
actttccccc ccgcacctat agtcaacttg gcggacacgc tacttgtagc tgacgttgat 3900
ttatagaccc aatcaaagcg ggttatcggt caggtagcac ttatcattca tcgttcatac 3960
tacgatgagc aatctcgggc atgtccggaa aagtgtcggg cgcgccagct gcattaatga 4020
atcggccaac gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc 4080
actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg 4140
gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc 4200
cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc 4260
ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga 4320
ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc 4380
ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat 4440
agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg 4500
cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc 4560
aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga 4620
gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact 4680
agaagaacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt 4740
ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag 4800
cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg 4860
tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa 4920
aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata 4980
tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg 5040
atctgtctat ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata 5100
cgggagggct taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg 5160
gctccagatt tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct 5220
gcaactttat ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt 5280
tcgccagtta atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc 5340
tcgtcgtttg gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga 5400
tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt 5460
aagttggccg cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc 5520
atgccatccg taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa 5580
tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca 5640
catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca 5700
aggatcttac cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct 5760
tcagcatctt ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc 5820
gcaaaaaagg gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa 5880
tattattgaa gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt 5940
tagaaaaata aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgatgcg 6000
gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggaaat tgtaagcgtt 6060
aatattttgt taaaattcgc gttaaatttt tgttaaatca gctcattttt taaccaatag 6120
gccgaaatcg gcaaaatccc ttataaatca aaagaataga ccgagatagg gttgagtgtt 6180
gttccagttt ggaacaagag tccactatta aagaacgtgg actccaacgt caaagggcga 6240
aaaaccgtct atcagggcga tggcccacta cgtgaaccat caccctaatc aagttttttg 6300
gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag ggagcccccg atttagagct 6360
tgacggggaa agccggcgaa cgtggcgaga aaggaaggga agaaagcgaa aggagcgggc 6420
gctagggcgc tggcaagtgt agcggtcacg ctgcgcgtaa ccaccacacc cgccgcgctt 6480
aatgcgccgc tacagggcgc gtccattcgc cattcaggct gcgcaactgt tgggaagggc 6540
gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt gctgcaaggc 6600
gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg acggccagtg 6660
aattgtaata cgactcacta tagggcgaat tgggcccgac gtcgcatgca ttccgacagc 6720
agcgactggg caccatgatc aagcgaaaca ccttccccca gctgccctgg caaaccatca 6780
agaaccctac tttcatcaag tgcaagaacg gttctactct tctcacctcc ggtgtctacg 6840
gctggtgccg aaagcctaac tacaccgctg atttcatcat gtgcctcacc tgggctctca 6900
tgtgcggtgt tgcttctccc ctgccttact tctacccggt cttcttcttc ctggtgctca 6960
tccaccgagc ttaccgagac tttgagcgac tggagcgaaa gtacggtgag gactaccagg 7020
agttcaagcg acaggtccct tggatcttca tcccttatgt tttctaaacg ataagcttag 7080
tgagcgaatg gtgaggttac ttaattgagt ggccagccta tgggattgta taacagacag 7140
tcaatatatt actgaaaaga ctgaacagcc agacggagtg aggttgtgag tgaatcgtag 7200
agggcggcta ttacagcaag tctactctac agtgtactaa cacagcagag aacaaataca 7260
ggtgtgcatt cggctatctg agaattagtt ggagagctcg agaccctcgg cgataaactg 7320
ctcctcggtt ttgtgtccat acttgtacgg accattgtaa tggggcaagt cgttgagttc 7380
tcgtcgtccg acgttcagag cacagaaacc aatgtaatca atgtagcaga gatggttctg 7440
caaaagattg atttgtgcga gcaggttaat taagttgcga cacatgtctt gatagtatct 7500
tgaattctct ctcttgagct tttccataac aagttcttct gcctccagga agtccatggg 7560
tggtttgatc atggttttgg tgtagtggta gtgcagtggt ggtattgtga ctggggatgt 7620
agttgagaat aagtcataca caagtcagct ttcttcgagc ctcatataag tataagtagt 7680
tcaacgtatt agcactgtac ccagcatctc cgtatcgaga aacacaacaa catgccccat 7740
tggacagatc atgcggatac acaggttgtg cagtatcata catactcgat cagacaggtc 7800
gtctgaccat catacaagct gaacaagcgc tccatacttg cacgctctct atatacacag 7860
ttaaattaca tatccatagt ctaacctcta acagttaatc ttctggtaag cctcccagcc 7920
agccttctgg tatcgcttgg cctcctcaat aggatctcgg ttctggccgt acagacctcg 7980
gccgacaatt atgatatccg ttccggtaga catgacatcc tcaacagttc ggtactgctg 8040
tccgagagcg tctcccttgt cgtcaagacc caccccgggg gtcagaataa gccagtcctc 8100
agagtcgccc ttaggtcggt tctgggcaat gaagccaacc acaaactcgg ggtcggatcg 8160
ggcaagctca atggtctgct tggagtactc gccagtggcc agagagccct tgcaagacag 8220
ctcggccagc atgagcagac ctctggccag cttctcgttg ggagagggga ctaggaactc 8280
cttgtactgg gagttctcgt agtcagagac gtcctccttc ttctgttcag agacagtttc 8340
ctcggcacca gctcgcaggc cagcaatgat tccggttccg ggtacaccgt gggcgttggt 8400
gatatcggac cactcggcga ttcggtgaca ccggtactgg tgcttgacag tgttgccaat 8460
atctgcgaac tttctgtcct cgaacaggaa gaaaccgtgc ttaagagcaa gttccttgag 8520
ggggagcaca gtgccggcgt aggtgaagtc gtcaatgatg tcgatatggg ttttgatcat 8580
gcacacataa ggtccgacct tatcggcaag ctcaatgagc tccttggtgg tggtaacatc 8640
cagagaagca cacaggttgg ttttcttggc tgccacgagc ttgagcactc gagcggcaaa 8700
ggcggacttg tggacgttag ctcgagcttc gtaggagggc attttggtgg tgaagaggag 8760
actgaaataa atttagtctg cagaactttt tatcggaacc ttatctgggg cagtgaagta 8820
tatgttatgg taatagttac gagttagttg aacttataga tagactggac tatacggcta 8880
tcggtccaaa ttagaaagaa cgtcaatggc tctctgggcg tcgcctttgc cgacaaaaat 8940
gtgatcatga tgaaagccag caatgacgtt gcagctgata ttgttgtcgg ccaaccgcgc 9000
cgaaaacgca gctgtcagac ccacagcctc caacgaagaa tgtatcgtca aagtgatcca 9060
agcacactca tagttggagt cgtactccaa aggcggcaat gacgagtcag acagatactc 9120
gtcgaccttt tccttgggaa ccaccaccgt cagcccttct gactcacgta ttgtagccac 9180
cgacacaggc aacagtccgt ggatagcaga atatgtcttg tcggtccatt tctcaccaac 9240
tttaggcgtc aagtgaatgt tgcagaagaa gtatgtgcct tcattgagaa tcggtgttgc 9300
tgatttcaat aaagtcttga gatcagtttg gccagtcatg ttgtgggggg taattggatt 9360
gagttatcgc ctacagtctg tacaggtata ctcgctgccc actttatact ttttgattcc 9420
gctgcacttg aagcaatgtc gtttaccaaa agtgagaatg ctccacagaa cacaccccag 9480
ggtatggttg agcaaaaaat aaacactccg atacggggaa tcgaaccccg gtctccacgg 9540
ttctcaagaa gtattcttga tgagagcgta tcgatgagcc taaaatgaac ccgagtatat 9600
ctcataaaat tctcggtgag aggtctgtga ctgtcagtac aaggtgcctt cattatgccc 9660
tcaaccttac catacctcac tgaatgtagt gtacctctaa aaatgaaata cagtgccaaa 9720
agccaaggca ctgagctcgt ctaacggact tgatatacaa ccaattaaaa caaatgaaaa 9780
gaaatacagt tctttgtatc atttgtaaca attaccctgt acaaactaag gtattgaaat 9840
cccacaatat tcccaaagtc cacccctttc caaattgtca tgcctacaac tcatatacca 9900
agcactaacc taccgtttaa acgagaatcg tacagagttg tttctgaacc atttcgaagc 9960
cgttcagagt cgtttaaccg cagtttgagt cgtttcagag cggttctcag tcgtttttga 10020
tccatctctg aatgattcag agccgcctaa ctccttgtga gccgttaaat cgcgaattga 10080
gccactctga gccgttgatt cttccatttg tggccccttc accatctcct catctccttc 10140
ctctcgtcgc catctccttt tctcctctcg cacctcgcac tactccaaac caactcactg 10200
actacatccc aacagcgatc taaccaacgc cgcgcaagca aacagacaca aaaacaacgt 10260
ccgcgccgcc gaccacgtca gcagatcccg ctctcctggg ttttgtcgtc gtttgccgcc 10320
ttttgccgcc gctatttgca acgccgccac actcaatggc cgagccatga tgccgtcgtc 10380
gtgtcttttc ccaaatagga aaccgggcac caaccctagc cccacaactg gagtactcaa 10440
ctcggcgaaa aatgggccaa tcgccgcggg agaaacgaca atcggcttgt tttgactcaa 10500
ttacctcacc aagcgcccct tcgtcgccgc catacctccg caacaccccc tcaccgtccc 10560
tccctccgcc cctctggaaa ctcatagaac cccaaacctt atttccgatg accgcaaact 10620
ttagactata caggcgaatc tgggtggtgg caccaaccct tcctcttctc catcaccccc 10680
ccctcaatct ctttttctca ccatggcctt ccagtttcac ctggaggtcc tcctgcccta 10740
cctccttcct ctgcttctgc tcatcctgcc caccactatc ttctttctca ccaagcccaa 10800
caataaggtg tcctctactt ccaccaacaa taacatcatt acactgccca agtcgtaccc 10860
tctcattggc tcctaccttt cgttccgaaa gaacctgcat cgacggatcc agtggctctc 10920
cgacattgtt cagatctctc cctccgctac cttccagctc gacggaaccc tgggcaagcg 10980
acagatcatt actggcaacc cttctaccgt ccagcacatt ctcaagaacc agttctccaa 11040
ctatcagaag ggcaccacat tcaccaacac tctgtccgac tttctcggaa caggcatctt 11100
caacaccaac ggtcccaact ggaagtttca acgacaggtt gcctctcacg agttcaacac 11160
caagtccatt cggaacttcg tcgagcacat cgtggatacc gaactcacca accgattgat 11220
tcccatcctc acttcgagca cccagacaaa caatatcctg gacttccagg atattctgca 11280
gcgatttacc ttcgacaaca tctgcaacat tgccttcgga tacgatcccg agtacctcac 11340
tccctcgacc aatcgttcca agttcgcgga ggcctacgaa gacgctaccg agatctccag 11400
caagcgattc agactgcctc ttcccatcat ttggaagatc aaaaagtact tcaacattgg 11460
ctccgagaag cgactcaagg aagccgtcac cgaggtccga tcctttgcca agaaactggt 11520
ccgagagaag aaacgggagc tcgaagagaa gtcttcgctg gagaccgaag acatgctttc 11580
tcgatttctg tccagcggtc actcggacga ggatttcgtt gccgacattg tcatctcctt 11640
cattctcgca ggcaaggaca ctacctctgc cgctcttacc tggtttttct ggctgctctg 11700
gaagaaccct cgagtggagg aagagatcgt caacgagctg tccaagaaat cggagcttat 11760
ggtgtacgac gaggtcaagg aaatggtcta cacccatgct gcgctgtccg agtcgatgag 11820
actctaccct cccgttccaa tggattccaa ggaggccgtc aacgacgatg tgctgcccga 11880
cggctgggtg gtcaagaaag gtacaatcgt cacctaccat gtctacgcta tgggtcgaat 11940
gaagtctctc tggggagacg attgggcaga gtttcgacca gaacggtggc tcgagaagga 12000
cgaggtcaac ggcaagtggg tgttcgtcgg acgagacagc tactcctatc ctgtgttcca 12060
ggctggtccc agagtctgcc tgggaaagga gatggccttc atgcagatga agcgaattgt 12120
ggctggcatc gtcggaaagt tcaaggtggt tcccgaagcc cacttggctc aggagccagg 12180
attcatttcc tttctgtcgt ctcagatgga gggtggattt cccgtcacta tccagaagcg 12240
agactcctaa gcggccgcaa gtgtggatgg ggaagtgagt gcccggttct gtgtgcacaa 12300
ttggcaatcc aagatggatg gattcaacac agggatatag cgagctacgt ggtggtgcga 12360
ggatatagca acggatattt atgtttgaca cttgagaatg tacgatacaa gcactgtcca 12420
agtacaatac taaacatact gtacatactc atactcgtac ccgggcaacg gtttcacttg 12480
agtgcagtgg ctagtgctct tactcgtaca gtgtgcaata ctgcgtatca tagtctttga 12540
tgtatatcgt attcattcat gttagttgat tt 12572
<210> 93
<211> 1548
<212> DNA
<213> 人工序列
<220>
<223> VsCYP94A1s (CYP)
<400> 93
atggccttcc agtttcacct ggaggtcctc ctgccctacc tccttcctct gcttctgctc 60
atcctgccca ccactatctt ctttctcacc aagcccaaca ataaggtgtc ctctacttcc 120
accaacaata acatcattac actgcccaag tcgtaccctc tcattggctc ctacctttcg 180
ttccgaaaga acctgcatcg acggatccag tggctctccg acattgttca gatctctccc 240
tccgctacct tccagctcga cggaaccctg ggcaagcgac agatcattac tggcaaccct 300
tctaccgtcc agcacattct caagaaccag ttctccaact atcagaaggg caccacattc 360
accaacactc tgtccgactt tctcggaaca ggcatcttca acaccaacgg tcccaactgg 420
aagtttcaac gacaggttgc ctctcacgag ttcaacacca agtccattcg gaacttcgtc 480
gagcacatcg tggataccga actcaccaac cgattgattc ccatcctcac ttcgagcacc 540
cagacaaaca atatcctgga cttccaggat attctgcagc gatttacctt cgacaacatc 600
tgcaacattg ccttcggata cgatcccgag tacctcactc cctcgaccaa tcgttccaag 660
ttcgcggagg cctacgaaga cgctaccgag atctccagca agcgattcag actgcctctt 720
cccatcattt ggaagatcaa aaagtacttc aacattggct ccgagaagcg actcaaggaa 780
gccgtcaccg aggtccgatc ctttgccaag aaactggtcc gagagaagaa acgggagctc 840
gaagagaagt cttcgctgga gaccgaagac atgctttctc gatttctgtc cagcggtcac 900
tcggacgagg atttcgttgc cgacattgtc atctccttca ttctcgcagg caaggacact 960
acctctgccg ctcttacctg gtttttctgg ctgctctgga agaaccctcg agtggaggaa 1020
gagatcgtca acgagctgtc caagaaatcg gagcttatgg tgtacgacga ggtcaaggaa 1080
atggtctaca cccatgctgc gctgtccgag tcgatgagac tctaccctcc cgttccaatg 1140
gattccaagg aggccgtcaa cgacgatgtg ctgcccgacg gctgggtggt caagaaaggt 1200
acaatcgtca cctaccatgt ctacgctatg ggtcgaatga agtctctctg gggagacgat 1260
tgggcagagt ttcgaccaga acggtggctc gagaaggacg aggtcaacgg caagtgggtg 1320
ttcgtcggac gagacagcta ctcctatcct gtgttccagg ctggtcccag agtctgcctg 1380
ggaaaggaga tggccttcat gcagatgaag cgaattgtgg ctggcatcgt cggaaagttc 1440
aaggtggttc ccgaagccca cttggctcag gagccaggat tcatttcctt tctgtcgtct 1500
cagatggagg gtggatttcc cgtcactatc cagaagcgag actcctaa 1548
<210> 94
<211> 515
<212> PRT
<213> 人工序列
<220>
<223> VsCYP94A1s (CYP)蛋白质
<400> 94
Met Ala Phe Gln Phe His Leu Glu Val Leu Leu Pro Tyr Leu Leu Pro
1 5 10 15
Leu Leu Leu Leu Ile Leu Pro Thr Thr Ile Phe Phe Leu Thr Lys Pro
20 25 30
Asn Asn Lys Val Ser Ser Thr Ser Thr Asn Asn Asn Ile Ile Thr Leu
35 40 45
Pro Lys Ser Tyr Pro Leu Ile Gly Ser Tyr Leu Ser Phe Arg Lys Asn
50 55 60
Leu His Arg Arg Ile Gln Trp Leu Ser Asp Ile Val Gln Ile Ser Pro
65 70 75 80
Ser Ala Thr Phe Gln Leu Asp Gly Thr Leu Gly Lys Arg Gln Ile Ile
85 90 95
Thr Gly Asn Pro Ser Thr Val Gln His Ile Leu Lys Asn Gln Phe Ser
100 105 110
Asn Tyr Gln Lys Gly Thr Thr Phe Thr Asn Thr Leu Ser Asp Phe Leu
115 120 125
Gly Thr Gly Ile Phe Asn Thr Asn Gly Pro Asn Trp Lys Phe Gln Arg
130 135 140
Gln Val Ala Ser His Glu Phe Asn Thr Lys Ser Ile Arg Asn Phe Val
145 150 155 160
Glu His Ile Val Asp Thr Glu Leu Thr Asn Arg Leu Ile Pro Ile Leu
165 170 175
Thr Ser Ser Thr Gln Thr Asn Asn Ile Leu Asp Phe Gln Asp Ile Leu
180 185 190
Gln Arg Phe Thr Phe Asp Asn Ile Cys Asn Ile Ala Phe Gly Tyr Asp
195 200 205
Pro Glu Tyr Leu Thr Pro Ser Thr Asn Arg Ser Lys Phe Ala Glu Ala
210 215 220
Tyr Glu Asp Ala Thr Glu Ile Ser Ser Lys Arg Phe Arg Leu Pro Leu
225 230 235 240
Pro Ile Ile Trp Lys Ile Lys Lys Tyr Phe Asn Ile Gly Ser Glu Lys
245 250 255
Arg Leu Lys Glu Ala Val Thr Glu Val Arg Ser Phe Ala Lys Lys Leu
260 265 270
Val Arg Glu Lys Lys Arg Glu Leu Glu Glu Lys Ser Ser Leu Glu Thr
275 280 285
Glu Asp Met Leu Ser Arg Phe Leu Ser Ser Gly His Ser Asp Glu Asp
290 295 300
Phe Val Ala Asp Ile Val Ile Ser Phe Ile Leu Ala Gly Lys Asp Thr
305 310 315 320
Thr Ser Ala Ala Leu Thr Trp Phe Phe Trp Leu Leu Trp Lys Asn Pro
325 330 335
Arg Val Glu Glu Glu Ile Val Asn Glu Leu Ser Lys Lys Ser Glu Leu
340 345 350
Met Val Tyr Asp Glu Val Lys Glu Met Val Tyr Thr His Ala Ala Leu
355 360 365
Ser Glu Ser Met Arg Leu Tyr Pro Pro Val Pro Met Asp Ser Lys Glu
370 375 380
Ala Val Asn Asp Asp Val Leu Pro Asp Gly Trp Val Val Lys Lys Gly
385 390 395 400
Thr Ile Val Thr Tyr His Val Tyr Ala Met Gly Arg Met Lys Ser Leu
405 410 415
Trp Gly Asp Asp Trp Ala Glu Phe Arg Pro Glu Arg Trp Leu Glu Lys
420 425 430
Asp Glu Val Asn Gly Lys Trp Val Phe Val Gly Arg Asp Ser Tyr Ser
435 440 445
Tyr Pro Val Phe Gln Ala Gly Pro Arg Val Cys Leu Gly Lys Glu Met
450 455 460
Ala Phe Met Gln Met Lys Arg Ile Val Ala Gly Ile Val Gly Lys Phe
465 470 475 480
Lys Val Val Pro Glu Ala His Leu Ala Gln Glu Pro Gly Phe Ile Ser
485 490 495
Phe Leu Ser Ser Gln Met Glu Gly Gly Phe Pro Val Thr Ile Gln Lys
500 505 510
Arg Asp Ser
515
<210> 95
<211> 2082
<212> DNA
<213> 人工序列
<220>
<223> VsCPRs (CPR)
<400> 95
atggccacct cctctaactc cgacctggtc cgaaccatcg agtccgccct cggcatttct 60
ctcggcgaca gcgtgtccga ttctgtcgtt atcattgcca ccacttctgc tgccgtcatc 120
attggacttc tggtcttcct ctggcgaaag tctcccgaca gatcgcgaga gctgcgtcct 180
gtcattgtgc ccaagtttac cgttaagcac gaggacgatg aagtcgaggt ggaccgaggc 240
aaaaccaagg ttacagtttt ctacggaact cagaccggta ctgccgaggg ctttgcaaag 300
gcccttgcgg aggaaatcaa ggccagatac gagaaggccg ttgtcaaggt ggttgacatg 360
gatgactacg ctattgacga tgaccagtac gaggaaaagc tcaaaaagga gaccctggtc 420
ttctttatgc ttgccaccta tggagacggc gaacccaccg ataacgctgc acgattctac 480
aagtggttta ccgagggcaa ggaggaacga ggaacctggc tgcagcaact cacttacggt 540
gtgttcgcct tgggcaaccg acagtacgag catttcaaca agatcggcaa gattgtcgac 600
gaggatctta ccgagcaggg agccaagcgt ctggttcccg tcggtctcgg cgacgatgac 660
cagtccatcg aggacgattt caacgcttgg aaggaaacct tgtggccaga gctggaccaa 720
cttctccgag acgaggatga cgtcaacact gcttcgaccc cttacactgc cgctatctcc 780
gagtatcgtg tcgttatcca cgatcctacc gtgtctccct cctacgagaa ccatttcaat 840
gttgccaacg gtggagcagt gttcgacatt caccatccct gtcgagtcaa cgttgccgtg 900
cgacgggaac ttcacaagcc ccagtccgac cgatcttgca ttcacctgga gtttgatctc 960
tccggtactg gcgttacata cgagactggc gaccacgtcg gagtgtacgc cgagaactgc 1020
gacgaaactg tcgaggaagc tggcaagctg ctcggtcagt cgctggatct tctcttttct 1080
ctgcataccg acaaggagga tggcacaagc cttggtggat ctctgctccc tccatttcct 1140
ggaccctgta ccgttcgaac tgccctcgct tgctacgccg accttcttaa tcctccacgg 1200
aaagccgcta tcgtggcact tgctgcccat gcttccgagc ccagcgaggc cgaacgactc 1260
aagtttcttt cttcgcctca gggcaaggac gagtactcca agtgggtcgt tggatctcag 1320
cgatcgctgc tcgaagtcat ggccgatttt ccctccgcca agcctccact gggagtgttc 1380
tttgctgcca ttgcacctcg actgcagcct cgatactatt ctatctcctc ttcgcccaga 1440
ccagctcccc agcgagtgca cgttacctgt gcccttgtcg agggacccac tcctaccggt 1500
cggattcaca agggtgtgtg ctccacctgg atgaagtctg ctactccctt ggagaagtct 1560
cacgactgtt cccgagcacc tatcttcatt cgaccctcca acttcaagct tcctgccgac 1620
cattcgattc ccattatcat ggtcggacct ggtacaggtc tggctccctt tcgaggattc 1680
ctccaggaac gacttgccct caaggaggat ggagttcagc ttggacctgc cctgctcttc 1740
tttggttgcc gaaacagaca gatggacttc atctacgagg acgaactcaa caatttcgtt 1800
cagcaaggtg ccatttccga gctcatcgtt gcgttttctc gagagggccc agaaaaggag 1860
tacgtgcagc acaagatgat ggacaaggcc gagtatctgt ggtctctcat ttcgcaggga 1920
ggctacctgt acgtctgtgg tgatgccaaa ggcatggctc gagacgtgca ccgatccctt 1980
cataccattg ttcagcaaca ggagaacgca gattcttcga aggctgaggc cactgtcaag 2040
aaactccaga tggacggaag atacctgcga gacgtgtggt aa 2082
<210> 96
<211> 693
<212> PRT
<213> 人工序列
<220>
<223> VsCPRs (CPR)蛋白质
<400> 96
Met Ala Thr Ser Ser Asn Ser Asp Leu Val Arg Thr Ile Glu Ser Ala
1 5 10 15
Leu Gly Ile Ser Leu Gly Asp Ser Val Ser Asp Ser Val Val Ile Ile
20 25 30
Ala Thr Thr Ser Ala Ala Val Ile Ile Gly Leu Leu Val Phe Leu Trp
35 40 45
Arg Lys Ser Pro Asp Arg Ser Arg Glu Leu Arg Pro Val Ile Val Pro
50 55 60
Lys Phe Thr Val Lys His Glu Asp Asp Glu Val Glu Val Asp Arg Gly
65 70 75 80
Lys Thr Lys Val Thr Val Phe Tyr Gly Thr Gln Thr Gly Thr Ala Glu
85 90 95
Gly Phe Ala Lys Ala Leu Ala Glu Glu Ile Lys Ala Arg Tyr Glu Lys
100 105 110
Ala Val Val Lys Val Val Asp Met Asp Asp Tyr Ala Ile Asp Asp Asp
115 120 125
Gln Tyr Glu Glu Lys Leu Lys Lys Glu Thr Leu Val Phe Phe Met Leu
130 135 140
Ala Thr Tyr Gly Asp Gly Glu Pro Thr Asp Asn Ala Ala Arg Phe Tyr
145 150 155 160
Lys Trp Phe Thr Glu Gly Lys Glu Glu Arg Gly Thr Trp Leu Gln Gln
165 170 175
Leu Thr Tyr Gly Val Phe Ala Leu Gly Asn Arg Gln Tyr Glu His Phe
180 185 190
Asn Lys Ile Gly Lys Ile Val Asp Glu Asp Leu Thr Glu Gln Gly Ala
195 200 205
Lys Arg Leu Val Pro Val Gly Leu Gly Asp Asp Asp Gln Ser Ile Glu
210 215 220
Asp Asp Phe Asn Ala Trp Lys Glu Thr Leu Trp Pro Glu Leu Asp Gln
225 230 235 240
Leu Leu Arg Asp Glu Asp Asp Val Asn Thr Ala Ser Thr Pro Tyr Thr
245 250 255
Ala Ala Ile Ser Glu Tyr Arg Val Val Ile His Asp Pro Thr Val Ser
260 265 270
Pro Ser Tyr Glu Asn His Phe Asn Val Ala Asn Gly Gly Ala Val Phe
275 280 285
Asp Ile His His Pro Cys Arg Val Asn Val Ala Val Arg Arg Glu Leu
290 295 300
His Lys Pro Gln Ser Asp Arg Ser Cys Ile His Leu Glu Phe Asp Leu
305 310 315 320
Ser Gly Thr Gly Val Thr Tyr Glu Thr Gly Asp His Val Gly Val Tyr
325 330 335
Ala Glu Asn Cys Asp Glu Thr Val Glu Glu Ala Gly Lys Leu Leu Gly
340 345 350
Gln Ser Leu Asp Leu Leu Phe Ser Leu His Thr Asp Lys Glu Asp Gly
355 360 365
Thr Ser Leu Gly Gly Ser Leu Leu Pro Pro Phe Pro Gly Pro Cys Thr
370 375 380
Val Arg Thr Ala Leu Ala Cys Tyr Ala Asp Leu Leu Asn Pro Pro Arg
385 390 395 400
Lys Ala Ala Ile Val Ala Leu Ala Ala His Ala Ser Glu Pro Ser Glu
405 410 415
Ala Glu Arg Leu Lys Phe Leu Ser Ser Pro Gln Gly Lys Asp Glu Tyr
420 425 430
Ser Lys Trp Val Val Gly Ser Gln Arg Ser Leu Leu Glu Val Met Ala
435 440 445
Asp Phe Pro Ser Ala Lys Pro Pro Leu Gly Val Phe Phe Ala Ala Ile
450 455 460
Ala Pro Arg Leu Gln Pro Arg Tyr Tyr Ser Ile Ser Ser Ser Pro Arg
465 470 475 480
Pro Ala Pro Gln Arg Val His Val Thr Cys Ala Leu Val Glu Gly Pro
485 490 495
Thr Pro Thr Gly Arg Ile His Lys Gly Val Cys Ser Thr Trp Met Lys
500 505 510
Ser Ala Thr Pro Leu Glu Lys Ser His Asp Cys Ser Arg Ala Pro Ile
515 520 525
Phe Ile Arg Pro Ser Asn Phe Lys Leu Pro Ala Asp His Ser Ile Pro
530 535 540
Ile Ile Met Val Gly Pro Gly Thr Gly Leu Ala Pro Phe Arg Gly Phe
545 550 555 560
Leu Gln Glu Arg Leu Ala Leu Lys Glu Asp Gly Val Gln Leu Gly Pro
565 570 575
Ala Leu Leu Phe Phe Gly Cys Arg Asn Arg Gln Met Asp Phe Ile Tyr
580 585 590
Glu Asp Glu Leu Asn Asn Phe Val Gln Gln Gly Ala Ile Ser Glu Leu
595 600 605
Ile Val Ala Phe Ser Arg Glu Gly Pro Glu Lys Glu Tyr Val Gln His
610 615 620
Lys Met Met Asp Lys Ala Glu Tyr Leu Trp Ser Leu Ile Ser Gln Gly
625 630 635 640
Gly Tyr Leu Tyr Val Cys Gly Asp Ala Lys Gly Met Ala Arg Asp Val
645 650 655
His Arg Ser Leu His Thr Ile Val Gln Gln Gln Glu Asn Ala Asp Ser
660 665 670
Ser Lys Ala Glu Ala Thr Val Lys Lys Leu Gln Met Asp Gly Arg Tyr
675 680 685
Leu Arg Asp Val Trp
690
<210> 97
<211> 783
<212> DNA
<213> 解脂耶氏酵母
<400> 97
aaacgagaat cgtacagagt tgtttctgaa ccatttcgaa gccgttcaga gtcgtttaac 60
cgcagtttga gtcgtttcag agcggttctc agtcgttttt gatccatctc tgaatgattc 120
agagccgcct aactccttgt gagccgttaa atcgcgaatt gagccactct gagccgttga 180
ttcttccatt tgtggcccct tcaccatctc ctcatctcct tcctctcgtc gccatctcct 240
tttctcctct cgcacctcgc actactccaa accaactcac tgactacatc ccaacagcga 300
tctaaccaac gccgcgcaag caaacagaca caaaaacaac gtccgcgccg ccgaccacgt 360
cagcagatcc cgctctcctg ggttttgtcg tcgtttgccg ccttttgccg ccgctatttg 420
caacgccgcc acactcaatg gccgagccat gatgccgtcg tcgtgtcttt tcccaaatag 480
gaaaccgggc accaacccta gccccacaac tggagtactc aactcggcga aaaatgggcc 540
aatcgccgcg ggagaaacga caatcggctt gttttgactc aattacctca ccaagcgccc 600
cttcgtcgcc gccatacctc cgcaacaccc cctcaccgtc cctccctccg cccctctgga 660
aactcataga accccaaacc ttatttccga tgaccgcaaa ctttagacta tacaggcgaa 720
tctgggtggt ggcaccaacc cttcctcttc tccatcaccc ccccctcaat ctctttttct 780
cac 783
<210> 98
<211> 17083
<212> DNA
<213> 人工序列
<220>
<223> pZSCPn-3FAOBU质粒
<400> 98
cgattcgaga ttttacagat atttctcgca gtttttcacg tccccttgtc cttgtcctat 60
tgtttcaaat aaactctcgt ctactgattt cacatggaac ctttgctatt tcggggataa 120
ccccctttgc cattgcacga tggacgtggc aaaagaaaga tcgccctgcg gggatactta 180
tcatgtggtc acatgctgtg attagaaata aagaaaaagg tgcttttttg gcgctgtgat 240
taacatctcg tctgccgtgc tctactagtc gcaatagcaa aaactcgctt aatagtgtgc 300
atagtgcggg gtagcaggat actgaactac agtacgattt gcttgctact gcttgtagca 360
attaccttta ctgtagggac cacacctcct ggtttcaatg tctttcctcg cctcgacaaa 420
gcaaaactgt cacccaatca caccttgttc atattcatta gtgcatccgt taaccttgac 480
atgacacttc tcatactagt gatagggctg tagttgagac aagttgattc acacggatac 540
atacaaagcc tcagagagca aatgttatat actcagggac cgaccaatca aaaaaacaca 600
ctcctaataa ccaccatttc catctacgcg tactcactct gtcagctgcc ccacattgcc 660
caatgcacaa tgcacaatga tgtgtgcaaa caacgcaatc aaaagtctat ggatgctgac 720
caaactctga tcaccaagtt gcgaacatga aaaagaagac ctgtgtatat ataagtaagg 780
gggagagccc taactagatc tttcgaaaac cccccgacct tcaccttcca caaccatggc 840
caaccccgtc gtggaggact cccatctgga cgtcttctgc ctccttgccg atgctgtggt 900
tcacgagatt cctccctccg agatcgtcga gtacctgcat cctgactttc ccaaggacaa 960
ggtcgaagag taccttgccg agttctctca tccctccgct attccagagt tccgagaggt 1020
tgccaagcga atcattaaca agggcaccgt gctgtcgatc aagctctttc tgctcttggc 1080
cactgctctg gattctcgaa tccttgctcc tgccttgacc aactccacta cactcatccg 1140
agacatggat ctttctcagc gggaggaact cctgagatcc tggcgagact ctcccttcac 1200
taccaaacga aagctgttcc gagtctacaa ctcgtttacc ctcaacgcct tcagcaagac 1260
tgctaccgac cttcacttca aggccctggg ataccctggt cgagagctcc gtactcagat 1320
tcaggactac gaggtcgatc cctttcgata cacgttcctg gagaagcctc agcaagacgg 1380
acaggagctc cactttcccg acattgatgt gctcattatc ggatctggct ccggtgcagg 1440
cgtcgttgct cagactcttt cggagaacgg actcaagtct ctggtgctcg agaagggcaa 1500
atacttttcc aacgacgagc tgaccatgaa cgacctcgaa ggttccgagg ccctgttcga 1560
aaacggaggt gctctctcct ctaccaatca acagatcttt atcattgccg gatcgacttt 1620
cggtggcgga tccacagtca actggtctgc ctgtctcaag actcccttca aggtgcgaaa 1680
ggagtggtac gacaactttg gactggattt cgttgctacc cagtattacg aggactgtat 1740
ggactacgtc tggaagaaaa tgggtgcctc caacgagaat atcgaccatt ctggagccaa 1800
ctcggtcatt ctggaaggtt ccaagaaact tggctaccct caccgtgccg tggaacagaa 1860
caatggaggc aagattcacg actgtggtat gtgccacctc ggatgtcgat ttggcatcaa 1920
gcagggatcg gtcaactgct ggtttcgtgg tccctccgag aacggctcga agttcatgca 1980
gcaagttctc gtggacaaga tcctgcagcg agatggcaag gctgtcggtg ttctctgtag 2040
agacgtggtt accggagtca agttcaagat cactggaccc aagaaaatcg tcgtgttctg 2100
gtggttcttt gccaactccg gatttgttac caagtctggt ttcaagaaca agcacatcgg 2160
tgcaaacctc aagctgcatc ccgtcagcct tacgctcggc gactttggta acaatgtgga 2220
tttcgaggcc taccgaaagc caatcatgac ctccatttgt aacaaggtcg aggacctgga 2280
tggaaaggct cacggcactc gaatcgaggc catgctcaat gctccctacg gtgttgctcc 2340
attctttccc tggaagtctg gcgcagagtc ccgaaaggac ctcctgcgat acaagcagac 2400
tgtgcccatt ctcctgcttt ccagagacac cacttctgga tccgtcacct acgacaaaca 2460
gaagcccgat gccttggtga tcgactacct gctcaacaag ttcgaccgaa actccatcct 2520
gcagggcttt ctcattgctt cggatcttct gtacatcgag ggtgccagcc gagaccatgt 2580
tacctacaag cttggatacc agtggttcaa gtcttccaag cccaagcacg ctcgatccat 2640
cgaagacgag gactacgtca actggagagc caaggttgca aagattccct ttgattccta 2700
tggatctcct tacggttcgg ctcaccagat gtccacttgc agaatgtctg gcaagggacc 2760
aggctacgga gcctgcgaca ccaagggcaa actcttcgag tgcagcaacg tgtacgtcgc 2820
cgatgcttcc actctgccca ccgcatctgg tgccaaccct atggtctcta ccatgtcctt 2880
tgcccgacac gtgtcgcttg gcatcgtcaa ggagctgcag caatccaagc tctaagcggc 2940
cgcatggagc gtgtgttctg agtcgatgtt ttctatggag ttgtgagtgt tagtagacat 3000
gatgggttta tatatgatga atgaatagat gtgattttga tttgcacgat ggaattgaga 3060
actttgtaaa cgtacatggg aatgtatgaa tgtgggggtt ttgtgactgg ataactgacg 3120
gtcagtggac gccgttgttc aaatatccaa gagatgcgag aaactttggg tcaagtgaac 3180
atgtcctctc tgttcaagta aaccatcaac tatgggtagt atatttagta aggacaagag 3240
ttgagattct ttggagtcct agaaacgtat tttcgcgttc caagatcaaa ttagtagagt 3300
aatacgggca cgggaatcca ttcatagtct caagtttaaa ccatcatcta agggcctcaa 3360
aactacctcg gaactgctgc gctgatctgg acaccacaga ggttccgagc actttaggtt 3420
gcaccaaatg tcccaccagg tgcaggcaga aaacgctgga acagcgtgta cagtttgtct 3480
taacaaaaag tgagggcgct gaggtcgagc agggtggtgt gacttgttat agcctttaga 3540
gctgcgaaag cgcgtatgga tttggctcat caggccagat tgagggtctg tggacacatg 3600
tcatgttagt gtacttcaat cgccccctgg atatagcccc gacaataggc cgtggcctca 3660
tttttttgcc ttccgcacat ttccattgct cggtacccac accttgcttc tcctgcactt 3720
gccaacctta atactggttt acattgacca acatcttaca agcggggggc ttgtctaggg 3780
tatatataaa cagtggctct cccaatcggt tgccagtctc ttttttcctt tctttcccca 3840
cagattcgaa atctaaacta cacatcacac catggcctcc caccaggtcg aggaccacga 3900
tctggacgtg ttctgcctcc tggccgacgc tgttctccac gagattcctc cctccgaaat 3960
cgtcgagtac cttcatcccg atttccccaa ggacaagatc gaagagtacc tgaccggctt 4020
ttctcgaccc tccgccgttc ctcagttccg acagtgtgcc aagaaactca tcaaccgagg 4080
ttccgagctg tcgatcaagc tcttccttta cttgaccact gctctggact ctcgaatcct 4140
tgcaccagcc ctgaccaact cgctcactct gatcagagac atggatcttt cccagcgaga 4200
ggaactgttg cggtcctggc gagattctcc actgactgcc aagcgaagac tctttcgagt 4260
ctacgcctcc tttaccctgt ctacattcaa caagctcgga accgacttgc acttcaaggc 4320
cctgggctac cctggtcgag agctccggac ccagattcaa gactacgagg tcgatccctt 4380
tcgatactcg ttcatggaga agctcaaaca cgagggacat gaactgttcc ttcccgatat 4440
cgacgttctg atcattggct ctggatccgg tgcaggcgtg gtcgctcaga ctcttaccga 4500
gagcggactc aagtctctgg ttctcgagaa gggcaagtac tttgcctccg aagagctgtg 4560
catgaccgat ctcgacggaa acgaggccct gttcgaaagc ggtggcacta ttccttccac 4620
caatcaacag ttgttcatga tcgctggatc tacttttggt ggaggctcca ccgtcaactg 4680
gtctgcctgt ctcaagactc ccttcaaggt tcgaaaggag tggtacgacg atttcggact 4740
ggactttgtg gctacccagc aatacgacga ttgcatggac tacgtgtgga agaaaatggg 4800
tgcctcgacc gagcacatcg agcattctgc tgcaaatgcc gtcatcatgg acggagctgc 4860
caagcttggc tacgctcacc gagccctcga gcagaacacc ggtggccatg ttcacgactg 4920
tggaatgtgc cacctgggct gtcgattcgg tatcaagcag ggaggcgtca actgctggtt 4980
tcgagaaccc tccgagaagg gttccaagtt catggagcag gtcgttgtcg agaagattct 5040
gcagcacaag ggcaaggcca ctggaattct ctgcagagat accgagtctg gcatcaagtt 5100
caagattact ggacccaaga aatacgtcgt gtccggtggc tctttgcaga cccctgttct 5160
ccttcagaag tctggcttca agaacaagca cattggagcc aacctcaagc tgcatcccgt 5220
ctcggttgct cttggcgact ttggtaacga ggtggacttc gaagcctaca agcgacccct 5280
catgaccgca gtctgcaatg ccgtggacga tctggacggc aaggctcacg gaacacgaat 5340
cgaggccatt ctgcacgctc cttacgtcac tgctcccttc tatccctggc agtccggtgc 5400
ccaggctcgg aagaacttgc tcaaatacaa gcagaccgtg cctctgctcc ttctgtctcg 5460
agacacctcc tcgggtaccg ttacatacga caaacagaag ccagatgtct tggtggtcga 5520
ctacactgtc aacaagttcg atcgaaactc catcctgcag ggatttctcg ttgcttccga 5580
cattttgtac atcgagggtg ccaaggagat tctgtctccc caggcttggg tgcccacctt 5640
caagagcaac aagcccaagc acgccagatc catcaaggac gaggactacg tcaagtggcg 5700
agaaaccgtg gccaagattc cctttgattc ctacggctcg ccttacggtt ctgctcatca 5760
gatgtcctcg tgtcgaatgt ctggcaaggg acccggatac ggtgcctgcg ataccaaggg 5820
acgactcttc gagtgcaaca atgtgtacgt tgcagacgcc tccgtcatgc ctactgcttc 5880
tggagtcaac cccatgatta ccacaatggc ctttgcacga cacgttgctc tctgtctggc 5940
caaggacctt caaccccaga ccaagctgta agcggccgca tgagaagata aatatataaa 6000
tacattgaga tattaaatgc gctagattag agagcctcat actgctcgga gagaagccaa 6060
gacgagtact caaaggggat tacaccatcc atatccacag acacaagctg gggaaaggtt 6120
ctatatacac tttccggaat accgtagttt ccgatgttat caatgggggc agccaggatt 6180
tcaggcactt cggtgtctcg gggtgaaatg gcgttcttgg cctccatcaa gtcgtaccat 6240
gtcttcattt gcctgtcaaa gtaaaacaga agcagatgaa gaatgaactt gaagtgaagg 6300
aatttaaata agtttgcaaa aagatcgtat tatagttgga gcaagggaga aatgtagagt 6360
gtgaaagact cactatggtc cgggcttatc tcgaccaata gccaaagtct ggagtttctg 6420
agagaaaaag gcaagatacg tatgtaacaa agcgacgcat ggtacaataa taccggaggc 6480
atgtatcata gagagttagt ggttcgatga tggcactggt gcctggtatg actttatacg 6540
gctgactaca tatttgtcct cagacataca attacagtca agcacttacc cttggacatc 6600
tgtaggtacc ccccggccaa gacgatctca gcgtgtcgta tgtcggattg gcgtagctcc 6660
ctcgctcgtc aattggctcc catctacttt cttctgcttg gctacaccca gcatgtctgc 6720
tatggctcgt tttcgtgcct tatctatcct cccagtatta ccaactctaa atgacatgat 6780
gtgattgggt ctacactttc atatcagaga taaggagtag cacagttgca taaaaagccc 6840
aactctaatc agcttcttcc tttcttgtaa ttagtacaaa ggtgattagc gaaatctgga 6900
agcttagttg gccctaaaaa aatcaaaaaa agcaaaaaac gaaaaacgaa aaaccacagt 6960
tttgagaaca gggaggtaac gaaggatcgt atatatatat atatatatat atacccacgg 7020
atcccgagac cggcctttga ttcttcccta caaccaacca ttctcaccac cctaattcac 7080
aaccatggct cccttcctgc ccgaccaggt cgactacaag cacgtcgata ccctcatgct 7140
gctgtgcgac ggcatcattc acgagactac cgtggacgag atcaaggatg tcattgctcc 7200
tgactttcca gccgacaagt acgaggaata cgttcgaacc ttcacaaagc cctccgagac 7260
tcccggtttc cgagagaccg tgtacaacac cgtcaatgcc aacactatgg atgccatcca 7320
tcagttcatt atcctgacca acgttctcgg atctcgagtc cttgctcctg ccctgaccaa 7380
ctccttgact cccatcaagg acatgtctct cgaagaccgg gagaagctgc ttgcctcgtg 7440
gcgagattct cccattgctg ccaagcggaa gctgttcaga ctcgtgtcca cgcttactct 7500
ggtcaccttt acacgacttg ccaacgagtt gcatctcaag gccattcact atccaggacg 7560
agaagaccga gagaaggctt acgagaccca ggagatcgac cccttcaagt accagtttct 7620
ggagaaaccc aagttctacg gcgcagagct gtacctccca gacattgatg tcatcattat 7680
cggatctggt gccggagctg gtgtcgttgc ccatactctc accaacgacg gcttcaagtc 7740
cctggttctc gaaaagggca gatactttag caactccgag ctcaacttcg acgataagga 7800
cggtgttcag gagctgtacc aatctggagg taccttgact accgtcaatc agcaactctt 7860
cgtgcttgct ggttccactt ttggaggtgg cactaccgtc aactggtctg cctgtctcaa 7920
gacgcccttc aaggtgcgga aggagtggta cgacgagttc ggcgtcgatt ttgctgccga 7980
cgaagcctac gacaaggcac aggattacgt gtggcagcaa atgggagcct cgaccgaagg 8040
catcactcac tccttggcca acgagatcat tatcgaaggt ggcaagaaac tcggatacaa 8100
ggccaaggtc ctggaccaga actctggtgg acatcctcat caccgatgcg gcttctgtca 8160
cctcggttgc aagcacggaa tcaagcaggg ctccgtcaac aattggtttc gagacgcagc 8220
tgcccacgga tcgcagttca tgcaacaggt gcgagttctg cagattctca acaagaaagg 8280
catcgcctac ggtatcttgt gcgaggatgt cgttaccgga gccaagttta ccattactgg 8340
tcccaaaaag ttcgtggtcg ctgcaggagc cctcaacact cccagcgtgc tggtcaactc 8400
cggattcaag aacaaaaaca ttggcaagaa ccttaccttg catcccgttt ctgtcgtgtt 8460
tggcgacttc ggaaaggacg tgcaggccga tcactttcac aattccatca tgactgctct 8520
gtgttcggaa gccgctgacc tcgacggcaa gggtcatgga tgccgaattg agaccatcct 8580
gaacgcaccc ttcattcagg cttcctttct tccttggcga ggttccaacg aggccagacg 8640
agacctcctg cgatacaaca atatggtcgc gatgctgctt ctctctcgag atacaacctc 8700
gggttccgtg tcttcccatc ccaccaaacc agaagccctg gttgtcgagt acgacgtcaa 8760
caagtttgat cgaaactcca tcttgcaggc cctgcttgtc actgcagacc tgctctacat 8820
tcagggagcc aagcgaatcc tttctcctca gccctgggtg ccaatcttcg agtccgacaa 8880
gcccaaggac aagcgatcta tcaaggacga ggattacgtc gaatggcgag ccaaggttgc 8940
caagattccc ttcgacacct acggctctcc ttatggttcg gctcaccaga tgtcttcctg 9000
tcgtatgagc ggcaagggtc ccaagtacgg agccgtcgat accgacggtc gactgtttga 9060
gtgctcgaac gtgtacgttg ccgacgcttc ccttctgccc actgctagcg gtgccaaccc 9120
tatggtcaca accatgactc tcgctcgaca cgttgccctc ggcttggcag actccctgaa 9180
gaccaaagcc aagctctaag cggccgcaag tgtggatggg gaagtgagtg cccggttctg 9240
tgtgcacaat tggcaatcca agatggatgg attcaacaca gggatatagc gagctacgtg 9300
gtggtgcgag gatatagcaa cggatattta tgtttgacac ttgagaatgt acgatacaag 9360
cactgtccaa gtacaatact aaacatactg tacatactca tactcgtacc cgggcaacgg 9420
tttcacttga gtgcagtggc tagtgctctt actcgtacag tgtgcaatac tgcgtatcat 9480
agtctttgat gtatatcgta ttcattcatg ttagttgcgt acgacccctc tcaggccaag 9540
cagaaggctg agtccatcaa gaaggccaac gctatcattg tcttcaacct caagaacaag 9600
gctggcaaga ccgagtcttg gtaccttgac ctcaagaacg acggtgacgt cggcaagggc 9660
aacaagtccc ccaagggtga tgctgacatc cagctcactc tctctgacga ccacttccag 9720
cagctcgttg agggtaaggc taacgcccag cgactcttca tgaccggcaa gctcaaggtt 9780
aagggcaacg tcatgaaggc tgccgccatt gagggtatcc tcaagaacgc tcagaacaac 9840
ctctaagcgc atcatttatt gattaattga tgatttacta tattgatttc gcaactgtag 9900
tgtgattgta tgtgatctgg ctcgtaggct tcagtaaata ctagacgggt atcctacgta 9960
gttgtatcat acatcgagcc tgtggttact tgtacaataa ttcgtaatgt agagataccc 10020
cttgatccat tgcctgtttc taacatacaa tgatctccac gcaataatcc cactcttgac 10080
taaaagttgc tactcttgca cggttacctc ggcatagtca cgcctctctt gtctcgtctc 10140
gaacgcacaa agtcaattga caacgccact cactcgagtg tgccccaaca gggcaccata 10200
tcgactaatt tgaggccaac tagggtgatt ttggatggaa tttgatcgga aaaaatagct 10260
gcagaaattc ctggagagaa aaattgaccg catccacatg gtttgaccaa aaaatcgtct 10320
ccatctctgt gctcaactct cctgacgaga tatgcgcgcg cacccccaca tgatgtgatt 10380
gatctcaaca aacttcaccc agacccttat ctttccggga aacttactgt ataagtggtc 10440
gtgcgaacag aaagtgtgcg cactttaggt gtctagatcc gattgttctc gttctgataa 10500
tgagccagcc ccgcgaggca atgtttttta caattgaaaa cttcgttaac cactcacatt 10560
accgtttttg ccccatattt accctctggt acactccctc ttgcatacac acacactgca 10620
gtgaaaatgc actccgttag caccgttgtg attggttcag ggcacgagtt tggtggttta 10680
aggcgcaact acatcaatat gaaaacagga gacgctgaaa aggggtaata tcggactgct 10740
gctatgttgt atgtactgca tgacgaattg gtgttattca agaccgtggc acaggttgct 10800
gcggtacgag acctggtagc ttctctaaac ggcatgtcta ggtggcgcgc cagctgcatt 10860
aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat tgggcgctct tccgcttcct 10920
cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca gctcactcaa 10980
aggcggtaat acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa 11040
aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc 11100
tccgcccccc tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga 11160
caggactata aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc 11220
cgaccctgcc gcttaccgga tacctgtccg cctttctccc ttcgggaagc gtggcgcttt 11280
ctcatagctc acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct 11340
gtgtgcacga accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg 11400
agtccaaccc ggtaagacac gacttatcgc cactggcagc agccactggt aacaggatta 11460
gcagagcgag gtatgtaggc ggtgctacag agttcttgaa gtggtggcct aactacggct 11520
acactagaag aacagtattt ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa 11580
gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt 11640
gcaagcagca gattacgcgc agaaaaaaag gatctcaaga agatcctttg atcttttcta 11700
cggggtctga cgctcagtgg aacgaaaact cacgttaagg gattttggtc atgagattat 11760
caaaaaggat cttcacctag atccttttaa attaaaaatg aagttttaaa tcaatctaaa 11820
gtatatatga gtaaacttgg tctgacagtt accaatgctt aatcagtgag gcacctatct 11880
cagcgatctg tctatttcgt tcatccatag ttgcctgact ccccgtcgtg tagataacta 11940
cgatacggga gggcttacca tctggcccca gtgctgcaat gataccgcga gacccacgct 12000
caccggctcc agatttatca gcaataaacc agccagccgg aagggccgag cgcagaagtg 12060
gtcctgcaac tttatccgcc tccatccagt ctattaattg ttgccgggaa gctagagtaa 12120
gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat tgctacaggc atcgtggtgt 12180
cacgctcgtc gtttggtatg gcttcattca gctccggttc ccaacgatca aggcgagtta 12240
catgatcccc catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg atcgttgtca 12300
gaagtaagtt ggccgcagtg ttatcactca tggttatggc agcactgcat aattctctta 12360
ctgtcatgcc atccgtaaga tgcttttctg tgactggtga gtactcaacc aagtcattct 12420
gagaatagtg tatgcggcga ccgagttgct cttgcccggc gtcaatacgg gataataccg 12480
cgccacatag cagaacttta aaagtgctca tcattggaaa acgttcttcg gggcgaaaac 12540
tctcaaggat cttaccgctg ttgagatcca gttcgatgta acccactcgt gcacccaact 12600
gatcttcagc atcttttact ttcaccagcg tttctgggtg agcaaaaaca ggaaggcaaa 12660
atgccgcaaa aaagggaata agggcgacac ggaaatgttg aatactcata ctcttccttt 12720
ttcaatatta ttgaagcatt tatcagggtt attgtctcat gagcggatac atatttgaat 12780
gtatttagaa aaataaacaa ataggggttc cgcgcacatt tccccgaaaa gtgccacctg 12840
atgcggtgtg aaataccgca cagatgcgta aggagaaaat accgcatcag gaaattgtaa 12900
gcgttaatat tttgttaaaa ttcgcgttaa atttttgtta aatcagctca ttttttaacc 12960
aataggccga aatcggcaaa atcccttata aatcaaaaga atagaccgag atagggttga 13020
gtgttgttcc agtttggaac aagagtccac tattaaagaa cgtggactcc aacgtcaaag 13080
ggcgaaaaac cgtctatcag ggcgatggcc cactacgtga accatcaccc taatcaagtt 13140
ttttggggtc gaggtgccgt aaagcactaa atcggaaccc taaagggagc ccccgattta 13200
gagcttgacg gggaaagccg gcgaacgtgg cgagaaagga agggaagaaa gcgaaaggag 13260
cgggcgctag ggcgctggca agtgtagcgg tcacgctgcg cgtaaccacc acacccgccg 13320
cgcttaatgc gccgctacag ggcgcgtcca ttcgccattc aggctgcgca actgttggga 13380
agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg gatgtgctgc 13440
aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta aaacgacggc 13500
cagtgaattg taatacgact cactataggg cgaattgggc ccgacgtcgc atgcgtcact 13560
aatcaaggat acctaccatg ccactatgat gtttgcagga ggtgtacctc ggcagtcatc 13620
aaaaaatgga actactggct ttagatcttg ttgtatggca tcgcgcctaa aaaagaaacc 13680
cccttccagc gagctactac aagtagttgt agttgcgggc gttggatacc gaaagtcaca 13740
agcacatgtc gaagctctca tctgaaacac cgacagtcgt ctgcaccccg caagtctcgg 13800
ttcgtaccag caccaatgtt aggcagaact atacacaaga gggcggacga tcacttcggc 13860
gttaggcaac tgaaggctat tttcggctgg tactgtaggg gacagaggaa acgcaagtga 13920
ttagtaaatc ggataatagg cctgttagtt taccgaaatg gtgggggagg ggttccgtgg 13980
atatcttgaa gttatggagg ctgatcgtta tttgtgggga tggatatcat tgtatggaca 14040
tactgtagct actgtataaa caacggatct tacacctgcc tcttgtatgc ccattgcttg 14100
atcatctatc gtgttactgt acatatacaa tagatatagg gaagaaaagc cggaagtaga 14160
gaccatagtc tggcagaagt aacggcctcg ggtcgagaga actataacaa agtccaacgg 14220
cgggtcttag aatagcccca aggatcacac agttccgcaa tccagtttca catgttccgt 14280
tgcatggact tttgcatgtc tactgttgct acgattcccc cattgcaacc acagtttggg 14340
gttaccccgc attatattag catgattacg aaagagataa gtatcatatg gaacatgtga 14400
agggtagtat gcaggtccgg cggagaaaga gaatgacgtt ttcattaagc gattcgcttg 14460
gcggcttgtg ggggatgtga cgatacttac ggtaaagacc ctgtgtgaga gctggtactc 14520
gctcgttact tcgctgatct gttgggccgt caatcgaatc tcgtggaact tgcattcttc 14580
ttaactgtgt ctatacaaga cacctaatga aacatacaag ctaccgaaat cattttactc 14640
gtactgaccg gtacggtact tgcacaagta gtgaaacttc cgaaaatagc cagcctcatg 14700
catcatcgct tcaccccttc tgttgacctc aaaagcattc caacggtaaa aaattataac 14760
gccgccaact ggatggttgt gacggcgttg accaccaatg tgtgggggct ggcggtagga 14820
ccgagcttat tcgtcccaat aagctctttg gatttgattc tttggggtgt gtggtaaaat 14880
tcacatgggg aagaacacgg tggcagtttg aggcagaggc ccagcgtgta gttcctaggg 14940
catgaatata ccgaactcat ggcgcagaat tgagctgaat gcgcaaaaag ctacaggatc 15000
aaccgcgtta gaaatgccgc aaatgtccac taattccccg gactgttcca aatgattctg 15060
tggggataaa tctcaaactg ggttaggctt tgtcacgttt ctttgtgtcg tgtcggttcg 15120
tccggggcaa tgtgcccacg cttggctgtc tccctacacc tcggtaaaaa ctatcacatg 15180
ctgcccctct cgagcaagca ttaaatgcat atagtcaatc taacgacata tatataggta 15240
gggtgcatcc tccggtttag ctccccagaa tatctcttat tcattacaca aaaacaacaa 15300
tgtctctcaa ggtcgacggc ttcacttctt aattaacttt ggccggaatt cctttacctg 15360
caggataact tcgtataatg tatgctatac gaagttatga tctctctctt gagcttttcc 15420
ataacaagtt cttctgcctc caggaagtcc atgggtggtt tgatcatggt tttggtgtag 15480
tggtagtgca gtggtggtat tgtgactggg gatgtagttg agaataagtc atacacaagt 15540
cagctttctt cgagcctcat ataagtataa gtagttcaac gtattagcac tgtacccagc 15600
atctccgtat cgagaaacac aacaacatgc cccattggac agatcatgcg gatacacagg 15660
ttgtgcagta tcatacatac tcgatcagac aggtcgtctg accatcatac aagctgaaca 15720
agcgctccat acttgcacgc tctctatata cacagttaaa ttacatatcc atagtctaac 15780
ctctaacagt taatcttctg gtaagcctcc cagccagcct tctggtatcg cttggcctcc 15840
tcaataggat ctcggttctg gccgtacaga cctcggccga caattatgat atccgttccg 15900
gtagacatga catcctcaac agttcggtac tgctgtccga gagcgtctcc cttgtcgtca 15960
agacccaccc cgggggtcag aataagccag tcctcagagt cgcccttagg tcggttctgg 16020
gcaatgaagc caaccacaaa ctcggggtcg gatcgggcaa gctcaatggt ctgcttggag 16080
tactcgccag tggccagaga gcccttgcaa gacagctcgg ccagcatgag cagacctctg 16140
gccagcttct cgttgggaga ggggactagg aactccttgt actgggagtt ctcgtagtca 16200
gagacgtcct ccttcttctg ttcagagaca gtttcctcgg caccagctcg caggccagca 16260
atgattccgg ttccgggtac accgtgggcg ttggtgatat cggaccactc ggcgattcgg 16320
tgacaccggt actggtgctt gacagtgttg ccaatatctg cgaactttct gtcctcgaac 16380
aggaagaaac cgtgcttaag agcaagttcc ttgaggggga gcacagtgcc ggcgtaggtg 16440
aagtcgtcaa tgatgtcgat atgggttttg atcatgcaca cataaggtcc gaccttatcg 16500
gcaagctcaa tgagctcctt ggtggtggta acatccagag aagcacacag gttggttttc 16560
ttggctgcca cgagcttgag cactcgagcg gcaaaggcgg acttgtggac gttagctcga 16620
gcttcgtagg agggcatttt ggtggtgaag aggagactga aataaattta gtctgcagaa 16680
ctttttatcg gaaccttatc tggggcagtg aagtatatgt tatggtaata gttacgagtt 16740
agttgaactt atagatagac tggactatac ggctatcggt ccaaattaga aagaacgtca 16800
atggctctct gggcgtcgcc tttgccgaca aaaatgtgat catgatgaaa gccagcaatg 16860
acgttgcagc tgatattgtt gtcggccaac cgcgccgaaa acgcagctgt cagacccaca 16920
gcctccaacg aagaatgtat cgtcaaagtg atccaagcac actcatagtt ggagtcgtac 16980
tccaaaggcg gcaatgacga gtcagacaga tactcgtcga cgcgataact tcgtataatg 17040
tatgctatac gaagttatcg tacgatagtt agtagacaac aat 17083
<210> 99
<211> 2115
<212> DNA
<213> 人工序列
<220>
<223> CtFAO1M (FAO)
<400> 99
atggctccct tcctgcccga ccaggtcgac tacaagcacg tcgataccct catgctgctg 60
tgcgacggca tcattcacga gactaccgtg gacgagatca aggatgtcat tgctcctgac 120
tttccagccg acaagtacga ggaatacgtt cgaaccttca caaagccctc cgagactccc 180
ggtttccgag agaccgtgta caacaccgtc aatgccaaca ctatggatgc catccatcag 240
ttcattatcc tgaccaacgt tctcggatct cgagtccttg ctcctgccct gaccaactcc 300
ttgactccca tcaaggacat gtctctcgaa gaccgggaga agctgcttgc ctcgtggcga 360
gattctccca ttgctgccaa gcggaagctg ttcagactcg tgtccacgct tactctggtc 420
acctttacac gacttgccaa cgagttgcat ctcaaggcca ttcactatcc aggacgagaa 480
gaccgagaga aggcttacga gacccaggag atcgacccct tcaagtacca gtttctggag 540
aaacccaagt tctacggcgc agagctgtac ctcccagaca ttgatgtcat cattatcgga 600
tctggtgccg gagctggtgt cgttgcccat actctcacca acgacggctt caagtccctg 660
gttctcgaaa agggcagata ctttagcaac tccgagctca acttcgacga taaggacggt 720
gttcaggagc tgtaccaatc tggaggtacc ttgactaccg tcaatcagca actcttcgtg 780
cttgctggtt ccacttttgg aggtggcact accgtcaact ggtctgcctg tctcaagacg 840
cccttcaagg tgcggaagga gtggtacgac gagttcggcg tcgattttgc tgccgacgaa 900
gcctacgaca aggcacagga ttacgtgtgg cagcaaatgg gagcctcgac cgaaggcatc 960
actcactcct tggccaacga gatcattatc gaaggtggca agaaactcgg atacaaggcc 1020
aaggtcctgg accagaactc tggtggacat cctcatcacc gatgcggctt ctgtcacctc 1080
ggttgcaagc acggaatcaa gcagggctcc gtcaacaatt ggtttcgaga cgcagctgcc 1140
cacggatcgc agttcatgca acaggtgcga gttctgcaga ttctcaacaa gaaaggcatc 1200
gcctacggta tcttgtgcga ggatgtcgtt accggagcca agtttaccat tactggtccc 1260
aaaaagttcg tggtcgctgc aggagccctc aacactccca gcgtgctggt caactccgga 1320
ttcaagaaca aaaacattgg caagaacctt accttgcatc ccgtttctgt cgtgtttggc 1380
gacttcggaa aggacgtgca ggccgatcac tttcacaatt ccatcatgac tgctctgtgt 1440
tcggaagccg ctgacctcga cggcaagggt catggatgcc gaattgagac catcctgaac 1500
gcacccttca ttcaggcttc ctttcttcct tggcgaggtt ccaacgaggc cagacgagac 1560
ctcctgcgat acaacaatat ggtcgcgatg ctgcttctct ctcgagatac aacctcgggt 1620
tccgtgtctt cccatcccac caaaccagaa gccctggttg tcgagtacga cgtcaacaag 1680
tttgatcgaa actccatctt gcaggccctg cttgtcactg cagacctgct ctacattcag 1740
ggagccaagc gaatcctttc tcctcagccc tgggtgccaa tcttcgagtc cgacaagccc 1800
aaggacaagc gatctatcaa ggacgaggat tacgtcgaat ggcgagccaa ggttgccaag 1860
attcccttcg acacctacgg ctctccttat ggttcggctc accagatgtc ttcctgtcgt 1920
atgagcggca agggtcccaa gtacggagcc gtcgataccg acggtcgact gtttgagtgc 1980
tcgaacgtgt acgttgccga cgcttccctt ctgcccactg ctagcggtgc caaccctatg 2040
gtcacaacca tgactctcgc tcgacacgtt gccctcggct tggcagactc cctgaagacc 2100
aaagccaagc tctaa 2115
<210> 100
<211> 704
<212> PRT
<213> 人工序列
<220>
<223> CtFAO1M (FAO)蛋白质
<400> 100
Met Ala Pro Phe Leu Pro Asp Gln Val Asp Tyr Lys His Val Asp Thr
1 5 10 15
Leu Met Leu Leu Cys Asp Gly Ile Ile His Glu Thr Thr Val Asp Glu
20 25 30
Ile Lys Asp Val Ile Ala Pro Asp Phe Pro Ala Asp Lys Tyr Glu Glu
35 40 45
Tyr Val Arg Thr Phe Thr Lys Pro Ser Glu Thr Pro Gly Phe Arg Glu
50 55 60
Thr Val Tyr Asn Thr Val Asn Ala Asn Thr Met Asp Ala Ile His Gln
65 70 75 80
Phe Ile Ile Leu Thr Asn Val Leu Gly Ser Arg Val Leu Ala Pro Ala
85 90 95
Leu Thr Asn Ser Leu Thr Pro Ile Lys Asp Met Ser Leu Glu Asp Arg
100 105 110
Glu Lys Leu Leu Ala Ser Trp Arg Asp Ser Pro Ile Ala Ala Lys Arg
115 120 125
Lys Leu Phe Arg Leu Val Ser Thr Leu Thr Leu Val Thr Phe Thr Arg
130 135 140
Leu Ala Asn Glu Leu His Leu Lys Ala Ile His Tyr Pro Gly Arg Glu
145 150 155 160
Asp Arg Glu Lys Ala Tyr Glu Thr Gln Glu Ile Asp Pro Phe Lys Tyr
165 170 175
Gln Phe Leu Glu Lys Pro Lys Phe Tyr Gly Ala Glu Leu Tyr Leu Pro
180 185 190
Asp Ile Asp Val Ile Ile Ile Gly Ser Gly Ala Gly Ala Gly Val Val
195 200 205
Ala His Thr Leu Thr Asn Asp Gly Phe Lys Ser Leu Val Leu Glu Lys
210 215 220
Gly Arg Tyr Phe Ser Asn Ser Glu Leu Asn Phe Asp Asp Lys Asp Gly
225 230 235 240
Val Gln Glu Leu Tyr Gln Ser Gly Gly Thr Leu Thr Thr Val Asn Gln
245 250 255
Gln Leu Phe Val Leu Ala Gly Ser Thr Phe Gly Gly Gly Thr Thr Val
260 265 270
Asn Trp Ser Ala Cys Leu Lys Thr Pro Phe Lys Val Arg Lys Glu Trp
275 280 285
Tyr Asp Glu Phe Gly Val Asp Phe Ala Ala Asp Glu Ala Tyr Asp Lys
290 295 300
Ala Gln Asp Tyr Val Trp Gln Gln Met Gly Ala Ser Thr Glu Gly Ile
305 310 315 320
Thr His Ser Leu Ala Asn Glu Ile Ile Ile Glu Gly Gly Lys Lys Leu
325 330 335
Gly Tyr Lys Ala Lys Val Leu Asp Gln Asn Ser Gly Gly His Pro His
340 345 350
His Arg Cys Gly Phe Cys His Leu Gly Cys Lys His Gly Ile Lys Gln
355 360 365
Gly Ser Val Asn Asn Trp Phe Arg Asp Ala Ala Ala His Gly Ser Gln
370 375 380
Phe Met Gln Gln Val Arg Val Leu Gln Ile Leu Asn Lys Lys Gly Ile
385 390 395 400
Ala Tyr Gly Ile Leu Cys Glu Asp Val Val Thr Gly Ala Lys Phe Thr
405 410 415
Ile Thr Gly Pro Lys Lys Phe Val Val Ala Ala Gly Ala Leu Asn Thr
420 425 430
Pro Ser Val Leu Val Asn Ser Gly Phe Lys Asn Lys Asn Ile Gly Lys
435 440 445
Asn Leu Thr Leu His Pro Val Ser Val Val Phe Gly Asp Phe Gly Lys
450 455 460
Asp Val Gln Ala Asp His Phe His Asn Ser Ile Met Thr Ala Leu Cys
465 470 475 480
Ser Glu Ala Ala Asp Leu Asp Gly Lys Gly His Gly Cys Arg Ile Glu
485 490 495
Thr Ile Leu Asn Ala Pro Phe Ile Gln Ala Ser Phe Leu Pro Trp Arg
500 505 510
Gly Ser Asn Glu Ala Arg Arg Asp Leu Leu Arg Tyr Asn Asn Met Val
515 520 525
Ala Met Leu Leu Leu Ser Arg Asp Thr Thr Ser Gly Ser Val Ser Ser
530 535 540
His Pro Thr Lys Pro Glu Ala Leu Val Val Glu Tyr Asp Val Asn Lys
545 550 555 560
Phe Asp Arg Asn Ser Ile Leu Gln Ala Leu Leu Val Thr Ala Asp Leu
565 570 575
Leu Tyr Ile Gln Gly Ala Lys Arg Ile Leu Ser Pro Gln Pro Trp Val
580 585 590
Pro Ile Phe Glu Ser Asp Lys Pro Lys Asp Lys Arg Ser Ile Lys Asp
595 600 605
Glu Asp Tyr Val Glu Trp Arg Ala Lys Val Ala Lys Ile Pro Phe Asp
610 615 620
Thr Tyr Gly Ser Pro Tyr Gly Ser Ala His Gln Met Ser Ser Cys Arg
625 630 635 640
Met Ser Gly Lys Gly Pro Lys Tyr Gly Ala Val Asp Thr Asp Gly Arg
645 650 655
Leu Phe Glu Cys Ser Asn Val Tyr Val Ala Asp Ala Ser Leu Leu Pro
660 665 670
Thr Ala Ser Gly Ala Asn Pro Met Val Thr Thr Met Thr Leu Ala Arg
675 680 685
His Val Ala Leu Gly Leu Ala Asp Ser Leu Lys Thr Lys Ala Lys Leu
690 695 700
<210> 101
<211> 2100
<212> DNA
<213> 人工序列
<220>
<223> CcFAO1 (FAO)
<400> 101
atggcctccc accaggtcga ggaccacgat ctggacgtgt tctgcctcct ggccgacgct 60
gttctccacg agattcctcc ctccgaaatc gtcgagtacc ttcatcccga tttccccaag 120
gacaagatcg aagagtacct gaccggcttt tctcgaccct ccgccgttcc tcagttccga 180
cagtgtgcca agaaactcat caaccgaggt tccgagctgt cgatcaagct cttcctttac 240
ttgaccactg ctctggactc tcgaatcctt gcaccagccc tgaccaactc gctcactctg 300
atcagagaca tggatctttc ccagcgagag gaactgttgc ggtcctggcg agattctcca 360
ctgactgcca agcgaagact ctttcgagtc tacgcctcct ttaccctgtc tacattcaac 420
aagctcggaa ccgacttgca cttcaaggcc ctgggctacc ctggtcgaga gctccggacc 480
cagattcaag actacgaggt cgatcccttt cgatactcgt tcatggagaa gctcaaacac 540
gagggacatg aactgttcct tcccgatatc gacgttctga tcattggctc tggatccggt 600
gcaggcgtgg tcgctcagac tcttaccgag agcggactca agtctctggt tctcgagaag 660
ggcaagtact ttgcctccga agagctgtgc atgaccgatc tcgacggaaa cgaggccctg 720
ttcgaaagcg gtggcactat tccttccacc aatcaacagt tgttcatgat cgctggatct 780
acttttggtg gaggctccac cgtcaactgg tctgcctgtc tcaagactcc cttcaaggtt 840
cgaaaggagt ggtacgacga tttcggactg gactttgtgg ctacccagca atacgacgat 900
tgcatggact acgtgtggaa gaaaatgggt gcctcgaccg agcacatcga gcattctgct 960
gcaaatgccg tcatcatgga cggagctgcc aagcttggct acgctcaccg agccctcgag 1020
cagaacaccg gtggccatgt tcacgactgt ggaatgtgcc acctgggctg tcgattcggt 1080
atcaagcagg gaggcgtcaa ctgctggttt cgagaaccct ccgagaaggg ttccaagttc 1140
atggagcagg tcgttgtcga gaagattctg cagcacaagg gcaaggccac tggaattctc 1200
tgcagagata ccgagtctgg catcaagttc aagattactg gacccaagaa atacgtcgtg 1260
tccggtggct ctttgcagac ccctgttctc cttcagaagt ctggcttcaa gaacaagcac 1320
attggagcca acctcaagct gcatcccgtc tcggttgctc ttggcgactt tggtaacgag 1380
gtggacttcg aagcctacaa gcgacccctc atgaccgcag tctgcaatgc cgtggacgat 1440
ctggacggca aggctcacgg aacacgaatc gaggccattc tgcacgctcc ttacgtcact 1500
gctcccttct atccctggca gtccggtgcc caggctcgga agaacttgct caaatacaag 1560
cagaccgtgc ctctgctcct tctgtctcga gacacctcct cgggtaccgt tacatacgac 1620
aaacagaagc cagatgtctt ggtggtcgac tacactgtca acaagttcga tcgaaactcc 1680
atcctgcagg gatttctcgt tgcttccgac attttgtaca tcgagggtgc caaggagatt 1740
ctgtctcccc aggcttgggt gcccaccttc aagagcaaca agcccaagca cgccagatcc 1800
atcaaggacg aggactacgt caagtggcga gaaaccgtgg ccaagattcc ctttgattcc 1860
tacggctcgc cttacggttc tgctcatcag atgtcctcgt gtcgaatgtc tggcaaggga 1920
cccggatacg gtgcctgcga taccaaggga cgactcttcg agtgcaacaa tgtgtacgtt 1980
gcagacgcct ccgtcatgcc tactgcttct ggagtcaacc ccatgattac cacaatggcc 2040
tttgcacgac acgttgctct ctgtctggcc aaggaccttc aaccccagac caagctgtaa 2100
<210> 102
<211> 699
<212> PRT
<213> 人工序列
<220>
<223> CcFAO1 (FAO)蛋白质
<400> 102
Met Ala Ser His Gln Val Glu Asp His Asp Leu Asp Val Phe Cys Leu
1 5 10 15
Leu Ala Asp Ala Val Leu His Glu Ile Pro Pro Ser Glu Ile Val Glu
20 25 30
Tyr Leu His Pro Asp Phe Pro Lys Asp Lys Ile Glu Glu Tyr Leu Thr
35 40 45
Gly Phe Ser Arg Pro Ser Ala Val Pro Gln Phe Arg Gln Cys Ala Lys
50 55 60
Lys Leu Ile Asn Arg Gly Ser Glu Leu Ser Ile Lys Leu Phe Leu Tyr
65 70 75 80
Leu Thr Thr Ala Leu Asp Ser Arg Ile Leu Ala Pro Ala Leu Thr Asn
85 90 95
Ser Leu Thr Leu Ile Arg Asp Met Asp Leu Ser Gln Arg Glu Glu Leu
100 105 110
Leu Arg Ser Trp Arg Asp Ser Pro Leu Thr Ala Lys Arg Arg Leu Phe
115 120 125
Arg Val Tyr Ala Ser Phe Thr Leu Ser Thr Phe Asn Lys Leu Gly Thr
130 135 140
Asp Leu His Phe Lys Ala Leu Gly Tyr Pro Gly Arg Glu Leu Arg Thr
145 150 155 160
Gln Ile Gln Asp Tyr Glu Val Asp Pro Phe Arg Tyr Ser Phe Met Glu
165 170 175
Lys Leu Lys His Glu Gly His Glu Leu Phe Leu Pro Asp Ile Asp Val
180 185 190
Leu Ile Ile Gly Ser Gly Ser Gly Ala Gly Val Val Ala Gln Thr Leu
195 200 205
Thr Glu Ser Gly Leu Lys Ser Leu Val Leu Glu Lys Gly Lys Tyr Phe
210 215 220
Ala Ser Glu Glu Leu Cys Met Thr Asp Leu Asp Gly Asn Glu Ala Leu
225 230 235 240
Phe Glu Ser Gly Gly Thr Ile Pro Ser Thr Asn Gln Gln Leu Phe Met
245 250 255
Ile Ala Gly Ser Thr Phe Gly Gly Gly Ser Thr Val Asn Trp Ser Ala
260 265 270
Cys Leu Lys Thr Pro Phe Lys Val Arg Lys Glu Trp Tyr Asp Asp Phe
275 280 285
Gly Leu Asp Phe Val Ala Thr Gln Gln Tyr Asp Asp Cys Met Asp Tyr
290 295 300
Val Trp Lys Lys Met Gly Ala Ser Thr Glu His Ile Glu His Ser Ala
305 310 315 320
Ala Asn Ala Val Ile Met Asp Gly Ala Ala Lys Leu Gly Tyr Ala His
325 330 335
Arg Ala Leu Glu Gln Asn Thr Gly Gly His Val His Asp Cys Gly Met
340 345 350
Cys His Leu Gly Cys Arg Phe Gly Ile Lys Gln Gly Gly Val Asn Cys
355 360 365
Trp Phe Arg Glu Pro Ser Glu Lys Gly Ser Lys Phe Met Glu Gln Val
370 375 380
Val Val Glu Lys Ile Leu Gln His Lys Gly Lys Ala Thr Gly Ile Leu
385 390 395 400
Cys Arg Asp Thr Glu Ser Gly Ile Lys Phe Lys Ile Thr Gly Pro Lys
405 410 415
Lys Tyr Val Val Ser Gly Gly Ser Leu Gln Thr Pro Val Leu Leu Gln
420 425 430
Lys Ser Gly Phe Lys Asn Lys His Ile Gly Ala Asn Leu Lys Leu His
435 440 445
Pro Val Ser Val Ala Leu Gly Asp Phe Gly Asn Glu Val Asp Phe Glu
450 455 460
Ala Tyr Lys Arg Pro Leu Met Thr Ala Val Cys Asn Ala Val Asp Asp
465 470 475 480
Leu Asp Gly Lys Ala His Gly Thr Arg Ile Glu Ala Ile Leu His Ala
485 490 495
Pro Tyr Val Thr Ala Pro Phe Tyr Pro Trp Gln Ser Gly Ala Gln Ala
500 505 510
Arg Lys Asn Leu Leu Lys Tyr Lys Gln Thr Val Pro Leu Leu Leu Leu
515 520 525
Ser Arg Asp Thr Ser Ser Gly Thr Val Thr Tyr Asp Lys Gln Lys Pro
530 535 540
Asp Val Leu Val Val Asp Tyr Thr Val Asn Lys Phe Asp Arg Asn Ser
545 550 555 560
Ile Leu Gln Gly Phe Leu Val Ala Ser Asp Ile Leu Tyr Ile Glu Gly
565 570 575
Ala Lys Glu Ile Leu Ser Pro Gln Ala Trp Val Pro Thr Phe Lys Ser
580 585 590
Asn Lys Pro Lys His Ala Arg Ser Ile Lys Asp Glu Asp Tyr Val Lys
595 600 605
Trp Arg Glu Thr Val Ala Lys Ile Pro Phe Asp Ser Tyr Gly Ser Pro
610 615 620
Tyr Gly Ser Ala His Gln Met Ser Ser Cys Arg Met Ser Gly Lys Gly
625 630 635 640
Pro Gly Tyr Gly Ala Cys Asp Thr Lys Gly Arg Leu Phe Glu Cys Asn
645 650 655
Asn Val Tyr Val Ala Asp Ala Ser Val Met Pro Thr Ala Ser Gly Val
660 665 670
Asn Pro Met Ile Thr Thr Met Ala Phe Ala Arg His Val Ala Leu Cys
675 680 685
Leu Ala Lys Asp Leu Gln Pro Gln Thr Lys Leu
690 695
<210> 103
<211> 2100
<212> DNA
<213> 人工序列
<220>
<223> CcFAO2 (FAO)
<400> 103
atggccaacc ccgtcgtgga ggactcccat ctggacgtct tctgcctcct tgccgatgct 60
gtggttcacg agattcctcc ctccgagatc gtcgagtacc tgcatcctga ctttcccaag 120
gacaaggtcg aagagtacct tgccgagttc tctcatccct ccgctattcc agagttccga 180
gaggttgcca agcgaatcat taacaagggc accgtgctgt cgatcaagct ctttctgctc 240
ttggccactg ctctggattc tcgaatcctt gctcctgcct tgaccaactc cactacactc 300
atccgagaca tggatctttc tcagcgggag gaactcctga gatcctggcg agactctccc 360
ttcactacca aacgaaagct gttccgagtc tacaactcgt ttaccctcaa cgccttcagc 420
aagactgcta ccgaccttca cttcaaggcc ctgggatacc ctggtcgaga gctccgtact 480
cagattcagg actacgaggt cgatcccttt cgatacacgt tcctggagaa gcctcagcaa 540
gacggacagg agctccactt tcccgacatt gatgtgctca ttatcggatc tggctccggt 600
gcaggcgtcg ttgctcagac tctttcggag aacggactca agtctctggt gctcgagaag 660
ggcaaatact tttccaacga cgagctgacc atgaacgacc tcgaaggttc cgaggccctg 720
ttcgaaaacg gaggtgctct ctcctctacc aatcaacaga tctttatcat tgccggatcg 780
actttcggtg gcggatccac agtcaactgg tctgcctgtc tcaagactcc cttcaaggtg 840
cgaaaggagt ggtacgacaa ctttggactg gatttcgttg ctacccagta ttacgaggac 900
tgtatggact acgtctggaa gaaaatgggt gcctccaacg agaatatcga ccattctgga 960
gccaactcgg tcattctgga aggttccaag aaacttggct accctcaccg tgccgtggaa 1020
cagaacaatg gaggcaagat tcacgactgt ggtatgtgcc acctcggatg tcgatttggc 1080
atcaagcagg gatcggtcaa ctgctggttt cgtggtccct ccgagaacgg ctcgaagttc 1140
atgcagcaag ttctcgtgga caagatcctg cagcgagatg gcaaggctgt cggtgttctc 1200
tgtagagacg tggttaccgg agtcaagttc aagatcactg gacccaagaa aatcgtcgtg 1260
ttctggtggt tctttgccaa ctccggattt gttaccaagt ctggtttcaa gaacaagcac 1320
atcggtgcaa acctcaagct gcatcccgtc agccttacgc tcggcgactt tggtaacaat 1380
gtggatttcg aggcctaccg aaagccaatc atgacctcca tttgtaacaa ggtcgaggac 1440
ctggatggaa aggctcacgg cactcgaatc gaggccatgc tcaatgctcc ctacggtgtt 1500
gctccattct ttccctggaa gtctggcgca gagtcccgaa aggacctcct gcgatacaag 1560
cagactgtgc ccattctcct gctttccaga gacaccactt ctggatccgt cacctacgac 1620
aaacagaagc ccgatgcctt ggtgatcgac tacctgctca acaagttcga ccgaaactcc 1680
atcctgcagg gctttctcat tgcttcggat cttctgtaca tcgagggtgc cagccgagac 1740
catgttacct acaagcttgg ataccagtgg ttcaagtctt ccaagcccaa gcacgctcga 1800
tccatcgaag acgaggacta cgtcaactgg agagccaagg ttgcaaagat tccctttgat 1860
tcctatggat ctccttacgg ttcggctcac cagatgtcca cttgcagaat gtctggcaag 1920
ggaccaggct acggagcctg cgacaccaag ggcaaactct tcgagtgcag caacgtgtac 1980
gtcgccgatg cttccactct gcccaccgca tctggtgcca accctatggt ctctaccatg 2040
tcctttgccc gacacgtgtc gcttggcatc gtcaaggagc tgcagcaatc caagctctaa 2100
<210> 104
<211> 699
<212> PRT
<213> 人工序列
<220>
<223> CcFAO2 (FAO)蛋白质
<400> 104
Met Ala Asn Pro Val Val Glu Asp Ser His Leu Asp Val Phe Cys Leu
1 5 10 15
Leu Ala Asp Ala Val Val His Glu Ile Pro Pro Ser Glu Ile Val Glu
20 25 30
Tyr Leu His Pro Asp Phe Pro Lys Asp Lys Val Glu Glu Tyr Leu Ala
35 40 45
Glu Phe Ser His Pro Ser Ala Ile Pro Glu Phe Arg Glu Val Ala Lys
50 55 60
Arg Ile Ile Asn Lys Gly Thr Val Leu Ser Ile Lys Leu Phe Leu Leu
65 70 75 80
Leu Ala Thr Ala Leu Asp Ser Arg Ile Leu Ala Pro Ala Leu Thr Asn
85 90 95
Ser Thr Thr Leu Ile Arg Asp Met Asp Leu Ser Gln Arg Glu Glu Leu
100 105 110
Leu Arg Ser Trp Arg Asp Ser Pro Phe Thr Thr Lys Arg Lys Leu Phe
115 120 125
Arg Val Tyr Asn Ser Phe Thr Leu Asn Ala Phe Ser Lys Thr Ala Thr
130 135 140
Asp Leu His Phe Lys Ala Leu Gly Tyr Pro Gly Arg Glu Leu Arg Thr
145 150 155 160
Gln Ile Gln Asp Tyr Glu Val Asp Pro Phe Arg Tyr Thr Phe Leu Glu
165 170 175
Lys Pro Gln Gln Asp Gly Gln Glu Leu His Phe Pro Asp Ile Asp Val
180 185 190
Leu Ile Ile Gly Ser Gly Ser Gly Ala Gly Val Val Ala Gln Thr Leu
195 200 205
Ser Glu Asn Gly Leu Lys Ser Leu Val Leu Glu Lys Gly Lys Tyr Phe
210 215 220
Ser Asn Asp Glu Leu Thr Met Asn Asp Leu Glu Gly Ser Glu Ala Leu
225 230 235 240
Phe Glu Asn Gly Gly Ala Leu Ser Ser Thr Asn Gln Gln Ile Phe Ile
245 250 255
Ile Ala Gly Ser Thr Phe Gly Gly Gly Ser Thr Val Asn Trp Ser Ala
260 265 270
Cys Leu Lys Thr Pro Phe Lys Val Arg Lys Glu Trp Tyr Asp Asn Phe
275 280 285
Gly Leu Asp Phe Val Ala Thr Gln Tyr Tyr Glu Asp Cys Met Asp Tyr
290 295 300
Val Trp Lys Lys Met Gly Ala Ser Asn Glu Asn Ile Asp His Ser Gly
305 310 315 320
Ala Asn Ser Val Ile Leu Glu Gly Ser Lys Lys Leu Gly Tyr Pro His
325 330 335
Arg Ala Val Glu Gln Asn Asn Gly Gly Lys Ile His Asp Cys Gly Met
340 345 350
Cys His Leu Gly Cys Arg Phe Gly Ile Lys Gln Gly Ser Val Asn Cys
355 360 365
Trp Phe Arg Gly Pro Ser Glu Asn Gly Ser Lys Phe Met Gln Gln Val
370 375 380
Leu Val Asp Lys Ile Leu Gln Arg Asp Gly Lys Ala Val Gly Val Leu
385 390 395 400
Cys Arg Asp Val Val Thr Gly Val Lys Phe Lys Ile Thr Gly Pro Lys
405 410 415
Lys Ile Val Val Phe Trp Trp Phe Phe Ala Asn Ser Gly Phe Val Thr
420 425 430
Lys Ser Gly Phe Lys Asn Lys His Ile Gly Ala Asn Leu Lys Leu His
435 440 445
Pro Val Ser Leu Thr Leu Gly Asp Phe Gly Asn Asn Val Asp Phe Glu
450 455 460
Ala Tyr Arg Lys Pro Ile Met Thr Ser Ile Cys Asn Lys Val Glu Asp
465 470 475 480
Leu Asp Gly Lys Ala His Gly Thr Arg Ile Glu Ala Met Leu Asn Ala
485 490 495
Pro Tyr Gly Val Ala Pro Phe Phe Pro Trp Lys Ser Gly Ala Glu Ser
500 505 510
Arg Lys Asp Leu Leu Arg Tyr Lys Gln Thr Val Pro Ile Leu Leu Leu
515 520 525
Ser Arg Asp Thr Thr Ser Gly Ser Val Thr Tyr Asp Lys Gln Lys Pro
530 535 540
Asp Ala Leu Val Ile Asp Tyr Leu Leu Asn Lys Phe Asp Arg Asn Ser
545 550 555 560
Ile Leu Gln Gly Phe Leu Ile Ala Ser Asp Leu Leu Tyr Ile Glu Gly
565 570 575
Ala Ser Arg Asp His Val Thr Tyr Lys Leu Gly Tyr Gln Trp Phe Lys
580 585 590
Ser Ser Lys Pro Lys His Ala Arg Ser Ile Glu Asp Glu Asp Tyr Val
595 600 605
Asn Trp Arg Ala Lys Val Ala Lys Ile Pro Phe Asp Ser Tyr Gly Ser
610 615 620
Pro Tyr Gly Ser Ala His Gln Met Ser Thr Cys Arg Met Ser Gly Lys
625 630 635 640
Gly Pro Gly Tyr Gly Ala Cys Asp Thr Lys Gly Lys Leu Phe Glu Cys
645 650 655
Ser Asn Val Tyr Val Ala Asp Ala Ser Thr Leu Pro Thr Ala Ser Gly
660 665 670
Ala Asn Pro Met Val Ser Thr Met Ser Phe Ala Arg His Val Ser Leu
675 680 685
Gly Ile Val Lys Glu Leu Gln Gln Ser Lys Leu
690 695
<210> 105
<211> 12358
<212> DNA
<213> 人工序列
<220>
<223> pZKLY-VsCPR&CYP质粒
<400> 105
aaaccatcat ctaagggcct caaaactacc tcggaactgc tgcgctgatc tggacaccac 60
agaggttccg agcactttag gttgcaccaa atgtcccacc aggtgcaggc agaaaacgct 120
ggaacagcgt gtacagtttg tcttaacaaa aagtgagggc gctgaggtcg agcagggtgg 180
tgtgacttgt tatagccttt agagctgcga aagcgcgtat ggatttggct catcaggcca 240
gattgagggt ctgtggacac atgtcatgtt agtgtacttc aatcgccccc tggatatagc 300
cccgacaata ggccgtggcc tcattttttt gccttccgca catttccatt gctcggtacc 360
cacaccttgc ttctcctgca cttgccaacc ttaatactgg tttacattga ccaacatctt 420
acaagcgggg ggcttgtcta gggtatatat aaacagtggc tctcccaatc ggttgccagt 480
ctcttttttc ctttctttcc ccacagattc gaaatctaaa ctacacatca caccatggcc 540
acctcctcta actccgacct ggtccgaacc atcgagtccg ccctcggcat ttctctcggc 600
gacagcgtgt ccgattctgt cgttatcatt gccaccactt ctgctgccgt catcattgga 660
cttctggtct tcctctggcg aaagtctccc gacagatcgc gagagctgcg tcctgtcatt 720
gtgcccaagt ttaccgttaa gcacgaggac gatgaagtcg aggtggaccg aggcaaaacc 780
aaggttacag ttttctacgg aactcagacc ggtactgccg agggctttgc aaaggccctt 840
gcggaggaaa tcaaggccag atacgagaag gccgttgtca aggtggttga catggatgac 900
tacgctattg acgatgacca gtacgaggaa aagctcaaaa aggagaccct ggtcttcttt 960
atgcttgcca cctatggaga cggcgaaccc accgataacg ctgcacgatt ctacaagtgg 1020
tttaccgagg gcaaggagga acgaggaacc tggctgcagc aactcactta cggtgtgttc 1080
gccttgggca accgacagta cgagcatttc aacaagatcg gcaagattgt cgacgaggat 1140
cttaccgagc agggagccaa gcgtctggtt cccgtcggtc tcggcgacga tgaccagtcc 1200
atcgaggacg atttcaacgc ttggaaggaa accttgtggc cagagctgga ccaacttctc 1260
cgagacgagg atgacgtcaa cactgcttcg accccttaca ctgccgctat ctccgagtat 1320
cgtgtcgtta tccacgatcc taccgtgtct ccctcctacg agaaccattt caatgttgcc 1380
aacggtggag cagtgttcga cattcaccat ccctgtcgag tcaacgttgc cgtgcgacgg 1440
gaacttcaca agccccagtc cgaccgatct tgcattcacc tggagtttga tctctccggt 1500
actggcgtta catacgagac tggcgaccac gtcggagtgt acgccgagaa ctgcgacgaa 1560
actgtcgagg aagctggcaa gctgctcggt cagtcgctgg atcttctctt ttctctgcat 1620
accgacaagg aggatggcac aagccttggt ggatctctgc tccctccatt tcctggaccc 1680
tgtaccgttc gaactgccct cgcttgctac gccgaccttc ttaatcctcc acggaaagcc 1740
gctatcgtgg cacttgctgc ccatgcttcc gagcccagcg aggccgaacg actcaagttt 1800
ctttcttcgc ctcagggcaa ggacgagtac tccaagtggg tcgttggatc tcagcgatcg 1860
ctgctcgaag tcatggccga ttttccctcc gccaagcctc cactgggagt gttctttgct 1920
gccattgcac ctcgactgca gcctcgatac tattctatct cctcttcgcc cagaccagct 1980
ccccagcgag tgcacgttac ctgtgccctt gtcgagggac ccactcctac cggtcggatt 2040
cacaagggtg tgtgctccac ctggatgaag tctgctactc ccttggagaa gtctcacgac 2100
tgttcccgag cacctatctt cattcgaccc tccaacttca agcttcctgc cgaccattcg 2160
attcccatta tcatggtcgg acctggtaca ggtctggctc cctttcgagg attcctccag 2220
gaacgacttg ccctcaagga ggatggagtt cagcttggac ctgccctgct cttctttggt 2280
tgccgaaaca gacagatgga cttcatctac gaggacgaac tcaacaattt cgttcagcaa 2340
ggtgccattt ccgagctcat cgttgcgttt tctcgagagg gcccagaaaa ggagtacgtg 2400
cagcacaaga tgatggacaa ggccgagtat ctgtggtctc tcatttcgca gggaggctac 2460
ctgtacgtct gtggtgatgc caaaggcatg gctcgagacg tgcaccgatc ccttcatacc 2520
attgttcagc aacaggagaa cgcagattct tcgaaggctg aggccactgt caagaaactc 2580
cagatggacg gaagatacct gcgagacgtg tggtaagcgg ccgcatgaga agataaatat 2640
ataaatacat tgagatatta aatgcgctag attagagagc ctcatactgc tcggagagaa 2700
gccaagacga gtactcaaag gggattacac catccatatc cacagacaca agctggggaa 2760
aggttctata tacactttcc ggaataccgt agtttccgat gttatcaatg ggggcagcca 2820
ggatttcagg cacttcggtg tctcggggtg aaatggcgtt cttggcctcc atcaagtcgt 2880
accatgtctt catttgcctg tcaaagtaaa acagaagcag atgaagaatg aacttgaagt 2940
gaaggaattt aaatgtaacg aaactgaaat ttgaccagat attgtgtccg cggtggagct 3000
ccagcttttg ttccctttag tgagggttaa tttcgagctt ggcgtaatca tggtcatagc 3060
tgtttcctgt gtgaaattgt tatccgctca caagcttcca cacaacgtac gttgattgag 3120
gtggagccag atgggctatt gtttcatata tagactggca gccacctctt tggcccagca 3180
tgtttgtata cctggaaggg aaaactaaag aagctggcta gtttagtttg attattatag 3240
tagatgtcct aatcactaga gattagaatg tcttggcgat gattagtcgt cgtcccctgt 3300
atcatgtcta gaccaactgt gtcatgaagt tggtgctggt gttttacctg tgtactacaa 3360
gtaggtgtcc tagatctagt gtacagagcc gtttagaccc atgtggactt caccattaac 3420
gatggaaaat gttcattata tgacagtata ttacaatgga cttgctccat ttcttccttg 3480
catcacatgt tctccacctc catagttgat caacacatca tagtagctaa ggctgctgct 3540
ctcccactac agtccaccac aagttaagta gcaccgtcag tacagctaaa agtacacgtc 3600
tagtacgttt cataactagt caagtagccc ctattacaga tatcagcact atcacgcacg 3660
agtttttctc tgtgctatct aatcaacttg ccaagtattc ggagaagata cactttcttg 3720
gcatcaggta tacgagggag cctatcagat gaaaaagggt atattggatc cattcatatc 3780
cacctacacg ttgtcataat ctcctcattc acgtgattca tttcgtgaca ctagtttctc 3840
actttccccc ccgcacctat agtcaacttg gcggacacgc tacttgtagc tgacgttgat 3900
ttatagaccc aatcaaagcg ggttatcggt caggtagcac ttatcattca tcgttcatac 3960
tacgatgagc aatctcgggc atgtccggaa aagtgtcggg cgcgccagct gcattaatga 4020
atcggccaac gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc 4080
actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg 4140
gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc 4200
cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc 4260
ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga 4320
ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc 4380
ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat 4440
agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg 4500
cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc 4560
aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga 4620
gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact 4680
agaagaacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt 4740
ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag 4800
cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg 4860
tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa 4920
aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata 4980
tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg 5040
atctgtctat ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata 5100
cgggagggct taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg 5160
gctccagatt tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct 5220
gcaactttat ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt 5280
tcgccagtta atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc 5340
tcgtcgtttg gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga 5400
tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt 5460
aagttggccg cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc 5520
atgccatccg taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa 5580
tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca 5640
catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca 5700
aggatcttac cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct 5760
tcagcatctt ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc 5820
gcaaaaaagg gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa 5880
tattattgaa gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt 5940
tagaaaaata aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgatgcg 6000
gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggaaat tgtaagcgtt 6060
aatattttgt taaaattcgc gttaaatttt tgttaaatca gctcattttt taaccaatag 6120
gccgaaatcg gcaaaatccc ttataaatca aaagaataga ccgagatagg gttgagtgtt 6180
gttccagttt ggaacaagag tccactatta aagaacgtgg actccaacgt caaagggcga 6240
aaaaccgtct atcagggcga tggcccacta cgtgaaccat caccctaatc aagttttttg 6300
gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag ggagcccccg atttagagct 6360
tgacggggaa agccggcgaa cgtggcgaga aaggaaggga agaaagcgaa aggagcgggc 6420
gctagggcgc tggcaagtgt agcggtcacg ctgcgcgtaa ccaccacacc cgccgcgctt 6480
aatgcgccgc tacagggcgc gtccattcgc cattcaggct gcgcaactgt tgggaagggc 6540
gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt gctgcaaggc 6600
gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg acggccagtg 6660
aattgtaata cgactcacta tagggcgaat tgggcccgac gtcgcatgca ttccgacagc 6720
agcgactggg caccatgatc aagcgaaaca ccttccccca gctgccctgg caaaccatca 6780
agaaccctac tttcatcaag tgcaagaacg gttctactct tctcacctcc ggtgtctacg 6840
gctggtgccg aaagcctaac tacaccgctg atttcatcat gtgcctcacc tgggctctca 6900
tgtgcggtgt tgcttctccc ctgccttact tctacccggt cttcttcttc ctggtgctca 6960
tccaccgagc ttaccgagac tttgagcgac tggagcgaaa gtacggtgag gactaccagg 7020
agttcaagcg acaggtccct tggatcttca tcccttatgt tttctaaacg ataagcttag 7080
tgagcgaatg gtgaggttac ttaattgagt ggccagccta tgggattgta taacagacag 7140
tcaatatatt actgaaaaga ctgaacagcc agacggagtg aggttgtgag tgaatcgtag 7200
agggcggcta ttacagcaag tctactctac agtgtactaa cacagcagag aacaaataca 7260
ggtgtgcatt cggctatctg agaattagtt ggagagctcg agaccctcgg cgataaactg 7320
ctcctcggtt ttgtgtccat acttgtacgg accattgtaa tggggcaagt cgttgagttc 7380
tcgtcgtccg acgttcagag cacagaaacc aatgtaatca atgtagcaga gatggttctg 7440
caaaagattg atttgtgcga gcaggttaat taagttgcga cacatgtctt gatagtatct 7500
tgaattctct ctcttgagct tttccataac aagttcttct gcctccagga agtccatggg 7560
tggtttgatc atggttttgg tgtagtggta gtgcagtggt ggtattgtga ctggggatgt 7620
agttgagaat aagtcataca caagtcagct ttcttcgagc ctcatataag tataagtagt 7680
tcaacgtatt agcactgtac ccagcatctc cgtatcgaga aacacaacaa catgccccat 7740
tggacagatc atgcggatac acaggttgtg cagtatcata catactcgat cagacaggtc 7800
gtctgaccat catacaagct gaacaagcgc tccatacttg cacgctctct atatacacag 7860
ttaaattaca tatccatagt ctaacctcta acagttaatc ttctggtaag cctcccagcc 7920
agccttctgg tatcgcttgg cctcctcaat aggatctcgg ttctggccgt acagacctcg 7980
gccgacaatt atgatatccg ttccggtaga catgacatcc tcaacagttc ggtactgctg 8040
tccgagagcg tctcccttgt cgtcaagacc caccccgggg gtcagaataa gccagtcctc 8100
agagtcgccc ttaggtcggt tctgggcaat gaagccaacc acaaactcgg ggtcggatcg 8160
ggcaagctca atggtctgct tggagtactc gccagtggcc agagagccct tgcaagacag 8220
ctcggccagc atgagcagac ctctggccag cttctcgttg ggagagggga ctaggaactc 8280
cttgtactgg gagttctcgt agtcagagac gtcctccttc ttctgttcag agacagtttc 8340
ctcggcacca gctcgcaggc cagcaatgat tccggttccg ggtacaccgt gggcgttggt 8400
gatatcggac cactcggcga ttcggtgaca ccggtactgg tgcttgacag tgttgccaat 8460
atctgcgaac tttctgtcct cgaacaggaa gaaaccgtgc ttaagagcaa gttccttgag 8520
ggggagcaca gtgccggcgt aggtgaagtc gtcaatgatg tcgatatggg ttttgatcat 8580
gcacacataa ggtccgacct tatcggcaag ctcaatgagc tccttggtgg tggtaacatc 8640
cagagaagca cacaggttgg ttttcttggc tgccacgagc ttgagcactc gagcggcaaa 8700
ggcggacttg tggacgttag ctcgagcttc gtaggagggc attttggtgg tgaagaggag 8760
actgaaataa atttagtctg cagaactttt tatcggaacc ttatctgggg cagtgaagta 8820
tatgttatgg taatagttac gagttagttg aacttataga tagactggac tatacggcta 8880
tcggtccaaa ttagaaagaa cgtcaatggc tctctgggcg tcgcctttgc cgacaaaaat 8940
gtgatcatga tgaaagccag caatgacgtt gcagctgata ttgttgtcgg ccaaccgcgc 9000
cgaaaacgca gctgtcagac ccacagcctc caacgaagaa tgtatcgtca aagtgatcca 9060
agcacactca tagttggagt cgtactccaa aggcggcaat gacgagtcag acagatactc 9120
gtcgaccttt tccttgggaa ccaccaccgt cagcccttct gactcacgta ttgtagccac 9180
cgacacaggc aacagtccgt ggatagcaga atatgtcttg tcggtccatt tctcaccaac 9240
tttaggcgtc aagtgaatgt tgcagaagaa gtatgtgcct tcattgagaa tcggtgttgc 9300
tgatttcaat aaagtcttga gatcagtttg gccagtcatg ttgtgggggg taattggatt 9360
gagttatcgc ctacagtctg tacaggtata ctcgctgccc actttatact ttttgattcc 9420
gctgcacttg aagcaatgtc gtttaccaaa agtgagaatg ctccacagaa cacaccccag 9480
ggtatggttg agcaaaaaat aaacactccg atacggggaa tcgaaccccg gtctccacgg 9540
ttctcaagaa gtattcttga tgagagcgta tcgattgccc cggagaagac ggccaggccg 9600
cctagatgac aaattcaaca actcacagct gactttctgc cattgccact aggggggggc 9660
ctttttatat ggccaagcca agctctccac gtcggttggg ctgcacccaa caataaatgg 9720
gtagggttgc accaacaaag ggatgggatg gggggtagaa gatacgagga taacggggct 9780
caatggcaca aataagaacg aatactgcca ttaagactcg tgatccagcg actgacacca 9840
ttgcatcatc taagggcctc aaaactacct cggaactgct gcgctgatct ggacaccaca 9900
gaggttccga gcactttagg ttgcaccaaa tgtcccacca ggtgcaggca gaaaacgctg 9960
gaacagcgtg tacagtttgt cttaacaaaa agtgagggcg ctgaggtcga gcagggtggt 10020
gtgacttgtt atagccttta gagctgcgaa agcgcgtatg gatttggctc atcaggccag 10080
attgagggtc tgtggacaca tgtcatgtta gtgtacttca atcgccccct ggatatagcc 10140
ccgacaatag gccgtggcct catttttttg ccttccgcac atttccattg ctcggtaccc 10200
acaccttgct tctcctgcac ttgccaacct taatactggt ttacattgac caacatctta 10260
caagcggggg gcttgtctag ggtatatata aacagtggct ctcccaatcg gttgccagtc 10320
tcttttttcc tttctttccc cacagattcg aaatctaaac tacacatcac agaattccga 10380
gccgtgagta tccacgacaa gatcagtgtc gagacgacgc gttttgtgta atgacacaat 10440
ccgaaagtcg ctagcaacac acactctcta cacaaactaa cccagctctc catggccttc 10500
cagtttcacc tggaggtcct cctgccctac ctccttcctc tgcttctgct catcctgccc 10560
accactatct tctttctcac caagcccaac aataaggtgt cctctacttc caccaacaat 10620
aacatcatta cactgcccaa gtcgtaccct ctcattggct cctacctttc gttccgaaag 10680
aacctgcatc gacggatcca gtggctctcc gacattgttc agatctctcc ctccgctacc 10740
ttccagctcg acggaaccct gggcaagcga cagatcatta ctggcaaccc ttctaccgtc 10800
cagcacattc tcaagaacca gttctccaac tatcagaagg gcaccacatt caccaacact 10860
ctgtccgact ttctcggaac aggcatcttc aacaccaacg gtcccaactg gaagtttcaa 10920
cgacaggttg cctctcacga gttcaacacc aagtccattc ggaacttcgt cgagcacatc 10980
gtggataccg aactcaccaa ccgattgatt cccatcctca cttcgagcac ccagacaaac 11040
aatatcctgg acttccagga tattctgcag cgatttacct tcgacaacat ctgcaacatt 11100
gccttcggat acgatcccga gtacctcact ccctcgacca atcgttccaa gttcgcggag 11160
gcctacgaag acgctaccga gatctccagc aagcgattca gactgcctct tcccatcatt 11220
tggaagatca aaaagtactt caacattggc tccgagaagc gactcaagga agccgtcacc 11280
gaggtccgat cctttgccaa gaaactggtc cgagagaaga aacgggagct cgaagagaag 11340
tcttcgctgg agaccgaaga catgctttct cgatttctgt ccagcggtca ctcggacgag 11400
gatttcgttg ccgacattgt catctccttc attctcgcag gcaaggacac tacctctgcc 11460
gctcttacct ggtttttctg gctgctctgg aagaaccctc gagtggagga agagatcgtc 11520
aacgagctgt ccaagaaatc ggagcttatg gtgtacgacg aggtcaagga aatggtctac 11580
acccatgctg cgctgtccga gtcgatgaga ctctaccctc ccgttccaat ggattccaag 11640
gaggccgtca acgacgatgt gctgcccgac ggctgggtgg tcaagaaagg tacaatcgtc 11700
acctaccatg tctacgctat gggtcgaatg aagtctctct ggggagacga ttgggcagag 11760
tttcgaccag aacggtggct cgagaaggac gaggtcaacg gcaagtgggt gttcgtcgga 11820
cgagacagct actcctatcc tgtgttccag gctggtccca gagtctgcct gggaaaggag 11880
atggccttca tgcagatgaa gcgaattgtg gctggcatcg tcggaaagtt caaggtggtt 11940
cccgaagccc acttggctca ggagccagga ttcatttcct ttctgtcgtc tcagatggag 12000
ggtggatttc ccgtcactat ccagaagcga gactcctaag cggccgcatt gatgattgga 12060
aacacacaca tgggttatat ctaggtgaga gttagttgga cagttatata ttaaatcagc 12120
tatgccaacg gtaacttcat tcatgtcaac gaggaaccag tgactgcaag taatatagaa 12180
tttgaccacc ttgccattct cttgcactcc tttactatat ctcatttatt tcttatatac 12240
aaatcacttc ttcttcccag catcgagctc ggaaacctca tgagcaataa catcgtggat 12300
ctcgtcaata gagggctttt tggactcctt gctgttggcc accttgtcct tgctgttt 12358
<210> 106
<211> 1296
<212> DNA
<213> 解脂耶氏酵母
<400> 106
atggatttct tcagacggca ccagaaaaag gtgctggcac tggtaggtgt ggcgctgagt 60
tcctacctgt ttatcgacta tgtgaagaaa aagttcttcg agatccaggg tcgtttgagc 120
tcggagcgaa ccgctaaaca gaatctccgg cgccgatttg aacagaacca gcaggatgca 180
gattttacaa tcatggctct gctatccagc ttgacgacac cggtaatgga gcgttacccc 240
gtcgaccaga tcaaggcaga gttacagagc aagagacgcc ccacagaccg ggttttggct 300
ctcgagagct ccacctcgtc ctcagctacc gcacaaaccg tgcccaccat gacaagtggc 360
gccacagagg agggcgagaa gtcgaaaaca cagttgtggc aggatctcaa gcgaacgacc 420
atttcccgag cgttttctct tgtctatgca gatgcacttc ttattttctt cacgcgtttg 480
cagctcaaca ttctaggacg acgaaactac gtcaacagtg ttgtcgctct ggcgcagcag 540
ggccgagagg gtaatgccga gggtcgagtg gcgccctcgt ttggtgatct tgcagatatg 600
ggctatttcg gcgacctttc aggctcgtcc agcttcggag aaactattgt cgatcccgat 660
ctggacgaac agtaccttac cttttcgtgg tggctgctga acgagggatg ggtgtcgctg 720
agcgagcgag tggaggaagc ggttcgtcga gtgtgggacc ccgtgtcacc caaggccgaa 780
cttggatttg acgagttgtc ggaactcatt ggacgaacac agatgctcat tgatcgacct 840
ctcaatccct cgtcgccact caactttctg agccagctgc tgccaccacg ggagcaggag 900
gagtacgtgc ttgcccagaa ccccagcgat actgctgccc ccattgtagg acctaccctc 960
cgacggcttc tggacgagac tgccgacttc atcgagtccc ctaatgccgc agaggtgatt 1020
gagcgacttg ttcactccgg tctctctgtg ttcatggaca agctggctgt cacgtttgga 1080
gccacacctg ctgattcggg ttcgccttat cctgtggtgc tgcctactgc aaaggtcaag 1140
ctgccctcca ttcttgccaa catggctcga caggctggag gcatggccca gggatcgccg 1200
ggcgtggaaa acgagtacat tgacgtgatg aaccaagtgc aggagctgac ctcctttagt 1260
gctgtggtct attcatcttt tgattgggct ctctag 1296
<210> 107
<211> 431
<212> PRT
<213> 解脂耶氏酵母
<400> 107
Met Asp Phe Phe Arg Arg His Gln Lys Lys Val Leu Ala Leu Val Gly
1 5 10 15
Val Ala Leu Ser Ser Tyr Leu Phe Ile Asp Tyr Val Lys Lys Lys Phe
20 25 30
Phe Glu Ile Gln Gly Arg Leu Ser Ser Glu Arg Thr Ala Lys Gln Asn
35 40 45
Leu Arg Arg Arg Phe Glu Gln Asn Gln Gln Asp Ala Asp Phe Thr Ile
50 55 60
Met Ala Leu Leu Ser Ser Leu Thr Thr Pro Val Met Glu Arg Tyr Pro
65 70 75 80
Val Asp Gln Ile Lys Ala Glu Leu Gln Ser Lys Arg Arg Pro Thr Asp
85 90 95
Arg Val Leu Ala Leu Glu Ser Ser Thr Ser Ser Ser Ala Thr Ala Gln
100 105 110
Thr Val Pro Thr Met Thr Ser Gly Ala Thr Glu Glu Gly Glu Lys Ser
115 120 125
Lys Thr Gln Leu Trp Gln Asp Leu Lys Arg Thr Thr Ile Ser Arg Ala
130 135 140
Phe Ser Leu Val Tyr Ala Asp Ala Leu Leu Ile Phe Phe Thr Arg Leu
145 150 155 160
Gln Leu Asn Ile Leu Gly Arg Arg Asn Tyr Val Asn Ser Val Val Ala
165 170 175
Leu Ala Gln Gln Gly Arg Glu Gly Asn Ala Glu Gly Arg Val Ala Pro
180 185 190
Ser Phe Gly Asp Leu Ala Asp Met Gly Tyr Phe Gly Asp Leu Ser Gly
195 200 205
Ser Ser Ser Phe Gly Glu Thr Ile Val Asp Pro Asp Leu Asp Glu Gln
210 215 220
Tyr Leu Thr Phe Ser Trp Trp Leu Leu Asn Glu Gly Trp Val Ser Leu
225 230 235 240
Ser Glu Arg Val Glu Glu Ala Val Arg Arg Val Trp Asp Pro Val Ser
245 250 255
Pro Lys Ala Glu Leu Gly Phe Asp Glu Leu Ser Glu Leu Ile Gly Arg
260 265 270
Thr Gln Met Leu Ile Asp Arg Pro Leu Asn Pro Ser Ser Pro Leu Asn
275 280 285
Phe Leu Ser Gln Leu Leu Pro Pro Arg Glu Gln Glu Glu Tyr Val Leu
290 295 300
Ala Gln Asn Pro Ser Asp Thr Ala Ala Pro Ile Val Gly Pro Thr Leu
305 310 315 320
Arg Arg Leu Leu Asp Glu Thr Ala Asp Phe Ile Glu Ser Pro Asn Ala
325 330 335
Ala Glu Val Ile Glu Arg Leu Val His Ser Gly Leu Ser Val Phe Met
340 345 350
Asp Lys Leu Ala Val Thr Phe Gly Ala Thr Pro Ala Asp Ser Gly Ser
355 360 365
Pro Tyr Pro Val Val Leu Pro Thr Ala Lys Val Lys Leu Pro Ser Ile
370 375 380
Leu Ala Asn Met Ala Arg Gln Ala Gly Gly Met Ala Gln Gly Ser Pro
385 390 395 400
Gly Val Glu Asn Glu Tyr Ile Asp Val Met Asn Gln Val Gln Glu Leu
405 410 415
Thr Ser Phe Ser Ala Val Val Tyr Ser Ser Phe Asp Trp Ala Leu
420 425 430
<210> 108
<211> 377
<212> PRT
<213> 解脂耶氏酵母
<400> 108
Met Trp Gly Ser Ser His Ala Phe Ala Gly Glu Ser Asp Leu Thr Leu
1 5 10 15
Gln Leu His Thr Arg Ser Asn Met Ser Asp Asn Thr Thr Ile Lys Lys
20 25 30
Pro Ile Arg Pro Lys Pro Ile Arg Thr Glu Arg Leu Pro Tyr Ala Gly
35 40 45
Ala Ala Glu Ile Ile Arg Ala Asn Gln Lys Asp His Tyr Phe Glu Ser
50 55 60
Val Leu Glu Gln His Leu Val Thr Phe Leu Gln Lys Trp Lys Gly Val
65 70 75 80
Arg Phe Ile His Gln Tyr Lys Glu Glu Leu Glu Thr Ala Ser Lys Phe
85 90 95
Ala Tyr Leu Gly Leu Cys Thr Leu Val Gly Ser Lys Thr Leu Gly Glu
100 105 110
Glu Tyr Thr Asn Leu Met Tyr Thr Ile Arg Asp Arg Thr Ala Leu Pro
115 120 125
Gly Val Val Arg Arg Phe Gly Tyr Val Leu Ser Asn Thr Leu Phe Pro
130 135 140
Tyr Leu Phe Val Arg Tyr Met Gly Lys Leu Arg Ala Lys Leu Met Arg
145 150 155 160
Glu Tyr Pro His Leu Val Glu Tyr Asp Glu Asp Glu Pro Val Pro Ser
165 170 175
Pro Glu Thr Trp Lys Glu Arg Val Ile Lys Thr Phe Val Asn Lys Phe
180 185 190
Asp Lys Phe Thr Ala Leu Glu Gly Phe Thr Ala Ile His Leu Ala Ile
195 200 205
Phe Tyr Val Tyr Gly Ser Tyr Tyr Gln Leu Ser Lys Arg Ile Trp Gly
210 215 220
Met Arg Tyr Val Phe Gly His Arg Leu Asp Lys Asn Glu Pro Arg Ile
225 230 235 240
Gly Tyr Glu Met Leu Gly Leu Leu Ile Phe Ala Arg Phe Ala Thr Ser
245 250 255
Phe Val Gln Thr Gly Arg Glu Tyr Leu Gly Ala Leu Leu Glu Lys Ser
260 265 270
Val Glu Lys Glu Ala Gly Glu Lys Glu Asp Glu Lys Glu Ala Val Val
275 280 285
Pro Lys Lys Lys Ser Ser Ile Pro Phe Ile Glu Asp Thr Glu Gly Glu
290 295 300
Thr Glu Asp Lys Ile Asp Leu Glu Asp Pro Arg Gln Leu Lys Phe Ile
305 310 315 320
Pro Glu Ala Ser Arg Ala Cys Thr Leu Cys Leu Ser Tyr Ile Ser Ala
325 330 335
Pro Ala Cys Thr Pro Cys Gly His Phe Phe Cys Trp Asp Cys Ile Ser
340 345 350
Glu Trp Val Arg Glu Lys Pro Glu Cys Pro Leu Cys Arg Gln Gly Val
355 360 365
Arg Glu Gln Asn Leu Leu Pro Ile Arg
370 375
<210> 109
<211> 391
<212> PRT
<213> 解脂耶氏酵母
<400> 109
Met Thr Asp Lys Leu Val Lys Val Met Gln Lys Lys Lys Ser Ala Pro
1 5 10 15
Gln Thr Trp Leu Asp Ser Tyr Asp Lys Phe Leu Val Arg Asn Ala Ala
20 25 30
Ser Ile Gly Ser Ile Glu Ser Thr Leu Arg Thr Val Ser Tyr Val Leu
35 40 45
Pro Gly Arg Phe Asn Asp Val Glu Ile Ala Thr Glu Thr Leu Tyr Ala
50 55 60
Val Leu Asn Val Leu Gly Leu Tyr His Asp Thr Ile Ile Ala Arg Ala
65 70 75 80
Val Ala Ala Ser Pro Asn Ala Ala Ala Val Tyr Arg Pro Ser Pro His
85 90 95
Asn Arg Tyr Thr Asp Trp Phe Ile Lys Asn Arg Lys Gly Tyr Lys Tyr
100 105 110
Ala Ser Arg Ala Val Thr Phe Val Lys Phe Gly Glu Leu Val Ala Glu
115 120 125
Met Val Ala Lys Lys Asn Gly Gly Glu Met Ala Arg Trp Lys Cys Ile
130 135 140
Ile Gly Ile Glu Gly Ile Lys Ala Gly Leu Arg Ile Tyr Met Leu Gly
145 150 155 160
Ser Thr Leu Tyr Gln Pro Leu Cys Thr Thr Pro Tyr Pro Asp Arg Glu
165 170 175
Val Thr Gly Glu Leu Leu Glu Thr Ile Cys Arg Asp Glu Gly Glu Leu
180 185 190
Asp Ile Glu Lys Gly Leu Met Asp Pro Gln Trp Lys Met Pro Arg Thr
195 200 205
Gly Arg Thr Ile Pro Glu Ile Ala Pro Thr Asn Val Glu Gly Tyr Leu
210 215 220
Leu Thr Lys Val Leu Arg Ser Glu Asp Val Asp Arg Pro Tyr Asn Leu
225 230 235 240
Leu Ser Arg Leu Asp Asn Trp Gly Val Val Ala Glu Leu Leu Ser Ile
245 250 255
Leu Arg Pro Leu Ile Tyr Ala Cys Leu Leu Phe Arg Gln His Val Asn
260 265 270
Lys Thr Val Pro Ala Ser Thr Lys Ser Lys Phe Pro Phe Leu Asn Ser
275 280 285
Pro Trp Ala Pro Trp Ile Ile Gly Leu Val Ile Glu Ala Leu Ser Arg
290 295 300
Lys Met Met Gly Ser Trp Leu Leu Arg Gln Arg Gln Ser Gly Lys Thr
305 310 315 320
Pro Thr Ala Leu Asp Gln Met Glu Val Lys Gly Arg Thr Asn Leu Leu
325 330 335
Gly Trp Trp Leu Phe Arg Gly Glu Phe Tyr Gln Ala Tyr Thr Arg Pro
340 345 350
Leu Leu Tyr Ser Ile Val Ala Arg Leu Glu Lys Ile Pro Gly Leu Gly
355 360 365
Leu Phe Gly Ala Leu Ile Ser Asp Tyr Leu Tyr Leu Phe Asp Arg Tyr
370 375 380
Tyr Phe Thr Ala Ser Thr Leu
385 390
<210> 110
<211> 2106
<212> DNA
<213> 解脂耶氏酵母
<400> 110
atgatcaccc caaaccccgc taacgacatt gtccatgacg gcaagctcta cgacaccttc 60
actgagcccc ccaagctgat ggctcaggag cgagctcagc tggacttcga ccctagagac 120
atcacctact ttctggatgg ctctaaggag gagaccgagc tgctggagtc gctcatgctc 180
atgtacgagc gagaccctct cttcaacaac cagaacgagt acgatgaatc gtttgaaaca 240
ctgcgagagc gatctgtgaa gcgaattttc cagctgtcca agtccatcgc catggacccc 300
gagcccatgt ctttccgaaa gattgggttc ctgggtattc ttgacatggg aacgtatgct 360
cgactgggag tccactacgc gctcttctgt aactccatcc ggggccaggg aacccccgat 420
cagctcatgt actggctgga ccagggagcc atggtcatca agggcttcta cggctgtttt 480
gccatgaccg aaatgggcca tggatctaac ctgtcgcgtc tggaaaccat cgccactttc 540
gacaaagaga ccgacgaatt tatcattaac acgccccacg ttggagccac aaagtggtgg 600
attggaggag ccgcccacac tgctactcac acacttgcct ttgcccgtct tcaagtagac 660
ggaaaggact acggtgtgaa atcgtttgtc gtacctctcc gaaacctgga cgaccattcg 720
ctgcgtcctg gaatcgccac aggtgatatt ggtaagaaga tgggtcgaga tgccgttgac 780
aacggctgga ttcagttcac caacgtccga gtgccccgaa actacatgct catgaagcat 840
accaaggttc ttcgagacgg taccgtcaag cagccgcctt tggcccaact gacttacgga 900
tctctcatca ctggacgagt ccagatgacc actgactctc acaatgtgtc caaaaagttc 960
ctcaccattg ccctgagata cgccaccatc cgacgacagt tctcgtcaac tccaggagag 1020
cccgaaaccc gactaattga ctacctgtac caccaaagac gactcctgcc tcttatggct 1080
tactcttacg ccatgaaact agctggagat cacgtccgag agctgttctt tgcatcccag 1140
gagaaggctg agagcctcaa ggaggacgac aaagccggag ttgagtctta cgtccaggat 1200
atcaaggagc tcttctctgt ttctgctggt ctcaaggctg ccactacatg ggcttgtgct 1260
gacatcattg acaaggcccg acaggcgtgt ggaggccacg gatactctgc ctacaacggc 1320
tttggacagg ccttccagga ctgggttgtc cagtgcactt gggagggtga caatactgtt 1380
ctgactctat ctgccggccg agctctgatc caatctgctc tcgtctaccg aaaggagggc 1440
aaactaggta acgccacgaa gtacctctct cggtccaagg agcttgccaa cgccaagaga 1500
aacggacgat ccctggaaga ccccaagctg ctcgtggagg catgggaggc tgtctctgcc 1560
ggtgctatca acgctgctac tgacgcttac gaggagctct ccaagcaggg agtttctgtt 1620
gacgagtgct ttgagcaggt gtcccaggag cgattccagg ctgcccgaat ccacactcga 1680
cgagctctta tcgaggcctt ctactcacga atcgccactg ctgatgagaa ggtgaagcct 1740
catctgatcc ctctggccaa cctgtttgcc ctgtggtcca ttgaggagga ctctgctctg 1800
ttcctggctg agggctactt tgagcctgag gatatcattg aggtgacttc tcttgtcaac 1860
aagtactgcg gaattgttcg aaagaacgtt attggataca ccgatgcctt caacctgtcc 1920
gactacttca tcaacgctgc cattggacga tacgacggag acgtgtacaa gaactacttt 1980
gagaaggtca aacagcagta ccctcctgag ggtggcaagc ctcactacta cgaggatgtc 2040
atgaagccct tcctgcatcg agagcgaatt cccgatgtcc ccatggagcc cgaggatatt 2100
cagtaa 2106
<210> 111
<211> 701
<212> PRT
<213> 解脂耶氏酵母
<400> 111
Met Ile Thr Pro Asn Pro Ala Asn Asp Ile Val His Asp Gly Lys Leu
1 5 10 15
Tyr Asp Thr Phe Thr Glu Pro Pro Lys Leu Met Ala Gln Glu Arg Ala
20 25 30
Gln Leu Asp Phe Asp Pro Arg Asp Ile Thr Tyr Phe Leu Asp Gly Ser
35 40 45
Lys Glu Glu Thr Glu Leu Leu Glu Ser Leu Met Leu Met Tyr Glu Arg
50 55 60
Asp Pro Leu Phe Asn Asn Gln Asn Glu Tyr Asp Glu Ser Phe Glu Thr
65 70 75 80
Leu Arg Glu Arg Ser Val Lys Arg Ile Phe Gln Leu Ser Lys Ser Ile
85 90 95
Ala Met Asp Pro Glu Pro Met Ser Phe Arg Lys Ile Gly Phe Leu Gly
100 105 110
Ile Leu Asp Met Gly Thr Tyr Ala Arg Leu Gly Val His Tyr Ala Leu
115 120 125
Phe Cys Asn Ser Ile Arg Gly Gln Gly Thr Pro Asp Gln Leu Met Tyr
130 135 140
Trp Leu Asp Gln Gly Ala Met Val Ile Lys Gly Phe Tyr Gly Cys Phe
145 150 155 160
Ala Met Thr Glu Met Gly His Gly Ser Asn Leu Ser Arg Leu Glu Thr
165 170 175
Ile Ala Thr Phe Asp Lys Glu Thr Asp Glu Phe Ile Ile Asn Thr Pro
180 185 190
His Val Gly Ala Thr Lys Trp Trp Ile Gly Gly Ala Ala His Thr Ala
195 200 205
Thr His Thr Leu Ala Phe Ala Arg Leu Gln Val Asp Gly Lys Asp Tyr
210 215 220
Gly Val Lys Ser Phe Val Val Pro Leu Arg Asn Leu Asp Asp His Ser
225 230 235 240
Leu Arg Pro Gly Ile Ala Thr Gly Asp Ile Gly Lys Lys Met Gly Arg
245 250 255
Asp Ala Val Asp Asn Gly Trp Ile Gln Phe Thr Asn Val Arg Val Pro
260 265 270
Arg Asn Tyr Met Leu Met Lys His Thr Lys Val Leu Arg Asp Gly Thr
275 280 285
Val Lys Gln Pro Pro Leu Ala Gln Leu Thr Tyr Gly Ser Leu Ile Thr
290 295 300
Gly Arg Val Gln Met Thr Thr Asp Ser His Asn Val Ser Lys Lys Phe
305 310 315 320
Leu Thr Ile Ala Leu Arg Tyr Ala Thr Ile Arg Arg Gln Phe Ser Ser
325 330 335
Thr Pro Gly Glu Pro Glu Thr Arg Leu Ile Asp Tyr Leu Tyr His Gln
340 345 350
Arg Arg Leu Leu Pro Leu Met Ala Tyr Ser Tyr Ala Met Lys Leu Ala
355 360 365
Gly Asp His Val Arg Glu Leu Phe Phe Ala Ser Gln Glu Lys Ala Glu
370 375 380
Ser Leu Lys Glu Asp Asp Lys Ala Gly Val Glu Ser Tyr Val Gln Asp
385 390 395 400
Ile Lys Glu Leu Phe Ser Val Ser Ala Gly Leu Lys Ala Ala Thr Thr
405 410 415
Trp Ala Cys Ala Asp Ile Ile Asp Lys Ala Arg Gln Ala Cys Gly Gly
420 425 430
His Gly Tyr Ser Ala Tyr Asn Gly Phe Gly Gln Ala Phe Gln Asp Trp
435 440 445
Val Val Gln Cys Thr Trp Glu Gly Asp Asn Thr Val Leu Thr Leu Ser
450 455 460
Ala Gly Arg Ala Leu Ile Gln Ser Ala Leu Val Tyr Arg Lys Glu Gly
465 470 475 480
Lys Leu Gly Asn Ala Thr Lys Tyr Leu Ser Arg Ser Lys Glu Leu Ala
485 490 495
Asn Ala Lys Arg Asn Gly Arg Ser Leu Glu Asp Pro Lys Leu Leu Val
500 505 510
Glu Ala Trp Glu Ala Val Ser Ala Gly Ala Ile Asn Ala Ala Thr Asp
515 520 525
Ala Tyr Glu Glu Leu Ser Lys Gln Gly Val Ser Val Asp Glu Cys Phe
530 535 540
Glu Gln Val Ser Gln Glu Arg Phe Gln Ala Ala Arg Ile His Thr Arg
545 550 555 560
Arg Ala Leu Ile Glu Ala Phe Tyr Ser Arg Ile Ala Thr Ala Asp Glu
565 570 575
Lys Val Lys Pro His Leu Ile Pro Leu Ala Asn Leu Phe Ala Leu Trp
580 585 590
Ser Ile Glu Glu Asp Ser Ala Leu Phe Leu Ala Glu Gly Tyr Phe Glu
595 600 605
Pro Glu Asp Ile Ile Glu Val Thr Ser Leu Val Asn Lys Tyr Cys Gly
610 615 620
Ile Val Arg Lys Asn Val Ile Gly Tyr Thr Asp Ala Phe Asn Leu Ser
625 630 635 640
Asp Tyr Phe Ile Asn Ala Ala Ile Gly Arg Tyr Asp Gly Asp Val Tyr
645 650 655
Lys Asn Tyr Phe Glu Lys Val Lys Gln Gln Tyr Pro Pro Glu Gly Gly
660 665 670
Lys Pro His Tyr Tyr Glu Asp Val Met Lys Pro Phe Leu His Arg Glu
675 680 685
Arg Ile Pro Asp Val Pro Met Glu Pro Glu Asp Ile Gln
690 695 700
<210> 112
<211> 1581
<212> DNA
<213> 解脂耶氏酵母
<400> 112
atggaagtcc gacgacgaaa aatcgacgtg ctcaaggccc agaaaaacgg ctacgaatcg 60
ggcccaccat ctcgacaatc gtcgcagccc tcctcaagag catcgtccag aacccgcaac 120
aaacactcct cgtccaccct gtcgctcagc ggactgacca tgaaagtcca gaagaaacct 180
gcgggacccc cggcgaactc caaaacgcca ttcctacaca tcaagcccgt gcacacgtgc 240
tgctccacat caatgctttc gcgcgattat gacggctcca accccagctt caagggcttc 300
aaaaacatcg gcatgatcat tctcattgtg ggaaatctac ggctcgcatt cgaaaactac 360
ctcaaatacg gcatttccaa cccgttcttc gaccccaaaa ttactccttc cgagtggcag 420
ctctcaggct tgctcatagt cgtggcctac gcacatatcc tcatggccta cgctattgag 480
agcgctgcca agctgctgtt cctctctagc aaacaccact acatggccgt ggggcttctg 540
cataccatga acactttgtc gtccatctcg ttgctgtcct acgtcgtcta ctactacctg 600
cccaaccccg tggcaggcac aatagtcgag tttgtggccg ttattctgtc tctcaaactc 660
gcctcatacg ccctcactaa ctcggatctc cgaaaagccg caattcatgc ccagaagctc 720
gacaagacgc aagacgataa cgaaaaggaa tccacctcgt cttcctcttc ttcagatgac 780
gcagagactt tggcagacat tgacgtcatt cctgcatact acgcacagct gccctacccc 840
cagaatgtga cgctgtcgaa cctgctgtac ttctggtttg ctcccacact ggtctaccag 900
cccgtgtacc ccaagacgga gcgtattcga cccaagcacg tgatccgaaa cctgtttgag 960
ctcgtctctc tgtgcatgct tattcagttt ctcatcttcc agtacgccta ccccatcatg 1020
cagtcgtgtc tggctctgtt cttccagccc aagctcgatt atgccaacat ctccgagcgc 1080
ctcatgaagt tggcctccgt gtctatgatg gtctggctca ttggattcta cgctttcttc 1140
cagaacggtc tcaatcttat tgccgagctc acctgttttg gaaacagaac cttctaccag 1200
cagtggtgga attcccgctc cattggccag tactggactc tatggaacaa gccagtcaac 1260
cagtacttta gacaccacgt ctacgtgcct cttctcgctc ggggcatgtc gcggttcaat 1320
gcgtcggtgg tggttttctt tttctccgcc gtcatccatg aactgcttgt cggcatcccc 1380
actcacaaca tcatcggagc cgccttcttc ggcatgatgt cgcaggtgcc tctgatcatg 1440
gctactgaga accttcagca tattaactcc tctctgggcc ccttccttgg caactgtgca 1500
ttctggttca cctttttcct gggacaaccc acttgtgcat tcctttatta tctggcttac 1560
aactacaagc agaaccagta g 1581
<210> 113
<211> 526
<212> PRT
<213> 解脂耶氏酵母
<400> 113
Met Glu Val Arg Arg Arg Lys Ile Asp Val Leu Lys Ala Gln Lys Asn
1 5 10 15
Gly Tyr Glu Ser Gly Pro Pro Ser Arg Gln Ser Ser Gln Pro Ser Ser
20 25 30
Arg Ala Ser Ser Arg Thr Arg Asn Lys His Ser Ser Ser Thr Leu Ser
35 40 45
Leu Ser Gly Leu Thr Met Lys Val Gln Lys Lys Pro Ala Gly Pro Pro
50 55 60
Ala Asn Ser Lys Thr Pro Phe Leu His Ile Lys Pro Val His Thr Cys
65 70 75 80
Cys Ser Thr Ser Met Leu Ser Arg Asp Tyr Asp Gly Ser Asn Pro Ser
85 90 95
Phe Lys Gly Phe Lys Asn Ile Gly Met Ile Ile Leu Ile Val Gly Asn
100 105 110
Leu Arg Leu Ala Phe Glu Asn Tyr Leu Lys Tyr Gly Ile Ser Asn Pro
115 120 125
Phe Phe Asp Pro Lys Ile Thr Pro Ser Glu Trp Gln Leu Ser Gly Leu
130 135 140
Leu Ile Val Val Ala Tyr Ala His Ile Leu Met Ala Tyr Ala Ile Glu
145 150 155 160
Ser Ala Ala Lys Leu Leu Phe Leu Ser Ser Lys His His Tyr Met Ala
165 170 175
Val Gly Leu Leu His Thr Met Asn Thr Leu Ser Ser Ile Ser Leu Leu
180 185 190
Ser Tyr Val Val Tyr Tyr Tyr Leu Pro Asn Pro Val Ala Gly Thr Ile
195 200 205
Val Glu Phe Val Ala Val Ile Leu Ser Leu Lys Leu Ala Ser Tyr Ala
210 215 220
Leu Thr Asn Ser Asp Leu Arg Lys Ala Ala Ile His Ala Gln Lys Leu
225 230 235 240
Asp Lys Thr Gln Asp Asp Asn Glu Lys Glu Ser Thr Ser Ser Ser Ser
245 250 255
Ser Ser Asp Asp Ala Glu Thr Leu Ala Asp Ile Asp Val Ile Pro Ala
260 265 270
Tyr Tyr Ala Gln Leu Pro Tyr Pro Gln Asn Val Thr Leu Ser Asn Leu
275 280 285
Leu Tyr Phe Trp Phe Ala Pro Thr Leu Val Tyr Gln Pro Val Tyr Pro
290 295 300
Lys Thr Glu Arg Ile Arg Pro Lys His Val Ile Arg Asn Leu Phe Glu
305 310 315 320
Leu Val Ser Leu Cys Met Leu Ile Gln Phe Leu Ile Phe Gln Tyr Ala
325 330 335
Tyr Pro Ile Met Gln Ser Cys Leu Ala Leu Phe Phe Gln Pro Lys Leu
340 345 350
Asp Tyr Ala Asn Ile Ser Glu Arg Leu Met Lys Leu Ala Ser Val Ser
355 360 365
Met Met Val Trp Leu Ile Gly Phe Tyr Ala Phe Phe Gln Asn Gly Leu
370 375 380
Asn Leu Ile Ala Glu Leu Thr Cys Phe Gly Asn Arg Thr Phe Tyr Gln
385 390 395 400
Gln Trp Trp Asn Ser Arg Ser Ile Gly Gln Tyr Trp Thr Leu Trp Asn
405 410 415
Lys Pro Val Asn Gln Tyr Phe Arg His His Val Tyr Val Pro Leu Leu
420 425 430
Ala Arg Gly Met Ser Arg Phe Asn Ala Ser Val Val Val Phe Phe Phe
435 440 445
Ser Ala Val Ile His Glu Leu Leu Val Gly Ile Pro Thr His Asn Ile
450 455 460
Ile Gly Ala Ala Phe Phe Gly Met Met Ser Gln Val Pro Leu Ile Met
465 470 475 480
Ala Thr Glu Asn Leu Gln His Ile Asn Ser Ser Leu Gly Pro Phe Leu
485 490 495
Gly Asn Cys Ala Phe Trp Phe Thr Phe Phe Leu Gly Gln Pro Thr Cys
500 505 510
Ala Phe Leu Tyr Tyr Leu Ala Tyr Asn Tyr Lys Gln Asn Gln
515 520 525
<210> 114
<211> 1545
<212> DNA
<213> 解脂耶氏酵母
<400> 114
atgactatcg actcacaata ctacaagtcg cgagacaaaa acgacacggc acccaaaatc 60
gcgggaatcc gatatgcccc gctatcgaca ccattactca accgatgtga gaccttctct 120
ctggtctggc acattttcag cattcccact ttcctcacaa ttttcatgct atgctgcgca 180
attccactgc tctggccatt tgtgattgcg tatgtagtgt acgctgttaa agacgactcc 240
ccgtccaacg gaggagtggt caagcgatac tcgcctattt caagaaactt cttcatctgg 300
aagctctttg gccgctactt ccccataact ctgcacaaga cggtggatct ggagcccacg 360
cacacatact accctctgga cgtccaggag tatcacctga ttgctgagag atactggccg 420
cagaacaagt acctccgagc aatcatctcc accatcgagt actttctgcc cgccttcatg 480
aaacggtctc tttctatcaa cgagcaggag cagcctgccg agcgagatcc tctcctgtct 540
cccgtttctc ccagctctcc gggttctcaa cctgacaagt ggattaacca cgacagcaga 600
tatagccgtg gagaatcatc tggctccaac ggccacgcct cgggctccga acttaacggc 660
aacggcaaca atggcaccac taaccgacga cctttgtcgt ccgcctctgc tggctccact 720
gcatctgatt ccacgcttct taacgggtcc ctcaactcct acgccaacca gatcattggc 780
gaaaacgacc cacagctgtc gcccacaaaa ctcaagccca ctggcagaaa atacatcttc 840
ggctaccacc cccacggcat tatcggcatg ggagcctttg gtggaattgc caccgaggga 900
gctggatggt ccaagctctt tccgggcatc cctgtttctc ttatgactct caccaacaac 960
ttccgagtgc ctctctacag agagtacctc atgagtctgg gagtcgcttc tgtctccaag 1020
aagtcctgca aggccctcct caagcgaaac cagtctatct gcattgtcgt tggtggagca 1080
caggaaagtc ttctggccag acccggtgtc atggacctgg tgctactcaa gcgaaagggt 1140
tttgttcgac ttggtatgga ggtcggaaat gtcgcccttg ttcccatcat ggcctttggt 1200
gagaacgacc tctatgacca ggttagcaac gacaagtcgt ccaagctgta ccgattccag 1260
cagtttgtca agaacttcct tggattcacc cttcctttga tgcatgcccg aggcgtcttc 1320
aactacgatg tcggtcttgt cccctacagg cgacccgtca acattgtggt tggttccccc 1380
attgacttgc cttatctccc acaccccacc gacgaagaag tgtccgaata ccacgaccga 1440
tacatcgccg agctgcagcg aatctacaac gagcacaagg atgaatattt catcgattgg 1500
accgaggagg gcaaaggagc cccagagttc cgaatgattg agtaa 1545
<210> 115
<211> 514
<212> PRT
<213> 解脂耶氏酵母
<400> 115
Met Thr Ile Asp Ser Gln Tyr Tyr Lys Ser Arg Asp Lys Asn Asp Thr
1 5 10 15
Ala Pro Lys Ile Ala Gly Ile Arg Tyr Ala Pro Leu Ser Thr Pro Leu
20 25 30
Leu Asn Arg Cys Glu Thr Phe Ser Leu Val Trp His Ile Phe Ser Ile
35 40 45
Pro Thr Phe Leu Thr Ile Phe Met Leu Cys Cys Ala Ile Pro Leu Leu
50 55 60
Trp Pro Phe Val Ile Ala Tyr Val Val Tyr Ala Val Lys Asp Asp Ser
65 70 75 80
Pro Ser Asn Gly Gly Val Val Lys Arg Tyr Ser Pro Ile Ser Arg Asn
85 90 95
Phe Phe Ile Trp Lys Leu Phe Gly Arg Tyr Phe Pro Ile Thr Leu His
100 105 110
Lys Thr Val Asp Leu Glu Pro Thr His Thr Tyr Tyr Pro Leu Asp Val
115 120 125
Gln Glu Tyr His Leu Ile Ala Glu Arg Tyr Trp Pro Gln Asn Lys Tyr
130 135 140
Leu Arg Ala Ile Ile Ser Thr Ile Glu Tyr Phe Leu Pro Ala Phe Met
145 150 155 160
Lys Arg Ser Leu Ser Ile Asn Glu Gln Glu Gln Pro Ala Glu Arg Asp
165 170 175
Pro Leu Leu Ser Pro Val Ser Pro Ser Ser Pro Gly Ser Gln Pro Asp
180 185 190
Lys Trp Ile Asn His Asp Ser Arg Tyr Ser Arg Gly Glu Ser Ser Gly
195 200 205
Ser Asn Gly His Ala Ser Gly Ser Glu Leu Asn Gly Asn Gly Asn Asn
210 215 220
Gly Thr Thr Asn Arg Arg Pro Leu Ser Ser Ala Ser Ala Gly Ser Thr
225 230 235 240
Ala Ser Asp Ser Thr Leu Leu Asn Gly Ser Leu Asn Ser Tyr Ala Asn
245 250 255
Gln Ile Ile Gly Glu Asn Asp Pro Gln Leu Ser Pro Thr Lys Leu Lys
260 265 270
Pro Thr Gly Arg Lys Tyr Ile Phe Gly Tyr His Pro His Gly Ile Ile
275 280 285
Gly Met Gly Ala Phe Gly Gly Ile Ala Thr Glu Gly Ala Gly Trp Ser
290 295 300
Lys Leu Phe Pro Gly Ile Pro Val Ser Leu Met Thr Leu Thr Asn Asn
305 310 315 320
Phe Arg Val Pro Leu Tyr Arg Glu Tyr Leu Met Ser Leu Gly Val Ala
325 330 335
Ser Val Ser Lys Lys Ser Cys Lys Ala Leu Leu Lys Arg Asn Gln Ser
340 345 350
Ile Cys Ile Val Val Gly Gly Ala Gln Glu Ser Leu Leu Ala Arg Pro
355 360 365
Gly Val Met Asp Leu Val Leu Leu Lys Arg Lys Gly Phe Val Arg Leu
370 375 380
Gly Met Glu Val Gly Asn Val Ala Leu Val Pro Ile Met Ala Phe Gly
385 390 395 400
Glu Asn Asp Leu Tyr Asp Gln Val Ser Asn Asp Lys Ser Ser Lys Leu
405 410 415
Tyr Arg Phe Gln Gln Phe Val Lys Asn Phe Leu Gly Phe Thr Leu Pro
420 425 430
Leu Met His Ala Arg Gly Val Phe Asn Tyr Asp Val Gly Leu Val Pro
435 440 445
Tyr Arg Arg Pro Val Asn Ile Val Val Gly Ser Pro Ile Asp Leu Pro
450 455 460
Tyr Leu Pro His Pro Thr Asp Glu Glu Val Ser Glu Tyr His Asp Arg
465 470 475 480
Tyr Ile Ala Glu Leu Gln Arg Ile Tyr Asn Glu His Lys Asp Glu Tyr
485 490 495
Phe Ile Asp Trp Thr Glu Glu Gly Lys Gly Ala Pro Glu Phe Arg Met
500 505 510
Ile Glu

Claims (12)

1.一种包含工程化的LCDA生产途径的重组微生物细胞,所述LCDA生产途径包括编码由SEQ ID NO: 44或49的氨基酸序列所示的长链酰基辅酶A合成酶(ACoS酶)的多核苷酸序列的上调,
其中所述微生物细胞可以从含有长链脂肪酸的底物生产一种或多种长链二羧酸(LCDA)产物,
其中所述微生物细胞是耶氏酵母属(Yarrowia)细胞。
2.如权利要求1所述的重组微生物细胞,其中所述ACoS酶具有长链酰基辅酶A合成酶活性和香豆酰辅酶A合成酶活性两者。
3.如权利要求1所述的重组微生物细胞,其中所述工程化的LCDA生产途径进一步包括以下特征中的一种或多种:
(i) 编码细胞色素P450单加氧酶(CYP酶)的多核苷酸序列的上调
(ii)编码细胞色素P450还原酶(CPR酶)的多核苷酸序列的上调,
(iii)编码脂肪醇氧化酶(FAO酶)的多核苷酸序列的上调,
(iv)编码脂肪醇脱氢酶(FADH酶)的多核苷酸序列的上调,和/或
(v) 编码脂肪醛脱氢酶(FALDH酶)的多核苷酸序列的上调。
4.如权利要求3所述的重组微生物细胞,其中编码所述CYP酶的多核苷酸序列和编码所述CPR酶的多核苷酸序列之一或两者被上调。
5.如权利要求1所述的重组微生物细胞,其中所述微生物细胞进一步包括编码过氧化物酶体生物合成因子的内源多核苷酸序列的下调。
6.如权利要求5所述的重组微生物细胞,其中所述过氧化物酶体生物合成因子是过氧化物酶体生物合成因子-3。
7.如权利要求1所述的重组微生物细胞,其中所述微生物细胞进一步包括编码过氧化物酶体酰基辅酶A氧化酶的内源多核苷酸序列的下调。
8.如权利要求7所述的重组微生物细胞,其中所述过氧化物酶体酰基辅酶A氧化酶是过氧化物酶体酰基辅酶A氧化酶-2、-3和/或-4。
9.如权利要求1所述的重组微生物细胞,其中所述微生物细胞具有降低的脂质合成和/或储存能力。
10.如权利要求9所述的重组微生物细胞,其中所述降低的脂质合成和储存能力是由于至少一种编码二酰基甘油酰基转移酶(DGAT酶)的内源多核苷酸序列的下调。
11.如权利要求1所述的重组微生物细胞,其中:
所述LCDA产物具有10至24个碳原子的链长度,和/或
所述含有长链脂肪酸的底物包含游离的长链脂肪酸或酯化的长链脂肪酸。
12.一种生产长链二羧酸(LCDA)的方法,所述方法包括:
a)使权利要求1所述的重组微生物细胞与含有长链脂肪酸的底物接触,其中所述微生物细胞从所述底物合成LCDA;并且
b)任选地回收步骤 (a) 的LCDA,其中所述微生物细胞是耶氏酵母属细胞。
CN201680055065.3A 2015-07-22 2016-07-20 用微生物高水平生产长链二羧酸 Active CN108138121B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201562195340P 2015-07-22 2015-07-22
US201562195338P 2015-07-22 2015-07-22
US62/195340 2015-07-22
US62/195338 2015-07-22
PCT/US2016/043133 WO2017015368A1 (en) 2015-07-22 2016-07-20 High level production of long-chain dicarboxylic acids with microbes

Publications (2)

Publication Number Publication Date
CN108138121A CN108138121A (zh) 2018-06-08
CN108138121B true CN108138121B (zh) 2022-04-19

Family

ID=57834583

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680055065.3A Active CN108138121B (zh) 2015-07-22 2016-07-20 用微生物高水平生产长链二羧酸

Country Status (6)

Country Link
US (1) US10626424B2 (zh)
EP (1) EP3325607A1 (zh)
JP (1) JP6898915B2 (zh)
CN (1) CN108138121B (zh)
MY (1) MY191314A (zh)
WO (1) WO2017015368A1 (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107400675B (zh) * 2017-08-29 2021-01-26 海南省农业科学院植物保护研究所 一种抗瓜类枯萎病活性产物基因的克隆与序列分析方法
US11136596B2 (en) * 2018-07-06 2021-10-05 Cibt America Inc. Long-chain dibasic acid with low content of hydroxyl acid impurity and production method thereof
CN110684676B (zh) * 2018-07-06 2023-08-08 上海凯赛生物技术股份有限公司 一种低含量羟基酸杂质的长链二元酸及其生产方法
CN111394400B (zh) * 2019-01-03 2022-08-19 上海凯赛生物技术股份有限公司 Sct1基因在长链二元酸生产中的应用
CN111394399B (zh) * 2019-01-03 2022-06-28 上海凯赛生物技术股份有限公司 一种降低长链二元酸中酰基甘油酯杂质含量的方法
CN112301066B (zh) * 2019-07-31 2022-08-02 上海凯赛生物技术股份有限公司 发酵生产长链二元酸的菌株及其制备方法与应用
KR102212882B1 (ko) * 2019-09-25 2021-02-08 한국원자력연구원 지방산 생산능이 증가된 클라미도모나스 속 미세조류 및 클라미도모나스 속 미세조류의 지방산 생산능을 증가시키는 방법
KR102343479B1 (ko) * 2020-06-23 2021-12-27 한국생명공학연구원 스핑고지질 및 스핑고이드 염기의 생산성이 향상된 피키아 시페라이 변이 균주 및 이의 제조방법
JP2024517798A (ja) 2021-05-04 2024-04-23 ニュートリション・アンド・バイオサイエンシーズ・ユーエスエー・フォー,インコーポレイテッド 不溶性アルファ-グルカンを含む組成物
CN115710584A (zh) * 2021-08-18 2023-02-24 上海凯赛生物技术股份有限公司 超氧化物歧化酶在制备lcda中的应用及过表达其的基因工程菌
CN113943760B (zh) * 2021-12-02 2023-09-12 王婷 维斯假丝酵母发酵生产长链二元酸的方法、产品与菌种
WO2023137258A1 (en) 2022-01-12 2023-07-20 Nutrition & Biosciences USA 4, Inc. Coating compositions comprising rubber and insoluble alpha-glucan
CN116656505B (zh) * 2023-04-23 2024-04-16 四川大学 一种高产醇脱氢酶和酰基转移酶菌株及培养方法及应用

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101228282A (zh) * 2004-12-15 2008-07-23 法国石油公司 利用解脂耶氏酵母改进突变株生产二羧酸
CN104321424A (zh) * 2012-04-03 2015-01-28 纳幕尔杜邦公司 在转基因耶氏酵母属中表达胞浆苹果酸酶以提高脂质产量
CN104781411A (zh) * 2012-11-09 2015-07-15 凯利斯塔公司 用于生物学产生脂肪酸衍生物的组合物和方法

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4880741A (en) 1983-10-06 1989-11-14 Pfizer Inc. Process for transformation of Yarrowia lipolytica
US5071764A (en) 1983-10-06 1991-12-10 Pfizer Inc. Process for integrative transformation of yarrowia lipolytica
US20040146999A1 (en) 1997-07-21 2004-07-29 E.I. Du Pont De Nemours And Company Transformed yeast strains and their use for the production of monoterminal and diterminal aliphatic carboxylates
US7238482B2 (en) 2003-05-07 2007-07-03 E. I. Du Pont De Nemours And Company Production of polyunsaturated fatty acids in oleaginous yeasts
US7125672B2 (en) 2003-05-07 2006-10-24 E. I. Du Pont De Nemours And Company Codon-optimized genes for the production of polyunsaturated fatty acids in oleaginous yeasts
US8846374B2 (en) 2006-12-12 2014-09-30 E I Du Pont De Nemours And Company Carotenoid production in a recombinant oleaginous yeast
CN101970638B (zh) 2007-10-03 2015-02-11 纳幕尔杜邦公司 用于高水平生产二十碳五烯酸的优化解脂耶氏酵母菌株
WO2012071439A1 (en) 2010-11-22 2012-05-31 The Regents Of The University Of California Host cells and methods for producing diacid compounds
US8729298B2 (en) 2011-03-28 2014-05-20 Cathay Industrial Biotech Ltd. Method for separation and purification of long-chain diacids
MY165893A (en) * 2011-07-06 2018-05-18 Verdezyne Inc Biological methods for preparing a fatty dicarboxylic acid
WO2013082186A2 (en) * 2011-11-28 2013-06-06 Solazyme, Inc. Genetically engineered microbial strains including prototheca lipid pathway genes
EP2935563B1 (en) * 2012-12-19 2020-11-04 Corvay Bioproducts GmbH Biological methods for preparing a fatty dicarboxylic acid
JP2016502851A (ja) 2012-12-21 2016-02-01 イー・アイ・デュポン・ドウ・ヌムール・アンド・カンパニーE.I.Du Pont De Nemours And Company 微生物細胞中における脂質生成を改変するためのsou2ソルビトール利用タンパク質をコードするポリヌクレオチドの下方制御
EP2843043A1 (en) * 2013-08-27 2015-03-04 Evonik Industries AG A method for producing acyl amino acids

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101228282A (zh) * 2004-12-15 2008-07-23 法国石油公司 利用解脂耶氏酵母改进突变株生产二羧酸
CN104321424A (zh) * 2012-04-03 2015-01-28 纳幕尔杜邦公司 在转基因耶氏酵母属中表达胞浆苹果酸酶以提高脂质产量
CN104781411A (zh) * 2012-11-09 2015-07-15 凯利斯塔公司 用于生物学产生脂肪酸衍生物的组合物和方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Involvement of acyl-CoA synthetase genes in n-alkane assimilation and fatty acid utilization in yeast Yarrowia lipolytica;Tenagy等;《FEMS Yeast Research》;20150630;第15卷(第4期);第4页"Orthologs of ACS genes in Y.lipolytica" *
YALI0E12419p [Yarrowia lipolytica CLIB122];NCBI;《NCBI》;20150227;ORIGIN部分 *

Also Published As

Publication number Publication date
JP2018519843A (ja) 2018-07-26
CN108138121A (zh) 2018-06-08
US10626424B2 (en) 2020-04-21
US20190144897A1 (en) 2019-05-16
WO2017015368A1 (en) 2017-01-26
JP6898915B2 (ja) 2021-07-07
EP3325607A1 (en) 2018-05-30
MY191314A (en) 2022-06-15

Similar Documents

Publication Publication Date Title
CN108138121B (zh) 用微生物高水平生产长链二羧酸
AU2023226754A1 (en) Compositions and methods for modifying genomes
DK2664670T3 (da) Perhydrolase
CN101939434B (zh) 用于在大豆中提高种子贮藏油脂的生成和改变脂肪酸谱的来自解脂耶氏酵母的dgat基因
CN101365788B (zh) Δ-9延伸酶及其在制备多不饱和脂肪酸中的用途
DK2087106T3 (en) MUTATING DELTA8 DESATURATION GENES CONSTRUCTED BY TARGETED MUTAGENES AND USE THEREOF IN THE MANUFACTURE OF MULTI-Saturated FAT ACIDS
DK2087105T3 (da) Delta 17-desaturase og anvendelse heraf ved fremstilling af flerumættede fedtsyrer
DK2443248T3 (en) IMPROVEMENT OF LONG-CHAIN POLYUM Saturated OMEGA-3 AND OMEGA-6 FATTY ACID BIOS SYNTHESIS BY EXPRESSION OF ACYL-CoA LYSOPHOSPHOLIPID ACYL TRANSFERASES
KR20140092759A (ko) 숙주 세포 및 아이소부탄올의 제조 방법
AU2018220469A1 (en) Method and cell line for production of phytocannabinoids and phytocannabinoid analogues in yeast
KR20130032897A (ko) 알코올 발효 시의 알코올 에스테르의 생성 및 원위치에서의 생성물 제거
KR20190002470A (ko) 표적 핵산의 변형을 위한 개선된 방법
KR20140099224A (ko) 케토-아이소발레레이트 데카르복실라제 효소 및 이의 이용 방법
EP2181195A2 (de) Fermentative gewinnung von aceton aus erneuerbaren rohstoffen mittels neuen stoffwechselweges
KR20070085669A (ko) 고농도의 아라키돈산을 생성하는 야로위아 리폴리티카 균주
KR20120099509A (ko) 재조합 숙주 세포에서 육탄당 키나아제의 발현
BRPI0806354A2 (pt) plantas oleaginosas transgências, sementes, óleos, produtos alimentìcios ou análogos a alimento, produtos alimentìcios medicinais ou análogos alimentìcios medicinais, produtos farmacêuticos, bebidas fórmulas para bebês, suplementos nutricionais, rações para animais domésticos, alimentos para aquacultura, rações animais, produtos de sementes inteiras, produtos de óleos misturados, produtos, subprodutos e subprodutos parcialmente processados
KR20150014953A (ko) 케톨-산 리덕토아이소머라아제 효소 및 사용 방법
KR20180053684A (ko) Fdca의 진균 제조
KR20100037031A (ko) 유전자 녹아웃 중온성 및 호열성 생물체, 및 이의 사용 방법
CN101646766B (zh) △17去饱和酶及其用于制备多不饱和脂肪酸的用途
KR20220012327A (ko) 피토칸나비노이드 및 피토칸나비노이드 전구체의 생산을 위한 방법 및 세포
CN108779480A (zh) 生产鞘氨醇碱和鞘脂类的方法
KR20180084135A (ko) 감소된 clr2 활성을 갖는 사상 진균에서 단백질을 생산하는 방법
CN108473968A (zh) 生产植物鞘氨醇或二氢神经鞘氨醇的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant