CN116391044A - 类异戊二烯的发酵生产 - Google Patents

类异戊二烯的发酵生产 Download PDF

Info

Publication number
CN116391044A
CN116391044A CN202180074059.3A CN202180074059A CN116391044A CN 116391044 A CN116391044 A CN 116391044A CN 202180074059 A CN202180074059 A CN 202180074059A CN 116391044 A CN116391044 A CN 116391044A
Authority
CN
China
Prior art keywords
leu
solvent
gly
retinol
asn
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180074059.3A
Other languages
English (en)
Inventor
彼得·路易斯·休斯顿
瓦尔米克·卡努拜·维亚斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DSM IP Assets BV
Original Assignee
DSM IP Assets BV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DSM IP Assets BV filed Critical DSM IP Assets BV
Publication of CN116391044A publication Critical patent/CN116391044A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P5/00Preparation of hydrocarbons or halogenated hydrocarbons
    • C12P5/007Preparation of hydrocarbons or halogenated hydrocarbons containing one or more isoprene units, i.e. terpenes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P23/00Preparation of compounds containing a cyclohexene ring having an unsaturated side chain containing at least ten carbon atoms bound by conjugated double bonds, e.g. carotenes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/645Fungi ; Processes using fungi

Landscapes

  • Organic Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Microbiology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Biotechnology (AREA)
  • Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明涉及类异戊二烯的发酵生产,包括在改进的两相培养系统中培养合适的宿主细胞,例如真菌宿主细胞,特别是油质宿主细胞。

Description

类异戊二烯的发酵生产
本发明涉及类异戊二烯的发酵生产,包括在改进的两相培养系统中培养合适的宿主细胞,例如真菌宿主细胞,特别是油质宿主细胞。
目前用于具有小于C40碳主链的类异戊二烯的化学生产方法,例如类胡萝卜素包括但不限于维生素的生产方法,具有一些不期望的特征,例如高能量消耗、复杂的纯化步骤和/或不期望的副产物。因此,在过去的几十年里,已经研究了制造这些化合物的其他方法,包括微生物转化步骤,但这将导致更经济和更生态化生产。
一般来说,生产本文定义的类异戊二烯的生物系统在工业上是难处理的和/或产生低水平的化合物,使得商业规模的分离是不可行的。最具限制性的因素包括此类生物系统中中间体的不稳定性和/或相对较高的副产物产量。例如,在维生素A的发酵生产中,特别是使用在甘油三酯上生长的油质宿主细胞的情况下,视黄醇脂肪酸酯(fatty acidretinyl ester,FARE)的形成是生物基维生素A/视黄醇转化过程中的一个重要限制因素。
为了避免以少于40个碳为主链的类异戊二烯的发酵生产中的一些问题,已经开发了所谓的两相培养系统,其中发酵产物在所谓的第二相在细胞外收集,第二相包括亲脂性溶剂,例如
Figure BDA0004205539450000011
硅油或正十二烷(参见WO2020/1141168或Jang等人,Microbial CellFactories 10:59,2011)。然而,使用已知溶剂的收率以及杂质分布并不令人满意。
因此,使用两相培养系统寻找更高效的生产工艺是一项持续的任务,特别是寻找具有改进性能的溶剂。
令人惊讶的是,我们现在发现了一种使用两相培养系统发酵生产以少于40个碳为主链的类异戊二烯(包括类胡萝卜素)的改进工艺,其中使用收集发酵产物的第二相溶剂,所述第二相溶剂在发酵过程中不会损失/消失,从而可以提高生产效率和/或提高发酵产物的纯度。
特别地,本发明涉及一种两相培养系统,包括体外提取系统,所述体外提取系统用于发酵生产以少于40个碳为主链的类异戊二烯(“<C40类异戊二烯”),所述类异戊二烯包括类胡萝卜素例如类视黄醇、倍半萜、二萜或紫罗兰酮,包括但不限于α-法尼烯、冷杉醇、α-紫罗兰酮和β-紫罗兰酮,其中在亲脂性溶剂的存在下在合适的碳源上生长合适的宿主细胞,特别是真菌宿主细胞,例如油质酵母,例如耶氏酵母属(Yarrowia)或酵母属(Saccharomyces),所述亲脂性溶剂在发酵过程中不消失。
如本文所定义的且用于本发明的在发酵过程中损失和/或消失最少的合适的亲脂性溶剂,即第二相溶剂,可以选自异链烷烃(isoparaffin),包括烷烃(alkane)、环烷属烃(cycloparaffin)、异烷烃(isoalkane)、环烷烃(cycloalkane)或十二烷的混合物。溶剂可以是天然的或合成的。市售有用溶剂的实例可选自:道尔达(Total),例如
Figure BDA0004205539450000021
溶剂;壳牌(Shell),例如ShellSolTD或ShellSolT;埃克森美孚(Exxon Mobile),例如IsoparTM流体,特别是例如Isopar M、Isopar N、Isopar H、Isopar K、Isopar L;或其混合物或与异十二烷异构体的混合物,例如以商品名AC365770010(Acros Organics)市售可得。优选地,所述第二相溶剂选自异链烷烃,所述异链烷烃包括例如Isopar M、Isopar N、Isopar H、Isopar K、Isopar L及其混合物,更优选地包括Isopar N、Isopar L和/或Isopar M。
如本文所定义的且用于本发明的在发酵过程中损失和/或消失最少的其他合适的亲脂性溶剂,即第二相溶剂,可以选自亲脂性溶剂,包括正烷烃(n-alkane)、异烷烃、碳氢化合物(hydrocarbon)的混合物。溶剂可以是天然的或合成的。市售有用溶剂的实例可选自埃克森美孚,例如以Exxsol D60、D80、D95或D110的商品名市售。
应理解,有用溶剂包括以上列出的市售可得的溶剂以及具有相同或同等性能但已知于/可从其他供应商处获得的相应溶剂。
如本文中所使用的,溶剂具有与Isopar流体(包括Isopar M、Isopar H、Isoper K、Isopard L)等同或相同的性能,并且定义为支化异构体,优选末端甲基化形式的包含6至26个碳的线性烷烃,可在强酸中与较小的烷烃前体化学偶联,用H2和催化剂(如镍或铂)氢化,以去除不饱和度和微量芳烃。目前,这些物质的工业供应商为Isopar(埃克森美孚化工公司(Exxon Mobil Chemical))、Soltrol(雪佛龙菲利普斯化工公司(Chevron PhillipsChemical Company)),Shellsol OMS(荷兰皇家壳牌公司(Royal Dutch Shell))、异辛烷和异十二烷。具体而言,优选使用Isopar M。这些物质在消费品中的用途概述于Johnson等人、Int J Toxicol.2012Nov-Dec;31(6Suppl):269S-95S中。
如本文中所使用的,溶剂具有与Exxsol D60、Exxsol D80、Exxsol D95、ExxsolD110等同或相同的性能。这些Exxsol D系列是来自已通过催化氢化而还原以去除芳烃和不饱和度的裂解烃的窄沸点蒸馏馏分。
在根据本发明的两相培养系统中生产的合适的<C40-类异戊二烯可以选自异戊二烯,包括但不限于,类视黄醇,例如视黄醇、视黄醛、视黄醇乙酸酯,包括4-酮-形式和3-羟基-形式;α-紫罗兰酮、β-紫罗兰酮,包括二羟基形式;檀香醇(santalol);瓦伦烯(valencene);诺卡酮(nootkatone);广藿香醇(patchoulol);α-法尼烯;冷杉醇(abienol);甜菊醇(steviol);即发酵产物,通常长度为15至30个碳,可以穿过宿主细胞的细胞壁,从而在本文定义的第二相溶剂中在细胞外收集。
如本文中所使用的,与本文所定义的第二相溶剂有关的术语“不消失(notdisappearing)”是指在发酵开始时存在的相同量的溶剂在发酵过程结束时仍然是可检测的。溶剂的损失或消失可能是由于例如被宿主细胞消耗和/或发酵过程中的蒸发。术语“损失(loss)”或“消失(disappearance)”在本文中可互换使用。用于本发明方法的这种溶剂也称为“稳定”溶剂。因此,根据本发明的稳定溶剂意味着在发酵过程中溶剂的损失或消失为约20%或更低,例如在约20%、15%、10%、8%、5%、3%、2%、1%的范围内,或甚至在发酵过程中没有溶剂的损失或消失。
在本发明的一个实施方案中,本文定义的两相培养系统,包括使用本文定义的溶剂,使得在约20%范围内或更少的溶剂消失,即其中,在发酵开始时存在的至少约80%,例如85%、90%、92%、95%、97%、98%、99%、100%的溶剂在发酵过程结束时仍然存在。特别有用的在发酵结束时仍然存在的溶剂可以选自与Isopar M、Isopar L、Isopar H、Isopar K或Exxsol D110相同或等同的溶剂。
因此,本发明涉及<C40-类异戊二烯的发酵生产,所述<C40-类异戊二烯包括但不限于类胡萝卜素、倍半萜、二萜或紫罗兰酮,所述发酵生产包括在两相培养系统中在合适的培养条件下在本文所定义的溶剂存在下培养本文定义的合适的宿主细胞,所述溶剂在发酵过程中溶剂损失约20%或更少。
如本文中所使用的,术语“包含异链烷烃的溶剂”或“包含烷烃混合物的溶剂”是指异链烷烃和/或烷烃混合物的百分比为至少在约90%的范围内,优选为在至少约95%、至少约98%、至少约99%或至少约100%的范围内(v/v),包括本文描述的溶剂,尤其是以商品名Isopar M、Isopar N、Isopard H、Isoper K、Isopra L、Exxsol D60、D80、D95、D110已知的溶剂,或具有等同或相同性能但来自其他供应商的溶剂。这样的范围也可适用于包含其他亲脂性化合物的溶剂,例如包含正十二烷、硅油、十六烷或
Figure BDA0004205539450000041
的溶剂。使用具有如本文所定义的百分比的异链烷烃和/或烷烃混合物的溶剂与术语“在亲脂性溶剂存在下”可互换使用。
在一个实施方案中,本发明涉及一种与使用正十二烷作为第二相的消耗相比减少或消除第二相溶剂消耗的方法,即减少或消除宿主细胞对第二相溶剂消耗的方法。特别地,与使用正十二烷作为第二相溶剂的消耗相比,通过使用本文所述的亲脂性溶剂的方法,第二相的消耗可以减少至少约50%,例如60%、65%、70%、75%、80%、85%、90%、95%、97%、99%或100%。优选地,亲脂性溶剂选自商品名为Isopar M、Isopar N、Isopard H、Isoper K、Isopra L、Exxsol D110的溶剂或具有等同或相同性能但来自其他供应商的溶剂。
在另一个实施方案中,本发明涉及用于如本文所定义的<C40-类异戊二烯的发酵生产的两相培养系统,所述发酵生产在如本文所描述的亲脂性溶剂存在下进行,其中,溶剂的蒸发减少或消除,特别地减少至少约50%,例如60%、65%、70%、75%、80%、85%、90%、95%、97%、99%或100%。优选地,亲油溶剂选自商品名为Isopar M、Isopar N、Isoper H、Isopard K、Isopra L、Exxsol D60、Exxsol-D110的溶剂,更优选Isopar L、Isopar-M、Exxsole-D110,或选自具有等同或相同性能但来自其他供应商的溶剂。
因此,根据本发明的稳定溶剂意味着,与已知溶剂例如正十二烷、硅油或十六烷相比,蒸发和/或消耗减少至少约50%。与本文定义的稳定溶剂相比,这种在发酵过程中蒸发和/或消耗增加约50%以上的溶剂定义为“不稳定溶剂”。这种不稳定溶剂的实例是正十二烷、硅油或十六烷。
两相培养系统中使用的溶剂的蒸发,包括随时间推移的发酵质量的测量,以及发酵开始和结束时的第二相体积的测量,可以使用LCMS通过质量平衡来测量。此外,将第二相掺入到产物例如视黄醇乙酸酯中的测量指示消耗。产物中的同位素13C比率——汽油与玉米衍生的乙醇进料中的比率加权——可以通过13C NMR或质谱来测量。根据本发明,宿主生物如耶氏酵母属对溶剂如异链烷烃的消耗是,在不存在另一碳源的情况下,在存在第二相的情况下,检测氧消耗(通过溶解氧探针测量),其中高于背景的氧的消耗与没有溶剂的情况相同,这与溶剂的消耗相关。最后,可以使用发酵产生的废气或冷阱中冷凝物的测量/质量规格分析来测量蒸发。
在一个实施方案中,本发明的特征在于,使用两相培养系统生产本文定义的<C40-类异戊二烯的发酵方法,其中与使用非稳定溶剂相比,副产物的形成可以减少,特别是减少至少约10%,例如在至少约15%、至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%或更多的范围内。特别地,本文定义的这种减少副产物形成的方法在本文定义的亲脂性溶剂的存在下进行,优选地,其中所述溶剂选自以商品名Isopar M、Isopar N、Isopar L、Exxsol D60、Exxsol D95、Exxsole D110已知的溶剂,更优选Isopar M、Exxsol D60、Exxsol D95、Exxsol D110或具有等同或相同性能但来自其他供应商的溶剂。与使用正十二烷或
Figure BDA0004205539450000061
相比,减少量可以在至少约25%的范围内。
如本文所使用的,与根据本发明的<C40-类异戊二烯的发酵生产有关的术语“副产物(by-product)”、“副产品(side-product)”或“不期望的发酵产物(undesiredfermentation product)”在本文中可互换使用,并且指竞争产物(即杂质)的不期望的共生产,其应与所需发酵产物的分离和/或其会限制所需发酵产物的收率和/或生产率。此外,它涉及不期望的转化过程,即其中中间体转化为期望的发酵产物与中间体转化为副产物或不期望的副产物的不期望的竞争。术语<C-40类异戊二烯和(期望的)发酵产物在本文中可互换使用。
关于类视黄醇,特别是视黄醇乙酸酯的生产,作为本发明中包括的类胡萝卜素的一个实例,不希望的副产物应减少或消除,所述不希望的副产物包括但不限于形成视黄醛、视黄醇、视黄醇脂肪酸酯(FARE)或二氢形式,例如二氢视黄醇或二氢视黄醇乙酸酯,特别是FARE。
关于紫罗兰酮,例如α-紫罗兰酮或β-紫罗兰酮的生产,作为本发明中所包括的类胡萝卜素的另一个实例,不希望的副产物包括但不限于形成rosafluene、八氢番茄红素、麦角固醇、二氢-β-紫罗兰酮和其他还原形式。
在本发明的一个特定方面中,本文所述的两相培养系统在包含异链烷烃的亲脂性溶剂的存在下进行,例如选自可作为IsoparTM流体市售可得的溶剂,特别选自Isopar M、Isopar N、Isopar K、Isopar L、Isopar H或具有等同或相同性能但来自其他供应商的溶剂,其中与例如在第二相溶剂(如
Figure BDA0004205539450000062
)的存在下获得的深色/黑色(不透明色)相比,所需发酵产物的颜色是半透明的,所述所需发酵物特别是在所述溶剂中积聚的类胡萝卜素,例如类视黄醇,更特别是视黄醇乙酸酯。
如本领域所知,颜色可以在几个不同的坐标系中精确描述,坐标系例如XYZ、RGB、CYMK或L*a*b*,包括
Figure BDA0004205539450000071
匹配系统(/>
Figure BDA0004205539450000072
Matching System,PMS)。在这些系统中,不同的值被分配给本领域已知的变量,如L*、a*和b*。本领域技术人员知晓根据不同的颜色测量系统使用哪种仪器,以及如何测量存在于本文所述的第二相溶剂中的发酵产物的颜色。
如本文中所使用的,术语“半透明(translucent)”可以定义为10%以上的透射率,其中透射率是穿过溶剂的光量,即定义为从溶剂射出的光/进入溶剂的光,穿过溶剂的距离为1cm。也可以定义为通过大约5厘米的溶剂阅读报纸的能力。
关于具体在表9中所示的半透明颜色分布,是指发酵产物的淡黄色,所述发酵产物特别是存在于本文定义的第二相溶剂中的类视黄醇,更特别是视黄醇乙酸酯。因此,存在于第二相溶剂(如Isopar M、Isopar H、Isopar K、Isopar L)中的类视黄醇的半透明颜色对应于由
Figure BDA0004205539450000073
匹配系统(PMS)配色方案定义的PMS 120–PMS 129的颜色。术语“半透明”、“透明”、“淡黄色(light yellow)”或“浅黄色(light yellowish)”在本文中可互换使用。
如本文中所使用的,术语“深色/黑色”是不透明的,并且可以根据上面给出的定义被定义为透射率小于10%。
关于具体在表9中所示的深色/黑色分布,是指发酵产物的深色(不透明色),所述指发酵产物特别是存在于本文定义的第二相溶剂中的类视黄醇,更特别是视黄醇乙酸酯。因此,存在于第二相溶剂(如Exxsol D60、D80、D95、D110或Drakeol 5)中的类视黄醇的深色对应于由
Figure BDA0004205539450000074
匹配系统(PMS)配色方案定义的PMS 182–PMS 209的颜色。
在本文定义的亲脂性溶剂存在下,使用本文定义的两相培养系统生产如上所述的<C40-类异戊二烯,包括培养合适的宿主细胞,特别是真菌宿主细胞,例如油质酵母,例如耶氏酵母属(Yarrowia)或酵母属(Saccharomyces),所述宿主细胞在合适的碳源上生长。
用于本发明的合适宿主细胞可以选自能够生产<C40-类异戊二烯的任何宿主细胞,包括生产类胡萝卜素、倍半萜、二萜或紫罗兰酮的任何宿主细胞,例如真菌宿主细胞、更特别是油质宿主细胞,例如耶氏酵母属(Yarrowia)、红冬孢酵母属(Rhodosporidium)、油脂酵母属(Lipomyces)、酵母属(Saccharomyces)或红酵母属(Rhodotorula),优选耶氏酵母属或酵母属,更优选解脂耶氏酵母(Yarrowia lipolytica)或酿酒酵母(Saccharomycescerevisiae)。根据发酵产物,本领域技术人员知晓选择哪种宿主细胞,包括各自的培养条件。
用于本发明的合适的碳源可以选自线性烷烃、游离脂肪酸,包括甘油三酯,特别是植物油,例如选自来源于如下物质的油:玉米、大豆、橄榄、向日葵、芥花籽(canola)、棉籽、油菜籽、芝麻、红花、葡萄籽或其混合物,包括各自的游离脂肪酸如油酸、棕榈酸或亚油酸。合适的碳源还可以选自乙醇、甘油或葡萄糖以及一种或多种上述碳源的混合物。
在一个实施方案中,本发明涉及一种生产类视黄醇的方法,特别是生产视黄醇乙酸酯的方法,即在本文定义的亲脂性溶剂存在下的两相培养系统进行,其中,生产视黄醇乙酸酯的宿主细胞,优选油质酵母细胞如耶氏酵母属,在合适的培养条件下培养,其中,亲脂性溶剂在发酵过程中没有被消耗或蒸发,所述亲脂性溶剂优选选自作为IsoparTM流体的市售溶剂,尤其选自Isopar M、Isopar N、Isopard K、Isoper L、Isopra H或具有等同或相同性能但来自其他供应商的溶剂,和/或其中,作为副产物的FARE的形成减少或消除,特别是减少到基于总类视黄醇的至少约50%,例如至少约40%、30%、20%、15%、10%、5%、3%、2%、1%或0.5%,和/或其中,与例如使用
Figure BDA0004205539450000081
作为第二相溶剂相比,视黄醇乙酸酯的颜色是半透明的且不暗。
用于本发明的合适的生产类视黄醇的宿主细胞,特别是生产视黄醇乙酸酯的宿主细胞,可以选自真菌宿主细胞,包括油质酵母细胞,例如红冬孢酵母属(Rhodosporidium)、油脂酵母属(Lipomyces)、酵母属(Saccharomyces)或耶氏酵母属(Yarrowia),优选耶氏酵母属,更优选解脂耶氏酵母,特别是表达编码异源酶EC类[EC 2.3.1.84]的基因和/或包含内源脂肪酶活性的一种或多种遗传修饰的解脂耶氏酵母,所述异源酶EC类[EC 2.3.1.84]催化视黄醇酶促转化为视黄醇乙酸酯,所述内源脂肪酶活性的一种或多种遗传修饰是例如参与将视黄醇转化为视黄醇脂肪酸酯(FARE)的内源性脂肪酶的活性降低或被消除(FARE是发酵类视黄醇生产中的一种主要的不期望的副产物)。在例如WO2019058001或WO2020141168中描述了表达这种ATF的合适菌株。
优选地,在本发明中使用的生产视黄醇乙酸酯的宿主细胞表达异源ATF,特别是真菌ATF,其包含至少7个氨基酸残基的高度保守的部分氨基酸序列,所述氨基酸残基选自[NDEHCS]-H-x(3)-D-[GA](基序为Prosite syntax,定义于https://prosite.expasy.org/scanprosite/scanprosite_doc.html中),其中,“x”表示任意氨基酸且其中心组氨酸是酶结合口袋的一部分,优选地,其中所述7个氨基酸基序选自[NDE]-H-x(3)-D-[GA],更优选选自[ND]-H-x(3)-D-[GA],最优选选自对应于根据WO2019058001中SEQ ID NO:13的多肽中的位置N218至G224的N-H-x(3)-D-[GA]。此类酶的实例可特别选自L.mirantina、发酵乳杆菌(L.fermentati)、贝酵母(S.bayanus)或异常威客汉姆酵母(W.anomalus),例如WO2019058001中SEQ ID NO:13的LmATF1、WO2019058001中公开的SbATF1、LffATF1、FfATF1、Wa1ATF1或Wa3ATF1,更优选地,所述ATF在序列中包含含一个或多个氨基酸取代,所述序列与WO2019058001中的SEQ ID NO:13具有至少约20%,例如25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、92%、95%、97%、98%、99%或高达100%的同一性,其中所述一个或多个氨基酸取代位于对应于选自位置68、69、72、73、171、174、176、178、291、292、294、301、307、308、311、312、320、322、334、362、405、407、409、480、483、484、490、492、520、521、522、524、525、526及其组合的氨基酸残基的位置,并且如WO2020141168的表4中特别举例说明的,最优选包含对应于WO2019058001的SEQ ID NO:13中的氨基酸残基69、407、409、480、484及其组合的位置上的一个或多个氨基酸取代。
在一个具体的实施方案中,用于本发明方法的生产视黄醇乙酸酯的宿主细胞包括在对应于根据WO2019058001中SEQ ID NO:13的多肽中的残基69的位置处的氨基酸取代,导致在所述残基处的天冬酰胺、丝氨酸或丙氨酸,例如通过天冬酰胺取代组氨酸(H69N)、丝氨酸取代组氨酸(H69S)或丙氨酸取代组氨酸(H69A),优选H69A。所述修饰的酶可以来源于酵母,例如L.mirantina、发酵乳杆菌(L.fermentati)、异常威客汉姆酵母(W.anomalus)或贝酵母(S.bayanus),优选来源于L.mirantina,任选地与根据WO2019058001中的SEQ ID NO:13的多肽中的残基407对应的位置处的氨基酸取代结合,从而在所述残基处产生异亮氨酸,例如通过用异亮氨酸取代缬氨酸(V407I),任选地与根据WO2019058001中SEQ ID NO:13的多肽中对应于残基409的位置处的氨基酸取代结合,从而在所述残基处产生丙氨酸,例如通过用丙氨酸取代甘氨酸(G409A),任选地与根据WO2019058001中的SEQ ID NO:13的多肽中对应于残基480的位置处的氨基酸取代结合,从而在所述残基处产生谷氨酸、赖氨酸、甲硫氨酸、苯丙氨酸或谷氨酰胺,例如通过谷氨酸取代丝氨酸(S480E)、赖氨酸取代丝氨酸(S480L),甲硫氨酸取代丝氨酸(S480M)、苯丙氨酸取代丝氨酸(S480F)或谷氨酰胺取代丝氨酸(S480Q),任选地与根据WO2019058001中SEQ ID NO:13的多肽中对应于残基484的位置处的氨基酸取代结合,从而在所述残基处产生亮氨酸,例如通过亮氨酸取代异亮氨酸(I484L)。所述修饰的酶可以来源于酵母,例如L.mirantina、发酵乳杆菌(L.fermentati)、异常威客汉姆酵母(W.anomalus)或贝酵母(S.bayanus),优选来源于L.mirantina。在最优选的实施方案中,用于根据本发明的方法的ATF是修饰的ATF,包含氨基酸取代S480Q_G409A_V407I_H69A_I484L,并且是可从Lachancea mirantina获得。
如本文中所使用的,术语“生产视黄醇乙酸酯的宿主细胞”是如本文所定义的能够合成视黄醇并表达ATF的宿主细胞,从而产生基于所述宿主细胞产生的总类视黄醇百分比为至少约70-90%的视黄醇乙酸酯。任选地,这种生产视黄醇乙酸酯的宿主细胞还能够产生类胡萝卜素。
在一个实施方案中,用于根据本发明的方法的生产视黄醇乙酸酯的宿主细胞可以包括进一步的修饰,例如使得视黄醇转化为FARE的内源性酶活性的修饰。特别地,这样的修饰包括内源性脂肪酶活性的减少或缺失,特别是编码具有与耶氏酵母LIP2和/或耶氏酵母LIP3和/或耶氏酵母LIP4和/或耶氏酵母LIP8相等活性的酶的一种或多种内源性基因的活性减少或消除,例如与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或其组合具有至少约50%,例如60%、70%、80%、90%、95%、98%或100%同一性的多肽,其中SEQ IDNO:1对应于可从解脂耶氏酵母获得的LIP2,SEQ ID NO:3对应于可从解脂耶氏酵母可获得的LIP3,SEQ ID NO:5对应于可从解脂耶氏酵母获得的LIP8,SEQ ID NO:7对应于可从解脂耶氏酵母获得的LIP4。优选的是对应于耶氏酵母LIP8的活性的脂肪酶活性的修饰,例如特别是降低或消除的活性,更特别是消除的活性。更优选的是,其中与SEQ ID NO:5具有至少约50%同一性的多肽被消除。
术语“脂肪酶”在本文中可与术语“具有脂肪酶活性的酶”互换使用。指的是参与甘油三酯油(如植物油)预消化为甘油和脂肪酸的酶,通常在油质宿主细胞中表达。如本文所定义的在生产视黄醇乙酸酯的宿主细胞中修饰的合适的酶可以选自属于EC 3.1.1类的内源性酶,包括但不限于一种或多种具有对应于耶氏酵母LIP2、耶氏酵母LIP3、耶氏酵母LIP4或耶氏酵母LIP8活性的活性的酶。
如本文中所使用的,具有“对应于耶氏酵母中相应LIP活性的活性”的酶不仅包括来源于耶氏酵母例如解脂耶氏酵母的基因,如耶氏酵母LIP2、耶氏酵母LIP3、耶氏酵母LIP4、耶氏酵母LIP8或其组合,还包括具有同等酶活性但来源于其他来源生物体(特别是生产视黄醇乙酸酯的油质宿主细胞)的酶,其中这种同等内源性基因的修饰将导致本文所定义的视黄醇到视黄醇乙酸酯转化率的增加。
如本文中所使用的,本文所定义的具有“降低或消除”活性的酶,特别是脂肪酶,意指其比活性的降低,即在发酵过程中催化产物从给定底物形成甘油和脂肪酸的能力的降低/消除,包括编码这种脂肪酶的相应(内源性)基因的活性降低或消除。100%的降低在本文中称为酶活性的消除,例如通过编码所述酶的内源性基因中的缺失、插入、移码突变、错义突变或过早终止密码子或用已知方法阻断所述内源性基因的表达和/或活性来实现。
如本文中所使用的,导致基因活性消失的基因的“缺失”包括核酸序列中可能导致功能减弱的等位基因的所有突变,包括但不限于缺失、插入、移码突变、错义突变和过早终止密码子,其中缺失意味着在宿主细胞中不能(再)检测到相应的基因/蛋白质活性,例如特别是内源性脂肪酶活性。
本文定义的遗传修饰包括但不限于,例如,基因置换、基因扩增、基因破坏、转染、使用质粒、病毒或其他载体的转化。这种基因修饰的实例可以例如影响与DNA的相互作用,该相互作用由本文定义的酶的N末端区域介导,或者影响与其他效应分子的相互作用。特别地,导致特异性酶活性降低/被消除的修饰可以在蛋白质的功能性部分中进行,例如对催化活性具有功能性的部分。此外,酶特异性活性的降低/消除可以通过使所述酶与特异性抑制剂或与它们特异性相互作用的其他物质接触来实现。为了鉴定这样的抑制剂,可以在怀疑抑制其活性的化合物存在的情况下表达相应的酶,例如本文定义的某些内源性脂肪酶,并测试其活性。
将突变产生为核酸或氨基酸,即诱变,可以以不同的方式进行,例如通过随机或侧向诱变、由试剂引起的物理损伤,例如辐射、化学处理或插入遗传元件。技术人员知晓如何引入突变。
如本文中所使用的,如果可以通过Northern印迹检测编码蛋白质的mRNA和/或通过质谱检测蛋白质,则酶是“在体内表达且有活性的”。关于本文定义的外源性脂肪酶活性,是指改善宿主细胞甘油三酯利用的能力,包括本文定义的内源性脂肪酶活性的修饰。关于本文定义的ATF,是指宿主细胞将视黄醇乙酰化为视黄醇乙酸酯的能力。
术语“序列同一性”、“同一性%”在本文中可互换使用。为了本发明的目的,这里定义为,为了确定两个氨基酸序列或两个核酸序列的序列同一性的百分比,为了最佳比较的目的对序列进行比对。为了优化两个序列之间的比对,可以在被比较的两个序列中的任何序列中引入间隙。这样的比对可以在被比较的序列的整个长度上进行。或者,比对可以在较短的长度上进行,例如在约20个、约50个、约100个或更多的核酸/碱基或氨基酸上进行。序列同一性是在报告的比对区域上两个序列之间相同匹配的百分比。两个氨基酸序列之间或两个核苷酸序列之间的序列同一性百分比可以使用用于两个序列比对的Needleman和Wunsch算法来确定(Needleman,S.B.and Wunsch,C.D.(1970)J.Mol.Biol.48,443-453)。氨基酸序列和核苷酸序列都可以通过该算法进行比对。Needleman-Wunsch算法已经在计算机程序NEEDLE中实现。为了本发明的目的,使用来自EMBOSS包的NEEDLE程序(版本2.8.0或更高版本,EMBOSS:The European Molecular Biology Open Software Suite(2000)Rice,Longden and Bleasby,Trends in Genetics 16,(6)pp276—277,http://emboss.bioinformatics.nl/)。对于蛋白质序列,使用EBLOSUM62作为取代基质。对于核苷酸序列,使用EDNAFLL。所使用的可选参数是10的间隙开放罚分和0.5的间隙扩展罚分。本领域技术人员将理解,所有这些不同的参数将产生略微不同的结果,但是当使用不同的算法时,两个序列的总体同一性百分比不会显著改变。
如上所述,在通过程序NEEDLE进行比对后,查询序列和本发明序列之间的序列同一性百分比计算如下:比对中显示两个序列中相同氨基酸或相同核苷酸的对应位置的数量除以减去比对中总间隙数之后的比对总长度。本文定义的同一性可以通过使用NOBRIEF选项从NEEDLE获得,并在程序输出中标记为“最长同一性”。如果比较的两个氨基酸序列的任何氨基酸都没有差异,则它们是相同的或具有100%的同一性。
本文所述的在本发明中使用的合适宿主细胞中表达的酶还包括携带(其他)氨基酸取代的酶,这些取代不会改变酶的活性,即相对于本文所定义的酶具有相同的性能。这种突变也被称为“沉默突变”。本发明中包括的沉默突变的实例是宿主优化的序列。
宿主细胞,包括但不限于本文所定义的生产视黄醇乙酸酯的宿主细胞,在合适碳源和本文所定义亲脂性溶剂存在下在水性介质中培养,任选地在有氧或厌氧条件下补充适当的营养素,并且如本领域技术人员所知,以能够生产所需的发酵产物,例如视黄醇乙酸酯。发酵可以分批、补料分批、半连续或连续模式进行。特别地,视黄醇乙酸酯发酵在补料分批搅拌槽反应器中进行。发酵可进行5至14天,例如约118小时。可在合适的时刻例如当罐由于添加进料而充满时收获发酵产物,所述发酵产物包括如本文所定义的在第二相溶剂中积累的视黄醇乙酸酯。根据宿主细胞的不同,培养可以有所不同,这是本领域技术人员已知的。所需的发酵产物,例如视黄醇乙酸酯、α-紫罗兰酮、β-紫罗兰酮等,可以用作食品、饲料、制药或化妆品工业中的成分/制剂。在例如WO2008042338中描述了从耶氏酵母属或酵母属中选择的产生β-胡萝卜素和类视黄醇的宿主细胞的培养和分离。
就本发明而言,应当理解的是,生物体,例如微生物、真菌、藻类或植物,还包括具有相同生理性能的此类物种的异名或基名,如《国际原核生物命名法(International Codeof Nomenclature of Prokaryotes)》或《国际藻类、真菌和植物命名法(InternationalCode of Nomenclature for algae,fungi,and plants(Melbourne Code))》所定义。因此,例如,Lachancea mirantina菌株是源自日本的Zygosaccharomyces sp.IFO 11066菌株的异名。
如本文中所使用的,关于酶的术语“比活性”或“活性”是指其催化活性,即其催化从给定底物形成产物的能力。比活性定义了在给定的时间段内消耗的底物和/或产生的产物的量以及在定义的温度下每定义量的蛋白质。通常,比活性以每分钟每毫克蛋白质消耗的μmol底物或形成的μmol产物表示。通常,μmol/min缩写为U(=单位)。因此,在全文中,比活性的单位定义μmol/min/(mg蛋白)或U/(mg蛋白质)可以互换使用。如果酶在体内,即在本文定义的宿主细胞内或在合适的(无细胞)系统内,在合适的底物存在下,执行其催化活性,则酶是活性的。本领域技术人员知晓如何测量酶活性。评估本文定义的脂肪酶参与视黄醇脂肪酸酯形成的能力的分析方法是本领域已知的,并且包括通过HPLC等进行的测量。关于本文定义的LIP2、LIP3、LIP8、LIP4的活性,本领域技术人员可以测量由视黄醇转化形成的视黄醇脂肪酸酯,与由视黄醇转化形成的视黄醇乙酸酯相比,这两者都是用修饰的和各自的野生型宿主细胞测量的。评估本文定义的合适的ATF(野生型或修饰型)用于生产视黄醇乙酸酯(即视黄醇的乙酰化)或本文定义的具有脂肪酶活性的酶的能力的分析方法是本领域已知的,例如在WO2014096992的实施例4中描述的。简言之,可以通过HPLC测量产物的滴度,所述产物例如视黄醇乙酸酯、视黄醇、反式视黄醛、顺式视黄醛、β-胡萝卜素等。
任选地,宿主细胞,例如耶氏酵母属,特别是产生视黄醇乙酸酯的耶氏酵母属,表达用于β-胡萝卜素生物合成的另外的酶和/或用于催化β-胡萝卜素转化为视黄醛和/或视黄醛转化为视黄醇的另外的酶。本领域技术人员知晓哪些基因用于β-胡萝卜素的生物合成和/或β-胡萝卜素生成视黄醇的生物转化。产生生产类胡萝卜素的宿主细胞的基因和方法是本领域已知的,参见例如WO2006102342。根据要产生的类胡萝卜素,可能涉及不同的基因。
在一个具体的实施方案中,在本文定义的方法中使用的宿主细胞,如WO2019058001或WO2019057999中公开的,可能来源于解脂耶氏酵母,因此被进一步基因修饰,其中由β-胡萝卜素形成的视黄醇乙酸酯是通过β-胡萝卜素氧化酶(beta-caroteneoxidases,BCO)、视黄醇二氢酶(retinol dihydrogenase,RDH)和/或乙酰基转移酶(acetyl-transferases,ATF)的异源表达来优化的。特别地,在本文定义的方法中使用的修饰的生产视黄醇乙酸酯的宿主细胞可以表达源自黑腹果蝇(Drosophila melanogaster)或灰尾果蝇(Danio rerio)的BCO、源自镰刀菌(Fusarium)的RDH和真菌ATF,例如源自Lachancea属或酵母属的ATF。为了在本文所定义的方法中增强β-胡萝卜素转化为视黄醛,转化为视黄醇,转化为视黄醇乙酸酯,所述酶可能包含一个或多个突变,导致视黄醇乙酰化为视黄醇乙酸酯的改善。
包含上述内源性基因活性例如脂肪酶活性的修饰和/或异源基因例如ATF的表达的宿主细胞,也被称为“修饰的宿主细胞”。
如本文中所使用的,“野生型宿主细胞”是指在上述遗传修饰方面为野生型,即未修饰的相应宿主细胞。因此,在野生型宿主细胞中,本文定义的相应内源性酶(仍然)在体内表达和有活性,和/或不表达异源酶。
根据本发明的转化被定义为特异性酶活性,即本文所述酶的催化活性,包括但不限于脂肪酶的酶活性,特别是属于EC类3.1.1的酶(参与视黄醇转化为视黄醇脂肪酸酯),β-胡萝卜素氧化酶(BCO)、视黄醇二氢酶(RDH)、乙酰基转移酶(ATF)。
本文所用的类视黄醇包括β-胡萝卜素裂解产物,也称为类胡萝卜素,包括但不限于视黄醛、视黄酸、视黄醇、视黄醇甲醇盐(retinoic methoxide)、视黄醇乙酸酯、视黄酯、4-酮-类视黄醇、3-羟基类视黄醇或其组合。类视黄醇的生物合成描述于例如WO2008042338中。
能够在发酵过程中产生类视黄醇的宿主细胞称为“生产类视黄醇的宿主细胞”。维生素A途径的基因和产生类视黄醇的宿主细胞的方法是本领域已知的。如本文中所使用的,“生产视黄醇的宿主细胞”是一种宿主细胞,其中相应的多肽在体内表达并具有活性,例如通过将视黄醛酶促转化为视黄醇来产生视黄醇。“生产视黄醇乙酸酯的宿主细胞”是能够通过表达相应的乙酰化酶(例如本文所述的ATF)将视黄醇乙酰化为视黄醇乙酸酯的相应宿主细胞。
本文所用的“视黄醛(Retinal)”已知为IUPAC名(2E,4E,6E,8E)-3,7-二甲基-9-(2,6,6-三甲基环己烯-1-基)壬-2,4,6,8-四烯醛。它在本文中可互换地称为视黄醛(retinaldehyde)或维生素A醛,并包括顺式和反式异构体,例如11-顺式视黄醛、13-顺式视黄醛,反式视黄醛和全反式视黄醛。
本文中使用的术语“类胡萝卜素”在本领域中是众所周知的。类胡萝卜素包括长度40个碳共轭类异戊二烯多烯,其在自然界中通过两个20个碳香叶基香叶基焦磷酸(geranylgeranyl pyrophosphate)分子的连接而形成。这些包括但不限于八氢番茄红素、番茄红素和胡萝卜素,例如β-胡萝卜素,其可以在4-酮位或3-羟基位被氧化以产生角黄素(canthaxanthin)、玉米黄质(zeaxanthin)或虾青素(astaxanthin)。类胡萝卜素的生物合成在例如WO2006102342中进行了描述。
本文所用的“维生素A”可以是在水溶液、固体和制剂中发现的任何化学形式的维生素A,包括视黄醇、视黄醇乙酸酯和视黄醇酯。它还包括视黄酸,例如未离解的游离酸形式或作为阴离子离解的视黄酸。维生素A的一种优选形式是视黄醇乙酸酯,其中术语“视黄醇乙酸酯(retinyl acetate/retinol acetate)”和“维生素A乙酸酯”可以互换使用(参见https://www.cancer.gov/publications/dictionaries/cancer-drug/def/retinyl-acetate?redirect=true)。
术语“甘油三酯”和“甘油三酯油”在本文中可互换使用。
本文可互换使用的“FARE”或“视黄醇脂肪酯”包括长链视黄醇酯。这些长链视黄醇酯定义由至少约8个(例如9个、10个、12个、13个、15个或20个)碳原子和至多约26个(例如25个、22个、21个或更少)碳原子组成的烃酯,优选至多约6个不饱和键,例如0个、1个、2个、4个、5个、6个不饱和键。长链视黄醇酯包括但不限于亚油酸、油酸或棕榈酸。
以下实施例仅是说明性的,并非旨在以任何方式限制本发明的范围。本申请中引用的所有参考文献、专利申请、专利和已公布的专利申请的全文通过引用的方式纳入本文,特别是WO2020141168,WO2019058001、WO2008042338、WO2014096992、WO2006102342、WO2019057999、WO2016172282。
本发明特别涉及以下实施方案(1)至(12):
(1)具有少于40个碳作为主链的类异戊二烯的发酵生产方法,所述发酵生产方法在两相培养系统中进行,包括原位提取所述类异戊二烯,其中在碳源和亲脂性溶剂的存在下培养合适的宿主细胞,其中所述亲脂性溶剂不同于所述碳源且在发酵过程中具有最小的溶剂损失。
(2)实施方案(1),其中,亲脂性溶剂和碳源不相同。
(3)实施方案(1)或(2),其中所述亲脂性溶剂包括异链烷烃,或其中所述亲脂性溶剂包括烷烃,特别是异烷烃或环烷烃。
(4)实施方案(1)、(2)或(3),其中,所述发酵产物选自类胡萝卜素、倍半萜,优选类视黄醇、紫罗兰酮,更优选视黄醇乙酸酯、α-紫罗兰酮、β-紫罗兰酮。
(5)实施方案(1)、(2)、(3)或(4),其中,所述碳源选自线性烷烃、游离脂肪酸、乙醇、葡萄糖,包括甘油三酯,特别是植物油,例如选自源自如下物质的油:玉米、大豆、橄榄、向日葵、芥花籽、棉籽、油菜籽、芝麻、红花、葡萄籽或其混合物,包括各自的游离脂肪酸,例如油酸、棕榈酸或亚油酸。
(6)实施方案(1)、(2)、(3)、(4)或(5),其中20%或更少的溶剂在发酵过程中损失。
(7)实施方案(6),其中宿主细胞对溶剂的消耗减少至少约50%,或其中溶剂的蒸发减少至少约50%。
(8)实施方案(1)、(2)、(3)、(4)、(5)、(6)或(7),副产物或杂质的形成减少至少约25%,优选其中所述杂质选自视黄醛、视黄醇、视黄醇脂肪酸酯(FARE)或其二氢形式,例如二氢视黄醇或二氢视黄醇乙酸酯,特别是FARE、rosafluene、八氢番茄红素、麦角甾醇、二氢-β-紫罗兰酮和其他还原形式。
(9)实施方案(1)、(2)、(3)、(4)、(5)、(6)、(7)或(8),其中,所述宿主细胞选自真菌宿主细胞,特别是油质宿主细胞,例如酵母,优选选自耶氏酵母属(Yarrowia)、红冬孢酵母属(Rhodosporidium)、油脂酵母属(Lipomyces)、酵母属(Saccharomyces)或红酵母属(Rhodotorula)。
(10)一种生产透明或浅黄色<C40类异戊二烯的方法,所述<C40类异戊二烯特别是类胡萝卜素、紫罗兰酮,其中合适的宿主细胞特别是油质酵母在两相培养体系中、在含有异链烷烃的亲脂性溶剂的存在下在合适的碳源上生长,其中,所述合适的碳源选自甘油三酯、线性烷烃、游离脂肪酸、葡萄糖或其混合物,其中发酵产物收集在所述溶剂中并任选地进一步分离和/或纯化。
(11)实施方案(10),其中,所述发酵产物为视黄醇乙酸酯。
(12)生物基类视黄醇形式,包含视黄醇、视黄醇乙酸酯,其中基于总类视黄醇的视黄醇乙酸酯的百分比在约70%-90%的范围内,所述产物通过根据实施方案(10)所述的方法生产。
实施例
实施例1:一般方法和质粒
本文所述的所有基本分子生物学和DNA操作程序通常根据Sambrook et al.(eds.),Molecular Cloning:A Laboratory Manual.Cold Spring Harbor LaboratoryPress:New York(1989)或Ausubel et al.(eds).Current Protocols in MolecularBiology.Wiley:New York(1998)执行。
摇板分析(Shake plate assay)。通常,将200μl 0.25%酵母提取物、0.5%蛋白胨(0.25X YP)与10μl新鲜生长的耶氏酵母属接种,并覆盖200μl溶剂。当碳源为2%玉米油时,将柱状假丝酵母脂肪酶(Candida rugosa Lipase)(Creative enzymes)重悬于PBS中并添加到生长培养基中。或者,使用2%的油酸作为碳源。第二相为Drakeol 5或表6中列出的其他溶剂(实施例2)。转化株通过蒸至单菌落进行纯化,在上述培养基中在24孔板(Multitron,30℃,800RPM)中在30℃下生长4天。第二相(Drakeol 5或表6中列出的其他溶剂)级分从摇板孔中移除并通过带有光电二极管阵列检测器的UPLC和/或C4 HPLC在正相柱上进行分析(详见下文)。
DNA转化。菌株通过在YPD平板培养基上过夜生长转化;从平板上刮下50μl细胞;并通过在40℃下在500μl的培养液中培养30分钟而转化,所述培养液具有以下物质:1μg转化DNA(通常是用于整合转化的线性DNA)、40%PEG 3550MW、100mM乙酸锂、50mM二硫苏糖醇、5mM Tris-Cl pH 8.0、0.5mM EDTA;并直接接种到选择性培养基中,或者在选择主要抗生素标记物的情况下,细胞在30℃下在YPD液体培养基上过度生长4小时,然后接种在选择性培养基上。使用5-氟乳清酸(5-fluoroorotic acid,FOA)进行URA3标记物回收。通过在非选择性培养基上传代治愈外显体潮霉素抗性标记(Hyg)质粒,并通过从非选择性培养基复刻平板菌落到含潮霉素(hygromycin)的培养基(100μg/mL)来鉴定对Hyg敏感的菌落。在含有诺尔丝菌素(nourseothricin)(100μg/mL)的YPD培养基上进行牛毒毒素抗性标记物(Nat)的筛选。
DNA分子生物学。含有DrBCO、LmATF-S480Q_G409A_V407I_H69A_I484L和FfRDH(SEQID NO:10)表达系统的质粒MB9523在Genscript(Piscataway,NJ,USA)合成。质粒MB9523含有“URA3”,用于在解脂耶氏酵母转化中选择标记。为了通过基因和标记物的随机非同源末端连接进行干净的基因插入,通过凝胶电泳和Qiagen凝胶纯化柱纯化感兴趣的(MB9523的)SfiI质粒片段。克隆体通过测序进行了验证。通常,基因在GenScript(Piscataway,NJ)合成。在Genscript(Piscataway,NJ,USA)合成含有Cas9的质粒MB9287(SEQ ID NO:11)和MB9953(SEQ ID NO:12),并在MB9287的情况下引导RNA表达系统靶向LIP2、LIP3和LIP8,在MB9953的情况下引导RNA表达系统靶向LIP4。
质粒列表。所使用的质粒、菌株、核苷酸和氨基酸序列列于表1、表2、表3、表11中。通常,本文所指的所有非修饰序列与参考菌株CLIB122(Dujon B,et al,Nature.2004Jul1;430(6995):35-44)的数据库中的登录序列相同。
表1:用于构建菌株的质粒列表,所述菌株用于以“插入片段”表示的相应基因的过表达或缺失。“LmATF1-mut”是指携带aa取代S480Q_G409A_V407I_H69A_I484L的Lachanceamirantina(LmATF1;WO2019058001中的SEQ ID NO:13)。“DrBCO”是指源自斑马鱼(Daniorerio)的BCO(参见WO2020141168中的SEQ ID NO:18);“FfRDH”是指源自镰刀菌(Fusarium)的RDH(参见WO2020141168中的SEQ ID NO:22)。有关详细说明,请参阅正文。
Figure BDA0004205539450000211
表2:所用解脂耶氏酵母菌株列表。在WO2020141168的表2中描述了ML17544的构造。有关更多详细信息,请参阅正文。
Figure BDA0004205539450000212
表3:使用Cas9 CRISPR靶向的用于脂肪酶基因突变的DNA序列。“脂肪酶基因”是指来自脂耶氏酵母的相应脂肪酶基因。“CRISPR靶向序列”是用于Cas9 CRISPR靶向的种子序列。分别用于LIP8、LIP2和LIP3构建体的引导RNA表达质粒是MB9287,用于LIP4构建体的引导RNA表达质粒是MB9953。有关更多详细信息,请参阅正文。
Lip基因 CRISPR靶向序列 SEQ ID NO:
LIP8 ACAGCAGGCTGAACGAGGAT 13
LIP2 TGGAGGCATGATCAACAGCG 14
LIP3 TCACTCCTCAGCCTCCCAAG 15
LIP4 GGTGGCCTGGATTCGAGTGG 16
LIP4 TTACACCCACTCTATCGGAG 17
类视黄醇定量。用C4反相类视黄醇方法(见下文)和其他文献(WO2020141168)描述的C18进行类视黄醇的分析。所有添加的中间体的相加得到类视黄醇的总量。
C4反相色谱法。为了精确测定离散类视黄醇,使用了长期反相系统。我们通过Agilent 1290仪器在230nm和325nm处分离分析物,仪器具有YMC Pro C4,150x 3.0mm 3μm柱(YMC America,Allentown PA)固定相,以及5μl注射循环体积和柱和样品托盘控制在23℃,梯度如表4B所示。在230nm和325nm处检测到分析物,并用LCMS验证峰的一致性。分析物分离为根据表4A分配的离散峰。
表4A:使用C4反相方法的分析物列表。所有添加的中间体的相加给出类视黄醇的总量。“RT”指保留时间。有关更多详细信息,请参阅正文。
中间体 RT[min] λmax[nm]
反式视黄醇 20.21 325
顺式视黄醇 20.32 325
二氢视黄醇 20.75 290
反式视黄醛 20.89 380
顺式视黄醛 21.02 380
反式视黄醇乙酸酯 22.15 325
顺式视黄醇乙酸酯 22.35 325
二氢视黄醇乙酸酯 22.60 290
视黄醇酯 26-30 325
表4B:UPLC法梯度,其中溶剂A:乙腈;溶剂B:水;溶剂C:水/乙腈/甲磺酸1000:25:1。有关更多详细信息,请参阅正文。
时间[min] %A %B %C 流量[ml/min]
0 5 85 10 0.5
20 98 0 2 0.5
35 98 0 2 0.5
35.1 5 85 10 0.5
40 5 85 10 0.5
方法校准。方法使用从DSM Nutritional Products,Kaisraugst,CH获得的高纯度视黄醇乙酸酯进行校准。对照视黄醇乙酸酯对视黄醇和视黄醛进行定量。表4C中所述的稀释液的制备方法如下。将40mg视黄醇乙酸酯称重到100mL容量瓶中,并溶解在乙醇中,得到400μg/mL溶液。根据需要对该溶液进行超声波处理,以确保溶解。使用50/50甲醇/甲基叔丁基醚(MTBE)作为稀释剂,将5mL此400μg/mL的溶液稀释成50mL(1/10稀释,终浓度40μg/mL),5mL稀释到100mL(1/20稀释,终浓度20μg/mL),5mL的40μg/mL的溶液稀释到50mL(1/10稀释,终浓度4μg/mL),5mL的20μg/mL的溶液稀释到50mL(1/10稀释,终浓度2μg/mL)。所有稀释均在容量瓶中进行。通过在乙醇中将400μg/mL的储备溶液进一步稀释100倍(使用2mL容量移液管和200mL容量瓶)来测定视黄醇乙酸酯的纯度。将该溶液在325nm下使用乙醇的吸光度作为空白,并使用方程调整初始浓度(Abs*稀释度(100)*分子量(328.5)/51180=浓度,单位为mg/mL)。由于视黄醇乙酸酯的紫外吸收迅速最大化,因此浓度越低越好。
表4C:校准标准品的制备。有关详细说明,请参阅正文。
储备[RA],稀释 终浓度
20μg/mL,1/10 2μg/mL
40μg/mL,1/10 4μg/mL
400μg/mL,1/20 20μg/mL
400μg/ml,1/10 40μg/mL
样品制备。将每个菌株的顶部第二相层样品以25倍或更高的稀释度在四氢呋喃(THF)中稀释。使用2mL Precellys(Bertin Corp,Rockville,MD)管制备发酵全培养基(fermentation whole broth),加入25μl充分混合的培养基和975μl THF。以3x15x7500rpm的转速进行两次循环,两次循环之间在-80℃下冷冻10分钟。通过以13000rpm离心1分钟,将细胞碎片向下旋转。将这些样品在THF中稀释10倍。
颜色测量。本文中的颜色由其他文献(http://www.bcslabel.com/pdf/pms_color_chart.pdf)描述的浅黄色/半透明(PMS 120-129)和黑色/深色(PMS 182-209)的Pantone配色方案(Pantone color scheme)定义。
发酵条件。补料分批发酵与先前描述的条件相同,不同之处在于使用Drakeol 5(Penreco,Karns City,PA,USA)或另一种第二相覆盖物(列于表5中)和搅拌槽,所述搅拌槽是在总体积为0.5L至5L的台式反应器中的玉米油、葡萄糖或乙醇进料(见WO2016172282)。分批培养基碳源组成和进料培养基列于表5中。在消耗完初始批次的碳后开始进料,以可控的方式添加进料以维持溶解氧水平(dissolved oxygen level,DO)设定值。
简言之,发酵在玻璃New Brunswick或Eppendorf发酵系统中以3.0L的溢流体积进行。用高压灭菌的1.6kg水溶液分批发酵罐,该水溶液组成为MgSO4·7H2O(1.96g/kg)、NaCl(0.20g/kg)、CaCl2·2H2O(0.33g/kg)、(NH4)2SO4(8.18g/kg)、KH2PO4(8.47g/kg)、Tastone酵母提取物(6.13g/kg,Marcor,Leominster,MA)、DF204消泡剂(8.13g/kg)、盐酸硫胺素(0.2g/kg的4mg/g溶液)、微量元素储备溶液(3.27g/kg的溶液,组成为柠檬酸(200g/kg)、FeSO4·7H2O(27.3g/kg)、Na2MoO4·2H2O(19.6g/kg)、CuSO4·5H2O(18.7mg/kg)、H3BO3(4.9g/kg)、MnSO4·H2O(21.9g/kg)、ZnSO4·7H2O(30.2g/kg))。
冷却后,将碳源与400mL Drakeol 5或其他第二相一起加入。用200ml YP培养基的过夜摇瓶培养物接种发酵,所述YP培养基在30℃下以250RPM搅拌以及如表3所示的特定碳源生长。发酵参数为1000RPM下搅拌,乙醇的气流为2.3LPM,油和混合脂肪酸的气流为2.3LPM,用NH4OH将pH控制在5.5,温度设定为30℃。进料开始时,DO设定点设置为40%。在接下来的24小时内,DO设定值以线性方式下降到20%。然后通过添加进料将DO维持在20%,用于剩余的发酵。
表5:发酵进料方案。发酵第二相的体积始终为400ml。有关详细说明,请参阅正文。
Figure BDA0004205539450000251
实施例2:用作收集解脂耶氏酵母(Yarrowia lipolytica)中产生的类视黄醇的第二相的溶剂的评估
为了确定收集菌株ML18743中产生的类视黄醇的最佳第二相,将各种溶剂作为第二相进行测试,如表6所示。如实施例1中所述进行摇板分析。这些第二相都具有比生长培养基更低的密度,这与其疏水性一起使得能够方便地从离心培养样品中取样上清液。
表6:摇板试验中用耶氏酵母菌株ML18743和ML18812作为第二相测试的溶剂列表。“Abbrev.”意指缩写。有关更多详细信息,请参阅正文。
Figure BDA0004205539450000261
针对发酵过程中溶剂的生长、损失(消耗、蒸发或其他消失方式)以及培养基的密度和粘度测试所述第二相的性能,其中在生长期4天后进行测试。结果如表7所示。
表7:生长、蒸发和密度取决于用作第二相的溶剂。在20℃下测量粘度。有关更多详细信息,请参阅正文。
溶剂 生长 损失 密度[g/ml] 粘度
none ++ N/A N/A N/A
dode ++ 100% 0.75 1.34
dode混合物 ++ 20% 0.75 1.3
Drake 5 ++ <5% 0.84 6.9
Iso H ++ 20% 0.76 1.9
Iso K ++ 20% 0.76 1.86
Iso L ++ <5% 0.77 2.11
Iso M ++ <5% 0.79 4.23
E D60 ++ 20% 0.8 1.77
E D80 ++ 20% 0.8 2.28
E D95 ++ 20% 0.81 2.81
E D110 ++ <5% 0.81 4.1
与没有第二相生长的细胞相比,所列出的第二相都没有引起生长抑制,而芳香族第二相如Exxon Solvesso 150TM和Exxon Solvesso200TM(未显示)不利于生长。有趣的是,包含Isopar M、Exxsol D110或Drakeol 5的第二相在发酵结束时或多或少仍然存在,即既没有蒸发也没有被宿主细胞消耗。其他第二相,包括Exxsol D60、Exxsol D80、ExxslolD95、异丙醇L、异丙醇K、异丙醇H和十二烷(异构体混合物),在测试期间损失了约20%的初始体积。一种第二相,正十二烷,在测试期间完全消失,很可能是由于被消耗。
实施例3:在生产视黄醇乙酸酯的解脂耶氏酵母中用作第二相的溶剂对脂肪酶的影响
为了测试第二相对脂肪酶的影响,我们通过比较用这些第二相中的每一种生长的菌株的类视黄醇输出来测量Candida rugosa lipase CrLIP(Creative Enzymes,US)的抑制作用(见表8)。菌株ML18743和ML18743-lip4在不添加脂肪酶(如CrLIP)的情况下不能消耗甘油三酯。为了确定CrLIP抑制的效果,将在油酸中生长的细胞的总类视黄醇产生与在脂肪酶缺失菌株中在存在CrLIP的情况下在玉米油中培养的细胞进行比较(参见实施例1)。除Drakeol 5和Exxsol D60外,所有第二相对脂肪酶的抑制作用至少为20%,Isopar L的最大抑制作用为40%。此外,还测量了第二相对视黄醇脂肪酸酯(FARE)的影响。简言之,计算每个第二相的基于总类视黄醇的FARE百分比(%FARE),然后将%FARE与Drakeol 5作为第二相的%FARE进行比较。如表8所示,与使用Drakeol 5作为第二相相比,通过使用选定的第二相溶剂可以降低FARE的百分比。
表8:第二相对脂肪酶抑制和FARE产生的影响。“%FARE”计算为在玉米油和异源CrLIP中以所示第二相生长的细胞的总类视黄醇的百分比,然后与存在于具有玉米油、异源CrLIP和作为第二相的Drakeol 5的培养物中的%FARE进行比较。有关更多详细信息,请参阅正文。
溶剂 CrLIP抑制 %FARE,与具有Drakeol 5[%]的%FARE比较
Drake 5 0% 100
Iso L 40% 73
Iso M 29% 56.8
E D60 4% 58.6
E D80 21% 98.5
E D95 35% 28.2
E D110 37% 49.9
实施例4:在生产视黄酰乙酸酯的解脂耶氏酵母中用作第二相的溶剂对颜色的影响
根据实施例2,使用不同的溶剂作为第二相进行实验,随后测量发酵产物(即在第二相中积累的视黄醇乙酸酯)的颜色。
尽管在Drakeol 5和Exxsol(Exxsol D60、D80、D95或D110)的情况下发酵产物的颜色是深色的,但用Isopar和异十二烷混合物(Acros Organics)获得浅黄色半透明颜色。结果如表9所示。
表9:取决于用作第二相的溶剂的颜色分布。根据实施例1中描述的方法测量颜色。有关更多详细信息,请参阅正文。
溶剂 视觉颜色
dode N/A
Dode混合物 浅黄
Drake 5 深/黑
Iso H 半透明
Iso K 半透明
Iso L 半透明
Iso M 半透明
E D60 深/黑
E D80 深/黑
E D95 深/黑
E D110 深/黑
实施例5:在解脂耶氏酵母中用作第二相的溶剂对总类视黄醇产量和纯度的影响
如实施例1所述进行发酵实验,使用不同的溶剂作为第二相,随后测量第二相中积累的类视黄醇。
如表10所示,与使用Exxol D110作为第二相相比较,使用Isopar K和Isopar M作为第二相位显示出总类视黄醇输出的改善。此外,使用Isopar K和Isopar M各自提高了基于总类视黄醇的视黄醇乙酸酯%。其他Isopar(即Isopar L和Isopar H)也获得了类似的结果。
表10:与Exxsol D110相比的总类视黄醇和基于isopar作为第二相溶剂的总类视黄醇的视黄醇乙酸酯%(“纯度%”)。有关更多详细信息,请参阅正文。
Figure BDA0004205539450000301
表11:序列。SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8是指根据SEQID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7分别表达LIP2、LIP3、LIP4、LIP8的多核苷酸。有关更多详细信息,请参阅正文。
Figure BDA0004205539450000311
/>
Figure BDA0004205539450000321
/>
Figure BDA0004205539450000331
/>
Figure BDA0004205539450000341
/>
Figure BDA0004205539450000351
/>
Figure BDA0004205539450000361
/>
Figure BDA0004205539450000371
/>
Figure BDA0004205539450000381
/>
Figure BDA0004205539450000391
/>
Figure BDA0004205539450000401
/>
Figure BDA0004205539450000411
/>
Figure BDA0004205539450000421
/>
Figure BDA0004205539450000431
/>
Figure BDA0004205539450000441
/>
Figure BDA0004205539450000451
/>
Figure BDA0004205539450000461
/>
Figure BDA0004205539450000471
/>
Figure BDA0004205539450000481
/>
Figure BDA0004205539450000491
/>
Figure BDA0004205539450000501
/>
Figure BDA0004205539450000511
/>
SEQUENCE LISTING
<110> 帝斯曼知识产权资产管理有限公司 (DSM IP Assets B.V.)
<120> 新方法
<130> Case 33828
<160> 17
<170> PatentIn version 3.5
<210> 1
<211> 334
<212> PRT
<213> Yarrowia lipolytica
<400> 1
Met Lys Leu Ser Thr Ile Leu Phe Thr Ala Cys Ala Thr Leu Ala Ala
1 5 10 15
Ala Leu Pro Ser Pro Ile Thr Pro Ser Glu Ala Ala Val Leu Gln Lys
20 25 30
Arg Val Tyr Thr Ser Thr Glu Thr Ser His Ile Asp Gln Glu Ser Tyr
35 40 45
Asn Phe Phe Glu Lys Tyr Ala Arg Leu Ala Asn Ile Gly Tyr Cys Val
50 55 60
Gly Pro Gly Thr Lys Ile Phe Lys Pro Phe Asn Cys Gly Leu Gln Cys
65 70 75 80
Ala His Phe Pro Asn Val Glu Leu Ile Glu Glu Phe His Asp Pro Arg
85 90 95
Leu Ile Phe Asp Val Ser Gly Tyr Leu Ala Val Asp His Ala Ser Lys
100 105 110
Gln Ile Tyr Leu Val Ile Arg Gly Thr His Ser Leu Glu Asp Val Ile
115 120 125
Thr Asp Ile Arg Ile Met Gln Ala Pro Leu Thr Asn Phe Asp Leu Ala
130 135 140
Ala Asn Ile Ser Ser Thr Ala Thr Cys Asp Asp Cys Leu Val His Asn
145 150 155 160
Gly Phe Ile Gln Ser Tyr Asn Asn Thr Tyr Asn Gln Ile Gly Pro Lys
165 170 175
Leu Asp Ser Val Ile Glu Gln Tyr Pro Asp Tyr Gln Ile Ala Val Thr
180 185 190
Gly His Ser Leu Gly Gly Ala Ala Ala Leu Leu Phe Gly Ile Asn Leu
195 200 205
Lys Val Asn Gly His Asp Pro Leu Val Val Thr Leu Gly Gln Pro Ile
210 215 220
Val Gly Asn Ala Gly Phe Ala Asn Trp Val Asp Lys Leu Phe Phe Gly
225 230 235 240
Gln Glu Asn Pro Asp Val Ser Lys Val Ser Lys Asp Arg Lys Leu Tyr
245 250 255
Arg Ile Thr His Arg Gly Asp Ile Val Pro Gln Val Pro Phe Trp Asp
260 265 270
Gly Tyr Gln His Cys Ser Gly Glu Val Phe Ile Asp Trp Pro Leu Ile
275 280 285
His Pro Pro Leu Ser Asn Val Val Met Cys Gln Gly Gln Ser Asn Lys
290 295 300
Gln Cys Ser Ala Gly Asn Thr Leu Leu Gln Gln Val Asn Val Ile Gly
305 310 315 320
Asn His Leu Gln Tyr Phe Val Thr Glu Gly Val Cys Gly Ile
325 330
<210> 2
<211> 1005
<212> DNA
<213> Yarrowia lipolytica
<400> 2
atgaagcttt ccaccatcct cttcacagcc tgcgctaccc tggctgccgc cctcccttcc 60
cccatcactc cttctgaggc cgcagttctc cagaagcgag tgtacacctc taccgagacc 120
tctcacattg accaggagtc ctacaacttc tttgagaagt acgcccgact cgcaaacatt 180
ggatattgtg ttggtcccgg cactaagatc ttcaagccct tcaactgtgg cctgcaatgt 240
gcccacttcc ccaacgttga gctcatcgag gagttccacg acccccgtct catctttgat 300
gtttctggtt acctcgctgt tgatcatgcc tccaagcaga tctaccttgt tattcgagga 360
acccactctc tggaggacgt cataaccgac atccgaatca tgcaggctcc tctgacgaac 420
tttgatcttg ctgctaacat ctcttctact gctacttgtg atgactgtct tgtccacaat 480
ggcttcatcc agtcctacaa caacacctac aatcagatcg gccccaagct cgactctgtg 540
attgagcagt atcccgacta ccagattgct gtcaccggtc actctctcgg aggagctgca 600
gcccttctgt tcggaatcaa cctcaaggtt aacggccacg atcccctcgt tgttactctt 660
ggtcagccca ttgtcggtaa cgctggcttt gctaactggg tcgataaact cttctttggc 720
caggagaacc ccgatgtctc caaggtgtcc aaagaccgaa agctctaccg aatcacccac 780
cgaggagata tcgtccctca agtgcccttc tgggacggtt accagcactg ctctggtgag 840
gtctttattg actggcccct gatccaccct cctctctcca acgttgtcat gtgccagggc 900
cagagcaata aacagtgctc tgccggtaac actctgctcc agcaggtcaa tgtgattgga 960
aaccatctgc agtacttcgt caccgagggt gtctgtggta tctaa 1005
<210> 3
<211> 498
<212> PRT
<213> Yarrowia lipolytica
<400> 3
Met Pro Leu Glu Leu Pro Ser Leu Asn Ala Ser Ile Val Gly Asn Thr
1 5 10 15
Val Gln Asn Gly Ala Val Glu Gln Phe Leu Asn Ile Arg Tyr Ala Asp
20 25 30
Ile Pro Gly Lys Phe Glu Lys Pro Val Leu Lys Asn Asp Trp Asn Gly
35 40 45
Ala Glu Ile Asp Ala Thr Lys Val Gly Pro Val Cys Pro Gln Pro Arg
50 55 60
Thr Pro Phe Asn Phe Phe Ser Val Pro Asp Asp Leu Trp Glu Lys Val
65 70 75 80
Asn Val Asp Thr Tyr Gln Asp Gly Leu Leu Cys Asp Asn Leu Ile Val
85 90 95
Thr Arg Pro Lys Gly Val Ser Ala Asn Ala Arg Leu Pro Thr Val Val
100 105 110
Trp Ile His Gly Gly Ser Asn Ile Glu Gly Ser Ile Tyr Asn Leu Ile
115 120 125
Tyr Glu Pro Gln Phe Leu Val Ala Glu Ser Val Arg Val Gly Lys Pro
130 135 140
Ile Val His Val Cys Ile Glu Tyr Arg Leu Gly Leu Ala Gly Phe Leu
145 150 155 160
Thr Lys Asn Gly Lys Gly Asn Trp Gly Thr Trp Asp Gln Tyr Thr Gly
165 170 175
Cys Gln Trp Val Asn Arg His Ile Gln Asp Phe Gly Gly Asp Pro Leu
180 185 190
Asn Val Thr Leu Thr Gly Glu Ser Ala Gly Ser Val Ala Val His Asn
195 200 205
Met Leu Ile Lys Asp Ser Met Asn Gly Arg Lys Leu Phe Arg Asn Ala
210 215 220
Val Met Met Ser Gly Thr Leu Glu Thr Ile Thr Pro Gln Pro Pro Lys
225 230 235 240
Trp His Ala Arg Leu Glu Glu Lys Val Ala Lys Val Thr Gly Lys Glu
245 250 255
Val Ala Asp Leu Ala Ser Leu Ser Asp Lys Glu Leu Leu Asp Ala Gln
260 265 270
Ile Lys Leu Asn Val Ala Val Cys Met Thr Cys Asp Asp Gly Asp Phe
275 280 285
Phe Glu Pro Gly Trp Lys Gln His Leu Thr Pro Asp Trp Leu Asp Lys
290 295 300
Leu Ile Ile Ser Asp Cys Lys Asp Glu Gly Met Leu Tyr Phe Leu Pro
305 310 315 320
Val Asn Ala Gln Asp Asp Glu Glu Leu Leu Ala Lys Val Ala Lys Ser
325 330 335
Pro Val Gly Lys Glu Ile Ser Glu Leu Tyr Gly Ile Lys Glu Gly Gly
340 345 350
Asp Ile Lys Ser Ala Cys Leu Asp Leu Lys Thr Asp Ala Thr Phe Asn
355 360 365
Tyr Phe Asn His Leu Leu Phe Lys Lys Met Glu Glu Ala Arg Asn Asn
370 375 380
Gly Ser Thr Ser Arg Val Tyr Arg Leu Ala Val Asp Glu Pro Asn Pro
385 390 395 400
His Asn Pro Asp Gln Arg Ala His His Ala Val Asp Val Leu Tyr Met
405 410 415
Phe Asn Ser Thr Lys Phe Asn Glu His Gly Asp Lys Leu Ser Arg Leu
420 425 430
Phe Gln Ser His Phe Leu Arg Leu Ala Tyr Gly Leu Glu Pro Trp Asp
435 440 445
His Arg Asn Phe Gly Val Tyr Arg Asn Gly Gly Tyr Gln Gln Leu Pro
450 455 460
Leu Ser Glu Leu Asn Lys Val Arg Pro Val Glu Arg Tyr Glu Ala Leu
465 470 475 480
Ser Lys Met Asp Phe Gly Gln Val Gly Arg Leu Ser Asn Ala Leu Ser
485 490 495
Arg Leu
<210> 4
<211> 1497
<212> DNA
<213> Yarrowia lipolytica
<400> 4
atgcctctcg aactcccctc gctcaacgcc tcgattgtcg gcaacaccgt tcagaacggc 60
gctgttgagc agtttctcaa catccgatac gccgacattc ctggcaagtt tgagaagccc 120
gtgctcaaga acgattggaa cggcgcggag atcgacgcca ccaaggtcgg tcccgtgtgc 180
ccccaacccc gcaccccatt caacttcttc tccgtgccag acgacctctg ggagaaagtc 240
aatgtggaca cgtaccagga cggtctgctg tgcgacaacc tgattgtgac gcgaccgaag 300
ggcgtgtctg ccaacgcccg gctgcccact gttgtgtgga tccacggcgg ctccaatatt 360
gagggcagta tctacaacct catctatgag ccccagttcc tggtggcaga gtcggtgcga 420
gtaggcaagc cgattgtgca cgtgtgtatc gagtaccgac tgggtctcgc gggcttcctc 480
accaagaacg gcaagggcaa ctggggcacg tgggatcagt acacgggctg ccagtgggtc 540
aaccgccaca ttcaggactt tggaggcgat cctttgaacg tgacattgac cggtgagtct 600
gccggctctg tagcagtcca taacatgctc atcaaggact ccatgaacgg ccgaaagttg 660
ttccgaaatg ccgtcatgat gagtggcact ctcgagacca tcactcctca gcctcccaag 720
tggcatgctc gtttggagga gaaggtggcc aaggtcactg gcaaggaagt ggccgacctt 780
gcttctctgt ccgataagga gctgctcgac gcccagatca agctcaatgt ggctgtgtgc 840
atgacttgcg acgacggcga ctttttcgag cccggatgga agcagcatct gactcctgac 900
tggctcgaca agctcatcat ctccgattgc aaggacgagg gcatgctgta tttcctgcca 960
gtcaacgcgc aggacgacga ggagctgttg gcaaaggtgg ccaagtcgcc cgtgggtaag 1020
gagatttccg agctttacgg catcaaggag ggtggcgata tcaagtctgc gtgtctcgat 1080
ctcaagactg acgccacctt caattacttt aaccatctgc tgttcaagaa gatggaggag 1140
gcccgaaaca acggctccac ttctcgagtt taccgtctgg ccgtcgatga gcccaacccc 1200
cacaaccccg accagcgggc ccaccacgcc gtcgacgtgc tgtacatgtt caactcgacc 1260
aagttcaacg agcacggcga caagctgtct cggctgttcc agagccactt tttgcggctg 1320
gcgtatggcc tggagccctg ggaccatcga aactttggag tgtacagaaa cggcggctac 1380
cagcagctgc cgctgagtga gttgaacaag gtccgacccg tcgagcggta cgaggcgctg 1440
tccaagatgg actttggcca ggttgggcgt ttgtccaatg cgctttcgcg cctatga 1497
<210> 5
<211> 371
<212> PRT
<213> Yarrowia lipolytica
<400> 5
Met Val Ser Leu Ser Ala Arg Ile Lys Asp Phe Phe Ser Val Leu Leu
1 5 10 15
Leu Gly Ala Ala Thr Ile Thr Pro Ser Thr Gln Thr Ala Gly Val Ser
20 25 30
Gln Gly Phe Tyr Asp Phe Ala Arg Asp Phe Ala His Leu Ser Asn Ile
35 40 45
Ala Tyr Cys Val Asn Ala Pro Ile Thr Pro Leu Asn Pro Asp Phe Thr
50 55 60
Cys Gly Asn Ser Cys Lys His Phe Pro Glu Ile Glu Leu Val Lys Thr
65 70 75 80
Phe Gly Gly Asn Phe Phe Lys Thr Ser Ile Thr Gly Tyr Leu Ala Val
85 90 95
Asp His Val Lys Lys Glu Lys Tyr Val Val Phe Arg Gly Thr Phe Ser
100 105 110
Leu Ala Asp Ala Ile Thr Asp Met Gln Phe Gln Leu Ser Pro Phe Leu
115 120 125
Val Asp Val Pro Ala Leu Asn Thr Phe Ser Ala Asn Asp Thr Thr Ala
130 135 140
Glu Ala Gln Thr His Cys Glu Gly Cys Lys Ile His Asp Gly Phe Ser
145 150 155 160
Lys Ala Phe Thr Glu Thr Trp Gly Asn Ile Gly Glu Asp Leu Gln Lys
165 170 175
His Leu Asp Ala Asn Pro Asp Tyr Gln Leu Tyr Val Thr Gly His Ser
180 185 190
Leu Gly Ala Ala Met Ala Leu Leu Gly Ala Thr Ser Ile Lys Leu Lys
195 200 205
Gly Tyr Asp Pro Ile Leu Ile Asn Tyr Gly Gln Pro Arg Val Gly Asn
210 215 220
Lys Pro Phe Ala Glu Phe Ile Asn Lys Leu Trp Phe Gly Glu Gly Asn
225 230 235 240
Gly Leu Glu Ile Thr Pro Glu Arg Lys Leu Tyr Arg Met Thr His Trp
245 250 255
Asn Asp Ile Phe Val Gly Leu Pro Asn Trp Glu Gly Tyr Thr His Ser
260 265 270
Asn Gly Glu Val Tyr Ile Asn Asn Arg Phe Ile Asn Pro Pro Leu Lys
275 280 285
Asp Val Ile Ser Cys Ala Gly Gly Glu Asn Ser Lys Cys Tyr Arg Ser
290 295 300
Ser Phe Ser Leu Leu Ser Gln Ile Asn Leu Leu Gln Asn His Leu Ala
305 310 315 320
Tyr Ile Asp Tyr Ile Gly Tyr Cys Ala Leu Asn Ile Gly Arg Arg Glu
325 330 335
Leu Ala Asp Gln Glu His Tyr Thr Gly Pro Tyr Tyr Tyr Gly His Arg
340 345 350
Ser Glu Glu Asp Phe Lys Lys Leu Gly Leu Glu Leu Ser Thr Pro Gln
355 360 365
Val Glu Asn
370
<210> 6
<211> 1116
<212> DNA
<213> Yarrowia lipolytica
<400> 6
atggtatccc tctctgctcg aatcaaagac tttttttcgg tcctcctcct cggagctgca 60
accatcactc cctccacaca gaccgcaggc gtgtctcaag ggttctatga ttttgctcgg 120
gactttgccc atctgtccaa cattgcctac tgtgtcaatg ctcccatcac tccactgaac 180
ccggacttca cctgtggcaa ctcgtgcaag cactttccgg aaattgagct tgtgaagaca 240
tttggaggca acttcttcaa gacctccatt acgggctacc tggctgtcga tcatgtcaag 300
aaggagaagt acgttgtctt ccgaggaacc ttttcgctgg cagacgcgat cacggacatg 360
cagttccagc tgtctccttt cctggtcgat gtgcctgccc tgaacacttt ctcagctaat 420
gacaccaccg cagaggccca gacgcactgt gagggctgca aaattcacga cggcttctcc 480
aaggccttta ccgagacctg gggtaacatt ggtgaggatc tgcagaaaca cctggacgct 540
aacccggact accagctgta cgtgactggc cattctctgg gagctgctat ggcccttctt 600
ggagctactt ccatcaagct caagggctac gatcccattc tcatcaacta cggacagccc 660
cgagtcggaa acaagccctt cgctgagttc attaacaagt tgtggtttgg agaaggcaac 720
ggtctggaaa tcacccccga gagaaagctg taccgaatga cccactggaa cgacatcttt 780
gttggcctgc ccaactggga gggatacacc cactctaacg gtgaagtata catcaacaac 840
cggttcatca accctcctct caaggatgtc atctcttgtg ctggaggcga aaactcgaag 900
tgctaccgat cctcgttcag cctgctgtcc cagatcaatc tgctccaaaa ccacctggct 960
tacattgatt acattggata ctgcgctctg aacattggtc gacgagagct tgccgatcag 1020
gaacattaca ctggtcctta ttactatggt catcgatctg aggaggactt taagaagttg 1080
ggcttggagc tatccacccc acaagttgag aactga 1116
<210> 7
<211> 406
<212> PRT
<213> Yarrowia lipolytica
<400> 7
Met Ala Gly Phe Asn Phe Thr Phe Gly Gln Val Ile Ser Tyr Leu Ala
1 5 10 15
Ser Met Leu Tyr Gly Gln Val Asp Ala Thr Ser Ser Ser Thr Arg Ile
20 25 30
Gln Ala Thr Gln Asp Leu Tyr Asp Phe Thr Ala Lys Phe Ser Arg Leu
35 40 45
Ser Asn Ile Ala Tyr Cys Ile Asn Ala Pro Phe Thr Pro Leu Arg Thr
50 55 60
Asp Phe Thr Cys Gly Glu Ser Cys Arg Tyr Phe Pro Asp Leu Gln Leu
65 70 75 80
Asp Ser Val Phe Gly Gly Asn Phe Ser Ser Ala Ser Thr Thr Gly Tyr
85 90 95
Ile Ala Tyr Asp His Lys Lys Lys Glu Lys Tyr Ile Val Phe Arg Gly
100 105 110
Thr Phe Ser Ile Pro Asp Ile Ile Thr Asp Ile Gln Phe Gln Thr Ala
115 120 125
Pro Trp Leu Thr Ser Leu Pro Thr His Leu Ile Pro Thr Lys Glu Asp
130 135 140
Phe Glu His Lys Gln Ala Ile Leu Lys His Tyr Ala Ala Glu Asn Lys
145 150 155 160
Gly Leu Ser Asn Leu Glu Glu Arg Gln Asp Val Val His Glu Asp Pro
165 170 175
Ser Leu Val Pro Lys Lys Met Asp Lys Cys Glu Asn Cys Gln Ile His
180 185 190
Asp Gly Phe Ala Lys Gly Phe Asn Glu Thr Ile Glu His Ala Gly Pro
195 200 205
Gln Ile Glu Lys Phe Leu Gly Asn Asn Thr Asp Tyr Lys Met Phe Val
210 215 220
Val Gly His Ser Leu Gly Ala Ala Gln Ala Gln Leu Phe Ala Thr Gln
225 230 235 240
Phe Lys Leu Leu Gly Phe Asp Pro Tyr Met Ile Asn Phe Gly Gln Pro
245 250 255
Arg Leu Gly Asn Pro Glu Phe Ala Ala Tyr Ile Asn Gln Leu Trp Phe
260 265 270
Asn Asp Thr Gly Leu Val Val Asn Asp Ala Arg Arg Phe Tyr Arg Val
275 280 285
Thr His Trp Asn Asp Ile Val Val Gly Val Pro Asp Trp Leu Asn Tyr
290 295 300
Thr His Ser Ile Gly Glu Val Phe Ile Asp Glu Glu Ser Val Tyr Pro
305 310 315 320
Lys Leu Asp Lys Val Val Val Cys Glu Gly Gly Glu Asn Pro Leu Cys
325 330 335
His Arg Gly Thr Phe Asn Leu Trp Ser Arg Ile Asn Phe Leu Gln Asn
340 345 350
His Leu Ala Tyr Ile Phe Tyr Ile Gly Leu Cys Ala Phe Asn Ile Gly
355 360 365
Arg Arg Asp Val Leu Asn Met Pro Gln Tyr Gln Gly Asn Phe Ser Tyr
370 375 380
Gln His Asn Ile Asp Pro Asn Tyr Asn Tyr Asp Thr Lys Val Pro Thr
385 390 395 400
Arg Ile Ser Lys Ser Asn
405
<210> 8
<211> 1221
<212> DNA
<213> Yarrowia lipolytica
<400> 8
atggcagggt tcaacttcac tttcgggcag gtgatttcgt acctggcttc catgctctat 60
ggacaggtgg atgccacttc atcctccact cgaatccagg ccacccagga tctgtacgac 120
ttcacagcca agttttcgcg actctcaaac atcgcgtact gcatcaatgc ccccttcacg 180
cctctcagaa cggacttcac ctgcggagaa agctgtcggt acttccccga cctccagctg 240
gactcagtgt ttggtggtaa cttctcctca gcctccacta ccggctacat tgcatacgac 300
cacaagaaga aggaaaagta cattgtgttt cgaggaactt tcagtatccc tgatatcatc 360
acagacattc aatttcagac tgccccttgg ttgacctctc tgcccacgca tctgatccct 420
accaaggagg actttgaaca caagcaggcc atcctgaagc actacgctgc cgaaaacaag 480
ggtctcagca acctggaaga gcgacaggat gttgtgcatg aagaccctag cctggttccc 540
aagaaaatgg acaagtgcga gaactgccag atccatgacg gattcgccaa gggcttcaac 600
gagactatcg agcatgccgg accccagatt gaaaagttcc tgggcaataa caccgactac 660
aagatgtttg ttgttggcca ctctctagga gctgctcagg cccagctgtt tgctacacag 720
ttcaaactgc tgggatttga cccttacatg atcaactttg gacagcctcg acttggaaac 780
cctgagttcg ccgcctacat caaccagctg tggttcaacg atactggtct ggttgtcaat 840
gatgcccgac gattctaccg agtgactcac tggaacgata tcgtcgtggg agtgcccgac 900
tggctcaatt acacccactc tatcggagag gtgttcatag acgaggagag cgtttacccc 960
aagctggaca aggtggtggt gtgcgaggga ggagagaacc ccctgtgcca ccgaggaact 1020
ttcaacctgt ggtcacgaat caacttcctg cagaaccatt tggcttatat cttctacatt 1080
ggtctgtgtg ctttcaacat tggccgaaga gacgtgctca acatgccaca ataccagggc 1140
aacttctcgt accagcacaa catcgacccc aactacaatt acgataccaa ggttcccacc 1200
cggatcagta aatcaaacta a 1221
<210> 9
<211> 11606
<212> DNA
<213> 人工序列
<220>
<223> 表达质粒
<400> 9
cgcgtggatc gccggtgcgt tgacgttggt gacctccagc cagaggtgcc cggcgccccg 60
ctcgccggcg aactccgtcg cgagccccat caacgcgcgc ccgaccccgt gcccccggtg 120
ctccggggcg acctcgatgt cctcgacggt cagccggcgg ttccacgccg agtacgagat 180
gaccacgaag cccgccaggt cgccgtcgtc cccgtacgcg acgaacgtcc gggagtccgg 240
gtcgccgtcc tccccgtcgt ccgattcgtc gtccgattcg tcgtcgggga acaccttggt 300
caggggcggg tccaccggca cctcccgcag ggtgaagccg tccccggtgg cggtgacgcg 360
gaagacggtg tcggtggtga aggacccatc cagtgcctcg atggcctcgg cgtcccccgg 420
gacactggtg cggtaccggt aagccgtgtc gtcaagagtg gtcatttttg tgtctaggtg 480
tttgtgtttg gactgcgatc agtgaagaaa agaagaggaa aaattgtgca agaaattttg 540
ctttcaagac ttggctgatg cagcagggta actctgggac acagacctat gtttgtggtt 600
aaactcaatg cacgtggtac gtgcgtggag cgcttaccca tccaagggtg tggacatgga 660
accgacggtc cgtggagttg tgtaatgtca ttttggcgac tcttgaagca aggctataaa 720
aaaattgtgt ggcttgagtc ttatcgagct cggtcactac aagagttaat cttcctgtct 780
caggcagaca ggtcaggcag ggttactttt gggtgtgctg taactcactg tatggccgtt 840
agtgcgcata gacgttgtac atactggacc gaattgtagc gtgctcaata gggccaataa 900
agctattgta gggatccgaa ttttcagaac ctaatttatc tgttacccgg cctgtggctc 960
gcacagctta aaaatggtca aactttcccc ttcttgtctt tttttcctca cattcatcag 1020
gttcttgtct tgatctttca agtgagtatt aattaccgac cttggttctt cattgggaga 1080
gcattggaag ccgtggtgca gcaaccacaa aacggttctt ccccttcgat accttcttgc 1140
ctgcctttca atacaagtcg gctcgattag cggtggtcgc ccccgccagc ggagaacatg 1200
gaactaaccc agaatgagag ctaagtggag aaagaagaga gtcagacgac tcaagcgaaa 1260
gcgccgcaag gtccgagctc gatccaaata agcggttttt aacggagatt taacactaaa 1320
tcgaagaact tttcccgttt catttgcgaa tgagctcgtt aacaaaatcc cccagttttt 1380
ttatccagct gtaaggattg acattagtaa tgaattattg tttggtatat ttaaatctgt 1440
agttcctttc tgtccgtgtc ggcaactgtc gtactcgtga tttacttgta ttgacgaata 1500
cttactgtag cgcactctgc tgctactggt cgtaaggatg tgctatttcg gtgtatggtg 1560
ggttttttgg gggtcggaac cgaagactgt tacacgggca cggctcgttg tgtacacgca 1620
cagagctctt gcgagtcatg ttgtagctag ctcgtcgtgt tcaggaactg ttcgatggtt 1680
cggagagagt cgccgcccag aacatacgcg caccgatgtc agcagacagc cttattacaa 1740
gtatattcaa gcaagtatat ccgtagggtg cgggtgattt ggatctaagg ttcgtactca 1800
acactcacga gcagcttgcc tatgttacat ccttttatca gacataacat aattggagtt 1860
tacttacaca cggggtgtac ctgtatgagc accacctaca attgtagcac tggtacttgt 1920
acaaagaatt tattcgtacg aatcacaggg acggccgccc tcaccgaacc agcgaatacc 1980
tcagcggtcc cctgcagtga ctcaacaaag cgatatgaac atcttgcgat ggtatcctgc 2040
tgatagtttt tactgtacaa acacctgtgt agctccttct agcattttta agttattcac 2100
acctcaaggg gagggataaa ttaaataaat tccaaaagcg aagatcgaga aactaaatta 2160
aaattccaaa aacgaagttg gaacacaacc ccccgaaaaa aaacaacaaa caaaaaaccc 2220
aacaaaataa acaaaaacaa aataaatata taactaccag tatctgacta aaagttcaaa 2280
tactcgtact tacaacaaat agaaatgagc cggccaaaat tctgcagaaa aaaatttcaa 2340
acaagtactg gtataattaa attaaaaaac acatcaaagt atcataacgt tagttatttt 2400
attttattta ataaaagaaa acaacaagat gggctcaaaa ctttcaactt atacgataca 2460
taccaaataa caatttagta tttatctaag tgcttttcgt agataatgga atacaaatgg 2520
atatccagag tatacacatg gatagtatac actgacacga caattctgta tctctttatg 2580
ttaactactg tgaggcatta aatagagctt gatatataaa atgttacatt tcacagtctg 2640
aacttttgca gattacctaa tttggtaaga tattaattat gaactgaaag ttgatggcat 2700
ccctaaattt gatgaaagat gaaattgtaa atgaggtggt aaaagagcta cagtcgtttt 2760
gttttgagat accatcatct ctaacgaaat atctattaaa aatctcagtg tgatcatgag 2820
tcattgccat cctggaaaat gtcatcatgg ctgatatttc taactgttta cttgagataa 2880
atatatattt acaagaactt cccttgaaat taatttagat ataaaatgtt tgcgggcaag 2940
ttactacgag gaataaatta tatctagagg ttccgcttcc tcgctcactg actcgctgcg 3000
ctcggtcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa tacggttatc 3060
cacagaatca ggggataacg caggaaagaa catgtgagca aaaggccagc aaaaggccag 3120
gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca 3180
tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca 3240
ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg 3300
atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcatagct cacgctgtag 3360
gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt 3420
tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca 3480
cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg 3540
cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa ggacagtatt 3600
tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc 3660
cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg 3720
cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg 3780
gaacgaaaac tcacgttaag ggattttggt catgagatta tcaaaaagga tcttcaccta 3840
gatcctttta aattaaaaat gaagttttaa atcaatctaa agtatatatg agtaaacttg 3900
gtctgacagt taccaatgct taatcagtga ggcacctatc tcagcgatct gtctatttcg 3960
ttcatccata gttgcctgac tccccgtcgt gtagataact acgatacggg agggcttacc 4020
atctggcccc agtgctgcaa tgataccgcg agacccacgc tcaccggctc cagatttatc 4080
agcaataaac cagccagccg gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc 4140
ctccatccag tctattaatt gttgccggga agctagagta agtagttcgc cagttaatag 4200
tttgcgcaac gttgttgcca ttgctgcagg catcgtggtg tcacgctcgt cgtttggtat 4260
ggcttcattc agctccggtt cccaacgatc aaggcgagtt acatgatccc ccatgttgtg 4320
caaaaaagcg gttagctcct tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt 4380
gttatcactc atggttatgg cagcactgca taattctctt actgtcatgc catccgtaag 4440
atgcttttct gtgactggtg agtactcaac caagtcattc tgagaatagt gtatgcggcg 4500
accgagttgc tcttgcccgg cgtcaacacg ggataatacc gcgccacata gcagaacttt 4560
aaaagtgctc atcattggaa aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct 4620
gttgagatcc agttcgatgt aacccactcg tgcacccaac tgatcttcag catcttttac 4680
tttcaccagc gtttctgggt gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat 4740
aagggcgaca cggaaatgtt gaatactcat actcttcctt tttcaatatt attgaagcat 4800
ttatcagggt tattgtctca tgagcggata catatttgaa tgtatttaga aaaataaaca 4860
aataggggtt ccgcgcacat ttccccgaaa agtgccacct gacgtctaag aaaccattat 4920
tatcatgaca ttaacctata aaaataggcg tatcacgagg ccctttcgtc tggcctagga 4980
agcgacttcc aatcgctttg catatccagt accacaccca caggcgtttg tgctactcta 5040
ctgatagcaa tagatgcgtc ataattggtt ggcccgctga gcctccacag gatactattg 5100
cacataccct ggtcatgtgc agatcagctc atttgtggag actctggagt aacttagacg 5160
acgcctggtt caattgccgc aatgtgcgcc cacgcagata atgtattgag gggtggagcg 5220
cctcttgggg acttgctgta cttgtacggg atattaaacg cactcagcaa gaccatgacg 5280
taaaacacac ctactgtacg atacgtactg taggtattgt actcgtaccc ggtactacaa 5340
atagtacgat actatacgga gtgtatttgt accttgatat acgactggcg gagtgaagag 5400
aaggagttga acaagaccag atggggatat cagccccagt gctttgtatt acaagtacga 5460
gtacttaata gatactgtaa ggctattgat acggatggca gtaagtcatt gagtaagcaa 5520
ttgtggccca gcatctcccc tacgtacttg taccataccc catggagaca ccaatggtct 5580
ttcacgcaca ctgtcgtgtg ctgtatcgca gaatcgggtg tccaaccaaa tgccgttacc 5640
cccacgtcac agccgataga cagatacacc atcaatacca gcaggttgta tcatgcggtt 5700
ggctgaaggt aagctgattg gtctaaaaac tgtagctgtc ctaattcaac gagcgctatt 5760
tggggccaac cacctcggcc aagcggcctt taatctgcgt gccccagagg cgtctaatga 5820
ggctctggcc gccactgtag gagtgtttct ctgtgcgcac acgcagtttt gagtttgggc 5880
gactttccct ttttcccaat tgcgtacaca cacagctccg agctaagcgc tgtccttgaa 5940
ccttctccct cttttccctc tttttctctt ccccttcccc tcctccacat taaggccaaa 6000
tcctgaattg caccaactag tacaacgaca acaatggaca agaagtactc catcggtttg 6060
gacattggta ctaactctgt cggctgggcc gtcatcaccg acgagtacaa ggttccctcc 6120
aagaagttca aggtccttgg caacaccgac cgacactcta tcaagaagaa cctgatcggt 6180
gctctgctgt tcgactctgg cgagactgcc gaggccaccc gactgaagcg aaccgctcga 6240
cgccgataca cccgacgaaa gaaccgaatc tgttacctcc aggagatctt cagcaacgag 6300
atggctaagg tcgacgactc cttcttccac cgactcgagg agtctttcct ggtcgaagag 6360
gataagaagc acgagcgaca ccccatcttc ggcaacattg ttgatgaggt tgcctaccat 6420
gagaagtacc ccaccatcta ccacctccga aagaagctcg tcgactccac tgacaaggct 6480
gacctccgac tcatctacct tgctctcgcc cacatgatca agttccgagg tcacttcctc 6540
attgagggtg atctcaaccc cgacaactcc gacgttgaca agctgttcat ccagctcgtc 6600
cagacctaca accagctctt tgaggagaac cctatcaacg cttctggtgt tgacgccaag 6660
gccattctct ccgcccgact ctctaagtcc cgacgactcg agaacctcat tgcccagctg 6720
cccggcgaga agaagaacgg cctcttcggt aacctgattg ctctctctct tggtctgacc 6780
cccaacttca agtccaactt tgacctcgcc gaggacgcca agctccagct gtccaaggac 6840
acctacgatg acgatctgga caacctcctg gcccagatcg gtgaccagta cgccgatctc 6900
ttccttgccg ccaagaacct ctccgacgcc atcctgctct ccgacatcct ccgagtcaac 6960
accgagatta ccaaggctcc tctgtctgcc tctatgatca agcgatacga cgagcaccac 7020
caggatctca ctcttctcaa ggctctcgtc cgacagcagc tccccgagaa gtacaaggag 7080
attttctttg accagtccaa gaacggttac gctggctaca ttgacggtgg tgcttcccag 7140
gaagagtttt acaagttcat caagcctatt ctggagaaga tggacggtac cgaggagctg 7200
ctcgtcaagc tcaaccgaga ggacctcctt cgaaagcagc gaaccttcga taacggctcc 7260
atcccccacc agatccacct gggtgagctc cacgccattc tccgaagaca agaggacttc 7320
taccccttcc taaaggataa ccgagagaag atcgagaaga ttctcacctt ccgaatcccc 7380
tactacgtcg gtcccctcgc tcgaggtaac tcccgatttg cttggatgac ccgaaagtcc 7440
gaggagacta tcaccccctg gaactttgaa gaggtagtcg acaagggtgc ctccgcccag 7500
tctttcattg agcggatgac caacttcgat aagaacctcc ccaacgagaa ggtccttccc 7560
aagcactctc tcctctacga gtacttcacc gtctacaacg agctgaccaa ggtcaagtac 7620
gttaccgagg gcatgcgaaa gcccgctttc ctctctggtg agcagaagaa ggccattgtc 7680
gacctcctgt tcaagactaa ccgaaaagtc accgtcaagc agctcaagga agactacttc 7740
aagaagattg agtgcttcga ctccgtcgag atttccggtg tcgaggaccg attcaacgcc 7800
tccctcggca cctaccacga tcttctgaag atcatcaagg acaaggactt tcttgataac 7860
gaggagaacg aggacattct cgaggacatc gtcctcaccc tcaccctttt cgaggatcga 7920
gagatgatcg aggagcgact caagacctac gcccatctct tcgacgacaa ggtcatgaag 7980
caactcaagc gacgacgata cactggctgg ggccgacttt cccgaaagct catcaacggc 8040
atccgagaca agcagtctgg caagaccatc ctggacttcc tgaagtccga cggtttcgcc 8100
aaccgaaact tcatgcagct catccacgac gactctctta ccttcaaaga ggatatccag 8160
aaggcccagg tttctggcca gggcgactcc ctccacgagc acattgccaa cctcgccgga 8220
tcccccgcca tcaaaaaggg tatcctccag accgtcaagg ttgtcgacga actcgtgaag 8280
gtcatgggcc gacacaagcc cgagaacatc gttatcgaga tggcccgaga gaaccagacc 8340
acccagaagg gtcagaagaa ctcccgagag cgaatgaagc gaatcgaaga gggtatcaag 8400
gagctcggtt cccagattct caaggagcac cccgtcgaga acacccagct ccagaacgag 8460
aaactctacc tgtactacct ccagaatggc cgagacatgt acgttgacca ggagctcgac 8520
atcaaccgac tctccgacta cgacgtcgac cacattgttc ctcagtcctt cctcaaggac 8580
gactccatcg acaacaaggt tctgacccga tctgacaaga accgaggtaa gtccgacaac 8640
gttccctccg aagaggtcgt taagaagatg aagaactact ggcgacagct tctcaacgcc 8700
aaactgatca cccagcgaaa gtttgacaac ctcaccaagg ccgagcgagg tggtctgtcc 8760
gagctggaca aggccggctt cattaagcga cagctggtcg agactcgaca gatcaccaag 8820
cacgtcgccc agatcctcga ctcccgaatg aacaccaagt acgacgagaa cgacaagctc 8880
atccgggagg tcaaggtcat caccctgaag tctaagcttg tctccgactt ccgaaaggac 8940
ttccagttct acaaggtccg agagatcaac aactaccacc acgcccacga cgcctacctc 9000
aacgccgttg ttggtaccgc cctcatcaag aagtatccca agctcgagtc cgagttcgtt 9060
tacggcgact acaaggttta cgatgtccga aagatgattg ccaagtccga gcaggagatc 9120
ggtaaggcca ccgccaagta ctttttctac tccaacatca tgaatttctt caagaccgag 9180
atcactctcg ccaacggtga gattcgaaag cgacccctga ttgagactaa tggtgagact 9240
ggtgagatcg tctgggataa gggccgagac ttcgccaccg tccgaaaggt cctgtccatg 9300
ccccaggtca acattgtcaa gaagaccgag gtccagaccg gtggcttctc caaggagtcc 9360
attctcccca agcgaaactc cgacaaactc atcgcccgta agaaggactg ggatccgaag 9420
aagtacggtg gtttcgattc tcccaccgtt gcctactccg tcctcgttgt tgctaaagtc 9480
gagaagggta agtctaagaa actcaagtcc gtgaaggagc tactcggtat caccatcatg 9540
gagcgatctt cttttgagaa gaaccccatt gacttcctcg aggccaaggg ttacaaagag 9600
gtcaagaagg acctgattat caagctgccc aagtactccc tctttgagct cgagaacggc 9660
cgaaagcgaa tgctggcttc cgctggtgag ctgcagaagg gcaacgagct cgctctgccc 9720
tccaagtacg tcaacttcct ctacctggcc tcccactacg agaagctcaa gggctccccc 9780
gaggacaacg agcagaagca gctgttcgtt gagcagcaca agcactacct cgacgagatc 9840
atcgagcaga tctccgagtt ctccaagcga gtcatcctcg ctgacgccaa ccttgataag 9900
gttctctctg cttacaacaa gcaccgggac aagcccatcc gagagcaggc cgagaatatc 9960
atccacctct tcactctcac caacctcggc gctcctgctg ccttcaagta cttcgacacc 10020
accattgacc gaaagaggta cacctccacc aaggaagtcc tcgacgccac cctgatccac 10080
cagtccatca ccggcctcta cgaaacccga atcgacctct cccagctcgg cggtgactct 10140
cgagccgacc ccaagaagaa gcgaaaagtc taaatatccg aagatcaaga gcgaagcaag 10200
ttgtaagtcc aggacatgtt tcccgcccac gcgagtgatt tataacacct ctcttttttg 10260
acacccgctc gccttgaaat tcatgtcaca taaattatag tcaacgacgt ttgaataact 10320
tgtcttgtag ttcgatgatg atcatatgat tacattaata gtaattactg tatttgatat 10380
atatactaat tacaatagta catattagaa catacaatag ttagtgccgt gaagtggctt 10440
aaaataccgc gagtcgatta cgtaatatta ttacctcttg cccatcgaac gtacaagtac 10500
tcctctgttc tctccttcct ttgctttgtg cacgaagaac tgcggtcagg tgacacaact 10560
ttttccatct cagggtgtgt cgcgtgtgct tcatccaaac tttagttggg gttcgggttc 10620
gcgcgagatg atcacgtgcc ctgatttggt gtcgtccccc gtcgcgctgc gcacgtgatt 10680
tatttatttc cggtggctgc tgtctacgcg gggccttctc tgcccttctg tttcaacctt 10740
cgggcggttc tcgtaaccag cagtagcaat ccatttcgaa actcaaagag ctaaaaacgt 10800
taaacctcag cagtcgctcg acgaatgggc tgcggttggg aagcccacga ggcctatagc 10860
cagagcctcg agttgacagg agcccagacg ccttttccaa cggcaacttt tatataaaat 10920
ggcaatgtat tcatgcaatt gcggccgtgt caggttggag acactggacc acactctcca 10980
ttgcttcctg aggagatgga tcattgctag tgcatctacg cgcagcaatc ccgcaagctc 11040
gacaaccgta gatgggcttt ggtgggccaa tcaattacgc aacccgcacg ttaaattgta 11100
tgaggaagga aggccacggt acaaagtggg tggtcttcac ccagtggttg ttggtggcgt 11160
catgcagacc atggccgcca gtgtgctgga attgaatatt taccgttcgt ataatgtatg 11220
ctatacgaag ttataccggt ctcgtagtgt tcacgttcag ttcacggtga gcttaaaact 11280
atcttcaaga agagatttga gacctgattt atacttgcag caatgtttac ttcttatcgc 11340
gatacacgaa tgtgatacgg atcaaagtaa gcaggactac gataagataa cgaatgcggt 11400
gcagtccatg tcgattaggt atagatacat ttattttgtg ttatgttaca ttttgggggg 11460
atactgtcct acttgtagta cctacttgta gtggcgcgtt aggggcaggg catgctcatg 11520
tagagcgcct gccgctcgcc gtccgaggcg gtgccgtcgt acagggcggt gtccaggccg 11580
cagagggtga accccatccg ccggta 11606
<210> 10
<211> 14006
<212> DNA
<213> 人工序列
<220>
<223> 表达质粒
<400> 10
gcggagccta ggccggccag cgtggcgcgt ggccatattg gccagcagct tactacagct 60
cagccaaagt ggatcatgat ggacggaaat atcggactgg aggccaaaaa ggaggtgctc 120
aaatacgcac gggacaagtc tgcacaggtg gcattcgaac ccacgtctgt ccccaaagcc 180
gctgctcttt ccgagctcaa tctgcccgtt taccccaaca actccattgc cttagccacc 240
cccaacactg cagagctcga ggccatgttc gaggcattcc acgagaaggg ccgatttgac 300
gttgacgact ggtttccagt catagacggt cttgctctcg gagctgactt tagaaacgga 360
gccaccatgt tgtcgcacca acatcgtgga ctcaaagcta ttctcgaaca aggaactctg 420
gcccaggcaa tccacatgct accatacatc ccaactttga tcatcaaggg cggagccaac 480
ggcgtcgtcg tcttccaact cattgatgat atcgagtctg ccattcattc acagcgttct 540
gcttccaata aaacgcctgg cctgttccag aagggcaacg ctgcgagtgg aaacaccaag 600
gtcggcgtct acatgcagta ctttgagccc gaagaagtgg gcagtcagtc gattgtaagc 660
gtgactggag ctggagacac tctgtttgga accctggcca tggagattgt caaggacgag 720
tcctggttga acgatatggg agacaagaag agtgcagttg tttctcgagc catgaacaat 780
gctgtgaaga ctattcagag taaggacgct gtctgcaaga gcatccttta agtgatttgc 840
catgctttct cttcttccac gatgtaaata cttattttac acactactgt gcagtagcaa 900
atacagaaca agagttgtcg cctattgaca gtacagtacg agtagtgtat gtacagtagt 960
tatacaatat ctatgtgaaa ttcgtcggca gctttcggct gatgaactac gagttcttcg 1020
taataaatca tcaacgtaat aagcttggta ccagagacgg gttggcggcg tatttgtgtc 1080
ccaaaaaaca gccccaattg ccccaattga ccccaaattg acccagtagc gggcccaacc 1140
ccggcgagag cccccttcac cccacatatc aaacctcccc cggttcccac acttgccgtt 1200
aagggcgtag ggtactgcag tctggaatct acgcttgttc agactttgta ctagtttctt 1260
tgtctggcca tccgggtaac ccatgccgga cgcaaaatag actactgaaa atttttttgc 1320
tttgtggttg ggactttagc caagggtata aaagaccacc gtccccgaat tacctttcct 1380
cttcttttct ctctctcctt gtcaactcac acccgaaatc gttaagcatt tccttctgag 1440
tataagaatc attcgctagc cacaaaaatg ggtgatctcg atgcccgagg aacctctgct 1500
caccccgagc tctctgagcg accttctatt atgccttcta tgtctgatat tcaggaccct 1560
tctggtgatg acaaggctac tccccgagga tctgctgctg gtctgcccca gcttgagctt 1620
gctggacacg cccgacgact tggccacctt gagaacttct ttgctgtcca ggctcgacag 1680
cagatttact cttcttttgc tgttttttgt gagtttgaca ctgcttgttc tctcgctcag 1740
cttgcttctg ctgtgcgaaa cgtttgtctt tctaaccccc ttctccttca cactgttgag 1800
cctaagcacc ctgacatcgc tggattctac cactctgacg agtacctttc ccgaccttgg 1860
cctcagcacg attacatgcg agttcttcga gaggttcacg tcgctgacgt tgttatgaac 1920
ggacagaagg agcacgctca cgttgttcga gatgctgttg acgtttttca ggctcacgga 1980
aaccaggtta cttctgagct ccttgagctt atgactcaga ttgagattcc tcacgcttct 2040
cagactcgac cctcttggcg acttctctgt tttccccacg gagaggctaa ccgatggcga 2100
acctttgctt ttgtttctaa ccactgttct tctgatggtc tttctggtct taacttcttt 2160
cgagatctcc agaaggagct tgctcacggc cccacctctg gtgctcctgg tgcccccgga 2220
gcttccggag ttattttcga ttacgctcag gacgctgcta ccctgcccaa gctgccccct 2280
cccattgatc agaagctcga ttaccgacct tctaagaagg ctcttctcgg ccttctcgct 2340
ggcaagttcg ttcgagagaa gctcggttac gtttctgctg ctcctcccac tacccctacc 2400
tctgaccttg ctcaccctga gggtcaccag tactactgtt accttgttaa cgttcccact 2460
tcttctgttg cccacattaa gactcaggtg cgagagaacg ttcctcacaa gtgtactctc 2520
actccctttc tccaggcttg ttggcttgtt tctctgttca agtacggtcg agttttttct 2580
ggttcttggc ttgagcgata caccgatgtt cttgttgcta tgaacactcg acagcttctc 2640
cccgaggacc ttgagcttca gcgacagtac cgatacggtt ctaacattgg agctgttcga 2700
tacaactacc ctattgctcc ccttgacgtt cgagataacg atcagaagtt ctggtccctt 2760
gttgagtctt accgacttgc cctttctgat gcccgagata agaacgatta cctttacgct 2820
cttggtgctc ttatgctccc tgagatttac gagaagaaga acgttgatgc tgttgttaac 2880
gataccattc ttaaccagcg acgacaggga acccttcttt ctaacgttgg ttacgttcga 2940
gatgagcagc ccactgcttt tgctattaag aaccacgttt tttctcaggg agttggagct 3000
aaccgaaacg cttttgttct taacatttgt gctaccgatc agggtggtct taacatcgct 3060
atttctattg ctaagggaac ccttgcttct cgacaggagg gacaggagct ttgtgatatt 3120
tttaagtcta ctctccttcg attttaaacg cgtctatccg aagatcaaga gcgaagcaag 3180
ttgtaagtcc aggacatgtt tcccgcccac gcgagtgatt tataacacct ctcttttttg 3240
acacccgctc gccttgaaat tcatgtcaca taaattatag tcaacgacgt ttgaataact 3300
tgtcttgtag ttcgatgatg atcatatgat tacattaata gtaattactg tatctgtacc 3360
tgctgtggac cacgcacggc ggaacgtacc gtacaaatat tttcttgctc acatgactct 3420
ctctcggccg cgcacgccgg tggcaaattg ctcttgcatt ggctctgtct ctagacgtcc 3480
aaaccgtcca aagtggcagg gtgacgtgat gcgacgcacg aaggagatgg cccggtggcg 3540
aggaaccgga cacggcgagc cggcgggaaa aaaggcggaa aacgaaaagc gaagggcaca 3600
atctgacggt gcggctgcca ccaacccaag gaggctattt tgggtcgctt tccatttcac 3660
attcgccctc aatggccact ttgcggtggt gaacatggtt tctgaaacaa ccccccagaa 3720
ttagagtata ttgatgtgtt taagattggg ttgctatttg gccattgtgg gggagggtag 3780
cgacgtggag gacattccag ggcgaattga gcctagaaag tggtaccatt ccaaccgtct 3840
cagtcgtccg aattgatcgc tataactatc acctctctca catgtctact tccccaacca 3900
acatccccaa cctcccccac actaaagttc acgccaataa tgtaggcact ctttctgggt 3960
gtgggacagc agagcaatac ggaggggaga ttacacaacg agccacaatt ggggagatgg 4020
tagccatctc actcgacccg tcgacttttg gcaacgctca attacccacc aaatttgggc 4080
tggagttgag gggaccgtgt tccagcgctg taggaccagc aacacacacg gtatcaacag 4140
caaccaacgc ccccgctaat gcacccagta ctgcgcaggt gtgggccagg tgcgttccag 4200
atgcgagttg gcgaacccta agccgacagt gtactttttg ggacgggcag tagcaatcgt 4260
gggcgtagac cccggtgtat ataaaggggt ggagaggacg gattattagc accaacacac 4320
acacttatac tacatgctag ccacaaaaat gctctctttc ttctggcgaa acggtatcga 4380
gactcccgag cccctcaagg ctgacgtttc cggctctatc cctccctggc ttcagggaac 4440
ccttctccga aacggtcctg gtctgttctc cgttggcaac acttcctaca agcactggtt 4500
cgatggtatg gctctcattc actccttcac ctttaaggat ggtgaggttt tttaccgatc 4560
taagtacctg aagtctgaga cttacaagaa gaacatcgct gccgaccgaa tcgttgtgtc 4620
tgagttcgga accatggtgt accccgatcc ctgcaagaac attttctccc gagccttctc 4680
ttacatgatg aacgccattc ctgactttac cgataacaac ctcattaaca tcattaagta 4740
cggtgaggat tactacgcct cctctgaggt caactacatc aaccagattg accccctgac 4800
ccttgagact ctcggacgaa ctaactaccg aaaccacatt gccatcaacc ttgccactgc 4860
tcaccctcac tacgacgagg agggtaacac ttacaacatg ggcactgcta ttatgaacct 4920
cggtcgaccc aagtacgtga ttttcaaggt gcccgccaac acctctgata aggagaacaa 4980
gaagcctgcc ctctctgagg tggagcaggt ttgctccatt cccatccgac cctcccttta 5040
cccttcttac ttccactctt ttggcatgac tgagaactac atcatcttcg ttgagcaggc 5100
cttcaagctg gacatcgtca agctggctac tgcttacttc cgagatatta actggggatc 5160
ttgccttaag ttcgaccagg atgacattaa cgtgttccac ctggtcaaca agaagactgg 5220
taaggctgtg tccgtgaagt actacactga cccctttgtt accttccacc acatcaacgc 5280
ttacgaggac gatggccacg tcgtcttcga tctcattact tacaaggact ctaagctgta 5340
cgatatgttc tacattcaga acatgaagca ggacgtcaag cgatttattg agactaacaa 5400
ggacttcgct cagcccgtgt gccagcgatt tgtccttccc gtcaacgttg ataaggagac 5460
tcctcaggac atcaaccttg tcaagctgca ggacaccact gccactgctg tcctgaagga 5520
ggacggctct gtctactgca cccctgacat catttttaag ggtcttgagc tccctgctat 5580
caactacaag tttaactcta agaagaaccg atacttctac ggcacccgag tggagtggtc 5640
cccttaccct aacaaggtcg ctaaggtgga cgttgttact cgaacccaca agatttggac 5700
tgaggaggag tgttaccctt ctgagcctgt ctttattgcc tcccctgacg ccgttgatga 5760
ggatgacggt gtgattcttt cttctgtggt ttctttcaac ccccagcgac cccctttcct 5820
ggttgtcctc gatgctaagt ccttcaagga gattgctcga gctaccatcg atgcctctat 5880
tcacatggac cttcacggcc ttttcatcca cgacaagtct acctaagttt tttgatcaat 5940
gatccaatgg ctttcacata cccccccacg cctataatta aaacacagag aaatataatc 6000
taacttaata aatattacgg agaatctttc gagtgttcag cagaaatata gccattgtaa 6060
caaaagccgg ctatcgaccg ctttatcgaa gaatatttcc cgccccccag tggccaaacg 6120
atatcggtca gaaggggcag ctctaaacga agaactgcgg tcaggtgaca caactttttc 6180
catctcaggg tgtgtcgcgt gtgcttcatc caaactttag ttggggttcg ggttcgcgcg 6240
agatgatcac gtgccctgat ttggtgtcgt cccccgtcgc gctgcgcacg tgatttattt 6300
atttccggtg gctgctgtct acgcggggcc ttctctgccc ttctgtttca accttcgggc 6360
ggttctcgta accagcagta gcaatccatt tcgaaactca aagagctaaa aacgttaaac 6420
ctcagcagtc gctcgacgaa tgggctgcgg ttgggaagcc cacgaggcct atagccagag 6480
cctcgagttg acaggagccc agacgccttt tccaacggca acttttatat aaaatggcaa 6540
tgtattcatg caattgcggc cgtgtcaggt tggagacact ggaccacact ctccattgct 6600
tcctgaggag atggatcatt gctagtgcat ctacgcgcag caatcccgca agctcgacaa 6660
ccgtagatgg gctttggtgg gccaatcaat tacgcaaccc gcacgttaaa ttgtatgagg 6720
aaggaaggcc acggtacaaa gtgggtggtc ttcacccagt ggttgttggt ggcgtcatgc 6780
agaccatgca ttggggatag cacagggttg gggtgtcttg tggactcaat gggtgaaagg 6840
agatggaaaa gggcggtgaa aagtggtaga atcgaaatcc ctgacgtcaa tttataaagt 6900
aaaatgcgtt tctgccattt tgctcccctc cttctttcgc aatcgcctcc ccaaaagttg 6960
tcgtggcagt acacatgctt gcatacaatg aagctaatcc ggcttgctca gtagttgcta 7020
tatccaggca tggtgtgaaa cccctcaaag tatatatagg agcggtgagc cccagtctgg 7080
ggtcttttct ctccatctca aaactacttt ctcacatgct agccacaaaa atgaccacta 7140
agtacacttc cgttcacgag tctcccaacg gccctggtga cgctcgaccc accgcttccc 7200
agattatcga cgattacaac cttgagggag agctttctgg caagactgtt ctcgtcaccg 7260
gctgttcctc tggtattggt gttgagactg cccgagctat ttaccgaact ggtgccaccc 7320
tttacctcac tgcccgagat gtcgataagg ccaagaccgt tcttcccgac cttgttgaca 7380
cttcccgagt ccactttctc caccttgacc ttaactctct ggagtctgtt cgaggttttg 7440
ctgagaactt caagtctaag tccactcagc ttcacattct catcgagaac gctggcgtga 7500
tggcctgtcc cgagggccga accgtcgatg gttttgagac tcagtttggt atcaaccacc 7560
ttgctcactt tctcctcttt tacctcctca aggataccct tctcaactct tctacccccg 7620
ctttcaactc ccgagttgtc atcctctctt cttgtgctca ccaggctggt tccgttcacc 7680
ttaacaacct gtctcttgag ggtggatacg agccttggaa gtcttacggc cagtccaaga 7740
ctgccaacct ttggactgcc cgagagatcg agaagcgatt tggtgcttcc ggtatccact 7800
cttgggctgt tcaccccggt tccatcgcta ctgagcttca gcgacacgtt tccgacgagc 7860
ttaagcagaa gtgggctgac gataaggagg gtgccaagct gtggaagtcc accgagcagg 7920
gtgccgccac cactgtcctt gctgctgttt cccctgagct tgagggtaag ggcggtcttt 7980
accttgagga tacccaggtt gccaagcccc ctgcccgagg aatgtttggt gttgctgact 8040
gggcttacga tgaggatggc ccctctaagc tctgggccaa gtctcttgag ctccttaagc 8100
tccagtaaag gttagactat ggatatgtaa tttaactgtg tatatagaga gcgtgcaagt 8160
atggagcgct tgttcagctt gtatgatggt cagacgacct gtctgatcga gtatgtatga 8220
tactgcacaa cctgtgtatc cgcatgatct gtccaatggg gcatgttgtt gtgtttctcg 8280
atacggagat gctgggtaca agtagctaat acgattgaac tacttatact tatatgaggc 8340
ttgaagaaag ctgacttgtg tatgacttat tctcaactac atccccagtc acaataccac 8400
cactgcacta ccactacaca ctagtggtgt gttctgtgga gcattctcac ttttggtaaa 8460
cgacattgct tcaagtgcag cggaatcaaa aagtataaag tgggcagcga gtatacctgt 8520
acagactgta ggcgataact caatccaatt accccccaca acatgactgg ccaaactgat 8580
ctcaagactt tattgaaatc agcaacaccg attctcaatg aaggcacata cttcttctgc 8640
aacattcact tgacgcctaa agttggtgag aaatggaccg acaagacata ttctgctatc 8700
cacggactgt tgcctgtgtc ggtggctaca atacgtgagt cagaagggct gacggtggtg 8760
gttcccaagg aaaaggtcga cgagtatctg tctgactcgt cattgccgcc tttggagtac 8820
gactccaact atgagtgtgc ttggatcact ttgacgatac attcttcgtt ggaggctgtg 8880
ggtctgacag ctgcgttttc ggcgcggttg gccgacaaca atatcagctg caacgtcatt 8940
gctggctttc atcatgatca catttttgtc ggcaaaggcg acgcccagag agccattgac 9000
gttctttcta atttggaccg atagccgtat agtccagtct atctataagt tcaactaact 9060
cgtaactatt accataacat atacttcact gccccagata aggttccgat aaaaagttct 9120
gcagactaaa tttatttcag tctcctcttc accaccaaaa tgccctccta cgaagctcga 9180
gctaacgtcc acaagtccgc ctttgccgct cgagtgctca agctcgtggc agccaagaaa 9240
accaacctgt gtgcttctct ggatgttacc accaccaagg agctcattga gcttgccgat 9300
aaggtcggac cttatgtgtg catgatcaag acccatatcg acatcattga cgacttcacc 9360
tacgccggca ctgtgctccc cctcaaggaa cttgctctta agcacggttt cttcctgttc 9420
gaggacagaa agttcgcaga tattggcaac actgtcaagc accagtacaa gaacggtgtc 9480
taccgaatcg ccgagtggtc cgatatcacc aacgcccacg gtgtacccgg aaccggaatc 9540
attgctggcc tgcgagctgg tgccgaggaa actgtctctg aacagaagaa ggaggacgtc 9600
tctgactacg agaactccca gtacaaggag ttcctggtcc cctctcccaa cgagaagctg 9660
gccagaggtc tgctcatgct ggccgagctg tcttgcaagg gctctctggc cactggcgag 9720
tactccaagc agaccattga gcttgcccga tccgaccccg agtttgtggt tggcttcatt 9780
gcccagaacc gacctaaggg cgactctgag gactggctta ttctgacccc cggggtgggt 9840
cttgacgaca agggagacgc tctcggacag cagtaccgaa ctgttgagga tgtcatgtct 9900
accggaacgg atatcataat tgtcggccga ggtctgtacg gccagaaccg agatcctatt 9960
gaggaggcca agcgatacca gaaggctggc tgggaggctt accagaagat taactgttag 10020
aggttagact atggatatgt aatttaactg tgtatataga gagcgtgcaa gtatggagcg 10080
cttgttcagc ttgtatgatg gtcagacgac ctgtctgatc gagtatgtat gatactgcac 10140
aacctgtgta tccgcatgat ctgtccaatg gggcatgttg ttgtgtttct cgatacggag 10200
atgctgggta caagtagcta atacgattga actacttata cttatatgag gcttgaagaa 10260
agctgacttg tgtatgactt attctcaact acatccccag tcacaatacc accactgcac 10320
taccactaca cctcgagcat gcacactatt atcacattac tacatccaaa cccctacagg 10380
gggaggagct ctccaatcaa atatgtacat taactatctc tcgtaaatca ttgttataag 10440
accgtccgtg actgtctaaa tcggttcatt cgttgtaaca aatcagtgta acaactcgtg 10500
gtacgcccgg tttgcttcgc tcacgctccc ctagattttc cgtctaggac acaacaagcc 10560
ctggtggatg acgttcaacg ccttcagcgc gtctttttcc tcaataacac acgagatgtt 10620
aatttcgttg gctccctgag aaatcatctc aatgttaata cctgcctggg ccagagtaga 10680
gaagaacatg cctgcacatc cgaccatggc cttcattctc gttccgatca gcgacacaat 10740
ggtcatgcct cgcttcacat ctactgtgcc gtactttcgc agctcctcca cagcctgctt 10800
gaggttggag tcgggagcat ggaaggccat cgacacatgg acctcagaag tggagatgag 10860
atcgacgaca agtttctgct ggtcgagagt agcaaagatc ttgttcaaga agccatgact 10920
cttggttcgc ttattcgaat gaacgttgag aacggtgata ttcgatttgg tagtgacagc 10980
tgtaggcttc ttctcgtcat ctacaggagc agacacctgg ggagtgaatg agccagagga 11040
cagagaagtt agcgagtcgg tggaagaagc cagatcctgg acattgtttt tcgttttcag 11100
gttgcccgag ccgtcagcag atgggtagat gatagttcct cctcccaggg ggttttccac 11160
gtttttgatt cggataggaa tatgggcctt aatgacctgc tccatggtga aggggtggat 11220
gacttcagat ccgtagtagg tcaactcagc ggcctcctcg ggggtaatga tgggcagcag 11280
acgggcagtg gacacctttc tgggatcggc agtgaagaca ccatcgactt ctttccagat 11340
ctgaagctcc ttggcgtcca gacccacagc caccagagca gcacacagat cggtgtatcc 11400
tcgtccgatc tggcttagga ggcctccctt gacggggcca aagaaaccgg tcaacacggg 11460
caccatgttt cccttgacag gagcagagtc cgtgttagga gagccgggaa gagtgatgat 11520
ctcgcccaga acacgtccga ggtccgaata gaacttggga tcttcggcat tggtggtggt 11580
aactgcgtga gacaggtcaa agtaccgtgc gttaacacca gcgtcccgca taactgcagt 11640
catgtacatg caactgagct tctccccaat ggccatgatg gagtcgagtg ttcgggggga 11700
gatctcagaa atgatttcag cagcagccag gattcgcaac agctggtcgc actcgccgtt 11760
gatgtcggca ttgaggtttt cgagcagttc ggggttcttg acgtcacgct tagcagctgc 11820
aagatggtct tctcggatag actcaatgat ggggttgtag gcgtctgatc cgagaagagc 11880
agagtcagca gcagcaataa gacgggtggt ggttccctcg gccttggtgg cctctagatg 11940
gcctccttgg ccccattcca gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt 12000
ttgcgtattg ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg 12060
ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac agaatcaggg 12120
gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag 12180
gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca caaaaatcga 12240
cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct 12300
ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata cctgtccgcc 12360
tttctccctt cgggaagcgt ggcgctttct catagctcac gctgtaggta tctcagttcg 12420
gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca gcccgaccgc 12480
tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga cttatcgcca 12540
ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg tgctacagag 12600
ttcttgaagt ggtggcctaa ctacggctac actagaagaa cagtatttgg tatctgcgct 12660
ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc 12720
accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga 12780
tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca 12840
cgttaaggga ttttggtcat gagattatca aaaaggatct tcacctagat ccttttaaat 12900
taaaaatgaa gttttaaatc aatctaaagt atatatgagt aaacttggtc tgacagttac 12960
caatgcttaa tcagtgaggc acctatctca gcgatctgtc tatttcgttc atccatagtt 13020
gcctgactcc ccgtcgtgta gataactacg atacgggagg gcttaccatc tggccccagt 13080
gctgcaatga taccgcgaga gccacgctca ccggctccag atttatcagc aataaaccag 13140
ccagccggaa gggccgagcg cagaagtggt cctgcaactt tatccgcctc catccagtct 13200
attaattgtt gccgggaagc tagagtaagt agttcgccag ttaatagttt gcgcaacgtt 13260
gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc 13320
tccggttccc aacgatcaag gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt 13380
agctccttcg gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg 13440
gttatggcag cactgcataa ttctcttact gtcatgccat ccgtaagatg cttttctgtg 13500
actggtgagt actcaaccaa gtcattctga gaatagtgta tgcggcgacc gagttgctct 13560
tgcccggcgt caatacggga taataccgcg ccacatagca gaactttaaa agtgctcatc 13620
attggaaaac gttcttcggg gcgaaaactc tcaaggatct taccgctgtt gagatccagt 13680
tcgatgtaac ccactcgtgc acccaactga tcttcagcat cttttacttt caccagcgtt 13740
tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg 13800
aaatgttgaa tactcatact cttccttttt caatattatt gaagcattta tcagggttat 13860
tgtctcatga gcggatacat atttgaatgt atttagaaaa ataaacaaat aggggttccg 13920
cgcacatttc cccgaaaagt gccacctgac gtctaagaaa ccattattat catgacatta 13980
acctataaaa ataggcgtat cacgag 14006
<210> 11
<211> 13802
<212> DNA
<213> 人工序列
<220>
<223> 表达质粒
<400> 11
ggttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta 60
tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag 120
aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg 180
tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg 240
tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 300
cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga 360
agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc 420
tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt 480
aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact 540
ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 600
cctaactacg gctacactag aaggacagta tttggtatct gcgctctgct gaagccagtt 660
accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt 720
ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct 780
ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg 840
gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt 900
aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt 960
gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc 1020
gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg 1080
cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc 1140
gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg 1200
gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctgca 1260
ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga 1320
tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct 1380
ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg 1440
cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca 1500
accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaaca 1560
cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct 1620
tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact 1680
cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa 1740
acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc 1800
atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga 1860
tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga 1920
aaagtgccac ctgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg 1980
cgtatcacga ggccctttcg tctggcctag gaagcgactt ccaatcgctt tgcatatcca 2040
gtaccacacc cacaggcgtt tgtgctactc tactgatagc aatagatgcg tcataattgg 2100
ttggcccgct gagcctccac aggatactat tgcacatacc ctggtcatgt gcagatcagc 2160
tcatttgtgg agactctgga gtaacttaga cgacgcctgg ttcaattgcc gcaatgtgcg 2220
cccacgcaga taatgtattg aggggtggag cgcctcttgg ggacttgctg tacttgtacg 2280
ggatattaaa cgcactcagc aagaccatga cgtaaaacac acctactgta cgatacgtac 2340
tgtaggtatt gtactcgtac ccggtactac aaatagtacg atactatacg gagtgtattt 2400
gtaccttgat atacgactgg cggagtgaag agaaggagtt gaacaagacc agatggggat 2460
atcagcccca gtgctttgta ttacaagtac gagtacttaa tagatactgt aaggctattg 2520
atacggatgg cagtaagtca ttgagtaagc aattgtggcc cagcatctcc cctacgtact 2580
tgtaccatac cccatggaga caccaatggt ctttcacgca cactgtcgtg tgctgtatcg 2640
cagaatcggg tgtccaacca aatgccgtta cccccacgtc acagccgata gacagataca 2700
ccatcaatac cagcaggttg tatcatgcgg ttggctgaag gtaagctgat tggtctaaaa 2760
actgtagctg tcctaattca acgagcgcta tttggggcca accacctcgg ccaagcggcc 2820
tttaatctgc gtgccccaga ggcgtctaat gaggctctgg ccgccactgt aggagtgttt 2880
ctctgtgcgc acacgcagtt ttgagtttgg gcgactttcc ctttttccca attgcgtaca 2940
cacacagctc cgagctaagc gctgtccttg aaccttctcc ctcttttccc tctttttctc 3000
ttccccttcc cctcctccac attaaggcca aatcctgaat tgcaccaact agtacaacga 3060
caacaatgga caagaagtac tccatcggtt tggacattgg tactaactct gtcggctggg 3120
ccgtcatcac cgacgagtac aaggttccct ccaagaagtt caaggtcctt ggcaacaccg 3180
accgacactc tatcaagaag aacctgatcg gtgctctgct gttcgactct ggcgagactg 3240
ccgaggccac ccgactgaag cgaaccgctc gacgccgata cacccgacga aagaaccgaa 3300
tctgttacct ccaggagatc ttcagcaacg agatggctaa ggtcgacgac tccttcttcc 3360
accgactcga ggagtctttc ctggtcgaag aggataagaa gcacgagcga caccccatct 3420
tcggcaacat tgttgatgag gttgcctacc atgagaagta ccccaccatc taccacctcc 3480
gaaagaagct cgtcgactcc actgacaagg ctgacctccg actcatctac cttgctctcg 3540
cccacatgat caagttccga ggtcacttcc tcattgaggg tgatctcaac cccgacaact 3600
ccgacgttga caagctgttc atccagctcg tccagaccta caaccagctc tttgaggaga 3660
accctatcaa cgcttctggt gttgacgcca aggccattct ctccgcccga ctctctaagt 3720
cccgacgact cgagaacctc attgcccagc tgcccggcga gaagaagaac ggcctcttcg 3780
gtaacctgat tgctctctct cttggtctga cccccaactt caagtccaac tttgacctcg 3840
ccgaggacgc caagctccag ctgtccaagg acacctacga tgacgatctg gacaacctcc 3900
tggcccagat cggtgaccag tacgccgatc tcttccttgc cgccaagaac ctctccgacg 3960
ccatcctgct ctccgacatc ctccgagtca acaccgagat taccaaggct cctctgtctg 4020
cctctatgat caagcgatac gacgagcacc accaggatct cactcttctc aaggctctcg 4080
tccgacagca gctccccgag aagtacaagg agattttctt tgaccagtcc aagaacggtt 4140
acgctggcta cattgacggt ggtgcttccc aggaagagtt ttacaagttc atcaagccta 4200
ttctggagaa gatggacggt accgaggagc tgctcgtcaa gctcaaccga gaggacctcc 4260
ttcgaaagca gcgaaccttc gataacggct ccatccccca ccagatccac ctgggtgagc 4320
tccacgccat tctccgaaga caagaggact tctacccctt cctaaaggat aaccgagaga 4380
agatcgagaa gattctcacc ttccgaatcc cctactacgt cggtcccctc gctcgaggta 4440
actcccgatt tgcttggatg acccgaaagt ccgaggagac tatcaccccc tggaactttg 4500
aagaggtagt cgacaagggt gcctccgccc agtctttcat tgagcggatg accaacttcg 4560
ataagaacct ccccaacgag aaggtccttc ccaagcactc tctcctctac gagtacttca 4620
ccgtctacaa cgagctgacc aaggtcaagt acgttaccga gggcatgcga aagcccgctt 4680
tcctctctgg tgagcagaag aaggccattg tcgacctcct gttcaagact aaccgaaaag 4740
tcaccgtcaa gcagctcaag gaagactact tcaagaagat tgagtgcttc gactccgtcg 4800
agatttccgg tgtcgaggac cgattcaacg cctccctcgg cacctaccac gatcttctga 4860
agatcatcaa ggacaaggac tttcttgata acgaggagaa cgaggacatt ctcgaggaca 4920
tcgtcctcac cctcaccctt ttcgaggatc gagagatgat cgaggagcga ctcaagacct 4980
acgcccatct cttcgacgac aaggtcatga agcaactcaa gcgacgacga tacactggct 5040
ggggccgact ttcccgaaag ctcatcaacg gcatccgaga caagcagtct ggcaagacca 5100
tcctggactt cctgaagtcc gacggtttcg ccaaccgaaa cttcatgcag ctcatccacg 5160
acgactctct taccttcaaa gaggatatcc agaaggccca ggtttctggc cagggcgact 5220
ccctccacga gcacattgcc aacctcgccg gatcccccgc catcaaaaag ggtatcctcc 5280
agaccgtcaa ggttgtcgac gaactcgtga aggtcatggg ccgacacaag cccgagaaca 5340
tcgttatcga gatggcccga gagaaccaga ccacccagaa gggtcagaag aactcccgag 5400
agcgaatgaa gcgaatcgaa gagggtatca aggagctcgg ttcccagatt ctcaaggagc 5460
accccgtcga gaacacccag ctccagaacg agaaactcta cctgtactac ctccagaatg 5520
gccgagacat gtacgttgac caggagctcg acatcaaccg actctccgac tacgacgtcg 5580
accacattgt tcctcagtcc ttcctcaagg acgactccat cgacaacaag gttctgaccc 5640
gatctgacaa gaaccgaggt aagtccgaca acgttccctc cgaagaggtc gttaagaaga 5700
tgaagaacta ctggcgacag cttctcaacg ccaaactgat cacccagcga aagtttgaca 5760
acctcaccaa ggccgagcga ggtggtctgt ccgagctgga caaggccggc ttcattaagc 5820
gacagctggt cgagactcga cagatcacca agcacgtcgc ccagatcctc gactcccgaa 5880
tgaacaccaa gtacgacgag aacgacaagc tcatccggga ggtcaaggtc atcaccctga 5940
agtctaagct tgtctccgac ttccgaaagg acttccagtt ctacaaggtc cgagagatca 6000
acaactacca ccacgcccac gacgcctacc tcaacgccgt tgttggtacc gccctcatca 6060
agaagtatcc caagctcgag tccgagttcg tttacggcga ctacaaggtt tacgatgtcc 6120
gaaagatgat tgccaagtcc gagcaggaga tcggtaaggc caccgccaag tactttttct 6180
actccaacat catgaatttc ttcaagaccg agatcactct cgccaacggt gagattcgaa 6240
agcgacccct gattgagact aatggtgaga ctggtgagat cgtctgggat aagggccgag 6300
acttcgccac cgtccgaaag gtcctgtcca tgccccaggt caacattgtc aagaagaccg 6360
aggtccagac cggtggcttc tccaaggagt ccattctccc caagcgaaac tccgacaaac 6420
tcatcgcccg taagaaggac tgggatccga agaagtacgg tggtttcgat tctcccaccg 6480
ttgcctactc cgtcctcgtt gttgctaaag tcgagaaggg taagtctaag aaactcaagt 6540
ccgtgaagga gctactcggt atcaccatca tggagcgatc ttcttttgag aagaacccca 6600
ttgacttcct cgaggccaag ggttacaaag aggtcaagaa ggacctgatt atcaagctgc 6660
ccaagtactc cctctttgag ctcgagaacg gccgaaagcg aatgctggct tccgctggtg 6720
agctgcagaa gggcaacgag ctcgctctgc cctccaagta cgtcaacttc ctctacctgg 6780
cctcccacta cgagaagctc aagggctccc ccgaggacaa cgagcagaag cagctgttcg 6840
ttgagcagca caagcactac ctcgacgaga tcatcgagca gatctccgag ttctccaagc 6900
gagtcatcct cgctgacgcc aaccttgata aggttctctc tgcttacaac aagcaccggg 6960
acaagcccat ccgagagcag gccgagaata tcatccacct cttcactctc accaacctcg 7020
gcgctcctgc tgccttcaag tacttcgaca ccaccattga ccgaaagagg tacacctcca 7080
ccaaggaagt cctcgacgcc accctgatcc accagtccat caccggcctc tacgaaaccc 7140
gaatcgacct ctcccagctc ggcggtgact ctcgagccga ccccaagaag aagcgaaaag 7200
tctaaatatc cgaagatcaa gagcgaagca agttgtaagt ccaggacatg tttcccgccc 7260
acgcgagtga tttataacac ctctcttttt tgacacccgc tcgccttgaa attcatgtca 7320
cataaattat agtcaacgac gtttgaataa cttgtcttgt agttcgatga tgatcatatg 7380
attacattaa tagtaattac tgtatttgat atatatacta attacaatag tacatattag 7440
aacatacaat agttagtgcc gtgaagtggc ttaaaatacc gcgagtcgat tacgtaatat 7500
tattacctct tgcccatcga acgtacaagt actcctctgt tctctccttc ctttgctttg 7560
tgcacgaaga actgcggtca ggtgacacaa ctttttccat ctcagggtgt gtcgcgtgtg 7620
cttcatccaa actttagttg gggttcgggt tcgcgcgaga tgatcacgtg ccctgatttg 7680
gtgtcgtccc ccgtcgcgct gcgcacgtga tttatttatt tccggtggct gctgtctacg 7740
cggggccttc tctgcccttc tgtttcaacc ttcgggcggt tctcgtaacc agcagtagca 7800
atccatttcg aaactcaaag agctaaaaac gttaaacctc agcagtcgct cgacgaatgg 7860
gctgcggttg ggaagcccac gaggcctata gccagagcct cgagttgaca ggagcccaga 7920
cgccttttcc aacggcaact tttatataaa atggcaatgt attcatgcaa ttgcggccgt 7980
gtcaggttgg agacactgga ccacactctc cattgcttcc tgaggagatg gatcattgct 8040
agtgcatcta cgcgcagcaa tcccgcaagc tcgacaaccg tagatgggct ttggtgggcc 8100
aatcaattac gcaacccgca cgttaaattg tatgaggaag gaaggccacg gtacaaagtg 8160
ggtggtcttc acccagtggt tgttggtggc gtcatgcaga ccatgcattg gggatagcac 8220
agggttgggg tgtcttgtgg actcaatggg tgaaaggaga tggaaaaggg cggtgaaaag 8280
tggtagaatc gaaatccctg acgtcaattt ataaagtaaa atgcgtttct gccattttgc 8340
tcccctcctt ctttcgcaat cgcctcccca aaagttgtcg tggcagtaca catgcttgca 8400
tacaatgaag ctaatccggc ttgctcagta gttgctatat ccaggcatgg tgtgaaaccc 8460
ctcaaagtat atataggagc ggtgagcccc agtctggggt cttttctctc catctcaaaa 8520
ctactttctc acaatggatt tgctgatgag tccgtgagga cgaaacgagt aagctcgtct 8580
ggaggcatga tcaacagcgg ttttagagct agaaatagca agttaaaata aggctagtcc 8640
gttatcaact tgaaaaagtg gcaccgagtc ggtgcttttg gccggcatgg tcccagcctc 8700
ctcgctggcg ccggctgggc aacatgcttc ggcatggcga atgggactaa acttcgagct 8760
aatccagtag cttacgttac ccaggggcag gtcaactggc tagccacgag tctgtcccag 8820
gtcgcaattt agtgtaataa acaatatata tattgagtct aaagggaatt gtagctattg 8880
tgattgtgtg attttcgtct tgctggttct tattgtgtcc cattcgtttc atcctgatga 8940
ggacccctgg aaccggtgtt ttcttagtct ctgcaatcgc tagtcttgtt gctatgacag 9000
ttgcgtcgac actattcagg tcatctatcg gttattctga tattataata cctccggatc 9060
gatgtacctg atttatactt gcagcaatgt ttacttctta tcgttggacc ccgtcttcaa 9120
ttacacttcc caactgggaa cacccctctt tatcgaccca ttttaggtaa tttaccctag 9180
cccattgtct ccataaggaa tattacccta acccacagtc cagggtgccc aggtccttct 9240
ttggccaaat tttaacttcg gtcctatggc acagcggtag cgcgtgagat tgcaaatctt 9300
aaggtcccga gttcgaatct cggtgggacc tagttgaaaa atacctctaa tgcgccgatg 9360
gtttagtggt aaaatccatc gttgccatcg atgggccccc ggttcgattc cgggtcggcg 9420
caggttgacg tacagcaggc tgaacgagga tgttttagag ctagaaatag caagttaaaa 9480
taaggctagt ccgttatcaa cttgaaaaag tggcaccgag tcggtgcttt tttttttcga 9540
tcggccccag ttgcaaaagt tgacacaact ctagatctgc ttccaaatat agaatcataa 9600
caagggttag ggtgtgatta tataatattg gtcttaattg atgtgctagg gctttaaaag 9660
ttggttaaaa taacgctcta atgccttttt aatatattgt ctttttcaaa atctcaaatc 9720
ggacacttct tcgtgtatga gactccattt tttggctccg tcacgtgata tgtattatca 9780
gctatagtgg tgtaaacaaa gttttttact agctgtaatg gcattttgtc ggagtggtaa 9840
atcgccttct tgttgtgcgt tcgagttctg gactctgcac tgggctactt tgaaaaatac 9900
ctctaatgcg ccgatggttt agtggtaaaa tccatcgttg ccatcgatgg gcccccggtt 9960
cgattccggg tcggcgcagg ttgacgttca ctcctcagcc tcccaaggtt ttagagctag 10020
aaatagcaag ttaaaataag gctagtccgt tatcaacttg aaaaagtggc accgagtcgg 10080
tgcttttttt tttcgcgata cacgaatgtg atacggatca aagtaagcag gactacgata 10140
agataacgaa tgcggtgcag tccatgtcga ttaggtatag atacatttat tttgtgttat 10200
gttacatttt ggggggatac tgtcctactt gtagtaccta cttgtagtgg cgcgtctatt 10260
cctttgccct cggacgagtg ctggggcgtc ggtttccact atcggcgagt acttctacac 10320
agccatcggt ccagacggcc gcgcttctgc gggcgatttg tgtacgcccg acagtcccgg 10380
ctccggatcg gacgattgcg tcgcatcgac cctgcgccca agctgcatca tcgaaattgc 10440
cgtcaaccaa gctctgatag agttggtcaa gaccaatgcg gagcatatac gcccggagcc 10500
gcggcgatcc tgcaagctcc ggatgcctcc gctcgaagta gcgcgtctgc tgctccatac 10560
aagccaacca cggcctccag aagaagatgt tggcgacctc gtattgggaa tccccgaaca 10620
tcgcctcgct ccagtcaatg accgctgtta tgcggccatt gtccgtcagg acattgttgg 10680
agccgaaatc cgcgtgcacg aggtgccgga cttcggggca gtcctcggcc caaagcatca 10740
gctcatcgag agcctgcgcg acggacgcac tgacggtgtc gtccatcaca gtttgccagt 10800
gatacacatg gggatcagca atcgcgcata tgaaatcacg ccatgtagtg tattgaccga 10860
ttccttgcgg tccgaatggg ccgaacccgc tcgtctggct aagatcggcc gcagcgatcg 10920
catccatggc ctccgcgacc ggctgcagaa cagcgggcag ttcggtttca ggcaggtctt 10980
gcaacgtgac accctgtgca cggcgggaga tgcaataggt caggctctcg ctgaattccc 11040
caatgtcaag cacttccgga atcgggagcg cggccgatgc aaagtgccga taaacataac 11100
gatctttgta gaaaccatcg gcgcagctat ttacccgcag gacatatcca cgccctccta 11160
catcgaagct gaaagcacga gattcttcgc cctccgagag ctgcatcagg tcggagacgc 11220
tgtcgaactt ttcgatcaga aacttctcga cagacgtcgc ggtgagttca ggctttttca 11280
tatgggtacc tgagaacatt tttgtgtcta ggtgtttgtg tttggactgc gatcagtgaa 11340
gaaaagaaga ggaaaaattg tgcaagaaat tttgctttca agacttggct gatgcagcag 11400
ggtaactctg ggacacagac ctatgtttgt ggttaaactc aatgcacgtg gtacgtgcgt 11460
ggagcgctta cccatccaag ggtgtggaca tggaaccgac ggtccgtgga gttgtgtaat 11520
gtcattttgg cgactcttga agcaaggcta taaaaaaatt gtgtggcttg agtcttatcg 11580
agctcggtca ctacaagagt taatcttcct gtctcaggca gacaggtcag gcagggttac 11640
ttttgggtgt gctgtaactc actgtatggc cgttagtgcg catagacgtt gtacatactg 11700
gaccgaattg tagcgtgctc aatagggcca ataaagctat tgtagggatc cgaattttca 11760
gaacctaatt tatctgttac ccggcctgtg gctcgcacag cttaaaaatg gtcaaacttt 11820
ccccttcttg tctttttttc ctcacattca tcaggttctt gtcttgatct ttcaagtgag 11880
tattaattac cgaccttggt tcttcattgg gagagcattg gaagccgtgg tgcagcaacc 11940
acaaaacggt tcttcccctt cgataccttc ttgcctgcct ttcaatacaa gtcggctcga 12000
ttagcggtgg tcgcccccgc cagcggagaa catggaacta acccagaatg agagctaagt 12060
ggagaaagaa gagagtcaga cgactcaagc gaaagcgccg caaggtccga gctcgatcca 12120
aataagcggt ttttaacgga gatttaacac taaatcgaag aacttttccc gtttcatttg 12180
cgaatgagct cgttaacaaa atcccccagt ttttttatcc agctgtaagg attgacatta 12240
gtaatgaatt attgtttggt atatttaaat ctgtagttcc tttctgtccg tgtcggcaac 12300
tgtcgtactc gtgatttact tgtattgacg aatacttact gtagcgcact ctgctgctac 12360
tggtcgtaag gatgtgctat ttcggtgtat ggtgggtttt ttgggggtcg gaaccgaaga 12420
ctgttacacg ggcacggctc gttgtgtaca cgcacagagc tcttgcgagt catgttgtag 12480
ctagctcgtc gtgttcagga actgttcgat ggttcggaga gagtcgccgc ccagaacata 12540
cgcgcaccga tgtcagcaga cagccttatt acaagtatat tcaagcaagt atatccgtag 12600
ggtgcgggtg atttggatct aaggttcgta ctcaacactc acgagcagct tgcctatgtt 12660
acatcctttt atcagacata acataattgg agtttactta cacacggggt gtacctgtat 12720
gagcaccacc tacaattgta gcactggtac ttgtacaaag aatttattcg tacgaatcac 12780
agggacggcc gccctcaccg aaccagcgaa tacctcagcg gtcccctgca gtgactcaac 12840
aaagcgatat gaacatcttg cgatggtatc ctgctgatag tttttactgt acaaacacct 12900
gtgtagctcc ttctagcatt tttaagttat tcacacctca aggggaggga taaattaaat 12960
aaattccaaa agcgaagatc gagaaactaa attaaaattc caaaaacgaa gttggaacac 13020
aaccccccga aaaaaaacaa caaacaaaaa acccaacaaa ataaacaaaa acaaaataaa 13080
tatataacta ccagtatctg actaaaagtt caaatactcg tacttacaac aaatagaaat 13140
gagccggcca aaattctgca gaaaaaaatt tcaaacaagt actggtataa ttaaattaaa 13200
aaacacatca aagtatcata acgttagtta ttttatttta tttaataaaa gaaaacaaca 13260
agatgggctc aaaactttca acttatacga tacataccaa ataacaattt agtatttatc 13320
taagtgcttt tcgtagataa tggaatacaa atggatatcc agagtataca catggatagt 13380
atacactgac acgacaattc tgtatctctt tatgttaact actgtgaggc attaaataga 13440
gcttgatata taaaatgtta catttcacag tctgaacttt tgcagattac ctaatttggt 13500
aagatattaa ttatgaactg aaagttgatg gcatccctaa atttgatgaa agatgaaatt 13560
gtaaatgagg tggtaaaaga gctacagtcg ttttgttttg agataccatc atctctaacg 13620
aaatatctat taaaaatctc agtgtgatca tgagtcattg ccatcctgga aaatgtcatc 13680
atggctgata tttctaactg tttacttgag ataaatatat atttacaaga acttcccttg 13740
aaattaattt agatataaaa tgtttgcggg caagttacta cgaggaataa attatatcta 13800
ga 13802
<210> 12
<211> 13246
<212> DNA
<213> 人工序列
<220>
<223> 表达质粒
<400> 12
ggttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta 60
tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag 120
aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg 180
tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg 240
tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 300
cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga 360
agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc 420
tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt 480
aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact 540
ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 600
cctaactacg gctacactag aaggacagta tttggtatct gcgctctgct gaagccagtt 660
accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt 720
ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct 780
ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg 840
gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt 900
aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt 960
gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc 1020
gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg 1080
cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc 1140
gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg 1200
gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctgca 1260
ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga 1320
tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct 1380
ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg 1440
cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca 1500
accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaaca 1560
cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct 1620
tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact 1680
cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa 1740
acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc 1800
atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga 1860
tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga 1920
aaagtgccac ctgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg 1980
cgtatcacga ggccctttcg tctggcctag gaagcgactt ccaatcgctt tgcatatcca 2040
gtaccacacc cacaggcgtt tgtgctactc tactgatagc aatagatgcg tcataattgg 2100
ttggcccgct gagcctccac aggatactat tgcacatacc ctggtcatgt gcagatcagc 2160
tcatttgtgg agactctgga gtaacttaga cgacgcctgg ttcaattgcc gcaatgtgcg 2220
cccacgcaga taatgtattg aggggtggag cgcctcttgg ggacttgctg tacttgtacg 2280
ggatattaaa cgcactcagc aagaccatga cgtaaaacac acctactgta cgatacgtac 2340
tgtaggtatt gtactcgtac ccggtactac aaatagtacg atactatacg gagtgtattt 2400
gtaccttgat atacgactgg cggagtgaag agaaggagtt gaacaagacc agatggggat 2460
atcagcccca gtgctttgta ttacaagtac gagtacttaa tagatactgt aaggctattg 2520
atacggatgg cagtaagtca ttgagtaagc aattgtggcc cagcatctcc cctacgtact 2580
tgtaccatac cccatggaga caccaatggt ctttcacgca cactgtcgtg tgctgtatcg 2640
cagaatcggg tgtccaacca aatgccgtta cccccacgtc acagccgata gacagataca 2700
ccatcaatac cagcaggttg tatcatgcgg ttggctgaag gtaagctgat tggtctaaaa 2760
actgtagctg tcctaattca acgagcgcta tttggggcca accacctcgg ccaagcggcc 2820
tttaatctgc gtgccccaga ggcgtctaat gaggctctgg ccgccactgt aggagtgttt 2880
ctctgtgcgc acacgcagtt ttgagtttgg gcgactttcc ctttttccca attgcgtaca 2940
cacacagctc cgagctaagc gctgtccttg aaccttctcc ctcttttccc tctttttctc 3000
ttccccttcc cctcctccac attaaggcca aatcctgaat tgcaccaact agtacaacga 3060
caacaatgga caagaagtac tccatcggtt tggacattgg tactaactct gtcggctggg 3120
ccgtcatcac cgacgagtac aaggttccct ccaagaagtt caaggtcctt ggcaacaccg 3180
accgacactc tatcaagaag aacctgatcg gtgctctgct gttcgactct ggcgagactg 3240
ccgaggccac ccgactgaag cgaaccgctc gacgccgata cacccgacga aagaaccgaa 3300
tctgttacct ccaggagatc ttcagcaacg agatggctaa ggtcgacgac tccttcttcc 3360
accgactcga ggagtctttc ctggtcgaag aggataagaa gcacgagcga caccccatct 3420
tcggcaacat tgttgatgag gttgcctacc atgagaagta ccccaccatc taccacctcc 3480
gaaagaagct cgtcgactcc actgacaagg ctgacctccg actcatctac cttgctctcg 3540
cccacatgat caagttccga ggtcacttcc tcattgaggg tgatctcaac cccgacaact 3600
ccgacgttga caagctgttc atccagctcg tccagaccta caaccagctc tttgaggaga 3660
accctatcaa cgcttctggt gttgacgcca aggccattct ctccgcccga ctctctaagt 3720
cccgacgact cgagaacctc attgcccagc tgcccggcga gaagaagaac ggcctcttcg 3780
gtaacctgat tgctctctct cttggtctga cccccaactt caagtccaac tttgacctcg 3840
ccgaggacgc caagctccag ctgtccaagg acacctacga tgacgatctg gacaacctcc 3900
tggcccagat cggtgaccag tacgccgatc tcttccttgc cgccaagaac ctctccgacg 3960
ccatcctgct ctccgacatc ctccgagtca acaccgagat taccaaggct cctctgtctg 4020
cctctatgat caagcgatac gacgagcacc accaggatct cactcttctc aaggctctcg 4080
tccgacagca gctccccgag aagtacaagg agattttctt tgaccagtcc aagaacggtt 4140
acgctggcta cattgacggt ggtgcttccc aggaagagtt ttacaagttc atcaagccta 4200
ttctggagaa gatggacggt accgaggagc tgctcgtcaa gctcaaccga gaggacctcc 4260
ttcgaaagca gcgaaccttc gataacggct ccatccccca ccagatccac ctgggtgagc 4320
tccacgccat tctccgaaga caagaggact tctacccctt cctaaaggat aaccgagaga 4380
agatcgagaa gattctcacc ttccgaatcc cctactacgt cggtcccctc gctcgaggta 4440
actcccgatt tgcttggatg acccgaaagt ccgaggagac tatcaccccc tggaactttg 4500
aagaggtagt cgacaagggt gcctccgccc agtctttcat tgagcggatg accaacttcg 4560
ataagaacct ccccaacgag aaggtccttc ccaagcactc tctcctctac gagtacttca 4620
ccgtctacaa cgagctgacc aaggtcaagt acgttaccga gggcatgcga aagcccgctt 4680
tcctctctgg tgagcagaag aaggccattg tcgacctcct gttcaagact aaccgaaaag 4740
tcaccgtcaa gcagctcaag gaagactact tcaagaagat tgagtgcttc gactccgtcg 4800
agatttccgg tgtcgaggac cgattcaacg cctccctcgg cacctaccac gatcttctga 4860
agatcatcaa ggacaaggac tttcttgata acgaggagaa cgaggacatt ctcgaggaca 4920
tcgtcctcac cctcaccctt ttcgaggatc gagagatgat cgaggagcga ctcaagacct 4980
acgcccatct cttcgacgac aaggtcatga agcaactcaa gcgacgacga tacactggct 5040
ggggccgact ttcccgaaag ctcatcaacg gcatccgaga caagcagtct ggcaagacca 5100
tcctggactt cctgaagtcc gacggtttcg ccaaccgaaa cttcatgcag ctcatccacg 5160
acgactctct taccttcaaa gaggatatcc agaaggccca ggtttctggc cagggcgact 5220
ccctccacga gcacattgcc aacctcgccg gatcccccgc catcaaaaag ggtatcctcc 5280
agaccgtcaa ggttgtcgac gaactcgtga aggtcatggg ccgacacaag cccgagaaca 5340
tcgttatcga gatggcccga gagaaccaga ccacccagaa gggtcagaag aactcccgag 5400
agcgaatgaa gcgaatcgaa gagggtatca aggagctcgg ttcccagatt ctcaaggagc 5460
accccgtcga gaacacccag ctccagaacg agaaactcta cctgtactac ctccagaatg 5520
gccgagacat gtacgttgac caggagctcg acatcaaccg actctccgac tacgacgtcg 5580
accacattgt tcctcagtcc ttcctcaagg acgactccat cgacaacaag gttctgaccc 5640
gatctgacaa gaaccgaggt aagtccgaca acgttccctc cgaagaggtc gttaagaaga 5700
tgaagaacta ctggcgacag cttctcaacg ccaaactgat cacccagcga aagtttgaca 5760
acctcaccaa ggccgagcga ggtggtctgt ccgagctgga caaggccggc ttcattaagc 5820
gacagctggt cgagactcga cagatcacca agcacgtcgc ccagatcctc gactcccgaa 5880
tgaacaccaa gtacgacgag aacgacaagc tcatccggga ggtcaaggtc atcaccctga 5940
agtctaagct tgtctccgac ttccgaaagg acttccagtt ctacaaggtc cgagagatca 6000
acaactacca ccacgcccac gacgcctacc tcaacgccgt tgttggtacc gccctcatca 6060
agaagtatcc caagctcgag tccgagttcg tttacggcga ctacaaggtt tacgatgtcc 6120
gaaagatgat tgccaagtcc gagcaggaga tcggtaaggc caccgccaag tactttttct 6180
actccaacat catgaatttc ttcaagaccg agatcactct cgccaacggt gagattcgaa 6240
agcgacccct gattgagact aatggtgaga ctggtgagat cgtctgggat aagggccgag 6300
acttcgccac cgtccgaaag gtcctgtcca tgccccaggt caacattgtc aagaagaccg 6360
aggtccagac cggtggcttc tccaaggagt ccattctccc caagcgaaac tccgacaaac 6420
tcatcgcccg taagaaggac tgggatccga agaagtacgg tggtttcgat tctcccaccg 6480
ttgcctactc cgtcctcgtt gttgctaaag tcgagaaggg taagtctaag aaactcaagt 6540
ccgtgaagga gctactcggt atcaccatca tggagcgatc ttcttttgag aagaacccca 6600
ttgacttcct cgaggccaag ggttacaaag aggtcaagaa ggacctgatt atcaagctgc 6660
ccaagtactc cctctttgag ctcgagaacg gccgaaagcg aatgctggct tccgctggtg 6720
agctgcagaa gggcaacgag ctcgctctgc cctccaagta cgtcaacttc ctctacctgg 6780
cctcccacta cgagaagctc aagggctccc ccgaggacaa cgagcagaag cagctgttcg 6840
ttgagcagca caagcactac ctcgacgaga tcatcgagca gatctccgag ttctccaagc 6900
gagtcatcct cgctgacgcc aaccttgata aggttctctc tgcttacaac aagcaccggg 6960
acaagcccat ccgagagcag gccgagaata tcatccacct cttcactctc accaacctcg 7020
gcgctcctgc tgccttcaag tacttcgaca ccaccattga ccgaaagagg tacacctcca 7080
ccaaggaagt cctcgacgcc accctgatcc accagtccat caccggcctc tacgaaaccc 7140
gaatcgacct ctcccagctc ggcggtgact ctcgagccga ccccaagaag aagcgaaaag 7200
tctaaatatc cgaagatcaa gagcgaagca agttgtaagt ccaggacatg tttcccgccc 7260
acgcgagtga tttataacac ctctcttttt tgacacccgc tcgccttgaa attcatgtca 7320
cataaattat agtcaacgac gtttgaataa cttgtcttgt agttcgatga tgatcatatg 7380
attacattaa tagtaattac tgtatttgat atatatacta attacaatag tacatattag 7440
aacatacaat agttagtgcc gtgaagtggc ttaaaatacc gcgagtcgat tacgtaatat 7500
tattacctct tgcccatcga acgtacaagt actcctctgt tctctccttc ctttgctttg 7560
tgcacgaaga actgcggtca ggtgacacaa ctttttccat ctcagggtgt gtcgcgtgtg 7620
cttcatccaa actttagttg gggttcgggt tcgcgcgaga tgatcacgtg ccctgatttg 7680
gtgtcgtccc ccgtcgcgct gcgcacgtga tttatttatt tccggtggct gctgtctacg 7740
cggggccttc tctgcccttc tgtttcaacc ttcgggcggt tctcgtaacc agcagtagca 7800
atccatttcg aaactcaaag agctaaaaac gttaaacctc agcagtcgct cgacgaatgg 7860
gctgcggttg ggaagcccac gaggcctata gccagagcct cgagttgaca ggagcccaga 7920
cgccttttcc aacggcaact tttatataaa atggcaatgt attcatgcaa ttgcggccgt 7980
gtcaggttgg agacactgga ccacactctc cattgcttcc tgaggagatg gatcattgct 8040
agtgcatcta cgcgcagcaa tcccgcaagc tcgacaaccg tagatgggct ttggtgggcc 8100
aatcaattac gcaacccgca cgttaaattg tatgaggaag gaaggccacg gtacaaagtg 8160
ggtggtcttc acccagtggt tgttggtggc gtcatgcaga ccatgcattg gggatagcac 8220
agggttgggg tgtcttgtgg actcaatggg tgaaaggaga tggaaaaggg cggtgaaaag 8280
tggtagaatc gaaatccctg acgtcaattt ataaagtaaa atgcgtttct gccattttgc 8340
tcccctcctt ctttcgcaat cgcctcccca aaagttgtcg tggcagtaca catgcttgca 8400
tacaatgaag ctaatccggc ttgctcagta gttgctatat ccaggcatgg tgtgaaaccc 8460
ctcaaagtat atataggagc ggtgagcccc agtctggggt cttttctctc catctcaaaa 8520
ctactttctc acaatgacga gactgatgag tccgtgagga cgaaacgagt aagctcgtcg 8580
gtggcctgga ttcgagtggg ttttagagct agaaatagca agttaaaata aggctagtcc 8640
gttatcaact tgaaaaagtg gcaccgagtc ggtgcttttg gccggcatgg tcccagcctc 8700
ctcgctggcg ccggctgggc aacatgcttc ggcatggcga atgggactaa acttcgagct 8760
aatccagtag cttacgttac ccaggggcag gtcaactggc tagccacgag tctgtcccag 8820
gtcgcaattt agtgtaataa acaatatata tattgagtct aaagggaatt gtagctattg 8880
tgattgtgtg attttcgtct tgctggttct tattgtgtcc cattcgtttc atcctgatga 8940
ggacccctgg aaccggtgtt ttcttagtct ctgcaatcgc tagtcttgtt gctatgacag 9000
ttgcgtcgac actattcagg tcatctatcg gttattctga tattataata cctccggatc 9060
gatgtacctg atttatactt gcagcaatgt ttacttctta tcgttggacc ccgtcttcaa 9120
ttacacttcc caactgggaa cacccctctt tatcgaccca ttttaggtaa tttaccctag 9180
cccattgtct ccataaggaa tattacccta acccacagtc cagggtgccc aggtccttct 9240
ttggccaaat tttaacttcg gtcctatggc acagcggtag cgcgtgagat tgcaaatctt 9300
aaggtcccga gttcgaatct cggtgggacc tagttgaaaa atacctctaa tgcgccgatg 9360
gtttagtggt aaaatccatc gttgccatcg atgggccccc ggttcgattc cgggtcggcg 9420
caggttgacg tttacaccca ctctatcgga ggttttagag ctagaaatag caagttaaaa 9480
taaggctagt ccgttatcaa cttgaaaaag tggcaccgag tcggtgcttt tttttttcgc 9540
gatacacgaa tgtgatacgg atcaaagtaa gcaggactac gataagataa cgaatgcggt 9600
gcagtccatg tcgattaggt atagatacat ttattttgtg ttatgttaca ttttgggggg 9660
atactgtcct acttgtagta cctacttgta gtggcgcgtc tattcctttg ccctcggacg 9720
agtgctgggg cgtcggtttc cactatcggc gagtacttct acacagccat cggtccagac 9780
ggccgcgctt ctgcgggcga tttgtgtacg cccgacagtc ccggctccgg atcggacgat 9840
tgcgtcgcat cgaccctgcg cccaagctgc atcatcgaaa ttgccgtcaa ccaagctctg 9900
atagagttgg tcaagaccaa tgcggagcat atacgcccgg agccgcggcg atcctgcaag 9960
ctccggatgc ctccgctcga agtagcgcgt ctgctgctcc atacaagcca accacggcct 10020
ccagaagaag atgttggcga cctcgtattg ggaatccccg aacatcgcct cgctccagtc 10080
aatgaccgct gttatgcggc cattgtccgt caggacattg ttggagccga aatccgcgtg 10140
cacgaggtgc cggacttcgg ggcagtcctc ggcccaaagc atcagctcat cgagagcctg 10200
cgcgacggac gcactgacgg tgtcgtccat cacagtttgc cagtgataca catggggatc 10260
agcaatcgcg catatgaaat cacgccatgt agtgtattga ccgattcctt gcggtccgaa 10320
tgggccgaac ccgctcgtct ggctaagatc ggccgcagcg atcgcatcca tggcctccgc 10380
gaccggctgc agaacagcgg gcagttcggt ttcaggcagg tcttgcaacg tgacaccctg 10440
tgcacggcgg gagatgcaat aggtcaggct ctcgctgaat tccccaatgt caagcacttc 10500
cggaatcggg agcgcggccg atgcaaagtg ccgataaaca taacgatctt tgtagaaacc 10560
atcggcgcag ctatttaccc gcaggacata tccacgccct cctacatcga agctgaaagc 10620
acgagattct tcgccctccg agagctgcat caggtcggag acgctgtcga acttttcgat 10680
cagaaacttc tcgacagacg tcgcggtgag ttcaggcttt ttcatatggg tacctgagaa 10740
catttttgtg tctaggtgtt tgtgtttgga ctgcgatcag tgaagaaaag aagaggaaaa 10800
attgtgcaag aaattttgct ttcaagactt ggctgatgca gcagggtaac tctgggacac 10860
agacctatgt ttgtggttaa actcaatgca cgtggtacgt gcgtggagcg cttacccatc 10920
caagggtgtg gacatggaac cgacggtccg tggagttgtg taatgtcatt ttggcgactc 10980
ttgaagcaag gctataaaaa aattgtgtgg cttgagtctt atcgagctcg gtcactacaa 11040
gagttaatct tcctgtctca ggcagacagg tcaggcaggg ttacttttgg gtgtgctgta 11100
actcactgta tggccgttag tgcgcataga cgttgtacat actggaccga attgtagcgt 11160
gctcaatagg gccaataaag ctattgtagg gatccgaatt ttcagaacct aatttatctg 11220
ttacccggcc tgtggctcgc acagcttaaa aatggtcaaa ctttcccctt cttgtctttt 11280
tttcctcaca ttcatcaggt tcttgtcttg atctttcaag tgagtattaa ttaccgacct 11340
tggttcttca ttgggagagc attggaagcc gtggtgcagc aaccacaaaa cggttcttcc 11400
ccttcgatac cttcttgcct gcctttcaat acaagtcggc tcgattagcg gtggtcgccc 11460
ccgccagcgg agaacatgga actaacccag aatgagagct aagtggagaa agaagagagt 11520
cagacgactc aagcgaaagc gccgcaaggt ccgagctcga tccaaataag cggtttttaa 11580
cggagattta acactaaatc gaagaacttt tcccgtttca tttgcgaatg agctcgttaa 11640
caaaatcccc cagttttttt atccagctgt aaggattgac attagtaatg aattattgtt 11700
tggtatattt aaatctgtag ttcctttctg tccgtgtcgg caactgtcgt actcgtgatt 11760
tacttgtatt gacgaatact tactgtagcg cactctgctg ctactggtcg taaggatgtg 11820
ctatttcggt gtatggtggg ttttttgggg gtcggaaccg aagactgtta cacgggcacg 11880
gctcgttgtg tacacgcaca gagctcttgc gagtcatgtt gtagctagct cgtcgtgttc 11940
aggaactgtt cgatggttcg gagagagtcg ccgcccagaa catacgcgca ccgatgtcag 12000
cagacagcct tattacaagt atattcaagc aagtatatcc gtagggtgcg ggtgatttgg 12060
atctaaggtt cgtactcaac actcacgagc agcttgccta tgttacatcc ttttatcaga 12120
cataacataa ttggagttta cttacacacg gggtgtacct gtatgagcac cacctacaat 12180
tgtagcactg gtacttgtac aaagaattta ttcgtacgaa tcacagggac ggccgccctc 12240
accgaaccag cgaatacctc agcggtcccc tgcagtgact caacaaagcg atatgaacat 12300
cttgcgatgg tatcctgctg atagttttta ctgtacaaac acctgtgtag ctccttctag 12360
catttttaag ttattcacac ctcaagggga gggataaatt aaataaattc caaaagcgaa 12420
gatcgagaaa ctaaattaaa attccaaaaa cgaagttgga acacaacccc ccgaaaaaaa 12480
acaacaaaca aaaaacccaa caaaataaac aaaaacaaaa taaatatata actaccagta 12540
tctgactaaa agttcaaata ctcgtactta caacaaatag aaatgagccg gccaaaattc 12600
tgcagaaaaa aatttcaaac aagtactggt ataattaaat taaaaaacac atcaaagtat 12660
cataacgtta gttattttat tttatttaat aaaagaaaac aacaagatgg gctcaaaact 12720
ttcaacttat acgatacata ccaaataaca atttagtatt tatctaagtg cttttcgtag 12780
ataatggaat acaaatggat atccagagta tacacatgga tagtatacac tgacacgaca 12840
attctgtatc tctttatgtt aactactgtg aggcattaaa tagagcttga tatataaaat 12900
gttacatttc acagtctgaa cttttgcaga ttacctaatt tggtaagata ttaattatga 12960
actgaaagtt gatggcatcc ctaaatttga tgaaagatga aattgtaaat gaggtggtaa 13020
aagagctaca gtcgttttgt tttgagatac catcatctct aacgaaatat ctattaaaaa 13080
tctcagtgtg atcatgagtc attgccatcc tggaaaatgt catcatggct gatatttcta 13140
actgtttact tgagataaat atatatttac aagaacttcc cttgaaatta atttagatat 13200
aaaatgtttg cgggcaagtt actacgagga ataaattata tctaga 13246
<210> 13
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于Cas9 CRISPR靶向的序列
<400> 13
acagcaggct gaacgaggat 20
<210> 14
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于Cas9 CRISPR靶向的序列
<400> 14
tggaggcatg atcaacagcg 20
<210> 15
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于Cas9 CRISPR靶向的序列
<400> 15
tcactcctca gcctcccaag 20
<210> 16
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于Cas9 CRISPR靶向的序列
<400> 16
ggtggcctgg attcgagtgg 20
<210> 17
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于Cas9 CRISPR靶向的序列
<400> 17
ttacacccac tctatcggag 20

Claims (14)

1.具有少于40个碳作为主链的类异戊二烯的发酵生产方法,所述发酵生产方法在两相培养系统中进行,包括原位提取所述类异戊二烯,其中在碳源和亲脂性溶剂的存在下培养合适的宿主细胞,其中所述亲脂性溶剂不同于所述碳源且在发酵过程中具有最小的溶剂损失。
2.根据权利要求1所述的方法,其中在发酵结束时存在的亲脂性溶剂是在发酵过程开始时存在的溶剂的至少80%。
3.根据权利要求1或2所述的方法,其中所述亲脂性溶剂包括异链烷烃。
4.根据权利要求1或2所述的方法,其中所述亲脂性溶剂包括烷烃,特别是异烷烃或环烷烃。
5.根据权利要求1或4中任一项所述的方法,其中所述发酵产物选自类胡萝卜素、倍半萜,优选类视黄醇、紫罗兰酮,更优选视黄醇乙酸酯、α-紫罗兰酮、β-紫罗兰酮。
6.根据权利要求1至5中任一项所述的方法,其中所述碳源选自线性烷烃、游离脂肪酸、乙醇、葡萄糖,包括甘油三酯,特别是植物油,例如选自源自如下物质的油:玉米、大豆、橄榄、向日葵、芥花籽、棉籽、油菜籽、芝麻、红花、葡萄籽或其混合物,包括各自的游离脂肪酸,例如油酸、棕榈酸或亚油酸。
7.根据权利要求1至6中任一项所述的方法,其中20%或更少的溶剂在发酵过程中损失。
8.根据权利要求1至7中任一项所述的方法,其中宿主细胞对溶剂的消耗减少至少约50%。
9.根据权利要求7所述的方法,其中溶剂的蒸发减少至少约50%。
10.根据权利要求1至10中任一项所述的方法,其中副产物或杂质的形成减少至少约25%,优选其中所述杂质选自视黄醛、视黄醇、视黄醇脂肪酸酯(FARE)或其二氢形式,例如二氢视黄醇或二氢视黄醇乙酸酯,特别是FARE、rosafluene、八氢番茄红素、麦角甾醇、二氢-β-紫罗兰酮和其他还原形式。
11.根据权利要求1至10中任一项所述的方法,其中所述宿主细胞选自真菌宿主细胞,特别是油质宿主细胞,例如酵母,优选选自耶氏酵母属(Yarrowia)、红冬孢酵母属(Rhodosporidium)、油脂酵母属(Lipomyces)、酵母属(Saccharomyces)或红酵母属(Rhodotorula)。
12.根据权利要求1至11中任一项所述的方法,用于生产视黄醇乙酸酯,包括收集所述亲脂性溶剂中的发酵产物,任选地进一步分离和/或纯化,并测量发酵产物的颜色,其中所述颜色是半透明色或浅黄色。
13.根据权利要求12所述的方法,其中所述半透明色对应于根据
Figure FDA0004205539440000021
MatchingSystem(PMS)的PMS 120-129。
14.生物基类视黄醇形式,包含视黄醇、视黄醇乙酸酯,其中基于总类视黄醇的视黄醇乙酸酯的百分比在约70%-90%的范围内,所述产物通过根据权利要求12所述的方法生产。
CN202180074059.3A 2020-10-30 2021-11-01 类异戊二烯的发酵生产 Pending CN116391044A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063107898P 2020-10-30 2020-10-30
US63/107,898 2020-10-30
PCT/EP2021/080282 WO2022090548A1 (en) 2020-10-30 2021-11-01 Fermentative production of isoprenoids

Publications (1)

Publication Number Publication Date
CN116391044A true CN116391044A (zh) 2023-07-04

Family

ID=78536196

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180074059.3A Pending CN116391044A (zh) 2020-10-30 2021-11-01 类异戊二烯的发酵生产

Country Status (5)

Country Link
US (1) US20230407344A1 (zh)
EP (1) EP4237570A1 (zh)
KR (1) KR20230088922A (zh)
CN (1) CN116391044A (zh)
WO (1) WO2022090548A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023006851A1 (en) * 2021-07-27 2023-02-02 Dsm Ip Assets B.V. Fermentative production of retinyl acetate in the presence of ethanol
WO2023214072A2 (en) * 2022-05-05 2023-11-09 Dsm Ip Assets B.V. Novel process
WO2024119170A2 (en) 2022-12-02 2024-06-06 Dsm Ip Assets B.V. Fermentatively-produced retinoid containing compositions, and the methdos of making and using the same

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EA016258B1 (ru) 2005-03-18 2012-03-30 Микробиа, Инк. Рекомбинантные грибы, продуцирующие каротиноиды, и способы их применения
WO2008042338A2 (en) 2006-09-28 2008-04-10 Microbia, Inc. Production of carotenoids in oleaginous yeast and fungi
KR101392159B1 (ko) * 2011-07-29 2014-05-12 경상대학교산학협력단 미생물로부터 레티노이드를 생산하는 방법
EP2935571B1 (en) 2012-12-20 2018-03-07 DSM IP Assets B.V. Acetyl transferases and their use for producing carotenoids
KR20140147982A (ko) * 2013-06-20 2014-12-31 경상대학교산학협력단 레티노이드 생산에 관여하는 효소를 코딩하는 유전자를 포함하는 미생물 및 이를 이용한 레티노이드의 생산 방법
WO2016172282A1 (en) 2015-04-21 2016-10-27 Dsm Ip Assets B.V. Microbial production of terpenoids
JP2020535794A (ja) 2017-09-25 2020-12-10 ディーエスエム アイピー アセッツ ビー.ブイ.Dsm Ip Assets B.V. トランス−レチナールの生産
JP7443656B2 (ja) 2017-09-25 2024-03-06 ディーエスエム アイピー アセッツ ビー.ブイ. レチニルエステルの生産
WO2019058000A1 (en) * 2017-09-25 2019-03-28 Dsm Ip Assets B.V. BIOSYNTHESIS OF RETINOIDS
US20220064607A1 (en) 2018-12-31 2022-03-03 Dsm Ip Assets B.V. Novel acetyl-transferases

Also Published As

Publication number Publication date
EP4237570A1 (en) 2023-09-06
US20230407344A1 (en) 2023-12-21
WO2022090548A1 (en) 2022-05-05
KR20230088922A (ko) 2023-06-20

Similar Documents

Publication Publication Date Title
CN116438297A (zh) 原位两相提取系统
CN116391044A (zh) 类异戊二烯的发酵生产
CN101563356B (zh) 高山被孢霉c16/18脂肪酸延伸酶
KR20120115500A (ko) 전해질 첨가를 동반한 추출성 발효를 사용해 부탄올을 제조하는 방법
KR20120117990A (ko) 삼투조절물질 첨가를 동반한 추출성 발효를 사용해 부탄올을 제조하는 방법
KR20110015045A (ko) 2-상 추출 발효를 이용한 부탄올의 생산방법
DK2324119T3 (en) Mutant DELTA5 Desaturases AND USE THEREOF FOR THE PRODUCTION OF polyunsaturated fatty acids
CN102695796B (zh) 细胞、核酸、酶和它们用于生产槐糖脂的用途以及方法
KR102381610B1 (ko) Rna-유도 엔도뉴클레아제를 사용한 통상적이지 않은 효모에서의 유전자 표적화
DK2087106T3 (en) MUTATING DELTA8 DESATURATION GENES CONSTRUCTED BY TARGETED MUTAGENES AND USE THEREOF IN THE MANUFACTURE OF MULTI-Saturated FAT ACIDS
CN106794261B (zh) 埃博拉病毒特异性的miRNA以及通过miRNA抑制埃博拉病毒的方法
US20040166580A1 (en) Vector constructs
KR20140099251A (ko) 아세트산 및 글리세롤로부터 에탄올을 생성하도록 합성된 이스트 스트레인
DK2443248T3 (en) IMPROVEMENT OF LONG-CHAIN POLYUM Saturated OMEGA-3 AND OMEGA-6 FATTY ACID BIOS SYNTHESIS BY EXPRESSION OF ACYL-CoA LYSOPHOSPHOLIPID ACYL TRANSFERASES
DK2576605T3 (en) PREPARATION OF METABOLITES
KR20130087014A (ko) 알코올 생산성 향상을 위한 지방산의 보충
CN114901816A (zh) 脂肪酶修饰的菌株
KR20130087013A (ko) 추출 발효에서의 알코올 제거를 위한 오일로부터 유래되는 추출 용매
KR20220020826A (ko) 바실러스에서의 푸코실화 올리고당의 생산
CN109609579B (zh) 一种产β-胡萝卜素的基因工程菌及其构建方法
CN114015587B (zh) 一种生产角鲨烯的重组菌株及其构建方法以及应用
CN116134147A (zh) 脂肪酸视黄酯形成的减少
KR102226252B1 (ko) 리소좀을 포함하는 미백용 조성물
CN108531495A (zh) 一种光控基因表达系统及其应用
AU2015207519B2 (en) Novel cytochrome P450 polypeptide with increased enzymatic activity

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination