生产类鞘氨醇碱或其衍生物的微生物菌株
术语“鞘脂(sphingolipids)”指衍生自诸如鞘氨醇(sphingosine)的类鞘氨醇碱(sphingoid base)的一组脂类物质。鞘脂经常发现于动物、植物和微生物细胞的膜中。
神经酰胺是一组特别的鞘脂,其含有鞘氨醇、植物鞘氨醇或者二氢鞘氨醇(dihydrosphingosine,也称作二氢神经鞘氨醇(sphinganine)),在与脂肪酸的酰胺连接中作为碱部分(类鞘氨醇碱)。神经酰胺是皮肤上层角质层的主要脂类组分。包含鞘脂(例如神经酰胺)的组合物的局部应用能改善皮肤的屏障功能和水分保持性质(Curratolo,1987,Pharm.Res.4,271-277;Kerscher et al.,1991,Eur.J.Dermatol.1,39-43)。此外,上述类鞘氨醇碱已知能介导若干生理作用,例如抑制蛋白质激酶C的活性,因此由于其抗炎和抗微生物活性被包括进化妆品或皮肤护理组合物。
因为鞘氨醇是人类中鞘脂的主要类鞘氨醇碱,人们对其有着相当大的商业兴趣,以生产鞘氨醇和含鞘氨醇的鞘脂,用于食品、制药和化妆品应用。
目前,已开发了用于化学合成鞘氨醇(以及二氢神经鞘氨醇)的若干途径。但是,由于这些分子中存在两个立体异构中心,化学合成产生外消旋混合物,其中仅有25%是天然存在的立体异构化学构型。此外,由于在这些分子中存在三个功能基团,必须要应用大量的化学保护方法。因此,通过化学合成生产的鞘氨醇和二氢神经鞘氨醇非常昂贵,使其无法被包括进食物和化妆品配方。对于从天然来源(例如脑或鸡蛋)分离的纯鞘氨醇和二氢神经鞘氨醇而言,也是这样。还可获得从动物来源提取的异源鞘脂制剂。虽然这比纯的化合物便宜,但是它们存在组成异源性的缺点,因为可能含有病原物而可能不够安全。
与哺乳动物相反,在微生物中,植物鞘氨醇(而非鞘氨醇)才是鞘脂的主要的类鞘氨醇碱性组分。通常,植物鞘氨醇不在微生物中积累,但是其是鞘脂的从头生物合成途径的一部分。酵母Pichia ciferrii(Wickerhamand Stodola,1960,J.Bacteriol.80,484-491)显示出能生产相当高水平的类鞘氨醇碱及其衍生物,但全部是以C18-鞘氨醇及其乙酰化衍生物作为主要组成成分的植物鞘氨醇。其生产水平远高于对鞘脂从头进行生物合成所必须的。该鞘氨醇可从酵母中提取,并且化学转化为,例如,神经酰胺,由此获得纯的化妆品成分(见,例如WO93/20038)。
WO 00/01839公开了通过经典诱变获得的Pichia ciferrii菌株,其展示出对类鞘氨醇碱植物鞘氨醇的提高的生产水平。
但是,还没有获得用于生产鞘氨醇和二氢神经鞘氨醇纯化合物的天然存在的立体异构体的经济上更可行的方法,人们对其非常需要。
Barenholz et al(1973,Biochimica et Biophysica Acta 306:341-345)描述了通过不含细胞的提取物进行的对少量经放射性标记的人工底物向二氢鞘氨醇(二氢神经鞘氨醇)的转化。但是,整个细胞几乎专门生产植物鞘氨醇,如作者在第344页所述“该工作仅测量了对二氢鞘氨醇的合成,而高产者主要积累乙酰化的植物鞘氨醇”。已通过针对丁香假单胞霉素E(syringomycin E)抗性突变体的筛选,通过在单倍体Saccharomycescerevisiae细胞中扰乱SYR2基因(Grilley et al.,1998,J Biol Chem273:11062-11068),获得了积累二氢神经鞘氨醇的酵母。但是,这些酵母生产非常低水平的二氢神经鞘氨醇,其不足以高效生产。
Bae et al.(2004,Yeast,21:437-443)描述了缺少C4-二氢神经鞘氨醇羟化酶的Saccharomyces cerevisiae sur2空突变体的二氢神经鞘氨醇生产水平。其显示为仅346pmol/mg蛋白质,这对应于大约10微克/g生物质。这对于商业化工艺来说太低了。
因此,本发明的一个目的是提供下述微生物菌株,它们能生产不是C-18植物鞘氨醇的类鞘氨醇碱,特别是二氢神经鞘氨醇和/或鞘氨醇。
因此,在第一个方面,本发明提供了一种微生物菌株,特别是酵母菌株,其能生产对每g生物质干重而言至少0.1mg的根据结构式I:
的类鞘氨醇碱或其盐或酯,
其中,A-B选自CH2-CH2和CH=CH构成的组,并且,其中,R选自下述构成的组:
a)(CH2)m-X-(CH2)n-CH3,其中m和n每个独立地在0至18(含)之间,X是CH2-CH2、CH=CH、C≡C、CHOH-CH2、HC=O-CH2,前提条件是m+n应当在0至18(含)之间,以及
b)(CH2)p-CH=CH-(CH2)q-CH=CH-(CH2)w-CH3,其中p、q和w每个独立地在0至16(含)之间,前提条件是p+q+w应当在0至16(含)之间。
优选地,本发明的酵母菌株能生产对每g生物质干重而言至少1mg的根据结构式I的类鞘氨醇碱,更优选地,每g生物质干重至少10mg。技术人员将理解,类鞘氨醇碱生产率的上限可能是每g生物质干重大约500mg。
优选地,当在下述条件下培养能生产类鞘氨醇碱的微生物菌株时,测量本发明的微生物菌株的类鞘氨醇碱生产率。从琼脂平板将微生物细胞接种进500ml摇瓶中的100ml YEPD培养基,在30℃和280rpm培养72小时。随后,将该培养物的1%转移到装有100ml LCBNB生产培养基的带挡板500ml摇瓶中,在30℃和280rpm培养96小时。
通过HPLC或MS来方便地测量鞘氨醇生产率。
本发明的微生物菌株优选是酵母菌株,更优选地是Pichia的菌株,最优选地是Pichia ciferrii的菌株。
在另一种实施方式中,根据结构式I的类鞘氨醇碱是酰基酯形式的。酰基通过羟基连接到类鞘氨醇碱上,即“真正的”酯连接,和/或通过氨基连接,即,酰胺连接。优选地,酰基是1-4个碳原子的直短链酰基,更优选地,是乙酰基。
在一种优选的实施方式中,根据结构式I的类鞘氨醇碱具有根据结构式II的D-赤-(2R,3S)-构型:
其中,A-B和R如上文定义。
还优选的是根据结构式I或II的化合物,其中,R是(CH2)m-X-(CH2)n-CH3,其中,更优选地,m是0,X是CH2-CH2或CHOH-CH2,最优选地,X是CH2-CH2,n在8至12之间,最优选地,n是10。尤其优选的是其中A-B是CH2-CH2或CH=CH并且R是(CH2)12-CH3的根据结构式I或II的化合物。
技术人员将理解,通过微生物生产的类鞘氨醇碱可组成具有不同链长(即不同长度的R基团)的类鞘氨醇碱的混合物。一些情况下,一种链长可能占优势地存在,但是包含大致等量的不同链长的混合物也是可能的。
在第二个方面,本发明提供了一种方法,用于分离根据第一个方面的微生物菌株。
所述方法包括在存在合适浓度的毒素的情况下,培养微生物细胞的群体,选择对于所述毒素具有抗性的细胞亚群,从对毒素具有抗性的细胞亚群中分离出能生产对每g生物质干重而言至少0.1mg的结构式(I)的类鞘氨醇碱的细胞。
在根据本发明的方法中,在存在合适浓度的毒素的情况下,培养微生物细胞的群体,分离(选择)出对于所述毒素具有抗性的细胞亚群。应用的毒素应当对微生物细胞的起始群体具有毒性,即,所述毒素应当具有使得当细胞在合适浓度的该毒素存在的情况下被培养时细胞不能生长或存活的作用。当在存在合适浓度的毒素的情况下培养时,分离出对毒素展示出抗性的细胞亚群,即能在存在毒素的情况下能生长的细胞亚群。这些毒素抗性细胞的亚组可能已获得了一种或多种突变,所述突变例如提供对根据结构式I的类鞘氨醇碱的提高的生产水平。
可应用于此类选择的典型的毒素是:丁香假单胞霉素E,它在二氢神经鞘氨醇羟化酶的作用下成为有毒性的(Grilley et al.(1998),J,Biol.Chem.273,11062-11068),因此抗性细胞可能是二氢神经鞘氨醇羟化酶阴性突变体;非乙酰化的类鞘氨醇碱,例如二氢神经鞘氨醇、植物鞘氨醇和鞘氨醇,它们作为生长抑制剂或者作为凋亡诱导化合物发挥毒性作用(Chunget al.(2001),J.Biol.Chem.276,35614-35621;Cheng et al.(2003),Mol.Cell.Biol.23,163-177),抗性细胞可能是非敏感型类鞘氨醇碱过量生产细胞;伏马毒素(fumonisin),其是(二氢)神经酰胺合酶的抑制剂,抗性细胞可能是具有增加的经历类鞘氨醇碱生物合成途径通量的细胞(Merill(2002),J.Biol.Chem.277,25843-25846);AAL(Alternaria alternata)毒素,其是类鞘氨醇碱的类似物,抗性细胞可能是产生具有改变的水平和/或改变的组成的类鞘氨醇碱的细胞(Abbas et al.(1994),Plant Physiol.106,1086-1093)。
毒素的合适浓度典型地为:针对将被用于进行本发明方法的微生物细胞发现的最小抑制浓度(MIC值)左右。MIC值将取决于所用的微生物细胞,其可能在例如2至10μg/ml之间。从具有毒素抗性的细胞亚群分离出下述微生物菌株,所述菌株能生产对每g生物质干重而言至少0.1mg的根据结构式I的类鞘氨醇碱。
令人吃惊地,我们发现,毒素抗性细胞中有很高百分比能生产对每g生物质干重而言至少0.1mg的根据结构式I的类鞘氨醇碱。
特别地,我们吃惊地发现,使用毒素丁香假单胞霉素E获得了能生产高水平二氢神经鞘氨醇的丁香假单胞霉素E抗性Pichia ciferrii。这之所以令人吃惊是因为人们认为针对单倍体物种的方法,例如S.cerevisiae描述的方法(上文Grilley et al.,)不可能对二倍体物种例如Pichia ciferrii有用(Wickerham and Burton,1962,Bacteriol Rev.26:382-397),尤其是如果此类二倍体物种还具有高的类鞘氨醇碱通量的话。
有多个例子证明:基于对毒素的抗性来分离特定突变体对二倍体物种很麻烦。例如Nosek et al.,(2002,Curr Genet,42:27-35)描述了:即使在存在毒素的情况下培养之前对细胞进行诱变处理,也不能分离出二倍体酵母菌株Candida parapsilosis SR23的5-氟乳清酸(5-FOA)抗性克隆。在另一公开文献(Wellington and Rustchenko,2005,Yeast,22:57-70)中,报导了对二倍体酵母菌株Candida albicans的5-FOA-抗性克隆的分离。但是,这些克隆保留为尿嘧啶原营养型。因此,在单倍体酵母物种中,例如Saccharomyces cerevisiae的实验室菌株中容易进行的通过处理5-FOA对编码乳清苷-5’-磷酸脱羧酶的URA3基因的定位失活在二倍体酵母菌株中看起来是不可能的。
类鞘氨醇碱,例如二氢神经鞘氨醇,已知能诱导凋亡(Cheng et al.,2003,Mol Cell Biol,23:163-177)。P.ciferrii明显地通过高效乙酰化以及随后植物鞘氨醇的分泌回避了该问题。但是,当细胞被驱动以积累二氢神经鞘氨醇来代替植物鞘氨醇的时候此类生物将如何反应却是不可预测的。
用本发明的方法处理的微生物群体可以是从一种特定的亲本菌株获得的相同细胞的群体。以这种方式,典型地,可分离自发突变体。用本发明的方法处理的微生物细胞的群体还可以是先经过诱变处理以将遗传变异有意引入到所述群体中的细胞群体。典型地,诱变处理可包含所谓的经典处理,其还可包括DNA介导的转化。
经典处理包括原生质体融合和/或用UV放射或某些化学物质进行的处理。
在一种实施方式中,生产根据结构式I的类鞘氨醇碱的微生物细胞是从下述细胞群体分离的,所述细胞群体被诱变处理,但在诱变处理前并不经过毒素处理。当诱变处理是DNA介导的转化时,该实施方式特别有用,更特别地,为了对鞘脂代谢途径加以工程改造的目的时。
在另一种实施方式中,诱变处理在毒素抗性细胞上进行,优选地,在能生产对每g生物质干重而言至少0.1mg的根据结构式I的类鞘氨醇碱的毒素抗性细胞上进行。当诱变处理是DNA介导的转化以便对鞘脂代谢途径加以工程改造时,该实施方式也特别有用。
对鞘脂代谢途径进行工程改造可以以多种方式进行。例如,通过对来自代谢途径的一种或多种酶的表达水平加以改变,即增加或减少,来进行。例如通过对编码感兴趣的酶的基因进行靶向失活,可由此实现表达水平的减少。此外,或或者,通过修饰代谢途径的一种或多种单个的酶,例如,以获得对于特定底物具有改变的底物特异性或更高的亲和性的酶。
对鞘脂代谢途径进行工程改造的一个例子是增加二氢神经酰胺去饱和酶的表达水平,即过量表达编码二氢神经酰胺去饱和酶的基因,特别地,这提供于本发明的另一方面中。
对鞘脂代谢途径进行工程改造的另一个例子是以下述方式对去饱和酶的底物范围加以修饰,所述方式使得,类鞘氨醇碱(例如二氢神经鞘氨醇)代替神经酰胺(特别是二氢神经酰胺)成为该酶的优选底物,这提供了二氢神经鞘氨醇向鞘氨醇的直接原位转化。
对鞘脂代谢途径进行工程改造的其它例子是对类鞘氨醇碱的乙酰化情况的改变,对类鞘氨醇碱的链长组成的改变和/或类鞘氨醇碱增加或减少的分泌。
具有经改变的乙酰化情况的类鞘氨醇碱可通过下述手段获得,例如,筛选出以及(可能地)富集具有经修饰乙酰化活性和/或经修饰的分泌活性的突变体菌株,这以下述方式来进行,所述方式使得:较之亲本菌株能生产更多或更少的、根据结构式I的类鞘氨醇碱的乙酰化形式的菌株被分离出来。
本发明还包括对二氢神经酰胺去饱和酶活性的修饰,可选地,结合对神经酰胺酶活性的修饰,可选地,结合对乙酰化酶的修饰,可选地,结合对分泌机制的酶的修饰,这以下述方式来进行,所述方式使得从细胞内二氢神经鞘氨醇经由神经酰胺到分泌的鞘氨醇的通量增加。
在本发明的一种实施方式中,分离出下述微生物菌株,较之亲本菌株,所述微生物菌株展示出:对根据结构式I的类鞘氨醇碱的提高的生产率,和/或鞘脂代谢途径中的酶表达水平和/或细胞内定位的变化。
类鞘氨醇碱的提高的生产率由此包括:较之亲本菌株的生产率增加和/或对亲本菌株基本不生产的类鞘氨醇碱的生产。鞘脂代谢途径中的酶的表达水平的变化由此包括:较之亲本菌株表达水平的增加和/或亲本菌株不表达的酶活性的表达。
在本发明的上下文中,亲本菌株是基本不产生根据结构式I的类鞘氨醇碱的菌株。例如,合适的亲本菌株可以是下述菌株:在特定条件下,其以低于每g生物质干重0.1mg的水平产生根据结构式I的类鞘氨醇碱。亲本菌株还可以是下述菌株,其生产大量的并非是根据结构式I的类鞘氨醇碱的类鞘氨醇碱,例如,优选地,Pichia ciferrii NRRL Y-1031 F-60-10和/或WO 95/12683公开的任何Pichia ciferri菌株,所有这些都主要产生C18-植物鞘氨醇。
在第三个方面,本发明提供了具有二氢神经酰胺去饱和酶活性的多肽,优选地,可从酵母Pichia ciferrii获得。特别地,本发明的具有二氢神经酰胺去饱和酶的多肽具有根据SEQ ID NO:1的氨基酸序列和/或具有与SEQ ID NO:1至少67%的百分比同一性的氨基酸序列,优选地,与SEQID NO:1至少70%,更优选地,至少80%,最优选地,至少90%的同一性(同源多肽)。同源多肽可以是可从其它微生物(特别是酵母)菌株获得的变体,或者可以是经过工程改造的变体。
我们吃惊地发现,生产大量植物鞘氨醇而非鞘氨醇的Pichia ciferrii含有与来自Candida albicans的二氢神经酰胺去饱和酶的序列相似的多肽。
技术人员将认识到下述事实,可获得多种不同的计算程序来确定两条序列间的百分比同一性。例如,使用Needleman and Wunsch(J.Mol.Biol.(48):444-453(1970))算法来确定两条氨基酸序列间的百分比同一性,该算法已被并入GCG软件包的GAP程序(可从
http://www.gcg.com获得),其中使用Blossom 62矩阵或PAM250矩阵,以及16、14、12、10、8、6或4的缺口权重以及1、2、3、4、5或6的长度权重。技术人员将认识到,所有这些不同参数可能产生略有不同的结果,但是使用不同算法时两条序列间的整体百分比同一性不会有显著改变。方便地,采用缺省设置(缺口权重为12,长度权重为1),使用Blossom 62矩阵。
本发明令人吃惊地显示:较之亲本菌株展示出对本发明多肽的更高的表达水平的微生物细胞展示出了对根据结构式I的类鞘氨醇碱的提高的生产率。特别是下述根据结构式I的类鞘氨醇碱,其中,A-B是CH=CH,R是(CH2)m-X-(CH2)n-CH3,其中,更优选地,m是0,X是CH2-CH2或CHOH-CH2,以及n在8至12之间,最优选地,n是10。
在第四个方面,本发明提供了一种多核苷酸,其包含编码第三个方面的多肽的核苷酸序列。优选地,多核苷酸包含编码SEQ ID NO:1的氨基酸序列的核苷酸序列。更优选地,编码SEQ ID NO:1的氨基酸序列的核苷酸序列是SEQ ID NO:2或者被SEQ ID NO:3包含。
特别地,本发明涉及一种同源多核苷酸,其包含编码第三个方面的多肽的核苷酸序列,在严谨条件下,优选在高度严谨条件下,能与根据SEQID NO:2的核苷酸序列或其亚序列杂交。
有利地,此类同源多核苷酸可从生产类鞘氨醇碱的微生物菌株获得,特别地,从生产类鞘氨醇碱的酵母菌株获得,更特别地,从Pichia菌株获得。
例如,使用SEQ ID NO:2或其亚序列的核酸序列作为杂交探针,可使用标准杂交和克隆技术(例如,如Sambrook,J.,Fritsh,E.F.,andManiatis,T.Molecular Cloning:A Laboratory Manual.2nd,ed.,Cold SpringHarbor Laboratory,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY,1989所述)分离出本发明的核酸分子。
本文中使用的术语“杂交”意欲描述下述杂交和洗涤条件,在所述条件下,典型地,互相至少大约50%,至少大约60%,至少大约70%,更优选至少大约80%,进一步更优选至少大约85%至90%,更优选至少95%相同的核苷酸序列保持为互相杂交。
此类杂交条件的一种优选非限制性例子是:大约45℃时在6X氯化钠/柠檬酸钠(SSC)中杂交,接着在1 X SSC、0.1%SDS中于50℃洗一次或多次,优选在55℃,优选在60℃,进一步更优选在65℃洗。
高度严谨条件包括,例如,在68℃时,在5x SSC/5x Denhardt’s溶液/0.1%SDS中杂交,在0.2x SSC/0.1%SDS中于室温洗涤。或者,可在42℃洗。
技术人员将知道用何种条件作为严谨杂交条件和高度严谨杂交条件。关于此类条件的额外指导可从现有技术容易地获得,例如,在Sambrook etal.,1989,Molecular Cloning,A Laboratory Manual,Cold Spring Harbor Press,N.Y.;and Ausubel et al.(eds.),1995,Current Protocols in Molecular Biology,(John Wiley&Sons,N.Y.)中。
在一种典型的方法中,使用从SEQ ID NO:2获得的探针,从由选用生物构建的cDNA文库中筛选出与SEQ ID NO:2同源的多核苷酸。探测到与SEQ ID NO:2同源的转录子后,可从由合适的菌株分离的RNA来构建cDNA文库,这利用本领域技术人员公知的标准技术来进行。或者,可筛选全基因组DNA文库。
还可例如通过使用基于本文教导的核苷酸序列设计的两个(简并)寡核苷酸引物库进行PCR来分离同源基因序列。用于反应的模板可以是染色体DNA,或通过对制备自己知能表达或怀疑能表达根据本发明的多核苷酸的菌株的mRNA的反转录获得的cDNA。PCR产物可被亚克隆并测序,以确保扩增的序列代表了本发明的序列。此外,可使用基于SEQ ID NO:2含有的序列信息设计的合成寡核苷酸引物,通过PCR来分离包括SEQID NO:2的全部或一部分的核酸分子。
然后可通过多种已知方法,将获得的PCR片段用于分离全长cDNA。例如,可对PCR片段加以标记,将其用于筛选cDNA文库或基因组文库。或者,可使用获得的PCR片段的DNA序列,应用反向PCR反应。
还可以通过诱变技术来获得同源基因序列,优选地,应用于SEQ IDNO:2。合适的诱变技术包括随机诱变(例如,易错PCR)、定点诱变和/或基因改组(gene shuffling)。例如,诱变可用于获得较之竞争性羟化酶而言对其底物具有更高的亲和性的去饱和酶多肽,和/或具有更高的的比酶活性和/或具有改变的底物特异性的去饱和酶多肽,例如,关于类鞘氨醇碱的烃链长的方面。
本发明还提供了包含第四个方面的多核苷酸的载体,包括克隆载体和表达盒。
向其中插入本发明多核苷酸的载体可以是可方便地应用于重组DNA方法的任何载体,对载体的选择通常将取决于其将引入的宿主细胞。因此,载体可以是自主复制载体,即,作为染色体外实体存在的载体,其复制不依赖于染色体复制,例如质粒、粘粒、病毒或噬菌体载体,通常提供有复制起点。或者,载体可以是下述这样的:当引入宿主细胞时,其整合进宿主细胞基因组,并且与它被整合进其中的染色体一起复制。载体可以是环状的,例如,质粒,或者线性的,例如表达盒。
优选地,本发明的多核苷酸可被插入表达盒。在表达盒中,本发明的多核苷酸与调控序列可操作地相连,所述调控序列能提供宿主细胞从其编码序列对多肽的表达。术语“可操作地相连”指下述并置,其中,所述组件以允许它们以其期望的方式发挥作用的关系存在。调控序列,例如启动子、增强子或与编码序列“可操作地相连”的另一表达调控信号以下述方式定位,所述方式使得在与调控序列相容的条件下获得多肽从其编码序列的表达。
用于给定宿主细胞的表达盒可包含从相对于编码第一个方面的多肽的序列的编码链而言5’末端至3’末端以适当的顺序互相可操作相连的下述元件:启动子序列,其能指导编码多肽的DNA序列在给定宿主细胞中的转录;可选地,信号序列,其能指导多肽从给定宿主细胞分泌进培养基;可选地,靶向序列,其用于将多肽引导至某亚细胞区室,编码多肽的成熟形式以及优选活性形式的DNA序列;以及优选地,还有转录终止区域(终止子),其能在编码多肽的DNA序列下游终止转录。
除编码本发明多肽(的天然存在的前体)的基因天然的启动子之外,可使用其它启动子来指导本发明多肽的表达。可根据其指导本发明多肽在表达宿主中表达的效率来选择启动子。
可选择与为其设计表达盒或载体的宿主细胞相容的启动子/增强子和其它表达调控信号。优选地,启动子序列从可诱导的或高度表达的基因获得。在本发明的上下文中,高度表达的基因是:其mRNA占细胞总mRNA的至少0.01%(w/w)的基因,例如,在诱导条件下的,或者其基因产物占细胞总蛋白的至少0.2%(w/w)的基因,或者,在分泌出的基因产物的情况下,可分泌至至少0.05g/l的水平。优选的高度表达的基因(从中优选获得启动子,和/或其被包含于用于整合表达盒的优选的预定靶基因座中)包括但不限于,编码糖分解酶(例如磷酸三糖异构酶(TPI)、磷酸甘油醛脱氢酶(GAPDH)、磷酸甘油酯激酶(PGK)、丙酮酸激酶(PYK)、醇脱氢酶(ADH))的基因以及编码β-半乳糖苷酶、醇(甲醇)氧化酶、延伸因子和核糖体蛋白的基因。合适的高度表达的基因的具体例子包括,例如,来自Kluyveromyces sp.的LAC4基因,来自Hansenula和Pichia的甲醇氧化酶基因(AOX和MOX),或者来自Hansenula polymorpha的质膜H(+)-ATP酶基因(PMA1)。其它酵母启动子包括可从乳糖酶或丙酮酸脱氢酶亚基1获得的强酵母启动子,或者来自鞘脂生物合成途径的基因的启动子,例如SYR2(二氢神经鞘氨醇羟化酶)、LCB1(丝氨酸棕榈酰转移酶亚基1)、LCB2(丝氨酸棕榈酰转移酶亚基2)、TSC10(酮-二氢鞘氨醇还原酶)、LAC1(神经酰胺合酶/二氢神经鞘氨醇N酰基转移酶,CoA依赖型)、LAG1(神经酰胺合酶/二氢神经1鞘氨醇N酰基转移酶,CoA依赖型)、DES1(去饱和酶)、YDH1(二氢神经酰胺酶)、YPCI(植物神经酰胺酶)、LCB4(鞘氨醇类脂激酶)、LCB5(鞘氨醇类脂激酶)。
编码多肽的多核苷酸序列下游可以是含有一处或多处转录终止位点(例如终止子)的3’非翻译区域。终止子的起点并不重要。终止子可以是对于编码多肽的多核苷酸来说天然的。但是,优选地,在酵母宿主细胞中使用酵母终止子,在有丝真菌宿主细胞中使用有丝真菌终止子。更优选地,终止子是宿主细胞(其中编码多肽的多核苷酸序列待表达的)内源的。
载体可以含有一种或多种选择标记基因,以便能从占大多数的未转化细胞中选出经转化的细胞。
优选的选择标记包括但不限于补偿宿主细胞中的缺陷或赋予对药物的抗性的那些。它们包括,例如,可用于转化大多数真菌(包括酵母)的通用选择标记,例如乙酰胺酶(amdS)基因或cDNA,或者提供对抗生素(例如G418、潮霉素B、博来霉素、nourseothricin、腐草霉素、zeocin、杀稻瘟菌素S、aureobasidinA、双丙氨膦(bialaphos)或环己酰胺)抗性的基因。或者,可使用特异性的选择标记,例如营养缺陷型标记,其需要相应的突变体宿主菌株,例如URA3(来自S.cerevisiae的,或来自其它酵母的类似基因)、LEU2、HIS3或TRP1。在一种优选的实施方式中,在将表达构建体引入之后,从经转化的宿主细胞除去选择标记,以获得能生产不含选择标记基因的多肽的经转化宿主细胞。
编码多肽的核苷酸序列优选作为表达载体或表达盒的一部分引入合适的宿主。关于用表达载体或表达盒对合适宿主的转化,转化程序是可获得的,其为本领域技术人员所公知。表达盒可作为携带有选择标记的载体的一部分用于对宿主的转化,或者表达盒可作为单独的分子与携带有选择标记的载体一起进行共转化。载体可包含一种或多种选择标记基因。
对于大多数有丝真菌和酵母而言,载体或表达构建体优选整合进宿主细胞的基因组,以获得稳定转化子。但是,对于某些酵母而言,还可获得合适的游离载体,其中可以包括表达构建体以稳定和高水平表达。其例子包括从Saccharomyces和Kluyveromyces各自的2μ和pKD1质粒获得的载体。当表达构建体整合进宿主细胞基因组的情况下,构建体整合进基因组的随机基因座,或者使用同源重组整合进预定的靶基因座,在这种情况下,靶基因座优选包含高度表达的基因。合适的高度表达的基因的大量例子在前文中提供。优选的整合靶位点是rRNA基因座(Bae et al,2003)或者PDA1、ENO1、GAPDH、SYR2的启动子区域。
在另一方面,提供了包含本发明的多核苷酸的宿主细胞。多核苷酸可以是宿主细胞基因组异源的。在本发明的上下文中,术语“异源”表示:该多核苷酸并非天然存在于宿主细胞(以其重组形式被引入宿主)基因组中,或者宿主细胞天然不生产该多肽。
合适的宿主细胞是原核微生物,例如细菌,或真核生物,例如真菌,例如酵母或有丝真菌。优选的宿主是酵母。
用于表达编码本发明的多肽的DNA序列的优选酵母宿主细胞是Saccharomyces、Kluyveromyces、Hansenula、Pichia、Yarrowia、Candida、Eremothecium属的。更优选地,酵母宿主细胞选自Saccharomyces cerevisiae、Kluyveromyces lactis、Hansenula polymorpha、Pichia pastoris、Pichia ciferrii、Yarrowia lipolytica、Candida albicans、Candida utilis、Eremothecium gossypii种构成的组。最优选的是酵母Pichiaciferrii。
在本发明的一种尤其优选的实施方式中,宿主细胞是本发明前文所述的毒素抗性细胞。
本发明的另一个方面因此提供了宿主细胞,它们是经本发明的多核苷酸或载体转化的,或包含本发明的多核苷酸或载体。优选地,所述多核苷酸被携带于用于复制多核苷酸和/或表达本发明的多肽的载体中。将选择与选用的宿主细胞相容的载体。在其中宿主细胞是本发明前文所述毒素抗性细胞的本发明实施方式中,毒素抗性表型可在转化事件之前或之后获得。
如果本发明的多核苷酸被包括进重组可复制载体,该载体可用于在相容的宿主细胞中复制多核苷酸。
因此,在另一方面,本发明提供了一种方法,用于生产根据本发明的多核苷酸,所述方法通过将本发明的多核苷酸引入可复制载体,将所述载体引入相容的宿主细胞以及在能使得所述载体复制的条件下培养所述宿主细胞来实现。可从宿主细胞回收含有根据本发明的多核苷酸的载体。合适的宿主细胞包括细菌,例如E.coli。
在另一个方面,本发明提供了一种方法,用于制备根据本发明的多核苷酸,这是通过将宿主细胞(例如,用前文所述的表达载体转化过的)在能提供本发明多肽表达的条件下培养,以及可选地,回收表达的多肽来实现的。优选地,多肽作为分泌蛋白生产,在该情况下,表达构建体中编码多肽的成熟形式的多核苷酸序列与编码信号肽的多核苷酸序列可操作地相连。
在另一个方面,本发明提供了一种方法,用于制备结构式I的类鞘氨醇碱,这是通过在能提供类鞘氨醇碱表达的条件下,以及如果必要的话,能提供本发明的多肽表达的条件下,培养根据本发明第一个方面的微生物细胞和/或经根据本发明第四个方面的多核苷酸(例如,克隆于前文所述表达盒中的)转化的宿主细胞以及可选地回收类鞘氨醇碱来实现的。
可使用本领域已知的手段来培养根据本发明的细胞。对于启动子和宿主细胞的每种组合来说,可获得有益于本发明的多肽表达的培养条件。在达到理想的细胞密度后,终止培养,使用已知手段来回收本发明的多肽或类鞘氨醇碱。
发酵培养基可包含含有碳源(例如葡萄糖、麦芽糖、糖蜜)、氮源(例如,氨、硫酸铵、硝酸铵、氯化铵、有机氮源(例如酵母提取物、麦芽提取物、蛋白胨))以及其它无机营养源(例如磷酸盐、镁、钾、锌、铁等)的已知培养基。可选地,可包括诱导剂。
对合适培养基的选择可基于对表达宿主的选择和/或基于表达构建体的调控序列和/或基于与本发明的类鞘氨醇碱的最优表达相关的需要。此类培养基是本领域技术人员已知的。
发酵可进行0.5至30天的时间。其可以是分批、连续或补料分批过程,合适地,在0至45℃范围内的温度下进行,以及,例如,在2至10之间的pH下进行。优选的发酵条件是在20至37℃的范围内的温度和/或3至9之间的pH。通常基于选用的表达宿主以及待表达的蛋白质来选择合适的条件。
发酵之后,如果必要的话,可通过离心或过滤手段将细胞从发酵培养液中移出。然后可通过传统方法回收(以及,如果想要的话,纯化以及分离)本发明的多肽和/或类鞘氨醇碱。
本发明有利地表明:根据结构式I的类鞘氨醇碱的生产可完全通过发酵来进行。特别地,其表明,鞘氨醇可通过发酵生产。或者,鞘氨醇可通过下述手段产生:从根据本发明的发酵方法生产的二氢神经鞘氨醇通过化学方法生产;或使用经修饰以表达上文所述活性二氢神经鞘氨醇去饱和酶多肽的合适生物并且补料根据本发明发酵生产的二氢神经鞘氨醇通过生物转化进行;或使用经稳定分离以及可选地经配制的活性二氢神经鞘氨醇去饱和酶,并且补料根据本发明发酵生产的二氢神经鞘氨醇通过应用生物转化来进行;或通过上述手段的任何组合来生产。
方便地,本发明的类鞘氨醇碱可与合适的赋形剂组合,以生产类鞘氨醇碱组合物。
本发明的类鞘氨醇碱可作为起始材料使用,以制备其它类鞘氨醇碱、或鞘脂,例如神经酰胺、神经节苷脂或脑苷脂。
附图说明
图1A和1B图示了三步法,其导致对整个Pichia ciferrii DES1基因座的分离。对PcDES1(I.)内部部分扩增之后,进行两轮反向PCR(II.和III.)。用于各个步骤的寡核苷酸被标出,不同阴影代表的序列展示了各个步骤中确定的DNA序列所属的PcDES1基因座的部分。与实验程序相关的限制性位点也被标出。
图2图示了质粒pCR-PcDES1上Pichia ciferrii DES1基因座。箭头表示开放读码框PcDES1(阴影箭头,从Pichia ciferrii获得)、bla(氨苄青霉素抗性基因)以及卡纳霉素抗性基因(阴影线箭头,从载体pCR4-TOPO获得)的定位和方向。灰色的条带表示E.coli复制起点的定位。还显示了克隆和限制性分析相关的限制性位点。
图3显示了对发酵培养液进行LC-UV分析之后的典型色谱,这验证了三乙酰化二氢神经鞘氨醇TriAsa的存在。
图4显示了通过从丁香假单胞霉素E抗性菌落的十种稳定分离菌生产的类鞘氨醇碱的组成(TAPS=四乙酰化植物鞘氨醇;Sa=二氢神经鞘氨醇;DiASa=二乙酰化二氢神经鞘氨醇;TriASa=三乙酰化二氢神经鞘氨醇)。
图5显示了用于在Pichia ciferrii中同源过量表达DES1的质粒pDB007。显示了PcPDA1启动子(垂直阴影线的),PcDES1基因(水平阴影线的),经修饰的PcL41*基因,其介导环己酰亚胺(cycloheximide)抗性(黑色的),5S-26S rDNA基因间间隔序列,其具有内部的PmeI识别位点(IS;格状的);氨苄青霉素抗性基因(bla;浅灰)以及E.coli复制起点(pUC ori;深灰)。还显示了克隆程序相关的限制性位点。
图6图示了对有或没有PcDES1的丁香假单胞霉素E抗性Pichiaciferrii突变体中鞘氨醇-N-酰基酯的定量。以棕榈酸(白)、硬脂酸(垂直阴影线的)、α-羟基硬脂酸(深灰)、不饱和二十四烷酸(lignocericacid) (水平阴影线的)、二十四烷酸(浅灰)以及α-羟基蜂蜡酸(黑)作为脂肪酸侧链的鞘氨醇-N-酰基酯的绝对浓度针对如下菌株显示:在对数生长阶段(log;24小时培养)和稳定阶段(stat;96小时培养),有(syrE pDB007)和没有PcDES1过量表达(syrE)的丁香假单胞霉素E抗性Pichia ciferrii突变体。
实施例1 从Pichia ciferrii F-60-10A NRRL 1031分离基因组DNA
在250ml Erlenmeyer瓶中的50ml YEPD培养基(蛋白胨2%(w/v)、酵母提取物1%(w/v)和葡萄糖2%(w/v))中,于200rpm和30℃培养Pichia ciferrii F-60-10A NRRL 1031,18小时后,OD600为1.5时收获。使用用于酵母和革兰氏阳性细菌的PUREGENEDNA Purification Kit(Gentra Systems Inc.,cat.#D-6000A)按照厂商说明书来分离染色体DNA。通过琼脂糖凝胶电泳对分离出的DNA的定性检测展示了其高分子量(>16kbp)。
实施例2扩增Pichia ciferrii DES1基因的内部部分
首先,通过用Candida albicans Des1p蛋白(GenBank acc.#EAL03178)作为模板进行TBLASTN检索,从完全的和未完成的真核基因组的NCBI数据库(www.ncbi.nlm.nih.gov/sutils/genom table.cgi)提取来自子囊菌物种的可能的二氢神经酰胺Δ4去饱和酶的氨基酸序列。该蛋白质已经过生化分析,其被证明代表神经酰胺Δ4去饱和酶(Ternes et al.,TheJournal of Biological Chemistry,277:25512-25518,2002)。使用ClustalW程序(www.ebi.ac.uk/clustalw)比对提取的序列(所有E值<2×10-52的入口)。通过在考虑具有高度偏好性的Pichia ciferrii密码子使用的情况下,将Des1p序列中高度保守的氨基酸片断翻译回去,来获得用于扩增Pichiaciferrii DES1基因的内部部分的合适的寡核苷酸。然后通过MWG Biotech(Ebersberg,Germany)合成下述寡核苷酸:
des 1-deg-fw-2LeuT:
ACW TTY CAA ATH TTN TTY TAY GC(SEQ ID NO:4)
des 1-deg-rv:
GGR AAA TCA TGA TGY TCR TTA TG(SEQ ID NO:5)
这些寡核苷酸用于按照Innis et al.,(PCR protocols.A guide to methodsand applications,1990,Academic Press)建立PCR反应,其中按照厂商说明书使用HerculaseHotstart DNA聚合酶(Stratagene,cat.#600312)。应用该方法可获得350bp的片段。按照厂商说明书,使用QIAquick PCRPurification Kit(Qiagen,cat.#28106)来纯化该片段。
实施例3 对Pichia ciferrii DES1基因的内部部分的DNA序列进行测定
使用Sanger et al.(Proceedings of the National Academy of Sciences,U.S.A.,74:5463-5467)开发的双脱氧链终止法来测定经纯化PCR产物的DNA序列。实施例1中用于PCR扩增的引物作为测序引物使用。通过Sequiserve(Vaterstetten,Germany)来进行DNA测序。使用Clone Manager 7软件(Scientific&Educational Software)将产生的序列信息(341bp,对应于SEQ ID NO:3的1336-1676位核苷酸,图1A)翻译成蛋白质,得到的氨基酸序列用作为模板,用于用NCBI的非重复蛋白质数据库进行的BLASTP检索(www.ncbi.nlm.nih.gov/BLAST/)。检索使得将Candidaalbicans Des1p(NCBI acc.#EAL03178)鉴定为数据库中最接近新序列的蛋白质,这证实了:事实上已扩增出了Pichia ciferrii DES1直向同源体的部分。
实施例4 扩增整条Pichia ciferrii DES1基因以及测定其DNA序列
为测定整条Pichia ciferrii DES1基因(编码序列、启动子区域以及3’非翻译区域)的DNA序列,接着进行反向PCR方法。按照厂商说明书,用NdeI(MBI Fermentas,cat.#ER0581)对来自Pichia ciferrii F-60-10ANRR1 1031的染色体DNA(300ng)(按照实施例1分离的)进行过夜消化,这以总体积100μl进行。按照厂商说明书,使用QIAquick PCRPurification Kit(Qiagen,cat.#28106),对经消化的DNA进行纯化。按照厂商说明书,使用1 U T4 DNA链接酶,以200μl的总体积,使用RapidDNA Ligation Kit(Roche Diagnostics,cat.#1635379)对洗脱的DNA(50μl)进行过夜连接。按照厂商说明书,使用MinElute Gel Extraction Kit(Qiagen,cat.#28604)对连接的DNA加以纯化。将1μl洗出物用作模板用于反向PCR反应,这按照Innis et al.,(PCR protocols.A guide to methods andapplications,1990,Academic Press)来进行。为此应用靶向Pichia ciferriiDES1基因的已知部分(见实施例3)的两条寡核苷酸:
des 1-IP-fw:
AAA GAI CAT CCA CCT TTA GAA ACT TAT TC(SEQ ID NO:6)
des 1-IP-rv:
GAC CTG AAC ATG GAT GTA AAG AAC CAG(SEQ ID NO:7)
扩增用HerculaseHotstart DNA聚合酶按照厂商说明书来进行。使用该程序,可获得1.6kbp的PCR产物。使用QIAquick PCR Purification Kit按照厂商说明书来纯化片段。按照实施例3所述测定该片段的DNA序列,其中使用寡核苷酸des1-IP-fw、des1-IP-rv和
SSc-IPfw1:
TTT TTA CTT TTG CGA ATC G(SEQ ID NO:8)
作为测序引物。新获得的序列信息覆盖了SEQ ID NO:3的1-1681位核苷酸,其侧翼有两个NdeI位点,这与预期一致,因为对模板DNA进行了NdeI消化。实施例3中获得的DNA序列下游没能获得新的序列信息,因为3’NdeI位点恰好直接位于该部分的下游(图1B)。为了获得Pichiaciferrii DES1基因编码区域的3’末端及其3’非翻译区域的DNA序列,必须要再进行一轮反向PCR。因此,上述实验方案重复进行,不同之处在于:用SspI(New England Biolabs,cat.#R0132S)来消化Pichia ciferrii染色体DNA,在反向PCR期间使用下述寡核苷酸,它们是MWG Biotech(Ebersberg,Germany)合成的:
des 1-IP-fw:
AAA GAT CAT CCA CCT TTA GAA ACT TAT TC(SEQ ID NO:9)
des 1-RP-BamHI:
CTG TTA TAA GTC TTT GGT GGA TCC(SEQ ID NO:10)
使用该程序,可获得1.2 kbp的PCR产物。按照厂商说明书使用QIAquick PCR Puruification Kit对片段进行纯化。按照实施例3中所述,使用寡核苷酸des1-IP-fw和des1-RP-BamHI作为测序引物,测定该片段的DNA序列。可获得852bp的新序列信息(SEQ ID NO:3中的1682-2534位核苷酸),其延伸至3’NdeI位点的下一个SspI限制性位点下游(图1B)。使用上述三步程序,可分离出总共2534bp的Pichia ciferrii DES1基因座,并可对其DNA序列进行测序(见SEQ ID NO:3和图1)。
图2描述的Pichia ciferrii DES1基因座编码长度为351个氨基酸的PcDes1p蛋白(SEQ ID NO.1)。PcDes1p与来自Candida albicans(GenBank acc.#EAL03178)和Schizosaccharomyces pombe(GenBankacc.#O59715)的Des1p蛋白分别具有62%(76%)和53%(70%)的位置氨基酸同一性(相似性)。来自Candida albicans和来自Schizosaccharomyces pombe的Des1p蛋白已被生化分析过,其在体内展示出二氢神经酰胺Δ4去饱和酶活性。PcDes1p含有对于脂肪去饱和酶/羟化酶来说典型的氨基酸序列基元(Sperling&Heinz,Biochimica and BiophysicaActa,2003,1632:1-15):HXXHH(149-153位氨基酸)和HXXHH(291-295位氨基酸)。此外,PcDes1p被预计携带有三个跨膜片断(87-109、171-193以及205-227位氨基酸;这是TMHMM工具预测的,www.cbs.dtu.dk/services/TMHMM/),其具有二赖氨酰基元作为其C末端,这可能用作为内质网驻留信号(Andersson et al.,1999,The Journal ofBiological Chemistry,274:15080-4)。生物信息学分析强烈表明,PcDES1编码Pichia ciferrii二氢神经酰胺Δ4去饱和酶。
实施例5 分离丁香假单胞霉素E抗性Pichia ciferrii突变体
为了分离出能高效生产二氢神经鞘氨醇的Pichia ciferrii菌株,进行下述程序。首先,通过将不同浓度的丁香假单胞霉素E加入到琼脂平板中,来测定Pichia ciferrii菌株对于Streptomyces syringae产生的毒性化合物丁香假单胞霉素E(Gross DC,1985,Regulation of syringomycin synthesis inPseudomonas syringae pv.syringae and defined conditions for its production.JAppl Bacteriol.58:167-174)的天然敏感性。通过将3.5mg丁香假单胞霉素E(从J.Takemoto,Utah State University获得的)溶解于1.0ml 0.001 N HCl中来制备其贮液。为了稳定,将pH保持为低于7,贮藏于-20℃。使用含有0.1至20μg/ml之间不同浓度的丁香假单胞霉素E的YEPD平板(每升:酵母提取物,10g;蛋白胨,20g;葡萄糖,20g;琼脂,20g),测定针对Pichia ciferrii菌株的最小抑制浓度(=MIC值)。在具有不同浓度的丁香假单胞霉素E的每块平板上,涂布100μl新鲜培养物(OD600nm=0.4),在30℃培养5天。
取决于菌株,在有2至10μg/ml丁香假单胞霉素E的平板上没有出现菌落,表明MIC值在2至10μg/ml之间。
为分离出丁香假单胞霉素E抗性P.ciferrii变体,选用具有10μg/ml的选择性平板,因为该浓度被证实为对于标准P.ciferrii菌株是致死性的,在这些平板上能存活的菌株将被命名为“抗性菌株”。如果使用了更低的浓度,这将导致非抗性菌落的背景生长,从而妨碍对真正的抗性突变体的分离。为分离丁香假单胞霉素E抗性P.ciferrii变体,US6204006(DeBoer L and Van der Wildt IFC,Microbial strains producing sphingolipidbases)所述的P.ciferrii的植物鞘氨醇生产菌株被预先培养于液体YEPD培养液中,直到OD600nm=1.0,将其分为不同的小份,涂布到10μg/ml的丁香假单胞霉素E平板上,在30℃培养5天。将这些平板上表现为自发的丁香假单胞霉素E抗性分离菌的25个菌落转移到标准YEPD平板,这些平板将作为所谓的主平板(master plate)。在这些YEPD平板上进行非选择性生长之后,再在具有10μg/ml或15μg/ml丁香假单胞霉素E的YEPD平板上对所有分离菌进行再次验证。最初的分离菌中能在10μg/ml甚至在15μg/ml丁香假单胞霉素E上生长的十种分离菌被命名为真正的“抗性”分离菌。这十种分离菌是在标准YEPD平板上纯化的菌落,其被贮藏以待后用。
实施例6 通过丁香假单胞霉素E抗性Pichia ciferrii突变体对二氢神经鞘
氨醇进行摇瓶生产
为评价按照实施例5所述分离的Pichia ciferrii的丁香假单胞霉素E突变体对类鞘氨醇碱的生产,将所有十种真正的抗性分离菌的预培养物接种进25ml YEPD(在100ml Erlenmeyer瓶中,无挡板),在30℃和280转/分钟下培养3天。随后,将1%的预培养物用于接种100ml LCBNB(在500ml Erlenmeyer瓶中,有挡板),在30℃和280转/分钟下培养4天。
表1.LCBNB(=长链碱营养培养液)培养基的组成
组分 |
分子式 |
每升 |
酵母提取物 |
|
0.7g |
葡萄糖 |
C6H12O6·laq |
44g |
硫酸镁·7aq |
MgSO4·7H2O |
0.88g |
氯化钙·2aq |
CaCl2·2H2O |
0.20g |
氯化铵 |
NH4Cl |
4.83g |
氯化钠 |
NaCl |
0.30g |
磷酸二氢钾 |
KH2PO4 |
1.0g |
邻苯二甲酸二氢钾 |
KH2C8H4O4 |
20g |
消泡剂(synperonic) |
-- |
0.40ml |
痕量元素 |
溶液B |
0.30ml |
维生素溶液 |
溶液B |
1.50ml |
表2.痕量和维生素贮液的组成
痕量元素 |
溶液B(g/kg) |
96%H2SO4抗坏血酸·1H2OFeSO4·7H2OZnSO4·7H2OCuSO4·7H2OMnSO4·1H2OH3BO3NaMoO4·2H2OKI |
20ml50g48g16.7g2.5g1.88g2g2g0.5g |
维生素溶液 |
溶液B |
96%H2SO4烟碱酸D-泛酸钙 |
3.6ml2g2g |
硫胺(维生素B1)吡哆醇(维生素B6)1g/kg的d-生物素溶液 |
2g0.32g0.016g |
为测定乙酰化类鞘氨醇碱(例如,长链碱,例如植物鞘氨醇、鞘氨醇或二氢神经鞘氨醇),将2.5克总培养液转移至25ml容量瓶中。然后加入2.5ml经纯化的水以及12ml丙酮。混合该容量瓶10分钟,以萃取脂肪,之后用丙酮填装至25ml。在10,000rpm对2ml该溶液加以10分钟离心。将10μl注射到柱上。使用Waters 2695 HPLC系统和来自GL Science的柱(Inertsil ODS-80A,4.6×250mm)分析样品。流动相由乙腈中的0.05%TFA构成。流速为1ml/分钟,在200nm处进行UV检测。所用条件如下:
流速 1.0ml/分钟
注射体积 10μl
柱温 环境
槽温 环境
UV 200nm
流动相 乙腈中的0.05%TFA
稀释缓冲液 水/丙酮(10∶90)
商业可获得的LCBs作为对照物被乙酰化并使用。在发酵培养液中可探测到表示为TriASa的三乙酰化二氢神经鞘氨醇(图3)。选出的丁香假单胞霉素E抗性突变体生产的(乙酰化)二氢神经鞘氨醇的典型浓度被发现为每g生物质干重10-100mg的范围内。
实施例7通过LC-MS鉴定二氢神经鞘氨醇
为验证乙酰化二氢神经鞘氨醇的存在,使用LC-MS。用乙酰化试剂对标准二氢神经鞘氨醇和植物鞘氨醇(作为对照)进行乙酰化。乙酰化试剂含有40mg 4-二甲基氨基吡啶、0.6ml乙酸酐以及0.2ml三乙胺,它们溶解于10ml不含乙醇的氯仿中。大约3-4mg类鞘氨醇碱溶解于10ml乙腈中作为标准物。向0.8ml类鞘氨醇碱溶液中加入0.2ml乙酰化试剂。室温下20-25分钟的反应时间后,注射5μl。
可探测到二氢神经鞘氨醇的三乙酰化形式(TriASa)。
LC-UV-MS细节:
仪器: LC-ZQ,来自Waters(CV18)
MS ESI/pos
毛细电压 3.66 kV
锥孔电压 24V
提取器(extractor)电压 2V
RF镜(lens)电压 0.1V
去溶剂化温度 350℃
源温度 130℃
去溶剂化气流 600L/小时
锥孔气流 120L/小时
lon能量 0.1
增效器 650V
扫描 MS模式m/z 400-800
UV 200nm
柱 YMC J’sphere ODS-H80,4m 250*4.6mm
条件:
流速 1.0ml/分钟
注射体积 5μl满环(full loop)
柱温 20℃
槽温 环境
切换阀 1分钟至废料
流动相 乙腈中的0.05%TFA
稀释缓冲液 水/丙酮(10∶90)
表3.对三乙酰化二氢神经鞘氨醇(TriASa)的MS鉴定
RT=10.02分钟三乙酰二氢神经鞘氨醇(TriASa)C24H45NO5=427,618 |
观察到的m/z值 |
可能的离子 |
466.3 |
[M+K]+ |
450.4 |
[M+Na]+ |
428.4 |
[M+H]+ |
368.4 |
[M+H-CH3COOH]+ |
实施例8 Pichia ciferrii产生的二氢神经鞘氨醇变体的链长
分离出的菌株能生产和排出Sa和/或其乙酰化形式,如实施例6和7所示。LCB的链长可根据脂肪酸合成的效率变化。已用LC-MS测定了从发酵培养液获得的二氢神经鞘氨醇(Sa)及其乙酰化形式的链长。Sa及其衍生物主要以C18的最优链长存在。
表4.(乙酰化)Sa和TAPS的驻留时间
|
驻留时间 |
链长 |
Sa(分钟) |
NASa(分钟) |
DiASa(分钟) |
TriASa(分钟) |
TAPS(分钟) |
16 |
2.1 |
6.8 |
10.5 |
14.9 |
14.0 |
17 |
2.6 |
8.6 |
12.7 |
17.2 |
16.3 |
18 |
3.1 |
10.7 |
15.1 |
19.5 |
18.6 |
19 |
3.9 |
12.9 |
17.5 |
21.8 |
20.8 |
20 |
4.8 |
15.5 |
19.9 |
24.1 |
23.0 |
表5.不同链长的(乙酰化)Sa和TAPS的比例
链长 |
Sa(%) |
NASa(%) |
DiASa(%) |
TriASa(%) |
TAPS(%) |
16 |
0.3 |
0.0 |
0.1 |
1.8 |
nd |
17 |
0.2 |
0.0 |
0.1 |
1.1 |
nd |
18 |
90.2 |
100.0 |
96.5 |
93.8 |
nd |
19 |
1.8 |
0.0 |
1.0 |
1.5 |
nd |
20 |
7.6 |
0.0 |
2.3 |
1.8 |
nd |
nd=未检测
实施例9 Pichia ciferrii产生的二氢神经鞘氨醇变体的组成
分离出的菌株能生产和排出Sa和/或其乙酰化形式。乙酰化程度可在0至3之间变动,这分别产生:
●二氢神经鞘氨醇(Sa)
●单乙酰二氢神经鞘氨醇(NASa)
●二乙酰二氢神经鞘氨醇(DiASa)
●三乙酰二氢神经鞘氨醇(TriASa)
已用LC-MS测定了从典型的发酵培养液获得的二氢神经鞘氨醇(Sa)及其乙酰化形式的相对组成。样品包含50%完全乙酰化的TriASa。第二主要部分是DiASa,较少组分是游离的Sa。
表6.两种样品中不同(乙酰化)组分的相对贡献
|
Sa(%) |
NASa(%) |
DiASa(%) |
TriASa(%) |
TAPS(%) |
样品Sa生产菌株 |
9 |
0 |
37 |
55 |
0 |
实施例10分离稳定的、生产二氢神经鞘氨醇的Pichia ciferrii突变体
因为Pichia ciferrii是二倍体物种,导致对丁香假单胞霉素E抗性的突变可能是不稳定的。为了分离出稳定的生产二氢鞘氨醇的Pichia ciferrii菌株,进行下述程序。在非选择性YEPD琼脂上对选出的丁香假单胞霉素E抗性菌落进行菌落纯化,以诱导良好生长。随后,按照实施例6所述,在摇瓶中对两种不同的最初丁香假单胞霉素E抗性菌落中的10种分离菌加以检验。
分离菌显示了产生的类鞘氨醇碱具有的不同光谱,包括仍生产四乙酰化植物鞘氨醇的细胞系(见图4;SYR21-2H)。使用该方法,可能分离出稳定并且专门性的二氢神经鞘氨醇生产细胞系。
实施例11 构建过量表达二氢神经酰胺去饱和酶基因的丁香假单胞霉素E
抗性Pichia ciferrii菌株
为构建过量表达Pichia ciferrii二氢神经酰胺去饱和酶基因的丁香假单胞霉素E抗性突变体,我们首先构建整合型DES1表达载体,其含有选择标记——用于将线性化载体同源整合进Pichia ciferrii染色体DNA的DNA序列。
选择核糖体DNA基因间间隔序列作为染色体整合位点。为插入核糖体DNA基因间间隔序列,以及在整合位点中间产生独特的PmeI识别序列,按照Innis et al.(PCR protocols.A guide to methods and applications,1990,Academic Press),通过PCR来扩增5S-26S rDNA基因间间隔序列(IS)的两个片段(Bae et al.,Integrative transformation system for themetabolic engineering of the sphingoid base-producing yeast Pichia ciferrii.2003.Applied and Environmental Microbiology;美国专利6,638,735),其中使用200ng Pichia ciferrii F-60-10A NRRL 1031的染色体DNA作为模板,以及使用下述寡核苷酸:
片段1:
pIS-NdeI-rev:
5′-TATATA
CATATGGCTAGATTGACAGAAGTCGATCAG-3′[包括5’末端的NdeI识别序列(下划线表示)](SEQ ID NO:11)
PmeI-rv:
5′-
CCCATCCACTAA
GTTTAAACACCCATACAAAATCGAGCTTCAAATC-3′
[包括与寡核苷酸PmeI-fw互补的5’末端的21bp的序列(斜体表示)以及PmeI识别序列(下划线表示)](SEQ ID NO:12)
片段2:
p-IS-NdeI-for:
5′-TATATA
CATATGCTAATCACAACAGAACATTCTCTAACG-3′[包括5’末端的NdeI识别序列(下划线表示)](SEQ ID NO:13)
PmeI-fw:
5′-
T
GTTTAAACTTAGTGGATGGGAAACCCTGTAGAACTGGGACAAAC-3′[包括与寡核苷酸PmeI-rv互补的5’末端的21bp的序列(斜体表示)以及PmeI识别序列(下划线表示)](SEQ ID NO:14)
使用QIAquick PCR Purification Kit按照厂商说明书对获得的PCR片段(分别为503和519bp)进行纯化。随后,按照Innis et al.(PCRprotocols.A guide to methods and applications,1990,Academic Press),代表Pichia ciferrii 5S-26S rDNA基因间间隔序列的5’和3’部分的两种PCR产物中的每种取10ng作为模板,通过建立PCR来获得片段1和片段2的融合,其中使用下述寡核苷酸:
p-IS-NdeI-for:
5′-TATATA
CATATGCTAATCACAACAGAACATTCTCTAACG-3′[包括5’末端的NdeI识别序列(下划线表示)](SEQ ID NO:15)
pIS-NdeI-rev:
5′-TATATA
CATATGGCTAGATTGACAGAAGTCGATCAG-3′[包括5’末端的NdeI识别序列(下划线表示)](SEQ ID NO:16)
得到的1 kbp PCR片段在其两个末端都含有NdeI识别序列,在片段中间含有PmeI识别序列。使用QIAquick PCR Purification Kit按照厂商说明书对片段进行纯化。用NdeI对PCR产物和载体pAG25(Goldstein et al.,Three new dominant gene disruption cassettes for gene disruption inSaccharomyces cerevisiae,1999,Yeast)加以切割(按照限制性内切酶的厂商说明书:New England Biolabs,Schwalbach,Germany)。进行连接,产生载体pTH-IS2-PmeI。插入的定向和正确性通过DNA测序来验证。对化学感受态Escherichia coli细胞的连接、制备和转化通过技术人员已知的方法来进行。
为构建DES1过量表达盒,使Pichia ciferrii的DES1基因处于Pichiaciferrii丙酮酸脱氢酶亚基A基因(PDA1)启动子区域的控制下。首先,使用200ng Pichia ciferrii F-60-10A NRRL 1031的染色体DNA作为模板用于按照Innis et al.(PCR protocols.A guide to methods and applications,1990,Academic Press)的PCR,扩增出PcDEs1,其中使用下述寡核苷酸:
DES1-fw:
5′-
TAGAAGTTCCAGAAACTACTTTCCAAACTTCAAAATCAACTTTATTATCAATGGCTACAATTACACATAGAAAAAACCCTTCACAAC-3′[包括5’末端与寡核苷酸PDA1-rv互补的50个碱基的序列(斜体表示)](SEQ ID NO:17)
DES1-rv:
5′-
TATA
CTGCAGGCATATTGTCAATTCTATTGTACTTGAGTATTAATGATTA-3′[包括5’末端的PstI识别序列(下划线表示)](SEQ ID NO:18)
接着,用下述寡核苷酸来扩增Picha ciferrii丙酮酸脱氢酶亚基A基因(PDA1)的启动子区域:
PDA1-fw:
5′-TATA
CTGCAGTGTGCTCTAAATTTGCCCGGTTCGCGACG-3′[包括5’末端的PstI识别序列(下划线表示)](SEQ ID NO:19)
PDA1-rv:
5′-
TGATAATAAAGTTGATTTTGAAGTTTGGAAAGTAGTTTCTGGAACTTCTA-3′(与寡核苷酸DES1-fw的5’末端互补)(SEQ ID NO:20)
使用QIAquick PCR Purification Kit按照厂商说明书对获得的PCR片段(分别为687bp和1596bp)进行纯化。随后,按照Innis et al.(PCRprotocols.A guide to methods and applications,1990,Academic Press),代表Pichia ciferrii DES1基因和Pichia ciferrii PDA1启动子区域的两种PCR产物中的每种取10ng作为模板,通过建立PCR来获得PDA1启动子区域和DES1基因的融合,其中使用下述寡核苷酸:
PDA1-fw:
5′-TATA
CTGCAGTGTGCTCTAAATTTGCCCGGTTCGCGACG-3′[包括5’末端的PstI识别序列(下划线表示)](SEQ ID NO:21)
DES1-rv:
5′-
TATA
CTGCAGGCATATTGTCAATTCTATTGTACTTGAGTATTAATGATTA-3′[包括5’末端的PstI识别序列(下划线表示)](SEQ ID NO:22)
使用该程序,可获得2.2kbp的PCR产物。使用QIAquick PCRPurification Kit按照厂商说明书对片段进行纯化。然后,用限制性内切酶PstI对PCR产物进行消化(按照限制性内切酶的厂商说明书:NewEngland Biolabs,Schwalbach,Germany),将其连接进PstI切割过的载体pTH-IS2-PmeI(见上文),得到pTH-DES1-IS2-PmeI。插入的定向和正确性通过DNA测序来验证。对化学感受态Escherichia coli细胞的连接、制备和转化通过技术人员已知的方法来进行。
构建赋予环己酰亚胺抗性的抗性表达盒作为选择性标记,它基于编码核糖体蛋白L41的Pichia ciferrii基因(Bae et al.,Integrative transformationsystem for the metabolic engineering of the sphingoid base-producing yeastPichia ciferrii.2003.Applied and Environmental Microbiology;美国专利6,638,735)。按照Innis et al.(PCR protocols.A guide to methods andapplications,1990,Academic Press)通过PCR扩增编码核糖体蛋白L41的Pichia ciferrii基因的两条片段,以获得经修饰的L41*基因,其中使用Pichia ciferrii F-60-10A NRRL 1031的染色体DNA作为模板,使用下述寡核苷酸:
片段1:
PcL41-SalI-fw:
5′-TATA
GTCGACGAATTCTCTTAAATGATGTTGG-3′[包括5’末端的SalI识别序列(下划线表示)](SEQ ID NO:23)
PcL41-internal-rv
5′-
GTTTTAGCTTTTTTATGGAAAACTTGTTTGGTTTGACCACCGTAACCGG-3′[与寡核苷酸PcL41-internal-fw的5’末端互补,并且插入点突变(C到A,粗体),代替来自Pichia ciferrii的L41蛋白的第56位氨基酸(脯氨酸到谷氨酰胺),产生环己酰亚胺抗性(Bae et al.,Integrativetransformation system for the metabolic engineering of the sphingoid base-producing yeast Pichia ciferrii.2003.Applied and Environmental Microbiology;美国专利6,638,735)](SEQ ID NO:24)
片段2:
PcL41-internal-fw:
5′-
CCGGTTA CGGTGGTCAAACCAAACAAGTTTTCCATAAAAAAGCTAAAACTACCAAAAAAGTTGTTTTACG-3′[包括5’末端与寡核苷酸PcL41-internal-rv互补的49bp的序列,插入点突变(C到A,粗体),代替来自Pichiaciferrii的L41蛋白的第56位氨基酸(脯氨酸到谷氨酰胺),产生环己酰亚胺抗性)(Bae et al.,Integrative transformation system for the metabolicengineering of the sphingoid base-producing yeast Pichia ciferrii.2003.Appliedand Environmental Microbiology;美国专利6,638,735)](SEQ ID NO:25)
PcL41-SacI-rv:
5′-TATA
GAGCTCAATTCCAATGTTTTGATCTGTC-3′[包括5’末端的SacI识别序列(下划线表示)](SEQ ID NO:26)
使用QIAquick PCR Purification Kit按照厂商说明书对获得的PCR片段(分别为1222bp和753bp)进行纯化。然后,两种PCR产物每种取10ng进行PCR,来获得代表经修饰的L41*基因(介导环己酰亚胺抗性)的两条片段的融合,其中使用下述寡核苷酸:
PcL41-SalI-fw:
5′-TATA
GTCGACGAATTCTCTTAAATGATGTTGG-3′(包括5’末端的SalI识别序列)(SEQ ID NO:27)
PcL4 1-SacI-rv:
5′-TATA
GAGCTCAATTCCAATGTTTTGATCTGTC-3′(包括5’末端的SacI识别序列)(SEQ ID NO:28)
使用QIAquick PCR Purification Kit按照厂商说明书对获得的1.9kbp的PCR片段进行纯化。然后,用限制性内切酶SalI和SacI对PCR产物进行消化(按照限制性内切酶的厂商说明书:New England Biolabs,Schwalbach,Germany),将其分别连接进pTH-DES1-IS2-PmeI(见上文),产生载体pDB007(图4)。插入的定向和正确性通过DNA测序来验证。对化学感受态Escherichia coli细胞的连接、制备和转化通过技术人员已知的方法来进行。
用PmeI对载体pDB007进行线性化(按照限制性内切酶的厂商说明书:New England Biolabs,Schwalbach,Germany),然后使用QIAquickPCR Purification Kit按照厂商说明书进行纯化。
对Pichia ciferrii F-60-10A NRRL 1031细胞的转化按照近来所描述的来进行(Bae et al.,Integrative transformation system for the metabolicengineering of the sphingoid base-producing yeast Pichia ciferrii.2003.ApplEnviron Microbiol.;美国专利6,638,735)。
将丁香假单胞霉素E抗性Pichia ciferrii(实施例5中所述的)培养于YEPD培养基中,至600nm处的光学密度为1至1.5。通过离心收获细胞,将其悬浮于0.1倍培养液体积的50mM磷酸盐缓冲液(pH 7.5)中,使用之前该缓冲液中已加入25mM二硫苏糖醇。在37℃培养15分钟后,用一倍培养液体积的冷稳定溶液[270mM蔗糖、10mM Tris-HCl(pH7.5)、1mM MgCl2]对细胞洗两次,将其重新悬浮于0.01倍培养液体积的稳定溶液中。将5μl线性化载体pDB007(含有1.6μg DNA)与50μl细胞混合,在冰上放置10分钟。然后将转化混合物转移到2mm电穿孔管中。电穿孔用GenePulser X细胞(Bio-Rad Laboratories,München,Germany)在500 V、50μF和700Ω下按照厂商说明书来进行。电穿孔之后,将细胞重新悬浮于500μl稳定溶液中,转移至含有2ml YPD培养基的培养管中。细胞在30℃过夜再生后,将再生培养物的小份涂布到含有每ml 0.5μg环己酰亚胺的YPD平板上。在30℃培养7天后,出现数十个菌落。
实施例12验证二氢神经酰胺去饱和酶基因表达盒的存在
进行菌落PCR,以验证用携带有Pichia ciferrii二氢神经酰胺去饱和酶基因(DES1)的质粒pDB007对丁香假单胞霉素E抗性Pichia ciferrii突变体的转化,所述基因处于Pichia ciferrii的丙酮酸脱氢酶亚基A基因(PDA1)的启动子区域控制下。
为达到该目的,在PCR中将来自实施例10的环己酰亚胺抗性菌落直接用作为模板,其中使用在PDA1启动子区域结合的一条寡核苷酸(PDA1-DES1-fw),以及在DES1基因结合的另一条(PDA1-DES1-rv),仅在携带有处于PDA1启动子控制下的DES1基因的转化子中产生402bp的片段:
PDA1-DES1-fw:
5′-CTAGGAAAGATAGGGGACAATCAAG-3′(SEQ ID NO:29)
PDA1-DES1-rv:
5′-AAGGTTCAGGTCCACAAAGTTCTG-3′(SEQ ID NO:30)
通过PCR,可在检验的所有环己酰亚胺抗性菌落中证实Pichia ciferriiPDA1启动子和Pichia ciferrii DES1之间融合的存在。
实施例13通过过量表达Pichia ciferrii二氢神经酰胺去饱和酶基因的丁香
假单胞霉素E抗性Pichia ciferrii突变体对鞘氨醇-N-酰基酯进行摇瓶生产
为检验过量表达Pichia ciferrii二氢神经酰胺去饱和酶基因的丁香假单胞霉素E抗性突变体对鞘氨醇-N-酰基酯的增加的生产,按照实施例6中关于通过丁香假单胞霉素E抗性Pichia ciferrii突变体对二氢神经鞘氨醇进行的摇瓶生产的部分所述(不同之处在于:在携带载体pDB007的丁香假单胞霉素E抗性突变体的情况下加入每ml培养基2μg的环己酰亚胺),培养携带有载体pDB007(二氢神经酰胺去饱和酶基因表达载体)的丁香假单胞霉素E抗性突变体的一个克隆以及丁香假单胞霉素E抗性亲本菌株,用于对鞘氨醇-N-酰基酯进行摇瓶生产。24小时(对数生长期)和4天(稳定期)后取样。
将10ml总发酵培养液转移至10ml离心管中,在5300xg于4℃离心10分钟,沉淀重新悬浮于1ml 0.9%(w/v)氯化钠(含有10mg/mlGlucanex(Sigma-Aldrich,Taufkirchen,Germany))中。细胞悬浮液在室温培养1小时,随后使用Soniprep MSE对细胞悬浮液进行3次超声波处理,每次10秒,中间间隔冷却。在5300xg对细胞悬浮液进行离心,使用BCA试验,按照Smith et.al.(Measurement of protein using bicinchoninicacid.Anal Biochem.1985 Oct;150(1):76-85),用牛血清清蛋白作为对照来测定上清液中的蛋白质浓度。向800μl含有300μg蛋白质的上清液中,加入3ml氯仿/乙醇混合物(1∶2的比例)。剧烈混合达成单相之后,将样品在室温保持1小时。然后通过加入1ml氯仿和1ml蒸馏水使相分离。剧烈混合之后,在13000xg于室温下对样品进行15分钟的离心。分离出较低的含脂肪氯仿相,通过真空离心进行蒸发(Christ Vakuumzentrifuge,Christ AG,Osterode)。
实施例14 通过ESI-MS/MS在过量表达二氢神经酰胺去饱和酶基因的丁
香假单胞霉素E抗性Pichia ciferrii突变体中定量和表征鞘氨醇-N-酰基酯
使用电喷雾离子化串联质谱(ESI-MS/MS)测定按照实施例12制备的细胞提取物中鞘氨醇-N-酰基的浓度。
ESI-MS/MS细节:
仪器: Quattro Ultima(Micromass)
MS ESI/pos
毛细电压 3.5kV
锥孔电压 50V
RF1镜电压 0.1V
孔电压 0.0V
RF2镜电压 0.6V
去溶剂化温度 300℃
源温度 100℃
去溶剂化气流 660L/小时
锥孔气流 100L/小时
碰撞能量 25eV
碰撞气压 1.0-3Torr
lon能量1 0.5
lon能量2 1.0
增效器 650V
亲本离子扫描 m/z 400-800范围内,m/z 264.2
LC条件:
流速 0.05ml/分钟
注射体积 20μl满环
槽温 7℃
流动相 含10mM甲酸铵的甲醇
使用该方法,可展示:过量表达Pichia ciferrii二氢神经酰胺去饱和酶基因的丁香假单胞霉素E抗性突变体较之相应的亲本菌株能生产出至少两倍的鞘氨醇-N-酰基(图5)。酰基残基被测定为几乎排他性地代表α-羟基硬脂酸和蜂蜡酸(图5)。N-α-羟基-硬脂酰-鞘氨醇以163ng/mg细胞蛋白质的量存在,α-羟基-蜂蜡酰-鞘氨醇以392ng/mg细胞蛋白质的量存在。加起来,我们发现相对于每mg蛋白质有至少550ng的鞘氨醇-N-酰基酯。由于蛋白质相对总细胞干重的比例被测定为每g细胞干重520mg蛋白质,鞘氨醇-N-酰基酯的总量为每g细胞干重0.29mg。
序列表
<110>科斯莫费尔姆有限公司
<120>二氢神经酰胺去饱和酶
<130>7729WO
<160>30
<170>PatentIn version 3.1
<210>1
<211>351
<212>PRT
<213>Pichia ciferrii
<400>1
Met Ala Thr Ile Thr His Arg Lys Asn Pro Ser Gln Pro Ile Thr Phe
1 5 10 15
Gln Thr Pro Pro Ala Asp Ala Pro Ile Glu Lys Leu Asn Asp Phe Tyr
20 25 30
Trp Thr Asn Glu Thr Glu Pro His Thr Ile Arg Arg Lys Leu Ile Leu
35 40 45
Lys Lys Tyr Pro Lys Ile Thr Glu Leu Cys Gly Pro Glu Pro Leu Thr
50 55 60
Lys Tyr Ile Ile Phe Gly Val Val Ser Leu Gln Leu Ser Ile Ala Tyr
65 70 75 80
Tyr Leu Arg Asn Thr Pro Phe Leu Ser Trp Lys Phe Phe Leu Leu Ser
85 90 95
Tyr Ile Ile Gly Ala Thr Ala Asn Gln Asn Val Phe Leu Ala Ile His
100 105 110
Glu Leu Thr His Asn Leu Ala Phe Lys Lys Pro Leu His Asn Lys Leu
115 120 125
Tyr Ala Ile Phe Thr Asn Ile Pro Ile Gly Ile Pro Tyr Ser Ala Ser
130 135 140
Phe Gln Pro Tyr His Gln Leu His His Lys Tyr Leu Gly Asp Glu Val
145 150 155 160
Leu Asp Thr Asp Val Pro Thr Lys Tyr Glu Ala Ile Val Leu Ser Asn
165 170 175
Val Leu Gly Lys Ser Phe Phe Ala Thr Phe Gln Ile Leu Phe Tyr Ala
180 185 190
Leu Arg Pro Met Phe Ile Thr Gln Ile Lys Phe Thr Tyr Ile His Leu
195 200 205
Leu Asn Val Leu Val Gln Leu Phe Val Asp Phe Leu Ile Val Lys Tyr
210 215 220
Trp Gly Trp Lys Ser Leu Ser Tyr Phe Ile Phe Ser Ser Phe Leu Ala
225 230 235 240
Gly Ser Leu His Pro Cys Ser Gly His Phe Ile Ala Glu His Tyr Ile
245 250 255
Met Asp Pro Pro Lys Thr Tyr Asn Arg Tyr Lys Asp His Pro Pro Leu
260 265 270
Glu Thr Tyr Ser Tyr Tyr Gly Ala Leu Asn Leu Val Thr Trp Asn Val
275 280 285
Gly Leu His Asn Glu His His Asp Phe Pro Tyr Val Ala Trp Ser Lys
290 295 300
Leu His Lys Leu Asn Glu Val Ala Asn Glu Phe Tyr Cys Asp Leu Pro
305 310 315 320
Lys His Asp Ser Trp Thr Met Val Ile Val Asn Phe Ile Leu Asp Lys
325 330 335
Asn Val Leu Leu Tyr Asn Arg Val Lys Arg Glu Thr Ala Lys Lys
340 345 350
<210>2
<211>1056
<212>DNA
<213>Pichia ciferrii
<400>2
atggctacaa ttacacatag aaaaaaccct tcacaaccaa taactttcca aacacctcca 60
gcagatgctc caattgaaaa attaaatgat ttttattgga caaatgaaac tgaacctcat 120
acaattagaa gaaaattaat attgaaaaaa tatccaaaaa ttacagaact ttgtggacct 180
gaacctttaa ctaaatatat tattttcgga gttgtttcat tacaattatc aattgcttat 240
tatttaagaa atactccatt tttaagttgg aaattctttt tgttaagtta tataattggt 300
gctactgcaa atcaaaatgt ctttttagct attcatgaat taactcataa tttagcattt 360
aaaaaaccat tacataacaa attatatgca attttcacaa atattccaat tggtatacct 420
tattcagctt ctttccaacc ttatcatcaa ttacatcata aatatttagg tgatgaagtt 480
ttagatactg atgtcccaac aaaatatgaa gctatagttt tatcaaatgt cttggggaaa 540
tcattttttg caactttcca aatcttattt tatgctttaa gaccaatgtt tattacacaa 600
attaaattta cttatattca tttacttaac gtcttggttc aactatttgt tgatttctta 660
attgtgaaat actggggttg gaaatcatta agttatttca tctttagttc atttttagct 720
ggttctttac atccatgttc aggtcatttc attgctgaac attatatcat ggatccacca 780
aagacttata acagatataa agatcatcca cctttagaaa cttattcata ttatggtgcc 840
ttaaatttag ttacatggaa tgttggtcta cataatgaac atcatgattt cccatatgtt 900
gcttggtcaa aacttcataa attgaatgaa gttgctaatg agttttattg tgatttacca 960
aaacatgatt catggactat ggttattgtt aacttcattc ttgataaaaa tgtcttatta 1020
tacaatagag ttaaaagaga aactgcaaag aaataa 1056
<210>3
<211>2534
<212>DNA
<213>Pichia ciferrii
<400>3
catatggtat tattctaatt atacatagac aagtgttacc acaagtttct catgataaat 60
ggaaagtatt tggattatgg actttagtta acgcatttgc tgttggttat catccgattc 120
aaaatacttg gttacaacta aactgtgatt ctccacagga aagaagtatt tcaattgcac 180
tttgggtaat gtttgccatg attggactaa tgagtggatc tcagttgttt agacaagatg 240
ataaaccttt atatcaaaag ggaactttag ccatgatttg tatggttttt ggaggattcc 300
tcatatcctt gggacagtat ctcttatact atcatctaaa caggaaaaag caatcaaatg 360
agcgtaaatg gctattataa aatgatattt gactcattaa tttgtgaata ttttgtagtt 420
tatactgatt acataaccat gacataagca aatcaggaac gttttttttt ttatttttat 480
ttttattttt acttttgcga atcgcctcgt ttaaaacgtt taaaaaacca aaaatttaat 540
tgttttctat taacatcagc tcattttaat tgtatttaaa gaacagctca actttttctt 600
tgaaaggaag atcagactac aaatttgtca aactccaaaa ctcctattta tacacagaga 660
aattcttttt tctctttttc cattcattta tacccctaat atcattggat ctcaaaaaag 720
ttgttattcg agatctgaat ctggatctat attatattaa taaaaagatt ccaaaagctc 780
atcatggcta caattacaca tagaaaaaac ccttcacaac caataacttt ccaaacacct 840
ccagcagatg ctccaattga aaaattaaat gatttttatt ggacaaatga aactgaacct 900
catacaatta gaagaaaatt aatattgaaa aaatatccaa aaattacaga actttgtgga 960
cctgaacctt taactaaata tattattttc ggagttgttt cattacaatt atcaattgct 1020
tattatttaa gaaatactcc atttttaagt tggaaattct ttttgttaag ttatataatt 1080
ggtgctactg caaatcaaaa tgtcttttta gctattcatg aattaactca taatttagca 1140
tttaaaaaac cattacataa caaattatat gcaattttca caaatattcc aattggtata 1200
ccttattcag cttctttcca accttatcat caattacatc ataaatattt aggtgatgaa 1260
gttttagata ctgatgtccc aacaaaatat gaagctatag ttttatcaaa tgtcttgggg 1320
aaatcatttt ttgcaacttt ccaaatctta ttttatgctt taagaccaat gtttattaca 1380
caaattaaat ttacttatat tcatttactt aacgtcttgg ttcaactatt tgttgatttc 1440
ttaattgtga aatactgggg ttggaaatca ttaagttatt tcatctttag ttcattttta 1500
gctggttctt tacatccatg ttcaggtcat ttcattgctg aacattatat catggatcca 1560
ccaaagactt ataacagata taaagatcat ccacctttag aaacttattc atattatggt 1620
gccttaaatt tagttacatg gaatgttggt ctacataatg aacatcatga tttcccatat 1680
gttgcttggt caaaacttca taaattgaat gaagttgcta atgagtttta ttgtgattta 1740
ccaaaacatg attcatggac tatggttatt gttaacttca ttcttgataa aaatgtctta 1800
ttatacaata gagttaaaag agaaactgca aagaaataaa atccataaaa ttatcattat 1860
ttataaacta tatatgtacg aattgggctg gagaatagag gtataacaaa atatacaaaa 1920
catatcatta tttatacgaa aattgtagtc accagatagt catctaaaat gctgacatgt 1980
aactgtcgtc gtattcgttc aatttgatgt gaagtatcca tgctcaatgc tgagatcctc 2040
atacaaaaaa taattagcga aaagcaaaaa ataaaaaaaa aaaaaaacct ttaatctcct 2100
gataatttaa ctaacaaatt ttgtcaaacg gtagaaacga ttcgaacttt atcaattcta 2160
gttttgaaca agatcagttg tcacaaaaga acgaagtgtt aaacgataaa tcattgattg 2220
tcaattgtat ataaacacag acaggaaacc gttgaattcg ttgtatcttt atcaaaactt 2280
aatcattaat actcaagtac aatagaattg acaatatgcc tttcactgat caaacatcac 2340
caaatgcccc aattagggaa aagatggaag ctttaatccg tcaaaaacaa caagaaatca 2400
ctaaaggtct tgaagcttta gaaccaactg ctagattctt tgctgattct tggtctcgtg 2460
gtgaaagtgc tggaggtggt acttcatgtg ttattcaaga tggtgaagtt tttgaaaaag 2520
gtggtgtgaa tatt 2534
<210>4
<211>23
<212>DNA
<213>人工序列
<400>4
ACWTTYCAAA THTTNTTYTA YGC 23
<210>5
<211>23
<212>DNA
<213>人工序列
<400>5
GGRAAATCAT GATGYTCRTT ATG 23
<210>6
<211>29
<212>DNA
<213>人工序列
<400>6
AAAGATCATC CACCTTTAGA AACTTATTC 29
<210>7
<211>27
<212>DNA
<213>人工序列
<400>7
GACCTGAACA TGGATGTAAA GAACCAG 27
<210>8
<211>19
<212>DNA
<213>人工序列
<400>8
TTTTTACTTT TGCGAATCG 19
<210>9
<211>29
<212>DNA
<213>人工序列
<400>9
AAAGATCATC CACCTTTAGA AACTTATTC 29
<210>10
<211>24
<212>DNA
<213>人工序列
<400>10
CTGTTATAAG TCTTTGGTGG ATCC 24
<210>11
<211>36
<212>DNA
<213>人工序列
<400>11
TATATACATA TGGCTAGATT GACAGAAGTC GATCAG 36
<210>12
<211>46
<212>DNA
<213>人工序列
<400>12
CCCATCCACT AAGTTTAAAC ACCCATACAA AATCGAGCTT CAAATC 46
<210>13
<211>39
<212>DNA
<213>人工序列
<400>13
TATATACATA TGCTAATCAC AACAGAACAT TCTCTAACG 39
<210>14
<211>45
<212>DNA
<213>人工序列
<400>14
TGTTTAAACT TAGTGGATGG GAAACCCTGT AGAACTGGGA CAAAC 45
<210>15
<211>39
<212>DNA
<213>人工序列
<400>15
TATATACATA TGCTAATCAC AACAGAACAT TCTCTAACG 39
<210>16
<211>36
<212>DNA
<213>人工序列
<400>16
TATATACATA TGGCTAGATT GACAGAAGTC GATCAG 36
<210>17
<211>87
<212>DNA
<213>人工序列
<400>17
TAGAAGTTCC AGAAACTACT TTCCAAACTT CAAAATCAAC TTTATTATCA ATGGCTACAA 60
TTACACATAG AAAAAACCCT TCACAAC 87
<210>18
<211>50
<212>DNA
<213>人工序列
<400>18
TATACTGCAG GCATATTGTC AATTCTATTG TACTTGAGTA TTAATGATTA 50
<210>19
<211>39
<212>DNA
<213>人工序列
<400>19
TATACTGCAG TGTGCTCTAA ATTTGCCCGG TTCGCGACG 39
<210>20
<211>50
<212>DNA
<213>人工序列
<400>20
TGATAATAAA GTTGATTTTG AAGTTTGGAA AGTAGTTTCT GGAACTTCTA 50
<210>21
<211>39
<212>DNA
<213>人工序列
<400>21
TATACTGCAG TGTGCTCTAA ATTTGCCCGG TTCGCGACG 39
<210>22
<211>50
<212>DNA
<213>人工序列
<400>22
TATACTGCAG GCATATTGTC AATTCTATTG TACTTGAGTA TTAATGATTA 50
<210>23
<211>32
<212>DNA
<213>人工序列
<400>23
TATAGTCGAC GAATTCTCTT AAATGATGTT GG 32
<210>24
<211>49
<212>DNA
<213>人工序列
<400>24
GTTTTAGCTT TTTTATGGAA AACTTGTTTG GTTTGACCAC CGTAACCGG 49
<210>25
<211>70
<212>DNA
<213>人工序列
<400>25
CCGGTTACGG TGGTCAAACC AAACAAGTTT TCCATAAAAA AGCTAAAACT ACCAAAAAAG 60
TTGTTTTACG 70
<210>26
<211>32
<212>DNA
<213>人工序列
<400>26
TATAGAGCTC AATTCCAAT GTTTTGATCTG TC 32
<210>27
<211>432
<212>DNA
<213>人工序列
<400>27
TATAGTCGAC GAATTCTCT TAAATGATGTT GG 32
<210>28
<211>32
<212>DNA
<213>人工序列
<400>28
TATAGAGCTC AATTCCAAT GTTTTGATCTG TC 32
<210>29
<211>26
<212>DNA
<213>人工序列
<400>29
CTAGGAAAGA TAGGGGACA ATCAAG 26
<210>30
<211>25
<212>DNA
<213>人工序列
<400>30
AAGGTTCAGG TCCACAAAG TTCTG 25