CN112980710B - 一种工程菌株、其构建方法和应用 - Google Patents
一种工程菌株、其构建方法和应用 Download PDFInfo
- Publication number
- CN112980710B CN112980710B CN201911285363.3A CN201911285363A CN112980710B CN 112980710 B CN112980710 B CN 112980710B CN 201911285363 A CN201911285363 A CN 201911285363A CN 112980710 B CN112980710 B CN 112980710B
- Authority
- CN
- China
- Prior art keywords
- leu
- lys
- strain
- ala
- ser
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/37—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
- C07K14/39—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from yeasts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
- C12N15/815—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts for yeasts other than Saccharomyces
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/905—Stable introduction of foreign DNA into chromosome using homologous recombination in yeast
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
- C12P7/6436—Fatty acid esters
- C12P7/6445—Glycerides
- C12P7/6463—Glycerides obtained from glyceride producing microorganisms, e.g. single cell oil
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E50/00—Technologies for the production of fuel of non-fossil origin
- Y02E50/10—Biofuels, e.g. bio-diesel
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Mycology (AREA)
- Zoology (AREA)
- Biotechnology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Gastroenterology & Hepatology (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Cell Biology (AREA)
- Oil, Petroleum & Natural Gas (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本申请公开了一种工程菌株,所述工程菌株是脂滴大小调控菌株,所述脂滴大小调控菌株通过调控出发菌株中的LDP1或CALs基因表达下调或功能灭活获得。本申请提供了一种通过脂滴蛋白基因的敲除或敲减实现对脂滴大小的调控方法。本申请通过基因工程,实现调控脂滴大小并弱化油脂合成代谢途径,为天然产油酵母菌株工程改造,使代谢流更多地流向其他代谢途径,为萜类化合物的合成奠定了基础。
Description
技术领域
本申请涉及一种工程菌株、其构建方法和应用,属于生物技术领域。
背景技术
油脂是一种氧含量低、能量密度高、碳链长度适中的可再生资源,可以代替化石资源作为化学工业和可再生能源产业的基本加工原料,是人类从碳氢经济向碳氢氧经济过渡的重要链接,其市场潜力巨大。
微生物是自然界中分布最广泛的物种之一,其中一部分微生物能够在特定条件下(如氮源、磷源缺乏)在胞内贮存超过其细胞干重20%的油脂,其中以甘油三酯为主,具有这种表型的微生物称为产油微生物,包括细菌、酵母、霉菌、藻类等(Ratledge C and WynnJP.Adv Appl Microbiol 2002,51:1–51.)。其中产油酵母包括Rhodotorula,Candida,Cryptococcus,Rhizopus,Trichosporon和Yarrowia属中的某些菌株 (Ratledge C,WynnJP.Adv Appl Microbio l2002,51,1-51)。利用微生物转化生物质资源生产油脂,可发展成基本不依赖耕地、可连续生产、降低农业污染、资源综合利用的新技术,是形成化学品的石化资源替代品新的生产途径(赵宗保.中国生物工程杂志2005,25:8–11.)。
圆红冬孢酵母属于担子菌门异宗配合型真菌,是发酵工业中一种极为重要的微生物,并且对环境具有很强的抗逆性和鲁棒性。除了常规的碳源,它还可以利用一些其它的底物作为碳源进行发酵,包括粗甘油(Yang XB,et al.Biochem Eng2014,91:86-91.)、离子液体(Huang QT,et al.Bioresour Technol 2013,130:339-344.)以及海带渣水解液 (ZhangXB,et al.RSC Adv 2016,6:26752-26756.)等。在氮源限制条件下,胞内油脂可达细胞干重的60%以上(Li YH,et al.Enzyme Microb Technol 2007,41:312-317.)。此外,圆红冬孢酵母的异戊二烯途径非常发达,可以作为微生物细胞工厂生产β-胡萝卜素等萜类化合物。目前在圆红冬孢酵母中,功能基因的研究主要通过基因克隆、异源表达和通过CRISPR基因编辑工具来进行。
脂滴(Lipid droplets)是细胞内中性脂肪贮存的主要场所,直径从 40nm至100μm不等,广泛存在于植物、昆虫和动物细胞中。其由极性单磷脂层包裹中性脂组成的疏水核心而构成,并且表面分布有很多蛋白,成熟脂滴中含量最丰富的表面蛋白是周脂素(perilipin)。目前,大家普遍认可脂滴起源于内质网,通过“出芽模型”生成(Walther TC&Farese RV,Jr.Annu Rev Biochem 2012,81:687-714)。内质网上存在许多与油脂合成相关的蛋白(DGA、LRO等),这些蛋白催化生成的中性脂不能与内质网膜上的磷脂互溶,因此不断在磷脂层中的非极性区域积累,积累到一定程度后,内质网膜将其包裹,最终形成新的具有磷脂单分子层的细胞器-脂滴。脂滴从内质网上脱落以后,同时携带内质网膜上的相关蛋白,我们将其统称为脂滴蛋白。这些脂滴蛋白主要参与细胞代谢、蛋白合成与加工、线粒体功能与膜泡运输等功能。形成的脂滴不仅与其它细胞器存在动态相互作用,而且自身之间进行融合形成一个体积更大的脂滴。研究表明,脂滴融合主要依赖于微管动力蛋白与SNARE融合机制(Bostrom P,Andersson L,Rutberg M,et al.Nat Cell Biol 2007,9(11):1286-U139.;Bostrom P,Rutberg M, Ericsson J,et al.Arterioscl Throm Vas 2005,25(9):1945-1951.)。脂滴作为能量的存储器,普遍存在于胞质中,充当中性脂质储库和脂质代谢的中枢。
和动物的脂肪细胞一样,产油酵母合成的甘油三酯以脂滴的形式贮存在细胞内部,随着油脂积累量的增加,脂滴不断变大或相互融合,在油脂积累后期,脂滴几乎占据了整个产油酵母的细胞大小[Zhu ZW, Zhang SF,Liu HW,et al.Nat.Commun.2012,3,1112,Supplementary Figure S6]。2007年,在金龟子绿僵菌中首次鉴定了周脂素,并证明它具有保护脂滴免受降解的作用(Wang C,St Leger RJ.J Biol Chem. 2007,282(29),21110-21115)。2013年,通过多组学(multi-omic)和脂滴蛋白质组学研究,鉴定到产油酵母圆红冬孢酵母(Rhodosporidium toruloides)油脂积累期间一种新颖的周脂素样蛋白高丰度表达,并将其命名为RLDP1(R.toruloides lipid droplet protein 1,圆红冬孢酵母脂滴蛋白1),来源于圆红冬孢酵母R.toruloides CGMCC 2.1389,并发现该蛋白的丰度与油脂含量成正比(Zhu ZW,Ding YF,Gong ZW,et al. Eukaryot Cell 2015,14(3):252-264.);根据实验结果,推测rLDP1基因与产油酵母油脂积累、贮运和代谢调控密切相关,并且该蛋白定位于脂滴上。截止专利提交日,圆红冬孢酵母周脂素敲除重组菌株中代谢途径研究结果未公布,且未检索到圆红冬孢酵母脂滴相关缺陷菌株的研究。
随着从微生物中提取类胡萝卜素的兴起,红酵母作为一类天然生产类胡萝卜素的菌株逐渐引起了人们的关注。但是,野生型菌株中类胡萝卜素的含量非常低。目前通过基因工程提高β-胡萝卜素产量主要通过过表达类胡萝卜素合成途径中关键基因获得。在圆红冬孢酵母中通过2A序列连接,同时表达来源于三孢布拉霉三个β-胡萝卜素合成基因,得到的工程菌株中β-胡萝卜素的含量可以达到1.7mg/g DCW,相对于野生型菌株提高了4.5倍(Jiao X,et al.FEMS Yeast Res.2018, 18(7),foy086.)。但是,通过这种操作提高类胡萝卜素产量会受到一定的限制。因为在产油酵母圆红冬孢酵母中,即使过表达类胡萝卜素途径基因,乙酰-CoA前体还是主要流向油脂合成途径。那么弱化油脂代谢,使得代谢流更多的流向萜类合成具有重要意义。
因此,有必要提供一种调控脂滴大小并弱化油脂代谢的方法。
发明内容
根据本申请的第一方面,提供了一种工程菌株,该工程菌株中脂滴合成关键蛋白基因LDP1或CALs表达下调或功能灭活,通过观察脂滴功能缺陷菌株中脂滴的变化,进一步揭示脂滴蛋白在油脂合成及储存中的重要作用及对天然产油酵母生长和代谢途径的影响。
所述工程菌株是脂滴大小调控菌株,所述脂滴大小调控菌株通过调控出发菌株中的LDP1或CALs基因表达下调或功能灭活获得。
可选地,所述工程菌株包括ΔLDP1菌株和ΔCALs菌株中的至少一种,其中,ΔLDP1菌株的保藏编号为CGMCC:18929,ΔCALs菌株的保藏编号为CGMCC:18928。
可选地,所述脂滴大小调控菌株的出发菌株为天然产油酵母菌。
可选地,所述出发菌株包括圆红冬孢酵母Rhodosporidium toruloides、禾本红酵母Rhodotorula graminis、粘红酵母 Rhodosporidium glutinis、掷孢酵母Sporobolomyces roseus、弯曲隐球酵母Cryptococcus albidun、斯达氏油脂酵母Lipomyces starkeyi中的至少一种。
可选地,所述出发菌株表达Cas9和/或表达RNAi机制的Ago蛋白和Dicer酶基因。
根据本申请的第二方面,提供了一种工程菌株的构建方法,所述工程菌株是脂滴大小调控菌株,所述构建方法包括调控所述出发菌株中的LDP1基因或CALs基因表达下调或不功能灭活的步骤,其中,所述调控通过CRISPR/Cas9系统的基因编辑和/或RNAi机制完成。
可选地,调控所述LDP1基因功能灭活的步骤包括:构建具有 SEQ ID NO:13所示的核苷酸序列的LDP1-sgRNA载体;将所述 LDP1-sgRNA载体导入表达Cas9的工程菌株,筛选、培养后得到LDP1 功能灭活的工程菌株。
可选地,调控所述LDP1基因表达下调的步骤包括:构建具有 SEQ ID NO:15所示的核苷酸序列的LDP1-RNAi载体;将LDP1- RNAi载体导入表达RNAi机制的Ago蛋白和Dicer酶基因的菌株,筛选、培养后得到LDP1表达下调的工程菌株。
可选地,调控所述CALs基因功能灭活的步骤包括:构建具有 SEQ ID NO:14所示的核苷酸序列的CALs-sgRNA载体;将CALs- sgRNA载体导入表达Cas9的工程菌株,筛选、培养后得到CALs功能灭活的工程菌株。
可选地,调控所述CALs基因表达下调的步骤包括:构建具有 SEQ ID NO:16所示的核苷酸序列的CALs-RNAi载体;将CALs- RNAi载体导入表达RNAi机制的Ago蛋白和Dicer酶基因的菌株,筛选、培养后得到CALs表达下调的工程菌株。
可选地,所述出发菌株为天然产油酵母菌。
可选地,所述出发菌株包括圆红冬孢酵母Rhodosporidium toruloides、禾本红酵母Rhodotorula graminis、粘红酵母 Rhodosporidium glutinis、掷孢酵母Sporobolomyces roseus、弯曲隐球酵母Cryptococcus albidun、斯达氏油脂酵母Lipomyces starkeyi。
根据本申请的第三个方面,提供了一种载体试剂盒,所述载体试剂盒包括具有SEQID NO:13所示的核苷酸序列的LDP1-sgRNA载体、具有SEQ ID NO:14所示的核苷酸序列的CALs-sgRNA载体、具有SEQ ID NO:15所示的核苷酸序列的LDP1-RNAi载体、具有 SEQ IDNO:16所示的核苷酸序列的CALs-RNAi载体中的至少一种。
根据本申请的第四方面,提供给了根据本申请的第一方面提供的工程菌株或根据本申请的第二方面提供的构建方法构建的工程菌株在调控脂滴大小和油脂合成中的应用。
可选地,所述应用包括通过调控出发菌株中LDP1基因或CALs 基因的表达水平来调控脂滴大小和油脂合成。
本申请提供了一种重组脂滴缺陷酵母菌株,所述酵母的基因组敲除或敲减LDP1和CALS基因,且敲除LDP1和CALs菌株包含经重组构建表达了Cas9的工程菌株。
所述的出发菌株选自圆红冬孢酵母(Rhodosporidium toruloides)、贝吉维红冬孢酵母(Rhodosporidium babjevae),所述锁掷酵母属(Sporidiobolus)菌株选自拟粉红锁掷孢酵母(Sporidiobolus pararoseus),所述掷孢酵母属(Sporobolomyces)菌株选自粉红掷孢酵母 (Sporobolomyces roseus),所述红酵母属(Rhodotorula)菌株选自深红酵母(Rhodotorula rubra)、胶红酵母(Rhodotorula mucilaqinosa)、海滨红酵母(Rhodotorulamarina)、禾本红酵母(Rhodotorula graminis) 和粘红酵母(Rhodotorula glutinis)。
本发明中所敲除基因LDP1的详细序列及功能信息等可参见专利 CN103965304B,CN103965305B,CN103965306B,CN103965307B中详细描述。
以野生型圆红冬孢酵母NP11或表达了Cas9蛋白的圆红冬孢酵母NP11-SaCas9工程菌株作为出发菌株。
选择LDP1基因上靶位点进行载体设计为:pZPK-PGPD-HYG- Tnos-U6b-LDP1-sgRNA(Sa)。
选择CALs基因上靶位点进行载体设计为:pZPK-PGPD-HYG- Tnos-U6b-CALs-sgRNA。
选择LDP1基因第一个外显子或cDNA5’端500bp以内作为靶序列正义链和反义链,构建RNAi载体为:pZPK-PPGK-HYG-Tnos-PPGD- LDP1-sen-anti-Thsp。
选择CALs基因第一个外显子或cDNA5’端500bp以内作为靶序列正义链和反义链,构建RNAi载体为:pZPK-PPGK-HYG-Tnos-PPGD- CALs-sen-anti-Thsp。
如上,sgRNA表达载体的抗性基因使用GPD启动子及Tnos终止子,靶基因guide序列使用RNA聚合酶III型启动子U6b启动子及 (Sa)sgRNA整合至同一基因元件中。
RNAi双元表达载体抗性基因的表达使用PGK启动子及Tnos终止子,靶序列正反义链发夹结构的表达使用GPD启动子和Thsp终止子。
以上sgRNA表达载体可通过农杆菌介导转化或sgRNA表达盒线性片段,电转化方法导入到目的菌株中。
以上RNAi双元表达载体可通过农杆菌介导转化导入到目的菌株。
本发明所述表达Cas9的NP11工程菌株及敲除载体所用启动子及载体构建方法均可参见文献Jiao X,Zhang Y,Liu XJ,Zhang Q,Zhang SF,Zhao ZB.Biotechnol J,2019,1900036及专利201910005293.5中记载,基因敲除盒或基因表达盒等线性DNA片段电转化方法可参见文献Liu HD,et al.FEMS Yeast Res,2017,17,fox017。
本发明所述RNAi工程菌株构建方法可参见文献Liu XJ,Zhang Y,et al.FEMSYeast Res,2019,foz031。
本发明通过利用特定的酵母内源基因以及外源基因进行基因元件、基因模块的构建,并转入到表达CRIPR/Cas9系统的产油酵母基因组上,实现重组脂滴蛋白缺陷菌株脂滴大小调控和油脂合成减少。
其中,所涉及的酵母中的抗性标记、启动子和终止子,包括但不局限于HYG、GPD、Tnos、U6b,上述基因元件的获得可以红酵母基因组或其它携带相应元件的载体为模板,通过PCR扩增获得或进行人工基因合成。
在本发明中,上述U6b启动子为圆红冬孢酵母菌株NP11基因组中通过PCR扩增得到;而HYG抗性标记基因,GPD启动子及Tnos 终止子从载体pZPK-PGPD-HYG-Tnos通过PCR扩增得到,LDP1和 CALs基因靶位点guide序列及sgRNA(Sa)通过人工基因合成得到,在设计特异性引物进行RF克隆得到上述所用载体,具体操作参见 Jiao X,Zhang Y,Liu XJ,ZhangQ,Zhang SF,Zhao ZB.Biotechnol J, 2019,1900036。
本发明所涉及的外源基因包括SaCas9来源于金黄色葡萄球菌 (Staphylococcusaureus)通过密码子优化后人工合成并得到,SaCas9 蛋白氨基酸序列见序列SEQ ID NO:17,核苷酸序列见SEQ ID NO: 18。
通过对应的引物扩增SaCas9片段,然后通过EcoRV/SpeI双酶切目的片段与目标载体pZPK-PPGK-Ble-Tnos-PGPD-mcs-Thsp,通过 DNA Ligation Kit试剂盒连接得到pZPK-PPGK-BLE-Tnos-PGPD-SaCas9- Thsp。通过酶切连接得到的载体,直接转化到大肠杆菌电转感受态细胞中。
将上述构建的质粒通过农杆菌介导转化导入到圆红冬孢酵母,具体步骤参考方法可参见文献Lin XP,et al.FEMS Yeast Res,2014,14, 547-555。
本发明的另一个目的是提供一种构建脂滴功能缺陷菌株的方法,其中,所用酵母为红冬孢酵母属(Rhodosporidium)圆红冬孢酵母 (Rhodosporidium toruloides)。除此之外,也可以锁掷酵母属、掷孢酵母属、油脂酵母属和红酵母属改造菌株将本发明所限定的基因元件和模块根据这些菌株的已被解析的脂滴蛋白基因序列进行敲除。
在本申请中,提供了一种构建工程菌株所用脂滴蛋白敲除盒重组表达载体,LDP1基因上选择靶位点进行载体设计为pZPK-PGPD- HYG-Tnos-U6b-LDP1-sgRNA(Sa)和以CALs基因上选择靶位点进行载体设计,为pZPK-PGPD-HYG-Tnos-U6b-CALs-sgRNA(Sa)。
其中,构建RNAi工程菌株所用RNAi重组表达载体,以LDP1 基因第一个外显子的正义链和反义链进行连接形成“发夹”结构RNAi 载体:pZPK-PPGK-HYG-Tnos-PPGD-LDP1sen-anti-Thsp;相同地, CALs基因RNAi载体:pZPK-PPGK-HYG-Tnos-PPGD-CALs-sen-anti-Thsp。
在本申请中提供了一种DNA表达盒的重组载体,所述载体为游离型或者整合型载体。所述的整合型载体为农杆菌介导表达载体,或者为携带有靶基因翼侧1500-4000碱基同源重组臂的同源重组载体。其中所述农杆菌介导的双元表达载体例如,但不限于,pZPK或pPZP200,pZPK或pPZP200的详细信息参见Lin XP,et al.FEMS Yeast Res,2014,14,547-555。其中所述游离型载体选自大肠杆菌克隆载体或酵母穿梭载体。所述游离型载体例如,但不限于,pMD18-T、pUC18、 pYES2c/t或pYX212。在本申请中重组载体的宿主细胞为大肠杆菌细胞、农杆菌细胞或酵母细胞。
所述脂滴功能缺陷菌株的构建方法为ATMT和电转化方法。转化后对ΔCALs和ΔLDP1或LDP1i和CALsi工程菌株的筛选分别在添加潮霉素、诺尔斯菌素或博来霉素抗性平板上完成。所述平板培养基为YPD或YEPD加上相应抗生素。
在本申请中,一种调控脂滴大小的方法包括,将上述工程菌株或根据上述方法构建的工程菌株,接种于培养基培养活化后,接种至限氮培养基中发酵培养,发酵结束后收集菌体细胞提取油脂,并通过荧光显微镜观测脂滴大小变化。
具体地,将上述工程菌株接种于5mL种子培养基活化24h制备种子液,将种子液转接到新鲜的50mL限氮培养基,接种量为10%- 20%,发酵培养后收集菌体细胞提取油脂,并取样进行尼罗红染色荧光显微镜观察脂滴大小。
可选地,所述种子培养基组成为20g/L葡萄糖、20g/L蛋白胨或10g/L蛋白胨、10g/L酵母浸粉,pH=6.0。所述限氮培养基为70g/L 葡萄糖、0.75g/L酵母浸粉,0.1g/L硫铵、1g/L磷酸二氢钾,1.5g/L 结晶硫酸镁,痕量元素1%(V/V)(痕量元素储液组成4.0g/L结晶氯化钙,0.55g/L结晶硫酸亚铁,0.52g/L一水合柠檬酸,0.1g/L结晶硫酸锌,0.076g/L结晶硫酸锰和100μL/L 18M浓硫酸),pH=6.0。所述培养条件均为30℃、200r/min。
发酵结束后油脂提取法为酸热法、酶法或者快速萃取法。发酵结束后取1mL或适量发酵菌液,并添加尼罗红染料进行荧光观察。
本发明涉及的专用名词的术语解释如下:
LDP1基因:产油酵母脂滴蛋白编码基因,具有促进脂滴融合、生长,增加脂滴内油脂积累,稳定脂滴形态与功能,参与油脂贮运和代谢调控相关的脂滴蛋白活性。
CALs基因:是一个caleosin家族蛋白,其中caleosin是脂滴Ca2+结合蛋白,被命名为CALs,对天然产油酵母脂滴合成具有重要作用。
ATMT技术:农杆菌介导的遗传转化技术是由Ti质粒介导的,而Ti质粒上毒性基因vir主要承担转化过程中各个组分的编码和表达。Vir区上共有6个操纵子-VirA-E,G,这6个操纵子编码的蛋白质产物参与单链T-DNA的合成、加工和转移等过程。T-DNA复合物T- DNA进入细胞核后随机插入到受体细胞基因组中,造成外源DNA插入突变。
CRISPRCas9技术:有规律的成串的间隔短回文重复序列并与之相关联蛋白的免疫系统(Clustered Regularly Interspaced Short Palindromic Repeats/CRISPR-Associated Systems CRISPR/Cas9)是第三类已报道的能够进行特异性基因编辑的技术。相比于ZFN与TALEN, CRISPR系统以其操作方便、编辑高效、成本低廉等明显优势在所有的基因编辑技术中发展最快,也是目前应用最广泛的技术。
RNA干扰:RNA干扰(RNA interference,RNAi)是指在进化过程中高度保守的、由双链RNA(double-stranded RNA,dsRNA)诱发的、同源mRNA高效特异性降解的现象,是真核生物抵御病毒入侵、抑制转座子活动、调控基因表达的监控机制,也可替代基因敲除、核酶、反义核酸等进行基因沉默相关研究(赵雪萌,余祖江.河南医学研究, 2015,24(1):74-75)。目前RNAi技术因其操作简单、特异性强、高效性的特点,被广泛应用于各类分子生物学领域。
sgRNA:向导RNA(guide RNA,gRNA),也称为小向导RNA (small guide RNA,sgRNA)。是作用于动质体(kinetoplastid)体内一种称为RNA编辑(RNA editing)的后转录修饰过程中。也是一种小型非编码RNA。可与pre-mRNA配对,并在其中插入一些尿嘧啶 (U),产生具有作用的mRNA。常和Cas9匹配使用进行基因组编辑。
基因敲除技术:是指通过一定的途径使机体内特定的基因失活或缺失的技术。本专利所涉及基因敲除是通过CRISPR/Cas9系统进行基因序列编辑,使任意碱基缺失或插入所致的基因失活。
基因敲减:是指通过一定的途径使机体内特定的基因表达受到干预,从而导致表达量或者表达功能下调。本专利所涉及基因敲减是通过RNAi方法实现。
本申请能产生的有益效果包括:
1)本申请通过调控出发菌株中的LDP1或CALs基因表达下调或功能灭活,提供了一种工程菌株。
2)本申请提供的工程菌株脂滴合成关键蛋白基因LDP1和CALs 表达下调或功能灭活,显微镜观察到脂滴缺陷菌株中脂滴变小,进一步揭示脂滴蛋白在油脂合成及储存中的重要作用及对天然产油酵母生长和代谢途径的影响。
3)本申请通过首先构建LDP1-sgRNA载体、CALs-sgRNA载体、 LDP1-RNAi载体、CALs-RNAi载体,然后将载体导入出发菌株,提供了一种工程菌株的构建方法。
3)本申请还提供了构建工程菌株的载体和表达盒。
4)本申请提供了一种通过脂滴大小调控基因的敲除或敲减实现对脂滴大小表达的调控方法。本申请通过基因工程,实现调控脂滴大小并弱化油脂合成代谢途径,为天然产油酵母菌株工程改造,使代谢流更多地流向其他代谢途径,为萜类化合物的合成奠定了基础。
附图说明
图1是根据本申请实施例1和实施例2构建的LDP1-sgRNA载体、CALs-sgRNA载体组成示意图。
图2示出了根据本申请实施例5的扩增LDP1和CALs基因测序比对结果。
图3是根据本申请实施例10的ΔLDP1和ΔCALs工程菌株发酵结果图。
图4是根据本申请实施例10的ΔLDP1和ΔCALs工程菌株发酵葡萄糖消耗图。
图5是根据本申请实施例10的ΔLDP1和ΔCALs工程菌株尼罗红染色荧光显微镜图。
具体实施方式
下面结合实施例详述本申请,但本申请并不局限于这些实施例。
如无特别说明,本申请的实施例中的原料均通过商业途径购买。
本申请公开了一种脂滴缺陷型菌株及其应用,本领域技术人员可以借鉴本文内容,适当改进工艺参数实现。特别需要指出的是,所有类似的替换和改动对本领域技术人员来说是显而易见的,它们都被视为包括在本发明。本发明所述方法和应用已经通过较佳实施例进行了描述,相关人员明显能在不脱离本发明内容、精神和范围内对本文所述的方法和应用进行改动或适当变更与组合,来实现和应用本发明技术。
本发明中的“圆红冬孢酵母”,包括属于该“物种”的任何二倍体和单倍体,野生型菌株和营养缺陷型菌株。本发明中的“红冬孢酵母属、锁掷酵母属、掷孢酵母属和红酵母属”,没有具体限制,实施例包括圆红冬孢酵母(Rhodosporidium toruloides)、贝吉维红冬孢酵母 (Rhodosporidium babjevae),粉红锁掷孢酵母(Sporidiobolu parroseus),粉红掷孢酵母(Sporobolomyce roseus),深红酵母(Rhodotorula rubra),胶红酵母(Rhodotorula mucilaqinosa),海滨红酵母(Rhodotorula marina),禾本红酵母(Rhodotorula graminis)和粘红酵母(Rhodotorula glutinis)、斯达氏油脂酵母(Lipomyces starkeyi)。
下面结合附图及实施例对本发明作进一步说明,将有助于本领域的普通技术人员理解本发明,但不以任何形式限制本发明。下述实施例中所有引物合成及测序工作,如无特别说明则均由上海生工公司完成。下述实施例中的实验方法,如无特殊说明,均为常规方法。下述实施例中所用的实验材料,如无特殊说明,均为自常规生化试剂公司购买得到的。
圆红冬孢酵母R.toruloides NP11单倍体菌株,为中科院大连化学物理研究所张素芳博士以木质纤维素水解液驯化的R.toruloides Y4 (源自CGMCC 2.1389=CBS 6016=IFO 0559x IFO 0880)为母本菌株,通过产孢、冬孢子萌发、担孢子分离等操作得到单倍体NP11,具体操作方法参见Nat.Commun.2012,3,1112,R.toruloides NP11单倍体保藏于广东省微生物菌种保藏中心,保藏号为GDMCC 2.224。
圆红冬孢酵母R.toruloides CGMCC 2.1389购自中国普通微生物菌种保藏中心(CGMCC)。
禾本红酵母Rhodotorula.graminis ATCC MYA-4893来源于美国标准生物品收藏中心(ATCC)。
掷孢酵母S.roseus JCM 8242购自日本微生物保藏中心(Japan Collection ofMicroorganisms,JCM)。
粘红酵母R.glutinis ATCC 204091购自美国典型培养物保藏中心 (ATCC)。
斯达氏油脂酵母NRRL Y-11557购自NITE生物资源中心(NBRC 10381)。
PrimeSTAR DNA聚合酶等酶均购自大连TakaRa公司。
根癌农杆菌Agrobacterium tumefaciems AGL1(购自美国标准生物品收藏中心(ATCC),保藏编号为:ATCC BAA-100。
通过EVOS荧光显微镜观察进行荧光观测。
实施例1:LDP1-sgRNA载体构建
所用的质粒全部采用RF克隆方法进行构建。以质粒pZPK-PGPD- HYG-Tnos-U6b-sgRNA(Sa)(Jiao X,Zhang Y,Liu XJ,et al.Biotechnol J,2019,1900036及专利201910005293.5)为模板,利用引物Tnos- U6b-sgRNA-F/RLPD1-sgRNAR扩增得到U6b-LPD1-sgRNA片段。然后通过RF克隆的方法将片段整合到目标载体,得到质粒pZPK-PGPD- HYG-Tnos-U6b-LDP1-sgRNA(Sa)。
RF克隆:5×PCR缓冲液10.0μL,dNTPs(10mM)1.0μL,上述扩增的片段300ng作为大引物(mega-primer),20ng质粒pZPK-PGPD- HYG-Tnos-U6b-sgRNA(Sa)(Jiao X,Zhang Y,LiuXJ,et al.Biotechnol J,2019,1900036及专利201910005293.5)作为模板PrimeSTAR DNA聚合酶0.5μL,ddH2O补加至50μL,于94℃保温3min,然后于98℃保温10s,62℃10s,72℃10min,15个循环,72℃15min,4℃结束反应。
DpnI消化和电击转化:取8μL RF反应产物加入1μL DpnI(购自TaKaRa)和1μL DpnI缓冲液,混匀后在37℃作用120min去除原pZPK-PGPD-HYG-Tnos-U6b-sgRNA(Sa)(Jiao X,Zhang Y,Liu XJ,et al.Biotechnol J,2019,1900036及专利201910005293.5)质粒后,取2μL电击转化DH10B感受态细胞,感受态细胞按标准方法制备(分子克隆实验指南第三版,萨姆布鲁克著,黄培堂等译,科学出版社出版),电击转化参数:2200-2500V,400Ω,25μF,0℃,4-8ms。挑选Kan 抗性转化子进行增菌培养、质粒提取,将重组载体送上海生工公司进行测序,得到序列正确的载体。同时,该重组载体命名为pZPK-PGPD- HYG-Tnos-U6b-LDP1-sgRNA(Sa)。
构建的LDP1-sgRNA载体具有如SEQ ID NO:13所示的核苷酸序列。
LDP1-sgRNA载体组成如图1所示。
实施例2:CALs-sgRNA载体构建
载体构建方法同上。CALs基因上两个位点作为靶位点进行载体设计,分别为载体pZPK-PGPD-HYG-Tnos-U6b-CALs-sgRNA(Sa)。
构建的CALs-sgRNA载体具有如SEQ ID NO:14所示的核苷酸序列。
CALs-sgRNA载体组成如图1所示。
实施例3:LDP1-RNAi载体构建
所用RNAi载体采用酶切连接的方法构建。以PZPK表达载体 (Lin XP,et al.FEMSYeast Res,2014,14,547-555)为出发载体,此载体能够通过农杆菌介导转化的方法将目的片段转化到圆红冬孢酵母当中,是红酵母目前最常用的稳定的转化方法之一。扩增相应片段正义链和反义链,酶切的方式将它们连接起来,连接到双元表达载体上。再采用ATMT的方法将构建好的载体转入到红酵母当中进行表达。
构建RNAi载体最重要的就是要在原有的pPZK载体(Lin XP,et al.FEMS YeastRes,2014,14,547-555)上加入RNAi的片段,此片段有两部分组成,其中正义链(sen)中一大部分是和整个反义链(anti) 序列是反向互补的,其余部分作为连接两个片段的中间发夹结构部分。
RNAi正义链和反义链PCR扩增:通过PCR的方法从NP11的基因组中扩增两个片段,引物设计时在两端加入了相应的酶切位点,引物设计时目标靶位点选择是LDP1基因的第一个外显子,正向链包括了一段内含子序列作为正反向引物形成发卡结构时的中间环状(loop)结构。LPD1相应引物以基因组cDNA为模板,LDP1i-LDP1- p1(EcoRV)、LDP1i-LDP1-p2(NcoI),LDP1i-inLDP1i-p1(NcoI)、LDP1i- inLDP1i-p2(SpeI)。PCR体系:配制100μL体系,再分装成50μL进行PCR扩增,PrimeSTAR DNA聚合酶50μL,超纯水46μL,引物 LDP1i-LDP1-p1(EcoRV)/LDP1i-inLDP1i-p1(NcoI)1μL,引物LDP1i- LDP1-p2(NcoI)/LDP1i-inLDP1i-p2(SpeI)1μL,以NP11 gDNA/cDNA 模板(np11:58ng/μL)2μL。PCR(RT-PCR)扩增条件为:98℃作用 2min,98℃30s,63℃10s,72℃30s,35个循环,72℃7min, 10℃反应结束。
酶切连接片段与载体:通过对片段的酶切和连接,使用EcoRV和NcoI限制性内切酶对正义链进行双酶切,同时使用NcoI和SpeI对反义链进行双酶切,SanPrep柱式PCR产物纯化试剂盒进行产物的回收纯化,再将两个片段连接为一个片段,60μL体系混合回收好的两个片段,加入相同体积的溶液Ⅱ混合后再加入总体系一半体积的溶液I,放入16℃30min,25℃3min,10℃结束片段之间的连接后,回收两个片段的连接产物。再将这一片段两端与载体一起双酶切后连接,正义链反义链片段和pZPK载体均使用EcoRV和SpeI进行双酶切,回收纯化后,用10μL连接体系,连接条件同片段连接,最后4℃加载体闭环。制备成RNAi重组载体pZPK-PPGK-HYG-Tnos-PPGD- LDP1sen-anti-Thsp。然后采用化学转化法将RNAi重组载体转化到大肠杆菌DH5α。
无缝克隆连接片段与载体:本发明同时提供一种更为快捷的一步连接正义链、反义链和载体的方法,直接使用Takara infusion试剂盒 (货号:639645)连接并转化,经双酶切后的pZPK载体(Lin XP,et al. FEMS Yeast Res,2014,14,547-555)和PCR扩增纯化后带同源臂的正反义链片段,操作方法参考Takara infusion试剂盒说明书,反应体系如下:5×In-fusion HD Enzyme Premix 2μL,酶切线性化载体400ng,纯化后PCR正义链和反义链片段54.5-65.5ng,加入至总体积10μL 混匀,总体系可根据载体与片段的体积进行调整相应加倍至20μL。 50℃孵育15min,然后置于冰上,直接热击转化至大肠杆菌DH5α。
酶切验证:由于片段有高度反向互补序列,所以无法通过菌落 PCR的方法进行载体验证,只能通过质粒提取的方法来酶切验证。挑选转化后长出的转化子,摇床培养16h后进行质粒DNA提取。使用 SanPrep柱式质粒DNA小量抽提试剂盒(购自碧云天,货号:D0003)提取质粒,用EcoRV和SpeI构建10μL酶切体系进行验证,酶切体系组成如下:10×H Buffer1μL,EcoRV 0.4μL,SpeI 0.6μL,质粒DNA 1μg,加ddH2O至10μL,37℃酶切2h后进行琼脂糖凝胶电泳。
构建的LDP1-RNAi载体具有如SEQ ID NO:15所示的核苷酸序列。
实施例4:CALs-RNAi载体构建
载体构建方法同实施例3,构建CALs双元表达载体pZPK-PPGK- HYG-Tnos-PPGD-CALs-sen-anti-Thsp。
构建的CALs-RNAi载体具有如SEQ ID NO:16所示的核苷酸序列。
实施例5:圆红冬孢酵母脂滴功能缺陷工程菌株的构建
圆红冬孢酵母R.toruloides单倍体菌株,由中科院大连化学物理研究所张素芳博士以木质纤维素水解液驯化的R.toruloides Y4(源自 CGMCC 2.1389=CBS 6016=IFO0559x IFO 0880)为母本菌株,通过产孢、冬孢子萌发、担孢子分离等操作得到单倍体R.toruloides NP11,具体操作方法参见Nat.Commun.2012,3,1112,R.toruloides单倍体NP11保藏于广东省微生物菌种保藏中心,保藏号为GDMCC 2.224。
圆红冬孢酵母(R.toruloides)CGMCC 2.1389:购自中国普通微生物菌种保藏中心(CGMCC)。
以圆红冬孢酵母NP11为例,NP11-SaCas9工程菌株(NP11-SaCas9 工程菌株的构建方法参见Jiao X,Zhang Y,Liu XJ,Zhang Q,Zhang SF, Zhao ZB.Biotechnol J,2019,1900036及专利201910005293.5)为出发菌,构建LDP1和CALs(RHTO_05627和RHTO_03414)基因敲除菌株ΔLDP1及ΔCALs。或以NP11为出发菌,直接构建LDP1和CALs RNAi调控基因表达菌株。具体实施过程如下所述:
Rhodosporidium toruloides LDP1氨基酸序列如序列表中SEQ ID NO:1所示,Rhodosporidium toruloides LDP1核苷酸序列如SEQ ID NO:2所示,Rhodosporidiumtoruloides CALs氨基酸序列如SEQ ID NO:3所示,Rhodosporidium toruloides CALs核苷酸序列如SEQ ID NO:4所示。
1.含有pZPK质粒的农杆菌工程菌株的构建
所用引物见下表1:
首先将所获得的4个农杆菌双元表达载体(方法见实施例1、2、 3、4)采用电击转化法转化至根癌农杆菌(Agrobacterium tumefaciems) AGL1(购自美国标准生物品收藏中心ATCC,基因型AGL0 recA::bla pTiBo542DT Mop+CbR)于含有50ng/μL卡那霉素的LB平板上挑取转化子。农杆菌转化子首先采用菌落PCR的方法进行验证。验证正确的转化子,提取其中的质粒,转化至大肠杆菌中。双元载体通过大肠杆菌大量富集后送测序验证。含有测序正确质粒的农杆菌菌株为工程菌株,保存备用。
再通过ATMT或电转化方法,将构建好的LDP1-sgRNA载体线性化片段导入工程菌株NP11-SaCas9,菌体涂布于诺尔斯菌素抗性平板,将筛选得到的转化子继代培养5代进行稳定性验证;之后将稳定传代的工程菌株进行基因组DNA提取;用基因上下游引物:LDP1-F(5’-CAAACAACGAGCACAGCGACAC-3’)与LDP1-R(5’- AAACCGAGAAGAAACCCGAAC-3’)对基因组DNA进行扩增,将得到的PCR产物进行测序,得到基因缺失型ΔLDP1工程菌株,该基因缺失型ΔLDP1工程菌株保藏在位于北京市朝阳区北辰西路1号院 3号的中国微生物菌种保藏管理委员会普通微生物中心(CGMCC),保藏时间为2019年11月8日,保藏编号为CGMCC No.18929,该保藏菌种的分类命名为:圆红冬孢酵母Rhodosporidium toruloides。
同样,通过ATMT或电转化方法,将构建好的CALs-sgRNA载体线性化片段导入NP11-SaCas9,将菌体涂布于潮霉素抗性平板,将筛选得到的转化子继代培养5代进行稳定性验证;之后将稳定传代的工程菌株进行基因组DNA提取;用基因上下游引物:CALs-F(5’-ATGTCACCCTCTTACGCACAAGC-3’)与CALs-R(5’- CTTCACGGAAGGTCAAGCCGCCT-3’)对基因组DNA进行扩增,将得到的PCR产物进行测序,得到基因缺失型ΔCALs工程菌株,该基因缺失型ΔCALs工程菌株保藏在位于北京市朝阳区北辰西路1号院3号的中国微生物菌种保藏管理委员会普通微生物中心(CGMCC),保藏时间为2019年11月8日,保藏编号为CGMCC No.18928,该保藏菌种的分类命名为:圆红冬孢酵母Rhodosporidium toruloides。
ATMT转化过程大致可以分为载体构建、农杆菌活化、宿主材料制备、共转化和转化子筛选这五个步骤。首先在双元载体的T-DNA 区域间插入合适的选择标记,并转入农杆菌;含有双元载体的农杆菌工程菌株活化后用乙酰丁香酮(AS)诱导;宿主菌株经过活化后稀释到一定的浓度;将活化并诱导后的农杆菌与宿主材料混合,涂布于铺有载体介质的共培养平板上,在适宜的温度下进行共转化;将共培养的混菌转移到筛选平板上,置于宿主菌最适宜的温度下培养,至转化子出现。
2.双元载体通过ATMT导入到圆红冬孢酵母(Rhodosporidium toruloides)NP11中
取一环活化后的NP11,接于5mL YPD(葡萄糖20.0g/L,酵母提取物10.0g/L,蛋白胨20.0g/L,pH 6.0)培养液中,30℃,200r/min,过夜培养24h。用无菌水洗涤一遍后,调节至OD600=0.1-0.8,备用。含有pZPK质粒的18株农杆菌活化后,分别接于5mL含有卡那霉素(50ng/μL)和利福平(50ng/μL)的LB液体中,30℃,200r/min,培养16h。用无菌水洗涤一遍,调节至OD 600=0.1-1.6,备用。
取上述酵母及18种携带双元载体的农杆菌稀释液各400μL,分别一一混匀,直接滴于诱导平板(5mmol/L葡萄糖,0.5%甘油,1.45 g/L磷酸二氢钾,2.05g/L磷酸氢二钾,0.15g/L氯化钠,0.5g/L七水硫酸镁,66mg/L二水氯化钙,2.48g/L七水硫酸铁,0.5g/L硫酸铵, 40mmol/L MES(2-(N-吗啡啉)乙磺酸),2%琼脂粉,200μmol/L乙酰丁香酮)上(BundockP,et al.EMBO J 1995,14:3206-3214.),24-25℃,培养4天。用10mL左右的无菌水将混合菌苔洗下,3000r/min离心 5min,弃去上层主要含有农杆菌的液体,剩余的细胞用800μL无菌水重悬,取50-200μL涂布于磷酸盐限制平板(50ng/μL潮霉素、300 μg/mL头孢菌素、30g/L葡萄糖、5g/L硫酸铵、0.64g/L硫酸钾、0.08 g/L十二水合磷酸氢二钠、0.94g/L硫酸钠、1.5g/L七水硫酸镁,琼脂粉1.5g/L,PH 6.0)上,于30℃进行培养,直至转化子出现。
电转化方法(Liu HD,et al.FEMS Yeast Res,2017,17,fox017):将外源DNA电击转化到圆红冬孢酵母,首先需要构建圆红冬孢酵母的电转感受态。将圆红冬孢酵母菌株从活化的平板上挑取单克隆接种到10mL YPD培养基中,30℃,200r/min培养24h制备种子液。将种子液按照1∶100的比例接种到200mL YPD培养基中,30℃,200 r/min培养7-8h至OD600=1.0左右。4℃,4000g离心5min,弃上清。 200mL新配制的TMLSD(10mmol/L Tris-HCl(pH7.5,贮液浓度1.0 M),1.0mmol/L MgCl2(贮液浓度0.1M),100mmol/L LiOAc,270 mmol/L蔗糖,5mmol/L DTT(贮液浓度1.0M,过滤除菌分装,-20℃保存),0.22μM滤膜过滤除菌,pH7.5)。重悬细胞,4℃,4000g离心5min,弃上清。100mL新配制的TMLSD重悬细胞,25℃,50 r/min孵育60min,4℃,1300g离心5min,弃上清。100mL预冷的 TMS(10mmol/L Tris-HCl,1.0mmol/L MgCl2,270mmol/L蔗糖,0.22 μmol/L滤膜过滤除菌,pH7.5)洗涤沉淀,4℃,1300g离心5min,弃上清。重复洗涤一次。最后菌体用0.5mL预冷的TMS重悬沉淀。每100μL电转感受态分装到2mL离心管中。将3μg的DNA片段加入100μL电转感受态中,冰浴5-10min。然后将混合物转移到0.2cm 已预冷的电转杯进行电击转化,电压700V。电击后马上加入1mLTMS,30℃静置培养2h进行复壮。600g,离心2min,弃上清,再加入1mL YPD培养基,30℃200r/min培养2h再次进行复壮。600 g,离心2min,取适量的菌体涂布于相应的抗生素平板上,30℃培养直至转化子长出。
3.转化子基因型鉴定测序
基因组DNA提取方法(精编分子生物学实验指南):稳定性验证后的菌株在YPD培养基中,30℃培养24h。取2-5mL菌液,离心后用超纯水洗涤一遍。加入400μL TES缓冲液,适量玻璃珠,利用细胞破碎仪振荡1min,冰浴1min,重复2-3次。然后加入400μLTris饱和酚混合物(Tris饱和酚∶氯仿∶异戊醇=25∶24∶1),反复颠倒混匀后,室温静置5min。4℃,15000g离心10min,取200 μL转移到新的1.5mL离心管中,加入1/10体积的醋酸钠(3mol/L pH 5.2),2倍体积的冰冷的无水乙醇,-20℃沉淀30-60min。4℃, 15000g离心10min,弃上清。沉淀用冰冷的75%乙醇洗涤后,离心晾干。加入适量TE缓冲液溶解,NanoDrop测定浓度后备用。
扩增LDP1和CALs基因测序比对结果图2所示,在图2中,靶基因上有碱基缺失代表实现了该基因及其功能敲除。
4.转化子靶基因转录表达水平RT-qPCR鉴定
挑取转化子单菌落接种到10mL YPD液体培养基(葡萄糖20.0 g/L,酵母提取物10.0g/L,蛋白胨20.0g/L,pH 6.0)中,于30℃摇床培养24h,再以1∶50的体积比例将菌液分别转接到100mL YPD液体培养基中,于30℃摇床培养14h达对数生长期。在4℃下,5000 r/min离心4min,收集菌体,用液氮迅速冷冻菌体,研磨破壁(Yang F,et al.Mol Biotechnol2010,47:144-151.)。使用TakaRa公司RNAiso 试剂盒(货号:9109),并按照其标准步骤提取总RNA。RNA进行1.5% (质量/体积浓度)琼脂糖凝胶电泳,使用荧光-紫外分析仪观察鉴定,可见清晰的两条带。用紫外/可见光光谱仪分析总RNA样品,测得 OD260/OD280=1.99,表明总RNA质量很好。取1μg RNA作为模板,按照TakaRa公司PrimeScriptTM RT reagent Kit withgDNA Eraser试剂盒(货号:RR047A)标准步骤进行反转录。PCR扩增:2×rTaq mix 25.0 μL,上游引物(a-A-F50 mmol/L)1.0μL,下游引物(a-A-R:50mmol/L) 1.0μL,反转录混合液1.0μL作为模板,ddH2O补加至50μL,同时 GAPDH-F、GAPDH-R扩增GAPDH作为内参对照。
10μL的RT-qPCR反应液组成如下所示:(单位:μL)
PCR反应条件:95℃5min;95℃10s,60℃30s(40cycles); 95℃15s,55℃15s,95℃15s。
通过RT-qPCR验证,得到LDP1和ACLs基因显著下调的工程菌株。
实施例6:禾本红酵母Rhodotorula graminis ATCC MYA-4893脂滴功能缺陷工程菌株的构建
禾本红酵母(R.graminis)ATCC MYA-4893:美国标准生物品收藏中心(ATCC),分离自美国华盛顿Three ForksPark的毛果杨 (Populustrichocarpa)茎部,由FGSC提交至ATCC,等同于 R.graminisWP1或FGSC10291。
本发明所涉及的外源基因蛋白包括SaCas9来源于金黄色葡萄球菌(Staphylococcus aureus)通过密码子优化后人工合成并得到。密码子优化及全基因合成:遗传密码有64种,但生物对这些密码子的利用具有偏好性。因此在导入外源基因时,为降低其对翻译蛋白在异源系统中表达的影响,需要根据圆红冬孢酵母的密码子偏好性对外源基因进行重新设计,即密码子优化。密码子优化及全基因合成均委托苏州泓迅生物科技股份有限公司进行,并连接于pUC57载体,以干粉质粒形式保存。利用引物EcoRV-Cas9-F(5’-CCGGATATCATGCACCACCATCACCAT
CACGATAAGAAG)与Cas9-SpeI-R(5’- CGGACTAGTCTAGTGATGGTGATGGTGGTGGACCTTCCGCTTCT TCTTCGGATC-3’)扩增SaCas9片段,然后通过EcoRV/SpeI双酶切目的片段与目标载体pZPK-PPGK-BLE-Tnos-PGPD-mcs-Thsp,通过 DNA Ligation Kit试剂盒连接得到pZPK-PPGK-BLE-Tnos-PGPD- SaCas9-Thsp。通过酶切连接得到的载体,直接转化到大肠杆菌电转感受态中。
将上述构建的质粒通过农杆菌介导转化导入到禾本红酵母R. graminisATCCMYA-4893,得到ATCCMYA-4893-SaCas9工程菌株。具体步骤参考方法可参见文献JiaoX,Zhang Y,Liu XJ,Zhang Q,Zhang SF,Zhao ZB.Biotechnol J,2019,1900036及专利201910005293.5。
以禾本红酵母R.graminis ATCCMYA-4893表达SaCas9工程菌株为出发菌,构建方法见参考文献Jiao X,Zhang Y,Liu XJ,Zhang Q, Zhang SF,Zhao ZB.Biotechnol J,2019,1900036及专利201910005293.5 构建LDP1和CALs基因敲除菌株Rhodotorulagraminis ΔLDP1及 Rhodotorula graminisΔCALs。具体实施过程同实施例5。
Rhodotorula graminis rgrLDP1氨基酸序列如序列表中SEQ ID NO: 5所示;Rhodotorula graminis rgrLDP1核苷酸序列如SEQ ID NO:6 所示。
载体构建引物及基因扩增引物如下表:
荧光染色观察到工程菌株脂滴大小与出发菌株有明显差异,说明敲除脂滴蛋白基因LDP1和CALs能够调控禾本红酵母R.graminis ATCC MYA-4893菌株中脂滴大小,对油脂合成产生影响。
实施例7:掷孢酵母S.roseus JCM 8242脂滴功能因缺陷工程菌株的构建
掷孢酵母(S.roseus)JCM 8242:购自日本微生物保藏中心(Japan CollectionofMicroorganisms,JCM),分离自日本叶柳(Leaf of willow),由M.Yoshizawa提交至日本东京大学IAM培养物保藏中心(IAM Culture Collection),后移送至JCM。
pZPK-PPGK-BLE-Tnos-PGPD-SaCas9-Thsp的构建见实施例6。
pZPK-PPGK-BLE-Tnos-PGPD-SaCas9-Thsp质粒通过农杆菌介导转化导入到掷孢酵母S.roseus JCM 8242,得到S.roseus JCM 8242- SaCas9工程菌株。具体步骤参考方法可参见文献Jiao X,Zhang Y,Liu XJ,Zhang Q,Zhang SF,Zhao ZB.Biotechnol J,2019,1900036及专利 201910005293.5。
以S.roseus JCM 8242表达SaCas9工程菌株为出发菌,构建方法见参考文献JiaoX,Zhang Y,Liu XJ,Zhang Q,Zhang SF,Zhao ZB. Biotechnol J,构建LDP1和CALs基因敲除菌株S.roseus ΔLDP1及S. roseus ΔCALs。具体实施过程同实施例5。
S.roseus srLDP1氨基酸序列如SEQ ID NO:7所示,S.roseus srLDP1核苷酸序列如SEQ ID NO:8所示。
具体实施过程同实施例5。
载体构建引物及基因扩增引物如下表:
荧光染色观察到工程菌株脂滴大小与出发菌株有明显差异,说明脂滴蛋白基因LDP1和CALs能够调控掷孢酵母S.roseus JCM 8242 菌株中脂滴大小,对油脂的积累起到调控作用。
实施例8:粘红酵母Rhodotorula glutinis ATCC 204091脂滴功能缺陷工程菌株的构建
粘红酵母(R.glutinis)ATCC 204091:购自美国典型培养物保藏中心(ATCC),分离自印度土壤,由NK Yadav提交至ATCC。
pZPK-PPGK-BLE-Tnos-PGPD-SaCas9-Thsp的构建见实施例6。
pZPK-PPGK-BLE-Tnos-PGPD-SaCas9-Thsp质粒通过农杆菌介导转化导入到粘红酵母R.glutinis ATCC 204091,得到表达SaCas9工程菌株R.glutinis ATCC 204091-SaCas9。具体步骤参考方法可参见文献 Jiao X,Zhang Y,Liu XJ,Zhang Q,Zhang SF,ZhaoZB.Biotechnol J, 2019,1900036及专利201910005293.5。
以R.glutinis ATCC 204091表达SaCas9工程菌株为出发菌,构建方法见参考文献Jiao X,Zhang Y,Liu XJ,Zhang Q,Zhang SF,Zhao ZB. Biotechnol J,构建LDP1和CALs基因敲除菌株Rhodotorula glutinis -ΔLDP1及Rhodotorula glutinis ΔCALs。
Rhodotorula glutinis LDP1氨基酸序列如SEQ ID NO:9所示, Rhodotorulaglutinis LDP1核苷酸序列如SEQ ID NO:10所示。
具体实施过程同实施例5。
载体构建引物及基因扩增引物如下表:
荧光染色观察到工程菌株脂滴大小与出发菌株有明显差异,说明敲除脂滴蛋白基因LDP1和CALs能够调控粘红酵母R.glutinis ATCC 204091菌株中脂滴大小,对油脂的积累起到调控作用。
实施例9:斯达氏油脂酵母(Lipomyces starkeyi)脂滴功能缺陷工程菌株的构建
斯达氏油脂酵母NRRLY-11557购自NITE生物资源中心(NBRC 10381)。
pZPK-PPGK-BLE-Tnos-PGPD-SaCas9-Thsp的构建见实施例6。
pZPK-PPGK-BLE-Tnos-PGPD-SaCas9-Thsp质粒通过农杆菌介导转化导入到斯达氏油脂酵母L.starkeyi NRRLY-11557,得到表达 SaCas9工程菌株L.starkeyi NRRLY-11557-SaCas9。具体步骤参考方法可参见文献Jiao X,Zhang Y,Liu XJ,Zhang Q,Zhang SF,ZhaoZB. Biotechnol J,2019,1900036及专利201910005293.5。
以Lipomyces starkeyi表达CRISPR/Cas9系统工程菌株为出发菌,构建方法见参考文献Jiao X,Zhang Y,Liu XJ,Zhang Q,Zhang SF,Zhao ZB.Biotechnol J,构建LDP1和CALs基因敲除菌株Lipomyces starkeyi ΔLDP1及Lipomyces starkeyi ΔCALs。
Lipomyces starkeyi LDP1氨基酸序列如SEQ ID NO:11所示, Lipomycesstarkeyi LDP1核苷酸序列如SEQ ID NO:12所示。
具体实施过程同实施例5。
载体构建引物及基因扩增引物如下表:
荧光染色观察到工程菌株脂滴大小与出发菌株有明显差异,说明敲除脂滴蛋白基因LDP1和CALs能够调控斯达氏油脂酵母 (Lipomyces starkeyi)菌株中脂滴大小,对油脂的积累起到调控作用。
实施例10:脂滴功能缺陷菌株的摇瓶发酵
菌株:NP11-SaCas9(出发菌株,同实施例5)、实施例5制备的ΔLDP1(保藏于中国普通微生物菌种保藏中心(CGMCC)保藏编号为CGMCC 18929。)和ΔCALs工程菌株(保藏于中国普通微生物菌种保藏中心(CGMCC)保藏编号为CGMCC 18928。)。
试验方法:
种子培养基:如实施例5所述YPD培养基。
限氮培养基:30g/L葡萄糖、0.75g/L酵母浸粉,0.1g/L硫酸铵、 1g/L磷酸二氢钾,1.5g/L结晶硫酸镁,其余为水,pH=6.0。
将上述菌株接种于5mL种子培养基活化24h制备种子液,将种子液转接到新鲜的50mL限氮培养基,并设置三个生物学平行;控制初始OD=2,在30℃、200r/min条件下培养144h,发酵培养后收集菌体细胞提取油脂并对脂滴染色进行荧光观测。
油脂提取方法:取30mL发酵液,离心烘干后计算生物量。然后采用酸热法提油。干菌体中加入5mL 4M盐酸,置于78℃水浴处理1.5h。冷却后加入等体积的氯仿/甲醇溶剂,涡旋振荡5min,8000g 离心5min,将下层有机相转移至新的离心管中。上层再加入等体积的氯仿萃取,重复两次。收集的有机相中加入等体积的0.1%氯化钠溶液,涡旋振荡1min,8000g离心5min,将下层有机相转移至盛有无水硫酸钠的玻璃漏斗中进行干燥,过程中不断添加氯仿,直至无水硫酸钠上面的红色全部消失。收集油脂的油瓶通过减压蒸馏除去溶剂,称重后计算油脂产量。
荧光观测方法:取1mL发酵液,8000g离心5min,弃上清。用 1mL超纯水重悬菌体,8000g离心5min,弃上清。添加50μL 20x尼罗红染料,染色5-10min。取适量菌体至于载玻片上,EVOS荧光显微镜观察(激发波长475nm,发射波长580nm)。
工程菌发酵油脂产量及生物量结果:
试验结果:由图3和图4可知,LDP1脂滴蛋白缺陷型菌株用于弱化油脂合成时,油脂含量为0.42g/g,相比出发菌株的0.59g/g油脂产量,下降28.8%,油脂合成代谢显著被弱化。同时,ΔLDP1和ΔCALs工程菌消耗葡萄糖的速率明显下降,生物量也随之下降。本发明所述脂滴缺陷型菌株,通过荧光显微镜观察,如图5所示,可以观察到ΔLDP1和ΔCALs工程菌株经尼罗红染料染色后指示脂滴荧光,其体积相比出发菌株明显减小,说明敲除LDP1或CALs基因可以对菌株内脂滴大小进行调控,从而使工程菌株胞内代谢流发生变化,为代谢工程改造产油酵母奠定基础。
以上所述,仅是本申请的几个实施例,并非对本申请做任何形式的限制,虽然本申请以较佳实施例揭示如上,然而并非用以限制本申请,任何熟悉本专业的技术人员,在不脱离本申请技术方案的范围内,利用上述揭示的技术内容做出些许的变动或修饰均等同于等效实施案例,均属于技术方案范围内。
序列表
<110> 中国科学院大连化学物理研究所
<120> 一种工程菌株、其构建方法和应用
<130> DD190633I
<141> 2019-12-13
<160> 18
<170> SIPOSequenceListing 1.0
<210> 1
<211> 265
<212> PRT
<213> Rhodosporidium toruloides
<400> 1
Met Ala Thr Val Asn Glu Lys Gln Pro Ala Thr Asp Ala Pro Leu Ala
1 5 10 15
His Glu Thr Ala Ile His Arg Ala Leu Asp Tyr Pro Val Ile Lys Asp
20 25 30
Thr Leu Ser Thr Phe Asp His Tyr Ala His Ser His Pro Tyr Ile Ser
35 40 45
Ser Leu Tyr Ser Arg Thr Leu Ser Leu Ser Arg Gln Ile Leu Ala His
50 55 60
Val Gln Pro Val Leu Pro Leu Glu Leu Ala Asp Gln Tyr Ala Asn Lys
65 70 75 80
Thr Leu Asp Val Val Glu Lys Tyr Val Pro Gln Val Lys Met Glu Thr
85 90 95
Gly Glu Leu Ile Gly Lys Ala Arg Gly Pro Ala Asp Ala Ala Phe Gln
100 105 110
Thr Ala Gln Glu Tyr Arg Gln Gly Ile Gln Ser Arg Ile Ser Pro Val
115 120 125
Thr Asp Gln Leu Tyr Gln Arg Ile Thr Thr Ser Gln Ala His Leu Ser
130 135 140
Ser Leu Gln Asp Arg Leu Gln Lys Thr Ile Lys Gln Leu Pro His Asp
145 150 155 160
Thr Glu Ser Leu Gln Ser Thr Leu His Ser Ile Leu Asn Glu Val Asp
165 170 175
Gly Leu Val Lys Ser Ala Gln Ser Ile Pro Ala Asn Ala Gln Ala Thr
180 185 190
Ala Lys Pro Val Phe Asp Gly Val Val Glu Ala Ala Asp His Ile Arg
195 200 205
Lys Glu Val Thr Arg Thr Asp Ile Pro Met Gly Ala Arg Ala Gln Asn
210 215 220
Val Leu Thr Tyr Thr Gln Asp Arg Leu Gln Pro Val Val Glu Gln Ile
225 230 235 240
Lys Ser Phe Val Leu Lys Lys Lys Asp Glu Val Ala Glu Thr Val Glu
245 250 255
Glu Lys Glu Gly Glu Gly Glu Lys Gln
260 265
<210> 2
<211> 798
<212> DNA
<213> Rhodosporidium toruloides
<400> 2
atggccaccg tcaacgagaa gcagcccgcc accgacgcgc ccctcgcgca cgagaccgcc 60
atccaccgcg cgctcgacta ccccgtgatc aaagacaccc tctcgacctt tgaccactac 120
gcccactcgc acccctacat ctcgtccctc tactcgcgca ccctcagcct ctcgcgccag 180
atcctcgctc acgtccagcc cgtcctcccc ctcgagttgg cggaccagta cgcgaacaag 240
acgctcgatg tcgtcgagaa gtatgtcccg caggtcaaga tggagacggg agagttgatt 300
ggaaaggcga gggggcccgc cgatgccgcg ttccagacgg cccaggagta caggcaggga 360
atccagtctc gcatctcgcc cgtgacggac cagctctacc agcgcatcac gacctcgcaa 420
gcgcacctct cgtccctcca agaccgtctc caaaagacga tcaagcagct cccccacgac 480
acggagagcc tccagtctac gctccactcg atcctcaacg aggtcgacgg gttggtcaag 540
tctgctcagt cgatccccgc caacgcccaa gcgaccgcca agcccgtctt tgacggagtc 600
gtcgaggctg cggaccacat tcgcaaggag gtcactcgca ccgacatccc gatgggcgcc 660
cgcgcgcaaa acgtcctcac ctacacccag gaccgcctcc agcccgtcgt cgagcagatc 720
aagagtttcg tgctcaagaa gaaggacgag gttgccgaga ctgtcgagga gaaggagggc 780
gagggggaga agcagtga 798
<210> 3
<211> 372
<212> PRT
<213> Rhodosporidium toruloides
<400> 3
Met Ser Pro Ser Tyr Ala Gln Ala Thr Ser Ala Trp Leu Pro Ser Pro
1 5 10 15
Ser Glu Met Pro Gln Pro Asp Lys Ala Leu Leu Ala Thr Thr Glu Asp
20 25 30
Val Thr Ala Gly Lys His Ser Pro Ser Thr Ile Ala His Gly Asn Glu
35 40 45
Asn Ala Lys Val Gln Val Val Gly Glu Leu Thr Pro Pro Leu Thr Pro
50 55 60
Pro Gly Glu Lys Glu Asp Ser Ile Ala Ala Gly Glu Gly Val Arg Arg
65 70 75 80
Arg Lys Val Gly Lys Ser Ser Glu Asp Glu Glu His Asp Val Pro Gly
85 90 95
Lys Gly Phe Val Gln Ser Ile Glu Gly Thr Val Ser Ala Glu Arg Tyr
100 105 110
Val Pro Glu Asp Leu Asp Lys Arg Ile Tyr Lys Pro Trp Val Pro Arg
115 120 125
Ala Asn Ile Ala Ala Thr Pro Glu His Pro Tyr Gly Thr Thr Ala Gly
130 135 140
Gly Tyr Ala Glu Lys His Lys Asp Glu Pro Val Leu Ala Gln His Val
145 150 155 160
Ala Phe Phe Asp Lys Asp Arg Asp Asn Ile Leu Trp Pro Leu Asp Thr
165 170 175
Trp Arg Gly Phe Arg Glu Met Gly Tyr Ser Phe Phe Trp Cys Thr Phe
180 185 190
Ala Met Cys Val Ile His Phe Phe Phe Ser Trp Phe Thr Thr Pro Asn
195 200 205
Arg Ile Leu Pro Asp Pro Phe Phe Arg Val Tyr Ile Ser Asn Gly His
210 215 220
Arg Ser Lys His Gly Ser Asp Thr Ala Val Phe Asp Ser Glu Gly Arg
225 230 235 240
Phe Ile Pro Ala Lys Phe Glu Glu Ile Phe Thr Lys Phe Asp Lys Gly
245 250 255
Asn Lys Gly Gly Leu Thr Phe Arg Glu Gly Val Gln Leu Ile His Ala
260 265 270
Gln Arg Gln Ala Val Asp Pro Ile Gly Val Ala Ala Glu Cys Phe Glu
275 280 285
Trp Ala Ser Thr Tyr Leu Leu Ile Trp Pro Lys Asp Gly Ile Cys Asp
290 295 300
Lys Glu Ser Ile Arg Thr Val Tyr Asp Gly Ser Leu Phe Tyr Leu Val
305 310 315 320
Ala Asp Ala Glu Arg Gln Arg Ser Leu Ala Arg Leu Glu Ala Arg Lys
325 330 335
His Met Ser Trp Pro Ala Trp Val Trp Asp Ser Val Pro Gly Pro Trp
340 345 350
Arg Gly Trp Gly Lys Glu Asn Lys Ala Ser Gly Phe Glu Trp Thr Glu
355 360 365
Glu Lys Phe Leu
370
<210> 4
<211> 1119
<212> DNA
<213> Rhodosporidium toruloides
<400> 4
atgtcaccct cttacgcaca agctacttca gcgtggttac cctccccctc cgaaatgccg 60
caacccgaca aggctctcct cgcgacgaca gaggacgtga cggcggggaa acactctcca 120
tcgacgatcg cgcacggaaa cgagaacgca aaggtgcagg tcgttgggga gttgacgccc 180
cctcttacgc cgccgggtga gaaggaggat tcgattgcgg cgggagaggg cgtgaggagg 240
aggaaagtgg ggaagtcttc cgaggacgag gagcacgatg tcccgggcaa gggtttcgtg 300
cagagtattg aggggactgt gagtgcggaa cgctacgtcc cggaggacct cgacaagcgg 360
atctacaagc cttgggttcc gcgcgcgaac atcgctgcga cgccggagca tccgtacggc 420
acgaccgcgg gcgggtacgc ggagaagcac aaggacgagc ccgttctcgc tcagcacgtc 480
gctttcttcg acaaggaccg cgacaacatc ctgtggccgc tcgatacctg gcgcgggttc 540
cgcgagatgg ggtacagttt cttctggtgc accttcgcca tgtgtgtgat ccacttcttc 600
ttctcctggt tcaccacccc caaccgcatc ctccccgacc ccttcttccg cgtctacatc 660
tcgaacggac accgctcgaa acacggttcc gacacggccg tgtttgattc agaaggcagg 720
ttcatcccgg ctaagtttga ggagatcttt accaagttcg ataagggcaa caaaggcggc 780
ttgaccttcc gtgaaggcgt ccagctcatc cacgcccaac gccaggccgt cgacccgatc 840
ggcgtagctg ccgagtgctt cgagtgggct agcacgtact tgctgatttg gccgaaagac 900
gggatttgcg acaaagagtc catccgtaca gtctacgacg gttcgctctt ctacctcgtc 960
gccgacgcag aacgccaacg ctccctcgcg cgcctcgaag ctcgcaaaca catgtcctgg 1020
cccgcttggg tttgggattc ggtgcccggt ccgtggaggg ggtgggggaa ggagaacaag 1080
gcgagtgggt ttgagtggac ggaggagaag ttcctgtaa 1119
<210> 5
<211> 279
<212> PRT
<213> Rhodotorula graminis
<400> 5
Met Ser Ala Ala Thr Glu Gln Ala Pro Ser Thr Thr Ile Asn Gly Asp
1 5 10 15
Thr Ala His Glu Thr Ala Leu His Arg Val Thr Gly Tyr Pro Leu Val
20 25 30
Lys Asp Thr Leu Ser Thr Ala His Ala Tyr Val Glu Glu Arg Pro Tyr
35 40 45
Leu Ser Ser Leu Tyr Ala Arg Ala Glu Gln Leu Ser Leu Ala Ile Leu
50 55 60
His Arg Leu Glu Pro Leu Gln Lys Arg Leu Ile Pro Leu Asp Gln Val
65 70 75 80
Asp Ser Tyr Ala Asn Ala Gly Leu Asp Tyr Leu Glu Lys Arg Val Pro
85 90 95
Gln Val Lys Leu Glu Thr Asn Glu Leu Leu Gly Gln Ala Arg Lys Pro
100 105 110
Ala Asp Ala Ala Tyr Gly Leu Ala Gln Asp Tyr Asn Lys Ala Phe Gln
115 120 125
Gln Arg Phe Ser Pro Leu Ala Glu Pro Val Tyr Gln Arg Leu Ala Asp
130 135 140
Gly Arg Ala Thr Leu Val Ser Leu Gln Asp Arg Leu Ala Lys Thr Ile
145 150 155 160
Ala Asp Phe Pro His Asp Lys Gln Ser Leu Gln Ser Thr Leu Asp Ser
165 170 175
Leu Ser Asn Glu Leu Glu Ala Tyr Val Asp Thr Ala Lys Ser Leu Pro
180 185 190
Ser His Ala Gln Glu Thr Ala Lys Pro Tyr Leu Ala Ala Ala Gln Asp
195 200 205
Val Leu Gly Asp Val Thr Lys Glu Leu Gln Arg Thr Asp Val Pro Leu
210 215 220
Gly Thr Lys Ala Ser Asn Val Leu His Tyr Ser Gln Asp Lys Leu Ala
225 230 235 240
Pro Val Leu Asp Tyr Phe Lys Thr Phe Val Val Lys Lys Lys Asp Glu
245 250 255
Ala Ser Asp Lys Val Asp Glu Val Lys Asp Lys Ala Asp Glu Ala Ser
260 265 270
Ser Ser Ser Ser Ser Ser Ala
275
<210> 6
<211> 840
<212> DNA
<213> Rhodotorula graminis
<400> 6
atgtctgccg ccaccgagca ggccccgagc accaccatca acggcgacac ggcccacgag 60
actgccctcc accgtgtcac gggctaccct ctcgtcaagg acacgctctc gaccgcgcac 120
gcctacgtcg aggagcgccc ttacctctcg tcgctctacg cccgcgccga gcagctctcg 180
ctcgccatcc tgcaccgcct cgagcccctc cagaagcgcc tcatcccgct cgaccaggtc 240
gacagctacg ccaacgccgg cctcgactac ctcgagaagc gcgtgcccca ggtcaagctc 300
gagaccaacg agctcctcgg ccaggcgcgc aagcccgccg acgccgccta cggcctcgcg 360
caggactaca acaaggcctt ccagcagcgc ttctcgcctc tcgccgaacc ggtgtaccag 420
cgcctcgccg acggccgtgc gaccctcgtc agcctccagg accgcctcgc caagacgatc 480
gccgacttcc ctcacgacaa gcagtcgctc cagtcgacgc tcgactcgct ctcgaacgag 540
ctcgaggcgt acgtcgacac ggccaagtcg ctcccgtcgc acgcccagga gacggccaag 600
ccgtacctcg cggcggcgca ggacgtcctc ggcgacgtga ccaaggagct gcagcgcacc 660
gacgtcccgc tcggcaccaa ggcgtcgaac gtgctccact actcgcagga caagctcgcg 720
cccgtcctcg actacttcaa gacgttcgtc gtcaagaaga aggacgaggc gagcgacaag 780
gtcgacgagg tcaaggacaa ggcggacgag gcgtcctcgt cgtcctcgtc gtcggcgtga 840
<210> 7
<211> 241
<212> PRT
<213> S.roseus
<400> 7
Met Glu Gln Thr Phe Pro Ala Thr Lys Glu Thr Ser Leu Gln Arg Ala
1 5 10 15
Tyr Gly Tyr Pro Val Val Lys Asp Thr Leu Asp Thr Ala His Ser Tyr
20 25 30
Val Ala Ala Asn Ser Tyr Thr Asn Ala Tyr Glu Arg Ala Ala Asn Leu
35 40 45
Ala Ala Ala Ile Leu His Arg Leu Glu Pro Leu Gln Lys Arg Leu Pro
50 55 60
Leu Glu Arg Val Asp Gly Tyr Ala Asn Gly Ala Leu Asp Tyr Val Glu
65 70 75 80
Lys Arg Phe Pro Ala Val Lys Ser Glu Thr Ser Glu Ile Val Gly Lys
85 90 95
Pro Arg Gln Ala Ala Asp His Ala Val Ala Ala Phe Tyr Ala Gln Ile
100 105 110
Gly Lys Ser Gln Glu Thr Leu His Gly Leu Gln Asp Arg Leu Ala Lys
115 120 125
Thr Val Ala Lys Phe Pro His Asp Gln Ala Ser Leu Lys Lys Thr Leu
130 135 140
Ser Glu Ile Ser Ala Glu Leu Asp Ser Val Val Lys Ala Val Pro Ser
145 150 155 160
Leu Pro Ala Gln Ala Gln Ser His Ala Gln Pro Tyr Leu Asp Gly Leu
165 170 175
Gly Glu Ala Ala Leu Tyr Val Lys Lys Glu Val Thr Arg Ser Asp Ala
180 185 190
Thr Val Ser Glu Lys Ala Gln Asn Ile Leu Asn Tyr Ser Gln Glu Lys
195 200 205
Leu Thr Pro Val Leu Glu Ser Val Lys Ala Tyr Ala Phe Lys Thr Lys
210 215 220
Lys Gln Val Glu Glu Lys Gly Glu Glu Val Lys Glu Thr Thr Asn Ser
225 230 235 240
Asp
<210> 8
<211> 726
<212> DNA
<213> S.roseus
<400> 8
atggaacaaa ctttccccgc caccaaagag acttcgcttc aacgcgccta cggctaccct 60
gtcgtcaaag acacgctcga cactgctcac agctacgtcg ccgccaactc gtacacgaac 120
gcctacgagc gtgctgccaa cttggccgct gcgatcctcc accgtctcga acctcttcag 180
aagcgtctcc ctctcgaacg tgtagacggc tatgccaacg gtgccctcga ttacgtcgag 240
aagcgtttcc ctgccgtcaa atccgagact agcgaaatcg ttggcaaacc tcgtcaagcg 300
gcagatcatg ccgtcgctgc cttctacgcc cagattggaa agtcgcaaga gactcttcac 360
ggtctccagg accgtctcgc caagaccgtc gccaaattcc ctcacgatca agcctcgctc 420
aaaaagacgt tgagtgagat ctctgccgaa ctcgattccg ttgtcaaagc tgttccttct 480
ctccccgctc aagcccagtc tcacgctcaa ccttacctcg acggactcgg agaagccgct 540
ttgtacgtca agaaggaggt gacccgctcg gatgctaccg tttccgagaa ggcgcagaac 600
attctcaact actcgcaaga aaagttgacc ccggtactcg aatcggtcaa ggcttacgcg 660
ttcaagacga agaagcaagt tgaagagaag ggagaagaag tcaaagagac gacgaactcc 720
gactaa 726
<210> 9
<211> 261
<212> PRT
<213> Rhodotorula glutinis
<400> 9
Met Ala Thr Val Asn Glu Lys Gln Pro Ala Thr Asp Ala Pro Leu Ala
1 5 10 15
His Glu Thr Ala Ile His Arg Val Ser Asp Tyr Pro Val Ile Lys Asp
20 25 30
Thr Leu Ser Ser Leu Asp Ser Tyr Ala His Ser His Pro Tyr Leu Ser
35 40 45
Ser Leu Tyr Ser Arg Thr Leu Ser Leu Ser Arg Gln Ile Leu Ala Arg
50 55 60
Ile Glu Pro Val Leu Pro Leu Asp Leu Ala Asp Gln Tyr Ala Asn Lys
65 70 75 80
Thr Leu Asp Val Val Glu Lys Tyr Val Pro Gln Val Lys Met Glu Thr
85 90 95
Gly Glu Leu Ile Gly Lys Ala Arg Gly Pro Ala Asp Ala Ala Phe Gln
100 105 110
Thr Ala Gln Glu Tyr Arg Gln Gly Ile Gln Ser Arg Ile Ser Pro Val
115 120 125
Thr Asp Gln Leu Tyr Gln Arg Ile Thr Thr Ser Gln Ala Gln Leu Ser
130 135 140
Ser Leu Gln Asp Arg Leu Gln Lys Thr Ile Lys Gln Leu Pro His Asp
145 150 155 160
Thr Glu Ser Leu Gln Ser Thr Leu His Ser Ile Leu Thr Glu Val Asp
165 170 175
Gly Leu Val Lys Ser Ala Gln Ser Ile Pro Ala Asn Ala Gln Ala Thr
180 185 190
Ala Lys Pro Val Phe Asp Gly Val Val Glu Ala Ala Glu His Ile Arg
195 200 205
Lys Glu Val Thr Arg Thr Asp Ile Pro Met Gly Ala Arg Ala Gln Asn
210 215 220
Val Leu Thr Tyr Thr Gln Asp Arg Leu Thr Pro Val Val Glu Gln Ile
225 230 235 240
Lys Ser Phe Val Leu Lys Lys Lys Asp Glu Ala Ala Glu Val Val Glu
245 250 255
Thr Thr Glu Lys Glu
260
<210> 10
<211> 786
<212> DNA
<213> Rhodotorula glutinis
<400> 10
atggccaccg tcaacgagaa gcagcccgcc accgacgcgc ccctcgcgca cgagaccgcc 60
atccaccgcg tgtcggacta ccccgtgatc aaagacaccc tctcctcgct cgactcgtac 120
gcccactcgc acccctacct ctcctctctc tactcccgca ccctcagtct ctcgcgccaa 180
atcctcgcgc gcatcgagcc cgtcctcccg ctcgacctcg cagaccagta cgcgaacaag 240
acgcttgatg tggtggagaa gtatgtgcct caggtcaaga tggagacggg cgagttgatt 300
ggaaaggcga gggggccggc tgatgcggcg ttccagacgg ctcaggagta caggcagggg 360
atccagtcgc gcatctcgcc cgtgacggac cagctctacc agcgcatcac gacctcccaa 420
gcgcagctct cctcgctcca agaccgtctc cagaagacga tcaagcagct cccccacgac 480
accgagagcc tccagtctac gcttcactcg atcctcactg aggttgatgg gctcgtcaag 540
tctgctcagt cgatccccgc caacgcccaa gcgaccgcca agcccgtctt tgatggagtc 600
gtcgaggctg ccgagcacat ccgtaaggag gttacgcgca ccgacatccc catgggcgcc 660
cgcgcacaaa acgtcctcac ctacacgcaa gaccgtctca cccccgtcgt cgagcagatc 720
aagagtttcg tcttgaagaa gaaggacgag gctgccgagg ttgtcgagac cactgagaag 780
gagtaa 786
<210> 11
<211> 632
<212> PRT
<213> Lipomyces starkeyi
<400> 11
Met Ser Arg Glu Ile Ser Gly Leu Lys His Ser Asn Ser Thr Leu Ser
1 5 10 15
Leu Asn Thr Leu Pro Met Trp Asp Ser Ser Asp Pro Asp Arg His Pro
20 25 30
Pro Pro Leu Pro Leu Asn Pro Asp Pro Gln Ile Leu Ser Gly Ser Pro
35 40 45
Thr Arg Ser Ser Gln Leu Tyr Gly Ser Thr Arg Ser Arg Thr Val Ser
50 55 60
Pro Val Arg Gln Thr Met Lys Pro Val Thr Leu Asn Ser Pro Ser Asn
65 70 75 80
Asp Arg Ile Ala Glu Ile Leu His Leu Leu Ser Lys Ile His Asp Thr
85 90 95
Leu Lys Asp Val Asp Ala Thr Ser Lys Leu Ser Asp Ala Thr Ile Arg
100 105 110
Lys Ser Glu Lys Asp Val Asp Ser Leu Leu Arg Arg Ser Lys Asp Asn
115 120 125
Ala Val Asp Leu Val Ser Leu Arg Asp Lys Ile Tyr Ser Ser Glu Ile
130 135 140
Phe Leu Ser His Gln Leu Gln Asp Ile His Asp Val Met Ser Lys Gly
145 150 155 160
Asn Ala Thr Gly Ser Asn Gly Thr Ala Thr Gly Ala Ile Ser Ala Gly
165 170 175
Tyr Leu Ala Lys Val Asp Glu Leu Lys Gly Leu Trp Asp Asn Gly Ser
180 185 190
Leu Ser Met Ser Glu Leu Leu Asp Phe Asn Arg Ser Gln Leu Asp Ala
195 200 205
Leu Gln Ser Leu Asn Asp Ala Leu Ser Lys Ser Thr Gln Leu Ser Ser
210 215 220
Glu Gln Leu Asp Cys Leu Lys Thr Gln Leu Glu Gly Ile Gln Lys Thr
225 230 235 240
Gln Val Glu Asn Ala Asp Asn Glu Lys Asp Val Asn Val Gln Thr Ile
245 250 255
Asn Val Leu His Asp Leu Arg Arg Ile Leu Thr Leu Glu Asp Lys Ser
260 265 270
Glu Val Ile Leu Arg Glu Ile Arg Lys His Glu Arg Val Thr Asp Gly
275 280 285
Tyr Thr Lys Asp Leu Lys Glu Ser Leu Gln Lys Thr Gln Glu Met Leu
290 295 300
Thr Ala Leu Ser Arg Ser Thr Leu Glu Asp Lys Asp Ala Ile Ala Asn
305 310 315 320
Gln Met His Asn Val Asn Ala Ser Ile Ala Ser Leu Arg Asp Gln Thr
325 330 335
Gln Leu Lys Asp Glu Thr Ala Ile Ala Asp Val Val Arg Ser Ser Gln
340 345 350
Ala Gln Val Thr Glu Val Leu Gly Arg Leu Gln Leu Asp Val Lys Ser
355 360 365
Arg Ile Gln Ser Val Leu Ser Ser Leu Glu Ser Asn Asp Arg Thr Val
370 375 380
Ala Ala Ile Glu Asp Leu Lys Ser Phe Ile Ala Thr Arg Ser Asp Ser
385 390 395 400
Ser Leu Glu Ser Thr Ile His Glu His Glu Lys Leu Asp Gln Ile Leu
405 410 415
Lys Asp Ile Gly Val Leu Ser Ser Asn Met Ala Pro Leu Ser Leu Leu
420 425 430
Pro Glu Ile His Ala Ser Phe Leu Glu Ser Ala Thr Gln Phe Asn Thr
435 440 445
Tyr Ile Ile Gly Glu His Ser Lys Leu Met Ser Glu Val Glu Thr Leu
450 455 460
Arg Gln Glu Lys Leu Asn Leu Val Ser Glu Leu Ser Ala Leu Glu Ser
465 470 475 480
Val Val Ala Thr Arg Ser Glu Gln Leu Glu Ile Leu Glu Lys Arg Ala
485 490 495
Glu Asn Phe Gln Leu Arg Leu Thr Glu His Ile Leu Gln Lys Ser Pro
500 505 510
Lys Gly Thr Val Ala Ile Glu Gly Arg Gln Ser Phe Gln Lys Ser Ala
515 520 525
Arg Ser Thr Leu Asp Val Leu Thr Glu Ala Pro Gly Pro Tyr Glu Ala
530 535 540
Asn Leu Ala Asn Ile Thr Asn Ser Ala Ser Ala Tyr Ala Gly His Ala
545 550 555 560
Ile Arg Glu Asn Val Ala His Glu Val Ser Ile Ile Ser Asp Ala Ser
565 570 575
Ser Ile Asp Ala Ser Arg Ser Val Ser Gly Gly Ser Ala Ser Arg Arg
580 585 590
Val Ser Trp Ser Lys Lys Ile Gly Thr Met Phe Ser Ser Gly Lys Glu
595 600 605
Asn Glu Leu Val Ile Pro Lys Arg Gly Gly Ala Arg Lys Val Gly Lys
610 615 620
Gly Arg Ser Val Ser Glu Arg Leu
625 630
<210> 12
<211> 1896
<212> DNA
<213> Lipomyces starkeyi
<400> 12
atgtctagag aaatttctgg tttgaagcac tctaactcta ctttgtcttt gaacactttg 60
ccaatgtggg attcttctga tccagataga cacccaccac cattgccatt gaacccagat 120
ccacaaattt tgtctggttc tccaactaga tcttctcaat tgtacggttc tactagatct 180
agaactgttt ctccagttag acaaactatg aagccagtta ctttgaactc tccatctaac 240
gatagaattg ctgaaatttt gcacttgttg tctaagattc acgatacttt gaaggatgtt 300
gatgctactt ctaagttgtc tgatgctact attagaaagt ctgaaaagga tgttgattct 360
ttgttgagaa gatctaagga taacgctgtt gatttggttt ctttgagaga taagatttac 420
tcttctgaaa ttttcttgtc tcaccaattg caagatattc acgatgttat gtctaagggt 480
aacgctactg gttctaacgg tactgctact ggtgctattt ctgctggtta cttggctaag 540
gttgatgaat tgaagggttt gtgggataac ggttctttgt ctatgtctga attgttggat 600
ttcaacagat ctcaattgga tgctttgcaa tctttgaacg atgctttgtc taagtctact 660
caattgtctt ctgaacaatt ggattgtttg aagactcaat tggaaggtat tcaaaagact 720
caagttgaaa acgctgataa cgaaaaggat gttaacgttc aaactattaa cgttttgcac 780
gatttgagaa gaattttgac tttggaagat aagtctgaag ttattttgag agaaattaga 840
aagcacgaaa gagttactga tggttacact aaggatttga aggaatcttt gcaaaagact 900
caagaaatgt tgactgcttt gtctagatct actttggaag ataaggatgc tattgctaac 960
caaatgcaca acgttaacgc ttctattgct tctttgagag atcaaactca attgaaggat 1020
gaaactgcta ttgctgatgt tgttagatct tctcaagctc aagttactga agttttgggt 1080
agattgcaat tggatgttaa gtctagaatt caatctgttt tgtcttcttt ggaatctaac 1140
gatagaactg ttgctgctat tgaagatttg aagtctttca ttgctactag atctgattct 1200
tctttggaat ctactattca cgaacacgaa aagttggatc aaattttgaa ggatattggt 1260
gttttgtctt ctaacatggc tccattgtct ttgttgccag aaattcacgc ttctttcttg 1320
gaatctgcta ctcaattcaa cacttacatt attggtgaac actctaagtt gatgtctgaa 1380
gttgaaactt tgagacaaga aaagttgaac ttggtttctg aattgtctgc tttggaatct 1440
gttgttgcta ctagatctga acaattggaa attttggaaa agagagctga aaacttccaa 1500
ttgagattga ctgaacacat tttgcaaaag tctccaaagg gtactgttgc tattgaaggt 1560
agacaatctt tccaaaagtc tgctagatct actttggatg ttttgactga agctccaggt 1620
ccatacgaag ctaacttggc taacattact aactctgctt ctgcttacgc tggtcacgct 1680
attagagaaa acgttgctca cgaagtttct attatttctg atgcttcttc tattgatgct 1740
tctagatctg tttctggtgg ttctgcttct agaagagttt cttggtctaa gaagattggt 1800
actatgttct cttctggtaa ggaaaacgaa ttggttattc caaagagagg tggtgctaga 1860
aaggttggta agggtagatc tgtttctgaa agattg 1896
<210> 13
<211> 8746
<212> DNA
<213> synthetic
<400> 13
agtactttga tccaacccct ccgctgctat agtgcagtcg gcttctgacg ttcagtgcag 60
ccgtcttctg aaaacgacat gtcgcacaag tcctaagtta cgcgacaggc tgccgccctg 120
cccttttcct ggcgttttct tgtcgcgtgt tttagtcgca taaagtagaa tacttgcgac 180
tagaaccgga gacattacgc catgaacaag agcgccgccg ctggcctgct gggctatgcc 240
cgcgtcagca ccgacgacca ggacttgacc aaccaacggg ccgaactgca cgcggccggc 300
tgcaccaagc tgttttccga gaagatcacc ggcaccaggc gcgaccgccc ggagctggcc 360
aggatgcttg accacctacg ccctggcgac gttgtgacag tgaccaggct agaccgcctg 420
gcccgcagca cccgcgacct actggacatt gccgagcgca tccaggaggc cggcgcgggc 480
ctgcgtagcc tggcagagcc gtgggccgac accaccacgc cggccggccg catggtgttg 540
accgtgttcg ccggcattgc cgagttcgag cgttccctaa tcatcgaccg cacccggagc 600
gggcgcgagg ccgccaaggc ccgaggcgtg aagtttggcc cccgccctac cctcaccccg 660
gcacagatcg cgcacgcccg cgagctgatc gaccaggaag gccgcaccgt gaaagaggcg 720
gctgcactgc ttggcgtgca tcgctcgacc ctgtaccgcg cacttgagcg cagcgaggaa 780
gtgacgccca ccgaggccag gcggcgcggt gccttccgtg aggacgcatt gaccgaggcc 840
gacgccctgg cggccgccga gaatgaacgc caagaggaac aagcatgaaa ccgcaccagg 900
acggccagga cgaaccgttt ttcattaccg aagagatcga ggcggagatg atcgcggccg 960
ggtacgtgtt cgagccgccc gcgcacgtct caaccgtgcg gctgcatgaa atcctggccg 1020
gtttgtctga tgccaagctg gcggcctggc cggccagctt ggccgctgaa gaaaccgagc 1080
gccgccgtct aaaaaggtga tgtgtatttg agtaaaacag cttgcgtcat gcggtcgctg 1140
cgtatatgat gcgatgagta aataaacaaa tacgcaaggg gaacgcatga aggttatcgc 1200
tgtacttaac cagaaaggcg ggtcaggcaa gacgaccatc gcaacccatc tagcccgcgc 1260
cctgcaactc gccggggccg atgttctgtt agtcgattcc gatccccagg gcagtgcccg 1320
cgattgggcg gccgtgcggg aagatcaacc gctaaccgtt gtcggcatcg accgcccgac 1380
gattgaccgc gacgtgaagg ccatcggccg gcgcgacttc gtagtgatcg acggagcgcc 1440
ccaggcggcg gacttggctg tgtccgcgat caaggcagcc gacttcgtgc tgattccggt 1500
gcagccaagc ccttacgaca tatgggccac cgccgacctg gtggagctgg ttaagcagcg 1560
cattgaggtc acggatggaa ggctacaagc ggcctttgtc gtgtcgcggg cgatcaaagg 1620
cacgcgcatc ggcggtgagg ttgccgaggc gctggccggg tacgagctgc ccattcttga 1680
gtcccgtatc acgcagcgcg tgagctaccc aggcactgcc gccgccggca caaccgttct 1740
tgaatcagaa cccgagggcg acgctgcccg cgaggtccag gcgctggccg ctgaaattaa 1800
atcaaaactc atttgagtta atgaggtaaa gagaaaatga gcaaaagcac aaacacgcta 1860
agtgccggcc gtccgagcgc acgcagcagc aaggctgcaa cgttggccag cctggcagac 1920
acgccagcca tgaagcgggt caactttcag ttgccggcgg aggatcacac caagctgaag 1980
atgtacgcgg tacgccaagg caagaccatt accgagctgc tatctgaata catcgcgcag 2040
ctaccagagt aaatgagcaa atgaataaat gagtagatga attttagcgg ctaaaggagg 2100
cggcatggaa aatcaagaac aaccaggcac cgacgccgtg gaatgcccca tgtgtggagg 2160
aacgggcggt tggccaggcg taagcggctg ggttgtctgc cggccctgca atggcactgg 2220
aacccccaag cccgaggaat cggcgtgacg gtcgcaaacc atccggcccg gtacaaatcg 2280
gcgcggcgct gggtgatgac ctggtggaga agttgaaggc cgcgcaggcc gcccagcggc 2340
aacgcatcga ggcagaagca cgccccggtg aatcgtggca agcggccgct gatcgaatcc 2400
gcaaagaatc ccggcaaccg ccggcagccg gtgcgccgtc gattaggaag ccgcccaagg 2460
gcgacgagca accagatttt ttcgttccga tgctctatga cgtgggcacc cgcgatagtc 2520
gcagcatcat ggacgtggcc gttttccgtc tgtcgaagcg tgaccgacga gctggcgagg 2580
tgatccgcta cgagcttcca gacgggcacg tagaggtttc cgcagggccg gccggcatgg 2640
ccagtgtgtg ggattacgac ctggtactga tggcggtttc ccatctaacc gaatccatga 2700
accgataccg ggaagggaag ggagacaagc ccggccgcgt gttccgtcca cacgttgcgg 2760
acgtactcaa gttctgccgg cgagccgatg gcggaaagca gaaagacgac ctggtagaaa 2820
cctgcattcg gttaaacacc acgcacgttg ccatgcagcg tacgaagaag gccaagaacg 2880
gccgcctggt gacggtatcc gagggtgaag ccttgattag ccgctacaag atcgtaaaga 2940
gcgaaaccgg gcggccggag tacatcgaga tcgagctagc tgattggatg taccgcgaga 3000
tcacagaagg caagaacccg gacgtgctga cggttcaccc cgattacttt ttgatcgatc 3060
ccggcatcgg ccgttttctc taccgcctgg cacgccgcgc cgcaggcaag gcagaagcca 3120
gatggttgtt caagacgatc tacgaacgca gtggcagcgc cggagagttc aagaagttct 3180
gtttcaccgt gcgcaagctg atcgggtcaa atgacctgcc ggagtacgat ttgaaggagg 3240
aggcggggca ggctggcccg atcctagtca tgcgctaccg caacctgatc gagggcgaag 3300
catccgccgg ttcctaatgt acggagcaga tgctagggca aattgcccta gcaggggaaa 3360
aaggtcgaaa aggtctcttt cctgtggata gcacgtacat tgggaaccca aagccgtaca 3420
ttgggaaccg gaacccgtac attgggaacc caaagccgta cattgggaac cggtcacaca 3480
tgtaagtgac tgatataaaa gagaaaaaag gcgatttttc cgcctaaaac tctttaaaac 3540
ttattaaaac tcttaaaacc cgcctggcct gtgcataact gtctggccag cgcacagccg 3600
aagagctgca aaaagcgcct acccttcggt cgctgcgctc cctacgcccc gccgcttcgc 3660
gtcggcctat cgcggccgct ggccgctcaa aaatggctgg cctacggcca ggcaatctac 3720
cagggcgcgg acaagccgcg ccgtcgccac tcgaccgccg gcgcccacat caaggcaccc 3780
tgcctcgcgc gtttcggtga tgacggtgaa aacctctgac acatgcagct cccggagacg 3840
gtcacagctt gtctgtaagc ggatgccggg agcagacaag cccgtcaggg cgcgtcagcg 3900
ggtgttggcg ggtgtcgggg cgcagccatg acccagtcac gtagcgatag cggagtgtat 3960
actggcttaa ctatgcggca tcagagcaga ttgtactgag agtgcaccat atgcggtgtg 4020
aaataccgca cagatgcgta aggagaaaat accgcatcag gcgctcttcc gcttcctcgc 4080
tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg 4140
cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag 4200
gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc 4260
gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag 4320
gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga 4380
ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc 4440
atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg 4500
tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt 4560
ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac aggattagca 4620
gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac tacggctaca 4680
ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc ggaaaaagag 4740
ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt tttgtttgca 4800
agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg 4860
ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg agccatattc 4920
aacgggaaac gtcttgctct aggccgcgat taaattccaa catggatgct gatttatatg 4980
ggtataaatg ggctcgcgat aatgtcgggc aatcaggtgc gacaatctat cgattgtatg 5040
ggaagcccga tgcgccagag ttgtttctga aacatggcaa aggtagcgtt gccaatgatg 5100
ttacagatga gatggtcaga ctaaactggc tgacggaatt tatgcctctt ccgaccatca 5160
agcattttat ccgtactcct gatgatgcat ggttactcac cactgcgatc cccgggaaaa 5220
cagcattcca ggtattagaa gaatatcctg attcaggtga aaatattgtt gatgcgctgg 5280
cagtgttcct gcgccggttg cattcgattc ctgtttgtaa ttgtcctttt aacagcgatc 5340
gcgtatttcg tctcgctcag gcgcaatcac gaatgaataa cggtttggtt gatgcgagtg 5400
attttgatga cgagcgtaat ggctggcctg ttgaacaagt ctggaaagaa atgcataaac 5460
ttttgccatt ctcaccggat tcagtcgtca ctcatggtga tttctcactt gataacctta 5520
tttttgacga ggggaaatta ataggttgta ttgatgttgg acgagtcgga atcgcagacc 5580
gataccagga tcttgccatc ctatggaact gcctcggtga gttttctcct tcattacaga 5640
aacggctttt tcaaaaatat ggtattgata atcctgatat gaataaattg cagtttcatt 5700
tgatgctcga tgagtttttc taatcacagg cagcaacgct ctgtcatcgt tacaatcaac 5760
atgctaccct ccgcgagatc atccgtgttt caaacccggc agcttagttg ccgttcttcc 5820
gaatagcatc ggtaacatga gcaaagtctg ccgccttaca acggctctcc cgctgacgcc 5880
gtcccggact gatgggctgc ctgtatcgag tggtgatttt gtgccgagct gccggtcggg 5940
gagctgttgg ctggctggtg gcaggatata ttgtggtgta aacaaattga cgcttagaca 6000
acttaataac acattgcgga cgtttttaat gtactgaatt aacgccgaat tgaattcgag 6060
ctcggtacct ggagttcgac gttctcctcg ctccgcaagc attggaatga accttgctct 6120
ctagttccct cctccgtgac ctcgtttcgt cctttagacg gcacgatgga aggaagaaat 6180
ctctgcggac aagcaaatct gctggctcgc cttgtaggtc gcctaccgga gcaagccttg 6240
tgccgccggg atgccaacgt cgttttttga cgtttgcaag acgtagagga cgcttcggac 6300
gacgaaacaa gctgtgagga catggaagtc gtgggaggaa cggcgcagag cggcgccgcg 6360
ggagcataag gcaagcgaga tagtccagaa atcgcggcgc caagtacagt aatttattgg 6420
agcaggcacc agaagcgggc agcagtatgc gcaggcttgg ggtcgacgag agacgactcc 6480
ctcatactcg gttacctcga gcaatacaat caatcgaagc tgcgcgaatc tcggcttgta 6540
agggtcggaa aggaacctcg gagatggcca cgtcacatca ccaacttatc gatctcagcc 6600
gacgtcgcag agagggcgag cgaagcggtg aaggagggaa acaatccctc gagagcatga 6660
tccgtctgaa tctgcagcgc aggaagccgt cacacgcccg cctcgagcgc aggtcgggtc 6720
cagccggggg acgaaacgcg cgagggctga tttcgtgagc gaaggaagcc gcatcgacaa 6780
gttcgcgtcc ctttgccctc tttcccatca cccgctctcg ctctacccgc tcagaacaac 6840
accagatcag tcacaatgcc ggagctcacg gcgacgtcgg tcgagaagtt cctcatcgaa 6900
aagttcgact cggtctcgga cctcatgcaa ctctcggagg gagaggaatc gcgcgcgttc 6960
tcgttcgacg tcggaggccg cggatacgtc ctccgcgtca actcgtgtgc ggacggattc 7020
tacaaggatc ggtacgtcta ccgccatttt gcgtcggcgg cgctcccgat ccccgaagtc 7080
ctcgacatcg gagagttctc ggaatccctc acgtactgta tctcgcgccg ggcgcaagga 7140
gtcacgctcc aagatctccc ggagacggaa ctcccggcgg tcctccaacc ggtcgcggaa 7200
gcgatggacg cgatcgcggc cgcggacctc tcgcaaacgt cgggattcgg accgtttgga 7260
ccgcaaggaa tcggacaata cacgacgtgg cgcgacttca tctgtgcgat cgcggatccc 7320
catgtctacc actggcaaac ggtcatggat gacacggtct cggcgtcggt cgcgcaagcg 7380
ctcgacgagc tcatgctctg ggcggaggac tgtccggagg tccgccacct cgtccacgcg 7440
gactttggat cgaacaacgt cctcacggac aacggacgca tcacggcggt catcgactgg 7500
tcggaggcga tgtttggaga ctcgcaatac gaggtcgcga acatcttctt ctggcgcccg 7560
tggctcgcgt gcatggagca acagacgcgc tacttcgagc gccgccaccc ggagctcgcg 7620
ggatcgccgc gcctccgcgc gtacatgctc cgcatcggcc tcgaccaact ctaccagtcg 7680
ctcgtcgacg gaaacttcga cgatgccgcg tgggcccaag gacgctgcga cgcgattgtc 7740
cgctcgggag cgggaaccgt gggacgcacg caaattgcgc ggcgctcggc ggccgtctgg 7800
acggatggat gtgtcgaagt cctcgcggat tcgggaaacc ggcgcccgtc gacgcgcccg 7860
cgggcgaaag aacaccacca tcaccatcac taggatcgtt caaacatttg gcaataaagt 7920
ttcttaagat tgaatcctgt tgccggtctt gcgatgatta tcatataatt tctgttgaat 7980
tacgttaagc atgtaataat taacatgtaa tgcatgacgt tatttatgag atgggttttt 8040
atgattagag tcccgcaatt atacatttaa tacgcgatag aaaacaaaat atagcgcgca 8100
aactaggata aattatcgcg cgcggtgtca tctatgttac tagatcgggc ctggatcctc 8160
tagagtcgac ctgcagcatg caagcttgga gcttgagctt ggggcgggat gacccagcgc 8220
tttcaccctc gcctgaccgg gcgctctcac cgtcgtcggc tgcgctcgct cgagacgacg 8280
ccgccgactc gccgcgctac cactcgtcgt cgtcaacccc ccaaaaagcc aggcctttat 8340
aagcagattc gctgcgtcga cctcagcacc cctacggggg ttgcatacaa taaacttgtt 8400
cgtcgagcca catgcacgga tatcttccag cgacttcggt cttgtcgaga gggtgtcttt 8460
gatcagtttt agagctagaa atagcaagtt aaaataaggc tagtccgtta tcaacttgaa 8520
aaagtggcac cgagtcggtg gtgctttttt tgttttttat gtctatcaga ttgtcgtttc 8580
ccgccttcag tttaaactat cagtgtttga caggatatat tggcgggtaa acctaagaga 8640
aaagagcgtt tattagaata atcggatatt taaaagggcg tgaaaaggtt tatccgttcg 8700
tccatttgta tgtgcatgcc aaccacaggg ttcccctcgg gatcaa 8746
<210> 14
<211> 8746
<212> DNA
<213> synthetic
<400> 14
agtactttga tccaacccct ccgctgctat agtgcagtcg gcttctgacg ttcagtgcag 60
ccgtcttctg aaaacgacat gtcgcacaag tcctaagtta cgcgacaggc tgccgccctg 120
cccttttcct ggcgttttct tgtcgcgtgt tttagtcgca taaagtagaa tacttgcgac 180
tagaaccgga gacattacgc catgaacaag agcgccgccg ctggcctgct gggctatgcc 240
cgcgtcagca ccgacgacca ggacttgacc aaccaacggg ccgaactgca cgcggccggc 300
tgcaccaagc tgttttccga gaagatcacc ggcaccaggc gcgaccgccc ggagctggcc 360
aggatgcttg accacctacg ccctggcgac gttgtgacag tgaccaggct agaccgcctg 420
gcccgcagca cccgcgacct actggacatt gccgagcgca tccaggaggc cggcgcgggc 480
ctgcgtagcc tggcagagcc gtgggccgac accaccacgc cggccggccg catggtgttg 540
accgtgttcg ccggcattgc cgagttcgag cgttccctaa tcatcgaccg cacccggagc 600
gggcgcgagg ccgccaaggc ccgaggcgtg aagtttggcc cccgccctac cctcaccccg 660
gcacagatcg cgcacgcccg cgagctgatc gaccaggaag gccgcaccgt gaaagaggcg 720
gctgcactgc ttggcgtgca tcgctcgacc ctgtaccgcg cacttgagcg cagcgaggaa 780
gtgacgccca ccgaggccag gcggcgcggt gccttccgtg aggacgcatt gaccgaggcc 840
gacgccctgg cggccgccga gaatgaacgc caagaggaac aagcatgaaa ccgcaccagg 900
acggccagga cgaaccgttt ttcattaccg aagagatcga ggcggagatg atcgcggccg 960
ggtacgtgtt cgagccgccc gcgcacgtct caaccgtgcg gctgcatgaa atcctggccg 1020
gtttgtctga tgccaagctg gcggcctggc cggccagctt ggccgctgaa gaaaccgagc 1080
gccgccgtct aaaaaggtga tgtgtatttg agtaaaacag cttgcgtcat gcggtcgctg 1140
cgtatatgat gcgatgagta aataaacaaa tacgcaaggg gaacgcatga aggttatcgc 1200
tgtacttaac cagaaaggcg ggtcaggcaa gacgaccatc gcaacccatc tagcccgcgc 1260
cctgcaactc gccggggccg atgttctgtt agtcgattcc gatccccagg gcagtgcccg 1320
cgattgggcg gccgtgcggg aagatcaacc gctaaccgtt gtcggcatcg accgcccgac 1380
gattgaccgc gacgtgaagg ccatcggccg gcgcgacttc gtagtgatcg acggagcgcc 1440
ccaggcggcg gacttggctg tgtccgcgat caaggcagcc gacttcgtgc tgattccggt 1500
gcagccaagc ccttacgaca tatgggccac cgccgacctg gtggagctgg ttaagcagcg 1560
cattgaggtc acggatggaa ggctacaagc ggcctttgtc gtgtcgcggg cgatcaaagg 1620
cacgcgcatc ggcggtgagg ttgccgaggc gctggccggg tacgagctgc ccattcttga 1680
gtcccgtatc acgcagcgcg tgagctaccc aggcactgcc gccgccggca caaccgttct 1740
tgaatcagaa cccgagggcg acgctgcccg cgaggtccag gcgctggccg ctgaaattaa 1800
atcaaaactc atttgagtta atgaggtaaa gagaaaatga gcaaaagcac aaacacgcta 1860
agtgccggcc gtccgagcgc acgcagcagc aaggctgcaa cgttggccag cctggcagac 1920
acgccagcca tgaagcgggt caactttcag ttgccggcgg aggatcacac caagctgaag 1980
atgtacgcgg tacgccaagg caagaccatt accgagctgc tatctgaata catcgcgcag 2040
ctaccagagt aaatgagcaa atgaataaat gagtagatga attttagcgg ctaaaggagg 2100
cggcatggaa aatcaagaac aaccaggcac cgacgccgtg gaatgcccca tgtgtggagg 2160
aacgggcggt tggccaggcg taagcggctg ggttgtctgc cggccctgca atggcactgg 2220
aacccccaag cccgaggaat cggcgtgacg gtcgcaaacc atccggcccg gtacaaatcg 2280
gcgcggcgct gggtgatgac ctggtggaga agttgaaggc cgcgcaggcc gcccagcggc 2340
aacgcatcga ggcagaagca cgccccggtg aatcgtggca agcggccgct gatcgaatcc 2400
gcaaagaatc ccggcaaccg ccggcagccg gtgcgccgtc gattaggaag ccgcccaagg 2460
gcgacgagca accagatttt ttcgttccga tgctctatga cgtgggcacc cgcgatagtc 2520
gcagcatcat ggacgtggcc gttttccgtc tgtcgaagcg tgaccgacga gctggcgagg 2580
tgatccgcta cgagcttcca gacgggcacg tagaggtttc cgcagggccg gccggcatgg 2640
ccagtgtgtg ggattacgac ctggtactga tggcggtttc ccatctaacc gaatccatga 2700
accgataccg ggaagggaag ggagacaagc ccggccgcgt gttccgtcca cacgttgcgg 2760
acgtactcaa gttctgccgg cgagccgatg gcggaaagca gaaagacgac ctggtagaaa 2820
cctgcattcg gttaaacacc acgcacgttg ccatgcagcg tacgaagaag gccaagaacg 2880
gccgcctggt gacggtatcc gagggtgaag ccttgattag ccgctacaag atcgtaaaga 2940
gcgaaaccgg gcggccggag tacatcgaga tcgagctagc tgattggatg taccgcgaga 3000
tcacagaagg caagaacccg gacgtgctga cggttcaccc cgattacttt ttgatcgatc 3060
ccggcatcgg ccgttttctc taccgcctgg cacgccgcgc cgcaggcaag gcagaagcca 3120
gatggttgtt caagacgatc tacgaacgca gtggcagcgc cggagagttc aagaagttct 3180
gtttcaccgt gcgcaagctg atcgggtcaa atgacctgcc ggagtacgat ttgaaggagg 3240
aggcggggca ggctggcccg atcctagtca tgcgctaccg caacctgatc gagggcgaag 3300
catccgccgg ttcctaatgt acggagcaga tgctagggca aattgcccta gcaggggaaa 3360
aaggtcgaaa aggtctcttt cctgtggata gcacgtacat tgggaaccca aagccgtaca 3420
ttgggaaccg gaacccgtac attgggaacc caaagccgta cattgggaac cggtcacaca 3480
tgtaagtgac tgatataaaa gagaaaaaag gcgatttttc cgcctaaaac tctttaaaac 3540
ttattaaaac tcttaaaacc cgcctggcct gtgcataact gtctggccag cgcacagccg 3600
aagagctgca aaaagcgcct acccttcggt cgctgcgctc cctacgcccc gccgcttcgc 3660
gtcggcctat cgcggccgct ggccgctcaa aaatggctgg cctacggcca ggcaatctac 3720
cagggcgcgg acaagccgcg ccgtcgccac tcgaccgccg gcgcccacat caaggcaccc 3780
tgcctcgcgc gtttcggtga tgacggtgaa aacctctgac acatgcagct cccggagacg 3840
gtcacagctt gtctgtaagc ggatgccggg agcagacaag cccgtcaggg cgcgtcagcg 3900
ggtgttggcg ggtgtcgggg cgcagccatg acccagtcac gtagcgatag cggagtgtat 3960
actggcttaa ctatgcggca tcagagcaga ttgtactgag agtgcaccat atgcggtgtg 4020
aaataccgca cagatgcgta aggagaaaat accgcatcag gcgctcttcc gcttcctcgc 4080
tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg 4140
cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag 4200
gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc 4260
gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag 4320
gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga 4380
ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc 4440
atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg 4500
tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt 4560
ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac aggattagca 4620
gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac tacggctaca 4680
ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc ggaaaaagag 4740
ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt tttgtttgca 4800
agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg 4860
ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg agccatattc 4920
aacgggaaac gtcttgctct aggccgcgat taaattccaa catggatgct gatttatatg 4980
ggtataaatg ggctcgcgat aatgtcgggc aatcaggtgc gacaatctat cgattgtatg 5040
ggaagcccga tgcgccagag ttgtttctga aacatggcaa aggtagcgtt gccaatgatg 5100
ttacagatga gatggtcaga ctaaactggc tgacggaatt tatgcctctt ccgaccatca 5160
agcattttat ccgtactcct gatgatgcat ggttactcac cactgcgatc cccgggaaaa 5220
cagcattcca ggtattagaa gaatatcctg attcaggtga aaatattgtt gatgcgctgg 5280
cagtgttcct gcgccggttg cattcgattc ctgtttgtaa ttgtcctttt aacagcgatc 5340
gcgtatttcg tctcgctcag gcgcaatcac gaatgaataa cggtttggtt gatgcgagtg 5400
attttgatga cgagcgtaat ggctggcctg ttgaacaagt ctggaaagaa atgcataaac 5460
ttttgccatt ctcaccggat tcagtcgtca ctcatggtga tttctcactt gataacctta 5520
tttttgacga ggggaaatta ataggttgta ttgatgttgg acgagtcgga atcgcagacc 5580
gataccagga tcttgccatc ctatggaact gcctcggtga gttttctcct tcattacaga 5640
aacggctttt tcaaaaatat ggtattgata atcctgatat gaataaattg cagtttcatt 5700
tgatgctcga tgagtttttc taatcacagg cagcaacgct ctgtcatcgt tacaatcaac 5760
atgctaccct ccgcgagatc atccgtgttt caaacccggc agcttagttg ccgttcttcc 5820
gaatagcatc ggtaacatga gcaaagtctg ccgccttaca acggctctcc cgctgacgcc 5880
gtcccggact gatgggctgc ctgtatcgag tggtgatttt gtgccgagct gccggtcggg 5940
gagctgttgg ctggctggtg gcaggatata ttgtggtgta aacaaattga cgcttagaca 6000
acttaataac acattgcgga cgtttttaat gtactgaatt aacgccgaat tgaattcgag 6060
ctcggtacct ggagttcgac gttctcctcg ctccgcaagc attggaatga accttgctct 6120
ctagttccct cctccgtgac ctcgtttcgt cctttagacg gcacgatgga aggaagaaat 6180
ctctgcggac aagcaaatct gctggctcgc cttgtaggtc gcctaccgga gcaagccttg 6240
tgccgccggg atgccaacgt cgttttttga cgtttgcaag acgtagagga cgcttcggac 6300
gacgaaacaa gctgtgagga catggaagtc gtgggaggaa cggcgcagag cggcgccgcg 6360
ggagcataag gcaagcgaga tagtccagaa atcgcggcgc caagtacagt aatttattgg 6420
agcaggcacc agaagcgggc agcagtatgc gcaggcttgg ggtcgacgag agacgactcc 6480
ctcatactcg gttacctcga gcaatacaat caatcgaagc tgcgcgaatc tcggcttgta 6540
agggtcggaa aggaacctcg gagatggcca cgtcacatca ccaacttatc gatctcagcc 6600
gacgtcgcag agagggcgag cgaagcggtg aaggagggaa acaatccctc gagagcatga 6660
tccgtctgaa tctgcagcgc aggaagccgt cacacgcccg cctcgagcgc aggtcgggtc 6720
cagccggggg acgaaacgcg cgagggctga tttcgtgagc gaaggaagcc gcatcgacaa 6780
gttcgcgtcc ctttgccctc tttcccatca cccgctctcg ctctacccgc tcagaacaac 6840
accagatcag tcacaatgcc ggagctcacg gcgacgtcgg tcgagaagtt cctcatcgaa 6900
aagttcgact cggtctcgga cctcatgcaa ctctcggagg gagaggaatc gcgcgcgttc 6960
tcgttcgacg tcggaggccg cggatacgtc ctccgcgtca actcgtgtgc ggacggattc 7020
tacaaggatc ggtacgtcta ccgccatttt gcgtcggcgg cgctcccgat ccccgaagtc 7080
ctcgacatcg gagagttctc ggaatccctc acgtactgta tctcgcgccg ggcgcaagga 7140
gtcacgctcc aagatctccc ggagacggaa ctcccggcgg tcctccaacc ggtcgcggaa 7200
gcgatggacg cgatcgcggc cgcggacctc tcgcaaacgt cgggattcgg accgtttgga 7260
ccgcaaggaa tcggacaata cacgacgtgg cgcgacttca tctgtgcgat cgcggatccc 7320
catgtctacc actggcaaac ggtcatggat gacacggtct cggcgtcggt cgcgcaagcg 7380
ctcgacgagc tcatgctctg ggcggaggac tgtccggagg tccgccacct cgtccacgcg 7440
gactttggat cgaacaacgt cctcacggac aacggacgca tcacggcggt catcgactgg 7500
tcggaggcga tgtttggaga ctcgcaatac gaggtcgcga acatcttctt ctggcgcccg 7560
tggctcgcgt gcatggagca acagacgcgc tacttcgagc gccgccaccc ggagctcgcg 7620
ggatcgccgc gcctccgcgc gtacatgctc cgcatcggcc tcgaccaact ctaccagtcg 7680
ctcgtcgacg gaaacttcga cgatgccgcg tgggcccaag gacgctgcga cgcgattgtc 7740
cgctcgggag cgggaaccgt gggacgcacg caaattgcgc ggcgctcggc ggccgtctgg 7800
acggatggat gtgtcgaagt cctcgcggat tcgggaaacc ggcgcccgtc gacgcgcccg 7860
cgggcgaaag aacaccacca tcaccatcac taggatcgtt caaacatttg gcaataaagt 7920
ttcttaagat tgaatcctgt tgccggtctt gcgatgatta tcatataatt tctgttgaat 7980
tacgttaagc atgtaataat taacatgtaa tgcatgacgt tatttatgag atgggttttt 8040
atgattagag tcccgcaatt atacatttaa tacgcgatag aaaacaaaat atagcgcgca 8100
aactaggata aattatcgcg cgcggtgtca tctatgttac tagatcgggc ctggatcctc 8160
tagagtcgac ctgcagcatg caagcttgga gcttgagctt ggggcgggat gacccagcgc 8220
tttcaccctc gcctgaccgg gcgctctcac cgtcgtcggc tgcgctcgct cgagacgacg 8280
ccgccgactc gccgcgctac cactcgtcgt cgtcaacccc ccaaaaagcc aggcctttat 8340
aagcagattc gctgcgtcga cctcagcacc cctacggggg ttgcatacaa taaacttgtt 8400
cgtcgagcca catgcacgga tatcttccag cgacttcggt cttggaggag cacgatgtcc 8460
cgggcgtttt agagctagaa atagcaagtt aaaataaggc tagtccgtta tcaacttgaa 8520
aaagtggcac cgagtcggtg gtgctttttt tgttttttat gtctatcaga ttgtcgtttc 8580
ccgccttcag tttaaactat cagtgtttga caggatatat tggcgggtaa acctaagaga 8640
aaagagcgtt tattagaata atcggatatt taaaagggcg tgaaaaggtt tatccgttcg 8700
tccatttgta tgtgcatgcc aaccacaggg ttcccctcgg gatcaa 8746
<210> 15
<211> 11488
<212> DNA
<213> synthetic
<400> 15
agtactttga tccaacccct ccgctgctat agtgcagtcg gcttctgacg ttcagtgcag 60
ccgtcttctg aaaacgacat gtcgcacaag tcctaagtta cgcgacaggc tgccgccctg 120
cccttttcct ggcgttttct tgtcgcgtgt tttagtcgca taaagtagaa tacttgcgac 180
tagaaccgga gacattacgc catgaacaag agcgccgccg ctggcctgct gggctatgcc 240
cgcgtcagca ccgacgacca ggacttgacc aaccaacggg ccgaactgca cgcggccggc 300
tgcaccaagc tgttttccga gaagatcacc ggcaccaggc gcgaccgccc ggagctggcc 360
aggatgcttg accacctacg ccctggcgac gttgtgacag tgaccaggct agaccgcctg 420
gcccgcagca cccgcgacct actggacatt gccgagcgca tccaggaggc cggcgcgggc 480
ctgcgtagcc tggcagagcc gtgggccgac accaccacgc cggccggccg catggtgttg 540
accgtgttcg ccggcattgc cgagttcgag cgttccctaa tcatcgaccg cacccggagc 600
gggcgcgagg ccgccaaggc ccgaggcgtg aagtttggcc cccgccctac cctcaccccg 660
gcacagatcg cgcacgcccg cgagctgatc gaccaggaag gccgcaccgt gaaagaggcg 720
gctgcactgc ttggcgtgca tcgctcgacc ctgtaccgcg cacttgagcg cagcgaggaa 780
gtgacgccca ccgaggccag gcggcgcggt gccttccgtg aggacgcatt gaccgaggcc 840
gacgccctgg cggccgccga gaatgaacgc caagaggaac aagcatgaaa ccgcaccagg 900
acggccagga cgaaccgttt ttcattaccg aagagatcga ggcggagatg atcgcggccg 960
ggtacgtgtt cgagccgccc gcgcacgtct caaccgtgcg gctgcatgaa atcctggccg 1020
gtttgtctga tgccaagctg gcggcctggc cggccagctt ggccgctgaa gaaaccgagc 1080
gccgccgtct aaaaaggtga tgtgtatttg agtaaaacag cttgcgtcat gcggtcgctg 1140
cgtatatgat gcgatgagta aataaacaaa tacgcaaggg gaacgcatga aggttatcgc 1200
tgtacttaac cagaaaggcg ggtcaggcaa gacgaccatc gcaacccatc tagcccgcgc 1260
cctgcaactc gccggggccg atgttctgtt agtcgattcc gatccccagg gcagtgcccg 1320
cgattgggcg gccgtgcggg aagatcaacc gctaaccgtt gtcggcatcg accgcccgac 1380
gattgaccgc gacgtgaagg ccatcggccg gcgcgacttc gtagtgatcg acggagcgcc 1440
ccaggcggcg gacttggctg tgtccgcgat caaggcagcc gacttcgtgc tgattccggt 1500
gcagccaagc ccttacgaca tatgggccac cgccgacctg gtggagctgg ttaagcagcg 1560
cattgaggtc acggatggaa ggctacaagc ggcctttgtc gtgtcgcggg cgatcaaagg 1620
cacgcgcatc ggcggtgagg ttgccgaggc gctggccggg tacgagctgc ccattcttga 1680
gtcccgtatc acgcagcgcg tgagctaccc aggcactgcc gccgccggca caaccgttct 1740
tgaatcagaa cccgagggcg acgctgcccg cgaggtccag gcgctggccg ctgaaattaa 1800
atcaaaactc atttgagtta atgaggtaaa gagaaaatga gcaaaagcac aaacacgcta 1860
agtgccggcc gtccgagcgc acgcagcagc aaggctgcaa cgttggccag cctggcagac 1920
acgccagcca tgaagcgggt caactttcag ttgccggcgg aggatcacac caagctgaag 1980
atgtacgcgg tacgccaagg caagaccatt accgagctgc tatctgaata catcgcgcag 2040
ctaccagagt aaatgagcaa atgaataaat gagtagatga attttagcgg ctaaaggagg 2100
cggcatggaa aatcaagaac aaccaggcac cgacgccgtg gaatgcccca tgtgtggagg 2160
aacgggcggt tggccaggcg taagcggctg ggttgtctgc cggccctgca atggcactgg 2220
aacccccaag cccgaggaat cggcgtgacg gtcgcaaacc atccggcccg gtacaaatcg 2280
gcgcggcgct gggtgatgac ctggtggaga agttgaaggc cgcgcaggcc gcccagcggc 2340
aacgcatcga ggcagaagca cgccccggtg aatcgtggca agcggccgct gatcgaatcc 2400
gcaaagaatc ccggcaaccg ccggcagccg gtgcgccgtc gattaggaag ccgcccaagg 2460
gcgacgagca accagatttt ttcgttccga tgctctatga cgtgggcacc cgcgatagtc 2520
gcagcatcat ggacgtggcc gttttccgtc tgtcgaagcg tgaccgacga gctggcgagg 2580
tgatccgcta cgagcttcca gacgggcacg tagaggtttc cgcagggccg gccggcatgg 2640
ccagtgtgtg ggattacgac ctggtactga tggcggtttc ccatctaacc gaatccatga 2700
accgataccg ggaagggaag ggagacaagc ccggccgcgt gttccgtcca cacgttgcgg 2760
acgtactcaa gttctgccgg cgagccgatg gcggaaagca gaaagacgac ctggtagaaa 2820
cctgcattcg gttaaacacc acgcacgttg ccatgcagcg tacgaagaag gccaagaacg 2880
gccgcctggt gacggtatcc gagggtgaag ccttgattag ccgctacaag atcgtaaaga 2940
gcgaaaccgg gcggccggag tacatcgaga tcgagctagc tgattggatg taccgcgaga 3000
tcacagaagg caagaacccg gacgtgctga cggttcaccc cgattacttt ttgatcgatc 3060
ccggcatcgg ccgttttctc taccgcctgg cacgccgcgc cgcaggcaag gcagaagcca 3120
gatggttgtt caagacgatc tacgaacgca gtggcagcgc cggagagttc aagaagttct 3180
gtttcaccgt gcgcaagctg atcgggtcaa atgacctgcc ggagtacgat ttgaaggagg 3240
aggcggggca ggctggcccg atcctagtca tgcgctaccg caacctgatc gagggcgaag 3300
catccgccgg ttcctaatgt acggagcaga tgctagggca aattgcccta gcaggggaaa 3360
aaggtcgaaa aggtctcttt cctgtggata gcacgtacat tgggaaccca aagccgtaca 3420
ttgggaaccg gaacccgtac attgggaacc caaagccgta cattgggaac cggtcacaca 3480
tgtaagtgac tgatataaaa gagaaaaaag gcgatttttc cgcctaaaac tctttaaaac 3540
ttattaaaac tcttaaaacc cgcctggcct gtgcataact gtctggccag cgcacagccg 3600
aagagctgca aaaagcgcct acccttcggt cgctgcgctc cctacgcccc gccgcttcgc 3660
gtcggcctat cgcggccgct ggccgctcaa aaatggctgg cctacggcca ggcaatctac 3720
cagggcgcgg acaagccgcg ccgtcgccac tcgaccgccg gcgcccacat caaggcaccc 3780
tgcctcgcgc gtttcggtga tgacggtgaa aacctctgac acatgcagct cccggagacg 3840
gtcacagctt gtctgtaagc ggatgccggg agcagacaag cccgtcaggg cgcgtcagcg 3900
ggtgttggcg ggtgtcgggg cgcagccatg acccagtcac gtagcgatag cggagtgtat 3960
actggcttaa ctatgcggca tcagagcaga ttgtactgag agtgcaccat atgcggtgtg 4020
aaataccgca cagatgcgta aggagaaaat accgcatcag gcgctcttcc gcttcctcgc 4080
tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg 4140
cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag 4200
gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc 4260
gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag 4320
gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga 4380
ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc 4440
atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg 4500
tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt 4560
ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac aggattagca 4620
gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac tacggctaca 4680
ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc ggaaaaagag 4740
ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt tttgtttgca 4800
agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg 4860
ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg agccatattc 4920
aacgggaaac gtcttgctct aggccgcgat taaattccaa catggatgct gatttatatg 4980
ggtataaatg ggctcgcgat aatgtcgggc aatcaggtgc gacaatctat cgattgtatg 5040
ggaagcccga tgcgccagag ttgtttctga aacatggcaa aggtagcgtt gccaatgatg 5100
ttacagatga gatggtcaga ctaaactggc tgacggaatt tatgcctctt ccgaccatca 5160
agcattttat ccgtactcct gatgatgcat ggttactcac cactgcgatc cccgggaaaa 5220
cagcattcca ggtattagaa gaatatcctg attcaggtga aaatattgtt gatgcgctgg 5280
cagtgttcct gcgccggttg cattcgattc ctgtttgtaa ttgtcctttt aacagcgatc 5340
gcgtatttcg tctcgctcag gcgcaatcac gaatgaataa cggtttggtt gatgcgagtg 5400
attttgatga cgagcgtaat ggctggcctg ttgaacaagt ctggaaagaa atgcataaac 5460
ttttgccatt ctcaccggat tcagtcgtca ctcatggtga tttctcactt gataacctta 5520
tttttgacga ggggaaatta ataggttgta ttgatgttgg acgagtcgga atcgcagacc 5580
gataccagga tcttgccatc ctatggaact gcctcggtga gttttctcct tcattacaga 5640
aacggctttt tcaaaaatat ggtattgata atcctgatat gaataaattg cagtttcatt 5700
tgatgctcga tgagtttttc taatcacagg cagcaacgct ctgtcatcgt tacaatcaac 5760
atgctaccct ccgcgagatc atccgtgttt caaacccggc agcttagttg ccgttcttcc 5820
gaatagcatc ggtaacatga gcaaagtctg ccgccttaca acggctctcc cgctgacgcc 5880
gtcccggact gatgggctgc ctgtatcgag tggtgatttt gtgccgagct gccggtcggg 5940
gagctgttgg ctggctggtg gcaggatata ttgtggtgta aacaaattga cgcttagaca 6000
acttaataac acattgcgga cgtttttaat gtactgaatt aacgccgaat tgaattcgag 6060
ctcggtaccc gggccagacg gaccttgaga accctcaatc gctcgcggta ctcgtccgcc 6120
ctgcgatcca gcatcgaaac cgagtgcagc gcgttcaaca aatccgagtc gtctcctcct 6180
gctccttcgc gctgtttcgg cgcgggtggc gcagggacag ccggagggag agggggagga 6240
ggaggagggg ctggggcgac ctttttcttc ttcttcctgt tcttgccctt cttcttcgcc 6300
gcctctgctt ctccatcacc caccgccccc acattcgccg ccgaagcacc gaccacggcc 6360
cccctcatcc gcctctgcaa cctcctcgcc tcgctcgcct ccaaactcaa tcgcgcgacg 6420
cactgctcca actcggcgat ggcgctcatc aagcttggga gggaggcggg tgagagagcc 6480
gagtcggaga ggatgccgtc tgcggggatt tgggagggtg agaggtgggt ttgaggcggt 6540
tgagaggagg aggacgagag ggggagggcg gaggagaggg ctgtcaagtc cgagagggag 6600
agggggatcg aggtcgtgaa ggatgtcgag gacgaggaag aggcgttccg ctgttgttgt 6660
tgctggacgg cggagaggac gcccaggaag gctgcgtcgg ccgcttgcga gggcgagtcg 6720
atcacctcgt aggcggcgtc gtcgtgctcg gacggcgacg acgcgtggtc ctccgactcg 6780
acccagtctg gcccgttgaa gaggcattcg gcggcgaaga cgacggccgg gtcgtccgag 6840
gctgtcgagg caagtggctg taagcaagcg cggcagaaga ggcagaacgc tgcgacgcac 6900
tcctaggatc ccacggctgc gcatccggat cctccccgcg ctgctggcgc ctcgcccgct 6960
cccgctcgta ctccgccatg accgtcaacc cctggcagag caggcggtac tgctcgacca 7020
gggcccagtc ctcgctcgtc tgtgggaaag gttggacggg acatcctggc ggcaatggaa 7080
gcgagtacag ccagtcgagc gtgagagggg agggccgaaa gtgctccgtc gagatgctgg 7140
cgagcgagac gaggggctgg gtgagcgacg gcgggcggat ccctgcgcct gtgttgtcca 7200
tccctgcagt gcactctgtt gctcgtatca tgtcccactc ccttgtatcc ctcgagtcgg 7260
tcgactcttc cctggcgagt ccaagcggag gaggtggtcg tcgcctgacc cgctcggagt 7320
gcgccgctcg acttggccct gggagaacaa gcctgtgtga gtctgtctag cctgtcagcg 7380
aatgcgccag acgagtgcaa gcgggtgagc gaggtcgacc ctgctcgtca ctcgctcgtc 7440
gggtgcggcc gcatcgttga acttgcactt ctcactcgca ctcgctctgg tacagctaca 7500
gtcactcgct tactactctg caggttcaca gcaactcacc cgtccaactc ccaccctccc 7560
ccgtgcagcc caccatgccg gagctcacgg cgacgtcggt cgagaagttc ctcatcgaaa 7620
agttcgactc ggtctcggac ctcatgcaac tctcggaggg agaggaatcg cgcgcgttct 7680
cgttcgacgt cggaggccgc ggatacgtcc tccgcgtcaa ctcgtgtgcg gacggattct 7740
acaaggatcg gtacgtctac cgccattttg cgtcggcggc gctcccgatc cccgaagtcc 7800
tcgacatcgg agagttctcg gaatccctca cgtactgtat ctcgcgccgg gcgcaaggag 7860
tcacgctcca agatctcccg gagacggaac tcccggcggt cctccaaccg gtcgcggaag 7920
cgatggacgc gatcgcggcc gcggacctct cgcaaacgtc gggattcgga ccgtttggac 7980
cgcaaggaat cggacaatac acgacgtggc gcgacttcat ctgtgcgatc gcggatcccc 8040
atgtctacca ctggcaaacg gtcatggatg acacggtctc ggcgtcggtc gcgcaagcgc 8100
tcgacgagct catgctctgg gcggaggact gtccggaggt ccgccacctc gtccacgcgg 8160
actttggatc gaacaacgtc ctcacggaca acggacgcat cacggcggtc atcgactggt 8220
cggaggcgat gtttggagac tcgcaatacg aggtcgcgaa catcttcttc tggcgcccgt 8280
ggctcgcgtg catggagcaa cagacgcgct acttcgagcg ccgccacccg gagctcgcgg 8340
gatcgccgcg cctccgcgcg tacatgctcc gcatcggcct cgaccaactc taccagtcgc 8400
tcgtcgacgg aaacttcgac gatgccgcgt gggcccaagg acgctgcgac gcgattgtcc 8460
gctcgggagc gggaaccgtg ggacgcacgc aaattgcgcg gcgctcggcg gccgtctgga 8520
cggatggatg tgtcgaagtc ctcgcggatt cgggaaaccg gcgcccgtcg acgcgcccgc 8580
gggcgaaaga acaccaccat caccatcact aggatcgttc aaacatttgg caataaagtt 8640
tcttaagatt gaatcctgtt gccggtcttg cgatgattat catataattt ctgttgaatt 8700
acgttaagca tgtaataatt aacatgtaat gcatgacgtt atttatgaga tgggttttta 8760
tgattagagt cccgcaatta tacatttaat acgcgataga aaacaaaata tagcgcgcaa 8820
actaggataa attatcgcgc gcggtgtcat ctatgttact agatcgggcc tggatcctct 8880
agatccatgc tgctgcgatc tgggagtgca agcccgcggt cagcagccat tgcccgccta 8940
caatgtcttc ccaaagccgc ccttgctcgc tcgctgcgtg gagttcgacg ttctcctcgc 9000
tccgcaagca ttggaatgaa ccttgctctc tagttccctc ctccgtgacc tcgtttcgtc 9060
ctttagacgg cacgatggaa ggaagaaatc tctgcggaca agcaaatctg ctggctcgcc 9120
ttgtaggtcg cctaccggag caagccttgt gccgccggga tgccaacgtc gttttttgac 9180
gtttgcaaga cgtagaggac gcttcggacg acgaaacaag ctgtgaggac atggaagtcg 9240
tgggaggaac ggcgcagagc ggcgccgcgg gagcataagg caagcgagat agtccagaaa 9300
tcgcggcgcc aagtacagta atttattgga gcaggcacca gaagcgggca gcagtatgcg 9360
caggcttggg gtcgacgaga gacgactccc tcatactcgg ttacctcgag caatacaatc 9420
aatcgaagct gcgcgaatct cggcttgtaa gggtcggaaa ggaacctcgg agatggccac 9480
gtcacatcac caacttatcg atctcagccg acgtcgcaga gagggcgagc gaagcggtga 9540
aggagggaaa caatccctcg agagcatgat ccgtctgaat ctgcagcgca ggaagccgtc 9600
acacgcccgc ctcgagcgca ggtcgggtcc agccggggga cgaaacgcgc gagggctgat 9660
ttcgtgagcg aaggaagccg catcgacaag ttcgcgtccc tttgccctct ttcccatcac 9720
ccgctctcgc tctacccgct cagaacaaca ccagatcagt cacagatatc atggccaccg 9780
tcaacgagaa gcagcccgcc accgacgcgc ccctcgcgca cgagaccgcc atccaccgcg 9840
cgctcgacta ccccgtgatc aaagacaccc tctcgacctt tgaccactac gcccactcgc 9900
acccctacat ctcgtccctc tactcgcgca ccctcagcct ctcgcgccag atcctcgctc 9960
acgtccagcc cgtcctcccc ctcgagttgg cggaccagta cgcgaacaag acgctcgatg 10020
tcgtcgagaa gtatgtcccg caggtcaaga tggagacggg agagttgatt ggaaaggcga 10080
gggggcccgc cgatgccgcg ttccagacgg cccaggagta caggcaggga atccagtctc 10140
gcatctcgcc cgtgacggac cagctctacc agcgcatcac gacctcgcaa gcgcacctct 10200
cgtccctcca agaccgtctc caaaagacga tcaagcagct cccccacgac acggagagcc 10260
tccagtctac gctccactcg atcctcaacg aggtcgacgg gttggtcaag tctgctcagt 10320
cgatccccgc caacgcccaa gcgaccgcca agcccgtctt tgacggagtc ccatgggtag 10380
actggaggct ctccgtgtcg tgggggagct gcttgatcgt cttttggaga cggtcttgga 10440
gggacgagag gtgcgcttgc gaggtcgtga tgcgctggta gagctggtcc gtcacgggcg 10500
agatgcgaga ctggattccc tgcctgtact cctgggccgt ctggaacgcg gcatcggcgg 10560
gccccctcgc ctttccaatc aactctcccg tctccatctt gacctgcggg acatacttct 10620
cgacgacatc gagcgtcttg ttcgcgtact ggtccgccaa ctcgaggggg aggacgggct 10680
ggacgtgagc gaggatctgg cgcgagaggc tgagggtgcg cgagtagagg gacgagatgt 10740
aggggtgcga gtgggcgtag tggtcaaagg tcgagagggt gtctttgatc acggggtagt 10800
cgagcgcgcg gtggatggcg gtctcgtgcg cgaggggcgc gtcggtggcg ggctgcttct 10860
cgttgacggt ggccatacta gtacgattcc gccccgtctc acctcgcatc cgacctgtgt 10920
agccacgcct tttctctttc cgcccccgac actaaaagga gttcagtcgt ccgcttttcc 10980
tctcttccgt tctccacgcc tgcagtactg catgcctcag ctgtgtaatt tcgatagagt 11040
actcgcacgt atgctcgcgc ggacttgtcg agagagcggg cgagaggtcg agaggagctg 11100
acttgagtga gcagcgagag cggagcggct tgttgcggca cacaacggtc cggcttacgg 11160
acaatcagcg atgaagccgg aagagcggca ggagtggacg aagacgtgcg aagaggaaag 11220
ggggcgagga agagaagcgg aggaggaaac gcagcgaagc agcacaactt ccgcagagac 11280
gacggttcac atagtcaaag atgcagtgca gagaagtgcg cgccgccttc agtttaaact 11340
atcagtgttt gacaggatat attggcgggt aaacctaaga gaaaagagcg tttattagaa 11400
taatcggata tttaaaaggg cgtgaaaagg tttatccgtt cgtccatttg tatgtgcatg 11460
ccaaccacag ggttcccctc gggatcaa 11488
<210> 16
<211> 11488
<212> DNA
<213> synthetic
<400> 16
agtactttga tccaacccct ccgctgctat agtgcagtcg gcttctgacg ttcagtgcag 60
ccgtcttctg aaaacgacat gtcgcacaag tcctaagtta cgcgacaggc tgccgccctg 120
cccttttcct ggcgttttct tgtcgcgtgt tttagtcgca taaagtagaa tacttgcgac 180
tagaaccgga gacattacgc catgaacaag agcgccgccg ctggcctgct gggctatgcc 240
cgcgtcagca ccgacgacca ggacttgacc aaccaacggg ccgaactgca cgcggccggc 300
tgcaccaagc tgttttccga gaagatcacc ggcaccaggc gcgaccgccc ggagctggcc 360
aggatgcttg accacctacg ccctggcgac gttgtgacag tgaccaggct agaccgcctg 420
gcccgcagca cccgcgacct actggacatt gccgagcgca tccaggaggc cggcgcgggc 480
ctgcgtagcc tggcagagcc gtgggccgac accaccacgc cggccggccg catggtgttg 540
accgtgttcg ccggcattgc cgagttcgag cgttccctaa tcatcgaccg cacccggagc 600
gggcgcgagg ccgccaaggc ccgaggcgtg aagtttggcc cccgccctac cctcaccccg 660
gcacagatcg cgcacgcccg cgagctgatc gaccaggaag gccgcaccgt gaaagaggcg 720
gctgcactgc ttggcgtgca tcgctcgacc ctgtaccgcg cacttgagcg cagcgaggaa 780
gtgacgccca ccgaggccag gcggcgcggt gccttccgtg aggacgcatt gaccgaggcc 840
gacgccctgg cggccgccga gaatgaacgc caagaggaac aagcatgaaa ccgcaccagg 900
acggccagga cgaaccgttt ttcattaccg aagagatcga ggcggagatg atcgcggccg 960
ggtacgtgtt cgagccgccc gcgcacgtct caaccgtgcg gctgcatgaa atcctggccg 1020
gtttgtctga tgccaagctg gcggcctggc cggccagctt ggccgctgaa gaaaccgagc 1080
gccgccgtct aaaaaggtga tgtgtatttg agtaaaacag cttgcgtcat gcggtcgctg 1140
cgtatatgat gcgatgagta aataaacaaa tacgcaaggg gaacgcatga aggttatcgc 1200
tgtacttaac cagaaaggcg ggtcaggcaa gacgaccatc gcaacccatc tagcccgcgc 1260
cctgcaactc gccggggccg atgttctgtt agtcgattcc gatccccagg gcagtgcccg 1320
cgattgggcg gccgtgcggg aagatcaacc gctaaccgtt gtcggcatcg accgcccgac 1380
gattgaccgc gacgtgaagg ccatcggccg gcgcgacttc gtagtgatcg acggagcgcc 1440
ccaggcggcg gacttggctg tgtccgcgat caaggcagcc gacttcgtgc tgattccggt 1500
gcagccaagc ccttacgaca tatgggccac cgccgacctg gtggagctgg ttaagcagcg 1560
cattgaggtc acggatggaa ggctacaagc ggcctttgtc gtgtcgcggg cgatcaaagg 1620
cacgcgcatc ggcggtgagg ttgccgaggc gctggccggg tacgagctgc ccattcttga 1680
gtcccgtatc acgcagcgcg tgagctaccc aggcactgcc gccgccggca caaccgttct 1740
tgaatcagaa cccgagggcg acgctgcccg cgaggtccag gcgctggccg ctgaaattaa 1800
atcaaaactc atttgagtta atgaggtaaa gagaaaatga gcaaaagcac aaacacgcta 1860
agtgccggcc gtccgagcgc acgcagcagc aaggctgcaa cgttggccag cctggcagac 1920
acgccagcca tgaagcgggt caactttcag ttgccggcgg aggatcacac caagctgaag 1980
atgtacgcgg tacgccaagg caagaccatt accgagctgc tatctgaata catcgcgcag 2040
ctaccagagt aaatgagcaa atgaataaat gagtagatga attttagcgg ctaaaggagg 2100
cggcatggaa aatcaagaac aaccaggcac cgacgccgtg gaatgcccca tgtgtggagg 2160
aacgggcggt tggccaggcg taagcggctg ggttgtctgc cggccctgca atggcactgg 2220
aacccccaag cccgaggaat cggcgtgacg gtcgcaaacc atccggcccg gtacaaatcg 2280
gcgcggcgct gggtgatgac ctggtggaga agttgaaggc cgcgcaggcc gcccagcggc 2340
aacgcatcga ggcagaagca cgccccggtg aatcgtggca agcggccgct gatcgaatcc 2400
gcaaagaatc ccggcaaccg ccggcagccg gtgcgccgtc gattaggaag ccgcccaagg 2460
gcgacgagca accagatttt ttcgttccga tgctctatga cgtgggcacc cgcgatagtc 2520
gcagcatcat ggacgtggcc gttttccgtc tgtcgaagcg tgaccgacga gctggcgagg 2580
tgatccgcta cgagcttcca gacgggcacg tagaggtttc cgcagggccg gccggcatgg 2640
ccagtgtgtg ggattacgac ctggtactga tggcggtttc ccatctaacc gaatccatga 2700
accgataccg ggaagggaag ggagacaagc ccggccgcgt gttccgtcca cacgttgcgg 2760
acgtactcaa gttctgccgg cgagccgatg gcggaaagca gaaagacgac ctggtagaaa 2820
cctgcattcg gttaaacacc acgcacgttg ccatgcagcg tacgaagaag gccaagaacg 2880
gccgcctggt gacggtatcc gagggtgaag ccttgattag ccgctacaag atcgtaaaga 2940
gcgaaaccgg gcggccggag tacatcgaga tcgagctagc tgattggatg taccgcgaga 3000
tcacagaagg caagaacccg gacgtgctga cggttcaccc cgattacttt ttgatcgatc 3060
ccggcatcgg ccgttttctc taccgcctgg cacgccgcgc cgcaggcaag gcagaagcca 3120
gatggttgtt caagacgatc tacgaacgca gtggcagcgc cggagagttc aagaagttct 3180
gtttcaccgt gcgcaagctg atcgggtcaa atgacctgcc ggagtacgat ttgaaggagg 3240
aggcggggca ggctggcccg atcctagtca tgcgctaccg caacctgatc gagggcgaag 3300
catccgccgg ttcctaatgt acggagcaga tgctagggca aattgcccta gcaggggaaa 3360
aaggtcgaaa aggtctcttt cctgtggata gcacgtacat tgggaaccca aagccgtaca 3420
ttgggaaccg gaacccgtac attgggaacc caaagccgta cattgggaac cggtcacaca 3480
tgtaagtgac tgatataaaa gagaaaaaag gcgatttttc cgcctaaaac tctttaaaac 3540
ttattaaaac tcttaaaacc cgcctggcct gtgcataact gtctggccag cgcacagccg 3600
aagagctgca aaaagcgcct acccttcggt cgctgcgctc cctacgcccc gccgcttcgc 3660
gtcggcctat cgcggccgct ggccgctcaa aaatggctgg cctacggcca ggcaatctac 3720
cagggcgcgg acaagccgcg ccgtcgccac tcgaccgccg gcgcccacat caaggcaccc 3780
tgcctcgcgc gtttcggtga tgacggtgaa aacctctgac acatgcagct cccggagacg 3840
gtcacagctt gtctgtaagc ggatgccggg agcagacaag cccgtcaggg cgcgtcagcg 3900
ggtgttggcg ggtgtcgggg cgcagccatg acccagtcac gtagcgatag cggagtgtat 3960
actggcttaa ctatgcggca tcagagcaga ttgtactgag agtgcaccat atgcggtgtg 4020
aaataccgca cagatgcgta aggagaaaat accgcatcag gcgctcttcc gcttcctcgc 4080
tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg 4140
cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag 4200
gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc 4260
gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag 4320
gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga 4380
ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc 4440
atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg 4500
tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt 4560
ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac aggattagca 4620
gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac tacggctaca 4680
ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc ggaaaaagag 4740
ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt tttgtttgca 4800
agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg 4860
ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg agccatattc 4920
aacgggaaac gtcttgctct aggccgcgat taaattccaa catggatgct gatttatatg 4980
ggtataaatg ggctcgcgat aatgtcgggc aatcaggtgc gacaatctat cgattgtatg 5040
ggaagcccga tgcgccagag ttgtttctga aacatggcaa aggtagcgtt gccaatgatg 5100
ttacagatga gatggtcaga ctaaactggc tgacggaatt tatgcctctt ccgaccatca 5160
agcattttat ccgtactcct gatgatgcat ggttactcac cactgcgatc cccgggaaaa 5220
cagcattcca ggtattagaa gaatatcctg attcaggtga aaatattgtt gatgcgctgg 5280
cagtgttcct gcgccggttg cattcgattc ctgtttgtaa ttgtcctttt aacagcgatc 5340
gcgtatttcg tctcgctcag gcgcaatcac gaatgaataa cggtttggtt gatgcgagtg 5400
attttgatga cgagcgtaat ggctggcctg ttgaacaagt ctggaaagaa atgcataaac 5460
ttttgccatt ctcaccggat tcagtcgtca ctcatggtga tttctcactt gataacctta 5520
tttttgacga ggggaaatta ataggttgta ttgatgttgg acgagtcgga atcgcagacc 5580
gataccagga tcttgccatc ctatggaact gcctcggtga gttttctcct tcattacaga 5640
aacggctttt tcaaaaatat ggtattgata atcctgatat gaataaattg cagtttcatt 5700
tgatgctcga tgagtttttc taatcacagg cagcaacgct ctgtcatcgt tacaatcaac 5760
atgctaccct ccgcgagatc atccgtgttt caaacccggc agcttagttg ccgttcttcc 5820
gaatagcatc ggtaacatga gcaaagtctg ccgccttaca acggctctcc cgctgacgcc 5880
gtcccggact gatgggctgc ctgtatcgag tggtgatttt gtgccgagct gccggtcggg 5940
gagctgttgg ctggctggtg gcaggatata ttgtggtgta aacaaattga cgcttagaca 6000
acttaataac acattgcgga cgtttttaat gtactgaatt aacgccgaat tgaattcgag 6060
ctcggtaccc gggccagacg gaccttgaga accctcaatc gctcgcggta ctcgtccgcc 6120
ctgcgatcca gcatcgaaac cgagtgcagc gcgttcaaca aatccgagtc gtctcctcct 6180
gctccttcgc gctgtttcgg cgcgggtggc gcagggacag ccggagggag agggggagga 6240
ggaggagggg ctggggcgac ctttttcttc ttcttcctgt tcttgccctt cttcttcgcc 6300
gcctctgctt ctccatcacc caccgccccc acattcgccg ccgaagcacc gaccacggcc 6360
cccctcatcc gcctctgcaa cctcctcgcc tcgctcgcct ccaaactcaa tcgcgcgacg 6420
cactgctcca actcggcgat ggcgctcatc aagcttggga gggaggcggg tgagagagcc 6480
gagtcggaga ggatgccgtc tgcggggatt tgggagggtg agaggtgggt ttgaggcggt 6540
tgagaggagg aggacgagag ggggagggcg gaggagaggg ctgtcaagtc cgagagggag 6600
agggggatcg aggtcgtgaa ggatgtcgag gacgaggaag aggcgttccg ctgttgttgt 6660
tgctggacgg cggagaggac gcccaggaag gctgcgtcgg ccgcttgcga gggcgagtcg 6720
atcacctcgt aggcggcgtc gtcgtgctcg gacggcgacg acgcgtggtc ctccgactcg 6780
acccagtctg gcccgttgaa gaggcattcg gcggcgaaga cgacggccgg gtcgtccgag 6840
gctgtcgagg caagtggctg taagcaagcg cggcagaaga ggcagaacgc tgcgacgcac 6900
tcctaggatc ccacggctgc gcatccggat cctccccgcg ctgctggcgc ctcgcccgct 6960
cccgctcgta ctccgccatg accgtcaacc cctggcagag caggcggtac tgctcgacca 7020
gggcccagtc ctcgctcgtc tgtgggaaag gttggacggg acatcctggc ggcaatggaa 7080
gcgagtacag ccagtcgagc gtgagagggg agggccgaaa gtgctccgtc gagatgctgg 7140
cgagcgagac gaggggctgg gtgagcgacg gcgggcggat ccctgcgcct gtgttgtcca 7200
tccctgcagt gcactctgtt gctcgtatca tgtcccactc ccttgtatcc ctcgagtcgg 7260
tcgactcttc cctggcgagt ccaagcggag gaggtggtcg tcgcctgacc cgctcggagt 7320
gcgccgctcg acttggccct gggagaacaa gcctgtgtga gtctgtctag cctgtcagcg 7380
aatgcgccag acgagtgcaa gcgggtgagc gaggtcgacc ctgctcgtca ctcgctcgtc 7440
gggtgcggcc gcatcgttga acttgcactt ctcactcgca ctcgctctgg tacagctaca 7500
gtcactcgct tactactctg caggttcaca gcaactcacc cgtccaactc ccaccctccc 7560
ccgtgcagcc caccatgccg gagctcacgg cgacgtcggt cgagaagttc ctcatcgaaa 7620
agttcgactc ggtctcggac ctcatgcaac tctcggaggg agaggaatcg cgcgcgttct 7680
cgttcgacgt cggaggccgc ggatacgtcc tccgcgtcaa ctcgtgtgcg gacggattct 7740
acaaggatcg gtacgtctac cgccattttg cgtcggcggc gctcccgatc cccgaagtcc 7800
tcgacatcgg agagttctcg gaatccctca cgtactgtat ctcgcgccgg gcgcaaggag 7860
tcacgctcca agatctcccg gagacggaac tcccggcggt cctccaaccg gtcgcggaag 7920
cgatggacgc gatcgcggcc gcggacctct cgcaaacgtc gggattcgga ccgtttggac 7980
cgcaaggaat cggacaatac acgacgtggc gcgacttcat ctgtgcgatc gcggatcccc 8040
atgtctacca ctggcaaacg gtcatggatg acacggtctc ggcgtcggtc gcgcaagcgc 8100
tcgacgagct catgctctgg gcggaggact gtccggaggt ccgccacctc gtccacgcgg 8160
actttggatc gaacaacgtc ctcacggaca acggacgcat cacggcggtc atcgactggt 8220
cggaggcgat gtttggagac tcgcaatacg aggtcgcgaa catcttcttc tggcgcccgt 8280
ggctcgcgtg catggagcaa cagacgcgct acttcgagcg ccgccacccg gagctcgcgg 8340
gatcgccgcg cctccgcgcg tacatgctcc gcatcggcct cgaccaactc taccagtcgc 8400
tcgtcgacgg aaacttcgac gatgccgcgt gggcccaagg acgctgcgac gcgattgtcc 8460
gctcgggagc gggaaccgtg ggacgcacgc aaattgcgcg gcgctcggcg gccgtctgga 8520
cggatggatg tgtcgaagtc ctcgcggatt cgggaaaccg gcgcccgtcg acgcgcccgc 8580
gggcgaaaga acaccaccat caccatcact aggatcgttc aaacatttgg caataaagtt 8640
tcttaagatt gaatcctgtt gccggtcttg cgatgattat catataattt ctgttgaatt 8700
acgttaagca tgtaataatt aacatgtaat gcatgacgtt atttatgaga tgggttttta 8760
tgattagagt cccgcaatta tacatttaat acgcgataga aaacaaaata tagcgcgcaa 8820
actaggataa attatcgcgc gcggtgtcat ctatgttact agatcgggcc tggatcctct 8880
agatccatgc tgctgcgatc tgggagtgca agcccgcggt cagcagccat tgcccgccta 8940
caatgtcttc ccaaagccgc ccttgctcgc tcgctgcgtg gagttcgacg ttctcctcgc 9000
tccgcaagca ttggaatgaa ccttgctctc tagttccctc ctccgtgacc tcgtttcgtc 9060
ctttagacgg cacgatggaa ggaagaaatc tctgcggaca agcaaatctg ctggctcgcc 9120
ttgtaggtcg cctaccggag caagccttgt gccgccggga tgccaacgtc gttttttgac 9180
gtttgcaaga cgtagaggac gcttcggacg acgaaacaag ctgtgaggac atggaagtcg 9240
tgggaggaac ggcgcagagc ggcgccgcgg gagcataagg caagcgagat agtccagaaa 9300
tcgcggcgcc aagtacagta atttattgga gcaggcacca gaagcgggca gcagtatgcg 9360
caggcttggg gtcgacgaga gacgactccc tcatactcgg ttacctcgag caatacaatc 9420
aatcgaagct gcgcgaatct cggcttgtaa gggtcggaaa ggaacctcgg agatggccac 9480
gtcacatcac caacttatcg atctcagccg acgtcgcaga gagggcgagc gaagcggtga 9540
aggagggaaa caatccctcg agagcatgat ccgtctgaat ctgcagcgca ggaagccgtc 9600
acacgcccgc ctcgagcgca ggtcgggtcc agccggggga cgaaacgcgc gagggctgat 9660
ttcgtgagcg aaggaagccg catcgacaag ttcgcgtccc tttgccctct ttcccatcac 9720
ccgctctcgc tctacccgct cagaacaaca ccagatcagt cacagatatc atgtcaccct 9780
cttacgcaca agctacttca gcgtggttac cctccccctc cgaaatgccg caacccgaca 9840
aggctctcct cgcgacgaca gaggacgtga cggcggggaa acactctcca tcgacgatcg 9900
cgcacggaaa cgagaacgca aaggtgcagg tcgttgggga gttgacgccc cctcttacgc 9960
cgccgggtga gaaggaggat tcgattgcgg cgggagaggg cgtgaggagg aggaaagtgg 10020
ggaagtcttc cgaggacgag gagcacgatg tcccgggcaa gggtttcgtg cagagtattg 10080
aggggactgt gagtgcggaa cgctacgtcc cggaggacct cgacaagcgg atctacaagc 10140
cttgtgcgtc ctccctctcc tctcttcctc gcgagttcct tggagagctg atggtgggca 10200
cgcaggggtt ccgcgcgcga acatcgctgc gacgccggag catccgtacg gcacgaccgc 10260
gggcgggtac gcggagaagc acaaggacga gcccgttctc gctcagcacg tcgctttctt 10320
cgacaaggtg cgatcccttt cacccccctt aaaccctgcg agtgagactg ccatgggtac 10380
ccgcccgcgg tcgtgccgta cggatgctcc ggcgtcgcag cgatgttcgc gcgcggaacc 10440
cctgcgtgcc caccatcagc tctccaagga actcgcgagg aagagaggag agggaggacg 10500
cacaaggctt gtagatccgc ttgtcgaggt cctccgggac gtagcgttcc gcactcacag 10560
tcccctcaat actctgcacg aaacccttgc ccgggacatc gtgctcctcg tcctcggaag 10620
acttccccac tttcctcctc ctcacgccct ctcccgccgc aatcgaatcc tccttctcac 10680
ccggcggcgt aagagggggc gtcaactccc caacgacctg cacctttgcg ttctcgtttc 10740
cgtgcgcgat cgtcgatgga gagtgtttcc ccgccgtcac gtcctctgtc gtcgcgagga 10800
gagccttgtc gggttgcggc atttcggagg gggagggtaa ccacgctgaa gtagcttgtg 10860
cgtaagaggg tgacatacta gtacgattcc gccccgtctc acctcgcatc cgacctgtgt 10920
agccacgcct tttctctttc cgcccccgac actaaaagga gttcagtcgt ccgcttttcc 10980
tctcttccgt tctccacgcc tgcagtactg catgcctcag ctgtgtaatt tcgatagagt 11040
actcgcacgt atgctcgcgc ggacttgtcg agagagcggg cgagaggtcg agaggagctg 11100
acttgagtga gcagcgagag cggagcggct tgttgcggca cacaacggtc cggcttacgg 11160
acaatcagcg atgaagccgg aagagcggca ggagtggacg aagacgtgcg aagaggaaag 11220
ggggcgagga agagaagcgg aggaggaaac gcagcgaagc agcacaactt ccgcagagac 11280
gacggttcac atagtcaaag atgcagtgca gagaagtgcg cgccgccttc agtttaaact 11340
atcagtgttt gacaggatat attggcgggt aaacctaaga gaaaagagcg tttattagaa 11400
taatcggata tttaaaaggg cgtgaaaagg tttatccgtt cgtccatttg tatgtgcatg 11460
ccaaccacag ggttcccctc gggatcaa 11488
<210> 17
<211> 1379
<212> PRT
<213> synthetic
<400> 17
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1010 1015 1020
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser
1025 1030 1035 1040
Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu
1045 1050 1055
Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile
1060 1065 1070
Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser
1075 1080 1085
Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly
1090 1095 1100
Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile
1105 1110 1115 1120
Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser
1125 1130 1135
Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1140 1145 1150
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile
1155 1160 1165
Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala
1170 1175 1180
Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1185 1190 1195 1200
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser
1205 1210 1215
Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1220 1225 1230
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1250 1255 1260
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val
1265 1270 1275 1280
Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys
1285 1290 1295
His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu
1300 1305 1310
Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp
1315 1320 1325
Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp
1330 1335 1340
Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile
1345 1350 1355 1360
Asp Leu Ser Gln Leu Gly Gly Asp Ser Arg Ala Asp Pro Lys Lys Lys
1365 1370 1375
Arg Lys Val
<210> 18
<211> 4140
<212> DNA
<213> synthetic
<400> 18
atggataaga agtactccat tggattggac atcggcacga actccgtggg atgggccgtc 60
atcaccgacg agtacaaggt cccctcgaaa aagttcaaag tcctcggaaa tacggaccgc 120
cactccatca agaagaacct cattggcgcc ttgctctttg actcgggcga aacggccgaa 180
gcgacccgct tgaagcgcac cgcgcgccgc cgctacacgc gccgcaaaaa ccgcatttgt 240
tatctccaag agatcttttc caacgagatg gcgaaggtcg acgactcctt cttccatcgc 300
ttggaggagt cctttttggt ggaggaggac aagaagcacg agcgccaccc gatcttcgga 360
aacattgtcg acgaagtcgc ctatcacgaa aagtacccga ccatctacca tttgcggaaa 420
aaactcgtcg attcgaccga taaggcggat ctccgcctca tctacctcgc gctcgcgcac 480
atgatcaagt tccgcggcca ctttctcatt gagggagacc tcaacccgga caactcggac 540
gtggataagc tcttcatcca gctcgtccag acgtacaatc agctctttga agagaatccc 600
atcaatgcct ccggcgtgga tgcgaaggcc attttgtccg cccgcctctc gaaatcgcgc 660
cgcttggaga acttgatcgc ccaactcccg ggcgagaaga agaacggctt gtttggcaac 720
ttgatcgcgt tgtccctcgg actcaccccg aattttaaat cgaactttga tctcgccgag 780
gatgccaagc tccagctctc caaggacacc tacgacgacg acttggacaa cctcttggcc 840
cagattggcg atcagtatgc cgacctcttc ctcgcggcga agaacttgtc ggacgcgatc 900
ttgttgtcgg acattttgcg cgtcaatacc gagatcacga aggcgccgct ctcggcgtcc 960
atgattaagc gctacgatga gcaccaccag gatctcaccc tcttgaaggc cctcgtgcgc 1020
cagcagctcc ccgagaagta caaggagatt tttttcgacc agtccaaaaa cggatatgcc 1080
ggatatattg acggaggcgc ctcgcaggaa gagttctaca agttcatcaa gccgatcctc 1140
gagaagatgg acggaaccga agagctcctc gtgaaactca accgcgaaga cctcctccgg 1200
aaacagcgga ccttcgacaa cggatcgatt ccccaccaga ttcacttggg cgaattgcac 1260
gcgatcctcc ggcgccagga agacttttat ccgtttctca aggacaaccg cgaaaagatc 1320
gagaaaattc tcaccttccg gatcccctac tatgtcggac cgctcgcccg cggaaattcg 1380
cgcttcgcct ggatgacgcg caaatcggag gagaccatta ccccgtggaa tttcgaagag 1440
gtcgtcgaca aaggcgcctc ggcgcaatcg ttcatcgagc ggatgacgaa cttcgataaa 1500
aatctcccga atgaaaaggt cctcccgaag cattcgctct tgtatgagta tttcacggtc 1560
tataacgagc tcaccaaggt gaagtatgtg accgaaggaa tgcgcaagcc ggcgttcctc 1620
tcgggcgagc aaaagaaggc catcgtcgac ctcctcttca agacgaatcg caaggtgacg 1680
gtcaagcaac tcaaggaaga ctattttaaa aagatcgagt gttttgactc cgtggagatc 1740
tcgggagtgg aagaccgctt taacgcgtcg ctcggcacct accatgacct cctcaagatc 1800
atcaaagaca aggattttct cgacaacgag gaaaacgagg acatcttgga ggacatcgtg 1860
ctcacgctca cgctcttcga ggatcgggag atgattgaag agcgcttgaa gacctacgcg 1920
cacctctttg atgataaggt catgaagcag ctcaagcgcc gccggtatac gggctggggc 1980
cgcctctccc gcaagttgat caacggcatt cgggacaagc agtccggcaa gaccatcctc 2040
gacttcttga agtccgatgg attcgccaac cgcaacttca tgcagctcat ccacgacgac 2100
tcgctcacct tcaaggagga tatccagaaa gcccaggtct ccggccaagg agactcgctc 2160
catgagcata tcgcgaactt ggccggctcg ccggccatca agaaaggaat cctccagacc 2220
gtcaaggtcg tcgacgaact cgtgaaggtg atgggccggc ataagccgga gaacatcgtc 2280
atcgagatgg cccgcgaaaa ccaaacgacc cagaaaggcc agaaaaactc ccgcgagcgc 2340
atgaagcgca tcgaggaagg aatcaaggag ttgggctccc agattctcaa ggaacatccg 2400
gtcgaaaaca cccaactcca aaatgaaaag ctctacctct attacctcca aaacggccgg 2460
gatatgtatg tggaccagga gctcgacatc aatcggctct ccgattacga tgtcgatcac 2520
attgtccccc aatcgttcct caaagacgac tccattgaca acaaggtcct cacccgctcc 2580
gacaaaaacc gcggcaagtc ggataatgtg ccgtccgagg aggtcgtcaa gaagatgaaa 2640
aattattggc ggcagctcct caatgcgaaa ttgattacgc agcggaaatt cgataatctc 2700
accaaagcgg agcggggagg cctctccgag ctcgacaaag ccggcttcat caagcggcag 2760
ttggtcgaaa cccggcaaat caccaagcac gtcgcgcaga ttttggattc gcgcatgaac 2820
acgaagtatg acgagaatga caagctcatc cgggaagtca aggtcatcac gctcaagtcg 2880
aagttggtct ccgacttccg gaaagacttc cagttctaca aggtccggga gatcaacaac 2940
tatcatcacg cgcatgacgc ctacctcaac gcggtggtcg gcacggcgct catcaagaag 3000
tatccgaagt tggagtccga gttcgtgtac ggagactaca aagtgtacga tgtgcgcaag 3060
atgatcgcga aatcggagca agaaatcggc aaggcgaccg cgaaatattt cttctattcc 3120
aacatcatga acttctttaa aaccgagatt accctcgcca atggcgaaat ccgcaagcgg 3180
ccgctcattg agacgaacgg cgagaccggc gaaatcgtct gggacaaggg ccgcgacttc 3240
gcgaccgtgc gcaaggtctt gtcgatgccc caggtcaaca tcgtcaaaaa gaccgaggtg 3300
cagaccggcg gcttctccaa agagtcgatt ctccccaaac gcaactcgga caaattgatt 3360
gcccggaaga aggactggga cccgaaaaaa tacggcggct ttgactcccc gacggtcgcc 3420
tactcggtcc tcgtggtcgc gaaagtcgag aagggcaagt ccaaaaaact caagtccgtc 3480
aaggagctct tgggaatcac gattatggag cgctcgtcgt tcgaaaagaa ccccatcgac 3540
ttcctcgagg cgaagggcta caaggaagtg aaaaaagacc tcatcatcaa attgccgaag 3600
tactccctct tcgagctcga gaacggccgg aaacgcatgt tggcgtccgc gggcgagttg 3660
cagaagggca acgagctcgc gttgccgtcg aagtatgtca acttcctcta cctcgcctcc 3720
cactacgaga aactcaaggg ctccccggag gataatgaac agaaacagct cttcgtcgaa 3780
caacacaagc actacctcga tgaaattatt gagcagatct cggagttctc gaaacgggtc 3840
atcttggccg atgcgaactt ggacaaggtg ctctcggcgt acaataagca ccgggacaag 3900
ccgattcggg agcaggcgga aaacatcatc catctcttca cgctcaccaa cttgggcgcc 3960
cccgcggcgt tcaagtattt cgacacgacc atcgaccgca aacgctatac ctcgacgaag 4020
gaggtcctcg acgccaccct cattcaccaa tcgatcacgg gcttgtatga gacgcgcatc 4080
gatttgtccc agctcggcgg agactcgcgg gcggatccga agaagaagcg gaaggtctag 4140
Claims (8)
1.一种工程菌株,其特征在于,所述工程菌株是脂滴大小调控菌株,所述脂滴大小调控菌株通过调控出发菌株中的CALs基因功能灭活获得;
所述出发菌株包括圆红冬孢酵母Rhodosporidiumtoruloides、禾本红酵母Rhodotorulagraminis、粘红酵母Rhodosporidiumglutinis、掷孢酵母Sporobolomycesroseus、斯达氏油脂酵母Lipomycesstarkeyi中的至少一种。
2.根据权利要求1所述的工程菌株,其特征在于,所述工程菌株包括ΔCALs菌株,ΔCALs菌株的保藏编号为CGMCC:18928。
3.根据权利要求1所述的工程菌株,其特征在于,所述出发菌株表达Cas9和/或表达RNAi机制的Ago蛋白和Dicer酶基因。
4.一种工程菌株的构建方法,其特征在于,所述工程菌株是脂滴大小调控菌株,所述构建方法包括调控出发菌株中的CALs基因功能灭活的步骤,
其中,所述调控通过CRISPR/Cas9系统的基因编辑和/或RNAi机制完成;
所述出发菌株包括圆红冬孢酵母Rhodosporidiumtoruloides、禾本红酵母Rhodotorulagraminis、粘红酵母Rhodosporidiumglutinis、掷孢酵母Sporobolomycesroseus、斯达氏油脂酵母Lipomycesstarkeyi中的至少一种。
5.根据权利要求4所述的构建方法,其特征在于,调控所述CALs基因功能灭活的步骤包括:
构建具有SEQ ID NO:14所示的核苷酸序列的CALs-sgRNA载体;
将CALs-sgRNA载体导入表达Cas9的工程菌株,筛选、培养后得到CALs功能灭活的工程菌株。
6.根据权利要求4所述的构建方法,其特征在于,所述出发菌株为天然产油酵母菌。
7.根据权利要求1~3任一项所述的工程菌株或权利要求4~6任一项所述的构建方法构建的工程菌株在调控脂滴大小和油脂合成中的应用。
8.根据权利要求7所述的应用,其特征在于,所述应用包括通过调控出发菌株中CALs基因的表达水平来调控脂滴的大小。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911285363.3A CN112980710B (zh) | 2019-12-13 | 2019-12-13 | 一种工程菌株、其构建方法和应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911285363.3A CN112980710B (zh) | 2019-12-13 | 2019-12-13 | 一种工程菌株、其构建方法和应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112980710A CN112980710A (zh) | 2021-06-18 |
CN112980710B true CN112980710B (zh) | 2022-09-23 |
Family
ID=76342361
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911285363.3A Active CN112980710B (zh) | 2019-12-13 | 2019-12-13 | 一种工程菌株、其构建方法和应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112980710B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103965307A (zh) * | 2013-01-31 | 2014-08-06 | 中国科学院大连化学物理研究所 | 一种产油酵母脂滴蛋白及其编码基因与应用 |
CN106749560A (zh) * | 2017-01-13 | 2017-05-31 | 中国科学院生物物理研究所 | 脂滴或脂肪体通过mldsr蛋白参与的转录调控的发现及应用 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2470665A4 (en) * | 2009-08-28 | 2013-04-17 | Phycal Inc | BIOFUEL FROM RECOMBINANT OIL-CONTAINING ALGAE USING SUGAR CARBON SOURCES |
-
2019
- 2019-12-13 CN CN201911285363.3A patent/CN112980710B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103965307A (zh) * | 2013-01-31 | 2014-08-06 | 中国科学院大连化学物理研究所 | 一种产油酵母脂滴蛋白及其编码基因与应用 |
CN106749560A (zh) * | 2017-01-13 | 2017-05-31 | 中国科学院生物物理研究所 | 脂滴或脂肪体通过mldsr蛋白参与的转录调控的发现及应用 |
Non-Patent Citations (6)
Title |
---|
Developing a CRISPR/Cas9 System for Genome Editing in the Basidiomycetous Yeast Rhodosporidium toruloides;Xiang Jiao等;《Biotechnol. J.》;20190731;第14卷;第1-7页 * |
Dynamics of the Lipid Droplet Proteome of the Oleaginous Yeast Rhodosporidium toruloides;Zhiwei Zhu等;《Eukaryotic Cell》;20150331;第14卷(第3期);第255页右栏第2-3段和第261页左栏第1段 * |
Rhodotorula toruloides NP11 peripilin-like protein partial mRNA;Zhu,Z.等;《Genbank》;20160429;第1-2页序列 * |
Rhodotorula toruloides NP11 protein of caleosin family partial mRNA;Zhu,Z.等;《Genbank》;20160429;第1-2页序列 * |
RNA interference in the oleaginous yeast hodosporidium toruloides;Xiangjian Liu等;《FEMS》;20190415;第19卷;第1-10页 * |
Zhiwei Zhu等.Dynamics of the Lipid Droplet Proteome of the Oleaginous Yeast Rhodosporidium toruloides.《Eukaryotic Cell》.2015,第14卷(第3期), * |
Also Published As
Publication number | Publication date |
---|---|
CN112980710A (zh) | 2021-06-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108486146B (zh) | LbCpf1-RR突变体用于CRISPR/Cpf1系统在植物基因编辑中的应用 | |
CN111534535B (zh) | 一种构建麦角硫因生产菌的方法 | |
CN108997484B (zh) | 小麦TaWox5基因在提高小麦转化效率中的应用 | |
CN106834338B (zh) | 拟南芥基因rem16的表达载体及其在调控植株开花期中的应用 | |
CN109609396B (zh) | 一种基因工程菌及其构建方法与应用 | |
CN109022285B (zh) | 一种提高集胞藻pcc6803铵盐耐受能力的方法与应用 | |
CN111154764B (zh) | 一种通过基因组编辑提高水稻抗病性的方法及其使用的sgRNA | |
CN108531502A (zh) | 柑桔衰退病毒侵染性克隆的构建及接种方法 | |
CN112980710B (zh) | 一种工程菌株、其构建方法和应用 | |
CN112553246A (zh) | 一种基于CRISPR-SaCas9系统的高效基因组编辑载体及其应用 | |
CN112980709B (zh) | 一种工程菌株及其构建方法和应用 | |
EP2922954A1 (en) | Gene cluster for biosynthesis of cornexistin and hydroxycornexistin | |
CN109593661B (zh) | 一种产棘白菌素b的基因工程菌及其构建方法和应用 | |
CN110724689B (zh) | Cas9介导的麻竹基因编辑载体和应用 | |
CN108559759A (zh) | 三元穿梭载体及利用其构建clbv侵染性克隆的方法 | |
KR102170566B1 (ko) | 목적 유전자의 발현을 조기 종결하기 위한 벡터 및 이를 포함하는 균주 | |
CN114672509A (zh) | 一种具有高表达能力的棒状杆菌和大肠杆菌双表达载体及其构建方法 | |
CN110938650B (zh) | 一种mRNA可变剪切-荧光素酶报告系统及其应用 | |
CN113621531B (zh) | 一种酵母工程菌及其构建方法和应用 | |
Soltani et al. | A survey on optimization of Agrobacterium-mediated genetic transformation (AtMT) of Colletotrichum gloeosporioides | |
CN111394349B (zh) | 一种圆红冬孢酵母rna聚合酶iii型启动子及其应用 | |
CN111394350B (zh) | 圆红冬孢酵母rna聚合酶iii型启动子及其应用 | |
US20040158889A1 (en) | Efficient system for RNA silencing | |
KR102399035B1 (ko) | 산업 균주 내 온-타겟 효율의 감소 없이 오프-타겟이 없는 사이토신 염기 편집기를 발현하는 벡터 및 이의 용도 | |
RU2715314C1 (ru) | Генотерапевтический ДНК-вектор VTvaf17-Act1-Cas9 на основе генотерапевтического ДНК-вектора VTvaf17, несущий целевой ген Cas9, для гетерологичной экспрессии этого целевого гена в клетках растений при геномном редактировании растений, способ получения и применения генотерапевтического ДНК-вектора, штамм Escherichia coli SCS110-AF/VTvaf17-Act1-Cas9, несущий генотерапевтический ДНК-вектор, способ его получения, способ производства в промышленных масштабах генотерапевтического ДНК-вектора |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |