CN107034150B - 一种重组耶氏解脂酵母菌株及其构建方法与应用 - Google Patents
一种重组耶氏解脂酵母菌株及其构建方法与应用 Download PDFInfo
- Publication number
- CN107034150B CN107034150B CN201710239939.7A CN201710239939A CN107034150B CN 107034150 B CN107034150 B CN 107034150B CN 201710239939 A CN201710239939 A CN 201710239939A CN 107034150 B CN107034150 B CN 107034150B
- Authority
- CN
- China
- Prior art keywords
- yarrowia lipolytica
- gene
- pregnenolone
- plasmid
- adr
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0071—Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
- C12N9/0077—Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14) with a reduced iron-sulfur protein as one donor (1.14.15)
- C12N9/0081—Cholesterol monooxygenase (cytochrome P 450scc)(1.14.15.6)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/37—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
- C07K14/39—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from yeasts
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
- C12N15/815—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts for yeasts other than Saccharomyces
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0095—Oxidoreductases (1.) acting on iron-sulfur proteins as donor (1.18)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P33/00—Preparation of steroids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y114/00—Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
- C12Y114/15—Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with reduced iron-sulfur protein as one donor, and incorporation of one atom of oxygen (1.14.15)
- C12Y114/15006—Cholesterol monooxygenase (side-chain-cleaving) (1.14.15.6), i.e. cytochrome P450scc
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y118/00—Oxidoreductases acting on iron-sulfur proteins as donors (1.18)
- C12Y118/01—Oxidoreductases acting on iron-sulfur proteins as donors (1.18) with NAD+ or NADP+ as acceptor (1.18.1)
- C12Y118/01002—Ferredoxin-NADP+ reductase (1.18.1.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/22—Vectors comprising a coding region that has been codon optimised for expression in a respective host
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Biomedical Technology (AREA)
- Medicinal Chemistry (AREA)
- Mycology (AREA)
- Biophysics (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Toxicology (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本发明涉及基因工程技术领域,公开了一种重组耶氏解脂酵母菌株及其构建方法和应用。本发明在耶氏解脂酵母菌株中以葡萄糖为碳源实现甾体药物重要中间体孕烯醇酮的生物全合成,在重组耶氏解脂酵母菌株中,野猪来源mCYP11A1与牛来源的mAdR和mAdX的组合具有最佳的生产孕烯醇酮的效果。利用本发明所述重组耶氏解脂酵母菌株生产孕烯醇酮相对于生物转化方法生产孕烯醇酮步骤简单且污染小,同时解决了酿酒酵母中生物全合成孕烯醇酮对后续甾体药物生产的瓶颈问题,为孕烯醇酮的工业生产提供了一种可行的办法,并为下游孕酮、雄烯二酮、糖皮质激素等甾体激素类药物的合成打下基础。
Description
技术领域
本发明涉及基因工程技术领域,具体涉及一种重组耶氏解脂酵母菌株及其构建方法与应用。
背景技术
目前,甾体激素类药物是仅次于抗生素的第二类药物,在制备保健品、治疗呼吸系统疾病、内分泌失调、淋巴白血病、风湿病以及皮肤病等方面被广泛应用。作为制备各种甾体类药物的原材料,甾体激素中间体应用广泛,具有重要的医药价值和巨大的市场需求。其中一个重要中间体孕烯醇酮(pregnenolone)其合成是所有甾体激素合成的第一步也是限速步骤。该步骤由一个细胞色素P450侧链降解酶系统(P450scc)催化,包含细胞色素氧化酶CYP11A1及其电子传递系统中伴随蛋白铁氧还蛋白AdX和铁氧还蛋白还原酶AdR。具体反应如图1所示,首先NADPH通过AdR将电子传递给AdX,AdX再将电子传递给CYP11A1,继而CYP11A1催化胆固醇及其类似物生成孕烯醇酮。
一直以来,孕烯醇酮合成所涉及的P450电子传递系统这三种组分间适配性复杂,酶促反应效率较低,因此P450scc的优化和孕烯醇酮产量的提高始终是科学家研究的热点。2008年,Novikova.L.A研究组在耶氏解脂酵母菌株(Yarrowia lipolytica)中构建了人(Homo sapiens)来源AdX、AdR与人(Homo sapiens)和牛(Bos taurus)来源CYP11A1的P450scc表达体系,通过胆固醇添加实现了由胆固醇到孕烯醇酮的生物转化,但转化效率非常低,24h后检测到的孕烯醇酮占总甾醇比例仅为8%。2013年该课题组又在大肠杆菌中构建了牛的侧链降解系统,再次实现了胆固醇的生物转化,孕烯醇酮产量仅为420μg/L。2015年俄国另一研究者Adrian Gerber发表了在巨大芽孢杆菌(Bacillus megaterium)中胆固醇及其类似物的生物转化的研究结果,推测利用该菌株内PHB颗粒的原位催化效应使孕烯醇酮提高到了95mg/L。
虽然利用微生物转化法生产孕烯醇酮与传统方法相比具有很大优势,规避了化学合成步骤繁多、有机试剂排放等诸多弊端。但由于该反应是在微生物胞内甾体转化酶的催化作用下完成的,而甾体类物质通常具有较强的疏水性,一般很难溶解在培养基中,普遍采用的环糊精包埋方式也很难被微生物细胞吸收与酶接触反应,严重限制孕烯醇酮的生成。而合成生物学的快速发展使微生物中从头合成天然产物成为可能,利用简单碳源(如葡萄糖)对孕烯醇酮进行生物全合成,一方面可以规避疏水性底物添加造成的底物利用率低,另一方面还可以降低投料成本,更加有利于工业化生产。但是利用合成生物学方法在酵母菌株中从头合成孕烯醇酮相比于胆固醇添加的生物转化方法,其代谢路径更长、涉及到的基因更多、代谢调控更加复杂,因此在更具潜力的同时困难也更大。1998年,CatherineDuport在合成菜油甾醇基础上,于酿酒酵母中共表达牛细胞侧链降解酶系统P450scc,实现了单一碳源到孕烯醇酮的生物全合成,使产量达到60mg/L。但酿酒酵母中孕烯醇酮多以酯化形式存在,且甾体类物质通常具有较强的疏水性,在体内的储存及转运将成为制约后续甾体药物生产的瓶颈。而耶氏解脂酵母(Yarrowia lipolytica)是一种需氧的、无致病性的二型性非常规酵母。该酵母因其可以有效地利用碳水化合物或疏水性底物为唯一碳源进行生长繁殖而得到研究人员的关注。因此,亟待开发利用简单碳源(如葡萄糖)对孕烯醇酮进行生物全合成,高产孕烯醇酮的耶氏解脂酵母。
发明内容
有鉴于此,本发明的目的是提供一种合成孕烯醇酮的重组耶氏解脂酵母菌株及其构建方法与应用。
为了实现上述发明目的,本发明提供以下技术方案:
本发明提供了一种重组耶氏解脂酵母菌株,包含细胞色素氧化酶CYP11A1基因、电子传递体AdR基因和AdX基因,其中所述细胞色素氧化酶CYP11A1基因为经优化和去除线粒体转运肽的野猪、雀或牛蛙来源CYP11A1基因序列;所述AdR基因为经优化和去除线粒体转运肽的牛或耶氏解脂酵母来源AdR基因序列;所述AdX基因为经优化的和去除线粒体转运肽的牛或耶氏解脂酵母来源AdX基因序列。
优选的,所述细胞色素氧化酶CYP11A1基因的核苷酸序列如SEQ ID NO:3、SEQ IDNO:6或SEQ ID NO:8所示。
优选的,所述AdR基因的核苷酸序列如SEQ ID NO:11或SEQ ID NO:13所示;所述AdX基因的核苷酸序列如SEQ ID NO:15或SEQ ID NO:17所示。
进一步优选的,所述重组耶氏解脂酵母菌株中所述细胞色素氧化酶CYP11A1基因的核苷酸序列如SEQ ID NO:3所示,所述AdR基因的核苷酸序列如SEQ ID NO:11所示,所述AdX基因的核苷酸序列如SEQ ID NO:15所示。
本发明还提供了所述重组耶氏解脂酵母菌株的构建方法,将细胞色素氧化酶CYP11A1基因整合到耶氏解脂酵母底盘菌基因组pBR322位置,将电子传递体AdR基因和AdX基因整合到耶氏解脂酵母底盘菌基因组IntD位置。
其中,优选的,所述耶氏解脂酵母底盘菌为耶氏解脂酵母SyBE_Yl01070028。
进一步优选的,所述的构建方法具体包含如下步骤:
步骤1、将经优化和去除线粒体转运肽的CYP11A1基因两端分别引入BsaI酶切位点,采用Golden Gate技术与pUC57K-GPATp-PEX16t质粒构建,获得pUC57K-GPATp-mCYP11A1-PEX16t质粒,PCR扩增获得GPATp-mCYP11A1-PEX16t基因表达盒,利用In-Fusioncloning reaction重组到pYLEX1质粒上,获得pYLEX1-GPATp-mCYP11A1-PEX16t质粒,采用醋酸锂法将上述质粒转化耶氏解脂酵母底盘菌,Sc-URA-LEU固体培养基筛选转化子;
步骤2、将经优化和去除线粒体转运肽的AdR基因两端分别引入BsaI酶切位点,采用Golden Gate技术与pUC57K-GPM1t-TEFp-LIP2t-GPDt质粒构建,获得pUC57K-GPM1t-TEFp-mAdR-LIP2t-GPDt质粒,PCR扩增获得上游引入40bp同源序列获得GPM1t(40bp)-TEFp-mAdR-LIP2t-GPDt基因组整合片段;
将经优化和去除线粒体转运肽的AdR和AdX基因两端分别引入BsaI酶切位点,采用Golden Gate技术与pUC57K-GPDt-GPDp-OCTt-FBA1t质粒构建,获得pUC57K-GPDt-GPDp-mAdX-OCTt-FBA1t质粒,PCR扩增获得上游引入40bp同源序列获得GPDt(40bp)-GPDp-mAdX-OCTt-FBA1t基因组整合片段;
采用PCR扩增获得上游整合片段IntD-L-GPM1t、下游整合片段IntD-R;
步骤3、将步骤2获得的整合片段与克隆载体质粒进行Gibson组装,酶切后获得IntD-L-TEFp-mAdR-LIP2t-GPDp-mAdX-OCTt-IntD-R片段;
步骤4、采用醋酸锂法将步骤3获得的片段转化到步骤1获得的耶氏解脂酵母转化子中,整合于基因组IntD位置,含潮霉素的Sc-URA-LEU固体平板筛选转化子。
本发明还提供了所述的重组耶氏解脂酵母菌株在生产孕烯醇酮中的应用。
进一步,本发明还提供了一种生产孕烯醇酮的方法,将所述的重组耶氏解脂酵母菌株接入种子培养基活化;将活化后的菌株接种于发酵培养基中发酵培养,发酵培养后收集菌体细胞提取孕烯醇酮。
优选的,所述生产孕烯醇酮的方法具体为将本发明所述的重组耶氏解脂酵母菌株接入种子培养基在28℃、250rpm活化24h,转接至新鲜的种子培养基,在28℃、220rpm活化18h,转接至发酵培养基28℃、220rpm发酵169h,收集菌体提取孕烯醇酮;其中,所述种子培养基为22g/L葡萄糖、20g/L蛋白胨、10g/L酵母浸粉,余量为水;所述发酵培养基为50g/L葡萄糖、20g/L蛋白胨、10g/L酵母浸粉,余量为水。
本发明在耶氏解脂酵母菌株中以葡萄糖为碳源实现甾体药物重要中间体孕烯醇酮的生物全合成,在重组耶氏解脂酵母菌株中,野猪来源mCYP11A1(Ss_mCYP11A1)与牛来源的mAdR(Bt_mAdR)和mAdX(Bt_mAdX)的组合具有最佳的生产孕烯醇酮的效果。利用本发明所述重组耶氏解脂酵母菌株生产孕烯醇酮相对于生物转化方法生产孕烯醇酮步骤简单且污染小,同时解决了酿酒酵母中生物全合成孕烯醇酮对后续甾体药物生产的瓶颈问题,为孕烯醇酮的工业生产提供了一种可行的办法,并为下游孕酮、雄烯二酮、糖皮质激素等甾体激素类药物的合成打下基础。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1示重组耶氏解脂酵母合成孕烯醇酮的路经图及侧链降解酶系统P450scc的催化反应过程;
图2示P450scc系统中细胞色素氧化酶CYP11A1及电子传递体AdR、AdX的线粒体转运肽截断方式对比图;A为CYP11A1基因;B为AdR基因;C为AdX基因;实线为已知的线粒体转运肽截断位置;虚线为推测的线粒体转运肽截断位置;
图3示耶氏解脂酵母中mCYP11A1整合型质粒构建过程图;
图4示耶氏解脂酵母中mAdR和mAdX在染色体D上的整合示意图;
图5示孕烯醇酮标准曲线;
图6示重组耶氏解脂酵母菌株36种P450scc组合的孕烯醇酮摇瓶产量比较图。
具体实施方式
本发明公开了一种重组耶氏解脂酵母菌株及其构建方法和应用。本领域技术人员可以借鉴本文内容,适当改进工艺参数实现。特别需要指出的是,所有类似的替换和改动对本领域技术人员来说是显而易见的,它们都被视为包含在本发明。本发明的方法及产品已经通过较佳实施例进行了描述,相关人员明显能在不脱离本发明内容、精神和范围内对本文所述的方法进行改动或适当变更与组合,来实现和应用本发明技术。
为实现本发明的目的,本发明提供以下技术方案:
本发明以高产菜油甾醇耶氏解脂酵母SyBE_Yl01070028为底盘菌株,选取9种不同物种来源细胞色素氧化酶CYP11A1,经优化且去除线粒体转运肽后利用单拷贝整合型质粒pYLEX1在底盘菌基因组上分别进行整合,获得9种成熟CYP11A1的菌株。再分别以上述9种菌株为底盘,选取4种不同物种来源的电子传递体AdR、AdX,经优化且去除线粒体转运肽后通过片段同源重组分别整合在9种底盘菌染色体D的IntD位置,得到P450scc36种不同组合的菌株,通过摇瓶发酵筛选耶氏解脂酵母体内合成孕烯醇酮最优的P450scc组合。
9种不同来源的CYP11A1的基因来源包括人(Homo sapiens)、牛(Bostaurus)、野猪(Sus scrofa)、小鼠(Mus musculus)、鸡(Gallus gallus)、雀(Taeniopygia guttata)、斑马鱼(Danio rerio)、牛蛙(Lithobates catesbeiana)和木本棉(Gossypium arboreum)。4种不同来源的AdR、AdX基因,分别为人(Homo sapiens)、牛(Bos taurus)、拟南芥(Arabidopsis thaliana)和耶氏解脂酵母(Yarrowia lipolytica)。
本发明所述重组耶氏解脂酵母菌株中所述优化具体包含耶氏解脂酵母密码子优化、规避BsaⅠ限制性内切酶酶切位点和在基因两端额外添加核苷酸序列。
其中,在一些实施方案中,所述基因5’端额外添加的核苷酸序列如SEQ ID NO:18所示(gcggccgcggtctcca);3’端额外添加的核苷酸序列如SEQ ID NO:19所示(taaaggagaccgcggccgc)。
为进一步提高P450scc酶对前体菜油甾醇的获得性使催化反应在细胞质中进行,需通过PCR反应去除CYP11A1的线粒体转运肽,部分来源CYP11A1线粒体转运肽已知,未知来源根据序列比对进行推测,具体线粒体转运肽截断方式如图2所示。
经过优化和去除线粒体转运肽获得成熟CYP11A1,即mCYP11A1,依次简写为Hs_mCYP11A1、Bt_mCYP11A1、Ss_mCYP11A1、Mm_mCYP11A1、Gg_mCYP11A1、Tg_mCYP11A1、Dr_mCYP11A1、Lc_mCYP11A1、Ga_mCYP11A1。经过优化和去除线粒体转运肽获得成熟。AdR、AdX,依次简写为Hs_mAdR、Hs_mAdX、Bt_mAdR、Bt_mAdX、At_mAdR、At_mAdX、Yl_mAdR、Yl_mAdX。
本发明筛选获得一种重组耶氏解脂酵母菌株,包含细胞色素氧化酶CYP11A1基因、电子传递体AdR基因和AdX基因,所述细胞色素氧化酶CYP11A1基因为经优化和去除线粒体转运肽的野猪、雀或牛蛙来源CYP11A1基因序列;所述AdR基因为经优化和去除线粒体转运肽的牛或耶氏解脂酵母来源AdR基因序列;所述AdX基因为经优化的和去除线粒体转运肽的牛或耶氏解脂酵母来源AdX基因序列。
在一些实施方案中,所述重组耶氏解脂酵母菌株中,所述细胞色素氧化酶CYP11A1基因的核苷酸序列如SEQ ID NO:3、SEQ ID NO:6或SEQ ID NO:8所示。
在一些实施方案中,所述重组耶氏解脂酵母菌株中,所述AdR基因的核苷酸序列如SEQ ID NO:11或SEQ ID NO:13所示;所述AdX基因的核苷酸序列如SEQ ID NO:15或SEQ IDNO:17所示。
进一步的,在一些优选实施方案中,所述的重组耶氏解脂酵母菌株,所述细胞色素氧化酶CYP11A1基因为经优化和去除线粒体转运肽的野猪来源CYP11A1基因序列,核苷酸序列如SEQ ID NO:3所示;所述AdR基因为经优化和去除线粒体转运肽的牛来源AdR基因序列,核苷酸序列如SEQ ID NO:11所示;所述AdX基因为经优化的和去除线粒体转运肽的牛来源AdX基因序列的核苷酸序列如SEQ ID NO:15所示。
本发明还提供了所述重组耶氏解脂酵母菌株的构建方法,将细胞色素氧化酶CYP11A1基因整合到耶氏解脂酵母底盘菌基因组pBR322位置,将电子传递体AdR基因和AdX基因整合到耶氏解脂酵母底盘菌基因组IntD位置。
在一些实施方案中,所述构建方法中所述耶氏解脂酵母底盘菌优选为高产菜油甾醇耶氏解脂酵母SyBE_Yl01070028。
在一些实施方案中,所述构建方法具体包含如下步骤:
步骤1、将经优化和去除线粒体转运肽的CYP11A1基因两端分别引入BsaI酶切位点,采用Golden Gate技术与pUC57K-GPATp-PEX16t质粒构建,获得pUC57K-GPATp-mCYP11A1-PEX16t质粒,PCR扩增获得GPATp-mCYP11A1-PEX16t基因表达盒,利用In-Fusioncloning reaction重组到pYLEX1质粒上,获得pYLEX1-GPATp-mCYP11A1-PEX16t质粒,采用醋酸锂法将上述质粒转化耶氏解脂酵母底盘菌,Sc-URA-LEU固体培养基筛选转化子;
步骤2、将经优化和去除线粒体转运肽的AdR基因两端分别引入BsaI酶切位点,采用Golden Gate技术与pUC57K-GPM1t-TEFp-LIP2t-GPDt质粒构建,获得pUC57K-GPM1t-TEFp-mAdR-LIP2t-GPDt质粒,PCR扩增获得上游引入40bp同源序列GPM1t(40bp)-TEFp-mAdR-LIP2t-GPDt基因组整合片段;
将经优化和去除线粒体转运肽的AdR和AdX基因两端分别引入BsaI酶切位点,采用Golden Gate技术与pUC57K-GPDt-GPDp-OCTt-FBA1t质粒构建,获得pUC57K-GPDt-GPDp-mAdX-OCTt-FBA1t质粒,PCR扩增获得上游引入40bp同源序列获得GPDt(40bp)-GPDp-mAdX-OCTt-FBA1t基因组整合片段;
采用PCR扩增获得上游整合片段IntD-L-GPM1t、下游整合片段IntD-R;
步骤3、将步骤2获得的整合片段与克隆载体质粒进行Gibson组装,酶切后获得IntD-L-TEFp-mAdR-LIP2t-GPDp-mAdX-OCTt-IntD-R片段;
步骤4、采用醋酸锂法步骤3获得的片段转化到步骤1获得的耶氏解脂酵母转化子中,整合于基因组IntD位置,含潮霉素的Sc-URA-LEU固体培养基筛选转化子。
步骤1所述PCR扩增获得GPATp-mCYP11A1-PEX16t基因表达盒具体为利用两端分别包含SalⅠ、ClaⅠ限制性内切酶酶切位点及外侧碱基序列共15bp的核酸序列的引物进行PCR扩增,使GPATp-mCYP11A1-PEX16t基因表达盒两端分别引入SalⅠ、ClaⅠ限制性内切酶酶切位点及外侧碱基序列的15bp载体同源序列用于接下来与载体In-Fusion同源重组。具体来讲,左边15bp含有SalI的酶切位点,其余为载体上SalI的酶切位点外侧的序列;右边15bp含有ClaI的酶切位点,其余为载体上ClaI的酶切位点外侧的序列。
在一些实施方案中,所述扩增获得GPATp-mCYP11A1-PEX16t基因表达盒的引物序列如SEQ ID NO:20(F:AAGGGCATCGGTCGACCAACTTTTCTTGTCGACCTGAGATACC)和SEQ ID NO:21所示(R:GACAGCTTATCATCGATTTTCCGAGCTCGATGCTGG),下划线部分为酶切位点。
步骤2所述PCR扩增获得上游引入40bp同源序列的GPM1t(40bp)-TEFp-mAdR-LIP2t-GPDt基因组整合片段的引物序列为Gi-Yl-2-F:TTTTCAGCCTGTCGTGGTAGCAAT和Gi-Yl-2-R:ATCCACAATGTATCAGGTATCT。所述GPM1t(40bp)-TEFp-mAdR-LIP2t-GPDt基因组整合片段的上游40bp同源序列如SEQ ID NO:22所示(ttttcagcctgtcgtggtagcaatttgaggagtattatta)。
步骤2所述PCR扩增获得上游引入40bp同源序列获得GPDt(40bp)-GPDp-mAdX-OCTt-FBA1t基因组整合片段的引物序列为Gi-Yl-3-F:ACATGTAATATCTGTAGTAGATACC和Gi-Yl-3-R:AAAGATGAGCTAGGCTTTTGT。所述GPDt(40bp)-GPDp-mAdX-OCTt-FBA1t基因组整合片段的上游40bp同源序列如SEQ ID NO:23所示(acatgtaatatctgtagtagatacctgatacattgtggat)。
步骤2所述采用PCR扩增获得上游整合片段IntD-L-GPM1t的引物序列为Gi-pUC18H(40)-F:tttcccagtcacgacgttgtaaaacgacggccagtgcgtcgcggccgcgacatgatacattctgttgctgg;Gi-GPM1t-R:TAATAATACTCCTCAAATTGCT。所述上游整合片段IntD-L-GPM1t序列如SEQ IDNO:24所示。
步骤2所述采用PCR扩增获得下游整合片段IntD-R的引物序列为Gi-Hp h(40)-F:ACTGAAAACCTTGCTTGAGAAGGTTTTGGGACGCTCGAAGtgtgaagacggccagatacag;Gi-pUC18H(40)-R:CAATTTCACACAGGAAACAGCTATGACCATGATTACGGTCGCGGCCGCAATGTCTGTACCTGACGTTATCTC。所述下游整合片段IntD-R序列如SEQ ID NO:25所示。
本领域技术人员可以理解,步骤3所述克隆载体可以为常用的任意克隆载体,包括但不限于pUC18H。
步骤4所述含潮霉素的Sc-URA-LEU固体培养基中所述潮霉素含量为100μg/mL。
利用本发明所述重组耶氏解脂酵母菌株生产孕烯醇酮,相对于生物转化步骤简单且污染小,同时可解决了酿酒酵母中生物全合成孕烯醇酮对后续甾体药物生产的瓶颈问题。因此本发明提供了所述重组耶氏解脂酵母菌株在生产孕烯醇酮中的应用。
进一步本发明提供了一种生产孕烯醇酮的方法,将所述的重组耶氏解脂酵母菌株接入种子培养基活化;将活化后的菌株接种于发酵培养基中发酵培养,发酵培养后收集菌体细胞提取孕烯醇酮。
在一些实施方案中,所述方法具体为将所述的重组耶氏解脂酵母菌株接入种子培养基在28℃、250rpm活化24h,转接至新鲜的种子培养基,在28℃、220rpm活化18h,转接至发酵培养基28℃、220rpm发酵169h,收集菌体提取孕烯醇酮;
其中,所述种子培养基为22g/L葡萄糖、20g/L蛋白胨、10g/L酵母浸粉,余量为水;所述发酵培养基为50g/L葡萄糖、20g/L蛋白胨、10g/L酵母浸粉,余量为水。
优选的,以包含野猪来源mCYP11A1(Ss_mCYP11A1)与牛来源的mAdR(Bt_mAdR)和AdX(Bt_mAdX)重组耶氏解脂酵母菌株SyBE_Yl02060029发酵生产孕烯醇酮。
为了进一步理解本发明,下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如无特殊说明,本发明实施例中所涉及的试剂均为市售产品,均可以通过商业渠道购买获得。在本发明中所涉及的一些质粒载体、菌株均可由市场购得,pUC57K-GPATp-PEX16t、pUC57K-GPM1t-TEFp-LIP2t-GPDt、pUC57K-GPDt-GPDp-OCTt-FBA1t表达盒保存于天津大学元英进实验室。存菌号为SyBE_Yl01070028的耶氏解脂酵母是一株高产菜油甾醇的耶氏解脂酵母菌株,保存于天津大学合成生物学元英进课题组(Du H X,Xiao W H,Wang Y,et al.Engineering Yarrowia lipolytica for campesterol overproduction[J].PloSone,2016,11(1):e0146773。该菌株基因型为:erg5::URA3-EXP1p-DHCR7(Xenopus laevis)D409E-XPR2t)。
实施例1:外源功能基因元件CYP11A1、AdR、AdX的获得
外源基因为用于合成孕烯醇酮的P450scc系统,包含细胞色素氧化酶CYP11A1,电子传递体AdR和AdX:为筛选合成孕烯醇酮最优的基因来源,选取9种不同来源的CYP11A1基因,CYP11A1的基因来源包含人(Homo sapiens)、牛(Bos taurus)、野猪(Sus scrofa)、小鼠(Mus musculus)、鸡(Gallus gallus)、雀(Taeniopygia guttata)、斑马鱼(Danio rerio)、牛蛙(Lithobates catesbeiana)和木本棉(Gossypium arboreum)等,上述基因均经过耶氏解脂酵母密码子优化并适当规避BsaⅠ限制性内切酶酶切位点,在基因两端额外添加5’端gcggccgcggtctcca;3’taaaggagaccgcggccgc,通过人工合成得到。
为进一步提高P450scc酶对前体菜油甾醇的获得性使催化反应在细胞质中进行,需通过PCR反应去除CYP11A1的线粒体转运肽,部分来源CYP11A1线粒体转运肽已知,未知来源根据序列比对进行推测,获得的成熟CYP11A1(即mCYP11A1)依次简写为Hs_mCYP11A1、Bt_mCYP11A1、Ss_mCYP11A1、Mm_mCYP11A1、Gg_mCYP11A1、Tg_mCYP11A1、Dr_mCYP11A1、Lc_mCYP11A1、Ga_mCYP11A1,具体线粒体转运肽截断方式如图2所示,经耶氏解脂酵母密码子优化后的基因序列如表1。
另选取4种不同来源的AdR、AdX基因,分别为人(Homo sapiens)、牛(Bos taurus)、拟南芥(Arabidopsis thaliana)和耶氏解脂酵母(Yarrowia lipolytica)。同理,上述基因均按照耶氏解脂酵母密码子优化并适当规避BsaⅠ限制性内切酶酶切位点,在基因两端额外添加5’端gcggccgcggtctcca;3’端taaaggagaccgcggccgc后人工合成,且根据序列比对截断线粒体转运肽获得成熟AdR、AdX,依次简写为Hs_mAdR、Hs_mAdX、Bt_mAdR、Bt_mAdX、At_mAdR、At_mAdX、Yl_mAdR、Yl_mAdX。具体线粒体转运肽截断方式如图2所示,经耶氏解脂酵母密码子优化后的基因序列见表1
表1经耶氏解脂酵母密码子优化的不同来源的CYP11A1、AdR和AdX基因序列
实施例2:构建生产孕烯醇酮的重组耶氏解脂酵母菌株
将获得的9种外源CYP11A1基因进行PCR扩增,获得线粒体转运肽截断的mCYP11A1基因,同时两端各引入一个BsaⅠ限制性内切酶酶切位点,将pUC57K-GPATp-PEX16t质粒(可在http://synbioml.org/免费获取)及获得的外源mCYP11A1基因用Golden Gate方法进行构建,获得9种来源mCYP11A1的pUC57K-GPATp-mCYP11A1-PEX16t大肠杆菌游离型多拷贝质粒。将获得的9种外源CYP11A1基因表达盒GPATp-mCYP11A1-PEX16t进行PCR扩增,两端分别用引物扩增引入包含载体的SalⅠ、ClaⅠ两个限制性内切酶酶切位点及外侧碱基序列共15bp的核酸序列,利用In-Fusion cloning reaction重组到经SalⅠ、ClaⅠ双酶切后的pYLEX1质粒上,获得9种来源mCYP11A1的pYLEX1-GPATp-mCYP11A1-PEX16t耶氏解脂酵母整合型单拷贝质粒,构建过程如图3所示。
采用醋酸锂法将9种质粒分别转化到SyBE_Yl01070028底盘菌株中,整合于基因组pBR322platform位置,采用Sc-URA-LEU固体平板(合成酵母氮源YNB 6.7g/L,葡萄糖22g/L,缺尿嘧啶和亮氨酸的混合氨基酸粉末2g/L,2%的琼脂粉)进行筛选,得到的转化子进行划线分纯培养后提取酵母基因组进行PCR验证,对验证正确的重组菌株保存甘油菌并分别命名为SyBE_Yl02060009-SyBE_Yl02060017。其中,各菌株基因组基因型见附表2。
然后,按照上述方法将获得的4种外源AdR和AdX基因进行PCR扩增,获得线粒体转运肽截断的mAdR和mAdX基因,同时两端各引入一个BsaⅠ限制性内切酶酶切位点,将pUC57K-GPM1t-TEFp-LIP2t-GPDt质粒(可在http://synbioml.org/免费获取)及获得的外源mAdR基因用Golden Gate方法进行构建,获得4种来源mAdR的pUC57K-GPM1t-TEFp-mAdR-LIP2t-GPDt大肠杆菌游离型多拷贝质粒。将pUC57K-GPDt-GPDp-OCTt-FBA1t质粒(可在http://synbioml.org/免费获取)及获得的外源mAdX基因用Golden Gate方法进行构建,获得4种来源mAdX的pUC57K-GPDt-GPDp-mAdX-OCTt-FBA1t大肠杆菌游离型多拷贝质粒。将上述质粒PCR扩增分别在mAdR和mAdX表达盒上游引入40bp的核酸序列,获得4种来源的GPM1t(40bp)-TEFp-mAdR-LIP2t-GPDt和GPDt(40bp)-GPDp-mAdX-OCTt-FBA1t基因组整合片段。选择文献中报道但未经实验验证的耶氏解脂酵母染色体D上的可整合位点IntD(YALI0D1632529-YALI0D1633537)作为mAdR、mAdX基因表达盒的在基因组的整合位置。如图4所示,上游整合片段的构建首先以NotI酶切位点为分界将IntD基因前段从耶氏解脂酵母基因组上PCR扩增,同时在上游引入pUC18H的HincⅡ酶切位点上游40bp的核酸序列及NotI酶切位点,在下游引入GPM1t核酸序列,获得上游整合片段IntD-L-GPM1t。抗性基因整合片段的构建采用PCR方法扩增潮霉素抗性基因表达盒hph在上游引入40bp的FBA1t核酸序列,获得抗性基因整合片段FBA1t(40bp)-hph。下游整合片段的构建将IntD基因后段从耶氏解脂酵母基因组上PCR扩增,同时在上游引入hph表达盒尾端40bp的核酸序列,在下游引入pUC18H的HincⅡ酶切位点下游40bp的核酸序列及NotI酶切位点,获得下游整合片段IntD-R。将上述获得的所有整合片段(包含IntD-L-GPM1t、GPM1t-TEFp-mAdR-LIP2t-GPDt、GPDt-GPDp-mAdX-OCTt-FBA1t、FBA1t-hph、IntD-R)与经HincⅡ酶切后的pUC18H质粒进行Gibson组装,获得4种来源mAdR和mAdX的pUC18H-IntD-L-TEFp-mAdR-LIP2t-GPDp-mAdX-OCTt-IntD-R的大肠杆菌游离型多拷贝质粒,后经NotI酶切后获得4种来源基因组整合片段IntD-L-TEFp-mAdR-LIP2t-GPDp-mAdX-OCTt-IntD-R。
采用醋酸锂法将4种片段分别转化到SyBE_Yl02060009-SyBE_Yl02060017这9种底盘菌株中,整合于基因组IntD位置,获得36种P45scc的不同组合。采用含潮霉素(100μg/mL)的Sc-URA-LEU固体平板进行筛选,PCR验证正确的重组菌株分别命名为SyBE_Yl02060020-SyBE_Yl02060055,各菌株基因组基因型见附表2。
表2各菌株基因组基因型列表
实施例3:菌株SyBE_Yl02060020-SyBE_Yl02060055的孕烯醇酮摇瓶产量比较
1、试验材料:
耶氏解脂酵母菌株SyBE_Yl02060020-SyBE_Yl02060055;
一级、二级种子培养基:22g/L葡萄糖、20g/L蛋白胨、10g/L酵母浸粉;
发酵培养基:50g/L葡萄糖、20g/L蛋白胨、10g/L酵母浸粉。
2、试验方法:
将上述菌株SyBE_Yl02060020-SyBE_Yl02060055接种于5mL一级种子培养基中,在28℃、250rpm培养24h,以初始菌体浓度OD600=0.2分别接种于二级种子培养基中,在28℃、220rpm培养18h,再以初始菌体浓度OD600=0.2分别接种于50mL发酵培养基中,每种菌株做两组平行,于28℃、220rpm条件下培养,发酵169小时结束,测定菌体密度(OD600),取10mL菌液提取孕烯醇酮。
孕烯醇酮提取方法:取10mL发酵液,6000rpm离心5min收集菌体,水洗两次。用液氮冷冻细胞并在研钵中研磨,直到细胞被研磨成白色极细粉末,转移至新10mL离心管中,加入2mL甲醇配制的1.5M KOH,60℃水浴皂化反应过夜。皂化后加入2mL分析纯正己烷涡旋震荡10min对产物进行萃取,5000rpm离心10min收集一定量有机相真空冷冻干燥2h,加入400μL正己烷溶解再次冷冻干燥4h,加入400μL衍生化试剂N-甲基-N-三甲基硅基三氟乙酰胺(MSTFA)30℃水浴2h,用2μm有机滤膜过滤后利用GC/MS检测孕烯醇酮含量。
3、试验结果:
统计不同菌株孕烯醇酮产量,结果见表3及图5和图6。
表3气相色谱-质谱联用(GC-MS)检测数据
结果显示,发酵169小时,P450scc所有36种组合的产量均较低,几乎一半的组合孕烯醇酮的产量在检测限以下,尤其是文献中报道使用的Hs_mCYP11A1或Bt_mCYP11A1与Hs_mAdR和Hs_mAdX的组合孕烯醇酮产量较低,不建议继续选用。但当组合细胞色素氧化酶为Ss_mCYP11A1、Tg_mCYP11A1或Lc_mCYP11A1时,孕烯醇酮的产量较为显著,说明与电子传递体mAdR和mAdX相比,细胞色素氧化酶mCYP11A1对于P450scc系统的催化水平占主导作用,同时也表明推测的线粒体转运肽截断方式至少在Tg_mCYP11A1、Lc_mCYP11A1和Yl_mAdR、Yl_mAdX上是有效的。在所有组合中Ss_mCYP11A1与Bt_mAdR、Bt_mAdX组合,即菌株SyBE_Yl02060029孕烯醇酮产量为203±17μg/L,表现出最佳的效果。
由此可知,侧链降解酶系统P450scc基因来源的组合的不同对于重组耶氏解脂酵母生产孕烯醇酮具有不同影响,在重组耶氏解脂酵母中野猪来源mCYP11A1(Ss_mCYP11A1)与牛来源的mAdR(Bt_mAdR)和mAdX(Bt_mAdX)组合效果明显好于已报道最高产量的基因来源。
SEQUENCE LISTING
<110> 天津大学
<120> 一种重组耶氏解脂酵母菌株及其构建方法与应用
<130> MP1701566
<160> 25
<170> PatentIn version 3.3
<210> 1
<211> 1566
<212> DNA
<213> Homo sapiens
<400> 1
atgctggcta agggtctgcc tcctcgatcc gtgctggtca agggttgtca gaccttcctg 60
tctgctcctc gagagggtct gggtcgactg cgagtgccta ccggagaggg tgctggtatc 120
tctacccgat ccccccgacc cttcaacgag attccctccc ccggcgacaa cggatggctg 180
aacctgtacc acttctggcg agagactggc acccacaagg tgcacctgca ccacgtccag 240
aacttccaga agtacggccc catctaccga gagaagctgg gaaacgtgga gtccgtgtac 300
gtcattgacc ccgaggacgt cgccctgctg ttcaagtctg agggacccaa ccccgagcga 360
ttcctgatcc ccccctgggt ggcttaccac cagtactacc agcgacccat tggtgtcctg 420
ctgaagaagt ctgccgcttg gaagaaggac cgagtggccc tgaaccagga ggtcatggcc 480
cccgaggcta ccaagaactt cctgcctctg ctggacgccg tgtcccgaga cttcgtgtct 540
gtcctgcacc gacgaatcaa gaaggctgga tctggtaact actccggcga catttctgac 600
gacctgttcc gattcgcttt cgagtccatc accaacgtga ttttcggaga gcgacagggc 660
atgctggagg aggtggtcaa ccctgaggct cagcgattca tcgacgctat ctaccagatg 720
ttccacacct ctgtccccat gctgaacctg ccccccgacc tgttccgact gttccgaacc 780
aagacctgga aggaccacgt ggccgcttgg gacgtcatct tctccaaggc cgacatctac 840
acccagaact tctactggga gctgcgacag aagggatctg tccaccacga ctaccgagga 900
atcctgtacc gactgctggg tgactctaag atgtccttcg aggacattaa ggccaacgtg 960
accgagatgc tggctggcgg agtcgacacc acctccatga ccctgcagtg gcacctgtac 1020
gagatggccc gaaacctgaa ggtgcaggac atgctgcgag ctgaggtcct ggctgctcga 1080
caccaggctc agggtgacat ggctaccatg ctgcagctgg tgcccctgct gaaggcctcc 1140
atcaaggaga ctctgcgact gcaccccatt tctgtcaccc tgcagcgata cctggtgaac 1200
gacctggtcc tgcgagacta catgatcccc gctaagaccc tggtgcaggt cgccatctac 1260
gctctgggac gagagcccac cttcttcttc gaccccgaga acttcgaccc cacccgatgg 1320
ctgtctaagg acaagaacat cacctacttc cgaaacctgg gcttcggatg gggtgtgcga 1380
cagtgcctgg gtcgacgaat tgccgagctg gagatgacca tcttcctgat taacatgctg 1440
gagaacttcc gagtggagat ccagcacctg tccgacgtcg gaaccacctt caacctgatc 1500
ctgatgcccg agaagcccat ttctttcacc ttctggccct tcaaccagga ggctacccag 1560
cagtaa 1566
<210> 2
<211> 1563
<212> DNA
<213> Bos taurus
<400> 2
atgctggctc gaggcctgcc tctgcgatct gccctggtga aggcttgtcc ccccattctg 60
tccaccgtgg gagagggttg gggacaccac cgagtcggta ccggagaggg agctggtatc 120
tctaccaaga ccccccgacc ctactctgag attccctccc ccggtgacaa cggctggctg 180
aacctgtacc acttctggcg agagaagggc tcccagcgaa tccacttccg acacattgag 240
aacttccaga agtacggtcc catctaccga gagaagctgg gcaacctgga gtctgtgtac 300
atcattcacc ccgaggacgt cgcccacctg ttcaagttcg agggatccta ccccgagcga 360
tacgacattc ccccctggct ggcttaccac cgatactacc agaagcccat cggcgtgctg 420
ttcaagaagt ctggaacctg gaagaaggac cgagtggtcc tgaacaccga ggtcatggcc 480
cccgaggcta tcaagaactt cattcccctg ctgaaccccg tgtctcagga cttcgtctcc 540
ctgctgcaca agcgaatcaa gcagcagggc tctggaaagt tcgtgggcga cattaaggag 600
gacctgttcc acttcgcctt cgagtccatc accaacgtca tgttcggaga gcgactgggt 660
atgctggagg agactgtgaa ccccgaggcc cagaagttca ttgacgctgt ctacaagatg 720
ttccacacct ctgtgcctct gctgaacgtc cctcctgagc tgtaccgact gttccgaacc 780
aagacctggc gagatcacgt ggccgcttgg gacaccatct tcaacaaggc cgagaagtac 840
accgagattt tctaccagga cctgcgacga aagaccgagt tccgaaacta ccccggaatt 900
ctgtactgtc tgctgaagtc cgagaagatg ctgctggagg acgtgaaggc caacatcacc 960
gagatgctgg ctggcggagt caacaccacc tctatgaccc tgcagtggca cctgtacgag 1020
atggcccgat ccctgaacgt gcaggagatg ctgcgagagg aggtcctgaa cgcccgacga 1080
caggctgagg gtgacatctc taagatgctg cagatggtcc ccctgctgaa ggcttccatc 1140
aaggagactc tgcgactgca ccccatttct gtgaccctgc agcgataccc cgagtccgac 1200
ctggtcctgc aggactacct gatccccgcc aagaccctgg tgcaggtcgc catctacgct 1260
atgggacgag atcccgcttt cttctcttcc cccgacaagt tcgaccccac ccgatggctg 1320
tccaaggaca aggacctgat tcacttccga aacctgggtt tcggttgggg agtgcgacag 1380
tgcgtcggac gacgaatcgc cgagctggag atgaccctgt tcctgatcca cattctggag 1440
aacttcaagg tggagatgca gcacattggt gacgtcgaca ccatcttcaa cctgattctg 1500
acccccgaca agcccatctt cctggtgttc cgacccttca accaggaccc tcctcaggct 1560
taa 1563
<210> 3
<211> 1563
<212> DNA
<213> Sus scrofa
<400> 3
atgctggccc gaggactggc tctgcgatct gtgctggtca agggttgtca gcccttcctg 60
tccgctcctc gagagtgccc tggtcaccct cgagtcggta ccggagaggg agcttgtatc 120
tctaccaaga ccccccgacc cttctctgag atcccctccc ccggagacaa cggttggatt 180
aacctgtacc gattctggaa ggagaaggga acccagaaga tccactacca ccacgtgcag 240
aacttccaga agtacggccc catctaccga gagaagctgg gaaacctgga gtccgtctac 300
atcattgacc ccgaggacgt ggccctgctg ttcaagttcg agggccccaa ccccgagcga 360
tacaacattc ccccctgggt cgcctaccac cagcactacc agaagcccgt gggtgtcctg 420
ctgaagaagt ctggcgcttg gaagaaggac cgactggtcc tgaacaccga ggtcatggcc 480
cccgaggcta tcaagaactt cattcccctg ctggacaccg tgtcccagga cttcgtgggc 540
gtcctgcacc gacgaatcaa gcagcagggt tctggcaagt tctccggaga cattcgagag 600
gacctgttcc gattcgcctt cgagtctatc accaacgtca ttttcggcga gcgactggga 660
atgctggagg agatcgtgga ccccgaggcc cagaagttca ttgacgctgt ctaccagatg 720
ttccacacct ccgtgcctat gctgaacctg cctcccgacc tgttccgact gttccgaacc 780
aagacctggc gagatcacgt cgccgcttgg gacaccatct tcaacaaggc cgagaagtac 840
acccagaact tctactggga cctgcgacga aagcgagagt tcaacaacta ccccggaatt 900
ctgtaccgac tgctgggtaa cgacaagctg ctgtctgagg acgtcaaggc caacgtgacc 960
gagatgctgg ctggcggagt ggacaccacc tctatgaccc tgcagtggca cctgtacgag 1020
atggcccgat ccctgaacgt ccaggagatg ctgcgagagg aggtgctgaa cgcccgacga 1080
caggctcagg gagacacctc caagatgctg cagctggtcc ccctgctgaa ggcttctatc 1140
aaggagactc tgcgactgca ccccatttcc gtgaccctgc agcgatacct ggtcaacgac 1200
ctggtgctgc gagactacat gatccctgct aagaccctgg tgcaggtcgc tgtgtacgct 1260
atgggtcgag atcccgcttt cttctctaac cccggacagt tcgaccctac ccgatggctg 1320
ggcaaggagc gggacctgat ccacttccga aacctgggat tcggttgggg cgtccgacag 1380
tgcgtcggac gacgaattgc cgagctggag atgaccctgt tcctgatcca cattctggag 1440
aacttcaagg tcgagctgca gcacttctcc gacgtggaca ccatcttcaa cctgattctg 1500
atgcccgaca agcccatttt cctggtgttc cgacccttca accaggaccc cctgcaggct 1560
taa 1563
<210> 4
<211> 1581
<212> DNA
<213> Mus musculus
<400> 4
atgctggcta agggtctgtc tctgcgatcc gtgctggtca agggctgtca gcccttcctg 60
tctcctacct ggcagggacc tgtgctgtcc accggaaagg gtgctggtac ctccacctct 120
tcccctcgat ctttcaacga gatcccctcc cccggagaca acggttggct gaacctgtac 180
cacttctggc gagagtctgg tacccagaag atccactacc accagatgca gtccttccag 240
aagtacggcc ccatctaccg agagaagctg ggaaccctgg agtctgtgta catcgtcgac 300
cccaaggacg cttctattct gttctcctgc gagggtccta accctgagcg attcctggtg 360
cctccttggg tcgcttacca ccagtactac cagcgaccca tcggagtgct gttcaagtct 420
tccgacgcct ggaagaagga ccgaatcgtg ctgaaccagg aggtcatggc tcccggagcc 480
attaagaact tcgtgcctct gctggagggt gtcgctcagg acttcatcaa ggtgctgcac 540
cgacgaatta agcagcagaa ctctggcaac ttctccggag tcatttctga cgacctgttc 600
cgattctctt tcgagtccat ctcttccgtg attttcggag agcgaatggg catgctggag 660
gagatcgtcg accccgaggc tcagcgattc attaacgccg tgtaccagat gttccacacc 720
tctgtcccca tgctgaacct gccccccgac ttcttccgac tgctgcgaac caagacctgg 780
aaggaccacg ccgctgcctg ggacgtgatc ttcaacaagg ccgacgagta cacccagaac 840
ttctactggg acctgcgaca gaagcgagac ttctctcagt accctggtgt gctgtactcc 900
ctgctgggtg gaaacaagct gcccttcaag aacatccagg ctaacattac cgagatgctg 960
gccggtggcg tcgacaccac ctccatgacc ctgcagtgga acctgtacga gatggctcac 1020
aacctgaagg tgcaggagat gctgcgagct gaggtcctgg ctgctcgacg acaggctcag 1080
ggagacatgg ccaagatggt gcagctggtc cccctgctga aggcttctat caaggagact 1140
ctgcgactgc accccatttc cgtgaccctg cagcgataca ccgtgaacga cctggtcctg 1200
cgaaactaca agattcccgc caagaccctg gtgcaggtcg cttctttcgc catgggacga 1260
gatcccggtt tcttccccaa ccccaacaag ttcgacccca cccgatggct ggagaagtcc 1320
cagaacacca cccacttccg atacctggga ttcggttggg gcgtccgaca gtgtctgggt 1380
cgacgaatcg ctgagctgga gatgaccatc ctgctgatta acctgctgga gaacttccga 1440
attgaggtgc agaacctgcg agacgtcggt accaagttct ccctgatcct gatgcccgag 1500
aaccccattc tgttcaactt ccagcctctg aagcaggacc tgggtcctgc cgtgacccga 1560
aaggacaaca ccgtcaacta a 1581
<210> 5
<211> 1527
<212> DNA
<213> Gallus gallus
<400> 5
atgctgtccc gagctgctcc tatcgctggt tctttccagg cttgtcgatg cgctggtgga 60
attcctgctc tggctggtgt gcactaccct ctgccttctt cctctggtgc ccgacccttc 120
gaccaggtcc ctggagagtg gcgagctggt tggctgaacc tgtaccactt ctggaaggag 180
ggtggcttcc acaacgtcca caacatcatg gcctccaagt tccagcgatt cggccccatc 240
taccgagaga agctgggagt gtacgagtcc gtcaacatca tttctccccg agacgccgct 300
accctgttca agtccgaggg tatgctgccc gagcgattct ctgtgcctcc ttgggtcgct 360
taccgagact accgaaacaa gccctacggt gtcctgctga agaccggcga ggcttggcga 420
tccgaccgac tgaccctgaa caaggaggtg ctgtcccccc aggtggtcga ctctttcgtg 480
cccctgctgg accaggtgtc tcaggacttc ctgcgacgag cccgagctca ggtgcagcag 540
tccggacgag agcgatggac cgccgacttc tctcacgagc tgttccgatt cgctctggag 600
tccgtgtgtc acgtcctgta cggagagcga ctgggcctgc tgcaggactt cgtggacccc 660
gaggcccagc agttcatcga cgctgtcacc ctgatgttcc acaccacctc ccctatgctg 720
tacgtgcctc ctgctctgct gcgacacctg aacaccaaga cctggcgaga tcacgtccac 780
gcctgggacg ctattttcac ccaggctgac aagtgcatcc agaacgtgta ccgagacatt 840
cgactgcagc gaaagtctac cgaggagcac accggaatcc tgttctccct gctggtccag 900
gacaagctgc ccctggacga cattaaggcc tctgtgaccg agatgatggc tggaggtgtc 960
gacaccacct ccatgaccct gcagtgggcc atgctggagc tggctcgatc tcccggaatc 1020
caggagcgac tgcgagctga ggtgctggct gctaagcagg aggctcaggg tgaccgagtc 1080
aagatgctga agtctatccg actgctgaag gccgctatta aggagactct gcgactgcac 1140
cctgtggctg tcaccctgca gcgatacacc acccaggagg tcatcctgca ggactaccga 1200
attcctccta agaccctggt gcaggtcggc ctgtacgcca tgggacgaga tcccgaggtg 1260
ttccccaagc ccgagcagtt caaccccgag cgatggctgg tcatgggatc caagcacttc 1320
aagggtctgt ctttcggttt cggacctcga cagtgtctgg gtcgacgaat tgccgagctg 1380
gagatgcagc tgttcctgat gcacatcctg gagaacttca agattgagac taagcgagcc 1440
gtggaggtcg gaaccaagtt cgacctgatc ctggtgcccg agaagcccat ctacctgcga 1500
ctgcgacccc tgcagcccca ggagtaa 1527
<210> 6
<211> 1527
<212> DNA
<213> Taeniopygia guttata
<400> 6
atgctggctc gagtggtcac caagcctggt gctctgcgag gatgtcctcg aggtgccgct 60
gcccgatgcc gacgactggg tggagctggt ggtgctgtgc cttccgctcc ccgacccttc 120
aaccaggtcc ctggagagtg gcgagctggt tggctgaacc tgtaccgatt ctggcgagag 180
ggaggtctgt ctgccctgca cctgtccatg gctcagaagt tccgacgatt cggtcccatc 240
taccgagaga agctgggcgt gcacgagact gtcaacatca tttctcctgg agacgctgct 300
accctgttcc aggctgaggg tgctctgcct gagcgattcc gagtgcctcc ttgggtcgct 360
taccgagact tccgaaacaa gccctacggc gtgctgctga agaccggaga ggcttggcga 420
tccgaccgac tgctgctgaa ccaggaggct ctggctcctg ctgctgtggc tgccttcgtc 480
cccctgctgt ctgccgtggg agaggacttc gtccgacgag ctcgagccca ggctcgacac 540
tctggacacg gttgttggac cggcgacttc tcccacgagc tgttccgatt cgccctggag 600
tctgtgtgcc acgtcctgta cggccagcga ctgggactgc tgcaggactt cgtgcagcct 660
gaggctcagc gattcattga ggccgtcgct cgaatgttcc acaccaccgc tcctatgctg 720
tacctgcctc ctgctctgct gcgacgactg cgatcccgaa cctggcgaga gcacgtgcac 780
gcttgggacg ctatcttctg tcaggccgac aagtgcattc agaacgtcta ccgggacctg 840
cgactgcagc gaaagtcttc ccaggagtac atgggaatcc tgggtaacct gattctgcga 900
gacaagctgc ccctggacga catccgagcc tccgtgaccg agatgatggc tggcggagtc 960
gacaccacct ctatgaccct gcagtgggct atgctggagc tggctcgagc tcctggagtg 1020
caggagcagc tgcgagctga ggtcctggct gctaagcgag aggctggtgg cgaccgagag 1080
aagatgctga agtctacccg actgctgaag gccaccatta aggagactct gcgactgcac 1140
cccgtggctg tcaccctgca gcgatacacc acccacgagg tcatcctgca ggactaccga 1200
attcctcctg gtaccctggt gcaggtcgga ctgtacgcca tgggtcgaga tcccgacgtc 1260
ttcccccgac ccgagcgatt ccgacctcag cgatggctgg ctgctggtcc taagcccttc 1320
ctgggcctgg gattcggttt cggtcctcga cagtgtctgg gacgacgaat cgccgagctg 1380
gagatgcagc tgttcctgat gcacatcctg gagaacttca agattgagac tatgcgagct 1440
gtggagatcg gaaccaagtt cgacctgatc ctgattcccg accagcccat tcagctgacc 1500
ctgcgacccc tggacggcca gccctaa 1527
<210> 7
<211> 1529
<212> DNA
<213> Danio rerio
<400> 7
atggcccgat ggaacgtgac cctggctcga ctggaccagt ctctgtcttc cctgaagaac 60
ctgctgcagg tgaaggtcac ccgatctggt cgagctcctc agaactccac cgtgcagccc 120
ttcaacaaga tccccggccg atggcgaaac tctctgctgt ccgtcctggc tttcaccaag 180
atgggcggac tgcgaaacgt gcaccgaatt atggtccaca acttcaagac cttcggtccc 240
atctaccgag agaaggtcgg catctacgac tccgtctaca tcattaagcc cgaggacgga 300
gccatcctgt tcaaggctga gggtcaccac cccaaccgaa ttaacgtgga cgcctggacc 360
gcttaccgag actaccgaaa ccagaagtac ggagtcctgc tgaaggaggg caaggcctgg 420
aagaccgacc gaatgatcct gaacaaggag ctgctgctgc ccaagctgca gggcaccttc 480
gtgcccctgc tggacgaggt cggacaggac ttcgtggccc gagtcaacaa gcagattgag 540
cgatctggac agaagcagtg gaccaccgac ctgacccacg acctgttccg attctccctg 600
gagtctgtgt ccgctgtcct gtacggcgag cgactgggac tgctgctgga caacatcgac 660
cccgagttcc agcacttcat tgactgtgtg tctgtcatgt tcaagaccac ctcccctatg 720
ctgtacctgc ctcctggcct gctgcgatct atcggatcca acatttggaa gaaccacgtg 780
gaggcctggg acggaatctt caaccaggct gaccgatgca tccagaacat tttcaagcag 840
tggaaggaga accccgaggg aaacggcaag taccccggtg tgctggccat tctgctgatg 900
caggacaagc tgtctatcga ggacattaag gcctccgtca ccgagctgat ggctggtggc 960
gtggactctg tcaccttcac cctgctgtgg accctgtacg agctggctcg acagcccgac 1020
ctgcaggacg agctgcgagc tgagatttct gccgctcgaa ttgctttcaa gggagacatg 1080
gtgcagatgg tcaagatgat ccccctgctg aaggccgctc tgaaggagac tctgcgactg 1140
caccccgtgg ccatgtctct gccccgatac attaccgagg acaccgtcat ccagaactac 1200
cacattcctg ctggtaccct ggtgcagctg ggtgtctacg ctatgggccg agatcaccag 1260
ttcttcccca agcccgagca gtactgtccc tctcgatgga tctcttccaa ccgacagtac 1320
ttcaagtccc tgggcttcgg attcggtcct cgacagtgcc tgggtcgacg aattgccgag 1380
actgagatgc agattttcct gattcacatg ctggagaact tccgatcgag aagcagaagc 1440
agattgaggt ccgatctaag ttcgagctgc tgctgatgcc cgagaagccc atcattctga 1500
ccatcaagcc cctgaacgct tcccgataa 1529
<210> 8
<211> 1518
<212> DNA
<213> Lithobates catesbeiana
<400> 8
atgatgctgt cccgacgact gtgtctgctg ccctcttcct ctggaatgct gaactaccac 60
ctggtggtgt ctgagtcctc ttccatgatc cacaaccagt ctggaacctc ccctctgcct 120
tacgaccagc tgcctggtga ctggcgaaac ggttggtccg gactgtacca cttcttccga 180
aaggacggat tccacaacat tcaccacctg atggaggaga actaccagcg attcggtccc 240
atctaccgag agaagctggg cacctacgac tctgtctaca tccagcgacc cgaggacgcc 300
gctatcctgt tccaggtgga gggcattcac cccgagcgac tgcgaatcca gccctggttc 360
gagtaccgag actaccgaaa caagaagtac ggcgtcctgc tgaagtccgg agaggactgg 420
cgatgtcagc gactgaccct gaaccgagag gtgctgtccg tcgccggcat gaaccgattc 480
ctgcccctgc tggactctgt gggacaggac ttcgtgcgac gagtctacac ccacgtcgag 540
cgatctggac gaggcaagtg gaccgccgac ctgtcccagg agctgttccg attcgctctg 600
gagtctgtgt gcaacgtcct gtacggtcag cgactgggcc tgctgcagga ctacatcaac 660
cccgagtctc aggagttcat cgactccatt aacctgatgt tcgacaccac ctctcccatg 720
ctgtacatcc ccccccgagt cttccgactg atgaacctgt ctgtgtggaa gaaccacgtc 780
aagtcctggg acgccatttt caaccacgct gacctgtgta tccagggtat ctactcttcc 840
ctgcgacagc gatctgacaa cacctactcc ggcgtgctgt cttccctgct gctgcagcac 900
cagctgcctc tggaggacat caaggcctcc attaccgagc tgatggctgg cggagtcgac 960
accacctcta tgaccctgca gtgggccatg tacgagctgg cccgagctcc ctctgtgcag 1020
gagaagctgc gatccgagat taaggccgct cgaaaggccg ctggaaacga cctgaacgcc 1080
ctgctgaagc gaatccccct ggtgaaggcc gctctgaagg agactctgcg actgcacccc 1140
gtcgctattt ccctgcagcg atacacccag cgagacaccg tgatccgaaa ctacatgatt 1200
cctcgaggta ccctggtgca ggtcggactg tacgccatgg gtcgaaaccc cgacatcttc 1260
ccctctcccg agaagttctt ccccgagcga tggctgggtg gcgagtctac ccacttccga 1320
tccctgggct tcggattcgg tccccgacag tgcctgggac gacgaattgc tgagatggag 1380
atgaacctgt tcctgatcca cattctggag cacttccgaa tcgagactaa ccgaatgatt 1440
gaagtgggta ccaccttcaa gctgattctg ttccccttca agcccatcca cctgaccctg 1500
cgacccctgg acgactaa 1518
<210> 9
<211> 363
<212> DNA
<213> Gossypium arboreum
<400> 9
atgacccacg agcagtaccc cgacctgacc atcgagggat ctacccgggg aaagtccggt 60
accatgcagc gagtggagaa ggccaccttc cgaggagtgg tcaccgaggt cgctcgagct 120
gtggtcggaa tgtgtggcgg agacaaccac tgccctcgat ctgtgcctct gcagctgcag 180
ggtgacaaga tttgtaacct gcagcctacc cctctgctgc tgcgagagat tggttggtgg 240
ctgcgatccg tgcctctgct ggtccgagag actcgattcg ccgtcttcga cctgttccac 300
tgtaacttcc gagagactcg atctgctatt ttctccctgc tgccctactg cctgggtggc 360
taa 363
<210> 10
<211> 1476
<212> DNA
<213> Homo sapiens
<400> 10
atggcctctc gatgttggcg atggtggggt tggtccgctt ggcctcgaac ccgactgcct 60
cctgctggtt ctaccccttc cttctgtcac cacttctcta cccaggagaa gaccccccag 120
atttgcgtgg tcggttccgg acctgctgga ttctacaccg ctcagcacct gctgaagcac 180
ccccaggccc acgtcgacat ctacgagaag cagcctgtgc ctttcggcct ggtccgattc 240
ggagtggctc ccgaccaccc cgaggtgaag aacgtcatta acaccttcac ccagaccgct 300
cactccggac gatgcgcttt ctggggtaac gtggaggtcg gtcgagacgt gaccgtccct 360
gagctgcgag aggcttacca cgctgtggtc ctgtcctacg gtgctgagga ccaccgagct 420
ctggagatcc ccggagagga gctgcccggt gtctgttctg cccgagcttt cgtgggttgg 480
tacaacggcc tgcctgagaa ccaggagctg gagcccgacc tgtcctgcga caccgccgtg 540
atcctgggtc agggtaacgt cgctctggac gtggctcgaa ttctgctgac ccctcctgag 600
cacctggagc gaaccgacat caccaaggct gctctgggtg tcctgcgaca gtctcgagtg 660
aagaccgtct ggctggtggg acgacgaggt cctctgcagg tggccttcac catcaaggag 720
ctgcgagaga tgattcagct gcctggtgct cgacccattc tggaccccgt cgacttcctg 780
ggactgcagg acaagatcaa ggaggtgccc cgaccccgaa agcgactgac cgagctgctg 840
ctgcgaaccg ctaccgagaa gcctggacct gctgaggctg ctcgacaggc ttctgcttcc 900
cgagcttggg gtctgcgatt cttccgatct ccccagcagg tcctgccttc ccctgacggt 960
cgacgagctg ctggagtccg actggctgtg acccgactgg agggagtcga cgaggctacc 1020
cgagctgtgc ctaccggtga catggaggac ctgccctgtg gactggtgct gtcttccatt 1080
ggttacaagt ctcgacccgt cgacccctct gtgcccttcg actccaagct gggcgtcatc 1140
cccaacgtgg agggacgagt catggacgtg cccggtctgt actgctctgg ttgggtgaag 1200
cgaggtccta ccggagtgat cgctaccacc atgaccgact ccttcctgac cggtcagatg 1260
ctgctgcagg acctgaaggc tggcctgctg ccttctggac cccgacccgg ttacgctgct 1320
attcaggctc tgctgtcttc ccgaggagtc cgacccgtgt ctttctccga ctgggagaag 1380
ctggacgctg aggaggtcgc tcgaggacag ggtaccggca agcctcgaga gaagctggtg 1440
gacccccagg agatgctgcg actgctgggc cactaa 1476
<210> 11
<211> 1479
<212> DNA
<213> Bos taurus
<400> 11
atggctcctc gatgttggcg atggtggcct tggtcttcct ggacccgaac ccgactgcct 60
ccttctcgat ccattcagaa cttcggccag cacttctcta cccaggagca gaccccccag 120
atttgtgtgg tcggttccgg acctgctgga ttctacaccg ctcagcacct gctgaagcac 180
cactctcgag cccacgtcga catctacgag aagcagctgg tgcctttcgg actggtccga 240
ttcggtgtgg ctcccgacca ccccgaggtg aagaacgtca tcaacacctt cacccagacc 300
gcccgatccg accgatgtgc tttctacggc aacgtggagg tcggacgaga cgtgaccgtc 360
caggagctgc aggacgccta ccacgctgtg gtcctgtctt acggcgccga ggaccaccag 420
gctctggaca ttcccggaga ggagctgcct ggtgtcttct ccgctcgagc tttcgtggga 480
tggtacaacg gtctgcctga gaaccgagag ctggctcccg acctgtcttg cgacaccgct 540
gtcatcctgg gtcagggtaa cgtcgctctg gacgtggctc gaattctgct gacccccccc 600
gaccacctgg agaagaccga catcaccgag gctgctctgg gagctctgcg acagtcccga 660
gtgaagaccg tctggattgt gggtcgacga ggacctctgc aggtggcttt caccatcaag 720
gagctgcgag agatgattca gctgcctggt acccgaccca tgctggaccc tgctgacttc 780
ctgggcctgc aggaccgaat caaggaggcc gctcgacccc gaaagcgact gatggagctg 840
ctgctgcgaa ccgctaccga gaagcctgga gtggaggagg ctgctcgacg agcttctgct 900
tcccgagctt ggggtctgcg attcttccga tctccccagc aggtcctgcc ttcccctgac 960
ggacgacgag ctgctggtat ccgactggcc gtgacccgac tggagggaat tggagaggct 1020
acccgagctg tccctaccgg cgacgtggag gacctgcctt gtggtctggt cctgtcttcc 1080
atcggctaca agtctcgacc cattgaccct tccgtgcctt tcgaccctaa gctgggagtg 1140
gtccccaaca tggagggtcg agtggtcgac gtccctggcc tgtactgctc tggatgggtc 1200
aagcgaggtc ccaccggcgt gattaccacc accatgaccg actccttcct gaccggccag 1260
atcctgctgc aggacctgaa ggctggacac ctgccttctg gtccccgacc cggatccgcc 1320
ttcatcaagg ctctgctgga ctctcgaggt gtctggcccg tgtctttctc cgactgggag 1380
aagctggacg ccgaggaggt gtctcggggt caggcttccg gcaagccccg agagaagctg 1440
ctggaccccc aggagatgct gcgactgctg ggacactaa 1479
<210> 12
<211> 1452
<212> DNA
<213> Arabidopsis thaliana
<400> 12
atgtctcgat acctggcccg atacatggtg tcccgatact tctcttccgc ttcttcccga 60
cccctgcacg tctgtattgt gggttccgga cctgctggtt tctacaccgc tgacaaggtc 120
ctgaaggccc acgagggagc tcacgtggac atcattgacc gactgcctac ccctttcggc 180
ctggtccgat ctggagtggc tcctgaccac cccgagacta agatcgccat taaccagttc 240
tctcgagtcg ctcagcacga gcgatgctcc ttcatcggta acgtgaagct gggctctgac 300
ctgtctctgt ccgagctgcg ggacctgtac cacgtggtcg tgctggctta cggcgccgag 360
tccgacaagg acctgggtat ccccggcgag tctctgtccg gcatctactc tgcccgagag 420
ttcgtctggt ggtacaacgg acaccccgac tactcttccc tgaagcccga cctgaagacc 480
tctgactccg ccgtgatcct gggtcagggt aacgtcgctc tggacgtggc tcgaattctg 540
ctgcgaccca ccaccgagct ggcttccacc gacatcgcta cccacgccct gtctgctctg 600
aaggagtctt ccatccgaaa ggtctacctg attggacgac gaggtcctgt gcaggctgct 660
ctgaccgcta aggagctgcg agaggtcctg ggaattaaga acctgcacat ccgaattaag 720
cagaccgacc tgtccgtgac ccctgctgac gaggaggaga tgaagacctc tcgagctcga 780
aagcgaatct acgagctgct gtccaaggcc gctgccgctg ccaagacctc tgaggctgac 840
cctgaccagc gagagctgca cttcgtcttc ttccgacagc ccgaccagtt cctggagtct 900
gacgagcgaa agggacacgt ctccggtgtg aacctgcaga agaccatcct ggagtccgtc 960
ggaaccggca agcagattgc cgtgggcacc ggagagttcg aggacctgaa ctgttccatg 1020
gtcctgaagg ctattggtta caagtctgtc cccgtgaacg gcctgccctt cgaccacaag 1080
aagggcgtcg tgcccaacgt gaagggacga gtcgtgtctc acacctccgg cgacatctct 1140
cagaccgagc ccggactgta cgtctgtggt tggctgaagc gaggccccgt gggaatcatt 1200
gccaccaacc tgtactgcgc tgaggagact gtcggatcta tctccgagga cattgaggag 1260
ggtgtgtgga agtcttccaa ggccggttcc aagggcctga tgcagctgct ggagaagcga 1320
aaggtcaaga aggtggagtt ctctggctgg gagaagatcg acgctaagga gaagcagatg 1380
ggaattgagc gaaacaagcc ccgagagaag ctggtgacct gggaggacct gctggctgcc 1440
gctgccaact aa 1452
<210> 13
<211> 1395
<212> DNA
<213> Yarrowia lipolytica
<400> 13
atgatccgat ccgtgcgaca cctgtctacc ctgcgatcca cccctcgagt cgctgtggtc 60
ggtgctggac ctgctggatt ctacaccgct caccgactgc tgaagctgca gcccgacacc 120
aagattgacc tgttcgagtc tctgcctgtg ccttacggcc tggctcgaca cggagtggct 180
cctgaccacc ctgaggtcaa gaactgccag gacaccttcg acgaagtggg taacgacccc 240
cgagtccagt tcttcggtaa cgtgaccgtc ggcgacaccc tgcccgtctc caagctgcga 300
gacaactaca acgccgtggt cctgtcttac ggcacccaca ccgaccgaaa gctgggtatc 360
cctggagagg acctgcctgg agtgatttcc gcccgaacct tcgtcaactg gtacaacggt 420
caccccgagc acgagtctct gaaccccccc ctgcacaagg ctgagactgt gaccatcgtc 480
ggtaacggca acgtggccct ggacatcgct cgaattctgc tgtcccccct ggaccacctg 540
aagtctaccg acatcaccca gcaggcctac gagactctga agacctccaa ggtgaagcga 600
gtccgaatta tggcccgacg aggcctgctg gagtctgctt tcaccatcaa ggagattcga 660
gagctgttca agctgcccga caccggattc gtggccttcc cccacaccaa gtgggacgac 720
gtcctggccg ctcacaagtc ttacaagcga cccctgtccc gaatcgtgaa gctgattgag 780
gagtacaacc tgaaggccaa gcagcgagat cccgcccacg cttctaccct gaagcagtgg 840
tccctggact acctgctgtc tcccaaggag gtcatcgcta accccgacga ccccgagctg 900
gtcaagaccc tgattgccac cgagaacaag ctggtgtctg ctgacggatc cggtcgaatc 960
ggagtggagc ccaccggtgt caccgagtcc ttcgacaccg acctgatctt cacctctatt 1020
ggttacgctt ccacccctct ggagggtatc cctttcgacg accgaaagtc tgtcattccc 1080
tcttcccgag gccgagtgac cgacaacggc gtctacgccg ctggatgggt gaagaacggt 1140
cccaccggcg tcattgccac caccatggct gactccttcg acaccgccca ggctatctct 1200
gacgacatta ccgccggaaa gctggacggt gctaagtctg gctccgacaa cctgacccag 1260
tacctggagg acgccatctc ctgggaccag tggaagaagc tggaggctca cgagcactct 1320
cagggagacg ctgctggcaa gcctcgagag aaggtgaaca acgtcgccaa gatgctggag 1380
attgctcgac agtaa 1395
<210> 14
<211> 555
<212> DNA
<213> Homo sapiens
<400> 14
atggccgctg ccggtggagc tcgactgctg cgagctgctt ccgctgtcct gggtggtcct 60
gctggtcgat ggctgcacca cgctggatct cgagccggtt cttccggcct gctgcgaaac 120
cgaggtcctg gaggttccgc tgaggcttcc cgatctctgt ccgtctctgc tcgagcccga 180
tcttcctctg aggacaagat caccgtgcac ttcattaacc gagacggaga gactctgacc 240
accaagggaa aggtcggtga ctctctgctg gacgtggtcg tggagaacaa cctggacatt 300
gacggcttcg gagcttgtga gggtaccctg gcctgttcca cctgccacct gatcttcgag 360
gaccacatct acgagaagct ggacgctatc accgacgagg agaacgacat gctggacctg 420
gcctacggtc tgaccgaccg atcccgactg ggctgtcaga tttgcctgac caagtctatg 480
gacaacatga ccgtccgagt gcctgagact gtcgctgacg ctcgacagtc catcgacgtg 540
ggaaagacct cttaa 555
<210> 15
<211> 561
<212> DNA
<213> Bos taurus
<400> 15
atggctgctc gactgctgcg agtcgcttcc gctgctctgg gtgacaccgc tggccgatgg 60
cgactgctgg ctcgaccccg agctggagct ggtggactgc gaggttctcg aggtcctggc 120
ctgggtggtg gagctgtcgc tacccgaacc ctgtccgtgt ctggtcgagc tcagtcttcc 180
tctgaggaca agatcaccgt gcacttcatt aaccgagacg gcgagactct gaccaccaag 240
ggcaagatcg gagactccct gctggacgtg gtcgtgcaga acaacctgga cattgacgga 300
ttcggtgcct gtgagggaac cctggcttgt tctacctgcc acctgatctt cgagcagcac 360
attttcgaga agctggaggc catcaccgac gaggagaacg acatgctgga cctggcttac 420
ggcctgaccg accgatcccg actgggatgt cagatttgcc tgaccaaggc catggacaac 480
atgaccgtcc gagtgcctga cgccgtctcc gacgctcgag agtctatcga catgggcatg 540
aactcctcta agattgagta a 561
<210> 16
<211> 594
<212> DNA
<213> Arabidopsis thaliana
<400> 16
atgatcggtc accgaatttc tcgactgggc tccaccatcg tgaagcagct ggctcgagag 60
ggctacctgg ccacctacgg aaccaagaac ctgcaccgat cttacggaca ctacctgcag 120
tccctgcctg tggtccctcg acaggctcga acctctcagg aggcctggtt cctgaagtcc 180
cacaagttct gtacctcttc caccacctct tccgagaacg gtgacgagga gactgagaag 240
attaccatca ttttcgtgga caaggacggc gaggagatcc ccgtgaaggt ccccattgga 300
atgtctgtcc tggaggccgc tcacgagaac gacatcgacc tggagggcgc ctgtgaggct 360
tctctggcct gttccacctg ccacgtgatt gtcatggaca ccgagtacta caacaagctg 420
gaggagccca ccgacgagga gaacgacatg ctggacctgg ctttcggact gaccgagact 480
tctcgactgg gttgccaggt catcgcccga cccgagctgg acggtgtccg actggctatt 540
ccctccgcca cccgaaactt cgctgtggac ggcttcgtcc ccaagcccca ctaa 594
<210> 17
<211> 486
<212> DNA
<213> Yarrowia lipolytica
<400> 17
atgctgcgaa ccttctctcg acaggtgctg caggtgtctc gagctgtgcc tcgaaccttc 60
cgacctgtcg ctcctgctac ccgactgttc cagacctctg ctcccgtgtt ccacggtcac 120
gtccacaagc ccaagcccgg cgaggagatc aaggtgacct tcattaccaa ggacggcgag 180
cagatcgagg tcgacacctg tgagggagac aacctgctgg acattgccca ggctaacaac 240
ctggacatgg agggtgcctg tggcggatct tgtgcttgct ccacctgcca cgtgatcgtc 300
gaccccgagt actacgacaa gctggaggag cccgacgacg acgagaacga catgctggac 360
ctggccttcg gactgaccga gacttctcga ctgggttgtc aggtgtgcat gtccaaggac 420
ctggacggaa tccgaattgc cctgcccgct atgacccgaa acctgcaggc ttccgacttc 480
aactaa 486
<210> 18
<211> 16
<212> DNA
<213> 人工序列
<400> 18
gcggccgcgg tctcca 16
<210> 19
<211> 19
<212> DNA
<213> 人工序列
<400> 19
taaaggagac cgcggccgc 19
<210> 20
<211> 43
<212> DNA
<213> 人工序列
<400> 20
aagggcatcg gtcgaccaac ttttcttgtc gacctgagat acc 43
<210> 21
<211> 36
<212> DNA
<213> 人工序列
<400> 21
gacagcttat catcgatttt ccgagctcga tgctgg 36
<210> 22
<211> 40
<212> DNA
<213> 人工序列
<400> 22
ttttcagcct gtcgtggtag caatttgagg agtattatta 40
<210> 23
<211> 40
<212> DNA
<213> 人工序列
<400> 23
acatgtaata tctgtagtag atacctgata cattgtggat 40
<210> 24
<211> 709
<212> DNA
<213> 人工序列
<400> 24
gcggccgcga catgatacat tctgttgctg gaacaactat tgtgctattg gttgtttgat 60
caccagtgcc gtagtcttac cgtcgtacca ttaccacatg agcttgacct acttgaaccg 120
tacataacta gtctccgtat cactaccgcc gcttgagtca tttgcgtcgt accggtacag 180
acagagacag aagaggcact ctagctcaac gccgtgccat gaggtatttc gaccacagcc 240
cggtaacgag acatgtttac agctgcgaaa cccgctattc tcccccccag agcctcggcc 300
gttctcacgg ctctactcat acatgttcct gtgctacatt agttgatggt acattcatgt 360
ggaggccccc aggaggctct ggaaagcctg tcgaggcttg gctcagcttt ctttttgccc 420
cagatgggca ccagtcctcg atcggccacc tctaagggct caaaggtttg tctcctccac 480
ccgcccaccg tggttcccgt ctttacggtg tctgaagaat gaatgatttg atgatttctt 540
tttccctcca tttttcttac tgaatatatc aatgatatag acttgtatag tttattattt 600
caaattaagt agctatatat agtcaagata acgtttgttt gacacgatta cattattcgt 660
cgacatcttt tttcagcctg tcgtggtagc aatttgagga gtattatta 709
<210> 25
<211> 548
<212> DNA
<213> 人工序列
<400> 25
aaaccttgct tgagaaggtt ttgggacgct cgaaggcttt tgtgaagacg gccagataca 60
gacattccca gaggaacatg ttccagaggg acatgttgca gagggagatg ggtcacgtga 120
cggggtccac ggtatgttca cgtgacgcta ttgttaccag tcatgtgacc taattcgact 180
tgtctctacg tttctctcac tcggatgcat gccagtccca ctggggccac cagacgttgc 240
tttttcccgc cgccatttcc agcggactag ctcgaattct atctccgttt tttctttctc 300
ggtgcaactc tgtcgcgtgc cctctggagc gagagagttc cgataaccgt tcttttggct 360
gttatcgaga tgtcggagat gggccgacgg tgatcgcgtg cccaagtcag ccaccagaga 420
ttggagcaga tgagacacca aattggaacc acaaaaacgc tactgagtct ggactgcaac 480
aggttctaga agagctggtg agacatggta ccgatagaga taacgtcagg tacagacatt 540
gcggccgc 548
Claims (6)
1.一种重组耶氏解脂酵母菌株,其特征在于,包含细胞色素氧化酶CYP11A1基因、电子传递体AdR基因和AdX基因,所述细胞色素氧化酶CYP11A1基因为经优化和去除线粒体转运肽的野猪来源CYP11A1基因序列;所述AdR基因为经优化和去除线粒体转运肽的牛来源AdR基因序列;所述AdX基因为经优化的和去除线粒体转运肽的牛来源AdX基因序列;
所述细胞色素氧化酶CYP11A1基因的核苷酸序列如SEQ ID NO:3所示,所述AdR基因的核苷酸序列如SEQ ID NO:11所示,所述AdX基因的核苷酸序列如SEQ ID NO:15所示;
其构建方法为:将细胞色素氧化酶CYP11A1基因整合到耶氏解脂酵母底盘基因组pBR322位置,将电子传递体AdR基因和AdX基因整合到耶氏解脂酵母底盘菌基因组IntD位置。
2.根据权利要求1所述的重组耶氏解脂酵母菌株,其特征在于,所述耶氏解脂酵母底盘菌为耶氏解脂酵母SyBE_Yl01070028。
3.根据权利要求1或2所述的重组耶氏解脂酵母菌株,其特征在于,所述构建方法具体包含如下步骤:
步骤1、将经优化和去除线粒体转运肽的CYP11A1基因两端分别引入BsaI酶切位点,采用Golden Gate技术与pUC57K-GPATp-PEX16t质粒构建,获得pUC57K-GPATp-mCYP11A1-PEX16t质粒,PCR扩增获得GPATp-mCYP11A1-PEX16t基因表达盒,利用In-Fusion cloningreaction重组到pYLEX1质粒上,获得pYLEX1-GPATp-mCYP11A1-PEX16t质粒,采用醋酸锂法将上述质粒转化耶氏解脂酵母底盘菌,Sc-URA-LEU固体培养基筛选转化子;
步骤2、将经优化和去除线粒体转运肽的AdR基因两端分别引入BsaI酶切位点,采用Golden Gate技术与pUC57K-GPM1t-TEFp-LIP2t-GPDt质粒构建,获得pUC57K-GPM1t-TEFp-mAdR-LIP2t-GPDt质粒,PCR扩增获得上游引入40 bp同源序列GPM1t-TEFp-mAdR-LIP2t-GPDt基因组整合片段;
将经优化和去除线粒体转运肽的AdR和AdX基因两端分别引入BsaI酶切位点,采用Golden Gate技术与pUC57K-GPDt-GPDp-OCTt-FBA1t质粒构建,获得pUC57K-GPDt-GPDp-mAdX-OCTt-FBA1t质粒,PCR扩增获得上游引入40 bp同源序列获得GPDt-GPDp-mAdX-OCTt-FBA1t基因组整合片段;
采用PCR扩增获得上游整合片段IntD-L-GPM1t、下游整合片段IntD-R;
步骤3、将步骤2获得的整合片段与克隆载体质粒进行Gibson组装,酶切后获得IntD-L-TEFp-mAdR-LIP2t-GPDp-mAdX-OCTt-IntD-R片段;
步骤4、采用醋酸锂法将步骤3获得的片段转化到步骤1获得的耶氏解脂酵母转化子中,整合于基因组IntD位置,含潮霉素的Sc- URA-LEU固体平板筛选转化子。
4.权利要求1-3任一项所述的重组耶氏解脂酵母菌株在生产孕烯醇酮中的应用。
5.一种生产孕烯醇酮的方法,其特征在于,将权利要求1-3任一项所述的重组耶氏解脂酵母菌株接入种子培养基活化;将活化后的菌株接种于发酵培养基中发酵培养,发酵培养后收集菌体细胞提取孕烯醇酮。
6.根据权利要求5所述方法,其特征在于,具体为将权利要求1-3任一项所述的重组耶氏解脂酵母菌株接入种子培养基在28 ℃、250 rpm活化24 h,转接至新鲜的种子培养基,在28 ℃、220 rpm活化18 h,转接至发酵培养基28 ℃、220 rpm发酵169 h,收集菌体提取孕烯醇酮;
其中,所述种子培养基为22 g/L葡萄糖、20 g/L蛋白胨、10 g/L酵母浸粉,余量为水;所述发酵培养基为50 g/L葡萄糖、20 g/L蛋白胨、10 g/L酵母浸粉,余量为水。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710239939.7A CN107034150B (zh) | 2017-04-13 | 2017-04-13 | 一种重组耶氏解脂酵母菌株及其构建方法与应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710239939.7A CN107034150B (zh) | 2017-04-13 | 2017-04-13 | 一种重组耶氏解脂酵母菌株及其构建方法与应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107034150A CN107034150A (zh) | 2017-08-11 |
CN107034150B true CN107034150B (zh) | 2021-06-29 |
Family
ID=59536328
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710239939.7A Active CN107034150B (zh) | 2017-04-13 | 2017-04-13 | 一种重组耶氏解脂酵母菌株及其构建方法与应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107034150B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107916275B (zh) * | 2017-12-06 | 2021-01-01 | 山东大学 | 一种利用具有还原tca途径的解脂耶氏酵母菌株好氧合成琥珀酸的方法 |
CN110499259B (zh) * | 2019-07-22 | 2021-07-27 | 浙江工业大学 | 一种解酯耶氏酵母yw100-1及其应用 |
CN111454871B (zh) * | 2020-03-03 | 2022-06-14 | 天津大学 | 一种高产雄烯二酮的重组分枝杆菌及构建方法及应用 |
CN115975962A (zh) * | 2022-12-30 | 2023-04-18 | 天津大学 | 网状路径产物定向合成 |
CN115851640A (zh) * | 2022-12-30 | 2023-03-28 | 天津大学 | 混菌避免路径竞争的模块及其应用 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104805027A (zh) * | 2015-05-27 | 2015-07-29 | 天津大学 | 一种重组耶氏解脂酵母菌株及其构建方法和应用 |
CN105473730A (zh) * | 2013-06-17 | 2016-04-06 | 赛诺菲 | 用于细胞色素p450单加氧酶生物催化的全细胞系统 |
-
2017
- 2017-04-13 CN CN201710239939.7A patent/CN107034150B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105473730A (zh) * | 2013-06-17 | 2016-04-06 | 赛诺菲 | 用于细胞色素p450单加氧酶生物催化的全细胞系统 |
CN104805027A (zh) * | 2015-05-27 | 2015-07-29 | 天津大学 | 一种重组耶氏解脂酵母菌株及其构建方法和应用 |
Non-Patent Citations (1)
Title |
---|
Critical role of the plasma membrane for expression of mammalian mitochondrial side chain cleavage activity in yeast;Duport C等;《Eur J Biochem》;20030430;第270卷(第7期);摘要 * |
Also Published As
Publication number | Publication date |
---|---|
CN107034150A (zh) | 2017-08-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107034150B (zh) | 一种重组耶氏解脂酵母菌株及其构建方法与应用 | |
CN109097343B (zh) | 新月弯胞霉中甾类11β-羟化酶及其编码基因与应用 | |
CN106754993B (zh) | 一种基因、重组酿酒酵母菌株及其构建方法与应用 | |
CN113151027B (zh) | 生产7-脱氢胆固醇的重组酿酒酵母菌株及其构建方法 | |
CN112812983B (zh) | 一种生产菜油甾醇的酿酒酵母工程菌及构建方法 | |
CN113528472B (zh) | 一种细胞色素p450 bm3突变体及其在醋酸群勃龙合成中的应用 | |
CN112094797B (zh) | 基因工程菌及其制备9α,22-二羟基-23,24-双降胆甾-4-烯-3-酮的应用 | |
CN109097342B (zh) | 蓝色犁头霉中甾类11β-羟化酶及其编码基因与应用 | |
CN116987603A (zh) | 一种高产大麻萜酚酸的重组酿酒酵母菌株及其构建方法与应用 | |
JP6633535B2 (ja) | 7デヒドロコレステロール及びビタミンd3の製造法 | |
CN112135905A (zh) | C-8甾醇异构化的优化 | |
CN111690549A (zh) | 利用木糖生产原人参二醇的重组解脂耶氏酵母菌株及构建方法和应用 | |
CN114717173B (zh) | 一种用于生产甾醇侧链不完全降解产物的基因工程菌株及其构建方法以及应用 | |
CN111560383A (zh) | 促进枯草芽孢杆菌合成甲萘醌-7的重组菌及其基因修饰方法 | |
CN114525215B (zh) | 产萜类化合物的重组菌株及其构建方法和发酵产萜类化合物的方法及应用 | |
CN114525213B (zh) | 一种高产赤藓糖醇的菌株及其发酵产赤藓糖醇的方法 | |
JP7443657B2 (ja) | C-5ステロール不飽和化の最適化 | |
CN115305254A (zh) | 一种萜类底盘微生物与工程菌及其构建方法和应用 | |
CN108913732B (zh) | 一种莫纳可林j异源生产的方法及应用 | |
CN118325858B (zh) | 一种茶树菇来源的非特异性过氧合酶突变体及其在催化甾族化合物中的应用 | |
CN111808830A (zh) | 一种微生物降解植物甾醇生产雄二烯二酮的方法 | |
CN113493758A (zh) | 一株缩短发酵周期的产酪醇重组大肠杆菌及其应用 | |
CN113684191A (zh) | 梨头霉甾体11β-羟化酶CYP5311B2突变体构建及其应用 | |
CN111748022B (zh) | 新月弯孢霉来源的甾类物质转运蛋白及其编码基因与应用 | |
CN118291291B (zh) | 高产虫草素的酵母工程菌及其构建方法与应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |