CN110684784B - 一种低含量一元酸杂质的长链二元酸及其生产方法 - Google Patents

一种低含量一元酸杂质的长链二元酸及其生产方法 Download PDF

Info

Publication number
CN110684784B
CN110684784B CN201910321614.2A CN201910321614A CN110684784B CN 110684784 B CN110684784 B CN 110684784B CN 201910321614 A CN201910321614 A CN 201910321614A CN 110684784 B CN110684784 B CN 110684784B
Authority
CN
China
Prior art keywords
monoacid
impurity
long
acid
fermentation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910321614.2A
Other languages
English (en)
Other versions
CN110684784A (zh
Inventor
刘文波
徐敏
杨晨
周豪宏
刘修才
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cathay R&D Center Co Ltd
CIBT America Inc
Original Assignee
Cathay R&D Center Co Ltd
CIBT America Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cathay R&D Center Co Ltd, CIBT America Inc filed Critical Cathay R&D Center Co Ltd
Priority to US16/503,301 priority Critical patent/US11225677B2/en
Priority to EP19184887.8A priority patent/EP3591044A1/en
Publication of CN110684784A publication Critical patent/CN110684784A/zh
Priority to US16/826,606 priority patent/US10982241B2/en
Application granted granted Critical
Publication of CN110684784B publication Critical patent/CN110684784B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/64Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
    • C12P7/6409Fatty acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/65Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression using markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • C12N15/815Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts for yeasts other than Saccharomyces
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/905Stable introduction of foreign DNA into chromosome using homologous recombination in yeast
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Mycology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Oil, Petroleum & Natural Gas (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明涉及一种低含量一元酸杂质的长链二元酸及其生产方法,具体涉及利用定向进化和同源重组方法制备长链二元酸菌株、利用该菌株发酵生产低含量一元酸杂质的长链二元酸。本发明涉及一种突变的CYP52A12基因、其同源基因或其变体,其相对于GenBank登录号AY230498以起始密码子ATG上游第一位碱基为‑1计,具有碱基突变。本发明还涉及包含所述突变的CYP52A12基因、其同源基因或其变体的菌株,该菌株发酵生产长链二元酸时,其发酵产物中一元酸杂质的含量显著降低。

Description

一种低含量一元酸杂质的长链二元酸及其生产方法
技术领域
本发明涉及一种低含量一元酸杂质的长链二元酸及其制备方法,以及利用定向进化和同源重组方法制备长链二元酸菌株、利用该菌株生产低一元酸杂质含量的长链二元酸的方法。
背景技术
长链二元酸(LCDA;也称为长链二羧酸或长链二酸)包括化学式HOOC(CH2)nCOOH的二元酸,其中n≥7。长链二元酸作为重要的单体原料,广泛用于合成尼龙、树脂、热熔胶、粉末涂料、防腐剂、香料、润滑剂、塑化剂等。
长期以来,长链二元酸经由石油通过传统的化学合成途径如丁二烯多步氧化法合成。但化学合成法面临多种挑战,化学合成法得到的二元酸为长链二元酸与短链二元酸的混合物,因此需要复杂的后续提取纯化步骤,对于生产工艺和生产成本而言,都是巨大的障碍。采用微生物发酵技术生产长链二元酸,因其产生的污染低、环境友好、能够合成化学合成方法难以合成的产物如12碳以上的长链二元酸且纯度高等特点,较传统的化学合成法具有明显的优势。
但是微生物发酵技术生产的长链二元酸,有时会在产物中残留杂质,产品纯度的降低会严重影响产品的质量,对后期应用造成极大地影响。尤其是与长链二元酸特性比较类似的杂质,其不仅对后期的提取纯化带来了巨大的技术挑战,而且对于生产成本控制而言也会造成严重的负面影响。因此对于生产长链二元酸菌株进行遗传改造,以降低发酵过程中一些特定杂质的含量,对于生物合成法生产二元酸具有重要的意义和生产价值。
此前,二元酸菌种的改良大多通过传统的随机诱变或采用基因工程的手段得以实现,由于诱变本身随机性的特点,对筛选通量有很高的要求,而且每一次对于性状改变都要求新一轮的诱变筛选,在技术上已经成为重要的限制因素。采用基因工程的手段可以对菌株进行有针对性的遗传改造,从而获得产率更高的优良菌株。长链二元酸微生物发酵法生产方法主要为烷烃经ω-氧化生成。继而又可以经过β-氧化途径而被降解。以往的研究表明,可以通过增强ω-氧化途径并抑制β-氧化途径的手段来提高长链二元酸的产率。Coginis公司的Pictaggio等(Mol.Cell.Biol.,11(9),4333-4339,1991)报导敲除POX4和POX5各两个等位基因可以有效阻断β-氧化途径,从而达到底物100%的转化率。进一步过量表达ω-氧化途径中的限速步骤的两个关键酶P450及氧化还原酶CYP52A12基因,可以使产量得到有效提升。赖小勤等(中国发明专利CN103992959B)报道向二元酸生产菌株中引入一个拷贝的CYP52A14基因也可以有效提高二元酸的转化率和生产效率。另外清华大学曹竹安等人(Biotechnol.J.,1,68-74,2006)发现敲除乙酰辅酶A由过氧化物酶体向线粒体运输过程中的关键基因CAT中的一个拷贝,从而部分阻断乙酰辅酶A进入柠檬酸循环,也可以有效降低二元酸的降解。
易错PCR是Leung等(Technique,1,11-15,1989)最早提出的构建基因文库进行定向研究的技术。通过改变PCR反应条件,如调整反应体系中四种脱氧核糖核酸的浓度、改变Mg2+的浓度以及使用低保真度的DNA聚合酶等方法,使碱基错配而引入突变。过高或过低的突变率都会影响构建突变库的效果,理想的碱基突变比例是每个DNA片段1-3个。因此利用易错PCR产生随机突变,并结合同源重组的方法进行基因的定向遗传学改造,可以帮助筛选对菌株产能进一步提高有帮助的有益突变。
以往对于二元酸菌株的改造大都集中于随机诱变或过量表达上游合成途径的基因或阻断下游β-氧化途径,对于代谢途径中基因的定向进化尚未有报道或应用。本领域依然存在能使长链二元酸产量得到显著提升并且部分杂质含量显著降低的菌株以及其制备方法的需求。
发明内容
本发明涉及一种分离的突变的CYP52A12基因、其同源基因或其变体,其相对于GenBank登录号AY230498(例如SEQ ID NO:21所示,特别是第1-1176或265-1176位核苷酸)以起始密码子ATG(其中以A为第1位)上游第一位碱基(例如SEQ ID NO:21所示的第1176位碱基“C”)为-1计,具有以下碱基突变中的任意一种或多种:-876A>G;-853A>T;-831delT;-825C>A;-823delG;-579A>G;-412_-411AC>TT;-402insTT和-15_1ACCAACCAACCAACCA>ACCAACCAACCA(例如-7_-4delACCA);其中所述变体与突变的CYP52A12基因或其同源基因具有至少70%的序列同一性。
在一个实施方案中,本发明所述突变的CYP52A12基因、其同源基因或其变体具有碱基突变-15_1ACCAACCAACCAACCA>ACCAACCAACCA(例如-7_-4delACCA),例如SEQ ID NO:22所示。
在一个实施方案中,本发明所述突变的CYP52A12基因、其同源基因或其变体具有碱基突变-412_-411AC>TT、-402insTT和-15_1ACCAACCAACCAACCA>ACCAACCAACCA(例如-7_-4delACCA),例如SEQ ID NO:23所示。
在一个实施方案中,本发明所述突变的CYP52A12基因、其同源基因或其变体具有碱基突变-579A>G、-412_-411AC>TT、-402insTT和-15_1ACCAACCAACCAACCA>ACCAACCAACCA(例如-7_-4delACCA),例如SEQ ID NO:24所示。
在一个实施方案中,本发明所述突变的CYP52A12基因、其同源基因或其变体具有碱基突变-831delT、-825C>A、-823delG、-579A>G、-412_-411AC>TT、-402insTT和-15_1ACCAACCAACCAACCA>ACCAACCAACCA(例如-7_-4delACCA),例如SEQ ID NO:25所示。
在一个实施方案中,本发明所述突变的CYP52A12基因、其同源基因或其变体具有碱基突变-876A>G、-853A>T、-831delT、-825C>A、-823delG、-579A>G、-412_-411AC>TT、-402insTT和-15_1ACCAACCAACCAACCA>ACCAACCAACCA(例如-7_-4delACCA),例如SEQ ID NO:26所示。
特别地,本发明涉及一种分离的DNA分子,其相对于SEQ ID NO:21的1-1176或265-1176位所示核苷酸序列,具有以下碱基突变中的任意一种或几种:301A>G,324A>T,346delT,352C>A,354delG,598A>G,765_766AC>TT,774insTT,1162_1176ACCAACCAACCAACC>ACCAACCAACC(例如1170_1173delACCA)。
在一个实施方案中,所述分离的DNA分子具有碱基突变1162_1176ACCAACCAACCAACC>ACCAACCAACC(例如1170_1173delACCA),例如SEQ ID NO:27或32所示。
在一个实施方案中,本发明所述分离的DNA分子具有碱基突变765_766AC>TT,774insTT和1162_1176ACCAACCAACCAACC>ACCAACCAACC(例如1170_1173delACCA),例如SEQID NO:28或33所示。
在一个实施方案中,本发明所述分离的DNA分子具有碱基突变598A>G,765_766AC>TT,774insTT和1162_1176ACCAACCAACCAACC>ACCAACCAACC(例如1170_1173delACCA),例如SEQ ID NO:29或34所示。
在一个实施方案中,本发明所述分离的DNA分子具有碱基突变346delT,352C>A,354delG,598A>G,765_766AC>TT,774insTT和1162_1176 ACCAACCAACCAACC>ACCAACCAACC(例如1170_1173delACCA),例如SEQ ID NO:30或35所示。
在一个实施方案中,本发明所述分离的DNA分子具有碱基突变301A>G,324A>T,346delT,352C>A,354delG,598A>G,765_766AC>TT,774insTT和1162_1176ACCAACCAACCAACC>ACCAACCAACC(例如1170_1173del ACCA),例如SEQ ID NO:31或36所示。
在一个实施方案中,本发明所述突变的CYP52A12基因的序列如SEQ ID NO:16和22-26任一所示或与其具有至少70%的序列同一性,例如具有至少约75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%、99.91%、99.92%、99.93%、99.94%、99.95%或99.96%的同一性的序列。
本发明进一步涉及一种含有本发明所述分离的DNA分子(其用于控制CYP52A12基因的表达,例如作为启动子)或突变的CYP52A12基因、其同源基因或其变体的微生物,其相对于含有未突变的CYP52A12基因、其同源基因或其变体的微生物,在生产长链二元酸时具有降低的一元酸杂质含量。
本发明进一步涉及一种利用含有本发明所述分离的DNA分子或突变的CYP52A12基因、其同源基因或其变体的微生物发酵产生长链二元酸的方法,包括培养所述微生物的步骤,任选地,还包括从培养产物分离、提取和/或纯化长链二元酸的步骤。
在一些实施方案中,本发明所述微生物发酵产生长链二元酸结束后,发酵液中一元酸杂质的质量比率在5%以下,所述质量比率为发酵液中一元酸杂质占长链二元酸的质量百分比。
在一些实施方案中,本发明所述微生物发酵产生长链二元酸结束后,发酵液中一元酸杂质的含量相对于采用常规微生物发酵法如采用本发明所述的非突变的微生物发酵法生产的长链二元酸中的一元酸杂质的含量至少下降5%。
本发明进一步涉及一种低含量一元酸杂质的长链二元酸,所述一元酸杂质的含量大于0,且在12000ppm以下,优选在10000ppm以下或者6000ppm以下,更优选在3000ppm以下,更优选1000ppm以下,更优选500ppm以下,更优选200ppm以下;所述一元酸杂质包括长链一元羧酸杂质,即在羧酸分子中只含有一个羧基(-COOH)。
在一些实施方案中,本发明所述长链二元酸生产微生物菌株含有本发明所述的分离的DNA分子(其用于控制CYP52A12基因的表达,例如作为启动子)或突变的CYP52A12基因、其同源基因或其变体。在一些实施方案中,所述长链二元酸生产微生物菌株是本发明所述的含有本发明所述分离的DNA分子或突变的CYP52A12基因、其同源基因或其变体的微生物。
在一些实施方案中,本发明所述微生物选自棒状杆菌、白地霉、假丝酵母属、毕赤酵母属、红酵母属、酵母属、耶氏酵母属;更优选地,所述微生物是酵母菌;更优选地,所述微生物选自热带假丝酵母(Candida tropicalis)或清酒假丝酵母(Candida sake)。在一个具体实施方案中,所述微生物选自CCTCC M2011192和CCTCC M203052。
在一些实施方案中,本发明所述长链二元酸选自C9~C22长链二元酸,优选C9~C18长链二元酸,更优选十碳二元酸、十一碳二元酸、十二碳二元酸、十三碳二元酸、十四碳二元酸、十五碳二元酸、十六碳二元酸中的一种或多种。更优选地,所述长链二元酸为十碳至十六碳二元酸中至少一种或多种或者正十碳至十六碳二元酸中至少一种或多种,例如选自癸二酸、十一烷二元酸、十二烷二元酸、十三烷二元酸、十四烷二元酸、十五烷二元酸和十六烷二元酸中的至少一种或多种。
在一些实施方案中,本发明所述一元酸杂质的化学式包括CH3-(CH2)n-COOH,其中n≥7,和/或,CH2OH-(CH2)n-COOH,其中n≥7。优选地,所述一元酸杂质包括但不限于碳链上碳原子数在9以上的长链一元酸。优选地,所述一元酸杂质包括九碳一元酸、十碳一元酸、十一碳一元酸、十二碳一元酸、十三碳一元酸、十四碳一元酸、十五碳一元酸、十六碳一元酸、十七碳一元酸、十八碳一元酸、或十九碳一元酸中的任意一种或多种。
在一些实施方案中,例如使用微生物发酵法生产长链二元酸时,当所述长链二元酸为十二碳二元酸时,一元酸杂质主要为十二碳一元酸杂质且所述十二碳一元酸杂质的含量低于8000ppm。
在一些实施方案中,例如使用微生物发酵法生产长链二元酸时,当所述长链二元酸为十碳二元酸时,一元酸杂质主要为十碳一元酸杂质且所述十碳一元酸杂质的含量低于2500ppm。
在一些实施方案中,例如使用微生物发酵法生产长链二元酸时,当所述长链二元酸为十六碳二元酸时,一元酸杂质主要为十六碳一元酸杂质且所述十六碳一元酸杂质的含量低于12000ppm。
本发明进一步涉及一种改造长链二元酸生产微生物菌株的方法,包括定向进化长链二元酸合成途径的关键基因的步骤,其中改造后的长链二元酸生产微生物菌株相对于改造前的微生物菌株,生产的长链二元酸中一元酸杂质的含量得以实质性降低,例如在相同条件下。在一些实施方案中,本发明所述长链二元酸合成途径的关键基因是CYP52A12基因。
在一些实施方案中,本发明所述微生物选自棒状杆菌、白地霉、假丝酵母属、毕赤酵母属、红酵母属、酵母属、耶氏酵母属,更优选地,其中所述微生物是酵母菌,更优选地,其中所述微生物选自热带假丝酵母或清酒假丝酵母。在一个具体实施方案中,所述热带微生物选自CCTCC M2011192和CCTCC M203052。
在一些实施方案中,本发明所述长链二元酸选自C9~C22长链二元酸,优选选自C9~C18长链二元酸,更优选选自十碳二元酸、十一碳二元酸、十二碳二元酸、十三碳二元酸、十四碳二元酸、十五碳二元酸、十六碳二元酸中的一种或多种。更优选地,所述长链二元酸选自十碳至十六碳二元酸中至少一种或多种或者正十碳至十六碳二元酸中的至少一种或多种,例如选自癸二酸、十一烷二元酸、十二烷二元酸、十三烷二元酸、十四烷二元酸、十五烷二元酸和十六烷二元酸中的至少一种或多种。
在一些实施方案中,所述一元酸杂质的含量相对于采用常规微生物发酵法生产的一元酸杂质的含量至少下降5%,优选至少下降10%,更优选至少下降20%,更优选至少下降40%,更优选至少下降50%或更低。
在一些实施方案中,改造长链二元酸生产微生物菌株的方法包括步骤:
1)通过易错PCR制备带有突变的目的基因(CYP52A12基因)片段;
2)制备同源重组所需的目的基因(CYP52A12基因)上下游片段作为同源重组的模板以及抗性标记基因,优选地,所述抗性标记基因是潮霉素B;
3)通过PCR重叠延伸制备完整的重组片段;
4)利用同源重组将所述重组片段引入菌株;
5)利用抗性标记筛选阳性菌株;
6)筛选发酵结束后的发酵液中一元酸含量显著降低的菌株;和
7)任选地,筛选到的菌株进一步经过同源重组去除抗性筛选标记。
本发明进一步涉及一种微生物发酵法生产长链二元酸过程中的发酵液,其特征在于,发酵液中含有一元酸杂质,且所述一元酸杂质的质量比率在5%以下,优选1.5%以下,更优选1.0%以下,0.9%以下;所述质量比率为发酵液中一元酸杂质占长链二元酸的质量百分比;
优选地,所述长链二元酸为C9~C22的长链二元酸,并且所述一元酸杂质包括但不限于碳链上碳原子数在9以上的长链一元酸。
在一些实施方案中,所述微生物含有本发明所述的分离的DNA分子(其用于控制CYP52A12基因的表达,例如作为启动子)或突变的CYP52A12基因、其同源基因或其变体。在一些实施方案中,所述微生物是本发明所述的含有本发明所述分离的DNA分子或突变的CYP52A12基因、其同源基因或其变体的微生物。在一些实施方案中,所述发酵液通过本发明所述的用含有本发明所述分离的DNA分子或突变的CYP52A12基因、其同源基因或其变体的微生物发酵产生长链二元酸的方法获得。在一些实施方案中,所述发酵液使用通过本发明所述的改造长链二元酸生产微生物菌株的方法获得的微生物在生产长链二元酸时获得。
本发明进一步涉及一种本发明所述的长链二元酸的生产方法,包括定向进化长链二元酸合成途径的CYP52A12基因,获得含有突变的CYP52A12基因、其同源基因或其变体的长链二元酸生产微生物菌株,培养所述菌株发酵生产长链二元酸,任选地,其还包括从培养产物分离、提取和/或纯化长链二元酸的步骤;
其中所述突变的CYP52A12基因、其同源基因或其变体,其相对于GenBank登录号AY230498以起始密码子ATG(其中以A为第1位)上游第一位碱基为-1计,在其启动子区域发生了以下碱基突变中的任意一种或几种的组合:-876A>G;-853A>T;-831delT;-825C>A;-823delG;-579A>G;-412_-411AC>TT;-402insTT;-15_1ACCAACCAACCAACCA>ACCAACCAACCA(例如-7_-4delACCA);并且其中所述变体与突变的CYP52A12基因、其同源基因具有至少70%的序列同一性。
优选地,所述突变的CYP52A12基因、其同源基因或其变体在其启动子区域发生了以下碱基突变:-15_1ACCAACCAACCAACCA>ACCAACCAACCA(例如-7_-4delACCA)。
优选地,所述突变的CYP52A12基因、其同源基因或其变体在其启动子区域发生了以下碱基突变:-412_-411AC>TT、-402insTT、-15_1ACCAACCAACCAACCA>ACCAACCAACCA(例如-7_-4delACCA)。
优选地,所述突变的CYP52A12基因、其同源基因或其变体在其启动子区域发生了以下碱基突变:-579A>G、-412_-411AC>TT、-402insTT、-15_1ACCAACCAACCAACCA>ACCAACCAACCA(例如-7_-4delACCA)。
优选地,所述突变的CYP52A12基因、其同源基因或其变体在其启动子区域发生了以下碱基突变:-831delT、-825C>A、-823delG、-579A>G、-412_-411AC>TT、-402insTT、-15_1ACCAACCAACCAACCA>ACCAACCAACCA(例如-7_-4delACCA)。
优选地,所述突变的CYP52A12基因的序列如SEQ ID NO.16和22-26任一所示或与其具有至少70%的序列同一性,例如具有至少约75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%、99.91%、99.92%、99.93%、99.94%、99.95%或99.96%的同一性的序列;
优选地,所述长链二元酸为C9~C22的长链二元酸,优选包括C9~C18的长链二元酸,更优选包括十碳二元酸、十一碳二元酸、十二碳二元酸、十三碳二元酸、十四碳二元酸、十五碳二元酸、十六碳二元酸中的一种或多种;所述长链二元酸为十碳至十六碳二元酸中至少一种或者正十碳至十六碳二元酸中至少一种,例如选自癸二酸、十一烷二元酸、十二烷二元酸、十三烷二元酸、十四烷二元酸、十五烷二元酸和十六烷二元酸中的至少一种。
优选地,所述一元酸杂质的化学式包括CH3-(CH2)n-COOH,其中n≥7,和/或,CH2OH-(CH2)n-COOH,其中n≥7。
在一些实施方案中,所述微生物是酵母菌,更优选地,所述微生物选自热带假丝酵母(Candida tropicalis)或清酒假丝酵母(Candida sake)。
在一些实施方案中,获得含有突变的CYP52A12基因、其同源基因或其变体的长链二元酸生产微生物菌株包括如下步骤:
1)通过易错PCR制备带有突变的CYP52A12基因片段;
2)制备同源重组所需的CYP52A12基因上下游片段作为同源重组的模板以及抗性标记基因,优选地,所述抗性标记基因是潮霉素B;
3)通过PCR重叠延伸制备完整的重组片段;
4)利用同源重组将所述重组片段引入菌株;
5)利用抗性标记筛选阳性菌株;
6)筛选发酵结束后的发酵液中一元酸杂质含量显著降低的菌株;
7)任选地,筛选到的菌株进一步经过同源重组去除抗性筛选标记。
优选地,本发明以现有热带假丝酵母菌株(Candida tropicalis)菌株CATN145(保藏号为CCTCC M2011192)为出发菌株,以下简称CCTCC M2011192,采用易错PCR的方法对CYP52A12基因进行随机突变,并通过同源重组的方法对该基因进行定向进化,以此筛选二元酸生产中杂质含量显著降低的菌株。所述杂质优选为一元酸杂质。通过筛选,本发明得到一株发酵产物中一元酸杂质含量显著下降的菌株,命名为突变株430。通过测序分析发现,与亲代菌株CCTCC M2011192相比,突变株430的CYP52A12基因,以起始密码子ATG(其中以A为第1位)上游第一位碱基为-1计,本发明筛选到的热带假丝酵母突变株在其启动子区域发生了以下碱基突变:-876A>G、-853A>T、-831delT、-825C>A、-823delG、-579A>G、-412_-411AC>TT、-402insTT、-15_1ACCAACCAACCAACCA>ACCAACCAACCA(例如-7_-4delACCA)。采用全基因合成的方法(Sangon)合成含有不同突变位点组合的启动子序列(Genbank登录号AY230498),包含起始密码子上游912bp和相邻的23bp CDS序列。以起始密码子上游第一个碱基为-1计,具体上述碱基突变位点中的任意一种或几种的组合,同样可以实现一元酸杂质含量显著下降的效果。
根据本发明,热带假丝酵母CYP52A12基因的序列如SEQ ID NO:16所示。
进一步对突变菌株去除抗性筛选标记后,与原始菌株相比,发酵结束后发酵液中的一元酸杂质质量比率显著降低,且对发酵液进行提取纯化后获得长链二元酸成品中一元酸杂质的含量可以降低至200ppm以下,尤其是当发酵生产十二碳长链二元酸。
本发明通过对CYP52A12基因进行定向进化,筛选到一株在该基因的启动子区域发生碱基突变的菌株,针对不同的发酵底物,发酵液中一元酸杂质的含量均显著降低,经提取纯化,与亲代菌株相比,一元酸杂质的含量降低近50%,进一步提高了发酵产物长链二元酸的纯度,使二元酸产品作为尼龙长丝、工程塑料、合成香料、耐寒增塑剂、高级润滑油和聚酰胺热熔胶等产品的重要原料,更有利于下游产品的生产制造,提高下游产品的质量。更重要的是,这在很大程度上降低了二元酸后期的提取纯化工艺的难度,简化工艺并节约了能耗。
附图说明
图1为通过同源重组的方式整合进带有突变位点的CYP52A12基因并去除潮霉素筛选标记的示意图,“*”代表可能存在于CYP52A12任意区域(包括启动子、编码区和终止子)的突变。
图2为本发明的突变菌株(SEQ ID NO:16)与原始菌株CYP52A12基因核苷酸序列(SEQ ID NO:21的265-1176位核苷酸)的比对结果,突变位点用黑框标出,其中192指代CCTCC M2011192。
具体实施方式
定义:
除非另有定义,本文所用的技术和科学术语具有本领域技术人员通常理解的含义。参见例如,Singleton et al.,DICTIONARY OF MICROBIOLOGY AND MOLECULAR BIOLOGY2nd ed.,J.Wiley&Sons(New York,NY 1994);Sambrook et al.,MOLECULAR CLONING,ALABORATORY MANUAL,Cold Springs Harbor Press(Cold Springs Harbor,NY 1989)。
长链烷烃:本发明的发酵底物包括长链烷烃,长链烷烃属于饱和链烃,是碳氢化合物下的一种饱和烃,其整体构造大多仅由碳、氢、碳碳单键与碳氢单键所构成,其包括化学式CH3(CH2)n CH3的烷烃,其中n≥7。优选C9~C22的正烷烃,更优选包括C9~C18的正烷烃,最优选包括C10、C11、C12、C13、C14、C15或C16的正烷烃。
长链二元酸(LCDA;也称为长链二羧酸或长链二酸、以下或简称为二元酸):包括化学式HOOC(CH2)nCOOH的二元酸,其中n≥7。优选的,所述长链二元酸包括C9~C22的长链二元酸,优选包括C9~C18的长链二元酸,更优选包括十碳二元酸、十一碳二元酸、十二碳二元酸、十三碳二元酸、十四碳二元酸、十五碳二元酸、十六碳二元酸中的一种或多种。优选地,所述长链二元酸为十碳至十六碳二元酸中至少一种或多种,优选地,为正十碳至十六碳二元酸中至少一种或多种,例如选自癸二酸、十一烷二元酸、十二烷二元酸、十三烷二元酸、十四烷二元酸、十五烷二元酸和十六烷二元酸中的至少一种或多种。
产长链二元酸的微生物:已报道的可产生和积累二元酸的菌株包括细菌、酵母以及霉菌等,如:棒状杆菌(Corynebacterium)、白地霉(Geotrichum candidum)、假丝酵母属(Candida)、毕赤酵母属(Pichia)、红酵母属(Rhodotroula)、酵母属(Saccharomyces)、耶氏酵母属(Yarrowia)等。其中假丝酵母属的许多种类是发酵生产二元酸的优良菌种。所述发酵的菌种优选包括:热带假丝酵母(Candida tropicalis)或清酒假丝酵母(Candidasake)。
发酵底物长链烷烃在发酵生产长链二元酸的过程中,烷烃会被氧化成只含有一个羧基的羧酸,如果发酵反应进行的不够完全会导致这些只含有一个羧基的羧酸作为杂质残留在发酵液中,因其特性与长链二元酸非常相似,很难通过常规手段有效分离,这类杂质会随着后处理工艺进入到最终的二元酸产品中,大大影响产品的纯度和质量。
本发明所述的一元酸杂质尤指长链一元羧酸杂质,即在羧酸分子中只含有一个羧基(-COOH),尤其是端羧基。优选地,所述一元酸杂质包括但不限于碳链上碳原子数在9以上的长链一元酸,所述一元酸杂质的化学式包括CH3-(CH2)n-COOH,其中n≥7;和/或,CH2OH-(CH2)n-COOH,其中n≥7。
所述一元酸杂质优选九碳一元酸、十碳一元酸、十一碳一元酸、十二碳一元酸、十三碳一元酸、十四碳一元酸、十五碳一元酸、十六碳一元酸、十七碳一元酸、十八碳一元酸、或十九碳一元酸中的任意一种或多种。所述长链一元酸是指含有1个端羧基的直链一元酸,如九碳一元酸指的是含有9个碳原子、且含有1个端羧基的长链一元酸。
如本文所用,本发明所述的一元酸杂质的含量实质性降低或显著降低是指与参照相比,一元酸杂质的含量(例如一元酸CH3-(CH2)n-COOH和CH2OH-(CH2)n-COOH的总含量)降低至少5%、6%、7%、8%、9%、10%、12%、14%、16%、18%、20%、25%、30%、35%、40%、50%、60%、70%、80%、90%、95%或更多,优选至少下降10%,更优选至少下降20%,更优选至少下降40%,更优选至少下降50%,更优选至少下降70%或更多。
本发明发酵生产长链二元酸时,发酵结束后的发酵液中含有一元酸杂质,该一元酸杂质的含量相对于采用常规微生物发酵法如采用本发明所述的非突变的微生物发酵法生产的一元酸杂质的含量显著下降,如至少下降5%、6%、7%、8%、9%、10%、12%、14%、16%、18%、20%、25%、30%、35%、40%、50%、60%、70%、80%、90%、95%或更多,优选地,至少下降10%,更优选地,至少下降20%,更优选地,至少下降40%,更优选地,至少下降50%,更优选地,至少下降70%或更高。
在一些实施方案中,使用微生物发酵法生产长链二元酸,发酵液中含有一元酸杂质,所述一元酸杂质的含量降低至5.0%以下,如4.0%、3.0%、2.0%、1.5%、1.4%、1.3%、1.2%、1.1%、1.0%、0.9%、0.8%、0.7%、0.6%以下或更低,优选降低至1.5%以下,更优选降低至1.0%以下,更优选降低至0.9%以下,所述百分比为发酵液中一元酸杂质占长链二元酸的质量百分比。
本发明微生物发酵法生产的长链二元酸,所述长链二元酸含有一元酸杂质,所述一元酸杂质的含量大于0且在15000ppm以下,优选10000ppm以下、7000ppm以下、5000ppm以下、3000ppm以下、2000ppm以下、1000ppm以下、500ppm以下、300ppm以下、250ppm以下、200ppm以下、150ppm以下或100ppm以下或更低。
本发明杂质含量的单位ppm为杂质占长链二元酸的质量比率,且100ppm=100*10-6=0.01%。
在一些实施方案中,DC16的杂质整体比DC12和DC10要高一些,如高至少10%、至少20%、至少30%、至少40%、至少50%、60%、至少80%、至少100%或更高,其中DC指代长链二元酸。
在本发明一个实施方案中,当使用微生物发酵法生产十二碳长链二元酸时,一元酸杂质主要为十二碳一元酸杂质,所述十二碳一元酸杂质的含量低于8000ppm,例如低于6000ppm、5000ppm、4000ppm、3000ppm,优选低于2000ppm,1900ppm,1850ppm,1800ppm,1750ppm,1700ppm,1650ppm,1600ppm,1550ppm,1500ppm,1450ppm,1400ppm,1350ppm,1300ppm,1250ppm,1200ppm,1150ppm,1100ppm,1050ppm,1000ppm,950ppm,900ppm,850ppm,800ppm,750ppm,700ppm,650ppm,600ppm,550ppm,500ppm,450ppm,400ppm,350ppm,300ppm,250ppm,200ppm,150ppm,100ppm或更低。所述十二碳一元酸杂质的化学式包括CH3-(CH2)10-COOH和/或CH2OH-(CH2)10-COOH。
在本发明一个实施方案中,当使用微生物发酵法生产十碳长链二元酸时,一元酸杂质主要为十碳一元酸杂质,所述十碳一元酸杂质的含量低于2500ppm,例如低于2000ppm、1500ppm,优选低于1000ppm,500ppm,300ppm,250ppm,200ppm,150ppm或更低。所述十碳一元酸杂质的化学式包括CH3-(CH2)8-COOH和/或CH2OH-(CH2)8-COOH。
在本发明一个实施方案中,当使用微生物发酵法生产十六碳长链二元酸时,一元酸杂质主要为十六碳一元酸杂质,所述十六碳一元酸杂质的含量低于12000ppm,例如低于10000ppm、9000ppm、8000ppm、7000ppm优选低于6000ppm,或低于4000ppm,或低于3500ppm、3000ppm、2000ppm、1000ppm、900ppm、800ppm、700ppm、600ppm、500ppm、400ppm、300ppm、200ppm、150ppm或更低。所述十六碳一元酸杂质的化学式包括CH3-(CH2)14-COOH和/或CH2OH-(CH2)14-COOH。
在一些实施方案中,本发明所述一元酸杂质的含量是指一元酸CH3-(CH2)n-COOH和CH2OH-(CH2)n-COOH的总含量。
所述二元酸及杂质含量的测试方法可以采用本领域技术人员熟知的技术,例如气相色谱检测法的内标法或归一法等。
CYP52A12是指细胞色素氧化酶P450家族CYP52亚族中的一种,与细胞色素还原酶CPR形成复合体,共同参与发酵产酸过程中烷烃和脂类ω-氧化。本领域技术人员知晓,在其他产长链二元酸的微生物中也存在CYP52A12或其同源基因,其序列可能存在差异,但同样落入本发明的范围内。
术语“分离的”当用于核酸或蛋白质时,是指所述核酸或者蛋白质基本上不含其在天然状态下结合的其它细胞组分。其可以是例如均质状态,并且可以是干燥的或者在水溶液中。纯度和均质性典型地用分析化学技术确定,如聚丙烯酰胺凝胶电泳或高效液相色谱。
如本文所用,表述“相对于GenBank登录号AY230498”或“相对于SEQ ID NO:21所示核苷酸序列”是指与GenBank登录号AY230498所示的序列或SEQ ID NO:21相比对,在相应位置具有所述的突变。所述相应位置是指当该给定多核苷酸序列(例如突变的CYP52A12基因序列)与参考序列(例如SEQ ID NO:21)相比较时参考序列的残基编号。当占据核酸内与给定碱基相同的基本结构位置时,核酸中的碱基“相应于”给定碱基。通常为了鉴别相应位置,排列核酸序列以便获得最高级别的匹配(见例如Computational Molecular Biology,Lesk,A.M.,ed.,Oxford University Press,New York,1988;Biocomputing:Informaticsand Genome Projects,Smith,D.W.,ed.,Academic Press,New York,1993;ComputerAnalysis of Sequence Data,Part I,Griffin,A.M.,and Griffin,H.G.,eds.,HumanaPress,New Jersey,1994;Sequence Analysis in Molecular Biology,von Heinje,G.,Academic Press,1987;和Sequence Analysis Primer,Gribskov,M.and Devereux,J.,eds.,M Stockton Press,New York,1991;Carillo et al.(1988)SIAM J Applied Math48:1073)。核苷酸序列排列对比也可考虑核苷酸中的保守差异和/或取代频率。保守差异是保护涉及的残基的物理-化学性质的那些差异。排列对比可以是整体(在全长序列排列对比序列及包括所有残基)或局部(一部分序列的排列对比,仅包括最相似的一或多个区域)。
如本文所用,碱基突变“XXX N0>N1”是指在第XXX位的碱基N0突变为N1;碱基突变“XXXdelN”是指在第XXX位的碱基N缺失;碱基突变“XXXinsN0N1”是指在第XXX位之后插入碱基N0N1;碱基突变“XXX0_XXX1N0N1>N2N3”是指第XXX0和XXX1位的碱基N0N1分别突变为N2N3;碱基突变“XXX0_XXX1delN0N1N2N3”是指第XXX0至XXX1位碱基N0N1N2N3缺失。
例如,以起始密码子ATG(其中以A为第1位)上游第一位碱基为-1计(指紧邻起始密码子ATG的碱基“A”的上游第一位碱基为-1),碱基突变“-876A>G”指-876位的碱基A突变为G;“-831delT”指-831位的碱基T缺失,“-412_-411AC>TT”指在-412和-411位的碱基AC突变为TT,“-402insTT”指在-402位之后(即-402和-403位间)插入TT,以及“-15_1ACCAACCAACCAACCA>ACCAACCAACCA”指-15至1位的碱基变为ACCAACCAACCA。
在一个实施方案中,本发明所述的CYP52A12基因的序列如SEQ ID NO:21所示,其中蛋白编码序列为1177-2748位核苷酸。相应地,所述突变“-876A>G”相应于SEQ ID NO:21第301位的核苷酸A突变为G;突变“-831delT”相应于SEQ ID NO:21第346位的核苷酸T缺失;突变“-412_-411AC>TT”相应于在SEQ ID NO:21第765和766位核苷酸AC突变为TT,突变“-402insTT”相应于在SEQ ID NO:21第774和775位核苷酸间插入TT,以及突变“-15_1ACCAACCAACCAACCA>ACCAACCAACCA”相应于SEQ ID NO:21第1162-1177位的核苷酸ACCAACCAACCAACCA突变为ACCAACCAACCA。
在本文中,提及碱基时,G指鸟嘌呤,T指胸腺嘧啶,A指腺嘌呤,C指胞嘧啶,U指尿嘧啶。
如本文所用,“未突变的CYP52A12基因”是指不含有本发明所述突变-876A>G、-853A>T、-831delT、-825C>A、-823delG、-579A>G、-412_-411AC>TT、-402insTT或-15_1ACCAACCAACCAACCA>ACCAACCAACCA(例如-7_-4delACCA)的CYP52A12基因,例如天然发生的、野生型等位基因,例如GenBank中登录号为AY230498的CYP52A12基因。举例的未修饰的CYP52A12基因如SEQ ID NO:21所示。所述CYP52A12基因可以含有其他突变,例如在编码区中导致编码氨基酸不改变的沉默突变。
如本文所用,“非突变的微生物”是指不含有本发明所述突变的CYP52A12基因或同源基因的微生物,例如其含有GenBank中登录号为AY230498的CYP52A12基因。在一个实施方案中,所述非突变的微生物含有本发明所述的未突变的CYP52A12基因。
采用本发明的方法,本发明筛选到一株CYP52A12基因发生突变的菌株,以起始密码子ATG(其中以A为第1位)上游第一位碱基为-1计,其启动子区域发生了以下碱基突变中的任意一种或几种的组合:-876A>G、-853A>T、-831delT、-825C>A、-823delG、-579A>G、-412_-411AC>TT、-402insTT、-15_1ACCAACCAACCAACCA>ACCAACCAACCA(例如-7_-4delACCA)。
同源基因是指序列相似性达80%的两条或多条基因序列,其包括直向同源基因(又称为垂直同源基因、正同源基因或定向进化同源基因)、横向同源基因(又称为旁系同源基因、并系同源基因或平行进化同源基因)和/或异源同源基因。本发明中所指的CYP52A12基因的同源基因既可以是CYP52A12基因的直向同源基因,也可以是其横向同源基因或异源同源基因。
序列同一性是指在序列比对和引入缺口后,多核苷酸序列变体的残基与非变体序列的相同的百分比。在具体实施方案中,多核苷酸变体与本文所述的多核苷酸具有至少约70%、至少约75%、至少约80%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%、至少约99.1%、至少约99.2%、至少约99.3%、至少约99.4%、至少约99.5%、至少约99.6%、至少约99.7%、至少约99.8%、至少约99.9%、至少约99.91%、至少约99.92%、至少约99.93%、至少约99.94%、至少约99.95%、或至少约99.96%的多核苷酸同源性。
如本文所用,术语“同源性”和“同一性”可互换使用,是指核苷酸序列无变化的程度,可通过比对多核苷酸与参考多核苷酸之间的相同核苷酸碱基的数目而检测。序列同一性可以通过标准排列对比算法程序使用由每个供应商制定的默认缺口罚分确定。同源核酸分子是指预定数目的相同或同源核苷酸。同源性包括不改变编码的氨基酸的取代(沉默取代)以及相同的残基。基本同源的核酸分子典型在中等严格条件下或者在高度严格条件下杂交全长核酸或者至少或至少约70%、80%或90%全长的感兴趣的核酸分子。本发明还涵盖了含有简并密码子代替杂交核酸分子中密码子的核酸分子。任两个核酸分子是否具有至少80%、85%、90%、95%、96%、97%、98%或99%“相同的”核苷酸序列可以使用已知的计算机算法确定,如BLASTN、FASTA、DNAStar及Gap(University of Wisconsin GeneticsComputer Group(UWG),Madison WI,USA)。例如,核酸分子的同源性或同一性百分比可以例如通过使用GAP计算机程序对比序列信息而确定(例如Needleman et al.J.Mol.Biol.48:443(1970),由Smith and Waterman(Adv.Appl.Math.2:482(1981)修订)。简而言之,GAP程序根据相似的排列对比的符号(即核苷酸)的数目除以两个序列中较短序列的符号总数而定义相似性。
定向进化是指借助于技术手段模拟自然选择的过程。通过人为制造的突变和特定的筛选压力,使蛋白质或核酸向特定的方向突变,从而在短时间内在分子水平上实现自然界中需要成千上万年才能完成的进化过程。本领域已知多种进行定向进化的方法,包括例如易错PCR等(可例如参见Technique,1,11-15,1989;Genome Research,2,28-33,1992)。
在一些实施方案中,在本发明的易错PCR中,Mg2+浓度范围为1~10mM,优选地,2~8mM,更优选地,5~6mM,和/或dNTP的浓度为0.1~5mM,优选地,0.2-3mM,更优选地,0.5~2mM,更优选地,0.8-1.5mM,例如1mM,和/或添加新鲜配置的MnCl2至终浓度为0.1~5mM,优选地,0.2~2mM,更优选地,0.3~1mM,更优选地,0.4~0.7mM,例如0.5mM。在一些实施方案中,通过降低模板量并适当增加至40个或更多个循环PCR以增加突变几率,例如41、42、43、44、45、46、47、48、49、50、55、60或更多个PCR循环。
PCR重叠延伸又称SOE(gene splicing by overlap extension)PCR是指通过设计具有互补末端的引物,通过PCR扩增将不同DNA片段拼接到一起的方法。
同源重组是指依赖于序列相似性的DNA分子之间的重组,最常见于细胞内用于修复有丝分裂期间产生的突变。同源重组技术已广泛应用于基因组编辑,包括基因敲除、基因修复以及向特定位点引入新的基因等。以酿酒酵母为代表的一类微生物,其细胞内发生同源重组的几率非常高,不依赖于序列特异性,在基因组编辑方面具有明显的优势。而位点特异性重组,依赖于特异性位点和位点特异性重组酶参与,重组仅发生于特异的位点之间,如Cre/loxP、FLP/FRT等。本专利使用的同源重组技术不属于位点特异性重组,重组依赖于细胞内的DNA修复系统。
抗性标记是指选择性标记的一种,其往往携带有赋予转化子在抗生素存在的条件下得以生存的能力。所述抗性标记基因包括NPT、HYG、BLA及CAT等,分别可以抗卡那霉素、潮霉素、氨苄/羧苄青霉素以及氯霉素等。优选的,所述抗性标记基因是潮霉素B抗性基因HYG。
发酵生产过程中,所述发酵培养基包括:碳源、氮源、无机盐和营养盐。
在一些实施方案中,所述碳源包括选自葡萄糖、蔗糖和麦芽糖中的一种或多种;和/或所述碳源的添加量为1%~10%(w/v),例如1.5%、2.0%、2.5%、3.0%、3.5%、4.0%、4.5%、5.0%、6.0%、7.0%、8.0%、9.0%。
在一些实施方案中,所述氮源包括选自蛋白胨、酵母膏、玉米浆、硫酸铵、尿素和硝酸钾中的一种或多种;和/或所述氮源的总添加量为0.1%~3%(w/v),例如0.2%、0.4%、0.5%、0.6%、0.8%、1.0%、1.2%、1.5%、1.8%、2.0%、2.5%。
在一些实施方案中,所述无机盐包括选自磷酸二氢钾、氯化钾、硫酸镁、氯化钙、氯化铁、硫酸铜中的一种或多种;和/或所述无机盐的总添加量为0.1%~1.5%(w/v),例如0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1.0%、1.1%、1.2%、1.3%、1.4%。
在一些实施方案中,所述营养因子包括选自维生素B1、维生素B2,维生素C、生物素中的一种或多种;和/或所述营养因子的总添加量为0~1%(w/v),例如0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%。按照发酵领域常识,本发明中所述百分比为质量体积比,即:w/v;%表示g/100mL。
本领域技术人员可以容易地确定上述物质的添加量。
在本发明的一个实施方案中,发酵菌株的接种量为10%~30%,例如11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、22%、24%、25%、27%、29%。所述菌株培养至菌体光密度(OD620)为0.5以上(稀释30倍)时,加入底物进行发酵转化。
长链二元酸的提取纯化:对发酵制得的发酵液进行提取纯化处理,以获得长链二元酸成品。所述提取纯化的步骤包括:对发酵液进行除菌,以及对获得的清液进行酸化,固液分离,和/或溶剂结晶。
本发明所述的提取纯化,可以重复进行一次以上,进行多次提取纯化步骤有助于进一步降低二元酸产品中的杂质含量,例如,在本发明一个实施方案中,参考中国发明专利CN 101985416 A实施例1中的精制工艺对本发明获得的十二碳长链二元酸产品继续进行处理,获得的十二碳长链二元酸中十二碳一元酸杂质含量可以从处理前的5000ppm以上降低至4000ppm以下,如3000ppm以下,2000ppm以下,1000ppm以下,500ppm以下,400ppm以下,300ppm以下,甚至250ppm、200ppm、150ppm、100ppm以下。
所述发酵液包括生物发酵长链二元酸的过程中产生的含有长链二元酸盐的发酵液,所述含有长链二元酸盐的发酵液中可能含有长链二元酸钠盐、长链二元酸钾盐或长链二元酸铵盐等。
所述除菌优选膜过滤:使用过滤膜将残留的菌体和大蛋白等杂质分离出去,与含有长链二元酸盐的发酵液有效地分离开。进而优选陶瓷膜过滤工艺。使用陶瓷膜进行膜过滤时,优选膜前压力为0.2-0.4MPa;优选过滤膜孔径为0.05-0.2微米。
所述酸化是膜过滤后对获得的含有长链二元酸盐的膜清液进行酸化处理,通过加入酸将长链二元酸盐转化为长链二元酸沉淀。酸化时优选使用无机酸,如硫酸、盐酸、硝酸、或其混合酸。所述酸化处理时无机酸的加入量,需将溶液中的长链二元酸充分沉淀,主要以溶液的终点pH为准,优选酸化的终点pH低于5,更优选终点pH低于4.0。加入无机酸进行酸化处理时,可以获得长链二元酸沉淀和相应的无机盐溶液。
所述固液分离是将获得的长链二元酸沉淀与酸化母液分离开,所述固液分离包括过滤或/和离心分离,可以使用常用的固液分离设备。
优选的,所述提取纯化的步骤还包括对含有长链二元酸盐的发酵液进行脱色,向含有长链二元酸盐的发酵液或膜清液中加入活性炭进行脱色处理,脱色处理后再过滤除去活性炭,脱色步骤可以进一步脱除长链二元酸溶液中的杂质。优选的,活性炭的加量为0.1-5wt%,优选1-3wt%(相对于溶液中含有的长链二元酸的量)。
所述溶剂结晶,即将长链二元酸沉淀溶解于有机溶剂中,并通过冷却\蒸发\溶析使长链二元酸结晶,再分离晶体,获得纯化后长链二元酸。所述有机溶剂包括醇、酸、酮和酯的一种或多种;其中,所述醇包括甲醇、乙醇、异丙醇、正丙醇、正丁醇中的一种或多种;所述酸包括乙酸;所述酮包括丙酮;所述酯包括乙酸乙酯和/或乙酸丁酯。
在另一个优选的实施方案中,长链二元酸沉淀溶解在有机溶剂后进行脱色,再分离得到清液,使用活性炭脱色时,脱色的温度为85~100℃,脱色的时间为15~165min;在另一个优选的实施方案中,分离清液后,降温结晶,降温结晶可包括以下步骤:首先降温至65~80℃,保温1~2小时后,再降温至25~35℃,结晶。在另一个优选的实施方案中,结晶之后,分离出所得晶体,由此得到长链二元酸,分离晶体的方式可以为离心分离。
在一些实施方案中,本发明涉及利用上述获得的二元酸产品生产尼龙长丝、工程塑料、合成香料、耐寒增塑剂、高级润滑油和聚酰胺热熔胶等产品。
如本文所用,“任选”或“任选地”是指随后描述的事件或情况发生或不发生,该描述包括其中所述事件或情况发生及不发生的情况。例如,任选包括的步骤是指该步骤存在或不存在。
如本文所用,术语“约”是指包括具体数值的数值范围,本领域技术人员可以合理认为其类似于具体数值。在一些实施方案中,术语“约”是指在使用本领域通常接受的测量的标准误差内。在一些实施方案中,约是指到具体数值的+/-10%。
下面将通过下述非限制性实施例进一步说明本发明,本领域技术人员公知,在不背离本发明精神的情况下,可以对本发明做出许多修改,这样的修改也落入本发明的范围。
下述实验方法如无特别说明,均为常规方法,所使用的实验材料如无特别说明,均可容易地从商业公司获取。
实施例1 实施例所述的培养基、培养方法及二元酸检测方法
1、YPD培养基,配方(w/v)为:2%蛋白胨,2%葡萄糖和1%酵母提取物(OXOID,LP0021)。固体培养基中还需加入1.5~2%琼脂粉。
培养时,可取单菌落于含有1mL YPD液体培养基的2mL离心管中,30℃下,250rpm摇床培养1天。
2、种子培养基,配方(w/v)为:蔗糖10~20g/L(具体使用10g/L),酵母膏3~8g/L(具体使用4g/L),工业发酵用玉米浆(简称玉米浆,总氮含量2.5wt%)2~4g/L(具体使用2g/L),KH2PO4 4~12g/L(具体使用4g/L),尿素0.5~4g/L(具体使用0.5g/L)(115℃,20min单独灭菌),发酵底物如正十二烷、正十烷、正十六烷20mL/L。
培养时,将步骤1培养后的菌液接入含有30mL种子培养基的500mL摇瓶,接种量为3-5%,在250rpm、30℃摇床培养至OD620达到0.8时(稀释30倍后)。
3、发酵培养基(w/v):蔗糖10-40g/L(具体使用10g/L),玉米浆(总氮含量2.5wt%)1~5g/L(具体使用1g/L),酵母膏4~12g/L(具体使用4g/L),NaCl 0~3g/L(具体未使用),KNO3 4~12g/L(具体使用4g/L),KH2PO4 4~12g/L(具体使用4g/L),尿素0.5~3g/L(具体使用0.5g/L)(115℃,20min单独灭菌),发酵底物为正十二烷、正十烷、正十六烷300~400mL/L(具体使用300mL/L),丙烯酸4g/L,用1N HCl和1N NaOH调节pH值至7.5~7.6。
发酵时,将步骤2培养的种子液接种到装有15mL发酵培养基的500mL摇瓶中,接种量为10-30%,在30℃、250rpm摇床培养90-144h至发酵结束。培养过程中通过隔段时间补加酸/碱的方式调节pH值至设定范围。
4、气相色谱法(GC)测定二元酸产量和一元酸杂质含量的步骤
(1)发酵液产物及杂质含量检测:发酵液经常规气相色谱法前处理,使用气相色谱检测,色谱条件:
色谱柱:Supelco SPB-50 30m*0.53mm*0.5μm(货号54983)。
气相色谱仪(Shimadzu,GC-2014)。
方法:初温100℃,15℃/min升温至230℃,保持2min。载气为氢气,进样口温度280℃,FID温度280℃,进样量4μL。
根据二元酸产物峰面积和已知浓度的内标峰面积比进行二元酸产量计算,根据二元酸产物峰面积和杂质峰面积计算杂质含量。
(2)固体产品纯度及杂质含量检测:将固体产品经常规气相色谱法前处理。使用气相色谱检测,
色谱条件:色谱柱:Supelco SPB-50 30m*0.53mm*0.5μm(货号54983)。
气相色谱仪(Shimadzu,GC-2014)。
方法:初温100℃,15℃/min升温至230℃,保持2min。载气为氢气,进样口温度280℃,FID温度280℃,进样量4μL。
根据二元酸产物峰面积和杂质峰面积计算产物纯度和杂质含量。
实施例2 CYP52A12突变模板的制备
1、CYP52A12启动子突变模板的制备。
使用Ezup酵母基因组DNA快速提取试剂盒(Sangon,货号518257)提取假丝酵母细胞CCTCC M2011192的基因组DNA。为提高细胞壁破碎效率,辅以液氮研磨的方法破碎细胞壁。以用该方法获得的基因组DNA作为模板进行易错PCR。获得的无突变产物称为CYP52A12,经测序证实与GenBank登录号:AY230498所示序列一致。
2、易错PCR
调整Mg2+的浓度(2-8mM,以0.5mM递增),用普通Taq酶(Takara,货号R001B)进行易错PCR扩增CYP52A12基因的启动子,引物如下:
Pcyp52a12-F:5'-GTCGACTTCTCCTTTAGGCA-3'(SEQ ID NO:1)
Pcyp52a12-R:5'-TCGATGATTTCTTGTGTGGC-3'(SEQ ID NO:2)
PCR反应条件为:
步骤1:98℃30s
步骤2:98℃10s,52℃30s,72℃1m;35个循环
步骤3:72℃5m。
PCR产物经1%琼脂糖凝胶电泳后,采用Axygen凝胶回收试剂盒(Axygen,AP-GX-250G)进行回收纯化。
实施例3 同源重组模板的制备
本实施例中所有DNA片段均使用Takara公司HS高保真DNA聚合酶(Takara,R040A)扩增得到。1%琼脂糖凝胶电泳后用Axygen凝胶回收试剂盒(Axygen,AP-GX-250G)回收纯化DNA片段。
(1)上下游同源重组片段的扩增,模板为热带假丝酵母基因组DNA,引物序列如下:
CYP52A12_Upstream-F:5'-GGTCGAGGAAGTGGCATTAAA-3'(SEQ ID NO:3)
CYP52A12_Upstream-R:5'-ACCTCCTGCAGTTGCCAT-3'(SEQ ID NO:4)
PCR反应条件如下:
步骤1:98℃30s
步骤2:98℃10s,53℃10s,72℃30s;30个循环
步骤3:72℃5m。
获得的产物称为CYP52A12_Upstream,经测序证实无误,如SEQ ID NO:17所示。
CYP52A12_Downstream-F:5'-ATGGCCACACAAGAAATCAT-3'(SEQ ID NO:5)
CYP52A12_Downstream-R:5'-AGTCTGGGAGTAACTTCTGG-3'(SEQ ID NO:6)。
PCR反应条件一致如下:
步骤1:98℃30s
步骤2:98℃10s,50℃10s,72℃45s;30个循环
步骤3:72℃5m。
获得的产物称为CYP52A12_Downstream,经测序证实无误,其序列如SEQ ID NO:18所示。
(2)抗性筛选标记(HYG,即潮霉素抗性基因)的扩增,扩增模板为本公司所有的载体pCIB2(序列信息如SEQ ID NO:11),引物序列如下:
CYP52A12_HYG-F:
5'-ATGGCAACTGCAGGAGGTGCATGCGAACCCGAAAATGG-3'(SEQ ID NO:7)
CYP52A12_HYG-R:
5'-TGCCTAAAGGAGAAGTCGACGCTAGCAGCTGGATTTCACT-3'(SEQ ID NO:8)。
PCR反应条件如下:
步骤1:98℃30s
步骤2:98℃10s,55℃10s,72℃1m 50s,5个循环
步骤3:98℃10s,72℃2m,25个循环
步骤4:72℃5m。
获得的产物称为HYG,经测序证实无误,如SEQ ID NO:9所示。
(3)PCR重叠延伸得到完整的重组模板
将上述4条回收的PCR片段进行重叠延伸,得到同源重组模板,并回收纯化。具体方法如下:
加入等摩尔量的CYP52A12_Upstream、Pcyp52a12、HYG和CYP52A12_Downstream片段作为模板,引物为CYP52A12_Upstream-F和CYP52A12_Downstream-R,用HS高保真DNA聚合酶进行PCR重叠延伸。
PCR反应条件如下:
步骤1:98℃30s
步骤2:98℃10s,55℃10s,72℃5m 30s共30个循环
步骤3:72℃8m
凝胶电泳后进行回收纯化大小约为5.1Kb的重组片段。
图1示出了本发明通过同源重组的方式整合进带有突变位点的CYP52A12基因并去除潮霉素筛选标记的示意图。
实施例4 构建热带假丝酵母CYP52A12基因突变体库
1、酵母电转化感受态细胞的制备
将30℃,250rpm摇床过夜培养的假丝酵母细胞CCTCC M2011192接种到实施例1的100mL YPD培养基中,至OD620为0.1。相同条件下培养至OD620至1.3时,3000g、4℃离心收集细胞。用冰冷的无菌水洗涤细胞两次并收集后将细胞重悬于10mL冰上预冷的1M的山梨醇溶液,4℃、1500g离心收集细胞后重悬于1mL上述山梨醇溶液,分装100μL细胞悬液用于遗传转化。
2、酵母感受态电击转化
上述感受态细胞中加入1μg实施例3步骤(3)中回收的用于重组的DNA片段,冰上放置5min后迅速转移至0.2cm电击杯,电击转化(BioRad,Micropulser TM Electroporator,转化程序SC2,1.5kV,25uFD,200ohms)。迅速加入1mL YPD和1M山梨醇(1:1,v/v)的混合液,30℃,200rpm培养2小时后,收集菌液后涂布含有100mg/L潮霉素B的YPD培养基平板,30℃静置培养2至3天,至长出单菌落。
实施例5 突变菌株的筛选
1、筛选方法:挑取实施例4获取的单菌落于含有1mL实施例1YPD培养基(含100mg/L潮霉素B)的2mL离心管中,30℃下,250rpm摇床培养1天。取上述菌液接入含有30mL实施例1种子培养基(含100mg/L潮霉素B)的500mL摇瓶中,接种量为3%,250rpm、30℃培养至OD620达到0.8(稀释30倍后)时。将种子液接种到装有15mL实施例1发酵培养基的500mL摇瓶中,接种量为20%,发酵培养基中底物为正十二烷。继续250rpm、30℃培养至发酵结束。并以原始CCTCC M2011192作为对照组:除培养基不含潮霉素B外,培养基、培养和发酵方法与上述相同。
取0.5g发酵液样品采用实施例1中4所述的方法进行GC检测,计算十二碳二元酸及十二碳一元酸杂质的质量比率。
2、筛选结果:经筛选得到一株与原始菌株CCTCC M2011192相比,一元酸杂质含量有效降低的候选菌株,编号为430HYG,结果如下表1所示。
表1
菌株 对照组CCTCC M2011192 430HYG
十二碳二元酸产量(mg/g) 148.8 149.6
十二碳一元酸杂质质量比率(%) 2.22 1.15
本发明所述一元酸杂质的质量比率为其所占十二碳二元酸的质量百分比,由表1可知十二碳一元酸杂质的质量比率下降了48.2%。
实施例6 突变菌株430HYG的CYP52A12基因序列分析
1、按实施例2的方法提取CCTCC M2011192和430HYG酵母基因组DNA,并使用Takara公司HS高保真DNA聚合酶扩增CYP52A12基因的启动子区域,引物为Pcyp52a12-F和Pcyp52a12-R。
PCR反应条件如下:
步骤1:98℃30s
步骤2:98℃10s,52℃10s,72℃1m;30个循环
步骤3:72℃5m。
2、PCR完成后,将产物进行凝胶电泳并回收纯化。
3、纯化后的PCR片段加A处理:20μL PCR回收片段加入4μL 10X Takara Taq缓冲液、3.2μL dNTP(均为10mM)和0.2μL Takara Taq,补ddH2O至40μL,72℃保温20分钟后,使用Axygen PCR纯化试剂盒回收。
4、TA克隆。取加“A”后的PCR回收片段4μL加入1μL pMD19-T载体骨架和5μLSolution I,混匀后16℃保温30min。并将连接产物转化至DH5α化学感受态,挑取阳性克隆送至Majorbio测序。
结果显示:亲代CCTCC M2011192的CYP52A12基因序列与GenBANK数据库中的序列(登录号:AY230498)一致,而突变株430HYG在启动子区域碱基突变。如图2所示,CYP52A12的启动子区域发生了数个碱基突变(序列比对结果中黑框位置所示),其序列如SEQ ID NO:16所示。
实施例7 抗性筛选标记的去除
1、同源重组模板的制备
以热带假丝酵母突变株430HYG基因组DNA为模板,使用HS高保真DNA聚合酶扩增去除抗性筛选标记所需的重组模板片段CYP52A-Upstream-2和Pcyp52a12,凝胶电泳后回收。获得的序列如SEQ ID NO:14和15所示。引物序列与PCR反应条件如下:
CYP52A12_Upstream-F:5’-GGTCGAGGAAGTGGCATTAAA-3’(SEQ ID NO:3)
CYP52A12_Upstream-2R:TGCCTAAAGGAGAAGTCGACACCTCCTGCAGTTGCCAT-3'(SEQ IDNO:10)
Pcyp52a12-F:5’-GTCGACTTCTCCTTTAGGCA-3’(SEQ ID NO:1)
Pcyp52a12-R:5’-TCGATGATTTCTTGTGTGGC-3’(SEQ ID NO:2)
PCR反应条件一致如下:
步骤1:98℃30s
步骤2:98℃10s,52℃10s,72℃1m;30个循环
步骤3:72℃5m。
回收纯化上述PCR片段,并加入等摩尔量的CYP52A12_Upstream-2和Pcyp52a12作模板,所用引物为CYP52A12_Upstream-F和Pcyp52a12-R,用HS高保真DNA聚合酶进行PCR重叠延伸,PCR反应条件如下:
步骤1:98℃30s
步骤2:98℃10s,52℃10s,72℃1m 30s;30个循环
步骤3:72℃5m。
凝胶电泳后回收纯化大小约为1.3Kb的重叠延伸所得到的片段,即为去除潮霉素筛选标记所需的同源重组模板,其序列如SEQ ID NO:12所示。
2、去除抗性筛选标记
制备菌株430HYG的新鲜电转化感受态细胞,加入步骤1回收的所述重组片段1μg,冰上放置5min后迅速转移至冰上预冷的0.2cm电击杯,电击转化(如上,1.5kV,25uFD,200ohms)。迅速加入1mL YPD和1M山梨醇(1:1,v/v)的混合液,30℃、200rpm培养2小时后,收集菌液后涂布含有不含抗生素的YPD培养基平板,30℃静置培养2至3天,至长出单菌落。
3、去除抗性标记的菌株的筛选
挑取单菌落一一对应分别接种于含有和不含潮霉素(100mg/L)的YPD平板,挑取在含有抗生素培养基上不生长但不含抗生素培养基上能够生长的单菌落接种于含有1mL的YPD培养基的2mL离心管中,于4℃、250rpm过夜培养,次日通过菌落PCR鉴定抗性筛选标记是否去除,所用DNA聚合酶为Takara Taq,引物分别为
a)CYP52A12_Upstream-F和Pcyp52a12-R。
b)HYG-F:5’-CTCGGAGGGCGAAGAATCTC-3’(SEQ ID NO.19)
HYG-R:5’-CAATGACCGCTGTTATGCGG-3’(SEQ ID NO.20)。
PCR反应条件一致为:
Step 1:98℃30s
Step 2:98℃10s,52℃30s,72℃35s共30个循环
Step 3:72℃5m
4、筛选结果
通过菌落PCR,筛选得到1株抗性筛选标记去除的菌株,并通过测序确认,该菌株CYP52A12基因启动子区域存在的突变与430HYG菌株相同,并已去除潮霉素筛选标记基因。最终该菌株命名为430。
实施例8 菌株430发酵生产十二碳长链二元酸
发酵:接种菌株430至含有1mL实施例1YPD培养基的2mL离心管中,30℃下,250rpm摇床培养1天。取上述菌液接入含有30mL实施例1种子培养基的500mL摇瓶中,接种量为3%,摇床250rpm、30℃,36~48h培养至OD620达到0.8(稀释30倍后)时。将种子液接种到装有15mL实施例1发酵培养基的摇瓶中,接种量为20%,发酵培养基中底物为正十二烷。继续摇床培养250rpm、30℃培养至发酵结束。并以原始CCTCC M2011192作为对照组,培养基、培养和发酵方法与上述相同。
取0.5g发酵液样品采用实施例1中4所述的方法进行GC检测,计算十二碳二元酸及十二碳一元酸杂质的质量比率,结果如下表2所示:
表2
菌株 CCTCC M2011192 430
十二碳二元酸产量(mg/g) 150.4 151.3
十二碳一元酸杂质质量比率(%) 2.16 1.09
由表2可知去除筛选标记后,十二碳一元酸杂质的质量比率下降了49.5%。
提取纯化:
(1)将上述发酵液,用质量浓度30%的氢氧化钠溶液调节pH为8.5,加水调节到长链二元酸浓度为8.9wt%,加热至45℃,用0.05微米孔径的陶瓷膜[购自三达膜科技(厦门)有限公司]对发酵液进行过滤。使用的陶瓷膜膜面积为0.84平方米,膜前压力设定0.3MPa,收集膜清液。
(2)将接收到的膜清液,在60℃下,加入5wt%的粉末活性炭(相对于溶液中含有的长链二元酸的量)脱色,过滤得到澄清液体。
(3)再向所述澄清液体中加入硫酸,调节pH至3.5,降温到30℃,过滤得到湿固体,用3倍于湿固体重量的纯净水洗涤滤饼,过滤后烘干,获得十二碳二元酸一级产品。
(4)向十二碳二元酸一级产品加入3.5倍量(相对于十二碳二元酸一级产品重量)浓度为97%的醋酸,加热到85℃溶解,加入1%大孔粉末活性炭(相对于十二碳二元酸一级产品重量)脱色,在85℃下保持1小时,热过滤得到清液。该溶液以10℃/小时的速度降温,到30℃得到十二碳二元酸晶体溶液。过滤,水洗涤湿固体的溶剂,烘干后得到十二碳二元酸二级产品。
(5)对十二碳二元酸二级产品重复步骤(4)获得十二碳二元酸三级产品。
使用实施例1中4所述方法测定并计算提取纯化步骤(3)-(5)获得的二元酸产品纯度及一元酸杂质含量,如下表3所示:
表3
实施例9
为进一步验证上述突变,提取酵母430HYG的基因组DNA,用HS高保真DNA聚合酶进行PCR扩增包含突变后的CYP52A12和HYG抗性基因的DNA片段,所用引物为CYP52A12_Upstream-F(SEQ ID NO:3)和Pcyp52a12-R(SEQ ID NO:2),PCR反应条件如下:
步骤1:98℃30s
步骤2:98℃10s,52℃10s,72℃4m;30个循环
步骤3:72℃5m。
凝胶电泳后进行回收纯化,大小约为4Kb,经测序证实无误,其序列如SEQ ID NO:13所示。将上述DNA片段同源重组入菌株CCTCC M2011192的过程同实施例4和5,筛选得到的单克隆的CYP52A12基因的启动子序列测序方法同实施例6。经测序确认,挑取的单克隆中整合入带有突变的CYP52A12基因,突变位点与SEQ ID NO.16一致。将其中一株菌命名为431HYG。
发酵方法同实施例5所述,所用菌株为CCTCC M2011192、430HYG和431HYG。发酵结束后各取0.5g上述发酵液样品,计算计算十二碳二元酸产量与十二碳一元酸杂质含量,如表4所示。结果显示,与430HYG一致,与对照组CCTCC M2011192相比,431HYG中一元酸含量显著下降。
表4
菌株 CCTCC M2011192 430HYG 431HYG
十二碳二元酸产量(mg/g) 149.8 150.2 150.1
十二碳一元酸杂质质量比率(%) 2.17 1.10 1.11
实施例10 不同碱基突变位点对于一元酸杂质含量影响的测定
1、含有不同突变位点组合的启动子序列的合成
采用本领域常规使用的全基因合成的方法(Sangon)合成含有不同突变位点组合的启动子序列(Genbank登录号AY230498),包含起始密码子上游912bp和相邻的23bp CDS序列。以起始密码子上游第一个碱基为-1计,具体包含的突变位点如下:
Pcyp52a12-1:-7_-4delACCA;
Pcyp52a12-2:-412_-411AC>TT、-402insTT、-7_-4delACCA;
Pcyp52a12-3:-579A>G、-412_-411AC>TT、-402insTT、-7_-4delACCA;
Pcyp52a12-4:-831delT、-825C>A、-823delG、-579A>G、-412_-411AC>TT、-402insTT、-7_-4delACCA(相应于碱基突变-15_1ACCAACCAACCAACCA>ACCAACCAACCA)。
2、同源重组模板的制备
同源重组模板的制备方法同实施例3,区别仅在于启动子片段部分不同。PCR结束后回收并纯化所得大小约为5.1Kb的DNA片段,即同源重组模板,经测序证实无误,按本实施例10步骤1中的次序依次命名为:T12-1、T12-2、T12-3和T12-4。
3、构建CYP52A12启动子区域含有不同突变位点组合的突变菌株
采用同源重组的方法构建CYP52A12启动子区域含有不同突变位点组合的突变菌株,方法同实施例4、5。2-3天后,挑取平板上长出的菌落,用菌落PCR的方法鉴定并测序验证重组结果,方法同实施例6。经测序确认无误后,随机挑选一株得到的突变菌株依本实施例10步骤1所述次序分别命名为P12-1、P12-2、P12-3和P12-4。
4、不同菌株发酵法生产十二碳长链二元酸的对比
挑取430HYG、P12-1、P12-2、P12-3、和P12-4的单菌落接种于含有1mL实施例1YPD培养基(含100mg/L潮霉素B)的2mL离心管中,30℃下,250rpm摇床培养1天。取上述菌液接入含有30mL实施例1种子培养基的500mL摇瓶中,接种量为3%,250rpm、30℃培养至OD620达到0.8(稀释30倍后)时。将种子液接种到装有15mL实施例1所述发酵培养基的500mL摇瓶中,接种量为20%,发酵培养基中底物为正十二烷。继续250rpm、30℃培养至发酵结束。并以原始菌株CCTCC M2011192作为对照组:除YPD培养基不含潮霉素B外,培养基、培养和发酵方法与上述相同。
发酵结束后,取0.5g发酵液样品依照实施例1中步骤4所述的方法进行GC检测,计算十二碳二元酸产量及十二碳一元酸杂质所占十二碳二元酸的质量比率,结果如下表5所示。
表5
菌株 十二碳一元酸质量比率(%) 十二碳二元酸产量(mg/g)
CCTCC M2011192 2.20 148.7
430HYG 1.14 149.5
P12-1 1.96 148.5
P12-2 1.32 149.1
P12-3 1.20 148.9
P12-4 1.21 149.6
由表5中一元酸杂质含量的数据可以推测,显著降低发酵液中十二碳一元酸杂质含量的突变位点包括-579A>G、-412_-411AC>TT、-402insTT和-7_-4delACCA,这些位点的变化,可能影响转录因子与启动子区域顺式作用元件的结合,从而影响CYP52A12基因的转录。
实施例11 菌株430发酵生产十碳长链二元酸
发酵:接种菌株430至含有1mL实施例1YPD培养基的2mL离心管中,30℃下,250rpm摇床培养1天。取上述菌液接入含有30mL实施例1种子培养基的500mL摇瓶中,接种量为3%,摇床250rpm、30℃,36~48h培养至OD620达到0.8(稀释30倍后)时。将种子液接种到装有15mL实施例1发酵培养基的摇瓶中,接种量为20%,发酵培养基中底物为正十烷。继续摇床培养250rpm、30℃培养至发酵结束。并以原始CCTCC M2011192作为对照组,培养基、培养和发酵方法与上述相同。
发酵结束后取0.5g发酵液样品采用实施例1中4所述的方法进行GC检测,对比亲本与突变菌株的十碳二元酸的产量和一元酸杂质的含量,结果如下表6所示:
表6
菌株 CCTCC M2011192 430
十碳二元酸产量(mg/g) 122.5 125.6
十碳一元酸杂质质量比率(%) 1.55 0.79
由表6可知十碳一元酸杂质的质量比率下降了49.0%。
提取纯化步骤:与实施例8提取纯化步骤相同,区别在于没有进行步骤(5)。使用实施例1中4所述方法测定并计算获得的十碳二元酸一级产品和二级产品的纯度及一元酸杂质含量,如下表7所示:
表7
实施例12 菌株430发酵生产十六碳长链二元酸
发酵:接种菌株430至含有1mL实施例1YPD培养基的2mL离心管中,30℃下,250rpm摇床培养1天。取上述菌液接入含有30mL实施例1种子培养基的500mL摇瓶中,接种量为3%,摇床250rpm、30℃,36~48h培养至OD620达到0.8(稀释30倍后)时。将种子液接种到装有15mL实施例1发酵培养基的摇瓶中,接种量为20%,发酵培养基中底物为正十六烷。继续摇床培养250rpm、30℃培养至发酵结束。并以原始CCTCC M2011192作为对照组,培养基、培养和发酵方法与上述相同。
发酵结束后取0.5g发酵液样品采用实施例1中4所述的方法进行GC检测,对比亲本与突变菌株的十六碳二元酸的产量和一元酸杂质的含量,结果如下表8所示:
表8
菌株 CCTCC M2011192 430
十六碳二元酸产量(mg/g) 125.1 126.6
十六碳一元酸杂质质量比率(%) 5.06 2.89
由表8可知十六碳一元酸杂质的质量比率下降了42.9%。
提取纯化步骤:与实施例8提取纯化步骤相同,区别在于没有进行步骤(5)。使用实施例1中4所述方法测定并计算获得的十六碳二元酸一级产品和二级产品的纯度及一元酸杂质含量,如下表9所示:
表9
实施例13
将实施例9所述DNA片段(SEQ ID NO:13)同源重组入热带假丝酵母(CCTCCM203052),方法同实施例4和5。筛选得到的单克隆与亲代菌株(CCTCC M203052)基因组中CYP52A12基因的启动子序列测序方法同实施例6。经测序证实,亲代菌株(CCTCC M203052)的CYP52A12的基因序列与GENBANK(登录号AY230498)公布的序列一致,而筛选得到的克隆中该基因携带有突变,突变位点与SEQ ID NO.16一致。将其中一株菌命名为432HYG。
发酵方法同实施例5,所用菌株为CCTCC M203052和432HYG。发酵结束后各取0.5g上述发酵液样品,计算十二碳二元酸产量与十二碳一元酸杂质含量,如表10所示。结果表明,与亲代菌株CCTCC M203052相比,432HYG中一元酸杂质含量显著下降。
表10
菌株 CCTCC M203052 432HYG
十二碳二元酸产量(mg/g) 135.8 134.1
十二碳一元酸杂质质量比率(%) 1.23 0.59
从上述针对不同的发酵底物发酵生产长链二元酸的实施例8-13中可以看出,发酵后的发酵液中一元酸杂质的含量均显著降低,与亲代菌株相比,一元酸杂质的含量能降低至少40%以上,有的含量降低近50%,而且,对获得的十二碳二元酸、十碳二元酸、十六碳二元酸进行进一步的提取纯化,可以进一步降低一元酸杂质含量,很大程度上降低了后期的提取纯化工艺的难度。
序列表
<110> 上海凯赛生物技术研发中心有限公司
CIBT美国公司
<120> 一种低含量一元酸杂质的长链二元酸及其生产方法
<130> I2019TC3079CB
<150> CN201810734273.7
<151> 2018-07-06
<150> CN201810734190.8
<151> 2018-07-06
<160> 36
<170> PatentIn version 3.5
<210> 1
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> primer Pcyp52a12-F
<400> 1
gtcgacttct cctttaggca 20
<210> 2
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> primer Pcyp52a12-R
<400> 2
tcgatgattt cttgtgtggc 20
<210> 3
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> primer CYP52A12_Upstream-F
<400> 3
ggtcgaggaa gtggcattaa a 21
<210> 4
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> primer CYP52A12_Upstream-R
<400> 4
acctcctgca gttgccat 18
<210> 5
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> primer CYP52A12_Downstream-F
<400> 5
atggccacac aagaaatcat 20
<210> 6
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> primer CYP52A12_Downstream-R
<400> 6
agtctgggag taacttctgg 20
<210> 7
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> primer CYP52A12_HYG-F
<400> 7
atggcaactg caggaggtgc atgcgaaccc gaaaatgg 38
<210> 8
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> primer CYP52A12_HYG-R
<400> 8
tgcctaaagg agaagtcgac gctagcagct ggatttcact 40
<210> 9
<211> 1776
<212> DNA
<213> Artificial Sequence
<220>
<223> HYG
<400> 9
atggcaactg caggaggtgc atgcgaaccc gaaaatggag caatcttccc cggggcctcc 60
aaataccaac tcacccgaga gagataaaga gacaccaccc accacgagac ggagtatatc 120
caccaaggta agtaactcag agttaatgat acaggtgtac acagctcctt ccctagccat 180
tgagtgggta tcacatgaca ctggtaggtt acaaccacgt ttagtagtta ttttgtgcaa 240
ttccatgggg atcaggaagt ttggtttggt gggtgcgtct actgattccc ctttgtctct 300
gaaaatcttt tccctagtgg aacactttgg ctgaatgata taaattcacc ttgattccca 360
ccctcccttc tttctctctc tctctgttac acccaattga attttctttt tttttttact 420
ttccctcctt ctttatcatc aaagataagt aagtttatca attgcctatt cagaatgaaa 480
aagcctgaac tcaccgcgac gtctgtcgag aagtttctca tcgaaaagtt cgacagcgtc 540
tccgacctca tgcagctctc ggagggcgaa gaatctcgtg ctttcagctt cgatgtagga 600
gggcgtggat atgtcctccg ggtaaatagc tgcgccgatg gtttctacaa agatcgttat 660
gtttatcggc actttgcatc ggccgcgctc ccgattccgg aagtgcttga cattggggaa 720
ttcagcgaga gcctcaccta ttgcatctcc cgccgtgcac agggtgtcac gttgcaagac 780
ctccctgaaa ccgaactccc cgctgttctc cagccggtcg cggaggccat ggatgcgatc 840
gctgcggccg atcttagcca gacgagcggg ttcggcccat tcggaccgca aggaatcggt 900
caatacacta catggcgtga tttcatatgc gcgattgctg atccccatgt gtatcactgg 960
caaactgtga tggacgacac cgtcagtgcg tccgtcgcgc aggctctcga tgagctcatg 1020
ctttgggccg aggactgccc cgaagtccgg cacctcgtgc acgcggattt cggctccaac 1080
aatgtcctca cggacaatgg ccgcataaca gcggtcattg actggagcga ggcgatgttc 1140
ggggattccc aatacgaggt cgccaacatc ttcttctgga ggccgtggtt ggcttgtatg 1200
gagcagcaga cgcgctactt cgagcggagg catccggagc ttgcaggatc gccgcggctc 1260
cgggcgtata tgctccgcat tggtcttgac caactctatc agagcttggt tgacggcaat 1320
ttcgatgatg cagcttgggc gcagggtcga tgcgacgcaa tcgtccgatc cggagccggg 1380
actgtcgggc gtacacaaat cgcccgcaga agcgcggccg tctggaccga tggctgtgta 1440
gaagtactcg ccgatagtgg aaaccgacgc cccagcactc gtccgagggc aaaggaatag 1500
tgtgctaccc acgcttactc caccagagct attaacatca gaaatattta ttctaataaa 1560
taggatgcaa aaaaaaaacc ccccttaata aaaaaaaaag aaacgatttt ttatctaatg 1620
aagtctatgt atctaacaaa tgtatgtatc aatgtttatt ccgttaaaca aaaatcagtc 1680
tgtaaaaaag gttctaaata aatattctgt ctagtgtaca cattctccca aaatagtgaa 1740
atccagctgc tagcttgtcg acttctcctt taggca 1776
<210> 10
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> primer CYP52A12_Upstream-2R
<400> 10
tgcctaaagg agaagtcgac acctcctgca gttgccat 38
<210> 11
<211> 5873
<212> DNA
<213> Artificial Sequence
<220>
<223> vector pCIB2
<400> 11
gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca 60
cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaatg tgagttagct 120
cactcattag gcaccccagg ctttacactt tatgcttccg gctcgtatgt tgtgtggaat 180
tgtgagcgga taacaatttc acacaggaaa cagctatgac catgattacg aattcggtct 240
agtatgattg tcaataatga tgggtcatcg tttcctgatt cgacgttccc tgtggtgtcg 300
ttaaatagcc tgtctgaaat ctcctccatg attgtgttgg tgtgtgttgt ttgactttcc 360
caattgctta catttttttc ttcaaggatt cgctccaaaa tagacagaaa ttatcgcgac 420
aagtcagacg aacgtcgcac gaggcgaacc aaattcttta gaagcatacg aaaactcact 480
ttatttccat tagaagtatt aaattaacaa atatataata tacaggatac aaagtaaaag 540
cacgcttaag caaccaaagc ggaagcggta gcggattcgt atttccagtt aggtggcaag 600
acagcgacgg ttctgtagta tctggccaat ctgtggattc tagattcaat caaaatcaat 660
ctgaacttgg agtccttgtc ctttctgttt ctttccaagt gctttctgac agagacagcc 720
ttcttgatca agtagtacaa gtcttctggg atttctggag ccaaaccgtt ggatttcaag 780
attctcaaga tcttgttacc agtgacaacc ttggcttggg aaacaccgtg agcatctctc 840
aagataacac caatttgaga tggagtcaaa ccctttctgg cgtacttgat gacttgttca 900
acaacttcgt cagaagacaa cttgaaccaa gatggagcgt ttcttgagta tggaagagcg 960
gaggaggaaa tacctttacc ctaaaataac aagagctaat gttagtaatt tgaaaaaaaa 1020
gacgttgagc acgcacaccc catccacccc acaggtgaaa cacatcaaac gtagcaagaa 1080
caatagttgg ccctcccgtc aagggggcag gtaattgtcc aagtacttta gaaaagtatg 1140
tttttaccca taagatgaac acacacaaac cagcaaaagt atcaccttct gcttttcttg 1200
gttgaggttc aaattatgtt tggcaataat gcagcgacaa tttcaagtac ctaaagcgta 1260
tatagtaaca attctaggtc tgtatagtcg accgtaggtg aatcgtttac tttaggcaag 1320
accttgtccc tgataaagcc aggttgtact ttctattcat tgagtgtcgt ggtggtggta 1380
gtggtggttg attgggctgt tgtggtagta gtagtggttg tgatttggaa catacagatg 1440
aatgcatacg acccatgatg actgatttgt ttctttattg agttgatggt aagaaagaga 1500
agaagaggag gtaaaaaggt ggtagagtga aaaatttttt tctcttaaaa gtgagagaga 1560
gaaagagaaa aatttcactg cgaaacaaat ggttggggac acgacttttt tcaggaattt 1620
ttactcgaag cgtatatgca ggaaagttgt tgttagggaa tatggagcca caagagagct 1680
gcgaattcga gctcggtacc cggggatcct ctagagtcga cctgcaggca tgcgaacccg 1740
aaaatggagc aatcttcccc ggggcctcca aataccaact cacccgagag agagaaagag 1800
acaccaccca ccacgagacg gagtatatcc accaaggtaa gtaactcagg gttaatgata 1860
caggtgtaca cagctccttc cctagccatt gagtgggtat cacatgacac tggtaggtta 1920
caaccacgtt tagtagttat tttgtgcaat tccatgggga tcaggaagtt tggtttggtg 1980
ggtgcgtcta ctgattcccc tttgtctctg aaaatctttt ccctagtgga acactttggc 2040
tgaatgatat aaattcacct tgattcccac cctcccttct ttctctctct ctctgttaca 2100
cccaattgaa ttttcttttt ttttttactt tccctccttc tttatcatca aagataagta 2160
agtttatcaa ttgcctattc agaatgaaaa agcctgaact caccgcgacg tctgtcgaga 2220
agtttctcat cgaaaagttc gacagcgtct ccgacctcat gcagctctcg gagggcgaag 2280
aatctcgtgc tttcagcttc gatgtaggag ggcgtggata tgtcctccgg gtaaatagct 2340
gcgccgatgg tttctacaaa gatcgttatg tttatcggca ctttgcatcg gccgcgctcc 2400
cgattccgga agtgcttgac attggggaat tcagcgagag cctcacctat tgcatctccc 2460
gccgtgcaca gggtgtcacg ttgcaagacc tccctgaaac cgaactcccc gctgttctcc 2520
agccggtcgc ggaggccatg gatgcgatcg ctgcggccga tcttagccag acgagcgggt 2580
tcggcccatt cggaccgcaa ggaatcggtc aatacactac atggcgtgat ttcatatgcg 2640
cgattgctga tccccatgtg tatcactggc aaactgtgat ggacgacacc gtcagtgcgt 2700
ccgtcgcgca ggctctcgat gagctcatgc tttgggccga ggactgcccc gaagtccggc 2760
acctcgtgca cgcggatttc ggctccaaca atgtcctcac ggacaatggc cgcataacag 2820
cggtcattga ctggagcgag gcgatgttcg gggattccca atacgaggtc gccaacatct 2880
tcttctggag gccgtggttg gcttgtatgg agcagcagac gcgctacttc gagcggaggc 2940
atccggagct tgcaggatcg ccgcggctcc gggcgtatat gctccgcatt ggtcttgacc 3000
aactctatca gagcttggtt gacggcaatt tcgatgatgc agcttgggcg cagggtcgat 3060
gcgacgcaat cgtccgatcc ggagccggga ctgtcgggcg tacacaaatc gcccgcagaa 3120
gcgcggccgt ctggaccgat ggctgtgtag aagtactcgc cgatagtgga aaccgacgcc 3180
ccagcactcg tccgagggca aaggaatagt gtgctaccca cgcttactcc accagagcta 3240
ttaacatcag aaatatttat tctaataaat aggatgcaaa aaaaaaaccc cccttaataa 3300
aaaaaaaaga aacgattttt tatctaatga agtctatgta tctaacaaat gtatgtatca 3360
atgtttattc cgttaaacaa aaatcagtct gtaaaaaagg ttctaaataa atattctgtc 3420
tagtgtacac attctcccaa aatagtgaaa tccagctgct agcgtgtaag cttggcactg 3480
gccgtcgttt tacaacgtcg tgactgggaa aaccctggcg ttacccaact taatcgcctt 3540
gcagcacatc cccctttcgc cagctggcgt aatagcgaag aggcccgcac cgatcgccct 3600
tcccaacagt tgcgcagcct gaatggcgaa tggcgcctga tgcggtattt tctccttacg 3660
catctgtgcg gtatttcaca ccgcatatgg tgcactctca gtacaatctg ctctgatgcc 3720
gcatagttaa gccagccccg acacccgcca acacccgctg acgcgccctg acgggcttgt 3780
ctgctcccgg catccgctta cagacaagct gtgaccgtct ccgggagctg catgtgtcag 3840
aggttttcac cgtcatcacc gaaacgcgcg agacgaaagg gcctcgtgat acgcctattt 3900
ttataggtta atgtcatgat aataatggtt tcttagacgt caggtggcac ttttcgggga 3960
aatgtgcgcg gaacccctat ttgtttattt ttctaaatac attcaaatat gtatccgctc 4020
atgagacaat aaccctgata aatgcttcaa taatattgaa aaaggaagag tatgagtatt 4080
caacatttcc gtgtcgccct tattcccttt tttgcggcat tttgccttcc tgtttttgct 4140
cacccagaaa cgctggtgaa agtaaaagat gctgaagatc agttgggtgc acgagtgggt 4200
tacatcgaac tggatctcaa cagcggtaag atccttgaga gttttcgccc cgaagaacgt 4260
tttccaatga tgagcacttt taaagttctg ctatgtggcg cggtattatc ccgtattgac 4320
gccgggcaag agcaactcgg tcgccgcata cactattctc agaatgactt ggttgagtac 4380
tcaccagtca cagaaaagca tcttacggat ggcatgacag taagagaatt atgcagtgct 4440
gccataacca tgagtgataa cactgcggcc aacttacttc tgacaacgat cggaggaccg 4500
aaggagctaa ccgctttttt gcacaacatg ggggatcatg taactcgcct tgatcgttgg 4560
gaaccggagc tgaatgaagc cataccaaac gacgagcgtg acaccacgat gcctgtagca 4620
atggcaacaa cgttgcgcaa actattaact ggcgaactac ttactctagc ttcccggcaa 4680
caattaatag actggatgga ggcggataaa gttgcaggac cacttctgcg ctcggccctt 4740
ccggctggct ggtttattgc tgataaatct ggagccggtg agcgtgggtc tcgcggtatc 4800
attgcagcac tggggccaga tggtaagccc tcccgtatcg tagttatcta cacgacgggg 4860
agtcaggcaa ctatggatga acgaaataga cagatcgctg agataggtgc ctcactgatt 4920
aagcattggt aactgtcaga ccaagtttac tcatatatac tttagattga tttaaaactt 4980
catttttaat ttaaaaggat ctaggtgaag atcctttttg ataatctcat gaccaaaatc 5040
ccttaacgtg agttttcgtt ccactgagcg tcagaccccg tagaaaagat caaaggatct 5100
tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc aaacaaaaaa accaccgcta 5160
ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc tttttccgaa ggtaactggc 5220
ttcagcagag cgcagatacc aaatactgtc cttctagtgt agccgtagtt aggccaccac 5280
ttcaagaact ctgtagcacc gcctacatac ctcgctctgc taatcctgtt accagtggct 5340
gctgccagtg gcgataagtc gtgtcttacc gggttggact caagacgata gttaccggat 5400
aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac agcccagctt ggagcgaacg 5460
acctacaccg aactgagata cctacagcgt gagctatgag aaagcgccac gcttcccgaa 5520
gggagaaagg cggacaggta tccggtaagc ggcagggtcg gaacaggaga gcgcacgagg 5580
gagcttccag ggggaaacgc ctggtatctt tatagtcctg tcgggtttcg ccacctctga 5640
cttgagcgtc gatttttgtg atgctcgtca ggggggcgga gcctatggaa aaacgccagc 5700
aacgcggcct ttttacggtt cctggccttt tgctggcctt ttgctcacat gttctttcct 5760
gcgttatccc ctgattctgt ggataaccgt attaccgcct ttgagtgagc tgataccgct 5820
cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga aga 5873
<210> 12
<211> 1424
<212> DNA
<213> Artificial Sequence
<220>
<223> homologous recombination template
<400> 12
ggtcgaggaa gtggcattaa atccatgcga tgatcgcagg agatcagaat caaattgttg 60
ggttctagcg taacttcgtt aattacatga ggagtggagt aagcgtaata tgcgcgaagg 120
gctcagaacc gcacgtgact tcccctaaca ttgtagttaa gaggggaggg atcggagttt 180
cttttttggt tgtgcacgga gaaatcgttg aaaaggtggg gcacattttc atatgcgcta 240
atcttctttt tctttttatc acaggagaaa ctatcccacc cccacttcga aacacaatga 300
caactcctgc gtaacttgca aattcttgtc tgactaattg aaaactccgg acgagtcaga 360
cctccagtca aacggacaga cagacaaaca cttggtgcga tgttcatacc tacagacatg 420
tcaacgggtg ttagacgacg gtttcttgca aagacaggtg ttggcatctc gtacgatggc 480
aactgcagga ggtgtcgact tctcctttag gcaatagaaa aagactaagg gaacagcgtt 540
tttacaggtt gctttggtta atgtagtatt ttttagtcca acattctgtg ggttgctctg 600
ggtttctaga ataggaaatc acaggagaat gcaaattcag atggaagaac aaagagataa 660
aaaacaaaaa aaaactgagt tttgcaccaa tagaatgttt gatgatatca tccactcgct 720
aaacgaatca tgtgggtgat cttctcttta gttttggtct atcataaaac acatgaaagt 780
gaaatccaaa tacactacac tccgggtatt gtccttcgtt ttacggatgt ctcattgtct 840
tacttttgag gtcataggag ttgcctgtga gagatcacag agattatcac actcacattt 900
atcgtagttt cctatctcat gctgtgtgtc tctggttggt tcatgagttt ggattgttgt 960
acattaaagg aatcgctgga aagcaaagct atttaaattt tttctttgtc acaggtacac 1020
taacctgtaa aacttcactg ccacgccagt ctttcctgat tgggcaagtg cacaaactac 1080
aacctgcaaa acagcactcc gcttgtcaca ggttgtctcc tctcaaccaa caaaaaaata 1140
agattaaact ttctttgctc atgcatcaat cggagttatc tctgaaagag ttgcctttgt 1200
gtaatgtgtg ccaaactcaa actgcaaaac taaccacaga atgatttccc tcacaattat 1260
ataaactcac ccacatttcc acagaccgta atttcatgtc tcactttctc ttttgctctt 1320
cttttactta gtcaggtttg ataacttcct tttttattac cctatcttat ttatttattt 1380
attcatttat accaaccaac catggccaca caagaaatca tcga 1424
<210> 13
<211> 3162
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA fragment comprising mutant CYP52A12 and the resistance gene
HYG
<400> 13
ggtcgaggaa gtggcattaa atccatgcga tgatcgcagg agatcagaat caaattgttg 60
ggttctagcg taacttcgtt aattacatga ggagtggagt aagcgtaata tgcgcgaagg 120
gctcagaacc gcacgtgact tcccctaaca ttgtagttaa gaggggaggg atcggagttt 180
cttttttggt tgtgcacgga gaaatcgttg aaaaggtggg gcacattttc atatgcgcta 240
atcttctttt tctttttatc acaggagaaa ctatcccacc cccacttcga aacacaatga 300
caactcctgc gtaacttgca aattcttgtc tgactaattg aaaactccgg acgagtcaga 360
cctccagtca aacggacaga cagacaaaca cttggtgcga tgttcatacc tacagacatg 420
tcaacgggtg ttagacgacg gtttcttgca aagacaggtg ttggcatctc gtacgatggc 480
aactgcagga ggtgcatgcg aacccgaaaa tggagcaatc ttccccgggg cctccaaata 540
ccaactcacc cgagagagat aaagagacac cacccaccac gagacggagt atatccacca 600
aggtaagtaa ctcagagtta atgatacagg tgtacacagc tccttcccta gccattgagt 660
gggtatcaca tgacactggt aggttacaac cacgtttagt agttattttg tgcaattcca 720
tggggatcag gaagtttggt ttggtgggtg cgtctactga ttcccctttg tctctgaaaa 780
tcttttccct agtggaacac tttggctgaa tgatataaat tcaccttgat tcccaccctc 840
ccttctttct ctctctctct gttacaccca attgaatttt cttttttttt ttactttccc 900
tccttcttta tcatcaaaga taagtaagtt tatcaattgc ctattcagaa tgaaaaagcc 960
tgaactcacc gcgacgtctg tcgagaagtt tctcatcgaa aagttcgaca gcgtctccga 1020
cctcatgcag ctctcggagg gcgaagaatc tcgtgctttc agcttcgatg taggagggcg 1080
tggatatgtc ctccgggtaa atagctgcgc cgatggtttc tacaaagatc gttatgttta 1140
tcggcacttt gcatcggccg cgctcccgat tccggaagtg cttgacattg gggaattcag 1200
cgagagcctc acctattgca tctcccgccg tgcacagggt gtcacgttgc aagacctccc 1260
tgaaaccgaa ctccccgctg ttctccagcc ggtcgcggag gccatggatg cgatcgctgc 1320
ggccgatctt agccagacga gcgggttcgg cccattcgga ccgcaaggaa tcggtcaata 1380
cactacatgg cgtgatttca tatgcgcgat tgctgatccc catgtgtatc actggcaaac 1440
tgtgatggac gacaccgtca gtgcgtccgt cgcgcaggct ctcgatgagc tcatgctttg 1500
ggccgaggac tgccccgaag tccggcacct cgtgcacgcg gatttcggct ccaacaatgt 1560
cctcacggac aatggccgca taacagcggt cattgactgg agcgaggcga tgttcgggga 1620
ttcccaatac gaggtcgcca acatcttctt ctggaggccg tggttggctt gtatggagca 1680
gcagacgcgc tacttcgagc ggaggcatcc ggagcttgca ggatcgccgc ggctccgggc 1740
gtatatgctc cgcattggtc ttgaccaact ctatcagagc ttggttgacg gcaatttcga 1800
tgatgcagct tgggcgcagg gtcgatgcga cgcaatcgtc cgatccggag ccgggactgt 1860
cgggcgtaca caaatcgccc gcagaagcgc ggccgtctgg accgatggct gtgtagaagt 1920
actcgccgat agtggaaacc gacgccccag cactcgtccg agggcaaagg aatagtgtgc 1980
tacccacgct tactccacca gagctattaa catcagaaat atttattcta ataaatagga 2040
tgcaaaaaaa aaacccccct taataaaaaa aaaagaaacg attttttatc taatgaagtc 2100
tatgtatcta acaaatgtat gtatcaatgt ttattccgtt aaacaaaaat cagtctgtaa 2160
aaaaggttct aaataaatat tctgtctagt gtacacattc tcccaaaata gtgaaatcca 2220
gctgctagct tgtcgacttc tcctttaggc aatagaaaaa gactaaggga acagcgtttt 2280
tacaggttgc tttggttaat gtagtatttt ttagtccaac attctgtggg ttgctctggg 2340
tttctagaat aggaaatcac aggagaatgc aaattcagat ggaagaacaa agagataaaa 2400
aacaaaaaaa aactgagttt tgcaccaata gaatgtttga tgatatcatc cactcgctaa 2460
acgaatcatg tgggtgatct tctctttagt tttggtctat cataaaacac atgaaagtga 2520
aatccaaata cactacactc cgggtattgt ccttcgtttt acggatgtct cattgtctta 2580
cttttgaggt cataggagtt gcctgtgaga gatcacagag attatcacac tcacatttat 2640
cgtagtttcc tatctcatgc tgtgtgtctc tggttggttc atgagtttgg attgttgtac 2700
attaaaggaa tcgctggaaa gcaaagctat ttaaattttt tctttgtcac aggtacacta 2760
acctgtaaaa cttcactgcc acgccagtct ttcctgattg ggcaagtgca caaactacaa 2820
cctgcaaaac agcactccgc ttgtcacagg ttgtctcctc tcaaccaaca aaaaaataag 2880
attaaacttt ctttgctcat gcatcaatcg gagttatctc tgaaagagtt gcctttgtgt 2940
aatgtgtgcc aaactcaaac tgcaaaacta accacagaat gatttccctc acaattatat 3000
aaactcaccc acatttccac agaccgtaat ttcatgtctc actttctctt ttgctcttct 3060
tttacttagt caggtttgat aacttccttt tttattaccc tatcttattt atttatttat 3120
tcatttatac caaccaacca tggccacaca agaaatcatc ga 3162
<210> 14
<211> 513
<212> DNA
<213> Artificial Sequence
<220>
<223> recombination template fragment CYP52A-Upstream-2
<400> 14
ggtcgaggaa gtggcattaa atccatgcga tgatcgcagg agatcagaat caaattgttg 60
ggttctagcg taacttcgtt aattacatga ggagtggagt aagcgtaata tgcgcgaagg 120
gctcagaacc gcacgtgact tcccctaaca ttgtagttaa gaggggaggg atcggagttt 180
cttttttggt tgtgcacgga gaaatcgttg aaaaggtggg gcacattttc atatgcgcta 240
atcttctttt tctttttatc acaggagaaa ctatcccacc cccacttcga aacacaatga 300
caactcctgc gtaacttgca aattcttgtc tgactaattg aaaactccgg acgagtcaga 360
cctccagtca aacggacaga cagacaaaca cttggtgcga tgttcatacc tacagacatg 420
tcaacgggtg ttagacgacg gtttcttgca aagacaggtg ttggcatctc gtacgatggc 480
aactgcagga ggtgtcgact tctcctttag gca 513
<210> 15
<211> 931
<212> DNA
<213> Artificial Sequence
<220>
<223> recombination template fragment Pcyp52a12
<400> 15
gtcgacttct cctttaggca atagaaaaag actaagggaa cagcgttttt acaggttgct 60
ttggttaatg tagtattttt tagtccaaca ttctgtgggt tgctctgggt ttctagaata 120
ggaaatcaca ggagaatgca aattcagatg gaagaacaaa gagataaaaa acaaaaaaaa 180
actgagtttt gcaccaatag aatgtttgat gatatcatcc actcgctaaa cgaatcatgt 240
gggtgatctt ctctttagtt ttggtctatc ataaaacaca tgaaagtgaa atccaaatac 300
actacactcc gggtattgtc cttcgtttta cggatgtctc attgtcttac ttttgaggtc 360
ataggagttg cctgtgagag atcacagaga ttatcacact cacatttatc gtagtttcct 420
atctcatgct gtgtgtctct ggttggttca tgagtttgga ttgttgtaca ttaaaggaat 480
cgctggaaag caaagctatt taaatttttt ctttgtcaca ggtacactaa cctgtaaaac 540
ttcactgcca cgccagtctt tcctgattgg gcaagtgcac aaactacaac ctgcaaaaca 600
gcactccgct tgtcacaggt tgtctcctct caaccaacaa aaaaataaga ttaaactttc 660
tttgctcatg catcaatcgg agttatctct gaaagagttg cctttgtgta atgtgtgcca 720
aactcaaact gcaaaactaa ccacagaatg atttccctca caattatata aactcaccca 780
catttccaca gaccgtaatt tcatgtctca ctttctcttt tgctcttctt ttacttagtc 840
aggtttgata acttcctttt ttattaccct atcttattta tttatttatt catttatacc 900
aaccaaccat ggccacacaa gaaatcatcg a 931
<210> 16
<211> 908
<212> DNA
<213> Artificial Sequence
<220>
<223> mutant CYP52A12
<400> 16
gtcgacttct cctttaggca atagaaaaag actaagggaa cagcgttttt acaggttgct 60
ttggttaatg tagtattttt tagtccaaca ttctgtgggt tgctctgggt ttctagaata 120
ggaaatcaca ggagaatgca aattcagatg gaagaacaaa gagataaaaa acaaaaaaaa 180
actgagtttt gcaccaatag aatgtttgat gatatcatcc actcgctaaa cgaatcatgt 240
gggtgatctt ctctttagtt ttggtctatc ataaaacaca tgaaagtgaa atccaaatac 300
actacactcc gggtattgtc cttcgtttta cggatgtctc attgtcttac ttttgaggtc 360
ataggagttg cctgtgagag atcacagaga ttatcacact cacatttatc gtagtttcct 420
atctcatgct gtgtgtctct ggttggttca tgagtttgga ttgttgtaca ttaaaggaat 480
cgctggaaag caaagctatt taaatttttt ctttgtcaca ggtacactaa cctgtaaaac 540
ttcactgcca cgccagtctt tcctgattgg gcaagtgcac aaactacaac ctgcaaaaca 600
gcactccgct tgtcacaggt tgtctcctct caaccaacaa aaaaataaga ttaaactttc 660
tttgctcatg catcaatcgg agttatctct gaaagagttg cctttgtgta atgtgtgcca 720
aactcaaact gcaaaactaa ccacagaatg atttccctca caattatata aactcaccca 780
catttccaca gaccgtaatt tcatgtctca ctttctcttt tgctcttctt ttacttagtc 840
aggtttgata acttcctttt ttattaccct atcttattta tttatttatt catttatacc 900
aaccaacc 908
<210> 17
<211> 493
<212> DNA
<213> Artificial Sequence
<220>
<223> CYP52A12_Upstream
<400> 17
ggtcgaggaa gtggcattaa atccatgcga tgatcgcagg agatcagaat caaattgttg 60
ggttctagcg taacttcgtt aattacatga ggagtggagt aagcgtaata tgcgcgaagg 120
gctcagaacc gcacgtgact tcccctaaca ttgtagttaa gaggggaggg atcggagttt 180
cttttttggt tgtgcacgga gaaatcgttg aaaaggtggg gcacattttc atatgcgcta 240
atcttctttt tctttttatc acaggagaaa ctatcccacc cccacttcga aacacaatga 300
caactcctgc gtaacttgca aattcttgtc tgactaattg aaaactccgg acgagtcaga 360
cctccagtca aacggacaga cagacaaaca cttggtgcga tgttcatacc tacagacatg 420
tcaacgggtg ttagacgacg gtttcttgca aagacaggtg ttggcatctc gtacgatggc 480
aactgcagga ggt 493
<210> 18
<211> 750
<212> DNA
<213> Artificial Sequence
<220>
<223> CYP52A12_Downstream
<400> 18
atggccacac aagaaatcat cgattctgta cttccgtact tgaccaaatg gtacactgtg 60
attactgcag cagtattagt cttccttatc tccacaaaca tcaagaacta cgtcaaggca 120
aagaaattga aatgtgtcga tccaccatac ttgaaggatg ccggtctcac tggtattctg 180
tctttgatcg ccgccatcaa ggccaagaac gacggtagat tggctaactt tgccgatgaa 240
gttttcgacg agtacccaaa ccacaccttc tacttgtctg ttgccggtgc tttgaagatt 300
gtcatgactg ttgacccaga aaacatcaag gctgtcttgg ccacccaatt cactgacttc 360
tccttgggta ccagacacgc ccactttgct cctttgttgg gtgacggtat cttcaccttg 420
gacggagaag gttggaagca ctccagagct atgttgagac cacagtttgc tagagaccag 480
attggacacg ttaaagcctt ggaaccacac atccaaatca tggctaagca gatcaagttg 540
aaccagggaa agactttcga tatccaagaa ttgttcttta gatttaccgt cgacaccgct 600
actgagttct tgtttggtga atccgttcac tccttgtacg atgaaaaatt gggcatccca 660
actccaaacg aaatcccagg aagagaaaac tttgccgctg ctttcaacgt ttcccaacac 720
tacttggcca ccagaagtta ctcccagact 750
<210> 19
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> primer HYG-F
<400> 19
ctcggagggc gaagaatctc 20
<210> 20
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> primer HYG-R
<400> 20
caatgaccgc tgttatgcgg 20
<210> 21
<211> 4115
<212> DNA
<213> Candida tropicalis
<400> 21
catatgcgct aatcttcttt ttctttttat cacaggagaa actatcccac ccccacttcg 60
aaacacaatg acaactcctg cgtaacttgc aaattcttgt ctgactaatt gaaaactccg 120
gacgagtcag acctccagtc aaacggacag acagacaaac acttggtgcg atgttcatac 180
ctacagacat gtcaacgggt gttagacgac ggtttcttgc aaagacaggt gttggcatct 240
cgtacgatgg caactgcagg aggtgtcgac ttctccttta ggcaatagaa aaagactaag 300
agaacagcgt ttttacaggt tgcattggtt aatgtagtat ttttttagtc ccagcattct 360
gtgggttgct ctgggtttct agaataggaa atcacaggag aatgcaaatt cagatggaag 420
aacaaagaga taaaaaacaa aaaaaaactg agttttgcac caatagaatg tttgatgata 480
tcatccactc gctaaacgaa tcatgtgggt gatcttctct ttagttttgg tctatcataa 540
aacacatgaa agtgaaatcc aaatacacta cactccgggt attgtccttc gttttacaga 600
tgtctcattg tcttactttt gaggtcatag gagttgcctg tgagagatca cagagattat 660
cacactcaca tttatcgtag tttcctatct catgctgtgt gtctctggtt ggttcatgag 720
tttggattgt tgtacattaa aggaatcgct ggaaagcaaa gctaactaaa ttttctttgt 780
cacaggtaca ctaacctgta aaacttcact gccacgccag tctttcctga ttgggcaagt 840
gcacaaacta caacctgcaa aacagcactc cgcttgtcac aggttgtctc ctctcaacca 900
acaaaaaaat aagattaaac tttctttgct catgcatcaa tcggagttat ctctgaaaga 960
gttgcctttg tgtaatgtgt gccaaactca aactgcaaaa ctaaccacag aatgatttcc 1020
ctcacaatta tataaactca cccacatttc cacagaccgt aatttcatgt ctcactttct 1080
cttttgctct tcttttactt agtcaggttt gataacttcc ttttttatta ccctatctta 1140
tttatttatt tattcattta taccaaccaa ccaaccatgg ccacacaaga aatcatcgat 1200
tctgtacttc cgtacttgac caaatggtac actgtgatta ctgcagcagt attagtcttc 1260
cttatctcca caaacatcaa gaactacgtc aaggcaaaga aattgaaatg tgtcgatcca 1320
ccatacttga aggatgccgg tctcactggt attctgtctt tgatcgccgc catcaaggcc 1380
aagaacgacg gtagattggc taactttgcc gatgaagttt tcgacgagta cccaaaccac 1440
accttctact tgtctgttgc cggtgctttg aagattgtca tgactgttga cccagaaaac 1500
atcaaggctg tcttggccac ccaattcact gacttctcct tgggtaccag acacgcccac 1560
tttgctcctt tgttgggtga cggtatcttc accttggacg gagaaggttg gaagcactcc 1620
agagctatgt tgagaccaca gtttgctaga gaccagattg gacacgttaa agccttggaa 1680
ccacacatcc aaatcatggc taagcagatc aagttgaacc agggaaagac tttcgatatc 1740
caagaattgt tctttagatt taccgtcgac accgctactg agttcttgtt tggtgaatcc 1800
gttcactcct tgtacgatga aaaattgggc atcccaactc caaacgaaat cccaggaaga 1860
gaaaactttg ccgctgcttt caacgtttcc caacactact tggccaccag aagttactcc 1920
cagacttttt actttttgac caaccctaag gaattcagag actgtaacgc caaggtccac 1980
cacttggcca agtactttgt caacaaggcc ttgaacttta ctcctgaaga actcgaagag 2040
aaatccaagt ccggttacgt tttcttgtac gaattggtta agcaaaccag agatccaaag 2100
gtcttgcaag atcaattgtt gaacattatg gttgccggaa gagacaccac tgccggtttg 2160
ttgtcctttg ctttgtttga attggctaga cacccagaga tgtggtccaa gttgagagaa 2220
gaaatcgaag ttaactttgg tgttggtgaa gactcccgcg ttgaagaaat taccttcgaa 2280
gccttgaaga gatgtgaata cttgaaggct atccttaacg aaaccttgcg tatgtaccca 2340
tctgttcctg tcaactttag aaccgccacc agagacacca ctttgccaag aggtggtggt 2400
gctaacggta ccgacccaat ctacattcct aaaggctcca ctgttgctta cgttgtctac 2460
aagacccacc gtttggaaga atactacggt aaggacgcta acgacttcag accagaaaga 2520
tggtttgaac catctactaa gaagttgggc tgggcttatg ttccattcaa cggtggtcca 2580
agagtctgct tgggtcaaca attcgccttg actgaagctt cttatgtgat cactagattg 2640
gcccagatgt ttgaaactgt ctcatctgat ccaggtctcg aataccctcc accaaagtgt 2700
attcacttga ccatgagtca caacgatggt gtctttgtca agatgtaaag tagtcgatgc 2760
tgggtattcg attacatgtg tataggaaga ttttggtttt ttattcgttc ttttttttaa 2820
tttttgttaa attagtttag agatttcatt aatacataga tgggtgctat ttccgaaact 2880
ttacttctat cccctgtatc ccttattatc cctctcagtc acatgattgc tgtaattgtc 2940
gtgcaggaca caaactccct aacggactta aaccataaac aagctcagaa ccataagccg 3000
acatcactcc ttcttctctc ttctccaacc aatagcatgg acagacccac cctcctatcc 3060
gaatcgaaga cccttattga ctccataccc acctggaagc ccctcaagcc acacacgtca 3120
tccagcccac ccatcaccac atccctctac tcgacaacgt ccaaagacgg cgagttctgg 3180
tgtgcccgga aatcagccat cccggccaca tacaagcagc cgttgattgc gtgcatactc 3240
ggcgagccca caatgggagc cacgcattcg gaccatgaag caaagtacat tcacgagatc 3300
acgggtgttt cagtgtcgca gattgagaag ttcgacgatg gatggaagta cgatctcgtt 3360
gcggattacg acttcggtgg gttgttatct aaacgaagat tctatgagac gcagcatgtg 3420
tttcggttcg aggattgtgc gtacgtcatg agtgtgcctt ttgatggacc caaggaggaa 3480
ggttacgtgg ttgggacgta cagatccatt gaaaggttga gctggggtaa agacggggac 3540
gtggagtgga ccatggcgac gacgtcggat cctggtgggt ttatcccgca atggataact 3600
cgattgagca tccctggagc aatcgcaaaa gatgtgccta gtgtattaaa ctacatacag 3660
aaataaaaac gtgtcttgat tcattggttt ggttcttgtt gggttccgag ccaatatttc 3720
acatcatctc ctaaattctc caagaatccc aacgtagcgt agtccagcac gccctctgag 3780
atcttattta atatcgactt ctcaaccacc ggtggaatcc cgttcagacc attgttacct 3840
gtagtgtgtt tgctcttgtt cttgatgaca atgatgtatt tgtcacgata cctgaaataa 3900
taaaacatcc agtcattgag cttattactc gtgaacttat gaaagaactc attcaagccg 3960
ttcccaaaaa acccagaatt gaagatcttg ctcaactggt catgcaagta gtagatcgcc 4020
atgatctgat actttaccaa gctatcctct ccaagttctc ccacgtacgg caagtacggc 4080
aacgagctct ggaagctttg ttgtttgggg tcata 4115
<210> 22
<211> 4111
<212> DNA
<213> Artificial Sequence
<220>
<223> mutant CYP52A12, -7_-4delAACC
<400> 22
catatgcgct aatcttcttt ttctttttat cacaggagaa actatcccac ccccacttcg 60
aaacacaatg acaactcctg cgtaacttgc aaattcttgt ctgactaatt gaaaactccg 120
gacgagtcag acctccagtc aaacggacag acagacaaac acttggtgcg atgttcatac 180
ctacagacat gtcaacgggt gttagacgac ggtttcttgc aaagacaggt gttggcatct 240
cgtacgatgg caactgcagg aggtgtcgac ttctccttta ggcaatagaa aaagactaag 300
agaacagcgt ttttacaggt tgcattggtt aatgtagtat ttttttagtc ccagcattct 360
gtgggttgct ctgggtttct agaataggaa atcacaggag aatgcaaatt cagatggaag 420
aacaaagaga taaaaaacaa aaaaaaactg agttttgcac caatagaatg tttgatgata 480
tcatccactc gctaaacgaa tcatgtgggt gatcttctct ttagttttgg tctatcataa 540
aacacatgaa agtgaaatcc aaatacacta cactccgggt attgtccttc gttttacaga 600
tgtctcattg tcttactttt gaggtcatag gagttgcctg tgagagatca cagagattat 660
cacactcaca tttatcgtag tttcctatct catgctgtgt gtctctggtt ggttcatgag 720
tttggattgt tgtacattaa aggaatcgct ggaaagcaaa gctaactaaa ttttctttgt 780
cacaggtaca ctaacctgta aaacttcact gccacgccag tctttcctga ttgggcaagt 840
gcacaaacta caacctgcaa aacagcactc cgcttgtcac aggttgtctc ctctcaacca 900
acaaaaaaat aagattaaac tttctttgct catgcatcaa tcggagttat ctctgaaaga 960
gttgcctttg tgtaatgtgt gccaaactca aactgcaaaa ctaaccacag aatgatttcc 1020
ctcacaatta tataaactca cccacatttc cacagaccgt aatttcatgt ctcactttct 1080
cttttgctct tcttttactt agtcaggttt gataacttcc ttttttatta ccctatctta 1140
tttatttatt tattcattta taccaaccaa ccatggccac acaagaaatc atcgattctg 1200
tacttccgta cttgaccaaa tggtacactg tgattactgc agcagtatta gtcttcctta 1260
tctccacaaa catcaagaac tacgtcaagg caaagaaatt gaaatgtgtc gatccaccat 1320
acttgaagga tgccggtctc actggtattc tgtctttgat cgccgccatc aaggccaaga 1380
acgacggtag attggctaac tttgccgatg aagttttcga cgagtaccca aaccacacct 1440
tctacttgtc tgttgccggt gctttgaaga ttgtcatgac tgttgaccca gaaaacatca 1500
aggctgtctt ggccacccaa ttcactgact tctccttggg taccagacac gcccactttg 1560
ctcctttgtt gggtgacggt atcttcacct tggacggaga aggttggaag cactccagag 1620
ctatgttgag accacagttt gctagagacc agattggaca cgttaaagcc ttggaaccac 1680
acatccaaat catggctaag cagatcaagt tgaaccaggg aaagactttc gatatccaag 1740
aattgttctt tagatttacc gtcgacaccg ctactgagtt cttgtttggt gaatccgttc 1800
actccttgta cgatgaaaaa ttgggcatcc caactccaaa cgaaatccca ggaagagaaa 1860
actttgccgc tgctttcaac gtttcccaac actacttggc caccagaagt tactcccaga 1920
ctttttactt tttgaccaac cctaaggaat tcagagactg taacgccaag gtccaccact 1980
tggccaagta ctttgtcaac aaggccttga actttactcc tgaagaactc gaagagaaat 2040
ccaagtccgg ttacgttttc ttgtacgaat tggttaagca aaccagagat ccaaaggtct 2100
tgcaagatca attgttgaac attatggttg ccggaagaga caccactgcc ggtttgttgt 2160
cctttgcttt gtttgaattg gctagacacc cagagatgtg gtccaagttg agagaagaaa 2220
tcgaagttaa ctttggtgtt ggtgaagact cccgcgttga agaaattacc ttcgaagcct 2280
tgaagagatg tgaatacttg aaggctatcc ttaacgaaac cttgcgtatg tacccatctg 2340
ttcctgtcaa ctttagaacc gccaccagag acaccacttt gccaagaggt ggtggtgcta 2400
acggtaccga cccaatctac attcctaaag gctccactgt tgcttacgtt gtctacaaga 2460
cccaccgttt ggaagaatac tacggtaagg acgctaacga cttcagacca gaaagatggt 2520
ttgaaccatc tactaagaag ttgggctggg cttatgttcc attcaacggt ggtccaagag 2580
tctgcttggg tcaacaattc gccttgactg aagcttctta tgtgatcact agattggccc 2640
agatgtttga aactgtctca tctgatccag gtctcgaata ccctccacca aagtgtattc 2700
acttgaccat gagtcacaac gatggtgtct ttgtcaagat gtaaagtagt cgatgctggg 2760
tattcgatta catgtgtata ggaagatttt ggttttttat tcgttctttt ttttaatttt 2820
tgttaaatta gtttagagat ttcattaata catagatggg tgctatttcc gaaactttac 2880
ttctatcccc tgtatccctt attatccctc tcagtcacat gattgctgta attgtcgtgc 2940
aggacacaaa ctccctaacg gacttaaacc ataaacaagc tcagaaccat aagccgacat 3000
cactccttct tctctcttct ccaaccaata gcatggacag acccaccctc ctatccgaat 3060
cgaagaccct tattgactcc atacccacct ggaagcccct caagccacac acgtcatcca 3120
gcccacccat caccacatcc ctctactcga caacgtccaa agacggcgag ttctggtgtg 3180
cccggaaatc agccatcccg gccacataca agcagccgtt gattgcgtgc atactcggcg 3240
agcccacaat gggagccacg cattcggacc atgaagcaaa gtacattcac gagatcacgg 3300
gtgtttcagt gtcgcagatt gagaagttcg acgatggatg gaagtacgat ctcgttgcgg 3360
attacgactt cggtgggttg ttatctaaac gaagattcta tgagacgcag catgtgtttc 3420
ggttcgagga ttgtgcgtac gtcatgagtg tgccttttga tggacccaag gaggaaggtt 3480
acgtggttgg gacgtacaga tccattgaaa ggttgagctg gggtaaagac ggggacgtgg 3540
agtggaccat ggcgacgacg tcggatcctg gtgggtttat cccgcaatgg ataactcgat 3600
tgagcatccc tggagcaatc gcaaaagatg tgcctagtgt attaaactac atacagaaat 3660
aaaaacgtgt cttgattcat tggtttggtt cttgttgggt tccgagccaa tatttcacat 3720
catctcctaa attctccaag aatcccaacg tagcgtagtc cagcacgccc tctgagatct 3780
tatttaatat cgacttctca accaccggtg gaatcccgtt cagaccattg ttacctgtag 3840
tgtgtttgct cttgttcttg atgacaatga tgtatttgtc acgatacctg aaataataaa 3900
acatccagtc attgagctta ttactcgtga acttatgaaa gaactcattc aagccgttcc 3960
caaaaaaccc agaattgaag atcttgctca actggtcatg caagtagtag atcgccatga 4020
tctgatactt taccaagcta tcctctccaa gttctcccac gtacggcaag tacggcaacg 4080
agctctggaa gctttgttgt ttggggtcat a 4111
<210> 23
<211> 4113
<212> DNA
<213> Artificial Sequence
<220>
<223> mutant CYP52A12, -412_-411AC>TT, -402insTT and -7_-4delACCA
<400> 23
catatgcgct aatcttcttt ttctttttat cacaggagaa actatcccac ccccacttcg 60
aaacacaatg acaactcctg cgtaacttgc aaattcttgt ctgactaatt gaaaactccg 120
gacgagtcag acctccagtc aaacggacag acagacaaac acttggtgcg atgttcatac 180
ctacagacat gtcaacgggt gttagacgac ggtttcttgc aaagacaggt gttggcatct 240
cgtacgatgg caactgcagg aggtgtcgac ttctccttta ggcaatagaa aaagactaag 300
agaacagcgt ttttacaggt tgcattggtt aatgtagtat ttttttagtc ccagcattct 360
gtgggttgct ctgggtttct agaataggaa atcacaggag aatgcaaatt cagatggaag 420
aacaaagaga taaaaaacaa aaaaaaactg agttttgcac caatagaatg tttgatgata 480
tcatccactc gctaaacgaa tcatgtgggt gatcttctct ttagttttgg tctatcataa 540
aacacatgaa agtgaaatcc aaatacacta cactccgggt attgtccttc gttttacaga 600
tgtctcattg tcttactttt gaggtcatag gagttgcctg tgagagatca cagagattat 660
cacactcaca tttatcgtag tttcctatct catgctgtgt gtctctggtt ggttcatgag 720
tttggattgt tgtacattaa aggaatcgct ggaaagcaaa gctatttaaa ttttttcttt 780
gtcacaggta cactaacctg taaaacttca ctgccacgcc agtctttcct gattgggcaa 840
gtgcacaaac tacaacctgc aaaacagcac tccgcttgtc acaggttgtc tcctctcaac 900
caacaaaaaa ataagattaa actttctttg ctcatgcatc aatcggagtt atctctgaaa 960
gagttgcctt tgtgtaatgt gtgccaaact caaactgcaa aactaaccac agaatgattt 1020
ccctcacaat tatataaact cacccacatt tccacagacc gtaatttcat gtctcacttt 1080
ctcttttgct cttcttttac ttagtcaggt ttgataactt ccttttttat taccctatct 1140
tatttattta tttattcatt tataccaacc aaccatggcc acacaagaaa tcatcgattc 1200
tgtacttccg tacttgacca aatggtacac tgtgattact gcagcagtat tagtcttcct 1260
tatctccaca aacatcaaga actacgtcaa ggcaaagaaa ttgaaatgtg tcgatccacc 1320
atacttgaag gatgccggtc tcactggtat tctgtctttg atcgccgcca tcaaggccaa 1380
gaacgacggt agattggcta actttgccga tgaagttttc gacgagtacc caaaccacac 1440
cttctacttg tctgttgccg gtgctttgaa gattgtcatg actgttgacc cagaaaacat 1500
caaggctgtc ttggccaccc aattcactga cttctccttg ggtaccagac acgcccactt 1560
tgctcctttg ttgggtgacg gtatcttcac cttggacgga gaaggttgga agcactccag 1620
agctatgttg agaccacagt ttgctagaga ccagattgga cacgttaaag ccttggaacc 1680
acacatccaa atcatggcta agcagatcaa gttgaaccag ggaaagactt tcgatatcca 1740
agaattgttc tttagattta ccgtcgacac cgctactgag ttcttgtttg gtgaatccgt 1800
tcactccttg tacgatgaaa aattgggcat cccaactcca aacgaaatcc caggaagaga 1860
aaactttgcc gctgctttca acgtttccca acactacttg gccaccagaa gttactccca 1920
gactttttac tttttgacca accctaagga attcagagac tgtaacgcca aggtccacca 1980
cttggccaag tactttgtca acaaggcctt gaactttact cctgaagaac tcgaagagaa 2040
atccaagtcc ggttacgttt tcttgtacga attggttaag caaaccagag atccaaaggt 2100
cttgcaagat caattgttga acattatggt tgccggaaga gacaccactg ccggtttgtt 2160
gtcctttgct ttgtttgaat tggctagaca cccagagatg tggtccaagt tgagagaaga 2220
aatcgaagtt aactttggtg ttggtgaaga ctcccgcgtt gaagaaatta ccttcgaagc 2280
cttgaagaga tgtgaatact tgaaggctat ccttaacgaa accttgcgta tgtacccatc 2340
tgttcctgtc aactttagaa ccgccaccag agacaccact ttgccaagag gtggtggtgc 2400
taacggtacc gacccaatct acattcctaa aggctccact gttgcttacg ttgtctacaa 2460
gacccaccgt ttggaagaat actacggtaa ggacgctaac gacttcagac cagaaagatg 2520
gtttgaacca tctactaaga agttgggctg ggcttatgtt ccattcaacg gtggtccaag 2580
agtctgcttg ggtcaacaat tcgccttgac tgaagcttct tatgtgatca ctagattggc 2640
ccagatgttt gaaactgtct catctgatcc aggtctcgaa taccctccac caaagtgtat 2700
tcacttgacc atgagtcaca acgatggtgt ctttgtcaag atgtaaagta gtcgatgctg 2760
ggtattcgat tacatgtgta taggaagatt ttggtttttt attcgttctt ttttttaatt 2820
tttgttaaat tagtttagag atttcattaa tacatagatg ggtgctattt ccgaaacttt 2880
acttctatcc cctgtatccc ttattatccc tctcagtcac atgattgctg taattgtcgt 2940
gcaggacaca aactccctaa cggacttaaa ccataaacaa gctcagaacc ataagccgac 3000
atcactcctt cttctctctt ctccaaccaa tagcatggac agacccaccc tcctatccga 3060
atcgaagacc cttattgact ccatacccac ctggaagccc ctcaagccac acacgtcatc 3120
cagcccaccc atcaccacat ccctctactc gacaacgtcc aaagacggcg agttctggtg 3180
tgcccggaaa tcagccatcc cggccacata caagcagccg ttgattgcgt gcatactcgg 3240
cgagcccaca atgggagcca cgcattcgga ccatgaagca aagtacattc acgagatcac 3300
gggtgtttca gtgtcgcaga ttgagaagtt cgacgatgga tggaagtacg atctcgttgc 3360
ggattacgac ttcggtgggt tgttatctaa acgaagattc tatgagacgc agcatgtgtt 3420
tcggttcgag gattgtgcgt acgtcatgag tgtgcctttt gatggaccca aggaggaagg 3480
ttacgtggtt gggacgtaca gatccattga aaggttgagc tggggtaaag acggggacgt 3540
ggagtggacc atggcgacga cgtcggatcc tggtgggttt atcccgcaat ggataactcg 3600
attgagcatc cctggagcaa tcgcaaaaga tgtgcctagt gtattaaact acatacagaa 3660
ataaaaacgt gtcttgattc attggtttgg ttcttgttgg gttccgagcc aatatttcac 3720
atcatctcct aaattctcca agaatcccaa cgtagcgtag tccagcacgc cctctgagat 3780
cttatttaat atcgacttct caaccaccgg tggaatcccg ttcagaccat tgttacctgt 3840
agtgtgtttg ctcttgttct tgatgacaat gatgtatttg tcacgatacc tgaaataata 3900
aaacatccag tcattgagct tattactcgt gaacttatga aagaactcat tcaagccgtt 3960
cccaaaaaac ccagaattga agatcttgct caactggtca tgcaagtagt agatcgccat 4020
gatctgatac tttaccaagc tatcctctcc aagttctccc acgtacggca agtacggcaa 4080
cgagctctgg aagctttgtt gtttggggtc ata 4113
<210> 24
<211> 4113
<212> DNA
<213> Artificial Sequence
<220>
<223> mutant CYP52A12, -579A>G, -412_-411AC>TT, -402insTT and
-7_-4delACCA
<400> 24
catatgcgct aatcttcttt ttctttttat cacaggagaa actatcccac ccccacttcg 60
aaacacaatg acaactcctg cgtaacttgc aaattcttgt ctgactaatt gaaaactccg 120
gacgagtcag acctccagtc aaacggacag acagacaaac acttggtgcg atgttcatac 180
ctacagacat gtcaacgggt gttagacgac ggtttcttgc aaagacaggt gttggcatct 240
cgtacgatgg caactgcagg aggtgtcgac ttctccttta ggcaatagaa aaagactaag 300
agaacagcgt ttttacaggt tgcattggtt aatgtagtat ttttttagtc ccagcattct 360
gtgggttgct ctgggtttct agaataggaa atcacaggag aatgcaaatt cagatggaag 420
aacaaagaga taaaaaacaa aaaaaaactg agttttgcac caatagaatg tttgatgata 480
tcatccactc gctaaacgaa tcatgtgggt gatcttctct ttagttttgg tctatcataa 540
aacacatgaa agtgaaatcc aaatacacta cactccgggt attgtccttc gttttacgga 600
tgtctcattg tcttactttt gaggtcatag gagttgcctg tgagagatca cagagattat 660
cacactcaca tttatcgtag tttcctatct catgctgtgt gtctctggtt ggttcatgag 720
tttggattgt tgtacattaa aggaatcgct ggaaagcaaa gctatttaaa ttttttcttt 780
gtcacaggta cactaacctg taaaacttca ctgccacgcc agtctttcct gattgggcaa 840
gtgcacaaac tacaacctgc aaaacagcac tccgcttgtc acaggttgtc tcctctcaac 900
caacaaaaaa ataagattaa actttctttg ctcatgcatc aatcggagtt atctctgaaa 960
gagttgcctt tgtgtaatgt gtgccaaact caaactgcaa aactaaccac agaatgattt 1020
ccctcacaat tatataaact cacccacatt tccacagacc gtaatttcat gtctcacttt 1080
ctcttttgct cttcttttac ttagtcaggt ttgataactt ccttttttat taccctatct 1140
tatttattta tttattcatt tataccaacc aaccatggcc acacaagaaa tcatcgattc 1200
tgtacttccg tacttgacca aatggtacac tgtgattact gcagcagtat tagtcttcct 1260
tatctccaca aacatcaaga actacgtcaa ggcaaagaaa ttgaaatgtg tcgatccacc 1320
atacttgaag gatgccggtc tcactggtat tctgtctttg atcgccgcca tcaaggccaa 1380
gaacgacggt agattggcta actttgccga tgaagttttc gacgagtacc caaaccacac 1440
cttctacttg tctgttgccg gtgctttgaa gattgtcatg actgttgacc cagaaaacat 1500
caaggctgtc ttggccaccc aattcactga cttctccttg ggtaccagac acgcccactt 1560
tgctcctttg ttgggtgacg gtatcttcac cttggacgga gaaggttgga agcactccag 1620
agctatgttg agaccacagt ttgctagaga ccagattgga cacgttaaag ccttggaacc 1680
acacatccaa atcatggcta agcagatcaa gttgaaccag ggaaagactt tcgatatcca 1740
agaattgttc tttagattta ccgtcgacac cgctactgag ttcttgtttg gtgaatccgt 1800
tcactccttg tacgatgaaa aattgggcat cccaactcca aacgaaatcc caggaagaga 1860
aaactttgcc gctgctttca acgtttccca acactacttg gccaccagaa gttactccca 1920
gactttttac tttttgacca accctaagga attcagagac tgtaacgcca aggtccacca 1980
cttggccaag tactttgtca acaaggcctt gaactttact cctgaagaac tcgaagagaa 2040
atccaagtcc ggttacgttt tcttgtacga attggttaag caaaccagag atccaaaggt 2100
cttgcaagat caattgttga acattatggt tgccggaaga gacaccactg ccggtttgtt 2160
gtcctttgct ttgtttgaat tggctagaca cccagagatg tggtccaagt tgagagaaga 2220
aatcgaagtt aactttggtg ttggtgaaga ctcccgcgtt gaagaaatta ccttcgaagc 2280
cttgaagaga tgtgaatact tgaaggctat ccttaacgaa accttgcgta tgtacccatc 2340
tgttcctgtc aactttagaa ccgccaccag agacaccact ttgccaagag gtggtggtgc 2400
taacggtacc gacccaatct acattcctaa aggctccact gttgcttacg ttgtctacaa 2460
gacccaccgt ttggaagaat actacggtaa ggacgctaac gacttcagac cagaaagatg 2520
gtttgaacca tctactaaga agttgggctg ggcttatgtt ccattcaacg gtggtccaag 2580
agtctgcttg ggtcaacaat tcgccttgac tgaagcttct tatgtgatca ctagattggc 2640
ccagatgttt gaaactgtct catctgatcc aggtctcgaa taccctccac caaagtgtat 2700
tcacttgacc atgagtcaca acgatggtgt ctttgtcaag atgtaaagta gtcgatgctg 2760
ggtattcgat tacatgtgta taggaagatt ttggtttttt attcgttctt ttttttaatt 2820
tttgttaaat tagtttagag atttcattaa tacatagatg ggtgctattt ccgaaacttt 2880
acttctatcc cctgtatccc ttattatccc tctcagtcac atgattgctg taattgtcgt 2940
gcaggacaca aactccctaa cggacttaaa ccataaacaa gctcagaacc ataagccgac 3000
atcactcctt cttctctctt ctccaaccaa tagcatggac agacccaccc tcctatccga 3060
atcgaagacc cttattgact ccatacccac ctggaagccc ctcaagccac acacgtcatc 3120
cagcccaccc atcaccacat ccctctactc gacaacgtcc aaagacggcg agttctggtg 3180
tgcccggaaa tcagccatcc cggccacata caagcagccg ttgattgcgt gcatactcgg 3240
cgagcccaca atgggagcca cgcattcgga ccatgaagca aagtacattc acgagatcac 3300
gggtgtttca gtgtcgcaga ttgagaagtt cgacgatgga tggaagtacg atctcgttgc 3360
ggattacgac ttcggtgggt tgttatctaa acgaagattc tatgagacgc agcatgtgtt 3420
tcggttcgag gattgtgcgt acgtcatgag tgtgcctttt gatggaccca aggaggaagg 3480
ttacgtggtt gggacgtaca gatccattga aaggttgagc tggggtaaag acggggacgt 3540
ggagtggacc atggcgacga cgtcggatcc tggtgggttt atcccgcaat ggataactcg 3600
attgagcatc cctggagcaa tcgcaaaaga tgtgcctagt gtattaaact acatacagaa 3660
ataaaaacgt gtcttgattc attggtttgg ttcttgttgg gttccgagcc aatatttcac 3720
atcatctcct aaattctcca agaatcccaa cgtagcgtag tccagcacgc cctctgagat 3780
cttatttaat atcgacttct caaccaccgg tggaatcccg ttcagaccat tgttacctgt 3840
agtgtgtttg ctcttgttct tgatgacaat gatgtatttg tcacgatacc tgaaataata 3900
aaacatccag tcattgagct tattactcgt gaacttatga aagaactcat tcaagccgtt 3960
cccaaaaaac ccagaattga agatcttgct caactggtca tgcaagtagt agatcgccat 4020
gatctgatac tttaccaagc tatcctctcc aagttctccc acgtacggca agtacggcaa 4080
cgagctctgg aagctttgtt gtttggggtc ata 4113
<210> 25
<211> 4111
<212> DNA
<213> Artificial Sequence
<220>
<223> mutant CYP52A12, -831delT, -825C>A, -823delG, -579A>G,
-412_-411AC>TT, -402insTT and -7_-4delACCA
<400> 25
catatgcgct aatcttcttt ttctttttat cacaggagaa actatcccac ccccacttcg 60
aaacacaatg acaactcctg cgtaacttgc aaattcttgt ctgactaatt gaaaactccg 120
gacgagtcag acctccagtc aaacggacag acagacaaac acttggtgcg atgttcatac 180
ctacagacat gtcaacgggt gttagacgac ggtttcttgc aaagacaggt gttggcatct 240
cgtacgatgg caactgcagg aggtgtcgac ttctccttta ggcaatagaa aaagactaag 300
agaacagcgt ttttacaggt tgcattggtt aatgtagtat tttttagtcc aacattctgt 360
gggttgctct gggtttctag aataggaaat cacaggagaa tgcaaattca gatggaagaa 420
caaagagata aaaaacaaaa aaaaactgag ttttgcacca atagaatgtt tgatgatatc 480
atccactcgc taaacgaatc atgtgggtga tcttctcttt agttttggtc tatcataaaa 540
cacatgaaag tgaaatccaa atacactaca ctccgggtat tgtccttcgt tttacggatg 600
tctcattgtc ttacttttga ggtcatagga gttgcctgtg agagatcaca gagattatca 660
cactcacatt tatcgtagtt tcctatctca tgctgtgtgt ctctggttgg ttcatgagtt 720
tggattgttg tacattaaag gaatcgctgg aaagcaaagc tatttaaatt ttttctttgt 780
cacaggtaca ctaacctgta aaacttcact gccacgccag tctttcctga ttgggcaagt 840
gcacaaacta caacctgcaa aacagcactc cgcttgtcac aggttgtctc ctctcaacca 900
acaaaaaaat aagattaaac tttctttgct catgcatcaa tcggagttat ctctgaaaga 960
gttgcctttg tgtaatgtgt gccaaactca aactgcaaaa ctaaccacag aatgatttcc 1020
ctcacaatta tataaactca cccacatttc cacagaccgt aatttcatgt ctcactttct 1080
cttttgctct tcttttactt agtcaggttt gataacttcc ttttttatta ccctatctta 1140
tttatttatt tattcattta taccaaccaa ccatggccac acaagaaatc atcgattctg 1200
tacttccgta cttgaccaaa tggtacactg tgattactgc agcagtatta gtcttcctta 1260
tctccacaaa catcaagaac tacgtcaagg caaagaaatt gaaatgtgtc gatccaccat 1320
acttgaagga tgccggtctc actggtattc tgtctttgat cgccgccatc aaggccaaga 1380
acgacggtag attggctaac tttgccgatg aagttttcga cgagtaccca aaccacacct 1440
tctacttgtc tgttgccggt gctttgaaga ttgtcatgac tgttgaccca gaaaacatca 1500
aggctgtctt ggccacccaa ttcactgact tctccttggg taccagacac gcccactttg 1560
ctcctttgtt gggtgacggt atcttcacct tggacggaga aggttggaag cactccagag 1620
ctatgttgag accacagttt gctagagacc agattggaca cgttaaagcc ttggaaccac 1680
acatccaaat catggctaag cagatcaagt tgaaccaggg aaagactttc gatatccaag 1740
aattgttctt tagatttacc gtcgacaccg ctactgagtt cttgtttggt gaatccgttc 1800
actccttgta cgatgaaaaa ttgggcatcc caactccaaa cgaaatccca ggaagagaaa 1860
actttgccgc tgctttcaac gtttcccaac actacttggc caccagaagt tactcccaga 1920
ctttttactt tttgaccaac cctaaggaat tcagagactg taacgccaag gtccaccact 1980
tggccaagta ctttgtcaac aaggccttga actttactcc tgaagaactc gaagagaaat 2040
ccaagtccgg ttacgttttc ttgtacgaat tggttaagca aaccagagat ccaaaggtct 2100
tgcaagatca attgttgaac attatggttg ccggaagaga caccactgcc ggtttgttgt 2160
cctttgcttt gtttgaattg gctagacacc cagagatgtg gtccaagttg agagaagaaa 2220
tcgaagttaa ctttggtgtt ggtgaagact cccgcgttga agaaattacc ttcgaagcct 2280
tgaagagatg tgaatacttg aaggctatcc ttaacgaaac cttgcgtatg tacccatctg 2340
ttcctgtcaa ctttagaacc gccaccagag acaccacttt gccaagaggt ggtggtgcta 2400
acggtaccga cccaatctac attcctaaag gctccactgt tgcttacgtt gtctacaaga 2460
cccaccgttt ggaagaatac tacggtaagg acgctaacga cttcagacca gaaagatggt 2520
ttgaaccatc tactaagaag ttgggctggg cttatgttcc attcaacggt ggtccaagag 2580
tctgcttggg tcaacaattc gccttgactg aagcttctta tgtgatcact agattggccc 2640
agatgtttga aactgtctca tctgatccag gtctcgaata ccctccacca aagtgtattc 2700
acttgaccat gagtcacaac gatggtgtct ttgtcaagat gtaaagtagt cgatgctggg 2760
tattcgatta catgtgtata ggaagatttt ggttttttat tcgttctttt ttttaatttt 2820
tgttaaatta gtttagagat ttcattaata catagatggg tgctatttcc gaaactttac 2880
ttctatcccc tgtatccctt attatccctc tcagtcacat gattgctgta attgtcgtgc 2940
aggacacaaa ctccctaacg gacttaaacc ataaacaagc tcagaaccat aagccgacat 3000
cactccttct tctctcttct ccaaccaata gcatggacag acccaccctc ctatccgaat 3060
cgaagaccct tattgactcc atacccacct ggaagcccct caagccacac acgtcatcca 3120
gcccacccat caccacatcc ctctactcga caacgtccaa agacggcgag ttctggtgtg 3180
cccggaaatc agccatcccg gccacataca agcagccgtt gattgcgtgc atactcggcg 3240
agcccacaat gggagccacg cattcggacc atgaagcaaa gtacattcac gagatcacgg 3300
gtgtttcagt gtcgcagatt gagaagttcg acgatggatg gaagtacgat ctcgttgcgg 3360
attacgactt cggtgggttg ttatctaaac gaagattcta tgagacgcag catgtgtttc 3420
ggttcgagga ttgtgcgtac gtcatgagtg tgccttttga tggacccaag gaggaaggtt 3480
acgtggttgg gacgtacaga tccattgaaa ggttgagctg gggtaaagac ggggacgtgg 3540
agtggaccat ggcgacgacg tcggatcctg gtgggtttat cccgcaatgg ataactcgat 3600
tgagcatccc tggagcaatc gcaaaagatg tgcctagtgt attaaactac atacagaaat 3660
aaaaacgtgt cttgattcat tggtttggtt cttgttgggt tccgagccaa tatttcacat 3720
catctcctaa attctccaag aatcccaacg tagcgtagtc cagcacgccc tctgagatct 3780
tatttaatat cgacttctca accaccggtg gaatcccgtt cagaccattg ttacctgtag 3840
tgtgtttgct cttgttcttg atgacaatga tgtatttgtc acgatacctg aaataataaa 3900
acatccagtc attgagctta ttactcgtga acttatgaaa gaactcattc aagccgttcc 3960
caaaaaaccc agaattgaag atcttgctca actggtcatg caagtagtag atcgccatga 4020
tctgatactt taccaagcta tcctctccaa gttctcccac gtacggcaag tacggcaacg 4080
agctctggaa gctttgttgt ttggggtcat a 4111
<210> 26
<211> 4111
<212> DNA
<213> Artificial Sequence
<220>
<223> mutant CYP52A12, containing
-876A>G,-853A>T,-831delT,-825C>A,-823delG,-579A>G,-412_-411AC>TT,
-402insTT and -7_-4delAACC
<400> 26
catatgcgct aatcttcttt ttctttttat cacaggagaa actatcccac ccccacttcg 60
aaacacaatg acaactcctg cgtaacttgc aaattcttgt ctgactaatt gaaaactccg 120
gacgagtcag acctccagtc aaacggacag acagacaaac acttggtgcg atgttcatac 180
ctacagacat gtcaacgggt gttagacgac ggtttcttgc aaagacaggt gttggcatct 240
cgtacgatgg caactgcagg aggtgtcgac ttctccttta ggcaatagaa aaagactaag 300
ggaacagcgt ttttacaggt tgctttggtt aatgtagtat tttttagtcc aacattctgt 360
gggttgctct gggtttctag aataggaaat cacaggagaa tgcaaattca gatggaagaa 420
caaagagata aaaaacaaaa aaaaactgag ttttgcacca atagaatgtt tgatgatatc 480
atccactcgc taaacgaatc atgtgggtga tcttctcttt agttttggtc tatcataaaa 540
cacatgaaag tgaaatccaa atacactaca ctccgggtat tgtccttcgt tttacggatg 600
tctcattgtc ttacttttga ggtcatagga gttgcctgtg agagatcaca gagattatca 660
cactcacatt tatcgtagtt tcctatctca tgctgtgtgt ctctggttgg ttcatgagtt 720
tggattgttg tacattaaag gaatcgctgg aaagcaaagc tatttaaatt ttttctttgt 780
cacaggtaca ctaacctgta aaacttcact gccacgccag tctttcctga ttgggcaagt 840
gcacaaacta caacctgcaa aacagcactc cgcttgtcac aggttgtctc ctctcaacca 900
acaaaaaaat aagattaaac tttctttgct catgcatcaa tcggagttat ctctgaaaga 960
gttgcctttg tgtaatgtgt gccaaactca aactgcaaaa ctaaccacag aatgatttcc 1020
ctcacaatta tataaactca cccacatttc cacagaccgt aatttcatgt ctcactttct 1080
cttttgctct tcttttactt agtcaggttt gataacttcc ttttttatta ccctatctta 1140
tttatttatt tattcattta taccaaccaa ccatggccac acaagaaatc atcgattctg 1200
tacttccgta cttgaccaaa tggtacactg tgattactgc agcagtatta gtcttcctta 1260
tctccacaaa catcaagaac tacgtcaagg caaagaaatt gaaatgtgtc gatccaccat 1320
acttgaagga tgccggtctc actggtattc tgtctttgat cgccgccatc aaggccaaga 1380
acgacggtag attggctaac tttgccgatg aagttttcga cgagtaccca aaccacacct 1440
tctacttgtc tgttgccggt gctttgaaga ttgtcatgac tgttgaccca gaaaacatca 1500
aggctgtctt ggccacccaa ttcactgact tctccttggg taccagacac gcccactttg 1560
ctcctttgtt gggtgacggt atcttcacct tggacggaga aggttggaag cactccagag 1620
ctatgttgag accacagttt gctagagacc agattggaca cgttaaagcc ttggaaccac 1680
acatccaaat catggctaag cagatcaagt tgaaccaggg aaagactttc gatatccaag 1740
aattgttctt tagatttacc gtcgacaccg ctactgagtt cttgtttggt gaatccgttc 1800
actccttgta cgatgaaaaa ttgggcatcc caactccaaa cgaaatccca ggaagagaaa 1860
actttgccgc tgctttcaac gtttcccaac actacttggc caccagaagt tactcccaga 1920
ctttttactt tttgaccaac cctaaggaat tcagagactg taacgccaag gtccaccact 1980
tggccaagta ctttgtcaac aaggccttga actttactcc tgaagaactc gaagagaaat 2040
ccaagtccgg ttacgttttc ttgtacgaat tggttaagca aaccagagat ccaaaggtct 2100
tgcaagatca attgttgaac attatggttg ccggaagaga caccactgcc ggtttgttgt 2160
cctttgcttt gtttgaattg gctagacacc cagagatgtg gtccaagttg agagaagaaa 2220
tcgaagttaa ctttggtgtt ggtgaagact cccgcgttga agaaattacc ttcgaagcct 2280
tgaagagatg tgaatacttg aaggctatcc ttaacgaaac cttgcgtatg tacccatctg 2340
ttcctgtcaa ctttagaacc gccaccagag acaccacttt gccaagaggt ggtggtgcta 2400
acggtaccga cccaatctac attcctaaag gctccactgt tgcttacgtt gtctacaaga 2460
cccaccgttt ggaagaatac tacggtaagg acgctaacga cttcagacca gaaagatggt 2520
ttgaaccatc tactaagaag ttgggctggg cttatgttcc attcaacggt ggtccaagag 2580
tctgcttggg tcaacaattc gccttgactg aagcttctta tgtgatcact agattggccc 2640
agatgtttga aactgtctca tctgatccag gtctcgaata ccctccacca aagtgtattc 2700
acttgaccat gagtcacaac gatggtgtct ttgtcaagat gtaaagtagt cgatgctggg 2760
tattcgatta catgtgtata ggaagatttt ggttttttat tcgttctttt ttttaatttt 2820
tgttaaatta gtttagagat ttcattaata catagatggg tgctatttcc gaaactttac 2880
ttctatcccc tgtatccctt attatccctc tcagtcacat gattgctgta attgtcgtgc 2940
aggacacaaa ctccctaacg gacttaaacc ataaacaagc tcagaaccat aagccgacat 3000
cactccttct tctctcttct ccaaccaata gcatggacag acccaccctc ctatccgaat 3060
cgaagaccct tattgactcc atacccacct ggaagcccct caagccacac acgtcatcca 3120
gcccacccat caccacatcc ctctactcga caacgtccaa agacggcgag ttctggtgtg 3180
cccggaaatc agccatcccg gccacataca agcagccgtt gattgcgtgc atactcggcg 3240
agcccacaat gggagccacg cattcggacc atgaagcaaa gtacattcac gagatcacgg 3300
gtgtttcagt gtcgcagatt gagaagttcg acgatggatg gaagtacgat ctcgttgcgg 3360
attacgactt cggtgggttg ttatctaaac gaagattcta tgagacgcag catgtgtttc 3420
ggttcgagga ttgtgcgtac gtcatgagtg tgccttttga tggacccaag gaggaaggtt 3480
acgtggttgg gacgtacaga tccattgaaa ggttgagctg gggtaaagac ggggacgtgg 3540
agtggaccat ggcgacgacg tcggatcctg gtgggtttat cccgcaatgg ataactcgat 3600
tgagcatccc tggagcaatc gcaaaagatg tgcctagtgt attaaactac atacagaaat 3660
aaaaacgtgt cttgattcat tggtttggtt cttgttgggt tccgagccaa tatttcacat 3720
catctcctaa attctccaag aatcccaacg tagcgtagtc cagcacgccc tctgagatct 3780
tatttaatat cgacttctca accaccggtg gaatcccgtt cagaccattg ttacctgtag 3840
tgtgtttgct cttgttcttg atgacaatga tgtatttgtc acgatacctg aaataataaa 3900
acatccagtc attgagctta ttactcgtga acttatgaaa gaactcattc aagccgttcc 3960
caaaaaaccc agaattgaag atcttgctca actggtcatg caagtagtag atcgccatga 4020
tctgatactt taccaagcta tcctctccaa gttctcccac gtacggcaag tacggcaacg 4080
agctctggaa gctttgttgt ttggggtcat a 4111
<210> 27
<211> 1172
<212> DNA
<213> Artificial Sequence
<220>
<223> 1170_1173delAACC
<400> 27
catatgcgct aatcttcttt ttctttttat cacaggagaa actatcccac ccccacttcg 60
aaacacaatg acaactcctg cgtaacttgc aaattcttgt ctgactaatt gaaaactccg 120
gacgagtcag acctccagtc aaacggacag acagacaaac acttggtgcg atgttcatac 180
ctacagacat gtcaacgggt gttagacgac ggtttcttgc aaagacaggt gttggcatct 240
cgtacgatgg caactgcagg aggtgtcgac ttctccttta ggcaatagaa aaagactaag 300
agaacagcgt ttttacaggt tgcattggtt aatgtagtat ttttttagtc ccagcattct 360
gtgggttgct ctgggtttct agaataggaa atcacaggag aatgcaaatt cagatggaag 420
aacaaagaga taaaaaacaa aaaaaaactg agttttgcac caatagaatg tttgatgata 480
tcatccactc gctaaacgaa tcatgtgggt gatcttctct ttagttttgg tctatcataa 540
aacacatgaa agtgaaatcc aaatacacta cactccgggt attgtccttc gttttacaga 600
tgtctcattg tcttactttt gaggtcatag gagttgcctg tgagagatca cagagattat 660
cacactcaca tttatcgtag tttcctatct catgctgtgt gtctctggtt ggttcatgag 720
tttggattgt tgtacattaa aggaatcgct ggaaagcaaa gctaactaaa ttttctttgt 780
cacaggtaca ctaacctgta aaacttcact gccacgccag tctttcctga ttgggcaagt 840
gcacaaacta caacctgcaa aacagcactc cgcttgtcac aggttgtctc ctctcaacca 900
acaaaaaaat aagattaaac tttctttgct catgcatcaa tcggagttat ctctgaaaga 960
gttgcctttg tgtaatgtgt gccaaactca aactgcaaaa ctaaccacag aatgatttcc 1020
ctcacaatta tataaactca cccacatttc cacagaccgt aatttcatgt ctcactttct 1080
cttttgctct tcttttactt agtcaggttt gataacttcc ttttttatta ccctatctta 1140
tttatttatt tattcattta taccaaccaa cc 1172
<210> 28
<211> 1174
<212> DNA
<213> Artificial Sequence
<220>
<223> 765_766AC>TT, 774insTT and 1170_1173delAACC
<400> 28
catatgcgct aatcttcttt ttctttttat cacaggagaa actatcccac ccccacttcg 60
aaacacaatg acaactcctg cgtaacttgc aaattcttgt ctgactaatt gaaaactccg 120
gacgagtcag acctccagtc aaacggacag acagacaaac acttggtgcg atgttcatac 180
ctacagacat gtcaacgggt gttagacgac ggtttcttgc aaagacaggt gttggcatct 240
cgtacgatgg caactgcagg aggtgtcgac ttctccttta ggcaatagaa aaagactaag 300
agaacagcgt ttttacaggt tgcattggtt aatgtagtat ttttttagtc ccagcattct 360
gtgggttgct ctgggtttct agaataggaa atcacaggag aatgcaaatt cagatggaag 420
aacaaagaga taaaaaacaa aaaaaaactg agttttgcac caatagaatg tttgatgata 480
tcatccactc gctaaacgaa tcatgtgggt gatcttctct ttagttttgg tctatcataa 540
aacacatgaa agtgaaatcc aaatacacta cactccgggt attgtccttc gttttacaga 600
tgtctcattg tcttactttt gaggtcatag gagttgcctg tgagagatca cagagattat 660
cacactcaca tttatcgtag tttcctatct catgctgtgt gtctctggtt ggttcatgag 720
tttggattgt tgtacattaa aggaatcgct ggaaagcaaa gctatttaaa ttttttcttt 780
gtcacaggta cactaacctg taaaacttca ctgccacgcc agtctttcct gattgggcaa 840
gtgcacaaac tacaacctgc aaaacagcac tccgcttgtc acaggttgtc tcctctcaac 900
caacaaaaaa ataagattaa actttctttg ctcatgcatc aatcggagtt atctctgaaa 960
gagttgcctt tgtgtaatgt gtgccaaact caaactgcaa aactaaccac agaatgattt 1020
ccctcacaat tatataaact cacccacatt tccacagacc gtaatttcat gtctcacttt 1080
ctcttttgct cttcttttac ttagtcaggt ttgataactt ccttttttat taccctatct 1140
tatttattta tttattcatt tataccaacc aacc 1174
<210> 29
<211> 1174
<212> DNA
<213> Artificial Sequence
<220>
<223> 598A>G, 765_766AC>TT, 774insTT and 1170_1173delAACC
<400> 29
catatgcgct aatcttcttt ttctttttat cacaggagaa actatcccac ccccacttcg 60
aaacacaatg acaactcctg cgtaacttgc aaattcttgt ctgactaatt gaaaactccg 120
gacgagtcag acctccagtc aaacggacag acagacaaac acttggtgcg atgttcatac 180
ctacagacat gtcaacgggt gttagacgac ggtttcttgc aaagacaggt gttggcatct 240
cgtacgatgg caactgcagg aggtgtcgac ttctccttta ggcaatagaa aaagactaag 300
agaacagcgt ttttacaggt tgcattggtt aatgtagtat ttttttagtc ccagcattct 360
gtgggttgct ctgggtttct agaataggaa atcacaggag aatgcaaatt cagatggaag 420
aacaaagaga taaaaaacaa aaaaaaactg agttttgcac caatagaatg tttgatgata 480
tcatccactc gctaaacgaa tcatgtgggt gatcttctct ttagttttgg tctatcataa 540
aacacatgaa agtgaaatcc aaatacacta cactccgggt attgtccttc gttttacgga 600
tgtctcattg tcttactttt gaggtcatag gagttgcctg tgagagatca cagagattat 660
cacactcaca tttatcgtag tttcctatct catgctgtgt gtctctggtt ggttcatgag 720
tttggattgt tgtacattaa aggaatcgct ggaaagcaaa gctatttaaa ttttttcttt 780
gtcacaggta cactaacctg taaaacttca ctgccacgcc agtctttcct gattgggcaa 840
gtgcacaaac tacaacctgc aaaacagcac tccgcttgtc acaggttgtc tcctctcaac 900
caacaaaaaa ataagattaa actttctttg ctcatgcatc aatcggagtt atctctgaaa 960
gagttgcctt tgtgtaatgt gtgccaaact caaactgcaa aactaaccac agaatgattt 1020
ccctcacaat tatataaact cacccacatt tccacagacc gtaatttcat gtctcacttt 1080
ctcttttgct cttcttttac ttagtcaggt ttgataactt ccttttttat taccctatct 1140
tatttattta tttattcatt tataccaacc aacc 1174
<210> 30
<211> 1172
<212> DNA
<213> Artificial Sequence
<220>
<223> 346delT, 352C>A, 354delG, 598A>G, 765_766AC>TT, 774insTT and
1170_1173delAACC
<400> 30
catatgcgct aatcttcttt ttctttttat cacaggagaa actatcccac ccccacttcg 60
aaacacaatg acaactcctg cgtaacttgc aaattcttgt ctgactaatt gaaaactccg 120
gacgagtcag acctccagtc aaacggacag acagacaaac acttggtgcg atgttcatac 180
ctacagacat gtcaacgggt gttagacgac ggtttcttgc aaagacaggt gttggcatct 240
cgtacgatgg caactgcagg aggtgtcgac ttctccttta ggcaatagaa aaagactaag 300
agaacagcgt ttttacaggt tgcattggtt aatgtagtat tttttagtcc aacattctgt 360
gggttgctct gggtttctag aataggaaat cacaggagaa tgcaaattca gatggaagaa 420
caaagagata aaaaacaaaa aaaaactgag ttttgcacca atagaatgtt tgatgatatc 480
atccactcgc taaacgaatc atgtgggtga tcttctcttt agttttggtc tatcataaaa 540
cacatgaaag tgaaatccaa atacactaca ctccgggtat tgtccttcgt tttacggatg 600
tctcattgtc ttacttttga ggtcatagga gttgcctgtg agagatcaca gagattatca 660
cactcacatt tatcgtagtt tcctatctca tgctgtgtgt ctctggttgg ttcatgagtt 720
tggattgttg tacattaaag gaatcgctgg aaagcaaagc tatttaaatt ttttctttgt 780
cacaggtaca ctaacctgta aaacttcact gccacgccag tctttcctga ttgggcaagt 840
gcacaaacta caacctgcaa aacagcactc cgcttgtcac aggttgtctc ctctcaacca 900
acaaaaaaat aagattaaac tttctttgct catgcatcaa tcggagttat ctctgaaaga 960
gttgcctttg tgtaatgtgt gccaaactca aactgcaaaa ctaaccacag aatgatttcc 1020
ctcacaatta tataaactca cccacatttc cacagaccgt aatttcatgt ctcactttct 1080
cttttgctct tcttttactt agtcaggttt gataacttcc ttttttatta ccctatctta 1140
tttatttatt tattcattta taccaaccaa cc 1172
<210> 31
<211> 1172
<212> DNA
<213> Artificial Sequence
<220>
<223> 301A>G, 324A>T, 346delT, 352C>A, 354delG, 598A>G, 765_766AC>TT,
774insTT, and 1170_1173delAACC
<400> 31
catatgcgct aatcttcttt ttctttttat cacaggagaa actatcccac ccccacttcg 60
aaacacaatg acaactcctg cgtaacttgc aaattcttgt ctgactaatt gaaaactccg 120
gacgagtcag acctccagtc aaacggacag acagacaaac acttggtgcg atgttcatac 180
ctacagacat gtcaacgggt gttagacgac ggtttcttgc aaagacaggt gttggcatct 240
cgtacgatgg caactgcagg aggtgtcgac ttctccttta ggcaatagaa aaagactaag 300
ggaacagcgt ttttacaggt tgctttggtt aatgtagtat tttttagtcc aacattctgt 360
gggttgctct gggtttctag aataggaaat cacaggagaa tgcaaattca gatggaagaa 420
caaagagata aaaaacaaaa aaaaactgag ttttgcacca atagaatgtt tgatgatatc 480
atccactcgc taaacgaatc atgtgggtga tcttctcttt agttttggtc tatcataaaa 540
cacatgaaag tgaaatccaa atacactaca ctccgggtat tgtccttcgt tttacggatg 600
tctcattgtc ttacttttga ggtcatagga gttgcctgtg agagatcaca gagattatca 660
cactcacatt tatcgtagtt tcctatctca tgctgtgtgt ctctggttgg ttcatgagtt 720
tggattgttg tacattaaag gaatcgctgg aaagcaaagc tatttaaatt ttttctttgt 780
cacaggtaca ctaacctgta aaacttcact gccacgccag tctttcctga ttgggcaagt 840
gcacaaacta caacctgcaa aacagcactc cgcttgtcac aggttgtctc ctctcaacca 900
acaaaaaaat aagattaaac tttctttgct catgcatcaa tcggagttat ctctgaaaga 960
gttgcctttg tgtaatgtgt gccaaactca aactgcaaaa ctaaccacag aatgatttcc 1020
ctcacaatta tataaactca cccacatttc cacagaccgt aatttcatgt ctcactttct 1080
cttttgctct tcttttactt agtcaggttt gataacttcc ttttttatta ccctatctta 1140
tttatttatt tattcattta taccaaccaa cc 1172
<210> 32
<211> 908
<212> DNA
<213> Artificial Sequence
<220>
<223> 1170_1173delAACC
<400> 32
gtcgacttct cctttaggca atagaaaaag actaagagaa cagcgttttt acaggttgca 60
ttggttaatg tagtattttt ttagtcccag cattctgtgg gttgctctgg gtttctagaa 120
taggaaatca caggagaatg caaattcaga tggaagaaca aagagataaa aaacaaaaaa 180
aaactgagtt ttgcaccaat agaatgtttg atgatatcat ccactcgcta aacgaatcat 240
gtgggtgatc ttctctttag ttttggtcta tcataaaaca catgaaagtg aaatccaaat 300
acactacact ccgggtattg tccttcgttt tacagatgtc tcattgtctt acttttgagg 360
tcataggagt tgcctgtgag agatcacaga gattatcaca ctcacattta tcgtagtttc 420
ctatctcatg ctgtgtgtct ctggttggtt catgagtttg gattgttgta cattaaagga 480
atcgctggaa agcaaagcta actaaatttt ctttgtcaca ggtacactaa cctgtaaaac 540
ttcactgcca cgccagtctt tcctgattgg gcaagtgcac aaactacaac ctgcaaaaca 600
gcactccgct tgtcacaggt tgtctcctct caaccaacaa aaaaataaga ttaaactttc 660
tttgctcatg catcaatcgg agttatctct gaaagagttg cctttgtgta atgtgtgcca 720
aactcaaact gcaaaactaa ccacagaatg atttccctca caattatata aactcaccca 780
catttccaca gaccgtaatt tcatgtctca ctttctcttt tgctcttctt ttacttagtc 840
aggtttgata acttcctttt ttattaccct atcttattta tttatttatt catttatacc 900
aaccaacc 908
<210> 33
<211> 910
<212> DNA
<213> Artificial Sequence
<220>
<223> 765_766AC>TT, 774insTT and 1170_1173delAACC
<400> 33
gtcgacttct cctttaggca atagaaaaag actaagagaa cagcgttttt acaggttgca 60
ttggttaatg tagtattttt ttagtcccag cattctgtgg gttgctctgg gtttctagaa 120
taggaaatca caggagaatg caaattcaga tggaagaaca aagagataaa aaacaaaaaa 180
aaactgagtt ttgcaccaat agaatgtttg atgatatcat ccactcgcta aacgaatcat 240
gtgggtgatc ttctctttag ttttggtcta tcataaaaca catgaaagtg aaatccaaat 300
acactacact ccgggtattg tccttcgttt tacagatgtc tcattgtctt acttttgagg 360
tcataggagt tgcctgtgag agatcacaga gattatcaca ctcacattta tcgtagtttc 420
ctatctcatg ctgtgtgtct ctggttggtt catgagtttg gattgttgta cattaaagga 480
atcgctggaa agcaaagcta tttaaatttt ttctttgtca caggtacact aacctgtaaa 540
acttcactgc cacgccagtc tttcctgatt gggcaagtgc acaaactaca acctgcaaaa 600
cagcactccg cttgtcacag gttgtctcct ctcaaccaac aaaaaaataa gattaaactt 660
tctttgctca tgcatcaatc ggagttatct ctgaaagagt tgcctttgtg taatgtgtgc 720
caaactcaaa ctgcaaaact aaccacagaa tgatttccct cacaattata taaactcacc 780
cacatttcca cagaccgtaa tttcatgtct cactttctct tttgctcttc ttttacttag 840
tcaggtttga taacttcctt ttttattacc ctatcttatt tatttattta ttcatttata 900
ccaaccaacc 910
<210> 34
<211> 910
<212> DNA
<213> Artificial Sequence
<220>
<223> 598A>G, 765_766AC>TT, 774insTT and 1170_1173delAACC
<400> 34
gtcgacttct cctttaggca atagaaaaag actaagagaa cagcgttttt acaggttgca 60
ttggttaatg tagtattttt ttagtcccag cattctgtgg gttgctctgg gtttctagaa 120
taggaaatca caggagaatg caaattcaga tggaagaaca aagagataaa aaacaaaaaa 180
aaactgagtt ttgcaccaat agaatgtttg atgatatcat ccactcgcta aacgaatcat 240
gtgggtgatc ttctctttag ttttggtcta tcataaaaca catgaaagtg aaatccaaat 300
acactacact ccgggtattg tccttcgttt tacggatgtc tcattgtctt acttttgagg 360
tcataggagt tgcctgtgag agatcacaga gattatcaca ctcacattta tcgtagtttc 420
ctatctcatg ctgtgtgtct ctggttggtt catgagtttg gattgttgta cattaaagga 480
atcgctggaa agcaaagcta tttaaatttt ttctttgtca caggtacact aacctgtaaa 540
acttcactgc cacgccagtc tttcctgatt gggcaagtgc acaaactaca acctgcaaaa 600
cagcactccg cttgtcacag gttgtctcct ctcaaccaac aaaaaaataa gattaaactt 660
tctttgctca tgcatcaatc ggagttatct ctgaaagagt tgcctttgtg taatgtgtgc 720
caaactcaaa ctgcaaaact aaccacagaa tgatttccct cacaattata taaactcacc 780
cacatttcca cagaccgtaa tttcatgtct cactttctct tttgctcttc ttttacttag 840
tcaggtttga taacttcctt ttttattacc ctatcttatt tatttattta ttcatttata 900
ccaaccaacc 910
<210> 35
<211> 908
<212> DNA
<213> Artificial Sequence
<220>
<223> 346delT, 352C>A, 354delG, 598A>G, 765_766AC>TT, 774insTT and 1170_1173delAACC
<400> 35
gtcgacttct cctttaggca atagaaaaag actaagagaa cagcgttttt acaggttgca 60
ttggttaatg tagtattttt tagtccaaca ttctgtgggt tgctctgggt ttctagaata 120
ggaaatcaca ggagaatgca aattcagatg gaagaacaaa gagataaaaa acaaaaaaaa 180
actgagtttt gcaccaatag aatgtttgat gatatcatcc actcgctaaa cgaatcatgt 240
gggtgatctt ctctttagtt ttggtctatc ataaaacaca tgaaagtgaa atccaaatac 300
actacactcc gggtattgtc cttcgtttta cggatgtctc attgtcttac ttttgaggtc 360
ataggagttg cctgtgagag atcacagaga ttatcacact cacatttatc gtagtttcct 420
atctcatgct gtgtgtctct ggttggttca tgagtttgga ttgttgtaca ttaaaggaat 480
cgctggaaag caaagctatt taaatttttt ctttgtcaca ggtacactaa cctgtaaaac 540
ttcactgcca cgccagtctt tcctgattgg gcaagtgcac aaactacaac ctgcaaaaca 600
gcactccgct tgtcacaggt tgtctcctct caaccaacaa aaaaataaga ttaaactttc 660
tttgctcatg catcaatcgg agttatctct gaaagagttg cctttgtgta atgtgtgcca 720
aactcaaact gcaaaactaa ccacagaatg atttccctca caattatata aactcaccca 780
catttccaca gaccgtaatt tcatgtctca ctttctcttt tgctcttctt ttacttagtc 840
aggtttgata acttcctttt ttattaccct atcttattta tttatttatt catttatacc 900
aaccaacc 908
<210> 36
<211> 908
<212> DNA
<213> Artificial Sequence
<220>
<223> 301A>G, 324A>T, 346delT, 352C>A, 354delG, 598A>G, 765_766AC>TT,
774insTT, and 1170_1173delAACC
<400> 36
gtcgacttct cctttaggca atagaaaaag actaagggaa cagcgttttt acaggttgct 60
ttggttaatg tagtattttt tagtccaaca ttctgtgggt tgctctgggt ttctagaata 120
ggaaatcaca ggagaatgca aattcagatg gaagaacaaa gagataaaaa acaaaaaaaa 180
actgagtttt gcaccaatag aatgtttgat gatatcatcc actcgctaaa cgaatcatgt 240
gggtgatctt ctctttagtt ttggtctatc ataaaacaca tgaaagtgaa atccaaatac 300
actacactcc gggtattgtc cttcgtttta cggatgtctc attgtcttac ttttgaggtc 360
ataggagttg cctgtgagag atcacagaga ttatcacact cacatttatc gtagtttcct 420
atctcatgct gtgtgtctct ggttggttca tgagtttgga ttgttgtaca ttaaaggaat 480
cgctggaaag caaagctatt taaatttttt ctttgtcaca ggtacactaa cctgtaaaac 540
ttcactgcca cgccagtctt tcctgattgg gcaagtgcac aaactacaac ctgcaaaaca 600
gcactccgct tgtcacaggt tgtctcctct caaccaacaa aaaaataaga ttaaactttc 660
tttgctcatg catcaatcgg agttatctct gaaagagttg cctttgtgta atgtgtgcca 720
aactcaaact gcaaaactaa ccacagaatg atttccctca caattatata aactcaccca 780
catttccaca gaccgtaatt tcatgtctca ctttctcttt tgctcttctt ttacttagtc 840
aggtttgata acttcctttt ttattaccct atcttattta tttatttatt catttatacc 900
aaccaacc 908

Claims (43)

1.一种CYP52A12基因的启动子,其中所述启动子的序列如SEQ ID NO:16和27-36任一所示。
2.一种分离的突变的CYP52A12基因,其中所述突变的CYP52A12基因的序列包含权利要求1的启动子并且由选自SEQ ID NO:22-26任一的序列组成。
3.一种含有权利要求1所述的启动子或权利要求2所述的突变的CYP52A12基因的微生物,与未含有所述DNA分子或含有未突变的CYP52A12基因微生物相比,其生产的长链二元酸具有降低的一元酸杂质含量,其中所述微生物选自热带假丝酵母(Candida tropicalis)或清酒假丝酵母(Candida sake)。
4.一种利用权利要求3所述的微生物发酵产生长链二元酸的方法,包括培养所述微生物的步骤。
5.权利要求4所述的方法,还包括从培养产物分离、提取和/或纯化长链二元酸的步骤。
6.权利要求4所述的方法,其特征在于,所述微生物发酵产生长链二元酸的过程中,发酵结束后的发酵液中含有一元酸杂质,且所述一元酸杂质的质量比率在5%以下,所述质量比率为发酵液中一元酸杂质占长链二元酸的质量百分比。
7.权利要求4所述的方法,其特征在于,所述微生物发酵产生长链二元酸的过程结束后的发酵液中含有一元酸杂质,且所述一元酸杂质的含量相对于采用常规微生物发酵法生产的一元酸杂质的含量至少下降5%;其中常规微生物发酵法是采用非突变的所述微生物发酵法。
8.权利要求4所述的方法,所述微生物发酵产生的长链二元酸含有一元酸杂质,其特征在于,所述一元酸杂质的含量大于0,且在12000ppm以下,其中所述一元酸杂质包括长链一元羧酸杂质,即在羧酸分子中只含有一个羧基(-COOH)。
9.权利要求8所述的方法,其中所述一元酸杂质的含量在10000ppm以下。
10.权利要求8所述的方法,其中所述一元酸杂质的含量在6000ppm以下。
11.权利要求8所述的方法,其中所述一元酸杂质的含量在3000ppm以下。
12.权利要求8所述的方法,其中所述一元酸杂质的含量在1000ppm以下。
13.权利要求8所述的方法,其中所述一元酸杂质的含量在500ppm以下。
14.权利要求8所述的方法,其中所述一元酸杂质的含量在200ppm以下。
15.权利要求8所述的方法,其中所述一元酸杂质的化学式包括CH3-(CH2)n-COOH,其中n≥7,和/或,CH2OH-(CH2)n-COOH,其中n≥7。
16.权利要求8所述的方法,其中所述一元酸杂质包括但不限于碳链上碳原子数在9以上的长链一元酸。
17.权利要求8所述的方法,其中所述一元酸杂质包括九碳一元酸、十碳一元酸、十一碳一元酸、十二碳一元酸、十三碳一元酸、十四碳一元酸、十五碳一元酸、十六碳一元酸、十七碳一元酸、十八碳一元酸、或十九碳一元酸中的任意一种或多种。
18.权利要求8所述的方法,其中,当所述长链二元酸为十碳二元酸时,一元酸杂质为十碳一元酸杂质且所述十碳一元酸杂质的含量低于2500ppm。
19.权利要求8所述的方法,其中,当所述长链二元酸为十六碳二元酸时,一元酸杂质为十六碳一元酸杂质且所述十六碳一元酸杂质的含量低于12000ppm。
20.权利要求6所述的方法,其中发酵结束后的发酵液中所述一元酸杂质的质量比率在1.5%以下。
21.权利要求6所述的方法,其中发酵结束后的发酵液中所述一元酸杂质的质量比率在1.0%以下。
22.权利要求6所述的方法,其中发酵结束后的发酵液中所述一元酸杂质的质量比率在0.9%以下。
23.一种改造长链二元酸生产菌株的方法,包括通过定向进化长链二元酸合成途径的关键基因,其中改造后的长链二元酸生产微生物菌株生产的长链二元酸中一元酸杂质含量相对于改造前的微生物菌株得以降低;
其中,所述长链二元酸合成途径的关键基因是CYP52A12基因,并且所述改造后的长链二元酸生产微生物菌株含有权利要求1所述的启动子或权利要求2所述的突变的CYP52A12基因;其中所述微生物选自热带假丝酵母或清酒假丝酵母;所述长链二元酸选自C9~C22长链二元酸。
24.权利要求23所述的方法,其中所述长链二元酸选自C9~C18长链二元酸。
25.权利要求23所述的方法,其中所述长链二元酸选自十碳二元酸、十一碳二元酸、十二碳二元酸、十三碳二元酸、十四碳二元酸、十五碳二元酸、十六碳二元酸中的一种或多种。
26.权利要求23所述的方法,其中所述长链二元酸选自正十碳至十六碳二元酸中的至少一种或多种。
27.权利要求23所述的方法,其中所述一元酸杂质包括但不限于碳链上碳原子数在9以上的长链一元酸。
28.权利要求23所述的方法,其中所述一元酸选自九碳一元酸、十碳一元酸、十一碳一元酸、十二碳一元酸、十三碳一元酸、十四碳一元酸、十五碳一元酸、十六碳一元酸、十七碳一元酸、十八碳一元酸、或十九碳一元酸中的任意一种或多种。
29.权利要求23所述的方法,其中所述一元酸杂质的含量相对于采用非突变的所述微生物发酵法生产的一元酸杂质的含量至少下降5%。
30.权利要求23所述的方法,其中所述一元酸杂质的含量相对于采用非突变的所述微生物发酵法生产的一元酸杂质的含量至少下降10%。
31.权利要求23所述的方法,其中所述一元酸杂质的含量相对于采用非突变的所述微生物发酵法生产的一元酸杂质的含量至少下降20%。
32.权利要求23所述的方法,其中所述一元酸杂质的含量相对于采用非突变的所述微生物发酵法生产的一元酸杂质的含量至少下降40%。
33.权利要求23所述的方法,其中所述一元酸杂质的含量相对于采用非突变的所述微生物发酵法生产的一元酸杂质的含量至少下降50%或更低。
34.根据权利要求23所述的方法,其包括步骤:
1)通过易错PCR制备带有突变的CYP52A12基因片段;
2)制备同源重组所需的CYP52A12基因上下游片段作为同源重组的模板以及抗性标记基因;
3)通过PCR重叠延伸制备完整的重组片段;
4)利用同源重组将所述重组片段引入菌株;
5)利用抗性标记筛选阳性菌株;
6)筛选发酵结束后的发酵液中一元酸杂质含量显著降低的菌株。
35.权利要求34所述的方法,其中所述抗性标记基因是潮霉素B。
36.权利要求34所述的方法,包括:7)筛选到的菌株进一步经过同源重组去除抗性筛选标记。
37.一种生产权利要求8-19任一项所限定的长链二元酸或权利要求20-22任一项所限定的发酵液的方法,包括通过定向进化CYP52A12基因以获得含有权利要求2所述的突变的CYP52A12基因的长链二元酸生产微生物菌株,培养所述菌株发酵生产长链二元酸的步骤,其中所述微生物选自热带假丝酵母或清酒假丝酵母。
38.权利要求37所述的方法,还包括从培养产物分离、提取和/或纯化长链二元酸的步骤。
39.权利要求37所述的方法,其中所述长链二元酸选自C9~C22长链二元酸。
40.权利要求37所述的方法,其中所述长链二元酸选自C9~C18长链二元酸。
41.权利要求37所述的方法,其中所述长链二元酸选自十碳二元酸、十一碳二元酸、十二碳二元酸、十三碳二元酸、十四碳二元酸、十五碳二元酸、十六碳二元酸中的一种或多种。
42.权利要求37所述的方法,其中所述一元酸杂质的化学式包括CH3-(CH2)n-COOH,其中n≥7,和/或,CH2OH-(CH2)n-COOH,其中n≥7。
43.权利要求37-42任一项所述的方法,其中所述含有突变的CYP52A12基因的长链二元酸生产微生物菌株通过权利要求23-36任一项的方法获得。
CN201910321614.2A 2018-07-06 2019-04-22 一种低含量一元酸杂质的长链二元酸及其生产方法 Active CN110684784B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
US16/503,301 US11225677B2 (en) 2018-07-06 2019-07-03 Long-chain dibasic acid with low content of monobasic acid impurity and the production method thereof
EP19184887.8A EP3591044A1 (en) 2018-07-06 2019-07-08 A long-chain dibasic acid with low content of monobasic acid impurity and the production method thereof
US16/826,606 US10982241B2 (en) 2018-07-06 2020-03-23 Long-chain dibasic acid with low content of monobasic acid impurity and the production method thereof

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
CN2018107341908 2018-07-06
CN2018107342737 2018-07-06
CN201810734273 2018-07-06
CN201810734190 2018-07-06

Publications (2)

Publication Number Publication Date
CN110684784A CN110684784A (zh) 2020-01-14
CN110684784B true CN110684784B (zh) 2023-08-08

Family

ID=69107567

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910321614.2A Active CN110684784B (zh) 2018-07-06 2019-04-22 一种低含量一元酸杂质的长链二元酸及其生产方法

Country Status (1)

Country Link
CN (1) CN110684784B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111748480B (zh) * 2020-06-03 2022-06-24 上海凯赛生物技术股份有限公司 一种维斯假丝酵母及其应用

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102994402A (zh) * 2012-03-09 2013-03-27 上海凯赛生物技术研发中心有限公司 一种生产二元酸的菌株及其发酵方法
CN103243033A (zh) * 2012-02-10 2013-08-14 上海凯赛生物技术研发中心有限公司 清酒假丝酵母及其发酵方法
CN103243032A (zh) * 2012-02-10 2013-08-14 上海凯赛生物技术研发中心有限公司 清酒假丝酵母及其发酵方法
CN107326051A (zh) * 2017-08-02 2017-11-07 上海凯赛生物技术研发中心有限公司 一种微生物发酵法生产的癸二酸及其制备方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8158391B2 (en) * 2009-05-06 2012-04-17 Dna Twopointo, Inc. Production of an α-carboxyl-ω-hydroxy fatty acid using a genetically modified Candida strain
US8728798B2 (en) * 2011-05-03 2014-05-20 Verdezyne, Inc. Biological methods for preparing adipic acid

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103243033A (zh) * 2012-02-10 2013-08-14 上海凯赛生物技术研发中心有限公司 清酒假丝酵母及其发酵方法
CN103243032A (zh) * 2012-02-10 2013-08-14 上海凯赛生物技术研发中心有限公司 清酒假丝酵母及其发酵方法
CN102994402A (zh) * 2012-03-09 2013-03-27 上海凯赛生物技术研发中心有限公司 一种生产二元酸的菌株及其发酵方法
CN107326051A (zh) * 2017-08-02 2017-11-07 上海凯赛生物技术研发中心有限公司 一种微生物发酵法生产的癸二酸及其制备方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"Candida tropicalis CYP52A1 (CYP52A12) gene, complete cds",Accession Number:AY230498.1;Craft,D.L. et al.;《GenBank》;20031008;第1-2页 *

Also Published As

Publication number Publication date
CN110684784A (zh) 2020-01-14

Similar Documents

Publication Publication Date Title
US11875298B2 (en) Sensor for NADP (H) and development of alcohol dehydrogenases
CN107739728A (zh) 一种高效生产氨基葡萄糖的重组大肠杆菌及其应用
CN114480474B (zh) 一种海洋微拟球藻转录激活CRISPRa系统的构建及其应用
CN112725348B (zh) 一种提高水稻单碱基编辑效率的基因、方法及应用
CN111394399B (zh) 一种降低长链二元酸中酰基甘油酯杂质含量的方法
CN110684784B (zh) 一种低含量一元酸杂质的长链二元酸及其生产方法
CN110684783B (zh) 一种低含量脂肪酸杂质的长链二元酸及其生产方法
RU2752904C1 (ru) ИНТЕГРАЦИОННЫЙ ВЕКТОР ДЛЯ МНОГОКОПИЙНОЙ ИНТЕГРАЦИИ ГЕНОВ В 18SpPHK ДРОЖЖЕЙ Pichia pastoris
CN112011579B (zh) 一种二元酸生产中降低非目标碳链长度二元酸杂质的方法
CN111394400B (zh) Sct1基因在长链二元酸生产中的应用
CN110684785B (zh) 低含量低碳链长链二元酸杂酸的长链二元酸及其制备方法
CN110684676B (zh) 一种低含量羟基酸杂质的长链二元酸及其生产方法
CN110343675B (zh) Cyp52a12基因的定向进化及其在二元酸生产中的应用
CN113736797B (zh) 一种提升微藻甘油三酯(tag)产量的培养方法及其应用
CN115216464B (zh) 获得α-法尼烯以及β-法尼烯的重组微生物及其构建方法
CN114045302A (zh) 一种单碱基编辑载体及其构建和应用
CN115992164A (zh) CRISPRi基因抑制系统、包含其的基因工程菌及其应用
CN115992114A (zh) CRISPRa基因激活系统、包含其的基因工程菌及其应用
CN104988167A (zh) 罗汉果葫芦二烯醇合成酶基因SgCbQ及其应用
CN114908030B (zh) 一种在枯草芽孢杆菌表面展示β-环糊精葡萄糖基转移酶的重组菌及其应用
CN113215156B (zh) 一种利用CRISPR/Cas9技术高效创制香味玉米的方法
CN112094832B (zh) 一种突变的耐热耐碱造纸用木聚糖酶及其应用
US6525245B1 (en) Method for identifying components involved in signal transduction pathways in higher plants
KR101878801B1 (ko) 클로스트리디움의 유전체 조작 방법
CN113980999A (zh) 基于多位点同时敲除的CRISPR/Cas9载体及其构建方法和应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant