CN114621882A - 一种具有高同源重组效率的毕赤酵母菌株及其应用 - Google Patents

一种具有高同源重组效率的毕赤酵母菌株及其应用 Download PDF

Info

Publication number
CN114621882A
CN114621882A CN202011458293.XA CN202011458293A CN114621882A CN 114621882 A CN114621882 A CN 114621882A CN 202011458293 A CN202011458293 A CN 202011458293A CN 114621882 A CN114621882 A CN 114621882A
Authority
CN
China
Prior art keywords
gene
pichia pastoris
seq
homologous recombination
strain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011458293.XA
Other languages
English (en)
Inventor
周雍进
段兴鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian Institute of Chemical Physics of CAS
Original Assignee
Dalian Institute of Chemical Physics of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian Institute of Chemical Physics of CAS filed Critical Dalian Institute of Chemical Physics of CAS
Priority to CN202011458293.XA priority Critical patent/CN114621882A/zh
Publication of CN114621882A publication Critical patent/CN114621882A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/37Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
    • C07K14/39Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/65Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression using markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • C12N15/815Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts for yeasts other than Saccharomyces

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Mycology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明公开了一种用于毕赤酵母同源重组的菌株及其应用,菌株包括毕赤酵母基因和过表达PpRAD52基因。本发明通过在现有毕赤酵母基因与过表达PpRAD52基因的整合、敲除KU70/KU80基因或抑制KU70/KU80基因表达强度,提高了毕赤酵母的同源重组效率。本发明用于毕赤酵母同源重组的菌株具有高同源整合能力,并且证实了通过表达同源重组相关蛋白以及下调非同源末端连接强度均可以改善毕赤酵母同源重组活力。

Description

一种具有高同源重组效率的毕赤酵母菌株及其应用
技术领域
本发明属于微生物基因工程应用技术领域,具体涉及一种具有高同源重组效率的毕赤酵母菌株及其应用。
背景技术
微生物生长迅速、反应条件温和及易于控制,但是微生物细胞工厂所需碳源多以生物质来源的葡萄糖和蔗糖为底物,消耗量大使得成本高。作为全球流通的重要原料,甲醇主要原料来源为煤炭,煤炭直接燃烧能量值低且会造成严重污染,利用劣质煤炭转化的甲醇为原料构建微生物细胞工厂合成脂肪酸类衍生物可推进煤炭资源的洁净利用,并为可再生石油化工产品的生产提供了一种新途径。传统的模式微生物无法以甲醇作为唯一碳源使得甲醇利用效率低。甲醇自养酵母如毕赤巴斯德酵母(Komagataella phaffii)因其生长快、可进行高密度发酵及能够适应苛刻的工业化条件等优势成为理想的甲醇转化宿主。
毕赤酵母作为外源基因表达的宿主,目前被证明可表达5000多种蛋白质。但主要依靠单交换的方式将需要表达的蛋白整合在AOX1启动子、GAP启动子等较少的位点,难以实现基因的定点敲除和外源基因的高效定点整合进而只能进行种类较少的蛋白表达,在毕赤酵母中很难实现多基因代谢途径的整合。
近年来,CRISPR/Cas9技术的兴起使得基因编辑效率显著提升,该技术已经广泛应用于真核、原核、模式以及非模式等众多生物体系基因的定点编辑和基因整合。CRISPR/Cas9可以很容易地在几乎任何需要的基因组位点上引入目标链断裂,进行重新编程。CRISPR/Cas9技术实现基因编辑,主要依靠Cas9蛋白借助短导向RNA(gRNA或者单导向gRNA,sgRNA)在基因组中与gRNA的互补区域诱导一个双链断裂(Double Strand Break,DSB)。随后依靠细胞内的内源修复机制对DSB进行修复。因此在有Cas9蛋白存在的条件下,通过更换gRNA的20bp序列可对不同的靶标位点进行编辑。Weninger等对毕赤酵母的CRISPR/Cas9系统进行了构建,使用人源密码子优化的Cas9和还有核糖酶侧翼的gRNA,同时使用毕赤酵母自身来源的双向、组成型RNA聚合酶II型启动子对Cas9和gRNA进行表达。并利用核酸酶去除gRNA两端多余的5’/3’序列,实现了对毕赤酵母基因的有效编辑(A.Weninger,A.M.Hatzl,C.Schmid,T.Vogl,A.Glieder,Combinatorial optimization of CRISPR/Cas9expression enables precision genome engineering in the methylotrophic yeastPichia pastoris.J Biotechnol 235,139-149(2016).)。然而与高同源重组效率的酿酒酵母(Saccharomyces cerevisiae)不同,毕赤酵母等非传统酵母在进行基因组修复时同源重组的效率很低,主要依靠非同源末端连接(Non-homologous end joining,NHEJ)的方式进行修复,依靠毕赤酵母自身的同源重组过程在进行基因的无缝敲除和外源基因的定点整合方面存在很大难度。非同源末端链接修复的DNA会使基因编码序列产生短的碱基序列插入或缺失导致基因移码突变失活,该机制随机性较高,很难实现特定目的基因敲除和整合。同源重组能够依赖供体DNA同源臂,实现特定基因的定点敲除和基因整合。然而,生物系统是否进行同源重组修复,主要依赖生物系统自身的特性,而不依赖CRISPR/Cas9系统。因此增强生物系统自身的同源重组修复能力成为完善该物种基因编辑平台的重要组成部分。虽然在此前已有报道通过敲除NHEJ相关的重要基因KU70以及将自主复制序列(Autonomouslyreplicating sequence,ARS)连接到供体序列的方式显著提高了毕赤酵母同源重组效率。但对于通过加强毕赤酵母自身同源重组系统相关基因有效提高同源重组效率的研究还未有报道。主要原因是毕赤酵母为非传统酵母,其基因组虽然已经测序,但其中的大部分基因功能尚未被证实。其次未能找到毕赤酵母同源重组系统中导致同源重组系统效率低的关键限速环节的关键基因。
发明内容
为了解决上述技术问题,本发明提供了一种具有高同源重组效率的毕赤酵母菌株及其应用,用以提高毕赤酵母的同源重组效率。
为实现上述目的,本发明采用的技术方案如下:
本发明一方面,提出了一种具有高同源重组效率的毕赤酵母菌株,所述菌株包括毕赤酵母基因和过表达PpRAD52基因。所用毕赤酵母菌株以毕赤酵母GS115为基础构建。GS115基因组序列可登录NCBI(https://www.ncbi.nlm.nih.gov/)获得,基因组序列号:GCA_001746955.1(该基因组所包含的四条染色体的序列号:CP014715.1、CP014716.1、CP014717.1、CP014718.1)。
可选地,过表达PpRAD52基因整合在毕赤酵母AOX1位点或HIS4基因位点。
可选地,所述过表达PpRAD52基因以单交换的方式整合到毕赤酵母AOX1位点;
或者所述过表达PpRAD52基因以同源重组方式整合到毕赤酵母HIS4基因位点。
具体地,使用载体,利用能够在毕赤酵母中表达的强启动子(如PGAP和PADH2,但不止于此)表达PpRAD52基因。利用常规电转化方法将PpRAD52整合到毕赤酵母基因组上。
具体地,利用利用同源重组方法,将PpRAD52基因表达盒整合到毕赤酵母基因组上不影响其他基因发挥功能的任意位点。
使用以上两种方法过表达PpRAD52基因均能够有效提高毕赤酵母同源重组能力。
可选地,所述菌株敲除了毕赤酵母非同源末端连接关键蛋白KU70/KU80基因中的至少一个;KU70敲除菌株基因组序列是在GCA_001746955.1基础上将位于染色体序列CP014717.1中647140-649105范围的碱基敲除。KU80敲除菌株基因组序列是在GCA_001746955.1基础上将染色体序列CP014718.1中1466939-1469029范围的碱基敲除。KU70/KU80可通过美国国家生物技术信息中心(NCBI)网站https://www.ncbi.nlm.nih.gov/查询。
或者抑制了非同源末端连接关键蛋白KU70/KU80基因中至少一个的表达强度。抑制KU70基因菌株基因组序列是在GCA_001746955.1基础上,在染色体序列CP014717.1中649002-649132之间插入序列PMET3序列(SEQ ID NO:54)。抑制KU80基因菌株基因组序列是在GCA_001746955.1基础上,在染色体序列CP014718.1中1469029-1469030之间插入序列PMET3序列(SEQ ID NO:54)。
可选地,抑制非同源末端连接关键蛋白KU70/KU80基因表达强度,通过将KU70/KU80基因的启动子替换为抑制型启动子实现;
优选地,所述抑制型启动子为毕赤酵母自身来源的MET3基因的启动子PMET3(SEQID NO:54)。
使用毕赤酵母抑制型启动子(如毕赤酵母自身来源的Met3基因的启动子PMet3)原位替换KU70或KU80的启动子降低了毕赤酵母非同源末端连接强度,从而显著提高了同源重组效率。
具体步骤为:
(1)gRNA靶向KU70或KU80启动子序列位于KU70基因或KU80基因上游100bp以内,未到达KU70基因或KU80基因上游基因的CDS序列。
(2)设计引物,克隆启动子PHTX1和HH区段和含有gRNA序列的HDV和终止子TAOX1序列(SEQ ID NO:3),并使用融合PCR的方法,将两者进行融合,并利用无缝克隆的方法将该片段整合到含有Cas9的游离载体上,转化大肠杆菌DH5α用于后续转化。
(3)其中所述KU70基因替换启动子供体构建物包含5’同源臂、终止子、PMET3启动子序列、3’同源臂。终止子用于防止5’同源臂所含有的KU70基因自身启动子转录KU70基因的表达。
其中所述KU80基因替换启动子供体构建物包含5’同源臂、终止子、PMET3启动子序列、3’同源臂。终止子用于防止5’同源臂所含有的KU80基因自身启动子转录KU80基因的表达。
(4)使用含有10mM甲硫氨酸的YPD液体培养基活化毕赤酵母菌株GS115(购自赛默飞世尔科技(中国)有限公司)6h;
(5)采用常规的电击转化方法,电击结束后,细胞使用1mL含有10mM甲硫氨酸的YPD液体培养基孵育1h;
(6)筛选平板添加与上述步骤(2)等浓度10mM的甲硫氨酸,菌体涂布后置于30℃静置培养2~3天。
本发明另一方面,提出了一种毕赤酵母代谢工程改造方法,所述方法至少包括:
采用CRISPR/Cas9系统,对毕赤酵母菌株的基因序列进行无缝敲除或/和多片段体内定点重组;
所述毕赤酵母菌株为上述的用于毕赤酵母同源重组的菌株中的至少一种。
可选地,所述CRISPR/Cas9系统的表达载体中包括筛选标记;
所述筛选标记为来Zeocin抗性基因和Geneticin抗性基因中的至少一种。
具体地,筛选标记为来Zeocin抗性基因BleoR或/和Geneticin抗性基因KANR
所述表达载体包括gRNA表达盒、筛选标记和能够在毕赤酵母中扩增的复制起点:
gRNA表达盒包括启动子,启动子用于双向表达Cas9蛋白和gRNA。
gRNA表达盒还包括所述启动子能够识别的核酶序列;
优选地,启动子为RNA pol II型启动子。
具体地,本申请中gRNA表达盒中启动子为RNA pol II型启动子PHTX1(SEQ ID NO:2),其能够识别核酶序列HH和HDV,完全切除gRNA转录后的侧翼多余序列。
同时为了使含有Cas9和gRNA表达组件的载体能够在毕赤酵母中稳定游离存在,本申请将能够在毕赤酵母中扩增的复制起点构建与于表达载体上。
所述能够在毕赤酵母中扩增的复制起点为panARS,panARS具有SEQ ID NO:1所示的核苷酸序列;
优选地,所述能够在毕赤酵母中扩增的复制起点源于乳酸克鲁维酵母。
进一步,所述表达载体还包含单一酶切位点SacII和XbaI,单一酶切位点SacII和XbaI分别位于启动子前和终止子后。
可选地,无缝敲除的同源臂长度为50~1000bp,且位于敲除基因启动子或终止子区域。
可选地,敲除基因为毕赤酵母菌株的PpSGS1、PpTOP3、PpRMI1或PpMPH1基因。
可选地,多片段体内定点重组的片段整合长度为11013bp,片段数量为3段,且重叠区为重组基因的启动子或终止子区域;
优选地,所述重组基因为过表达PpMUS81-PpMMS4基因或PpSLX1-PpSLX4基因。
一种毕赤酵母代谢工程改造方法,具体步骤为:
(1)以上述用于毕赤酵母同源重组的表达载体出发,构建新靶向重组执行检查点相关基因的敲除和同源重组过表达重组执行检查点相关基因的基因位点的gRNA表达载体;
具体实施过程中,载体的构建过程为:
(1)为了实现Cas9蛋白在对连续替换不同靶标的gRNA结合位点进行剪切分别构建了含有Zeocin抗性基因和Geneticin抗性基因的gRNA表达载体。
PCR方法:使用Takara公司
Figure BDA0002830166080000031
HS DNA Polymerase克隆所需条带,PCR方法参照
Figure BDA0002830166080000032
HS DNA Polymerase使用说明。退火温度根据克隆所需的引物设定,延伸时间根据
Figure BDA0002830166080000033
HS DNA Polymerase的延伸速度1min/kb和所克隆片段的长度确定。
采用含有Zeocin抗性基因的gRNA表达载体对靶向于PpMPH1进行编辑时,首先将靶标PpMPH1基因的gRNA利用融合PCR的方法构建到含有启动子-HH-gRNA-HDV-终止子的片段中,然后利用无缝克隆的方法,将该片段连接到含有Cas9蛋白和Zeocin抗性的载体中。
(2)构建敲除重组执行检查点或过表达重组执行检查点相关基因的供体序列构建;
构建基因无缝敲除的供体DNA:以引物MPH1UP-F(SEQ ID NO:6)/MPH1UP-R(SEQ IDNO:7)、MPH1DN-F(SEQ ID NO:8)/MPH1DN-R(SEQ ID NO:9)从GS115基因组上扩增出MPH1基因编码序列上游同源臂MPH1 UP和下游同源臂MPH1 DN。将上述两片段经过重叠PCR获得MPH1 UP-DN片段。
(3)采用常规电转化方法将敲除基因进行敲除或将过表达基因进行过表达。
将100ng pPICZA-MPH1-gRNA(在SEQ ID NO:56基础上将4960-5022位点序列替换为PpMPH1-gRNA序列:SEQ ID NO:57)和1μg供体DNA共转化到GS115-PpRAD52,复苏后涂布于含有100μg/L Zeocin抗性的YPD平板,3-4天后,挑取16个单菌落于YPD液体培养基中。提取基因组后PCR验证。以基因组为模板,MPH1-Check-F(SEQ ID NO:10)/MPH1-Check-R(SEQ IDNO:11)经PCR扩增后,电泳出现较短条带(2203bp)的为敲除MPH1的菌株。挑取其中阳性菌株直接进行下一步基因编辑。
(4)在需要连续对其他基因进行编辑时,依次重复步骤(2)、(3)直到获得最终的目标菌株。
一种毕赤酵母代谢工程改造方法,采用CRISPR/Cas9系统,能够完成快速多轮基因组编辑,包括但不限于基因无缝敲除和定点整合,具体步骤如下:
(1)以前述gRNA表达载体出发,构建新靶向gRNA表达载体;
(2)以重叠延伸PCR的方法构建基因敲除和表达的供体DNA片段,同源臂长度可设定为200bp,500bp,或者1000bp;
(3)以电击转化的方法将gRNA表达载体500ng和供体DNA分子1000ng导入毕赤酵母细胞;
(4)验证正确的转化子可使用不同抗性(如前面使用了Zeocin抗性后面使用Geneticin抗性)CRISPR-Cas9-gRNA载体进行其他靶标位点的基因编辑。
本发明的有益效果在于:
(1)本发明通过在现有毕赤酵母基因与过表达PpRAD52基因的整合、敲除KU70/KU80基因或抑制KU70/KU80基因表达强度,提高了毕赤酵母的同源重组效率。
(2)在常规CRISPR/Cas9系统的编辑过程中,需要在含有gRNA的载体上使用筛选标记,以方便在筛选平板上获得转化子。本申请在gRNA载体上设计并构建了含有不同抗性标记Zeocin和Geneticin。由于每次进行基因编辑时,采用的载体抗性均与上次不同,并且在菌株进行转化过程中需要进行活化的过程,及在转化前的一天挑取单菌落接种到YPD培养基中过夜培养,并在第二天进行一次转接。因此使用两种不同抗性的基因编辑载体可在进行下一次基因编辑的转化过程中,将上一次载体抗性进行去除。不再需要进行丢掉质粒的步骤,缩短了对毕赤酵母进行连续基因编辑的时间。
(2)本发明毕赤酵母代谢工程改造方法具有高同源整合能力,并且证实了通过表达同源重组相关蛋白以及下调非同源末端连接强度均可以改善毕赤酵母同源重组活力,其中过表达PpRAD52基因是增强毕赤酵母同源重组能力的关键。
(3)本发明进一步拓展了毕赤酵母作为细胞工厂的应用潜力,使其在遗传改造过程中更加简洁、快速、方便和精准。
附图说明
图1是本申请菌株构建及其用于代谢工程改造的策略示意图;
图2是实施例1中CRISPR-Cas9-gRNA表达载体构建过程简化示意图;
图3是实施例1中CRISPR-Cas9-gRNA不同抗性表达载体连续转化示意图;
图4是实施例2中PpRAD52基因在毕赤酵母中的整合表达盒;
图5是实施例2中过表达PpRAD52基因菌株同源重组效率结果;
图6是实施例3中抑制NHEJ中KU70基因的表达后毕赤酵母同源重组结果,其中A为GS115、GS115-PpRAD52、GS115-PpRAD52;KU70dw菌株在同源臂为200bp时敲除GUT1基因PCR电泳检测图,B为毕赤酵母GUT1基因敲除示意图图,C为GS115、GS115-PpRAD52、GS115-PpRAD52;KU70dw在同源臂为200bp时敲除GUT1基因同源重组效率统计图;
图7是实施例4中过表达PpRAD52基因进行无缝敲除同源臂长度的示意图和结果,其中A为GUT1基因敲除过程示意图;B为敲除前、后的同源重组效率对比结果;
图8是实施例4中PpSGS1、PpTOP3、PpRMI1和PpMPH1,PpSGS1和PpMPH1敲除强化多片段重组示意图和结果,其中A为上述多片段体内定点整合实验设计示意图;B为上述多片段体内定点整合转化效率与阳性率验证结果。
具体实施方式
下面结合附图和具体实施例,进一步阐述本发明。
下述实施例中所使用的实验方法如无特殊说明,均为常规方法;下述实施例中所用的试剂、材料等,如无特殊说明,均可从商业途径得到。下述实施例中所用的仪器,如无特殊说明,使用时采用的参数均为厂家推荐参数。
本申请中所涉及pPICZA-PpGUT1-gRNA质粒模板均以pPICZαA(序列来源为https://www.snapgene.com/resources/plasmid-files/?set=yeast_plasmids&plasmid=pPICZ(alpha)_A)为骨架,将1-1678区段序列替换为序列SEQ ID NO:55;获得完整pPICZA-PpGUT1-gRNA序列SEQ ID NO:56。
图1是本申请菌株构建及其用于代谢工程改造的策略示意图,并通过以下实施过程进行具体说明。
实施例1
CRISPR/Cas9系统构建
(1)CRISPR/Cas9载体构建
为了实现Cas9蛋白在毕赤酵母细胞中的表达,扩增人源密码子优化的Cas9基因,由来源于毕赤酵母的PHTX1双向启动子同时启动Cas9和gRNA。PHTX1为RNA pol II型启动子能够识别核酶序列HH和HDV,对gRNA转录后的侧翼多余序列完全切除。同时为了使含有Cas9和gRNA表达组件的载体能够在毕赤酵母中稳定游离存在,将来源于乳酸克鲁维酵母的复制起点panARS(SEQ ID NO:1)构建于表达载体。为了方便后续应用过程中不同gRNA的替换,在启动子PHTX1前和终止子TAOX1后分别添加了该载体上单一酶切位点SacII和XbaI,通过对gRNA表达盒酶切的方式进行替换。通过使用在构建时不需要更换的启动子PHTX1的F端引物SacII-PHTX1-R(SEQ ID NO:16)和终止子TAOX1的R端引物XbaI-TAOX1-F(SEQ ID NO:17),以及在构建不同gRNA时需要更换的含有HH和可变序列的启动子PHTX1的R端引物和含有gRNA和HDV的TAOX1的F端引物,利用重叠PCR,
重叠PCR具体参数为:
第一轮PCR
将进行overlap的两个片段按照1:1的摩尔比混合,启动子添加的量为100ng/kb。以DNA片段混合物作为模板,添加3μl dNTP(浓度2.5mM),5μl 5×PrimerStar缓冲液,0.5μlPrime STAR HS DNA聚合酶(以上购买于宝生物工程(大连)有限公司),以水将反应体系补充至25μl。然后在PCR扩增仪上按照如下程序进行扩增:
Figure BDA0002830166080000051
取2μl第一轮PCR产物作为模板,添加上下游引物和Prime STAR HS DNA聚合酶,进行50μl体系常规PCR(反应体系可以根据需要进行调整),在PCR扩增仪上采用如下程序进行扩增反应:
Figure BDA0002830166080000052
并将gRNA片段与酶切载体连接,可快速构建不同gRNA的表达载体(如图2所示,其中Variable N6 Sequence与gRNA起始的6bp碱基为互补序列)。根据不同抗性,在以上载体组成部分的基础上,筛选标记分别使用了Zeocin抗性基因和Geneticin抗性基因。含有不同筛选标记的载体在操作过程中可轮换使用,即在转化含有Zeocin抗性基因的含有Cas9和gRNA的载体A后,可在不进行质粒丢失的菌株中使用Geneticin抗性基因作为筛选标记的含有Cas9和gRNA的载体B对其他基因进行编辑(如图3所示)。在轮换过程中,通过转化时需要在不含抗生素的培养基中培养将之前的载体丢失,从而保证后续基因操作可连续进行。
具体实施过程中,载体的构建过程为:
(1)为了实现Cas9蛋白在毕赤酵母基因组中不同的基因实现连续编辑,分别构建了含有Zeocin抗性基因和Geneticin抗性基因的gRNA表达载体,以pPICZA-PpGUT1-gRNA质粒为模板(SEQ ID NO:56),使用引物Plasmid F(SEQ ID NO:58);Plasmid R(SEQ ID NO:59)克隆除BleoR部分的质粒。在PCR扩增仪上采用如下程序进行扩增反应:
Figure BDA0002830166080000061
以pPICZA-KANR质粒为模板使用引物KAN-pPICZA-F(SEQ ID NO:60)和KAN-pPICZA-R(SEQ ID NO:61)克隆KANR基因。
PCR扩增仪上采用如下程序进行扩增反应:
Figure BDA0002830166080000062
将PCR获得的质粒片段和KANR基因片段使用诺唯赞一步克隆试剂盒(ClonExpressMultiS One Step Cloning Kit,C113),将质粒片段与KANR基因片段连接。操作方法参照诺唯赞试剂盒使用说明,通过无缝克隆获得pPICZA-gRNA-KANR质粒。
(2)pPICZA-PpMPH1-gRNA质粒构建:
以pPICZA-PpGUT1-gRNA质粒为模板,以XbaI-TAOX1-F(SEQ ID NO:17)/PpMPH1-gRNA-R为引物(SEQ ID NO:4)pPICZA-PpGUT1-gRNA质粒为模板扩增出PpMPH1-gRNA片段。以PpMPH1-PHTX1-F(SEQ ID NO:5)/SacII-PHTX1-R(SEQ ID NO:16)为引物扩增出PHTX1片段。
(3)pPICZA-PpSGS1-gRNA-KANR质粒构建:
以pPICZA-PpGUT1-gRNA质粒为模板,以XbaI-TAOX1-F(SEQ ID NO:23)/PpSGS1-gRNA-R为引物(SEQ ID NO:12)扩增出PpSGS1-gRNA片段。以pPICZA-PpGUT1-gRNA质粒为模板,以PpSGS1-PHTX1-F(SEQ ID NO:13)/SacII-PHTX1-R(SEQ ID NO:22)为引物扩增出PHTX1片段。
将PpSGS1-gRNA片段和PpSGS1-PHTX1片段进行重叠PCR获得PHTX1-PpSGS1-gRNA片段。
将PHTX1-PpSGS1-gRNA与经SacII、XbaI双酶切线性化的pPICZA-gRNA-KANR质粒进行无缝克隆得pPICZA-PpSGS1-gRNA-KANR质粒。
(3)在过表达PpRAD52基因(SEQ ID NO:25)的GS115-PpRAD52菌株中采用含有Zeocin抗性基因的gRNA表达载体pPICZA-PpMPH1-gRNA对PpMPH1进行编辑。
以MPH1UP-F(SEQ ID NO:6)/MPH1UP-R(SEQ ID NO:7)、MPH1DN-F(SEQ ID NO:8)/MPH1DN-R(SEQ ID NO:9)为引物,以GS115基因组DNA为模板,扩增出MPH1上游同源臂MPH1UP和下游同源臂MPH1DN。将上述两个片段经过Overlap PCR得到供体DNA MPH1UP-MPH1DN片段。
将1μg供体DNA片段、100ng pPICZA-PpMPH1-gRNA质粒转化到过表达PpRAD52(SEQID NO:25)基因的GS115-PpRAD52菌株中,复苏后涂布于100μg/L的Zeocin YPD培养基中,3-4天后,挑取20个菌落于YPD培养基。以基因组为模板,以MPH1-Check-F(SEQ ID NO:10)/MPH1-Check-R(SEQ ID NO:11)为引物扩增后,电泳后条带2203bp为敲除MPH1的菌株GS115-PpRAD52-mph1Δ。
(4)以获得的未进行质粒丢失的GS115-PpRAD52-mph1Δ菌株为初始菌株,采用含有Geneticin抗性基因的gRNA表达载体对PpSGS1基因进行再次编辑。
将验证正确的GS115-PpRAD52-mph1Δ菌株接种到20mL YPD培养基中用于感受态的制备。
以SGS1UP-F(SEQ ID NO:14)/SGS1UP-R(SEQ ID NO:15)、SGS1DN-F(SEQ ID NO:16)/SGS1DN-R(SEQ ID NO:17)为引物,以GS115基因组DNA为模板,扩增出SGS1上游同源臂SGS1UP和下游同源臂SGS1DN。将上述两个片段经过重叠PCR得到供体DNA SGS1UP-SGS1DN片段。
将1μg供体DNA片段、100ng pPICZA-PpSGS1-gRNA质粒转化到未丢质粒的GS115-PpRAD52-mph1Δ菌株中,复苏后涂布于100μg/L的Geneticin YPD培养基中,3-4天后,挑取20个菌落于YPD培养基。以基因组为模板,以SGS1-Check-F(SEQ ID NO:18)/SGS1-Check-R(SEQ ID NO:19)为引物扩增后,电泳后条带2387bp为敲除PpSGS1的菌株GS115-PpRAD52-mph1Δ-sgs1Δ。
(5)依次交替使用不同抗性的gRNA质粒,可实现对毕赤酵母基因组的连续基因编辑。直到获得目的菌株。
实施例2
过表达PpRAD52促进毕赤酵母同源重组介导的DNA修复机制
在酿酒酵母中,当基因组双链DNA分子发生断裂后主要依靠同源重组的方式对DNA进行修复。在修复过程中RAD52上游基因发挥了重要功能,其中包括了RAD52、RAD51、RAD54、RAD55-RAD57二聚体等多个RAD基因家族中的基因。在酵母菌中,RAD52基因发挥着重要的功能,Rad52是一种真核介导蛋白,由三个具有不同分子功能的区域组成的多结构域蛋白,在Rad52的氨基端和羧基端均发现了DNA结合域,并且更倾向于与单链DNA结合。Rad52的氨基端能够与Rad59结合,同时含有两个自连接域,可使Rad52形成7聚体环状结构。在Rad52蛋白的中间和羧基端含有ssDNA和重组酶Rad51的结合域,能够加快Rad51蛋白与包裹了复制蛋白A(replication protein A,RPA)蛋白的单链DNA进行装配。当进行DNA双链断裂的修复时,双链末端的5’链被剪切形成一个3’单链结构,RPA蛋白立即与ssDNA结合,防止其被降解以及二级结构的形成。Rad52蛋白通过将RPA替换为重组酶Rad51激活了修复过程。在修复的过程中,Rad52可能参与了第二链末端的捕获以及退火过程。在酿酒酵母中,在DSB断裂附近会聚集600-2100个Rad52蛋白分子,这种局部高浓度的Rad52蛋白分子可能促进了重组过程中的生化步骤。在启动子pENO1、pGAL1过表达RAD52基因能够纠正RAD52缺陷细胞修复和重组的缺陷,表明RAD52基因能够被广泛的启动子进行过表达,并发挥正常的功能。
因此,提高RAD52基因的表达水平对于提高毕赤酵母的同源重组效率具有显著的促进作用。我们对来源于毕赤酵母的同源重组相关蛋白RAD52单独过表达(整合表达盒如图4所示)。以敲除毕赤酵母中同源重组效率较低的位点GUT1基因为例,单独过表达毕赤酵母自身的PpRAD52基因(SEQ ID NO:25)同源重组效率达到了75~90%(图5)。在毕赤酵母中使用来源于毕赤酵母的启动子pGAP过表达PpRAD52基因(SEQ ID NO:25),通过单交换方式,或将毕赤酵母的启动子pGAP过表达PpRAD52基因(SEQ ID NO:25),整合到基因组上均可实现。
具体实施步骤为:
单交换方法过表达PpRAD52基因:
(1)pPICZA-PGAP-RAD52质粒的构建
为了实现PpRAD52基因(SEQ ID NO:25)在GS115中过表达,以SacII-PGAP-F(SEQ IDNO:62)/PpRAD52-PGAP-R(SEQ ID NO:63)为引物,GS115基因组为模板扩增得到PGAP序列,以PpRAD52-F(SEQ ID NO:64)/XbaI-PpRAD52-R(SEQ ID NO:65)为引物,GS115基因组为模板,扩增出PpRAD52片段。将上述片段经过重叠PCR得到PGAP-PpRAD52(SEQ ID NO:21),之后将PGAP-PpRAD52与pPICZA-KANR质粒使用SacII和XbaI双酶切,使用T4连接酶连接,得到pPICZA-PGAP-RAD52质粒。
(2)将pPICZA-PGAP-PpRAD52整合到GS115基因组上
将pPICZA-PGAP-PpRAD52用PmeI酶切,将线性化的pPICZA-PGAP-PpRAD52转化到GS115基因组PAOX1位点。复苏后涂布于200μg/mL Geneticin抗性的YPD平板,3-4天后,挑取16个单菌落于YPD液体培养基中。提取基因组后PCR验证。以基因组为模板,以引物SacII-PGAP-F/XbaI-PpRAD52-R扩增后,获得1727bp条带,为过表达PpRAD52基因菌株。
将PGAP-PpRAD52基因整合到GS115基因组上:
(1)pPICZA-PpHIS4-gRNA(将SEQ ID NO:56 4960-5022区段替换为PpHIS4-gRNA:SEQ ID NO:20)质粒的构建
根据PpHIS4基因序列,进行靶标位点的筛选,选择PpHIS4-gRNA靶点序列其在NCBI中与GS115基因组BLAST同源性较低。
以pPICZA-PpGUT1-gRNA质粒为模板,以PpHIS4-PHTX1F(SEQ ID NO:66)/SacII-PHTX1-R(SEQ ID NO:22)为引物扩增出PHTX1片段。以XbaI-TAOX1-F(SEQ ID NO:23)/PpHIS4-gRNA-R(SEQ ID NO:67)为引物pPICZA-PpGUT1-gRNA质粒为模板扩增出PpHIS4-gRNA片段。
将PpHIS4-gRNA片段和PHTX1片段进行重叠PCR获得PHTX1-PpHis4-gRNA片段。
将PHTX1-PpHis4-gRNA与经SacII、XbaI双酶切线性化的pPICZA-PpGUT1-gRNA质粒进行无缝克隆得pPICZA-PpHIS4-gRNA
(2)HIS4-PGAP-PpRAD52(SEQ ID NO:24)构建
分别以PpHIS4UP-F(SEQ ID NO:68)/PpHIS4UP-R(SEQ ID NO:69)、PpHIS4DN-F(SEQ ID NO:70)/PpHIS4DN-R(SEQ ID NO:71)为引物,从GS115基因组上扩增出HIS4基因上游同源臂片段PpHIS4UP和HIS4基因上游同源臂片段PpHIS4UP。以PpHIS4UP-PGAP-F(SEQ IDNO:72)/PpHISDN-TAOX1-R(SEQ ID NO:73)为引物,从pPICZA-PGAP-PpRAD52质粒扩增出PGAP-PpRAD52片段。将上述三个片段经过重叠PCR得到PpHIS4UP-PGAP-PpRAD52-PpHIS4DN
(3)过表达PpRAD52(SEQ ID NO:25)基因菌株的构建:
以100ng pPICZA-PpHIS4-gRNA质粒和1μg PpHIS4UP-PGAP-PpRAD52-PpHIS4DN供体DNA片段共转化到GS115,复苏后涂布于100μg Zeocin抗性YPD平板。3-4天后挑取48个单菌落于液体YPD培养基。提取基因组后进行PCR验证。以HIS4-Check-F/RAD52-Check-R为引物,以基因组为模板电泳条带分别为1795bp的为整合成功的菌株。
(4)过表达PpRAD52基因同源重组效率验证
以GUT1UP-F(SEQ ID NO:26)/GUT1UP-R(SEQ ID NO:27)、GUT1DN-F/GUTDN-R(SEQID NO:21)为引物,以GS115基因组DNA为模板,扩增出GUT1上游同源臂GUT1UP和下游同源臂GUT1DN。将上述两个片段经过Overlap PCR得到供体DNA GUT1UP-GUT1DN片段。
(5)将1μg供体DNA片段、100ng pPICZA-PpGUT1-gRNA质粒转化到过表达PpRAD52基因(SEQ ID NO:25)的GS115-PpRAD52菌株中,复苏后涂布于100μg/L的Zeocin YPD培养基中,3-4天后,挑取20个菌落于YPD培养基。以基因组为模板,以GUT1-Check-F(SEQ ID NO:30)/GUT-Check-R(SEQ ID NO:31)为引物扩增后,电泳后条带为2564bp为敲除GUT1,统计阳性转化子菌株占总菌株数的比例。
实施例3
削弱毕赤酵母非同源末端连接水平
在酵母和丝状真菌的研究中发现,删除NHEJ通路中的组成成分将显著提高HR的频率。由于KU70和KU80基因参与了DNA修复过程,KU70或KU80基因的敲除使得菌株在高温以及紫外线条件下更加敏感。为了不影响菌株的稳定性,同时实现下调KU70/KU80基因表达强度,我们采用了甲硫氨酸抑制型启动子,该启动子为来源于毕赤酵母自身的长度为406bp的MET3基因启动子(PMET3),以同源重组方式整合到毕赤酵母基因组中,原位替换KU70/KU80基因自身的启动子。获得的转化子经过PCR验证以及测序正确,用于后续实验分析。PMET3启动子受到甲硫氨酸的抑制,因此,在转化过程中YPD孵育过程以及筛选平板中均添加浓度为10mM的甲硫氨酸。实验结果如图6A-6C所示,以甘油激酶1基因(PpGUT1)作为靶向基因,相较于对照组未能获得阳性克隆,添加甲硫氨酸显著提高了同源重组效率,达到50%。而在过表达PpRAD52(SEQ ID NO:25)的基础上下调KU70/KU80基因,将进一步增加同源重组效率。
具体实施步骤为:
(1)在过表达PpRAD52基础上,为了实现抑制表达KU70或KU80基因,分别构建了PKU70和PKU80的gRNA质粒。根据KU70和KU80基因的启动子区序列,根据PKU70选择靶标序列((SEQ ID NO:32)和PKU80选择靶标序列(SEQ ID NO:33)设计引物构建pPICZA-PKU70-gRNA和pPICZA-PKU80-gRNA质粒。
以pPICZA-PpGUT1-gRNA质粒为模板,以PKU70-PHTX1-F(SEQ ID NO:34)/SacII-PHTX1-R(SEQ ID NO:22)、PKU80-PHTX1-F(SEQ ID NO:35)/SacII-PHTX1-R(SEQ ID NO:23)为引物扩增出PHTX1-PKU70和PHTX1-PKU80片段。以XbaI-TAOX1-F(SEQ ID NO:23)/PKU70-gRNA-R(SEQ ID NO:36)、XbaI-TAOX1-F(SEQ ID NO:23)/PKU80-gRNA-R(SEQ ID NO:37)为引物pPICZA-PpGUT1-gRNA质粒为模板扩增出PKU70-gRNA片段。
将PKU70-gRNA片段和PHTX1-PKU70、PKU80-gRNA片段和PHTX1-PKU80片段进行重叠PCR获得PHTX1-PKU70-gRNA和PHTX1-PKU80-gRNA片段。
将PHTX1-PKU70-gRNA和PHTX1-PKU80-gRNA片段与经SacII、XbaI双酶切线性化的pPICZA-PpGUT1-gRNA质粒进行无缝克隆得pPICZA-PKU70-gRNA质粒和pPICZA-PKU80-gRNA质粒。
(2)PKU70和PKU80供体DNA构建
分别以PKU70UP-F(SEQ ID NO:38)/TGAP-PKU70UP-R(SEQ ID NO:39)、TGAP-F(SEQ IDNO:40)/PMET3-TGAP-R(SEQ ID NO:41)、PMET3-F(SEQ ID NO:42)/PMET3-R(SEQ ID NO:43)、PMET3-KU70-F(SEQ ID NO:44)/PMET3-KU70-R(SEQ ID NO:45)为引物,从GS115基因组上扩增出PKU70上游同源臂片段PKU70UP、终止子序列TGAP、启动子序列PMET3和PKU70下游序列KU70。以PKU80UP-F(SEQ ID NO:46)/TGAP-PKU80UP-R(SEQ ID NO:47)、TGAP-F(SEQ ID NO:40)/PMET3-TGAP-R(SEQ ID NO:41)、PMET3-F(SEQ ID NO:42)/PMET3-R(SEQ ID NO:43)、PMET3-KU80-F(SEQID NO:48)/PMET3-KU80-R(SEQ ID NO:49)为引物,从GS115基因组上扩增出PKU80上游同源臂片段PKU80UP、终止子序列TGAP、启动子序列PMET3和PKU80下游序列KU80。将上述三个片段经过重叠PCR得到PKU70UP-TGAP-PMET3-KU70和PKU80UP-TGAP-PMET3-KU80。
(3)将1μg供体DNA片段PKU70UP-TGAP-PMET3-KU70和100ng pPICZA-PKU70-gRNA质粒,1μg供体DNA片段PKU80UP-TGAP-PMET3-KU80和100ng pPICZA-PKU80-gRNA质粒分别共转化到GS115。复苏后涂布于100μg/mL Zeocin YPD平板。3-4天后各挑取24个单菌落于液体YPD培养基中,提取基因组后PCR验证。PMET3-KU70-F(SEQ ID NO:44)/KU70-Check-R和PMET3-KU80-F(SEQ IDNO:48)/KU80-Check-R为引物,扩增出条带1596bp和1635bp为整合成功菌株。
(4)各挑取5株阳性菌株,接种到5mL YPD液体培养基中过夜培养,转接到20mL YPD液体培养基中,取菌液在YPD平板上划线,挑单斑,PMET3-KU70-F(SEQ ID NO:44)/KU70-Check-R和PMET3-KU80-F(SEQ ID NO:48)/KU80-Check-R为引物再次验证供体DNA整合成功。经无菌水洗涤后涂布于100μg/mL Zeocin YPD固体培养基,倒置培养3天平板上一直没有菌落生长,说明菌株中含BleoR的游离质粒已经丢失。
(5)以GUT1UP-F(SEQ ID NO:26)/GUT1UP-R(SEQ ID NO:27)、GUT1DN-F(SEQ IDNO:28)/GUTDN-R(SEQ ID NO:29)为引物,以GS115基因组DNA为模板,扩增出GUT1上游同源臂GUT1UP和下游同源臂GUT1DN。将上述两个片段经过Overlap PCR得到供体DNAGUT1UP-GUT1DN片段。
(6)将GS115-PMET3-KU70和GS115-PMET3-KU80菌株接种到10mL 10mM甲硫氨酸的YPD液体培养基中过夜培养,在第二日天以初始OD600=0.2转接到50mL10 mM甲硫氨酸的YPD液体培养基中活化。
(7)将1μg供体DNA片段、100ng pPICZA-GUT1-gRNA质粒转化到替换了KU70基因和KU80基因启动子的诱导后的GS115-PMET3-KU70和GS115-PMET3-KU80菌株中,复苏后涂布于100μg/L的Zeocin和10mM YPD培养基中,3-4天后,挑取20个菌落于YPD培养基。以基因组为模板,以GUT1-Check-F(SEQ ID NO:30)/GUT-Check-R(SEQ ID NO:31)为引物扩增后,电泳后条带为2564bp为敲除GUT1,统计阳性转化子菌株占总菌株数的比例。
实施例4
毕赤酵母CRISPR/Cas9系统在代谢改造过程中的应用
(1)无缝敲除
为了过表达PpRAD52基因(SEQ ID NO:25)的菌株应用于进一步的基因组编辑与代谢工程改造研究中。首先是基因无缝敲除,同时探究同源臂长度对同源重组效率的影响。以无缝敲除PpGUT1基因为例,应用长度为200bp,500bp。实验结果如图7A至7B所示。7A为使用同源臂长度为500bp和200bp的GUT1供体DNA进行GUT1基因敲除过程示意图。7B为GS115-PpRAD52菌株在同源臂长度缩短至500bp和200bp时整合GUT1供体DNA的PCR检测,同源重组效率对比结果。过表达PpRAD52菌株在同源臂缩短的条件下依然呈现出较强的同源重组能力,即使同源臂缩短至200bp时,同源重组效率依然维持在66.6~83.3%。因此,在毕赤酵母中过表达PpRAD52基因菌株在进一步的代谢工程改造过程中具有更广泛的应用前景,成为后续研究的关键菌株。
(2)多片段体内定点重组
为了方便在实际应用过程中更为便捷的构建多基因表达盒代谢通路,我们在过表达PpRAD52基因的基础上分别敲除了Sgs1和Mph1基因。构建了用于脂肪醇合成通路的3个单独的基因表达盒,这3个单独的基因表达盒之间含有500bp的同源臂,并且在两侧的片段与基因组的同源臂为1000bp。将其3个部分同时整合至菌株的FAA1位点,以测试其在菌株体内进行多片段重组的能力。图8A为多片段体内定点重组实验设计示意图,多片段体内定点整合转化效率与阳性率验证结果如图8B所示。当进行多片段整合时,只过表达PpRAD52基因的菌株的阳性率变低为25%左右,而敲除PpMPH1、PpSGS1、PpTOP3、PpRMI1,和过表达PpMUS81-PpMMS4、过表达PpSLX1-PpSLX4)基因的菌株,阳性率显著上升,能够实现在毕赤酵母基因组同一位点一次性高效整合三个基因表达盒,总长度达到11013bp。其中PpMUS81-PpMMS4是将启动子PGAP、PpMUS81基因开放阅读框和终止子TFBP1融合为一个表达盒。PGAP和TFBP1序列分别为SEQ ID NO:50、SEQ ID NO:51。将启动子PTEF1、PpMMS4基因开放阅读框和终止子TADH2融合为另外一个表达盒,使用重叠PCR的方法将两个表达盒在终止子端融合成为一个片段。PTEF1和TADH2序列分别为SEQ ID NO:52、SEQ ID NO:53。PpMUS81和PpMMS4基因的序列可通过https://www.ncbi.nlm.nih.gov/查询,对应GenBank登录号为CP014716.1标签为AT250_GQ6801224和AT250_GQ6801321的两个序列。PpSLX1-PpSLX4是将启动子PGAP、PpSLX1基因开放阅读框和终止子TFBP1融合为一个表达盒。将启动子PTEF1、PpSLX4基因开放阅读框和终止子TADH2融合为另外一个表达盒。PpSLX1和PpSLX4可通过https://www.ncbi.nlm.nih.gov/查询,对应GenBank登录号为CP014715.1标签为AT250_GQ6802741和GenBank登录号为CP014717.1标签为AT250_GQ6803893的序列。
因此在过表达PpRAD52基因的高同源重组能力菌株基础上进一步改造,能够实现多片段的整合。在此基础上通过对毕赤酵母同源重组系统中REC相关基因进行改造,能够进一步提高毕赤酵母多片段重组的能力,为后续研究提供一个更为便捷的毕赤酵母底盘细胞。
以上所述,仅是本申请的几个实施例,并非对本申请做任何形式的限制,虽然本申请以较佳实施例揭示如上,然而并非用以限制本申请,任何熟悉本专业的技术人员,在不脱离本申请技术方案的范围内,利用上述揭示的技术内容做出些许的变动或修饰均等同于等效实施案例,均属于技术方案范围内。
序列表
<110> 中国科学院大连化学物理研究所
<120> 一种具有高同源重组效率的毕赤酵母菌株及其应用
<130> DD200148I
<141> 2020-12-10
<160> 73
<170> SIPOSequenceListing 1.0
<210> 1
<211> 452
<212> DNA
<213> An artificial sequence
<400> 1
tagtgctgat tatgatttga cgtttatata catgttatgt taatatggta aattttagat 60
atttggtagg agtgtcggtc cttgaaatat atgtaatata cccattatac caaggaaaga 120
ttgatttaac tatattggat tagcagatat ctaatttgtt tttttgttct taacctctgg 180
tgagttatta tgatgttttt atattttatc ttttttaatt aaatgtcatt atatagaaac 240
aaatattaaa ctaattatta aagtgtatta gtattcttaa tgaacgtcgg gaagaacaaa 300
agtttaaaga tattgaagtt aaacatcaat attagtcata agtgcataag caactgatat 360
tgatggaaag aactaaagaa gtgcaaagag ctcaccaaaa aacgtactgc gtatctgttc 420
tttctcattc tgatattatc caaagatgtt gc 452
<210> 2
<211> 550
<212> DNA
<213> An artificial sequence
<400> 2
tgttgtagtt ttaatatagt ttgagtatga gatggaactc agaacgaagg aattatcacc 60
agtttatata ttctgaggaa agggtgtgtc ctaaattgga cagtcacgat ggcaataaac 120
gctcagccaa tcagaatgca ggagccataa attgttgtat tattgctgca agatttatgt 180
gggttcacat tccactgaat ggttttcact gtagaattgg tgtcctagtt gttatgtttc 240
gagatgtttt caagaaaaac taaaatgcac aaactgacca ataatgtgcc gtcgcgcttg 300
gtacaaacgt caggattgcc accacttttt tcgcactctg gtacaaaagt tcgcacttcc 360
cactcgtatg taacgaaaaa cagagcagtc tatccagaac gagacaaatt agcgcgtact 420
gtcccattcc ataaggtatc ataggaaacg agagtcctcc ccccatcacg tatatataaa 480
cacactgata tcccacatcc gcttgtcacc aaactaatac atccagttca agttacctaa 540
acaaatcaaa 550
<210> 3
<211> 247
<212> DNA
<213> An artificial sequence
<400> 3
tcaagaggat gtcagaatgc catttgcctg agagatgcag gcttcatttt tgatactttt 60
ttatttgtaa cctatatagt ataggatttt ttttgtcatt ttgtttcttc tcgtacgagc 120
ttgctcctga tcagcctatc tcgcagctga tgaatatctt gtggtagggg tttgggaaaa 180
tcattcgagt ttgatgtttt tcttggtatt tcccactcct cttcagagta cagaagatta 240
agtgaga 247
<210> 4
<211> 96
<212> DNA
<213> An artificial sequence
<400> 4
ggttgtctga tgagtccgtg aggacgaaac gagtaagctc gtcacaaccc ggatattact 60
gaggttttag agctagaaat agcaagttaa aataag 96
<210> 5
<211> 59
<212> DNA
<213> An artificial sequence
<400> 5
tcgtttcgtc ctcacggact catcagacaa cctttgattt gtttaggtaa cttgaactg 59
<210> 6
<211> 25
<212> DNA
<213> An artificial sequence
<400> 6
gtaaaacttg ttgatgattg gaccc 25
<210> 7
<211> 61
<212> DNA
<213> An artificial sequence
<400> 7
gggattatta agggatagta agttactttg ttccatctaa gggtttaacg ggtttccaaa 60
g 61
<210> 8
<211> 38
<212> DNA
<213> An artificial sequence
<400> 8
agatggaaca aagtaactta ctatccctta ataatccc 38
<210> 9
<211> 23
<212> DNA
<213> An artificial sequence
<400> 9
ccttcctata gtggctatcg agg 23
<210> 10
<211> 23
<212> DNA
<213> An artificial sequence
<400> 10
gtatcttttg aatcgggagg tgg 23
<210> 11
<211> 23
<212> DNA
<213> An artificial sequence
<400> 11
gtatcggtga ctccatgaaa ggc 23
<210> 12
<211> 96
<212> DNA
<213> An artificial sequence
<400> 12
atgagactga tgagtccgtg aggacgaaac gagtaagctc gtctctcatg tagacgacga 60
ctggttttag agctagaaat agcaagttaa aataag 96
<210> 13
<211> 59
<212> DNA
<213> An artificial sequence
<400> 13
tcgtttcgtc ctcacggact catcagtctc attttgattt gtttaggtaa cttgaactg 59
<210> 14
<211> 26
<212> DNA
<213> An artificial sequence
<400> 14
gacttgtcaa agttgagaaa gttggg 26
<210> 15
<211> 23
<212> DNA
<213> An artificial sequence
<400> 15
agagtgggag ttgcggagaa aag 23
<210> 16
<211> 59
<212> DNA
<213> An artificial sequence
<400> 16
ttaatcaacc ttttctccgc aactcccact ctcatctact tcaaggaaag cttcagttc 59
<210> 17
<211> 30
<212> DNA
<213> An artificial sequence
<400> 17
atctgaactt tattcgtcga atcttcactg 30
<210> 18
<211> 28
<212> DNA
<213> An artificial sequence
<400> 18
ggagaaactg agtacagata ttcacagg 28
<210> 19
<211> 23
<212> DNA
<213> An artificial sequence
<400> 19
gcacgtcgta tctatggaac agg 23
<210> 20
<211> 63
<212> DNA
<213> An artificial sequence
<400> 20
ctacttctga tgagtccgtg aggacgaaac gagtaagctc gtcaagtagt gaatagacca 60
tcg 63
<210> 21
<211> 1727
<212> DNA
<213> An artificial sequence
<400> 21
tccccgcggt ttttgtagaa atgtcttggt gtcctcgtcc aatcaggtag ccatctctga 60
aatatctggc tccgttgcaa ctccgaacga cctgctggca acgtaaaatt ctccggggta 120
aaacttaaat gtggagtaat ggaaccagaa acgtctcttc ccttctctct ccttccaccg 180
cccgttaccg tccctaggaa attttactct gctggagagc ttcttctacg gcccccttgc 240
agcaatgctc ttcccagcat tacgttgcgg gtaaaacgga ggtcgtgtac ccgacctagc 300
agcccaggga tggaaaagtc ccggccgtcg ctggcaataa tagcgggcgg acgcatgtca 360
tgagattatt ggaaaccacc agaatcgaat ataaaaggcg aacacctttc ccaattttgg 420
tttctcctga cccaaagact ttaaatttaa tttatttgtc cctatttcaa tcaattgaac 480
aactatcaaa acacaatgtc tttcgatgac gctgagctca aacgcatatc taaggagctc 540
gacaagcaac ttggtccaga gtttatttgt acaagacctg gccaaggtgg tatgaaagtg 600
tcgtatctct ctggcactac tgctattagt ttggccaatc acatctttgg ctttaatggg 660
tggcattcgg aagttaagag tactacagtg gattttgtag atactcagca tggcaaaatt 720
tcaatgggac tttcgtctgt tattcgggtc accttgaaag acggttcttt tcatgaggat 780
attggttatg gaagcgtgga aaatgcaaaa tccaaggcca tagcttttga gaagtgcaga 840
aaagaggcta tcaccgacgg actcaagaga gttttgagat gttttggtaa tgctttgggt 900
aattgtctgt acgacaagga atatttacga aagatttcaa acgttaaaac tcaagctatc 960
acatttaatg aaggcgatct tatgagacac aatcagcttg aggcacgaac tctcaaacag 1020
gaagccaagc ttctggagat taatcaaaag aaagctaaaa acagcagcaa gtcaagaatt 1080
aatgtccctc ccaagcattt tggtgacaat gaagacgacg attcgcattt gttcagcgat 1140
gaaatcaaca tcgatagtga ggactttatg aatgaaattg atgattacga gatggatttg 1200
ctgatgcaaa agaactctca gagagaaatt gaaaacgtaa acgacgatga gattgaaaat 1260
aagggtgacg ctgtcgacgc tgttaccaag agtaatattg aaaatcagtt cattgccccc 1320
aatagtcccc agattatgga caacatggta ctgactccag ataaaatccc agccaaggtt 1380
gaatttgttt ctgccaaggt tgccgagaag gtccaaaaca atagtccatt gaacgtggaa 1440
gaaaagttca acccatcatt ccagtctcct tctttaagaa gaactgtaga tcctacgaaa 1500
tcaatgccca ttagacgtac aatggttcaa acatctgtgc ttagtcagtc caagcagggt 1560
cctaaacgaa tgatcggaat tcctccagat acggcaaaaa ggcataagct gggatcacaa 1620
aaccaaaaca ctgccaacga taaacccgag gagaagcaat tgagtcggtt caattctaca 1680
aaggccccag gaaaagaaaa ctctccagct tcgaattaat ctagagc 1727
<210> 22
<211> 65
<212> DNA
<213> An artificial sequence
<400> 22
aatggagtac ttcttgtcca tcgtttcgcc gcggtgttgt agttttaata tagtttgagt 60
atgag 65
<210> 23
<211> 55
<212> DNA
<213> An artificial sequence
<400> 23
aacgtcaaat cataatcagc actatctaga gcacaaacga aggtctcact taatc 55
<210> 24
<211> 3961
<212> DNA
<213> An artificial sequence
<400> 24
ggcgaaactg aagcgaatta tagatgtctg gagtcaacgt aagatatttg actcaaacct 60
gattcataga ctttatcaga gcatacagga tcaaaaagct tataacggtt tatcctcgtc 120
tagttcaaat tctccaccaa tcaattctgg ggatttggct cctgagattt cctctctatc 180
aacgctgttc aacaaaatct caacattgaa gtcttcaacg tctctggtcg ttaatcagat 240
aaatgaacaa tactcaagtc tattcgactc tgaaacatta ccaggaactg atatttattt 300
aaaacaactt ggagatctat caaccttaat cacctcagcc agatcaaagt cacaggagac 360
ccaagaatta cgagagtcca taataaatga gctgaagaaa ctgattcaag tccaagagtc 420
gtggattacg aaagatgcag agtcttcggg ttctctggat gagaaacttg ccacagttca 480
gcagaaagaa tcagagttga aagaattcat aaacgatgta gaagaagaag atggtgtacc 540
tcaatatgcc gcttcaagtg atgaagaagg cgacgaaaat gtgtcaaaaa agagaaaaat 600
ggagagccca ccaactgaaa cagttgattc tggcgaacag ccaactaacc cagtccaccc 660
tcagctttcc tccatcttag agagtctatc tagaacaact ggactaacac cagaacctgc 720
ttctacttcg gacgagtcag caacagcaac gcagaagcaa gatgaaacac ctgtttcttc 780
atctataaat cctgctctag ccagtttgct gtccaaactt aacggttaat tcttaatgtc 840
ttccccaatc acttgagtac gaactatgta ttatataatc aggcatcttt tctttttttc 900
tttttttttt gtctctcgct tggatcccaa caccatattt cagatctcct gatgactgac 960
tcactgataa taaaaatacg gcttcagaat ttctcaagac tacactcact gtccgacttc 1020
aagttttttg tagaaatgtc ttggtgtcct cgtccaatca ggtagccatc tctgaaatat 1080
ctggctccgt tgcaactccg aacgacctgc tggcaacgta aaattctccg gggtaaaact 1140
taaatgtgga gtaatggaac cagaaacgtc tcttcccttc tctctccttc caccgcccgt 1200
taccgtccct aggaaatttt actctgctgg agagcttctt ctacggcccc cttgcagcaa 1260
tgctcttccc agcattacgt tgcgggtaaa acggaggtcg tgtacccgac ctagcagccc 1320
agggatggaa aagtcccggc cgtcgctggc aataatagcg ggcggacgca tgtcatgaga 1380
ttattggaaa ccaccagaat cgaatataaa aggcgaacac ctttcccaat tttggtttct 1440
cctgacccaa agactttaaa tttaatttat ttgtccctat ttcaatcaat tgaacaacta 1500
tcaaaacaca atgtctttcg atgacgctga gctcaaacgc atatctaagg agctcgacaa 1560
gcaacttggt ccagagttta tttgtacaag acctggccaa ggtggtatga aagtgtcgta 1620
tctctctggc actactgcta ttagtttggc caatcacatc tttggcttta atgggtggca 1680
ttcggaagtt aagagtacta cagtggattt tgtagatact cagcatggca aaatttcaat 1740
gggactttcg tctgttattc gggtcacctt gaaagacggt tcttttcatg aggatattgg 1800
ttatggaagc gtggaaaatg caaaatccaa ggccatagct tttgagaagt gcagaaaaga 1860
ggctatcacc gacggactca agagagtttt gagatgtttt ggtaatgctt tgggtaattg 1920
tctgtacgac aaggaatatt tacgaaagat ttcaaacgtt aaaactcaag ctatcacatt 1980
taatgaaggc gatcttatga gacacaatca gcttgaggca cgaactctca aacaggaagc 2040
caagcttctg gagattaatc aaaagaaagc taaaaacagc agcaagtcaa gaattaatgt 2100
ccctcccaag cattttggtg acaatgaaga cgacgattcg catttgttca gcgatgaaat 2160
caacatcgat agtgaggact ttatgaatga aattgatgat tacgagatgg atttgctgat 2220
gcaaaagaac tctcagagag aaattgaaaa cgtaaacgac gatgagattg aaaataaggg 2280
tgacgctgtc gacgctgtta ccaagagtaa tattgaaaat cagttcattg cccccaatag 2340
tccccagatt atggacaaca tggtactgac tccagataaa atcccagcca aggttgaatt 2400
tgtttctgcc aaggttgccg agaaggtcca aaacaatagt ccattgaacg tggaagaaaa 2460
gttcaaccca tcattccagt ctccttcttt aagaagaact gtagatccta cgaaatcaat 2520
gcccattaga cgtacaatgg ttcaaacatc tgtgcttagt cagtccaagc agggtcctaa 2580
acgaatgatc ggaattcctc cagatacggc aaaaaggcat aagctgggat cacaaaacca 2640
aaacactgcc aacgataaac ccgaggagaa gcaattgagt cggttcaatt ctacaaaggc 2700
cccaggaaaa gaaaactctc cagcttcgaa ttaatcaaga ggatgtcaga atgccatttg 2760
cctgagagat gcaggcttca tttttgatac ttttttattt gtaacctata tagtatagga 2820
ttttttttgt cattttgttt cttctcgtac gagcttgctc ctgatcagcc tatctcgcag 2880
ctgatgaata tcttgtggta ggggtttggg aaaatcattc gagtttgatg tttttcttgg 2940
tatttcccac tcctcttcag agtacagaag attaagtgag attatttaga gattttaact 3000
tacatttaga ttcgatagat ctaaccggca tctaacatcc agtgtttcta atctagtgaa 3060
tcgagatcaa gtctcactct gaacataata aataaggtct aaccccatgg aattacatgt 3120
ccccttgggt tctgagattg tcttacccgg tggggaaaga gccatactca agttcgtagg 3180
aaatgtggag tcaaagtctg ggatttttgc tggtgttgaa ctgattggtc aaatgagtgg 3240
aaaaggaaag aattctggag agtttaagaa cgtgcagtac tttaccacca aagtccctaa 3300
ttcaggcata tttttgccct atcaaagact tctggagaca agtaacatgc aacgacttca 3360
agcagagaca ccaacgaaga caaaacgaaa tgtttatgta tctcgctcac cattagctgt 3420
ttccaatcaa caagggttga aacgatcatc aaaggagagt agcccgagca ctgttgcagg 3480
caatgaagga caattgcaca gtttgaagac tgaaaatacc catctttcac agaaatgttt 3540
gaagttagaa acacagttac aagagtgcac ggaagttctc gagtctatgg agaaggtcat 3600
taaagaccat tacgaaccag ccttcaacca aatggagaaa gatttgtctg agaagaatga 3660
aaaaatttcc aagctaaagg tttcattcga cgaacagaag accgaactgc tggatattat 3720
tgattccctt gaaaaacaag cgtcagaaac tgaacagctc tacactaaag aattgaaaag 3780
gttgagggag gaatgtgctg cttataaaaa caaggatact gcaaaggaaa cgaacgaact 3840
ccaacgtcag ctgaaagtca aggaaaaaat gtgtcaagat tgggagttga aatatactca 3900
acttaaggat tcaaaaagta aagaggaaaa cgatataatt caaggatacc agcgtgaaat 3960
c 3961
<210> 25
<211> 1224
<212> DNA
<213> An artificial sequence
<400> 25
atgtctttcg atgacgctga gctcaaacgc atatctaagg agctcgacaa gcaacttggt 60
ccagagttta tttgtacaag acctggccaa ggtggtatga aagtgtcgta tctctctggc 120
actactgcta ttagtttggc caatcacatc tttggcttta atgggtggca ttcggaagtt 180
aagagtacta cagtggattt tgtagatact cagcatggca aaatttcaat gggactttcg 240
tctgttattc gggtcacctt gaaagacggt tcttttcatg aggatattgg ttatggaagc 300
gtggaaaatg caaaatccaa ggccatagct tttgagaagt gcagaaaaga ggctatcacc 360
gacggactca agagagtttt gagatgtttt ggtaatgctt tgggtaattg tctgtacgac 420
aaggaatatt tacgaaagat ttcaaacgtt aaaactcaag ctatcacatt taatgaaggc 480
gatcttatga gacacaatca gcttgaggca cgaactctca aacaggaagc caagcttctg 540
gagattaatc aaaagaaagc taaaaacagc agcaagtcaa gaattaatgt ccctcccaag 600
cattttggtg acaatgaaga cgacgattcg catttgttca gcgatgaaat caacatcgat 660
agtgaggact ttatgaatga aattgatgat tacgagatgg atttgctgat gcaaaagaac 720
tctcagagag aaattgaaaa cgtaaacgac gatgagattg aaaataaggg tgacgctgtc 780
gacgctgtta ccaagagtaa tattgaaaat cagttcattg cccccaatag tccccagatt 840
atggacaaca tggtactgac tccagataaa atcccagcca aggttgaatt tgtttctgcc 900
aaggttgccg agaaggtcca aaacaatagt ccattgaacg tggaagaaaa gttcaaccca 960
tcattccagt ctccttcttt aagaagaact gtagatccta cgaaatcaat gcccattaga 1020
cgtacaatgg ttcaaacatc tgtgcttagt cagtccaagc agggtcctaa acgaatgatc 1080
ggaattcctc cagatacggc aaaaaggcat aagctgggat cacaaaacca aaacactgcc 1140
aacgataaac ccgaggagaa gcaattgagt cggttcaatt ctacaaaggc cccaggaaaa 1200
gaaaactctc cagcttcgaa ttaa 1224
<210> 26
<211> 28
<212> DNA
<213> An artificial sequence
<400> 26
aaatctaggt catcctacag caaacacc 28
<210> 27
<211> 60
<212> DNA
<213> An artificial sequence
<400> 27
gacctaacat gataatataa ttacagctgc tcgtagaaga agagtctttt tcagtccttg 60
<210> 28
<211> 32
<212> DNA
<213> An artificial sequence
<400> 28
gagcagctgt aattatatta tcatgttagg tc 32
<210> 29
<211> 34
<212> DNA
<213> An artificial sequence
<400> 29
aaatataaga ggaaacaacg ttcgtatcgt gatc 34
<210> 30
<211> 35
<212> DNA
<213> An artificial sequence
<400> 30
gaaaaggttt actatcccga tttaggcgaa aagag 35
<210> 31
<211> 28
<212> DNA
<213> An artificial sequence
<400> 31
atgaagttag taaggttctt gatgaagc 28
<210> 32
<211> 20
<212> DNA
<213> An artificial sequence
<400> 32
gcatgcctga gctttgaggg 20
<210> 33
<211> 20
<212> DNA
<213> An artificial sequence
<400> 33
aggctggaaa cctttggcgg 20
<210> 34
<211> 59
<212> DNA
<213> An artificial sequence
<400> 34
tcgtttcgtc ctcacggact catcaggcat gctttgattt gtttaggtaa cttgaactg 59
<210> 35
<211> 59
<212> DNA
<213> An artificial sequence
<400> 35
tcgtttcgtc ctcacggact catcagagaa gatttgattt gtttaggtaa cttgaactg 59
<210> 36
<211> 96
<212> DNA
<213> An artificial sequence
<400> 36
gcatgcctga tgagtccgtg aggacgaaac gagtaagctc gtcgcatgcc tgagctttga 60
ggggttttag agctagaaat agcaagttaa aataag 96
<210> 37
<211> 96
<212> DNA
<213> An artificial sequence
<400> 37
tcttctctga tgagtccgtg aggacgaaac gagtaagctc gtcagaagag atattttggc 60
gcggttttag agctagaaat agcaagttaa aataag 96
<210> 38
<211> 24
<212> DNA
<213> An artificial sequence
<400> 38
tctcacgggt gattacttgt ttac 24
<210> 39
<211> 59
<212> DNA
<213> An artificial sequence
<400> 39
attttcgaat ttcagctatt tcacatacaa atcgatctat acaacccttt gcttcctcc 59
<210> 40
<211> 24
<212> DNA
<213> An artificial sequence
<400> 40
atcgatttgt atgtgaaata gctg 24
<210> 41
<211> 59
<212> DNA
<213> An artificial sequence
<400> 41
tgatggttta attacttact acttagactt gttgcaacgc aattttccat tccaatttg 59
<210> 42
<211> 34
<212> DNA
<213> An artificial sequence
<400> 42
gttgcaacaa gtctaagtag taagtaatta aacc 34
<210> 43
<211> 24
<212> DNA
<213> An artificial sequence
<400> 43
ttctttctga gttggtttcc agtg 24
<210> 44
<211> 59
<212> DNA
<213> An artificial sequence
<400> 44
ctctcaattt cactggaaac caactcagaa agaaatgagt gttgtcagca agcaatacg 59
<210> 45
<211> 27
<212> DNA
<213> An artificial sequence
<400> 45
tatccctgaa acctagaatt tccaaag 27
<210> 46
<211> 28
<212> DNA
<213> An artificial sequence
<400> 46
cctagtagtt ctcttttgag tggctttc 28
<210> 47
<211> 60
<212> DNA
<213> An artificial sequence
<400> 47
aaattttcga atttcagcta tttcacatac aaatcgatca ggtaaacgac acgacttggt 60
<210> 48
<211> 59
<212> DNA
<213> An artificial sequence
<400> 48
ctctcaattt cactggaaac caactcagaa agaaatggat aaggaatgga cattgtttg 59
<210> 49
<211> 25
<212> DNA
<213> An artificial sequence
<400> 49
ccctgtcgtc ctctttcttt gtatc 25
<210> 50
<211> 486
<212> DNA
<213> An artificial sequence
<400> 50
tttttgtaga aatgtcttgg tgtcctcgtc caatcaggta gccatctctg aaatatctgg 60
ctccgttgca actccgaacg acctgctggc aacgtaaaat tctccggggt aaaacttaaa 120
tgtggagtaa tggaaccaga aacgtctctt cccttctctc tccttccacc gcccgttacc 180
gtccctagga aattttactc tgctggagag cttcttctac ggcccccttg cagcaatgct 240
cttcccagca ttacgttgcg ggtaaaacgg aggtcgtgta cccgacctag cagcccaggg 300
atggaaaagt cccggccgtc gctggcaata atagcgggcg gacgcatgtc atgagattat 360
tggaaaccac cagaatcgaa tataaaaggc gaacaccttt cccaattttg gtttctcctg 420
acccaaagac tttaaattta atttatttgt ccctatttca atcaattgaa caactatcaa 480
aacaca 486
<210> 51
<211> 251
<212> DNA
<213> An artificial sequence
<400> 51
tgcgttcgat tggcactgtt tccgagattt gatactttgt acacgatgtt atatgaggtt 60
atatacttga taagagggtt tttacgtttg caattagcac aatttcggag tagcactggc 120
gggagtgaac cttgagtagt ctggatcaat gtaatcttcg tataggctag acaccccgga 180
ttgggagtgc tgacgaaatg atgttgggat gtgatgacat catagggata atagaaaagt 240
aaggttccgc g 251
<210> 52
<211> 424
<212> DNA
<213> An artificial sequence
<400> 52
ataactgtcg cctcttttat ctgccgcact gcatgaggtg tccccttagt gggaaagagt 60
actgagccaa ccctggagga cagcaaggga aaaataccta caacttgctt cataatggtc 120
gtaaaaacaa tccttgtcgg atataagtgt tgtagactgt cccttatcct ctgcgatgtt 180
cttcctctca aagtttgcga tttctctcta tcagaattgc catcaagaga ctcaggacta 240
atttcgcagt cccacacgca ctcgtacatg attggctgaa atttccctaa agaatttctt 300
tttcacgaaa attttttttt tacacaagat tttcagcaga tataaaatgg agagcaggac 360
ctccgctgtg actcttcttt tttttctttt attctcacta catacatttt agttattcgc 420
caac 424
<210> 53
<211> 250
<212> DNA
<213> An artificial sequence
<400> 53
gccgaatagt ttgtatacgt cttatgtaat gagtttcaat gaattactta tttttacctc 60
tccttttttg gctcaattca actagcctct gtagcaatct gtttgcgaag aagaacttat 120
ctaatttttc atgggttttc cccacgtttt tgaaaagact ttgtcttaac tctctgtgat 180
caaaccgttg tggtggaccg ctgattgatt gtgattcttc ttccagatct agcgactctg 240
gcagataaga 250
<210> 54
<211> 657
<212> DNA
<213> An artificial sequence
<400> 54
atcgatttgt atgtgaaata gctgaaattc gaaaatttca ttatggctgt atctacttta 60
gcgtattagg catttgagca ttggcttgaa caatgcgggc tgtagtgtgt caccaaagaa 120
accattcggg ttcggatctg gaagtcctca tcacgtgatg ccgatctcgt gtattttatt 180
ttcagataac acctgaagac ttttgggtcg gaggactggc tctttccgat caaattggaa 240
tggaaaattg cgttgcaaca agtctaagta gtaagtaatt aaaccatcat gatcctatga 300
tcgtgatcat tcattaaagc acggtgtggc aattattgct agggagatcg tcactgtatg 360
gtggcagaat tatctctaca agatgtctca aagtccccac aaagcttgga ccctctcatc 420
tgtaatgcat tttcctgtaa ctccccttag ccacacgtca agggctctga atccgttgaa 480
aagctgtggc gtctgccacc tttaacgtct tcatgaggga tgtgcacgtg atattgtctt 540
tcccttctct aaagcttcga aaaaaacgca tctcaatgcg agaagcagat cgatatatat 600
aaagaactag tccattgaaa gatctctcaa tttcactgga aaccaactca gaaagaa 657
<210> 55
<211> 5875
<212> DNA
<213> An artificial sequence
<400> 55
gacccttgtg actgacactt tgggagtccc tattctactt agtctcatat cgcatgaaac 60
ttttgataaa ttattttctg ataggaattt ttcatcagat attatcatcg cggcttacgt 120
aataacaaaa aaaattgatg gagtctatac taggctaaca taaactaagt tattaattaa 180
acaaaacaaa acgtactagc attactgtca tatataaggg ctcctaacta aaactgtaaa 240
gacttcccgt ttaaactttt cttttcttct ttgggtctcc accgagctga gagaggtcga 300
ttcttgtttc atagagcccc gtaattgact gatgaatcag tgtggcgtcc aggacctcct 360
ttgtagaggt gtaccgcttt ctgtctatgg tggtgtcgaa gtacttgaag gctgcaggcg 420
cgcccaagtt ggtcagagta aacaagtgga taatgttttc tgcctgctcc ctgatgggct 480
tatccctgtg cttattgtaa gcagaaagca ccttatcgag gttagcgtcg gcgaggatca 540
ctcttttgga gaattcgctt atttgctcga tgatctcatc aaggtagtgt ttgtgttgtt 600
ccacgaacag ctgcttctgc tcattatctt cgggagaccc tttgagcttt tcatagtggc 660
tggccagata caagaaatta acgtatttag agggcagtgc cagctcgtta cctttctgca 720
gctcgcccgc actagcgagc attcgtttcc ggccgttttc aagctcaaag agagagtact 780
tgggaagctt aatgatgagg tcttttttga cctctttata tcctttcgcc tcgagaaagt 840
cgatggggtt tttttcgaag cttgatcgct ccatgattgt gatgcccagc agttccttga 900
cgcttttgag ttttttagac ttccctttct ccactttggc cacaaccagt acactgtaag 960
cgactgtagg agaatcgaat ccgccgtatt tcttggggtc ccaatctttt ttgcgtgcga 1020
tcagcttgtc gctgttcctt ttcgggagga tactttcctt ggagaagcct ccggtctgta 1080
cttcggtctt tttaacgatg ttcacctgcg gcatggacag gaccttccgg actgtcgcga 1140
aatccctacc cttgtcccac acgatttctc ctgtttctcc gtttgtttcg ataagtggtc 1200
gcttccgaat ctctccattg gccagtgtaa tctcggtctt gaaaaaattc ataatattgc 1260
tgtaaaagaa gtacttagcg gtggccttgc ctatttcctg ctcagacttt gcgatcattt 1320
tcctaacatc gtacacttta tagtctccgt aaacaaattc agattcaagc ttgggatatt 1380
ttttgataag tgcagtgcct accactgcat tcaggtaggc atcatgcgca tggtggtaat 1440
tgttgatctc tctcacctta taaaactgaa agtcctttct gaaatctgag accagcttag 1500
acttcagagt aataactttc acctctcgaa tcagtttgtc attttcatcg tacttggtgt 1560
tcatgcgtga atcgagaatt tgggccacgt gcttggtgat ctggcgtgtc tcaacaagct 1620
gccttttgat gaagccggct ttatccaact cagacaggcc acctcgttca gccttagtca 1680
gattatcgaa cttccgttgt gtgatcagtt tggcgttcag cagctgccgc caataatttt 1740
tcattttctt gacaacttct tctgagggga cgttatcact cttccctcta tttttatcgg 1800
atcttgtcaa cactttatta tcaatagaat catctttgag aaaagactgg ggcacgatat 1860
gatccacgtc gtagtcggag agccgattga tgtccagttc ctgatccacg tacatgtccc 1920
tgccgttctg caggtagtac aggtagagct tctcattctg aagctgggtg ttttcaactg 1980
ggtgttcctt aaggatttgg gaccccagtt cttttatacc ctcttcaatc ctcttcatcc 2040
tttccctact gttcttctgt cccttctggg tagtttggtt ctctcgggcc atctcgataa 2100
cgatattctc gggcttatgc cttcccatta ctttgacgag ttcatccacg accttaacgg 2160
tctgcagtat tccctttttg atagctgggc tacctgcaag attagcgatg tgctcgtgaa 2220
gactgtcccc ctggccagaa acttgtgctt tctggatgtc ctccttaaag gtgagagagt 2280
catcatggat caactgcatg aagttccggt tggcaaatcc atcggactta agaaaatcca 2340
ggattgtctt tccactctgc ttgtctcgga tcccattgat cagttttctt gacagccgcc 2400
cccatcctgt atatcggcgc ctcttgagct gtttcatgac tttgtcgtcg aagagatgag 2460
cgtaagtttt caagcgttct tcaatcatct ccctatcttc aaacaacgta agggtgagga 2520
caatgtcctc aagaatgtcc tcgttctcct cattgtccag gaagtccttg tctttaatga 2580
ttttcaggag atcgtgatac gttcccaggg atgcgttgaa gcgatcctcc actccgctga 2640
tttcaacaga gtcgaaacat tcaatctttt tgaaatagtc ttctttgagc tgtttcacgg 2700
taactttccg gttcgtcttg aagaggaggt ccacgatagc tttcttctgc tctccagaca 2760
ggaatgctgg ctttctcatc ccttctgtga cgtatttgac cttggtgagc tcgttataaa 2820
ctgtgaagta ctcgtacagc agagagtgtt taggaagcac cttttcgtta ggcagatttt 2880
tatcaaagtt agtcatcctt tcgatgaagg actgggcaga ggccccctta tccacgactt 2940
cctcgaagtt ccagggagtg atggtctctt ctgatttgcg agtcatccac gcgaatctgg 3000
aatttccccg ggcgaggggg cctacatagt agggtatccg aaatgtgagg attttctcaa 3060
tcttttccct gttatctttc aaaaaggggt agaaatcctc ttgccgcctg aggatagcgt 3120
gcagttcgcc caggtgaatc tggtggggga tgcttccatt gtcgaaagtg cgctgtttgc 3180
gcaacagatc ttctctgtta agctttacca gcagctcctc ggtgccgtcc attttttcca 3240
agatgggctt aataaatttg taaaattcct cctggcttgc tccgccgtca atgtatccgg 3300
cgtagccatt tttagactga tcgaagaaaa tttccttgta cttctcaggc agttgctgtc 3360
tgacaagggc cttcagcaaa gtcaagtctt ggtggtgctc atcatagcgc ttgatcatac 3420
tagcgctcag cggagctttg gtgatctccg tgttcactcg cagaatatca ctcagcagaa 3480
tggcgtctga caggttcttt gccgccaaaa aaaggtctgc gtactggtcg ccgatctggg 3540
ccagcagatt gtcgagatca tcatcgtagg tgtctttgct cagttgaagc ttggcatctt 3600
cggccaggtc gaagttagat ttaaagttgg gggtcagccc gagtgacagg gcgataagat 3660
taccaaacag gccgttcttc ttctccccag ggagctgtgc gatgaggttt tcgagccgcc 3720
gggatttgga cagcctagcg ctcaggattg ctttggcgtc aactccggat gcgttgatcg 3780
ggttctcttc gaaaagctga ttgtaagtct gaaccagttg gataaagagt ttgtcgacat 3840
cgctgttgtc tgggttcagg tccccctcga tgaggaagtg tccccgaaat ttgatcatat 3900
gcgccagcgc gagatagatc aaccgcaagt cagccttatc agtactgtct acaagcttct 3960
tcctcagatg atatatggtt gggtactttt catggtacgc cacctcgtcc acgatattgc 4020
caaagattgg gtggcgctcg tgctttttat cctcctccac caaaaaggac tcctccagcc 4080
tatggaagaa agagtcatcc accttagcca tctcattact aaagatctcc tgcaggtagc 4140
agatccgatt ctttctgcgg gtatatctgc gccgtgctgt tcttttgagc cgcgtggctt 4200
cggccgtctc cccggagtcg aacaggaggg cgccaatgag gttcttcttt atgctgtggc 4260
gatcggtatt gcccagaact ttgaattttt tgctcggcac cttgtactcg tccgtaatga 4320
cggcccagcc gacgctgttt gtgccgatat cgagcccaat ggagtacttc ttgtccatcg 4380
tttcgccgcg gtgttgtagt tttaatatag tttgagtatg agatggaact cagaacgaag 4440
gaattatcac cagtttatat attctgagga aagggtgtgt cctaaattgg acagtcacga 4500
tggcaataaa cgctcagcca atcagaatgc aggagccata aattgttgta ttattgctgc 4560
aagatttatg tgggttcaca ttccactgaa tggttttcac tgtagaattg gtgtcctagt 4620
tgttatgttt cgagatgttt tcaagaaaaa ctaaaatgca caaactgacc aataatgtgc 4680
cgtcgcgctt ggtacaaacg tcaggattgc caccactttt ttcgcactct ggtacaaaag 4740
ttcgcacttc ccactcgtat gtaacgaaaa acagagcagt ctatccagaa cgagacaaat 4800
tagcgcgtac tgtcccattc cataaggtat cataggaaac gagagtcctc cccccatcac 4860
gtatatataa acacactgat atcccacatc cgcttgtcac caaactaata catccagttc 4920
aagttaccta aacaaatcaa aattgcactg atgagtccgt gaggacgaaa cgagtaagct 4980
cgtctgcaat ttcctcagcc aggcgtttta gagctagaaa tagcaagtta aaataaggct 5040
agtccgttat caacttgaaa aagtggcacc gagtcggtgc ttttggccgg catggtccca 5100
gcctcctcgc tggcgccggc tgggcaacat gcttcggcat ggcgaatggg actcaagagg 5160
atgtcagaat gccatttgcc tgagagatgc aggcttcatt tttgatactt ttttatttgt 5220
aacctatata gtataggatt ttttttgtca ttttgtttct tctcgtacga gcttgctcct 5280
gatcagccta tctcgcagca gatgaatatc ttgtggtagg ggtttgggaa aatcattcga 5340
gtttgatgtt tttcttggta tttcccactc ctcttcagag tacagaagat taagtgagac 5400
cttcgtttgt gctctagata gtgctgatta tgatttgacg tttatataca tgttatgtta 5460
atatggtaaa ttttagatat ttggtaggag tgtcggtcct tgaaatatat gtaatatacc 5520
cattatacca aggaaagatt gatttaacta tattggatta gcagatatct aatttgtttt 5580
tttgttctta acctctggtg agttattatg atgtttttat attttatctt ttttaattaa 5640
atgtcattat atagaaacaa atattaaact aattattaaa gtgtattagt attcttaatg 5700
aacgtcggga agaacaaaag tttaaagata ttgaagttaa acatcaatat tagtcataag 5760
tgcataagca actgatattg atggaaagaa ctaaagaagt gcaaagagct caccaaaaaa 5820
cgtactgcgt atctgttctt tctcattctg atattatcca aagatgttgc cctag 5875
<210> 56
<211> 7809
<212> DNA
<213> An artificial sequence
<400> 56
agatctgacc cttgtgactg acactttggg agtccctatt ctacttagtc tcatatcgca 60
tgaaactttt gataaattat tttctgatag gaatttttca tcagatatta tcatcgcggc 120
ttacgtaata acaaaaaaaa ttgatggagt ctatactagg ctaacataaa ctaagttatt 180
aattaaacaa aacaaaacgt actagcatta ctgtcatata taagggctcc taactaaaac 240
tgtaaagact tcccgtttaa acttttcttt tcttctttgg gtcagccctg ctgtctccac 300
cgagctgaga gaggtcgatt cttgtttcat agagccccgt aattgactga tgaatcagtg 360
tggcgtccag gacctccttt gtagaggtgt accgctttct gtctatggtg gtgtcgaagt 420
acttgaaggc tgcaggcgcg cccaagttgg tcagagtaaa caagtggata atgttttctg 480
cctgctccct gatgggctta tccctgtgct tattgtaagc agaaagcacc ttatcgaggt 540
tagcgtcggc gaggatcact cttttggaga attcgcttat ttgctcgatg atctcatcaa 600
ggtagtgttt gtgttgttcc acgaacagct gcttctgctc attatcttcg ggagaccctt 660
tgagcttttc atagtggctg gccagataca agaaattaac gtatttagag ggcagtgcca 720
gctcgttacc tttctgcagc tcgcccgcac tagcgagcat tcgtttccgg ccgttttcaa 780
gctcaaagag agagtacttg ggaagcttaa tgatgaggtc ttttttgacc tctttatatc 840
ctttcgcctc gagaaagtcg atggggtttt tttcgaagct tgatcgctcc atgattgtga 900
tgcccagcag ttccttgacg cttttgagtt ttttagactt ccctttctcc actttggcca 960
caaccagtac actgtaagcg actgtaggag aatcgaatcc gccgtatttc ttggggtccc 1020
aatctttttt gcgtgcgatc agcttgtcgc tgttcctttt cgggaggata ctttccttgg 1080
agaagcctcc ggtctgtact tcggtctttt taacgatgtt cacctgcggc atggacagga 1140
ccttccggac tgtcgcgaaa tccctaccct tgtcccacac gatttctcct gtttctccgt 1200
ttgtttcgat aagtggtcgc ttccgaatct ctccattggc cagtgtaatc tcggtcttga 1260
aaaaattcat aatattgctg taaaagaagt acttagcggt ggccttgcct atttcctgct 1320
cagactttgc gatcattttc ctaacatcgt acactttata gtctccgtaa acaaattcag 1380
attcaagctt gggatatttt ttgataagtg cagtgcctac cactgcattc aggtaggcat 1440
catgcgcatg gtggtaattg ttgatctctc tcaccttata aaactgaaag tcctttctga 1500
aatctgagac cagcttagac ttcagagtaa taactttcac ctctcgaatc agtttgtcat 1560
tttcatcgta cttggtgttc atgcgtgaat cgagaatttg ggccacgtgc ttggtgatct 1620
ggcgtgtctc aacaagctgc cttttgatga agccggcttt atccaactca gacaggccac 1680
ctcgttcagc cttagtcaga ttatcgaact tccgttgtgt gatcagtttg gcgttcagca 1740
gctgccgcca ataatttttc attttcttga caacttcttc tgaggggacg ttatcactct 1800
tccctctatt tttatcggat cttgtcaaca ctttattatc aatagaatca tctttgagaa 1860
aagactgggg cacgatatga tccacgtcgt agtcggagag ccgattgatg tccagttcct 1920
gatccacgta catgtccctg ccgttctgca ggtagtacag gtagagcttc tcattctgaa 1980
gctgggtgtt ttcaactggg tgttccttaa ggatttggga ccccagttct tttataccct 2040
cttcaatcct cttcatcctt tccctactgt tcttctgtcc cttctgggta gtttggttct 2100
ctcgggccat ctcgataacg atattctcgg gcttatgcct tcccattact ttgacgagtt 2160
catccacgac cttaacggtc tgcagtattc cctttttgat agctgggcta cctgcaagat 2220
tagcgatgtg ctcgtgaaga ctgtccccct ggccagaaac ttgtgctttc tggatgtcct 2280
ccttaaaggt gagagagtca tcatggatca actgcatgaa gttccggttg gcaaatccat 2340
cggacttaag aaaatccagg attgtctttc cactctgctt gtctcggatc ccattgatca 2400
gttttcttga cagccgcccc catcctgtat atcggcgcct cttgagctgt ttcatgactt 2460
tgtcgtcgaa gagatgagcg taagttttca agcgttcttc aatcatctcc ctatcttcaa 2520
acaacgtaag ggtgaggaca atgtcctcaa gaatgtcctc gttctcctca ttgtccagga 2580
agtccttgtc tttaatgatt ttcaggagat cgtgatacgt tcccagggat gcgttgaagc 2640
gatcctccac tccgctgatt tcaacagagt cgaaacattc aatctttttg aaatagtctt 2700
ctttgagctg tttcacggta actttccggt tcgtcttgaa gaggaggtcc acgatagctt 2760
tcttctgctc tccagacagg aatgctggct ttctcatccc ttctgtgacg tatttgacct 2820
tggtgagctc gttataaact gtgaagtact cgtacagcag agagtgttta ggaagcacct 2880
tttcgttagg cagattttta tcaaagttag tcatcctttc gatgaaggac tgggcagagg 2940
cccccttatc cacgacttcc tcgaagttcc agggagtgat ggtctcttct gatttgcgag 3000
tcatccacgc gaatctggaa tttccccggg cgagggggcc tacatagtag ggtatccgaa 3060
atgtgaggat tttctcaatc ttttccctgt tatctttcaa aaaggggtag aaatcctctt 3120
gccgcctgag gatagcgtgc agttcgccca ggtgaatctg gtgggggatg cttccattgt 3180
cgaaagtgcg ctgtttgcgc aacagatctt ctctgttaag ctttaccagc agctcctcgg 3240
tgccgtccat tttttccaag atgggcttaa taaatttgta aaattcctcc tggcttgctc 3300
cgccgtcaat gtatccggcg tagccatttt tagactgatc gaagaaaatt tccttgtact 3360
tctcaggcag ttgctgtctg acaagggcct tcagcaaagt caagtcttgg tggtgctcat 3420
catagcgctt gatcatacta gcgctcagcg gagctttggt gatctccgtg ttcactcgca 3480
gaatatcact cagcagaatg gcgtctgaca ggttctttgc cgccaaaaaa aggtctgcgt 3540
actggtcgcc gatctgggcc agcagattgt cgagatcatc atcgtaggtg tctttgctca 3600
gttgaagctt ggcatcttcg gccaggtcga agttagattt aaagttgggg gtcagcccga 3660
gtgacagggc gataagatta ccaaacaggc cgttcttctt ctccccaggg agctgtgcga 3720
tgaggttttc gagccgccgg gatttggaca gcctagcgct caggattgct ttggcgtcaa 3780
ctccggatgc gttgatcggg ttctcttcga aaagctgatt gtaagtctga accagttgga 3840
taaagagttt gtcgacatcg ctgttgtctg ggttcaggtc cccctcgatg aggaagtgtc 3900
cccgaaattt gatcatatgc gccagcgcga gatagatcaa ccgcaagtca gccttatcag 3960
tactgtctac aagcttcttc ctcagatgat atatggttgg gtacttttca tggtacgcca 4020
cctcgtccac gatattgcca aagattgggt ggcgctcgtg ctttttatcc tcctccacca 4080
aaaaggactc ctccagccta tggaagaaag agtcatccac cttagccatc tcattactaa 4140
agatctcctg caggtagcag atccgattct ttctgcgggt atatctgcgc cgtgctgttc 4200
ttttgagccg cgtggcttcg gccgtctccc cggagtcgaa caggagggcg ccaatgaggt 4260
tcttctttat gctgtggcga tcggtattgc ccagaacttt gaattttttg ctcggcacct 4320
tgtactcgtc cgtaatgacg gcccagccga cgctgtttgt gccgatatcg agcccaatgg 4380
agtacttctt gtccatcgtt tcgccgcggt gttgtagttt taatatagtt tgagtatgag 4440
atggaactca gaacgaagga attatcacca gtttatatat tctgaggaaa gggtgtgtcc 4500
taaattggac agtcacgatg gcaataaacg ctcagccaat cagaatgcag gagccataaa 4560
ttgttgtatt attgctgcaa gatttatgtg ggttcacatt ccactgaatg gttttcactg 4620
tagaattggt gtcctagttg ttatgtttcg agatgttttc aagaaaaact aaaatgcaca 4680
aactgaccaa taatgtgccg tcgcgcttgg tacaaacgtc aggattgcca ccactttttt 4740
cgcactctgg tacaaaagtt cgcacttccc actcgtatgt aacgaaaaac agagcagtct 4800
atccagaacg agacaaatta gcgcgtactg tcccattcca taaggtatca taggaaacga 4860
gagtcctccc cccatcacgt atatataaac acactgatat cccacatccg cttgtcacca 4920
aactaataca tccagttcaa gttacctaaa caaatcaaaa ttgcactgat gagtccgtga 4980
ggacgaaacg agtaagctcg tctgcaattt cctcagccag gcgttttaga gctagaaata 5040
gcaagttaaa ataaggctag tccgttatca acttgaaaaa gtggcaccga gtcggtgctt 5100
ttggccggca tggtcccagc ctcctcgctg gcgccggctg ggcaacatgc ttcggcatgg 5160
cgaatgggac tcaagaggat gtcagaatgc catttgcctg agagatgcag gcttcatttt 5220
tgatactttt ttatttgtaa cctatatagt ataggatttt ttttgtcatt ttgtttcttc 5280
tcgtacgagc ttgctcctga tcagcctatc tcgcagcaga tgaatatctt gtggtagggg 5340
tttgggaaaa tcattcgagt ttgatgtttt tcttggtatt tcccactcct cttcagagta 5400
cagaagatta agtgagacct tcgtttgtgc tctagatagt gctgattatg atttgacgtt 5460
tatatacatg ttatgttaat atggtaaatt ttagatattt ggtaggagtg tcggtccttg 5520
aaatatatgt aatataccca ttataccaag gaaagattga tttaactata ttggattagc 5580
agatatctaa tttgtttttt tgttcttaac ctctggtgag ttattatgat gtttttatat 5640
tttatctttt ttaattaaat gtcattatat agaaacaaat attaaactaa ttattaaagt 5700
gtattagtat tcttaatgaa cgtcgggaag aacaaaagtt taaagatatt gaagttaaac 5760
atcaatatta gtcataagtg cataagcaac tgatattgat ggaaagaact aaagaagtgc 5820
aaagagctca ccaaaaaacg tactgcgtat ctgttctttc tcattctgat attatccaaa 5880
gatgttgccc taggatcccc cacacaccat agcttcaaaa tgtttctact ccttttttac 5940
tcttccagat tttctcggac tccgcgcatc gccgtaccac ttcaaaacac ccaagcacag 6000
catactaaat tttccctctt tcttcctcta gggtgtcgtt aattacccgt actaaaggtt 6060
tggaaaagaa aaaagagacc gcctcgtttc tttttcttcg tcgaaaaagg caataaaaat 6120
ttttatcacg tttctttttc ttgaaatttt tttttttagt ttttttctct ttcagtgacc 6180
tccattgata tttaagttaa taaacggtct tcaatttctc aagtttcagt ttcatttttc 6240
ttgttctatt acaacttttt ttacttcttg ttcattagaa agaaagcata gcaatctaat 6300
ctaaggggcg gtgttgacaa ttaatcatcg gcatagtata tcggcatagt ataatacgac 6360
aaggtgagga actaaaccat ggccaagttg accagtgccg ttccggtgct caccgcgcgc 6420
gacgtcgccg gagcggtcga gttctggacc gaccggctcg ggttctcccg ggacttcgtg 6480
gaggacgact tcgccggtgt ggtccgggac gacgtgaccc tgttcatcag cgcggtccag 6540
gaccaggtgg tgccggacaa caccctggcc tgggtgtggg tgcgcggcct ggacgagctg 6600
tacgccgagt ggtcggaggt cgtgtccacg aacttccggg acgcctccgg gccggccatg 6660
accgagatcg gcgagcagcc gtgggggcgg gagttcgccc tgcgcgaccc ggccggcaac 6720
tgcgtgcact tcgtggccga ggagcaggac tgacacgtcc gacggcggcc cacgggtccc 6780
aggcctcgga gatccgtccc ccttttcctt tgtcgatatc atgtaattag ttatgtcacg 6840
cttacattca cgccctcccc ccacatccgc tctaaccgaa aaggaaggag ttagacaacc 6900
tgaagtctag gtccctattt atttttttat agttatgtta gtattaagaa cgttatttat 6960
atttcaaatt tttctttttt ttctgtacag acgcgtgtac gcatgtaaca ttatactgaa 7020
aaccttgctt gagaaggttt tgggacgctc gaaggcttta atttgcaagc tggagaccaa 7080
catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt 7140
tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg 7200
gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg 7260
ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag 7320
cgtggcgctt tctcaatgct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc 7380
caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa 7440
ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg 7500
taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc 7560
taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga agccagttac 7620
cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg 7680
tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt 7740
gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt 7800
catgagatc 7809
<210> 57
<211> 63
<212> DNA
<213> An artificial sequence
<400> 57
ggttgtctga tgagtccgtg aggacgaaac gagtaagctc gtcacaaccc ggatattact 60
gag 63
<210> 58
<211> 20
<212> DNA
<213> An artificial sequence
<400> 58
cacgtccgac ggcggcccac 20
<210> 59
<211> 30
<212> DNA
<213> An artificial sequence
<400> 59
ggtttagttc ctcaccttgt cgtattatac 30
<210> 60
<211> 59
<212> DNA
<213> An artificial sequence
<400> 60
cggcatagta taatacgaca aggtgaggaa ctaaaccatg ggtaaggaaa agactcacg 59
<210> 61
<211> 59
<212> DNA
<213> An artificial sequence
<400> 61
ccgaggcctg ggacccgtgg gccgccgtcg gacgtgttag aaaaactcat cgagcatca 59
<210> 62
<211> 34
<212> DNA
<213> An artificial sequence
<400> 62
tccccgcggt ttttgtagaa atgtcttggt gtcc 34
<210> 63
<211> 59
<212> DNA
<213> An artificial sequence
<400> 63
tgcgtttgag ctcagcgtca tcgaaagaca ttgtgttttg atagttgttc aattgattg 59
<210> 64
<211> 22
<212> DNA
<213> An artificial sequence
<400> 64
atgtctttcg atgacgctga gc 22
<210> 65
<211> 32
<212> DNA
<213> An artificial sequence
<400> 65
gctctagatt aattcgaagc tggagagttt tc 32
<210> 66
<211> 59
<212> DNA
<213> An artificial sequence
<400> 66
tcgtttcgtc ctcacggact catcagaagt agtttgattt gtttaggtaa cttgaactg 59
<210> 67
<211> 96
<212> DNA
<213> An artificial sequence
<400> 67
ctacttctga tgagtccgtg aggacgaaac gagtaagctc gtcaagtagt gaatagacca 60
tcggttttag agctagaaat agcaagttaa aataag 96
<210> 68
<211> 23
<212> DNA
<213> An artificial sequence
<400> 68
ggcgaaactg aagcgaatta tag 23
<210> 69
<211> 25
<212> DNA
<213> An artificial sequence
<400> 69
acttgaagtc ggacagtgag tgtag 25
<210> 70
<211> 33
<212> DNA
<213> An artificial sequence
<400> 70
ttatttagag attttaactt acatttagat tcg 33
<210> 71
<211> 21
<212> DNA
<213> An artificial sequence
<400> 71
gatttcacgc tggtatcctt g 21
<210> 72
<211> 55
<212> DNA
<213> An artificial sequence
<400> 72
caagactaca ctcactgtcc gacttcaagt tttttgtaga aatgtcttgg tgtcc 55
<210> 73
<211> 59
<212> DNA
<213> An artificial sequence
<400> 73
tctaaatgta agttaaaatc tctaaataat ctcacttaat cttctgtact ctgaagagg 59

Claims (10)

1.一种具有高同源重组效率的毕赤酵母菌株,其特征在于,所述菌株包括毕赤酵母基因和过表达PpRAD52基因。
2.根据权利要求1所述的具有高同源重组效率的毕赤酵母菌株,其特征在于,所述过表达PpRAD52基因整合在毕赤酵母AOX1位点或HIS4基因位点。
3.根据权利要求2所述的具有高同源重组效率的毕赤酵母菌株,其特征在于,所述过表达PpRAD52基因以单交换的方式整合到毕赤酵母AOX1位点;
或者所述过表达PpRAD52基因以同源重组方式整合到毕赤酵母HIS4基因位点。
4.根据权利要求1所述的具有高同源重组效率的毕赤酵母菌株,其特征在于,所述菌株敲除了毕赤酵母非同源末端连接关键蛋白KU70/KU80基因中的至少一个;
或者抑制了非同源末端连接关键蛋白KU70/KU80基因中至少一个的表达强度。
5.根据权利要求4所述的具有高同源重组效率的毕赤酵母菌株,其特征在于,所述抑制非同源末端连接关键蛋白KU70/KU80基因表达强度,通过将所述KU70/KU80基因的启动子替换为抑制型启动子实现;
优选地,所述抑制型启动子为毕赤酵母自身来源的MET3基因的启动子PMET3
6.一种毕赤酵母代谢工程改造方法,其特征在于,所述方法至少包括:
采用CRISPR/Cas9系统,对毕赤酵母菌株的基因序列进行无缝敲除或/和多片段体内定点重组;
所述毕赤酵母菌株为权利要求1-5任一项所述的具有高同源重组效率的毕赤酵母菌株中的至少一种。
7.根据权利要求6所述的毕赤酵母代谢工程改造方法,其特征在于,所述CRISPR/Cas9系统的表达载体中包括筛选标记;
所述筛选标记为来Zeocin抗性基因和Geneticin抗性基因中的至少一种。
8.根据权利要求6所述的毕赤酵母代谢工程改造方法,其特征在于,所述无缝敲除的同源臂长度为50~1000bp,且位于敲除基因启动子或终止子区域。
9.根据权利要求8所述的毕赤酵母代谢工程改造方法,其特征在于,所述敲除基因为毕赤酵母菌株的PpSGS1、PpTOP3、PpRMI1或PpMPH1基因。
10.根据权利要求6所述的毕赤酵母代谢工程改造方法,其特征在于,所述多片段体内定点重组的片段整合长度为11013bp,片段数量为3段,且重叠区为重组基因的启动子或终止子区域;
优选地,所述重组基因为过表达PpMUS81-PpMMS4基因或PpSLX1-PpSLX4基因。
CN202011458293.XA 2020-12-10 2020-12-10 一种具有高同源重组效率的毕赤酵母菌株及其应用 Pending CN114621882A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011458293.XA CN114621882A (zh) 2020-12-10 2020-12-10 一种具有高同源重组效率的毕赤酵母菌株及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011458293.XA CN114621882A (zh) 2020-12-10 2020-12-10 一种具有高同源重组效率的毕赤酵母菌株及其应用

Publications (1)

Publication Number Publication Date
CN114621882A true CN114621882A (zh) 2022-06-14

Family

ID=81896177

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011458293.XA Pending CN114621882A (zh) 2020-12-10 2020-12-10 一种具有高同源重组效率的毕赤酵母菌株及其应用

Country Status (1)

Country Link
CN (1) CN114621882A (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060183233A1 (en) * 2004-12-06 2006-08-17 Noda Institute For Scientific Research Transformant having an increased frequency of homologous recombination
US20080138905A1 (en) * 2004-02-27 2008-06-12 Japan Science And Technology Ageny Method of Inducing Homologous Recombination
CN104480083A (zh) * 2014-10-15 2015-04-01 深圳华中科技大学研究院 一种脂肪酶、工程菌及其制备方法
CN109825523A (zh) * 2019-01-07 2019-05-31 广东海纳川生物科技股份有限公司 多拷贝表达载体、表达菌丝霉素的毕赤酵母及其制备方法
CN110079546A (zh) * 2019-05-15 2019-08-02 华东理工大学 一种用于毕赤酵母表达宿主的多基因敲入方法
CN110846239A (zh) * 2019-11-29 2020-02-28 南京工业大学 具有高同源重组效率的重组解脂耶氏酵母菌及其构建方法和应用
KR20200084220A (ko) * 2019-01-02 2020-07-10 중앙대학교 산학협력단 신규 세포벽 분해 변이 효모 균주 및 이를 이용한 글루타치온 생산방법

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080138905A1 (en) * 2004-02-27 2008-06-12 Japan Science And Technology Ageny Method of Inducing Homologous Recombination
US20060183233A1 (en) * 2004-12-06 2006-08-17 Noda Institute For Scientific Research Transformant having an increased frequency of homologous recombination
CN104480083A (zh) * 2014-10-15 2015-04-01 深圳华中科技大学研究院 一种脂肪酶、工程菌及其制备方法
KR20200084220A (ko) * 2019-01-02 2020-07-10 중앙대학교 산학협력단 신규 세포벽 분해 변이 효모 균주 및 이를 이용한 글루타치온 생산방법
CN109825523A (zh) * 2019-01-07 2019-05-31 广东海纳川生物科技股份有限公司 多拷贝表达载体、表达菌丝霉素的毕赤酵母及其制备方法
CN110079546A (zh) * 2019-05-15 2019-08-02 华东理工大学 一种用于毕赤酵母表达宿主的多基因敲入方法
CN110846239A (zh) * 2019-11-29 2020-02-28 南京工业大学 具有高同源重组效率的重组解脂耶氏酵母菌及其构建方法和应用

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
AURÈLE PIAZZA等: "Dynamic Processing of Displacement Loops during Recombinational DNA Repair", 《MOL CELL.》, vol. 73, no. 6 *
SANDRA MUÑOZ-GALVÁN等: "Distinct Roles of Mus81, Yen1, Slx1-Slx4, and Rad1 Nucleases in the Repair of Replication-Born Double-Strand Breaks by Sister Chromatid Exchange", 《MOL CELL BIOL.》, vol. 32, no. 9, pages 1593 *
谷洋等: "毕赤酵母基因编辑技术研究进展", 《微生物学通报》, vol. 47, no. 2, pages 1 - 3 *

Similar Documents

Publication Publication Date Title
AU2015292421A1 (en) Promoters derived from Yarrowia lipolytica and Arxula adeninivorans, and methods of use thereof
EP3008181B1 (en) Methods and compositions for target dna modification
US20170088845A1 (en) Vectors and methods for fungal genome engineering by crispr-cas9
KR20170087521A (ko) 진균 게놈 변형 시스템 및 사용 방법
WO2016183163A1 (en) Expression constructs and methods of genetically engineering methylotrophic yeast
Nett et al. Cloning and disruption of the PpURA5 gene and construction of a set of integration vectors for the stable genetic modification of Pichia pastoris
Swietalski et al. Secretion of a low and high molecular weight β-glycosidase by Yarrowia lipolytica
US20220145313A1 (en) Targeting Nuclear-Encoded Recombinant Proteins to the Chloroplast in Microalgae
Havukainen et al. Functional characterization of a highly specific L-arabinose transporter from Trichoderma reesei
CN102676563B (zh) 一种制备人血清白蛋白-人甲状旁腺激素的方法
CN110042068B (zh) 一种改造信号肽提高肠激酶分泌表达量的方法
CN114621882A (zh) 一种具有高同源重组效率的毕赤酵母菌株及其应用
EP3810779A1 (en) Genetic selection markers based on enzymatic activities of the pyrimidine salvage pathway
US11788095B2 (en) Synthetic promoter based on gene from acid-resistant yeast
CN108473972B (zh) 补身醇合酶iii
AU2016329244A1 (en) Novel episomal plasmid vectors
CN107523568B (zh) 毕赤酵母的一种组成型启动子及其应用
ES2948239T3 (es) Promotor quimérico para su uso en ingeniería metabólica
CN111269930A (zh) 一种检测丝状真菌转化体系遗传稳定性的方法
WO2006024972A2 (en) Malate synthase regulatory sequences for heterologous gene expression in pichia
LU101172B1 (en) Method for in vivo screening of engineered enzyme variants
CN116555269B (zh) 熊蜂生假丝酵母诱导型启动子及其应用
CN113278645B (zh) 一种增强链霉菌基因组编辑效率的方法及其应用
Isakova et al. The engineering of a Yarrowia lipolytica yeast strain capable of homologous recombination of the mitochondrial genome
CN108070597B (zh) 一种杨树nac基因启动子及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination