CN107299114B - 一种高效的酵母菌染色体融合方法 - Google Patents

一种高效的酵母菌染色体融合方法 Download PDF

Info

Publication number
CN107299114B
CN107299114B CN201710729662.6A CN201710729662A CN107299114B CN 107299114 B CN107299114 B CN 107299114B CN 201710729662 A CN201710729662 A CN 201710729662A CN 107299114 B CN107299114 B CN 107299114B
Authority
CN
China
Prior art keywords
chromosome
centromere
yeast
sequence
chromosomes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710729662.6A
Other languages
English (en)
Other versions
CN107299114A (zh
Inventor
覃重军
邵洋洋
薛小莉
鲁宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Center for Excellence in Molecular Plant Sciences of CAS
Original Assignee
Center for Excellence in Molecular Plant Sciences of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Center for Excellence in Molecular Plant Sciences of CAS filed Critical Center for Excellence in Molecular Plant Sciences of CAS
Priority to CN201710729662.6A priority Critical patent/CN107299114B/zh
Publication of CN107299114A publication Critical patent/CN107299114A/zh
Application granted granted Critical
Publication of CN107299114B publication Critical patent/CN107299114B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/905Stable introduction of foreign DNA into chromosome using homologous recombination in yeast
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid

Abstract

本发明涉及一种高效的酵母菌染色体融合方法。本发明公开了一种利用CRISPR/Cas9系统和酵母体内同源重组系统,进行酵母染色体融合的方法。本发明的方法可实现快速、高效的染色体融合。

Description

一种高效的酵母菌染色体融合方法
技术领域
本发明涉及微生物合成生物学、基因组工程和分子生物学领域,具体涉及一种高效的酵母菌染色体融合方法。
背景技术
研究表明,酵母可以作为珍稀药物前体青蒿酸、紫杉烯、氢化可的松和新能源丁醇的异源表达宿主。还因其高效的同源重组能力,可以作为DNA大片段克隆及其他微生物基因组组装和改造的宿主菌,特别是对于实验室条件下难培养、缺乏有效遗传操作手段的菌株。
酿酒酵母(Saccharomyces cerevisiae)是基础研究最透彻、工业应用最广泛的模式生物之一。然而,酿酒酵母天然有16条线性染色体,大小在230kbp到1530kbp,造成了在酵母体内克隆的超过200kbp的大片段DNA难以和染色体进行分离。这一缺陷限制了酿酒酵母作为异源基因表达和大片段DNA克隆、基因组改造宿主的应用。
因此,本领域有必要发展快速高效的染色体融合新技术来构建新的基因组简约化且遗传稳定的酿酒酵母宿主菌。
发明内容
本发明的目的在于提供一种高效的酵母菌染色体融合方法。
在本发明的第一方面,提供一种对酵母的染色体A和染色体B进行融合的方法,其特征在于,所述方法包括:
将着丝粒敲除组件、染色体融合组件、sgRNA靶向切割组件引入到表达Cas9蛋白的酵母中,从而获得染色体A和染色体B发生融合的酵母;
其中,
所述着丝粒敲除组件用于敲除两条染色体(选自染色体A和染色体B)之一的着丝粒,其含有该着丝粒两侧同源序列和筛选标记(较佳地,筛选标记位于两条同源序列之间);
所述染色体融合组件用于在两条染色体两个端粒附近发生双交换,删除端粒且介导染色体融合,其含有染色体A近端粒区的同源序列、染色体B近端粒区的同源序列和筛选标记(较佳地,筛选标记位于两条同源序列之间);
所述sgRNA靶向切割组件含有能在要删除的着丝粒和两个端粒序列附近进行切割的sgRNA。
在一个优选例中,所述的Cas9表达组件是表达载体,其中以酵母强启动子驱动cas9基因的表达;较佳地,所述的强启动子为Tef1启动子。
在另一优选例中,所述的Cas9表达组件是表达载体,其在酵母中为单拷贝复制、在大肠杆菌中为高拷贝复制;较佳地,所述的表达载体的载体复制区来源于CEN6 ARS4;较佳地,所述的表达载体以LEU2作为筛选标记;较佳地,所述的表达载体的载体复制起始位点为pBR322 origin(来源于pBR322)。
在另一优选例中,所述的Cas9表达组件的骨架载体具有SEQ ID NO:1所示的核酸序列。
在另一优选例中,所述sgRNA靶向切割组件是能在酵母中组成型表达sgRNA的表达载体;较佳地,其以酵母强启动子驱动sgRNA的表达;较佳地,所述的强启动子为SNR52。
在另一优选例中,所述sgRNA靶向切割组件是能在酵母中组成型表达sgRNA的表达载体,其在酵母中为单拷贝复制、在大肠杆菌中为高拷贝复制;较佳地,所述的表达载体的载体复制区为2micron2 origi(来源于2μm质粒);较佳地,所述的表达载体以HIS3作为酵母表达的筛选标记;以氨苄青霉素抗性基因作为大肠杆菌表达的筛选标记;较佳地,所述的表达载体的载体复制起始位点为pBR322 origin(来源于pBR322)。
在另一优选例中,所述的sgRNA靶向切割组件的骨架载体具有SEQ ID NO:2所示的核酸序列。
在另一优选例中,在着丝粒敲除组件中,设置一段正向重复序列,其设置于该组件中所述同源序列与筛选标记之间;其序列为染色体上紧挨该着丝粒一侧同源序列的序列;较佳地,该正向重复序列的长度为50~500bp(例如,100~300bp;更佳地如150bp,180bp,200bp,250bp)。
在另一优选例中,所述染色体融合组件中,设置一段正向重复序列,设置于该组件中所述同源序列与筛选标记之间;其序列为紧挨着其中一条染色体近端粒区同源序列的序列;较佳地,该正向重复序列的长度为50~500bp(例如,100~300bp;更佳地如150bp,180bp,200bp,250bp)。
在另一优选例中,通过酵母原生质体转化方法将着丝粒敲除组件、染色体融合组件、sgRNA靶向切割组件、Cas9表达组件引入到酵母中。
在另一优选例中,将酿酒酵母的染色体ChrVI和ChrI进行融合,其中,所述着丝粒敲除组件用于敲除ChrVI着丝粒,并且,所述的着丝粒两侧同源序列分别为左同源臂ChrVI:148410-148459、右同源臂ChrVI:148725-148774,所述正向重复序列为ChrVI:148775-149002;所述染色体融合组件中,两条染色体的近端粒区的同源序列分别为ChrVI:269212-269615和ChrI:2893-3294,所述正向重复序列为ChrI:3295-3519;所述sgRNA靶向切割组件含有SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5(对应于Target1~3)所示核苷酸序列的sgRNA。
在另一优选例中,将酿酒酵母的染色体ChrIX和ChrII进行融合,其中,所述着丝粒敲除组件用于敲除ChrIX着丝粒,并且,所述的着丝粒两侧同源序列分别为左同源臂ChrIX:355547-355606、右同源臂ChrIX:355840-355891,所述正向重复序列为ChrIX:355892-356106;所述染色体融合组件中,以ChrIX:435934-436360和ChrII:8680-9089分别作为两条染色体的近端粒区的同源序列,所述正向重复序列为ChrII:9090-9359;所述sgRNA靶向切割组件含有SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8(对应于Target4~6)所示核苷酸序列的sgRNA。
在另一优选例中,采用所述方法对酵母的染色体A和染色体B进行融合的同时,还包括:在同一体系中,采用所述方法将染色体A和染色体B的融合染色体与其它一个或多个染色体(如染色体C)进行融合。
在另一优选例中,在同一体系中,将酿酒酵母的染色体ChrVI,ChrI和ChrII进行融合,其中,一个着丝粒敲除组件用于敲除ChrVI着丝粒,并且,所述的着丝粒两侧同源序列分别为左同源臂ChrVI:148410-148459、右同源臂ChrVI:148725-148774,所述正向重复序列为ChrVI:148775-149002;另一着丝粒敲除组件用于敲除ChrII着丝粒,并且,所述的着丝粒两侧同源序列分别为左同源臂ChrII:237974-238026、右同源臂ChrII:238390-238439,所述正向重复序列为ChrII:238440-238652;一个染色体融合组件针对ChrVI和ChrI的融合,其中,两条染色体的近端粒区的同源序列分别为ChrVI:269212-269615和ChrI:2893-3294,所述正向重复序列为ChrI:3295-3519;另一染色体融合组件针对ChrI和ChrII的融合,其中,两条染色体的近端粒区的同源序列分别为ChrI:202775-203182和ChrII:8680-9089,所述正向重复序列为ChrII:9090-9359;所述sgRNA靶向切割组件含有SEQ ID NO:3、SEQ IDNO:4、SEQ ID NO:5、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11所示核苷酸序列的sgRNA。
在另一优选例中,采用所述方法对酵母的染色体A和染色体B进行融合的同时,还包括:在同一体系中,采用同样的方法对其它的一组或多组染色体(如染色体A’和B’)进行融合。
在另一优选例中,在同一体系中,将酿酒酵母的染色体ChrVI和ChrI融合,同时将ChrIX和ChrII融合。
在另一优选例中,与其它染色体进行融合时,融合的染色体仅保留一个着丝粒。
在另一优选例中,表达Cas9蛋白的酵母通过在酵母细胞中引入表达Cas9的表达载体建立。
在本发明的另一方面,提供所述方法的应用,应用于:
(a)将酵母中两条染色体融合为一条融合染色体;
(b)将酵母中两条以上的染色体融合为一条融合染色体;较佳地,该种融合在一个转化子系统中进行;
(c)将酵母中多条染色体进行两两融合;或
(d)将酵母中多条染色体进行随机组合的融合。
在本发明的另一方面,提供一种用于对酵母的染色体进行融合的Cas9表达组件,其是表达载体,其在酵母中为单拷贝复制、在大肠杆菌中为高拷贝复制,其中含有:
酵母强启动子以及由该启动子驱动表达的cas9基因;较佳地,所述的强启动子为Tef1启动子;
来源于CEN6 ARS4的载体复制区;
筛选标记LEU2;
复制起始位点pBR322 origin。
在另一优选例中,所述的Cas9表达组件的骨架载体具有SEQ ID NO:1所示的核酸序列。
在本发明的另一方面,提供一种用于对酵母的染色体进行融合的sgRNA靶向切割组件,其是能在酵母中组成型表达sgRNA的表达载体,其中含有:
酵母强启动子(一个或多个)以及由该启动子驱动表达的sgRNA(一个或多个);较佳地,所述的强启动子为SNR52;
载体复制区2micron2 origi;
酵母筛选标记HIS3;
大肠甘菊筛选标记氨苄青霉素抗性基因;
复制起始位点为pBR322 origin。
本发明的其它方面由于本文的公开内容,对本领域的技术人员而言是显而易见的。
附图说明
图1、CRISPR/Cas9介导的染色体融合方法原理图。
图2、Cas9表达质粒pleucas9示意图。
图3、sgRNA表达质粒psgRNA示意图。
图4、ChrVI,ChrI融合脉冲电泳验证。脉冲条件:1%的琼脂糖凝胶,0.5*TBE缓冲液,12.5℃,转换角度120°,电压6V/cm,先60s转换时间电泳22小时,再90s转换时间电泳12小时。
图5、ChrIX,ChrII融合脉冲电泳验证。脉冲条件:1%的琼脂糖凝胶,0.5*TBE缓冲液,12.5℃,转换角度120°,电压6V/cm,先60s转换时间电泳22小时,再90s转换时间电泳12小时。
图6、ChrVI,ChrI,ChrII融合脉冲电泳验证。脉冲条件:1%的琼脂糖凝胶,0.5*TBE缓冲液,12.5℃,转换角度120°,电压6V/cm,先60s转换时间电泳22小时,再90s转换时间电泳12小时。
图7、ChrVI,ChrI和ChrIX,ChrII同时融合脉冲电泳验证。脉冲条件:1%的琼脂糖凝胶,0.5*TBE缓冲液,12.5℃,转换角度120°,电压6V/cm,先60s转换时间电泳22小时,再90s转换时间电泳12小时。
具体实施方式
本发明人经过深入的研究,开发了一种利用CRISPR/Cas9系统和酵母体内同源重组系统,进行酵母染色体融合的方法。本发明的方法可实现快速、高效的染色体融合。
术语
本发明中,所述的“核酸”可以指DNA或RNA。本文所用的术语“核酸序列”可以指DNA或RNA的序列。核酸序列可为环形。DNA包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。例如,编码区序列可以是SEQ ID NO:1所示的编码序列的简并变异体。此处所用的“简并变异体”指与参比核酸编码相同氨基酸序列、但核酸序列不同于参比核酸的核酸变异体。
本发明中,所述的“载体”和“表达载体”可互换使用,指本领域熟知的细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒如腺病毒、逆转录病毒或其他载体。这些载体能够在宿主体内复制和稳定。这些载体的一个重要特征是通常含有复制起点、启动子、标记基因和翻译控制元件。
本发明中,所述的“着丝粒敲除组件”是指含有一系列元件的核酸,其用于在进行染色体融合时,敲除多余的着丝粒,使得融合后的染色体仅含有一个着丝粒。所述的“着丝粒敲除组件”含有待敲除着丝粒的两侧同源序列(同源臂)和筛选标记。所述的“着丝粒敲除组件”还含有必要的“调控元件”,从而可以被引入细胞内以及在细胞内复制、表达。
本发明中,所述的“染色体融合组件”是指含有一系列元件的核酸,其用于待融合的染色体在合适的部位(通常位于端粒区)被识别和切割后,使得待融合的染色体发生融合;所述的“染色体融合组件”含有待融合的染色体的近端粒区的同源序列和筛选标记。所述的“染色体融合组件”还含有必要的“调控元件”,从而可以被引入细胞内以及在细胞内复制、表达。
本发明中,所述的“sgRNA靶向切割组件”是指用于在细胞内生成靶向特定位点的sgRNA的核酸,其产生的sgRNA能在着丝粒两个同源序列间和近端粒区的两个同源序列处进行切割,配合“着丝粒敲除组件”、“染色体融合组件”实现染色体的融合。所述的“sgRNA靶向切割组件”还含有必要的“调控元件”,从而可以被引入细胞内以及在细胞内复制、表达。
本发明中,所述的“调控元件”可包括启动子、增强子、响应元件、信号肽、内部核糖体进入序列、聚腺苷酸信号、终止子、或调控核酸表达(如转录或翻译)的可诱导元件。
本文所用术语“基因组”指包含在一个生物体的DNA(部分病毒是RNA)中的全部遗传信息。基因组包括基因和非编码DNA。一般地,一个生物体的基因组是指一套染色体中的完整的DNA序列。例如,生物个体体细胞中的二倍体由两套染色体组成,其中一套DNA序列就是一个基因组。基因组一词可特指核DNA(例如,核基因组),也可用于包含自身DNA序列的细胞器基因组,如粒线体基因组或叶绿体基因组。
本文所述“敲除”或“删除”指将目标基因从基因组中删除的技术。
本文所用术语“骨架载体”或“骨架质粒”指载体中除目标片段以外的部分。
如本文所用,术语“包含”、“包括”和其等同形式包括“含有”以及“由……组成”的含义,例如“包含”X的组合物可仅由X组成或可含有其它物质,例如X+Y。
融合原理
本发明提供了一种利用CRISPR/Cas9系统在酵母中高效融合染色体的方法,该方法的原理及流程如图1。通过酵母原生质体转化技术,将含有着丝粒两侧同源序列和筛选标记的组件、参与融合的染色体两个近端粒区的同源序列和筛选标记的组件以及能在着丝粒两个同源序列间和近端粒区的两个同源序列处发生切割的sgRNA质粒一次转化到酵母细胞内。染色体在着丝粒和端粒附近被切割后,含有染色体上同源序列的着丝粒敲除组件和染色体融合组件通过酵母体内的同源重组整合到染色体上,通过sgRNA载体,Cas9载体和着丝粒组件、染色体融合组件上的标记筛选出需要的转化子。
以往的染色体操作,往往受限于近端粒区有大段重复序列的染色体,而本发明人的方法可以实现任意染色体的融合;可以融合3条染色体为一条、4条染色体为两条;可以实现无痕融合,即染色体上不残留筛选标记;本发明的方法快速,简便,可应用于其他具有高效重组系统的真核生物,实施染色体工程改造。
融合方法
本发明提供了一种对酵母的染色体A和染色体B进行融合的方法,所述方法包括:将着丝粒敲除组件、染色体融合组件、sgRNA靶向切割组件、Cas9表达组件引入到酵母中,从而获得染色体A和染色体B发生融合的酵母。
所述着丝粒敲除组件用于敲除两条染色体之一的着丝粒,其含有该着丝粒两侧同源序列和筛选标记。当靶向性的sgRNA在着丝粒的一侧进行切割后,所述的着丝粒敲除组件通过同源交换,整合到染色体上。为了筛选发生交换的细胞,通常需要在着丝粒敲除组件中加上筛选标记。根据需要,所述的筛选标记可以是抗性基因,或者也可以是一段易于被识别的核酸片段。作为本发明的优选方式,在着丝粒敲除组件中,设置一段正向重复序列,其设置于该组件中所述同源序列与筛选标记之间;其序列为染色体上紧挨该着丝粒一侧同源序列的序列,设置该正向重复序列,有利于将来在该区段进行进一步重组操作以消除筛选标记,获得无痕融合的染色体。
所述染色体融合组件在两条染色体端粒附近发生双交换,删除端粒同时介导染色体融合,含有染色体A近端粒区的同源序列、染色体B近端粒区的同源序列和筛选标记。当靶向性的sgRNA在要删除的两个端粒附近进行切割后,所述的染色体融合组件通过同源交换,整合到染色体,将两条染色体连接在一起。为了筛选发生染色体融合的细胞,通常需要在着丝粒敲除组件中加上筛选标记。作为本发明的优选方式,所述染色体融合组件中,设置一段正向重复序列,设置于该组件中所述同源序列与筛选标记之间;其序列为紧挨着其中一条染色体近端粒区同源序列的序列。
所述sgRNA靶向切割组件含有能在着丝粒两个同源序列间和近端粒区的两个同源序列处进行切割的sgRNA。可将多个sgRNA串联在一个质粒中进行表达,以简化操作。
作为本发明的优选方式,所述sgRNA靶向切割组件是能在酵母中组成型表达sgRNA的表达载体;所述sgRNA靶向切割组件是能在酵母中组成型表达sgRNA的表达载体,其在酵母中为单拷贝复制、在大肠杆菌中为高拷贝复制。较佳地,其以酵母强启动子驱动sgRNA的表达;更佳地,所述的强启动子为SNR52。更优选地,所述的表达载体的载体复制区为2micron2 origi(来源于2μm质粒),以HIS3作为酵母表达的筛选标记;以氨苄青霉素抗性基因作为大肠杆菌表达的筛选标记,以pBR322 origin(来源于pBR322)载体复制起始位点。
作为本发明的优选方式,所述的Cas9表达组件是表达载体,其中以酵母强启动子驱动cas9基因的表达。例如,所述的强启动子可以为Tef1启动子。所述的Cas9表达组件在酵母中为单拷贝复制、在大肠杆菌中为高拷贝复制;更优选地,所述的表达载体的载体复制区来源于CEN6ARS4,以LEU2作为筛选标记,以pBR322 origin(来源于pBR322)作为复制起始位点。进一步优选地,所述的Cas9表达组件的骨架载体具有SEQ ID NO:1所示的核酸序列。所述的Cas9表达组件能够高效地驱动cas9基因的表达,实现有效的基因编辑。
利用本发明,可以直接将酵母的两条染色体融合为一条。例如,本发明的实施例中,将酿酒酵母染色体ChrVI,270kbp和ChrI,230kbp融合得到ChrVI-I,503kbp;将染色体ChrIX,440kbp和ChrII,810kbp融合得到ChrIX-II,1247kbp)。
利用本发明,可以在一次操作体系中将酵母的三条染色体融合为一条。例如,本发明的实施例中,将酿酒酵母的染色体ChrVI,270kbp、ChrI,230kbp和ChrII,810kbp融合得到ChrVI-I-II,1283kbp。
利用本发明,可以在一次操作体系中将酵母的两组两条染色体进行融合。例如,本发明的实施例中,将酿酒酵母的染色体ChrVI,270kbp和ChrI,230kbp融合得到ChrVI-I,503kbp;同时将ChrIX,440kbp和ChrII,810kbp融合得到ChrIX-II,1247kbp。
与常规的方法相比较,本发明可以融合任意两条染色体,包括在近端粒区有大段其他染色体高度相似序列的染色体。在融合两条染色体时,省去了先引入失活着丝粒组件再转入染色体融合组件同时诱导着丝粒失活等繁琐操作,比传统方法更快速、高效。并且,本发明的方法还可以一次融合三条染色体、一次融合两组两条染色体。与传统方法相比,不仅可以自由选择融合的染色体,操作步骤更加简便、大大缩短了实验时间,还可一次融合更多数目的染色体,极为显著地提高了染色体融合的效率。
利用本方法可以逐步将酿酒酵母的16条染色体人工融合成1条,构建基因组更简约的异源表达宿主和DNA组装“工厂”。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如J.萨姆布鲁克等编著,分子克隆实验指南,第三版,科学出版社,2002中所述的条件,或按照制造厂商所建议的条件。
sgRNA识别序列
实施例中所用的sgRNA识别序列如表1所示。
表1、sgRNA识别序列
名称 20bp序列 PAM位点
Target1识别位点(S1) TCGAACGTGATCCTAACGAG(SEQID NO:3) TGG
Target2识别位点(S2) ACACACGTTTACGATGATAT(SEQID NO:4) TGG
Target3识别位点(S3) ACGGCTAACTGAACCTAAGT(SEQID NO:5) AGG
Target4识别位点(S4) AAGGAGACAAATTCAGCGAG(SEQID NO:6) TGG
Target5识别位点(S5) TTTCACGAATACGAGATACA(SEQID NO:7) GGG
Target6识别位点(S6) AGCGTAGTTAACCCCTCTGC(SEQID NO:8) AGG
Target7识别位点(S7) CTGGTAAAGAGCTCTGCAGC(SEQID NO:9) AGG
Target8识别位点(S8) AGCGTAGTTAACCCCTCTGC(SEQID NO:10) AGG
Target9识别位点(S9) TAGGATACAAGTGTCTGTGC(SEQID NO:11) AGG
Cas9表达载体的构建
Cas9表达载体的质粒图谱见图2。Cas9表达载体的序列见SEQ ID NO:1。
构建在大肠杆菌中为高拷贝复制(复制起始位点来源于pBR322,筛选标记为氨苄青霉素(Ampicillin)抗性基因)、在酵母中单拷贝复制(载体复制区来源于CEN6ARS4,筛选标记LEU2)且能组成型表达Cas9的质粒pleucas9。PCR扩增LEU2标记(以酿酒酵母S.cerevisiae S288c基因组为模板),通过正反向引物的5’端带上质粒pMetcas9上筛选标记MET14(Zhou,J.,et al.,Nucleic Acids Res,2016.44(14):p.e124)两侧50bp的同源序列,PCR产物纯化后和pMetcas9一起转入酵母,在亮氨酸单缺培养基上筛选,经PCR及测序验证正确后转化大肠杆菌DH10B,抽取质粒备用。
sgRNA表达载体构建
sgRNA表达载体的质粒图谱见图3。
构建在大肠杆菌中为高拷贝复制(复制起始位点来源于pBR322,筛选标记为氨苄青霉素抗性基因)、在酵母中多拷贝复制(载体复制区来源于2μm,筛选标记HIS3)且能组成型表达sgRNA的质粒pHISgRNA。sgRNA包括SNR52启动子、handle Cas9序列、20bp切割位点。ChrVI和ChrI融合获得ChrVI-I需要Target1,2,3三个切割位点,分别位于ChrVI的着丝粒、右端粒和ChrI的左端粒附近。ChrIX和ChrII融合获得ChrIX-II需要Target4,5,6三个切割位点,分别位于ChrIX的着丝粒、右端粒和ChrII的左端粒附近。
sgRNA载体的构建首先以p426-SNR52p-gRNA.Y-SUP4t(Agren,R.等,J IndMicrobiol Biotechnol,2013.40(7):p.735-47)为模板,PCR切割位点gRNA.Y以外的上下游序列。通过引物带上20bp切割位点、上下游40bp重复序列和酶切位点,经融合PCR将gRNA的两部分融合到一起获得400bp完整的gRNA。Target1,4的PCR产物用EcoRI、BamHI酶切,Target2,5的PCR产物用BamHI、NcoI酶切,Target3,6的PCR产物用NcoI、NotI酶切,酶切好的Target1,2,3和Target4,5,6连到EcoRI、NotI酶切的载体pHISgRNA((由质粒p426-SNR52p-gRNA.Y-SUP4t质粒改造,将URA3筛选标记改为HIS3筛选标记)上。转化大肠杆菌后抽质粒测序备用。ChrVI,ChrI和ChrII融合获得ChrVI-I-II需要Target1,2,3,7,8,9六个切割位点,分别位于ChrVI着丝粒、右端粒,ChrI左端粒、右端粒和ChrII着丝粒、左端粒附近。一次融合ChrVI,ChrI和ChrIX,ChrII两组两条染色体获得ChrVI-I、ChrIX-II,需要Target1,2,3,4,5,6六个切割位点。sgRNA载体的构建首先以p426-SNR52p-gRNA.Y-SUP4t为模板,PCR切割位点gRNA.Y以外的上下游序列。分别通过引物带上20bp切割位点、上下游40bp重复序列和Golden-Gate克隆所需的四个碱基,通过融合PCR获得的400bp gRNA片段。将400bp gRNA片段克隆到pUC57(筛选标记为氨苄青霉素(Ampicillin)抗性基因)上,测序正确后Target1,2,3gRNA通过BsaI酶切和T4连接酶连接作用(Golden-Gate)克隆到线性化载体pHX31(筛选标记为阿普拉霉素(Apramycin)抗性基因,含酶切位点EcoRI、BamHI和Golden-Gate克隆所需的四个碱基)上。Target4,5,6和Target7,8,9gRNA通过BsaI酶切和T4连接酶连接作用(Golden-Gate)克隆到线性化载体pHX31(筛选标记为阿普拉霉素(Apramycin)抗性基因,含酶切位点BamHI、NotI和Golden-Gate克隆所需的四个碱基)上。之后用EcoRI、BamHI酶切获得Target123,BamHI、NotI酶切获得Target456,再将酶切片段Target123和Target456连接到EcoRI、NotI酶切的pHISgRNA上获得一次融合ChrVI,ChrI和ChrIX,ChrII两组两条染色体需要的sgRNA;EcoRI、BamHI酶切Target123和BamHI、NotI酶切的Target789连接到EcoRI、NotI酶切的pHISgRNA上获得一次融合ChrVI,ChrI和ChrII三条染色体需要的sgRNA载体。
质粒pgRNA1-3含有启动子SNR52使sgRNA Target1、Target2和Target3可在酵母中组成型表达(在一次融合三条染色体和两组两条染色体实验中质粒psgRNA含有启动子SNR52使6个Target位点可在酵母中组成型表达)。该质粒含酵母复制区(来源于2μorigin)和筛选标记(HIS3),在酵母中为多拷贝复制;同时含大肠杆菌复制区(来源于pBR322)和筛选标记氨苄青霉素(Ampicillin),在大肠杆菌中为高拷贝复制。序列见SEG ID NO:2。
质粒pgRNA4-6含有启动子SNR52使sgRNA Target4、Target5和Target6可在酵母中组成型表达。
着丝粒敲除组件的构建
以BY4742基因组为模板选取着丝粒左右两侧50bp序列作为敲除组件的左右同源臂,着丝粒一侧200bp序列作为打靶组件上的正向重复序列(以便日后该序列处发生重组消除筛选标记,获得无痕融合的染色体)。以S288C基因组为模板PCR URA3基因作为筛选标记。将50bp同源臂序列带在引物上,分别PCR正向重复序列和筛选标记,经融合PCR获得着丝粒敲除组件。
染色体融合组件的构建
以BY4742基因组为模板PCR一条染色体右端粒左侧、另一条染色体左端粒右侧的400bp序列作为染色体融合组件的同源臂,PCR一个端粒附近200bp序列作为融合组件上的正向重复序列(以便日后在该序列处发生重组消除筛选标记,获得无痕融合的染色体)。以S288C基因组为模板PCR LYS2基因作为筛选标记。四个片段间通过引物带上40bp同源序列,经融合PCR获得染色体融合组件。
原生质体转化
将1μg的pgRNA载体、1μg着丝粒敲除组件、1μg染色体融合组件用原生质体转化的方法转入酵母,在pgRNA和Cas9的共同作用下,在着丝粒、左/右端粒处发生切割。通过酵母体内高效的同源重组系统,含有酵母染色体上同源序列的着丝粒敲除组件和染色体融合组件双交换到染色体上。通过共同筛选pcas9、pgRNA、着丝粒敲除组件和染色体融合组件所带的营养缺陷标记,得到需要的转化重组子。阳性克隆经PCR、测序以及脉冲场凝胶电泳验证。
酵母原生质体制备和转化的具体方法参考Kouprina,N等,Nat Protoc,2008.3(3):p.371-7,在此基础上本发明人做了改进,从而有效提高转化效率,其步骤为:
1.BY4742/pleucas9在SC-leu平板上划线,30℃培养2天;
2.接单克隆到4mL SC-leu液体培养基中,30℃培养过夜;
3.将过夜培养的菌液转接到含50mL SC-leu液体培养基摇瓶中,调起始ODλ=600nm=0.1;
4.240rpm,30℃培养至终ODλ=600nm=1.0;
5.将菌液转移到50mL无菌离心管中,5℃,1000g离心5分钟收菌;
6.弃上清,加30mL无菌水重悬菌体,5℃,3000g离心5分钟收菌;
7.弃上清,加20mL 1M山梨醇溶液重悬菌体,5℃,3000g离心5分钟收菌;
8.弃上清,加20mL SPE溶液重悬菌体,再加入20μL裂解酶融合和40μL巯基乙醇,混匀后30℃水浴锅中孵育20分钟;
9.5℃,570g离心5分钟收集原生质体;
10.弃上清,用50mL 1M山梨醇溶液轻柔混匀、重悬原生质体,570g离心10分钟收集原生质体;
11.弃上清,加50mL1M山梨醇溶液重复洗涤一次;
12.加1.2mL STC溶液轻柔重悬原生质体;
13.取200μL原生质体重悬液与1μg Target123-pHISgRNA、1μg着丝粒敲除组件、1μg染色体融合组件(事先混匀,总体积约20μL)混匀;
14.再加入800μL PEG8000,,轻柔倒转混匀,室温放置10分钟;
15.5℃,500g离心5分钟收集原生质体;
16.弃上清,加800μL SOS重悬,30℃水浴锅中孵育1小时;
17.将原生质体转移到SC-leu-his-ura-lys选择培养基中(50℃平衡好),轻柔颠倒混匀后快速倒到SC-leu-his-ura-lys平板上;
18.30℃培养3-4天直至所有的转化子清晰可见;
挑取4个转化子通过菌落PCR进行初步验证。菌落PCR具体步骤:1)引物设计,在着丝粒敲除组件同源臂外侧设计验证引物,如果着丝粒敲除成功,验证引物PCR出2kbp左右条带,如果不成功,验证引物PCR出1kbp左右条带;在染色体发生融合的位置设计外部验证引物和内部验证引物,在筛选标记LYS2内部设计引物,如果染色体融合成功,由外部验证引物和LYS2内部引物PCR出1.5/1.0kbp条带,如果不成功,由染色体上的外部验证引物和内部验证引物PCR出0.7kbp条带。2)PCR,挑取酵母转化子悬于15μL无菌水中,混匀后取1uL为模板,用KOD-FX酶进行PCR验证,PCR扩增条件为:94℃预变性4min;98℃变性10s,50℃退火30s,68℃延伸3min,35个循环。进行了两次试验,其中ChrVI和ChrI融合转化子数分别是150,634,菌落PCR验证阳性率分别是4/4,4/4。其中ChrIX和ChrII融合转化子数分别是672,832,菌落PCR验证阳性率分别是4/4,4/4。
挑选两个PCR验证正确并测序正确的酵母准备制作胶块,进行脉冲场凝胶电泳检测。基本步骤为:
1.从平板上挑取单克隆接YPAD培养基,30℃,240rpm过夜培养;
2.把试管内过夜培养的酵母转接到50mL YPAD培养基中,起始ODλ=600nm=0.1;
3.30℃,240rpm培养至ODλ=600nm=1.0时20℃,5,000rpm离心5分钟收菌;
4.50mL ddH2O重悬酵母,20℃,5,000rpm离心5分钟收菌;
5.10mL pH8.0,10mM EDTA重悬酵母,20℃,5,000rpm离心5分钟收菌;
6.750μL pH7.2,10mM的Tris.HCl重悬,转到1.5mL EP管中,20℃,5,000rpm离心5分钟收菌;
7.150μL pH7.2,10mM的Tris.HCl重悬,放到50℃水浴锅中平衡;
8.加入150μL Zymolyse-20T溶液(20mg/mL zymolyse-20T,50%甘油,2.5%葡萄糖,50mM pH8.0Tris.HCl)和225μL 2%的TE25S溶解的低熔点琼脂糖(事先配好,在50℃水浴锅中平衡),混匀后倒入模具,冰箱4℃冷却;
9.30分钟后取出胶块,加入5mL lyticase buffer(pH7.5,10mM的Tris.HCl和pH8.0,50mM EDTA)和500μL Zymolyse-20T,37℃孵育3小时;
10.25mL ddH2O洗一次胶块,然后用wash buffer(pH7.5,20mM的Tris.HCl和pH8.0,50mM EDTA)洗涤一次;
11.每1mL胶块加入5mL蛋白酶反应液(pH8.0,100mM EDTA,0.2%sodiumdeoxycholate,1%sodium laurylsarcosine,1mg/mL的蛋白酶K)50℃消化36小时;
12.50mL wash buffer洗涤胶块4次,于室温下轻柔震荡,每次30-60分钟。
13.使用Bio-Rad CHEFDRII仪器,用1%的琼脂糖凝胶在0.5*TBE缓冲液中12.5℃条件下进行分离。转换角度设置为120°,电压设置为6V/cm,先60s转换时间电泳22小时,再90s转换时间电泳12小时。
实施例1、两条染色体融合
以酿酒酵母BY4742为出发菌株,选取ChrVI(270kbp)和ChrI(230kbp)、ChrIX(440kbp)和ChrII(813kbp)进行融合(表2)。
表2、两条染色体融合信息
Figure BDA0001386816750000151
将Cas9表达质粒pleucas9转入BY4742酵母细胞中获得菌株BY4742/pleucas9。质粒pleucas9含有启动子Tef1使Cas9可在酵母中组成型表达。该质粒含酵母复制区(CEN6ARS4)和筛选标记(LEU2),在酵母中为单拷贝复制;同时含大肠杆菌复制区(来源于pBR322)和筛选标记氨苄青霉素(Ampicillin),在大肠杆菌中为高拷贝复制。
ChrVI,ChrI融合时,敲除ChrVI着丝粒,选取ChrVI上148410-148459bp、148725-148774bp、148775-149002bp作为着丝粒敲除的左同源臂、右同源臂、正向重复序列(DR1),269212-269615bp作为染色体融合组件的左同源臂。ChrI上2893-3294bp、3295-3519bp作为染色体融合组件的右同源臂和正向重复序列(DR2)。将pgRNA1-3、ChrVI着丝粒敲除组件(筛选标记URA3)和ChrVI-I融合组件(筛选标记LYS2)转化BY4742/pleucas9原生质体。
ChrIX,ChrII融合时,敲除ChrIX着丝粒,选取ChrIX上355547-355606bp、355840-355891bp、355892-356106bp作为着丝粒敲除的左同源臂、右同源臂、正向重复序列,435934-436360bp作为染色体融合组件的左同源臂。ChrII上8680-9089bp、9090-9359bp作为染色体融合组件的右同源臂和正向重复序列。将pgRNA4-6、ChrIX着丝粒敲除组件(筛选标记URA3)和ChrIX-II融合组件(筛选标记LYS2)转化BY4742/pleucas9原生质体。
脉冲场凝胶电泳结果显示,ChrVI(270kbp)和ChrI(230kbp)融合为一条503kbp的染色体(图4),即ChrVI-I。脉冲条件:1%的琼脂糖凝胶,0.5*TBE缓冲液,12.5℃,转换角度120°,电压6V/cm,先60s转换时间电泳22小时,再90s转换时间电泳12小时。
脉冲电泳图显示ChrIX(440kbp)和ChrII(813kbp)条带消失,多出一条1247kbp左右条带,即ChrIX-II。因此,ChrIX(440kbp)和ChrII(813kbp)融合为一条1247kbp的染色体(图5)。
实施例2、三条染色体融合
本实施例中,以酿酒酵母BY4742为出发菌株,选取ChrVI(270kbp)和ChrI(230kbp)和ChrII(813kbp)进行融合,见表3。
表3、三条染色体融合信息
Figure BDA0001386816750000171
ChrVI(270kbp)、ChrI(230kbp)和ChrII(813kbp)融合时,敲除ChrVI和ChrII的着丝粒。选取ChrVI上148410-148459bp、148725-148774bp、148775-149002bp作为着丝粒敲除的左同源臂、右同源臂、正向重复序列;269212-269615bp作为ChrVI-I融合组件的左同源臂。ChrI上2893-3294bp、3295-3519bp作为ChrVI-I融合组件的右同源臂和正向重复序列;202775-203182bp作为ChrI-II融合组件左同源臂。ChrII上8680-9089bp、9090-9359bp作为ChrI-II融合组件的右同源臂和正向重复序列。选取ChrII上237974-238026bp、238390-238439bp、238440-238652bp作为着丝粒敲除的左同源臂、右同源臂、正向重复序列。将pgRNA123789(见表1)、ChrVI着丝粒敲除组件(URA3)、ChrVI-I融合组件(LYS2)、ChrI-II融合组件(natMX6,Nourseothricin)、ChrII着丝粒敲除组件(URA3)用实施例1中所述原生质体转化的方法转移到BY4742/pleucas9中。
挑取4个转化子通过菌落PCR进行初步验证。菌落PCR具体步骤:1)引物设计,在ChrVI、ChrII着丝粒同源臂外侧设计验证引物,如果着丝粒敲除成功,验证引物PCR出2kbp左右条带,如果不成功,验证引物PCR出1kbp左右条带;在ChrVI、ChrI发生融合的位置设计外部验证引物和内部验证引物和LYS2上的验证引物,如果染色体融合成功,则由外部验证引物和LYS2上的验证引物PCR出1.5/1.0kbp条带,如果融合不成功,则由染色体上的外部验证引物和内部验证引物PCR出0.7kbp条带。在ChrI、ChrII发生融合的位置设计外部验证引物和内部验证引物,如果融合成功,则由两条外部验证引物PCR出2.5kbp条带,如果失败,则由一条外部验证引物和内部验证引物PCR出1.0kbp条带。进行了两次试验,融合转化子数分别是12,7,菌落PCR验证阳性率分别是1/4,1/4。
按实施例1中所述菌落PCR方法进行初步验证,挑一个正确的克隆按实例一中所述进行脉冲电泳验证。
脉冲电泳图显示ChrVI(270kbp)、ChrI(230kbp)和ChrII(813kbp)条带消失,多出一条1283kbp左右条带,即ChrVI-I-II(图6)。脉冲场凝胶电泳结果说明,ChrVI(270kbp)、ChrI(230kbp)和ChrII(813kbp)融合为一条1283kbp的染色体。
实施例3、两组两条染色体融合
本例中以酿酒酵母BY4742为出发菌株,选取ChrVI(270kbp)和ChrI(230kbp)、ChrIX(440kbp)和ChrII(813kbp)同时融合(表4)。
表4、两组两条染色体融合信息
Figure BDA0001386816750000181
ChrVI(270kbp)和ChrI(230kbp)、ChrIX(440kbp)和ChrII(810kbp)同时融合时,将pgRNA1-6、ChrVI着丝粒敲除组件(URA3)、ChrVI-I融合组件(URA3)、ChrIX着丝粒敲除组件(LYS2)、ChrIX-II融合组件(LYS2)用实施例1中所述原生质体融合转化的方法转移到BY4742/pleucas9中(同源臂的选择参见实施例1)。
按实施例1中所述菌落PCR方法进行初步验证(验证引物参见实施例1),进行了两次试验,融合转化子数分别是10,24,菌落PCR验证阳性率分别是3/4,3/4。
挑一个正确的克隆按实施例1中所述进行脉冲电泳验证。
脉冲电泳图显示ChrVI(270kbp)、ChrI(230kbp)和ChrIX(440kbp)、ChrII(813kbp)条带消失,多出一条500kbp左右条带ChrVI-I和一条1247kbp左右条带ChrIX-II。结果说明,ChrVI(270kbp)、ChrI(230kbp)和ChrIX(440kbp)、ChrII(813kbp)四条染色体同时两两融合为503kbp,1247kbp大小的染色体(见图7)。
通过酵母原生质体转化技术,将着丝粒敲除组件,染色体融合组件以及pgRNA质粒一次转化到酵母细胞内。染色体在着丝粒和端粒附近被切割后,含有染色体上同源序列的着丝粒敲除组件和染色体融合组件通过酵母体内的同源重组整合到染色体上,通过sgRNA载体,Cas9载体和着丝粒组件、染色体融合组件上的标记筛选出需要的转化子。因打靶组件上带有可消除标记的正向重复序列,还可以诱导切割获得无痕融合的染色体。
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
序列表
<110> 中国科学院上海生命科学研究院
<120> 一种高效的酵母菌染色体融合方法
<130> 175012
<160> 11
<170> SIPOSequenceListing 1.0
<210> 1
<211> 10781
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<221> misc_feature
<223> 表达载体
<400> 1
gacgaaaggg cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt 60
cttaggacgg atcgcttgcc tgtaacttac acgcgcctcg tatcttttaa tgatggaata 120
atttgggaat ttactctgtg tttatttatt tttatgtttt gtatttggat tttagaaagt 180
aaataaagaa ggtagaagag ttacggaatg aagaaaaaaa aataaacaaa ggtttaaaaa 240
atttcaacaa aaagcgtact ttacatatat atttattaga caagaaaagc agattaaata 300
gatatacatt cgattaacga taagtaaaat gtaaaatcac aggattttcg tgtgtggtct 360
tctacacaga caagatgaaa caattcggca ttaatacctg agagcaggaa gagcaagata 420
aaaggtagta tttgttggcg atccccctag agtcttttac atcttcggaa aacaaaaact 480
attttttctt taatttcttt ttttactttc tatttttaat ttatatattt atattaaaaa 540
atttaaatta taattatttt tatagcacgt gatgaaaagg acccaggtgg cacttttcgg 600
ggaaatgtgc gcggaacccc tatttgttta tttttctaaa tacattcaaa tatgtatccg 660
ctcatgagac aataaccctg ataaatgctt caataatatt gaaaaaggaa gagtatgagt 720
attcaacatt tccgtgtcgc ccttattccc ttttttgcgg cattttgcct tcctgttttt 780
gctcacccag aaacgctggt gaaagtaaaa gatgctgaag atcagttggg tgcacgagtg 840
ggttacatcg aactggatct caacagcggt aagatccttg agagttttcg ccccgaagaa 900
cgttttccaa tgatgagcac ttttaaagtt ctgctatgtg gcgcggtatt atcccgtatt 960
gacgccgggc aagagcaact cggtcgccgc atacactatt ctcagaatga cttggttgag 1020
tactcaccag tcacagaaaa gcatcttacg gatggcatga cagtaagaga attatgcagt 1080
gctgccataa ccatgagtga taacactgcg gccaacttac ttctgacaac gatcggagga 1140
ccgaaggagc taaccgcttt tttgcacaac atgggggatc atgtaactcg ccttgatcgt 1200
tgggaaccgg agctgaatga agccatacca aacgacgagc gtgacaccac gatgcctgta 1260
gcaatggcaa caacgttgcg caaactatta actggcgaac tacttactct agcttcccgg 1320
caacaattaa tagactggat ggaggcggat aaagttgcag gaccacttct gcgctcggcc 1380
cttccggctg gctggtttat tgctgataaa tctggagccg gtgagcgtgg gtctcgcggt 1440
atcattgcag cactggggcc agatggtaag ccctcccgta tcgtagttat ctacacgacg 1500
gggagtcagg caactatgga tgaacgaaat agacagatcg ctgagatagg tgcctcactg 1560
attaagcatt ggtaactgtc agaccaagtt tactcatata tactttagat tgatttaaaa 1620
cttcattttt aatttaaaag gatctaggtg aagatccttt ttgataatct catgaccaaa 1680
atcccttaac gtgagttttc gttccactga gcgtcagacc ccgtagaaaa gatcaaagga 1740
tcttcttgag atcctttttt tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg 1800
ctaccagcgg tggtttgttt gccggatcaa gagctaccaa ctctttttcc gaaggtaact 1860
ggcttcagca gagcgcagat accaaatact gtccttctag tgtagccgta gttaggccac 1920
cacttcaaga actctgtagc accgcctaca tacctcgctc tgctaatcct gttaccagtg 1980
gctgctgcca gtggcgataa gtcgtgtctt accgggttgg actcaagacg atagttaccg 2040
gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca cacagcccag cttggagcga 2100
acgacctaca ccgaactgag atacctacag cgtgagctat gagaaagcgc cacgcttccc 2160
gaagggagaa aggcggacag gtatccggta agcggcaggg tcggaacagg agagcgcacg 2220
agggagcttc cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt tcgccacctc 2280
tgacttgagc gtcgattttt gtgatgctcg tcaggggggc ggagcctatg gaaaaacgcc 2340
agcaacgcgg cctttttacg gttcctggcc ttttgctggc cttttgctca catgttcttt 2400
cctgcgttat cccctgattc tgtggataac cgtattaccg cctttgagtg agctgatacc 2460
gctcgccgca gccgaacgac cgagcgcagc gagtcagtga gcgaggaagc ggaagagcgc 2520
ccaatacgca aaccgcctct ccccgcgcgt tggccgattc attaatgcag ctggcacgac 2580
aggtttcccg actggaaagc gggcagtgag cgcaacgcaa ttaatgtgag ttacctcact 2640
cattaggcac cccaggcttt acactttatg cttccggctc ctatgttgtg tggaattgtg 2700
agcggataac aatttcacac aggaaacagc tatgaccatg attacgccaa gcgcgcaatt 2760
aaccctcact aaagggaaca aaagctggag ctcgtgacag ccctccgaag gaagactctc 2820
ctccgtgcgt cctcgtcttc accggtcgcg ttcctgaaac gcagatgtgc ctcgcgccgc 2880
actgctccga acaataaaga ttctacaata ctagctttta tggttatgaa gaggaaaaat 2940
tggcagtaac ctggccccac aaaccttcaa atgaacgaat caaattaaca accataggat 3000
gataatgcga ttagtttttt agccttattt ctggggtaat taatcagcga agcgatgatt 3060
tttgatctat taacggatat ataaatgcaa aaactgcata accactttaa ctaatacttt 3120
caacattttc ggtttgtatt acttcttatt caaatgtaat aaaagtatca acaaaaaatt 3180
gttaatatac ctctatactt taacgtcaag gagaaaaaac cccggattct agcttgcctt 3240
gtccccgccg ggtcacccgg ccagcgacat ggaggcccag aataccctcc ttgacagtct 3300
tgacgtgcgc agctcagggg catgatgtga ctgtcgcccg tacatttagc ccatacatcc 3360
ccatgtataa tcatttgcat ccatacattt tgatggccgc acggcgcgaa gcaaaaatta 3420
cggctcctcg ctgcagacct gcgagcaggg aaacgctccc ctcacagacg cgttgaattg 3480
tccccacgcc gcgcccctgt agagaaatat aaaaggttag gatttgccac tgaggttctt 3540
ctttcatata cttcctttta aaatcttgct aggatacagt tctcacatca catccgaaca 3600
taaacaacca tggacaagaa gtactccatt gggctcgata tcggcacaaa cagcgtcggc 3660
tgggccgtca ttacggacga gtacaaggtg ccgagcaaaa aattcaaagt tctgggcaat 3720
accgatcgcc acagcataaa gaagaacctc attggcgccc tcctgttcga ctccggggag 3780
acggccgaag ccacgcggct caaaagaaca gcacggcgca gatatacccg cagaaagaat 3840
cggatctgct acctgcagga gatctttagt aatgagatgg ctaaggtgga tgactctttc 3900
ttccataggc tggaggagtc ctttttggtg gaggaggata aaaagcacga gcgccaccca 3960
atctttggca atatcgtgga cgaggtggcg taccatgaaa agtacccaac catatatcat 4020
ctgaggaaga agcttgtaga cagtactgat aaggctgact tgcggttgat ctatctcgcg 4080
ctggcgcata tgatcaaatt tcggggacac ttcctcatcg agggggacct gaacccagac 4140
aacagcgatg tcgacaaact ctttatccaa ctggttcaga cttacaatca gcttttcgaa 4200
gagaacccga tcaacgcatc cggagttgac gccaaagcaa tcctgagcgc taggctgtcc 4260
aaatcccggc ggctcgaaaa cctcatcgca cagctccctg gggagaagaa gaacggcctg 4320
tttggtaatc ttatcgccct gtcactcggg ctgaccccca actttaaatc taacttcgac 4380
ctggccgaag atgccaagct tcaactgagc aaagacacct acgatgatga tctcgacaat 4440
ctgctggccc agatcggcga ccagtacgca gacctttttt tggcggcaaa gaacctgtca 4500
gacgccattc tgctgagtga tattctgcga gtgaacacgg agatcaccaa agctccgctg 4560
agcgctagta tgatcaagcg ctatgatgag caccaccaag acttgacttt gctgaaggcc 4620
cttgtcagac agcaactgcc tgagaagtac aaggaaattt tcttcgatca gtctaaaaat 4680
ggctacgccg gatacattga cggcggagca agccaggagg aattttacaa atttattaag 4740
cccatcttgg aaaaaatgga cggcaccgag gagctgctgg taaagcttaa cagagaagat 4800
ctgttgcgca aacagcgcac tttcgacaat ggaagcatcc cccaccagat tcacctgggc 4860
gaactgcacg ctatcctcag gcggcaagag gatttctacc cctttttgaa agataacagg 4920
gaaaagattg agaaaatcct cacatttcgg ataccctact atgtaggccc cctcgcccgg 4980
ggaaattcca gattcgcgtg gatgactcgc aaatcagaag agaccatcac tccctggaac 5040
ttcgaggaag tcgtggataa gggggcctct gcccagtcct tcatcgaaag gatgactaac 5100
tttgataaaa atctgcctaa cgaaaaggtg cttcctaaac actctctgct gtacgagtac 5160
ttcacagttt ataacgagct caccaaggtc aaatacgtca cagaagggat gagaaagcca 5220
gcattcctgt ctggagagca gaagaaagct atcgtggacc tcctcttcaa gacgaaccgg 5280
aaagttaccg tgaaacagct caaagaagac tatttcaaaa agattgaatg tttcgactct 5340
gttgaaatca gcggagtgga ggatcgcttc aacgcatccc tgggaacgta tcacgatctc 5400
ctgaaaatca ttaaagacaa ggacttcctg gacaatgagg agaacgagga cattcttgag 5460
gacattgtcc tcacccttac gttgtttgaa gatagggaga tgattgaaga acgcttgaaa 5520
acttacgctc atctcttcga cgacaaagtc atgaaacagc tcaagaggcg ccgatataca 5580
ggatgggggc ggctgtcaag aaaactgatc aatgggatcc gagacaagca gagtggaaag 5640
acaatcctgg attttcttaa gtccgatgga tttgccaacc ggaacttcat gcagttgatc 5700
catgatgact ctctcacctt taaggaggac atccagaaag cacaagtttc tggccagggg 5760
gacagtcttc acgagcacat cgctaatctt gcaggtagcc cagctatcaa aaagggaata 5820
ctgcagaccg ttaaggtcgt ggatgaactc gtcaaagtaa tgggaaggca taagcccgag 5880
aatatcgtta tcgagatggc ccgagagaac caaactaccc agaagggaca gaagaacagt 5940
agggaaagga tgaagaggat tgaagagggt ataaaagaac tggggtccca aatccttaag 6000
gaacacccag ttgaaaacac ccagcttcag aatgagaagc tctacctgta ctacctgcag 6060
aacggcaggg acatgtacgt ggatcaggaa ctggacatca atcggctctc cgactacgac 6120
gtggatcata tcgtgcccca gtcttttctc aaagatgatt ctattgataa taaagtgttg 6180
acaagatccg ataaaaatag agggaagagt gataacgtcc cctcagaaga agttgtcaag 6240
aaaatgaaaa attattggcg gcagctgctg aacgccaaac tgatcacaca acggaagttc 6300
gataatctga ctaaggctga acgaggtggc ctgtctgagt tggataaagc cggcttcatc 6360
aaaaggcagc ttgttgagac acgccagatc accaagcacg tggcccaaat tctcgattca 6420
cgcatgaaca ccaagtacga tgaaaatgac aaactgattc gagaggtgaa agttattact 6480
ctgaagtcta agctggtctc agatttcaga aaggactttc agttttataa ggtgagagag 6540
atcaacaatt accaccatgc gcatgatgcc tacctgaatg cagtggtagg cactgcactt 6600
atcaaaaaat atcccaagct tgaatctgaa tttgtttacg gagactataa agtgtacgat 6660
gttaggaaaa tgatcgcaaa gtctgagcag gaaataggca aggccaccgc taagtacttc 6720
ttttacagca atattatgaa ttttttcaag accgagatta cactggccaa tggagagatt 6780
cggaagcgac cacttatcga aacaaacgga gaaacaggag aaatcgtgtg ggacaagggt 6840
agggatttcg cgacagtccg gaaggtcctg tccatgccgc aggtgaacat cgttaaaaag 6900
accgaagtac agaccggagg cttctccaag gaaagtatcc tcccgaaaag gaacagcgac 6960
aagctgatcg cacgcaaaaa agattgggac cccaagaaat acggcggatt cgattctcct 7020
acagtcgctt acagtgtact ggttgtggcc aaagtggaga aagggaagtc taaaaaactc 7080
aaaagcgtca aggaactgct gggcatcaca atcatggagc gatcaagctt cgaaaaaaac 7140
cccatcgact ttctcgaggc gaaaggatat aaagaggtca aaaaagacct catcattaag 7200
cttcccaagt actctctctt tgagcttgaa aacggccgga aacgaatgct cgctagtgcg 7260
ggcgagctgc agaaaggtaa cgagctggca ctgccctcta aatacgttaa tttcttgtat 7320
ctggccagcc actatgaaaa gctcaaaggg tctcccgaag ataatgagca gaagcagctg 7380
ttcgtggaac aacacaaaca ctaccttgat gagatcatcg agcaaataag cgaattctcc 7440
aaaagagtga tcctcgccga cgctaacctc gataaggtgc tttctgctta caataagcac 7500
agggataagc ccatcaggga gcaggcagaa aacattatcc acttgtttac tctgaccaac 7560
ttgggcgcgc ctgcagcctt caagtacttc gacaccacca tagacagaaa gcggtacacc 7620
tctacaaagg aggtcctgga cgccacactg attcatcagt caattacggg gctctatgaa 7680
acaagaatcg acctctctca gctcggtgga gacagcaggg ctgaccccaa gaagaagagg 7740
aaggtgtgat tttggacctc gagtcattgg acctcgagtc atgtaattag ttatgtcacg 7800
cttacattca cgccctcccc ccacatccgc tctaaccgaa aaggaaggag ttagacaacc 7860
tgaagtctag gtccctattt atttttttat agttatgtta gtattaagaa cgttatttat 7920
atttcaaatt tttctttttt ttctgtacag acgcgtgtac gcatgtaaca ttatactgaa 7980
aaccttgctt gagaaggttt tgggacgctc gaaggcttta atttgcggcc ggtacccaat 8040
tcgccctata gtgagtcgta ttacgcgcgc tcactggccg tcgttttaca acgtcgtgac 8100
tgggaaaacc ctggcgttac ccaacttaat cgccttgcag cacatccccc tttcgccagc 8160
tggcgtaata gcgaagaggc ccgcaccgat cgcccttccc aacagttgcg cagcctgaat 8220
ggcgaatggc gcgacgcgcc ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg 8280
cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct 8340
tcctttctcg ccacgttcgc cggctttccc cgtcaagctc taaatcgggg gctcccttta 8400
gggttccgat ttagtgcttt acggcacctc gaccccaaaa aacttgatta gggtgatggt 8460
tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg 8520
ttctttaata gtggactctt gttccaaact ggaacaacac tcaaccctat ctcggtctat 8580
tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt 8640
taacaaaaat ttaacgcgaa ttttaacaaa atattaacgt ttacaatttc ctgatgcggt 8700
attttctcct tacgcatctg tgcggtattt cacaccgcat atcgacggtc gaggagaact 8760
tctagtatat ccacatacct aatattattg ccttattaaa aatggaatcc caacaattac 8820
atcaaaatcc acattctctt caaaatcaat tgtcctgtac ttccttgttc atgtgtgttc 8880
aaaaacgtta tatttatagg ataattatac tctatttctc aacaagtaat tggttgtttg 8940
gccgagcggt ctaaggcgcc tgattcaaga aatatcttga ccgcaagatt acgtttaaag 9000
gagcattaac aggtttactc ataacaatca ttttcaaatt tccctatgca tgtttagagc 9060
aagcgccttt gtgagccctc ccggttacga cgccttggca atgtagcaga taactctgca 9120
cttctagagc tcgtgacagc cctccgaagg aagactctcc tccgtgcgtc ctcgtcttca 9180
ccggtcgcgt tcctgaaacg cagatgtgcc tcgcgccgca ctgctccgaa caataaagat 9240
tctacaatac tagcttttat ggttatgaag aggaaaaatt ggcagtaacc tggccccaca 9300
aaccttcaaa tgaacgaatc aaattaacaa ccataggatg ataatgcgat tagtttttta 9360
gccttatttc tggggtaatt aatcagcgaa gcgatgattt ttgatctatt aacggatata 9420
taaatgcaaa aactgcataa ccactttaac taatactttc aacattttcg gtttgtatta 9480
cttcttattc aaatgtaata aaagtatcaa caaaaaattg ttaatatacc tctatacttt 9540
aacgtcaagg agaaaaaacc ccctgattac tagcgaagct gcgttttaga gctagaaata 9600
gcaagttaaa ataaggctag tccgttatca acttgaaaaa gtggcaccga gtcggtggtg 9660
ctttttttgt tttttatgtc ttcgagtcat gtaattagtt atgtcacgct tacattcacg 9720
ccctcccccc acatccgctc taaccgaaaa ggaaggagtt agacaacctg aagtctaggt 9780
ccctatttat ttttttatag ttatgttagt attaagaacg ttatttatat ttcaaatttt 9840
tctttttttt ctgtacagac gcgtgtacgc atgtaacatt atactgaaaa ccttgcttga 9900
gaaggttttg ggacgctcga aggcttttct agaatcattc cactacgaca tttggctcat 9960
caccagctcg cgagaaatgt aaataagcca acaaccaaga atgcgtaaca ttaaagaata 10020
cagttgcttt catttcggcg tgatggtacg gcacccacgg taccttacat tattctcgaa 10080
aaatagctgc acgcttttcc aggaataaaa gaccgtgcca ctaatttcac gtgatcaata 10140
tatttacaag ccacctcaaa aaatgtggca atggagaaga ggatgaacga ctcaatatga 10200
ggaatatgtt catagggtag acgaaactat atacgcaatc tacatacatt tatcaagaag 10260
gagaaaaagg aggatagtaa aggaatacag gtaagcaaat tgatactaat ggctcaacgt 10320
gataaggaaa aagaattgca ctttaacatt aatattgaca aggaggaggg caccacacaa 10380
aaagttaggt gtaacagaaa atcatgaaac tacgattcct aatttgatat tggaggattt 10440
tctctaaaaa aaaaaaaata caacaaataa aaaacactca atgacctgac catttgatgg 10500
agtttaagtc aataccttct tgaaccattt cccataatgg tgaaagttcc ctcaagaatt 10560
ttactctgtc agaaacggcc ttacgacgta gtcgatatgg tgcactctca gtacaatctg 10620
ctctgatgcc gcatagttaa gccagccccg acacccgcca acacccgctg acgcgccctg 10680
acgggcttgt ctgctcccgg catccgctta cagacaagct gtgaccgtct ccgggagctg 10740
catgtgtcag aggttttcac cgtcatcacc gaaacgcgcg a 10781
<210> 2
<211> 7096
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<221> misc_feature
<223> 表达载体
<400> 2
gacgaaaggg cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt 60
cttagtatga tccaatatca aaggaaatga tagcattgaa ggatgagact aatccaattg 120
aggagtggca gcatatagaa cagctaaagg gtagtgctga aggaagcata cgataccccg 180
catggaatgg gataatatca caggaggtac tagactacct ttcatcctac ataaatagac 240
gcatataagt acgcatttaa gcataaacac gcactatgcc gttcttctca tgtatatata 300
tatacaggca acacgcagat ataggtgcga cgtgaacagt gagctgtatg tgcgcagctc 360
gcgttgcatt ttcggaagcg ctcgttttcg gaaacgcttt gaagttccta ttccgaagtt 420
cctattctct agaaagtata ggaacttcag agcgcttttg aaaaccaaaa gcgctctgaa 480
gacgcacttt caaaaaacca aaaacgcacc ggactgtaac gagctactaa aatattgcga 540
ataccgcttc cacaaacatt gctcaaaagt atctctttgc tatatatctc tgtgctatat 600
ccctatataa cctacccatc cacctttcgc tccttgaact tgcatctaaa ctcgacctct 660
acatttttta tgtttatctc tagtattact ctttagacaa aaaaattgta gtaagaacta 720
ttcatagagt gaatcgaaaa caatacgaaa atgtaaacat ttcctatacg tagtatatag 780
agacaaaata gaagaaaccg ttcataattt tctgaccaat gaagaatcat caacgctatc 840
actttctgtt cacaaagtat gcgcaatcca catcggtata gaatataatc ggggatgcct 900
ttatcttgaa aaaatgcacc cgcagcttcg ctagtaatca gtaaacgcgg gaagtggagt 960
caggcttttt ttatggaaga gaaaatagac accaaagtag ccttcttcta accttaacgg 1020
acctacagtg caaaaagtta tcaagagact gcattataga gcgcacaaag gagaaaaaaa 1080
gtaatctaag atgctttgtt agaaaaatag cgctctcggg atgcattttt gtagaacaaa 1140
aaagaagtat agattctttg ttggtaaaat agcgctctcg cgttgcattt ctgttctgta 1200
aaaatgcagc tcagattctt tgtttgaaaa attagcgctc tcgcgttgca tttttgtttt 1260
acaaaaatga agcacagatt cttcgttggt aaaatagcgc tttcgcgttg catttctgtt 1320
ctgtaaaaat gcagctcaga ttctttgttt gaaaaattag cgctctcgcg ttgcattttt 1380
gttctacaaa atgaagcaca gatgcttcgt tcaggtggca cttttcgggg aaatgtgcgc 1440
ggaaccccta tttgtttatt tttctaaata cattcaaata tgtatccgct catgagacaa 1500
taaccctgat aaatgcttca ataatattga aaaaggaaga gtatgagtat tcaacatttc 1560
cgtgtcgccc ttattccctt ttttgcggca ttttgccttc ctgtttttgc tcacccagaa 1620
acgctggtga aagtaaaaga tgctgaagat cagttgggtg cacgagtggg ttacatcgaa 1680
ctggatctca acagcggtaa gatccttgag agttttcgcc ccgaagaacg ttttccaatg 1740
atgagcactt ttaaagttct gctatgtggc gcggtattat cccgtattga cgccgggcaa 1800
gagcaactcg gtcgccgcat acactattct cagaatgact tggttgagta ctcaccagtc 1860
acagaaaagc atcttacgga tggcatgaca gtaagagaat tatgcagtgc tgccataacc 1920
atgagtgata acactgcggc caacttactt ctgacaacga tcggaggacc gaaggagcta 1980
accgcttttt tgcacaacat gggggatcat gtaactcgcc ttgatcgttg ggaaccggag 2040
ctgaatgaag ccataccaaa cgacgagcgt gacaccacga tgcctgtagc aatggcaaca 2100
acgttgcgca aactattaac tggcgaacta cttactctag cttcccggca acaattaata 2160
gactggatgg aggcggataa agttgcagga ccacttctgc gctcggccct tccggctggc 2220
tggtttattg ctgataaatc tggagccggt gagcgtgggt ctcgcggtat cattgcagca 2280
ctggggccag atggtaagcc ctcccgtatc gtagttatct acacgacggg gagtcaggca 2340
actatggatg aacgaaatag acagatcgct gagataggtg cctcactgat taagcattgg 2400
taactgtcag accaagttta ctcatatata ctttagattg atttaaaact tcatttttaa 2460
tttaaaagga tctaggtgaa gatccttttt gataatctca tgaccaaaat cccttaacgt 2520
gagttttcgt tccactgagc gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat 2580
cctttttttc tgcgcgtaat ctgctgcttg caaacaaaaa aaccaccgct accagcggtg 2640
gtttgtttgc cggatcaaga gctaccaact ctttttccga aggtaactgg cttcagcaga 2700
gcgcagatac caaatactgt ccttctagtg tagccgtagt taggccacca cttcaagaac 2760
tctgtagcac cgcctacata cctcgctctg ctaatcctgt taccagtggc tgctgccagt 2820
ggcgataagt cgtgtcttac cgggttggac tcaagacgat agttaccgga taaggcgcag 2880
cggtcgggct gaacgggggg ttcgtgcaca cagcccagct tggagcgaac gacctacacc 2940
gaactgagat acctacagcg tgagctatga gaaagcgcca cgcttcccga agggagaaag 3000
gcggacaggt atccggtaag cggcagggtc ggaacaggag agcgcacgag ggagcttcca 3060
gggggaaacg cctggtatct ttatagtcct gtcgggtttc gccacctctg acttgagcgt 3120
cgatttttgt gatgctcgtc aggggggcgg agcctatgga aaaacgccag caacgcggcc 3180
tttttacggt tcctggcctt ttgctggcct tttgctcaca tgttctttcc tgcgttatcc 3240
cctgattctg tggataaccg tattaccgcc tttgagtgag ctgataccgc tcgccgcagc 3300
cgaacgaccg agcgcagcga gtcagtgagc gaggaagcgg aagagcgccc aatacgcaaa 3360
ccgcctctcc ccgcgcgttg gccgattcat taatgcagct ggcacgacag gtttcccgac 3420
tggaaagcgg gcagtgagcg caacgcaatt aatgtgagtt acctcactca ttaggcaccc 3480
caggctttac actttatgct tccggctcct atgttgtgtg gaattgtgag cggataacaa 3540
tttcacacag gaaacagcta tgaccatgat tacgccaagc gcgcaattaa ccctcactaa 3600
agggaacaaa agctggagaa ttctctttga aaagataatg tatgattatg ctttcactca 3660
tatttataca gaaacttgat gttttctttc gagtatatac aaggtgatta catgtacgtt 3720
tgaagtacaa ctctagattt tgtagtgccc tcttgggcta gcggtaaagg tgcgcatttt 3780
ttcacaccct acaatgttct gttcaaaaga ttttggtcaa acgctgtaga agtgaaagtt 3840
ggtgcgcatg tttcggcgtt cgaaacttct ccgcagtgaa agataaatga tctcgaacgt 3900
gatcctaacg aggttttaga gctagaaata gcaagttaaa ataaggctag tccgttatca 3960
acttgaaaaa gtggcaccga gtcggtggtg ctttttttgt tttttatgtc tggatcctct 4020
ttgaaaagat aatgtatgat tatgctttca ctcatattta tacagaaact tgatgttttc 4080
tttcgagtat atacaaggtg attacatgta cgtttgaagt acaactctag attttgtagt 4140
gccctcttgg gctagcggta aaggtgcgca ttttttcaca ccctacaatg ttctgttcaa 4200
aagattttgg tcaaacgctg tagaagtgaa agttggtgcg catgtttcgg cgttcgaaac 4260
ttctccgcag tgaaagataa atgatcacac acgtttacga tgatatgttt tagagctaga 4320
aatagcaagt taaaataagg ctagtccgtt atcaacttga aaaagtggca ccgagtcggt 4380
ggtgcttttt ttgtttttta tgtctccatg gtctttgaaa agataatgta tgattatgct 4440
ttcactcata tttatacaga aacttgatgt tttctttcga gtatatacaa ggtgattaca 4500
tgtacgtttg aagtacaact ctagattttg tagtgccctc ttgggctagc ggtaaaggtg 4560
cgcatttttt cacaccctac aatgttctgt tcaaaagatt ttggtcaaac gctgtagaag 4620
tgaaagttgg tgcgcatgtt tcggcgttcg aaacttctcc gcagtgaaag ataaatgatc 4680
acggctaact gaacctaagt gttttagagc tagaaatagc aagttaaaat aaggctagtc 4740
cgttatcaac ttgaaaaagt ggcaccgagt cggtggtgct ttttttgttt tttatgtctg 4800
cggccgcagt catgtaatta gttatgtcac gcttacattc acgccctccc cccacatccg 4860
ctctaaccga aaaggaagga gttagacaac ctgaagtcta ggtccctatt tattttttta 4920
tagttatgtt agtattaaga acgttattta tatttcaaat ttttcttttt tttctgtaca 4980
gacgcgtgta cgcatgtaac attatactga aaaccttgct tgagaaggtt ttgggacgct 5040
cgaaggcttt aatttgcggc cggtacccaa ttcgccctat agtgagtcgt attacgcgcg 5100
ctcactggcc gtcgttttac aacgtcgtga ctgggaaaac cctggcgtta cccaacttaa 5160
tcgccttgca gcacatcccc ctttcgccag ctggcgtaat agcgaagagg cccgcaccga 5220
tcgcccttcc caacagttgc gcagcctgaa tggcgaatgg cgcgacgcgc cctgtagcgg 5280
cgcattaagc gcggcgggtg tggtggttac gcgcagcgtg accgctacac ttgccagcgc 5340
cctagcgccc gctcctttcg ctttcttccc ttcctttctc gccacgttcg ccggctttcc 5400
ccgtcaagct ctaaatcggg ggctcccttt agggttccga tttagtgctt tacggcacct 5460
cgaccccaaa aaacttgatt agggtgatgg ttcacgtagt gggccatcgc cctgatagac 5520
ggtttttcgc cctttgacgt tggagtccac gttctttaat agtggactct tgttccaaac 5580
tggaacaaca ctcaacccta tctcggtcta ttcttttgat ttataaggga ttttgccgat 5640
ttcggcctat tggttaaaaa atgagctgat ttaacaaaaa tttaacgcga attttaacaa 5700
aatattaacg tttacaattt cctgatgcgg tattttctcc ttacgcatct gtgcggtatt 5760
tcacaccgca tagggtctcg aggagcttgg tgagcgctag gagtcactgc caggtatcgt 5820
ttgaacacgg cattagtcag ggaagtcata acacagtcct ttcccgcaat tttctttttc 5880
tattactctt ggcctcctct agtacactct atattttttt atgcctcggt aatgattttc 5940
attttttttt ttcccctagc ggatgactct ttttttttct tagcgattgg cattatcaca 6000
taatgaatta tacattatat aaagtaatgt gatttcttcg aagaatatac taaaaaatga 6060
gcaggcaaga taaacgaagg caaagatgac agagcagaaa gccctagtaa agcgtattac 6120
aaatgaaacc aagattcaga ttgcgatctc tttaaagggt ggtcccctag cgatagagca 6180
ctcgatcttc ccagaaaaag aggcagaagc agtagcagaa caggccacac aatcgcaagt 6240
gattaacgtc cacacaggta tagggtttct ggaccatatg atacatgctc tggccaagca 6300
ttccggctgg tcgctaatcg ttgagtgcat tggtgactta cacatagacg accatcacac 6360
cactgaagac tgcgggattg ctctcggtca agcttttaaa gaggccctac tggcgcgtgg 6420
agtaaaaagg tttggatcag gatttgcgcc tttggatgag gcactttcca gagcggtggt 6480
agatctttcg aacaggccgt acgcagttgt cgaacttggt ttgcaaaggg agaaagtagg 6540
agatctctct tgcgagatga tcccgcattt tcttgaaagc tttgcagagg ctagcagaat 6600
taccctccac gttgattgtc tgcgaggcaa gaatgatcat caccgtagtg agagtgcgtt 6660
caaggctctt gcggttgcca taagagaagc cacctcgccc aatggtacca acgatgttcc 6720
ctccaccaaa ggtgttctta tgtagtgaca ccgattattt aaagctgcag catacgatat 6780
atatacatgt gtatatatgt atacctatga atgtcagtaa gtatgtatac gaacagtatg 6840
atactgaaga tgacaaggta atgcatcatt ctatacgtgt cattctgaag agctcattga 6900
aaagctgtgg tatggtgcac tctcagtaca atctgctctg atgccgcata gttaagccag 6960
ccccgacacc cgccaacacc cgctgacgcg ccctgacggg cttgtctgct cccggcatcc 7020
gcttacagac aagctgtgac cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca 7080
tcaccgaaac gcgcga 7096
<210> 3
<211> 20
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<221> misc_feature
<223> sgRNA识别序列
<400> 3
tcgaacgtga tcctaacgag 20
<210> 4
<211> 20
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<221> misc_feature
<223> sgRNA识别序列
<400> 4
acacacgttt acgatgatat 20
<210> 5
<211> 20
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<221> misc_feature
<223> sgRNA识别序列
<400> 5
acggctaact gaacctaagt 20
<210> 6
<211> 20
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<221> misc_feature
<223> sgRNA识别序列
<400> 6
aaggagacaa attcagcgag 20
<210> 7
<211> 20
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<221> misc_feature
<223> 引物
<220>
<221> misc_feature
<223> sgRNA识别序列
<400> 7
tttcacgaat acgagataca 20
<210> 8
<211> 20
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<221> misc_feature
<223> sgRNA识别序列
<400> 8
agcgtagtta acccctctgc 20
<210> 9
<211> 20
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<221> misc_feature
<223> sgRNA识别序列
<400> 9
ctggtaaaga gctctgcagc 20
<210> 10
<211> 20
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<221> misc_feature
<223> sgRNA识别序列
<400> 10
agcgtagtta acccctctgc 20
<210> 11
<211> 20
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<221> misc_feature
<223> sgRNA识别序列
<400> 11
taggatacaa gtgtctgtgc 20

Claims (27)

1.一种对酵母的染色体A和染色体B进行融合的方法,其特征在于,所述方法包括:
将着丝粒敲除组件、染色体融合组件、sgRNA靶向切割组件引入到表达Cas9蛋白的酵母中,从而获得染色体A和染色体B发生融合的酵母;
其中,
所述着丝粒敲除组件用于敲除两条染色体之一的着丝粒,使得融合后的染色体仅含有一个着丝粒,其含有该着丝粒两侧同源序列和筛选标记;在着丝粒敲除组件中,设置一段正向重复序列,其设置于该组件中所述同源序列与筛选标记之间;其序列为染色体上紧挨该着丝粒一侧同源序列的序列;该正向重复序列的长度为50~500bp;
所述染色体融合组件用于在两条染色体两个端粒附近发生双交换,删除端粒且介导染色体融合,其含有染色体A近端粒区的同源序列、染色体B近端粒区的同源序列和筛选标记;该组件中设置一段正向重复序列,设置于该组件中所述同源序列与筛选标记之间;其序列为紧挨着其中一条染色体近端粒区同源序列的序列;该正向重复序列的长度为50~500bp;
所述sgRNA靶向切割组件含有能在要删除的着丝粒和两个端粒序列附近进行切割的sgRNA,其是能在酵母中组成型表达sgRNA的表达载体,其配合所述着丝粒敲除组件、染色体融合组件实现染色体的融合。
2.如权利要求1所述的方法,其特征在于,所述的Cas9表达组件是表达载体,其中以酵母强启动子驱动cas9基因的表达。
3.如权利要求2所述的方法,其特征在于,所述的强启动子为Tef1启动子。
4.如权利要求1所述的方法,其特征在于,所述的Cas9表达组件是表达载体,其在酵母中为单拷贝复制、在大肠杆菌中为高拷贝复制。
5.如权利要求4所述的方法,其特征在于,所述的表达载体的载体复制区来源于CEN6ARS4。
6.如权利要求4所述的方法,其特征在于,所述的表达载体以LEU2作为筛选标记。
7.如权利要求4所述的方法,其特征在于,所述的表达载体的载体复制起始位点为pBR322 origin。
8.如权利要求1所述的方法,其特征在于,所述的Cas9表达组件的骨架载体具有SEQ IDNO:1所示的核酸序列。
9.如权利要求1所述的方法,其特征在于,其以酵母强启动子驱动sgRNA的表达。
10.如权利要求9所述的方法,其特征在于,所述的强启动子为SNR52。
11.如权利要求1所述的方法,其特征在于,所述sgRNA靶向切割组件是能在酵母中组成型表达sgRNA的表达载体,其在酵母中为单拷贝复制、在大肠杆菌中为高拷贝复制。
12.如权利要求11所述的方法,其特征在于,所述的表达载体的载体复制区为2micron2origi。
13.如权利要求11所述的方法,其特征在于,所述的表达载体以HIS3作为酵母表达的筛选标记;以氨苄青霉素抗性基因作为大肠杆菌表达的筛选标记。
14.如权利要求11所述的方法,其特征在于,所述的表达载体的载体复制起始位点为pBR322 origin。
15.如权利要求1所述的方法,其特征在于,所述的sgRNA靶向切割组件的骨架载体具有SEQ ID NO:2所示的核酸序列。
16.如权利要求1所述的方法,其特征在于,通过酵母原生质体转化方法将着丝粒敲除组件、染色体融合组件、sgRNA靶向切割组件、Cas9表达组件引入到酵母中。
17.如权利要求1所述的方法,其特征在于,将酿酒酵母的染色体ChrVI和ChrI进行融合,其中,
所述着丝粒敲除组件用于敲除ChrVI着丝粒,并且,所述的着丝粒两侧同源序列分别为左同源臂ChrVI:148410-148459、右同源臂ChrVI:148725-148774,所述正向重复序列为ChrVI:148775-149002。
18.如权利要求1所述的方法,其特征在于,所述染色体融合组件中,两条染色体的近端粒区的同源序列分别为ChrVI:269212-269615和ChrI:2893-3294,所述正向重复序列为ChrI:3295-3519。
19.如权利要求1所述的方法,其特征在于,所述sgRNA靶向切割组件含有SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5所示核苷酸序列的sgRNA。
20.如权利要求1所述的方法,其特征在于,将酿酒酵母的染色体ChrIX和ChrII进行融合,其中,
所述着丝粒敲除组件用于敲除ChrIX着丝粒,并且,所述的着丝粒两侧同源序列分别为左同源臂ChrIX:355547-355606、右同源臂ChrIX:355840-355891,所述正向重复序列为ChrIX:355892-356106;
所述染色体融合组件中,以ChrIX:435934-436360和ChrII:8680-9089分别作为两条染色体的近端粒区的同源序列,所述正向重复序列为ChrII:9090-9359;
所述sgRNA靶向切割组件含有SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8所示核苷酸序列的sgRNA。
21.如权利要求1所述的方法,其特征在于,采用所述方法对酵母的染色体A和染色体B进行融合的同时,还包括:在同一体系中,采用所述方法将染色体A和染色体B的融合染色体与其它一个或多个染色体进行融合。
22.如权利要求21所述的方法,其特征在于,在同一体系中,将酿酒酵母的染色体ChrVI,ChrI和ChrII进行融合,其中,
一个着丝粒敲除组件用于敲除ChrVI着丝粒,并且,所述的着丝粒两侧同源序列分别为左同源臂ChrVI:148410-148459、右同源臂ChrVI:148725-148774,所述正向重复序列为ChrVI:148775-149002;
另一着丝粒敲除组件用于敲除ChrII着丝粒,并且,所述的着丝粒两侧同源序列分别为左同源臂ChrII:237974-238026、右同源臂ChrII:238390-238439,所述正向重复序列为ChrII:238440-238652;
一个染色体融合组件针对ChrVI和ChrI的融合,其中,两条染色体的近端粒区的同源序列分别为ChrVI:269212-269615和ChrI:2893-3294,所述正向重复序列为ChrI:3295-3519;
另一染色体融合组件针对ChrI和ChrII的融合,其中,两条染色体的近端粒区的同源序列分别为ChrI:202775-203182和ChrII:8680-9089,所述正向重复序列为ChrII:9090-9359;
所述sgRNA靶向切割组件含有SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11所示核苷酸序列的sgRNA。
23.如权利要求1所述的方法,其特征在于,采用所述方法对酵母的染色体A和染色体B进行融合的同时,还包括:在同一体系中,采用同样的方法对其它的一组或多组染色体进行融合。
24.如权利要求23所述的方法,其特征在于,在同一体系中,将酿酒酵母的染色体ChrVI和ChrI融合,同时将ChrIX和ChrII融合。
25.如权利要求1所述的方法,其特征在于,表达Cas9蛋白的酵母通过在酵母细胞中引入表达Cas9的表达载体建立。
26.权利要求1所述方法的应用,其特征在于,应用于:
(a)将酵母中两条染色体融合为一条融合染色体;
(b)将酵母中两条以上的染色体融合为一条融合染色体;
(c)将酵母中多条染色体进行两两融合;或
(d)将酵母中多条染色体进行随机组合的融合。
27.权利要求26所述方法的应用,其特征在于,该种融合在一个转化子系统中进行。
CN201710729662.6A 2017-08-23 2017-08-23 一种高效的酵母菌染色体融合方法 Active CN107299114B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710729662.6A CN107299114B (zh) 2017-08-23 2017-08-23 一种高效的酵母菌染色体融合方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710729662.6A CN107299114B (zh) 2017-08-23 2017-08-23 一种高效的酵母菌染色体融合方法

Publications (2)

Publication Number Publication Date
CN107299114A CN107299114A (zh) 2017-10-27
CN107299114B true CN107299114B (zh) 2021-08-27

Family

ID=60132501

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710729662.6A Active CN107299114B (zh) 2017-08-23 2017-08-23 一种高效的酵母菌染色体融合方法

Country Status (1)

Country Link
CN (1) CN107299114B (zh)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6261500B2 (ja) 2011-07-22 2018-01-17 プレジデント アンド フェローズ オブ ハーバード カレッジ ヌクレアーゼ切断特異性の評価および改善
US20150044192A1 (en) 2013-08-09 2015-02-12 President And Fellows Of Harvard College Methods for identifying a target site of a cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9340799B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College MRNA-sensing switchable gRNAs
US9526784B2 (en) 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
US9388430B2 (en) 2013-09-06 2016-07-12 President And Fellows Of Harvard College Cas9-recombinase fusion proteins and uses thereof
US9840699B2 (en) 2013-12-12 2017-12-12 President And Fellows Of Harvard College Methods for nucleic acid editing
WO2016022363A2 (en) 2014-07-30 2016-02-11 President And Fellows Of Harvard College Cas9 proteins including ligand-dependent inteins
US20190225955A1 (en) 2015-10-23 2019-07-25 President And Fellows Of Harvard College Evolved cas9 proteins for gene editing
KR102547316B1 (ko) 2016-08-03 2023-06-23 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 아데노신 핵염기 편집제 및 그의 용도
AU2017308889B2 (en) 2016-08-09 2023-11-09 President And Fellows Of Harvard College Programmable Cas9-recombinase fusion proteins and uses thereof
US11542509B2 (en) 2016-08-24 2023-01-03 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
KR20240007715A (ko) 2016-10-14 2024-01-16 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 핵염기 에디터의 aav 전달
US10745677B2 (en) 2016-12-23 2020-08-18 President And Fellows Of Harvard College Editing of CCR5 receptor gene to protect against HIV infection
US11898179B2 (en) 2017-03-09 2024-02-13 President And Fellows Of Harvard College Suppression of pain by gene editing
EP3592777A1 (en) 2017-03-10 2020-01-15 President and Fellows of Harvard College Cytosine to guanine base editor
US11268082B2 (en) 2017-03-23 2022-03-08 President And Fellows Of Harvard College Nucleobase editors comprising nucleic acid programmable DNA binding proteins
US11560566B2 (en) 2017-05-12 2023-01-24 President And Fellows Of Harvard College Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation
WO2019023680A1 (en) 2017-07-28 2019-01-31 President And Fellows Of Harvard College METHODS AND COMPOSITIONS FOR EVOLUTION OF BASIC EDITORS USING PHAGE-ASSISTED CONTINUOUS EVOLUTION (PACE)
WO2019139645A2 (en) 2017-08-30 2019-07-18 President And Fellows Of Harvard College High efficiency base editors comprising gam
US11795443B2 (en) 2017-10-16 2023-10-24 The Broad Institute, Inc. Uses of adenosine base editors
CN107858346B (zh) * 2017-11-06 2020-06-16 天津大学 一种敲除酿酒酵母染色体的方法
CN107988202B (zh) * 2017-11-27 2020-09-04 天津大学 一种敲除酿酒酵母染色体的方法
CA3130488A1 (en) 2019-03-19 2020-09-24 David R. Liu Methods and compositions for editing nucleotide sequences
GB2614813A (en) 2020-05-08 2023-07-19 Harvard College Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106480083A (zh) * 2015-08-26 2017-03-08 中国科学院上海生命科学研究院 CRISPR/Cas9介导的大片段DNA拼接方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102274445B1 (ko) * 2013-12-19 2021-07-08 아미리스 인코퍼레이티드 게놈 삽입을 위한 방법
US10513711B2 (en) * 2014-08-13 2019-12-24 Dupont Us Holding, Llc Genetic targeting in non-conventional yeast using an RNA-guided endonuclease

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106480083A (zh) * 2015-08-26 2017-03-08 中国科学院上海生命科学研究院 CRISPR/Cas9介导的大片段DNA拼接方法

Also Published As

Publication number Publication date
CN107299114A (zh) 2017-10-27

Similar Documents

Publication Publication Date Title
CN107299114B (zh) 一种高效的酵母菌染色体融合方法
KR102015116B1 (ko) 표적 단백질을 코딩하는 폴리뉴클레오티드를 포함하는 재조합 미생물로부터 유래한 세포외 소낭 및 그의 용도
CN110191955A (zh) 在体外和体内对工程化的细胞中表达的化学物质诱导的信号传导复合物进行外源性药物激活的方法
KR102450833B1 (ko) 혈우병 a 치료용 유전자 요법
CN111850034B (zh) 一种基因编辑的载体和方法
CN113502235B (zh) 一种强化表达内质网大小调节因子的酿酒酵母菌株的构建和应用
KR20130020842A (ko) 유전적으로 변형된 광합성 생물들의 고처리량 스크리닝
KR20210005179A (ko) 헤모글로빈-관련 돌연변이를 편집하기 위한 상동성-지정 복구 주형 설계 및 전달
CN111542610A (zh) 精确基因组编辑的新策略
KR102330593B1 (ko) 신규 이소프렌 신타아제 및 이를 이용한 이소프렌의 제조방법
CN114041417A (zh) 一种植物快速育种方法
CN108992665B (zh) 基于重组减毒单增李斯特菌的宫颈癌治疗性疫苗
CN112501101B (zh) 天然除草剂thaxtomins的高产菌株及其制备方法和用途
CN107064184B (zh) 一种同步x射线可见的成像标签及其制备方法
CN110836903B (zh) 一种同步x射线可见的多色成像标签及其制备方法
CN109010819B (zh) 重组减毒李斯特菌在制备宫颈癌治疗性疫苗中的应用
CN112575030A (zh) 一种利用浮萍表达系统制备草鱼呼肠孤病毒口服亚单位疫苗的方法
CN108913644A (zh) 一种基因组携带外源基因的减毒重组单增李斯特菌及制备方法
KR102553825B1 (ko) 표적 단백질을 코딩하는 폴리뉴클레오티드를 포함하는 재조합 미생물로부터 유래한 세포외 소낭 및 그의 용도
CN112094794A (zh) 一种产MTSase和MTHase的方法及应用
CN111926032B (zh) 植物花斑蛋白hb1及其编码基因在调控植物花斑表型中的应用
KR102173211B1 (ko) 글루코스와 자일로스 동시전환 효모균주
CN111388658B (zh) 基于重组减毒李斯特菌的kras高表达癌症疫苗及其制备方法及其应用方法
CN112831524B (zh) 人工改造的重组腺病毒载体、由其包装的病毒及其应用
CN114839382A (zh) 一种在酵母中建立基于红色荧光蛋白的双分子荧光互补系统的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20200609

Address after: 200032 building 4, No. 300 Fenglin Road, Xuhui District, Shanghai

Applicant after: Center for excellence and innovation in molecular plant science, Chinese Academy of Sciences

Address before: 200031, 319 Yueyang Road, Shanghai, Shanghai, Xuhui District

Applicant before: SHANGHAI INSTITUTES FOR BIOLOGICAL SCIENCES, CHINESE ACADEMY OF SCIENCES

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant