CN108866050A - 一种高效的基因工程载体 - Google Patents

一种高效的基因工程载体 Download PDF

Info

Publication number
CN108866050A
CN108866050A CN201710331370.7A CN201710331370A CN108866050A CN 108866050 A CN108866050 A CN 108866050A CN 201710331370 A CN201710331370 A CN 201710331370A CN 108866050 A CN108866050 A CN 108866050A
Authority
CN
China
Prior art keywords
gene
construction object
genome
nucleotide construction
nucleotide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710331370.7A
Other languages
English (en)
Other versions
CN108866050B (zh
Inventor
姜有为
李云飞
杜正伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HANGZHOU JINGYINKANG BIOTECHNOLOGY Co Ltd
Original Assignee
HANGZHOU JINGYINKANG BIOTECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by HANGZHOU JINGYINKANG BIOTECHNOLOGY Co Ltd filed Critical HANGZHOU JINGYINKANG BIOTECHNOLOGY Co Ltd
Priority to CN201710331370.7A priority Critical patent/CN108866050B/zh
Priority to PCT/CN2018/086343 priority patent/WO2018205977A1/zh
Publication of CN108866050A publication Critical patent/CN108866050A/zh
Application granted granted Critical
Publication of CN108866050B publication Critical patent/CN108866050B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/10Biofuels, e.g. bio-diesel

Landscapes

  • Genetics & Genomics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Chemical & Material Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Plant Pathology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明提供具有5’‑A1‑B1‑C‑B2‑A2‑D‑3’或5’‑D‑A1‑B1‑C‑B2‑A2‑3’所示结构的核苷酸构建物,其中A1、A2是同向重复序列,B1、B2是反向重复序列,C是标记基因,D是外源基因表达盒。本发明还提供包含所述核苷酸构建物的表达载体以及在其基因组中整合有所述核苷酸构建物的宿主细胞。本发明的核苷酸构建物及载体通过两次重组而将大量外源基因整合在基因组中,能够有效循环使用选择标记,专一性地破坏基因组中的靶基因的表达,或者保持靶基因的正常表达,从而可广泛应用于完成基因组大规模改造项目。

Description

一种高效的基因工程载体
技术领域
本发明涉及生物技术领域;具体地说,本发明涉及通过两次重组而将大量外源基因整合在基因组中,同时避免破坏宿主细胞基因的新型基因工程载体。
背景技术
酵母在现代生物工程技术中有许多应用。随着代谢工程、系统生物学与合成生物学的发展,酵母成为重要的生物系统,应用于生产各种小分子化合物,包括酒精类、糖衍生物类、有机酸类、脂肪类、萜类、芳香类、和酮类化合物(Leqian Liu,Heidi Redden and HalS Alper,Frontiers of yeast metabolic engineering:diversifying beyond ethanoland Saccharomyces,Current Opinion in Biotechnology 2013,24:1023–1030)。常规酵母,酿酒酵母(Saccharomyces cerevisiae),是一种被全面研究的模式真核生物,在基因工程技术发展早期就应用于生物医药产品的表达生产。1987年用酿酒酵母生产的重组人胰岛素获得成功后,目前已经有几十种酿酒酵母生产的药品在欧美获得批准进入市场。随后非常规酵母,例如巴斯德毕赤酵母(毕赤酵母)(Pichia pastoris)、多形汉森酵母(Hansenulapolymorpha)、和乳酸克鲁维酵母(Kluyveromyces lactis)等也发展成为具有前景的重组蛋白表达系统。首个用毕赤酵母生产的激肽释放酶血管舒缓素抑止剂(Kallikreininhibitor)已于2009年在美国进入市场,而且还有其它产品正在临床试验中(Walsh,Biopharmaceutical benchmarks,Nat Biotechnol 2010;28:917–24)。
在合成生物领域的最新发展,包括酵母人源糖基化工程和代谢工程等,需要对生物细胞进行基因工程改造,将许多外源基因整合在基因组中进行表达,构建有利于表达生产不同目标产品的生物细胞。为了完成复杂的基因工程项目,需要有不同的载体、选择标记、和基因组位点可供选择使用。
但是当载体通过单交换重组整合在基因组靶基因位点,会导致靶基因的重复,形成同向重复序列。同向重复序列之间可以再次发生同源重组,切除整合的外源载体,恢复靶基因原来的状态。而且,由于通过不同位置的同向重复序列之间的同源重组可以将靶基因恢复成野生型或者缺陷型的状态,无法通过选择筛选条件来防止这个重组切除载体过程的发生。因此,载体通过单交换重组整合在基因组中,具有遗传不稳定性。
与单交换重组不同,双交换重组能够将外源基因稳定整合在基因组中,是基因工程改造的优先选择。目前有几个载体,包括pPIC9,pPIC3.5,pHIL-D2,and pHIL-S1(Invitrogen Corp.,Carlsbad,CA),可以通过双交换重组用外源基因取代毕赤酵母的AOX1基因编码区,结果产生MutS表型,在有甲醇的培养基中生长缓慢。另一类载体也可用于将外源基因稳定整合在毕赤酵母的基因组中,它将URA5基因两端连接同向重复的lacZ序列,然后与UDP-葡萄糖转运蛋白(UDP-GlcNAc-transporter)基因相连,通过最外面两端连接的同源重组基因序列,双交换重组替换基因组的OCH1基因。然后在5-FOA的反选择条件下,利用同向重复lacZ序列间的重组,去除URA5基因,将UDP-葡萄糖转运蛋白基因和一个lacZ序列稳定整合在基因组的OCH1基因座上(Nett JH,Gerngross TU,Cloning and disruption ofthe PpURA5 gene and construction of a set of integration vectors for thestable genetic modification of Pichia pastoris,Yeast.2003,20:1279-90)。
目前通过这些载体的双交换重组,主要将外源基因整合在个别已知编码非必需蛋白的基因座上,破坏这些基因座编码的蛋白质不会影响宿主的生存。但是在基因组中已知编码非必需蛋白质的基因座数量很少,无法满足整合大量外源基因的需求。
应用目前的基因操作技术对基因组进行大规模改造受到许多限制,主要在于缺乏可供大量使用的表达载体、选择标记,以及编码非必需蛋白的基因座。
因此,需要开发新的方法和材料,克服这些限制,将大量外源基因整合在基因组中,同时避免破坏宿主细胞基因的正常生理功能,这样才能够使专业技术人员在合成生物领域完成复杂的基因工程项目。
发明内容
本发明的目的在于提供一种核苷酸构建物,所述核苷酸构建物能够将大量外源基因整合在基因组中,同时避免破坏宿主细胞基因的正常生理功能,并且基因组中的任何开放阅读框都可以用作外源基因的整合位点,从而能广泛应用于基因组的大规模改造。
在第一方面,本发明提供一种核苷酸构建物,所述核苷酸构建物具有如下式所示的结构:
5’-A1-B1-C-B2-A2-D-3’ I;
其中,
A1、A2是同向重复序列;
B1、B2是反向重复序列;
C是标记基因;
D是外源基因表达盒;
或者
所述核苷酸构建物具有如下式所示的结构:
5’-D-A1-B1-C-B2-A2-3’ II;
其中
A1、A2是同向重复序列;
B1、B2是反向重复序列;
C是标记基因;
D是外源基因表达盒。
在具体的实施方式中,所述B1或B2也可以是C的反向重复序列,当B1或B2是C的反向重复序列时,B1和B2中的另一个不存在。
在具体的实施方式中,所述同向重复序列是25-700bp,优选100-500bp,更优选200-400bp的同向重复序列。
在具体的实施方式中,所述同向重复序列是外源转录终止子或外源转录启动子。
在优选的实施方式中,所述外源转录终止子包括但不限于:酿酒酵母的ADH1、CYC1、和TIF51A等转录终止子;毕赤酵母的ALG6、AOD、AOX1、ARG4、PMA1和TEF1等转录终止子。
在优选的实施方式中,所述外源转录启动子包括但不限于:酿酒酵母的ADH1、GAP、PGK1和TEF1等启动子;毕赤酵母的GAP、ILV5、PGK1和TEF1等启动子,AOX1和FLD1等诱导启动子。
在优选的实施方式中,所述反向重复序列是600-1200bp,优选700-1000bp的反向重复序列。
在优选的实施方式中,所述反向重复序列包括但不限于:大肠杆菌(E.coli)lacZ基因、沙门氏菌(Salmonella)hisG基因、毕赤酵母URA3基因、毕赤酵母URA5基因、其它标记基因等。
在优选的实施方式中,所述核苷酸构建物中可以包含多个外源基因表达盒或多个标记。
在优选的实施方式中,式I所示核苷酸构建物中的所述外源基因表达盒中可以不含自身的转录终止子;式II所示核苷酸构建物中的所述外源基因表达盒中可以不含自身的转录启动子。
在具体的实施方式中,所述核苷酸构建物在5’端和3’端还包含同源臂。
在具体的实施方式中,所述核苷酸构建物还可以包含当所述核苷酸构建物形成环状时,能够在宿主细胞(例如,细菌)中复制所需的其它基因X,优选细菌复制起点和抗生素耐受性基因,所述其它基因X不能位于所述外源基因表达盒和与所述外源基因表达盒紧邻的同向重复序列之间、也不能位于所述外源基因表达盒和与所述外源基因表达盒紧邻的同源臂之间。
在具体的实施方式中,所述其它基因X可以在A1和A2之间;优选地,所述其它基因X在B1和B2之间。
在优选的实施方式中,所述核苷酸构建物具有如下式所示的结构:
5’-A1-B1-X-C-B2-A2-D-3’
5’-A1-B1-C-X-B2-A2-D-3’
5’-A1-B1-X-C-A2-D-3’
5’-A1-C-X-B2-A2-D-3’;
或者,所述核苷酸构建物具有如下式所示的结构:
5’-D-A1-B1-X-C-B2-A2-3’
5’-D-A1-B1-C-X-B2-A2-3’
5’-D-A1-B1-X-C-A2-3’
5’-D-A1-C-X-B2-A2-3’。
在进一步的优选实施方式中,所述核苷酸构建物具有如下式所示结构:
5’-H1-A1-B1-C-B2-A2-D-H2-3’;
5’-H1-A1-B1-X-C-B2-A2-D-H2-3’;
5’-H1-A1-B1-C-X-B2-A2-D-H2-3’;
5’-H1-A1-B1-X-C-A2-D-H2-3’;
5’-H1-A1-C-X-B2-A2-D-H2-3’;
或者
5’-H1-D-A1-B1-C-B2-A2-H2-3’;
5’-H1-D-A1-B1-X-C-B2-A2-H2-3’;
5’-H1-D-A1-B1-C-X-B2-A2-H2-3’;
5’-H1-D-A1-B1-X-C-A2-H2-3’;
5’-H1-D-A1-C-X-B2-A2-H2-3’。
在第二方面,本发明提供一种表达载体,所述表达载体包含本发明第一方面所述的核苷酸构建物。
在第三方面,本发明提供一种宿主细胞,所述宿主细胞在其基因组中整合有本发明第一方面所述的核苷酸构建物。
在优选的实施方式中,所述宿主细胞包括但不限于:真核和原核宿主宿主细胞,例如大肠杆菌(E.coli)、假单胞菌属(Pseudomonas spp.)、芽胞杆菌属(Bacillus spp.)、链霉菌属(Streptomyces spp.)、真菌和酵母菌,昆虫细胞,例如草地贪夜蛾(Spodopterafrugiperda)(SF9),动物细胞,例如中国仓鼠卵巢细胞(Chinese hamster ovary cell)(CHO)、小鼠细胞、非洲绿猴细胞,培养的人类细胞和植物细胞。
在优选的实施方式中,所述酵母菌和真菌包括但不限于:酿酒酵母(Saccharomyces cerevisiae),粟酒裂殖酵母(Schizosaccharomyces pombe),巴斯德毕赤酵母(毕赤酵母)(Pichia pastoris),多形汉森酵母(Hansenula polymorpha)、脂耶罗威亚酵母(Yarrowia lipolytica)、树干毕赤酵母(Pichia stipitis)和乳酸克鲁维酵母(Kluyveromyces lactis),乳头假丝酵母(Candida albicas),构巢曲霉(Aspergillusnidulans),黑曲霉(Aspergillus niger),里氏木霉(Trichoderma reesei)等。
在优选的实施方式中,所述宿主细胞是酵母,更优选巴斯德毕赤酵母。
在第四方面,本发明提供一种对宿主细胞进行基因改造的方法,所述方法包括利用本发明第一方面所述的核苷酸构建物整合外源基因。
在具体的实施方式中,所述方法包括以下步骤:
a.构建本发明第一方面所述的核苷酸构建物;
b.通过同源重组将式I所示核苷酸构建物功能性整合在基因组开放阅读框(ORF)的翻译终止无义密码子(TAA)的下游;或者,
通过同源重组将式II所示核苷酸构建物功能性整合在基因组开放阅读框(ORF)的起始密码子(ATG)上游;和
c.通过第二次同源重组去除式I或式II所示核苷酸构建物中的同向重复序列、反向重复序列、标记基因和反向重复序列与标记基因之间的其它基因,从而仅仅将式I或式II所示核苷酸构建物中的一个同向重复序列和外源性基因表达盒整合在宿主细胞的基因组中。
在具体的实施方式中,所述将式I所示核苷酸构建物功能性整合在基因组开放阅读框(ORF)的翻译终止无义密码子(TAA)的下游是指式I所示核苷酸构建物位于基因组开放阅读框(ORF)的翻译终止无义密码子(例如TAA,等)的第三个核苷酸到其下游另一个开放阅读框(ORF)的转录启动子或终止子之外的区域,优选到其下游的300个核苷酸之间;最优选地,式I所示核苷酸构建物紧邻基因组开放读框(ORF)的翻译终止无义密码子(例如TAA,等);
所述将式II所示核苷酸构建物功能性整合在基因组开放阅读框(ORF)的起始密码子(ATG)上游是指式II所示核苷酸构建物位于基因组开放阅读框(ORF)起始密码子(ATG)的第一个核苷酸到其上游另一个开放阅读框(ORF)的转录启动子或终止子之外的区域,优选到其上游的300个核苷酸之间;最优选地,式II所示核苷酸构建物紧邻基因组开放读框(ORF)的起始密码子(ATG)。
在优选的实施方式中,所述宿主细胞包括但不限于:真核和原核宿主宿主细胞,例如大肠杆菌(E.coli)、假单胞菌属(Pseudomonas spp.)、芽胞杆菌属(Bacillus spp.)、链霉菌属(Streptomyces spp.)、真菌和酵母菌,昆虫细胞,例如草地贪夜蛾(Spodopterafrugiperda)(SF9),动物细胞,例如中国仓鼠卵巢细胞(Chinese hamster ovary cell)(CHO)、小鼠细胞、非洲绿猴细胞,培养的人类细胞和植物细胞。
在优选的实施方式中,所述酵母菌和真菌包括但不限于:酿酒酵母(Saccharomyces cerevisiae),粟酒裂殖酵母(Schizosaccharomyces pombe),巴斯德毕赤酵母(毕赤酵母)(Pichia pastoris),多形汉森酵母(Hansenula polymorpha)、脂耶罗威亚酵母(Yarrowia lipolytica)、树干毕赤酵母(Pichia stipitis)和乳酸克鲁维酵母(Kluyveromyces lactis),乳头假丝酵母(Candida albicas),构巢曲霉(Aspergillusnidulans),黑曲霉(Aspergillus niger),里氏木霉(Trichoderma reesei)等。
在优选的实施方式中,所述宿主细胞是酵母,更优选巴斯德毕赤酵母。
在第五方面,本发明提供本发明第一方面所述的核苷酸构建物或本发明第二方面所述的表达载体在对宿主细胞进行基因改造中的用途。
在第六方面,本发明提供采用本发明第五方面所述的方法改造的宿主细胞的用途,所述菌株应用于代谢工程、系统生物学与合成生物学等领域;包括但不限于:所述菌株用于生物催化反应,或者所述菌株用于生产重组蛋白。
在一优选例中,所述重组蛋白中的糖基化模式得到改变。
应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合,从而构成新的或优选的技术方案。限于篇幅,在此不再一一累述。
附图说明
图1A描述了将外源转录终止子(DR-TT)和基因表达盒(P2-GOI-TT2)整合在基因组开放阅读框(ORF)的翻译终止无义密码子(TAA)后面,不破坏开放阅读框的表达。在这个方法中,选择标记切除后可以反复用于将不同的基因整合在不同的基因座上。载体组分未按比例绘制。
图1B描述了将外源转录启动子(DR-P)和基因表达盒(P2-GOI-TT2)整合在基因组开放阅读框(ORF)的起始密码子(ATG)前面,不破坏开放阅读框(ORF)的表达。在这个方法中,选择标记切除后可以反复用于将不同的基因整合在不同的基因座上。载体组分未按比例绘制。
图2A描述了构建pLUL载体的示意图,载体组分未按比例绘制。
图2B描述了构建pLUL-cCeMnsI表达载体的示意图,载体组分未按比例绘制。
图2C描述了pLUL-cCeMnsI表达载体整合在och1基因座表达杂合cCeMnsI,载体组分未按比例绘制。
图2D显示PCR结果确认pLUL-cCeMnsI表达载体整合在och1基因座。
图3显示用杂合cCeMnsI表达菌生产的mIL-22释放的N-糖链的质谱图。
图4A描述了构建pUC-KOade载体的示意图,载体组分未按比例绘制。
图4B描述了pUC-KOade载体整合在ADE1基因座,然后切除ADE1、URA3和IR基因的示意图,载体组分未按比例绘制。
图4C显示PCR结果确认pUC-KOade载体整合在ADE1基因翻译终止无义密码子下游的指定位点(+53/+54)。
图4D显示PCR结果确认在基因组中切除ADE1、URA3和IR基因。
图5A描述了构建pIDU载体的示意图,载体组分未按比例绘制。
图5B描述了构建pIDU-cCeMnsI表达载体,载体组分未按比例绘制。
图5C描述了将pIDU-cCeMnsI表达载体整合在och1基因座及切除URA3和lacZ的示意图,载体组分未按比例绘制。
图5D显示PCR结果确认pIDU-cCeMnsI表达载体整合在och1基因座。
图5E显示PCR结果确认在基因组中切除URA3和lacZ基因。
图6A描述了构建pIDU-cAtMnsI表达载体,载体组分未按比例绘制。
图6B描述了将pIDU-cAtMnsI表达载体整合在ARG4基因座及切除URA3和lacZ的示意图,载体组分未按比例绘制。
图6C显示PCR结果确认在基因组中切除URA3和lacZ基因。
具体实施方式
发明人经过广泛而深入的研究,出乎意料地发现一种新型基因工程载体,该载体通过两次重组而将大量外源基因整合在基因组中,能够有效循环使用选择标记,专一性地破坏基因组中的靶基因的表达,或者保持靶基因的正常表达,从而可广泛应用于完成基因组大规模改造项目。在此基础上完成了本发明。
本发明涉及用于载体将外源基因稳定整合在基因组的方法和材料。本文所用的术语根据以下定义。
"基因打靶"是在基因组上整合外源DNA的方法,通常导致靶基因的改造、替换或复制。这种机制适用于所有生物体。
“Ends-in”和“Ends-out”是指可用于经同源重组整合外源性DNA进入基因组的两种不同方式。“Ends-in”方式的基因打靶中,当外源DNA与基因组中的同源区域配对时,线性外源DNA的末端指向彼此,通过单交换重组(single cross-over recombination,“rollin”)将DNA整合进入基因组。但重组后由于产生同向的重复序列,可以再通过重复序列间的同源重组切除外源DNA,恢复靶基因原来的状态。“ends-out”方式的基因打靶中,当外源DNA与基因组中的同源区域配对时,线性外源DNA的末端背离彼此,通过末端靶向侧翼和宿主基因组的同源序列之间的双交换重组将DNA插入基因组中。“Ends-out”打靶常用于小鼠和酵母,因为它可以直接替换或删除靶基因。不过,“ends-out”发生的概率远低于“ends-in”事件。(Paques andHaber 1999,Microbiology and Molecular Biology Reviews,63:349–404)。在本发明中,基因打靶是指“ends-out”双交换同源重组,除非专门表明是通过单交换同源重组的“ends-in”打靶(roll-in)。
"细胞"或"机体"是用于实施本发明的基因打靶的机体的术语。
可用于本发明的宿主细胞的例子包括典型的真核和原核宿主,例如大肠杆菌(E.coli)、假单胞菌属(Pseudomonas spp.)、芽胞杆菌属(Bacillus spp.)、链霉菌属(Streptomyces spp.)、真菌和酵母菌,昆虫细胞,例如草地贪夜蛾(Spodopterafrugiperda)(SF9),动物细胞,例如中国仓鼠卵巢细胞(Chinese hamster ovary cell)(CHO)、小鼠细胞、非洲绿猴细胞,培养的人类细胞和植物细胞。
酵母菌和真菌包括但不限于酿酒酵母(Saccharomyces cerevisiae),粟酒裂殖酵母(Schizosaccharomyces pombe),巴斯德毕赤酵母(毕赤酵母)(Pichia pastoris),多形汉森酵母(Hansenula polymorpha)、脂耶罗威亚酵母(Yarrowia lipolytica)、树干毕赤酵母(Pichia stipitis)和乳酸克鲁维酵母(Kluyveromyces lactis),乳头假丝酵母(Candida albicas),构巢曲霉(Aspergillus nidulans),黑曲霉(Aspergillus niger),里氏木霉(Trichoderma reesei)等。酵母是优选的本发明宿主细胞。巴斯德毕赤酵母是更优选的宿主细胞。
"细胞转化"是指外源DNA导入细胞的过程。一般是指将外源DNA整合到细胞的基因组中或导入可自我复制质粒的过程。
将打靶盒或载体引入宿主细胞以供同源重组。可按照本领域技术人员熟知的方法进行宿主细胞的转化和转染。
合适的转化方法包括病毒感染、转染、接合、原生质体融合、电穿孔、基因枪技术、磷酸钙沉淀、直接显微注射等等。方法的选择通常依赖于所转化的细胞类型和进行转化的条件。这些方法的常规讨论可在文献中查阅(Ausubel,et al.,Short Protocols inMolecular Biology,3rd ed.,Wiley&Sons,1995)。
例如,可采用不同的方法实施酵母转化,包括球形体方法、电穿孔、聚乙二醇方法、碱性阳离子方法等等[Gregg JM(2010)Pichia Protocols,Second edition.Totowa,NewJersey:Humanna Press]。
"靶基因"″或"目标基因"是指通过本发明的方法予以改变的细胞内的基因或DNA区段。靶基因可以是宿主基因组中的任何DNA片段或先前导入机体的外源DNA片段,包括但不限于多肽编码区、开放阅读框(ORF)、控制区、内含子、外显子或它们的一部分。
5'和3'区域的核苷酸编号是指将基因组开放阅读框(ORF)的相应起始密码子(ATG)作为核苷酸1至3,其5’上游区域用负号编号;而相应的翻译终止无义密码子(如TAA)作为核苷酸+1至+3,其3'下游区域用加号编号。
打靶载体也可称为载体。用于重组DNA技术的载体通常是"质粒"的形式。在本说明书中,术语"载体"和"质粒"可互换使用。
表达盒作为载体的一部分,在细胞内生成RNA和蛋白质。它的组成包括,但不限于,转录启动子序列,开放阅读框和转录终止子序列按已知的位置和方向排列。
在本文中,“同源臂”具有与本领域技术人员常规理解相同的意义,是指待插入的外源序列两侧的、与基因组序列完全一致的侧翼序列,用于识别并发生重组的区域。因此,鉴于本发明的内容,本领域技术人员可以自行选择和决定同源臂的长度。
类似地,在本文,某区域与相应基因区域同源表示该区域与所述基因区域的碱基序列有至少90%、优选至少92%、更优选至少94%、还要更优选至少96%、还要更优选至少98%、还要更优选至少99%、最优选100%相同。这种“同源区域”优选源自所述的基因区域。
同源重组区域的长度不作特别限定。该区域的长度优选适于发生同源重组。因此,该区域的长度至少40个碱基对。
当考虑将本发明的载体转入细菌细胞传代时,优选载体中包含细菌复制起点和抗生素耐受性基因,以确保细菌传代过程中保有该载体。细菌复制起点包括fl-ori、colisin、col El和本领域已知的其它起点。抗生素耐受性基因包括氨苄青霉素(Ampicillin,Amp)、博莱霉素(zeocin)、卡那霉素(kanamycin,kan)、四环素(Tetracyclines)耐受性基因和本领域已知的其它抗生素耐受性基因。
"标记"代表基因或序列,其存在或不存在提供机体的可检测表型。可利用一种或多种标记选择和筛选基因打靶事件。可用于本发明的不同类型的标记包括但不限于选择标记、筛选标记,等。
选择标记基因的表达可以使得机体具有对一组特定条件耐受或敏感的表型。选择标记包括对不同抗生素的耐受基因,例如Sh ble基因耐博莱霉素(zeocin),neo基因耐受卡那霉素(kanamycin,kan)或遗传霉素(geneticin,G418),灭瘟素脱氨酶(blasticidin Sdeaminase)基因耐受杀稻瘟菌素(blasticidin),nat基因耐受诺尔丝菌素(nourseothricin),潮霉素磷酸转移酶基因耐受潮霉素(hygromycin),以及本领域已知的其它抗生素耐受性基因等。
可选择标记体系由营养缺陷突变型宿主菌株和野生型生物基因构成,补充宿主对不完全培养基的缺陷,例如,酿酒酵母或毕赤酵母ADE1、ARG4、HIS4和URA3野生型基因可分别用于ade1、arg4、his4和ura3营养缺陷型酵母的转化,以及在本领域已知的其它基因。
筛选标记传递可观察和可区分的特征。可筛选标记包括荧光蛋白,例如绿色荧光蛋白(GFP)、报道酶,例如β-半乳糖苷酶(lacZ)、碱性磷酸酶(AP)、β-内酰胺酶、β-葡萄糖醛酸酶、谷胱甘肽S-转移酶(GST)、荧光素酶和本领域已知的其它酶。
反选择标记包括URA3、URA5、TRP、LYS、T-urf13、mazf、和本领域已知的其它标记。这些反选择标记常在某些条件下是毒性的或对于复制是抑制性的。反选择条件常涉及暴露于特定底物或生长条件的改变。例如在含有5-氟乳清酸(5-Fluoroorotic acid,5-FOA)的培养基中,URA3或URA5原养型酵母能将5-FOA通过代谢转化为有毒的化合物,进而杀死URA3或URA5原养型酵母,但是不会杀死ura3或ura5尿嘧啶营养缺陷型酵母。
本发明开发的一种载体能将大量外源基因稳定整合在基因组中。这类载体的组成,主要包括但不局限于选择标记、反选择标记、反向重复序列、同向重复序列、外源基因、同源重组序列、抗生素耐受性基因和复制起点等诸部分。这些部分可以相连形成环状载体。如果需要的话,该环状载体在诸部分之间可以含有其它部分和接头。然而,本发明也应包括功能等价的其它形式载体。
优选的选择标记和反选择标记包括酵母的URA3、URA5、TRP、LYS、T-urf13、mazf和本领域已知的其它标记。
反向重复序列(IR)是两个相同的核酸序列以相反的方向排列。互补的反向重复序列在双链DNA中能通过发夹环或茎环形成十字结构。反向重复序列的长度优选有利于同向重复序列间的同源重组,同时减少基因组的随机整合。本发明选择600-1200个碱基对(bp),优选700-1000个碱基对(bp)的反向重复序列。反向重复序列可以是任何基因序列,优选外源基因序列或者选择标记、反选择标记的部分序列。
同向重复序列(DR)是两个相同的核酸序列以相同的方向排列。同向重复序列的长度优选适于发生同源重组,同时减少基因组的随机整合。因此,本发明选择25-700个碱基对(bp),优选100-500个碱基对(bp),更优选200-400个碱基对(bp)的同向重复序列。同向重复序列可以是任何基因序列,优选在基因组中能发挥功能的转录启动子和转录终止子。
选择标记和反选择标记(C)侧接反向重复序列(B1、B2),一个位于上游侧(5’端一侧),另一个位于下游侧(3’端一侧);反向重复序列再侧接同向重复序列(A1、A2);外源基因表达盒(D)一端与同向重复序列相连,另一端与一个同源重组序列相连;同向重复序列的另一端与另一个同源重组序列相接;两个同源重组序列(H1、H2)通过与细菌复制起点和抗生素耐受性基因(X)相连形成环状载体,能够直接在宿主细胞(例如,细菌)中复制传代。环状载体通过酶切线性化,去除细菌复制起点和抗生素耐受性基因(X)后,形成线性载体,应用于同源重组。下面是一种环状载体通过酶切线性化形成线性载体示例:5’-H1-A1-B1-C-B2-A2-D-H2-3’。
另一种方式,首先将选择标记和反选择标记(C)、细菌复制起点和抗生素耐受性基因(X)互相连接后,再侧接反向重复序列(B1、B2),然后再侧接同向重复序列(A1、A2);外源基因(D)一端与同向重复序列相连,它们的另一端分别侧接同源序列形成环状载体,能够直接在宿主细胞(例如,细菌)中复制传代。这里的上游同源序列(5’H(H1))的5’端与下游同源序列(3’H(H2))的3’端之间有限制性内切位点,用于线性化。优选上游同源序列的5’端带有一半限制性内切位点(如GCT),下游同源序列的3’端带有另一半限制性内切位点(如AGC),用重叠PCR将两者拼接,由此产生限制性内切位点(如AGCGCT用于Afe I),用于酶切线性化,应用于同源重组。下面是一种环状载体通过酶切线性化后,形成的线性载体示例:5’-H1-A1-B1-X-C-B2-A2-D-H2-3’。
另一方面,本发明提供线性载体,可利用限制性酶消化使环状载体线性化,或者可通过基因化学合成得到。为简便起见,该线性载体在本文还可称为“基因整合片段”、“打靶盒”、“线性打靶载体”或“打靶片段”。该线性载体用于将外源基因整合入宿主的基因组中,从而该外源基因能在该宿主中行使功能。
线性载体的主要构成包括:选择标记和反选择标记侧接反向重复序列,然后侧接同向重复序列,然后再侧接外源基因表达盒,最外面侧接同源重组序列。
线性载体通过双交换同源重组稳定整合在宿主基因组后,在反选择条件下,由于反向重复序列的内在不稳定性,能促使同向重复序列高效重组,将选择标记和反选择标记进行自我切除,在基因组中稳定留下一段同向重复序列和外源基因表达盒。
图1A描述了在基因组开放阅读框翻译终止无义密码子下游整合外源基因。图中标出基因的5’调控区(5’区)、开放阅读框(ORF)和3’调控区(3’区),在5’调控区转录启动子(P1),开放阅读框的翻译起始密码子(如ATG)和翻译终止无义密码子(如TAA,TGA,TAG),3’调控区转录终止子(TT1)。线性载体中,选择标记和反选择标记侧接反向重复序列(IR),然后侧接外源的转录终止子作为同向重复序列(DR-TT),然后再侧接外源基因(gene ofinterest,GOI),最外面侧接同源重组序列。线性载体中可以连接多个标记和外源基因,而且在同向重复序列(DR-TT)或者反向重复序列(IR)与标记基因间也可以含有其它部分和接头,如抗生素耐受性基因和复制起点,等。可用于毕赤酵母的转录终止子包括,但不限于,酿酒酵母的ADH1、CYC1、和TIF51A,等转录终止子;毕赤酵母的ALG6、AOD、AOX1、ARG4、PMA1、和TEF1,等转录终止子;以及本领域已知的其它转录终止子。
中国专利申请号201510218188.1表明线性载体能通过双交换重组高效整合在翻译终止无义密码子下游。整合后开放阅读框自己的转录终止子(TT1)被替换成外源的转录终止子同向重复序列(DR-TT)。它能转录出与野生型相似的mRNA,翻译出野生型蛋白质,发挥正常功能。
因此,整合位点附近开放阅读框编码的蛋白质不会因为外源基因的整合而受到破坏。
在反选择条件下,反向重复序列(IR)的内在不稳定性促使同向重复序列(DR-TT)高效重组,将选择标记和反选择标记进行自我切除,在基因组中稳定留下一段同向重复序列(DR-TT)用作开放阅读框的转录终止子,同时留下外源基因在宿主基因组中能稳定表达。
在线性载体的整合和自我切除的过程中,开放阅读框的转录和翻译始终未受破坏,能正常发挥功能。因此,宿主基因组中的任何开放阅读框,包括生存所必需的基因,都可以用作外源基因整合的位点。同时通过线性载体的自我切除,未将任何冗余的DNA引入基因组。切除的选择标记和反选择标记可以反复使用。
另外,外源基因也可以省略其转录终止子(TT2),基因组整合后利用开放读框的转录终止子(TT1)。
图1B描述了在基因组开放读框翻译起始密码子上游整合外源基因表达盒。线性载体中,选择标记和反选择标记侧接反向重复序列(IR),然后侧接外源的转录启动子作为同向重复序列(DR-P),然后再侧接外源基因(GOI),最外面侧接同源序列。线性载体中可以连接多个标记和外源基因,而且在同向重复序列(DR-TT)或者反向重复序列(IR)与标记基因间也可以含有其它部分和接头,如抗生素耐受性基因和复制起点,等。可用于毕赤酵母的转录启动子包括,但不限于,酿酒酵母的ADH1、GAP、PGK1、和TEF1等启动子,毕赤酵母的GAP、ILV5、PGK1、TEF1、等启动子,AOX1和FLD1等诱导启动子,以及本领域已知的其它转录启动子。
DR-P、DR-TT、和IR一些代表例子:
中国专利申请号201510218188.1表明线性载体能通过双交换重组高效整合在翻译起始密码子上游。整合后开放阅读框自己的转录启动子(P1)被替换成外源的转录启动子同向重复序列(DR-P)。它能转录出与野生型相似的mRNA,翻译出野生型蛋白质,发挥正常功能。
因此,整合位点附近开放阅读框编码的蛋白质不会因为外源基因的整合而受到破坏。
在反选择条件下,反向重复序列(IR)的内在不稳定性促使同向重复序列(DR-P)高效重组,将选择标记和反选择标记进行自我切除,在基因组中稳定留下一段同向重复序列(DR-P)用作开放阅读框的转录启动子,同时留下外源基因在宿主基因组中能稳定表达。
在线性载体整合和自我切除的过程中,开放阅读框的转录和翻译始终未受破坏,能正常发挥功能。因此,细胞基因组中的任何开放阅读框,包括生存所必需的基因,都可以用作外源基因整合的位点。同时通过线性载体的自我切除,未将任何冗余的DNA引入基因组。切除的选择标记和反选择标记可以反复使用。
另外,外源基因可以省略其转录启动子(P2),基因组整合后利用开放阅读框的转录启动子(P1)。
除了将外源基因整合在开放阅读框的上游和下游,它也可以整合在开放阅读框的中间。这会破坏开放阅读框的表达和生物功能,因此,整合的开放阅读框应当是细胞的非必需基因。
本发明开发的这项方法和载体,能够将外源基因稳定整合在宿主的基因组中,同时极小甚至不影响整合位点附近开放阅读框的表达和功能。因此,宿主基因组中的任何开放阅读框,包括生存所必需的基因,都可以用作外源基因整合的位点。这项方法没有将任何冗余的DNA引入基因组。在这项方法中,切除的选择标记和反选择标记可以反复使用。因此,这项方法能将大量的外源基因稳定整合在宿主基因组的不同位点,可用于基因组的大规模改造,不存在现有方法受到的限制:如有限的选择标记和有限的整合位点等。
具体地说,本发明提供具有如下式所示结构的核苷酸构建物:
5’-A1-B1-C-B2-A2-D-3’ I;
其中,
A1、A2是同向重复序列;B1、B2是反向重复序列;C是标记基因;D是外源基因表达盒;
或者,具有如下式所示结构的核苷酸构建物:
5’-D-A1-B1-C-B2-A2-3’ II;
其中
A1、A2是同向重复序列;B1、B2是反向重复序列;C是标记基因;D是外源基因表达盒。
鉴于本发明的原理,本领域技术人员知晓,所述B1或B2也可以是C的反向重复序列,当B1或B2是C的反向重复序列时,B1和B2中的另一个不存在。
本领域技术人员知晓,为进行同源重组,本发明的核苷酸构建物在两端还可包含同源臂。所述同源臂可由技术人员根据具体情况确定。
由于本发明的核苷酸构建物可以形成环状,从而能够直接在宿主细胞(例如,细菌)中复制。因此,本发明的核苷酸构建物还可以包含当所述核苷酸构建物形成环状时,能够在宿主细胞(例如,细菌)中复制所需的其它基因X,优选细菌复制起点和抗生素耐受性基因,所述其它基因X不能位于所述外源基因表达盒和与所述外源基因表达盒紧邻的同向重复序列之间、也不能位于所述外源基因表达盒和与所述外源基因表达盒紧邻的同源臂之间。
在具体的实施方式中,所述其它基因X位于A1和A2之间。在优选的实施方式中,所述其它基因X位于B1和B2之间。
然而,相比于所述其它基因X在A1和A2之间的情况,所述其它基因X在所述核苷酸构建物形成环状后,包含在同源臂之间、所述核苷酸构建物的相对侧时,其构建过程更复杂些,同源臂各自需要两个不同的限制性内切位点用于与基因X相连形成环状载体,同时还需要有限制性内切位点用于酶切线性化。
在本发明的核苷酸构建物的基础上,本发明提供包含本发明核苷酸构建物的表达载体,以及其基因组中整合有本发明核苷酸构建物的宿主细胞。
本领域技术人员知晓,本发明的宿主细胞包括但不限于:真核和原核宿主宿主细胞,例如大肠杆菌(E.coli)、假单胞菌属(Pseudomonas spp.)、芽胞杆菌属(Bacillusspp.)、链霉菌属(Streptomyces spp.)、真菌和酵母菌,昆虫细胞,例如草地贪夜蛾(Spodoptera frugiperda)(SF9),动物细胞,例如中国仓鼠卵巢细胞(Chinese hamsterovary cell)(CHO)、小鼠细胞、非洲绿猴细胞,培养的人类细胞和植物细胞。进一步地,所述酵母菌和真菌包括但不限于:酿酒酵母(Saccharomyces cerevisiae),粟酒裂殖酵母(Schizosaccharomyces pombe),巴斯德毕赤酵母(毕赤酵母)(Pichia pastoris),多形汉森酵母(Hansenula polymorpha)、脂耶罗威亚酵母(Yarrowia lipolytica)、树干毕赤酵母(Pichia stipitis)和乳酸克鲁维酵母(Kluyveromyces lactis),乳头假丝酵母(Candidaalbicas),构巢曲霉(Aspergillus nidulans),黑曲霉(Aspergillus niger),里氏木霉(Trichoderma reesei)等。优选地,所述宿主细胞是酵母,更优选巴斯德毕赤酵母。
利用本发明的核苷酸构建物,本领域技术人员可以对宿主细胞进行基因改造,以整合外源基因。具体地说,所述方法包括通过同源重组将式I所示核苷酸构建物功能性整合在基因组开放阅读框(ORF)的翻译终止无义密码子(TAA)的下游;或者,将式II所示核苷酸构建物功能性整合在基因组开放阅读框(ORF)的起始密码子(ATG)的上游;然后通过第二次同源重组去除式I或式II所示核苷酸构建物中的同向重复序列、反向重复序列、标记基因和反向重复序列与标记基因之间的其它基因,从而仅仅将式I或式II所示核苷酸构建物中的一个同向重复序列和外源性基因表达盒整合在宿主细胞的基因组中。
在具体的实施方式中,式I所示核苷酸构建物位于基因组开放阅读框(ORF)的翻译终止无义密码子(例如TAA,等)的第三个核苷酸到其下游另一个开放阅读框(ORF)的转录启动子或终止子之外的区域,优选到其下游的300个核苷酸之间;最优选地,式I所示核苷酸构建物紧邻基因组开放读框(ORF)的翻译终止无义密码子(例如TAA,等);
式II所示核苷酸构建物位于基因组开放阅读框(ORF)起始密码子(ATG)的第一个核苷酸到其上游另一个开放阅读框(ORF)的转录启动子或终止子之外的区域,优选到其上游的300个核苷酸之间;最优选地,式II所示核苷酸构建物紧邻基因组开放读框(ORF)的起始密码子(ATG)。
而采用本发明方法进行基因改造的宿主细胞可以应用于代谢工程、系统生物学与合成生物学等领域;包括但不限于:用于生物催化反应,或者所述菌株用于生产重组蛋白。例如,用于改变所述重组蛋白中的糖基化模式。
本发明的优点:
1.本发明的新型基因工程载体能够将大量的外源基因整合在生物机体的基因组中,同时不影响宿主细胞的生存;
2.基因组中的任何开放阅读框都可以用作外源基因的整合位点;
3.本发明的方法没有将冗余的外源DNA引入宿主基因组中;
4.本发明的方法能够有效循环使用选择标记;
5.本发明的基因工程载体和方法可广泛应用于完成基因组大规模改造项目。
以下结合具体实施案例对本发明的技术方案进一步描述,但以下实施案例不构成对本发明的限制,所有依据本发明的原理和技术手段采用的各种施用方法,均属于本发明范围。
例如,虽然本发明的实施例在优选的毕赤酵母中进行,但是本发明也通过基因组数据库,在不同的宿主中进行。基因组数据可以从发表的科学文献和专业网站获取。例如公共数据库NCBI(www.ncbi.nlm.nih.gov)提供原核生物、真核生物、和病毒等基因组详细信息。
下列实施例中未注明具体条件的实验方法,通常按照常规条件,或按照制造厂商所建议的条件。除非另外说明,否则百分比和份数按重量计算。
实施例
材料
用于基因重组的产生、验证和应用的化学试剂、酶、培养基和溶液是常用的并且是分子和细胞生物学领域的技术人员熟知的;它们可以从许多公司获得,包括Thermo FisherScientific、Invitrogen、Sigma、New England BioLabs、Takara Biotechnology、Toyobo、TransGen Biotech和Generay Biotechnology等等。其中许多以试剂盒的形式提供。
pPIC9K、pPICZ载体获自Invitrogen。
大肠杆菌(E.coli)菌株Trans1-T1获自TransGen Biotech。
毕赤酵母GS115(his)获自Invitrogen。
JC307(his4 ura3)获自Keck Graduate Institute(KGI)。
核苷酸序列数据主要获自公共数据库NCBI(www.ncbi.nlm.nih.gov)。
方法
除非另有表示,按照分子和细胞生物学领域技术人员熟知的标准方法进行本发明所用的方法,包括聚合酶链式反应(PCR)、限制性酶克隆、DNA纯化、细菌和原核细胞培养、转化、转染和蛋白质印迹,例如以下手册所述的:Sambrook J et al.(Molecular Cloning ALaboratory Manual(Third Edition),Cold Spring Harbor Laboratory Press,ColdSpring Harbor,N.Y.,2001),Ausubel F M et al.(Current Protocols in MolecularBiology,Wiley InterScience,2010),and Gregg JM(Pichia Protocols,(Secondedition),Totowa,New Jersey:Humanna Press,2010)。
大肠杆菌菌株Trans1-T1用于构建和扩增质粒。菌株用含合适抗生素的Luria-Bertani(LB)培养基(10g/L胰蛋白胨、5g/L酵母提取物和5g/L氯化钠)或LB平板(10g/L胰蛋白胨、5g/L酵母提取物和5g/L氯化钠、20g/L琼脂)培养。抗生素的加入浓度如下所述:100mg/L氨苄青霉素、50mg/L卡那霉素)。
毕赤酵母菌株利用YPD培养基(10g/L酵母提取物、20g/L蛋白胨、20g/L葡萄糖)和YPD平板(10g/L酵母提取物、20g/L蛋白胨、20g/L葡萄糖、20g/L琼脂)培养。利用不含氨基酸的YNB培养基(67g/L酵母氮源(yeast nitrogen base)、5g/L葡萄糖)和不含氨基酸的YNB平板(67g/L酵母氮源、5g/L葡萄糖、20g/L琼脂)来选择毕赤酵母原养型菌株,视需要适当添加(抗生素)。一些毕赤酵母营养缺陷型菌株利用SC培养基(8g/L SC不含组氨酸和尿嘧啶,20g/L葡萄糖)和SC平板(8g/L SC不含组氨酸和尿嘧啶,20g/L葡萄糖,15/L琼脂)选择,视需要适当添加(抗生素)。抗生素的加入浓度如下所述:250mg/L G-418硫酸盐。
用BMGY培养基(10g/L酵母提取物、20g/L蛋白胨、13.4g/L不含氨基酸的YNB、100mM磷酸钾缓冲液(pH 6.0)、0.4mg/L生物素、10ml/L甘油)和BMMY培养基(10g/L酵母提取物、20g/L蛋白胨、13.4g/L不含氨基酸的YNB、100mM磷酸钾缓冲液(pH 6.0)、0.4mg/L生物素、10ml/L甲醇)培养毕赤酵母诱导表达蛋白。
采用乙酸锂-SDS裂解,然后进行乙醇沉淀提取酿酒酵母和毕赤酵母中的基因组DNA,该方法描述于以下出版物:Looke et al.2011,Biotechniques.50:325–328。
利用MicroPulserTM电穿孔设备,按照生产商(BioRad)的操作使用说明书,通过电穿孔进行毕赤酵母的转化。
实施例1
用pLUL载体整合MnsI在och1基因座表达
(1)构建pLUL载体
图2A描述了构建pLUL载体的示意图。
PCR1,用毕赤酵母GS115(his)基因组DNA作为模板,用URA3F(SEQ ID NO:1)和URA3lac R(SEQ ID NO:2,该引物具有lacZ重叠序列以供融合PCR)引物对作PCR扩增URA3表达盒。
PCR2,用大肠杆菌BL21基因组DNA作为模板,用URAlacZ F(SEQ ID NO:3,该引物具有URA3重叠序列以供融合PCR)和lacZGAP R(SEQ ID NO:4,该引物具有P GAP重叠序列以供融合PCR)引物对作PCR扩增lacZ编码区700个碱基片段。
PCR3,用毕赤酵母基因组DNA作为模板,用lacGAP F(SEQ ID NO:5,该引物具有lacZ重叠序列以供融合PCR)和GAPTIF R(SEQ ID NO:6,该引物具有Mlu I、Not I、BamH I、和Xho I限制性酶切位点)引物对作PCR扩增毕赤酵母甘油醛-3-磷酸脱氢酶基因的启动子(P GAP)片段。
PCR4,用酿酒酵母基因组DNA作为模板,用MNBXTIF51A F(SEQ ID NO:7该引物具有Mlu I,Not I,BamH I,and Xho I限制性酶切位点)和TIF51ANde R(SEQ ID NO:8,该引物具有Nde I限制性酶切位点)引物对作PCR扩增酿酒酵母TIF51A转录终止子片段(TIF51A TT)。
PCR5,用URA3F和TIF51ANde R引物对,通过重叠-延伸PCR连接以上四种PCR产物(1、2、3、4)。这产生了URA3-lacZ-PGAP-TIF51ATT的融合片段。
PCR6,用酿酒酵母基因组DNA作为模板,用KpnADH1 F(SEQ ID NO:9,该引物具有Kpn I限制性酶切位点)和ADH1lac R(SEQ ID NO:10,该引物具有lacZ重叠序列以供融合PCR)引物对作PCR扩增ADH1转录终止子片段(ADH1 TT)。
PCR7,用大肠杆菌BL21基因组DNA作为模板,用ADHlacZ F(SEQ ID NO:11,该引物具有ADH1 TT重叠序列以供融合PCR)和lacZURA R(SEQ ID NO:12,该引物具有URA3重叠序列以供融合PCR)引物对作PCR扩增LacZ 700个碱基片段。
PCR8,用毕赤酵母基因组DNA作为模板,用lacURA3 F(SEQ ID NO:13,该引物具有lacZ重叠序列以供融合PCR)和URA3 R(SEQ ID NO:14),引物对作PCR扩增URA3表达盒。
PCR9,用KpnADH1 F和URA3 R引物对,通过重叠-延伸PCR连接以上三种PCR产物(6、7、8)。这产生了ADH1TT-lacZ-URA3的融合片段。
PCR10,用pUC19载体作为模板,用KEPUC19(SEQ ID NO:15,引物具有Kpn I和EcoRI限制性酶切位点)和pUC19SN R(SEQ ID NO:16,该引物具有Nde I和Sse8387 I限制性酶切位点)引物对作PCR扩增氨苄青霉素耐受性基因(Ampr)和复制起点(ori)片段(Ampr-ori)。
用限制性酶消化产物后,URA3-lacZ-PGAP-TIF51ATT的NdeI/XbaI片段、ADH1TT-lacZ-URA3的KpnI/XbaI片段、和Ampr-ori的NdeI/KpnI片段,用T4连接酶环化,产生pLUL载体。
(2)构建pLUL-MnsI表达载体
图2B描述了构建pLUL-MnsI表达载体的示意图。
PCR1,用毕赤酵母基因组DNA作为模板,用ESESOCH1-5 F(SEQ ID NO:17,该引物具有EcoR I,Stu I,EcoR V and Sma I限制性酶切位点)和OCH1-5Kpn R(SEQ ID NO:18,该引物具有Kpn I限制性酶切位点)引物对作PCR扩增OCH1开放阅读框的5'上游区同源序列片段(5’H)(1014 bp),然后,将酶切5’H的EcoRI-KpnI片段插入pLUL载体的相同限制性酶切位点以产生pLUL5’H载体。
PCR2,用毕赤酵母基因组DNA作为模板,用NdeOCH1-3 F(SEQ ID NO:19,该引物具有Nde I限制性酶切位点)和OCH1-3ESSS R(SEQ ID NO:20,该引物具有EcoR I、Sma I、StuI和Sse8387I限制性酶切位点)引物对作PCR扩增OCH1开放阅读框的3'下游区同源序列片段(3’H)(1008bp),然后,将酶切3’H的NdeI-Sse83871片段插入pLUL5’H载体的相同限制性酶切位点以产生pLUL5’3’H载体。
PCR3,用酿酒酵母基因组DNA作为模板,用MluMNN10F(SEQ ID NO:21,该引物具有Mlu I限制性酶切位点)和MNN10Kpn R(SEQ ID NO:22,该引物具有Kpn I限制性酶切位点)引物对作PCR扩增MNN10基因N端1至116个氨基酸片段(AA1-116)(N-MNN10)(SEQ ID NO:23)。
PCR4,用合成的秀丽隐杆线虫(Caenorhabditis elegans,Ce)甘露糖苷水解酶I基因(SEQ ID NO:24)作为模板,用KpnCeMnsI F(SEQ ID NO:25,该引物具有Kpn I限制性酶切位点)和CeMnsIXho R(SEQ ID NO:26,该引物具有Xho I限制性酶切位点)引物对作PCR扩增其C端的催化域81至540个氨基酸片段(AA81-540)(C-CeMnsI)。
PCR5,用合成的拟南芥(Arabidopsis thaliana,At)甘露糖苷水解酶I基因(SEQID NO:27)作为模板,用KpnAtMnsI F(SEQ ID NO:28,该引物具有Kpn I限制性酶切位点)和AtMnsIXho R(SEQ ID NO:29,该引物具有Xho I限制性酶切位点)引物对作PCR扩增其C端的催化域78至560个氨基酸片段(AA78-560)(C-AtMnsI)。
用限制性酶消化pLUL5’3’H载体和PCR(3、4、5)产物后,pLUL5’3’H的MluI-XhoI片段、N-MNN10的MluI-KpnI片段、C-CeMnsI和C-AtMnsI的KpnI-XhoI片端用T4连接酶环化,产生杂合型秀丽隐杆线虫甘露糖苷水解酶I表达载体(pLUL-cCeMnsI),和杂合型拟南芥甘露糖苷水解酶I表达载体(pLUL-cAtMnsI)。
(3)整合pLUL-MnsI在och1基因座表达
图2C描述了pLUL-cCeMnsI表达载体整合在och1基因座表达杂合cCeMnsI。
应用中国专利申请号201510220631.9描述的方法敲除och1基因,得到毕赤酵母och1敲除菌((JC301-och1∷loxP)(ade1 his4 ura3 och1::loxP)。
PCR1,用毕赤酵母基因组DNA作为模板,用ADE1F(SEQ ID NO:30)和ADE1R(SEQ IDNO:31)引物对作PCR扩增ADE1基因的开放阅读框。
按照生产商(BioRad,USA)的操作使用说明书,用MicroPulserTM电穿孔设备将ADE1开放读框的PCR产物通过电穿孔转化入毕赤酵母och1敲除菌(ade1 his4 ura3och1::loxP)的细胞。转化的细胞在补加了20mg/L组氨酸和50mg/L尿嘧啶的SC平板上生长以选择腺嘌呤原养型毕赤酵母och1敲除菌(his4 ura3 och1::loxP)。
由合成的密码子优化的小鼠白介素-22(mIL-22,针对酵母菌密码子作优化的含his-标签小鼠IL-22成熟肽的DNA序列如SEQ ID NO:32所示)做模板,用MIL22 F(SEQ IDNO:33)/R(SEQ ID NO:34)引物对作PCR扩增。用Xho I和Not I限制性酶消化PCR产物,并克隆入pPIC9K(Invitrogen)的Xho I/Not I位点以产生mIL-22表达载体,其能表达并分泌含His-标签的mIL-22。用限制性酶Sac I线性化该表达载体,并电穿孔转入och1敲除菌(his4ura3 och1::loxP)。转化的细胞在补加了250mg/L G418硫酸盐的YPD平板上25℃培养。线性化的载体通过单交换重组整合在AOX1基因座,获得mIL-22表达菌(his4 ura3 och1::loxP,mIL22)。
将pLUL-cCeMnsI表达载体用限制性酶Sma I消化,产生线性载体,5’H-ADH1TT-lacZ-URA3-lacZ-cCeMnsI-3’H。其中用作选择标记和反选择标记的URA3基因的两侧有700bp的lacZ同向重复序列,然后与杂合cCeMnsI基因相连。线性载体最外部分的5’H和3’H是och1靶基因座特异性同源序列,确保通过双交换同源重组整合在och1基因座。5’H和3’H同源序列分别是1014和1008bp。线性载体通过电穿孔转化入mIL-22表达菌(his4 ura3och1::loxP,mIL22)。转化的细胞在补加了20mg/L组氨酸的SC(不含组氨酸和尿嘧啶)平板上,25℃生长以选择尿嘧啶原养型mIL-22表达菌。在转化板上,随机挑取菌落并培养以提取基因组DNA供PCR验证基因组的整合。两个引物对,C1(SEQ ID NO:35,位于基因组中5’同源区域上游)/C2(SEQ ID NO:36,位于ADH1 TT内)和C3(SEQ ID NO:37,位于TIF51A TT内)/C4(SEQ ID NO:38,位于基因组中3’同源区域下游)用于PCR以验证线性载体整合在och1基因座上。1285和1427bp条带的成功PCR扩增表明线性载体通过同源重组成功整合到染色体基因组的och1基因座上(图2D)。由此,构建了杂合cCeMnsI表达菌(his4 och1::URA3-cCeMnsI,mIL22)。
将杂合cCeMnsI表达菌(his4 och1::URA3-cCeMnsI,mIL22)在5ml YPD培养基中,28℃,225rpm振荡培养24小时。以3000g离心沉淀细胞5分钟,重悬在5ml BMGY培养基中,28℃,225rpm振荡培养24小时。然后,以3000g离心沉淀细胞5分钟,重悬在5ml BMMY培养基中,28℃,225rpm振荡培养以诱导mIL-22表达。用50μl100%甲醇(1%终浓度)每日两次掺入培养液,将诱导再维持72小时。随后,通过离心收获培养上清液(3000g,10分钟),-20℃冷冻上清液待用。
按照生产商的使用说明书(南京金斯瑞生物科技有限公司),通过Ni-亲和层析从上清液中纯化带His-标签的mIL-22蛋白。
采用以前报道的方法,通过N-糖苷酶F(PNGaseF)(New England Biolabs,Beverly,MA)处理从带His-标签的mIL-22蛋白释放并分离糖链(Gregg JM(2010)PichiaProtocols,Second edition.Totowa,New Jersey:Humanna Press)。按照生产商的使用说明书,利用Ultraflex MALDI-TOF(bruker daltonics,不来梅,德国)质谱仪测定糖链的分子量。
图3显示杂合cCeMnsI表达菌(his4 och1::URA3-cCeMnsI,mIL22)生产的mIL-22释放的N-糖链的质谱图。其显示主要的N-糖链为Man5GlcNAc2(m/z:1257)、Man8GlcNAc2(m/z:1743)和Man9GlcNAc2(m/z:1905)。结果表明杂合cCeMnsI能够将Man8GlcNAc2转化为Man5GlcNAc2。
将杂合cCeMnsI表达菌(his4 och1::URA3-cCeMnsI,mIL22)在YPD培养基中培养,然后涂布在补加了20mg/L组氨酸,50mg/L尿嘧啶,1mg/mL 5-FOA的SC(不含组氨酸和尿嘧啶)平板上生长,希望在5-FOA反选择条件下,通过lacZ同向重复序列之间的同源重组,准确自我切除URA3,在基因组中留下一个700碱基lacZ序列和杂合cCeMnsI(图2C),用C1/C5(SEQID NO:39,位于P GAP内)引物对预计应扩增出1643bp条带。但是随机挑选许多在5-FOA平板生长的菌落,用C1/C5对其基因组进行PCR检定,未能扩增出预计的1643bp条带。在这些生长的菌落中,URA3可能发生非专一性丢失。
因此,需要开发新方法,提高同向重复序列间重组效率,准确切除URA3等选择标记,有利于反复使用URA3等选择标记将不同的外源基因整合在基因组的不同位点。
实施例2
同向重复序列的高效重组
许多生物中,基因打靶敲除基因的效率很低,特别是起重要生理功能的基因更难以敲除。在基因组开放读框的5’-和3’-调控区是基因打靶的高效区域(中国专利申请号201510218188.1),本实施例在3’-调控区整合外源基因,与开放阅读框形成反向重复序列和同向重复序列,通过选择合适碱基长度的同向重复序列,有效敲除开放阅读框,并切除标记基因。
图4A描述了构建pUC-KOade载体的示意图。
PCR1,用毕赤酵母GS115(his)基因组DNA作为模板,用XhoIR F(SEQ ID NO:40,该引物具有Xho I限制性酶切位点)和IRDRL R(SEQ ID NO:41,该引物具有DRL重叠序列以供融合PCR)引物对作PCR扩增ADE1基因1000bp的反向重复序列(IR)。
PCR2,用毕赤酵母基因组DNA作为模板,用DRL F(SEQ ID NO:42,该引物具有IR重叠序列以供融合PCR)和DRL R(SEQ ID NO:43,该引物具有3’H重叠序列以供融合PCR)引物对作PCR扩增ADE1基因200bp的长同向重复序列(DRL)。
PCR3,用毕赤酵母基因组DNA作为模板,用DRLADE1(+54)F(SEQ ID NO:44,该引物具有DRL重叠序列以供融合PCR)和ADE1(+815)SK R(SEQ ID NO:45,该引物具有Sma I和KpnI限制性酶切位点)引物对作PCR扩增ADE1基因的3’同源序列(3’H,+54/+815)。
PCR4,用XhoIR F和ADE1(+815)SK R引物对,通过重叠-延伸PCR连接以上三种PCR产物(1、2、3)。这产生了IR-DRL-3’H的融合片段。
PCR5,用毕赤酵母基因组DNA作为模板,用XhoIR F(该引物具有Xho I限制性酶切位点)和IR R(SEQ ID NO:46)引物对作PCR扩增ADE1基因1000碱基的反向重复序列(IR)。
PCR6,用PCR5的IR作为模板,用XhoIR F和DR R(SEQ ID NO:47,该引物具有ADE1基因25bp的同向重复序列,3’H重叠序列以供融合PCR)引物对作PCR扩增IR-DR片段。
PCR7,用XhoIR F和ADE1(+815)SK R引物对,通过重叠-延伸PCR连接IR-DR片段和3’H。这产生了IR-DR-3’H的融合片段。
PCR8,用毕赤酵母基因组DNA作为模板,用BSADE1(158)F(SEQ ID NO:48,该引物具有BamH I和Sma I限制性酶切位点)和ADE1(+53)URA R(SEQ ID NO:49,该引物具有CYC1 TT重叠序列以供融合PCR)引物对作PCR扩增ADE1基因的5’同源序列(5’H,158/+53)。
PCR9,用合成的ScCYC1 TT和PpURA3基因(SEQ ID NO:50)作为模板,用ADECYC1 F(SEQ ID NO:51,该引物具有ADE1 5’H重叠序列以供融合PCR)和URA3Xho R(SEQ ID NO:52,该引物具有Xho I限制性酶切位点)引物对作PCR扩增CYC1TT-URA3表达盒。
PCR10,用BSADE1(158)F和URA3Xho R引物对,通过重叠-延伸PCR连接以上两种PCR产物(8、9)。这产生了5’H-CYC1TT-URA3的融合片段。
用限制性酶消化产物后,IR-DRL-3’H的XhoI/KpnI片段、5’H-CYC1TT-URA3的BamHI/XhoI片段连接到pUC19的BamHI/KpnI片段,用T4连接酶环化,产生pUC-KOade(DRL)载体。同理IR-DR-3’H的XhoI/KpnI片段和5’H-CYC1TT-URA3的BamHI/XhoI片段连接到pUC19上,产生另一个pUC-KOade载体(DR)
图4B描述了pUC-KOade载体整合在ADE1基因座,然后切除ADE1、URA3和IR基因的示意图。
将pUC-KOade载体用限制性酶Sma I消化,以产生线性载体,5’H-CYC1TT-URA3-IR-DRL-3’H和5’H-CYC1TT-URA3-IR-DR-3’H。IR是ADE1基因1000bp的反向重复序列,DRL和DR分别是ADE1基因200bp和25bp同向重复序列。连接的CYC1TT-URA3、IR和DRL或DR侧接ADE1基因的5’和3’同源序列(5’H和3’H)确保整合在ADE1基因翻译终止无义密码子的下游指定位点(+53/+54)。
用MicroPulserTM电穿孔设备将线性载体通过电穿孔转化入毕赤酵母菌JC307(his4 ura3)的细胞。转化的细胞在补加了20mg/L组氨酸的SC(不含组氨酸和尿嘧啶)平板上,25℃生长以选择尿嘧啶原养型毕赤酵母菌。在各转化板上,随机挑取菌落并培养以提取基因组DNA供PCR验证基因组的整合。两个引物对,C6(SEQ ID NO:53,位于基因组中5’同源区域的上游)/C7(SEQ ID NO:54,位于线性载体的CYC1TT内)和C8(SEQ ID NO:55,位于线性载体的DR内)/C9(SEQ ID NO:56,位于基因组中3’同源区域的下游)用于验证线性载体的同源整合。通过C6/C7和C8/C9引物对在两个菌落中分别PCR扩增出预计的1300和800bp条带,验证了线性载体成功整合在ADE1基因翻译终止无义密码子下游的指定位点(+53/+54)(图4C)。由此产生DRL整合菌(ADE1::URA3-IR-DRL)和DR整合菌(ADE1::URA3-IR-DR)。
由于反向重复序列(IR)的内在不稳定性,它能促使同向重复序列通过同源重组,自我切除ADE1基因的ORF,URA3和IR,同时在基因组中稳定留下一个同向重复序列,产生尿嘧啶和腺嘌呤营养缺陷型菌株(ura3、ade1)。因此分别将DRL整合菌(ADE1::URA3-IR-DRL)和DR整合菌(ADE1::URA3-IR-DR)在YPD培养基中培养,然后将2000个整合菌分别涂布在补加了20mg/L组氨酸,50mg/L尿嘧啶,和1mg/mL 5-FOA的SC(无组氨酸、无尿嘧啶)平板上25℃生长,在5-FOA反选择条件下,能挑选出尿嘧啶和腺嘌呤营养缺陷菌。因为ade1营养缺陷型菌株会导致细胞中累积红色色素,表现为淡红色菌落;而ADE1原养型菌则表现为白色菌落。长同向重复序列(DRL,200bp)整合菌(ADE1::URA3-IR-DRL)在平板上80%为淡红色菌落,其余20%为白色菌落。但是同向重复序列(DR,25bp)整合菌(ADE1::URA3-IR-DR)在平板上只有一个是淡红色菌落,其余为白色菌落,淡红色菌落远低于1%。用C6/C9引物对在淡红色菌落和JC307基因组中分别扩增出预计的1000和2200bp条带,PCR结果进一步确认淡红色菌落基因组中,ADE1基因已敲除(图4D)。而5-FOA平板上的白色菌落则可能来自URA3的非专一性丢失。这个示例说明利用反向重复序列促进同向重复序列的同源重组效率与同向重复序列的长度有关系,200bp同向重复序列(DRL)间的同源重组准确自我切除的效率很高(80%),但是25bp同向重复序列(DR)间同源重组准确自我切除的效率很低(远低于1%)。
在毕赤酵母中的这个结果与文献报道在酿酒酵母的结果完全不同。在报道在酿酒酵母基因敲除中,利用反向重复序列促进同向重复序列的同源重组效率取决两个步骤:(1)线性载体在基因组位点上的整合,(2)同向重复序列的同源重组准确切除表记基因和反向重复序列。这两个步骤的效率与同向重复序列的长度有关。在酿酒酵母中,优选25bp同向重复序列(DR)用于基因整合和重组切除。加长至35bp同向重复序列会导致线性载体无法有效整合在准确的位点,没有整合菌可以利用反向重复序列促进同向重复序列的同源重组。酿酒酵母具有非常有效的同源重组系统,25bp同向重复序列(DR)是对其基因整合和自我切除最优选择,而且不能超过35个碱基(Nikhil U.Nair and Huimin Zhao,Mutagenicinverted repeat assisted genome engineering(MIRAGE).Nucleic Acids Research,2009,Vol.37:e9)。但是多数酵母,如毕赤酵母、多形汉森酵母、解脂耶氏酵母、木糖发酵酵母、和乳酸克鲁维酵母等,同源重组的效率非常低,因此需要用长同向重复序列(DRL)来增加其同源重组自我切除效率,同时长同向重复序列没有显著增加基因组的随机整合。
实施例3
用pIDU载体整合MnsI在och1基因座表达并切除选择表记
(1)构建pIDU载体
图5A描述了构建pIDU载体的示意图。
PCR1,用毕赤酵母基因组DNA作为模板,用URA3F(SEQ ID NO:57)和URA3lacIR R(SEQ ID NO:58,该引物具有lacZ IR重叠序列以供融合PCR)引物对作PCR扩增URA3表达盒。
PCR2,用大肠杆菌BL21基因组DNA作为模板,用URAlacZIR F(SEQ ID NO:59,该引物具有URA3重叠序列以供融合PCR)和lacZIRADH R(SEQ ID NO:60,该引物具有ADH1 TT重叠序列以供融合PCR)引物对作PCR扩增lacZ(IR)片段。
PCR3,用酿酒酵母基因组DNA作为模板,用lacIRADH1 F(SEQ ID NO:61,该引物具有lacZ(IR)重叠序列以供融合PCR)和ADH1GAP R(SEQ ID NO:62,该引物具有P GAP重叠序列以供融合PCR)引物对作PCR扩增ADH1转录终止子(ADH1 TT)片段。
PCR4,用毕赤酵母基因组DNA作为模板,用ADHGAP F(SEQ ID NO:63,该引物具有ADH1 TT重叠序列以供融合PCR)和GAPTIF R(该引物具有Mlu I、Not I、BamH I、Xho I限制性酶切位点)引物对作PCR扩增毕赤酵母P GAP片段。
PCR5,用酿酒酵母基因组DNA作为模板,用MNBXTIF51A F(该引物具有Mlu I、NotI、BamH I、Xho I限制性酶切位点)和TIF51ANde R(该引物具有Nde I限制性酶切位点)引物对作PCR扩增TIF51A转录终止子(TIF51A TT)片段
PCR6,用URA3F和TIF51ANde R引物对,通过重叠-延伸PCR连接以上五种PCR产物(1、2、3、4、5)。这产生了URA3-lacZ(IR)-ADH1TT-PGAP-TIF51A TT的融合片段。
PCR7,用酿酒酵母基因组DNA作为模板,用KpnADH1 F(该引物具有Kpn I限制性酶切位点)和ADH1lac R(该引物具有lacZ重叠序列以供融合PCR)引物对作PCR扩增ADH1 TT片段。
PCR8,用大肠杆菌BL21基因组DNA作为模板,用ADHlacZ F(该引物具有ADH1TT重叠序列以供融合PCR)and lacZURA R(该引物具有URA3重叠序列以供融合PCR)引物对作PCR扩增LacZ 700个碱基片段。
PCR9,用毕赤酵母基因组DNA作为模板,用lacURA3 F(该引物具有lacZ重叠序列以供融合PCR)和URA3 R引物对作PCR扩增URA3表达盒。
PCR10,用用KpnADH1 F和URA3 R引物对,通过重叠-延伸PCR连接以上三种PCR产物(7、8、9)。这产生了ADH1TT-lacZ-URA3的融合片段。
PCR11,用pUC19载体作为模板,用KEPUC19F(该引物具有Kpn I和EcoR I限制性酶切位点)和PUC19SN R(该引物具有Sse8387I和Nde I限制性酶切位点)引物对作PCR扩增氨苄青霉素耐受性基因(Ampr)和复制起点(ori)片段(Ampr-ori)。
用限制性酶消化产物后,URA3-LacZ(IR)-ADH1TT-PGAP-TIF51ATT的NdeI/XbaI片段、ADH1TT-lacZ-URA3的KpnI/XbaI片段和Ampr-ori的NdeI/KpnI片段,用T4连接酶环化,产生pIDU载体。
(2)用pIDU构建cCeMnsI表达载体
图5B描述了构建pIDU-cCeMnsI表达载体的一个示例。
PCR1,用毕赤酵母基因组DNA作为模板,用ESESOCH1-5 F(该引物具有EcoR I、StuI、EcoR V、Sma I限制性酶切位点)和OCH1-5Kpn R(该引物具有Kpn I限制性酶切位点)引物对作PCR扩增OCH1开放阅读框的5'上游区同源序列片段(5’H)(1014bp),然后,将酶切5’H的EcoRI-KpnI片段插入pIDU载体的相同限制性酶切位点以产生破pIDU5’H载体。
PCR2,用毕赤酵母基因组DNA作为模板,用NdeOCH1-3 F(该引物具有Nde I限制性酶切位点)和OCH1-3ESSS R(该引物具有EcoR I,Sma I,Stu I and Sse8387 I限制性酶切位点)引物对作PCR扩增OCH1开放阅读框的3'下游区同源序列片段(3’H)(1008bp),然后,将酶切3’H的NdeI-Sse83871片段插入pIDU5’H载体的相同限制性酶切位点以产生pIDU5’3’H载体。
用限制性酶消化pLUL-cCeMnsI和pIDU5’3’H载体后,cCeMnsI的MluI/XhoI片段用T4连接酶连接到pIDU5’3’H载体的相同位点,产生pIDU-cCeMnsI表达载体。
(3)整合pIDU-cCeMnsI载体在och1基因座表达并切除URA3
图5C描述了将pIDU-cCeMnsI整合在och1位点及切除URA3的示意图。
将pIDU-cCeMnsI表达载体,用限制性酶Sma I消化,以产生线性载体,5’H-ADH1TT-lacZ-URA3-lacZ(IR)-ADH1 TT-cCeMnsI-3’H。其中,用作选择标记和反选择标记的URA3表达盒侧接反向重复序列lacZ(IR),然后侧接ADH1 TT转录终止子作为同向重复序列,然后再侧接杂合cCeMnsI表达盒,最外面侧接OCH1特异性同源序列,确保通过双交换同源重组整合在基因组的och1基因座。用MicroPulserTM电穿孔设备将线性载体通过电穿孔转化入mIL-22表达菌(his4 ura3 och1::loxP,mIL22)。转化的细胞在补加了20mg/L组氨酸的SC(不含组氨酸和尿嘧啶)平板上,25℃生长以选择尿嘧啶原养型mIL-22表达菌。在转化板上,随机挑取菌落并培养以提取基因组DNA供PCR验证基因组的整合。两个引物对,C1/C2和C3/C4用于PCR以验证线性载体通过双交换同源重组整合在基因组的och1基因座。PCR从两个菌落基因组DNA中分别成功扩增出1285和1427bp的条带,表明线性载体通过同源重组成功整合到基因组的och1基因座(5D)。由此,构建了cCeMnsI整合菌(his4 och1::DR-IR-URA3-cCeMnsI,mIL22)
将cCeMnsI整合菌(his4 och1::DR-IR-URA3-cCeMnsI,mIL22)在YPD培养基中28℃培养,然后涂布在补加了20mg/L组氨酸,50mg/L尿嘧啶,1mg/mL 5-FOA的SC(不含组氨酸和尿嘧啶)平板上,25℃生长,在5-FOA反选择条件下,lacZ反向重复序列的内在不稳定性促使ADH1 TT同向重复序列发生重组,切除URA3、lacZ和ADH1 TT,在基因组中稳定留下一段ADH1TT和杂合cCeMnsI基因。用C1/C5引物对5-FOA平板上两个菌落的基因组PCR扩增出预计的1643bp条带,而用相同引物对5-FOA反选择前的两个cCeMnsI整合菌的基因组PCR扩增出预计的4713bp条带(图5E),PCR结果确认基因组中的URA3、lacZ和ADH1 TT被准确自我切除。在5-FOA反选择条件下,基因自我切除的效率很高,达到36%(9/25)。由此,构建了杂合cCeMnsI表达菌(his4 och1::CeMnsI,mIL22)。用这个菌表达的mIL-22的N-糖链,MALDI-TOF分析的结果与图3相似(图谱未显示)。
实施例4
用pIDU载体整合MnsI在ARG4基因座表达并切除选择表记
(1)构建pIDU-cAtMnsI表达载体
图6A描述了构建pIDU-cAtMnsI表达载体的一个示例。
PCR1,用毕赤酵母基因组DNA作为模板,用ESESARG4-5 F(SEQ ID NO:64,该引物具有EcoR I、Stu I、EcoR V和Sma I限制性酶切位点)和ARG4-5Kpn R(SEQ ID NO:65,该引物具有Kpn I限制性酶切位点)引物对作PCR扩增ARG4 ORF(5’H)(793bp)。用限制性酶消化产物后,ARG4ORF(5’H)的EcoRI/KpnI片段用T4连接酶连接到pIDU载体的相同位点,产生pIDUO5’H。
PCR2,用毕赤酵母基因组DNA作为模板,用NdeARG4-3 F(SEQ ID NO:66,该引物具有Nde I限制性酶切位点)和ARG4-3ESSS R(SEQ ID NO:67,该引物具有EcoR I、Sma I、StuI和Sse8387 I限制性酶切位点)引物对作PCR扩增ARG4 3’H(894bp)。用限制性酶消化产物后,ARG4 3’H的Sse8387I/NdeI片段用T4连接酶连接到pIDUO5’H载体的相同位点,产生pIDUO5’3’H。
用限制性酶消化pLUL-cAtMnsI和pIDUO5’3’H载体后,cAtMnsI的MluI/XhoI片段用T4连接酶连接到pIDUO5’3’H载体的相同位点,产生pIDU-cAtMnsI表达载体。
(2)整合pIDU-cAtMnsI载体在ARG4基因座表达并切除标记基因
图6B描述了将pIDU-cAtMnsI表达载体整合在ARG4基因座及切除URA3的示意图。
将pIDU-cAtMnsI表达载体,用限制性酶Sma I消化,以产生线性载体,
5’H-ADH1TT-lacZ-URA3-lacZ(IR)-ADH1TT-cAtMnsI-3’H。其中,用作选择标记和反选择标记的URA3表达盒侧接lacZ反向重复序列,然后侧接ADH1 TT转录终止子作为同向重复序列,然后再侧接杂合cAtMnsI,最外面侧接ARG4特异性同源序列,确保通过双交换同源重组整合在基因组的ARG4开放阅读框翻译终止无义密码子下游。用MicroPulserTM电穿孔设备将这些线形载体通过电穿孔转化入mIL-22表达菌(his4 ura3och1::loxP,mIL22)。转化的细胞在补加了20mg/L组氨酸的YNB(不含氨基酸)平板上生长以选择尿嘧啶原养型mIL-22表达菌。在转化板上,随机挑取菌落并培养以提取基因组DNA供PCR验证基因组的整合。两个引物对,C10(SEQ ID NO:68,位于基因组中ARG4的5’同源区域上游)/C2和C3/C11(SEQ ID NO:69,位于基因组中ARG4的3’同源区域下游)用于PCR以确认线性载体是否整合到ARG4开放阅读框翻译终止无义密码子下游。PCR从两个菌落基因组DNA中分别成功扩增出1172和1328bp的条带,表明线性载体通过同源重组成功整合到基因组ARG4开放读框翻译终止无义密码子下游。由此构建了杂合cAtMnsI整合菌(his4 ura3 och1::loxP,ARG4::URA3-cAtMnsI,mIL22)。
将杂合cAtMnsI整合菌(his4 ura3 och1::loxP,ARG4::URA3-AtMnsI,mIL22)在YPD培养基中培养,然后涂布在补加了20mg/L组氨酸,50mg/L尿嘧啶,1mg/mL 5-FOA的YNB(不含氨基酸)平板上生长,在5-FOA反选择条件下,lacZ反向重复序列促使ADH1 TT同向重复序列发生重组,切除URA3、lacZ和ADH1 TT,在ARG4开放阅读框翻译终止无义密码子下游稳定留下一段ADH1 TT和cAtMnsI基因。用C10/C5引物对5-FOA平板上两个菌落的基因组PCR扩增出预计的1530bp条带,而用相同引物对5-FOA反选择前的两个cAtMnsI整合菌的基因组PCR扩增出预计的4600bp条带(图6C),PCR结果确认基因组中的URA3、lacZ和ADH1 TT被准确自我切除。由此,构建了杂合cAtMnsI表达菌(his4 ura3 och1::loxP,ARG4::cAtMnsI,mIL22)。用这个菌表达的mIL-22的N-糖链,MALDI-TOF分析的结果与图3相似(图谱未显示)。在线性载体整合和自我切除的过程中,ARG4开放读框的转录终止子被替换成外源的ADH1TT转录终止子,转录和翻译始终未受破坏,能正常发挥功能,在不含精氨酸的YNB培养基中生长,没有显现arg4营养缺陷。
本发明的技术具有广泛的应用。有经验的技术人员可以在不偏离本发明基本原理的基础上,做某些修改或改进,通过这些修改可以将本发明应用于其它宿主细胞。此外,有经验的技术人员可以将本发明应用于其它方面,包括但不局限于代谢工程、系统生物学与合成生物学等相关领域的基因组改造。这些修改、改进、和应用也在本发明的可预期范围内。
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
序列表
<110> 杭州菁因康生物科技有限公司
<120> 一种高效的基因工程载体
<130> P2017-0391
<160> 69
<170> PatentIn version 3.5
<210> 1
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 1
gcttgaggaa cttttctgca c 21
<210> 2
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 2
cagatgtgcg gcgagcagtt ggtgagctta catgag 36
<210> 3
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 3
taagctcacc aactgctcgc cgcacatctg aacttc 36
<210> 4
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 4
catttctaca aaaaaggaaa accctggcgt taccc 35
<210> 5
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 5
acgccagggt tttccttttt tgtagaaatg tcttgg 36
<210> 6
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 6
ctcgagggat ccgcggccgc acgcgttgtg ttttgatagt tgttcaattg 50
<210> 7
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 7
acgcgtgcgg ccgcggatcc ctcgagaccg gttaacatca tggcatg 47
<210> 8
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 8
ggaattccat atgctgcagg actcgaacct gcg 33
<210> 9
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 9
cggggtaccg cgaatttctt atgatttatg 30
<210> 10
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 10
cagatgtgcg gcgagttgtc ctctgaggac ataaaatac 39
<210> 11
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 11
gtcctcagag gacaactcgc cgcacatctg aacttc 36
<210> 12
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 12
tgcagaaaag ttcctcaagc ggaaaaccct ggcgttaccc aac 43
<210> 13
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 13
gtaacgccag ggttttccgc ttgaggaact tttctgcac 39
<210> 14
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 14
ttacctcaga atattttggt aag 23
<210> 15
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 15
cggggtaccg aattcgacga aagggcctcg tgatac 36
<210> 16
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 16
ggaattccat atgcctgcag ggcctggggt gcctaatgag tg 42
<210> 17
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 17
ccggaattca ggcctgatat ccccgggcag ccttaaagag cccgctaaaa g 51
<210> 18
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 18
cggggtaccg gctgatgata tttgctacg 29
<210> 19
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 19
ggaattccat atgagaaagc tagagtaaaa tag 33
<210> 20
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 20
catgcctgca ggaggcctcc cgggaattcc ttgtggaaga tcttg 45
<210> 21
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 21
gcgacgcgta acacaatgtc tagtgtacct tata 34
<210> 22
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 22
cggggtaccc caaaacgacc atcttgatct 30
<210> 23
<211> 348
<212> DNA
<213> Artificial Sequence
<220>
<223> 酿酒酵母MNN10的N端基因序列
<400> 23
atgtctagtg taccttataa ttcccaactt cctatatcca accatctaga gtacgatgaa 60
gatgaaaaga agagcagagg ctcaaaacta ggcctgaaat ataaaatgat atactggagg 120
aaaactttat gcagttcgct agcgagatgg agaaagctaa tactattaat atctttagct 180
ttgtttttat tcatatggat aagcgattcc accataagca gaaatccatc taccacaagt 240
tttcaaggcc aaaatagtaa cgataataag ttgagtaata ctggttctag catcaactcc 300
aaaagatatg taccaccata ttctaagaga tcaagatggt cgttttgg 348
<210> 24
<211> 1623
<212> DNA
<213> Artificial Sequence
<220>
<223> 针对酵母菌密码子作优化的秀丽隐杆线虫(Caenorhabditis
elegans)甘露糖苷水解酶I基因
<400> 24
atgggtttga gatctcacga acaattggtc gtttgtgttg gtgttatgtt cttgttgacc 60
gtttgtatca ctgccttttt ctttttgcca tctggtggtg cagacttgta tttcagagag 120
gagaactctg tccacgttag agatgtcttg attagagaag agatcagaag aaaagaacag 180
gacgaattga gaagaaaggc cgaggaggct aatcctatcc ctattcctaa acctgaaatt 240
ggagcttctg acgatgctga aggaagaaga attttcgtca agcagatgat caagtttgca 300
tgggatggtt atagaaagta cgcttggggt gaaaacgagt tgagaccaaa ttctagatct 360
ggacactctt cttctatctt tggttacggt aagaccggtg caactatcat cgacgctatt 420
gatacattgt acttggttgg tttgaaagag gagtacaaag aagctagaga ttggattgca 480
gatttcgact ttaaaacctc tgctaagggt gatttgtctg tctttgaaac taacattaga 540
tttacaggtg gattgttgtc tgctttcgct ttgacaggag ataagatgtt tttgaagaag 600
gcagaagacg tcgccaccat tttgttgcct gcattcgaga ctccttctgg aatcccaaac 660
tctttgattg atgcccaaac aggaagatct aagacatact cttgggcctc tggaaaggct 720
atcttgtctg agtacggttc tattcaattg gaattcgatt acttgtctaa cttgaccggt 780
aacccagttt tcgcacaaaa agccgacaaa atcagagacg ttttgactgc aatggagaaa 840
ccagagggat tgtaccctat ctatattacc atggataacc caccaagatg gggacaacac 900
ttgttttcta tgggtgctat ggcagattct tggtacgaat atttgttgaa acagtggatc 960
gctactggta agaaggacga tagaactaag agagaatacg aagaagccat cttcgccatg 1020
gaaaagagaa tgttgtttaa gtctgaacag tctaatttgt ggtacttcgc aaaaatgaac 1080
ggaaacagaa tggagcattc ttttgagcat ttggcttgct tttctggagg aatggttgtt 1140
ttgcacgcta tgaacgaaaa aaacaaaact atctctgacc actacatgac tttgggtaag 1200
gaaatcggtc acacctgtca tgagtcttat gcaagatcta ccacaggtat tggaccagag 1260
tcttttcaat ttacatcttc tgtcgaagct aagactgaaa gaagacagga ttcttactat 1320
atcttgagac ctgaagtcgt cgaaacctgg ttctacttgt ggagagctac taaagatgag 1380
aagtatagac agtgggcttg ggatcatgtt caaaatttgg aagagtactg caagggtact 1440
gctggttatt ctggtatcag aaatgtttac gaatcttctc cagagcaaga tgacgtccag 1500
caatcttttt tgttcgccga gttgttcaag tatttgtatt tgattttctc tgaggataac 1560
attttgcctt tggatcaatg ggtcttcaac accgaggctc atccttttag aatcagacat 1620
taa 1623
<210> 25
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 25
cggggtaccg ccgaggaggc taatcctatc 30
<210> 26
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 26
ccgctcgagt taatgtctga ttctaaaagg 30
<210> 27
<211> 1683
<212> DNA
<213> Artificial Sequence
<220>
<223> 合成的拟南芥(Arabidopsis
thaliana,At)甘露糖苷水解酶I基因,其中的Xho I
酶切位点CTCGAG被变异为CTCGAA
<400> 27
atggcgagaa gtagatcgat tagtggttat gggatatgga aatatttgaa tcctgcgtat 60
tatcttagaa gaccgagacg tttggctttg cttttcattg tcttcgtctc tgtttctatg 120
cttgtctggg atcgtattaa tcttgcccga gaacatgagg ttgaagtttt taagctaaat 180
gaagaagttt cacggttgga gcagatgtta gaagagctta atggtggtgt tggcaataag 240
cctttgaaga ctctgaagga tgccccagaa gatccagttg ataaacagcg aaggcagaaa 300
gtaaaagagg caatgatcca tgcttggagc tcttatgaaa agtatgcatg ggggaaagat 360
gagcttcagc ctcggacaaa agatggcact gatagctttg gtggccttgg agcaactatg 420
gtagattctt tagatacact ctatataatg ggtctagatg agcagtttca aaaagccaga 480
gagtgggttg caagctcatt ggatttcgac aaggattatg acgccagtat gtttgagaca 540
accataagag ttgtaggcgg acttcttagt gcgtatgatc tttctgggga caaaatgttc 600
cttgaaaagg ctaaggatat tgcagacaga ttattgcctg catggaatac tccaacgggt 660
ataccttaca atattatcaa cttgagaaat ggaaatgctc acaatccttc atgggcggca 720
gggggagaca gtattctcgc agactccggc actgagcagc tcgaatttat tgccctttcc 780
caaaggacag gggacccaaa atatcagcag aaggtagaga aggttattac agaactgaat 840
aagaactttc ctgctgatgg tttacttccc atctatataa atccggataa tgctaatcca 900
tcgtactcta ccacaacatt tggtgccatg ggagatagct tttatgagta tttgctcaaa 960
gtttgggtgc aagggaacaa aacatctgcc gtgaaaccct atagagatat gtgggagaaa 1020
tcaatgaaag gtttgttaag cttggtcaag aaatcaacac cttcatcatt tacgtatata 1080
tgtgagaaga acggaaataa tttgattgat aagatggatg aattggcgtg ctttgctcct 1140
ggaatgttgg ctttaggagc ttcaggttat ggccctgatg aagaaaaaaa gtttctttca 1200
cttgctggag agcttgcctg gacttgttat aacttttacc aatcgacacc aacgaaactt 1260
gctggagaga actatttctt cactgcaggg caggacatga gtgttggcac atcttggaac 1320
attttaagac cagaaaccgt tgaatcactg ttttacctct ggcgattaac tgggaacaag 1380
acatatcaag agtggggatg gaatatattt caagcatttg agaagaactc tcgcgtagaa 1440
tctggatatg taggcttgaa ggatgtcaat acaggtgcta aagacaacaa gatgcaaagc 1500
ttcttcttag ctgagactct taagtatcta tatcttctct tttcgccttc atctgttatt 1560
tcattagacg agtgggtttt caacacagaa gcccatccgc ttaagattgt ggcacggaat 1620
gatccgcgta agccaactat agcactacgc cagaggaagt ttggtcatca gattaacgtt 1680
tag 1683
<210> 28
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 28
cggggtaccg gcaataagcc tttgaagact c 31
<210> 29
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 29
ccgctcgagc taaacgttaa tctgatgacc 30
<210> 30
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 30
atgtccattg tgaacactga tc 22
<210> 31
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 31
tcaagcccat ttcttgccag 20
<210> 32
<211> 459
<212> DNA
<213> Artificial Sequence
<220>
<223> 针对酵母菌密码子作优化的含his-标签小鼠IL-22成熟肽的DNA序列
<400> 32
ttgccagtca acaccagatg caaattggag gtctcaaact ttcaacagcc atacatcgtt 60
aatagaactt ttatgcttgc taaggaagct tcattggccg ataacaatac cgacgttaga 120
ttgattggtg aaaagctttt tagaggagtc agtgccaagg atcaatgtta cttgatgaaa 180
caggttttga acttcactct tgaagatgtc ttgcttccac aatcagacag atttcaacct 240
tatatgcagg aggttgtccc attcttgaca aagctttcaa atcagttgtc ttcctgccat 300
attagtggag atgaccaaaa catccagaag aatgttagaa gattgaaaga aactgtcaag 360
aaacttggtg aatctggaga gattaaagca atcggagagt tggacttgct ttttatgtcc 420
ttgagaaacg cttgtgttca tcaccatcac catcactaa 459
<210> 33
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 33
ccgctcgaga aaagagaggc tgaagctttg ccagtcaaca ccagatg 47
<210> 34
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 34
ataagaatgc ggccgcttag tgatggtg 28
<210> 35
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 35
gttcataaca tacaaatttt atg 23
<210> 36
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 36
cgacctcatg ctatacctga g 21
<210> 37
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 37
tgtaattcat tggggaggat g 21
<210> 38
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 38
ggaaagcgag attccaagtc atc 23
<210> 39
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 39
gtagaagaag ctctccagca gag 23
<210> 40
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 40
ccgctcgagt caagcccatt tcttgccag 29
<210> 41
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 41
cgattattgg taaaagttac aaaatagccc caatatacta ctctagg 47
<210> 42
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 42
cctagagtag tatattgggg ctattttgta acttttacca ataatcg 47
<210> 43
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 43
attttatatg gaattggaag gcatgcggtg aaagttcaga tgtttaat 48
<210> 44
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 44
catctgaact ttcaccgcat gccttccaat tccatataaa atcc 44
<210> 45
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 45
cggggtaccc ccgggttggt ccaacagcac tt 32
<210> 46
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 46
gccccaatat actactctag gaaactcg 28
<210> 47
<211> 68
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 47
ggattttata tggaattgga aggcatgcgg tgaaagttca gatgtttaat gctgccccaa 60
tatactac 68
<210> 48
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 48
cgcggatccc ccgggaaaga ttttgactca gctctcag 38
<210> 49
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 49
gatatcgaca aaggaaaagg ggcctgtaat aagggaaatt tcagatg 47
<210> 50
<211> 1643
<212> DNA
<213> Artificial Sequence
<220>
<223> 合成的ScCYC1 TT和毕赤酵母URA3基因
<400> 50
acaggcccct tttcctttgt cgatatcatg taattagtta tgtcacgctt acattcacgc 60
cctcccccca catccgctct aaccgaaaag gaaggagtta gacaacctga agtctaggtc 120
cctatttatt tttttatagt tatgttagta ttaagaacgt tatttatatt tcaaattttt 180
cttttttttc tgtacagacg cgtgtacgca tgtaacatta tactgaaaac cttgcttgag 240
aaggttttgg gacgctcgaa ggctttaatt tgcaagctgc ttgaggaact tttctgcaca 300
cttgttgatg cagccttcct ccttagaagt caacttgtta gatgtaaaat cattgacaca 360
gtctgtaaaa catttgctaa ccaaatcgga gtaaagacgc atgaagtctt tcatttgttt 420
ttgttcaacg agtttctgga actcttgttg ttctttagcg ttcaatgcgt ccattttgtg 480
atgtacttgg ttggggtaga gttagcactt gctctctctg ttaccagttt ttgtcaagat 540
tgaagaaaaa agttttttgg acggtacacg tcgcacctat ccttcgcatt gatccactct 600
aatgagttaa catcaacctg atcaaaggga tagataccta gacaatggct cgcagttatg 660
ccgagagagc aaatactcat caatcacctg tggcacgacg actgtttgcg cttatggaac 720
agaaacagag taacctatgc gcatcagtcg acgtgagaac aactaaagaa ttattggagc 780
ttctagataa attgggccca tttatctgtt tggccaagac tcatatcgac ataattgatg 840
acttcacgta tgatggaact attctgcctt tattggaact atcaaagaaa cacaagtttt 900
taatttttga ggacagaaag tttgctgata taggcaacac tgtcaagcat caatatcaag 960
gaggtgtcta caagattgca caatgggcag atattacaaa tgctcatggt gtcattggta 1020
gtggaattgt aaagggtcta aaggaggcag ccactgagac aacagatcaa ccaaggggac 1080
tattgatgtt ggctgaactg tcgtcaaagg gatcaattgc ccatggtaag tacaccgaag 1140
aaactgtaga aattgcaaaa tcagacaagg aattcgtcat tgggtttatt gctcaaaatt 1200
ctatgggagg acaagatgaa gggttcgatt ggattattat gacaccaggt gttggtttgg 1260
atgacactgg tgatgctcta ggccaacaat atcgaacagt gagtcaagta ttttccactg 1320
gcactgacat cataatcgta ggtcgtggtt tgtttggcaa gggcagagat cccttaaaag 1380
aaggtgaacg gtatagaaaa gctgggtggg aagcttacca aaatattctg aggtaaatta 1440
caagtatgta caggggatca attgtttcgg gcgattcaac tgaatcgatc ttcaatttca 1500
tcgctcaatt tttgacgcag tatttcaaac accagaagcc ccacggatgt tgctggaatg 1560
gtagttaacg cattcctaac gaacccttta taaaaccagc gggtccaaga tagtttagac 1620
ttctcatgta agctcaccaa ctg 1643
<210> 51
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 51
catctgaaat ttcccttatt acaggcccct tttcctttgt cgatatc 47
<210> 52
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 52
ccgctcgagc agttggtgag cttacatgag 30
<210> 53
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 53
catggagacg ggtgctatcg tttt 24
<210> 54
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 54
tgacataact aattacatga tatcg 25
<210> 55
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 55
agcattaaac atctgaactt tcacc 25
<210> 56
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 56
gtaattgtaa atgtgtagtg gcttg 25
<210> 57
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 57
gcttgaggaa cttttctgca cac 23
<210> 58
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 58
acgccagggt tttcccagtt ggtgagctta catgag 36
<210> 59
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 59
taagctcacc aactgggaaa accctggcgt taccc 35
<210> 60
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 60
tcataagaaa ttcgcctcgc cgcacatctg aacttc 36
<210> 61
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 61
cagatgtgcg gcgaggcgaa tttcttatga tttatg 36
<210> 62
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 62
catttctaca aaaaattgtc ctctgaggac ataaaatac 39
<210> 63
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 63
gtcctcagag gacaattttt tgtagaaatg tcttgg 36
<210> 64
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 64
ccggaattca ggcctgatat ccccgggggg agctggagct ttggctgg 48
<210> 65
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 65
cggggtacct caagactcta gcttttcatt c 31
<210> 66
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 66
ggaattccat atgaggtttt atactgagtt tgtt 34
<210> 67
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 67
catgcctgca ggaggcctcc cggggggttt tctaatagaa tttgc 45
<210> 68
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 68
caatctaact cagttggctg ac 22
<210> 69
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 69
ctatttcagc gtcctaaact c 21

Claims (14)

1.一种核苷酸构建物,所述核苷酸构建物具有如下式所示的结构:
5’-A1-B1-C-B2-A2-D-3’ I;
其中,
A1、A2是同向重复序列;
B1、B2是反向重复序列;
C是标记基因;
D是外源基因表达盒;
或者
所述核苷酸构建物具有如下式所示的结构:
5’-D-A1-B1-C-B2-A2-3’ II;
其中
A1、A2是同向重复序列;
B1、B2是反向重复序列;
C是标记基因;
D是外源基因表达盒。
2.如权利要求1所述的核苷酸构建物,其特征在于,所述B1或B2也可以是C的反向重复序列,当B1或B2是C的反向重复序列时,B1和B2中的另一个不存在。
3.如权利要求1或2所述的核苷酸构建物,其特征在于,所述同向重复序列是25-700bp,优选100-500bp,更优选200-400bp的同向重复序列。
4.如权利要求3所述的核苷酸构建物,其特征在于,所述同向重复序列是外源转录终止子或外源转录启动子。
5.如权利要求1或2所述的核苷酸构建物,其特征在于,所述核苷酸构建物在5’端和3’端还包含同源臂。
6.如权利要求5所述的核苷酸构建物,其特征在于,所述核苷酸构建物还可以包含当所述核苷酸构建物形成环状时,能够在宿主细胞(例如,细菌)中复制所需的其它基因X,优选细菌复制起点和抗生素耐受性基因,所述其它基因X不能位于所述外源基因表达盒和与所述外源基因表达盒紧邻的同向重复序列之间、也不能位于所述外源基因表达盒和与所述外源基因表达盒紧邻的同源臂之间。
7.如权利要求6所述的核苷酸构建物,其特征在于,所述其它基因X可以在A1和A2之间;优选地,所述其它基因X在B1和B2之间。
8.一种表达载体,所述表达载体包含权利要求1-7中任一项所述的核苷酸构建物。
9.一种宿主细胞,所述宿主细胞在其基因组中整合有权利要求1-7中任一项所述的核苷酸构建物。
10.一种对宿主细胞进行基因改造的方法,所述方法包括利用权利要求1-7中任一项所述的核苷酸构建物整合外源基因。
11.如权利要求10所述的方法,其特征在于,所述方法包括以下步骤:
a.构建权利要求1-7中任一项所述的核苷酸构建物;
b.通过同源重组将式I所示核苷酸构建物功能性整合在基因组开放阅读框(ORF)的翻译终止无义密码子(TAA)的下游;或者,
通过同源重组将式II所示核苷酸构建物功能性整合在基因组开放阅读框(ORF)的起始密码子(ATG)上游;和
c.通过第二次同源重组去除式I或式II所示核苷酸构建物中的同向重复序列、反向重复序列、标记基因和反向重复序列与标记基因之间的其它基因,从而仅仅将式I或式II所示核苷酸构建物中的一个同向重复序列和外源性基因表达盒整合在宿主细胞的基因组中。
12.如权利要求11所述的方法,其特征在于,所述将式I所示核苷酸构建物功能性整合在基因组开放阅读框(ORF)的翻译终止无义密码子(TAA)的下游是指式I所示核苷酸构建物位于基因组开放阅读框(ORF)的翻译终止无义密码子(例如TAA,等)的第三个核苷酸到其下游另一个开放阅读框(ORF)的转录启动子或终止子之外的区域,优选到其下游的300个核苷酸之间;最优选地,式I所示核苷酸构建物紧邻基因组开放读框(ORF)的翻译终止无义密码子(例如TAA等);
所述将式II所示核苷酸构建物功能性整合在基因组开放阅读框(ORF)的起始密码子(ATG)上游是指式II所示核苷酸构建物位于基因组开放阅读框(ORF)起始密码子(ATG)的第一个核苷酸到其上游另一个开放阅读框(ORF)的转录启动子或终止子之外的区域,优选到其上游的300个核苷酸之间;最优选地,式II所示核苷酸构建物紧邻基因组开放读框(ORF)的起始密码子(ATG)。
13.权利要求1-7中任一项所述的核苷酸构建物或权利要求8所述的表达载体在对宿主细胞进行基因改造中的用途。
14.采用权利要求10-12中任一项所述方法改造的宿主细胞的用途,所述菌株应用于代谢工程、系统生物学与合成生物学等领域;包括但不限于:所述菌株用于生物催化反应,或者所述菌株用于生产重组蛋白。
CN201710331370.7A 2017-05-11 2017-05-11 一种高效的基因工程载体 Active CN108866050B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201710331370.7A CN108866050B (zh) 2017-05-11 2017-05-11 一种高效的基因工程载体
PCT/CN2018/086343 WO2018205977A1 (zh) 2017-05-11 2018-05-10 一种高效的基因工程载体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710331370.7A CN108866050B (zh) 2017-05-11 2017-05-11 一种高效的基因工程载体

Publications (2)

Publication Number Publication Date
CN108866050A true CN108866050A (zh) 2018-11-23
CN108866050B CN108866050B (zh) 2022-12-27

Family

ID=64105036

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710331370.7A Active CN108866050B (zh) 2017-05-11 2017-05-11 一种高效的基因工程载体

Country Status (2)

Country Link
CN (1) CN108866050B (zh)
WO (1) WO2018205977A1 (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102361986A (zh) * 2009-01-22 2012-02-22 诺丁汉大学 在梭菌中的双交换同源重组的方法
CN104404077A (zh) * 2014-11-06 2015-03-11 中国科学院天津工业生物技术研究所 一种将多个外源基因同时克隆到微生物基因组的方法
CN104561080A (zh) * 2015-01-04 2015-04-29 浙江大学 一种选择标记可循环的酿酒酵母整合型表达载体及其构建方法
CN104593407A (zh) * 2015-01-06 2015-05-06 江南大学 树干毕赤酵母基因表达系统及其构建与应用
CN106191040A (zh) * 2015-04-30 2016-12-07 杭州菁因康生物科技有限公司 新型基因打靶方法
CN106191041A (zh) * 2015-04-30 2016-12-07 杭州菁因康生物科技有限公司 新型基因打靶方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1844401A (zh) * 2006-01-17 2006-10-11 南京大学 一种快速构建基因打靶重组用载体的方法
CN106978416B (zh) * 2016-01-18 2020-11-06 上海转基因研究中心 一种基因定位整合表达系统及其应用

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102361986A (zh) * 2009-01-22 2012-02-22 诺丁汉大学 在梭菌中的双交换同源重组的方法
CN104404077A (zh) * 2014-11-06 2015-03-11 中国科学院天津工业生物技术研究所 一种将多个外源基因同时克隆到微生物基因组的方法
CN104561080A (zh) * 2015-01-04 2015-04-29 浙江大学 一种选择标记可循环的酿酒酵母整合型表达载体及其构建方法
CN104593407A (zh) * 2015-01-06 2015-05-06 江南大学 树干毕赤酵母基因表达系统及其构建与应用
CN106191040A (zh) * 2015-04-30 2016-12-07 杭州菁因康生物科技有限公司 新型基因打靶方法
CN106191041A (zh) * 2015-04-30 2016-12-07 杭州菁因康生物科技有限公司 新型基因打靶方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
NIKHIL U. NAIR等: "Mutagenic inverted repeat assisted genome engineering (MIRAGE)", 《NUCLEIC ACIDS RESEARCH》 *

Also Published As

Publication number Publication date
WO2018205977A1 (zh) 2018-11-15
CN108866050B (zh) 2022-12-27

Similar Documents

Publication Publication Date Title
CN106480036B (zh) 一种具有启动子功能的dna片段及其应用
CN107075452A (zh) 来源于解脂耶氏酵母和解腺嘌呤阿氏酵母的启动子及其使用方法
US20170088845A1 (en) Vectors and methods for fungal genome engineering by crispr-cas9
CN1938426B (zh) 在酿酒酵母中生成重组基因
AU2016211118A1 (en) Method for inducing targeted meiotic recombinations
CN101432429B (zh) 产生芳香分子的酵母表达系统
US20160289690A1 (en) Mortierella alpina recombinant gene expression system and construction method and use thereof
CN108291189A (zh) 在具有降低的clr2活性的丝状真菌中生产蛋白质的方法
Kuanyshev et al. Domesticating a food spoilage yeast into an organic acid‐tolerant metabolic engineering host: Lactic acid production by engineered Zygosaccharomyces bailii
US20100190223A1 (en) Yeast for transformation, transformation method, and method for producing substance
CN108291191A (zh) 在具有降低的clr1活性的丝状真菌中生产蛋白质的方法
CN1894404B (zh) 有机酸存在下的启动子及其用途
CN105504033B (zh) 水稻细胞周期蛋白OsCYCP4;1的应用及提高水稻耐低磷胁迫的方法
Böer et al. Arxula adeninivorans
JP6206408B2 (ja) シゾサッカロミセス・ポンベ変異体の形質転換体、およびクローニングベクター
CN109628448A (zh) 基于酿酒酵母crispr文库的工业酿酒酵母抗逆性改造
CN108866050A (zh) 一种高效的基因工程载体
CN113564199B (zh) 创制高产大豆的方法
CN103917648B (zh) 用于通过同源重组转化和选择酵母转化体的盒和方法
CN100359013C (zh) 经过修饰的启动子
JP4109489B2 (ja) 遺伝子高発現系
EP1437405A1 (en) Gene overexpression system
CN102120966A (zh) Ura3缺陷型毕赤酵母x-33菌株的构建及应用
NZ500635A (en) Use of UDP-galactose epimerase enzyme obtained from guar and it&#39;s use in preparing foodstuffs.
CN105566467B (zh) 水稻细胞周期蛋白OsCYCP4;2的应用及提高水稻耐低磷胁迫的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant