CN109837293A - 一种能够增强蛋白质合成效率的串联dna元件 - Google Patents

一种能够增强蛋白质合成效率的串联dna元件 Download PDF

Info

Publication number
CN109837293A
CN109837293A CN201711194355.9A CN201711194355A CN109837293A CN 109837293 A CN109837293 A CN 109837293A CN 201711194355 A CN201711194355 A CN 201711194355A CN 109837293 A CN109837293 A CN 109837293A
Authority
CN
China
Prior art keywords
sequence
artificial sequence
dna
nucleic acid
yeast
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711194355.9A
Other languages
English (en)
Inventor
郭敏
王海鹏
柴智
徐开
周子鉴
章小玲
陈鉴冰
王静
于雪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kang Code (shanghai) Biological Technology Co Ltd
Original Assignee
Kang Code (shanghai) Biological Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kang Code (shanghai) Biological Technology Co Ltd filed Critical Kang Code (shanghai) Biological Technology Co Ltd
Priority to CN201711194355.9A priority Critical patent/CN109837293A/zh
Priority to JP2020545833A priority patent/JP7028986B2/ja
Priority to US16/766,079 priority patent/US20230203555A1/en
Priority to PCT/CN2017/113941 priority patent/WO2019100431A1/zh
Priority to EP17932921.4A priority patent/EP3730621A4/en
Priority to KR1020207018326A priority patent/KR102418515B1/ko
Publication of CN109837293A publication Critical patent/CN109837293A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/67General methods for enhancing the expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/102Plasmid DNA for yeast
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2840/00Vectors comprising a special translation-regulating system
    • C12N2840/20Vectors comprising a special translation-regulating system translation of more than one cistron
    • C12N2840/203Vectors comprising a special translation-regulating system translation of more than one cistron having an IRES

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Mycology (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明提供了一种能够增强蛋白质合成效率的串联DNA元件,具体地,本发明的核酸构建物由真核细胞(如酵母)来源的IRES增强子(如ScBOI1、ScFLO8、ScNCE102、ScMSN1、KlFLO8、KlNCE102、KlMSN1、KlBOI1)、Ω序列以及酵母特异性的Kozak序列串联而成。在酵母体外生物合成体系(如酵母体外蛋白合成体系)中应用本发明的核酸构建物,可显著提高蛋白合成效率。

Description

一种能够增强蛋白质合成效率的串联DNA元件
技术领域
本发明涉及生物技术领域,具体地,涉及一种能够增强蛋白质合成效率的串联DNA元件。
背景技术
蛋白质是细胞中的重要分子,几乎参与了细胞所有功能的执行。蛋白的序列和结构不同,决定了其功能的不同。在细胞内,蛋白可以作为酶类催化各种生化反应,可以作为信号分子协调生物体的各种活动,可以支持生物形态,储存能量,运输分子,并使生物体运动。在生物医学领域,蛋白质抗体作为靶向药物,是治疗癌症等疾病的重要手段。
在细胞中,蛋白质翻译的调节在应对营养缺失等外界压力,细胞发育与分化等很多过程中发挥重要作用。蛋白质翻译的四个过程包括翻译起始、翻译延伸、翻译终止和核糖体再循环,其中翻译起始是受调控最多的一个过程。真核细胞的翻译起始可以分为两大类:“帽子结构”依赖的传统途径和“帽子结构”非依赖的途径(图1)。
“帽子结构”依赖的翻译起始是一个非常复杂的过程,涉及十几种翻译起始因子和核糖体的40S小亚基。“帽子结构”非依赖的翻译起始则多是由位于mRNA 5′端非翻译区的内部核糖体进入序列(internal ribosome entry sites,IRESs)介导的。IRESs最早是在上世纪八十年代在病毒mRNA中第一次被发现的,后来细胞内来源的IRESs也被广泛报道。病毒IRESs通常具有复杂的二级和三级结构,在宿主细胞内依赖或者不依赖宿主细胞翻译起始因子来招募宿主细胞的核糖体,起始蛋白质翻译。与病毒IRESs相比,细胞内源性的IRESs起始蛋白质翻译的效率通常较低,而且被多种不具有共性的复杂机制所调控,不同的细胞内源性的IRESs不具有序列和结构上的共性,通常很难进行预测。
除了以上人们对于细胞内蛋白质合成的了解之外,蛋白质合成也可以在细胞外进行。蛋白质体外合成系统一般是指在细菌、真菌、植物细胞或动物细胞的裂解体系中,加入mRNA或者DNA模板、RNA聚合酶及氨基酸和ATP等组分,完成外源蛋白的快速高效翻译。目前,经常使用的商业化体外蛋白表达系统包括大肠杆菌系统(E.coli extract,ECE)、兔网织红细胞(Rabbit reticulocyte lysate,RRL)、麦胚(Wheat germ extract,WGE)、昆虫(Insectcell extract,ICE)和人源系统。
在体外合成的mRNA通常不具有“帽子结构”,而对mRNA进行加“帽子结构”修饰即耗时又昂贵,因此体外蛋白质合成体系一般采用“帽子结构”非依赖的翻译起始方法进行蛋白质的合成。然而目前单独使用IRES或Ω序列,翻译起始的效率都比较低,达不到快速、高效、高通量的在体外合成蛋白质的目的。目前还没有将两类翻译起始元件串联的研究。
因此,本领域迫切需要开发一种能够增强蛋白质翻译效率的串联IRES与Ω序列的新的核酸构建物。
发明内容
本发明的目的在于提供一种能够增强蛋白质翻译效率的串联IRES与Ω序列的新的核酸构建物。
本发明第一方面提供了一种核酸构建物,所述核酸构建物含有结构如式I所示的核酸序列:
Z1-Z2-Z3-Z4-Z5 (I)
式中,
Z1-Z5分别为用于构成所述构建物的元件;
各“-”独立地为键或核苷酸连接序列;
Z1为增强子元件,所述增强子元件包括IRES元件;
Z2为烟草花叶病毒的5’端前导序列(leading sequence)-Ω序列;
Z3为腺嘌呤脱氧核苷酸的寡聚链[oligo(A)]n
Z4为翻译起始密码子;
Z5为丝氨酸密码子;
其中,所述Z3、Z4和Z5组成了Kozak序列,所述Kozak序列来源于酵母。
在另一优选例中,所述Z1来源于酵母。
在另一优选例中,所述IRES元件来源选自下组的一种或多种细胞:原核细胞、真核细胞。
在另一优选例中,所述真核细胞包括高等真核细胞。
在另一优选例中,所述IRES元件包括内源性IRES元件和外源性IRES元件。
在另一优选例中,所述IRES元件来源选自下组的一种或多种细胞:人(human)、中国仓鼠卵巢细胞(Chinese hamster ovary cell,CHO)、昆虫细胞(insect)、麦胚(Wheatgerm cells)、兔网织红细胞(Rabbit reticulocyte)。
在另一优选例中,所述IRES元件选自下组:ScBOI1、ScFLO8、ScNCE102、ScMSN1、KlFLO8、KlNCE102、KlMSN1、KlBOI1、或其组合。
在另一优选例中,所述酵母选自下组:酿酒酵母、克鲁维酵母属酵母、或其组合。
在另一优选例中,所述克鲁维酵母属酵母选自下组:乳酸克鲁维酵母(Kluyveromyces lactis)、马克斯克鲁维酵母(Kluyveromyces marxianus)、多布克鲁维酵母(Kluyveromyces dobzhanskii)、或其组合。
在另一优选例中,所述翻译起始密码子选自下组:ATG、ATA、ATT、GTG、TTG、或其组合。
在另一优选例中,所述翻译起始密码子为ATG。
在另一优选例中,所述丝氨酸密码子选自下组:TCT、TCC、TCA、TCG、AGT、AGC、或其组合。
在另一优选例中,所述丝氨酸密码子为TCT。
在另一优选例中,n为6-12,较佳地,8-10。
在另一优选例中,所述Ω序列包括直接重复模块(ACAATTAC)m和(CAA)p模块。
在另一优选例中,所述m为1-6,较佳地,2-4。
在另一优选例中,所述p为6-12个,较佳地,8-10个。
在另一优选例中,所述(CAA)p模块为1-5个,较佳地,1-3个。
在另一优选例中,所述(CAA)p模块还包括优化的(CAA)p模块。
在另一优选例中,所述Kozak序列如SEQ ID NO.:84所示。
在另一优选例中,所述核酸构建物的序列如SEQ ID NO.:2-17所示。
在另一优选例中,所述核酸构建物的序列如SEQ ID NO.:2-9所示。
在另一优选例中,所述核酸构建物的序列如SEQ ID NO.:3、4、6所示。
本发明第二方面提供了一种核酸构建物,所述的构建物具有从5′至3′的式II结构:
Z1-Z2Z3-Z4-Z5-Z6 (II)
式中,
Z1-Z6分别为用于构成所述构建物的元件;
各“-”独立地为键或核苷酸连接序列;
Z1为增强子元件,所述增强子元件包括IRES元件;
Z2为烟草花叶病毒的5’端前导序列(leading sequence)-Ω序列;
Z3为腺嘌呤脱氧核苷酸的寡聚链[oligo(A)]n
Z4为翻译起始密码子;
Z5为丝氨酸密码子;
Z6为外源蛋白的编码序列;
其中,所述Z3、Z4和Z5组成了Kozak序列,所述Kozak序列来源于酵母。
在另一优选例中,所述外源蛋白的编码序列来自原核生物、真核生物。
在另一优选例中,所述外源蛋白的编码序列来自动物、植物、病原体。
在另一优选例中,所述外源蛋白的编码序列来自哺乳动物,较佳地灵长动物,啮齿动物,包括人、小鼠、大鼠。
在另一优选例中,所述的外源蛋白的编码序列编码选自下组的外源蛋白:荧光素蛋白、或荧光素酶(如萤火虫荧光素酶)、绿色荧光蛋白、黄色荧光蛋白、氨酰tRNA合成酶、甘油醛-3-磷酸脱氢酶、过氧化氢酶、肌动蛋白、抗体的可变区域、萤光素酶突变体、α-淀粉酶、肠道菌素A、丙型肝炎病毒E2糖蛋白、胰岛素前体、干扰素αA、白细胞介素-1β、溶菌酶素、血清白蛋白、单链抗体段(scFV)、甲状腺素运载蛋白、酪氨酸酶、木聚糖酶、或其组合。
在另一优选例中,所述外源蛋白选自下组:荧光素蛋白、或荧光素酶(如萤火虫荧光素酶)、绿色荧光蛋白、黄色荧光蛋白、氨酰tRNA合成酶、甘油醛-3-磷酸脱氢酶、过氧化氢酶、肌动蛋白、抗体的可变区域、萤光素酶突变、α-淀粉酶、肠道菌素A、丙型肝炎病毒E2糖蛋白、胰岛素前体、干扰素αA、白细胞介素-1β、溶菌酶素、血清白蛋白、单链抗体段(scFV)、甲状腺素运载蛋白、酪氨酸酶、木聚糖酶、或其组合。
在另一优选例中,所述核酸构建物的序列如SEQ ID NO.:85-87。
本发明第三方面提供了一种核酸构建物,所述的构建物具有从5’至3’的式III结构:
Z0-Z1-Z2Z3-Z4-Z5-Z6 (III)
式中,
Z0-Z6分别为用于构成所述构建物的元件;
各“-”独立地为键或核苷酸连接序列;
Z0为启动子元件,所述启动子元件选自下组:T7启动子、T3启动子、SP6启动子、或其组合;
Z1为增强子元件,所述增强子元件包括IRES元件;
Z2为烟草花叶病毒的5’端前导序列(leading sequence)-Ω序列;
Z3为腺嘌呤脱氧核苷酸的寡聚链[oligo(A)]n
Z4为翻译起始密码子;
Z5为丝氨酸密码子;
Z6为外源蛋白的编码序列;
其中,所述Z3、Z4和Z5组成了Kozak序列,所述Kozak序列来源于酵母。
本发明第四方面提供了一种核酸构建物,所述的构建物具有从5’至3’的式IV结构:
Z0’-Z1-Z2Z3-Z4-Z5-Z6 (IV)
式中,
Z0’-Z6分别为用于构成所述构建物的元件;
各“-”独立地为键或核苷酸连接序列;
Z0’为GAA;
Z1为增强子元件,所述增强子元件包括IRES元件;
Z2为烟草花叶病毒的5’端前导序列(leading sequence)-Ω序列;
Z3为腺嘌呤脱氧核苷酸的寡聚链[oligo(A)]n
Z4为翻译起始密码子;
Z5为丝氨酸密码子;
Z6为外源蛋白的编码序列;
其中,所述Z3、Z4和Z5组成了Kozak序列,所述Kozak序列来源于酵母。
本发明第五方面提供了一种载体或载体组合,所述的载体或载体组合含有本发明第一方面至本发明第四方面所述的核酸构建物。
本发明第六方面提供了一种基因工程细胞,所述基因工程细胞的基因组的一个或多个位点整合有本发明第一方面至本发明第四方面所述的构建物,或者所述基因工程细胞中含有本发明第五方面所述的载体或载体组合。
在另一优选例中,所述基因工程细胞包括原核细胞、真核细胞。
在另一优选例中,所述真核细胞包括高等真核细胞。
在另一优选例中,所述基因工程细胞选自下组:人源细胞(如Hela细胞)、中国仓鼠卵巢细胞、昆虫细胞、麦胚细胞、兔网织红细胞、酵母细胞、或其组合。
在另一优选例中,所述基因工程细胞为酵母细胞。
在另一优选例中,所述酵母细胞选自下组:酿酒酵母、克鲁维酵母属酵母、或其组合。
在另一优选例中,所述克鲁维酵母属酵母选自下组:乳酸克鲁维酵母、马克斯克鲁维酵母、多布克鲁维酵母、或其组合。
本发明第七方面提供了一种试剂盒,所述试剂盒中包含的试剂选自下组中的一种或多种:
(a)本发明第一方面至本发明第四方面所述的构建物;
(b)本发明第五方面所述的载体或载体组合;和
(c)本发明第六方面所述的基因工程细胞。
在另一优选例中,所述试剂盒还包括(d)真核体外生物合成体系(如真核体外蛋白合成体系)。
在另一优选例中,所述真核体外生物合成体系选自下组:酵母体外生物合成体系、中国仓鼠卵巢细胞体外生物合成体系、昆虫细胞体外生物合成体系、Hela细胞体外生物合成体系、或其组合。
在另一优选例中,所述真核体外生物合成体系包括真核体外蛋白合成体系。
在另一优选例中,所述真核体外蛋白合成体系选自下组:酵母体外蛋白合成体系、中国仓鼠卵巢细胞体外蛋白合成体系、昆虫细胞体外蛋白合成体系、Hela细胞体外蛋白合成体系、或其组合。
在另一优选例中,所述试剂盒还包括(e)酵母体外生物合成体系(如酵母体外蛋白合成体系)。
在另一优选例中,所述酵母体外生物合成体系(如酵母体外蛋白合成体系)为克鲁维酵母体外生物合成体系(如克鲁维酵母体外蛋白合成体系)(优选乳酸克鲁维酵母体外生物合成体系)(如乳酸克鲁维酵母体外蛋白合成体系)。
本发明第八方面提供了一种如本发明第一方面至本发明第四方面所述的构建物、本发明第五方面所述的载体或载体组合、本发明第六方面所述的基因工程细胞或本发明第七方面所述试剂盒的用途,用于进行高通量的体外蛋白合成。
本发明第九方面提供了一种体外高通量的外源蛋白合成方法,包括步骤:
(i)在真核体外生物合成体系存在下,提供本发明第一方面至本发明第四方面所述的核酸构建物;
(ii)在适合的条件下,孵育步骤(i)的真核体外生物合成体系一段时间T1,从而合成所述外源蛋白。
在另一优选例中,所述方法还包括:(iii)任选地从所述真核体外生物合成体系中,分离或检测所述外源蛋白。
在另一优选例中,所述真核体外生物合成体系为酵母体外生物合成体系(如酵母体外蛋白合成体系)。
在另一优选例中,所述酵母体外生物合成体系(如酵母体外蛋白合成体系)为克鲁维酵母体外生物合成体系(如克鲁维酵母体外蛋白合成体系)(优选乳酸克鲁维酵母体外生物合成体系)(如乳酸克鲁维酵母体外蛋白合成体系)。
在另一优选例中,所述外源蛋白的编码序列来自原核生物、真核生物。
在另一优选例中,所述外源蛋白的编码序列来自动物、植物、病原体。
在另一优选例中,所述外源蛋白的编码序列来自哺乳动物,较佳地灵长动物,啮齿动物,包括人、小鼠、大鼠。
在另一优选例中,所述的外源蛋白的编码序列编码选自下组的外源蛋白:荧光素蛋白、或荧光素酶(如萤火虫荧光素酶)、绿色荧光蛋白、黄色荧光蛋白、氨酰tRNA合成酶、甘油醛-3-磷酸脱氢酶、过氧化氢酶、肌动蛋白、抗体的可变区域、萤光素酶突变体、α-淀粉酶、肠道菌素A、丙型肝炎病毒E2糖蛋白、胰岛素前体、干扰素αA、白细胞介素-1β、溶菌酶素、血清白蛋白、单链抗体段(scFV)、甲状腺素运载蛋白、酪氨酸酶、木聚糖酶、或其组合。
在另一优选例中,所述外源蛋白选自下组:荧光素蛋白、或荧光素酶(如萤火虫荧光素酶)、绿色荧光蛋白、黄色荧光蛋白、氨酰tRNA合成酶、甘油醛-3-磷酸脱氢酶、过氧化氢酶、肌动蛋白、抗体的可变区域、萤光素酶突变、α-淀粉酶、肠道菌素A、丙型肝炎病毒E2糖蛋白、胰岛素前体、干扰素αA、白细胞介素-1β、溶菌酶素、血清白蛋白、单链抗体段(scFV)、甲状腺素运载蛋白、酪氨酸酶、木聚糖酶、或其组合。
在另一优选例中,所述步骤(ii)中,反应温度为20-37℃,较佳地,22-35℃。
在另一优选例中,所述步骤(ii)中,反应时间为1-10h,较佳地,2-8h。
应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合,从而构成新的或优选的技术方案。限于篇幅,在此不再一一累述。
附图说明
图1显示了生物合成中5′-UTR序列对于蛋白质翻译起始的关键性作用。5′-UTR在细胞内主要起到调控蛋白质翻译起始和稳定mRNA的作用。(A)在帽子结构依赖的蛋白质翻译起始过程,5′-UTR对于招募翻译起始因子和43S起始前复合物(pre-initiationcomplex,PIC)具有重要作用,还能够调控43S PIC的扫描和翻译起始。在帽子结构非依赖的翻译起始过程中,具有二级结构的5′-UTR(B)和不具有二级结构的5′-UTR(C)都在一些蛋白质因子的帮助下,对于招募43S PIC具有至关重要的作用。图2显示了真核细胞内源性IRES在体外蛋白质合成体系中起始蛋白质合成的效率。将挑选的来自酿酒酵母和乳酸克鲁维酵母的同源的8种IRES应用于酵母体外蛋白质合成体系中,并于传统的Ω序列相比较,其中6种IRES(ScFLO8、ScMSN1、ScNCE102、KlFLO8、KlMSN1和KlNCE102)起始合成的荧光素酶的相对光单位值(RLU)超过了Ω序列。
图3显示了串联DNA元件在体外蛋白质合成体系中起始蛋白质合成的效率比较。由8中IRES分别位于Ω序列的上游或者下游,与Ω序列以及乳酸克鲁维酵母特异性Kozak序列串联,构建16个串联DNA元件。并将16种串联元件应用于体外蛋白质合成体系的中,其中KlNCE102-Ω-10A起始的合成的荧光素酶的相对光单位值(RLU)超过了由Ω序列和Kozak序列的串联元件Ω-10A,是其1.65倍。其次另外两个串联元件ScFLO8-Ω-10A与KlMSN1-Ω-10A的相对光单位值接近Ω-10A,分别达到Ω-10A的81.68%和85.35%。
图4显示了发明中的KlNCE102-Ω-10A序列增强体外蛋白质翻译起始效率的原理。(A)Ω序列招募43S PIC并起始蛋白质翻译需要结合翻译起始因子eIF4G。(B)KlNCE102是A-rich的RNA序列,能够招募poly(A)结合蛋白Pab1。Pab1能够与eIF4G相互作用,进而增强对43S PIC的招募效果,提高翻译起始效率。KlNCE102和Ω序列形成协同效应,增强翻译起始效率。
图5显示了Ω-10A序列和GAA序列增强KlNCE102体外蛋白翻译效率。KlNCE102-Ω-10A串联元件的体外翻译效率是KlNCE102的1.23倍,GAA-KlNCE102-Ω-10A串联元件的体外翻译效率是KlNCE102-Ω-10A的1.28倍,是Ω-10A的2.52倍。
具体实施方式
经过广泛而深入的研究,通过大量筛选和摸索,首次意外地发现了一种可以增强体外蛋白质翻译效率的新型核酸构建物。本发明的核酸构建物由真核细胞(如酵母)来源的IRES增强子(如ScBOI1、ScFLO8、ScNCE102、ScMSN1、KlFLO8、KlNCE102、KlMSN1、KlBOI1)、Ω序列以及酵母(如克鲁维酵母,优选乳酸克鲁维酵母)特异性的Kozak序列串联而成。在酵母体外生物合成体系(如酵母体外蛋白合成体系)中应用本发明的核酸构建物,所合成的荧光素酶活性的相对光单位值(RLU)非常高,可达到单独Ω序列与Kozak序列串联(Ω-10A)的1.65倍,或与Ω-10A相当。
此外,本发明人还意外的发现,将GAA三个残基置于本发明的核酸构建物的上游,也可增强蛋白质合成效率,使本发明的核酸构建物介导的体外合成的荧光素酶的相对光单位值提高了约0.28倍(GAA-KlNCE102-Ω-10A与KlNCE102-Ω-10A相比),与Ω-10A相比,GAA-KlNCE102-Ω-10A的荧光素酶的相对光单位值有1.52倍的增加(即GAA-KlNCE102-Ω-10A是Ω-10A的2.52倍)(图5)。在此基础上,本发明人完成了本发明。
真核体外生物合成体系
真核体外生物合成体系是一种基于真核细胞的转录-翻译偶联的体系,能够以DNA模板为起始合成RNA,或者以DNA或RNA为模板完成蛋白质的体外合成。真核细胞包括酵母细胞、兔网织红细胞、麦胚细胞、昆虫细胞、人源细胞等。真核体外生物合成体系具有能够合成具有复杂结构的RNA或者蛋白质,以及蛋白质翻译后修饰等优点。
在本发明中,所述真核体外生物合成体系没有特别限制,一种优选的真核体外生物合成体系包括酵母体外生物合成体系,较佳地,酵母体外蛋白合成体系,更佳地,克鲁维酵母表达系统(更佳地,乳酸克鲁维酵母表达系统)。
酵母(yeast)兼具培养简单、高效蛋白质折叠、和翻译后修饰的优势。其中酿酒酵母(Saccharomyces cerevisiae)和毕氏酵母(Pichia pastoris)是表达复杂真核蛋白质和膜蛋白的模式生物,酵母也可作为制备体外翻译系统的原料。
克鲁维酵母(Kluyveromyces)是一种子囊孢子酵母,其中的马克斯克鲁维酵母(Kluyveromyces marxianus)和乳酸克鲁维酵母(Kluyveromyces lactis)是工业上广泛使用的酵母。与其他酵母相比,乳酸克鲁维酵母具有许多优点,如超强的分泌能力,更好的大规模发酵特性、食品安全的级别、以及同时具有蛋白翻译后修饰的能力等。
在本发明中,所述真核体外生物合成体系包括:
(a)真核细胞提取物;
(b)聚乙二醇;
(c)任选的外源蔗糖;和
(d)任选的溶剂,所述溶剂为水或水性溶剂。
在一特别优选的实施方式中,本发明提供的体外生物合成体系包括:真核细胞提取物,4-羟乙基哌嗪乙磺酸,醋酸钾,醋酸镁,腺嘌呤核苷三磷酸(ATP),鸟嘌呤核苷三磷酸(GTP),胞嘧啶核苷三磷酸(CTP),胸腺嘧啶核苷三磷酸(TTP),氨基酸混合物,磷酸肌酸,二硫苏糖醇(DTT),磷酸肌酸激酶,RNA酶抑制剂,荧光素,萤光素酶DNA,RNA聚合酶。
在本发明中,RNA聚合酶没有特别限制,可以选自一种或多种RNA聚合酶,典型的RNA聚合酶为T7RNA聚合酶。
在本发明中,所述真核细胞提取物在体外生物合成体系中的比例不受特别限制,通常所述真核细胞提取物在体外生物合成体系中所占体系为20-70%,较佳地,30-60%,更佳地,40-50%。
在本发明中,所述的真核细胞提取物不含完整的细胞,典型的真核细胞提取物包括用于RNA合成所需的各种类型的RNA聚合酶,和用于蛋白翻译的核糖体、转运RNA、氨酰tRNA合成酶、蛋白质合成需要的起始因子和延伸因子以及终止释放因子。此外,真核细胞提取物中还含有一些源自真核细胞的细胞质中的其他蛋白,尤其是可溶性蛋白。
在本发明中,所述的真核细胞提取物所含蛋白含量为20-100mg/mL,较佳为50-100mg/mL。所述的测定蛋白含量方法为考马斯亮蓝测定方法。
在本发明中,所述的真核细胞提取物的制备方法不受限制,一种优选的制备方法包括以下步骤:
(i)提供真核细胞;
(ii)对真核细胞进行洗涤处理,获得经洗涤的真核细胞;
(iii)对经洗涤的真核细胞进行破细胞处理,从而获得真核细胞粗提物;
(iv)对所述真核细胞粗提物进行固液分离,获得液体部分,即为真核细胞提取物。
在本发明中,所述的固液分离方式不受特别限制,一种优选的方式为离心。
在一优选实施方式中,所述离心在液态下进行。
在本发明中,所述离心条件不受特别限制,一种优选的离心条件为5000-100000g,较佳地,8000-30000g。
在本发明中,所述离心时间不受特别限制,一种优选的离心时间为0.5min-2h,较佳地,20min-50min。
在本发明中,所述离心的温度不受特别限制,优选的,所述离心在1-10℃下进行,较佳地,在2-6℃下进行。
在本发明中,所述的洗涤处理方式不受特别限制,一种优选的洗涤处理方式为采用洗涤液在pH为7-8(较佳地,7.4)下进行处理,所述洗涤液没有特别限制,典型的所述洗涤液选自下组:4-羟乙基哌嗪乙磺酸钾、醋酸钾、醋酸镁、或其组合。
在本发明中,所述破细胞处理的方式不受特别限制,一种优选的所述的破细胞处理包括高压破碎、冻融(如液氮低温)破碎。
所述体外生物合成体系中的核苷三磷酸混合物为腺嘌呤核苷三磷酸、鸟嘌呤核苷三磷酸、胞嘧啶核苷三磷酸和尿嘧啶核苷三磷酸。在本发明中,各种单核苷酸的浓度没有特别限制,通常每种单核苷酸的浓度为0.5-5mM,较佳地为1.0-2.0mM。
所述体外生物合成体系中的氨基酸混合物可包括天然或非天然氨基酸,可包括D型或L型氨基酸。代表性的氨基酸包括(但并不限于)20种天然氨基酸:甘氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、苯丙氨酸、脯氨酸、色氨酸、丝氨酸、酪氨酸、半胱氨酸、蛋氨酸、天冬酰胺、谷氨酰胺、苏氨酸、天冬氨酸、谷氨酸、赖氨酸、精氨酸和组氨酸。每种氨基酸的浓度通常为0.01-0.5mM,较佳地0.02-0.2mM,如0.05、0.06、0.07、0.08mM。
在优选例中,所述体外生物合成体系还含有聚乙二醇或其类似物。聚乙二醇或其类似物的浓度没有特别限制,通常,聚乙二醇或其类似物的浓度(w/v)为0.1-8%,较佳地,0.5-4%,更佳地,1-2%,以所述生物合成体系的总重量计。代表性的PEG例子包括(但并不限于):PEG3000,PEG8000,PEG6000和PEG3350。应理解,本发明的体系还可包括其他各种分子量的聚乙二醇(如PEG200、400、1500、2000、4000、6000、8000、10000等)。
在优选例中,所述体外生物合成体系还含有蔗糖。蔗糖的浓度没有特别限制,通常,蔗糖的浓度为0.03-40wt%,较佳地,0.08-10wt%,更佳地,0.1-5wt%,以所述蛋白合成体系的总重量计。
一种特别优选的体外生物合成体系,除了真核细胞提取物之外,还含有以下组分:22mM,pH为7.4的4-羟乙基哌嗪乙磺酸,30-150mM醋酸钾,1.0-5.0mM醋酸镁,1.5-4mM核苷三磷酸混合物,0.08-0.24mM的氨基酸混合物,25mM磷酸肌酸,1.7mM二硫苏糖醇,0.27mg/mL磷酸肌酸激酶,1%-4%聚乙二醇,0.5%-2%蔗糖,8-20ng/μL萤火虫荧光素酶的DNA,0.027-0.054mg/mL T7RNA聚合酶。
Ω序列
如本文所用,术语“Ω序列”是烟草花叶病毒基因组的5’端前导序列,是该种病毒的翻译增强子。Ω的DNA序列含有68个碱基对,由1-6个(优选2-4个,更优选3个)8碱基对直接重复模块(ACAATTAC)和1-5个(优选1-3个,更优选1个)(CAA)p模块,其中,p为6-12个,较佳地,8-10个。这两个模块对于Ω序列的增强翻译功能是关键。在本发明的酵母体外蛋白质合成体系中,Ω序列能够起始“帽子结构”非依赖性的蛋白质翻译,这种功能可能是通过招募翻译起始因子eIF4G实现的。但是Ω序列起始蛋白质翻译的效率比较低,需要对其构成进行优化,并配合其他DNA元件或者蛋白质来增强蛋白质翻译的效率。
Kozak序列
通过对已知的真核生物的mRNA分子中翻译起始密码子(AUG)上下游序列进行分析,找出的共有序列被称为Kozak序列。Kozak序列被证实能够增强mRNA的翻译起始效率。不同物种的Kozak序列往往是不同的,如酿酒酵母细胞(Saccharomyces cerevisiae)与哺乳动物细胞的Kozak序列就存在着显著差异。
在本发明中,所用的Kozak序列包括6-12个腺嘌呤脱氧核苷寡聚链(较佳地,8-10)、翻译起始密码子(如ATG、ATA、ATT、GTG、TTG等,优选ATG)和丝氨酸密码子(如TCT、TCC、TCA、TCG、AGT、AGC等,优选TCT),来源于克鲁维酵母(优选乳酸克鲁维酵母)。
外源编码序列(外源DNA)
如本文所用,术语“外源编码序列”与“外源DNA”可互换使用,均指外源的用于指导RNA或者蛋白质合成的DNA分子。通常,所述的DNA分子为线性的或环状的。所述的DNA分子含有编码外源RNA或者外源蛋白的序列。
在本发明中,所述的外源编码序列的例子包括(但并不限于):基因组序列、cDNA序列。所述的编码外源蛋白的序列还含有启动子序列、5′非翻译序列、3′非翻译序列。
本发明中,所述外源DNA的选择没有特别限制,通常,外源DAN选自下组:小非编码RNA(small non-coding RNA,sncRNA)、长非编码RNA(long non-coding RNA,lncRNA)、转运RNA(transfer RNA,tRNA)、葡萄糖胺-6-磷酸合成酶(Glucosamine-6-phosphatesynthase,glmS)等核酶、小的核RNA(small nuclearRNA,snRNA)、剪接体(spliceosome)等RNA与蛋白质的复合物、其他各种非编码RNA、或其组合。
外源DNA还可选自下组:编码荧光素蛋白、或荧光素酶(如萤火虫荧光素酶)、绿色荧光蛋白、黄色荧光蛋白、氨酰tRNA合成酶、甘油醛-3-磷酸脱氢酶、过氧化氢酶、肌动蛋白、抗体的可变区域的外源DNA、萤光素酶突变体的DNA、或其组合。
外源DNA还可以选自下组:编码α-淀粉酶、肠道菌素A、丙型肝炎病毒E2糖蛋白、胰岛素前体、干扰素αA、白细胞介素-1β、溶菌酶素、血清白蛋白、单链抗体段(scFV)、甲状腺素运载蛋白、酪氨酸酶、木聚糖酶的外源DNA、或其组合。
在一优选实施方式中,所述外源DNA编码选自下组的蛋白:绿色荧光蛋白(enhanced GFP,eGFP)、黄色荧光蛋白(YFP)、大肠杆菌β-半乳糖苷酶(β-galactosidase,LacZ)、人赖氨酸-tRNA合成酶(Lysine-tRNA synthetase)、人亮氨酸-tRNA合成酶(Leucine-tRNA synthetase)、拟南芥甘油醛3-磷酸脱氢酶(Glyceraldehyde-3-phosphatedehydrogenase)、鼠过氧化氢酶(Catalase)、或其组合。
核酸构建物
本发明提供了一种核酸构建物,所述核酸构建物含有结构如式I所示的核酸序列:
Z1-Z2-Z3-Z4-Z5 (I)
式中,
Z1-Z5分别为用于构成所述构建物的元件;
各“-”独立地为键或核苷酸连接序列;
Z1为增强子元件,所述增强子元件包括IRES元件;
Z2为烟草花叶病毒的5’端前导序列(leading sequence)-Ω序列;
Z3为腺嘌呤脱氧核苷酸的寡聚链[oligo(A)]n
Z4为翻译起始密码子;
Z5为丝氨酸密码子;
其中,所述Z3、Z4和Z5组成了Kozak序列,所述Kozak序列来源于酵母。
本发明还提供了一种核酸构建物,所述的构建物具有从5′至3′的式II结构:
Z1-Z2Z3-Z4-Z5-Z6 (II)
式中,
Z1-Z6分别为用于构成所述构建物的元件;
各“-”独立地为键或核苷酸连接序列;
Z1为增强子元件,所述增强子元件包括IRES元件;
Z2为烟草花叶病毒的5’端前导序列(leading sequence)-Ω序列;
Z3为腺嘌呤脱氧核苷酸的寡聚链[oligo(A)]n
Z4为翻译起始密码子;
Z5为丝氨酸密码子;
Z6为外源蛋白的编码序列;
其中,所述Z3、Z4和Z5组成了Kozak序列,所述Kozak序列来源于酵母。
本发明还提供了一种核酸构建物,所述的构建物具有从5′至3′的式III结构:
Z0-Z1-Z2Z3-Z4-Z5-Z6 (III)
式中,
Z0-Z6分别为用于构成所述构建物的元件;
各“-”独立地为键或核苷酸连接序列;
Z0为启动子元件,所述启动子元件选自下组:T7启动子、T3启动子、SP6启动子、或其组合;
Z1为增强子元件,所述增强子元件包括IRES元件;
Z2为烟草花叶病毒的5’端前导序列(leading sequence)-Ω序列;
Z3为腺嘌呤脱氧核苷酸的寡聚链[oligo(A)]n
Z4为翻译起始密码子;
Z5为丝氨酸密码子;
Z6为外源蛋白的编码序列;
其中,所述Z3、Z4和Z5组成了Kozak序列,所述Kozak序列来源于酵母。
本发明还提供了一种核酸构建物,所述的构建物具有从5′至3′的式IV结构:
Z0’-Z1-Z2Z3-Z4-Z5-Z6 (IV)
式中,
Z0’-Z6分别为用于构成所述构建物的元件;
各“-”独立地为键或核苷酸连接序列;
Z0’为GAA;
Z1为增强子元件,所述增强子元件包括IRES元件;
Z2为烟草花叶病毒的5’端前导序列(leading sequence)-Ω序列;
Z3为腺嘌呤脱氧核苷酸的寡聚链[oligo(A)]n
Z4为翻译起始密码子;
Z5为丝氨酸密码子;
Z6为外源蛋白的编码序列;
其中,所述Z3、Z4和Z5组成了Kozak序列,所述Kozak序列来源于酵母。
在本发明中,所述外源蛋白的编码序列的选择没有特别限制,通常,外源蛋白的编码序列选自下组:编码荧光素蛋白、或荧光素酶(如萤火虫荧光素酶)、绿色荧光蛋白、黄色荧光蛋白、氨酰tRNA合成酶、甘油醛-3-磷酸脱氢酶、过氧化氢酶、肌动蛋白、抗体的可变区域的外源DNA、萤光素酶突变体的DNA、或其组合。
外源蛋白的编码序列还可以编码选自下组的蛋白:α-淀粉酶、肠道菌素A、丙型肝炎病毒E2糖蛋白、胰岛素前体、干扰素αA、白细胞介素-1β、溶菌酶素、血清白蛋白、单链抗体段(scFV)、甲状腺素运载蛋白、酪氨酸酶、木聚糖酶、或其组合。
此外,本发明的所述核酸构建物可以是线性的,也可以是环状的。本发明的所述核酸构建物可以是单链的,也可以是双链的。本发明的所述核酸构建物可以是DNA,也可以是RNA,或DNA/RNA杂合。
在一优选实施方式中,本发明的核酸构建物的序列如SEQ ID NO.:2-17所示。
在一优选实施方式中,所述核酸构建物的序列如SEQ ID NO.:2-9所示。
在一优选实施方式中,所述核酸构建物的序列如SEQ ID NO.:3、4、6所示。
在一优选实施方式中,本发明的核酸构建物的序列如SEQ ID NO.:85-87
所示。在另一优选例中,所述的构建物还包括选自下组的元件或其组合:启动子、终止子、poly(A)元件、转运元件、基因靶向元件、筛选标记基因、增强子、抗性基因、转座酶编码基因。
多种选择性标志基因均可应用于本发明,包括但不限于:营养缺陷型标记,抗性标记,报告基因标记。选择性标志的应用对于重组细胞(重组子)的筛选起到作用,使得受体细胞能够与未转化的细胞进行显著区分。营养缺陷型标记是通过转入的标记基因与受体细胞突变基因互补,从而使受体细胞表现野生型生长。抗性标记是指将抗性基因转入受体细胞中,转入的基因使受体细胞在一定的药物浓度下表现抗药性。作为本发明的优选方式,应用抗性标记来实现重组细胞的便捷筛选。
在本发明中,在本发明的酵母体外生物合成体系(如酵母蛋白生物合成体系)中应用本发明的核酸构建物,可显著提高外源蛋白翻译的效率,具体地,应用本发明的核酸构建物所合成的荧光素酶活性的相对光单位值非常高,其中,本发明的核酸构建物(如KlNCE102-Ω-10A)的相对光单位值是Ω-10A序列的1.65倍。
载体,基因工程细胞
本发明还提供了一种载体或载体组合,所述载体含有本发明的核酸构建物。优选地,所述载体选自:细菌质粒、噬菌体、酵母质粒、或动物细胞载体、穿梭载体;所述的载体为转座子载体。用于制备重组载体的方法是本领域普通技术人员所熟知的。只要其能够在宿主体内复制和稳定,任何质粒和载体都是可以被采用的。
本领域普通技术人员可以使用熟知的方法构建含有本发明所述的启动子和/或目的基因序列的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等。
本发明还提供了一种基因工程细胞,所述的基因工程细胞含有所述的构建物或载体或载体组合,或所述的基因工程细胞染色体整合有所述的构建物或载体。在另一优选例中,所述的基因工程细胞还包括含有编码转座酶基因的载体或其染色体上整合有转座酶基因。
优选地,所述的基因工程细胞为真核细胞。
在另一优选例中,所述真核细胞,包括(但不限于):人体细胞、中国仓鼠卵巢细胞、昆虫细胞、麦胚细胞、兔网织红细胞等高等真核生物细胞。
在另一优选例中,所述真核细胞,包括(但不限于):酵母细胞(优选,克鲁维酵母细胞,更优选乳酸克鲁维酵母细胞)。
本发明的构建物或载体,可以用于转化适当的基因工程细胞。基因工程细胞可以是原核细胞,如大肠杆菌,链霉菌属、农杆菌:或是低等真核细胞,如酵母细胞;或是高等动物细胞,如昆虫细胞。本领域一般技术人员都清楚如何选择适当的载体和基因工程细胞。用重组DNA转化基因工程细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物(如大肠杆菌)时,可以用CaCl2法处理,也可用电穿孔法进行。当宿主是真核生物,可选用如下的DNA转染方法:磷酸钙共沉淀法,常规机械方法(如显微注射、电穿孔、脂质体包装等)。转化植物也可使用农杆菌转化或基因枪转化等方法,例如叶盘法、幼胚转化法、花芽浸泡法等。
体外高通量的蛋白合成方法
本发明提供了一种体外高通量的蛋白合成方法,包括步骤:
(i)在真核体外生物合成体系存在下,提供本发明第一方面至第四方面所述的核酸构建物;
(ii)在适合的条件下,孵育步骤(i)的真核体外生物合成体系一段时间T1,从而合成所述外源蛋白。
在另一优选例中,所述方法还包括:(iii)任选地从所述真核体外生物合成体系中,分离或检测所述外源蛋白。
本发明的主要优点包括:
(1)本发明首次发现,将任选的启动子、酵母来源的IRES、Ω序列、Kozak序列和外源蛋白的编码序列作为核酸构建物,应用于本发明的真核体外生物合成体系(如酵母体外蛋白合成体系)中,可显著提高外源蛋白翻译的效率。
(2)本发明的真核细胞内源性IRESs与Ω序列以及Kozak序列串联能够增强真核体外生物合成体系的蛋白质翻译起始效率。串联后的DNA元件增强翻译起始的效率超过后两者单独串联序列(Ω-10A)。其中,KlNCE102-Ω-10A在乳酸克鲁维酵母体外生物合成体系中起始合成的萤火虫荧光素酶(Firefly luciferase,Fluc)的相对光单位值(Relativelight unit,RLU)达到1.67×109,是Ω-10A序列的1.65倍。
(3)与酿酒酵母相比,乳酸克鲁维酵母因其安全性和高效性可以被应用于食品和药品领域蛋白质的生产,加上体外生物合成体系的优点,如适应于高通量的蛋白质合成筛选,合成毒性蛋白质和时间短成本低等,所以乳酸克鲁维酵母细胞来源的体外生物合成体系在蛋白质合成相关领域也能够得到广泛的应用。
(4)本发明提供的核酸构建物不仅能够增强真核体外生物合成体系起始蛋白质翻译的效率,更主要的是能够增加乳酸克鲁维酵母体外生物合成体系的针对不同蛋白质合成的可能性。
(5)本发明的核酸构建物不仅增强了蛋白质翻译起始的效率,而且提供了一种设计用于真核细胞体外生物合成体系的DNA元件的新思路与新方法,能够极大的提高相关体系在科研和工业生产领域的应用。
(6)本发明首次发现,将强启动子(如T7启动子、T3启动子、SP6启动子)与本发明的核酸构建物组合,也可获得非常高的蛋白合成效率。
(7)本发明首次发现,将GAA三个残基置于本发明核酸构建物的上游,也可以获得非常高的蛋白合成效率。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring HarborLaboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。除非另外说明,否则百分比和份数是重量百分比和重量份数。
如无特别说明,则本发明实施例中所用的材料和试剂均为市售产品。
实施例1:真核细胞内源性IRESs与Ω序列以及乳酸克鲁维酵母特异性Kozak序列串联的DNA元件的设计
1.1乳酸克鲁维酵母(Kluyveromyces lactis)和酿酒酵母(Saccharomycescerevisiae)中内源性IRESs的确定:4个乳酸克鲁维酵母内源性IRESs和其在酿酒酵母中同源蛋白对应的IRESs(表1)能够起始体外蛋白质合成,其中6个IRESs起始合成的Fluc的相对光单位值高于传统的Ω序列(KlFLO8、KlMSN1、KlNCE102、ScFLO8、ScMSN1和ScNCE102),另外2个则低于Ω序列(KlBOI1和ScBOI1)(图2)。确定这8个IRESs与Ω序列以及Kozak序列串联。
1.2 16个串联元件的确定:将8个内源性IRESs与Ω序列以及乳酸克鲁维酵母特异性Kozak序列串联,并改变IRESs与Ω序列的上下游顺序,共设计16个串联DNA元件(KlFLO8/KlMSN1/KlNCE102/KlBOI1/ScFLO8/ScMSN1/ScNCE102/ScBOI1-Ω-10A和Ω-KlFLO8/KlMSN1/KlNCE102/KlBOI1/ScFLO8/ScMSN1/ScNCE102/ScBOI1-10A)。串联元件的序列如SEQID NO.:2-17所示,与上述串联DNA元件(KlFLO8/KlMSN1/KlNCE102/KlBOI1/ScFLO8/ScMSN1/ScNCE102/ScBOI1-Ω-10A和Ω-KlFLO8/KlMSN1/KlNCE102/KlBOI1/ScFLO8/ScMSN1/ScNCE102/ScBOI1-10A)的顺序一一对应。
1.3串联元件与报告蛋白基因(Fluc)的设计:将上述设计的16个串联元件插入已有的Ω-10A-Fluc质粒(获自康码(上海)生物科技有限公司,Ω-10A序列如SEQ ID NO.:1所示)中,替换Ω-10A,形成16个新的质粒,分别为KlFLO8-Ω-10A-Fluc、KlMSN1-Ω-10A-Fluc、KlNCE102-Ω-10A-Fluc、KlBOI1-Ω-10A-Fluc、ScFLO8-Ω-10A-Fluc、ScMSN1-Ω-10A-Fluc、ScNCE102-Ω-10A-Fluc、ScBOI1-Ω-10A-Fluc、Ω-KlFLO8-10A-Fluc、Ω-KlMSN1-10A-Fluc、Ω-KlNCE102-10A-Fluc、Ω-KlBOI1-10A-Fluc、Ω-ScFLO8-10A-Fluc、Ω-ScMSN1-10A-Fluc、Ω-ScNCE102-10A-Fluc和Ω-ScBOI1-10A-Fluc。其中,KlNCE102-Ω-10A-Fluc、ScFLO8-Ω-10A-Fluc、KlMSN1-Ω-10A-Fluc的序列如SEQ ID NO.:85-87所示。
表1.酿酒酵母和乳酸克鲁维酵母中的相关基因
实施例2:含有串联DNA元件的体外蛋白质合成体系质粒的构建
2.1质粒的构建:将8个细胞内源性的IRESs插入到Ω-10A-Fluc质粒中,分别位于Ω序列的上下游,具体使用的引物如表2所示。
具体构建过程如下:
对于待插入的IRES片段与Ω-10A-Fluc载体质粒,分别使用两对引物进行PCR扩增,并各取10μL扩增产物进行混合;向20μL扩增产物中加入1μLDpn I,37℃孵育6h;将DpnI处理后产物4μL加入50μL DH5α感受态细胞中,冰上放置30min,42℃热激45s后,冰上放置3min,加入200μL LB液体培养基37℃振荡培养4h,涂布于含有Amp抗生素的LB固体培养基上过夜培养;挑取6个单克隆进行扩大培养后,进行测序确认正确后,提取质粒保存。
表2.PCR扩增引物
实施例3:串联DNA元件在酵母体外蛋白质合成体系中的应用
3.1利用PCR的方法,并使用引物T7_pET21a_F:CGCGAAATTAATACGACTCACTATAGG(SEQ ID NO.:82)和T7ter_pET21a_R:TCCGGATATAGTTCCTCCTTTCAG(SEQ ID NO.:83)将所有质粒中位于T7转录起始序列和终止序列之间包含串联DNA元件与Fluc的片段进行扩增。
并将扩增得到的DNA片段用乙醇沉淀的方法进行纯化和富集:向PCR产物中加入1/10体积的3M醋酸钠(pH 5.2),然后再加入2.5-3倍体积(该体积为加入醋酸钠之后的体积)的95%的乙醇,置于冰上孵育15min;室温条件下以高于14000g的速度离心30min,弃掉上清;使用70%乙醇进行清洗,然后再离心15min,弃掉上清,并用超纯水将沉淀溶解,测定DNA浓度。
3.2按照使用说明,将纯化的DNA片段加入到自制的乳酸克鲁维酵母体外蛋白质合成体系中。并将上述反应体系置于25-30℃的环境中,静置孵育约2-6h。反应结束后,在96孔白板或者384孔白板中加入等体积的Fluc底物荧光素(luciferin),立即放置于Envision2120多功能酶标仪(PerkinElmer),读数,检测Fluc活性,相对光单位值(Relative LightUnit,RLU)作为活性单位,如图2所示。
3.3使用不含有真核细胞内源性IRESs序列的DNA片段(Ω-10A-Fluc)作为对照,以不加任何DNA模板的反应组为阴性对照(Negative control,NC),每个样品均设计三组独立实验。
实验结果
1.真核细胞内源性IRESs与Ω序列以及乳酸克鲁维酵母特异性Kozak序列串联的DNA元件的设计
共设计16个串联DNA元件,并将这16个元件全部插入Ω-10A-Fluc质粒中替换Ω-10A序列,形成16个用于体外蛋白质合成的质粒。
2.含有串联DNA元件的体外蛋白质合成体系质粒的构建
经过多次尝试,最终构建成功所有16个体外蛋白质合成体系质粒。
3.串联DNA元件在酵母体外蛋白质合成体系中的应用
如图3所示,筛选的3个串联DNA元件在酵母体外蛋白质合成体系中引起萤火虫荧光素酶(Firefly luciferase,Fluc)发出的相对光单位值(RelativeLight Units,RLU)只有KlNCE102-Ω-10A超过Ω-10A序列,相对光单位值达到了1.67×109,是Ω-10A序列的1.65倍(Ω-10A序列的相对光单位值为1.01×109)。其余还有ScFLO8-Ω-10A与KlMSN1-Ω-10A的相对光单位值接近Ω-10A,分别达到Ω-10A的81.68%和85.35%。
因为处于检测仪器相对光单位值RLU与蛋白质浓度关系的线性范围内,活性最高的KlNCE102-Ω-10A的相对光单位值是Ω-10A序列的1.65倍,表明串联DNA元件能够增强大约1.65倍的蛋白质合成。
本发明结果表明:将真核细胞内源性的IRESs与Ω序列以及乳酸克鲁维酵母特异性的Kozak序列串联能够增强蛋白质合成效率,两者通过招募能够相互作用的翻译起始因子Pab1和eIF4G来实现促进蛋白质合成效率的协同效应(图4),并能够应用于酵母体外蛋白质合成体系中,起始蛋白质合成的效率能够超过常用的Ω序列与Kozak序列的串联元件Ω-10A。其中KlNCE102-Ω-10A起始蛋白质合成的量是Ω-10A序列的1.65倍,增强了酵母体外蛋白质合成体系翻译蛋白质的效率,增加了乳酸克鲁维酵母体外合成体系进行蛋白质合成起始翻译元件的选择性,极大增强了乳酸克鲁维酵母体外蛋白质合成体系的可用性。
并且,本发明的研究还发现,将GAA三个残基置于串联DNA元件上游(转录后mRNA的5′端为GAA)同样能够增强蛋白质合成效率,GAA与本发明的核酸构建物串联后介导的体外合成的荧光素酶的相对光单位值是单独使用本发明的核酸构建物的1.28倍(图5)。
此外,本发明的研究还发现,本发明的核酸构建物(如KlNCE102-Ω-10A)的相对光单位值是KlNCE102的1.23倍(图5)。
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
序列表
<110> 康码(上海)生物科技有限公司
<120> 一种能够增强蛋白质合成效率的串联DNA元件
<130> P2017-2217
<160> 87
<170> SIPOSequenceListing 1.0
<210> 1
<211> 85
<212> DNA
<213> 人工序列(artificial sequence)
<400> 1
ggtattttta caacaattac caacaacaac aaacaacaaa caacattaca attactattt 60
acaattacaa aaaaaaaaaa tgtct 85
<210> 2
<211> 146
<212> DNA
<213> 人工序列(artificial sequence)
<400> 2
gagatagaga gagagattcc gtgtttttgt ctcctgttct ttacacacgt attttcaacg 60
cggtattttt acaacaatta ccaacaacaa caaacaacaa acaacattac aattactatt 120
tacaattaca aaaaaaaaaa atgtct 146
<210> 3
<211> 147
<212> DNA
<213> 人工序列(artificial sequence)
<400> 3
aacatagaaa tcatcatttt aattgattcg gtgttttcga gtctagtatt gattgtttaa 60
tcggtatttt tacaacaatt accaacaaca acaaacaaca aacaacatta caattactat 120
ttacaattac aaaaaaaaaa aatgtct 147
<210> 4
<211> 146
<212> DNA
<213> 人工序列(artificial sequence)
<400> 4
aaaagaaatc tctcaagctg aaattaaacc aaaactctaa tataagaaaa aaaaatagaa 60
aggtattttt acaacaatta ccaacaacaa caaacaacaa acaacattac aattactatt 120
tacaattaca aaaaaaaaaa atgtct 146
<210> 5
<211> 146
<212> DNA
<213> 人工序列(artificial sequence)
<400> 5
catttagagc atctcagccg tatcataccg ttcgagttcc agaaatacct acaaaatcag 60
tggtattttt acaacaatta ccaacaacaa caaacaacaa acaacattac aattactatt 120
tacaattaca aaaaaaaaaa atgtct 146
<210> 6
<211> 146
<212> DNA
<213> 人工序列(artificial sequence)
<400> 6
aaaaaataaa cacgaagacg tttatagaca taaataaaga ggaaacgcat tccgtggtag 60
aggtattttt acaacaatta ccaacaacaa caaacaacaa acaacattac aattactatt 120
tacaattaca aaaaaaaaaa atgtct 146
<210> 7
<211> 146
<212> DNA
<213> 人工序列(artificial sequence)
<400> 7
ccttgcttat aagaaaagaa accaaatcag aaaaggagat tatttcaagg taggcatcga 60
aggtattttt acaacaatta ccaacaacaa caaacaacaa acaacattac aattactatt 120
tacaattaca aaaaaaaaaa atgtct 146
<210> 8
<211> 146
<212> DNA
<213> 人工序列(artificial sequence)
<400> 8
gaaaaatcgg ttaaaaaaac ttttcttctc aaagcatacc taataacaat ataatcccat 60
aggtattttt acaacaatta ccaacaacaa caaacaacaa acaacattac aattactatt 120
tacaattaca aaaaaaaaaa atgtct 146
<210> 9
<211> 146
<212> DNA
<213> 人工序列(artificial sequence)
<400> 9
aatttcaaca aagttctaac tcgaggtgac cggaggccac tgtaataata aaaaatagaa 60
gggtattttt acaacaatta ccaacaacaa caaacaacaa acaacattac aattactatt 120
tacaattaca aaaaaaaaaa atgtct 146
<210> 10
<211> 146
<212> DNA
<213> 人工序列(artificial sequence)
<400> 10
ggtattttta caacaattac caacaacaac aaacaacaaa caacattaca attactattt 60
acaattacag agatagagag agagattccg tgtttttgtc tcctgttctt tacacacgta 120
ttttcaacgc aaaaaaaaaa atgtct 146
<210> 11
<211> 147
<212> DNA
<213> 人工序列(artificial sequence)
<400> 11
ggtattttta caacaattac caacaacaac aaacaacaaa caacattaca attactattt 60
acaattacaa acatagaaat catcatttta attgattcgg tgttttcgag tctagtattg 120
attgtttaat caaaaaaaaa aatgtct 147
<210> 12
<211> 146
<212> DNA
<213> 人工序列(artificial sequence)
<400> 12
ggtattttta caacaattac caacaacaac aaacaacaaa caacattaca attactattt 60
acaattacaa aaagaaatct ctcaagctga aattaaacca aaactctaat ataagaaaaa 120
aaaatagaaa aaaaaaaaaa atgtct 146
<210> 13
<211> 146
<212> DNA
<213> 人工序列(artificial sequence)
<400> 13
ggtattttta caacaattac caacaacaac aaacaacaaa caacattaca attactattt 60
acaattacac atttagagca tctcagccgt atcataccgt tcgagttcca gaaataccta 120
caaaatcagt aaaaaaaaaa atgtct 146
<210> 14
<211> 146
<212> DNA
<213> 人工序列(artificial sequence)
<400> 14
ggtattttta caacaattac caacaacaac aaacaacaaa caacattaca attactattt 60
acaattacaa aaaaataaac acgaagacgt ttatagacat aaataaagag gaaacgcatt 120
ccgtggtaga aaaaaaaaaa atgtct 146
<210> 15
<211> 146
<212> DNA
<213> 人工序列(artificial sequence)
<400> 15
ggtattttta caacaattac caacaacaac aaacaacaaa caacattaca attactattt 60
acaattacac cttgcttata agaaaagaaa ccaaatcaga aaaggagatt atttcaaggt 120
aggcatcgaa aaaaaaaaaa atgtct 146
<210> 16
<211> 146
<212> DNA
<213> 人工序列(artificial sequence)
<400> 16
ggtattttta caacaattac caacaacaac aaacaacaaa caacattaca attactattt 60
acaattacag aaaaatcggt taaaaaaact tttcttctca aagcatacct aataacaata 120
taatcccata aaaaaaaaaa atgtct 146
<210> 17
<211> 146
<212> DNA
<213> 人工序列(artificial sequence)
<400> 17
ggtattttta caacaattac caacaacaac aaacaacaaa caacattaca attactattt 60
acaattacaa atttcaacaa agttctaact cgaggtgacc ggaggccact gtaataataa 120
aaaatagaag aaaaaaaaaa atgtct 146
<210> 18
<211> 34
<212> DNA
<213> 人工序列(artificial sequence)
<400> 18
cgtattttca acgcggtatt tttacaacaa ttac 34
<210> 19
<211> 35
<212> DNA
<213> 人工序列(artificial sequence)
<400> 19
ctctctctct atctccctat agtgagtcgt attaa 35
<210> 20
<211> 32
<212> DNA
<213> 人工序列(artificial sequence)
<400> 20
actcactata gggagataga gagagagatt cc 32
<210> 21
<211> 32
<212> DNA
<213> 人工序列(artificial sequence)
<400> 21
tgtaaaaata ccgcgttgaa aatacgtgtg ta 32
<210> 22
<211> 36
<212> DNA
<213> 人工序列(artificial sequence)
<400> 22
gattgtttaa tcggtatttt tacaacaatt accaac 36
<210> 23
<211> 32
<212> DNA
<213> 人工序列(artificial sequence)
<400> 23
ctatgttcct atagtgagtc gtattaattt cg 32
<210> 24
<211> 37
<212> DNA
<213> 人工序列(artificial sequence)
<400> 24
acgactcact ataggaacat agaaatcatc attttaa 37
<210> 25
<211> 38
<212> DNA
<213> 人工序列(artificial sequence)
<400> 25
gttgtaaaaa taccgattaa acaatcaata ctagactc 38
<210> 26
<211> 36
<212> DNA
<213> 人工序列(artificial sequence)
<400> 26
tagaaaggta tttttacaac aattaccaac aacaac 36
<210> 27
<211> 38
<212> DNA
<213> 人工序列(artificial sequence)
<400> 27
gagatttctt ttcctatagt gagtcgtatt aatttcgc 38
<210> 28
<211> 33
<212> DNA
<213> 人工序列(artificial sequence)
<400> 28
gactcactat aggaaaagaa atctctcaag ctg 33
<210> 29
<211> 42
<212> DNA
<213> 人工序列(artificial sequence)
<400> 29
gtaattgttg taaaaatacc tttctatttt tttttcttat at 42
<210> 30
<211> 35
<212> DNA
<213> 人工序列(artificial sequence)
<400> 30
cctacaaaat cagtggtatt tttacaacaa ttacc 35
<210> 31
<211> 32
<212> DNA
<213> 人工序列(artificial sequence)
<400> 31
gctctaaatg cctatagtga gtcgtattaa tt 32
<210> 32
<211> 30
<212> DNA
<213> 人工序列(artificial sequence)
<400> 32
tcactatagg catttagagc atctcagccg 30
<210> 33
<211> 38
<212> DNA
<213> 人工序列(artificial sequence)
<400> 33
ttgttgtaaa aataccactg attttgtagg tatttctg 38
<210> 34
<211> 30
<212> DNA
<213> 人工序列(artificial sequence)
<400> 34
ccgtggtaga ggtattttta caacaattac 30
<210> 35
<211> 34
<212> DNA
<213> 人工序列(artificial sequence)
<400> 35
cgtgtttatt ttttcctata gtgagtcgta ttaa 34
<210> 36
<211> 31
<212> DNA
<213> 人工序列(artificial sequence)
<400> 36
ctcactatag gaaaaaataa acacgaagac g 31
<210> 37
<211> 30
<212> DNA
<213> 人工序列(artificial sequence)
<400> 37
taaaaatacc tctaccacgg aatgcgtttc 30
<210> 38
<211> 33
<212> DNA
<213> 人工序列(artificial sequence)
<400> 38
ggtaggcatc gaaggtattt ttacaacaat tac 33
<210> 39
<211> 31
<212> DNA
<213> 人工序列(artificial sequence)
<400> 39
agcaaggcct atagtgagtc gtattaattt c 31
<210> 40
<211> 35
<212> DNA
<213> 人工序列(artificial sequence)
<400> 40
gactcactat aggccttgct tataagaaaa gaaac 35
<210> 41
<211> 34
<212> DNA
<213> 人工序列(artificial sequence)
<400> 41
gttgtaaaaa taccttcgat gcctaccttg aaat 34
<210> 42
<211> 36
<212> DNA
<213> 人工序列(artificial sequence)
<400> 42
caatataatc ccataggtat ttttacaaca attacc 36
<210> 43
<211> 34
<212> DNA
<213> 人工序列(artificial sequence)
<400> 43
ccgatttttc cctatagtga gtcgtattaa tttc 34
<210> 44
<211> 34
<212> DNA
<213> 人工序列(artificial sequence)
<400> 44
cgactcacta tagggaaaaa tcggttaaaa aaac 34
<210> 45
<211> 37
<212> DNA
<213> 人工序列(artificial sequence)
<400> 45
gttgtaaaaa tacctatggg attatattgt tattagg 37
<210> 46
<211> 40
<212> DNA
<213> 人工序列(artificial sequence)
<400> 46
taataaaaaa tagaagggta tttttacaac aattaccaac 40
<210> 47
<211> 34
<212> DNA
<213> 人工序列(artificial sequence)
<400> 47
ctttgttgaa attcctatag tgagtcgtat taat 34
<210> 48
<211> 36
<212> DNA
<213> 人工序列(artificial sequence)
<400> 48
tacgactcac tataggaatt tcaacaaagt tctaac 36
<210> 49
<211> 40
<212> DNA
<213> 人工序列(artificial sequence)
<400> 49
gtaattgttg taaaaatacc cttctatttt ttattattac 40
<210> 50
<211> 38
<212> DNA
<213> 人工序列(artificial sequence)
<400> 50
caacgcaaaa aaaaaaatgt ctgaagacgc caaaaaca 38
<210> 51
<211> 41
<212> DNA
<213> 人工序列(artificial sequence)
<400> 51
gaatctctct ctctatctct gtaattgtaa atagtaattg t 41
<210> 52
<211> 44
<212> DNA
<213> 人工序列(artificial sequence)
<400> 52
acaattacta tttacaatta cagagataga gagagagatt ccgt 44
<210> 53
<211> 55
<212> DNA
<213> 人工序列(artificial sequence)
<400> 53
gtttttggcg tcttcagaca tttttttttt tgcgttgaaa atacgtgtgt aaaga 55
<210> 54
<211> 33
<212> DNA
<213> 人工序列(artificial sequence)
<400> 54
gtttaatcaa aaaaaaaaat gtctgaagac gcc 33
<210> 55
<211> 45
<212> DNA
<213> 人工序列(artificial sequence)
<400> 55
gatttctatg tttgtaattg taaatagtaa ttgtaatgtt gtttg 45
<210> 56
<211> 42
<212> DNA
<213> 人工序列(artificial sequence)
<400> 56
caattactat ttacaattac aaacatagaa atcatcattt ta 42
<210> 57
<211> 37
<212> DNA
<213> 人工序列(artificial sequence)
<400> 57
cagacatttt tttttttgat taaacaatca atactag 37
<210> 58
<211> 22
<212> DNA
<213> 人工序列(artificial sequence)
<400> 58
atgtctgaag acgccaaaaa ca 22
<210> 59
<211> 22
<212> DNA
<213> 人工序列(artificial sequence)
<400> 59
tgtaattgta aatagtaatt gt 22
<210> 60
<211> 42
<212> DNA
<213> 人工序列(artificial sequence)
<400> 60
aattactatt tacaattaca aaaagaaatc tctcaagctg aa 42
<210> 61
<211> 54
<212> DNA
<213> 人工序列(artificial sequence)
<400> 61
gtttttggcg tcttcagaca tttttttttt ttttctattt ttttttctta tatt 54
<210> 62
<211> 29
<212> DNA
<213> 人工序列(artificial sequence)
<400> 62
cagtaaaaaa aaaatgtctg aagacgcca 29
<210> 63
<211> 41
<212> DNA
<213> 人工序列(artificial sequence)
<400> 63
gagatgctct aaatgtgtaa ttgtaaatag taattgtaat g 41
<210> 64
<211> 35
<212> DNA
<213> 人工序列(artificial sequence)
<400> 64
ctatttacaa ttacacattt agagcatctc agccg 35
<210> 65
<211> 40
<212> DNA
<213> 人工序列(artificial sequence)
<400> 65
cagacatttt tttttttact gattttgtag gtatttctgg 40
<210> 66
<211> 43
<212> DNA
<213> 人工序列(artificial sequence)
<400> 66
tccgtggtag aaaaaaaaaa aatgtctgaa gacgccaaaa aca 43
<210> 67
<211> 42
<212> DNA
<213> 人工序列(artificial sequence)
<400> 67
cgtcttcgtg tttatttttt tgtaattgta aatagtaatt gt 42
<210> 68
<211> 44
<212> DNA
<213> 人工序列(artificial sequence)
<400> 68
acaattacta tttacaatta caaaaaaata aacacgaaga cgtt 44
<210> 69
<211> 53
<212> DNA
<213> 人工序列(artificial sequence)
<400> 69
tgtttttggc gtcttcagac attttttttt tttctaccac ggaatgcgtt tcc 53
<210> 70
<211> 34
<212> DNA
<213> 人工序列(artificial sequence)
<400> 70
atcgaaaaaa aaaaaaatgt ctgaagacgc caaa 34
<210> 71
<211> 39
<212> DNA
<213> 人工序列(artificial sequence)
<400> 71
ataagcaagg tgtaattgta aatagtaatt gtaatgttg 39
<210> 72
<211> 41
<212> DNA
<213> 人工序列(artificial sequence)
<400> 72
caattactat ttacaattac accttgctta taagaaaaga a 41
<210> 73
<211> 39
<212> DNA
<213> 人工序列(artificial sequence)
<400> 73
cagacatttt tttttttttc gatgcctacc ttgaaataa 39
<210> 74
<211> 31
<212> DNA
<213> 人工序列(artificial sequence)
<400> 74
atgtctgaag acgccaaaaa cataaagaaa g 31
<210> 75
<211> 41
<212> DNA
<213> 人工序列(artificial sequence)
<400> 75
tgtaattgta aatagtaatt gtaatgttgt ttgttgtttg t 41
<210> 76
<211> 44
<212> DNA
<213> 人工序列(artificial sequence)
<400> 76
acaattacta tttacaatta cagaaaaatc ggttaaaaaa actt 44
<210> 77
<211> 54
<212> DNA
<213> 人工序列(artificial sequence)
<400> 77
tgtttttggc gtcttcagac attttttttt tttatgggat tatattgtta ttag 54
<210> 78
<211> 31
<212> DNA
<213> 人工序列(artificial sequence)
<400> 78
tagaagaaaa aaaaaaatgt ctgaagacgc c 31
<210> 79
<211> 38
<212> DNA
<213> 人工序列(artificial sequence)
<400> 79
gttgaaattt gtaattgtaa atagtaattg taatgttg 38
<210> 80
<211> 41
<212> DNA
<213> 人工序列(artificial sequence)
<400> 80
caattactat ttacaattac aaatttcaac aaagttctaa c 41
<210> 81
<211> 41
<212> DNA
<213> 人工序列(artificial sequence)
<400> 81
tcttcagaca tttttttttt tcttctattt tttattatta c 41
<210> 82
<211> 27
<212> DNA
<213> 人工序列(artificial sequence)
<400> 82
cgcgaaatta atacgactca ctatagg 27
<210> 83
<211> 24
<212> DNA
<213> 人工序列(artificial sequence)
<400> 83
tccggatata gttcctcctt tcag 24
<210> 84
<211> 16
<212> RNA
<213> 人工序列(artificial sequence)
<400> 84
aaaaaaaaaa augucu 16
<210> 85
<211> 1799
<212> DNA
<213> 人工序列(artificial sequence)
<400> 85
aaaagaaatc tctcaagctg aaattaaacc aaaactctaa tataagaaaa aaaaatagaa 60
aggtattttt acaacaatta ccaacaacaa caaacaacaa acaacattac aattactatt 120
tacaattaca aaaaaaaaaa atgtctgaag acgccaaaaa cataaagaaa ggcccggcgc 180
cattctatcc tctagaggat ggaaccgctg gagagcaact gcataaggct atgaagagat 240
acgccctggt tcctggaaca attgctttta cagatgcaca tatcgaggtg aacatcacgt 300
acgcggaata cttcgaaatg tccgttcggt tggcagaagc tatgaaacga tatgggctga 360
atacaaatca cagaatcgtc gtatgcagtg aaaactctct tcaattcttt atgccggtgt 420
tgggcgcgtt atttatcgga gttgcagttg cgcccgcgaa cgacatttat aatgaacgtg 480
aattgctcaa cagtatgaac atttcgcagc ctaccgtagt gtttgtttcc aaaaaggggt 540
tgcaaaaaat tttgaacgtg caaaaaaaat taccaataat ccagaaaatt attatcatgg 600
attctaaaac ggattaccag ggatttcagt cgatgtacac gttcgtcaca tctcatctac 660
ctcccggttt taatgaatac gattttgtac cagagtcctt tgatcgtgac aaaacaattg 720
cactgataat gaattcctct ggatctactg ggttacctaa gggtgtggcc cttccgcata 780
gaactgcctg cgtcagattc tcgcatgcca gagatcctat ttttggcaat caaatcattc 840
cggatactgc gattttaagt gttgttccat tccatcacgg ttttggaatg tttactacac 900
tcggatattt gatatgtgga tttcgagtcg tcttaatgta tagatttgaa gaagagctgt 960
ttttacgatc ccttcaggat tacaaaattc aaagtgcgtt gctagtacca accctatttt 1020
cattcttcgc caaaagcact ctgattgaca aatacgattt atctaattta cacgaaattg 1080
cttctggggg cgcacctctt tcgaaagaag tcggggaagc ggttgcaaaa cgcttccatc 1140
ttccagggat acgacaagga tatgggctca ctgagactac atcagctatt ctgattacac 1200
ccgaggggga tgataaaccg ggcgcggtcg gtaaagttgt tccatttttt gaagcgaagg 1260
ttgtggatct ggataccggg aaaacgctgg gcgttaatca gagaggcgaa ttatgtgtca 1320
gaggacctat gattatgtcc ggttatgtaa acaatccgga agcgaccaac gccttgattg 1380
acaaggatgg atggctacat tctggagaca tagcttactg ggacgaagac gaacacttct 1440
tcatagttga ccgcttgaag tctttaatta aatacaaagg atatcaggtg gcccccgctg 1500
aattggaatc gatattgtta caacacccca acatcttcga cgcgggcgtg gcaggtcttc 1560
ccgacgatga cgccggtgaa cttcccgccg ccgttgttgt tttggagcac ggaaagacga 1620
tgacggaaaa agagatcgtg gattacgtcg ccagtcaagt aacaaccgcg aaaaagttgc 1680
gcggaggagt tgtgtttgtg gacgaagtac cgaaaggtct taccggaaaa ctcgacgcaa 1740
gaaaaatcag agagatcctc ataaaggcca agaagggcgg aaagtccaaa ttggtttaa 1799
<210> 86
<211> 1799
<212> DNA
<213> 人工序列(artificial sequence)
<400> 86
aaaaaataaa cacgaagacg tttatagaca taaataaaga ggaaacgcat tccgtggtag 60
aggtattttt acaacaatta ccaacaacaa caaacaacaa acaacattac aattactatt 120
tacaattaca aaaaaaaaaa atgtctgaag acgccaaaaa cataaagaaa ggcccggcgc 180
cattctatcc tctagaggat ggaaccgctg gagagcaact gcataaggct atgaagagat 240
acgccctggt tcctggaaca attgctttta cagatgcaca tatcgaggtg aacatcacgt 300
acgcggaata cttcgaaatg tccgttcggt tggcagaagc tatgaaacga tatgggctga 360
atacaaatca cagaatcgtc gtatgcagtg aaaactctct tcaattcttt atgccggtgt 420
tgggcgcgtt atttatcgga gttgcagttg cgcccgcgaa cgacatttat aatgaacgtg 480
aattgctcaa cagtatgaac atttcgcagc ctaccgtagt gtttgtttcc aaaaaggggt 540
tgcaaaaaat tttgaacgtg caaaaaaaat taccaataat ccagaaaatt attatcatgg 600
attctaaaac ggattaccag ggatttcagt cgatgtacac gttcgtcaca tctcatctac 660
ctcccggttt taatgaatac gattttgtac cagagtcctt tgatcgtgac aaaacaattg 720
cactgataat gaattcctct ggatctactg ggttacctaa gggtgtggcc cttccgcata 780
gaactgcctg cgtcagattc tcgcatgcca gagatcctat ttttggcaat caaatcattc 840
cggatactgc gattttaagt gttgttccat tccatcacgg ttttggaatg tttactacac 900
tcggatattt gatatgtgga tttcgagtcg tcttaatgta tagatttgaa gaagagctgt 960
ttttacgatc ccttcaggat tacaaaattc aaagtgcgtt gctagtacca accctatttt 1020
cattcttcgc caaaagcact ctgattgaca aatacgattt atctaattta cacgaaattg 1080
cttctggggg cgcacctctt tcgaaagaag tcggggaagc ggttgcaaaa cgcttccatc 1140
ttccagggat acgacaagga tatgggctca ctgagactac atcagctatt ctgattacac 1200
ccgaggggga tgataaaccg ggcgcggtcg gtaaagttgt tccatttttt gaagcgaagg 1260
ttgtggatct ggataccggg aaaacgctgg gcgttaatca gagaggcgaa ttatgtgtca 1320
gaggacctat gattatgtcc ggttatgtaa acaatccgga agcgaccaac gccttgattg 1380
acaaggatgg atggctacat tctggagaca tagcttactg ggacgaagac gaacacttct 1440
tcatagttga ccgcttgaag tctttaatta aatacaaagg atatcaggtg gcccccgctg 1500
aattggaatc gatattgtta caacacccca acatcttcga cgcgggcgtg gcaggtcttc 1560
ccgacgatga cgccggtgaa cttcccgccg ccgttgttgt tttggagcac ggaaagacga 1620
tgacggaaaa agagatcgtg gattacgtcg ccagtcaagt aacaaccgcg aaaaagttgc 1680
gcggaggagt tgtgtttgtg gacgaagtac cgaaaggtct taccggaaaa ctcgacgcaa 1740
gaaaaatcag agagatcctc ataaaggcca agaagggcgg aaagtccaaa ttggtttaa 1799
<210> 87
<211> 1800
<212> DNA
<213> 人工序列(artificial sequence)
<400> 87
aacatagaaa tcatcatttt aattgattcg gtgttttcga gtctagtatt gattgtttaa 60
tcggtatttt tacaacaatt accaacaaca acaaacaaca aacaacatta caattactat 120
ttacaattac aaaaaaaaaa aatgtctgaa gacgccaaaa acataaagaa aggcccggcg 180
ccattctatc ctctagagga tggaaccgct ggagagcaac tgcataaggc tatgaagaga 240
tacgccctgg ttcctggaac aattgctttt acagatgcac atatcgaggt gaacatcacg 300
tacgcggaat acttcgaaat gtccgttcgg ttggcagaag ctatgaaacg atatgggctg 360
aatacaaatc acagaatcgt cgtatgcagt gaaaactctc ttcaattctt tatgccggtg 420
ttgggcgcgt tatttatcgg agttgcagtt gcgcccgcga acgacattta taatgaacgt 480
gaattgctca acagtatgaa catttcgcag cctaccgtag tgtttgtttc caaaaagggg 540
ttgcaaaaaa ttttgaacgt gcaaaaaaaa ttaccaataa tccagaaaat tattatcatg 600
gattctaaaa cggattacca gggatttcag tcgatgtaca cgttcgtcac atctcatcta 660
cctcccggtt ttaatgaata cgattttgta ccagagtcct ttgatcgtga caaaacaatt 720
gcactgataa tgaattcctc tggatctact gggttaccta agggtgtggc ccttccgcat 780
agaactgcct gcgtcagatt ctcgcatgcc agagatccta tttttggcaa tcaaatcatt 840
ccggatactg cgattttaag tgttgttcca ttccatcacg gttttggaat gtttactaca 900
ctcggatatt tgatatgtgg atttcgagtc gtcttaatgt atagatttga agaagagctg 960
tttttacgat cccttcagga ttacaaaatt caaagtgcgt tgctagtacc aaccctattt 1020
tcattcttcg ccaaaagcac tctgattgac aaatacgatt tatctaattt acacgaaatt 1080
gcttctgggg gcgcacctct ttcgaaagaa gtcggggaag cggttgcaaa acgcttccat 1140
cttccaggga tacgacaagg atatgggctc actgagacta catcagctat tctgattaca 1200
cccgaggggg atgataaacc gggcgcggtc ggtaaagttg ttccattttt tgaagcgaag 1260
gttgtggatc tggataccgg gaaaacgctg ggcgttaatc agagaggcga attatgtgtc 1320
agaggaccta tgattatgtc cggttatgta aacaatccgg aagcgaccaa cgccttgatt 1380
gacaaggatg gatggctaca ttctggagac atagcttact gggacgaaga cgaacacttc 1440
ttcatagttg accgcttgaa gtctttaatt aaatacaaag gatatcaggt ggcccccgct 1500
gaattggaat cgatattgtt acaacacccc aacatcttcg acgcgggcgt ggcaggtctt 1560
cccgacgatg acgccggtga acttcccgcc gccgttgttg ttttggagca cggaaagacg 1620
atgacggaaa aagagatcgt ggattacgtc gccagtcaag taacaaccgc gaaaaagttg 1680
cgcggaggag ttgtgtttgt ggacgaagta ccgaaaggtc ttaccggaaa actcgacgca 1740
agaaaaatca gagagatcct cataaaggcc aagaagggcg gaaagtccaa attggtttaa 1800

Claims (10)

1.一种核酸构建物,其特征在于,所述核酸构建物含有结构如式I所示的核酸序列:
Z1-Z2-Z3-Z4-Z5 (I)
式中,
Z1-Z5分别为用于构成所述构建物的元件;
各“-”独立地为键或核苷酸连接序列;
Z1为增强子元件,所述增强子元件包括IRES元件;
Z2为烟草花叶病毒的5’端前导序列(leading sequence)-Ω序列;
Z3为腺嘌呤脱氧核苷酸的寡聚链[oligo(A)]n
Z4为翻译起始密码子;
Z5为丝氨酸密码子;
其中,所述Z3、Z4和Z5组成了Kozak序列,所述Kozak序列来源于酵母。
2.一种核酸构建物,其特征在于,所述的构建物具有从5′至3′的式II结构:
Z1-Z2 Z3-Z4-Z5-Z6 (II)
式中,
Z1-Z6分别为用于构成所述构建物的元件;
各“-”独立地为键或核苷酸连接序列;
Z1为增强子元件,所述增强子元件包括IRES元件;
Z2为烟草花叶病毒的5’端前导序列(leading sequence)-Ω序列;
Z3为腺嘌呤脱氧核苷酸的寡聚链[oligo(A)]n;
Z4为翻译起始密码子;
Z5为丝氨酸密码子;
Z6为外源蛋白的编码序列;
其中,所述Z3、Z4和Z5组成了Kozak序列,所述Kozak序列来源于酵母。
3.一种核酸构建物,其特征在于,所述的构建物具有从5’至3’的式III结构:
Z0-Z1-Z2 Z3-Z4-Z5-Z6 (III)
式中,
Z0-Z6分别为用于构成所述构建物的元件;
各“-”独立地为键或核苷酸连接序列;
Z0为启动子元件,所述启动子元件选自下组:T7启动子、T3启动子、SP6启动子、或其组合;
Z1为增强子元件,所述增强子元件包括IRES元件;
Z2为烟草花叶病毒的5’端前导序列(leading sequence)-Ω序列;
Z3为腺嘌呤脱氧核苷酸的寡聚链[oligo(A)]n;
Z4为翻译起始密码子;
Z5为丝氨酸密码子;
Z6为外源蛋白的编码序列;
其中,所述Z3、Z4和Z5组成了Kozak序列,所述Kozak序列来源于酵母。
4.一种核酸构建物,其特征在于,所述的构建物具有从5’至3’的式IV结构:
Z0’-Z1-Z2 Z3-Z4-Z5-Z6 (IV)
式中,
Z0’-Z6分别为用于构成所述构建物的元件;
各“-”独立地为键或核苷酸连接序列;
Z0’为GAA;
Z1为增强子元件,所述增强子元件包括IRES元件;
Z2为烟草花叶病毒的5’端前导序列(leading sequence)-Ω序列;
Z3为腺嘌呤脱氧核苷酸的寡聚链[oligo(A)]n;
Z4为翻译起始密码子;
Z5为丝氨酸密码子;
Z6为外源蛋白的编码序列;
其中,所述Z3、Z4和Z5组成了Kozak序列,所述Kozak序列来源于酵母。
5.一种载体或载体组合,其特征在于,所述的载体或载体组合含有权利要求1-4所述的核酸构建物。
6.一种基因工程细胞,其特征在于,所述基因工程细胞的基因组的一个或多个位点整合有权利要求1-4所述的构建物,或者所述基因工程细胞中含有权利要求5所述的载体或载体组合。
7.一种试剂盒,其特征在于,所述试剂盒中包含的试剂选自下组中的一种或多种:
(a) 权利要求1-4所述的构建物;
(b) 权利要求5所述的载体或载体组合;和
(c) 权利要求6所述的基因工程细胞。
8.一种如权利要求1-4所述的构建物、权利要求5所述的载体或载体组合、权利要求6所述的基因工程细胞或权利要求7所述试剂盒的用途,其特征在于,用于进行高通量的体外蛋白合成。
9.一种体外高通量的外源蛋白合成方法,其特征在于,包括步骤:
(i) 在真核体外生物合成体系存在下,提供权利要求1-4所述的核酸构建物;
(ii) 在适合的条件下,孵育步骤(i)的真核体外生物合成体系一段时间T1,从而合成所述外源蛋白。
10.如权利要求9所述的方法,其特征在于,所述方法还包括:(iii) 任选地,从所述真核体外生物合成体系中,分离或检测所述外源蛋白。
CN201711194355.9A 2017-11-24 2017-11-24 一种能够增强蛋白质合成效率的串联dna元件 Pending CN109837293A (zh)

Priority Applications (6)

Application Number Priority Date Filing Date Title
CN201711194355.9A CN109837293A (zh) 2017-11-24 2017-11-24 一种能够增强蛋白质合成效率的串联dna元件
JP2020545833A JP7028986B2 (ja) 2017-11-24 2017-11-30 タンパク質合成効率を高めることができるタンデムdnaエレメント
US16/766,079 US20230203555A1 (en) 2017-11-24 2017-11-30 Tandem dna element capable of enhancing protein synthesis efficiency
PCT/CN2017/113941 WO2019100431A1 (zh) 2017-11-24 2017-11-30 一种能够增强蛋白质合成效率的串联dna元件
EP17932921.4A EP3730621A4 (en) 2017-11-24 2017-11-30 TANDEM DNA ELEMENT CAPABLE OF IMPROVING PROTEIN SYNTHESIS EFFICIENCY
KR1020207018326A KR102418515B1 (ko) 2017-11-24 2017-11-30 단백질 합성 효율을 향상시킬 수 있는 탠덤 dna 요소

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711194355.9A CN109837293A (zh) 2017-11-24 2017-11-24 一种能够增强蛋白质合成效率的串联dna元件

Publications (1)

Publication Number Publication Date
CN109837293A true CN109837293A (zh) 2019-06-04

Family

ID=66630823

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711194355.9A Pending CN109837293A (zh) 2017-11-24 2017-11-24 一种能够增强蛋白质合成效率的串联dna元件

Country Status (6)

Country Link
US (1) US20230203555A1 (zh)
EP (1) EP3730621A4 (zh)
JP (1) JP7028986B2 (zh)
KR (1) KR102418515B1 (zh)
CN (1) CN109837293A (zh)
WO (1) WO2019100431A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020239111A1 (zh) 2019-05-30 2020-12-03 康码(上海)生物科技有限公司 体外定量共表达多种蛋白的方法及其应用
WO2021104435A1 (zh) 2019-11-30 2021-06-03 康码(上海)生物科技有限公司 一种生物磁性微球及其制备方法和应用

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102753700A (zh) * 2009-09-04 2012-10-24 先正达参股股份有限公司 增加植物中多肽表达的翻译增强子元件堆叠
WO2014144583A2 (en) * 2013-03-15 2014-09-18 Northwestern University Methods for cell- free protein synthesis

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4228458A1 (de) * 1992-08-27 1994-06-01 Beiersdorf Ag Multicistronische Expressionseinheiten und deren Verwendung
US8889394B2 (en) * 2009-09-07 2014-11-18 Empire Technology Development Llc Multiple domain proteins
US9951392B2 (en) * 2014-03-14 2018-04-24 Northwestern University Substrate replenishment and byproduct removal improve yeast cell-free protein synthesis

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102753700A (zh) * 2009-09-04 2012-10-24 先正达参股股份有限公司 增加植物中多肽表达的翻译增强子元件堆叠
WO2014144583A2 (en) * 2013-03-15 2014-09-18 Northwestern University Methods for cell- free protein synthesis

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
NAMI KAMURA ET AL.: "Selection of 5’-untranslated sequences that enhance initiation of translation in a cell-free protein synthesis system from wheat embryos", 《BIOORGANIC & MEDICINAL CHEMISTRY LETTERS》 *
WENDY V. GILBERT ET AL.: "Cap-Independent Translation Is Required for Starvation-Induced Differentiation in Yeast", 《SCIENCE》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020239111A1 (zh) 2019-05-30 2020-12-03 康码(上海)生物科技有限公司 体外定量共表达多种蛋白的方法及其应用
WO2021104435A1 (zh) 2019-11-30 2021-06-03 康码(上海)生物科技有限公司 一种生物磁性微球及其制备方法和应用

Also Published As

Publication number Publication date
WO2019100431A1 (zh) 2019-05-31
KR102418515B1 (ko) 2022-07-06
KR20200089314A (ko) 2020-07-24
US20230203555A1 (en) 2023-06-29
EP3730621A1 (en) 2020-10-28
JP2021503950A (ja) 2021-02-15
EP3730621A4 (en) 2021-12-01
JP7028986B2 (ja) 2022-03-02

Similar Documents

Publication Publication Date Title
CN108642076B (zh) 一种体外DNA-to-Protein(D2P)的合成体系、制剂、试剂盒及制备方法
CN109971775A (zh) 一种核酸构建物及其调控蛋白合成的方法
CN108690139B (zh) 新型融合蛋白的制备及其在提高蛋白质合成的应用
Yin et al. Functional evaluation of the signal peptides of secreted proteins
ES2446040T3 (es) RNA circular monocatenario y método para producirlo
CN108535489B (zh) 一种用于体外蛋白质合成的蛋白合成体系、试剂盒及其制备方法
CN106978349B (zh) 一种体外蛋白质合成的试剂盒及其制备方法
CN110408636A (zh) 多重标签串联的dna序列及其在蛋白质表达纯化系统的应用
CN110408635A (zh) 一种含有链霉亲和素元件的核酸构建物在蛋白质表达、纯化中的应用
CN108949801B (zh) 一种通过对核酸酶系统敲除以调控体外生物合成活性的方法
CN103911367A (zh) 一种核酸扩增反应试剂的冻干保护剂及冻干方法
CN109423496A (zh) 一种细胞中内源性表达rna聚合酶的核酸构建物
CN110283764A (zh) 一种半胱氨酸单细胞生物传感器的构建及应用
CN110093284A (zh) 一种在细胞中提高蛋白合成效率的方法
CN109837293A (zh) 一种能够增强蛋白质合成效率的串联dna元件
CN110819647A (zh) 信号肽相关序列及其在蛋白质合成中的应用
CN111378708B (zh) 一种体外无细胞蛋白合成体系及其应用
CN109022478A (zh) 一种用于高通量体外蛋白质合成的dna元件
CN109971783A (zh) 一种体外蛋白合成体系、试剂盒及其制备方法
CN111778270B (zh) 通过整合发光报告基因反映体外无细胞蛋白表达水平的方法
CN109321620A (zh) 一种蛋白合成冻干制剂及其制备方法和应用
CA2347993A1 (fr) Procede de production in vivo de proteines chimiquement diversifiees par incorporation d&#39;acides amines non conventionnels
JP6778870B2 (ja) 藍藻変異株及びそれを用いたコハク酸及びd−乳酸産生方法
WO2024051855A1 (zh) 一种核酸构建物以及在ivtt体系中的应用
WO2019127259A1 (zh) 一种体外蛋白合成体系、试剂盒及其制备方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: Building No. 12, 118 Lane, Furong Hualu, Pudong New Area, Shanghai, 201321

Applicant after: Kang code (Shanghai) Biological Technology Co., Ltd.

Address before: 3rd Floor, No. 8 Building, 500 Lane, Furong Hualu, Pudong New Area, Shanghai, 201321

Applicant before: Kang code (Shanghai) Biological Technology Co., Ltd.

CB02 Change of applicant information
RJ01 Rejection of invention patent application after publication

Application publication date: 20190604

RJ01 Rejection of invention patent application after publication