CN113699124B - 一种含非天然氨基酸蛋白的制备方法 - Google Patents

一种含非天然氨基酸蛋白的制备方法 Download PDF

Info

Publication number
CN113699124B
CN113699124B CN202111050643.3A CN202111050643A CN113699124B CN 113699124 B CN113699124 B CN 113699124B CN 202111050643 A CN202111050643 A CN 202111050643A CN 113699124 B CN113699124 B CN 113699124B
Authority
CN
China
Prior art keywords
trna
unnatural amino
mutant
amino acid
erf1
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111050643.3A
Other languages
English (en)
Other versions
CN113699124A (zh
Inventor
夏青
史宁宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Original Assignee
Peking University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University filed Critical Peking University
Priority to CN202111050643.3A priority Critical patent/CN113699124B/zh
Publication of CN113699124A publication Critical patent/CN113699124A/zh
Application granted granted Critical
Publication of CN113699124B publication Critical patent/CN113699124B/zh
Priority to PCT/CN2022/117667 priority patent/WO2023036210A1/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/93Ligases (6)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4702Regulators; Modulating activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/65Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression using markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y601/00Ligases forming carbon-oxygen bonds (6.1)
    • C12Y601/01Ligases forming aminoacyl-tRNA and related compounds (6.1.1)
    • C12Y601/01001Tyrosine-tRNA ligase (6.1.1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y601/00Ligases forming carbon-oxygen bonds (6.1)
    • C12Y601/01Ligases forming aminoacyl-tRNA and related compounds (6.1.1)
    • C12Y601/01004Leucine--tRNA ligase (6.1.1.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y601/00Ligases forming carbon-oxygen bonds (6.1)
    • C12Y601/01Ligases forming aminoacyl-tRNA and related compounds (6.1.1)
    • C12Y601/01026Pyrrolysine-tRNAPyl ligase (6.1.1.26)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/106Plasmid DNA for vertebrates
    • C12N2800/107Plasmid DNA for vertebrates for mammalian
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/22Vectors comprising a coding region that has been codon optimised for expression in a respective host
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/36Vector systems having a special element relevant for transcription being a transcription termination element

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明涉及一种在动物细胞中表达含有非天然氨基酸重组蛋白的方法,在四组氨基酰‑tRNA合成酶和相应tRNA的基础上,构建识别终止密码子的氨基酰‑tRNA,筛选获得三种基因密码子拓展系统。所述三种基因密码子拓展系统对终止密码子通读效率高、相互兼容性强,从而可以在一条外源蛋白上插入三种非天然氨基酸、或对同一细胞的三条外源蛋白上分别插入不同的非天然氨基酸。为进一步提高通读率,还对释放因子eRF1进行了突变以减弱其与终止密码子的相互作用。

Description

一种含非天然氨基酸蛋白的制备方法
技术领域
本发明属于生物制药领域,具体涉及一种含非天然氨基酸蛋白的制备方法,尤其涉及一种在哺乳动物细胞中实现一个蛋白同时高效定点插入三种不同非天然氨基酸的方法。
背景技术
自然界中总共有64个三联体密码子,在一般的生物体中,其中61个密码子编码20种天然氨基酸,而另外三种密码子(UAA,UGA,UAG)不编码任何氨基酸,当核糖体翻译到这些密码子的时候,会有正常的终止因子来终止蛋白质翻译。随着更多的生物学现象被揭示,科学家们发现在古细菌中,终止密码子之一的琥珀终止密码子UAG被用来编码特殊的氨基酸到必须的蛋白质中,以保证细菌正常的生长。基于此,科学家们将古细菌中的tRNA和tRNA合成酶对单独拿出来,经过正负筛选的优化,使其在大肠杆菌中利用本来不编码氨基酸的UAG密码子,来编码自然界中不存在的氨基酸(即非天然氨基酸)到蛋白质的特定位置。
基于不同体系的非天然氨基酸已经被发现并应用于研究工作中,包括酪氨酸体系,吡咯赖氨酸体系,苯丙氨酸体系,大大丰富了非天然氨基酸结构的选择;而越来越多的物种,包括大肠杆菌,哺乳动物细胞,酵母,昆虫细胞等,都可以进行非天然氨基酸的插入,也为这套技术的广泛应用奠定了基础;在插入方法上,从最早的琥珀终止密码子,到其他终止密码子,四联体密码子,稀有密码子,甚至优化的特殊核糖体等,为插入方法提供了更多的选择。
基因密码子扩展技术从开发至今,已经在分子探针、药物靶标发现、药物改良修饰以及各种生化领域上得到了很广泛的应用。通过引入不同的非天然氨基酸,科学家们可以选择性的赋予蛋白质更新型的性质,以发现更多的生命科学中的奥秘。尽管如此,基因密码子扩展技术掺入氨基酸仍然存在效率低下、易错配等技术问题。在氨基酸掺入中,有可能会出现三种类型的错配:(1)tRNA/aaRS;(2)aaRS/aminoacid;and(3)tRNA/codon。体内将氨基酸类似物掺入蛋白质的一种方法就是借助于氨酰tRNA合成酶的疏漏,催化某种氨基酸类似物连接到tRNA从而进入蛋白质。在非天然氨基酸掺入中,能够避免所有三种错配的tRNA/aaRS需要设计相应的正交系统,仅仅在有其相应密码子的正确的位点插入新的氨基酸。也就是说,要扩展遗传密码,将新的氨基酸引入生物合成体系,需要有识别正交密码子的tRNA、对应的能将非天然氨基酸装上tRNA的高特异性aaRS,从而实现非天然氨基酸的掺入。正交系统需满足:唯一的新密码子,能识别新密码子的tRNA,能与其偶联的aaRS;并且,aaRs/tRNA组合必须与内源的aaRS/tRNA组合是正交的(即不可交叉使用),以保证非天然氨基酸掺入的精度。
包括抗体在内的蛋白质药物是国际上发展最快、利润最高、竞争也最激烈的研发领域,然而几乎所有蛋白质药物都存在以下共性的重大缺陷:①在体内易被蛋白酶降解致半衰期过短;②分子量大免疫源性强,机体注射诱导体内产生中和抗体致药效不断降低;③不能定点修饰,缺乏像小分子药物进行构效关系的系统研究手段等。这些瓶颈困扰着蛋白质药物,特别是质量控制和药效方面的整体发展。
在蛋白质药物的改良上,通过将含有苯丙酮的非天然氨基酸引入到蛋白质的特定位点,并基于苯丙酮和羟乙胺的化学偶联反应,美国的Ambrx公司已开发了一系列蛋白质药物新产品,包括双功能抗体,抗体药物偶联物等。除此外,借助琥珀终止密码子(UAG)和DNA定点突变技术,在干扰素或者其他蛋白药物的多个潜在的可修饰位置上引入了含叠氮基团的非天然氨基酸作为修饰“把手”,进而通过Click反应与含DIBO基团的不同分子量的PEG分子进行偶联。同时对引入非天然氨基酸的条件以及PEG的偶联条件进行了优化,成功建立了蛋白质药物温和、快速、高效、定量和特异的修饰方法。
绿色荧光蛋白GFP是最常用的报告基因,也是指示非天然氨基酸插入的有力工具,其由238个氨基酸组成。本申请以绿色荧光蛋白GFP为例说明本发明的技术背景,但是下述内容无论如何都不能理解为其是现有技术的承认,也无论无何都不能认为本发明的仅仅适用于GFP蛋白。
现在的蛋白药物的大量表达及修饰仍主要在细菌中进行,在哺乳动物细胞中非天然氨基酸插入效率低,特别是当表达多个非天然氨基酸修饰位点的多肽时,不同的密码子扩展系统之间还会相互干扰,不仅影响通读效率、而且也导致修饰位点氨基酸残基的不确定性。
目前现有技术中基因水平上非天然氨基酸蛋白质修饰仅能以单个位点、一种非天然氨基酸修饰,无法实现一个蛋白的多个位点特异性修饰、多个蛋白不同非天然氨基酸修饰,这些问题成为了基因密码子扩展技术在蛋白质药物开发中应用的瓶颈。因此,如何将外源的基因密码子系统应用于哺乳动物细胞,提高哺乳动物细胞中非天然氨基酸残基多肽的修饰效率,实现在一个蛋白多个位点同时特异性修饰、或多种带有不同非天然氨基酸残基蛋白的同时表达是本领域亟待解决的技术问题。
发明内容
针对上述现有技术中存在的缺陷,本发明的目的在于提供一种在哺乳动物细胞中实现一个蛋白同时高效定点插入三种不同非天然氨基酸的方法。本发明提供了一种在动物细胞中表达含有非天然氨基酸重组蛋白的方法,在四组氨基酰-tRNA合成酶和相应tRNA的基础上,构建识别终止密码子的氨基酰-tRNA,筛选获得三种基因密码子拓展系统。所述三种基因密码子拓展系统对终止密码子通读效率高、相互兼容性强,从而可以在一条外源蛋白上插入三种非天然氨基酸、或对同一细胞的三条外源蛋白上分别插入不同的非天然氨基酸。为进一步提高通读率,还对释放因子eRF1进行了突变以减弱其与终止密码子的相互作用。
本发明所采用的的技术方案如下:
基于四种不同基因密码子拓展系统酶和tRNA识别的结构特点,拓展构建12种不同系统的质粒载体。基于Mbpyl,Mmpyl,Ecleu,EcTyr四种基因密码子拓展系统的酶和tRNA的识别不影响非天然氨基酸编码的特点,将四种系统的tRNA反密码子环突变为CUA,UCA,UUA,通过点突变和分子克隆方法构建含有正交的氨酰tRNA合成酶和对应的串联tRNA的十二种不同基因密码子拓展系统的高效真核表达载体,并且构建在39位突变为UAA,UAG,UGA的GFP报告基因表达载体。通过GFP荧光流式分析方法,筛选出三种高通读率且正交性好的基因密码子拓展系统。分别在aaRS/tRNA、aaRS/UAA、tRNA/stop codon层次上,将12种不同系统进行实验组合和GFP蛋白荧光流式分析,精确筛选高通读效率且正交的基因密码子拓展系统Mmpyl-tRNApyl UCA,EcTyr-tRNATyr UUA,Ecleu-tRNAleu CUA。基于此,完成了在一个哺乳动物细胞中同时完成三种正交系统分别插入三种不同荧光蛋白RFP,BFP,GFP,实现三种蛋白的定点修饰,为一个蛋白上多点修饰奠定了基础。为同时提高一个蛋白上三种终止密码子的通读效率,通过GFP蛋白流式分析系统精确评价eRF1不同位点突变体单个或者多个组合对三种不同来源的正交的基因密码子拓展系统的通读效率影响,确定最佳同时提高三系统(三种终止密码子)通读率的eRF1突变体组合(E55R,E55D,N129P,Y125F)。转染eRF1突变体组合进入细胞后,对三位点定点修饰的GFP蛋白进行扩增表达,并进行蛋白纯化和LC-MS质谱等一系列验证,获得高纯度的多位点特异性修饰蛋白。
具体而言:
一方面,本发明提供一种基因密码子拓展组合物,包括:
(1)一种或多种氨基酰-tRNA合成酶,结合突变的tRNA;
(2)一种或多种突变的tRNA,所述突变的tRNA反密码子环上突变为终止密码子的互补序列;
其中,氨基酰-tRNA合成酶能将突变的tRNA结合到非天然氨基酸上产生氨基酰-tRNA。
进一步,本发明所述基因密码子拓展组合物,其特征在于:
所述氨基酰-tRNA合成酶选自Pyl-tRNA合成酶(PylRS)、Leu-tRNA合成酶(LeuRS)、Tyr-tRNA合成酶(TyrRS);
所述突变的tRNA选自tRNAPyl、tRNALeu、tRNATyr。
进一步,本发明所述基因密码子拓展组合物,其特征在于tRNAPyl和PylRS来自马氏甲烷八叠球菌(Methanosarcina mazei)或巴氏甲烷八叠球菌(Methanosarcinabarkeri);tRNALeu和LeuRS来自大肠杆菌;tRNATyr和TyrRS来自大肠杆菌。
进一步,本发明所述基因密码子拓展组合物,其包括选自以下氨基酰-tRNA合成酶与突变tRNA组合中的一种或多种
MmPylRs和tRNAMmPylUCA、
MmPylRs和tRNAMmPylCUA、
MmPylRs和tRNAMmPylUAA、
MbPylRs和tRNAMbPylUCA、
MbPylRs和tRNAMbPylCUA、
MbPylRs和tRNAMbPylUAA、
EcLeuRs和tRNAEcLeuUCA、
EcLeuRs和tRNAEcLeuCUA、
EcLeuRs和tRNAEcLeuUAA、
OMeYRs和tRNAEcTyrUCA、
OMeYRs和tRNAEcTyrCUA、
OMeYRs和tRNAEcTyrUAA。
进一步,本发明所述基因密码子拓展组合物,其包括
选自MmPylRs和tRNAMmPylUCA、MmPylRs和tRNAMmPylCUA、MmPylRs和tRNAMmPylUAA、MbPylRs和tRNAMbPylUCA、MbPylRs和tRNAMbPylCUA、MbPylRs和tRNAMbPylUAA中任一种的氨基酰-tRNA合成酶与突变tRNA组合;
选自EcLeuRs和tRNAEcLeuUCA、EcLeuRs和tRNAEcLeuCUA、EcLeuRs和tRNAEcLeuUAA中任一种的氨基酰-tRNA合成酶与突变tRNA组合;
以及选自OMeYRs和tRNAEcTyrUCA、OMeYRs和tRNAEcTyrCUA、OMeYRs和tRNAEcTyrUAA中任一种的氨基酰-tRNA合成酶与突变tRNA组合。
进一步,本发明所述基因密码子拓展组合物,其包括MmPylRs和tRNAMmPylUCA、OMeYRs和tRNAEcTyrUAA、以及EcLeuRs和tRNAEcLeuCUA三组氨基酰-tRNA合成酶与突变tRNA的组合。
进一步,本发明前述任一项基因密码子拓展组合物,其特征在于还包括非天然氨基酸,所述非天然氨基酸优选NAEK、Anap、pAcF。
第二方面,本发明提供一种在动物细胞中表达含有非天然氨基酸重组蛋白的方法,包括:
(1)制备重组蛋白表达盒,其中重组蛋白编码序列中非天然氨基酸的密码子设置为终止密码子;
(2)改造动物细胞,使其表达权利要求1-7中任一项基因密码子拓展组合物中的氨基酰-tRNA合成酶和突变的tRNA;
(3)将步骤(1)中重组蛋白表达盒导入步骤(2)改造的动物细胞,制备重组动物细胞;
(4)将步骤(3)构建的重组动物细胞在补充添加非天然氨基酸的培养基中培养,诱导含有非天然氨基酸重组蛋白的表达。
进一步,本发明所述在动物细胞中表达含有非天然氨基酸重组蛋白的方法,其特征在于所述重组蛋白氨基酸序列中含有一种、两种或三种非天然氨基酸。
进一步,本发明所述在动物细胞中表达含有非天然氨基酸重组蛋白的方法,其特征在于在动物细胞中表达一种、两种或三种含有非天然氨基酸的重组蛋白;各重组蛋白中含有的非天然氨基酸种类相同或不同。
进一步,本发明前述任一项在动物细胞中表达含有非天然氨基酸重组蛋白的方法,其特征在于(2)改造动物细胞的步骤还包括突变eRF1以削弱eRF1与mRNA、和/或核糖体的结合。
第三方面,本发明提供一种突变的eRF1,其特征在于与野生型eRF1相比,所述突变的eRF1对mRNA、和/或核糖体具有较低的结合能力,并且所述突变的eRF1包括E55、Y125、N129位点的突变。
进一步,本发明所述突变的eRF1,其特征在于所述突变的eRF1包括选自E55R、E55D、Y12F、N129P中的一个、两个、三个或四个位点的突变。
进一步,本发明前述任一项突变的eRF1在提高终止密码子通读效率中的应用。
进一步本发明所述突变的eRF1在提高终止密码子通读效率中的应用,其特征在于所述终止密码子为提前终止密码子(PTC,Premature termination codon)。
进一步,本发明所述突变的eRF1在提高终止密码子通读效率中的应用,其特征在于使所述突变的eRF1和含有PTC的mRNA在同一细胞内表达。
进一步,本发明所述突变的eRF1在提高终止密码子通读效率中的应用,其特征在于所述含有PTC的mRNA编码含有非天然氨基酸的蛋白,所述细胞为重组哺乳动物细胞。
进一步,本发明所述突变的eRF1在提高终止密码子通读效率中的应用,其特征在于所述细胞中还表达有本发明前述任一项基因密码子拓展组合物中的氨基酰-tRNA合成酶和突变的tRNA。
第四方面,本发明提供前述任一项基因密码子拓展组合物、和/或前述任一项所述突变的eRF1在重组表达含非天然氨基酸重组蛋白中的应用。
进一步,本发明所述的应用,其特征在于所述重组表达以哺乳动物细胞为宿主,
所述含非天然氨基酸重组蛋白包括:
含有一个、两个或三个非天然氨基酸的一种重组蛋白,或者
分别含有至少一个非天然氨基酸的两种或三种重组蛋白。
本发明首先实现了Mbpyl,Mmpyl,Ecleu,EcTyr四种不同系统的拓展和非天然氨基酸在三种不同终止密码子上的重编码,精确验证不同系统之间的正交性,并筛选出通读率高正交性好的三种系统组合Mmpyl-tRNApyl UCA,EcTyr-tRNATyr UUA,Ecleu-tRNAleu CUA。在此基础上,首次系统精确评价了eRF1不同位点突变体单个或者多个组合对三种不同来源的基因密码子拓展系统的通读效率影响,筛选出最佳的四种eRF1突变体组合(E55R,E55D,Y125F,N129P),条件性减弱释放因子eRF1与三种不同终止密码子之间的相互作用力,从而整体性地提高了三种不同正交系统的通读效率,从0.2%提高到12%,实现了三种不同非天然氨基酸在哺乳动物细胞中同时高效定点插入。并优化了表达纯化和蛋白鉴定方法,得到高产量高纯度的蛋白。该方法可适用于哺乳动物细胞中其他的蛋白多位点特异性修饰。
附图说明
通过参考附图阅读下文的详细描述,本公开示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本公开的若干实施方式,并且相同或对应的标号表示相同或对应的部分,其中:
图1四种基因密码子拓展系统氨酰tRNA合成酶和tRNA相互作用
四种系统是通过它们的突变反密码子来识别提前终止密码子。为了研究反密码子突变是否会影响这些tRNA和相应合成酶之间的整体相互作用,我们研究了合成酶和tRNA的三维结构对接。我们使用了除pylMmRS(PDB:2ZIM)之外的hafniense脱硫杆菌的可用复合物,这两种合成酶在结构上是保守的(图1A)。
根据合成酶和相应的tRNA的结合结构,tRNAPyl和tRNALeu的反密码子环不受其合成酶的结合(图1B,C)。表明tRNAPyl和tRNALeu上的反密码子环碱基突变不会影响其和相应的合成酶之间的整体相互作用。
tRNATyr的反密码子环与TyrRS中的D286和C231形成氢键(图1D),但突变的反密码子UUA、CUA和UCA与TyrRS中的上述关键残基仍能保持弱的相互作用(图1E-G),成功氨基酰化。
图1的结构分析表明,上述四种系统使用三种突变tRNA均可以完成氨基酰化过程,可编码非天然氨基酸,进而实现密码子系统的拓展。
图2四种单密码子拓展系统质粒构建及含PTC位点GFP的通读
构建大肠杆菌酪氨酰-tRNA合成酶(OMeYRS)和tRNAEcTyr共表达质粒。所述共表达质粒包括CMV启动子控制的OMeYRS表达盒、U6启动子控制的tRNAEcTyr表达盒、H1启动子控制的tRNAEcTyr表达盒、以及新霉素、卡那霉素、氨苄青霉素抗性筛选标记;其中tRNAEcTyr的反密码子区突变为CUA、UCA或UUA(图2A)。
利用转入OMeYRS-tRNAEcTyr共表达质粒的宿主细胞过表达插入三种终止密码子的重组GFP时,如培养基中不加入pAcF,不产生荧光;加入pAcF产生荧光。上述结果表明,不加入非天然氨基酸的情况下,重组GFP基因在插入的终止密码子处结束翻译;加入非天然氨基酸pAcF,OMeYRS-tRNAEcTyr系统能够在重组GFP基因插入的终止密码子处加上pAcF实现通读,产生荧光。tRNAEcTyr上使用不同的反密码子通读效率不同,CUA>UAA>UCA(图2B)。
其他三种系统拓展的质粒构建原理和GFP通读验证与OMeYRS-tRNAEcTyr系统一致。不加入相应非天然氨基酸时,均不产生荧光,加入相应非天然氨基酸条件下,均可实现成功通读。图2结果表明成功构建了12种不同的基因密码子拓展系统。
图3不同密码子拓展系统之间的正交性分析
为了排除不同系统的潜在相互作用,我们验证了四种可用aaRS/tRNA系统的相互正交性(图3C)。
首先,我们在UAA(非天然氨基酸,unnatural amino acid)和aaRS/tRNA对水平上进行了正交性分析,结果如图3A。结果表明,Anap和pAcF表现出很大的正交性,NAEK与MbpylRS-tRNAMbpyl表现出轻微的交叉反应性。但在加入eBK后,MmpylRS-tRNAMmpyl和AnapRS-tRNAEcLeu均可读取终止密码子,表明eBK不适合用于三个提前终止密码子同时编码非天然氨
基酸实验中。
进一步,我们在合成酶和tRNAs水平上进行正交性分析,结果如图3B。将合成酶分别共转染到具有不同tRNACUA的HEK293T细胞中,以及含有TAG突变的GFP,结果表明,只有合成酶与相对应系统的tRNACUA组别,GFP可以产生荧光。
随后,我们用三种不同的无义抑制tRNA评估了非同源终止密码子的错配潜力。将tRNAMmylUCA/CUA/UUA、tRNAMbyl UCA/CUA/UUA、tRNAEcleu UCA/CUA/UUA和tRNAEcTyr UCA/CUA/UUA与三种不同的GFP(39TGA/TAG/TAA)无义突变体以及相关合成酶共转染HEK293T细胞,结果如图3D。在没有任何错配的情况下,只有当tRNA质粒与含有同源无义密码子的报告者结合时,GFP才会发出荧光。这些结果进一步证实,MmPyl、EcTyr和EcLeu三系统的组合适用于哺乳动物细胞三种提前终止密码子的高保真共通读。
图4一个细胞中三种掺入不同PTC终止密码子荧光蛋白的通读
我们验证了三个系统同时将三种UAA同时插入到三种不同蛋白质中的可行性。我们构建了RFP36TGA、BFP39TAG和GFP39TAA突变体,并将它们一起转染到HEK293T细胞中,质粒含Mmpyl-tRNApyl UCA,EcTyr-tRNATyr UUA,Ecleu-tRNAleu CUA。根据Western bloting结果,我们发现这些蛋白只有在加入相应的UAA后才会表达;当加入两种UAA时,只有两种相关蛋白表达;当添加三种UAA时,所有三种荧光蛋白将同时表达。结果表明,三种系统可以独立工作,同时将UAAs成功插入单个哺乳动物细胞中的三种不同蛋白质中,具体结果见图4。
图5eRF1四种突变体与终止密码子相互作用的结构分析
我们试图在更深层次上研究eRF1突变对提高系统通读的作用。Glu55是通过直接与UAA第二位置的腺嘌呤相互作用参与终止密码子的识别。它还与28S rRNA上的A3732和eRF1本身上的Y125形成氢键。当Glu55突变为精氨酸时,带正电的胍基会向相反的一侧移动,放弃与A5(终止密码子)和A3732(28S rRNA)的相互作用。即使突变为天冬氨酸,Asp55和A5之间的相互作用也会弱得多。虽然Y125F和N129P突变对Glu55与A5和A3732的相互作用影响不大,但它们可能通过改变YxCxxxF基序的方向和进一步削弱eRF1与mRNA之间的结合间接起作用。总体而言,E55R,E55D,Y125F,N129P四个氨基酸位点突变可明显减弱eRF1与终止密码子的识别结合,从而提高哺乳动物细胞中提前终止密码子的通读率,具体结果见图5。
图6蛋白表达纯化及质谱鉴定结果
用His-tag-Ni-NTA树脂纯化富集的GFP+蛋白,并在溶液交换后在PBS缓冲液中稀释。考马斯亮蓝染色和western blot分析表明,含有3个UAA的突变GFP的分子量与野生型GFP的分子量相似,也表明没有其他UAA和内源性AA错误结合(图6A,B)。剪切电泳条带,并进行全蛋白质谱分析(图6C)和肽质谱分析(图6D-F),结果表明在预期位点成功地将三重UAAs掺入,而没有错误掺入。这些结果表明,在四个eRF1突变体的促进下,三种不同的UAA在哺乳动物细胞的特定位点成功地整合到单个蛋白质中。成功地将多达三种UAA整合到一种蛋白质中,将为研究蛋白质结构和功能提供一个强有力的工具。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述。
利用来自马氏古甲烷球菌(Methanosarcina mazei)的tRNA(tRNAMmpyl)和吡咯赖氨酰-tRNA合成酶(MmPylRS),来自大肠杆菌的亮氨酸合成酶(AnapRS)和tRNA(tRNAAnap),来自大肠杆菌酪氨酸合成酶(OMeYRS)和tRNA(tRNATyr),来自巴氏古甲烷球菌(Methanosarcinabarkeri)的tRNA(tRNAMbpyl)和吡咯赖氨酰-tRNA合成酶(MbPylRS),以绿色荧光蛋白GFP为模式,说明本发明的技术方案。
实施例1四种非天然氨基酸系统拓展成12种不同的系统
我们使用了除pylMmRS(PDB:2ZIM)之外的hafniense脱硫杆菌的可用复合物,这两种合成酶在结构上是保守的。根据合成酶和相应的tRNA的结合结构,tRNAPyl和tRNALeu的反密码子环不受其合成酶的结合。tRNATyr的反密码子环确实与TyrRS中的D286和C231形成氢键,但突变的反密码子UUA、CUA和UCA与TyrRS中的上述关键残基保持弱相互作用,从而确保氨基酰化成功(参见图1)。
为了构建编码四种氨酰tRNA合成酶(OMeYRS、EcleuRS、MbPylRS和MmpylRS)的质粒,通过双酶切反应将在CMV启动子下表达的相应基因分别插入到pcDNA3.1(+)载体中。tRNAMbPyl和tRNAEcTyr由H1和U6启动子表达,tRNAEcleu由H1启动子表达,tRNAMmPyl由7sk启动子表达。为了创建tRNA质粒,我们通过相应的酶切方法将4个或者8个tRNA基因拷贝分别整合到pcDNA3.1(+)载体中。四个无义系统的tRNA的反密码子通过点突变步骤突变为UCA、CUA或UUA(参见图2A)。四种不同基因密码子拓展系统载体建立所需的引物序列如表1所示,四个无义系统的tRNA的反密码子突变所用引物如表2所示。
表1.四种不同基因密码子拓展系统载体建立所需的引物序列
Figure BDA0003252817760000071
表2.四种不同基因密码子拓展系统拓展tRNA突变所用的引物序列
Figure BDA0003252817760000072
Figure BDA0003252817760000081
质粒构建成功后,使用转染试剂MegaTran 1.0(Origene)进行转染。HEK293T细胞接种在6孔板(康宁)中,直至60~70%融合,然后转染3μg系统质粒和突变后的GFP质粒。转染6小时后,将培养基更换为新鲜DMEM或含有1mM UAAs(NAEK、eBK和pAcF)或10μM pAnap的DMEM,培养48小时,在荧光显微镜和共焦显微镜(尼康)下观察细胞荧光强度,结果参见图2B。
实施例2四种非天然氨基酸系统正交性验证及筛选哺乳动物细胞中效率最高的三系统最佳组合
为了排除不同系统的相互作用,我们验证了四种可用aaRS/tRNA系统的相互正交性(图3C)。
首先,我们在UAA和aaRS/tRNA对水平上进行了正交性验证。在转染系统和相应的GFP质粒48小时后,培养基中分别加入不同的非天然氨基酸,观察GFP的荧光,并做流式分析比较荧光强度,结果如图3A所示。
然后,我们在合成酶和tRNAs水平上确定了正交性。将合成酶分别共转染到具有不同tRNACUA的HEK293T细胞中,以及含有TAG突变的GFP,观察GFP的荧光,并做流式分析比较荧光强度,结果如图3B所示。
另外,我们用三种不同tRNA评估非同源终止密码子的错配潜力。将tRNAMmylUCA /CUA/UUA、tRNAMbyl UCA/CUA/UUA、tRNAEcleu UCA/CUA/UUA和tRNAEcTyr UCA/CUA/UUA与三种不同的GFP无义突变体以及相关合成酶共转染HEK293T细胞,观察GFP的荧光,并做流式分析比较荧光强度。在用突变GFP报告基因转染48小时后,使用胰蛋白酶/EDTA将HEK293T细胞分离成单个细胞,并在BD FACSAriaTM(BD Biosciences)上使用适当的过滤器设置(488nm相干蓝宝石激光激发GFP)进行分析。正面和侧面散射用于识别完整细胞,并从测量信号中减去未转染细胞的平均背景荧光。数据通过FlowJo软件(FlowJo)进行分析。结果如图3D所示
表3.三种不同的GFP无义突变体构建所用的引物
Primer Sequence
GFP<sup>39TAG</sup>-F GATGCAACATAGGGAAAACTT
GFP<sup>39TAG</sup>-R AAGTTTTCCCTATGTTGCATC
GFP<sup>39TGA</sup>-F GATGCAACATGAGGAAAACTT
GFP<sup>39TGA</sup>-R AAGTTTTCCTCATGTTGCATC
GFP<sup>39TAA</sup>-F GATGCAACATAAGGAAAACTT
GFP<sup>39TAA</sup>-R AAGTTTTCCTTATGTTGCATC
为了研究实现一个蛋白三种不同终止密码子的同时高效通读,我们比较了四个系统的十二种组合。将每个aaRS-tRNA对与相应的GFP突变体HEK293T细胞共转染,三组携带不同aaRS-tRNA对的细胞组成一个组合,并在通过His-tag-Ni-NTA树脂纯化后,使用BCA蛋白质定量试剂盒测定每个组合的GFP产量。我们比较了三个系统的不同组合的通读效率。将每个aaRS-tRNA对与相应的GFP突变体HEK293T细胞共转染,三组携带不同aaRS-tRNA对的细胞组成一个组合,转染48小时后,收集细胞进行流式分析,获得精确的GFP通读效率。GFP蛋白通过His-tag-Ni-NTA树脂纯化后,使用BCA蛋白质定量试剂盒测定每个组合的GFP实际产量,从而筛选最佳的三系统组合,结果如表4所示。通过比较GFP产量和以突变GFP产量与野生型GFP产量之比计算的通读率,我们确认,对于哺乳动物细胞中的UAA掺入,Mmpyl-tRNApyl UCA,EcTyr-tRNATyr UUA,Ecleu-tRNAleu CUA的组合显示出最高的读取效率和突变GFP产量。
表4.密码子扩展系统不同组合的GFP通读率和GFP产量
Figure BDA0003252817760000091
Figure BDA0003252817760000101
实施例3RFP,BFP,GFP的质粒构建及哺乳动物细胞中三荧光蛋白实现可控表达
我们首先基于点突变和分子克隆方法构建了RFP36TGA、BFP39TAG和GFP39TAA突变体,构建上述3种突变荧光蛋白的引物如表5所示。
表5.三种荧光蛋白突变体构建所用的引物序列
Primer Sequence
GFP<sup>39TAA</sup>-F GATGCAACATAAGGAAAACTT
GFP<sup>39TAA</sup>-R AAGTTTTCCTTATGTTGCATC
RFP<sup>36TGA</sup>-F GAGGGCGAGGGCTGACCCTACGAGGGC
RFP<sup>36TGA</sup>-R GCCCTCGTAGGGTCAGCCCTCGCCCTC
BFP<sup>39TAG</sup>-F GAGGGCACCTAGACCATGAGA
BFP<sup>39TAG</sup>-R TCTCATGGTCTAGGTGCCCTC
系统质粒含Mmpyl-tRNApyl UCA,EcTyr-tRNATyr UUA,Ecleu-tRNAleu CUA,将它们一起转染到HEK293T细胞中,设计8组实验,培养基中分别加入0种,1种,2种,3种不同的非天然氨基酸,48h后,收集细胞,提蛋白进行Western bloting,检测不同实验条件下,三种荧光蛋白的表达情况。具体结果见图4。
实施例4eRF1不同突变体及不同组合对三种终止密码子的通读影响分析
以NCBI登录号NT_037436.4所示eRF1序列为基础,首先根据eRF1与终止密码子识别的结构分析(图5),确定突变E55R,E55D,Y125F,N129P四个位点,通过点突变完成(eRF1不同突变体构建所用的引物序列如表6所示)。之后,将一个,两个,三个突变体与系统的质粒,含有一个无义突变位点的GFP(39TAG、101TGA、172TAA)质粒分别同时转染入293T细胞中,加入相应的非天然氨基酸。48h后,观察GFP荧光并进行流式分析,比较不同突变体条件下GFP通读率的差异,结果见表8。
表6.eRF1不同突变体构建所用的引物序列
Primer Sequence
eRF1-E55R-F GTGGCAAAAATGTTAGCGGATCGCTTTGGAACTGCATCTAAC
eRF1-E55R-R GTTAGATGCAGTTCCAAAGCGATCCGCTAACATTTTTGCCAC
eRF1-E55D-F GTGGCAAAAATGTTAGCGGATGATTTTGGAACTGCATCTAACAT
eRF1-E55D-R ATGTTAGATGCAGTTCCAAAATCATCCGCTAACATTTTTGCCAC
eRF1-N129P-F CGTCATTGTATTTGTGTGACCCCAAATTCCATACAGAGGCTC
eRF1-N129P-R GAGCCTCTGTATGGAATTTGGGGTCACACAAATACAATGACG
eRF1-Y125F-F CCAATTAATACGTCATTGTTCTTGTGTGACAACAAATTCCATACAGAGG
eRF1-Y125F-R CCTCTGTATGGAATTTGTTGTCACACAAGAACAATGACGTATTAATTGG
表7.突变荧光蛋白GFP(39TAG、101TGA、172TAA)构建所用引物
Primer Sequence
GFP<sup>39TAG</sup>-F GATGCAACATAGGGAAAACTT
GFP<sup>39TAG</sup>-R AAGTTTTCCCTATGTTGCATC
GFP<sup>101TGA</sup>-F ATATTTTTCTGAGATATTCGACGGG
GFP<sup>101TGA</sup>-R CCCGTCGAATATCTCAGAAAAATAT
GFP<sup>172TAA</sup>-F CACAACATTTAAGATGGAAGC
GFP<sup>172TAA</sup>-R GCTTCCATCTTAAATGTTGTG
表8.eRF1四种突变体组合对三种GFP(分别含不同PTC终止密码子)通读的影响
Figure BDA0003252817760000111
表8的结果表明,eRF1四种突变体不同组合对三种不同系统的影响略有差异,其中,E55R和E55D对三种系统的影响明显高于其他的突变体。有E55R突变体的双组合,三组合的通读效率也明显高于没有该突变体的组合。表明四种突变体对三种不同系统的通读均有明显的促进作用。
实施例5筛选同时提高一个蛋白三种提前终止密码子通读效率的最佳的eRF1不同突变体组合
首先通过点突变方法突变GFP为GFP39TAG-101TGA-172TAA,将一个,两个,三个eRF1突变体与三个系统的质粒,含有三个无义突变位点的GFP质粒分别同时转染入293T细胞中,并加入三种非天然氨基酸。48h后,观察GFP荧光并进行流式分析,比较不同突变体条件下GFP通读率的差异。具体结果见表9。
表9.eRF1四种突变体组合对一种GFP(含三个不同PTC终止密码子)通读的影响
Figure BDA0003252817760000121
表9的结果表明,与其他组合相比,四个突变体的引入明显提高了含三个不同PTC终止密码子GFP的通读效率,效率可以达到11.6%。
实施例6哺乳动物细胞中一个蛋白成功实现三种非天然氨基酸的特异性修饰
收集用三种系统和所有四种eRF1突变体转染的HEK293T细胞,并在冰上再悬浮在RIPA裂解液中30分钟。随后在22000×g下澄清产生的细胞裂解液10分钟。去除上清液,并按照制造商的协议在His-tag-Ni-NTA树脂(Abbkine)上纯化His-tag-GFP。然后,通过超滤获得纯化的GFP蛋白,然后在PBS缓冲液中稀释。使用BCA蛋白质定量试剂盒(Thermo-Scientific)测定蛋白质浓度。此外,将三种UAA系统的质粒和三种无义突变的GFP共转染HEK293T(eRF1-E55R、eRF1-E55D、eRF1-Y125F和eRF1-N129P)细胞。两天后,从8.7×108细胞中提取总蛋白,然后通过SDS-PAGE和Commassie亮蓝染色纯化GFP蛋白。切下GFP和附近的条带并发送至MS分析(Thermo-LUMOS)。GFP上的残基39和101位用胰蛋白酶消化,残基172位用Asp-N蛋白酶(V162,promega)消化。用SYNAPT-G2-Si高分辨离子迁移率质谱仪(Waters)分析纯化GFP的分子质量。具体结果见图6。
本发明主要核酸元件的序列如下:
序列1MmPylRS
序列2MbPylRS
序列3EcLeuRS
序列4EcOMeYRS
序列5tRNA1MbPyl
序列6tRNA2MbPyl
序列7tRNAMmPyl
序列8tRNAEcLeu
序列9tRNA1EcTyr
序列10tRNA2EcTyr
序列11GFP
序列12RFP(DsRed2)
序列13BFP(TagBFP)
以上介绍了本发明的较佳实施方式,旨在使得本发明的精神更加清楚和便于理解,并不是为了限制本发明,凡在本发明的精神和原则之内,所做的修改、替换、改进,均应包含在本发明所附的权利要求概括的保护范围之内。
序列表
<110> 北京大学
<120> 一种含非天然氨基酸蛋白的制备方法
<130> YY20117
<160> 13
<170> SIPOSequenceListing 1.0
<210> 1
<211> 1365
<212> DNA
<213> 马氏甲烷八叠球菌(Methanosarcina mazeii)
<400> 1
atggataaaa aaccactaaa cactctgata tctgcaaccg ggctctggat gtccaggacc 60
ggaacaattc ataaaataaa acaccacgaa gtctctcgaa gcaaaatcta tattgaaatg 120
gcatgcggag accaccttgt tgtaaacaac tccaggagca gcaggactgc aagagcgctc 180
aggcaccaca aatacaggaa gacctgcaaa cgctgcaggg tttcggatga ggatctcaat 240
aagttcctca caaaggcaaa cgaagaccag acaagcgtaa aagtcaaggt cgtttctgcc 300
cctaccagaa cgaaaaaggc aatgccaaaa tccgttgcga gagccccgaa acctcttgag 360
aatacagaag cggcacaggc tcaaccttct ggatctaaat tttcacctgc gataccggtt 420
tccacccaag agtcagtttc tgtcccggca tctgtttcaa catcaatatc aagcatttct 480
acaggagcaa ctgcatccgc actggtaaaa gggaatacga accccattac atccatgtct 540
gcccctgttc aggcaagtgc ccccgcactt acgaagagcc agactgacag gcttgaagtc 600
ctgttaaacc caaaagatga gatttccctg aattccggca agcctttcag ggagcttgag 660
tccgaattgc tctctcgcag aaaaaaagac ctgcagcaga tctacgcgga agaaagggag 720
aattatctgg ggaaactcga gcgtgaaatt accaggttct ttgtggacag gggttttctg 780
gaaataaaat ccccgatcct gatccctctt gagtatatcg aaaggatggg cattgataat 840
gataccgaac tttcaaaaca gatcttcagg gttgacaaga acttctgcct gagacccatg 900
cttgctccaa acctttacaa ctacctgcgc aagcttgaca gggccctgcc tgatccaata 960
aaaatttttg aaataggccc atgctacaga aaagagtccg acggcaaaga acacctcgaa 1020
gagtttacca tgctgaactt ctgccagatg ggatcgggat gcacacggga aaatcttgaa 1080
agcataatta cggacttcct gaaccacctg ggaattgatt tcaagatcgt aggcgattcc 1140
tgcatggtct atggggatac ccttgatgta atgcacggag acctggaact ttcctctgca 1200
gtagtcggac ccataccgct tgaccgggaa tggggtattg ataaaccctg gataggggca 1260
ggtttcgggc tcgaacgcct tctaaaggtt aaacacgact ttaaaaatat caagagagct 1320
gcaaggtccg agtcttacta taacgggatt tctaccaacc tgtaa 1365
<210> 2
<211> 1260
<212> DNA
<213> 巴氏甲烷八叠球菌(Methanosarcina barkeri)
<400> 2
atggataaaa aaccattaga tgttttaata tctgcgaccg ggctctggat gtccaggact 60
ggcacgctcc acaaaatcaa gcaccatgag gtctcaagaa gtaaaatata cattgaaatg 120
gcgtgtggag accatcttgt tgtgaataat tccaggagtt gtagaacagc cagagcattc 180
agacatcata agtacagaaa aacctgcaaa cgatgtaggg tttcggacga ggatatcaat 240
aattttctca caagatcaac cgaaagcaaa aacagtgtga aagttagggt agtttctgct 300
ccaaaggtca aaaaagctat gccgaaatca gtttcaaggg ctccgaagcc tctggaaaat 360
tctgtttctg caaaggcatc aacgaacaca tccagatctg taccttcgcc tgcaaaatca 420
actccaaatt cgtctgttcc cgcatcggct cctgctcctt cacttacaag aagccagctt 480
gatagggttg aggctctctt aagtccagag gataaaattt ctctaaatat ggcaaagcct 540
ttcagggaac ttgagcctga acttgtgaca agaagaaaaa acgattttca gcggctctat 600
accaatgata gagaagacta cctcggtaaa ctcgaacgtg atattacgaa atttttcgta 660
gaccggggtt ttctggagat aaagtctcct atccttattc cggcggaata cgtggagaga 720
atgggtatta ataatgatac tgaactttca aaacagatct tccgggtgga taaaaatctc 780
tgcttgaggc caatgcttgc cccgactctt tacaactatc tgcgaaaact cgataggatt 840
ttaccaggcc caataaaaat tttcgaagtc ggaccttgtt accggaaaga gtctgacggc 900
aaagagcacc tggaagaatt tactatggtg aacttctgtc agatgggttc gggatgtact 960
cgggaaaatc ttgaagctct catcaaagag tttctggact atctggaaat cgacttcgaa 1020
atcgtaggag attcctgtat ggtctttggg gatactcttg atataatgca cggggacctg 1080
gagctttctt cggcagtcgt cgggccagtt tctcttgata gagaatgggg tattgacaaa 1140
ccatggatag gtgcaggttt tggtcttgaa cgcttgctca aggttatgca cggctttaaa 1200
aacattaaga gggcatcaag gtccgaatct tactataatg ggatttcaac caatctgtaa 1260
<210> 3
<211> 2592
<212> DNA
<213> 大肠埃希氏菌(Escherichia coli)
<400> 3
atggaagagc aataccgccc ggaagagata gaatccaaag tacagcttca ttgggatgag 60
aagcgcacat ttgaagtaac cgaagacgag agcaaagaga agtattactg cttttctggc 120
cctccctatc cttctggtcg actacacatg ggccacgtac gtaactacac catcggtgac 180
gtgatcgccc gctaccagcg tatgctgggc aaaaacgtcc tgcagccgat cggctgggac 240
gcgtttggtc tgcctgcgga aggcgcggcg gtgaaaaaca acaccgctcc ggcaccgtgg 300
acgtacgaca acatcgcgta tatgaaaaac cagctcaaaa tgctgggctt tggttatgac 360
tggagccgcg agctggcaac ctgtacgccg gaatactacc gttgggaaca gaaattcttc 420
accgagctgt ataaaaaagg cctggtatat aagaagactt ctgcggtcaa ctggtgtccg 480
aacgaccaga ccgtactggc gaacgaacaa gttatcgacg gctgctgctg gcgctgcgat 540
accaaagttg aacgtaaaga gatcccgcag tggtttatca aaatcactgc ttacgctgac 600
gagctgctca acgatctgga taaactggat cactggcctg acaccgttaa aaccatgcag 660
cgtaactgga tcggtcgttc cgaaggcgtg gagatcacct tcaacgttaa cgactatgac 720
aacacgctga ccgtttacac tacccgcccg gacaccttta tgggttgtac ctacctggcg 780
gtagctgcgg gtcatccgct ggcgcagaaa gcggcggaaa ataatcctga actggcggcc 840
tttattgacg aatgccgtaa caccaaagtt gccgaagctg aaatggcgac gatggagaaa 900
aaaggcgtcg atactggctt taaagcggtt cacccattaa cgggcgaaga aattcccgtt 960
tgggcagcaa acttcgtatt gatggagtac ggcacgggcg cagttatggc ggtaccgggg 1020
cacgaccagc gcgactacga gtttgcctct aaatacggcc tgaacatcaa accggttatc 1080
ctggcagctg acggctctga gccagatctt tctcagcaag ccctgactga aaaaggcgtg 1140
ctgttcaact ctggcgagtt caacggtctt gaccatgaag cggccttcaa cgccatcgcc 1200
gataaactga ctgcgatggg cgttggcgag cgtaaagtga actaccgcct gcgcgactgg 1260
ggtgtttccc gtcagcgtta ctggggcgcg ccgattccga tggtgactct agaagacggt 1320
accgtaatgc cgaccccgga cgaccagctg ccggtgatcc tgccggagga tgtggtaatg 1380
gacggcatta ccagcccgat taaagcagat ccggagtggg cgaaaactac cgttaacggt 1440
atgccagcac tgcgtgaaac cgacactttc gacaccttta tggagtcctc ctgggttctt 1500
gcgcgctaca cttgcccgca gtacaaagaa ggtatgctgg attccgaagc ggctaactac 1560
tggctgccgg tggatatcgc gattggtggt attgaacacg ccattatgga gagtctctac 1620
tgtcgcttct tccacaaact gatgcgtgat gcaggcatgg tgaactctga cgaaccagtt 1680
aaacagttgc tgtgtcaggg tatggtgctg gcagatgcct tctactatgt tggcgaaaac 1740
ggcgaacgta actgggtttc cccggttgat gctatcgttg aacgtgacga gaaaggccgt 1800
atcgtgaaag cgaaagatgc ggcaggccat gaactggttt ataccggcat gagcaaaatg 1860
tccaagtcga agaacaacgg tatcgacccg caggtgatgg ttgaacgtta cggcgcggac 1920
accgttcgtc tgtttatgat gtttgcttct ccggctgata tgactctcga atggcaggaa 1980
tccggtgtgg aaggggctaa ccgcttcctg aaacgtgtct ggaaactggt ttacgagcac 2040
acagcaaaaa gtgatgttgc ggcactgaac gttgatgcgc tgactgaaaa tcagaaagcg 2100
ctgcgtcgcg atgtgcataa aacgatcgct aaagtgaccg atgatatcgg ccgtcgtcag 2160
accttcaaca ccgcaattgc ggcgattatg gagctgatga acaaactggc gaaagcacca 2220
accgatggcg agcaggatcg cgctctgatg caggaagcac tgctggccgt tgtccgtatg 2280
cttaacccgt tcaccccgca catctgcttc acgctgtggc aggaactgaa aggcgaaggc 2340
gatatcgaca acgcgccgtg gccggttgct gacgaaaaag cgatggtgga agactccacg 2400
ctggtcgtgg tgcaggttaa cggtaaagtc cgtgccaaaa tcaccgttcc ggtggacgca 2460
acggaagaac aggttcgcga acgtgctggc caggaacatc tggtagcaaa atatcttgat 2520
ggcgttactg tacgtaaagt gatttacgta ccaggtaaac tcctcaatct ggtcgttggc 2580
gggcccgttt aa 2592
<210> 4
<211> 1284
<212> DNA
<213> 大肠埃希氏菌(Escherichia coli)
<400> 4
atggcaagca gtaacttgat taaacaattg caagagcggg ggctggtagc ccaggtgacg 60
gacgaggaag cgttagcaga gcgactggcg caaggcccga tcgcactcgt gtgtggcttc 120
gatcctaccg ctgacagctt gcatttgggg catcttgttc cattgttatg cctgaaacgc 180
ttccagcagg cgggccacaa gccggttgcg ctggtaggcg gcgcgacggg tctgattggc 240
gacccgagct tcaaagctgc cgagcgtaag ctgaacaccg aagaaactgt tcaggagtgg 300
gtggacaaaa tccgtaagca ggttgccccg ttcctcgatt tcgactgtgg agaaaactct 360
gctatcgcgg ccaataatta tgactggttc ggcaatatga atgtgctgac cttcctgcgc 420
gatattggca aacacttctc cgttaaccag atgatcaaca aagaagcggt taagcagcgt 480
ctcaaccgtg aagatcaggg gatttcgttc actgagtttt cctacaacct gctgcagggt 540
tatagtatgg cctgtttgaa caaacagtac ggtgtggtgc tgcaaattgg tggttctgac 600
cagtggggta acatcacttc tggtatcgac ctgacccgtc gtctgcatca gaatcaggtg 660
tttggcctga ccgttccgct gatcactaaa gcagatggca ccaaatttgg taaaactgaa 720
ggcggcgcag tctggttgga tccgaagaaa accagcccgt acaaattcta ccagttctgg 780
atcaacactg cgcgtgccga cgtttaccgc ttcctgaagt tcttcacctt tatgagcatt 840
gaagagatca acgccctgga agaagaagat aaaaacagcg gtaaagcacc gcgcgcccag 900
tatgtactgg cggagcaggt gactcgtctg gttcacggtg aagaaggttt acaggcggca 960
aaacgtatta ccgaatgcct gttcagcggt tctttgagtg cgctgagtga agcggacttc 1020
gaacagctgg cgcaggacgg cgtaccgatg gttgagatgg aaaagggcgc agacctgatg 1080
caggcactgg tcgattctga actgcaacct tcccgtggtc aggcacgtaa aactatcgcc 1140
tccaatgcca tcaccattaa cggtgaaaaa cagtccgatc ctgaatactt ctttaaagaa 1200
gaagatcgtc tgtttggtcg ttttacctta ctgcgtcgcg gtaaaaagaa ttactgtctg 1260
atttgctgga aagggcccgt ttaa 1284
<210> 5
<211> 79
<212> DNA
<213> 巴氏甲烷八叠球菌(Methanosarcina barkeri)
<400> 5
caccggaaac ctgatcatgt agatcgaacg gactctaaat ccgttcagcc gggttagatt 60
cccggggttt ccgtttttt 79
<210> 6
<211> 79
<212> DNA
<213> 巴氏甲烷八叠球菌(Methanosarcina barkeri)
<400> 6
caccgggggg tggatcgaat agatcacacg gactctaaat ccgtgcaggc gggtgaaact 60
cccgcacccc ccgtttttt 79
<210> 7
<211> 77
<212> DNA
<213> 马氏甲烷八叠球菌(Methanosarcina mazeii)
<400> 7
ggaaacctga tcatgtagat cgaatggact ctaaatccgt tcagccgggt tagattcccg 60
gggtttccgc cattttt 77
<210> 8
<211> 84
<212> DNA
<213> 大肠埃希氏菌(Escherichia coli)
<400> 8
gcccggatgg tggaatcggt agacacaagg gattctaaat ccctcggcgt tcgcgctgtg 60
cgggttcaag tcccgctccg ggta 84
<210> 9
<211> 88
<212> DNA
<213> 大肠埃希氏菌(Escherichia coli)
<400> 9
ggtggggttc ccgagcggcc aaagggagca gactctaaat ctgccgtcac agacttcgaa 60
ggttcgaatc cttcccccac catttttt 88
<210> 10
<211> 88
<212> DNA
<213> 大肠埃希氏菌(Escherichia coli)
<400> 10
ggaggggtag cgaagtggct aaacgcggcg gactctaaat ccgctccctt tgggttcggc 60
ggttcgaatc cgtccccctc catttttt 88
<210> 11
<211> 717
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
atgagtaaag gagaagaact tttcactgga gttgtcccaa ttcttgttga attagatggt 60
gatgttaatg ggcacaaatt ttctgtcagt ggagagggtg aaggtgatgc aacatacgga 120
aaacttaccc ttaaatttat ttgcactact ggaaaactac ctgttccatg gccaacactt 180
gtcactactt tcggttatgg tgttcaatgc tttgcgagat acccagatca tatgaaacag 240
catgactttt tcaagagtgc catgcctgaa ggttatgtac aggaaagaac tatatttttc 300
aaagatgacg ggaactacaa gacacgtgct gaagtcaagt ttgaaggtga tacccttgtt 360
aatagaatcg agttaaaagg tattgatttt aaagaagatg gaaacattct tggacacaaa 420
ttggaataca actataactc acacaatgta tacatcatgg cagacaaaca aaagaatgga 480
atcaaagtta acttcaaaat tagacacaac attgaagatg gaagcgttca actagcagac 540
cattatcaac aaaatactcc aattggcgat ggccctgtcc ttttaccaga caaccattac 600
ctgtccacac aatctgccct ttcgaaagat cccaacgaaa agagagacca catggtcctt 660
cttgagtttg taacagctgc tgggattaca catggcatgg atgaactata caaataa 717
<210> 12
<211> 678
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
atggcctcct ccgagaacgt catcaccgag ttcatgcgct tcaaggtgcg catggagggc 60
accgtgaacg gccacgagtt cgagatcgag ggcgagggcg agggccgccc ctacgagggc 120
cacaacaccg tgaagctgaa ggtgaccaag ggcggccccc tgcccttcgc ctgggacatc 180
ctgtcccccc agttccagta cggctccaag gtgtacgtga agcaccccgc cgacatcccc 240
gactacaaga agctgtcctt ccccgagggc ttcaagtggg agcgcgtgat gaacttcgag 300
gacggcggcg tggcgaccgt gacccaggac tcctccctgc aggacggctg cttcatctac 360
aaggtgaagt tcatcggcgt gaacttcccc tccgacggcc ccgtgatgca gaagaagacc 420
atgggctggg aggcctccac cgagcgcctg tacccccgcg acggcgtgct gaagggcgag 480
acccacaagg ccctgaagct gaaggacggc ggccactacc tggtggagtt caagtccatc 540
tacatggcca agaagcccgt gcagctgccc ggctactact acgtggacgc caagctggac 600
atcacctccc acaacgagga ctacaccatc gtggagcagt acgagcgcac cgagggccgc 660
caccacctgt tcctgtaa 678
<210> 13
<211> 702
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
atgagcgagc tgattaagga gaacatgcac atgaagctgt acatggaggg caccgtggac 60
aaccatcact tcaagtgcac atccgagggc gaaggcaagc cctacgaggg cacccagacc 120
atgagaatca aggtggtcga gggcggccct ctccccttcg ccttcgacat cctggctact 180
agcttcctct acggcagcaa gaccttcatc gaccacaccc agggcatccc cgacttcttc 240
aagcagtcct tccctgaggg cttcacatgg gagagagtca ccacatacga agacgggggc 300
gtgctgaccg ctacccagga caccagcctc caggacggct gcctcatcta caacgtcaag 360
atcagagggg tgaacttcac atccaacggc cctgtgatgc agaagaaaac actcggctgg 420
gaggccttca ccgagacgct gtaccccgct gacggcggcc tggaaggcag aaacgacatg 480
gccctgaagc tcgtgggcgg gagccatctg atcgcaaaca tcaagaccac atatagatcc 540
aagaaacccg ctaagaacct caagatgcct ggcgtctact atgtggacta cagactggaa 600
agaatcaagg aggccaacaa cgagacctac gtcgagcagc acgaggtggc agtggccaga 660
tactgcgacc tccctagcaa actggggcac aagctcaatt aa 702

Claims (7)

1.一种基因密码子拓展组合物,包括:
(1)一种或多种氨基酰-tRNA合成酶,结合突变的tRNA;
(2)一种或多种突变的tRNA,所述突变的tRNA反密码子环上突变为终止密码子的互补序列;
其中,氨基酰-tRNA合成酶能将突变的tRNA结合到非天然氨基酸上产生氨基酰-tRNA;所述非天然氨基酸选自NAEK、Anap、pAcF;
其包括以下三组氨基酰-tRNA合成酶与突变tRNA的组合:
来自马氏古甲烷球菌的MmPylRs和tRNAMmPyl UCA的所述氨基酰-tRNA合成酶与突变tRNA组合;
来自大肠杆菌的EcLeuRs和tRNAEcLeu CUA的所述氨基酰-tRNA合成酶与突变tRNA组合;
以及
来自大肠杆菌的EcTyrRs和tRNAEcTyr UUA的所述氨基酰-tRNA合成酶与突变tRNA组合。
2.一种在动物细胞中表达含有非天然氨基酸重组蛋白的方法,包括:
(1)制备重组蛋白表达盒,其中重组蛋白编码序列中非天然氨基酸的密码子设置为终止密码子;
(2)改造动物细胞,使其表达权利要求1中基因密码子拓展组合物中的氨基酰-tRNA合成酶和突变tRNA的组合;
可选的,进一步突变eRF1以削弱eRF1与mRNA、和/或eRF1与核糖体的结合;
(3)将步骤(1)中重组蛋白表达盒导入步骤(2)改造的动物细胞,制备重组动物细胞;
(4)将步骤(3)构建的重组动物细胞在补充添加非天然氨基酸的培养基中培养,诱导含有非天然氨基酸重组蛋白的表达。
3.如权利要求2所述在动物细胞中表达含有非天然氨基酸重组蛋白的方法,其特征在于:
(1)所述重组蛋白氨基酸序列中含有一种、两种或三种非天然氨基酸;或
(2)在动物细胞中表达一种、两种或三种含有非天然氨基酸的重组蛋白,各重组蛋白中含有的非天然氨基酸种类相同或不同。
4.一种提高动物细胞中表达含非天然氨基酸重组蛋白通读率的方法,包括使突变的eRF1和含有PTC的mRNA在同一动物细胞内表达,其中,所述动物细胞中表达有权利要求1所述基因密码子拓展组合物中的氨基酰-tRNA合成酶和突变的tRNA;所述突变的eRF1削弱了eRF1与mRNA、和/或eRF1与核糖体的结合。
5.如权利要求4所述提高动物细胞中表达含非天然氨基酸重组蛋白通读率的方法,其中与野生型eRF1相比,所述突变的eRF1对mRNA、和/或核糖体具有较低的结合能力,并且所述突变的eRF1包括E55R、E55D、Y125F、N129P位点的突变。
6.如权利要求5所述提高动物细胞中表达含非天然氨基酸重组蛋白通读率的方法,其中突变的eRF1包括E55R突变体、E55D突变体、Y125F突变体、N129P突变体。
7.权利要求1所述基因密码子拓展组合物在重组表达含非天然氨基酸重组蛋白中的应用;其中所述重组表达以哺乳动物细胞为宿主,
所述含非天然氨基酸重组蛋白包括:
含有一个、两个或三个非天然氨基酸的一种重组蛋白,或者
分别含有至少一个非天然氨基酸的两种或三种重组蛋白。
CN202111050643.3A 2021-09-08 2021-09-08 一种含非天然氨基酸蛋白的制备方法 Active CN113699124B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202111050643.3A CN113699124B (zh) 2021-09-08 2021-09-08 一种含非天然氨基酸蛋白的制备方法
PCT/CN2022/117667 WO2023036210A1 (zh) 2021-09-08 2022-09-07 一种含非天然氨基酸蛋白的制备方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111050643.3A CN113699124B (zh) 2021-09-08 2021-09-08 一种含非天然氨基酸蛋白的制备方法

Publications (2)

Publication Number Publication Date
CN113699124A CN113699124A (zh) 2021-11-26
CN113699124B true CN113699124B (zh) 2022-04-12

Family

ID=78659290

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111050643.3A Active CN113699124B (zh) 2021-09-08 2021-09-08 一种含非天然氨基酸蛋白的制备方法

Country Status (2)

Country Link
CN (1) CN113699124B (zh)
WO (1) WO2023036210A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113699124B (zh) * 2021-09-08 2022-04-12 北京大学 一种含非天然氨基酸蛋白的制备方法
WO2023208081A1 (en) * 2022-04-28 2023-11-02 Shenzhen Bay Laboratory Substituted fluorosulfate and use thereof
CN115261344B (zh) * 2022-08-29 2023-07-21 北京大学 基于非天然氨基酸的离子液体、其制备方法及应用

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201419109D0 (en) * 2014-10-27 2014-12-10 Medical Res Council Incorporation of unnatural amino acids into proteins
CN107177593B (zh) * 2016-03-10 2020-10-23 北京大学 利用优化的基因密码子扩展系统通读提前终止密码子疾病中的截短蛋白
US10266578B2 (en) * 2017-02-08 2019-04-23 Bristol-Myers Squibb Company Modified relaxin polypeptides comprising a pharmacokinetic enhancer and uses thereof
AU2019263303A1 (en) * 2018-05-01 2020-12-24 Ambrx, Inc. A method for optimizing antibody expression
CN110835633B (zh) * 2018-08-13 2021-10-01 北京大学 利用优化的基因密码子扩展系统制备ptc稳定细胞系及应用
CN113699124B (zh) * 2021-09-08 2022-04-12 北京大学 一种含非天然氨基酸蛋白的制备方法

Also Published As

Publication number Publication date
CN113699124A (zh) 2021-11-26
WO2023036210A1 (zh) 2023-03-16

Similar Documents

Publication Publication Date Title
CN113699124B (zh) 一种含非天然氨基酸蛋白的制备方法
EP2995683B1 (en) Method for producing peptide library, peptide library, and screening method
US8183037B2 (en) Methods of genetically encoding unnatural amino acids in eukaryotic cells using orthogonal tRNA/synthetase pairs
US20060084136A1 (en) Production of fusion proteins by cell-free protein synthesis
BRPI0718389A2 (pt) incorporação genética de aminoácidos antinaturais em proteìnas em células de mamìferos
US10227595B2 (en) Universal protein overexpression tag comprising ramp function, and application thereof
WO2010141851A1 (en) Improving unnatural amino acid incorporation in eukaryotic cells
Huang et al. Molecular basis for human mitochondrial tRNA m3C modification by alternatively spliced METTL8
EP3868882A1 (en) Archaeal pyrrolysyl trna synthetases for orthogonal use
AU2022234325A1 (en) Compositions comprising a variant polypeptide and uses thereof
Fu et al. Improving the efficiency and orthogonality of genetic code expansion
US20230045187A1 (en) Compositions comprising a nuclease and uses thereof
US20100297698A1 (en) System and method for producing synthetic microorganisms capable of translating proteins containing non-standard amino acids
WO2022174099A2 (en) Compositions comprising a variant cas12i4 polypeptide and uses thereof
WO2022150608A1 (en) Compositions comprising a variant crispr nuclease polypeptide and uses thereof
WO2020247605A1 (en) Compositions and methods for making hybrid polypeptides
WO2023077058A1 (en) Engineered bacterial tyrosyl-trna synthetase mutants for incorporating unnatural amino acids into proteins
WO2023028563A1 (en) Autonomous organisms for synthesis of permanently phosphorylated proteins
Köhrer et al. Specialized Components of the Translational Machinery for Unnatural Amino Acid Mutagenesis: tRNAs, Aminoacyl-tRNA Synthetases, and Ribosomes
Maranhao Improved selections and assessments for engineering orthogonal translation systems
Schwark et al. Orthogonal pair-directed codon reassignment as a tool for evaluating the factors affecting translation in E. coli
EP4305158A1 (en) Compositions comprising a variant polypeptide and uses thereof
CN114761418A (zh) Cho细胞衍生的蛋白分泌因子和包含它的表达载体
CA2471667A1 (en) Nucleotide sequences having activity of controlling translation efficiency and utilization thereof

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant