CN111850020A - 利用质粒系统在蛋白中引入非天然氨基酸 - Google Patents

利用质粒系统在蛋白中引入非天然氨基酸 Download PDF

Info

Publication number
CN111850020A
CN111850020A CN201910340499.3A CN201910340499A CN111850020A CN 111850020 A CN111850020 A CN 111850020A CN 201910340499 A CN201910340499 A CN 201910340499A CN 111850020 A CN111850020 A CN 111850020A
Authority
CN
China
Prior art keywords
ser
leu
lys
glu
ile
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910340499.3A
Other languages
English (en)
Other versions
CN111850020B (zh
Inventor
查若鹏
陈卫
吴松
张振山
刘慧玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Kunpeng Biotechnology Co ltd
Original Assignee
Suzhou Kunpeng Biotechnology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Kunpeng Biotechnology Co ltd filed Critical Suzhou Kunpeng Biotechnology Co ltd
Priority to CN201910340499.3A priority Critical patent/CN111850020B/zh
Publication of CN111850020A publication Critical patent/CN111850020A/zh
Application granted granted Critical
Publication of CN111850020B publication Critical patent/CN111850020B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/93Ligases (6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y601/00Ligases forming carbon-oxygen bonds (6.1)
    • C12Y601/01Ligases forming aminoacyl-tRNA and related compounds (6.1.1)
    • C12Y601/01006Lysine-tRNA ligase (6.1.1.6)

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明提供了利用质粒系统在蛋白中引入非天然氨基酸的方法。具体地,本发明提供了一种质粒系统,所述质粒系统包括第一表达盒、第二表达盒和第三表达盒,所述第一表达盒用于表达目的蛋白,所述第二表达盒用于表达氨酰基‑tRNA合成酶;第三表达盒用于编码人工tRNA。结果表明本发明的质粒系统能够将非天然氨基酸直接引入到蛋白中,成本低,产率高,环境污染小。此外,相比野生型赖氨酰‑tRNA合成酶,本发明突变型赖氨酰‑tRNA合成酶可提高非天然氨基酸插入量和含有非天然氨基酸的目的蛋白量。

Description

利用质粒系统在蛋白中引入非天然氨基酸
技术领域
本发明属于生物医药工程技术领域。具体地,本发明涉及利用质粒系统在蛋白中引入非天然氨基酸。
背景技术
作为蛋白质的翻译后修饰的重要位点以及多种酶活性中心的关键残基,非天然氨基酸在多种蛋白质行使其生理病理功能的过程中扮演重要的角色。对于蛋白质,特别是多肽药物,非天然氨基酸的修饰,不仅可能增强多肽药物的药效,降低药物毒性,还由于非天然氨基酸的掺入,使得多肽药物大大降低免疫原性,减少免疫排异反应,而且某些蛋白酶可能不再识别掺入非天然氨基酸的多肽物,使得药物在体内维系更长时间不被降解,从而延长药物半衰期,以革除多肽类药物不断注射给药的弊端;并且还有望通过修饰,使多肽药物“搭载”其它化学附件,从而导致疾病治疗新方法的出现。对于多肽药物的修饰,大多只通过化学合成的方法修饰。
因此,本领域急需开发一种能够高效地在多肽药物中定点引入非天然氨基酸的方法。
发明内容
本发明的目的是提供一种高效地在多肽药物中定点引入非天然氨基酸的方法。
本发明的第一方面,提供了一种质粒系统,所述质粒系统包含:
(1)第一表达盒,所述第一表达盒含有编码目的蛋白的第一编码序列,所述第一编码序列中含有用于引入预定的修饰氨基酸的天然密码子,所述天然密码子为UAG(琥珀)、UAA(赭石)、或UGA(蛋白石);和
(2)第二表达盒,所述第二表达盒含有编码氨酰基-tRNA合成酶的第二编码序列;
并且,所述系统还含有第三表达盒,所述第三表达盒含有编码人工tRNA的第三编码序列,其中所述人工tRNA含有对应于所述天然密码子的反密码子;
并且所述的氨酰基-tRNA合成酶特异性催化所述人工tRNA形成“人工tRNA-Xa”复合物,其中Xa为氨酰基形式的所述预定的修饰氨基酸。
在另一优选例中,所述质粒系统为单质粒系统或多质粒系统,优选为单质粒系统。
在另一优选例中,所述天然密码子为UAG(琥珀)或UGA(蛋白石)。
在另一优选例中,所述的密码子包括mRNA或DNA上对应于氨基酸的三碱基核苷酸序列。
在另一优选例中,所述预定的修饰氨基酸为带有修饰基团的赖氨酸。
在另一优选例中,所述修饰氨基酸选自下组:炔基氧羰基赖氨酸衍生物、叔丁氧羰基(BOC)-赖氨酸衍生物、脂肪酰化赖氨酸衍生物、或其组合。
在另一优选例中,所述炔基氧羰基赖氨酸的结构如下式I所示:
Figure BDA0002040543680000021
其中,n为0-8。
在另一优选例中,所述氨酰基-tRNA合成酶为野生型的氨酰基-tRNA合成酶或突变型氨酰基-tRNA合成酶。
在另一优选例中,所述氨酰基-tRNA合成酶为赖氨酰-tRNA合成酶。
在另一优选例中,所述氨酰基-tRNA合成酶为突变型赖氨酰-tRNA合成酶。
在另一优选例中,所述突变型赖氨酰-tRNA合成酶在对应于野生型赖氨酰-tRNA合成酶的氨基酸序列中第19位精氨酸(R)和/或第29位组氨酸(H)发生突变。
在另一优选例中,所述野生型赖氨酰-tRNA合成酶来自产甲烷古细菌的马氏甲烷八叠球菌(Methanosarcina mazei)、巴氏甲烷八叠球菌(Methanosarcina barkeri)或噬乙酸甲烷八叠球菌(Methanosarcina acetivorans)。
在另一优选例中,所述野生型赖氨酰-tRNA合成酶的氨基酸序列如SEQ ID NO.:1所示。
在另一优选例中,所述野生型赖氨酰-tRNA合成酶的氨基酸序列如SEQ ID NO.:2所示。
在另一优选例中,所述第19位精氨酸(R)突变为组氨酸(H)或赖氨酸(K);和/或
第29位组氨酸(H)突变为精氨酸(R)或赖氨酸(K)。
在另一优选例中,所述突变型赖氨酰-tRNA合成酶中的突变选自下组:R19H、R19K、H29R、H29K、或其组合。
在另一优选例中,所述突变型赖氨酰-tRNA合成酶还包括选自下组的位点发生突变:第26位异亮氨酸(I)、第122位苏氨酸(T)、第309位亮氨酸(L)、第348位半胱氨酸(C)、第384位酪氨酸(Y)、或其组合。
在另一优选例中,所述突变型赖氨酰-tRNA合成酶的突变位点还包括第26位异亮氨酸(I);优选地,所述第26位异亮氨酸(I)突变为缬氨酸(V)。
在另一优选例中,所述突变型赖氨酰-tRNA合成酶的突变位点还包括第122位苏氨酸(T);优选地,所述第122位苏氨酸(T)突变为色氨酸(S)。
在另一优选例中,所述突变型赖氨酰-tRNA合成酶的突变位点还包括第309位亮氨酸(L);优选地,所述第309位亮氨酸(L)突变为丙氨酸(A)。
在另一优选例中,所述突变型赖氨酰-tRNA合成酶的突变位点还包括第348位半胱氨酸(C);优选地,所述第348位半胱氨酸(C)突变为色氨酸(S)。
在另一优选例中,所述突变型赖氨酰-tRNA合成酶的突变位点还包括第384位酪氨酸(Y);优选地,所述第384位酪氨酸(Y)突变为苯丙氨酸(F)。
在另一优选例中,所述突变型赖氨酰-tRNA合成酶还包括选自下组的突变:I26V、T122S、L309A、C348S、Y384F、或其组合。
在另一优选例中,所述的突变型赖氨酰-tRNA合成酶包括选自下组的突变:R19H和H29R。
在另一优选例中,所述的突变型赖氨酰-tRNA合成酶包括选自下组的突变:R19K和H29R。
在另一优选例中,所述的突变型赖氨酰-tRNA合成酶包括选自下组的突变:R19H和H29K。
在另一优选例中,所述的突变型赖氨酰-tRNA合成酶包括选自下组的突变:R19K和H29K。
在另一优选例中,所述的突变型赖氨酰-tRNA合成酶包括选自下组的突变:R19H、I26V和H29R。
在另一优选例中,所述的突变型赖氨酰-tRNA合成酶包括选自下组的突变:R19H、H29R、T122S和Y384F。
在另一优选例中,所述的突变型赖氨酰-tRNA合成酶包括选自下组的突变:R19H、H29R、L309A和C348S。
在另一优选例中,所述的突变型赖氨酰-tRNA合成酶除所述突变(如第19和/或29位,以及任选的第26、122、309、348和/或384位)外,其余氨基酸与SEQ ID NO.:1或SEQ IDNO.:2所示的序列相同或基本相同。
在另一优选例中,所述的基本相同是至多有50个(较佳地为1-20个,更佳地为1-10个)氨基酸不相同,其中,所述的不相同包括氨基酸的取代、缺失或添加,且所述的突变蛋白仍具有赖氨酰-tRNA合成酶的活性。
在另一优选例中,所述突变型赖氨酰-tRNA合成酶的氨基酸序列与SEQ ID NO.1或SEQ ID NO.:2相比具有至少70%,优选至少75%、80%、85%、90%,更优选至少95%、96%、97%、98%、99%以上的序列相同性。
在另一优选例中,所述突变型赖氨酰-tRNA合成酶为SEQ ID NO.:1或SEQ ID NO.:2所示的野生型赖氨酰-tRNA合成酶经突变形成的。
在另一优选例中,所述突变型赖氨酰-tRNA合成酶选自下组:
(1)氨基酸序列如SEQ ID NO.:3-9任一所示的多肽;或
(2)将SEQ ID NO.:3-9任一所示氨基酸序列经过一个或几个,优选1-20个、更优选1-15个、更优选1-10个、更优选1-8个、更优选1-3个、最优选1个氨基酸残基的取代、缺失或添加而形成的,具有(1)所述多肽功能的由SEQ ID NO.:3-9任一所示氨基酸序列的多肽衍生的多肽。
在另一优选例中,所述突变型赖氨酰-tRNA合成酶的氨基酸序列如SEQ ID NO.:3-9任一所示。
在另一优选例中,所述突变型赖氨酰-tRNA合成酶为非天然蛋白。
在另一优选例中,所述突变型赖氨酰-tRNA合成酶用于将赖氨酸衍生物引入目的蛋白中。
在另一优选例中,所述突变型赖氨酰-tRNA合成酶具有以下特征:
与野生型赖氨酰-tRNA合成酶相比,能将大官能团的赖氨酸衍生物导入蛋白中。
在另一优选例中,所述人工tRNA的编码核酸序列如SEQ ID NO.:10所示。
GGAAACCTGATCATGTAGATCGAATGGACTCTAAATCCGTTCAGCCGGGTTAGATTCCCGGGGTTTCCGCCA(SEQ ID NO.:10)
在另一优选例中,所述目的蛋白选自下组:胰岛素、人胰岛素前体蛋白、赖脯胰岛素的前体蛋白、甘精胰岛素的前体蛋白、甲状旁腺素、可的瑞琳、降血钙素、比伐卢定、胰高血糖素样肽及其衍生物艾塞那肽和利拉鲁肽、索玛鲁肽、齐考诺肽、舍莫瑞林、生长瑞林、分泌素、替度鲁肽、水蛭素、生长激素、生长因子、生长激素释放因子、促肾上腺皮质激素、释放因子、德舍瑞林、去氨加压素、依降钙素、胰高血糖素、亮丙瑞林、促黄体激素释放激素、生长激素抑制素、促甲状腺激素释放激素、曲普瑞林、血管活性肠肽、干扰素、甲状旁腺激素、BH3肽、淀粉样变肽、或上述肽的片段、或其组合。
在另一优选例中,所述第一表达盒、第二表达盒和第三表达盒位于同一质粒中。
在另一优选例中,所述质粒为选自下组的表达载体:pBAD/gIII ABC、pBAD/HisABC、pET28a、pETDuet-1、或pEvol-pBpF载体。
在另一优选例中,所述质粒还包含抗性基因、标签序列、阻遏蛋白基因(araC)、启动子基因(araBAD)、或其组合。
在另一优选例中,所述抗性基因选自下组:氨苄青霉素抗性基因(AmpR)、氯霉素抗性基因(CmR)、卡那霉素抗性基因(KanaR)、四环素抗性基因(TetR)、或其组合。
在另一优选例中,所述第一表达盒、第二表达盒和第三表达盒在单质粒系统中的位置无任何限定。
在另一优选例中,所述第一表达盒、第二表达盒和第三表达盒中的任何两个或三个可以合二为一。
在另一优选例中,所述第一表达盒、第二表达盒和第三表达盒中的任何两个之间可以通过连接序列(如IRES、P2A、T2A等)连接。
在另一优选例中,所述第一表达盒、第二表达盒和/或第三表达盒可以含有启动子,也可以不含启动子。
在另一优选例中,所述第一表达盒、第二表达盒和/或第三表达盒还包含一个或多个启动子,所述启动子可操作地与所述第一编码序列、所述第二编码序列、所述第三编码序列、增强子、转录终止信号、多腺苷酸化序列、复制起点、选择性标记、核酸限制性位点、和/或同源重组位点连接。
在另一优选例中,所述第一表达盒中还包含第一启动子,较佳地所述第一启动子为可诱导启动子。
在另一优选例中,所述第一启动子选自下组:阿拉伯糖启动子(araBAD)、乳糖启动子(Plac)、pLacUV5启动子、pTac启动子、或其组合。
在另一优选例中,所述第一表达盒从5’-3’依次包括:启动子(如araBAD)、核糖体结合位点RBS、所述第一编码序列、终止子或标签序列。
在另一优选例中,所述第二表达盒中还包含第二启动子,较佳地所述第二启动子为可诱导启动子。
在另一优选例中,所述第二启动子选自下组:阿拉伯糖启动子(araBAD)、glnS启动子或其组合。
在另一优选例中,所述第二表达盒从5’-3’依次包括:启动子(如glnS)、核糖体结合位点RBS、所述第二编码序列和终止子(glnS T)。
在另一优选例中,所述第三表达盒中还包含第三启动子,较佳地所述第三启动子为组成型启动子。
在另一优选例中,所述第三启动子为逆转录启动子proK。
在另一优选例中,所述第三表达盒从5’-3’依次包括:启动子(如proK)、核糖体结合位点RBS、第三编码序列和终止子或标签序列。
本发明的第二方面,提供了一种宿主细胞或细胞提取液,所述宿主细胞或细胞提取液含有本发明第一方面所述的质粒系统。
在另一优选例中,所述宿主细胞选自下组:大肠杆菌、枯草芽孢杆菌、酵母细胞、昆虫细胞、哺乳动物细胞、或其组合。
在另一优选例中,所述细胞提取液来自选自下组的细胞:大肠杆菌、枯草芽孢杆菌、酵母细胞、昆虫细胞、哺乳动物细胞、或其组合。
本发明的第三方面,提供了一种试剂盒,所述试剂盒含有(a)容器,以及(b)位于所述容器内的本发明第一方面所述的质粒系统。
在另一优选例中,所述质粒系统为单质粒系统或多质粒系统,优选为单质粒系统。
在另一优选例中,所述试剂盒还包含细胞提取液。
在另一优选例中,所述质粒系统为多质粒系统,所述的各质粒位于相同或不同的容器内。
在另一优选例中,所述天然密码子为UAG(琥珀)或UGA(蛋白石)密码子。
在另一优选例中,所述预定的修饰氨基酸为带有修饰基团的赖氨酸。
在另一优选例中,所述修饰氨基酸选自下组:炔基氧羰基赖氨酸衍生物、叔丁氧羰基(BOC)-赖氨酸衍生物、脂肪酰化赖氨酸衍生物、或其组合。
在另一优选例中,所述氨酰基-tRNA合成酶为野生型的氨酰基-tRNA合成酶或突变型氨酰基-tRNA合成酶。
在另一优选例中,所述氨酰基-tRNA合成酶为赖氨酰-tRNA合成酶。
在另一优选例中,所述氨酰基-tRNA合成酶为突变型赖氨酰-tRNA合成酶。
在另一优选例中,所述目的蛋白选自下组:胰岛素、人胰岛素前体蛋白、赖脯胰岛素的前体蛋白、甘精胰岛素的前体蛋白、甲状旁腺素、可的瑞琳、降血钙素、比伐卢定、胰高血糖素样肽及其衍生物艾塞那肽和利拉鲁肽、索玛鲁肽、齐考诺肽、舍莫瑞林、生长瑞林、分泌素、替度鲁肽、水蛭素、生长激素、生长因子、生长激素释放因子、促肾上腺皮质激素、释放因子、德舍瑞林、去氨加压素、依降钙素、胰高血糖素、亮丙瑞林、促黄体激素释放激素、生长激素抑制素、促甲状腺激素释放激素、曲普瑞林、血管活性肠肽、干扰素、甲状旁腺激素、BH3肽、淀粉样变肽、或上述肽的片段、或其组合。
本发明的第四方面,提供了如本发明第一方面所述的质粒系统、或本发明第二方面所述的宿主细胞或细胞提取液、或本发明第三方面所述的试剂盒的用途,用于制备含预定的修饰氨基酸的蛋白。
在另一优选例中,所述预定的修饰氨基酸为带有修饰基团的赖氨酸。
在另一优选例中,所述修饰氨基酸选自下组:炔基氧羰基赖氨酸衍生物、叔丁氧羰基(BOC)-赖氨酸衍生物、脂肪酰化赖氨酸衍生物、或其组合。
本发明的第五方面,提供了一种制备含预定的修饰氨基酸的蛋白的方法,所述方法包括步骤:
(1)提供本发明第二方面所述的宿主细胞或细胞提取液,和
(2)添加所述预定的修饰氨基酸,培养所述细胞或细胞提取液,从而得到含所述预定的修饰氨基酸的蛋白。
在另一优选例中,所述宿主细胞选自下组:大肠杆菌、枯草芽孢杆菌、酵母细胞、昆虫细胞、哺乳动物细胞、或其组合。
在另一优选例中,所述细胞提取液来自选自下组的细胞:大肠杆菌、枯草芽孢杆菌、酵母细胞、昆虫细胞、哺乳动物细胞、或其组合。
在另一优选例中,所述预定的修饰氨基酸为带有修饰基团的赖氨酸。
在另一优选例中,所述修饰氨基酸选自下组:炔基氧羰基赖氨酸衍生物、叔丁氧羰基(BOC)-赖氨酸衍生物、脂肪酰化赖氨酸衍生物、或其组合。
在另一优选例中,所述目的蛋白选自下组:胰岛素、人胰岛素前体蛋白、赖脯胰岛素的前体蛋白、甘精胰岛素的前体蛋白、甲状旁腺素、可的瑞琳、降血钙素、比伐卢定、胰高血糖素样肽及其衍生物艾塞那肽和利拉鲁肽、索玛鲁肽、齐考诺肽、舍莫瑞林、生长瑞林、分泌素、替度鲁肽、水蛭素、生长激素、生长因子、生长激素释放因子、促肾上腺皮质激素、释放因子、德舍瑞林、去氨加压素、依降钙素、胰高血糖素、亮丙瑞林、促黄体激素释放激素、生长激素抑制素、促甲状腺激素释放激素、曲普瑞林、血管活性肠肽、干扰素、甲状旁腺激素、BH3肽、淀粉样变肽、或上述肽的片段、或其组合。
应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合,从而构成新的或优选的技术方案。限于篇幅,在此不再一一累述。
附图说明
图1显示了pBAD-A1-u4-u5-TEV-R-MiniINS质粒图谱。
图2显示了pBAD-araBAD[A1-u4-u5-TEV-R-MiniINS]-glnS[pylRs]-proK[pylT]质粒图谱。
图3显示了pBAD-araBAD[A1-u4-u5-TEV-R-MiniINS]-glnS[pylRs(R19H,H29R,T122S,Y384F)]-proK[pylT]的质粒图谱。
具体实施方式
本发明人经过广泛而深入的研究,首次意外地发现通过本发明质粒系统能够将非天然氨基酸直接引入到蛋白中,成本低,产率高,环境污染小。此外,本申请还意外地获得一种突变型赖氨酰-tRNA合成酶。相比野生型赖氨酰-tRNA合成酶,本发明突变型赖氨酰-tRNA合成酶可提高非天然氨基酸插入量和含有非天然氨基酸的目的蛋白量。此外,本发明突变型赖氨酰-tRNA合成酶还可以提高目的蛋白的稳定性,使其不容易断裂。本发明质粒系统优选为单质粒系统,相比多质粒系统,能够降低质粒丢失率,从而保证菌株高效稳定表达目的蛋白;在菌珠筛选时,可以仅使用单一抗性筛选,减少抗生素的使用。在此基础上,发明人完成了本发明。
术语说明
除非另外定义,否则本文中所用的全部技术与科学术语均具有如本发明所属领域的普通技术人员通常理解的相同含义。
如本文所用,在提到具体列举的数值中使用时,术语“约”意指该值可以从列举的值变动不多于1%。例如,如本文所用,表述“约100”包括99和101和之间的全部值(例如,99.1、99.2、99.3、99.4等)。
如本文所用,术语“含有”或“包括(包含)”可以是开放式、半封闭式和封闭式的。换言之,所述术语也包括“基本上由…构成”、或“由…构成”。
序列同一性(或同源性)通过沿着预定的比较窗(其可以是参考核苷酸序列或蛋白的长度的50%、60%、70%、80%、90%、95%或100%)比较两个对齐的序列,并且确定出现相同的残基的位置的数目来确定。通常地,这表示为百分比。核苷酸序列的序列同一性的测量是本领域技术人员熟知的方法。
载体
如本文所用,术语“构建体”或“载体”通常是指能够转运其所连接的目的蛋白的编码序列的核酸。一种类型的载体是“质粒”,其是指可以连接另外的DNA区段的环状双链DNA环。
目的蛋白的编码序列可以被掺入载体中。载体可用于在兼容的宿主细胞中复制核酸。载体可以从宿主细胞中回收。载体可以是用于在相容的宿主细胞中表达目的核酸序列的表达载体。适当地,目的蛋白的编码序列可操作地连接到能够提供目的蛋白的编码序列在宿主细胞中的表达的控制序列(例如启动子或增强子)。术语“可操作地连接”是指所描述的组分处于允许它们以其预期方式起作用的关系中。可操作地连接到目的蛋白的编码序列的调节序列以这样的方式连接,使得在与控制序列相容的条件下实现目的核酸序列的表达。
载体可以被转化或转染到合适的宿主细胞中以提供蛋白质的表达。该过程可以包括在提供编码蛋白质的目的核酸序列的载体的表达的条件下培养用表达载体转化的宿主细胞,和任选地回收表达的蛋白质。
载体可以是例如提供有复制起点、任选地用于表达目标核酸序列的启动子和任选的启动子的调节子的质粒或病毒载体。在细菌质粒的情况下,载体可以含有一个或多个选择标记基因,例如卡那霉素抗性基因。
本领域的技术人员熟知的方法能用于构建含本发明蛋白的编码DNA序列和合适的转录/翻译控制信号的表达载体,优选市售的载体:细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒如腺病毒、逆转录病毒或其它载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等。所述的DNA序列可有效连接到表达载体中的适当启动子上,以指导mRNA合成。这些启动子的代表性例子有:大肠杆菌的lac或trp启动子;λ噬菌体的PL启动子:真核启动子包括CMV早期启动子、HSV胸苷激酶启动子、早期和晚期SV40启动子、反转录病毒的LTRs和其它一些已知的可控制基因在原核细胞或真核细胞或其病毒中表达的启动子。表达载体还包括翻译起始用的核糖体结合位点和转录终止子,在载体中插入增强子序列将会使其在高等真核细胞中的转录得到增强。增强子是DNA表达的顺式作用因子,通常大约有10-300bp,作用于启动子以增强基因的转录。如腺病毒增强子。此外,表达载体优选包含一个或多个选择性标记基因,以提供用于选择转化的宿主细胞的表型性状。
本发明还提供的重组载体,其包含本发明的目的蛋白、突变型赖氨酰-tRNA合成酶基因、以及任选的tRNA的DNA序列。在优选的实施方式中,所述重组载体的启动子下游包含多克隆位点或至少一个酶切位点。需要表达目的基因时,将目的基因连接入适合的多克隆位点或酶切位点,从而可操作地连接目的基因与启动子。
在另一优选的实施方式中,所述重组载体在5’到3’方向上包括:启动子,目的基因和终止子。如果需要,所述重组载体还可以包括以下元件:蛋白纯化标签;3’多聚核苷酸化信号;非翻译核酸序列;转运和靶向核酸序列;选择标记(抗生素抗性基因、荧光蛋白等);增强子;或操作子。
用于制备重组载体的方法是本领域普通技术人员所熟知的。表达载体可以是细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒或其他载体,在一优选实施方式中,表达的载体可以为pET、pCW、pUC、pPIC9k、pMA5或其他载体。总之,只要其能够在宿主体内复制和稳定,任何质粒和载体都可以被采用。
本领域普通技术人员可以采用熟知的方法构建含有本发明启动子和/或目的基因序列的载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等。
本发明的表达载体,可以用于转化适当的宿主细胞,以使宿主转录目的RNA或表达目的蛋白质。宿主细胞可以是原核细胞,如大肠杆菌、谷氨酸棒杆菌、黄色短杆菌、链霉菌属、农杆菌:或是低等真核细胞,如酵母细胞;或是高等真核细胞,如植物细胞,较佳地,油菜、烟草、大豆;昆虫细胞如果蝇S2或Sf9;动物细胞如CHO、COS或Bowes黑素瘤细胞等。在一优选实施方式中,表达宿主可以为大肠杆菌、枯草芽孢杆菌、毕赤酵母、链霉菌或其他宿主细胞。本领域一般技术人员都清楚如何选择适当的载体和宿主细胞。用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物(如大肠杆菌)时,可以用CaCl2法处理,也可用电穿孔法进行。当宿主是真核生物,可选用如下的DNA转染方法:磷酸钙共沉淀法,常规机械方法(如显微注射、电穿孔、脂质体包装等)。该方法是这样实现的,根据宿主细胞,用本领域技术人员所共知的方法生长或培养。比如微生物细胞通常是在0-100℃,优选10-60℃,同时还要氧气。培养基中含有碳源,如葡萄糖;氮源,通常是有机氮的形式,如酵母提取物、氨基酸;盐,如硫酸铵,微量元素,如铁、镁盐;如果需要的话还有维生素。在此期间培养基的pH可以保持固定的值,就是说,在培养期间进行控制或不控制。培养可以分批培养、半不连续培养或连续培养形式进行。在培养之后,收集细胞,破碎或直接使用。转化植物也可使用农杆菌转化或基因枪转化等方法,例如叶盘法、幼胚转化法、花芽浸泡法等。对于转化的植物细胞、组织或器官可以用常规方法再生成植株,从而获得转基因的植物。
获得的转化子可以用常规方法培养,表达本发明的目的蛋白。根据所用的宿主细胞,培养中所用的培养基可选自各种常规培养基。在适于宿主细胞生长的条件下进行培养。当宿主细胞生长到适当的细胞密度后,用合适的方法(如温度转换或化学诱导)诱导选择的启动子,将细胞再培养一段时间。
在上面的方法中的重组多肽可在细胞内、或在细胞膜上表达、或分泌到细胞外。如果需要,可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化重组的蛋白。这些方法是本领域技术人员所熟知的。这些方法的例子包括但并不限于:常规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析(HPLC)和其它各种液相层析技术及这些方法的结合。
术语“可操作连接”是指将准备转录表达的目的基因以一种本领域的常规方式连接到它的控制序列以被表达。
质粒系统
本发明提供了一种质粒系统,所述质粒系统包含:
(1)第一表达盒,所述第一表达盒含有编码目的蛋白的第一编码序列,所述第一编码序列中含有用于引入预定的修饰氨基酸的天然密码子,所述天然密码子为UAG(琥珀)、UAA(赭石)、或UGA(蛋白石);和
(2)第二表达盒,所述第二表达盒含有编码氨酰基-tRNA合成酶的第二编码序列;
(3)第三表达盒,所述第三表达盒含有编码人工tRNA的第三编码序列,其中所述人工tRNA含有对应于所述天然密码子的反密码子;
并且所述的氨酰基-tRNA合成酶特异性催化所述人工tRNA形成“人工tRNA-Xa”复合物,其中Xa为氨酰基形式的所述预定的修饰氨基酸。
在另一优选例中,所述质粒系统为单质粒系统或多质粒系统,优选为单质粒系统。
在另一优选例中,所述天然密码子为UAG(琥珀)或UGA(蛋白石)。
在另一优选例中,所述的密码子包括mRNA或DNA上对应于氨基酸的三碱基核苷酸序列。
在另一优选例中,所述预定的修饰氨基酸为带有修饰基团的赖氨酸。
在另一优选例中,所述修饰氨基酸选自下组:炔基氧羰基赖氨酸衍生物、叔丁氧羰基(BOC)-赖氨酸衍生物、脂肪酰化赖氨酸衍生物、或其组合。
在另一优选例中,所述第一表达盒、第二表达盒和第三表达盒位于同一质粒中。
在另一优选例中,所述质粒为选自下组的表达载体:pBAD/gIII ABC、pBAD/HisABC、pET28a、pETDuet-1、或pEvol-pBpF载体。
在另一优选例中,所述质粒还包含抗性基因、标签序列、阻遏蛋白基因(araC)、启动子基因(araBAD)、或其组合。
在另一优选例中,所述抗性基因选自下组:氨苄青霉素抗性基因(AmpR)、氯霉素抗性基因(CmR)、卡那霉素抗性基因(KanaR)、四环素抗性基因(TetR)、或其组合。
在另一优选例中,所述第一表达盒、第二表达盒和第三表达盒在单质粒系统中的位置无任何限定。
在另一优选例中,所述第一表达盒、第二表达盒和第三表达盒中的任何两个或三个可以合二为一。
在另一优选例中,所述第一表达盒、第二表达盒和第三表达盒中的任何两个之间可以通过连接序列(如IRES、P2A、T2A等)连接。
在另一优选例中,所述第一表达盒、第二表达盒和/或第三表达盒可以含有启动子,也可以不含启动子。
在另一优选例中,所述第一表达盒、第二表达盒和/或第三表达盒还包含一个或多个启动子,所述启动子可操作地与所述第一编码序列、所述第二编码序列、所述第三编码序列、增强子、转录终止信号、多腺苷酸化序列、复制起点、选择性标记、核酸限制性位点、和/或同源重组位点连接。
在另一优选例中,所述第一表达盒中还包含第一启动子,较佳地所述第一启动子为可诱导启动子。
在另一优选例中,所述第一启动子选自下组:阿拉伯糖启动子(araBAD)、乳糖启动子(Plac)、pLacUV5启动子、pTac启动子、或其组合。
在另一优选例中,所述第一表达盒从5’-3’依次包括:启动子(如araBAD)、核糖体结合位点RBS、所述第一编码序列、终止子或标签序列。
在另一优选例中,所述第二表达盒中还包含第二启动子,较佳地所述第二启动子为可诱导启动子。
在另一优选例中,所述第二启动子选自下组:阿拉伯糖启动子(araBAD)、glnS启动子或其组合。
在另一优选例中,所述第二表达盒从5’-3’依次包括:启动子(如glnS)、核糖体结合位点RBS、所述第二编码序列、终止子(glnS T)。
在另一优选例中,所述第三表达盒中还包含第三启动子,较佳地所述第三启动子为组成型启动子。
在另一优选例中,所述第三启动子为逆转录启动子proK。
在另一优选例中,所述第三表达盒从5’-3’依次包括:启动子(如proK)、核糖体结合位点RBS、第三编码序列、终止子或标签序列。
在另一优选例中,所述启动子glnS的DNA序列如SEQ ID NO.:13所示。
TTTTAAAAAACTAACAGTTGTCAGCCTGTCCCGCTTTAATATCATACGCCGTTATACGTTGTTTACGCTTTG(SEQ ID NO.:13)
在另一优选例中,所述终止子glnS T的DNA序列如SEQ ID NO.:14所示。
CAAACAATCCAAAACGCCGCGTTCAGCGGCGTTTTTTCTGCTTTT(SEQ ID NO.:14)
在另一优选例中,所述启动子proK的DNA序列如SEQ ID NO.:15所示。
TGTGCTTCTCAAATGCCTGAGGCCAGTTTGCTCAGGCTCTCCCCGTGGAGGTAATAATTGACGATATGATCAGTGCACGGCTAACTAAGCGGCCTGCTGACTTTCTCGCCGATCAAAAGGCATTTTGCTATTAAGGGATTGACGAGGGCGT(SEQ ID NO.:15)
在另一优选例中,所述终止子proK T的DNA序列如SEQ ID NO.:16所示。
AATTCGAAAAGCCTGCTCAACGAGCAGGCTTTTTTGCATG(SEQ ID NO.:16)
野生型赖氨酰-tRNA合成酶
如本文所用,“野生型赖氨酰-tRNA合成酶”、“野生型酶pylRs”是指天然存在的、未经过人工改造的氨酰-tRNA合成酶,其核苷酸可以通过基因工程技术来获得,如基因组测序、聚合酶链式反应(PCR)等,其氨基酸序列可由核苷酸序列推导而得到。所述野生型赖氨酰-tRNA合成酶的来源没有特别限制,一种优选的来源为产甲烷古细菌的马氏甲烷八叠球菌(Methanosarcina mazei)、巴氏甲烷八叠球菌(Methanosarcina barkeri)和噬乙酸甲烷八叠球菌(Methanosarcina acetivorans)等取得,但不限于此。
在本发明的一个优选例中,所述野生型赖氨酰-tRNA合成酶的氨基酸序列如SEQID NO.:1所示。
MDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ ID NO.:1)
在本发明的一个优选例中,所述野生型赖氨酰-tRNA合成酶的氨基酸序列如SEQID NO.:2所示。
MDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSGSYYNGISTNL(SEQ ID NO.:2)
突变型赖氨酰-tRNA合成酶
如本文所用,术语“突变蛋白”、“本发明突变蛋白”、“本发明突变的氨酰-tRNA合成酶”、“突变型赖氨酰-tRNA合成酶”、“突变体酶”、“氨酰-tRNA合成酶的突变体”可互换使用,均指非天然存在的突变的氨酰-tRNA合成酶,且所述突变的氨酰-tRNA合成酶为对SEQ IDNO.:1或SEQ ID NO.:2所示多肽进行人工改造的蛋白。具体地,所述突变的氨酰-tRNA合成酶如本发明第一方面所述。
应理解,本发明突变型赖氨酰-tRNA合成酶中的氨基酸编号基于野生型赖氨酰-tRNA合成酶(优选地,SEQ ID NO.:1或SEQ ID NO.:2)作出。当某一具体突变蛋白与SEQ IDNO.:1或SEQ ID NO.:2所示序列的同源性达到80%或以上时,突变蛋白的氨基酸编号可能会有相对于SEQ ID NO.:1或SEQ ID NO.:2的氨基酸编号的错位,如向氨基酸的N末端或C末端错位1-5位,而采用本领域常规的序列比对技术,本领域技术人员通常可以理解这样的错位是在合理范围内的,且不应当由于氨基酸编号的错位而使同源性达80%(如90%、95%、98%)的、具有相同或相似糖基转移酶活性的突变蛋白不在本发明突变蛋白的范围内。
本发明突变蛋白是合成蛋白或重组蛋白,即可以是化学合成的产物,或使用重组技术从原核或真核宿主(例如,细菌、酵母、植物)中产生。根据重组生产方案所用的宿主,本发明的突变蛋白可以是糖基化的,或可以是非糖基化的。本发明的突变蛋白还可包括或不包括起始的甲硫氨酸残基。
本发明还包括所述突变蛋白的片段、衍生物和类似物。如本文所用,术语“片段”、“衍生物”和“类似物”是指基本上保持所述突变蛋白相同的生物学功能或活性的蛋白。
本发明的突变蛋白片段、衍生物或类似物可以是(i)有一个或多个保守或非保守性氨基酸残基(优选保守性氨基酸残基)被取代的突变蛋白,而这样的取代的氨基酸残基可以是也可以不是由遗传密码编码的,或(ii)在一个或多个氨基酸残基中具有取代基团的突变蛋白,或(iii)成熟突变蛋白与另一个化合物(比如延长突变蛋白半衰期的化合物,例如聚乙二醇)融合所形成的突变蛋白,或(iv)附加的氨基酸序列融合到此突变蛋白序列而形成的突变蛋白(如前导序列或分泌序列或用来纯化此突变蛋白的序列或蛋白原序列,或与抗原IgG片段的形成的融合蛋白)。根据本文的教导,这些片段、衍生物和类似物属于本领域熟练技术人员公知的范围。本发明中,保守性替换的氨基酸最好根据表I进行氨基酸替换而产生。
表I
Figure BDA0002040543680000131
Figure BDA0002040543680000141
PylRS的氨基酸底物的识别与催化活性功能域的立体结构相关,野生型PylRS能够活化的赖氨酸衍生物的大小有限,具有大官能团的赖氨酸衍生物就不能导入到蛋白质中,因此,通过对PylRS位点的突变,避免结合底物的空间位阻,或突变氨基酸与底物氨基酸或者是主链部分发生的相互作用,来提高效果。
优选地,所述的突变蛋白如SEQ ID NO.:3-9中任一所示。
MDKKPLNTLISATGLWMSHTGTIHKVKHREVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ ID NO.:3)
MDKKPLNTLISATGLWMSHTGTIHKIKHREVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENSEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVFGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ ID NO.:4)
MDKKPLNTLISATGLWMSHTGTIHKIKHREVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYARKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFSQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ ID NO.:5)
MDKKPLNTLISATGLWMSHTGTIHKIKHREVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ ID NO.:6)
MDKKPLNTLISATGLWMSHTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ ID NO.:7)
MDKKPLNTLISATGLWMSRTGTIHKIKHREVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ ID NO.:8)
MDKKPLNTLISATGLWMSKTGTIHKIKHKEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL(SEQ ID NO.:9)
应理解,本发明突变蛋白与SEQ ID NO.:1或SEQ ID NO.:2所示的序列相比,通常具有较高的同源性(相同性),优选地,所述的突变蛋白与SEQ ID NO.:1或SEQ ID NO.:2所示序列的同源性至少为80%,较佳地至少为85%-90%,更佳地至少为95%,更佳地至少为98%,最佳地至少为99%。
此外,还可以对本发明突变蛋白进行修饰。修饰(通常不改变一级结构)形式包括:体内或体外的突变蛋白的化学衍生形式如乙酰化或羧基化。修饰还包括糖基化,如那些在突变蛋白的合成和加工中或进一步加工步骤中进行糖基化修饰而产生的突变蛋白。这种修饰可以通过将突变蛋白暴露于进行糖基化的酶(如哺乳动物的糖基化酶或去糖基化酶)而完成。修饰形式还包括具有磷酸化氨基酸残基(如磷酸酪氨酸,磷酸丝氨酸,磷酸苏氨酸)的序列。还包括被修饰从而提高了其抗蛋白水解性能或优化了溶解性能的突变蛋白。
术语“编码突变型赖氨酰-tRNA合成酶的多核苷酸”可以是包括编码本发明突变型赖氨酰-tRNA合成酶的多核苷酸,也可以是还包括附加编码和/或非编码序列的多核苷酸。
本发明还涉及上述多核苷酸的变异体,其编码与本发明有相同的氨基酸序列的多肽或突变蛋白的片段、类似物和衍生物。这些核苷酸变异体包括取代变异体、缺失变异体和插入变异体。如本领域所知的,等位变异体是一个多核苷酸的替换形式,它可能是一个或多个核苷酸的取代、缺失或插入,但不会从实质上改变其编码的突变蛋白的功能。
本发明还涉及与上述的序列杂交且两个序列之间具有至少50%,较佳地至少70%,更佳地至少80%相同性的多核苷酸。本发明特别涉及在严格条件(或严紧条件)下与本发明所述多核苷酸可杂交的多核苷酸。在本发明中,“严格条件”是指:(1)在较低离子强度和较高温度下的杂交和洗脱,如0.2×SSC,0.1%SDS,60℃;或(2)杂交时加有变性剂,如50%(v/v)甲酰胺,0.1%小牛血清/0.1%Ficoll,42℃等;或(3)仅在两条序列之间的相同性至少在90%以上,更好是95%以上时才发生杂交。
本发明的突变蛋白和多核苷酸优选以分离的形式提供,更佳地,被纯化至均质。
本发明多核苷酸全长序列通常可以通过PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
此外,还可用人工合成的方法来合成有关序列,尤其是片段长度较短时。通常,通过先合成多个小片段,然后再进行连接可获得序列很长的片段。
目前,已经可以完全通过化学合成来得到编码本发明蛋白(或其片段,或其衍生物)的DNA序列。然后可将该DNA序列引入本领域中已知的各种现有的DNA分子(或如载体)和细胞中。此外,还可通过化学合成将突变引入本发明蛋白序列中。
应用PCR技术扩增DNA/RNA的方法被优选用于获得本发明的多核苷酸。特别是很难从文库中得到全长的cDNA时,可优选使用RACE法(RACE-cDNA末端快速扩增法),用于PCR的引物可根据本文所公开的本发明的序列信息适当地选择,并可用常规方法合成。可用常规方法如通过凝胶电泳分离和纯化扩增的DNA/RNA片段。
本发明的技术方案,具有如下有益效果:
(1)本发明通过质粒系统,将非天然氨基酸直接引入到蛋白的合成过程中,成本低,产率高,环境污染小。
(2)只需要化学合成带有修饰基团的氨基酸,省去化学合成肽链方法的合成路径摸索时间,相较于有机合成,修饰效率及终产物得率高。
(3)相比野生型赖氨酰-tRNA合成酶,本发明突变型赖氨酰-tRNA合成酶可提高非天然氨基酸插入量和含有非天然氨基酸的目的蛋白量。此外,本发明突变型赖氨酰-tRNA合成酶还可以提高目的蛋白的稳定性,使其不容易断裂。通过对赖氨酰-tRNA合成酶部分序列的突变,可以促使其可溶表达,更有利于对不同表达形式的目的蛋白的分离纯化。
(4)本发明的单质粒系统能够降低质粒丢失率,保证菌株高效稳定表达目的蛋白。
(5)菌珠筛选时,本发明的单质粒系统可以仅仅使用单一抗性筛选,从而减少抗生素的使用。
下面结合具体实施,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring Harbor LaboratoryPress,1989)中所述的条件,或按照制造厂商所建议的条件。除非另外说明,否则百分比和份数按重量计算。
实施例1、表达野生型pylRs的菌种的构建
根据融合蛋白A1-u4-u5-TEV-R-MiniINS的氨基酸序列(SEQ ID NO.:11),根据大肠杆菌的密码子偏好性,合成了A1-u4-u5-TEV-R-MiniINS的DNA序列(SEQ ID NO.:12),克隆至表达载体质粒pBAD/His A(购自NTCC公司,卡那霉素抗性)的araBAD启动子下游NcoI-XhoI位点。不保留表达载体质粒pBAD/His A原有的标签基因(6*His)。
A1-u4-u5-TEV-R-MiniINS的氨基酸序列
MVSKGEELFTGVYVQERTISFKDTYKTRAEVKFEGDENLYFQGRFVNQHLCGSHLVEALYLVCGERGFFYTPKTRGIVEQCCTSICSLYQLENYCN(SEQ ID NO.:11)
A1-u4-u5-TEV-R-MiniINS的DNA序列
ATGGTTAGCAAAGGTGAAGAACTGTTTACCGGCGTTTATGTGCAGGAACGTACCATTAGCTTCAAAGATACCTATAAAACCCGTGCGGAAGTTAAATTTGAAGGCGATGAAAACCTGTATTTTCAGGGACGTTTCGTTAACCAACACCTGTGCGGCAGCCACCTGGTAGAGGCACTGTATCTGGTTTGTGGTGAACGTGGCTTCTTCTATACTCCGTAGACTCGTGGTATCGTGGAACAGTGTTGCACTTCTATTTGCTCTCTGTATCAGCTGGAAAATTACTGTAATTAA(SEQID NO.:12)
以限制性内切酶NcoI和XhoI将序列1从克隆载体pUC57-A1-u4-u5-TEV-R-MiniINS上切下,同时以NcoI和XhoI将表达载体质粒pBAD/His A切开,以核酸电泳进行分离,以琼脂糖凝胶DNA回收试剂盒提取,使用T4 DNA Ligase连接,以化学法(CaCl2法)转化到E.coliTop10感受态细胞中,将所述转化的细胞培养在含有卡那霉素的LB琼脂培养基(10g/L酵母蛋白胨,5g/L酵母浸粉,10g/L NaCl,1.5%琼脂)上37℃培养过夜。挑取单个活菌落,在含有卡那霉素的液体LB培养基(10g/L酵母蛋白胨,5g/L酵母浸粉,10g/L NaCl)中37℃220rpm培养过夜。以质粒小量提取试剂盒提取质粒,得到的质粒命名为pBAD-A1-u4-u5-TEV-R-MiniINS。质粒图谱见图1。
根据野生型赖氨酰-tRNA合成酶pylRs的氨基酸序列(SEQ ID NO.:1),根据非天然tRNA(pylT)的DNA序列(SEQ ID NO.:10),根据来源于pEvol-pBpF载体的谷氨酰胺启动子glnS和启动子proK及其对应终止子的DNA序列(SEQ ID NO.:13-16),根据大肠杆菌的密码子偏好性,合成了glnS[pylRs]-proK[pylT]的DNA序列(SEQ ID NO.:17),克隆至质粒pBAD-A1-u4-u5-TEV-R-MiniINS上,终止子rrnB下游的AvrII-XbaI位点,其中AvrII和XbaI酶切位点通过PCR方法增加。
glnS[pylRs]-proK[pylT]的DNA序列:
TTTTAAAAAACTAACAGTTGTCAGCCTGTCCCGCTTTAATATCATACGCCGTTATACGTTGTTTACGCTTTGAGGAATCCCATATGGATAAGAAACCGCTGAATACTCTGATTTCTGCAACTGGTCTGTGGATGAGCCGTACCGGCACCATCCACAAGATCAAACACCACGAGGTTTCCCGTAGCAAAATCTACATCGAAATGGCGTGCGGTGACCACCTGGTGGTAAACAACTCCCGTTCTTCTCGTACTGCACGTGCTCTGCGCCACCACAAGTACCGTAAGACCTGCAAGCGCTGTCGCGTGTCTGATGAAGACCTGAACAAATTCCTGACTAAAGCGAACGAAGATCAGACTTCTGTGAAGGTGAAAGTTGTTTCTGCCCCAACCCGCACCAAGAAAGCGATGCCGAAGTCCGTTGCACGCGCTCCGAAACCGCTGGAGAACACCGAAGCCGCACAGGCCCAGCCGTCTGGTTCTAAGTTTTCTCCGGCAATCCCGGTTTCTACTCAGGAGTCTGTGTCTGTGCCAGCTTCTGTTAGCACTTCTATTTCCTCTATCAGCACTGGTGCGACTGCGTCCGCTCTGGTAAAAGGTAACACTAACCCGATCACCAGCATGTCTGCTCCGGTTCAGGCTTCTGCACCGGCACTGACTAAAAGCCAGACTGACCGTCTGGAGGTTCTGCTGAACCCGAAAGATGAAATCAGCCTGAACTCTGGCAAACCGTTCCGTGAACTGGAATCCGAACTGCTGTCTCGTCGTAAGAAAGACCTGCAACAAATCTATGCTGAAGAGCGTGAAAACTACCTGGGTAAACTGGAACGTGAAATCACCCGTTTCTTTGTGGACCGTGGTTTCCTGGAAATCAAGTCTCCGATCCTGATCCCGCTGGAATACATCGAGCGCATGGGTATTGATAACGACACCGAACTGTCCAAGCAGATTTTCCGTGTGGACAAGAACTTCTGCCTGCGTCCGATGCTGGCACCGAACCTGTACAATTACCTGCGTAAACTGGATCGTGCACTGCCGGACCCGATCAAAATCTTTGAAATCGGTCCATGCTATCGTAAGGAGAGCGACGGTAAAGAACACCTGGAAGAGTTCACTATGCTGAACTTTTGTCAGATGGGTTCTGGCTGCACCCGTGAAAATCTGGAATCTATCATCACCGACTTCCTGAACCACCTGGGCATTGACTTCAAAATCGTTGGTGATTCCTGCATGGTTTACGGTGACACTCTGGACGTTATGCATGGTGATCTGGAACTGAGCAGCGCTGTTGTGGGTCCGATTCCGCTGGATCGTGAATGGGGTATCGATAAACCGTGGATTGGTGCTGGCTTCGGTCTGGAACGTCTGCTGAAAGTTAAGCACGACTTTAAGAACATCAAACGTGCTGCGCGTTCCGAGTCCTATTACAACGGCATTAGCACTAACCTGTAAGTCGACCAAACAATCCAAAACGCCGCGTTCAGCGGCGTTTTTTCTGCTTTTGCGGCCGCTGTGCTTCTCAAATGCCTGAGGCCAGTTTGCTCAGGCTCTCCCCGTGGAGGTAATAATTGACGATATGATCAGTGCACGGCTAACTAAGCGGCCTGCTGACTTTCTCGCCGATCAAAAGGCATTTTGCTATTAAGGGATTGACGAGGGCGTATCTGCGCAGTAAGATGCGCCCCGCATTGGAAACCTGATCATGTAGATCGAATGGACTCTAAATCCGTTCAGCCGGGTTAGATTCCCGGGGTTTCCGCCAAATTCGAAAAGCCTGCTCAACGAGCAGGCTTTTTTGCATG(SEQ ID NO.:17)
以限制性内切酶AvrII和XbaI将SEQ ID NO.:17所示的序列从克隆载体pUC57-glnS[pylRs]-proK[pylT]上切下,同时以AvrII和XbaI将质粒pBAD-A1-u4-u5-TEV-R-MiniINS切开,以核酸电泳进行分离,以琼脂糖凝胶DNA回收试剂盒提取,使用T4 DNALigase连接,以化学法(CaCl2法)转化到E.coli Top10感受态细胞中,将所述转化的细胞培养在含有卡那霉素的LB琼脂培养基(10g/L酵母蛋白胨,5g/L酵母浸粉,10g/L NaCl,1.5%琼脂)上37℃培养过夜。挑取单个活菌落,在含有卡那霉素的液体LB培养基(10g/L酵母蛋白胨,5g/L酵母浸粉,10g/L NaCl)中37℃220rpm培养过夜。加入终浓度20%甘油保存菌种。以质粒小量提取试剂盒提取质粒,得到的含有野生型赖氨酰-tRNA合成酶的质粒命名为pBAD-araBAD[A1-u4-u5-TEV-R-MiniINS]-glnS[pylRs]-proK[pylT]。质粒图谱见图2。
实施例2、表达突变型pylRs的菌种的构建
根据野生型赖氨酰-tRNA合成酶pylRs的氨基酸序列(SEQ ID NO.:1),引入突变R19H,H29R,T122S,Y384F,得到氨基酸序列如SEQ ID NO.:4所示的突变型赖氨酰-tRNA合成酶pylRs(R19H,H29R,T122S,Y384F)。根据来源于pEvol-pBpF载体的谷氨酰胺启动子glnS及其对应终止子glnS T的DNA序列(SEQ ID NO.:13,14),根据大肠杆菌的密码子偏好性,合成了glnS[pylRs(R19H,H29R,T122S,Y384F)]的DNA序列(SEQ ID NO.:18)。
glnS[pylRs(R19H,H29R,T122S,Y384F)]的DNA序列:
TTTTAAAAAACTAACAGTTGTCAGCCTGTCCCGCTTTAATATCATACGCCGTTATACGTTGTTTACGCTTTGAGGAATCCCATATGGATAAGAAACCGCTGAATACTCTGATTTCTGCAACTGGTCTGTGGATGAGCCATACCGGCACCATCCACAAGATCAAACACCGCGAGGTTTCCCGAAGCAAAATCTACATCGAAATGGCGTGCGGTGACCACCTGGTGGTAAACAACTCCCGTTCTTCTCGTACTGCACGTGCTCTGCGCCACCACAAGTACCGTAAGACCTGCAAGCGCTGTCGCGTGTCTGATGAAGACCTGAACAAATTCCTGACTAAAGCGAACGAAGATCAGACTTCTGTGAAGGTGAAAGTTGTTTCTGCCCCAACCCGCACCAAGAAAGCGATGCCGAAGTCCGTTGCACGCGCTCCGAAACCGCTGGAGAACTCCGAAGCCGCACAGGCCCAGCCGTCTGGTTCTAAGTTTTCTCCGGCAATCCCGGTTTCTACTCAGGAGTCTGTGTCTGTGCCAGCTTCTGTTAGCACTTCTATTTCCTCTATCAGCACTGGTGCGACTGCGTCCGCTCTGGTAAAAGGTAACACTAACCCGATCACCAGCATGTCTGCTCCGGTTCAGGCTTCTGCACCGGCACTGACTAAAAGCCAGACTGACCGTCTGGAGGTTCTGCTGAACCCGAAAGATGAAATCAGCCTGAACTCTGGCAAACCGTTCCGTGAACTGGAATCCGAACTGCTGTCTCGTCGTAAGAAAGACCTGCAACAAATCTATGCTGAAGAGCGTGAAAACTACCTGGGTAAACTGGAACGTGAAATCACCCGTTTCTTTGTGGACCGTGGTTTCCTGGAAATCAAGTCTCCGATCCTGATCCCGCTGGAATACATCGAGCGCATGGGTATTGATAACGACACCGAACTGTCCAAGCAGATTTTCCGTGTGGACAAGAACTTCTGCCTGCGTCCGATGCTGGCACCGAACCTGTACAATTACCTGCGTAAACTGGATCGTGCACTGCCGGACCCGATCAAAATCTTTGAAATCGGTCCATGCTATCGTAAGGAGAGCGACGGTAAAGAACACCTGGAAGAGTTCACTATGCTGAACTTTTGTCAGATGGGTTCTGGCTGCACCCGTGAAAATCTGGAATCTATCATCACCGACTTCCTGAACCACCTGGGCATTGACTTCAAAATCGTTGGTGATTCCTGCATGGTTTTCGGTGACACTCTGGACGTTATGCATGGTGATCTGGAACTGAGCAGCGCTGTTGTGGGTCCGATTCCGCTGGATCGTGAATGGGGTATCGATAAACCGTGGATTGGTGCTGGCTTCGGTCTGGAACGTCTGCTGAAAGTTAAGCACGACTTTAAGAACATCAAACGTGCTGCGCGTTCCGAGTCCTATTACAACGGCATTAGCACTAACCTGTAAGTCGACCAAACAATCCAAAACGCCGCGTTCAGCGGCGTTTTTTCTGCTTTTGCGGCCGCTGTGCTTCTCAAATGCCTGAGGCCAGTTTGCTCAGGCTCTCCCCGTGGAGGTAATAATTGACGATATGATCAGTGCACGGCTAACTAAGCGGCCTGCTGACTTTCTCGCCGATCAAAAGGCATTTTGCTATTAAGGGATTGACGAGGGCGTATCTGCGCAGTAAGATGCGCCCCGCATTGGAAACCTGATCATGTAGATCGAATGGACTCTAAATCCGTTCAGCCGGGTTAGATTCCCGGGGTTTCCGCCAAATTCGAAAAGCCTGCTCAACGAGCAGGCTTTTTTGCATG(SEQ ID NO.:18)
以限制性内切酶AvrII和NotI将序列20从克隆载体pUC57-pylRs(R19H,H29R,T122S,Y384F)上切下,同时以AvrII和NotI将质粒pBAD-araBAD[A1-u4-u5-TEV-R-MiniINS]-glnS[pylRs]-proK[pylT]切开(目的DNA片段为其中4.5kb的大片段),以核酸电泳进行分离,以琼脂糖凝胶DNA回收试剂盒提取,使用T4 DNA Ligase连接,以化学法(CaCl2法)转化大E.coli Top10感受态细胞中,将所述转化的细胞培养在含有卡那素的LB琼脂培养基(10g/L酵母蛋白胨,5g/L酵母浸粉,10g/L NaCl,1.5%琼脂)上37℃培养过夜。挑取单个活菌落,在含有氯霉素的液体LB培养基(10g/L酵母蛋白胨,5g/L酵母浸粉,10g/L NaCl)中37℃220rpm培养过夜。以质粒小量提取试剂盒提取质粒,得到的含有突变型赖氨酰-tRNA合成酶pylRs的质粒命名为pBAD-araBAD[A1-u4-u5-TEV-R-MiniINS]-glnS[pylRs(R19H,H29R,T122S,Y384F)]-proK[pylT],质粒图谱见图3。
根据野生型赖氨酰-tRNA合成酶pylRs的氨基酸序列(SEQ ID NO.:1),引入突变R19H,得到氨基酸序列如SEQ ID NO.:7所示的突变型赖氨酰-tRNA合成酶pylRs(R19H)。并根据大肠杆菌的密码子偏好性,合成了pylRs(R19H)的DNA序列。
根据野生型赖氨酰-tRNA合成酶pylRs的氨基酸序列(SEQ ID NO.:1),引入突变H29R,得到氨基酸序列如SEQ ID NO.:8所示的突变型赖氨酰-tRNA合成酶pylRs(H29R)。并根据大肠杆菌的密码子偏好性,合成了pylRs(H29R)的DNA序列。
根据野生型赖氨酰-tRNA合成酶pylRs的氨基酸序列(SEQ ID NO.:1),引入突变R19H,H29R,得到氨基酸序列如SEQ ID NO.:6所示的突变型赖氨酰-tRNA合成酶pylRs(R19H,H29R)。并根据大肠杆菌的密码子偏好性,合成了pylRs(R19H,H29R)的DNA序列。
根据野生型赖氨酰-tRNA合成酶pylRs的氨基酸序列(SEQ ID NO.:1),引入突变R19H,I26V,H29R,得到氨基酸序列如SEQ ID NO.:3所示的突变型赖氨酰-tRNA合成酶pylRs(R19H,I26V,H29R)。并根据大肠杆菌的密码子偏好性,合成了pylRs(R19H,I26V,H29R)的DNA序列。
按照上述突变型菌株的构建方法,将pylRs(R19H,H29R,T122S,Y384F)的DNA序列分别替换为pylRs(R19H)的DNA序列、pylRs(H29R)的DNA序列、pylRs(R19H,H29R)的DNA序列和pylRs(R19H,I26V,H29R)的DNA序列,分别构建得到质粒pBAD-araBAD[A1-u4-u5-TEV-R-MiniINS]-glnS[pylRs(R19H)]-proK[pylT]、质粒pBAD-araBAD[A1-u4-u5-TEV-R-MiniINS]-glnS[pylRs(H29R)]-proK[pylT]、质粒pBAD-araBAD[A1-u4-u5-TEV-R-MiniINS]-glnS[pylRs(R19H,H29R)]-proK[pylT]和质粒pBAD-araBAD[A1-u4-u5-TEV-R-MiniINS]-glnS[pylRs(R19H,I26V,H29R]-proK[pylT]。
实施例3、叔丁氧羰基(Boc)修饰融合蛋白的高密度表达
将实施例1和实施例2构建的各菌种接种于液体LB培养基中37℃220rpm培养过夜,以1%(v/v)接种罐发酵培养基(12g/L酵母蛋白胨,24g/L酵母浸粉,4mL/L甘油,12.8g/L磷酸氢二钠,3g/L磷酸二氢钾,0.3‰消泡剂),在35(±3)℃,200~1000rpm,空气流量2~6L/min的条件下培养。培养3~10h后,以步进速率流加含甘油和酵母蛋白胨的补料培养基,持续至发酵结束。培养至OD600达到25~80时,加入终浓度0.25%L-ara和终浓度5mM Boc-Lys进行诱导。继续培养至OD600达到180~220时,放罐。然后离心(5000rpm,30min,25℃)收集。以SDS-聚丙烯酰胺电泳对各菌种全细胞中含有Boc修饰赖氨酸的融合蛋白表达情况进行检测。
不同突变酶的融合蛋白表达量如下表:
Figure BDA0002040543680000201
Figure BDA0002040543680000211
融合蛋白是以不可溶的“包涵体”形式表达。为释放包涵体,用高压均质机将大肠杆菌细胞破碎。通过10000g离心法去除核酸、细胞碎片和可溶性蛋白。用纯水洗涤含有融合蛋白的包涵体,所得的包涵体沉淀用作折叠的原材料。
为了使融合蛋白重折叠,将包涵体溶解于pH 10.5并含有2~10mM巯基乙醇的7.5M脲溶液中,使溶解后总蛋白的浓度为10~25mg/mL。将样品稀释5~10倍,在4~8℃,pH为10.5~11.7的条件下进行常规折叠16~30小时。于18~25℃下,pH值维持在8.0~9.5,用胰蛋白酶和羧肽酶B将融合蛋白酶解10~20小时,然后加入0.45M硫酸铵终止酶解反应。反相HPLC分析结果表明,该酶解步骤的收率高于90%。胰蛋白酶与羧肽酶B酶解后获得的胰岛素类似物被命名为BOC-赖氨酸胰岛素。Boc-赖氨酸胰岛素在上述条件下不能被酶解。通过膜过滤澄清样品,以0.45mM硫酸铵作为缓冲液,经疏水层析初纯化,SDS-聚丙烯酰胺凝胶电泳纯度达90%。并且对获得的Boc-人胰岛素进行MALDI-TOF质谱分析,结果检测出其分子量与理论分子量5907.7Da相符合。经疏水层析洗脱收集样品,加入盐酸进行Boc-人胰岛素脱保护反应,加入氢氧化钠溶液控制pH为2.8~3.2以终止反应,再经两步高压反相层析,重组人胰岛素的得率高于85%。
不同突变酶的重组人胰岛素表达量如下表:
Boc人胰岛素的产量(mg/L发酵液)
pylRs 310
R19H 370
H29R 340
R19H,H29R 390
R19H,I26V,H29R 490
R19H,H29R,T122S,Y384F 600
结果表明,利用本发明的突变酶制备含有Boc-赖氨酸的目的蛋白,可显著提高非天然氨基酸插入量和含有非天然氨基酸的目的蛋白量。
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
序列表
<110> 苏州鲲鹏生物技术有限公司
<120> 利用质粒系统在蛋白中引入非天然氨基酸
<130> P2019-0358
<160> 18
<170> SIPOSequenceListing 1.0
<210> 1
<211> 454
<212> PRT
<213> 马氏甲烷八叠球菌(Methanosarcina mazei)
<400> 1
Met Asp Lys Lys Pro Leu Asn Thr Leu Ile Ser Ala Thr Gly Leu Trp
1 5 10 15
Met Ser Arg Thr Gly Thr Ile His Lys Ile Lys His His Glu Val Ser
20 25 30
Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val
35 40 45
Asn Asn Ser Arg Ser Ser Arg Thr Ala Arg Ala Leu Arg His His Lys
50 55 60
Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Asp Glu Asp Leu Asn
65 70 75 80
Lys Phe Leu Thr Lys Ala Asn Glu Asp Gln Thr Ser Val Lys Val Lys
85 90 95
Val Val Ser Ala Pro Thr Arg Thr Lys Lys Ala Met Pro Lys Ser Val
100 105 110
Ala Arg Ala Pro Lys Pro Leu Glu Asn Thr Glu Ala Ala Gln Ala Gln
115 120 125
Pro Ser Gly Ser Lys Phe Ser Pro Ala Ile Pro Val Ser Thr Gln Glu
130 135 140
Ser Val Ser Val Pro Ala Ser Val Ser Thr Ser Ile Ser Ser Ile Ser
145 150 155 160
Thr Gly Ala Thr Ala Ser Ala Leu Val Lys Gly Asn Thr Asn Pro Ile
165 170 175
Thr Ser Met Ser Ala Pro Val Gln Ala Ser Ala Pro Ala Leu Thr Lys
180 185 190
Ser Gln Thr Asp Arg Leu Glu Val Leu Leu Asn Pro Lys Asp Glu Ile
195 200 205
Ser Leu Asn Ser Gly Lys Pro Phe Arg Glu Leu Glu Ser Glu Leu Leu
210 215 220
Ser Arg Arg Lys Lys Asp Leu Gln Gln Ile Tyr Ala Glu Glu Arg Glu
225 230 235 240
Asn Tyr Leu Gly Lys Leu Glu Arg Glu Ile Thr Arg Phe Phe Val Asp
245 250 255
Arg Gly Phe Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Leu Glu Tyr
260 265 270
Ile Glu Arg Met Gly Ile Asp Asn Asp Thr Glu Leu Ser Lys Gln Ile
275 280 285
Phe Arg Val Asp Lys Asn Phe Cys Leu Arg Pro Met Leu Ala Pro Asn
290 295 300
Leu Tyr Asn Tyr Leu Arg Lys Leu Asp Arg Ala Leu Pro Asp Pro Ile
305 310 315 320
Lys Ile Phe Glu Ile Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys
325 330 335
Glu His Leu Glu Glu Phe Thr Met Leu Asn Phe Cys Gln Met Gly Ser
340 345 350
Gly Cys Thr Arg Glu Asn Leu Glu Ser Ile Ile Thr Asp Phe Leu Asn
355 360 365
His Leu Gly Ile Asp Phe Lys Ile Val Gly Asp Ser Cys Met Val Tyr
370 375 380
Gly Asp Thr Leu Asp Val Met His Gly Asp Leu Glu Leu Ser Ser Ala
385 390 395 400
Val Val Gly Pro Ile Pro Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro
405 410 415
Trp Ile Gly Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Lys His
420 425 430
Asp Phe Lys Asn Ile Lys Arg Ala Ala Arg Ser Glu Ser Tyr Tyr Asn
435 440 445
Gly Ile Ser Thr Asn Leu
450
<210> 2
<211> 454
<212> PRT
<213> 巴氏甲烷八叠球菌(Methanosarcina barkeri)
<400> 2
Met Asp Lys Lys Pro Leu Asn Thr Leu Ile Ser Ala Thr Gly Leu Trp
1 5 10 15
Met Ser Arg Thr Gly Thr Ile His Lys Ile Lys His His Glu Val Ser
20 25 30
Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val
35 40 45
Asn Asn Ser Arg Ser Ser Arg Thr Ala Arg Ala Leu Arg His His Lys
50 55 60
Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Asp Glu Asp Leu Asn
65 70 75 80
Lys Phe Leu Thr Lys Ala Asn Glu Asp Gln Thr Ser Val Lys Val Lys
85 90 95
Val Val Ser Ala Pro Thr Arg Thr Lys Lys Ala Met Pro Lys Ser Val
100 105 110
Ala Arg Ala Pro Lys Pro Leu Glu Asn Thr Glu Ala Ala Gln Ala Gln
115 120 125
Pro Ser Gly Ser Lys Phe Ser Pro Ala Ile Pro Val Ser Thr Gln Glu
130 135 140
Ser Val Ser Val Pro Ala Ser Val Ser Thr Ser Ile Ser Ser Ile Ser
145 150 155 160
Thr Gly Ala Thr Ala Ser Ala Leu Val Lys Gly Asn Thr Asn Pro Ile
165 170 175
Thr Ser Met Ser Ala Pro Val Gln Ala Ser Ala Pro Ala Leu Thr Lys
180 185 190
Ser Gln Thr Asp Arg Leu Glu Val Leu Leu Asn Pro Lys Asp Glu Ile
195 200 205
Ser Leu Asn Ser Gly Lys Pro Phe Arg Glu Leu Glu Ser Glu Leu Leu
210 215 220
Ser Arg Arg Lys Lys Asp Leu Gln Gln Ile Tyr Ala Glu Glu Arg Glu
225 230 235 240
Asn Tyr Leu Gly Lys Leu Glu Arg Glu Ile Thr Arg Phe Phe Val Asp
245 250 255
Arg Gly Phe Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Leu Glu Tyr
260 265 270
Ile Glu Arg Met Gly Ile Asp Asn Asp Thr Glu Leu Ser Lys Gln Ile
275 280 285
Phe Arg Val Asp Lys Asn Phe Cys Leu Arg Pro Met Leu Ala Pro Asn
290 295 300
Leu Tyr Asn Tyr Leu Arg Lys Leu Asp Arg Ala Leu Pro Asp Pro Ile
305 310 315 320
Lys Ile Phe Glu Ile Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys
325 330 335
Glu His Leu Glu Glu Phe Thr Met Leu Asn Phe Cys Gln Met Gly Ser
340 345 350
Gly Cys Thr Arg Glu Asn Leu Glu Ser Ile Ile Thr Asp Phe Leu Asn
355 360 365
His Leu Gly Ile Asp Phe Lys Ile Val Gly Asp Ser Cys Met Val Tyr
370 375 380
Gly Asp Thr Leu Asp Val Met His Gly Asp Leu Glu Leu Ser Ser Ala
385 390 395 400
Val Val Gly Pro Ile Pro Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro
405 410 415
Trp Ile Gly Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Lys His
420 425 430
Asp Phe Lys Asn Ile Lys Arg Ala Ala Arg Ser Gly Ser Tyr Tyr Asn
435 440 445
Gly Ile Ser Thr Asn Leu
450
<210> 3
<211> 454
<212> PRT
<213> 人工序列(artificial sequence)
<400> 3
Met Asp Lys Lys Pro Leu Asn Thr Leu Ile Ser Ala Thr Gly Leu Trp
1 5 10 15
Met Ser His Thr Gly Thr Ile His Lys Val Lys His Arg Glu Val Ser
20 25 30
Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val
35 40 45
Asn Asn Ser Arg Ser Ser Arg Thr Ala Arg Ala Leu Arg His His Lys
50 55 60
Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Asp Glu Asp Leu Asn
65 70 75 80
Lys Phe Leu Thr Lys Ala Asn Glu Asp Gln Thr Ser Val Lys Val Lys
85 90 95
Val Val Ser Ala Pro Thr Arg Thr Lys Lys Ala Met Pro Lys Ser Val
100 105 110
Ala Arg Ala Pro Lys Pro Leu Glu Asn Thr Glu Ala Ala Gln Ala Gln
115 120 125
Pro Ser Gly Ser Lys Phe Ser Pro Ala Ile Pro Val Ser Thr Gln Glu
130 135 140
Ser Val Ser Val Pro Ala Ser Val Ser Thr Ser Ile Ser Ser Ile Ser
145 150 155 160
Thr Gly Ala Thr Ala Ser Ala Leu Val Lys Gly Asn Thr Asn Pro Ile
165 170 175
Thr Ser Met Ser Ala Pro Val Gln Ala Ser Ala Pro Ala Leu Thr Lys
180 185 190
Ser Gln Thr Asp Arg Leu Glu Val Leu Leu Asn Pro Lys Asp Glu Ile
195 200 205
Ser Leu Asn Ser Gly Lys Pro Phe Arg Glu Leu Glu Ser Glu Leu Leu
210 215 220
Ser Arg Arg Lys Lys Asp Leu Gln Gln Ile Tyr Ala Glu Glu Arg Glu
225 230 235 240
Asn Tyr Leu Gly Lys Leu Glu Arg Glu Ile Thr Arg Phe Phe Val Asp
245 250 255
Arg Gly Phe Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Leu Glu Tyr
260 265 270
Ile Glu Arg Met Gly Ile Asp Asn Asp Thr Glu Leu Ser Lys Gln Ile
275 280 285
Phe Arg Val Asp Lys Asn Phe Cys Leu Arg Pro Met Leu Ala Pro Asn
290 295 300
Leu Tyr Asn Tyr Leu Arg Lys Leu Asp Arg Ala Leu Pro Asp Pro Ile
305 310 315 320
Lys Ile Phe Glu Ile Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys
325 330 335
Glu His Leu Glu Glu Phe Thr Met Leu Asn Phe Cys Gln Met Gly Ser
340 345 350
Gly Cys Thr Arg Glu Asn Leu Glu Ser Ile Ile Thr Asp Phe Leu Asn
355 360 365
His Leu Gly Ile Asp Phe Lys Ile Val Gly Asp Ser Cys Met Val Tyr
370 375 380
Gly Asp Thr Leu Asp Val Met His Gly Asp Leu Glu Leu Ser Ser Ala
385 390 395 400
Val Val Gly Pro Ile Pro Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro
405 410 415
Trp Ile Gly Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Lys His
420 425 430
Asp Phe Lys Asn Ile Lys Arg Ala Ala Arg Ser Glu Ser Tyr Tyr Asn
435 440 445
Gly Ile Ser Thr Asn Leu
450
<210> 4
<211> 454
<212> PRT
<213> 人工序列(artificial sequence)
<400> 4
Met Asp Lys Lys Pro Leu Asn Thr Leu Ile Ser Ala Thr Gly Leu Trp
1 5 10 15
Met Ser His Thr Gly Thr Ile His Lys Ile Lys His Arg Glu Val Ser
20 25 30
Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val
35 40 45
Asn Asn Ser Arg Ser Ser Arg Thr Ala Arg Ala Leu Arg His His Lys
50 55 60
Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Asp Glu Asp Leu Asn
65 70 75 80
Lys Phe Leu Thr Lys Ala Asn Glu Asp Gln Thr Ser Val Lys Val Lys
85 90 95
Val Val Ser Ala Pro Thr Arg Thr Lys Lys Ala Met Pro Lys Ser Val
100 105 110
Ala Arg Ala Pro Lys Pro Leu Glu Asn Ser Glu Ala Ala Gln Ala Gln
115 120 125
Pro Ser Gly Ser Lys Phe Ser Pro Ala Ile Pro Val Ser Thr Gln Glu
130 135 140
Ser Val Ser Val Pro Ala Ser Val Ser Thr Ser Ile Ser Ser Ile Ser
145 150 155 160
Thr Gly Ala Thr Ala Ser Ala Leu Val Lys Gly Asn Thr Asn Pro Ile
165 170 175
Thr Ser Met Ser Ala Pro Val Gln Ala Ser Ala Pro Ala Leu Thr Lys
180 185 190
Ser Gln Thr Asp Arg Leu Glu Val Leu Leu Asn Pro Lys Asp Glu Ile
195 200 205
Ser Leu Asn Ser Gly Lys Pro Phe Arg Glu Leu Glu Ser Glu Leu Leu
210 215 220
Ser Arg Arg Lys Lys Asp Leu Gln Gln Ile Tyr Ala Glu Glu Arg Glu
225 230 235 240
Asn Tyr Leu Gly Lys Leu Glu Arg Glu Ile Thr Arg Phe Phe Val Asp
245 250 255
Arg Gly Phe Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Leu Glu Tyr
260 265 270
Ile Glu Arg Met Gly Ile Asp Asn Asp Thr Glu Leu Ser Lys Gln Ile
275 280 285
Phe Arg Val Asp Lys Asn Phe Cys Leu Arg Pro Met Leu Ala Pro Asn
290 295 300
Leu Tyr Asn Tyr Leu Arg Lys Leu Asp Arg Ala Leu Pro Asp Pro Ile
305 310 315 320
Lys Ile Phe Glu Ile Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys
325 330 335
Glu His Leu Glu Glu Phe Thr Met Leu Asn Phe Cys Gln Met Gly Ser
340 345 350
Gly Cys Thr Arg Glu Asn Leu Glu Ser Ile Ile Thr Asp Phe Leu Asn
355 360 365
His Leu Gly Ile Asp Phe Lys Ile Val Gly Asp Ser Cys Met Val Phe
370 375 380
Gly Asp Thr Leu Asp Val Met His Gly Asp Leu Glu Leu Ser Ser Ala
385 390 395 400
Val Val Gly Pro Ile Pro Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro
405 410 415
Trp Ile Gly Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Lys His
420 425 430
Asp Phe Lys Asn Ile Lys Arg Ala Ala Arg Ser Glu Ser Tyr Tyr Asn
435 440 445
Gly Ile Ser Thr Asn Leu
450
<210> 5
<211> 454
<212> PRT
<213> 人工序列(artificial sequence)
<400> 5
Met Asp Lys Lys Pro Leu Asn Thr Leu Ile Ser Ala Thr Gly Leu Trp
1 5 10 15
Met Ser His Thr Gly Thr Ile His Lys Ile Lys His Arg Glu Val Ser
20 25 30
Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val
35 40 45
Asn Asn Ser Arg Ser Ser Arg Thr Ala Arg Ala Leu Arg His His Lys
50 55 60
Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Asp Glu Asp Leu Asn
65 70 75 80
Lys Phe Leu Thr Lys Ala Asn Glu Asp Gln Thr Ser Val Lys Val Lys
85 90 95
Val Val Ser Ala Pro Thr Arg Thr Lys Lys Ala Met Pro Lys Ser Val
100 105 110
Ala Arg Ala Pro Lys Pro Leu Glu Asn Thr Glu Ala Ala Gln Ala Gln
115 120 125
Pro Ser Gly Ser Lys Phe Ser Pro Ala Ile Pro Val Ser Thr Gln Glu
130 135 140
Ser Val Ser Val Pro Ala Ser Val Ser Thr Ser Ile Ser Ser Ile Ser
145 150 155 160
Thr Gly Ala Thr Ala Ser Ala Leu Val Lys Gly Asn Thr Asn Pro Ile
165 170 175
Thr Ser Met Ser Ala Pro Val Gln Ala Ser Ala Pro Ala Leu Thr Lys
180 185 190
Ser Gln Thr Asp Arg Leu Glu Val Leu Leu Asn Pro Lys Asp Glu Ile
195 200 205
Ser Leu Asn Ser Gly Lys Pro Phe Arg Glu Leu Glu Ser Glu Leu Leu
210 215 220
Ser Arg Arg Lys Lys Asp Leu Gln Gln Ile Tyr Ala Glu Glu Arg Glu
225 230 235 240
Asn Tyr Leu Gly Lys Leu Glu Arg Glu Ile Thr Arg Phe Phe Val Asp
245 250 255
Arg Gly Phe Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Leu Glu Tyr
260 265 270
Ile Glu Arg Met Gly Ile Asp Asn Asp Thr Glu Leu Ser Lys Gln Ile
275 280 285
Phe Arg Val Asp Lys Asn Phe Cys Leu Arg Pro Met Leu Ala Pro Asn
290 295 300
Leu Tyr Asn Tyr Ala Arg Lys Leu Asp Arg Ala Leu Pro Asp Pro Ile
305 310 315 320
Lys Ile Phe Glu Ile Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys
325 330 335
Glu His Leu Glu Glu Phe Thr Met Leu Asn Phe Ser Gln Met Gly Ser
340 345 350
Gly Cys Thr Arg Glu Asn Leu Glu Ser Ile Ile Thr Asp Phe Leu Asn
355 360 365
His Leu Gly Ile Asp Phe Lys Ile Val Gly Asp Ser Cys Met Val Tyr
370 375 380
Gly Asp Thr Leu Asp Val Met His Gly Asp Leu Glu Leu Ser Ser Ala
385 390 395 400
Val Val Gly Pro Ile Pro Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro
405 410 415
Trp Ile Gly Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Lys His
420 425 430
Asp Phe Lys Asn Ile Lys Arg Ala Ala Arg Ser Glu Ser Tyr Tyr Asn
435 440 445
Gly Ile Ser Thr Asn Leu
450
<210> 6
<211> 454
<212> PRT
<213> 人工序列(artificial sequence)
<400> 6
Met Asp Lys Lys Pro Leu Asn Thr Leu Ile Ser Ala Thr Gly Leu Trp
1 5 10 15
Met Ser His Thr Gly Thr Ile His Lys Ile Lys His Arg Glu Val Ser
20 25 30
Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val
35 40 45
Asn Asn Ser Arg Ser Ser Arg Thr Ala Arg Ala Leu Arg His His Lys
50 55 60
Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Asp Glu Asp Leu Asn
65 70 75 80
Lys Phe Leu Thr Lys Ala Asn Glu Asp Gln Thr Ser Val Lys Val Lys
85 90 95
Val Val Ser Ala Pro Thr Arg Thr Lys Lys Ala Met Pro Lys Ser Val
100 105 110
Ala Arg Ala Pro Lys Pro Leu Glu Asn Thr Glu Ala Ala Gln Ala Gln
115 120 125
Pro Ser Gly Ser Lys Phe Ser Pro Ala Ile Pro Val Ser Thr Gln Glu
130 135 140
Ser Val Ser Val Pro Ala Ser Val Ser Thr Ser Ile Ser Ser Ile Ser
145 150 155 160
Thr Gly Ala Thr Ala Ser Ala Leu Val Lys Gly Asn Thr Asn Pro Ile
165 170 175
Thr Ser Met Ser Ala Pro Val Gln Ala Ser Ala Pro Ala Leu Thr Lys
180 185 190
Ser Gln Thr Asp Arg Leu Glu Val Leu Leu Asn Pro Lys Asp Glu Ile
195 200 205
Ser Leu Asn Ser Gly Lys Pro Phe Arg Glu Leu Glu Ser Glu Leu Leu
210 215 220
Ser Arg Arg Lys Lys Asp Leu Gln Gln Ile Tyr Ala Glu Glu Arg Glu
225 230 235 240
Asn Tyr Leu Gly Lys Leu Glu Arg Glu Ile Thr Arg Phe Phe Val Asp
245 250 255
Arg Gly Phe Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Leu Glu Tyr
260 265 270
Ile Glu Arg Met Gly Ile Asp Asn Asp Thr Glu Leu Ser Lys Gln Ile
275 280 285
Phe Arg Val Asp Lys Asn Phe Cys Leu Arg Pro Met Leu Ala Pro Asn
290 295 300
Leu Tyr Asn Tyr Leu Arg Lys Leu Asp Arg Ala Leu Pro Asp Pro Ile
305 310 315 320
Lys Ile Phe Glu Ile Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys
325 330 335
Glu His Leu Glu Glu Phe Thr Met Leu Asn Phe Cys Gln Met Gly Ser
340 345 350
Gly Cys Thr Arg Glu Asn Leu Glu Ser Ile Ile Thr Asp Phe Leu Asn
355 360 365
His Leu Gly Ile Asp Phe Lys Ile Val Gly Asp Ser Cys Met Val Tyr
370 375 380
Gly Asp Thr Leu Asp Val Met His Gly Asp Leu Glu Leu Ser Ser Ala
385 390 395 400
Val Val Gly Pro Ile Pro Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro
405 410 415
Trp Ile Gly Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Lys His
420 425 430
Asp Phe Lys Asn Ile Lys Arg Ala Ala Arg Ser Glu Ser Tyr Tyr Asn
435 440 445
Gly Ile Ser Thr Asn Leu
450
<210> 7
<211> 454
<212> PRT
<213> 人工序列(artificial sequence)
<400> 7
Met Asp Lys Lys Pro Leu Asn Thr Leu Ile Ser Ala Thr Gly Leu Trp
1 5 10 15
Met Ser His Thr Gly Thr Ile His Lys Ile Lys His His Glu Val Ser
20 25 30
Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val
35 40 45
Asn Asn Ser Arg Ser Ser Arg Thr Ala Arg Ala Leu Arg His His Lys
50 55 60
Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Asp Glu Asp Leu Asn
65 70 75 80
Lys Phe Leu Thr Lys Ala Asn Glu Asp Gln Thr Ser Val Lys Val Lys
85 90 95
Val Val Ser Ala Pro Thr Arg Thr Lys Lys Ala Met Pro Lys Ser Val
100 105 110
Ala Arg Ala Pro Lys Pro Leu Glu Asn Thr Glu Ala Ala Gln Ala Gln
115 120 125
Pro Ser Gly Ser Lys Phe Ser Pro Ala Ile Pro Val Ser Thr Gln Glu
130 135 140
Ser Val Ser Val Pro Ala Ser Val Ser Thr Ser Ile Ser Ser Ile Ser
145 150 155 160
Thr Gly Ala Thr Ala Ser Ala Leu Val Lys Gly Asn Thr Asn Pro Ile
165 170 175
Thr Ser Met Ser Ala Pro Val Gln Ala Ser Ala Pro Ala Leu Thr Lys
180 185 190
Ser Gln Thr Asp Arg Leu Glu Val Leu Leu Asn Pro Lys Asp Glu Ile
195 200 205
Ser Leu Asn Ser Gly Lys Pro Phe Arg Glu Leu Glu Ser Glu Leu Leu
210 215 220
Ser Arg Arg Lys Lys Asp Leu Gln Gln Ile Tyr Ala Glu Glu Arg Glu
225 230 235 240
Asn Tyr Leu Gly Lys Leu Glu Arg Glu Ile Thr Arg Phe Phe Val Asp
245 250 255
Arg Gly Phe Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Leu Glu Tyr
260 265 270
Ile Glu Arg Met Gly Ile Asp Asn Asp Thr Glu Leu Ser Lys Gln Ile
275 280 285
Phe Arg Val Asp Lys Asn Phe Cys Leu Arg Pro Met Leu Ala Pro Asn
290 295 300
Leu Tyr Asn Tyr Leu Arg Lys Leu Asp Arg Ala Leu Pro Asp Pro Ile
305 310 315 320
Lys Ile Phe Glu Ile Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys
325 330 335
Glu His Leu Glu Glu Phe Thr Met Leu Asn Phe Cys Gln Met Gly Ser
340 345 350
Gly Cys Thr Arg Glu Asn Leu Glu Ser Ile Ile Thr Asp Phe Leu Asn
355 360 365
His Leu Gly Ile Asp Phe Lys Ile Val Gly Asp Ser Cys Met Val Tyr
370 375 380
Gly Asp Thr Leu Asp Val Met His Gly Asp Leu Glu Leu Ser Ser Ala
385 390 395 400
Val Val Gly Pro Ile Pro Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro
405 410 415
Trp Ile Gly Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Lys His
420 425 430
Asp Phe Lys Asn Ile Lys Arg Ala Ala Arg Ser Glu Ser Tyr Tyr Asn
435 440 445
Gly Ile Ser Thr Asn Leu
450
<210> 8
<211> 454
<212> PRT
<213> 人工序列(artificial sequence)
<400> 8
Met Asp Lys Lys Pro Leu Asn Thr Leu Ile Ser Ala Thr Gly Leu Trp
1 5 10 15
Met Ser Arg Thr Gly Thr Ile His Lys Ile Lys His Arg Glu Val Ser
20 25 30
Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val
35 40 45
Asn Asn Ser Arg Ser Ser Arg Thr Ala Arg Ala Leu Arg His His Lys
50 55 60
Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Asp Glu Asp Leu Asn
65 70 75 80
Lys Phe Leu Thr Lys Ala Asn Glu Asp Gln Thr Ser Val Lys Val Lys
85 90 95
Val Val Ser Ala Pro Thr Arg Thr Lys Lys Ala Met Pro Lys Ser Val
100 105 110
Ala Arg Ala Pro Lys Pro Leu Glu Asn Thr Glu Ala Ala Gln Ala Gln
115 120 125
Pro Ser Gly Ser Lys Phe Ser Pro Ala Ile Pro Val Ser Thr Gln Glu
130 135 140
Ser Val Ser Val Pro Ala Ser Val Ser Thr Ser Ile Ser Ser Ile Ser
145 150 155 160
Thr Gly Ala Thr Ala Ser Ala Leu Val Lys Gly Asn Thr Asn Pro Ile
165 170 175
Thr Ser Met Ser Ala Pro Val Gln Ala Ser Ala Pro Ala Leu Thr Lys
180 185 190
Ser Gln Thr Asp Arg Leu Glu Val Leu Leu Asn Pro Lys Asp Glu Ile
195 200 205
Ser Leu Asn Ser Gly Lys Pro Phe Arg Glu Leu Glu Ser Glu Leu Leu
210 215 220
Ser Arg Arg Lys Lys Asp Leu Gln Gln Ile Tyr Ala Glu Glu Arg Glu
225 230 235 240
Asn Tyr Leu Gly Lys Leu Glu Arg Glu Ile Thr Arg Phe Phe Val Asp
245 250 255
Arg Gly Phe Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Leu Glu Tyr
260 265 270
Ile Glu Arg Met Gly Ile Asp Asn Asp Thr Glu Leu Ser Lys Gln Ile
275 280 285
Phe Arg Val Asp Lys Asn Phe Cys Leu Arg Pro Met Leu Ala Pro Asn
290 295 300
Leu Tyr Asn Tyr Leu Arg Lys Leu Asp Arg Ala Leu Pro Asp Pro Ile
305 310 315 320
Lys Ile Phe Glu Ile Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys
325 330 335
Glu His Leu Glu Glu Phe Thr Met Leu Asn Phe Cys Gln Met Gly Ser
340 345 350
Gly Cys Thr Arg Glu Asn Leu Glu Ser Ile Ile Thr Asp Phe Leu Asn
355 360 365
His Leu Gly Ile Asp Phe Lys Ile Val Gly Asp Ser Cys Met Val Tyr
370 375 380
Gly Asp Thr Leu Asp Val Met His Gly Asp Leu Glu Leu Ser Ser Ala
385 390 395 400
Val Val Gly Pro Ile Pro Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro
405 410 415
Trp Ile Gly Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Lys His
420 425 430
Asp Phe Lys Asn Ile Lys Arg Ala Ala Arg Ser Glu Ser Tyr Tyr Asn
435 440 445
Gly Ile Ser Thr Asn Leu
450
<210> 9
<211> 454
<212> PRT
<213> 人工序列(artificial sequence)
<400> 9
Met Asp Lys Lys Pro Leu Asn Thr Leu Ile Ser Ala Thr Gly Leu Trp
1 5 10 15
Met Ser Lys Thr Gly Thr Ile His Lys Ile Lys His Lys Glu Val Ser
20 25 30
Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val
35 40 45
Asn Asn Ser Arg Ser Ser Arg Thr Ala Arg Ala Leu Arg His His Lys
50 55 60
Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Asp Glu Asp Leu Asn
65 70 75 80
Lys Phe Leu Thr Lys Ala Asn Glu Asp Gln Thr Ser Val Lys Val Lys
85 90 95
Val Val Ser Ala Pro Thr Arg Thr Lys Lys Ala Met Pro Lys Ser Val
100 105 110
Ala Arg Ala Pro Lys Pro Leu Glu Asn Thr Glu Ala Ala Gln Ala Gln
115 120 125
Pro Ser Gly Ser Lys Phe Ser Pro Ala Ile Pro Val Ser Thr Gln Glu
130 135 140
Ser Val Ser Val Pro Ala Ser Val Ser Thr Ser Ile Ser Ser Ile Ser
145 150 155 160
Thr Gly Ala Thr Ala Ser Ala Leu Val Lys Gly Asn Thr Asn Pro Ile
165 170 175
Thr Ser Met Ser Ala Pro Val Gln Ala Ser Ala Pro Ala Leu Thr Lys
180 185 190
Ser Gln Thr Asp Arg Leu Glu Val Leu Leu Asn Pro Lys Asp Glu Ile
195 200 205
Ser Leu Asn Ser Gly Lys Pro Phe Arg Glu Leu Glu Ser Glu Leu Leu
210 215 220
Ser Arg Arg Lys Lys Asp Leu Gln Gln Ile Tyr Ala Glu Glu Arg Glu
225 230 235 240
Asn Tyr Leu Gly Lys Leu Glu Arg Glu Ile Thr Arg Phe Phe Val Asp
245 250 255
Arg Gly Phe Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Leu Glu Tyr
260 265 270
Ile Glu Arg Met Gly Ile Asp Asn Asp Thr Glu Leu Ser Lys Gln Ile
275 280 285
Phe Arg Val Asp Lys Asn Phe Cys Leu Arg Pro Met Leu Ala Pro Asn
290 295 300
Leu Tyr Asn Tyr Leu Arg Lys Leu Asp Arg Ala Leu Pro Asp Pro Ile
305 310 315 320
Lys Ile Phe Glu Ile Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys
325 330 335
Glu His Leu Glu Glu Phe Thr Met Leu Asn Phe Cys Gln Met Gly Ser
340 345 350
Gly Cys Thr Arg Glu Asn Leu Glu Ser Ile Ile Thr Asp Phe Leu Asn
355 360 365
His Leu Gly Ile Asp Phe Lys Ile Val Gly Asp Ser Cys Met Val Tyr
370 375 380
Gly Asp Thr Leu Asp Val Met His Gly Asp Leu Glu Leu Ser Ser Ala
385 390 395 400
Val Val Gly Pro Ile Pro Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro
405 410 415
Trp Ile Gly Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Lys His
420 425 430
Asp Phe Lys Asn Ile Lys Arg Ala Ala Arg Ser Glu Ser Tyr Tyr Asn
435 440 445
Gly Ile Ser Thr Asn Leu
450
<210> 10
<211> 72
<212> DNA
<213> 人工序列(artificial sequence)
<400> 10
ggaaacctga tcatgtagat cgaatggact ctaaatccgt tcagccgggt tagattcccg 60
gggtttccgc ca 72
<210> 11
<211> 96
<212> PRT
<213> 人工序列(artificial sequence)
<400> 11
Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Tyr Val Gln Glu
1 5 10 15
Arg Thr Ile Ser Phe Lys Asp Thr Tyr Lys Thr Arg Ala Glu Val Lys
20 25 30
Phe Glu Gly Asp Glu Asn Leu Tyr Phe Gln Gly Arg Phe Val Asn Gln
35 40 45
His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly
50 55 60
Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr Arg Gly Ile Val Glu Gln
65 70 75 80
Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Asn
85 90 95
<210> 12
<211> 291
<212> DNA
<213> 人工序列(artificial sequence)
<400> 12
atggttagca aaggtgaaga actgtttacc ggcgtttatg tgcaggaacg taccattagc 60
ttcaaagata cctataaaac ccgtgcggaa gttaaatttg aaggcgatga aaacctgtat 120
tttcagggac gtttcgttaa ccaacacctg tgcggcagcc acctggtaga ggcactgtat 180
ctggtttgtg gtgaacgtgg cttcttctat actccgtaga ctcgtggtat cgtggaacag 240
tgttgcactt ctatttgctc tctgtatcag ctggaaaatt actgtaatta a 291
<210> 13
<211> 72
<212> DNA
<213> 人工序列(artificial sequence)
<400> 13
ttttaaaaaa ctaacagttg tcagcctgtc ccgctttaat atcatacgcc gttatacgtt 60
gtttacgctt tg 72
<210> 14
<211> 45
<212> DNA
<213> 人工序列(artificial sequence)
<400> 14
caaacaatcc aaaacgccgc gttcagcggc gttttttctg ctttt 45
<210> 15
<211> 151
<212> DNA
<213> 人工序列(artificial sequence)
<400> 15
tgtgcttctc aaatgcctga ggccagtttg ctcaggctct ccccgtggag gtaataattg 60
acgatatgat cagtgcacgg ctaactaagc ggcctgctga ctttctcgcc gatcaaaagg 120
cattttgcta ttaagggatt gacgagggcg t 151
<210> 16
<211> 40
<212> DNA
<213> 人工序列(artificial sequence)
<400> 16
aattcgaaaa gcctgctcaa cgagcaggct tttttgcatg 40
<210> 17
<211> 1798
<212> DNA
<213> 人工序列(artificial sequence)
<400> 17
ttttaaaaaa ctaacagttg tcagcctgtc ccgctttaat atcatacgcc gttatacgtt 60
gtttacgctt tgaggaatcc catatggata agaaaccgct gaatactctg atttctgcaa 120
ctggtctgtg gatgagccgt accggcacca tccacaagat caaacaccac gaggtttccc 180
gtagcaaaat ctacatcgaa atggcgtgcg gtgaccacct ggtggtaaac aactcccgtt 240
cttctcgtac tgcacgtgct ctgcgccacc acaagtaccg taagacctgc aagcgctgtc 300
gcgtgtctga tgaagacctg aacaaattcc tgactaaagc gaacgaagat cagacttctg 360
tgaaggtgaa agttgtttct gccccaaccc gcaccaagaa agcgatgccg aagtccgttg 420
cacgcgctcc gaaaccgctg gagaacaccg aagccgcaca ggcccagccg tctggttcta 480
agttttctcc ggcaatcccg gtttctactc aggagtctgt gtctgtgcca gcttctgtta 540
gcacttctat ttcctctatc agcactggtg cgactgcgtc cgctctggta aaaggtaaca 600
ctaacccgat caccagcatg tctgctccgg ttcaggcttc tgcaccggca ctgactaaaa 660
gccagactga ccgtctggag gttctgctga acccgaaaga tgaaatcagc ctgaactctg 720
gcaaaccgtt ccgtgaactg gaatccgaac tgctgtctcg tcgtaagaaa gacctgcaac 780
aaatctatgc tgaagagcgt gaaaactacc tgggtaaact ggaacgtgaa atcacccgtt 840
tctttgtgga ccgtggtttc ctggaaatca agtctccgat cctgatcccg ctggaataca 900
tcgagcgcat gggtattgat aacgacaccg aactgtccaa gcagattttc cgtgtggaca 960
agaacttctg cctgcgtccg atgctggcac cgaacctgta caattacctg cgtaaactgg 1020
atcgtgcact gccggacccg atcaaaatct ttgaaatcgg tccatgctat cgtaaggaga 1080
gcgacggtaa agaacacctg gaagagttca ctatgctgaa cttttgtcag atgggttctg 1140
gctgcacccg tgaaaatctg gaatctatca tcaccgactt cctgaaccac ctgggcattg 1200
acttcaaaat cgttggtgat tcctgcatgg tttacggtga cactctggac gttatgcatg 1260
gtgatctgga actgagcagc gctgttgtgg gtccgattcc gctggatcgt gaatggggta 1320
tcgataaacc gtggattggt gctggcttcg gtctggaacg tctgctgaaa gttaagcacg 1380
actttaagaa catcaaacgt gctgcgcgtt ccgagtccta ttacaacggc attagcacta 1440
acctgtaagt cgaccaaaca atccaaaacg ccgcgttcag cggcgttttt tctgcttttg 1500
cggccgctgt gcttctcaaa tgcctgaggc cagtttgctc aggctctccc cgtggaggta 1560
ataattgacg atatgatcag tgcacggcta actaagcggc ctgctgactt tctcgccgat 1620
caaaaggcat tttgctatta agggattgac gagggcgtat ctgcgcagta agatgcgccc 1680
cgcattggaa acctgatcat gtagatcgaa tggactctaa atccgttcag ccgggttaga 1740
ttcccggggt ttccgccaaa ttcgaaaagc ctgctcaacg agcaggcttt tttgcatg 1798
<210> 18
<211> 1798
<212> DNA
<213> 人工序列(artificial sequence)
<400> 18
ttttaaaaaa ctaacagttg tcagcctgtc ccgctttaat atcatacgcc gttatacgtt 60
gtttacgctt tgaggaatcc catatggata agaaaccgct gaatactctg atttctgcaa 120
ctggtctgtg gatgagccat accggcacca tccacaagat caaacaccgc gaggtttccc 180
gaagcaaaat ctacatcgaa atggcgtgcg gtgaccacct ggtggtaaac aactcccgtt 240
cttctcgtac tgcacgtgct ctgcgccacc acaagtaccg taagacctgc aagcgctgtc 300
gcgtgtctga tgaagacctg aacaaattcc tgactaaagc gaacgaagat cagacttctg 360
tgaaggtgaa agttgtttct gccccaaccc gcaccaagaa agcgatgccg aagtccgttg 420
cacgcgctcc gaaaccgctg gagaactccg aagccgcaca ggcccagccg tctggttcta 480
agttttctcc ggcaatcccg gtttctactc aggagtctgt gtctgtgcca gcttctgtta 540
gcacttctat ttcctctatc agcactggtg cgactgcgtc cgctctggta aaaggtaaca 600
ctaacccgat caccagcatg tctgctccgg ttcaggcttc tgcaccggca ctgactaaaa 660
gccagactga ccgtctggag gttctgctga acccgaaaga tgaaatcagc ctgaactctg 720
gcaaaccgtt ccgtgaactg gaatccgaac tgctgtctcg tcgtaagaaa gacctgcaac 780
aaatctatgc tgaagagcgt gaaaactacc tgggtaaact ggaacgtgaa atcacccgtt 840
tctttgtgga ccgtggtttc ctggaaatca agtctccgat cctgatcccg ctggaataca 900
tcgagcgcat gggtattgat aacgacaccg aactgtccaa gcagattttc cgtgtggaca 960
agaacttctg cctgcgtccg atgctggcac cgaacctgta caattacctg cgtaaactgg 1020
atcgtgcact gccggacccg atcaaaatct ttgaaatcgg tccatgctat cgtaaggaga 1080
gcgacggtaa agaacacctg gaagagttca ctatgctgaa cttttgtcag atgggttctg 1140
gctgcacccg tgaaaatctg gaatctatca tcaccgactt cctgaaccac ctgggcattg 1200
acttcaaaat cgttggtgat tcctgcatgg ttttcggtga cactctggac gttatgcatg 1260
gtgatctgga actgagcagc gctgttgtgg gtccgattcc gctggatcgt gaatggggta 1320
tcgataaacc gtggattggt gctggcttcg gtctggaacg tctgctgaaa gttaagcacg 1380
actttaagaa catcaaacgt gctgcgcgtt ccgagtccta ttacaacggc attagcacta 1440
acctgtaagt cgaccaaaca atccaaaacg ccgcgttcag cggcgttttt tctgcttttg 1500
cggccgctgt gcttctcaaa tgcctgaggc cagtttgctc aggctctccc cgtggaggta 1560
ataattgacg atatgatcag tgcacggcta actaagcggc ctgctgactt tctcgccgat 1620
caaaaggcat tttgctatta agggattgac gagggcgtat ctgcgcagta agatgcgccc 1680
cgcattggaa acctgatcat gtagatcgaa tggactctaa atccgttcag ccgggttaga 1740
ttcccggggt ttccgccaaa ttcgaaaagc ctgctcaacg agcaggcttt tttgcatg 1798

Claims (10)

1.一种质粒系统,其特征在于,所述质粒系统含有:
(1)第一表达盒,所述第一表达盒含有编码目的蛋白的第一编码序列,所述第一编码序列中含有用于引入预定的修饰氨基酸的天然密码子,所述天然密码子为UAG(琥珀)、UAA(赭石)、或UGA(蛋白石);和
(2)第二表达盒,所述第二表达盒含有编码氨酰基-tRNA合成酶的第二编码序列;
(3)第三表达盒,所述第三表达盒含有编码人工tRNA的第三编码序列,其中所述人工tRNA含有对应于所述天然密码子的反密码子;
并且所述的氨酰基-tRNA合成酶特异性催化所述人工tRNA形成“人工tRNA-Xa”复合物,其中Xa为氨酰基形式的所述预定的修饰氨基酸。
2.如权利要求1所述的质粒系统,其特征在于,所述修饰氨基酸选自下组:炔基氧羰基赖氨酸衍生物、叔丁氧羰基(BOC)-赖氨酸衍生物、脂肪酰化赖氨酸衍生物、或其组合。
3.如权利要求1所述的质粒系统,其特征在于,所述质粒系统为单质粒系统。
4.如权利要求1所述的质粒系统,其特征在于,所述氨酰基-tRNA合成酶为赖氨酰-tRNA合成酶,较佳地为突变型赖氨酰-tRNA合成酶,更佳地所述突变型赖氨酰-tRNA合成酶在对应于野生型赖氨酰-tRNA合成酶的氨基酸序列中第19位精氨酸(R)和/或第29位组氨酸(H)发生突变。
5.如权利要求1所述的质粒系统,其特征在于,所述目的蛋白选自下组:胰岛素、人胰岛素前体蛋白、赖脯胰岛素的前体蛋白、甘精胰岛素的前体蛋白、甲状旁腺素、可的瑞琳、降血钙素、比伐卢定、胰高血糖素样肽及其衍生物艾塞那肽和利拉鲁肽、索玛鲁肽、齐考诺肽、舍莫瑞林、生长瑞林、分泌素、替度鲁肽、水蛭素、生长激素、生长因子、生长激素释放因子、促肾上腺皮质激素、释放因子、德舍瑞林、去氨加压素、依降钙素、胰高血糖素、亮丙瑞林、促黄体激素释放激素、生长激素抑制素、促甲状腺激素释放激素、曲普瑞林、血管活性肠肽、干扰素、甲状旁腺激素、BH3肽、淀粉样变肽、或上述肽的片段、或其组合。
6.如权利要求1所述的质粒系统,其特征在于,所述第一表达盒、第二表达盒和/或第三表达盒还包含一个或多个启动子,所述启动子可操作地与所述第一编码序列、所述第二编码序列、所述第三编码序列、增强子、转录终止信号、多腺苷酸化序列、复制起点、选择性标记、核酸限制性位点、和/或同源重组位点连接。
7.一种宿主细胞或细胞提取液,其特征在于,所述宿主细胞或细胞提取液含有权利要求1所述的质粒系统。
8.一种试剂盒,其特征在于,所述试剂盒含有(a)容器,以及(b)位于所述容器内的权利要求1所述的质粒系统。
9.如权利要求1所述的质粒系统、或权利要求7所述的宿主细胞或细胞提取液、或权利要求8所述的试剂盒的用途,其特征在于,用于制备含预定的修饰氨基酸的蛋白。
10.一种制备含预定的修饰氨基酸的蛋白的方法,其特征在于,所述方法包括步骤:
(1)提供权利要求7所述的宿主细胞或细胞提取液,和
(2)添加所述预定的修饰氨基酸,培养所述细胞或细胞提取液,从而得到含所述预定的修饰氨基酸的蛋白。
CN201910340499.3A 2019-04-25 2019-04-25 利用质粒系统在蛋白中引入非天然氨基酸 Active CN111850020B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910340499.3A CN111850020B (zh) 2019-04-25 2019-04-25 利用质粒系统在蛋白中引入非天然氨基酸

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910340499.3A CN111850020B (zh) 2019-04-25 2019-04-25 利用质粒系统在蛋白中引入非天然氨基酸

Publications (2)

Publication Number Publication Date
CN111850020A true CN111850020A (zh) 2020-10-30
CN111850020B CN111850020B (zh) 2021-05-07

Family

ID=72951541

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910340499.3A Active CN111850020B (zh) 2019-04-25 2019-04-25 利用质粒系统在蛋白中引入非天然氨基酸

Country Status (1)

Country Link
CN (1) CN111850020B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111849929A (zh) * 2019-04-30 2020-10-30 苏州鲲鹏生物技术有限公司 高效引入赖氨酸衍生物的氨酰基—tRNA合成酶
CN114634958A (zh) * 2021-12-22 2022-06-17 清华大学 使用无细胞蛋白质合成体系插入非天然氨基酸的方法
CN114657156A (zh) * 2022-03-11 2022-06-24 南京中医药大学 吡咯赖氨酸氨酰-tRNA合成酶突变体及其筛选系统和应用
WO2023011486A1 (zh) * 2021-08-02 2023-02-09 宁波鲲鹏生物科技有限公司 高效引入赖氨酸衍生物的氨酰基-tRNA合成酶及其应用

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010139948A2 (en) * 2009-06-04 2010-12-09 Medical Research Council Methods
WO2012175924A2 (en) * 2011-06-24 2012-12-27 Medical Research Council Incorporation of substituted lysines into polypeptides
CN104099360A (zh) * 2013-04-12 2014-10-15 北京大学 非天然氨基酸标记的目的蛋白或肽的制备
CN104450746A (zh) * 2014-08-30 2015-03-25 武汉佰福泰制药有限公司 一种向蛋白质定点引入非天然氨基酸的方法
EP2894476A1 (en) * 2014-01-14 2015-07-15 Universität Konstanz Genetically Encoded Spin Label
CN105026574A (zh) * 2012-09-24 2015-11-04 米迪缪尼有限公司 细胞系
CN107002088A (zh) * 2014-10-27 2017-08-01 医药研究委员会 将非天然氨基酸掺入蛋白质中
CN107012121A (zh) * 2016-01-27 2017-08-04 北京大学 携带正交tRNA/氨酰tRNA合成酶的稳定细胞系的构建
CN107022568A (zh) * 2016-02-01 2017-08-08 北京大学 哺乳动物细胞中高效多点插入非天然氨基酸的系统
WO2017152808A1 (zh) * 2016-03-10 2017-09-14 北京大学 利用优化的基因密码子扩展系统通读提前终止密码子疾病中的截短蛋白
CN107614689A (zh) * 2015-03-27 2018-01-19 昆士兰大学 用于将非天然氨基酸并入蛋白质中的平台
CN109295100A (zh) * 2017-07-25 2019-02-01 北京大学 携带正交tRNA/氨酰tRNA合成酶的稳定细胞系的构建
EP3279211B1 (en) * 2011-02-03 2020-04-29 Embl Unnatural amino acids comprising a norbornenyl group and uses thereof
CN111718949A (zh) * 2019-03-19 2020-09-29 宁波鲲鹏生物科技有限公司 利用双质粒系统在蛋白中引入非天然氨基酸
CN111718920A (zh) * 2019-03-19 2020-09-29 宁波鲲鹏生物科技有限公司 在蛋白中高效引入赖氨酸衍生物的氨酰基-tRNA合成酶
CN111849929A (zh) * 2019-04-30 2020-10-30 苏州鲲鹏生物技术有限公司 高效引入赖氨酸衍生物的氨酰基—tRNA合成酶

Patent Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010139948A2 (en) * 2009-06-04 2010-12-09 Medical Research Council Methods
EP3279211B1 (en) * 2011-02-03 2020-04-29 Embl Unnatural amino acids comprising a norbornenyl group and uses thereof
WO2012175924A2 (en) * 2011-06-24 2012-12-27 Medical Research Council Incorporation of substituted lysines into polypeptides
CN105026574A (zh) * 2012-09-24 2015-11-04 米迪缪尼有限公司 细胞系
CN104099360A (zh) * 2013-04-12 2014-10-15 北京大学 非天然氨基酸标记的目的蛋白或肽的制备
EP2894476A1 (en) * 2014-01-14 2015-07-15 Universität Konstanz Genetically Encoded Spin Label
CN104450746A (zh) * 2014-08-30 2015-03-25 武汉佰福泰制药有限公司 一种向蛋白质定点引入非天然氨基酸的方法
CN107002088A (zh) * 2014-10-27 2017-08-01 医药研究委员会 将非天然氨基酸掺入蛋白质中
US20180171321A1 (en) * 2015-03-27 2018-06-21 The University Of Queensland Platform for a non-natural amino acid incorporation into proteins
CN107614689A (zh) * 2015-03-27 2018-01-19 昆士兰大学 用于将非天然氨基酸并入蛋白质中的平台
CN107012121A (zh) * 2016-01-27 2017-08-04 北京大学 携带正交tRNA/氨酰tRNA合成酶的稳定细胞系的构建
CN107022568A (zh) * 2016-02-01 2017-08-08 北京大学 哺乳动物细胞中高效多点插入非天然氨基酸的系统
WO2017152808A1 (zh) * 2016-03-10 2017-09-14 北京大学 利用优化的基因密码子扩展系统通读提前终止密码子疾病中的截短蛋白
CN109295100A (zh) * 2017-07-25 2019-02-01 北京大学 携带正交tRNA/氨酰tRNA合成酶的稳定细胞系的构建
CN111718949A (zh) * 2019-03-19 2020-09-29 宁波鲲鹏生物科技有限公司 利用双质粒系统在蛋白中引入非天然氨基酸
CN111718920A (zh) * 2019-03-19 2020-09-29 宁波鲲鹏生物科技有限公司 在蛋白中高效引入赖氨酸衍生物的氨酰基-tRNA合成酶
CN111849929A (zh) * 2019-04-30 2020-10-30 苏州鲲鹏生物技术有限公司 高效引入赖氨酸衍生物的氨酰基—tRNA合成酶
WO2020221365A1 (zh) * 2019-04-30 2020-11-05 苏州鲲鹏生物技术有限公司 高效引入赖氨酸衍生物的氨酰基—tRNA合成酶

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
DAISUKE KIGA等: "An engineered Escherichia coli tyrosyl–tRNA synthetase for site-specific incorporation of an unnatural amino acid into proteins in eukaryotic translation and its application in a wheat germ cell-free system", 《PNAS》 *
JUN-ICHI FUKUNAGA等: "Misacylation of Yeast Amber Suppressor tRNATyr by E. coli Lysyl-tRNA Synthetase and Its Effective Repression by Genetic Engineering of the tRNA Sequence", 《J. BIOCHEM》 *
POLYCARPO,C.等: "pyrrolysine--tRNA(Pyl) ligase [Methanosarcina mazei]", 《GENBANK》 *
WOLFGANG H等: "Efficient Multisite Unnatural Amino Acid Incorporation in Mammalian Cells via Optimized Pyrrolysyl tRNA Synthetase/tRNA Expression and Engineered eRF1", 《JOURNAL OF THE AMERICAN CHEMICAL SOCIETY》 *
周勤华等: "氨酰-tRNA合成酶的研究进展 ", 《中国生物工程杂志》 *
陆颖菲等: "蛋白质中赖氨酸衍生物定点引入的应用研究进展 ", 《药物生物技术》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111849929A (zh) * 2019-04-30 2020-10-30 苏州鲲鹏生物技术有限公司 高效引入赖氨酸衍生物的氨酰基—tRNA合成酶
CN111849929B (zh) * 2019-04-30 2021-05-11 苏州鲲鹏生物技术有限公司 高效引入赖氨酸衍生物的氨酰基—tRNA合成酶
WO2023011486A1 (zh) * 2021-08-02 2023-02-09 宁波鲲鹏生物科技有限公司 高效引入赖氨酸衍生物的氨酰基-tRNA合成酶及其应用
CN114634958A (zh) * 2021-12-22 2022-06-17 清华大学 使用无细胞蛋白质合成体系插入非天然氨基酸的方法
CN114657156A (zh) * 2022-03-11 2022-06-24 南京中医药大学 吡咯赖氨酸氨酰-tRNA合成酶突变体及其筛选系统和应用

Also Published As

Publication number Publication date
CN111850020B (zh) 2021-05-07

Similar Documents

Publication Publication Date Title
CN111718949B (zh) 利用双质粒系统在蛋白中引入非天然氨基酸
CN111849929B (zh) 高效引入赖氨酸衍生物的氨酰基—tRNA合成酶
CN111850020B (zh) 利用质粒系统在蛋白中引入非天然氨基酸
CN111718920B (zh) 在蛋白中高效引入赖氨酸衍生物的氨酰基-tRNA合成酶
CN108239633B (zh) 一种催化活性得到提高的d-阿洛酮糖-3-差向异构酶的突变体及其应用
CN110551701A (zh) 羰基还原酶突变体及其在环戊二酮类化合物还原中的应用
CN113667685B (zh) 信号肽相关序列及其在蛋白质合成中的应用
JP7266325B2 (ja) 蛍光タンパク質フラグメントを含む融合タンパク質およびその用途
CN108239632B (zh) 一种热稳定性得到改善的d-阿洛酮糖-3-差向异构酶的突变体及其应用
CN109136209B (zh) 肠激酶轻链突变体及其应用
RU2790662C1 (ru) АМИНОАЦИЛ-тРНК-СИНТЕТАЗА, ЭФФЕКТИВНОЕ ВВЕДЕНИЕ ПРОИЗВОДНЫХ ЛИЗИНА
CN113801236A (zh) 一种赖脯胰岛素的制备方法
RU2799794C2 (ru) АМИНОАЦИЛ-тРНК-СИНТЕТАЗА ДЛЯ ЭФФЕКТИВНОГО ВВЕДЕНИЯ ПРОИЗВОДНОГО ЛИЗИНА В БЕЛОК
CN115701451B (zh) 高效引入赖氨酸衍生物的氨酰基-tRNA合成酶及其应用
CN114703168B (zh) 一种肝素酶iii
CN115873837A (zh) 高表达的新型的苯丙氨酸解氨酶
KR20200082618A (ko) 인슐린 과발현용 램프 태그 및 이를 이용한 인슐린의 제조방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Chen Wei

Inventor after: Wu Song

Inventor after: Zhang Zhenshan

Inventor after: Liu Huiling

Inventor before: Zha Ruopeng

Inventor before: Chen Wei

Inventor before: Wu Song

Inventor before: Zhang Zhenshan

Inventor before: Liu Huiling