CN113454211A - 氨酰基-tRNA合成酶及其用途 - Google Patents

氨酰基-tRNA合成酶及其用途 Download PDF

Info

Publication number
CN113454211A
CN113454211A CN202080015621.0A CN202080015621A CN113454211A CN 113454211 A CN113454211 A CN 113454211A CN 202080015621 A CN202080015621 A CN 202080015621A CN 113454211 A CN113454211 A CN 113454211A
Authority
CN
China
Prior art keywords
xaa
gly
seq
ala
leu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080015621.0A
Other languages
English (en)
Inventor
关宏涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Novo Nordisk AS
Original Assignee
Novo Nordisk AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novo Nordisk AS filed Critical Novo Nordisk AS
Publication of CN113454211A publication Critical patent/CN113454211A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/93Ligases (6)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/575Hormones
    • C07K14/605Glucagons
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y601/00Ligases forming carbon-oxygen bonds (6.1)
    • C12Y601/01Ligases forming aminoacyl-tRNA and related compounds (6.1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y601/00Ligases forming carbon-oxygen bonds (6.1)
    • C12Y601/01Ligases forming aminoacyl-tRNA and related compounds (6.1.1)
    • C12Y601/01007Alanine--tRNA ligase (6.1.1.7)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biomedical Technology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Endocrinology (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Biophysics (AREA)
  • Peptides Or Proteins (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明涉及用2‑氨基异丁酸(Aib)对tRNA进行氨酰化的氨酰基‑tRNA合成酶,从而能够在翻译过程中将Aib掺入正在增长的多肽链中,例如在真细菌宿主细胞如大肠杆菌中。例如,但非限制性地,本发明涉及新的氨酰基‑tRNA合成酶及其用途,以及产生含有一个或多个Aib的多肽的方法。

Description

氨酰基-tRNA合成酶及其用途
技术领域
本发明属于翻译生物化学领域。本发明涉及可用于将非天然氨基酸掺入多肽中的氨酰基-tRNA合成酶。
序列表的援引并入
本申请与电子形式的序列表一起提交。该序列表的全部内容通过引用并入本文。
背景
重组表达是生产天然或工程蛋白质和肽(单独地及统称为“多肽”)的有效方式。绝大多数已知生物体编码相同的20种天然存在的氨基酸,因此重组表达在不进一步开发的情况下局限于仅由天然存在的氨基酸组成的多肽。已经开发了一种克服这种限制的策略,其用于在原核和真核生物体中将多种非天然氨基酸在体内位点特异性地掺入多肽中(WangL1,Schultz PG,A general approach for the generation of orthogonal tRNAs,Chem.Biol.,2001Sep,8(9):883-90;Liu CC,Schultz PG,Adding new chemistries tothe genetic code,Annu.Rev.Biochem.,2010,79:413-44)。这些方法利用氨酰基-tRNA合成酶(RS),该酶用所需非天然氨基酸对tRNA进行氨酰化,进而在翻译过程中响应于选择密码子将所需非天然氨基酸掺入正在增长的多肽链中。可以开发翻译组分以与宿主生物体中的内源性tRNA、RS或氨基酸交叉反应,但效率降低。
2-氨基异丁酸(Aib)是一种非蛋白质氨基酸,其结构式为H2N-C(CH3)2-COOH。Aib可以掺入多肽中并赋予多肽所需性质。包含Aib的具有所需性质的多肽的一个实例是司美格鲁肽(semaglutide);这是一种生物活性GLP-1(胰高血糖素样肽-1)类似物[Lau J.等人,Discovery of the once-weekly glucagon-like peptide-1(GLP-1)analoguesemaglutide,J.Med.Chem.,2015;58:7370-7380],已作为抗糖尿病药物
Figure BDA0003220775120000021
销售。司美格鲁肽在WO06097537中公开。
在遗传学上编码Aib的翻译组分尚无报道,因此含有Aib的多肽目前未被重组表达。
发明内容
本发明涉及用2-氨基异丁酸(Aib)对tRNA进行氨酰化的氨酰基-tRNA合成酶,从而能够在翻译过程中将Aib掺入正在增长的多肽链中。换言之,本发明提供了制备具有经翻译掺入的Aib的多肽的手段。
在第一方面,本发明涉及用2-氨基异丁酸对tRNA进行氨酰化的2-氨基异丁酸-tRNA合成酶(AibRS)。在第二方面,本发明涉及AibRS在制备含有Aib的多肽中的用途。在第三方面,本发明涉及制备包含含有Aib的多肽的化合物的方法,其中该方法包括使用AibRS制备含有Aib的多肽的步骤。
描述
除非在说明书和所附权利要求书中另有说明,否则以单数形式呈现的术语也包括复数情况。因此,除非上下文另外明确指出,否则单数形式“一种”、“一个”和“该”包括复数指示物。例如,提及“一种多肽”实际上包括多种多肽。
在第一方面,本发明涉及2-氨基异丁酸-tRNA合成酶(AibRS)。该2-氨基异丁酸-tRNA合成酶(AibRS)包含SEQ ID NO:7的氨基酸序列或其变体,其中所述SEQ ID NO:7的变体在位置215处具有Gly。
在另一方面,本发明涉及本发明的AibRS在制备含有Aib的多肽中的用途。在进一步的方面,本发明涉及本发明的AibRS在制备包含SEQ ID NO:32的所得多肽中的用途。
在另一方面,本发明涉及制备化学式2的方法,其包括以下步骤:(i)通过使用本发明的AibRS制备所得多肽,和(ii)所得多肽的衍生化。
2-氨基异丁酸(Aib)
如本文所用的,术语“2-氨基异丁酸”(Aib)是指由化学结构式1表示的非天然氨基酸。Aib也可称为“α-甲基丙氨酸”。
化学式1:
Figure BDA0003220775120000031
2-氨基异丁酸-tRNA合成酶(AibRS)
如本文所用的,“2-氨基异丁酸-tRNA合成酶”(AibRS)是指能够用Aib对tRNA进行氨酰化的氨酰基-tRNA合成酶(RS)。AibRS可以:(i)与天然存在的丙氨酸-tRNA合成酶(AlaRS)相同或基本相似,(ii)通过天然或人工诱变衍生自天然存在的AlaRS,(iii)或者通过考虑(i)或(ii)的野生型或突变型AlaRS序列的序列的任何过程来衍生化,例如文库筛查或合理设计。AibRS可以来源于掘越氏火球菌(Pyrococcus horikoshii)的AlaRS或任何天然存在的AlaRS。
如本文所用的,术语“翻译”是指与分子生物学和遗传学领域已知的基因表达的翻译操作相同或相似的翻译操作或翻译操作的一部分。翻译的结果是不断增长的多肽链,也被称为“所得多肽”。本发明的AibRS可以用Aib对tRNA进行氨酰化,使tRNA可用于翻译,其中翻译的结果是含有一个或多个Aib残基的所得多肽。以这种方式起作用的tRNA也称为“tRNAAib”。换言之,当与翻译过程结合使用时,AibRS可被配置为将Aib掺入所得多肽中。Aib的功能不限于任何特定的所得多肽。该翻译系统特别适用于制备包含SEQ ID NO:32的所得多肽。
通过AibRS用Aib对tRNA的氨酰化可以与存在于宿主细胞中的其他氨基酸,例如天然氨基酸,如Ala竞争发生。换言之,本发明不限于专门用来用Aib对翻译系统的tRNA进行氨酰化的AibRS;本发明的AibRS可以用任何氨基酸对tRNA进行氨酰化。优选地,AibRS用Aib对tRNA进行氨酰化。AibRS功能的效率可以通过分析tRNA翻译后得到的多肽来确定。该效率可以被表示为含有Aib的所得多肽的量与含有另一种氨基酸,例如Ala的所得多肽的量之间的比率。所得多肽的定量可以使用LC-MS进行。
本发明的AibRS的功能不限于任何特定的生物系统。该AibRS可以在体外条件和/或体内条件的背景下工作。该AibRS适合在宿主细胞的环境中工作,其中通过利用宿主细胞的翻译机制的一种或多种组分来进行含有Aib的所得多肽的翻译。该AibRS可以与利用AibRS的生物系统的内源性组分,例如宿主细胞的组分相互作用。
如本文所用的术语“氨酰化”是指AibRS(或其他任何氨酰基-tRNA合成酶)催化tRNA与氨基酸之间的键合的操作。AibRS被称为对tRNA进行“氨酰化”。术语“氨酰化”与“加载”可互换使用。
在一个实施方案中,所述AibRS包含SEQ ID NO:7的氨基酸序列或其变体,其中所述变体包含215Gly。在一个实施方案中,所述SEQ ID NO:7的变体是式I的变体。在一个实施方案中,所述式I的变体在未指定为Xaa的位置处与SEQ ID NO:7至少90%相同。在一个实施方案中,所述式I的变体在未指定为Xaa的序列位置处与式I至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少99%或至少100%相同。在一个实施方案中,所述SEQ ID NO:7的变体与SEQ ID NO:7至少51%、至少55%或至少90%相同。在一个实施方案中,所述SEQ ID NO:7的变体与SEQ ID NO:7至少50%,优选至少60%,更优选至少70%,更优选至少75%,更优选至少80%,更优选至少85%,更优选至少90%,更优选至少95%,最优选99%相同。在一个实施方案中,所述SEQ ID NO:7的变体的特征在于:位置192为Trp、His、Val、Ile或Leu,位置193为Ala、Leu、Ile或Gly,位置213为Thr、Ser、Cys或Ala,位置216为Phe或Trp,位置217为Met、Ile或Leu,位置249为Thr、Ser、Val或Phe,位置360为Asn或Ala,且位置459为Glu或Ala。在一个实施方案中,所述SEQ ID NO:7的变体包含:[192His;215Gly]、[192His;215Gly;360Ala;459Ala]、[192His;215Gly;217Ile;360Ala;459Ala]、[192His;215Gly;217Leu;360Ala;459Ala]、[192His;215Gly;193Leu;360Ala;459Ala]、[192His;215Gly;216Trp;360Ala;459Ala]、[192His;215Gly;193Leu;216Trp;360Ala;459Ala]、[192His;215Gly;193Ile;360Ala;459Ala]、[192His;215Gly;193Ile;217Ile;360Ala;459Ala]、[192His;215Gly;193Leu;217Ile;360Ala;459Ala]、[192His;215Gly;193Ile;217Leu;360Ala.459Ala]、[192His;215Gly;193Leu;217Leu;360Ala;459Ala]、[192Val;215Gly;217Ile;360Ala;459Ala]、[192Ile;215Gly;217Ile;360Ala;459Ala]、[192Leu;215Gly;217Ile;360Ala;459Ala]、[192His;193Gly;215Gly;217Ile;360Ala;459Ala]、[192His;213Ser;215Gly;360Ala;459Ala]、[192His;215Gly;249Ser;360Ala;459Ala]、[192His;215Gly;249Val;360Ala;459Ala]、[192His;213Cys;215Gly;249Val;360Ala;459Ala]或[192His;213Ala;215Gly;249Phe;360Ala;459Ala]。在一个实施方案中,所述SEQ ID NO:7的变体选自由SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29和SEQ ID NO:30组成的列表。在一个实施方案中,所述AibRS来源于古菌细菌。在一个实施方案中,所述AibRS来源于掘越氏火球菌(Pyrococcus horikoshii)。在一个实施方案中,所述AibRS被配置为执行用Aib对tRNA进行氨酰化的功能。在一个实施方案中,所述AibRS能够用Aib对tRNA进行氨酰化。在一个实施方案中,所述AibRS被配置为在宿主细胞中执行用Aib对tRNA进行氨酰化的功能。在一个实施方案中,所述AibRS被配置为在大肠杆菌中执行用Aib对tRNA进行氨酰化的功能。在一个实施方案中,通过分析表达产物,即tRNA翻译后得到的多肽来确定用Aib对tRNA进行氨酰化的功能的效率。在一个实施方案中,所述效率被表示为在预期针对Aib的位置处含有Aib的所得多肽与含有Ala或Aib的所得多肽的量之间的掺入比。在一个实施方案中,所述掺入比使用LC-MS来确定,并且如下基于质谱来计算:掺入比=[峰强度]含有Aib的多肽/([峰强度]含有Aib的多肽+[峰强度]含有Ala的多肽)*100%。在一个实施方案中,所述掺入比是至少1%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55、至少60%、至少65%或至少70%。
tRNAAib
如本文所用的,“tRNAAib”是指可通过AibRS用Aib进行氨酰化且在翻译过程中将Aib掺入所得多肽中的tRNA。该tRNA可以:(i)与天然存在的丙氨酸-tRNA(tRNAAla)相同或基本相似,(ii)通过天然或人工诱变衍生自天然存在的tRNAAla,(iii)通过考虑(i)或(ii)的野生型或突变型tRNAAla序列的序列的任何过程来衍生化,例如文库筛查和/或合理设计。在一些实施方案中,所述tRNA可以来源于掘越氏火球菌(Pyrococcus horikoshii)。所述tRNAAib可以是抑制tRNA。
tRNAAib可以以加载状态(即,用氨基酸进行氨酰化的)或未加载状态(即,未用氨基酸进行氨酰化的)存在。tRNAAib与本发明的AibRS同源,并用Aib进行氨酰化。通过AibRS用Aib对tRNA进行的氨酰化可以与存在于宿主细胞中的另一种氨基酸,例如天然氨基酸,如Ala竞争发生。换言之,tRNAAib不限于通过AibRS仅用Aib进行氨酰化的tRNA分子,tRNAAib可以通过AibRS用另一种氨基酸进行氨酰化。tRNAAib用来在翻译过程中响应于选择密码子将氨基酸插入到所得多肽中。优选地,该氨基酸是Aib。
如本文所用的,术语“响应于”是指本发明的tRNA识别选择密码子并介导与tRNA偶联的非天然氨基酸掺入所得多肽中的过程。tRNAAib可以响应于作为终止密码子例如TAG的选择密码子掺入Aib。
如本文所用的,术语“编码”是指使用分子或序列串中的信息指导产生与第一分子或序列串不同的第二分子或序列串的任何过程。特别地,RNA分子可以编码多肽,在这种情况下,翻译过程需要在能够获得所得多肽之前发生。当用来描述翻译过程时,术语“编码”也可以扩展到编码氨基酸的三联密码子或终止密码子。特别地,DNA分子可以编码所得多肽,在这种情况下,转录过程和翻译过程都需要在能够获得所得肽之前发生。应当理解,本发明不限于在仅需要翻译过程来产生所得多肽的多核苷酸(例如,RNA)的背景下工作。本发明还可以在需要转录过程和翻译过程两者来产生所得多肽的多核苷酸(例如,DNA)的背景下工作。
在一个实施方案中,所述AibRS被配置为执行用Aib对tRNA进行氨酰化的功能。在一个实施方案中,该tRNA是抑制tRNA。在一个实施方案中,该tRNA包含一个或多个编码Aib的反密码子。在一个实施方案中,所述编码Aib的tRNA的反密码子与终止密码子互补。在一个实施方案中,选择密码子是无义密码子,例如终止密码子、四碱基密码子、罕用密码子和来源于天然、非天然碱基对等的密码子。在一个实施方案中,终止密码子是琥珀、赭石和/或乳白密码子。在一个实施方案中,编码Aib的反密码子是CTA。在一个实施方案中,所述tRNA由SEQ ID NO:3或其变体编码。在一个实施方案中,所述编码tRNA的SEQ ID NO:3的变体包含G3A突变。在一个实施方案中,所述编码tRNA的SEQ ID NO:3的变体与SEQ ID NO:3至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少99%或至少100%相同。在一个实施方案中,所述编码tRNA的SEQ ID NO:3的变体是SEQ ID NO:4。在一个实施方案中,所述tRNA由SEQ ID NO:4编码。在一个实施方案中,所述tRNA来源于古菌细菌。在一个实施方案中,所述tRNA来源于掘越氏火球菌(Pyrococcus horikoshii)。
氨基酸
如本文所用的,术语“天然氨基酸”是指由人类标准遗传密码编码的20种标准氨基酸。天然氨基酸也可称为“蛋白质氨基酸”。术语“非天然氨基酸”是指可存在于自然界中(但不属于由人类标准遗传密码编码的20种标准氨基酸)或纯合成的氨基酸,例如修饰的氨基酸和氨基酸类似物。非天然氨基酸也可称为“非蛋白质氨基酸”或“非编码氨基酸”。非天然氨基酸的非限制性实例是Aib和天然氨基酸的D-异构体。如果在本文中使用术语“氨基酸”而未指明其为天然的还是非天然的,则应将其解释为包括天然和非天然氨基酸。如本文所用的术语“任何氨基酸”被解释为包括天然和非天然氨基酸。
抑制tRNA和选择密码子
如本文所用的术语“抑制tRNA”是指改变mRNA在给定翻译系统中的读取的tRNA,从而允许密码子(例如作为终止密码子的选择密码子)的翻译通读,否则该密码子会导致翻译终止或错误翻译(例如,移码)。通常,抑制tRNA允许在多肽翻译过程中响应于终止密码子掺入氨基酸(被称为“通读”的过程)。
如本文所用的,术语“选择密码子”是指这样的密码子,响应于该密码子,tRNA(例如抑制tRNA)将氨基酸掺入所得多肽中。tRNA被称为选择密码子的“反密码子”。选择密码子可以是无义密码子,例如终止密码子、四碱基密码子、罕用密码子和来源于天然、非天然碱基对等的密码子。终止密码子的非限制性实例是琥珀、赭石和乳白密码子。
突变和突变体
如本文在氨基酸序列或多肽的语境中使用的术语“突变”是指氨基酸(i)被另一个氨基酸置换,(ii)被删除,或(iii)被添加。在氨基酸序列的语境中的突变可称为“氨基酸变化”。氨基酸序列(或多肽)的特定位置的特定氨基酸可以通过列出所讨论的序列位置,随后列出存在于该位置的氨基酸的三字母代码来描述。在氨基酸序列或多肽的语境中,该命名法的一个非限制性实例是:“192His和215Gly”,意思是His存在于位置192处而Gly存在于位置215处。氨基酸序列(或多肽)中的置换可以通过列出被置换的氨基酸的三字母代码,随后列出所讨论的序列位置,随后列出置换后的氨基酸来描述。这种命名法的一个非限制性实例是:“Trp192His;Val215Gly”,其中位置192处的Trp被His置换,且位置215处的Val被Gly置换。可以相对于序列表中描述的具体序列(通常相对于野生型tRNA合成酶)提供置换,并且被置换的氨基酸的位置是基于可以从序列表中的特定序列推导出的编号来确定的。在序列表中,SEQ ID NO:1的第一个氨基酸残基(从N末端计数)(Met)被指定为编号1;SEQ IDNO:1的第二个氨基酸残基(Glu)被指定为编号2,以此类推。如本文在核苷酸序列或多核苷酸的语境中所用的,术语“突变”是指核苷酸(i)被另一个核苷酸置换,(ii)被删除,或(iii)被添加。核苷酸序列或多核苷酸中的置换可以通过列出被置换的核苷酸的核碱基的单字母代码,随后列出被置换的核苷酸的序列位置,随后列出置换后的核苷酸的核碱基来描述。在核苷酸序列或多核苷酸的语境中,置换命名法的一个非限制性实例是:“G3A”,其中鸟嘌呤已被腺嘌呤置换。可以相对于序列表中描述的具体序列(通常相对于野生型tRNA)提供置换,并且被置换的核苷酸的位置是基于可以从序列表中的特定序列推导出的编号来确定的。在序列表中,SEQ ID NO:2的第一个核苷酸残基(从5’-末端计数)(G)被指定为编号1;SEQ ID NO:2的第二个氨基酸残基(G)被指定为编号2,以此类推。
如本文在氨基酸序列或多肽的语境中使用的术语“突变体”是指与突变体的亲本序列相比具有一个或多个突变的序列。
变体
如本文所用的,术语“变体”是指与变体的亲本组分相比可具有结构差异,但保持相似功能的组分。例如,AibRS与其变体不一定具有相同的氨基酸序列,但它们都将用非天然氨基酸对同源tRNA进行氨酰化。与AibRS相比,本发明AibRS的变体可以具有一个或多个突变,只要该变体仍然具有用Aib对tRNA进行氨酰化的功能即可。突变可包括置换、缺失和添加。变体中的突变也可称为“变异”。
多核苷酸和多肽
如本文所用的,术语“多核苷酸”是指两个或更多个核苷酸的序列。术语“多核苷酸”和“核苷酸序列”可互换使用。如本文所用的,术语“多肽”是指两个或更多个天然或非天然氨基酸的序列。因此,术语“多肽”包括肽和蛋白质。术语“多肽”和“氨基酸序列”可互换使用。如本文所用的,术语“所得多肽”是指作为翻译过程的产物的多肽,通常涉及本发明的AibRS。所得多肽也可称为“增长的多肽链”,尤其是当所得多肽在翻译过程的语境中被描述时。本发明的AibRS特别适用于制备包含SEQ ID NO:32的所得多肽,SEQ ID NO:32是司美格鲁肽的氨基酸序列[Lau J.等人,Discovery of the once-weekly glucagon-likepeptide-1(GLP-1)analogue semaglutide,J.Med.Chem.,2015;58:7370-7380]。
在一个实施方案中,所述AibRS用于制备含有一个或多个Aib残基的所得多肽。在一个实施方案中,所述AibRS用于制备含有一个或多个Aib残基的所得多肽,其中所述含有一个或多个Aib残基的所得多肽是GLP-1类似物。在一个实施方案中,所述AibRS用于制备所得多肽,其中所得多肽包含SEQ ID NO:32。在一个实施方案中,所述AibRS用于制备所得多肽,其中所得多肽是SEQ ID NO:32。
衍生物
如本文在多肽的语境中所用的,术语“衍生物”意指化学修饰的多肽,其中一个或多个取代基已经共价连接至该多肽。如本文所用的,术语“衍生化”是指从多肽获得衍生物的过程。例如,化学式2可以通过引入化学式3的取代基(也可称为“侧链”)的衍生化,从SEQID NO:32获得。
本发明的AibRS在制备司美格鲁肽(化学式2)的方法中特别有用,该方法包括以下步骤:(i)通过使用本发明的AibRS制备包含SEQ ID NO:32的所得多肽,和(ii)用取代基化学式3对包含SEQ ID NO:32的多肽进行衍生化。
化学式2(司美格鲁肽):
Figure BDA0003220775120000111
化学式3(司美格鲁肽的取代基[或侧链];其中*表示与多肽序列的连接点):
Figure BDA0003220775120000112
在一个实施方案中,本发明涉及产生化合物的方法,其包括以下步骤:(i)使用本发明的AibRS制备含有一个或多个Aib残基的所得多肽,和(ii)所得多肽的衍生化;在优选实施方案中,该化合物是化学式2;在优选实施方案中,所得多肽是SEQ ID NO:32;在优选实施方案中,所得多肽用化学式3衍生化。衍生化可以如Lau J.等人,Discovery of theonce-weekly glucagon-like peptide-1(GLP-1)analogue semaglutide,J.Med.Chem.,2015;58:7370-7380所述进行。
同源物
如本文所用的,“同源物”是指共同起作用或彼此具有特异性的某些方面的组分,例如tRNAAib和AibRS,以及反密码子和终止密码子。这些组分也可以称为“互补的”。在一个实施方案中,AibRS与tRNAAib同源。
正交的
如本文所用的,术语“正交的”是指与宿主细胞内源性的相应分子相比,以降低的效率与宿主细胞的内源性组分一起发挥作用,或无法与细胞的内源性组分一起发挥作用的分子(例如,AibRS和/或tRNAAib)。在tRNA和RS的背景下,正交的是指与内源性tRNA与内源性RS一起发挥作用相比,正交tRNA与内源性RS一起发挥作用的能力缺失或效率降低,或者与内源性RS与内源性tRNA一起发挥作用相比,正交RS与内源性tRNA一起发挥作用的能力缺失或效率降低。正交分子在细胞中缺乏功能正常的内源性互补分子。例如,与内源性RS对内源性tRNA的氨酰化相比,细胞中的正交tRNA被细胞的任何内源性RS氨酰化的效率降低,甚至为零。在另一个实例中,与内源性RS对内源性tRNA的氨酰化相比,正交RS以降低的或甚至为零的效率对目的细胞的任何内源性tRNA进行氨酰化。正交性可以被表示为AibRS功能的效率。
本发明的翻译组分(例如AibRS和/或tRNAAib)可以来源于任何生物体(或生物体的组合),以用于来自其他任何物种的宿主翻译系统中,但需要注意的是,翻译组分和宿主系统以正交方式起作用。在一些实施方案中,翻译组分来源于古菌基因(即古细菌),以用于真细菌宿主系统中。例如,正交tRNAAib可以来源于原生物,例如古细菌,如詹氏甲烷球菌(Methanococcus jannaschii)、热自养甲烷杆菌(Methanobacteriumthermoautotrophicum)、盐杆菌属(Halobacterium)(例如沃氏富盐菌(Haloferaxvolcanii)和盐杆菌属的种NRC-I)、闪烁古生球菌(Archaeoglobus fulgidus)、激烈火球菌(Pyrococcus furiosus)、掘越氏火球菌(Pyrococcus horikoshii)、Aeuropyrum pernix、海沼甲烷球菌(Methanococcus maripaludis)、坎氏甲烷嗜热菌(Methanopyruskandleri)、梅氏甲烷八叠球菌(Methanosarcina mazei)、Pyrobaculum aerophilum、深海火球菌(Pyrococcus abyssi)、硫磺矿硫化叶菌(Sulfolobus solfataricus)、Sulfolobuslokodaii、嗜酸热原体(Thermoplasma acidophilum)、火山热原体(Thermoplasmavolcanium)等,或真细菌,如大肠杆菌和嗜热栖热菌(Thermus thermophilus)。在一些实施方案中,翻译组分来源于真核来源,例如植物、藻类、原生生物、真菌、酵母、动物(例如哺乳动物、昆虫、节肢动物等)等。
宿主细胞
如本文所用的,术语“宿主细胞”是指本发明的AibRS可以在其中执行其功能的细胞。宿主细胞可以是原核细胞,例如细菌和古菌细胞,或真核细胞,例如酵母、藻类、丝状真菌、哺乳动物细胞、植物细胞和昆虫细胞。微生物宿主细胞也可称为“微生物”。真细菌的非限制性实例包括大肠杆菌、嗜热栖热菌、枯草芽孢杆菌(Bacillus subtilis)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)、谷氨酸棒杆菌(Corynebacterium glutamicum)。古菌的非限制性实例包括詹氏甲烷球菌、梅氏甲烷八叠球菌、热自养甲烷杆菌、海沼甲烷球菌、坎氏甲烷嗜热菌、盐杆菌属(例如沃氏富盐菌和盐杆菌属的种NRC-I)、闪烁古生球菌、激烈火球菌、掘越氏火球菌、Pyrobaculum aerophilum、深海火球菌、硫磺矿硫化叶菌、Sulfolobus tokodaii、Aeuropyrum pernix、嗜酸热原体和火山热原体。酵母和丝状真菌的非限制性实例包括酿酒酵母(Saccharomyces cerevisiae)、巴斯德毕赤酵母(Pichiapastoris)、Pichia pfaffi、多形汉逊酵母(Hansenula polymorpha)、黑曲霉(Aspergillusniger)和里氏木霉(Trichoderma resei)。哺乳动物细胞的非限制性实例包括CHO、CHO-K1、CHO-DXB11、CHO-DG44、CHO-S、HEK293或任何这些细胞的衍生物。
宿主细胞通常用编码本发明AibRS的多核苷酸进行遗传工程改造(例如,转化、转导或转染),例如使用一个或多个载体。本发明AibRS的编码区和待翻译的多肽可以与在所需宿主细胞中起作用的基因表达控制元件可操作地连接。载体可包含转录和翻译终止子、转录和翻译起始序列,以及可用于调节特定靶核酸的表达的启动子。载体可包含通用表达盒,该表达盒含有至少一个独立终止子序列、允许该盒在真核生物或原核生物或两者中复制的序列(例如穿梭载体)和用于原核和真核系统的选择标记。载体的非限制性实例是质粒、细菌、病毒、裸多核苷酸或缀合的多核苷酸。在一个实施方案中,宿主细胞是大肠杆菌。
共有序列
如本文所用的,术语“共有序列”是指在序列比对中在每个位置发现的最常见氨基酸残基的计算顺序。它表示多个序列比对的结果,其中相关序列(例如古菌AlaRS序列)相互比较并计算相似的序列基序。因此,共有序列是生物活性多肽的功能性(例如通过参与折叠和/或氨基酸结合)所必需的推定氨基酸位置的模型。一般而言,未被鉴定为推定活性位点的氨基酸序列位置具有高度的自由度,因为这些位置的氨基酸通常在环中暴露于溶剂,因此可以在这些位置引入高度的变异,同时保持生物活性多肽行使的功能。在一个实施方案中,Aib被限定为共有序列的变体。在一个实施方案中,Aib被限定为式I的变体。在一个实施方案中,Aib被限定为式II的变体。在一个实施方案中,Aib被限定为式III的变体。
序列同一性
序列同一性是两个(核苷酸或氨基酸)序列在比对中在相同位置处具有相同残基的程度。序列同一性方便地被表示为百分比,即如果两个序列之间100个比对位置中的85个氨基酸相同,则同一性程度为85%。如果两个序列之一是共有序列,则计算时仅考虑该共有序列的保守位置。即,如果100个比对和保守位置中的85个氨基酸相同,则同一性程度为85%,即使序列可能长于100个氨基酸。对于本发明而言,两个氨基酸序列之间的序列同一性通过使用简单的手写和目视,和/或标准蛋白质或肽比对程序,如基于Needleman-Wunsch算法的“比对”来确定。该算法在Needleman,S.B.和Wunsch,C.D.,(1970),Journal ofMolecular Biology,48:443-453中描述,而align程序由Myers和W.Miller在"OptimalAlignments in Linear Space"CABIOS(computer applications in the biosciences)(1988)4:11-17中描述。为了比对,可以使用默认的打分矩阵BLOSUM62和默认的单位矩阵(identity matrix),并可将空位中的第一残基的罚分设置为-12,或优选-10,而将空位中的其他残基的罚分设置为-2,或优选-0.5。
具体实施方案
应当理解,本文使用的术语用于描述特定实施方的目的,因此并非旨在限制。
1.包含SEQ ID NO:7的氨基酸序列或其变体的2-氨基异丁酸-tRNA合成酶(AibRS),其中所述变体包含215Gly。
2.根据任何前述实施方案所述的AibRS;其中所述SEQ ID NO:7的变体是式I的变体;其中式I是:
Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Phe-Xaa-Glu-Xaa-Gly-Xaa-Xaa-Xaa-Lys-Xaa-Cys-Xaa-Xaa-Cys-Gly-Xaa-Xaa-Phe-Trp-Thr-Xaa-Xaa-Xaa-Xaa-Arg-Xaa-Xaa-Cys-Gly-Asp-Xaa-Pro-Cys-Xaa-Xaa-Tyr-Xaa-Phe-Ile-Gly-Xaa-Pro-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Leu-Xaa-Glu-Xaa-Arg-Xaa-Xaa-Phe-Xaa-Xaa-Phe-Phe-Glu-Xaa-Xaa-Xaa-His-Xaa-Xaa-Xaa-Xaa-Arg-Tyr-Pro-Val-Xaa-Xaa-Arg-Trp-Arg-Asp-Asp-Val-Xaa-Leu-Val-Gly-Ala-Ser-Ile-Xaa-Asp-Phe-Gln-Pro-Trp-Val-Xaa-Xaa-Gly-Xaa-Xaa-Xaa-Pro-Pro-Ala-Asn-Pro-Leu-Xaa-Ile-Ser-Gln-Pro-Xaa-Ile-Arg-Xaa-Xaa-Asp-Xaa-Asp-Xaa-Val-Gly-Xaa-Xaa-Gly-Arg-His-Xaa-Thr-Xaa-Phe-Glu-Met-Met-Ala-His-His-Ala-Phe-Asn-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Tyr-Trp-Xaa-Xaa-Glu-Thr-Val-Xaa-Xaa-Xaa-Xaa-Xaa-Phe-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Ile-Thr-Phe-Xaa-Glu-Xaa-Xaa-Trp-Xaa-Gly-Gly-Gly-Asn-Ala-Gly-Xaa-Xaa-Xaa-Glu-Val-Xaa-Xaa-Xaa-Gly-Xaa-Glu-Xaa-Ala-Thr-Leu-Val-Phe-Met-Xaa-Tyr-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Pro-Xaa-Xaa-Xaa-Xaa-Xaa-Val-Asp-Thr-Gly-Tyr-Gly-Leu-Glu-Arg-Xaa-Xaa-Trp-Xaa-Ser-Xaa-Gly-Xaa-Pro-Thr-Xaa-Tyr-Asp-Ala-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Leu-Xaa-Xaa-Xaa-Ala-Gly-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Ile-Leu-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Ala-Gly-Xaa-Xaa-Asp-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Leu-Xaa-Xaa-Leu-Arg-Xaa-Xaa-Val-Ala-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Glu-Leu-Xaa-Xaa-Xaa-Xaa-Xaa-Pro-Xaa-Glu-Xaa-Xaa-Tyr-Ala-Ile-Ala-Asp-His-Thr-Xaa-Xaa-Leu-Xaa-Phe-Met-Leu-Xaa-Asp-Gly-Val-Xaa-Pro-Ser-Asn-Xaa-Xaa-Ala-Gly-Tyr-Leu-Ala-Arg-Leu-Xaa-Ile-Arg-Xaa-Xaa-Xaa-Arg-Xaa-Xaa-Xaa-Xaa-Leu-Gly-Xaa-Xaa-Xaa-Pro-Leu-Xaa-Xaa-Ile-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Pro-Glu-Xaa-Xaa-Glu-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Glu-Glu-Xaa-Xaa-Xaa-Xaa-Xaa-Thr-Xaa-Xaa-Arg-Gly-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Lys-Xaa-Xaa-Gly-Xaa-Xaa-Xaa-Xaa-Pro-Xaa-Xaa-Xaa-Leu-Xaa-Xaa-Xaa-Tyr-Xaa-Ser-His-Gly-Xaa-Xaa-Pro-Glu-Xaa-Xaa-Xaa-Glu-Xaa-Ala-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Val-Xaa-Xaa-Pro-Asp-Asn-Phe-Tyr-Xaa-Xaa-Val-Ala-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa
其中式I中的每个Xaa独立地选择,并且是一个或多个氨基酸,或不存在;
其中所述式I的变体在未指定为Xaa的位置处与SEQ ID NO:7至少90%相同。
3.根据任何前述实施方案所述的AibRS;其中所述SEQ ID NO:7的变体是式I的变体;其中式I对应于下式的共有序列:
Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Phe-Xaa-Glu-Xaa-Gly-Xaa-Xaa-Xaa-Lys-Xaa-Cys-Xaa-Xaa-Cys-Gly-Xaa-Xaa-Phe-Trp-Thr-Xaa-Xaa-Xaa-Xaa-Arg-Xaa-Xaa-Cys-Gly-Asp-Xaa-Pro-Cys-Xaa-Xaa-Tyr-Xaa-Phe-Ile-Gly-Xaa-Pro-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Leu-Xaa-Glu-Xaa-Arg-Xaa-Xaa-Phe-Xaa-Xaa-Phe-Phe-Glu-Xaa-Xaa-Xaa-His-Xaa-Xaa-Xaa-Xaa-Arg-Tyr-Pro-Val-Xaa-Xaa-Arg-Trp-Arg-Asp-Asp-Val-Xaa-Leu-Val-Gly-Ala-Ser-Ile-Xaa-Asp-Phe-Gln-Pro-Trp-Val-Xaa-Xaa-Gly-Xaa-Xaa-Xaa-Pro-Pro-Ala-Asn-Pro-Leu-Xaa-Ile-Ser-Gln-Pro-Xaa-Ile-Arg-Xaa-Xaa-Asp-Xaa-Asp-Xaa-Val-Gly-Xaa-Xaa-Gly-Arg-His-Xaa-Thr-Xaa-Phe-Glu-Met-Met-Ala-His-His-Ala-Phe-Asn-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Tyr-Trp-Xaa-Xaa-Glu-Thr-Val-Xaa-Xaa-Xaa-Xaa-Xaa-Phe-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Ile-Thr-Phe-Xaa-Glu-Xaa-Xaa-Trp-Xaa-Gly-Gly-Gly-Asn-Ala-Gly-Xaa-Xaa-Xaa-Glu-Val-Xaa-Xaa-Xaa-Gly-Xaa-Glu-Xaa-Ala-Thr-Leu-Val-Phe-Met-Xaa-Tyr-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Pro-Xaa-Xaa-Xaa-Xaa-Xaa-Val-Asp-Thr-Gly-Tyr-Gly-Leu-Glu-Arg-Xaa-Xaa-Trp-Xaa-Ser-Xaa-Gly-Xaa-Pro-Thr-Xaa-Tyr-Asp-Ala-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Leu-Xaa-Xaa-Xaa-Ala-Gly-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Ile-Leu-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Ala-Gly-Xaa-Xaa-Asp-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Leu-Xaa-Xaa-Leu-Arg-Xaa-Xaa-Val-Ala-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Glu-Leu-Xaa-Xaa-Xaa-Xaa-Xaa-Pro-Xaa-Glu-Xaa-Xaa-Tyr-Ala-Ile-Ala-Asp-His-Thr-Xaa-Xaa-Leu-Xaa-Phe-Met-Leu-Xaa-Asp-Gly-Val-Xaa-Pro-Ser-Asn-Xaa-Xaa-Ala-Gly-Tyr-Leu-Ala-Arg-Leu-Xaa-Ile-Arg-Xaa-Xaa-Xaa-Arg-Xaa-Xaa-Xaa-Xaa-Leu-Gly-Xaa-Xaa-Xaa-Pro-Leu-Xaa-Xaa-Ile-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Pro-Glu-Xaa-Xaa-Glu-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Glu-Glu-Xaa-Xaa-Xaa-Xaa-Xaa-Thr-Xaa-Xaa-Arg-Gly-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Lys-Xaa-Xaa-Gly-Xaa-Xaa-Xaa-Xaa-Pro-Xaa-Xaa-Xaa-Leu-Xaa-Xaa-Xaa-Tyr-Xaa-Ser-His-Gly-Xaa-Xaa-Pro-Glu-Xaa-Xaa-Xaa-Glu-Xaa-Ala-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Val-Xaa-Xaa-Pro-Asp-Asn-Phe-Tyr-Xaa-Xaa-Val-Ala-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa
其中式I的每个Xaa独立地选择,并且是一个或多个氨基酸,或不存在;
其中所述式I的变体在未指定为Xaa的位置处与SEQ ID NO:7至少90%相同。
4.根据任何前述实施方案所述的AibRS;其中所述式I的变体在未指定为Xaa的序列位置处与式I至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少99%或至少100%相同。
5.根据任何前述实施方案所述的AibRS,其中Xaa是一个或多个任何种类的氨基酸,或不存在。
6.根据任何前述实施方案所述的AibRS,其中式I的Xaa是任何氨基酸或不存在。
7.根据任何前述实施方案所述的AibRS;其中式I的Xaa是任何氨基酸。
8.根据任何前述实施方案所述的AibRS,其中所述SEQ ID NO:7的变体与SEQ IDNO:7至少41%相同。
9.根据任何前述实施方案所述的AibRS,其中所述SEQ ID NO:7的变体与SEQ IDNO:7至少55%相同。
10.根据任何前述实施方案所述的AibRS,其中所述SEQ ID NO:7的变体与SEQ IDNO:7至少90%相同。
11.根据任何前述实施方案所述的AibRS,其中所述SEQ ID NO:7的变体与SEQ IDNO:7至少50%,优选至少60%,更优选至少70%,更优选至少75%,更优选至少80%,更优选至少85%,更优选至少90%,更优选至少95%,最优选99%相同。
12.根据任何前述实施方案所述的AibRS;其中所述SEQ ID NO:7的变体的特征在于:
位置192为Trp、His、Val、Ile或Leu
位置193为Ala、Leu、Ile或Gly
位置213为Thr、Ser、Cys或Ala
位置216为Phe或Trp
位置217为Met、Ile或Leu
位置249为Thr、Ser、Val或Phe
位置360为Asn或Ala,
位置459为Glu或Ala。
13.根据任何前述实施方案所述的AibRS;其中所述SEQ ID NO:7的变体的特征在于:
位置192为His、Val、Ile或Leu
位置193为Ala、Leu、Ile或Gly
位置213为Thr、Ser、Cys或Ala
位置216为Phe或Trp
位置217为Met、Ile或Leu
位置249为Thr、Ser、Val或Phe
位置360为Ala,
位置459为Ala。
14.根据任何前述实施方案所述的AibRS;其中所述SEQ ID NO:7的变体包含:[192His;215Gly]、[192His;215Gly;360Ala;459Ala]、[192His;215Gly;217Ile;360Ala;459Ala]、[192His;215Gly;217Leu;360Ala;459Ala]、[192His;215Gly;193Leu;360Ala;459Ala]、[192His;215Gly;216Trp;360Ala;459Ala]、[192His;215Gly;193Leu;216Trp;360Ala;459Ala]、[192His;215Gly;193Ile;360Ala;459Ala]、[192His;215Gly;193Ile;217Ile;360Ala;459Ala]、[192His;215Gly;193Leu;217Ile;360Ala;459Ala]、[192His;215Gly;193Ile;217Leu;360Ala.459Ala]、[192His;215Gly;193Leu;217Leu;360Ala;459Ala]、[192Val;215Gly;217Ile;360Ala;459Ala]、[192Ile;215Gly;217Ile;360Ala;459Ala]、[192Leu;215Gly;217Ile;360Ala;459Ala]、[192His;193Gly;215Gly;217Ile;360Ala;459Ala]、[192His;213Ser;215Gly;360Ala;459Ala]、[192His;215Gly;249Ser;360Ala;459Ala]、[192His;215Gly;249Val;360Ala;459Ala]、[192His;213Cys;215Gly;249Val;360Ala;459Ala]或[192His;213Ala;215Gly;249Phe;360Ala;459Ala]。
15.根据任何前述实施方案所述的AibRS;其中所述SEQ ID NO:7的变体包含:[192His;215Gly;360Ala;459Ala]、[192His;215Gly;217Ile;360Ala;459Ala]、[192His;215Gly;217Leu;360Ala;459Ala]、[192His;215Gly;193Leu;360Ala;459Ala]、[192His;215Gly;216Trp;360Ala;459Ala]、[192His;215Gly;193Leu;216Trp;360Ala;459Ala]、[192His;215Gly;193Ile;360Ala;459Ala]、[192His;215Gly;193Ile;217Ile;360Ala;459Ala]、[192His;215Gly;193Leu;217Ile;360Ala;459Ala]、[192His;215Gly;193Ile;217Leu;360Ala.459Ala]、[192His;215Gly;193Leu;217Leu;360Ala;459Ala]、[192Val;215Gly;217Ile;360Ala;459Ala]、[192Ile;215Gly;217Ile;360Ala;459Ala]、[192Leu;215Gly;217Ile;360Ala;459Ala]、[192His;193Gly;215Gly;217Ile;360Ala;459Ala]、[192His;213Ser;215Gly;360Ala;459Ala]、[192His;215Gly;249Ser;360Ala;459Ala]、[192His;215Gly;249Val;360Ala;459Ala]、[192His;213Cys;215Gly;249Val;360Ala;459Ala]或[192His;213Ala;215Gly;249Phe;360Ala;459Ala]。
16.根据任何前述实施方案所述的AibRS;其中所述SEQ ID NO:7的变体选自由SEQID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQID NO:28、SEQ ID NO:29和SEQ ID NO:30组成的列表。
17.根据任何前述实施方案所述的AibRS;其中所述SEQ ID NO:7的变体选自由SEQID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQID NO:29和SEQ ID NO:30组成的列表。
18.根据任何前述实施方案所述的AibRS;其中所述AibRS来源于古菌细菌。
19.根据任何前述实施方案所述的AibRS;其中所述AibRS来源于掘越氏火球菌(Pyrococcus horikoshii)。
20.根据任何前述实施方案所述的AibRS;其中所述AibRS被配置为执行用Aib对tRNA进行氨酰化的功能。
21.根据任何前述权利要求所述的AibRS;其中所述AibRS能够用Aib对tRNA进行氨酰化。
22.根据任何前述实施方案所述的AibRS;其中所述tRNA是抑制tRNA。
23.根据任何前述实施方案所述的AibRS;其中所述tRNA包含一个或多个编码Aib的反密码子。
24.根据任何前述实施方案所述的AibRS;其中所述编码Aib的tRNA的反密码子与终止密码子互补。
25.根据任何前述实施方案所述的AibRS;其中所述编码Aib的反密码子是CTA。
26.根据任何前述实施方案所述的AibRS;其中所述tRNA由SEQ ID NO:3或其变体编码。
27.根据任何前述实施方案所述的AibRS;其中所述编码tRNA的SEQ ID NO:3的变体包含G3A突变。
28.根据任何前述实施方案所述的AibRS;其中所述编码tRNA的SEQ ID NO:3的变体与SEQ ID NO:3至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少99%或至少100%相同。
29.根据任何前述实施方案所述的AibRS;其中所述编码tRNA的SEQ ID NO:3的变体是SEQ ID NO:4。
30.根据任何前述实施方案所述的AibRS;其中所述tRNA由SEQ ID NO:4编码。
31.根据任何前述实施方案所述的AibRS;其中所述tRNA来源于古菌细菌。
32.根据任何前述实施方案所述的AibRS;其中所述tRNA来源于掘越氏火球菌(Pyrococcus horikoshii)。
33.根据任何前述实施方案所述的AibRS;其中所述AibRS被配置为在宿主细胞中执行用Aib对tRNA进行氨酰化的功能。
34.根据任何前述实施方案所述的AibRS;其中所述AibRS被配置为在大肠杆菌中执行用Aib对tRNA进行氨酰化的功能。
35.根据任何前述实施方案所述的AibRS;其中通过分析表达产物,即tRNA翻译后得到的多肽来确定所述功能的效率。
36.根据任何前述实施方案所述的AibRS;其中所述效率被表示为在预期针对Aib的位置处含有Aib的所得多肽与含有Ala或Aib的所得多肽的量之间的掺入比。
37.根据任何前述实施方案所述的AibRS;其中所述掺入比使用LC-MS来确定,并且如下基于质谱来计算:掺入比=[峰强度]含有Aib的多肽/([峰强度]含有Aib的多肽+[峰强度]含有Ala的多肽)*100%。
38.根据任何前述实施方案所述的AibRS;其中所述掺入比是至少1%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55、至少60%、至少65%或至少70%。
39.根据任何前述实施方案所述的AibRS在制备含有一个或多个Aib残基的所得多肽中的用途。
40.根据任何前述实施方案所述的AibRS的用途,其中含有一个或多个Aib残基的所得多肽是GLP-1类似物。
41.根据任何前述实施方案所述的AibRS的用途,其中含有一个或多个Aib残基的所得多肽包含SEQ ID NO:32。
42.制备化合物的方法,其包括以下步骤:
i.使用任何前述实施方案的AibRS制备含有一个或多个Aib残基的所得多肽,
ii.所得多肽的衍生化。
43.根据前述实施方案中任一项所述的方法;其中所述化合物是
化学式2:
Figure BDA0003220775120000221
进一步的具体实施方案
应当理解,本文使用的术语用于描述特定实施方的目的,因此并非旨在限制。
1.包含SEQ ID NO:7的氨基酸序列或其变体的2-氨基异丁酸-tRNA合成酶(AibRS),其中所述变体包含215Gly。
2.包含SEQ ID NO:7的氨基酸序列或其变体的AibRS,其中所述变体与SEQ ID NO:7至少41%、至少50%、至少55%、至少60%、至少70%、至少80%、至少90%、至少95%、至少99%或至少100%相同。
3.包含SEQ ID NO:10的氨基酸序列或其变体的AibRS,其中所述变体与SEQ IDNO:10至少41%、至少50%、至少55%、至少60%、至少70%、至少80%、至少90%、至少95%、至少99%或至少100%相同。
4.包含SEQ ID NO:11的氨基酸序列或其变体的AibRS,其中所述变体与SEQ IDNO:11至少41%、至少50%、至少55%、至少60%、至少70%、至少80%、至少90%、至少95%、至少99%或至少100%相同。
5.包含SEQ ID NO:12的氨基酸序列或其变体的AibRS,其中所述变体与SEQ IDNO:12至少41%、至少50%、至少55%、至少60%、至少70%、至少80%、至少90%、至少95%、至少99%或至少100%相同。
6.包含SEQ ID NO:13的氨基酸序列或其变体的AibRS,其中所述变体与SEQ IDNO:13至少41%、至少50%、至少55%、至少60%、至少70%、至少80%、至少90%、至少95%、至少99%或至少100%相同。
7.包含SEQ ID NO:14的氨基酸序列或其变体的AibRS,其中所述变体与SEQ IDNO:14至少41%、至少50%、至少55%、至少60%、至少70%、至少80%、至少90%、至少95%、至少99%或至少100%相同。
8.包含SEQ ID NO:15的氨基酸序列或其变体的AibRS,其中所述变体与SEQ IDNO:15至少41%、至少50%、至少55%、至少60%、至少70%、至少80%、至少90%、至少95%、至少99%或至少100%相同。
9.包含SEQ ID NO:16的氨基酸序列或其变体的AibRS,其中所述变体与SEQ IDNO:16至少41%、至少50%、至少55%、至少60%、至少70%、至少80%、至少90%、至少95%、至少99%或至少100%相同。
10.包含SEQ ID NO:17的氨基酸序列或其变体的AibRS,其中所述变体与SEQ IDNO:17至少41%、至少50%、至少55%、至少60%、至少70%、至少80%、至少90%、至少95%、至少99%或至少100%相同。
11.包含SEQ ID NO:18的氨基酸序列或其变体的AibRS,其中所述变体与SEQ IDNO:18至少41%、至少50%、至少55%、至少60%、至少70%、至少80%、至少90%、至少95%、至少99%或至少100%相同。
12.包含SEQ ID NO:19的氨基酸序列或其变体的AibRS,其中所述变体与SEQ IDNO:19至少41%、至少50%、至少55%、至少60%、至少70%、至少80%、至少90%、至少95%、至少99%或至少100%相同。
13.包含SEQ ID NO:20的氨基酸序列或其变体的AibRS,其中所述变体与SEQ IDNO:20至少41%、至少50%、至少55%、至少60%、至少70%、至少80%、至少90%、至少95%、至少99%或至少100%相同。
14.包含SEQ ID NO:21的氨基酸序列或其变体的AibRS,其中所述变体与SEQ IDNO:21至少41%、至少50%、至少55%、至少60%、至少70%、至少80%、至少90%、至少95%、至少99%或至少100%相同。
15.包含SEQ ID NO:22的氨基酸序列或其变体的AibRS,其中所述变体与SEQ IDNO:22至少41%、至少50%、至少55%、至少60%、至少70%、至少80%、至少90%、至少95%、至少99%或至少100%相同。
16.包含SEQ ID NO:23的氨基酸序列或其变体的AibRS,其中所述变体与SEQ IDNO:23至少41%、至少50%、至少55%、至少60%、至少70%、至少80%、至少90%、至少95%、至少99%或至少100%相同。
17.包含SEQ ID NO:24的氨基酸序列或其变体的AibRS,其中所述变体与SEQ IDNO:24至少41%、至少50%、至少55%、至少60%、至少70%、至少80%、至少90%、至少95%、至少99%或至少100%相同。
18.包含SEQ ID NO:25的氨基酸序列或其变体的AibRS,其中所述变体与SEQ IDNO:25至少41%、至少50%、至少55%、至少60%、至少70%、至少80%、至少90%、至少95%、至少99%或至少100%相同。
19.包含SEQ ID NO:26的氨基酸序列或其变体的AibRS,其中所述变体与SEQ IDNO:26至少41%、至少50%、至少55%、至少60%、至少70%、至少80%、至少90%、至少95%、至少99%或至少100%相同。
20.包含SEQ ID NO:27的氨基酸序列或其变体的AibRS,其中所述变体与SEQ IDNO:27至少41%、至少50%、至少55%、至少60%、至少70%、至少80%、至少90%、至少95%、至少99%或至少100%相同。
21.包含SEQ ID NO:28的氨基酸序列或其变体的AibRS,其中所述变体与SEQ IDNO:28至少41%、至少50%、至少55%、至少60%、至少70%、至少80%、至少90%、至少95%、至少99%或至少100%相同。
22.包含SEQ ID NO:29的氨基酸序列或其变体的AibRS,其中所述变体与SEQ IDNO:29至少41%、至少50%、至少55%、至少60%、至少70%、至少80%、至少90%、至少95%、至少99%或至少100%相同。
23.包含SEQ ID NO:30的氨基酸序列或其变体的AibRS,其中所述变体与SEQ IDNO:30至少41%、至少50%、至少55%、至少60%、至少70%、至少80%、至少90%、至少95%、至少99%或至少100%相同。
24.根据实施方案4-23中任一项所述的AibRS,其中所述变体包含215Gly。
25.根据任何前述实施方案所述的AibRS;其中所述变体是式I或其变体:
式I:
Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Phe-Xaa-Glu-Xaa-Gly-Xaa-Xaa-Xaa-Lys-Xaa-Cys-Xaa-Xaa-Cys-Gly-Xaa-Xaa-Phe-Trp-Thr-Xaa-Xaa-Xaa-Xaa-Arg-Xaa-Xaa-Cys-Gly-Asp-Xaa-Pro-Cys-Xaa-Xaa-Tyr-Xaa-Phe-Ile-Gly-Xaa-Pro-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Leu-Xaa-Glu-Xaa-Arg-Xaa-Xaa-Phe-Xaa-Xaa-Phe-Phe-Glu-Xaa-Xaa-Xaa-His-Xaa-Xaa-Xaa-Xaa-Arg-Tyr-Pro-Val-Xaa-Xaa-Arg-Trp-Arg-Asp-Asp-Val-Xaa-Leu-Val-Gly-Ala-Ser-Ile-Xaa-Asp-Phe-Gln-Pro-Trp-Val-Xaa-Xaa-Gly-Xaa-Xaa-Xaa-Pro-Pro-Ala-Asn-Pro-Leu-Xaa-Ile-Ser-Gln-Pro-Xaa-Ile-Arg-Xaa-Xaa-Asp-Xaa-Asp-Xaa-Val-Gly-Xaa-Xaa-Gly-Arg-His-Xaa-Thr-Xaa-Phe-Glu-Met-Met-Ala-His-His-Ala-Phe-Asn-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Tyr-Trp-Xaa-Xaa-Glu-Thr-Val-Xaa-Xaa-Xaa-Xaa-Xaa-Phe-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Ile-Thr-Phe-Xaa-Glu-Xaa-Xaa-Trp-Xaa-Gly-Gly-Gly-Asn-Ala-Gly-Xaa-Xaa-Xaa-Glu-Val-Xaa-Xaa-Xaa-Gly-Xaa-Glu-Xaa-Ala-Thr-Leu-Val-Phe-Met-Xaa-Tyr-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Pro-Xaa-Xaa-Xaa-Xaa-Xaa-Val-Asp-Thr-Gly-Tyr-Gly-Leu-Glu-Arg-Xaa-Xaa-Trp-Xaa-Ser-Xaa-Gly-Xaa-Pro-Thr-Xaa-Tyr-Asp-Ala-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Leu-Xaa-Xaa-Xaa-Ala-Gly-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Ile-Leu-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Ala-Gly-Xaa-Xaa-Asp-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Leu-Xaa-Xaa-Leu-Arg-Xaa-Xaa-Val-Ala-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Glu-Leu-Xaa-Xaa-Xaa-Xaa-Xaa-Pro-Xaa-Glu-Xaa-Xaa-Tyr-Ala-Ile-Ala-Asp-His-Thr-Xaa-Xaa-Leu-Xaa-Phe-Met-Leu-Xaa-Asp-Gly-Val-Xaa-Pro-Ser-Asn-Xaa-Xaa-Ala-Gly-Tyr-Leu-Ala-Arg-Leu-Xaa-Ile-Arg-Xaa-Xaa-Xaa-Arg-Xaa-Xaa-Xaa-Xaa-Leu-Gly-Xaa-Xaa-Xaa-Pro-Leu-Xaa-Xaa-Ile-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Pro-Glu-Xaa-Xaa-Glu-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Glu-Glu-Xaa-Xaa-Xaa-Xaa-Xaa-Thr-Xaa-Xaa-Arg-Gly-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Lys-Xaa-Xaa-Gly-Xaa-Xaa-Xaa-Xaa-Pro-Xaa-Xaa-Xaa-Leu-Xaa-Xaa-Xaa-Tyr-Xaa-Ser-His-Gly-Xaa-Xaa-Pro-Glu-Xaa-Xaa-Xaa-Glu-Xaa-Ala-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Val-Xaa-Xaa-Pro-Asp-Asn-Phe-Tyr-Xaa-Xaa-Val-Ala-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa,
其中Xaa是一个或多个任何种类的氨基酸,或不存在。
26.根据任何前述实施方案所述的AibRS;其中所述式I的变体在未指定为Xaa的序列位置处与式I至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少99%或至少100%相同。
27.根据任何前述实施方案所述的AibRS;其中式I的Xaa是任何氨基酸或不存在。
28.根据任何前述实施方案所述的AibRS;其中式I的Xaa是任何氨基酸。
29.根据任何前述实施方案所述的AibRS;其中所述变体是式II或其变体:
式II:
Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Phe-Xaa-Glu-Xaa-Gly-Xaa-Xaa-Arg-Lys-Xaa-Cys-Xaa-Xaa-Cys-Gly-Xaa-Xaa-Phe-Trp-Thr-Xaa-Asp-Pro-Asp-Arg-Glu-Thr-Cys-Gly-Asp-Xaa-Pro-Cys-Asp-Xaa-Tyr-Xaa-Phe-Ile-Gly-Xaa-Pro-Xaa-Xaa-Xaa-Xaa-Xaa-Tyr-Xaa-Leu-Xaa-Glu-Xaa-Arg-Glu-Xaa-Phe-Leu-Xaa-Phe-Phe-Glu-Xaa-Xaa-Xaa-His-Xaa-Arg-Xaa-Xaa-Arg-Tyr-Pro-Val-Xaa-Xaa-Arg-Trp-Arg-Asp-Asp-Val-Xaa-Leu-Val-Gly-Ala-Ser-Ile-Xaa-Asp-Phe-Gln-Pro-Trp-Val-Xaa-Ser-Gly-Xaa-Xaa-Xaa-Pro-Pro-Ala-Asn-Pro-Leu-Xaa-Ile-Ser-Gln-Pro-Ser-Ile-Arg-Xaa-Thr-Asp-Xaa-Asp-Asn-Val-Gly-Xaa-Thr-Gly-Arg-His-Xaa-Thr-Xaa-Phe-Glu-Met-Met-Ala-His-His-Ala-Phe-Asn-Xaa-Pro-Xaa-Xaa-Xaa-Xaa-Tyr-Trp-Xaa-Asp-Glu-Thr-Val-Glu-Xaa-Xaa-Xaa-Xaa-Phe-Xaa-Thr-Xaa-Xaa-Leu-Xaa-Xaa-Xaa-Xaa-Glu-Xaa-Ile-Thr-Phe-Lys-Glu-Xaa-Xaa-Trp-Xaa-Gly-Gly-Gly-Asn-Ala-Gly-Pro-Xaa-Xaa-Glu-Val-Leu-Xaa-Arg-Gly-Leu-Glu-Val-Ala-Thr-Leu-Val-Phe-Met-Gln-Tyr-Lys-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Gly-Xaa-Xaa-Xaa-Xaa-Pro-Met-Xaa-Xaa-Xaa-Xaa-Val-Asp-Thr-Gly-Tyr-Gly-Leu-Glu-Arg-Xaa-Val-Trp-Xaa-Ser-Xaa-Gly-Thr-Pro-Thr-Ala-Tyr-Asp-Ala-Val-Xaa-Xaa-Xaa-Val-Xaa-Xaa-Xaa-Leu-Xaa-Xaa-Xaa-Ala-Gly-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Ile-Leu-Xaa-Glu-Asn-Ser-Xaa-Leu-Ala-Gly-Xaa-Xaa-Asp-Ile-Glu-Xaa-Xaa-Xaa-Asp-Leu-Xaa-Xaa-Leu-Arg-Xaa-Xaa-Val-Ala-Xaa-Xaa-Xaa-Gly-Ile-Xaa-Xaa-Xaa-Glu-Leu-Xaa-Xaa-Xaa-Xaa-Xaa-Pro-Xaa-Glu-Xaa-Ile-Tyr-Ala-Ile-Ala-Asp-His-Thr-Xaa-Xaa-Leu-Xaa-Phe-Met-Leu-Xaa-Asp-Gly-Val-Xaa-Pro-Ser-Asn-Val-Lys-Ala-Gly-Tyr-Leu-Ala-Arg-Leu-Leu-Ile-Arg-Xaa-Xaa-Xaa-Arg-Xaa-Xaa-Xaa-Xaa-Leu-Gly-Leu-Xaa-Xaa-Pro-Leu-Xaa-Glu-Ile-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Leu-Xaa-Xaa-Xaa-Xaa-Pro-Glu-Xaa-Xaa-Glu-Xaa-Xaa-Xaa-Xaa-Ile-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Glu-Glu-Xaa-Xaa-Tyr-Xaa-Xaa-Thr-Leu-Xaa-Arg-Gly-Xaa-Xaa-Leu-Val-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Leu-Lys-Lys-Xaa-Gly-Xaa-Xaa-Glu-Xaa-Pro-Leu-Glu-Xaa-Leu-Xaa-Xaa-Xaa-Tyr-Xaa-Ser-His-Gly-Xaa-Xaa-Pro-Glu-Xaa-Val-Xaa-Glu-Xaa-Ala-Xaa-Xaa-Xaa-Gly-Xaa-Xaa-Val-Xaa-Xaa-Pro-Asp-Asn-Phe-Tyr-Xaa-Leu-Val-Ala-Xaa-Xaa-Xaa-Glu-Xaa-Xaa,
其中Xaa是一个或多个任何种类的氨基酸,或不存在。
30.根据任何前述实施方案所述的AibRS;其中所述式II的变体在未指定为Xaa的序列位置处与式II至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少99%或至少100%相同。
31.根据任何前述实施方案所述的AibRS;其中式II的Xaa是任何氨基酸或不存在。
32.根据任何前述实施方案所述的AibRS;其中式II的Xaa是任何氨基酸。
33.根据任何前述实施方案所述的AibRS;其中所述变体是式III或其变体:
式III:
Met-Xaa-Met-Asp-Met-Xaa-Thr-Arg-Met-Phe-Lys-Glu-Glu-Gly-Trp-Ile-Arg-Lys-Xaa-Cys-Lys-Xaa-Cys-Gly-Lys-Xaa-Phe-Trp-Thr-Leu-Asp-Pro-Asp-Arg-Glu-Thr-Cys-Gly-Asp-Pro-Pro-Cys-Asp-Glu-Tyr-Xaa-Phe-Ile-Gly-Lys-Pro-Gly-Ile-Pro-Lys-Lys-Tyr-Thr-Leu-Xaa-Glu-Met-Arg-Glu-Lys-Phe-Leu-Ser-Phe-Phe-Glu-Xaa-Xaa-Gly-His-Gly-Arg-Val-Lys-Arg-Tyr-Pro-Val-Leu-Pro-Arg-Trp-Arg-Asp-Asp-Val-Leu-Leu-Val-Gly-Ala-Ser-Ile-Met-Asp-Phe-Gln-Pro-Trp-Val-Ile-Ser-Gly-Glu-Ala-Asp-Pro-Pro-Ala-Asn-Pro-Leu-Thr-Ile-Ser-Gln-Pro-Ser-Ile-Arg-Phe-Thr-Asp-Ile-Asp-Asn-Val-Gly-Ile-Thr-Gly-Arg-His-Phe-Thr-Ile-Phe-Glu-Met-Met-Ala-His-His-Ala-Phe-Asn-Tyr-Pro-Gly-Lys-Pro-Ile-Tyr-Trp-Met-Asp-Glu-Thr-Val-Glu-Leu-Ala-Phe-Glu-Phe-Phe-Thr-Lys-Xaa-Leu-Gly-Met-Lys-Pro-Glu-Asp-Ile-Thr-Phe-Lys-Glu-Asn-Pro-Trp-Ala-Gly-Gly-Gly-Asn-Ala-Gly-Pro-Ala-Phe-Glu-Val-Leu-Tyr-Arg-Gly-Leu-Glu-Val-Ala-Thr-Leu-Val-Phe-Met-Gln-Tyr-Lys-Xaa-Ala-Pro-Xaa-Xaa-Ala-Xaa-Xaa-Xaa-Gln-Val-Val-Xaa-Ile-Lys-Gly-Asp-Xaa-Tyr-Val-Pro-Met-Xaa-Thr-Xaa-Val-Val-Asp-Thr-Gly-Tyr-Gly-Leu-Glu-Arg-Leu-Val-Trp-Met-Ser-Gln-Gly-Thr-Pro-Thr-Ala-Tyr-Asp-Ala-Val-Leu-Gly-Tyr-Val-Val-Glu-Pro-Leu-Lys-Xaa-Met-Ala-Gly-Xaa-Glu-Lys-Ile-Asp-Xaa-Xaa-Ile-Leu-Met-Glu-Asn-Ser-Arg-Leu-Ala-Gly-Met-Phe-Asp-Ile-Glu-Asp-Met-Gly-Asp-Leu-Arg-Xaa-Leu-Arg-Xaa-Xaa-Val-Ala-Xaa-Arg-Val-Gly-Ile-Ser-Val-Glu-Glu-Leu-Glu-Xaa-Xaa-Xaa-Arg-Pro-Tyr-Glu-Leu-Ile-Tyr-Ala-Ile-Ala-Asp-His-Thr-Lys-Ala-Leu-Thr-Phe-Met-Leu-Ala-Asp-Gly-Val-Ile-Pro-Ser-Asn-Val-Lys-Ala-Gly-Tyr-Leu-Ala-Arg-Leu-Leu-Ile-Arg-Lys-Ser-Ile-Arg-His-Leu-Arg-Glu-Leu-Gly-Leu-Glu-Xaa-Pro-Leu-Ser-Glu-Ile-Val-Ala-Met-His-Ile-Lys-Glu-Leu-Xaa-Xaa-Thr-Phe-Pro-Glu-Phe-Lys-Glu-Met-Glu-Asp-Val-Ile-Leu-Asp-Ile-Xaa-Xaa-Val-Glu-Glu-Lys-Arg-Tyr-Xaa-Glu-Thr-Leu-Xaa-Arg-Gly-Ser-Xaa-Leu-Val-Xaa-Arg-Glu-Ile-Xaa-Lys-Leu-Lys-Lys-Xaa-Gly-Xaa-Xaa-Glu-Xaa-Pro-Leu-Glu-Lys-Leu-Ile-Leu-Phe-Tyr-Glu-Ser-His-Gly-Leu-Thr-Pro-Glu-Ile-Val-Xaa-Glu-Ile-Ala-Glu-Lys-Glu-Gly-Xaa-Lys-Val-Xaa-Ile-Pro-Asp-Asn-Phe-Tyr-Ser-Leu-Val-Ala-Lys-Xaa-Ala-Glu-Xaa-Xaa,
其中Xaa是一个或多个任何种类的氨基酸,或不存在。
34.根据任何前述实施方案所述的AibRS;其中所述式III的变体在未指定为Xaa的序列位置处与式III至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少99%或至少100%相同。
35.根据任何前述实施方案所述的AibRS;其中式III的Xaa是任何氨基酸或不存在。
36.根据任何前述实施方案所述的AibRS;其中式III的Xaa是任何氨基酸。
37.根据任何前述实施方案所述的AibRS;其中所述变体包含至少197个选自由以下组成的列表的氨基酸:10Phe、12Glu、14Gly、18Lys、20Cys、23Cys、24Gly、27Phe、28Trp、29Thr、34Arg、37Cys、38Gly、39Asp、41Pro、42Cys、45Tyr、47Phe、48Ile、49Gly、51Pro、59Leu、61Glu、63Arg、66Phe、69Phe、70Phe、71Glu、75His、80Arg、81Tyr、82Pro、83Val、86Arg、87Trp、88Arg、89Asp、90Asp、91Val、93Leu、94Val、95Gly、96Ala、97Ser、98Ile、100Asp、101Phe、102Gln、103Pro、104Trp、105Val、108Gly、112Pro、113Pro、114Ala、115Asn、116Pro、117Leu、119Ile、120Ser、121Gln、122Pro、124Ile、125Arg、128Asp、130Asp、132Val、133Gly、136Gly、137Arg、138His、140Thr、142Phe、143Glu、144Met、145Met、146Ala、147His、148His、149Ala、150Phe、151Asn、158Tyr、159Trp、162Glu、163Thr、164Val、170Phe、182Ile、183Thr、184Phe、186Glu、189Trp、191Gly、192Gly、193Gly、194Asn、195Ala、196Gly、200Glu、201Val、205Gly、207Glu、209Ala、210Thr、211Leu、212Val、213Phe、214Met、216Tyr、238Pro、244Val、245Asp、246Thr、247Gly、248Tyr、249Gly、250Leu、251Glu、252Arg、255Trp、257Ser、259Gly、261Pro、262Thr、264Tyr、265Asp、266Ala、275Leu、279Ala、280Gly、289Ile、290Leu、297Ala、298Gly、301Asp、308Leu、311Leu、312Arg、315Val、316Ala、325Glu、326Leu、332Pro、334Glu、337Tyr、338Ala、339Ile、340Ala、341Asp、342His、343Thr、346Leu、348Phe、349Met、350Leu、352Asp、353Gly、354Val、356Pro、357Ser、358Asn、361Ala、362Gly、363Tyr、364Leu、365Ala、366Arg、367Leu、369Ile、370Arg、374Arg、379Leu、380Gly、384Pro、385Leu、388Ile、401Pro、402Glu、405Glu、417Glu、418Glu、424Thr、427Arg、428Gly、440Lys、443Gly、448Pro、452Leu、456Tyr、458Ser、459His、460Gly、463Pro、464Glu、468Glu、470Ala、477Val、480Pro、481Asp、482Asn、483Phe、484Tyr、487Val和488Ala。
38.根据任何前述实施方案所述的AibRS;其中所述变体包含至少264个选自由以下组成的列表的氨基酸:10Phe、12Glu、14Gly、17Arg、18Lys、20Cys、23Cys、24Gly、27Phe、28Trp、29Thr、31Asp、32Pro、33Asp、34Arg、35Glu、36Thr、37Cys、38Gly、39Asp、41Pro、42Cys、43Asp、45Tyr、47Phe、48Ile、49Gly、51Pro、57Tyr、59Leu、61Glu、63Arg、64Glu、66Phe、67Leu、69Phe、70Phe、71Glu、75His、77Arg、80Arg、81Tyr、82Pro、83Val、86Arg、87Trp、88Arg、89Asp、90Asp、91Val、93Leu、94Val、95Gly、96Ala、97Ser、98Ile、100Asp、101Phe、102Gln、103Pro、104Trp、105Val、107Ser、108Gly、112Pro、113Pro、114Ala、115Asn、116Pro、117Leu、119Ile、120Ser、121Gln、122Pro、123Ser、124Ile、125Arg、127Thr、128Asp、130Asp、131Asn、132Val、133Gly、135Thr、136Gly、137Arg、138His、140Thr、142Phe、143Glu、144Met、145Met、146Ala、147His、148His、149Ala、150Phe、151Asn、153Pro、158Tyr、159Trp、161Asp、162Glu、163Thr、164Val、165Glu、170Phe、172Thr、175Leu、180Glu、182Ile、183Thr、184Phe、185Lys、186Glu、189Trp、191Gly、192Gly、193Gly、194Asn、195Ala、196Gly、197Pro、200Glu、201Val、202Leu、204Arg、205Gly、206Leu、207Glu、208Val、209Ala、210Thr、211Leu、212Val、213Phe、214Met、215Gln、216Tyr、217Lys、233Gly、238Pro、239Met、244Val、245Asp、246Thr、247Gly、248Tyr、249Gly、250Leu、251Glu、252Arg、254Val、255Trp、257Ser、259Gly、260Thr、261Pro、262Thr、263Ala、264Tyr、265Asp、266Ala、267Val、271Val、275Leu、279Ala、280Gly、289Ile、290Leu、292Glu、293Asn、294Ser、296Leu、297Ala、298Gly、301Asp、302Ile、303Glu、307Asp、308Leu、311Leu、312Arg、315Val、316Ala、320Gly、321Ile、325Glu、326Leu、332Pro、334Glu、336Ile、337Tyr、338Ala、339Ile、340Ala、341Asp、342His、343Thr、346Leu、348Phe、349Met、350Leu、352Asp、353Gly、354Val、356Pro、357Ser、358Asn、359Val、360Lys、361Ala、362Gly、363Tyr、364Leu、365Ala、366Arg、367Leu、368Leu、369Ile、370Arg、374Arg、379Leu、380Gly、381Leu、384Pro、385Leu、387Glu、388Ile、396Leu、401Pro、402Glu、405Glu、410Ile、417Glu、418Glu、421Tyr、424Thr、425Leu、427Arg、428Gly、431Leu、432Val、439Leu、440Lys、441Lys、443Gly、446Glu、448Pro、449Leu、450Glu、452Leu、456Tyr、458Ser、459His、460Gly、463Pro、464Glu、466Val、468Glu、470Ala、474Gly、477Val、480Pro、481Asp、482Asn、483Phe、484Tyr、486Leu、487Val、488Ala和492Glu。
39.根据任何前述实施方案所述的AibRS;其中所述变体包含至少434个选自由以下组成的列表的氨基酸:1Met、3Met、4Asp、5Met、7Thr、8Arg、9Met、10Phe、11Lys、12Glu、13Glu、14Gly、15Trp、16Ile、17Arg、18Lys、20Cys、21Lys、23Cys、24Gly、25Lys、27Phe、28Trp、29Thr、30Leu、31Asp、32Pro、33Asp、34Arg、35Glu、36Thr、37Cys、38Gly、39Asp、40Pro、41Pro、42Cys、43Asp、44Glu、45Tyr、47Phe、48Ile、49Gly、50Lys、51Pro、52Gly、53Ile、54Pro、55Lys、56Lys、57Tyr、58Thr、59Leu、61Glu、62Met、63Arg、64Glu、65Lys、66Phe、67Leu、68Ser、69Phe、70Phe、71Glu、74Gly、75His、76Gly、77Arg、78Val、79Lys、80Arg、81Tyr、82Pro、83Val、84Leu、85Pro、86Arg、87Trp、88Arg、89Asp、90Asp、91Val、92Leu、93Leu、94Val、95Gly、96Ala、97Ser、98Ile、99Met、100Asp、101Phe、102Gln、103Pro、104Trp、105Val、106Ile、107Ser、108Gly、109Glu、110Ala、111Asp、112Pro、113Pro、114Ala、115Asn、116Pro、117Leu、118Thr、119Ile、120Ser、121Gln、122Pro、123Ser、124Ile、125Arg、126Phe、127Thr、128Asp、129Ile、130Asp、131Asn、132Val、133Gly、134Ile、135Thr、136Gly、137Arg、138His、139Phe、140Thr、141Ile、142Phe、143Glu、144Met、145Met、146Ala、147His、148His、149Ala、150Phe、151Asn、152Tyr、153Pro、154Gly、155Lys、156Pro、157Ile、158Tyr、159Trp、160Met、161Asp、162Glu、163Thr、164Val、165Glu、166Leu、167Ala、168Phe、169Glu、170Phe、171Phe、172Thr、173Lys、175Leu、176Gly、177Met、178Lys、179Pro、180Glu、181Asp、182Ile、183Thr、184Phe、185Lys、186Glu、187Asn、188Pro、189Trp、190Ala、191Gly、192Gly、193Gly、194Asn、195Ala、196Gly、197Pro、198Ala、199Phe、200Glu、201Val、202Leu、203Tyr、204Arg、205Gly、206Leu、207Glu、208Val、209Ala、210Thr、211Leu、212Val、213Phe、214Met、215Gln、216Tyr、217Lys、219Ala、220Pro、223Ala、227Gln、228Val、229Val、231Ile、232Lys、233Gly、234Asp、236Tyr、237Val、238Pro、239Met、241Thr、243Val、244Val、245Asp、246Thr、247Gly、248Tyr、249Gly、250Leu、251Glu、252Arg、253Leu、254Val、255Trp、256Met、257Ser、258Gln、259Gly、260Thr、261Pro、262Thr、263Ala、264Tyr、265Asp、266Ala、267Val、268Leu、269Gly、270Tyr、271Val、272Val、273Glu、274Pro、275Leu、276Lys、278Met、279Ala、280Gly、282Glu、283Lys、284Ile、285Asp、288Ile、289Leu、290Met、291Glu、292Asn、293Ser、294Arg、295Leu、296Ala、297Gly、298Met、299Phe、300Asp、301Ile、302Glu、303Asp、304Met、305Gly、306Asp、307Leu、308Arg、310Leu、311Arg、314Val、315Ala、317Arg、318Val、319Gly、320Ile、321Ser、322Val、323Glu、324Glu、325Leu、326Glu、330Arg、331Pro、332Tyr、333Glu、334Leu、335Ile、336Tyr、337Ala、338Ile、339Ala、340Asp、341His、342Thr、343Lys、344Ala、345Leu、346Thr、347Phe、348Met、349Leu、350Ala、351Asp、352Gly、353Val、354Ile、355Pro、356Ser、357Asn、358Val、359Lys、360Ala、361Gly、362Tyr、363Leu、364Ala、365Arg、366Leu、367Leu、368Ile、369Arg、370Lys、371Ser、372Ile、373Arg、374His、375Leu、376Arg、377Glu、378Leu、379Gly、380Leu、381Glu、383Pro、384Leu、385Ser、386Glu、387Ile、388Val、389Ala、390Met、391His、392Ile、393Lys、394Glu、395Leu、398Thr、399Phe、400Pro、401Glu、402Phe、403Lys、404Glu、405Met、406Glu、407Asp、408Val、409Ile、410Leu、411Asp、412Ile、415Val、416Glu、417Glu、418Lys、419Arg、420Tyr、422Glu、423Thr、424Leu、426Arg、427Gly、428Ser、430Leu、431Val、433Arg、434Glu、435Ile、437Lys、438Leu、439Lys、440Lys、442Gly、445Glu、447Pro、448Leu、449Glu、450Lys、451Leu、452Ile、453Leu、454Phe、455Tyr、456Glu、457Ser、458His、459Gly、460Leu、461Thr、462Pro、463Glu、464Ile、465Val、467Glu、468Ile、469Ala、470Glu、471Lys、472Glu、473Gly、475Lys、476Val、478Ile、479Pro、480Asp、481Asn、482Phe、483Tyr、484Ser、485Leu、486Val、487Ala、488Lys、490Ala和491Glu。
40.根据任何前述实施方案所述的AibRS;其中所述变体的特征进一步在于:
位置192为Trp、His、Val、Ile或Leu
位置193为Ala、Leu、Ile或Gly
位置213为Thr、Ser、Cys或Ala
位置216为Phe或Trp
位置217为Met、Ile或Leu
位置249为Thr、Ser、Val或Phe
位置360为Asn或Ala,
位置459为Glu或Ala。
41.根据任何前述实施方案所述的AibRS;其中所述变体的特征进一步在于:
位置192为His、Val、Ile或Leu
位置193为Ala、Leu、Ile或Gly
位置213为Thr、Ser、Cys或Ala
位置216为Phe或Trp
位置217为Met、Ile或Leu
位置249为Thr、Ser、Val或Phe
位置360为Ala,
位置459为Ala。
42.根据任何前述实施方案所述的AibRS;其中所述变体进一步包含一个或多个选自由以下组成的列表的氨基酸:192Trp、192His、192Val、192Ile、192Leu、193Ala、193Leu、193Ile、193Gly、213Thr、213Ser、213Cys、213Ala、216Phe、216Trp、217Met、217Ile、217Leu、249Thr、249Ser、249Val、249Phe、360Asn、360Ala、459Glu和459Ala。
43.根据任何前述实施方案所述的AibRS;其中所述变体进一步包含两个或更多个选自由以下组成的列表的氨基酸:192Trp、192His、192Val、192Ile、192Leu、193Ala、193Leu、193Ile、193Gly、213Thr、213Ser、213Cys、213Ala、216Phe、216Trp、217Met、217Ile、217Leu、249Thr、249Ser、249Val、249Phe、360Asn、360Ala、459Glu和459Ala。
44.根据任何前述实施方案所述的AibRS;其中所述变体进一步包含三个或更多个选自由以下组成的列表的氨基酸:192Trp、192His、192Val、192Ile、192Leu、193Ala、193Leu、193Ile、193Gly、213Thr、213Ser、213Cys、213Ala、216Phe、216Trp、217Met、217Ile、217Leu、249Thr、249Ser、249Val、249Phe、360Asn、360Ala、459Glu和459Ala。
45.根据任何前述实施方案所述的AibRS;其中所述变体进一步包含一个或多个选自由以下组成的列表的氨基酸:192His、192Val、192Ile、192Leu、193Leu、193Ile、193Gly、213Ser、213Cys、213Ala、216Trp、217Ile、217Leu、249Ser、249Val、249Phe、360Ala和459Ala。
46.根据任何前述实施方案所述的AibRS;其中所述变体进一步包含两个或更多个选自由以下组成的列表的氨基酸:192His、192Val、192Ile、192Leu、193Leu、193Ile、193Gly、213Ser、213Cys、213Ala、216Trp、217Ile、217Leu、249Ser、249Val、249Phe、360Ala和459Ala。
47.根据任何前述实施方案所述的AibRS;其中所述变体进一步包含三个或更多个选自由以下组成的列表的氨基酸:192His、192Val、192Ile、192Leu、193Leu、193Ile、193Gly、213Ser、213Cys、213Ala、216Trp、217Ile、217Leu、249Ser、249Val、249Phe、360Ala和459Ala。
48.根据任何前述实施方案所述的AibRS;其中所述变体选自由以下组成的列表:SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ IDNO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ IDNO:27、SEQ ID NO:28、SEQ ID NO:29和SEQ ID NO:30。
49.根据任何前述实施方案所述的AibRS;其中所述变体选自由以下组成的列表:SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ IDNO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ IDNO:28、SEQ ID NO:29和SEQ ID NO:30。
50.根据任何前述实施方案所述的AibRS;其中所述AibRS来源于古菌细菌。
51.根据任何前述实施方案所述的AibRS;其中所述AibRS来源于掘越氏火球菌(Pyrococcus horikoshii)。
52.根据任何前述实施方案所述的AibRS;其中所述AibRS被配置为执行用Aib对tRNA进行氨酰化的功能。
53.根据任何前述实施方案所述的AibRS;其中所述tRNA是抑制tRNA。
54.根据任何前述实施方案所述的AibRS;其中所述tRNA包含一个或多个编码Aib的反密码子。
55.根据任何前述实施方案所述的AibRS;其中所述编码Aib的tRNA的反密码子与终止密码子互补。
56.根据任何前述实施方案所述的AibRS;其中所述编码Aib的反密码子是CTA。
57.根据任何前述实施方案所述的AibRS;其中所述tRNA由SEQ ID NO:3或其变体编码。
58.根据任何前述实施方案所述的AibRS;其中所述编码tRNA的变体包含G3A突变。
59.根据任何前述实施方案所述的AibRS;其中所述编码tRNA的变体与SEQ ID NO:3至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少99%或至少100%相同。
60.根据任何前述实施方案所述的AibRS;其中所述编码tRNA的变体是SEQ ID NO:4。
61.根据任何前述实施方案所述的AibRS;其中所述tRNA由SEQ ID NO:4编码。
62.根据任何前述实施方案所述的AibRS;其中所述tRNA来源于古菌细菌。
63.根据任何前述实施方案所述的AibRS;其中所述tRNA来源于掘越氏火球菌(Pyrococcus horikoshii)。
64.根据任何前述实施方案所述的AibRS;其中所述AibRS被配置为在宿主细胞中执行用Aib对tRNA进行氨酰化的功能。
65.根据任何前述实施方案所述的AibRS;其中所述AibRS被配置为在大肠杆菌中执行用Aib对tRNA进行氨酰化的功能。
66.根据任何前述实施方案所述的AibRS;其中通过分析表达产物,即tRNA翻译后得到的多肽来确定所述功能的效率。
67.根据任何前述实施方案所述的AibRS;其中所述效率被表示为在预期针对Aib的位置处含有Aib的所得多肽与含有Ala或Aib的所得多肽的量之间的掺入比。
68.根据任何前述实施方案所述的AibRS;其中所述掺入比使用LC-MS来确定,并且如下基于质谱来计算:掺入比=[峰强度]含有Aib的多肽/([峰强度]含有Aib的多肽+[峰强度]含有Ala的多肽)*100%。
69.根据任何前述实施方案所述的AibRS;其中所述掺入比是至少1%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55、至少60%、至少65%或至少70%。
70.根据任何前述实施方案所述的AibRS在制备含有一个或多个Aib残基的所得多肽中的用途。
71.根据任何前述实施方案所述的AibRS的用途,其中含有一个或多个Aib残基的所得多肽是GLP-1类似物。
72.根据任何前述实施方案所述的AibRS的用途,其中含有一个或多个Aib残基的所得多肽包含SEQ ID NO:32。
73.制备化合物的方法,其包括以下步骤:
a.使用任何前述实施方案的AibRS制备含有一个或多个Aib残基的所得多肽
b.所得多肽的衍生化。
74.根据前述实施方案中任一项所述的方法,其中所得多肽包含SEQ ID NO:32。
75.根据前述实施方案中任一项所述的方法,其中所述化合物是化学式2:
Figure BDA0003220775120000381
76.根据前述实施方案中任一项所述的方法;其中所得多肽包含SEQ ID NO:32;并且其中所述化合物是是化学式2:
化学式2
Figure BDA0003220775120000382
77.根据前述实施方案中任一项所述的方法;其中所述衍生化引入化学式3的取代基:
化学式3
Figure BDA0003220775120000383
实施例
通用程序
SDS-PAGE
使用4-12%NuPAGETMBis-Tris作为本领域的标准进行SDS-PAGE以分析表达样品。对于凝胶和样品的制备,应用了供应商(Thermofisher)的方案。
用于表达tRNAAib、AibRS和靶多肽(即所得多肽)的质粒构建
tRNAAib、AibRS和靶多肽(即所得多肽)的表达从两个单独的质粒或单个质粒进行。在使用两个单独的质粒的情况下,每个质粒都包含单独的选择标记,即amp和kan抗性标记。在使用单个质粒的情况下,使用单个标记,即amp。tRNAAib、AibRS和靶多肽(即所得多肽)的表达由单独的启动子和终止子序列控制,即T7启动子和终止子控制靶多肽的表达,lac启动子和终止子控制AibRS的表达,lpp启动子和终止子控制tRNAAib的表达。优选地,tRNAAib针对tDNA的多个拷贝进行表达,即作为两个单独的3x多联体,其中每个多联体的表达分别由lpp启动子和终止子以及tet启动子和终止子控制。多联体中每个单独的tRNAAib由ValU-ValX操纵子接头以及IleT和AlaT操纵子接头隔开,以便能够被RNA酶处理以释放单独的tRNA分子。
大肠杆菌转化
大肠杆菌的转化按照Sambrook等人(1989)[Sambrook J,Fritsch EF,ManiatisT.;Molecular Cloning:A Laboratory Manual,第2版;Cold Spring Harbor LaboratoryPress:New York;1989]的标准方法进行,或按照Dower等人(1988)[Dower,W.J.,Miller,J.F.和Ragsdale,C.W.(1988)Nucleic Acids Res.16,6127-6145]所述在2-mm比色皿中使用设置为25μF、200ohm和2.5kV的Bio-Rad Gene Pulser通过电穿孔进行。转化的细胞在补充有适当选择性抗生素即氨苄青霉素和/或刀豆氨酸的LB培养基上进行选择。
大肠杆菌培养
用待测质粒转化的大肠杆菌TKO细胞(WO/2010/052335)取自冷冻原液或直接取自LB平板上的新鲜转化(使用适当的抗生素)。然后将细胞接种到装有8ml LB培养基加抗生素的50ml管旋生物反应器P50中。让细胞在37℃下以220rpm振摇生长5小时。将来自预培养物的细胞稀释到填充于125mL
Figure BDA0003220775120000391
一次性锥形瓶中的含有适当抗生素的20ml基本成分确定培养基(M9)中。加入Aib至10mM的浓度。将细胞在37℃下培养至OD600为1.0。通过添加1mM IPTG诱导靶蛋白表达,并在30℃或37℃下进一步培养至少4小时直至过夜。如下一段所述,通过超声处理和离心分离并收集包涵体级分。
样品制备和LC-MS方法
将对应于10OD的大肠杆菌细胞悬浮液以13000xg离心5分钟。将所得沉淀物重新悬浮在1ml 10mM磷酸钾pH 5.0缓冲液中,并以30%振幅、5″/5″开/关进行超声处理2分钟。在以13000xg重复离心5分钟后,将沉淀物部分用8M尿素/100mM DTT/50mM CAPS pH 12缓冲液溶解,并在室温下以2000xrpm振荡1小时。样品用0.2μm UPLC过滤器过滤,并通过LC-MS使用以下设置进行分析:
Figure BDA0003220775120000401
Figure BDA0003220775120000411
适用于在翻译过程中将2-氨基异丁酸掺入多肽中的tRNA合成酶和tRNA
先前已经报道了允许将非天然氨基酸系统地添加到大肠杆菌、酵母和哺乳动物细胞的遗传密码中的方法[Wals K.和Ovaa H;Unnatural amino acid incorporation inE.coli:current and future applications in the design of therapeutic proteins;Front Chem.Apr 1;2:15(2014)]、[Wang Q.和Wang L;Genetic incorporation ofunnatural amino acids into proteins in yeast;Methods Mol.Biol;794:199-213(2012)]和[Schmied WH,
Figure BDA0003220775120000412
SJ;Efficient multisite unnatural amino acidincorporation in mammalian cells via optimized pyrrolysyl tRNA synthetase/tRNA expression and engineered eRF1;Am Chem Soc.Nov 5;136(44):15577-83(2014)]。这些方法基于选择从远缘生物体中分离的正交tRNA/RS对,其使细胞能够响应于独特的密码子掺入给定氨基酸,而没有或具有减少的与内源宿主tRNA、RS或氨基酸的交叉反应。
为了将2-氨基异丁酸(Aib)特异性地掺入多肽中,可以开发能够向tRNA加载Aib的RS,并将其与其他翻译机制,例如宿主细胞(例如大肠杆菌)的内源部分一起使用。能够向tRNA加载Aib的RS在下文被称为2-氨基异丁酸-tRNA合成酶(AibRS)。加载有Aib的tRNA分子在下文被称为tRNAAib。AibRS和tRNAAib在下文统称为AibRS/tRNAAib对。
AibRS和tRNAAib可以方便地分别衍生自AlaRS和tRNAAla,因为Ala与Aib具有结构相似性。在理论上,AlaRS和tRNAAla可以起源于任何生物体。在这种情况下,AibRS和tRNAAib衍生自来自古菌细菌掘越氏火球菌(ph)的野生型AlaRS和野生型tRNAAla(分别被称为phAlaRS(wt)(SEQ ID NO:1)和phtRNAAla(wt)(SEQ ID NO:2))。在这种情况下,tRNAAib优化和AibRS开发是使用大肠杆菌作为模型系统进行的,尽管理论上任何宿主细胞都可以用于此目的。
tRNAAib的优化
实施例1
tRNAAib原则上可以是与AibRS同源的任何tRNA(例如tRNAAla)。然而,为了提高掺入Aib残基的翻译过程的效率,可以优化tRNA,以使不需要的翻译产物,例如含有Ala而不是Aib的多肽的形成减少。
为了避免Aib不希望地掺入所有编码Ala的位置,将phtRNAAla(wt)(SEQ ID NO:2)中的反密码子改变为CTA,与琥珀终止密码子TAG反向互补,从而产生抑制phtRNAAla(SEQ IDNO:3)。任何终止密码子原则上都可用于此目的。
抑制phtRNAAla(SEQ ID NO:3)与内源性大肠杆菌翻译系统不正交,这意味着抑制phtRNAAla(SEQ ID NO:3)可以被大肠杆菌的内源性AlaRS(ecAlaRS)识别,并用Ala而不是Aib进行氨酰化。为了有利于用Aib的氨酰化,可以在phtRNAAla(SEQ ID NO:3)中引入突变,以使其与ecAlaRS正交,同时保持其与AibRS的互补性。虽然此类突变可提供改进的效率,但它们原则上不是本发明起效所必需的。通过比对来自公共领域(即Genbank或EMBL)的序列,在phtRNAAla(wt)(SEQ ID NO:2)二级结构中形成G-U对的G3和T72 DNA核苷酸在不同物种之间的tRNAAla中是保守的。另外,对于其他古细菌已经证明,Aquifex aeolicus的tRNAAla中的G3A突变使tRNAAla无法被任何AlaRS识别[MA Swairjo等人;Alanyl-tRNA SynthetaseCrystal Structure,and Design for Acceptor-Stem Recognition;Molecular Cell,Vol.13,829–841,(2004)]。受Aquifex aeolicus中的观察结果的启发,制备了含有G3A突变的抑制phtRNAAla(SEQ ID NO:3),从而产生tRNAAib(SEQ ID NO:4)。
测试了抑制phtRNAAla(SEQ ID NO:3)和tRNAAib(SEQ ID NO:4)的正交性。在第一个样品中,通过标准质粒转化修饰大肠杆菌细胞,将编码抑制phtRNAAla(SEQ ID NO:3)和模型多肽MS-(Aib)-hsLeptin(SEQ ID NO:5)的外源DNA转移到细胞中。在第二个样品中,通过标准质粒转化修饰大肠杆菌细胞,将编码tRNAAib(SEQ ID NO:4)和模型多肽MS-(Aib)-hsLeptin(SEQ ID NO:5)的外源DNA转移到细胞中。理论上,如果内源ecAlaRS识别外源抑制phtRNAAla(SEQ ID NO:3),则全长模型多肽将被表达(尽管模型多肽MS-(Aib)-hsLeptin将含有Ala而不是Aib)。根据通用程序培养细胞,并通过SDS-PAGE进行分析。分析表明,在含有抑制phtRNAAla(SEQ ID NO:3)的细胞中表达了全长模型多肽,而在含有编码tRNAAib(SEQ IDNO:4)的DNA的细胞中没有(或很少)表达全长模型多肽,因此发现tRNAAib(SEQ ID NO:4)被ecAlaRS识别,但效率显著降低。
2-氨基异丁酸-tRNA合成酶(AibRS)的开发
实施例2
与Ala相比,2-氨基异丁酸(Aib)(化学式1)在α-碳位置包含额外的甲基,这使得Aib由于空间位阻而无法与phAlaRS(wt)相互作用。
化学式1(2-氨基异丁酸(Aib)):
Figure BDA0003220775120000441
phAlaRS(wt)的AlaRS II类核心催化域包含Ala结合口袋,是跨越野生型序列的位置1至263的氨基酸序列,并且是包含Ala结合和tRNAAla结合功能的N-末端结构域,在下文中被称为“aa1-495”。本研究中的所有构建体都省略了编辑和寡聚化结构域(aa496-915),因此以下所有RS构建体均基于phAlaRS(wt)的aa1-495部分(SEQ ID NO:6)。N-末端结构域(aa1-752)的phAlaRS(wt)晶体结构由M.Sokabe等人(2009)[Sokabe M,Ose T,Nakamura A,Tokunaga K,Nureki O,Yao M,Tanaka I;The structure of alanyl-tRNA synthetasewith editing domain;PNAS 106(27):11028-11033(2009)]发表。
AlaRS的丙氨酸结合口袋是基于在晶体结构2ZZG(与5″-O-(N-(L-丙氨酰基)-氨磺酰基氧基)腺嘌呤复合的丙氨酰基-tRNA合成酶的晶体结构,无寡聚化结构域)中有原子与丙氨酸C-α碳原子的距离比5埃更近的残基而计算的。通过加载2ZZG.pdb文件,选择A5A999.CA原子,然后选择在5埃以内的原子,在标准结构可视化软件,尤其是Accelrys VLViewer中计算距离。这些原子属于A99、M147、W192、T213、V215、D248、T249和G250。特别是,W192和V215与Aib的额外甲基的推定位置非常接近。据推测,这两个位置的突变可以容纳Aib的额外甲基。制备了phAlaRS(wt)的aa1-495部分(SEQ ID NO:6)的突变体,特别是测试了位置192的两个突变,即W192H和W192F,并且单独地以及与W192H组合地测试了位置215的一个突变,即V215G,总共产生四个突变体。此外,测试了phAlaRS(wt)的野生型aa1-495部分(SEQ ID NO:6)。
表1:phAlaRS(wt)的aa1-495部分(SEQ ID NO:6)的氨酰基-tRNA合成酶突变体
SEQ ID NO 突变
7 V215G
8 W192F
9 W192H
10 W192H;V215G
6 无突变(野生型)
通过标准质粒转化方法将突变体与一个拷贝的抑制phtRNAAla(SEQ ID NO:3)和编码模型多肽MS-(Aib)-hsLeptin(SEQ ID NO:5)的多核苷酸一起转化到大肠杆菌TKO细胞中。根据通用程序培养大肠杆菌细胞。用SDS-PAGE分析分离的包涵体级分。对于包含V215G和/或W192H突变的所有突变体(即SEQ ID NO:7、SEQ ID NO:9和SEQ ID NO:10),在约16kDa处观察到不同强度的条带(对于SEQ ID NO:8或野生型未观察到条带)。根据通用程序使用LC-MS分析溶解的包涵体,确认具有SEQ ID NO:7的样品中的条带代表一小部分表达的多肽MS-(Aib)-hsLeptin(SEQ ID NO:5)(实测[m/1]=16198.6;计算[m/1]=16198.4)。突变体的效率被表示为掺入比,并且如实施例3所述计算。SEQ ID NO:7的掺入比为=<10%.
实施例3
对于古菌闪烁古生球菌,已经报道了tRNAAla氨酰化机制可能基于单个GU对,对应于DNA多核苷酸中的G3和T72,并且参与该对相互作用的AlaRS的关键残基是N359和D450,并且对于掘越氏火球菌的AlaRS,两个相应的关键残基是N360和E459。此外,已经报道,AlaRS中的这些关键残基在古菌域中是保守的[M.Naganuma等人,Nature 510,第507–511页(2014)]。
将含有W192H、V215G、N360A和E459A突变的phAlaRS(wt)的aa1-495突变体(SEQ IDNO:11)按照通用程序在质粒上转化到大肠杆菌TKO细胞中,该质粒含有6个拷贝的tRNAAib(SEQ ID NO:4)和编码模型多肽IL21-H(Aib)-GLP-1(SEQ ID NO:31)的多核苷酸,其在位置1-24处包含来自IL-21蛋白的包涵体诱导区,和含Aib的GLP-1类似物区域。含Aib的GLP-1区与司美格鲁肽的多肽骨架(SEQ ID NO:32)相同[Lau J.等人,Discovery of the once-weekly glucagon-like peptide-1(GLP-1)analogue semaglutide,J.Med.Chem.,2015;58:7370-7380]。根据通用程序培养大肠杆菌细胞并通过SDS-PAGE进行分析。在约8kDa处鉴定到强条带,并且LC-MS证实模型多肽IL21-H(Aib)-GLP-1(SEQ ID NO:31)已表达(实测[m/1]=8324.6;计算[m/1]=8324.3)。Aib功能的效率被表示为在编码Aib的位置处含有Aib的所得多肽的量与含有Aib或Ala的所得多肽的量之间的掺入比,并且如下基于质谱来计算:掺入比=[峰强度]含有Aib的多肽/([峰强度]含有Aib的多肽+[峰强度]含有Ala的多肽)*100%。SEQ ID NO:11的掺入比经计算为63%。
实施例4
按照实施例3中描述的程序制备并测试包含W192H、V215G、M217I、N360A和E459A的phAlaRS(wt)的aa1-495的突变体(SEQ ID NO:12)。LC-MS证实模型多肽IL21-H(Aib)-GLP-1(SEQ ID NO:12)已表达(实测[m/1]=8324.6;计算[m/1]=8324.3)。计算出的掺入比为82%。
实施例5
按照实施例3中描述的程序制备并测试包含W192H、V215G、M217L、N360A和E459A的phAlaRS(wt)的aa1-495的突变体(SEQ ID NO:13)。LC-MS证实模型多肽IL21-H(Aib)-GLP-1(SEQ ID NO:13)已表达(实测[m/1]=8324.6;计算[m/1]=8324.3)。计算出的掺入比为66%。
实施例6
按照实施例3中描述的程序制备并测试包含W192H、V215G、A193L、N360A和E459A的phAlaRS(wt)的aa1-495的突变体(SEQ ID NO:14)。LC-MS证实模型多肽IL21-H(Aib)-GLP-1(SEQ ID NO:14)已表达(实测[m/1]=8324.6;计算[m/1]=8324.3)。计算出的掺入比为71%。
实施例7
按照实施例3中描述的程序制备并测试包含W192H、V215G、F216W、N360A和E459A的phAlaRS(wt)的aa1-495的突变体(SEQ ID NO:15)。LC-MS证实模型多肽IL21-H(Aib)-GLP-1(SEQ ID NO:15)已表达(实测[m/1]=8324.6;计算[m/1]=8324.3)。计算出的掺入比为66%。
实施例8
按照实施例3中描述的程序制备并测试包含W192H、V215G、A193L、F216W、N360A和E459A的phAlaRS(wt)的aa1-495的突变体(SEQ ID NO:16)。LC-MS证实模型多肽IL21-H(Aib)-GLP-1(SEQ ID NO:16)已表达(实测[m/1]=8324.6;计算[m/1]=8324.3)。计算出的掺入比为63%。
实施例9
按照实施例3中描述的程序制备并测试包含W192H、V215G和A193I、N360A和E459A的phAlaRS(wt)的aa1-495的突变体(SEQ ID NO:17)。LC-MS证实模型多肽IL21-H(Aib)-GLP-1(SEQ ID NO:16)已表达(实测[m/1]=8324.8;计算[m/1]=8324.3)。计算出的掺入比为60%。
实施例10
按照实施例3中描述的程序制备并测试包含W192H、V215G、A193I、M217I、N360A和E459A的phAlaRS(wt)的aa1-495的突变体(SEQ ID NO:18)。LC-MS证实模型多肽IL21-H(Aib)-GLP-1(SEQ ID NO:16)已表达(实测[m/1]=8324.6;计算[m/1]=8324.3)。计算出的掺入比为72%。
实施例11
按照实施例3中描述的程序制备并测试包含W192H、V215G、A193L、M217I、N360A和E459A的phAlaRS(wt)的aa1-495的突变体(SEQ ID NO:19)。LC-MS证实模型多肽IL21-H(Aib)-GLP-1(SEQ ID NO:16)已表达(实测[m/1]=8324.6;计算[m/1]=8324.3)。计算出的掺入比为82%。
实施例12
按照实施例3中描述的程序制备并测试包含W192H、V215G、A193I、M217L、N360A和E459A的phAlaRS(wt)的aa1-495的突变体(SEQ ID NO:20)。LC-MS证实模型多肽IL21-H(Aib)-GLP-1(SEQ ID NO:16)已表达(实测[m/1]=8324.8;计算[m/1]=8324.3)。计算出的掺入比为51%。
实施例13
按照实施例3中描述的程序制备并测试包含W192H、V215G、A193L、M217L、N360A和E459A的phAlaRS(wt)的aa1-495的突变体(SEQ ID NO:21)。LC-MS证实模型多肽IL21-H(Aib)-GLP-1(SEQ ID NO:21)已表达(实测[m/1]=8324.8;计算[m/1]=8324.3)。计算出的掺入比为57%。
实施例14
按照实施例3中描述的程序制备并测试包含W192V、V215G、M217I、N360A和E459A的phAlaRS(wt)的aa1-495的突变体(SEQ ID NO:22)。LC-MS证实模型多肽IL21-H(Aib)-GLP-1(SEQ ID NO:16)已表达(实测[m/1]=8324.4;计算[m/1]=8324.3)。计算出的掺入比为77%。
实施例15
按照实施例3中描述的程序制备并测试包含W192I、V215G、M217I、N360A和E459A的phAlaRS(wt)的aa1-495的突变体(SEQ ID NO:23)。LC-MS证实模型多肽IL21-H(Aib)-GLP-1(SEQ ID NO:16)已表达(实测[m/1]=8324.4;计算[m/1]=8324.3)。计算出的掺入比为74%。
实施例16
按照实施例3中描述的程序制备并测试包含W192L、V215G、M217I、N360A和E459A的phAlaRS(wt)的aa1-495的突变体(SEQ ID NO:24)。LC-MS证实模型多肽IL21-H(Aib)-GLP-1(SEQ ID NO:16)已表达(实测[m/1]=8325.0;计算[m/1]=8324.3)。计算出的掺入比为54%。
实施例17
按照实施例3中描述的程序制备并测试包含W192H、A193G、V215G、M217I、N360A和E459A的phAlaRS(wt)的aa1-495的突变体(SEQ ID NO:25)。LC-MS证实模型多肽IL21-H(Aib)-GLP-1(SEQ ID NO:16)已表达(实测[m/1]=8324.4;计算[m/1]=8324.3)。计算出的掺入比为86%。
实施例18
按照实施例3中描述的程序制备并测试包含W192H、T213S、V215G、N360A和E459A的phAlaRS(wt)的aa1-495的突变体(SEQ ID NO:26)。LC-MS证实模型多肽IL21-H(Aib)-GLP-1(SEQ ID NO:16)已表达(实测[m/1]=8324.2;计算[m/1]=8324.3)。计算出的掺入比为56%。
实施例19
按照实施例3中描述的程序制备并测试包含W192H、V215G、T249S、N360A和E459A的phAlaRS(wt)的aa1-495的突变体(SEQ ID NO:27)。LC-MS证实模型多肽IL21-H(Aib)-GLP-1(SEQ ID NO:16)已表达(实测[m/1]=8325.0;计算[m/1]=8324.3)。计算出的掺入比为67%。
实施例20
按照实施例3中描述的程序制备并测试包含W192H、V215G、T249V、N360A和E459A的phAlaRS(wt)的aa1-495的突变体(SEQ ID NO:28)。LC-MS证实模型多肽IL21-H(Aib)-GLP-1(SEQ ID NO:16)已表达(实测[m/1]=8324.8;计算[m/1]=8324.3)。计算出的掺入比为78%。
实施例21
按照实施例3中描述的程序制备并测试包含W192H、T213C、V215G、T249V、N360A和E459A的phAlaRS(wt)的aa1-495的突变体(SEQ ID NO:29)。LC-MS证实模型多肽IL21-H(Aib)-GLP-1(SEQ ID NO:16)已表达(实测[m/1]=8324.8;计算[m/1]=8324.3)。计算出的掺入比为82%。
实施例22
按照实施例3中描述的程序制备并测试包含W192H、T213A、V215G、T249F、N360A和E459A的phAlaRS(wt)的aa1-495的突变体(SEQ ID NO:30)。LC-MS证实模型多肽IL21-H(Aib)-GLP-1(SEQ ID NO:16)已表达(实测[m/1]=8324.6;计算[m/1]=8324.3)。计算出的掺入比为83%。
实施例23
通过使用SEQ ID NO:6作为针对“所有非冗余GenBank CDS翻译+PDB+SwissProt+PIR+PRF”的查询序列,并使用NCBI在线blastp套件,从NCBI序列数据库中提取与phAlaRS(wt)的aa1-495部分(SEQ ID NO:6)最相同的100个序列来制备古菌AlaRS的共有序列。将提取的序列在N末端和C末端修剪至与SEQ ID NO:6相同的长度(以去除N末端延伸和C末端编辑结构域),然后使用标准比对算法进行比对,尤其是使用采用Blosum62矩阵的MultipleAlign的
Figure BDA0003220775120000501
10.2.2软件。通过将比对中所有序列之间的同一性阈值分别设置为85%、75%或50%来创建三个共有序列,以表明氨基酸位置是否保守。然后将共有序列中的给定氨基酸位置表示为具体氨基酸——如果在设定阈值以上保守——或者代表任何氨基酸的Xaa——如果在阈值以上不保守。表2提供了共有序列。随着NCBI基因组数据库的定期更新,共有序列可能会随着时间的推移而改变。
表2:基于SEQ ID NO:6的古菌AlaRS的共有序列
Figure BDA0003220775120000511
Figure BDA0003220775120000521
Figure BDA0003220775120000531
1Xaa表示任何氨基酸
请求保护的AibRS可以根据共有序列来限定,例如作为共有序列的变体。被限定为共有序列变体的请求保护的AibRS可以通过共有序列的保守氨基酸(即未指定为Xaa的氨基酸)与参考序列之间的指定序列同一性水平进一步限定。在这种情况下,应当理解,请求保护的共有序列变体可以在保守氨基酸位置处具有一定程度的变异,使其落入由共有序列与参考序列之间的指定序列同一性设定的限度内。被限定为共有序列变体的请求保护的AibRS的非限制性实例提供如下:
A.包含SEQ ID NO:7的氨基酸序列或其变体的2-氨基异丁酸-tRNA合成酶(AibRS),其中所述SEQ ID NO:7的变体包含215Gly。
B.根据权利要求A所述的AibRS;其中所述SEQ ID NO:7的变体是式I的变体,其中式I是:
Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Phe-Xaa-Glu-Xaa-Gly-Xaa-Xaa-Xaa-Lys-Xaa-Cys-Xaa-Xaa-Cys-Gly-Xaa-Xaa-Phe-Trp-Thr-Xaa-Xaa-Xaa-Xaa-Arg-Xaa-Xaa-Cys-Gly-Asp-Xaa-Pro-Cys-Xaa-Xaa-Tyr-Xaa-Phe-Ile-Gly-Xaa-Pro-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Leu-Xaa-Glu-Xaa-Arg-Xaa-Xaa-Phe-Xaa-Xaa-Phe-Phe-Glu-Xaa-Xaa-Xaa-His-Xaa-Xaa-Xaa-Xaa-Arg-Tyr-Pro-Val-Xaa-Xaa-Arg-Trp-Arg-Asp-Asp-Val-Xaa-Leu-Val-Gly-Ala-Ser-Ile-Xaa-Asp-Phe-Gln-Pro-Trp-Val-Xaa-Xaa-Gly-Xaa-Xaa-Xaa-Pro-Pro-Ala-Asn-Pro-Leu-Xaa-Ile-Ser-Gln-Pro-Xaa-Ile-Arg-Xaa-Xaa-Asp-Xaa-Asp-Xaa-Val-Gly-Xaa-Xaa-Gly-Arg-His-Xaa-Thr-Xaa-Phe-Glu-Met-Met-Ala-His-His-Ala-Phe-Asn-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Tyr-Trp-Xaa-Xaa-Glu-Thr-Val-Xaa-Xaa-Xaa-Xaa-Xaa-Phe-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Ile-Thr-Phe-Xaa-Glu-Xaa-Xaa-Trp-Xaa-Gly-Gly-Gly-Asn-Ala-Gly-Xaa-Xaa-Xaa-Glu-Val-Xaa-Xaa-Xaa-Gly-Xaa-Glu-Xaa-Ala-Thr-Leu-Val-Phe-Met-Xaa-Tyr-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Pro-Xaa-Xaa-Xaa-Xaa-Xaa-Val-Asp-Thr-Gly-Tyr-Gly-Leu-Glu-Arg-Xaa-Xaa-Trp-Xaa-Ser-Xaa-Gly-Xaa-Pro-Thr-Xaa-Tyr-Asp-Ala-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Leu-Xaa-Xaa-Xaa-Ala-Gly-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Ile-Leu-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Ala-Gly-Xaa-Xaa-Asp-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Leu-Xaa-Xaa-Leu-Arg-Xaa-Xaa-Val-Ala-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Glu-Leu-Xaa-Xaa-Xaa-Xaa-Xaa-Pro-Xaa-Glu-Xaa-Xaa-Tyr-Ala-Ile-Ala-Asp-His-Thr-Xaa-Xaa-Leu-Xaa-Phe-Met-Leu-Xaa-Asp-Gly-Val-Xaa-Pro-Ser-Asn-Xaa-Xaa-Ala-Gly-Tyr-Leu-Ala-Arg-Leu-Xaa-Ile-Arg-Xaa-Xaa-Xaa-Arg-Xaa-Xaa-Xaa-Xaa-Leu-Gly-Xaa-Xaa-Xaa-Pro-Leu-Xaa-Xaa-Ile-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Pro-Glu-Xaa-Xaa-Glu-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Glu-Glu-Xaa-Xaa-Xaa-Xaa-Xaa-Thr-Xaa-Xaa-Arg-Gly-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Lys-Xaa-Xaa-Gly-Xaa-Xaa-Xaa-Xaa-Pro-Xaa-Xaa-Xaa-Leu-Xaa-Xaa-Xaa-Tyr-Xaa-Ser-His-Gly-Xaa-Xaa-Pro-Glu-Xaa-Xaa-Xaa-Glu-Xaa-Ala-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Val-Xaa-Xaa-Pro-Asp-Asn-Phe-Tyr-Xaa-Xaa-Val-Ala-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa
其中每个Xaa独立地选择,并且是一个或多个氨基酸,或不存在;
其中所述式I的变体在未指定为Xaa的位置处与SEQ ID NO:7至少90%相同。
在该示例中,权利要求B的权利要求语言将所请求保护的AibRS限定为共有序列的变体,即式I的变体。此外,权利要求B的权利要求语言限定了式I的变体在未指定为Xaa的位置处与SEQ ID NO:7至少90%相同,意味着与SEQ ID NO:7相比,保守氨基酸允许10%的变异。根据权利要求A(权利要求B所从属的权利要求),位置215必须是Gly。然而,式I将位置215限定为Val,因为权利要求B请求保护的AibRS被限定为式I的变体(而不是式I本身),如上所述,允许保守氨基酸的变异,因此请求保护的式I的变体可以在位置215处包含Gly,因此权利要求A与B之间不存在矛盾。
虽然本文已经阐述并描述了本发明的某些特征,但是本领域普通技术人员现在将会想到许多修改、替换、改变和等同方案。因此,应当理解,意欲以所附权利要求书涵盖所有这些落入本发明真正范围内的修改和改变。
Figure IDA0003220775190000011
Figure IDA0003220775190000021
Figure IDA0003220775190000031
Figure IDA0003220775190000041
Figure IDA0003220775190000051
Figure IDA0003220775190000061
Figure IDA0003220775190000071
Figure IDA0003220775190000081
Figure IDA0003220775190000091
Figure IDA0003220775190000101
Figure IDA0003220775190000111
Figure IDA0003220775190000121
Figure IDA0003220775190000131
Figure IDA0003220775190000141
Figure IDA0003220775190000151
Figure IDA0003220775190000161
Figure IDA0003220775190000171
Figure IDA0003220775190000181
Figure IDA0003220775190000191
Figure IDA0003220775190000201
Figure IDA0003220775190000211
Figure IDA0003220775190000221
Figure IDA0003220775190000231
Figure IDA0003220775190000241
Figure IDA0003220775190000251
Figure IDA0003220775190000261
Figure IDA0003220775190000271
Figure IDA0003220775190000281
Figure IDA0003220775190000291
Figure IDA0003220775190000301
Figure IDA0003220775190000311
Figure IDA0003220775190000321
Figure IDA0003220775190000331
Figure IDA0003220775190000341
Figure IDA0003220775190000351
Figure IDA0003220775190000361
Figure IDA0003220775190000371
Figure IDA0003220775190000381
Figure IDA0003220775190000391
Figure IDA0003220775190000401
Figure IDA0003220775190000411
Figure IDA0003220775190000421
Figure IDA0003220775190000431
Figure IDA0003220775190000441
Figure IDA0003220775190000451
Figure IDA0003220775190000461
Figure IDA0003220775190000471
Figure IDA0003220775190000481
Figure IDA0003220775190000491
Figure IDA0003220775190000501
Figure IDA0003220775190000511
Figure IDA0003220775190000521
Figure IDA0003220775190000531
Figure IDA0003220775190000541
Figure IDA0003220775190000551
Figure IDA0003220775190000561

Claims (14)

1.包含SEQ ID NO:7的氨基酸序列或其变体的2-氨基异丁酸-tRNA合成酶(AibRS),其中所述SEQ ID NO:7的变体包含215Gly。
2.根据任何前述权利要求所述的AibRS;其中所述SEQ ID NO:7的变体是式I的变体,其中式I是:
Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Phe-Xaa-Glu-Xaa-Gly-Xaa-Xaa-Xaa-Lys-Xaa-Cys-Xaa-Xaa-Cys-Gly-Xaa-Xaa-Phe-Trp-Thr-Xaa-Xaa-Xaa-Xaa-Arg-Xaa-Xaa-Cys-Gly-Asp-Xaa-Pro-Cys-Xaa-Xaa-Tyr-Xaa-Phe-Ile-Gly-Xaa-Pro-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Leu-Xaa-Glu-Xaa-Arg-Xaa-Xaa-Phe-Xaa-Xaa-Phe-Phe-Glu-Xaa-Xaa-Xaa-His-Xaa-Xaa-Xaa-Xaa-Arg-Tyr-Pro-Val-Xaa-Xaa-Arg-Trp-Arg-Asp-Asp-Val-Xaa-Leu-Val-Gly-Ala-Ser-Ile-Xaa-Asp-Phe-Gln-Pro-Trp-Val-Xaa-Xaa-Gly-Xaa-Xaa-Xaa-Pro-Pro-Ala-Asn-Pro-Leu-Xaa-Ile-Ser-Gln-Pro-Xaa-Ile-Arg-Xaa-Xaa-Asp-Xaa-Asp-Xaa-Val-Gly-Xaa-Xaa-Gly-Arg-His-Xaa-Thr-Xaa-Phe-Glu-Met-Met-Ala-His-His-Ala-Phe-Asn-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Tyr-Trp-Xaa-Xaa-Glu-Thr-Val-Xaa-Xaa-Xaa-Xaa-Xaa-Phe-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Ile-Thr-Phe-Xaa-Glu-Xaa-Xaa-Trp-Xaa-Gly-Gly-Gly-Asn-Ala-Gly-Xaa-Xaa-Xaa-Glu-Val-Xaa-Xaa-Xaa-Gly-Xaa-Glu-Xaa-Ala-Thr-Leu-Val-Phe-Met-Xaa-Tyr-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Pro-Xaa-Xaa-Xaa-Xaa-Xaa-Val-Asp-Thr-Gly-Tyr-Gly-Leu-Glu-Arg-Xaa-Xaa-Trp-Xaa-Ser-Xaa-Gly-Xaa-Pro-Thr-Xaa-Tyr-Asp-Ala-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Leu-Xaa-Xaa-Xaa-Ala-Gly-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Ile-Leu-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Ala-Gly-Xaa-Xaa-Asp-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Leu-Xaa-Xaa-Leu-Arg-Xaa-Xaa-Val-Ala-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Glu-Leu-Xaa-Xaa-Xaa-Xaa-Xaa-Pro-Xaa-Glu-Xaa-Xaa-Tyr-Ala-Ile-Ala-Asp-His-Thr-Xaa-Xaa-Leu-Xaa-Phe-Met-Leu-Xaa-Asp-Gly-Val-Xaa-Pro-Ser-Asn-Xaa-Xaa-Ala-Gly-Tyr-Leu-Ala-Arg-Leu-Xaa-Ile-Arg-Xaa-Xaa-Xaa-Arg-Xaa-Xaa-Xaa-Xaa-Leu-Gly-Xaa-Xaa-Xaa-Pro-Leu-Xaa-Xaa-Ile-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Pro-Glu-Xaa-Xaa-Glu-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Glu-Glu-Xaa-Xaa-Xaa-Xaa-Xaa-Thr-Xaa-Xaa-Arg-Gly-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Lys-Xaa-Xaa-Gly-Xaa-Xaa-Xaa-Xaa-Pro-Xaa-Xaa-Xaa-Leu-Xaa-Xaa-Xaa-Tyr-Xaa-Ser-His-Gly-Xaa-Xaa-Pro-Glu-Xaa-Xaa-Xaa-Glu-Xaa-Ala-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa-Val-Xaa-Xaa-Pro-Asp-Asn-Phe-Tyr-Xaa-Xaa-Val-Ala-Xaa-Xaa-Xaa-Xaa-Xaa-Xaa
其中式I的每个Xaa独立地选择,并且是一个或多个氨基酸,或不存在;
其中所述式I的变体在未指定为Xaa的位置处与SEQ ID NO:7至少90%相同。
3.根据任何前述权利要求所述的AibRS,其中所述SEQ ID NO:7的变体与SEQ ID NO:7至少41%相同。
4.根据任何前述权利要求所述的AibRS,其中所述SEQ ID NO:7的变体与SEQ ID NO:7至少55%相同。
5.根据任何前述权利要求所述的AibRS,其中所述SEQ ID NO:7的变体与SEQ ID NO:7至少90%相同。
6.根据任何前述权利要求所述的AibRS,其中所述SEQ ID NO:7的变体的特征在于:
位置192为Trp、His、Val、Ile或Leu
位置193为Ala、Leu、Ile或Gly
位置213为Thr、Ser、Cys或Ala
位置216为Phe或Trp
位置217为Met、Ile或Leu
位置249为Thr、Ser、Val或Phe
位置360为Asn或Ala,
位置459为Glu或Ala。
7.根据任何前述权利要求所述的AibRS;其中所述SEQ ID NO:7的变体包含:[192His;215Gly]、[192His;215Gly;360Ala;459Ala]、[192His;215Gly;217Ile;360Ala;459Ala]、[192His;215Gly;217Leu;360Ala;459Ala]、[192His;215Gly;193Leu;360Ala;459Ala]、[192His;215Gly;216Trp;360Ala;459Ala]、[192His;215Gly;193Leu;216Trp;360Ala;459Ala]、[192His;215Gly;193Ile;360Ala;459Ala]、[192His;215Gly;193Ile;217Ile;360Ala;459Ala]、[192His;215Gly;193Leu;217Ile;360Ala;459Ala]、[192His;215Gly;193Ile;217Leu;360Ala.459Ala]、[192His;215Gly;193Leu;217Leu;360Ala;459Ala]、[192Val;215Gly;217Ile;360Ala;459Ala]、[192Ile;215Gly;217Ile;360Ala;459Ala]、[192Leu;215Gly;217Ile;360Ala;459Ala]、[192His;193Gly;215Gly;217Ile;360Ala;459Ala]、[192His;213Ser;215Gly;360Ala;459Ala]、[192His;215Gly;249Ser;360Ala;459Ala]、[192His;215Gly;249Val;360Ala;459Ala]、[192His;213Cys;215Gly;249Val;360Ala;459Ala]或[192His;213Ala;215Gly;249Phe;360Ala;459Ala]。
8.根据任何前述权利要求所述的AibRS;其中所述SEQ ID NO:7的变体选自由以下组成的列表:SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQID NO:27、SEQ ID NO:28、SEQ ID NO:29和SEQ ID NO:30。
9.根据任何前述权利要求所述的AibRS;其中所述AibRS被配置为执行用Aib对tRNA进行氨酰化的功能。
10.根据权利要求7-9所述的AibRS;其中所述tRNA是抑制tRNA。
11.根据任何前述权利要求所述的AibRS在制备含有一个或多个Aib残基的所得多肽中的用途。
12.根据权利要求11所述的AibRS的用途;其中所得多肽包含SEQ ID NO:32。
13.制备化合物的方法,其包括以下步骤:
i.使用任何前述权利要求的AibRS制备含有一个或多个Aib残基的所得多肽,
ii.所得多肽的衍生化。
14.根据权利要求13所述的方法;其中所述化合物是化学式2:
化学式2:
Figure FDA0003220775110000041
CN202080015621.0A 2019-02-20 2020-02-19 氨酰基-tRNA合成酶及其用途 Pending CN113454211A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
CN2019075525 2019-02-20
CNPCT/CN2019/075525 2019-02-20
EP19172611.6 2019-05-03
EP19172611 2019-05-03
PCT/EP2020/054343 WO2020169658A2 (en) 2019-02-20 2020-02-19 Aminoacyl-trna synthetases and uses hereof

Publications (1)

Publication Number Publication Date
CN113454211A true CN113454211A (zh) 2021-09-28

Family

ID=69528860

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080015621.0A Pending CN113454211A (zh) 2019-02-20 2020-02-19 氨酰基-tRNA合成酶及其用途

Country Status (6)

Country Link
US (1) US20220251535A1 (zh)
EP (1) EP3927815A2 (zh)
JP (1) JP7495420B2 (zh)
CN (1) CN113454211A (zh)
MA (1) MA55008A (zh)
WO (1) WO2020169658A2 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4368722A1 (en) * 2021-07-07 2024-05-15 Ajinomoto Co., Inc. Method for secretory production of unnatural-amino-acid-containing protein

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020042097A1 (en) * 2000-05-26 2002-04-11 Tirrell David A. Overexpression of aminoacyl-tRNA synthetases for efficient production of engineered proteins containing amino acid analogues
CN1477195A (zh) * 2002-08-23 2004-02-25 上海博德基因开发有限公司 一种多肽——人甲硫氨酰tRNA合成酶29和编码这种多肽的多核苷酸
CN101048506A (zh) * 2004-10-27 2007-10-03 斯克利普斯研究院 体内掺入非天然氨基酸的正交翻译组分
CN101151366A (zh) * 2004-09-21 2008-03-26 斯克利普斯研究院 将炔基氨基酸体内掺入真细菌的蛋白
WO2013049234A2 (en) * 2011-09-26 2013-04-04 Novartis Ag Dual function proteins for treating metabolic disorders

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI362392B (en) 2005-03-18 2012-04-21 Novo Nordisk As Acylated glp-1 compounds
CN102209725B (zh) 2008-11-10 2016-02-24 诺沃—诺迪斯克有限公司 缺乏功能性ii组荚膜基因簇的大肠埃希氏菌bl21菌株

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020042097A1 (en) * 2000-05-26 2002-04-11 Tirrell David A. Overexpression of aminoacyl-tRNA synthetases for efficient production of engineered proteins containing amino acid analogues
CN1477195A (zh) * 2002-08-23 2004-02-25 上海博德基因开发有限公司 一种多肽——人甲硫氨酰tRNA合成酶29和编码这种多肽的多核苷酸
CN101151366A (zh) * 2004-09-21 2008-03-26 斯克利普斯研究院 将炔基氨基酸体内掺入真细菌的蛋白
CN101048506A (zh) * 2004-10-27 2007-10-03 斯克利普斯研究院 体内掺入非天然氨基酸的正交翻译组分
CN102827827A (zh) * 2004-10-27 2012-12-19 斯克利普斯研究院 体内掺入非天然氨基酸的正交翻译组分
WO2013049234A2 (en) * 2011-09-26 2013-04-04 Novartis Ag Dual function proteins for treating metabolic disorders

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
J CHRISTOPHER ANDERSON等: "An expanded genetic code with a functional quadruplet codon", 《PROC NATL ACAD SCI U S A 》 *
JESPER LAU等: "Discovery of the Once-Weekly Glucagon-Like Peptide-1 (GLP-1) Analogue Semaglutide", 《J MED CHEM 》 *
KOUSUKE TSUCHIYA等: "Chemoenzymatic synthesis of polypeptides containing the unnatural amino acid 2-aminoisobutyric acid", 《CHEMICAL COMMUNICATIONS》 *

Also Published As

Publication number Publication date
JP2022521321A (ja) 2022-04-06
WO2020169658A2 (en) 2020-08-27
EP3927815A2 (en) 2021-12-29
JP7495420B2 (ja) 2024-06-04
MA55008A (fr) 2021-12-29
WO2020169658A3 (en) 2020-11-05
US20220251535A1 (en) 2022-08-11

Similar Documents

Publication Publication Date Title
JP4990792B2 (ja) アミノアシル−tRNAシンテターゼの組成物およびこの使用
CN112795551B (zh) 一种耐高温逆转录酶突变体及其应用
US9340790B2 (en) Method for constructing recombinant bacterium for producing non-native protein, and utilization of same
CN111491945A (zh) cAMP受体蛋白变体和使用其生产L-氨基酸的方法
EP2221370B1 (en) Process for production of non-natural protein having ester bond therein
CN112795546B (zh) 一种具有高逆转录效率的耐高温逆转录酶突变体及其应用
CN111491946A (zh) cAMP受体蛋白变体和使用其生产L-氨基酸的方法
CN116113643A (zh) 合成表达系统
CN115485380A (zh) 用于正交用途的古细菌吡咯赖氨酰tRNA合成酶
WO2007061136A1 (ja) 非天然型アミノ酸を組み込んだタンパク質の製造方法
CN112795550B (zh) 耐高温逆转录酶突变体
CN112795547B (zh) 高逆转录效率的逆转录酶突变体
WO2010114615A2 (en) A facile system for encoding unnatural amino acids in mammalian cells
CN112795548A (zh) 具有高逆转录效率的耐高温逆转录酶突变体及其应用
CN112342178B (zh) 重组微生物、其制备方法及在生产塔格糖中的应用
CN113454211A (zh) 氨酰基-tRNA合成酶及其用途
KR20220116505A (ko) 히스티딘, 퓨린 경로 대사산물, 및 플라스미드 dna의 향상된 생성
Fu et al. Improving the efficiency and orthogonality of genetic code expansion
EP4230723A1 (en) Polypeptide with aspartate kinase activity and use thereof in production of amino acid
CN112795549B (zh) 一种逆转录酶突变体
CN115838712B (zh) 具有肌肽水解酶功能的蛋白酶及其在l-肌肽合成中的应用
KR102031886B1 (ko) 신규한 프로모터 및 이의 용도
US20240002847A1 (en) Synthetic methanol inducible promoters and uses thereof
KR102016050B1 (ko) 신규한 프로모터 및 이의 용도
Nadirova et al. Cloning of cDNA-gene of Arabidopsis thaliana ribosomal protein S6, its expression in Escherichia coli and purification of AtRPS6B1 recombinant protein

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination