CN117881779A - 微生物及其用途 - Google Patents

微生物及其用途 Download PDF

Info

Publication number
CN117881779A
CN117881779A CN202180101101.6A CN202180101101A CN117881779A CN 117881779 A CN117881779 A CN 117881779A CN 202180101101 A CN202180101101 A CN 202180101101A CN 117881779 A CN117881779 A CN 117881779A
Authority
CN
China
Prior art keywords
trna
prokaryotic cell
type
codon
endogenous
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180101101.6A
Other languages
English (en)
Inventor
W·E·罗伯森
L·F·H·芬克
D·德拉托尔
J·弗雷登斯
T·S·埃利奥特
D·L·东克尔曼
J·C·W·威利斯
A·T·贝蒂
J·W·钦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
United Kingdom Research and Innovation
Original Assignee
United Kingdom Research and Innovation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by United Kingdom Research and Innovation filed Critical United Kingdom Research and Innovation
Publication of CN117881779A publication Critical patent/CN117881779A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/93Ligases (6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • C12N15/1024In vivo mutagenesis using high mutation rate "mutator" host strains by inserting genetic material, e.g. encoding an error prone polymerase, disrupting a gene for mismatch repair
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales
    • C12R2001/185Escherichia
    • C12R2001/19Escherichia coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y601/00Ligases forming carbon-oxygen bonds (6.1)
    • C12Y601/01Ligases forming aminoacyl-tRNA and related compounds (6.1.1)

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Virology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Immobilizing And Processing Of Enzymes And Microorganisms (AREA)

Abstract

本发明涉及用于生产含有非经典氨基酸的聚合物的原核细胞以及制备所述细胞的方法。本发明还涉及由本发明的细胞产生的新的可获得的聚合物。另外,本发明还涉及新的正交氨酰基‑tRNA合成酶(aaRS)和正交tRNA,其可以成对使用并在宿主细胞(例如但不限于本发明的原核细胞)中应用。

Description

微生物及其用途
发明领域
本发明涉及用于生产含有非经典氨基酸的聚合物的新的原核细胞以及制备所述细胞的方法。本发明还涉及由本发明的原核细胞生产的新的可获得的聚合物。另外,本发明还涉及新的正交氨酰基-tRNA合成酶(aaRS)和正交tRNA,其可以成对使用并在宿主细胞(例如但不限于本发明的原核细胞)中应用。
发明背景
自然界使用64种三联密码子来编码由20种经典氨基酸组成的蛋白的合成,并且大多数氨基酸是由多于一种同义密码子编码。一个普遍的假设是,去除有义密码子和从基因组中读取它们的tRNA可能会使产生的细胞具有多种自然生物学中未发现的特性,包括新的病毒抵抗模式和编码非经典杂聚物生物合成的能力(3-6)。然而,这些假设尚未经过实验检验,因此仍然只是猜想。
从大肠杆菌中去除释放因子-1(RF-1)(从而去除在TAG终止密码子上有效终止翻译的能力),可以对噬菌体的有限亚组提供一定的抗性。然而,这种抗性并不普遍,并且噬菌体通常在不存在RF-1的情况下繁殖(8),因为TAG终止密码子很少用于终止翻译,并且即使病毒基因确实以琥珀密码子终止,不能读取终止密码子并不限制全长病毒蛋白的合成。相比之下,病毒基因组中的有义密码子通常比琥珀密码子丰富至少10倍,并且存在于病毒基因的整个长度中。
目前在细胞中编码新单体的策略仅限于编码单一类型的单体(通常响应于琥珀终止密码子)(3、10、11),效率低下或与编码连续单体不兼容(12-17),这些限制阻碍了完全由非经典单体组成的非经典杂聚物序列的合成。
最近,用合成的重新编码的基因组创建了一种大肠杆菌菌株Syn61,其中所有标注出现的两种有义密码子(丝氨酸密码子TCG和TCA)和终止密码子(TAG)均被同义密码子替换(18)。该菌株的生长速率慢,其来源菌株是它的1.6倍。
因此,仍然需要用于合成含有非经典氨基酸的聚合物的新平台。
当前一些用于合成含有非经典氨基酸的聚合物的平台利用正交aaRS/tRNA对。此类配对可用于在蛋白合成过程中插入非经典氨基酸。这些配对必须进一步工程化以解码不同的目标密码子并使用不是其他aaRS的底物的独特单体。
如果要开发一种能够将多种非经典氨基酸插入聚合物的平台,则可能需要利用多种aaRS/tRNA对。多种识别不同密码子并掺入不同的非经典氨基酸(ncAA)的工程化的相互正交的aaRS/tRNA对的鉴定,仍极具挑战。每种新的ncAA、aaRS、tRNA和密码子必须共同发挥作用,并且正交于每种内源氨基酸、aaRS和同工受体tRNA组及其同源密码子组。因此,对于每个新的ncAA:aaRS:tRNA:密码子集,必须确定3种相互作用(ncAA:aaRS、aaRS:tRNA和tRNA:密码子),且必须对所述新ncAA:aaRS:tRNA:密码子集和内源翻译机制之间的120种相互作用(6×20种相互作用;该分析将针对天然氨基酸的所有同工受体计数为一,并将针对氨基酸的所有密码子计数为一,从而提供必须被控制的相互作用的保守估计)进行最小化。此外,当掺入多于一种ncAA时,另外的ncAA:aaRS:tRNA:密码子集的组分之间可能存在相互作用,并且这些相互作用也必须最小化。生成ncAA:aaRS:tRNA:密码子集以将三种不同的ncAA编码入多肽中需要建立9种特定相互作用,并最小化至少378种特定相互作用,包括所述三个集的组分之间的18种相互作用。
因此,需要提供新的正交aaRS/tRNA对,并需要鉴定如果组合使用则具有功能的aaRS/tRNA对。
发明内容
本文提供了适合于生产含有非经典氨基酸的聚合物的原核细胞。发明人证明,可以例如通过使内源基因缺失而从原核细胞去除一种、两种或更多种内源tRNA,以产生有活力的细胞。发明人证明,去除的内源tRNA可以用正交tRNA替代。发明人还提供了克服这些过程可能引入的任何生长缺陷的方法。发明人还提供了实验数据,表明修饰的原核细胞对噬菌体具有完全抗性。
在本发明的一个方面,提供了一种原核细胞,其中:所述原核细胞不表达第一内源tRNA和第二内源tRNA;并且原核细胞包含基因组,其中第一种类型的有义密码子和第二种类型的有义密码子已被重新编码,使得第一内源tRNA和第二内源tRNA是非必要的(dispensable)。
在一些实施方案中,基因组的必需基因(essential gene)不包含第一种类型的有义密码子的出现(occurrence),并且第一内源tRNA是第一种类型的有义密码子的关联tRNA(cognate tRNA);和/或基因组的必需基因不包含第二种类型的有义密码子的出现,并且第二内源tRNA是第二种类型的有义密码子的关联tRNA。
在一些实施方案中,基因组包含第一种类型的有义密码子的5、4、3、2、1次出现或不出现,并且第一内源tRNA是第一种类型的有义密码子的关联tRNA;和/或基因组包含第二种类型的有义密码子的5、4、3、2、1次出现或不出现,并且第二内源tRNA是第二种类型的有义密码子的关联tRNA。
在一些实施方案中,第一种类型的有义密码子是TCA并且第一内源tRNA是tRNASer UGA;和/或第二种类型的有义密码子是TCG并且第二内源tRNA是tRNASer CGA。亲本株中TCA密码子的多次出现可以已被AGT替换;和/或亲本株中TCG密码子的多次出现可以已被AGC替换。
在一些实施方案中,原核细胞不表达第一内源释放因子;并且第一种类型的终止密码子已被重新编码在基因组内,使得第一内源释放因子是非必要的。
基因组的必需基因可以不包含第一种类型的终止密码子的出现,并且第一内源释放因子可以是第一种类型的终止密码子的关联释放因子(cognate release factor)。
基因组可以包含第一种类型的终止密码子的5、4、3、2、1次出现或不出现,并且第一内源释放因子可以是第一种类型的终止密码子的关联释放因子。第一种类型的终止密码子可以是TAG并且其中第一内源释放因子可以是RF-1。亲本株中TAG密码子的出现可以已被TAA替换。
在一些实施方案中,基因组与SEQ ID NO:3至8中任一项至少80%、85%、90%、95%、98%、99%、99.5%、99.8%、99.9%或100%同一。
在一些实施方案中,原核细胞表达第一正交氨酰基-tRNA合成酶和第一正交tRNA,第一正交氨酰基-tRNA合成酶和第一正交tRNA形成第一正交氨酰基-tRNA合成酶-tRNA对,并且第一正交tRNA能够解码第一种类型的有义密码子。
第一正交氨酰基-tRNA合成酶可以是MmPylRS或对非经典氨基酸具有改变的选择性的变体,并且第一正交tRNA可以是MmtRNAPylY YYY或MmtRNAPyl UGA
在一些实施方案中,原核细胞表达第二正交氨酰基-tRNA合成酶和第二tRNA,第二正交氨酰基-tRNA合成酶和第二正交tRNA形成第二正交氨酰基-tRNA合成酶-tRNA对,并且第二正交tRNA能够解码第二种类型的有义密码子。
第二正交氨酰基-tRNA合成酶可以是1R26PylRS或对非经典氨基酸具有改变的选择性的变体,并且第二正交tRNA可以是AlvtRNAΔNPyl(8) YYY或AlvtRNAΔNPyl(8) CGA
在一些实施方案中,原核细胞表达第三正交氨酰基-tRNA合成酶和第三正交tRNA,第三正交氨酰基-tRNA合成酶和第三正交tRNA形成第三正交氨酰基-tRNA合成酶-tRNA对,并且第三正交tRNA能够解码第一种类型的终止密码子。
第三正交氨酰基-tRNA合成酶-tRNA对可以是AfTyrRS或对非经典氨基酸具有改变的选择性的变体,以及Af-tRNATyr(A01) YYY;或者MjTyrRS或对非经典氨基酸具有改变的选择性的变体,以及MjtRNATyr YYY
原核细胞的生长速率可以比亲本株的参考原核细胞的生长速率更快。参考原核细胞可以是在重新编码基因组以去除第一种类型的有义密码子、第二种类型的有义密码子和第一种类型的终止密码子后直接获得的亲本株的原核细胞。参考原核细胞可以是在去除第一内源tRNA、第二内源tRNA和第一内源释放因子后直接获得的亲本株的原核细胞。
原核细胞可以抵抗噬菌体感染和/或F质粒的水平转移。原核细胞可以完全抵抗噬菌体感染和/或F质粒的水平转移。
原核细胞可以是细菌细胞或大肠杆菌细胞。原核细胞是有活力的。
在本发明的一个方面,提供了一种原核细胞,其基因组与SEQ ID NO:3至8中任一项至少80%、85%、90%、95%、98%、99%、99.5%、99.8%、99.9%或100%同一。序列同一性的计算可以排除任何外源序列,例如用于插入正交aaRS/tRNA对的任何序列。
在本发明的另一个方面,提供了一种用于产生修饰的原核细胞的方法,其中所述方法包括:
(i)修饰原核细胞以表达适合于解码第一种类型的有义密码子的第一正交氨酰基-tRNA合成酶-tRNA对,其中
所述原核细胞包含基因组,其中第一种类型的有义密码子已被重新编码,使得第一内源tRNA是非必要的;
(ii)在作为第一正交氨酰基-tRNA合成酶的底物的非经典氨基酸的存在下,孵育原核细胞;和
(iii)修饰编码第一内源tRNA的内源基因,使得第一内源tRNA不表达。
在一个实施方案中,步骤(i)和(ii)在步骤(iii)之前进行。在另一个实施方案中,步骤(iii)在步骤(i)和(ii)之前进行。
所述方法还可以包括:
(a)修饰原核细胞以表达适合于解码第二种类型的有义密码子的第二正交氨酰基-tRNA合成酶-tRNA对,其中
所述原核细胞包含基因组,其中第二种类型的有义密码子已被重新编码,使得第二内源tRNA是非必要的;
(b)在作为第二正交氨酰基-tRNA合成酶的底物的非经典氨基酸的存在下,孵育原核细胞;和
(c)修饰编码第二内源tRNA的内源基因,使得第二内源tRNA不表达。
在一个实施方案中,步骤(i)和(ii)在步骤(iii)之前进行,和/或步骤(a)和(b)在步骤(c)之前进行。在另一个实施方案中,步骤(iii)在步骤(i)和(ii)之前进行,和/或步骤(c)在步骤(a)和(b)之前进行。
在一些实施方案中,步骤(a)、(b)和(c)在步骤(i)、(ii)、(iii)之前进行;或者,步骤(a)与步骤(i)同时进行,步骤(b)与步骤(ii)同时进行,步骤(c)与步骤(iii)同时进行;或者,步骤(a)、(b)和(c)在步骤(i)、(ii)、(iii)之后进行。
基因组的必需基因可以不包含第一种类型的有义密码子的出现,或者基因组可以包含第一种类型的有义密码子的5、4、3、2、1次出现或不出现。第一种类型的有义密码子可以是TCA并且第一内源tRNA可以是tRNASer UGA。TCA密码子可以已被AGT替换。
第一正交氨酰基-tRNA合成酶可以是MmPy1RS或对非经典氨基酸具有改变的选择性的变体,并且第一正交tRNA可以是MmtRNAPylY YYY或MmtRNAPyl UGA
基因组的必需基因可以不包含第二种类型的有义密码子的出现,或者基因组可以包含第二种类型的有义密码子的5、4、3、2、1次出现或不出现。第二种类型的有义密码子可以是TCG并且第二内源tRNA可以是tRNASer CGA。TCG密码子可以被AGC替换。
第二正交氨酰基-tRNA合成酶可以是1R26PylRS或对非经典氨基酸具有改变的选择性的变体,并且第二正交tRNA可以是AlvtRNAΔNPyl(8) YYY或AlvtRNAΔNPyl(8) CGA
应用所述方法的原核细胞的基因组可以与以下任一项至少80%、85%、90%、95%、98%、99%、99.5%、99.8%、99.9%或100%同一:GenBank登录号CP040347.1、SEQ IDNO:3或SEQ ID NO:4。
所述方法可以进一步包括修饰原核细胞以表达适合于解码第一种类型的终止密码子的第三正交氨酰基-tRNA合成酶-tRNA对,其中第一种类型的终止密码子已在基因组内重新编码,使得第一内源释放因子是非必要的。基因组的必需基因可以不包含第一种类型的终止密码子的出现,或者基因组可以包含第一种类型的终止密码子的5、4、3、2、1次出现或者不出现。第一种类型的终止密码子可以是TAG,并且其中第一种类型的终止密码子的关联释放因子可以是RF-1。TAG密码子可以被TAA替换。
第三正交氨酰基-tRNA合成酶-tRNA对可以是AfTyrRS或对非经典氨基酸具有改变的选择性的变体,以及Af-tRNATyr(A01) YYY;或MjTyrRS或对非经典氨基酸具有改变的选择性的变体,以及MjtRNATyr YYY
所述方法在步骤(i)和(a)之前可以包括:
在包含含有重新编码的基因组的原核细胞的细胞培养物中诱导诱变,
将细胞培养物维持在指数生长条件下,
从所述细胞培养物中选择与初始培养物相比具有增加的生长速率的原核细胞;和
其中步骤(i)或(a)可以应用于所选择的原核细胞。
诱变、突变和选择可以是平行诱变和动态平行选择过程的一部分。诱导诱变可以包括诱变质粒的使用。诱变质粒可以是MP6。
在一个实施方案中,在步骤(i)之前,应用两轮的诱变和选择。
所述方法在步骤(iii)和/或(c)之后还可以包括:
从原核细胞获得细胞培养物,
在细胞培养物中诱导诱变,
将细胞培养物维持在指数生长条件下,以及
从所述细胞培养物中选择与初始培养物相比具有增加的生长速率的原核细胞。
诱变、突变和选择可以是平行诱变和动态平行选择过程的一部分。诱变的诱导可以包括使用诱变质粒,其中诱变质粒不包含第一种类型或第二种类型的有义密码子的任何出现,也不包含第一种类型的终止密码子的任何出现。诱变质粒可以是MP6,其中MP6已被重新编码为不包含第一种类型或第二种类型的有义密码子的任何出现,也不包含第一种类型的终止密码子的任何出现。可以应用三轮的诱变和选择。
在本发明的方法中,诱变可以进行5、10、15、17、20、30、45、60、70、80、100、150、200代或更多代;和/或细胞培养物可以在指数生长条件下维持5、10、15、20、30、40、50、52、60、70、80、100、200代或更多代。
在一些实施方案中,原核细胞是细菌细胞或大肠杆菌细胞。
在本发明的一个方面,提供了一种合成聚合物的方法,包括:
i)提供本发明的原核细胞或根据本发明的方法产生的原核细胞,其中所述原核细胞包含第一正交氨酰基-tRNA合成酶-tRNA对;和
将所述原核细胞与编码聚合物的核酸序列接触,所述核酸序列包含第一种类型的有义密码子;
ii)在第一非经典氨基酸的存在下孵育原核细胞,其中第一非经典氨基酸是第一正交氨酰基-tRNA合成酶的底物;和
iii)孵育原核细胞以允许通过第一正交氨酰基-tRNA合成酶-tRNA对将第一非经典氨基酸掺入聚合物中。
在一个实施方案中,原核细胞包含第二正交氨酰基-tRNA合成酶-tRNA对并且所述核酸序列包含第二种类型的有义密码子,并且
步骤ii)包括在第二非经典氨基酸的存在下孵育原核细胞,其中第二非经典氨基酸是第二正交氨酰基-tRNA合成酶的底物;和
步骤iii)包括孵育原核细胞以允许通过第二第一正交氨酰基-tRNA合成酶-tRNA对将第二非经典氨基酸掺入聚合物中。
在另一个实施方案中,原核细胞包含第三正交氨酰基-tRNA合成酶-tRNA对并且所述核酸序列包含第一种类型的终止密码子,并且
步骤ii)包括在第三非经典氨基酸的存在下孵育原核细胞,其中第三非经典氨基酸是第三正交氨酰基-tRNA合成酶的底物;和
步骤iii)包括孵育原核细胞以允许通过第三第一正交氨酰基-tRNA合成酶-tRNA对将第三非经典氨基酸掺入聚合物中。
合成聚合物的任何方法可以进一步包括纯化合成的聚合物。
合成的聚合物可以包含至少一种与另一种非经典氨基酸直接相邻的非经典氨基酸。聚合物可以包含彼此直接相邻的2个、3个、4个、5个、6个、7个、8个、9个、10个、15个、20个或更多个非经典氨基酸的链。所述聚合物可以是大环。非经典氨基酸可以是BocK、CbzK、AlloeK、p-I-Phe、CypK、AlkK、3-硝基-Tyr和p-Az-Phe中的任一种或任意组合。
在本发明的一个方面,提供了通过本发明的合成聚合物的方法获得或可通过本发明的合成聚合物的方法获得的聚合物。
在本发明的一个方面,提供了分离的1R26PylRS,或对非经典氨基酸具有改变的选择性的变体。分离的1R26PylRS可以与SEQ ID NO:9至少50%、60%、70%、80%、90%、95%、99%或100%同一,包含以下突变组中的任一组:L121L、L125L、Y126G、M129L、N166N、V168V、Y206Y、A223A;ii)L121L、L125L、Y126Y、M129A、N166N、V168V、Y206F、A223A;iii)L121L、L125L、Y126Y、M129M、N166Q、V168V、Y206F、A223A;iv)L121L、L125L、Y126Y、M129M、N166S、V168M、Y206F、A223G;和v)L121M、L125I、Y126F、M129A、N166N、V168F、Y206Y、A223A。分离的1R26PylRS可以与SEQ ID NO:10至14中的任一项至少50%、60%、70%、80%、90%、95%、99%或100%相似或同一。
在本发明的一个方面,提供了分离的闪烁古生球菌(Archaeoglobus fulgidus)酪氨酰-tRNA合成酶(AfTyrRS),或对非经典氨基酸具有改变的选择性的变体。分离的AfTyrRS可以与SEQ ID NO:16至少50%、60%、70%、80%、90%、95%、99%或100%同一(identical),包含以下突变组中的任一组:i)Y36I、L69M、H74L、Q116E、D165T、I166G和N190N;ii)Y36T、L69L、H74L、Q116E、D165T、I166G、N190K;和iii)Y36I、L69L、H74L、Q116E、D165T、I166G、N190N。分离的AfTyrRS可以与SEQ ID NO:16至19中的任一项至少50%、60%、70%、80%、90%、95%、99%或100%相似或同一。
在本发明的一个方面,提供了分离的Lum1PylRS,或对非经典氨基酸具有改变的选择性的变体。Lum1PylRS可以与SEQ ID NO:32至少50%、60%、70%、80%、90%、95%、99%或100%同一,包含以下突变组中的任一组:i)L121L、L125L、Y126G、M129L、V168V;和ii)L121M、L125I、Y126F、M129A、V168F。Lum1PylRS可以与SEQ ID NO:32至34中的任一项至少50%、60%、70%、80%、90%、95%、99%或100%相似或同一。
在本发明的一个方面,提供了分离的NitroPylRS,或对非经典氨基酸具有改变的选择性的变体。NitroPylRS可以与SEQ ID NO:36至少50%、60%、70%、80%、90%、95%、99%或100%同一,包含以下取代L123M、L127I、Y128F、M131A和V169F。NitroPylRS可以与SEQ ID NO:35或SEQ ID NO:36至少50%、60%、70%、80%、90%、95%、99%或100%相似或同一。
在本发明的一个方面,提供了分离的ClosΔNTDPylRS或对非经典氨基酸具有改变的选择性的变体。ClosΔNTDPylRS可以与SEQ ID NO:37至少50%、60%、70%、80%、90%、95%、99%或100%同一,包含以下突变组中的任一组:i)Y126G、M129L、Y208Y;和ii)Y126Y、M129A、Y208F。ClosΔNTDPylRS可以与SEQ ID N0:37至39中的任一项至少50%、60%、70%、80%、90%、95%、99%或100%相似或同一。
在本发明的一个方面,提供了分离的TronΔNTDPylRS或对非经典氨基酸具有改变的选择性的变体。TronΔNTDPylRS可以与SEQ ID NO:40至少50%、60%、70%、80%、90%、95%、99%或100%相似或同一。
在本发明的一个方面,提供了分离的GemmΔNTDPylRS,或对非经典氨基酸具有改变的选择性的变体。GemmΔNTDlRS可以与SEQ ID NO:41至少50%、60%、70%、80%、90%、95%、99%或100%相似或同一。
在本发明的一个方面,提供了分离的PGA8ΔNTDpylRS,或对非经典氨基酸具有改变的选择性的变体。PGA8ΔNTDPylRS可以与SEQ ID NO:42至少50%、60%、70%、80%、90%、95%、99%或100%相似或同一。
在本发明的一个方面,提供了分离的I2ΔNTDPylRS,或对非经典氨基酸具有改变的选择性的变体。I2ΔNTDPylRS可以与SEQ ID NO:43至少50%、60%、70%、80%、90%、95%、99%或100%相似或同一。
在本发明的一个方面,提供了分离的D121ΔNTDPylRS,或对非经典氨基酸具有改变的选择性的变体。D121ΔNTDPylRS可以与SEQ ID NO:44至少50%、60%、70%、80%、90%、95%、99%或100%相似或同一。
在本发明的一个方面,提供了分离的D416ΔNTDPylRS或对非经典氨基酸具有改变的选择性的变体。D416ΔNTDPylRS可以与SEQ ID NO:45至少50%、60%、70%、80%、90%、95%、99%或100%相似或同一。
本发明的tRNA合成酶可以对以下任一者具有改变的选择性:AllocK、AlkK、BocK、Bta、CbzK、CypK、3-硝基-Tyr、NMH、p-I-Phe、p-Az-Phe、和邻-甲基-酪氨酸。
在本发明的一个方面,提供了分离的tRNA,其中所述分离的tRNA与SEQ ID NO:15、20、46-52、54-58、61-66中的任一项至少80%、90%、95%、99%或100%同一。
在本发明的一个方面,提供了包含本发明的tRNA合成酶和tRNA的宿主细胞,其中所述tRNA合成酶和tRNA形成正交氨酰基-tRNA合成酶-tRNA对。
在本发明的一个方面,提供了一种宿主细胞,其包含选自以下列表的两个或三个项的任意组合:
(i)本发明的tRNA合成酶和tRNA,其中所述tRNA合成酶和tRNA形成正交氨酰基-tRNA合成酶-tRNA对;
(ii)闪烁古生球菌酪氨酰-tRNA合成酶(AfTyrRS),或对非经典氨基酸具有改变的选择性的变体,以及Af-tRNATyr(A01) YYY,其中AfTyrRS和Af-tRNATyr(A01) YYY形成正交氨酰基-tRNA合成酶-tRNA对;
(iii)MmPylRS tRNA合成酶,或对非经典氨基酸具有改变的选择性的变体,和MmtRNAPyl YYY,其中MmPylRS tRNA合成酶和MmtRNAPyl YYY形成正交氨酰基-tRNA合成酶-tRNA对。
在本发明的一个方面,提供了一种宿主细胞,其包含选自以下列表的两个或三个项的任意组合:
(i)本发明的tRNA合成酶和tRNA,其中所述tRNA合成酶和tRNA形成正交氨酰基-tRNA合成酶-tRNA对;
(ii)AfTyrRS,或对非经典氨基酸具有改变的选择性的变体,以及Af-tRNATyr (A01) YYY,其中AfTyrRS和Af-tRNATyr(A01) YYY形成正交氨酰基-tRNA合成酶-tRNA对;
(iii)詹氏甲烷球菌(Mjannaschii)酪氨酰-tRNA合成酶(MjTyrRS),或对非经典氨基酸具有改变的选择性的变体,以及MjtRNATyr YYY,其中MjTyrRS和MjtRNATyr YYY形成正交氨酰基-tRNA合成酶-tRNA对。
在本发明的一个方面,提供了一种宿主细胞,其包含选自以下列表的两个或三个项的任意组合:i)A类ΔNPylRS/ΔNPyltRNA对;ii)B类ΔNPylRS/ΔNPyltRNA对;和iii)MmPylRS/SpePyltRNA对。
宿主细胞可以是原核细胞或真核细胞、细菌细胞、大肠杆菌细胞、哺乳动物细胞、昆虫细胞或人类细胞。
在本发明的一个方面,提供了一种用于提高原核细胞的生长速率的方法,其中所述基因组已被重新编码,其中所述方法包括:
在包含含有重新编码的基因组的原核细胞的细胞培养物中诱导诱变,
将细胞培养物维持在指数生长条件下,
从所述细胞培养物中选择与初始培养物相比具有增加的生长速率的原核细胞。
诱变、突变和选择可以是平行诱变和动态平行选择过程的一部分。诱变的诱导可以包括诱变质粒的使用。诱变质粒可以是重新编码的诱变质粒,例如重新编码以去除第一种类型和/或第二种类型的有义密码子,以及任选地去除第一种类型的终止密码子。诱变质粒可以是MP6。可以应用两轮的诱变和选择。诱变可以进行5、10、15、17、20、30、45、60、70、80、100、150、200代或更多代;和/或细胞培养物可以在指数生长条件下维持5、10、15、20、30、40、50、52、60、70、80、100、200代或更多代。原核细胞可以是细菌细胞或大肠杆菌细胞。
在本发明的一个方面,提供了通过本发明的用于提高原核细胞生长速率的任何方法获得或可通过本发明的用于提高原核细胞生长速率的任何方法获得的原核细胞,其中原核细胞的生长速率快于亲本株的参考原核细胞的生长速率。
在本发明的一个方面,提供了一种原核细胞,其中所述原核细胞:不表达第一内源tRNA;包含基因组,其中第一种类型的有义密码子已被重新编码,使得第一内源tRNA是非必要的;表达第一正交氨酰基-tRNA合成酶和第一正交tRNA,所述第一正交氨酰基-tRNA合成酶和所述第一正交tRNA形成第一正交氨酰基-tRNA合成酶-tRNA对,并且第一正交tRNA能够解码第一种类型的有义密码子。
基因组的必需基因可以不包含第一种类型的有义密码子的出现,并且第一内源tRNA可以是第一种类型的有义密码子的关联tRNA。基因组可包含第一种类型的有义密码子的5、4、3、2、1次出现或不出现,并且第一内源tRNA可以是第一种类型的有义密码子的关联tRNA。第一种类型的有义密码子可以是TCA并且第一内源tRNA可以是tRNASer UGA;或者第一种类型的有义密码子可以是TCG并且第一内源tRNA可以是tRNASer CGA。亲本株中TCA密码子的多次出现可以已被AGT替换;和/或亲本株中TCG密码子的多次出现可以已被AGC替换。
在进一步的实施方案中,所述原核细胞不表达第二内源tRNA;包含基因组,其中第二种类型的有义密码子已被重新编码,使得第二内源tRNA是非必要的;表达第二正交氨酰基-tRNA合成酶和第二tRNA,所述第二正交氨酰基-tRNA合成酶和所述第二正交tRNA形成第二正交氨酰基-tRNA合成酶-tRNA对;第二正交tRNA能够解码第二种类型的有义密码子。基因组的必需基因可以不包含第二种类型的有义密码子的出现,并且第二内源tRNA可以是第二种类型的有义密码子的关联tRNA。基因组可包含第二种类型的有义密码子的5、4、3、2、1次出现或不出现,并且第二内源tRNA可以是第二种类型的有义密码子的关联tRNA。第二种类型的有义密码子可以是TCA,第二内源tRNA可以是tRNASer UGA;或者第二种类型的有义密码子可以是TCG并且第二内源密码子可以是tRNASer CGA
在进一步的实施方案中,原核细胞不表达第一内源释放因子;第一种类型的终止密码子已在基因组内重新编码,使得第一内源释放因子是非必要的;原核细胞表达第三正交氨酰基-tRNA合成酶和第三正交tRNA;所述第三正交氨酰基-tRNA合成酶和所述第三正交tRNA形成第三正交氨酰基-tRNA合成酶-tRNA对;第三正交tRNA能够解码第一种类型的终止密码子。基因组的必需基因可以不包含第一种类型的终止密码子的出现,并且第一内源释放因子可以是第一种类型的终止密码子的关联释放因子。所述基因组可包含第一种类型的终止密码子的5、4、3、2、1次出现或不出现,并且第一内源释放因子可以是第一种类型的终止密码子的关联释放因子。第一种类型的终止密码子可以是TAG并且其中第一内源释放因子可以是RF-1。亲本株中TAG密码子的出现可以已被TAA替换。
所述原核细胞可以是细菌细胞或大肠杆菌细胞。原核细胞是有活力的。
附图简要说明
图1.Syn61Δ3的菌株进化和产生。
(A)菌株进化示意图。编码丝氨酸和蛋白终止的密码子与tRNA的反密码子或预期解码它们的释放因子通过黑线相连。编码相应tRNA和释放因子的基因显示在黑框中。具有Syn61解码规则的单元格始终用粉红色框表示。两轮平行诱变和动态选择创建了Syn61、Syn61(ev2)。然后删除serT、serU和prfA以创建Syn61Δ3。最后,应用三轮的平行诱变和动态选择以产生Syn61Δ3(ev5);Syn61Δ3和Syn61Δ3(ev5)始终由浅青色框表示。
(B)Syn61和Syn61Δ3(ev5)形成过程中的所有中间菌株的生长速率。根据对每个菌株的n=8个重复培养物测量的生长曲线,计算生长速率。有关统计学,请参阅方法。
图2.裂解噬菌体增殖和细胞裂解在Syn61Δ3中受到阻碍。
(A)Syn61Δ3的病毒感染示意图。缺失serU(编码tRNASer CGA)、serT(编码tRNASer UGA)和prfA(编码RF-1)会使UCG、UCA和UAG密码子不可读,并且核糖体将在包含这些密码子的mRNA内的所述密码子处停滞(stall),如此处所示的病毒mRNA。
(B)TCG、TCA和TAG密码子的数量以及它们在T6噬菌体基因组中的位置的示意图。
(C)用T6噬菌体以5×10-2的感染复数(MOI)感染培养物,并在4小时内监测总滴度(细胞内噬菌体加游离噬菌体)。使用庆大霉素处理来消除蛋白合成,并为无法合成病毒蛋白或产生新病毒颗粒的细胞提供对照。
(D)T6有效裂解Syn61变体,但不能裂解Syn61Δ3。如图(C)所示感染培养物,4小时后测量OD600
(E)每个所示噬菌体中每kb中所示密码子的数量。
(F-G)Syn61ΔΔ3在多种噬菌体的同时感染中存活:(F)感染后(+)或未感染(-)后所述时间点的培养物照片。培养物用噬菌体λ、P1、T4、T6和T7感染,每种噬菌体的MOI=1x10-2。(G)4小时后测量培养物的OD600。所有实验均在三个独立重复中进行,点代表独立重复,线(图(C))或条(图(D)和(G))代表平均值。照片(图(F))代表来自三个独立重复的数据。
图3.将Syn61Δ3中的两种有义密码子和一种终止密码子重新分配给非经典氨基酸(ncAA)。
(A)每种密码子重新分配的示意图。将正交氨酰基-tRNA合成酶/tRNAYYY对(其中YYY是正交tRNA(由O-tRNA编码)的反密码子序列)引入Syn61Δ3(浅青色框,如图1A所示)可以解码被引入靶基因的关联密码子(cognate codon)(XXX)。正交对指导响应于XXX密码子的非经典氨基酸(ncAA)掺入。这些密码子重新分配在深灰色框中表示。
(B)Syn61Δ3中的翻译机器不读取TCG、TCA和TAG密码子,并且密码子重新分配使得ncAA能够掺入Ub11XXX中。将编码正交MmPylRS/MmtRNAPyt YYY对和C末端His6标记的泛素的质粒(在位置11处具有单个TCG、TCA或TAG密码子(Ub11XXX),或不具有目标密码子(wt))引入到Syn61Δ3中。“XXX”表示目标密码子,“YYY”表示关联反密码子(cognate anticodon)。泛素-His6的表达在不存在(-)或存在(+)MmPylRS的ncAA底物BocK的情况下进行。使用抗-His6抗体在等量细胞的细胞裂解物中检测全长泛素-His6
(C)通过电喷雾电离质谱法(ESI-MS)确认从带有所示目标密码子的Ub11XXX基因产生掺入BocK的泛素-His6,Ub-(11BocK)-His6。理论质量:9487.7Da;量质量:9487.8Da(TCG)、9487.8Da(TCA)、9488.0(TAG)。小100Da的峰是由于BocK失去了叔丁氧基羰基。
(D)如图(B)中所示但使用Ub11XXX,65XXX,其包含位于Ub基因位置11和65处的目标密码子。
(E)通过ESI-MS确认从带有所示目标密码子的Ub11XXX65XXX基因产生在位置11和65处掺入BocK的泛素-His6。理论质量:9629.0Da;测量质量:9629.2Da(TCG)、9629.0Da(TCA)、9629.0Da(TAG)。-100Da的较小峰对应于BocK中叔丁氧基羰基的丧失。
(F)如图(B)中所示但使用Ub11XXX,14XXX,65XXX,其包含位于Ub基因的位置11、14和65处的目标密码子。
(G)通过ESI-MS确认从带有所示目标密码子的Ub11XXX,14XXX,65XXX产生在位置11、14和65处掺入BocK的泛素-His6。理论质量:9756.1Da;测量质量:9756.2Da(TCG)、9756.0Da(TCA)、9756.0Da(TAG)。-100Da或-200Da的较小峰分别对应于一个或两个BocK残基的叔丁氧基羰基的丧失。
(H)如图(B)中所示但使用Ub9XXX,11XXX,14XXX,65XXX,其包含位于Ub基因的位置9、11、14和65处的目标密码子。
(D通过ESI-MS验证从带有所示目标密码子的Ub9XXX,11XXX,14XXX,65XXX产生在位置9、11、14和65处掺入BocK的泛素-His6。理论质量:9883.3Da;测量质量:9883.2Da(TCG)、9883.2Da(TCA)、9883.2Da(TAG)。-100Da或-200Da的较小峰分别对应于一个或两个BocK残基的叔丁氧基羰基的丧失。所有实验均在生物重复中进行了三次,结果相似。
图4.Syn61Δ3细胞中将不同的非经典氨基酸双重和三重掺入到TCG、TCA和TAG密码子中。
(A)在Syn61Δ3中将TCG(蓝框)、TCA(金框)和TAG(绿框)密码子重新分配给不同的ncAA。在单个细胞中将所有三种密码子重新分配给不同的ncAA需要三个工程化的三重正交氨酰基-tRNA合成酶/tRNA对。每对必须识别不同的ncAA并解码不同的密码子。来自这些三重正交对的tRNA被标记为O-tRNA1-3
(B)在单个基因中响应于TCG和TAG密码子而掺入两种不同的非经典氨基酸。向Syn61Δ3(ev4)一包含1R26PylRS(CbzK)/AlvtRNAΔNPyl(8) CGA对和AfTyrRS(p-I-Phe)/AftRNATyr(A01) CUA对(30)(分别指导将Nε-(苄基氧)-L-赖氨酸(CbzK)掺入到TCG中和将(S)-2-氨基-3-(4-碘苯基)丙酸(p-I-Phe)掺入到TAG中)。细胞还含有Ub11TCG,65TAG(TCG/TAG)或Ub9TCG,11TCG,14TAG,65TAG(2xTCG/2xTAG)或wt Ub(其不含目标密码子)提供CbzK和p-I-Phe。泛素-His6的表达在不存在(-)或存在(+)ncAA的情况下进行。用抗-His6抗体在等量细胞的细胞裂解液中检测全长泛素-His6
(C)纯化的Ub-(11CbzK,65p-I-Phe)(黑色迹线)和Ub-(11CbzK,14CbzK,57p-I-Phe,65p-I-Phe)(灰色迹线)的ESI-MS分析,其如图(E)中所述在CbzK和p-I-Phe存在下表达,并通过Ni2+-NTA色谱法纯化。这些数据证实了分别响应于TCG和TAG密码子而定量掺入CbzK和p-I-Phe。Ub-(11CbzK,65p-I-Phe),理论质量:9707.81Da;测量质量:9707.40Da。Ub-(11CbzK,14CbzK,57p-I-Phe,65p-I-Phe),理论质量:10055.00Da;测量质量:10055.60Da。
(D)在单个基因中将三种不同的非经典氨基酸掺入到TCG、TCA和TAG密码子中。向Syn61Δ3(ev4)-包含1R26PylRS(CbzK)/AlvtRNAΔNPyl(8) CGA对、MmPylRS/MmtRNAPyl UGA对和AfTyrRS(p-I-Phe)/AftRNATyr(A01) CUA对提供CbzK、BocK和p-I-Phe。细胞还含有Ub9TAG,11TCG,14TCA(TCG/TCA/TAG)。该基因的表达是在ncAA不存在(-)或存在(+)的情况下进行的。使用抗-His6抗体在等量细胞的细胞裂解物中检测全长Ub-(9p-I-Phe、11CbzK、14BocK)-His6
(E)纯化的Ub-(9p-I-Phe,11CbzK,14BocK)的ESI-MS,理论质量:9820.97Da;测量质量:9820.80Da。蛋白质印迹实验(图(B)和(D))在5次生物学重复中进行,结果相似。ESI-MS数据(图(C)和(E))收集一次。
图5.非经典杂聚物和大环化合物的可编程编码合成
(A)两种不同ncAA单体(标记为A(深蓝色)和B(绿色))的核糖体聚合的基本步骤。由A和B组成的所有线性杂聚物序列都可以由这四个基本步骤编码。
(B)编码杂聚物序列(非经典单体显示为星号)。杂聚物中的单体序列由用户编写的密码子序列编程。单体(A和B)的身份由添加到细胞中的氨酰基-tRNA合成酶/tRNA对定义。细胞可以被重新编程以编码来自单个DNA序列的不同杂聚物序列。序列被编码为在sfGFP-His6位置3处插入。重新分配方案1(r.s.1)使用MmPylRS/MmtRNAPyl cGA对将AllocK作为单体A分配,并使用1R26PylRS(CbzK)/AlvtRNAΔNPyl(8) CUA对将CbzK作为单体B分配(图S7,D至E)。r.s.2使用MmPylRS/MmtRNAPyl CGA对将BocK作为单体A分配,并使用AfTyrRS(p-I-Phe)/AftRNATyr(A01) CUA对将p-I-Phe作为单体B分配。r.s.3使用1R26PylRS(CbzK)/AlvtRNAΔNPyl(8) CGA对将CbzK作为单体A分配,并使用AfTyrRS(p-I-Phe)/AftRNATyr(A01) CUA对将p-I-Phe作为单体B分配。
(C-E)由所示ncAA组成的编码序列的聚合,Syn61Δ3(ev5)中产生的sfGFP-His6表达依赖于培养基中两种ncAA的添加。
(F)含有所示ncAA六聚体的纯化的sfGFP-His6变体的电喷雾电离(ESI)MS。BocK/p-I-Phe(丧失N末端甲硫氨酸后的预期质量:29172.07Da;观测质量:29171.8Da)、CbzK/p-I-Phe(丧失N末端甲硫氨酸后的预期质量:29274.13Da;观测质量:29274.0Da)和AllocK/CbzK(丧失N末端甲硫氨酸后的预期质量:29091.64Da;观测质量:29092.2Da)。ESI-MS数据收集一次。
(G)游离非经典聚合物的编码合成。在含有与r.s.1(B)中相同配对的Syn61Δ3(ev5)细胞中,将编码四聚体和六聚体的DNA序列插入在SUMO和与几丁质结合结构域(CBD)偶联的GyrA内含肽之间。构建体表达后进行Ulp1裂解和GyrA转硫酯化裂解,导致游离的非经典四聚体和六聚体聚合物的分离。在聚合物序列的紧上游添加额外的半胱氨酸会导致大环非经典聚合物的自裂解和释放。
(H-J)纯化的线性和环状AllocK/CbzK杂聚物的化学结构和ESI-MS谱。原始ESI-MS谱显示不同非经典肽的相对强度和观察到的m/z比。观察到的对应于预期[M+H]+或[M+2H]2+离子的质量以粗体突出显示。其他加合物和碎片离子均相对于这些进行标记。
图6(S1).Syn61菌株进化和敲除。
(A)自动平行进化示意图。克隆培养物显示为淡黄色;每个孔中的诱变群体由不同的阴影表示。使具有诱导的随机诱变的突变培养物生长17-70代,然后在机器人平台上进行六个循环的动态平行选择。定期评估光密度(OD600),并在3个孔的OD600达到0.5时重新稀释所有孔,使指数期持续生长约52代。最后,从诱变群体中分离出单菌落,并通过生长测量和全基因组测序来表征。图经许可改编自Schmied等人(17)。
(B)从进化池中分离出的Syn61和Syn61Δ3后代的谱系。彩色块代表每轮后从独立进化池中分离出的单个克隆,选择下划线克隆用于后续几轮进化。灰色块代表以生长为特征的克隆,其中一些已测序(C02.6、C04.7、A11.3、E7.2),但未考虑用于图S2中的进一步的ORF突变分析。数据文件S1中提供了具有在测序分析中鉴定的所有突变的进化菌株的列表。Syn61Δ3的第1轮未标明的16个额外克隆是G5.2、F8.2、A11.1、F11.3、E10.1、F11.10、F5.2、G8.1、D1.2、D11.1、F11.8、F11.2、D8.4、A9.1、F8.1、F11.6。
(C)从Syn61到Syn61Δ3(ev5)的菌株开发示意图。编码丝氨酸和蛋白终止的密码子与tRNA的反密码子或预计可解码它们的释放因子通过黑线相连;所有序列均以5′至3′书写。编码相应tRNA和释放因子的基因显示在黑框中。发明人进行了自动平行诱变和动态选择,以产生Syn61的生长更快的版本,Syn61(ev1)。该菌株随后进一步进化为Syn61(ev2)。每个菌株中获得的突变分为开放阅读框(ORF)中的突变、非编码突变和基因间区域中的突变。有关菌株开发中获得的所有突变的详细列表,请参阅数据文件S1。serT、serU和prfA的靶向缺失产生了Syn61Δ3。在此过程中,发明人观察到2个基因座处的重排:i)CRISPR阵列的崩溃导致429bp缺失,以及ii)用来自高度同源核糖体操纵子rrnB的重复片段部分替换核糖体操纵子rrnC。相对于wt Syn61的相应变化总计19个突变。再经过三轮后续进化,发明人分别分离出Syn61Δ3(ev3)、Syn61Δ3(ev4)和Syn61Δ3(ev5)。
(D)约17代诱变的一轮Syn61进化后分离的具有增加的生长速率的四个克隆的生长速率。96个平行进化池中的两个(C02和C04)产生了生长改善的克隆。来自同一个池(C02.5和C02.7或C04.7和C04.4)的克隆的序列几乎相同,因此它们被认为是克隆性的。具有多于一个突变的开放阅读框列于图S2中。计算每个菌株的n=8个重复培养物的生长速率。有关统计学,请参阅方法。
(E)从C04.4(Syn61(ev1))诱变约17代开始,第二轮Syn61进化后分离出的生长速率增加的三个克隆的生长速率。96个平行进化池中的两个(E10和A11)产生了生长改善的克隆。计算每个菌株的n=8个重复培养物的生长速率。有关统计学,请参阅方法。
(经过约70代诱变的一轮Syn61Δ3进化后,分离出的生长速率增加的22个克隆的生长速率,这些克隆来自11个独立池。计算每种菌株n=5个重复或n=1(用红色星号表示)培养物的生长速率。有关统计学,请参阅方法。
(G)从F11.9(Syn61Δ3(ev3))诱变约45代开始,在第二轮Syn61Δ3进化后从独立池中分离出的生长速率增加的7个克隆的生长速率。计算每个菌株的n=6个重复培养物的生长速率。有关统计学,请参阅方法。
(H)从E7.4(Syn61Δ3(ev4))诱变约60代开始,在第三轮Syn61Δ3进化后从独立池中分离出的生长速率增加的5个克隆的生长速率。计算每个菌株的n=6个重复培养物的生长速率。有关统计学,请参阅方法。
(I)最进化的Syn61衍生物(Syn61Δ3(ev5))的倍增时间是根据标准实验室条件下记录的生长曲线计算的。三个独立的培养物在37℃的摇瓶中生长,并在指数生长期间每10分钟进行一次OD600测量。对于每个独立培养物,选择指数期期间的60分钟窗口来计算Syn61Δ3(ev5)的平均生长速率为0.026±5x104以及倍增时间为38.72±1.02分钟。有关统计学,请参阅方法。
图7(S2).在Syn61进化过程中,开放阅读框突变了不止一次。
(A)对于该分析,发明入选择了14个克隆,每个池中一个测序的克隆,在图S1B中用彩色块表示。发明人在单个菌株或进化相关菌株中鉴定出在Syn61和Syn61Δ3之间突变了不止一次的开放阅读框。单个菌株或进化历史中相关菌株中发生的突变可能不是独立的。例如,E10.4中nrdE中引入的有害移码突变可能意味着nrdE中的额外突变不被选择或反对,因为该基因已经失活。发明人观察到,通过诱导的随机诱变,每代每bp平均引入2*10-6个突变。平均而言,每轮诱变和选择我们在基因组内的ORF中积累了87.25个突变。如果假设每个突变是独立的,则在同一开放阅读框中发现至少两个突变(考虑到大肠杆菌中有3556个ORF)的概率为0.65。因此,这些突变偶然在同一ORF中发现,这并非不可能。我们的数据与重新编码的菌株改善其适应性的多种方法是一致的。红色星号表示有害突变,包括提前终止密码子和由于插入或缺失通常1bp导致的移码。红色框标记必需基因,图(A)和(B)中的绿色框标记在敲除后进化过程中受到一个额外突变影响的基因。在进化菌株的测序分析中鉴定出的所有突变的列表在数据文件S1中提供。
(B)在独立衍生的菌株中,开放阅读框在Syn61和Syn61Δ3之间突变不止一次。rrmJ是一种23S rRNA甲基转移酶,在Syn61初始进化过程中获得了两个彼此在40bp内的无义突变(P190L、V203A),非常接近Syn61重新编码事件(S197)。平均而言,每轮诱变和选择我们在基因组内的ORF中积累了87.25个突变。如果假设每个突变是独立的,则在同一开放阅读框中找到至少两个突变(考虑Syn61中有3556个ORF)的概率为0.65。因此,这些突变偶然在同一ORF中发现,这也并非不可能。总体而言,独立进化菌株中出现的突变之间的重叠极小。我们的数据与重新编码的菌株改善其适应性的多种方法是一致的。
(C)在单个菌株或相关菌株中,开放阅读框在Syn61Δ3和Syn61Δ3(ev5)之间突变了不止一次。parE是参与染色体分离的重要基因,其累积的突变数量总体最高。图(C)、(D)和(E)中的绿色框标记了在敲除解码元件之前在Syn61进化过程中衍生的菌株中受到一种额外突变影响的基因。平均而言,每轮诱变和选择我们在基因组内的ORF中积累了62.3个突变。如果假设每个突变是独立的,则在同一开放阅读框中找到至少两个突变的概率(考虑Syn61中有3556个ORF)为0.41。因此,这些突变偶然在同一ORF中发现,这并非不可能。总体而言,独立进化菌株中出现的突变之间的重叠极小。这些数据与重新编码的菌株改善其适应性的多种方式是一致的。
(D)在同一轮进化内,独立衍生的菌株中开放阅读框在Syn61Δ3和Syn61Δ3(ev5)之间突变不止一次。在独立进化菌株中在同一轮进化中受影响的ORF可表明前体受到强大的进化压力。在第2轮之后衍生的所有菌株的topA中,记录了四个相同的突变。发明人怀疑1bp缺失发生在对F11.9进行测序之后和将菌株分成单独的诱变池之前。sbcD和nuoG在Syn61Δ3的初始进化中受独立突变的影响最大。总体而言,独立进化菌株中出现的突变之间的重叠很小,这表明重新编码的菌株可以通过多种方式来提高其适应性(fitness)。平均而言,每轮诱变和选择我们在基因组内的ORF中积累了62.3个突变。如果假设每个突变是独立的,则在同一开放阅读框中找到至少两个突变的概率(考虑Syn61中有3556个ORF)为0.41。因此,这些突变偶然在同一ORF中发现,这并非不可能。总体而言,独立进化菌株中出现的突变之间的重叠极小。这些数据与重新编码的菌株改善其适应性的多种方式是一致的。
(E)在单独的进化轮中,独立衍生的菌株中开放阅读框在Syn61Δ3和Syn61Δ3(ev5)之间突变了不止一次。Syn61Δ3进化轮中独立出现的突变不超过两个。平均而言,每轮诱变和选择我们在基因组内的ORF中积累了62.3个突变。如果假设每个突变是独立的,则在同一开放阅读框中找到至少两个突变的概率(考虑Syn61中有3556个ORF)为0.41。因此,这些突变偶然在同一ORF中发现,这并非不可能。总体而言,独立进化菌株中出现的突变之间的重叠极小。这些数据与重新编码的菌株改善其适应性的多种方式是一致的。
图8(S3).Syn61Δ3中的噬菌体繁殖被消除。
(A)Syn61变体感染4小时后的相对总噬菌体滴度(见图2C)。通过从培养物中分离噬菌体,连续稀释分离物,并用其感染平板上的大肠杆菌MG1655,测定感染产生的游离和胞内噬菌体的滴度。Syn61Δ3和经庆大霉素处理的Syn61(ev2)的培养物的蛋白合成和噬菌体产生受到抑制,4小时后含有相同量的噬菌体,而Syn61(ev2)和Syn61ΔRF-1繁殖噬菌体并导致感染。所示板是所示的稀释度。
(B)经庆大霉素处理的细胞中的蛋白合成被消除。Syn61(ev2)对照和用庆大霉素处理的Syn61(ev2)与35S-Met/Cys一起生长,并通过SDS-PAGE和磷光成像使标记的蛋白可视化。尽管将磷光屏暴露两周,但庆大霉素处理的样品没有观察到信号。
(C)T7噬菌体感染Syn61及其衍生物后的总滴度。噬菌体以MOI=5×10-5(感染复数)感染培养物,并在4小时内监测总滴度。
(D)T7有效裂解Syn61变体,但不能有效裂解Syn61Δ3。如图(C)所示感染培养物,4小时后测量OD600
(E)噬菌体λ、P1、T4和T7基因组中TCG、TCA和TAG密码子密度的示意图,如图2B。
图9(S4).MS-MS谱证实了位点特异性非经典氨基酸(ncAA)掺入Syn61Δ3中含有1、2、3或4个TCG密码子的报告基因中。
(A)在第11位含有BocK的Ub11TCG报告基因(Ub-(11BocK))(参见图3,B和C)通过Ni2 +-NTA纯化,并进行胰蛋白酶消化,然后进行LC/MS-MS分析(有关完整详细信息,请参阅方法)。胰蛋白酶肽证实了BocK位点特异性掺入到第11位的TCG密码子中。
(B-C)Ub-(11BocK、65BocK)的LC/MS-MS分析(见图3,D和E),如(A)所示。胰蛋白酶肽证实了BocK位点特异性掺入到第11位(B)和第65位(C)的TCG密码子中。
(D-E)Ub-(11BocK、14BocK、65BocK)的LC/MS-MS分析(参见图3,F和G),如(A)中所示。胰蛋白酶肽证实了BocK位点特异性掺入到第11、14(D)和65(E)位的TCG密码子中。
(F-G)Ub-(9BocK、11BocK、14BocK、65BocK)的LC/MS-MS分析(参见图3,H和I),如(A)中。发现含有残基9、11和14的胰蛋白酶肽(F)具有正确的母离子质量,其含有三种BocK质量。该母离子的片段化模式证实,BocK特异性掺入第11和14位TCG密码子中,尽管没有足够的b系列离子和y系列离子将BocK定位至第9位。(G)胰蛋白酶肽证实了BocK位点特异性掺入到第65位的TCG密码子中。
图10(S5).Syn61Δ3(ev5)中有义密码子和琥珀密码子抑制的GST-MBP比较。
含有正交aaRS/tRNA对及其相应ncAA的Syn61Δ3(ev5)细胞响应于有义密码子或琥珀密码子而有效地生成了全长GST-MBP蛋白。发明人用编码正交MmPylRS/MmtRNAPyl YYY对的质粒和编码同源GST-XXX-MBP报告基因的质粒共转化Syn61Δ3(ev5)细胞或MDS42细胞(对照);XXX编码野生型(wt)密码子、TCG有义密码子或TAG终止密码子,YYY表示其关联反密码子。在不存在(-)或存在(+)BocK(5mM)的情况下诱导GST-XXX-MBP表达后,用谷胱甘肽sepharose珠下拉表达的蛋白。然后用还原型谷胱甘肽洗脱结合的样品,并通过SDS-PAGE分析所得的全长GST-MBP或截短的GST产物。对于Syn61Δ3(ev5)细胞中的TCG有义密码子和TAG终止密码子,仅在BocK存在的情况下才检测到有效的GST-MBP全长合成(有关产量请参见数据文件S4)。
图11(S6).syn61Δ3(ev4)能够在弹性蛋白样多肽(ELP)中将九种有义密码子重新分配给非经典氨基酸(ncAA)。
(A)Syn61Δ3(ev4)能够将多位点ncAA掺入到ELP9x(TCG)中的9个TCG密码子中。发明人共转化了编码正交MmPylRS/MmtRNAPyl CGA对的质粒和编码ELP9x(TCG)的质粒;它包含ELP编码序列的九个重复,每个重复包含TCG密码子,并且在3′末端编码His6-标签。每个ELP重复“VPGVGVPGVGVPGXGVPGVGVPGVG”(SEQ ID NO:1)。该质粒的序列是GenBank登录号MW879732,并且在本文中提供为SEQ ID NO:2,其包含24个经典氨基酸和1个ncAA残基(X)。在用MmPylRS/MmtRNAPyl cGA质粒转化的细胞中,在不存在(-)或存在(+)BocK的情况下诱导ELP9x(TCG)表达。然后,发明人使用抗His6抗体来监测标准化细胞裂解物中全长蛋白(ELP9xBocK))的产生——仅在阿拉伯糖(Ara)和BocK的存在下检测到高效的ELP9x(BocK)合成。作为正交aaRS/tRNA对效率的比较,用编码EctRNAAla CGA的质粒单独转化细胞,EctRNAAla CGA是具有CGA反密码子的嵌合丙氨酰tRNA,指导响应于TCG密码子的丙氨酸掺入,由此发明人检测到在阿拉伯糖(Ara)存在下的高效ELP9x(Ala)合成。蛋白质印迹在生物学重复中进行3次,结果相似。
(B)来自(A)中描述的实验的Ni2+-NTA纯化的ELP9x(BocK)-His6的ESI-MS证实了BocK掺入到9个TCG密码子中。理论质量:23222.32Da;测量质量:23221.80Da。ESI-MS数据收集一次。
图12(S7).用于双重和三重非经典氨基酸掺入的aaRS/tRNA对的相互正交性。
(A-C)图4和图5中用于双重和三重不同非经典氨基酸掺入的aaRs/tRNA对是相互正交的。向Syn61Δ3(ev4)-包含1R26PylRS(CbzK)/AlvtRNAΔNPyl(8) CGA对、MmPylRS/MmtRNAPyl UGA对和AfTyrRS(p-I-Phe)/AftRNATyr(A01) CUA对(分别指导CbzK掺入到TCG中、BocK掺入到TCA中以及p-I-Phe掺入到TAG中)提供CbzK、BocK和p-IPhe。细胞还含有GFP3TCG(图A)、GFP3TCA(图B)或GFP3TAG(图C)。对从含有掺入CbzK但不掺入BocK或p-I-Phe的GFP3TCG的细胞中纯化的GFP-His6进行电喷雾电离(ESI)MS分析。GFP3TCA导致BocK的掺入,GFP3TAG导致p-I-Phe的掺入。
(D,E)MmPylRS/MmtRNAPyl CGA和1R26PylRS(CbzK)/AlvtRNAΔNPyl(8) CUA对在Syn61Δ3(ev4)中掺入响应于不同密码子的不同ncAA。正交aaRS/tRNA对MmPylRS/MmtRNAPyl CGA和lR26PylRS(CbzK)/AlvtRNAΔNPyl(8) CUA每个都响应于其不同的关联密码子而掺入其不同的关联ncAA。在含有GFP3XXX报告质粒的Syn61Δ3(ev4)细胞中在MmPylRS/MmtRNAPyl CGA和1R26PylRS(CbzK)/AlvtRNAΔNPyl(8) CUA存在的情况下,发明人在AllocK和CbzK(+/+)存在的情况下表达GFP。(D)Ni2+-NTA纯化的GFP3TCG的ESI-MS产生的质量对应于AllocK而不是CbzK的掺入,从而证明了MmPylRS/MmtRNAPyl CGA与其关联ncAA和关联密码子的正交性。(E)Ni2+-NTA纯化的GFP3TAG的ESIMS产生的质量对应于CbzK而不是AllocK的掺入,从而证明了1R26PylRS(CbzK)/A/vtRNAΔNPyl(8) CUA对与其关联ncAA和关联密码子的正交性。
图13(S8).MS-MS谱证实了不同的非经典氨基酸(ncAA)位点特异性掺入到Syn61Δ3(ev4)中的双重泛素、双重-双重泛素和三重泛素报告基因中。
(A,B)通过Ni2+-NTA纯化Ub-(11CbzK,65p-I-Phe)双重(见图4B)、Ub-(11CbzK,14CbzK,57p-I-Phe,65p-IPhe)双重-双重(见图4B)和Ub-(9p-I-Phe,11CbzK,14BocK)三重(参见图4D)ncAA掺入,并在胰蛋白酶消化后进行LC-MS/MS分析以确认将不同的ncAA位点特异性掺入到不同的有义密码子和终止密码子中(完整详细信息请参阅方法)。为了将双重不同ncAA掺入双重Ub11TCG,65TAG基因中,纯化的蛋白Ub-(11CbzK,65p-I-Phe)产生了对应于CbzK位点特异性掺入到11TCG密码子中(A)和p-I-Phe掺入到65TAG密码子中(B)的胰蛋白酶肽。
(C,D,E)对于双重-双重不同ncAA掺入到Ub11TCG,14TCG,57TAG,65TAG基因,纯化的蛋白Ub-(11CbzK,14CbzK,57p-I-Phe,65p-I-Phe)产生的胰蛋白酶肽对应于CbzK位点特异性掺入到11TCG和14TCG密码子中(C)以及p-I-Phe掺入到57TAG(D)和65TAG密码子(E)中。
(F)对于三重不同ncAA掺入到Ub9TAG,11TCG,14TCA基因,纯化的蛋白Ub-(9p-I-Phe,11CbzK,14BocK)产生的胰蛋白酶肽对应于p-I-Phe位点特异性掺入到9TAG密码子中,CbzK位点特异性掺入到11TCG密码子中和BocK位点特异性掺入到14TCA密码子中。
图14(S9).在Syn61Δ3(ev4)中将三种不同的非经典氨基酸编码到单个蛋白中的多个实例。
(A)用于证明Syn61中密码子重新分配和三重ncAA掺入的8种非经典氨基酸(ncAA)的化学结构。数字表示(B)中提供的ncAA的身份。
(B)在Syn61Δ3(ev4)中将三种不同的非经典氨基酸编码到单个蛋白中的七个实例。用编码His6标记的Ub9TAG,11TCG,14TCA(或wt Ub)报告基因加上三个相互正交的aaRS/tRNA对的质粒转化细胞,并且通过在ncAA不存在(-)或存在(+)的情况下添加L-阿拉伯糖来诱导报告基因的表达。通过使用抗-His6抗体进行蛋白质印迹,从相同数量的细胞中检测全长报告基因表达,通过OD600分光光度测量进行标准化。对于wtUb的表达和CbzK、p-I-Phe和BocK/AllocK/CypK/AlkK的掺入(泳道1-6),细胞包含1R26PylRS(CbzK)/AlvtRNAΔNPyl(8) CGA对、AfTyrRS(p-I-Phe)/AftRNATyr(A01) CUA对和MmPylRS/MmtRNAPyl UGA对。对于AllocK、3-硝基-Tyr和CbzK的掺入(泳道7和8),细胞含有MmPylRS/MmtRNAPyl CGA对、MjTyrRS(3-硝基-Tyr)/MjtRNATyr CUA对(来自参考文献(39))和1R26PylRS(CbzK)/AlvtRNAΔNPyl(8) UGA。对于p-Az-Phe、CbzK和AllocK/AlkK的掺入(泳道9-11),细胞含有MmPylRS/MmtRNAPyl CGA对、MjTyrRS(p-Az-Phe)/MjtRNATyr CUA对(来自参考文献(40))和1R26PylRS(CbzK)/AlvtRNAΔNPyI(8) UGA对。在所有情况下,Ub9TAG,11TCG,14TCA的表达依赖于三种关联ncAA的提供。
(C)发明人用Ni2+-NTA珠纯化了Syn61Δ3(ev4)中的Ub-His6报道基因(参见方法),并对(B)中详述的7种不同的非天然氨基酸组合进行ESI-MS分析。每条迹线对应于不同的泛素种类,在数字指示的位置处具有所示的ncAA。Ub(9p-I-Phe,11CbzK,14BocK)的理论质量:9820.97Da;观察到的质量:9820.8Da--100Da峰对应于BocK中叔丁氧羰基的损失。Ub(9p-I-Phe,11CbzK,14AllocK)理论质量:9804.94Da;观测质量:9805.0Da。Ub(9p-I-Phe,11CbzK,14CypK)理论质量:9830.97Da;观测质量:9830.8Da。Ub(9p-I-Phe,11CbzK,14AlkK)理论质量:9802.88Da;观测质量:9803.0Da。Ub(9(3-硝基-Tyr),11AllocK,14CbzK)理论质量:9740.09Da;观测质量:9740.0Da。Ub(9p-Az-Phe,11AllocK,14CbzK)理论质量:9720.09Da;观测质量:9720.2Da。Ub(9p-Az-Phe,11AlkK,14CbzK)理论质量:9717.99Da;观测质量:9718.6Da。ESI-MS数据收集一次。有关进一步确认响应于目标密码子的三重ncAA掺入,参见图S10。有关产量,请参阅数据文件S4。
图15(S10).来自另外六种额外的三重不同非经典氨基酸(ncAA)组合的MS-MS谱证实了期望的三种ncAA位点特异性掺入到Ub9TAG,11TCG,14TCA报告基因中。
(A)为了将三种不同的ncAA编码到Ub9TAG,11TCG,14TCA基因中,发明人表达了三个正交aaRS/tRNA对并将相应的三种ncAA添加到Syn61Δ3(ev4)细胞中。含有ncAAd1泛素通过Ni2+-NTA纯化,并在胰蛋白酶消化后进行LC/MS-MS分析,以确认不同ncAA位点特异性掺入到不同的TCG、TCA和TAG密码子中(完整详细信息请参阅方法)。为了编码分别响应于TAG、TCG和TCA密码子的p-I-Phe、CbzK和Allock的三重ncAA组合,使用与图4D中相同的aaRS/tRNA对。纯化的蛋白Ub-(Sp-IPhe,11CbzK,14AllocK)产生的胰蛋白酶肽对应于将p-I-Phe位点特异性掺入到9TAG密码子中、将CbzK位点特异性掺入到11TCG密码子中以及将AllocK位点特异性掺入到14TCA密码子中。
(B)对于分别响应于TAG、TCG和TCA密码子掺入p-I-Phe、CbzK和CypK的三重ncAA组合,使用与图4D中相同的aaRS/tRNA对。纯化的蛋白Ub-(9p-I-Phe,11CbzK,14CypK)产生具有正确母离子质量的胰蛋白酶肽,其包含残基9(p-I-Phe)、11(CbzK)和14(CypK)。该母离子的片段化模式证实了CbzK位点特异性掺入到11TCG密码子中和CypK位点特异性掺入到14TCA密码子中,尽管没有足够的b系列和y系列离子将p-I-Phe定位到位置9。
(C)对于分别响应于TAG、TCG和TCA密码子掺入p-I-Phe、CbzK和A1kK的三重ncAA组合,使用与图4D中相同的aaRS/tRNA对。纯化的蛋白Ub-(9p-I-Phe,11CbzK,14AlkK)产生的胰蛋白酶肽对应于p-I-Phe位点特异性掺入到9TAG密码子中、CbzK位点特异性掺入到11TCG密码子中和AlkK位点特异性掺入到14TCA密码子中。
(D)对于分别响应于TAG、TCG和TCA密码子掺入3-硝基-Tyr、AllocK和CbzK的三重ncAA组合,发明人使用正交aaRS/tRNA对MmPylRS/MmtRNAPyl CGA、MjTyrRS(3-硝基-Tyr)/MjtRNATyr CUA(来自参考文献(39))和1R26PylRS(CbzK)/AlvtRNAΔNPyl(8) UGA。纯化的蛋白Ub-(9(3-硝基-Tyr),11AllocK,14CbzK)产生的胰蛋白酶肽对应于3-硝基-Tyr位点特异性掺入到9TAG密码子中、AllocK位点特异性掺入到11TCG密码子中以及CbzK位点特异性掺入到14TCA密码子中。
(E)对于分别响应于TAG、TCG和TCA密码子掺入p-Az-Phe、AllocK和CbzK的三重ncAA组合,发明人使用正交aaRS/tRNA对MmPylRS/MmtRNAPyl CGA、MjTyrRS(对-Az-Phe)/MjtRNATyr CUA(来自参考文献(40))和1R26PylRS(CbzK)/AlvtRNAΔNPyl(8) UGA。纯化的蛋白Ub-(9p-Az-Phe,11AllocK,14CbzK)产生的胰蛋白酶肽对应于p-Az-Phe位点特异性掺入到9TAG密码子中、AllocK位点特异性掺入到11TCG密码子中以及CbzK位点特异性掺入到14TCA密码子中。
(F)对于分别响应于TAG、TCG和TCA密码子掺入p-Az-Phe、AlkK和CbzK的三重ncAA组合,使用与图(E)中相同的正交aaRS/tRNA对。纯化的蛋白Ub-(9p-Az-Phe,11AllocK,14CbzK)产生的胰蛋白酶肽对应于p-Az-Phe位点特异性掺入到9TAG密码子中、AlkK位点特异性掺入到11TCG密码子中和CbzK位点特异性掺入到14TCA密码子中。
图16(S11).非经典基本步骤和异四聚体的编码细胞合成。
(A)由BocK和p-I-Phe组成的杂聚物序列(编码为GFP位置3处的插入)的合成所需的基本步骤。使用MmPylRS/MmtRNAPyl CGA对和AfTyrRS(p-I-Phe)/AftRNATyr(A01) CUA对,将BocK(单体A)和p-I-Phe(单体B)分别引导至TCG和TAG密码子,如图5B中的重新分配方案2(r.s.2)所示。聚合和sfGFP表达依赖于培养基中ncAA的添加。
(B)使用1R26PylRS(CbzK)/AlvtRNAΔNPyl(8) CGA和AfTyrRS(p-I-Phe)/AftRNATyr (A01) CUA对,编码由分别引导至TCG和TAG的CbzK和p-I-Phe组成的基本步骤,如图5B中的重新分配方案3(r.s.3)所示。
(C)使用MmPylRS/MmtRNAPyl CGA和1R26PylRS(CbzK)/AlvtRNAΔNPyl(8) CUA对,编码由分别引导至TCG和TAG的AllocK和CbzK组成的基本步骤,如图5B中的重新分配方案1(r.s.1)所示。
(D)具有TCG和TAG密码子的异四聚体序列的遗传编码的示意图,如图5所示。
(E)使用MmPylRS/MmtRNAPyl CGA和AfTyrRS(p-I-Phe)/AftRNATyr(A01) CUA对,编码由分别引导至TCG和TAG的BocK和p-I-Phe组成的四聚体,如图5B中的重新分配方案2(r.s.2)所示。
(F)使用lR26PylRS(CbzK)/AlvtRNAΔNPyl(8) CGA对和AfTyrRS(p-I-Phe)/AftRNATyr (A01) CUA对,编码由分别引导至TCG和TAG的CbzK和p-I-Phe组成的四聚体,如图5B中的重新分配方案3(r.s.3)所示。
(G)使用MmPylRS/MmtRNAPyl CGA对和1R26PylRS(CbzK)/AlvtRNAΔNPyl(8) CUA对,编码由分别引导至TCG和TAG的AllocK和CbzK组成的四聚体,如图5B中的重新分配方案1(r.s.1)所示。
图17(S12).非典型异八聚体的编码细胞合成。
(A)使用MmPylRS/MmtRNAPyl CGA对和1R26PylRS(CbzK)/AlvtRNAΔNPyl(8) CUA对,编码由分别引导至TCG和TAG的AllocK和CbzK组成的异八聚体,如图5B中的重新分配方案1(r.s.1)所示,合成为sfGFP位置3处插入。
(B)由AllocK和CbzK组成的编码序列的聚合,并且得到的sfGFP-His6表达依赖于培养基中两种ncAA的添加。
(C)包含所示的八个连续ncAA组的纯化的sfGFP-(3AllocK,4CbzK,5AllocK,6CbzK,7AllocK,8CbzK,9AllocK,10CbzK)的电喷雾电离(ESI)MS。N-末端甲硫氨酸丢失和乙酰化后的预期质量:29608.28Da;观测质量:29607.60Da。ESI-MS数据收集两次。
图18(S13).线性和环状非经典杂聚物的切割。
所述杂聚物在His6-SUMO和GyrA内含肽(41)-CBD融合物之间编码和表达,并且在SUMO之后添加半胱氨酸能够实现自环化。在单个步骤中,即可通过添加Ulpl和DTT来切割或环化肽。Ulp1快速去除N末端SUMO,而C末端GyrA内含肽则通过DTT或N末端半胱氨酸的转硫酯化作用被切割。释放的杂聚物可以在C18柱上从反应中纯化,或者如果不溶,可以通过离心分离并用热的酸性甲醇萃取。通过N-→S酰基转移形成肽键,环化是不可逆的,而DTT硫酯则水解。
图19.RF1介导的(ΔRF1)对lambda噬菌体的抗性在ssrA的KO后被逆转。相反,ΔssrA不会降低三重敲除(Δ3)细胞中的lambda噬菌体抗性。
图20.提供了各种aaRS的序列比对。“*,,表示在所有比对的aaRS序列中发现的残基,“:”表示比对的序列之间具有高度相似性的残基,“.”表示比对的序列之间具有一定相似性的残基。Mm是马氏甲烷八叠球菌(Methanosarcina mazei);Mb是巴氏甲烷八叠球菌(Methanosarcina barkeri);1R26是Methanomethylophilus sp.1R26;Lum 1是Methanomassiliicoccus luminyensis 1;Nitro是亚硝基菌属古细菌(Nitrososphaeriaarchaeon);Tron是嗜热甲烷嗜盐碱古菌(Methanonatronarchaeum thermophilum);Gemm是芽单胞菌纲细菌(Gemmatimonadetes bacterium);PGA8是消化链球菌科细菌(Peptostreptococcaceae bacterium)pGA-8;I2是脱硫孢菌属(Desulfosporosinus sp.)I2;Clos是梭菌目细菌(Clostridiales bacterium);D121是一种δ-变形菌(Deltaproteobacteria bacterium);D416是另一种δ-变形菌。
发明详述
本发明人在此证明,可以从原核细胞去除第一内源tRNA和第二内源tRNA,以产生有活力的细胞,例如通过删除内源基因。
因此,在本发明的第一方面,提供了一种原核细胞,其中:原核细胞不表达第一内源tRNA和第二内源tRNA;并且原核细胞包含基因组,其中第一种类型的有义密码子和第二种类型的有义密码子已被重新编码,使得第一内源tRNA和第二内源tRNA是非必要的。
如果内源tRNA不以允许其解码其关联密码子的形式存在,则认为内源tRNA不表达。因此,可以使用任何会阻止原核细胞内产生功能性形式的内源tRNA的方式去除内源tRNA。例如,可以删除内源基因或者可以删除基因的一部分以防止表达。可以删除或改变调节序列以防止表达。或者,无义、移码或错义突变可以阻止tRNA以功能性形式表达。
内源tRNA的去除是在原核细胞中进行的,其中所述基因组已被重新编码以去除特定类型的有义密码子的出现。如本文所用,“重新编码”是将一种类型的密码子类型的出现替换为不同的密码子,使得所述密码子的出现从基因组中去除。重新编码的有义密码子可以用同义密码子替换以产生不同的密码子使用而不改变编码的多肽。或者,有义密码子可以用非同义密码子替换,例如如果所编码的多肽的序列的改变不影响活力。删除的内源tRNA是鉴于重新编码而非必要的那些。本文所用的“非必要”是指不被原核细胞的活力所需要。
有活力的原核细胞是能够具有代谢活性的细胞。在特定的实施方案中,本发明的有活力的原核细胞当在对于特定物种或菌株适当的培养基中和适当的条件下培养时能够生长。此类原核细胞可以被称为能够被培养。作为实例,如果原核细胞是细菌细胞,例如大肠杆菌,则活力的评估可以通过将所述细菌在包含LB培养基的培养基中或在包含LB琼脂的琼脂上在37℃下培养来进行。培养基或琼脂可补充2%葡萄糖。可以使用标准方法来监测细菌的生长,例如OD600的测量。替代方法,或适应于特定原核细胞、细菌菌株、细菌物种的方法,或考虑包含标记基因,是本领域技术人员已知的。
如果解码一种或多种已被替换(或删除)的有义密码子的tRNA仅解码所示已被替换(或删除)的一种或多种有义密码子,或者,如果所述tRNA解码一种或多种已被替换(或删除)的有义密码子和一种或多种尚未被替换(或删除)的有义密码子,如果所述tRNA对于未被替换(或删除)的一种或多种有义密码子来说是非必要的(即tRNA解码的所述一种或其余有义密码子被一种或多种替代tRNA解码),则可以将所述解码一种或多种已被替换(或删除)的有义密码子的tRNA删除而原核细胞将保持活力。例如,如果原核细胞的基因组缺乏TCA有义密码子,则编码tRNASer UGA的serT可以被删除,和/或如果基因缺少TCG有义密码子,则编码tRNASer CGA的serU可以被删除。由此,在一个实施方案中,所述原核细胞既不表达tRNASer UGA也不表达tRNASer CGA
被重新编码的第一种类型和第二种类型的有义密码子的出现次数足以能够去除对应于所述有义密码子的关联tRNA,同时保持原核细胞的活力。例如,这可以通过从必需基因中去除第一种类型和第二种类型的有义密码子的所有出现来实现。如本文所用,如果一个基因的产物是原核细胞活力(viability)需要的,则该基因是“必需的(essential)”。例如,如果阻止基因所编码的蛋白功能性形式的表达将导致原核细胞没有活力,则该基因被认为是必需的。特别是,如果基因内的“空白”密码子(即针对该密码子细胞没有相应的tRNA或释放因子)导致细胞活力丧失,则该基因被认为是必需的。因此,在一个实施方案中,对不能不丧失活力而耐受空白密码子的原核细胞的所有基因进行重新编码,但能够耐受空白密码子的基因可以不进行重新编码。因此,技术人员可以通过评估关联tRNA是否是非必要的来评估是否所有必需基因都已被重新编码。
在特定的实施方案中,提供了一种原核细胞,其中:所述原核细胞不表达第一内源tRNA和第二内源tRNA;原核细胞的必需基因不包含第一种类型的有义密码子的出现,并且第一内源tRNA是第一种类型的有义密码子的关联tRNA;并且原核细胞的必需基因不包含第二种类型的有义密码子的出现,并且第二内源tRNA是第二种类型的有义密码子的关联tRNA。
在特定的实施方案中,基因组包含100个或更多个、200个或更多个、或300个或更多必需基因,且没有第一种类型和/或第二种类型的有义密码子的出现。例如,基因组中的所有或基本上所有必需基因可以不包含第一种类型和/或第二种类型的有义密码子的出现。
在一些实施方案中,必需基因可以选自由以下组成的列表中的一个或多个:ribF、lspA、ispH、dapB、folA、imp、yabQ、ftsL、ftsI、murE、murF、mraY、murD、ftsW、murG、murC、ftsQ、ftsA、ftsZ、lpxC、secM、secA、can、folK、hemL、yadR、dapD、map、rpsB、tsf、pyrH、frr、dxr、ispU、cdsA、yaeL、yaeT、lpxD、fabZ、lpxA、lpxB、dnaE、accA、tilS、proS、yafF、hemB、secD、secF、ribD、ribE、thiL、dxs、ispA、dnaX、adk、hemH、lpxH、cysS、folD、entD、mrdB、mrdA、nadD、holA、rlpB、leuS、lnt、glnS、fldA、cydA、infA、cydC、rtsK、lolA、serS、rpsA、msbA、lpxK、kdsB、mukF、mukE、mukB、asnS、fabA、mviN、rne、fabD、fabG、acpP、tmk、holB、lolC、lolD、lolE、purB、minE、minD、pth、prsA、ispE、lolB、hemA、prfA、prmC、kdsA、topA、ribA、fabI、tyrS、ribC、ydiL、pheT、pheS、rplT、infC、thrS、nadE、gapA、yeaZ、aspS、argS、pgsA、yefM、metG、folE、yejM、gyrA、nrdA、nrdB、folC、accD、fabB、gltX、ligA、zipA、dapE、dapA、der、hisS、ispG、suhB、tadA、acpS、era、rnc、lepB、rpoE、pssA、yfiO、rplS、trmD、rpsP、ffh、grpE、csrA、ispF、ispD、ftsB、eno、pyrG、chpR、lgt、fbaA、pgk、yqgD、metK、yqgF、plsC、ygiT、parE、ribB、cca、ygjD、tdcF、yraL、yhbV、infB、nusA、ftsH、obgE、rpmA、rplU、ispB、murA、yrbB、yrbK、yhbN、rpsI、rplM、degS、mreD、mreC、mreB、accB、accC、yrdC、def、fmt、rplQ、rpoA、rpsD、rpsK、rpsM、secY、rplO、rpmD、rpsE、rplR、rplF、rpsH、rpsN、rplE、rplX、rplN、rpsQ、rpmC、rplP、rpsC、rplV、rpsS、rplB、rplW、rplD、rplC、rpsJ、fusA、rpsG、rpsL、trpS、yrfF、asd、rpoH、ftsX、ftsE、ftsY、yhhQ、bcsB、glyQ、gpsA、rfaK、kdtA、coaD、rpmB、dfp、dut、gmk、spoT、gyrB、dnaN、dnaA、rpmH、rnpA、yidC、tnaB、glmS、glmU、wzyE、hemD、hemC、yigP、ubiB、ubiD、hemG、yihA、ftsN、murI、murB、birA、secE、nusG、rplJ、rplL、rpoB、rpoC、ubiA、plsB、lexA、dnaB、ssb、alsK、groS、psd、orn、yjeE、rpsR、chpS、ppa、valS、yjgP、yjgQ和dnaC。
具体地,必需基因可以选自由以下组成的列表中的一个或多个:ribF、lspA、ispH、dapB、folA、imp、yabQ、lpxC、secM、secA、can、folK、hemL、yadR、dapD、map、rpsB、tsf、pyrH、frr、dxr、ispU、cdsA、yaeL、yaeT、lpxD、fabZ、lpxA、lpxB、dnaE、accA、tilS、proS、yafF、hemB、secD、secF、ribD、ribE、thiL、dxs、ispA、dnaX、adk、hemH、lpxH、cysS、folD、entD、mrdB、mrdA、nadD、bolA、rlpB、leuS、lht、glnS、fldA、cydA、infA、cydC、ftsK、lolA、serS、rpsA、msbA、lpxK、kdsB、mukF、mukE、mukB、asnS、fabA、mviN、rne、fabD、fabG、acpP、tmk、holB、lolC、lolD、lolE、purB、minE、minD、pth、prsA、ispE、lolB、hemA、prfA、prmC、kdsA、topA、ribA、fabI、tyrS、ribC、ydiL、pheT、pheS、rplT、infC、thrS、nadE、gapA、yeaZ、aspS、argS、pgsA、yefM、metG、folE、yejM、gyrA、nrdA、nrdB、folC、accD、fabB、gltX、ligA、zipA、dapE、dapA、der、hisS、ispG、suhB、tadA、acpS、era、mc、lepB、rpoE、pssA、yfiO、rplS、trmD、rpsP、ffh、grpE、csrA、ispF、ispD、ftsB、eno、pyrG、chpR、lgt、fbaA、pgk、yqgD、metK、yqgF、plsC、ygiT、parE、ribB、cca、ygjD、tdcF、yraL、yhbV、infB、nusA、ftsH、obgE、rpmA、rplU、ispB、murA、yrbB、yrbK、yhbN、rpsI、rplM、degS、mmreD、mreC、mreB、accB、accC、yrdC、def、frmt、rplQ、rpoA、rpsD、rpsK、rpsM、secY、rplO、rpmD、rpsE、rplR、rplF、rpsH、rpsN、rplE、rplX、rplN、rpsQ、rpmC、rplP、rpsC、rplV、rpsS、rplB、rplW、rplD、rplC、rpsJ、fusA、rpsG、rpsL、trpS、yrfF、asd、rpoH、ftsX、ftsE、ftsY、yhhQ、bcsB、glyQ、gpsA、traK、kdtA、coaD、rpmB、dfp、dut、gmk、spoT、gyrB、dnaN、dnaA、rpmH、rnpA、yidC、tnaB、glmS、glmU、wzyE、hermD、hemC、yigP、ubiB、ubiD、hemG、yihA、ftsN、murI、murB、birA、secE、nusG、rplJ、rplL、rpoB、rpoC、ubiA、plsB、lexA、dnaB、ssb、alsK、groS、psd、orn、yjeE、rpsR、chpS、ppa、valS、yjgP、yjgQ和dnaC。
在其他实施方案中,本发明的原核细胞可包含含有第一种类型和/或第二种类型的有义密码子的5次或更少次出现的基因组。所述基因组可以衍生自亲本基因组,并且相对于亲本基因组而言可以包含第一种类型和/或第二种类型的有义密码子小于10%、5%、2%、1%、0.5%、0.1%出现。基因组可包含没有出现第一种类型和/或第二种类型的有义密码子的100个或更多个、200个或更多个、或1000个或更多个基因。具体地,基因组中的所有或基本上所有基因可以不具有第一种类型和/或第二种类型的有义密码子的出现。
因此,在一个具体的实施方案中,提供了原核细胞,其中:原核细胞不表达第一内源tRNA和第二内源tRNA;原核细胞的基因组包含第一种类型的有义密码子的5、4、3、2、1次出现或不出现,并且第一内源tRNA是第一种类型的有义密码子的关联tRNA;原核细胞的基因组包含第二种类型的有义密码子的5、4、3、2、1次出现或不出现,并且第二内源tRNA是第二种类型的有义密码子的关联tRNA。
在特定的实施方案中,基因组不包含第一种类型的有义密码子的出现并且不包含第二种类型的有义密码子的出现。
基因组可衍生自亲本基因组并包含第一种类型和/或第二种类型的天然有义密码子的5次或更少次(例如5、4、3、2、1次)出现或不出现。在特定的实施方案中,基因组衍生自亲本基因组并且不包含第一种类型和第二种类型的天然有义密码子的出现。
在一些实施方案中,基因组包含100个或更多个、200个或更多个、300个或更多个、400个或更多个、500个或更多个、600个或更多个、700个或更多个、800个或更多个、900个或更多个、1000个或更多个、1500个或更多个、或2000个或更多个重新编码的基因。在一些实施方案中,基因是有翻译和/或预期蛋白产物的证据的基因。例如,基因组可以包含100个或更多个、200个或更多个、300个或更多个、400个或更多个、500个或更多个、600个或更多个、700个或更多个、800个或更多个、900个或更多个、1000个或更多个、1500个或更多个、或2000个或更多个证明有翻译和/或预测蛋白产物的重新编码的基因。
在一个实施方案中,基因组内所有标注的开放阅读框不具有第一种类型和第二种类型的有义密码子的出现。本发明的原核细胞可以是细菌细胞,优选大肠杆菌,并且大肠杆菌的基因组可以不包含第一种类型和第二种类型的有义密码子的出现(如GenBank登录号CP040347.1中标注)。
在特定的实施方案中,蛋白编码基因不具有第一种类型和第二种类型的有义密码子的出现。在特定的实施方案中,没有蛋白从第一种类型和/或第二种类型的有义密码子的任何剩余的出现中翻译,和/或包含第一种类型和/或第二种类型的有义密码子的剩余的出现的基因是推定的或非编码基因。在一些实施方案中,包含第一种类型和/或第二种类型的有义密码子的剩余出现的基因的翻译被减少和/或阻止(例如,基因可以包含5′序列中的终止密码子)。
有义密码子的任何剩余出现对于确保基因组是有活力的来说可能是必要的。例如,基因组中第一种类型和/或第二种类型的有义密码子的剩余出现的一次或多次,尤其是所有剩余出现,可以存在于必需基因的调控元件中;和/或第一种类型和/或第二种类型的有义密码子的剩余出现的一次或多次,尤其是所有剩余出现,可以在没有翻译或预期蛋白产物证据的基因(即推定的或非编码基因)中。
如本文所用,“有义密码子”是编码氨基酸的核苷酸三联体。因此,可以通过基因预测来鉴定基因组中的有义密码子,即通过鉴定基因组中编码蛋白的区域(即基因)和相应的开放阅读框(ORF)。通常,基因组天然包含61种有义密码子:GCT、GCC、GCA、GCG、CGT、CGC、CGA、CGG、AGA、AGG、AAT、AAC、GAT、GAC、TGT、TGC、CAA、CAG、GAA、GAG、GGT、GGC、GGA、GGG、CAT、CAC、ATT、ATC、ATA、TTA、TTG、CTT、CTC、CTA、CTG、AAA、AAG、ATG、TTT、TTC、CCT、CCC、CCA、CCG、TCT、TCC、TCA、TCG、AGT、AGC、ACT、ACC、ACA、ACG、TGG、TAT、TAC、GTT、GTC、GTA和GTG(在DNA编码链上从5′到3′读取)。标准遗传密码使用61种三联体密码子编码20种经典氨基酸。所述20种氨基酸中的18种由多于一种同义密码子编码。第一种类型或第二种类型的有义密码子可以是天然有义密码子,即存在于亲本基因组中的有义密码子。
DNA中的61种有义密码子被转录成相应的mRNA,随后被一种或多种tRNA解码。tRNA由mRNA中的有义密码子指导将氨基酸携带至核糖体。tRNA可以通过互补的反密码子识别一种或多种有义密码子。有义密码子序列随后被翻译成多肽(即氨基酸序列)。大肠杆菌基因组中的密码子和反密码子相互作用示于WO2020/229592(通过引用并入本文)的图17中。
全基因组范围内去除第一种类型和/或第二种类型的有义密码子,但不去除其他有义密码子,能够使对应于所述第一种类型或第二种类型的有义密码子的关联tRNA被删除,而不去除解码保留在基因组中的有义密码子的能力。
丝氨酸的氨酰基-tRNA合成酶不识别其关联tRNA的反密码子。这可以通过引入带有关联反密码子的tRNA来促进密码子分配给新的氨基酸,所述关联反密码子并不引导内源合成酶进行错误氨酰化。因此,重新编码的有义密码子可以选自:TCG、TCA、TCT、TCC、AGT或AGC。在特定的实施方案中,第一种类型和第二种类型的有义密码子是TCA和TCG。
为了实现有义密码子的去除,可以将它们替换为同义有义密码子。这对于确保编码的蛋白序列不改变是优选的。例如,原核细胞可以具有这样的基因组,其中亲本基因组中第一种类型或第二种类型的有义密码子的出现的90%或更多、95%或更多、98%或更多、99%或更多、99.5%或更多、99.6%或更多、99.7%或更多、99.8%或更多、99.9%或更多或100%被替换为同义有义密码子。本领域技术人员能够推导出合适的同义有义密码子替换。例如,在大肠杆菌中,通常TCG、TCA、TCT、TCC、AGT和AGC都编码丝氨酸。
在一些实施方案中,替换是限定的替换(defined replacement),即一种有义密码子被单个同义有义密码子替换。优选地,亲本基因组中第一种类型或第二种类型的有义密码子的出现的90%或更多、95%或更多、98%或更多、99%或更多、99.5%或更多、99.6%或更多、99.7%或更多、99.8%或更多、99.9%或更多或100%被替换为限定的(即单个)同义有义密码子。
例如,限定的替换可以是:将TCG替换为TCT、TCC、AGT或AGC中的任一种;或将TCA替换为TCT、TCC、AGT或AGC中的任一种。
具体地,替换选自以下一项或多项:TCG至AGT或AGC;或TCA至AGT或AGC。在特定的实施方案中,TCG被替换为AGC并且TCA被替换为AGT。
优选地,这些密码子替换均不影响核糖体结合位点(AGGAGG),该核糖体结合位点是大肠杆菌中高度保守的调节序列。可以在小的测试区域(例如基因组中必需靶基因和目标密码子两者中富含的20kb区域)上测试所选择的密码子替换,以评估活力。如果密码子替换在小测试区域上不可行,则可以忽略它们。
当用限定的替换同义有义密码子(defined replacement synonymous sensecodon)替换亲本基因组中的有义密码子不能产生有活力的原核细胞时,可以使用替代的替换同义有义密码子(altemative replacement synonymous sense codon)。例如,亲本基因组中第一种类型和/或第二种类型的有义密码子的出现的99.9%可以用限定的(即单个)同义有义密码子替换,并且剩余的0.1%用替代的同义有义密码子替换。例如,TCG的出现的99.9%可以用AGC替换,0.1%出现可以用TCT、TCC、AGT或AGC替换;和/或TCA的出现的99.9%可以用AGT替换,并且0.1%出现可以用TCT、TCC、AGT或AGC替换。
在一些情况下,有义密码子的特定出现可以是不能用任何潜在的同义有义密码子替换而不影响活力。为了保留活力,有义密码子可以用不影响活力的非同义有义密码子替换。例如,亲本基因组中第一种类型和/或第二种类型的有义密码子的出现的99.9%可以用定义的(即单个)同义有义密码子替换,并且剩余的0.1%用替代的非同义有义密码子替换。
本发明人另外证明,可以从本发明的原核细胞去除内源释放因子同时保留活力,使得所得细胞不表达至少两种内源tRNA并且不表达至少一种内源释放因子。因此,在一个实施方案中,原核细胞不表达第一内源释放因子;并且第一种类型的终止密码子在原核细胞的基因组内已被重新编码,使得第一内源释放因子是非必要的。
第一内源释放因子的去除可以在原核细胞中进行,其中基因组已被重新编码以去除第一种类型的终止密码子的出现。任选地,所去除的终止密码子被替换为同义密码子。删除的内源释放因子是鉴于重新编码而非必要的因子。
在特定的实施方案中,提供了原核细胞,其中所述原核细胞不表达第一内源tRNA、第二内源tRNA和第一内源释放因子;并且其中原核细胞的基因组已被重新编码以去除多个与第一和第二内源tRNA关联的有义密码子,并去除多个与第一内源释放因子关联的终止密码子。
如果内源释放因子不以允许其解码其关联密码子的形式存在,则所述内源释放因子被认为是不表达的。因此,可以使用任何会阻止原核细胞内产生功能性形式的内源释放因子的方式,去除内源释放因子。例如,可以删除内源基因或者可以删除所述基因的一部分以防止表达。可以删除或改变调节序列以防止表达。或者,无义、移码或错义突变可以阻止功能性形式的释放因子的表达。
如本文所用,“终止密码子”是编码使蛋白翻译终止的核苷酸三联体。通常,基因组天然包含3种终止密码子:TAA(“赭石(ochre)”)、TGA(“蛋白石(opal)”或“琥珀(umber)”)和TAG(“琥珀(amber)”)。
被去除的第一种类型的终止密码子的出现次数足以能够去除对应于所述终止密码子的关联释放因子,同时保持原核细胞的活力。
因此,在一些实施方案中,原核细胞的必需基因不包含第一种类型的终止密码子的出现。必需基因可以是本文所讨论的任何基因,特别是与第一种类型或第二种类型的有义密码子的去除有关的那些。在特定的实施方案中,基因组包含100个或更多个、200个或更多个、或者300个或更多个必需基因,且没有第一种类型的终止密码子的出现。例如,基因组中的所有或基本上所有必需基因可以不包含第一种类型的终止密码子的出现。
例如,基因组可包含100个或更多个、200个或更多个、或300个或更多个必需基因,且没有第一种类型的有义密码子、第二种类型的有义密码子和第一种类型的终止密码子的出现。具体地,基因组中的所有或基本上所有必需基因可以不包含第一种类型的有义密码子、第二种类型的有义密码子和第一种类型的终止密码子的出现。
在一些实施方案中,基因组包含第一种类型的终止密码子的10次或更少次、5次或更少次出现或不出现。例如第一种类型的终止密码子的5、4、3、2、1次出现或不出现。
在特定的实施方案中,其中第一种类型的终止密码子是TAG并且第一内源释放因子是RF-1。在此类实施方案中,可具有琥珀终止密码子(TAG)的10次或更少次、5次或更少次出现或不出现。在其他实例中,亲本基因组中TAG的出现的90%或更多、95%或更多、98%或更多、99%或更多或所有出现被TAA(赭石终止密码子)替换。在特定的实施方案中,基因组不包含琥珀终止密码子(TAG)的出现,任选地其中亲本基因组中TAG的所有出现被TAA(赭石终止密码子)替换。
在一个实施方案中,基因组内所有标注的开放阅读框不具有第一种类型的终止密码子的出现。本发明的原核细胞可以是细菌细胞,优选大肠杆菌,并且大肠杆菌的基因组可以不包含第一种类型的终止密码子的出现(如GenBank登录号CP040347.1中标注)。
在特定的实施方案中,蛋白编码基因没有第一种类型的终止密码子的出现。在特定的实施方案中,没有蛋白是翻译自第一种类型的终止密码子的任何剩余出现,和/或包含第一种类型的终止密码子的剩余出现的基因是推定的或者是非编码基因。在一些实施方案中,包含第一种类型的终止密码子的剩余出现的基因的翻译被减少和/或阻止(例如,所述基因可以在5′序列中包含终止密码子)。
第一种类型的终止密码子的任何剩余出现对于确保基因组的活力而言可能是必要的。例如,基因组中第一种类型的终止密码子的剩余出现的一次或多次、特别是所有剩余出现可以存在于必需基因的调控元件中;和/或第一种类型的终止密码子的剩余出现的一次或多次、特别是所有剩余出现可以位于其中没有翻译或预期蛋白产物的证据的基因中(即推定的或非编码基因)。
因此,在一些实施方案中,基因组不包含第一种类型和第二种类型的有义密码子的出现,并且不包含一个终止密码子的出现,优选琥珀终止密码子(TAG)。在特定的实施方案中,基因组不包含有义密码子TCG和TCA的出现,并且不包含琥珀终止密码子(TAG)的出现,任选地其中亲本基因组中的TCG、TCA和TAG被同义密码子替换,例如亲本基因组中TCG的出现的99.9%或更多被AGC替换,亲本基因组中TCA的出现的99.9%或更多被AGT替换,并且亲本基因组中TAG的所有出现被TAA替换。
在特定的实施方案中,原核细胞的基因组已被重新编码,使得有义密码子TCG已被AGC替换,有义密码子TCA已被AGT替换,并且终止密码子TAG已被TAA替换,并且其中所述密码子的足够数量已被重新编码,使得两种关联tRNA和关联释放因子是非必要的。
在特定的实施方案中,本发明的原核细胞是不表达tRNAserUGA、tRNASer CGA或RF-1的大肠杆菌细胞,有义密码子TCA的出现已被重新编码,使得tRNASer UGA是非必要的(例如,亲本株的必需基因中TCA的出现已被AGT替换),有义密码子TCG的出现已被重新编码,使得tRNASer CGA是非必要的(例如,亲本株的必需基因中TCG的出现已被AGC替换),并且终止密码子TAG的出现已被重新编码,使得RF-1是非必要的(例如,亲本株的必需基因中TAG的出现已被TAA替换)。原核细胞还可以被修饰以包括第一、第二和第三正交氨酰基-tRNA合成酶-tRNA对,其能够解码TCA、TCG和TAG密码子并在聚合物形成期间将非经典氨基酸掺入此类位点。
在一些实施方案中,本发明原核细胞的基因组包含与GenBank登录号CP040347.1中提供的序列至少80%、85%、90%、95%、98%、99%、99.5%、99.8%、99.9%或100%同一的多核苷酸序列,并且其中基因组已被进一步改变,使得tRNASer UGA和tRNASer CGA不被功能性表达(例如,通过删除serT和serU)。基因组可以已被进一步改变,使得RF-1不被功能性表达(例如,通过删除prfA)。包含根据GenBank登录号CP040347.1的基因组的大肠杆菌菌株在本文公开的实施例中被称为Syn61WT。
在一些实施方案中,本发明原核细胞的基因组包含与SEQ ID NO:3至少80%、85%、90%、95%、98%、99%、99.5%、99.8%、99.9%或100%同一的多核苷酸序列,并且其中基因组已被进一步改变,使得tRNASer UGA和tRNASer CGA不被功能性表达(例如,通过删除serT和serU)。基因组可以已被进一步改变,使得RF-1不被功能性表达(例如,通过删除prfA)。包含根据SEQ ID NO:3的基因组的大肠杆菌菌株在本文公开的实施例中被称为Syn61(ev1)。
在一些实施方案中,本发明原核细胞的基因组包含与SEQ ID NO:4至少80%、85%、90%、95%、98%、99%、99.5%、99.8%、99.9%或100%同一的多核苷酸序列,并且其中基因组已被进一步改变,使得tRNASer UGA和tRNASer CGA不被功能性表达(例如,通过删除serT和serU)。基因组可以已被进一步改变,使得RF-1不被功能性表达(例如,通过删除prfA)。包含根据SEQ ID NO:4的基因组的大肠杆菌菌株在本文公开的实施例中被称为Syn61(ev2)。
在一些实施方案中,本发明原核细胞的基因组包含与SEQ ID NO:5至少80%、85%、90%、95%、98%、99%、99.5%、99.8%、99.9%或100%同一的多核苷酸序列。包含根据SEQ ID NO:5的基因组的大肠杆菌菌株在本文公开的实施例中被称为Syn61Δ3。
在一些实施方案中,本发明原核细胞的基因组包含与SEQ ID NO:6至少80%、85%、90%、95%、98%、99%、99.5%、99.8%、99.9%或100%同一的多核苷酸序列。包含根据SEQ ID NO:6的基因组的大肠杆菌菌株在本文公开的实施例中被称为Syn61Δ3(ev3)。
在一些实施方案中,本发明原核细胞的基因组包含与SEQ ID NO:7至少80%、85%、90%、95%、98%、99%、99.5%、99.8%、99.9%或100%同一的多核苷酸序列。包含根据SEQ ID NO:7的基因组的大肠杆菌菌株在本文公开的实施例中被称为Syn61Δ3(ev4)。
在一些实施方案中,本发明原核细胞的基因组包含与SEQ ID NO:8(也作为GenBank登录号CP071799.1提供)至少80%、85%、90%、95%、98%、99%、99.5%、99.8%、99.9%或100%同一的多核苷酸序列。包含根据SEQ ID NO:8的基因组的大肠杆菌菌株在本文公开的实施例中被称为Syn61Δ3(ev5)。
本文提供了一种原核细胞,其包含与以下任一项至少80%、85%、90%、95%、98%、99%、99.5%、99.8%、99.9%或100%同一的基因组:SEQ ID NO:3、SEQ ID NO:4、SEQID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8。原核细胞可以是细菌,例如大肠杆菌。在一些实施方案中,序列同一性百分比的计算排除了已被插入而能够表达正交氨酰基-tRNA合成酶-tRNA对或多个正交对的任何序列。序列同一性百分比的计算可以进一步排除已经进一步引入基因组中的任何外源序列。具有小于100%同一性的基因组可包含如本文所公开的重新编码的有义密码子和终止密码子,因此在此类实施方案中,所述变化不会重新引入第一种类型的有义密码子、第二种类型的有义密码子或第一种类型的终止密码子。
发明人已经鉴定,具有重新编码的基因组或缺乏第一和/或第二内源tRNA的原核细胞可具有生长缺陷,除非在所述原核细胞的产生期间采取特定步骤。这些步骤描述于本文中。
发明人还注意到,一些诱导诱变的方法,例如涉及使用诱变质粒的方法,在本发明的原核细胞中不起作用。发明人已通过提供特别改造的试剂而克服了这个问题。
因此,在特定的实施方案中,原核细胞的生长速率比亲本株的参考原核细胞的生长速率更快。
通过制备本发明原核细胞的细胞培养物和参考原核细胞的细胞培养物并比较培养基光密度的变化速率来比较生长速率。在一些实施方案中,原核细胞是细菌细胞,例如大肠杆菌,并且通过测定在LB培养基中于37℃、25℃或42℃下的倍增时间来比较生长速率。本发明的原核细胞的倍增时间可以是参考原核细胞的倍增时间的1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、2或3倍。
“亲本株”是作为本发明原核细胞发育的一部分而存在或产生的菌株。因此,本发明的原核细胞直接或间接源自亲本株。亲本株也可称为“祖先株”。
亲本株可以是在重新编码基因组以去除特定类型的有义密码子和/终止密码子之后但在采取进一步步骤之前获得的原核细胞菌株。亲本株可包含基因组,其中第一种类型的有义密码子、第二种类型的有义密码子和第一种类型的终止密码子已经以与本发明原核细胞相同的方式重新编码,并且其中亲本株包含所有内源tRNA和释放因子。例如,亲本株可以是在重新编码基因组以去除或减少TCG、TCA和TAG密码子的数量后获得的菌株。在特定的实施方案中,亲本株可以是Syn61或可以包含Syn61的基因组(即GenBank登录号CP040347.1中的序列)。
亲本株可以是在去除第一内源tRNA、第二内源tRNA和/或释放因子后但在采取进一步步骤之前获得的原核细胞菌株。例如,亲本株可以是去除tRNASer UGA、tRNASer CGA和RF-1后获得的菌株。在特定的实施方案中,亲本株可以是Syn61Δ3或可以包含Syn61Δ3的基因组(SEQ ID NO:5)。
发明人在此提供了实验数据,证明本发明的原核细胞对噬菌体具有抗性。虽然先前已经假设去除细胞tRNA将产生噬菌体抗性,但发明人发现去除第一和第二内源tRNA产生了完全抗性。这种噬菌体抗性水平超出了去除这两种tRNA的累加效应所预测的水平。不受特定理论的束缚,发明人注意到,内源tRNA在它们能够解码的密码子中重叠,并且一定程度的通读是可能的,即便在此通常不知道tRNA与密码子相关。因此,第一和第二内源tRNA的去除产生协同作用,以提供具有完全抗性的原核细胞。
继前一段之后,发明人在本文中提供了数据,证明本发明的原核细胞对突变的积累具有更强的抗性,这可以导致挽救病毒繁殖。例如,发明人注意到,敲除具有至少一定噬菌体抗性的其他菌株中的基因ssrA可以挽救病毒繁殖。相反,从本发明的原核细胞敲除ssrA并不能挽救病毒繁殖(图19)。因此,本发明的原核细胞表现出令人惊讶的强健的噬菌体抗性,即使积累了进一步的突变。
因此,在一个实施方案中,本发明的原核细胞对噬菌体感染具有抗性。噬菌体可以是在其基因组中含有第一种类型的有义密码子、第二种类型的有义密码子和/或第一种类型的终止密码子的任何噬菌体。例如,本发明的原核细胞可以对T4噬菌体、T6噬菌体、T7噬菌体、λ噬菌体或P1vir噬菌体具有抗性。在一些实施方案中,本发明的原核细胞对所有这五个实例具有抗性。
本发明的原核细胞可以抵抗水平基因转移。例如,F质粒的水平转移。
本发明的原核细胞可以比亲本株的参考原核细胞更能抵抗感染或水平基因转移。亲本株可以是本文所述的任何菌株。
在一些实施方案中,本发明的原核细胞对噬菌体具有完全抗性。原核细胞可以完全抵抗T4噬菌体、T6噬菌体、T7噬菌体、λ噬菌体和P1vir噬菌体。如本文所用,术语“完全抗性(或完全抵抗)”是指本发明原核细胞的培养物的生长速率基本上不受或完全不受所述培养物中包含相关噬菌体的影响。对照可以是包含相同量的被杀伤噬菌体。相关噬菌体是能够感染原核细胞亲本株的噬菌体。
在特定的实施方案中,本发明的原核细胞是细菌细胞。细菌细胞可以是适合于异源蛋白生产的任何物种,特别是包含一种或多种非经典氨基酸的多肽的生产(例如由Ferrer-Miralles,N.and Villaverde,A.,2013.Microbial Cell Factories,12:113描述的那些)。合适的细菌宿主细胞包括:埃希氏菌属(例如大肠杆菌)、柄杆菌属(例如新月柄杆菌(Caulobacter crescentus)、光养细菌(例如Rodhobacter sphaeroides)、冷适应细菌(例如游海假交替单胞菌(Pseudoalteromonas haloplanktis)、希瓦氏菌属菌株Ac10(shewanella sp.strain Ac10))、假单胞菌(例如荧光假单胞菌(Pseudomonasfluorescens)、恶臭假单胞菌(Pseudomonas putida)、铜绿假单胞菌(Pseudomonasaeruginosa))、嗜盐细菌(例如Halomonas elongate、需盐色盐杆菌(Chromohalobactersalexigens)、链霉菌(例如变铅青链霉菌(Streptomyces lividans)、灰色链霉菌(Streptomyces griseus))、诺卡氏菌(例如乳糖诺卡氏菌(Nocardia lactamdurans))、分枝杆菌(例如耻垢分枝杆菌(Mycobacterium smegmatis))、棒状细菌(例如谷氨酸棒杆菌(Corynebacterium glutamicum)、产氨棒杆菌(Corynebacterium ammoniagenes)、乳酸发酵短杆菌(Brevibacterium lactofermentum))、杆菌(例如枯草芽孢杆菌(acillussubfilis)、短芽孢杆菌(Bacillus brevis)、巨大芽孢杆菌(Bacillus megaterium)、地衣芽孢杆菌(Bacillus licheniformis)、解淀粉芽孢杆菌acillus amyloliquefaciens))、弧菌(例如霍乱弧菌(Vibrio cholera)、需钠弧菌(Vibrio natriegens))和乳酸菌(例如乳酸乳球菌(Lactococcus lactis)、植物乳杆菌(Lactobacillus plantarum)、干酪乳杆菌(Lactobacillus casei)、罗伊氏乳杆菌(Lactobacillus reuteri)、嘉氏乳杆菌(Lactobacillus gasseri))。在一些实施方案中,细菌是革兰氏阴性细菌。
在特定的实施方案中,细菌是大肠杆菌、肠道沙门氏菌或痢疾志贺氏菌。更优选地,细胞是大肠杆菌。合适的大肠杆菌细胞包括K-12、MG1655、BL21、BL21(DE3)、AD494、Origami、HMS174、BLR(DE3)、HMS174(DE3)、Tuner(DE3)、Origami2(DE3)、Rosetta2(DE3)、Lemo21(DE3)、NiCo21(DE3)、T7Express、SHuffle Express、C41(DE3)、C43(DE3)以及m15pREP4或其衍生物(Rosano,G.L.and Ceccarelli,E.A.,2014.Frontiers inmicrobiology,5,p.172)。具体地,所述细胞可以是MG1655或BL21,或其衍生物。MG1655被认为是大肠杆菌的野生型菌株。该菌株基因组序列的GenBank ID为U00096。BL21在商业上广泛使用。例如,它可以从New England BioLabs购买,目录号为C2530H。
原核细胞可以含有源自相同物种或菌株的基因组,或者可以源自不同物种的基因组。例如,如果原核细胞是大肠杆菌,则基因组可以是大肠杆菌基因组。
包含正交氨酰基-tRNA合成酶-tRNA对的原核细胞
发明人在此提供实验数据,证明形成正交对的第一正交氨酰基-tRNA合成酶和第一正交tRNA可以被引入本发明的原核细胞中以替换内源tRNA。第一正交tRNA可以解码已从基因组中去除的一种类型的有义密码子,例如第一种类型的有义密码子可以已经以本文公开的任何方式从基因组中去除。第一正交氨酰基-tRNA合成酶使用氨基酸(可以是非经典氨基酸)特异性氨酰化正交关联tRNA。因此,原核细胞可以含有其中内源tRNA已被替换为第一正交tRNA从而第一种类型的有义密码子被重新用于编码非经典氨基酸的系统。
另外,发明人在本文中提供的实验数据证明,第一正交氨酰基-tRNA合成酶-tRNA对和第二正交氨酰基-tRNA合成酶-tRNA对可以被引入本发明的原核细胞中。第一tRNA可以解码从基因组去除的一种有义密码子,并且第二tRNA可以解码另一种有义密码子。正交氨酰基-tRNA合成酶使用氨基酸(可以是非经典氨基酸)特异性氨酰化它们的正交关联tRNA。因此,原核细胞可以含有其中两种或更多种有义密码子已被重新用于编码非经典氨基酸的系统。
在其中终止密码子已被重新编码的细胞中,第三正交氨酰基-tRNA合成酶-tRNA对可被引入原核细胞中,从而允许重新编码的终止密码子用于编码第三非经典氨基酸。因此,原核细胞可以含有其中两种或更多种有义密码子和一种或多种终止密码子已被重新用于编码第一、第二和第三非经典氨基酸的系统。在特定的实施方案中,原核细胞含有其中TCA、TCG和TAG编码第一、第二和第三非经典氨基酸的系统。第一、第二和第三非经典氨基酸可以彼此不同。
因此,正交氨酰基-tRNA合成酶(aaRS)-tRNA对可能能够利用原核细胞的蛋白合成装置指导非经典氨基酸掺入聚合物中。正交合成酶不识别内源tRNA,并使用提供给细胞(或由细胞合成)的非经典氨基酸特异性地氨酰化正交关联tRNA(它不是内源合成酶的有效底物)(Chin,J.W.,2017.Nature,550(7674),53-60)。
在一个实施方案中,提供了一种原核细胞,其中:所述原核细胞不表达第一内源tRNA,所述原核细胞包含其中第一种类型的有义密码子已被重新编码而使第一内源tRNA是非必要的基因组,所述原核细胞表达第一正交氨酰基-tRNA合成酶和第一正交tRNA,所述第一正交氨酰基-tRNA合成酶和所述第一正交tRNA形成第一正交氨酰基-tRNA合成酶-tRNA对,并且第一正交tRNA能够解码第一种类型的有义密码子。
在另一个实施方案中,提供了一种原核细胞,其中:所述原核细胞不表达第一内源tRNA和第二内源tRNA,所述原核细胞包含其中第一种类型的有义密码子和第二种类型的有义密码子已被重新编码而使第一内源tRNA和第二内源tRNA是非必要的基因组,
所述原核细胞表达第一正交氨酰基-tRNA合成酶和第一正交tRNA,所述第一正交氨酰基-tRNA合成酶和所述第一正交tRNA形成第一正交氨酰基-tRNA合成酶-tRNA对,第一正交tRNA能够解码第一种类型的有义密码子,以及
原核细胞表达第二正交氨酰基-tRNA合成酶和第二正交tRNA,所述第二正交氨酰基-tRNA合成酶和所述第二正交tRNA形成第二正交氨酰基-tRNA合成酶-tRNA对,第二正交tRNA能够解码第二种类型的有义密码子。
在另一个实施方案中,提供了原核细胞,其中:
所述原核细胞不表达第一内源tRNA、第二内源tRNA和第一内源释放因子,
所述原核细胞包含基因组,其中第一种类型的有义密码子和第二种类型的有义密码子已被重新编码,使得第一内源tRNA和第二内源tRNA是非必要的,并且第一种类型的终止密码子已被重新编码,使得第一内源释放因子是非必要的,
所述原核细胞表达第一正交氨酰基-tRNA合成酶和第一正交tRNA,所述第一正交氨酰基-tRNA合成酶和所述第一正交tRNA形成第一正交氨酰基-tRNA合成酶-tRNA对,第一正交tRNA能够解码第一种类型的有义密码子;
所述原核细胞表达第二正交氨酰基-tRNA合成酶和第二正交tRNA,所述第二正交氨酰基-tRNA合成酶和所述第二正交tRNA形成第二正交氨酰基-tRNA合成酶-tRNA对,第二正交tRNA能够解码第二种类型的有义密码子;和
原核细胞表达第三正交氨酰基-tRNA合成酶和第三正交tRNA,所述第三正交氨酰基-tRNA合成酶和所述第三正交tRNA形成第三正交氨酰基-tRNA合成酶-tRNA对,并且第三正交tRNA能够解码第一种类型的终止密码子。
本文使用的氨酰基-tRNA合成酶可以变化。尽管在实施例中可以使用特定的tRNA合成酶序列,但是本发明不旨在仅局限于那些实施例。理论上可以使用提供tRNA装载(氨酰化)功能的任何氨酰基-tRNA合成酶。例如,tRNA合成酶可以来自任何合适的物种,例如来自古细菌,例如来自甲烷八叠球菌属-例如Alethanosarcina barkeri MS;巴氏甲烷八叠球菌菌株Fusaro(Methanosarcina barkeri str.Fusaro);马氏甲烷八叠球菌G01(Methanosarcina mazei G01);乙酸甲烷八叠球菌C2A(Methanosarcina acetivoransC2A);嗜热甲烷八叠球菌(Methanosarcina thermophila);或甲烷类球菌属(Methanococcoides)-例如伯顿甲烷类球菌(Methanococcoides burtonii)。或者,tRNA合成酶可以来自细菌,例如来自脱硫杆菌(Desulfitobacterium)-例如哈夫尼脱硫杆菌(Desulfitobacterium hafniense)DCB-2;哈夫尼脱硫杆菌Y51;哈夫尼脱硫杆菌PCP1;或乙酸氧化脱硫肠状菌(Desulfotomaculum acetoxidans)DSM 771。
氨酰基-tRNA合成酶可以是吡咯赖氨酰基tRNA合成酶(pyrrolysyl tRNAsynthetase,PylRS)。PylRS可以是野生型或基因工程化的PylRS。基因工程化的PylRS已经描述于例如Neumann等人(Nat Chem Biol 4:232,2008)和Yanagisawa等人(Chem Biol2008,15:1187)、EP2192185A1和WO2016/066995(均通过引用并入本文)。适当地,选择增加非经典氨基酸的掺入效率的基因工程化tRNA合成酶基因。PylRS可以是巴氏甲烷八叠球菌(MbPylRS)或马氏甲烷八叠球菌(MmPylRS)。
本文使用的tRNA可以变化。尽管在实施例中可能已经使用了特定的tRNA,但是本发明并不旨在仅限于那些实施例。理论上可以使用任何tRNA,只要它与所选tRNA合成酶兼容即可。
tRNA可以来自任何合适的物种,例如来自古细菌,例如来自甲烷八叠球菌属-例如巴氏甲烷八叠球菌MS;巴氏甲烷八叠球菌菌株Fusaro;马氏甲烷八叠球菌G01;乙酸甲烷八叠球菌C2A:嗜热甲烷八叠球菌;或甲烷类球菌属-例如伯顿甲烷类球菌。或者,tRNA合成酶可以来自细菌,例如来自脱硫杆菌-例如哈夫尼脱硫杆菌DCB-2;哈夫尼脱硫杆菌Y51;哈夫尼脱硫杆菌PCP1;或乙酸氧化脱硫肠状菌DSM 771。
tRNA基因可以是野生型tRNA基因或者它可以是突变的tRNA基因。适当地,选择增加非天然氨基酸的掺入效率的突变的tRNA基因。在一个实施方案中,突变的tRNA基因是PylT的U25C变体,如Biochemistry(2013)52,10(通过引用并入本文)中所述。
在一个实施方案中,突变的tRNA基因是PylT的Opt变体,如Fan等人(NucleicAcids Research doi:10.1093/nar/gkv800)(通过引用并入本文)中所述。
在一个实施方案中,突变的tRNA基因具有PylT的U25C和Opt变体两者,即,在该实施方案中,tRNA,例如PylT tRNAcUA基因,包含U25C和Opt突变两者。
在一个实施方案中,编码tRNA的序列是来自马氏甲烷八叠球菌吡咯赖氨酸的吡咯赖氨酸tRNA(PylT)基因,其编码tRNAPyl。
氨酰基-tRNA合成酶和tRNA对可以如Cervettini等人(Rapid discovery andevolution of orthogonal aminoacyl-tRNA synthetase-tRNA pairs,NatureBiotechnology,Vol 38,990August 2020,P989-999)或Dunkelmann等人(Engineeredtriply orthogonal pyrrolysyl-tRNA synthetase/tRNA pairs enable the geneticencoding of three distinct non-canonical amino acids,Nature Chemistry,Vol 12,June 2020P535-544)中所公开或改进自其中所公开的内容。这些文件中的每一篇均通过引用并入。
如背景部分中提到的,aaRS、tRNA和密码子优选地共同起作用并且与每个内源氨基酸、aaRS和同工受体tRNA组及其关联密码子组正交。此外,第一、第二和第三ncAA:aaRS:tRNA:密码子组的组分之间存在相互作用的可能性,并且这些也优选地被最小化。
因此,多种工程化的相互正交的aaRS/tRNA对的鉴定为现有技术提供了有价值的贡献,所述aaRS/tRNA对识别不同的密码子并掺入不同的非经典氨基酸,并且可以组合使用。发明人在本文中提供了新颖的aaRS和tRNA对,并且还提供了所述对的新组合,其在本文中被证明能够联合发挥作用。
因此,在本发明的一个方面,提供了aaRS Methanomethylophilus属1R26PylRS(1R26PylRS)。1R26PylRS可以具有以下序列:
在一个实施方案中,合成酶是1R26PylRS的变体,其进一步包含允许识别非经典氨基酸或改变非经典氨基酸的特异性所必需的突变。在特定的实施方案中,aaRS可以根据SEQID NO:9,包含以下残基处的任意一种取代或取代的组合:L121、L125、Y126、M129、N166、V168、Y206、A223。上述残基处的突变可用于产生对非经典氨基酸具有改变的选择性的1R26PylRS变体。
合成酶可以是1R26PylRS(CbzK)。1R26PylRS(CbzK)可以是1R26PylRS的突变体,其包含以下突变:i)Y126G和M129L,或ii)M129A和Y206F。1R26PylRS(CbzK)适合于指导Nε-(苄氧羰基)-1-赖氨酸(CbzK)的掺入。1R26PylRS(CbzK)可以根据SEQ ID NO:10或11。
合成酶可以是1R26PylRS(AllocK)。1R26Py1RS(AllocK)可以是包含突变N166Q和Y206F的1R26PylRS的突变体,并且适合于指导6-N-Alloc-L-赖氨酸(AllocK)的掺入。1R26PylRS(AllocK)可以根据SEQ ID NO:12。
合成酶可以是1R26PylRS(Bta)。1R26PylRS(Bta)可以是包含突变N166S、V168M、Y206F和A223G的1R26PylRS突变体,并且适合于指导3-苯并噻吩基-L-丙氨酸(Bta)的掺入。1R26PylRS(Bta)可以根据SEQ ID NO:13。
合成酶可以是1R26PylRS(NMH)。1R26PylRS(NMH)可以是包含突变L121M、L125I、Y126F、M129A、V168F的1R26PylRS突变体,并且适合于指导3-N-甲基-L-组氨酸(NMH)的掺入。1R26PylRS(NMH)可以根据SEQ ID NO:14。
在一个实施方案中,aaRS与SEQ ID NO:9-14中的任一项至少50%、60%、70%、80%、90%、95%、99%或100%相似或同一。aaRS可以与SEQ ID NO:9至少50%、60%、70%、80%、90%、95%、99%或100%同一,包含以下突变组中的任一组:i)L121L、L125L、Y126G、M129L、N166N、V168V、Y206Y、A223A;ii)L121L、L125L、Y126Y、M129A、N166N、V168V、Y206F、A223A;iii)L121L、L125L、Y126Y、M129M、N166Q、V168V、Y206F、A223A;iv)L121L、L125L、Y126Y、M129M、N166S、V168M、Y206F、A223G;和v)L121M、L125I、Y126F、M129A、N166N、V168F、Y206Y、A223A。
图20提供了序列比对,其中“*”表示在所有比对的aaRS序列中发现的残基,“:”表示比对的序列之间具有高度相似性的残基,“.”表示比对的序列之间具有一定相似性的残基。aaRS可以与SEQ ID NO:9-14中的任一项至少50%、60%、70%、80%、90%、95%、99%或100%同一,其中仅在未标有以下的残基中发现变异:i)“*”;ii)“*”或“:”,或iii)或“*”、“:”或“.”。
1R26PylRS及其变体和衍生物可与tRNA Methanonethylophilus alvus(Alv)tRNAΔNPyl(8)配对。
因此,在本发明的另一个方面,提供了AlvtRNAΔNPyl(8)。AlvtNAΔNPyl(8)可以具有以下序列:
其中反密码子是“NNN”三联体。
在特定的实施方案中,AlvtRNAΔNPyl(8)可以具有以下序列:
AlvtRNAΔNPyl(8)可以被修饰以包括任何反密码子。本文示例了AlvtRNAΔNPyl(8) CGA,但本发明不必限于这种方式。tRNA可以与SEQ ID NO:15或61至少80%、90%、95%、99%或100%同一。
在本发明的一个方面,提供了一种宿主细胞,其包含本文公开的任何1R26PylRS或其变体或衍生物和本文公开的任何AlvtRNAΔNPyl(8)或其变体或衍生物,其中所述lR26PylRS和AlvtRNAΔNPyl(8)形成正交氨酰基-tRNA合成酶-tRNA对。宿主细胞可以是任何适合于异源蛋白生产、特别是包含一种或多种非经典氨基酸的多肽生产的细胞。宿主细胞可以是原核细胞或真核细胞。宿主细胞可以是细菌细胞,例如大肠杆菌。宿主细胞可以是真核细胞,例如哺乳动物或昆虫细胞系。宿主细胞可以是人类细胞。宿主细胞可以是本文公开的本发明的任何细菌。
1R26PylRS和AlvtRNAΔNPyl(8)在本文中也以分离形式提供。如本文所用,当分子在其天然环境中未发现时(即,当其在其天然存在的细胞中不表达为野生型蛋白时),则认为该分子是“分离的”。分子可以是分离的并被发现作为另一种组合物的一部分(例如,如果由不天然表达该分子的宿主细胞表达)。
本文公开的另一种aaRS是闪烁古生球菌(Archaeoglobus fulgidus)酪氨酰-tRNA合成酶(AfTyrRS)。AfTyrRS适用于本发明的原核细胞。AfTyrRS可以具有以下序列:
在一个实施方案中,合成酶是AfTyrRS的变体,进一步包含允许识别非经典氨基酸或改变非经典氨基酸的特异性所必需的突变。在特定的实施方案中,aaRS可以根据SEQ IDNO:16,其包含以下残基处的任何一个取代或取代的组合:Y36、L69、H74、Q116、D165、I166或N190。上述残基处的突变可用于产生对非经典氨基酸具有改变的选择性的AfTyrRS的变体。
在另一个实施方案中,合成酶可以是AfTyrRS(p-I-Phe)。AfTyrRS(p-I-Phe)可以是包含以下突变的AfTyrRS的变体:Y36I、L69M、H74L、Q116E、D165T和I166G,并且适合于指导p-I-Phe的掺入。AfTyrRS(p-I-Phe)可以根据SEQ ID NO:17。
在另一个实施方案中,合成酶可以是AfTyrRS(p-Az-Phe)。AfTyrRS(p-Az-Phe)可以是包含以下突变的AfTyrRS的变体:Y36T、H74L、Q116E、D165T、I166G和N190K,并且适合于指导p-Az-Phe的掺入。AfTyrRS(p-Az-Phe)可以根据SEQ ID NO:18。
在另一个实施方案中,合成酶可以是AfTyrRS(邻-甲基-酪氨酸)。AfTyrRS(邻-甲基-酪氨酸)可以是包含以下突变的AfTyrRS的突变体:Y36I、H74L、Q116E、D165T、I166G,并且适合于指导邻-甲基-酪氨酸的掺入。AfTyrRS(邻-甲基-酪氨酸)可以根据SEQ ID NO:19。
在一个实施方案中,aaRS可以与SEQ ID NO:16至19中的任一项至少50%、60%、70%、80%、90%、95%、99%或100%相似或同一。aaRS可以与SEQ ID NO:16至少50%、60%、70%、80%、90%、95%、99%或100%同一,包含以下组中的任一组:i)Y36I、L69M、H74L、Q116E、D165T、I166G、N190N;ii)Y36T、L69L、H74L、Q116E、D165T、I166G、N190K;和iii)Y36I、L69L、H74L、Q116E、D165T、I166G、N190N。
AfTyrRS及其变体和衍生物可以与tRNA Af-tRNATyr(A01) YYY配对。Af-tRNATyr(A01) YYY可以具有以下序列:
其中反密码子是“NNN”三联体。
在特定的实施方案中,Af-tRNATyr(A01)可具有以下序列:
Af-tRNATyr(A01) YYY可以被修饰以包括任何反密码子。Af-tRNATyr(A01) CUA在此举例说明,但本发明不必限于此方式。所述tRNA可以与SEQ ID NO:20或62至少80%、90%、95%、99%或100%同一。
本文公开的另一种aaRS是MmPylRS。MmPylRS是适用于本发明的原核细胞的aaRS。MmPylRS可以具有以下序列:
在一个实施方案中,合成酶是MmPylRS的变体,进一步包含允许识别非经典氨基酸或改变非经典氨基酸的特异性所必需的突变。在特定的实施方案中,aaRS可以根据SEQ IDNO:21,其包含在以下残基处的任意一种取代或取代的组合:L301、A302、L305、Y306、L309、N346、C348、Y384、V401或W417。上述残基处的突变可用于产生对非经典氨基酸具有改变的选择性的MmPylRS的变体。
合成酶可以是MmPylRS(Bpa)。MmPylRS(Bpa)可以是包含突变A302T、N346T、C348T和W417C的MmPylRS的变体,并且适合于指导对-苯甲酰基-L-苯丙氨酸(Bpa)的掺入。MmPylRS(Bpa)可以根据SEQ ID NO:22。
合成酶可以是MmPylRS(Bta)。MmPylRS(Bta)可以是包含突变N346S、C348M、Y384F和V401G的MmPylRS变体,并且适合于指导3-苯并噻吩基-L-丙氨酸(Bta)的掺入。MmPylRS(Bta)可以根据SEQ ID NO:23。
合成酶可以是MmPylRS(CbzK)。MmPylRS(CbzK)可以是MmPylRS的变体,其包含突变:i)Y306G,或ii)L309A、C348V、Y384F,并且适合于指导N6-Cbz-L-赖氨酸(CbzK)的掺入。MmPylRS(CbzK)可以根据SEQ ID NO:24或SEQ ID NO:25。
合成酶可以是MmPylRS(NMH)。MmPylRS(NMH)可以是包含突变L301M、L305I、Y306F、L309A和C348F的MmPylRS的变体,并且适合于指导3-N-甲基-L-组氨酸(NMH)的掺入。MmPylRS(NMH)可以根据SEQ ID NO:26。
在其他实施方案中,MmPylRS可以经改造而适合指导Bock、AllocK、p-I-Phe、CypK或AlkK的掺入。
在一个实施方案中,所述ssRS可以与SEQ ID NO:21至26中的任一项至少50%、60%、70%、80%、90%、95%、99%或100%相似或同一。所述aaRS可以与SEQ ID NO:21至少50%、60%、70%、80%、90%、95%、99%或100%同一,包含以下组中的任一组:i)L301L、A302T、L305L、Y306Y、L309L、N346T、C348T、Y384Y、V401V、W417C;ii)L301L、A302A、L305L、Y306Y、L309L、N346S、C348M、Y384F、V401G、W417W;iii)L301L、A302A、L305L、Y306G、L309L、N346N、C348C、Y384Y、V401V、W417W;iv)L301L、A302A、L305L、Y306Y、L309A、N346N、C348V、Y384F、V401V、W417W;和v)L301M、A302A、L305I、Y306F、L309A、N346N、C348F、Y384Y、V401V、W417W。
图20提供了序列比对。所述aaRS可以与SEQ ID NO:21至26中任一项至少50%、60%、70%、80%、90%、95%、99%或100%同一,其中仅在未标记以下的残基中发现变异:i)“*”;ii)“*”或“:”,或iii)或“*”、“:”或“.”。
MmPylRS和衍生物可以与tRNA MmtRNAPyl YYY配对。MmtRNAPyl YYY可以具有以下序列:
其中反密码子是“NNN”三联体。
在一个实施方案中,MmtRNAPyl可以具有以下序列:
MmtRNAPyl YYY可以被修饰以包括任何反密码子。本文示例了MmtRNAPyl UGA,但本发明不必限于这种方式。所述tRNA可以与SEQ ID NO:27或63至少80%、90%、95%、99%或100%同一。
本文公开的另一种aaRS是詹氏甲烷球菌酪氨酰-tRNA合成酶(MjTyrRS)。MjTyrRS是适用于本发明的原核细胞的aaRS。MjTyrRS可以如J.N.Beyer et al.(JournalofMolecular Biology 432,4690-4704(2020)中公开,其通过引用并入本文。
MjTyrRS可以具有以下序列:
在一个实施方案中,合成酶是MjTyrRS的变体,其进一步包含允许识别非经典氨基酸或改变非经典氨基酸的特异性所必需的突变。在特定的实施方案中,aaRS可以根据SEQID NO:28,包含在以下残基处的任意一种取代或取代的组合:Y32、L65、H70、F108、Q109、D158、I159或L162。上述残基处的突变可用于产生对非经典氨基酸具有改变的选择性的MjTyrRS的变体。
在另一个实施方案中,合成酶可以是MjTyrRS(3-硝基-Tyr)。MjTyrRS(3-硝基-Tyr)是MjTyrRS的变体,包含突变Y32H、H70T、D158H、I159A和L162R。MjTyrRS(3-硝基-Tyr)适合于指导3-硝基-Tyr的掺入。MjTyrRS(3-硝基-Tyr)可以根据SEQ ID NO:29。
在另一个实施方案中,合成酶可以是MjTyrRS(p-Az-Phe)。MjTyrRS(p-Az-Phe)是MjTyrRS的变体,其包含突变Y32L、L65V、F108W、Q109M、D158G和I159A。MjTyrRS(p-Az-Phe)适合于指导p-Az-Phe的掺入。MjTyrRS(p-Az-Phe)可以根据SEQ ID NO:30。
在一个实施方案中,ssRS可以与SEQ ID NO:28至30中的任一项至少50%、60%、70%、80%、90%、95%、99%或100%相似或同一。所述aaRS可以与SEQ ID NO:28至少50%、60%、70%、80%、90%、95%、99%或100%同一,包含以下组中的任一组:i)Y32H、L65L、H70T、F108F、Q109Q、D158H、I159A、L162R;和ii)Y32L、L65V、H70H、F108W、Q109M、D158G、I159A、L162L。
MjTyrRS及衍生物可与tRNA MjtRNATyr YYY配对。MjRNATyr YYY可以如N.Beyer等人(Journal of Molecular Biology 432,4690-4704(2020)中公开。MjtRNATyr YYY可以具有以下序列:
其中反密码子是“NNN”三联体。
在一个实施方案中,MjtRNATyr可以具有以下序列:
MjtRNATyr YYY可以被修饰以包括任何反密码子。本文示例了MjtRNATyr CGA,但本发明不必限于这种方式。所述tRNA可以与SEQ ID NO:3l或64至少80%、90%、95%、99%或100%同一。
本文公开的另一种aaRS是Methanomassiliicoccus luminyensis 1(Lum1)PylRS。Lum1PylRS是适用于本发明的原核细胞的aaRS。Lum1PylRS可以具有以下序列:
在一个实施方案中,合成酶是Lum1PylRS的变体,其进一步包含允许识别非经典氨基酸或改变非经典氨基酸的特异性所必需的突变。在特定的实施方案中,aaRS可以根据SEQID NO:32,包含以下残基处的任意一种取代或取代的组合:L121、L125、Y126、M129和V168。上述残基处的突变可用于产生对非经典氨基酸具有改变的选择性的Lum1PylRS的变体。
合成酶可以是Lum1PylRS(CbzK)。Lum1PylRS(CbzK)可以是包含突变Y126G和M129L的Lum1PylRS的变体,并且适合于引导CbzK的掺入。Lum1PylRS(CbzK)可以根据SEQ ID NO:33。
合成酶可以是Lum1PylRS(NMH)。Lum1PylRS(NMH)可以是包含突变L121M、L125I、Y126F、M129A和V168F的Lum1PylRS的变体,并且适合于指导3-N-甲基-L-组氨酸(NMH)的掺入。Lum1PylRS(NMH)可以根据SEQ ID NO:34。
在一个实施方案中,ssRS可以与SEQ ID NO:32至34中的任一项至少50%、60%、70%、80%、90%、95%、99%或100%相似或同一。aaRS可以与SEQ ID NO:32为50%、60%、70%、80%、90%、95%、99%或100%同一,包含以下组中的任一组:i)L121L、L125L、Y126G、M129L、V168V;和ii)L121M、L125I、Y126F、M129A、V168F。
图20提供了序列比对。所述aaRS可以与SEQ ID NO:32-34中的任一项至少50%、60%、70%、80%、90%、95%、99%或100%同一,其中仅在未标有以下的残基中发现变异:i)“*”;ii)“*”,或“:”,或iii)或“*”,、“:”或“.”。
Lum1PylRS及衍生物可与M.intenstinalis tRNA配对。此类tRNA可以具有以下序列:
其中反密码子是“NNN”三联体。
在一个实施方案中,M.intenstinalis tRNA可以具有以下序列:
M.intenstinalis tRNA可以被修饰以包括任何反密码子。所述tRNA可以与SEQ IDNO:65或66至少80%、90%、95%、99%或100%同一。
本文公开的另一种aaRS是NitroPylRS,其是来自亚硝基菌属古细菌的aaRS(NCBI蛋白登录号是HHP52415.1)。NitroPylRS是适用于本发明的原核细胞的aaRS。NitroPylRS可以具有以下序列:
在一个实施方案中,合成酶是NitroPylRS的变体,其进一步包含允许识别非经典氨基酸或改变非经典氨基酸的特异性所必需的突变。
合成酶可以是NitroPylRS(NMH)。NitroPylRS(NMH)可以是包含突变L123M、L127I、Y128F、M131A和V169F的NitroPylRS的变体,并且适合于指导NMH的掺入。NitroPylRS可以根据SEQ ID NO:36。
在一个实施方案中,aaRS可以与SEQ ID NO:35或SEQ ID NO:36至少50%、60%、70%、80%、90%、95%、99%或100%相似或同一。所述aaRS可以与SEQ ID NO:36至少50%、60%、70%、80%、90%、95%、99%或100%同一,包含以下取代L123M、L127I、Y128F、M131A和V169F。
图20提供了序列比对。所述aaRS可以与SEQ ID NO:35或SEQ ID NO:36至少50%、60%、70%、80%、90%、95%、99%或100%同一,其中仅在未标记以下的残基中发现变异:i)“*”;ii)“*”或“:”,或iii)或“*”、“:”或“.”。
NitroPylRS及衍生物可与源自Methanohalarchaeum thermophilum的tRNA配对。此类tRNA可具有以下序列:
SEQ ID NO:53可以被修饰以包括任何反密码子。所述tRNA可以与SEQ ID NO:53至少80%、90%、95%、99%或100%同一。
本文公开的另一种aaRS是ClosΔNTDPylRS,其是来自梭菌目细菌的aaRS(登录号NLY82529.1)。ClosΔNTDPylRS是适用于本发明的原核细胞的aaRS。ClosΔNTDPylRS可以具有以下序列:
在一个实施方案中,合成酶是ClosΔNTDPylRS的变体,其进一步包含允许识别非经典氨基酸或改变非经典氨基酸的特异性所必需的突变。在特定的实施方案中,aaRS可以根据SEQ ID NO:37,包含在以下残基处的任意一种取代或取代的组合:Y126、M129、Y208。上述残基处的突变可用于产生对非经典氨基酸具有改变的选择性的ClosΔNTDPylRS的变体。
合成酶可以是ClosΔNTDPylRS(CbzK)。ClosΔNTDPylRS(CbzK)可以是ClosΔNTDPylRS的变体,其包含突变:i)Y126G和M129L,或ii)M129A和Y208F,并且适合于指导CbzK的掺入。ClosΔNTDPylRS(CbzK)可以根据SEQ ID NO:38或SEQ ID NO:39。
在一个实施方案中,aaRS可以与SEQ ID NO:37至39中的任一项至少50%、60%、70%、80%、90%、95%、99%或100%相似或同一。所述aaRS可以与SEQ ID NO:37至少50%、60%、70%、80%、90%、95%、99%或100%同一,包含以下组中的任一组:i)Y126G、M129L和Y208Y,或ii)Y126Y、M129A或Y208F。
图20提供了序列比对。aaRS可以与SEQ ID NO:37至39中的任一项至少50%、60%、70%、80%、90%、95%、99%或100%同一,其中仅在未标记以下的残基中发现变异:i)“*”;ii)“*”或“:”,或iii)或“*”、“:”或“.”。
ClosΔNTDPylRS及其变体和衍生物可以根据以下序列的tRNA配对:
ClostRNA可以被修饰以包含任何反密码子。所述tRNA可以与SEQ ID NO:56至少80%、90%、95%、99%或100%同一。
本文公开的另一种aaRS是源自嗜热甲烷嗜盐碱古菌的aaRS(TronΔNTDPylRS)。TronΔNTDPylRS是适用于本发明的原核细胞的aaRS。TronΔNTDPylRS可以具有以下序列:
在一个实施方案中,合成酶是TronΔNTDPylRS的变体,其进一步包含允许识别非经典氨基酸或改变非经典氨基酸的特异性所必需的突变。
在一个实施方案中,所述aaRS可以与SEQ ID NO:40至少50%、60%、70%、80%、90%、95%、99%或100%相似或同一。
图20提供了序列比对。所述aaRS可以与SEQ ID NO:40至少50%、60%、70%、80%、90%、95%、99%或100%同一,其中仅在未标记以下的残基中发现变异:i)”*”;ii)“*”或“:”,或iii)或“*”,、“:”或“.”。
TronΔNTDPylRS及其变体和衍生物可以与根据以下序列的tRNA配对:
TrontRNA可以被修饰以包含任何反密码子。所述tRNA可以与SEQ ID NO:52至少80%、90%、95%、99%或100%同一。
本文公开的另一种aaRS是GemmΔNTDPylRS,其是来自芽单胞菌纲细菌的aaRS(登录号NNM03691.1)。GemmΔNTDPy1RS是适用于本发明的原核细胞的aaRS。GemmΔNTDPylRS可以具有以下序列:
在一个实施方案中,合成酶是GemmΔNTDPylRS的变体,其进一步包含允许识别非经典氨基酸或改变非经典氨基酸的特异性所必需的突变。
在一个实施方案中,所述aaRS可以与SEQ ID NO:41至少50%、60%、70%、80%、90%、95%、99%或100%相似或同一。
图20提供了序列比对。所述aaRS可以与SEQ ID NO:41至少50%、60%、70%、80%、90%、95%、99%或100%同一,其中仅在未标记以下的残基中发现变异:i)”*”;ii)“*”或“:”,或iii)或“*”、“:”或“.”。
GemmΔNTDPylRS和衍生物可以与tRNA GemmtRNA配对。GemmtRNA可以具有以下序列:
GemmtRNA可以被修饰以包含任何反密码子。所述tRNA可以与SEQ ID NO:46至少80%、90%、95%、99%或100%同一。
本文公开的另一种aaRS是PGA8ΔNTDPylRS,其是来自消化链球菌科细菌pGA-8的aaRS(登录号SFE25427.1)。PGA8ΔNTDPylRS是适用于本发明的原核细胞的aaRS。PGA8ΔNTDPylRS可以具有以下序列:
在一个实施方案中,合成酶是PGA8ΔNTDPylRS的变体,其进一步包含允许识别非经典氨基酸或改变非经典氨基酸的特异性所必需的突变。
在一个实施方案中,所述aaRS可以与SEQ ID NO:42至少50%、60%、70%、80%、90%、95%、99%或100%相似或同一。
图20提供了序列比对。所述aaRS可以与SEQ ID NO:42至少50%、60%、70%、80%、90%、95%、99%或100%同一,其中仅在未标记以下的残基中发现变异:i)”*”;ii)“*”或“:”,或iii)或“*,”、“:”或“.”。
PGA8ΔNTDPylRS以及变体和衍生物可以与tRNA PGA8tRNA配对。PGA8tRNA可以具有以下序列:
PGA8tRNA可以被修饰以包含任何反密码子。所述tRNA可以与SEQ ID NO:54至少80%、90%、95%、99%或100%同一。
本文公开的另一种aaRS是I2ΔNTDPylRS,其是来自脱硫孢菌属的aaRS(登录号WP_045576271.1)。I2ΔNTDPylRS是适用于本发明的原核细胞的aaRS。I2ΔNTDPylRS可以具有以下序列:
在一个实施方案中,合成酶是I2ΔNTDPylRS的变体,其进一步包含允许识别非经典氨基酸或改变非经典氨基酸的特异性所必需的突变。
在一个实施方案中,所述aaRS可以与SEQ ID NO:43至少50%、60%、70%、80%、90%、95%、99%或100%相似或同一。
图20提供了序列比对。aaRS可以与SEQ ID NO:43至少50%、60%、70%、80%、90%、95%、99%或100%同一,其中变异仅在未标记以下的残基中发现变异:i)”*”;ii)“*”或“:”,或iii)或“*”、“:”或“.”。
I2ΔNTDPylRS和衍生物可以与以下任何tRNA配对:
SEQ ID NO:47至51和55可被修饰以包括任何反密码子。所述tRNA可以与47至51和55中任一项至少80%、90%、95%、99%或100%同一。
本文公开的另一种aaRS是D121ΔNTDPylRS,其是来自δ-变形菌的aaRS(登录号RLC04121.1)。D121ΔNTDPylRS是适用于本发明的原核细胞的aaRS。D121ΔNTDPylRS可以具有以下序列:
在一个实施方案中,合成酶是D121ΔNTDPylRS的变体,其进一步包含允许识别非经典氨基酸或改变非经典氨基酸的特异性所必需的突变。
在一个实施方案中,aaRS可以与SEQ ID NO:44至少50%、60%、70%、80%、90%、95%、99%或100%相似或同一。
图20提供了序列比对。aaRS可以与SEQ ID NO:44至少50%、60%、70%、80%、90%、95%、99%或100%同一,其中仅在未标记以下的残基中发现变异:i)”*”;ii)“*”或“:”,或iii)或“*”、“:”或“”。
D121ΔNTDPylRS和衍生物可以与以下tRNA配对:
SEQ ID NO:57可以被修饰以包括任何反密码子。所述tRNA可以与SEQ ID NO:57至少80%、90%、95%、99%或100%同一。
本文公开的另一种aaRS是D416ΔNTDPylRS,其是来自δ-变形菌的aaRS(登录号RTZ99416.1)。D416ΔNTDPylRS是适用于本发明的原核细胞的aaRS。D416ΔNTDPylRS可以具有以下序列:
在一个实施方案中,合成酶是D416ΔNTDPylRS的变体,其进一步包含允许识别非经典氨基酸或改变非经典氨基酸的特异性所必需的突变。
在一个实施方案中,aaRS可以与SEQ ID NO:45至少50%、60%、70%、80%、90%、95%、99%或100%相似或同一。
图20提供了序列比对。aaRS可以与SEQ ID NO:45至少50%、60%、70%、80%、90%、95%、99%或100%同一,其中仅在未标记以下的残基中发现变异:i)”*”;ii)“*”或“:”,或iii)或“*”、“:”或“.”。
D416ΔNTDPylRS和衍生物可以与以下tRNA配对:
SEQ ID NO.58可以被修饰以包括任何反密码子。所述tRNA可以与SEQ ID NO:58至少80%、90%、95%、99%或100%同一。
在特定的实施方案中,本文公开的任何aaRS可以被修饰以允许识别任意以下或改变任意以下的特异性:AllocK、AlkK、Bock、Bta、CbzK、CypK、3-硝基-Tyr、NMH、p-I-Phe和p-Az-Phe和邻-甲基-酪氨酸。
在本发明的一个方面,提供了一种宿主细胞,其包含本文公开的任何aaRS或其变体或衍生物以及本文公开的任何tRNA或其变体或衍生物,其中aaRS和tRNA形成正交氨酰基-tRNA合成酶-tRNA对。宿主细胞可以是任何适合于异源蛋白生产、特别是包含一种或多种非经典氨基酸的多肽生产的细胞。宿主细胞可以是原核细胞或真核细胞。宿主细胞可以是细菌细胞,例如大肠杆菌。宿主细胞可以是真核细胞,例如哺乳动物或昆虫细胞系。宿主细胞可以是人类细胞。宿主细胞可以是本文公开的本发明的任何细菌。
aaRS和tRNA在本文中还以分离的形式提供。
本发明人在本文中提供数据证明了以下正交tRNA合成酶-tRNA对可以以两对或三对的任意组合使用:i)MmPylRS/MmtRNAPyl YYY;ii)1R26PylRS/AlvtRNAΔNPyl(8) YYY;和iii)AfTyrRS/Af-tRNATyr(A01) YYY
因此,在本发明的一个方面,提供了一种宿主细胞,其包含选自下组的任何一种、两种或三种正交tRNA合成酶-tRNA对:i)MmPylRS/MmtRNAPyl YYY;ii)1R26PylRS/AlvtRNAΔNPyl(8) YYY;和iii)AfTyrRS/Af-tRNATyr(A01) YYY。可以修饰aaRS以允许识别非经典氨基酸或改变非经典氨基酸的特异性。所述aaRS可以是本文公开的任何变体。所述tRNA可以是本文公开的任何变体。
本发明人在本文中提供数据证明了以下正交tRNA合成酶-tRNA对可以以两对或三对的任意组合使用:i)MmPylRS/MmtRNAPyl YYY;ii)1R26PylRS/AlvtRNAΔNPyl(8) YYY;和iii)MjTyrRS/MjtRNATyr YYY
因此,在本发明的一个方面,提供了一种宿主细胞,其包含选自下组的任何一种、两种或三种正交tRNA合成酶-tRNA对:i)MmPylRS/MmtRNAPyl YYY;ii)1R26PylRS/AlvtRNAΔNPyl(8) YYY;和iii)MjTyrRS/MjtRNATyr YYY。可以修饰aaRS以允许识别非经典氨基酸或改变非经典氨基酸的特异性。aaRS可以是本文公开的任何变体。tRNA可以是本文公开的任何变体。
在本发明的另一个方面,提供了一种宿主细胞,其包含选自下组的任何一种、两种或三种正交tRNA合成酶-tRNA对:i)A类ΔNPylRS/ΔNPyltRNA对;ii)B类ΔNPylRS/ΔNPyltRNA对;和iii)MmPylRS/SpePyltRNA对。aaRS和tRNA的类别如Dunkelmann.等人(Engineeredtriply orthogonal pyrrolysyl-tRNA synthetase/tRNA pairs enable the geneticencoding of three distinct non-canonical amino acids,2020)中所述。
正交tRNA合成酶-tRNA对可以在宿主细胞中表达。宿主细胞可以是任何适合于异源蛋白生产、特别是包含一种或多种非经典氨基酸的多肽生产的细胞。宿主细胞可以是原核细胞或真核细胞。宿主细胞可以是细菌细胞,例如大肠杆菌。宿主细胞可以是真核细胞,例如哺乳动物或昆虫细胞系。宿主细胞可以是人类细胞。宿主细胞可以是本文公开的本发明的任何细菌。
本文提供了包含含有与SEQ ID NO:8至少80%、85%、90%、95%、98%、99%、99.5%、99.8%、99.9%或100%同一的多核苷酸序列的基因组的细菌,并且其中所述细菌包含能够解码有义密码子TCG的第一正交氨酰基-tRNA合成酶-tRNA对、能够解码有义密码子TCA的第二正交氨酰基-tRNA合成酶-tRNA对以及能够解码终止密码子TAG的第三正交氨酰基-tRNA合成酶-tRNA对。基因组序列同一性的计算应排除表达正交氨酰基-tRNA合成酶-tRNA对所需的序列(即细菌可属于菌株Syn6lΔ3(ev5),其经进一步修饰以表达正交氨酰基-tRNA合成酶-tRNA对)。在一个实施方案中,正交tRNA合成酶-tRNA对是:i)MmPylRS/MmtRNAPyl YYY;ii)1R26PylRS/AlvtRNAΔNPyl(8) YYY;和iii)AfTyrRS/Af-tRNATyr(A01) CUA,其中MmtRNAPyl YYY可以是MmtRNAPyl UGA,1R26PylRS可以是1R26PylRS(CbzK),AlvtRNAΔNPyl(8) YYY可以是AlvtRNAΔNPyl(8) CGA,并且AfTyrRS可以是AfTyrRS(p-I-Phe)。在另一个实施方案中,正交tRNA合成酶-tRNA对是:i)MmPylRS/MmtRNAPyl YYY;ii)1R26PylRS/AlvtRNAΔNPyl(8) YYY;和iii)MjTyrRS/MjtRNATyr CUA,其中MmtRNAPyl YYY可以是MmtRNAPyl UGA,1R26PylRS可以是1R26PylRS(CbzK),AlvtRNAΔNPyl(8) YYY可以是AlvtRNAΔNPyl(8) CGA,并且MjTyrRS可以是MjTyrRS(3-硝基-Tyr)或MjTyrRS(p-Az-Phe)。
在本申请原核细胞中表达的正交tRNA合成酶的底物可以是任何非经典氨基酸。因此,本发明的原核细胞可用于产生包含第一非经典氨基酸、第二非经典氨基酸和任选的第三非经典氨基酸的聚合物。
本文所用的术语“非经典氨基酸(non-canonical amino acid)”是指排除L-丙氨酸、L-半胱氨酸、L-天冬氨酸、L-谷氨酸、L-苯丙氨酸、甘氨酸、L-组氨酸、L-异亮氨酸、L-赖氨酸、L-亮氨酸、L-甲硫氨酸、L-天冬酰胺、L-脯氨酸、L-谷氨酰胺、L-精氨酸、L-丝氨酸、L-苏氨酸、L-缬氨酸、L-色氨酸和L-酪氨酸的任何氨基酸。
非经典氨基酸可以是非天然氨基酸。如本文所用,“非天然氨基酸(unnaturalamino acid)”是非天然编码或非发现于遗传密码中的任何氨基酸。此类氨基酸可以是非蛋白氨基酸(non-proteinogenic amino acid)。因此,非天然氨基酸可以是排除L-丙氨酸、L-半胱氨酸、L-天冬氨酸、L-谷氨酸、L-苯丙氨酸、甘氨酸、L-组氨酸、L-异亮氨酸、L-赖氨酸、L-亮氨酸、L-甲硫氨酸、L-天冬酰胺、L-脯氨酸、L-谷氨酰胺、L-精氨酸、L-丝氨酸、L-苏氨酸、L-缬氨酸、L-色氨酸和L-酪氨酸、L-吡咯赖氨酸(L-pyrrolysine)和L-硒代半胱氨酸(L-selenocysteine)的任何氨基酸。
适合用于本发明的非经典氨基酸没有特别限制。合适的非经典氨基酸为本领域技术人员所熟知,例如公开于Neumann,H.,2012.FEBS letters,586(15),pp.2057-2064;和Liu,C.C.and Schultz,P.G.,2010.Annual review of biochemistry,79,pp.413-444(通过引用并入本文)中的那些。在一些实施方案中,非经典氨基酸选自以下的一种或多种:对-乙酰基苯丙氨酸、间-乙酰基苯丙氨酸、邻-烯丙基酪氨酸、苯基硒代半胱氨酸、硒代半胱氨酸、对-炔丙氧基苯丙氨酸(p-Propargyloxyphenylalanine)、对-叠氮基苯丙氨酸(p-Azidophenylalanine)、对-硼基苯丙氨酸、邻-甲基酪氨酸、对-氨基苯丙氨酸、对-氰基苯丙氨酸、间-氰基苯丙氨酸、对-氟苯丙氨酸、对-碘苯丙氨酸、对-溴苯丙氨酸、对-硝基苯丙氨酸、L-DOPA、3-氨基酪氨酸、3-碘酪氨酸、对-异丙基苯丙氨酸、3-(2-萘基)丙氨酸、联苯丙氨酸、高谷氨酰胺(Homoglutamine)、D-酪氨酸、对-羟基苯乳酸、2-氨基辛酸、联比啶丙氨酸(Bipyridylalanine)、HQ-丙氨酸、对-苯甲酰苯丙氨酸、邻-硝基苯甲基半胱氨酸、邻-硝基苯甲基丝氨酸、4,5-二甲氧基-2-硝基苯甲基丝氨酸、邻-硝基苯甲基赖氨酸、邻-硝基苯甲基酪氨酸、2-硝基苯丙氨酸、丹酰丙氨酸(Dansylalanine)、对-羧甲基苯丙氨酸、3-硝基酪氨酸、磺基酪氨酸、乙酰赖氨酸、甲基组氨酸、2-氨基壬酸、2-氨基癸酸、吡咯赖氨酸、Cbz-赖氨酸、Boc-赖氨酸、烯丙氧羰基赖氨酸(Allyloxycarbonyllysine)、Nε-((叔丁氧基)羰基)-L-赖氨酸(BocK)、Nε-(苄氧羰基)-L-赖氨酸(CbzK)、Nε-烯丙氧基羰基-L-赖氨酸(AllocK)、(S)-2-氨基-3-(4-碘苯基)丙酸(p-I-Phe)、CypK、AlkK、3-硝基-Tyr和p-Az-Phe。第一、第二和第三非经典氨基酸可以是上述非经典氨基酸的任意组合。
在特定的实施方案中,非经典氨基酸可以是Bock、CbzK、AllocK、p-I-Phe、CypK、AlkK、3-硝基-Tyr和p-Az-Phe中的任意一种(参见图S9)。第一、第二和第三非经典氨基酸可以是Bock、CbzK、AllocK、p-I-Phe、CypK、AlkK、3-硝基-Tyr和p-Az-Phe的任意组合。
本发明的原核细胞的用途
本发明的原核细胞可用于合成包括第一、第二和/或第三非经典氨基酸的聚合物或蛋白。在特定的实施方案中,本发明的原核细胞可用于合成包括两种或三种不同类型的非经典氨基酸的聚合物或蛋白。非经典氨基酸可以是本文所公开的任何非经典氨基酸。
因此,在本发明的一个方面,提供了一种合成聚合物的方法,包括:
i)提供本发明的原核细胞,其中所述原核细胞包含第一正交氨酰基-tRNA合成酶-tRNA对;以及使所述原核细胞与编码聚合物的核酸序列接触,所述核酸序列包含第一种类型的有义密码子;
ii)在第一非经典氨基酸的存在下孵育原核细胞,其中第一非经典氨基酸是第一正交氨酰基-tRNA合成酶的底物;和
iii)孵育原核细胞以允许通过第一正交氨酰基-tRNA合成酶-tRNA对将第一非经典氨基酸掺入聚合物中。
在特定的实施方案中,提供了一种合成聚合物的方法,包括:
i)提供本发明的原核细胞,其中所述原核细胞包含第一和第二正交氨酰基-tRNA合成酶-tRNA对;以及使所述原核细胞与编码聚合物的核酸序列接触,所述核酸序列包含第一种类型的有义密码子和/或第二种类型的有义密码子;
ii)在第一和第二非经典氨基酸的存在下孵育原核细胞,其中第一非经典氨基酸是第一正交氨酰基-tRNA合成酶的底物并且第二非经典氨基酸是第二正交氨酰基-tRNA合成酶的底物;和
iii)孵育原核细胞以允许通过第一正交氨酰基-tRNA合成酶-tRNA对将第一非经典氨基酸掺入聚合物中,并且允许通过第二正交氨酰基-tRNA合成酶-tRNA对将第二非经典氨基酸掺入聚合物中。
在一个实施方案中,提供了一种合成聚合物的方法,包括:i)提供本发明的原核细胞,其中所述原核细胞包含第一、第二和第三正交氨酰基-tRNA合成酶-tRNA对;以及使所述原核细胞与编码聚合物的核酸序列接触,所述核酸序列包含第一种类型的有义密码子、第二种类型的有义密码子和/或第一种类型的终止密码子;
ii)在第一、第二和第三非经典氨基酸的存在下孵育原核细胞,其中第一非经典氨基酸是第一正交氨酰基-tRNA合成酶的底物,第二非经典氨基酸是第二正交氨酰基-tRNA合成酶的底物,并且第三非经典氨基酸是第三正交氨酰-tRNA合成酶的底物;
iii)孵育原核细胞以允许通过第一正交氨酰基-tRNA合成酶-tRNA对将第一非经典氨基酸掺入聚合物中,通过第二正交氨酰基-tRNA合成酶-tRNA对将第二非经典氨基酸掺入聚合物中,和/或通过第三正交氨酰基-tRNA合成酶-tRNA对将第三非经典氨基酸掺入聚合物中。
原核细胞与核酸序列的接触可以采取向原核细胞提供核酸的任何形式,使得核酸序列可以被解码以产生聚合物,例如蛋白。
用于本方法的原核细胞可以是本文所述的任何原核细胞,其中原核细胞包含第一正交氨酰基-tRNA合成酶-tRNA对,且任选地包含第二正交氨酰基-tRNA合成酶-tRNA对,且任选地包含第三正交氨酰基-tRNA合成酶-tRNA对。例如,在一个实施方案中,用于本方法的原核细胞是不表达第一内源tRNA、第二内源tRNA和第一内源释放因子的原核细胞;并且其中第一种类型的有义密码子和第二种类型的有义密码子已在原核细胞的基因组内被重新编码,使得第一内源tRNA和第二内源tRNA是非必要的,并且第一种类型的终止密码子已在原核细胞的基因组内被重新编码,使得第一内源释放因子是非必要的。重新编码的性质可以如针对本文公开的本发明的任何原核细胞所描述的。第一正交tRNA能够解码第一种类型的有义密码子,第二正交tRNA能够解码第二种类型的有义密码子,并且第三正交tRNA能够解码第一种类型的终止密码子。原核细胞可以是大肠杆菌。
在特定的实施方案中,用于本方法的原核细胞是不表达tRNASer UGA、tRNASer CGA或RF-l的大肠杆菌细胞,有义密码子TCA的出现已被重新编码,使得tRNASer UGA是非必要的(例如,在亲本株的必需基因中的TCA的出现已被AGT替换),有义密码子TCG的出现已被重新编码,使得tRNASer CGA是非必要的(例如,在亲本株的必需基因中的TCG的出现已被AGC替换),并且终止密码子TAG的出现已被重新编码,使得RF-1是非必要的(例如,在亲本株的必需基因中的TAG的出现已被TAA替换)。所述细菌已被修饰以包括第一、第二和第三正交氨酰基-tRNA合成酶-tRNA对,其能够解码TCA、TCG和TAG密码子并且能够在聚合物形成过程中将第一、第二和第三非经典氨基酸掺入到此类位点中。
在特定的实施方案中,用于本方法的原核细胞是Syn61Δ3、Syn61Δ3(ev3)、Syn61Δ3(ev4)或Syn61Δ3(ev5)。因此,原核细胞可包含与SEQ ID NO.5至8中任一项至少80%、85%、90%、95%、98%、99%、99.5%、99.8%、99.9%或100%同一的基因组。序列同一性百分比的计算排除了已被插入从而能够表达正交氨酰基-tRNA合成酶-tRNA对的任何序列。
正交tRNA合成酶-tRNA对可以是本文所述的任何正交tRNA合成酶-tRNA对。
在特定的实施方案中,正交tRNA合成酶-tRNA对是:MmPylRS/MmtRNAPyl YYY;1R26PylRS/AlvtRNAΔNPyl(8) YYY;和AfTyrRS/Af-tRNATyr(A01) YYY。MmtRNAPyl YYY可以是MmtRNAPyl UGA。1R26PylRS可以是1R26PylRS(CbzK)。AlvtRNAΔNPyl(8) YYY可以是AlvtRNAΔNPyl(8) CGA。AfTyrRS可以是AfTyrRS(p-I-Phe)。Af-tRNATyr(A01) YYY可以是Af-tRNATyr(A01) CUA
在其他实施方案中,正交tRNA合成酶-tRNA对是:MmPylRS/MmtRNAPyl YYY;1R26PylRS/AlvtRNAΔNPyl(8) YYY;和MjTyrRS/MjtRNATyr YYY。MmtRNAPyl YYY可以是MmtRNAPyl lUGA。1R26PylRS可以是1R26PylRS(CbzK)。AlvtRNAΔNPyl(8) YYY可以是AlvtRNAΔNPyl(8) CGA。MjTyrRS可以是MjTyrRS(3-硝基-Tyr)或MjTyrRS(p-Az-Phe)。MjtRNATyr YYY可以是MjtRNATyr CUA
图S5提供了与使用Syn61Δ3(ev5)产生含有响应于有义密码子或终止密码子的ncAA的蛋白相关的数据。作为对照,MDS42细胞也被用来产生含有响应于终止密码子的ncAA的蛋白。从该图中可以看出,与对照相比,Syn61Δ3(ev5)的含有响应于琥珀密码子而掺入的ncAA的报告蛋白的产率(与wt相比的比率)大大提高。因此,本发明公开的原核细胞和使用所述原核细胞的方法相对于现有技术具有令人惊讶的改进,即使在生产相同的产品时也是如此。
与蛋白产量相关的更多数据在表1(数据文件S4)中提供。
原核细胞,例如大肠杆菌,通常不能掺入大多数真核翻译后修饰,例如泛素化、糖基化和磷酸化,它们通常也不能进行其他真核成熟过程和蛋白水解性的蛋白熟化。此外,正确的二硫键形成和脂多糖污染可能是个问题(参见Ovaa,H.,2014.Frontiers inchemistry,2,p.15)。然而,治疗性蛋白,如抗体、酶和细胞因子,通常带有翻译后修饰和二硫键,并且通常需要蛋白水解性熟化才能获得其正确折叠状态。因此,大多数治疗性蛋白是在真核和哺乳动物细胞系统中产生的。然而,在原核细胞(例如大肠杆菌)中的表达通常更便宜,更易于进行遗传修饰,并且在突变体文库开发方面具有通用性,并且适合工业规模发酵(Ovaa,H.,2014.Frontiers in chemistry,2,p.15)。
因此,在一些实施方案中,合成的聚合物是治疗性多肽,任选地其中哺乳动物蛋白修饰已通过一种或多种非经典氨基酸而引入。合成的聚合物可以是蛋白,例如治疗性蛋白,其包含至少三种不同类型的非经典氨基酸。
本文提供的实验数据表明,本发明的原核细胞可用于产生含有第一、第二和第三非经典氨基酸的聚合物,其中每一个非经典氨基酸可以彼此不同。令人惊讶的是,发明人证明,可以生产含有彼此直接相邻的非经典氨基酸的聚合物。事实上,聚合物甚至可只含有非经典氨基酸。虽然已知核糖体能够一次耐受一种非经典氨基酸,但从未证明同一核糖体中同时存在两种非经典氨基酸将允许多产的肽合成。如实施例中所讨论的,对于由两种不同单体(A和B)组成的线性聚合物,有四个基本聚合步骤(A+B->AB、B+A->BA、A+A->AA、B+B->BB)可以组成任何序列(图5A)。对于核糖体介导的聚合,这四个基本步骤对应于充当A位点或P位点底物的每个单体,以与相同单体的另一个拷贝或与不同单体形成键(图5A)。据发明人所知,实施例中给出的实验数据首次表明这四个聚合步骤中的每一个都是可能的。
因此,在一些实施方案中,合成的聚合物、多肽或蛋白可以包括至少一个非经典氨基酸与另一个非经典氨基酸直接相邻。该聚合物、多肽或蛋白可以包括彼此直接相邻的2个、3个、4个、5个、6个、7个、8个、9个、10个、15个、20个或更多个非经典氨基酸的链。该链可以包含两个或三个不同的非经典氨基酸。
在一些实施方案中,多肽可以从合成的聚合物上切割。例如,核酸可以编码预期产物任一侧的切割或可切割位点。经切割的产物可以完全由非经典氨基酸组成或可以包含一个或多个经典氨基酸。经切割的产物可以是本文描述的非经典氨基酸的链。
合成的聚合物(包括线性或环状聚合物)或蛋白可以在合成方法之后纯化。纯化可以采取本领域已知的任何形式,以便将聚合物或蛋白从制备它的细胞和培养物分离。
发明人在此证明了本发明的原核细胞用于生产环状聚合物的用途。环状聚合物可以通过聚合物的合成来产生,如本文所述,其中该聚合物能够自环化。该方法可以包括从聚合物中切割肽,其中该肽能够自环化。所述自环化可以是切割过程的一部分,但不要求如此。最终产物可以是大环。
大环可包括4个、5个、6个、7个、8个、9个、10个、15个、20个或更多个单体。大环可包括至少第一、第二和第三非经典氨基酸。
本发明的原核细胞可用于产生通过任何其他方法无法获得的产物。因此,在本发明的一个方面,提供了通过本发明的方法获得的或可通过本发明的方法获得的聚合物。在一个实施方案中,聚合物包含至少一个第一非经典氨基酸、至少一个第二非经典氨基酸和任选的至少一个第三非经典氨基酸,其中第一、第二和第三非经典氨基酸氨基酸彼此不同。聚合物可包含至少一个非经典氨基酸与另一个非经典氨基酸直接相邻。聚合物可包括彼此直接相邻的2个、3个、4个、5个、6个、7个、8个、9个、10个、15个、20个或更多个非经典氨基酸的链。聚合物可以是大环或可以是线性的。本发明的大环可包含4个、5个、6个、7个、8个、9个、10个或更多个单体。
本发明的原核细胞可以适合于产生掺入至少一个非经典氨基酸的目标聚合物或蛋白,其中生产速率(rate of production)是野生型对照的生产速率的至少5%、10%、15%、25%、35%50%、60%、70%、80%、90%、100%、110%或140%。
本发明的原核细胞可以适合于产生掺入至少一个非经典氨基酸的目标聚合物或蛋白,其中产率是至少0.5、1、2、5、7.5、10、15、20或25mg/l。
制备本发明的原核细胞的方法
本文提供了用于产生本发明的原核细胞的方法。所述方法的一些方面提供了用于产生所述原核细胞的令人惊讶的有效过程并且产生的原核细胞具有令人惊讶的有益特性。
因此,在本发明的一个方面,提供了一种用于产生原核细胞的方法,其中所述方法包括:
(i)修饰原核细胞以表达适合于解码第一种类型的有义密码子的第一正交氨酰基-tRNA合成酶-tRNA对,其中
原核细胞包含了其中第一种类型的有义密码子已被重新编码使得第一内源tRNA为非必要的基因组;
(ii)在作为第一正交氨酰基-tRNA合成酶的底物的非经典氨基酸的存在下,孵育原核细胞;和
(iii)修饰编码第一内源tRNA的内源基因,使得第一内源tRNA不表达。
步骤(ii)和(iii)可以在步骤(i)之前进行。
在特定的实施方案中,上述方法的步骤(i)和(ii)在步骤(iii)之前进行。发明人发现,这种特定的顺序惊人地有效,并且所述原核细胞在所述方法期间具有改善的生长。不受理论的束缚,发明人假设有益效果源自在可能保留在基因组中的未标注的有义密码子上的停滞减少,因此该特定的步骤顺序缓解了这种停滞并改善了生长。
在特定的实施方案中,提供了一种用于产生原核细胞的方法,其中所述方法包括:
(i)修饰原核细胞以表达适合于解码第一种类型的有义密码子的第一正交氨酰基-tRNA合成酶-tRNA对,其中
原核细胞包含了其中第一种类型的有义密码子已被重新编码使得第一内源tRNA为非必要的基因组;
(ii)在作为第一正交氨酰基-tRNA合成酶的底物的非经典氨基酸的存在下,孵育原核细胞;和
(iii)修饰编码第一内源tRNA的内源基因,使得第一内源tRNA不表达;和
(a)修饰原核细胞以表达适合于解码第二种类型的有义密码子的第二正交氨酰基-tRNA合成酶-tRNA对,其中
原核细胞包含了其中第二种类型的有义密码子已被重新编码使得第二内源tRNA为非必要的基因组;
(b)在作为第二正交氨酰基-tRNA合成酶的底物的非经典氨基酸的存在下,孵育原核细胞;和
(c)修饰编码第二内源tRNA的内源基因,使得第二内源tRNA不表达。
对编码第一或第二内源tRNA的内源基因进行修饰使得第一或第二内源tRNA不表达,这可以根据阻止原核细胞内内源tRNA的功能性形式产生的任何技术来进行。内源tRNA的功能性形式是允许解码tRNA关联密码子的形式。例如,可以删除内源基因或者可以删除基因的一部分以阻止表达。可以删除或改变调节序列以阻止表达。或者,无义、移码或错义突变可以阻止tRNA以功能性形式表达。
步骤(ii)和(iii)可以在步骤(i)之前进行,并且步骤(b)和(c)可以在步骤(a)之前进行。
在特定的实施方案中,上述方法的步骤(i)和(ii)在步骤(iii)之前进行。另外或可选地,步骤(a)和(b)可以在步骤(c)之前进行。发明人发现这种特定的顺序惊人地有效,并且原核细胞在所述方法期间具有改善的生长。不受理论的束缚,发明人假设有益效果源自在可能保留在基因组中的未标注的有义密码子上的停滞减少,因此该特定的步骤顺序缓解了这种停滞并改善了生长。
引入第二正交tRNA合成酶-tRNA对并删除非必要的内源tRNA的步骤(步骤(a)、(b)和(c))可以在引入第一正交tRNA合成酶-tRNA对并删除第一内源tRNA的步骤(步骤(i)、(ii)和(iii))之前、同时或之后进行。
在一个实施方案中,所述方法进一步包括修饰原核细胞以表达适合于解码第一种类型的终止密码子的第三正交氨酰基-tRNA合成酶-tRNA对,其中第一种类型的终止密码子已在原核细胞的基因组内被重新编码,使得第一内源释放因子是非必要的。
这可以应用于包含如本文所讨论的第一种类型和第二种类型的有义密码子的出现减少的重新编码的基因组的任何原核细胞。例如,必需基因(如本文所讨论)可以不包含第一种类型或第二种类型的有义密码子的出现。或者或另外,基因组可包含第一种类型或第二种类型的有义密码子的5、4、3、2、1次出现或不出现。
所述方法可以进一步包括修饰原核细胞以表达适合于解码第一种类型的终止密码子的第三正交氨酰基-tRNA合成酶-tRNA对,其中第一种类型的终止密码子已在原核细胞的基因组内被重新编码,使得第一内源释放因子是非必要的。这可以应用于包含如本文所讨论的第一种类型的终止密码子的出现减少的重新编码的基因组的任何原核细胞。例如,必需基因(如本文所讨论)可以不包含第一种类型的终止密码子的出现。或者或另外,所述基因组可包含第一种类型的终止密码子的5、4、3、2、1次出现或不出现。
产生原核细胞的方法可以例如应用于不表达tRNASer UGA、tRNASer CGA或RF-1的大肠杆菌细胞,其中有义密码子TCA的出现已被重新编码,使得tRNASer UGA是非必要的(例如,亲本株的必需基因中TCA的出现已被AGT替换),有义密码子TCG的出现已被重新编码,使得tRNASer CGA是非必要的(例如亲本株的必需基因中TCG的出现已被AGC替换),并且终止密码子TAG的出现已被重新编码,使得RF-1是非必要的(例如,亲本株的必需基因中TAG的出现已被TAA替换)。
具体地,所述方法可以应用于Syn61、Syn61(ev1)或Syn61(ev2)。因此,所述方法可应用于包含与以下任一项至少80%、85%、90%、95%、98%、99%、99.5%、99.8%、99.9%或100%同一的基因组的细菌:GenBank登录号CP040347.1、SEQ ID NO:3或SEQ ID NO:4。
插入细胞中的正交tRNA合成酶-tRNA对可以是任何合适的配对,包括本文所述的任何配对。
在特定的实施方案中,正交tRNA合成酶-tRNA对是:MmPylRS/MmtRNAPyl YYY;1R26PylRS/AlvtRNAΔNPyl(8) YYY;和AfTyrRS/Af-tRNATyr(A01) CUA。MmtRNAPyl YYY可以是MmtRNAPyl UGA。1R26PylRS可以是1R26PylRS(CbzK)。AlvtRNAΔNPyl(8) YYY可以是AlvtRNAΔNPyl(8) CGA。AfTyrRS可以是AfTyrRS(p-I-Phe)。
在其他实施方案中,正交tRNA合成酶-tRNA对是:MmPylRS/MmtRNAPyl YYY;1R26PylRS/AlvtRNAΔNPyl(8) YYYY;和MjTyrRS/MjtRNATyr CUA。MmtRNAPyl YYY可以是MmtRNAPyl UGA。1R26PylRS可以是1R26Py1RS(CbzK)。AlvtRNAΔNPyl(8) YYY可以是AlvtRNAΔNPyl(8) CGA。MjTyrRS可以是MjTyrRS(3-硝基-Tyr)或MjTyrRS(p-Az-Phe)。
本发明人发现,除非采取特定步骤,否则产生原核细胞的方法可能导致生长缺陷。为了克服这些生长缺陷,发明人利用诱变和选择的方法。在特定的实施方案中,此类方法步骤在本文公开的用于产生原核细胞的方法步骤之前进行。令人惊讶的是,这样的方法可以应用于本上下文。发明人最初假设生长缺陷可能是由于有限量的serV造成的,但进一步的实验表明并不是这样(Fredens等人,2019)。因此,尚不清楚生长缺陷是否可以克服。此外,发明人假设随机诱变和选择可能会逆转基因组的一些重新编码,并且还可能导致空白密码子(blank codon)的通读。然而,如本文公开的实验所证明的,发明人已经能够逆转生长缺陷而不损失期望的功能。
因此,在一个实施方案中,在用于产生原核细胞的方法的步骤之前,所述方法包括:在包含含有本文公开的重新编码的基因组的任何原核细胞的细胞培养物中诱导突变形成;将细胞培养物维持在指数生长条件下;从所述细胞培养物中选择与初始培养物相比具有增加的生长速率的原核细胞;其中,将用于产生原核细胞的方法的步骤应用于所选择的原核细胞。
诱变、突变和选择步骤可以是本文所公开的平行诱变和动态平行选择过程的一部分。平行诱变和动态平行选择过程可以如Schmied等人(W.H.Schmied等人,Controllingorthogonal ribosome subunit interactions enables evolution ofnewfunction.Nature 564,444-448(2018))所公开;其通过引用并入本文。
在一个实施方案中,诱导诱变包括使用诱变质粒。
在特定的实施方案中,诱导诱变包括使用诱变质粒“MP6”。MP6描述在Badran等人(A.H.Badran,D.R.Liu,Development of potent in vivo mutagenesis plasmids withbroad mutational spectra.Nature Communications 6,8425(2015))中;其通过引用并入本文。MP6可以是根据SEQ ID NO:59。
在一些实施方案中,诱变可进行5、10、15、17、20、30、45、60、70、80、100、150、200代或更多代。在特定的实施方案中,诱变可进行约1-200、5-100、10-25、15-20或17代。
在一些实施方案中,诱变后,突变培养物可以维持连续生长。例如,突变培养物可以转移到多个容器中(例如96孔板的孔)。培养物的OD600可在转移后测量,然后每2-9小时定期测量一次,具体取决于生长速率。当至少3个突变培养物的OD600达到0.5的阈值时,可以稀释所有培养物(例如,1/400)到新鲜容器中。如果没有培养物达到阈值,则可以使用三个最高OD600值来估算下一个OD600测量时间点,即达到阈值所需的时间。如果在三次连续OD600测量后少于3个培养物达到阈值,则无论测量的细胞密度如何,都可以在稀释步骤之前将培养物再孵育12小时。总的来说,该过程灵活地调整选择压力,以保持生长最快的培养物呈指数增长。
在一些实施方案中,细胞培养物可以维持在指数生长条件下5、10、15、20、30、40、50、52、60、70、80、100、200代或更多代。在特定的实施方案中,细胞培养物可以维持在指数生长条件下约20-80、30-70、40-60或50代。在示例性实施方案中,代的数量为52。
可以对细胞培养物进行多轮诱变、维持和选择。例如,可以应用一轮、二轮、三轮、四轮、五轮、十轮或更多轮。在特定的实施方案中,应用两轮。在一个实施方案中,每轮包括诱导诱变约10-25(例如17)代,以及在指数生长条件下维持约20-80(例如50)代。
诱变、突变和选择步骤可应用于Syn61、Syn61(ev1)或Syn61(ev2)。因此,所述方法可应用于包含与以下任一项至少80%、85%、90%、95%、98%、99%、99.5%、99.8%、99.9%或100%同一的基因组的细胞:GenBank登录号CP040347.1、SEQ ID NO:3或SEQ IDNO:4中提供的序列。
本发明人还发现,除非采取特定步骤,否则第一内源tRNA、第二内源tRNA和/或第一内源释放因子的去除可能产生生长缺陷。为了克服这些生长缺陷,发明人利用诱变和选择的方法。在特定的实施方案中,此类方法步骤在本文公开的用于产生原核细胞的方法步骤之后进行。至于去除内源基因之前的步骤,假设随机诱变和选择可能会逆转原核细胞的一些期望的技术特征,例如导致空白密码子的通读。然而,发明人再次令人惊讶地发现,可以在不损失期望功能的情况下纠正生长缺陷。
因此,在一个实施方案中,在产生原核细胞的方法的步骤之后,所述方法还包括:从原核细胞获得细胞培养物;在细胞培养物中诱导突变产生;将细胞培养物维持在指数生长条件下;和从所述细胞培养物中选择与初始培养物相比具有增加的生长速率的原核细胞。
诱变、突变和选择步骤可以是平行诱变和动态平行选择过程的一部分,如本文所公开。平行诱变和动态平行选择过程可以如Schmied等人(W.H.S chmied等人,Controllingorthogonfl ribosome subunit interactions enables evolution of newfunction.Nature 564,444-448(2018))所公开;其通过引用并入本文。
发明人发现,诱变质粒MP6在缺乏内源tRNA的细胞中不起作用。为了解决这个问题,发明人设计了一种新的质粒,称为“重新编码的MP6”。该质粒可以是根据SEQ ID NO:67。
在其他实施方案中,诱变质粒可以是已知的质粒,其中该质粒已被重新编码以去除第一种类型的有义密码子、第二种类型的有义密码子和/或第一种类型的终止密码子,并将所述密码子替换为同义密码子。例如,诱变质粒可能仅包含第一种类型的有义密码子、第二种类型的有义密码子或第一种类型的终止密码子的五次、四次、三次、两次、一次出现或不出现。在特定的实施方案中,诱变质粒不包含第一种类型或第二种类型的有义密码子的任何出现,也不包含第一种类型的终止密码子的任何出现。
因此,本文提供了重新编码的MP6或重新编码的诱变质粒用于在重新编码的原核细胞中诱导突变产生的用途。这样的用途可以形成本文所公开的用于产生本发明的原核细胞的方法的一部分。
在一些实施方案中,诱变可进行5、10、15、17、20、30、45、60、70、80、100、150、200代或更多代。在特定的实施方案中,诱变进行至少20、25、30、35或40代。在特定的实施方案中,诱变可进行约1-200、5-100、10-90或25-75代。在具体实例中,诱变可以进行至少或约45、60、70代。
在一些实施方案中,诱变后,突变培养物可以维持连续生长。该过程可以与针对去除内源tRNA和释放因子之前要执行的步骤所讨论的相同。
在一些实施方案中,细胞培养物可以在指数生长条件下维持5、10、15、20、30、40、50、52、60、70、80、100、200代或更多代。在特定的实施方案中,细胞培养物可以在指数生长条件下维持大约20-80、30-70、40-60或50代。在示例性实施方案中,代的数量为52。
可以对细胞培养物进行多轮诱变、维持和选择。例如,可以应用一轮、二轮、三轮、四轮、五轮、十轮或更多轮。在特定的实施方案中,应用三轮。在一个实施方案中,每轮包括诱导诱变至少20代,以及在指数生长条件下维持约20-80(例如50)代。在特定的实施方案中,第一轮可包括约70代,第二轮可包括45代,第三轮可包括60代诱变。
在用于产生本发明的原核细胞的方法期间的任何阶段,所述方法可以包括表型分析测定。表型分析测定包括分析第一种类型的有义密码子、第二种类型的有义密码子和第一种类型的终止密码子是否保持被重新编码。该测定可以包括用报告质粒转化原核细胞,所述报告质粒包含与报告子例如GFP(合适的报告基因在实施例中讨论)连接的重新编码的密码子。还插入了正交aaRS/tRNA对,其能够解码所述重新编码的密码子以掺入ncAA。所述测定然后可以包括在存在或不存在ncAA底物的情况下孵育细胞以确定是否存在依赖于ncAA的报告子信号。进一步的细节在实施例中提供。
如上所述,发明人惊奇地发现,诱变和选择方法可以应用于具有重新编码的基因组的原核细胞而不影响重新编码。
因此,在本发明的一个方面,提供了一种用于提高其中基因组已被重新编码的原核细胞生长速率的方法,其中所述方法包括
在包含含有重新编码的基因组的原核细胞的细胞培养物中诱导诱变,
将细胞培养物维持在指数生长条件下,
从所述细胞培养物中选择与初始培养物相比具有增加的生长速率的原核细胞。
原核细胞可包含其中第一种类型的有义密码子已被重新编码的基因组。第一种类型的有义密码子的重新编码可以是任何有义密码子,包括如本文所公开的任何重新编码类型的有义密码子。原核细胞可包含其中第一种类型和第二种类型的有义密码子已被重新编码的基因组。第一种类型和第二种类型的有义密码子的重新编码可以是任意两种有义密码子,包括如本文所公开的任何重新编码的类型的有义密码子。
诱导诱变、维持细胞和选择细胞的方法可以是本文所公开的任何方法。
重新编码基因组的方法
以下方法使得技术人员能够重新编码基因组以将有义密码子或终止密码子替换为同义密码子。更多信息可见:i)K.Wang等人,Defining synonymous codon compressionschemes by genome recoding.Nature 539,59-64(2016);ii)J.Fredens等人,Totalsynthesis of Escherichia coli with a recoded genome.Nature569,514-518(2019);iii)WO2018/020248;和iv)WO2020/229592(均通过引用并入本文)。
在一个实例中,优选地,使用一轮或多轮重组介导的基因工程化来编辑亲本基因组的10-1000kb、50-1000kb、100-1000kb或100-500kb,以提供两种或更多种不同的部分合成基因组。因此,在优选的实施例中,每轮重组介导的基因工程化在亲本基因组中插入或替换10kb或更多、50kb或更多、100kb或更多或约100kb的DNA。
如本文所用,术语“重组介导的基因工程化”(也称为“重组工程化(recombineering)”)是基于同源重组系统的基因工程化(即编辑基因组)的方法。通常,重组工程化基于大肠杆菌中由细菌噬菌体蛋白(来自Rac原噬菌体的RecE/RecT或来自细菌噬菌体lambda的Redaβδ)介导的同源重组。可以使用任何合适的重组介导的基因工程化方法。重组介导的基因工程化的方法是本领域技术人员公知的。
在“经典重组”(以大肠杆菌中lambda red介导的重组为例)中,合成DNA的短区域可以插入到基因组中或用于替换基因组DNA,可通过两步法:i)用线性双链DNA(dsDNA)转化细胞,所述线性双链DNA携带一段合成DNA,结合有正选择标记,并且两侧侧翼均为基因组目标区域的同源区域(HR),和ii)由同源区域介导重组,然后通过利用正选择标记来选择基因组整合。该方法可用于插入或替换基因组DNA的2-3kb。因此,如果使用经典重组,则需要多轮重组介导的基因工程化来编辑100-500kb的亲本基因组。
因此,在优选的实例中,所述一轮或多轮重组介导的基因工程化包括一轮或多轮复制子切割,用于通过程序重组(REXER)增强基因组工程化。
REXER描述于WO 2018/020248中。每轮REXER可用于插入或替换亲本基因组中约50kb至250kb或约100kb的DNA。
因此,所述一轮或多轮重组介导的基因工程化可以包括:
i)提供宿主细胞(例如大肠杆菌),其中所述宿主细胞包含游离型复制子(例如质粒或细菌人工染色体)和靶核酸(例如基因组),其中游离型复制子包含供体核酸序列(即合成区域),其中供体核酸序列以以下顺序包含:5′-同源重组序列1-感兴趣的序列-同源重组序列2-3′,其中感兴趣的序列包含正选择标记,其中,所述靶核酸以以下顺序包含:5′-同源重组序列1-负选择标记-同源重组序列2-3′;
ii)提供能够支持所述宿主细胞中核酸重组的辅助蛋白(例如λRed蛋白);
iii)提供能够支持所述宿主细胞中核酸切割的辅助蛋白和/或RNA(例如CRISPR/Cas9蛋白/RNA);
iv)诱导所述供体核酸序列的切割;
v)孵育以允许切割的供体核酸和所述靶核酸之间的重组;和
vi)选择已将所述供体核酸掺入到所述靶核酸中的重组体。
适当地选择已将所述供体核酸掺入所述靶核酸中的重组体,这包括选择供体核酸的正选择标记的获得和靶核酸的负选择标记的丧失。适当地,供体核酸的正选择标记的获得和靶核酸的负选择标记的损失的选择是同时进行的。适当地,所述感兴趣的序列包含正选择标记和负选择标记两者。适当地,负选择标记选自sacB(蔗糖敏感性)、rpsL(S12核糖体蛋白-链霉素敏感性)或pheST251A_A294G(4-氯苯丙氨酸敏感性)。适当地,正选择标记选自CmR(氯霉素抗性)、KanR(卡那霉素抗性)、HygR(潮霉素抗性)、庆大霉素R(庆大霉素抗性)或四环素R(四环素抗性)。适当地,选择重组体的步骤包括相继选择所述正和负标记,或相继选择所述负和正标记。适当地,选择重组体的步骤包括同时选择所述正和负标记。
适当地,如上所述的所述方法还包括在靶核酸序列中诱导至少一个双链断裂的步骤,其中所述双链断裂位于所述同源重组序列1和所述同源重组序列2之间。适当地,在靶核酸序列中诱导至少两个双链断裂,其中每个所述双链断裂位于所述同源重组序列1和所述同源重组序列2之间。
适当地,所述切割的供体核酸以所述同源重组序列1开始并以所述同源重组序列2结束。
适当地,所述游离型复制子包含独立于供体核酸序列的负选择标记。适当地,所述方法还包括通过选择不依赖于供体核酸序列的所述负选择标记的丧失,来选择游离型复制子的丧失的步骤。适当地,所述游离型复制子以以下顺序包含:切割剪切位点1-供体核酸序列-切割剪切位点2。适当地,所述靶核酸拥有能够在所述宿主细胞内起作用的其自身复制起点。适当地,所述游离型复制子是质粒核酸。适当地,所述游离型复制子是细菌人工染色体(BAC)。适当地,所述靶核酸是宿主细胞基因组。
游离型复制子(例如BAC)可以通过同源重组来组装,例如在酿酒酵母中,如Kouprina,N.,等人,2004.Methods Mol Biol 255,69-89中所述。组装可以组合:7-14个合成DNA片段,每段长度为6-13kb:选择构建体(包含负选择标记和/或正选择标记);和BAC穿梭载体骨架。所述合成DNA片段可以整体对应于游离型复制子(episomal replicon)中的供体核酸序列(即合成区域),其中每个片段包含80-200bp彼此重叠的DNA序列,并且其中重叠区域不含任何重新编码的靶标。所述片段可以在pSC101或pST载体中提供,侧翼是合适的限制性位点(例如BsaI、AvrII、SpeI或XbaI)。因此,在组装过程中,可以通过用相应的限制性酶消化来切割合成DNA片段。游离型复制子的组装可以通过测序来验证。
适当地,两个同源区域的长度可以是30-100bp或40-50bp或约50bp。
CRISPR/Cas9机器可用于切割。在一些实例中,CRISPR/Cas9机器包括Cas9、tracrRNA和两个间隔RNA,其中间隔RNA靶向用于切割的两个同源区域。在优选的实施方案中,间隔RNA是线性双链间隔子。在其他实施方案中,CRISPR/Cas9机器包含Cas9和两个sgRNA,其中sgRNA靶向用于切割的两个同源区。
可以使用λred重组机器进行重组。Λred重组机器可以包括λα/β/γ。
所述方法可以包括进行一轮或多轮REXER,即利用第一供体核酸序列的如上所述的步骤,选择与所述第一供体核酸序列相邻的另外的供体序列,以及用所述另外的供体核酸序列重复所述步骤,直到部分合成的基因组已被组装。这被称为基因组逐步交换合成(GENESIS),描述在Wang,K.等人,2016.Nature 539,59-64中并示意性地显示在WO2020/229592的图4中。
在优选的实例中,供体序列对应于合成基因组的一些区域。
因此,供体序列(即合成区域)可以包含一种或多种有义密码子的20次或更少次出现;和/或供体序列可以包含10个或更多个、20个或更多个、或者100个或更多个没有一种或多种有义密码子的出现的基因。
供体序列(即合成区域)可以与亲本基因组的序列(即非合成区域)相同,除了它们具有一种或多种有义密码子中每一种的50次或更少次、20次或更少次、10次或更少次、5次或更少次出现或0次出现;和/或相对于亲本基因组中的相应区域包含一种或多种有义密码子中每一种的出现的小于10%、5%、2%、1%、0.5%、0.1%;和/或包含10个或更多个、20个或更多个、或100个或更多个没有一种或多种有义密码子的出现的基因。
还可以相对于亲本基因组的序列(即非合成区域)重构供体序列(即合成区域)。对于3′,3′重叠(即方向相反的基因对),可以在基因之间插入合成插入物。对于3′,3′重叠,合成插入物可以包括重叠区域。对于5′,3′重叠(即方向相同的基因对),可以在基因之间插入合成插入物。对于5′,3′重叠,合成插入物可包含:(i)终止密码子;(ii)距重叠区域上游约20-200bp或20-100bp或20-50bp;和(iii)重叠区域。优选地,合成插入物包含:(i)终止密码子;(ii)距重叠区域上游约20bp;和(iii)重叠区域。在优选的实施方案中,终止密码子与下游基因的原始起始位点符合读框。优选地,终止密码子是TAA。
优选地,供体序列(即合成区域)的大小总共为50-10000kb、100-5000kb、100-2000kb、100-1000kb或100-500kb。优选地,每个供体序列的大小为50-300kb、100-200kb或约100kb。
因此,供体序列各自的大小可以为约100kb并且与亲本基因组的相应序列相同,除了它们不包含一种或多种有义密码子的出现以及亲本基因组中共有包含一种或多种有义密码子的重叠区域的所有基因对被重构,其中基因对是其中有义密码子替换将改变基因对中的两个或任一基因的编码蛋白序列的基因对。
在优选的实施例中,在每轮重组介导的基因工程化之后测试基因组的活力。在一些实例中,在每轮重组介导的基因工程化之后验证基因组的序列。
在一些实施方案中,基因组是减小的合成基因组或最小非合成基因组。“减小的基因组”是通过去除非必需基因和/或非编码区来缩减亲本基因组大小的基因组。“最小基因组”是例如通过删除基因组的所有非必需区域而减小到其最小尺寸同时保持活力的基因组。
重构(refactoring)
基因组包含许多重叠的开放阅读框(ORF),其可归类为3′,3′(方向相反的ORF之间)或5′,3′(方向相同的ORF之间)。待替换的有义密码子可以在亲本基因组的两类重叠中找到。
如果可以在不改变任一ORF的编码蛋白序列(即通过引入同义密码子)的情况下实现重叠内的每个ORF有义密码子的替换,则可能不需要编辑(例如重构)亲本基因组。然而,当编码的蛋白序列通过有义密码子的替换而改变时(即,一个或多个同义有义密码子未被引入到所述ORF的一个或两个中),则可能需要编辑(例如重构)亲本基因组。
因此,在一些实例中,亲本基因组中共有包含有义密码子的重叠区域的一个或多个基因对被重构。“重构”是指基因被重新组织以防止编码的蛋白序列发生变化。优选地,基因对是这样的基因对,其中有义密码子替换(例如,限定的同义密码子替换)将改变基因对中的两个或任一个的编码蛋白序列。最优选地,对亲本基因组中共有包含有义密码子的重叠区域的所有基因对进行重构,其中基因对是其中有义密码子替换(例如限定的同义密码子替换)将改变基因对中的两个或任一个的编码蛋白序列的基因对。
对于3′,3′重叠(即方向相反的基因对),可以在基因之间插入合成插入物。对于3′,3′重叠,合成插入物可以包括重叠区域。
对于5′,3′重叠(即方向相同的基因对,包括上游基因和下游基因),可以在基因之间插入合成插入物。对于5′,3′重叠,合成插入物可包含:(i)终止密码子;(ii)距重叠区域上游的约20-200bp或20-100bp或20-50bp;(iii)重叠区域。优选地,合成插入物包含:(i)终止密码子;(ii)距重叠区域上游的约20bp;和(iii)重叠区域。这保留了下游ORF的RBS序列以及该RBS与其起始密码子之间的距离。在优选的实施方案中,终止密码子与下游基因的原始起始位点符合读框。优选地,终止密码子是TAA。
通用
在所有情况下,当描述“原核细胞”时,本发明还延伸至含有多个原核细胞的细胞培养物。类似地,当描述“细菌”时,本发明还延伸至含有多个细菌的细菌培养物。
可以借助容易获得的序列比较程序来进行序列比较。这些公开和市售的计算机程序可以计算两个或更多个序列之间的序列同一性。
技术人员将理解如何计算两个核酸序列之间的百分比同一性。为了计算两个核酸序列之间的百分比同一性,必须首先准备两个序列的比对,然后计算序列同一性值。两个序列的百分比同一性可以取不同的值,具体取决于:(i)用于比对序列的方法,例如Needleman-Wunsch算法(例如由Needle(EMBOSS)或Stretcher(EMBOSS)采用)、Smith-Waterman算法(例如由Water(EMBOSS)采用))或LALIGN应用(例如由Matcher(EMBOSS)采用);以及(ii)比对方法使用的参数,例如局部与全局比对、使用的矩阵,以及空位采用的参数。
进行比对后,有许多不同的方法来计算两个序列之间的同一性百分比。例如,可以将同一性(identity)的数量除以:(i)最短序列的长度;(ii)比对的长度;(iii)序列的平均长度;(iv)非空位位置的数量;或(iv)排除悬突的等效位置数。此外,应当理解,同一性百分比也强烈依赖于长度。因此,一个序列对越短,人们预期偶然发生的序列同一性就越高。
两个核酸序列之间的百分比同一性的计算可以根据如(N/T)*100的比对来计算,其中N是其中序列共有相同残基的位置的数目,T是比较的位置的总数,包括空位但排除悬突。
序列比对可以是成对序列比对。合适的服务包括Needle(EMBOSS)、Stretcher(EMBOSS)、Water(EMBOSS)、Matcher(EMBOSS)、LALIGN或GeneWise。在实例中,两个核酸序列之间的同一性可以使用设置为默认参数的服务Needle(EMBOSS)来计算,例如矩阵(BLOSUM62)、空位开放(10)、空位延伸(0.5)、末端空位罚分(假)、末端空位开放(10)和末端空位延伸(0.5)。在另一个实例中,两个核酸序列之间的同一性可以使用设置为默认参数的服务Matcher(EMBOSS)来计算,例如矩阵(BLOSUM62)、空位开放(1)、空位延伸(1)。
本文描述的所有特征(包括任何所附权利要求、摘要和附图)和/或如此公开的任何方法或过程的所有步骤可以以任何组合与上述方面中的任何一个组合,除了其中这样的特征和/或步骤中的至少一些相互排斥的组合。
为了更好地理解本发明,并且为了显示如何实施本发明的实施方案,现在将参考实施例,这些实施例不旨在以任何方式限制本发明。
实施例
人们普遍假设,去除细胞tRNA(使其关联密码子变得不可读)可能会为病毒感染建立遗传防火墙,并使得有义密码子重新分配。然而,由于还没有创造出这样的细菌,所以不可能测试这些假设。在此,在大肠杆菌中进行同义密码子压缩和实验室进化后,发明人删除了tRNA和释放因子1(其通常解码两种有义密码子和一种终止密码子),由此产生的细胞无法读取经典的遗传密码,并且对病毒混合物具有完全抗性。发明人重新分配这些密码子以能够有效合成含有三种不同的非经典氨基酸的蛋白。重要的是,本发明人证明了用于编码多种非经典杂聚物和大环化合物的翻译的细胞的容易重编程。
实施例1-产生Syn61Δ3
发明人预期,在单个菌株中,替换细菌细胞基因组中标注的TCA、TCG和TAG密码子将能够删除解码这些密码子的serT和serU(编码tRNASer UGA和tRNASer CGA)和prfA(编码RF-1)(图1A)。发明人之前已经证明,serT、serU和prfA可以在源自Syn61的单独菌株中被删除(18);然而,这并没有捕捉到这些基因之间潜在的发展(epitasis)。因此,本文公开的实验询问是否可以在源自Syn61的单一菌株中删除serT、serU和prfA。
Syn61的生长速率慢,其来源菌株是它的1.6倍(18)。为了在serT、serU和prfA删除之前提高菌株的生长速率,应用了先前描述的随机平行诱变和自动动态平行选择策略(19);该方法使用反馈控制而基于生长速率对突变培养物进行动态稀释,并由此从突变群体中选择快速生长的菌株(图S1A)。通过连续两轮的诱变和选择,产生了菌株Syn61(ev2),其生长速率快,是1.3倍(图1B、图S1B、C、D和E,以及数据文件S1和S2)。
接下来,从Syn61(ev2)中去除serU、serT和prfA以产生Syn61Δ3(图1A、图S1C以及数据文件S1和S2)。这证明,去除Syn61中的目标密码子足以能够删除同一菌株中目标密码子的所有解码器(decoder)。然而,Syn61Δ3的生长速率慢,Syn61(ev2)是其的1.7倍(图1B)。这种生长下降可能是由于Syn61基因组中存在未标注和靶向的目标密码子所致(20,21),也可能是由于tRNA可能发挥的其他非经典作用所致(22,23)。
进行了连续三轮的随机平行诱变和自动动态平行选择,以便使Syn61Δ3进化为Syn61Δ3(ev5),其生长速率快,是Syn61Δ3的1.6倍(图1A和B,图S1B、C、F、G和H,以及数据文件S1)。当在摇瓶中的LB培养基中生长时,Syn61Δ3(ev5)的倍增时间为38.72+/-1.02分钟(图S1I)。相对于Syn61,Syn61Δ3(ev5)包含482个额外突变——420个取代和62个插入缺失——其中72个位于基因间区域(数据文件S1和S3,图S2)。没有目标密码子被恢复,这进一步证明了我们的重新编码方案的稳定性。将非必需基因中的16个有义密码子转换为目标密码子(5xTCG、3xTCA、8xTAG);这些频率与其他密码子观察到的频率相当(数据文件S1)。随后的实验使用Syn61Δ3或其进化衍生物(一旦可用)来研究这些菌株的新特性。
材料和方法——用于实施例1
基因重新编码
对于这项工作中使用的基因和质粒,有必要压缩遗传密码。使用定制Python脚本(18,使用Syn61设计中实施的重新编码规则(TCG至AGC、TCA至AGT、TAG至TAA)压缩蛋白CDS的遗传密码(有关序列详细信息,请见数据文件S2)。
重新编码的辅助质粒和MP6质粒的构建
该章节的所有克隆过程都在大肠杆菌DH10b或MDS42中进行,这两种菌株均含有用于链霉素抗性的rpsLK43R突变。在本研究中用于所有lambda-red介导的重组实验的辅助质粒是参考文献(18)中描述的“辅助”质粒pKW20CDFtet pAraRedCas9tracrRNA的重新编码版本,其在本文中称为“重新编码的辅助质粒”;有关序列详细信息,请参阅数据文件S2。
为了构建重新编码的辅助质粒,首先将序列分为具有20-25bp重叠的5个部分:i)第1部分编码araC、pBAD启动子和lambda-red gamma,ii)第2部分编码lambda-red beta和alpha并且后面是独特的BsaI位点,iii)第3部分编码侧翼是BsaI位点的Cas9,iv)第4部分编码apraR选择标记,v)第5部分编码pCDF起点、tracrRNA盒和氨苄青霉素启动子。
第1-3部分由Genewiz合成,第4部分作为gBloek(IDT)合成,第5部分通过PCR从原始辅助质粒(18)扩增。
为了组装重新编码的辅助质粒,首先通过重叠延伸PCR将第4部分和第5部分合并。然后通过HiFi Assembly(NEB)将产物与部分1和2一起组装到中间质粒中。将中间质粒转化到大肠杆菌MDS42中,并通过下一代测序(NGS)验证其序列。最后,将中间质粒用BsaI消化,并通过HiFi Assembly与第3部分组装在一起,以生成重新编码的辅助质粒。通过NGS验证质粒序列。
发明人设计了MP6诱变质粒(31)的重新编码版本以进行Syn61菌株进化。将重新编码的序列分为四个重叠部分,以便在克隆过程中最小化诱变组分的表达:i)第1部分编码araC和pBAD启动子,ii)第2部分编码大部分dnaQ926并且随后是AvrII位点、PmCDA1和用于氯霉素抗性的cat,iii)第3部分编码dnaQ926的N末端并且随后是dam、seqA、emrR和ugi,以及iv)第4部分包含pCDF起点。第1-3部分由Genewiz和Twist Bioscience合成,而第4部分由原始MP6质粒通过PCR扩增(31)。通过HiFi Assembly(NEB)将第4部分与第1部分和第2部分合并,以生成中间质粒,并通过Sanger测序验证各部分之间的重叠。最后,中间质粒用AyrII消化并通过HiFi Assembly与第3部分组装在一起,以生成重新编码的MP6。通过NGS验证质粒序列(有关序列详细信息,请参阅数据文件S2)。
自动化的平行进化和菌株分离
对Syn61应用两轮平行诱变和自动化动态平行选择,随后对Syn61Δ3应用三轮。对于诱变,用诱变质粒MP6(31)(或用于Syn61Δ3和衍生物进化的重新编码的MP6)转化Syn61,并且使细胞在含有2%葡萄糖和20μg/mL氯霉素的LB琼脂上生长。将96个单独的菌落挑入含有200μL补充有2%葡萄糖和20μg/mL氯霉素的LB培养基的孔中,并将菌落在37℃、220rpm下生长过夜。将浓密的过夜培养物按1/400稀释到补充有20μg/mL氯霉素的新鲜LB培养基中,并生长至OD600~0.1。通过添加L-阿拉伯糖至终浓度为0.5%来诱导诱变,在每个孔中产生独立的突变培养物。突变培养物在37℃、220rpm下生长24小时。在1/400稀释至新鲜诱导培养基(含有20μg/ml氯霉素和0.5%L-阿拉伯糖的LB)的步骤后,培养物在37℃、220rpm下再生长24小时。这相当于诱导诱变大约17代的生长期(2x log2(400))。在随后的几轮进化中,诱变的诱导扩大至70代。在Syn61进化的第1轮和第2轮中,诱导诱变约17代。在Syn61Δ3进化过程中,在第一轮中诱导诱变约70代,在第二轮中诱导诱变约45代,在第三轮中诱导诱变约60代。
诱变后,将突变培养物1/2稀释到新鲜的96孔板中,其中含有补充有2%葡萄糖的200μlLB培养基以抑制诱变。将板转移到机器人平台(Beckman Coulter Biomek FXpaccessirg Thermofisher Cytomat 2C培养箱摇床和Molecular Devices SpectraMax I3读板仪)上进行连续生长(37℃,400rpm)和自动动态平行选择生长最快的克隆(脚本可以在https://github.com/JWChin-Lab获取)。在一开始测量每个孔的OD600,然后每2-9小时定期测量一次,具体取决于生长速率。当至少3个突变孔的OD600达到0.5的阈值时,将所有培养物按1/400稀释至含有补充有2%葡萄糖的200μlLB的新鲜平板中。如果没有孔达到阈值,则使用板上的三个最高OD600值来估计下一个OD600测量时间点,即达到阈值所需的时间。如果连续3次OD600测量后达到阈值的孔少于3个,则无论测量的细胞密度如何,在实施稀释步骤之前将板再孵育12小时。总体而言,该过程灵活地调整选择压力,以保持生长最快的孔呈指数生长。经过6个稀释步骤(相当于52代的预估生长)后,工作流程终止,并确定最终板中所有进化突变孔的生长速率,如下所述。将具有最低倍增时间的进化群体的孔在含有2%葡萄糖和200μg/ml链霉素的LB琼脂平板上划线,并在37℃下孵育过夜以获得单菌落。从每个划线群体中挑出4-12个单独的进化菌落,并测量单独克隆的生长速率,与进化前的祖先株直接比较。准备生长最快的克隆用于下一代测序和进一步分析,如下所述。
经过一轮Syn61进化后,将来自96孔板的10个独立孔的细胞划线以获得单菌落。从这些划线中挑选出80个克隆并筛选它们的倍增时间。在单次重复实验中,最初分离出的80个筛选克隆中有20个的倍增时间缩短。然而,这些克隆中只有4个在所进行具有重复的后续测量中显示出生长改善。这四个克隆中的两个(C02.5和C02.6)来源于一个单孔,另外两个克隆均来源于一个不同的单孔(C04.4和C04.7)。对所有四个克隆进行测序(有关所有累积突变的完整列表,请参阅数据文件S1)。其中一个克隆(C04.4)接后操作并重新命名为Syn61(ev1)。
Syn61(ev1)进化后,对来自96孔板的12个独立孔的细胞进行划线以获得单菌落。从这些划线中挑选出88个克隆并筛选它们的倍增时间。在单次重复实验中,最初分离出的88个筛选克隆中有18个的倍增时间缩短。然而,这些克隆中只有3个在所进行的具有重复的后续测量中显示出生长改善。这些克隆中有两个克隆(A11.2和A11.3)来源于一个单孔,第三个克隆(E10.4)来自一个不同的孔。对所有三个克隆进行测序(有关所有累积突变的完整列表,请参阅数据文件S1)。这些克隆中的一个克隆(A11.2)接后操作并重新命名为Syn61(ev2)。Syn61(ev2)用于产生Syn61Δ3。
Syn61Δ3在两个96孔板中进化。对来自42个独立孔的细胞进行划线,从这些划线的细胞中挑取总共184个克隆,并对其倍增时间进行筛选(其中88个克隆来自板1的22个孔,96个克隆来自板2的20个孔)。184个克隆中有130个最初脱颖而出,与Syn61Δ3相比,倍增时间缩短。在(大部分)的重复生长实验中对22个生长最快的克隆进行了表征。这些克隆来源于11个独立的孔(板2:F11.2、F11.3、F11.5、F11.6、F11.7、F11.8、F11.9、F11.10(全部来自F11孔)、E10.1、E5.1、F5.2、F8.1、F8.2、G5.2、A11.1;板1:A7.4、D8.2、D8.4、A9.1、G8.1、D1.2、D11.1)。对以下克隆进行测序并选择用于进一步测序分析(有关所有累积突变的完整列表,请参阅数据文件S1):A7.4、F11.9、E5.1、D8.2。这些克隆中的一个克隆(F11.9)接后操作并重新命名为Syn61Δ3(ev3)。
将Syn61Δ3(ev3)的96个独立孔进行进化。对总倍增时间最低的19个孔进行划线,并从18个孔中分离出90个克隆,其中有一个孔未能在划线中存活。在单次重复测量中出现了37个倍增时间缩短的克隆。选择生长最快的22个克隆进行重复测量,并鉴定出来自5个不同孔的8个克隆与先祖相比具有改善的生长:E7.4、E7.2(来自孔E7);E10.3、E10.4(来自孔E10);D5.3、D5.1(来自孔D5);D8.1、B9.1。对四个克隆进行测序并选择用于进一步测序分析:E7.4、E7.2、E10.4、D5.3和D8.1(数据文件S1)。选择一个生长改善最大的克隆(E7.4)进行下一轮进化,并将其重新命名为Syn61Δ3(ev4)。
在用初始程序(下一次稀释前的最长生长时间为12小时)实验没有产生任何倍增时间得到改善的孔后,采用改造的选择程序(下一次稀释前的最大生长时间设置为6.5小时而不是12小时),在一个96孔板(板1)中使Syn61Δ3(ev4)进化。还进行了一个连续轮的选择,在板1上没有中间诱变,所得的一组进化池被称为板2。总体而言,在改造的动态选择中存活的孔较少。从板1划线13个孔,从板2划线7个孔,在单个重复测量中筛选了共152个克隆(96个来自板1,56个来自板2)。43个克隆显示出最初的改善的生长,但在重复测量中仅有5个克隆与未进化的祖细胞相比保持了可重复的更快生长,这些克隆全部来自不同的孔,板1:B12.3、D5.3、G12.6、E7.3;板2:E8.4。选择一个克隆作为本研究中使用的最进化的Syn61衍生物(B12.3),并将其重新命名为Syn61Δ3(ev5)。
通过lambda-red重组删除prfA、serU和serT以生成Syn61Δ3
在Syn61(ev2)中进行了serU、serT和prfA的无痕删除,每次删除都通过两次连续的lambda-red介导的重组进行。在第一次重组中,向受体细胞提供双选择标记盒以替换靶基因。在第二次重组中提供修复模板,以去除双选择标记并将其替换为靶基因座的天然环境,其中仅丢失对应于靶基因的序列。
rpsL-kanR选择标记盒(18)的重新编码版本用于所有删除。使用包含与serU、serT和prfA的侧翼基因组序列同源的约50bp同源物的寡核苷酸,扩增重新编码的rpsL-kanR。通过重叠延伸PCR,构建serU、serT和p的修复模板;靶基因直接上游和下游的500-600bp区域是利用经设计重叠约40bp的寡核苷酸而从Syn61基因组DNA模板扩增的。然后通过重叠延伸PCR将这两个片段组合成一个PCR产物,并将其用作修复模板。所有寡核苷酸序列均在数据文件S2中提供。
对于第一次重组,用重新编码的辅助质粒转化Syn61(ev2)细胞。将单菌落接种到含有50μg/ml安普霉素的2xYT培养基中,并以220rpm振荡在37℃下生长过夜。将过夜培养物在500mL含有50μg/ml安普霉素的2xYT培养基中稀释至OD600=0.05,并且使细胞在37℃下振荡生长直至OD600≈0.2。为了诱导lambda-red表达,将L-阿拉伯糖粉末添加到培养物中至终浓度为0.5%w/v,并在37℃下振荡培养培养物额外1小时。细胞在OD600≈0.6时收获,并如前所述将细胞制成电感受态(32)。利用~4μg具有与serU基因座同源的同源物的rpsL-kanRPCR产物,对100μL电感受态细胞进行电穿孔,在4mL SOB中恢复1小时,然后转移至补充有50μg/hd安普霉素的100mL 2xYT中。4小时后,将细胞离心并重悬于500μL H2O中,并以系列稀释液铺板在补充有2%葡萄糖、50μg/ml安普霉素和50μg/ml卡那霉素的2xYT琼脂平板上。将板在37C下孵育过夜,随后挑取单个菌落。将这些菌落重新划线到补充有2%葡萄糖、50μg/ml.安普霉素和50μg/ml卡那霉素的2xYT琼脂平板上。在37C过夜孵育后,使用目标基因座侧翼的引物,通过菌落PCR验证预期的缺失。然后在所得菌株Syn61(ev2)ΔserU.∴.rpsL-kanR中重复该过程,产生serU修复模板并在补充有2%葡萄糖、50μg/ml安普霉素和200μg/ml链霉素的2xYT琼脂平板上进行反选择(counter-selecting)。rpsL-kanR盒的去除通过菌落PCR和桑格测序进行验证。通过类似的两步法依次删除serT和prfA导致Syn61Δ3的产生。
生长速率测量和分析
将细菌克隆在补充有200μg/mL链霉素的LB中于37℃下培养过夜。将过夜培养物1:200稀释到96孔板中的200μL新鲜培养基中。在Infinite 200Pro读板仪(Tecan AG,瑞士)上,在37℃下高速线性振荡下监测生长情况。18小时内每5分钟测量一次OD600。为了测定倍增时间,对生长曲线进行log2转换,并确定所有连续时间点的一阶导数(d(log2(x))/dt)。发明人使用具有最大log2导数的十个连续时间点的平均值来计算倍增时间(1/平均值(最大log2导数))。生长速率计算为具有最大log2导数的十个连续时间点(如上所述)的线性拟合的斜率。使用Prism7(Graphpad)同时对重复进行曲线拟合(线性回归)。误差条显示了拟合的±标准误差。
为了确定标准实验室条件下的生长情况,将Syn61Δ3(ev5)过夜培养物1:100稀释到250ml锥形瓶中的80ml新鲜培养基中。三个重复培养物在37℃下振荡(220rpm)孵育,每10-30分钟进行一次OD600测量,在指数期每10分钟进行一次。对于每个独立培养物,发明人对生长曲线进行log2变换并选择指数期期间生长最快的60分钟窗口。生长速率(斜率)和倍增时间(1/斜率)是根据所述窗口内六个连续时间点的log2导数的线性拟合计算的。使用Prism7(Graphpad)对每次重复进行曲线拟合(线性回归),并计算平均倍增时间和生长速率。误差条显示平均值的±标准误差。
用于下一代测序的全基因组文库的制备
从目标克隆中挑取菌落,用于接种补充有200ug/mL链霉素的5mL LB,并以220rpm振荡在37℃下孵育过夜。按照制造商的说明,使用DNEasy血液和组织试剂盒(QIAgen)从这些培养物中提取基因组DNA。从纯化的基因组DNA中,遵循制造商的方案使用Nextera XTDNA文库制备试剂盒(Illumina)手动或使用Biomek FXp(Beckman Coulter,脚本可在https://github.com/JWChin-Lab获取)制备配对末端测序文库,但体积减少:输入gDNA(0.2ng/μL,1μL)、TD缓冲液(2μL)、ATM(1μL)、NT缓冲液(1μL)、索引(indeces)(1μL)、NPM(3μL)。索引序列是从“Illumina Adapter Sequences”支持文档(Nextera DNA索引,第16页,日期为2020年6月)生成的,其从Biomers购买并以10μM使用。然后按照制造商的说明用AMPureXP磁珠(Beckman Coulter)纯化文库(磁珠与反应体积比为6:10)。通过Qubit(Thermofisher)对文库进行定量,然后汇集文库、变性并使用600个循环(2×300个循环)或150个循环(2×75个循环)的v3MiSeq试剂盒,根据制造商的说明在MiSeq(Illumina)上进行配对末端测序。
Syn61敲除和进化菌株的分析
为了分析本工作中生成的Syn61衍生物的基因组序列,发明人使用了breseq,这是一个软件包,可将下一代测序读段(如上生成)与参考基因组进行比对,并鉴定突变、缺失和插入(33)。该程序用于分析每轮进化或靶基因敲除(serT、serU、prfA)后的分离的克隆,以鉴定这些菌株产生过程中出现的突变(数据文件S1包含所有中间菌株和突变的列表)。此外,先前描述的工作流程(32)(脚本可在https://github.com/TiongSun/iSeq获得)用于将读段与参考Syn61基因组序列进行比对,并在Integrative Genomics Viewer(34)中使读段的比对可视化。此外,发明人鉴定了具有多于一个突变的ORF(图S2)。由于发现源自同一进化池的克隆在其序列上几乎相同,因此发明人在每个池中仅选择一个克隆进行分析,该克隆具有最多的总体突变。发明人将serT、ser口prfA删除之前进化过程中积累的ORF中的所有突变与Syn61Δ3进化中由于去除解码元件后遗传背景的改变而获得的突变分开进行了比较。假设突变是独立事件,发明人通过计算了一个ORF中偶然出现至少两个突变的概率,其中a是ORF总数(Syn61中a=3556),b是一轮进化后ORF中累积的突变的平均数。
实施例2-Syn61Δ3中tRNA的缺失消除了病毒的产生
本发明人在改进的一步生长实验(24)中研究了删除编码tRNASer CGA和tRNASer UGA和RF-1的基因对Syn61Δ3的噬菌体繁殖的影响(图2A)。
对于Syn61(ev2),噬菌体T6(裂解性T-even家族的代表(图2B))的总滴度短暂下降(当噬菌体感染细胞时),然后上升到高于输入滴度的2-logs10,因为感染的细胞产生了新的噬菌体颗粒(图2C,图S3A)。如预期,Syn61(ev2)的OD600通过裂解性的T6噬菌体的感染而降低(图2D)。Syn61ΔRF-1(数据文件S1)和Syn61(ev2)在相当的时间尺度上产生了相当水平的噬菌体,并且在感染后显示出类似的OD600变化。发明人得出结论,单独删除RF-1对T6噬菌体产生或细胞裂解几乎没有影响(如果有的话)。
用T6噬菌体感染Syn61Δ3导致噬菌体总滴度稳定下降。重要的是,这种下降与添加庆大霉素完全抑制蛋白合成以及细胞中的噬菌体产生时观察到的下降相当(图2C,图S3B)。此外,T6感染对Syn61Δ3的生长影响极小(图2D)。发明人得出结论,Syn61Δ3在用T6噬菌体感染后不产生新的噬菌体颗粒,并且T6噬菌体不裂解这些细胞。T7噬菌体也获得了类似的结果,T7噬菌体的40kb基因组中有57个TCG密码子、114个TCA密码子和6个TAG密码子(图S3A、C和D)。发明人用含有lambda、Plvir、T4、T6和T7的噬菌体混合物处理细胞,这些噬菌体的TCA或TCG有义密码子比其基因组中的琥珀终止密码子丰富,是10至58倍(图2E、图S3E),并发现用这种噬菌体混合物处理导致Syn61(ev2)和Syn61ΔRF-1裂解,但对Syn61Δ3的生长影响很小(图2,F和G),表明Syn61Δ3中tRNA的删除提供对多种噬菌体的抗性。
材料和和方法——用于实施例2
一般噬菌体方法
噬菌体λ、P1vir、T4和T6由George Salmond(剑桥大学生物化学系)提供。噬菌体T7获自ATCC(BAA-1025-B2)。通过在噬菌体缓冲液(1mM MgSO4、1mM Tris-HCl、0.1%明胶)中连续稀释原液,然后在顶层琼脂(含0.35%琼脂的LB琼脂)中感染大肠杆菌MG1655,并使菌斑在37℃下成熟过夜,来估计每种噬菌体储备液的滴度。对菌斑进行计数并计算每种储存物的PFU/mL。
感染噬菌体的总滴度
将大肠杆菌Syn61变体的过夜培养物在2xYT中稀释至OD600=0.5,然后将3mL转移至50mL Falcon管中并用噬菌体T6或T7(MOI分别=5·10-2和5·10-5)感染它们。对于每种噬菌体,都包含无细胞对照,其中将噬菌体添加到3mL 2xYT中。将受感染的培养物在37℃下以220rpm振荡孵育4小时。在相关时间点,将100μL样品从每种培养物转移至冰上的微量离心管中,其中含有400μL噬菌体缓冲液和50μL氯仿。立即将样品彻底涡旋,以13000xg离心4分钟,转移至LoBind微量离心管(Eppendorf)并储存于4℃。为了定量噬菌体滴度,每个样品在噬菌体缓冲液中连续稀释。使用10μL相关稀释物感染在2xYT中生长的200μL大肠杆菌MG1655过夜培养物。将感染的细胞与4mL熔化的顶层琼脂混合并倒入TYE琼脂平板上。干燥后,将平板在37℃下孵育过夜,以便细菌菌苔生长和噬菌体菌斑形成。计数菌斑的数量并乘以稀释度,以计算原始样品的噬菌体滴度。
作为背景对照,使大肠杆菌Syn61代谢失活:发明人将过夜培养物在10mL 2xYT中稀释至OD 600=1,添加庆大霉素至终浓度1000μg/mL,并在37℃下以220rpm振荡孵育细胞6小时。将细胞以4000×g离心10分钟,然后吸出含有抗生素的上清液。将失活的细胞重悬于2xYT中至OD600=0.5,并如上所述用噬菌体感染它们。发明人通过35S掺入新合成的蛋白来评估庆大霉素处理的细胞的代谢活性。将1mL庆大霉素处理的大肠杆菌Syn61培养物(OD600=0.5)在1.5μL35S标记的甲硫氨酸和半胱氨酸混合物(11mCi/mL,1175Ci/mmol,PerkinElmer NEG072)的存在下于37℃下孵育1小时。
发明人在孵育结束时测量OD600,以4000×g离心细胞10分钟,用冷PBS洗涤细胞。根据上述OD600测量结果,将细胞重悬于1x BugBuster蛋白提取试剂(Merck)中至密度为1.4x 109个细胞/mL(假设OD600为1.0=1x109个细胞/mL,光程长为1cm)。将细胞裂解1小时,并将相当于2.8x 107个细胞加载到4-12%Bis-tris聚丙烯酰胺凝胶的每条泳道上。然后发明人通过SDS-PAGE分析裂解物,随后按照制造商的说明用快速考马斯染色剂(NeoBiotech)染色。将所得凝胶干燥并暴露于储存磷光屏(GE Healthcare Life Sciences)2周,然后在Amersham Typhoon(GE Healthcare Life Sciences)上成像。
噬菌体感染测定
对于多种噬菌体的同时感染,发明人如上所述制备了Syn61变体的培养物,并添加了所有五种噬菌体的混合物(λ、P1vir、T4、T6和T7,每种噬菌体的MOI=1×10-2)。通过在4小时后测量OD600并与未感染的培养物进行比较来监测细胞生长和裂解。
噬菌体基因组TCG、TCA、TAG密码子计数
发明人使用定制的python 3.7脚本鉴定了不同噬菌体基因组中TCG、TCA和TAG密码子的数量和位置。简而言之,该脚本使用Biopython(35)打开包含目标噬菌体的标注基因组的GenBank文件,然后扫描编码序列以识别目标密码子及其位置,并将它们存储在内存中。然后使用Python文库matploflib(36)生成基因组的图,其中每个目标密码子的位置用垂直线表示。该脚本可从https://github.com/JWChin-Lab获取。
实施例3-ncAA掺入
重新分配目标密码子以用于ncAA掺入
发明人在Syn61Δ3(ev5)中表达了Ub11XXX基因(在位置11处带有TCG、TCA或TAG的泛素-His6)以及编码关联正交MmPylRS/MmtRNAPyl YYY对(25)的基因(其中反密码子与位于Ub基因第11位的密码子互补)(图3A,数据文件S2)。
在不存在添加的ncAA的情况下,从在位置11处带有目标密码子的Ub基因,几乎检测不到泛素,而对照实验表明泛素由不包含任何目标密码子的“野生型”基因产生(图3B)。因此,Syn61Δ3中的内源翻译机器不会读取任何目标密码子。这进一步证明,该菌株中的所有目标密码子都是正交的。
添加用于MmPylRS/MmtRNAPyl对(Nε-((叔丁氧基)羰基)-L-赖氨酸(BocK))(25)的ncAA底物后,产生的泛素水平与野生型对照相当(图3B,数据文件S4)。ESI-MS和MS/MS证明,使用互补的MmPylRS/MmtRNAPyl YYY对响应于每个目标密码子,在Ub的位置11处遗传定向掺入了Bock(图3C,图S4A)。其他实验证明,ncAA能够响应于GST-MBP中有义密码子和终止密码子而有效掺入(图S5,数据文件S4)。发明人证明,响应于每个目标密码子将2、3或4个ncAA掺入单个多肽中的Ub-His6的良好产率(数据文件S4,图3,D至I,以及图S4,B至G),并进一步证明,响应于9个TCG密码子将9个ncAA掺入到单个重复蛋白中(图S6)。总之,这些结果表明,在Syn61Δ3衍生物中有义密码子TCG和TCA以及终止密码子TAG可以有效地重新分配给ncAA。
响应不同的目标密码子编码不同的ncAA
接下来,使用识别不同ncAA并解码不同密码子的工程化的相互正交的aaRS/tRNA对,发明人将TCG、TCA和TAG密码子分配给Syn61Δ3(ev4)中的不同ncAA(图4A、图S7)。响应TCG和TAG密码子,发明人将两种不同的ncAA掺入到泛素中(图4B、图S8A至B),并且证明了在泛素的四个位点处掺入了两种不同的ncAA,其中每种ncAA掺入到蛋白的两个不同位点处(图4B和C、图S8C至E、以及数据文件S4)。响应于TCG、TCA和TAG密码子,发明人将三种不同的ncAA掺入泛素中(图4D、E和图S8F)。发明人通过合成七种不同版本的泛素证明了他们的方法的通用性,每个版本掺入三种不同的ncAA(图S9、图S10、数据文件S4)。
编码的非经典聚合物和大环化合物
对于由两种不同单体(A和B)组成的线性聚合物,有四个基本聚合步骤(A+B->AB、B+A->BA、A+A->AA、B+B->BB)可以组成任何序列(图5A)。对于核糖体介导的聚合,这四个基本步骤对应于充当A位点或P位点底物的每个单体,以与相同单体的另一个拷贝或与不同单体形成键(图5A)。发明人通过在sfGFP基因的密码子3处插入TCG-TCG(编码AA;单体A被任意分配给该命名法中的TCG密码子)、TAG-TAG(编码BB;单体B被分配给TAG密码子)、TCG-TAG(编码AB)和TAG-TCG(编码BA),来编码每个基本步骤。发明人证明了三个单体对的基本步骤:A=BocK,B=p-IPhe;A=CbzK,B=p-I-Phe;A=Nε-烯丙氧基羰基-L-赖氨酸(AllocK),B=CbzK(图5B,图S11)。对于每个单体对,发明人遗传编码了六个完全非天然的四聚体序列和一个六聚体序列,并且对于AllocK、CbzK对是八聚体序列(总共22个合成聚合物序列)(图S11、图5,C、D和E,图S12)。所有编码的聚合均依赖于ncAA(图S11,图5,C,D和E,图S12B),并且ESI-MS证实发明人已经合成了非经典六聚体和八聚体作为sfGFP融合体(图5F,图S12C)。发明人编码了SUMO和GyrA-CBD之间由AllocK和CbzK组成的四聚体和六聚体序列,并纯化了游离聚合物(图5,G、H和I,图S13)。最后,发明人编码了非天然大环化合物的合成,让人想起非核糖体肽合成酶的产物(图5,G和J)。
表1(“数据文件S4”)——表达产量
/>
/>
/>
/>
/>
材料和方法——实施例3
表达泛素和GFP的载体的构建
所有克隆在大肠杆菌DH10b中进行。用于表达泛素(Ub)或sfGFP的质粒是基于pBAD表达系统构建的(37)。重新编码的野生型泛素、sfGFP、apraR和araC订购为gBlocks(IDT)。然后使用HiFi DNA Assembly Mix(NEB)通过4片组装(4-piece assembly)构建质粒,其中重叠片段是i)重新编码的野生型Ub或sfGFP,ii)重新编码的apraR,iii)重新编码的araC,以及iv)pBAD载体起始区域,通过PCR扩增。这生成了质粒pBAD_Ub-wt_rec和pBAD_sfGFP-wt_rec。其中TCG、TCA或TAG密码子被引入Ub或sfGFP基因的这些质粒的变体是通过pBAD_Ub-wt_rec和pBAD_sfGFP-wt_rec的定点诱变生成。有关所有质粒的序列详细信息,请参阅数据文件S2。
构建用于解码TCG、TCA或TAG密码子的aaRS/tRNA质粒
所有克隆在大肠杆菌DH10b中进行。为了掺入一种类型的ncAA,发明人使用了基于pMB1的质粒,该质粒编码指导ncAA掺入的aaRS/tRNA对。对于具有反密码子CGA和UGA的tRNAPyl构建体,发明人设计了pylTtRNA基因(包括来自ref的pylTopt突变(38)),使得整个反密码子茎环(ASL-反密码子加上每一侧的6个核苷酸)被替换为serU(在CGA的情况下)或serT(在UGA的情况下)大肠杆菌基因的ASL序列。
基于pMB1的aaRS/tRNA质粒通过多个片段的HiFi组装而构建,包括i)在组成型glnS启动子控制下重新编码的aaRS,合成为gBlock(IDT),ii)置于lpp启动子和rrnC终止子之间的tRNA基因,合成为gBlock(IDT),iii)重新编码的kanR基因,和iv)通过PCR从先前描述的基于pMB1的质粒(37)扩增的pMB1载体起点。通过该策略,组装了质粒pMB1_MmPylRS_tRNA-Pyl-opt(CGA/UGA/CUA)。所有质粒序列均可通过数据文件S2中列出的它们的Genbank登录号获得。
设计和构建编码aaRS/tRNA对的质粒,用于双重或三重ncAA掺入
对于双重和三重不同ncAA掺入实验,发明人设计了多顺反子编码两个aaRS/tRNA对的质粒(16)。发明人将两个aaRS CDS置于glnS启动子下游;使用RBS计算器程序(https://salislab.net/software/)优化aaRS基因之间的基因间区域。两个tRNA基因均置于lpp启动子的下游。tRNA基因之间的基因间区域基于大肠杆菌基因组中alaX和alaW基因之间的基因间区域。
为了构建编码两个aaRS/tRNA对的质粒,发明人排序了重新编码的aaRS基因,前面是它们相应的RBS序列,作为单独的gBlock(IDT)。多顺反子tRNA与lpp启动子、rrnC终止子和基因间区域一起排序,作为单独的gBlock(IDT)。发明人将编码aaRS基因和tRNA的合成DNA片段以及包含kanR的pMB1骨架(如上所述)通过HiFi Assembly(NEB)组装在一起。由此,发明人产生了质粒pMBl_1R26PylRS(CbzK)_AfTyrRS(p-I-Phe)_AlvtRNA-ΔNPyl(8)(CGA)_AftRN A-Tyr(A01)(CUA)、pMB1MmPylRS_1R26PylRS(CbzK)_MmtRNAPyl-opt(CGA)_AlvtRNA-ΔNPyl(8)(CUA)、pMB1MmPylRS_AfTyrRS(p-I-Phe)_MmtRNA-Pylopt(CGA)-AftRNA-Tyr(A01)(CUA)和pMB1_MmPylRS_1R26PylRS(CbzK)MmtRNA-Pylopt(CGA)_AlvtRNA-ΔNPyl(8)(UGA)。质粒序列可通过数据文件S2中列出的它们的Genbank登录号获得。
为了掺入三种不同的ncAA,发明人使用pMB1_MmPylRS_tRNA-Pyl-opt(UGA)作为模板来PCR扩增包含以下的DNA片段:i)在glnS启动子控制下的MmPylRS和ii)lpp启动子和rrnC终止子之间的pylT-serT(UGA)嵌合tRNA基因(见上文)。然后,发明人使用定点诱变分别创建了中间体pBAD Ub衍生物,其中泛素的密码子位置9、11和14分别替换为TAG、TCG和TCA。接下来,通过HiFi Assembly将MmpylRS/pylTserT(UGA)片段插入中间质粒中泛素基因的下游。最后,使用引物在所得质粒中进行定点诱变,所述引物指导将“opt”突变引入到tRNAPyl的序列中,如ref(38),以生成pBAD_Ub9TAG11TCG14TCA-MmPylRS_MmtRNA-Pyl-opt(UGA)。发明人使用该质粒作为起点来产生pBAD_Ub9TAG11TCG14TCA-MjTyrRS(p-Az-Phe)_tRNA-Mj-Tyr(CUA)和pBAD_Ub9TAG11TCG14TCA-MjTyrRS(3-硝基-TyrRS)_tRNA-Mj-Tyr(CUA),通过HiFi组装,将亲本质粒的aaRS/tRNA对替换为MjTyrRS(p-Az-Phe)或MjTyrRS(3-硝基-TyrRS)的重新编码的合成DNA片段或其相应的tRNA。序列在数据文件S2中有详细说明。
描述将Bock和p-I-Phe掺入到sfGFP中的实验(图5C和F)使用了pBAD_sfGFP_MmPylRS_MmtRNA-Pyl-opt(CGA)的衍生物。从pBAD_Ub9TAG11TCG14TCA-MmPylRS_MmtRNA-Pyl-opt(UGA)开始,发明人通过HiFi组装将Ub基因替换为野生型sfGFP。发明人随后通过定点诱变引入不同的密码子组合,来衍生化sfGFP的位置3。最后,使用定点诱变将每个所得质粒中的ASL从serT替换为serU,生成一组pBAD_sfGFP_MmPylRS_MmtRNA-Pyl-opt(CGA)衍生物(有关质粒的完整列表,请参阅数据文件S2)。
含目标密码子的泛素的Syn61表达的蛋白质印迹分析
为了表达泛素变体,发明人用pMBl_MmPylRS)tRNA-Pyl-opt(YYY)质粒(具有serU(CGA)、serT(UGA)或CUA反密码子,参见数据文件S2)和相关的pBAD_Ub质粒(每个质粒1μL)共转化60μl的电感受态Syn61Δ3、Syn61Δ3(ev3)或Syn61Δ3(ev4)细胞。经电穿孔的细胞在1mL预热的SOB中于37℃下恢复同时在台式热混合器(Eppendorf)上以1000rpm振荡1小时30分钟。恢复后,将1mL细胞稀释到6mL含有50μg/mL卡那霉素和50μg/mL安普霉素的预热2xYT中。然后将稀释的细胞在37℃下孵育18小时同时以220rpm振荡。通过将过夜培养物1:100稀释到5-50mL含有50μg/mL卡那霉素、50μg/mL安普霉素、0.2%L-阿拉伯糖(w/v)和0mM或5mM(Bock)的预热的2xYT中,来启动泛素表达。在37℃下以220rpm振荡表达8小时后,通过离心(4,000xg 20分钟)收获细胞,并将沉淀物-20℃下冷冻直至进一步使用。对于表达后的蛋白质印迹分析,发明人通过在1.5mL微量离心管中离心(10000x g,1分钟),以收获5x107个细胞(假设OD600为1.0=1×109个细胞/mL,光程长为1cm)。将细胞沉淀物重悬于含5%β-巯基乙醇的50μL1x LDS样品缓冲液(BioRad)中,在95℃下煮沸5分钟,然后涡旋5分钟。将10μL的每个样品加载到4-12%Bis-Tris NuPAGE SDS-PAGE凝胶(Invitrogen)中,并在180V下电泳45分钟。使用iBlot 2半湿转膜系统完成向PVDF膜的转膜。然后用5mL Odyssey封闭缓冲液封闭膜30分钟,然后与5mL抗His-tag一抗(Abcam,货号ab18184)在含0.2%Tween-20的封闭缓冲液中按1:1000稀释一起孵育。室温下1小时后,用5mL含有0.2%Tween-20的PBS将膜洗涤3次,每次5分钟。添加以1:15000稀释的5mL体积的二抗,稀释至封闭缓冲液和0.2%Tween-20的50/50混合物中,其补充有0.01%SDS。二抗(IRDye 925-68070,LiCor)在室温下孵育30分钟,然后用5mL含有0.2%Tween-20的PBS洗涤3次,每次5分钟。蛋白质印迹成像在Typhoon Trio磷光成像仪(GE Life Sciences)上进行。
GFP表达测量
发明人在与泛素基因表达(参见上文部分)相同的培养基条件下进行了带有单个或多个TCG、TCA或TAG密码子的重新编码的sfGFP基因的表达。简而言之,将50μL细胞(Syn61Δ3(ev4))与基于pMB1的aaRS/tRNA质粒(1μL)以及pBAD_sfGFP报告质粒(1μL)共同电穿孔。将转化的细胞在1mL SOB中恢复1小时30分钟同时在37℃下以1000rpm振荡,随后将整个1mL细胞接种到含有50μg/mL卡那霉素和50μg/mL安普霉素的6mL2xYT中并在37℃下孵育过夜,同时以220rpm振荡。发明人以96孔微量滴定板形式进行表达,将过夜培养物以1:100接种至含有卡那霉素(50μg/mL)、安普霉素(50μg/mL)、阿拉伯糖(0.2%)并且存在或不存在2mMncAA的0.5mL 2xYT中。将96孔板在Thermo-Shaker(Grant-bio)中以750rpm振荡在37℃下孵育16小时。以3200g离心10分钟后,将细胞沉淀物重悬于150μLPBS中。为了测量针对细胞密度标准化的GFP表达,将100μL重悬细胞转移至Costar透明96孔平底板,并在PHERAstar FS读板器(BMG LABTECH)上记录OD600和GFP荧光(λex:485nm;m:520nm)测量,增益(gain)设置为200,焦点调整为3.5mm。
从大杆菌中纯化His6x标记记的报告蛋白
含有i)携带aaRS/tRNA对的基于pMB1的质粒和ii)pBAD_sfGFP或pBAD_Ub衍生物的细胞(Syn61Δ3(ev4)或Syn61Δ3(ev5))在37℃、220rpm振荡下生长过夜。对于包含单个目标密码子的报告基因,以10mL体积制备过夜培养物,而对于包含多种密码子的报告基因,制备更大体积(20-50mL)的过夜培养物。将表达培养物以4000x g离心10分钟,将沉淀物在冰上冷置,然后将细胞重悬于原始培养物体积的1/20的裂解缓冲液(1x PBS、1x蛋白提取试剂/>50μg/mL DNase 1、100μg/mL溶菌酶、1mM PMSF和20mM咪唑)。将细胞重悬物在4℃下孵育30分钟,然后通过离心(16000x g,4℃,30分钟)澄清裂解物。然后将澄清的裂解物上清液转移至含有50-100μLNi2+-NTA浆液(Qiagen)的新鲜微量离心管中。将Ni2+-NTA混合物在4℃下孵育1小时,同时轻柔翻转。发明人将Ni2+-NTA珠子重力过滤收集在烧结柱上,并将其重悬于500μL洗涤缓冲液(PBS,40mM咪唑,pH 8)中;进行三次洗涤。为了洗脱多组氨酸标记的蛋白,发明人随后将洗涤的珠子重悬于100μL洗脱缓冲液(PBS,300mM咪唑,pH 8)中。离心(1000×g,4℃,1分钟)后,将含有洗脱蛋白的上清液转移至新的微量离心管中,并将洗脱过程重复3次。为了定量蛋白表达产量(mg/L),发明人根据制造商的方案使用QubitTM蛋白测定试剂盒(ThermoScientific),并在后续分析之前将纯化的蛋白储存于-20℃。
从大肠杆菌中纯化GST标记的报告蛋白
以与His6标记的报告子表达相同的方式以10mL体积制备细胞,不同之处在于根据制造商的方案将裂解物与100μL Glutathione SepharaoseTM 4B珠子(GE Healthcare)一起孵育。在4℃温和搅拌下孵育1小时后,发明人用1mLPBS洗涤珠子3次。然后发明人用150μL10mM还原型谷胱甘肽在50mM Tris-HCl pH 8.0中洗脱与珠子结合的GST标记蛋白。将洗脱的蛋白混合至最终浓度的1x LDS样品缓冲液(BioRad),然后将每个样品10ml加载至4-12%Bis-Tris NuPAGE凝胶中。电泳后,将凝胶用InstantBlue(Expedeon)染色30分钟,然后用水冲洗。
用于表达His6-SUMO-ncPeptide-GyrA的载体的构建
重新编码的野生型GyrA-CBD和His6-SUMO订购为gBlocks(IDT)。使用HiFi DNAAssembly Mix(NEB)在4片组装中组装质粒,其中重叠片段包含SUMO和GyrA之间的GS4接头。所述组装包含i)PCR扩增的GS4-GyrA-CBD;ii)His6-SUMO-GS4;iii)含有MmPylRS/MmtRNAPyl CGA对的DNA片段;和iv)通过PCR从pBAD_Ub-wt_rec扩增的Pbad骨架。这生成了质粒pBAD_SUMO-GS4-GyrACBD_MmPylRS_MmtRNA-Pyl-opt(CGA)。其中非经典肽编码序列和/或半胱氨酸密码子嵌入在SUMO和GyrA之间的该质粒的变体通过定点诱变产生。有关所有质粒的序列详细信息,请参阅数据文件S2。
His6-SUM0-ncPeptide-GyrA-CBD融合蛋白的表达
发明人用pBAD_SUMO-XXX-GyrA-CBD_MmPylRS_MmtRNA-Pyl-opt(CGA)或pBAD_SUMO-Cys-XXX-GyrA-CBD_MmPylRS_MmtRNA-Pyl-opt(CGA)衍生物(XXX表示目标肽的编码序列),转化了60μl含有pMB1_MmPylRS_1R26PylRS(CbzK)_MmtRNA-Pyl-opt(CGA)_AlvtRNA-ΔNPy l(8)(CUA)质粒的电感受态Syn61Δ3(ev5)细胞。将经电穿孔的细胞在37℃下在lmLSOB中恢复同时以200rpm振荡,2小时后,将细胞稀释在含有50μg/mL卡那霉素和50μg/mL安普霉素的20mL2xYT中。通过将生长的预培养物添加到500mL TB培养基(维持抗生素选择)中来接种表达培养物。TB培养物在37℃下生长,同时搅拌(200rpm)至OD600为2.5-3.0(约12小时)。通过添加0.4%L-阿拉伯糖和2Mm的两种ncAA(AllocK、CbzK)来诱导表达。14小时后,将培养物分成250mL的等分试样,并通过离心(4000rpm,20分钟,4℃)收获细胞。用PBS洗涤细胞沉淀物并储存在-20℃下。
His6-SUMO-nc肽-GyrA-CBD融合蛋白的纯化和肽切割
将冷冻细胞等分试样解冻并重悬于补充有DNAse(0.01mg/mL)和溶菌酶(0.1mg/mL)的冰冷的MES缓冲液(20mM MES pH 6.9,150mM NaCl)中。将重悬的细胞通过气动匀浆器两次,并通过离心(25000rpm,25分钟)澄清裂解物。将上清液与1mL Ni2+-NTA浆液(20%乙醇中的50%珠子)混合,并在4℃下轻柔搅拌孵育1小时。使用Poly-Prep柱(BioRad),通过重力过滤从上清液分离Ni2+-NTA琼脂糖。用补充有30mM咪唑的30mL MES缓冲液洗涤滤液,随后在含有200mM咪唑的2mL MES缓冲液中洗脱蛋白。将洗脱液浓缩至约10mg/mL,并将缓冲液更换为MES缓冲液。每个切割反应使用4mg蛋白(约100μg肽),其在含有10或200mM DTT(环化或DTT诱导裂解)和0.04mg Ulpl的500μLMES缓冲液中制备。反应在37℃下孵育,并通过LC-MS监测反应进度,完成后(18-48小时),通过C18离心柱纯化(线性AllocK/CbzK四聚体)或热酸性甲醇萃取(线性AllocK/CbzK六聚体,环状AllocK/CbzK四聚体)纯化游离肽。
对于C18离心柱(PierceTM)纯化,基本上按照制造商说明书中所描述地执行方案,唯一的修改是使用70%ACN、0.1%AeOH进行额外的洗涤步骤以去除蛋白,并将洗脱缓冲液替换为90%MeOH,0.2%AcOH。简而言之,将样品与4x样品缓冲液(20%ACN、2%AcOH)混合,并以200μL份加载到激活并平衡的C18离心柱上。通过在1500xg下离心30秒,使反应物通过柱两次。然后用200μL洗涤缓冲液(5%ACN和0.5%AcOH)洗涤柱两次,并用200μL蛋白洗涤缓冲液(70%ACN,0.2%AcOH)洗涤一次。然后用2x 20μL90%MeOH、0.2%AcOH洗脱肽,并在空气流下蒸发甲醇(不蒸发至干燥)。然后用0.2%AeOH将样品重新填充至初始体积,并通过ESI-MS进行分析。
对于热酸性甲醇提取,线性AllocK/CbzK六聚体和环状AllocK/CbzK四聚体肽从反应混合物沉淀,可以通过离心(5分钟,20000rpm)收集,弃去上清液。将肽在200μl的90%甲醇1%AcOH中于55℃重新溶解2小时(长时间孵育会增加Alloc和Cbz保护基团的损失)。在气流下蒸发样品至40μL;此时甲醇浓度保持在>20%以上以确保溶解度。如上所述分析样品的线性AllocK/CbzK四聚体肽。
完整蛋白质谱分析
发明人使用配备有改进的nanoAcquity LC系统的Waters Xevo G2质谱仪进行ESI-MS。简而言之,将注射的蛋白在BEH C4UPLC柱(1.7μm;1.0x 100mm;Waters)上以50μL/min的流速分离。泵在20分钟内输送从2%vol/vol到80%vol/vol(0.1%vol/vol甲酸)的乙腈梯度。柱出口通过电喷雾电离源与混合四极杆飞行时间质谱仪(Waters)直接连接。当使用30V锥孔电压时,以正离子模式采集数据,范围为300-2000m/z。使用MassLynx软件(Waters)中的MaxEnt1函数,对扫描进行解卷积。发明人使用GPMAW(Lighthouse Data)软件计算了理论野生型蛋白分子量,并手动编辑它们以适应ncAA的分子量。
含ncAA的胰蛋白酶肽的串联质谱(MS/MS)
如上所述,发明人利用其C端His6标签纯化了含有ncAA的泛素或GFP蛋白,并在4-12%NuPAGE Bis-Tris凝胶(Invitrogen)上运行纯化的样品。在InstantBlue(Expedeon)染色之后,发明人切割以预测的靶蛋白的近似分子量迁移的凝胶碎片,并将它们进行凝胶内胰蛋白酶消化,如先前所述(37)。将切割的蛋白凝胶碎片用含50mM碳酸氢铵的50%v/v乙腈脱色。用10mM DTT还原并用55mM碘乙酰胺烷基化后,用6ng/μL胰蛋白酶(Promega,英国)在37℃下将蛋白消化过夜。在含有2%v/v乙腈的2%v/v甲酸中提取胰蛋白酶肽,随后使用流速设置为300nL/min的Ultimate U3000HPLC(ThermoScientific Dionex,圣何塞,美国)通过纳米级毛细管LC-MS/MS进行分析。在C18Acclaim PepMap1005μm、100μm×20mnnanoViper(ThermoScientific Dionex,圣何塞,美国)上捕获肽,然后在C18T31.8μm、75μm×250mm nanoEase柱(Waters,曼彻斯特,英国)上分离。乙腈梯度洗脱肽,并使用纳流电喷雾电离源和四极Orbitrap质谱仪(Q-Exactive HFX,ThermoScientific,美国)直接连接分析柱出口。对于基于数据的分析,全MS谱使用60,000分辨率,然后是12MS/MS。MS谱在300-1,800的m/z范围下收集。使用Mascot搜索引擎程序,针对蛋白数据库(UniProt KB)搜索所得LC-MS/MS谱。数据库搜索参数限于5p.p.m的前体离子耐受性和0.1Da的碎片离子耐受性。发明人在搜索参数中设置了多项修改:两个缺失的酶切割,甲硫氨酸氧化、半胱氨酸脲甲基化、焦谷氨酸、赖氨酸至ncAA、苏氨酸至ncAA和丝氨酸至ncAA(ncAA基于实验可变)的可变修饰。蛋白组学软件Scaffold4用于可视化碎片化谱。
实施例4-讨论
发明人进化了Syn61并删除了解码TCG、TCA和TAG密码子的tRNA和释放因子。他们证明,产生的菌株对病毒混合物具有完全抗性。此外,他们证明了响应于所有三种密码子的非经典氨基酸(ncAA)的编码掺入,以及完全非经典杂聚物和大环的编码的可编程细胞合成。
因此,发明人已经合成性解开了他们的菌株与读取经典代码的能力,并且这一进展为生物生产提供了潜在的基础,而没有与病毒污染和裂解相关的灾难性风险(26,27)。发明人指出,他们所实施的合成密码子压缩和密码子重新分配策略类似于针对自然进化过程中的密码子捕获提出的模型(28)。
未来的工作将扩展本文所例证的原理以进一步压缩和重新分配遗传密码。发明人预计,结合细胞翻译机器工程化的不断进步(4),这项工作能够可编程的编码细胞合成一组扩展的具有新兴的潜在有用特性的非经典杂聚物。
参考文献
1.F.H.C.Crick,L.Barnett,S.Brenner,R.J.Watts-Tobin,General Nature ofthe Genetic Code for Proteins.Nature 192,1227-1232(1961).
2.P.Marliere,The farther,the safer:a manifesto for securelynavigating synthetic species away from the old living world.Systems andSynthetic Biology 3,77(2009).
3.J.W.Chin,Expanding and reprogramming the genetic code.Nature 550,53-60(2017).
4.D.de la Torre,J.W.Chin,Reprogramming the genetic code.NatureReviews Genetics 22,169-184(2020).
5.T.Passioura,H.Suga,Reprogramming the genetic code in vitro.TrendsBiochem Sci 39,400-408(2014).
6.A.C.Forster et al.,Programming peptidomimetic syntheses bytranslating genetic codes designed de novo.Proc Natl Acad Sci U S A 100,6353-6357(2003).
7.M.J.Lajoie et al.,Genomically Recoded Organisms Expand BiologicalFunctions.Science 342,357-360(2013).
8.N.J.Ma,F.J.Isaacs,Genomic Recoding Broadly Obstructs thePropagation of Horizontally Transferred Genetic Elements.Cell Systems 3,199-207(2016).
9.G.Korkmaz,M.Holm,T.Wiens,S.Sanyal,Comprehensive analysis of stopcodon usage in bacteria and its correlation with release factor abundance.JBiol Chem 289,30334-30342(2014).
10.D.D.Young,P.G.Schultz,Playing with the Molecules of Life.ACSChemical Biology 13,854-870(2018).
11.C.C.Liu,P.G.Schultz,Adding New Chemistries to the GeneticCode.Annual Review of Biochemistry 79,413-444(2010).
12.Y.Zhang et al.,A semi-synthetic organism that stores and retrievesincreased genetic information.Nature 551,644-647(2017).
13.E.C.Fischer et al.,New codons for efficient production ofunnatural proteins in a semisynthetic organism.Nature Chemical Biology 16,570-576(2020).
14.H.Neumarnn,K.Wang,L.Davis,M.Garcia-Alai,J.W.Chin,Encoding multipleunnatural amino acids via evolution of a quadruplet-decoding ribosome.Nature464,441-444(2010).
15.K.Wang et al.,Optimized orthogonal translation of unnatural aminoacids enables spontaneous protein double-labelling and FRET.Nature Chemistry6,393-403(2014).
16.D.L.Dunkelmann,J.C.W.Willis,A.T.Beattie,J.W.Chin,Engineered triplyorthogonal pyrrolysyl-tRNA synthetase/tRNA pairs enable the genetic encodingof three distinct non-canonical amino acids.Nature Chemistry 12,535-544(2020).
17..J.S.Italia et al.,Mutually Orthogonal Nonsense-SuppressionSystems and Conjugation Chemistries for Precise Protein Labeling at up toThree Distinct Sites.Journal of the American Chemical Society 141,6204-6212(2019).
18.J.Fredens et al.,Total synthesis of Escherichia coli with arecoded genome.Nature 569,514-518(2019).
19.W.H.Schmied et al.,Controlling orthogonal ribosome subunitinteractions enables evolution of new function.Nature 564,444-448(2018).
20.M.R.Hemn et al.,Small Stress Response Proteins in Escherichiacoli:Proteins Missed by Classical Proteomie Studies.Journal of Bacteriology192,46(2010).
21.S.Meydan et al.,Retapamulin-Assisted Ribosome Profiling Revealsthe Alternative Bacterial Proteome.Mol Cell 74,481-493 e486(2019).
22.A.Katz,S.Elgamal,A.Rajkovic,M.Ibba,Non-canonical roles oftRNAs andtRNA mimics in bacterial cell biology.Mol Microbiol 101,545-558(2016).
23.Z.Su,B.Wilson,P.Kumar,A.Dutta,Noncanonical Roles of tRNAs:tRNAFragments and Beyond.Annu Rev Genet 54,47-69(2020).
24.L.You,P.F.Suthers,J.Yin,Effects of Escherichia coli Physiology onGrowth of Phage T7 In Vivo and In Silico.Journal of Bacteriology 184,1888(2002).
25.T.Yanagisawa et al.,Multistep Engineering of Pyrrolysyl-tRNASynthetase to Genetically Encode Ne(o-Azidobenzyloxycarbonyl)lysine for Site-Specific Protein Modification.Chemistry&Biology 15,1187-1197(2008).
26.V.Bethencourt,Virus stalls Genzyme plant.Nature Biotechnology 27,681-681(2009).
27.J.Zahn,M.Halter,in Surveillance and Elimination of BacteriophageContaminationinan Industrial Fermentation Process.(2018).
28.S.Osawa,T.H.Juikes,Codon reassignment(eodon capture)inevolution.Journal of Molecular Evolution 28,271-278(1989).
29.D.Cervettini,K.C.Liu,J.W.Chin,Scripts for Sense Codon ReassignmentEnables Viral Resistance and Encoded Polymer Synthesis.Zenodo,(2021).
30.D.Cervettini et al.,Rapid discovery and evolution of orthogonalaminoacyl-tRNA synthetase-tRNA pairs.Nature Biotechnology 38,989-999(2020).
31.A.H.Badran,D.R.Liu,Development of potent in vivo mutagenesisplasmids with broad mutational spectra.Nature Communications 6,8425(2015).
32.K.Wang et al.,Defining synonymous codon compression schemes bygenome recoding.Nature 539,59-64(2016).
33.D.E.Deatherage,J.E.Barrick,Identification of mutations inlaboratory-evolved microbes from next-generation sequencing data usingbreseq.Methods Mol Biol 1151,
165-188(2014).
34.H.Thorvaldsdóttir,J.T.Robinson,J.P.Mesirov,Integrative GenomiesViewer(IGV):high-performance genomics data visualization andexploration.Briefings in Bioinformatics 14,178-192(2013).
35.P.J.A.Cock et al.,Biopython:freely available Python tools forcomputational molecular biology and bioinformatics.Bioinformatics 25,1422-1423(2009).
36.J.D.Hunter,Matplotlib:A 2D Graphics Environment.Computing inScience&Engineering 9,90-95(2007).
37.T.S.Elliott et al.,Proteome labeling and protein identification inspecific tissues and at specific developmental stages in an animal.NatureBiotechnology32,465-472(2014).
38.C.Fan,H.Xiong,N.M.Reynolds,D.Rationally evolving tRNAPyl forefficient incorporation of noncanonical amino acids.Nucleic Acids Research43,e156-e156(2015).
39.J.N.Beyer et al.,Overcoming Near-Cognate Suppression in a ReleaseFactor1-Deficient Host with an Improved Nitro-Tyrosine tRNASynthetase.Journal of Molecular Biology
432,4690-4704(2020).
40.K.C.Sehultz et al.,A Genetically Encoded Infiared Probe.Journal ofthe American Chemical Society 128,13984-13985(2006).
41.A.Telenti et al.,The Mycobacterium xenopi GyrA protein splicingelement:characterization ofa minimal intein.Journal of Bacteriology 179,6378(1997).
本文提及的数据文件S1、数据文件S2和数据文件S3可见于以下出版物:WesleyE.Robertson,Louise F.H.Funke,Daniel de la Torre,Julius Fredens,ThomasS.Elliott,Martin Spinck,Yonka Christova,Daniele Cervettini,Franz L.KimC.Liu,Salvador Buse,Sarah Maslen,George P.C.Salmond,&Jason W.Chin,Sense CodonReassignment Enables Viral Resistance and Encoded Polymer Synthesis,Science,其通过引用以其整体并入。/>

Claims (122)

1.一种原核细胞,其中:
所述原核细胞不表达第一内源tRNA和第二内源tRNA;和
所述原核细胞包含基因组,其中第一种类型的有义密码子和第二种类型的有义密码子已被重新编码,使得第一内源tRNA和第二内源tRNA是非必要的。
2.根据权利要求1所述的原核细胞,其中:
所述基因组的必需基因不包含第一种类型的有义密码子的出现,并且第一内源tRNA是第一种类型的有义密码子的关联tRNA;和/或
所述基因组的必需基因不包含第二种类型的有义密码子的出现,并且第二内源tRNA是第二种类型的有义密码子的关联tRNA。
3.根据权利要求1或权利要求2所述的原核细胞,其中:
所述基因组包含第一种类型的有义密码子的5、4、3、2、1次出现或不出现,并且第一内源tRNA是第一种类型的有义密码子的关联tRNA;和/或
所述基因组包含第二种类型的有义密码子的5、4、3、2、1次出现或不出现,并且第二内源tRNA是第二种类型的有义密码子的关联tRNA。
4.根据权利要求1至3中任一项所述的原核细胞,其中
第一种类型的有义密码子是TCA,第一内源tRNA是tRNASer UGA;和/或
第二种类型的有义密码子是TCG,第二内源tRNA是tRNASer CGA
5.根据权利要求4所述的原核细胞,其中
亲本株中TCA密码子的多次出现已被替换为AGT;和/或
亲本株中TCG密码子的多次出现已被替换为AGC。
6.根据权利要求1至5中任一项所述的原核细胞,其中:
所述原核细胞不表达第一内源释放因子;和
第一种类型的终止密码子已在基因组内被重新编码,使得第一内源释放因子是非必要的。
7.根据权利要求6所述的原核细胞,其中所述基因组的必需基因不包含所述第一种类型的终止密码子的出现,并且所述第一内源释放因子是所述第一种类型的终止密码子的关联释放因子。
8.根据权利要求6或权利要求7所述的原核细胞,其中所述基因组包含第一种类型的终止密码子的5、4、3、2、1次出现或不出现,并且所述第一内源释放因子是所述第一种类型的终止密码子的关联释放因子。
9.根据权利要求6至8中任一项所述的原核细胞,其中所述第一种类型的终止密码子是TAG并且其中所述第一内源释放因子是RF-1。
10.根据权利要求9所述的原核细胞,其中亲本株中TAG密码子的出现已被替换为TAA。
11.一种原核细胞,其包含与SEQ ID NO:3至8中任一项至少80%、85%、90%、95%、98%、99%、99.5%、99.8%、99.9%或100%同一的基因组。
12.根据权利要求6至11中任一项所述的原核细胞,其中
所述原核细胞表达第三正交氨酰基-tRNA合成酶和第三正交tRNA,
所述第三正交氨酰基-tRNA合成酶和所述第三正交tRNA形成第三正交氨酰基-tRNA合成酶-tRNA对,并且
所述第三正交tRNA能够解码第一种类型的终止密码子。
13.根据权利要求12所述的原核细胞,其中所述第三正交氨酰基-tRNA合成酶-tRNA对是:
AfTyrRS或对非经典氨基酸具有改变的选择性的变体,以及Af-tRNATyr(A01) YYY;或者
MjTyrRS或对非经典氨基酸具有改变的选择性的变体,以及MjtRNATyr YYY
14.根据权利要求1至13中任一项所述的原核细胞,其中
所述原核细胞表达第一正交氨酰基-tRNA合成酶和第一正交tRNA,
所述第一正交氨酰基-tRNA合成酶和所述第一正交tRNA形成第一正交氨酰基-tRNA合成酶-tRNA对,并且
所述第一正交tRNA能够解码第一种类型的有义密码子。
15.根据权利要求14所述的原核细胞,其中所述第一正交氨酰基-tRNA合成酶是MmPylRS或对非经典氨基酸具有改变的选择性的变体,并且所述第一正交tRNA是MmtRNAPylY YYY或MmtRNAPyl UGA
16.根据权利要求1至15中任一项所述的原核细胞,其中
所述原核细胞表达第二正交氨酰基-tRNA合成酶和第二tRNA,
所述第二正交氨酰基-tRNA合成酶和所述第二正交tRNA形成第二正交氨酰基-tRNA合成酶-tRNA对,并且
所述第二正交tRNA能够解码第二种类型的有义密码子。
17.根据权利要求16所述的原核细胞,其中所述第二正交氨酰基-tRNA合成酶是1R26PylRS或对非经典氨基酸具有改变的选择性的变体,并且所述第二正交tRNA是AlvtRNAΔNPyl(8) YYY或AlvtRNAΔNPyl(8) CGA
18.根据权利要求1至17中任一项所述的原核细胞,其中所述原核细胞的生长速率快于亲本株的参考原核细胞的生长速率。
19.根据权利要求18所述的原核细胞,其中所述参考原核细胞是在重新编码基因组以去除第一种类型的有义密码子、第二种类型的有义密码子和第一种类型的终止密码子后直接获得的亲本株的原核细胞。
20.根据权利要求18所述的原核细胞,其中所述参考原核细胞是在去除所述第一内源tRNA、所述第二内源tRNA和所述第一内源释放因子后直接获得的亲本株的原核细胞。
21.根据权利要求1至20中任一项所述的原核细胞,其中所述原核细胞抵抗噬菌体感染和/或F质粒的水平转移。
22.根据权利要求1至20中任一项所述的原核细胞,其中所述原核细胞完全抵抗噬菌体感染和/或F质粒的水平转移。
23.根据权利要求1至22中任一项所述的原核细胞,其中所述原核细胞是细菌细胞或大肠杆菌(Escherichia coli)细胞。
24.根据权利要求1至23中任一项所述的原核细胞,其中所述原核细胞是有活力的。
25.一种用于产生修饰的原核细胞的方法,其中所述方法包括:
(i)修饰原核细胞以表达适合于解码第一种类型的有义密码子的第一正交氨酰基-tRNA合成酶-tRNA对,其中
所述原核细胞包含基因组,其中第一种类型的有义密码子已被重新编码,使得第一内源tRNA是非必要的;
(ii)在作为第一正交氨酰基-tRNA合成酶的底物的非经典氨基酸的存在下,孵育所述原核细胞:和
(iii)修饰编码第一内源tRNA的内源基因,使得第一内源tRNA不表达。
26.根据权利要求25所述的方法,其中步骤(i)和(ii)在步骤(iii)之前进行。
27.根据权利要求25或权利要求26所述的方法,其中所述方法进一步包括:
(a)修饰所述原核细胞以表达适合于解码第二种类型的有义密码子的第二正交氨酰基-tRNA合成酶-tRNA对,其中
所述原核细胞包含基因组,其中第二种类型的有义密码子已被重新编码,使得第二内源tRNA是非必要的;
(b)在作为第二正交氨酰基-tRNA合成酶的底物的非经典氨基酸的存在下,孵育所述原核细胞:和
(c)修饰编码第二内源tRNA的内源基因,使得第二内源tRNA不表达。
28.根据权利要求27所述的方法,其中步骤(i)和(ii)在步骤(iii)之前进行,和/或其中步骤(a)和(b)在步骤(c)之前进行。
29.根据权利要求27或28所述的方法,其中
步骤(a)、(b)和(c)在步骤(i)、(ii)、(iii)之前进行;或者
步骤(a)与步骤(i)同时进行,步骤(b)与步骤(ii)同时进行,步骤(c)与步骤(iii)同时进行:或者
步骤(a)、(b)和(c)在步骤(i)、(ii)、(iii)之后进行。
30.根据权利要求25至29中任一项所述的方法,其中所述基因组的必需基因不包含第一种类型的有义密码子的出现,或者所述基因组包含第一种类型的有义密码子的5、4、3、2、1次出现或不出现。
31.根据权利要求25至30中任一项所述的方法,其中所述第一种类型的有义密码子是TCA并且所述第一内源tRNA是tRNASer UGA
32.根据权利要求31所述的方法,其中所述TCA密码子已被替换为AGT。
33.根据权利要求25至32中任一项所述的方法,其中所述第一正交氨酰基-tRNA合成酶是MmPylRS或对非经典氨基酸具有改变的选择性的变体,并且所述第一正交tRNA是MmtRNAPylY YYY或MmtRNAPyl UGA
34.根据权利要求25至33中任一项所述的方法,其中所述基因组的必需基因不包含第二种类型的有义密码子的出现,或者所述基因组包含第二种类型的有义密码子的5、4、3、2、1次出现或不出现。
35.根据权利要求25至34中任一项所述的方法,其中所述第二种类型的有义密码子是TCG并且所述第二内源tRNA是tRNASer CGA
36.根据权利要求35所述的方法,其中所述TCG密码子被替换为AGC。
37.根据权利要求25至36中任一项所述的方法,其中所述第二正交氨酰基-tRNA合成酶是1R26PylRS或对非经典氨基酸具有改变的选择性的变体,并且所述第二正交tRNA是AlvtRNA△NPyl(8) YYY或AlvtRNAΔNPyl(8) CGA
38.根据权利要求25至37中任一项所述的方法,其中向其应用所述方法的原核细胞的基因组与以下任一项具有至少80%、85%、90%、95%、98%、99%、99.5%、99.8%、99.9%或100%的同一性:GenBank登录号CP040347.1、SEQ ID NO:3或SEQ ID NO:4。
39.根据权利要求25至38中任一项所述的方法,进一步包括:
修饰所述原核细胞以表达适合解码第一种类型的终止密码子的第三正交氨酰基-tRNA合成酶-tRNA对,其中第一种类型的终止密码子已在基因组内被重新编码,使得第一内源释放因子是非必要的。
40.根据权利要求39所述的方法,其中所述基因组的必需基因不包含第一种类型的终止密码子的出现,或者所述基因组包含第一种类型的终止密码子的5、4、3、2、1次出现或不出现。
41.根据权利要求39或40所述的方法,其中所述第一种类型的终止密码子是TAG,并且其中所述第一种类型的终止密码子的关联释放因子是RF-1。
42.根据权利要求41所述的方法,其中所述TAG密码子被TAA替换。
43.根据权利要求39至42中任一项所述的方法,其中所述第三正交氨酰基-tRNA合成酶-tRNA对是:
AfTyrRS或对非经典氨基酸具有改变的选择性的变体,以及Af-tRNATyr(A01) YYY;或者
MjTyrRS或对非经典氨基酸具有改变的选择性的变体,以及MjtRNATyr YYY
44.根据权利要求25至43中任一项所述的方法,其在步骤(i)和(a)之前包括:
在包含含有重新编码的基因组的原核细胞的细胞培养物中诱导诱变,
将细胞培养物维持在指数生长条件下,
从所述细胞培养物中选择与初始培养物相比具有增加的生长速率的原核细胞;和
其中将步骤(i)或(a)应用于所选择的原核细胞。
45.根据权利要求44所述的方法,其中所述诱变、突变和选择是平行诱变和动态平行选择过程的一部分。
46.根据权利要求44或权利要求45所述的方法,其中诱变的诱导包括使用诱变质粒。
47.根据权利要求46所述的方法,其中所述诱变质粒是MP6。
48.根据权利要求44至47中任一项所述的方法,其中在步骤(i)之前,应用两轮的诱变和选择。
49.根据权利要求25至48中任一项所述的方法,在步骤(iii)和/或(c)之后进一步包括:
从所述原核细胞获得细胞培养物,
在细胞培养物中诱导诱变,
将细胞培养物维持在指数生长条件下,以及
从所述细胞培养物中选择与初始培养物相比具有增加的生长速率的原核细胞。
50.根据权利要求49所述的方法,其中所述诱变、突变和选择是平行诱变和动态平行选择过程的一部分。
51.根据权利要求49或权利要求50所述的方法,其中诱变的诱导包括使用诱变质粒,其中所述诱变质粒不包含第一种类型或第二种类型的有义密码子的任何出现也不包含第一种类型的终止密码子的任何出现。
52.根据权利要求51所述的方法,其中所述诱变质粒是MP6,其中所述MP6已被重新编码而不包含第一种类型或第二种类型的有义密码子的任何出现也不包含第一种类型的终止密码子的任何出现。
53.根据权利要求49至52中任一项所述的方法,其中应用三轮的诱变和选择。
54.根据权利要求44至53中任一项所述的方法,其中
诱变进行5、10、15、17、20、30、45、60、70、80、100、150、200代或更多代;和/或
将细胞培养物维持在指数生长条件下5、10、15、20、30、40、50、52、60、70、80、100、200代或更多代。
55.根据权利要求25至54中任一项所述的方法,其中所述原核细胞是细菌细胞或大肠杆菌细胞。
56.一种合成聚合物的方法,包括:
i)提供权利要求1至24中任一项所述的原核细胞或根据权利要求25至55中任一项所述的方法产生的原核细胞,其中所述原核细胞包含第一正交氨酰基-tRNA合成酶-tRNA对;和
使所述原核细胞与编码聚合物的核酸序列接触,所述核酸序列包含第一种类型的有义密码子;
ii)在第一非经典氨基酸的存在下孵育所述原核细胞,其中第一非经典氨基酸是第一正交氨酰基-tRNA合成酶的底物;和
iii)孵育所述原核细胞,以允许通过第一正交氨酰基-tRNA合成酶-tRNA对将第一非经典氨基酸掺入聚合物中。
57.根据权利要求56所述的方法,其中所述原核细胞包含第二正交氨酰基-tRNA合成酶-tRNA对,并且所述核酸序列包含第二种类型的有义密码子,并且其中
步骤ii)包括在第二非经典氨基酸的存在下孵育所述原核细胞,其中所述第二非经典氨基酸是第二正交氨酰基-tRNA合成酶的底物;和
步骤iii)包括孵育所述原核细胞,以允许通过第二第一正交氨酰基-tRNA合成酶-tRNA对将第二非经典氨基酸掺入聚合物中。
58.根据权利要求56或57所述的方法,其中所述原核细胞包含第三正交氨酰基-tRNA合成酶-tRNA对,并且所述核酸序列包含第一种类型的终止密码子,并且其中
步骤ii)包括在第三非经典氨基酸的存在下孵育所述原核细胞,其中第三非经典氨基酸是第三正交氨酰基-tRNA合成酶的底物;和
步骤iii)包括孵育所述原核细胞,以允许通过第三第一正交氨酰基-tRNA合成酶-tRNA对将第三非经典氨基酸掺入聚合物中。
59.根据权利要求56至58中任一项所述的方法,进一步包括:
iv)纯化合成的聚合物。
60.根据权利要求56至59中任一项所述的方法,其中所述合成的聚合物包含与另一非经典氨基酸直接相邻的至少一个非经典氨基酸。
61.根据权利要求56至60中任一项所述的方法,其中所述聚合物包含彼此直接相邻的2个、3个、4个、5个、6个、7个、8个、9个、10个、15个、20个或更多个非经典氨基酸的链。
62.根据权利要求56至61中任一项所述的方法,其中所述聚合物是大环化合物。
63.根据权利要求56至62中任一项所述的方法,其中所述非经典氨基酸包含BocK、CbzK、AllocK、p-I-Phe、CypK、AlkK、3-硝基-Tyr和p-Az-Phe中的任一个或任意组合。
64.一种聚合物,其通过权利要求56至63中任一项所述的方法获得或可通过权利要求56至63中任一项所述的方法获得。
65.分离的1R26PylRS或对非经典氨基酸具有改变的选择性的变体。
66.根据权利要求65所述的分离的1R26PylRS,其中所述分离的1R26PylRS与SEQ IDNO:9至少50%、60%、70%、80%、90%、95%、99%或100%同一,包含以下任意一组突变:i)L121L、L125L、Y126G、M129L、N166N、V168V、Y206Y、A223A;ii)L121L、L125L、Y126Y、M129A、N166N、V168V、Y206F、A223A;iii)L121L、L125L、Y126Y、M129M、N166Q、V168V、Y206F、A223A;iV)L121L、L125L、Y126Y、M129M、N166S、V168M、Y206F、A223G;和v)L121M、L125I、Y126F、M129A、N166N、V168F、Y206Y、A223A。
67.根据权利要求65所述的分离的1R26PylRS,其中所述分离的1R26PylRS与SEQ IDNO:10至14中的任一项至少50%、60%、70%、80%、90%、95%、99%或100%相似或同一。
68.分离的闪烁古生球菌(Archaeoglobus fulgidus)酪氨酰-tRNA合成酶(AfTyrRS),或对非经典氨基酸具有改变的选择性的变体。
69.根据权利要求68所述的分离的4fTyrRS,其中所述分离的AfIyrRS与SEQ ID NO:16至少50%、60%、70%、80%、90%、95%、99%或100%同一,包含以下任意一组突变:i)Y36I、L69M、H74L、Q116E、D165T、I166G、和N190N;ii)Y36T、L69L、H74L、Q116E、D165T、I166G、N190K;和iii)Y36I、L69L、H74L、Q116E、D165T、I166G、N190N。
70.根据权利要求68所述的分离的AfTyrRS,其中所述分离的AfTyrRS与SEQ ID NO:16至19中的任一项至少50%、60%、70%、80%、90%、95%、99%或100%相似或同一。
71.分离的LumlPylRS或对非经典氨基酸具有改变的选择性的变体。
72.根据权利要求71所述的分离的LumlPylRS,其中所述LumlPylRS与SEQ ID NO:32至少50%、60%、70%、80%、90%、95%、99%或100%同一,包含以下任意一组突变:i)L121L、L125L、Y126G、M129L、V168V;和ii)L121M、L125I、Y126F、M129A、V168F。
73.根据权利要求71所述的分离的LumlPylRS,其中所述LumlPylRS与SEQ ID NO:32至34中的任一项至少50%、60%、70%、80%、90%、95%、99%或100%相似或同一。
74.分离的NitroPylRS或对非经典氨基酸具有改变的选择性的变体。
75.根据权利要求74所述的分离的NitroPylRS,其中所述NitroPylRS与SEQ ID NO:36至少50%、60%、70%、80%、90%、95%、99%或100%同一,包含以下取代:L123M、L127I、Y128F、M131A和V169F。
76.根据权利要求74所述的分离的NitroPylRS,其中所述NitroPylRS与SEQ ID NO:35或SEQ ID NO:36至少50%、60%、70%、80%、90%、95%、99%或100%相似或同一。
77.分离的ClosΔNTDPylRS或对非经典氨基酸具有改变的选择性的变体。
78.根据权利要求77所述的分离的ClosΔNTDPylRS,其中所述ClosΔNTDPylRS与SEQID NO:37至少50%、60%、70%、80%、90%、95%、99%或100%同一,包含以下任意一组突变:i)Y126G、M129L、Y208Y,和ii)Y126Y、M129A、Y208F。
79.根据权利要求77所述的分离的ClosΔNTDPylRS,其中所述ClosΔNTDPylRS与SEQID NO:37至39中的任一项至少50%、60%、70%、80%、90%、95%、99%或100%相似或同一。
80.分离的TronΔNTDPylRS或对非经典氨基酸具有改变的选择性的变体。
81.根据权利要求80所述的分离的TronΔNTDPylRS,其中所述TronΔNTDPylRS与SEQID NO:40至少50%、60%、70%、80%、90%、95%、99%或100%相似或同一。
82.分离的GemmΔNTDPylRS或对非经典氨基酸具有改变的选择性的变体。
83.根据权利要求82所述的分离的GemmΔNTDPylRS,其中所述GemmΔNTDPylRS与SEQID NO:41至少50%、60%、70%、80%、90%、95%、99%或100%相似或同一。
84.分离的PGA8ΔNTDPylRS或对非经典氨基酸具有改变的选择性的变体。
85.根据权利要求84所述的分离的PGA8ΔNTDPylRS,其中所述PGASΔNTDPylRS与SEQID NO:42至少50%、60%、70%、80%、90%、95%、99%或100%相似或同一。
86.分离的I2ΔNTDPylRS或对非经典氨基酸具有改变的选择性的变体。
87.根据权利要求86所述的分离的I2ΔNTDPylRS,其中所述I2ΔNTDPylRS与SEQ IDNO:43至少50%、60%、70%、80%、90%、95%、99%或100%相似或同一。
88.分离的D121ΔNTDPylRS或对非经典氨基酸具有改变的选择性的变体。
89.根据权利要求88所述的分离的D121ΔNTDPylRS,其中所述D121ΔNTDPylRS与SEQID NO:44至少50%、60%、70%、80%、90%、95%、99%或100%相似或同一。
90.分离的D416ΔNTDPylRS或对非经典氨基酸具有改变的选择性的变体。
91.根据权利要求90所述的分离的D416ΔNTDPylRS,其中所述D416ΔNTDPylRS与SEQID NO:45至少50%、60%、70%、80%、90%、95%、99%或100%相似或同一。
92.根据权利要求65至91中任一项所述的tRNA合成酶,其中所述tRNA合成酶对以下任一种具有改变的选择性:AllocK、AlkK、BocK、Bta、CbzK、CypK、3-硝基-Tyr、NMH、p-I-Phe、p-Az-Phe和邻-甲基-酪氨酸。
93.一种分离的tRNA,其中所述分离的tRNA与SEQ ID NO:15、20、46-52、54-58、61-66中的任一项至少80%、90%、95%、99%或100%同一。
94.一种宿主细胞,其包含权利要求65至92中任一项所述的tRNA合成酶和tRNA,其中所述tRNA合成酶和tRNA形成正交氨酰基-tRNA合成酶-tRNA对。
95.一种宿主细胞,其包含选自以下列表的两个或三个项的任意组合:
(i)权利要求65至67中任一项所述的tRNA合成酶和tRNA,其中所述tRNA合成酶和tRNA形成正交氨酰基-tRNA合成酶-tRNA对;
(ii)闪烁古生球菌酪氨酰-tRNA合成酶(AfTyrRS),或对非经典氨基酸具有改变的选择性的变体,以及Af-tRNATyr(A01) YYY,其中AfTyrRS和Af-tRNATyr(A01) YYY形成正交氨酰基-tRNA合成酶-tRNA对;
(iii)MmPylRS tRNA合成酶或对非经典氨基酸具有改变的选择性的变体,和MmtRNAPyl YYY,其中MmPylRS tRNA合成酶和MmtRNAPyl YYY形成正交氨酰基-tRNA合成酶-tRNA对。
96.一种宿主细胞,其包含选自以下列表的两个或三个项的任意组合:
(i)权利要求65至67中任一项所述的tRNA合成酶和tRNA,其中所述tRNA合成酶和tRNA形成正交氨酰基-tRNA合成酶-tRNA对;
(ii)AfryrRS或对非经典氨基酸具有改变的选择性的变体,和Af-tRNATyr(A01) YYY,其中AfTyrRS和Af-tRNATyr(A01) YYY形成正交氨酰基-tRNA合成酶-tRNA对;
(iii)詹氏甲烷球菌(Mjannaschii)酪氨酰-tRNA合成酶(MjTyrRS)或对非经典氨基酸具有改变的选择性的变体,和MjtRNATyr YYY,其中MjTyrRS和MjtRNATyr YYY形成正交氨酰基-tRNA合成酶-tRNA对。
97.一种宿主细胞,其包含选自以下列表的两个或三个项的任意组合:
i)A类ΔNPylRS/ΔNPyltRNA对;
ii)B类ΔNPylRS/ΔNPyltRNA对;和
iii)MmPylRS/SpePyltRNA对。
98.根据权利要求94至96中任一项所述的宿主细胞,其中所述宿主细胞是原核细胞或真核细胞、细菌细胞、大肠杆菌细胞、哺乳动物细胞、昆虫细胞或人类细胞。
99.一种提高原核细胞的生长速率的方法,其中所述基因组已被重新编码,其中所述方法包括:
在包含含有重新编码的基因组的原核细胞的细胞培养物中诱导诱变,
将细胞培养物维持在指数生长条件下,
从所述细胞培养物中选择与初始培养物相比具有增加的生长速率的原核细胞。
100.根据权利要求99所述的方法,其中所述诱变、突变和选择是平行诱变和动态平行选择过程的一部分。
101.根据权利要求99或权利要求100所述的方法,其中诱变的诱导包括使用诱变质粒,任选地,其中所述诱变质粒是重新编码的诱变质粒。
102.根据权利要求101所述的方法,其中所述诱变质粒是MP6。
103.根据权利要求99至102中任一项所述的方法,其中应用两轮的诱变和选择。
104.根据权利要求99至103中任一项所述的方法,其中
诱变进行5、10、15、17、20、30、45、60、70、80、100、150、200代或更多代;和/或
将细胞培养物维持在指数生长条件下5、10、15、20、30、40、50、52、60、70、80、100、200代或更多代。
105.根据权利要求99至104中任一项所述的方法,其中所述原核细胞是细菌细胞或大肠杆菌细胞。
106.一种原核细胞,其通过权利要求99至105中任一项的方法获得或可通过权利要求99至105中任一项的方法获得,其中所述原核细胞的生长速率快于亲本株的参考原核细胞的生长速率。
107.一种原核细胞,其中所述原核细胞:
不表达第一内源tRNA;
包含基因组,其中第一种类型的有义密码子已被重新编码,使得第一内源tRNA是非必要的;
表达第一正交氨酰基-tRNA合成酶和第一正交tRNA,
第一正交氨酰基-tRNA合成酶和第一正交tRNA形成第一正交氨酰基-tRNA合成酶-tRNA对,并且
第一正交tRNA能够解码第一种类型的有义密码子。
108.根据权利要求107所述的原核细胞,其中:
所述基因组的必需基因不包含第一种类型的有义密码子的出现,并且第一内源tRNA是第一种类型的有义密码子的关联tRNA。
109.根据权利要求107或权利要求108所述的原核细胞,其中:
所述基因组包含第一种类型的有义密码子的5、4、3、2、1次出现或不出现,并且第一内源tRNA是第一种类型的有义密码子的关联tRNA。
110.根据权利要求107至109中任一项所述的原核细胞,其中
第一种类型的有义密码子是TCA,第一内源tRNA是tRNASer UGA;或者
第一种类型的有义密码子是TCG,第一内源是tRNASer CGA
111.根据权利要求110所述的原核细胞,其中
亲本株中TCA密码子的多次出现已被替换为AGT;和/或
亲本株中TCG密码子的多次出现已被替换为AGC。
112.根据权利要求107至111中任一项所述的原核细胞,其中所述原核细胞:
不表达第二内源tRNA;
包含基因组,其中第二种类型的有义密码子已被重新编码,使得第二内源tRNA是非必要的;
表达第二正交氨酰基-tRNA合成酶和第二tRNA,
所述第二正交氨酰基-tRNA合成酶和所述第二正交tRNA形成第二正交氨酰基-tRNA合成酶-tRNA对,并且
第二正交tRNA能够解码第二种类型的有义密码子。
113.根据权利要求112所述的原核细胞,其中:
所述基因组的必需基因不包含第二种类型的有义密码子的出现,并且第二内源tRNA是第二种类型的有义密码子的关联tRNA。
114.根据权利要求112或权利要求113所述的原核细胞,其中:
所述基因组包含第二种类型的有义密码子的5、4、3、2、1次出现或不出现,并且第二内源tRNA是第二种类型的有义密码子的关联tRNA。
115.根据权利要求112至114中任一项所述的原核细胞,其中
第二种类型的有义密码子是TCA,第二内源tRNA是tRNASer UGA;或者
第二种类型的有义密码子是TCG,第二内源tRNA是tRNASer CGA
116.根据权利要求107至115中任一项所述的原核细胞,其中:
所述原核细胞不表达第一内源释放因子;
第一种类型的终止密码子已在基因组内被重新编码,使得第一内源释放因子是非必要的;
所述原核细胞表达第三正交氨酰基-tRNA合成酶和第三正交tRNA,
所述第三正交氨酰基-tRNA合成酶和所述第三正交tRNA形成第三正交氨酰基-tRNA合成酶-tRNA对,并且
所述第三正交tRNA能够解码第一种类型的终止密码子。
117.根据权利要求116所述的原核细胞,其中所述基因组的必需基因不包含第一种类型的终止密码子的出现,并且所述第一内源释放因子是第一种类型的终止密码子的关联释放因子。
118.根据权利要求116或117所述的原核细胞,其中所述基因组包含第一种类型的终止密码子的5、4、3、2、1次出现或不出现,并且所述第一内源释放因子是第一种类型的终止密码子的关联释放因子。
119.根据权利要求116至118中任一项所述的原核细胞,其中所述第一种类型的终止密码子是TAG,并且其中所述第一内源释放因子是RF-1。
120.根据权利要求119所述的原核细胞,其中亲本株中TAG密码子的出现已被替换为TAA。
121.根据权利要求107至120中任一项所述的原核细胞,其中所述原核细胞是细菌细胞或大肠杆菌细胞。
122.根据权利要求107至121中任一项所述的原核细胞,其中所述原核细胞是有活力的。
CN202180101101.6A 2021-05-28 2021-05-28 微生物及其用途 Pending CN117881779A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/EP2021/064391 WO2022248061A1 (en) 2021-05-28 2021-05-28 Microorganisms and uses thereof

Publications (1)

Publication Number Publication Date
CN117881779A true CN117881779A (zh) 2024-04-12

Family

ID=76553722

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180101101.6A Pending CN117881779A (zh) 2021-05-28 2021-05-28 微生物及其用途

Country Status (7)

Country Link
US (2) US20240117295A1 (zh)
EP (1) EP4347799A1 (zh)
JP (1) JP2024521175A (zh)
CN (1) CN117881779A (zh)
AU (1) AU2021447219A1 (zh)
CA (1) CA3219328A1 (zh)
WO (1) WO2022248061A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115701451B (zh) * 2021-08-02 2023-08-01 宁波鲲鹏生物科技有限公司 高效引入赖氨酸衍生物的氨酰基-tRNA合成酶及其应用
WO2023205267A1 (en) * 2022-04-20 2023-10-26 The Administrators Of The Tulane Educational Fund Enhanced cell-free bacteriophage synthesis by genetic modulation of bacterial transcription/translation machinery (txtl) machinery

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101952428B (zh) 2007-09-20 2013-10-23 独立行政法人理化学研究所 突变体吡咯赖氨酰-tRNA合成酶以及使用该酶的非天然氨基酸整合蛋白质的制造方法
GB201419109D0 (en) 2014-10-27 2014-12-10 Medical Res Council Incorporation of unnatural amino acids into proteins
GB201613135D0 (en) 2016-07-29 2016-09-14 Medical Res Council Genome editing
GB201906775D0 (en) 2019-05-14 2019-06-26 Res & Innovation Uk Synthetic genome

Also Published As

Publication number Publication date
US20240158736A1 (en) 2024-05-16
JP2024521175A (ja) 2024-05-28
US20240117295A1 (en) 2024-04-11
EP4347799A1 (en) 2024-04-10
WO2022248061A1 (en) 2022-12-01
CA3219328A1 (en) 2022-12-01
AU2021447219A1 (en) 2023-11-09

Similar Documents

Publication Publication Date Title
US20240158736A1 (en) Microorganisms and uses thereof
JP6294368B2 (ja) 直交tRNA−アミノアシルtRNAシンテターゼ対を生産するための方法及び組成物
Jiao et al. In situ enhancement of surfactin biosynthesis in Bacillus subtilis using novel artificial inducible promoters
Van Den Berg et al. Improved solubility of TEV protease by directed evolution
US20230392138A1 (en) Synthetic genome
CN107406864B (zh) 用于使用缺乏丝氨酸降解途径的基因工程微生物生产l-丝氨酸的方法
Gemperlein et al. Synthetic biology approaches to establish a heterologous production system for coronatines
EP3330282A1 (en) Cipa, cipb and pixa as scaffolds to organize proteins into crystalline inclusions
JPWO2004053111A1 (ja) 外来遺伝子高発現大腸菌株の選択方法、その方法により選択される大腸菌変異株及びそれを用いる酵素及び化合物の製造方法
WO2024017956A2 (en) Genetic codes
EP1124983B1 (fr) Procede de production in vivo de proteines chimiquement diversifiees par incorporation d'acides amines non conventionnels
WO2016068417A1 (ko) 5'말단 코딩 영역의 코돈을 동의 코돈으로 무작위 치환하여 기능성 발현이 증진된 단백질을 코딩하는 유전자 선별 방법
JP2016032440A (ja) 新規なカウンターセレクションマーカー
Karbalaei-Heidari et al. Genomically integrated orthogonal translation in Escherichia coli, a new synthetic auxotrophic chassis with altered genetic code, genetic firewall, and enhanced protein expression
KR102283628B1 (ko) 바이러스 감염 관련 유전자 불활성에 의해 방향족 아미노산 생산능력이 향상된 균주
Ho et al. Improved pyrrolysine biosynthesis through continuous directed evolution of the complete pathway
WO2023069816A2 (en) Compositions and methods for multiplex decoding of quadruplet codons
WO2016032163A1 (ko) 디제너러시 리프로그래밍을 통한 비천연 단백질 합성 방법
FR2808284A1 (fr) Souches mutantes capables de produire des proteines chimiquement diversifiees par incorporation d'acides amines non conventionnels
Kwon Protein engineering via site-specific incorporation of nonnatural amino acids
Wang Recoding Rare Codons to Unnatural Amino Acids in Bacteria

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination