CN115997022A - 用于细菌细胞中蛋白质合成的完全正交系统 - Google Patents

用于细菌细胞中蛋白质合成的完全正交系统 Download PDF

Info

Publication number
CN115997022A
CN115997022A CN202180035057.3A CN202180035057A CN115997022A CN 115997022 A CN115997022 A CN 115997022A CN 202180035057 A CN202180035057 A CN 202180035057A CN 115997022 A CN115997022 A CN 115997022A
Authority
CN
China
Prior art keywords
engineered
ribosome
rrna
sequence
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180035057.3A
Other languages
English (en)
Inventor
M·C·杰维特
A·S·曼金
N·阿列克萨辛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Illinois
Northwestern University
Original Assignee
University of Illinois
Northwestern University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Illinois, Northwestern University filed Critical University of Illinois
Publication of CN115997022A publication Critical patent/CN115997022A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/67General methods for enhancing the expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1025Acyltransferases (2.3)
    • C12N9/104Aminoacyltransferases (2.3.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y203/00Acyltransferases (2.3)
    • C12Y203/02Aminoacyltransferases (2.3.2)
    • C12Y203/02012Peptidyltransferase (2.3.2.12)

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Chemical & Material Sciences (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本申请公开了工程化多核苷酸、包含所述工程化多核苷酸的工程化核糖体、包含工程化多核苷酸和工程化核糖体的工程化细胞和系统、以及制造和使用所述的工程化多核苷酸、工程化核糖体、工程化细胞和系统的方法。所述的工程化多核苷酸、工程化核糖体和工程化细胞可用于制备序列确定的聚合物以及用于选择能够将非经典氨基酸掺入聚合物中的突变体核糖体。

Description

用于细菌细胞中蛋白质合成的完全正交系统
关于联邦资助的研究或开发的声明
本发明是在美国国家科学基金会授予的MCB-1716766和MCB-1615851的政府支持下完成的。政府对本发明享有一定的权利。
相关专利申请的交叉引用
本申请根据35 USC§119(e)要求2020年3月24日提交的美国临时申请号62/993,860的优先权,该美国临时申请的内容通过引用整体并入本文。
技术领域
本发明涉及工程化多核苷酸、包含所述工程化多核苷酸的工程化核糖体、包含所述工程化多核苷酸和工程化核糖体的工程化细胞和系统,以及制造和使用所述的工程化多核苷酸、工程化核糖体、工程化细胞和系统的方法。所述工程化多核苷酸、工程化核糖体和工程化细胞可用于制备序列确定的聚合物。
技术背景
核糖体是负责蛋白质合成的核糖核蛋白机器。在所有生命界中,核糖体由两个亚基组成,每个亚基都建立在自己的核糖体RNA(rRNA)支架上。亚基的独立但协调的功能,包括它们在起始时缔合、在延伸期间旋转以及在蛋白质释放后解离的能力,是蛋白质合成的既定范例。此外,核糖体的二分性被认为对生物发生至关重要,因为专用的组装因子将未成熟的核糖体亚基分开并阻止它们翻译起始[Karbstein 2013]。亚基的自由交换限制了专门的正交遗传系统的发展,这些系统可以进化出新的功能而不干扰天然的翻译。
核糖体是一个非凡的复杂机器。其中RNA是主要的结构和功能成分的这种大颗粒总是包含协调不同但互补功能的两种亚基:小亚基解码mRNA,而大亚基催化肽键形成并为所述多肽提供出口通道。这些亚基的缔合在整个翻译周期中受到严格调控。首先,几种组装因子阻止这两种亚基在核糖核蛋白成熟期间缔合。随后,翻译的起始也受到严格控制,使得起始因子、mRNA和fMet-tRNAfMet依次加入小亚基形成预起始复合物,然后再招募大亚基。在延伸过程中,两种亚基以大约6度的角度相对于彼此啮合。终止时,新合成的蛋白质从核糖体中释放出来,亚基在称为核糖体循环的主动过程中解离,准备进行另外的翻译轮次。因此,在翻译的特定阶段对程序化的亚基缔合和解离的要求有可能解释为什么核糖体在进化过程中一直保持为两个亚基。尽管无前导mRNAs的起始被认为是由具有预缔合亚基的70S核糖体进行的,但没有实验证据表明可以由具有不可分离亚基的核糖体完成蛋白质合成的完整循环。
两种核糖体亚基在蛋白质生物合成的反复性行为之间的随机交换为制造完全正交的核糖体带来了障碍,这是一项对基础科学和生物工程都有重要意义的任务。以前,可以通过在报道mRNA中放置替代的SD(Shine-Dalgarno)序列并在16S rRNA的抗SD区域中引入互补变化而将小核糖体亚基的亚群从翻译本源mRNA重定向到翻译特定mRNA[Hui 1987;Rackham 2005],这使得能够选择具有新解码特性的突变体30S亚基[Wang 2007]。然而,由于大亚基在天然和正交小亚基之间自由交换,因此不可能产生完全正交的核糖体,从而限制了用于获得专门的新特性的50S亚基的工程化,所述50S亚基包括肽基转移酶中心(PTC)和新生肽出口通道。
其中亚基相互连接的系连式核糖体的工程化可以为制备正交翻译系统、使核糖体进化以在合成生物学中掺入非天然氨基酸、以及分子表征显性致死突变开辟新的领域。以前,我们和其他人公开了系连式核糖体以及制造和使用系连式核糖体的方法。(参见国际公开申请WO2015/184283,“Tethered Ribosomes and Methods of Making and UsingThereof”和Orelle等,“Protein synthesis by ribosomes with tethered subunits”,Nature,2015年8月6日,第524卷,第119页)。在这里,我们公开了对用系连式亚基合并核糖体的系统和方法的进一步改进。
发明内容
本文公开了工程化多核苷酸、工程化核糖体以及工程化细胞和系统。所述工程化多核苷酸、工程化核糖体和工程化细胞和系统可用于制备序列确定的聚合物的方法中。在一些实施方案中,工程化核糖体包含小亚基、大亚基和包含多核苷酸序列的连接部分,其中所述连接部分将小亚基与大亚基系连起来,并且其中所述工程化核糖体能够支持所述序列确定的聚合物的翻译。
在某些实施方案中,所述工程化核糖体的小亚基包含rRNA和蛋白质,所述工程化核糖体的大亚基包含rRNA和蛋白质,并且所述连接部分将小亚基的rRNA与大亚基的rRNA系连起来。在某些实施方案中,大亚基包含23S rRNA的排列变体(permuted variant)。在某些实施方案中,小亚基包含16SrRNA的排列变体。因此,在某些实施方案中,所述工程化核糖体包含工程化多核苷酸,其包含以下(a)与(b)的融合物:(a)16S rRNA、其排列变体或其片段;(b)23S rRNA、其排列变体或其片段。
所公开的工程化核糖体的小亚基的rRNA可以包含抗SD(抗Shine-Dalgarno)序列。在一些实施方案中,所述工程化核糖体的小亚基的rRNA的抗SD序列与包含所述工程化核糖体的工程化宿主细胞的天然抗SD序列相对应或与之相同。在这样的实施方案中,所述工程化核糖体的小亚基的rRNA的抗SD序列针对所述工程化宿主细胞的天然mRNA的SD(Shine-Delgarno)序列表现出反向互补性。在所公开的工程化核糖体的一些实施方案中,所公开的工程化核糖体的小亚基的rRNA通过包含多核苷酸序列的连接部分与大亚基的rRNA系连,其中所述工程化核糖体可以被描述为具有系连式的大亚基和小亚基,并且包括含所述工程化核糖体的工程化宿主细胞的天然抗SD序列,其显示与所述工程化宿主细胞的天然mRNA的SD序列反向互补。因此,具有系连式的大亚基和小亚基的工程化核糖体可以支持使用所述工程化宿主细胞的天然mRNA进行翻译。
在其他实施方案中,工程化核糖体的小亚基的rRNA的抗SD序列被修饰以相对于含所述工程化核糖体的工程化宿主细胞的天然mRNA的抗SD序列(或相对于第一工程化核糖体的抗SD序列)包括碱基置换。在这样的实施方案中,工程化宿主细胞可以被工程化以包含具有修饰的抗SD序列的修饰的mRNA,该修饰的抗SD序列表现出与所述工程化核糖体的小亚基的rRNA的经修饰的抗SD序列反向互补性,从而允许通过具有带有修饰的抗SD序列的rRNA的工程化核糖体翻译修饰的mRNA。
公开的工程化核糖体可以组合用于工程化宿主细胞。在一些实施方案中,所公开的核糖体组合可以包括第一工程化核糖体和第二工程化核糖体。第一工程化核糖体可包含:i)包含核糖体RNA(rRNA)和蛋白质的小亚基,ii)包含核糖体RNA(rRNA)和蛋白质的大亚基,以及iii)连接部分;其中连接部分包含多核苷酸序列并将小亚基的rRNA与大亚基的rRNA系连起来。在一些实施方案中,第一工程化核糖体的小亚基的rRNA包含与工程化宿主细胞的天然mRNA的SD序列相对应的抗SD序列,允许翻译所述工程化宿主细胞的天然mRNA并且优选不允许翻译具有修饰的SD序列(即,相对于所述工程化宿主细胞的天然核糖体的抗SD序列具有一个或多个核苷酸置换的修饰的SD序列)的mRNA。第二工程化核糖体可包含:i)包含rRNA和蛋白质的小亚基;以及ii)包含rRNA和蛋白质的大亚基;其中第二工程化核糖体在大亚基之间缺乏连接部分。在一些实施方案中,第二工程化核糖体的小亚基的rRNA包含相对于工程化宿主细胞的天然核糖体的抗SD序列(和/或相对于第一工程化核糖体的抗SD序列)具有一个或多个核苷酸置换的修饰的抗SD序列。所述修饰的抗SD序列优先允许翻译具有与天然细胞mRNA的SD序列不同的互补或同源SD序列的mRNA模板和/或具有与第一工程化核糖体的抗SD序列不同的抗SD序列的mRNA模板(即,允许翻译具有与第二核糖体的小亚基的rRNA的抗SD序列互补的修饰的SD序列的mRNA,允许第二核糖体翻译具有修饰的SD序列的mRNA,并且优选不允许第二工程化核糖体翻译工程化宿主细胞的天然mRNA)和/或其中第二工程化核糖体在大亚基和/或小亚基中包含相对于工程化宿主细胞的天然核糖体(或相对于第一工程化核糖体)的一个或多个功能改变性突变,所述功能改变性突变不存在于抗SD序列中。
在工程化核糖体的大亚基和小亚基被连接部分系连的某些实施方案中,连接部分将大亚基的螺旋共价结合到小亚基的螺旋。在大亚基包含23S rRNA(或23S rRNA的排列变体)且小亚基包含16S rRNA(或16S rRNA的排列变体)的某些实施方案中,连接部分将23SrRNA(或23S rRNA的排列变体)的螺旋10、螺旋38、螺旋42、螺旋54、螺旋58、螺旋63、螺旋78或螺旋101与16S rRNA(或16S rRNA的排列变体)的螺旋共价结合。在大亚基包含23S rRNA(或23S rRNA的排列变体)且小亚基包含16S rRNA(或16S rRNA的排列变体)的某些实施方案中,连接部分共价结合,连接部分将16S rRNA(或16S rRNA的排列变体)的螺旋11、螺旋26、螺旋33或螺旋44与23S rRNA(或23S rRNA的排列变体)的螺旋共价结合。
在某些实施方案中,大亚基包含L1多核苷酸结构域、L2多核苷酸结构域和C多核苷酸结构域,其中按照从5’到3’的顺序,L1结构域之后依次是C结构域和L2结构域。在某些实施方案中,按照从5’到3’的顺序基本上由L2结构域后接L1结构域组成的多核苷酸与23SrRNA(例如,大肠杆菌(E.coli)的23S rRNA)基本上相同。在某些实施方案中,按照从5’到3’的顺序基本上由L2结构域后接L1结构域组成的多核苷酸与23S rRNA至少95%相同。在某些实施方案中,C结构域包含长度为1-200个核苷酸的多核苷酸。在某些实施方案中,C结构域包含GAGA多核苷酸。
在某些实施方案中,小亚基包含S1多核苷酸结构域和S2多核苷酸结构域,其中按照从5’到3’的顺序,S1结构域之后按序是S2结构域。在某些实施方案中,按照从5’到3’的顺序基本上由S1结构域后接S2结构域组成的多核苷酸与16S rRNA(例如,大肠杆菌的16SrRNA)基本上相同。在某些实施方案中,按照从5’到3’的顺序基本上由S1结构域后接S2结构域组成的多核苷酸与16S rRNA至少95%相同。
在某些实施方案中,连接部分包含T1多核苷酸结构域和T2多核苷酸结构域。在某些实施例中,T1结构域链接S1结构域和L1结构域,并且其中按照从5’到3’的顺序,S1结构域之后依次是T1结构域和L1结构域。在某些实施方案中,T1结构域包含长度为5至200个核苷酸的多核苷酸。在某些实施方案中,T1结构域包含长度为7至40个核苷酸的多核苷酸。在某些实施方案中,T1结构域包含聚腺嘌呤多核苷酸。在某些实施方案中,T1结构域包含长度为7至12个腺嘌呤核苷酸的聚腺嘌呤多核苷酸。在某些实施方案中,T2结构域将S2结构域与L2结构域连接,并且其中按照从5’到3’的顺序,L2结构域之后依次是T2结构域和S2结构域。在某些实施方案中,T2结构域包含长度为5至200个核苷酸的多核苷酸。在某些实施方案中,T2结构域包含长度为7至20个核苷酸的多核苷酸。在某些实施方案中,T2结构域包含聚腺嘌呤多核苷酸。在某些实施方案中,T2结构域包含长度为7至12个腺嘌呤核苷酸的聚腺嘌呤多核苷酸。
在某些实施方案中,工程化核糖体包含S1结构域,按照从5’到3’的顺序,其后依次是T1结构域、L1结构域、C结构域、L2结构域、T2结构域和S2结构域。在某些实施方案中,工程化核糖体包含一种多核苷酸,其按照从5’到3’的顺序基本上由S1结构域、其后依次是T1结构域、L1结构域、C结构域、L2结构域、T2结构域和S2结构域组成。
在某些实施方案中,所公开的工程化核糖体包含相对于野生型宿主细胞(例如相对于野生型大肠杆菌)的突变。在某些实施方案中,所述突变是功能改变性突变。在某些实施方案中,所述功能改变性突变是功能获得性突变。在某些实施方案中,所述功能获得性突变存在于工程化核糖体的大亚基的肽基转移酶中心。在某些实施方案中,所述功能获得性突变存在于工程化核糖体大亚基的肽基转移酶中心的A位点中。在某些实施方案中,所述功能获得性突变存在于工程化核糖体的大亚基的出口通道中。在某些实施方案中,工程化核糖体包含存在于工程化核糖体的大亚基和/或小亚基中的抗生素抗性突变。
本文还公开了多核苷酸,即编码工程化核糖体的rRNA的多核苷酸。在某些实施方案中,所述多核苷酸是载体。在某些实施方案中,所述多核苷酸进一步包含将由工程化核糖体表达的基因。在某些实施方案中,所述基因是报道基因。在某些实施方案中,所述报道基因是绿色荧光蛋白基因。在某些实施方案中,工程化核糖体包含经修饰的抗SD序列,并且所述基因包含与工程化核糖体的所述抗SD序列相对应的互补性的经修饰SD序列。在某些实施方案中,所述基因包含密码子并且该密码子编码非天然氨基酸。在一些实施方案中,包含经修饰的抗SD序列的核糖体是未系连的核糖体。
本文还公开了用于制备工程化核糖体的方法,该方法包括例如在工程化宿主细胞如大肠杆菌中表达编码工程化核糖体的rRNA的多核苷酸。在某些实施方案中,该方法进一步包括在宿主细胞中制备工程化核糖体,表达选择标记物,以及选择在工程化宿主细胞中表达所述选择标记物的工程化核糖体。在一些实施方案中,选择的工程化核糖体将包括相对于工程化宿主细胞中表达的工程化核糖体(和/或相对于工程化宿主细胞的天然核糖体)的一个或多个突变。在某些实施方案中,选择步骤包括阴性选择步骤、阳性选择步骤或阴性选择步骤和阳性选择步骤两者。
本文还公开了工程化细胞。所述工程化细胞是宿主细胞,例如大肠杆菌细胞,其包含:(i)编码工程化核糖体的rRNA的多核苷酸,(ii)工程化核糖体,或(i)和(ii)两者。在一些实施方案中,工程化宿主细胞包含具有系连的大亚基和小亚基的第一工程化核糖体,其中小亚基包含具有与工程化宿主细胞的天然mRNA的SD序列相对应的抗SD序列的rRNA。在一些实施方案中,工程化宿主细胞还包含具有未系连的大亚基和小亚基的第二工程化核糖体,其中小亚基包含具有抗SD序列的rRNA,其相对于工程化宿主细胞的天然mRNA的SD序列经过修饰且允许翻译具有与第二核糖体的小亚基的rRNA的经修饰的抗SD序列相对应的经修饰的SD序列的mRNA。
在一些实施方案中,工程化细胞包含第一蛋白质翻译机制和第二蛋白质翻译机制。第一蛋白质翻译机制可以包括第一工程化核糖体,其中第一工程化核糖体包括用于系连第一和第二亚基的连接部分。第二翻译机制可以包括第二工程化核糖体,其中第二工程化核糖体在大亚基和小亚基之间没有连接部分。在一些实施方案中,第二工程化核糖体包含相对于与天然mRNA的SD序列互补的天然核糖体的抗SD序列(和/或相对于第一工程化核糖体的抗SD序列)的经修饰的抗SD序列,和/或包含相对于工程化细胞的天然核糖体(和/或相对于第一工程化核糖体)的在抗SD序列以外的功能改变性突变。
本文还公开了用于制备序列确定的聚合物的方法,该方法包括(a)提供工程化核糖体或包含一种或多种工程化核糖体的工程化细胞,和(b)提供编码序列确定的聚合物的mRNA或DNA模板,以及使用一种或多种工程化核糖体、包含一种或多种工程化核糖体的工程化细胞和编码序列确定的聚合物的mRNA或DNA模板制备序列确定的聚合物。序列确定的聚合物可以在体外和/或体内制备。
在某些实施方案中,序列确定的聚合物是在体外制备的,并且该方法还包括(c)提供核糖体耗尽的细胞提取物或纯化的翻译系统和使用所述核糖体耗尽的细胞提取物或纯化的翻译系统来制备序列确定的聚合物。在某些实施方案中,核糖体耗尽的细胞提取物包含S150提取物,该S150提取物由指数生长期中期至晚期的细胞培养物或在收获时具有至少约2.0、2.5或3.0的OD600的培养物制备。
在某些实施方案中,序列确定的聚合物是在体内制备的。所述序列确定的聚合物可以在包含第一和第二翻译系统的工程化细胞中制备,所述第一和第二翻译系统包含工程化核糖体,其中第一翻译系统包含具有野生型抗SD序列(即,与工程化宿主细胞的天然mRNA的SD序列互补的工程化宿主细胞的核糖体的天然抗SD序列)的系连式核糖体,并且其中第二翻译系统包含非系连式核糖体,所述非系连式核糖体具有(a)经修饰的抗SD序列(例如,相对于工程化宿主细胞核糖体的天然抗SD序列或相对于第一翻译系统的系连式核糖体的抗SD序列),其与宿主细胞的天然mRNA的SD序列不互补,和/或(b)抗SD序列外的功能改变性突变,所述突变相对于工程化宿主细胞的天然核糖体或相对于第一翻译系统的系连式核糖体而言。在某些实施方案中,编码序列确定的聚合物的mRNA或DNA包含经修饰的SD序列,并且第二翻译系统的非系连式工程化核糖体包含与编码所述序列确定的聚合物的mRNA或DNA的经修饰的SD序列互补的经修饰的抗SD序列,允许由第二翻译系统翻译(并且优选允许由第一翻译系统翻译)编码所述序列确定的聚合物的mRNA。
在某些实施方案中,序列确定的聚合物包含氨基酸。在某些实施方案中,氨基酸是天然氨基酸。在某些实施方案中,氨基酸是非天然或非经典氨基酸,并且第二翻译系统的非系连式工程化核糖体包含相对于天然核糖体(或相对于第一翻译的系连式工程化核糖体)的一个或多个突变,其允许将非天然或非经典氨基酸掺入所述序列确定的聚合物中。
附图说明
图1.OSYRIS设置。a)rRNA基因的组织和可解离的70S核糖体(左)和Ribo-T(右)的结构。Ribo-T的小亚基和大亚基通过两个RNA系链共价连接,将循环排列(circularly-permutated)的23S rRNA连接到16S rRNA中的螺旋44的环13,16。b)在最初的基于Ribo-T的正交翻译系统中13,wt可解离核糖体翻译细胞蛋白质组,而正交Ribo-T(oRibo-T)致力于翻译正交报道mRNA。c)在OSYRIS细胞(实施例1)中,蛋白质组由Ribo-T合成,而可解离的核糖体则作为一个专门的正交翻译系统发挥作用。Ribo-T的系连性质将可解离核糖体的两个亚基(具有改变的ASD的30S亚基和50S亚基)限制为仅翻译正交mRNA。
图2.OSYRIS细胞中可解离正交核糖体的性能。a)OSYRIS细胞中大rRNA种类的琼脂糖凝胶电泳分析,与仅含有可解离的70S核糖体的野生型大肠杆菌(wt)以及仅携带系连式核糖体的Ribo-T细胞(Ribo-T)相比。b)OSYRIS细胞中核糖体含量的引物延伸分析。上图:由于Ribo-T rRNA中存在A2058G突变,因此可以区分Ribo-T和可解离的核糖体。中图:引物延伸分析的原理。在存在ddCTP的情况下,逆转录酶在23S rRNA模板(具有A2058)上将引物延伸4个核苷酸,但在Ribo-T rRNA模板(具有G2058)上仅延伸3个核苷酸。下图:从wt、Ribo-T或OSYRIS细胞中提取的rRNA上产生的引物延伸产物的凝胶电泳分析。c)正交GFP报道基因在携带可解离核糖体的OSYRIS细胞中的表达,所述可解离核糖体具有wt 30S亚基(wt Rbs)或16S rRNA中具有改变的ASD的正交30S亚基(oRbs)。通过改变诱导剂高丝氨酸内酯的浓度诱导报道基因的转录19。从所有值中减去不含报道基因的细胞的自发荧光值。插图显示了在其上点样指定细胞并使其生长的琼脂板的紫外(UV)光图片。d)o-gfp报道基因在OSYRIS细胞中的表达(深灰色条)与在用表达wt核糖体的o-pAM552或poRibo-T转化的BL21细胞中的表达(浅灰色条)的比较(参见扩展数据图1)。用于将o-核糖体或oRibo-T引入BL21细胞的中等拷贝数质粒基于pBR322复制起点(322);在OSYRIS中表达o-核糖体的低拷贝数质粒基于pSC101复制起点(101)。误差线显示n=3次重复的标准差(s.d.)。进行学生t检验,***表示p<0.0005。
图3.OSYRIS细胞中可解离的o-核糖体的大小亚基的正交性。a)OSYRIS细胞中正交GFP报道基因表达对红霉素的敏感性(左侧图,深灰色条)表明其翻译主要由可解离的o-核糖体进行,而不是由EryR Ribo-T或由Ribo-T/30S杂合体进行(右侧简图)。一致地,由EryRRibo-T驱动的wt gfp基因的翻译不受抗生素的抑制(浅灰色条)。误差线显示n=3次重复的标准差(s.d.)。b)上图:用poRbs质粒(其中23S rRNA基因含有致死突变A2602U)转化的OSYRIS细胞能够形成菌落,这表明o-核糖体的大亚基不参与细胞蛋白质组的翻译。当OSYRIS细胞用相同的质粒但16S rRNA基因中具有未改变(wt)ASD(pRbs)转化时,缺乏菌落证明了非正交翻译系统中A2602U突变的显性致死性质(另见图12b,c)。下图:引物延伸分析显示OSYRIS细胞稳定地维持具有23S rRNA突变的大核糖体亚基,这些突变在wt大肠杆菌细胞中是显性致死的。显示了通过使临近突变体23S rRNA(上方箭头)或未突变的Ribo-TrRNA(下方箭头)上的相关突变位点退火的引物延伸产生的cDNA条带。通过围绕2058rRNA残基的引物延伸分析进一步证实了Ribo-T(具有G2058)与具有致死性23S rRNA突变(但在2058位为wt腺嘌呤)的可解离核糖体的共存(图12d)。右图:说明这些实验结论的简图,其说明可解离的50S亚基在很大程度上不参与表达依赖于Ribo-T的细胞蛋白质组的翻译。
图4.从OSYRIS细胞中的PTC突变体文库中选择功能获得性突变。a)因为当翻译发生在高浓度的L-色氨酸时TnaC对终止的抑制作用28,预期将TnaC编码序列附加到gfp的末端会减少报道基因的表达。已知TnaC中W12R突变的存在可部分缓解终止问题28并应导致更高水平的报道基因表达。b)在存在L-色氨酸类似物1-甲基色氨酸(1m-Trp)的情况下,OSYRIS细胞中GFP-TnaC融合蛋白的表达被抑制了94%,而GFP-TnaC(W12R)突变体的表达仅减少了48%。误差线显示n=3次重复的标准差(s.d.)。进行学生t检验,**表示p<0.005。c)23SrRNA核苷酸(箭头)的位置,其突变存在于PTC突变体文库中,显示在50S核糖体亚基的横切面上。显示出了P位点和A位点tRNA。d)其突变构成PTC文库的23S rRNA残基。左图和中图:在PTC文库中,PTC活性位点半径
Figure BDA0003941050290000101
(内壳)内的所有23S rRNA残基和PTC活性位点半径
Figure BDA0003941050290000102
(第二壳)内的大部分23S rRNA残基都发生了突变。P位点和A位点tRNA的氨酰化受体末端分别以粉红色和绿色显示。右图:显示突变核苷酸在23S rRNA结构域V中心环的二级结构中的位置。显示出了相关的23S rRNA发夹。e)在OSYRIS细胞中表达正交GFP-TnaC报道基因的PTC文库突变体的翻译活性和停滞旁路分数。对应于表现出TnaC肽有效终止(增加的旁路分数)同时保持高翻译效率(wt对照的>60%)的突变体的点被加框和深色表示。虚线表示没有正交核糖体的Ribo-T细胞中正交GFP-TnaC(W12R)突变体的背景表达水平。黑点(箭头)显示了包含wt 23S rRNA的o-核糖体对报道基因的翻译。f)在无细胞翻译系统中测试在OSYRIS细胞中鉴定的具有特定功能获得性突变的分离核糖体。对于体外测试,从OSYRIS细胞中分离出具有致死突变(U2500G、A2060C、A2450U)的核糖体50S亚基并与wt 30S亚基组合。从SQ171细胞中分离出具有非致死突变的核糖体。趾纹测定(图16c)用于评估由于TnaC的低效释放而导致tnaC基因终止密码子处的翻译阻滞的程度。误差线代表三个独立实验的标准差。与wt值的差异的统计显著性由通过学生t检验确定的*(p<0.05)、**(p<0.005)或***(p<0.0005)表示。g)其突变导致功能获得的23S rRNA残基(蓝色)在TnaC停滞的核糖体结构中相对于TnaC-tRNA(绿色)和RF2(橙色)的位置(图E中的黑点)30
图5.OSYRIS的关键质粒。a)pRibo-Tt质粒的图谱。编码16S-23S rRNA杂合体和5SrRNA的pRibo-T基因在λPL启动子的控制下表达。在16S-23S rRNA杂合体中,在螺旋101的环处打开的循环排列的23S rRNA通过两个RNA系链被插入到16S rRNA的螺旋44的环中,其在Ribo-T v.2.0中的序列相对于原始Ribo-T版本被重新设计3,4。23S rRNA链段携带A2058G突变,使Ribo-T具有红霉素抗性。由于染色体rRNA操纵子的缺失而在宿主细胞中缺失10的tRNA基因簇受Ptac启动子的控制。该质粒携带pBR322复制起点和氨苄青霉素抗性基因。b)源自pAM5524的poRBS质粒携带大肠杆菌rrnB操纵子,在16S rRNA基因中具有改变的ASD序列GUGGUU3。该质粒携带pSC101复制起点和卡那霉素抗性基因。对照质粒pRbs(未显示)与poRbs相同,只是它在16S rRNA基因中含有wt ASD。c)报道质粒poGFP携带超折叠绿色荧光蛋白(sf-gfp)的基因(poGFP)或该基因以及红色荧光蛋白的基因(poRFP/oGFP)。报道基因的编码序列之前是改变的(正交)SD序列,AACCAC3,它与poRBS质粒中编码的16S rRNA中的ASD序列互补,如图b所示。poGFP中正交gfp基因的转录由诱导型PLux启动子控制,该启动子通过N-(β-酮己酰基)-L-高丝氨酸内酯(HSL)与LuxR阻遏物的结合来调节。质粒中存在两个拷贝的luxR基因。poGFP质粒具有pA15复制起点和Spc抗性基因。d)报道质粒poRFP/oGFP携带分别受Plpp5和PT5启动子控制的绿色(sfGFP)和红色(RFP)荧光蛋白基因。两个基因前面都有正交SD序列AACCAC。该质粒具有pA15复制起点和Spc抗性基因。e)poLuc质粒类似于poGFP质粒(图c),但sf-gfp基因被编码萤火虫萤光素酶的luc基因替代。luc基因前面是正交SD序列AACCAC。此图中显示的质粒的完整注释序列可在附录I中找到。
图6.大肠杆菌细胞中的OSYRIS组装。a,OSYRIS细胞的质粒组成。翻译细胞蛋白质组的Ribo-T由pRibo-Tt质粒表达。从poGFP(或poRFP/oGFP)质粒上的正交报道基因转录的mRNA由o-核糖体(其rRNA在poRbs质粒中编码)翻译。b,构建OSYRIS细胞的顺序步骤。在组装步骤III之后,细胞的基因组被完全测序(参见图c)。在接下来的两个步骤中,随后用报道质粒(图示示例中的poGFP)转化细胞,然后用poRbs(或图4中描述的PTC突变体文库的质粒)转化细胞。指示了在每个步骤中产生的细胞的抗生素抗性。c,OSYRIS细胞的基因组。起始SQ171 FG菌株来源于大肠杆菌MG1655细胞26。在OSYRIS细胞组装和繁殖过程中获得了五个自发突变(箭头);突变的精确位置和受影响基因的功能列于图20的表格中。圆圈外的数字表示基因组核苷酸编号。d,来自OSYRIS组装的不同步骤的细胞的质粒内容物的凝胶电泳分析(如图b所示)。用KpnI、BamHI和HindIII限制酶的混合物消化质粒制备物。显示单个质粒的限制性消化物以供参考。
图7.oRbs在OSYRIS细胞中稳定表达。a,在从过夜培养物稀释后保持在OSYRIS细胞中的总RNA的琼脂糖凝胶电泳分析。将带有poGFP质粒的OSYRIS细胞的两个独立菌落(A和B)培养过夜,并各自用补充有50μg/ml Amp、25μg/ml Kan和15μg/ml Spc的LB培养基以1:50的比例稀释到两个管中。在指定的时间间隔后分离总RNA。独立处理每种培养物的两个技术重复并在凝胶的不同泳道中跑胶。b,随着时间的推移,OSYRIS细胞中oRbs的代表(具有wtA2058)相对于Ribo-T(携带A2058G突变)的引物延伸分析。引物延伸分析的原理在测序凝胶上方进行了说明。从OSYRIS细胞制备的总RNA(参见图a)用作引物延伸的模板。从wt大肠杆菌细胞(‘A2058’)和仅表达Ribo-T的细胞(‘A2058G’)制备的RNA样品用作对照。标有“Pr”的泳道含有[32P]标记的DNA引物。c,Ribo-T和oRbs特异性条带的相对强度的定量用于评估两种核糖体种类的相对代表性。
图8.OSYRIS细胞中正交报道基因的有效翻译。a,含有o-核糖体(实线)或wt核糖体(虚线)的OSYRIS细胞的生长曲线(上图)和其中正交GFP报道基因的表达(右图)。b,在表达o-核糖体(实线)或wt核糖体(虚线)的OSYRIS细胞中,生长曲线(左图)和正交GFP(中图)和RFP报道基因(右图)的表达。每个实验中的最高荧光读数(相对荧光单位)取为100%。c,正交萤光素酶报道基因在含有o-核糖体(深灰色条)或wt核糖体(浅灰色条)的OSYRIS细胞中的表达。最高发光读数(相对发光单位,RLU)取为100%。误差线显示n=3次重复的标准差(s.d.)。进行学生t检验,***表示p<0.0005,n.s.表示没有统计学意义。
图9.OSYRIS细胞和大肠杆菌BL21中正交gfp报道基因的表达。在96孔板中生长的OSYRIS细胞和BL21细胞的(a)生长曲线、(b)GFP荧光和(c)通过细胞密度归一化的GFP荧光。两种类型的细胞都表达wt核糖体(虚线)或o-核糖体(实线)。请注意,OSYRIS细胞中的归一化正交GFP荧光(或每个细胞的oGFP荧光)高于BL21细胞。数据代表三个独立生物学重复的结果;误差条表示标准差(s.d.)。在(b)中,最高荧光读数(相对荧光单位)(对于BL21细胞)被视为100%。在(c)中,最高归一化荧光读数(相对荧光单位/A600)(对于OSYRIS细胞)被视为100%。
图10.oRbs在正交萤光素酶报道基因的表达方面优于oRibo-T。o-luc在BL21或OSYRIS细胞中的表达由可解离的oRbs或oRibo-T驱动。具有报道质粒poLuc的BL21细胞分别用中等拷贝数(pBR322 ori)质粒o-pAM552转化或用表达oRbs或oRibo-T的poRibo-T转化。OSYRIS细胞从低拷贝数质粒poRbs表达oRbs。对照细胞用相同的质粒(但携带带有wt ASD的rRNA)转化。如实验程序中所述记录相对报道基因表达。误差线显示n=3次重复的标准差(s.d.)。进行学生t检验,***表示p<0.0005,n.s.表示没有统计学意义。
图11.OSYRIS细胞对红霉素(Ery)的抗性说明了正交可解离核糖体的功能性分离。a,表达wt(顶部两个细胞和底部细胞左侧)或正交(底部细胞右侧)核糖体的OSYRIS细胞的核糖体组成。系连式核糖体携带A2058G突变,使其对Ery具有抗性,而可解离的核糖体对Ery敏感。b,在指定浓度的Ery存在下,在96孔板中生长24小时后,表达wt或正交核糖体的OSYRIS细胞培养物的光密度。与EryR Ribo-T一起表达wt可解离的EryS核糖体使细胞对红霉素敏感(Ribo-T=+wt Rbs,每个X轴点的第三个条形),表明如果游离50S亚基参与翻译(在这种情况下是由于它与wt 30S亚基的相互作用),则蛋白质合成和细胞生长受到抑制。相反,表达oRbs的细胞仍然是EryR,这表明OSYRIS细胞中正交可解离核糖体的50S亚基在功能上是分离的,不参与细胞蛋白质组的翻译。对于图11b,对于每个X轴数据值,第一个条形是仅Ribo-T;第二个条形是Ribo-T+wt Rbs;第三个条形是Ribo-T+oRbs。
图12.表达正交核糖体50S亚基的rRNA中的致命突变的OSYRIS细胞的活力证明了两个正交翻译系统的功能分离。a,PTC活性位点(PDB 1VY4)22中23S rRNA核苷酸G2553、A2602、A2451(橙色)的位置。这些核苷酸的突变在wt大肠杆菌细胞中是显性致死的27。A位点tRNA为绿色,P位点tRNA为蓝色。b,当携带致死突变的突变体23S rRNA与正交16SrRNA(poRbs)共表达时,OSYRIS细胞的转化会产生活菌落,但与wt 16SrRNA(pRbs)共表达时则不会。c,其中来自pRbs和poRbs质粒的rRNA操纵子表达被抑制2的POP2136菌株的转化没有产生菌落。d,(上图)表达带有A2058G突变的Ribo-T和50S亚基携带致死突变的可解离正交核糖体(右侧)的OSYRIS细胞中的核糖体组成。(下图)邻近核苷酸2058的rRNA区域的引物延伸分析显示,在OSYRIS细胞中,携带致死突变(且无A2058G突变)的50S亚基与Ribo-T(携带A2058G突变)一起得到稳定维持。泳道1-3:对wt 23SrRNA(泳道1)、具有A2058G突变的23SrRNA(泳道2)或从仅表达Ribo-T的OSYRIS细胞中提取的RNA(泳道3)制备物进行对照引物延伸。泳道4,来自用pRbs转化并表达wt可解离核糖体的OSYRIS细胞的rRNA。泳道5-8,来自表达正交核糖体的细胞的rRNA,在23S rRNA中没有突变(泳道4)或在23SrRNA中具有所示的致死突变。凝胶泳道下方的数字表示23S rRNA的含量(%),将其估算为代表23S rRNA的cDNA条带(底部两个箭头)强度与23S rRNA特异性条带和Ribo-T特异性条带(分别为底部两个箭头和顶部箭头)强度之和的比值。显示的是三个独立生物学重复的代表性凝胶。
图13.TnaC介导的报道蛋白体外翻译抑制。在低(50μM)或高(5mM)L-色氨酸浓度存在的情况下在PURExpress无细胞系统中进行GFP-TnaC或GFP-TnaC(W12R)报道基因的翻译。已知TnaC突变W12R可减少TnaC介导的对高L-色氨酸浓度下终止密码子处蛋白质释放的抑制28。数据代表三个独立实验的结果,误差条表示实验误差。DNA模板的序列见附录I。每个实验中最高荧光读数(相对荧光单位)取为100%。
图14.PTC文库突变体在OSYRIS细胞中的翻译活性。通过将o-GFP-TnaC(W12R)报道基因在具有突变体o-核糖体的OSYRIS细胞中的表达(其显示部分停滞缓解)(参见图4a-b)与相同的报道基因在含有具有wt 23SrRNA的o-核糖体的OSYRIS细胞中的表达(100%)进行比较来估计单个突变体的翻译活性。显示了各个wt 23S rRNA残基,并显示了评估的突变体的身份。高翻译活性被定义为报道基因表达>60%。将高旁路分数与高翻译活性相结合的功能获得性突变体以深色条形显示(参见图4e和图13)。数据代表两个独立生物学重复的结果,误差条表示实验误差。数值数据可以在图17中找到。含有具有wt 23S rRNA的o-核糖体的OSYRIS细胞的归一化荧光读数(相对荧光单位/A600)取为100%。
图15.各个PTC突变体的终止停滞旁路分数。TnaC停滞旁路分数计算为表达GFP-TnaC的OSYRIS细胞中的GFP荧光(按细胞密度标准化)与具有GFP-TnaC(W12R)报道基因的细胞中的荧光之比。具有wt 23S rRNA的o-核糖体的细胞的旁路分数为0.17。阈值高旁路分数(≥0.3,红色虚线)被定义为U2609C突变提供的分数,据报道它会减少tnaC终止密码子处的翻译阻滞29,30。显示了各个wt 23S rRNA残基,并显示了评估的突变体的身份。将高旁路分数与高翻译活性相结合的功能获得性突变体(参见图4e和图14)以蓝色显示。数据代表两个独立生物学重复的结果,误差条表示实验误差。n.s.表示无统计学意义,进行学生t检验,将每个突变体的值与wt核糖体进行比较,*表示p<0.05,**表示p<0.005,***表示p<0.0005。数值数据见图17。
图16.在无细胞翻译系统中测试功能获得性突变体。a,来自OSYRIS细胞的核糖体材料在亚基解离条件下的蔗糖梯度分级分离。从解离的wt核糖体(箭头)制备的30S和50S亚基用作标记物。灰色阴影表示在无细胞翻译实验中收集和使用的50S亚基级分。b,通过rRNA的琼脂糖凝胶电泳分析50S材料(如A中所述分离)的纯度。野生型16S和23S以及纯化的Ribo-T rRNA被用作移动性标记物。c,体外趾纹实验的原理(上图)和结果(下图)。由分离的突变体50S亚基和wt 30S亚基组装的核糖体翻译tnaC模板。对于每个突变体,翻译反应在三种不同的条件下进行:(I)在脯氨酰-tRNA合成酶的抑制剂L-PSA存在下21,该抑制剂在A位点用tnaC Pro24密码子使核糖体停滞;相应的趾纹条带的强度(由空心箭头表示)反映了突变体核糖体的翻译活性;(H)在高浓度L-色氨酸(5mM)的存在下,除非rRNA突变缓解停滞,否则该高浓度L-色氨酸会导致终止密码子处的翻译阻滞(由绿色箭头指示);(L)在低浓度的L-色氨酸(5μM)下,此时检测到终止密码子处没有停滞或有限的停滞。通过H样品的终止密码子趾纹条带的强度与I样品中Pro24密码子的强度之比计算终止停滞效率(图4f)。
图17.提供的表格显示了实施例1中描述的PTC文库突变体的翻译活性和终止停滞旁路分数。
图18.提供的表格显示了实施例1中使用的大肠杆菌菌株的基因型。
图19.提供的表格显示了实施例1中使用的引物。
图20.提供的表格显示了实施例1中使用的OSYRIS细胞的基因型。
图21.提供的表格显示了用于实施例1的引物延伸分析的引物和核苷酸组合。
图22.A)大亚基rRNA和小亚基rRNA的二级结构。B)编码大亚基rRNA和小亚基rRNA的基因。
图23.A)具有大亚基、小亚基和连接部分的系连式核糖体。B)编码图23A的系连式核糖体的基因。
图24.核糖体rRNA的排列。
图25.A)具有编码rRNA的基因的质粒。B)具有编码系连式核糖体的rRNA基因的质粒。
具体实施方式
公开了能够成功地进行蛋白质合成的、具有系连式并由此不可分离的亚基的核糖体(“Ribo-T”)。Ribo-T可通过将包含小亚基、大亚基和将小亚基与大亚基系连的连接部分的核糖体进行工程化来制备。所述工程化核糖体可包含杂合rRNA,该杂合rRNA包含小亚基rRNA序列、大亚基rRNA序列和可将小亚基rRNA序列和大亚基rRNA序列共价连接成单一实体的RNA接头。所述工程化核糖体可以通过表达编码工程化核糖体的rRNA的多核苷酸来制备。也可以通过正向或负向选择突变来进化所述工程化核糖体。引人注目的是,Ribo-T不仅在体外具有功能,而且即使在没有野生型(“wt”)核糖体的情况下也能够支持细胞生长。因此,Ribo-T有很多用途。例如,Ribo-T可用于制备序列确定的聚合物,例如天然存在的蛋白质或非天然存在的氨基酸聚合物;在体外或体内创建完全正交的核糖体-mRNA系统;探索知之甚少的核糖体功能;并设计具有新功能的核糖体。
系连式核糖体
参考美国公开号2017/0073381,其公开了系连式核糖体以及制备和使用系连式核糖体的方法,其内容通过引用整体并入本文。工程化核糖体包含小亚基、大亚基和连接部分,其中连接部分将小亚基与大亚基系连起来。工程化核糖体能够支持序列确定的聚合物的翻译。
与天然存在的核糖体相比,工程化核糖体具有不可分离的大亚基和小亚基。图22描绘了具有可分离的小亚基和大亚基的野生型核糖体的一部分。图22A说明了一起形成功能性核糖体一部分的大亚基rRNA 101和小亚基rRNA 102的二级结构。图22B说明了包含编码大亚基rRNA 202的操纵子和编码小亚基rRNA 201的操纵子的rRNA基因200。在野生型rRNA中,将大亚基rRNA和小亚基rRNA从初级转录物中切除并加工成成熟的个体亚基。
图23中说明了工程化系连式核糖体的一个实施方案。图23A说明了工程化核糖体300的一部分rRNA的二级结构。所述工程化核糖体包含大亚基301、小亚基302和将小亚基302与大亚基301系连在一起的连接部分303。在本实例中,连接部分303将小亚基302的rRNA与大亚基301的rRNA系连在一起。所述工程化核糖体还可以包括连接体304,其关闭天然大亚基rRNA的末端。图23B说明了rRNA基因400和编码工程化核糖体300的操纵子的实例。
大亚基
大亚基301包括能够连接氨基酸形成多肽链的亚基。大亚基301可以包括第一大亚基结构域(“L1多核苷酸结构域”或“L1结构域”)、第二大亚基结构域(“L2多核苷酸结构域”或“L2结构域”)和连接体结构域(“C多核苷酸结构域”或“C结构域”)304,其中按照从5’到3’的顺序,L1结构域后依次是C结构域和L2结构域。
图23B说明了编码工程化核糖体300的rRNA基因400的实例,并提供了用于理解工程化核糖体的替代表示。编码多核苷酸400可以包含编码工程化核糖体300的各个结构域的不同序列。如图23B所示,编码大亚基rRNA301的多核苷酸包含编码L1结构域402的多核苷酸、编码C结构域406的多核苷酸,以及编码L2结构域403的多核苷酸。
大亚基rRNA 301可以是可分离的大亚基rRNA的排列变体。在某些实施方案中,排列变体是可分离的大亚基rRNA的循环排列变体。可分离大亚基可以是任何功能性大亚基。在某些实施方案中,可分离的大亚基可以是23S rRNA。在某些实施方案中,可分离大亚基是野生型大亚基rRNA。在具体实施方案中,可分离大亚基是野生型23S rRNA。
如果大亚基301是大亚基rRNA的排列变体,则基本上由按照从5’到3’顺序的L2结构域后接L1结构域组成的多核苷酸可以与大亚基rRNA基本相同。在某些实施方案中,按照从5’到3’的顺序基本上由L2结构域后接L1结构域组成的多核苷酸与大亚基rRNA至少90%相同、至少91%相同、至少92%相同、至少93%相同、至少94%相同、至少95%相同、至少96%相同、至少97%相同、至少98%相同或至少99%相同。
在其中大亚基301是可分离大亚基rRNA的排列变体的某些实施方案中,大亚基301可进一步包含连接可分离大亚基rRNA的天然5’和3’端的C结构域304。C结构域可以包含长度为1-200个核苷酸的多核苷酸。在某些实施方案中,C结构域304包含长度为1-150个核苷酸、1-100个核苷酸、1-90个核苷酸、1-80个核苷酸、1-70个核苷酸、1-60个核苷酸、1-50个核苷酸、1-40个核苷酸、1-30个核苷酸、1-20个核苷酸、1-10个核苷酸、1-9个核苷酸、1-8个核苷酸、1-7个核苷酸、1-6个核苷酸、1-5个核苷酸、1-4个核苷酸、1-3个核苷酸或1-2个核苷酸的多核苷酸。在某些实施方案中,C结构域包含GAGA多核苷酸。
小亚基
小亚基302能够结合mRNA。小亚基302包括第一小亚基结构域(“S1多核苷酸结构域”或“S1结构域”)和第二小亚基结构域(“S2多核苷酸结构域”或“S2结构域”),其中按照从5’到3’的顺序,S1结构域后接S2结构域。再次参考图23B,编码小亚基rRNA 302的多核苷酸包含编码S1结构域401的多核苷酸和编码S2结构域404的多核苷酸。
小亚基rRNA 302可以是可分离的小亚基rRNA的排列变体。在某些实施方案中,排列变体是可分离小亚基rRNA的循环排列变体。可分离小亚基可以是任何功能性小亚基。在某些实施方案中,可分离的小亚基可以是16S rRNA。在某些实施方案中,可分离小亚基是野生型小亚基rRNA。在具体实施方案中,可分离小亚基是野生型23S rRNA。
如果小亚基302是小亚基rRNA的排列变体,则基本上由按照从5’到3’顺序的S1结构域后接S2结构域组成的多核苷酸可以与小亚基rRNA基本相同。在某些实施方案中,基本上由按照从5’到3’顺序的S1结构域后接S2结构域组成的多核苷酸与小亚基rRNA至少90%相同、至少91%相同、至少92%相同、至少93%相同、至少94%相同、至少95%相同、至少96%相同、至少97%相同、至少98%相同或至少99%相同。
小亚基还可包含修饰的抗SD序列。所述修饰的抗SD序列允许翻译具有不同于内源性细胞mRNA的互补SD序列的模板。
连接部分
再次参考图23B,连接部分303将小亚基302与大亚基301系连起来。在某些实施方案中,连接部分将大亚基301的螺旋共价结合到小亚基302的螺旋上。
连接部分还可包含第一系链结构域(“T1多核苷酸结构域”或“T1结构域”)和第二系链结构域(“T2多核苷酸结构域”或“T2结构域”)。再次参考图23B,编码连接部分303的多核苷酸包含编码T1结构域405的多核苷酸和编码T2结构域407的多核苷酸。
T1结构域将S1结构域与L1结构域连接,其中按照从5’到3’的顺序,S1结构域之后依次是T1结构域和L1结构域。T1结构域可以包含长度为5-200个核苷酸、5-150个核苷酸、5-100个核苷酸、5-90个核苷酸、5-80个核苷酸、5-70个核苷酸、5-60个核苷酸、5-50个核苷酸、5-40个核苷酸、5-30个核苷酸或5-20个核苷酸的多核苷酸,包括具有5个核苷酸、6个核苷酸、7个核苷酸、8个核苷酸、9个核苷酸、10个核苷酸、11个核苷酸、12个核苷酸、13个核苷酸、14个核苷酸、15个核苷酸、16个核苷酸、17个核苷酸、18个核苷酸、19个核苷酸或20个核苷酸的多核苷酸。在某些实施方案中,T1包含聚腺嘌呤。在某些实施方案中,T1包含聚尿苷。在某些实施方案中,T1包含非结构化多核苷酸。在某些实施方案中,T1包含与T2结构域碱基配对的核苷酸。
T2结构域将L2结构域与S2结构域连接,其中按照从5’到3’的顺序,L2结构域之后依次是T2结构域和S2结构域。T2结构域可以包含长度为5-200个核苷酸、5-150个核苷酸、5-100个核苷酸、5-90个核苷酸、5-80个核苷酸、5-70个核苷酸、5-60个核苷酸、5-50个核苷酸、5-40个核苷酸、5-30个核苷酸或5-20个核苷酸的多核苷酸,包括具有5个核苷酸、6个核苷酸、7个核苷酸、8个核苷酸、9个核苷酸、10个核苷酸、11个核苷酸、12个核苷酸、13个核苷酸、14个核苷酸、15个核苷酸、16个核苷酸、17个核苷酸、18个核苷酸、19个核苷酸或20个核苷酸的多核苷酸。在某些实施方案中,T1包含聚腺嘌呤。在某些实施方案中,T2包含聚尿苷。在某些实施方案中,T2包含非结构化多核苷酸。在某些实施方案中,T2包含与T1结构域碱基配对的核苷酸。
在具有T1结构域和T2结构域的实施方案中,T1结构域和T2结构域可以具有相同数量的多核苷酸。在其他实施方案中,T1结构域和T2结构域可以具有不同数量的多核苷酸。
在某些实施方案中,按照从5’到3’的顺序,工程化核糖体可包含S1结构域、其后依次为T1结构域、L1结构域、C结构域、L2结构域、T2结构域和S2结构域。在具体实施方案中,工程化核糖体可以基本上由按照从5’到3’顺序的S1结构域、其后依次为T1结构域、L1结构域、C结构域、L2结构域、T2结构域和S2结构域组成。
突变
在某些实施方案中,工程化核糖体可包含一个或多个突变。在具体实施方案中,突变是功能改变性突变。功能改变性突变可以是功能获得性突变或功能丧失性突变。功能获得性突变可以是赋予新功能的任何突变。功能丧失性突变可以是导致母体所具有的功能丧失的任何突变。
在某些实施方案中,功能改变性突变可以在核糖体的肽基转移酶中心。在具体实施方案中,功能改变性突变可以在肽基转移酶中心的A位点处。在其他实施方案中,功能改变性突变可以在工程化核糖体的出口通道中。
在某些实施方案中,功能改变性突变可以是抗生素抗性突变。抗生素抗性突变可以在大亚基或小亚基中。在某些实施方案中,抗生素抗性突变可以使工程化核糖体对氨基糖苷类、四环素类、密旋霉素类、链霉素类、伊短菌素类(edein)或靶向小核糖体亚基的任何其他抗生素具有抗性。在某些实施方案中,抗生素抗性突变可以使工程化核糖体对大环内酯类、氯霉素类、林可酰胺类、噁唑烷酮类、截短侧耳素类、链霉素类或靶向大核糖体亚基的任何其他抗生素具有抗性。
设计系连式核糖体
系连大亚基和小亚基的成功的嵌合构建体必须i)与核糖体蛋白和生物发生因子正确地相互作用,以进行功能性核糖体组装;ii)避免核糖核酸酶降解;iii)具有足够短的接头以确保亚基顺式缔合,但又足够长以使对翻译起始、延伸和肽释放所需的亚基运动的抑制最小化。考虑到上述设计限制,大亚基和小亚基的天然末端是不合适的。例如,在天然原核核糖体中,例如,16S和23S rRNA的5’和3’末端相距太远(
Figure BDA0003941050290000212
),无法与核酸酶抗性RNA接头连接。因此,如果要实现功能性工程化核糖体,则需要替代设计。
设计系连式核糖体的一种方法是将一个大亚基排列以产生新的5’和3’末端。在某些实施方案中,采用循环排列(CP)方法,原因在于大亚基上的天然末端彼此接近。循环排列可以用以下方案来说明:
Figure BDA0003941050290000211
这样,在多核苷酸的循环排列中,在每次排列中都能保持多核苷酸的序列,但每个核苷酸在各次排列的末端。循环排列用于在保持多核苷酸的二级结构的同时在不同的位置替换多核苷酸末端。
Polacek及其同事率先在体外采用了CP方法[Erlacher 2005],随后的一项初步研究表明,三个23S rRNA循环排列的变体可以在体内组装成功能性亚基[Kitahara 2009]。这种方法在图24中说明。在图24中,按照从5’到3’的顺序,天然大亚基核糖体510包含第二大亚基结构域(L2结构域)513、后接第一大亚基结构域(L1结构域)。大亚基核糖体510(其是图22A中所示的大亚基rRNA 101的简化表示)的天然末端通过连接体结构域(C结构域)511连接,并且在512处制备新的末端。通过这种方法制备的经排列的亚基包含:按照从5’到3’的顺序,第一大亚基结构域(L1结构域),其后依次是连接体结构域(C结构域)和第二大亚基结构域(L2结构域)。图24还说明了基因500的一部分,其编码小亚基501和按照从5’到3’的顺序包含L1结构域502以及其后依次的C结构域506和L2结构域503的新的经排列的大亚基。
继续上述方法,需要制备小亚基的新末端,以便小亚基的新末端可以通过连接部分与大亚基的新末端连接,如图23A、B所示。
上述方法可用于生成具有新末端的循环排列突变体的集合。新的末端可以制备在天然亚基的任何位置。尽管一些新末端可能导致经排列的突变体无活力,但本文公开的方法能够生成和测试经排列的突变体的集合。
在一些实施方案中,小亚基或大亚基的新末端的位置可以基于亚基的二级结构、与另一个亚基的接近度、核糖体活力或其任何组合来选择。
大亚基和小亚基任一者或二者的二级结构可用于确定新末端的位置。在某些实施方案中,新末端制备在天然亚基的螺旋中。在一些具体实施方案中,新末端制备在天然亚基的发夹中。
与另一亚基的接近度可用于选择新末端在大亚基或小亚基任一者或二者中的位置。在某些实施方案中,新末端位于天然亚基的亚基溶剂侧。在一些其他实施例中,新末端位于靠近亚基接口边缘的位置。在某些具体实施方案中,新末端位于亚基溶剂侧并靠近亚基接口边缘。
核糖体活力可用于选择新末端在大亚基或小亚基任一者或二者中的位置。例如,在群体中不是高度保守的大亚基或小亚基任一者或二者中的多核苷酸序列或二级结构可用于选择新末端的位置。
在工程化核糖体是23S构建体的某些实施方案中,连接部分可以共价结合23SrRNA的排列变体的螺旋10、螺旋38、螺旋42、螺旋54、螺旋58、螺旋63、螺旋78或螺旋101。在工程化核糖体是16S rRNA构建体的某些实施方案中,连接部分可以共价结合16S rRNA的排列变体的螺旋11、螺旋26、螺旋33或螺旋44。在工程化核糖体是16S构建体的某些其他实施方案中,连接部分可以共价结合靠近16S rRNA的排列变体的E位点。在工程化核糖体是16S-23S构建体的具体实施方案中,连接部分可以将排列变体16S rRNA的螺旋44与排列变体23SrRNA的螺旋101共价结合,连接部分可以将排列变体16S rRNA的螺旋26与排列变体23SrRNA的螺旋10共价结合,连接部分可以将排列变体16S rRNA的螺旋33与排列变体23S rRNA的螺旋38共价结合,连接部分可以将排列变体16S rRNA的螺旋11与排列变体23S rRNA的螺旋58共价结合,连接部分可以将排列变体16S rRNA的螺旋44与排列变体23SrRNA的螺旋58共价结合,连接部分可以将排列变体16S rRNA的螺旋26与排列变体23S rRNA的螺旋54共价结合,连接部分可以将排列变体16S rRNA的螺旋11与排列变体23S rRNA的螺旋63共价结合,或者连接部分可以将排列变体16S rRNA的螺旋44与排列变体23S rRNA的螺旋63共价结合。
如上所述,连接部分必须足够短以防止降解并确保亚基顺式缔合,同时又必须足够长以使对翻译起始、延伸和肽释放所需的亚基运动的抑制最小化。结果,连接部分必须跨越大亚基和短亚基上的新末端之间的数十埃。
编码系连式核糖体的多核苷酸
还公开了编码系连式核糖体的多核苷酸。编码系连式核糖体的多核苷酸可以是能够被表达以产生系连式核糖体的rRNA的任何多核苷酸。图23B说明了用于制备系连式核糖体的rRNA的多核苷酸。按照从5’到3’的顺序,多核苷酸400包含编码S1结构域401的rRNA的序列、其后依次是编码T1接头405的rRNA的序列、编码L1结构域402的rRNA的序列、编码C结构域406的rRNA的序列、编码L2结构域403的rRNA的序列、编码T2接头407的rRNA的序列、和编码S2结构域404的rRNA的序列。
编码系连式核糖体的多核苷酸可以进一步包含编码核糖体的其他rRNA亚基或核糖体蛋白的基因。例如,编码包含系连在一起的经排列的23S rRNA和经排列的16S rRNA的工程化核糖体的多核苷酸,该多核苷酸可以进一步包含编码5S rRNA的基因。
在某些实施方案中,多核苷酸是可以将外源遗传物质引入宿主细胞的载体。载体可以是质粒、病毒载体、粘粒或人工染色体。
图25A、B提供了质粒的实例,所述质粒编码具有可分离亚基的原核核糖体(图25A)和编码系连式核糖体的多核苷酸(图25B)。在图25A中,质粒600包含启动子612、编码16S亚基601的基因(包括由较小矩形指示的加工茎的示意图)、tRNA基因613、编码23S亚基602的基因(包括由较小的矩形指示的加工茎的示意图)、编码5S亚基611的基因、编码抗生素抗性614的基因、和复制起点基因615。在一些实施方案中,16S亚基601包括修饰的抗SD序列。所述修饰的抗SD序列可以位于任一小亚基结构域(即,S1或S2)中。
任选地,编码具有可分离亚基的原核核糖体的质粒包含一个或多个附加基因。所述一个或多个附加基因可以包含经修饰的SD序列,该序列与非系连式核糖体小亚基的经修饰的抗SD序列互补。
与编码具有可分离亚基的核糖体的质粒相比,编码系连式核糖体700的质粒具有编码大亚基、小亚基和将接大亚基与小亚基701-707连接的连接部分的嵌合基因。质粒包含用于表达系连式核糖体720的基因。任选地,质粒还可包含一个或多个附加基因740。
编码系连的亚基的基因按照从5’到3’的顺序包含编码S1结构域701的rRNA的序列、其后依次是编码T1接头705的rRNA的序列、编码L1结构域702的rRNA的序列、编码C结构域706的rRNA的序列、编码L2结构域703的rRNA的序列、编码T2接头707的rRNA的序列、以及编码S2结构域704的rRNA的序列。可以保留嵌合基因侧翼的小亚基加工序列(由小矩形表示),用于小亚基末端的正确成熟,而大亚基716的加工序列可以移动到质粒中的另一个位置或完全消除以防止大亚基从杂合体中分裂出来。
在某些实施方案中,编码系连的亚基的质粒进一步包含编码5S亚基711的基因、编码抗生素抗性714的基因和复制起点基因715。
任选地,编码系连的亚基的质粒可以包含修饰的抗SD序列708(环状)。尽管在图25B中显示修饰的抗SD序列位于编码S2结构域的序列内,但修饰的抗SD序列可以位于任一小亚基结构域(即,S1或S2)中。在一些实施方案中,包括系连的亚基的质粒包含野生型抗SD序列。
任选地,编码系连的亚基的质粒包含一个或多个附加基因740。附加基因可以包含与系连式核糖体的修饰的抗SD序列互补的经修饰的SD序列。在某些实施方案中,所述附加基因可以是报道基因。在具体实施方案中,报道基因是绿色荧光蛋白。在一些实施方案中,附加基因包含野生型抗SD序列。
制备多核苷酸
本文还公开了制备多核苷酸的方法。所述方法包括制备编码经排列的亚基rRNA构建体的质粒,鉴定有活力的经排列的亚基rRNA构建体,以及制备编码工程化核糖体的多核苷酸,所述工程化核糖体包含大亚基、小亚基和将小亚基与大亚基系连的连接部分。
编码经排列的亚基rRNA构建体的质粒的制备可以通过连接亚基的天然末端并制备新末端的循环排列方法来完成(图24)。质粒的制备可以包括模板制备、质粒骨架制备和组装的步骤。模板制备步骤可以通过质粒消化和连接来完成。例如,可以通过EagI消化和连接从pCP23S-EagI质粒制备CP23S模板。使用环化的23S rRNA基因(作为模板)和独特的引物对通过PCR生成每个CP23S变体,所添加的序列与目标质粒骨架重叠。质粒骨架制备步骤可以通过用限制酶消化质粒来完成,该限制酶在亚基加工茎位点处使骨架线性化。例如,通过用AflII限制酶消化pAM552-23S-AflII来制备质粒骨架,该酶在23S加工茎位点处使骨架线性化。组装步骤将模板与质粒骨架结合以制备编码经排列的亚基rRNA的质粒。组装步骤可以通过吉布森组装(Gibson assembly)来完成。
为了鉴定经排列的亚基rRNA的活力构建体,可以将编码经排列的亚基rRNA的质粒引入宿主细胞株,并使用筛选机制来鉴定转化体。宿主细胞包含所述质粒以及编码野生型rRNA操纵子的质粒,并且可以与抗生素一起被点样到琼脂板上。选择机制包括鉴定对抗生素有抗性的转化体。例如,可以将质粒转化到携带具有野生型rRNA操纵子的pCSacB质粒的Δ7rrn SQ171菌株中,并选择对氨苄青霉素、红霉素和蔗糖具有抗性的转化体。为了确认用编码经排列的亚基rRNA的质粒完全替代了野生型rRNA操纵子,可以对总质粒提取物进行三引物诊断性PCR检查。
制备编码包含大亚基、小亚基和将小亚基与大亚基系连的连接部分的工程化核糖体的多核苷酸包括将经排列的亚基rRNA构建体和连接部分移植到另一个亚基中。在某些实施方案中,制备步骤还可以包括制备包含编码工程化核糖体的多核苷酸的质粒,所述工程化核糖体包含大亚基、小亚基和将小亚基与大亚基系连的连接部分。在其他实施方案中,制备步骤还可以包括制备包含编码工程化核糖体的多核苷酸和编码附加基因的多核苷酸的质粒,所述工程化核糖体包含大亚基、小亚基和将小亚基与大亚基系连的连接部分。
制备系连式核糖体
还公开了制备系连式核糖体的方法。可通过表达编码工程化核糖体的多核苷酸来制备系连式核糖体。在某些实施方案中,系连式核糖体的制备还包括制备编码所述工程化核糖体的多核苷酸。在其他实施方案中,系连式核糖体的制备还包括用编码工程化核糖体的多核苷酸转化细胞。在一些具体实施方案中,系连式核糖体的制备进一步包括制备多核苷酸和用所述多核苷酸转化细胞。
系连式核糖体进化
还公开了用于进化系连式核糖体的方法。系连式核糖体进化的方法包括表达编码工程化核糖体的多核苷酸和选择突变体。选择步骤可以包括阴性选择步骤、阳性选择步骤或阴性选择步骤和阳性选择步骤二者。选择的突变体可以包含具有功能改变性突变的系连式核糖体。功能改变性突变可以是功能获得性突变或功能丧失性突变。
系连式核糖体的效用和应用
下面描述了系连式核糖体的一些用途和应用。
人造细胞
公开了人造细胞。人造细胞可以包含编码工程化核糖体的多核苷酸,所述工程化核糖体包含小亚基、大亚基和连接部分,其中连接部分将小亚基与大亚基系连。包含编码工程化核糖体的多核苷酸的人造细胞可能能够表达多核苷酸以制备工程化核糖体。在其他实施方案中,人造细胞包含工程化核糖体。在一些具体实施方案中,人造细胞包含编码工程化核糖体的多核苷酸和工程化核糖体。
人造细胞可以包含一种或多种翻译机制。在第一个实施方案中,人造细胞具有一种翻译机制,该翻译机制包含工程化核糖体,所述工程化核糖体包含小亚基、大亚基和连接部分,其中连接部分将小亚基与大亚基系连。
在另一个实施方案中,人造细胞可以包含两种翻译机制。第一翻译机制可以包含核糖体,其中核糖体在大亚基和小亚基之间没有连接部分。第二翻译机制包括工程化核糖体,所述工程化核糖体包含小亚基、大亚基和连接部分,其中连接部分将小亚基与大亚基系连。在一些实施方案中,第一翻译机制或第二翻译机制是正交翻译机制。在一些实施方案中,第一翻译机制和第二翻译机制是正交翻译机制。可以通过修饰核糖体的抗SD序列以允许翻译具有不同于内源性细胞mRNA的互补SD序列的模板来制备正交翻译机制。
在另一个实施方案中,公开了包含第一机制和第二机制的用于蛋白质翻译的细胞。第一机制包括具有野生型抗SD序列的系连式核糖体,其中所述核糖体根据自然遗传密码(即,细胞内源性三联体密码)翻译mRNA。第二机制包括一种源自非系连式核糖体的人工机制,该机制允许表达异源基因。在一些实施方案中,第二机制包含具有修饰的抗SD序列的核糖体。
序列确定的聚合物的制备
还提供了制备序列确定的聚合物的方法。在某些实施方案中,制备序列确定的聚合物的方法包括提供工程化核糖体和提供编码序列确定的聚合物的mRNA或DNA模板。在一些实施方案中,工程化核糖体包含小亚基、大亚基和连接部分,并且其中连接部分将小亚基与大亚基系连在一起,并且其中工程化核糖体包含修饰的抗SD序列。在一些实施方案中,工程化核糖体包含小亚基、大亚基、不含连接部分、和经修饰的SD序列。在该方法的一个方面,任何步骤之一包括添加至少一种外源DNA模板,该模板编码用于序列确定的聚合物的mRNA。
在该方法的一个方面,序列确定的聚合物是天然生物聚合物。在该方法的另一个方面,序列确定的聚合物是非天然生物聚合物。在某些实施方案中,序列确定的聚合物包含氨基酸。在某些实施方案中,氨基酸可以是天然氨基酸。如本文所用,天然氨基酸是由通用遗传密码的密码子直接编码的蛋白质氨基酸。在某些实施方案中,氨基酸可以是非天然氨基酸。如本文所用,非天然氨基酸是非蛋白质氨基酸。非天然氨基酸的实例包括但不限于对乙酰基-L-苯丙氨酸、对碘-L-苯丙氨酸、O-甲基-L-酪氨酸、对炔丙基氧基苯丙氨酸、对炔丙基-苯丙氨酸、L-3-(2-萘基)丙氨酸、3-甲基-苯丙氨酸、O-4-烯丙基-L-酪氨酸、4-丙基-L-酪氨酸、三-O-乙酰基-GlcNAcpβ-丝氨酸、L-多巴、氟化苯丙氨酸、异丙基-L-苯丙氨酸、对叠氮基-L-苯丙氨酸、对酰基-L-苯丙氨酸、对苯甲酰基-L-苯丙氨酸、L-磷酸丝氨酸、磷酰丝氨酸、磷酰酪氨酸、对溴苯丙氨酸、对氨基-L-苯丙氨酸、异丙基-L-苯丙氨酸、酪氨酸氨基酸的非天然类似物、谷氨酰胺氨基酸的非天然类似物、苯丙氨酸氨基酸的非天然类似物、丝氨酸氨基酸的非天然类似物、苏氨酸氨基酸的非天然类似物、甲硫氨酸氨基酸的非天然类似物、亮氨酸氨基酸的非天然类似物、异亮氨酸氨基酸的非天然类似物;烷基、芳基、酰基、叠氮基、氰基、卤素、肼、酰肼、羟基、烯基、炔基、醚、硫醇、磺酰基、硒基、酯、硫代酸、硼酸盐(borate)、硼酸基(boronate)、磷酸、磷酰基、膦、杂环、烯酮、亚胺、醛、羟胺、酮基或氨基取代的氨基酸,或其组合;具有可光活化交联剂的氨基酸、自旋标记的氨基酸、荧光氨基酸、金属结合氨基酸、含金属氨基酸、放射性氨基酸、光笼型和/或光异构化氨基酸、含有生物素或生物素类似物的氨基酸、含有酮基的氨基酸、包含聚乙二醇或聚醚的氨基酸、重原子取代的氨基酸、化学可裂解或光可裂解的氨基酸、具有拉长侧链的氨基酸、含有毒性基团的氨基酸、糖取代的氨基酸、碳连接的含糖氨基酸、氧化还原活性氨基酸、含α-羟基的酸、氨基硫代酸、α,α二取代氨基酸、β-氨基酸、γ-氨基酸、除脯氨酸或组氨酸以外的环状氨基酸、除苯丙氨酸、酪氨酸或色氨酸以外的芳香族氨基酸。在某些实施方案中,序列确定的聚合物是多肽或蛋白质。
在该方法的一个方面,系连亚基的布置包含在23S和16S rRNA之间的连接部分。在该方面的一个方面,连接部分将23S rRNA的螺旋101与16S rRNA的螺旋44共价结合。在该方面的另一个方面,连接部分包含长度范围为5个核苷酸至200个核苷酸的多核苷酸。连接的核糖体可以进一步包括工程化的16S rRNA,其具有修饰的抗SD序列以允许在体外翻译具有不同于内源性细胞mRNA的互补SD序列的翻译模板。通过这种方式,有可能在体外选择性地翻译mRNA以高效生产序列确定的生物聚合物。
在该方法的一个方面,工程化核糖体是非系连式的,并且包含修饰的抗SD(Shine-Dalgarno)16S序列以允许在体外或体内翻译具有不同于内源性细胞mRNA的互补SD序列的翻译模板。以这种方式,有可能选择性翻译mRNA以高效生产序列确定的生物聚合物。
在该方法的一个方面,mRNA或DNA模板编码经修饰的SD序列。在某些实施方案中,工程化核糖体包含与由mRNA或DNA模板编码的SD序列互补的抗SD序列。
在一些实施方案中,将mRNA或DNA模板提供给经修饰的细胞(例如,包含两种不同蛋白质翻译机制的细胞)、来自这种细胞的提取物、或来自这种细胞的经纯化的翻译系统。
序列确定的聚合物可以在体外制备。在一些实施方案中,体外制备序列确定的聚合物的方法还包括提供核糖体耗尽的细胞提取物或纯化的翻译系统。在某些实施方案中,核糖体耗尽的细胞提取物包含从指数生长期中期至晚期的细胞培养物或在收获时具有约3.0的O.D.600的培养物制备的S150提取物。在该方法的一方面,核糖体耗尽的提取物是用一种或多种多胺制备的,例如精胺、亚精胺和腐胺,或它们的组合。在该方法的一个方面,用浓度为约50mM至约300mM的盐制备核糖体耗尽的提取物。
核糖体耗尽的细胞提取物的制备和使用它们来支持序列确定的聚合物的体外翻译的方法公开于Michael Jewett等于2014年4月24日提交的发明名称为IMPROVED METHODSFOR MAKING RIBOSOMES的国际专利申请号PCT/US14/35376,其全部内容通过引用并入本文。
在该方法的一个方面,mRNA编码经修饰的SD序列,该序列不同于核糖体耗尽的细胞提取物中存在的内源性细胞mRNA。在该方面的一个方面,工程化核糖体包括改变的16SrRNA,其具有与修饰的SD序列互补的修饰的抗SD序列,以允许mRNA的体外翻译以在体外制备序列确定的生物聚合物。
一方面,该方法被配置用于分批补料操作或连续操作。在该方法的另一个方面,在操作期间补充至少一个底物。
在该方法的一个方面,至少一个步骤包括DNA依赖性RNA聚合酶。在该方法的一个方面,在一个步骤中包括至少一种大分子拥挤剂。在该方法的一个方面,在一个步骤中包括至少一种还原剂(例如二硫苏糖醇、三(2-羧乙基)膦盐酸盐等)。
序列确定的聚合物可以在体内制备。体内制备序列确定的聚合物的方法可以发生在如上所述的人造细胞中。人造细胞可以具有包含工程化核糖体的翻译机制,其中所述工程化核糖体包含小亚基、大亚基和连接部分,并且其中连接部分将小亚基与大亚基系连。在某些实施方案中,人造细胞具有一种翻译机制。在其他实施例中,所述细胞具有两种翻译机制。在一些实施方案中,细胞具有两种蛋白质翻译机制,第一蛋白质翻译机制包含其中在大亚基和小亚基之间没有连接部分的核糖体,并且第二蛋白质翻译机制包含其中含有将大亚基与小亚基连接的连接部分的核糖体。在一些实施方案中,第一翻译系统的核糖体包含修饰的抗SD序列,并且第二翻译系统的核糖体包括野生型(未修饰的)抗SD序列。
术语
除非另有定义,否则本文使用的所有技术和科学术语具有与本发明所属领域的技术人员通常理解的相同含义。如本文所定义和使用的所有定义应理解为优先于字典定义、通过引用并入的文件中的定义和/或所定义术语的普通含义。
在说明书和权利要求书中使用的不定冠词“一种”和“一个”,除非明确指出相反,应理解为“至少一种/一个”。
范围包括每个单独的成员。因此,例如,具有1-3个成员的组是指具有1、2或3个成员的组。
还应该理解的是,除非有明确的相反指示,在本文要求保护的任何包括一个以上步骤或操作的方法中,该方法的步骤或操作的顺序不一定限于这些步骤或操作被描述的顺序。
情态动词“可”/“可能”是指在几个所描述的实施方案或其中所含特征中的一个或多个选项或选择的优选使用或选择。在没有公开关于具体实施方案或其中所含特征的选项或选择的情况下,情态动词“可”/“可能”是指关于如何做出或使用所描述的实施方案或其中所含特征的一个方面的肯定操作,或者使用关于所描述的实施方案或其中所含特征的特定技能的最终决定。在后一种情况下,情态动词“可”/“可能”与助动词“能够”具有相同的含义和内涵。
在权利要求以及上述说明书中,所有过渡性词语,例如“包含”、“包括”、“携带”、“具有”、“含有”、“涉及”、“持有”、“包含有”等应被理解为是开放式的,即意味着包括但不限于。只有过渡性词语“由…组成”和“基本上由…组成”应分别为封闭式或半封闭式过渡词语,如美国专利局专利审查程序手册第2111.03节所述。
如本文所用,术语“核酸”和“寡核苷酸”是指多脱氧核糖核苷酸(含有2-脱氧-D核糖)、多核糖核苷酸(含有D核糖)和任何其他类型的为嘌呤或嘧啶碱基的N糖苷的多核苷酸。术语“核酸”、“寡核苷酸”和“多核苷酸”之间没有预期的长度区别,这些术语可以互换使用。这些术语仅指分子的一级结构。因此,这些术语包括双链和单链DNA,以及双链和单链RNA。对于本发明的使用,寡核苷酸还可以包含其中碱基、糖或磷酸骨架被修饰的核苷酸类似物以及非嘌呤或非嘧啶核苷酸类似物。
多核苷酸的“片段”是与在序列上与参考序列相同但长度短于参考序列的多核苷酸序列的一部分。片段可包含至多参考序列的全长减去至少一个核苷酸。例如,片段可包含参考多核苷酸的5至1000个连续核苷酸。在一些实施方案中,片段可包含参考多核苷酸的至少5、10、15、20、25、30、40、50、60、70、80、90、100、150、250或500个连续核苷酸。片段可以优先选自分子的某些区域。术语“至少一个片段”包括全长多核苷酸。参考多核苷酸序列的“变体”、“突变体”或“衍生物”可以包括参考多核苷酸序列的片段。
关于多核苷酸序列,同一性百分比可以在整个定义的多核苷酸序列的长度上测量,例如,如由特定的SEQ ID数字定义的,或者可以在例如取自较大的所定义序列的片段长度内的较短的长度上测量,例如,至少20、至少30、至少40、至少50、至少70、至少100或至少200个连续核苷酸的片段。这样的长度仅是示例性的,并且应当理解,由本文在表格、附图或序列表中显示的序列支持的任何片段长度都可以用于描述可以测量同一性百分比的长度。
关于多核苷酸序列,“变体”、“突变体”或“衍生物”可以定义为使用blastn通过美国国家生物技术信息中心网站上提供的“BLAST 2 Sequences”工具在核酸序列之一的一定长度上与特定核酸序列具有至少50%序列同一性的核酸序列。(参见Tatiana A.Tatusova,Thomas L.Madden(1999),“Blast 2 sequences-a new tool for comparing protein andnucleotide sequences”,FEMS Microbiol Lett.174:247-250)。这样的核酸对可以显示例如在某个定义的长度上具有至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%或更高的序列同一性。
“重组核酸”是非天然存在的序列或具有通过人工组合两个或更多个以其他方式分离的序列片段而产生的序列的序列。这种人工组合通常通过化学合成或更常见地通过对分离的核酸片段进行人工操作(例如通过本领域已知的基因工程技术)来实现。术语重组包括仅通过添加、置换或缺失部分核酸而改变的核酸。通常,重组核酸可以包括与启动子序列可操作连接的核酸序列。这种重组核酸可以是用于例如转化细胞的载体的一部分。
本文公开的核酸可以是“基本上分离或纯化的”。术语“基本上分离或纯化的”是指从其自然环境中取出的核酸,并且至少60%不含、优选至少75%不含、更优选至少90%不含、甚至更优选至少95%不含与其天然缔合的其他成分。
寡核苷酸可以通过任何合适的方法制备,包括通过诸如以下方法的直接化学合成:Narang等,1979,Meth.Enzymol.68:90-99的磷酸三酯方法;Brown等,1979,Meth.Enzymol.68:109-151的磷酸二酯法;Beaucage等,1981,Tetrahedron Letters 22:1859-1862的二乙基亚磷酰胺法;以及美国专利号4,458,066的固相载体方法,这些文献均以引用方式并入本文。在Goodchild,1990,Bioconjugate Chemistry 1(3):165-187中提供了对寡核苷酸和修饰核苷酸的缀合物的合成方法的综述,该文献通过引用并入本文。
如本文所用,术语“引物”是指能够在合适条件下充当DNA合成起始点的寡核苷酸。这样的条件包括在合适的缓冲液中和适合的温度下,在四种不同的三磷酸核苷和延伸用试剂(例如,DNA聚合酶或逆转录酶)的存在下,诱导合成与核酸链互补的引物延伸产物的那些条件。
引物优选是单链DNA。引物的合适长度取决于引物的预期用途,但通常在约6至约225个核苷酸的范围内,包括中间范围,例如15至35个核苷酸、18至75个核苷酸和25至150个核苷酸。短引物分子通常需要较低的温度才能与模板形成足够稳定的杂合复合物。引物不需要反映模板核酸的确切序列,但必须充分互补以与模板杂交。用于扩增给定靶序列的合适引物的设计是本领域众所周知的并且在本文引用的文献中有所描述。
引物可以包含允许检测或固定引物但不改变引物的基本特性(即,作为DNA合成起始点的特性)的附加特征。例如,引物可以在5’端包含附加核酸序列,该序列不与靶核酸杂交,但有利于扩增产物的克隆或检测,或者能够转录RNA(例如,通过包含启动子)或翻译蛋白质(例如,通过包含5’-UTR,例如内部核糖体进入位点(IRES)或3’-UTR元件例如poly(A)n序列,其中n为约20至约200)。与模板充分互补以进行杂交的引物区域在本文中称为杂交区域。
术语“启动子”是指引导RNA聚合酶和其他反式作用转录因子从包括顺式作用DNA序列的DNA模板起始RNA转录的顺式作用DNA序列。
如本文所用,术语“靶”、“靶序列”、“靶区域”和“靶核酸”是同义的,是指待扩增、测序或检测的核酸区域或序列。
如本文所用,术语“杂交”是指由于互补碱基配对而由两条单链核酸形成双链体结构。杂交可以发生在完全互补的核酸链之间或包含少量错配区域的“基本上互补”的核酸链之间。强烈优选完全互补的核酸链杂交的条件称为“严格杂交条件”或“序列特异性杂交条件”。基本上互补序列的稳定双链体可以在不太严格的杂交条件下获得;可以通过适当调整杂交条件来控制容许的错配程度。核酸技术领域的技术人员可以遵循本领域提供的指导在考虑多个变量的情况下根据经验确定双链体稳定性,所述多个变量例如寡核苷酸的长度和碱基对组成、离子强度和错配碱基对的发生率(参见,例如,Sambrook等,1989,MolecularCloning-A Laboratory Manual,Cold Spring Harbor Laboratory,Cold Spring Harbor,New York;Wetmur,1991,Critical Review in Biochem.and Mol.Biol.26(3/4):227-259;和Owczarzy等,2008,Biochemistry,47:5336-5353,均通过引用并入本文)。
术语“扩增反应”是指包括酶促反应在内的任何化学反应,其导致模板核酸序列的拷贝增加或导致模板核酸转录。扩增反应包括逆转录、包括实时PCR在内的聚合酶链式反应(PCR)(参见美国专利号4,683,195和4,683,202;PCR Protocols:A Guide to Methods andApplications(Innis等编,1990))、以及连接酶链式反应(LCR)(参见Barany等,美国专利号5,494,810)。示例性的“扩增反应条件”或“扩增条件”通常包括两步或三步循环。两步循环具有高温变性步骤,随后是杂交/延伸(或连接)步骤。三步循环包括变性步骤,然后是杂交步骤,然后是单独的延伸步骤。
如本文所用,“聚合酶”是指催化核苷酸聚合的酶。“DNA聚合酶”催化脱氧核糖核苷酸的聚合。已知的DNA聚合酶包括例如激烈热球菌(Pyrococcus furiosus,Pfu)DNA聚合酶、大肠杆菌DNA聚合酶I、T7 DNA聚合酶和水生栖热菌(Thermus aquaticus,Taq)DNA聚合酶等。“RNA聚合酶”催化核糖核苷酸的聚合。DNA聚合酶的上述实例也称为DNA依赖性DNA聚合酶。RNA依赖性DNA聚合酶也属于DNA聚合酶的范围。逆转录酶(包括由逆转录病毒编码的病毒聚合酶)是RNA依赖性DNA聚合酶的一个实例。RNA聚合酶(“RNAP”)的已知实例包括例如T3RNA聚合酶、T7 RNA聚合酶、SP6 RNA聚合酶和大肠杆菌RNA聚合酶等。RNA聚合酶的上述实例也称为DNA依赖性RNA聚合酶。任何上述酶的聚合酶活性可以通过本领域熟知的方法来确定。
如本文所用,术语“序列确定的聚合物”是指具有特定一级序列的聚合物。在基因编码具有特定一级序列的聚合物的情况下,序列确定的聚合物可以等同于遗传编码的确定的聚合物。
如本文所用,如果当在足够严格的条件下用于扩增反应时,引物主要与靶核酸杂交,则引物对于该靶序列是“特异性的”。通常,如果引物-靶双链体稳定性大于在引物与样品中发现的任何其他序列之间形成的双链体的稳定性,则引物对靶序列具有特异性。本领域技术人员将认识到各种因素将影响引物的特异性,例如盐条件以及引物的碱基组成和错配的位置,并且在很多情况下需要引物特异性的常规实验确认。可以选择引物仅与靶序列形成稳定双链体的杂交条件。因此,在适当严格的扩增条件下使用靶特异性引物能够选择性扩增那些含有靶引物结合位点的靶序列。
如本文所用,“表达模板”是指用作用于转录可翻译成多肽或蛋白质的至少一种RNA的底物的核酸。表达模板包括由DNA或RNA组成的核酸。用于表达模板的核酸的合适的DNA来源包括基因组DNA、质粒DNA、cDNA和可以转化为cDNA的RNA。基因组DNA、cDNA和RNA可以来自任何生物来源,例如组织样本、活组织检查、拭子、痰液、血液样本、粪便样本、尿液样本、刮片等。基因组DNA、cDNA和RNA可以来自宿主细胞或病毒来源以及来自任何物种,包括现存和灭绝的生物体。如本文所用,“表达模板”和“转录模板”具有相同的含义并且可以互换使用。
如本文所用,“系连的”、“结合的”、“连接的”、“接连的”、“偶联的”和“共价结合的”作为修饰语时具有相同的含义。
如本文所用,“系连式核糖体”和“Ribo-T”可互换使用。
如本文所用,术语“工程化核糖体”是指已被修饰的核糖体。示例性修饰可包括但不限于系连亚基、改变亚基和改变一种或多种rRNA序列的一种或多种修饰。示例性的非限制性修饰可以包括一种或多种修饰的:16S rRNA;23S rRNA;抗-SD序列,肽基转移中心;新生的出口通道;核糖体的编码中心;与延伸因子的相互作用位点;tRNA结合位点;伴侣结合位点;新生链修饰酶结合位点;GTP酶中心;引入抗生素抗性序列等。
如本文所用,术语“野生型”、“天然的”或“内源的”是指通常存在于给定生物体中的物质或条件。
如本文所用,术语“突变体”、“外源性”、“正交的”和“非天然”是指在给定生物体中通常不存在的物质或条件。
如本文所用,“CP”是指循环排列的亚基。如本文所用,当CP后接“23S”时,“23S”指的是循环排列的23S rRNA。如本文所用,当CP后接数字时,可以指二级结构中新的5’端的位置,例如CP101表示新的5’端在23SrRNA的螺旋101中,或指新的5’核苷酸的位置,例如CP2861表示新的5’核苷酸是23rRNA的核苷酸2861,具体取决于上下文。
如本文所用,“翻译模板”是指从表达模板转录的RNA产物,其可被核糖体用于合成多肽或蛋白质。
如本文所用,“核糖体结合位点”或“RBS”是在蛋白质翻译起始期间负责核糖体募集的mRNA转录物起始密码子上游的核苷酸序列。RBS可以包括SD序列。SD(Shine-Dalgarno)序列是原核信使RNA中的核糖体结合位点,通常位于起始密码子AUG上游约8个碱基处。SD序列通过将核糖体与起始密码子对齐来帮助将核糖体募集到信使RNA(mRNA)以起始蛋白质合成。六碱基共有序列是AGGAGG,而在大肠杆菌中该序列是AGGAGGU。
杂项
除非本文另有说明或与上下文明显矛盾,否则本文所述的所有方法都可以以任何合适的顺序执行。本文提供的任何和所有示例或示例性语言(例如,“诸如”)的使用仅旨在更好地阐明本发明并且不对本发明的范围构成限制,除非另有声明。说明书中的任何语言都不应被解释为指示任何未要求保护的对于本发明的实践是必不可少的要素。
本文描述了本发明的优选方面,包括发明人已知的用于实施本发明的最佳方式。在阅读上述描述后,那些优选方面的变化对于本领域普通技术人员可能变得显而易见。发明人预期本领域普通技术人员适当地采用这样的变化,并且发明人旨在以不同于本文具体描述的方式实践本发明。因此,本发明包括在适用法律允许的情况下对所附权利要求中记载的主题的所有修改和等同物。此外,除非本文另有说明或与上下文明显矛盾,否则本发明包括上述要素的所有可能变化形式的任何组合。
说明性实施方案
以下实施方案是说明性的并且应该被解释为限制要求保护的主题的范围。
实施方案1.一种工程化核糖体,所述工程化核糖体包含一个小亚基、一个大亚基和一个连接部分,a.其中连接部分将小亚基与大亚基系连起来,并且b.其中所述工程化核糖体能够支持序列确定的聚合物的翻译。
实施方案2.如实施方案1所述的工程化核糖体,其中小亚基包含rRNA和蛋白质,其中大亚基包含rRNA和蛋白质,并且其中连接部分将小亚基的rRNA与大亚基的rRNA系连起来。
实施方案3.如实施方案1或2所述的工程化核糖体,其中所述大亚基包含23S rRNA的排列变体(例如,23rRNA的循环排列变体)。
实施方案4.如实施方案1-3中任一项所述的工程化核糖体,其中所述小亚基包含16S rRNA的排列变体(例如,23rRNA的循环排列变体)。
实施方案5.如实施方案1-4中任一项所述的工程化核糖体,其中所述小亚基包含修饰的抗SD序列以允许翻译具有不同于内源细胞mRNA的互补性SD序列的模板(例如,其中所述小亚基的修饰的抗SD序列与不同于内源性细胞mRNA的SD序列互补)。
实施方案6.如实施方案1-5中任一项所述的工程化核糖体,其中所述连接部分将所述大亚基的螺旋与所述小亚基的螺旋共价结合。
实施方案7.如实施方案3-6中任一项所述的工程化核糖体,其中所述连接部分共价结合所述23S rRNA的排列变体的螺旋10、螺旋38、螺旋42、螺旋54、螺旋58、螺旋63、螺旋78或螺旋101。
实施方案8.如实施方案4-7中任一项所述的工程化核糖体,其中所述连接部分共价结合所述16S rRNA的排列变体的螺旋11、螺旋26、螺旋33或螺旋44。
实施方案9.如实施方案1-8中任一项所述的工程化核糖体,其中所述大亚基包含L1多核苷酸结构域(例如,23S rRNA的片段)、L2多核苷酸结构域(例如,23S rRNA的片段)和C多核苷酸结构域,或基本上由L1多核苷酸结构域(例如,23S rRNA的片段)、L2多核苷酸结构域(例如,23S rRNA的片段)和C多核苷酸结构域组成,其中按照从5’到3’的顺序L1结构域之后依次是C结构域和L2结构域。
实施方案10.如实施方案9所述的工程化核糖体,其中按照从5’到3’的顺序包含L2结构域后接L1结构域或基本上由其组成的多核苷酸与23S rRNA或23S rRNA的片段基本相同。
实施方案11.如实施方案9或10所述的工程化核糖体,其中按照从5’至3’的顺序包含L2结构域后接L1结构域或基本上由其组成的多核苷酸与23S rRNA或23S rRNA的片段至少95%相同(或与23S rRNA或23S rRNA的片段至少96%、97%、98%或99%相同)。
实施方案12.如实施方案9-11中任一项所述的工程化核糖体,其中所述C结构域包含长度为1-200个核苷酸的多核苷酸。
实施方案13.如实施方案9-12中任一项所述的工程化核糖体,其中所述C结构域包含GAGA多核苷酸。
实施方案14.如实施方案1-13中任一项所述的工程化核糖体,其中所述小亚基包含S1多核苷酸结构域(例如,16S rRNA的片段)和S2多核苷酸结构域(例如,16S rRNA的片段)或基本上由其组成,其中按照从5’到3’的顺序,S1结构域后接S2结构域。
实施方案15.如实施方案14所述的工程化核糖体,其中按照从5’到3’的顺序包含S1结构域后接S2结构域或基本上由其组成的多核苷酸与16S rRNA(或16S rRNA的片段)基本相同。
实施方案16.如实施方案14或15所述的工程化核糖体,其中按照从5’到3’的顺序包含S1结构域后接S2结构域或基本上由其组成的多核苷酸与16S rRNA至少95%相同(或与23S rRNA或23S rRNA的片段至少96%、97%、98%或99%相同)。
实施方案17.如实施方案1-16中任一项所述的工程化核糖体,其中所述连接部分包含T1多核苷酸结构域和T2多核苷酸结构域。
实施方案18.如实施方案17所述的工程化核糖体,其中所述T1结构域连接S1结构域和L1结构域,并且其中按照从5’到3’的顺序,S1结构域后依次是T1结构域和L1结构域。
实施方案19.如实施方案17或18所述的工程化核糖体,其中所述T1结构域包含长度为5至200个核苷酸的多核苷酸。
实施方案20.如实施方案19所述的工程化核糖体,其中所述T1结构域包含长度为7至20个核苷酸的多核苷酸。
实施方案21.如实施方案17-20中任一项所述的工程化核糖体,其中所述T1结构域包含聚腺嘌呤多核苷酸。
实施方案22.如实施方案17-20中任一项所述的工程化核糖体,其中所述T1结构域包含具有7至12个腺嘌呤核苷酸长度的聚腺嘌呤多核苷酸。
实施方案23.如实施方案17-22中任一项所述的工程化核糖体,其中所述T2结构域连接S2结构域和L2结构域,并且其中按照从5’到3’的顺序,L2结构域后依次是T2结构域和S2结构域。
实施方案24.如实施方案17-24中任一项所述的工程化核糖体,其中所述T2结构域包含长度为5至200个核苷酸的多核苷酸。
实施方案25.如实施方案17、23或24所述的工程化核糖体,其中所述T2结构域包含长度为7至20个核苷酸的多核苷酸。
实施方案26.如实施方案17-25中任一项所述的工程化核糖体,其中所述T2结构域包含聚腺嘌呤多核苷酸。
实施方案27.如实施方案17-26中任一项所述的工程化核糖体,其中所述T2结构域包含长度为7至12个腺嘌呤核苷酸的聚腺嘌呤多核苷酸。
实施方案28.如实施方案17-27中任一项所述的工程化核糖体,其中所述核糖体按照从5’到3’的顺序包含S1结构域‘、其后依次为T1结构域、L1结构域、C结构域、L2结构域、T2结构域和S2结构域。
实施方案29.如实施方案17-28中任一项所述的工程化核糖体,其中所述核糖体包含基本上由按照从5’到3’顺序的S1结构域、其后依次为T1结构域、L1结构域、C结构域、L2结构域、T2结构域和S2结构域组成的多核苷酸。
实施方案30.如实施方案1-29中任一项所述的工程化核糖体,其中所述工程化核糖体包含突变。
实施方案31.如实施方案30所述的工程化核糖体,其中所述突变是功能改变性突变。
实施方案32.如实施方案31所述的工程化核糖体,其中所述功能改变性突变位于肽基转移酶中心。
实施方案33.如实施方案31所述的工程化核糖体,其中所述功能改变性突变位于肽基转移酶中心的A位点。
实施方案34.如实施方案31所述的工程化核糖体,其中功能改变性突变位于工程化核糖体的出口通道、与转运体的相互作用位点或与促进翻译的辅助蛋白的相互作用位点中的一个或多个。
实施方案35.如实施方案1-35中任一项所述的工程化核糖体,其中所述工程化核糖体具有抗生素抗性突变。
实施方案36.一种多核苷酸,该多核苷酸编码实施方案1-35中任一项的工程化核糖体的rRNA。
实施方案37.如实施方案36所述的多核苷酸,其中所述多核苷酸是载体。
实施方案38.如实施方案36或37所述的多核苷酸,其中所述多核苷酸进一步包含将由所述工程化核糖体表达的基因。
实施方案39.如实施方案38所述的多核苷酸,其中所述基因是报道基因。
实施方案40.如实施方案39所述的多核苷酸,其中所述报道基因是绿色荧光蛋白基因。
实施方案41.如实施方案36-40中任一项所述的多核苷酸,其中所述工程化核糖体包含修饰的抗SD序列,并且所述基因包含与所述工程化核糖体互补的SD序列。
实施方案42.如实施方案36-41中任一项所述的多核苷酸,其中所述基因包含密码子并且所述密码子编码非天然氨基酸。
实施方案43.一种用于制备工程化核糖体的方法,该方法包括表达实施方案36-42中任一项所述的多核苷酸。
实施方案44.如实施方案43所述的方法,该方法进一步包括选择突变体。
实施方案45.如实施方案44所述的方法,其中所述选择步骤包括阴性选择步骤、阳性选择步骤或阴性选择步骤和阳性选择步骤两者。
实施方案46.一种工程化细胞,该工程化细胞包含(i)实施方案36-42中任一项所述的多核苷酸,(ii)实施方案1-35中任一项所述的工程化核糖体,或(i)和(ii)两者。
实施方案47.一种工程化细胞,该工程化细胞包含第一蛋白质翻译机制和第二蛋白质翻译机制,a.其中第一蛋白质翻译机制包含核糖体,其中所述核糖体在大亚基和小亚基之间没有连接部分,和b.其中第二蛋白质翻译机制包含实施方案1-35中任一项所述的工程化核糖体。
实施方案48.一种用于制备序列确定的聚合物的方法,该方法包括(a)提供实施方案1-35中任一项所述的工程化核糖体和(b)提供编码序列确定的聚合物的mRNA或DNA模板。
实施方案49.如实施方案48所述的方法,其中所述序列确定的聚合物在体外制备。
实施方案50.如实施方案49所述的方法,该方法进一步包括提供核糖体耗尽的细胞提取物或纯化的翻译系统。
实施方案51.如实施方案50所述的方法,其中所述核糖体耗尽的细胞提取物包含S150提取物,所述S150提取物由指数生长期中期至晚期的细胞培养物或在收获时具有约3.0的O.D.600的培养物制备。
实施方案52.如实施方案48所述的方法,其中所述序列确定的聚合物在体内制备。
实施方案53.如实施方案48或52所述的方法,其中所述序列确定的聚合物是在实施方案46或47中任一项所述的细胞中制备的。
实施方案54.如实施方案48-53中任一项所述的方法,其中所述mRNA或DNA编码修饰的SD序列,并且所述工程化核糖体包含与所述修饰的SD序列互补的抗SD序列。
实施方案55.如实施方案48-54中任一项所述的方法,其中所述序列确定的聚合物包含氨基酸。
实施方案56.如实施方案55所述的方法,其中所述氨基酸是天然氨基酸。
实施方案57.如实施方案55所述的方法,其中所述氨基酸是非天然氨基酸。
实施方案58.如实施方案47所述的工程化细胞,其中第一蛋白质翻译机制的核糖体包含修饰的抗SD序列,并且其中第二蛋白质翻译系统的核糖体包含未修饰的(例如野生型)抗-SD序列。
实施方案59.如实施方案48-53中任一项所述的方法,进一步包括包含修饰的抗SD序列的非系连式核糖体。
实施方案60.如实施方案59的方法,其中所述mRNA或DNA编码修饰的SD序列,并且所述非系连式核糖体包含与所述修饰的SD序列互补的抗SD序列。
实施方案61.如实施方案60的方法,其中所述序列确定的聚合物包含天然或非天然氨基酸。
实施方案62.一种包含两种或更多种蛋白质翻译机制的工程化细胞,其中:(a)第一种机制是天然翻译机制,其中由系连式或钉合式核糖体根据天然遗传密码翻译mRNA;(b)第二种机制是一种源自可解离核糖体的人工机制,它调节宿主代谢负担,或者其中由所述正交核糖体翻译包含正交密码子的正交mRNA。
实施方案63.一种包含两种或更多种蛋白质翻译机制的工程化细胞,其中:(a)第一种机制是天然翻译机制,其中由维持细胞生命的系连式或钉合式核糖体翻译mRNA;(b)第二种机制是源自执行正交功能的可解离核糖体的人工机制。
实施方案64.一种包含两种或更多种蛋白质翻译机制的工程化细胞,其中正交可解离核糖体在蛋白质表达的情况下优于正交系连式核糖体。
实施方案65.一种工程化细胞,其中不仅o-30S而且游离50S亚基都被工程化以实现新功能。
实施方案66.一种工程化细胞,其中不仅o-30S而且游离50S亚基都被工程化以实现新功能而不干扰细胞蛋白质组的表达,不仅o-30S而且游离50S亚基都被设计成在不干扰细胞蛋白质组表达的情况下实现新功能。
实施方案67.一种工程化细胞,其中不仅o-30S而且游离50S亚基都被工程化以实现功能获得性核糖体突变。
实施方案68.一种工程化细胞,其中不仅o-30S而且游离50S亚基都被工程化以实现功能获得性核糖体突变,其中这些突变特异性地克服了有问题的聚合物序列的翻译。
实施方案69.一种工程化细胞,其包含第一蛋白质翻译机制和第二蛋白质翻译机制,所述第一蛋白质翻译机制包含第一工程化核糖体,所述第一工程化核糖体包含:i)包含核糖体RNA(rRNA)和蛋白质的小亚基,ii)包含核糖体RNA(rRNA)和蛋白质的大亚基,和iii)连接部分,其中连接部分包含多核苷酸序列并将小亚基的rRNA与大亚基的rRNA系连起来;第二蛋白质翻译机制包含第二工程化核糖体,第二工程化核糖体包含:i)包含rRNA和蛋白质的小亚基,ii)包含rRNA和蛋白质的大亚基,和iii)其中第二工程化核糖体在大亚基和小亚基之间没有连接部分;并且其中第二工程化核糖体的小亚基包含修饰的抗SD序列以允许翻译具有不同于内源细胞mRNA的互补和/或同源SD序列的模板,和/或其中第二工程化核糖体包含一个或多个功能改变性突变,其中所述功能改变性突变不在抗SD序列中。
实施方案70.如实施方案69所述的工程化细胞,其中所述第一蛋白质翻译机制和第二蛋白质翻译机制能够支持序列确定的聚合物的翻译。
实施方案71.如实施方案69-70中任一项所述的工程化细胞,其中所述第一蛋白质翻译机制能够支持天然内源RNA的翻译。
实施方案72.如实施方案69-71中任一项所述的工程化细胞,其中所述第二蛋白质翻译机制能够支持非天然外源RNA的翻译。
实施方案73.如实施方案69-72中任一项所述的工程化细胞,其中所述第二工程化核糖体的小亚基包含选自3’-GGUGUU-5’、3’-UGGUGU-5’、3’-GGUGUC-5’、3’-GUUUAG-5’、3’-UGGAAU-5’、3’GGAUCU-5’、3’-UGGAUC-5’、3’-UGGUAA-5’和3’-UGGAUC-5’的经修饰的抗SD序列。
实施方案74.如实施方案69-74中任一项所述的工程化细胞,其中所述第二工程化核糖体在以下一项或多项中包含功能改变性突变:a)肽基转移酶中心(PTC);b)新生肽出口通道(NPET);c)与延伸因子的相互作用位点;d)tRNA结合位点;e)伴侣结合位点;f)新生链修饰酶结合位点;g)GTP酶中心。
实施方案75.如实施方案69-74中任一项所述的工程化细胞,其中第二工程化核糖体的大亚基在23S rRNA的以下残基中的一个或多个处包含功能改变性突变:G2061、C2452、U2585、G2251、G2252、A2057、A2058、C2611、A2062、A2503、U2609、G2454和G2455。
实施方案76.如实施方案69-75中任一项所述的工程化细胞,其中所述第一工程化核糖体、所述第二工程化核糖体或所述第一工程化核糖体和所述第二工程化核糖体两者包含抗生素抗性突变。
实施方案77.如实施方案69-76中任一项所述的工程化细胞,其中所述第一工程化核糖体的大亚基包含23SrRNA的排列变体或突变体和/或所述小亚基包含16S rRNA的排列变体或突变体。
实施方案78.如实施方案69-77中任一项所述的工程化细胞,其中所述连接部分将大亚基的螺旋共价结合至小亚基的螺旋,所述大亚基的螺旋选自螺旋10、螺旋38、螺旋42、螺旋54、螺旋58、螺旋63、螺旋78、螺旋101,所述小亚基的螺旋选自螺旋11、螺旋26、螺旋33和螺旋44。
实施方案79.一种用于制备序列确定的氨基酸聚合物的方法,该方法包括:(a)提供以下中的一种或多种:(i)如实施方案69-78中任一项所述的细胞;(ii)由实施方案69-78中任一项所述的细胞衍生的细胞提取物;(iii)由实施方案69-78中任一项所述的细胞衍生的纯化的翻译系统;b)向所述细胞或细胞提取物提供编码序列确定的聚合物的mRNA。
实施方案80.如实施方案79所述的方法,其中所述序列确定的氨基酸聚合物在体内制备。
实施方案81.如实施方案79所述的方法,其中所述序列确定的氨基酸聚合物在体外制备。
实施方案82.如实施方案79-81中任一项所述的方法,其中所述序列确定的氨基酸聚合物包含一种或多种非天然氨基酸。
实施例
以下实施例是说明性的,不应被解释为限制要求保护的主题。
实施例1.用于细菌细胞中蛋白质合成的完全正交系统的开发和测试
A.概要
核糖体从蛋白氨基酸合成遗传编码的多肽。核糖体工程正在成为一种强大的方法,用于扩展蛋白质合成装置的催化潜力并阐明其起源、进化和功能。由于工程化核糖体的特性可能对一般蛋白质合成有害,因此需要使设计的核糖体在功能上与合成细胞蛋白质的翻译机器分离。Ribo-T为这个问题提供了最初的解决方案,它是一种带有系连式亚基的工程化核糖体,在翻译所需的蛋白质时,可以将其排除在细胞蛋白质组的翻译之外。在这里,我们提供了一种概念上不同的工程化细胞设计,它具有两个正交翻译系统,其中细胞蛋白质由Ribo-T翻译,而天然核糖体作为分离的蛋白质合成机器运行,其两个亚基都致力于翻译特定类型的mRNA。我们表明,特化核糖体的两个亚基都保留了Ribo-T的自主性,排除在细胞蛋白质组的翻译之外,因此可以被工程化以用于新功能。我们通过在肽基转移酶中心的每个rRNA核苷酸处生成具有变异的突变体的全面集合并分离使核糖体能够克服由阻滞肽施加的翻译终止阻断的功能获得性突变来阐明了所述系统的实用性。
B.简介
核糖体在蛋白质合成过程中发挥独特、复杂和高度协调的功能。它由两个亚基(小亚基和大亚基)组成,这两个亚基在细菌中分别是30S和50S(图1a)。30S亚基利用mRNA起始密码子附近的SD序列(Shine-Dalgarno)与其16S rRNA的3’末端的抗SD序列(ASD)之间的互补性来驱动翻译的起始1。在蛋白质合成的延伸阶段,30S亚基通过维持密码子-反密码子相互作用来执行解码功能,而在终止时,它促进释放因子对终止密码子的识别。50S亚基包含肽基转移酶中心(PTC),在该中心发生氨基酸聚合成多肽,并且在终止阶段还催化肽释放。不断增长的氨基酸链从PTC进入新生肽出口通道(NPET),并离开核糖体2,3
核糖体已经进化到可以利用其天然底物(mRNA、tRNA和蛋白氨基酸)进行操作,使其能够合成遗传编码的蛋白质。然而,它的合成能力可以通过分子工程来扩展,以允许使用替代遗传密码、聚合更广泛的氨基酸,或甚至可以进行非蛋白质聚合物的可编程合成4。核糖体工程也可用于阐明蛋白质合成体的起源、进化和功能。然而,所有这些努力都需要改变核糖体的内在特性5,这不可避免地会降低甚至消除核糖体合成细胞蛋白的能力6,7。虽然可以由无细胞翻译系统提供对这个问题的有意义的解决方案8,但效率和可扩展性问题限制了它们当前的应用。
所述核糖体工程困境可以通过在细胞内创建正交蛋白质合成体来克服,该正交蛋白质合成体不参与细胞蛋白质组的产生,而是专门用于翻译仅一种或几种特定的mRNA9。通过将16S rRNA中的ASD突变并将互补性SD序列引入到mRNA中,已经有可能指导一小部分的小亚基仅翻译同源mRNA10,11,这种策略已被用于扩展核糖体的解码能力12。然而,这种设置的正交性仅限于小亚基,因为由于大小核糖体亚基缔合在多轮翻译中的随机性,野生型(wt)和正交30S亚基共享同一个50S亚基池。无法创建正交50S亚基限制了改造PTC和NPET的努力,这是设计具有改进的或扩展的催化能力的翻译体的最关键位点。随着带有系连式亚基的核糖体Ribo-T的出现13,第一个完全正交翻译系统的工程化成为可能。在Ribo-T和随后的类似设计14-16中,循环排列的23S rRNA嵌入到16S rRNA中,产生的核糖体中亚基通过两个RNA接头连接(图1a)。因为Ribo-T的小亚基和大亚基是不可分离的,在带有改变的ASD的正交Ribo-T(oRibo-T)中,两个亚基都致力于仅翻译同源mRNA,因此,oRibo-T的功能独立于翻译细胞蛋白的wt核糖体(图1b)。在oRibo-T的帮助下,可以选择特定的PTC突变,以促进对wt核糖体而言有问题的氨基酸序列的聚合13,15。然而,在实现完全正交性的同时,Ribo-T的不寻常设计限制了它的功能。Ribo-T翻译蛋白质的速度只有可解离核糖体的一半13。与wt核糖体相比,它脱离起始密码子的速度较慢17。此外,即使是‘wt’Ribo-T的生物发生也相当缓慢和低效17,并且如果核糖体的功能中心受到额外的改变7,则组装问题可能会进一步加剧。虽然没有被广泛表征,但我们预计“钉合式”核糖体会面临类似的挑战。总而言之,所有这些因素使直接使用Ribo-T或任何系连式核糖体在进一步的工程化尝试中变得复杂。
C.用于在细菌细胞中蛋白质合成的“翻转”正交系统的开发和测试
为了克服最初的基于oRibo-T的方法在将具有两个功能独立的翻译机器的细胞工程化方面的缺点,我们现在创建了一个概念上新颖的体内系统设计,该系统利用可解离但完全分离的核糖体,该核糖体致力于只翻译专门的mRNA。通过“翻转”Ribo-T和可解离核糖体的作用,我们改造了细菌细胞,其中蛋白质组的翻译由Ribo-T进行,而由可解离的正交30S(o-30S)亚基和wt50S亚基组成的核糖体用作完全正交的翻译机器(图1c)。在得到的设置中,我们将其命名为OSYRIS(基于具有分离亚基的核糖体的正交翻译系统),实现了完全正交性,因为Ribo-T的系连性质使其无法与可解离核糖体的o-30S或50S缔合。因此,在OSYRIS细胞中,物理上未连接的o-30S和50S核糖体亚基仍然被迫相互作用并作为完全正交的核糖体(o-核糖体)发挥作用。因此,不仅o-30S,而且游离的50S亚基也可以被改造以实现新的功能,而不会干扰细胞蛋白质组的表达(图1c)。
所述系统的组件(图5)在不含染色体rrn等位基因的大肠杆菌菌株中组装18(图6)。在所得的OSYRIS细胞中,从经过优化的pRibo-Tt质粒中表达具有改进的16S-23S系链的Ribo-T rRNA16。另一种质粒poRbs携带可解离的o-核糖体的rRNA基因,其16S rRNA基因携带改变的ASD(图5)。在用这两种质粒转化的细胞中,o-核糖体占总核糖体群的约15%(图2a、b和图7)。将具有与o-核糖体ASD同源的SD的专门报道基因(gfp、rfp或luc)引入第三个质粒(poGFP、poRFP/oGFP或poLuc)(图5)(我们将这些正交报道基因称作o-报道基因)。
OSYRIS细胞中o-报道基因的表达依赖于o-核糖体:在不存在o-核糖体的情况下,由o-mRNA编码的报道蛋白(GFP、RFP或萤光素酶)以低水平产生,而可解离o-核糖体的存在,极大地刺激了o-报道基因的表达(图2c、d和图8)。因此,在之前的研究11,16中已被证实排除在细胞mRNA的翻译之外的o-30S亚基有效地驱动OSYRIS中o-mRNA的翻译。值得注意的是,当在同一宿主(大肠杆菌,BL21)中引入可比较的载体时,可解离的o-核糖体在o-报道基因的表达方面优于oRibo-T。此外,与从较高拷贝数质粒表达oRibo-T的细胞相比,o-GFP报道基因在OSYRIS细胞中的相对表达(其中o-核糖体从低拷贝数质粒表达)更高(图2d,图8,深色条)。
为了测试OSYRIS细胞中可解离o-核糖体是只有小亚基还是小亚基和大亚基二者保持在功能上与Ribo-T隔离,我们利用了Ribo-T中存在的使其对抗生素红霉素(Ery)有抗性的A2058G突变13。如果对Ery敏感的游离50S亚基能够以某种方式与Ribo-T的小亚基合作翻译蛋白质组,那么Ery将抑制一般蛋白质合成并干扰细胞生长。然而,即使在最高测试浓度的抗生素(1mg/ml)下,OSYRIS细胞仍继续生长,证明了可解离的50S亚基和Ribo-T的功能自主性(图11,每个组中的第二组条形图)。相比之下,随着培养基中Ery浓度的增加,o-GFP报道基因的表达逐渐降低(图3a)。该结果表明,o-报道基因的翻译主要通过由可解离的o-30S和50S亚基组成的核糖体驱动,与o-30S/Ribo-T杂合体不同(图3a)。因此,o-30S亚基和50S亚基都不会与Ribo-T相互作用,尽管两个亚基之间没有物理连接,但它们在功能上仍然相互专用。
通过将突变引入OSYRIS细胞中可解离50S亚基的23S rRNA中,获得了该可解离50S亚基的正交性的更严格证据,已知这些突变在wt大肠杆菌细胞中是显性致死的20,21。其中两个突变,A2451C和A2602U,改变PTC活性位点的关键核苷酸,而突变G2553C破坏了正确放置A位点氨酰基-tRNA以形成肽键所需的基本rRNA-tRNA相互作用22,23(图12a)。如果突变体可解离50S亚基主要与o-30S亚基相互作用,OSYRIS细胞的存活不应受到损害,因为o-核糖体被排除在一般翻译之外。相反,如果游离的50S亚基与Ribo-T缔合并参与蛋白质组的翻译,那么显性致死23S rRNA突变将阻止或严重损害OSYRIS细胞的生长。在不含o-30S的细胞中表达突变体50S亚基(通过用编码突变体23S rRNA和wt 16S rRNA的pRb质粒转化Ribo-T细胞)的尝试没有产生转化体,这证实了23S rRNA突变的显性致死性质(图3b和图12b、c)。相反,当将突变体23S rRNA基因在携带正交16S rRNA的质粒上引入到OSYRIS细胞中时,出现了许多转化体(图3b和图12b、c)。对从转化细胞的培养物中分离的rRNA的分析揭示了含有突变体23S rRNA的游离50S亚基的相当高的表达水平(图3b,图12d)。总之,这些结果清楚地表明,可解离的大核糖体亚基保持在功能上与Ribo-T隔离。这些结果清楚地表明,可解离的大核糖体亚基保持在功能上与Ribo-T隔离。
总之,o-报道基因表达和对显性致死突变的耐受性的结果表明,在OSYRIS细胞中,可解离的o-核糖体翻译o-mRNA,但对蛋白质组的翻译没有显著贡献。因此,OSYRIS细胞中可解离的o-核糖体的两个亚基都适用于生物分子工程。
在确定了OSYRIS细胞中可解离核糖体的正交性后,我们进行了原理验证实验,以测试系统选择大亚基rRNA突变的潜力,这将使核糖体能够执行其他有问题的任务。具体来说,我们旨在改造一种能够使难以终止的蛋白质有效释放的核糖体。一般来说,完全合成的多肽的释放是由PTC在1类释放因子的帮助下催化的高度细微的反应24,25。虽然大多数蛋白质在终止密码子处有效释放,但其他蛋白质的终止可能更成问题26,27。大肠杆菌中低效终止的一个极端情况是编码调节蛋白TnaC的mRNA终止密码子处的程序性翻译阻滞28-30。在高浓度色氨酸下,完全翻译的TnaC的释放受到抑制,引起的核糖体在tnaC终止密码子处的停滞导致tna操纵子下游基因表达的激活31。tnaC终止密码子处的终止阻滞是由新生TnaC与NPET和PTC的rRNA核苷酸的不利相互作用介导的30,31。TnaC介导的终止阻滞代表了蛋白质释放效率低下的范例,并说明了可能抑制携带例如非经典氨基酸的生物工程化多肽表达的问题之一。
为了鉴定可以减轻TnaC无效终止的突变,我们构建了其中将TnaC编码序列(没有其自己的起始密码子)附加在gfp基因的末端的报道基因(图4a)。如所预期的,GFP-TnaC嵌合体的体内和体外表达在高浓度色氨酸下受到抑制(图4b,图13)。在TnaC编码片段中引入W12R突变(已知用于减轻终止阻滞)28,在色氨酸存在的情况下显著刺激了报道基因的表达(图4b,图13)。
然后,我们在poRbs质粒中生成了包含120个单核苷酸23S rRNA突变体的综合文库(图5,图17的表),其中包括以下改变:i)位于参与肽基转移反应的受体氨基酸的攻击胺的
Figure BDA0003941050290000481
半径内的PTC活性位点中9个rRNA残基中的每一个;ii)第二壳核苷酸中的41个(距离PTC 
Figure BDA0003941050290000482
半径内的核苷酸);iii)参与定位P位点和A位点tRNA的受体末端的23S rRNA P环和A环的6个残基(图4c、d)。值得注意的是,OSYRIS细胞携带的文库中包含的大多数单个突变据报道在wt大肠杆菌细胞中是有害或致死的20,21,因此仅由于OSYRIS细胞中可解离核糖体的正交性质,才可以很容易地进行测试。
我们通过估算停滞旁路(SB)分数表征了单个突变体成功终止GFP-TnaC多肽的能力。SB分数反映了与有效终止的GFP-TnaC(W12R)变体28相比,难以终止的GFP-TnaC报道基因的相对表达。此外,GFP-TnaC(W12R)构建体的表达水平用于评估PTC突变对突变体核糖体一般翻译活性的影响。引人注目的是,与具有野生型50S亚基的OSYRIS细胞相比,许多具有PTCrRNA残基改变的突变体表现出明显更高的旁路分数(图4e和图14和15)。这其中,19个突变体结合了高翻译活性(wt对照的>60%)和显著增加的SB分数(>0.3,对比wt对照的0.17)(图4e,图17的表)。鉴定的突变处在位于下述中的23S rRNA残基处:PTC活性位点(G2061、C2452、U2585)、P环(G2251、G2252)以及第二PTC外壳中,包括NPET入口处的残基(A2057、A2058、C2611、A2062、A2503、U2609)和通过A2453堆叠在PTC的C2452上的两个残基(G2454和G2455)(图4g)。该列表中的两个非致死突变(U2609C和A2058U)之前已有描述29,31;它们作为内部对照,证实新分离的突变体确实揭示了参与TnaC介导的终止阻滞的PTC残基,并且所鉴定的突变有助于克服核糖体在TnaC终止密码子处的停滞。
OSYRIS细胞提供的独特机会是分离具有甚至致死突变的单个核糖体亚基的可能性,因为可以通过蔗糖梯度离心将可解离的30S或50S亚基与Ribo-T分离13(图16a、b)。利用该系统的这一特性,我们制备了携带致死突变U2500G、A2060C、A2450U的大核糖体亚基,其旁路分数>0.37,将它们与wt(非正交)30S亚基重新缔合,并在无细胞翻译系统中测试所述突变是否缓解核糖体在tnaC ORF的终止密码子处的停滞(图16c)。我们还测试了SB分数为0.35-0.55的一些非致死突变体(A2503G、A2062G、C2611G、C2611U)。与体内数据一致,在无细胞翻译过程中,与wt核糖体相比,所有测试的突变体核糖体显示在tnaC终止密码子处的停滞减少(图4g和图16),揭示了它们更有效地终止TnaC肽翻译的能力。已识别的终止阻滞释放突变的位置表明,突变体核糖体的肽基-tRNA的位置改变或P位点底物和/或PTC中的释放因子的不太严格定位促进了TnaC的释放。可以说,缓解TnaC介导的终止阻滞的突变可以使用以前的基于oRibo-T的方法进行分离13,15。然而,OSYRIS中鉴定的一些突变可能会被遗漏,因为与OSYRIS中的可解离o-核糖体相比,oRibo-T提供的报道基因表达水平降低(图2d)将限制超过在我们的筛选上施加的最小效率阈值的突变体的数量。
我们的原理验证实验表明,基于Ribo-T维持细胞生长同时迫使o-核糖体的可解离亚基彼此相互作用的能力的OSYRIS设计提出了一种用于生成完全正交的细胞翻译系统的可行的概念上新颖的方法。OSYRIS的改造是可能的,因为Ribo-T具有足够的活性来翻译整个细胞蛋白质组13,17。然而,由Ribo-T驱动的翻译缓慢且RiboT组装效率低,这可能是导致OSYRIS细胞生长速度缓慢的因素之一(96孔板中的倍增时间τ~300分钟,与BL21菌株的τ~45分钟相比)(图9a)。因此,优化Ribo-T功能和组装可以提高OSYRIS细胞的生长速度并进一步扩展正交系统的多功能性。三质粒设置(图5)使OSYRIS高度模块化,并因此可以容易地调整以适应各种应用。原则上,OSYRIS可以通过将Ribo-T rRNA基因引入染色体并将正交rRNA基因和报道基因组合在同一质粒上来进一步简化。减少质粒的数量还可以促进OSYRIS细胞的生长。通过调节质粒拷贝数或启动子强度来增加OSYRIS细胞中o-核糖体的比例可能是提高系统性能并根据特定需求进行调整的另一种方法。因此,虽然在我们的实验中,o-核糖体只参与了一个报道基因的表达,但如果适当平衡o-核糖体的比例,则可以同时翻译几个配备被改变的SD的基因,从而提供正交表达例如多亚基蛋白质复合物的可能性。
OSYRIS的一个明显可能的应用是能够将非经典氨基酸掺入被核糖体区别对待的多肽(例如,反键修饰的D-和β-氨基酸32)中的工程化核糖体。尽管扩大核糖体的合成潜力需要从专门的氨酰化系统到设计遗传密码的许多组件,但在OSYRIS细胞中运行的完全正交的可解离核糖体可以加速这一目标的实现。重要的是,OSYRIS使许多其他努力成为可能,从采用核糖体逆向工程来阐明翻译体的起源,到为非蛋白质性质的聚合物的可编程合成发展新的催化功能。
参考文献
1 Shine,J.&Dalgarno,L.The 3'-terminal sequence of Escherichia coli16S ribosomal RNA:complementarity to nonsense triplets and ribosome bindingsites.Proc.Natl.Acad.Sci.USA 71,1342-1346(1974)。
2 Jenni,S.&Ban,N.The chemistry of protein synthesis and voyagethrough the ribosomal tunnel.Curr.Opin.Struct.Biol.13,212-219(2003)。
3 Rodnina,M.V.Translation in Prokaryotes.Cold Spring HarborPerspect.Biol.10,pii:a032664(2018)。
4 Des Soye,B.J.,Patel,J.R.,Isaacs,F.J.&Jewett,M.C.Repurposing thetranslation apparatus for synthetic biology.Curr.Opin.Chem.Biol.28,83-90(2015)。
5 Davis,L.&Chin,J.W.Designer proteins:applications of genetic codeexpansion in cell biology.Nat.Rev.Mol.Cell Biol.13,168-182(2012)。
6 Dedkova,L.M.,Fahmi,N.E.,Golovine,S.Y.&Hecht,S.M.Construction ofModified Ribosomes for Incorporation of d-Amino Acids intoProteins.Biochemistry 45,15541-15551(2006)。
7 Ward,F.R.,Watson,Z.L.,Ad,O.,Schepartz,A.&Cate,J.H.D.Defects in theassembly of ribosomes selected for beta-amino acidincorporation.Biochemistry,58,4494-4504(2019)。
8 Silverman,A.D.,Karim,A.S.&Jewett,M.C.Cell-free gene expression:anexpanded repertoire of applications.Nat.Rev.Genet.,doi:10.1038/s41576-019-0186-3(2019)。
9 Arranz-Gibert,P.,Vanderschuren,K.&Isaacs,F.J.The role oforthogonality in genetic code expansion.Life 9,58(2019)。
10 Hui,A.&de Boer,H.A.Specialized ribosome system:preferentialtranslation of a single mRNA species by a subpopulation of mutated ribosomesin Escherichia coli.Proc.Natl.Acad.Sci.USA 84,4762-4766(1987)。
11 Rackham,O.&Chin,J.W.A network of orthogonal ribosome x mRNApairs.Nat.Chem.Biol.1,159-166(2005)。
12 Wang,K.,Neumann,H.,Peak-Chew,S.Y.&Chin,J.W.Evolved orthogonalribosomes enhance the efficiency of synthetic genetic codeexpansion.Nat.Biotechnol.25,770-777(2007)。
13 Orelle,C.等Protein synthesis by ribosomes with tetheredsubunits.Nature 524,119-124(2015)。
14 Fried,S.D.,Schmied,W.H.,Uttamapinant,C.&Chin,J.W.Ribosome subunitstapling for orthogonal translation in E.coli.Angew.Chem.Int.Edit.54,12791-12794(2015)。
15 Schmied,W.H.等Controlling orthogonal ribosome subunit interactionsenables evolution of new function.Nature 564,444-448(2018)。
16 Carlson,E.D.等Engineered ribosomes with tethered subunits forexpanding biological function.Nat.Commun.10,3920(2019)。
17 Aleksashin,N.A.等Assembly and functionality of the ribosome withtethered subunits.Nat.Commun.10,930(2019)。
18 Quan,S.,Skovgaard,O.,McLaughlin,R.E.,Buurman,E.T.&Squires,C.L.Markerless Escherichia coli rrn deletion strains for geneticdetermination of ribosomal binding sites.G3 5,2555-2557(2015)。
19Davis,J.H.等Modular assembly of the bacterial large ribosomalsubunit.Cell 167,1610-1622(2016)。
20 Sato,N.S.,Hirabayashi,N.,Agmon,I.,Yonath,A.&Suzuki,T.Comprehensivegenetic selection revealed essential bases in the peptidyl-transferasecenter.Proc.Natl.Acad.Sci.USA 103,15386-15391(2006)。
21 Cochella,L.&Green,R.Isolation of antibiotic resistance mutationsin the rRNA by using an in vitro selection system.Proc.Natl.Acad.Sci.USA 101,3786-3791(2004)。
22 Nissen,P.,Hansen,J.,Ban,N.,Moore,P.B.&Steitz,T.A.The structuralbasis of ribosome activity in peptide bond synthesis.Science 289,920-930(2000)。
23 Polikanov,Y.S.,Steitz,T.A.&Innis,C.A.A proton wire to coupleaminoacyl-tRNA accommodation and peptide-bond formation on the ribosome.Nat.Struct.Molec.Biol.21,787-793(2014)。
24 Korostelev,A.A.Structural aspects of translation termination onthe ribosome.RNA 17,1409-1421(2011)。
25 Tate,W.P.,Cridge,A.G.&Brown,C.M.'Stop'in protein synthesis ismodulated with exquisite subtlety by an extended RNA translationsignal.Biochem.Soc.Trans.46,1615-1625(2018)。
26 Li,G.W.,Burkhardt,D.,Gross,C.&Weissman,J.S.Quantifying absoluteprotein synthesis rates reveals principles underlying allocation of cellularresources.Cell 157,624-635(2014)。
27 Baggett,N.E.,Zhang,Y.&Gross,C.A.Global analysis of translationtermination in E.coli.PLoS Genet.13,e1006676(2017)。
28 Gong,F.&Yanofsky,C.Instruction of translating ribosome by nascentpeptide.Science 297,1864-1867(2002)。
29 Martinez,A.K.等Interactions of the TnaC nascent peptide with rRNAin the exit tunnel enable the ribosome to respond to free tryptophan.NucleicAcids Res.42,1245-1256(2014)。
30 Bischoff,L.,Berninghausen,O.&Beckmann,R.Molecular basis for theribosome functioning as an L-tryptophan sensor.Cell Rep.9,469-475(2014)。
31 Cruz-Vera,L.R.,Rajagopal,S.,Squires,C.&Yanofsky,C.Features ofribosome-peptidyl-tRNA interactions essential for tryptophan induction of tnaoperon expression.Mol.Cell 19,333-343(2005)。
32 Lee,J.等Expanding the limits of the second genetic code withribozymes.Nat.Commun.10,5097,doi:10.1038/s41467-019-12916-w(2019)。
D.材料和方法
1.OSYRIS细胞的组装
a.质粒构建
用于生成和优化OSYRIS设置的质粒如图5所示。关键质粒的核苷酸序列和特征显示在源数据文件中。
所有质粒均使用吉布森组装构建1,质粒骨架通过反向PCR或限制性核酸酶消化制备,克隆的插入物从各自的模板PCR扩增或通过Integrated DNA Technologies化学合成。PCR反应使用Q5高保真DNA聚合酶(New England Biolabs)进行,并且PCR产物使用DNA纯化和浓缩试剂盒(DNA Clean and Concentrator kit,Zymo Research)纯化。将编码rRNA的质粒的吉布森组装反应物电穿孔到大肠杆菌POP2136细胞中(所有细菌菌株列于图18的表中),并在补充有适当抗生素的LB板上回收转化体;将平板在30℃下孵育,以防止受λPL启动子控制的rRNA基因的表达2。所有其他质粒在LB培养基中生长的大肠杆菌JM109菌株中转化和繁殖,需要时在培养基中补充100μg/ml氨苄青霉素(Amp)、50μg/ml卡那霉素(Kan)或50μg/ml壮观霉素(Spc)。质粒使用高纯度质粒分离试剂盒(High Pure Plasmid IsolationKit,Roche)分离,通过PCR和毛细管测序检验,并用于OSYRIS细胞的工程化。以下部分概述了主要质粒的构建。
i)pRibo-Tt质粒
用SgsI限制酶线性化携带A2058G红霉素抗性突变的pRibo-T v2.0质粒3的骨架并纯化。缺失的tRNA基因簇(编码tRNAGlu、tRNAAla、tRNAIle、tRNATrp和tRNAAsp,其转录受Ptac启动子和T1终止子控制)被合成为gBlock(Integrated DNA Technology)并使用引物NA1和NA2进行PCR扩增(所有引物列于图19的表中)。PCR反应由Q5高保真DNA聚合酶(New EnglandBiolabs)根据制造方案在以下条件下催化:98℃,30秒,然后是30个循环(98℃,10秒;64℃,30s;72℃,20s),然后在72℃最终孵育2分钟。在吉布森组装反应物(1.7%PEG-800、3.1mMDTT、0.31mMβ-烟酰胺腺嘌呤二核苷酸、62.5μM每种dNTP、3.1mM MgCl2、31.3mM Tris/HCl,pH 7.5、0.004U/μl T5核酸外切酶(Epicentre)、4U/μl Taq DNA连接酶(New EnglandBiolabs)、0.025U/μl Phusion高保真DNA聚合酶(New England Biolabs))中,将纯化的PCR产物(20ng)与SgsI线性化的pRibo-T v.2.0骨架(80ng)混合。在50℃下孵育1小时后,将3μl反应混合物转化到电感受态POP2136大肠杆菌细胞中。将细胞接种到LB/Amp琼脂板上。挑取转化体的单个菌落,在LB/Amp培养基上生长并分离质粒。tRNA簇的存在通过使用引物NA3和NA4的PCR扩增和测序来确认。
ii)poRBS质粒
使用引物NA5和NA6,分别从pO2和pAM552质粒4中PCR扩增受λPL启动子和T1/T2终止子转录控制的正交和wt rRNA操纵子。使用引物NA7和NA8从质粒pKD135扩增KanR基因。使用引物NA9和NA10从pCSacB质粒6扩增pSC101复制起点。PCR反应用DpnI处理以降低亲本质粒的背景。PCR产物经过纯化、电泳确认,并在吉布森组装反应物中混合(每种40ng)。在50℃下孵育1小时后,将3μl反应混合物转化到电感受态POP2136大肠杆菌细胞中。将细胞涂板到LB/Kan琼脂板上。在37℃孵育24小时后,挑取单个菌落,在LB/Kan培养基中生长,分离质粒并通过限制性消化和测序验证。
iii)poGFP质粒
使用引物NA11和NA12从plpp5-oGFP质粒4中PCR扩增具有5’UTR、3’UTR和T1/T2终止子的o-GFP基因。使用引物NA13和NA14从pJDO75质粒8PCR扩增LuxR阻遏物和PLux启动子7。使用引物NA15和NA16从ptRNA67质粒6中PCR扩增SpcR标记(aadA)。使用引物NA17和NA18从ptRNA67质粒中PCR扩增p15A复制起点。涉及质粒模板的PCR反应用DpnI处理。在吉布森组装反应物中混合纯化的PCR产物(每种40ng)。在50℃下孵育1小时后,将3μl反应混合物转化到电感受态JM109大肠杆菌细胞(Promega)中。将细胞涂板到LB/Spc琼脂板上。在37℃孵育24小时后,挑取单个菌落,在LB/Spc培养基中生长并分离质粒。使用引物NA19和NA20通过PCR确认luxR基因插入物的存在。所得质粒的限制性消化表明其大小超过预期大小约1kb。随后的限制性分析和测序显示luxR基因经历了重复(图5c)。预计这种重复不会影响o-gfp报道基因的表达。
iv)poRFP/oGFP质粒
SpcR标记(aadA)和p15A复制起点从ptRNA67质粒6进行PCR扩增。PCR反应物用DpnI处理。具有Plpp5启动子、5’UTR、3’UTR和T1/T2终止子的o-GFP基因从plpp5-oGFP质粒4进行PCR扩增。将纯化的PCR产物(每种约40ng)在吉布森组装反应物中混合。在50℃下孵育1小时后,将3μl反应混合物转化到电感受态JM109大肠杆菌细胞(Promega)中。将细胞涂板到LB/Spc琼脂板上。在37℃孵育24小时后,挑取单个菌落,在LB/Spc培养基中生长并分离质粒。所得质粒plpp5-oGFP-pA15-Spec的结构通过限制性消化和测序验证。从质粒pRYG9中PCR扩增具有PT5启动子和T0转录终止子的rfp基因,通过PCR引入正交SD序列,并将所得的o-rfp构建体插入plpp5-oGFP-pA15-Spc质粒的独特SphI位点。
v)poLuc质粒
基于poGFP(图5c)构建了携带正交萤光素酶基因的质粒poLuc。使用引物NA21和NA22从pBESTluc质粒(Promega)中PCR扩增编码萤火虫萤光素酶的1653bp基因luc。所得PCR产物和poGFP质粒用限制酶BglII和SalI切割并连接。将连接混合物转化大肠杆菌JM109感受态细胞,通过菌落PCR鉴定luc基因阳性克隆,通过测序验证所克隆的luc基因的完整性。
vi)poGFP-TnaC质粒
为了构建报道poGFP-TnaC质粒(wt或W12R突变体),将poGFP质粒中的gfp编码序列替换为编码嵌合wt或突变体GFP-TnaC蛋白的序列。包含正交核糖体结合位点和GFP-TnaC或GFP-TnaC(W12R)编码序列的DNA插入物是使用引物NA23和NA24使用用于体外翻译(如下所述)的模板通过PCR产生的。纯化后,通过吉布森组装将插入物引入用限制酶BglII和SalI切割的poGFP质粒中。转化后,通过使用引物NA25和NA26的菌落PCR并通过对质粒的相应片段进行测序来检查单个菌落中正确插入物的存在。
b.改造表达Ribo-T的细胞
SQ171 FG细胞(图18的表)用作宿主(图6),所述细胞不含染色体rRNA等位基因10,但携带在表达Ribo-T4时刺激其生长的ybeX和rpsA基因突变。为了将来可能使用5-氟尿嘧啶阴性选择,基因upp被重组工程技术灭活。
受体细胞最初携带两个质粒:包含rrnB操纵子、反选择性sacB标记物和KanR基因的pCSacB质粒,以及携带缺失tRNA基因的ptRNA67质粒,所述缺失tRNA基因在染色体rRNA操纵子的缺失过程中被消除6。将细胞制备成电感受态的,然后用50ng pRibo-Tt质粒转化50μl细胞悬液,该质粒携带Ribo-T rRNA基因和缺失的tRNA基因(图5),该质粒是从POP2136细胞中分离的。转化的细胞用1ml SOC培养基(2%胰蛋白胨、0.5%酵母提取物、10mM NaCl、10mM MgSO4、10mM MgCl2、20mM葡萄糖)稀释,并在37℃下振荡孵育6小时。用补充有50μg/mlAmp、25μg/ml Spc和0.25%蔗糖的新鲜SOC培养基将150μl培养物整分试样稀释至2ml,并在37℃下持续振荡培养12小时。将细胞离心(1分钟,5000g)并涂板在含有50g/ml Amp、25μg/ml Spc、5%蔗糖和1mg/ml红霉素(Ery)的LB/琼脂板上。将板在37℃下孵育48小时。pCSacB质粒的缺失通过转化体对Kan的敏感性进行验证,测试通过在添加或不添加50μg/ml Kan的情况下在补充有50μg/ml Amp、25μg/ml Spc的LB/琼脂平板上重复涂板菌落进行。然后将转化体在补充有50μg/ml Amp和25μg/ml Spc的LB培养基中培养,分离质粒并通过限制性分析验证。通过使用RNeasy Mini试剂盒(Qiagen)和琼脂糖凝胶电泳分离总RNA进一步证实了wtrRNA的不存在。
c.ptRNA67质粒的消除
然后将获得的转化体去除ptRNA67质粒。为此,将细胞在补充有100μg/ml Amp的LB培养基中传代约100代。在将细胞稀释物涂板后,通过它们对Spc的敏感性和在总质粒制备物的限制性消化中没有可见量的ptRNA67质粒条带,证实了单个克隆中不存在ptRNA67质粒。
d.表达Ribo-T的细胞中recA基因的失活
我们最初将poRbs引入工程化细胞的尝试经常导致出现由poRbs和pRibo-Tt质粒之间的重组引起的异常质粒。因此,为了避免这个问题,我们灭活了带有pRibo-Tt质粒的细胞中的recA基因。(值得注意的是,在去除ptRNA67质粒之前灭活recA基因可以防止质粒丢失,即使在没有Spc的情况下长时间传代细胞后也是如此)。
为了通过P1噬菌体转导灭活OSYRIS细胞中的recA基因,我们首先使用来自pKD3质粒5的氯霉素(Chl)抗性盒通过常规重组程序制备供体菌株BW25113 recA::cat。使用引物NA27和NA28对盒进行PCR扩增。PCR片段被转化到携带Red重组酶表达质粒pDK46的BW25113菌株中。在选择和验证recA::cat菌株并去除pKD46质粒后,得到的菌株用作噬菌体转导的供体。根据标准方案11进行P1噬菌体转导,不同之处在于在将转导子涂板到补充有50μg/mlAmp和15μg/ml Chl的LB/琼脂平板上之前,复苏孵育时间为6小时而不是1小时。工程化菌株的基因型显示在图20的表中。
e.poRbs质粒的引入
然后通过电穿孔用poRbs(或在需要时,用pRbs)质粒转化SQ171FGΔrecA/pRibo-Tt菌株并选择AmpR/KanR/ChlR细胞。与标准转化方案的唯一偏差是转化体在不含抗生素的SOC培养基中的复苏时间延长至6小时,然后在补充有50μg/ml Amp、25μg/ml Kan和15μg/mlChl的LB/琼脂平板上选择转化体。通过总质粒的限制性分析和通过琼脂糖凝胶电泳分析rRNA来验证转化体。
f.报道质粒的引入
通过电穿孔将报道质粒(poGFP、poRFP/oGFP、poLuc、poGFP-TnaC)引入到SQ171 FGΔrecA/pRibo-Tt/poRbs细胞中并选择Ampr/Kanr/Chlr/Spcr细胞,基本上如上一节所述。
g.验证OSYRIS细胞的基因组序列
在OSYRIS细胞的构建过程中,原始宿主细胞经过多次传代并在多个步骤经历单菌落纯化,可能导致自发突变的积累。因此,对完全组装的OSYRIS细胞的总基因组进行了测序。对所得序列的分析表明在几个基因中存在突变(图20的表)。其中一些突变(例如,在基因ptsI或ackA中)可能在某些条件下对细胞生长产生潜在的负面影响,并且将来可以通过基因组改造进行纠正。
h.监测正交gfp基因的体内表达
携带poRbs或pRbs质粒(分别表达正交或非正交核糖体)和poGFP报道质粒的OSYRIS细胞在补充有50μg/ml Amp、25μg/ml Kan、25μg/ml Spc和15μg/ml Chl的LB培养基中在37℃持续摇动下生长过夜。将培养物在补充有相同抗生素并另外含有1ng/ml N-(β-酮己酰基)-L-高丝氨酸内酯(HSL,报道基因转录的诱导剂,Santa Cruz Biotechnology)的新鲜LB培养基中按1:40(v/v)稀释。将培养物(120μl)置于96孔平底聚苯乙烯组织培养板(Costar)的孔中并置于读板器(TECAN Infinite M200 Pro)中并在37℃以恒定线性(3mm)摇动进行孵育。在24-48小时的时间段内监测细胞培养物密度(A600)和GFP荧光(485nm的激发波长,520nm的发射波长,应用增益调节函数的最佳增益30%RFU)。从所有记录值中减去不含报道基因的细胞的自发荧光。
对于红霉素敏感性测试,将过夜培养物以1:40的比例稀释到仅补充有HSL(最终浓度:0-16ng/ml)或补充有1ng/ml HSL和不同浓度的红霉素(最终浓度:0-1mg/ml)新鲜的LB培养基中。细胞生长和GFP表达的监测如前一段所述。
当OSYRIS细胞携带poRFP/poGFP报道基因时,使用550nm的激发波长和675nm的发射波长监测RFP的表达,应用增益调节函数的最佳增益为30%RFU。
2.正交萤光素酶基因的体内表达
携带poLuc质粒的OSYRIS细胞在补充有50μg/ml Amp、25μg/ml Kan、25μg/ml Spc和15μg/ml Chl的LB培养基中生长24小时,然后按1:40稀释到含有相同的抗生素和1ng/mlHSL的新鲜培养基中。6小时后,将每种培养物0.2A600离心(5分钟,5000g,4℃),并将细胞沉淀快速冷冻。按照制造商的方案,使用萤光素酶测定系统(Promega)测量萤光素酶活性。具体来说:将细胞沉淀在20℃水浴中解冻,然后重新悬浮在补充有10%(v/v)的磷酸氢盐缓冲液(1M K2HPO4 pH 7.8、20mM EDTA)的25μl LB中。将20μl细胞悬液与60μl新鲜制备的裂解混合物(25mM Tris-磷酸盐pH 7.8、2mM二硫苏糖醇、2mM 1,2-二氨基环己烷-N,N,N’,N’-四乙酸、10%甘油、1%Triton X-100、1.25mg/ml溶菌酶、2.5mg/ml牛血清白蛋白)混合并在室温下裂解10分钟。然后将10μl细胞裂解物整分试样放入96孔黑色/透明底测定板(Corning)的孔中,加入50μl萤光素酶测定试剂(Promega),并立即在TECAN读板器中获得荧光读数。
3.oRibo-T或oRbs驱动的报道基因表达比较
用poGFP或poLuc质粒转化大肠杆菌BL21菌株。在补充有50μg/ml Spc的LB/琼脂平板上选择转化体,从单个菌落生长,然后使其成为电感受态的。然后用poRibo-T(基于pBR322 ori的表达oRibo-T rRNA的AmpR质粒)3或用o-pAM552质粒(基于pBR322 ori的表达oRbs rRNA的AmpR质粒)3转化含有报道基因的细胞。
如上所述测量o-gfp或o-luc报道基因的表达。
4.突变体rRNA含量分析
通过引物延伸分析正交核糖体的23S rRNA中是否存在工程化突变。为此,使用RNeasy Mini试剂盒(Qiagen)从OSYRIS细胞中分离总RNA。用于分析每个突变的引物和dNTP和ddNTP的组合显示在图21的表中。对于每个测定,通过在90℃下孵育1分钟,然后在15分钟内冷却至42℃,将适当的5’[32P]标记的引物(0.5pmol)在1X杂交缓冲液(50mM K-HEPES,pH7.0,100mM KCl)中退火至1μg总RNA。在0.25mM的适当ddNTP和0.2mM的每种其余dNTP(图21中的表)存在下,用2个单位的AMV逆转录酶(Roche)在42℃下将退火的引物延伸20分钟(最终反应体积为8μl)。加入120μl终止缓冲液(84mM NaOAc,0.8mM EDTA,pH 8.0,70%EtOH)终止反应,在-80℃冷却15分钟,然后在15000g(4℃)离心1小时使核酸沉淀。去除上清液,将沉淀干燥并溶解在甲酰胺上样染料中。在12%变性聚丙烯酰胺凝胶中分离cDNA产物,并通过磷屏成像进行可视化。使用ImageJ软件12确定趾纹条带的强度。减去背景。
5.无细胞翻译系统中GFP-TnaC(wt)或GFP-TnaC(W12R)蛋白的表达
通过交叉PCR生成包含T7 RNA聚合酶启动子、来自噬菌体T7基因10的核糖体结合位点和GFP-TnaC或GFP-TnaC(W12R)编码序列的DNA模板(见附录I)。首先,使用T7启动子正向引物NA29(图19的表)和与wt tnaC互补的NA30或与tnaC基因的W12R突变体互补的NA31,从pY71-T7-GFP质粒13PCR扩增T7启动子和gfp编码序列。独立地,使用正向引物NA32(用于wt)或NA33(用于W12R突变体)和共用反向引物NA34,从质粒pGF2500-tnaC-wt或pGF2500-tnaC-mut14 PCR扩增具有3’非翻译区的wt或突变体tnaC基因的3’链段。
对应于wt或突变体gfp-tnaC构建体的两个PCR产物以400pg/μl(最终浓度)组合在一起,并使用T7和TnaC(rev)引物重新扩增。
gfp-tnaC模板的体外翻译在PURExpress、ΔRibosome、ΔtRNA、Δ氨基酸无细胞翻译系统中进行,该系统由纯化的成分(New England Biolabs)组成,如15所述,稍作修改。反应物补充了19种氨基酸的混合物(最终浓度:每种氨基酸0.3mM)和最终浓度为50μM的L-色氨酸(用于低色氨酸条件下的反应)或5mM的色氨酸(用于高色氨酸条件)。加入PCR生成的DNA模板到最终浓度为5ng/μl。在读板器(TECAN Infinite M200 Pro)中,在具有黑壁和透明底部的384孔板(Falcon)中,在37℃下进行反应3小时,总体积为5μl。随着时间的推移监测GFP荧光(485nm激发,520nm发射,应用增益调节函数的最佳增益30%RFU)。
6.PTC突变体文库的制备
通过将来自pT7rrnB文库16的单个突变转移到poRbs质粒中的23S rRNA基因中,生成了PTC突变体文库。
为了制备质粒骨架,用SgsI和Bst1107I限制酶消化poRbs质粒,从23S rRNA基因中切除1546nt的片段。通过琼脂糖凝胶电泳分离反应产物,并依次使用Zymoclean凝胶DNA回收试剂盒(Zymo Research)和DNA纯化和浓缩试剂盒(Zymo Research)从凝胶中纯化7483bp骨架片段。
为了产生携带PTC突变的1606-bp插入物,将pT7rrnB质粒文库的单个质粒用作PCR反应的模板,所述PCR反应由Q5高保真DNA聚合酶(New England Biolabs)催化并使用引物NA35和NA36。使用DNA纯化和浓缩试剂盒(Zymo Research)纯化PCR产物。
将质粒骨架(35ng)和DNA插入物(60ng)混合在总体积为5μl的吉布森组装反应物中,并在50℃下孵育1小时。
单独的吉布森组装反应用于转化化学感受态POP2136细胞。高通量转化在具有低蒸发透明盖的平底组织培养96孔板(Falcon)中进行。在板的每个孔中,将20μl感受态细胞与2μl单独的吉布森组装反应物混合。将板在冰上孵育30分钟,在42℃下孵育50秒,然后再在冰上孵育15分钟。每孔加入100μl SOC培养基,在摇床上使细胞在30℃复苏2小时。通过在吊桶式转头中以6000g离心板6分钟并去除80μl上清液,将培养体积减少到40μl。然后使用多道移液器将6μl每种剩余细胞悬液点涂在补充有50μg/ml Kan的LB/琼脂矩形OmniTray单孔板(Nunc)上。将板在30℃下孵育20小时。
将单个菌落接种在补充有50μg/ml Kan的新鲜LB培养基中,并在30℃下生长12小时。分离质粒,通过毛细管测序确认PCR扩增的23S rRNA链段中是否存在所需突变,以及不存在脱靶突变。
然后将单个PTC突变体文库质粒引入OSYRIS细胞,方法是使用上述高通量转化方法将它们转化到SQ171 FG/pRibo-Tt/poGFP-TnaC细胞中,所述转化方法具有以下修改:i)转化使用20ng纯化的单个质粒;ii)转化体在SOC培养基中在37℃复苏6小时,并涂板到补充有50μg/ml Amp、25μg/ml Kan、25μg/ml Spc和15μg/ml Chl的LB/琼脂板上;iii)将板在37℃下孵育48小时;iv)在96孔板中由转化体的单个菌落生长的培养物制备甘油储备物。
7.PTC文库筛选
将携带PTC文库突变体的OSYRIS细胞的单个菌落接种到含有120μl LB培养基的96孔板的孔中,所述培养基补充有50μg/ml Amp、25μg/ml Kan、25μg/ml Spc和15μg/ml Chl,在37℃持续摇动下生长24小时。将培养物在120μl补充有相同抗生素、0.35mg/ml 1-甲基-色氨酸(Sigma)和0.016ng/ml HSL的新鲜LB中按1:40(v/v)稀释。将板放入TECAN InfiniteM200 Pro读板器中,并在37℃下以恒定线性(3mm)摇动孵育。如上所述监测培养物的光密度(A600)和oGFP荧光。
通过将携带GFP-TnaC(W12R)突变体构建体的OSYRIS细胞中的GFP表达效率与携带wt GFP-TnaC构建体的OSYRIS细胞中的GFP表达效率相比较来计算终止阻滞旁路分数。使用下式根据在48小时时间点获得的读数计算停滞旁路(SB)分数:
Figure BDA0003941050290000611
其中RFU是相对荧光单位。
使用在两个独立实验中获得的数据计算平均SB分数值。
8.从OSYRIS细胞中分离50S核糖体亚基
根据由Ohashi等描述的方案17,从OSYRIS细胞中分离核糖体。具体而言,在37℃下,将表达在23S rRNA中具有突变U2500G、A2060C或A2450U的核糖体的OSYRIS细胞在补充有50μg/ml Amp、25μg/ml Kan、25μg/ml Spc和15μg/ml Chl的LB培养基中培养过夜。将培养物稀释到到补充有相同抗生素的1L新鲜LB培养基中至最终的A600=0.003,并在剧烈摇动下生长约15小时,直到光密度达到A600=0.35。通过以5000g(4℃)离心15分钟收集细胞,将细胞沉淀物在液氮中快速冷冻并储存在-80℃。将冷冻细胞沉淀物重悬于20ml裂解缓冲液(10mMHEPES-KOH,pH 7.6,50mM KCl,10mM Mg(OAc)2,7mMβ-巯基乙醇)中,在EmulsiFlex-C3匀浆器(AVESTIN Inc.)中在15000psi下裂解5分钟,然后通过以20000g(4℃)离心30分钟来澄清裂解物并转移到新的离心管中。添加硫酸铵至最终浓度为1.5M,并将试管以20000g(4℃)离心1小时。通过0.22-μm
Figure BDA0003941050290000612
聚醚砜(PES)膜过滤器(CELLTREAT Scientific Products)过滤含有核糖体(Ribo-T+可解离核糖体)的上清液。使用5ml HiTrap Butyl FF柱(GEHealthcare Life Sciences)在AKTApurifier UPC 10(GE Healthcare)上通过疏水层析纯化核糖体材料,该柱用20mM HEPES-KOH、pH 7.6、10mM Mg(OAc)2、7mMβ-巯基乙醇、1.5M(NH4)2SO4平衡。加载材料后,用20mM HEPES-KOH、pH 7.6、10mM Mg(OAc)2、7mMβ-巯基乙醇、1.2M(NH4)2SO4洗涤柱子,然后用含有20mM HEPES-KOH、pH 7.6、10mM Mg(OAc)2、7mMβ-巯基乙醇、0.75M(NH4)2SO4的缓冲液洗脱核糖体。将含有核糖体的洗脱级分汇集在一起并加载到在35毫升离心管中在缓冲液20mM HEPES-KOH、pH 7.6、10mM Mg(OAc)2、30mM NH4Cl、7mMβ-巯基乙醇中制备的16ml 30%蔗糖垫层上。在Type 70Ti转子(Beckman)中,通过在4℃下以36000rpm离心18小时使核糖体沉淀。将核糖体沉淀物重新悬浮在解离/储存缓冲液(20mMHEPES-KOH pH 7.6、30mM KCl、1.5mM Mg(OAc)2、7mMβ-巯基乙醇)中,将整分试样快速冷冻并储存在-80℃。
为了分离单个50S核糖体亚基,将核糖体制备物加载到在用于SW41转子(Beckman)的离心管中在缓冲液20mM Tris-HCl、pH 7.5、1.5mM Mg(OAc)2、100mM NH4Cl、2mMβ-巯基乙醇中制备的10-40%蔗糖梯度上。将梯度在4℃下以27000rpm离心16小时,并在梯度分级器(BioComp)上进行分级,并进行A254监测。将对应于大核糖体亚基的级分汇集起来,在带有三乙酸纤维素膜的Vivaspin 2ml浓缩器(Sartorius Stedim Biotech GmbH)上浓缩,并回收在核糖体储存缓冲液中(20mM HEPES-KOH pH 7.6、30mM KCl、6mM Mg(OAc)2、7mMβ-巯基乙醇)。将整分试样快速冷冻并储存在-80℃。
9.分离具有非致死23S rRNA突变的核糖体
从携带具有相应突变的pAM552质粒4的SQ171细胞分离出在23S rRNA中携带非致死突变(A2503G、A2062G、C2611G和C2611U)的核糖体。如前所述制备表达突变体核糖体的纯种群的相应菌株18。如上所述分离核糖体,不同之处在于,蔗糖垫层离心后,将核糖体沉淀重新悬浮在核糖体储存缓冲液(20mM HEPES-KOH pH 7.6、30mM KCl、6mM Mg(OAc)2、7mMβ-巯基乙醇)中。将整分试样快速冷冻并储存在-80℃。
10.趾纹分析
引物延伸抑制(趾纹(toeprinting))分析19如前所述20进行。需要时,向反应物中添加脯氨酰-tRNA合成酶抑制剂5’-O-[N-(L-脯氨酰)-氨磺酰]腺苷(L-PSA)21,至最终浓度为50μM。在测序凝胶中分离引物延伸产物并磷屏成像后,使用ImageJ软件12确定趾纹条带的强度。通过将终止密码子趾纹条带(SB)的强度(图16c中的箭头)与含L-PSA的样品(PB)中前一密码子处的趾纹条带强度(图16c中的空心箭头)进行比较,使用下式计算在tnaC终止密码子处TnaC-诱导的翻译阻滞的效率:
Figure BDA0003941050290000631
其中SBBG和PBBG是相应条带的背景。
11.结构分析和图形准备
为了计算23S rRNA核苷酸与A位点氨基酸的攻击α-氨基的距离,将在攻击前状态具有P位点和A位点tRNA的嗜热栖热菌(Thermus thermophilus)核糖体的晶体结构(PDB1VY4)22与部分旋转的空缺大肠杆菌核糖体的高分辨率结构(PDB 4YBB)23基于全长23SrRNA进行比对。距离测量和图形渲染在PyMOL(Molecular Graphics System,Version 2.0
Figure BDA0003941050290000632
LLC.)中进行。图4g是通过用P位点中的TnaC-tRNA停滞的大肠杆菌核糖体的冷冻电镜结构(PDB 4UY8)24与复合有RF2的嗜热栖热菌核糖体的晶体结构(PDB4V67)25比对得到的。
12.统计分析
在相关的地方,统计值可以在图形图例中找到。所述值的平均值定义为算术平均值。根据独立生物学重复的数目(n),偏差范围代表标准差(s.d.)(n≥3)或实验误差(n=2)。使用Microsoft Excel 365软件计算所有统计值并绘制所有图表。学生t检验使用适用于Windows的GraphPad Prism 8.00版(GraphPad Software,La Jolla California USA)进行。
材料和方法部分的参考文献
1 Gibson,D.G.等Enzymatic assembly of DNA molecules up to severalhundred kilobases.Nat Methods 6,343-345(2009)。
2 Kusters,J.G.,Jager,E.J.&van der Zeijst,B.A.Improvement of thecloning linker of the bacterial expression vector pEX.Nucleic Acids Res 17,8007(1989)。
3 Carlson,E.D.等Engineered ribosomes with tethered subunits forexpanding biological function.Nat Commun 10,3920(2019)。
4 Orelle,C.等Protein synthesis by ribosomes with tetheredsubunits.Nature 524,119-124(2015)。
5 Datsenko,K.A.&Wanner,B.L.One-step inactivation of chromosomal genesin Escherichia coli K-12 using PCR products.Proc Natl Acad Sci USA 97,6640-6645(2000)。
6 Zaporojets,D.,French,S.&Squires,C.L.Products transcribed fromrearranged rrn genes of Escherichia coli can assemble to form functionalribosomes.J Bacteriol 185,6921-6927(2003)。
7 Canton,B.,Labno,A.&Endy,D.Refinement and standardization ofsynthetic biological parts and devices.Nat Biotechnol 26,787-793(2008)。
8 Davis,J.H.等Modular assembly of the bacterial large ribosomalsubunit.Cell 167,1610-1622(2016)。
9 Monk,J.W.等Rapid and inexpensive evaluation of nonstandard aminoacid incorporation in Escherichia coli.ACS Synth Biol 6,45-54(2017)。
10 Quan,S.,Skovgaard,O.,McLaughlin,R.E.,Buurman,E.T.&Squires,C.L.Markerless Escherichia coli rrn deletion strains for geneticdetermination of ribosomal binding sites.G3 5,2555-2557(2015)。
11 Thomason,L.C.,Costantino,N.&Court,D.L.E.coli genome manipulationby P1 transduction.Curr Protoc Mol Biol/edited by Frederick M.Ausubel...[etal.]Chapter 1,Unit 1 17(2007)。
12 Schneider,C.A.,Rasband,W.S.&Eliceiri,K.W.NIH Image to ImageJ:25years of image analysis.Nat Methods 9,671-675(2012)。
13 Bundy,B.C.&Swartz,J.R.Site-specific incorporation of p-propargyloxyphenylalanine in a cell-free environment for direct protein-protein click conjugation.Bioconjug Chem 21,255-263(2010)。
14 Gong,F.&Yanofsky,C.Reproducing tna operon regulation in vitro inan S-30system.Tryptophan induction inhibits cleavage of TnaC peptidyl-tRNA.JBiol Chem 276,1974-1983(2001)。
15 Martinez,A.K.等Interactions of the TnaC nascent peptide with rRNAin the exit tunnel enable the ribosome to respond to free tryptophan.NucleicAcids Res 42,1245-1256,doi:10.1093/nar/gkt923(2014)。
16 d’Aquino,A.E.,Azim,T.,Aleksashin,N.A.,Hockenberry,A.H.,Jewett,M.C.Mutating the ribosomal peptidyl transferase center in vitro.Nucleic AcidsRes.,in press(2020)。
17 Ohashi,H.,Shimizu,Y.,Ying,B.W.&Ueda,T.Efficient protein selectionbased on ribosome display system with purified components.Biochem Biophys ResCommun 352,270-276(2007)。
18 Vazquez-Laslop,N.,Thum,C.&Mankin,A.S.Molecular mechanism of drug-dependent ribosome stalling.Mol Cell 30,190-202(2008)。
19 Hartz,D.,McPheeters,D.S.,Traut,R.&Gold,L.Extension inhibitionanalysis of translation initiation complexes.Methods Enzymol 164,419-425(1988)。
20 Orelle,C.等Identifying the targets of aminoacyl-tRNA synthetaseinhibitors by primer extension inhibition.Nucleic Acids Res 41,e144(2013)。
21 Heacock,D.,Forsyth,C.J.,Shiba,K.&MusierForsyth,K.Synthesis andaminoacyl-tRNA synthetase inhibitory activity of prolyl adenylateanalogs.Bioorg Chem 24,273-289(1996)。
22 Polikanov,Y.S.,Steitz,T.A.&Innis,C.A.A proton wire to coupleaminoacyl-tRNA accommodation and peptide-bond formation on the ribosome.NatStruct Mol Biol 21,787-793(2014)。
23 Noeske,J.等High-resolution structure of the Escherichia coliribosome.Nat Struct Mol Biol 22,336-341(2015)。
24 Bischoff,L.,Berninghausen,O.&Beckmann,R.Molecular basis for theribosome functioning as an L-tryptophan sensor.Cell Rep 9,469-475(2014)。
25 Korostelev,A.等Crystal structure of a translation terminationcomplex formed with release factor RF2.Proc Natl Acad Sci USA 105,19684-19689(2008)。
26 Keseler,I.M.等The EcoCyc database:reflecting new knowledge aboutEscherichia coli K-12.Nucleic Acids Res 45,D543-D550(2017)。
27 Sato,N.S.,Hirabayashi,N.,Agmon,I.,Yonath,A.&Suzuki,T.Comprehensivegenetic selection revealed essential bases in the peptidyl-transferasecenter.Proc Natl Acad Sci USA 103,15386-15391(2006)。
28 Gong,F.&Yanofsky,C.Instruction of translating ribosome by nascentpeptide.Science 297,1864-1867(2002)。
29 Cruz-Vera,L.R.,Rajagopal,S.,Squires,C.&Yanofsky,C.Features ofribosome-peptidyl-tRNA interactions essential for tryptophan induction of tnaoperon expression.Mol Cell 19,333-343(2005)。
30 Vazquez-Laslop,N.,Ramu,H.,Klepacki,D.,Kannan,K.,Mankin,A.S.The keyrole of a conserved and modified rRNA residue in the ribosomal response tothe nascent peptide.EMBO J.29,3108-3117(2010)
31 Yanisch-Perron,C.,Vieira,J.&Messing,J.Improved M13phage cloningvectors and host strains:nucleotide sequences of the M13mp18 and pUC19vectors.Gene 33,103-119(1985)。
33 Gibson,D.G.等Enzymatic assembly of DNA molecules up to severalhundred kilobases.Nat.Methods 6,343-345(2009)。
34 Kusters,J.G.,Jager,E.J.&van der Zeijst,B.A.Improvement of thecloning linker of the bacterial expression vector pEX.Nucleic Acids Res.17,8007(1989)。
35 Datsenko,K.A.&Wanner,B.L.One-step inactivation of chromosomalgenes in Escherichia coli K-12using PCR products.Proc.Nat.l Acad.Sci.USA 97,6640-6645(2000)。
36 Zaporojets,D.,French,S.&Squires,C.L.Products transcribed fromrearranged rrn genes of Escherichia coli can assemble to form functionalribosomes.J.Bacteriol.185,6921-6927(2003)。
37 Canton,B.,Labno,A.&Endy,D.Refinement and standardization ofsynthetic biological parts and devices.Nat.Biotechnol.26,787-793(2008)。
38.Davis,J.H.等Modular assembly of the bacterial large ribosomalsubunit.Cell 167,1610-1622(2016)
39 Monk,J.W.等Rapid and inexpensive evaluation of nonstandard aminoacid incorporation in Escherichia coli.ACS Synth.Bio.l 6,45-54(2017)。
40 Thomason,L.C.,Costantino,N.&Court,D.L.E.coli genome manipulationby P1 transduction.Curr.Protoc.Mol.Biol./edited by Frederick M.Ausubel...[etal.]Chapter 1,Unit 1 17(2007)。
41 Schneider,C.A.,Rasband,W.S.&Eliceiri,K.W.NIH Image to ImageJ:25years of image analysis.Nat.Methods 9,671-675(2012)。
42 Bundy,B.C.&Swartz,J.R.Site-specific incorporation of p-propargyloxyphenylalanine in a cell-free environment for direct protein-protein click conjugation.Bioconjug.Chem.21,255-263(2010)。
43 Gong,F.&Yanofsky,C.Reproducing tna operon regulation in vitro inan S-30 system.Tryptophan induction inhibits cleavage of TnaC peptidyl-tRNA.J.Biol.Chem.276,1974-1983(2001)。
44 d’Aquino,A.E.,Azim,T.,Aleksashin,N.A.,Hockenberry,A.H.,Jewett,M.C.Mutational characterization and mapping of the 70S ribosome activesite.Nucleic Acids Res 48,2777-2789(2020)。
45 Ohashi,H.,Shimizu,Y.,Ying,B.W.&Ueda,T.Efficient protein selectionbased on ribosome display system with purified components.Bioch.Biophys.Res.Commun.352,270-276(2007)。
46 Vazquez-Laslop,N.,Thum,C.&Mankin,A.S.Molecular mechanism of drug-dependent ribosome stalling.Mol.Cell 30,190-202(2008)。
47 Hartz,D.,McPheeters,D.S.,Traut,R.&Gold,L.Extension inhibitionanalysis of translation initiation complexes.Methods Enzymol.164,419-425(1988)。
48 Orelle,C.等Identifying the targets of aminoacyl-tRNA synthetaseinhibitors by primer extension inhibition.Nucleic Acids Res.41,e144(2013)。
49 Heacock,D.,Forsyth,C.J.,Shiba,K.&MusierForsyth,K.Synthesis andaminoacyl-tRNA synthetase inhibitory activity of prolyl adenylateanalogs.Bioorg.Chem.24,273-289(1996)。
50 Noeske,J.等High-resolution structure of the Escherichia coli ribosome.Nat.Struct.Molec.Biol.22,336-341(2015)。
51 Korostelev,A.等Crystal structure of a translation terminationcomplex formed with release factor RF2.Proc.Natl.Acad.Sci.USA 105,19684-19689(2008)。
另外的参考文献
Rackham,O.;Chin,J.W.,Compositions and methods relating to orthogonalribosome mRNA pairs.US 11/982,877:申请日2007年11月6日。
Chin,J.;Wang,K.;Neumann,H.,Orthogonal Q-Ribosomes.US 13/517,372:申请日2010年12月20日。
Chin,J.;Wang,K.;Neumann,H.,Evolved orthogonal ribosomes.US 12/516,230:申请日2007年11月28日。
E.实施例1的“翻转”正交翻译系统的应用和优点
1.应用
作为示例但不作为限制,本文公开的组合物和方法的应用包括但不限于:核糖体进化/改造(例如目标是更有效的非经典氨基酸掺入);用于非经典氨基酸掺入的扩展遗传密码;使抗生素耐药机制的详细体内研究能够进行,使抗生素开发过程能够进行;生物制药生产;细胞中的正交回路;合成生物学;通过结合天然(或野生型)核糖体合成的肽或其翻译后修饰的衍生物无法获得的新功能来生产工程化肽;生产可以改变药物化学的新型蛋白酶抗性肽;允许在细胞中开发工程化核糖体。
2.优点
作为示例,但不作为限制,本文公开的组合物和方法的优点包括但不限于以下。
Ribo-T的不寻常设计限制了其作为正交翻译系统(oRiboT)的功能。具体来说,Ribo-T翻译蛋白质的速度仅为可解离核糖体的一半。与wt核糖体相比,它离开起始密码子的速度较慢。此外,即使是“wt”Ribo-T的生物发生也相当缓慢且效率低,如果核糖体的功能中心受到额外的改变,组装问题可能会进一步加剧。
为了克服最初的基于oRibo-T的方法在改造具有两个功能独立的翻译机器的细胞中的缺点,我们现在创建了一个概念上新颖的体内系统设计,该系统利用可解离但完全分离的核糖体,致力于只翻译专门的mRNA。通过“翻转”Ribo-T和可解离核糖体的作用,我们改造了细菌细胞,其中蛋白质组的翻译由Ribo-T进行,而由可解离的正交30S(o-30S)亚基和wt 50S亚基组成的核糖体用作完全正交的翻译机器。在由此产生的设置中,我们将其命名为OSYRIS(基于具有分离亚基的核糖体的正交翻译系统),实现了完全正交性,因为Ribo-T的系连性质使其无法与可解离核糖体的o-30S或50S缔合。因此,在OSYRIS细胞中,物理上未连接的o-30S和50S核糖体亚基仍然被迫相互作用并作为完全正交的核糖体(o-核糖体)发挥作用。因此,不仅o-30S,而且游离的50S亚基都可以被改造以实现新的功能,而不会干扰细胞蛋白质组的表达。
当并排比较OSYRIS细胞时,由可解离的正交核糖体(oRbs)或正交系连式核糖体(oRibo-T)驱动在同一宿主(大肠杆菌BL21)中表达两个正交报道基因(o-gfp和新改造的o-luc)。值得注意的是,尽管oRibo-T从高拷贝数载体表达而oRbs从低拷贝数质粒转录,但oRbs的表现优于oRibo-T。这一结果清楚地证明了oRbs在翻译正交mRNA方面优于oRibo-T,并巩固了OSYRIS设计优于基于oRibo-T设计的概念。
核糖体改造在生物技术、化学和材料科学领域具有极大的利益,但以前的方法无法进化出包含催化活性位点和蛋白质泌出通道的核糖体大亚基。系连式核糖体的开发消除了这些限制并扩大了核糖体改造的可能性。可以对核糖体进行改造,掺入非天然氨基酸以扩展蛋白质功能或进行新的化学反应以生产非蛋白质聚合物。
本发明详细介绍了第一个正交核糖体-mRNA系统,其中mRNA解码、多肽合成催化和蛋白质泌出都可以针对新的底物和功能进行优化。与现有技术的主要区别在于,不仅小(解码性)核糖体亚基,而且大(催化性)核糖体亚基作为单一的、组合的和不可分割的正交基因合成机器发挥作用。
此外,这是独一无二的,因为系连式核糖体保持细胞存活,而可自由解离的核糖体用于改造。
我们强调,本发明是同类发明中的首创。我们预计,这里报道的创新将有助于激发更大的核糖体构建和改造尝试,以突破工程生物系统的极限,在目前超出相邻可能的研究领域开辟新的商业机会。
在前面的描述中,本领域技术人员将很容易明白,在不背离本发明的范围和精神的情况下,可以对本文公开的发明进行各种替换和修改。本文中示例性描述的本发明可以适当地在没有本文未具体公开的任何一个或多个要素、一个或多个限制的情况下实施。已使用的术语和表达被用作描述而非限制,并且在使用这些术语和表达时无意排除所示和描述的特征或其部分的任何等同物,而是应该认识到可以在本发明的范围内进行各种修改。因此,应当理解,尽管本发明已经通过特定实施方案和可选特征进行了说明,但是本领域技术人员可以对本文公开的概念进行修改和/或变化,并且这样的修改和变化被认为是在本发明的范围内。
本文引用了许多专利和非专利参考文献。引用的参考文献通过引用整体并入本文。如果本说明书中的术语定义与引用的参考文献中的术语定义不一致,则应根据本说明书中的定义来解释该术语。
序列表
<110>  西北大学(Northwestern University)
伊利诺伊大学董事会(The Board of Trustees of the University of Illinois)
Jewett, Michael C.
Aleksashin, Nikolay
Mankin, Alexander S.
<120>  用于细菌细胞中蛋白质合成的完全正交系统
<130>  702581.01926
<150>  62/993,860
<151>  2020-03-24
<160>  61
<170>  PatentIn version 3.5
<210>  1
<211>  8188
<212>  DNA
<213>  人工序列
<220>
<223>  合成的-质粒
<400>  1
gcggccgcga tctctcacct accaaacaat gcccccctgc aaaaaataaa ttcatataaa      60
aaacatacag ataaccatct gcggtgataa attatctctg gcggtgttga cataaatacc     120
actggcggtg atactgagca cgggtaccgg ccgctgagaa aaagcgaagc ggcactgctc     180
tttaacaatt tatcagacaa tctgtgtggg cactcgaaga tacggattct taacgtcgca     240
agacgaaaaa tgaataccaa gtctcaagag tgaacacgta attcattacg aagtttaatt     300
ctttgagcgt caaactttta aattgaagag tttgatcatg gctcagattg aacgctggcg     360
gcaggcctaa cacatgcaag tcgaacggta acaggaagaa gcttgcttct ttgctgacga     420
gtggcggacg ggtgagtaat gtctgggaaa ctgcctgatg gagggggata actactggaa     480
acggtagcta ataccgcata acgtcgcaag accaaagagg gggaccttcg ggcctcttgc     540
catcggatgt gcccagatgg gattagctag taggtggggt aacggctcac ctaggcgacg     600
atccctagct ggtctgagag gatgaccagc cacactggaa ctgagacacg gtccagactc     660
ctacgggagg cagcagtggg gaatattgca caatgggcgc aagcctgatg cagccatgcc     720
gcgtgtatga agaaggcctt cgggttgtaa agtactttca gcggggagga agggagtaaa     780
gttaatacct ttgctcattg acgttacccg cagaagaagc accggctaac tccgtgccag     840
cagccgcggt aatacggagg gtgcaagcgt taatcggaat tactgggcgt aaagcgcacg     900
caggcggttt gttaagtcag atgtgaaatc cccgggctca acctgggaac tgcatctgat     960
actggcaagc ttgagtctcg tagagggggg tagaattcca ggtgtagcgg tgaaatgcgt    1020
agagatctgg aggaataccg gtggcgaagg cggccccctg gacgaagact gacgctcagg    1080
tgcgaaagcg tggggagcaa acaggattag ataccctggt agtccacgcc gtaaacgatg    1140
tcgacttgga ggttgtgccc ttgaggcgtg gcttccggag ctaacgcgtt aagtcgaccg    1200
cctggggagt acggccgcaa ggttaaaact caaatgaatt gacgggggcc cgcacaagcg    1260
gtggagcatg tggtttaatt cgatgcaacg cgaagaacct tacctggtct tgacatccac    1320
ggaagttttc agagatgaga atgtgccttc gggaaccgtg agacaggtgc tgcatggctg    1380
tcgtcagctc gtgttgtgaa atgttgggtt aagtcccgca acgagcgcaa cccttatcct    1440
ttgttgccag cggtccggcc gggaactcaa aggagactgc cagtgataaa ctggaggaag    1500
gtggggatga cgtcaagtca tcatggccct tacgaccagg gctacacacg tgctacaatg    1560
gcgcatacaa agagaagcga cctcgcgaga gcaagcggac ctcataaagt gcgtcgtagt    1620
ccggattgga gtctgcaact cgactccatg aagtcggaat cgctagtaat cgtggatcag    1680
aatgccacgg tgaatacgtt cccgggcctt gtacacaccg cccgtcacac catgggagtg    1740
ggttgcaaaa gaagtaggta gcttaaccca atgaacaatt ggatgcgttg agctaaccgg    1800
tactaatgaa ccgtgaggct taaccgagag gttaagcgac taagcgtaca cggtggatgc    1860
cctggcagtc agaggcgatg aaggacgtgc taatctgcga taagcgtcgg taaggtgata    1920
tgaaccgtta taaccggcga tttccgaatg gggaaaccca gtgtgtttcg acacactatc    1980
attaactgaa tccataggtt aatgaggcga accgggggaa ctgaaacatc taagtacccc    2040
gaggaaaaga aatcaaccga gattccccca gtagcggcga gcgaacgggg agcagcccag    2100
agcctgaatc agtgtgtgtg ttagtggaag cgtctggaaa ggcgcgcgat acagggtgac    2160
agccccgtac acaaaaatgc acatgctgtg agctcgatga gtagggcggg acacgtggta    2220
tcctgtctga atatgggggg accatcctcc aaggctaaat actcctgact gaccgatagt    2280
gaaccagtac cgtgagggaa aggcgaaaag aaccccggcg aggggagtga aaaagaacct    2340
gaaaccgtgt acgtacaagc agtgggagca cgcttaggcg tgtgactgcg taccttttgt    2400
ataatgggtc agcgacttat attctgtagc aaggttaacc gaatagggga gccgaaggga    2460
aaccgagtct taactgggcg ttaagttgca gggtatagac ccgaaacccg gtgatctagc    2520
catgggcagg ttgaaggttg ggtaacacta actggaggac cgaaccgact aatgttgaaa    2580
aattagcgga tgacttgtgg ctgggggtga aaggccaatc aaaccgggag atagctggtt    2640
ctccccgaaa gctatttagg tagcgcctcg tgaattcatc tccgggggta gagcactgtt    2700
tcggcaaggg ggtcatcccg acttaccaac ccgatgcaaa ctgcgaatac cggagaatgt    2760
tatcacggga gacacacggc gggtgctaac gtccgtcgtg aagagggaaa caacccagac    2820
cgccagctaa ggtcccaaag tcatggttaa gtgggaaacg atgtgggaag gcccagacag    2880
ccaggatgtt ggcttagaag cagccatcat ttaaagaaag cgtaatagct cactggtcga    2940
gtcggcctgc gcggaagatg taacggggct aaaccatgca ccgaagctgc ggcagcgacg    3000
cttatgcgtt gttgggtagg ggagcgttct gtaagcctgc gaaggtgtgc tgtgaggcat    3060
gctggaggta tcagaagtgc gaatgctgac ataagtaacg ataaagcggg tgaaaagccc    3120
gctcgccgga agaccaaggg ttcctgtcca acgttaatcg gggcagggtg agtcgacccc    3180
taaggcgagg ccgaaaggcg tagtcgatgg gaaacaggtt aatattcctg tacttggtgt    3240
tactgcgaag gggggacgga gaaggctatg ttggccgggc gacggttgtc ccggtttaag    3300
cgtgtaggct ggttttccag gcaaatccgg aaaatcaagg ctgaggcgtg atgacgaggc    3360
actacggtgc tgaagcaaca aatgccctgc ttccaggaaa agcctctaag catcaggtaa    3420
catcaaatcg taccccaaac cgacacaggt ggtcaggtag agaataccaa ggcgcttgag    3480
agaactcggg tgaaggaact aggcaaaatg gtgccgtaac ttcgggagaa ggcacgctga    3540
tatgtaggtg aggtccctcg cggatggagc tgaaatcagt cgaagatacc agctggctgc    3600
aactgtttat taaaaacaca gcactgtgca aacacgaaag tggacgtata cggtgtgacg    3660
cctgcccggt gccggaaggt taattgatgg ggttagcgca agcgaagctc ttgatcgaag    3720
ccccggtaaa cggcggccgt aactataacg gtcctaaggt agcgaaattc cttgtcgggt    3780
aagttccgac ctgcacgaat ggcgtaatga tggccaggct gtctccaccc gagactcagt    3840
gaaattgaac tcgctgtgaa gatgcagtgt acccgcggca agacgggaag accccgtgaa    3900
cctttactat agcttgacac tgaacattga gccttgatgt gtaggatagg tgggaggctt    3960
tgaagtgtgg acgccagtct gcatggagcc gaccttgaaa taccaccctt taatgtttga    4020
tgttctaacg ttgacccgta atccgggttg cggacagtgt ctggtgggta gtttgactgg    4080
ggcggtctcc tcctaaagag taacggagga gcacgaaggt tggctaatcc tggtcggaca    4140
tcaggaggtt agtgcaatgg cataagccag cttgactgcg agcgtgacgg cgcgagcagg    4200
tgcgaaagca ggtcatagtg atccggtggt tctgaatgga agggccatcg ctcaacggat    4260
aaaaggtact ccggggataa caggctgata ccgcccaaga gttcatatcg acggcggtgt    4320
ttggcacctc gatgtcggct catcacatcc tggggctgaa gtaggtccca agggtatggc    4380
tgttcgccat ttaaagtggt acgcgagctg ggtttagaac gtcgtgagac agttcggtcc    4440
ctatctgccg tgggcgctgg agaactgagg ggggctgctc ctagtacgag aggaccggag    4500
tggacgcatc actggtgttc gggttgtcat gccaatggca ctgcccggta gctaaatgcg    4560
gaagagataa gtgctgaaag catctaagca cgaaacttgc cccgagatga gttctccctg    4620
accctttaag ggtcctgaag gaacgttgaa gacgacgacg ttgataggcc gggtgtgtaa    4680
gcgcagataa ctagtggagg gcgcttacca ctttgtgatt catgactggg gtgaagtcgt    4740
aacaaggtaa ccgtagggga acctgcggtt ggatcacctc cttaccttaa agaagcgtac    4800
tttgtagtgc tcacacagat tgtctgatag aaagtgaaaa gcaaggcgtt tacgcgttgg    4860
gagtgaggct gaagagaata aggccgttcg ctttctatta atgaaagctc accctacacg    4920
aaaatatcac gcaacgcgtg ataagcaatt ttcgtgtccc cttcgtctag aggcccagga    4980
caccgccctt tcacggcggt aacaggggtt cgaatcccct aggggacgcc acttgctggt    5040
ttgtgagtga aagtcgccga ccttaatatc tcaaaactca tcttcgggtg atgtttgaga    5100
tatttgctct ttaaaaatct ggatcaagct gaaaattgaa acactgaaca acgagagttg    5160
ttcgtgagtc tctcaaattt tcgcaacacg atgatgaatc gaaagaaaca tcttcgggtt    5220
gtgagcttaa gcttacaacg ccgaagctgt tttggcggat gagagaagat tttcagcctg    5280
atacagatta aatcagaacg cagaagcggt ctgataaaac agaatttgcc tggcggcagt    5340
agcgcggtgg tcccacctga ccccatgccg aactcagaag tgaaacgccg tagcgccgat    5400
ggtagtgtgg ggtctcccca tgcgagagta gggaactgcc aggcatcaaa taaaacgaaa    5460
ggctcagtcg aaagactggg cctttcgttt tatctgttgt ttgtcggtga acgctctcct    5520
gagtaggaca aatccgccgg gagcggattt gaacgttgcg aagcaacggc ccggagggtg    5580
gcgggcagga cgcccgccat aaactgccag gcatcaaatt aagcagaagg ccatcctgac    5640
ggatggcctt tttgcgtttc tacaaactct tcctgtcgtc atatctacaa gccggctttc    5700
ctttccatca aaaaaatatt gatgaaatga gctgttgaca attaatcatc ggctcgtata    5760
atgtgtggaa ttgtcacaca ggaaacagaa ttcccgggga tctgggggat catcgatggt    5820
tgtaaaagaa ttcggtggag cggtagttca gtcggttaga atacctgcct gtcacgcagg    5880
gggtcgcggg ttcgagtccc gtccgttccg ccaccctaat taggggcgta gttcaattgg    5940
tagagcaccg gtctccaaaa ccgggtgttg ggagttcgag tctctccgcc cctgccagaa    6000
atcatccttg tcgatgggag cagtaaaacc tctacaggct tgtagctcag gtggttagag    6060
cgcacccctg ataagggtga ggtcggtggt tcaagtccac tcaggcctac caaatttgca    6120
cggcaaattt gaagaggttt taactacatg ttatggggct atagctcagc tgggagagcg    6180
cctgctttgc acgcaggagg tctgcggttc gatcccgcat agctccacca tctctgtagt    6240
gattaagagc gtgataagca attttcgtgt ccccttcgtc tagaggccca ggacaccgcc    6300
ctttcacggc ggtaacaggg gttcgaatcc cctaggggac gccactctag gaaatccgcc    6360
ataaaacaaa aggctcagtc ggaagactgg gccttttgtt ttacgcgccg ggaaatgtgc    6420
gcggaacccc tatttgttta tttttctaaa tacattcaaa tatgtatccg ctcatgagac    6480
aataaccctg ataaatgctt caataatatt gaaaaaggaa gagtatgagt attcaacatt    6540
tccgtgtcgc ccttattccc ttttttgcgg cattttgcct tcctgttttt gctcacccag    6600
aaacgctggt gaaagtaaaa gatgctgaag atcagttggg tgcacgagtg ggttacatcg    6660
aactggatct caacagcggt aagatccttg agagttttcg ccccgaagaa cgttttccaa    6720
tgatgagcac ttttaaagtt ctgctatgtg gcgcggtatt atcccgtgtt gacgccgggc    6780
aagagcaact cggtcgccgc atacactatt ctcagaatga cttggttgag tactcaccag    6840
tcacagaaaa gcatcttacg gatggcatga cagtaagaga attatgcagt gctgcaataa    6900
ccatgagtga taacactgcg gccaacttac ttctgacaac gatcggagga ccgaaggagc    6960
taaccgcttt tttgcacaac atgggggatc atgtaactcg ccttgatcgt tgggaaccgg    7020
agctgaatga agccatacca aacgacgagc gtgacaccac gatgcctgca gcaatggcaa    7080
caacgttgcg caaactatta actggcgaac tacttactct agcttcccgg caacaattaa    7140
tagactggat ggaggcggat aaagttgcag gaccacttct gcgctcggcc cttccggcta    7200
gctggtttat tgctgataaa tctggagccg gtgagcgtgg gtctcgcggt atcattgcag    7260
cactggggcc agatggtaag ccctcccgta tcgtagttat ctacacgacg gggagtcagg    7320
caactatgga tgaacgaaat agacagatcg ctgagatagg tgcctcactg attaagcatt    7380
ggtaactgca gaccaagttt actcatatat actttagatt gatttaaaac ttcattttta    7440
atttaaaagg atctaggtga agatcctttt tgataatctc atgaccaaaa tcccttaacg    7500
tgagttttcg ttccactgag cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga    7560
tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt    7620
ggtttgtttg ccggatcaag agctaccaac tctttttccg aaggtaactg gcttcagcag    7680
agcgcagata ccaaatactg tccttctagt gtagccgtag ttaggccacc acttcaagaa    7740
ctctgtagca ccgcctacat acctcgctct gctaatcctg ttaccagtgg ctgctgccag    7800
tggcgataag tcgtgtctta ccgggttgga ctcaagacga tagttaccgg ataaggcgca    7860
gcggtcgggc tgaacggggg gttcgtgcac acagcccagc ttggagcgaa cgacctacac    7920
cgaactgaga tacctacagc gtgagctatg agaaagcgcc acgcttcccg aagggagaaa    7980
ggcggacagg tatccggtaa gcggcagggt cggaacagga gagcgcacga gggagcttcc    8040
agggggaaac gcctggtatc tttatagtcc tgtcgggttt cgccacctct gacttgagcg    8100
tcgatttttg tgatgctcgt caggggggcg gagcctatgg aaaaacgcca gcaacgcggc    8160
ctttttacgg ttcctggcct tttgctgg                                       8188
<210>  2
<211>  9029
<212>  DNA
<213>  人工序列
<220>
<223>  合成的poRbs质粒
<400>  2
gcggccgcga tctctcacct accaaacaat gcccccctgc aaaaaataaa ttcatataaa      60
aaacatacag ataaccatct gcggtgataa attatctctg gcggtgttga cataaatacc     120
actggcggtg atactgagca cgggtaccgg ccgctgagaa aaagcgaagc ggcactgctc     180
tttaacaatt tatcagacaa tctgtgtggg cactcgaaga tacggattct taacgtcgca     240
agacgaaaaa tgaataccaa gtctcaagag tgaacacgta attcattacg aagtttaatt     300
ctttgagcgt caaactttta aattgaagag tttgatcatg gctcagattg aacgctggcg     360
gcaggcctaa cacatgcaag tcgaacggta acaggaagaa gcttgcttct ttgctgacga     420
gtggcggacg ggtgagtaat gtctgggaaa ctgcctgatg gagggggata actactggaa     480
acggtagcta ataccgcata acgtcgcaag accaaagagg gggaccttcg ggcctcttgc     540
catcggatgt gcccagatgg gattagctag taggtggggt aacggctcac ctaggcgacg     600
atccctagct ggtctgagag gatgaccagc cacactggaa ctgagacacg gtccagactc     660
ctacgggagg cagcagtggg gaatattgca caatgggcgc aagcctgatg cagccatgcc     720
gcgtgtatga agaaggcctt cgggttgtaa agtactttca gcggggagga agggagtaaa     780
gttaatacct ttgctcattg acgttacccg cagaagaagc accggctaac tccgtgccag     840
cagccgcggt aatacggagg gtgcaagcgt taatcggaat tactgggcgt aaagcgcacg     900
caggcggttt gttaagtcag atgtgaaatc cccgggctca acctgggaac tgcatctgat     960
actggcaagc ttgagtctcg tagagggggg tagaattcca ggtgtagcgg tgaaatgcgt    1020
agagatctgg aggaataccg gtggcgaagg cggccccctg gacgaagact gacgctcagg    1080
tgcgaaagcg tggggagcaa acaggattag ataccctggt agtccacgcc gtaaacgatg    1140
tcgacttgga ggttgtgccc ttgaggcgtg gcttccggag ctaacgcgtt aagtcgaccg    1200
cctggggagt acggccgcaa ggttaaaact caaatgaatt gacgggggcc cgcacaagcg    1260
gtggagcatg tggtttaatt cgatgcaacg cgaagaacct tacctggtct tgacatccac    1320
ggaagttttc agagatgaga atgtgccttc gggaaccgtg agacaggtgc tgcatggctg    1380
tcgtcagctc gtgttgtgaa atgttgggtt aagtcccgca acgagcgcaa cccttatcct    1440
ttgttgccag cggtccggcc gggaactcaa aggagactgc cagtgataaa ctggaggaag    1500
gtggggatga cgtcaagtca tcatggccct tacgaccagg gctacacacg tgctacaatg    1560
gcgcatacaa agagaagcga cctcgcgaga gcaagcggac ctcataaagt gcgtcgtagt    1620
ccggattgga gtctgcaact cgactccatg aagtcggaat cgctagtaat cgtggatcag    1680
aatgccacgg tgaatacgtt cccgggcctt gtacacaccg cccgtcacac catgggagtg    1740
ggttgcaaaa gaagtaggta gcttaacctt cgggagggcg cttaccactt tgtgattcat    1800
gactggggtg aagtcgtaac aaggtaaccg taggggaacc tgcggttgga tcacctcctt    1860
accttaaaga agcgtacttt gtagtgctca cacagattgt ctgatagaaa gtgaaaagca    1920
aggcgtttac gcgttgggag tgaggctgaa gagaataagg ccgttcgctt tctattaatg    1980
aaagctcacc ctacacgaaa atatcacgca acgcgtgata agcaattttc gtgtcccctt    2040
cgtctagagg cccaggacac cgccctttca cggcggtaac aggggttcga atcccctagg    2100
ggacgccact tgctggtttg tgagtgaaag tcgccgacct taatatctca aaactcatct    2160
tcgggtgatg tttgagatat ttgctcttta aaaatctgga tcaagctgaa aattgaaaca    2220
ctgaacaacg agagttgttc gtgagtctct caaattttcg caacacgatg atgaatcgaa    2280
agaaacatct tcgggttgtg aggttaagcg actaagcgta cacggtggat gccctggcag    2340
tcagaggcga tgaaggacgt gctaatctgc gataagcgtc ggtaaggtga tatgaaccgt    2400
tataaccggc gatttccgaa tggggaaacc cagtgtgttt cgacacacta tcattaactg    2460
aatccatagg ttaatgaggc gaaccggggg aactgaaaca tctaagtacc ccgaggaaaa    2520
gaaatcaacc gagattcccc cagtagcggc gagcgaacgg ggagcagccc agagcctgaa    2580
tcagtgtgtg tgttagtgga agcgtctgga aaggcgcgcg atacagggtg acagccccgt    2640
acacaaaaat gcacatgctg tgagctcgat gagtagggcg ggacacgtgg tatcctgtct    2700
gaatatgggg ggaccatcct ccaaggctaa atactcctga ctgaccgata gtgaaccagt    2760
accgtgaggg aaaggcgaaa agaaccccgg cgaggggagt gaaaaagaac ctgaaaccgt    2820
gtacgtacaa gcagtgggag cacgcttagg cgtgtgactg cgtacctttt gtataatggg    2880
tcagcgactt atattctgta gcaaggttaa ccgaataggg gagccgaagg gaaaccgagt    2940
cttaactggg cgttaagttg cagggtatag acccgaaacc cggtgatcta gccatgggca    3000
ggttgaaggt tgggtaacac taactggagg accgaaccga ctaatgttga aaaattagcg    3060
gatgacttgt ggctgggggt gaaaggccaa tcaaaccggg agatagctgg ttctccccga    3120
aagctattta ggtagcgcct cgtgaattca tctccggggg tagagcactg tttcggcaag    3180
ggggtcatcc cgacttacca acccgatgca aactgcgaat accggagaat gttatcacgg    3240
gagacacacg gcgggtgcta acgtccgtcg tgaagaggga aacaacccag accgccagct    3300
aaggtcccaa agtcatggtt aagtgggaaa cgatgtggga aggcccagac agccaggatg    3360
ttggcttaga agcagccatc atttaaagaa agcgtaatag ctcactggtc gagtcggcct    3420
gcgcggaaga tgtaacgggg ctaaaccatg caccgaagct gcggcagcga cgcttatgcg    3480
ttgttgggta ggggagcgtt ctgtaagcct gcgaaggtgt gctgtgaggc atgctggagg    3540
tatcagaagt gcgaatgctg acataagtaa cgataaagcg ggtgaaaagc ccgctcgccg    3600
gaagaccaag ggttcctgtc caacgttaat cggggcaggg tgagtcgacc cctaaggcga    3660
ggccgaaagg cgtagtcgat gggaaacagg ttaatattcc tgtacttggt gttactgcga    3720
aggggggacg gagaaggcta tgttggccgg gcgacggttg tcccggttta agcgtgtagg    3780
ctggttttcc aggcaaatcc ggaaaatcaa ggctgaggcg tgatgacgag gcactacggt    3840
gctgaagcaa caaatgccct gcttccagga aaagcctcta agcatcaggt aacatcaaat    3900
cgtaccccaa accgacacag gtggtcaggt agagaatacc aaggcgcttg agagaactcg    3960
ggtgaaggaa ctaggcaaaa tggtgccgta acttcgggag aaggcacgct gatatgtagg    4020
tgaggtccct cgcggatgga gctgaaatca gtcgaagata ccagctggct gcaactgttt    4080
attaaaaaca cagcactgtg caaacacgaa agtggacgta tacggtgtga cgcctgcccg    4140
gtgccggaag gttaattgat ggggttagcg caagcgaagc tcttgatcga agccccggta    4200
aacggcggcc gtaactataa cggtcctaag gtagcgaaat tccttgtcgg gtaagttccg    4260
acctgcacga atggcgtaat gatggccagg ctgtctccac ccgagactca gtgaaattga    4320
actcgctgtg aagatgcagt gtacccgcgg caagacggaa agaccccgtg aacctttact    4380
atagcttgac actgaacatt gagccttgat gtgtaggata ggtgggaggc tttgaagtgt    4440
ggacgccagt ctgcatggag ccgaccttga aataccaccc tttaatgttt gatgttctaa    4500
cgttgacccg taatccgggt tgcggacagt gtctggtggg tagtttgact ggggcggtct    4560
cctcctaaag agtaacggag gagcacgaag gttggctaat cctggtcgga catcaggagg    4620
ttagtgcaat ggcataagcc agcttgactg cgagcgtgac ggcgcgagca ggtgcgaaag    4680
caggtcatag tgatccggtg gttctgaatg gaagggccat cgctcaacgg ataaaaggta    4740
ctccggggat aacaggctga taccgcccaa gagttcatat cgacggcggt gtttggcacc    4800
tcgatgtcgg ctcatcacat cctggggctg aagtaggtcc caagggtatg gctgttcgcc    4860
atttaaagtg gtacgcgagc tgggtttaga acgtcgtgag acagttcggt ccctatctgc    4920
cgtgggcgct ggagaactga ggggggctgc tcctagtacg agaggaccgg agtggacgca    4980
tcactggtgt tcgggttgtc atgccaatgg cactgcccgg tagctaaatg cggaagagat    5040
aagtgctgaa agcatctaag cacgaaactt gccccgagat gagttctccc tgacccttta    5100
agggtcctga aggaacgttg aagacgacga cgttgatagg ccgggtgtgt aagcgcagcg    5160
atgcgttgag ctaaccggta ctaatgaacc gtgaggctta accttacaac gccgaagctg    5220
ttttggcgga tgagagaaga ttttcagcct gatacagatt aaatcagaac gcagaagcgg    5280
tctgataaaa cagaatttgc ctggcggcag tagcgcggtg gtcccacctg accccatgcc    5340
gaactcagaa gtgaaacgcc gtagcgccga tggtagtgtg gggtctcccc atgcgagagt    5400
agggaactgc caggcatcaa ataaaacgaa aggctcagtc gaaagactgg gcctttcgtt    5460
ttatctgttg tttgtcggtg aacgctctcc tgagtaggac aaatccgccg ggagcggatt    5520
tgaacgttgc gaagcaacgg cccggagggt ggcgggcagg acgcccgcca taaactgcca    5580
ggcatcaaat taagcagaag gccatcctga cggatggcct ttttgcgttt ctacaaactc    5640
ttcctgtcgt catatctaca agccggcgcg ccattccggg gatccgtcga cctgcagttc    5700
gaagttccta ttctctagaa agtataggaa cttcagagcg cttttgaagc tcacgctgcc    5760
gcaagcactc agggcgcaag ggctgctaaa ggaagcggaa cacgtagaaa gccagtccgc    5820
agaaacggtg ctgaccccgg atgaatgtca gctactgggc tatctggaca agggaaaacg    5880
caagcgcaaa gagaaagcag gtagcttgca gtgggcttac atggcgatag ctagactggg    5940
cggttttatg gacagcaagc gaaccggaat tgccagctgg ggcgccctct ggtaaggttg    6000
ggaagccctg caaagtaaac tggatggctt tcttgccgcc aaggatctga tggcgcaggg    6060
gatcaagatc tgatcaagag acaggatgag gatcgtttcg catgattgaa caagatggat    6120
tgcacgcagg ttctccggcc gcttgggtgg agaggctatt cggctatgac tgggcacaac    6180
agacaatcgg ctgctctgat gccgccgtgt tccggctgtc agcgcagggg cgcccggttc    6240
tttttgtcaa gaccgacctg tccggtgccc tgaatgaact gcaggacgag gcagcgcggc    6300
tatcgtggct ggccacgacg ggcgttcctt gcgcagctgt gctcgacgtt gtcactgaag    6360
cgggaaggga ctggctgcta ttgggcgaag tgccggggca ggatctcctg tcatctcacc    6420
ttgctcctgc cgagaaagta tccatcatgg ctgatgcaat gcggcggctg catacgcttg    6480
atccggctac ctgcccattc gaccaccaag cgaaacatcg catcgagcga gcacgtactc    6540
ggatggaagc cggtcttgtc gatcaggatg atctggacga agagcatcag gggctcgcgc    6600
cagccgaact gttcgccagg ctcaaggcgc gcatgcccga cggcgaggat ctcgtcgtga    6660
cccatggcga tgcctgcttg ccgaatatca tggtggaaaa tggccgcttt tctggattca    6720
tcgactgtgg ccggctgggt gtggcggacc gctatcagga catagcgttg gctacccgtg    6780
atattgctga agagcttggc ggcgaatggg ctgaccgctt cctcgtgctt tacggtatcg    6840
ccgctcccga ttcgcagcgc atcgccttct atcgccttct tgacgagttc ttctaataag    6900
gggatcttga agttcctatt ccgaagttcc tattctctag aaagtatagg aacttcgaag    6960
cagctccagc ctacaatcga tgcgggataa tccgaagtgg tcagactgga aaatcagagg    7020
gcaggaactg ctgaacagca aaaagtcaga tagcaccaca tagcagaccc gccataaaac    7080
gccctgagaa gcccgtgacg ggcttttctt gtattatggg tagtttcctt gcatgaatcc    7140
ataaaaggcg cctgtagtgc catttacccc cattcactgc cagagccgtg agcgcagcga    7200
actgaatgtc acgaaaaaga cagcgactca ggtgcctgat ggtcggagac aaaaggaata    7260
ttcagcgatt tgcccgagct tgcgagggtg ctacttaagc ctttagggtt ttaaggtctg    7320
ttttgtagag gagcaaacag cgtttgcgac atccttttgt aatactgcgg aactgactaa    7380
agtagtgagt tatacacagg gctgggatct attcttttta tcttttttta ttctttcttt    7440
attctataaa ttataaccac ttgaatataa acaaaaaaaa cacacaaagg tctagcggaa    7500
tttacagagg gtctagcaga atttacaagt tttccagcaa aggtctagca gaatttacag    7560
atacccacaa ctcaaaggaa aaggactagt aattatcatt gactagccca tctcaattgg    7620
tatagtgatt aaaatcacct agaccaattg agatgtatgt ctgaattagt tgttttcaaa    7680
gcaaatgaac tagcgattag tcgctatgac ttaacggagc atgaaaccaa gctaatttta    7740
tgctgtgtgg cactactcaa ccccacgatt gaaaacccta caaggaaaga acggacggta    7800
tcgttcactt ataaccaata cgctcagatg atgaacatca gtagggaaaa tgcttatggt    7860
gtattagcta aagcaaccag agagctgatg acgagaactg tggaaatcag gaatcctttg    7920
gttaaaggct ttgagatttt ccagtggaca aactatgcca agttctcaag cgaaaaatta    7980
gaattagttt ttagtgaaga gatattgcct tatcttttcc agttaaaaaa attcataaaa    8040
tataatctgg aacatgttaa gtcttttgaa aacaaatact ctatgaggat ttatgagtgg    8100
ttattaaaag aactaacaca aaagaaaact cacaaggcaa atatagagat tagccttgat    8160
gaatttaagt tcatgttaat gcttgaaaat aactaccatg agtttaaaag gcttaaccaa    8220
tgggttttga aaccaataag taaagattta aacacttaca gcaatatgaa attggtggtt    8280
gataagcgag gccgcccgac tgatacgttg attttccaag ttgaactaga tagacaaatg    8340
gatctcgtaa ccgaacttga gaacaaccag ataaaaatga atggtgacaa aataccaaca    8400
accattacat cagattccta cctacgtaac ggactaagaa aaacactaca cgatgcttta    8460
actgcaaaaa ttcagctcac cagttttgag gcaaaatttt tgagtgacat gcaaagtaag    8520
catgatctca atggttcgtt ctcatggctc acgcaaaaac aacgaaccac actagagaac    8580
atactggcta aatacggaag gatctgaggt tcttatggct cttgtatcta tcagtgaagc    8640
atcaagacta acaaacaaaa gtagaacaac tgttcaccgt tagatatcaa agggaaaact    8700
gtccatatgc acagatgaaa acggtgtaaa aaagatagat acatcagagc ttttacgagt    8760
ttttggtgca tttaaagctg ttcaccatga acagatcgac aatgtaacag atgaacagca    8820
tgtaacacct aatagaacag gtgaaaccag taaaacaaag caactagaac atgaaattga    8880
acacctgaga caacttgtta cagctcaaca gtcacacata gacagcctga aacaggcgat    8940
gctgcttatc gaatcaaagc tgccgacaac acgggagcca gtgacgcctc ccgtggggaa    9000
aaaatcatgg caattctgga agaaatagc                                      9029
<210>  3
<211>  6771
<212>  DNA
<213>  人工序列
<220>
<223>  合成的- poGFP质粒
<400>  3
attcgcggcc gcttctagag tccctatcag tgatagagat tgacatccct atcagtgata      60
gagatactga gcactactag agaaagagga gaaatactag atgaaaaaca taaatgccga     120
cgacacatac agaataatta ataaaattaa agcttgtaga agcaataatg atattaatca     180
atgcttatct gatatgacta aaatggtaca ttgtgaatat tatttactcg cgatcattta     240
tcctcattct atggttaaat ctgatatttc aatcctagat aattacccta aaaaatggag     300
gcaatattat gatgacgcta atttaataaa atatgatcct atagtagatt attctaactc     360
caatcattca ccaattaatt ggaatatatt tgaaaacaat gctgtaaata aaaaatctcc     420
aaatgtaatt aaagaagcga aaacatcagg tcttatcact gggtttagtt tccctattca     480
tacggctaac aatggcttcg gaatgcttag ttttgcacat tcagaaaaag acaactatat     540
agatagttta tttttacatg cgtgtatgaa cataccatta attgttcctt ctctagttga     600
taattatcga aaaataaata tagcaaataa taaatcaaac aacgatttaa ccaaaagaga     660
aaaagaatgt ttagcgtggg catgcgaagg aaaaagctct tgggatattt caaaaatatt     720
aggttgcagt gagcgtactg tcactttcca tttaaccaat gcgcaaatga aactcaatac     780
aacaaaccgc tgccaaagta tttctaaagc aattttaaca ggagcaattg attgcccata     840
ctttaaaaat taataacact gatagtgcta gtgtagatca ctactagagc caggcatcaa     900
ataaaacgaa aggctcagtc gaaagactgg gcctttcgtt ttatctgttg tttgtcggtg     960
aacgctctct actagagtca cactggctca ccttcgggtg ggcctttctg cgtttatata    1020
ctagagacct gtaggatcgt acaggtttac gcaagaaaat ggtttgttat agtcgaataa    1080
actatatctg ttattttttc caaccacaga tctatgagca aaggtgaaga actgtttacc    1140
ggcgttgtgc cgattctggt ggaactggat ggcgatgtga acggtcacaa attcagcgtg    1200
cgtggtgaag gtgaaggcga tgccacgatt ggcaaactga cgctgaaatt tatctgcacc    1260
accggcaaac tgccggtgcc gtggccgacg ctggtgacca ccctgaccta tggcgttcag    1320
tgttttagtc gctatccgga tcacatgaaa cgtcacgatt tctttaaatc tgcaatgccg    1380
gaaggctatg tgcaggaacg tacgattagc tttaaagatg atggcaaata taaaacgcgc    1440
gccgttgtga aatttgaagg cgataccctg gtgaaccgca ttgaactgaa aggcacggat    1500
tttaaagaag atggcaatat cctgggccat aaactggaat acaactttaa tagccataat    1560
gtttatatta cggcggataa acagaaaaat ggcatcaaag cgaattttac cgttcgccat    1620
aacgttgaag atggcagtgt gcagctggca gatcattatc agcagaatac cccgattggt    1680
gatggtccgg tgctgctgcc ggataatcat tatctgagca cgcagaccgt tctgtctaaa    1740
gatccgaacg aaaaaggcac gcgggaccac atggttctgc acgaatatgt gaatgcggca    1800
ggtattacgt ggagccatcc gcagttcgaa aaataagtcg accggctgct aacaaagccc    1860
gcggccgctg aagatcgatc tcgacgagtg agagaagatt ttcagcctga tacagattaa    1920
atcagaacgc agaagcggtc tgataaaaca gaatttgcct ggcggcagta gcgcggtggt    1980
cccacctgac cccatgccga actcagaagt gaaacgccgt agcgccgatg gtagtgtggg    2040
gtcaccccat gcgagagtag ggaactgcca ggcatcaaat aaaacgaaag gctcagtcga    2100
aagactgggc ctttcgtttt atctgttgtt tgtcggtgaa cgctctcctg agtaggacaa    2160
atccgccggg agcggatttg aacgttgcga agcaacggcc cggagggtgg cgggcaggac    2220
gcccgccata aactgccagg catcaaatta agcagaaggc catcctgacg gatggccttt    2280
ttgcgtttct acactcgagg atctctttcc tttccatcaa aaaaatattg atgaaatgag    2340
ctgtggggcg ttatttaggt tttttcttct ttcgaaaaaa tctttcttta tgaagttaaa    2400
agctatgtat tcaatagcat attttgaata tggacataga atagtgctta tcactattgc    2460
atatagcatc ttatctgaca caaggaaata atacccttcg ctgttttttg ttataaggta    2520
tatatatata agtgtgcagt acaggccaaa taaaatattt tttatgtagt atcttaaatc    2580
ccgcaagagg cccggcagta ccggcataac caagcctatg cctacagcat ccagggtgac    2640
ggtgccgagg atgacgatga gcgcattgtt agatttcata cacggtgcct gactgcgtta    2700
gcaatttaac tgtgataaac taccgcatta aagcttatcg atgataagct gtcaaacatg    2760
agaattacaa cttatatcgt atggggctga cttcaggtgc tacatttgaa gagataaatt    2820
gcactgaaat ctagaaatat tttatctgat taataagatg atcttcttga gatcgttttg    2880
gtctgcgcgt aatctcttgc tctgaaaacg aaaaaaccgc cttgcagggc ggtttttcga    2940
aggttctctg agctaccaac tctttgaacc gaggtaactg gcttggagga gcgcagtcac    3000
caaaacttgt cctttcagtt tagccttaac cggcgcatga cttcaagact aactcctcta    3060
aatcaattac cagtggctgc tgccagtggt gcttttgcat gtctttccgg gttggactca    3120
agacgatagt taccggataa ggcgcagcgg tcggactgaa cggggggttc gtgcatacag    3180
tccagcttgg agcgaactgc ctacccggaa ctgagtgtca ggcgtggaat gagacaaacg    3240
cggccataac agcggaatga caccggtaaa ccgaaaggca ggaacaggag agcgcacgag    3300
ggagccgcca gggggaaacg cctggtatct ttatagtcct gtcgggtttc gccaccactg    3360
atttgagcgt cagatttcgt gatgcttgtc aggggggcgg agcctatgga aaaacggctt    3420
tgccgcggcc ctctcacttc cctgttaagt atcttcctgg catcttccag gaaatctccg    3480
ccccgttcgt aagccatttc cgctcgccgc agtcgaacga ccgagcgtag cgagtcagtg    3540
agcgaggaag cggaatatat cctgtatcac atattctgct gacgcaccgg tgcagccttt    3600
tttctcctgc cacatgaagc acttcactga caccctcatc agtgccaaca tagtaagcca    3660
gtatacactc cgctagcgct gatgtccggc ggtgcttttg ccgttacgca ccaccccgtc    3720
agtagctgaa caggagggac agagctttat gcttgtaaac cgttttgtga aaaaattttt    3780
aaaataaaaa aggggacctc tagggtcccc aattaattag taatataatc tattaaaggt    3840
cattcaaaag gtcatccacc ggatcaattc ccctgctcgc gcaggctggg tgccaagctc    3900
tcgggtaaca tcaaggcccg atccttggag cccttgccct cccgcacgat gatcgtgccg    3960
tgatcgaaaa tccagatcct tgacccgcat ttgcaaaccc tcactgatcc gcatggggcc    4020
cccgttccat acagaagctg ggcgaagtaa tcgcaacata ttcgcggccg cttctagagt    4080
ccctatcagt gatagagatt gacatcccta tcagtgatag agatactgag cactactaga    4140
gaaagaggag aaatactaga tgaaaaacat aaatgccgac gacacataca gaataattaa    4200
taaaattaaa gcttgtagaa gcaataatga tattaatcaa tgcttatctg atatgactaa    4260
aatggtacat tgtgaatatt atttactcgc gatcatttat cctcattcta tggttaaatc    4320
tgatatttca atcctagata attaccctaa aaaatggagg caatattatg atgacgctaa    4380
tttaataaaa tatgatccta tagtagatta ttctaactcc aatcattcac caattaattg    4440
gaatatattt gaaaacaatg ctgtaaataa aaaatctcca aatgtaatta aagaagcgaa    4500
aacatcaggt cttatcactg ggtttagttt ccctattcat acggctaaca atggcttcgg    4560
aatgcttagt tttgcacatt cagaaaaaga caactatata gatagtttat ttttacatgc    4620
gtgtatgaac ataccattaa ttgttccttc tctagttgat aattatcgaa aaataaatat    4680
agccaataat aaatcaaaca acgatttaac caaaagagaa aaagaatgtt tagcgtgggc    4740
atgcgaagga aaaagctctt gggatatttc aaaaatatta ggttgcagtg agcgtactgt    4800
cactttccat ttaaccaatg cgcaaatgaa actcaataca acaaaccgct gccaaagtat    4860
ttctaaagca attttaacag gagcaattga ttgcccatac tttaaaaatt aataacactg    4920
atagtgctag tgtagatcac tactagagcc aggcatcaaa taaaacgaaa ggctcagtcg    4980
aaagactggg cctttcgttt tatctgttgt ttgtcggtga acgctctcta ctagagtcac    5040
actggctcac cttcgggtgg gcctttctgc gtttatatac tagagacctg taggatcgta    5100
caggtttacg caagaaaatg gtttgttata gtcgaataaa ctatatctgt tattttttcc    5160
aaccactgat ccgcatgggg cccccgttcc atacagaagc tgggcgaaca aacgatgctc    5220
gccttccaga aaaccgagga tgcgaaccac ttcatccggg gtcagcacca ccggcaagcg    5280
ccgcgacggc cgaggtcttc cgatctcctg aagccagggc agatccgtgc acagcacctt    5340
gccgtagaag aacagcaagg ccgccaatgc ctgacgatgc gtggagaccg aaaccttgcg    5400
ctcgttcgcc agccaggaca gaaatgcctc gacttcgctg ctgcccaagg ttgccgggtg    5460
acgcacaccg tggaaacgga tgaaggcacg aacccagtgg acataagcct gttcggttcg    5520
taagctgtaa tgcaagtagc gtatgcgctc acgcaactgg tccagaacct tgaccgaacg    5580
cagcggtggt aacggcgcag tggcggtttt catggcttgt tatgactgtt tttttggggt    5640
acagtctatg cctcgggcat ccaagcagca agcgcgttac gccgtgggtc gatgtttgat    5700
gttatggagc agcaacgatg ttacgcagca gggcagtcgc cctaaaacaa agttaaacat    5760
catgagggaa gcggtgatcg ccgaagtatc gactcaacta tcagaggtag ttggcgtcat    5820
cgagcgccat ctcgaaccga cgttgctggc cgtacatttg tacggctccg cagtggatgg    5880
cggcctgaag ccacacagtg atattgattt gctggttacg gtgaccgtaa ggcttgatga    5940
aacaacgcgg cgagctttga tcaacgacct tttggaaact tcggcttccc ctggagagag    6000
cgagattctc cgcgctgtag aagtcaccat tgttgtgcac gacgacatca ttccgtggcg    6060
ttatccagct aagcgcgaac tgcaatttgg agaatggcag cgcaatgaca ttcttgcagg    6120
tatcttcgag ccagccacga tcgacattga tctggctatc ttgctgacaa aagcaagaga    6180
acatagcgtt gccttggtag gtccagcggc ggaggaactc tttgatccgg ttcctgaaca    6240
ggatctattt gaggcgctaa atgaaacctt aacgctatgg aactcgccgc ccgactgggc    6300
tggcgatgag cgaaatgtag tgcttacgtt gtcccgcatt tggtacagcg cagtaaccgg    6360
caaaatcgcg ccgaaggatg tcgctgccga ctgggcaatg gagcgcctgc cggcccagta    6420
tcagcccgtc atacttgaag ctagacaggc ttatcttgga caagaagaag atcgcttggc    6480
ctcgcgcgca gatcagttgg aagaatttgt ccactacgtg aaaggcgaga tcaccaaggt    6540
agtcggcaaa taatgtctaa caattcgttc aagccgacgc cgcttcgcgg cgcggcttaa    6600
ctcaagcgtt agatgcacta agcacataat tgctcacagc caaactatca ggtcaagtct    6660
gcttttatta tttttaagcg tgcataataa gccctacaca aattgggaga tatatcatga    6720
aaggctggct ttttcttgtt atcgcaatag ttggcgaagt aatcgcaaca t             6771
<210>  4
<211>  7701
<212>  DNA
<213>  人工序列
<220>
<223>  合成的- poLuc质粒
<400>  4
attcgcggcc gcttctagag tccctatcag tgatagagat tgacatccct atcagtgata      60
gagatactga gcactactag agaaagagga gaaatactag atgaaaaaca taaatgccga     120
cgacacatac agaataatta ataaaattaa agcttgtaga agcaataatg atattaatca     180
atgcttatct gatatgacta aaatggtaca ttgtgaatat tatttactcg cgatcattta     240
tcctcattct atggttaaat ctgatatttc aatcctagat aattacccta aaaaatggag     300
gcaatattat gatgacgcta atttaataaa atatgatcct atagtagatt attctaactc     360
caatcattca ccaattaatt ggaatatatt tgaaaacaat gctgtaaata aaaaatctcc     420
aaatgtaatt aaagaagcga aaacatcagg tcttatcact gggtttagtt tccctattca     480
tacggctaac aatggcttcg gaatgcttag ttttgcacat tcagaaaaag acaactatat     540
agatagttta tttttacatg cgtgtatgaa cataccatta attgttcctt ctctagttga     600
taattatcga aaaataaata tagcaaataa taaatcaaac aacgatttaa ccaaaagaga     660
aaaagaatgt ttagcgtggg catgcgaagg aaaaagctct tgggatattt caaaaatatt     720
aggttgcagt gagcgtactg tcactttcca tttaaccaat gcgcaaatga aactcaatac     780
aacaaaccgc tgccaaagta tttctaaagc aattttaaca ggagcaattg attgcccata     840
ctttaaaaat taataacact gatagtgcta gtgtagatca ctactagagc caggcatcaa     900
ataaaacgaa aggctcagtc gaaagactgg gcctttcgtt ttatctgttg tttgtcggtg     960
aacgctctct actagagtca cactggctca ccttcgggtg ggcctttctg cgtttatata    1020
ctagagacct gtaggatcgt acaggtttac gcaagaaaat ggtttgttat agtcgaataa    1080
actatatctg ttattttttc caaccacaga tctatggaag acgccaaaaa cataaagaaa    1140
ggcccggcgc cattctatcc gctagaggat ggaaccgctg gagagcaact gcataaggct    1200
atgaagagat acgccctggt tcctggaaca attgctttta cagatgcaca tatcgaggtg    1260
aacatcacgt acgcggaata cttcgaaatg tccgttcggt tggcagaagc tatgaaacga    1320
tatgggctga atacaaatca cagaatcgtc gtatgcagtg aaaactctct tcaattcttt    1380
atgccggtgt tgggcgcgtt atttatcgga gttgcagttg cgcccgcgaa cgacatttat    1440
aatgaacgtg aattgctcaa cagtatgaac atttcgcagc ctaccgtagt gtttgtttcc    1500
aaaaaggggt tgcaaaaaat tttgaacgtg caaaaaaaat taccaataat ccagaaaatt    1560
attatcatgg attctaaaac ggattaccag ggatttcagt cgatgtacac gttcgtcaca    1620
tctcatctac ctcccggttt taatgaatac gattttgtac cagagtcctt tgatcgtgac    1680
aaaacaattg cactgataat gaactcctct ggatctactg ggttacctaa gggtgtggcc    1740
cttccgcata gaactgcctg cgtcagattc tcgcatgcca gagatcctat ttttggcaat    1800
caaatcattc cggatactgc gattttaagt gttgttccat tccatcacgg ttttggaatg    1860
tttactacac tcggatattt gatatgtgga tttcgagtcg tcttaatgta tagatttgaa    1920
gaagagctgt ttttacgatc ccttcaggat tacaaaattc aaagtgcgtt gctagtacca    1980
accctatttt cattcttcgc caaaagcact ctgattgaca aatacgattt atctaattta    2040
cacgaaattg cttctggggg cgcacctctt tcgaaagaag tcggggaagc ggttgcaaaa    2100
cgcttccatc ttccagggat acgacaagga tatgggctca ctgagactac atcagctatt    2160
ctgattacac ccgaggggga tgataaaccg ggcgcggtcg gtaaagttgt tccatttttt    2220
gaagcgaagg ttgtggatct ggataccggg aaaacgctgg gcgttaatca gagaggcgaa    2280
ttatgtgtca gaggacctat gattatgtcc ggttatgtaa acaatccgga agcgaccaac    2340
gccttgattg acaaggatgg atggctacat tctggagaca tagcttactg ggacgaagac    2400
gaacacttct tcatagttga ccgcttgaag tctttaatta aatacaaagg ataccaggtg    2460
gcccccgctg aattggagtc gatattgtta caacacccca acatcttcga cgcgggcgtg    2520
gcaggtcttc ccgacgatga cgccggtgaa cttcccgccg ccgttgttgt tttggagcac    2580
ggaaagacga tgacggaaaa agagatcgtg gattacgtcg ccagtcaagt aacaaccgcc    2640
aaaaagttgc gcggaggagt tgtgtttgtg gacgaagtac cgaaaggtct taccggaaaa    2700
ctcgacgcaa gaaaaatcag agagatcctc ataaaggcca agaagggcgg aaagtccaaa    2760
ttgtaagtcg accggctgct aacaaagccc gcggccgctg aagatcgatc tcgacgagtg    2820
agagaagatt ttcagcctga tacagattaa atcagaacgc agaagcggtc tgataaaaca    2880
gaatttgcct ggcggcagta gcgcggtggt cccacctgac cccatgccga actcagaagt    2940
gaaacgccgt agcgccgatg gtagtgtggg gtcaccccat gcgagagtag ggaactgcca    3000
ggcatcaaat aaaacgaaag gctcagtcga aagactgggc ctttcgtttt atctgttgtt    3060
tgtcggtgaa cgctctcctg agtaggacaa atccgccggg agcggatttg aacgttgcga    3120
agcaacggcc cggagggtgg cgggcaggac gcccgccata aactgccagg catcaaatta    3180
agcagaaggc catcctgacg gatggccttt ttgcgtttct acactcgagg atctctttcc    3240
tttccatcaa aaaaatattg atgaaatgag ctgtggggcg ttatttaggt tttttcttct    3300
ttcgaaaaaa tctttcttta tgaagttaaa agctatgtat tcaatagcat attttgaata    3360
tggacataga atagtgctta tcactattgc atatagcatc ttatctgaca caaggaaata    3420
atacccttcg ctgttttttg ttataaggta tatatatata agtgtgcagt acaggccaaa    3480
taaaatattt tttatgtagt atcttaaatc ccgcaagagg cccggcagta ccggcataac    3540
caagcctatg cctacagcat ccagggtgac ggtgccgagg atgacgatga gcgcattgtt    3600
agatttcata cacggtgcct gactgcgtta gcaatttaac tgtgataaac taccgcatta    3660
aagcttatcg atgataagct gtcaaacatg agaattacaa cttatatcgt atggggctga    3720
cttcaggtgc tacatttgaa gagataaatt gcactgaaat ctagaaatat tttatctgat    3780
taataagatg atcttcttga gatcgttttg gtctgcgcgt aatctcttgc tctgaaaacg    3840
aaaaaaccgc cttgcagggc ggtttttcga aggttctctg agctaccaac tctttgaacc    3900
gaggtaactg gcttggagga gcgcagtcac caaaacttgt cctttcagtt tagccttaac    3960
cggcgcatga cttcaagact aactcctcta aatcaattac cagtggctgc tgccagtggt    4020
gcttttgcat gtctttccgg gttggactca agacgatagt taccggataa ggcgcagcgg    4080
tcggactgaa cggggggttc gtgcatacag tccagcttgg agcgaactgc ctacccggaa    4140
ctgagtgtca ggcgtggaat gagacaaacg cggccataac agcggaatga caccggtaaa    4200
ccgaaaggca ggaacaggag agcgcacgag ggagccgcca gggggaaacg cctggtatct    4260
ttatagtcct gtcgggtttc gccaccactg atttgagcgt cagatttcgt gatgcttgtc    4320
aggggggcgg agcctatgga aaaacggctt tgccgcggcc ctctcacttc cctgttaagt    4380
atcttcctgg catcttccag gaaatctccg ccccgttcgt aagccatttc cgctcgccgc    4440
agtcgaacga ccgagcgtag cgagtcagtg agcgaggaag cggaatatat cctgtatcac    4500
atattctgct gacgcaccgg tgcagccttt tttctcctgc cacatgaagc acttcactga    4560
caccctcatc agtgccaaca tagtaagcca gtatacactc cgctagcgct gatgtccggc    4620
ggtgcttttg ccgttacgca ccaccccgtc agtagctgaa caggagggac agagctttat    4680
gcttgtaaac cgttttgtga aaaaattttt aaaataaaaa aggggacctc tagggtcccc    4740
aattaattag taatataatc tattaaaggt cattcaaaag gtcatccacc ggatcaattc    4800
ccctgctcgc gcaggctggg tgccaagctc tcgggtaaca tcaaggcccg atccttggag    4860
cccttgccct cccgcacgat gatcgtgccg tgatcgaaaa tccagatcct tgacccgcat    4920
ttgcaaaccc tcactgatcc gcatggggcc cccgttccat acagaagctg ggcgaagtaa    4980
tcgcaacata ttcgcggccg cttctagagt ccctatcagt gatagagatt gacatcccta    5040
tcagtgatag agatactgag cactactaga gaaagaggag aaatactaga tgaaaaacat    5100
aaatgccgac gacacataca gaataattaa taaaattaaa gcttgtagaa gcaataatga    5160
tattaatcaa tgcttatctg atatgactaa aatggtacat tgtgaatatt atttactcgc    5220
gatcatttat cctcattcta tggttaaatc tgatatttca atcctagata attaccctaa    5280
aaaatggagg caatattatg atgacgctaa tttaataaaa tatgatccta tagtagatta    5340
ttctaactcc aatcattcac caattaattg gaatatattt gaaaacaatg ctgtaaataa    5400
aaaatctcca aatgtaatta aagaagcgaa aacatcaggt cttatcactg ggtttagttt    5460
ccctattcat acggctaaca atggcttcgg aatgcttagt tttgcacatt cagaaaaaga    5520
caactatata gatagtttat ttttacatgc gtgtatgaac ataccattaa ttgttccttc    5580
tctagttgat aattatcgaa aaataaatat agccaataat aaatcaaaca acgatttaac    5640
caaaagagaa aaagaatgtt tagcgtgggc atgcgaagga aaaagctctt gggatatttc    5700
aaaaatatta ggttgcagtg agcgtactgt cactttccat ttaaccaatg cgcaaatgaa    5760
actcaataca acaaaccgct gccaaagtat ttctaaagca attttaacag gagcaattga    5820
ttgcccatac tttaaaaatt aataacactg atagtgctag tgtagatcac tactagagcc    5880
aggcatcaaa taaaacgaaa ggctcagtcg aaagactggg cctttcgttt tatctgttgt    5940
ttgtcggtga acgctctcta ctagagtcac actggctcac cttcgggtgg gcctttctgc    6000
gtttatatac tagagacctg taggatcgta caggtttacg caagaaaatg gtttgttata    6060
gtcgaataaa ctatatctgt tattttttcc aaccactgat ccgcatgggg cccccgttcc    6120
atacagaagc tgggcgaaca aacgatgctc gccttccaga aaaccgagga tgcgaaccac    6180
ttcatccggg gtcagcacca ccggcaagcg ccgcgacggc cgaggtcttc cgatctcctg    6240
aagccagggc agatccgtgc acagcacctt gccgtagaag aacagcaagg ccgccaatgc    6300
ctgacgatgc gtggagaccg aaaccttgcg ctcgttcgcc agccaggaca gaaatgcctc    6360
gacttcgctg ctgcccaagg ttgccgggtg acgcacaccg tggaaacgga tgaaggcacg    6420
aacccagtgg acataagcct gttcggttcg taagctgtaa tgcaagtagc gtatgcgctc    6480
acgcaactgg tccagaacct tgaccgaacg cagcggtggt aacggcgcag tggcggtttt    6540
catggcttgt tatgactgtt tttttggggt acagtctatg cctcgggcat ccaagcagca    6600
agcgcgttac gccgtgggtc gatgtttgat gttatggagc agcaacgatg ttacgcagca    6660
gggcagtcgc cctaaaacaa agttaaacat catgagggaa gcggtgatcg ccgaagtatc    6720
gactcaacta tcagaggtag ttggcgtcat cgagcgccat ctcgaaccga cgttgctggc    6780
cgtacatttg tacggctccg cagtggatgg cggcctgaag ccacacagtg atattgattt    6840
gctggttacg gtgaccgtaa ggcttgatga aacaacgcgg cgagctttga tcaacgacct    6900
tttggaaact tcggcttccc ctggagagag cgagattctc cgcgctgtag aagtcaccat    6960
tgttgtgcac gacgacatca ttccgtggcg ttatccagct aagcgcgaac tgcaatttgg    7020
agaatggcag cgcaatgaca ttcttgcagg tatcttcgag ccagccacga tcgacattga    7080
tctggctatc ttgctgacaa aagcaagaga acatagcgtt gccttggtag gtccagcggc    7140
ggaggaactc tttgatccgg ttcctgaaca ggatctattt gaggcgctaa atgaaacctt    7200
aacgctatgg aactcgccgc ccgactgggc tggcgatgag cgaaatgtag tgcttacgtt    7260
gtcccgcatt tggtacagcg cagtaaccgg caaaatcgcg ccgaaggatg tcgctgccga    7320
ctgggcaatg gagcgcctgc cggcccagta tcagcccgtc atacttgaag ctagacaggc    7380
ttatcttgga caagaagaag atcgcttggc ctcgcgcgca gatcagttgg aagaatttgt    7440
ccactacgtg aaaggcgaga tcaccaaggt agtcggcaaa taatgtctaa caattcgttc    7500
aagccgacgc cgcttcgcgg cgcggcttaa ctcaagcgtt agatgcacta agcacataat    7560
tgctcacagc caaactatca ggtcaagtct gcttttatta tttttaagcg tgcataataa    7620
gccctacaca aattgggaga tatatcatga aaggctggct ttttcttgtt atcgcaatag    7680
ttggcgaagt aatcgcaaca t                                              7701
<210>  5
<211>  5659
<212>  DNA
<213>  人工序列
<220>
<223>  合成的- poRFP/oGFP质粒
<400>  5
ccgcattaaa atctagcgag gatccgaggc gcgcccagag attttgagac acaacgtggc      60
tttccatcaa aaaaatattg acaacataaa aaactttgtg ttatacttgt ggaattgtga     120
gcggataaca attctatatc tgttattttt tccaaccaca gatctatgag caaaggtgaa     180
gaactgttta ccggcgttgt gccgattctg gtggaactgg atggcgatgt gaacggtcac     240
aaattcagcg tgcgtggtga aggtgaaggc gatgccacga ttggcaaact gacgctgaaa     300
tttatctgca ccaccggcaa actgccggtg ccgtggccga cgctggtgac caccctgacc     360
tatggcgttc agtgttttag tcgctatccg gatcacatga aacgtcacga tttctttaaa     420
tctgcaatgc cggaaggcta tgtgcaggaa cgtacgatta gctttaaaga tgatggcaaa     480
tataaaacgc gcgccgttgt gaaatttgaa ggcgataccc tggtgaaccg cattgaactg     540
aaaggcacgg attttaaaga agatggcaat atcctgggcc ataaactgga atacaacttt     600
aatagccata atgtttatat tacggcggat aaacagaaaa atggcatcaa agcgaatttt     660
accgttcgcc ataacgttga agatggcagt gtgcagctgg cagatcatta tcagcagaat     720
accccgattg gtgatggtcc ggtgctgctg ccggataatc attatctgag cacgcagacc     780
gttctgtcta aagatccgaa cgaaaaaggc acgcgggacc acatggttct gcacgaatat     840
gtgaatgcgg caggtattac gtggagccat ccgcagttcg aaaaataagt cgaccggctg     900
ctaacaaagc ccgcggccgc tgaagatcga tctcgacgag tgagagaaga ttttcagcct     960
gatacagatt aaatcagaac gcagaagcgg tctgataaaa cagaatttgc ctggcggcag    1020
tagcgcggtg gtcccacctg accccatgcc gaactcagaa gtgaaacgcc gtagcgccga    1080
tggtagtgtg gggtcacccc atgcgagagt agggaactgc caggcatcaa ataaaacgaa    1140
aggctcagtc gaaagactgg gcctttcgtt ttatctgttg tttgtcggtg aacgctctcc    1200
tgagtaggac aaatccgccg ggagcggatt tgaacgttgc gaagcaacgg cccggagggt    1260
ggcgggcagg acgcccgcca taaactgcca ggcatcaaat taagcagaag gccatcctga    1320
cggatggcct ttttgcgttt ctacactcga ggatctcttt cctttccatc aaaaaaatat    1380
tgatgaaatg agctgtgggg cgttatttag gttttttctt ctttcgaaaa aatctttctt    1440
tatgaagtta aaagctatgt attcaatagc atattttgaa tatggacata gaatagtgct    1500
tatcactatt gcatatagca tcttatctga cacaaggaaa taataccctt cgctgttttt    1560
tgttataagg tatatatata taagtgtgca gtacaggcca aataaaatat tttttatgta    1620
gtatcttaaa tcccgcaaga ggcccggcag taccggcata accaagccta tgcctacagc    1680
atccagggtg acggtgccga ggatgacgat gagcgcattg ttagatttca tacacggtgc    1740
ctgactgcgt tagcaattta actgtgataa actaccgcat taaagcttat cgatgataag    1800
ctgtcaaaca tgagaattac aacttatatc gtatggggct gacttcaggt gctacatttg    1860
aagagataaa ttgcactgaa atctagaaat attttatctg attaataaga tgatcttctt    1920
gagatcgttt tggtctgcgc gtaatctctt gctctgaaaa cgaaaaaacc gccttgcagg    1980
gcggtttttc gaaggttctc tgagctacca actctttgaa ccgaggtaac tggcttggag    2040
gagcgcagtc accaaaactt gtcctttcag tttagcctta accggcgcat gacttcaaga    2100
ctaactcctc taaatcaatt accagtggct gctgccagtg gtgcttttgc atgtctttcc    2160
gggttggact caagacgata gttaccggat aaggcgcagc ggtcggactg aacggggggt    2220
tcgtgcatac agtccagctt ggagcgaact gcctacccgg aactgagtgt caggcgtgga    2280
atgagacaaa cgcggccata acagcggaat gacaccggta aaccgaaagg caggaacagg    2340
agagcgcacg agggagccgc cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt    2400
tcgccaccac tgatttgagc gtcagatttc gtgatgcttg tcaggggggc ggagcctatg    2460
gaaaaacggc tttgccgcgg ccctctcact tccctgttaa gtatcttcct ggcatcttcc    2520
aggaaatctc cgccccgttc gtaagccatt tccgctcgcc gcagtcgaac gaccgagcgt    2580
agcgagtcag tgagcgagga agcggaatat atcctgtatc acatattctg ctgacgcacc    2640
ggtgcagcct tttttctcct gccacatgaa gcacttcact gacaccctca tcagtgccaa    2700
catagtaagc cagtatacac tccgctagcg ctgatgtccg gcggtgcttt tgccgttacg    2760
caccaccccg tcagtagctg aacaggaggg acagagcttt atgcttgtaa accgttttgt    2820
gaaaaaattt ttaaaataaa aaaggggacc tctagggtcc ccaattaatt agtaatataa    2880
tctattaaag gtcattcaaa aggtcatcca ccggatcaat tcccctgctc gcgcaggctg    2940
ggtgccaagc tctcgggtaa catcaaggcc cgatccttgg agcccttgcc ctcccgcacg    3000
atgatcgtgc cgtgatcgaa aatccagatc cttgacccgc atttgcaaac cctcactgat    3060
ccgcatgggg ccctcataaa aaatttattt gctttgtgag cggataacaa ttataataga    3120
ttcaattgtg agcggataac aatttcacac agaattcatt aaagcaacca caattaacta    3180
tggcttcctc cgaagacgtt atcaaagagt tcatgcgttt caaagttcgt atggaaggtt    3240
ccgttaacgg tcacgagttc gaaatcgaag gtgaaggtga aggtcgtccg tacgaaggta    3300
cccagaccgc taaactgaaa gttaccaaag gtggtccgct gccgttcgct tgggacatcc    3360
tgtccccgca gttccagtac ggttccaaag cttacgttaa acacccggct gacatcccgg    3420
actacctgaa actgtccttc ccggaaggtt tcaaatggga acgtgttatg aacttcgaag    3480
acggtggtgt tgttaccgtt acccaggact cctccctgca agacggtgag ttcatctaca    3540
aagttaaact gcgtggtacc aacttcccgt ccgacggtcc ggttatgcag aaaaaaacca    3600
tgggttggga agcttccacc gaacgtatgt acccggaaga cggtgctctg aaaggtgaaa    3660
tcaaaatgcg tctgaaactg aaagacggtg gtcactacga cgctgaagtt aaaaccacct    3720
acatggctaa aaaaccggtt cagctgccgg gtgcttacaa aaccgacatc aaactggaca    3780
tcacctccca caacgaagac tacaccatcg ttgaacagta cgaacgtgct gaaggtcgtc    3840
actccaccgg tgcttaagga tccgcatgcg agctcggtac cccgggtcga cctgcagcca    3900
agcttaatta gctgagcttg gactcctgtt gatagatcca gtaatgacct cagaactcca    3960
tctggatttg ttcagaacgc tcggttgccg ccgggcgttt tttattggtg agaatccaag    4020
ctagcttggc gagattttca ggagctaagg aagctaaaga tccgacatat gccgttccat    4080
acagaagctg ggcgaacaaa cgatgctcgc cttccagaaa accgaggatg cgaaccactt    4140
catccggggt cagcaccacc ggcaagcgcc gcgacggccg aggtcttccg atctcctgaa    4200
gccagggcag atccgtgcac agcaccttgc cgtagaagaa cagcaaggcc gccaatgcct    4260
gacgatgcgt ggagaccgaa accttgcgct cgttcgccag ccaggacaga aatgcctcga    4320
cttcgctgct gcccaaggtt gccgggtgac gcacaccgtg gaaacggatg aaggcacgaa    4380
cccagtggac ataagcctgt tcggttcgta agctgtaatg caagtagcgt atgcgctcac    4440
gcaactggtc cagaaccttg accgaacgca gcggtggtaa cggcgcagtg gcggttttca    4500
tggcttgtta tgactgtttt tttggggtac agtctatgcc tcgggcatcc aagcagcaag    4560
cgcgttacgc cgtgggtcga tgtttgatgt tatggagcag caacgatgtt acgcagcagg    4620
gcagtcgccc taaaacaaag ttaaacatca tgagggaagc ggtgatcgcc gaagtatcga    4680
ctcaactatc agaggtagtt ggcgtcatcg agcgccatct cgaaccgacg ttgctggccg    4740
tacatttgta cggctccgca gtggatggcg gcctgaagcc acacagtgat attgatttgc    4800
tggttacggt gaccgtaagg cttgatgaaa caacgcggcg agctttgatc aacgaccttt    4860
tggaaacttc ggcttcccct ggagagagcg agattctccg cgctgtagaa gtcaccattg    4920
ttgtgcacga cgacatcatt ccgtggcgtt atccagctaa gcgcgaactg caatttggag    4980
aatggcagcg caatgacatt cttgcaggta tcttcgagcc agccacgatc gacattgatc    5040
tggctatctt gctgacaaaa gcaagagaac atagcgttgc cttggtaggt ccagcggcgg    5100
aggaactctt tgatccggtt cctgaacagg atctatttga ggcgctaaat gaaaccttaa    5160
cgctatggaa ctcgccgccc gactgggctg gcgatgagcg aaatgtagtg cttacgttgt    5220
cccgcatttg gtacagcgca gtaaccggca aaatcgcgcc gaaggatgtc gctgccgact    5280
gggcaatgga gcgcctgccg gcccagtatc agcccgtcat acttgaagct agacaggctt    5340
atcttggaca agaagaagat cgcttggcct cgcgcgcaga tcagttggaa gaatttgtcc    5400
actacgtgaa aggcgagatc accaaggtag tcggcaaata atgtctaaca attcgttcaa    5460
gccgacgccg cttcgcggcg cggcttaact caagcgttag atgcactaag cacataattg    5520
ctcacagcca aactatcagg tcaagtctgc ttttattatt tttaagcgtg cataataagc    5580
cctacacaaa ttgggagata tatcatgaaa ggctggcttt ttcttgttat cgcaatagtt    5640
ggcgaagtaa tcgcaacat                                                 5659
<210>  6
<211>  1020
<212>  DNA
<213>  人工序列
<220>
<223>  合成的- GFP-TnaC模板,用于体外翻译
<400>  6
tcgatttttg tgatgctcgt caggggggcg gagcctatgg aaacgaattc agatctcgat      60
cccgcgaaat taatacgact cactataggg agaccacaac ggtttccctc tagaaataat     120
tttgtttaac tttaagaagg agatatacat atgagcaaag gtgaagaact gtttaccggc     180
gttgtgccga ttctggtgga actggatggc gatgtgaacg gtcacaaatt cagcgtgcgt     240
ggtgaaggtg aaggcgatgc cacgattggc aaactgacgc tgaaatttat ctgcaccacc     300
ggcaaactgc cggtgccgtg gccgacgctg gtgaccaccc tgacctatgg cgttcagtgt     360
tttagtcgct atccggatca catgaaacgt cacgatttct ttaaatctgc aatgccggaa     420
ggctatgtgc aggaacgtac gattagcttt aaagatgatg gcaaatataa aacgcgcgcc     480
gttgtgaaat ttgaaggcga taccctggtg aaccgcattg aactgaaagg cacggatttt     540
aaagaagatg gcaatatcct gggccataaa ctggaataca actttaatag ccataatgtt     600
tatattacgg cggataaaca gaaaaatggc atcaaagcga attttaccgt tcgccataac     660
gttgaagatg gcagtgtgca gctggcagat cattatcagc agaatacccc gattggtgat     720
ggtccggtgc tgctgccgga taatcattat ctgagcacgc agaccgttct gtctaaagat     780
ccgaacgaaa aaggcacgcg ggaccacatg gttctgcacg aatatgtgaa tgcggcaggt     840
attacgtgga gccataaatg gttcaatatt gacaacaaaa ttgtcgatca ccgcccttga     900
tttgcccttc tgtagccatc accagagcca aaccgattag attcaatgtg atctatttgt     960
ttgctatatc ttaattttgc cttttgcaaa ggtcatctct cgtttattta cttgttttag    1020
<210>  7
<211>  900
<212>  DNA
<213>  人工序列
<220>
<223>  合成的- GFP-TnaC (W12R)模板,用于体外翻译
<400>  7
tcgatttttg tgatgctcgt caggggggcg gagcctatgg aaacgaattc agatctcgat      60
cccgcgaaat taatacgact cactataggg agaccacaac ggtttccctc tagaaataat     120
tttgtttaac tttaagaagg agatatacat atgagcaaag gtgaagaact gtttaccggc     180
gttgtgccga ttctggtgga actggatggc gatgtgaacg gtcacaaatt cagcgtgcgt     240
ggtgaaggtg aaggcgatgc cacgattggc aaactgacgc tgaaatttat ctgcaccacc     300
ggcaaactgc cggtgccgtg gccgacgctg gtgaccaccc tgacctatgg cgttcagtgt     360
tttagtcgct atccggatca catgaaacgt cacgatttct ttaaatctgc aatgccggaa     420
ggctatgtgc aggaacgtac gattagcttt aaagatgatg gcaaatataa aacgcgcgcc     480
gttgtgaaat ttgaaggcga taccctggtg aaccgcattg aactgaaagg cacggatttt     540
aaagaagatg gcaatatcct gggccataaa ctggaataca actttaatag ccataatgtt     600
tatattacgg cggataaaca gaaaaatggc atcaaagcga attttaccgt tcgccataac     660
gttgaagatg gcagtgtgca gctggcagat cattatcagc agaatacccc gattggtgat     720
ggtccggtgc tgctgccgga taatcattat ctgagcacgc agaccgttct gtctaaagat     780
ccgaacgaaa aaggcacgcg ggaccacatg gttctgcacg aatatgtgaa tgcggcaggt     840
attacgtgga gccataaacg gttcaatatt gacaacaaaa ttgtcgatca ccgcccttga     900
<210>  8
<211>  12
<212>  DNA
<213>  人工序列
<220>
<223>  合成的-序列,见图2b (左侧)
<400>  8
cgggaagacc cc                                                          12
<210>  9
<211>  12
<212>  DNA
<213>  人工序列
<220>
<223>  合成的-序列,见图2b (右侧)
<400>  9
cggaaagacc cc                                                          12
<210>  10
<211>  12
<212>  DNA
<213>  人工序列
<220>
<223>  合成的-序列,见图7b (左侧)
<400>  10
cgggaagacc cc                                                          12
<210>  11
<211>  12
<212>  DNA
<213>  人工序列
<220>
<223>  合成的-序列,见图7b (右侧)
<400>  11
cggaaagacc cc                                                          12
<210>  12
<211>  55
<212>  DNA
<213>  人工序列
<220>
<223>  合成的-引物NA1
<400>  12
aataggggtt ccgcgcacat ttcccggcgc gtaaaacaaa aggcccagtc ttccg           55
<210>  13
<211>  65
<212>  DNA
<213>  人工序列
<220>
<223>  合成的-引物NA2
<400>  13
actcttcctg tcgtcatatc tacaagccgg ctttcctttc catcaaaaaa atattgatga      60
aatga                                                                  65
<210>  14
<211>  25
<212>  DNA
<213>  人工序列
<220>
<223>  合成的-引物NA3
<400>  14
tatacgagcc gatgattaat tgtca                                            25
<210>  15
<211>  18
<212>  DNA
<213>  人工序列
<220>
<223>  合成的-引物NA4
<400>  15
gcctggcggc agtagcgc                                                    18
<210>  16
<211>  56
<212>  DNA
<213>  人工序列
<220>
<223>  合成的-引物NA5
<400>  16
aatcatggca attctggaag aatagcgcgg ccgcgatctc tcacctacca aacaat          56
<210>  17
<211>  61
<212>  DNA
<213>  人工序列
<220>
<223>  合成的-引物NA6
<400>  17
ctgcaggtcg acggatcccc cggaatggcg cgccggcttg tagatatgac gacaggaaga      60
g                                                                      61
<210>  18
<211>  51
<212>  DNA
<213>  人工序列
<220>
<223>  合成的-引物NA7
<400>  18
tcctgtcgtc atatctacaa gccggcgcgc cattccgggg atccgtcgac c               51
<210>  19
<211>  50
<212>  DNA
<213>  人工序列
<220>
<223>  合成的-引物NA8
<400>  19
gtctgaccac tcggattatc ccgcatcgat tgtaggctgg agctgcttcg                 50
<210>  20
<211>  50
<212>  DNA
<213>  人工序列
<220>
<223>  合成的-引物NA9
<400>  20
gtctgaccac tcggattatc ccgcatcgat tgtaggctgg agctgcttcg                 50
<210>  21
<211>  55
<212>  DNA
<213>  人工序列
<220>
<223>  合成的-引物NA10
<400>  21
attgtttggt aggtgagaga tcgcggccgc gctatttctt ccagaattcc catga           55
<210>  22
<211>  60
<212>  DNA
<213>  人工序列
<220>
<223>  合成的-引物NA11
<400>  22
caagaaaatg gtttgttata gtcgaataaa ctatatctgt tattttttcc aaccacagat      60
<210>  23
<211>  60
<212>  DNA
<213>  人工序列
<220>
<223>  合成的-引物NA12
<400>  23
gaaagaagaa aaaacctaaa taacgcccca cagctcattt catcaatatt tttttgatgg      60
<210>  24
<211>  52
<212>  DNA
<213>  人工序列
<220>
<223>  合成的-引物NA13
<400>  24
atagttggcg aagtaatcgc aacaataatt cgcggccgct tctagagtcc ct              52
<210>  25
<211>  60
<212>  DNA
<213>  人工序列
<220>
<223>  合成的-引物NA14
<400>  25
atctgtggtt ggaaaaaata acagatatag tttattcgac tataacaaac cattttcttg      60
<210>  26
<211>  50
<212>  DNA
<213>  人工序列
<220>
<223>  合成的-引物NA15
<400>  26
accctcactg atccgcatgg ggcccccgtt ccatacagaa gctgggcgaa                 50
<210>  27
<211>  50
<212>  DNA
<213>  人工序列
<220>
<223>  合成的-引物NA16
<400>  27
agggactcta gaagcggccg cgaatatgtt gcgattactt cgccaactat                 50
<210>  28
<211>  50
<212>  DNA
<213>  人工序列
<220>
<223>  合成的-引物NA17
<400>  28
ttcgcccagc ttctgtatgg aacgggggcc ccatgcggat cagtgagggt                 50
<210>  29
<211>  60
<212>  DNA
<213>  人工序列
<220>
<223>  合成的-引物NA18
<400>  29
ccatcaaaaa aatattgatg aaatgagctg tggggcgtta tttaggtttt ttcttctttc      60
<210>  30
<211>  30
<212>  DNA
<213>  人工序列
<220>
<223>  合成的-引物NA19
<400>  30
aaactatcag gtcaagtctg cttttattat                                       30
<210>  31
<211>  29
<212>  DNA
<213>  人工序列
<220>
<223>  合成的-引物NA20
<400>  31
cgagtaaata atattcacaa tgtaccatt                                        29
<210>  32
<211>  52
<212>  DNA
<213>  人工序列
<220>
<223>  合成的-引物NA21
<400>  32
ctgttatttt ttccaaccac agatctatgg aagacgccaa aaacataaag aa              52
<210>  33
<211>  56
<212>  DNA
<213>  人工序列
<220>
<223>  合成的-引物NA22
<400>  33
cggccgcggg ctttgttagc agccggtcga cttacaattt ggactttccg cccttc          56
<210>  34
<211>  76
<212>  DNA
<213>  人工序列
<220>
<223>  合成的-引物NA23
<400>  34
tcgtcgagat cgatcttcag cggccgcggg ctttgttagc agccggtcga ctcaagggcg      60
gtgatcgaca attttg                                                      76
<210>  35
<211>  54
<212>  DNA
<213>  人工序列
<220>
<223>  合成的-引物NA24
<400>  35
tactgttatt ttttccaacc acagatctat gagcaaaggt gaagaactgt ttac            54
<210>  36
<211>  25
<212>  DNA
<213>  人工序列
<220>
<223>  合成的-引物NA25
<400>  36
caaaattgtc gatcaccgcc cttga                                            25
<210>  37
<211>  20
<212>  DNA
<213>  人工序列
<220>
<223>  合成的-引物NA26
<400>  37
acgttcaaat ccgctcccgg                                                  20
<210>  38
<211>  70
<212>  DNA
<213>  人工序列
<220>
<223>  合成的-引物NA27
<400>  38
cagaacatat tgactatccg gtattacccg gcatgacagg agtaaaaatg gtgtaggctg      60
gagctgcttc                                                             70
<210>  39
<211>  70
<212>  DNA
<213>  人工序列
<220>
<223>  合成的-引物NA28
<400>  39
atgcgaccct tgtgtatcaa acaagacgat taaaaatctt cgttagtttc atgggaatta      60
gccatggtcc                                                             70
<210>  40
<211>  26
<212>  DNA
<213>  人工序列
<220>
<223>  合成的-引物NA29
<400>  40
tcgatttttg tgatgctcgt cagggg                                           26
<210>  41
<211>  55
<212>  DNA
<213>  人工序列
<220>
<223>  合成的-引物NA30
<400>  41
atcgacaatt ttgttgtcaa tattgaacca tttatggctc cacgtaatac ctgcc           55
<210>  42
<211>  52
<212>  DNA
<213>  人工序列
<220>
<223>  合成的-引物NA31
<400>  42
gacaattttg ttgtcaatat tgaaccgttt atggctccac gtaatacctg cc              52
<210>  43
<211>  60
<212>  DNA
<213>  人工序列
<220>
<223>  合成的-引物NA32
<400>  43
gtgaatgcgg caggtattac gtggagccat aaatggttca atattgacaa caaaattgtc      60
<210>  44
<211>  60
<212>  DNA
<213>  人工序列
<220>
<223>  合成的-引物NA33
<400>  44
gtgaatgcgg caggtattac gtggagccat aaacggttca atattgacaa caaaattgtc      60
<210>  45
<211>  30
<212>  DNA
<213>  人工序列
<220>
<223>  合成的-引物NA34
<400>  45
ctaaaacaag taaataaacg agagatgacc                                       30
<210>  46
<211>  50
<212>  DNA
<213>  人工序列
<220>
<223>  合成的-引物NA35
<400>  46
cagcactgtg caaacacgaa agtggacgta tacggtgtga cgcctgcccg                 50
<210>  47
<211>  60
<212>  DNA
<213>  人工序列
<220>
<223>  合成的-引物NA36
<400>  47
tgcaggtcga cggatccccg gaatggcgcg tattcgagcc ggatgagtaa ttgtcaattt      60
<210>  48
<211>  17
<212>  DNA
<213>  人工序列
<220>
<223>  合成的- A2058G引物
<400>  48
gtaaggttca cggggtc                                                     17
<210>  49
<211>  20
<212>  DNA
<213>  人工序列
<220>
<223>  合成的- A2451C引物
<400>  49
ctcttgggcg gtatcagcct                                                  20
<210>  50
<211>  19
<212>  DNA
<213>  人工序列
<220>
<223>  合成的- A2451C引物
<400>  50
cgtaccactt taaatggcg                                                   19
<210>  51
<211>  20
<212>  DNA
<213>  人工序列
<220>
<223>  合成的- A2602U引物
<400>  51
cacggcagat agggaccgaa                                                  20
<210>  52
<211>  25
<212>  DNA
<213>  人工序列
<220>
<223>  合成的- A2060C引物
<400>  52
aagctatagt aaaggttcac ggggt                                            25
<210>  53
<211>  25
<212>  DNA
<213>  人工序列
<220>
<223>  合成的- A2062G引物
<400>  53
tgtcaagcta tagtaaaggt tcacg                                            25
<210>  54
<211>  25
<212>  DNA
<213>  人工序列
<220>
<223>  合成的- A2450U引物
<400>  54
tgaactcttg ggcggtatca gcctg                                            25
<210>  55
<211>  25
<212>  DNA
<213>  人工序列
<220>
<223>  合成的- U2500G引物
<400>  55
ccccaggatg tgatgagccg acatg                                            25
<210>  56
<211>  20
<212>  DNA
<213>  人工序列
<220>
<223>  合成的- A2503G引物
<400>  56
ccaggatgtg atgagccgac                                                  20
<210>  57
<211>  23
<212>  DNA
<213>  人工序列
<220>
<223>  合成的- C2611U引物
<400>  57
ttctccagcg cccacggcag ata                                              23
<210>  58
<211>  23
<212>  DNA
<213>  人工序列
<220>
<223>  合成的- C2611G引物
<400>  58
ttctccagcg cccacggcag ata                                              23
<210>  59
<211>  42
<212>  RNA
<213>  人工序列
<220>
<223>  合成的- 图4d 23s rRNA右上链
<400>  59
uccggggaga acaggcugau uuggcagcuc gguuucggcu ca                         42
<210>  60
<211>  41
<212>  RNA
<213>  人工序列
<220>
<223>  合成的- 图4d 23s rRNA左下链
<400>  60
ugagcugguu uagaacgucg ugagacguac ggucccuauc u                          41
<210>  61
<211>  19
<212>  RNA
<213>  人工序列
<220>
<223>  合成的- 图4d 23s rRNA左上链
<400>  61
agacggaaag accccguga                                                   19

Claims (36)

1.一种工程化细胞,其包含第一蛋白质翻译机制和第二蛋白质翻译机制,
a)所述第一蛋白质翻译机制包含第一工程化核糖体,所述第一工程化核糖体包含:
i)包含核糖体RNA(rRNA)和蛋白质的小亚基;
ii)包含核糖体RNA(rRNA)和蛋白质的大亚基;和
iii)连接部分,
其中所述连接部分包含多核苷酸序列并将小亚基的rRNA与大亚基的rRNA系连起来;
b)所述第二蛋白质翻译机制包含第二工程化核糖体,所述第二工程化核糖体包含:
i)包含rRNA和蛋白质的小亚基;和
ii)包含rRNA和蛋白质的大亚基;
其中所述第二工程化核糖体在大亚基和小亚基之间不含连接部分;和
其中所述第二工程化核糖体的小亚基包含修饰的抗SD序列以允许翻译具有与细胞的内源性细胞mRNA不同的互补和/或同源SD序列的模板,和/或
2.根据权利要求1所述的工程化细胞,其中所述第一蛋白质翻译机制和所述第二蛋白质翻译机制能够支持序列确定的聚合物的翻译。
3.根据权利要求1所述的工程化细胞,其中所述第一蛋白质翻译机制能够支持天然内源RNA的翻译。
4.根据权利要求1所述的工程化细胞,其中所述第二蛋白质翻译机制能够支持非天然外源RNA的翻译。
5.根据权利要求1所述的工程化细胞,其中所述第二工程化核糖体包含一个或多个功能改变性突变,其中所述功能改变性突变不在抗SD序列处。
6.根据权利要求1所述的工程化细胞,其中所述第二工程化核糖体的小亚基包含选自3’-GGUGUU-5’、3’-UGGUGU-5’、3’-GGUGUC-5’、3’-GUUUAG-5’、3’-UGGAAU-5’、3’GGAUCU-5’、3’-UGGAUC-5’、3’-UGGUAA-5’和3’-UGGAUC-5’的修饰的抗SD序列。
7.根据权利要求1所述的工程化细胞,其中所述第二工程化核糖体在以下一项或多项中包含功能改变性突变:
a)肽基转移酶中心(PTC);
b)新生肽出口通道(NPET);
c)与延伸因子的相互作用位点;
d)tRNA结合位点;
e)伴侣结合位点;
f)新生链修饰酶结合位点;
g)GTP酶中心。
8.根据权利要求1所述的工程化细胞,其中所述第二工程化核糖体的大亚基在23SrRNA的以下残基中的一个或多个处包含功能改变性突变:G2061、C2452、U2585、G2251、G2252、A2057、A2058、C2611、A2062、A2503、U2609、G2454和G2455。
9.根据权利要求1所述的工程化细胞,其中所述第一工程化核糖体、所述第二工程化核糖体或所述第一工程化核糖体和所述第二工程化核糖体两者包含抗生素抗性突变。
10.根据权利要求1所述的工程化细胞,其中所述第一工程化核糖体的大亚基包含23SrRNA的排列变体或突变体和/或所述小亚基包含16S rRNA的排列变体或突变体。
11.根据权利要求1所述的工程化细胞,其中所述连接部分将大亚基的螺旋与小亚基的螺旋共价结合,所述大亚基的螺旋选自螺旋10、螺旋38、螺旋42、螺旋54、螺旋58、螺旋63、螺旋78、螺旋101,所述小亚基的螺旋选自螺旋11、螺旋26、螺旋33和螺旋44。
12.一种制备序列确定的聚合物的方法,所述方法包括:
a)提供以下一项或多项:
(i)权利要求1的细胞;
(ii)源自权利要求1中任一项的细胞的无细胞提取物;
(iii)源自权利要求1的细胞的纯化的翻译系统;
b)向所述细胞或无细胞提取物提供编码所述序列确定的聚合物的mRNA;和
c)在所述细胞或无细胞提取物中翻译mRNA以提供所述序列确定的聚合物。
13.根据权利要求12所述的方法,其中所述序列确定的聚合物是在体内制备的。
14.根据权利要求12所述的方法,其中所述序列确定的聚合物是在体外制备的。
15.根据权利要求12所述的方法,其中所述无细胞提取物包含从指数生长期中期至晚期的细胞培养物或在收获时具有至少约2.0、2.5或3.0的OD600的培养物制备的S150提取物。
16.根据权利要求12所述的方法,其中编码所述序列确定的聚合物的mRNA包含修饰的SD序列,并且所述第二翻译系统的工程化核糖体包含与所述mRNA的修饰的SD序列互补的抗SD序列。
17.根据权利要求12所述的方法,其中所述序列确定的聚合物包括氨基酸聚合物。
18.根据权利要求17所述的方法,其中所述氨基酸聚合物包含经典氨基酸。
19.根据权利要求17所述的方法,其中所述氨基酸聚合物包含一种或多种非经典氨基酸。
20.根据权利要求12所述的方法,其中所述序列确定的聚合物包括非氨基酸基聚合物。
21.根据权利要求12所述的方法,其中如下提供所述mRNA:提供编码所述mRNA的DNA,和在所述细胞或所述无细胞提取物中转录所述DNA以提供所述mRNA。
22.根据权利要求21所述的方法,其中所述工程化细胞被工程化以表达转录DNA以提供mRNA的外源RNA转录酶,例如T7 RNA转录酶。
23.一种或多种多核苷酸,所述一种或多种多核苷酸编码权利要求1所述的工程化细胞的a)第一蛋白质翻译机制的工程化核糖体的rRNA和/或编码权利要求1所述的工程化细胞的b)第二蛋白质翻译机制的工程化核糖体的rRNA。
24.根据权利要求23所述的多核苷酸,其中所述多核苷酸是载体。
25.根据权利要求23所述的多核苷酸,其中所述多核苷酸还包含将由所述工程化核糖体表达的基因。
26.根据权利要求25所述的多核苷酸,其中所述基因是报道基因或选择标记物。
27.根据权利要求26所述的多核苷酸,其中所述报道基因是绿色荧光蛋白基因。
28.根据权利要求26所述的多核苷酸,其中所述选择标记物是对抗生素的抗性。
29.根据权利要求23所述的多核苷酸,其中所述第二翻译系统的工程化核糖体的rRNA包含修饰的抗SD序列,并且所述mRNA包含针对所述第二翻译系统的工程化核糖体的互补性SD序列。
30.根据权利要求23所述的多核苷酸,其中所述mRNA包含密码子并且所述密码子编码非天然氨基酸。
31.根据权利要求23所述的多核苷酸,其包含第一多核苷酸和第二多核苷酸,所述第一多核苷酸编码a)所述第一翻译系统的工程化核糖体的rRNA,并且所述第二多核苷酸包含编码a)所述第二翻译系统的工程化核糖体的rRNA的第二多核苷酸。
32.根据权利要求31所述的多核苷酸,其中所述第一多核苷酸和/或所述第二核苷酸存在于一个或多个载体上。
33.一种制备工程化核糖体的方法,所述方法包括在宿主细胞中表达权利要求23所述的多核苷酸,任选地,其中所述宿主细胞包括权利要求1所述的工程化细胞。
34.根据权利要求33所述的方法,所述方法还包括对所述宿主细胞进行选择并选择包含突变体核糖体的宿主细胞。
35.根据权利要求34所述的方法,其中所述突变体包括以下一项或多项中的突变:
a)肽基转移酶中心(PTC);
b)新生肽出口通道(NPET);
c)与延伸因子的相互作用位点;
d)tRNA结合位点;
e)伴侣结合位点;
f)新生链修饰酶结合位点;
g)GTP酶中心;
h)与易位子的相互作用位点;和
i)与促进翻译的辅助蛋白的相互作用位点。
36.根据权利要求35所述的方法,其中所述选择步骤包括阴性选择步骤、阳性选择步骤或阴性选择步骤和阳性选择步骤两者。
CN202180035057.3A 2020-03-24 2021-03-24 用于细菌细胞中蛋白质合成的完全正交系统 Pending CN115997022A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202062993860P 2020-03-24 2020-03-24
US62/993,860 2020-03-24
PCT/US2021/024006 WO2021195294A2 (en) 2020-03-24 2021-03-24 Fully orthogonal system for protein synthesis in bacterial cells

Publications (1)

Publication Number Publication Date
CN115997022A true CN115997022A (zh) 2023-04-21

Family

ID=77892667

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180035057.3A Pending CN115997022A (zh) 2020-03-24 2021-03-24 用于细菌细胞中蛋白质合成的完全正交系统

Country Status (5)

Country Link
US (1) US20230117150A1 (zh)
EP (1) EP4127183A4 (zh)
JP (1) JP2023520667A (zh)
CN (1) CN115997022A (zh)
WO (1) WO2021195294A2 (zh)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015184283A1 (en) * 2014-05-29 2015-12-03 Northwestern University Tethered ribosomes and methods of making and using thereof
US10590456B2 (en) * 2014-05-29 2020-03-17 Northwestern University Ribosomes with tethered subunits

Also Published As

Publication number Publication date
EP4127183A4 (en) 2024-04-24
WO2021195294A2 (en) 2021-09-30
US20230117150A1 (en) 2023-04-20
JP2023520667A (ja) 2023-05-18
WO2021195294A3 (en) 2021-11-18
EP4127183A2 (en) 2023-02-08

Similar Documents

Publication Publication Date Title
US8815600B2 (en) Homologous recombination-based DNA cloning methods and compositions
US20060084136A1 (en) Production of fusion proteins by cell-free protein synthesis
CN112552380A (zh) 一种SARS-CoV-2病毒的免疫原及其应用
US20190376092A1 (en) Hybrid proteins and uses thereof
CN111607613A (zh) 一种表达细胞免疫疫苗mRNA的质粒载体及其构建方法和应用
US8101355B2 (en) Method for cloning and expressing target gene by homologous recombination
KR20230134543A (ko) 신규한 조작된 뉴클레아제 및 키메라 뉴클레아제
JP2009523428A (ja) 直鎖状ベクター、宿主細胞およびクローニング法
US9187752B2 (en) Hybrid portable origin of replication plasmids
US8008016B2 (en) Vectors and methods for high throughput co-expressions
CN115997022A (zh) 用于细菌细胞中蛋白质合成的完全正交系统
KR102282778B1 (ko) 재조합 미생물 및 이의 사용 방법
CN113423823A (zh) 经基因组编辑的细胞的制造方法
US20220049260A1 (en) Inducible expression system for plasmid-free production of a protein of interest
US8628954B2 (en) Expression cassette, use of the expression cassette, vector, host cell, a method for producing a polypeptide
JP6640226B2 (ja) 発現エレメント、発現カセット、及びそれらを含むベクター
US20040161753A1 (en) Creation and identification of proteins having new dna binding specificities
US20200392482A1 (en) Self-diversifying systems and methods of use thereof
Wiechert et al. Deciphering the rules underlying xenogeneic silencing and counter-silencing of Lsr2-like proteins
Boulter et al. A PCR-based method for isolation of genomic DNA flanking a known DNA sequence
Jin et al. An efficient site-directed mutagenesis method for ColE1-type ori plasmid
CN114480470A (zh) 高通量制备模式生物基因编辑突变体的方法及相关质粒
CN111850037A (zh) 一种piggyBac转座子高通量遗传筛选方法
Donahue Modular assembly of genes and plasmids using PCR-based and ribozyme-based gene engineering methods

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40085420

Country of ref document: HK