CN110234765A - 分离的多核苷酸和多肽及使用它们来表达感兴趣的表达产物的方法 - Google Patents

分离的多核苷酸和多肽及使用它们来表达感兴趣的表达产物的方法 Download PDF

Info

Publication number
CN110234765A
CN110234765A CN201780084829.6A CN201780084829A CN110234765A CN 110234765 A CN110234765 A CN 110234765A CN 201780084829 A CN201780084829 A CN 201780084829A CN 110234765 A CN110234765 A CN 110234765A
Authority
CN
China
Prior art keywords
aimr
polynucleotides
nucleic acid
peptide
response element
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201780084829.6A
Other languages
English (en)
Inventor
R.索瑞克
G.阿米泰
E.佐哈
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yeda Research and Development Co Ltd
Original Assignee
Yeda Research and Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yeda Research and Development Co Ltd filed Critical Yeda Research and Development Co Ltd
Publication of CN110234765A publication Critical patent/CN110234765A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/635Externally inducible repressor mediated regulation of gene expression, e.g. tetR inducible by tetracyline
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/67General methods for enhancing the expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/75Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Bacillus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N7/00Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2795/00Bacteriophages
    • C12N2795/00011Details
    • C12N2795/00022New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2795/00Bacteriophages
    • C12N2795/00011Details
    • C12N2795/00032Use of virus as therapeutic agent, other than vaccine, e.g. as cytolytic agent
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2795/00Bacteriophages
    • C12N2795/00011Details
    • C12N2795/10011Details dsDNA Bacteriophages
    • C12N2795/10311Siphoviridae
    • C12N2795/10341Use of virus, viral particle or viral elements as a vector
    • C12N2795/10343Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Virology (AREA)
  • Immunology (AREA)
  • Mycology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明提供了表达感兴趣的表达产物的方法。因此,本发明提供了一种方法,其包括在细胞中引入多核苷酸,该多核苷酸包含可操作地连接到编码感兴趣的表达产物的核酸序列的Aim R响应元件,以及使所述细胞与包含XXXXGG/A的氨基酸序列的Aim P肽接触,其中所述Aim P肽能够与所述Aim R多肽结合,并使所述Aim R多肽与所述Aim R响应元件分离。本发明还提供了制品、分离的肽、多核苷酸和核酸构建体。

Description

分离的多核苷酸和多肽及使用它们来表达感兴趣的表达产物 的方法
发明领域和背景
本发明,在其一些实施方案中,涉及分离的多核苷酸和多肽及使用所述多核苷酸和多肽来表达感兴趣的表达产物的方法。
重组DNA技术,包括诱导基因表达和基因组编辑技术,为在多种类型的生物体(包括动植物)中控制基因表达和精确、靶向修饰基因组序列提供了机会。一般说来,合理的基因表达,以及特别是基因组编辑,通过插入或删除特定的遗传特征在基础研究、药物发现和基于细胞的医学领域具有巨大的潜力。这包括纠正引起疾病的突变,将治疗基因添加到基因组的特定位置,删除有害基因或基因组序列,以及改变植物基因组以产生改良的作物。现有的基因组编辑方法包括,例如,锌指核酸酶、TALEN和CRISPR-Cas9系统的使用。
发明概述
根据本发明的一些实施方案的一个方面,提供了一种表达感兴趣的表达产物的方法,该方法包括:
(i) 在细胞中引入多核苷酸,所述多核苷酸包含可操作地连接到编码感兴趣的表达产物的核酸序列的AimR响应元件,其中AimR包含用于结合AimR响应元件的DNA结合结构域,AimR包含螺旋-转角-螺旋(HTH)基序和三十四肽重复序列(TPR)结构域;和
(ii) 使细胞与包含XXXXGG/A的氨基酸序列的AimP肽接触,其中AimP肽能够结合AimR多肽,并将AimR多肽与AimR响应元件分离,
从而表达感兴趣的表达产物。
根据本发明的一些实施方案的一个方面,提供了一种表达感兴趣的表达产物的方法,该方法包括在细胞中引入多核苷酸,所述多核苷酸包含可操作地连接到编码感兴趣的表达产物的异源核酸序列的AimR响应元件,其中AimR包含用于结合AimR响应元件的DNA结合结构域,AimR包含螺旋-转角-螺旋(HTH)基序和三十四肽重复序列(TPR)结构域,从而表达感兴趣的表达产物。
根据本发明的一些实施方案的一个方面,提供了一种表达感兴趣的表达产物的方法,该方法包括在细胞中引入多核苷酸,所述多核苷酸包含可操作地连接到编码感兴趣的表达产物的核酸序列的AimR响应元件;和包含AimR多核苷酸和顺式作用调节元件的核酸构建体,所述顺式作用调节元件与AimR异源,用于指导所述AimR多核苷酸的表达,
其中AimR包含用于结合AimR响应元件的DNA结合结构域,AimR包含螺旋-转角-螺旋(HTH)基序和三十四肽重复序列(TPR)结构域,从而表达感兴趣的表达产物。
根据本发明的一些实施方案,该方法包括在细胞中引入编码AimR的多核苷酸。
根据本发明的一些实施方案,该方法包括使细胞与AimP肽或编码该肽的核酸序列接触,AimP肽包含XXXXGG/A的氨基酸序列,其中AimP肽能够结合AimR多肽,并将AimR多肽与AimR响应元件分离。
根据本发明的一些实施方案,该方法包括使细胞与能够下调AimR响应元件的表达和/或活性的试剂接触。
根据本发明的一些实施方案,感兴趣的表达产物对细胞是内源性的。
根据本发明的一些实施方案,感兴趣的表达产物对细胞是外源性的。
根据本发明的一些实施方案的一个方面,提供了一种经鉴定表达感兴趣的表达产物的制品,其包括包装以下至少两种物质的包装材料:
(i) 包含AimR响应元件的多核苷酸,其中AimR包含用于结合AimR响应元件的DNA结合结构域,AimR包含螺旋-转角-螺旋(HTH)基序和三十四肽重复序列(TPR)结构域;
(ii) 编码AimR的多核苷酸;
(iii) 包含XXXXGG/A的氨基酸序列的AimP肽或编码该肽的核酸序列,其中AimP肽能够结合AimR多肽,并将AimR多肽与AimR响应元件分离;和/或
(iv) 能够下调AimR响应元件的表达和/或活性的试剂。
根据本发明的一些实施方案,编码AimR的多核苷酸被包含在核酸构建体中,所述核酸构建体包含对AimR为异源性的顺式作用调节元件,用于指导AimR多核苷酸的表达。
根据本发明的一些实施方案,制品包含多克隆位点(MCS)。
根据本发明的一些实施方案,制品包含编码感兴趣的表达产物的多核苷酸。
根据本发明的一些实施方案,感兴趣的表达产物是DNA编辑剂。
根据本发明的一些实施方案,AimR响应元件包含用于结合所述AimR和AimX多核苷酸的核酸序列,其中AimX多核苷酸或由AimX多核苷酸编码的AimX多肽能够抑制在宿主细菌中表达AimR的温和噬菌体的溶原性。
根据本发明的一些实施方案,感兴趣的表达产物是AimX依赖的DNA编辑剂。
根据本发明的一些实施方案,该方法包括在细胞中引入由DNA编辑剂整合到细胞基因组中的核酸序列。
根据本发明的一些实施方案,DNA编辑剂是整合酶。
根据本发明的一些实施方案,DNA编辑剂选自锌指核酸酶、2类CRISPR/Cas的效应蛋白(如Cas9、Cpf1、C2c1、C2c3)和TALEN。
根据本发明的一些实施方案的一个方面,提供了一种分离的包含XXXXGG/A的氨基酸序列的AimP肽,其中肽能够结合AimR多肽,该多肽包含用于与AimR响应元件结合的DNA结合结构域,AimR包含螺旋-转角-螺旋(HTH)基序和三十四肽重复序列(TPR)结构域;并将AimR多肽与AimR响应元件分离。
根据本发明的一些实施方案,提供了一种编码本发明的肽的分离多核苷酸。
根据本发明的一些实施方案的一个方面,提供了一种分离的AimR多肽,该多肽包含用于与AimR响应元件结合的DNA结合结构域,AimR包含螺旋-转角-螺旋(HTH)基序和三十四肽重复序列(TPR)结构域。
根据本发明的一些实施方案,提供了一种编码本发明的多肽的分离多核苷酸。
根据本发明的一些实施方案的一个方面,提供了一种包含AimR响应元件的分离多核苷酸,其中AimR包含用于结合AimR响应元件的DNA结合结构域,AimR包含螺旋-转角-螺旋(HTH)基序和三十四肽重复序列(TPR)结构域。
根据本发明的一些实施方案,AimR响应元件包含用于结合所述AimR和AimX多核苷酸的核酸序列,其中AimX多核苷酸或由AimX多核苷酸编码的AimX多肽能够抑制在宿主细菌中表达所述AimR的温和噬菌体的溶原性。
根据本发明的一些实施方案,提供了一种由本发明的多核苷酸编码的分离多肽。
根据本发明的一些实施方案,提供了一种包含本发明的多核苷酸的分离多核苷酸。
根据本发明的一些实施方案,提供了一种编码仲裁系统(arbitrium system)的分离多核苷酸,包含本发明的多核苷酸,其中仲裁系统能够调节在宿主细菌中表达仲裁系统的噬菌体的溶原性。
根据本发明的一些实施方案,提供了一种包含本发明的多核苷酸和多克隆位点(MCS)的核酸构建体。
根据本发明的一些实施方案,提供了一种包含本发明的多核苷酸和多克隆位点(MCS)的核酸构建体。
根据本发明的一些实施方案,提供了一种包含本发明的多核苷酸或本发明的核酸构建体和顺式作用调节元件的核酸构建体,所述顺式作用调节元件对AimP、AimR、AimR响应元件和/或AimX是异源的,以指导多核苷酸的表达。
根据本发明的一些实施方案,本发明的核酸构建体为包含至少两个核酸构建体的核酸构建体系统,至少两个核酸构建体各自表达至少一个多核苷酸。
根据本发明的一些实施方案,所述构建体编码包含多核苷酸的多顺反子mRNA。
根据本发明的一些实施方案的一个方面,提供了一种能够下调AimR响应元件的表达和/或活性的分离核酸试剂,其中AimR包含用于结合AimR响应元件的DNA结合结构域,AimR包含螺旋-转角-螺旋(HTH)基序和三十四肽重复序列(TPR)结构域。
根据本发明的一些实施方案,提供了一种经鉴定表达感兴趣的表达产物的制品,其包含包装以下的包装材料:
至少一种以下物质:
(a)(i) 本发明的分离的多核苷酸,
(a)(ii) 包含本发明的多核苷酸和多克隆位点(MCS)的核酸构建体,和/或
(a)(iii) 包含本发明的多核苷酸和顺式作用调节元件的核酸构建体,所述顺式作用调节元件对AimR或AimX是异源的,用于指导多核苷酸表达;
和至少一种以下物质:
(b)(i) 本发明的分离的肽,
(b)(ii) 本发明的分离的多核苷酸,
(b)(iii) 包含本发明的多核苷酸和MCS的核酸构建体,
(b)(iv) 包含本发明的多核苷酸和顺式作用调节元件的核酸构建体,所述顺式作用调节元件对AimP是异源的,用于指导多核苷酸的表达,和/或
(b)(v) 本发明的分离剂。
根据本发明的一些实施方案,本发明的分离的多核苷酸、核酸构建体或制品包含编码感兴趣的表达产物的核酸序列。
根据本发明的一些实施方案,感兴趣的表达产物是DNA编辑剂。
根据本发明的一些实施方案,AimP肽能够导致在宿主细菌中表达所述AimR的温和噬菌体的溶原性。
根据本发明的一些实施方案,AimP包含选自SEQ ID NOs: 269-283和285-286的氨基酸序列。
根据本发明的一些实施方案,AimR包含与选自SEQ ID NO: 1-113的序列的具有至少80 %同一性的核酸序列和/或与选自SEQ ID NOs: 114-226的序列具有至少80 %同一性的氨基酸序列。
根据本发明的一些实施方案,AimR包含选自SEQ ID NO: 1-113的核酸序列和/或选自SEQ ID NOs: 114-226的氨基酸序列。
根据本发明的一些实施方案,AimR响应元件包含选自SEQ ID NOs: 287-334的核酸序列。
根据本发明的一些实施方案,AimR响应元件包含SEQ ID NO: 378。
根据本发明的一些实施方案,AimX包含在SEQ ID NO: 336中所述的核酸序列。
根据本发明的一些实施方案,AimR和AimP和/或AimR响应元件在表达它们的温和噬菌体的核酸分子上5’至3’依次定位。
根据本发明的一些实施方案,AimP和AimR响应元件在表达它们的温和噬菌体的核酸分子上5’至3’依次定位。
根据本发明的一些实施方案,AimR和AimP和/或AimR响应元件在温和噬菌体的基因组中5’至3’依次定位。
根据本发明的一些实施方案,AimP和AimR响应元件在温和噬菌体的基因组中5’至3’依次定位。
除非另有限定,否则在本文中使用的所有技术和/或科学术语具有如与本发明所属领域中的普通技术人员通常理解的相同意义。虽然在实施或测试本发明的实施方案中可以使用类似或等同于本文描述的方法和材料,但下文描述示例性方法和/或材料。在冲突的情况下,以本专利说明书,包括定义为准。另外,材料、方法和实施例仅是说明性的而不意图必然是限制性的。
几幅附图的简要说明
仅通过举例的方式,并参照附图,本文描述了本发明的一些实施方案。现在详细地具体参照附图,需要强调的是,示出的详情是通过举例的方式并用于本发明的实施方案的说明性讨论。在这方面,连同附图一起的描述使本领域技术人员明了可以如何实施本发明的实施方案。
在附图中:
图1A-E展示了条件培养基对噬菌体phi3T的感染动力学的影响。图1A是对照和条件培养基的准备方案的示意图。图1B是显示被phi3T以感染复数(MOI) = 0.1感染的枯草芽孢杆菌(B. subtilis) 168在对照和条件培养基中的生长曲线的图。图1C是显示被phi3T以MOI=0.1感染的枯草芽孢杆菌菌株DS4979 5 (oppD::kan)在对照和条件培养基中的生长曲线的图。对于图1B-C,数据表示3个生物复制的平均数,每个有3个技术复制,而误差棒表示标准误差。图1D是一张半定量PCR照片,显示枯草芽孢杆菌168在对照和条件培养基中,被phi3T感染的时间过程中的噬菌体溶原性。图1E是一幅显示被phi3T以MOI=0.1感染的枯草芽孢杆菌168在对照和条件培养基(用和不用蛋白酶K预处理)中的生长曲线的图。数据表示3个技术复制的平均数,而误差棒表示标准错误。
图2A-G展示了仲裁肽(arbitrium peptide)及其受体。图2A是在phi3T噬菌体基因组中的仲裁基因座(arbitrium locus)的示意图。图2B显示了AimP前-前肽(pre-pro-peptide)中胞外蛋白酶的切割信号。所展示的是枯草芽孢杆菌群体感应(quorum sensing)Phr基因的氨基酸序列,这些基因被划分到它们的结构域中1。枯草芽孢杆菌胞外蛋白酶在各自序列中的识别信号被标记为绿色。phi3T AimP蛋白中的信号肽用SignalP 4.1网络服务器预测8。右边的SEQ ID NOs分别代表信号肽、前肽和成熟肽的序列。图2C显示了验证SAIRGA (SEQ ID NO: 269)肽在条件培养基中存在的质谱直方图。左侧小图显示在LB中浓度为100 nM的参考合成SAIRGA肽。B2、Y3、Y4和Y5是肽片段离子。中间小图显示对照培养基和右侧小图显示条件培养基。在所有的小图中,箭头描绘了SAIRGA肽的预期保留时间。图2D是一幅显示被phi3T以MOI=0.1感染的枯草芽孢杆菌168在补充有合成的SAIRGA (SEQ IDNO: 269)肽的LB培养基中的生长曲线的图。数字代表肽浓度。所显示的是3个生物复制的平均值,每个都有3个技术复制。图2E显示了证实6个氨基酸仲裁肽的5个氨基酸版本不能指导溶原性的图。显示了被phi3T以MOI=0.1感染的枯草芽孢杆菌168在补充有合成的SAIRGA(SEQ ID NO: 269,左小图)、AIRGA (SEQ ID NO: 335,中间小图)或SAIRG (SEQ ID NO:355)肽的LB培养基中的生长曲线。所显示的是3个生物复制的平均值,每个都有3个技术复制。误差棒表示标准误差。图2F显示溶原化细菌的部分的基于测序的定量测定。顶部-分析原理图:在感染期间从细胞中提取总DNA,并进行Illumina全基因组测序。溶原性百分比被计算为在涵盖噬菌体/细菌整合连接处的读取总数中跨越该连接处的读取分数。整合连接处被标记为红色;整合的噬菌体DNA是绿色的。底部-在用phi3T以MOI = 2感染枯草芽孢杆菌168的过程中四个时间点的溶原化细菌百分数。显示的是三个生物复制的平均值,误差棒表示标准误差。图2G是显示纯化的AimR (C-端6xHis-标记,浓度为200 nM)和合成的SAIRGA(SEQ ID NO: 269)或GMPRGA (SEQ ID NO: 271)肽(浓度范围为9-4000nM)之间结合的微量热泳动(MST)分析的图表。3个复制的平均值和标准误差被示出。
图3A-F显示了一种指导芽孢杆菌噬菌体的溶原性的保守肽通信密码。图3A是测序基因组(以红色标记)中所选择的AimR同系物实例的示意图示。AimR同系物的基因座标记,以及与phi3T AimR的百分比同一性被指明。成熟的仲裁肽(AimP ORF的最后6个氨基酸)在AimP同系物下方指明(以橙色标记)。图3B是一个饼状图,显示了仲裁肽在AimP的112个同系物中的分布情况(见表3)。所示的肽为SAIRGA (SEQ ID NO: 269)、GFTVGA (SEQ ID NO:273)、SASRGA (SEQ ID NO: 275)、GFGRGA (SEQ ID NO: 272)、GVVRGA (SEQ ID NO: 276)、GMPRGA (SEQ ID NO: 271)、AMGNGG (SEQ ID NO: 278)、DPGRGG (SEQ ID NO: 274)、GFGHGA (SEQ ID NO: 282)、GFPRGA (SEQ ID NO: 281)、GIVRGA (SEQ ID NO: 286)、SIIRGA (SEQ ID NO: 270)、TIGRGG (SEQ ID NO: 280)、NPGRGA (SEQ ID NO: 285)、SIGHGA (SEQ ID NO: 283)、SPSRGA (SEQ ID NO: 277)和TIGRG (SEQ ID NO: 279)。图3C显示仲裁肽类型的氨基酸谱。图3D-E是显示被spBeta以MOI = 0.1感染的枯草芽孢杆菌BEST7003在补充有合成的GMPRGA (SEQ ID NO: 271,图3D)和SAIRGA (SEQ ID NO: 269,图3E)肽的LB培养基中的生长曲线的图。图3F是显示被phi3T以MOI = 0.1感染的枯草芽孢杆菌168在补充有合成的GMPRGA (SEQ ID NO: 271)肽的LB培养基中的生长曲线的图。图3D-F中的数据代表3个生物复制的平均值,每个具有3个技术复制。误差棒表示标准误差。
图4A-I显示仲裁系统中的DNA结合及转录调节。图4A是显示在感染后15分钟(用或不用1 µM的SAIRGA (SEQ ID NO: 269)肽)的His-标记的AimR的ChIP-seq的图。对于噬菌体基因组中的每个核苷酸,示出了在没有肽的感染期间的测序拉下的DNA量与当肽存在于培养基中的情况下拉下的DNA量之间的比率。该比率被标准化为每个库中的测序读取量。图4B显示了图4A所示图的噬菌体基因组中一个放大的区域。图4C是显示存在或不存在SAIRGA(SEQ ID NO: 269)或GMPRGA (SEQ ID NO: 271)肽时纯化的AimR的凝胶过滤结果的图。插图给出了使用已知大小的蛋白质进行凝胶过滤的校准曲线。图4D是展示AimX基因在感染过程中的表达的条形图。RNA-seq读取计数被标准化为每个RNA-seq库中命中噬菌体基因组的读取数。对两个时间点分别进行标准化。为单个生物复制提供了数据(每个实验中对于野生型细菌为3个,对于aimR敲减菌株为2个)。图4E-G显示了在感染后5 min (图4E)、10 min(图4F)和20 min (图4G),仲裁基因座的RNA-seq覆盖率。RNA-seq覆盖率被标准化为每个RNA-seq库中命中噬菌体基因组的读取数。图4H是展示phi3T-感染期间野生型和dCas9-沉默菌株的生长曲线的图。菌株在t=0时以MOI=0.1被感染。dCas9由木糖0.2 %诱导。在木糖启动子下也克隆了aimX基因(紫色线)。所显示的是3个生物复制的平均值,每个都有3个技术复制。误差棒表示标准误差。图4I显示了在感染后20分钟的噬菌体基因表达。每个点代表单一的噬菌体基因。轴表示对于RNA-seq库大小经标准化为对照后来自3个复制的平均RNA-seq读取计数/基因。X轴代表当噬菌体感染是在1 µM的SAIRGA (SEQ ID NO: 269)肽存在下时的表达;和Y轴代表在没有肽的情况下的表达。
图5A-C是所提出的基于通信的裂解-溶原性决策的机械模型的示意图。图5A展示了噬菌体感染细菌培养过程中仲裁积聚的动力学过程。图5B显示,当噬菌体第一次与细菌群体相遇时,培养基中没有仲裁。早期基因aimRaimP在感染后立即表达。AimR作为一种二聚体,结合了aimX上游的噬菌体DNA,并激活了AimX表达。AimX是溶原性的抑制剂,指导噬菌体至裂解周期。同时,表达、分泌和细胞外加工AimP,产生成熟肽。图5C显示,在感染动力学的后期,仲裁肽在培养基中积累,并被OPP转运蛋白内化到细菌中。在此阶段,当噬菌体感染细菌时,表达的AimR受体与仲裁分子结合,不能激活AimX的表达,导致溶原性偏好。
图6是构建体#1的示意图:噬菌体Phi3T AimR-AimP-AimX基因座(红色矩形)与荧光报告基因(gfp)基因融合,插入pDR111质粒的EcoRI/BamHI-裂解位点内产生pDR111-构建体#1。
图7是具有在amyE基因内插入枯草芽孢杆菌(Bacillus subtilis) BEST7003染色体中的抗生素抗性基因的构建体#1的示意图。
图8是具有在amyE基因内插入枯草芽孢杆菌BEST7003染色体中的抗生素抗性基因的构建体#2的示意图。
图9A-B是显示野生型枯草芽孢杆菌BEST7003 (WT)和含有构建体#1 (图9A)或构建体#2 (图9B)的枯草芽孢杆菌BEST7003,在补充有指定浓度的SAIRGA (SEQ ID NO: 269)肽的LB生长培养基中培养后的生长曲线和GFP荧光水平的图。所显示的为技术复制(n = 3)的平均值。荧光以任意单位(a.u)显示。
本发明的具体实施方案的描述
本发明,在其一些实施方案中,涉及分离的多核苷酸和多肽及使用多核苷酸和多肽表达感兴趣的表达产物的方法。
在详细解释本发明的至少一个实施方案以前,应当理解的是,本发明的应用不一定限于在以下描述中阐述的或通过实施例举例说明的细节。本发明能够以各种方式实施或进行其他实施方案。
近年来发展起来的包括诱导型基因表达和基因组编辑技术在内的重组DNA技术允许在包括植物和动物的多种类型的生物体中控制基因表达,以及精确和靶向修饰基因组序列。
在构思本发明的实施方案并将其还原为实践的同时,本发明人已设计一种新的表达工具,该工具基于利用温和病毒的新发现的通信系统,以协调裂解-溶原性决策。
如在下文和在接着的实施例部分中所示出的,本发明人表明,病毒(spBeta家族噬菌体)在感染其杆菌(Bacillus)宿主细胞时产生一个6个氨基酸长的肽,其被释放到培养基中(实施例1-2,图1A-E和2A-F)。这种肽以浓度依赖性的方式导致噬菌体在其感染的宿主中的溶原性(实施例2,图2D)。接下来,本发明人能够识别由噬菌体家族的不同物种编码的肽中的一个共有基序;在第5位的甘氨酸残基,第6位的甘氨酸或丙氨酸,和任选的第4位的带正电荷的残基(实施例3,图2G和3A-C)。本发明人进一步证明,这一新的通讯系统,本发明人称之为“仲裁”系统,由3个噬菌体基因编码,它们分别表示为:AimP,产生肽;AimR,胞内肽受体;和AimX,一种溶原性的负调节剂(实施例2-4,图2A-G、3A-C和4A-I和表3)。AimR,作为一种同二聚体,是AimX的转录激活因子;当AimR被肽结合时,其成为一种单体,且AimX的转录被抑制而导致溶原性。不受理论的束缚,提示仲裁系统使后代噬菌体颗粒能够与其前辈通讯,即估计近期在先感染的数量,从而决定是否采用裂解或溶原周期(实施例4,图5A-C)。
综上所述,本教义表明仲裁系统及其功能片段可用于例如总体上控制感兴趣的表达产物的表达,并特别控制DNA序列与目标基因组的整合。如在下文和在接着的实施例部分中进一步描述的,AimR可结合AimR响应元件,从而导致激活与AimR响应元件(如AimR结合位点)可操作地连接的感兴趣表达产物的转录;而AimP与AimR的结合抑制感兴趣的表达产物的转录。
本发明人进一步证明,在与噬菌体无关的背景下,AimR-AimP系统可以起着控制可操作地连接于AimR结合位点的GFP报告基因在枯草芽孢杆菌BEST7003中表达的作用(实施例5,图6-8和9A-B)。因此,根据本发明的第一个方面,提供一种分离的包含XXXXGG/A的氨基酸序列的AimP肽,其中所述肽能够结合AimR多肽,该多肽包含用于与AimR响应元件结合的DNA结合结构域,所述AimR包含螺旋-转角-螺旋(HTH)基序和三十四肽重复序列(TPR)结构域,并将所述AimR多肽与所述AimR响应元件分离。
根据本发明的另一方面,提供一种分离的AimR多肽,该多肽包含用于与AimR响应元件结合的DNA结合结构域,所述AimR包含螺旋-转角-螺旋(HTH)基序和三十四肽重复序列(TPR)结构域。
如在本文中使用的,术语“分离的”是指至少部分地与自然环境、生理环境如微生物或噬菌体分离。
如在本文中使用的,术语“AimR”指多核苷酸和表达产物如AimR基因的多肽。AimR基因的产物含有用于结合AimR响应元件的DNA结合结构域。AimR基因的产物含有螺旋-转角-螺旋(HTH)基序和三十四肽重复序列(TPR)结构域。
如在本文中使用的,短语“DNA结合结构域(DBD)”指可识别和结合特定核酸序列(如AimR响应元件)的基序。DBD可以序列特异性方式识别和结合双链核酸序列(如DNA)。通常,DBD是蛋白结构域的结构基序。根据特定的实施方案,DBD包含螺旋-转角-螺旋(HTH)基序。
如在本文中使用的,术语“螺旋-转角-螺旋(HTH)基序”指一个熟知的DNA结合基序,其与DNA大沟的形状互补,具有mfap编号IPR000047 (见例如Ann Rev. of Biochem.(1984) 53:293, Brunelle和Schleif J. Mol. Biol. (1989) 209:607)。结构域可用序列XXXPhoAlaXXPhoGlyPhoXXXXPhoXXPhoXX (SEQ ID NO: 335)说明,其中X是任何氨基酸和Pho是疏水性氨基酸。
如在本文中使用的,术语“三十四肽重复序列(TPR)结构域”指在3-16个基序串联阵列中发现的一个简并的34个氨基酸共有序列,该序列被认为介导蛋白-蛋白结合家族:TPR_1 (PF00515)。TPR结构域形成两个以转角分离的反平行的α-螺旋,形成一个具有两性分子沟的结构[见例如Hirano et al. (1990), Cell, 60:319-328]。
根据特定的实施方案,AimR多核苷酸具有与选自SEQ ID NO: 1-113的核酸的至少80 %同一性。
根据特定的实施方案,AimR多核苷酸具有与选自SEQ ID NO: 1-113的核酸的至少85 %、至少90 %、至少95 %同一性。
根据特定的实施方案,AimR多肽具有与选自SEQ ID NOs: 114-226的氨基酸序列的至少80 %同一性。
根据特定的实施方案,AimR多肽具有与选自SEQ ID NOs: 114-226的氨基酸序列的至少85 %、至少90 %、至少95 %同一性。
根据特定的实施方案,AimR多肽具有与SEQ ID NO: 114的至少35 %、至少40 %、至少45 %、至少50 %、至少55 %、至少60 %、至少70 %、至少80 %、至少85 %、至少90 %或100 %同一性。
可以使用任何蛋白质比对算法或基于编码多肽的多核苷酸序列的任何核酸序列比对算法来确定序列的同一性,例如Blast、ClustalW、MUSCLE和Hhpred。
根据特定的实施方案,AimR氨基酸序列选自SEQ ID NOs: 114-226。
根据特定的实施方案,AimR核酸序列选自SEQ ID NOs: 1-113。
根据特定的实施方案,AimR包含SEQ ID NO: 114。
本发明人发现,在缺乏AimP肽的情况下,AimR以二聚体的形式结合噬菌体DNA并作为转录激活剂(如AimX)发挥作用。在与AimP肽结合后,AimR将其寡聚状态从活性二聚体转变为非活性单体,导致例如AimX转录的降低。
因此,根据某些实施方案,AimR多肽能够结合由XXXXGG/A的氨基酸序列(如下文进一步描述的)组成的AimR肽;以及在不存在AimP的情况下结合DNA (即AimR响应元件)并激活基因表达(即转录因子)。
测定转录因子(如AimR)与DNA (如AimR响应元件)结合的方法是本领域熟知的并包括,但不限于染色质免疫沉淀(ChIP)分析、DNA电泳迁移率分析(EMSA)、DNA拉下分析(DNAPull-down Assay)和微板捕获和检测分析。
根据特定的实施方案,AimR结合DNA作为二聚体。评估二聚化的方法是本领域熟知的,并在下面的实施例部分作了进一步的描述,并包括在凝胶过滤柱上的迁移方法。
根据特定的实施方案,术语“AimR”指全长AimR。根据其它特定的实施方案,术语“AimR”指维持如本文所述的活性的AimR片段。
术语“AimR”还指功能AimR同系物,其表现出如本文所述的所需活性。这样的同系物可以是与多肽SEQ ID NOs: 114-226有例如至少80 %、至少81 %、至少82 %、至少83 %、至少84 %、至少85 %、至少86 %、至少87 %、至少88 %、至少89 %、至少90 %、至少91 %、至少92%、至少93 %、至少94 %、至少95 %、至少96 %、至少97 %、至少98 %、至少99 %或100 %的同一性或同源性,或与编码相同物质的多核苷酸有80 %、至少81 %、至少82 %、至少83 %、至少84%、至少85 %、至少86 %、至少87 %、至少88 %、至少89 %、至少90 %、至少91 %、至少92 %、至少93 %、至少94 %、至少95 %、至少96 %、至少97 %、至少98 %、至少99 %或100 %同一性(如上文和下文进一步描述的)。同系物也可指直系同源、缺失、插入或替代变体,包括氨基酸替代。
序列同一性或同源性可使用任何蛋白或核酸序列比对算法例如Blast、ClustalW、MUSCLE和Hhpred测定。
如在本文中使用的,术语“可操作地连接”指与其它核酸序列具有功能关系的核酸序列。根据特定的实施方案,当调节序列(例如AimR结合位点)控制和调节核酸序列的转录和/或翻译时,核酸序列被"可操作地连接"到调节序列。根据一个实施方案,调节元件以顺式作用于它所调控的核酸序列。根据另一个实施方案,调节元件以反式作用于它所调控的核酸序列。根据特定的实施方案,调节序列被放置在它所调控的核酸序列的上游。根据特定的实施方案,术语"可操作地连接"包括具有要表达的核酸序列的适当起始信号(例如ATG)上游,以及保持正确的阅读框,以允许在调控序列控制下表达核酸序列,并表达由核酸序列编码的所需产物。
根据特定的实施方案,术语“AimR响应元件”指全长AimR响应元件。根据其它特定的实施方案,术语“AimR响应元件”指维持如本文所述活性的AimR响应元件的片段。根据特定的实施方案,AimR响应元件是4-100、4-50、4-30或4-10个核酸长度。
根据特定的实施方案,AimR响应元件包含用于结合AimR (即AimR结合位点)的核酸序列。
根据特定的实施方案,AimR响应元件包含选自SEQ ID NOs: 287-334的核酸序列。
根据特定的实施方案,AimR响应元件被包含在选自SEQ ID NOs: 287-334的核酸序列中。
根据特定的实施方案,AimR响应元件包含SEQ ID NO: 378。
根据特定的实施方案,AimR响应元件被包含在SEQ ID NO: 378中。
根据特定的实施方案,AimR响应元件包含SEQ ID NOs: 287-334或378的片段,其作为结合AimR的核酸序列(即AimR结合位点),维持SEQ ID NOs: 287-334或378活性,如通过例如染色质免疫沉淀(ChIP)分析、DNA电泳迁移率分析(EMSA)、微板捕获和检测分析,或DNA拉下分析所测定的。
根据特定的实施方案,AimR响应元件包含用于结合AimR (即AimR结合位点)和AimX的核酸序列。因此,本发明的特定实施方案公开了AimR与其结合位点的结合控制了AimR的表达,这依次控制了感兴趣的表达产物的表达。
术语“AimR响应元件”还指表现出所需的活性(即结合AimR)的功能性AIMR响应元件同系物。这样的同系物可以与多核苷酸SEQ ID NOs: 287-334和378具有例如至少80 %、至少81 %、至少82 %、至少83 %、至少84 %、至少85 %、至少86 %、至少87 %、至少88 %、至少89 %、至少90 %、至少91 %、至少92 %、至少93 %、至少94 %、至少95 %、至少96 %、至少97 %、至少98 %、至少99 %或100 %同一性或同源性。同系物也可指直系同源、缺失、插入或替代变体,包括氨基酸替代。
下面的表3列出了包含AimR响应元件的AIMR及其同源序列,其可根据某些实施方案使用。
如在本文中使用的,术语“AimP”指具有XXXXGG/A的氨基酸序列的肽,其中X 是任何氨基酸或编码所述氨基酸的核酸。根据特定的实施方案,AimP具有XXXX1GG/A的氨基酸序列,其中X是任何氨基酸和其中X1是带正电荷的氨基酸。根据一个特定的实施方案,AimP是AimP基因的产物。
所述肽可以长至例如超过50个氨基酸(例如,51-80个氨基酸、51-100个氨基酸、100-200个氨基酸)或短至例如6-50个氨基酸长度。根据特定的实施方案,所述肽为6个氨基酸长度。
根据特定的实施方案,AimP包含选自SEQ ID NOs: 269-283和285-286的氨基酸序列。
根据特定的实施方案,AimP肽包含SAIRGA (SEQ ID NO: 269)或GMPRGA (SEQ IDNO: 271)氨基酸序列。
根据特定的实施方案,AimP肽包含SAIRGA (SEQ ID NO: 269)氨基酸序列。
功能性的AimP肽可结合AimR多肽并使AimR多肽与DNA和特别是与AimR响应元件分离。
如在本文中使用的,术语“分离”指包含AimR和AimR响应元件的复合物减少至少30%,如本领域已知的分析法,例如染色质免疫沉淀(ChIP)分析、DNA电泳迁移率分析(EMSA)、DNA拉下分析和微板捕获和检测分析所证明的。
根据特定的实施方案,功能性的AimP可导致在宿主细菌中表达AimR的温和噬菌体的溶原性。分析噬菌体溶原性的方法在下文描述。
术语“AimP”也指功能性的AimP同系物,其表现出如本文所述的所需活性。这样的同系物可以与肽SEQ ID NOs: 269-283和285-286具有例如至少80 %、至少81 %、至少82 %、至少83 %、至少84 %、至少85 %、至少86 %、至少87 %、至少88 %、至少89 %、至少90 %、至少91 %、至少92 %、至少93 %、至少94 %、至少95 %、至少96 %、至少97 %、至少98 %、至少99 %或100 %同一性或同源性。同系物也可指直系同源、缺失、插入或替代变体,包括氨基酸替代。
下面的表3列出了可根据某些实施方案使用的AimPs及其同源物AimRs。
鉴定与AimR结合的肽的结合试验是本领域熟知的并包括蛋白质印迹法、BiaCore、高效液相色谱(HPLC)或流式细胞术。
鉴定肽从DNA分离AimR的能力的结合试验在本研究中是本领域熟知的并包括,但不限于,染色质免疫沉淀(ChIP)分析、DNA电泳迁移率分析(EMSA)、DNA拉下分析和微板捕获和检测分析。
根据特定的实施方案,AimP肽与AimR多肽的结合抑制AimR多肽的二聚化。
如在本文中使用的,术语“抑制(inhibit)”和“抑制(inhibiting)”指活性下降(例如二聚、结合、溶原性)。根据特定的实施方案,与没有AimP肽或AimX的相同物质比较,所述下降为至少1.5倍、至少2倍、至少3倍、至少5倍、至少10倍,或至少20倍。
根据其它特定的实施方案,与没有AimP肽或AimX的相同物质比较,下降至少5 %、至少10 %、至少20 %、至少30 %、至少40 %、至少50 %、至少60 %、至少70 %、至少80 %、至少90 %、至少95 %或99 %或100 %。
温和噬菌体是一种能够进入溶原途径的噬菌体,其中噬菌体在它的裂解周期结束之前会成为细胞基因组中一个休眠的被动部分。
根据特定的实施方案,噬菌体能够感染芽孢杆菌(Bacillus bacteria)。
根据特定的实施方案,噬菌体是一种前噬菌体(prophage)。
下表3指示了可根据本发明的特定实施方案使用的噬菌体和前噬菌体。根据一个特定的实施方案,噬菌体是spBeta噬菌体。根据一个特定实施方案,噬菌体是Phi3T。
在相同的培养条件下,溶原性的程度通常与同一物种但不与指定的试剂(如AimP,AimX)接触或与媒介对照(也称为对照品)接触的细菌的溶原性相比较来表示。
分析噬菌体溶原性的方法是本领域熟知的并包括,但不限于,DNA测序和PCR分析。当一种温和的噬菌体可以采用溶原性途径或裂解途径时,噬菌体的溶原活性可以用本领域熟知的方法(包括但不限于光密度、噬菌斑测定和活的染料指示剂),通过测定噬菌体的裂解活性的降低来间接评估。
如在本文中使用的,短语“导致溶原性(leading to lysogeny)”和“导致溶原性(lead to lysogeny)”指溶原性增加。
根据特定的实施方案,所述增加为至少1.5倍、至少2倍、至少3倍、至少5倍、至少10倍,或至少20倍。
根据其它特定的实施方案,与没有AimP肽或AimX下调剂的相同物质比较,所述增加为至少5 %、至少10 %、至少20 %、至少30 %、至少40 %、至少50 %、至少60 %、至少70 %、至少80 %、至少90 %、至少95 %或99 %或100 %。
根据特定的实施方案,细菌可以用从下表3中描述的噬菌体中选择的温和噬菌体感染。根据特定的实施方案,细菌可以用spBeta噬菌体感染。根据特定的实施方案,所述细菌是芽孢杆菌,根据特定的实施方案,细菌选自下表3中列出的细菌。
本发明还考虑了如本文所述的编码仲裁系统及其功能性片段的组分的分离的多核苷酸。
因此,根据本发明的一个方面,提供一种分离的多核苷酸,其编码包含XXXXGG/A的氨基酸序列的AimP肽,其中所述肽能够结合AimR多肽,该多肽包含用于与AimR响应元件结合的DNA结合结构域,所述AimR包含螺旋-转角-螺旋(HTH)基序和三十四肽重复序列(TPR)结构域;并从AimR响应元件分离所述AimR多肽。
根据本发明的另一个方面,提供一种编码AimR多肽的分离的多核苷酸,该多肽包含用于与AimR响应元件结合的DNA结合结构域,所述AimR包含螺旋-转角-螺旋(HTH)基序和三十四肽重复序列(TPR)结构域。
根据特定的实施方案,编码AimR多肽的多核苷酸包含与选自SEQ ID NOs: 1-113的核酸序列具有至少80 %、至少85 %、至少90 %、至少95 %或100 %同一性的序列。
根据特定的实施方案,编码AimR多肽的多核苷酸包含选自SEQ ID NOs: 1-113的序列。
根据本发明的另一个方面,提供一种包含AimR响应元件的分离多核苷酸,其中所述AimR包含用于结合所述AimR响应元件的DNA结合结构域,所述AimR包含螺旋-转角-螺旋(HTH)基序和三十四肽重复序列(TPR)结构域。
根据特定的实施方案,AimR响应元件包含用于结合AimR和AimX多核苷酸的核酸序列,其中所述AimX多核苷酸或由所述AimX多核苷酸编码的AimX多肽能够抑制在宿主细菌中表达所述AimR的温和噬菌体的溶原性。
根据本发明的另一个方面,提供一种分离的AimX多核苷酸。
根据本发明的另一个方面,提供一种由AimX多核苷酸编码的分离的多肽。
如在本文中使用的,术语“AimX”指多核苷酸和表达产物如AimX基因的多肽。根据特定的实施方案,“AimX”指AimX基因的多核苷酸。根据特定的实施方案,AimR结合位点可操作地连接于AimX多核苷酸。功能性的AimX能够抑制温和噬菌体在宿主细菌中表达各自的AimR的溶原性。根据特定的实施方案,AimX和AimR结合位点包含AimR响应元件。
根据特定的实施方案,AimX包含在SEQ ID NO: 336中所述的核酸序列。
根据特定的实施方案,术语“AimX”指全长AimX。根据其它特定的实施方案,术语“AimX”指维持如本文所述的活性的AimX片段。
术语“AimX”还指功能性的AimX同系物,其抑制如本文所述的所需活性。这样的同系物可以与多核苷酸SEQ ID NO:336具有例如至少80 %、至少81 %、至少82 %、至少83 %、至少84 %、至少85 %、至少86 %、至少87 %、至少88 %、至少89 %、至少90 %、至少91 %、至少92%、至少93 %、至少94 %、至少95 %、至少96 %、至少97 %、至少98 %、至少99 %或100 %同一性或同源性。同系物也可指直系同源、缺失、插入或替代变体,包括氨基酸替代。
下面的表3列出了可根据一些实施方案使用的AimRs及其同源物AimXs。
根据本发明的另一个方面,提供一种分离的多核苷酸,其包含编码AimP肽的多核苷酸,编码AimR多肽的多核苷酸,包含AimR响应元件的多核苷酸和/或AimX多核苷酸及其任何组合。
根据本发明的另一个方面,提供一种编码仲裁系统的分离的多核苷酸,其包含编码AimP肽的核酸序列,编码AimR多肽的核酸序列和用于结合可操作地连接于AimX的核酸序列的AimR的核酸序列,其中所述仲裁系统能够调节在宿主细菌中表达所述仲裁系统的噬菌体的溶原性。
如在本文中使用的,“仲裁系统”或“功能性仲裁”指多-基因系统,其包含如本文所述的AimP、AimR和AimX且其活性控制噬菌体在其宿主基因组中的溶原性。
根据某些实施方案可使用的仲裁系统组分的组合列出于下表3中。
如在本文中使用的,术语“仲裁系统组分”指AimP、AimR、AimR响应元件、AimX及相同物质或例如上文所述的其功能片段的任何组合。
根据特定的实施方案,AimR是由位于温和噬菌体基因组中编码AimP和/或AimR响应元件(如SEQ ID NOs: 287-334、378)的基因的1-10个基因中的一个基因编码的。
根据特定的实施方案,AimP是由位于温和噬菌体基因组中编码AimR响应元件(如SEQ ID NOs: 287-334、378)的基因的1-10个基因中定位的一个基因编码的。根据特定的实施方案,AimR和AimP和/或AimR响应元件(如SEQ ID NOs: 287-334, 378)在表达相同物质的温和噬菌体的核酸分子上依次定位为5’-3’。
根据特定的实施方案,AimR和AimP和/或AimR响应元件(如SEQ ID NOs: 287-334,378)在温和噬菌体的基因组中依次定位为5’-3’。
根据特定的实施方案,AimR和AimP和/或AimR响应元件(如SEQ ID NOs: 287-334,378)在表达相同物质的温和噬菌体的核酸分子上被连续地定位于5’-3’。
根据特定的实施方案,AimR和AimP和/或AimR响应元件(如SEQ ID NOs: 287-334,378)在温和噬菌体的基因组中被连续地定位于5’-3’。
根据特定的实施方案,AimP和AimR响应元件(如SEQ ID NOs: 287-334, 378)在表达相同物质的温和噬菌体的核酸分子上依次定位为5’-3’。
根据特定的实施方案,AimP和AimR响应元件(如SEQ ID NOs: 287-334, 378)在温和噬菌体的基因组中依次定位为5’-3’。
根据特定的实施方案,AimP和AimR响应元件(如SEQ ID NOs: 287-334, 378)在表达相同物质的温和噬菌体的核酸分子上被连续地定位于5’-3’。
根据特定的实施方案,AimP和AimR响应元件(如SEQ ID NOs: 287-334, 378)在温和噬菌体的基因组中被连续地定位于5’-3’。
根据特定的实施方案,AimR由位于温和噬菌体基因组中编码AimX的基因的10个基因中的一个基因编码。
根据特定的实施方案,AimP由位于温和噬菌体基因组中编码AimX的基因的10个基因中的一个基因编码。
根据特定的实施方案,AimR和AimP和/或AimX在表达相同物质的温和噬菌体的核酸分子上依次定位为5’-3’。
根据特定的实施方案,AimR和AimP和/或AimX在温和噬菌体的基因组中依次定位为5’-3’。
根据特定的实施方案,AimR和AimP和/或AimX在表达相同物质的温和噬菌体的核酸分子上被连续地定位于5’-3’。
根据特定的实施方案,AimR和AimP和/或AimX被连续地定位于温和噬菌体的基因组中的5’-3’。
根据特定的实施方案,AimP和AimX 依次定位为表达相同物质的温和噬菌体的核酸分子上的5’-3’。
根据特定的实施方案,AimP和AimX 依次定位为在温和噬菌体的基因组中的5’-3’。
根据特定的实施方案,AimP和AimX被连续地定位于表达相同物质的温和噬菌体的核酸分子上的5’-3’。
根据特定的实施方案,AimP和AimX被连续地定位于温和噬菌体的基因组中的5’-3’。
因此,根据特定的实施方案,本发明的多核苷酸包含:
(1) 编码AimP肽的多核苷酸;
(2) 包含编码AimR多肽的核酸序列的多核苷酸;
(3) 包含AimR响应元件核酸序列的多核苷酸;
(4) AimX多核苷酸;
(5) 包含(2)和(3)的多核苷酸;
(6) 包含(2)和(4)的多核苷酸;
(7) 包含(1)、(2)和(3)的多核苷酸;
(8) 包含(1)、(2)和(4)的多核苷酸;
(9) 包含(1)和(2)的多核苷酸;
(10) 包含(1)和(3)的多核苷酸;或
(11) 包含(1)和(4)的多核苷酸。
根据特定的实施方案,AimR多核苷酸位于AimP多核苷酸的上游。
根据特定的实施方案,AimR多核苷酸位于AimR响应元件多核苷酸的上游。
根据特定的实施方案,AimR多核苷酸位于AimX多核苷酸的上游。
根据特定的实施方案,AimR响应元件位于AimX多核苷酸的上游。
根据特定的实施方案,AimP多核苷酸位于AimR响应元件多核苷酸的上游。
根据特定的实施方案,AimP多核苷酸位于Aimx多核苷酸的上游。
如在本文中使用的,术语"肽"和“多肽”,可互换使用,包括天然肽(降解产物、合成的肽或重组肽)和拟肽(通常是合成的肽),以及肽类似物的类肽(peptoids)和半肽类(semipeptoids),例如,它们可能具有使肽在体内更稳定或更有能力渗透进入细胞的修饰。这样的修饰包括,但不限于N端修饰、C端修饰、肽键修饰、骨架修饰和残基修饰。制备拟肽化合物的方法是本领域熟知的,并在例如定量药物设计(Quantitative Drug Design), C.A.Ramsden Gd., Chapter 17.2, F. Choplin Pergamon Press (1992)中作了具体规定,其通过引用结合到本文,如同在此充分说明一样。这方面的更多细节在下文提供。
所述肽内的肽键(-CO-NH-)可例如被N-甲基化酰胺键(-N(CH3)-CO-)、酯键(-C(=O)-O-)、酮亚甲基键(-CO-CH2-)、亚硫酰亚甲基键(-S(=O)-CH2-)、α-氮杂键(-NH-N(R)-CO-) (其中R是任何烷基(例如,甲基))、胺键(-CH2-NH-)、硫键(-CH2-S-)、乙烯键(-CH2-CH2-)、羟基乙烯键(-CH(OH)-CH2-)、硫代酰胺键(-CS-NH-)、烯属双键(-CH=CH-)、氟代烯属双键(-CF=CH-)、反酰胺键(-NH-CO-)、肽衍生物(-N(R)-CH2-CO-)替代,其中R是"正常"侧链,自然存在于碳原子上。
这些修饰可以发生在沿着肽链的任何一个键上,甚至可以同时发生在几个(2-3)键上。
天然芳香族氨基酸TRP、Tyr和Phe可被非天然芳香族氨基酸如1,2,3,4-四氢异喹啉-3-甲酸(Tic)、萘丙氨酸、Phe环甲基化衍生物、Phe或O-甲基-Tyr的卤化衍生物取代。
某些本发明的实施方案的肽也可包括一个或多个修饰的氨基酸或一个或多个非-氨基酸单体(如脂肪酸、复合碳水化合物等)。
术语"氨基酸(amino acid)"或"氨基酸(amino acids)"被理解为包括20个天然存在的氨基酸;那些氨基酸在体内经常经过翻译后修饰,包括例如,羟脯氨酸、磷酸丝氨酸和磷酸苏氨酸;以及其它不寻常的氨基酸,包括但不限于2-氨基己二酸、羟赖氨酸、异锁链素、正缬氨酸、正亮氨酸和鸟氨酸。而且,术语"氨基酸"包括D-和L-氨基酸二者。
下表1和2列出天然存在的氨基酸(表1)和非-常规或修饰的氨基酸(例如,合成的,表2),其可用于本发明的某些实施方案。
表1
表2
本发明的某些实施方案中的肽优选以线性形式使用,虽然应意识到,在其中环化不严重干扰肽的特性的情况下,也可使用环化形式的肽。
本发明的某些实施方案中的肽优选地包括包括一个或多个非天然或天然极性氨基酸,包括但不限于丝氨酸和苏氨酸,由于它们含有羟基的侧链而能够增加肽溶解度。
本发明的肽的氨基酸可以被保守地或非保守地替代。
如在本文中使用的术语“保守的替代”,指的是用具有类似的空间性质的天然或非-天然存在的氨基或拟肽置换存在于肽的天然序列中的氨基酸。当要置换的天然氨基酸的侧链是或者极性或者疏水性时,保守的取代应该用(除了具有与置换的氨基酸侧链的相同空间性质外),还是极性或疏水性的天然存在的氨基酸、非-天然存在的氨基酸或用拟肽部分进行。
因为天然存在的氨基酸通常根据它们的性质分组,经天然存在的氨基酸的保守替代可容易地记住这一事实而确定,即根据本发明,荷电的氨基酸被空间上类似的非-荷电的氨基酸置换被认为是保守的替代。
为了产生由非-天然存在的氨基酸的保守的替代,也可能使用本领域熟知的氨基酸类似物(合成的氨基酸)。天然存在的氨基酸的拟肽在熟练的专业人员已知的文献中是有充分的文字记载的。
当影响保守的替代时,取代氨基酸应在侧链中具有与原始氨基酸相同的或类似的官能团。
如本文所用的短语"非-保守的取代"指存在于母体序列中的氨基酸被具有不同的电化学和/或空间性质的另一个天然或非-天然存在的氨基酸置换。因此,取代氨基酸的侧链可显著地大(或小)于被取代的天然氨基酸的侧链和/或可具有与被取代的氨基酸显著不同的电子性质的官能团。这种类型的非-保守的取代的实例包括苯丙氨酸或环己基甲基甘氨酸对丙氨酸,异亮氨酸对甘氨酸,或对天冬氨酸的取代。落入本发明的范围内的那些非-保守的取代是仍然构成具有抗菌特性的肽的那些取代。
本发明的肽的N和C末端可由官能团保护。合适的官能团被描述于Green andWuts, "有机合成中的保护基团(Protecting Groups in Organic Synthesis)", JohnWiley and Sons, 第5和7章, 1991中,其讲述通过引用结合到本文中。优选的保护基团是那些有助于将其附着在细胞中的化合物运输到细胞中的基团,例如通过降低化合物的亲水性和增加亲脂性。
本发明的肽可(或者共价或者非-共价)连接至渗透剂。
如本文所用的短语"渗透剂"指促进任何连接的肽越过细胞膜的易位的异源性试剂。
根据一个实施方案,渗透剂是肽并经由肽键(或者直接或者间接)连接于多肽。
通常地,肽渗透剂具有含有相对高丰度的带正电荷氨基酸例如赖氨酸或精氨酸的氨基酸组合物,或者具有含有极性/荷电的氨基酸和非-极性、疏水性氨基酸的交替模式的序列。根据某些本发明的实施方案根,能够以无毒和有效的方式穿透细胞并适合使用的CPPs的非限制示例包括TAT (来自HIV-1的转录激活剂)、pAntp (也称为穿膜肽、果蝇触角同源结构域转录因子)和VP22 (来自单纯疱疹病毒)。生产CPPs-物质缀合物并用这样的缀合物感染细胞的方案可例如在L Theodore et al. [The Journal of Neuroscience,(1995) 15(11): 7158-7167], Fawell S, et al. [Proc Natl Acad Sci USA, (1994)91:664–668],和Jing Bian et al. [Circulation Research. (2007) 100:1626-1633]中发现。
本发明的肽还可包含非-氨基酸部分,例如连接于肽的疏水性部分(各种直链、支链、环状、多环或杂环烃和烃衍生物);非-肽渗透剂;各种保护基团,特别是当化合物是线性的,它附着在化合物的终端上,以减少降解。可以包括存在于该化合物中的化学(非氨基酸)基团,以改善各种生理特性;减少降解或清除;减少不同细胞泵的排斥力,改善免疫原性活性,改善各种给药方式(例如附着允许穿透各种屏障、肠道等的各种序列);增加特异性,增加亲和力,降低毒性等。
附加到其他非氨基酸试剂上的本发明的肽的氨基酸序列组分可以是共价连接,非共价配合,例如,通过与疏水聚合物的配合,这可使其降解或裂解,产生能够缓释的化合物;将肽的氨基酸部分包裹在脂质体或胶束中,产生本发明的最终的肽。该缔合可以通过在另一个组分(脂质体、胶束)内截留氨基酸序列或在聚合物内浸渍氨基酸序列进行,以产生本发明的最终的肽。
本发明的某些实施方案中的肽可以通过肽合成领域技术人员已知的任何技术来合成和纯化,例如(但不限于)固相技术和重组技术,如下文进一步描述的技术。
如在本文中使用的,术语“多核苷酸”指分离并以RNA序列形式提供的单链或双链核酸序列、互补的多核苷酸序列(cDNA)、基因组多核苷酸序列和/或复合多核苷酸序列(例如上述的组合)。
由于新的“仲裁”系统涉及到控制DNA整合到宿主基因组中,因此,本讲述提出在此描述的“仲裁”系统的组成部分可用于控制目标基因组的整合到感兴趣的表达产物中。
因此,根据特定的实施方案,本发明的多核苷酸包含编码感兴趣的表达产物的核酸序列。
如在本文中使用的,术语“感兴趣的表达产物”指感兴趣的RNA和/或蛋白。
根据特定的实施方案,感兴趣的表达产物的表达和/或活性依赖于AimX;即AimX的表达控制感兴趣的表达产物的表达和/或活性。
根据特定的实施方案,感兴趣的表达产物是治疗性表达产物例如抗体、生长因子、细胞因子等。
根据特定的实施方案,感兴趣的表达产物是DNA编辑剂。
根据特定的实施方案,DNA编辑剂的表达和/或活性取决于AimX,即AimX的表达控制DNA编辑剂的表达和/或活性。
如在本文中使用的,术语“DNA编辑剂”指一种能在细胞基因组中引入序列改变的试剂。这些目标序列的改变可能涉及功能丧失或功能改变的增益。这样的改变的非限制性例子包括一种错义突变,即一种使蛋白质中的一个氨基酸残基与另一个氨基酸残基发生改变,从而调节该蛋白质的活性的突变; 一种无义突变,即在蛋白质中引入终止密码子,例如导致缺少活性的较短的蛋白质的早期终止密码子的突变;一种移码突变,即改变蛋白质的阅读框的核酸的突变(通常为缺失或插入),并且可以通过将终止密码子引入到阅读框(例如,截短的蛋白,缺少活性)中,或在更长的氨基酸序列(例如,通读蛋白)中引入终止密码子导致早期终止,这影响蛋白质的二级或三级结构,并导致具有调节活性的蛋白质;由于移码突变或修饰的终止密码子突变(即,当终止密码子突变为氨基酸密码子时),而导致具有调节活性的通读突变;一种缺失突变,即删除基因序列中编码核酸的突变,并可能导致移码突变或整码突变(在编码序列中,缺失一个或多个氨基酸密码);一种插入突变,即在基因序列中插入编码或非编码核酸的突变,并且其可能导致移码突变或一个或多个氨基酸密码子的框内插入;一种反转,即导致反转编码或非-编码序列的突变;一种剪接突变,即导致剪接异常或剪接不良的突变;和一种复制突变,即导致复制编码或非编码序列的突变,其可以是整码突变或可以导致移码突变。
根据特定的实施方案,基因的DNA序列改变可包含至少一个等位基因。
根据其它特定的实施方案,基因序列的改变包括两个等位基因。在这样的情况下,基因可能为纯合子形式,或为杂合子形式。
根据特定的实施方案,DNA编辑剂允许将外生核酸序列整合到基因组中。
因此,根据特定的实施方案,本发明的某些实施方案的多核苷酸的核酸包含通过DNA编辑剂整合到细胞基因组中的核酸序列。
DNA基因组编辑的方法是本领域熟知的[参见例如Francisco Martín et al.“New Vectors for Stable and Safe Gene Modification” in Gene Therapy -Developments and Future Perspectives (2011) DOI: 10.5772/10622; Menke D.Genesis (2013) 51: - 618; Capecchi, Science (1989) 244:1288-1292; Santiago etal. Proc Natl Acad Sci USA (2008) 105:5809-5814; 国际专利申请号WO 2014085593、WO 2009071334和WO 2011146121; 美国专利号8771945、8586526、6774279和UP专利申请公布号20030232410、20050026157、US20060014264中;其内容通过引用以其整体并入本文]并包括但不限于整合酶和工程核酸酶。DNA基因组编辑的试剂可被设计为可公开获得的来源,或可从Transposagen, Addgene and Sangamo Biosciences经商购获得。
根据特定的实施方案,DNA编辑剂是整合酶。
如在本文中使用的,术语“整合酶”指能够将核酸序列整合到另一核酸序列中的重组酶(例如,细胞的基因组)。根据特定的实施方案,整合酶是位点-特异性重组酶,即导致两个核酸之间的序列整合,每个核酸包含至少一个对重组酶的识别位点。这样的整合酶是本领域已知的[见例如Francisco Martín et al. Gene Therapy - Developments andFuture Perspectives (2011) DOI: 10.5772/10622, Recchia A et al. Curr GeneTher. (2011) 11(5): 399-405, Lim KI, BMB Rep. (2015) 48(1):6-12和美国专利申请公布号US20070190601;其内容通过引用以其整体并入本文]并包括例如逆转录病毒整合酶(HIV整合酶)和噬菌体整合酶(如phi C31整合酶、λ整合酶)。
根据特定的实施方案,DNA编辑剂是工程内切酶。
使用工程内切酶例如巨核酶、锌指核酸酶(ZFNs)、转录激活因子样效应核酸酶(TALENs)和CRISPR/Cas系统的基因组编辑,是本领域熟知的并描述于例如国际专利申请公布号WO2015/033343,其内容通过引用以其整体并入本文。
根据其它特定的实施方案,DNA编辑剂选自锌指核酸酶,一种2类CRISPR/Cas的效应蛋白(如Cas9、Cpf1、C2c1、C2c3)和TALEN。
根据特定的实施方案,本发明的多核苷酸是核酸构建体的部分(在此也称为“表达载体”)。
如在本文中使用的,术语“核酸构建体”和“表达载体”指设计在宿主细胞中引入感兴趣的特定表达产物(即基因)的核酸载体。表达可以是短暂的或一致的,也可以是游离基因的或可以整合到宿主细胞的染色体中。根据特定的实施方案,表达是在一个可传播的基因元件上,例如质粒上。
因此,本发明的某些实施方案的核酸构建体包括额外的序列,使该载体适合于原核生物、真核生物或优选两者(例如穿梭载体)中的复制和整合。此外,典型的克隆载体可以包含调节元件,例如启动子、增强子、转录和翻译起始序列、转录和翻译终止子、聚腺苷酸化信号转录终止信号等,以及用于克隆感兴趣表达产物的至少一个多克隆位点(MCS)。例如,这样的构建体通常包括5' LTR、tRNA结合位点、包装信号、第二链DNA合成的起源,和3' LTR或其部分。
因此,根据本发明的一个方面,提供一种包含编码AimP肽的多核苷酸,编码AimR多肽的多核苷酸,包含AimR响应元件的多核苷酸和/或AimX多核苷酸,及其任何组合;和MCS的核酸构建体。
根据本发明的另一个方面,提供一种包含编码AimP肽的多核苷酸,编码AimR多肽的多核苷酸,包含AimR响应元件的多核苷酸和/或AimX多核苷酸,及其任何组合;以及用于指导多核苷酸表达的与AimP、AimR、AimR响应元件和/或AimX异源的顺式作用调节元件的核酸构建体。
因此,根据特定的实施方案,核酸构建体可包含上文描述的多核苷酸(1)-(11)中的任何一种。
本发明的讲述进一步设想,多核苷酸是核酸构建体系统的一部分,由此,仲裁系统的组分由不同的构建体表达。
因此,根据特定的实施方案,本发明提供包含至少两个核酸构建体的核酸构建体系统,各自表达至少一个本发明的多核苷酸。
因此,根据特定的实施方案,核酸构建体系统包含用于本发明的各个多核苷酸(即AimP、AimR、AimR响应元件和AimX)的独立的核酸构建体。
根据其它特定的实施方案,一个单一的构建体包含多个本发明的多核苷酸,如上文所述的。
根据特定的实施方案,核酸构建体系统包含至少一个允许将多核苷酸整合到细胞染色体中的构建体和至少一个允许多核苷酸的游离基因表达的构建体。
如在本文中使用的,术语“多克隆位点(MCS)”指包括至少一个限制性内切位点的核酸序列,更典型的是一些限制性内切位点,目的是将核酸序列克隆到表达载体中。MCS被一种特定的限制性内切酶识别和消化,以便可将感兴趣的目标表达产物插入到被消化的MCS位点中。本领域已知的任何MCS可用于本发明的核酸构建体中。它可以从在具有MCS的领域中已知的各种商业上可获得的载体(例如,pUC18、pUC19等)购得。
顺式作用调节序列包括指导核苷酸序列组成型表达的序列以及仅在某些条件下指导核苷酸序列的诱导型表达的序列。
本发明的顺式调节序列是与本发明的多核苷酸(即AimP、AimR、AimR响应元件和AimX)异源性的。
如在本文中使用的,术语"异源的"是指源自不同的遗传位置。例如,通过基因工程技术,可以将多核苷酸放置到从不同来源衍生出来的载体中,它是一种异源性多核苷酸;从其天然编码序列中删除的启动子和可操作地连接到天然序列以外的编码序列上的启动子是异源性启动子。
根据特定的实施方案,核酸构建体包括用于以构成或诱导的方式指导细胞内多核苷酸序列的转录的启动子序列。
真核生物启动子通常包含两种类型的识别序列,TATA盒和上游启动子元件。TATA盒,位于转录起始位点上游的25-30个碱基对,被认为参与指导RNA聚合酶以开始RNA合成。其它上游启动子元件决定转录启动率。
优选地,本发明的某些实施方案的核酸构建体所使用的启动子在转化的特定细胞群体中是活泼的。细胞类型-特异性和/或组织-特异性启动子的例子包括肝特异性启动子,如白蛋白[Pinkert et al., (1987) Genes Dev. 1:268-277]、淋巴样特异性启动子[Calame et al., (1988) Adv. Immunol. 43:235-275],特别是T-细胞受体的启动子[Winoto et al., (1989) EMBO J. 8:729-733]和免疫球蛋白; [Banerji et al. (1983)Cell 33729-740]、神经元-特异性启动子例如神经丝启动子[Byrne et al. (1989) Proc.Natl. Acad. Sci. USA 86:5473-5477]、胰-特异性启动子[Edlunch et al. (1985)Science 230:912-916]或乳腺-特异性启动子例如乳清启动子(U.S. Pat. No. 4,873,316和欧洲申请公布号264,166)。
增强子元件可以从连接的同源或异源启动子中刺激多达1,000倍的转录。当位于转录起始位点的下游或上游时,增强子是活跃的。许多来自病毒的增强子元件具有广泛的宿主范围,并且在各种组织中都具有活性。例如,SV40早期基因增强子适用于多种细胞类型。适合于本发明某些实施方案的其它增强子/启动子组合包括从多瘤病毒、人或鼠巨细胞病毒(CMV)、从各种逆转录病毒(如小鼠白血病病毒、小鼠或Rous肉瘤病毒和HIV)中长期重复衍生的增强子/启动子组合。参见,增强子与真核表达(Enhancers and EukaryoticExpression), Cold Spring Harbor Press, Cold Spring Harbor, N.Y. 1983,其通过引用并入本文。
根据特定的实施方案,启动子是病毒(如噬菌体)启动子。
根据特定的实施方案,启动子是细菌启动子。
在构建表达载体时,启动子优选地定位于与异源转录起始位点与其自然环境中的转录起始位点大致相同的距离。然而,如本领域已知的,在不丧失启动子功能的情况下,可以适应该距离的一些变化。
多腺苷酸化序列也可加入到表达载体中以增加mRNA翻译的有效性。准确有效的多腺苷酸化需要两个不同的序列元素:位于多腺苷酸化位点下游的GU或U丰富序列和高度保守的6个核苷酸(AAUAAA)序列,位于上游的11-30个核苷酸。适合于本发明的某些实施方案的终止信号和多腺苷酸化信号包括来自SV40的信号。
除了已经描述的元件,本发明的某些实施方案的表达载体可通常含有其它专门的元件,旨在提高克隆核酸的表达水平或促进携带重组DNA的细胞的鉴定。例如,许多动物病毒含有促进病毒基因组在容许细胞类型中的额外染色体复制的DNA序列。携带这些病毒复制子的质粒,只要由质粒上携带的基因或宿主细胞的基因组提供适当的因子,就会被游离体复制。
载体可能包括或可能不包括真核生物复制子。如果真核生物复制子存在,则利用适当的可选择标记在真核细胞中扩增载体。如果该载体不包含真核生物复制子,则不可能进行同体扩增。相反,重组DNA整合到工程细胞的基因组中,在那里启动子指导所需核酸的表达。
本发明的某些实施方案的表达载体还可以包括额外的多核苷酸序列,例如,允许从单个mRNA中翻译几个蛋白,以及用于启动子-嵌合多肽基因组整合的序列,如上下文详细描述的。
根据特定的实施方案,编码多顺反子mRNA的构建体包含本发明的多核苷酸。
可以利用各种构建方案来表达来自单个核酸构建体的少数基因。根据特定的实施方案,编码多顺反子mRNA的构建体包含本发明的多核苷酸;也就是说,多核苷酸可以从核酸构建体的单个启动子序列中作为多顺反子信息共同转录。为了使来自单个多顺反子信息的所有基因共同翻译,不同的多核苷酸片段可以通过包括内部核糖体进入位点(IRES)序列的接头序列进行转录融合,从而能够将IRES序列的多核苷酸片段下游进行翻译。在这种情况下,一个转录的多顺反子RNA分子,包括本发明多核苷酸的不同组合的编码序列,将从该多顺反子RNA分子的5'封端和内部IRES序列中翻译出来。
另外,每两个多核苷酸片段都可以通过被细胞表达的蛋白酶切割的蛋白酶识别位点进行翻译融合,所述细胞用核酸构建体转化。在这种情况下,翻译的嵌合多肽将被细胞表达的蛋白酶切割。
仍然可供选择地,本发明的某些实施方案的核酸构建体可包括至少两个启动子序列,每个启动子序列分别表达不同的多核苷酸。这些至少两个可以相同或不同的启动子可以是组成型、组织特异性的或可调节的(例如诱导型)启动子,其在一种或多种细胞类型中发挥作用。
当需要分泌多肽时,本发明的多核苷酸可以表达为包含编码核酸序列的融合多肽,例如,在框架中连接到编码信号肽的核酸序列的“仲裁”系统的组成部分(如AimP)。根据特定的实施方案,信号序列是N-端信号序列。根据特定的实施方案,信号肽分泌时被切割。
编码合适的信号序列的DNA可以衍生自分泌性细菌蛋白的基因,如大肠杆菌外膜蛋白质基因(ompA) (Masui et al. (1983) FEBS Lett. 151(1):159-164; Ghrayeb etal. (1984) EMBO J. 3:2437-2442)和大肠杆菌碱性磷酸酶信号序列(phoA) (Oka et al.(1985) Proc. Natl. Acad. Sci. 82:7212)。其它原核信号包括例如来自青霉素酶Ipp的信号序列或群体感应系统Phr家族的热稳定肠毒素II前导和信号序列[如在Pottathil, M.& Lazazzera, B. A. Front. Biosci.8, d32–45 (2003)中描述的]。
根据特定的实施方案,信号序列如SEQ ID NO: 342中所示。
确保在细胞中保持载体的可选择标记基因也可以包含在表达载体中。优选的可选择标记物包括对诸如氨苄青霉素、氯霉素、红霉素、卡那霉素(新霉素)和四环素等药物具有抗性的标记(Davies et al. (1978) Annu. Rev. Microbiol. 32:469)。可选择的标记还可允许细胞在最小培养基上或在有毒代谢物存在的情况下生长,并且可以包括生物合成基因,如组氨酸、色氨酸和亮氨酸生物合成途径中的基因。
除了包含用于插入编码序列的转录和翻译的必要元件之外,本发明的一些实施方案的表达表达构建体还可以包括经工程改造以增强表达的多肽的稳定性、生产、纯化、产量或毒性的序列。因此,例如,本发明的某些实施方案中的肽(如AimP)可以是一种含有由胞外蛋白酶加工的序列以产生成熟肽的前肽。根据特定的实施方案,用于细胞外处理的信号如在SEQ ID NO: 348中所示。
或者,例如融合蛋白或可裂解融合蛋白的表达(所述融合蛋白包含本发明的一些实施方案的蛋白(如AimP)和异源蛋白可被工程改造。这样一种融合蛋白的设计可以使融合蛋白可能易于通过亲和层析分离;例如,将融合蛋白固定在一个对异源蛋白特异性的柱上。在本发明一些实施方案的蛋白和异源蛋白之间设计裂解位点的情况下,本发明一些实施方案的蛋白可通过用破坏裂解位点的适当酶或试剂处理而从色谱柱中释放[例如,see Boothet al. (1988) Immunol. Lett. 19:65-70;和Gardella et al., (1990) J. Biol.Chem. 265:15854-15859]。
当需要时,在适当的培养时间后,重组多肽的回收就会受到影响。短语"回收重组多肽”指收集含有多肽的整个发酵培养基,并不需要额外的分离或纯化步骤。尽管如此,本发明某些实施方案的多肽仍可通过使用各种标准蛋白纯化技术进行纯化,例如,但不限于亲和层析、离子交换层析、过滤、电泳、疏水相互作用色谱、凝胶过滤层析、反相色谱、伴刀豆球蛋白A色谱、色谱聚焦和微分增溶等。
在适当的情况下,可以优化多核苷酸,以增加在转化有机体中的表达。例如,利用优选的密码子可以合成多核苷酸,以改善表达。
应该意识到,表达载体中包含的各个元件可以按多种配置排列。例如,增强子元件、启动子等,甚至编码“仲裁”系统的组分的多核苷酸序列也可以"头对尾"的配置排列,可以作为反向互补,也在互补配置中作为反平行链存在。虽然这样的多样化配置更有可能发生在表达载体的非编码元件中,但也设想了表达载体内编码序列的可选配置。
哺乳动物表达载体的例子包括,但不限于,pcDNA3、pcDNA3.1(+/-)、pGL3、pZeoSV2(+/-)、pSecTag2、pDisplay、pEF/myc/cyto、pCMV/myc/cyto、pCR3.1、pSinRep5、DH26S、DHBB、pNMT1、pNMT41、pNMT81(从Invitrogen获得),从Promega获得的pCI,pMbac、pPbac、pBK-RSV和pBK-CMV (从Strategene获得),从Clontech获得的pTRES,及其衍生物。
细菌构建体的例子包括大肠杆菌表达载体的pET系列[Studier et al. (1990)Methods in Enzymol. 185:60-89)。
在酵母中,可以使用一些含有组成型或诱导型启动子的载体,如在美国专利申请号5,932,447中公开的。另外,也可以使用载体来促进外源DNA序列与酵母染色体的整合。
在使用植物表达载体的情况下,编码序列的表达可由许多启动子驱动。例如,可使用病毒启动子例如CaMV的35S RNA和19S RNA启动子[Brisson et al. (1984) Nature310:511-514],或TMV的外壳蛋白启动子蛋白启动子[Takamatsu et al. (1987) EMBO J.6:307-311]。或者,可使用植物启动子例如RUBISCO的小亚基[Coruzzi et al. (1984)EMBO J. 3:1671-1680和Brogli et al., (1984) Science 224:838-843]或热休克启动子,例如大豆hsp17.5-E或hsp17.3-B [Gurley et al. (1986) Mol. Cell. Biol. 6:559-565]。这些构建体可使用Ti质粒、Ri质粒、植物病毒载体、直接DNA转化,微注射,电穿孔和技术人员熟知的其它技术引入植物细胞。参见,例如,Weissbach & Weissbach, 1988, 植物分子生物学的方法(Methods for Plant Molecular Biology), Academic Press, NY,Section VIII, pp 421-463。
本领域熟知的其它表达系统例如昆虫和哺乳动物宿主细胞系统也可被本发明的某些实施方案使用。
还可以使用含有来自真核病毒(如逆转录病毒)的调节元件的表达载体。SV40载体包括pSVT7和pMT2。源自牛乳头状瘤病毒的载体包括pBV-1MTHA,和源自爱泼斯坦-巴尔(Epstein Bar)病毒的载体包括pHEBO和p2O5。其它示例性载体包括pMSG、pAV009/A+、pMTO10/A+、pMAMneo-5、杆状病毒pDSVE,以及允许在SV-40早期启动子、SV-40晚期启动子、金属硫因启动子、小鼠乳腺瘤病毒启动子、Rous肉瘤病毒启动子、多角体蛋白启动子,或在真核细胞中有效表达的其它启动子指导下表达蛋白的任何其它载体。
如上所述,病毒是非常特殊的传染性物质,在许多情况下是为了逃避宿主防御机制而进化而来的。通常, 病毒在特定的细胞类型中感染和传播。病毒载体的靶向特异性利用其天然特异性,专门针对预定的细胞类型,从而将重组基因导入受感染细胞中。因此,本发明的某些实施方案使用的载体类型将取决于转化的细胞类型。根据转化的细胞类型选择合适的载体的能力完全在普通熟练技术人员的能力范围内,因此这里没有提供关于选择考虑的一般描述。重组病毒载体可用于在体内表达本发明某些实施方案的多核苷酸和多肽,因为它们具有例如横向感染和靶向特异性等优点。
可以使用各种方法将本发明的某些实施方案的多核苷酸、表达载体和多肽导入细胞。本文描述的多核苷酸和核酸构建体可以通过本领域已知的任何方法引入细胞,如下文进一步详细描述的。备选或另外地,这里描述的多肽可以与细胞本身接触。
要意识到,细胞可能包含在特定的有机体内,例如哺乳动物体内或植物内。
因此,根据特定的实施方案,引入和/或在体内接触是受影响的。
根据另一个特定的实施方案,引入和/或接触是在体内或体外进行的。
可以使用各种方法将本发明某些实施方案的多核苷酸和表达载体导入细胞。这样的方法通常描述于Sambrook et al., 分子克隆:实验室手册(Molecular Cloning: ALaboratory Manual), Cold Springs Harbor Laboratory, New York (1989, 1992), inAusubel et al., 分子生物学中的当前方案(Current Protocols in MolecularBiology), John Wiley和Sons, Baltimore, Md. (1989), Chang et al., 体细胞基因治疗(Somatic Gene Therapy), CRC Press, Ann Arbor, Mich. (1995), Vega et al.,Gene Targeting, CRC Press, Ann Arbor Mich. (1995), 载体:分子克隆载体及其应用综述(Vectors: A Survey of Molecular Cloning Vectors and Their Uses),Butterworths, Boston Mass. (1988)和Gilboa et at. [Biotechniques 4 (6): 504-512, 1986]中并包括,例如,稳定或瞬时转染、脂质转染、电穿孔和用重组病毒载体感染。此外,对于正负选择方法参见美国专利号5,464,764和5,487,992。
通过病毒感染引入核酸具有超过其他方法,例如脂质转染和电穿孔的优势,因为由于病毒的传染性,可以获得更高的转染效率。
目前优选的体内核酸转移技术包括使用病毒或非病毒构建体,如腺病毒、慢病毒、单纯疱疹I型病毒,或腺相关病毒(AAV)和基于脂质的系统的转染。对于脂质-介导的基因转移有用的脂质是例如,DOTMA、DOPE和DC-Chol [Tonkinson et al., CancerInvestigation, 14(1): 54-65 (1996)]。在基因治疗中最优选的构建体是病毒,最优选是腺病毒、AAV、慢病毒,或逆转录病毒。一种病毒构建体,如逆转录病毒构建体,包括至少一个转录启动子/增强子或基因座-限定元件,或其它通过其它方式控制基因表达的元件,如交替剪接、核RNA输出或信使翻译后修饰。这样的载体构建体还包括包装信号、长末端重复序列(LTRs)或其部分,以及与所使用的病毒相适应的正、负链引物结合位点,除非它已经存在于病毒构建体中。可使用的其它载体为非病毒载体,如阳离子脂质、聚赖氨酸和树状大分子。
不管介绍的方法如何,本教导规定了一种分离的细胞,其包括多核苷酸、核酸构建体和/或多肽,如本文所述。
如在本文中使用的,术语“细胞”指原核或真核细胞细胞。可用于本发明某些实施方案的细胞的非限制性实例包括,但不限于,微生物,如用含有编码序列的重组噬菌体DNA、质粒DNA或粘粒DNA表达载体转化的细菌;用含有编码序列的重组酵母表达载体转化的酵母;重组病毒表达载体(例如,花椰菜花叶病毒、CaMV;烟草花叶病毒、TMV)感染或用重组质粒表达载体,例如含有编码序列的Ti质粒转化的植物细胞系统。
根据特定的实施方案,细胞是细菌。
根据特定的实施方案,细胞是哺乳动物细胞。
根据特定的实施方案,哺乳动物细胞选自中国仓鼠卵巢(CHO)、HEK293、PER.C6、HT1080、NS0、Sp2/0、BHK、Namalwa、COS、HeLa和Vero细胞。
根据另一个特定的实施方案,细胞是原代细胞。
根据特定实施方案,细胞是细胞系。
细胞可来源于合适的组织,包括但不限于血液、肌肉、神经、大脑、心脏、肺、肝脏、胰腺、脾脏、胸腺、食道、胃、肠、肾、睾丸、卵巢、毛发、皮肤、骨骼、乳房、子宫、膀胱、脊髓或各种体液。
根据特定的实施方案,细胞不内源性表达本发明的多核苷酸和/或多肽。
根据特定的实施方案,细胞内源性表达AimR。
如在本文中使用的术语“内源性”,指原生基因在其自然位置的表达和在生物体基因组中的表达水平。
正如下面的实施例部分所表明的,仲裁系统是一个遗传系统,它使用肽来控制特定DNA与特定目标位点的整合。因此,本教导建议使用上述多核苷酸、核酸构建体和/或多肽来诱导一般的基因表达,特别是控制基因组编辑。
因此,根据本发明的一个方面,提供一种表达感兴趣的表达产物的方法,该方法包括:
(i) 在细胞中引入多核苷酸,所述多核苷酸包含可操作地连接到编码感兴趣的表达产物的核酸序列的AimR响应元件,其中所述AimR包含用于结合所述AimR响应元件的DNA结合结构域,所述AimR包含螺旋-转角-螺旋(HTH)基序和三十四肽重复序列(TPR)结构域;和
(ii) 使所述细胞与包含XXXXGG/A的氨基酸序列的AimP肽接触,其中所述AimP肽能够与所述AimR多肽结合并从AimR响应元件分离所述AimR多肽,
从而表达感兴趣的表达产物。
根据本发明的另一个方面,提供一种表达感兴趣的表达产物的方法,该方法包括在细胞中引入多核苷酸,所述多核苷酸包含可操作地连接到编码感兴趣的表达产物的异源核酸序列的AimR响应元件,其中所述AimR包含用于结合所述AimR响应元件的DNA结合结构域,所述AimR包含螺旋-转角-螺旋(HTH)基序和三十四肽重复序列(TPR)结构域,从而表达感兴趣的表达产物。
根据特定的实施方案,该方法包括在细胞中引入编码AimR的多核苷酸。
根据本发明的另一个方面,提供一种表达感兴趣的表达产物的方法,该方法包括在细胞中引入多核苷酸,所述多核苷酸包含可操作地连接到编码感兴趣的表达产物的核酸序列的AimR响应元件;和包含AimR多核苷酸和顺式作用调节元件的核酸构建体,所述顺式作用调节元件是与所述AimR异源的,用于指导所述AimR多核苷酸的表达,
其中所述AimR包含用于结合所述AimR响应元件的DNA结合结构域,所述AimR包含螺旋-转角-螺旋(HTH)基序和三十四肽重复序列(TPR)结构域, 从而表达感兴趣的表达产物。
根据特定的实施方案,该方法包括使细胞与AimP肽或编码相同肽的核酸序列接触。
根据特定的实施方案,该方法包括使细胞与能够下调所述AimR响应元件的表达和/或活性的试剂接触。
如在本文中使用的,短语“下调表达”指在基因组上(如同源重组和位点特异性内切核酸酶)和/或使用多种干扰转录和/或翻译的分子(例如,RNA沉默剂如RNA干扰(RNAi)、转录基因沉默(TGS)、转录后基因沉默(PTGS)、压制、共抑制和翻译抑制)在转录水平上或在蛋白水平上(例如,适配子、小分子和抑制肽、拮抗剂、裂解多肽的酶、抗体等)下调表达。
根据特定的实施方案,下调剂是核酸剂。
根据特定的实施方案,下调剂是2类CRISPR/Cas的效应蛋白(如Cas9、Cpf1、C2c1、C2c3)。
根据特定的实施方案,下调剂是CRISPR/Cas系统的crRNA或sgRNA。
根据特定的实施方案,下调剂是RNAi。
根据特定的实施方案,下调表达指的是mRNA和/或蛋白的缺失,如分别由RT-PCR或蛋白质印迹法分别检测到的。
根据其它特定的实施方案,下调表达指的是与不存在下调剂的相同情况比较,mRNA和/或蛋白水平下降,如由RT-PCR或蛋白质印迹法分别检测到的。下降可能为至少10%、至少20 %、至少30 %、至少40 %、至少50 %、至少60 %、至少70 %、至少80 %、至少90 %、至少95 %或至少99 %的下降。
作为本发明人所使用的、在下面实施例章节中公开的用于下调AimX的表达和/或活性的CRISPR/Cas系统是新颖的;根据本发明的一个方面,提供一种能够下调AimR响应元件的表达和/或活性的分离的核酸剂。
根据特定的实施方案,下调剂能够下调AimX的表达和/或活性。
如在本文中使用的,“表达(expressing)”或“表达(expression)”指核酸和/或蛋白水平的基因表达。表达可以使用本领域已知的方法,例如,但不限于选择标记基因、RNA印迹分析、PCR分析、DNA测序、RNA测序、蛋白质印迹法分析和免疫组织化学分析来测定。
当感兴趣的表达产物的表达导致调节的活性时,DNA整合的鉴定有效性也可以通过确定活性来确定。
此外,本领域的普通技术人员可容易地设计一个敲入/敲除(knock-in/knock-out)构建体,包括阳性和/或阴性选择标记,以便有效地选择经过DNA与多核苷酸或构建体的整合事件的转化细胞。阳性选择提供了一种方法来丰富已吸收外来DNA的克隆群。这样的阳性标记的非限制性实例包括人流感血凝素(HA)标记、谷氨酰胺合成酶、二氢叶酸还原酶(DHFR)、His-标记、FLAG肽,和产生抗生素耐药性的标记,例如新霉素、潮霉素、普罗霉素和杀稻瘟菌素S抗性盒。需要阴性选择标记以针对随机整合和/或消除标记序列(例如阳性标记)进行选择。这样的阴性标记的非限制性实例包括单纯疱疹胸苷激酶(HSV-TK),其将更昔洛韦(GCV)转化为细胞毒性核苷类似物;次黄嘌呤磷酸核糖转移酶(HPRT)和腺嘌呤磷酸核糖转移酶(ARPT)。
根据特定的实施方案,感兴趣的表达产物是对细胞内源性的。
根据其它特定的实施方案,感兴趣的表达产物对细胞是外源性的。
如上所述,感兴趣的表达产物可以是DNA编辑剂。因此,根据特定的实施方案,所述方法包括在细胞中引入由DNA编辑剂整合到细胞基因组中的核酸序列。
核酸序列整合到细胞基因组中的鉴定效力和检测方法是本领域已知的并包括,但不限于,DNA测序、电泳、基于酶的错配检测分析和杂交分析,例如PCR、RT-PCR、RNase保护、原位杂交、引物延伸、DNA印迹、RNA印迹和斑点印迹分析。
根据另一个方面,提供一种经鉴定表达感兴趣的表达产物的制品,其包括包装以下至少两种物质的包装材料:
(i) 包含AimR响应元件的多核苷酸;
(ii) 编码所述AimR的多核苷酸;
(iii) AimP肽;和/或
(iv) 能够下调所述AimR响应元件的表达和/或活性的试剂。
制品可包含以下的两项、三项或全部,即(i) + (ii)、(i) + (iii)、(i) + (iv)、(ii) + (iii)、(ii) + (iv)、(i) + (ii) +(iii)、(ii) + (iii) + (iv)、(i) + (ii) +(iv)、(i) + (iii) + (iv)或(i) + (ii) + (iii) + (iv)。
根据另一个方面,提供一种经鉴定表达感兴趣的表达产物的制品,其包含包装以下物质的包装材料:
(a) 本发明的(2)-(6)多核苷酸或其功能片段或包含如本文所述的相同物质的核酸构建体的至少一个;和
(b) AimP肽、AimP多核苷酸、其功能片段、包含如本文所述的相同物质的核酸构建体或AimR响应元件下调剂的至少一个。
根据特定的实施方案,编码AimR的多核苷酸被包含在一个核酸构建体中,所述核酸构建体包含与AimR异源的顺式作用调节元件,以指导AimR多核苷酸的表达。
根据特定的实施方案,制品包含多克隆位点(MCS)。
根据特定的实施方案,制品包含编码感兴趣的表达产物的多核苷酸。
根据本发明的这些方面的特定实施方案,(i)、(ii)、(iii)和/或(iv)或(a)和(b)被包装在单独的容器中。
根据本发明这些方面的还有的其它特定实施方案,(i)、(ii)、(iii)和/或(iv)或(a)和(b)以c-制剂形式存在。
预计从这项申请开始的专利有效期内,将开发许多相关的DNA编辑剂,而术语DNA编辑剂的范围意欲包括所有这样的超前新技术。
如在本文中使用的,术语“约”指±10 %。
术语"包含", "包含"、"含有"、"包括"、"包纳"、“具有”和它们的变化意指"包括,但不限于"。
术语“由…组成”意指“包括且限于”。
术语"基本上由…组成"意指组合物、方法或结构可包括另外的成分、步骤和/或部件,但只要另外的成分、步骤和/或部件不会实质性地改变所要求的组合物、方法或结构的基本和新颖的特性。
如本文所用的,单数形式"一"、"一个"和"该"包括复数指代,除非文中另外清楚地指明。例如,术语"一个化合物"或"至少一个化合物"可包括多个化合物,包括其混合物。
贯穿该申请,本发明的各个实施方案可以一个范围格式提出。应该理解,在范围格式中的描述仅仅是为了方便和简明,而不应被解释为对本发明范围的硬性限制,因此,一定范围的描述应被认为已具体公开所有的可能的子范围以及在该范围内的各个数值。例如,一个范围例如从1至6的描述应被认为已具体公开例如从1至3,从1至4,从1至5,从2至4,从2至6,从3至6等的子范围,以及在该范围内的各个数值,例如,1、2、3、4、5和6。这适用于无论多宽的范围。
每当此处指明一个数值范围时,则意味着包括在该指明的范围内的任何引用的数字(分数或整数)。短语“范围/第一次指明的数字和第二次指明的数字之间的范围”和“范围/范围从”第一次指明的数字“至”第二次指明的数字在此可互换使用并意欲包括第一次和第二次指明的数字以及在其之间的所有分数和整数数值。
如本文所用的,术语"方法"指为完成给定任务的方式、手段、技术和程序,包括,但不限于,那些方式、手段、技术和程序或者为化学、药学、生物学、生物化学和医学领域的专业人员已知的,或从已知的方式、手段、技术和程序容易地开发的。
当引用特定的序列表时,这样的引用应被理解为也涵盖基本上对应于其互补序列的序列,如包括由例如测序错误、克隆错误,或其它导致碱基取代、碱基缺失或碱基添加的改变生成的次要序列变异,只要这样的变异的频率少于1/50的核苷酸,或者少于1/100的核苷酸,或者少于1/200的核苷酸,或者少于1/500的核苷酸,或者少于1/1000的核苷酸,或者少于1/5,000的核苷酸,或者少于1/10,000的核苷酸。
表3:测序基因组中AimR-AimP的同系物
要意识到本发明的某些特征,为了清楚起见,其在独立的实施方案的上下文中被描述,也可在单一实施方案中组合提供。反过来,本发明的各个特征,为了清楚起见,其在单一实施方案的上下文中被描述,也可分开地或以任何合适的亚组合(subcombination)或作为适合于任何其它描述的本发明实施方案提供。在各个实施方案的上下文中描述的某些特征并不认为是那些实施方案的基本特征,除非没有那些要素,所述实施方案无法实施。
如上文描述的和如在下文权利要求书部分所要求的本发明的各个实施方案和方面在以下实施例中找到实验支持。
实施例
现在以非限制性方式,与以上描述说明本发明的一些实施方案一起,对以下实施例进行参照。
一般来说,此处所用的命名和本发明所用的实验程序包括分子、生物化学、微生物学和重组DNA技术。这样的技术在文献中有充分的解释。见,例如,"分子克隆:实验室手册(Molecular Cloning: A laboratory Manual)" Sambrook et al., (1989); "分子生物学现代方法(Current Protocols in Molecular Biology)" Volumes I-III Ausubel, R.M., ed. (1994); Ausubel et al., "分子生物学现代方法(Current Protocols inMolecular Biology)", John Wiley and Sons, Baltimore, Maryland (1989); Perbal,"分子克隆实用指南(A Practical Guide to Molecular Cloning)", John Wiley &Sons, New York (1988); Watson et al., "重组DNA (Recombinant DNA)", ScientificAmerican Books, New York; Birren et al. (eds) "基因组分析:实验室手册丛书(Genome Analysis: A Laboratory Manual Series)", Vols. 1-4, Cold Spring HarborLaboratory Press, New York (1998);如在美国专利号4,666,828;4,683,202;4,801,531;5,192,659和5,272,057中提出的方法;"细胞生物学:实验室手册(Cell Biology: ALaboratory Handbook)", I-III卷, Cellis, J. E., ed. (1994);"动物细胞的培养-基础技术手册(Culture of Animal Cells - A Manual of Basic Technique)" byFreshney, Wiley-Liss, N. Y. (1994),第3版;"免疫学现代方法(Current Protocols inImmunology)" I-III卷, Coligan J. E., ed. (1994); Stites et al. (eds), "基础和临床免疫学(Basic and Clinical Immunology)" (第8版), Appleton & Lange,Norwalk, CT (1994); Mishell and Shiigi (eds), "细胞免疫学的选择方法(SelectedMethods in Cell Immunology)", W. H. Freeman and Co., New York (1980);可获得的免疫分析在专利和科学文献中有广泛的描述,见,例如,美国专利号3,791,932;3,839,153;3,850,752;3,850,578;3,853,987;3,867,517;3,879,262;3,901,654;3,935,074;3,984,533;3,996,345;4,034,074;4,098,876;4,879,219;5,011,771和5,281,521;"寡核苷酸合成(Oligonucleotide Synthesis)" Gait, M. J., ed. (1984);“核酸杂交(Nucleic AcidHybridization)" Hames, B. D., and Higgins S. J., eds. (1985);"转录和转译(Transcription and Translation)" Hames, B. D., and Higgins S. J., eds.(1984);"动物细胞培养(Animal Cell Culture)" Freshney, R. I., ed. (1986);"固定化细胞和酶(Immobilized Cells and Enzymes)" IRL Press, (1986);"分子克隆实用指南(A Practical Guide to Molecular Cloning)" Perbal, B., (1984)和"酶学方法(Methods in Enzymology)" Vol. 1-317, Academic Press;"PCR方案:方法和应用指导(PCR Protocols: A Guide To Methods And Applications)", Academic Press, SanDiego, CA (1990);Marshak et al., "蛋白纯化和鉴定的策略-实验室课程手册(Strategies for Protein Purification and Characterization - A LaboratoryCourse Manual)" CSHL Press (1996);所有文献通过引用结合到本文中,如同在本文中全面阐明一样。本文通篇提供其它一般的参考。其中的程序相信是本领域熟知的并为读者提供方便。其中含有的所有信息通过引用结合到本文中。
材料和方法
寡核苷酸和试剂–所有寡核苷酸均购自Sigma (St. Louis, Missouri)或IntegratedDNA Technologies (IDT, San Jose, California)。合成的肽购自Peptide 2.0 Inc.(Chantilly, Virginia), 纯度98%,脱盐的。
条件培养基的制备–程序的示意图如图1A所示。特别地,枯草芽孢杆菌菌株168的过夜培养物在补充有0.1 mM MnCl2和5 mM MgCl2的LB培养基中按1:50稀释,并在37℃伴随摇动下培养,直到达到光密度(O.D) 600 nm = 0.5。将噬菌体(phi29、phi105、rho14或phi3T) 按MOI = 1加入到细菌培养物中并培养3小时。于4℃将培养基以4000 rpm离心10分钟并用0.2 µm过滤器过滤上清液(GE Healthcare Life Sciences, Whatman, CAT#10462200)。使用截止值3,000 NMWL (3kDa)的Amicon超离心过滤器(Milipore, CAT#UFC900324),从培养基滤出噬菌体和大分子。进行噬菌斑测定以证实没有噬菌体留在培养基中。
蛋白酶K处理- 7.5 mg (每反应)蛋白酶K – 将得自白色念球菌(Tritirachium album) (Sigma, CAT# P9290)的琼脂糖用750 µl无菌水洗涤两次,然后用750 µl补充有0.1 mM MnCl2和5 mM MgCl2的LB再悬浮。接着,再次离心试管并弃去上清液。将1.5 ml的phi3T-衍生的条件培养基或对照培养基加入到含有洗涤的蛋白酶K的试管中。于37℃,将培养基与蛋白酶K一起培养2小时。离心培养基并收集上清液用于感染分析。
噬菌体-感染的培养物的生长动力学– 将细菌的过夜培养物在LB培养基中按1:100稀释,并在37℃伴随摇动下培养,直到达到O.D 600 nm = 0.1。于室温下,将细菌培养物以4000 rpm离心10分钟。弃去上清液并将沉淀颗粒在补充有0.1 mM MnCl2和5 mM MgCl2的LB培养基中,以10 %的初始体积重新悬浮。将浓缩的细菌培养物以1:9 (细菌对比培养基)的比例加入到条件培养基或补充有合成的仲裁肽的培养基中,并于室温下培养1小时。此后,用噬菌体以MOI = 0.1感染培养物。在96孔板上使用TECAN无限200平板阅读器(TECANInfinite 200 plate reader)在600 nm波长处进行了光密度测量。对于不包括条件培养基或添加合成肽的感染实验,稀释后的过夜培养物生长至早期对数期,然后如上文所述被感染。
溶原性的半定量PCR分析 - 将细菌的过夜培养物按1:100稀释,直到达到O.D 600nm = 0.1。如上所述(用条件培养基或对照培养基)替换培养基,于室温下将培养物培养1小时。细菌用phi3T以MOI = 5感染。在条件培养基或对照培养基的存在下,在0、15、30、40和60分钟感染后收集细胞颗粒。DNA使用 DNeasy血和组织试剂盒(CAT# 69504)提取。如Goldfarb et al先前所述,执行检测噬菌体phi3T DNA、枯草芽孢杆菌DNA,以及整合的噬菌体和细菌基因组之间的连接处的多重PCR方法29
质谱法– 使用具有3kDa MW截止值的过滤器(Millipore)过滤条件培养基,使用Oasis HLB uElution板(Waters Corp.)使低分子量部分脱盐。干燥样品并于-80℃直至分析。ULC/MS级溶剂被用于所有色谱步骤。采用无分离纳米超高效液相色谱(split-lessnano-Ultra Performance Liquid Chromatography) (10 kpsi nanoAcquity; Waters,Milford, MA, USA)加载每个样品。流动相是:A) H2O + 0.1 %甲酸和B)乙腈+ 0.1 %甲酸。使用反相C18捕获柱(180 µm内径,20 mm长度,5 µm粒径;Waters)在线进行样品的脱盐。此后,使用T3 HSS纳米-柱(75 µm内径,250 mm长度,1.8 µm粒径;Waters),以0.35 µL / min分离肽,使用以下梯度将肽从柱上洗脱到质谱仪中:4 %-35 % B,65 min;35 %-90 % B,5min,维持于90 %,5 min,然后回到初始条件。通过nanoESI发射器(10 µm tip; NewObjective; Woburn, MA, USA),使用FlexIon纳米喷雾器(Proxeon),将nanoUPLC在线偶联于四极轨道质谱计(Q Exactive Plus, Thermo Scientific)。以平行反应监测(PRM)模式,针对前体质量574.33和287.67采集数据,单和双电荷形式的肽SAIRGA (SEQ ID NO: 269)。MS2分辨率设置为-35,000,最大注射时间设置为200 msec,自动增益控制设置为2e5。原始数据被导入到Skyline软件30版本3.5中。提取产物离子强度并计算曲线下的总面积。
AimR纯化 -使用Transfer-PCR (TPCR)31,使用以下引物,将AimR (SEQ ID NO: 1)克隆到表达载体pET28a (Novagen)中:
随后,AimR用C-端6x His-标记在大肠杆菌BL21(DE3)细胞中表达。使用200 µM IPTG(异丙基β-D-1-硫代吡喃半乳糖苷)作为诱导剂,在15℃下进行约~18小时的表达。将细胞颗粒再悬浮在裂解缓冲液[50 mM Tris pH 8,0.3M NaCl、20 mM咪唑、2 mM DTT、0.2 mg / ml溶菌酶、1 µg / ml DNAse、蛋白酶抑制剂合剂(Calbiochem)]中,在4°C下被细胞破裂器破坏,以15,000 g澄清30分钟。将澄清的溶胞产物装载到HisTrap_FF_5ml柱(GE Healthcare)上,并用含有50 mM Tris pH 8、0.3 M NaCl、20 mM咪唑和2 mM DTT的缓冲液洗涤。AimR在一个步骤中用含有0.5M咪唑相同缓冲液从柱中洗脱出来。合并含有AimR的流分并注入到用20 mM Tris pH 8,0.3 M NaCl、2 mM TCEP平衡的尺寸排阻柱(HiLoad_16/60_Superdex_200_prepgrade,GE_Healthcare)中。合并含有纯AimR的流分并使用液氮快速冷冻等分试样。
将纯AimR注入用含有20 mM Tris pH 8,0.3 M NaCl、2 mM TCEP的缓冲液平衡的分析性凝胶过滤柱(Superdex_200_Increase_10/30 GL, GE Healthcare)中。在以下摩尔比下,将纯AimR的迁移位置与AimR-肽混合物的迁移位置进行了比较:AimR和SAIRGA (SEQID NO: 269)肽(1:2)、AimR和GMPRGA (SEQ ID NO: 271)肽(1:1)。通过监测下列已知蛋白质/聚合物的迁移位置校准柱(图4C的插图):蓝葡聚糖(2000 kDa)、甲状腺球蛋白(669kDa)、脱铁蛋白(443 kDa)、β-淀粉酶(200 kDa)、醇脱氢酶(150 kDa)、白蛋白(66 kDA)和碳酸酐酶(29kDa)。
微量热泳动(MST)- 将在-80℃的Tris/NaCl缓冲液(50 mM Tris pH 8.0, 150 mMNaCl、2 mM TCEP)中储存的两步纯化的6xHis标记的AimR在冰上解冻,在分析前于4℃以21,000g离心10分钟。将肽[SAIRGA (SEQ ID NO: 269)和GMPRGA (SEQ ID NO: 271)]溶于50mM Tris-HCl pH 8.0,150 mM NaCl中至最终浓度100 µM。将AimR稀释至200 nM,并与在9-4000 nM之间变化的16种不同浓度的肽一起温育,这些浓度的肽在Tris/NaCl缓冲液含有0.1 % [v/v]普流罗尼克酸(Pluronic acid) (NanoTemper)中制备。大约3  µl被装入NT.LabelFree Zero-Background Premium Coated Capillaries (NanoTemper)中并插入Monolith NT.LabelFree装置(NanoTemper)。使用Monolith NT.LabelFree仪器(Nanotemper),以60 % MST功率(红外线激光)和20 % LED功率(23℃)进行MST实验。计算归一化初始荧光与后温跃迁和热泳动之间的比值,并从3次独立运行(测量前在室温下孵育20分钟)进行平均。用荧光比与肽浓度的关系图来评价噬菌体蛋白及其同源肽配体的结合能力。
ChIP-Seq–对于ChIP-seq实验,枯草芽孢杆菌细胞培养物于37℃,在100 ml LB(O.D为0.1)中生长。随后,于室温下,将50 ml培养物以4000 rpm离心10分钟。然后用或者含有(最终浓度1 µM)肽或者缺乏肽(SAIRGA, SEQ ID NO: 269)的25 ml LB悬浮沉淀颗粒。在室温、摇动下,使培养物孵育另外一小时。然后,用具有5x107 PFU / ml噬菌体的最终菌斑形成单位(PFU)的噬菌体(MOI = 0.5)感染培养物。噬菌体感染后15分钟,将培养物于4℃以3000g离心5分钟。弃去上清液并使沉淀颗粒再悬浮于1 ml冰冷的1xPBS (10 mM磷酸盐、137mM NaCl、2.7 mM KCl,pH 7.4)中。
对于蛋白质对DNA的甲醛固定作用,将1 ml PBS再悬浮的沉淀与62.5 µl甲醛(Thermoscientific 16 %甲醛溶液(w/v),无甲醇小瓶)混合,使溶液中的甲醛最终浓度达到1 % (w/v)。使含甲醛的细胞悬浮液于室温伴有温和搅拌下培养10分钟 。随后,加入75 µl 2M甘氨酸(f.c. 150mM)以消除残留的甲醛。使含甘氨酸的样品在冰上保持另外10分钟,接着于4℃以5500g离心1分钟。弃去上清液并用1 ml冰冷的1xPBS洗涤沉淀。对各个样品重复离心和洗涤3次。
用含有50 mM Tris-HCl pH 7.5,150 mM NaCl和蛋白酶抑制剂混合物(cOmpleteULTRA Tablets Roche)的600 µl溶胞缓冲液使细胞沉淀悬浮。将含溶胞缓冲液的细胞应用于溶胞基质B (MP Biomedicals) 0.1 mm二氧化硅珠。将混合物和珠置于FastPrep-24 (MPBiomedicals)装置中并于4℃猛烈摇动20秒钟(6 m / sec)。然后,按照制造商的指示,于4℃,以10,000g离心1分钟,将珠子从溶解的细胞中分离出来。随后,将300 µl含有溶解的细胞混合物的上清液转移至1.5 ml Bioruptor® Plus TPX微管(diagenode)中并在冰上保持10分钟(按照制造商的指示)。于4℃,使用BioRuptor plus (Diagenode)装置,全功率超声处理样品15分钟(30秒关/开周期)。超声波将DNA剪切到平均大小为~500 bp。超声处理后,于4℃以20,000g离心样品10分钟。
对于IP实验,使含有溶胞缓冲液和细胞内容物的上清液与Triton X-100和脱氧胆酸盐混合,得到最终的IP-缓冲液组合物,其含有补充了蛋白酶抑制剂(cOmplete ULTRATablets Roche)的50 mM Tris-HCl, pH 7.5、150 mM NaCl、1 % [vol/vol] Triton X-100、0.1 % [wt/vol]脱氧胆酸钠。然后将抗-6X His标记® ChIP-级抗体(abcam (ab9108))加入到经超声处理的样品中并于4℃温和混合过夜。同时,用IP缓冲液冲洗蛋白G Dynabead(100.04D; Invitrogen)三次。
于室温下,将DNA-蛋白-抗体复合物(300 µl)与100 µl Dynabeads蛋白G一起旋转混合1小时,用后者捕获前者。于室温下,将0.72 µl的0.5M EDTA (f.c. 1 mM)加入到混合物中以抑制DNase活性。将珠应用于磁台(Qiagen),在室温下用IP缓冲液(200 µl)冲洗三次。于65℃,用100 µl和50 µl洗脱缓冲液(50 mM Tris-HCl, pH 7.5,10 mM EDTA、1 %[wt/vol] SDS)在摇动平台上应用两个洗脱步骤15分钟。洗脱液(100 µl)与5 µl蛋白酶K(20 mg ml−1)在50℃孵育1小时,接着于65℃孵育6小时。使用QIAquick PCR纯化试剂盒(Qiagen)回收免疫沉淀的DNA。然后使用现有的方案32将免疫沉淀的DNA转换为NGS库,并在NextSeq500 Illumina机器上进行测序,生成75nt-长的读数。
对于溶原性的基于测序的分析–将细菌的过夜培养物以1/100稀释直至达到O.D600nm =0.1。如上所述替换培养基[补充有0.1 mM MnCl2和5 mM MgCl2的LB,含有或不含SAIRGA (SEQ ID NO: 269)],并于室温下培养1小时。用phi3T以感染复数(MOI) = 2感染细菌。在1 µM最终浓度的SAIRGA (SEQ ID NO: 269)肽的存在或不存在下,在感染后5、10、20和60分钟收集培养基中的细胞沉淀。使用QIAGEN DNeasy血和组织试剂盒(CAT# 69504)提取DNA并在NextSeq500上经历基于Illumina的全基因组测序。每个样本中溶原体的相对丰度是使用映射到不间断整合位点的读取数对比映射到跨越一端的前噬菌体DNA和另一端上的细菌DNA的整合连接出的读取数来估算的。
CRISPRi实验 - 通过将木糖启动子22控制的dCas9构建体插入枯草芽孢杆菌168基因组的lacA区,并在组成型启动子存在下,使具有靶向选择基因的间隔区的sgRNA插入thrC区,构建沉默噬菌体基因的菌株[靶向aimR的间隔区: ACCATTTACTTTTTCATAAC (SEQ IDNO: 358),靶向aimX的间隔区: TTTCCGCTTCATTCTCAAGA (SEQ ID NO: 359)]。CRISPRi菌株的感染分析在补充有0.1 mM MnCl2、5 mM MgCl2和0.2 %木糖的LB中执行。
为了aimRaimR-沉默CRISPRi菌株的背景下的互补分析,AimR使用以下引物从phi3T基因组扩增:
*包括6xHis标记
这些引物扩增aimR与来自其上游区的158个碱基,其C-端具有6xHis。扩增的片段被克隆到pBS1C质粒(从BGSC获得)中。随后,通过同义点突变(在aimR基因的密码子#20的C->A),使用包含点突变和Gibson组装的引物集改变互补aimR基因中的天然前间区序列邻近基序。然后将修饰的基因整合到枯草芽孢杆菌基因组中的amyE基因座中。在aimR-沉默的CRISPRi菌株的背景下构建了aimX互补体系。为此,使用以下引物从phi3T基因组扩增AimX
这些引物扩增aimX与来自其上游区的60个碱基和来自其下游区的107个碱基(含有基因终止子)。扩增的aimX被克隆到经修饰含有木糖启动子的pBS1C质粒中,然后整合到枯草芽孢杆菌基因组中的amyE基因座中。
RNA-seq–为测定用所述肽和不用所述肽的基因表达中的差异,在1 µM合成的SAIRGA (SEQ ID NO: 269)肽的存在或不存在下,在补充有0.1 mM MnCl2和5 mM MgCl2的LB培养基中培养细菌1小时。随后,用phi3T (MOI = 0.1)感染细菌;在感染后0、5、10和20分钟收集细胞颗粒。
如Dar et al. 33中所述执行RNA提取和RNA-seq。简言之,使用Fastprep均化机(MPBiomedicals, Santa Ana, California)溶解沉淀物并根据制造商的指示,用FastRNA PRO蓝色试剂盒(MP Biomedicals, 116025050)提取RNA。用TURBO脱氧核糖核酸酶(DNase)(Life technologies, AM2238)处理RNA样品并用碎裂缓冲器(Ambion)于72℃碎裂1:45分钟。通过加入x 2.5 SPRI珠清洁反应物。用80 % EtOH洗涤珠两次,并风干5分钟。用H2O洗脱RNA。rRNA使用Ribo-零rRNA清除试剂盒(epicenter, MRZB12424)而耗尽。使用NEBNext超定向RNA库Prep试剂盒(NEB, E7420)执行了链-特异性RNA-seq并进行以下调整:所有清理阶段都使用x 1.8 SPRI珠执行,在结束修复步骤之后只执行一次清理步骤。
为测定aimR基因的CRISPRi沉默的效果,用phi3T (MOI = 0.1)感染早期对数期细菌,并在感染后20分钟收集细胞颗粒。如上所述制备RNA-seq库。
使用Illumina NextSeq500平台对RNA-seq库测序。对测序读取进行解复用,并使用带有默认参数的fastx_clipper修剪适配器。读数被映射到参考基因组(基因注释和序列从基因库(Genbank)下载:NC_000964表示枯草芽孢杆菌菌株168,AP012496表示枯草芽孢杆菌BEST7003),使用具有默认参数的NovoAlign (Novocraft) V3.02.02。所有的下游分析和标准化的全基因组RNA-seq覆盖图都是如Dar et al 33所述生成的。
差异表达式分析 -在感染后20分钟,计算每个生物复制的每个基因的读数(不论是否有合成肽),和相对于在每个复制中命中噬菌体基因组的总映射读数标准化。在每个条件下,对每个基因平均3个复制进行log 10转化,以用来绘制图4I并计算基因AimX的倍数变化。
AimR同源物的鉴定及仲裁肽代码 -利用整合微生物基因组(IMG)网络服务器(img(dot)jgi(dot)doe(dot)gov/cgi-bin/mer/main(dot)cgi)中的BLAST选项,搜索phi3TAimR受体的同源物。phi3T AimR (SEQ ID NO: 114)是作为查询序列提供的,并对所有具有e-值阈值1e-35的分离的基因组进行搜索。每个AimR同系物的基因邻域通过IMG “基因邻域”表示法进行视觉检查,发现的位于标记为噬菌体蛋白的蛋白质旁边的基因被认为是在前噬菌体中发现的。如果包含由IMG网络服务器预测的信号肽,则每个AimR同系物的直接下游基因都被认为是各自的AimP基因。如果没有直接下游基因注解,AimR同系物的直接下游的基因间区域将用Expasy翻译工具(Expasy Translate Tool) (web(dot)expasy(dot)org/translate/)进行翻译,并检查短翻译ORFs用于AimP签名。该分析结果见上文表3。
质粒构建– 使用以下引物和寡核苷酸构建载体
构建体#1包含2个组分:噬菌体Phi3T病毒aimR-aimP-aimX基因座和荧光报告基因(Superfolder Green Fluorescent Protein (sfGFP(sp)),在此称为GFP。将这两个组分插入到使质粒能够在大肠杆菌中传播的目的穿梭质粒(pDR111)中,然后转化至枯草芽孢杆菌BEST7003基因组。pDR111包含两个序列,每个序列匹配目标基因(amyE)的5’-端或者3’-端,所述基因(amyE)通过同源重组允许插入构建体#1。此外,pDR111还包含一个大观霉素抗药性(spec)基因,该基因允许选择所需的插入,即构建体#1。
特别地,aimR-aimP-aimX基因座(SEQ ID NO: 372)是使用引物A+B直接从噬菌体Phi3T基因组中扩增的,所述引物含有aimR、AimP和aimX编码基因,包括它们的基因间间隔区(Erez Z, et al., Nature. 2017; 541 (7638): 488-493)。
报告基因GFP基因(SEQ ID NO: 373)使用引物C+D,从质粒pDR111-sfGFP(sp)中扩增,所述质粒含有枯草芽孢杆菌-优化的Superfolder-GFP (Overkamp W, et al., ApplEnviron Microbiol. 2013 Oct;79(20):6481-90)。
报告基因GFP通过在aimX的37bp长的3’UTR下游先后插入3个终止密码子和一个核糖体结合位点(在此称为rbs)与Phi3T aimR-aimP-aimX基因座进行基因融合(见图6)。一个转录-终止子元件(rrnb)位于GFP基因的下游。aimR-aimP-aimX基因座与GFP报告基因的基因融合得到构建体#1 (图6, SEQ ID NO: 374)。
利用NEB构建器HIFI DNA组装反应试剂盒(NEB, MA, USA),将该构建体在限制性内切位点EcoRI和BamHI之间插入到穿梭质粒pDR111中,形成质粒pDR111-构建体#1 (图6,SEQ ID NO: 375)。
pDR111-构建体#1质粒在大肠杆菌(Escherichia coli)中繁殖,然后用作穿梭载体,以将构建体#1操纵子与RPX操纵子上游的相对链的spec基因一起在amyE基因内插入枯草芽孢杆菌基因组中(图7)。应用全基因组测序,用高通量Illumina NextSeq测序仪(High-throughput Illumina NextSeq sequencer),以验证构建体#1操纵子的序列及其在细菌基因组中的精确位置。
为了创建一个最小化的表达系统,pDR111-构建体#1质粒使用引物E+F扩增,接着使用NEB构建器HIFI DNA组装反应试剂盒(NEB, MA, USA)进行DNA组装,导致具有缺失aimP基因的质粒pDR111-构建体#1。这个构建体可使用引物G+H进一步扩增,接着DNA组装也导致aimX基因的缺失。最终产物,pDR111-构建体#2 (SEQ ID NO: 377),含有构建体#1的双基因缺失Δ aimP aimX变体[即构建体#2 (SEQ ID NO: 376)]。pDR111-构建体#2以类似于pDR111-构建体#1的方式被用作穿梭质粒。这导致构建体#2如同对于构建体#1所述插入细菌基因组(图8)。
含质粒的培养物的生长动力学- 野生型(WT)枯草芽孢杆菌BEST7003菌株和含有构建体#1或构建体#2的枯草芽孢杆菌BEST7003菌株的启动生长物在3 ml Luria-Bertani(LB)肉汤中培养直至生长曲线指示静止相。随后,细菌细胞在LB肉汤或补充有SAIRGA (SEQID NO: 269)肽的LB肉汤(浓度范围62.5 nM-1000 nM)中以1 / 100的比例稀释。使用TECANInfinite 200读板仪,在96孔板中测量随时间推移的光密度(600nm处的O.D.)和GFP荧光水平(488 nm激发/518 nm发射)变化。
实施例1
在影响溶解/溶原性决定的PHI3T噬菌体感染后,短肽被释放到培养基中
在对照和噬菌体-衍生的条件培养基中,枯草芽孢杆菌菌株168的培养物被以下4个不同的噬菌体之一感染:phi29 (短尾噬菌体科(Podoviridae),强制性溶胞的)、phi105 (长尾噬菌体科(Siphoviridae),温和,λ-样)、rho14 (长尾噬菌体科,温和,λ-样)或phi3T (长尾噬菌体科,温和,spBeta-样) (见图1A)。令人惊讶的是,从细菌生长曲线推断,对于一种被测试的噬菌体phi3T,条件培养基中的感染动力学与对照培养基中的动力学有很大的不同。如在图1B中所示,虽然在感染后两小时内,大部分phi3T感染的细菌培养物已在对照培养基中溶解,但在条件培养基中生长的培养物似乎大部分被保护以避免溶解。测试的其它三种噬菌体中的任何一种均未检测到这种效果,对此未观察到对照培养基和条件培养基之间的感染动力学的差异。另外,从phi3T感染制备的条件培养基不影响其它噬菌体的感染动力学,反过来从其它噬菌体制备的条件培养基不影响phi3T的感染动力学。
综上所述,这些结果表明在枯草芽孢杆菌被phi3T感染期间,一个小分子被释放到培养基中,这个分子可影响该噬菌体下游感染的动力学。
已知杆菌和其它厚壁菌门(Firmicutes)的群体感应(QS)通常是基于短肽,这些短肽被分泌到培养基中,由细胞内或膜结合受体感受到1–3。因此,为了检验培养基中的活性物质是否为蛋白质的,条件培养基用蛋白酶K处理。如在图1E中所示,蛋白酶-处理的条件培养基中的感染动力学与对照培养基中的动力学相似,提示培养基中的活性成分确实是蛋白质的。由于寡肽渗透酶转运蛋白(OPP)经常将芽孢杆菌菌群感应系统中的通讯肽导入细胞内,在细菌中检测噬菌体感染动力学,其中OPP转运蛋白的一个基本亚单位oppD缺失(图1C)。当缺乏功能性OPP的细菌被phi3T感染时,噬菌体-衍生的条件培养液失去其作用,说明条件培养基中的活性物质为3aa-20aa长肽,这是革兰氏阳性菌的OPP转运蛋白可输入的肽的大小范围4
仔细观察oppD突变体的噬菌体感染动力学表明,与野生型细菌的感染相比,对照培养基和条件培养基中的培养溶解量都增加(图1B-C)。噬菌体phi3T是温和噬菌体,其可选择通过或者溶胞性或者溶原性循环感染6,7。裂解周期导致细菌细胞的裂解,而在溶原性周期中,噬菌体基因组整合到细菌基因组中,而溶原化细菌则受到保护,不受相同噬菌体的进一步感染7。结果表明,phi3T感染的细菌在对照培养基中的生长曲线表现为部分而不是完全的溶解培养物,然后由于溶原化细菌的生长而培养物恢复。oppD突变体的感染动力学曲线显示出完整的培养物溶胞过程的观察提示,释放到培养基中的活性肽可能促进噬菌体的溶原性。因此,为了测试在感染期间,在噬菌体衍生的条件培养基中观察到的减少的细菌裂解是否由于在感染期间溶原性噬菌体phi3T与枯草芽孢杆菌基因组的整合增加引起,使用半定量PCR分析来检查。确实,如在图1D中所示,当细菌培养物在条件培养基中被感染时,观察到增加的溶原性。
总体看来,这些结果表明,在phi3T感染过程中,一个短肽被释放到培养基中,当该肽积聚时,它作为一种通讯剂起作用,影响了噬菌体后代的更晚传代的裂解/溶原性决定。这一新发现的假定通讯分子在这里表示为仲裁(拉丁语表示“决定”)。
实施例2
影响裂解/溶原性决定的肽由aimP基因编码
Phi3T在40年前被分离,并被特征描述为属于spBeta家族的噬菌体,尽管迄今为止其基因组没有测序6。为了寻找编码仲裁肽的可能遗传系统,对phi3T的基因组进行了测序和分析。这个基因组组装成单一的包含185个预测基因的128 kbps的叠连群。为了搜索可能分泌到培养基中的蛋白质,使用signalP软件筛选phi3T中的所有开放阅读框(ORFs),以确定是否存在N-端信号肽8。3个ORFs被预测有信号肽,表明它们是分泌的或膜定位的。虽然这些基因中有两个看起来无关紧要(一个是完整的膜蛋白,而另一个是大的核酸酶),但第三个基因显示让人联想到芽孢杆菌群体感应肽的特征(图2A-B)。属于枯草芽孢杆菌群体感应系统Phr家族的肽通常是从含有N-端信号序列的前-前肽中加工而来,该序列被Sec系统识别并在分泌时被切割1。一旦在细胞外,前肽由枯草芽孢杆菌胞外蛋白酶进一步加工,产生成熟的短肽(5-6个氨基酸),这种肽通常存在于前肽的C-端1。所选的候选基因编码一个短的ORF(43个氨基酸,SEQ ID NO: 227),并显示了N-端信号序列及其C-端的肽成熟的共识切割位点(图2A-B)。如果phi3T-编码的蛋白是细胞外分泌和成熟的,则预测的成熟通讯肽经前肽切割后将为Ser-Ala-Ile-Arg-Gly-Ala (SAIRGA, SEQ ID NO: 269)。事实上,质谱分析证实了在条件培养基中存在SAIRGA肽,而在对照培养基中则不存在(图2C)。
为了测试预测的成熟肽是否确实是影响噬菌体溶原性决定的仲裁分子,在补充有增加量的合成SAIRGA (SEQ ID NO: 269)肽的LB培养基中用phi3T感染细菌。对噬菌体感染动力学的明显的浓度-依赖性效应被观察到,以致当培养基中含有较高浓度的合成肽时,培养物溶胞明显减少(图2D)。这些效应对该肽是特异性的,对于较短的5个氨基酸版本的肽(SAIRG或AIRGA, 分别为SEQ ID NOs: 355和354),和PhrC (SEQ ID NO: 350),一种已知的枯草芽孢杆菌的群体感应肽(图2D-E)均未观察到。在SAIRGA (SEQ ID NO: 269)肽浓度为500 nM时,观察到对培养物生长曲线的影响最大,在此浓度以上时该效应呈饱和状态(图2D)。
为了验证观察到的SAIRGA肽对感染的培养物动力学的影响是由于增加的溶原性的结果,对被phi3T感染期间(含和不含所述肽)从时程实验收集的细菌的总DNA进行了直接测序。经比较通过细菌基因组中完整噬菌体整合位点的测序读取与在该位点显示噬菌体整合的读数的分数,直接量化了各时间点溶原化细菌的分数。值得注意的是,在SAIRGA (SEQID NO: 269)肽的存在下,观察到溶原性持续升高,与无肽生长的细菌的18 % (± 3.3 %)相比,在感染后60 min时48 % (± 7.9 %)的细菌被裂解(图2F)。这些结果表明,所鉴定的噬菌体-编码的基因被分泌和加工成成熟的仲裁通讯肽,其进而影响噬菌体的裂解/溶原性决定。这种基因在此被称为aimP
aimP基因直接位于基因(SEQ ID NO: 1)的下游,该基因编码一个378个氨基酸长的开放阅读框(SEQ ID NO: 114),表明这两个基因可能是从作为多顺反子的噬菌体基因组中共同转录的。这种上游基因编码一个预测的三十四肽重复序列(TPR)结构域,这是革兰氏阳性菌的QS系统中RRNPP家族的典型细胞内肽受体9–11 (图2A)。因此,推测这个上游基因(其被命名为aimR)是AimP-衍生的仲裁肽的受体。为了验证这一假设,纯化了C-端His-标记的AimR,并用微量热泳动(MST)测定了纯化的受体和合成的仲裁肽之间的结合。这个分析表明,在phi3T AimR受体和同源SAIRGA (SEQ ID NO: 269)肽之间,在有效肽浓度为EC50=138nM (118-162 nM,置信区间95 %)时,具有高亲和力结合(图2G),证实AimR最可能作为仲裁SAIRGA肽的细胞内受体发挥作用。
实施例3
一种指导芽孢杆菌噬菌体溶原性的保守肽通讯代码
为了了解这一系统在自然界中的丰度,进行了一项同源性搜索,以在现有的测序基因组中找到aimR基因的同系物。使用这个搜索,检测了112个AimR同系物的实例,它们几乎全部都存在于芽孢杆菌噬菌体或被发现整合在芽孢杆菌基因组中的前噬菌体中,提示该基因主要履行噬菌体-相关的功能(图3A和以上表3)。在所有情况下,在aimP候选基因上游发现AimR同系物,即编码N-端信号肽的短多肽,随后是符合芽孢杆菌胞外蛋白酶的加工成熟信号的前肽(上表3;图2B)。虽然预测的成熟肽的序列是多样的,但它们全部都对它们的序列组成维持严格的规定,第5位必须是甘氨酸残基,第6位是甘氨酸或丙氨酸,以及第4位优先是带正电的残基(图3B-C)。
为了测试噬菌体-编码的通讯肽以序列特异性的方式指导噬菌体溶原性的假设,对spBeta噬菌体的感染动力学进行了评估,其中鉴定了AimR-AimP系统的同系物。预测的spBeta的成熟AimP-衍生的仲裁肽是GMPRGA (SEQ ID NO: 271),一种与phi3T的SAIRGA(SEQ ID NO: 269)肽的不同之处在于3个N-端氨基酸的序列。如在图3D-F中所示,虽然GMPRGA (SEQ ID NO: 271)肽促进了spBeta的溶原性,但它不影响phi3T的溶原性性质;且类似地,phi3T-衍生的SAIRGA (SEQ ID NO: 269)肽对spBeta的感染动力学没有影响。因此,spBeta-衍生的GMPRGA (SEQ ID NO: 271)肽没有显示出与phi3T AimR受体的特异性结合(图2G)。
综上所述,这些结果显示了一个序列特异性肽代码,它以噬菌体物种特异性方式指导噬菌体溶原性。
实施例4
AimP肽改变了其AimR的寡聚状态并改变了AimX的表达
在革兰氏阳性菌的通讯系统中,通讯肽与其受体的结合通常导致转录反应的重新编程。当受体是转录调节剂时,例如在肠球菌的PrgX12,13、蜡样芽胞杆菌群的PlcR14–16和其它系统17,18的情况下,这可能会或者直接地发生,或者在如芽胞杆菌的Rap/Phr系统的情况下间接地发生,其中受体是一种磷酸酶,其通过去磷酸化19,20,或空间干扰21调节下游转录调节剂。在AimR的N-端存在一个预测的螺旋-转角-螺旋(HTH)基序,这表明仲裁系统的受体直接结合于DNA。为了测试AimR在体内是否与噬菌体DNA结合,将His-标记的aimR基因工程改造至枯草芽孢杆菌168菌株,其中使用dCas9 (CRISPRi)技术22来沉默噬菌体AimR基因,而不是克隆的His-标记的AimR的表达(见上文的材料和方法)。随后,在噬菌体感染后15分钟,在仲裁肽的存在和不存在下执行ChIP-seq分析。与AimR结合的DNA测序清楚地表明,AimR与噬菌体基因组中的单一位点结合,该位点位于aimP基因的直接下游(图4A-B)。此外,这种结合只有在培养基中没有仲裁肽时才发生,这表明仲裁肽与其AimR受体的结合会导致受体与其在噬菌体DNA上的结合位点分离。
AimR纯化过程中,发现蛋白质作为同二聚体在凝胶过滤柱中迁移。然而,在加入phi3T-衍生的SAIRGA (SEQ ID NO: 269)肽后,该蛋白作为单体严格迁移(图4C)。这些结果表明,仲裁肽通过改变其AimR受体的寡聚状态将信号从DNA结合二聚体转移到肽-结合的离解单体上。spBeta GMPRGA (SEQ ID NO: 271)肽的添加不导致AimR低聚状态的改变,再次指出在仲裁系统中的肽与其受体之间的高特异性(图4C)。
为了研究仲裁肽与其AimR受体的结合是否导致噬菌体基因组中的转录反应,RNA-seq被应用于从感染期间的细菌(具有和没有所述肽)提取的RNA。如在图4D-I中所示,对于单个基因,观察到表达的最显著的变化,该基因在本文中表示为aimX,即紧邻AimR DNA结合位点的下游。该基因在感染后10分钟开始在没有仲裁肽的情况下表现出显著表达,但是当培养基补充有1 µM SAIRGA (SEQ ID NO: 269)肽时,其表达减少为小于1/20 (图4D-G)。
这些结果表明,AimR,当在仲裁肽的不存在下作为二聚体结合于噬菌体DNA时,是AimX的转录激活因子。事实上,当使用dCas9使AimR静默时,AimX的表达显著减少(图4D)。此外,AimR的沉默导致了溶原性的增加,这表明AimR与噬菌体DNA的结合可能通过激活AimX的表达抑制了溶原性(或促进裂解) (图4H)。
由于AimR敲减在感染后20分钟对任何基因(除AimX外)未导致显著的转录效应(图4I),假设AimR的主要功能是控制aimX基因的表达,且AimX基因产物在AimR-AimP通讯系统的下游工作,以执行裂解-溶原性的决策。与此假设一致,使用dCas9敲减AimX导致了增加的溶原性(图4H)。此外,在AimR敲减的背景下,用异位AimX作为补充(在这个背景中,AimX表达被自然地沉默了,图4D)导致培养物裂解,表明AimXAimR下游发挥作用,并作为溶原体的抑制剂或裂解周期的促进剂发挥作用(图4H)。
总体看来,本发明人已经表明,一个庞大的噬菌体家族使用通讯肽来决定是进入裂解周期,还是溶原化受感染的细菌。在某种意义上,所描述的通信机制允许后代噬菌体颗粒与其祖先进行通信,即测量在先前循环中完成成功感染的先前噬菌体的量。这个策略背后的生物逻辑是清楚的:当单个噬菌体遇到细菌菌落时,从感染的第一个周期产生的后代噬菌体有足够的猎物,因此裂解周期是优选的。在感染动力学的后期,细菌细胞的数量减少到子代噬菌体处于不再有新宿主感染的风险的点。然后,噬菌体转变为溶原性以保留存活繁殖的机会是合乎逻辑的。
仲裁系统为噬菌体颗粒提供了一流机制,以估计近期在先感染的数量,从而决定是采用溶胞循环还是溶原性循环。不受理论的束缚,结果指出以下模型(图5A-C):在细菌培养的初始感染时,phi3T表达早期操纵子AimR-AimPAimR,作为二聚体,激活AimX的表达,后者依次阻断到溶原性的途径并促进裂解循环。同时,AimP被分泌到培养基中并加工成成熟的仲裁肽。几个感染循环后,仲裁肽将在培养基中积聚。在此阶段,当噬菌体颗粒感染尚未被感染的细菌时,由OPP转运蛋白内化到细菌中的仲裁肽的浓度将高到足以与AimR受体结合。AimR受体结合后,其寡聚状态由活性二聚体转变为非活性单体,使AimX溶原性-抑制剂沉默并导致溶原性。
实施例5
作为表达感兴趣的表达产物的系统的仲裁系统
为了证明AimR-AimP系统可在噬菌体-独立的环境中作为异源表达系统发挥作用,它被用于控制枯草芽孢杆菌BEST7003中GFP报道基因的表达。
为此,对仲裁基因座(AimR-AimP-AimR结合位点-AimX)进行了工程改造,使得AimX基因融合到GFP报告基因(构建体#1, 图6)上。这种构建体在AmyE基因座被整合到枯草芽孢杆菌BEST7003基因组中(图7)。如在图9A中所示,构建体#1的整合导致了GFP在细菌液体培养物中的显著表达,在约6小时的培养之后达到平稳期,这可能由于构建体编码的AimP肽的表达所致。此外,当细菌在各种浓度的仲裁肽(SAIRGA, SEQ ID NO: 269)的存在下在液体培养基中生长时,观察到GFP荧光的浓度-依赖性表达,使得在没有肽的情况下检测到最大荧光;并且荧光逐渐以与生长培养基中的肽的浓度成比例的方式被抑制。
随后,设计了一种仅包含AimR基因、AimR结合位点和AimR结合位点下游的GFP的最小表达系统(构建体#2, 图8)并在AmyE基因座整合到枯草芽孢杆菌BEST7003的基因组中(即该系统不含AimP和AimX基因)。类似于含有构建体#1的细菌,最小化构建体#2的整合导致GFP在细菌液体培养物中的显著表达;而当细菌在不同浓度的仲裁肽(SAIRGA, SEQ IDNO: 269)存在下生长时,观察到GFP的差异表达依赖于培养基中肽的浓度(图9B)。
重要的是,SAIRGA (SEQ ID NO: 269)肽浓度或GFP表达不影响细菌的生长速率(图9A-B)。
虽然本发明已结合其特定实施方案进行了描述,显然许多选择、修饰和变化对本领域技术人员而言将是显而易见的。因此,打算涵盖所有这样的落入所附权利要求书的精神和宽泛范围内的选择、修饰和变化。
本说明书提及的所有的出版物、专利和专利申请通过引用以其全文在此结合到本说明书中,如同各个独立的出版物、专利或专利申请特别地和单独地指明通过引用结合到本文中的程度一样。此外,本申请中的任何参考文献的引用和鉴定不应视为承认这样的参考文献可作为本发明的现有技术获得。对于章节标题使用的程度,不应将它们视为必要的限制。
参考文献
(另外的参考资料在文本中被引用)
1.Pottathil, M. & Lazazzera, B. A. The extracellular Phr peptide-Rapphosphatase signaling circuit of Bacillus subtilis. Front. Biosci.8, d32–45(2003).
2.Perego, M. Forty years in the making: understanding the molecularmechanism of peptide regulation in bacterial development. PLoS Biol.11,e1001516 (2013).
3.Waters, C. M. & Bassler, B. L. Quorum sensing: cell-to-cellcommunication in bacteria. Annu. Rev. Cell Dev. Biol.21, 319–46 (2005).
4.Lanfermeijer, F. C., Detmers, F. J., Konings, W. N. & Poolman, B. Onthe binding mechanism of the peptide receptor of the oligopeptide transportsystem of Lactococcus lactis. EMBO J.19, 3649–56 (2000).
5.Patrick, J. E. & Kearns, D. B. Laboratory Strains of Bacillus subtilisDo Not Exhibit Swarming Motility. J. Bacteriol.191, 7129–7133 (2009).
6.Tucker, R. G. Acquisition of Thymidylate Synthetase Activity by aThymine-requiring Mutant of Bacillus subtilis following Infection by theTemperate Phage 3. J. Gen. Virol.4, 489–504 (1969).
7.Rutberg, L. in The Molecular Biology of Bacilli Vol. 1 Bacillussubtilis (ed Dubnau, D. A.) Ch. Temperate Bacteriophages of BacillusSubtilis, 247-268 (Academic press, 1982).
8.Emanuelsson, O., Brunak, S., von Heijne, G. & Nielsen, H. Locatingproteins in the cell using TargetP, SignalP and related tools. Nat. Protoc.2,953–971 (2007).
9.Rocha-Estrada, J., Aceves-Diez, A. E., Guarneros, G. & de la Torre, M.The RNPP family of quorum-sensing proteins in Gram-positive bacteria. Appl. Microbiol. Biotechnol.87, 913–23 (2010).
10.Do, H. & Kumaraswami, M. Structural Mechanisms of Peptide Recognitionand Allosteric Modulation of Gene Regulation by the RRNPP Family of Quorum-Sensing Regulators. J. Mol. Biol.428, 2793-2804 (2016).
11.Perez-Pascual, D., Monnet, V. & Gardan, R. Bacterial Cell-CellCommunication in the Host via RRNPP Peptide-Binding Regulators. Front. Microbiol.7, 706 (2016).
12.Dunny, G. M. & Berntsson, R. P.-A. Enterococcal Sex Pheromones:Evolutionary Pathways to Complex, Two-Signal Systems. J. Bacteriol.198, 1556–1562 (2016).
13.Shi, K. et al. Structure of peptide sex pheromone receptor PrgX andPrgX/pheromone complexes and regulation of conjugation in Enterococcusfaecalis. Proc. Natl. Acad. Sci. U. S. A.102, 18596–601 (2005).
14.Lereclus, D., Agaisse, H., Gominet, M., Salamitou, S. & Sanchis, V.Identification of a Bacillus thuringiensis gene that positively regulatestranscription of the phosphatidylinositol-specific phospholipase C gene atthe onset of the stationary phase. J. Bacteriol.178, 2749–56 (1996).
15.Slamti, L. & Lereclus, D. A cell-cell signaling peptide activates thePlcR virulence regulon in bacteria of the Bacillus cereus group. EMBO J.21,4550–9 (2002).
16.Declerck, N. et al. Structure of PlcR: Insights into virulenceregulation and evolution of quorum sensing in Gram-positive bacteria. Proc. Natl. Acad. Sci. U. S. A.104, 18490–5 (2007).
17.Dubois, T. et al. Activity of the Bacillus thuringiensis  NprR-NprXcell-cell communication system is co-ordinated to the physiological stagethrough a complex transcriptional regulation. Mol. Microbiol.88, 48–63(2013).
18.Fleuchot, B. et al. Rgg proteins associated with internalized smallhydrophobic peptides: a new quorum-sensing mechanism in streptococci. Mol. Microbiol.80, 1102–1119 (2011).
19.Parashar, V., Mirouze, N., Dubnau, D. A. & Neiditch, M. B. StructuralBasis of Response Regulator Dephosphorylation by Rap Phosphatases. PLoS Biol.9, e1000589 (2011).
20.Ishikawa, S., Core, L. & Perego, M. Biochemical characterization ofaspartyl phosphate phosphatase interaction with a phosphorylated responseregulator and its inhibition by a pentapeptide. J. Biol. Chem.277, 20483–20489 (2002).
21.Baker, M. D. & Neiditch, M. B. Structural Basis of Response RegulatorInhibition by a Bacterial Anti-Activator Protein. PLoS Biol.9, e1001226(2011).
22.Peters, J. M. et al. A Comprehensive, CRISPR-based Functional Analysisof Essential Genes in Bacteria. Cell165, 1493–1506 (2016).
23.Johnson, C. M. & Grossman, A. D. Integrative and Conjugative Elements(ICEs): What They Do and How They Work. Annu. Rev. Genet. 49, 577-601 (2015).
24.Auchtung, J. M., Lee, C. A., Monson, R. E., Lehman, A. P. & Grossman,A. D. Regulation of a Bacillus subtilis mobile genetic element byintercellular signaling and the global DNA damage response. Proc. Natl. Acad. Sci. U. S. A.102, 12554–9 (2005).
25.Hargreaves, K. R. et al. What Does the Talking: Quorum SensingSignalling Genes Discovered in a Bacteriophage Genome. PLoS One9, e85131(2014).
26.Jiang, M., Grau, R. & Perego, M. Differential Processing of PropeptideInhibitors of Rap Phosphatases in Bacillus subtilis. J. Bacteriol.182, 303–310 (2000).
27.Dodd, I. B., Shearwin, K. E. & Egan, J. B. Revisited gene regulationin bacteriophage lambda. Curr. Opin. Genet. Dev.15, 145–52 (2005).
28.Oppenheim, A. B., Kobiler, O., Stavans, J., Court, D. L. & Adhya, S.Switches in bacteriophage lambda development. Annu. Rev. Genet.39, 409–29(2005).
29.Goldfarb, T. et al. BREX is a novel phage resistance system widespreadin microbial genomes. EMBO J.34, 169–83 (2015).
30.MacLean, B. et al. Skyline: an open source document editor forcreating and analyzing targeted proteomics experiments. Bioinformatics26,966–8 (2010).
31.Erijman, A., Dantes, A., Bernheim, R., Shifman, J. M. & Peleg, Y.Transfer-PCR (TPCR): a highway for DNA cloning and protein engineering. J. Struct. Biol.175, 171–177 (2011).
32.Garber, M. et al. A High-Throughput Chromatin ImmunoprecipitationApproach Reveals Principles of Dynamic Gene Regulation in Mammals. Mol. Cell47, 810–822 (2012).
33.Dar, D. et al. Term-seq reveals abundant ribo-regulation ofantibiotics resistance in bacteria. Science, 352, 187 (2016).

Claims (48)

1. 一种表达感兴趣的表达产物的方法,该方法包括:
(i) 在细胞中引入多核苷酸,所述多核苷酸包含可操作地连接到编码感兴趣的表达产物的核酸序列的AimR响应元件,其中所述AimR包含用于结合所述AimR响应元件的DNA结合结构域,所述AimR包含螺旋-转角-螺旋(HTH)基序和三十四肽重复序列(TPR)结构域;和
(ii) 使所述细胞与包含XXXXGG/A的氨基酸序列的AimP肽接触,其中所述AimP肽能够与所述AimR多肽结合,并将所述AimR多肽与所述AimR响应元件分离,
从而表达感兴趣的表达产物。
2.一种表达感兴趣的表达产物的方法,该方法包括在细胞中引入多核苷酸,所述多核苷酸包含可操作地连接到编码感兴趣的表达产物的异源核酸序列的AimR响应元件,其中所述AimR包含用于结合所述AimR响应元件的DNA结合结构域,所述AimR包含螺旋-转角-螺旋(HTH)基序和三十四肽重复序列(TPR)结构域,从而表达感兴趣的表达产物。
3.一种表达感兴趣的表达产物的方法,该方法包括在细胞中引入多核苷酸,所述多核苷酸包含可操作地连接到编码感兴趣的表达产物的核酸序列的AimR响应元件;和包含AimR多核苷酸和用于指导所述AimR多核苷酸的表达的与所述AimR异源的顺式作用调节元件的核酸构建体,
其中所述AimR包含用于结合所述AimR响应元件的DNA结合结构域,所述AimR包含螺旋-转角-螺旋(HTH)基序和三十四肽重复序列(TPR)结构域,从而表达感兴趣的表达产物。
4.权利要求1-2的任一项的方法,其包括在所述细胞中引入编码所述AimR的多核苷酸。
5.权利要求2-3的任一项的方法,其包括使所述细胞与AimP肽或编码所述肽的核酸序列接触,所述AimP肽包含XXXXGG/A的氨基酸序列,其中所述AimP肽能够与所述AimR多肽结合,并将所述AimR多肽与所述AimR响应元件分离。
6.权利要求2-3的任一项的方法,其包括使所述细胞与能够下调所述AimR响应元件的表达和/或活性的试剂接触。
7.权利要求1-6的任一项的方法,其中所述感兴趣的表达产物对所述细胞是内源性的。
8.权利要求1-6的任一项的方法,其中所述感兴趣的表达产物对所述细胞是外源性的。
9.一种经鉴定为表达感兴趣的表达产物的制品,其包括包装以下至少两种物质的包装材料:
(i) 包含AimR响应元件的多核苷酸,其中所述AimR包含用于结合所述AimR响应元件的DNA结合结构域,所述AimR包含螺旋-转角-螺旋(HTH)基序和三十四肽重复序列(TPR)结构域;
(ii) 编码所述AimR的多核苷酸;
(iii) 包含XXXXGG/A的氨基酸序列的AimP肽或编码该肽的核酸序列,其中所述AimP肽能够与所述AimR多肽结合,并将所述AimR多肽与所述AimR响应元件分离;和/或
(iv) 能够下调所述AimR响应元件的表达和/或活性的试剂。
10.权利要求9的制品,其中编码所述AimR的所述多核苷酸被包含在核酸构建体中,所述核酸构建体包含与所述AimR异源的顺式作用调节元件,用于指导所述AimR多核苷酸的表达。
11.权利要求9-10的任一项的制品,其包含多克隆位点(MCS)。
12.权利要求9-11的任一项的制品,其包含编码感兴趣的表达产物的多核苷酸。
13.权利要求1-8的任一项的方法或权利要求9-12的任一项的制品,其中所述感兴趣的表达产物是DNA编辑剂。
14.权利要求1-8的任一项的方法或权利要求9-12的任一项的制品,其中所述AimR响应元件包含用于结合所述AimR和AimX多核苷酸的核酸序列,其中所述AimX多核苷酸或由所述AimX多核苷酸编码的AimX多肽能够抑制在宿主细菌中表达所述AimR的温和噬菌体的溶原性。
15.权利要求14的方法或制品,其中所述感兴趣的表达产物是AimX依赖的DNA编辑剂。
16.权利要求15的方法,其包括在所述细胞中引入由所述DNA编辑剂整合到所述细胞的基因组中的核酸序列。
17.权利要求13和15的任一项的方法或制品,其中所述DNA编辑剂是整合酶。
18.权利要求13和15的任一项的方法或制品,其中所述DNA编辑剂选自锌指核酸酶、2类CRISPR/Cas的效应蛋白(如Cas9、Cpf1、C2c1、C2c3)和TALEN。
19.一种包含XXXXGG/A的氨基酸序列的分离AimP肽,其中所述肽能够结合AimR多肽,该多肽包含用于与AimR响应元件结合的DNA结合结构域,所述AimR包含螺旋-转角-螺旋(HTH)基序和三十四肽重复序列(TPR)结构域;并将所述AimR多肽与AimR响应元件分离。
20.一种编码权利要求19的肽的分离多核苷酸。
21.一种分离的AimR多肽,该多肽包含用于与AimR响应元件结合的DNA结合结构域,所述AimR包含螺旋-转角-螺旋(HTH)基序和三十四肽重复序列(TPR)结构域。
22.一种编码权利要求21的多肽的分离多核苷酸。
23.一种包含AimR响应元件的分离多核苷酸,其中所述AimR包含用于结合所述AimR响应元件的DNA结合结构域,所述AimR包含螺旋-转角-螺旋(HTH)基序和三十四肽重复序列(TPR)结构域。
24.权利要求23的分离多核苷酸,其中所述AimR响应元件包含用于结合所述AimR和AimX多核苷酸的核酸序列,其中所述AimX多核苷酸或由所述AimX多核苷酸编码的AimX多肽能够抑制在宿主细菌中表达所述AimR的温和噬菌体的溶原性。
25.一种分离的多肽,其由权利要求24的多核苷酸编码。
26.一种分离的多核苷酸,其包含权利要求22和23或22和24的多核苷酸。
27.一种编码仲裁系统的分离多核苷酸,包含权利要求20、22和24的多核苷酸,其中所述仲裁系统能够调节在宿主细菌中表达所述仲裁系统的噬菌体的溶原性。
28.一种核酸构建体,其包含权利要求20、22、23和24的任一项的多核苷酸和多克隆位点(MCS)。
29.一种核酸构建体,其包含权利要求26-27的任一项的多核苷酸和多克隆位点(MCS)。
30.一种核酸构建体,其包含权利要求20、22、23和24的任一项的多核苷酸或权利要求28的核酸构建体,以及与所述AimP、所述AimR、所述AimR响应元件和/或所述AimX异源的顺式作用调节元件,用于指导所述多核苷酸的表达。
31.一种核酸构建体,其包含权利要求26-27的任一项的多核苷酸或权利要求29的核酸构建体,以及与所述AimP、所述AimR、所述AimR响应元件和/或所述AimX异源的顺式作用调节元件,用于指导所述多核苷酸的表达。
32.权利要求29和31的任一项的核酸构建体,其为包含至少两个核酸构建体的核酸构建体系统,所述至少两个核酸构建体各自表达至少一个所述多核苷酸。
33.权利要求28-32的任一项的核酸构建体,其中所述构建体编码包含所述多核苷酸的多顺反子mRNA。
34.一种能够下调AimR响应元件的表达和/或活性的分离核酸试剂,其中所述AimR包含用于结合所述AimR响应元件的DNA结合结构域,所述AimR包含螺旋-转角-螺旋(HTH)基序和三十四肽重复序列(TPR)结构域。
35.一种经鉴定表达感兴趣的表达产物的制品,其包含包装以下的包装材料:
至少一种以下物质:
(a)(i) 权利要求22-24和26的任一项的分离多核苷酸,
(a)(ii) 包含权利要求22-24和26的任一项的多核苷酸和多克隆位点(MCS)的核酸构建体,和/或
(a)(iii) 包含权利要求22-24和26的任一项的多核苷酸和用于指导所述多核苷酸的表达的与所述AimR或所述AimX异源的顺式作用调节元件的核酸构建体;
和至少一种以下物质:
(b)(i) 权利要求19的分离的肽,
(b)(ii) 权利要求20的分离的多核苷酸,
(b)(iii) 包含权利要求20的多核苷酸和MCS的核酸构建体,
(b)(iv) 包含权利要求20的多核苷酸以及用于指导所述多核苷酸的表达的与所述AimP异源的顺式作用调节元件的核酸构建体,和/或
(b)(v) 权利要求34的分离试剂。
36.权利要求22、23-24和26-27的任一项的分离多核苷酸、权利要求28-33的任一项的核酸构建体或权利要求35的制品,其包含编码感兴趣的表达产物的核酸序列。
37.权利要求35和36的任一项的分离的多核苷酸、核酸构建体或制品,其中所述感兴趣的表达产物是DNA编辑剂。
38.权利要求1、4-5、7-20和27-33和35-37的任一项的方法、制品、分离的多肽、分离的多核苷酸或核酸构建体,其中所述AimP肽能够导致在宿主细菌中表达所述AimR的温和噬菌体的溶原性。
39. 权利要求1、4-5、7-20和27-33和35-38的任一项的方法、制品、分离的多肽、分离的多核苷酸或核酸构建体,其中所述AimP包含选自SEQ ID NOs: 269-283和285-286的氨基酸序列。
40. 权利要求1-39的任一项的方法、制品、分离的多肽、分离的多核苷酸或核酸构建体,其中所述AimR包含与选自SEQ ID NO: 1-113的序列具有至少80 %同一性的核酸序列和/或与选自SEQ ID NOs: 114-226的序列具有至少80 %同一性的氨基酸序列。
41. 权利要求1-39的任一项的方法、制品、分离的多肽、分离的多核苷酸或核酸构建体,其中所述AimR包含选自SEQ ID NO: 1-113的核酸序列和/或选自SEQ ID NOs: 114-226的氨基酸序列。
42. 权利要求1-18和23-41的任一项的方法、制品、分离的多肽、分离的多核苷酸或核酸构建体,其中所述AimR响应元件包含选自SEQ ID NOs: 287-334的核酸序列。
43. 权利要求1-18和23-41的任一项的方法、制品、分离的多肽、分离的多核苷酸或核酸构建体,其中所述AimR响应元件包含SEQ ID NO: 378。
44. 权利要求14-18和24-33和35-43的任一项的方法、制品、分离的多肽、分离的多核苷酸或核酸构建体,其中所述AimX包含在SEQ ID NO: 336中所述的核酸序列。
45.权利要求1-44的任一项的方法、制品、分离的多肽、分离的多核苷酸或核酸构建体,其中所述AimR和所述AimP和/或所述AimR响应元件在表达它们的温和噬菌体的核酸分子上5’至3’依次定位。
46.权利要求1-45的任一项的方法、制品、分离的多肽、分离的多核苷酸或核酸构建体,其中所述AimP和所述AimR响应元件在表达它们的温和噬菌体的核酸分子上5’至3’依次定位。
47.权利要求1-44的任一项的方法、制品、分离的多肽、分离的多核苷酸或核酸构建体,其中所述AimR和所述AimP和/或所述AimR响应元件在温和噬菌体的基因组中5’至3’依次定位。
48.权利要求1-45的任一项的方法、制品、分离的多肽、分离的多核苷酸或核酸构建体,其中所述AimP和所述AimR响应元件在温和噬菌体的基因组中5’至3’依次定位。
CN201780084829.6A 2016-11-28 2017-11-28 分离的多核苷酸和多肽及使用它们来表达感兴趣的表达产物的方法 Pending CN110234765A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662426669P 2016-11-28 2016-11-28
US62/426669 2016-11-28
PCT/IL2017/051293 WO2018096547A1 (en) 2016-11-28 2017-11-28 Isolated polynucleotides and polypeptides and methods of using same for expressing an expression product of interest

Publications (1)

Publication Number Publication Date
CN110234765A true CN110234765A (zh) 2019-09-13

Family

ID=60766018

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780084829.6A Pending CN110234765A (zh) 2016-11-28 2017-11-28 分离的多核苷酸和多肽及使用它们来表达感兴趣的表达产物的方法

Country Status (5)

Country Link
US (1) US11542508B2 (zh)
EP (1) EP3545095A1 (zh)
JP (1) JP2019535298A (zh)
CN (1) CN110234765A (zh)
WO (1) WO2018096547A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11542508B2 (en) 2016-11-28 2023-01-03 Yeda Research And Development Co. Ltd. Isolated polynucleotides and polypeptides and methods of using same for expressing an expression product of interest

Family Cites Families (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL154600B (nl) 1971-02-10 1977-09-15 Organon Nv Werkwijze voor het aantonen en bepalen van specifiek bindende eiwitten en hun corresponderende bindbare stoffen.
NL154598B (nl) 1970-11-10 1977-09-15 Organon Nv Werkwijze voor het aantonen en bepalen van laagmoleculire verbindingen en van eiwitten die deze verbindingen specifiek kunnen binden, alsmede testverpakking.
NL154599B (nl) 1970-12-28 1977-09-15 Organon Nv Werkwijze voor het aantonen en bepalen van specifiek bindende eiwitten en hun corresponderende bindbare stoffen, alsmede testverpakking.
US3901654A (en) 1971-06-21 1975-08-26 Biological Developments Receptor assays of biologically active compounds employing biologically specific receptors
US3853987A (en) 1971-09-01 1974-12-10 W Dreyer Immunological reagent and radioimmuno assay
US3867517A (en) 1971-12-21 1975-02-18 Abbott Lab Direct radioimmunoassay for antigens and their antibodies
NL171930C (nl) 1972-05-11 1983-06-01 Akzo Nv Werkwijze voor het aantonen en bepalen van haptenen, alsmede testverpakkingen.
US3850578A (en) 1973-03-12 1974-11-26 H Mcconnell Process for assaying for biologically active molecules
US3935074A (en) 1973-12-17 1976-01-27 Syva Company Antibody steric hindrance immunoassay with two antibodies
US3996345A (en) 1974-08-12 1976-12-07 Syva Company Fluorescence quenching with immunological pairs in immunoassays
US4034074A (en) 1974-09-19 1977-07-05 The Board Of Trustees Of Leland Stanford Junior University Universal reagent 2-site immunoradiometric assay using labelled anti (IgG)
US3984533A (en) 1975-11-13 1976-10-05 General Electric Company Electrophoretic method of detecting antigen-antibody reaction
US4098876A (en) 1976-10-26 1978-07-04 Corning Glass Works Reverse sandwich immunoassay
US4879219A (en) 1980-09-19 1989-11-07 General Hospital Corporation Immunoassay utilizing monoclonal high affinity IgM antibodies
US5011771A (en) 1984-04-12 1991-04-30 The General Hospital Corporation Multiepitopic immunometric assay
US4666828A (en) 1984-08-15 1987-05-19 The General Hospital Corporation Test for Huntington's disease
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4801531A (en) 1985-04-17 1989-01-31 Biotechnology Research Partners, Ltd. Apo AI/CIII genomic polymorphisms predictive of atherosclerosis
EP0264166B1 (en) 1986-04-09 1996-08-21 Genzyme Corporation Transgenic animals secreting desired proteins into milk
US4873316A (en) 1987-06-23 1989-10-10 Biogen, Inc. Isolation of exogenous recombinant proteins from the milk of transgenic mammals
US5272057A (en) 1988-10-14 1993-12-21 Georgetown University Method of detecting a predisposition to cancer by the use of restriction fragment length polymorphism of the gene for human poly (ADP-ribose) polymerase
US5464764A (en) 1989-08-22 1995-11-07 University Of Utah Research Foundation Positive-negative selection methods and vectors
US5192659A (en) 1989-08-25 1993-03-09 Genetype Ag Intron sequence analysis method for detection of adjacent and remote locus alleles as haplotypes
US5281521A (en) 1992-07-20 1994-01-25 The Trustees Of The University Of Pennsylvania Modified avidin-biotin technique
US5541110A (en) 1994-05-17 1996-07-30 Bristol-Myers Squibb Cloning and expression of a gene encoding bryodin 1 from Bryonia dioica
US6774279B2 (en) 1997-05-30 2004-08-10 Carnegie Institution Of Washington Use of FLP recombinase in mice
US20030232410A1 (en) 2002-03-21 2003-12-18 Monika Liljedahl Methods and compositions for using zinc finger endonucleases to enhance homologous recombination
CA2497913C (en) 2002-09-05 2014-06-03 California Institute Of Technology Use of chimeric nucleases to stimulate gene targeting
US20060014264A1 (en) 2004-07-13 2006-01-19 Stowers Institute For Medical Research Cre/lox system with lox sites having an extended spacer region
US20070190601A1 (en) 2004-10-08 2007-08-16 Avigenics, Inc. Modified integrase and methods of use
EP2067402A1 (en) 2007-12-07 2009-06-10 Max Delbrück Centrum für Molekulare Medizin (MDC) Berlin-Buch; Transponson-mediated mutagenesis in spermatogonial stem cells
AU2011256838B2 (en) 2010-05-17 2014-10-09 Sangamo Therapeutics, Inc. Novel DNA-binding proteins and uses thereof
CA2892860C (en) 2012-11-27 2023-01-03 Children's Medical Center Corporation Targeting bcl11a distal regulatory elements for fetal hemoglobin reinduction
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
US20160251410A1 (en) 2013-09-03 2016-09-01 Yissum Research Development Company Of The Hebrew University Of Jerusalem Ltd. Compositions and methods for expressing recombinant polypeptides
US11542508B2 (en) 2016-11-28 2023-01-03 Yeda Research And Development Co. Ltd. Isolated polynucleotides and polypeptides and methods of using same for expressing an expression product of interest

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
LUKE E ULRICH等: "One-component systems dominate signal transduction in prokaryotes", 《TRENDS MICROBIOL》 *
MRIDULA POTTATHIL等: "The extracellular Phr peptide-Rap phosphatase signaling circuit of Bacillus subtilis", 《FRONT BIOSCI》 *
ZOHAR EREZ等: "Communication between viruses guides lysis-lysogeny decisions", 《NATURE》 *
焦文豪等: "噬菌体仲裁通讯系统的研究进展", 《湖北农业科学》 *
陈恬: "SezAT系统及PlcR转录调控因子在2型猪链球菌中的作用研究", 《中国优秀硕士学位论文全文数据库(电子期刊)医药卫生科技辑》 *

Also Published As

Publication number Publication date
US20190264213A1 (en) 2019-08-29
US11542508B2 (en) 2023-01-03
EP3545095A1 (en) 2019-10-02
WO2018096547A8 (en) 2018-08-09
JP2019535298A (ja) 2019-12-12
WO2018096547A1 (en) 2018-05-31

Similar Documents

Publication Publication Date Title
CN113185613B (zh) 新型冠状病毒s蛋白及其亚单位疫苗
US11162084B2 (en) Enhanced hAT family transposon-mediated gene transfer and associated compositions, systems, and methods
Siomi et al. A nuclear localization domain in the hnRNP A1 protein.
DE3854952T2 (de) Mykobakterielle rekombinanten und peptide
AU2017249424A1 (en) Recombinant arterivirus replicon systems and uses thereof
CN108026519A (zh) 将蛋白质定向至基因组中的特定基因座的组合物和方法
CN109312361A (zh) 转座子系统及应用方法
CN105051204A (zh) 位点特异性酶和使用方法
CN107531780A (zh) 抗‑Rho GTPase的构象单域抗体及其用途
JPH04503604A (ja) N―連結グリコシル化部位含有il―2アナローグ
JP6000130B2 (ja) 新規なシグナルペプチドおよび組換えタンパク質の生成のためのその使用
JP6876628B2 (ja) 細胞表面上にペプチドを提示するためのシステム
CN109563489A (zh) 具有经修饰的糖蛋白d的疱疹病毒
CN110234765A (zh) 分离的多核苷酸和多肽及使用它们来表达感兴趣的表达产物的方法
KR20180102025A (ko) C2c1 엔도뉴클레아제를 포함하는 유전체 교정용 조성물 및 이를 이용한 유전체 교정 방법
Cheng et al. Hsp70A and GlsA interact as partner chaperones to regulate asymmetric division in Volvox
UA127452C2 (uk) Бактерія streptomyces fungicidicus та спосіб одержання ендурацидину в штамі streptomyces fungicidicus
US11980671B2 (en) Use of bacterial voltage gated ion channels for human therapies
US20130023643A1 (en) Nuclear localization signal peptides derived from vp2 protein of chicken anemia virus and uses of said peptides
US20230357325A1 (en) Composition and method to stabilize coronavirus spike glycoproteins in pre-fusion conformation
Luu et al. Sulfated RaxX, which represents an unclassified group of ribosomally synthesized post-translationally modified peptides, binds a host immune receptor
KR20190011687A (ko) 면역원성시스템 및 이를 포함한 동물 백신
EP3954699A1 (en) Nucleic acid binding protein
EP1454987A1 (en) Polypeptides translocated into cells by the VirB/VirD4 type IV secretion system and uses thereof
KR101351801B1 (ko) 소 IgG의 Fc 도메인의 세포 표면 발현용 벡터, 상기 벡터에 의해 형질전환된 숙주세포 및 상기 숙주세포를 이용한 소 질병 관련 바이러스에 대한 백신의 제조방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190913

WD01 Invention patent application deemed withdrawn after publication