CN112867791A - 用于转导蛋白质-蛋白质相互作用的新方法 - Google Patents

用于转导蛋白质-蛋白质相互作用的新方法 Download PDF

Info

Publication number
CN112867791A
CN112867791A CN201980067865.0A CN201980067865A CN112867791A CN 112867791 A CN112867791 A CN 112867791A CN 201980067865 A CN201980067865 A CN 201980067865A CN 112867791 A CN112867791 A CN 112867791A
Authority
CN
China
Prior art keywords
domain
variant
protein
cell
narx
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980067865.0A
Other languages
English (en)
Inventor
阿兰·玛兹
雅科夫·贝宁森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Eidgenoessische Technische Hochschule Zurich ETHZ
Original Assignee
Eidgenoessische Technische Hochschule Zurich ETHZ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Eidgenoessische Technische Hochschule Zurich ETHZ filed Critical Eidgenoessische Technische Hochschule Zurich ETHZ
Publication of CN112867791A publication Critical patent/CN112867791A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0684Cells of the urinary tract or kidneys
    • C12N5/0686Kidney cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1055Protein x Protein interaction, e.g. two hybrid selection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1223Phosphotransferases with a nitrogenous group as acceptor (2.7.3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/13Protein-histidine kinases (2.7.13)
    • C12Y207/13003Histidine kinase (2.7.13.3)
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6845Methods of identifying protein-protein interactions in protein mixtures
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/70Fusion polypeptide containing domain for protein-protein interaction
    • C07K2319/71Fusion polypeptide containing domain for protein-protein interaction containing domain for transcriptional activaation, e.g. VP16
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/13Protein-histidine kinases (2.7.13)
    • C12Y207/13001Protein-histidine pros-kinase (2.7.13.1)
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2500/00Screening for compounds of potential therapeutic value
    • G01N2500/02Screening involving studying the effect of compounds C on the interaction between interacting molecules A and B (e.g. A = enzyme and B = substrate for A, or A = receptor and B = ligand for the receptor)
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2500/00Screening for compounds of potential therapeutic value
    • G01N2500/10Screening for compounds of potential therapeutic value involving cells

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Urology & Nephrology (AREA)
  • Medicinal Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Hematology (AREA)
  • Immunology (AREA)
  • Plant Pathology (AREA)
  • Cell Biology (AREA)
  • Food Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明涉及细胞,其包含第一核酸序列、第二核酸序列和第三核酸序列,所述第一核酸序列编码融合至包含DHp结构域和CA结构域的组氨酸激酶第一变体的N‑末端的第一多肽,其中所述第一变体不包含跨膜结构域,所述第二核酸序列编码融合至包含DHp结构域和CA结构域的所述组氨酸激酶第二变体的N‑末端的第二多肽,其中所述第二变体不包含跨膜结构域,所述第三核酸序列编码可被所述第一或所述第二变体的所述DHp结构域特异性磷酸化的应答调节蛋白。本发明还涉及本发明的细胞的用途。

Description

用于转导蛋白质-蛋白质相互作用的新方法
本申请要求提交于2018年10月15日的欧洲专利申请EP18200357.4的优先权的权益,其通过引用并入本文。
本发明涉及用于评估或响应蛋白质-蛋白质相互作用并将该相互作用转导至目的基因的表达的方法和手段。
背景技术
分子相互作用,例如蛋白质/蛋白质相互作用,几乎参与活细胞中的每个细胞过程。蛋白质/蛋白质相互作用的表征是更好地理解和控制生物系统的重要步骤。将蛋白质/蛋白质相互作用转导至可检测信号或目的基因的表达,对于新药的发现,和用作基于细胞的生物传感器或细胞疗法的具有新功能的细胞的开发是重要的。
不同的细胞途径通过促进或抑制蛋白质/蛋白质相互作用的化合物的存在/不存在来调节。鉴定调节蛋白质/蛋白质相互作用的分子是药物发现和开发中使用的主要工具之一。此外,将蛋白质/蛋白质相互作用转导成新的应答是用于治疗目的细胞工程的主要工具。
由化合物调节的蛋白质相互作用的实例是G蛋白偶联受体(GPCRs)和下游途径蛋白(如β-抑制蛋白)之间的相互作用。GPCRs是哺乳动物细胞中的膜受体,其可检测各种配体(内源激素、生长因子和天然或合成的小分子)。GPCR与其配体相互作用后,在细胞中不同的级联反应被诱导,调节细胞活性。由于GPCR在细胞中的中心功能,许多药物作用于作为其靶标的GPCRs。已开发了不同的试验来鉴别和表征GPCR激动剂和拮抗剂。这些试验中的一些将GPCR与其蛋白配偶体之一的相互作用转导成报告基因的表达。
此外,蛋白质/蛋白质相互作用已经用于设计嵌合传感器(chimeric sensors),其可以感知不同的信号并将这些信号转导至特定的响应。这种将信息从确定的输入重定向到特定输出的能力可以用于许多应用,例如产生基于细胞的生物传感器以产生新的体外(invitro)诊断工具或产生具有更好安全性和功效的新细胞疗法。尽管在生物传感器领域有许多发展,但是它们中的许多仅仅产生需要人手动读出和解释的可检测信号。在将信号转导成下游生物活性(如基因表达)的生物传感器方面的进展明显较少。迄今为止,描述的人工信号转导系统主要利用切割融合蛋白以释放转录激活因子的方式,然后该转录激活因子调节目的基因的表达。
在组氨酸残基处的组氨酸激酶(HK)受体蛋白的配体触发(ligand-triggered)的自磷酸化后,接着磷酰基转移到应答调控子(RR)蛋白的天冬氨酸残基,启动双组分系统(TCS)信号级联。除了一些例外,HK传感器在细胞膜中形成同源二聚体(homodimer),HK自磷酸化的结构基础是存在两种不同的HK二聚体构象。在未刺激状态下,构象是这样的,即催化性ATP-结合(CA)结构域远离二聚化中的组氨酸残基和含组氨酸的磷酸转移酶(DHp)结构域(图1a),因此不发生自磷酸化。在配体结合时,CA结构域和结合的ATP进入DHp的组氨酸附近,使得磷酰基转移。接着,同源应答调控子(RR)结合至磷酸化DHp结构域,磷酸盐从RR的接受体结构域中的组氨酸转移至一个天冬氨酸,并且磷酸化RR结合其靶启动子并调节基因表达。此外,当磷酸化的RR结合未磷酸化的DHp结构域时,后者催化天冬氨酸残基的去磷酸化,并因此主动关闭信号传导。因此,HK是具有激酶和磷酸酶活性的双功能酶,两者之间的平衡决定了信号强度和动力学。
由于GPCR信号在人类疾病中的重要性,已开发了不同的试验来检测和鉴定与GPCR相互作用的分子。在所开发的不同方法中,一些方法利用β-抑制蛋白与配体活化的GPCR相互作用的事实。生物发光共振能量转移(BRET)分析、TANGO分析(Invitrogen)(图5)和ChaCha系统是这些试验的实例。第一系统将蛋白质/蛋白质相互作用转导成可检测的荧光信号。后两种试验将蛋白质/蛋白质相互作用转导成目的基因(如报告基因)的表达。
TANGO分析通过将蛋白水解可切割的人工转录因子(GAL4-VP16)与GPCR的胞内结构域融合,并通过将TEV蛋白酶与β-抑制蛋白融合来实施。通过配体激活GPCR诱导β-抑制蛋白募集至GPCR,使TEV蛋白酶与GPCR上的可切割接头紧密接近,并允许GAL4-VP16的释放。人工转录因子将诱导被GAL4-VP16靶向的嵌合启动子驱动的报告基因(β-内酰胺酶)的表达。
ChaCha系统最近已经被开发为TANGO分析的衍生物。在该系统中,与由VP64、p65激活结构域和Rta(dCas9-VPR)组成的三联转录激活因子连接的dCas9(不能切割DNA,但仍能结合它)与β-抑制蛋白融合,而GPCR的胞内结构域与TEV蛋白酶融合。该系统还需要向导RNA(gRNA)的表达,其允许dCas9募集至启动子,驱动目的基因的表达。GPCR与β-抑制蛋白-dCas9-VRP融合之间的相互作用释放dCas9-VRP。dCas9-VRP调节由在细胞中共表达的gRNA靶向的目的基因的表达。启动子可以是内源的或嵌合的。
关于探测例如细胞质中的一般蛋白质-蛋白质相互作用,也已经开发了不同的方法。最流行的一种方法是酵母双杂交方法。在该方法中,两种潜在的相互作用的蛋白,通常称为诱饵(bait)和猎物(prey),与具有特定的可检测的生物活性的蛋白质的分裂(split)亚基融合。每个单独的分裂亚基不显示所讨论的生物活性。诱饵与猎物之间的相互作用允许分别与诱饵和猎物融合的结构域的适当重建。根据诱饵和猎物的定位,已经开发了不同的报告系统:
-为了探测核定位,分裂蛋白重建报告基因的转录激活;
-对于发生在细胞质中或膜上的蛋白质-蛋白质相互作用,报告系统是基于通过激活Ras信号传导、尿嘧啶营养缺陷型或抗生素抗性的酵母生长。
酵母双杂交方法的一个缺点是,相互作用是在酵母细胞中定量的,并且它们可能不能如实地重演天然哺乳动物细胞环境中的相互作用。
因此,本发明的目的是提供用于响应于和/或评估蛋白质-蛋白质相互作用的手段和方法。
发明内容
该目的通过独立权利要求中指定的细胞和方法来解决。在从属权利要求和以下描述中陈述了有利的实施例。
本发明的第一方面涉及一种重组细胞。细胞有助于分析一对两个多肽或蛋白质彼此之间的相互作用。这些相互作用的配偶体在下文中称为“第一多肽”和“第二多肽”。这些多肽中的每一个由核酸序列编码,并且这些多肽中的每一个是融合蛋白的一部分,所述融合蛋白包含用于分析其与其它多肽的相互作用的多肽部分,以及保留DHp和CA活性的组氨酸激酶变体(variant)的片段。
本发明的细胞包括
-第一核酸序列,其编码融合至组氨酸激酶(E.C.2.7.13.3)的第一变体的N-末端的第一多肽。组氨酸激酶包含DHp(二聚化和含组氨酸的磷酸转移酶)结构域和CA(催化性ATP-结合)结构域。该细胞进一步包括
-第二核酸序列,其编码融合至组氨酸激酶的第二变体N-末端的第二多肽,所述组氨酸激酶包含DHp结构域和CA结构域,和
-第三核酸序列,其编码可被所述组氨酸激酶的第一或所述第二变体的DHp结构域特异性磷酸化的应答调节蛋白。
换句话说,本发明的这个方面涉及一种细胞,其包括
-第一核酸序列,其中所述第一核酸序列编码
o在N至C的方向上,第一多肽,其与第二多肽的相互作用作为分析对象,所述第一多肽融合至组氨酸激酶的第一变体的N-末端,其中所述组氨酸激酶包含DHp结构域和CA结构域,并且DHp结构域和CA结构域均保留在所述第一变体中,
-第二核酸序列,其编码融合至所述组氨酸激酶第二变体N-末端的第二多肽,所述组氨酸激酶包含DHp结构域和CA结构域,其中DHp结构域和CA结构域也保留在第二变体中,和
-第三核酸序列,其编码可被所述第一或所述第二变体的所述DHp结构域特异性磷酸化的应答调节蛋白。
在特别的实施方案中,第一和第二多肽不包含上述组氨酸激酶的任何部分,特别是不包含跨膜结构域、传感器结构域或传递器结构域(transmitter domain)。
在本发明的细胞的某些实施方案中,第一变体和/或第二变体不包含组氨酸激酶的跨膜结构域。
在本发明的细胞的某些实施方案中,
-所述第一变体不包含组氨酸激酶的功能性传递器结构域和/或功能性传感器结构域,和/或;
-所述第二变体不包含组氨酸激酶的功能性传递器结构域和/或功能性传感器结构域。
在特别的实施方案中,组氨酸激酶的天然存在的传感器和传递器结构域被两种目的蛋白质替代,其相互作用应被评估。如果在这些蛋白之间存在特异性相互作用,它们之间的结合促进组氨酸激酶截短(truncated)变体的二聚化,由此实现具有ATP的CA结构域和DHp结构域的空间接近性。这产生DHp结构域的磷酸化,其然后能够磷酸化同源配体(cognate),应答调节结构域,特别是应答调节蛋白的受体结构域。
或者,两种目的蛋白可形成人工信号转导途径,其中两种目的蛋白的结合由刺激物触发,例如可被两种目的蛋白之一或两者特异性识别的配体。配体的识别可以与由应答调节蛋白的活性介导的期望的应答相关。这种应答可以是影响细胞的细胞过程的微小RNA,或者是蛋白质(例如细胞因子或抗体)的表达。在特别的实施方案中,该细胞可以用于医学应用,其中有益的或治疗性应答可以由,例如,疾病相关的化合物(如疾病相关的抗原)特异性地触发。
或者,化合物对已知相互作用蛋白的作用可以通过本发明的细胞来评估,其中化合物的作用可以通过应答调节蛋白的活性来确定。
特别地,应答调节因子蛋白包含效应子功能,其可以被确定用于评估第一多肽和第二多肽之间的相互作用,或用于引发响应于上述刺激物的期望应答。这种效应子功能的非限制性实例包括与DNA、RNA或酶(例如催化例如cAMP形成的酶)结合。
在特别的实施方案中,效应子功能包括与启动子序列的特异性结合和诱导目的基因的表达。
在本发明的细胞的某些实施方案中,应答调节蛋白包含与效应器结构域(aneffector domain)融合的受体结构域,其中受体结构域能够被第一或第二组氨酸激酶变体的DHp结构域磷酸化,并且效应器结构域能够被磷酸化的受体结构域调节,特别是被激活或抑制。特别地,效应器结构域的活性依受体结构域的磷酸化状态而变化,因此效应器结构域的活性通过受体结构域的磷酸化可以增加或可以被开启或降低或被抑制。
在本发明的细胞的某些实施方案中,
-效应器结构域是转录激活结构域,和
-所述细胞包含第四核酸序列,所述第四核酸序列包含在可由转录激活结构域识别的诱导型启动子控制下的目的基因,
其中在转录激活结构域激活后,目的基因的表达被诱导。
在本发明细胞的某些实施方案中,目的基因编码目的蛋白,特别是荧光或发光蛋白,或目的RNA。
该目的蛋白可以是荧光或发光蛋白,由此可以通过目的蛋白的荧光或发光来确定或观察第一和第二多肽之间的成功的相互作用。
或者,目的蛋白或目的RNA可以是或引发响应于上述刺激物的期望应答,例如期望治疗应答(细胞因子、抗体、活性氧的产生等)。
在本发明的细胞的某些实施方案中,
-第一和第二变体是EnvZ激酶(UniProt No P0AEJ4)的变体,应答调节蛋白包含或a是OmpR应答调节(RR)蛋白(Uniprot No P0AA16),或
-第一和第二变体是NarX激酶(UniProt No P0AFA2)的变体,受体结构域包含或a是NarL应答调节(RR)蛋白(Uniprot编号P0AF28),效应器结构域是或包含VP16转录激活结构域(Vp48,SEQ ID 7)。
如前所述,效应器结构域可以是与VP16融合的NarL的部分。
在本发明细胞的某些实施方案中,转录激活结构域是,由以SEQ ID NO 7为特征的氨基酸组成或包含以SEQ ID NO 7为特征的氨基酸。
在本发明细胞的某些实施方案中,第一或第二变体是或包含选自EnvZ180-450(SEQID 8)、EnvZ223-450(SEQ ID 9)、NarX176-598(SEQ ID 10)和NarX379-598(SEQ ID 11)的变体,或与SEQ ID 8-11中任一个具有至少70%、80%、85%、90%、95%、98%或99%序列同一性的功能等同多肽。
在本发明细胞的某些实施方案中,诱导型启动子选自OmpR启动子(SEQ ID 1)和NarL-RE启动子(SEQ ID 2)。
在本发明细胞的某些实施方案中,第一核酸序列和/或第二核酸序列和/或第三核酸序列针对细胞的密码子使用进行优化。
在本发明细胞的某些实施方案中,第一核酸序列和/或第二核酸序列和/或第三核酸序列在组成型启动子的转录控制下。
在本发明细胞的某些实施方式中,组成型启动子选自CMV(SEQ ID 3)、EF1α(SEQID 4)和EF1α-V1(SEQ ID 5)。
在本发明的细胞的某些实施方案中,第一变体和第二变体是相同的。
在本发明细胞的某些实施方案中,组氨酸激酶属于转磷酸化家族(transphosphorylation family)。
在本发明的细胞的某些实施方案中,
-第一变体包含DHp结构域,其不包含组氨酸激酶的第一或第二变体的CA结构域可接近的组氨酸残基,和/或
-第二变体包含不能结合ATP的CA结构域。
在本发明的细胞的某些实施方案中,
-第一变体是或包含变体NarX379-598(H399Q)(SEQ ID 12)或与(SEQ ID 12)具有至少70%,80%,85%,90%,95%,98%或99%的序列同一性的功能等效多肽,和/或-第二个变体是或包含变体NarX379-598(N509A)(SEQ ID 13)或与(SEQ ID 13)具有至少70%,80%,85%,90%,95%,98%或99%的序列同一性的功能等效多肽。
在本发明细胞的某些实施方案中,第一多肽和第二多肽的特异性结合可由第一和/或第二多肽特异性识别的配体触发。
在本发明细胞的某些实施方案中,第一多肽是受体或包含受体,第二多肽是受体的结合配偶体或包含受体的结合配偶体,其中受体和结合配偶体的结合可由受体可识别的配体触发。
在本发明细胞的某些实施方案中,受体是跨膜受体,结合配偶体是胞质蛋白。在这种情况下,可被受体识别的配体和作为结合配偶体的胞质蛋白特别地被膜分开。
在本发明的细胞的某些实施方案中,
-第一多肽由G蛋白偶联受体组成或包含G蛋白偶联受体,第二多肽由G蛋白偶联受体的胞质配体组成或包含G蛋白偶联受体的胞质配体,特别是β-抑制蛋白,或
-所述第一多肽由T细胞受体或其组分之一组成或包含T细胞受体或其组分之一,并且第二多肽是或包含T细胞受体或其组分的胞质配体,特别是ZAP-70(UniProt NoP43403)。
在本发明细胞的某些实施方案中,所述细胞是哺乳动物细胞,特别是人细胞。
本发明的另一方面涉及评估蛋白质-蛋白质相互作用的方法。该方法包括:
-提供根据本发明的细胞,所述细胞包含:
·第一核酸序列,其编码融合至组氨酸激酶(E.C.2.7.13.3)的第一变体的N-末端的第一多肽,所述组氨酸激酶包含DHp结构域和CA结构域,
·第二核酸序列,其编码融合至组氨酸激酶第二变体N-末端的第二多肽,所述组氨酸激酶包含DHp结构域和CA结构域,和
·第三核酸序列,其编码可由所述第一或第二变体的DHp结构域特异性磷酸化的应答调节蛋白;以及
-测定所述应答调节(RR)蛋白的活性,
其中在第一多肽和第二多肽特异性结合后,第一和第二变体二聚化,使得第一或第二变体的CA结构域磷酸化第一或第二变体的DHp结构域,并且通过第一或第二变体的DHp结构域对其磷酸化,来调节、特别是激活或抑制应答调节蛋白的活性。
本发明的另一方面涉及测定化合物对蛋白质-蛋白质相互作用的影响的方法。该方法包括:
-提供根据本发明的细胞,所述细胞包括,
·第一核酸序列,其编码融合至组氨酸激酶第一变体的N-末端的第一多肽,所述组氨酸激酶包含DHp结构域和CA结构域,
·第二核酸序列,其编码融合至组氨酸激酶第二变体N-末端的第二多肽,所述组氨酸激酶包含DHp结构域和CA结构域,和
·第三核酸序列,其编码可被所述第一或所述第二变体的所述DHp结构域特异性磷酸化的应答调节蛋白,和
-将细胞与化合物接触,和
-测定所述应答调节蛋白的活性,
其中
在第一多肽和第二多肽特异性结合后,第一和第二变体二聚化,使得第一或第二变体的CA结构域磷酸化第一或第二变体的DHp结构域,并且通过所述第一和/或第二变体的所述DHp结构域的磷酸化而调节、特别是激活或抑制所述应答调节蛋白的活性,和
化合物对第一多肽和第二多肽的特异性结合的影响由应答调节蛋白的活性决定。
有利地,上述方法可以用作筛选测定以评估任何化合物对任何目的蛋白质-蛋白质相互作用的影响。
本发明的又一方面提供了一种用于响应于刺激而引起所期望应答的方法。根据本发明的这个方面的方法包括以下步骤:
-提供根据本发明的细胞,所述细胞包括,
·第一核酸序列,其编码融合至组氨酸激酶第一变体的N-末端的第一多肽,所述组氨酸激酶包含DHp结构域和CA结构域,
·第二核酸序列,其编码融合至所述组氨酸激酶的第二变体的N-末端的第二多肽,所述组氨酸激酶包含DHp结构域和CA结构域,
其中第一和第二多肽的特异性结合是由刺激物触发的,和
·第三核酸序列,其编码可被所述第一或第二变体的DHp结构域特异性磷酸化的应答调节蛋白,
其中在第一多肽和第二多肽特异性结合后,第一和第二变体二聚化,使得第一或第二变体的CA结构域磷酸化第一或第二变体的DHp结构域,并且通过第一和/或第二变体的DHp结构域的磷酸化调节、特别是激活或抑制应答调节蛋白的活性,和
-将细胞暴露于刺激物,其中期望应答由应答调节蛋白的活性介导或是应答调节蛋白的活性。
优选地,第一或第二多肽是识别刺激物的受体,例如识别疾病相关抗原的T细胞受体,或G-偶联受体,其中另一多肽可以是该受体的配体,例如分别是β-抑制蛋白或ZAP-70。
术语“第一和第二多肽的特异性结合”特别是指Kd小于10-5M、10-6M、10-7M、10-8M或10-9M的结合。
在本发明方法的某些实施方案中,所述应答调节蛋白包含与效应器结构域融合的受体结构域,其中所述受体结构域可被第一或第二变体的DHp结构域磷酸化,并且所述效应器结构域可被磷酸化的受体结构域激活。
在本发明的方法的某些实施方案中,
-所述应答调节蛋白包含与效应器结构域融合的受体结构域,其中所述受体结构域可被所述第一或第二变体的DHp结构域磷酸化,并且所述效应器结构域可被磷酸化的受体结构域激活;
-效应器结构域是转录激活结构域,
-所述细胞还包含编码目的基因的第四核酸序列,所述目的基因在可被所述转录激活结构域识别的诱导型启动子的控制下,
-其中在转录激活结构域激活后,目的基因的表达被诱导。
在本发明方法的某些实施方案中,目的基因表达产物的存在被确定作为应答调节蛋白的活性。
在本发明方法的某些实施方案中,目的基因的表达产物具有光学性质,例如包含发光部分,如在绿色荧光蛋白(GFP)的情况下。
在本发明方法的某些实施方案中,目的基因的表达产物是Cerulean。
在本发明方法的某些实施方案中,目的基因的表达产物是或介导期望的应答。例如,表达产物可以是旨在引发细胞的免疫应答的细胞因子。表达产物还可以是信号级联的组分,在级联的更下游引发期望的应答。表达产物还可以是能够引发所需反应的RNA,例如MicroRNA或自身调节内源基因的向导RNA。
此外,本发明提供了特别适合于转染或转导哺乳动物细胞,特别是人细胞的载体。该载体包括:
-包含在本发明细胞内的第一核酸序列,
-包含在本发明细胞内的第二核酸序列,
-包含在本发明细胞内的第三核酸序列,和
-任选地包含在本发明的细胞内的第四核酸序列。
根据本发明的另一方面,提供了融合蛋白。所述变体包含融合至组氨酸激酶(E.C.2.7.13.3)的一种变体的一种多肽,所述组氨酸激酶包含DHp(二聚化和含组氨酸的磷酸转移)结构域和CA(催化性ATP-结合)结构域。
特别地,所述多肽不包含上述组氨酸激酶的任何部分,特别地不包含跨膜结构域、传感器结构域或传递器结构域。
在本发明的融合蛋白的某些实施方案中,变体不包含组氨酸激酶的跨膜结构域。
在本发明的融合蛋白的某些实施方案中,变体不包含组氨酸激酶的功能性传递器结构域和/或功能性传感器结构域。
在本发明的融合蛋白的某些实施方案中,变体是EnvZ激酶的变体(UniProt NoP0AEJ4)或NarX激酶(UniProt No P0AFA2)的变体。
在本发明的融合蛋白的某些实施方案中,变体是或包含选自EnvZ180-450(SEQ ID8)、EnvZ223-450(SEQ ID 9)、NarX176-598(SEQ ID 10)和NarX379-598(SEQ ID 11)的变体,或与SEQ ID 8-11中任一个具有至少70%、80%、85%、90%、95%、98%或99%序列同一性的功能等同多肽。
在本发明的融合蛋白的某些实施方案中,组氨酸激酶属于转磷酸化家族。
在本发明的融合蛋白的某些实施方案中,变体包含DHp结构域,其不包含组氨酸激酶的变体或另一变体的CA结构域可接近的组氨酸残基,或包含不能结合ATP的CA结构域。
在本发明的融合蛋白的某些实施方案中,变体是或包含变体NarX379-598(H399Q)(SEQ ID 12),变体NarX379-598(N509A)(SEQ ID 13)或与SEQ ID 12或13具有至少70%,80%,85%,90%,95%,98%或99%的序列同一性的功能等效多肽。
在本发明的融合蛋白的某些实施方案中,多肽由G蛋白偶联受体组成或包含G蛋白偶联受体,或由G蛋白偶联受体的胞质配体组成或包含G蛋白偶联受体的胞质配体,特别是β-抑制蛋白。
在本发明的融合蛋白的某些实施方案中,多肽由T细胞受体或其组分之一组成或包含T细胞受体或其组分之一,或者多肽包含T细胞受体或其组分的胞质配体,特别是ZAP-70(UniProt No P43403)。
通过以下实施例和附图进一步说明本发明,从这些实施例和附图中可以得到进一步的实施方案和优点。这些实施例用于说明本发明,而不是限制其范围。
附图说明
图1显示了天然和移植的双组分信号传导途径的示意图。(A)天然途径由受体组氨酸激酶(HK)蛋白组成,在其信号存在下,其将自磷酸化并在受体结构域中存在的一个天冬酰胺的水平上磷酸化其同源应答调节因子(RR)。磷酸化的RR将结合由RR调节的启动子中存在的特异性反应元件。(B)移植到哺乳动物宿主中的TCS由具有人优化密码子序列的基因表达。移植到哺乳动物细胞中的组氨酸激酶总是有活性的并且自磷酸化并磷酸化RR。移植的RR用VP48反式激活结构域增强。磷酸化的RR将结合工程化启动子中存在的RE,其驱动目的基因的表达,在这种情况下为荧光报告物cerulean。DNB,DNA结合结构域。VP48,VP48反式激活蛋白结构域;Pmin,最小哺乳动物启动子。
图2显示HK的顺式相对反式自磷酸化。(A)在表达WT HK(第一列)、DHp突变体(第二列)、CA突变体(第三列)或DHp突变体和CA突变体(第四列)的哺乳动物细胞中顺式自磷酸化(上泳道)和反式自磷酸化(下泳道)的示意图。(B)表达报告基因的哺乳动物细胞的定量数据,所述哺乳动物细胞仅表达报告基因或与野生型HK、DHp突变体(EnvZ H243V、NarX H399Q和DcuS H350L)、CA突变体(EnvZ N347A、NarX N509A和DcuS N445A)或DHp突变体和CA突变体组合表达。柱状图以独立的生物一式三份的平均值±SD显示了Cerulean水平,该水平标准化为转染对照的表达(norm.u.)。
图3显示截短HK的活性。(A)在表达WT HK(第一列)、传感器结构域截短突变体(第二列),或传感器和传递器结构域截短突变体(第三列)的哺乳动物细胞中,在EnvZ/OmpR元件(上泳道)和NarX/NarL元件(下泳道)之间发生磷酸转移的示意图。(B)表达报告基因的哺乳动物细胞的定量数据,所述哺乳动物细胞仅表达报告基因或与野生型HK、传感器结构域截短突变体(EnvZ180-450和NarX176-598),或传感器和传递器结构域截短突变体(EnvZ223-450和NarX379-598)组合表达。柱状图以独立的生物一式三份的平均值±SD显示了Cerulean水平,该水平标准化为转染对照的表达(norm.u.)。
图4显示了蛋白质/蛋白质相互作用测定的设计。(A)PPI分析的示意图,用于监测两种蛋白质P1和P2之间的相互作用。P1和P2之间的相互作用,自发地或由化合物诱导,允许在与P1融合的CA结构域水平上突变的转磷酸化家族HK短胞质结构域,与在与P2融合的DHp结构域水平上突变的转磷酸化家族HK短胞质结构域二聚化。二聚作用将触发RR的磷酸化,RR将结合其RE并诱导报告基因的表达。(B)表达融合至SZ1或SZ2结构域的HK突变体的哺乳动物细胞的定量数据。(C)表达融合至FKBP或FRB结构域的HK突变体的哺乳动物细胞在不存在(白色条)或存在诱导FKBP和FRB结构域二聚化的A/C异源二聚体(黑色条)时的定量数据。柱状图以独立的生物一式三份的平均值±SD显示了Cerulean水平,该水平标准化为转染对照的表达(norm.u.)。
图5显示GPCR的蛋白质/蛋白质相互作用分析(PPI)的设计。(A)TANGO分析的示意图,用于监测GPCR和β-抑制蛋白之间的相互作用。由激动剂诱导的GPCR与β-抑制蛋白之间的相互作用,使得β-抑制蛋白-TEV蛋白酶融合体定位在GPCR-tTA的水平上并触发转录因子tTA的释放。(B)监测GPCR和β-抑制蛋白之间的相互作用的PPI分析的图示。由激动剂诱导的GPCR和β-抑制蛋白的相互作用,允许在与GPCR融合的CA结构域水平上突变的转磷酸化家族HK短胞质结构域,与在与β-抑制蛋白融合的DHp结构域水平上突变的转磷酸化家族HK短胞质结构域二聚化。二聚作用将触发RR的磷酸化,RR将结合其RE并诱导报告基因的表达。(C)表达TANGO的哺乳动物细胞的定量数据。(D)表达融合至GPCR或β-抑制蛋白的HK突变体的哺乳动物细胞在不存在(白色条)或存在异丙喹喘宁(Procaterol)(黑色条)时的定量数据。柱状图以独立的生物一式三份的平均值±SD显示了Cerulean水平,该水平标准化为转染对照的表达(norm.u.)。
图6显示通过在NarX的C末端或N末端融合的蛋白质部分的强制二聚化恢复双组分信号传导。如图中所示,在单独表达应答调节因子NarL和NarL调节的mCerulean荧光蛋白报告物,或与融合在NarX的C-末端或N-末端的SynZip1和SynZip2的不同组合的的哺乳动物细胞中的信号水平。柱状图以独立的生物一式三份的平均值±SD显示了Cerulean水平,该水平标准化为转染对照的表达(norm.u.)。
图7显示CMV和EF1α启动子的比较。(a)用表达来自CMV启动子(白色条)或来自EF1α启动子(黑色条)的iRFP的质粒转染的HEK细胞的iRFP荧光。如图所示,显示了在没有任何配体的DMEM中,或在1μM异丙喹喘宁或2μM肾上腺素的存在下的报告基因表达。柱状图以独立的生物学一式三份的平均值±SD显示了iRFP水平,其标准化为转染标记物Citrine阳性细胞(rel.u.)的频率。(b)由CMV或EF1α启动子表达的NarX/NarL的活性。如图中所示,每次转染含有NarL调节的mCerulean荧光蛋白报告物和从CMV、EF1α或EF1α-V1启动子表达NarL和NarX的质粒。柱状图以独立的生物一式三份的平均值±SD显示了Cerulean水平,该水平标准化为转染对照的表达(norm.u.)。
图8显示了通过与野生型NarX或各种NarX突变体融合的强制二聚化,双组分信号传导的恢复。如图中所示,在单独表达应答调节因子NarL和NarL调节的mCerulean荧光蛋白报告物,或与融合在野生型NarX或各种NarX突变体的SynZip1和SynZip2的不同组合的哺乳动物细胞中的信号水平。柱状图以独立的生物一式三份的平均值±SD显示了Cerulean水平,该水平标准化为转染对照的表达(norm.u.)。
图9显示了通过强制二聚化恢复双组分信号传导。如图中所示,在单独表达反应调节因子NarL和NarL调节的mCerulean荧光蛋白报告物,或仅与融合至SynZip1或SynZip2的NarX突变体的一种不同变体一起的的哺乳动物细胞中的信号水平。柱状图以独立的生物一式三份的平均值±SD显示了Cerulean水平,该水平标准化为转染对照的表达(norm.u.)。
图10显示了细胞质配体浓度对基因表达的转导。(a)如图中所示,在单独表达反应调节因子NarL和NarL调节的mCerulean荧光蛋白报告物,或仅与融合至FKBP和FRB的NarX突变体的一种不同变体一起的的哺乳动物细胞中的信号水平。对于每对条形,左边的条形(白色)代表无A/C配体时的报告物表达,右边的条形(黑色)代表有配体(100nM)时的报告物表达。柱状图显示了Cerulean水平,该水平标准化为转染对照的表达(norm.u.)。(b)相同转染的代表性显微图像,其图像如图3b所示,包括转染对照通道(红色)。在所有图中,图像的顶行和底行分别显示mCherry转染报告物(红色假色)的表达,和在相同转染中使用或不使用配体的途径诱导的mCreulean蛋白输出(青色假色)。柱状图以独立的生物一式三份的平均值±SD显示了Cerulean水平,该水平标准化为转染对照的表达(norm.u.)。
图11显示GPCR活性对报告基因表达的重装(rewiring)。(a)在表达应答调节因子NarL和NarL调节的mCerulean荧光蛋白报告物,以及所示蛋白结构域及其融合物的不同组合的哺乳动物细胞中的信号水平。(b)表达TANGO测定的来自CMV或EF1α-V1启动子组分的哺乳动物细胞中的信号水平。对于图a和b中的每对条形,左边的条形(白色)表示无异丙喹喘宁的报告物表达,右边的柱(黑色)表示有异丙喹喘宁的报告物表达(2μM)。柱状图以独立的生物一式三份的平均值±SD显示了Cerulean水平,该水平标准化为转染对照的表达(norm.u.)。(c)相同的选择的转染的代表性显微图像,其图像如图4所示,这里也显示mCherry转染对照的表达。在所有图中,图像的顶行和底行分别显示mCherry转染报告物(红色假色)的表达,和在相同转染中使用或不使用配体的途径诱导的mCreulean蛋白输出(青色假色)。
本发明某些实施方案的详细描述
本发明提供了一种新的方法,使用来自细菌中存在的双组分系统的组分将蛋白质/蛋白质相互作用转导成哺乳动物细胞中的基因表达。本发明可用于开发新的筛选分析法,一般用于蛋白质-蛋白质相互作用,尤其是用于GPCR信号调节。与现有技术(例如,来自ThermoFischer的TANGO系统)相比,本文所述的系统的特征在于具有优异的动态范围,并且由于几乎无限的结构单元供应,其具有高通量多路复用(multiplexing)的巨大潜力。
本发明可以提供基于细胞的生物传感器和工程化治疗细胞中的合成信号转导模块的基础,其具有诸如低背景水平、高动态范围和可逆性等性质。由于该方法可以被多路复用,因此它将允许创建复杂的基于逻辑的回路,该回路可以向修饰的细胞提供新颖的能力。
特别地,本发明包括3个不同的特征:
-HK(组氨酸激酶)组分(分成两种不同的突变体)
-RR组分
-该基因构建体含有允许目的基因表达的嵌合启动子。
融合到2个相互作用蛋白的HK结构域被突变以增加动态范围。也可使用野生型结构域,但迄今为止这导致较低的动态范围。然而,当使用该系统检测同源二聚化时,野生型结构域的使用可以赋予一些优点。另外,在目的蛋白质同源二聚化的情况下,可以使用属于顺式家族的HK。该方法的优点是减少了遗传构建体的数量。然而,在所有情况下,本发明的重要特征是将目的蛋白与HK的一个尺寸减少的结构域融合,除非借助于融合组分的强制二聚化,否则所述结构域自身不二聚化,因此自身不转导转录活性。
本实验中使用的RR(应答调节蛋白)与VP48融合,作为在哺乳动物细胞中起作用的转录激活结构域。其它转录激活结构域可以与RR融合,例如p65(RelA)结构域或Rta。在本实施例中,发明人使用直接结合DNA的RR,但根据所需的读出,可以使用其它类型的RR。例如,一些RR可以结合RNA,而其它的是酶,催化供给次级信号转导链的化合物的产生,例如,环状di-GMP。
表达目的基因(GOI)的基因构建体包含2个元件。第一部分是嵌合启动子。本发明人使用与具有许多RR结合位点的上游序列连接的最小启动子。最小启动子和RE数量之间的距离可以被修饰以上调或下调GOI的表达。
实验中使用的GOI是荧光报告物Cerulean,但它可以用任何其它蛋白质或RNA编码基因代替。例如,GOI可以是自身可以调节内源基因的miRNA或向导RNA。
本发明与上述TANGO和CHACHA系统的不同之处在于,这些系统释放分别预先与GPCR或β-抑制蛋白融合的转录因子,并且该转录因子随时间而积累。相反,在本发明中,在蛋白质-蛋白质相互作用的一个动作之后,所有元件仍然是功能性的,因此它们表现出多重转换。由TANGO和本发明的系统调节的目的基因处于嵌合启动子的调节下。在ChaCha系统中,也可以使用适当设计的gRNA来调节内源基因。本发明与TANGO测定之间的另一个差异是在本发明中,除了嵌合GPCR融合和β-抑制蛋白融合之外,还需要额外的组分,即RR。
与GPCR和β-抑制蛋白融合的HK结构域大小仅为223aa。在TANGO中,融合蛋白的大小分别为240aa和341aa。对于ChaCha,除了需要gRNA表达之外,它们分别为240aa和1900aa。由于这种较小的尺寸,系统更容易构建,并且对细胞造成的负担更小。
本发明的系统包含两个信号放大步骤。本发明独特的第一步是由使RR的多个拷贝磷酸化的重构HK产生。也存在于TANGO和ChaChaCha系统中的第二水平扩增是RR的基因诱导的催化性质。与TANGO系统相比,本发明中的两种水平的扩增导致动态范围提高10倍。
本发明的系统随着时间的推移不会脱敏;在配体存在/不存在的几个循环之后,相同的蛋白质可以被再活化。相反,TANGO和ChaCha系统的元件仅可以使用一次,因此它们的系统活性依赖于蛋白质降解和蛋白质重新合成,这是固有的缓慢过程。这个特性使本发明的系统更快速地从接通状态切换到断开状态,反之亦然。
由于本发明与其他方法相比包含一个额外水平的扩增的事实,它可以检测少量的蛋白质和弱的蛋白质-蛋白质相互作用。该特征的优点是本发明的测定所需的组分的表达可以在细胞中从低到高调节。这样,系统组分的表达水平可以设定在能够实现合适的配体诱导型动态范围的水平。因此,本方法减少了由于在较早的方法中蛋白质过表达而可能发生的配体非依赖性信号传导。
具体地,本发明的测定显示比TANGO测定更高的动态范围。与TANGO相比,该参数将有利于本发明产生的结果的自动分析。
本发明的系统的另一个优点是,它可以通过同时使用不同的HK-RR对而被多路复用。由于天然双组分体系的数量非常大,因此其多路复用潜力非常大。每个嵌合对将是独立的,并诱导不同的输出。因此,在同一实验中,人们将能够一次测试化合物对多种蛋白-蛋白相互作用或多种GPCRs的作用。其它方法的多路复用更困难,因为充分表征的TEV蛋白酶的数量有限。
由于RR自发地去磷酸化的事实,本发明的系统还实现了可逆性。在蛋白对之间不存在相互作用的情况下,激酶不再有活性并且不磷酸化RR。未磷酸化的RR不能诱导GOI的表达。在TANGO和ChaCha的情况下,系统的可逆性是困难的,因为它需要GPCR和β-抑制蛋白之间相互作用后释放的转录激活因子的耗时的降解。
最后,本发明的测定是高度模块化的。如GPCR诱导分析的情况,同一对互补HK片段对可用于检测细胞质中的蛋白-蛋白相互作用和膜定位的蛋白-蛋白相互作用。其它分析需要大的调整以探测不同类型的蛋白质-蛋白质相互作用,且例如TANGO的测定对GPCR途径具有特异性且尚未用于探测一般蛋白质-蛋白质相互作用。
本发明可以具有多种应用。
1)其可用于开发新的筛选分析法以鉴别与GPCR相互作用的化合物。预期所得的测定具有比现有测定更好的特异性和更高的动态范围。它也将更容易多路复用。该测定的商业化可通过销售含有与HK融合的GPCR的稳定细胞系来实现,这与目前DiscoverX和ThermoFischer(PathHunter和TANGO)所做的相似。
2)它可以用于筛选调节蛋白质-蛋白质相互作用的化合物,并因此用于药物发现。与酵母2杂交体相反,筛选试验可在哺乳动物细胞中进行,这是一个更相关的系统。此外,对于本发明,相同的测定可用于定位于不同细胞区室(核、细胞质或膜)的蛋白质。
3)现有的基于细胞的治疗剂通常使用涉及膜的细胞质一侧的蛋白质-蛋白质相互作用的信号传导途径。这包括CAR-T细胞,其中抗原与细胞外抗体片段的结合募集蛋白质相互作用配偶体;然后,可以使用本发明人的方法重新排列这些相互作用以产生治疗效果。
实施例
已知HK的胞内胞质结构域能够二聚化和自磷酸化。
本发明基于部分胞质结构域是否具有降低的固有信号传导能力的问题。为此,发明人进行了HKs的逐步截短诱变以鉴定不能自身二聚化的结构域(图1b)。第一组截短突变体包含EnvZ和NarX的整个胞质结构域(分别为EnvZ180-450和NarX176-598),第二组以更深的截短为特征,N-末端位于组氨酸上游约20个氨基酸(aa)(分别为EnvZ223-450和NarX379-598)。本发明人发现,在HEK293细胞中与同源应答调节因子OmpR共表达的EnvZ截短突变体,能够组成型地发出信号,并以与野生型EnvZ相当的水平诱导OmpR调节的报告物mCerulean的表达(图1c)。这个结果与含有组氨酸的小EnvZ结构域(“结构域A”,aa 223-289)负责同二聚体化的事实一致。另一方面,在同源RR NarL和NarL诱导型报告物存在下,NarX的截短突变体显示出基础信号的尺寸依赖性降低,最短的突变体NarX379-598达到背景水平(图1d)。对该结果可能有许多解释,包括(1)蛋白质稳定性的降低;(2)截短突变体的激酶活性降低和/或磷酸酶活性增加,和(3)突变体不能自身二聚化。在这些解释中,仅最后一个将支持合成信号传导的最终建立。为了检查强制二聚化作用是否能恢复信号传导,本发明人试图将截短的NarX结构域融合到一对在哺乳动物细胞中形成强的异源二聚体的蛋白质上。原因是如果仅二聚化受损,则这些相同的突变体,以彼此强的亲和力连接到蛋白质,将二聚化并转导下游的信号。
SynZip1/SynZip2
本发明人使用了已知的相互作用对SynZip1和SynZip2,并将它们融合到短NarX结构域NarX379-598的N-和C-末端。观察到(图6)SynZip1和SynZip2融合体共表达到短NarX结构域的N-末端导致增加的报告物表达,尽管表达比全长NarX的信号低得多。另一方面,SynZip融合体共表达到NarX的C-末端不导致任何二聚化触发的增加的报告物表达。总之,结果暗示了通过与短细胞质NarX结构域的N-末端融合的强制二聚化作为信号传导机制的可能性,与全长HK中传感器结构域相对于细胞质结构域的位置一致。然而,定量性能差。与该研究平行,本发明人优化了驱动其构建体的启动子,以确保它们不响应外部刺激,并且表达水平是平衡的(图7)。
对于任何合成信号系统,重要的是避免对信号读出的非特异性改变。在本发明的系统中,所述组分由组成型启动子表达。然而,这些启动子实际上受高度表达的转录因子如Sp1控制,并且总是存在这些因子通过不相关的内源途径直接受外部刺激影响的风险。这将导致组成型表达的变化,以及信号读出的明显变化,这与研究的效果无关并且并不真实(artefactual)。为了消除这些混淆因素,本发明人检查了许多组成型启动子在各种刺激条件下的稳健性,并比较了在通常用于诱导细胞信号传导的不同化合物(肾上腺素和异丙喹喘宁(procaterol))存在下iRFP从CMV和EF1α启动子的表达。在没有任何化合物的培养基中,两个启动子的活性是相似的。然而,在肾上腺素和异丙喹喘宁存在下,CMV启动子的活性被诱导两倍,而EF1α启动子的活性不受影响(图7a)。
定量从CMV、EF1α和EF1α-V1启动子表达的NarX/NarL系统的活性,以确定截短的HK胞质结构域的过高表达是否会增加背景水平并响应非特异性相互作用。EF1α-V1启动子比EF1α弱约5倍。结果证明,用从任何测试启动子表达的NarX获得了报告基因的相当的表达(图7b,比较泳道2和3以及泳道5和6)。然而,当NarL从较弱启动子表达时,观察到报告基因表达的降低(补充的图2b)。根据这些结果,发明人使用EF1α-V1驱动NarX衍生的构建体和EF1α驱动NarL表达。
本发明人进一步探索了优化该效果的可能性。已知HKs在自磷酸化机制方面可分为两个家族。在“顺式”家族中,磷酰基从与相同单体的CA结构域结合的ATP分子转移至组氨酸。在“反式”家族中,磷酰基从结合到一个单体的ATP转移到另一个单体中的可磷酸化的组氨酸(图2a)。对于所有HKs,磷酰基转移可通过突变ATP结合位点或组氨酸来终止。在“顺式”家族HK的情况下,ATP结合位点突变体和组氨酸突变体之间形成的异二聚体不能信号传导,但在“反式”家族HK的情况下,它实际上仍然能够通过单向磷酸转移从组氨酸突变单体向ATP结合位点突变单体发出信号(图2b)。因此,突变体彼此互补为“反式”-家族HKs。
本发明人假设互补突变体之间的二聚化可导致更有效的转导,这是由于突变体HK朝向其同源应答调节因子的磷酸酶活性降低。使用蛋白质比对,本发明人鉴定了NarX的CA结构域中对于ATP结合重要的推定残基。
对EnvZ CA结构域中存在的氨基酸进行突变分析,可以鉴定347位的天冬酰胺是EnvZ激酶活性的原始来源。组氨酸激酶的CA结构域属于HSP90伴侣/DNA拓扑异构酶II/组氨酸激酶蛋白的ATP酶结构域的大家族(超级家族55874,http://supfam.org/SUPERFAMILY/cgi-bin/scop.cgi?sunid=55874)。为了鉴定EnvZ的N347在NarX中是否保守,发明人将EnvZ和NarX与含有ATP酶结构域的蛋白质进行了比对。比对鉴定NarX的Asn509为保守残基,其对于ATP结合可能是重要的。
因为全长HKs在哺乳动物细胞中显示组成型地发出信号,发明人通过将密码子优化的NarX突变体的不同组合与同源下游RR NarL和由NarL-应答启动子驱动的报告基因共转染,在HEK293细胞中建立了互补试验。在该分析中(图2c),显示(i)全长野生型NarX能够如前所示发出信号;(ii)如预期的那样,对于ATP结合重要的CA结构域中的天冬氨酸或DHp结构域中的组氨酸的突变体,不能独立地发出信号;(iii)NarX互补突变体的共表达将信号部分恢复至野生型NarX所获得的信号水平。
接着,在NarX的短胞质结构域中引入相同的突变(图2d),并将所得突变体在N-末端融合到SynZip1和SynZip2肽,如之前用野生型结构域进行的那样,分别产生,构建体SynZip1::NarX379-598H399Q(从现在起为了简洁标记为SynZip1::Hmut)和SynZip2::NarX379 -598N509A(标记为SynZip2::Nmut)(图2e)。发明人还反转融合对,产生SynZip2::NarX379- 598H399Q(SynZip2:Hmut)和SynZip1::NarX379-598N509A(SynZip1::Nmut)。发现当这些构建体对在HEK293细胞中与NarL RR在NarL-应答性报告物存在下共表达时,通过NarL的信号完全恢复到用全长野生型NarX获得的水平,并产生比野生型短NarX融合体强得多的信号(图8)。对于这两对,恢复是相同的(图2f,条11和12)。当融合的SynZip结构域中的一个或两个缺失时,信号传导停止(图2f,条4-8,图9),表明融合结构域的二聚化是必需的并且足以恢复信号传导。有趣的是,均融合至SynZip1(SynZip1::Hmut和SynZip1::Nmut)的互补NarX突变体对也导致信号传导活性升高(图2f,条9),与在类似条件下用野生型结构域观察到的(较弱的)作用一致(图6,条4)。这导致了一个假设,即SynZip1结构域能够同源二聚,尽管与SynZip1-SynZip2相互作用相比具有降低的亲和力。实际上,原始文献的研究表明SynZip1在尺寸排阻色谱实验中以单体和二聚体存在,并且其比单独的SynZip2在此方面中有更大的程度。为了评价信号强度的剂量-应答行为,发明人表征了不同质粒剂量的NarX衍生的构建体的输出水平(图2g)。活性与质粒剂量成比例地增加,全长野生型NarX显示最高剂量敏感性,可能反映最强的二聚化常数,SynZip1-SynZip2对显示轻微降低但可比较的二聚化行为,以及SynZip1清楚地显示较差的二聚化。例如,与最初使用的条件(6.25ng而不是100ng)相比,质粒量减少约16倍,将SynZip1-SynZip1信号传导减少至背景水平,同时仍导致强SynZip1-SynZip2二聚化,与预期一致。
总之,这些实验表明NarX启动的信号转导可在互补的截短突变结构域的强制二聚化后恢复,并且这种恢复是剂量和相互作用强度依赖性的。与目前关于在大肠杆菌中具有大约1:30的HK:RR比率的两个组分信号化学计量的知识一致,与NarL相比,NarX表达约10%完全激活报告物的输出。这是因为驱动NarL的启动子EF1α-V1(见方法)比驱动NarL的野生型EF1α启动子弱约5倍,另外,1:2的质粒剂量比(即50ng NarX衍生质粒vs.100ng RR编码质粒)已使反应饱和。
FK506/FKBP
为了能够进行真正的信号传导,NarX结构域的二聚化应优选通过外部刺激物控制。可诱导的蛋白-蛋白相互作用是细胞质和跨膜中的常见的信号传导机制。在小分子A/C异二聚体(雷帕霉素类似物C16-(S)-7-甲基吲哚雷帕霉素,也称为AP21967)的存在下,在蛋白FK506-结合蛋白12(FKBP)和FKBP12-雷帕霉素结合结构域(FRB)突变体FRBT2098L之间发生充分表征的配体诱导的异二聚体化。
为了找出NarX结构域是否能够转导这种相互作用(图3a),将上述互补的组氨酸和天冬酰胺NarX突变体分别在其N-末端与FKBP(FK)和FRBT2098L(FR)蛋白融合,产生融合体FK::NarX379-598H399Q(FK::Hmut)和FR::NarX379-598N509A(FR::Nmut),和反向对FR::Hmut和FK::Nmut。首先,证实A/C不影响野生型NarX/NarL系统,在不存在或存在100nM A/C的情况下用NarX或NarX379-598转染HEK细胞(图3b,条2和3)。接下来,本发明人以类似于SynZip1-SynZip2实验所用的方式探测配体诱导的信号,在应答调节因子NarL和NarL-激活的报告构建体存在的情况下,在HEK293细胞中表达不同的融合变体和对照构建体,这次使用和不使用配体(图3b,图8)。如所预期的,全长野生型NarX是组成型活性的。在除了野生型NarX的所有情况下,在缺乏配体时没有信号。只有当(i)NarX衍生的结构域含有互补的组氨酸和天冬酰胺突变和(ii)它们分别与FKBP和FRB相互作用配偶体融合时,高水平的配体才能诱导强信号(图3b,条11和12)。然后,本发明人继续使用FR::Hmut和FK::Nmut对来表征该工程化的信号转导途径的剂量-响应行为(图3c)。剂量-响应显示预期的Hill函数依赖性,与公开的值10nM和36nM相比,由此测定的EC50在试验背景下为1.3nM。
上述结果说明了基于TCS的组分介导细胞质中信号转导的能力。然而,大量信号传导发生在整个膜上。许多跨膜信号传导途径涉及脂双层胞质表面的蛋白-蛋白相互作用,包括一类重要的由G蛋白偶联受体(GPCR)启动的信号传导途径,G蛋白偶联受体是几百个蛋白的家族。GPCR信号转导的关键步骤是GPCR本身与蛋白β-抑制蛋白之间形成复合物,随后是包括GPCR内化、再循环和信号传导在内的各种过程。先前已表明,这种相互作用足以通过融合转录激活因子的特异性蛋白水解切割来重新连接GPCR信号。发明人假设这种相互作用也能通过双组分途径进行催化跨膜信号传导。为此,本发明人将NarX的截短组氨酸突变体,NarX379-598H399Q,融合至GPCR ADRB2-AVPR2:异丙喹喘宁激活的肾上腺素受体β2(ADRB2)嵌合体和精氨酸加压素受体2的细胞质片段(AVPR2)。发明人还将NarX的截短天冬酰胺突变体,NarX379-598N509A,融合到β-抑制蛋白2(图4a)。最后,发明人反向实施这些融合以检查效果是否对称。
首先,证实了异丙喹喘宁不影响通过NarX/NarL系统的信号传导。在不存在或存在100nM异丙喹喘宁的情况下,用NarL和NarL-活化的报告物与NarX或NarX379-598共转染的HEK293细胞,分别显示了独立于异丙喹喘宁的完全诱导的和背景的报告基因表达(图4b,条2和3)。在将分别与GPCR受体、β-抑制蛋白或二者融合的互补NarX突变体组合的实验中(图4b、图11a),发现存在一定量的β-抑制蛋白和单独GPCR受体的不依赖于异丙喹喘宁的信号传导(图4b,条9和10)。GPCR的效果更明显,表明受体以配体非依赖性方式二聚化。重要的是,当互补NarX突变体分别融合到GPCR受体和β-抑制蛋白时,发生非常强的异丙喹喘宁触发的信号传导,诱导动态范围高于3个数量级(图4b,条11和12)。用基于双组分的系统获得的动态范围高于TANGO测定(基于蛋白水解的GPCR活化测定)中获得的动态范围(图11b)。
为了确定合成的信号级联是否能够重演不同的已知GPCR配体的作用,发明人表征了包含,ADRB2-AVPR2::Hmut和β-抑制蛋白::Nmut对,在两种激动剂(异丙喹喘宁、异丙肾上腺素)和一种部分激动剂(克仑特罗)的存在下进行的系统的剂量响应。观察到两种完全激动剂,异丙喹喘宁(图4C,蓝线)和异丙肾上腺素(图4C,红线),以剂量依赖性方式诱导强的下游基因表达,并在饱和剂量下达到相同的最大响应。在部分激动剂克伦特罗(Clenbuterol)存在下,报告基因的表达比完全激动剂存在下的低3.5倍(图4C,将绿色线条与蓝色和红色线条比较)。此外,单细胞流式细胞术数据表明单峰的而不是双峰的诱导(图4d,TCS数据)。从剂量-响应曲线测定异丙喹喘宁、异丙肾上腺素和克仑特罗的EC50值分别为5nM、30nM和14nM。这些值与文献中描述的值和通过TANGO测定确定的值相似(图4c,虚线,第二轴)。注意,尽管TANGO测定导致更高的绝对报告物表达,但是与基于TCS的机制相比,渗漏(leakage)高得多,并且单细胞数据是双峰的(图4d,TANGO数据)。发明人还表征了在异丙喹喘宁存在下拮抗剂普萘洛尔的作用,并发现在本发明的信号级联中,拮抗剂以剂量依赖性方式抑制异丙喹喘宁的作用(图4E,蓝线)。发明人测定了在本试验中拮抗剂的IC50为2nM,这与使用TANGO测定获得的值相似(图4e,虚线)。这些结果证明本发明的系统可如实地转导激动剂和拮抗剂对GPCR活性的多种已知效应,且其可用于提取关于相互作用参数的定量数据。
概述
在细胞,特别是哺乳动物细胞中实施非天然信号传导模式,对于合理控制细胞行为,和最终为基础研究、生物技术和医学工程化新的细胞功能是高度期望的。双组分信号传导与脊椎动物信号传导在进化上极为不同,并且就发明人所知,在脊椎动物细胞中没有描述组氨酸至天冬氨酸磷酰基转移的单一实例。原核生物中TCS信号转导的天然机制依赖于膜中HK二聚体的配体诱导的构象变化,但在哺乳动物细胞中直接实施该机制是难以捉摸的。相反,发明人寻求一种不同的策略,通过在HK胞质结构域的解离和结合状态之间切换来控制信号传导,从而获得基本上相同的最终结果。在发明人所显示的情况下,通过配体诱导的蛋白质二聚作用转换被完成,所述蛋白质分别与HKNarX的截短的胞质结构域的组氨酸和天冬酰胺突变体融合。当使用野生型截短结构域代替突变体时,观察到类似的定性效应。然而,定量行为较差,更重要的是,所得效果不能区分配体诱导的两种相互作用配偶体的二聚化,和其中一种配偶体的同源二聚化,如SynZip1和GPCR的情况。动态范围降低的一个原因可能是,与组氨酸突变体相比,野生型结构域的磷酸酶活性更强。
该方法保留了原始原核生物信号转导的许多特征。它是一种扩增的、多个周转过程,其中单一NarX二聚体能够磷酸化应答调节因子NarL的多个拷贝,其进而可诱导多个转录起始事件。发明人推测,与基于蛋白水解切割的方法相比,两步扩增导致动态范围大大提高。此外,在刺激撤除后,由于RR的自发脱磷酸化,信号传导将停止;如果需要快速信号转导沉默(quiescence),通过精明地使用保留其全部磷酸酶活性的野生型HK结构域,可以促进这一点。考虑到TCS途径的丰富多样性,通过使用上述方法,合成信号途径的多路复用是可行的。总之,结果指向用于在哺乳动物细胞中,在细胞质中和跨膜中的感应和信号转导的新的模态。
方法
使用技术人员可用的标准分子克隆技术。
质粒构建。
使用标准克隆技术构建质粒。本工作中使用的所有限制酶均购自New EnglandBiolabs(NEB)。Q5高保真DNA聚合酶(NEB)用于片段扩增。通过Sigma-Aldrich合成单链寡核苷酸。使用GenElute Gel Extraction Kit或Gen Elute PCR Clean Up Kit(Sigma-Aldrich)纯化消化产物或PCR片段。连接使用T4 DNA连接酶(NEB)通过温度循环连接进行,所述循环为10℃30s和30℃30s之间的140个循环,Gibson组装如下所述进行。将5μl连接产物或Gibson组装产物转化到化学感受态大肠杆菌DH5α(E.Coli DH5α)或大肠杆菌TOP10(E.coli TOP10)中,将其铺板在含有100μg/ml氨苄青霉素的LB琼脂上。将得到的克隆通过菌落PCR(Dream Taq Green PCR Master Mix,Thermo Scientific)直接筛选。发明人在补充有氨苄青霉素的LB Broth Miller Difco(BD)中扩增了单个克隆,并使用GenElutePlasmid Miniprep Kit(Sigma-Aldrich)纯化了它们的质粒DNA。所有得到的质粒都用Sanger测序法通过Microsynth进行序列验证。使用Promega PureYieldTMPlasmid MidiprepSystem(A2495)从100ml液体培养物中获得用于哺乳动物转染的DNA。回收的DNA用NorgenEndotoxin Removal Kit Mini(Cat.#27700)或Midi(Cat.#52200)进一步纯化。本工作中使用的每种构建体的短克隆方法如下所述。
Gibson组装方法
通过在1X Gibson组装缓冲液(0.1M Tris-HCl,pH 7.5,0.01M MgCl2,0.2mMdGTP,0.2mM dATP,0.2mM dTTP,0.2mM dCTP,0.01M DTT,5%(w/v)PEG-8000,1mM NAD)中混合载体(0.018pmol)和插入物(0.09pmol),在10μl终体积中进行Gibson组装,0.04单位的T5外切核酸酶(NEB),0.25单位的Phusion DNA聚合酶(NEB)和40单位的Taq DNA连接酶(NEB)。Gibson组装体的阴性对照仅包括载体。Gibson组装在50℃下进行1小时。
重组DNA克隆方法
OmpR_RE-Cerulean(pMZ1):用NotI和SmaI消化来自EF1α-cerulean(pKH24)的mCerulean编码序列,并克隆到用AfeI和PspOMI消化的质粒OmpR_RE-amCyan(pJH008)中。
CMV-envZ N347A(pMZ37):用PR3687/PR3708和PR3707/PR3709从质粒CMV-envZ(pJH001)PCR扩增envZ的5'和3'片段。引物被设计成引入突变,该突变将编码347位天冬酰胺(N)的密码子替换为编码丙氨酸(A)的密码子。PCR产物和用XhoI和PvuII消化的质粒CMV-envZ(pJH00114)都使用Gibson mix组装。
CMV-EnvZ223-450(pMZ123):用PR4345/PR4346从质粒CMV-envZ(pJH1)PCR扩增envZ的3'片段。引物被设计成从243位编码磷酸化组氨酸的密码子上游的第20位密码子开始扩增到基因末端,并在该扩增序列前面插入ATG序列。PCR产物和用XhoI和AgeI消化的质粒CMV-envZ(pJH001)使用Gibson Mix组装。
CMV-NarX N509A(pMZ160):用PR4122/PR4541和PR4346/PR4542从质粒CMV-narX(pJH002)PCR扩增narX的5'和3'片段。设计引物以引入突变,该突变将编码509位天冬酰胺(N)的密码子替换为编码丙氨酸(A)的密码子。PCR产物和用XhoI和AgeI消化的质粒CMV-envZ(pJH001)都使用Gibson mix组装。
CMV-narX379-598(pMZ163):用PR4345/PR4546从质粒CMV-narX(pJH00214)PCR扩增narX的3'片段。引物被设计成从第399位编码磷酸化组氨酸的密码子上游的第20位密码子开始扩增到基因末端,并在该扩增序列的前面插入ATG序列。PCR产物和用XhoI和AgeI消化的质粒CMV-envZ(pJH001)使用Gibson Mix组装。
EF1α-V1-envZ-mCherry(pMZ194):EF1α-V1,作为EF1α的缩短形式,用PR4733/PR4734从质粒pRA114(Altamura等,手稿正在准备中)PCR扩增。启动子和用PspOMI和AgeI消化的质粒EnvZ-GGGGS-mCherry(pEM01714)使用Gibson Mix组装。
CMV-SynZip1::narX379-598(pMZ200):发明人通过IDT从头合成编码SynZip1和G4S接头的gBlock序列(gBlock264)。用PR4346/PR4747从质粒CMV-narX176-598(JH01014)PCR扩增NarX379-598的编码序列。使用Gibson Mix组装gBlock、PCR产物和用AgeI和XhoI消化的质粒CMV-envZ(pJH001)。
CMV-narX379-598::SynZip1(pMZ202):发明人通过IDT从头合成编码G4S接头的gBlock序列和SynZip1(gBlock265)。用PR4122/PR4747从质粒CMV-narX379-598(pMZ163)PCR扩增NarX379-598的编码序列。使用Gibson Mix组装gBlock、PCR产物和用AgeI和XhoI消化的质粒CMV-envZ(pJH001)。
CMV-SynZip2::narX379-598(pMZ206):发明人通过IDT从头合成编码SynZip2和G4S接头的gBlock序列(gBlock269)。用PR4346/PR4747从质粒CMV-narX176-598(JH010)PCR扩增NarX379-598的编码序列。使用Gibson Mix组装gBlock、PCR产物和用AgeI和XhoI消化的质粒CMV-envZ(pJH001)。
CMV-narX379-598::SynZip1(pMZ208):发明人通过IDT从头合成编码G4S接头的gBlock序列和SynZip1(gBlock270)。用PR4122/PR4748从质粒CMV-narX379-598(pMZ163)PCR扩增NarX379-598的编码序列。使用Gibson Mix组装gBlock、PCR产物和用AgeI和XhoI消化的质粒CMV-envZ(pJH001)。
CMV-FRB T2098L::CBRC(pMZ211):用PR4122/PR4541和PR4346/PR4542从质粒FRB::CBRC27 PCR扩增具有CBRC的FRB的5'和3'片段。设计引物以引入突变,该突变将编码Both098th位置处苏氨酸(T)的密码子(相对于全长蛋白丝氨酸/苏氨酸-蛋白激酶TOR1)替换为编码亮氨酸(L)的密码子。PCR产物和BamHI和AgeI消化的质粒FRB::CBRC用Gibson Mix组装。
CMV-FKBP::narX379-598(pMZ214):用PR4766/PR4767从质粒CBRN::FKBP27 PCR扩增编码FKBP的序列。用PR4346/PR4771从质粒CMV-narX176-598(pJH010)PCR扩增NarX379-598的编码序列。引物被设计成在扩增片段之间插入(G4S)2接头。PCR产物和用AgeI和XhoI消化的质粒CMV-envZ(pJH001)都使用Gibson mix组装。
CMV-FRB T2098L::narX379-598(pMZ215):用PR4769/PR4770从质粒CMV-FRB::CBRC(pMZ211)PCR扩增编码FRB T2098L的序列。用PR4346/PR4771从质粒CMV-narX176-598(pJH010)PCR扩增NarX379-598的编码序列。引物被设计成在扩增片段之间插入(G4S)2接头。PCR产物和用AgeI和XhoI消化的质粒CMV-envZ(pJH001)都使用Gibson mix组装。
NarL_RE-cerulean(pMZ219):通过退火引物PR4892和PR4893形成最小效应元件NarL_RE。退火产物和用AscI和NdeI消化的质粒OmpR_RE-Cerulean(pMZ1)都使用Gibsonmix组装。
EF1α-V1-SynZip1::narX379-598(pMZ221):用PR3687/PR4971从质粒CMV-SynZip1::NarX379-598(pMZ200)PCR扩增编码SynZip1、G4S接头和NarX379-383的序列。PCR产物和用AgeI和XhoI消化的质粒EF1α-V1-envZ-mCherry(pMZ194)使用Gibson Mix组装。
EF1α-V1-SynZip2::narX379-598(pMZ222):用PR3687/PR4971从质粒CMV-SynZip2::narX379-598(pMZ206)PCR扩增编码SynZip2、G4S接头和NarX379-383的序列。PCR产物和用AgeI和XhoI消化的质粒EF1α-V1-envZ-mCherry(pMZ194)使用Gibson Mix组装。
EF1α-V1-SynZip1::narX379-598 H399Q(pMZ223):用PR4971/PR4973从质粒CMV-SynZip1::narX379-598(pMZ200)PCR扩增编码SynZip1和G4S接头的序列。用PR3687/PR4972从质粒CMV-narX H399Q(pEM014)PCR扩增编码NarX379-598H399Q的序列。PCR产物和用AgeI和XhoI消化的质粒EF1α-V1-envZ-mCherry(pMZ194)使用Gibson Mix组装。
EF1α-V1-SynZip2::narX379-598 H399Q(pMZ224):用PR4971/PR4973从质粒CMV-SynZip2::narX379-598(pMZ206)PCR扩增编码SynZip2和G4S接头的序列。用PR3687/PR4972从质粒CMV-narX H399Q(pEM014)PCR扩增编码NarX379-598H399Q的序列。PCR产物和用AgeI和XhoI消化的质粒EF1α-V1-envZ-mCherry(pMZ194)使用Gibson Mix组装。
EF1α-V1-SynZip1::narX379-598 N509A(pMZ225):用PR4971/PR4973从质粒CMV-SynZip1::narX379-598(pMZ200)PCR扩增编码SynZip1的序列。用PR3687/PR4972从质粒CMV-narX N509A(pMZ160)PCR扩增编码NarX379-598N509A的序列。PCR产物和用AgeI和XhoI消化的质粒EF1α-V1-envZ-mCherry(pMZ194)使用Gibson Mix组装。
EF1α-V1-SynZip2::narX379-598 N509A(pMZ226):用PR4971/PR4973从质粒CMV-SynZip2::narX379-598(pMZ206)PCR扩增SynZip2的编码序列。用PR3687/PR4972从CMV-narXN509A(pMZ160)PCR扩增编码NarX379-598N509A的序列。PCR产物和用AgeI和XhoI消化的质粒EF1α-V1-envZ-mCherry(pMZ194)使用Gibson Mix组装。
EF1α-V1-FKBP::narX379-598 H399Q(pMZ229):用PR4974/PR4973从质粒CMV-FKBP::NarX379-598(pMZ214)PCR扩增编码FKBP和(G4S)2接头的序列。用PR3687/PR4972从质粒CMV-narX H399Q(pEM014)PCR扩增编码NarX379-598H399Q的序列。PCR产物和用AgeI和XhoI消化的质粒EF1α-V1-envZ-mCherry(pMZ194)使用Gibson Mix组装。
EF1α-V1-FRB T2098L::narX379-598 H399Q(pMZ230):用PR4975/PR4973从质粒CMV-FRB T2098L::narX379-598(pMZ215)PCR扩增编码FRB T2098L和(G4S)2接头的序列。用PR3687/PR4972从质粒CMV-narX H399Q(pEM014)PCR扩增编码NarX379-598H399Q的序列。PCR产物和用AgeI和XhoI消化的质粒EF1α-V1-envZ-mCherry(pMZ194)使用Gibson Mix组装。
EF1α-V1-FKBP::narX379-598 N509A(pMZ231):用PR4974/PR4973从质粒CMV-FKBP::narX379-598(pMZ214)PCR扩增编码FKBP和(G4S)2接头的序列。用PR3687/PR4972从质粒CMV-narX N509A(pMZ160)PCR扩增编码NarX379-598N509A的序列。PCR产物和用AgeI和XhoI消化的质粒EF1α-V1-envZ-mCherry(pMZ194)使用Gibson Mix组装。
EF1α-V1-FRB T2098L::narX379-598 N509A(pMZ232):用PR4975/PR4973从质粒CMV-FRB T2098L::narX379-598(pMZ215)PCR扩增编码FRB T2098L和(G4S)2接头的序列。用PR3687/PR4972从质粒CMV-narX N509A(pMZ160)PCR扩增编码NarX379-598N509A的序列。PCR产物和用AgeI和XhoI消化的质粒EF1α-V1-envZ-mCherry(pMZ194)使用Gibson Mix组装。
EF1α-V1-narX(pMZ239):用PR3687/PR4979从质粒CMV-narX(pJH00214)PCR扩增编码NarX的序列。PCR产物和用AgeI和XhoI消化的质粒EF1α-V1-envZ-mCherry(pMZ194)使用Gibson Mix组装。
EF1α-V1-narX379-598(pMZ241):用PR4977/PR3687从质粒CMV-narX(pJH002)PCR扩增narX的3'片段。引物被设计成扩增从第399位编码可磷酸化组氨酸的密码子上游的第20位密码子直到基因末端的序列,并在该扩增序列的前面插入ATG序列。PCR产物和用AgeI和XhoI消化的质粒EF1α-V1-envZ-mCherry(pMZ194)使用Gibson Mix组装。
EF1α-V1-narX H399Q(pMZ242):用PR3687/PR4979从质粒CMV-narX H399Q(pEM01414)PCR扩增NarX的编码序列。PCR产物和用AgeI和XhoI消化的质粒EF1α-V1-envZ-mCherry(pMZ194)使用Gibson Mix组装。
EF1α-V1-narX379-598 H399Q(pMZ244):用PR4977/PR3687从质粒CMV-narX H399Q(pEM014)PCR扩增narX的3'片段。引物被设计成扩增从第399位编码可磷酸化组氨酸的密码子上游的第20位密码子直到基因末端的序列,并在该扩增序列的前面插入ATG序列。PCR产物和用AgeI和XhoI消化的质粒EF1α-V1-envZ-mCherry(pMZ194)使用Gibson Mix组装。
EF1α-V1-narX N509A(pMZ245):用PR3687/PR4979从质粒CMV-narX N509A(pMZ160)PCR扩增编码NarX的序列。PCR产物和用AgeI和XhoI消化的质粒EF1α-V1-envZ-mCherry(pMZ194)使用Gibson Mix组装。
EF1α-V1-narX379-598 N509A(pMZ247):用PR4977/PR3687从质粒CMV-narX N509A(pMZ160)PCR扩增narX的3'片段。引物被设计成扩增从第399位编码可磷酸化组氨酸的密码子上游的第20位密码子直到基因末端的序列,并在该扩增序列的前面插入ATG序列。PCR产物和用AgeI和XhoI消化的质粒EF1α-V1-envZ-mCherry(pMZ194)使用Gibson Mix组装。
EF1α-narL(pMZ248):EF1α启动子用PR4732/PR4978从质粒pRA58(Altamura等,手稿准备中)PCR扩增。PCR产物和用PspOMI和AgeI消化的质粒CMV-narL(pJH004)使用GibsonMix组装。
EF1α-V1-narL(pMZ249):EF1α-V1启动子用PR4734/PR4978从质粒pRA114(Altamura等,手稿准备中)进行PCR扩增。PCR产物和用PspOMI和AgeI消化的质粒CMV-narL(pJH004)使用Gibson Mix组装。
EF1α-V1-ARRB2::narX379-598(pMZ250):用PR4980/PR4981从质粒CMV-ARRB2::TEV蛋白酶(pBH302)PCR扩增编码ARRB2的序列。用PR3687/PR4982从质粒CMV-narX(pJH2)PCR扩增编码NarX379-598的序列。设计引物以在扩增片段之间插入G4S接头。PCR产物和用AgeI和XhoI消化的质粒EF1α-V1-envZ-mCherry(pMZ194)使用Gibson Mix组装。
EF1α-V1-ARRB2::narX379-598 H399Q(pMZ251):用PR4980/PR4981从质粒CMV-ARRB2::TEV蛋白酶(pBH302)PCR扩增编码ARRB2的序列。用PR3687/PR4982从质粒CMV-narXH399Q(pEM014)PCR扩增编码NarX379-598H399Q的序列。设计引物以在扩增片段之间插入G4S接头。PCR产物和用AgeI和XhoI消化的质粒EF1α-V1-envZ-mCherry(pMZ194)使用GibsonMix组装。
EF1α-V1-ARRB2::narX379-598 N509A(pMZ252):用PR4980/PR4981从质粒CMV-ARRB2::TEV蛋白酶(pBH302)PCR扩增编码ARRB2的序列。用PR3687/PR4972从质粒CMV-narXN509A(pMZ160)PCR扩增编码NarX379-598N509A的序列。设计引物以在扩增片段之间插入G4S接头。PCR产物和用AgeI和XhoI消化的质粒EF1α-V1-envZ-mCherry(pMZ194)使用GibsonMix组装。
EF1α-V1-ADRB21-341::AVPR2343-371::narX379-598 H399Q(pMZ257):用PR4983/PR4985从质粒CMV-ADRB21-341::AVPR2343-371::tTA(pBH312)PCR扩增编码ADRB21-341::AVPR2343-371的序列。用PR3687/PR4982从质粒CMV-narX H399Q(pEM014)PCR扩增编码NarX379-598H399Q的序列。设计引物以在扩增片段之间插入G4S接头。PCR产物和用AgeI和XhoI消化的质粒EF1α-V1-envZ-mCherry(pMZ194)使用Gibson Mix组装。
EF1α-V1-ADRB21-341::AVPR2343-371::narX379-598 N509A(pMZ258):用PR4983/PR4985从质粒CMV-ADRB21-341::AVPR2343-371::tTA(pBH312)PCR扩增编码ADRB21-341::AVPR2343-371的序列。用PR3687/PR4972从质粒CMV-narX N509A(pMZ160)PCR扩增编码NarX379-598N509A的序列。设计引物以在扩增片段之间插入G4S接头。PCR产物和用AgeI和XhoI消化的质粒EF1α-V1-envZ-mCherry(pMZ194)使用Gibson Mix组装。
tTA_RE-cerulean(pMZ290):用PR5226/PR5227从质粒tTA_RE-mCherry(pIM00312)PCR扩增tTA调节的启动子。PCR产物和用AscI和AgeI消化的质粒DcuR_E-Cerulean(pMZ259)使用Gibson Mix组装。
EF1α-V1-ARRB2::TEV蛋白酶(pMZ291):用PR5228/PR5229从质粒CMV-ARRB2::TEV蛋白酶(pBH302)PCR扩增编码ARRB2283-409的序列。用PR5230/PR5231从质粒EF1α-V1-ARRB2::narX379-598(pMZ250)PCR扩增bGH poly(A)信号的序列。PCR产物和用BsaI和AvrII消化的质粒EF1α-V1-ARRB2::narX379-598(pMZ250)使用Gibson Mix组装。
EF1α::iRFP(pCS184):用PR2258/PR2259 PCR扩增来自CMV-iRFP(pCS12)的iRFP编码序列。PCR产物和用BmtI和XbaI消化的质粒EF1α::Citrine(pRA001,Altamura等,手稿准备中)使用连接混合物(ligation mix)组装。
EF1α-V1-ADRB21-341::AVPR2343-371::tTA(pBH292):用PR5232/PR5233从质粒CMV-ADRB21-341::AVPR2343-371::tTA(pBH312)PCR扩增编码ADRB2254-341 AVPR2343-371和tTA的序列的序列。PCR产物和用BsaI和XhoI消化的质粒EF1α-V1-ADRB21-341::AVPR2343-371::narX379-598H399Q(pMZ257)使用Gibson Mix组装。
CMV-ARRB2::TEV蛋白酶(pBH302):发明人通过IDT从头合成了编码与TEV蛋白酶融合的具有2gBlock(gBlock112和gBlock 113)的β-抑制蛋白-2的gBlock序列。gBlock和用NotI和EcoRI消化的质粒pZsYellow1-N1(Clontech 632445)用Gibson Mix组装。
CMV-OPRK11-345::AVPR2343-371::tTA(pBH309):发明人通过IDT从头合成了与tTA融合的编码KOR-1的gBlock(gBlock114)序列和编码V2R的gBlock(gBlock115)。用PR2442/PR2443 PCR扩增来自gBlock114的编码KOR-1 1-345的序列。PCR产物,gBlock115和用XhoI和MfeI消化的质粒pZsYellow1-N1(Clontech 632445)用Gibson Mix组装。
CMV-ADRB21-341::AVPR2343-371::tTA(pBH312):发明人通过IDT从头合成了编码β-2肾上腺素能受体的gBlock(gBlock118)序列。用PR2442/PR2444 PCR扩增来自gBlock118的编码ADRB21-341的序列。PCR产物和用XhoI和BssHII消化的质粒CMV-OPRK11-345::AVPR2343 -371::tTA(pBH309)用Gibson Mix组装。
CMV-narX176-598(pJH010):用PR1021/PR1023 PCR扩增来自CMV-narX(pJH002)的narX的3'片段。设计引物以从176位的丙氨酸编码密码子到基因末端扩增NarX序列,并在该扩增序列的前面插入ATG序列。PCR产物和CMV-narX(pJH002)用XhoI和AgeI消化。然后将两个消化产物连接在一起。
先前报道了以下质粒:CMV-envZ(pJH001),CMV-narX(pJH002),CMV-ompR(pJH003),CMV-narL(pJH004),OmpR_RE-AmCyan(pJH008),CMV-envZ_cyt(pJH009),CMV-envZ H243V(pEM013),CMV-narX H399Q(pEM014)和EnvZ-GGGGS-mCherry(pEM017)(Hansen,J.et al.Proc Natl Acad Sci U S A 111,15705-15710(2014)).CBRN::FKBP和FRB::CBRC(Schramm,A.et al.Int J Mol Sci 19(2018)).Ef1α-mCerulean(pKH024),Ef1α-citrine(pKH025)Ef1α-mCherry(pKH026)and Junk-DNA(pBH265)(Prochazka,et al.,Nat Commun5,4729(2014)).pTRE Bidirectional mCherry-pA(pIM003)(Angelici,B.,et al.,CellRep 16,2525-2537(2016)).质粒CMV-iRFP(pCS12)是从Addgene获得的(plasmid 31857(Filonov,G.S.et al.Angewandte Chemie International Edition 51,1448-1451(2012))).
细胞培养
本工作中的实验在购自Life Technology的HEK293(Cat#11631-017)上进行。细胞在37℃下,在5%CO2下,在补充有10%FBS(Sigma-Aldrich;Cat#F9665)和1%青霉素/链白霉素溶液(Sigma-Aldrich,Cat#P4333)的DMEM(Gibco,Life Technologies;Cat#41966-052)中培养。每隔3-4天使用0.25%胰蛋白酶-EDTA进行分裂(Gibco,Life technologies;Cat#25200-072)。在用新鲜细胞储备物替换之前,培养物繁殖最多两个月。
转染
所有转染都使用Lipofectamine 2000转染试剂(Life Technologies;Cat#11668027)进行。所有转染在24孔板(Thermo Scientific Nunc;NC-142475)中进行,转染400ng DNA。在转染前24小时,将细胞以500μl DMEM中50000的密度/孔接种在。如补充表3-18所示混合每个样品的质粒,并用Opti-MEM I还原血清(Opti-MEM I Reduced Serum,Gibco,Life technologies Cat#31985-962)完成体积以使最终体积为50μl。将1.5μl的lipofectamine 2000稀释在50μl Opti-MEM I/样品中,使最终量为3.75:1μl试剂/μg DNA比率。在至少5分钟的温育后,将稀释的Lipofectamine加入到混合的DNA样品中。通过轻微涡旋将所得混合物简单混合,并在加入细胞之前在室温下孵育20分钟。在DNA加入细胞4小时后,除去培养基,并用500μl新鲜培养基替换。当需要时,将5μL测试的化学品加入到培养基中。如下所示制备100X的不同母液的所需终浓度:
A/C异二聚体(Clontech;Cat#635057)母液在乙醇(Honeywell;Cat#02860)中制备:250μM、50μM、20μM、8μM、3.2μM、1.28μM、512nM、205nM、81.9nM、32.8nM、13.1nM、5.24nM、1.04nM。
异丙喹喘宁(Sigma;Cat#P9180-10MG)母液在DMSO(Sigma;Cat#D4540,BCBT0803)中制备:1mM、286μM、81.6μM、23.3μM、10μM、6.6μM、1.9μM、544nM、155nM、44.4nM和12.7nM。
异丙肾上腺素(Sigma;Cat#I6504)母液在DMSO(Sigma;Cat#D4540)中制备:1mM、286μM、81.6μM、23.3μM、6.6μM、1.9μM、544nM、155nM、44.4nM和12.7nM。
克伦特罗(Sigma;Cat#C5423)母液在DMSO(Sigma;Cat#D4540)中制备:1mM、286μM、81.6μM、23.3μM、6.6μM、1.9μM、544nM、155nM、44.4nM和12.7nM。
普萘洛尔(Sigma;Cat#P0884)母液在水中制备(Invitrogen;Cat#10977-035):1mM、286μM、81.6μM、23.3μM、6.6μM、1.9μM、544nM、155nM、44.4nM和12.7nM。
显微镜检查
显微图像取自转染后48小时。发明人使用Nikon Eclipse Ti显微镜,其配备有机械化载物台和在图像获取期间保持在37℃的温度控制室。激发光由Nikon Intensight C-HGFI汞灯产生,并通过一组优化的Semrock滤光立方体过滤。用Hamamatsu,ORCA R2照相机,用10X物镜收集所得图像。每个Semrock立方体由激发滤光器、分色镜和发射滤光器组装而成。为了使不同荧光蛋白之间的串扰最小化,发明人使用了以下设置:Cerulean:CFP HC(HC438/24,BS 458,HC 483/32),mCherry:TxRed HC(HC 624/40、BS 593、HC 562/40)。对于Cerulean和mCherry,图像是用40ms的曝光获得的。通过ImageJ软件处理获得的图像,进行均匀的对比度增强以改善可视化。
流式细胞仪
转染48小时后,通过除去培养基并将细胞与200μl Stem ProTMAccutaseTM细胞解离试剂(Gibco,cat#A11105-01)在37℃下孵育5分钟,制备用于FACS分析的细胞。温育后,将板转移到冰上。为了避免潜在的细胞损伤,以连续批次制备样品,使得没有单个样品会在冰上保持超过1小时。使用BD LSR Fortessa II细胞分析仪,结合激发和发射来测量制备的样品,所述激发和发射使不同荧光报告物之间的串扰最小化。用445nm激光器和473/10nm发射滤波器测量Cerulean,用561nm激发激光器与600nm长通滤波器和610/20发射滤波器耦合测量mCherry。在所有实验中,在330和310的PMT电压下分别测量Cerulean和mCherry。使用SPHERO Rainbow校准颗粒(Spherotech;Cat#RCP-30-5A,BD)来确保恒定的器件性能。
数据分析
使用FlowJo软件进行一般流式细胞术的柱状图的数据分析。在本工作中,如下计算以归一化表达单位(Cerulean,norm.u.)表示的柱状图中的荧光值。基于活细胞的前向和侧向散射读出对活细胞进行门控。根据其前向散射面积和前向散射高度对该群体的单细胞进行门控。在该门中,基于阴性对照门控Cerulean阳性细胞,使得该对照样品中99.9%的细胞落在选择的门之外。对于每个Cerulean阳性细胞,计算荧光强度的平均值并乘以阳性细胞的频率。该值用作样品中总报告信号的量度,并可以定义为总强度(TI)。Cerulean的TI通过mCherry阳性细胞(组成型转染对照)的TI标准化。因此,相关公式为:以norm.u.示出的报告物强度[平均值(在报告物+细胞中的报告物)*频率(报告物+细胞)]/[平均值(在转染标志物+细胞中的转染标记)*频率(转染标志物+细胞)]。
序列
在以下给出的序列不同于本文以文本形式提交的序列方案的情况下,以下序列应为准。
表1引物序列
Figure BDA0003020352050000281
Figure BDA0003020352050000291
Figure BDA0003020352050000301
Figure BDA0003020352050000311
表2用于质粒构建体的合成DNA列表
Figure BDA0003020352050000312
Figure BDA0003020352050000321
Figure BDA0003020352050000331
Figure BDA0003020352050000341
下表列出了合成启动子的序列(带下划线的序列表示RR DNA结合位点,斜体字母表示TATA框。起始密码子以粗体显示)。
Figure BDA0003020352050000342
CMV启动子、EF1α和EF1α-V1的序列
>CMV promoter(SEQ ID 3)
gcgttgacattgattattgactagttattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctctctggctaact
>EF1α(SEQ ID 4)
GCTCCGGTGCCCGTCAGTGGGCAGAGCGCACATCGCCCACAGTCCCCGAGAAGTTGGGGGGAGGGGTCGGCAATTGAACCGGTGCCTAGAGAAGGTGGCGCGGGGTAAACTGGGAAAGTGATGTCGTGTACTGGCTCCGCCTTTTTCCCGAGGGTGGGGGAGAACCGTATATAAGTGCAGTAGTCGCCGTGAACGTTCTTTTTCGCAACGGGTTTGCCGCCAGAACACAGGTAAGTGCCGTGTGTGGTTCCCGCGGGCCTGGCCTCTTTACGGGTTATGGCCCTTGCGTGCCTTGAATTACTTCCACGCCCCTGGCTGCAGTACGTGATTCTTGATCCCGAGCTTCGGGTTGGAAGTGGGTGGGAGAGTTCGAGGCCTTGCGCTTAAGGAGCCCCTTCGCCTCGTGCTTGAGTTGAGGCCTGGCCTGGGCGCTGGGGCCGCCGCGTGCGAATCTGGTGGCACCTTCGCGCCTGTCTCGCTGCTTTCGATAAGTCTCTAGCCATTTAAAATTTTTGATGACCTGCTGCGACGCTTTTTTTCTGGCAAGATAGTCTTGTAAATGCGGGCCAAGATCTGCACACTGGTATTTCGGTTTTTGGGGCCGCGGGCGGCGACGGGGCCCGTGCGTCCCAGCGCACATGTTCGGCGAGGCGGGGCCTGCGAGCGCGGCCACCGAGAATCGGACGGGGGTAGTCTCAAGCTGGCCGGCCTGCTCTGGTGCCTGGCCTCGCGCCGCCGTGTATCGCCCCGCCCTGGGCGGCAAGGCTGGCCCGGTCGGCACCAGTTGCGTGAGCGGAAAGATGGCCGCTTCCCGGCCCTGCTGCAGGGAGCTCAAAATGGAGGACGCGGCGCTCGGGAGAGCGGGCGGGTGAGTCACCCACACAAAGGAAAAGGGCCTTTCCGTCCTCAGCCGTCGCTTCATGTGACTCCACGGAGTACCGGGCGCCGTCCAGGCACCTCGATTAGTTCTCGAGCTTTTGGAGTACGTCGTCTTTAGGTTGGGGGGAGGGGTTTTATGCGATGGAGTTTCCCCACACTGAGTGGGTGGAGACTGAAGTTAGGCCAGCTTGGCACTTGATGTAATTCTCCTTGGAATTTGCCCTTTTTGAGTTTGGATCTTGGTTCATTCTCAAGCCTCAGACAGTGGTTCAAAGTTTTTTTCTTCCATTTCAGGTGTCGTGA
>EF1α-V1(SEQ ID 5)
ttaagctcgggcccTGGGCGGGATTCGTCTTGGGCGGGATCCTTGTCCACGTGATCGGGGGAGGGACTTTCCCGCTGGAGTGACTCATCTAGCCCACGTGATCTTCATGCCACGTGATCGATATGGGGACTTTCCTGACTCCCACGTGATCGCACCCCCACGTGATCCCGTAAGGGACTTTCCCTACTTTGCCTAGAGAAGGTGGCGCGGGGTAAACTGGGAAAGTGATGTCGTGTACTGGCTCCGCCTTTTTCCCGTGCTCAGGGGAGAACCGTATATAAGTGCAGTAGTCGCCGTGAACGTTCTTTTTCGCAACGTTAACTAGCACAGAACACAGGTAAGTGCCGTGTGTGGTTCCCGCGGGCGGCGACGGGGCCCGTGCCCACGTGATCAGGAGTTGGGCGGGATGTTATGAGTGACTCACGCCATCCACGTGATCTCAGACGGGACTTTCCATATTAAGTGACTCAGGATAAGGGACTTTCCCTACGGCCACGTGATCTCTTTTTGGGCGGGATGAGATTGGGACTTTCCTGTCCTGGGACTTTCCTACAGTTCAAACTCGACCACGTGATCTTATGACTGACGGGCGGGTGAGTCACCCACGGTGGCATGGGGGACTTTCCTTTAGGCGTTCATGTGACTCCACGGACAAGCCTCAGACAGTGGTTCAAAGTTTTTTTCTTCCATTTCAGGTGTCGTGAa
narL的序列:
>NarL(SEQ ID 6)
MSNQEPATILLIDDHPMLRTGVKQLISMAPDITVVGEASNGEQGIELAESLDPDLILLDLNMPGMNGLETLDKLREKSLSGRIVVFSVSNHEEDVVTALKRGADGYLLKDMEPEDLLKALHQAAAGEMVLSEALTPVLAASLRANRATTERDVNQLTPRERDILKLIAQGLPNKMIARRLDITESTVKVHVKHMLKKMKLKSRVEAAVWVHQERIF
VP48的序列:
>VP48(SEQ ID 7)
GPADALDDFDLDMLPADALDDFDLDMLPADALDDFDLDMLPG
EnvZ180-450,EnvZ223-450,NarX176-598和NarX379-598的氨基酸序列在可磷酸化的组氨酸下标有下划线和斜体,对于ATP结合结构域重要的天冬酰胺标有粗体和下划线。
>EnvZ180-450(SEQ ID 8)
Figure BDA0003020352050000361
>EnvZ223-450(SEQ ID 9)
Figure BDA0003020352050000362
>NarX176-598(SEQ ID 10)
Figure BDA0003020352050000363
Figure BDA0003020352050000371
>NarX379-598(SEQ ID 11)
Figure BDA0003020352050000372
NarX379-598突变版本的aa的突变aa用粗体和下划线表示
>NarX379-598(H399Q)(SEQ ID 12)
Figure BDA0003020352050000373
>NarX379-598(N509A)(SEQ ID 13)
Figure BDA0003020352050000374
序列表
<110> 苏黎世联邦理工学院(ETH Zürich)
<120> 用于转导蛋白质-蛋白质相互作用的新方法
<130> eth182wo
<160> 79
<170> PatentIn version 3.5
<210> 1
<211> 134
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成启动子(synthetic promoter)
<400> 1
atttacattt tgaaacatct atagcgccgg catttacatt ttgaaacatc tatccatatg 60
ctctagaggg tatataatgg gggccactag tctactacca gagctcatcg ctagcgctac 120
cggtcgccac catg 134
<210> 2
<211> 124
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成启动子(synthetic promoter)
<400> 2
tacccctata ggggtatagc gccggctacc cctatagggg tatccatatg ctctagaggg 60
tatataatgg gggccactag tctactacca gagctcatcg ctagcgctac cggtcgccac 120
catg 124
<210> 3
<211> 601
<212> DNA
<213> 巨细胞病毒(Cytomegalovirus)
<400> 3
gcgttgacat tgattattga ctagttatta atagtaatca attacggggt cattagttca 60
tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc ctggctgacc 120
gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag taacgccaat 180
agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc acttggcagt 240
acatcaagtg tatcatatgc caagtacgcc ccctattgac gtcaatgacg gtaaatggcc 300
cgcctggcat tatgcccagt acatgacctt atgggacttt cctacttggc agtacatcta 360
cgtattagtc atcgctatta ccatggtgat gcggttttgg cagtacatca atgggcgtgg 420
atagcggttt gactcacggg gatttccaag tctccacccc attgacgtca atgggagttt 480
gttttggcac caaaatcaac gggactttcc aaaatgtcgt aacaactccg ccccattgac 540
gcaaatgggc ggtaggcgtg tacggtggga ggtctatata agcagagctc tctggctaac 600
t 601
<210> 4
<211> 1182
<212> DNA
<213> 智人(Homo sapiens)
<400> 4
gctccggtgc ccgtcagtgg gcagagcgca catcgcccac agtccccgag aagttggggg 60
gaggggtcgg caattgaacc ggtgcctaga gaaggtggcg cggggtaaac tgggaaagtg 120
atgtcgtgta ctggctccgc ctttttcccg agggtggggg agaaccgtat ataagtgcag 180
tagtcgccgt gaacgttctt tttcgcaacg ggtttgccgc cagaacacag gtaagtgccg 240
tgtgtggttc ccgcgggcct ggcctcttta cgggttatgg cccttgcgtg ccttgaatta 300
cttccacgcc cctggctgca gtacgtgatt cttgatcccg agcttcgggt tggaagtggg 360
tgggagagtt cgaggccttg cgcttaagga gccccttcgc ctcgtgcttg agttgaggcc 420
tggcctgggc gctggggccg ccgcgtgcga atctggtggc accttcgcgc ctgtctcgct 480
gctttcgata agtctctagc catttaaaat ttttgatgac ctgctgcgac gctttttttc 540
tggcaagata gtcttgtaaa tgcgggccaa gatctgcaca ctggtatttc ggtttttggg 600
gccgcgggcg gcgacggggc ccgtgcgtcc cagcgcacat gttcggcgag gcggggcctg 660
cgagcgcggc caccgagaat cggacggggg tagtctcaag ctggccggcc tgctctggtg 720
cctggcctcg cgccgccgtg tatcgccccg ccctgggcgg caaggctggc ccggtcggca 780
ccagttgcgt gagcggaaag atggccgctt cccggccctg ctgcagggag ctcaaaatgg 840
aggacgcggc gctcgggaga gcgggcgggt gagtcaccca cacaaaggaa aagggccttt 900
ccgtcctcag ccgtcgcttc atgtgactcc acggagtacc gggcgccgtc caggcacctc 960
gattagttct cgagcttttg gagtacgtcg tctttaggtt ggggggaggg gttttatgcg 1020
atggagtttc cccacactga gtgggtggag actgaagtta ggccagcttg gcacttgatg 1080
taattctcct tggaatttgc cctttttgag tttggatctt ggttcattct caagcctcag 1140
acagtggttc aaagtttttt tcttccattt caggtgtcgt ga 1182
<210> 5
<211> 705
<212> DNA
<213> 智人(Homo sapiens)
<400> 5
ttaagctcgg gccctgggcg ggattcgtct tgggcgggat ccttgtccac gtgatcgggg 60
gagggacttt cccgctggag tgactcatct agcccacgtg atcttcatgc cacgtgatcg 120
atatggggac tttcctgact cccacgtgat cgcaccccca cgtgatcccg taagggactt 180
tccctacttt gcctagagaa ggtggcgcgg ggtaaactgg gaaagtgatg tcgtgtactg 240
gctccgcctt tttcccgtgc tcaggggaga accgtatata agtgcagtag tcgccgtgaa 300
cgttcttttt cgcaacgtta actagcacag aacacaggta agtgccgtgt gtggttcccg 360
cgggcggcga cggggcccgt gcccacgtga tcaggagttg ggcgggatgt tatgagtgac 420
tcacgccatc cacgtgatct cagacgggac tttccatatt aagtgactca ggataaggga 480
ctttccctac ggccacgtga tctctttttg ggcgggatga gattgggact ttcctgtcct 540
gggactttcc tacagttcaa actcgaccac gtgatcttat gactgacggg cgggtgagtc 600
acccacggtg gcatggggga ctttccttta ggcgttcatg tgactccacg gacaagcctc 660
agacagtggt tcaaagtttt tttcttccat ttcaggtgtc gtgaa 705
<210> 6
<211> 216
<212> PRT
<213> 大肠肝菌(Escherichia coli)
<400> 6
Met Ser Asn Gln Glu Pro Ala Thr Ile Leu Leu Ile Asp Asp His Pro
1 5 10 15
Met Leu Arg Thr Gly Val Lys Gln Leu Ile Ser Met Ala Pro Asp Ile
20 25 30
Thr Val Val Gly Glu Ala Ser Asn Gly Glu Gln Gly Ile Glu Leu Ala
35 40 45
Glu Ser Leu Asp Pro Asp Leu Ile Leu Leu Asp Leu Asn Met Pro Gly
50 55 60
Met Asn Gly Leu Glu Thr Leu Asp Lys Leu Arg Glu Lys Ser Leu Ser
65 70 75 80
Gly Arg Ile Val Val Phe Ser Val Ser Asn His Glu Glu Asp Val Val
85 90 95
Thr Ala Leu Lys Arg Gly Ala Asp Gly Tyr Leu Leu Lys Asp Met Glu
100 105 110
Pro Glu Asp Leu Leu Lys Ala Leu His Gln Ala Ala Ala Gly Glu Met
115 120 125
Val Leu Ser Glu Ala Leu Thr Pro Val Leu Ala Ala Ser Leu Arg Ala
130 135 140
Asn Arg Ala Thr Thr Glu Arg Asp Val Asn Gln Leu Thr Pro Arg Glu
145 150 155 160
Arg Asp Ile Leu Lys Leu Ile Ala Gln Gly Leu Pro Asn Lys Met Ile
165 170 175
Ala Arg Arg Leu Asp Ile Thr Glu Ser Thr Val Lys Val His Val Lys
180 185 190
His Met Leu Lys Lys Met Lys Leu Lys Ser Arg Val Glu Ala Ala Val
195 200 205
Trp Val His Gln Glu Arg Ile Phe
210 215
<210> 7
<211> 42
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 7
Gly Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala
1 5 10 15
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu
20 25 30
Asp Asp Phe Asp Leu Asp Met Leu Pro Gly
35 40
<210> 8
<211> 272
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 8
Met Arg Ile Gln Asn Arg Pro Leu Val Asp Leu Glu His Ala Ala Leu
1 5 10 15
Gln Val Gly Lys Gly Ile Ile Pro Pro Pro Leu Arg Glu Tyr Gly Ala
20 25 30
Ser Glu Val Arg Ser Val Thr Arg Ala Phe Asn His Met Ala Ala Gly
35 40 45
Val Lys Gln Leu Ala Asp Asp Arg Thr Leu Leu Met Ala Gly Val Ser
50 55 60
His Asp Leu Arg Thr Pro Leu Thr Arg Ile Arg Leu Ala Thr Glu Met
65 70 75 80
Met Ser Glu Gln Asp Gly Tyr Leu Ala Glu Ser Ile Asn Lys Asp Ile
85 90 95
Glu Glu Cys Asn Ala Ile Ile Glu Gln Phe Ile Asp Tyr Leu Arg Thr
100 105 110
Gly Gln Glu Met Pro Met Glu Met Ala Asp Leu Asn Ala Val Leu Gly
115 120 125
Glu Val Ile Ala Ala Glu Ser Gly Tyr Glu Arg Glu Ile Glu Thr Ala
130 135 140
Leu Tyr Pro Gly Ser Ile Glu Val Lys Met His Pro Leu Ser Ile Lys
145 150 155 160
Arg Ala Val Ala Asn Met Val Val Asn Ala Ala Arg Tyr Gly Asn Gly
165 170 175
Trp Ile Lys Val Ser Ser Gly Thr Glu Pro Asn Arg Ala Trp Phe Gln
180 185 190
Val Glu Asp Asp Gly Pro Gly Ile Ala Pro Glu Gln Arg Lys His Leu
195 200 205
Phe Gln Pro Phe Val Arg Gly Asp Ser Ala Arg Thr Ile Ser Gly Thr
210 215 220
Gly Leu Gly Leu Ala Ile Val Gln Arg Ile Val Asp Asn His Asn Gly
225 230 235 240
Met Leu Glu Leu Gly Thr Ser Glu Arg Gly Gly Leu Ser Ile Arg Ala
245 250 255
Trp Leu Pro Val Pro Val Thr Arg Ala Gln Gly Thr Thr Lys Glu Gly
260 265 270
<210> 9
<211> 228
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 9
Met Ala Ala Gly Val Lys Gln Leu Ala Asp Asp Arg Thr Leu Leu Met
1 5 10 15
Ala Gly Val Ser His Asp Leu Arg Thr Pro Leu Thr Arg Ile Arg Leu
20 25 30
Ala Thr Glu Met Met Ser Glu Gln Asp Gly Tyr Leu Ala Glu Ser Ile
35 40 45
Asn Lys Asp Ile Glu Glu Cys Asn Ala Ile Ile Glu Gln Phe Ile Asp
50 55 60
Tyr Leu Arg Thr Gly Gln Glu Met Pro Met Glu Met Ala Asp Leu Asn
65 70 75 80
Ala Val Leu Gly Glu Val Ile Ala Ala Glu Ser Gly Tyr Glu Arg Glu
85 90 95
Ile Glu Thr Ala Leu Tyr Pro Gly Ser Ile Glu Val Lys Met His Pro
100 105 110
Leu Ser Ile Lys Arg Ala Val Ala Asn Met Val Val Asn Ala Ala Arg
115 120 125
Tyr Gly Asn Gly Trp Ile Lys Val Ser Ser Gly Thr Glu Pro Asn Arg
130 135 140
Ala Trp Phe Gln Val Glu Asp Asp Gly Pro Gly Ile Ala Pro Glu Gln
145 150 155 160
Arg Lys His Leu Phe Gln Pro Phe Val Arg Gly Asp Ser Ala Arg Thr
165 170 175
Ile Ser Gly Thr Gly Leu Gly Leu Ala Ile Val Gln Arg Ile Val Asp
180 185 190
Asn His Asn Gly Met Leu Glu Leu Gly Thr Ser Glu Arg Gly Gly Leu
195 200 205
Ser Ile Arg Ala Trp Leu Pro Val Pro Val Thr Arg Ala Gln Gly Thr
210 215 220
Thr Lys Glu Gly
225
<210> 10
<211> 424
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 10
Met Ala Arg Leu Leu Gln Pro Trp Arg Gln Leu Leu Ala Met Ala Ser
1 5 10 15
Ala Val Ser His Arg Asp Phe Thr Gln Arg Ala Asn Ile Ser Gly Arg
20 25 30
Asn Glu Met Ala Met Leu Gly Thr Ala Leu Asn Asn Met Ser Ala Glu
35 40 45
Leu Ala Glu Ser Tyr Ala Val Leu Glu Gln Arg Val Gln Glu Lys Thr
50 55 60
Ala Gly Leu Glu His Lys Asn Gln Ile Leu Ser Phe Leu Trp Gln Ala
65 70 75 80
Asn Arg Arg Leu His Ser Arg Ala Pro Leu Cys Glu Arg Leu Ser Pro
85 90 95
Val Leu Asn Gly Leu Gln Asn Leu Thr Leu Leu Arg Asp Ile Glu Leu
100 105 110
Arg Val Tyr Asp Thr Asp Asp Glu Glu Asn His Gln Glu Phe Thr Cys
115 120 125
Gln Pro Asp Met Thr Cys Asp Asp Lys Gly Cys Gln Leu Cys Pro Arg
130 135 140
Gly Val Leu Pro Val Gly Asp Arg Gly Thr Thr Leu Lys Trp Arg Leu
145 150 155 160
Ala Asp Ser His Thr Gln Tyr Gly Ile Leu Leu Ala Thr Leu Pro Gln
165 170 175
Gly Arg His Leu Ser His Asp Gln Gln Gln Leu Val Asp Thr Leu Val
180 185 190
Glu Gln Leu Thr Ala Thr Leu Ala Leu Asp Arg His Gln Glu Arg Gln
195 200 205
Gln Gln Leu Ile Val Met Glu Glu Arg Ala Thr Ile Ala Arg Glu Leu
210 215 220
His Asp Ser Ile Ala Gln Ser Leu Ser Cys Met Lys Met Gln Val Ser
225 230 235 240
Cys Leu Gln Met Gln Gly Asp Ala Leu Pro Glu Ser Ser Arg Glu Leu
245 250 255
Leu Ser Gln Ile Arg Asn Glu Leu Asn Ala Ser Trp Ala Gln Leu Arg
260 265 270
Glu Leu Leu Thr Thr Phe Arg Leu Gln Leu Thr Glu Pro Gly Leu Arg
275 280 285
Pro Ala Leu Glu Ala Ser Cys Glu Glu Tyr Ser Ala Lys Phe Gly Phe
290 295 300
Pro Val Lys Leu Asp Tyr Gln Leu Pro Pro Arg Leu Val Pro Ser His
305 310 315 320
Gln Ala Ile His Leu Leu Gln Ile Ala Arg Glu Ala Leu Ser Asn Ala
325 330 335
Leu Lys His Ser Gln Ala Ser Glu Val Val Val Thr Val Ala Gln Asn
340 345 350
Asp Asn Gln Val Lys Leu Thr Val Gln Asp Asn Gly Cys Gly Val Pro
355 360 365
Glu Asn Ala Ile Arg Ser Asn His Tyr Gly Met Ile Ile Met Arg Asp
370 375 380
Arg Ala Gln Ser Leu Arg Gly Asp Cys Arg Val Arg Arg Arg Glu Ser
385 390 395 400
Gly Gly Thr Glu Val Val Val Thr Phe Ile Pro Glu Lys Thr Phe Thr
405 410 415
Asp Val Gln Gly Asp Thr His Glu
420
<210> 11
<211> 221
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 11
Met Gln Glu Arg Gln Gln Gln Leu Ile Val Met Glu Glu Arg Ala Thr
1 5 10 15
Ile Ala Arg Glu Leu His Asp Ser Ile Ala Gln Ser Leu Ser Cys Met
20 25 30
Lys Met Gln Val Ser Cys Leu Gln Met Gln Gly Asp Ala Leu Pro Glu
35 40 45
Ser Ser Arg Glu Leu Leu Ser Gln Ile Arg Asn Glu Leu Asn Ala Ser
50 55 60
Trp Ala Gln Leu Arg Glu Leu Leu Thr Thr Phe Arg Leu Gln Leu Thr
65 70 75 80
Glu Pro Gly Leu Arg Pro Ala Leu Glu Ala Ser Cys Glu Glu Tyr Ser
85 90 95
Ala Lys Phe Gly Phe Pro Val Lys Leu Asp Tyr Gln Leu Pro Pro Arg
100 105 110
Leu Val Pro Ser His Gln Ala Ile His Leu Leu Gln Ile Ala Arg Glu
115 120 125
Ala Leu Ser Asn Ala Leu Lys His Ser Gln Ala Ser Glu Val Val Val
130 135 140
Thr Val Ala Gln Asn Asp Asn Gln Val Lys Leu Thr Val Gln Asp Asn
145 150 155 160
Gly Cys Gly Val Pro Glu Asn Ala Ile Arg Ser Asn His Tyr Gly Met
165 170 175
Ile Ile Met Arg Asp Arg Ala Gln Ser Leu Arg Gly Asp Cys Arg Val
180 185 190
Arg Arg Arg Glu Ser Gly Gly Thr Glu Val Val Val Thr Phe Ile Pro
195 200 205
Glu Lys Thr Phe Thr Asp Val Gln Gly Asp Thr His Glu
210 215 220
<210> 12
<211> 221
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 12
Met Gln Glu Arg Gln Gln Gln Leu Ile Val Met Glu Glu Arg Ala Thr
1 5 10 15
Ile Ala Arg Glu Leu Gln Asp Ser Ile Ala Gln Ser Leu Ser Cys Met
20 25 30
Lys Met Gln Val Ser Cys Leu Gln Met Gln Gly Asp Ala Leu Pro Glu
35 40 45
Ser Ser Arg Glu Leu Leu Ser Gln Ile Arg Asn Glu Leu Asn Ala Ser
50 55 60
Trp Ala Gln Leu Arg Glu Leu Leu Thr Thr Phe Arg Leu Gln Leu Thr
65 70 75 80
Glu Pro Gly Leu Arg Pro Ala Leu Glu Ala Ser Cys Glu Glu Tyr Ser
85 90 95
Ala Lys Phe Gly Phe Pro Val Lys Leu Asp Tyr Gln Leu Pro Pro Arg
100 105 110
Leu Val Pro Ser His Gln Ala Ile His Leu Leu Gln Ile Ala Arg Glu
115 120 125
Ala Leu Ser Asn Ala Leu Lys His Ser Gln Ala Ser Glu Val Val Val
130 135 140
Thr Val Ala Gln Asn Asp Asn Gln Val Lys Leu Thr Val Gln Asp Asn
145 150 155 160
Gly Cys Gly Val Pro Glu Asn Ala Ile Arg Ser Asn His Tyr Gly Met
165 170 175
Ile Ile Met Arg Asp Arg Ala Gln Ser Leu Arg Gly Asp Cys Arg Val
180 185 190
Arg Arg Arg Glu Ser Gly Gly Thr Glu Val Val Val Thr Phe Ile Pro
195 200 205
Glu Lys Thr Phe Thr Asp Val Gln Gly Asp Thr His Glu
210 215 220
<210> 13
<211> 221
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 13
Met Gln Glu Arg Gln Gln Gln Leu Ile Val Met Glu Glu Arg Ala Thr
1 5 10 15
Ile Ala Arg Glu Leu His Asp Ser Ile Ala Gln Ser Leu Ser Cys Met
20 25 30
Lys Met Gln Val Ser Cys Leu Gln Met Gln Gly Asp Ala Leu Pro Glu
35 40 45
Ser Ser Arg Glu Leu Leu Ser Gln Ile Arg Asn Glu Leu Asn Ala Ser
50 55 60
Trp Ala Gln Leu Arg Glu Leu Leu Thr Thr Phe Arg Leu Gln Leu Thr
65 70 75 80
Glu Pro Gly Leu Arg Pro Ala Leu Glu Ala Ser Cys Glu Glu Tyr Ser
85 90 95
Ala Lys Phe Gly Phe Pro Val Lys Leu Asp Tyr Gln Leu Pro Pro Arg
100 105 110
Leu Val Pro Ser His Gln Ala Ile His Leu Leu Gln Ile Ala Arg Glu
115 120 125
Ala Leu Ser Ala Ala Leu Lys His Ser Gln Ala Ser Glu Val Val Val
130 135 140
Thr Val Ala Gln Asn Asp Asn Gln Val Lys Leu Thr Val Gln Asp Asn
145 150 155 160
Gly Cys Gly Val Pro Glu Asn Ala Ile Arg Ser Asn His Tyr Gly Met
165 170 175
Ile Ile Met Arg Asp Arg Ala Gln Ser Leu Arg Gly Asp Cys Arg Val
180 185 190
Arg Arg Arg Glu Ser Gly Gly Thr Glu Val Val Val Thr Phe Ile Pro
195 200 205
Glu Lys Thr Phe Thr Asp Val Gln Gly Asp Thr His Glu
210 215 220
<210> 14
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 14
gctgctgctc tcgagtcatt atcattcgtg agtgtc 36
<210> 15
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 15
gctgctaccg gtcgccacca tggcccgctt gctccagccg tgg 43
<210> 16
<211> 72
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 16
cgcgcctgat tacaaaactt taaaaagtgc tgtagcgccg gctgattaca aaactttaaa 60
aagtgctgtc ca 72
<210> 17
<211> 70
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 17
tatggacagc actttttaaa gttttgtaat cagccggcgc tacagcactt tttaaagttt 60
tgtaatcagg 70
<210> 18
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 18
taagcggaat tcatcttggc tgaggaatct t 31
<210> 19
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 19
gcgaattcta gactacttgt acagctcgtc c 31
<210> 20
<211> 39
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 20
aatgtgaagc tagcgccacc atggctgaag gatccgtcg 39
<210> 21
<211> 35
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 21
aatgtaatct agatcactct tccatcacgc cgatc 35
<210> 22
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 22
gctagcgcta ccggactcag at 22
<210> 23
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 23
tgggtggggt gcgtccgcgc gcacagaagt cccggaaaca ccg 43
<210> 24
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 24
tgggtggggt gcgtccgcgc gcacacagaa gctcctggaa ggcaa 45
<210> 25
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 25
ggcacagtcg aggctgattt tc 22
<210> 26
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 26
tggcagcggg cgtcaagcag 20
<210> 27
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 27
atggtggtgg cagcggcgag gtatggcaac g 31
<210> 28
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 28
ctcgccgctg ccaccaccat gttggcgacg 30
<210> 29
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 29
gaaattaata cgactcacta taggggac 28
<210> 30
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 30
gaaattaata cgactcacta taggggaccg gtcgccacca tggcagcggg cgtcaag 57
<210> 31
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 31
cacagtcgag gctgattttc 20
<210> 32
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 32
gtttgagagc tgccgagagt gcttctctcg cg 32
<210> 33
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 33
agcactctcg gcagctctca aacatagcca gg 32
<210> 34
<211> 35
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 34
cttccagtgc agcttcaatc agatttccca gtgtg 35
<210> 35
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 35
tctgattgaa gctgcactgg aagctctggg ac 32
<210> 36
<211> 60
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 36
gaaattaata cgactcacta taggggaccg gtcgccacca tgcaagagcg gcagcagcag 60
<210> 37
<211> 42
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 37
gacggccagt cttaagctcg ggcccgctcc ggtgcccgtc ag 42
<210> 38
<211> 47
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 38
gaagtcgtcg catggtggcg accggttcac gacacctgaa atggaag 47
<210> 39
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 39
gacggccagt cttaagctcg ggccctgggc gggattcgtc ttg 43
<210> 40
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 40
caagagcggc agcagcag 18
<210> 41
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 41
ttcgtgagtg tcaccctgc 19
<210> 42
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 42
gaaattaata cgactcacta taggggaccg gtcgccacca tgggcgtgca ggtggag 57
<210> 43
<211> 49
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 43
cgccaccgcc tgaaccgcct ccaccttcca gttttagaag ctccacatc 49
<210> 44
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 44
gaaattaata cgactcacta taggggaccg gtcgccacca tggtagccat cctctgg 57
<210> 45
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 45
cgccaccgcc tgaaccgcct ccacctgata tccgtctgaa cacgtg 46
<210> 46
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 46
aggcggttca ggcggtggcg ggtcgcaaga gcggcagcag cag 43
<210> 47
<211> 52
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 47
cgcgcctacc cctatagggg tatagcgccg gctaccccta taggggtatc ca 52
<210> 48
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 48
tatggatacc cctatagggg tagccggcgc tataccccta taggggtagg 50
<210> 49
<211> 44
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 49
ttcttccatt tcaggtgtcg tgaaccggtc gccaccatgg gctc 44
<210> 50
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Priomer
<400> 50
catcgtcatg gaagagaggg cgactattgc 30
<210> 51
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 51
gcaatagtcg ccctctcttc catgacgatg 30
<210> 52
<211> 44
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 52
ttcttccatt tcaggtgtcg tgaaccggtc gccaccatgg gcgt 44
<210> 53
<211> 44
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 53
ttcttccatt tcaggtgtcg tgaaccggtc gccaccatgg tagc 44
<210> 54
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 54
ttcttccatt tcaggtgtcg tgaaccggtc gccaccatgc aagagcggca gcagcag 57
<210> 55
<211> 39
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 55
cctgattgga catggtggcg accggttcac gacacctga 39
<210> 56
<211> 42
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 56
ttcttccatt tcaggtgtcg tgaaccggtc gccaccatgc tt 42
<210> 57
<211> 52
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 57
tccatttcag gtgtcgtgaa ccggtcgcca ccatggggga gaaacccggg ac 52
<210> 58
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 58
ctcttgcgag ccaccgccac cgcagagttg atcatcatag tcgtc 45
<210> 59
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 59
ggtggcggtg gctcgcaaga gcggcagcag cag 33
<210> 60
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 60
tccatttcag gtgtcgtgaa ccggtcgcca ccatggggca acccgggaac 50
<210> 61
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 61
ctcttgcgag ccaccgccac ccgatgaagt gtccttggcc 40
<210> 62
<211> 38
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 62
attacgccaa gctacggggg cacctcgaca tactcgag 38
<210> 63
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 63
ccttgctcac catggtggcg aggtaccgag ctcgaaatct c 41
<210> 64
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 64
accgggagaa gcggggtctc g 21
<210> 65
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 65
cagtcgaggc tgattttctc gctcaagcgt aatctggaac 40
<210> 66
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 66
gttccagatt acgcttgagc gagaaaatca gcctcgactg 40
<210> 67
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 67
ccgggagctt tttgcaaaag c 21
<210> 68
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 68
ggacggggca tggactccgc ag 22
<210> 69
<211> 56
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物(Primer)
<400> 69
gcacagtcga ggctgatttt ctcgagtcat tactacccac cgtactcgtc aattcc 56
<210> 70
<211> 996
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 用于质粒构建体的合成DNA
<400> 70
agatctcgag ctcaagcttc gaattcgcca ccatggggga gaaacccggg accagggtct 60
tcaagaagtc gagccctaac tgcaagctca ccgtgtactt gggcaagcgg gacttcgtag 120
atcacctgga caaagtggac cctgtagatg gcgtggtgct tgtggaccct gactacctga 180
aggaccgcaa agtgtttgtg accctcacct gcgccttccg ctatggccgt gaagacctgg 240
atgtgctggg cttgtccttc cgcaaagacc tgttcatcgc cacctaccag gccttccccc 300
cggtgcccaa cccaccccgg ccccccaccc gcctgcagga ccggctgctg aggaagctgg 360
gccagcatgc ccaccccttc ttcttcacca taccccagaa tcttccatgc tccgtcacac 420
tgcagccagg cccagaggat acaggaaagg cctgcggcgt agactttgag attcgagcct 480
tctgtgctaa atcactagaa gagaaaagcc acaaaaggaa ctctgtgcgg ctggtgatcc 540
gaaaggtgca gttcgccccg gagaaacccg gcccccagcc ttcagccgaa accacacgcc 600
acttcctcat gtctgaccgg tccctgcacc tcgaggcttc cctggacaag gagctgtact 660
accatgggga gcccctcaat gtaaatgtcc acgtcaccaa caactccacc aagaccgtca 720
agaagatcaa agtctctgtg agacagtacg ccgacatctg cctcttcagc accgcccagt 780
acaagtgtcc tgtggctcaa ctcgaacaag atgaccaggt atctcccagc tccacattct 840
gtaaggtgta caccataacc ccactgctca gcgacaaccg ggagaagcgg ggtctcgccc 900
tggatgggaa actcaagcac gaggacacca acctggcttc cagcaccatc gtgaaggagg 960
gtgccaacaa ggaggtgctg ggaatcctgg tgtcct 996
<210> 71
<211> 1066
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 用于质粒构建体的合成DNA
<400> 71
gctgggaatc ctggtgtcct acagggtcaa ggtgaagctg gtggtgtctc gaggcgggga 60
tgtctctgtg gagctgcctt ttgttcttat gcaccccaag ccccacgacc acatccccct 120
ccccagaccc cagtcagccg ctccggagac agatgtccct gtggacacca acctcattga 180
atttgatacc aactatgcca cagatgatga cattgtgttt gaggactttg cccggcttcg 240
gctgaagggg atgaaggatg acgactatga tgatcaactc tgcggatcca gcttgtttaa 300
gggaccacgt gattacaacc cgatatcgag caccatttgt catttgacga atgaatctga 360
tgggcacaca acatcgttgt atggtattgg atttggtccc ttcatcatta caaacaagca 420
cttgtttaga agaaataatg gaacactgtt ggtccaatca ctacatggtg tattcaaggt 480
caagaacacc acgactttgc aacaacacct cattgatggg agggacatga taattattcg 540
catgcctaag gatttcccac catttcctca aaagctgaaa tttagagagc cacaaaggga 600
agagcgcata tgtcttgtga caaccaactt ccaaactaag agcatgtcta gcatggtgtc 660
agacactagt tgcacattcc cttcatctga tggcatattc tggaagcatt ggattcaaac 720
caaggatggg cagtgtggca gtccattagt atcaactaga gatgggttca ttgttggtat 780
acactcagca tcgaatttca ccaacacaaa caattatttc acaagcgtgc cgaaaaactt 840
catggaattg ttgacaaatc aggaggcgca gcagtgggtt agtggttggc gattaaatgc 900
tgactcagta ttgtgggggg gccataaagt tttcatgagc aaacctgaag agccttttca 960
gccagttaag gaagcgactc aactcatgaa tgaattggtg tactcgcaat acccatacga 1020
tgttccagat tacgcttgag cggccgcgac tctagatcat aatcag 1066
<210> 72
<211> 1201
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 用于质粒构建体的合成DNA
<400> 72
gcgctaccgg actcagatct cgaggccacc atggactccc cgatccagat cttccgcggg 60
gagccgggcc ctacctgcgc cccgagcgcc tgcctgcccc ccaacagcag cgcctggttt 120
cccggctggg ccgagcccga cagcaacggc agcgccggct cggaggacgc gcagctggag 180
cccgcgcaca tctccccggc catcccggtc atcatcacgg cggtctactc cgtagtgttc 240
gtcgtgggct tggtgggcaa ctcgctggtc atgttcgtga tcatccgata cacaaagatg 300
aagacagcaa ccaacattta catatttaac ctggctttgg cagatgcttt agttactaca 360
accatgccct ttcagagtac ggtctacttg atgaattcct ggccttttgg ggatgtgctg 420
tgcaagatag taatttccat tgattactac aacatgttca ccagcatctt caccttgacc 480
atgatgagcg tggaccgcta cattgccgtg tgccaccccg tgaaggcttt ggacttccgc 540
acacccttga aggcaaagat catcaatatc tgcatctggc tgctgtcgtc atctgttggc 600
atctctgcaa tagtccttgg aggcaccaaa gtcagggaag acgtcgatgt cattgagtgc 660
tccttgcagt tcccagatga tgactactcc tggtgggacc tcttcatgaa gatctgcgtc 720
ttcatctttg ccttcgtgat ccctgtcctc atcatcatcg tctgctacac cctgatgatc 780
ctgcgtctca agagcgtccg gctcctttct ggctcccgag agaaagatcg caacctgcgt 840
aggatcacca gactggtcct ggtggtggtg gcagtcttcg tcgtctgctg gactcccatt 900
cacatattca tcctggtgga ggctctgggg agcacctccc acagcacagc tgctctctcc 960
agctattact tctgcatcgc cttaggctat accaacagta gcctgaatcc cattctctac 1020
gcctttcttg atgaaaactt caagcggtgt ttccgggact tctgttttcc actgaagatg 1080
aggatggagc ggcagagcac tagcagagtc cgaaatacag ttcaggaccc tgcttacctg 1140
agggacatcg atgggatgaa taaaccagta tgacaattgt tgttgttaac ttgtttattg 1200
c 1201
<210> 73
<211> 1167
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 用于质粒构建体的合成DNA
<400> 73
agcggtgttt ccgggacttc tgtgcgcgcg gacgcacccc acccagcctg ggtccccaag 60
atgagtcctg caccaccgcc agctcctccc tggccaagga cacttcatcg ggatccgaga 120
atctgtactt tcagctgaga ttagataaaa gtaaagtgat taacagcgca ttagagctgc 180
ttaatgaggt cggaatcgaa ggtttaacaa cccgtaaact cgcccagaag ctaggtgtag 240
agcagcctac attgtattgg catgtaaaaa ataagcgggc tttgctcgac gccttagcca 300
ttgagatgtt agataggcac catactcact tttgcccttt agaaggggaa agctggcaag 360
attttttacg taataacgct aaaagtttta gatgtgcttt actaagtcat cgcgatggag 420
caaaagtaca tttaggtaca cggcctacag aaaaacagta tgaaactctc gaaaatcaat 480
tagccttttt atgccaacaa ggtttttcac tagagaatgc attatatgca ctcagcgctg 540
tggggcattt tactttaggt tgcgtattgg aagatcaaga gcatcaagtc gctaaagaag 600
aaagggaaac acctactact gatagtatgc cgccattatt acgacaagct atcgaattat 660
ttgatcacca aggtgcagag ccagccttct tattcggcct tgaattgatc atatgcggat 720
tagaaaaaca acttaaatgt gaaagtgggt ccgcgtacag ccgggcgcgt acgaaaaaca 780
attacgggtc taccatcgag ggcctgctcg atctcccgga cgacgacgcc cccgaagagg 840
cggggctggc ggctccgcgc ctgtcctttc tccccgcggg acacacgcgc agactgtcga 900
cggccccccc gaccgatgtc agcctggggg acgagctcca cttagacggc gaggacgtgg 960
cgatggcgca tgccgacgcg ctagacgatt tcgatctgga catgttgggg gacggggatt 1020
ccccgggtcc gggatttacc ccccacgact ccgcccccta cggcgctctg gatatggccg 1080
acttcgagtt tgagcagatg tttaccgatg cccttggaat tgacgagtac ggtgggtagc 1140
aattgttgtt gttaacttgt ttattgc 1167
<210> 74
<211> 1304
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 用于质粒构建体的合成DNA
<400> 74
gctagcgcta ccggactcag atctcgaggc caccatgggg caacccggga acggcagcgc 60
cttcttgctg gcacccaata gaagccatgc gccggaccac gacgtcacgc agcaaaggga 120
cgaggtgtgg gtggtgggca tgggcatcgt catgtctctc atcgtcctgg ccatcgtgtt 180
tggcaatgtg ctggtcatca cagccattgc caagttcgag cgtctgcaga cggtcaccaa 240
ctacttcatc acttcactgg cctgtgctga tctggtcatg ggcctggcag tggtgccctt 300
tggggccgcc catattctta tgaaaatgtg gacttttggc aacttctggt gcgagttttg 360
gacttccatt gatgtgctgt gcgtcacggc cagcattgag accctgtgcg tgatcgcagt 420
ggatcgctac tttgccatta cttcaccttt caagtaccag agcctgctga ccaagaataa 480
ggcccgggtg atcattctga tggtgtggat tgtgtcaggc cttacctcct tcttgcccat 540
tcagatgcac tggtaccggg ccacccacca ggaagccatc aactgctatg ccaatgagac 600
ctgctgtgac ttcttcacga accaagccta tgccattgcc tcttccatcg tgtccttcta 660
cgttcccctg gtgatcatgg tcttcgtcta ctccagggtc tttcaggagg ccaaaaggca 720
gctccagaag attgacaaat ctgagggccg cttccatgtc cagaacctta gccaggtgga 780
gcaggatggg cggacggggc atggactccg cagatcttcc aagttctgct tgaaggagca 840
caaagccctc aagacgttag gcatcatcat gggcactttc accctctgct ggctgccctt 900
cttcatcgtt aacattgtgc atgtgatcca ggataacctc atccgtaagg aagtttacat 960
cctcctaaat tggataggct atgtcaattc tggtttcaat ccccttatct actgccggag 1020
cccagatttc aggattgcct tccaggagct tctgtgtctg cgcaggtctt ctttgaaggc 1080
ctatgggaat ggctactcca gcaacggcaa cacaggggag cagagtggat atcacgtgga 1140
acaggagaaa gaaaataaac tgctgtgtga agacctccca ggcacggaag actttgtggg 1200
ccatcaaggt actgtgccta gcgataacat tgattcacaa gggaggaatt gtagtacaaa 1260
tgactcactg ctgtaacaat tgttgttgtt aacttgttta ttgc 1304
<210> 75
<211> 832
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 用于质粒构建体的合成DNA
<400> 75
atcttggctg aggaatcttc taacaattta gagcttaaaa acgcccacga ggcggagaac 60
gaaatatcca gagagacgtt agaaacgttc aaaaacgttc gctagcgcca ccatggtgag 120
caagggcgag gagctgttca ccggggtggt gcccatcctg gtcgagctgg acggcgacgt 180
aaacggccac aagttcagcg tgtccggcga gggcgagggc gatgccacct acggcaagct 240
gaccctgaag ttcatctgca ccaccggcaa gctgcccgtg ccctggccca ccctcgtgac 300
caccttcggc tacggcctga tgtgcttcgc ccgctacccc gaccacatga agcagcacga 360
cttcttcaag tccgccatgc ccgaaggcta cgtccaggag cgcaccatct tcttcaagga 420
cgacggcaac tacaagaccc gcgccgaggt gaagttcgag ggcgacaccc tggtgaaccg 480
catcgagctg aagggcatcg acttcaagga ggacggcaac atcctggggc acaagctgga 540
gtacaactac aacagccaca acgtctatat catggccgac aagcagaaga acggcatcaa 600
ggtgaacttc aagatccgcc acaacatcga ggacggcagc gtgcagctcg ccgaccacta 660
ccagcagaac acccccatcg gcgacggccc cgtgctgctg cccgacaacc actacctgag 720
ctaccagtcc aagctgagca aagaccccaa cgagaagcgc gatcacatgg tcctgctgga 780
gttcgtgacc gccgccggga tcactctcgg catggacgag ctgtacaagt ag 832
<210> 76
<211> 227
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 用于质粒构建体的合成DNA
<400> 76
gaaattaata cgactcacta taggggaccg gtcgccacca tgggctcgag caacctggtt 60
gcgcagctcg aaaacgaagt tgcgtctctg gaaaatgaga acgaaaccct gaagaaaaag 120
aacctgcaca aaaaagacct gatcgcgtac ctggagaaag aaatcgcgaa tctgcgtaag 180
aaaatcgaag aaggcggtgg cgggtcgcaa gagcggcagc agcagct 227
<210> 77
<211> 210
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 用于质粒构建体的合成DNA
<400> 77
tgcagggtga cactcacgaa ggcggtggcg ggtcgaacct ggttgcgcag ctcgaaaacg 60
aagttgcgtc tctggaaaat gagaacgaaa ccctgaagaa aaagaacctg cacaaaaaag 120
acctgatcgc gtacctggag aaagaaatcg cgaatctgcg taagaaaatc gaagaatgat 180
aatgactcga gaaaatcagc ctcgactgtg 210
<210> 78
<211> 236
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 用于质粒构建体的合成DNA
<400> 78
gaaattaata cgactcacta taggggaccg gtcgccacca tgggctcgag cgcgcgtaac 60
gcgtatctgc gtaagaaaat cgcacgtctg aaaaaagaca acctgcagct ggaacgtgat 120
gaacagaacc tggaaaaaat catcgcgaac ctgcgtgacg aaatcgcgcg tctcgaaaac 180
gaagttgcgt ctcacgaaca gggcggtggc gggtcgcaag agcggcagca gcagct 236
<210> 79
<211> 219
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 用于质粒构建体的合成DNA
<400> 79
tgcagggtga cactcacgaa ggcggtggcg ggtcggcgcg taacgcgtat ctgcgtaaga 60
aaatcgcacg tctgaaaaaa gacaacctgc agctggaacg tgatgaacag aacctggaaa 120
aaatcatcgc gaacctgcgt gacgaaatcg cgcgtctcga aaacgaagtt gcgtctcacg 180
aacagtgata atgactcgag aaaatcagcc tcgactgtg 219

Claims (28)

1.细胞,特别是哺乳动物细胞,更特别是人细胞,其中所述细胞包含
-第一核酸序列,其编码融合至组氨酸激酶第一变体的N-末端的第一多肽,所述组氨酸激酶包含DHp结构域和CA结构域,
-第二核酸序列,其编码融合至组氨酸激酶第二变体N-末端的第二多肽,所述组氨酸激酶包含DHp结构域和CA结构域,和
-第三核酸序列,其编码可由所述第一或所述第二变体的所述DHp结构域特异性磷酸化的应答调节蛋白。
2.根据权利要求1所述的细胞,其中所述第一变体和/或所述第二变体不包含所述组氨酸激酶的跨膜结构域。
3.根据权利要求1或2所述的细胞,其中
-所述第一变体不包含所述组氨酸激酶的功能性传递器结构域和/或功能性传感器结构域,和/或
-所述第二变体不包含所述组氨酸激酶的功能性传递器结构域和/或功能性传感器结构域。
4.根据前述权利要求任一项的细胞,其中所述应答调节蛋白包含与效应器结构域融合的受体结构域,其中所述受体结构域可被所述第一或所述第二变体的所述DHp结构域磷酸化,并且所述效应器结构域可被磷酸化的受体结构域激活或抑制。
5.根据前述权利要求中任一项的细胞,其中
-所述效应器结构域是转录激活结构域,
-所述细胞包含第四核酸,其包含在可被所述转录激活结构域识别的诱导型启动子控制下的目的基因,
其中在所述转录激活结构域激活后,诱导所述目的基因的表达。
6.根据权利要求5的细胞,其中所述目的基因编码目的蛋白或目的RNA,其中特别地所述目的蛋白是发光蛋白。
7.根据前述权利要求中任一项的细胞,其中
-所述第一和第二变体是EnvZ激酶的变体,所述应答调节蛋白包含或a是OmpR应答调节蛋白,或
-所述第一变体和所述第二变体是NarX激酶的变体,所述受体结构域包含或a是NarL应答调节蛋白(SEQ ID 6),并且所述效应器结构域是或包含VP16转录激活结构域(Vp48,SEQID 7)。
8.根据前述权利要求中任一项的细胞,其中所述第一或所述第二变体是或包含选自EnvZ180-450(SEQ ID 8)、EnvZ223-450(SEQ ID 9)、NarX176-598(SEQ ID 10)和NarX379-598(SEQ ID11)的变体。
9.根据权利要求5至8中任一项所述的细胞,其中所述诱导型启动子选自OmpR启动子(SEQ ID NO 1)和NarL-RE(SEQ ID NO 2)。
10.根据前述权利要求中任一项所述的细胞,其中所述第一核酸序列和/或所述第二核酸序列和/或所述第三核酸序列针对所述细胞的密码子使用进行优化。
11.根据前述权利要求中任一项所述的细胞,其中所述第一核酸序列和/或所述第二核酸序列和/或所述第三核酸序列在组成型启动子的转录控制下。
12.根据权利要求11的细胞,其中所述组成型启动子选自CMV(SEQ ID NO3)、EF1α(SEQID NO 4)和EF1α-V1(SEQ ID NO 5)。
13.根据前述权利要求中任一项的细胞,其中所述第一变体和所述第二变体是相同的。
14.根据前述权利要求中任一项的细胞,其中所述组氨酸激酶属于转磷酸化家族。
15.根据前述权利要求中任一项的细胞,其中
-所述第一变体包含DHp结构域,其不包含所述组氨酸激酶的第一或所述第二变体的所述CA结构域可接近的组氨酸残基,和/或
-所述第二变体包含不能结合ATP的CA结构域。
16.根据前述权利要求中任一项的细胞,其中
-所述第一变体是或包含变体NarX379-598(H399Q)(SEQ ID NO 12)或NarX176-598(H399Q),和/或
-所述第二变体是或包含变体NarX379-598(N509A)(SEQ ID NO 13)或NarX176-598(N509A)。
17.根据前述权利要求中任一项的细胞,其中所述第一多肽和所述第二多肽的特异性结合可由所述第一和/或所述第二多肽特异性识别的配体触发。
18.根据权利要求17的细胞,其中所述第一多肽是受体或包含受体,所述第二多肽是所述受体的结合配偶体或包含所述受体的结合配偶体,其中所述受体和所述结合配偶体的结合可由所述受体可识别的所述配体触发。
19.根据权利要求18的细胞,其中所述受体是跨膜受体,所述结合配偶体是胞质蛋白。
20.根据前述权利要求中任一项的细胞,其中
-所述第一多肽由G蛋白偶联受体组成或包含G蛋白偶联受体,所述第二多肽由所述G蛋白偶联受体的胞质配体组成或包含G蛋白偶联受体的胞质配体,特别是β-抑制蛋白,或
-所述第一种多肽由T细胞受体组成或包含T细胞受体,所述第二种多肽是ZAP-70或包含ZAP-70。
21.根据权利要求5至20中任一项所述的细胞,其中所述目的基因编码影响细胞功能或相互作用状态的免疫蛋白,特别是细胞因子或抗体,或microRNA。
22.根据前述权利要求中任一项所述的细胞,其中所述细胞是哺乳动物细胞,特别是人细胞。
23.一种用于评估蛋白质-蛋白质相互作用的方法,其中所述方法包括以下步骤:
-提供根据权利要求1至22中任一项所述的细胞,所述细胞包含,
·第一核酸序列,其编码融合至组氨酸激酶第一变体的N-末端的第一多肽,所述组氨酸激酶包含DHp结构域和CA结构域,
·第二核酸序列,其编码融合至组氨酸激酶第二变体N-末端的第二多肽,所述组氨酸激酶包含DHp结构域和CA结构域,和
·第三核酸序列,其编码可被所述第一或所述第二变体的所述DHp结构域特异性磷酸化的应答调节蛋白,和
-测定所述应答调节蛋白的活性,
其中
在所述第一多肽和所述第二多肽特异性结合后,所述第一和第二变体二聚化,使得所述第一或第二变体的所述CA结构域磷酸化所述第一或第二变体的所述DHp结构域,并且所述应答调节蛋白的活性通过所述第一和/或所述第二变体的所述DHp结构域的磷酸化而调节,特别是活化或抑制。
24.一种评估化合物对蛋白质-蛋白质相互作用的影响的方法,其中所述方法包括以下步骤
-提供根据权利要求1至22中任一项所述的细胞,所述细胞包含,
·第一核酸序列,其编码融合至组氨酸激酶第一变体的N-末端的第一多肽,所述组氨酸激酶包含DHp结构域和CA结构域,
·第二核酸序列,其编码融合至组氨酸激酶第二变体N-末端的第二多肽,所述组氨酸激酶包含DHp结构域和CA结构域,和
·第三核酸序列,其编码可被所述第一或所述第二变体的所述DHp结构域特异性磷酸化的应答调节蛋白,和
-将所述细胞与化合物接触,和
-测定所述应答调节蛋白的活性,
其中
在所述第一多肽和所述第二多肽特异性结合后,所述第一和第二变体二聚化,使得所述第一或第二变体的所述CA结构域磷酸化所述第一或第二变体的所述DHp结构域,并且所述应答调节蛋白的活性通过所述第一和/或所述第二变体的所述DHp结构域的磷酸化而调节,特别是激活或抑制,和
所述化合物对所述第一多肽和所述第二多肽的所述特异性结合的影响由所述应答调节蛋白的所述活性决定。
25.一种用于响应于刺激物而引起期望应答的方法,其中所述方法包括以下步骤:
-提供根据权利要求1至22中任一项所述的细胞,所述细胞包含,
·第一核酸序列,其编码融合至组氨酸激酶第一变体的N-末端的第一多肽,所述组氨酸激酶包含DHp结构域和CA结构域,
·第二核酸序列,其编码融合至组氨酸激酶第二变体的N-末端的第二多肽的,所述组氨酸激酶包含DHp结构域和CA结构域,
其中所述第一和第二多肽的特异性结合是由所述刺激物触发的,和
·第三核酸序列,其编码可由所述第一或所述第二变体的所述DHp结构域特异性磷酸化的应答调节蛋白,
其中在所述第一多肽和所述第二多肽特异性结合时,所述第一和第二变体二聚化,使得所述第一或第二变体的所述CA结构域磷酸化所述第一或第二变体的所述DHp结构域,并且所述应答调节蛋白的活性通过所述第一和/或第二变体的所述DHp结构域的磷酸化而调节
-将细胞暴露于刺激物,其中所需应答由应答调节蛋白的活性介导或是应答调节蛋白的活性。
26.根据权利要求23至25中任一项所述的方法,其中
-所述应答调节蛋白包含与效应器结构域融合的受体结构域,其中所述受体结构域可被所述第一或所述第二变体的所述DHp结构域磷酸化,并且所述效应器结构域可被磷酸化的受体结构域激活;
-所述效应器结构域是转录激活结构域,
-所述细胞还包含编码目的基因的第四核酸序列,所述目的基因在可被所述转录激活结构域识别的诱导型启动子的控制下,
其中在所述转录激活结构域激活后,诱导所述目的基因的表达。
27.根据权利要求26所述的方法,其中
-所述目的基因表达产物的存在被确定为所述应答调节蛋白的活性,或
-所述目的基因的表达产物是或介导所述期望的应答。
28.一种载体,特别适用于转染或转导哺乳动物细胞,特别是人细胞,所述载体包含:
-如权利要求1-22中任一项所述的第一核酸序列,
-如权利要求1-22中任一项所述的第二核酸序列,
-如权利要求1-22中任一项所述的第三核酸序列,和
-任选地,权利要求5-22中任一项所述的第四核酸序列。
CN201980067865.0A 2018-10-15 2019-10-15 用于转导蛋白质-蛋白质相互作用的新方法 Pending CN112867791A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP18200357 2018-10-15
EP18200357.4 2018-10-15
PCT/EP2019/077962 WO2020078996A1 (en) 2018-10-15 2019-10-15 Novel method for transducing protein-protein interactions

Publications (1)

Publication Number Publication Date
CN112867791A true CN112867791A (zh) 2021-05-28

Family

ID=63857796

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980067865.0A Pending CN112867791A (zh) 2018-10-15 2019-10-15 用于转导蛋白质-蛋白质相互作用的新方法

Country Status (8)

Country Link
US (1) US20210340526A1 (zh)
EP (1) EP3867360A1 (zh)
JP (1) JP2022513352A (zh)
KR (1) KR20210080408A (zh)
CN (1) CN112867791A (zh)
AU (1) AU2019361227A1 (zh)
CA (1) CA3116236A1 (zh)
WO (1) WO2020078996A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220169831A (ko) 2021-06-21 2022-12-28 주식회사 엘지에너지솔루션 가스 배출 경로를 개선한 배터리 팩

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008157572A2 (en) * 2007-06-19 2008-12-24 Emory University A method of treating abnormal angiogenesis via the bai family of proteins and their protein fragments
CN101557818A (zh) * 2006-10-03 2009-10-14 新泽西医科和牙科大学 Atap肽、编码atap肽的核酸以及相关的应用方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015063522A (ja) * 2013-08-30 2015-04-09 国立大学法人東北大学 Ebd及びhkd含有融合ペプチド及び当該ペプチドを発現する形質転換体
WO2016201106A1 (en) * 2015-06-09 2016-12-15 Massachusetts Institute Of Technology Synthetic hybrid receptor and genetic circuit in bacteria to detect enteric pathogenic microorganisms
GB201702165D0 (en) * 2017-02-09 2017-03-29 Univ Of Portsmouth Higher Education Corp Screening method and kit to detect receptor activation

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101557818A (zh) * 2006-10-03 2009-10-14 新泽西医科和牙科大学 Atap肽、编码atap肽的核酸以及相关的应用方法
WO2008157572A2 (en) * 2007-06-19 2008-12-24 Emory University A method of treating abnormal angiogenesis via the bai family of proteins and their protein fragments

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陈新国, 季青, 艾秀莲, 郭三堆, 石玉瑚: "牛促卵泡激素基因克隆筛选和序列分析", 西北农业学报, no. 01 *

Also Published As

Publication number Publication date
JP2022513352A (ja) 2022-02-07
KR20210080408A (ko) 2021-06-30
WO2020078996A1 (en) 2020-04-23
CA3116236A1 (en) 2020-04-23
EP3867360A1 (en) 2021-08-25
US20210340526A1 (en) 2021-11-04
AU2019361227A1 (en) 2021-04-01

Similar Documents

Publication Publication Date Title
EP0371820B1 (en) Novel receptors: their identification, characterization, preparation and use
CA2285426C (en) Detection of molecular interactions by reporter subunit complementation
US7598352B2 (en) Method of identifying polypeptide monobodies which bind to target proteins and use thereof
US20140234851A1 (en) Modular extracellular sensor architecture for cell-based biosensors
US5262300A (en) Receptors: their identification, characterization, preparation and use
Sawma et al. Evidence for new homotypic and heterotypic interactions between transmembrane helices of proteins involved in receptor tyrosine kinase and neuropilin signaling
US11053300B2 (en) Membrane span-kinase fusion protein and the uses thereof
Rossi et al. [15] Monitoring protein-protein interactions in live mammalian cells by, 8-galactosidase complementation
DK2681319T3 (en) CHINESE SUBSTRATE SENSOR
CN112867791A (zh) 用于转导蛋白质-蛋白质相互作用的新方法
WO2010066113A1 (zh) 拆分荧光蛋白的融合蛋白组合、其表达载体,稳定表达哺乳动物细胞系及筛选方法
US8148110B2 (en) Detection of molecular interactions by β-lactamase reporter fragment complementation
JP2003513670A (ja) ジフテリア毒素構築体を用いるスクリーニングのための方法および組成物
CN114591987A (zh) 一种用于检测活细胞中mTORC1活性的遗传编码荧光生物传感器及其构建方法
EP1893627A1 (en) Multiplex array useful for assaying protein-protein interaction
WO2003058197A2 (en) Detection of molecular interactions by beta-lactamase reporter fragment complementation
US11860166B2 (en) Red fluorescent protein-based biosensor for measuring activity of dopamine receptor D1
CN108191979B (zh) 一种荧光互补检测人趋化因子生物学活性的方法
WO2016038750A1 (ja) 分割型組換えルシフェラーゼ及びそれを用いた解析方法
NO330269B1 (no) Peptid, DNA, vektor, celle, fremgangsmate for undersokelse av hvorvidt et peptid som kodes for av et cDNA som skal testes inneholder sekretorisk evne, samt fremgangsmate for isolering av et cDNA som koder for et peptid med sekretorisk evne
US6420529B1 (en) Genetic selection method for identifying ligands for transmembrane proteins
WO2023220392A1 (en) Synthetic modular extracellular sensors that employ natural receptor ligand-binding domains
WO2000061745A1 (fr) Procede de criblage de ligand de proteine gr et procede d&#39;expression du clonage de la proteine gr
JP2000354500A (ja) G蛋白質共役型受容体リガンドのスクリーニング法並びにg蛋白質共役型受容体のエクスプレッションクローニング法
JP2001521619A (ja) レポーターサブユニット相補による分子相互作用の検出

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination