CN110191953A - 通过接近增强的反应性实现分裂蛋白模板组装的方法 - Google Patents

通过接近增强的反应性实现分裂蛋白模板组装的方法 Download PDF

Info

Publication number
CN110191953A
CN110191953A CN201780084045.3A CN201780084045A CN110191953A CN 110191953 A CN110191953 A CN 110191953A CN 201780084045 A CN201780084045 A CN 201780084045A CN 110191953 A CN110191953 A CN 110191953A
Authority
CN
China
Prior art keywords
terminal
stem
polynucleotides
monoploid
protein fragments
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201780084045.3A
Other languages
English (en)
Inventor
伊恩·邓恩
马修·劳勒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tribiotica LLC
Original Assignee
Tribiotica LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tribiotica LLC filed Critical Tribiotica LLC
Publication of CN110191953A publication Critical patent/CN110191953A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1055Protein x Protein interaction, e.g. two hybrid selection
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/04Antibacterial agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • A61P35/02Antineoplastic agents specific for leukemia
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • A61P37/02Immunomodulators
    • A61P37/04Immunostimulants
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D257/00Heterocyclic compounds containing rings having four nitrogen atoms as the only ring hetero atoms
    • C07D257/02Heterocyclic compounds containing rings having four nitrogen atoms as the only ring hetero atoms not condensed with other rings
    • C07D257/08Six-membered rings
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1068Template (nucleic acid) mediated chemical library synthesis, e.g. chemical and enzymatical DNA-templated organic molecule synthesis, libraries prepared by non ribosomal polypeptide synthesis [NRPS], DNA/RNA-polymerase mediated polypeptide synthesis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1086Preparation or screening of expression libraries, e.g. reporter assays
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/35Nature of the modification
    • C12N2310/351Conjugate
    • C12N2310/3513Protein; Peptide
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/50Physical structure
    • C12N2310/53Physical structure partially self-complementary or closed
    • C12N2310/531Stem-loop; Hairpin

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • General Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Immunology (AREA)
  • Oncology (AREA)
  • Communicable Diseases (AREA)
  • Virology (AREA)
  • Hematology (AREA)
  • Peptides Or Proteins (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Medicinal Preparation (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

本公开提供了在用于较大蛋白质的蛋白质片段的辅助折叠的方法中使用的化合物、组合物和试剂盒,所述方法通过由靶核酸分子与附连于目标蛋白质片段的互补核酸分子之间的特异性核酸杂交强制造成的诱导接近实现。

Description

通过接近增强的反应性实现分裂蛋白模板组装的方法
技术领域
本公开部分涉及在用于较大蛋白质的蛋白质片段的辅助折叠的方法中使用的化合物、组合物和试剂盒,所述方法通过由靶核酸分子与附连于目标蛋白质片段的互补核酸分子之间的特异性核酸杂交强制造成的诱导接近实现。
背景技术
药物开发的目标是向致病细胞,如病毒感染的细胞、赘生性细胞、产生自身免疫应答的细胞以及其他失调或功能障碍细胞递送有效的生物治疗干预。能够对抗致病细胞的有效生物治疗干预的实例包括毒素、促凋亡剂以及重新导向免疫细胞以消除致病细胞的免疫治疗方法。遗憾的是,由于对相邻正常细胞或患者的整体健康有高风险的毒性,这些药剂的开发非常困难。
已经出现的允许向致病细胞递送有效干预同时减轻对正常细胞的毒性的方法是通过将治疗剂导向对致病细胞具有特异性的分子标志物来实现所述治疗剂的靶向。靶向治疗剂已经在有限的病例中显示出非凡的临床结果,但由于缺乏靶向疗法的可接近标志物,目前在其可应用性上受到限制。发现许多致病细胞类型的蛋白质标志物是极其困难的,且常常是不可能的。
近年来,已经开发了靶向对致病细胞具有特异性的核酸靶标的疗法。现有的核酸靶向疗法(如siRNA)能够下调潜在危险基因的表达,但不递送有效的细胞毒性或细胞抑制性干预,因此在消除危险细胞本身方面不是特别有效。
因此,需要对抗现有生物治疗干预的不良功效和/或严重副作用。与其中预折叠亚基相互作用的其他形式的蛋白质互补(如β-半乳糖苷酶的α-互补)不同,本文所述的方法涉及特征在于通过强制的空间接近促进成熟折叠途径的分裂蛋白方法。因此,分离形式的分裂蛋白片段不可概括其相应亲本蛋白的功能特征谱,并且因此片段背景功能水平极低。
发明内容
本文大致描述了可借助来通过处于多种不同架构的核酸模板指导分裂蛋白重折叠的方法。具体地,细胞RNA或靶细胞内的任何可接近的核酸模板序列可以用于将目标蛋白质的特定多肽片段组装成功能性折叠形式。以此方式组装例如有效的核糖毒素可以用于靶向杀伤表达特定标志物的细胞,包括肿瘤细胞或异常免疫细胞。
本公开提供了包含多核苷酸的瓶形单倍体,所述多核苷酸包括:a)第一3’茎部,其包括约10至约20个核苷酸碱基;b)反靶环部分,其包括约16至约40个核苷酸碱基,与第一3’茎部连接,其中反靶环部分与靶核酸分子基本上互补;以及c)第二5’茎部,其包括约10至约20个核苷酸碱基,与反靶环部分连接,其中第一3’茎部与第二5’茎部基本上互补;其中多核苷酸的5’末端包含-SH部分;并且其中反靶环部分:靶核酸分子的Tm大于第一茎部:第二茎部的Tm
本公开还提供了包含多核苷酸的瓶形单倍体,所述多核苷酸包括:a)第一3’茎部,其包括约10至约20个核苷酸碱基;b)反靶环部分,其包括约16至约40个核苷酸碱基,与第一3’茎部连接,其中反靶环部分与靶核酸分子基本上互补;以及c)第二5’茎部,其包括约10至约20个核苷酸碱基,与反靶环部分连接,其中第一3’茎部与第二5’茎部基本上互补;其中反靶环部分:靶核酸分子的Tm大于第一茎部:第二茎部的Tm,并且其中多核苷酸的5’末端或3’末端与N末端蛋白质片段的C末端或C末端蛋白质片段的N末端连接,其中与多核苷酸连接的蛋白质片段的末端包含半胱氨酸或硒代半胱氨酸。
本公开还提供了单倍体,其包含:a)多核苷酸;以及b)N末端蛋白质片段或C末端蛋白质片段,其中多核苷酸的3’或5’末端与C末端蛋白质片段的N末端或N末端蛋白质片段的C末端连接;其中:i)N末端片段包含APIVTCRKLDGREKPFKVDVATAQAQARKAGLTTGKSGDPHRYFAGDHIRWGVNNCDKADAILWEYPIYWVGKNAEWAKDVKTSQQKG(SEQ ID NO:1)的氨基酸序列,并且C末端片段包含GPTPIRVVYANSRGAVQYCGVMTHSKVDKNNQGKEFFEKCD(SEQ ID NO:2)的氨基酸序列;ii)N末端片段包含APIVTCRPKLDG(SEQ ID NO:3)的氨基酸序列,并且C末端片段包含REKPFKVDVATAQAQARKAGLTTGKSGDPHRYFAGDHIRWGVNNCDKADAILWEYPIYWVGKNAEWAKDVKTSQQKGGPTPIRVVYANSRGAVQYCGVMTHSKVDKNNQGKEFFEKCD(SEQ ID NO:4)的氨基酸序列;iii)N末端片段包含APIVTCRPKLDGREKPFKVDVATAQAQARKAGLTTGK(SEQ ID NO:5)的氨基酸序列,并且C末端片段包含SGDPHRYFAGDHIRWGVNNCDKADAILWEYPIYWVGKNAEWAKDVKTSQQKGGPTPIRVVYANSRGAVQYCGVMTHSKVDKNNQGKEFFEKCD(SEQ ID NO:6)的氨基酸序列;iv)N末端片段包含APIVTCRPKLDGREKPFKVDVATAQAQARKAGLTTGKSGDPHRYFAGDHIRWGVNNCDKAD(SEQ ID NO:7)的氨基酸序列,并且C末端片段包含AILWEYPIYWVGKNAEWAKDVKTSQQKGGPTPIRVVYANSRGAVQYCGVMTHSKVDKNNQGKEFFEKCD(SEQ ID NO:8)的氨基酸序列;v)N末端片段包含APIVTCRPKLDGREKPFKVDVATAQAQARKAGLTTGKSGDPHRYFAGDHIRWGVNNCDKADAILWEYPIYWVG(SEQ ID NO:9)的氨基酸序列,并且C末端片段包含KNAEWAKDVKTSQQKGGPTPIRVVYANSRGAVQYCGVMTHSKVDKNNQGKEFFEKCD(SEQ ID NO:10)的氨基酸序列;vi)N末端片段包含APIVTCRPKLDGREKPFKVDVATAQAQARKAGLTTGKSGDPHRYFAGDHIRWGVNNCDKADAILWEYPIYWVGKNAEWAKD(SEQ ID NO:11)的氨基酸序列,并且C末端片段包含VKTSQQKGGPTPIRVVYANSRGAVQYCGVMTHSKVDKNNQGKEFFEKCD(SEQ ID NO:12)的氨基酸序列;vii)N末端片段包含APIVTCRPKLDGREKPFKVDVATAQAQARKAGLTTGKSGDPHRYFAGDHIRWGVNNCDKADAILWEYPIYWVGKNAEWAKDVKTSQ(SEQ ID NO:13)的氨基酸序列,并且C末端片段包含QKGGPTPIRVVYANSRGAVQYCGVMTHSKVDKNNQGKEFFEKCD(SEQ ID NO:14)的氨基酸序列;viii)N末端片段包含APIVTCRPKLDGREKPFKVDVATAQAQARKAGLTTGKSGDPHRYFAGDHIRWGVNNCDKADAILWEYPIYWVGKNAEWAKDVKTSQQKGGPTPIRVVYANSRG(SEQ ID NO:15)的氨基酸序列,并且C末端片段包含AVQYCGVMTHSKVDKNNQGKEFFEKCD(SEQ ID NO:16)的氨基酸序列;ix)N末端片段包含APIVTCRPKLDGREKPFKVDVATAQAQARKAGLTTGKSGDPHRYFAGDHIRWGVNNCDKADAILWEYPIYWVGKNAEWAKDVKTSQQKGGPTPIRVVYANSRGAVQYCGVMTHSKVDKN(SEQ ID NO:17)的氨基酸序列,并且C末端片段包含NQGKEFFEKCD(SEQ ID NO:18)的氨基酸序列;或N末端片段包含APIVTCRPKLDGREKPFKVDVATAQAQARKAGLT(SEQ ID NO:40)的氨基酸序列,并且C末端片段包含TGKSGDPHRYFAGDHIRWGVNNCDKADAILWEYPIYWVGKNAEWAKDVKTSQQKGGPTPIRVVYANSRGAVQYCGVMTHSKVDKNNQGKEFFEKCD(SEQ ID NO:41)的氨基酸序列。
本公开还提供了表面靶标化合物,其包含:a)模板多核苷酸;以及b)肽;其中多核苷酸的5’末端与肽的N末端或C末端偶联,或多核苷酸的3’末端与肽的N末端或C末端偶联;并且其中肽是细胞表面分子的配体。
本公开还提供了融合蛋白,其包含:a)N末端蛋白质片段、融合配偶体蛋白和纯化结构域,其中N末端蛋白质片段的C末端与融合配偶体蛋白的N末端偶联,并且融合配偶体蛋白的C末端与纯化结构域的N末端偶联;或b)N末端蛋白质片段、融合配偶体蛋白和切割位点,其中融合配偶体蛋白的C末端与切割位点的N末端偶联,并且切割位点的C末端与N末端蛋白质片段的N末端偶联,其中N末端蛋白质片段包含N末端甲硫氨酸和C末端半胱氨酸;或c)C末端蛋白质片段、融合配偶体蛋白和切割位点,其中融合配偶体蛋白的C末端与切割位点的N末端偶联,并且切割位点的C末端与C末端蛋白质片段的N末端偶联,其中C末端蛋白质片段包含N末端半胱氨酸。
本公开还提供了具有下式的化合物:
其中n为约3至约6。
本公开还提供了组合物或试剂盒,其包含:a)第一单倍体,其中第一单倍体包含与N末端蛋白质片段的C末端连接的多核苷酸;以及b)第二单倍体,其中第二单倍体包含与C末端蛋白质片段的N末端连接的多核苷酸;其中第一或第二单倍体中的一个的多核苷酸在其5’末端与蛋白质片段连接,并且第一和第二单倍体中的另一个在其3’末端与蛋白质片段连接;其中N末端蛋白质片段和C末端蛋白质片段来源于单一蛋白质;并且其中:i)第一单倍体的多核苷酸与第二单倍体的多核苷酸互补;或ii)第一单倍体的多核苷酸与靶核酸分子互补,并且第二单倍体的多核苷酸在与第一单倍体的多核苷酸在空间上接近的位点处与靶核酸分子基本上互补;或iii)第一单倍体的多核苷酸与靶核酸分子5’相邻于茎环结构的部分基本上互补,并且第二单倍体的多核苷酸与靶核酸分子3’相邻于茎环结构的部分基本上互补;或iv)第一单倍体的多核苷酸与靶核酸分子的茎环结构的环的5’部分基本上互补,并且第二单倍体的多核苷酸与靶核酸分子的茎环结构的环的3’部分基本上互补。
本公开还提供了组合物或试剂盒,其包含:a)包含多核苷酸的瓶形单倍体,所述多核苷酸包括:i)第一3’茎部,其包括约10至约20个核苷酸碱基;ii)反靶环部分,其包括约16至约40个核苷酸碱基,与第一3’茎部连接,其中反靶环部分与靶核酸分子基本上互补;以及iii)第二5’茎部,其包括约10至约20个核苷酸碱基,与反靶环部分连接,其中第一3’茎部与第二5’茎部基本上互补;其中多核苷酸的5’末端包含-SH部分;其中反靶环部分:靶核酸分子的Tm大于第一茎部:第二茎部的Tm;b)N末端蛋白质片段,其中N末端蛋白质片段的C末端包含半胱氨酸-SH部分;以及c)双马来酰亚胺试剂。
本公开还提供了组合物或试剂盒,其包含:a)包含多核苷酸的瓶形单倍体,所述多核苷酸包括:i)第一3’茎部,其包括约10至约20个核苷酸碱基;ii)反靶环部分,其包括约16至约40个核苷酸碱基,与第一3’茎部连接,其中反靶环部分与靶核酸分子基本上互补;以及iii)第二5’茎部,其包含约10至约20个核苷酸碱基,与反靶环部分连接,其中第一3’茎部与第二5’茎部基本上互补;其中多核苷酸的5’末端与N末端蛋白质片段的C末端连接,其中C末端包含半胱氨酸;以及b)包含多核苷酸和C末端蛋白质片段的第二单倍体,其中多核苷酸的3’末端与C末端蛋白质片段的N末端连接,其中N末端包含半胱氨酸;其中第二单倍体的多核苷酸与瓶形单倍体的多核苷酸的第二5’茎部基本上互补;其中反靶环部分:靶核酸分子的Tm大于第一茎部:第二茎部的Tm;并且其中N末端蛋白质片段和C末端蛋白质片段来源于单一蛋白质。
本公开还提供了如上文和本文所阐述的单倍体、瓶形单倍体、融合蛋白以及试剂盒或组合物,其中N末端蛋白质片段和C末端蛋白质片段均来源于报告蛋白、转录因子、信号转导途径因子、基因编辑蛋白、单链免疫球蛋白可变区(scFv)蛋白、毒性蛋白或酶。
本公开还提供了用于蛋白质在细胞中的定向组装的方法,其包括:a)使细胞与第一单倍体接触,所述第一单倍体包含与N末端蛋白质片段的C末端连接的多核苷酸;以及b)使细胞与第二单倍体接触,所述第二单倍体包含与C末端蛋白质片段的N末端连接的多核苷酸;其中第一或第二单倍体中的一个的多核苷酸在其5’末端与蛋白质片段连接,并且第一和第二单倍体中的另一个在其3’末端与蛋白质片段连接;其中N末端蛋白质片段和C末端蛋白质片段来源于单一蛋白质;并且其中:i)第一单倍体的多核苷酸与第二单倍体的多核苷酸基本上互补;或ii)第一单倍体的多核苷酸与靶核酸分子基本上互补,并且第二单倍体的多核苷酸在与第一单倍体的多核苷酸在空间上接近的位点处与靶核酸分子基本上互补;或iii)第一单倍体的多核苷酸与靶核酸分子5’相邻于茎环结构的部分基本上互补,并且第二单倍体的多核苷酸与靶核酸分子3’相邻于茎环结构的部分基本上互补;或iv)第一单倍体的多核苷酸与靶核酸分子的茎环结构的环的5’部分基本上互补,并且第二单倍体的多核苷酸与靶核酸分子的茎环结构的环的3’部分基本上互补;从而导致由N末端蛋白质片段和C末端蛋白质片段组装蛋白质。
本公开还提供了用于蛋白质的定向组装的方法,其包括:a)使靶核酸分子与瓶形单倍体接触,所述瓶形单倍体包含:i)第一3’茎部,其包括约10至约20个核苷酸碱基;ii)反靶环部分,其包括约16至约40个核苷酸碱基,与第一3’茎部连接,其中反靶环部分与靶核酸分子基本上互补;以及iii)第二5’茎部,其包括约10至约20个核苷酸碱基,与反靶环部分连接,其中第一3’茎部与第二5’茎部基本上互补;其中多核苷酸的5’末端与N末端蛋白质片段的C末端连接,其中C末端包含半胱氨酸;c)使瓶形单倍体与第二单倍体接触,所述第二单倍体包含与C末端蛋白质片段的N末端连接的多核苷酸,其中第二单倍体的多核苷酸与瓶形单倍体的多核苷酸的第二5’茎部基本上互补;其中N末端蛋白质片段和C末端蛋白质片段来源于单一蛋白质;其中反靶环部分:靶核酸分子的Tm大于第一茎部:第二茎部的Tm;并且其中从第一茎部:第二茎部的Tm中减去由第二单倍体和瓶形单倍体的第二茎部形成的双链体的Tm为约0℃至约20℃;从而导致由N末端蛋白质片段和C末端蛋白质片段组装蛋白质。
本公开还提供了用于蛋白质的定向组装的方法,其包括:a)使细胞与表面靶标化合物接触,所述表面靶标化合物包含:i)模板多核苷酸;以及ii)肽;其中多核苷酸的5’末端与肽的N末端或C末端偶联,或多核苷酸的3’末端与肽的N末端或C末端偶联;其中肽是细胞表面分子的配体;b)使细胞与第一单倍体接触,所述第一单倍体包含与N末端蛋白质片段的C末端连接的多核苷酸;以及c)使细胞与第二单倍体接触,所述第二单倍体包含与C末端蛋白质片段的N末端连接的多核苷酸;其中第一或第二单倍体中的一个的多核苷酸在其5’末端与蛋白质片段连接,并且第一和第二单倍体中的另一个在其3’末端与蛋白质片段连接;其中N末端蛋白质片段和C末端蛋白质片段来源于单一蛋白质;并且其中第一单倍体的多核苷酸与表面靶标化合物的模板多核苷酸基本上互补,并且第二单倍体的多核苷酸在与第一单倍体的多核苷酸在空间上接近的位点处与表面靶标化合物的模板多核苷酸基本上互补;从而导致由N末端蛋白质片段和C末端蛋白质片段组装蛋白质。
本公开还提供了用于蛋白质的定向组装的方法,其包括:a)使细胞与表面靶标化合物接触,所述表面靶标化合物包含:i)模板多核苷酸;以及ii)肽;其中多核苷酸的5’末端与肽的N末端或C末端偶联,或多核苷酸的3’末端与肽的N末端或C末端偶联;其中肽是细胞表面分子的配体;b)使靶核酸分子与瓶形单倍体接触,所述瓶形单倍体包含:i)第一3’茎部,其包括约10至约20个核苷酸碱基;ii)反靶环部分,其包括约16至约40个核苷酸碱基,与第一3’茎部连接,其中反靶环部分与表面靶标化合物的模板多核苷酸基本上互补;以及iii)第二5’茎部,其包括约10至约20个核苷酸碱基,与反靶环部分连接,其中第一3’茎部与第二5’茎部基本上互补;其中多核苷酸的5’末端与N末端蛋白质片段的C末端连接,其中C末端包含半胱氨酸;c)使瓶形单倍体与第二单倍体接触,所述第二单倍体包含与C末端蛋白质片段的N末端连接的多核苷酸,其中第二单倍体的多核苷酸与瓶形单倍体的多核苷酸的的第二5’茎部基本上互补;其中N末端蛋白质片段和C末端蛋白质片段来源于单一蛋白质;其中反靶环部分:靶核酸分子的Tm大于第一茎部:第二茎部的Tm;并且其中从第一茎部:第二茎部的Tm中减去由第二单倍体和瓶形单倍体的第二茎部形成的双链体的Tm为约0℃至约20℃;从而导致由N末端蛋白质片段和C末端蛋白质片段组装蛋白质。
本公开还提供了从融合蛋白中的内含肽融合配偶体中切割N末端蛋白质片段的方法,其包括:a)使融合蛋白与2-巯基乙烷磺酸接触;以及b)使融合蛋白与具有甲基四嗪基团的半胱氨酸接触;从而从融合蛋白中释放N末端蛋白质片段。
附图说明
图1示出用于蛋白质片段的蛋白质互补测定(PCA)/分裂蛋白技术的示意图。
图2示出用于蛋白质片段融合体的表达和共折叠的蛋白质互补测定(PCA)/分裂蛋白技术的示意图。
图3示出多肽-核酸缀合的第一取向(小图A)和第二取向(小图B)的通过接近增强的反应性实现的分裂蛋白模板组装(SP-TAPER)的代表性示意图。
图4示出用于SP-TAPER的代表性第一架构,其中附连核酸标签是自我互补的。
图5示出用于SP-TAPER的代表性第二架构,其中附连核酸标签不是自我互补的,而是在线性靶核酸模板上并置杂交。
图6示出用于SP-TAPER的代表性第三架构,其中模板介导的多肽片段并置由茎环结构指导。
图7示出用于SP-TAPER的代表性第四架构,其中模板介导的多肽片段并置由环结构内的杂交位点的“外型”构型指导。
图8示出用于SP-TAPER的锁定TAPER寡核苷酸的代表性结构。
图9示出与锁定TAPER方法一致的SP-TAPER的代表性示意图。
图10示出多毛菌素A(Hirsutellin A)结构和氨基酸序列(SEQ ID NO:50)以及代表性候选片段序列(例如,SEQ ID NO:51和SEQ ID NO:41;以及SEQ ID NO:52和SEQ ID NO:2),其示出用于分裂蛋白测定的两个代表性切割位点(例如,二苏氨酸SP位点和二甘氨酸SP位点)。
图11示出代表性超折叠GFP(sfGFP)相对于海肾N末端片段。
图12示出用于SP-TAPER-内含肽融合体切割的代表性sfGFP N末端片段(约17kD)。
图13示出麦芽糖结合蛋白系统中的代表性sfGFP和海肾C末端片段、肠激酶切割位点(SEQ ID NO:44)和肠激酶片段切割。
图14示出麦芽糖结合蛋白系统中的代表性sfGFP和海肾N末端片段以及肠激酶切割位点(SEQ ID NO:44)。
图15示出麦芽糖结合蛋白系统中sfGFP N末端片段的代表性肠激酶切割。
图16示出在用三(2-羧乙基)膦(TCEP)处理且随后与1,8-双(马来酰亚胺基)二乙二醇(BMP2)反应之后,具有5’-二硫化物基团的代表性寡核苷酸(SEQ ID NO:45)的分析。
图17示出α-黑素细胞刺激激素(MSH)的衍生物(SEQ ID NO:21)在表达具有代表性模板化序列(SEQ ID NO:20)的MC1R的靶细胞中生成表面模板的代表性使用。
图18示出多毛菌素A区段(SEQ ID NO:25和SEQ ID NO:26)和肠激酶切割位点(SEQID NO:44)的代表性结构,其在89-90二甘氨酸处断裂且在MBP系统中表达为融合蛋白。
图19示出用于SP-TAPER的寡核苷酸的代表性偶联,这通过用螯合剂共价修饰核酸5’或3’末端,以使寡核苷酸能够与六组氨酸分裂蛋白片段融合体结合来实现。
图20示出借助固相链霉抗生物素蛋白制备物通过具有四组氨酸序列(生物素-GSGSGHHHH;SEQ ID NO:19)的生物素化寡核苷酸从与六组氨酸形成复合物的反应中除去过量NTA::Ni寡核苷酸的代表性示意图。
图21(小图A和B)示出用于制备三串联NTA-修饰寡核苷酸的代表性方法,以及锁定TAPER寡核苷酸上的产物形成的展示。
图22示出用于纯化His结合的三串联NTA锁定TAPER oligo的代表性功能策略。
图23示出作为六组氨酸融合体的sfGFP片段(SEQ ID NO:53和SEQ ID NO:54)的表达。
图24示出利用sfGFP-六组氨酸锁定TAPER oligo-NTA-Ni缀合物的SP-TAPER。
图25示出利用sfGFP片段的SP-TAPER。
具体实施方式
现在将描述某些示例性实施方案以便在总体上理解本文所公开的组合物和方法的结构原理、功能、制造和用途。这些实施方案的一个或多个实例在附图中示出。本领域技术人员应当理解本文中具体描述并在附图中示出的组合物和方法均为非限制的示例性实施方案,并且本公开的范围仅由权利要求书限定。结合一个示例性实施方案进行图解说明或描述的特征可与其他实施方案的特征进行组合。此类修改和变型旨在被包括在本公开的范围内。
除非内容另外明确指出,如本文所用,单数形式“一个”、“一种”和“所述”包括多个指代物。本公开使用的术语遵循本领域普通技术人员通常接受的标准定义。在可能需要任何进一步解释的情况下,下文进一步阐明了一些术语。
如本文所用,短语“反靶环部分”是指有利于与靶核酸分子的序列特异性结合的瓶形单倍体的部分。
如本文所用,术语“碱基”是指含有嘌呤或嘧啶基团的分子或人工类似物,其通过Watson-Crick或Hoogsteen键合相互作用与另一相应碱基形成结合对。碱基还含有有利于聚合物如寡聚物中的多个碱基共价连接在一起的基团。非限制性实例包括核苷酸、核苷、肽核酸残基或吗啉代残基。
如本文所用,术语“结合(bind、binds、binding和bound)”是指彼此靠近的两个分子之间的稳定相互作用。所述术语包括物理相互作用,如化学键(直接连接或通过中间结构连接),以及非物理相互作用和吸引力,如静电吸引、氢键和范德华力/分散力。
如本文所用,短语“生物缀合化学”是指在温和条件下将常见官能团连接在一起,有利于多部分化合物的模块化构建的化学合成策略和试剂。
如本文所用,短语“化学接头”或“接头”是指将一个单倍体与另一个单倍体或一个部分与不同化合物上的另一个部分结合的分子。接头可由支链或非支链的共价键合的分子链构成。
如本文所用,短语“剂量单位形式”是指适合作为待治疗受试者的单一剂量的物理上离散的单位。
如本文所用,术语“单倍体(haplomer)”是指与蛋白质的片段连接的核酸分子,其以序列特异性方式结合靶核酸分子模板并在核酸模板化组装期间参与蛋白质形成。本文还包括“衍生物”或“类似物”,如其盐、水合物、溶剂化物,或已经进行化学修饰并保持相同的生物活性或生物活性缺乏、和/或用作单倍体或以与单倍体一致的方式起作用的能力的其他分子。
如本文所用,短语“非无痕生物正交化学(non-traceless bio-orthogonalchemistry)”是指涉及选择性反应性部分的反应,其中选择性反应性部分的部分或全部结构保留在产物结构中。
如本文所用,短语“核酸模板化组装”是指蛋白质在靶核酸分子上产生,使得可以通过在与靶核酸分子结合时接近的正在组装的单倍体促进蛋白质形成。
如本文所用,术语“低聚物”和“oligo”是指由多个单元组成的分子,其中一些或所有单元是能够形成Watson-Crick或Hoogsteen碱基配对相互作用的碱基,从而允许与双链体或多链体结构中的核酸分子的序列特异性结合。非限制性实例包括但不限于寡核苷酸、肽核酸低聚物和吗啉代低聚物。
如本文所用,短语“致病细胞”可以指能够导致或促进患病或异常状况的细胞,如感染病毒的细胞、肿瘤细胞以及感染微生物的细胞,或产生诱导或介导疾病的分子的细胞,所述疾病包括但不限于过敏症、过敏反应、炎症和自身免疫。
如本文所用,短语“药学上可接受的”是指材料不是生物学上或其他方面不可接受的,可以掺入组合物中并施用于患者而不引起不可接受的生物学效应或以不可接受的方式与组合物的其他组分相互作用。
如本文所用,短语“药学上可接受的盐”意指由可接受施用于患者如哺乳动物的碱或酸制备的盐(例如,对于给定的剂量方案具有可接受的哺乳动物安全性的盐)。
如本文所用,术语“盐”可以包括衍生自药学上可接受的无机酸和碱的盐以及衍生自药学上可接受的有机酸和碱的盐以及其衍生物和变体。
如本文所用,术语“样品”是指在可能发生核酸模板化组装时可向其中施用单倍体的任何体系。样品的实例包括但不限于固定或保藏细胞、整个生物体、组织、肿瘤、裂解物或体外测定系统。
如本文所用,短语“一组相应的反应物”或“相应的单倍体”是指聚集在单个靶核酸分子上以参与模板化组装反应的单倍体。
如本文所用,短语“靶区室”是指含有一种或多种靶核酸分子,或与非靶区室不同量的靶核酸分子的细胞、病毒、组织、肿瘤、裂解物、其他生物结构、空间区域或样品。
如本文所用,短语“靶核酸序列”和“靶核酸分子”可互换使用并且是指旨在充当核酸模板化组装的模板的单元或核酸的序列。
如本文所用,短语“模板化组装产物”是指通过与单倍体缔合的特定蛋白质的两个片段形成的蛋白质。
如本文所用,短语“无痕生物正交化学”是指涉及单倍体的反应,其中通过从由此产生的结构中消除部分或全部生物正交部分而形成天然存在的键,如酰胺。
对指定的目标细胞具有特异性的核酸分子(无论这些是由病理性肿瘤细胞、异常免疫细胞还是任何其他细胞类型代表)可以用作通过分子相互作用的接近性诱导的增强实现新结构(例如,效应子结构)的生成的模板(参见,例如,PCT公布WO 2014/197547)。此类模板化产物可以被设计以便以各种方式触发细胞死亡,或调节细胞活性。细胞类型特异性核酸可以来源于特异性转录的mRNA,或通过可以用于使非核酸靶标适应于提供限定的模板序列的核酸适体产生。
在用于上述诊断或治疗目的的模板化组装的初始过程中,借助反应性基团与预定序列的寡核苷酸的连接而使所述反应性基团在空间上接近,所述预定序列的寡核苷酸自身在靶核酸分子模板上接近共杂交。携带相互反应的基团的模板导向的修饰寡核苷酸被称为“单倍体”。反应性基团的这种强制接近大大增强了产物形成,并且因此细胞类型特异性转录物可以指导目标细胞中期望分子的产生。如本文所述,通过将特异性配体附连至每个单倍体寡核苷酸而不是直接相互作用的官能团,可以将TAPER的一般原理改变为两级过程。因此,在TAPER的原始配置(本文称为“常规TAPER”)中,该过程可以表示为在单个反应工序内发生,其中模板可以在功能上视为特定催化剂:
其中H1和H2分别代表携带反应性基团A和B的单倍体。在与特定模板杂交时,形成A与B之间的接近性驱动的反应中间体[A:B],从而迅速导致产物[P]的形成。
在一些实施方案中,被称为“锁定TAPER”的TAPER的变型容易地适用于SP-TAPER。对于锁定SP-TAPER,第一瓶形单倍体和第二单倍体如本文所描述的那样相互作用。根据锁定TAPER过程的性质,第二单倍体-蛋白质片段缀合物的杂交位点是不可接近的,除了在特定靶标的存在下,其中与第一瓶形单倍体的反靶环部分发生杂交。随后,使第二单倍体-蛋白质片段缀合物的杂交位点可接近,并且继而实现接近促进的组装。
SP-TAPER过程及其组分通常可以通过以下一般表示来描述。
许多蛋白质可以分成两个单独的多肽片段,所述片段在分离时是无序的,但是当在空间上接近地以正确取向保持在一起时,可以经历准确的共折叠。这种空间强制折叠可以导致形成成熟蛋白质,包括其原始功能特性的重构。用于引起此类蛋白质片段之间的空间接近的一种手段是将每个所述蛋白质片段附连于独立折叠且相互作用的小蛋白质结构域,如亮氨酸拉链。该过程通常被称为蛋白质互补测定(PCA)或分裂蛋白技术,并且在图1和2中示意性地描绘。当蛋白质三维结构可获得时,可以合理地指导用于分裂目标蛋白质的一级氨基酸序列内的位点的特定选择。因此,可以在不损害一般蛋白质折叠或功能的情况下修饰的环或其他结构特征有利于分裂蛋白程序。目标蛋白质的N末端和C末端的空间取向也可以是重要的。例如,在N末端和C末端在成熟折叠蛋白质中空间接近地包装时(参见图1),在分裂蛋白互补中这些末端的平行取向可能比反平行取向与所需的折叠途径更相容。然而,如果每个片段装配有长度足以允许空间定位的柔性接头序列,那么可减少或消除此类潜在约束。在不存在关于用于分裂蛋白分析的所选断裂点(fragmentation point)的实用性的其他信息时,可以通过将片段单独表达为具有自折叠和相互作用的蛋白质结构域的适当融合体,并且在片段体外混合时测试功能活性的重构,或在细胞内共表达融合产物来根据经验对该系统进行测试。作为一种所述布置的实例,呈现为两个片段A和B的蛋白质被工程化以单独表达为A-(C末端)-Jun和Fos-(N末端)-B,其中Jun和Fos衍生自c-Jun和c-Fos相互作用的亮氨酸拉链,并且其中长的丝氨酸-甘氨酸接头将Jun/Fos区段与期望多肽分开。
如本文所述,已经显示,出于在分裂蛋白片段之间产生空间接近以进行功能重构的目的,核酸杂交可以取代相互作用的蛋白质结构域。蛋白质片段已经以合适的取向与互补寡核苷酸缀合,以用于诊断、成像和治疗目的。
使用核酸模板强制实现分子接近和伴随的双分子反应已经在治疗或诊断背景中应用于肽或其他小分子的组装(称为TAPER过程,其中参与的修饰核酸被称为单倍体TM(参见PCT公布WO 14/197547)。尽管此过程的先前描述集中于小分子的组装,但是对所组装的分子种类的性质没有固有的尺寸限制。本发明实施方案使用TAPER和单倍体技术通过分裂蛋白方法实现多肽的定向组装。因此,此类应用被分类为TAPER过程的子集,并且统称为分裂蛋白TAPER或SP-TAPER。如先前所述的TAPER的使用在本文称为“常规TAPER”。用于SP-TAPER的与蛋白质片段缀合的寡核苷酸在本文称为“SP-单倍体”,通过常规TAPER的延伸获得。
为了使常规TAPER适合于SP-TAPER,将蛋白质片段与核酸单倍体偶联,由此单倍体实现两个蛋白质片段之间的杂交介导的分子接近。将这些单倍体附连至通过将所选蛋白质表达为两个单独的片段产生的新N末端或C末端(在本文中,这些新末端分别称为N*-和C*-)。寡核苷酸的5’或3’末端可以通过各种化学方法(小图A相对于小图B)附连至分裂蛋白片段的N*末端和C*末端(参见图3)。
在核酸缀合之前,将目标蛋白质片段在细菌系统中表达并纯化。在一些实施方案中,表达系统包括但不限于具有麦芽糖结合蛋白或六组氨酸标签的亲和融合体。在一些实施方案中,内含肽融合体被表达成使得在适当条件下体外切割掉期望蛋白质片段。
在一些实施方案中,单倍体与蛋白质片段之间的偶联通过桥接末端-SH基团介导。对于寡核苷酸,通过合成容易地产生5’或3’-SH基团,其中巯基通常在即将使用前通过用还原剂如二硫苏糖醇(DTT)或TCEP处理而由末端前体二硫化物产生。对于多肽,通过将末端半胱氨酸残基置于适当位点而最简单地产生N末端或C末端-SH基团。-SH标记的寡核苷酸的连接可以通过双官能马来酰亚胺试剂实现,包括但不限于1,8-双(马来酰亚胺基)二乙二醇和1,11-双(马来酰亚胺基)三乙二醇。目标多肽片段中内部半胱氨酸的存在是该方法的潜在障碍,但实际上已发现,相比于嵌入较长序列内的那些,末端半胱氨酸得到更有效的修饰。
在一些实施方案中,单倍体与蛋白质片段之间的偶联通过另选的化学方法介导。对于与单倍体的N末端多肽缀合,这些方法包括但不限于烯酮化学、硫代氮杂环戊烷(thioazolidine)或异氰酸根合螯合物。对于与单倍体的C末端多肽缀合,这些方法包括但不限于工程化的C末端硒代半胱氨酸的碘化作用(iodinylation)以及其中标记与内含肽切割偶联的方法。在后一种情况下,可以通过携带叠氮基的肼基化合物实现目标N末端蛋白质片段从融合内含肽序列中的切割(Kalia等人,Chem.BioChem.,2006,7,1375-1383)。在此之后,携带5’或3’环辛炔基团的寡核苷酸可以通过无铜点击化学容易地与叠氮化物部分连接。另选地,目标N末端蛋白质片段可以通过以下方式从融合内含肽序列上切割下来:用2-巯基乙烷磺酸进行常规处理,同时与携带甲基四嗪基团的新修饰半胱氨酸((R)-2-氨基-3-巯基-N-(3-(4-(6-甲基-1,2,4,5-四嗪-3-基)苯氧基)丙基)丙酰胺)共反应:
这将期望的N末端蛋白质片段的释放与半胱氨酸-甲基四嗪的缀合相组合。继而,携带5’或3’反式环辛烯基团的寡核苷酸与附连的甲基四嗪部分快速且特异性地反应。
在一些实施方案中,单倍体与蛋白质片段之间的偶联通过延长的遗传密码子介导。为了实施这一点,TAG终止密码子(在DNA水平上)被工程化为处于N或C末端位置,并且将用于表达目的的细菌菌株用具有特定序列修饰的源自古细菌来源的编码生物正交氨酰基tRNA合酶/tRNA对的质粒共转染。在此类情况下,氨酰基tRNA合酶已被工程化并被选择以便以生物正交方式使其同源tRNA带有期望的非天然氨基酸,其借由通过tRNA反密码子三联体识别UAG密码子而以位点特异性方式掺入蛋白质中。在延长遗传密码子法的一些实例中,非天然氨基携带点击基团,包括但不限于反式环辛烯。当具有携带特定点击基团的侧链的非天然氨基酸残基掺入所选多肽的N或C末端或其附近时,携带反应互补的点击基团的寡核苷酸可以通过特定的点击反应本身而化学连接至多肽。在掺入的非天然氨基酸携带反式环辛烯的实施方案中,生物正交反应性寡核苷酸附连有5’或3’甲基四嗪基团。
与单倍体的多核苷酸缀合的蛋白质片段可从存在的其他蛋白质和未缀合的过量核酸中纯化。纯化方法包括但不限于透析(其中在目标缀合物与其他组分之间存在显著的分子量差异)、凝胶过滤、非变性凝胶电泳和特定条带切除以及HPLC。
在一些实施方案中,当附连于多肽的单倍体由DNA组成时,可以通过与生物素化的互补RNA链杂交并随后固定化在固相链霉抗生物素蛋白上来纯化缀合物。缺乏DNA寡核苷酸单倍体的初始混合物的组分不与固相链霉抗生物素蛋白结合,并且因此通过洗涤步骤除去。然后通过用特异性消化RNA:DNA杂交体中的RNA链的RNA酶H处理来释放所结合的缀合物。
可构建SP-TAPER,其中杂交介导的多肽并置(其能够实现折叠和功能活性重构)通过许多不同的分子架构发生。在最简单的布置中,每个分裂蛋白片段上的单倍体基本上彼此互补。此类单倍体之间的直接杂交促进了所附连的蛋白质片段的空间接近,并且进而通过天然折叠途径促进它们的相互作用(参见图4)。在本文,此构型称为“架构1”。
为了与常规TAPER大致相似,SP-单倍体对也可以与第三方线性靶模板空间接近地共杂交,而不是彼此互补。通过这样做,所附连的多肽序列以期望取向以空间并置的方式布置,以使得可以形成成熟的折叠蛋白质产物(参见图5)。在本文,此构型称为“架构2”。在此架构内,互补模板(即靶核酸分子)上的两个杂交SP-单倍体之间的间隙可为零(即,当SP-单倍体精确并置时)或N>0,其中N=SP-单倍体对的5’和3’末端之间的模板核苷酸的数目。(实际上,当N增加时,单倍体多肽之间的相互作用的效率将趋于减弱)。
另外的架构对于SP-TAPER是可能的,其中SP-单倍体的杂交位点就靶模板的一级序列而言是非连续的。在SP-单倍体对的不连续识别位点通过茎环结构而空间接近时(本文称为“架构3”),所附连的多肽序列可以共折叠为成熟蛋白质结构(参见图6)。
在基于模板的架构2和3中,SP-单倍体的5’和3’就模板链的坐标而言指向彼此。这在先前称为“内型(endo)”构型。在模板链可以形成相当大的环结构的情况下,相反的单倍体布置(“外型”构型,其中SP-单倍体的5’和3’就模板链的坐标而言指向彼此(参见图7)还可以导致所附连的多肽区段的空间接近,以及功能性共折叠。在本文,此构型称为“架构4”。
在一些实施方案中,先前称为“锁定TAPER”的TAPER的变型(即,使用瓶形单倍体的TAPER过程)易于适用于SP-TAPER。锁定TAPER的使用有助于避免任何模板滴定效应。对于锁定SP-TAPER,第一单倍体瓶和第二单倍体以与以上实施方案中的其他SP-TAPER架构类似的方式与预定且独立表达的目标蛋白质的多肽片段缀合。第一单倍体瓶和第二单倍体与目标多肽片段之间的缀合过程可以以对应于以上实施方案的各种方式实现,包括但不限于通过双官能马来酰亚胺偶联试剂进行的硫醇缀合(参见图8)。根据锁定TAPER过程的性质,第二单倍体-多肽缀合物的杂交位点是不可接近的,除了在特定靶核酸分子的存在下,其中与第一单倍体瓶的反靶环部分发生杂交。随后,使第二单倍体-多肽缀合物的杂交位点可接近,并且继而可以确保两个多肽链的接近促进的共折叠(参见图9)。
在锁定TAPER系统内,当携带多肽缀合物的两个寡核苷酸处于杂交介导的空间接近时(参见图9),组装件的结构对应于架构1(参见图9和图4),因为两个衍生的寡核苷酸彼此互补,而不是如在架构2-4中那样与靶模板互补。然而,由于锁定TAPER第一单倍体瓶的环段与靶核酸分子序列杂交以便暴露第二单倍体的识别位点,因此环-靶标结合本身可以通过不同的架构发生。因此,图9中的锁定TAPER寡核苷酸的靶标杂交对应于架构2(参见图5),并且通过架构3和4(分别参见图6和7)实现的靶标杂交同样是可能的。因此,锁定TAPER具有独特特征,由此TAPER组装始终与架构1一致,但靶标杂交可以采用可变架构。换句话说,对于常规的TAPER,靶标杂交和组装指导的杂交是重合的,但对于锁定TAPER,它们是不同且可分开的。
可以作为分裂多肽用于由SP-TAPER指导的模板化重新组装的蛋白质包括能够递送报告信号的所有那些蛋白质。报告蛋白实例的非限制性组包括荧光蛋白(如GFP和衍生物、YFP、mCherry、dsRed、VENUS和CFP)和荧光素酶(萤火虫荧光素酶、海肾荧光素酶)。SP-TAPER应用涵盖的其他类别的蛋白质包括但不限于转录因子、信号转导途径因子以及基因编辑蛋白。
在一些实施方案中,SP-TAPER针对单链免疫球蛋白可变区(scFv)蛋白的模板化组装。这些通常含有能够实现可变区重链区段和轻链区段的缔合的延长的丝氨酸-甘氨酸接头序列。此接头序列是用于产生分裂蛋白的便利位点,其中两个免疫球蛋白可变区区段根据期望架构附连有核酸标签(参见图5-8),之后由特定模板的存在介导它们的组装和所得的抗原结合特性。这使得能够在目标细胞靶标中原位产生期望的抗原结合特异性,所述目标细胞靶标如通过细胞特异性核酸序列所定义。scFv靶向的SP-TAPER的应用包括但不限于荧光激活蛋白(FAP,在靶配体中产生荧光的scFv分子)的使用。
在一些实施方案中,SP-TAPER应用于小的高毒性蛋白质或核糖毒素(其通过使真核核糖体酶促失能而发挥作用)的模板化组装。此类蛋白质包括但不限于蓖麻毒素A链、Aspf1、α-八叠球菌(sarcin)、丝林霉素(mitogillin)和多毛菌素A。这些蛋白质因其体积小和毒性高而对SP-TAPER具有吸引力。作为非限制性实例,多毛菌素A具有许多潜在的分裂蛋白断裂位点,包括二甘氨酸转角(参见图10)。虽然剧毒可能是对核糖毒素作为直接免疫缀合物的部署的显著限制(通过不可接受的旁观效应),但SP-TAPER有效地避免了这一点。当核糖毒素分裂蛋白片段缺乏其亲本蛋白质的毒性活性时,它们的循环片段是无害的。利用SP-TAPER,此类片段仅在与病理性细胞靶标相关的特定模板的存在下组装成完全活性蛋白质。
通过与针对核糖毒素所述相同的原理,SP-TAPER也适用于其他小且高毒性蛋白质的模板导向组装,所述蛋白质包括但不限于白喉毒素和霍乱毒素。另外的实例在下文提供。
用作SP-TAPER的模板的靶核酸分子包括区分所选靶标的任何核酸序列,无论该序列是对应于任何描述的细胞RNA分子,源自适体介导的适应过程(参见USSN 62/339,981),还是来自用于将合适的模板序列固定在期望的细胞局部区域(cellular locale)的任何其他过程。
用作SP-TAPER的模板的靶核酸分子可在细胞表面上产生,其中SP-单倍体的模板促进组装也是表面效应。在一些实施方案中,特定的期望模板(和期望的分裂蛋白组装位点)内在地位于靶细胞类型内,无论是肿瘤来源,通过异常免疫途径产生,还是通过任何其他类型的病理过程引起。在此类情况下,SP-单倍体通过各种递送技术被布控至细胞内环境,包括但不限于自主(gymnotic)方法和各种各样的纳米颗粒。后一类包括但不限于简单和多层脂质体、树状大分子、细胞外囊泡、DNA或其他核酸折纸笼(nucleic acid origamicage)、工程化细菌媒介物、工程化线粒体、病毒衍生结构、核糖核蛋白穹窿体以及蛋白质或聚乙二醇化的蛋白质自组装区室。与常规TAPER一样,虽然递送的靶标精确度是有用的,但它不是必需的,因为在没有病理学定义的靶序列的情况下,将不发生分裂蛋白组装。换句话说,对于SP-TAPER的实施,递送到正常的“脱靶”细胞不产生有害的副作用。
在一些实施方案中,SP-TAPER中的分裂多肽片段的折叠途径可通过提供蛋白质伴侣(包括但不限于多种热休克蛋白家族的成员)或低分子量化学伴侣进行辅助。后一类中具有非特异性伴侣功能的小分子伴侣包括但不限于丁酸4-苯基酯、去氧胆酸、熊去氧胆酸或牛磺酸-去氧胆酸。在一些实施方案中,SP-TAPER可利用对特定的目标靶多肽片段具有有益的折叠增强的小分子,其中此类低分子量化合物定义为药物分子伴侣或药物伴侣。
SP-TAPER过程及其组分通常可以通过以下更具体的实施方案来描述。
本公开提供了单倍体,其包含:a)多核苷酸,其与靶核酸分子基本上互补;以及b)N末端蛋白质片段或C末端蛋白质片段,其中多核苷酸的3’或5’末端与C末端蛋白质片段的N末端或N末端蛋白质片段的C末端连接。在一些实施方案中,单倍体的多核苷酸包括约6至约20个核苷酸碱基。在一些实施方案中,单倍体的多核苷酸包括约8至约15个核苷酸碱基。
在一些实施方案中,一对单倍体串联作用。在一些实施方案中,第一单倍体的蛋白质片段与第一单倍体的多核苷酸的5’末端连接,并且第二单倍体的蛋白质片段与第二单倍体的多核苷酸的3’末端连接。
在一些实施方案中,第一单倍体的多核苷酸与第二单倍体的多核苷酸基本上互补。在一些实施方案中,第一单倍体的多核苷酸与靶核酸分子基本上互补,并且第二单倍体的多核苷酸在与第一单倍体的多核苷酸在空间上接近的位点处与靶核酸分子基本上互补。
在本文所述的任何实施方案中,单倍体在空间上接近(当与靶核酸分子结合时),使得蛋白质片段可以恰当地相互作用,以诱导它们各自的目标蛋白质片段的相互作用。因此,对于任何单倍体对,第一单倍体和第二单倍体与靶核酸分子的结合部之间的间隙N为0(即,单倍体紧密并置)的情况下可以发生反应性,并且逐渐增大的间隙(N>0)将使反应性逐渐减小。因此,在一些实施方案中,第一单倍体和第二单倍体与靶核酸分子的结合部之间存在0个核苷酸。在一些实施方案中,第一单倍体和第二单倍体与靶核酸分子的结合部之间存在少于6个核苷酸。在一些实施方案中,第一单倍体和第二单倍体与靶核酸分子的结合部之间存在少于5个核苷酸。在一些实施方案中,第一单倍体和第二单倍体与靶核酸分子的结合部之间存在少于4个核苷酸。在一些实施方案中,第一单倍体和第二单倍体与靶核酸分子的结合部之间存在少于3个核苷酸。在一些实施方案中,第一单倍体和第二单倍体与靶核酸分子的结合部之间存在少于2个核苷酸。
在一些实施方案中,第一单倍体的蛋白质片段和多核苷酸均包含反应性生物正交部分,和/或第二单倍体的蛋白质片段和多核苷酸均包含反应性生物正交部分,其中第一单倍体的反应性生物正交部分与第二单倍体的生物正交部分可反应。
在一些实施方案中,N末端片段包含APIVTCRKLDGREKPFKVDVATAQAQARKAGLTTGKSGDPHRYFAGDHIRWGVNNCDKADAILWEYPIYWVGKNAEWAKDVKTSQQKG(SEQ ID NO:1)的氨基酸序列,并且C末端片段包含GPTPIRVVYANSRGAVQYCGVMTHSKVDKNNQGKEFFEKCD(SEQ ID NO:2)的氨基酸序列。
在一些实施方案中,N末端片段包含APIVTCR PKLDG(SEQ ID NO:3)的氨基酸序列,并且C末端片段包含REKPFKVDVATAQAQARKAGLTTGKSGDPHRYFAGDHIRWGVNNCDKADAILWEYPIYWVGKNAEWAKDVKTSQQKGGPTPIRVVYANSRGAVQYCGVMTHSKVDKNNQGKEFFEKCD(SEQ ID NO:4)的氨基酸序列。
在一些实施方案中,N末端片段包含APIVTCRPKLDGREKPFKVDVATAQAQARKAGLTTGK(SEQ ID NO:5)的氨基酸序列,并且C末端片段包含SGDPHRYFAGDHIRWGVNNCDKADAILWEYPIYWVGKNAEWAKDVKTSQQKGGPTPIRVVYANSRGAVQYCGVMTHSKVDKNNQGKEFFEKCD(SEQ ID NO:6)的氨基酸序列。
在一些实施方案中,N末端片段包含APIVTCRPKLDGREKPFKVDVATAQAQARKAGLTTGKSGDPHRYFAGDHIRWGVNNCDKAD(SEQ ID NO:7)的氨基酸序列,并且C末端片段包含AILWEYPIYWVGKNAEWAKDVKTSQQKGGPTPIRVVYANSRGAVQYCGVMTHSKVDKNNQGKEFFEKCD(SEQ ID NO:8)的氨基酸序列。
在一些实施方案中,N末端片段包含APIVTCRPKLDGREKPFKVDVATAQAQARKAGLTTGKSGDPHRYFAGDHIRWGVNNCDKADAILWEYPIYWVG(SEQ ID NO:9)的氨基酸序列,并且C末端片段包含KNAEWAKDVKTSQQKGGPTPIRVVYANSRGAVQYCGVMTHSKVDKNNQGKEFFEKCD(SEQ ID NO:10)的氨基酸序列。
在一些实施方案中,N末端片段包含APIVTCRPKLDGREKPFKVDVATAQAQARKAGLTTGKSGDPHRYFAGDHIRWGVNNCDKADAILWEYPIYWVGKNAEWAKD(SEQ ID NO:11)的氨基酸序列,并且C末端片段包含VKTSQQKGGPTPIRVVYANSRGAVQYCGVMTHSKVDKNNQGKEFFEKCD(SEQ ID NO:12)的氨基酸序列。
在一些实施方案中,N末端片段包含APIVTCRPKLDGREKPFKVDVATAQAQARKAGLTTGKSGDPHRYFAGDHIRWGVNNCDKADAILWEYPIYWVGKNAEWAKDVKTSQ(SEQ ID NO:13)的氨基酸序列,并且C末端片段包含QKGGPTPIRVVYANSRGAVQYCGVMTHSKVDKNNQGKEFFEKCD(SEQ ID NO:14)的氨基酸序列。
在一些实施方案中,N末端片段包含APIVTCRPKLDGREKPFKVDVATAQAQARKAGLTTGKSGDPHRYFAGDHIRWGVNNCDKADAILWEYPIYWVGKNAEWAKDVKTSQQKGGPTPIRVVYANSRG(SEQ ID NO:15)的氨基酸序列,并且C末端片段包含AVQYCGVMTHSKVDKNNQGKEFFEKCD(SEQ ID NO:16)的氨基酸序列。
在一些实施方案中,N末端片段包含APIVTCRPKLDGREKPFKVDVATAQAQARKAGLTTGKSGDPHRYFAGDHIRWGVNNCDKADAILWEYPIYWVGKNAEWAKDVKTSQQKGGPTPIRVVYANSRGAVQYCGVMTHSKVDKN(SEQ ID NO:17)的氨基酸序列,并且C末端片段包含NQGKEFFEKCD(SEQ ID NO:18)的氨基酸序列。
在一些实施方案中,N末端片段包含APIVTCRPKLDGREKPFKVDVATAQAQARKAGLT(SEQID NO:40)的氨基酸序列;并且C末端片段包含TGKSGDPHRYFAGDHIRWGVNNCDKADAILWEYPIYWVGKNAEWAKDVKTSQQKGGPTPIRVVYANSRGAVQYCGVMTHSKVDKNNQGKEFFEKCD(SEQ ID NO:41)的氨基酸序列。
本公开还提供了包含多核苷酸的瓶形单倍体,其中多核苷酸包括:a)第一3’茎部,其包括约10至约20个核苷酸碱基;b)反靶环部分,其包括约16至约40个核苷酸碱基,与第一3’茎部连接,其中反靶环部分与靶核酸分子基本上互补;以及c)第二5’茎部,其包括约10至约20个核苷酸碱基,与反靶环部分连接,其中第一3’茎部与第二5’茎部基本上互补;其中:i)多核苷酸的5’末端包含-SH部分;并且ii)反靶环部分:靶核酸分子的Tm大于第一茎部:第二茎部的Tm
本公开还提供了包含多核苷酸的瓶形单倍体,其中多核苷酸包括:a)第一3’茎部,其包括约10至约20个核苷酸碱基;b)反靶环部分,其包括约16至约40个核苷酸碱基,与第一3’茎部连接,其中反靶环部分与靶核酸分子基本上互补;以及c)第二5’茎部,其包括约10至约20个核苷酸碱基,与反靶环部分连接,其中第一3’茎部与第二5’茎部基本上互补;其中:i)反靶环部分:靶核酸分子的Tm大于第一茎部:第二茎部的Tm,并且ii)多核苷酸的5’末端或3’末端与N末端蛋白质片段的C末端或C末端蛋白质片段的N末端连接,其中与多核苷酸连接的蛋白质片段的末端包含半胱氨酸或硒代半胱氨酸。
在一些实施方案中,第一茎部包括约12至约18个核苷酸碱基。在一些实施方案中,反靶环部分包括约18至约35个核苷酸碱基。在一些实施方案中,第二茎部包括约12至约18个核苷酸碱基。反靶环部分具有与第一茎部连接的第一末端。反靶环部分与靶核酸分子基本上互补。第二茎部与反靶环部分的第二末端连接。第一茎部与第二茎部基本上互补。
在一些实施方案中,反靶环部分还可包含内部铰链区,其中铰链区包括与靶核酸分子不互补的一个或多个核苷酸。在一些实施方案中,铰链区包括约1个核苷酸至约6个核苷酸、约1个核苷酸至约5个核苷酸、约1个核苷酸至约4个核苷酸、约1个核苷酸至约3个核苷酸或1或2个核苷酸。
对于本文所述的瓶形单倍体的多核苷酸,特定多核苷酸或其部分的长度的重要性小于通过多核苷酸或其部分与另一核酸分子或其部分的相互作用形成的双链体的Tm。例如,通过反靶环部分与靶核酸分子的相互作用形成的双链体(例如,反靶环部分:靶核酸分子)的Tm大于由第一茎部与第二茎部的相互作用形成的双链体(例如,第一茎部:第二茎部)的Tm。在一些实施方案中,从反靶环部分:靶核酸分子的Tm中减去第一茎部:第二茎部的Tm为约10℃至约40℃。在一些实施方案中,从反靶环部分:靶核酸分子的Tm中减去第一茎部:第二茎部的Tm为约10℃至约20℃。在一些实施方案中,第一茎部:第二茎部的Tm为约40℃至约50℃。在一些实施方案中,反靶环部分:靶核酸分子的Tm为约60℃至约80℃。
另外,将以上Tm信息翻译成本文所述的核酸分子的特定长度还可以取决于每种核酸分子的GC含量。例如,合适的HPV模型靶核酸分子的长度为30个碱基(Tm为70℃),而EBV模型靶核酸分子的长度仅为21个碱基(Tm为69℃),这是由于其更大的%GC。
在一些实施方案中,瓶形单倍体与第二单倍体串联作用。在一些实施方案中,瓶形单倍体是本文所述的任何瓶形单倍体,并且第二单倍体是本文所述的任何单倍体。在一些实施方案中,第二单倍体包含:a)包括约6至约20个核苷酸碱基的核苷酸部分,其与和瓶形单倍体的蛋白质片段连接的瓶形单倍体的茎部基本上互补;以及b)与第二单倍体的核苷酸部分的5’或3’末端连接的蛋白质片段;其中第二单倍体:与瓶形单倍体的蛋白质片段连接的第一或第二茎部的Tm小于或等于瓶形单倍体的第一茎部:第二茎部的Tm
在一些实施方案中,通过第二单倍体与第一茎部或第二茎部的相互作用形成的双链体的Tm,无论哪个茎部与蛋白质片段连接(例如,第二单倍体:与蛋白质片段连接的第一或第二茎部),小于或等于第一茎部:第二茎部的Tm。在一些实施方案中,从第一茎部:第二茎部的Tm中减去由第二单倍体和与蛋白质片段连接的第一或第二茎部形成的双链体的Tm为约0℃至约20℃。在一些实施方案中,从第一茎部:第二茎部的Tm中减去由第二单倍体和与蛋白质片段连接的第一或第二茎部形成的双链体的Tm为约5℃至约10℃。在一些实施方案中,由第二单倍体和与蛋白质片段连接的第一或第二茎部形成的双链体的Tm为约30℃至约40℃。
这种结构布置经过设计使得在不存在靶核酸分子模板的情况下,锁定的第一单倍体瓶不与其互补的第二单倍体显著杂交,并且因此,在此类条件下不促进模板导向的产物组装。另一方面,当存在特定的靶核酸分子模板时,通过在瓶形单倍体的反靶环部分与靶核酸分子自身之间形成更稳定的杂交体来“解锁”瓶形单倍体。一旦发生这种情况,与蛋白质片段连接的瓶形单倍体的第一茎部自由地与可用的第二单倍体杂交,从而导致两者上的蛋白质片段之间接近。
本公开还提供了表面靶标化合物,其包含:a)模板多核苷酸;以及b)肽;其中:i)多核苷酸的5’末端与肽的N末端或C末端偶联,或多核苷酸的3’末端与肽的N末端或C末端偶联;并且ii)肽是细胞表面分子的配体。
在一些实施方案中,配体是肽激素或神经肽。肽激素的实例包括但不限于α-MSH、胰淀素、抗苗勒管激素、脂联素、心房肽、人生长激素、促性腺激素释放激素、抑制素、生长抑素、促肾上腺皮质激素、血管加压素、血管活性肠肽、胃泌素、分泌素、抑胃多肽、胃动素、铁调素、肾素、松弛素、胃饥饿素、瘦素、促脂解素、血管紧张素I、血管紧张素II、缓激肽、降血钙素、胰岛素、胰高血糖素、胰岛素样生长因子I、胰岛素样生长因子II、胰高血糖素样肽I、胰多肽、促代谢因子(betatrophin)、缩胆囊素、内皮素、促红细胞生成素、促血小板生成素、卵泡刺激素、人绒毛膜促性腺激素、人胎盘催乳素、催乳素、催乳素释放激素、促黄体激素、促甲状腺激素、促甲状腺激素释放激素、甲状旁腺激素以及垂体腺苷酸环化酶激活肽。
神经肽的实例包括但不限于神经肽Y、内啡肽、脑啡肽、脑利钠肽、速激肽、皮质抑素、甘丙肽、食欲素和催产素。
在一些实施方案中,多核苷酸包含核苷酸序列AAGCCACTGTGTCCTGAAGAAAAGCAAAGACATC(SEQ ID NO:20),并且肽包含氨基酸序列SYSMEHFRWGKPVGGGSSGGGC(SEQ ID NO:21)、SYSXEHFRWGKPVGGGSSGGGC(SEQ ID NO:22)、CSGGGSSGGGSYSMEHFRWGKPV-NH2(SEQ ID NO:23)或CSGGGSSGGGSYSXEHFRWGKPV-NH2(SEQ ID NO:24),其中X是正亮氨酸并且F残基是D-苯丙氨酸。
本公开还提供了融合蛋白,其包含:N末端蛋白质片段、融合配偶体蛋白和纯化结构域,其中N末端蛋白质片段的C末端与融合配偶体蛋白的N末端偶联,并且融合配偶体蛋白的C末端与纯化结构域的N末端偶联;或N末端蛋白质片段、融合配偶体蛋白和切割位点,其中融合配偶体蛋白的C末端与切割位点的N末端偶联,并且切割位点的C末端与N末端蛋白质片段的N末端偶联,其中N末端蛋白质片段包含N末端甲硫氨酸和C末端半胱氨酸;或C末端蛋白质片段、融合配偶体蛋白和切割位点,其中融合配偶体蛋白的C末端与切割位点的N末端偶联,并且切割位点的C末端与C末端蛋白质片段的N末端偶联,其中C末端蛋白质片段包含N末端半胱氨酸。
在一些实施方案中,融合蛋白包含N末端蛋白质片段、内含肽和几丁质结合结构域,其中N末端蛋白质片段的C末端与内含肽的N末端偶联,并且内含肽的C末端与几丁质结合结构域的N末端偶联。在一些实施方案中,融合蛋白包含N末端蛋白质片段、麦芽糖结合蛋白和肠激酶切割位点,其中麦芽糖结合蛋白的C末端与肠激酶切割位点的N末端偶联,并且肠激酶切割位点的C末端与N末端蛋白质片段的N末端偶联,其中N末端蛋白质片段包含N末端甲硫氨酸和C末端半胱氨酸。在一些实施方案中,融合蛋白包含C末端蛋白质片段、麦芽糖结合蛋白和肠激酶切割位点,其中麦芽糖结合蛋白的C末端与肠激酶切割位点的N末端偶联,并且肠激酶切割位点的C末端与C末端蛋白质片段的N末端偶联,其中C末端蛋白质片段包含N末端半胱氨酸。
在一些实施方案中,融合蛋白包含N末端蛋白质片段、麦芽糖结合蛋白和肠激酶切割位点,其中麦芽糖结合蛋白的C末端与肠激酶切割位点的N末端偶联,并且肠激酶切割位点的C末端与N末端蛋白质片段的N末端偶联,其中N末端蛋白质片段包含氨基酸序列APIVTCRPKLDGREKPFKVDVATAQAQARKAGLTTGKSGDPHRYFAGDHIRWGVNNCDKADAILWEYPIYWVGKNAEWAKDVKTSQQKGC(SEQ ID NO:25)。
在一些实施方案中,融合蛋白包含C末端蛋白质片段、麦芽糖结合蛋白和肠激酶切割位点,其中麦芽糖结合蛋白的C末端与肠激酶切割位点的N末端偶联,并且肠激酶切割位点的C末端与C末端蛋白质片段的N末端偶联,其中C末端蛋白质片段包含氨基酸序列CGPTPIRVVYANSRGAVQYCGVMTHSKVDKNNQGKEFFEKCD(SEQ ID NO:26)。
在一些实施方案中,融合配偶体蛋白是内含肽、麦芽糖结合蛋白、谷胱甘肽-S-转移酶、β-半乳糖苷酶或Omp F。
在一些实施方案中,切割位点是肠激酶切割位点或因子Xa蛋白酶切割位点。在一些实施方案中,因子Xa蛋白酶切割位点是IEGR(SEQ ID NO:27)。
在一些实施方案中,纯化结构域是几丁质结合结构域或六组氨酸标签。
在一些实施方案中,用于SP-TAPER的寡核苷酸的偶联通过用螯合剂共价修饰核酸5’或3’末端,以使寡核苷酸能够与六组氨酸分裂蛋白片段融合体结合来实现。具有5’或3’二硫化物修饰的寡核苷酸最初用摩尔过量的TCEP还原,然后通过脱盐柱跑样,以从TCEP和低分子量产物中纯化所得的硫醇末端寡核苷酸。此后,使游离硫醇寡核苷酸与马来酰亚胺基-C3-次氮基三乙酸(MNTA;Dojindo Molecular Technologies)反应,以使MNTA的马来酰亚胺部分与可用的硫醇反应形成缀合物。通过脱盐再次从低分子物类中纯化该产物,然后通过与摩尔过量的NiCl2一起温育以负载镍离子,并重新脱盐以除去过量的镍。然后,所得的螯合缀合物可用于与通过适当编码序列的表达产生的携带C末端或N末端六组氨酸标签的分裂蛋白片段形成复合物。缀合过程描绘于图19中。
在一些实施方案中,借助于具有四组氨酸序列的生物素化寡核苷酸(生物素-GSGSGHHHH;SEQ ID NO:19),可以从与六组氨酸形成复合物的反应中除去过量的NTA::Ni寡核苷酸。由于镍螯合物仍然可以结合四组氨酸,但相对于六组氨酸具有降低的亲和力(Knecht等人,J.Molec.Recognition,22:270-279,2009),过量的四组氨酸肽可以耗尽未缀合的NTA::Ni寡核苷酸,而不从蛋白质片段组氨酸标签上竞争性地剥离寡核苷酸。然后在固相链霉抗生物素蛋白制备物上除去过量的生物素化的肽/寡核苷酸(参见图20)。如果需要,可以重复利用生物素化的四组氨酸肽的耗尽步骤以除去残余的未偶联的NTA::Ni寡核苷酸螯合物。
通过NTA::Ni螯合物与六组氨酸标签之间的复合形成的缀合物可以使用任何架构1-4和锁定TAPER构型,以与其他化学缀合途径相同的方式用于SP-TAPER(参见图4-9)。
本公开还提供了具有下式的化合物:
其中n为约3至约6。在一些实施方案中,n为约4至约6或5至6。在一些实施方案中,n为3。在一些实施方案中,n为4。在一些实施方案中,n为5。在一些实施方案中,n为6。在一些实施方案中,通过用各种取代基替代一个或多个氢来修饰化合物,所述取代基包括例如-OH、-C1-C6烷基、-C1-C6烯基和卤素等。
在本文所述的任何多核苷酸或其任何部分中,核苷酸碱基选自由以下各项组成的组:DNA核苷酸、RNA核苷酸、硫代磷酸酯修饰的核苷酸、2-O-烷基化的RNA核苷酸、卤代核苷酸、锁核酸核苷酸(LNA)、肽核酸(PNA)、吗啉代核酸类似物(吗啉代化合物(morpholinos))、假尿苷核苷酸、黄嘌呤核苷酸、次黄嘌呤核苷酸、2-脱氧肌苷核苷酸、具有L-核糖的DNA类似物(L-DNA)、Xeno核酸(XNA)类似物,或能够形成碱基对的其他核酸类似物,或具有改变的主链的人工核酸类似物,或其任何组合或混合物。
对于本文所述的任何单倍体多核苷酸,与另一核酸分子的互补性可为100%。在一些实施方案中,一种特定的核酸分子可以与另一核酸分子基本上互补。如本文所用,短语“基本上互补”是指1至10个错配碱基位置、1至9个错配碱基位置、1至8个错配碱基位置、1至7个错配碱基位置、1至6个错配碱基位置、1至5个错配碱基位置、1至4个错配碱基位置、1至3个错配碱基位置,以及1或2个错配碱基位置。在一些实施方案中,希望避免通过错配碱基位置将反靶环部分:靶核酸分子的Tm降低超过10%。瓶形单倍体茎是相对于第二单倍体设计的,并且其结构被有意地布置成比第二单倍体双链体的形成更稳定一些。
在一些实施方案中,不与蛋白质片段连接的瓶形单倍体的部分可具有突出且不形成茎结构的一部分的另外的核苷酸碱基。在一些实施方案中,不与蛋白质片段连接的第二单倍体的末端可具有突出且不与瓶形单倍体的茎部形成该结构的互补部分的另外的核苷酸碱基。另外,在一些实施方案中,与蛋白质片段连接的茎的部分也可以具有不与第一茎部碱基配对的核苷酸碱基。具有非杂交“臂”的茎的这种延伸将两个蛋白质片段置于更大的空间距离,因此倾向于降低它们的相互反应性。因此,对于少数核苷酸碱基(少于10或少于5个),仍可能发生强制反应性,但随着非碱基配对片段长度的增加,强制反应性将趋于减小。
在一些实施方案中,添加的核苷酸碱基可具有无限长度,只要它们不:1)与锁定TAPER寡核苷酸的任何其他区域具有显著同源性,且因此倾向于交叉杂交和干扰;或2)非特异性地干扰系统的任何其他特征。例如,长的附连序列可能降低在治疗背景中使用的锁定TAPER寡核苷酸的转化效率。此外,附连序列应被设计成避免与其他细胞转录物的伪杂交。20-30个核苷酸碱基的附连的非同源序列是合适的。附连的核酸序列可包含本领域常用的引物序列。此类实例可包括但不限于M13、T3、T7、SP6、VF2、VR、其修饰型式、其互补序列以及其反向序列。此外,还包括定制引物序列。可以使用此类引物序列,例如,空间引发的化学连接寡核苷酸(CLOSE)可能应用于锁定TAPER策略(参见PCT公布WO 2016/89958;其通过引用整体并入本文)。
本文所述的任何单倍体和瓶形单倍体或其任何部分还可包括在第一茎部与反靶环部分之间、反靶环部分与第二茎部之间、第二茎部与蛋白质片段之间、第一茎部与配体之间或第二单倍体与其蛋白质片段之间中的任何一者或多者的接头。在一些实施方案中,接头选自由以下各项组成的组:烷基、烯基、酰胺、酯、硫酯、酮、醚、硫醚、二硫化物、乙二醇、环烷基、苄基、杂环基、马来酰亚胺基、腙、聚氨酯、唑类、亚胺、卤代烷基、次氮基三乙酸、镍、钴、铜以及氨基甲酸酯,或其任何组合。
在一些实施方案中,瓶形单倍体包含核苷酸序列5’-ACTCGAGACGTCTCCTTGTCTTTGCTTTTCTTCAGGACACAGTGGCGAGACGTCTCGAGT-3’(SEQ ID NO:28)或5’-ACTCGAGACGTCTCCTTCCTGCCCCTCCTCCTGCTCCGAGACGTCTCGAGT-3’(SEQ ID NO:29)。
在一些实施方案中,第二单倍体包含核苷酸序列5’-AGCTCTCGAGT-3’(SEQ ID NO:30),或5’-GACGTCTCGAGT-3’(SEQ ID NO:31)。
在一些实施方案中,瓶形单倍体的多核苷酸包含5’-ACTCGAGACGTCTCCTTGTCTTTGCTTTTCTTCAGGACACAGTGGCGAGACGTCTCGAGT-3’(SEQ ID NO:32)的核苷酸序列,并且第二单倍体的多核苷酸包含5’-AGCTCTCGAGT-3’(SEQ ID NO:30)的核苷酸序列;或瓶形单倍体的多核苷酸包含5’-ACTCGAGACGTCTCCTTCCTGCCCCTCCTCCTGCTCCGAGACGTCTCGAGT-3’(SEQ IDNO:29)的核苷酸序列,并且第二单倍体的多核苷酸包含核苷酸序列5’-GACGTCTCGAGT-3’(SEQ ID NO:31)。
在本文所述的实施方案中用作模板的靶核酸分子可以包含能够与单倍体的多核苷酸或瓶形单倍体的反靶环部分杂交的任何期望的核酸序列。
具有可接近序列的任何单链核酸分子都是潜在可靶向的。这些包括但不限于细胞RNA、mRNA、基因组或细胞器DNA、附着型或质粒DNA、病毒DNA或RNA、miRNA、rRNA、snRNA、tRNA、短和长非编码RNA,以及出于模板化目的使用的任何人工序列,或任何其他生物或人工核酸序列。人工序列包括但不限于适体和大分子-核酸缀合物。还包括适体模板,其中这些模板被设计成将非核酸细胞产物转化为任何形式的TAPER(包括锁定TAPER)的可靶向序列。在一些实施方案中,靶核酸分子杂交位点保持尽可能短,同时:1)保持在复杂转录组或其他复杂靶标内的特异性;并且2)保持本文所述的锁定TAPER设计准则。
含有核酸分子的任何细胞、病毒、组织、空间区域、裂解物或样品的其他子组分可以提供靶核酸分子。含有靶核酸分子的靶区室可以包括但不限于致病细胞、癌细胞、病毒、感染病毒或其他病原体的宿主细胞,或免疫系统中有助于自身免疫性的细胞,如适应性或先天性免疫系统、移植排斥或过敏反应的细胞。在一些实施方案中,靶核酸分子可存在于病毒或感染病毒的细胞中,但在健康细胞中不存在。病毒的实例包括但不限于DNA病毒、RNA病毒或逆转录病毒。在一些实施方案中,靶核酸分子可存在于肿瘤或癌细胞中,但在健康细胞中不存在。癌症的实例包括但不限于由致癌病毒,如人乳头瘤病毒、爱泼斯坦-巴尔病毒(Epstein-Barr virus)、乙型肝炎病毒、丙型肝炎病毒、人T淋巴细胞病毒、默克尔细胞多瘤病毒(Merkel cell polyoma virus)以及卡波西肉瘤(Kaposi's sarcoma)相关疱疹病毒引起的癌症。在一些实施方案中,靶核酸分子可存在于感染剂或微生物,或受感染剂或微生物感染的细胞中,但在健康细胞中不存在。感染剂或微生物的实例包括但不限于病毒、细菌、真菌、原生生物、朊病毒或真核寄生物。
靶核酸分子也可以是基因,如致癌基因、突变基因、致癌病毒基因、病毒核酸序列、微生物核酸序列、差异表达基因及其核酸基因产物的片段、部分或局部。在一些实施方案中,靶核酸分子是细胞核酸分子、肿瘤特异性核酸分子、异常免疫途径核酸分子或表面靶标化合物的多核苷酸。
癌症特异性靶核酸的实例包括但不限于突变型致癌基因,如突变型ras、HRAS、KRAS、NRAS、BRAF、EGFR、FLT1、FLT4、KDR、PDGFRA、PDGFRB、ABL1、PDGFB、MYC、CCND1、CDK2、CDK4或SRC基因;突变型肿瘤抑制基因,如TP53、TP63、TP73、MDM1、MDM2、ATM、RB1、RBL1、RBL2、PTEN、APC、DCC、WT1、IRF1、CDK2AP1、CDKN1A、CDKN1B、CDKN2A、TRIM3、BRCA1或BRCA2基因;以及在癌细胞中表达的基因,其中该基因可能未经突变或遗传改变,但在施用时在样品的健康细胞中不表达,如癌胚抗原。
在一些实施方案中,与非靶区室相比,靶核酸分子可以不同的量或浓度存在于靶区室中。实例包括但不限于在癌细胞中以不同于健康细胞的水平表达的基因,如myc、端粒酶、HER2或细胞周期蛋白依赖性激酶。在一些实施方案中,靶核酸分子可以是在靶区室中相对于非靶区室至少1.5X倍差异表达的基因。这些的一些实例包括但不限于与介导I型过敏反应相关的基因,对其而言靶RNA分子含有免疫球蛋白ε重链序列;在T细胞亚类中表达的基因,如特异性T细胞受体(TCR),
其在特定主要组织相容性(MHC)蛋白如胰岛素原来源的肽和含有源自致糖尿病CD8+T细胞的α或β可变区序列的克隆特异性mRNA的背景下识别自身抗原;以及其产生可通过加剧炎症反应而具有不良结果的细胞因子,包括但不限于TNF-α、TNF-β、IL-1、IL-2、IL-4、IL-6、IL-8、IL-1O、IL-12、IL-15、IL-17、IL-18、IL-21、IL-22、IL-27、IL-31、IFN-γ、OSM和LIF。
在一些实施方案中,靶核酸分子存在于靶区室和可接受的非靶区室亚组中,但不存在于不同或有差别的非靶区室亚组中。实例包括但不限于在癌细胞中表达且限于健康细胞类别的基因,如癌-睾丸抗原、存活素、前列腺特异性抗原、癌胚抗原(CEA)、甲胎蛋白以及其他癌胚蛋白。此外,面对严重的疾病,许多组织和器官对其他健康生活来说并不是必不可少的。例如,黑素细胞抗原如Melan-A/MART-1和gp100在许多恶性黑素瘤以及正常黑素细胞上表达,并且靶向这些抗原的疗法可以破坏肿瘤和正常黑素细胞两者,从而导致白癜风,但主要肿瘤减少。同样,当这些组织的肿瘤出现时,生殖器官可经手术切除,如睾丸、卵巢和子宫,以及相关器官如乳腺和前列腺可被靶向,并且这些器官内正常组织的破坏可以是可耐受的治疗结果。此外,产生激素,如甲状腺素和胰岛素的一些细胞可以用相关蛋白质代替,从而允许潜在靶向在这些起源的肿瘤的存在下可能存在的正常细胞。
在一些实施方案中,特定单倍体的靶核酸分子是对应单倍体的多核苷酸,以使产生架构1。
靶核酸分子还可包括先前未鉴定的新序列。在一些实施方案中,可以通过序列分析,如下一代测序、全转录组(RNA-seq)或全基因组测序、微阵列谱分析、基因表达的连续分析(SAGE)来评估一个或多个样品,以确定样品的基因组成。靶核酸分子可以鉴定为存在于靶区室中,但不存在于非靶区室中,或与非靶区室相比在靶区室中以不同的量或浓度存在的那些。然后通过这些方法鉴定的序列可用作靶核酸分子。
在一些实施方案中,单倍体的多核苷酸和蛋白质片段还可包含生物正交反应性部分以有助于它们的连接。生物正交部分包括那些可以进行叠氮化物与炔之间的“点击”反应、叠氮化物与膦之间的无痕或非无痕施陶丁格(Staudinger)反应以及硫酯与硫醇之间的天然化学连接反应的基团。另外,生物正交部分可以是叠氮化物、炔、环辛炔、硝酮、降冰片烯、氧杂降冰片二烯、膦、二烷基膦、三烷基膦、膦硫醇、膦酚、环辛烯、氧化腈、硫酯、四嗪、异腈、四唑、四环烷及其衍生物中的任一种。选择一组相应单倍体的成员的生物正交部分,以使它们将相互反应。
多种生物正交部分可与本文公开的方法和组合物一起使用,一些非限制性实例包括:
叠氮化物-炔“点击化学”
点击化学具有高度选择性,因为在典型条件下,叠氮化物和炔都不与常见生物分子反应。R-N3形式的叠氮化物和R-C≡CH形式的末端炔或R-C≡C-R形式的内部炔易于相互反应以产生呈1,2,3-三唑形式的Huisgen环加成产物。
基于叠氮化物的单倍体具有子结构:R-N3,其中R为化学接头、核酸识别部分(例如与核酸分子的另一部分互补的寡核苷酸的部分)或配体。叠氮化物和叠氮化物衍生物可易于由可商购获得的试剂制备。
在蛋白质片段或多核苷酸的合成期间,还可以将叠氮化物引入蛋白质片段或多核苷酸。在一些实施方案中,在使用标准肽合成方法合成蛋白质片段或多核苷酸期间,通过掺入可商购获得的叠氮化物衍生化的标准氨基酸或氨基酸类似物,将叠氮基引入到蛋白质片段或多核苷酸中。可用叠氮化物替代α-氨基使氨基酸衍生化,获得以下形式的结构:
其中R为标准氨基酸或非标准氨基酸类似物的侧链。
可商购获得的产品可以引入叠氮化物官能性作为氨基酸侧链,产生以下形式的结构:
其中A为标准氨基酸或非标准氨基酸类似物的侧链中的任何原子及其取代基。
通过重氮转移法将蛋白质片段或多核苷酸上的胺基转化为叠氮化物进行合成后,也可将叠氮化物引入蛋白质片段或多核苷酸中。生物缀合化学也可用于将可商购获得的衍生化叠氮化物连接至含有合适的反应性基团的化学接头、核酸识别部分或蛋白质片段或多核苷酸。
标准炔可以通过类似于叠氮化物掺入的方法掺入到单倍体中。炔官能化的核苷酸类似物是可商购获得的,从而允许在核酸识别部分合成时直接掺入炔基。类似地,可通过标准肽合成法将炔衍生化的氨基酸类似物掺入蛋白质片段或多核苷酸中。另外,与生物缀合化学法相容的不同官能化炔可用于促进通过合适的官能团或侧基向其他部分掺入炔。
叠氮化物激活的炔“点击化学”
标准叠氮化物-炔化学反应通常需要催化剂,如铜(I)。由于催化浓度下的铜(I)对许多生物系统有毒,所以标准叠氮化物-炔化学反应在活细胞中的使用有限。基于活化炔的无铜点击化学体系避开了有毒催化剂。
活化炔常常呈环辛炔形式,其中掺入到环辛基中向炔中引入了环应变。
杂原子或取代基可引入环辛基环中的各个位置,这可改变炔的反应性或在化合物中提供其他替代性化学特性。环上的各个位置也可用作连接环辛炔与核酸模板化组装部分或接头的附接点。环或其取代基上的这些位置可任选地用辅助基团进一步衍生化。
多种环辛炔是可商购获得的,包括适合与标准生物缀合化学方案一起使用的几种衍生化型式。可商购获得的环辛炔衍生化的核苷酸可有助于促进在合成期间便利地掺入蛋白质片段或多核苷酸。
叠氮化物-膦施陶丁格化学
基于叠氮化物与膦或亚磷酸盐之间的快速反应的损失N2的施陶丁格还原也代表生物正交反应。施陶丁格连接,其中在施陶丁格反应中在反应物之间形成共价连接,适合用于核酸模板化组装中。非无痕和无痕形式的施陶丁格连接都允许在这些反应中形成的产物的化学结构上有多种选择。
非无痕施陶丁格连接
标准施陶丁格连接是叠氮化物与苯基取代的膦如三苯基膦之间的非无痕反应,其中膦上的亲电子阱取代基如甲酯与反应的氮杂-内鎓盐中间体重排,以产生通过氧化膦连接的连接产物。
携带亲电子阱的苯基取代的膦也可容易地合成。衍生化型式是可商购获得的并且适于掺入到单倍体中:
无痕施陶丁格连接
在一些实施方案中,能够进行无痕施陶丁格连接的膦可用作多核苷酸和蛋白质片段的生物正交部分。在无痕反应中,膦在氮杂-内鎓盐中间体的重排期间用作离去基团,从而产生通常呈天然酰胺键形式的连接。能够进行无痕施陶丁格连接的化合物通常呈硫酯衍生化膦或酯衍生化膦的形式:
用于无痕施陶丁格连接的示例性酯衍生化膦为:
用于无痕施陶丁格连接的示例性硫酯衍生化膦为:
化学接头或辅助基团可任选地作为取代基附连于以上结构中的R基团,为多核苷酸和蛋白质片段提供附接点或向反应物引入附加官能性。
无痕膦酚施陶丁格连接
与非无痕施陶丁格苯基膦化合物相比,无痕膦酚上亲电子阱酯的取向相对于苯基是反向的。这使得无痕施陶丁格连接能够在与叠氮化物的反应中发生,从而在不含氧化膦的产物中产生天然酰胺键。
如果合适的亲水性基团如叔胺附连至苯基膦,那么无痕施陶丁格连接可在无有机共溶剂的水性介质中进行。Weisbrod和Marx描述了水溶性膦酚的制备,其可通过温和的Steglich酯化,使用碳二亚胺如二环己基碳二亚胺(DCC)或N,N'-二异丙基碳二亚胺(DIC)和酯活化剂如1-羟基苯并三唑(HOBT)来负载含有羧酸(如肽的C末端)的期望配体。这种方法有利于以下形式的单倍体的合成:
(Synlett,2010,5,787-789)。
基于水溶性膦酚的无痕单倍体结构。
无痕膦甲硫醇施陶丁格连接
膦甲硫醇代表用于介导无痕施陶丁格连接反应的膦酚的替代物。一般而言,膦甲硫醇与膦酚相比在介导无痕施陶丁格连接反应中具有有利的反应动力学。美国专利申请公布2010/0048866和Tam等人,J.Am.Chem.Soc.,2007,129,11421-30描述了以下形式的水溶性膦甲硫醇的制备:
这些化合物可负载肽或呈活化酯形式的其他有效负载,以形成适于用作无痕生物正交反应性基团的硫酯。
天然化学连接
天然化学连接是基于硫酯与带有硫醇和胺的化合物之间的反应的生物正交法。典型的天然化学连接在携带C末端硫酯的肽与携带N末端半胱氨酸的另一个肽之间,如下所示:
天然化学连接可用于介导无痕反应,产生含有内部半胱氨酸残基,或如果利用非标准氨基酸,则含有其他含硫醇的残基的肽或肽模拟物。
N末端半胱氨酸可通过标准氨基酸合成方法掺入。末端硫酯可通过本领域已知的几种方法产生,包括使用如二环己基碳二亚胺(DCC)的试剂将活化酯与硫醇缩合,或通过使用“安全捕捉(Safety-Catch)”载体树脂在肽合成期间引入。
其他选择性反应性部分
只要在复杂的生物环境中以高度选择性的方式有效介导反应,任何合适的生物正交反应化学均可用于合成单倍体-蛋白质片段复合物。最近开发的可能合适的替代性生物正交化学的非限制性实例是四嗪与各种烯烃如降冰片烯和反式环辛烯之间的反应,其有效地介导水性介质中的生物正交反应。
化学接头或辅助基团可任选地作为取代基附连于以上结构,为多核苷酸或蛋白质片段提供附接点,或向反应物引入附加官能性。
涉及实施例和附图中描述的蛋白质片段的构型可以反向。换句话说,蛋白质片段可与瓶形单倍体的3’末端连接,只要第二单倍体因此使其蛋白质片段与其5’末端连接即可。以下提供的实施例包括具有5’-连接蛋白质片段的瓶形单倍体和具有3’-连接蛋白质片段的第二单倍体。同样,在此系统中,生物正交部分可轮换。例如,代替使用具有5’-己炔基的瓶形单倍体和具有3’-叠氮化物的第二单倍体,瓶形单倍体可携带叠氮化物,并且第二单倍体可携带己炔基。
在一些实施方案中,生物正交部分选自叠氮化物、炔、环辛炔、硝酮、降冰片烯、氧杂降冰片二烯、膦、二烷基膦、三烷基膦、膦硫醇、膦酚、环辛烯、氧化腈、硫酯、四嗪、异腈、四唑或四环烷或其任何衍生物。在一些实施方案中,第一单倍体的生物正交部分是己炔基并且第二单倍体的生物正交部分是叠氮化物。在一些实施方案中,第一单倍体的生物正交部分是叠氮化物并且第二单倍体的生物正交部分是己炔基。
在一些实施方案中,通过模板化组装产生的目标蛋白质可通过作用于靶区室内(例如,细胞内)、靶区室表面(例如,细胞表面)、靶区室附近(例如,当效应子结构从细胞中主动输出、从细胞中泄漏或在细胞死亡时释放时)而触发活性,或扩散或被携带到样品的远处区域以触发响应。在一些实施方案中,通过在模板化组装产品中掺入靶向基团,可以使目标蛋白质靶向其活性位点。靶向基团的实例包括但不限于内质网转运信号、高尔基体转运信号、核转运信号、线粒体转运信号、遍在蛋白化基序、其他蛋白体靶向基序,以及糖基磷脂酰肌醇锚定基序。靶向基团可通过在合成期间掺入单倍体部分、化学接头或辅助基团中而引入,或可在连接反应期间生成。
在一些实施方案中,目标蛋白质可以存在于靶标室的表面。在一些实施方案中,目标蛋白质可以作为与主要组织相容性复合物分子结合的配体存在于细胞表面。
在一些实施方案中,目标蛋白质可以是内源性肽及其类似物,或作为如抗体的试剂的靶标的完全合成结构。因为靶核酸分子的可用性可以限制目标活性蛋白质的产生,可能希望目标蛋白质在以低水平存在时发挥活性。
在一些实施方案中,N末端蛋白质片段和C末端蛋白质片段均来源于报告蛋白、转录因子、信号转导途径因子、基因编辑蛋白、单链免疫球蛋白可变区(scFv)蛋白、毒性蛋白或酶。
在一些实施方案中,酶是β-内酰胺酶、氯霉素乙酰转移酶、氨基糖苷-3'-磷酸转移酶、β-半乳糖苷酶、二氢叶酸还原酶、限制性酶、DNA酶或RNA酶。
在一些实施方案中,报告蛋白是荧光蛋白、荧光素酶、氯霉素乙酰转移酶、β-半乳糖苷酶或β-葡糖醛酸酶。
在一些实施方案中,荧光蛋白是GFP、YFP、mCherry、dsRed、VENUS或CFP、蓝色荧光蛋白或其任何类似物。在一些实施方案中,荧光蛋白是超折叠GFP。在一些实施方案中,超折叠GFP的N末端片段包含MSKGEELFTGVVPILVELDGDVNGHKFSVRGEGEGDATNGKLTLKFICTTGKLPVPWPTLVTTLTYGVQCFSRYPDHMKRHDFFKSAMPEGYVQERTISFKDDGTYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNFNSHNVYITADKQ(SEQ ID NO:33)的氨基酸序列。在一些实施方案中,超折叠GFP的C末端片段包含KNGIKANFKIRHNVEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQSVLSKDPNEKRDHMVLLEFVTAAGITHGMDELYK(SEQ ID NO:34)的氨基酸序列。在一些实施方案中,超折叠GFP(sfGFP)的片段包含MRKGEELFTGVVPILVELDGDVNGHKFSVRGEGEGDATNGKLTLKFICTTGKLPVPWPTLVTTLTYGVQCFARYPDHMKQHDFFKSAMPEGYVQERTISFKDDGTYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNFNSHNVYITADKQ(SEQ ID NO:35)或KNGIKANFKIRHNVEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQSVLSKDPNEKRDHMVLLEFVTAAGITHGMDELYK(SEQ ID NO:34),其中一个片段与另一个片段相互作用。
在一些实施方案中,荧光素酶是萤光虫荧光素酶、海肾荧光素酶或Gaussiaprinceps荧光素酶。在一些实施方案中,荧光素酶是海肾荧光素酶。在一些实施方案中,海肾荧光素酶的N末端片段包含MASKVYDPEQRKRMITGPQWWARCKQMNVLDSFINYYDSEKHAENAVIFLHGNAASSYLWRHVVPHIEPVARCIIPDLIGMGKSGKSGNGSYRLLDHYKYLTAWFELLNLPKKIIFVGHDWGACLAFHYSYEHQDKIKAIVHAESVVDVIESWDEWPDIEEDIALIKSEEGEKMVLENNFFVETMLPSKIMRKLEPEEFAAYLEPFKEKGEVRRPTLSWPREIPLVKGGY(SEQ ID NO:36)的氨基酸序列。在一些实施方案中,海肾荧光素酶的C末端片段包含KPDVVQIVRNYNAYLRASDDLPKMFIESDPGFFSNAIVEGAKKFPNTEFVKVKGLHFSQEDAPDEMGKYIKSFVERVLKNEQZ(SEQ ID NO:37)的氨基酸序列。在一些实施方案中,海肾荧光素酶的片段包含MASKVYDPEQRKRMITGPQWWARCKQMNVLDSFINYYDSEKHAENAVIFLHGNAASSYLWRHVVPHIEPVARCIIPDLIGMGKSGKSGNGSYRLLDHYKYLTAWFELLNLPKKIIFVGHDWGACLAFHYSYEHQDKIKAIVHAESVVDVIESWDEWPDIEEDIALIKSEEGEKMVLENNFFVETMLPSKIMRKLEPEEFAAYLEPFKEKGEVRRPTLSWPREIPLVKGG(SEQ ID NO:38)或KPDVVQIVRNYNAYLRASDDLPKMFIESDPGFFSNAIVEGAKKFPNTEFVKVKGLHFSQEDAPDEMGKYIKSFVERVLKNEQ(SEQ ID NO:39),其中一个片段与另一个片段相互作用。在一些实施方案中,荧光素酶是Gaussia princeps荧光素酶。在一些实施方案中,Gaussia princeps荧光素酶的N末端片段包含MKPTENNEDFNIVAVASNFATTDLDADRGKLPGKKLPLEVLKEMEANARKAGCTRGCLICLSHIKCTPKMKKFIPGRCHTYEGDKESAQGGIG(SEQ ID NO:42)的氨基酸序列。在一些实施方案中,Gaussia princeps荧光素酶的C末端片段包含EAIVDIPEIPGFKDLEPMEQFIAQVDLCVDCTTGCLKGLANVQCSDLLKKWLPQRCATFASKIQGQVDKIKGAGGD(SEQ IDNO:43)的氨基酸序列。
在一些实施方案中,可以通过与细胞毒性、杀微生物或杀病毒效应子结构的直接相互作用诱导靶细胞的杀伤或生长抑制。可以产生本领域已知的多种毒性分子。在一些实施方案中,目标蛋白质是毒性肽或毒性蛋白。毒性肽的实例包括但不限于蜜蜂蜂毒素、芋螺毒素、凯萨林菌素(cathelicidin)、防御素、protegrin和NK溶素。毒性蛋白的实例包括但不限于蓖麻毒素A链、Aspf1、α-八叠球菌、丝林霉素、多毛菌素A、白喉毒素、肉毒杆菌A毒素以及霍乱毒素。在一些实施方案中,毒性蛋白是切割大28S核糖体RNA的核糖毒素。
在一些实施方案中,靶细胞的杀伤或生长抑制可以通过目标促凋亡蛋白诱导。例如,目标蛋白质包括促凋亡肽,包括但不限于朊病毒蛋白片段106-126(PrP 106-126)、与半胱天冬酶级联相关的Bax衍生的最小前肽(包括Bax 106-134),以及促凋亡肽(KLAKLAK)2
在一些实施方案中,目标蛋白质可以是血栓形成性的,因为它诱导蛋白质的凝血级联的各种组分的活化,或蛋白质的活化,或血小板的活化和/或聚集,或可导致生物活性过程的内皮损伤,在所述生物活性过程中,含有致病细胞的区域可以被选择性地形成血栓以限制对肿瘤或其他致病细胞的血液供应。这些类型的目标蛋白质还可以诱导凝血,或防止凝血,或防止被靶向的致病细胞中和周围的血小板活化和聚集。
在一些实施方案中,目标蛋白质可以通过激活与免疫系统相关的分子、途径或细胞来介导靶细胞或病毒的杀伤或生长抑制。目标蛋白质可以激发先天免疫系统、适应性免疫系统和/或两者。
在一些实施方案中,目标蛋白质可以通过刺激先天免疫系统介导细胞或病毒的杀伤或生长抑制。在一些实施方案中,目标蛋白质包括病原体相关分子模式(PAMP)、损伤相关分子模式(DAMP)及其合成类似物。
在一些实施方案中,先天免疫系统可以被激活补体系统的目标蛋白质激发。补体激活效应子结构的非限制性实例可以是补体蛋白C3的C3a片段。
在一些实施方案中,目标蛋白质可以是Toll样受体(TLR)的天然或合成配体。此类目标蛋白质的实例包括已知为TLR激动剂的热休克蛋白(hsp)的肽片段。
在一些实施方案中,无痕生物正交化学可用于产生NOD2受体的胞壁酰二肽激动剂以激活炎症反应。
在一些实施方案中,目标蛋白质可以通过激活适应性免疫系统的分子或细胞来介导细胞或病毒的杀伤或生长抑制。对于适应性免疫系统独特的是,分子或细胞可以被工程化以识别各种各样的结构,从而消除目标蛋白质必须具有内在活性或与内源性蛋白质结合的约束。
在一些实施方案中,目标蛋白质可以是抗体或抗体片段(包括但不限于Fab、Fv和scFv)的配体。无痕生物正交方法可用于产生由现有抗体结合的肽或其他表位,或可以开发抗体以识别所产生的目标蛋白质。
在一些实施方案中,目标蛋白质是以下各项的片段:细胞毒性蛋白、杀微生物蛋白、杀病毒蛋白、促凋亡蛋白、血栓形成蛋白、补体激活蛋白、Toll样受体蛋白、NOD2受体激动剂蛋白,或抗体或其片段,其中第一片段和第二片段相互作用以产生功能蛋白。
在一些实施方案中,细胞毒性蛋白是蜜蜂蜂毒素、芋螺毒素、凯萨林菌素、防御素、protegrin或NK溶素。在一些实施方案中,促凋亡蛋白是朊病毒蛋白、与半胱天冬酶级联相关的Bax衍生的最小前肽,或促凋亡肽(KLAKLAK)2(SEQ ID NO:40)。在一些实施方案中,先天免疫系统刺激蛋白是病原体相关分子模式(PAMP)或损伤相关分子模式(DAMP)。在一些实施方案中,补体激活蛋白是补体蛋白C3的C3a片段。在一些实施方案中,Toll样受体(TLR)蛋白是热休克蛋白(hsp)。在一些实施方案中,NOD2受体激动剂蛋白是胞壁酰二肽激动剂。在一些实施方案中,抗体片段是Fab、Fv或scFv。
在一些实施方案中,目标蛋白质是以下各项的片段:鼠二氢叶酸还原酶(DHFR)、酿酒酵母(S.cerevisiae)遍在蛋白、β-内酰胺酶,或单纯疱疹病毒1型胸苷激酶,其中目标蛋白质的一个片段与目标蛋白质的另一个片段二聚化或折叠在一起。
在一些实施方案中,鼠二氢叶酸还原酶(DHFR)的片段包含其氨基酸1-105或106-186,其中一个片段与另一个片段相互作用。
在一些实施方案中,酿酒酵母遍在蛋白的片段包含其氨基酸1-34(MQIFVKTLTGKTITLEVESSDTIDNVKSKIQDKE;SEQ ID NO:55)或35-76(GIPPDQQRLIFAGKQLEDGRTLSDYNIQKESTLHLVLRLRGG;SEQ ID NO:56),其中一个片段与另一个片段相互作用。
在一些实施方案中,β-内酰胺酶的片段包含其氨基酸25-197或198-286,其中一个片段与另一个片段相互作用。
在一些实施方案中,单纯疱疹病毒1型胸苷激酶的片段包含其氨基酸1-265或266-376,其中一个片段与另一个片段相互作用。
在一些实施方案中,可能不存在关于目标蛋白质可在何处分开以用于一般分裂蛋白质分析(包括SP-TAPER)的预先存在的信息。在此类情况下,蛋白质的三维晶体结构的检查可远离与蛋白质的功能直接相关的区域在表面环和转角内提供许多候选靶标。由预测靶位点处的切割产生的片段可通过单独表达为具有例如合适的相互作用的亮氨酸拉链的融合蛋白进行筛选,其中如果分裂蛋白靶向成功,那么在融合蛋白混合时恢复蛋白质活性。用于根据经验标记合适的切割位点的更快速的测定是可获得的,包括溶解度测定(参见Chen等人,Protein Science,2009,18,399-409)或优选的环状排列测定(circularpermutation assay)(参见Massoud等人,Nature Medicine,2010,16,921-926)。即使在没有结构信息的情况下,这些测定也是适用的,但是可以通过适用的结构知识来指导和提高效率。对于环状排列测定,首先生成目标编码序列的串联框内连续二聚体,其中丝氨酸-甘氨酸接头(如[SGGGG]3;SEQ ID NO:57)位于两个拷贝之间。然后通过使用合适的引物扩增由二聚体生成用于表达的环状排列的编码序列区(coding sequence block)。
本公开还提供了包含本文所述的单倍体、瓶形单倍体和表面靶标化合物中的任何一种或多种的组合物或试剂盒。
在一些实施方案中,组合物或试剂盒包含:a)第一单倍体,其中第一单倍体包含与N末端蛋白质片段的C末端连接的多核苷酸;以及b)第二单倍体,其中第二单倍体包含与C末端蛋白质片段的N末端连接的多核苷酸;其中:i)第一或第二单倍体中的一个的多核苷酸在其5’末端与蛋白质片段连接,并且第一和第二单倍体中的另一个在其3’末端与蛋白质片段连接;并且ii)N末端蛋白质片段和C末端蛋白质片段来源于单一蛋白质;并且其中:i)第一单倍体的多核苷酸与第二单倍体的多核苷酸互补;或ii)第一单倍体的多核苷酸与靶核酸分子互补,并且第二单倍体的多核苷酸在与第一单倍体的多核苷酸在空间上接近的位点处与靶核酸分子基本上互补;或iii)第一单倍体的多核苷酸与靶核酸分子5’相邻于茎环结构的部分基本上互补,并且第二单倍体的多核苷酸与靶核酸分子3’相邻于茎环结构的部分基本上互补;或iv)第一单倍体的多核苷酸与靶核酸分子的茎环结构的环的5’部分基本上互补,并且第二单倍体的多核苷酸与靶核酸分子的茎环结构的环的3’部分基本上互补。
在一些实施方案中,组合物或试剂盒包含:a)包含多核苷酸的瓶形单倍体,所述多核苷酸包括:i)第一3’茎部,其包括约10至约20个核苷酸碱基;ii)反靶环部分,其包括约16至约40个核苷酸碱基,与第一3’茎部连接,其中反靶环部分与靶核酸分子基本上互补;以及iii)第二5’茎部,其包括约10至约20个核苷酸碱基,与反靶环部分连接,其中第一3’茎部与第二5’茎部基本上互补;其中:i)多核苷酸的5’末端包含-SH部分;并且ii)反靶环部分:靶核酸分子的Tm大于第一茎部:第二茎部的Tm;b)N末端蛋白质片段,其中N末端蛋白质片段的C末端包含半胱氨酸-SH部分;以及c)双马来酰亚胺试剂。
在一些实施方案中,组合物或试剂盒包含:a)包含多核苷酸的瓶形单倍体,所述多核苷酸包括:i)第一3’茎部,其包括约10至约20个核苷酸碱基;ii)反靶环部分,其包括约16至约40个核苷酸碱基,与第一3’茎部连接,其中反靶环部分与靶核酸分子基本上互补;以及iii)第二5’茎部,其包括约10至约20个核苷酸碱基,与反靶环部分连接,其中第一3’茎部与第二5’茎部基本上互补;其中多核苷酸的5’末端与N末端蛋白质片段的C末端连接,其中C末端包含半胱氨酸;以及b)第二单倍体,其包含多核苷酸和C末端蛋白质片段,其中多核苷酸的3’末端与C末端蛋白质片段的N末端连接,其中N末端包含半胱氨酸;其中:i)第二单倍体的多核苷酸与瓶形单倍体的多核苷酸的第二5’茎部基本上互补;ii)反靶环部分:靶核酸分子的Tm大于第一茎部:第二茎部的Tm;并且iii)N末端蛋白质片段和C末端蛋白质片段来源于单一蛋白质。
在一些实施方案中,从反靶环部分:靶核酸分子的Tm中减去第一茎部:第二茎部的Tm为约10℃至约40℃。在一些实施方案中,从反靶环部分:靶核酸分子的Tm中减去第一茎部:第二茎部的Tm为约10℃至约20℃。在一些实施方案中,第一茎部:第二茎部的Tm为约40℃至约50℃。在一些实施方案中,反靶环部分:靶核酸分子的Tm为约60℃至约80℃。在一些实施方案中,从第一茎部:第二茎部的Tm中减去由第二单倍体和瓶形单倍体的第一或第二茎部形成的双链体的Tm为约0℃至约20℃。在一些实施方案中,从第一茎部:第二茎部的Tm中减去由第二单倍体和瓶形单倍体的第一或第二茎部形成的双链体的Tm为约5℃至约10℃。在一些实施方案中,由第二单倍体和瓶形单倍体的第一或第二茎部形成的双链体的Tm为约30℃至约40℃。
在一些实施方案中,第一茎部包括约12至约18个核苷酸碱基。在一些实施方案中,反靶环部分包括约18至约35个核苷酸碱基。在一些实施方案中,第二茎部包括约12至约18个核苷酸碱基。
在一些实施方案中,组合物或试剂盒还包含蛋白质伴侣、小分子伴侣或药物伴侣。在一些实施方案中,蛋白质伴侣是热休克蛋白。在一些实施方案中,小分子伴侣蛋白是丁酸4-苯基酯、去氧胆酸、熊去氧胆酸、牛磺酸-去氧胆酸、溶血磷脂酸、海藻糖、甘露醇、三甲胺氧化物、甜菜碱或二甲亚砜。
本公开还提供了从融合蛋白中的内含肽融合配偶体中切割N末端蛋白质片段的方法,其包括:a)使融合蛋白与2-巯基乙烷磺酸接触;以及b)使融合蛋白与具有甲基四嗪基团的半胱氨酸接触;从而从融合蛋白中释放N末端蛋白质片段。在一些实施方案中,具有甲基四嗪基团的半胱氨酸是
在一些实施方案中,该方法还包括使N末端蛋白质片段与具有5’或3’反式环辛烯基团的多核苷酸反应。
本公开还提供了使用本文所述的任何单倍体进行蛋白质的定向组装的方法。
在一些实施方案中,该方法包括:a)使细胞与第一单倍体接触,所述第一单倍体包含与N末端蛋白质片段的C末端连接的多核苷酸;以及b)使细胞与第二单倍体接触,所述第二单倍体包含与C末端蛋白质片段的N末端连接的多核苷酸;其中:i)第一或第二单倍体中的一个的多核苷酸在其5’末端与蛋白质片段连接,并且第一和第二单倍体中的另一个在其3’末端与蛋白质片段连接;ii)N末端蛋白质片段和C末端蛋白质片段来源于单一蛋白质;并且iii)其中:第一单倍体的多核苷酸与第二单倍体的多核苷酸基本上互补;或第一单倍体的多核苷酸与靶核酸分子基本上互补,并且第二单倍体的多核苷酸在与第一单倍体的多核苷酸在空间上接近的位点处与靶核酸分子基本上互补;或第一单倍体的多核苷酸与靶核酸分子5’相邻于茎环结构的部分基本上互补,并且第二单倍体的多核苷酸与靶核酸分子3’相邻于茎环结构的部分基本上互补;或第一单倍体的多核苷酸与靶核酸分子的茎环结构的环的5’部分基本上互补,并且第二单倍体的多核苷酸与靶核酸分子的茎环结构的环的3’部分基本上互补;从而导致由N末端蛋白质片段和C末端蛋白质片段组装蛋白质。
在一些实施方案中,第一单倍体的多核苷酸与第二单倍体的多核苷酸基本上互补。在一些实施方案中,第一单倍体的多核苷酸与靶核酸分子结合,在空间上接近第二单倍体的多核苷酸与靶核酸分子的结合。
在一些实施方案中,第一单倍体的蛋白质片段与第一单倍体的多核苷酸的5’末端连接,并且第一单倍体的多核苷酸与核酸靶标5’相邻于茎环结构的部分基本上互补;并且第二单倍体的蛋白质片段与第二单倍体的多核苷酸的3’末端连接,并且第二单倍体的多核苷酸与核酸靶标3’相邻于茎环结构的部分基本上互补。
在一些实施方案中,第一单倍体的蛋白质片段与第一单倍体的多核苷酸的3’末端连接,并且第一单倍体的多核苷酸与靶核酸分子的茎环结构的环结构的5’部分基本上互补,其中环结构的5’部分与茎环结构的茎区域相邻;并且第二单倍体的蛋白质片段与第二单倍体的多核苷酸的5’末端连接,并且第二单倍体的多核苷酸与靶核酸分子的茎环结构的环结构的3’部分基本上互补,其中环结构的3’部分与茎环结构的茎区域相邻。
在一些实施方案中,该方法包括:a)使靶核酸分子与瓶形单倍体接触,所述瓶形单倍体包含:i)第一3’茎部,其包括约10至约20个核苷酸碱基;ii)反靶环部分,其包括约16至约40个核苷酸碱基,与第一3’茎部连接,其中反靶环部分与靶核酸分子基本上互补;以及iii)第二5’茎部,其包括约10至约20个核苷酸碱基,与反靶环部分连接,其中第一3’茎部与第二5’茎部基本上互补;其中多核苷酸的5’末端与N末端蛋白质片段的C末端连接,其中C末端包含半胱氨酸;以及b)使瓶形单倍体与第二单倍体接触,所述第二单倍体包含与C末端蛋白质片段的N末端连接的多核苷酸,其中第二单倍体的多核苷酸与瓶形单倍体的多核苷酸的第二5’茎部基本上互补;其中:i)N末端蛋白质片段和C末端蛋白质片段来源于单一蛋白质;ii)反靶环部分:靶核酸分子的Tm大于第一茎部:第二茎部的Tm;并且iii)从第一茎部:第二茎部的Tm中减去由第二单倍体和瓶形单倍体的第二茎部形成的双链体的Tm为约0℃至约20℃;从而导致由N末端蛋白质片段和C末端蛋白质片段组装蛋白质。
在一些实施方案中,该方法包括:a)使细胞与表面靶标化合物接触,所述表面靶标化合物包含:i)模板多核苷酸;以及ii)肽;其中:i)多核苷酸的5’末端与肽的N末端或C末端偶联,或多核苷酸的3’末端与肽的N末端或C末端偶联;并且ii)肽是细胞表面分子的配体;b)使细胞与第一单倍体接触,所述第一单倍体包含与N末端蛋白质片段的C末端连接的多核苷酸;以及c)使细胞与第二单倍体接触,所述第二单倍体包含与C末端蛋白质片段的N末端连接的多核苷酸;其中:i)第一或第二单倍体中的一个的多核苷酸在其5’末端与蛋白质片段连接,并且第一和第二单倍体中的另一个在其3’末端与蛋白质片段连接;ii)N末端蛋白质片段和C末端蛋白质片段来源于单一蛋白质;并且iii)第一单倍体的多核苷酸与表面靶标化合物的模板多核苷酸基本上互补,并且第二单倍体的多核苷酸在与第一单倍体的多核苷酸在空间上接近的位点处与表面靶标化合物的模板多核苷酸基本上互补;从而导致由N末端蛋白质片段和C末端蛋白质片段组装蛋白质。
在一些实施方案中,该方法包括:a)使细胞与表面靶标化合物接触,所述表面靶标化合物包含:i)模板多核苷酸;以及ii)肽;其中:i)多核苷酸的5’末端与肽的N末端或C末端偶联,或多核苷酸的3’末端与肽的N末端或C末端偶联;并且ii)肽是细胞表面分子的配体;b)使靶核酸分子与瓶形单倍体接触,所述瓶形单倍体包含:i)第一3’茎部,其包括约10至约20个核苷酸碱基;ii)反靶环部分,其包括约16至约40个核苷酸碱基,与第一3’茎部连接,其中反靶环部分与表面靶标化合物的模板多核苷酸基本上互补;以及iii)第二5’茎部,其包括约10至约20个核苷酸碱基,与反靶环部分连接,其中第一3’茎部与第二5’茎部基本上互补;其中多核苷酸的5’末端与N末端蛋白质片段的C末端连接,其中C末端包含半胱氨酸;以及c)使瓶形单倍体与第二单倍体接触,所述第二单倍体包含与C末端蛋白质片段的N末端连接的多核苷酸,其中第二单倍体的多核苷酸与瓶形单倍体的多核苷酸的第二5’茎部基本上互补;其中:i)N末端蛋白质片段和C末端蛋白质片段来源于单一蛋白质;ii)反靶环部分:靶核酸分子的Tm大于第一茎部:第二茎部的Tm;并且iii)从第一茎部:第二茎部的Tm中减去由第二单倍体和瓶形单倍体的第二茎部形成的双链体的Tm为约0℃至约20℃;从而导致由N末端蛋白质片段和C末端蛋白质片段组装蛋白质。
本公开还提供了使用本文所述的任何单倍体调节细胞或细胞靶分子的方法。相应单倍体的组对哺乳动物或人的施用可根据试图治疗的疾病、病症或病状的性质而变化。在一些实施方案中,可以将单倍体和瓶形单倍体分配到合适的容器或腔室内的样品中。在一些实施方案中,可将样品分配到已经含有单倍体或瓶形单倍体的容器中。在一些实施方案中,单倍体和瓶形单倍体可以体外或原位使用。在一些实施方案中,人将需要这样的治疗。
在一些实施方案中,可以施用单倍体和瓶形单倍体以进行体内模板化组装。为了有利于这样的治疗,所制备的单倍体和瓶形单倍体可在任选地掺入合适递送剂的任何合适的缓冲液或制剂中施用,并且与哺乳动物或人或其样品(对于离体方法)接触。浓缩形式的单倍体和瓶形单倍体可以与其对应的单倍体和瓶形单倍体分开处理,因为产物生成反应可在不存在高浓度的靶核酸分子模板的情况下发生。表1提供了自主(无递送剂)单倍体和瓶形单倍体的最大可接受浓度的准则。如果在高于这些阈值的浓度下接触单倍体和瓶形单倍体,则可能发生非模板化的背景反应。
表1:单倍体的接触最大浓度,高于所述浓度可能发生非模板化的反应水平
生物正交反应化学 最大浓度
叠氮化物-炔 <50μM
叠氮化物-膦 <50μM
天然化学连接 <1mM
其他单倍体和瓶形单倍体的阈值浓度可使用所公开的模板化组装诊断评估测定根据经验确定。
在一些实施方案中,可以通过施用一组相应的单倍体和瓶形单倍体,使得首先施用一种单倍体,然后在观察到时间延迟之后施用相应的单倍体来降低非模板化反应的可能性。此时间延迟可在1分钟至数天的范围内,这取决于体系中单倍体的持久性。
某些递送剂,如转染试剂,如阳离子脂质、聚乙烯亚胺、基于葡聚糖的转染物或本领域已知的其他转染试剂,可引起单倍体的缩合。在这些情况下,单倍体可与相应的反应性单倍体分开制备并分开施用于样品。单倍体也可自主施用、溶解在适当的缓冲液中而不添加任何另外的递送剂。
单倍体和瓶形单倍体也可在与合适的递送剂一起配制后施用。合适的递送剂可增强单倍体和瓶形单倍体的稳定性、生物利用率、生物分布、细胞渗透性或其他期望的药理学特性或这些特性的组合。本领域已知的递送剂包括但不限于聚阳离子转染试剂、聚乙烯亚胺及其衍生物、DEAE-葡聚糖、其他转染试剂、盐、离子、缓冲剂、增溶剂、各种病毒载体、脂质体、靶向脂质体、纳米颗粒、载体聚合物、内体破坏剂、渗透剂、脂质、类固醇、表面活性剂、分散剂、稳定剂或其任何组合。
也可通过辅助基团与单倍体和瓶形单倍体的共价附接增强单倍体和瓶形单倍体向靶区室的递送。可增强递送的辅助基团可包括已知增强化合物的稳定性和生物分布的化合物,如聚乙二醇(PEG);以及增强单倍体的细胞渗透性的化合物,包括但不限于本领域已知的胆固醇衍生物、本领域已知的内体破坏剂,以及细胞穿透肽,如聚阳离子如聚精氨酸或聚赖氨酸、衍生自HIV tat蛋白的肽、运输蛋白和衍生自触角蛋白(穿透素)的肽。
还可包括施用效应蛋白产物触发的试剂,如抗体或其他效应蛋白产物检测分子,或效应蛋白产物检测细胞。施用可以是模板化组装程序的一部分。它可在施用单倍体和瓶形单倍体之前、期间或之后施用,并且可通过对于该试剂适当的任何方法施用。在一些实施方案中,效应蛋白产物触发的试剂在施用单倍体和瓶形单倍体之前施用,以便于在它们一旦形成并可用于试剂结合时即通过效应蛋白触发活性。
在一些实施方案中,可并行施用多组相应的单倍体和瓶形单倍体。这些反应物组可结合单个靶核酸分子上的多个杂交位点,或结合不同的靶核酸分子,或其组合。不同的单倍体和瓶形单倍体组可产生相同的蛋白质结构,因此通过促进其产生增加由所述蛋白质结构产生的活性的水平,或不同的单倍体和瓶形单倍体组可产生不同的蛋白质结构,因此在样品中产生多价活性,或其组合。
通过本文所述的方法产生效应蛋白可产生活性,如诱导免疫应答、程序性细胞死亡、细胞凋亡、坏死、裂解、生长抑制、病毒感染的抑制、病毒复制的抑制、癌基因表达的抑制、基因表达的修饰、微生物感染的抑制和微生物复制的抑制,以及这些生物活性的组合。
在一些实施方案中,所施用的组合物可包括靶向两种或更多种靶核酸分子的两组或更多组相应的单倍体和瓶形单倍体。两种或更多种靶核酸分子可存在于相同基因转录物内,或可选地存在于不同且分开的转录物上。识别相同细胞转录物内的不同核酸靶分子的两组或更多组相应的单倍体和瓶形单倍体可独立地产生相同或不同的蛋白质。
靶核酸分子的丰度也可限制由模板化组装产生的活性蛋白的量。在一些实施方案中,每个靶区室平均存在至少5个拷贝的靶核酸分子。施用的组合物的剂量和浓度可以考虑靶核酸分子的可用性。
在一些实施方案中,公开了将单倍体和瓶形单倍体或包含一组或多组所述单倍体和瓶形单倍体的组合物递送至致病细胞的方法。所述方法可包括向致病细胞施用治疗有效量的一组或多组相应的单倍体和瓶形单倍体组合物。在一些实施方案中,所述方法还可包括在施用单倍体和瓶形单倍体组合物之前检测靶核酸分子的存在或不存在。
药物组合物可通过以下途径中的一个施用:口服、局部、全身(例如透皮、鼻内或通过栓剂)、或肠胃外(例如肌内、皮下或静脉内注射)。组合物可采取片剂、丸剂、胶囊、半固体、粉剂、缓释制剂、溶液、混悬液、酏剂、气溶胶或任何其他适当组合物的形式;并且包含与至少一种药学上可接受的赋形剂组合的至少一种化合物。合适的赋形剂是本领域普通技术人员所熟知的,并且所述赋形剂和配制组合物的方法可在标准参考文献中找到,如Remington:The Science and Practice of Pharmacy,A.Gennaro编,第20版,Lippincott,Williams&Wilkins,Philadelphia,Pa。合适的液体载体,尤其是用于可注射溶液的液体载体,包括水、盐水溶液、葡萄糖水溶液和二醇类。
适用于注射的药物组合物可包括无菌水溶液(为水溶性时)或分散体以及用于即时制备无菌可注射溶液或分散体的无菌粉末。在所有情况下,组合物必须是无菌的并且应具有易于注射的流动性。组合物在制造和储存条件下应是稳定的并且应在防止微生物(如细菌和真菌)的污染作用的条件下保存。载体可为溶剂或分散介质,其含有,例如,水、乙醇、多元醇(例如,甘油、丙二醇和液体聚乙二醇等)、其合适的混合物以及植物油。适当流动性可例如通过使用诸如卵磷脂的包衣、通过在分散状况下维持所需粒子大小且通过使用表面活性剂来维持。可通过各种抗细菌剂和抗真菌剂来实现对微生物作用的预防。在许多情况下,可在组合物中包括等渗剂,例如,糖、多元醇如甘露糖醇、山梨醇、氯化钠。通过在组合物中包含延迟吸收的试剂(例如单硬脂酸铝和明胶)可引起注射组合物的吸收延长。
无菌可注射溶液可通过将合适量的包含单倍体和瓶形单倍体的组合物与上文列举的成分中的一种或组合一起掺入适当的溶剂中来制备。一般而言,通过将组合物掺入含有基础分散介质和来自以上所列举的那些的所需的其他成分的无菌媒介物中来制备分散体。
当包含单倍体和瓶形单倍体的组合物被适当地保护时,如上所述,组合物可配制用于口服施用,例如,与惰性稀释剂或可同化的可食用载体一起。组合物和其他成分也可包封在硬壳或软壳明胶胶囊中,压制成片剂,或直接掺入受试者的饮食中。对于口服治疗性施用,组合物可掺入赋形剂并且以可摄取片剂、经颊片剂、锭剂、胶囊、酏剂、混悬液、糖浆、干胶片等形式使用。当然,组合物和制剂的百分比可以变化。此类治疗有用的组合物中的单倍体和瓶形单倍体的量是使得将获得合适的剂量。
以易于施用和实现剂量均匀性的剂量单位形式配制组合物可以是有利的。每个剂量单位形式含有经计算用以产生所述量的活性效应产物的预定量的单倍体和瓶形单倍体以及药物载体。新剂量单位形式的规格取决于靶向模板化组装组合物的独特特征,以及待实现的特定治疗效果。剂量参考成分的常用剂量和施用方式来确定。
单倍体和瓶形单倍体组合物可包含药学上可接受的载体,使得载体可掺入组合物中并施用于患者而不引起不可接受的生物效应或以不可接受的方式与组合物的其他组分相互作用。此类药学上可接受的载体通常满足毒理学和制造测试的所需标准,并且包括由美国食品和药物管理局(U.S.Food and Drug Administration)鉴定为合适的非活性成分的那些材料。
单倍体和瓶形单倍体也可以制备为药学上可接受的盐。此类盐可以是例如由可接受施用于如哺乳动物的患者的碱或酸制备的盐(例如,对于给定的剂量方案具有可接受的哺乳动物安全性的盐)。然而,应理解,本文所涵盖的盐不需要是药学上可接受的盐,如不旨在用于施用于患者的单倍体的盐。药学上可接受的盐可衍生自药学上可接受的无机或有机碱和药学上可接受的无机或有机酸。此外,当单倍体同时含有碱性部分(如胺)和酸性部分(如羧酸)时,可形成两性离子并且包括在如本文所用的术语“盐”之内。由药学上可接受的无机碱衍生的盐可包括:铵盐、钙盐、铜盐、三价铁盐、亚铁盐、锂盐、镁盐、锰盐、二价锰盐、钾盐、钠盐、以及锌盐等。由药学上可接受的有机碱衍生的盐可包括以下各项的盐:伯胺、仲胺和叔胺、包括取代胺、环胺、天然存在的胺等,如精氨酸、甜菜碱、咖啡因、胆碱、N,N-二苄基乙二胺、二乙胺、2-二乙氨基乙醇、2-二甲氨基乙醇、乙醇胺、乙二胺、N-乙基吗啉、N-乙基哌啶、葡糖胺、葡萄糖胺、组氨酸、哈胺(hydrabamine)、异丙基胺、赖氨酸、甲基葡糖胺、吗啉、哌嗪、哌啶、聚胺树脂、普鲁卡因、嘌呤类、可可碱、三乙胺、三甲胺、三丙胺、氨丁三醇等。由药学上可接受的无机酸衍生的盐可包括以下各项的盐:硼酸、碳酸、氢卤酸(氢溴酸、盐酸、氢氟酸或氢碘酸)、硝酸、磷酸、氨基磺酸和硫酸。由药学上可接受的有机酸衍生的盐可包括以下各项的盐:脂族羟基酸(例如,柠檬酸、葡糖酸、乙醇酸、乳酸、乳糖酸、苹果酸和酒石酸)、脂族一元羧酸(例如,乙酸、丁酸、甲酸、丙酸和三氟乙酸)、氨基酸(例如,天冬氨酸和谷氨酸)、芳族羧酸(例如,苯甲酸、对氯苯甲酸、二苯基乙酸、龙胆酸、马尿酸和三苯基乙酸)、芳族羟基酸(例如,邻羟基苯甲酸、对羟基苯甲酸、1-羟基萘-2-羧酸和3-羟基萘-2-羧酸)、抗坏血酸、二羧酸(例如,富马酸、马来酸、草酸和琥珀酸)、葡糖醛酸、扁桃酸、粘酸、烟酸、乳清酸、双羟萘酸、泛酸、磺酸(例如,苯磺酸、樟脑磺酸、乙二磺酸(edisylic acid)、乙烷磺酸、羟乙磺酸、甲烷磺酸、萘磺酸、萘-1,5-二磺酸、萘-2,6-二磺酸以及对甲苯磺酸)、羟萘甲酸等。
通过本文所述的方法产生的效应蛋白是驱动期望作用的触发物。期望蛋白活性的一些实例可包括但不限于诱导免疫应答、程序性细胞死亡、细胞凋亡、非特异性或程序性坏死、裂解、生长抑制、病毒感染的抑制、病毒复制的抑制、癌基因表达的抑制、基因表达的修饰、微生物感染的抑制和微生物复制的抑制,以及这些生物活性的组合。在一些实施方案中,所产生的蛋白质可以充当抗体的配体以在致病细胞的位点处诱导免疫应答,或将抗体导向的疗法(如携带治疗有效负载的抗体)定位至致病细胞的位点。在一些实施方案中,所产生的蛋白质可以调节靶基因的表达。在一些实施方案中,所产生的蛋白质可以调控酶活性、基因/蛋白质表达、分子信号传导和分子相互作用。
提出了以下代表性实施方案:
实施方案1.一种包含多核苷酸的瓶形单倍体,其中所述多核苷酸包括:a)第一3’茎部,其包括约10至约20个核苷酸碱基;b)反靶环部分,其包括约16至约40个核苷酸碱基,与所述第一3’茎部连接,其中所述反靶环部分与靶核酸分子基本上互补;以及c)第二5’茎部,其包括约10至约20个核苷酸碱基,与所述反靶环部分连接,其中所述第一3’茎部与所述第二5’茎部基本上互补;
其中:所述多核苷酸的5’末端包含-SH部分;并且反靶环部分:靶核酸分子的Tm大于第一茎部:第二茎部的Tm
实施方案2.一种包含多核苷酸的瓶形单倍体,其中所述多核苷酸包括:a)第一3’茎部,其包括约10至约20个核苷酸碱基;b)反靶环部分,其包括约16至约40个核苷酸碱基,与所述第一3’茎部连接,其中所述反靶环部分与靶核酸分子基本上互补;以及c)第二5’茎部,其包括约10至约20个核苷酸碱基,与所述反靶环部分连接,其中所述第一3’茎部与所述第二5’茎部基本上互补;其中:反靶环部分:靶核酸分子的Tm大于第一茎部:第二茎部的Tm,并且所述多核苷酸的5’末端或3’末端与N末端蛋白质片段的C末端或C末端蛋白质片段的N末端连接,其中与所述多核苷酸连接的所述蛋白质片段的所述末端包含半胱氨酸或硒代半胱氨酸。
实施方案3.根据实施方案1或实施方案2所述的瓶形单倍体,其中从所述反靶环部分:靶核酸分子的Tm中减去所述第一茎部:第二茎部的Tm为约10℃至约40℃。
实施方案4.根据实施方案1至3中任一项所述的瓶形单倍体,其中所述第一茎部:第二茎部的Tm为约40℃至约50℃。
实施方案5.根据实施方案1至4中任一项所述的瓶形单倍体,其中所述反靶环部分:靶核酸分子的Tm为约60℃至约80℃。
实施方案6.根据实施方案1至5中任一项所述的瓶形单倍体,其中从所述反靶环部分:靶核酸分子的Tm中减去所述第一茎部:第二茎部的Tm为约10℃至约20℃。
实施方案7.根据实施方案1至6中任一项所述的瓶形单倍体,其中所述第一茎部包括约12至约18个核苷酸碱基。
实施方案8.根据实施方案1至7中任一项所述的瓶形单倍体,其中所述反靶环部分包括约18至约35个核苷酸碱基。
实施方案9.根据实施方案1至8中任一项所述的瓶形单倍体,其中所述第二茎部包括约12至约18个核苷酸碱基。
实施方案10.根据实施方案1至9中任一项所述的瓶形单倍体,其中所述第一茎部、所述反靶环部分以及所述第二茎部中的任何一个或多个的核苷酸碱基选自由以下各项组成的组:DNA核苷酸、RNA核苷酸、硫代磷酸酯修饰的核苷酸、2-O-烷基化的RNA核苷酸、卤代核苷酸、锁核酸核苷酸(LNA)、肽核酸(PNA)、吗啉代核酸类似物(吗啉代化合物)、假尿苷核苷酸、黄嘌呤核苷酸、次黄嘌呤核苷酸、2-脱氧肌苷核苷酸、具有L-核糖的DNA类似物(L-DNA)、Xeno核酸(XNA)类似物,或能够形成碱基对的其他核酸类似物,或具有改变的主链的人工核酸类似物,或其任何组合。
实施方案11.根据实施方案1至10中任一项所述的瓶形单倍体,还包括在所述第一茎部与所述反靶环部分之间,或所述反靶环部分与所述第二茎部之间中的任何一者或多者的接头。
实施方案12.根据实施方案11所述的瓶形单倍体,其中所述接头选自由以下各项组成的组:烷基、烯基、酰胺、酯、硫酯、酮、醚、硫醚、二硫化物、乙二醇、环烷基、苄基、杂环基、马来酰亚胺基、腙、聚氨酯、唑类、亚胺、卤代烷基,以及氨基甲酸酯,或其任何组合。
实施方案13.一种单倍体,其包含:a)多核苷酸;以及b)N末端蛋白质片段或C末端蛋白质片段,其中所述多核苷酸的3’或5’末端与所述C末端蛋白质片段的N末端或所述N末端蛋白质片段的C末端连接;其中:所述N末端片段包含APIVTCRKLDGREKPFKVDVATAQAQARKAGLTTGKSGDPHRYFAGDHIRWGVNNCDKADAILWEYPIYWVGKNAEWAKDVKTSQQKG(SEQ ID NO:1)的氨基酸序列,并且所述C末端片段包含GPTPIRVVYANSRGAVQYCGVMTHSKVDKNNQGKEFFEKCD(SEQ IDNO:2)的氨基酸序列;所述N末端片段包含APIVTCRPKLDG(SEQ ID NO:3)的氨基酸序列,并且所述C末端片段包含REKPFKVDVATAQAQARKAGLTTGKSGDPHRYFAGDHIRWGVNNCDKADAILWEYPIYWVGKNAEWAKDVKTSQQKGGPTPIRVVYANSRGAVQYCGVMTHSKVDKNNQGKEFFEKCD(SEQ ID NO:4)的氨基酸序列;所述N末端片段包含APIVTCRPKLDGREKPFKVDVATAQAQARKAGLTTGK(SEQ ID NO:5)的氨基酸序列,并且所述C末端片段包含SGDPHRYFAGDHIRWGVNNCDKADAILWEYPIYWVGKNAEWAKDVKTSQQKGGPTPIRVVYANSRGAVQYCGVMTHSKVDKNNQGKEFFEKCD(SEQ ID NO:6)的氨基酸序列;所述N末端片段包含APIVTCRPKLDGREKPFKVDVATAQAQARKAGLTTGKSGDPHRYFAGDHIRWGVNNCDKAD(SEQ ID NO:7)的氨基酸序列,并且所述C末端片段包含AILWEYPIYWVGKNAEWAKDVKTSQQKGGPTPIRVVYANSRGAVQYCGVMTHSKVDKNNQGKEFFEKCD(SEQ ID NO:8)的氨基酸序列;所述N末端片段包含APIVTCRPKLDGREKPFKVDVATAQAQARKAGLTTGKSGDPHRYFAGDHIRWGVNNCDKADAILWEYPIYWVG(SEQ ID NO:9)的氨基酸序列,并且所述C末端片段包含KNAEWAKDVKTSQQKGGPTPIRVVYANSRGAVQYCGVMTHSKVDKNNQGKEFFEKCD(SEQ ID NO:10)的氨基酸序列;所述N末端片段包含APIVTCRPKLDGREKPFKVDVATAQAQARKAGLTTGKSGDPHRYFAGDHIRWGVNNCDKADAILWEYPIYWVGKNAEWAKD(SEQ ID NO:11)的氨基酸序列,并且所述C末端片段包含VKTSQQKGGPTPIRVVYANSRGAVQYCGVMTHSKVDKNNQGKEFFEKCD(SEQ ID NO:12)的氨基酸序列;所述N末端片段包含APIVTCRPKLDGREKPFKVDVATAQAQARKAGLTTGKSGDPHRYFAGDHIRWGVNNCDKADAILWEYPIYWVGKNAEWAKDVKTSQ(SEQ ID NO:13)的氨基酸序列,并且所述C末端片段包含QKGGPTPIRVVYANSRGAVQYCGVMTHSKVDKNNQGKEFFEKCD(SEQ ID NO:14)的氨基酸序列;所述N末端片段包含APIVTCRPKLDGREKPFKVDVATAQAQARKAGLTTGKSGDPHRYFAGDHIRWGVNNCDKADAILWEYPIYWVGKNAEWAKDVKTSQQKGGPTPIRVVYANSRG(SEQ ID NO:15)的氨基酸序列,并且所述C末端片段包含AVQYCGVMTHSKVDKNNQGKEFFEKCD(SEQ ID NO:16)的氨基酸序列;所述N末端片段包含APIVTCRPKLDGREKPFKVDVATAQAQARKAGLTTGKSGDPHRYFAGDHIRWGVNNCDKADAILWEYPIYWVGKNAEWAKDVKTSQQKGGPTPIRVVYANSRGAVQYCGVMTHSKVDKN(SEQ ID NO:17)的氨基酸序列,并且所述C末端片段包含NQGKEFFEKCD(SEQ ID NO:18)的氨基酸序列;或所述N末端片段包含APIVTCRPKLDGREKPFKVDVATAQAQARKAGLT;(SEQ ID NO:40)的氨基酸序列,并且所述C末端片段包含TGKSGDPHRYFAGDHIRWGVNNCDKADAILWEYPIYWVGKNAEWAKDVKTSQQKGGPTPIRVVYANSRGAVQYCGVMTHSKVDKNNQGKEFFEKCD(SEQ ID NO:41)的氨基酸序列。
实施方案14.一种表面靶标化合物,其包含:a)模板多核苷酸;以及b)肽;其中:所述多核苷酸的5’末端与所述肽的N末端或C末端偶联,或所述多核苷酸的3’末端与所述肽的N末端或C末端偶联;并且所述肽是细胞表面分子的配体。
实施方案15.根据实施方案14所述的表面靶标化合物,其中所述配体是肽激素或神经肽。
实施方案16.根据实施方案15所述的表面靶标化合物,其中所述肽激素选自由以下各项组成的组:α-MSH、胰淀素、抗苗勒管激素、脂联素、心房肽、人生长激素、促性腺激素释放激素、抑制素、生长抑素、促肾上腺皮质激素、血管加压素、血管活性肠肽、胃泌素、分泌素、抑胃多肽、胃动素、铁调素、肾素、松弛素、胃饥饿素、瘦素、促脂解素、血管紧张素I、血管紧张素II、缓激肽、降血钙素、胰岛素、胰高血糖素、胰岛素样生长因子I、胰岛素样生长因子II、胰高血糖素样肽I、胰多肽、促代谢因子、缩胆囊素、内皮素、促红细胞生成素、促血小板生成素、卵泡刺激素、人绒毛膜促性腺激素、人胎盘催乳素、催乳素、催乳素释放激素、促黄体激素、促甲状腺激素、促甲状腺激素释放激素、甲状旁腺激素以及垂体腺苷酸环化酶激活肽。
实施方案17.根据实施方案15所述的表面靶标化合物,其中所述神经肽选自由以下各项组成的组:神经肽Y、内啡肽、脑啡肽、脑利钠肽、速激肽、皮质抑素、甘丙肽、食欲素和催产素。
实施方案18.根据实施方案14所述的表面靶标化合物,其中所述多核苷酸包含核苷酸序列AAGCCACTGTGTCCTGAAGAAAAGCAAAGACATC(SEQ ID NO:20),并且所述肽包含氨基酸序列SYSMEHFRWGKPVGGGSSGGGC(SEQ ID NO:21)、SYSXEHFRWGKPVGGGSSGGGC(SEQ ID NO:22)、CSGGGSSGGGSYSMEHFRWGKPV-NH2(SEQ ID NO:23)或CSGGGSSGGGSYSXEHFRWGKPV-NH2(SEQID NO:24),其中X是正亮氨酸并且F残基是D-苯丙氨酸。
实施方案19.一种融合蛋白,其包含:N末端蛋白质片段、融合配偶体蛋白和纯化结构域,其中所述N末端蛋白质片段的C末端与所述融合配偶体蛋白的N末端偶联,并且所述融合配偶体蛋白的C末端与所述纯化结构域的N末端偶联;或N末端蛋白质片段、融合配偶体蛋白和切割位点,其中所述融合配偶体蛋白的C末端与所述切割位点的N末端偶联,并且所述切割位点的C末端与所述N末端蛋白质片段的N末端偶联,其中所述N末端蛋白质片段包含N末端甲硫氨酸和C末端半胱氨酸;或C末端蛋白质片段、融合配偶体蛋白质和切割位点,其中所述融合配偶体蛋白的C末端与所述切割位点的N末端偶联,并且所述切割位点的C末端与所述C末端蛋白质片段的N末端偶联,其中所述C末端蛋白质片段包含N末端半胱氨酸。
实施方案20.根据实施方案19所述的融合蛋白,其包含:N末端蛋白质片段、内含肽和几丁质结合结构域,其中所述N末端蛋白质片段的C末端与内含肽的N末端偶联,并且内含肽的C末端与所述几丁质结合结构域的N末端偶联;或N末端蛋白质片段、麦芽糖结合蛋白和肠激酶切割位点,其中所述麦芽糖结合蛋白的C末端与所述肠激酶切割位点的N末端偶联,并且所述肠激酶切割位点的C末端与所述N末端蛋白质片段的N末端偶联,其中所述N末端蛋白质片段包含N末端甲硫氨酸和C末端半胱氨酸;或C末端蛋白质片段、麦芽糖结合蛋白和肠激酶切割位点,其中所述麦芽糖结合蛋白的C末端与所述肠激酶切割位点的N末端偶联,并且所述肠激酶切割位点的C末端与所述C末端蛋白质片段的N末端偶联,其中所述C末端蛋白质片段包含N末端半胱氨酸。
实施方案21.根据实施方案20所述的融合蛋白,其包含N末端蛋白质片段、麦芽糖结合蛋白和肠激酶切割位点,其中所述麦芽糖结合蛋白的C末端与所述肠激酶切割位点的N末端偶联,并且所述肠激酶切割位点的C末端与所述N末端蛋白质片段的N末端偶联,其中所述N末端蛋白质片段包含氨基酸序列APIVTCRPKLDGREKPFKVDVATAQAQARKAGLTTGKSGDPHRYFAGDHIRWGVNNCDKADAILWEYPIYWVGKNAEWAKDVKTSQQKGC(SEQ ID NO:25)。
实施方案22.根据实施方案19所述的融合蛋白,其包含C末端蛋白质片段、麦芽糖结合蛋白和肠激酶切割位点,其中所述麦芽糖结合蛋白的C末端与所述肠激酶切割位点的N末端偶联,并且所述肠激酶切割位点的C末端与所述C末端蛋白质片段的N末端偶联,其中所述C末端蛋白质片段包含氨基酸序列CGPTPIRVVYANSRGAVQYCGVMTHSKVDKNNQGKEFFEKCD(SEQID NO:26)。
实施方案23.一种化合物,其具有下式:
其中n为约3至约6。
实施方案24.一种组合物或试剂盒,其包含:a)第一单倍体,其中所述第一单倍体包含与N末端蛋白质片段的C末端连接的多核苷酸;以及b)第二单倍体,其中所述第二单倍体包含与C末端蛋白质片段的N末端连接的多核苷酸;其中:所述第一或第二单倍体中的一个的所述多核苷酸在其5’末端与所述蛋白质片段连接,并且所述第一和第二单倍体中的另一个在其3’末端与所述蛋白质片段连接;所述N末端蛋白质片段和所述C末端蛋白质片段来源于单一蛋白质;并且其中:所述第一单倍体的所述多核苷酸与所述第二单倍体的所述多核苷酸互补;或所述第一单倍体的所述多核苷酸与靶核酸分子互补,并且所述第二单倍体的所述多核苷酸在与所述第一单倍体的所述多核苷酸在空间上接近的位点处与所述靶核酸分子基本上互补;或所述第一单倍体的所述多核苷酸与靶核酸分子5’相邻于茎环结构的部分基本上互补,并且所述第二单倍体的所述多核苷酸与所述靶核酸分子3’相邻于所述茎环结构的部分基本上互补;或所述第一单倍体的所述多核苷酸与靶核酸分子的茎环结构的环的5’部分基本上互补,并且所述第二单倍体的所述多核苷酸与所述靶核酸分子的所述茎环结构的所述环的3’部分基本上互补。
实施方案25.一种组合物或试剂盒,其包含:a)包含多核苷酸的瓶形单倍体,所述多核苷酸包括:i)第一3’茎部,其包括约10至约20个核苷酸碱基;ii)反靶环部分,其包括约16至约40个核苷酸碱基,与所述第一3’茎部连接,其中所述反靶环部分与靶核酸分子基本上互补;以及iii)第二5’茎部,其包括约10至约20个核苷酸碱基,与所述反靶环部分连接,其中所述第一3’茎部与所述第二5’茎部基本上互补;其中:所述多核苷酸的5’末端包含-SH部分;并且反靶环部分:靶核酸分子的Tm大于第一茎部:第二茎部的Tm;b)N末端蛋白质片段,其中所述N末端蛋白质片段的C末端包含半胱氨酸-SH部分;以及c)双马来酰亚胺试剂。
实施方案26.一种组合物或试剂盒,其包含:a)包含多核苷酸的瓶形单倍体,所述多核苷酸包括:i)第一3’茎部,其包括约10至约20个核苷酸碱基;ii)反靶环部分,其包括约16至约40个核苷酸碱基,与所述第一3’茎部连接,其中所述反靶环部分与靶核酸分子基本上互补;以及iii)第二5’茎部,其包括约10至约20个核苷酸碱基,与所述反靶环部分连接,其中所述第一3’茎部与所述第二5’茎部基本上互补;其中所述多核苷酸的5’末端与N末端蛋白质片段的C末端连接,其中所述C末端包含半胱氨酸;以及b)第二单倍体,其包含多核苷酸和C末端蛋白质片段,其中所述多核苷酸的3’末端与所述C末端蛋白质片段的N末端连接,其中所述N末端包含半胱氨酸;其中:所述第二单倍体的所述多核苷酸与所述瓶形单倍体的所述多核苷酸的所述第二5’茎部基本上互补;反靶环部分:靶核酸分子的Tm大于第一茎部:第二茎部的Tm;并且所述N末端蛋白质片段和所述C末端蛋白质片段来源于单一蛋白质。
实施方案27.根据实施方案24至26中任一项所述的试剂盒或组合物,其中所述单倍体,或所述瓶形单倍体的所述第一茎部、所述反靶环部分和所述第二茎部中的任何一个或多个的核苷酸碱基选自由以下各项组成的组:DNA核苷酸、RNA核苷酸、硫代磷酸酯修饰的核苷酸、2-O-烷基化的RNA核苷酸、卤代核苷酸、锁核酸核苷酸(LNA)、肽核酸(PNA)、吗啉代核酸类似物(吗啉代化合物)、假尿苷核苷酸、黄嘌呤核苷酸、次黄嘌呤核苷酸、2-脱氧肌苷核苷酸、具有L-核糖的DNA类似物(L-DNA)、Xeno核酸(XNA)类似物,或能够形成碱基对的其他核酸类似物,或具有改变的主链的人工核酸类似物,或其任何组合。
实施方案28.根据实施方案25或实施方案26所述的试剂盒或组合物,其中从所述反靶环部分:靶核酸分子的Tm中减去所述第一茎部:第二茎部的Tm为约10℃至约40℃。
实施方案29.根据实施方案25至28中任一项所述的试剂盒或组合物,其中所述第一茎部:第二茎部的Tm为约40℃至约50℃。
实施方案30.根据实施方案25至29中任一项所述的试剂盒或组合物,其中所述反靶环部分:靶核酸分子的Tm为约60℃至约80℃。
实施方案31.根据实施方案25至30中任一项所述的试剂盒或组合物,其中从所述反靶环部分:靶核酸分子的Tm中减去所述第一茎部:第二茎部Tm的为约10℃至约20℃。
实施方案32.根据实施方案25至31中任一项所述的试剂盒或组合物,其中所述第一茎部包括约12至约18个核苷酸碱基。
实施方案33.根据实施方案25至32中任一项所述的试剂盒或组合物,其中所述反靶环部分包括约18至约35个核苷酸碱基。
实施方案34.根据实施方案25至33中任一项所述的试剂盒或组合物,其中所述第二茎部包括约12至约18个核苷酸碱基。
实施方案35.根据实施方案26所述的试剂盒或组合物,其中从所述第一茎部:第二茎部的Tm中减去由所述第二单倍体和所述瓶形单倍体的所述第一或第二茎部形成的所述双链体的Tm为约0℃至约20℃。
实施方案36.根据实施方案26所述的试剂盒或组合物,其中由所述第二单倍体和所述瓶形单倍体的所述第一或第二茎部形成的所述双链体的Tm为约30℃至约40℃。
实施方案37.根据实施方案26所述的试剂盒或组合物,其中从所述第一茎部:第二茎部的Tm中减去由所述第二单倍体和所述瓶形单倍体的所述第一或第二茎部形成的所述双链体的Tm为约5℃至约10℃。
实施方案38.根据实施方案24至37中任一项所述的试剂盒或组合物,其中所述多核苷酸和蛋白质片段各自包含生物正交反应性分子。
实施方案39.根据实施方案38所述的试剂盒或组合物,其中所述生物正交反应性分子为叠氮化物、炔、环辛炔、硝酮、降冰片烯、氧杂降冰片二烯、膦、二烷基膦、三烷基膦、膦硫醇、膦酚、环辛烯、氧化腈、硫酯、四嗪、异腈、四唑或四环烷或其任何衍生物。
实施方案40.根据实施方案25至39中任一项所述的试剂盒或组合物,还包括在所述第一茎部与所述反靶环部分之间或所述反靶环部分与所述第二茎部之间的接头。
实施方案41.根据实施方案40所述的试剂盒或组合物,其中所述接头为烷基、烯基、酰胺、酯、硫酯、酮、醚、硫醚、二硫化物、乙二醇、环烷基、苄基、杂环基、马来酰亚胺基、腙、聚氨酯、唑类、亚胺、卤代烷基、次氮基三乙酸、镍、钴、铜以及氨基甲酸酯,或其任何组合。
实施方案42.根据实施方案25至41中任一项所述的试剂盒或组合物,其中所述反靶环部分还包含内部铰链区,其中所述铰链区包括与所述靶核酸分子不互补的一个或多个核苷酸。
实施方案43.根据实施方案42所述的试剂盒或组合物,其中所述铰链区包括约1个核苷酸至约6个核苷酸。
实施方案44.根据实施方案1至14、19至22或24至43中任一项所述的单倍体、瓶形单倍体、融合蛋白或试剂盒或组合物,其中所述N末端蛋白质片段和所述C末端蛋白质片段均来源于报告蛋白、转录因子、信号转导途径因子、基因编辑蛋白、单链免疫球蛋白可变区(scFv)蛋白、毒性蛋白或酶。
实施方案45.根据实施方案44所述的单倍体、瓶形单倍体、融合蛋白或试剂盒或组合物,其中酶是β-内酰胺酶、氯霉素乙酰转移酶、氨基糖苷-3'-磷酸转移酶、β-半乳糖苷酶、二氢叶酸还原酶、限制性酶、DNA酶或RNA酶。
实施方案46.根据实施方案44所述的单倍体、瓶形单倍体、融合蛋白或试剂盒或组合物,其中所述报告蛋白是荧光蛋白、荧光素酶、氯霉素乙酰转移酶、β-半乳糖苷酶或β-葡糖醛酸酶。
实施方案47.根据实施方案46所述的单倍体、瓶形单倍体、融合蛋白或试剂盒或组合物,其中所述荧光蛋白是GFP、YFP、mCherry、dsRed、VENUS或CFP、蓝色荧光蛋白,或其任何类似物。
实施方案48.根据实施方案46所述的单倍体、瓶形单倍体、融合蛋白或试剂盒或组合物,其中所述荧光蛋白是超折叠GFP。
实施方案49.根据实施方案48所述的单倍体、瓶形单倍体、融合蛋白或试剂盒或组合物,其中所述超折叠GFP的N末端片段包含MSKGEELFTGVVPILVELDGDVNGHKFSVRGEGEGDATNGKLTLKFICTTGKLPVPWPTLVTTLTYGVQCFSRYPDHMKRHDFFKSAMPEGYVQERTISFKDDGTYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNFNSHNVYITADKQ(SEQ ID NO:33)的氨基酸序列。
实施方案50.根据实施方案48所述的单倍体、瓶形单倍体、融合蛋白或试剂盒或组合物,其中所述超折叠GFP的C末端片段包含KNGIKANFKIRHNVEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQSVLS KDPNEKRDHMVLLEFVTAAGITHGMDELYK(SEQ ID NO:34)的氨基酸序列。
实施方案51.根据实施方案46所述的单倍体、瓶形单倍体、融合蛋白或试剂盒或组合物,其中所述荧光素酶是萤火虫荧光素酶、海肾荧光素酶或Gaussia princeps荧光素酶。
实施方案52.根据实施方案51所述的单倍体、瓶形单倍体、融合蛋白或试剂盒或组合物,其中所述荧光素酶是海肾荧光素酶。
实施方案53.根据实施方案52所述的单倍体、瓶形单倍体、融合蛋白或试剂盒或组合物,其中所述海肾荧光素酶的N末端片段包含MASKVYDPEQRKRMITGPQWWARCKQMNVLDSFINYYDSEKHAENAVIFLHGNAASSYLWRHVVPHIEPVARCIIPDLIGMGKSGKSGNGSYRLLDHYKYLTAWFELLNLPKKIIFVGHDWGACLAFHYSYEHQDKIKAIVHAESVVDVIESWDEWPDIEEDIALIKSEEGEKMVLENNFFVETMLPSKIMRKLEPEEFAAYLEPFKEKGEVRRPTLSWPREIPLVKGGY(SEQ ID NO:36)的氨基酸序列。
实施方案54.根据实施方案52所述的单倍体、瓶形单倍体、融合蛋白或试剂盒或组合物,其中所述海肾荧光素酶的C末端片段包含KPDVVQIVRNYNAYLRASDDLPKMFIESDPGFFSNAIVEGAKKFPNTEFVKVKGLHFSQEDAPDEMGKYIKSFVERVLKNEQZ(SEQ ID NO:37)的氨基酸序列。
实施方案55.根据实施方案44所述的单倍体、瓶形单倍体、融合蛋白或试剂盒或组合物,其中所述毒性蛋白是蓖麻毒素A链、Aspf1、α-八叠球菌、丝林霉素、多毛菌素A、白喉毒素、肉毒杆菌A毒素或霍乱毒素。
实施方案56.根据实施方案44所述的单倍体、瓶形单倍体、融合蛋白或试剂盒或组合物,其中所述毒性蛋白是切割大28S核糖体RNA的核糖毒素。
实施方案57.根据实施方案1至14、19至22或24至43中任一项所述的单倍体、瓶形单倍体、融合蛋白或试剂盒或组合物,其中所述靶核酸分子是细胞核酸分子、肿瘤特异性核酸分子、异常免疫途径核酸分子或表面靶标化合物的多核苷酸。
实施方案58.根据实施方案24至43中任一项所述的组合物或试剂盒,还包含蛋白质伴侣、小分子伴侣或药物伴侣。
实施方案59.根据实施方案58所述的组合物或试剂盒,其中所述蛋白质伴侣是热休克蛋白。
实施方案60.根据实施方案58所述的组合物或试剂盒,其中所述小分子伴侣是丁酸4-苯基酯、去氧胆酸、熊去氧胆酸、牛磺酸-去氧胆酸、溶血磷脂酸、海藻糖、甘露醇、三甲胺氧化物、甜菜碱或二甲亚砜。
实施方案61.根据实施方案19至22中任一项所述的融合蛋白,其中所述融合配偶体蛋白是内含肽、麦芽糖结合蛋白、谷胱甘肽-S-转移酶、β-半乳糖苷酶或Omp F。
实施方案62.根据实施方案19至22中任一项所述的融合蛋白,其中所述切割位点是肠激酶切割位点或因子Xa蛋白酶切割位点。
实施方案63.根据实施方案62所述的融合蛋白,其中所述因子Xa蛋白酶切割位点是IEGR(SEQ ID NO:27)。
实施方案64.根据实施方案19至22中任一项所述的融合蛋白,其中所述纯化结构域是几丁质结合结构域或六组氨酸标签。
实施方案65.一种用于蛋白质在细胞中的定向组装的方法,其包括:a)使细胞与第一单倍体接触,所述第一单倍体包含与N末端蛋白质片段的C末端连接的多核苷酸;以及b)使所述细胞与第二单倍体接触,所述第二单倍体包含与C末端蛋白质片段的N末端连接的多核苷酸;其中:所述第一或第二单倍体中的一个的所述多核苷酸在其5’末端与所述蛋白质片段连接,并且所述第一和第二单倍体中的另一个在其3’末端与所述蛋白质片段连接;所述N末端蛋白质片段和所述C末端蛋白质片段来源于单一蛋白质;并且其中:所述第一单倍体的所述多核苷酸与所述第二单倍体的所述多核苷酸基本上互补;或所述第一单倍体的所述多核苷酸与靶核酸分子基本上互补,并且所述第二单倍体的所述多核苷酸在与所述第一单倍体的所述多核苷酸在空间上接近的位点处与所述靶核酸分子基本上互补;或所述第一单倍体的所述多核苷酸与靶核酸分子5’相邻于茎环结构的部分基本上互补,并且所述第二单倍体的所述多核苷酸与所述靶核酸分子3’相邻于所述茎环结构的部分基本上互补;或所述第一单倍体的所述多核苷酸与靶核酸分子的茎环结构的环的5’部分基本上互补,并且所述第二单倍体的所述多核苷酸与所述靶核酸分子的所述茎环结构的所述环的3’部分基本上互补;从而导致由所述N末端蛋白质片段和所述C末端蛋白质片段组装所述蛋白质。
实施方案66.一种用于蛋白质的定向组装的方法,其包括:a)使靶核酸分子与瓶形单倍体接触,所述瓶形单倍体包括:i)第一3’茎部,其包括约10至约20个核苷酸碱基;ii)反靶环部分,其包括约16至约40个核苷酸碱基,与所述第一3’茎部连接,其中所述反靶环部分与靶核酸分子基本上互补;以及iii)第二5’茎部,其包括约10至约20个核苷酸碱基,与所述反靶环部分连接,其中所述第一3’茎部与所述第二5’茎部基本上互补;其中所述多核苷酸的5’末端与N末端蛋白质片段的C末端连接,其中所述C末端包含半胱氨酸;以及b)使所述瓶形单倍体与第二单倍体接触,所述第二单倍体包含与C末端蛋白质片段的N末端连接的多核苷酸,其中所述第二单倍体的所述多核苷酸与所述瓶形单倍体的所述多核苷酸的所述第二5’茎部基本上互补;其中:所述N末端蛋白质片段和所述C末端蛋白质片段来源于单一蛋白质;反靶环部分:靶核酸分子的Tm大于第一茎部:第二茎部的Tm;并且从所述第一茎部:第二茎部的Tm中减去由所述第二单倍体和所述瓶形单倍体的所述第二茎部形成的双链体的Tm为约0℃至约20℃;从而导致由所述N末端蛋白质片段和所述C末端蛋白质片段组装所述蛋白质。
实施方案67.一种用于蛋白质的定向组装的方法,其包括:a)使细胞与表面靶标化合物接触,所述表面靶标化合物包含:i)模板多核苷酸;以及ii)肽;其中:所述多核苷酸的5’末端与所述肽的N末端或C末端偶联,或所述多核苷酸的3’末端与所述肽的N末端或C末端偶联;并且所述肽是细胞表面分子的配体;b)使所述细胞与第一单倍体接触,所述第一单倍体包含与N末端蛋白质片段的C末端连接的多核苷酸;以及c)使所述细胞与第二单倍体接触,所述第二单倍体包含与C末端蛋白质片段的N末端连接的多核苷酸;其中:所述第一或第二单倍体中的一个的所述多核苷酸在其5’末端与所述蛋白质片段连接,并且所述第一和第二单倍体中的另一个在其3’末端与所述蛋白质片段连接;所述N末端蛋白质片段和所述C末端蛋白质片段来源于单一蛋白质;并且所述第一单倍体的所述多核苷酸与所述表面靶标化合物的所述模板多核苷酸基本上互补,并且所述第二单倍体的所述多核苷酸在与所述第一单倍体的所述多核苷酸在空间上接近的位点处与所述表面靶标化合物的所述模板多核苷酸基本上互补;从而导致由所述N末端蛋白质片段和所述C末端蛋白质片段组装所述蛋白质。
实施方案68.一种用于蛋白质的定向组装的方法,其包括:a)使细胞与表面靶标化合物接触,所述表面靶标化合物包含:i)模板多核苷酸;以及ii)肽;其中:所述多核苷酸的5’末端与所述肽的N末端或C末端偶联,或所述多核苷酸的3’末端与所述肽的N末端或C末端偶联;并且所述肽是细胞表面分子的配体;b)使靶核酸分子与瓶形单倍体接触,所述瓶形单倍体包含:i)第一3’茎部,其包括约10至约20个核苷酸碱基;ii)反靶环部分,其包括约16至约40个核苷酸碱基,与所述第一3’茎部连接,其中所述反靶环部分与所述表面靶标化合物的所述模板多核苷酸基本上互补;以及iii)第二5’茎部,其包括约10至约20个核苷酸碱基,与所述反靶环部分连接,其中所述第一3’茎部与所述第二5’茎部基本上互补;其中所述多核苷酸的5’末端与N末端蛋白质片段的C末端连接,其中所述C末端包含半胱氨酸;以及c)使所述瓶形单倍体与第二单倍体接触,所述第二单倍体包含与C末端蛋白质片段的N末端连接的多核苷酸,其中所述第二单倍体的所述多核苷酸与所述瓶形单倍体的所述多核苷酸的所述第二5’茎部基本上互补;其中:所述N末端蛋白质片段和所述C末端蛋白质片段来源于单一蛋白质;反靶环部分:靶核酸分子的Tm大于第一茎部:第二茎部的Tm;并且从所述第一茎部:第二茎部的Tm中减去由所述第二单倍体和所述瓶形单倍体的所述第二茎部形成的双链体的Tm为约0℃至约20℃;从而导致由所述N末端蛋白质片段和所述C末端蛋白质片段组装所述蛋白质。
实施方案69.一种从融合蛋白中的内含肽融合配偶体中切割N末端蛋白质片段的方法,其包括:a)使所述融合蛋白与2-巯基乙烷磺酸接触;以及b)使所述融合蛋白与具有甲基四嗪基团的半胱氨酸接触;从而从所述融合蛋白中释放出所述N末端蛋白质片段。
实施方案70.根据实施方案69所述的方法,其中具有甲基四嗪基团的所述半胱氨酸是
实施方案71.根据实施方案69所述的方法,还包括使所述N末端蛋白质片段与具有5’或3’反式环辛烯基团的多核苷酸反应。
为了可以更有效地理解本文公开的主题,下文提供了实施例。应理解,这些实施例仅出于说明性目的且不应解释为以任何方式限制要求保护的主题。除非另有说明,否则在这些实施例中,分子克隆反应和其他标准重组DNA技术使用可商购获得的试剂,根据Maniatis等人,Molecular Cloning-A Laboratory Manual,第2版,Cold Spring HarborPress(1989)中所述的方法进行。
实施例
实施例1:基于内含肽的系统中的蛋白质溶解度-N末端sfGFP片段的表达
在与核酸标签缀合之前,SP-TAPER的实施提供整个目标蛋白质的预定多肽片段的表达。为此,针对所需的分裂蛋白片段,对合适的细菌表达系统进行评估。在原核系统中的成功表达的一个方面是蛋白质溶解度的维持。尽管不溶性包涵体通常可以重新溶解,但如果可能的话,优选避免这一耗时步骤。
两种单独的报告蛋白被考虑用于初始SP-TAPER:sfGFP和海肾荧光素酶。sfGFP蛋白在环区域的位点处分成分别为157和81个氨基酸残基的N末端和C末端片段。基于与常规蛋白质互补测定相容的切割位点的先前筛选,将海肾荧光素酶分成分别为229和81个残基的N末端和C末端片段(Paulmurugan等人,Anal.Chem.,203,75,1584-1589)。
在sfGFP和海肾荧光素酶模型系统中,所选N末端片段显著长于其相应的C末端片段。虽然在原核表达系统中的蛋白质片段不溶性受多种因素的影响,但所表达的片段越长,包含疏水区(hydrophobic tract)(通常用正确折叠的全长蛋白质包装)且从而遇到溶解性问题的可能性越大。因此,最初在基于内含肽的表达系统(New England Biolabs)中对较长的sfGFP和海肾N末端片段进行检查。将针对在大肠杆菌中的表达进行优化的每个片段的编码序列插入基于内含肽的表达载体pTXB1(New England Biolabs)的Nde I/Sap I克隆位点中,使得产生正确的连接序列和阅读框,其中期望的编码序列被克隆为具有可切割的内含肽结构域序列的5’框内融合体,继而与亲和可选择的几丁质结合结构域的编码序列融合(通过候选克隆的测序确认)。
将经过验证的质粒克隆转染到大肠杆菌菌株T7express(New England Biolabs)中,并在37℃、短期生长条件下在液体培养基(50ml)中增殖1.5小时,然后再用400μM IPTG诱导2小时。获得样品(200μl“直接裂解物”),在1.5ml管中以1000g沉淀,用200μl的1X PBS洗涤一次,并重悬于50μl PBS中。将50ml生长物的其余部分沉淀(在Sorvall台式离心机中,10分钟,3000rpm),并且在2.0ml Eppendorf管中重悬于具有1%蛋白酶抑制剂混合物(Sigma P3840)的1.5ml的冰冷TXB柱缓冲液(20mM HEPES pH 8.5、500mM NaCl和0.05%Triton-X100)中。然后对细胞悬浮液进行超声处理(6x 5秒脉冲,5-设定值,Branson450Sonifier,在每轮超声处理之间冷却),以14000rpm离心5分钟(台式微量离心机),并将上清液移除至新管中。
将上述上清液和直接裂解物的样品(50μl)与等体积的标准2X Laemmli SDS-PAGE裂解缓冲液(Bio-Rad)混合,并将样品在100℃下加热5分钟。然后将这些样品上样到SDS-PAGE凝胶(5μl/泳道;“any-kD”TGX凝胶,Bio-Rad)上、固定,并用SYPRO-Ruby(Thermo)染色过夜。脱色后,用UV透照仪使凝胶可视化。在IPTG诱导的培养物的全细胞裂解物样品中观察到预期分子量的sfGFP和海肾荧光素酶N末端融合体片段(参见图11),但是海肾条带强度明显小于sfGFP。超声处理后,sfGFP条带在澄清上清液中容易观察到,但观察不到海肾条带。这些结果表明,这种基于内含肽的系统在所用条件下与海肾片段表达的相容性很差。另一方面,sfGFP N末端片段是可溶的并且以良好的收率表达,并与制备特定缀合物的进一步处理相容。
实施例2:N末端sfGFP-内含肽融合体的亲和纯化和内含肽介导的固相切割
当在基于内含肽的系统中表达为融合蛋白时(在实施例1中描述),N末端sfGFP片段的溶解度表明进一步检查游离N末端片段本身的制备是恰当的。通过融合蛋白的几丁质结合结构域区段(参见图11),全细胞超声处理上清液中的可溶性N末端sfGFP融合片段与几丁质磁珠(CMB;New England Biolabs)结合,方式如下:对菌株T7Express中的编码N末端sfGFP-内含肽-几丁质结合结构域融合体的质粒的重复的50ml生长物进行增殖,用100μMIPTG诱导,并获得全细胞裂解物样品。随后制备超声处理的澄清上清液;这些初始步骤以与实施例1类似的方式进行。将合适量的CMB(各自具有100μl珠子浆液的2个管)用0.5ml的冰冷TXB缓冲液(参见实施例1)洗涤两次(使用珠子的磁力分离),然后以原始体积(100μl)重悬于TXB缓冲液中。向每个管中添加1.25ml的N末端sfGFP融合蛋白的经诱导的超声处理上清液,并在4℃下温育1小时,将管频繁倒置以进行混合。在此之后,将珠子磁力分离,移除上清液,并用TXB缓冲液对珠子进行三次洗涤,最后在相同缓冲液中汇集成悬浮液,最终总体积为200μl。
然后对通过融合蛋白的几丁质结合结构域保留在几丁质磁珠上的材料进行一系列处理,以检查用于制备分离的N末端sfGFP片段的最佳方法。在此系统中,在插入多肽连接点处用适当的硫醇试剂激活内含肽可以导致期望多肽片段的切割和释放,同时内含肽-几丁质结合结构域区段保持与几丁质珠结合。试剂2-巯基乙烷磺酸(MESNA)常用于此目的。内含肽切割产物的溶解度和其他特性可以通过改变氯化钠浓度进行调节。因此,在25℃下温育16小时,使用若干MESNA/盐条件测试携带N末端sfGFP融合体的几丁质珠。对于每种实验条件,在40μl的总体积中使用20μl经洗涤的几丁质磁珠/融合蛋白浆液。在温育期结束时,磁力移除上清液。保留珠子沉淀并用0.5ml的TXB缓冲液洗涤两次,然后在30μl相同缓冲液中重构。在所有情况下,将25或30μl样品与等体积的2X Laemmli SDS-PAGE上样缓冲液混合,并在100℃下加热5分钟,然后将5μl样品上样到SDS-PAGE凝胶上。
在此代表性实施例中,实现了全细胞裂解物中sfGFP融合体的诱导,以及含有可溶性融合体的上清液的衍生(参见泳道1和2,图12)。携带N末端sfGFP融合体的几丁质珠在TCB缓冲液中过夜温育之后,未观察到蛋白质的非特异性洗脱,但是低水平的自发切割的内含肽-几丁质结合结构域(约28kD)和N末端sfGFP(约17kD)保持与珠子缔合(参见泳道aS/aP;图12)。比常用的10mM更高浓度的MESNA(New England Biolabs)更加有效地在可溶性上清液中产生切割的N末端sfGFP片段(参见泳道组b(10mM MESNA)相对于泳道组c(75mMMESNA))。在这些MESNA温育期间,显著量的内含肽-几丁质结合结构域以及预期释放的N末端sfGFP片段从珠子中浸出。然而,这种不希望的效果可通过更高的氯化钠浓度抑制(参见泳道组f(75mM MESNA/1.4M NaCl)相对于泳道组g(75mM MESNA/2.3M NaCl))。
这些结果表明,N末端sfGFP片段可以通过基于内含肽的系统成功制备,并且此外,通过携带甲基四嗪基团的修饰半胱氨酸,得到具有寡核苷酸的C末端缀合策略,如上所述。
实施例3:作为麦芽糖结合蛋白融合体的C末端sfGFP和海肾片段的表达和纯化,以及利用肠激酶实现的片段切割
对于sfGFP和海肾荧光素酶的C末端片段的表达和此类产物的N末端(N*)的标记,使用麦芽糖结合蛋白的另选表达系统在技术上比实施例1和2的内含肽系统更便利。此外,在所选C末端区段内均不具有半胱氨酸残基的模型蛋白sfGFP和海肾荧光素酶的情况下,通过插入N末端半胱氨酸实现寡核苷酸缀合成为一个简便选项。
每个C末端区段的编码序列(如实施例1所述的边界)在期望的N末端位置处提供有半胱氨酸密码子,并且此外,装配有肠激酶识别信号(DDDDK的密码子;SEQ ID NO:44),使得在表达后,C末端片段可以从麦芽糖结合载体蛋白上切割下来。将组装的序列克隆到pMALc5x(New England Biolabs)的Xmn I位点与Sbf I位点之间,并通过测序确认候选克隆的结构。将经过验证的克隆转化到菌株NEB-express(New England Biolabs)中,并在37℃、短期生长条件下在液体培养基(50ml)中增殖1.5小时,然后再用300μM IPTG诱导2小时。获取样品(200μl“直接裂解物”),在1.5ml管中以1000g沉淀,用200μl的1X PBS洗涤一次,并重悬于50μl PBS中。将50ml生长物的其余部分沉淀(在Sorvall台式离心机中,10分钟,3000rpm),并且在2.0ml Eppendorf管中重悬于1.5ml的冰冷麦芽糖结合蛋白系统柱缓冲液(MC缓冲液;20mM Tris pH 7.4、200mM NaCl、1mM EDTA和1mM DTT)中,然后通过与实施例1所用的相同条件对其进行超声处理并澄清化,以得到可溶性上清液。在SDS-PAGE凝胶上,此类上清液显示出预期分子量的强条带(参见图13,对于sfGFP和海肾制备物,分别为泳道G和R)。这些模型报告蛋白的C末端片段具有相似的分子量(对于sfGFP和海肾,分别为9.1kD和9.4kD)。因此,两个片段的所观察到的MBP融合蛋白条带以约51kD的预期大小迁移(参见图13)。
表达为具有麦芽糖结合蛋白的融合体的多肽在直链淀粉磁珠(A-MB;New EnglandBiolabs)上进行亲和纯化。将合适的A-MB样品(通常相当于每1ml上清液250μl原始浆液)用1ml冷MC缓冲液洗涤两次(使用磁力分离以下拉A-MB),并重悬于原始体积中。将来自诱导的质粒培养物的超声处理的上清液与A-MB在4℃下混合1小时,将管频繁倒置以将珠子重悬。此后,磁力除去上清液,并且用0.5ml冷MC缓冲液洗涤珠子四次,然后重悬于150μl的相同缓冲液/250μl原始珠子中。然后在25℃下持续1小时用终浓度10mM的麦芽糖洗脱结合的蛋白质。
具有MBP的分离的蛋白质融合体接着需要用肠激酶处理,以便从MBP载体中释放游离的目标多肽片段。两种融合体都是可切割的,从而产生预期片段(参见图13)。在此实施例的条件下,用恒定量的肠激酶切割在1小时达到峰值,并且不因延长的温育时间进一步增强(参见图13)。
实施例4:作为麦芽糖结合蛋白融合体的N末端sfGFP和海肾片段的表达和纯化,以及利用肠激酶实现的片段切割
由于海肾荧光素酶N末端片段难以与内含肽-几丁质结合结构域融合体形成可溶性融合体(参见实施例1),因此使用用于将用于SP-TAPER的N末端片段表达为C末端MBP融合体的MBP系统。使用校正DNA聚合酶系统(Phusion,Thermo),通过用携带适当改变的引物扩增编码序列,使如用于基于内含肽的系统(参见实施例1)的海肾的N末端编码序列适合于框内C末端表达为MBP融合体。同时,出于比较目的,对相应的sfGFP序列进行类似操纵。将扩增区段用Xmn I和Sbf I消化(在引物中存在,但在编码序列内不存在)并以与实施例3类似的方式插入pMALc5x中。然而,在这种情况下,半胱氨酸密码子置于这些编码序列的3’末端,使得半胱氨酸残基将在C*末端表达。如在C末端片段表达中(参见实施例3)一样,也将肠激酶的切割位点插入MBP编码序列的末端与N末端sfGFP和海肾片段的编码序列的起始点之间(示意性地描绘于图14中)。通过测序确认候选克隆的结构。将经过验证的克隆转化到菌株NEB-express(New England Biolabs)中,并以与实施例3相同的方式增殖以进行IPTG诱导,作为直接裂解物样品,超声处理以初始产生上清液,结合并从直链淀粉磁珠(A-MB)上洗脱。
据发现,sfGFP和海肾N末端片段均可表达为具有MBP的可溶性融合蛋白。仅在IPTG诱导后在SDS-PAGE凝胶上的直接裂解物样品中观察到两者(参见图14,泳道1相对于2;泳道3相对于4)。此外,两个经过诱导的融合体条带均存在于超声处理的上清液中(参见图14,对于sfGFP和海肾N末端片段,分别为泳道5和8)。继而,两者均可用麦芽糖从A-MB上结合洗脱(参见图14,对于sfGFP和海肾N末端片段,分别为泳道6和9)。
在所用条件下,洗脱对于sfGFP片段更有效。获取携带通过MBP结合的融合蛋白的A-MB样品(如实施例3中用MC缓冲液洗涤四次之后)作为均匀浆液。为了进行比较,还获取了洗脱后上清液的样品,其中初始浆液和麦芽糖洗脱的可溶性材料的体积相同。这些配对在Laemmli缓冲液中在100℃下通常变性(如实施例1),并将5μl样品上样到SDS-PAGE凝胶上。由于A-MB浆液样品代表存在的总结合蛋白,其条带强度与体积匹配的洗脱样品的条带强度的比较提供了洗脱效率的估计。因此,sfGFP N末端融合体显示出接近完全的优异洗脱,而N末端海肾融合体的可溶性收率降低(参见图14,分别为泳道6相对于泳道7;以及泳道9相对于泳道10)。然而,纯化的可溶性N末端海肾融合蛋白可在MBP系统中产生,这与在实施例1的基于内含肽的系统中未能观察到等同的可溶性蛋白有很大区别。
通过用肠激酶处理进一步检查具有MBP的N末端sfGFP融合体,以便释放游离的N末端片段。当不同量的肠激酶与固定量的sfGFP融合体在25℃下一起使用2.5小时时,观察到剂量反应,其中使用最大量的蛋白酶实现几乎完全切割(参见图15)。同时,可在SDS-PAGE凝胶上检测到所释放的片段(约17kD)(参见图15)。
实施例5:具有5’或3’巯基的核酸标签和具有N末端或C末端半胱氨酸的多肽的化学连接
使用双马来酰亚胺接头的缀合过程分两个阶段进行。最初,将携带5’或3’末端二硫化物修饰的寡核苷酸(参见图16;-SS-TTTCTTCAGGACACAGC;SEQ ID NO:45)用100倍摩尔过量的TCEP在25℃下处理至少4小时,然后脱盐到10mM Tris pH 7.4中以除去TCEP和低分子量产物。然后在磷酸钠缓冲液pH 7.1中将所得的-SH寡核苷酸用摩尔过量(500倍)的BMP2(Sigma)在25℃下处理4小时。然后将制备物再次脱盐以除去过量的BMP2。将修饰寡核苷酸的样品在8M尿素凝胶上跑样,与原始-SS-寡核苷酸和相应的衍生的-SH寡核苷酸进行比较,以检查该过程的成功(参见图16)。
第二阶段使用BMP2衍生化的寡核苷酸与具有末端半胱氨酸残基的目标多肽片段交联。将合适的片段在具有100mM氯化钠的磷酸盐缓冲液(pH 7.1)中和大摩尔过量的BMP2衍生化的寡核苷酸一起温育以驱动反应,在25℃下持续4小时。然后通过用巯基磁珠(Bioclone)处理除去过量的寡核苷酸(携带未反应的马来酰亚胺基团)。然后用PBSM透析多肽缀合物,并在-20℃下储存于50%甘油中。
实施例6:通过SP-TAPER实现的报告蛋白片段在细胞表面上的组装和功能
通过模板化SP-TAPER实现的报告蛋白片段的细胞表面组装和测定的过程可分为几个阶段,包括:
1)以特异性方式将用于模板化目的的核苷酸序列置于细胞表面上;
2)用于SP-TAPER的报告蛋白切割点的选择;
3)报告蛋白切割点多肽的制备,以及它们与用于SP-TAPER的核酸标签的缀合;
4)在体外系统中确定通过特异性模板化SP-TAPER实现的报告蛋白切割片段的重新组装;以及
5)SP-TAPER报告蛋白系统的细胞表面模板的有效性的展示。
此实施例描述了该过程的每个阶段。在成功展示先前阶段1-4之前,不进行阶段5。
1)表面模板:
SP-TAPER使用靶核酸分子序列作为用于组装蛋白质片段的模板,以在细胞表面上进行靶向组装。初始方面是用于以特异性方式在靶细胞上定位模板序列的手段。适体可以用于此目的。在此类情况下,适体可以被视为双功能实体,其由识别区段(用于结合细胞表面靶标)和处于单元适体的5’或3’末端,或二元适体的5’-3’连接点处的模板序列组成。还描述了针对黑素瘤中的表面标志物(黑皮质素-1受体(MC1R),来自α-黑素细胞刺激激素的G蛋白偶联受体转导信号)的适体的实例。
当已知表面靶标的配体时,存在产生表面模板的替代方法。在此实施例中,配体是α-黑素细胞刺激激素(MSH),其具有由丝氨酸-甘氨酸接头和C末端半胱氨酸残基组成的C末端延伸(参见图17;AcSYSMEHFRWGKPVGGGSSGGGC-SH;SEQ ID NO:21)。此末端半胱氨酸使得能够通过双马来酰亚胺交联试剂形成寡核苷酸缀合物,其中寡核苷酸携带5’(或3’)-SH基团(参见图17)。在此实施例中,所显示的模板序列对应于人乳头瘤病毒16E6/E7序列的区段(参见图17;AAGCCACTGTGTCCTGAAGAAAAGCAAAGACATC;SEQ ID NO:20)。
在该实施例的变体中,MSH配体被取代以产生增强的结合特性。在一个实例中,产生NDP-MSH,由此用于模板化的NDP-MSH的延长型式具有AcSYSXEHFRWGKPVGGGSSGGGC(SEQID NO:22)的氨基酸序列,其中野生型Met-4和Phe-7残基(均以粗体显示)分别被正亮氨酸(Nle)和D-苯丙氨酸(D-Phe)替代。MSH配体的其他变体包括CSGGGSSGGGSYSMEHFRWGKPV-NH2(SEQ ID NO:23)和CSGGGSSGGGSYSXEHFRWGKPV-NH2(SEQ ID NO:24),其中X是正亮氨酸并且F残基是D-苯丙氨酸。
使用双马来酰亚胺接头的缀合过程根据实施例5的两阶段方案进行,使用BMP2-修饰的模板寡核苷酸(参见图17)与合成肽的100:1摩尔比,使得驱动肽的衍生化至完全。此后,通过与巯基修饰的长臂磁珠(Bioclone)反应以将任何剩余的马来酰亚胺寡核苷酸转移至固相来除去过量的未反应的BMP2-寡核苷酸。随后通过磁力分离使可溶相与珠子分开。
为了显示所制备的表面模板,将细胞(2.105)用1nmol的肽配体-模板缀合物在冰上处理1小时,并用具有1mM MgCl2的1X PBS(PBSM)洗涤两次。已知阳性对照细胞表达表面MC1R;阴性对照是MC1R-;两种类型的细胞也以相同的方式处理,但不包括肽配体-模板缀合物。受体配体的结合和可接近表面模板的存在通过与附连的模板标签互补的荧光双标记探针同时测定:5’-6Fam-GATGTCTTTGCTTTTCTTCAGGACACAGTGGCTT-6Fam(SEQ ID NO:46)。
将双标记探针(500pmol)添加到携带肽配体-模板的细胞(0.5ml;2.105),以及如上定义的匹配对照细胞中。在25℃温育30分钟后,用PBSM将细胞再洗涤一次,然后进行流式分析,其中通道设置与荧光素一样。成功的配体结合和模板可接近性通过MC1R+细胞的显著荧光峰以及同时在MC1R-细胞中的不存在(其中两者均用肽配体-模板缀合物预处理),以及在肽配体-模板缀合物省略的所有细胞中的不存在定义。
2)用于SP-TAPER的报告蛋白切割点的选择:
报告蛋白sfGFP和海肾荧光素酶的切割点的布置如实施例1中所述。
3)报告蛋白切割点多肽的制备,以及它们与用于SP-TAPER的核酸标签的缀合:
实施例1-4描述了用于制备报告蛋白sfGFP和海肾荧光素酶的切割点多肽的方法。基于内含肽的系统或MBP系统适用于N端sfGFP片段,而MBP系统在海肾荧光素酶的N末端片段和两种报告蛋白的C末端片段的情况下是成功的。
通过巯基和双马来酰亚胺化学接头制备多肽-核酸标签缀合物的方法如实施例5中所述。
将具有与预定模板序列互补的环区域的锁定TAPER第一瓶形单倍体寡核苷酸(携带5’-SH基团)(参见图17)分别与N末端sfGFP和海肾荧光素酶片段的C末端半胱氨酸缀合(如实施例1中所定义)。将相应的第二单倍体(携带3’-SH基团)分别与C末端sfGFP和海肾荧光素酶片段的N末端半胱氨酸缀合(也如实施例1中所定义)。两种类型的缀合物均示意性地描绘于图9中。
4)在体外系统中测试通过特异性模板化SP-TAPER实现的报告蛋白切割片段的重新组装:
根据定义,正确地重新组装的报告蛋白多肽片段将精于其固有的“可报告”功能。在此实施例中,线性DNA模板(对应于图17中的模板的游离寡核苷酸型式)与上述锁定TAPER寡核苷酸报告蛋白缀合物一起使用。由于通过使用锁定TAPER系统避免了模板滴定效应,因此可将过量模板与可变量的缀合的第一单倍体瓶和第二单倍体一起使用。
如上所述制备以下缀合物:
sfGFP信号是最大发射与荧光素相同的荧光,并且通过具有荧光读取设施(Tecan)的分光光度计监测。使用腔肠素底物并且使用纯化的海肾荧光素酶(RayBiotech)作为阳性对照,通过用于该酶的商业试剂盒(Promega)评估海肾荧光素酶的酶促活性。通过标准光度计(Berthold)量化发光。
在剂量反应实验设计中,等摩尔量的(sfG-N-H1+sfG-C-H2)和(R-N-H1+R-C-H2)在2倍稀释步骤中混合于各自在10.0至0.1pmol范围内的系列稀释液中,或在可用量的SP-单倍体允许时,在与恒定量的DNA靶模板混合之前,两倍过量于所用缀合物的最高量进行混合。在25℃下温育16小时后,在适当时对sfGFP和海肾荧光素酶的报告信号进行测定。
还可进行可比较时程实验,其中恒定量的多肽缀合物([sfG-N-H1+sfG-C-H2]和[R-N-H1+R-C-H2])与两倍过量的模板混合,其中可测定样品在一系列时间点获取:15、30、45、60分钟;以及1、2、4、6、8和16小时。
模板介导的多肽组装的特异性可通过使用对应于与所用的寡核苷酸-多肽缀合物相同的序列(如图9所描绘)但没有附连多肽标签的阻断寡核苷酸来展示。摩尔过量的这些寡核苷酸中的任一种有效地抑制组装反应,而组装过程不受相同长度但具有杂混序列的过量寡核苷酸的影响。
5)SP-TAPER报告蛋白系统的细胞表面模板的有效性的展示:
在此实施例中,以上述方式在表达MC1R的靶细胞上产生表面模板(参见图17)。所使用的细胞包括黑素瘤系453A和淋巴瘤系K562,已知两者均具有如通过一抗和FITC标记的二抗(Santa Cruz Biotechnology)检测的表面MC1R。在确认模板显示和可接近(通过双标记荧光探针,如上文)之后,将模板显示细胞用过量的多肽缀合物对([sfG-N-H1+sfG-C-H2]和[R-N-H1+R-C-H2])处理并在25℃下温育2小时。与仅用抗MC1R一抗和荧光二抗处理的细胞相比较,通过流式分析证实通过sfGFP的多肽片段的表面模板化共折叠产生报告信号。对于海肾荧光素酶的细胞表面确定,如上所述直接测定全细胞样品的发光,其中使用完整的海肾酶作为阳性测定对照。
实施例7:通过SP-TAPER实现的毒素片段在细胞表面上的组装和功能
小毒性介质的细胞表面组装及其随后的摄取和细胞杀伤的功能性活动的过程可分为几个阶段,包括:
1)以特异性方式将用于模板化目的的核苷酸序列置于细胞表面上;
2)多用于SP-TAPER的肽毒素及其切割点的选择;
3)毒素切割点多肽的制备,以及它们与用于SP-TAPER的核酸标签的缀合;
4)在体外系统中检查通过特异性模板化SP-TAPER实现的毒素切割片段的重新组装;
5)通过SP-TAPER报告蛋白系统进行的细胞表面模板的有效性的展示;以及
6)通过表面组装毒素的摄取进行的细胞杀伤的展示。此实施例描述了该过程的每个阶段。在成功展示先前阶段1-4之前,不进行阶段5和6。
1)表面模板:
衍生用于充当SP-TAPER的模板的细胞表面核酸的方法如实施例6中所述。
2)多肽毒素和切割点:
尽管多种小的核糖毒素从它们对SP-TAPER的潜在应用的角度来看是有吸引力的,但是多毛菌素A(HstA)是迄今为止已知最小的领先竞争者,并且可以鉴定潜在的切割点(如上所述;参见图10)。所选的初始切割点是成熟多肽的89和90位的二甘氨酸(参见图10)。
包括在SP-TAPER中与HstA一起作用的有用对照是在C末端片段内缺乏催化关键残基组氨酸-113的突变体(参见图10;通过点突变将正常密码子转换为编码甘氨酸残基(H113G)的密码子))。
3)毒素片段多肽的制备和核酸缀合:
通过合成编码序列,二甘氨酸位点的N末端(APIVTCRKLDGREKPFKVDVATAQAQARKAGLTTGKSGDPHRYFAGDHIRWGVNNCDKADAILWEYPIYWVGKNAEWAKDVKTSQQKGC;SEQ ID NO:47)和C末端HstA(CGPTPIRVVYANSRGAVQYCGVMTHSKVDKNNQGKEFFEKCD;SEQ ID NO:26)片段在MBP系统中均表达为融合体,分别具有插入的C末端和N末端半胱氨酸残基(参见图18)。如实施例3和4所述,将融合蛋白表达、与直链淀粉磁珠结合,并用麦芽糖洗脱。用肠激酶释放多肽HstA片段(实施例3和4),然后用商业亲和产品(Thermofisher)除去肠激酶。
锁定TAPER瓶形寡合苷酸(第一单倍体瓶;参见图8)被制备成具有5’巯基和与目标靶核酸分子模板序列互补的反靶环部分。在此实施例中,模板在MC1R+细胞上表面显示,如图16所示。通过用TCEP处理且接着脱盐,由二硫化物前体产生5’巯基。通过双官能马来酰亚胺试剂以与实施例5相同的方式将该锁定TAPER瓶形寡核苷酸与携带C末端半胱氨酸的N末端HstA片段缀合(参见图17)。
用于锁定TAPER的相应第二单倍体寡核苷酸(参见图8)同样被制备成具有游离的3’-巯基,然后也通过与实施例5相同的双官能马来酰亚胺试剂将其与携带N末端半胱氨酸的N末端HstA片段缀合(参见图17)。
通过从天然丙烯酰胺凝胶中切除,之后进行电洗脱来纯化每种缀合物。尽管两个HstA片段均含有内部半胱氨酸,但包括这些残基的不期望缀合物可在适当的凝胶系统中与单个N末端或C末端缀合物中分离。虽然单末端缀合物近似于跨越多肽链至附连的核酸磷酸二酯序列的线性骨架结构,但是一个或多个内部缀合物具有导致改变的电泳迁移率的支链结构。
4)测试通过特异性模板化SP-TAPER实现的毒素切割片段的重新组装:
将两种HstA锁定TAPER缀合物(各50pmol,如上制备)在1X PBSM中与和不与两倍过量的游离模板化序列一起在25℃下温育6小时。为了测定正确组装的HstA的作用,哺乳动物体外翻译系统是适当的。基于兔网织红细胞裂解制备物的偶联体外转录/翻译系统(PromegaQuick Coupled Transcription Translation System)便利地用于产生荧光素酶形式的灵敏读出物,其质粒(和测试试剂)包括在商业试剂盒中。包括HstA在内的核糖毒素干扰核糖体蛋白合成,从而允许可测定的蛋白质产生用作核糖毒素活性水平的衡量标准。
根据制造商的说明建立用于对照荧光素酶产生的系统,并且在37℃温育90分钟之前接种增大量的测试组装的HstA制备物。对照包括不含模板的HstA多肽缀合物,并且添加序列与缀合物相同的未标记的阻断寡核苷酸(如上文针对报告蛋白组装系统所述)。阳性对照由另一核糖毒素(蓖麻毒素A链,Sigma)和HstA自身的商业样品代表,在大肠杆菌中表达。后者以与本申请中的其他表达多肽类似的方式由插入pMALc5x载体中的全长合成编码序列产生,其中全长HstA多肽通过肠激酶从MBP载体上切割下来。在MBP-HstA融合体在直链淀粉磁珠上纯化、用麦芽糖洗脱并肠激酶切割之后,用商业亲和树脂(EMD-Millipore)除去蛋白酶,并且该制备物直接用于利用荧光素酶体外转录/翻译系统进行的测试。
与核糖毒素阳性对照平行,通过组装的HstA片段,在荧光素酶发光信号的剂量依赖性减少的情况下实现了该系统中的成功读出。组装过程被展示为模板依赖性的,并且可用未标记的竞争寡核苷酸特异性地阻断。
在抑制荧光素酶报告蛋白活性的同时,通过评估八叠球菌-蓖麻毒素环上的核糖体28S RNA切割,也可以用相同的体外测定组分直接解决HstA组装。在体外转录-翻译过程之后,使用和不使用组装的HstA制备物,对整个反应混合物的样品进行苯酚提取,沉淀,并在无RNA酶条件下在TE缓冲液中重构。样品在2%琼脂糖上跑样并用溴化乙锭可视化(Kao等人,Meth.Enzymol.,2001,341,324-335)。表征性400碱基核糖毒素α-片段的产生是HstA组装成功的判断依据。另外,对应于28S RNA中的八叠球菌-蓖麻毒素环的合成35聚体(GGUAAUCCUGCUCAGUACGAGAGGAACCGCAGGUU;SEQ ID NO:48;Endo等人,J.Biol.Chem.,1998,263,7917-7920)可用于在体外直接测定特定核糖毒素切割。这通过将寡核糖核苷酸与增加量的测试组装的HstA(和全HstA对照制备物)一起温育,然后在37℃下温育90分钟来进行。在15%8M尿素变性丙烯酰胺凝胶上评估产物和成功切割。
与使用野生型HstA缀合物的SP-TAPER分析平行,使用携带H113G突变的缀合物(C末端SP-单倍体)展示该效应对真核核糖体蛋白合成的抑制的特异性。
5)通过SP-TAPER报告蛋白系统进行的细胞表面模板的有效性的展示。
用于毒素组装目的的细胞表面模板的可接近性最初通过由SP-TAPER实现的报告蛋白组装来确认,如实施例6中所述。
6)通过表面组装毒素的摄取进行的细胞杀伤的展示。
使用建立的细胞表面模板系统(如实施例6所述)。HstA多肽缀合物以及对照sfGFP和海肾报告蛋白缀合物在系列稀释液中与先前经过操纵的细胞一起温育以显示表面模板。利用用于HstA组装的体外模板的平行实验充当组装过程本身的阳性对照。另外,细胞表面报告信号的平行产生表明模板系统按计划发挥作用。
表面组装和功能性HstA的期望活性取决于其从表面位点到靶细胞中的摄取。这通过成熟HstA蛋白的固有细胞穿透功能主动发生,或在任何情况下通过内吞作用被动发生。通过利用活体染色的直接显微镜检查并且通过利用用于凋亡细胞的商业膜联蛋白V系统的流式分析对细胞毒性作用进行监测和定量。
实施例8:使用sfGFP分裂蛋白系统的功能性SP-TAPER
为了展示SP-TAPER的功效,使用了以下组分:
A.蛋白质片段:
在大肠杆菌NiCo21(DE3)中表达sfGFP的特定型式的以下蛋白质片段组分(Overkamp等人,Applied Environ.Microbiol.,2013,79,6481-6490):
N末端:MSKGEELFTGVVPILVELDGDVNGHKFSVRGEGEGDATNGKLTLKFICTTGKLPVPWPTLVTTLTYGVQCFSRYPDHMKRHDFFKSAMPEGYVQERTISFKDDGTYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNFNSHN VYITADKQGGSGHHHHHH(SEQ ID NO:53);
C末端:MHHHHHHGGSGKNGIKANFKIRHNVEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQSVLSKDPNEKRDHMVLLEFVTAAGITHGMDELYK(SEQ ID NO:54);
附连的六组氨酸标签以粗体显示;六组氨酸区段与sfGFP序列之间的短丝氨酸-甘氨酸接头加有下划线。从超声处理的细胞提取物中纯化在固定化的金属亲和色谱磁珠(IMAC,Dynabeads,Thermofisher Corp)上进行,并且蛋白质用300mM咪唑洗脱。
B.用于产生蛋白质-核酸缀合物的寡核苷酸:
以下寡核苷酸用于实施锁定TAPER以应用于SP-TAPER的这种情况。
(i)三Am-HPV-B1(锁定TAPER单倍体环'瓶'oligo)[三串联氨基]-ACTCGAGACGTCTCCTTGTCTTTGCTTTTCTTCAGGACACAGTGGCGAGACGTCTCGAGT(SEQ ID NO:28);以及
(ii)HPV-B2-三Am(第二锁定TAPER单倍体oligo)TTTGACGTCTCGAGT–[三串联氨基](SEQ ID NO:58)。
这些寡核苷酸TN-HPV-B1和HPV-B2-T被合成为分别在其5’或3’末端具有三-串联氨基,以使它们能够与马来酰亚胺基-C3-次氮基三乙酸(MNTA;Dojindo MolecularTechnologies)串联衍生化,以在Ni+2的存在下增加对六组氨酸标签的结合亲和力(参见Goodman等人,Chembiochem,2009,10,1551-1557)。该MNTA缀合如上所述进行(参见图19),除了将末端氨基重复成三联体组。缀合过程使用初始步骤,其中三末端胺首先用双官能试剂N-琥珀酰亚胺基3-(2-吡啶基二硫代)丙酸酯(SPDP)转化为二硫醇,然后用TCEP还原,最后通过MNTA的马来酰亚胺基部分缀合(参见图21,小图A)。在实践中,尽管缀合反应本身容易进行,但是不可能实现寡核苷酸的完全三取代衍生化,如图21小图B中所示,其中具有单、二和三取代的NTA形式的锁定TAPER系统的小组分的非限制性实例在变性丙烯酰胺凝胶上十分明显。因此,三取代的NTA形式的富集是期望的。这通过如针对单MNTA缀合物的纯化所描述的生物素化的四组氨酸策略实现(参见图20)。此处,混合串联MNTA产物的反应产物带有Ni+2离子以允许螯合,与固相生物素化的四组氨酸一起温育,并用咪唑洗脱。该过程由于其对四组氨酸的更高亲和力而允许选择性富集锁定TAPER寡核苷酸的三串联NTA形式(参见图22)。
当分裂蛋白片段与被设计为在共同模板上相互接近杂交的特定寡核苷酸缀合时,它们被称为SP-单倍体。当与锁定TAPER策略组合时,它们因此被称为(缩写)Lk-SP-单倍体。
将携带六组氨酸标签的sfGFP的片段(如上所述)在大肠杆菌菌株NiCo21(DE3)中表达,并根据标准方案纯化,通过咪唑进行最终洗脱(参见图23)。然后用三串联NTA锁定TAPER寡核苷酸对这些制备物进行衍生化(参见图22),其中蛋白质摩尔过量。
在此非限制性实例中,用160pmol的小锁定TAPER寡核苷酸HPV-B2(如上所述)处理300pmol的较大sfGFP片段(参见图23),如上所述衍生化并富集,以形成HPV-B2-3’-三NTA。在此非限制性实例中,用160pmol的较大环-瓶锁定TAPER寡核苷酸(如上)HPV-B1处理300pmol的较小sfGFP片段(参见图23),如上所述衍生化并富集,以形成5’三NTA-HPV-B1。通过使用过量的蛋白质,寡核苷酸的复合被驱动完全,从而使可以干扰随后的模板化SP-TAPER的游离寡核苷酸的量最小化。
为了展示SP-TAPER,将以上Lk-SP-单倍体(各20pmol)单独或一起以50μl体积在50mM磷酸盐缓冲液pH 7.0/100mM NaCl中与10倍过量(200pmol)的模板寡核苷酸一起直接在96孔黑面平底板(Corning)中温育:TAACTGTCAAAAGCCACTGTGTCCTGAAGAAAAGCAAAGACATCTGGACAAAAAGC(SEQ ID NO:59);或与10倍过量(200pmol)的相应杂混寡核苷酸一起温育:TAACTGTCAAAAGCCACAAGCGGAATAATGACTTCCCAGGGATAGATCAAAAAGC(SEQ ID NO:49)。
通过使用锁定TAPER,模板浓度可大大过量于Lk-SP-单倍体进行使用,因为避免了使用常规单倍体时观察到的模板滴定效应。
在合适的时间点,在Tecan分光荧光计中读取板的荧光(设置与荧光素相同)。结果示于图25中。指示sfGFP活性的荧光反应在特定的超杂混模板的存在下大大加快。无论模板如何,单独使用任一Lk-SP-单倍体均未观察到显著反应。
除了本文所述的那些之外,本领域技术人员由前文的描述将显而易见地知道所述主题的各种修改。这些修改也意图属于随附权利要求书的范围内。本申请中引用的每个参考文献(包括但不限于期刊文章、美国和非美国专利、专利申请公布、国际专利申请公布、基因库登录号等)以引用的方式整体并入本文。
序列表
<110> 特里比奥迪卡有限责任公司(TriBiotica LLC)
伊恩·邓恩(Dunn, Ian)
马修·劳勒(Lawler, Matthew)
<120> 通过接近增强的反应性实现分裂蛋白模板组装的方法
<130> 189156.00702 (3031)
<150> 62/424,689
<151> 2016-11-21
<160> 59
<170> PatentIn Version 3.5
<210> 1
<211> 88
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> N末端片段
<400> 1
Ala Pro Ile Val Thr Cys Arg Lys Leu Asp Gly Arg Glu Lys Pro Phe
1 5 10 15
Lys Val Asp Val Ala Thr Ala Gln Ala Gln Ala Arg Lys Ala Gly Leu
20 25 30
Thr Thr Gly Lys Ser Gly Asp Pro His Arg Tyr Phe Ala Gly Asp His
35 40 45
Ile Arg Trp Gly Val Asn Asn Cys Asp Lys Ala Asp Ala Ile Leu Trp
50 55 60
Glu Tyr Pro Ile Tyr Trp Val Gly Lys Asn Ala Glu Trp Ala Lys Asp
65 70 75 80
Val Lys Thr Ser Gln Gln Lys Gly
85
<210> 2
<211> 41
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> C末端片段
<400> 2
Gly Pro Thr Pro Ile Arg Val Val Tyr Ala Asn Ser Arg Gly Ala Val
1 5 10 15
Gln Tyr Cys Gly Val Met Thr His Ser Lys Val Asp Lys Asn Asn Gln
20 25 30
Gly Lys Glu Phe Phe Glu Lys Cys Asp
35 40
<210> 3
<211> 12
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> N末端片段
<400> 3
Ala Pro Ile Val Thr Cys Arg Pro Lys Leu Asp Gly
1 5 10
<210> 4
<211> 118
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> C末端片段
<400> 4
Arg Glu Lys Pro Phe Lys Val Asp Val Ala Thr Ala Gln Ala Gln Ala
1 5 10 15
Arg Lys Ala Gly Leu Thr Thr Gly Lys Ser Gly Asp Pro His Arg Tyr
20 25 30
Phe Ala Gly Asp His Ile Arg Trp Gly Val Asn Asn Cys Asp Lys Ala
35 40 45
Asp Ala Ile Leu Trp Glu Tyr Pro Ile Tyr Trp Val Gly Lys Asn Ala
50 55 60
Glu Trp Ala Lys Asp Val Lys Thr Ser Gln Gln Lys Gly Gly Pro Thr
65 70 75 80
Pro Ile Arg Val Val Tyr Ala Asn Ser Arg Gly Ala Val Gln Tyr Cys
85 90 95
Gly Val Met Thr His Ser Lys Val Asp Lys Asn Asn Gln Gly Lys Glu
100 105 110
Phe Phe Glu Lys Cys Asp
115
<210> 5
<211> 37
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> N末端片段
<400> 5
Ala Pro Ile Val Thr Cys Arg Pro Lys Leu Asp Gly Arg Glu Lys Pro
1 5 10 15
Phe Lys Val Asp Val Ala Thr Ala Gln Ala Gln Ala Arg Lys Ala Gly
20 25 30
Leu Thr Thr Gly Lys
35
<210> 6
<211> 93
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> C末端片段
<400> 6
Ser Gly Asp Pro His Arg Tyr Phe Ala Gly Asp His Ile Arg Trp Gly
1 5 10 15
Val Asn Asn Cys Asp Lys Ala Asp Ala Ile Leu Trp Glu Tyr Pro Ile
20 25 30
Tyr Trp Val Gly Lys Asn Ala Glu Trp Ala Lys Asp Val Lys Thr Ser
35 40 45
Gln Gln Lys Gly Gly Pro Thr Pro Ile Arg Val Val Tyr Ala Asn Ser
50 55 60
Arg Gly Ala Val Gln Tyr Cys Gly Val Met Thr His Ser Lys Val Asp
65 70 75 80
Lys Asn Asn Gln Gly Lys Glu Phe Phe Glu Lys Cys Asp
85 90
<210> 7
<211> 61
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> N末端片段
<400> 7
Ala Pro Ile Val Thr Cys Arg Pro Lys Leu Asp Gly Arg Glu Lys Pro
1 5 10 15
Phe Lys Val Asp Val Ala Thr Ala Gln Ala Gln Ala Arg Lys Ala Gly
20 25 30
Leu Thr Thr Gly Lys Ser Gly Asp Pro His Arg Tyr Phe Ala Gly Asp
35 40 45
His Ile Arg Trp Gly Val Asn Asn Cys Asp Lys Ala Asp
50 55 60
<210> 8
<211> 69
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> C末端片段
<400> 8
Ala Ile Leu Trp Glu Tyr Pro Ile Tyr Trp Val Gly Lys Asn Ala Glu
1 5 10 15
Trp Ala Lys Asp Val Lys Thr Ser Gln Gln Lys Gly Gly Pro Thr Pro
20 25 30
Ile Arg Val Val Tyr Ala Asn Ser Arg Gly Ala Val Gln Tyr Cys Gly
35 40 45
Val Met Thr His Ser Lys Val Asp Lys Asn Asn Gln Gly Lys Glu Phe
50 55 60
Phe Glu Lys Cys Asp
65
<210> 9
<211> 73
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> N末端片段
<400> 9
Ala Pro Ile Val Thr Cys Arg Pro Lys Leu Asp Gly Arg Glu Lys Pro
1 5 10 15
Phe Lys Val Asp Val Ala Thr Ala Gln Ala Gln Ala Arg Lys Ala Gly
20 25 30
Leu Thr Thr Gly Lys Ser Gly Asp Pro His Arg Tyr Phe Ala Gly Asp
35 40 45
His Ile Arg Trp Gly Val Asn Asn Cys Asp Lys Ala Asp Ala Ile Leu
50 55 60
Trp Glu Tyr Pro Ile Tyr Trp Val Gly
65 70
<210> 10
<211> 57
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> C末端片段
<400> 10
Lys Asn Ala Glu Trp Ala Lys Asp Val Lys Thr Ser Gln Gln Lys Gly
1 5 10 15
Gly Pro Thr Pro Ile Arg Val Val Tyr Ala Asn Ser Arg Gly Ala Val
20 25 30
Gln Tyr Cys Gly Val Met Thr His Ser Lys Val Asp Lys Asn Asn Gln
35 40 45
Gly Lys Glu Phe Phe Glu Lys Cys Asp
50 55
<210> 11
<211> 81
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> N末端片段
<400> 11
Ala Pro Ile Val Thr Cys Arg Pro Lys Leu Asp Gly Arg Glu Lys Pro
1 5 10 15
Phe Lys Val Asp Val Ala Thr Ala Gln Ala Gln Ala Arg Lys Ala Gly
20 25 30
Leu Thr Thr Gly Lys Ser Gly Asp Pro His Arg Tyr Phe Ala Gly Asp
35 40 45
His Ile Arg Trp Gly Val Asn Asn Cys Asp Lys Ala Asp Ala Ile Leu
50 55 60
Trp Glu Tyr Pro Ile Tyr Trp Val Gly Lys Asn Ala Glu Trp Ala Lys
65 70 75 80
Asp
<210> 12
<211> 49
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> C末端片段
<400> 12
Val Lys Thr Ser Gln Gln Lys Gly Gly Pro Thr Pro Ile Arg Val Val
1 5 10 15
Tyr Ala Asn Ser Arg Gly Ala Val Gln Tyr Cys Gly Val Met Thr His
20 25 30
Ser Lys Val Asp Lys Asn Asn Gln Gly Lys Glu Phe Phe Glu Lys Cys
35 40 45
Asp
<210> 13
<211> 86
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> N末端片段
<400> 13
Ala Pro Ile Val Thr Cys Arg Pro Lys Leu Asp Gly Arg Glu Lys Pro
1 5 10 15
Phe Lys Val Asp Val Ala Thr Ala Gln Ala Gln Ala Arg Lys Ala Gly
20 25 30
Leu Thr Thr Gly Lys Ser Gly Asp Pro His Arg Tyr Phe Ala Gly Asp
35 40 45
His Ile Arg Trp Gly Val Asn Asn Cys Asp Lys Ala Asp Ala Ile Leu
50 55 60
Trp Glu Tyr Pro Ile Tyr Trp Val Gly Lys Asn Ala Glu Trp Ala Lys
65 70 75 80
Asp Val Lys Thr Ser Gln
85
<210> 14
<211> 44
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> C末端片段
<400> 14
Gln Lys Gly Gly Pro Thr Pro Ile Arg Val Val Tyr Ala Asn Ser Arg
1 5 10 15
Gly Ala Val Gln Tyr Cys Gly Val Met Thr His Ser Lys Val Asp Lys
20 25 30
Asn Asn Gln Gly Lys Glu Phe Phe Glu Lys Cys Asp
35 40
<210> 15
<211> 103
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> N末端片段
<400> 15
Ala Pro Ile Val Thr Cys Arg Pro Lys Leu Asp Gly Arg Glu Lys Pro
1 5 10 15
Phe Lys Val Asp Val Ala Thr Ala Gln Ala Gln Ala Arg Lys Ala Gly
20 25 30
Leu Thr Thr Gly Lys Ser Gly Asp Pro His Arg Tyr Phe Ala Gly Asp
35 40 45
His Ile Arg Trp Gly Val Asn Asn Cys Asp Lys Ala Asp Ala Ile Leu
50 55 60
Trp Glu Tyr Pro Ile Tyr Trp Val Gly Lys Asn Ala Glu Trp Ala Lys
65 70 75 80
Asp Val Lys Thr Ser Gln Gln Lys Gly Gly Pro Thr Pro Ile Arg Val
85 90 95
Val Tyr Ala Asn Ser Arg Gly
100
<210> 16
<211> 27
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> C末端片段
<400> 16
Ala Val Gln Tyr Cys Gly Val Met Thr His Ser Lys Val Asp Lys Asn
1 5 10 15
Asn Gln Gly Lys Glu Phe Phe Glu Lys Cys Asp
20 25
<210> 17
<211> 119
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> N末端片段
<400> 17
Ala Pro Ile Val Thr Cys Arg Pro Lys Leu Asp Gly Arg Glu Lys Pro
1 5 10 15
Phe Lys Val Asp Val Ala Thr Ala Gln Ala Gln Ala Arg Lys Ala Gly
20 25 30
Leu Thr Thr Gly Lys Ser Gly Asp Pro His Arg Tyr Phe Ala Gly Asp
35 40 45
His Ile Arg Trp Gly Val Asn Asn Cys Asp Lys Ala Asp Ala Ile Leu
50 55 60
Trp Glu Tyr Pro Ile Tyr Trp Val Gly Lys Asn Ala Glu Trp Ala Lys
65 70 75 80
Asp Val Lys Thr Ser Gln Gln Lys Gly Gly Pro Thr Pro Ile Arg Val
85 90 95
Val Tyr Ala Asn Ser Arg Gly Ala Val Gln Tyr Cys Gly Val Met Thr
100 105 110
His Ser Lys Val Asp Lys Asn
115
<210> 18
<211> 11
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> C末端片段
<400> 18
Asn Gln Gly Lys Glu Phe Phe Glu Lys Cys Asp
1 5 10
<210> 19
<211> 9
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 寡核苷酸
<400> 19
Gly Ser Gly Ser Gly His His His His
1 5
<210> 20
<211> 34
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 多核苷酸序列
<400> 20
aagccactgt gtcctgaaga aaagcaaaga catc 34
<210> 21
<211> 22
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 肽
<400> 21
Ser Tyr Ser Met Glu His Phe Arg Trp Gly Lys Pro Val Gly Gly Gly
1 5 10 15
Ser Ser Gly Gly Gly Cys
20
<210> 22
<211> 22
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 肽
<220>
<221> misc_feature
<222> (4)..(4)
<223> Xaa为Nle
<220>
<221> misc_feature
<222> (7)..(7)
<223> Phe可以是D-苯丙氨酸
<400> 22
Ser Tyr Ser Xaa Glu His Phe Arg Trp Gly Lys Pro Val Gly Gly Gly
1 5 10 15
Ser Ser Gly Gly Gly Cys
20
<210> 23
<211> 23
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 肽
<220>
<221> misc_feature
<222> (17)..(17)
<223> Phe可以是D-苯丙氨酸
<400> 23
Cys Ser Gly Gly Gly Ser Ser Gly Gly Gly Ser Tyr Ser Met Glu His
1 5 10 15
Phe Arg Trp Gly Lys Pro Val
20
<210> 24
<211> 23
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 肽
<220>
<221> misc_feature
<222> (14)..(14)
<223> Xaa为Nle
<220>
<221> misc_feature
<222> (17)..(17)
<223> Phe可以是D-苯丙氨酸
<400> 24
Cys Ser Gly Gly Gly Ser Ser Gly Gly Gly Ser Tyr Ser Xaa Glu His
1 5 10 15
Phe Arg Trp Gly Lys Pro Val
20
<210> 25
<211> 90
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> N末端蛋白质片段
<400> 25
Ala Pro Ile Val Thr Cys Arg Pro Lys Leu Asp Gly Arg Glu Lys Pro
1 5 10 15
Phe Lys Val Asp Val Ala Thr Ala Gln Ala Gln Ala Arg Lys Ala Gly
20 25 30
Leu Thr Thr Gly Lys Ser Gly Asp Pro His Arg Tyr Phe Ala Gly Asp
35 40 45
His Ile Arg Trp Gly Val Asn Asn Cys Asp Lys Ala Asp Ala Ile Leu
50 55 60
Trp Glu Tyr Pro Ile Tyr Trp Val Gly Lys Asn Ala Glu Trp Ala Lys
65 70 75 80
Asp Val Lys Thr Ser Gln Gln Lys Gly Cys
85 90
<210> 26
<211> 42
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> C末端蛋白质片段
<400> 26
Cys Gly Pro Thr Pro Ile Arg Val Val Tyr Ala Asn Ser Arg Gly Ala
1 5 10 15
Val Gln Tyr Cys Gly Val Met Thr His Ser Lys Val Asp Lys Asn Asn
20 25 30
Gln Gly Lys Glu Phe Phe Glu Lys Cys Asp
35 40
<210> 27
<211> 4
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 因子Xa蛋白酶切割位点
<400> 27
Ile Glu Gly Arg
1
<210> 28
<211> 60
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 瓶形单倍体核苷酸序列
<400> 28
actcgagacg tctccttgtc tttgcttttc ttcaggacac agtggcgaga cgtctcgagt 60
<210> 29
<211> 51
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 瓶形单倍体核苷酸序列
<400> 29
actcgagacg tctccttcct gcccctcctc ctgctccgag acgtctcgag t 51
<210> 30
<211> 11
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 第二单倍体核苷酸序列
<400> 30
agctctcgag t 11
<210> 31
<211> 12
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 第二单倍体核苷酸序列
<400> 31
gacgtctcga gt 12
<210> 32
<211> 60
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 瓶形单倍体核苷酸序列的多核苷酸
<400> 32
actcgagacg tctccttgtc tttgcttttc ttcaggacac agtggcgaga cgtctcgagt 60
<210> 33
<211> 157
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 超折叠GFP的N末端片段
<400> 33
Met Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val
1 5 10 15
Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Arg Gly Glu
20 25 30
Gly Glu Gly Asp Ala Thr Asn Gly Lys Leu Thr Leu Lys Phe Ile Cys
35 40 45
Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Leu
50 55 60
Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys Arg
65 70 75 80
His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg
85 90 95
Thr Ile Ser Phe Lys Asp Asp Gly Thr Tyr Lys Thr Arg Ala Glu Val
100 105 110
Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile
115 120 125
Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn
130 135 140
Phe Asn Ser His Asn Val Tyr Ile Thr Ala Asp Lys Gln
145 150 155
<210> 34
<211> 81
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 超折叠GFP的C末端片段
<400> 34
Lys Asn Gly Ile Lys Ala Asn Phe Lys Ile Arg His Asn Val Glu Asp
1 5 10 15
Gly Ser Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly
20 25 30
Asp Gly Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser
35 40 45
Val Leu Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu
50 55 60
Glu Phe Val Thr Ala Ala Gly Ile Thr His Gly Met Asp Glu Leu Tyr
65 70 75 80
Lys
<210> 35
<211> 157
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 超折叠GFP(sfGFP)的片段
<400> 35
Met Arg Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val
1 5 10 15
Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Arg Gly Glu
20 25 30
Gly Glu Gly Asp Ala Thr Asn Gly Lys Leu Thr Leu Lys Phe Ile Cys
35 40 45
Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Leu
50 55 60
Thr Tyr Gly Val Gln Cys Phe Ala Arg Tyr Pro Asp His Met Lys Gln
65 70 75 80
His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg
85 90 95
Thr Ile Ser Phe Lys Asp Asp Gly Thr Tyr Lys Thr Arg Ala Glu Val
100 105 110
Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile
115 120 125
Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn
130 135 140
Phe Asn Ser His Asn Val Tyr Ile Thr Ala Asp Lys Gln
145 150 155
<210> 36
<211> 230
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 海肾荧光素酶的N末端片段
<400> 36
Met Ala Ser Lys Val Tyr Asp Pro Glu Gln Arg Lys Arg Met Ile Thr
1 5 10 15
Gly Pro Gln Trp Trp Ala Arg Cys Lys Gln Met Asn Val Leu Asp Ser
20 25 30
Phe Ile Asn Tyr Tyr Asp Ser Glu Lys His Ala Glu Asn Ala Val Ile
35 40 45
Phe Leu His Gly Asn Ala Ala Ser Ser Tyr Leu Trp Arg His Val Val
50 55 60
Pro His Ile Glu Pro Val Ala Arg Cys Ile Ile Pro Asp Leu Ile Gly
65 70 75 80
Met Gly Lys Ser Gly Lys Ser Gly Asn Gly Ser Tyr Arg Leu Leu Asp
85 90 95
His Tyr Lys Tyr Leu Thr Ala Trp Phe Glu Leu Leu Asn Leu Pro Lys
100 105 110
Lys Ile Ile Phe Val Gly His Asp Trp Gly Ala Cys Leu Ala Phe His
115 120 125
Tyr Ser Tyr Glu His Gln Asp Lys Ile Lys Ala Ile Val His Ala Glu
130 135 140
Ser Val Val Asp Val Ile Glu Ser Trp Asp Glu Trp Pro Asp Ile Glu
145 150 155 160
Glu Asp Ile Ala Leu Ile Lys Ser Glu Glu Gly Glu Lys Met Val Leu
165 170 175
Glu Asn Asn Phe Phe Val Glu Thr Met Leu Pro Ser Lys Ile Met Arg
180 185 190
Lys Leu Glu Pro Glu Glu Phe Ala Ala Tyr Leu Glu Pro Phe Lys Glu
195 200 205
Lys Gly Glu Val Arg Arg Pro Thr Leu Ser Trp Pro Arg Glu Ile Pro
210 215 220
Leu Val Lys Gly Gly Tyr
225 230
<210> 37
<211> 83
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 海肾荧光素酶的C末端片段
<400> 37
Lys Pro Asp Val Val Gln Ile Val Arg Asn Tyr Asn Ala Tyr Leu Arg
1 5 10 15
Ala Ser Asp Asp Leu Pro Lys Met Phe Ile Glu Ser Asp Pro Gly Phe
20 25 30
Phe Ser Asn Ala Ile Val Glu Gly Ala Lys Lys Phe Pro Asn Thr Glu
35 40 45
Phe Val Lys Val Lys Gly Leu His Phe Ser Gln Glu Asp Ala Pro Asp
50 55 60
Glu Met Gly Lys Tyr Ile Lys Ser Phe Val Glu Arg Val Leu Lys Asn
65 70 75 80
Glu Gln Glx
<210> 38
<211> 229
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 海肾荧光素酶的片段
<400> 38
Met Ala Ser Lys Val Tyr Asp Pro Glu Gln Arg Lys Arg Met Ile Thr
1 5 10 15
Gly Pro Gln Trp Trp Ala Arg Cys Lys Gln Met Asn Val Leu Asp Ser
20 25 30
Phe Ile Asn Tyr Tyr Asp Ser Glu Lys His Ala Glu Asn Ala Val Ile
35 40 45
Phe Leu His Gly Asn Ala Ala Ser Ser Tyr Leu Trp Arg His Val Val
50 55 60
Pro His Ile Glu Pro Val Ala Arg Cys Ile Ile Pro Asp Leu Ile Gly
65 70 75 80
Met Gly Lys Ser Gly Lys Ser Gly Asn Gly Ser Tyr Arg Leu Leu Asp
85 90 95
His Tyr Lys Tyr Leu Thr Ala Trp Phe Glu Leu Leu Asn Leu Pro Lys
100 105 110
Lys Ile Ile Phe Val Gly His Asp Trp Gly Ala Cys Leu Ala Phe His
115 120 125
Tyr Ser Tyr Glu His Gln Asp Lys Ile Lys Ala Ile Val His Ala Glu
130 135 140
Ser Val Val Asp Val Ile Glu Ser Trp Asp Glu Trp Pro Asp Ile Glu
145 150 155 160
Glu Asp Ile Ala Leu Ile Lys Ser Glu Glu Gly Glu Lys Met Val Leu
165 170 175
Glu Asn Asn Phe Phe Val Glu Thr Met Leu Pro Ser Lys Ile Met Arg
180 185 190
Lys Leu Glu Pro Glu Glu Phe Ala Ala Tyr Leu Glu Pro Phe Lys Glu
195 200 205
Lys Gly Glu Val Arg Arg Pro Thr Leu Ser Trp Pro Arg Glu Ile Pro
210 215 220
Leu Val Lys Gly Gly
225
<210> 39
<211> 82
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 海肾荧光素酶的片段
<400> 39
Lys Pro Asp Val Val Gln Ile Val Arg Asn Tyr Asn Ala Tyr Leu Arg
1 5 10 15
Ala Ser Asp Asp Leu Pro Lys Met Phe Ile Glu Ser Asp Pro Gly Phe
20 25 30
Phe Ser Asn Ala Ile Val Glu Gly Ala Lys Lys Phe Pro Asn Thr Glu
35 40 45
Phe Val Lys Val Lys Gly Leu His Phe Ser Gln Glu Asp Ala Pro Asp
50 55 60
Glu Met Gly Lys Tyr Ile Lys Ser Phe Val Glu Arg Val Leu Lys Asn
65 70 75 80
Glu Gln
<210> 40
<211> 34
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> N末端片段
<400> 40
Ala Pro Ile Val Thr Cys Arg Pro Lys Leu Asp Gly Arg Glu Lys Pro
1 5 10 15
Phe Lys Val Asp Val Ala Thr Ala Gln Ala Gln Ala Arg Lys Ala Gly
20 25 30
Leu Thr
<210> 41
<211> 96
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> C末端片段
<400> 41
Thr Gly Lys Ser Gly Asp Pro His Arg Tyr Phe Ala Gly Asp His Ile
1 5 10 15
Arg Trp Gly Val Asn Asn Cys Asp Lys Ala Asp Ala Ile Leu Trp Glu
20 25 30
Tyr Pro Ile Tyr Trp Val Gly Lys Asn Ala Glu Trp Ala Lys Asp Val
35 40 45
Lys Thr Ser Gln Gln Lys Gly Gly Pro Thr Pro Ile Arg Val Val Tyr
50 55 60
Ala Asn Ser Arg Gly Ala Val Gln Tyr Cys Gly Val Met Thr His Ser
65 70 75 80
Lys Val Asp Lys Asn Asn Gln Gly Lys Glu Phe Phe Glu Lys Cys Asp
85 90 95
<210> 42
<211> 93
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> Gaussia princeps荧光素酶的C末端片段
<400> 42
Met Lys Pro Thr Glu Asn Asn Glu Asp Phe Asn Ile Val Ala Val Ala
1 5 10 15
Ser Asn Phe Ala Thr Thr Asp Leu Asp Ala Asp Arg Gly Lys Leu Pro
20 25 30
Gly Lys Lys Leu Pro Leu Glu Val Leu Lys Glu Met Glu Ala Asn Ala
35 40 45
Arg Lys Ala Gly Cys Thr Arg Gly Cys Leu Ile Cys Leu Ser His Ile
50 55 60
Lys Cys Thr Pro Lys Met Lys Lys Phe Ile Pro Gly Arg Cys His Thr
65 70 75 80
Tyr Glu Gly Asp Lys Glu Ser Ala Gln Gly Gly Ile Gly
85 90
<210> 43
<211> 76
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> Gaussia princeps荧光素酶的C末端片段
<400> 43
Glu Ala Ile Val Asp Ile Pro Glu Ile Pro Gly Phe Lys Asp Leu Glu
1 5 10 15
Pro Met Glu Gln Phe Ile Ala Gln Val Asp Leu Cys Val Asp Cys Thr
20 25 30
Thr Gly Cys Leu Lys Gly Leu Ala Asn Val Gln Cys Ser Asp Leu Leu
35 40 45
Lys Lys Trp Leu Pro Gln Arg Cys Ala Thr Phe Ala Ser Lys Ile Gln
50 55 60
Gly Gln Val Asp Lys Ile Lys Gly Ala Gly Gly Asp
65 70 75
<210> 44
<211> 5
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 肠激酶识别信号
<400> 44
Asp Asp Asp Asp Lys
1 5
<210> 45
<211> 17
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 寡核苷酸
<400> 45
tttcttcagg acacagc 17
<210> 46
<211> 34
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 附连模板标签
<400> 46
gatgtctttg cttttcttca ggacacagtg gctt 34
<210> 47
<211> 89
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> N末端
<400> 47
Ala Pro Ile Val Thr Cys Arg Lys Leu Asp Gly Arg Glu Lys Pro Phe
1 5 10 15
Lys Val Asp Val Ala Thr Ala Gln Ala Gln Ala Arg Lys Ala Gly Leu
20 25 30
Thr Thr Gly Lys Ser Gly Asp Pro His Arg Tyr Phe Ala Gly Asp His
35 40 45
Ile Arg Trp Gly Val Asn Asn Cys Asp Lys Ala Asp Ala Ile Leu Trp
50 55 60
Glu Tyr Pro Ile Tyr Trp Val Gly Lys Asn Ala Glu Trp Ala Lys Asp
65 70 75 80
Val Lys Thr Ser Gln Gln Lys Gly Cys
85
<210> 48
<211> 35
<212> RNA
<213> 人工序列(Artificial sequence)
<220>
<223> 对应于28S RNA中的八叠球菌-蓖麻毒素环的合成35聚体
<400> 48
gguaauccug cucaguacga gaggaaccgc agguu 35
<210> 49
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 杂混寡核苷酸
<400> 49
taactgtcaa aagccacaag cggaataatg acttcccagg gatagatcaa aaagc 55
<210> 50
<211> 130
<212> PRT
<213> 多毛菌素A (Hirsutellin A)
<400> 50
Ala Pro Ile Val Thr Cys Arg Pro Lys Leu Asp Gly Arg Glu Lys Pro
1 5 10 15
Phe Lys Val Asp Val Ala Thr Ala Gln Ala Gln Ala Arg Lys Ala Gly
20 25 30
Leu Thr Thr Gly Lys Ser Gly Asp Pro His Arg Tyr Phe Ala Gly Asp
35 40 45
His Ile Arg Trp Gly Val Asn Asn Cys Asp Lys Ala Asp Ala Ile Leu
50 55 60
Trp Glu Tyr Pro Ile Tyr Trp Val Gly Lys Asn Ala Glu Trp Ala Lys
65 70 75 80
Asp Val Lys Thr Ser Gln Gln Lys Gly Gly Pro Thr Pro Ile Arg Val
85 90 95
Val Tyr Ala Asn Ser Arg Gly Ala Val Gln Tyr Cys Gly Val Met Thr
100 105 110
His Ser Lys Val Asp Lys Asn Asn Gln Gly Lys Glu Phe Phe Glu Lys
115 120 125
Cys Asp
130
<210> 51
<211> 34
<212> PRT
<213> 多毛菌素A二苏氨酸位点N末端片段(Hirsutellin A dithreonine site N-terminal fragment)
<400> 51
Ala Pro Ile Val Thr Cys Arg Pro Lys Leu Asp Gly Arg Glu Lys Pro
1 5 10 15
Phe Lys Val Asp Val Ala Thr Ala Gln Ala Gln Ala Arg Lys Ala Gly
20 25 30
Leu Thr
<210> 52
<211> 89
<212> PRT
<213> 多毛菌素A二甘氨酸位点N末端片段(Hirsutellin A diglycine site N-terminal fragment)
<400> 52
Ala Pro Ile Val Thr Cys Arg Pro Lys Leu Asp Gly Arg Glu Lys Pro
1 5 10 15
Phe Lys Val Asp Val Ala Thr Ala Gln Ala Gln Ala Arg Lys Ala Gly
20 25 30
Leu Thr Thr Gly Lys Ser Gly Asp Pro His Arg Tyr Phe Ala Gly Asp
35 40 45
His Ile Arg Trp Gly Val Asn Asn Cys Asp Lys Ala Asp Ala Ile Leu
50 55 60
Trp Glu Tyr Pro Ile Tyr Trp Val Gly Lys Asn Ala Glu Trp Ala Lys
65 70 75 80
Asp Val Lys Thr Ser Gln Gln Lys Gly
85
<210> 53
<211> 167
<212> PRT
<213> sfGFP N末端片段(sfGFP N-terminal fragment)
<400> 53
Met Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val
1 5 10 15
Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Arg Gly Glu
20 25 30
Gly Glu Gly Asp Ala Thr Asn Gly Lys Leu Thr Leu Lys Phe Ile Cys
35 40 45
Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Leu
50 55 60
Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys Arg
65 70 75 80
His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg
85 90 95
Thr Ile Ser Phe Lys Asp Asp Gly Thr Tyr Lys Thr Arg Ala Glu Val
100 105 110
Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile
115 120 125
Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn
130 135 140
Phe Asn Ser His Asn Val Tyr Ile Thr Ala Asp Lys Gln Gly Gly Ser
145 150 155 160
Gly His His His His His His
165
<210> 54
<211> 92
<212> PRT
<213> sfGFP C末端片段(sfGFP C-terminal fragment)
<400> 54
Met His His His His His His Gly Gly Ser Gly Lys Asn Gly Ile Lys
1 5 10 15
Ala Asn Phe Lys Ile Arg His Asn Val Glu Asp Gly Ser Val Gln Leu
20 25 30
Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro Val Leu
35 40 45
Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Val Leu Ser Lys Asp
50 55 60
Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe Val Thr Ala
65 70 75 80
Ala Gly Ile Thr His Gly Met Asp Glu Leu Tyr Lys
85 90
<210> 55
<211> 34
<212> PRT
<213> 酿酒酵母遍在蛋白氨基酸1-34(S. cerevisiae ubiquitin amino acids 1-34)
<400> 55
Met Gln Ile Phe Val Lys Thr Leu Thr Gly Lys Thr Ile Thr Leu Glu
1 5 10 15
Val Glu Ser Ser Asp Thr Ile Asp Asn Val Lys Ser Lys Ile Gln Asp
20 25 30
Lys Glu
<210> 56
<211> 42
<212> PRT
<213> 酿酒酵母遍在蛋白氨基酸35-76(S. cerevisiae ubiquitin amino acids 35-76)
<400> 56
Gly Ile Pro Pro Asp Gln Gln Arg Leu Ile Phe Ala Gly Lys Gln Leu
1 5 10 15
Glu Asp Gly Arg Thr Leu Ser Asp Tyr Asn Ile Gln Lys Glu Ser Thr
20 25 30
Leu His Leu Val Leu Arg Leu Arg Gly Gly
35 40
<210> 57
<211> 15
<212> PRT
<213> 丝氨酸-甘氨酸接头(serine-glycine linker)
<400> 57
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
1 5 10 15
<210> 58
<211> 15
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> HPV-B2-TrisAm
<400> 58
tttgacgtct cgagt 15
<210> 59
<211> 56
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> Lk-SP-单倍体
<400> 59
taactgtcaa aagccactgt gtcctgaaga aaagcaaaga catctggaca aaaagc 56

Claims (23)

1.一种包含多核苷酸的瓶形单倍体,其中所述多核苷酸包括:
a)第一3’茎部,其包括约10至约20个核苷酸碱基;
b)反靶环部分,其包括约16至约40个核苷酸碱基,与所述第一3’茎部连接,其中所述反靶环部分与靶核酸分子基本上互补;以及
c)第二5’茎部,其包括约10至约20个核苷酸碱基,与所述反靶环部分连接,其中所述第一3’茎部与所述第二5’茎部基本上互补;
其中:
所述多核苷酸的5’末端包含-SH部分;并且
反靶环部分:靶核酸分子的Tm大于第一茎部:第二茎部的Tm
2.一种包含多核苷酸的瓶形单倍体,其中所述多核苷酸包括:
a)第一3’茎部,其包括约10至约20个核苷酸碱基;
b)反靶环部分,其包括约16至约40个核苷酸碱基,与所述第一3’茎部连接,其中所述反靶环部分与靶核酸分子基本上互补;以及
c)第二5’茎部,其包括约10至约20个核苷酸碱基,与所述反靶环部分连接,其中所述第一3’茎部与所述第二5’茎部基本上互补;
其中:
反靶环部分:靶核酸分子的Tm大于第一茎部:第二茎部的Tm;并且
所述多核苷酸的5’末端或3’末端与N末端蛋白质片段的C末端或C末端蛋白质片段的N末端连接,其中与所述多核苷酸连接的所述蛋白质片段的所述末端包含半胱氨酸或硒代半胱氨酸。
3.根据权利要求1或权利要求2所述的瓶形单倍体,其中:
从所述反靶环部分:靶核酸分子的Tm中减去所述第一茎部:第二茎部的Tm为约10℃至约40℃;
所述第一茎部:第二茎部的Tm为约40℃至约50℃;
所述反靶环部分:靶核酸分子的Tm为约60℃至约80℃;和/或
从所述反靶环部分:靶核酸分子的Tm中减去所述第一茎部:第二茎部的Tm为约10℃至约20℃。
4.根据权利要求1至3中任一项所述的瓶形单倍体,其中:
所述第一茎部包括约12至约18个核苷酸碱基;
所述反靶环部分包括约18至约35个核苷酸碱基;和/或
所述第二茎部包括约12至约18个核苷酸碱基。
5.根据权利要求1至4中任一项所述的瓶形单倍体,还包括在所述第一茎部与所述反靶环部分之间,或所述反靶环部分与所述第二茎部之间中的任何一者或多者的接头。
6.一种单倍体,其包含:
a)多核苷酸;以及
b)N末端蛋白质片段或C末端蛋白质片段,其中所述多核苷酸的3’或5’末端与所述C末端蛋白质片段的N末端或所述N末端蛋白质片段的C末端连接;
其中:
所述N末端片段包含APIVTCRKLDGREKPFKVDVATAQAQARKAGLTTGKSGDPHRYFAGDHIRWGVNNCDKADAILWEYPIYWVGKNAEWAKDVKTSQQKG(SEQ ID NO:1)的氨基酸序列,并且所述C末端片段包GPTPIRVVYANSRGAVQYCGVMTHSKVDKNNQGKEFFEKCD(SEQ ID NO:2)的氨基酸序列;
所述N末端片段包含APIVTCRPKLDG(SEQ ID NO:3)的氨基酸序列,并且所述C末端片段包含REKPFKVDVATAQAQARKAGLTTGKSGDPHRYFAGDHIRWGVNNCDKADAILWEYPIYWVGKNAEWAKDVKTSQQKGGPTPIRVVYANSRGAVQYCGVMTHSKVDKNNQGKEFFEKCD(SEQ ID NO:4)的氨基酸序列;
所述N末端片段包含APIVTCRPKLDGREKPFKVDVATAQAQARKAGLTTGK(SEQ ID NO:5)的氨基酸序列,并且所述C末端片段包含SGDPHRYFAGDHIRWGVNNCDKADAILWEYPIYWVGKNAEWAKDVKTSQQKGGPTPIRVVYANSRGAVQYCGVMTHSKVDKNNQGKEFFEKCD(SEQ ID NO:6)的氨基酸序列;
所述N末端片段包含APIVTCRPKLDGREKPFKVDVATAQAQARKAGLTTGKSGDPHRYFAGDHIRWGVNNCDKAD(SEQ ID NO:7)的氨基酸序列,并且所述C末端片段包含AILWEYPIYWVGKNAEWAKDVKTSQQKGGPTPIRVVYANSRGAVQYCGVMTHSKVDKNNQGKEFFEKCD(SEQ ID NO:8)的氨基酸序列;
所述N末端片段包含APIVTCRPKLDGREKPFKVDVATAQAQARKAGLTTGKSGDPHRYFAGDHIRWGVNNCDKADAILWEYPIYWVG(SEQ ID NO:9)的氨基酸序列,并且所述C末端片段包含KNAEWAKDVKTSQQKGGPTPIRVVYANSRGAVQYCGVMTHSKVDKNNQGKEFFEKCD(SEQ ID NO:10)的氨基酸序列;
所述N末端片段包含APIVTCRPKLDGREKPFKVDVATAQAQARKAGLTTGKSGDPHRYFAGDHIRWGVNNCDKADAILWEYPIYWVGKNAEWAKD(SEQ ID NO:11)的氨基酸序列,并且所述C末端片段包含VKTSQQKGGPTPIRVVYANSRGAVQYCGVMTHSKVDKNNQGKEFFEKCD(SEQ ID NO:12)的氨基酸序列;
所述N末端片段包含APIVTCRPKLDGREKPFKVDVATAQAQARKAGLTTGKSGDPHRYFAGDHIRWGVNNCDKADAILWEYPIYWVGKNAEWAKDVKTSQ(SEQ ID NO:13)的氨基酸序列,并且所述C末端片段包含QKGGPTPIRVVYANSRGAVQYCGVMTHSKVDKNNQGKEFFEKCD(SEQ ID NO:14)的氨基酸序列;
所述N末端片段包含APIVTCRPKLDGREKPFKVDVATAQAQARKAGLTTGKSGDPHRYFAGDHIRWGVNNCDKADAILWEYPIYWVGKNAEWAKDVKTSQQKGGPTPIRVVYANSRG(SEQ ID NO:15)的氨基酸序列,并且所述C末端片段包含AVQYCGVMTHSKVDKNNQGKEFFEKCD(SEQ ID NO:16)的氨基酸序列;
所述N末端片段包含APIVTCRPKLDGREKPFKVDVATAQAQARKAGLTTGKSGDPHRYFAGDHIRWGVNNCDKADAILWEYPIYWVGKNAEWAKDVKTSQQKGGPTPIRVVYANSRGAVQYCGVMTHSKVDKN(SEQ ID NO:17)的氨基酸序列,并且所述C末端片段包含NQGKEFFEKCD(SEQ ID NO:18)的氨基酸序列;或
所述N末端片段包含APIVTCRPKLDGREKPFKVDVATAQAQARKAGLT;(SEQ ID NO:40)的氨基酸序列,并且所述C末端片段包含TGKSGDPHRYFAGDHIRWGVNNCDKADAILWEYPIYWVGKNAEWAKDVKTSQQKGGPTPIRVVYANSRGAVQYCGVMTHSKVDKNNQGKEFFEKCD(SEQ ID NO:41)的氨基酸序列。
7.一种表面靶标化合物,其包含:
a)模板多核苷酸;以及
b)肽;
其中:
所述多核苷酸的5’末端与所述肽的N末端或C末端偶联,或所述多核苷酸的3’末端与所述肽的N末端或C末端偶联;并且
所述肽是细胞表面分子的配体。
8.根据权利要求7所述的表面靶标化合物,其中所述配体是肽激素或神经肽。
9.根据权利要求7所述的表面靶标化合物,其中所述多核苷酸包含核苷酸序列AAGCCACTGTGTCCTGAAGAAAAGCAAAGACATC(SEQ ID NO:20),并且所述肽包含氨基酸序列SYSMEHFRWGKPVGGGSSGGGC(SEQ ID NO:21)、SYSXEHFRWGKPVGGGSSGGGC(SEQ ID NO:22)、CSGGGSSGGGSYSMEHFRWGKPV-NH2(SEQ ID NO:23)或CSGGGSSGGGSYSXEHFRWGKPV-NH2(SEQ IDNO:24),其中X是正亮氨酸并且F残基是D-苯丙氨酸。
10.一种融合蛋白,其包含:
N末端蛋白质片段、融合配偶体蛋白和纯化结构域,其中所述N末端蛋白质片段的C末端与所述融合配偶体蛋白的N末端偶联,并且所述融合配偶体蛋白的C末端与所述纯化结构域的N末端偶联;或
N末端蛋白质片段、融合配偶体蛋白和切割位点,其中所述融合配偶体蛋白的C末端与所述切割位点的N末端偶联,并且所述切割位点的C末端与所述N末端蛋白质片段的N末端偶联,其中所述N末端蛋白质片段包含N末端甲硫氨酸和C末端半胱氨酸;或
C末端蛋白质片段、融合配偶体蛋白和切割位点,其中所述融合配偶体蛋白的C末端与所述切割位点的N末端偶联,并且所述切割位点的C末端与所述C末端蛋白质片段的N末端偶联,其中所述C末端蛋白质片段包含N末端半胱氨酸。
11.根据权利要求19所述的融合蛋白,其包含:
N末端蛋白质片段、内含肽和几丁质结合结构域,其中所述N末端蛋白质片段的C末端与内含肽的N末端偶联,并且内含肽的C末端与所述几丁质结合结构域的N末端偶联;或
N末端蛋白质片段、麦芽糖结合蛋白和肠激酶切割位点,其中所述麦芽糖结合蛋白的C末端与所述肠激酶切割位点的N末端偶联,并且所述肠激酶切割位点的C末端与所述N末端蛋白质片段的N末端偶联,其中所述N末端蛋白质片段包含N末端甲硫氨酸和C末端半胱氨酸;或
C末端蛋白质片段、麦芽糖结合蛋白和肠激酶切割位点,其中所述麦芽糖结合蛋白的C末端与所述肠激酶切割位点的N末端偶联,并且所述肠激酶切割位点的C末端与所述C末端蛋白质片段的N末端偶联,其中所述C末端蛋白质片段包含N末端半胱氨酸。
12.根据权利要求11所述的融合蛋白,其包含N末端蛋白质片段、麦芽糖结合蛋白和肠激酶切割位点,其中所述麦芽糖结合蛋白的C末端与所述肠激酶切割位点的N末端偶联,并且所述肠激酶切割位点的C末端与所述N末端蛋白质片段的N末端偶联,其中所述N末端蛋白质片段包含氨基酸序列APIVTCRPKLDGREKPFKVDVATAQAQARKAGLTTGKSGDPHRYFAGDHIRWGVNNCDKADAILWEYPIYWVGKNAEWAKDVKTSQQKGC(SEQ ID NO:25)。
13.根据权利要求10所述的融合蛋白,其包含C末端蛋白质片段、麦芽糖结合蛋白和肠激酶切割位点,其中所述麦芽糖结合蛋白的C末端与所述肠激酶切割位点的N末端偶联,并且所述肠激酶切割位点的C末端与所述C末端蛋白质片段的N末端偶联,其中所述C末端蛋白质片段包含氨基酸序列CGPTPIRVVYANSRGAVQYCGVMTHSKVDKNNQGKEFFEKCD(SEQ ID NO:26)。
14.一种化合物,其具有下式:
其中n为约3至约6。
15.一种组合物或试剂盒,其包含:
a)第一单倍体,其中所述第一单倍体包含与N末端蛋白质片段的C末端连接的多核苷酸;以及
b)第二单倍体,其中所述第二单倍体包含与C末端蛋白质片段的N末端连接的多核苷酸;
其中:
所述第一或第二单倍体中的一个的所述多核苷酸在其5’末端与所述蛋白质片段连接,并且所述第一和第二单倍体中的另一个在其3’末端与所述蛋白质片段连接;
所述N末端蛋白质片段和所述C末端蛋白质片段来源于单一蛋白质;并且
其中:
所述第一单倍体的所述多核苷酸与所述第二单倍体的所述多核苷酸互补;或
所述第一单倍体的所述多核苷酸与靶核酸分子互补,并且所述第二单倍体的所述多核苷酸在与所述第一单倍体的所述多核苷酸在空间上接近的位点处与所述靶核酸分子基本上互补;或
所述第一单倍体的所述多核苷酸与靶核酸分子5’相邻于茎环结构的部分基本上互补,并且所述第二单倍体的所述多核苷酸与所述靶核酸分子3’相邻于所述茎环结构的部分基本上互补;或
所述第一单倍体的所述多核苷酸与靶核酸分子的茎环结构的环的5’部分基本上互补,并且所述第二单倍体的所述多核苷酸与所述靶核酸分子的所述茎环结构的所述环的3’部分基本上互补。
16.一种组合物或试剂盒,其包含:
a)包含多核苷酸的瓶形单倍体,所述多核苷酸包括:
i)第一3’茎部,其包括约10至约20个核苷酸碱基;
ii)反靶环部分,其包括约16至约40个核苷酸碱基,与所述第一3’茎部连接,其中所述反靶环部分与靶核酸分子基本上互补;以及
iii)第二5’茎部,其包括约10至约20个核苷酸碱基,与所述反靶环部分连接,其中所述第一3’茎部与所述第二5’茎部基本上互补;
其中:
所述多核苷酸的5’末端包含-SH部分;并且
反靶环部分:靶核酸分子的Tm大于第一茎部:第二茎部的Tm
b)N末端蛋白质片段,其中所述N末端蛋白质片段的C末端包含半胱氨酸-SH部分;以及
c)双马来酰亚胺试剂。
17.一种组合物或试剂盒,其包含:
a)包含多核苷酸的瓶形单倍体,所述多核苷酸包括:
i)第一3’茎部,其包括约10至约20个核苷酸碱基;
ii)反靶环部分,其包括约16至约40个核苷酸碱基,与所述第一3’茎部连接,其中所述反靶环部分与靶核酸分子基本上互补;以及
iii)第二5’茎部,其包括约10至约20个核苷酸碱基,与所述反靶环部分连接,其中所述第一3’茎部与所述第二5’茎部基本上互补;
其中所述多核苷酸的5’末端与N末端蛋白质片段的C末端连接,其中所述C末端包含半胱氨酸;以及
b)包含多核苷酸和C末端蛋白质片段的第二单倍体,其中所述多核苷酸的3’末端与所述C末端蛋白质片段的N末端连接,其中所述N末端包含半胱氨酸;
其中:
所述第二单倍体的所述多核苷酸与所述瓶形单倍体的所述多核苷酸的所述第二5’茎部基本上互补;
反靶环部分:靶核酸分子的Tm大于第一茎部:第二茎部的Tm;并且
所述N末端蛋白质片段和所述C末端蛋白质片段来源于单一蛋白质。
18.根据权利要求15至17中任一项所述的试剂盒或组合物,其中所述多核苷酸和蛋白质片段各自包含生物正交反应性分子。
19.一种用于蛋白质在细胞中的定向组装的方法,其包括:
a)使细胞与第一单倍体接触,所述第一单倍体包含与N末端蛋白质片段的C末端连接的多核苷酸;以及
b)使所述细胞与第二单倍体接触,所述第二单倍体包含与C末端蛋白质片段的N末端连接的多核苷酸;
其中:
所述第一或第二单倍体中的一个的所述多核苷酸在其5’末端与所述蛋白质片段连接,并且所述第一和第二单倍体中的另一个在其3’末端与所述蛋白质片段连接;
所述N末端蛋白质片段和所述C末端蛋白质片段来源于单一蛋白质;并且
其中:
所述第一单倍体的所述多核苷酸与所述第二单倍体的所述多核苷酸基本上互补;或
所述第一单倍体的所述多核苷酸与靶核酸分子基本上互补,并且所述第二单倍体的所述多核苷酸在与所述第一单倍体的所述多核苷酸在空间上接近的位点处与所述靶核酸分子基本上互补;或
所述第一单倍体的所述多核苷酸与靶核酸分子5’相邻于茎环结构的部分基本上互补,并且所述第二单倍体的所述多核苷酸与所述靶核酸分子3’相邻于所述茎环结构的部分基本上互补;或
所述第一单倍体的所述多核苷酸与靶核酸分子的茎环结构的环的5’部分基本上互补,并且所述第二单倍体的所述多核苷酸与所述靶核酸分子的所述茎环结构的所述环的3’部分基本上互补;
从而导致由所述N末端蛋白质片段和所述C末端蛋白质片段组装所述蛋白质。
20.一种用于蛋白质的定向组装的方法,其包括:
a)使靶核酸分子与瓶形单倍体接触,所述瓶形单倍体包括:
i)第一3’茎部,其包括约10至约20个核苷酸碱基;
ii)反靶环部分,其包括约16至约40个核苷酸碱基,与所述第一3’茎部连接,其中所述反靶环部分与靶核酸分子基本上互补;以及
iii)第二5’茎部,其包括约10至约20个核苷酸碱基,与所述反靶环部分连接,其中所述第一3’茎部与所述第二5’茎部基本上互补;
其中所述多核苷酸的5’末端与N末端蛋白质片段的C末端连接,其中所述C末端包含半胱氨酸;以及
b)使所述瓶形单倍体与第二单倍体接触,所述第二单倍体包含与C末端蛋白质片段的N末端连接的多核苷酸,其中所述第二单倍体的所述多核苷酸与所述瓶形单倍体的所述多核苷酸的所述第二5’茎部基本上互补;
其中:
所述N末端蛋白质片段和所述C末端蛋白质片段来源于单一蛋白质;
反靶环部分:靶核酸分子的Tm大于第一茎部:第二茎部的Tm;并且
从所述第一茎部:第二茎部的Tm中减去由所述第二单倍体和所述瓶形单倍体的所述第二茎部形成的双链体的Tm为约0℃至约20℃;
从而导致由所述N末端蛋白质片段和所述C末端蛋白质片段组装所述蛋白质。
21.一种用于蛋白质的定向组装的方法,其包括:
a)使细胞与表面靶标化合物接触,所述表面靶标化合物包含:
i)模板多核苷酸;以及
ii)肽;
其中:
所述多核苷酸的5’末端与所述肽的N末端或C末端偶联,或所述多核苷酸的3’末端与所述肽的N末端或C末端偶联;并且
所述肽是细胞表面分子的配体;
b)使所述细胞与第一单倍体接触,所述第一单倍体包含与N末端蛋白质片段的C末端连接的多核苷酸;以及
c)使所述细胞与第二单倍体接触,所述第二单倍体包含与C末端蛋白质片段的N末端连接的多核苷酸;
其中:
所述第一或第二单倍体中的一个的所述多核苷酸在其5’末端与所述蛋白质片段连接,并且所述第一和第二单倍体中的另一个在其3’末端与所述蛋白质片段连接;
所述N末端蛋白质片段和所述C末端蛋白质片段来源于单一蛋白质;并且
所述第一单倍体的所述多核苷酸与所述表面靶标化合物的所述模板多核苷酸基本上互补,并且所述第二单倍体的所述多核苷酸在与所述第一单倍体的所述多核苷酸在空间上接近的位点处与所述表面靶标化合物的所述模板多核苷酸基本上互补;
从而导致由所述N末端蛋白质片段和所述C末端蛋白质片段组装所述蛋白质。
22.一种用于蛋白质的定向组装的方法,其包括:
a)使细胞与表面靶标化合物接触,所述表面靶标化合物包含:
i)模板多核苷酸;以及
ii)肽;
其中:
所述多核苷酸的5’末端与所述肽的N末端或C末端偶联,或所述多核苷酸的3’末端与所述肽的N末端或C末端偶联;并且
所述肽是细胞表面分子的配体;
b)使靶核酸分子与瓶形单倍体接触,所述瓶形单倍体包含:
i)第一3’茎部,其包括约10至约20个核苷酸碱基;
ii)反靶环部分,其包括约16至约40个核苷酸碱基,与所述第一3’茎部连接,其中所述反靶环部分与所述表面靶标化合物的所述模板多核苷酸基本上互补;以及
iii)第二5’茎部,其包括约10至约20个核苷酸碱基,与所述反靶环部分连接,其中所述第一3’茎部与所述第二5’茎部基本上互补;
其中所述多核苷酸的5’末端与N末端蛋白质片段的C末端连接,其中所述C末端包含半胱氨酸;以及
c)使所述瓶形单倍体与第二单倍体接触,所述第二单倍体包含与C末端蛋白质片段的N末端连接的多核苷酸,其中所述第二单倍体的所述多核苷酸与所述瓶形单倍体的所述多核苷酸的所述第二5’茎部基本上互补;
其中:
所述N末端蛋白质片段和所述C末端蛋白质片段来源于单一蛋白质;
反靶环部分:靶核酸分子的Tm大于第一茎部:第二茎部的Tm;并且
从所述第一茎部:第二茎部的Tm中减去由所述第二单倍体和所述瓶形单倍体的所述第二茎部形成的双链体的Tm为约0℃至约20℃;
从而导致由所述N末端蛋白质片段和所述C末端蛋白质片段组装所述蛋白质。
23.一种从融合蛋白中的内含肽融合配偶体中切割N末端蛋白质片段的方法,其包括:
a)使所述融合蛋白与2-巯基乙烷磺酸接触;以及
b)使所述融合蛋白与具有甲基四嗪基团的半胱氨酸接触;
从而从所述融合蛋白中释放出所述N末端蛋白质片段。
CN201780084045.3A 2016-11-21 2017-11-16 通过接近增强的反应性实现分裂蛋白模板组装的方法 Pending CN110191953A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662424689P 2016-11-21 2016-11-21
US62/424,689 2016-11-21
PCT/US2017/061907 WO2018093978A2 (en) 2016-11-21 2017-11-16 Methods for split-protein template assembly by proximity-enhanced reactivity

Publications (1)

Publication Number Publication Date
CN110191953A true CN110191953A (zh) 2019-08-30

Family

ID=62146850

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780084045.3A Pending CN110191953A (zh) 2016-11-21 2017-11-16 通过接近增强的反应性实现分裂蛋白模板组装的方法

Country Status (5)

Country Link
US (1) US20230193244A1 (zh)
EP (1) EP3541415A4 (zh)
JP (1) JP2020501530A (zh)
CN (1) CN110191953A (zh)
WO (1) WO2018093978A2 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110121559A (zh) * 2016-11-21 2019-08-13 特里比奥迪卡有限责任公司 通过模板化组装反应进行蛋白质的定向折叠组装或二聚化的方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018094070A1 (en) * 2016-11-21 2018-05-24 Tribiotica Llc Methods for preventing titration of bimolecular templated assembly reactions by structurally-determined differential hybridizations
US20240002908A1 (en) * 2020-11-09 2024-01-04 The General Hospital Corporation Methods of determining surface glycan density

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1633501A (zh) * 2002-01-08 2005-06-29 迈克尔·R·拉尔布 表达civps或内含肽修饰蛋白的转基因植物及其制备方法
WO2013012434A1 (en) * 2011-07-15 2013-01-24 University Of Miami Bioluminescent stem-loop probes, compositions containing the same and methods utilizing the same
WO2015175747A1 (en) * 2014-05-14 2015-11-19 Evorx Technologies, Inc. Barcoded peptides
CN105358691A (zh) * 2013-06-04 2016-02-24 特里比奥迪卡有限责任公司 用于核酸特异性杂化合物的模板化装配的方法和组合物
WO2016134232A1 (en) * 2015-02-19 2016-08-25 Massachusetts Institute Of Technology Theranostic nanoprobes for overcoming cancer multidrug resistance and methods

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2403209A1 (en) * 1999-04-08 2000-10-19 Pavel V. Sergeev Synthesis of biologically active compounds in cells
US8168381B2 (en) * 2004-11-22 2012-05-01 Peter Birk Rasmussen Template directed split and mix systhesis of small molecule libraries
CN105358984B (zh) * 2013-03-15 2020-02-18 普罗格诺西斯生物科学公司 用于检测肽/mhc/tcr结合的方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1633501A (zh) * 2002-01-08 2005-06-29 迈克尔·R·拉尔布 表达civps或内含肽修饰蛋白的转基因植物及其制备方法
WO2013012434A1 (en) * 2011-07-15 2013-01-24 University Of Miami Bioluminescent stem-loop probes, compositions containing the same and methods utilizing the same
CN105358691A (zh) * 2013-06-04 2016-02-24 特里比奥迪卡有限责任公司 用于核酸特异性杂化合物的模板化装配的方法和组合物
US20160106854A1 (en) * 2013-06-04 2016-04-21 Tribiotica Llc Methods And Compositions For Templated Assembly Of Nucleic Acid Specific Heterocompounds
WO2015175747A1 (en) * 2014-05-14 2015-11-19 Evorx Technologies, Inc. Barcoded peptides
WO2016134232A1 (en) * 2015-02-19 2016-08-25 Massachusetts Institute Of Technology Theranostic nanoprobes for overcoming cancer multidrug resistance and methods
US20160243254A1 (en) * 2015-02-19 2016-08-25 Massachusetts Institute Of Technology Theranostic Nanoprobes for Overcoming Cancer Multidrug Resistance and Methods

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
YONGQIAN等: "A novel signal-on electrochemical DNA sensor based on target catalyzed hairpin assembly strategy", 《BIOSENSORS AND BIOELECTRONICS》 *
YUQING HE等: "Visual detection of single-base mismatches in DNA using hairpin oligonucleotide with double-target DNA binding sequences and gold nanoparticles", 《BIOSENSORS AND BIOELECTRONICS》 *
王永红: "基于纳米材料信号增强的电化学生物传感器研究", 《中国博士学位论文全文数据库(电子期刊)工程科技I辑》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110121559A (zh) * 2016-11-21 2019-08-13 特里比奥迪卡有限责任公司 通过模板化组装反应进行蛋白质的定向折叠组装或二聚化的方法

Also Published As

Publication number Publication date
EP3541415A4 (en) 2020-10-14
WO2018093978A2 (en) 2018-05-24
EP3541415A2 (en) 2019-09-25
WO2018093978A3 (en) 2018-09-20
US20230193244A1 (en) 2023-06-22
JP2020501530A (ja) 2020-01-23

Similar Documents

Publication Publication Date Title
Klabenkova et al. Chemistry of peptide-oligonucleotide conjugates: a review
KR101317100B1 (ko) 세포-침투성 펩티드로서 유용한 펩티드
US11866466B2 (en) Tumor homing and cell penetrating peptide-immuno-oncology agent complexes and methods of use thereof
Venkatesan et al. Peptide conjugates of oligonucleotides: synthesis and applications
JPH08506487A (ja) 全合成親和性試薬
US20210317479A1 (en) Nucleic acid assemblies for use in targeted delivery
CN109563537B (zh) 使用核酸适体用于导向的模板化组装的方法
JP7064769B2 (ja) 条件的活性型ポリペプチド
JPH09508019A (ja) 亜鉛フィンガータンパク質誘導体およびそのための方法
JP2015519344A (ja) 炭疽菌防御抗原ポアを通しての非天然化学実体のトランスロケーション
CN110191953A (zh) 通过接近增强的反应性实现分裂蛋白模板组装的方法
CN105579464A (zh) 能够再活化p53突变体的肽
Taskova et al. Synthetic nucleic acid analogues in gene therapy: an update for peptide–oligonucleotide conjugates
JP2022095641A (ja) 条件的活性型ポリペプチド及びそれを生成する方法
CN105358691A (zh) 用于核酸特异性杂化合物的模板化装配的方法和组合物
Liu et al. Toward artificial immunotoxins: traceless reversible conjugation of RNase A with receptor targeting and endosomal escape domains
CN107847567A (zh) 方法
EP1907544B1 (en) Membrane-translocating peptides
Fadaie et al. Unraveling the potential of M13 phages in biomedicine: Advancing drug nanodelivery and gene therapy
US20220387471A1 (en) Methods For Directed Folding Assembly Or Dimerization Of Proteins By Templated Assembly Reactions
Billerbeck Small Functional Peptides and Their Application in Superfunctionalizing Proteins
CN117203224A (zh) 包括封装在其中的客体货物的人工蛋白笼
JP2024507901A (ja) その中にカプセル化されたゲストカーゴを含む人工タンパク質ケージ
WO2023086901A1 (en) Borrelia burgdorferi peptidoglycan detection methods
Archer Preparation, Characterization, and Delivery of Antibodies Binding to a Model Oncogenic RNA, Human Initiator tRNA

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190830

WD01 Invention patent application deemed withdrawn after publication