CN108410827A - 整合包含bcn基团的氨基酸到多肽中的方法 - Google Patents

整合包含bcn基团的氨基酸到多肽中的方法 Download PDF

Info

Publication number
CN108410827A
CN108410827A CN201810228028.9A CN201810228028A CN108410827A CN 108410827 A CN108410827 A CN 108410827A CN 201810228028 A CN201810228028 A CN 201810228028A CN 108410827 A CN108410827 A CN 108410827A
Authority
CN
China
Prior art keywords
leu
ser
lys
glu
arg
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810228028.9A
Other languages
English (en)
Other versions
CN108410827B (zh
Inventor
贾森·钦
凯瑟琳·郎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
United Kingdom Research and Innovation
Original Assignee
Medical Research Council
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from GBGB1208875.3A external-priority patent/GB201208875D0/en
Priority claimed from GBGB1210303.2A external-priority patent/GB201210303D0/en
Application filed by Medical Research Council filed Critical Medical Research Council
Priority to CN201810228028.9A priority Critical patent/CN108410827B/zh
Publication of CN108410827A publication Critical patent/CN108410827A/zh
Application granted granted Critical
Publication of CN108410827B publication Critical patent/CN108410827B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K1/00General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
    • C07K1/006General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length of peptides containing derivatised side chain amino acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07CACYCLIC OR CARBOCYCLIC COMPOUNDS
    • C07C271/00Derivatives of carbamic acids, i.e. compounds containing any of the groups, the nitrogen atom not being part of nitro or nitroso groups
    • C07C271/06Esters of carbamic acids
    • C07C271/08Esters of carbamic acids having oxygen atoms of carbamate groups bound to acyclic carbon atoms
    • C07C271/10Esters of carbamic acids having oxygen atoms of carbamate groups bound to acyclic carbon atoms with the nitrogen atoms of the carbamate groups bound to hydrogen atoms or to acyclic carbon atoms
    • C07C271/22Esters of carbamic acids having oxygen atoms of carbamate groups bound to acyclic carbon atoms with the nitrogen atoms of the carbamate groups bound to hydrogen atoms or to acyclic carbon atoms to carbon atoms of hydrocarbon radicals substituted by carboxyl groups
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K1/00General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
    • C07K1/13Labelling of peptides
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2/00Peptides of undefined number of amino acids; Derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/93Ligases (6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y601/00Ligases forming carbon-oxygen bonds (6.1)
    • C12Y601/01Ligases forming aminoacyl-tRNA and related compounds (6.1.1)
    • C12Y601/01026Pyrrolysine-tRNAPyl ligase (6.1.1.26)
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/58Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving labelled substances
    • G01N33/582Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving labelled substances with fluorescent label
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07CACYCLIC OR CARBOCYCLIC COMPOUNDS
    • C07C2602/00Systems containing two condensed rings
    • C07C2602/02Systems containing two condensed rings the rings having only two atoms in common
    • C07C2602/14All rings being cycloaliphatic
    • C07C2602/24All rings being cycloaliphatic the ring system containing nine carbon atoms, e.g. perhydroindane

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Hematology (AREA)
  • Immunology (AREA)
  • Urology & Nephrology (AREA)
  • Cell Biology (AREA)
  • Food Science & Technology (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)

Abstract

本发明涉及整合包含BCN基团的氨基酸到多肽中的方法。具体而言,本发明涉及包含具有双环[6.1.0]壬‑4‑炔‑9‑基甲醇(BCN)基团的氨基酸的多肽,尤其是当所述BCN基团作为赖氨酸的残基存在。本发明还涉及制备包含BCN基团的多肽的方法,所述方法包括将包括BCN基团的氨基酸遗传整合到多肽。本发明还涉及包括双环[6.1.0]壬‑4‑炔‑9‑基甲醇(BCN)的氨基酸,特别地,氨基酸是双环[6.1.0]壬‑4‑炔‑9‑基甲醇(BCN)赖氨酸。此外,本发明涉及包含突变Y271M、L274G和C313A的PylRS tRNA合成酶。

Description

整合包含BCN基团的氨基酸到多肽中的方法
本申请是申请号为201380037290.0,申请日为2013年5月15日,发明名称为“利用编码包含BCN基团的氨基酸的正交密码子和正交PylRS合成酶将包含BCN基团的氨基酸整合到多肽中的方法”的中国专利申请的分案申请。
技术领域
本发明涉及经(延伸的)遗传密码的生物正交基团的位点特异性整合。特别地,本发明涉及经在遗传整合的氨基酸基团如亲二烯体和化学基团如四嗪之间的加速的反电子需求 Diels-Alder反应,将化学基团整合到多肽中。
背景技术
经遗传编码延伸的生物正交基团的位点特异性整合为具有任意探针的位点特异的标记蛋白提供了强大的通用策略。然而,可被遗传编码的生物正交官能团的缓慢反应性限制了这一策略的利用。
对于化学生物学家而言,具有不同探针的蛋白的快速且位点特异性标记仍是个很大的挑战;酶介导的标记方法可以是快速的,但在研究中,却使用了将扰动引入到蛋白中的蛋白或肽的融合,并可能限制了可标记的位点,而许多可遗传编码组分的“生物正交”反应太慢以至于在用于研究许多生物过程的时间尺度上影响了蛋白的定量的和位点特异性得标记。
迫切需要在不同背景下的具有用户定义的探针的位点特异性标记蛋白的通用方法。
包含降冰片烯和反式环辛烯的有张力(strained)的烯烃和四嗪之间的反电子需求 Diels-Alder反应已成为一类重要的快速生物正交反应1-4。据报道,某些这些反应的速度非常快3,4
最近,已报道了使用这些反应的特异性标记蛋白的三种方法:
-一种在两步法中接受反式环辛烯底物的硫辛酸连接酶变体已被用于标记带有13个氨基酸硫辛酸连接酶标签的蛋白5
-一种四嗪已在特异性位点上经遗传编码延伸引入在大肠杆菌中表达的的蛋白,并与有张力的反式环辛烯二乙酰荧光素进行衍生6
-已证示了有张力的烯烃(包含降冰片烯的氨基酸)的整合,其是通过遗传编码延伸和体外、大肠杆菌中和哺乳动物细胞中的用四嗪荧光基团的位点特异性荧光标记7。最近还报道了包含降冰片烯的氨基酸的整合8,9
已报道了包含反式环辛烯的氨基酸(TCO)(2)的低效整合,其在固定的细胞中具有一些荧光标记的检测9
最近在有机溶剂中的模型反应进行的工作表明BCN(最初描述于与叠氮化物进行的张力促进的反应中)10和四嗪之间的反应可以非常快速地进行11。然而,与简单的用叠氮化物、硝酮12-16和四嗪9,17进行的环辛炔的非常慢的反应不同,此反应还未在水性介质中进行探索或还未探索作为化学选择性路径以标记大分子。
本发明意图克服与现有技术相关的问题。
发明内容
在本领域中存在一些将四嗪化合物附着到多肽上的技术。然而,这些技术的反应速率很慢。此外,这些技术使得产生多种化学物质作为反应产物。这可能导致一些问题,如染料基团间可变的分子距离,其可能使荧光共振能量转移(FRET)分析产生问题。这对治疗性分子的生产也可能是不利的,因为产物的异质性是本领域中的一个缺点。
本发明人已提供了一种具有双环[6.1.0]壬-4-炔-9-基甲醇(BCN)基团的新的氨基酸。这显著地增加了反应速度,这是有利的。此外,这允许进行单产物加成反应。这导致了均一的产物,这是一个优势。这也在产物中消除了异构体变体(空间异构体),这在一系列如本文所表明的应用中提供了技术优势。此外,BCN加成反应的产物不是差向异构的,而来自(例如)降冰片烯和/或TCO反应的产物会产生差向异构体。因此,本发明的一个优势在于其还避免了差向异构体的问题。
因此,在一个方面中,本发明提供了包括具有双环[6.1.0]壬-4-炔-9-基甲醇(BCN)基团的氨基酸的多肽。这具有在加入(例如)四嗪化合物后提供单反应产物的优势。可替代的技术如降冰片烯加成或TCO加成得到的产物是包含不同的异构体如区域或立体异构体的混合物。这一优势的一个原因在于分子的BCN部分具有镜面对称,使得产物是相同的,而对于TCO/降冰片烯而言,分子的那一部分是手性的,使得可以附着到双键的“顶面”或“底面”,导致在产物中存在不同的异构体。
因此,当用于将其它的基团如四嗪化合物附着到多肽上时,本发明的优点在于提供了产物的均一性。
适当地,所述BCN基团作为赖氨酸的残基存在。
在另一个方面中,本发明涉及一种生产包含BCN基团的多肽的方法,所述方法包括将包含BCN基团的氨基酸遗传整合到多肽中。
适当地,生产所述多肽包括:
(i)提供编码多肽的核酸,该核酸包含编码具有BCN基团的氨基酸的正交密码子;
(ⅱ)在能够识别所述正交密码子的正交tRNA合成酶/tRNA对存在的情况下翻译所述核酸,并将具有BCN基团的氨基酸整合到多肽链上。
适当地,所述包含BCN基团的氨基酸是BCN赖氨酸。
适当地,所述正交密码子包括琥珀密码子(TAG),所述tRNA包括MbtRNACUA。适当地,所述具有BCN基团的氨基酸包括双环[6.1.0]壬-4-炔-9-基甲醇(BCN)赖氨酸。适当地,所述tRNA合成酶包含具有突变Y271M、L274G和C313A的PylRS合成酶(BCNRS)。
适当地,所述具有BCN基团的氨基酸所整合的位置对应于野生型多肽中的赖氨酸残基的位置。其优势在于,使包含BCN的多肽与作为其来源的野生型多肽之间保持最接近的可能的结构关系。
在另一个方面中,本发明涉及一种如上所述的多肽,其包括单个BCN基团。因此,适当地,多肽包含单个BCN基团。这优势在于,可保持可能作用于BCN基团的任何其它化学修饰的特异性。例如,当在目标多肽中仅存在单个BCN基团时,有助于避免如下可能的问题,即部分修饰(如其中仅多肽中的部分BCN基团随后被修饰)或在相同多肽上的可替代的BCN基团之间变化的反应微环境(其可导致在多肽的不同位置的不同的BCN 基团之间的不平等的反应性)。
BCN基团整合的关键优势在于其允许一系列非常有用的其它化合物如标记能够容易地且特异性地附着到BCN基团上。
在另一个方面中,本发明涉及一种如上所述的多肽,其中所述BCN基团连接到四嗪基团上。
在另一个方面中,本发明涉及一种如上所述的多肽,其中所述四嗪基团进一步连接到荧光团上。
适当地,所述荧光团包括荧光素、四甲罗丹明(TAMRA)或硼吡咯甲烷(BODIPY)。
在另一个方面中,本发明涉及一种包含BCN基团的新的非天然氨基酸。
在另一个方面中,本发明涉及一种包含双环[6.1.0]壬-4-炔-9-基甲醇(BCN)的氨基酸。
在另一个方面中,本发明涉及一种氨基酸,其是双环[6.1.0]壬-4-炔-9-基甲醇(BCN) 赖氨酸。
适当地,如上所述的BCN赖氨酸具有如下结构:
在另一个方面中,本发明涉及一种生产包含四嗪基团的多肽的方法,所述方法包括:提供如上所述的多肽,将所述多肽与四嗪化合物相接触,并孵育以允许通过反电子需求Diels-Alder环加成反应,将四嗪连接到BCN基团上。
适当地,四嗪选自图1的6至17。
适当地,反应的准一级速率常数至少为80M-1s-1
适当地,四嗪选自图1的6、7、8和9且反应的准一级速率常数至少为80M-1s-1
这种化学反应具有反应速度的优势。
适当地,允许所述反应进行10分钟或更少。
适当地,允许所述反应进行1分钟或更少。
适当地,允许所述反应进行30秒或更少。
值得注意的是,某些反应环境可能会影响反应时间。最适当地,最短时间如30秒或更少可应用于体外反应。
在体内或在真核生物培养条件如组织培养基或其它适合真核细胞的介质中的反应可能需要反应超过30秒以达到最大标记。熟练的操作者可以基于本文所提供的指导通过试错法来确定最佳反应时间。
适当地,所述四嗪化合物是选自图1的11和17的四嗪化合物。
在另一个方面中,本发明涉及一种包含突变Y271M、L274G和C313A的PylRS tRNA合成酶。
适当地,所述PylRS tRNA合成酶的序列对应于包含突变Y271M、L274G和C313A 的MbPylRS tRNA合成酶的序列。
在另一个方面中,本发明涉及本发明的PylRS tRNA合成酶将包含双环[6.1.0]壬-4- 炔-9-基甲醇(BCN)的氨基酸整合到多肽中的用途。
在另一个方面中,本发明涉及一种将包含双环[6.1.0]壬-4-炔-9-基甲醇(BCN)的氨基酸整合到多肽中的方法,其包含使用本发明的PylRS tRNA合成酶以整合所述氨基酸。
在另一个方面中,本发明涉及一种如上所述的均质的重组多肽。适当地,所述多肽由如上所述的方法进行制备。
还公开的是根据如本文所述的方法生产的多肽。并且作为这些新方法的产物,这样的多肽具有包括BCN的技术特征。
突变具有本领域中的正常含义,并且可以是指所涉及的残基、基序或结构域的取代、截短或缺失。可以在多肽水平上产生突变,例如通过合成具有突变序列的多肽,或者可以在核苷酸水平上产生突变,例如通过制备编码突变序列的核酸,该核酸随后可被翻译以产生突变多肽。其中,没有氨基酸被指定为给定突变位点的替换氨基酸,适当地,使用所述位点的随机化。作为缺省突变,可以使用丙氨酸(A)。适当地,在特定位点使用的突变如本文所列。
适当地,片段的长度至少为10个氨基酸,适当地至少为25个氨基酸,适当地至少为50个氨基酸,适当地至少为100个氨基酸,适当地至少为200个氨基酸,适当地至少为250个氨基酸,适当地至少为300个氨基酸,适当地至少为313个氨基酸,或适当地为目标多肽的大部分。
在此,我们证明了双环[6.1.0]壬-4-炔-9-基甲醇(BCN)和四嗪之间的荧光反应。这些反应的速率快于许多“生物正交”反应的速率3-7个数量级。我们描述了氨酰-tRNA合成酶/tRNA对和其用于将包含BCN的氨基酸,1,和包含反式环辛烯的氨基酸2(其与四嗪的反应也非常迅速)有效地位点特异性整合到大肠杆菌和哺乳动物细胞中表达的蛋白的用途。我们证明了在第一可测量的时间点(几秒钟或几分钟后)在体外、大肠杆菌中和活哺乳动物细胞中包含1和2的蛋白的位点特异性荧光标记。此外,我们证明了对于蛋白质组的四嗪标记的特异性,以及对于现有的“生物正交”反应,这一方法的优势(其组分可被编码)。开发的方法可在动物中用于位点特异性蛋白标记,并且发现其可用于标记和成像研究。
一种包含具有亲二烯体基团的氨基酸的多肽,其特征在于所述亲二烯体基团包含双环[6.1.0]壬-4-炔-9-基甲醇(BCN)基团。
我们描述了双环壬炔和反式环辛烯的遗传编码,其通过荧光Diels-Alder反应在体外和在活哺乳动物细胞中用于位点特异性蛋白标记。
本发明的方法可以在体内或体外实施。
在一个实施方式中,适当地,本发明的方法不用于人体或动物体。适当地,本发明的方法是体外方法。适当地,方法不需要人体或动物体的存在。适当地,方法不是人体或动物体的诊断、治疗或手术方法。
亲二烯体/反式-环辛烯(TCO)方面
在一个宽的方面中,本发明涉及包含具有能够与四嗪基团反应的亲二烯体基团的氨基酸的多肽。
适当地,所述亲二烯体基团作为赖氨酸的残基存在。
在一个实施方式中,本发明涉及一种生产含有亲二烯体基团的多肽的方法,所述方法包括将含有亲二烯体基团的氨基酸遗传整合到多肽中。
适当地,生产此多肽包含:
(i)提供编码多肽的核酸,该核酸包含编码具有亲二烯体基团的氨基酸的正交密码子;
(ⅱ)在能够识别所述正交密码子的正交tRNA合成酶/tRNA对存在的情况下翻译所述核酸,并将具有亲二烯体基团的氨基酸整合到多肽链上。适当地,所述含有亲二烯体基团的氨基酸是亲二烯体赖氨酸。
适当地,所述正交密码子包括琥珀密码子(TAG),所述tRNA包含MbtRNACUA,所述具有亲二烯体基团的氨基酸包括含有反式-环辛烯-4-醇(TCO)的氨基酸,以及所述tRNA 合成酶包含具有突变Y271A、L274M和C313A(TCORS)的PylRS合成酶。
适当地,所述PylRS tRNA合成酶的序列对应于含有突变Y271A、L274M和 C313A(TCORS)的MbPylRS tRNA合成酶的序列。在另一个方面中,本发明涉及本发明的 PylRStRNA合成酶用于将含有反式-环辛烯-4-醇(TCO)的氨基酸整合到多肽中的用途。
在另一个方面中,本发明涉及一种将含有反式-环辛烯-4-醇(TCO)的氨基酸整合到多肽中的方法,其包含使用本发明的PylRS tRNA合成酶以整合该氨基酸。
除非上下文另有说明,本文所讨论的将四嗪化合物连接到非天然氨基酸相关的方面,同样也用于TCO氨基酸,因为它们作用于BCN氨基酸。
我们报道了非常快速的荧光的BCN与一系列四嗪在室温水性条件下的反应。BCN-四嗪反应的速率常数高于降冰片烯与相同的四嗪的反应500至1000倍。TCO-四嗪反应的速率常数高于BCN与相同的四嗪的反应10-15倍。有张力的烯烃和四嗪之间的反应可能会导致非对映体和区域异构体以及来自二氢哒嗪异构化的异构体的混合物3,4
相反地,BCN四嗪反应导致形成单一的产物。这可能是应用中的一种优势,其中同质在探针附着的取向中可能是重要的,这包括单分子光谱和FRET法。
我们描述了氨酰-tRNA合成酶/tRNA对及其引导1和2高效地位点特异性地整合到大肠杆菌和哺乳动物细胞中的蛋白的用途。
我们已证实,蛋白的特异性定量标记使用编码的氨基酸1和2可以在数秒钟内完成,而此过程使用编码的降冰片烯时需要数十分钟至数小时7,使用利用铜催化的点击化学并使用炔烃探针的编码的叠氮化物时需要数十小时21。虽然我们未观察到整合到哺乳动物细胞表面上的EGFR中的叠氮化物与环辛炔的标记7,以及EGFR中编码的降冰片烯的标记仅允许与四嗪在2小时后标记7,但使用纳摩尔浓度的四嗪-染料缀合物在所测量的第一时间点(2min)观察到了整合1和2的EGFR的强且饱和的标记。这些实验证明,在小分子实验中所表征的快速的BCN-四嗪和TCO-四嗪连接在不同环境的蛋白标记中转化为实质性进步。虽然我们已证明了这种方法在体外、在大肠杆菌中和在活哺乳动物细胞中的优势,使用PylRS/tRNACUA29在线虫(C.elegans)中整合非天然氨基酸的能力表明,可能将如本文所述的标记方法拓展用于在动物中进行位点特异性蛋白标记。
遗传整合和多肽生产
在根据本发明的方法中,所述遗传整合优选使用正交的或延伸的遗传密码,其中一个或多个特异的正交密码子被分配以编码具有BCN基团的特异的氨基酸残基,使得其可以通过使用正交tRNA合成酶/tRNA对进行遗传整合。原则上,正交tRNA合成酶/tRNA 对可以是任何能够使tRNA携带包含BCN基团的氨基酸且能够将含有BCN基团的氨基酸整合到响应正交密码子的多肽链中的对。
正交密码子可能是正交密码子琥珀、赭石、蛋白石或四联体密码子。简单地,密码子必须对应于用于携带含有BCN基团的氨基酸的正交tRNA。优选正交密码子是琥珀密码子。
值得注意的是,本文所示的具体实施例使用了琥珀密码子和相应的tRNA/tRNA合成酶。如上所述,这些是可以变化的。或者,为了使用其它密码子而不引起使用或选择能够与含有BCN基团的氨基酸作用的可替代的tRNA/tRNA合成酶对的麻烦,tRNA的反密码子区域可以简单地与所需的所选密码子的反密码子区域交换。反密码子区域不涉及tRNA 的携带或整合功能,也不涉及tRNA合成酶的识别,因此这样的交换完全在熟练的操作者的范围内。
因此,如果需要,可以使用可替代的正交tRNA合成酶/tRNA对。
优选地,正交合成酶/tRNA对是巴氏甲烷八叠球菌(Methanosarcina barkeri)MS吡咯赖氨酸tRNA合成酶(MbPylRS)和其同源琥珀抑制子tRNA(MbtRNACUA)。
巴氏甲烷八叠球菌PylT基因编码MbtRNACUAtRNA。
巴氏甲烷八叠球菌PylS基因编码MbPylRS tRNA合成酶蛋白。当特定的氨基酸残基使用数字编号指代时,编号采用MbPylRS(巴氏甲烷八叠球菌吡咯赖氨酰-tRNA合成酶) 氨基酸序列作为参考序列(即由公开可获得的登录号为Q46E77的野生型巴氏甲烷八叠球菌PylS基因所编码):
此处标注的所述序列在下文称为SEQ ID NO.1。
如果需要,本领域技术人员可以通过突变以适应MbPylRS tRNA合成酶蛋白,以优化所使用的BCN氨基酸。突变的需要取决于所使用的BCN氨基酸。一个实例是,当BCN 氨基酸不被MbPylRS tRNA合成酶蛋白处理时,可能需要突变MbPylRS tRNA合成酶。
可以通过将突变引入到MbPylRS tRNA合成酶上来进行此类突变,例如在MbPylRStRNA合成酶的如下的一个或多个位置上:M241、A267、Y271、L274和C313。
一个实例是,当所述具有BCN基团的氨基酸包含双环[6.1.0]壬-4-炔-9-基甲醇(BCN) 赖氨酸。适当地,所述tRNA合成酶包含PylRS合成酶,如具有突变Y271M、L274G和C313A(BCNRS)的MbPylRS。
一个实例是,当所述具有亲二烯体基团的氨基酸包含含有反式-环辛烯-4-醇(TCO)的氨基酸。合适地,所述tRNA合成酶包含PylRS合成酶,如具有突变Y271A、L274M和C313A(TCORS)的MbPylRS。
tRNA合成酶
本发明的tRNA合成酶可以变化。虽然具体的tRNA合成酶的序列可能已经用于实施例中,本发明并不意图仅限于这些实施例。
原则上,可以在本发明中使用任何提供相同的tRNA携带(氨酰化)功能的tRNA合成酶。
例如,tRNA合成酶可以来自任何合适的物种,如来自阿克雅(archea),如来自巴氏甲烷八叠球菌MS(Methanosarcina barkeri MS);巴氏甲烷八叠球菌属Fusaro(Methanosarcina barkeri str.Fusaro);马氏甲烷八叠球菌Go1(Methanosarcina mazeiGo1);嗜乙酸甲烷八叠球菌C2A(Methanosarcina acetivorans C2A);嗜热甲烷八叠球菌(Methanosarcina thermophila)或布氏甲烷八叠球菌(Methanococcoides burtonii)。或者tRNA 合成酶可以来自细菌,如来自哥本哈根脱亚硫酸菌DCB-2(Desulfitobacteriumhafniense DCB-2);哥本哈根脱亚硫酸菌Y51(Desulfitobacterium hafniense Y51);哥本哈根脱亚硫酸菌PCP1(Desulfitobacterium hafniense PCP1);醋酸氧化脱硫肠状菌DSM771(Desulfotomaculum acetoxidans DSM 771)。
来自这些生物体的示例性序列是公开可获得的序列。提供如下实例作为吡咯赖氨酸 tRNA合成酶的示例性序列:
>巴氏甲烷八叠球菌MS/1-419/
巴氏甲烷八叠球菌MS
版本Q6WRH6.1GI:74501411
MDKKPLDVLISATGLWMSRTGTLHKIKHHEVSRSKIYIEMACGDHLVVNNSRSCRTARAFRHHKYRKTCKRCRVSDEDINNFLTRSTESKNSVKVRVVSAPKVKKAMPKSVSRAPKPLENSVSAKASTNTSRSVPSPAKSTPNSSVPASAPAPSLTRSQLDRVEALLSPEDKISLNMAKPFRELEPELVTRRKNDFQRLYTNDREDYLGKLERDITKFFVDRGFLEIKSPILIPAEYVERMGINNDTELSKQIFRVDKNLCLRPMLAPTLYNYLRKLDRILPGPIKIFEVGPCYRKESDGKEHLEEFTMVNFCQMGSGCTRENLEALIKEFLDYLEIDFEIVGDSCMVYGDTLDIMHGDLELSSAVVGPVSLDREWGIDKPWIGAGFGLERLLKVMHGFKNIKRASRSESY YNGISTNL
>巴氏甲烷八叠球菌F/1-419/
巴氏甲烷八叠球菌属Fusaro
版本YP_304395.1GI:73668380
MDKKPLDVLISATGLWMSRTGTLHKIKHYEVSRSKIYIEMACGDHLVVNNSRSCRTARAFRHHKYRKTCKRCRVSDEDINNFLTRSTEGKTSVKVKVVSAPKVKKAMPKSVSRAPKPLENPVSAKASTDTSRSVPSPAKSTPNSPVPTSAPAPSLTRSQLDRVEALLSPEDKISLNIAKPFRELESELVTRRKNDFQRLYTNDREDYLGKLERDITKFFVDRDFLEIKSPILIPAEYVERMGINNDTELSKQIFRVDKNLCLRPMLAPTLYNYLRKLDRILPDPIKIFEVGPCYRKESDGKEHLEEFTMVNFCQMGSGCTRENLESLIKEFLDYLEIDFEIVGDSCMVYGDTLDIMHGDLELSSAVVGPVPLDREWGIDKPWIGAGFGLERLLKVMHGFKNIKRASRSESYYN GISTNL
>马氏甲烷八叠球菌/1-454
马氏甲烷八叠球菌Go1
版本NP_633469.1GI:21227547
MDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL
>嗜乙酸甲烷八叠球菌/1-443
嗜乙酸甲烷八叠球菌C2A
版本NP_615128.2GI:161484944
MDKKPLDTLISATGLWMSRTGMIHKIKHHEVSRSKIYIEMACGERLVVNNSRSSRTARALRHHKYRKTCRHCRVSDEDINNFLTKTSEEKTTVKVKVVSAPRVRKAMPKSVARAPKPLEATAQVPLSGSKPAPATPVSAPAQAPAPSTGSASATSASAQRMANSAAAPAAPVPTSAPALTKGQLDRLEGLLSPKDEISLDSEKPFRELESELLSRRKKDLKRIYAEERENYLGKLEREITKFFVDRGFLEIKSPILIPAEYVERMGINSDTELSKQVFRIDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLEAIITEFLNHLGIDFEIIGDSCMVYGNTLDVMHDDLELSSAVVGPVPLDREWGIDKPWIGAGFGLERLLKVMHGFKNIKRAARSESYYNGISTNL
>嗜热甲烷八叠球菌/1-478
嗜热甲烷八叠球菌,版本DQ017250.1GI:67773308
MDKKPLNTLISATGLWMSRTGKLHKIRHHEVSKRKIYIEMECGERLVVNNSRSCRAARALRHHKYRKICKHCRVSDEDLNKFLTRTNEDKSNAKVTVVSAPKIRKVMPKSVARTPKPLENTAPVQTLPSESQPAPTTPISASTTAPASTSTTAPAPASTTAPAPASTTAPASASTTISTSAMPASTSAQGTTKFNYISGGFPRPIPVQASAPALTKSQIDRLQGLLSPKDEISLDSGTPFRKLESELLSRRRKDLKQIYAEEREHYLGKLEREITKFFVDRGFLEIKSPILIPMEYIERMGIDNDKELSKQIFRVDNNFCLRPMLAPNLYNYLRKLNRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLEAIIKDFLDYLGIDFEIVGDSCMVYGDTLDVMHGDLELSSAVVGPVPMDRDWGINKPWIGAGFGLERLLKVMHNFKNIKRASRSESYYNGIST NL
>布氏甲烷八叠球菌/1-416
布氏甲烷八叠球菌DSM 6242,版本YP_566710.1GI:91774018
MEKQLLDVLVELNGVWLSRSGLLHGIRNFEITTKHIHIETDCGARFTVRNSRSSRSARSLRHNKYRKPCKRCRPADEQIDRFVKKTFKEKRQTVSVFSSPKKHVPKKPKVAVIKSFSISTPSPKEASVSNSIPTPSISVVKDEVKVPEVKYTPSQIERLKTLMSPDDKIPIQDELPEFKVLEKELIQRRRDDLKKMYEEDREDRLGKLERDITEFFVDRGFLEIKSPIMIPFEYIERMGIDKDDHLNKQIFRVDESMCLRPMLAPCLYNYLRKLDKVLPDPIRIFEIGPCYRKESDGSSHLEEFTMVNFCQMGSGCTRENMEALIDEFLEHLGIEYEIEADNCMVYGDTIDIMHGDLELSSAVVGPIPLDREWGVNKPWMGAGFGLERLLKVRHNYTNIRRASRSELYYNGINT NL
>哥本哈根脱亚硫酸菌_DCB-2/1-279
哥本哈根脱亚硫酸菌DCB-2
版本YP_002461289.1GI:219670854
MSSFWTKVQYQRLKELNASGEQLEMGFSDALSRDRAFQGIEHQLMSQGKRHLEQLRTVKHRPALLELEEGLAKALHQQGFVQVVTPTIITKSALAKMTIGEDHPLFSQVFWLDGKKCLRPMLAPNLYTLWRELERLWDKPIRIFEIGTCYRKESQGAQHLNEFTMLNLTELGTPLEERHQRLEDMARWVLEAAGIREFELVTESSVVYGDTVDVMKGDLELASGAMGPHFLDEKWEIVDPWVGLGFGLERLLMIREGTQHVQSMARSLSYLDGVRLNIN
>哥本哈根脱亚硫酸菌_Y51/1-312
哥本哈根脱亚硫酸菌Y51
版本YP_521192.1GI:89897705
MDRIDHTDSKFVQAGETPVLPATFMFLTRRDPPLSSFWTKVQYQRLKELNASGEQLEMGFSDALSRDRAFQGIEHQLMSQGKRHLEQLRTVKHRPALLELEEGLAKALHQQGFVQVVTPTIITKSALAKMTIGEDHPLFSQVFWLDGKKCLRPMLAPNLYTLWRELERLWDKPIRIFEIGTCYRKESQGAQHLNEFTMLNLTELGTPLEERHQRLEDMARWVLEAAGIREFELVTESSVVYGDTVDVMKGDLELASGAMGPHFLDEKWEIVDPWVGLGFGLERLLMIREGTQHVQSMARSLSYLDGVRLNIN
>哥本哈根脱亚硫酸菌PCP1/1-288
哥本哈根脱亚硫酸菌
版本AY692340.1GI:53771772
MFLTRRDPPLSSFWTKVQYQRLKELNASGEQLEMGFSDALSRDRAFQGIEHQLMSQGKRHLEQLRTVKHRPALLELEEKLAKALHQQGFVQVVTPTIITKSALAKMTIGEDHPLFSQVFWLDGKKCLRPMLAPNLYTLWRELERLWDKPIRIFEIGTCYRKESQGAQHLNEFTMLNLTELGTPLEERHQRLEDMARWVLEAAGIREFELVTESSVVYGDTVDVMKGDLELASGAMGPHFLDEKWEIFDPWVGLGFGLERLLMIREGTQHVQSMARSLSYLDGVRLNI N
>醋酸氧化脱硫肠状菌/1-277
醋酸氧化脱硫肠状菌DSM 771
版本YP_003189614.1GI:258513392
MSFLWTVSQQKRLSELNASEEEKNMSFSSTSDREAAYKRVEMRLINESKQRLNKLRHETRPAICALENRLAAALRGAGFVQVATPVILSKKLLGKMTITDEHALFSQVFWIEENKCLRPMLAPNLYYILKDLLRLWEKPVRIFEIGSCFRKESQGSNHLNEFTMLNLVEWGLPEEQRQKRISELAKLVMDETGIDEYHLEHAESVVYGETVDVMHRDIELGSGALGPHFLDGRWGVVGPWVGIGFGLERLLMVEQGGQNVRSMGKSLTYLDGVRLNI
在通过突变tRNA合成酶已经提供了特定的tRNA携带(氨酰化)功能时,简单地使用另一种如选自上述中一种的野生型tRNA序列可能是不恰当的。这种情况下,重要的是保持同样的tRNA携带(氨酰化)功能。这可以通过把示范的tRNA合成酶中的突变转移到如选自上述中一种的备用的tRNA合成酶骨架上来实现。
通过这种方式,能将所选择的突变转移到相应的tRNA合成酶序列上,如来自示范的巴氏甲烷八叠球菌和/或马氏甲烷八叠球菌序列以外的其它生物体的相应的pylS序列。
通过与已知的tRNA合成酶如示范的巴氏甲烷八叠球菌和/或马氏甲烷八叠球菌的序列比对,可选择目标tRNA合成酶蛋白/骨架。
现通过参照pylS(吡咯赖氨酸tRNA合成酶)序列来阐述该问题,但所述原理同样适用于感兴趣的特定tRNA合成酶。
例如,图6提供了所有PylS序列的比对。这些序列可能出现低的整体百分比序列同一性。因此,重要的是例如通过将所述序列和已知tRNA合成酶进行序列比对(而不是简单地用低的序列同一性评分)对序列进行研究,以确保所用的序列的确是tRNA合成酶。
因此,适当地,当考虑序列同一性时,它被适当地认为是跨越如图6所示的tRNA 合成酶。适当地,百分比同一性可以如图6所定义。图7显示tRNA合成酶之间序列同一性的图。适当地,百分比同一性可以如图7所定义。
关注催化区域可能是有用的。图8比对的仅仅是催化区域。这样做的目的是提供由其可以定义高百分比同一性的tRNA催化区域,以捕获/鉴别适合接受所引入的突变的骨架,从而产生相同的tRNA携带(氨酰化)功能,例如新的或非天然的氨基酸识别。
因此,适当地,当考虑序列同一性时,适当地,它被认为是跨越如图8所示的催化区域。适当地,百分比同一性可以如图8所定义。图9显示了催化区域之间序列同一性的图。适当地,百分比同一性可以如图9所定义。
通过定点突变(mutagenesis)编码tRNA合成酶骨架的核苷酸序列,可以将突变“转移”或“植入”到可选的tRNA合成酶骨架上。该技术在本领域里是众所熟知的。实质上,选择骨架pylS序列(例如用上面所讨论的活性位点比对)且将所选择的突变转移到 (即安置在)相应的/同源位置。
当使用数字地址指代特定的氨基酸残基时,除非明显另外指明,否则编号使用MbPylRS(巴氏甲烷八叠球菌吡咯赖氨酸-tRNA合成酶)的氨基酸序列作为参考序列(即由公开可获得的登录号为Q46E77的野生型巴氏甲烷八叠球菌PylS基因所编码):
入本领域广泛理解地使用该序列来定位目标残基。这并不总是一个严格的计数练习——必须注意环境或对齐。例如,如果目标蛋白的长度稍有不同,该序列中对应于(例如)L266的正确残基的定位可能需要将序列对齐,并挑出相当或相应的残基,而不是简单地取用目标序列的第266位残基。这完全在本领域技术人员的能力范围内。
本文所用的突变表示法是本领域的标准表示法。例如,L266M是指与野生型序列的第266位的L对应的氨基酸被替换为M。
其它tRNA骨架之间突变的植入现可参照示范性的巴氏甲烷八叠球菌和马氏甲烷八叠球菌的序列进行描述,但相同的原则可平等地用于植入到其它骨架或从其它骨架植入。
例如,Mb AcKRS是用于AcK的整合的工程化的合成酶。
亲本蛋白/骨架:巴氏甲烷八叠球菌PylS
突变:L266V、L270I、Y271F、L274A、C317F
Mb PCKRS:用于PCK的整合的工程化的合成酶。
亲本蛋白/骨架:巴氏甲烷八叠球菌PylS
突变:M241F、A267S、Y271C、L274M
通过把这些突变植入至马氏甲烷八叠球菌PylS中能得到具有相同底物特异性的合成酶。在图10中可以看出两个合成酶的序列同源性。因此,可以通过将来自Mb骨架的突变植入至Mm tRNA骨架上而产生下列合成酶:
Mm AcKRS:引入突变L301V、L305I、Y306F、L309A、C348F至马氏甲烷八叠球菌PylS;
Mm PCKRS:引入突变M276F、A302S、Y306C、L309M至马氏甲烷八叠球菌PylS。
下面给出这些植入突变的示范性合成酶的全长序列。
>Mb_PylS/1-419
MDKKPLDVLISATGLWMSRTGTLHKIKHHEVSRSKIYIEMACGDHLVVNNSRSCRTARAFRHHKYRKTCKRCRVSDEDINNFLTRSTESKNSVKVRVVSAPKVKKAMPKSVSRAPKPLENSVSAKASTNTSRSVPSPAKSTPNSSVPASAPAPSLTRSQLDRVEALLSPEDKISLNMAKPFRELEPELVTRRKNDFQRLYTNDREDYLGKLERDITKFFVDRGFLEIKSPILIPAEYVERMGINNDTELSKQIFRVDKNLCLRPMLAPTLYNYLRKLDRILPGPIKIFEVGPCYRKESDGKEHLEEFTMVNFCQMGSGCTRENLEALIKEFLDYLEIDFEIVGDSCMVYGDTLDIMHGDLELSSAVVGPVSLDREWGIDKPWIGAGFGLERLLKVMHGFKNIKRASRSESY YNGISTNL
>Mb_AcKRS/1-419
MDKKPLDVLISATGLWMSRTGTLHKIKHHEVSRSKIYIEMACGDHLVVNNSRSCRTARAFRHHKYRKTCKRCRVSGEDINNFLTRSTESKNSVKVRVVSAPKVKKAMPKSVSRAPKPLENSVSAKASTNTSRSVPSPAKSTPNSSVPASAPAPSLTRSQLDRVEALLSPEDKISLNMAKPFRELEPELVTRRKNDFQRLYTNDREDYLGKLERDITKFFVDRGFLEIKSPILIPAEYVERMGINNDTELSKQIFRVDKNLCLRPMVAPTIFNYARKLDRILPGPIKIFEVGPCYRKESDGKEHLEEFTMVNFFQMGSGCTRENLEALIKEFLDYLEIDFEIVGDSCMVYGDTLDIMHGDLELSSAVVGPVSLDREWGIDKPWIGAGFGLERLLKVMHGFKNIKRASRSESYY NGISTNL
>Mb_PCKRS/1-419
MDKKPLDVLISATGLWMSRTGTLHKIKHHEVSRSKIYIEMACGDHLVVNNSRSCRTARAFRHHKYRKTCKRCRVSDEDINNFLTRSTESKNSVKVRVVSAPKVKKAMPKSVSRAPKPLENSVSAKASTNTSRSVPSPAKSTPNSSVPASAPAPSLTRSQLDRVEALLSPEDKISLNMAKPFRELEPELVTRRKNDFQRLYTNDREDYLGKLERDITKFFVDRGFLEIKSPILIPAEYVERFGINNDTELSKQIFRVDKNLCLRPMLSPTLCNYMRKLDRILPGPIKIFEVGPCYRKESDGKEHLEEFTMVNFCQMGSGCTRENLEALIKEFLDYLEIDFEIVGDSCMVYGDTLDIMHGDLELSSAVVGPVSLDREWGIDKPWIGAGFGLERLLKVMHGFKNIKRASRSESY YNGISTNL
>Mm_PylS/1-454
MDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL
>Mm_AcKRS/1-454
MDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMVAPNIFNYARKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFFQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL
>Mm_PCKRS/1-454
MDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERFGIDNDTELSKQIFRVDKNFCLRPMLSPNLCNYMRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL
同样的原则同样适用于其它突变和/或其它骨架。
可有利地对用这种方式产生的具有植入的多肽进行测试,以确保保留了期望的功能/ 底物特异性。
可以将编码用于上述方法的目标多肽的多核苷酸整合到重组的可复制载体中。该载体可用于在可相容的宿主细胞中复制该核酸。因此,在进一步的实施方式中,本发明提供了通过将本发明的多核苷酸引入到可复制载体、将该载体引入到可相容的宿主细胞并在使载体复制的条件下培养上述宿主细胞来生产本发明的多核苷酸的方法。所述载体可从宿主细胞中回收。适当地,宿主细胞包括如大肠杆菌的细菌。
优选地,本发明的多核苷酸在载体中与控制序列有效地连接,所述控制序列能够使宿主细胞表达编码序列,即所述载体为表达载体。术语“有效地连接”指的是所描述的组分处于允许其以预期的方式发挥作用的关系中。“有效地连接”到编码序列的调节序列以在与控制序列相容的条件下实现编码序列的表达的方式连接。
本发明的载体可被转化或转染到所描述的合适的宿主细胞中,以表达本发明的蛋白。该方法包括在使载体表达编码所述蛋白的编码序列的条件下培养转化有上述表达载体的宿主细胞,和任选地回收所表达的蛋白质。
载体可以是,例如提供有复制起点、任选的用于表达所述多核苷酸的启动子和任选的所述启动子的调节子的质粒或病毒载体。载体可包含一个或多个选择性标记基因,例如细菌质粒情况下的氨苄青霉素抗性基因。可以使用载体以例如转染或转化宿主细胞。
有效地连接到编码本发明的蛋白的序列上的控制序列包括启动子/增强子和其它表达调控信号。可选择这些控制序列以使其与经设计使表达载体用于其中的宿主细胞相容。术语启动子在本领域中是熟知的,包括在大小和复杂度上从最小启动子到包括上游元件和增强子的启动子的范围内的核酸区域。
本发明的另一个方面是一种方法,如一种体外方法,其将含有BCN的氨基酸遗传地且位点特异性地整合至所选择的蛋白质中,适当地,在真核细胞中。所述方法中的遗传整合的一个优势是其避免了一旦形成就要将含有BCN氨基酸的蛋白递送到细胞中的需要,这是因为在本实施方式中,所述蛋白可以直接在靶细胞中合成。方法包括如下步骤:
i)在编码蛋白的核苷酸序列的所期望的位点用正交密码子如琥珀密码子引入或替代一个特定的密码子
ⅱ)在细胞中引入正交tRNA合成酶/tRNA对的表达系统,如吡咯赖氨酰(pyrollysyl)-tRNA合成酶/tRNA对
ⅲ)使具有根据本发明的含有BCN的氨基酸的细胞在培养基中生长。
步骤(i)在蛋白的遗传序列的所期望的位点上用正交密码子如琥珀密码子承担或替代特定的密码子。这可以简单地通过引入具有编码蛋白的核苷酸序列的构建体(如质粒)来完成,其中将期望将含有BCN的氨基酸引入/替换的位点进行变化以包含正交密码子如琥珀密码子。这完全在本领域技术人员的能力之内且下述给出了此类的实施例。
步骤(ii)需要一个正交表达系统以在所期望的位置(如琥珀密码子)特异性整合含有 BCN的氨基酸。因此,需要特异的正交tRNA合成酶如正交吡咯赖氨酰-tRNA合成酶和特异的相应的正交tRNA对,其一起能够使所述tRNA携带含有BCN的氨基酸。本文提供了此类的实施例。
蛋白表达与纯化
包含本发明的多核苷酸的宿主细胞可以用于表达本发明的蛋白质。可以在合适的允许表达本发明的蛋白的条件下培养宿主细胞。本发明的蛋白表达可以是组成型的,这使得其不断地产生,或者是可诱导的,这需要刺激以启动表达。在诱导表达的情况下,可以在需要时启动蛋白的生产,例如向培养基添加诱导物质如地塞米松或IPTG。
可以通过各种本领域已知的技术从宿主细胞中提取本发明的蛋白质,包括酶、化学和/或渗透裂解和物理破坏。
可以通过本领域已知的标准技术如制备性色谱、亲和纯化或任何其它合适的技术来纯化本发明的蛋白质。
定义
术语“包括”(包含、含有)应被理解为具有本领域常规的含义,即包括规定的特征或一组特征,但该术语不排除还存在任何其它的规定的特征或一组特征。
附图说明
图1示出了本研究所使用的非天然氨基酸1至5和四嗪衍生物(6-17)的结构式。TAMRA-X、硼荧TMR-X、硼荧-FL和CFDA是荧光团的通用名称;它们的结构式示于补充附图S4)。
图2示出了BCN-四嗪反应的动力学和光谱特征。a)反应的停流动力学;插图示出了四嗪7与5-降冰片烯-2-醇(Nor)的缀合物,标注了不同的时间尺度;条件:C7=0.05mM、 CBCN=CNor=5mM于MeOH/H2O(55/45)中,25℃。b)7和BCN的反应的二级速率常数k。 c)11与BCN的荧光反应。
图3示出了在大肠杆菌中使用BCNRS/tRNACUA或TCORS/tRNACUA对的非天然氨基酸的高效、遗传编码的整合。a)sfGFP-His6的氨基酸依赖的过表达在150位上具有琥珀密码子。用抗His6抗体检测裂解物中的所表达的蛋白。b)用考马斯亮蓝染色的凝胶显示了纯化的蛋白。c-e)氨基酸整合的质谱:sfGFP-1-His6,实际:28017.54Da,计算:28017.62 Da;sfGFP-2-His6,实际:27993.36Da,计算:27992.82Da;如本文所述,在3存在下所产生的sfGFP-His6,实际:28019.34Da,计算:28019.63Da。所有质谱中较小的灰色峰表示131Da的损失,其对应于N-末端甲硫氨酸的蛋白水解裂解。
图4示出了重组蛋白与四嗪-荧光团的快速且特异的标记。a)具有1、2和4的sfGFP与四嗪-染料缀合物11(10eq)的特异性标记,如由SDS-PAGE和凝胶内荧光所表示的。对于在仅3存在的情况下所产生的sfGFP-His6,可以见到非常弱的亚化学计量标记。b)通过 ESI-MS证明了sfGFP-1与11的定量标记(生物缀合之前(蓝色谱,实际:28018.1±2Da,计算:28017.6Da)和生物缀合之后(红色谱,实际28824.2±2Da,计算:28823.2Da))。 c)通过ESI-MS证明了sfGFP-2与11的定量标记(生物缀合之前(蓝色谱,实际:27993.2 ±2Da,计算:27992.8Da)和生物缀合之后(红色谱,实际28799.4±2Da,计算:28799.1 Da))。d)通过MS可以检测sfGFP-His6(在3存在的情况下表达的)与11未标记。e)含有位点特异性整合的氨基酸1和2的蛋白质的非常快速标记。sfGFP-1(左)和sfGFP-2(中)在其用于装载凝胶的数秒钟内与11定量标记,而在相同条件下,完全标记sfGFP-4需要1h(右)。
图5示出了在哺乳动物细胞中将1和2位点特异性整合到蛋白质中,以及11的细胞表面和细胞内哺乳动物蛋白质的快速且特异性的标记。a)Western印迹证实了全长mCherry(TAG)eGFP-HA的表达依赖于1或2的存在,并且tRNACUA、BCNRS、TCORS 是FLAG标记的。b)活哺乳动物细胞中的细胞表面蛋白的特异和超快速标记。在128位具有1、2或5的EGFR-GFP显示为转染细胞的膜上的绿色荧光(左组)。用11(400nM)处理细胞导致包含1或2的EGFR的选择性标记(中组)。右组示出了合并的绿色和红色荧光图像,DIC=微分干涉对比。加入11后2分钟对细胞进行成像。c)活哺乳动物细胞中核蛋白的特异且快速标记。Jun-1-mCherry显示为转染细胞的细胞核中的红色荧光(左组)。用可渗透细胞的四嗪染料17(200nM)处理细胞导致jun-1-mCherry的选择性标记(中组)。右组示出了合并的红色和绿色荧光。未观察到具有jun-5-mCherry的细胞的标记。
图6示出了PylS序列的比对。
图7示出了PylS序列的序列同一性。
图8示出了PylS序列的催化结构域的比对(从350至480;从图6的比对编号)。
图9示出了PylS序列的催化结构域的序列同一性。
图10示出了基于巴氏甲烷八叠球菌PylS或马氏甲烷八叠球菌PylS的具有植入的突变的合成酶的比对。红色星号表示突变位置。
图11示出了方案1。我们在体外、在大肠杆菌中和在哺乳动物细胞中证明了非天然氨基酸1和2的合成、遗传编码和荧光标记。
图12(补充附图S1)示出了LC/MS迹线(254nm),其显示了在MeOH中,相应的四嗪(6、7、9和8)与2当量的BCN(外/内混合物~4/1)的反应中,哒嗪产物(6-BCN、7-BCN、 9-BCN、8-BCN)的形成。所有质量以道尔顿形式给出。在室温下孵育反应10至30分钟后获得HPLC迹线。转换成哒嗪产物的总体产率为>98%。
图13(补充附图S2)示出了使用停流装置通过UV-光谱测定各个四嗪与BCN的反应的速率常数k。(a)BCN加成(100eq=5mM)产生的化合物6在320nm处的UV吸光度的响应;将数据拟合至单指数方程,测量K'值(左组);每个测量进行三至五次,并将所观察到的速率K'的平均值对BCN的浓度作图,以从曲线的斜率中获得速率常数k。对所有四个四嗪,进行完整测量组,一式两份(中组和右组),值的平均值报告于补充表1中。,四嗪7、 9和8的(b-d)如(a)一样。条件:C四嗪=0.05mM于9/1的H2O/MeOH中,CBCN=0.5至5mM 于MeOH中,导致最终在55/45的MeOH/H2O混合物中。所有实验于25℃记录。
图14(补充附图S3)示出了使用停流设备通过UV-光谱测定四嗪6和7与TCO的反应中的速率常数K。(a)TCO加成(100eq=5mM)产生的化合物6在320nm处的UV吸光度的响应;通过将数据拟合到两个单指数方程之和中,测定快速单指数方程的k'值(左组);每个测量进行三至五次,并将所观察到的速率K'对TCO的浓度作图,以从曲线的斜率获得速率常数k。对两个四嗪,进行完整测量组,至少一式两份(中组和右组),值的平均值报告于补充表1中。四嗪7(b)如(a)一样。条件:C四嗪=0.05mM于9/1的H2O/MeOH中, CTCO=0.5至5mM于MeOH中,导致最终在55/45的MeOH/H2O混合物中。所有实验于 25℃记录。
图15(补充附图S4)示出了在本研究中所使用的各种四嗪荧光团的结构式。可以在参考文献2中找到这些四嗪-荧光团的合成和特征化的细节。
图16(补充附图S5)示出了在与9-羟甲基双环[6.1.0]壬炔(BCN)的反应中“开启”的四嗪-荧光团的荧光。将水中的2mM相应的四嗪-荧光团溶液(2mM于DMSO中)与300当量的BCN反应。在添加BCN之前和之后30min记录发射光谱。激发波长:TAMRA-染料和硼荧-TMR-X:550nm;硼荧-FL:490nm。
图17(补充附图S6)示出了在150位具有琥珀密码子的sfGFP-His6的氨基酸依赖性表达。使用抗-His6抗体检测裂解物中表达的蛋白。使用氨基酸1的纯化的外型或内型非对映体表明外型形式优选通过BCNRS/tRNACUA整合至sfGFP中。
图18(补充附图S7)示出了sfGFP-1与各种四嗪的标记反应的LC-MS特征。黑色峰表示在标记前sfGFP-1的实际质量,彩色峰是sfGFP-1与6、7、9和8反应后的实际质量。所有的质量以道尔顿形式给出。与所有四嗪的标记是特异性的且定量的。反应条件:向~ 10μM的sfGFP-1溶液(于20mM Tris-HCl、100mM NaCl、2mM EDTA中,pH7.4)添加 10当量的相应的四嗪(于甲醇中的1mM储备液),并将反应混合物在室温下孵育10至30 分钟。
图19(补充附图S8)示出了LC-MS显示了sfGFP-1与四嗪荧光团缀合物12、16、13 和14的特异性和定量标记。红峰表示在标记前sfGFP-1的实际质量,彩色峰是sfGFP-1 与12(a)、16(b)、13(c)和14(d)反应之后的实际质量。以道尔顿形式给出预期和实际的质量值。与所有的四嗪-荧光团的标记是特异性且定量的。反应条件:向~10μM的sfGFP-1 溶液(于20mM Tris-HCl、100mM NaCl、2mM EDTA中,pH7.4)添加10当量的相应的四嗪染料(于DMSO中的2mM储备液),并将反应混合物在室温下孵育10至30分钟。
图20(补充附图S9)示出了在sfGFP对大肠杆菌蛋白质组中的标记1和2的特异性。考马斯亮蓝染色的凝胶示出了在指定浓度的非天然氨基酸1、2、3(外型和内型非对映体)和5存在的情况下产生sfGFP的大肠杆菌中的蛋白质。在凝胶中,荧光凝胶示出了与四嗪-染料缀合物11的特异性标记。虽然氨基酸1、2和3-外型以相似水平进行整合(从考马斯染色凝胶和Western印迹来判断),我们观察到在3-外型和3-内型存在的情况下仅产生非常弱的亚化学计量的sfGFP的标记。这些观察与在3的反式烯烃至其顺式异构体的片段的体内转化相一致。
图21(补充附图S10)示出了在sfGFP对大肠杆菌蛋白质组中的标记1的特异性。泳道1-5:考马斯亮蓝染色凝胶示出了在指定浓度的非天然氨基酸1和5存在的情况下产生sfGFP的大肠杆菌中的蛋白质。泳道6-10:使用抗-His6抗体检测裂解物中的表达的蛋白。泳道11-15:指定荧光团11标记的蛋白的荧光图像。
图22(补充附图S11)示出了2分钟的EGFR-GFP与四嗪-荧光团缀合物11的特异性且超快速的标记。在128位具有1的EGFR-GFP在转染细胞的膜上显示为绿色荧光(左组)。用11(400nM)处理细胞导致含有1的EGFR-GFP的选择性标记(中组)。右组示出了合并的绿色和红色荧光图像,DIC=微分干涉对比。在添加11之后2分钟对细胞进行成像。在相同的未表达EGFR-GFP的样品中未观察到细胞标记,且具有EGFR-5-GFP的细胞未被11 标记。
图23(补充附图S12)示出了5分钟的EGFR-GFP与四嗪-荧光团缀合物11的特异性且超快速的标记。在128位具有1的EGFR-GFP在转染细胞的膜上显示为绿色荧光(左组)。用11(400nM)处理细胞导致含有1的EGFR-GFP的选择性标记(中组)。右组示出了合并的绿色和红色荧光图像,DIC=微分干涉对比。在添加11之后5分钟对细胞进行成像。在相同的未表达EGFR-GFP的样品中未观察到细胞标记,且具有EGFR-5-GFP的细胞未被11 标记。
图24(补充附图S13)示出了10分钟的EGFR-GFP与四嗪-荧光团缀合物11的特异性且超快速的标记。在128位具有1的EGFR-GFP在转染细胞的膜上显示为绿色荧光(左组)。用11(400nM)处理细胞导致含有1的EGFR-GFP的选择性标记(中组)。右组示出了合并的绿色和红色荧光图像,DIC=微分干涉对比。在添加11之后10分钟对细胞进行成像。在相同的未表达EGFR-GFP的样品中未观察到细胞标记,且具有EGFR-5-GFP的细胞未被11标记。
图25(补充附图S14)示出了与包含氨基酸1的EGFR-GFP的超快速的标记相比,使具有EGFR-4-GFP的细胞特异性标记上四嗪-荧光团缀合物112花费了2小时。
在128位具有4的EGFR-GFP在转染细胞的膜上显示为绿色荧光(左组)。用11(200nM) 处理细胞导致含有4的EGFR-GFP的标记(中组)。右组示出了合并的绿色和红色荧光图像, DIC=微分干涉对比。在添加11之后2小时对细胞进行成像。
图26(补充附图S15)示出了2分钟的EGFR-GFP与四嗪-荧光团缀合物11的特异性且超快速的标记。在128位具有2的EGFR-GFP在转染细胞的膜上显示为绿色荧光(左组)。用11(400nM)处理细胞导致含有2的EGFR-GFP的选择性标记(中组)。右组示出了合并的绿色和红色荧光图像,DIC=微分干涉对比。在添加11之后2分钟对细胞进行成像。在相同的未表达EGFR-GFP的样品中未观察到细胞标记,且具有EGFR-5-GFP的细胞未被11 标记。
图27(补充附图S16)示出了5分钟的EGFR-GFP与四嗪-荧光团缀合物11的特异性且超快速的标记。在128位具有2的EGFR-GFP在转染细胞的膜上显示为绿色荧光(左组)。用11(400nM)处理细胞导致含有2的EGFR-GFP的选择性标记(中组)。右组示出了合并的绿色和红色荧光图像,DIC=微分干涉对比。在添加11之后5分钟对细胞进行成像。在相同的未表达EGFR-GFP的样品中未观察到细胞标记,且具有EGFR-5-GFP的细胞未被11 标记。
图28(补充附图S17)示出了30和60分钟的在哺乳动物细胞中3的位点特异性整合和EGFR-GFP与四嗪-荧光团缀合物11的标记。a)Western印迹表明,全长mCherry(TAG)eGFP-HA的表达依赖于3或5和tRNACUA的存在。BCNRS和PylRS被FLAG标记。B 和C)在128位存在3的EGFR-GFP在转染细胞的膜上显示为绿色荧光(左组)。用11(400nM) 处理细胞导致微弱但可测量到的含有3的EGFR-GFP的标记(中组)。这一观察与在哺乳动物细胞中的3的片段的反式烯键到其顺式的异构化相一致。右组示出了合并的绿色和红色荧光图像,DIC=微分干涉对比。在添加11之后30或60分钟对细胞进行成像。在相同的未表达EGFR-GFP的样品中未观察到细胞标记。
图29(补充附图S18)示出了在活哺乳动物细胞中核蛋白的特异性且超快速的标记。 Jun-1-mCherry在转染细胞的核内显示为红色荧光(左组)。用可渗透细胞的四嗪染料17(200 nM)处理细胞导致jun-1-mCherry的选择性标记(中组)。右组示出了合并的绿色和红色荧光图像。DIC=微分干涉对比。在添加11之后15分钟对细胞进行成像。在相同的未表达jun-mCherry的样品中未观察到细胞标记,且具有jun-5-mCherry的细胞未被11标记。
具体实施方式
本发明现通过实施例的方式进行描述。这些实施例旨在是说明性的,并不旨在限制所附的权利要求。
实施例
我们开发了四嗪和BCN之间的快速的且荧光的反应,并在大肠杆菌和哺乳动物细胞中证明了含有氨基酸1和2的BCN和反式环辛烯的遗传编码。我们示出了蛋白的在大肠杆菌和在活哺乳动物细胞中与四嗪探针的特异性和快速标记,并明确地证明了相对于以前报道的生物正交标记策略,此方法的优势(图11-方案1)。
实施例1:化学与加成反应
测量了各种亲二烯体(BCN、TCO(反式-环辛烯-4-醇)和sTCO(双环[6.1.0]壬-4-烯-9- 基甲醇))与四嗪的反应的速率常数3-5、9、11。然而,在许多情况下,研究人员已经使用了不同的四嗪、溶剂系统或测量方法,这使定量比较各种亲二烯体与目标四嗪的反应性变得具有挑战。我们最初的实验确认了,各种亲二烯体与四嗪6(图1)的反应的速率太快以至于不能在准一级条件下通过手工混合研究。因此,我们转向停流技术以直接确定这些反应的准一级速率常数。通过归结在甲醇/水(55/45)混合物中与10至100倍过量的BCN反应时在320nm的吸光度的指数衰减,我们确定了BCN与6和7的反应的速率常数分别是437 M-1s-1(+/-13)和1245M-1s-1(+/-45)。LC-MS和NMR证实了预期产物的形成(补充信息和补充附图1)。在相同条件下,我们确定了TCO与6和7的速率常数分别是5235M-1s-1(+/-258) 和17248M-1s-1(+/-3132)。这些数据证明了BCN和6之间的反应比5-降冰片烯-2-醇和6 之间的反应快约1000倍7,而TCO速率比BCN速率快约10-15倍。sTCO速率太快而难以由停流技术进行精确地测量,并且我们估计其比TCO速率快至少50倍。在BCN与四嗪8和9的反应中观察到了相似的速率加速(图1、图2a和2b、补充表1和补充附图S2 和S3)。
补充表1:使用停流装置在25℃于准一级条件下所测量的各种四嗪(6、7、9和8)与BCN和TCO的反应的速率常数k,与在21℃相同的四嗪与5-降冰片烯-2-醇的反应的速率常数相比较2。数值通过至少两个独立的测量来确定。溶剂体系:55/45甲醇/水。BCN 与四嗪的环加成反应比5-降冰片烯-2-醇的反应快500至1000倍,TCO和四嗪之间的反应比BCN和四嗪之间的反应快10至15倍。
数个四嗪荧光团缀合物,包括11、13、14和16(附图1,补充附图S4)相对于游离荧光团而言是基本上猝灭的,观察到荧光团的发射能量转移到邻近的四嗪发色团具有510 和530nm之间的最大吸光度7、18。我们发现,BCN与四嗪荧光团缀合物11、13、14和 16的反应导致荧光的5-10倍的增加,这表明哒嗪产物的形成有效地减轻了荧光猝灭(图 2c和补充附图S5)。BCN和这些四嗪之间的荧光反应,像有张力的烯烃和这些四嗪之间的反应一样7、18,利于成像实验,这是因为其最大化了标记信号,而最小化了游离四嗪荧光团所产生的荧光。
实施例2:氨基酸设计
接着,我们的目的是设计、合成和遗传编码具有BCN、TCO和sTCO的氨基酸以用于在体外和在细胞中将位点特异性蛋白标记不同的探针。来自包括巴氏甲烷八叠球菌(Mb) 和马氏甲烷八叠球菌(Mm)的甲烷八叠球菌属的吡咯赖氨酰-tRNA合成酶(PylRS)/ tRNACUA对和其演化衍生物用于指导越来越多的响应琥珀密码子的结构多样的非天然氨基酸的位点特异性整合19-26。PylRS/tRNACUA对正在成为可能的最通用的系统,以用于将非天然氨基酸整合到蛋白质中,由于其在一系列宿主中是正交的,允许演化自大肠杆菌的合成酶在越来越多的细胞和组织中用于遗传密码延伸,这包括:大肠杆菌、鼠伤寒沙门氏菌、酵母、人类细胞和线虫7、27-31。我们设计了非天然氨基酸1、2和3(附图1),目的是用PylRS/tRNACUA对或演化衍生物将它们整合到蛋白中。氨基酸的合成如补充信息中所述。
实施例3:遗传整合到多肽和tRNA合成酶
我们筛选了MbPylRS/tRNACUA对以及一组MbPylRS的突变体,其是先前在我们实验室中生产的并用于将不同的非天然氨基酸位点特异性地整合到蛋白质中,其能指导1、 2和3通过响应在150位引入的琥珀密码子整合入C末端六聚组氨酸-(His6)标签的超折叠绿色荧光蛋白(sfGFP)。MbPylRS/tRNACUA对没有指导任何所测试的非天然氨基酸的整合,如通过抗C末端His6标签的Western印迹来判断。然而,包含MbPylRS突变体、在酶活性位点包含三个氨基酸取代Y271M、L274G、C313A32(我们命名为BCN-tRNA合成酶, BCNRS)的细胞,编码MbtRNACUA和在150位具有琥珀密码子的 sfGFP-His6(psfGFP150TAGPylT-His6)的质粒引起全长sfGFP-His6的氨基酸依赖性合成,如通过抗-His6的Western印迹和考马斯染色所判断的(图3a)。使用1及其内型异构体的额外的蛋白表达实验证明了通过BCNRS/tRNACUA优选外型整合到蛋白中(补充附图S6)。我们发现了另外的合成酶突变体,其具有突变Y271A、L274M和C313A32,我们将其命名为TCO-tRNA合成酶,TCORS。TCORS/tRNACUA对在2存在的情况下引起来自 psfGFP150TAGPylT-His6的sfGFP的氨基酸依赖性合成。最后,我们发现BCNRS/tRNACUA对和TCORS/tRNACUA对在3存在的情况下都引起来自psfGFP150TAGPylT-His6的sfGFP 的氨基酸依赖性合成。对于每个氨基酸,在His-标签和凝胶过滤纯化后以良好收率分离了sfGFP(每L培养基6-12mg,图3b)。这相当于其它良好整合的非天然氨基酸(包括5)所得到的产率。在各个非天然氨基酸存在的情况下psfGFP150TAGPylT-His6所产生的sfGFP 的电喷雾电离质谱(ESI-MS)与它们的位点特异性整合相一致(图3c-3e)。
实施例4:位点特异性整合
为了证明四嗪-染料-探针与具有位点特异性整合的1的重组蛋白有效地且特异性地反应,我们在室温下用10当量的四嗪荧光团缀合物11标记纯化的sfGFP-1-His6 1小时。SDS-PAGE和ESI-MS分析证实了含有1的sfGFP的定量标记(图4a和4b)。对照实验表明,在与用于标记sfGFP-1的相同条件下sfGFP-4被标记,且没有检测到与sfGFP-5的非特异性标记。ESI-MS证明sfGFP-1可有效地和特异性地与一系列四嗪6、7、8和9衍生化(补充附图S7),与四嗪荧光团缀合物12、13、14和16衍生化(补充附图S8)。我们还证明了纯化的sfGFP-2-His6可以与四嗪荧光团11进行定量标记(图4a和4c)。有趣的是,我们观察到仅有非常微弱的sfGFP-His6的标记,其纯化自表达TCORS/tRNACUA和psfGFP150TAGPylT-His6的细胞,并在3存在的情况下生长(图4a和4d)且在纯化前存在此蛋白的亚化学计量的标记(补充附图S9)。由于在3存在的情况下所表达的sfGFP具有与3 的整合相对应的质量,这些观察与3中的反式烯烃部分体内转化与其无反应性的顺式异构体相一致。已知此异构化发生于硫醇存在的情况下4
实施例5:反应的特异性和选择性
为了进一步证明,BCN和各种四嗪基染料之间的反应不仅高效和特异性而且在细胞环境中具有高度选择性,我们在表达sfGFP-1-His6的大肠杆菌中进行反应(补充附图S10)。在诱导蛋白表达后4小时收集表达不同水平的sfGFP-1的细胞(通过调整添加至细胞的1 的浓度来控制),用PBS洗涤并在室温下与四嗪染料11孵育30分钟。加入过量的BCN 以猝灭未反应的四嗪染料之后,将细胞裂解并分析反应混合物。凝胶内荧光证明了具有1 的重组sfGFP与四嗪缀合的TAMRA染料11的特异性标记。虽然裂解物中的许多蛋白质的丰度与sfGFP-1相当,我们仅观察到极少的背景标记,这表明此反应对于大肠杆菌蛋白质组是特异性的。
实施例6:标记的速度
为了研究在小分子中观察到的BCN-四嗪环和TCO-四嗪环加成反应的速度是否转化为异常快速的蛋白标记,我们比较了具有1、2或4的纯化的sfGFP与10当量的四嗪-荧光团缀合物11的标记。作为时间函数的标记反应的凝胶内荧光成像(图4e)表明了在约1 小时内sfGFP-4的反应得以完成。相比之下,sfGFP-1和sfGFP-2的标记在用于测量第一时间点的几秒钟内完成,这表明BCN-四嗪和TCO-四嗪反应的速率加素转换成了快速得多蛋白标记。
实施例7:应用于哺乳动物细胞
为了证明哺乳动物细胞中的氨基酸1和2的整合,我们通过植入突变创建了BCNRS和TCORS的哺乳动物优化版本,以允许1或2整合进哺乳动物优化的MbPylRS中。通过Western印迹,我们证明了通过使用BCNRS/tRNACUA对或TCORS/tRNACUA,1和2 均可以在哺乳动物细胞中高效地遗传编码进蛋白(图5a)。
为了研究快速BCN-四嗪连接是否提供了在哺乳动物细胞中的位点特异性标记蛋白的优势,我们在含有BCNRS/tRNACUA对的HEK-293细胞中、在1存在(0.5mM)的情况下表达了在128位具有琥珀密码子的表皮生长因子受体(EGFR)-绿色荧光蛋白(GFP)融合体 (EGFR(128TAG)GFP)。在1存在的情况下产生了全长的EGFR-1-GFP,这导致在细胞膜上产生了明亮的绿色荧光。为了将EGFR的128位上的1(其在受体的胞外结构域中)与四嗪荧光团缀合物相标记,我们将细胞与11(400nM)孵育,改变培养基并将TAMRA标记所产生的红色荧光和全长EGFR-GFP表达所产生的绿色荧光进行成像。TAMRA荧光与细胞表面的EGFR-GFP荧光很好地共定位。在我们可测量的第一时间点,2分钟内观察到具有EGFR-1-GFP的细胞的清晰的标记;其它时间点证明,标记在2分钟内达到饱和(图 5b和补充附图S11-S14);用四嗪荧光团12得到了类似的结果。将2整合进EGFR-GFP 融合体产生与四嗪荧光团11的相似地快速且有效的标记(图5b和补充附图S15-S16)。相比之下,在相同条件下,经过2小时,我们才观察到具有EGFR-4-GFP的细胞的特异性标记(补充附图S14)7。在对照实验中,我们观察到具有EGFR-5-GFP的细胞无标记且未表达EGFR-GFP的细胞未检测到非特异性标记。我们观察到,在BCNRS/tRNACUA对和3 存在的情况下HEK293细胞中所表达的EGFR-GFP(来自EGFR(128TAG)GFP)的微弱但可测量的标记(补充附图S17)。这些观察与哺乳动物细胞中的3的片段的异构化相一致,并与我们在大肠杆菌中的观察相一致。
为了证明在哺乳动物细胞中胞内蛋白的快速标记,我们从在JunB(jun)和mCherry之间的接头上具有琥珀密码子的基因中表达了具有C-末端mCherry融合的转录因子,jun。在氨基酸1和BCNKRS/tRNACUA对存在的情况下,在HEK细胞中产生了jun-1-mCherry 蛋白,与所预期的一样,其定位于细胞的细胞核(图5c和补充附图S18)。与可渗透细胞的二乙酰荧光素四嗪缀合物(200nM)的标记产生了绿色荧光,其与在第一时间点所分析的 mCherry信号很好地共定位(15min标记,随后洗涤90min)。在相同样品中的未转染细胞中或表达jun-5-mCherry的对照细胞中没有观察到特异性标记,这进一步证实了胞内标记的特异性。
补充实施例
蛋白质的表达和纯化
为了表达整合有非天然氨基酸1的sfGFP,我们用pBKBCNRS(其编码MbBCNRS) 和psfGFP150TAGPylT-His6(其编码MbtRNACUA和在150位具有琥珀密码子的C-末端六聚组氨酸标记的sfGFP基因)转化大肠杆菌DH10B细胞。在37℃于1ml的S.O.B培养基(补充有0.2%的葡萄糖)恢复细胞1小时,之后在100ml含有氨苄青霉素(100μg/mL)和四环素(25μg/mL)的LB中孵育(16h、37℃、230r.p.m)。使用20mL这种过夜培养物接种1L 补充有氨苄青霉素(50μg/mL)和四环素(12μg/mL)的LB,并在37℃孵育。在OD600=0.4 至0.5时,添加在H2O中的1的溶液使得最终浓度为2mM。30min之后,通过加入终浓度为0.2%的阿拉伯糖诱导蛋白表达。诱导3h后,离心收集细胞并在-80℃中冷冻备用。将细胞在冰上解冻并悬浮于30ml的裂解缓冲液(10mM Tris-HCl、20mM咪唑、200mM NaCl,pH 8,1mM苯甲基磺酰氟、1mg/mL溶菌酶、100μg/mL DNaseA、Roche蛋白酶抑制剂)中。于4℃超声提取蛋白。通过离心将提取物澄清(20min、21.000g、4℃),将600 μL的Ni2+-NTA珠(Qiagen)加入到提取物中并将混合物在4℃搅拌孵育1小时。通过离心 (10min、1000g)收集珠。将珠重悬于30mL洗涤缓冲液(20mM Tris-HCl、30mM咪唑、300 mM NaCl,pH 8)并于1000g离心,重复三次。随后,将珠重悬于10mL的洗涤缓冲液中,并转移到柱中。用3mL补充有200mM咪唑的洗涤缓冲液洗脱蛋白并通过尺寸排阻色谱法采用HiLoad 16/60Superdex75制备级柱(GE Life Sciences)以1mL/min的流速(缓冲液: 20mM Tris-HCl、100mM NaCl、2mM EDTA,pH 7.4)进一步进行纯化。将含有蛋白质的级分收集并用Amicon Ultra-15 3kDa MWCO离心过滤装置(Millipore)浓缩。通过4-12%的SDS-PAGE分析纯化的蛋白质并通过质谱确认其质量(见补充信息)。用相同的方式制备具有整合的2和3的SfGFP:sfGFP-2、sfGFP-3,预期用pBKTCORS(其编码MbTCORS) 和psfGFP150TAGPylT-His6(其编码MbtRNACUA和在150位具有琥珀密码子的C-末端六聚组氨酸标记的sfGFP基因)转化细胞。用相同的方式制备具有整合的4和5的SfGFP: sfGFP-4、sfGFP-5,预期用pBKPylRS(其编码MbPylRS)和psfGFP150TAGPylT-His6(其编码MbtRNACUA和在150位具有琥珀密码子的C-末端六聚组氨酸标记的sfGFP基因)转化细胞。纯化蛋白的产量达到6-12mg/L。
蛋白质谱
通过使用Agilent 1200LC-MS系统,用6130四极谱仪进行ESI-MS。溶剂体系由作为缓冲液A的H2O中的0.2%甲酸和作为缓冲液B的乙腈(MeCN)中的0.2%甲酸组成。使用Phenomenex Jupiter C4柱(150x 2mm、5μm)对蛋白进行LC-ESI-MS,并且根据214 和280nm的蛋白UV吸光度,在正模式中分析样品。用MS Chemstation软件(Agilent Technologies)通过反褶积计算总蛋白质量。
此外,在具有电喷雾电离的LCT飞行时间质谱仪(ESI,Micromass)上确定蛋白总质量。蛋白质重缓冲于20mM的碳酸氢铵中并与包含1%甲酸的乙腈1:1混合。或者用C4 Ziptip(Millipore)制备样品并直接灌注于包含1%甲酸的50%乙腈水溶液中。以10μL min-1的速度注射样品并用马心肌红蛋白在正离子模式下进行校准。将30个扫描进行平均,并用MassLynx版本4.1(Micromass)通过最大熵反褶积获得分子质量。使用 ProtParam(http://us.expasy.org/tools/protparam.html)计算野生型蛋白质的理论质量,并手工校正包含非天然氨基酸的蛋白质的理论质量。
经四嗪-BCN或四嗪-TCO环加成的蛋白标记
用不同的四嗪体外标记纯化的蛋白质
向40μL纯化的重组蛋白(~10μM于20mM Tris-HCl、100mM NaCl、2mM EDTA,pH7.4)添加4μL的1mM的溶于MeOH的四嗪化合物6、7、8或9溶液(~10或20当量)。室温孵育30分钟后,通过LC-ESI-MS分析溶液。(补充附图S9)
用四嗪和四嗪-染料缀合物体外标记纯化的蛋白质:
将具有位点特异性整合的1或2的纯化的重组sfGFP:sfGFP-1或sfGFP-2(~10μM于20mM Tris-HCl、100mM NaCl、2mM EDTA,pH7.4)分别与10当量的四嗪-染料缀合物11、 12、13、14、15或16(2mM于DMSO中)进行孵育。室温下孵育溶液,并在30分钟至3 小时后取等分试样,通过SDS PAGE分析,用C4-ZIPTIP脱盐后通过ESI-MS进行分析。用考马斯亮蓝染色SDSPAGE凝胶或用Typhoon成像仪扫描SDS PAGE凝胶以将凝胶内荧光可视化(图4和补充附图S8)。
作为时间函数的四嗪-染料缀合物体外标记纯化的蛋白质:
将2nmol纯化的sfGFP-1、sfGFP-2或sfGFP-4(10μM于20mM Tris-HCl、100mM NaCl、2mM EDTA,pH 7.4中)与20nmol的四嗪-染料缀合物11(10μL于DMSO中的2 mM的溶液)孵育。在不同的时间点(0、30s、1min、2min、5min、10min、30min、1h、 2h、3h)从溶液中取出8μL的等分试样并用700倍过量的BCN或TCO猝灭并投入液氮中。将样品与补充有5%β-巯基乙醇的NuPAGE LDS样品缓冲液混合,加热10min至 90℃,并通过4-12%的SDS PAGE进行分析。通过用Typhoon Trio磷光成像仪(GE Life Sciences)扫描荧光带对标记的蛋白的量进行定量。使用橡皮筋(rubber band)背景减法用 ImageQuantTM TL软件(GE Life Sciences)对带进行定量。凝胶内荧光显示了sfGFP-4与10 当量的四嗪荧光团11的标记在1h内完成(图4e),而sfGFP-1和sfGFP-2的标记在用于测量第一时间点的数秒钟内完成。
用四嗪-染料缀合物标记整个大肠杆菌蛋白质组:
将含有psfGFP150TAGPylT-His6和pBKBCNRS或者psfGFP150TAGPylT-His6和pBKPylRS的大肠杆菌DH10B细胞接种于含有氨苄青霉素(对于pBKBCNRS,100μg/mL) 或卡那霉素(对于pBKPylRS,50μg/mL)和四环素(25μg/mL)的LB中。在37℃以250rpm 将细胞振摇孵育过夜。将2mL过夜培养物接种到100mL的补充有氨苄青霉素(50μg/mL) 和四环素(12μg/mL)或者卡那霉素(25μg/mL)和四环素(12μg/mL)的LB中,在37℃孵育。当OD600=0.5时,移出3ml培养物等分试样并补充不同浓度(1mM、2mM和5mM)的1 和1mM的5。37℃振摇孵育30min后,通过加入30μL的20%阿拉伯糖诱导蛋白表达。表达3.5h后,离心(16000g,5min)1mL的细胞悬浮液收集细胞。将细胞重悬浮于PBS 缓冲液中,再次离心,弃去上清液。此过程重复多于两次。最后,将洗涤的细胞沉淀物悬浮于100μL的PBS中,并在室温下与3μL的四嗪-染料缀合物11(2mM于DMSO中) 孵育30分钟。添加200倍过量的BCN以猝灭未反应的四嗪染料之后,将细胞重悬浮于 100μL补充有5%β-巯基乙醇的NuPAGE LDS样品缓冲液中,于90℃加热10min并 16000g离心10min。通过4-12%SDS-PAGE分析粗细胞裂解物以评估蛋白质水平。用考马斯亮蓝染色或用Typhoon成像仪扫描凝胶,以使荧光带显色(补充附图S9和S10)。用抗六聚组氨酸标签的抗体进行Western印迹(Cell Signaling Technology,His标签27E8鼠mAb#2366)。
停流确定小分子环加成的动力学速率常数
在准一级条件下、用甲醇/水混合物中10至100倍过量的BCN或TCO,之后用停流装置随时间在320、300或280nm处四嗪的UV吸光度的指数衰减来测量不同的四嗪的速率常数k(Applied Photophysics,补充附图S2和S3和补充表1)。制备各个四嗪(0.1mM于 9/1水/甲醇中)以及BCN和TCO(1至10mM于甲醇中)的储备液。测量前,四嗪以及BCN 和TCO溶液均在停流装置的注射器中恒温化。通过停流装置混合等体积的制备的储备液,使得最终浓度为0.05mM的四嗪和0.5至5mM的BCN或TCO,对应于10至100当量的BCN或TCO。使用下列仪器参数记录光谱:对于6和7,波长为320nm;对于8,波长为300nm;对于9,波长为280nm;每秒500至5000个数据点)。所有测量均在25℃进行。BCN-四嗪反应的数据拟合到单指数方程,并且TCO-四嗪反应的数据拟合到两个单指数方程之和。每个测量进行三至五次,将所观察到的速率K'的平均(如果是TCO-四嗪反应,则是第一指数方程)与BCN或TCO的浓度作图,以从图的斜率中获得速率常数k。对于所有4个四嗪,一式两份进行完整的测量组,值的平均值示于补充表1中。使用 Kaleidagraph软件(Synergy Software,Reading,UK)处理所有数据。
克隆哺乳动物细胞的应用
使用酶AflII和EcoRV(NEB)酶切质粒pMmPylS-mCherry-TAG-EGFP-HA1,2和pMmPylRS-EGFR-(128TAG)-GFP-HA2以去除野生型MmPylRS。用相同的侧翼位点、通过GeneArt制备突变合成酶MbBCNRS和MbTCORS的合成的基因。合成的MbBCNRS和 MbTCORS也用AflII和EcoRV消化并克隆以代替野生型合成酶(MmPylS)。通过使用快速连接试剂盒(Roche),构建了载体pMbBCNRS-mCherry-TAG-EGFP-HA、 pMbBCNRS-EGFR(128TAG)-GFP-HA和pMbTCORS-EGFR(128TAG)-GFP-HA。通过交换 MmPylRS与MbBCNRS,从pCMV-cJun-TAG-mCherry-MmPylRS质粒构建 pCMV-cJun-TAG-mCherry-MbBCNRS质粒(由Fiona Townsley构建)。按同样方法构建 pMbBCNRS-mCherry-TAG-EGFP-HA质粒。
HEK293细胞中的氨基酸1、2和3的整合
将HEK293细胞铺于聚赖氨酸包被的μ盘(Ibidi)。在10%的胎牛血清(FBS)Dulbecco 改进的Eagle培养基(DMEM)中生长至接近汇合时,使用lipofectamine 2000(Life Technologies)用2μg的pMbBCNRS-EGFR(128TAG)-GFP-HA和2μg的 p4CMVE-U6-PylT(其包含四个拷贝的野生型吡咯赖氨酰tRNA)1,2转染细胞。转染后,将细胞留于10%FBSDMEM中,37℃和5%的CO2条件下生长过夜。对于Western印迹,将细胞铺于24孔板并生长至接近汇合。使用lipofectamine 2000用 pMbBCNRS-mCherry-TAG-EGFP-HA或pMmPylRS-mCherry-TAG-EGFP-HA或 pTCORS-mCherry-TAG-EGFP-HA构建体和p4CMVE-U6-PylT质粒转染细胞。在存在或不存在0.5mM的1、1mM的2或1mM的5的条件下生长16小时后,使用RIPA缓冲液 (Sigma)将细胞在冰上裂解。离心裂解物并将上清液加到4x LDS样品缓冲液(Lifetechnologies)中。样品通过SDS-PAGE进行分析,并转移至硝酸纤维素膜上,并使用原代大鼠抗-HA(罗氏)和小鼠抗-FLAG(Ab frontier)进行印迹,二抗分别是抗-大鼠(Santa CruzBiotech)和抗-小鼠(Cell Signaling)。
哺乳动物细胞表面蛋白的标记
将细胞铺于聚赖氨酸包被的μ盘并在生长至接近汇合后,用2μg的 pMbBCNRS-EGFR(128TAG)-GFP-HA或pMbTCORS-EGFR(128TAG)-GFP-HA和 p4CMVE-U6-PylT转染细胞。在存在0.5mM的1(0.5%DMSO)、1mM的2或1mM的3 的情况下于37℃和5%CO2下在含有0.1%FBS的DMEM中生长8-16小时后,在含有0.1% FBS的DMEM中洗涤细胞,然后在含有0.1%FBS的DMEM中孵育过夜。次日,将细胞洗涤一次以上之后,加入400nM的四嗪-染料缀合物11孵育2-60分钟。将培养基更换两次,然后将细胞成像。在具有平复消色差透镜63X油浸物镜的Zeiss 780激光扫描显微镜下进行成像;扫描缩放:1x或2x;扫描分辨率:512×512;扫描速度:9;平均:16×。 EGFP在488nm激发并在493至554nm成像;TAMRA分别在561nm和566-685nm激发和检测。
同样处理对照组,但用pMmPylRS-EGFR(128TAG)-GFP-HA代替 pMbBCNRS-EGFR(128TAG)-GFP-HA转染细胞。在存在1mM的5的情况下并且在不存在或存在0.5%的DMSO(例如是氨基酸1的情况下)的情况下过夜培养细胞。
哺乳动物细胞核蛋白的标记
将细胞铺于聚赖氨酸包被的μ盘并在生长至接近汇合后,用2μg的 pCMV-cJun-TAG-mCherry和p4CMVE-U6-PylT分别转染细胞。在存在0.5mM的1(0.5% DMSO)的情况下于37℃和5%CO2下在含有0.1%FBS的DMEM中生长约16小时后,在含有0.1%FBS的DMEM中洗涤细胞,然后在含有0.1%FBS的DMEM中孵育过夜。次日,用两种培养基交替重复洗涤细胞,然后在2小时内孵育30分钟。加入200nM的四嗪-染料缀合物11孵育15分钟,然后再次重复洗涤细胞90分钟。对细胞表面的标记进行成像。
化学合成:
通用方法:
在Bruker UltrashieldTM 400Plus光谱仪(1H:400MHz,13C:101MHz,31P:162MHz)上记录NMR谱。以ppm报告化学位移(δ)并参考残余的未氘化的溶剂峰:CDCl3(7.26 ppm)、d6-DMSO(2.50ppm)用于1H-NMR谱,CDCl3(77.0ppm)、d6-DMSO(39.5ppm)用于13C-NMR谱。13C-和31P-NMR共振是质子去偶的。对于偶合常数(J)的测量精确到0.1Hz 并如观察所示。分裂模式指定如下:s,单峰;d,双峰;t,三重峰;q,四重峰;quin,五重峰;sext,六重峰;m,多重峰。在硅胶60F-254板上进行分析型薄层色谱(TLC)。通过UV光(254nm)和/或通过高锰酸钾染色将斑点可视化。在硅胶60(230-400目或70-230 目)上进行快速柱色谱。使用具有6130四极谱仪的Agilent 1200LC-MS系统进行ESI-MS。溶剂体系由作为缓冲液A的H2O中的0.2%甲酸和作为缓冲液B的乙腈(MeCN)中的0.2%甲酸组成。使用Phenomenex Jupiter C18柱(150×2mm,5μm)进行小分子LC-MS。使用可变波长并在正离子和负离子模式获得MS。使用具有来自Phenomenex C18柱(250×30 mm,5μm)的自动化馏分收集的Varian PrepStar/ProStarHPLC系统进行制备性的HPLC 纯化。通过191nm的UV吸光度鉴定化合物。所有溶剂和化学试剂购自商业供应商,并且无需进一步纯化即可使用。双环[6.1.0]壬-4-炔-9-基甲醇(BCN,外/内混合物~4/1)购自 SynAffix,荷兰。非水反应在惰性氩气气氛下在烘箱干燥的玻璃器皿中进行,除非另有说明。所有实验用水是蒸馏的。盐水是指饱和氯化钠水溶液。
根据文献步骤3合成外-双环[6.1.0]壬-4-炔-9-基甲醇(exo-BCN,S18)。
于0℃将N,N'-二琥珀酰亚胺碳酸酯(1.38g,5.37mmol)加入到于MeCN(10mL)中的exo-BCN-OH S18(538mg,3.58mmol)和三乙胺(2.0mL,14.3mmol)的搅拌溶液中。将溶液加热至室温并搅拌3小时并减压浓缩。将粗的油状物通过硅胶色谱(用己烷中的60%的 EtOAc洗脱)的短垫(shord pad)进行纯化,得到exo-BCN-琥珀酰亚胺碳酸酯,其直接使用而不需要进一步纯化。DMF(4mL)中的exo-BCN-OSu(1.25g,4.29mmol)经插管加入到DMF(10mL)中的Fmoc-Lys-OH.HCl(2.61g,6.45mmol)和DIPEA(1.49mL,8.58mmol)的搅拌溶液中。室温搅拌溶液14小时,用Et2O(100mL)稀释并用H2O洗涤(3×100mL)。将有机相经硫酸钠干燥、过滤并减压浓缩。将粗的油状物通过硅胶色谱(0-5%MeOH于DCM 中(0.1%AcOH))进行纯化,得到exo-Fmoc-BCNK-OH S19,其为白色固体(1.65g,85%超过2个步骤)。δH(400MHz,d6-DMSO)12.67-12.31(1H,br s),7.90(2H,d,J 7.5),7.73(2H,d, J 7.4),7.63(1H,d,J 7.8),7.42(2H,t,J 7.4),7.34(2H,t,J 7.4),7.10(1H,t,J 5.7),4.31-4.19 (3H,m),3.95-3.87(1H,m),3.84(1H,d,J 6.4),3.45-3.25(br s,1H),3.01-2.91(2H,m), 2.52-2.50(1H,m),2.33-2.15(4H,m),2.11-2.02(2H,m),1.75-1.54(2H,m),1.46-1.23(6H,m), 0.70-0.58(2H,m);δC(101MHz,d6-DMSO)174.4,156.9,156.6,144.30,144.27,141.2,128.1, 127.5,125.7,120.6,99.4,68.1,66.1,54.3,47.1,33.3,30.9,29.5,23.9,23.4,22.7,21.3;LRMS (ESI+):m/z 543(100%[M–H])。
将聚合物结合的哌嗪(1.28g,1.28mmol,200-400目,标记程度:1.0-2.0mmol/g装载,与二乙烯基苯2%交联)添加到DCM(10mL)中的exo-Fmoc-BCNK-OH S19(174mg,0.32mmol)的搅拌溶液中。所得到的混合物室温搅拌4小时,过滤并用CHCl3/MeOH(3:1,3x50 mL)洗涤试剂。减压蒸发滤液并溶解于H2O(100mL)中,并用EtOAc洗涤(3×100mL)。减压蒸发水相并冷冻干燥,得到exo-H-BCNK-OH 1,其为白色固体(101mg,98%)。对于所有使用哺乳动物细胞的后续标记实验而言,exo-H-BCNK-OH 1进一步通过反相HPLC 进行纯化(0:1的H2O:MeCN至9:1的H2O:MeCN梯度)。δH(400MHz,d6-DMSO/D2O (1:1))4.14-3.76(m,3H),3.56-3.29(m,2H),3.18-2.81(m,3H),2.31-1.98(m,5H),1.71-1.52 (m,4H),1.51-1.29(m,4H),1.29-1.08(m,3H),0.95-0.66(m,2H);δC(101MHz, d6-DMSO/D2O(1:1))169.4,165.9,101.3,76.0,55.8,31.8,30.1,29.9,25.2,23.2,22.1,21.0, 18.7;LRMS(ESI+):m/z 323(100%[M+H]+)。根据文献步骤3合成内-双环[6.1.0]壬-4-炔 -9-基甲醇(内-BCN)并以与1类似的方式加工成相应的氨基酸。
在配备有磁力搅拌棒的玻璃小瓶(Ltd.)中填入化合物6(39.2mg,0.096mmol) 并用气密铝/橡胶隔片密封。在真空中干燥小瓶中的内容物并用氩气吹扫(×3)。将MeOH(1 mL)加入到小瓶中,然后加入exo-双环[6.1.0]壬-4-炔-9-基甲醇(exo-BCN,S18)溶液(20.2mg 溶于1ml的MeOH中,0.1344mmol)。室温搅拌混合物。2分钟内,反应混合物脱色,再搅拌内容物1分钟。然后将混合物减压蒸发,并通过硅胶色谱(5%MeOH溶于DCM)进行纯化,得到哒嗪S20,其为淡黄色半固体(49mg,96%)。δH(400MHz,CDCl3)9.16(1H,br s),8.77-8.71(1H,m),8.67(1H,app.d,J 2.1),8.01(1H,br s),7.97(1H,d,J 7.8),7.89(1H,ddd, J 7.8,7.6,1.7),7.75(1H,app.d,J 8.4),7.40(1H,ddd,J 7.4,4.9,1.1),5.93(1H,br s),4.02(2H, d,J 5.0),3.49-3.31(2H,m),3.12-2.88(4H,m),2.68-2.49(2H,m),1.88-1.60(1H,br s), 1.60-1.50(1H,m),1.48(9H,s),0.92-0.72(4H,m);δC(101MHz,CDCl3)169.0,159.2,159.0, 156.9,156.8,155.7,152.1,148.9,143.0,140.9,137.0,134.4,128.0,125.1,124.9,123.5,80.7, 66.4,45.7,30.7,29.9,29.6,29.5,28.5(3x CH3(tBu)),28.0,27.8,21.7;LRMS(ESI+):m/z 531(100%[M+H]+)。
于室温将市售的溶于H2O(10mL)的4-(氨基甲基)苄腈盐酸盐S21(2.11g,12.50mmol)加入到在H2O(10mL)中的NaOH(1.50g,37.50mmol)和二叔丁基二碳酸酯(3.00g,13.75mmol)的搅拌溶液中。将混合物搅拌16小时,在此之后,形成白色沉淀。过滤混合物并用H2O(50mL)洗涤,并在真空下干燥所得到的固体,得到叔丁基氨基甲酸酯S22,其为白色固体(2.78g,96%)。δH(400MHz,CDCl3)7.62(2H,d,J 8.2),7.39(2H,d,J 8.2), 5.00(1H,brs),4.37(2H,d,J 5.8),1.46(9H,s);δC(101MHz,CDCl3)155.9,144.7,132.4, 127.8,118.9,111.1,80.1,44.2,28.4;LRMS(ESI+):m/z 233(100%[M+H]+)。
通过改进文献步骤4合成四嗪10。于室温将肼一水化物(1.024mL,21.10mmol)加入到溶于1,4-二恶烷(0.5mL)中的叔丁基氨基甲酸酯S22(98mg,0.44mmol)、乙酸甲脒(439mg,4.22mmol)和Zn(OTf)2(77mg,0.22mmol)的搅拌悬浮液中。将反应加热至60℃并搅拌16小时。将反应冷却至室温并用EtOAc(10mL)稀释。用1M HCl(10mL)洗涤反应,并用EtOAc(2×5mL)萃取水相。经硫酸钠干燥有机相,将其过滤并减压蒸发。将所得到的粗残留物溶于DCM和乙酸(1:1,5mL)的混合物中,并缓慢添加NaNO2(584mg,8.44mmol),历时15分钟,在此期间,反应变成亮红色。用活性空气净化吹扫含氮烟雾,然后用DCM(25 mL)稀释反应。用碳酸氢钠(sat.,aq.,25mL)洗涤反应混合物并用DCM(2×10mL)萃取水相。经硫酸钠干燥有机相,过滤并减压蒸发。用硅胶色谱(溶于己烷的20%EtOAc)纯化所得到的残留物,得到四嗪10,其为粉色固体(85mg,70%)。δH(400MHz,CDCl3)10.21(1H, s),8.60(2H,d,J 8.2),7.53(2H,d,J 8.2),4.97(1H,br s),4.45(2H,d,J 6.0),1.49(9H,s);δC (101MHz,CDCl3)149.4,142.6,141.1,132.1,120.8,119.2,118.8,51.8,39.0;LRMS(ESI+): m/z 188(100%[(M–Boc)+2H]+)。将溶于二恶烷的4M HCl(2mL,8.0mmol)加入到溶于 DCM(4mL)中的四嗪10(75mg,0.26mmol)的搅拌溶液中。1小时后,反应完成,并减压去除溶剂,得到伯胺盐酸盐S23,其为粉红色固体(61mg,100%)。δH(400MHz,d6-DMSO) 10.64(1H,s),8.54(2H,d,J8.4),7.79(2H,d,J 8.4),4.18(2H,d,J 5.5);δC(101MHz, d6-DMSO)165.2,158.2,138.9,131.9,129.8,127.9,41.8;LRMS(ESI+):m/z 188(100% [M+H]+)。
通过先前所述的光化学步骤5,6或通过如下所述的非光化学步骤制备E-5-羟基环辛烯和E-exo-双环[6.1.0]壬-4-烯-9-基甲醇。
于0℃逐滴地将二异丁基氢化铝(溶于环己烷的1.0M溶液,89mL,89mmol)加入到溶于DCM(300mL)中的市售9-氧杂双环[6.1.0]壬-4-烯S24(10g,80.53mmol)的搅拌溶液中。于0℃搅拌溶液30分钟,温热至室温并搅拌16h。此后,将反应冷却至0℃,缓慢加入异丙醇(50mL),随后加入HCl(1M,aq.,100mL)。用DCM(3×200mL)萃取水相。将组合的有机物用盐水洗涤,用硫酸钠干燥,过滤并减压浓缩。通过硅胶色谱(溶于己烷的 10-20%EtOAc)纯化粗物质,得到环辛烯-4-醇S25,其为无色油状物(8.42g,83%)。光谱数据符合文献7
于0℃将叔丁基(氯)二甲基硅烷(13.3g,88.0mmol)添加至溶于DCM(30mL)的环辛烯 -4-醇S25(5.6g,44.0mmol)、咪唑(7.5g,0.11mol)和DMAP(1晶体)的搅拌溶液中。将溶液温热至室温并搅拌90分钟,在此期间形成白色沉淀。将反应冷却至0℃,用DCM(100 mL)稀释并添加碳酸氢钠(sat.,aq.,100mL)。分离各相并用DCM(3×100mL)萃取水相。将组合的有机物用盐水(200mL)洗涤,经硫酸钠干燥,过滤并减压浓缩。通过硅胶色谱(溶于己烷的10-20%DCM)纯化粗物质,得到甲硅烷基醚S26,其为无色油状物(10.55g, quant.)。H(400MHz,CDCl3 )5.71-5.63(1H,m),5.60-5.52(1H,m),3.80(1H,app td,J 8.6, 4.2),2.34(1H,dtd,J13.8,8.2,3.8),2.25-2.15(1H,m),2.13-2.05(1H,m),2.02-1.93(1H,m), 1.87-1.52(5H,m),1.47-1.35(1H,m),0.88(9H,s),0.04(3H,s),0.03(3H,s);C(101MHz, CDCl3)130.4,129.4,73.1,38.0,36.5,26.1,25.8,25.1,22.7,18.4,–3.4;LRMS(ESI+):m/z 241(11%[M+H]+)。
于0℃逐滴地将过乙酸(乙酸中的39%,10.3mL,52.7mmol)加入到溶于DCM(80mL)的甲硅烷基醚S26(10.6g,43.9mmol)和碳酸钠(7.0g,65.8mmol)的搅拌溶液中。将混合物温热至室温并搅拌14小时。将反应冷却至0℃,用DCM(50mL)稀释并添加硫代硫酸钠(sat.,aq.,100mL)。将混合物在室温下搅拌10min,然后用NaOH(2M,aq.)将其碱化至pH 12。分离各相并用H2O(100mL)、盐水(100mL)洗涤有机相,经硫酸钠干燥,过滤并减压浓缩。通过硅胶色谱(溶于己烷的80%-90%DCM)纯化粗物质,得到环氧化物 S27/S28,其为非对映体的不可分混合物(2.3:1,通过1H-NMR测定)且其为无色油状物(10.2 g,91%)。主要非对映体:δH(400MHz,CDCl3)3.90(1H,app sext,J 4.2),2.90(2H,ddd,J 16.7, 8.3,4.4),2.21-2.09(1H,m),1.85-1.60(6H,m),1.50-1.38(2H,m),1.34-1.23(1H,m),0.88(9H, s),0.04(3H,s),0.03(3H,s);δC(101MHz,CDCl3)171.9,55.5,55.4,36.3,34.3,27.7,26.0, 25.8,22.6,18.3,–3.4;LRMS(ESI+):m/z 257(8%[M+H]+)。
于-78℃逐滴地将正丁基锂(溶于己烷的2.5M,14.8mL,37.0mmol)加入到(15分钟内)THF(80mL)中的环氧化物S27/S28(7.9g,30.8mmol)和二苯基膦(6.43mL,37.0mmol) 的搅拌溶液中。将所得到的混合物在-78℃搅拌1小时,温热至室温并搅拌14小时。将反应混合物用THF(80mL)稀释,并冷却至0℃。加入乙酸(5.54mL,92.4mmol),接着加入过氧化氢(溶于H2O中的30%溶液,7.68mL,67.7mmol)。将反应混合物温热至室温并搅拌4小时。加入硫代硫酸钠(sat.,aq.,100mL)并搅拌混合物10分钟。用EtOAc(3×200mL) 萃取水相。将组合的有机物用盐水洗涤(3×200mL),用硫酸钠干燥,过滤并减压浓缩,得到氧化膦S29/S30/S31/S32,其为4种非对映体的混合物,其不经进一步纯化即可使用。δP(162MHz,CDCl3)45.2,44.8,44.4,43.8;LRMS(ESI+):m/z 459(100%[M+H]+)。
于0℃将氢化钠(溶于矿物油中的60%分散,2.46g,61.5mmol)加入到溶于DMF(100mL)中的粗的羟基氧化膦S29/S30/S31/S32的搅拌溶液中。将所得到的混合物温热至室温,包裹在锡箔中并搅拌2小时。将反应冷却至0℃,用Et2O(200mL)稀释并加入H2O(200mL)。分离各相并用盐水(2×200mL)洗涤组合的有机物,用硫酸钠干燥,过滤并减压浓缩。通过硅胶色谱(溶于己烷的1-15%DCM)纯化粗的混合物,得到反式环辛烯S33/S34,其为非对映体的可分混合物,具有专一的E-选择性,其为无色油状物(2.78g,1.2:1dr,38%超过3个步骤)。S33:δH(400MHz,CDCl3)5.64(1H,ddd,J 16.0,10.8,3.6),5.45(1H,ddd,J 15.9, 11.1,3.2),4.01(1H,app dd,J 10.2,5.4),2.41(1H,qd,J 11.5,4.4),2.26-2.19(1H,m), 2.09-1.94(3H,m),1.92-1.73(2H,m),1.71-1.63(1H,m),1.54(1H,tdd,J 14.0,4.7,1.1), 1.30-1.08(1H,m),0.94(9H,s),0.03(3H,s),0.01(3H,s);δC(101MHz,CDCl3)135.9,131.5, 67.6,44.0,35.2,34.8,29.7,27.7,26.2,18.4,–4.7,–4.8;LRMS(ESI+):m/z 241(8%[M+H]+).S34:δH(400MHz,CDCl3)5.55(1H,ddd,J 15.9,11.0,3.6),5.36(1H,ddd,J 16.1,10.8,3.4),3.42-3.37(1H,m),2.36-2.28(2H,m),2.22(1H,app qd,J 11.2,6.3),2.02-1.87(4H,m),1.73 (1H,dd,J 14.9,6.2),1.67-1.45(2H,m),0.87(9H,s),0.03(6H,s);δC(101MHz,CDCl3)135.5,132.5,78.6,44.9,42.0,34.6,33.0,31.3,26.1,18.3,–4.4,–4.5;LRMS(ESI+):m/z241 (12%[M+H]+)。对于所有进一步的实验而言,使用反式-环辛烯S34,其中C4-氧取代占据了赤道轴位置。
于室温将氟化四丁基铵(溶于THF中的1M溶液,23.8mL,23.8mmol)和氟化铯(1.08g,7.14mmol)加入到溶于MeCN(5mL)中的甲硅烷基醚S34(573mg,2.38mmol)的搅拌溶液中。将所得到的混合物包裹在锡箔中,并在室温下搅拌36小时。此后,将反应冷却至 0℃,用DCM(100mL)稀释并加入H2O(100mL)。分离各相,用盐水(2×100mL)洗涤有机相,用硫酸钠干燥,过滤并减压浓缩。通过硅胶色谱(溶于己烷中的20%EtOAc)纯化粗物质,得到仲醇S35,其为无色油状物(289mg,96%)δH(400MHz,CDCl3)5.60(1H,ddd,J 16.0, 10.7,4.2),5.41(1H,ddd,J 16.0,11.1,3.7),3.52-3.45(2H,m),2.40-2.25(3H,m),2.03-1.90 (4H,m),1.75-1.53(3H,m),1.25-1.18(1H,m);δC(101MHz,CDCl3)135.1,132.8,77.7,44.6, 41.1,34.3,32.6,32.1;LRMS(ESI+):m/z 127(14%[M+H]+)。
于0℃将琥珀酸胺碳酸盐(succimidyl carbonate)S36(200mg,0.75mmol)加入到溶于DMF(7.5mL)中的Fmoc-Lys-OH.HCl(303mg,0.75mmol)和DIPEA(0.19g,1.50mmol) 的搅拌溶液中。将溶液温热至室温,包裹在锡箔中并搅拌12小时。此后,减压浓缩溶液,并通过硅胶色谱(溶于DCM的0-10%MeOH)进行纯化,得到Fmoc-TCOK-OH S37/S38,其为黄色油状物,其仍含有DMF(350mg,81%)。δH(400MHz,CDCl3)7.75-7.69(2H,m), 7.63-7.52(2H,m),7.41-7.33(2H,m),7.32-7.25(2H,m),5.82-5.34(3H,m),5.27(1H,br s), 4.90-4.50(1H,m),4.47-4.01(5H,m),3.32-3.30(1H,m),2.39-1.08(17H,m);δC(100MHz, CDCl3)174.3,156.3,155.9,143.8,143.6,141.1,135.0,134.8,132.8,132.6,127.5,126.9,125.0, 119.8,80.3,66.8,53.4,47.0,41.0,40.4,38.5,34.1,32.5,32.3,32.1,30.8,29.3,22.3;ESI-MS(m/z):[M+Na]+,C30H36N2O6Na计算值543.2471,实际值543.2466。
将哌啶(1mL)加入到溶于DCM(4mL)的Fmoc-TCOK-OH S37/S38(0.269g,0.517mmol)的搅拌溶液中。将混合物包裹在锡箔中并在室温下搅拌30分钟。将反应混合物减压浓缩,通过硅胶色谱(溶于DCM的30-50%MeOH)纯化粗物质,得到H-TCOK-OH 1,其为象牙色固体。δH(400MHz,d4-MeOD)5.63-5.56(1H,m),5.50-5.43(1H,m),4.31-4.25 (1H,m),3.60-3.53(1H,m),3.11-3.03(2H,m),2.37-2.26(3H,m),2.02-1.36(13H,m);δC (100MHz,d4-MeOD)174.3,159.0,136.3,133.9,81.8,56.0,42.4,41.4,39.8,35.4,33.7,32.3, 32.1,30.9,23.6;ESI-MS(m/z):[M–H]C15H25N2O4计算值297.1814,实际值297.1811。
根据文献步骤5合成exo-双环[6.1.0]壬-4-烯-9-基甲醇S18。
于0℃将叔丁基(氯)二苯基硅烷(7.45g,27.1mmol)加入到溶于DCM(35mL)的exo-双环[6.1.0]壬-4-烯-9-基甲醇S18(2.75g,18.1mmol)、咪唑(2.15g,31.6mmol)和DMAP(2.21 g,18.1mmol)的搅拌溶液中。将溶液温热至室温并搅拌24小时,在此期间形成白色沉淀。将反应冷却至0℃,用DCM(100mL)稀释并加入碳酸氢钠(sat.,aq.,100mL)。分离各相并用DCM(3×100mL)萃取水相。将组合的有机物用盐水(200mL)洗涤,用硫酸钠干燥,过滤并减压浓缩。通过硅胶色谱(溶于己烷的20%DCM)纯化粗物质,得到甲硅烷基醚S39,其为无色油状物(6.85g,97%),δH(400MHz,CDCl3)7.79-7.64(4H,m),7.50-7.32(6H,m), 5.63(2H,dm,J11.5),3.59(2H,d,J 6.2),2.40-2.21(2H,m),2.18-1.96(4H,m),1.45-1.33(2H, m),1.07(9H,s),0.72-0.56(3H,m);δC(101MHz,CDCl3)135.7,134.3,130.2,129.5,127.6, 67.9,29.1,28.6,27.2,26.9,22.0,19.3;LRMS(ESI+):m/z 408(10%,[M+NH4]+)。
于0℃将过乙酸(3.38mL,溶于乙酸的39%,19.9mmol)加入到溶于DCM(65mL)的甲硅烷基醚S39(6.49g,16.6mmol)和无水碳酸钠(2.64g,24.9mmol)的搅拌溶液中。将混合物温热至室温并搅拌24小时。然后将反应冷却至0℃,用DCM(100mL)稀释并加入硫代硫酸钠(sat.,aq.,150mL)。将混合物在室温下搅拌30分钟,然后用NaOH(2M,aq.) 将其碱化至pH12。分离各相并用H2O(200mL)、盐水(200mL)洗涤有机相,用硫酸钠干燥,过滤并减压浓缩。通过硅胶色谱(100%DCM)纯化粗物质,得到环氧化物S40和S41,其为非对映体的不可分混合物(1:1通过1H NMR光谱),并且其为无色油状物(5.97g, 88%)。δH(400MHz,CDCl3)7.72-7.63(8H,m),7.47-7.34(12H,m),3.57(2H,d,J 5.6),3.54 (2H,d,J 5.9),3.03-3.10(2H,m),3.02-2.91(2H,m),2.36-2.24(2H,m),2.21-2.08(2H,m), 2.06-1.85(6H,m),1.35-1.12(4H,m),1.06(9H,s),1.05(9H,s),0.92-0.80(2H,m),0.78-0.47 (6H,m);δC(101MHz,CDCl3)135.65,135.63,134.2,134.1,129.6(2×CH),127.6(2×CH), 67.4,67.0,56.91,56.85,29.7,27.7,26.9(2×3CH3),26.6,26.5,23.31,23.25,21.7,20.4,19.2 (2×2C);LRMS(ESI+):m/z407(9%,[M+H]+)。
于-78℃逐滴地将正丁基锂(溶于己烷中的2.5M,5.92mL,14.8mmol)加入到(15分钟内)溶于THF(50mL)的环氧化物S40/S41(5.47g,13.5mmol)和二苯基膦(2.57mL,14.80mmol)的搅拌溶液中。将所得到的混合物在-78℃搅拌1小时,温热至室温,并再搅拌14 小时。将反应混合物用THF(80mL)稀释并冷却至0℃。加入乙酸(1.54mL,26.9mmol),接着加入过氧化氢(溶于H2O中的30%溶液,3.05mL,26.9mmol)。将反应混合物温热至室温并搅拌4小时。加入硫代硫酸钠(sat.,aq.,100mL)并将混合物搅拌10分钟。用EtOAc(3 ×200mL)萃取水相。将组合的有机物用盐水(3×200mL)洗涤,用硫酸钠干燥,过滤并减压浓缩。通过硅胶色谱(溶于己烷的40-100%EtOAc)纯化粗的混合物,得到氧化膦 S42/S43/S44/S45,其为两个非对映异构体的51:18的混合物(5.61g,69%超过2个步骤),其各自是区域异构体的1:1混合物(S42/S45和S43/S44)。主要非对映体:δH(400MHz, CDCl3)7.82-7.68(4H,m),7.68-7.58(4H,m),7.52-7.32(12H,m),4.58-4.45(1H,m),4.16(1H, d,J 5.3),3.54(2H,d,J6.0),2.47(1H,ddd,J 12.0,11.7,4.3),2.21-2.07(1H,m),2.05-1.85(2H, m),1.78-1.55(3H,m),1.22-1.05(1H,m),1.03(9H,s),0.91-0.75(1H,m),0.62-0.35(3H,m);δP(162MHz,CDCl3)39.7;LRMS(ESI+):m/z 609[100%,(M+H)+]。次要非对映体:δH(400 MHz,CDCl3)7.87-7.77(2H,m),7.74-7.60(6H,m),7.52-7.30(12H,m),4.26(1H,d,J 4.0), 3.89-3.78(1H,m),3.63(1H,dd,J 10.7,5.8),3.54(1H,dd,J 10.7,6.2),3.26-3.10(1H,m), 2.22-2.12(1H,m),2.00-1.78(3H,m),1.70-1.62(1H,m),1.42-1.28(1H,m),1.04(9H,s), 1.04-0.92(2H,m),0.79-0.65(1H,m),0.55-0.41(1H,m),0.27-0.12(1H,m);δP(162MHz, CDCl3)39.6;LRMS(ESI+):m/z 609[100%,(M+H)+]。
于0℃将氢化钠(溶于矿物油中的60%分散体系,0.46g,11.5mmol)加入到溶于无水 DMF(60mL)的羟基氧化膦S42/S43/S44/S45(4.68g,7.69mol)的搅拌溶液中。将所得到的混合物温热至室温,包裹在锡箔中并搅拌2小时。将反应混合物冷却至0℃,用Et2O(200 mL)和H2O(200mL)稀释,分离各相并用己烷(150mL)萃取水相。将组合的有机物用盐水 (sat.,aq.,5×250mL)洗涤,用硫酸钠干燥,过滤并减压浓缩。通过硅胶色谱(溶于己烷的1-20%DCM)纯化粗的混合物,得到反式环辛烯S46,其为单一的非对映体,并具有专一的E-选择性(2.08g,69%);δH(400MHz,CDCl3)7.72-7.62(4H,m),7.46-7.34(6H,m), 5.83(1H,ddd,J16.1,9.2,6.2),5.11(1H,ddd,J 16.1,10.6,3.3),3.59(2H,d,J 5.7),2.28-2.40 (1H,m),2.12-2.27(3H,m),1.80-1.95(2H,m),1.04(9H,s),0.74-0.90(1H,m),0.46-0.60(1H, dm,J14.0),0.31-0.42(2H,m),0.18-0.29(1H,m);δC(101MHz,CDCl3)138.6,135.8,134.4,131.3,129.6,127.7,68.1,39.0,34.1,32.9,28.2,27.9,27.0,21.6,20.5,19.4。
于室温将氟化四丁基铵(溶于THF中的1M溶液,10.0mL,10.0mmol)添加到溶于 THF(5mL)中的甲硅烷基醚S46(0.78g,2mmol)的搅拌溶液中,包裹在锡箔中并搅拌45 分钟。此后,将反应混合物减压浓缩,用DCM(100mL)稀释并用盐水(100mL)洗涤。分离各相并用盐水(2×100mL)洗涤有机相。将组合的有机物用硫酸钠干燥,过滤并减压浓缩。通过硅胶色谱(溶于己烷的20%EtOAc)纯化粗物质,得到伯醇S47,其为无色油状物(0.29 g,96%);δH(400MHz,d4-MeOD)5.87(1H,ddd,J 16.5,9.3,6.2),5.13(1H,dddd,J 16.5,10.4, 3.9,0.8),3.39-3.47(2H,dd,J 6.2,1.5),2.34-2.44(1H,m),2.12-2.33(3H,m),1.82-1.98(2H,m),0.90(1H,dtd,J 12.5,12.5,7.1),0.55-0.70(1H,m),0.41-0.55(1H,m),0.27-0.41(2H,m);δC(101MHz,d4-MeOD)139.3,132.2,67.5,39.9,34.8,33.8,29.2,28.7,23.0,21.9;MS-CI(NH3):m/z[M-OH]C10H15,计算值135.1174;实际值135.1173。
于0℃将pNO2-苯基碳酸酯S48(250mg,0.79mmol)加入到溶于DMF(3mL)中的 Fmoc-Lys-OH.HCl(478mg,1.18mmol)和DIPEA(0.27mL,1.58mmol)的搅拌溶液中。将溶液温热至室温,包裹在锡箔中并搅拌16小时。此后将溶液减压浓缩,并通过硅胶色谱(溶于DCM的0-5%MeOH)纯化,得到Fmoc-exo-sTCOK S49,其为白色泡沫(373mg,87%)。δH(400MHz,d6-DMSO)13.09-12.06(1H,br s),7.90(2H,d,J 7.5),7.73(2H,d,J 7.5), 7.66-7.56(1H,m),7.43(2H,t,J 7.4),7.34(2H,J 7.4),7.08(1H,t,J 5.4),5.84-5.72(1H,m), 5.13-5.01(1H,m),4.31-4.19(3H,m),3.93-3.79(3H,m),3.00-2.90(2H,m),2.31-2.07(4H,m), 1.91-1.78(2H,m),1.75-1.49(2H,m),1.45-1.22(4H,m),0.91-0.75(1H,m),0.62-0.45(2H,m), 0.43-0.32(2H,m);δC(101MHz,d6-DMSO)173.9,156.4,156.1,143.8,140.7,137.9,131.0, 127.6,127.0,125.2,120.1,79.1,67.9,65.6,53.8,46.6,38.1,33.4,31.9,30.4,29.0,27.2,24.3, 22.8,21.2,20.2;LRMS(ESI+):m/z 545(100%[M–H])。
将氢氧化锂一水合物(94mg,0.75mmol)加入到溶于THF:H2O(3:1,8mL)的 exo-sTCOK S49的搅拌溶液中。将溶液包裹在锡箔中,室温搅拌4小时,并加入EtOAc(100 mL)和H2O(100mL)。通过添加AcOH,将水相小心地酸化至pH4,并用EtOAc(4×100mL) 萃取水相,减压蒸发水相并冷冻干燥,得到exo-sTCOK 3,其为白色固体。对于所有使用哺乳动物细胞的后续标记实验而言,通过反相HPLC进一步纯化exo-H-bcnK-OH 1(0:1 的H2O:MeCN至9:1的H2O:MeCN梯度)。δH(400MHz,d6-DMSO)7.21-7.09(1H,br m), 5.85-5.72(1H,m),5.14-5.02(1H,m),3.80(2H,d,J 2.6),3.14-3.05(1H,m),2.98-2.86(2H,m), 2.31-2.08(4H,m),1.92-1.78(2H,m),1.73-1.65(1H,m),1.55-1.44(1H,m),1.41-1.25(4H,m), 0.90-0.62(1H,m),0.65-0.45(2H,m),0.43-0.32(2H,m);δC(101MHz,d6-DMSO)175.5, 156.3,137.9,131.1,67.8,54.5,38.1,33.4,32.1,32.0,29.2,27.2,24.7,24.3,22.5,21.2,20.2; LRMS(ESI+):m/z 325(100%[M+H]+)。
补充实施例的参考文献
1.Gautier,A.et al.Genetically encoded photocontrol of proteinlocalization in mammalian cells.J Am Chem Soc132,4086-8(2010).
2.Lang,K.et al.Genetically encoded norbornene directs site-specificcellular protein labelling via a rapid bioorthogonal reaction.Naturechemistry4,298-304(2012).
3.Dommerholt,J.et al.Readily Accessible Bicyclononynes forBioorthogonal Labeling and Three-Dimensional Imaging of LivingCells.Angewandte Chemie-International Edition49,9422-9425(2010).
4.Yang,J.,Karver,M.R.,Li,W.,Sahu,S.&Devaraj,N.K.Metal-catalyzed one-pot synthesis of tetrazines directly from aliphatic nitriles andhydrazine.Angewandte Chemie51, 5222-5(2012).
5.Taylor,M.T.,Blackman,M.L.,Dmitrenko,O.&Fox,J.M.Design and synthesisof highly reactive dienophiles for the tetrazine-trans-cycloocteneligation.Journal of the American Chemical Society133,9646-9(2011).
6.Royzen,M.,Yap,G.P.&Fox,J.M.A photochemical synthesis offunctionalized trans-cyclooctenes driven by metal complexation.Journal of theAmerican Chemical Society130,3760-1(2008).
7.Zhang,K.,Lackey,M.A.,Cui,J.&Tew,G.N.Gels based on cyclic polymers.Journal of the American Chemical Society133,4140-8(2011).
正文的参考文献:
(1)Devaraj,N.K.;Weissleder,R.;Hilderbrand,S.A.Bioconjug Chem2008,19,2297.
(2)Devaraj,N.K.;Weissleder,R.Acc Chem Res2011.
(3)Blackman,M.L.;Royzen,M.;Fox,J.M.J Am Chem Soc2008,130,13518.
(4)Taylor,M.T.;Blackman,M.L.;Dmitrenko,O.;Fox,J.M.Journal of theAmerican Chemical Society2011,133,9646.
(5)Liu,D.S.;Tangpeerachaikul,A.;Selvaraj,R.;Taylor,M.T.;Fox,J.M.;Ting, A.Y.Journal of the American Chemical Society2012,134,792.
(6)Seitchik,J.L.;Peeler,J.C.;Taylor,M.T.;Blackman,M.L.;Rhoads,T.W.;Cooley,R.B.;Refakis,C.;Fox,J.M.;Mehl,R.A.Journal of the American ChemicalSociety2012,134,2898.
(7)Lang,K.;Davis,L.;Torres-Kolbus,J.;Chou,C.;Deiters,A.;Chin,J.W.Nature chemistry2012,4,298.
(8)Kaya,E.;Vrabel,M.;Deiml,C.;Prill,S.;Fluxa,V.S.;Carell,T.AngewandteChemie2012,51,4466.
(9)Plass,T.;Milles,S.;Koehler,C.;Szymanski,J.;Mueller,R.;Wiessler,M.;Schultz,C.;Lemke,E.A.Angew Chem Int Edit2012,51,4166.
(10)Dommerholt,J.;Schmidt,S.;Temming,R.;Hendriks,L.J.A.;Rutjes,F.P.J.T.;van Hest,J.C.M.;Lefeber,D.J.;Friedl,P.;van Delft,F.L.Angew Chem IntEdit2010,49,9422.
(11)Chen,W.X.;Wang,D.Z.;Dai,C.F.;Hamelberg,D.;Wang,B.H.ChemCommun2012,48,1736.
(12)McKay,C.S.;Blake,J.A.;Cheng,J.;Danielson,D.C.;Pezacki,J.P.ChemCommun2011,47,10040.
(13)McKay,C.S.;Chigrinova,M.;Blake,J.A.;Pezacki,J.P.Organic&biomolecular chemistry2012.
(14)Ning,X.;Temming,R.P.;Dommerholt,J.;Guo,J.;Ania,D.B.;Debets, M.F.;Wolfert,M.A.;Boons,G.J.;van Delft,F.L.Angewandte Chemie2010,49,3065.
(15)Agard,N.J.;Prescher,J.A.;Bertozzi,C.R.Journal of the AmericanChemical Society2004,126,15046.
(16)Sletten,E.M.;Bertozzi,C.R.Accounts of chemical research2011,44,666.
(17)Karver,M.R.;Weissleder,R.;Hilderbrand,S.A.Angewandte Chemie2012,51, 920.
(18)Devaraj,N.K.;Hilderbrand,S.;Upadhyay,R.;Mazitschek,R.;Weissleder,R.Angew Chem Int Ed Engl2010,49,2869.
(19)Fekner,T.;Li,X.;Lee,M.M.;Chan,M.K.Angew Chem Int Ed Engl2009,48,1633.
(20)Nguyen,D.P.;Garcia Alai,M.M.;Kapadnis,P.B.;Neumann,H.;Chin,J.W. JAm Chem Soc2009,131,14194.
(21)Nguyen,D.P.;Lusic,H.;Neumann,H.;Kapadnis,P.B.;Deiters,A.;Chin,J.W.J Am Chem Soc2009,131,8720.
(22)Nguyen,D.P.;Elliott,T.;Holt,M.;Muir,T.W.;Chin,J.W.J Am ChemSoc2011,133,11418.
(23)Neumann,H.;Peak-Chew,S.Y.;Chin,J.W.Nat Chem Biol2008,4,232.
(24)Polycarpo,C.R.;Herring,S.;Berube,A.;Wood,J.L.;Soll,D.;Ambrogelly,A.FEBS Lett2006,580,6695.
(25)Li,X.;Fekner,T.;Ottesen,J.J.;Chan,M.K.Angew Chem Int Ed Engl2009,48, 9184.
(26)Wang,Y.S.;Fang,X.;Wallace,A.L.;Wu,B.;Liu,W.R.Journal of theAmerican Chemical Society2012,134,2950.
(27)Mukai,T.;Kobayashi,T.;Hino,N.;Yanagisawa,T.;Sakamoto,K.;Yokoyama,S.Biochem Biophys Res Commun2008,371,818.
(28)Hancock,S.M.;Uprety,R.;Deiters,A.;Chin,J.W.J Am Chem Soc2010,132,14819.
(29)Greiss,S.;Chin,J.W.J Am Chem Soc2011.
(30)Lin,S.X.;Zhang,Z.R.;Xu,H.;Li,L.;Chen,S.;Li,J.;Hao,Z.Y.;Chen,P.R.Journal of the American Chemical Society2011,133,20581.
(31)Gautier,A.;Nguyen,D.P.;Lusic,H.;An,W.;Deiters,A.;Chin,J.W.J AmChem Soc2010,132,4086.
(32)Virdee,S.;Kapadnis,P.B.;Elliott,T.;Lang,K.;Madrzak,J.;Nguyen,D.P.;Riechmann,L.;Chin,J.W.Journal of the American Chemical Society2011,133,10708.
上述说明书中所提及的所有出版物通过引用并入本文。本发明的所述方面和实施方式的各种改进和变型对本领域技术人员而言是显而易见的,并不脱离本发明的范围。尽管本发明已经结合具体的优选实施方式进行了描述,但应当理解,如权利要求所保护的本发明不应限制于这样的具体实施方式。事实上,用于实施本发明的所述方式的各种改进对本领域技术人员而言是显而易见的,其均在下述权利要求的范围之内。
序列表
<110> 医药研究委员会
<120>整合包含BCN基团的氨基酸到多肽中的方法
<130> P3889WO
<140> PCT/GB2013/051249
<141> 2013-05-15
<160> 18
<170> SIPOSequenceListing 1.0
<210> 1
<211> 419
<212> PRT
<213> 巴氏甲烷八叠球菌(Methanosarcina barkeri)
<400> 1
Met Asp Lys Lys Pro Leu Asp Val Leu Ile Ser Ala Thr Gly Leu Trp
1 5 10 15
Met Ser Arg Thr Gly Thr Leu His Lys Ile Lys His Tyr Glu Val Ser
20 25 30
Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val
35 40 45
Asn Asn Ser Arg Ser Cys Arg Thr Ala Arg Ala Phe Arg His His Lys
50 55 60
Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Asp Glu Asp Ile Asn
65 70 75 80
Asn Phe Leu Thr Arg Ser Thr Glu Gly Lys Thr Ser Val Lys Val Lys
85 90 95
Val Val Ser Ala Pro Lys Val Lys Lys Ala Met Pro Lys Ser Val Ser
100 105 110
Arg Ala Pro Lys Pro Leu Glu Asn Pro Val Ser Ala Lys Ala Ser Thr
115 120 125
Asp Thr Ser Arg Ser Val Pro Ser Pro Ala Lys Ser Thr Pro Asn Ser
130 135 140
Pro Val Pro Thr Ser Ala Pro Ala Pro Ser Leu Thr Arg Ser Gln Leu
145 150 155 160
Asp Arg Val Glu Ala Leu Leu Ser Pro Glu Asp Lys Ile Ser Leu Asn
165 170 175
Ile Ala Lys Pro Phe Arg Glu Leu Glu Ser Glu Leu Val Thr Arg Arg
180 185 190
Lys Asn Asp Phe Gln Arg Leu Tyr Thr Asn Asp Arg Glu Asp Tyr Leu
195 200 205
Gly Lys Leu Glu Arg Asp Ile Thr Lys Phe Phe Val Asp Arg Asp Phe
210 215 220
Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Ala Glu Tyr Val Glu Arg
225 230 235 240
Met Gly Ile Asn Asn Asp Thr Glu Leu Ser Lys Gln Ile Phe Arg Val
245 250 255
Asp Lys Asn Leu Cys Leu Arg Pro Met Leu Ala Pro Thr Leu Tyr Asn
260 265 270
Tyr Leu Arg Lys Leu Asp Arg Ile Leu Pro Asp Pro Ile Lys Ile Phe
275 280 285
Glu Val Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys Glu His Leu
290 295 300
Glu Glu Phe Thr Met Val Asn Phe Cys Gln Met Gly Ser Gly Cys Thr
305 310 315 320
Arg Glu Asn Leu Glu Ser Leu Ile Lys Glu Phe Leu Asp Tyr Leu Glu
325 330 335
Ile Asp Phe Glu Ile Val Gly Asp Ser Cys Met Val Tyr Gly Asp Thr
340 345 350
Leu Asp Ile Met His Gly Asp Leu Glu Leu Ser Ser Ala Val Val Gly
355 360 365
Pro Val Pro Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro Trp Ile Gly
370 375 380
Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Met His Gly Phe Lys
385 390 395 400
Asn Ile Lys Arg Ala Ser Arg Ser Glu Ser Tyr Tyr Asn Gly Ile Ser
405 410 415
Thr Asn Leu
<210> 2
<211> 419
<212> PRT
<213> 巴氏甲烷八叠球菌(Methanosarcina barkeri)
<400> 2
Met Asp Lys Lys Pro Leu Asp Val Leu Ile Ser Ala Thr Gly Leu Trp
1 5 10 15
Met Ser Arg Thr Gly Thr Leu His Lys Ile Lys His His Glu Val Ser
20 25 30
Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val
35 40 45
Asn Asn Ser Arg Ser Cys Arg Thr Ala Arg Ala Phe Arg His His Lys
50 55 60
Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Asp Glu Asp Ile Asn
65 70 75 80
Asn Phe Leu Thr Arg Ser Thr Glu Ser Lys Asn Ser Val Lys Val Arg
85 90 95
Val Val Ser Ala Pro Lys Val Lys Lys Ala Met Pro Lys Ser Val Ser
100 105 110
Arg Ala Pro Lys Pro Leu Glu Asn Ser Val Ser Ala Lys Ala Ser Thr
115 120 125
Asn Thr Ser Arg Ser Val Pro Ser Pro Ala Lys Ser Thr Pro Asn Ser
130 135 140
Ser Val Pro Ala Ser Ala Pro Ala Pro Ser Leu Thr Arg Ser Gln Leu
145 150 155 160
Asp Arg Val Glu Ala Leu Leu Ser Pro Glu Asp Lys Ile Ser Leu Asn
165 170 175
Met Ala Lys Pro Phe Arg Glu Leu Glu Pro Glu Leu Val Thr Arg Arg
180 185 190
Lys Asn Asp Phe Gln Arg Leu Tyr Thr Asn Asp Arg Glu Asp Tyr Leu
195 200 205
Gly Lys Leu Glu Arg Asp Ile Thr Lys Phe Phe Val Asp Arg Gly Phe
210 215 220
Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Ala Glu Tyr Val Glu Arg
225 230 235 240
Met Gly Ile Asn Asn Asp Thr Glu Leu Ser Lys Gln Ile Phe Arg Val
245 250 255
Asp Lys Asn Leu Cys Leu Arg Pro Met Leu Ala Pro Thr Leu Tyr Asn
260 265 270
Tyr Leu Arg Lys Leu Asp Arg Ile Leu Pro Gly Pro Ile Lys Ile Phe
275 280 285
Glu Val Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys Glu His Leu
290 295 300
Glu Glu Phe Thr Met Val Asn Phe Cys Gln Met Gly Ser Gly Cys Thr
305 310 315 320
Arg Glu Asn Leu Glu Ala Leu Ile Lys Glu Phe Leu Asp Tyr Leu Glu
325 330 335
Ile Asp Phe Glu Ile Val Gly Asp Ser Cys Met Val Tyr Gly Asp Thr
340 345 350
Leu Asp Ile Met His Gly Asp Leu Glu Leu Ser Ser Ala Val Val Gly
355 360 365
Pro Val Ser Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro Trp Ile Gly
370 375 380
Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Met His Gly Phe Lys
385 390 395 400
Asn Ile Lys Arg Ala Ser Arg Ser Glu Ser Tyr Tyr Asn Gly Ile Ser
405 410 415
Thr Asn Leu
<210> 3
<211> 419
<212> PRT
<213> 巴氏甲烷八叠球菌(Methanosarcina barkeri)
<400> 3
Met Asp Lys Lys Pro Leu Asp Val Leu Ile Ser Ala Thr Gly Leu Trp
1 5 10 15
Met Ser Arg Thr Gly Thr Leu His Lys Ile Lys His Tyr Glu Val Ser
20 25 30
Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val
35 40 45
Asn Asn Ser Arg Ser Cys Arg Thr Ala Arg Ala Phe Arg His His Lys
50 55 60
Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Asp Glu Asp Ile Asn
65 70 75 80
Asn Phe Leu Thr Arg Ser Thr Glu Gly Lys Thr Ser Val Lys Val Lys
85 90 95
Val Val Ser Ala Pro Lys Val Lys Lys Ala Met Pro Lys Ser Val Ser
100 105 110
Arg Ala Pro Lys Pro Leu Glu Asn Pro Val Ser Ala Lys Ala Ser Thr
115 120 125
Asp Thr Ser Arg Ser Val Pro Ser Pro Ala Lys Ser Thr Pro Asn Ser
130 135 140
Pro Val Pro Thr Ser Ala Pro Ala Pro Ser Leu Thr Arg Ser Gln Leu
145 150 155 160
Asp Arg Val Glu Ala Leu Leu Ser Pro Glu Asp Lys Ile Ser Leu Asn
165 170 175
Ile Ala Lys Pro Phe Arg Glu Leu Glu Ser Glu Leu Val Thr Arg Arg
180 185 190
Lys Asn Asp Phe Gln Arg Leu Tyr Thr Asn Asp Arg Glu Asp Tyr Leu
195 200 205
Gly Lys Leu Glu Arg Asp Ile Thr Lys Phe Phe Val Asp Arg Asp Phe
210 215 220
Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Ala Glu Tyr Val Glu Arg
225 230 235 240
Met Gly Ile Asn Asn Asp Thr Glu Leu Ser Lys Gln Ile Phe Arg Val
245 250 255
Asp Lys Asn Leu Cys Leu Arg Pro Met Leu Ala Pro Thr Leu Tyr Asn
260 265 270
Tyr Leu Arg Lys Leu Asp Arg Ile Leu Pro Asp Pro Ile Lys Ile Phe
275 280 285
Glu Val Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys Glu His Leu
290 295 300
Glu Glu Phe Thr Met Val Asn Phe Cys Gln Met Gly Ser Gly Cys Thr
305 310 315 320
Arg Glu Asn Leu Glu Ser Leu Ile Lys Glu Phe Leu Asp Tyr Leu Glu
325 330 335
Ile Asp Phe Glu Ile Val Gly Asp Ser Cys Met Val Tyr Gly Asp Thr
340 345 350
Leu Asp Ile Met His Gly Asp Leu Glu Leu Ser Ser Ala Val Val Gly
355 360 365
Pro Val Pro Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro Trp Ile Gly
370 375 380
Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Met His Gly Phe Lys
385 390 395 400
Asn Ile Lys Arg Ala Ser Arg Ser Glu Ser Tyr Tyr Asn Gly Ile Ser
405 410 415
Thr Asn Leu
<210> 4
<211> 454
<212> PRT
<213> 马氏甲烷八叠球菌(Methanosarcina mazeii)
<400> 4
Met Asp Lys Lys Pro Leu Asn Thr Leu Ile Ser Ala Thr Gly Leu Trp
1 5 10 15
Met Ser Arg Thr Gly Thr Ile His Lys Ile Lys His His Glu Val Ser
20 25 30
Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val
35 40 45
Asn Asn Ser Arg Ser Ser Arg Thr Ala Arg Ala Leu Arg His His Lys
50 55 60
Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Asp Glu Asp Leu Asn
65 70 75 80
Lys Phe Leu Thr Lys Ala Asn Glu Asp Gln Thr Ser Val Lys Val Lys
85 90 95
Val Val Ser Ala Pro Thr Arg Thr Lys Lys Ala Met Pro Lys Ser Val
100 105 110
Ala Arg Ala Pro Lys Pro Leu Glu Asn Thr Glu Ala Ala Gln Ala Gln
115 120 125
Pro Ser Gly Ser Lys Phe Ser Pro Ala Ile Pro Val Ser Thr Gln Glu
130 135 140
Ser Val Ser Val Pro Ala Ser Val Ser Thr Ser Ile Ser Ser Ile Ser
145 150 155 160
Thr Gly Ala Thr Ala Ser Ala Leu Val Lys Gly Asn Thr Asn Pro Ile
165 170 175
Thr Ser Met Ser Ala Pro Val Gln Ala Ser Ala Pro Ala Leu Thr Lys
180 185 190
Ser Gln Thr Asp Arg Leu Glu Val Leu Leu Asn Pro Lys Asp Glu Ile
195 200 205
Ser Leu Asn Ser Gly Lys Pro Phe Arg Glu Leu Glu Ser Glu Leu Leu
210 215 220
Ser Arg Arg Lys Lys Asp Leu Gln Gln Ile Tyr Ala Glu Glu Arg Glu
225 230 235 240
Asn Tyr Leu Gly Lys Leu Glu Arg Glu Ile Thr Arg Phe Phe Val Asp
245 250 255
Arg Gly Phe Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Leu Glu Tyr
260 265 270
Ile Glu Arg Met Gly Ile Asp Asn Asp Thr Glu Leu Ser Lys Gln Ile
275 280 285
Phe Arg Val Asp Lys Asn Phe Cys Leu Arg Pro Met Leu Ala Pro Asn
290 295 300
Leu Tyr Asn Tyr Leu Arg Lys Leu Asp Arg Ala Leu Pro Asp Pro Ile
305 310 315 320
Lys Ile Phe Glu Ile Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys
325 330 335
Glu His Leu Glu Glu Phe Thr Met Leu Asn Phe Cys Gln Met Gly Ser
340 345 350
Gly Cys Thr Arg Glu Asn Leu Glu Ser Ile Ile Thr Asp Phe Leu Asn
355 360 365
His Leu Gly Ile Asp Phe Lys Ile Val Gly Asp Ser Cys Met Val Tyr
370 375 380
Gly Asp Thr Leu Asp Val Met His Gly Asp Leu Glu Leu Ser Ser Ala
385 390 395 400
Val Val Gly Pro Ile Pro Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro
405 410 415
Trp Ile Gly Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Lys His
420 425 430
Asp Phe Lys Asn Ile Lys Arg Ala Ala Arg Ser Glu Ser Tyr Tyr Asn
435 440 445
Gly Ile Ser Thr Asn Leu
450
<210> 5
<211> 443
<212> PRT
<213> 嗜乙酸甲烷八叠球菌(Methanosarcina acetivorans)
<400> 5
Met Asp Lys Lys Pro Leu Asp Thr Leu Ile Ser Ala Thr Gly Leu Trp
1 5 10 15
Met Ser Arg Thr Gly Met Ile His Lys Ile Lys His His Glu Val Ser
20 25 30
Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Glu Arg Leu Val Val
35 40 45
Asn Asn Ser Arg Ser Ser Arg Thr Ala Arg Ala Leu Arg His His Lys
50 55 60
Tyr Arg Lys Thr Cys Arg His Cys Arg Val Ser Asp Glu Asp Ile Asn
65 70 75 80
Asn Phe Leu Thr Lys Thr Ser Glu Glu Lys Thr Thr Val Lys Val Lys
85 90 95
Val Val Ser Ala Pro Arg Val Arg Lys Ala Met Pro Lys Ser Val Ala
100 105 110
Arg Ala Pro Lys Pro Leu Glu Ala Thr Ala Gln Val Pro Leu Ser Gly
115 120 125
Ser Lys Pro Ala Pro Ala Thr Pro Val Ser Ala Pro Ala Gln Ala Pro
130 135 140
Ala Pro Ser Thr Gly Ser Ala Ser Ala Thr Ser Ala Ser Ala Gln Arg
145 150 155 160
Met Ala Asn Ser Ala Ala Ala Pro Ala Ala Pro Val Pro Thr Ser Ala
165 170 175
Pro Ala Leu Thr Lys Gly Gln Leu Asp Arg Leu Glu Gly Leu Leu Ser
180 185 190
Pro Lys Asp Glu Ile Ser Leu Asp Ser Glu Lys Pro Phe Arg Glu Leu
195 200 205
Glu Ser Glu Leu Leu Ser Arg Arg Lys Lys Asp Leu Lys Arg Ile Tyr
210 215 220
Ala Glu Glu Arg Glu Asn Tyr Leu Gly Lys Leu Glu Arg Glu Ile Thr
225 230 235 240
Lys Phe Phe Val Asp Arg Gly Phe Leu Glu Ile Lys Ser Pro Ile Leu
245 250 255
Ile Pro Ala Glu Tyr Val Glu Arg Met Gly Ile Asn Ser Asp Thr Glu
260 265 270
Leu Ser Lys Gln Val Phe Arg Ile Asp Lys Asn Phe Cys Leu Arg Pro
275 280 285
Met Leu Ala Pro Asn Leu Tyr Asn Tyr Leu Arg Lys Leu Asp Arg Ala
290 295 300
Leu Pro Asp Pro Ile Lys Ile Phe Glu Ile Gly Pro Cys Tyr Arg Lys
305 310 315 320
Glu Ser Asp Gly Lys Glu His Leu Glu Glu Phe Thr Met Leu Asn Phe
325 330 335
Cys Gln Met Gly Ser Gly Cys Thr Arg Glu Asn Leu Glu Ala Ile Ile
340 345 350
Thr Glu Phe Leu Asn His Leu Gly Ile Asp Phe Glu Ile Ile Gly Asp
355 360 365
Ser Cys Met Val Tyr Gly Asn Thr Leu Asp Val Met His Asp Asp Leu
370 375 380
Glu Leu Ser Ser Ala Val Val Gly Pro Val Pro Leu Asp Arg Glu Trp
385 390 395 400
Gly Ile Asp Lys Pro Trp Ile Gly Ala Gly Phe Gly Leu Glu Arg Leu
405 410 415
Leu Lys Val Met His Gly Phe Lys Asn Ile Lys Arg Ala Ala Arg Ser
420 425 430
Glu Ser Tyr Tyr Asn Gly Ile Ser Thr Asn Leu
435 440
<210> 6
<211> 478
<212> PRT
<213> 嗜热甲烷八叠球菌(Methanosarcina thermophila)
<400> 6
Met Asp Lys Lys Pro Leu Asn Thr Leu Ile Ser Ala Thr Gly Leu Trp
1 5 10 15
Met Ser Arg Thr Gly Lys Leu His Lys Ile Arg His His Glu Val Ser
20 25 30
Lys Arg Lys Ile Tyr Ile Glu Met Glu Cys Gly Glu Arg Leu Val Val
35 40 45
Asn Asn Ser Arg Ser Cys Arg Ala Ala Arg Ala Leu Arg His His Lys
50 55 60
Tyr Arg Lys Ile Cys Lys His Cys Arg Val Ser Asp Glu Asp Leu Asn
65 70 75 80
Lys Phe Leu Thr Arg Thr Asn Glu Asp Lys Ser Asn Ala Lys Val Thr
85 90 95
Val Val Ser Ala Pro Lys Ile Arg Lys Val Met Pro Lys Ser Val Ala
100 105 110
Arg Thr Pro Lys Pro Leu Glu Asn Thr Ala Pro Val Gln Thr Leu Pro
115 120 125
Ser Glu Ser Gln Pro Ala Pro Thr Thr Pro Ile Ser Ala Ser Thr Thr
130 135 140
Ala Pro Ala Ser Thr Ser Thr Thr Ala Pro Ala Pro Ala Ser Thr Thr
145 150 155 160
Ala Pro Ala Pro Ala Ser Thr Thr Ala Pro Ala Ser Ala Ser Thr Thr
165 170 175
Ile Ser Thr Ser Ala Met Pro Ala Ser Thr Ser Ala Gln Gly Thr Thr
180 185 190
Lys Phe Asn Tyr Ile Ser Gly Gly Phe Pro Arg Pro Ile Pro Val Gln
195 200 205
Ala Ser Ala Pro Ala Leu Thr Lys Ser Gln Ile Asp Arg Leu Gln Gly
210 215 220
Leu Leu Ser Pro Lys Asp Glu Ile Ser Leu Asp Ser Gly Thr Pro Phe
225 230 235 240
Arg Lys Leu Glu Ser Glu Leu Leu Ser Arg Arg Arg Lys Asp Leu Lys
245 250 255
Gln Ile Tyr Ala Glu Glu Arg Glu His Tyr Leu Gly Lys Leu Glu Arg
260 265 270
Glu Ile Thr Lys Phe Phe Val Asp Arg Gly Phe Leu Glu Ile Lys Ser
275 280 285
Pro Ile Leu Ile Pro Met Glu Tyr Ile Glu Arg Met Gly Ile Asp Asn
290 295 300
Asp Lys Glu Leu Ser Lys Gln Ile Phe Arg Val Asp Asn Asn Phe Cys
305 310 315 320
Leu Arg Pro Met Leu Ala Pro Asn Leu Tyr Asn Tyr Leu Arg Lys Leu
325 330 335
Asn Arg Ala Leu Pro Asp Pro Ile Lys Ile Phe Glu Ile Gly Pro Cys
340 345 350
Tyr Arg Lys Glu Ser Asp Gly Lys Glu His Leu Glu Glu Phe Thr Met
355 360 365
Leu Asn Phe Cys Gln Met Gly Ser Gly Cys Thr Arg Glu Asn Leu Glu
370 375 380
Ala Ile Ile Lys Asp Phe Leu Asp Tyr Leu Gly Ile Asp Phe Glu Ile
385 390 395 400
Val Gly Asp Ser Cys Met Val Tyr Gly Asp Thr Leu Asp Val Met His
405 410 415
Gly Asp Leu Glu Leu Ser Ser Ala Val Val Gly Pro Val Pro Met Asp
420 425 430
Arg Asp Trp Gly Ile Asn Lys Pro Trp Ile Gly Ala Gly Phe Gly Leu
435 440 445
Glu Arg Leu Leu Lys Val Met His Asn Phe Lys Asn Ile Lys Arg Ala
450 455 460
Ser Arg Ser Glu Ser Tyr Tyr Asn Gly Ile Ser Thr Asn Leu
465 470 475
<210> 7
<211> 416
<212> PRT
<213> 布氏甲烷八叠球菌(Methanococcoides burtonii)
<400> 7
Met Glu Lys Gln Leu Leu Asp Val Leu Val Glu Leu Asn Gly Val Trp
1 5 10 15
Leu Ser Arg Ser Gly Leu Leu His Gly Ile Arg Asn Phe Glu Ile Thr
20 25 30
Thr Lys His Ile His Ile Glu Thr Asp Cys Gly Ala Arg Phe Thr Val
35 40 45
Arg Asn Ser Arg Ser Ser Arg Ser Ala Arg Ser Leu Arg His Asn Lys
50 55 60
Tyr Arg Lys Pro Cys Lys Arg Cys Arg Pro Ala Asp Glu Gln Ile Asp
65 70 75 80
Arg Phe Val Lys Lys Thr Phe Lys Glu Lys Arg Gln Thr Val Ser Val
85 90 95
Phe Ser Ser Pro Lys Lys His Val Pro Lys Lys Pro Lys Val Ala Val
100 105 110
Ile Lys Ser Phe Ser Ile Ser Thr Pro Ser Pro Lys Glu Ala Ser Val
115 120 125
Ser Asn Ser Ile Pro Thr Pro Ser Ile Ser Val Val Lys Asp Glu Val
130 135 140
Lys Val Pro Glu Val Lys Tyr Thr Pro Ser Gln Ile Glu Arg Leu Lys
145 150 155 160
Thr Leu Met Ser Pro Asp Asp Lys Ile Pro Ile Gln Asp Glu Leu Pro
165 170 175
Glu Phe Lys Val Leu Glu Lys Glu Leu Ile Gln Arg Arg Arg Asp Asp
180 185 190
Leu Lys Lys Met Tyr Glu Glu Asp Arg Glu Asp Arg Leu Gly Lys Leu
195 200 205
Glu Arg Asp Ile Thr Glu Phe Phe Val Asp Arg Gly Phe Leu Glu Ile
210 215 220
Lys Ser Pro Ile Met Ile Pro Phe Glu Tyr Ile Glu Arg Met Gly Ile
225 230 235 240
Asp Lys Asp Asp His Leu Asn Lys Gln Ile Phe Arg Val Asp Glu Ser
245 250 255
Met Cys Leu Arg Pro Met Leu Ala Pro Cys Leu Tyr Asn Tyr Leu Arg
260 265 270
Lys Leu Asp Lys Val Leu Pro Asp Pro Ile Arg Ile Phe Glu Ile Gly
275 280 285
Pro Cys Tyr Arg Lys Glu Ser Asp Gly Ser Ser His Leu Glu Glu Phe
290 295 300
Thr Met Val Asn Phe Cys Gln Met Gly Ser Gly Cys Thr Arg Glu Asn
305 310 315 320
Met Glu Ala Leu Ile Asp Glu Phe Leu Glu His Leu Gly Ile Glu Tyr
325 330 335
Glu Ile Glu Ala Asp Asn Cys Met Val Tyr Gly Asp Thr Ile Asp Ile
340 345 350
Met His Gly Asp Leu Glu Leu Ser Ser Ala Val Val Gly Pro Ile Pro
355 360 365
Leu Asp Arg Glu Trp Gly Val Asn Lys Pro Trp Met Gly Ala Gly Phe
370 375 380
Gly Leu Glu Arg Leu Leu Lys Val Arg His Asn Tyr Thr Asn Ile Arg
385 390 395 400
Arg Ala Ser Arg Ser Glu Leu Tyr Tyr Asn Gly Ile Asn Thr Asn Leu
405 410 415
<210> 8
<211> 279
<212> PRT
<213> 哥本哈根脱亚硫酸菌(Desulfitobacterium hafniense)
<400> 8
Met Ser Ser Phe Trp Thr Lys Val Gln Tyr Gln Arg Leu Lys Glu Leu
1 5 10 15
Asn Ala Ser Gly Glu Gln Leu Glu Met Gly Phe Ser Asp Ala Leu Ser
20 25 30
Arg Asp Arg Ala Phe Gln Gly Ile Glu His Gln Leu Met Ser Gln Gly
35 40 45
Lys Arg His Leu Glu Gln Leu Arg Thr Val Lys His Arg Pro Ala Leu
50 55 60
Leu Glu Leu Glu Glu Gly Leu Ala Lys Ala Leu His Gln Gln Gly Phe
65 70 75 80
Val Gln Val Val Thr Pro Thr Ile Ile Thr Lys Ser Ala Leu Ala Lys
85 90 95
Met Thr Ile Gly Glu Asp His Pro Leu Phe Ser Gln Val Phe Trp Leu
100 105 110
Asp Gly Lys Lys Cys Leu Arg Pro Met Leu Ala Pro Asn Leu Tyr Thr
115 120 125
Leu Trp Arg Glu Leu Glu Arg Leu Trp Asp Lys Pro Ile Arg Ile Phe
130 135 140
Glu Ile Gly Thr Cys Tyr Arg Lys Glu Ser Gln Gly Ala Gln His Leu
145 150 155 160
Asn Glu Phe Thr Met Leu Asn Leu Thr Glu Leu Gly Thr Pro Leu Glu
165 170 175
Glu Arg His Gln Arg Leu Glu Asp Met Ala Arg Trp Val Leu Glu Ala
180 185 190
Ala Gly Ile Arg Glu Phe Glu Leu Val Thr Glu Ser Ser Val Val Tyr
195 200 205
Gly Asp Thr Val Asp Val Met Lys Gly Asp Leu Glu Leu Ala Ser Gly
210 215 220
Ala Met Gly Pro His Phe Leu Asp Glu Lys Trp Glu Ile Val Asp Pro
225 230 235 240
Trp Val Gly Leu Gly Phe Gly Leu Glu Arg Leu Leu Met Ile Arg Glu
245 250 255
Gly Thr Gln His Val Gln Ser Met Ala Arg Ser Leu Ser Tyr Leu Asp
260 265 270
Gly Val Arg Leu Asn Ile Asn
275
<210> 9
<211> 312
<212> PRT
<213> 哥本哈根脱亚硫酸菌(Desulfitobacterium hafniense)
<400> 9
Met Asp Arg Ile Asp His Thr Asp Ser Lys Phe Val Gln Ala Gly Glu
1 5 10 15
Thr Pro Val Leu Pro Ala Thr Phe Met Phe Leu Thr Arg Arg Asp Pro
20 25 30
Pro Leu Ser Ser Phe Trp Thr Lys Val Gln Tyr Gln Arg Leu Lys Glu
35 40 45
Leu Asn Ala Ser Gly Glu Gln Leu Glu Met Gly Phe Ser Asp Ala Leu
50 55 60
Ser Arg Asp Arg Ala Phe Gln Gly Ile Glu His Gln Leu Met Ser Gln
65 70 75 80
Gly Lys Arg His Leu Glu Gln Leu Arg Thr Val Lys His Arg Pro Ala
85 90 95
Leu Leu Glu Leu Glu Glu Gly Leu Ala Lys Ala Leu His Gln Gln Gly
100 105 110
Phe Val Gln Val Val Thr Pro Thr Ile Ile Thr Lys Ser Ala Leu Ala
115 120 125
Lys Met Thr Ile Gly Glu Asp His Pro Leu Phe Ser Gln Val Phe Trp
130 135 140
Leu Asp Gly Lys Lys Cys Leu Arg Pro Met Leu Ala Pro Asn Leu Tyr
145 150 155 160
Thr Leu Trp Arg Glu Leu Glu Arg Leu Trp Asp Lys Pro Ile Arg Ile
165 170 175
Phe Glu Ile Gly Thr Cys Tyr Arg Lys Glu Ser Gln Gly Ala Gln His
180 185 190
Leu Asn Glu Phe Thr Met Leu Asn Leu Thr Glu Leu Gly Thr Pro Leu
195 200 205
Glu Glu Arg His Gln Arg Leu Glu Asp Met Ala Arg Trp Val Leu Glu
210 215 220
Ala Ala Gly Ile Arg Glu Phe Glu Leu Val Thr Glu Ser Ser Val Val
225 230 235 240
Tyr Gly Asp Thr Val Asp Val Met Lys Gly Asp Leu Glu Leu Ala Ser
245 250 255
Gly Ala Met Gly Pro His Phe Leu Asp Glu Lys Trp Glu Ile Val Asp
260 265 270
Pro Trp Val Gly Leu Gly Phe Gly Leu Glu Arg Leu Leu Met Ile Arg
275 280 285
Glu Gly Thr Gln His Val Gln Ser Met Ala Arg Ser Leu Ser Tyr Leu
290 295 300
Asp Gly Val Arg Leu Asn Ile Asn
305 310
<210> 10
<211> 288
<212> PRT
<213> 哥本哈根脱亚硫酸菌(Desulfitobacterium hafniense)
<400> 10
Met Phe Leu Thr Arg Arg Asp Pro Pro Leu Ser Ser Phe Trp Thr Lys
1 5 10 15
Val Gln Tyr Gln Arg Leu Lys Glu Leu Asn Ala Ser Gly Glu Gln Leu
20 25 30
Glu Met Gly Phe Ser Asp Ala Leu Ser Arg Asp Arg Ala Phe Gln Gly
35 40 45
Ile Glu His Gln Leu Met Ser Gln Gly Lys Arg His Leu Glu Gln Leu
50 55 60
Arg Thr Val Lys His Arg Pro Ala Leu Leu Glu Leu Glu Glu Lys Leu
65 70 75 80
Ala Lys Ala Leu His Gln Gln Gly Phe Val Gln Val Val Thr Pro Thr
85 90 95
Ile Ile Thr Lys Ser Ala Leu Ala Lys Met Thr Ile Gly Glu Asp His
100 105 110
Pro Leu Phe Ser Gln Val Phe Trp Leu Asp Gly Lys Lys Cys Leu Arg
115 120 125
Pro Met Leu Ala Pro Asn Leu Tyr Thr Leu Trp Arg Glu Leu Glu Arg
130 135 140
Leu Trp Asp Lys Pro Ile Arg Ile Phe Glu Ile Gly Thr Cys Tyr Arg
145 150 155 160
Lys Glu Ser Gln Gly Ala Gln His Leu Asn Glu Phe Thr Met Leu Asn
165 170 175
Leu Thr Glu Leu Gly Thr Pro Leu Glu Glu Arg His Gln Arg Leu Glu
180 185 190
Asp Met Ala Arg Trp Val Leu Glu Ala Ala Gly Ile Arg Glu Phe Glu
195 200 205
Leu Val Thr Glu Ser Ser Val Val Tyr Gly Asp Thr Val Asp Val Met
210 215 220
Lys Gly Asp Leu Glu Leu Ala Ser Gly Ala Met Gly Pro His Phe Leu
225 230 235 240
Asp Glu Lys Trp Glu Ile Phe Asp Pro Trp Val Gly Leu Gly Phe Gly
245 250 255
Leu Glu Arg Leu Leu Met Ile Arg Glu Gly Thr Gln His Val Gln Ser
260 265 270
Met Ala Arg Ser Leu Ser Tyr Leu Asp Gly Val Arg Leu Asn Ile Asn
275 280 285
<210> 11
<211> 277
<212> PRT
<213> 醋酸氧化脱硫肠状菌(Desulfotomaculum acetoxidans)
<400> 11
Met Ser Phe Leu Trp Thr Val Ser Gln Gln Lys Arg Leu Ser Glu Leu
1 5 10 15
Asn Ala Ser Glu Glu Glu Lys Asn Met Ser Phe Ser Ser Thr Ser Asp
20 25 30
Arg Glu Ala Ala Tyr Lys Arg Val Glu Met Arg Leu Ile Asn Glu Ser
35 40 45
Lys Gln Arg Leu Asn Lys Leu Arg His Glu Thr Arg Pro Ala Ile Cys
50 55 60
Ala Leu Glu Asn Arg Leu Ala Ala Ala Leu Arg Gly Ala Gly Phe Val
65 70 75 80
Gln Val Ala Thr Pro Val Ile Leu Ser Lys Lys Leu Leu Gly Lys Met
85 90 95
Thr Ile Thr Asp Glu His Ala Leu Phe Ser Gln Val Phe Trp Ile Glu
100 105 110
Glu Asn Lys Cys Leu Arg Pro Met Leu Ala Pro Asn Leu Tyr Tyr Ile
115 120 125
Leu Lys Asp Leu Leu Arg Leu Trp Glu Lys Pro Val Arg Ile Phe Glu
130 135 140
Ile Gly Ser Cys Phe Arg Lys Glu Ser Gln Gly Ser Asn His Leu Asn
145 150 155 160
Glu Phe Thr Met Leu Asn Leu Val Glu Trp Gly Leu Pro Glu Glu Gln
165 170 175
Arg Gln Lys Arg Ile Ser Glu Leu Ala Lys Leu Val Met Asp Glu Thr
180 185 190
Gly Ile Asp Glu Tyr His Leu Glu His Ala Glu Ser Val Val Tyr Gly
195 200 205
Glu Thr Val Asp Val Met His Arg Asp Ile Glu Leu Gly Ser Gly Ala
210 215 220
Leu Gly Pro His Phe Leu Asp Gly Arg Trp Gly Val Val Gly Pro Trp
225 230 235 240
Val Gly Ile Gly Phe Gly Leu Glu Arg Leu Leu Met Val Glu Gln Gly
245 250 255
Gly Gln Asn Val Arg Ser Met Gly Lys Ser Leu Thr Tyr Leu Asp Gly
260 265 270
Val Arg Leu Asn Ile
275
<210> 12
<211> 419
<212> PRT
<213> 巴氏甲烷八叠球菌(Methanosarcina barkeri)
<400> 12
Met Asp Lys Lys Pro Leu Asp Val Leu Ile Ser Ala Thr Gly Leu Trp
1 5 10 15
Met Ser Arg Thr Gly Thr Leu His Lys Ile Lys His Tyr Glu Val Ser
20 25 30
Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val
35 40 45
Asn Asn Ser Arg Ser Cys Arg Thr Ala Arg Ala Phe Arg His His Lys
50 55 60
Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Asp Glu Asp Ile Asn
65 70 75 80
Asn Phe Leu Thr Arg Ser Thr Glu Gly Lys Thr Ser Val Lys Val Lys
85 90 95
Val Val Ser Ala Pro Lys Val Lys Lys Ala Met Pro Lys Ser Val Ser
100 105 110
Arg Ala Pro Lys Pro Leu Glu Asn Pro Val Ser Ala Lys Ala Ser Thr
115 120 125
Asp Thr Ser Arg Ser Val Pro Ser Pro Ala Lys Ser Thr Pro Asn Ser
130 135 140
Pro Val Pro Thr Ser Ala Pro Ala Pro Ser Leu Thr Arg Ser Gln Leu
145 150 155 160
Asp Arg Val Glu Ala Leu Leu Ser Pro Glu Asp Lys Ile Ser Leu Asn
165 170 175
Ile Ala Lys Pro Phe Arg Glu Leu Glu Ser Glu Leu Val Thr Arg Arg
180 185 190
Lys Asn Asp Phe Gln Arg Leu Tyr Thr Asn Asp Arg Glu Asp Tyr Leu
195 200 205
Gly Lys Leu Glu Arg Asp Ile Thr Lys Phe Phe Val Asp Arg Asp Phe
210 215 220
Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Ala Glu Tyr Val Glu Arg
225 230 235 240
Met Gly Ile Asn Asn Asp Thr Glu Leu Ser Lys Gln Ile Phe Arg Val
245 250 255
Asp Lys Asn Leu Cys Leu Arg Pro Met Leu Ala Pro Thr Leu Tyr Asn
260 265 270
Tyr Leu Arg Lys Leu Asp Arg Ile Leu Pro Asp Pro Ile Lys Ile Phe
275 280 285
Glu Val Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys Glu His Leu
290 295 300
Glu Glu Phe Thr Met Val Asn Phe Cys Gln Met Gly Ser Gly Cys Thr
305 310 315 320
Arg Glu Asn Leu Glu Ser Leu Ile Lys Glu Phe Leu Asp Tyr Leu Glu
325 330 335
Ile Asp Phe Glu Ile Val Gly Asp Ser Cys Met Val Tyr Gly Asp Thr
340 345 350
Leu Asp Ile Met His Gly Asp Leu Glu Leu Ser Ser Ala Val Val Gly
355 360 365
Pro Val Pro Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro Trp Ile Gly
370 375 380
Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Met His Gly Phe Lys
385 390 395 400
Asn Ile Lys Arg Ala Ser Arg Ser Glu Ser Tyr Tyr Asn Gly Ile Ser
405 410 415
Thr Asn Leu
<210> 13
<211> 419
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> MbPylS
<400> 13
Met Asp Lys Lys Pro Leu Asp Val Leu Ile Ser Ala Thr Gly Leu Trp
1 5 10 15
Met Ser Arg Thr Gly Thr Leu His Lys Ile Lys His His Glu Val Ser
20 25 30
Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val
35 40 45
Asn Asn Ser Arg Ser Cys Arg Thr Ala Arg Ala Phe Arg His His Lys
50 55 60
Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Asp Glu Asp Ile Asn
65 70 75 80
Asn Phe Leu Thr Arg Ser Thr Glu Ser Lys Asn Ser Val Lys Val Arg
85 90 95
Val Val Ser Ala Pro Lys Val Lys Lys Ala Met Pro Lys Ser Val Ser
100 105 110
Arg Ala Pro Lys Pro Leu Glu Asn Ser Val Ser Ala Lys Ala Ser Thr
115 120 125
Asn Thr Ser Arg Ser Val Pro Ser Pro Ala Lys Ser Thr Pro Asn Ser
130 135 140
Ser Val Pro Ala Ser Ala Pro Ala Pro Ser Leu Thr Arg Ser Gln Leu
145 150 155 160
Asp Arg Val Glu Ala Leu Leu Ser Pro Glu Asp Lys Ile Ser Leu Asn
165 170 175
Met Ala Lys Pro Phe Arg Glu Leu Glu Pro Glu Leu Val Thr Arg Arg
180 185 190
Lys Asn Asp Phe Gln Arg Leu Tyr Thr Asn Asp Arg Glu Asp Tyr Leu
195 200 205
Gly Lys Leu Glu Arg Asp Ile Thr Lys Phe Phe Val Asp Arg Gly Phe
210 215 220
Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Ala Glu Tyr Val Glu Arg
225 230 235 240
Met Gly Ile Asn Asn Asp Thr Glu Leu Ser Lys Gln Ile Phe Arg Val
245 250 255
Asp Lys Asn Leu Cys Leu Arg Pro Met Leu Ala Pro Thr Leu Tyr Asn
260 265 270
Tyr Leu Arg Lys Leu Asp Arg Ile Leu Pro Gly Pro Ile Lys Ile Phe
275 280 285
Glu Val Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys Glu His Leu
290 295 300
Glu Glu Phe Thr Met Val Asn Phe Cys Gln Met Gly Ser Gly Cys Thr
305 310 315 320
Arg Glu Asn Leu Glu Ala Leu Ile Lys Glu Phe Leu Asp Tyr Leu Glu
325 330 335
Ile Asp Phe Glu Ile Val Gly Asp Ser Cys Met Val Tyr Gly Asp Thr
340 345 350
Leu Asp Ile Met His Gly Asp Leu Glu Leu Ser Ser Ala Val Val Gly
355 360 365
Pro Val Ser Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro Trp Ile Gly
370 375 380
Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Met His Gly Phe Lys
385 390 395 400
Asn Ile Lys Arg Ala Ser Arg Ser Glu Ser Tyr Tyr Asn Gly Ile Ser
405 410 415
Thr Asn Leu
<210> 14
<211> 419
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> Mb_AckRS
<400> 14
Met Asp Lys Lys Pro Leu Asp Val Leu Ile Ser Ala Thr Gly Leu Trp
1 5 10 15
Met Ser Arg Thr Gly Thr Leu His Lys Ile Lys His His Glu Val Ser
20 25 30
Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val
35 40 45
Asn Asn Ser Arg Ser Cys Arg Thr Ala Arg Ala Phe Arg His His Lys
50 55 60
Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Gly Glu Asp Ile Asn
65 70 75 80
Asn Phe Leu Thr Arg Ser Thr Glu Ser Lys Asn Ser Val Lys Val Arg
85 90 95
Val Val Ser Ala Pro Lys Val Lys Lys Ala Met Pro Lys Ser Val Ser
100 105 110
Arg Ala Pro Lys Pro Leu Glu Asn Ser Val Ser Ala Lys Ala Ser Thr
115 120 125
Asn Thr Ser Arg Ser Val Pro Ser Pro Ala Lys Ser Thr Pro Asn Ser
130 135 140
Ser Val Pro Ala Ser Ala Pro Ala Pro Ser Leu Thr Arg Ser Gln Leu
145 150 155 160
Asp Arg Val Glu Ala Leu Leu Ser Pro Glu Asp Lys Ile Ser Leu Asn
165 170 175
Met Ala Lys Pro Phe Arg Glu Leu Glu Pro Glu Leu Val Thr Arg Arg
180 185 190
Lys Asn Asp Phe Gln Arg Leu Tyr Thr Asn Asp Arg Glu Asp Tyr Leu
195 200 205
Gly Lys Leu Glu Arg Asp Ile Thr Lys Phe Phe Val Asp Arg Gly Phe
210 215 220
Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Ala Glu Tyr Val Glu Arg
225 230 235 240
Met Gly Ile Asn Asn Asp Thr Glu Leu Ser Lys Gln Ile Phe Arg Val
245 250 255
Asp Lys Asn Leu Cys Leu Arg Pro Met Val Ala Pro Thr Ile Phe Asn
260 265 270
Tyr Ala Arg Lys Leu Asp Arg Ile Leu Pro Gly Pro Ile Lys Ile Phe
275 280 285
Glu Val Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys Glu His Leu
290 295 300
Glu Glu Phe Thr Met Val Asn Phe Phe Gln Met Gly Ser Gly Cys Thr
305 310 315 320
Arg Glu Asn Leu Glu Ala Leu Ile Lys Glu Phe Leu Asp Tyr Leu Glu
325 330 335
Ile Asp Phe Glu Ile Val Gly Asp Ser Cys Met Val Tyr Gly Asp Thr
340 345 350
Leu Asp Ile Met His Gly Asp Leu Glu Leu Ser Ser Ala Val Val Gly
355 360 365
Pro Val Ser Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro Trp Ile Gly
370 375 380
Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Met His Gly Phe Lys
385 390 395 400
Asn Ile Lys Arg Ala Ser Arg Ser Glu Ser Tyr Tyr Asn Gly Ile Ser
405 410 415
Thr Asn Leu
<210> 15
<211> 419
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> MbPCKRS
<400> 15
Met Asp Lys Lys Pro Leu Asp Val Leu Ile Ser Ala Thr Gly Leu Trp
1 5 10 15
Met Ser Arg Thr Gly Thr Leu His Lys Ile Lys His His Glu Val Ser
20 25 30
Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val
35 40 45
Asn Asn Ser Arg Ser Cys Arg Thr Ala Arg Ala Phe Arg His His Lys
50 55 60
Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Asp Glu Asp Ile Asn
65 70 75 80
Asn Phe Leu Thr Arg Ser Thr Glu Ser Lys Asn Ser Val Lys Val Arg
85 90 95
Val Val Ser Ala Pro Lys Val Lys Lys Ala Met Pro Lys Ser Val Ser
100 105 110
Arg Ala Pro Lys Pro Leu Glu Asn Ser Val Ser Ala Lys Ala Ser Thr
115 120 125
Asn Thr Ser Arg Ser Val Pro Ser Pro Ala Lys Ser Thr Pro Asn Ser
130 135 140
Ser Val Pro Ala Ser Ala Pro Ala Pro Ser Leu Thr Arg Ser Gln Leu
145 150 155 160
Asp Arg Val Glu Ala Leu Leu Ser Pro Glu Asp Lys Ile Ser Leu Asn
165 170 175
Met Ala Lys Pro Phe Arg Glu Leu Glu Pro Glu Leu Val Thr Arg Arg
180 185 190
Lys Asn Asp Phe Gln Arg Leu Tyr Thr Asn Asp Arg Glu Asp Tyr Leu
195 200 205
Gly Lys Leu Glu Arg Asp Ile Thr Lys Phe Phe Val Asp Arg Gly Phe
210 215 220
Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Ala Glu Tyr Val Glu Arg
225 230 235 240
Phe Gly Ile Asn Asn Asp Thr Glu Leu Ser Lys Gln Ile Phe Arg Val
245 250 255
Asp Lys Asn Leu Cys Leu Arg Pro Met Leu Ser Pro Thr Leu Cys Asn
260 265 270
Tyr Met Arg Lys Leu Asp Arg Ile Leu Pro Gly Pro Ile Lys Ile Phe
275 280 285
Glu Val Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys Glu His Leu
290 295 300
Glu Glu Phe Thr Met Val Asn Phe Cys Gln Met Gly Ser Gly Cys Thr
305 310 315 320
Arg Glu Asn Leu Glu Ala Leu Ile Lys Glu Phe Leu Asp Tyr Leu Glu
325 330 335
Ile Asp Phe Glu Ile Val Gly Asp Ser Cys Met Val Tyr Gly Asp Thr
340 345 350
Leu Asp Ile Met His Gly Asp Leu Glu Leu Ser Ser Ala Val Val Gly
355 360 365
Pro Val Ser Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro Trp Ile Gly
370 375 380
Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Met His Gly Phe Lys
385 390 395 400
Asn Ile Lys Arg Ala Ser Arg Ser Glu Ser Tyr Tyr Asn Gly Ile Ser
405 410 415
Thr Asn Leu
<210> 16
<211> 454
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> MmPylS
<400> 16
Met Asp Lys Lys Pro Leu Asn Thr Leu Ile Ser Ala Thr Gly Leu Trp
1 5 10 15
Met Ser Arg Thr Gly Thr Ile His Lys Ile Lys His His Glu Val Ser
20 25 30
Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val
35 40 45
Asn Asn Ser Arg Ser Ser Arg Thr Ala Arg Ala Leu Arg His His Lys
50 55 60
Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Asp Glu Asp Leu Asn
65 70 75 80
Lys Phe Leu Thr Lys Ala Asn Glu Asp Gln Thr Ser Val Lys Val Lys
85 90 95
Val Val Ser Ala Pro Thr Arg Thr Lys Lys Ala Met Pro Lys Ser Val
100 105 110
Ala Arg Ala Pro Lys Pro Leu Glu Asn Thr Glu Ala Ala Gln Ala Gln
115 120 125
Pro Ser Gly Ser Lys Phe Ser Pro Ala Ile Pro Val Ser Thr Gln Glu
130 135 140
Ser Val Ser Val Pro Ala Ser Val Ser Thr Ser Ile Ser Ser Ile Ser
145 150 155 160
Thr Gly Ala Thr Ala Ser Ala Leu Val Lys Gly Asn Thr Asn Pro Ile
165 170 175
Thr Ser Met Ser Ala Pro Val Gln Ala Ser Ala Pro Ala Leu Thr Lys
180 185 190
Ser Gln Thr Asp Arg Leu Glu Val Leu Leu Asn Pro Lys Asp Glu Ile
195 200 205
Ser Leu Asn Ser Gly Lys Pro Phe Arg Glu Leu Glu Ser Glu Leu Leu
210 215 220
Ser Arg Arg Lys Lys Asp Leu Gln Gln Ile Tyr Ala Glu Glu Arg Glu
225 230 235 240
Asn Tyr Leu Gly Lys Leu Glu Arg Glu Ile Thr Arg Phe Phe Val Asp
245 250 255
Arg Gly Phe Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Leu Glu Tyr
260 265 270
Ile Glu Arg Met Gly Ile Asp Asn Asp Thr Glu Leu Ser Lys Gln Ile
275 280 285
Phe Arg Val Asp Lys Asn Phe Cys Leu Arg Pro Met Leu Ala Pro Asn
290 295 300
Leu Tyr Asn Tyr Leu Arg Lys Leu Asp Arg Ala Leu Pro Asp Pro Ile
305 310 315 320
Lys Ile Phe Glu Ile Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys
325 330 335
Glu His Leu Glu Glu Phe Thr Met Leu Asn Phe Cys Gln Met Gly Ser
340 345 350
Gly Cys Thr Arg Glu Asn Leu Glu Ser Ile Ile Thr Asp Phe Leu Asn
355 360 365
His Leu Gly Ile Asp Phe Lys Ile Val Gly Asp Ser Cys Met Val Tyr
370 375 380
Gly Asp Thr Leu Asp Val Met His Gly Asp Leu Glu Leu Ser Ser Ala
385 390 395 400
Val Val Gly Pro Ile Pro Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro
405 410 415
Trp Ile Gly Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Lys His
420 425 430
Asp Phe Lys Asn Ile Lys Arg Ala Ala Arg Ser Glu Ser Tyr Tyr Asn
435 440 445
Gly Ile Ser Thr Asn Leu
450
<210> 17
<211> 454
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> Mm_AcKRS
<400> 17
Met Asp Lys Lys Pro Leu Asn Thr Leu Ile Ser Ala Thr Gly Leu Trp
1 5 10 15
Met Ser Arg Thr Gly Thr Ile His Lys Ile Lys His His Glu Val Ser
20 25 30
Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val
35 40 45
Asn Asn Ser Arg Ser Ser Arg Thr Ala Arg Ala Leu Arg His His Lys
50 55 60
Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Asp Glu Asp Leu Asn
65 70 75 80
Lys Phe Leu Thr Lys Ala Asn Glu Asp Gln Thr Ser Val Lys Val Lys
85 90 95
Val Val Ser Ala Pro Thr Arg Thr Lys Lys Ala Met Pro Lys Ser Val
100 105 110
Ala Arg Ala Pro Lys Pro Leu Glu Asn Thr Glu Ala Ala Gln Ala Gln
115 120 125
Pro Ser Gly Ser Lys Phe Ser Pro Ala Ile Pro Val Ser Thr Gln Glu
130 135 140
Ser Val Ser Val Pro Ala Ser Val Ser Thr Ser Ile Ser Ser Ile Ser
145 150 155 160
Thr Gly Ala Thr Ala Ser Ala Leu Val Lys Gly Asn Thr Asn Pro Ile
165 170 175
Thr Ser Met Ser Ala Pro Val Gln Ala Ser Ala Pro Ala Leu Thr Lys
180 185 190
Ser Gln Thr Asp Arg Leu Glu Val Leu Leu Asn Pro Lys Asp Glu Ile
195 200 205
Ser Leu Asn Ser Gly Lys Pro Phe Arg Glu Leu Glu Ser Glu Leu Leu
210 215 220
Ser Arg Arg Lys Lys Asp Leu Gln Gln Ile Tyr Ala Glu Glu Arg Glu
225 230 235 240
Asn Tyr Leu Gly Lys Leu Glu Arg Glu Ile Thr Arg Phe Phe Val Asp
245 250 255
Arg Gly Phe Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Leu Glu Tyr
260 265 270
Ile Glu Arg Met Gly Ile Asp Asn Asp Thr Glu Leu Ser Lys Gln Ile
275 280 285
Phe Arg Val Asp Lys Asn Phe Cys Leu Arg Pro Met Val Ala Pro Asn
290 295 300
Ile Phe Asn Tyr Ala Arg Lys Leu Asp Arg Ala Leu Pro Asp Pro Ile
305 310 315 320
Lys Ile Phe Glu Ile Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys
325 330 335
Glu His Leu Glu Glu Phe Thr Met Leu Asn Phe Phe Gln Met Gly Ser
340 345 350
Gly Cys Thr Arg Glu Asn Leu Glu Ser Ile Ile Thr Asp Phe Leu Asn
355 360 365
His Leu Gly Ile Asp Phe Lys Ile Val Gly Asp Ser Cys Met Val Tyr
370 375 380
Gly Asp Thr Leu Asp Val Met His Gly Asp Leu Glu Leu Ser Ser Ala
385 390 395 400
Val Val Gly Pro Ile Pro Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro
405 410 415
Trp Ile Gly Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Lys His
420 425 430
Asp Phe Lys Asn Ile Lys Arg Ala Ala Arg Ser Glu Ser Tyr Tyr Asn
435 440 445
Gly Ile Ser Thr Asn Leu
450
<210> 18
<211> 454
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> MmPCKRS
<400> 18
Met Asp Lys Lys Pro Leu Asn Thr Leu Ile Ser Ala Thr Gly Leu Trp
1 5 10 15
Met Ser Arg Thr Gly Thr Ile His Lys Ile Lys His His Glu Val Ser
20 25 30
Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val
35 40 45
Asn Asn Ser Arg Ser Ser Arg Thr Ala Arg Ala Leu Arg His His Lys
50 55 60
Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Asp Glu Asp Leu Asn
65 70 75 80
Lys Phe Leu Thr Lys Ala Asn Glu Asp Gln Thr Ser Val Lys Val Lys
85 90 95
Val Val Ser Ala Pro Thr Arg Thr Lys Lys Ala Met Pro Lys Ser Val
100 105 110
Ala Arg Ala Pro Lys Pro Leu Glu Asn Thr Glu Ala Ala Gln Ala Gln
115 120 125
Pro Ser Gly Ser Lys Phe Ser Pro Ala Ile Pro Val Ser Thr Gln Glu
130 135 140
Ser Val Ser Val Pro Ala Ser Val Ser Thr Ser Ile Ser Ser Ile Ser
145 150 155 160
Thr Gly Ala Thr Ala Ser Ala Leu Val Lys Gly Asn Thr Asn Pro Ile
165 170 175
Thr Ser Met Ser Ala Pro Val Gln Ala Ser Ala Pro Ala Leu Thr Lys
180 185 190
Ser Gln Thr Asp Arg Leu Glu Val Leu Leu Asn Pro Lys Asp Glu Ile
195 200 205
Ser Leu Asn Ser Gly Lys Pro Phe Arg Glu Leu Glu Ser Glu Leu Leu
210 215 220
Ser Arg Arg Lys Lys Asp Leu Gln Gln Ile Tyr Ala Glu Glu Arg Glu
225 230 235 240
Asn Tyr Leu Gly Lys Leu Glu Arg Glu Ile Thr Arg Phe Phe Val Asp
245 250 255
Arg Gly Phe Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Leu Glu Tyr
260 265 270
Ile Glu Arg Phe Gly Ile Asp Asn Asp Thr Glu Leu Ser Lys Gln Ile
275 280 285
Phe Arg Val Asp Lys Asn Phe Cys Leu Arg Pro Met Leu Ser Pro Asn
290 295 300
Leu Cys Asn Tyr Met Arg Lys Leu Asp Arg Ala Leu Pro Asp Pro Ile
305 310 315 320
Lys Ile Phe Glu Ile Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys
325 330 335
Glu His Leu Glu Glu Phe Thr Met Leu Asn Phe Cys Gln Met Gly Ser
340 345 350
Gly Cys Thr Arg Glu Asn Leu Glu Ser Ile Ile Thr Asp Phe Leu Asn
355 360 365
His Leu Gly Ile Asp Phe Lys Ile Val Gly Asp Ser Cys Met Val Tyr
370 375 380
Gly Asp Thr Leu Asp Val Met His Gly Asp Leu Glu Leu Ser Ser Ala
385 390 395 400
Val Val Gly Pro Ile Pro Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro
405 410 415
Trp Ile Gly Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Lys His
420 425 430
Asp Phe Lys Asn Ile Lys Arg Ala Ala Arg Ser Glu Ser Tyr Tyr Asn
435 440 445
Gly Ile Ser Thr Asn Leu
450

Claims (10)

1.一种均质的重组多肽,其包含遗传整合的具有双环[6.1.0]壬-4-炔-9-基甲醇(BCN)基团的氨基酸,其中所述BCN基团作为赖氨酸的残基存在,并且其中所述BCN基团连接到四嗪基团上。
2.一种制备包含BCN基团的多肽的方法,所述方法包括将包含BCN基团的氨基酸遗传整合到多肽中,其中制备多肽包括:
(i)提供编码多肽的核酸,该核酸包含编码具有BCN基团的氨基酸的正交密码子;
(ⅱ)在识别所述正交密码子的正交tRNA合成酶/tRNA对存在的情况下翻译所述核酸,并将所述具有BCN基团的氨基酸整合到多肽链上,
其中所述tRNA合成酶包括具有突变Y271M、L274G和C313A(BCNRS)的PylRS合成酶,且其中所述包含BCN基团的氨基酸是BCN赖氨酸。
3.如权利要求2所述的方法,其中所述正交密码子包括琥珀密码子(TAG),所述tRNA包括MbtRNACUA,所述具有BCN基团的氨基酸包含双环[6.1.0]壬-4-炔-9-基甲醇(BCN)赖氨酸和所述tRNA合成酶包含具有突变Y271M、L274G和C313A(BCNRS)的PylRS合成酶。
4.如权利要求1所述的均质的重组多肽或如权利要求2或3所述的方法,其中所述具有BCN基团的氨基酸整合于对应于野生型多肽上的赖氨酸残基的位置上。
5.如权利要求1所述的均质的重组多肽,其中所述四嗪基团进一步连接到荧光团上。
6.如权利要求5所述的多肽,其中所述荧光团包括荧光素、四甲基罗丹明(TAMRA)或硼吡咯甲烷(BODIPY)。
7.一种制备包括四嗪基团的多肽的方法,所述方法包括提供包含遗传整合的具有双环[6.1.0]壬-4-炔-9-基甲醇(BCN)基团的氨基酸的均质的重组多肽,将所述多肽与四嗪化合物接触,并孵育以允许通过反电子需求Diels-Alder环加成反应将四嗪连接到BCN基团上。
8.如权利要求7所述的方法,其中四嗪选自图1的6至17。
9.如权利要求7所述的方法,其中四嗪选自图1的6、7、8和9,并且反应的准一级速率常数为至少80M-1s-1
10.如权利要求7至9任一项所述的方法,其中所述四嗪化合物是选自由图1的11和17组成的组的四嗪化合物。
CN201810228028.9A 2012-05-18 2013-05-15 整合包含bcn基团的氨基酸到多肽中的方法 Active CN108410827B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810228028.9A CN108410827B (zh) 2012-05-18 2013-05-15 整合包含bcn基团的氨基酸到多肽中的方法

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
GB1208875.3 2012-05-18
GBGB1208875.3A GB201208875D0 (en) 2012-05-18 2012-05-18 Methods
GB1210303.2 2012-06-08
GBGB1210303.2A GB201210303D0 (en) 2012-06-08 2012-06-08 Polypeptides and methods
CN201810228028.9A CN108410827B (zh) 2012-05-18 2013-05-15 整合包含bcn基团的氨基酸到多肽中的方法
CN201380037290.0A CN104718285A (zh) 2012-05-18 2013-05-15 利用编码包含BCN基团的氨基酸的正交密码子和正交PylRS合成酶将包含BCN基团的氨基酸整合到多肽中的方法
PCT/GB2013/051249 WO2013171485A1 (en) 2012-05-18 2013-05-15 Methods of incorporating an amino acid comprising a bcn group into a polypeptide using an orthogonal codon encoding it and an orthorgonal pylrs synthase.

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201380037290.0A Division CN104718285A (zh) 2012-05-18 2013-05-15 利用编码包含BCN基团的氨基酸的正交密码子和正交PylRS合成酶将包含BCN基团的氨基酸整合到多肽中的方法

Publications (2)

Publication Number Publication Date
CN108410827A true CN108410827A (zh) 2018-08-17
CN108410827B CN108410827B (zh) 2023-05-09

Family

ID=48748281

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201810228028.9A Active CN108410827B (zh) 2012-05-18 2013-05-15 整合包含bcn基团的氨基酸到多肽中的方法
CN201380037290.0A Pending CN104718285A (zh) 2012-05-18 2013-05-15 利用编码包含BCN基团的氨基酸的正交密码子和正交PylRS合成酶将包含BCN基团的氨基酸整合到多肽中的方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201380037290.0A Pending CN104718285A (zh) 2012-05-18 2013-05-15 利用编码包含BCN基团的氨基酸的正交密码子和正交PylRS合成酶将包含BCN基团的氨基酸整合到多肽中的方法

Country Status (9)

Country Link
US (3) US20150148525A1 (zh)
EP (1) EP2852664B1 (zh)
JP (1) JP6343604B2 (zh)
CN (2) CN108410827B (zh)
BR (1) BR112014028588B1 (zh)
CA (1) CA2873793C (zh)
HK (1) HK1208704A1 (zh)
IN (1) IN2014DN09922A (zh)
WO (1) WO2013171485A1 (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013171485A1 (en) * 2012-05-18 2013-11-21 Medical Research Council Methods of incorporating an amino acid comprising a bcn group into a polypeptide using an orthogonal codon encoding it and an orthorgonal pylrs synthase.
CN104744293B (zh) * 2013-12-31 2016-08-17 深圳先进技术研究院 胆碱类似物及其制备方法和应用、由染料分子标记的四嗪探针及其制备方法和应用
GB2528227A (en) 2014-03-14 2016-01-20 Medical Res Council Cyclopropene amino acids and methods
EP3971169A1 (en) * 2015-04-30 2022-03-23 Oregon State University Method for producing, in a cell, a protein or a polypeptide comprising a tetrazine amino acid
WO2017030156A1 (ja) * 2015-08-19 2017-02-23 国立研究開発法人理化学研究所 非天然アミノ酸導入抗体
CN105254655B (zh) * 2015-11-20 2017-03-22 江汉大学 一种基于bodipy的荧光氨基酸及其合成方法与应用
CN106565762B (zh) * 2016-11-17 2018-10-23 陕西师范大学 一种原位产生近红外荧光的bodipy类染料及其制备和应用
CN110891611B (zh) 2017-03-22 2024-03-29 阿森迪斯制药公司 水凝胶交联透明质酸前药组合物和方法
JOP20190245A1 (ar) 2017-04-20 2019-10-15 Novartis Ag أنظمة توصيل إطلاق مستدام تتضمن روابط بلا أثر لنقطة الربط
US11560384B2 (en) 2017-05-04 2023-01-24 University Of Utah Research Foundation Benzonorbornadiene derivatives and reactions thereof
AR111963A1 (es) * 2017-05-26 2019-09-04 Univ California Método y moléculas
AR116566A1 (es) 2018-10-03 2021-05-19 Novartis Ag Administración sostenida de polipéptidos similares a la angiopoyetina 3
CN111849929B (zh) * 2019-04-30 2021-05-11 苏州鲲鹏生物技术有限公司 高效引入赖氨酸衍生物的氨酰基—tRNA合成酶
IL267744A (en) * 2019-06-30 2019-08-29 Nat Inst Biotechnology Negev Ltd Labelling molecules and methods of use thereof
CN115701451B (zh) * 2021-08-02 2023-08-01 宁波鲲鹏生物科技有限公司 高效引入赖氨酸衍生物的氨酰基-tRNA合成酶及其应用

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040029129A1 (en) * 2001-10-25 2004-02-12 Liangsu Wang Identification of essential genes in microorganisms
CN101076598A (zh) * 2003-07-07 2007-11-21 斯克利普斯研究院 正交赖氨酰-tRNA和氨酰-tRNA合成酶对的组合物及其应用
CN101952428A (zh) * 2007-09-20 2011-01-19 独立行政法人理化学研究所 突变体吡咯赖氨酰-tRNA合成酶以及使用该酶的非天然氨基酸整合蛋白质的制造方法
WO2011039519A2 (en) * 2009-10-01 2011-04-07 Medical Research Council (United Kingdom) ACETYL LYSINE INCORPORATION WITH tRNA SYNTHETASE
CN102414217A (zh) * 2009-02-25 2012-04-11 彼格泰格私人有限公司 用于检测基孔肯雅病毒的探针和引物
CN104718285A (zh) * 2012-05-18 2015-06-17 医药研究委员会 利用编码包含BCN基团的氨基酸的正交密码子和正交PylRS合成酶将包含BCN基团的氨基酸整合到多肽中的方法
WO2016154675A1 (en) * 2015-03-27 2016-10-06 The University Of Queensland Platform for non-natural amino acid incorporation into proteins
CN115485380A (zh) * 2020-02-21 2022-12-16 欧洲分子生物学实验室 用于正交用途的古细菌吡咯赖氨酰tRNA合成酶

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2527877A1 (en) 2003-06-18 2005-01-13 The Scripps Research Institute Unnatural reactive amino acid genetic code additions
CA2549830A1 (en) 2003-12-18 2006-01-05 The Scripps Research Institute Selective incorporation of 5-hyroxytryptophan into proteins in mammalian cells
JP2008513039A (ja) 2004-09-21 2008-05-01 ザ スクリップス リサーチ インスティテュート 真正細菌の蛋白質へのアルキニルアミノ酸のインビボ組込み
MX2007004892A (es) 2004-10-27 2007-08-16 Scripps Research Inst Componentes de traduccion ortogonales para la incorporacion in vivo de aminoacidos no naturales.
JP2007037445A (ja) 2005-08-02 2007-02-15 Institute Of Physical & Chemical Research tRNA合成方法、核酸、アミノアシルtRNA合成方法及び非天然型アミノ酸組み込み蛋白質の製造方法
WO2007090198A2 (en) 2006-02-01 2007-08-09 Encode Bio, Inc. Fluorescent assays using orthogonal trna - aminoacyl synthetase pairs
US20080096819A1 (en) 2006-05-02 2008-04-24 Allozyne, Inc. Amino acid substituted molecules
JP2010526091A (ja) 2007-04-30 2010-07-29 インテザイン テクノロジーズ, インコーポレイテッド 癌の処置のための生物学的な標的基の改変
GB0721291D0 (en) * 2007-10-30 2007-12-12 Medical Res Council Methods and compositions
GB2470770A (en) 2009-06-04 2010-12-08 Medical Res Council Incorporation of unnatural amino acids having an orthogonal functional group into polypeptides using orthogonal tRNA/tRNA synthetase pairs
GB0917240D0 (en) * 2009-10-01 2009-11-18 Medical Res Council Incorporation of methyl lysine into poiypeptide
EP2789622B1 (en) 2010-04-15 2017-03-01 MedImmune Limited Pyrrolobenzodiazepines used to treat proliferative diseases
EP3604264A1 (en) * 2010-04-27 2020-02-05 SynAffix B.V. Fused cyclooctyne compounds
US20120077186A1 (en) 2010-05-07 2012-03-29 Oregon Health & Science University Use of cysteine-derived suppressor trnas for non-native amino acid incorporation
WO2011156686A2 (en) 2010-06-11 2011-12-15 The Regents Of The University Of Colorado, A Body Corporate Method for synthesizing a cyclic multivalent peptide using a thiol-mediated reaction
EP3279211B1 (en) 2011-02-03 2020-04-29 Embl Unnatural amino acids comprising a norbornenyl group and uses thereof
GB201110815D0 (en) * 2011-06-24 2011-08-10 Medical Res Council Incorporation of subtituted lysines into polypeptides
US20130066063A1 (en) * 2011-09-09 2013-03-14 John Cooke Hodges Bicyclo[6.1.0]non-4-yne regents for chemical modification of oligonucleotides
GB201201100D0 (en) 2012-01-20 2012-03-07 Medical Res Council Polypeptides and methods
EP4074728A1 (en) 2012-08-31 2022-10-19 Sutro Biopharma, Inc. Modified peptides comprising an azido group
BR112015006368B1 (pt) 2012-09-24 2022-02-08 Medimmune Limited Processo para produção de linha celular eucariótica estável
GB2528227A (en) 2014-03-14 2016-01-20 Medical Res Council Cyclopropene amino acids and methods
GB201419109D0 (en) 2014-10-27 2014-12-10 Medical Res Council Incorporation of unnatural amino acids into proteins
GB201817444D0 (en) 2018-10-26 2018-12-12 Res & Innovation Uk Methods and compositions

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040029129A1 (en) * 2001-10-25 2004-02-12 Liangsu Wang Identification of essential genes in microorganisms
CN101076598A (zh) * 2003-07-07 2007-11-21 斯克利普斯研究院 正交赖氨酰-tRNA和氨酰-tRNA合成酶对的组合物及其应用
CN101952428A (zh) * 2007-09-20 2011-01-19 独立行政法人理化学研究所 突变体吡咯赖氨酰-tRNA合成酶以及使用该酶的非天然氨基酸整合蛋白质的制造方法
CN102414217A (zh) * 2009-02-25 2012-04-11 彼格泰格私人有限公司 用于检测基孔肯雅病毒的探针和引物
WO2011039519A2 (en) * 2009-10-01 2011-04-07 Medical Research Council (United Kingdom) ACETYL LYSINE INCORPORATION WITH tRNA SYNTHETASE
CN104718285A (zh) * 2012-05-18 2015-06-17 医药研究委员会 利用编码包含BCN基团的氨基酸的正交密码子和正交PylRS合成酶将包含BCN基团的氨基酸整合到多肽中的方法
WO2016154675A1 (en) * 2015-03-27 2016-10-06 The University Of Queensland Platform for non-natural amino acid incorporation into proteins
CN107614689A (zh) * 2015-03-27 2018-01-19 昆士兰大学 用于将非天然氨基酸并入蛋白质中的平台
CN115485380A (zh) * 2020-02-21 2022-12-16 欧洲分子生物学实验室 用于正交用途的古细菌吡咯赖氨酰tRNA合成酶

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
KATHRIN LANG等: "Genetically encoded norbornene directs site-specific cellular protein labelling via a rapid bioorthogonal reaction", 《NAT CHEM.》 *
WEIXUAN CHEN等: "Clicking 1,2,4,5-tetrazine and cyclooctynes with tunable reaction rates", 《CHEM. COMMUN.》 *

Also Published As

Publication number Publication date
US20200271658A1 (en) 2020-08-27
JP6343604B2 (ja) 2018-06-13
US20150148525A1 (en) 2015-05-28
US11732001B2 (en) 2023-08-22
HK1208704A1 (zh) 2016-03-11
CN108410827B (zh) 2023-05-09
WO2013171485A1 (en) 2013-11-21
CA2873793C (en) 2022-02-22
EP2852664A1 (en) 2015-04-01
EP2852664B1 (en) 2017-09-06
BR112014028588A2 (pt) 2017-06-27
BR112014028588B1 (pt) 2023-03-21
BR112014028588A8 (pt) 2021-06-29
IN2014DN09922A (zh) 2015-08-14
CA2873793A1 (en) 2013-11-21
JP2015523965A (ja) 2015-08-20
CN104718285A (zh) 2015-06-17
US20230340013A1 (en) 2023-10-26

Similar Documents

Publication Publication Date Title
CN108410827A (zh) 整合包含bcn基团的氨基酸到多肽中的方法
Peng et al. Site-specific bioorthogonal labeling for fluorescence imaging of intracellular proteins in living cells
CN104203971B (zh) 多肽和方法
Acosta-Ruiz et al. Branched photoswitchable tethered ligands enable ultra-efficient optical control and detection of G protein-coupled receptors in vivo
US20120270247A1 (en) Luminescence measurement method and luminescence measurement system
CN106905418A (zh) 一种组氨酸荧光探针及其制备方法和应用
Zhang et al. Synthesis and application of the blue fluorescent amino acid l-4-cyanotryptophan to assess peptide–membrane interactions
US8524447B2 (en) Fluorescently labeled fusion protein for assaying adenosine triphosphate
Tian et al. Micelle‐Enhanced Bioorthogonal Labeling of Genetically Encoded Azido Groups on the Lipid‐Embedded Surface of a GPCR
US8445291B2 (en) Method for detecting target substance, and tag, DNA, vector, probe and detection kit for use therewith
KR20160134669A (ko) 시클로프로펜 아미노산 및 방법
Teixeira et al. Modulation of the redox potential and electron/proton transfer mechanisms in the outer membrane cytochrome OmcF from Geobacter sulfurreducens
EP2436690B1 (en) Reversibly photoswitchable polypeptides
Thompson In Vivo Incorporation of 19 F-Tryptophan into JNK3 for 19 F NMR Spectroscopy of Binding Interactions
Brand Genetically encoded conformational probes for small GTPase activity
Michels Precision crosslinking and active-site modifications via site-specific protein engineering
Munoz-Robles et al. Irreversible light-activated SpyLigation mediates split-protein assembly in 4D
Cremonini Segmental labelling approaches applied to NMR studies of multidomain proteins in vitro and in-cell
Teruya DEVELOPMENT OF AFFINITY-BASED CHEMICAL PROBES FOR FLUORESCENCE DETECTION OF HUMAN CARBONIC ANHYDRASES
Miller et al. 6 Trimethoprim Derivatives for Labeling Dihydrofolate Reductase Fusion Proteins in Living Mammalian Cells
Gendreizig et al. Labeling of Fusion Proteins with Small Molecules in Vivo
TW201118169A (en) Mutant blue fluorescent protein and method of using the same for fluorescence resonance energy transfer and blue fluorescent fish

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20220216

Address after: Swindon

Applicant after: United Kingdom Research and Innovation

Address before: Wiltshire

Applicant before: MEDICAL RESEARCH COUNCIL

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant