CN113767111A - 以增强的速率与肽标签配偶体自发形成异肽键的多肽和其用途 - Google Patents

以增强的速率与肽标签配偶体自发形成异肽键的多肽和其用途 Download PDF

Info

Publication number
CN113767111A
CN113767111A CN202080033169.0A CN202080033169A CN113767111A CN 113767111 A CN113767111 A CN 113767111A CN 202080033169 A CN202080033169 A CN 202080033169A CN 113767111 A CN113767111 A CN 113767111A
Authority
CN
China
Prior art keywords
polypeptide
amino acid
seq
peptide
peptide tag
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080033169.0A
Other languages
English (en)
Inventor
马克·豪沃思
安东尼·基布尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oxford University Innovation Ltd
Original Assignee
Oxford University Innovation Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oxford University Innovation Ltd filed Critical Oxford University Innovation Ltd
Publication of CN113767111A publication Critical patent/CN113767111A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/315Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Streptococcus (G), e.g. Enterococci
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli

Abstract

本发明涉及一种形成两部分接头中的一个部分的多肽,其中所述多肽与肽标签,即所述两部分接头中的第二部分自发地形成异肽键。还提供了对所述多肽进行编码的核酸分子、包括所述核酸分子的载体以及包括所述载体和所述核酸分子的宿主细胞。还提供了一种试剂盒,所述试剂盒包括所述两部分接头(即肽标签和多肽结合配偶体)和/或核酸分子/载体。还提供了一种产生本发明的多肽(结合配偶体)的方法和所述多肽的用途。

Description

以增强的速率与肽标签配偶体自发形成异肽键的多肽和其 用途
本发明的工作依据欧盟第七框架计划(European Union's Seventh FrameworkProgramme,FP7/2007-2013)/ERC拨款协议第615945号已获得欧洲研究理事会(EuropeanResearch Council)的资助。
本发明涉及一种形成两部分接头中的一个部分的多肽,其中所述多肽(蛋白质)与肽标签,即所述两部分接头中的第二部分自发地形成异肽键。具体地,所述两部分接头可以被视为肽标签和多肽结合配偶体同源对,所述肽标签和所述多肽结合配偶体同源对当在允许本发明的多肽与肽标签之间自发形成异肽键的条件下接触时可以通过共价键缀合。还提供了对所述多肽进行编码的核酸分子、包括所述核酸分子的载体以及包括所述载体和所述核酸分子的宿主细胞。还提供了一种试剂盒,所述试剂盒包括所述两部分接头(即肽标签和多肽结合配偶体)和/或核酸分子/载体。还提供了一种产生本发明的多肽(结合配偶体)的方法和所述多肽的用途。
细胞功能取决于大量可逆的非共价蛋白质-蛋白质相互作用,并且蛋白质在复合物中的精确布置影响并决定其功能。因此,对共价蛋白质-蛋白质相互作用进行工程化的能力可以为基础研究、合成生物学和生物技术带来一系列新机遇。具体地,两种或更多种蛋白质缀合以形成所谓的“融合蛋白”可以产生具有有用特性的分子。例如,使单一种类的蛋白质聚类通常会大大增强生物信号,例如疫苗上的重复抗原结构。使具有不同活性的蛋白聚类也可以产生活性提高的复合物,例如由酶作为通道的底物。
通常,共价蛋白质相互作用是通过二硫键介导的,但二硫化物是可逆的,不适用于减少细胞区室,并且可能干扰蛋白质折叠。肽标签是用于蛋白质分析和修饰的便捷工具,因为其大小较小最小化了对蛋白质功能的干扰。肽标签易于进行遗传编码,并且其大小较小减少了来自对其它相互作用、生物合成成本和免疫原性的引入的干扰的中断。然而,肽标签与其肽或多肽结合配偶体之间的相互作用很少具有高亲和力,这限制了其在稳定复合物形成中的效用。
已经有利地使用了能够自发地形成异肽键的蛋白质(所谓的“异肽蛋白”)来开发彼此共价结合并且提供可逆的相互作用的肽标签/多肽结合配偶体对(即两部分接头)(参见例如WO2011/098772、WO 2016/193746和WO 2018/197854,所述文献均通过引用在此并入)。在此方面,能够自发地形成异肽键的蛋白质可以表达为单独片段,以提供肽标签和所述肽标签的多肽结合配偶体,其中两个片段能够通过异肽键形成共价重组,由此将与肽标签和其多肽结合配偶体融合的分子或组分连接。由肽标签和其多肽结合配偶体形成的异肽键在非共价相互作用会迅速解离的条件下,例如在长时间段内(例如数周)、在高温下(到至少95℃)、在高的力下或在苛刻的化学处理的情况下(例如pH 2-11、有机溶剂、清洁剂或变性剂)是稳定的。
异肽键是形成在羧基/甲酰胺与氨基之间的酰胺键,其中羧基或氨基中的至少一个位于蛋白质主链(蛋白质的骨架)之外。此类键在典型的生物条件下是化学上不可逆的,并且其对大多数蛋白酶具有抗性。由于异肽键本质上是共价的,因此其会导致最强测量的蛋白质相互作用中的一些相互作用。
简而言之,两部分接头,即肽标签和其多肽结合配偶体(所谓的肽标签/结合配偶体对)可以衍生自能够自发地形成异肽键的蛋白质(异肽蛋白),其中蛋白质的结构域单独表达以产生包括涉及异肽键的残基之一(例如天门冬氨酸或天冬酰胺)的肽标签以及包括涉及异肽键的其它残基(例如,赖氨酸)和形成异肽键所需的至少一个其它残基(例如谷氨酸盐)的肽或多肽结合配偶体(或“捕捉剂”)。将肽标签和结合配偶体混合导致在标签与结合配偶体之间自发形成异肽键。由此,通过将肽标签和结合配偶体与不同的分子或组分,例如蛋白质单独融合,可能的是通过形成在肽标签与结合配偶体之间的异肽键将所述分子或所述组分共价连接在一起,即以在与肽标签和结合配偶体融合的分子或组分之间形成接头。
肽标签/结合配偶体对(两部分接头),被称为SpyTag/SpyCatcher,衍生自酿脓链球菌(Streptococcus pyogenes)FbaB蛋白的CnaB2结构域(Zakeri等人,2012《美国国家科学院院刊(Proc Natl Acad Sci USA)》109,E690-E697)并且用于多种应用,包含生物材料(Botyanszki等人,2015,《生物技术和生物工程(Biotechnology and bioengineering)》112,2016-2024;Chen等人,2014,《美国国家科学院院刊》108,11399-11404)、下一代测序(Stranges等人,2016,《美国国家科学院院刊》113,E6749-E6756)、酶稳定性(Schoene等人,2016,《科学报告(Scientific Reports)》6,21151)和疫苗开发(Brune等人,2016,《科学报告》6,19234);Thrane等人,2016,《纳米生物技术杂志(Journal of Nanobiotechnology)》14,30)。虽然在SpyTag与SpyCatcher之间形成异肽键的速度对于经纯化的组分是令人满意的,但速度在细胞表达水平上受到限制。因此,已经开发了SpyTag和SpyCatcher肽以及多肽SpyTag002和SpyCatcher002(Keeble等人,2017《德国应用化学国际版英文(Angew ChemInt Ed Engl.)》第56(52)卷:第16521-16525页)的反应速率提高的经修饰的版本(WO2018/197854,所述文献通过引用在此并入),所述经修饰的版本使得能够在低浓度下,特别是在细菌细胞表达水平下有效反应。然而,反应速率仍比扩散受控的蛋白质-蛋白质相互作用慢,其起始被视为105到106M-1s-1
尽管SpyTag/SpyCatcher技术的应用很多,但其应用主要在经纯化的蛋白质上或细菌细胞中(Keeble和Howarth,2019,《酶学方法(Methods Enzymol)》617,443-461;Banerjee和Howarth,2018,《生物技术当前述评(Curr Opin Biotechnol.)》51,16-23),其中很少涉及哺乳动物细胞。哺乳动物蛋白通常例如,由于存在翻译后修饰而对表达有严格的细胞类型要求并且通常仅以低水平进行表达。因此,需要反应速率在扩散受控的蛋白质-蛋白质相互作用的范围内的两部分肽接头以促进其在哺乳动物细胞中的效用。
本发明的发明人现已令人惊讶地确定,通过对SpyCatcher002多肽的氨基酸序列(SEQ ID NO:7)进行修饰(即突变),具体地通过在多肽的C末端端部处引入非保守取代,可以将SpyCatcher002多肽的反应速率提高另外的数量级(即在扩散受控的蛋白质-蛋白质相互作用的范围内)。因此,本发明的经修饰的SpyCatcher多肽(被称为SpyCatcher003)的反应速率比原始SpyCatcher多肽(SEQ ID NO:8)多于两个数量级。值得注意且出乎意料的是,导致反应速率提高的修饰不会不利地影响多肽(结合配偶体)的其它期望的性质,如热稳定性。
因此,有利地,本发明的突变体捕捉剂(SpyCatcher003,SEQ ID NO:1)可以与其同源肽标签,例如SpyTag003(即作为两部分接头)一起用于仅低浓度的肽和多肽结合配偶体例如在体内可用的设施内。本发明的突变体捕捉剂(多肽)也可以特别用于需要高灵敏度和/或速度的分析测定,例如其中使用肽标签(例如SpyTag003)作为表位标签的蛋白质印迹(Western blots)。本发明的突变体捕捉剂(多肽)的速率常数提高在标签和/或捕捉剂与可能减慢反应的分子或组分(例如大蛋白)融合的反应中以及在与标签和/或捕捉剂融合的分子或组分导致空间位阻的反应中,如在病毒样颗粒形成以用于疫苗组装的中也是有利的。此外,提高反应的速度所需的修饰不会影响与SpyCatcher相关联的其它有用性质,即热稳定性、在某个范围的pH值和温度下以及在各种缓冲液中的反应,包含在洗涤剂存在的情况下,以及在大肠杆菌(Escherichia coli)和哺乳动物细胞中的高效表达,如在哺乳动物细胞上的高效表面显示。
虽然不希望受理论束缚,但假设对SpyCatcher002多肽(SEQ ID NO:7)进行的产生SpyCatcher003多肽(SEQ ID NO:1)的五个修饰起到稳定多肽(例如使多肽中的环刚性化)并改善与SpyTag肽,具体地SpyTag003(SEQ ID NO:3)的静电相互作用的作用。设想了本发明的多肽(肽标签结合配偶体)(SEQ ID NO:1,即SpyCatcher多肽变体)中相对于SpyCatcher002的氨基酸序列(SEQ ID NO:7)的每个取代可以单独提高多肽(肽标签结合配偶体)的活性。
此外,鉴于可以在不显著影响其活性的情况下在其N末端和C末端处截短SpyCatcher多肽的事实(Li等人,2014,《分子生物学杂志(J Mol Biol.)》;426(2):309–317),设想了可以在不显著降低多肽的活性的情况下在N末端处和/或在C末端处截短本文例示的多肽(即SEQ ID NO:1)。具体地,SEQ ID NO:1可以在N末端处截短至多21个氨基酸(例如5个、10个、15个或20个氨基酸)并且可以在C末端处截短至多9个氨基酸(例如1个、2个、3个、4个或5个、6个、7个、8个或9个氨基酸),优选地截短至多5个氨基酸。在优选的实施例中,仅在N末端处截短本文列示的多肽(即SEQ ID NO:1)。
因此,在一个方面,本发明因此提供了一种多肽(肽标签结合配偶体),所述多肽包括:
i)如SEQ ID NO:1中所示的氨基酸序列;或
ii)(i)的一部分,包括如SEQ ID NO:2中所示的氨基酸序列;
iii)与SEQ ID NO:1中列示的序列具有至少80%序列同一性(例如,与SEQ ID NO:1中所示的序列至少85%、90%、95%、96%、97%、98%或99%相同)的氨基酸序列,其中所述氨基酸序列包括位于位置31处的赖氨酸、位于位置77处的谷氨酸以及以下中的一个或多个:
1)位于位子91处的谷氨酸;
2)位于位置103处的天冬氨酸;以及
3)位于位置108处的谷氨酸;
其中指定的氨基酸残基位于与SEQ ID NO:1中的位置等效的位置处;或者
iv)(iii)的一部分,包括与如SEQ ID NO:2中所示的序列具有至少80%序列同一性(例如,与SEQ ID NO:2中所示的序列至少85%、90%、95%、96%、97%、98%或99%相同)的氨基酸序列,其中所述氨基酸序列包括位于位置10处的赖氨酸、位于位置56处的谷氨酸以及以下一个或多个:
1)位于位置70处的谷氨酸;
2)位于位置82处的天冬氨酸;以及
3)位于位置87处的谷氨酸,
其中指定的氨基酸残基位于与SEQ ID NO:2中的位置等效的位置处,
并且其中所述多肽能够与包括如SEQ ID NO:3中所示的氨基酸序列的肽自发地形成异肽键,其中所述异肽键形成在位于SEQ ID NO:3的位置10处的天冬氨酸残基与位于SEQID NO:1的位置31或SEQ ID NO:2的位置10处的赖氨酸残基之间。
在本发明的一个优选实施例中,所述多肽包括:
i)如SEQ ID NO:1中所示的氨基酸序列;或
ii)(i)的一部分,包括如SEQ ID NO:2中所示的氨基酸序列;
iii)与SEQ ID NO:1中所示的序列具有至少80%序列同一性(例如,与如SEQ IDNO:1中所示的序列至少85%、90%、95%、96%、97%、98%或99%相同)的氨基酸序列,其中所述氨基酸序列包括位于位置31处的赖氨酸、位于位置77处的谷氨酸以及以下中的三个或更多个:
1)位于位置89处的脯氨酸;
2)位于位置91处的谷氨酸;
3)位于位置97处的天冬氨酸;
4)位于位置103处的天冬氨酸;以及
5)位于位置108处的谷氨酸;
其中指定的氨基酸残基位于与SEQ ID NO:1中的位置等效的位置处;或者
iv)(iii)的一部分,包括与如SEQ ID NO:2中所示的序列具有至少80%序列同一性(例如,与如SEQ ID NO:2中所示的序列至少85%、90%、95%、96%、97%、98%或99%相同)的氨基酸序列,其中所述氨基酸序列包括位于位置10处的赖氨酸、位于位置56处的谷氨酸以及以下中的三个或更多个:
1)位于位置68处的脯氨酸;
2)位于位置70处的谷氨酸;
3)位于位置76处的天冬氨酸;
4)位于位置82处的天冬氨酸;以及
5)位于位置87处的谷氨酸,
其中指定的氨基酸残基位于与SEQ ID NO:2中的位置等效的位置处,
并且其中所述多肽能够与包括如SEQ ID NO:3中所示的氨基酸序列的肽自发地形成异肽键,其中所述异肽键形成在位于SEQ ID NO:3的位置10处的天冬氨酸残基与位于SEQID NO:1的位置31或SEQ ID NO:2的位置10处的赖氨酸残基之间。
在一些实施例中,三个氨基酸是1)和2)以及3)-5)中的任一个。然而,本文设想了三个或更多个氨基酸的任何组合,例如3)、4)和5)、2)、4)和5)、1)、3)和5)、2)、3)和4)、1)-4)、2)-5)等。在一个特别优选的实施例中,以上提到的所有五种氨基酸都存在于本发明的变体多肽中。
在本发明的多肽(肽标签结合配偶体)变体(即序列同一性相关的多肽和其部分)不含有以上指定的所有残基的实施方例中,优选的是在指定的位置处,变体含有位于SpyCatcher002多肽(SEQ ID NO:7)中的等效位置处的氨基酸残基。通过例如使用BLASTP算法将多肽(肽标签结合配偶体)变体的氨基酸序列与SEQ ID NO:7进行比较可以容易地确定等效位置。
因此,举例来说,在本发明的多肽(肽标签结合配偶体)包括与如SEQ ID NO:1中所示的序列具有至少80%序列同一性的氨基酸序列的实施例中,如果位置91(或等效位置)处的残基不是谷氨酸,则优选的是残基是苏氨酸。类似地,如果位置103(或等效位置)处的残基不是天冬氨酸,则优选的是所述残基是天冬酰胺。如果位置108(或等价位置)处的残基不是谷氨酸,则优选的是所述残基是赖氨酸。如果位置89(或等效位置)处的残基不是脯氨酸,则优选的是所述残基是丙氨酸。如果位置97(或等效位置)处的残基不是天冬氨酸,则优选的是所述残基是谷氨酰胺。这适用于以下指定的其它残基。
在一些实施例中,本发明的多肽(肽标签结合配偶体)变体与SEQ ID NO:1的不同之处可以在于,例如,1个到50个、1个到45个、1个到40个、1个到35个、1个到30个、1个到25个、1个到20个、1个到15个、1个到10个、1个到8个、1个到6个、1个到5个、1个到4个,例如1个、2个或3个氨基酸取代、插入和/或缺失,优选地1个到23个、1个到20个、1个到15个、1个到10个、1个到8个、1个到6个、1个到5个、1个到4个,例如1个、2个到3个氨基酸取代和/或1个到30个、1个到25个、1个到20个、1个到15个、1个到10个、1个到8个、1个到6个、1个到5个、1个到4个,例如1个、2个或3个氨基酸缺失。如下所讨论的,在一些实施例中,优选的是缺失位于N末端和/或C末端处,即截短,优选地N末端截短,由此生成如上定义的SEQ ID NO:1的多肽部分,例如SEQ ID NO:2。
在一些实施例中,相对于所示例的多肽(SEQ ID NO:1)存在于本发明的多肽(肽标签结合配偶体)中的任何突变可以是保守氨基酸取代。保守氨基酸取代是指由一个氨基酸取代另一个氨基酸这保留了多肽的物理化学特征(例如D可以被E取代或反之亦然,N被Q取代,或L或I被V取代或反之亦然)。因此,通常取代氨基酸具有与被取代氨基酸相似的性质,例如疏水性、亲水性、电负性、庞大的侧链等。可以掺入天然L-氨基酸的异构体,例如D-氨基酸。
因此,在其中本发明的多肽(肽标签结合配偶体)变体不含有以上以及另外以下指定的所有残基(即,SEQ ID NO:1中相对于SEQ ID NO:7的所有突变)的一些实施例中。在本文指定的位置,特别是以下指定的位置中,变体可以含有在SpyCatcher002肽(SEQ ID NO:7)中的等效位置处对氨基酸残基的保守取代。因此,例如,如果位置13(或等效位置)处的残基不是脯氨酸或谷氨酰胺,则优选的是所述残基是天冬酰胺。
因此,在一些实施例中,本发明的多肽(肽标签结合配偶体)可以包括与如SEQ IDNO:1中示出的序列具有至少80%序列同一性的氨基酸序列,其中所述氨基酸序列包括位于位置31处的赖氨酸、位于位置77处的谷氨酸、以下中任何三个或更多个(优选地四个或五个):
1)位于位置89处的脯氨酸;
2)位于位置91处的谷氨酸;
3)位于位置97处的天冬氨酸;
4)位于位置103处的天冬氨酸;以及
5)位于位置108处的谷氨酸;
以及以下中的任何一个或多个(优选地两个、三个、四个、五个或六个):
6)位于位置2处的苏氨酸;
7)位于位置13处的脯氨酸;
8)位于位置37处的精氨酸;
9)位于位置62处的组氨酸;
10)位于位置105处的谷氨酸;以及
11)位于位置113处的苏氨酸,
其中指定的氨基酸残基位于与SEQ ID NO:1中的位置等效的位置处。
本发明的多肽(肽标签结合配偶体)突变体(即变体)的位置2(基于SEQ ID NO:1和SEQ ID NO:7的编号)处存在天冬氨酸残基可能导致形成不需要的副反应-多肽(肽标签结合配偶体)二聚体,其中所述多肽通过异肽键缀合。位置2处存在苏氨酸或丙氨酸消除了不需要的副反应,并且可进一步提高多肽(肽标签结合配偶体)与其同源肽标签反应的速率。因此,在一些实施例中,本发明的多肽(肽标签结合配偶体)可以包括与如SEQ ID NO:1中示出的序列具有至少80%序列同一性的氨基酸序列,其中所述氨基酸序列包括位于位置2处的苏氨酸、位于位置31处的赖氨酸、位于位置77处的谷氨酸、以下中任何三个或更多个(优选地四个或五个):
1)位于位置89处的脯氨酸;
2)位于位置91处的谷氨酸;
3)位于位置97处的天冬氨酸;
4)位于位置103处的天冬氨酸;以及
5)位于位置108处的谷氨酸;
以及以下中的任何一个或多个(优选地两个、三铬、四个或五个):
6)位于位置13处的脯氨酸;
7)位于位置37处的精氨酸;
8)位于位置62处的组氨酸;
9)位于位置105处的谷氨酸;以及
10)位于位置113处的苏氨酸,
其中指定的氨基酸残基位于与SEQ ID NO:1中的位置等效的位置处。
设想了本发明的多肽(肽标签结合配偶体)可以包括以上定义的指定的氨基酸残基的任何组合,所述指定的氨基酸残基包括来自如上定义的1)-5)中所列示的那些的至少三个氨基酸残基(优选地四个或所有五个),以及至少一个(例如,上面在列表6)-11)和6)-10)中指定的氨基酸残基中的两个、三个、四个、五个或六个),例如6)和7)、6)和8)、6和9)、6)和10)、6)和11)、7)和8)、7)和9)、7)和10)、7)和11)等、6)、7)和8)、6)、8)和9)、6)、8)和10)等。然而,一些特别优选的组合包含:
a)1)位于位置2处的苏氨酸;
2)位于位置13处的脯氨酸;
3)位于位置31处的赖氨酸;
4)位于位置37处的精氨酸;
5)位于位置62处的组氨酸;
6)位于位置77处的谷氨酸;
7)位于位置91处的谷氨酸;
8)位于位置103处的天冬氨酸;
9)位于位置105处的谷氨酸;
10)位于位置108处的谷氨酸;以及
11)位于位置113处的苏氨酸;
b)1)位于位置2处的苏氨酸;
2)位于位置13处的脯氨酸;
3)位于位置31处的赖氨酸;
4)位于位置37处的精氨酸;
5)位于位置62处的组氨酸;
6)位于位置77处的谷氨酸;
7)位于位置89处的脯氨酸;
8)位于位置91处的谷氨酸;
9)位于位置103处的天冬氨酸;
10)位于位置105处的谷氨酸;
11)位于位置108处的谷氨酸;以及
12)位于位置113处的苏氨酸;以及
c)1)位于位置2处的苏氨酸;
2)位于位置13处的脯氨酸;
3)位于位置31处的赖氨酸;
4)位于位置37处的精氨酸;
5)位于位置62处的组氨酸;
6)位于位置77处的谷氨酸;
7)位于位置89处的脯氨酸;
8)位于位置91处的谷氨酸;
9)位于位置97处的天冬氨酸;
10)位于位置103处的天冬氨酸;
11)位于位置105处的谷氨酸;
12)位于位置108处的谷氨酸;以及
13)位于位置113处的苏氨酸;
其中指定的氨基酸残基位于与SEQ ID NO:1中的位置等效的位置处。
在一些另外的实施例中,以上定义的多肽(肽标签结合配偶体)变体还可以包括位于位置9处的甘氨酸和/或位于位置19处的苏氨酸。
因此,本发明的多肽(肽标签结合配偶体)具体地可以与如SEQ ID NO:1中所示的示例的序列至少80%相同,并且更具体地与SEQ ID NO:1至少85%、90%、95%、96%、97%、98%或99%相同,其中所述多肽变体包括位于位置31(或等效位置)处的赖氨酸、位于位置77(或等效位置)处的谷氨酸以及以下全部:
1)位于位置2处的苏氨酸;
2)位于位置9处的甘氨酸;
3)位于位置13处的脯氨酸;
4)位于位置19处的苏氨酸;
5)位于位置37处的精氨酸;
6)位于位置62处的组氨酸;
7)位于位置89处的脯氨酸;
8)位于位置91处的谷氨酸;
9)位于位置97处的天冬氨酸;
10)位于位置103处的天冬氨酸;
11)位于位置105处的谷氨酸;
12)位于位置108处的谷氨酸;以及
13)位于位置113处的苏氨酸;
其中指定的氨基酸残基位于与SEQ ID NO:1中的位置等效的位置处。
在一些仍另外的实施例中,以上定义的多肽(肽标签结合配偶体)变体还可以包括以下一个或多个(优选地全部):
1)位于位置34处的谷氨酸;
2)位于位置50处的丝氨酸;
3)位于位置69处的酪氨酸或丝氨酸(优选地丝氨酸);
4)位于位置83处的甘氨酸;以及
5)位于位置86处的缬氨酸;
其中指定的氨基酸残基位于与SEQ ID NO:1中的位置等效的位置处。
因此,本发明的多肽(肽标签结合配偶体)具体地可以与如SEQ ID NO:1中所示的示例的序列至少80%相同,并且更具体地与SEQ ID NO:1至少85%、90%、95%、96%、97%、98%或99%相同,其中所述多肽变体包括位于位置31(或等效位置)处的赖氨酸、位于位置77(或等效位置)处的谷氨酸以及以下全部:
1)位于位置2处的苏氨酸;
2)位于位置9处的甘氨酸;
3)位于位置13处的脯氨酸;
4)位于位置19处的苏氨酸;
5)位于位置34处的谷氨酸;
6)位于位置37处的精氨酸;
7)位于位置50处的丝氨酸;
8)位于位置62处的组氨酸;
9)位于位置69处的酪氨酸;
10)位于位置83处的甘氨酸;
11)位于位置86处的缬氨酸;
12)位于位置89处的脯氨酸;
13)位于位置91处的谷氨酸;
14)位于位置97处的天冬氨酸;
15)位于位置103处的天冬氨酸;
16)位于位置105处的谷氨酸;
17)位于位置108处的谷氨酸;以及
18)位于位置113处的苏氨酸;
其中指定的氨基酸残基位于与SEQ ID NO:1中的位置等效的位置处。
如以上所提到的,在一些优选实施例中,本发明的多肽变体包括相对于SEQ IDNO:1的氨基酸取代。因此,在一些又仍另外的实施例中,以上定义的多肽(肽标签结合配偶体)变体(例如具有如上定义的残基1-11、1-12、1-13或1-18的变体)还可以包括相对于SEQID NO:1的以下取代中的一个或多个取代(即两个取代、三个取代、四个取代或五个取代):
1)在位置52处用谷氨酰胺取代赖氨酸(即在位置52处为谷氨酰胺);
2)在位置63处用天冬氨酸取代缬氨酸(即在位置63处为天冬氨酸);
3)在位置69处用丝氨酸取代酪氨酸(即在位置69处为丝氨酸);
4)在位置88处用亮氨酸取代苏氨酸(即在位置88处为亮氨酸);以及
5)在位置96处用脯氨酸取代谷氨酸(即在位置96处为脯氨酸);
其中指定的氨基酸残基位于与SEQ ID NO:1中的位置等效的位置处。
因此,在一些实施例中,本发明的多肽变体可以含有以上列表中的1)-8)和10)-18)中指定的残基,其中位置69处的酪氨酸残基被丝氨酸取代。此多肽变体可以进一步包括以上指定的其它取代中的一个或多个取代。
本发明的多肽变体可以包括相对于SEQ ID NO:1的氨基酸缺失。虽然N末端缺失是优选的,但在一些实施例中,本发明的多肽变体可以包括与SEQ ID NO:1的17等效的位置处的缺失,即甲硫氨酸在SEQ ID NO:1的位置17处的缺失。
在特别优选的实施例中,本发明的多肽变体不包括位于与SEQ ID NO:1的14-16和/或85-89等效的位置处的氨基酸缺失。
如本文所用,术语“接头”是指起到优选地通过共价键,例如异肽键将两个分子或组分连接,即缀合或接合在一起的作用的分子。因此,本发明的多肽和其肽标签可以被视为两部分接头,其中第一部分,即多肽与第二部分,即肽标签之间的异肽键的形成重构接头,由此接合与接头的所述第一部分和第二部分融合或缀合的分子或组件。可替代地阐述地,本发明的多肽和其肽标签可被视为起到接头的作用的同源对,即肽标签和多肽同源对或肽标签和结合配偶体同源对。这些术语贯穿整个说明书可互换使用。
术语“同源”是指共同起作用的组分。因此,在本发明的上下文中,同源对是指自发地一起反应以形成异肽键的肽标签和本发明的多肽。因此,包括在使得能够自发形成所述异肽键的条件下一起高效反应以形成异肽键的肽标签和多肽的两部分接头也可以被称为“互补对”,即肽标签和多肽互补对。
因此,同源肽标签是指本发明的多肽与其自发地反应以形成异肽键的SpyTag肽或其变体(例如,包括SEQ ID NO:3-6之一中所示的氨基酸序列的肽)。在一些实施例中,同源肽标签可以是包括与如SEQ ID NO:3-5之一中所示的氨基酸序列具有至少80%(例如至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%)序列同一性的氨基酸序列的肽,所述肽能够与包括如SEQ ID NO:1中所示氨基酸序列的多肽例如在同源肽标签中的天冬氨酸(即与SEQ ID NO:3中的位置10、SEQ ID NO:4中的位置8或SEQ ID NO:5中的位置7相当的位置处的天冬氨酸)与位于SEQ ID NO:1的位置31处的赖氨酸残基之间自发地形成异肽键。
在一些实施例中,所述肽标签包括如SEQ ID NO:6中所示的氨基酸序列,其中:
(i)位于位置1处的X是精氨酸或无氨基酸;
(ii)位于位置2处的X是甘氨酸或无氨基酸;
(iii)位于位置5处的X是组氨酸或苏氨酸,优选地是组氨酸;
(iv)位于位置11处的X是丙氨酸、甘氨酸或缬氨酸,优选地是丙氨酸;并且
(v)位于位置14处的X是精氨酸或赖氨酸,优选地是精氨酸;
其中当位于位置1处的X无氨基酸时,位于位置2处的X无氨基酸,
并且其中所述肽能够与包括如SEQ ID NO:1中所示的氨基酸序列的多肽自发地形成异肽键,其中所述异肽键形成在位于SEQ ID NO:6的位置10处的天冬氨酸残基与位于SEQID NO:1的位置31处的赖氨酸残基之间。
因此,在一些优选实施例中,肽标签包括如SEQ ID NO:3、4或5中所示的氨基酸序列或由所述氨基酸序列组成。
因此,本发明进一步提供了包括肽(肽标签)和多肽(肽标签结合配偶体)的两部分接头,其中:
a)所述多肽(肽标签结合配偶体)包括如上定义的氨基酸序列(即SEQ ID NO:1或其变体);以及
b)所述肽(肽标签)包括如上定义的氨基酸序列(例如SEQ ID NO:3、4、5或6中所示的氨基酸序列),
并且其中所述肽(肽标签)和多肽(肽标签结合配偶体)能够在肽标签中的天冬氨酸残基(例如在SEQ ID NO:4中的位置8处、在SEQ ID NO:5的位置7处或SEQ ID NO:3或6的位置10)与位于SEQ ID NO:1的位置31处的赖氨酸残基之间自发地形成异肽键。
本发明的多肽(肽标签结合配偶体)的位于位置31处的赖氨酸残基(SEQ ID NO:1)在各种条件下,包含以下解释的适于在所述肽标签与多肽(肽标签结合配偶体)之间形成异肽键的那些下与位于SEQ ID NO:4中的位置8处、SEQ ID NO:5的位置7或SEQ ID NO:3或6的位置10处的天冬氨酸残基自发地形成异肽键。从以下的实例显而易见的是,本发明的多肽(肽标签结合配偶体)在某种范围的条件下有活性并且能够与多种肽标签(具体地SEQ IDNO:3-5)反应。
例如,多肽(肽标签结合配偶体)在包含磷酸盐缓冲盐水(PBS)、4-(2-羟乙基)-1-哌嗪乙磺酸(HEPES)、HEPES缓冲盐水(HBS)和Tris缓冲盐水(TBS)的多种缓冲液中在具有和不具有EDTA的情况下有活性(即能够与如本文所述的肽标签自发地形成异肽键)。多肽(肽标签结合配偶体)在约3.0-8.0,例如4.0-7.0、5.0-7.0,如约5.5-6.5的pH下在宽范围的温度,例如0-40℃,例如1℃、2℃、3℃、4℃、5℃、10℃、12℃、15℃、18℃、20℃、22℃、25℃、28℃、30℃、35℃或37℃,优选地约25-35℃,例如约25℃下有活性。本发明的多肽(肽标签结合配偶体)在通常使用的去污剂,如Tween 20和Triton X-100存在的情况下,例如至多约1%(v/v)的浓度下,并且在尿素存在的情况下,例如至多约3M的浓度下也有活性。技术人员将能够容易地确定其它合适的条件。
因此,在一些实施例中,适于在本发明的多肽(肽标签结合配偶体)与同源肽标签(例如,包括如SEQ ID NO:3-6,优选地3-5中所示的氨基酸序列或由所述氨基酸序列组成的肽)之间形成异肽键的条件包含使肽标签和本发明的多肽(肽标签结合配偶体)接触导致在所述肽标签与多肽(肽标签结合配偶体)之间,具体地在位于SEQ ID NO:3或6的位置10(或等效位置,例如SEQ ID NO:5的位置7或SEQ ID NO:4的位置8)处的天冬氨酸残基与位于SEQID NO:1的位置31(或等效位置)处的赖氨酸残基之间自发形成异肽键的任何条件。例如,使所述肽标签和多肽(肽标签结合配偶体)在缓冲条件下,例如在缓冲溶液中或在已经用缓冲液,如PBS平衡的固相(例如柱)上接触。接触的步骤可以在任何合适的pH下,如pH 3.0-8.0,例如4.0-7.0,如pH 4.2、4.4、4.6、4.8、5.0、5.2、5.4、5.6、5.8、6.0、6.2、6.4、6.6、6.8或7.0。另外或可替代地,接触的步骤可以在任何合适的温度下,如约0-40℃,例如约1-39℃、2-38℃、3-37℃、4-36℃、5-35℃、6-34℃、7-33℃、8-32℃、9-31℃或10-30℃,例如约10℃、12℃、15℃、18℃、20℃、22℃、25℃、28℃、30℃、33℃、35℃或37℃,优选地约25-35℃,例如约25℃。
在一些实施例中,肽标签和本发明的多肽(肽标签结合配偶体)“在能够自发形成异肽键的条件下”接触包含使肽标签和多肽在化学伴侣,例如增强或改善肽标签和多肽(肽标签结合配偶体)的反应性的分子存在的情况下接触。在一些实施例中,化学伴侣是TMAO(氧化三甲胺N)。在一些实施例中,化学伴侣,例如TMAO以至少约0.2M,例如至少0.3、0.4、0.5、1.0、1.5、2.0或2.5M,例如约0.2-3.0M、0.5-2.0M、1.0-1.5M的浓度存在于反应中。
如以上指出的,在本文描述的肽标签与本发明的多肽(肽标签结合配偶体)之间形成异肽键是自发的。在此方面,多肽(肽标签结合配偶体)包括位于位置77(或等效位置,基于SEQ ID NO:1的编号)处的促进,例如诱导、推动或催化分别在肽标签和多肽(肽标签结合配偶体)中在天门冬氨酸与赖氨酸残基之间形成异肽键的谷氨酸。
如本文所用,术语“自发”是指可以在蛋白质中或在肽或蛋白质之间(例如,在两个肽或肽与蛋白质之间,即肽标签与本发明的多肽(肽标签结合配偶体)之间)在不存在任何其它试剂(例如酶催化剂)和/或不存在对蛋白质或肽的化学修饰的情况下,例如在没有天然化学连接或使用1-乙基-3-(3-二甲基氨基丙基)碳二亚胺(EDC)进行的化学偶联的情况下形成的异肽键。因此,不执行用于对具有C-末端硫酯的肽或蛋白质进行修饰的天然化学连接。
因此,当分离并且在没有对肽标签和/或本发明的多肽进行化学修饰的情况下,可以在如本文定义的肽标签与本发明的多肽(肽标签结合配偶体)之间形成自发异肽键。因此,自发异肽键可以在酶或其它外源物质不存在并且没有对肽标签和/或本发明的多肽进行化学修饰的情况下自行形成。
自发异肽键可以几乎紧接着肽标签和本发明的多肽(肽标签结合配偶体)接触而形成,例如在1分钟、2分钟、3分钟、4分钟、5分钟、10分钟、15分钟、20分钟、25分钟或30分钟内,或在1小时、2小时、4小时、8小时、12小时、16小时、20小时或24小时内。
异肽形成的速度将取决于肽标签和多肽反应物的浓度以及反应的条件,例如温度。在一些实施例中,自发异肽键形成可以在约1分钟或更短的时间内完成反应物的约90%或更多,例如其中所述反应物各自在约25℃的反应温度下以约10μM的浓度存在。在一些实施例中,自发异肽键形成可以在约1分钟或更短的时间内完成反应物的约50%或更多,例如其中所述反应物各自在约25℃的反应温度下以约100nM的浓度存在。在一些实施例中,自发异肽键形成可以在约1分钟或更短的时间内完成反应物的约10%或更多,例如其中所述反应物各自在约25℃的反应温度下以约10nM的浓度存在。
可替代地看到的,在一些实施例中,自发异肽键形成可以在约5分钟或更短的时间内完成反应物的约90%或更多,例如其中所述反应物各自在约25℃的反应温度下以约100nM的浓度存在。在一些实施例中,自发异肽键形成可以在约15分钟或更短的时间内完成反应物的约90%或更多,例如其中所述反应物各自在约25℃的反应温度下以约10nM的浓度存在。
以上定义的用于确定反应速度的其它反应条件,例如缓冲液、pH等可以是本文定义的任何条件。在一些实施例中,反应条件是实例中使用的那些。例如,在一些实施例中,自发异肽键形成在pH为约7.0的琥珀酸-磷酸-甘氨酸缓冲液中,具体地pH 7.0的包括12.5mM琥珀酸、43.75mM NaH2PO4、43.75mM甘氨酸的缓冲液中以上述指定的量完成。
本发明的多肽(肽标签结合配偶体)涵盖多肽(肽标签结合配偶体)的突变体形式(即在本文中被称为同源物、变体或衍生物),所述突变体形式与SEQ ID NO:1中所示的例示的多肽(肽标签结合配偶体)在结构上相似。本发明的多肽(肽标签结合配偶体)变体能够起到肽标签结合配偶体(捕捉剂)的作用,即能够在如本文定义的肽标签的位置10(或等效位置)处的天冬氨酸与多肽(肽标签结合配偶体)变体的位置31(或等效位置)处的赖氨酸之间在如上定义的合适条件下自发地形成异肽键。
在多肽(肽标签结合配偶体)变体包括相对于SEQ ID NO:1的突变,例如缺失或插入的情况下,以上指定的残基存在于变体多肽(肽标签结合配偶体)序列中的等效氨基酸位置处。在一些实施例中,本发明的多肽(肽标签结合配偶体)变体中的缺失不是N末端和/或C末端截短,尤其不是C末端截短。
然而,如上所提到的,设想了可以在不显著降低多肽的活性的情况下将本文例示的多肽(即SEQ ID NO:1)在N末端和/或C末端处截短。具体地,SEQ ID NO:1可以在N末端处截短至多21个氨基酸(例如5个、10个、15个或20个氨基酸)和/或在C末端处截短至多9个氨基酸(例如1个、2个、3个、4个、5个、6个、7个、8个或9个氨基酸),优选地5个氨基酸或更少。因此,如本文使用的术语变体包含例示的多肽的截短变体。可替代地看到的,可以看到本发明提供了例示的多肽的一部分,其中所述部分包括如以上所讨论的SEQ ID NO:2中所示的氨基酸序列或其变体。
如本文所提及的,“部分”包括至少如SEQ ID NO:2中所示的氨基酸序列,即SEQ IDNO:1的(其所衍生的序列)含有如SEQ ID NO:2中所示的氨基酸序列的至少83个、84个、85个、86个、87个、88个、89个、90个、91个、92个、93个、94个、95个、100个、105个、110个或更多个氨基酸。因此,所述部分可以从序列的中央部分或者N末端或C末端部分获得。优选地,所述部分从中央部分获得,即其包括N末端和/或C末端截短,优选地N末端截短,如上定义的。显著地,如本文描述的“部分”是本发明的多肽并且因此满足本文提到的同一性(相对于可比区域)条件和功能等效条件。
在一些实施例中,用于与本发明的多肽一起使用的肽标签可以是本文描述的序列的变体,例如与SEQ ID NO:3-6的不同之处可以在于例如1个到5个、1个到4个,例如1个、2个到3个氨基酸取代、插入和/或缺失,优选地取代,如上定义的。在一些实施例中,本发明的多肽(肽标签结合配偶体)变体可以不同于如上定义的SEQ ID NO:1。然而,肽和多肽变体必须保留其功能活性,即其能够分别与其同源结合配偶体和肽自发地形成异肽键。
序列同一性可以通过本领域已知的任何合适的方法,例如使用SWISS-PROT蛋白质序列数据库使用FASTA pep-cmp,利用可变pam因子以及置设为12.0的缺口产生罚分和设置为4.0的缺口延伸罚分以及2个氨基酸的窗口确定。用于确定氨基酸序列同一性的其它程序包含来自威斯康星大学(University of Wisconsin)的遗传学计算机组(GeneticsComputer Group,GCG)版本10软件包的BestFit程序。所述程序使用Smith和Waterman的局部同源算法,其中默认值:间隙产生罚分-8,间隙扩展罚分=2,平均匹配=2.912,平均失配=-2.003。
优选地,所述比较在序列的全长上进行,但也可以在较小的比较窗口上进行,例如少于100个、80个或50个连续氨基酸。
优选地,所述肽标签和多肽(肽标签结合配偶体)变体(例如序列同一性相关变体)与具有如SEQ ID NO:3-5或SEQ ID NO:1或2中所示的序列的肽标签和多肽(肽标签结合配偶体)在功能上等效。如本文所提及的,“功能等效性”是指本文定义的肽标签和上文讨论的本发明的多肽(肽标签结合配偶体)的可以示出在与相应配偶体自发形成异肽键方面功效相对于母体分子(即与其示出序列同源性的分子)的某种降低(例如表达产率较低、反应速率较低或活性在有限的反应条件范围下(例如,温度范围较窄,如10-30℃等),但优选地同样高效或更高效的变体。
具有与包括如SEQ ID NO:3-5之一中所示的氨基酸序列或由所述氨基酸序列组成的肽标签的活性“等效”的活性的突变体或变体肽标签可以具有与包括如SEQ ID NO:3-5之一所示的氨基酸序列或由所述氨基酸序列组成的肽标签的活性相似(即可比)的活性,即使得肽标签的实际应用不会受到显著影响,例如在实验误差的裕度内。因此,等效的肽标签活性意味着突变体或变体肽标签能够与多肽(肽标签结合配偶体,例如包括如SEQ ID NO:1或2中所示的氨基酸序列或由所述氨基酸序列组成)在相同的条件下以与包括如SEQ ID NO:3-5之一中所示的氨基酸序列或由所述氨基酸序列组成的肽标签相似的反应速率(即如以下所讨论的速率常数)和/或产率自发地形成异肽键。
相似地,具有与包括如SEQ ID NO:1或2(优选地SEQ ID NO:1)中所示的氨基酸序列或由所述氨基酸序列组成的多肽(肽标签结合配偶体)的活性“等效”的活性的本发明的突变体或变体多肽(肽标签结合配偶体)可以具有与包括如SEQ ID NO:1或2(优选地SEQ IDNO:1)中所示的氨基酸序列或由所述氨基酸序列组成的多肽(肽标签结合配偶体)的活性相似(即可比)的活性,即使得多肽(肽标签结合配偶体)的实际应用不会受到显著影响,例如在实验误差的裕度内。因此,等效的多肽(肽标签结合配偶体)活性意味着本发明的突变体或变体多肽(肽标签结合配偶体)能够与肽标签(例如包括如SEQ ID NO:3-6中所示的氨基酸序列或由所述氨基酸序列组成)在相同的条件下以与包括如SEQ ID NO:1或2(优选地SEQID NO:1)之一中所示的氨基酸序列或由所述氨基酸序列组成的多肽(肽标签结合配偶体)相似的反应速率(即如以下所讨论的速率常数)和/或产率自发地形成异肽键。
在如以上所例示的相同反应条件,例如温度、底物(即肽标签或多肽序列)和其浓度、缓冲液、盐等下测量的不同肽标签和多肽(例如分别为SEQ ID NO:3与突变体和SEQ IDNO:1与突变体)的活性可以容易地进行比较以确定每个肽标签和多肽的活性是更高、更低还是等效。
具体地,本文定义的肽标签变体和本发明的多肽变体具有与具有分别如SEQ IDNO:3-5或SEQ ID NO:1或2所示的序列的肽标签和多肽具有等效的速率常数。速率常数是指给定温度下反应(异肽键的形成)的速率与反应物的浓度的乘积(即肽标签和本发明的多肽的浓度的乘积)相关的比例系数。
因此,本文公开的变体(例如突变体)肽标签的活性,例如速率常数可以是包括如SEQ ID NO:3-5之一中所示的氨基酸序列或由所述氨基酸序列组成的肽标签的活性,例如速率常数的至少60%,例如至少70%、75%、80%、85%或90%,如包括如SEQ ID NO:3-5之一中所示的氨基酸序列或由所述氨基酸序列组成的肽标签的活性的至少91%、92%、93%、94%、95%、96%、97%、98%或99%。可替代地看到的,突变体肽标签的活性,例如速率常数可以比包括如SEQ ID NO:3-5中所示的氨基酸序列或由所述氨基酸序列组成的肽标签的活性,例如速率常数低不多于40%,例如比包括如SEQ ID NO:3-5之一中所示的氨基酸序列或由所述氨基酸序列组成的肽标签的活性,例如速率常数低不多于35%、30%、25%或20%,如比包括如SEQ ID NO:3-5之一中所示的氨基酸序列或由所述氨基酸序列组成的肽标签的活性,例如速率常数低不多于10%、9%、8%、7%、6%、5%、4%、3%、2%或1%。
类似地,本发明的变体多肽(肽标签结合配偶体)的活性,例如速率常数可以是包括如SEQ ID NO:1或2之一中所示的氨基酸序列或由所述氨基酸序列组成的多肽的活性,例如速率常数的至少60%,例如至少70%、75%、80%、85%或90%,如包括如SEQ ID NO:1或2中所示的氨基酸序列或由所述氨基酸序列组成的多肽的活性,例如速率常数的至少91%、92%、93%、94%、95%、96%、97%、98%或99%。可替代地看到的,突变体多肽的活性可以比包括如SEQ ID NO:1或2中所示的氨基酸序列或由所述氨基酸序列组成的多肽的活性,例如速率常数低不多于40%,例如比包括如SEQ ID NO:1或2中所示的氨基酸序列或由所述氨基酸序列组成的多肽的活性,例如速率常数低不多于35%、30%、25%或20%,如比包括如SEQ ID NO:1或2中所示的氨基酸序列或由所述氨基酸序列组成的多肽的活性,例如速率常数低不多于10%、9%、8%、7%、6%、5%、4%、3%、2%或1%。
值得注意的是,当肽标签和/或多肽与扩散比分离的肽标签和多肽慢的大分子或组分(例如蛋白质)融合时,本文公开的肽标签和本发明的多肽反应的速率常数可以低于实例中描述的值。此外,如果肽标签和/或多肽所融合的分子或组分对反应造成空间位阻,则可以降低速率常数。因此,当测量本文公开的肽标签变体和本发明的多肽变体反应的速率常数时,优选的是使用分离的肽标签和多肽,即未与其它分子或组分融合或缀合的肽标签和多肽执行测量。
然而,如实例中所示,通常便利的是使用与多肽融合的肽标签来测量本发明的多肽变体反应的速率常数。因此,当使用与多肽融合的肽标签测量和比较不同多肽变体的速率常数时,优选的是与肽标签融合的多肽在所有反应中具有相同的大小,优选地相同的序列。
显而易见的是,与大分子或组分的融合和/或空间位阻也会影响其它肽标签和多肽的速率常数,例如SpyTag、SpyTag002、SpyCatcher和SpyCatcher002。因此,除了本发明的多肽在低浓度下使用之外,其速率常数的提高在以高浓度使用本发明的多肽和其同源肽标签时(例如当与大分子或组分融合时)仍可能是有利的。
可以通过本领域已知的并且如实例和WO 2018/197854(通过引用并入本文)中所述的任何合适的手段来评估反应速率和速率常数。例如,反应速率可以通过(i)在SDS中煮沸或会破坏所有非共价相互作用的其它强变性处理之后评估反应产物在SDS-PAGE上的迁移率或(ii)通过质谱来监测。
因此,可以对SEQ ID NO:1进行任何修饰或修饰的组合以产生本发明的变体多肽(肽标签结合配偶体),条件是所述变体多肽(肽标签结合配偶体)包括位于与SEQ ID NO:1的位置31等效的位置处的赖氨酸残基和位于与SEQ ID NO:1的位置77等效的位置处的谷氨酸残基以及位于与位置91、103和108等效的位置处的至少一个(优选地2个或3个)其它氨基酸残基,任选地位于与位置89和97等效的位置处的一个或两个氨基酸残基,进一步任选地位于与SEQ ID NO:1的位置2、9、13、19、37、62、105和113等效的位置处的一个或多个(优选地2个、3个、4个、5个、6个、7个或8个)氨基酸残基,以及进一步任选地位于与如上定义的SEQID NO:1的位置34、50、69、83和86等效的位置处的一个或多个(优选地2个、3个、4个或5个)氨基酸残基,并且保留了以上定义的功能特性,即其产生能够与包括如SEQ ID NO:3-5之一中所示的氨基酸序列或由所述氨基酸序列组成的肽标签自发地形成异肽键的多肽(肽标签结合配偶体),并且任选地具有相对于具有如SEQ ID NO:1中所示的氨基酸序列的多肽(肽标签结合配偶体)等效或更高的产率、反应速率,例如速率常数、温度和/或缓冲范围。
在一些实施例中,本发明的变体多肽(肽标签结合配偶体)包括上文指定的残基和以下取代中的一个或多个取代(2个、3个、4个或5个):K52Q、V63D、Y69S、T88L和E96P(相对于SEQ ID NO:1),并且保留了以上定义的功能特性,即其产生能够与包括如SEQ ID NO:3-5之一中所示的氨基酸序列或由所述氨基酸序列组成的肽标签自发地形成异肽键的多肽(肽标签结合配偶体),并且任选地具有相对于具有如SEQ ID NO:1中所示的氨基酸序列的多肽(肽标签结合配偶体)等效或更高的产率、反应速率,例如速率常数、温度和/或缓冲范围。
在一些另外的实施例中,本发明的变体多肽包括上文指定的残基,任选地以上指定的取代和SEQ ID NO:1的位置17处的甲硫氨酸的缺失,并且保留了以上定义的功能特性,即其产生能够与包括如SEQ ID NO:3-5之一中所示的氨基酸序列或由所述氨基酸序列组成的肽标签自发地形成异肽键的多肽(肽标签结合配偶体),并且任选地具有相对于具有如SEQ ID NO:1中所示的氨基酸序列的多肽(肽标签结合配偶体)等效或更高的产率、反应速率,例如速率常数、温度和/或缓冲范围。
可替代地看到的,可以对SEQ ID NO:2进行任何修饰或修饰的组合(优选地取代)以产生本发明的变体多肽(肽标签结合配偶体),条件是所述变体多肽(肽标签结合配偶体)包括位于与SEQ ID NO:2的位置10等效的位置处的赖氨酸残基和位于与SEQ ID NO:2的位置56等效的位置处的谷氨酸残基以及位于与位置70、82和87等效的位置处的至少一个(优选地2个或3个)其它氨基酸残基,任选地位于与位置68和76等效的位置处的一个或两个氨基酸残基,进一步任选地位于与SEQ ID NO:2的位置16、41、84和92等效的位置处的一个或多个(优选地2个、3个或4个)氨基酸残基,以及进一步任选地位于与如上定义的SEQ ID NO:2的位置13、29、48、62和65等效的位置处的一个或多个(优选地2个、3个、4个或5个)氨基酸残基,并且保留了以上定义的功能特性,即其产生能够与包括如SEQ ID NO:3-5之一中所示的氨基酸序列或由所述氨基酸序列组成的肽标签自发地形成异肽键的多肽(肽标签结合配偶体),并且任选地具有相对于具有如SEQ ID NO:2中所示的氨基酸序列的多肽(肽标签结合配偶体)等效或更高的产率、反应速率,例如速率常数、温度和/或缓冲范围。
在一些实施例中,截短的本发明的变体多肽(肽标签结合配偶体)包括上文指定的残基和以下取代中的一个或多个取代(2个、3个、4个或5个):K31Q、V42D、Y48S、T67L和E75P(相对于SEQ ID NO:2),并且保留了以上定义的功能特性,即其产生能够与包括如SEQ IDNO:3-5之一中所示的氨基酸序列或由所述氨基酸序列组成的肽标签自发地形成异肽键的多肽(肽标签结合配偶体),并且任选地具有相对于具有如SEQ ID NO:2中所示的氨基酸序列的多肽(肽标签结合配偶体)等效或更高的产率、反应速率,例如速率常数、温度和/或缓冲范围。
本文公开的肽标签中的等效位置优选地通过参考SEQ ID NO:3或6的氨基酸序列来确定。本发明的多肽(肽标签结合配偶体)中的等效位置通过参考SEQ ID NO:1或2的氨基酸序列来确定。同源或对应位置可以基于序列之间的同源性或同一性,例如使用BLAST算法,通过将同源物(突变体、变体或衍生物)肽标签的序列与SEQ ID NO:3或6的序列或同源物(突变体、变体或衍生物)多肽(肽标签结合配偶体)的序列与SEQ ID NO:1或2的序列排列起来而容易地推断。
如本文所用,术语“标签”和“肽标签”通常是指肽或寡肽。
如本文所用,术语“肽标签结合配偶体”、“结合配偶体”或“捕捉剂”通常是指多肽或蛋白质。
在此方面,关于肽的含义之间的大小边界无标准定义。通常肽可以被视为包括介于2个-39个之间的氨基酸。因此,多肽可以被视为包括至少40个氨基酸,优选地至少50个、60个、70个、80个、90个、100个或110个氨基酸。
因此,在优选实施例中,如本文定义的肽标签可以被视为在长度上包括至少12个氨基酸,例如12-39个氨基酸,如13-35个、14-34个、15-33个、16-31个、17-30个氨基酸,例如其可以包括以下或由以下组成:12个、13个、14个、15个、16个、17个、18个、19个或20个氨基酸。
如本文定义的本发明的多肽(肽标签结合配偶体、结合配偶体或“捕捉剂”)可以被视为在长度上包括至少80个氨基酸,例如80-150个氨基酸,如80-140个、80-130个、80-120个氨基酸长,例如,其可以包括以下或由以下组成:83个、84个、85个、86个、87个、88个、89个、90个、91个、92个、93个、94个、95个、96个、97个、98个、99个、100个、101个、102个、103个、104个、105个、106个、107个、108个、109个、110个、111个、112个、113个、114个、115个、116个、117个、118个、119个或120个氨基酸。
如以上所讨论的,两部分接头(例如标签和捕捉剂系统或对,即同源对)具有大量用途,并且本发明的多肽(肽标签结合配偶体)和其同源肽标签(例如,SEQ ID NO:3-6)可用于通过异肽键将两个分子或组分缀合(即接合或连接)。例如,肽标签和多肽(肽标签结合配偶体)可以分别与所关注的分子或组分缀合或融合,并且随后在适合于允许在肽标签与多肽(肽标签结合配偶体)之间自发形成异肽键的条件下接触在一起,从而通过异肽键接合(即连接或缀合)分子或组分。
因此,在一些实施例中,可以看出本发明提供了如本文定义的肽(肽标签)和多肽(肽标签结合配偶体)对通过异肽键将两个分子或组分缀合的用途,
其中通过异肽键缀合的所述分子或组分包括:
a)第一分子或组分,所述第一分子或组分包括如本文定义的本发明的多肽(肽标签结合配偶体)(例如与本发明的多肽缀合或融合);以及
b)第二分子或组分,所述第二分子或组分包括如本文定义的肽(肽标签)(例如与以本文定义的肽缀合或融合)。
显而易见的是,以上描述的肽标签和多肽(肽标签结合配偶体)对(即两部分接头)的使用包括在适合于使得能够(例如推动或促进)在如上所述的所述肽标签与所述多肽(肽标签结合配偶体)之间自发形成异肽键的条件下使所述第一分子和所述第二分子接触。
可替代地看到的,本发明提供了一种用于通过异肽键将两个分子或组分缀合的方法,所述方法包括:
a)提供第一分子或组分,所述第一分子或组分包括如本文定义的本发明的多肽(肽标签结合配偶体)(例如与本发明的多肽缀合或融合);
b)提供第二分子或组分,所述第二分子或组分包括如本文定义的肽(肽标签)(例如与以本文定义的肽缀合或融合);
c)使所述第一分子或组分和所述第二分子或组分在使得能够(例如推动或促进)在如上所述的所述肽与所述多肽之间自发形成异肽键的条件下接触,由此通过异肽键将所述第一分子或组分与所述第二分子或组分缀合以形成复合物。
在本发明的上下文中关于将两个或更多个分子或组分连接以形成复合物的术语“缀合”或“连接”是指通过共价键,具体地形成在肽标签与多肽(肽标签结合配偶体)之间的并入在所述分子或组分,例如蛋白质中或与所述分子或组分融合的异肽键将所述分子或组分,例如蛋白质连接或缀合(例如所述肽标签和所述多肽(肽标签结合配偶体)可以形成待缀合或连接在一起的蛋白质的结构域)。
如以上所提及的,在一些实施例中,本文公开的肽标签和/或本发明的多肽(肽标签结合配偶体)与其它分子或其它成分或实体融合或缀合。此类分子或组分(即实体)可以是核酸分子、蛋白质(例如抗体或其抗原结合片段)、肽、小分子有机化合物、荧光团、金属配体复合物、多糖、纳米颗粒、2D单层(例如石墨烯)、纳米管、聚合物、细胞、病毒、病毒样颗粒或这些的任何组合。在一些实施例中,肽标签和/或多肽(肽标签结合配偶体)与其融合或缀合的组分或实体是固体支撑物,即固体底物或固相,如下定义的。
因此,可替代地看到的,本发明提供了核酸分子、蛋白质(例如抗体或其抗原结合片段)、肽、小分子有机化合物、荧光团、金属配体复合物、多糖、纳米颗粒、2D单层(例如石墨烯)、纳米管、聚合物、细胞、病毒、病毒样颗粒或其任何组合或与肽标签和/或本发明的多肽(肽标签结合配偶体)融合或缀合的固体支撑物。
所述细胞可以是原核或真核细胞。在一些实施例中,所述细胞是原核细胞,例如细菌细胞。在一些实施例中,所述细胞是真核细胞,如动物细胞,例如人细胞。
在一些实施例中,肽标签和/或多肽(肽标签结合配偶体)可以与具有治疗作用或预防作用的化合物或分子,例如抗生素、抗病毒剂、疫苗、例如放射性化合物或同位素等抗肿瘤剂、细胞因子、毒素、寡核苷酸和核酸编码基因或核酸疫苗缀合或融合。
在一些实施例中,肽标签和/或多肽(肽标签结合配偶体)可以与标记物,例如放射性标记物、荧光标记物、发光标记物、生色团标记物以及生成可检测底物的物质和酶,例如辣根过氧化物酶、荧光素酶或碱性磷酸酶缀合或融合。此检测可以应用于常规使用抗体的多种测定,包含蛋白质印迹/免疫印迹、组织化学、酶联免疫吸附测定(ELISA)或流式细胞术(FACS)格式。用于磁共振成像的标记物、正电子发射断层扫描探针和用于中子捕获疗法的硼10也可以与肽标签和/或本发明的多肽(肽标签结合配偶体)缀合。具体地,肽标签和/或多肽(肽标签结合配偶体)可以与另一种肽,例如His标签融合或用另一种肽产生,和/或可以与另一种蛋白质融合或用另一种蛋白质产生,例如目的是增强通过与麦芽糖结合蛋白融合进行的重组蛋白表达。
在一些实施例中,可能有用的是将半胱氨酸残基引入到本发明的多肽中以将多肽与另一种分子或组分,例如荧光标记物等标记物或固体底物偶联。例如,引入半胱氨酸残基将允许多肽与另一种分子或组分,如含有马来酰亚胺官能团的标记物,例如荧光标记物偶联。
在一些特定实施例中,以上定义的多肽变体可以另外包括位于与SEQ ID NO:1中的位置49或55等效的位置(优选地与位置49等效的位置)或SEQ ID NO:2中的位置28或34等效的位置(优选地与位置28等效的位置)处的半胱氨酸。因此,在一些实施例中,本发明的多肽包括如SEQ ID NO:12或13中所示的氨基酸序列。
在一个特别有用的实施例中,肽标签和/或多肽(肽标签结合配偶体)与另一种肽或多肽融合或缀合。例如,肽标签和/或多肽(肽标签结合配偶体)可以使用如以下所讨论的重组技术产生作为另一种肽或多肽,即作为重组或合成蛋白质或多肽。在肽或多肽与另一种肽或多肽融合或缀合的实施例中,所述肽或多肽不是肽标签或本发明的多肽所衍生自的肽或多肽(例如所述肽或多肽不是异肽蛋白,即本发明的多肽衍生自的异肽蛋白(酿脓链球菌FbaB蛋白的CnaB2结构域))。
显而易见的是,本文公开的肽标签和/或本发明的多肽(肽标签结合配偶体)可以与任何蛋白质或多肽融合。所述蛋白质可以衍生自或获得自任何合适的来源。例如,所述蛋白质可以从生物和临床样品,例如生物体(真核生物、原核生物)的任何细胞或组织样品,或衍生自所述生物体的任何体液或制剂,以及如细胞培养物、细胞制剂、细胞裂解物等样品等中进行体外翻译或纯化。蛋白质可以衍生自或获得自环境样品,例如从环境样品中进行纯化,例如还包含了土壤和水样品或食物样品。样品可以是新鲜制备的,或者其可以以任何方便的方式进行预先处理,例如以供储存。
如以上指出的,在一个优选的实施例中,与本文公开的肽标签和/或本发明的多肽融合的肽或蛋白质可以以重组方式产生,并且因此对所述重组蛋白质进行编码的核酸分子可以衍生自或获得自任何合适的来源,例如任何病毒或细胞材料,包含所有原核或真核细胞、病毒、噬菌体、支原体、原生质体和细胞器。此生物材料因此可以包括所有类型的哺乳动物和非哺乳动物的动物细胞、植物细胞、包含蓝绿藻等藻类、真菌、细菌、原虫、病毒等。在一些实施例中,所述蛋白质可以是合成蛋白质。例如,本文公开的肽和多肽(蛋白质)可以通过如固相肽合成等化学合成产生。
肽标签和/或多肽(肽标签结合配偶体)在重组或合成蛋白内的位置不是特别重要。因此,在一些实施例中,肽标签和/或多肽(肽标签结合配偶体)可以定位在重组或合成多肽的N末端或C末端处。在一些实施例中,肽标签和/或多肽(肽标签结合配偶体)可以向内定位在重组或合成多肽内。因此,在一些实施例中,肽标签和/或多肽(肽标签结合配偶体)可以被视为重组或合成多肽的N末端结构域、C末端结构域或内部结构域。
在一些优选实施例中,多肽(肽标签结合配偶体)优选地定位在重组或合成多肽的N末端或C末端处。因此,在一些实施例中,多肽(肽标签结合配偶体)可以被视为重组或合成多肽的N末端或C末端结构域。
在一些实施例中,可能有用的是在要与肽标签和/或多肽(肽标签结合配偶体)连接或缀合的肽或多肽之间包含一个或多个间隔子,例如肽间隔子。因此,肽、寡肽或多肽以及肽标签和/或多肽(肽标签结合配偶体)可以彼此直接连接,或者其可以通过一个或多个间隔子序列的手段间接连接。因此,间隔子序列可以将重组或合成多肽的两个或更多个单独部分间隔开或分开。在一些实施例中,间隔子可以是肽标签和/或多肽(肽标签结合配偶体)的N末端或C末端。在一些实施例中,间隔子可以位于肽标签和/或多肽(肽标签结合配偶体)的两侧处。
间隔子序列的精确性质并不是关键的,并且其可以具有可变长度和/或序列,例如其可以具有1-40个,更具体地2-20个、1-15个、1-12个、1-10个、1-8个或1-6个残基,例如6个、7个、8个、9个、10个或更多个残基。通过代表性实例的方式,间隔子序列,如果存在的话可以具有1-15个、1-12个、1-10个、1-8个或1-6个残基等。残基的性质并不是关键的,并且其可以是例如任何氨基酸,例如中性氨基酸或脂肪族氨基酸,或者可替代地其可以是疏水的、或极性的、或带电的或结构形成的,例如脯氨酸。在一些优选实施例中,接头是富含丝氨酸和/或甘氨酸的序列。
示例性间隔子序列因此包含任何单氨基酸残基,例如S、G、L、V、P、R、H、M、A或E或由此类残基中的一个或多个残基构成的二、三、四五或六肽。
因此,在一些实施例中,本发明提供了一种重组或合成多肽,所述重组或合成多肽包括如上定义的本发明的多肽(肽标签结合配偶体),即包括与本发明的多肽(肽标签结合配偶体)融合的肽或多肽(例如异源肽或多肽,即通常不与例如来自不同生物体的本发明的多肽缔合的肽或多肽)的重组或合成多肽。所述重组或合成多肽任选地包括如上定义的间隔子。
本发明的重组或合成多肽还可以包括用于促进其纯化(例如在用于下文讨论的本发明的方法和用途之前)的纯化部分或标签。任何合适的纯化部分或标签可以并入到多肽中,并且此类部分是本领域众所周知的。例如,在一些实施例中,重组或合成多肽可以包括肽纯化标签或部分,例如His标签或C标签序列。此类纯化部分或标签可以并入在多肽内的任何位置处。在一些优选实施例中,所述纯化部分定位在多肽的N末端或C末端处或朝向N末端或C末端(即在多肽的5个、10个、15个、20个氨基酸内)。
如以上指出的,本发明的优点源于两部分接头的并入在肽或多肽(例如本发明的重组或合成多肽)中的肽标签和/或多肽(肽标签结合配偶体)可以是经完全遗传编码的事实。因此,在另外的方面,本发明提供了一种对如上定义的多肽(肽标签结合配偶体)或重组或合成多肽进行编码的核酸分子。
在一些实施例中,所述核酸分子是针对宿主细胞中的表达进行密码子优化的。因此,在一些实施例中,所述核酸分子是针对在如大肠杆菌(E.coli)等细菌细胞中的表达进行优化的密码子,例如SEQ ID NO:9中所示的核苷酸序列。因此,在一些实施例中,所述核酸分子是针对在如人类细胞等哺乳动物细胞,例如HEK细胞中的表达进行优化的密码子,例如SEQ ID NO:10中所示的核苷酸序列。
在一些实施例中,对以上定义的多肽结合配偶体进行编码的核酸分子包括如SEQID NO:9或10中所示的核苷酸序列,或与如SEQ ID NO:9或10中所示的序列具有至少80%序列同一性的核苷酸序列。
优选地,以上核酸分子与其所比较的序列至少85%、90%、95%、96%、97%、98%、99%或100%相同。
核酸序列同一性可以通过例如使用GCG包的FASTA搜索,利用默认值和可变pam因子以及设置为12.0的缺口产生罚分和设置为4.0的缺口延伸罚分以及6个核苷酸的窗口确定。优选地,所述比较在全长的序列上进行,但也可以在较小的比较窗口,例如少于600个、500个、400个、300个、200个、100个或50个连续核苷酸上进行。
本发明的核酸分子可以由核糖核苷酸和/或脱氧核糖核苷酸以及能够参与沃森-克里克(Watson-Crick)类型或类似碱基对相互作用的合成残基,例如合成核苷酸构成。优选地,所述核酸分子是DNA或RNA。
以上描述的核酸分子可以与表达控制序列或含有此重组DNA分子的重组DNA克隆媒剂或载体操作性地连接。这允许肽和本发明的多肽以基因产物的形式表达,其表达由引入到所关注细胞中的基因引导。基因表达从在所关注细胞中有活性的启动子引导,并且可以插入在任何形式的线性或环状核酸(例如DNA)载体中以并入在基因组中或以进行独立复制或瞬时转染/表达。合适的转化或转染技术在文献中很好地进行了描述。可替代地,可将裸核酸(例如DNA或RNA,其可以包含一个或多个合成残基,例如碱基类似物)分子直接引入到细胞中以产生本发明的多肽。可替代地,可以通过体外转录将核酸转换为mRNA,并且可以通过体外翻译生成相关蛋白质。
适当的表达载体包含在匹配阅读框中与本发明的核酸分子连接的适当的控制序列,例如翻译(例如起始密码子和终止密码子、核糖体结合位点)和转录控制元素(例如启动子-操纵子区、封端终止序列)。适当的载体可以包含质粒和病毒(包含噬菌体和真核病毒)。合适的病毒载体包含杆状病毒以及还有腺病毒、腺相关病毒、慢病毒、疱疹和痘苗/痘病毒。许多其它病毒载体在本领域进行了描述。合适的载体的实例包含细菌和哺乳动物表达载体pGEX-KG、pEF-neo和pEF-HA。
如以上指出的,本发明的重组或合成多肽可以包括另外的序列(例如用于促进多肽的纯化的肽/多肽标签),并且因此核酸分子可以方便地与对另外的肽或多肽,例如His标签、麦芽糖结合蛋白等进行编码的DNA融合以在表达时产生融合蛋白。
因此,从另外的方面看,本发明提供了一种包括如上定义的核酸分子的载体,优选地表达载体。
本发明的其它方面包含用于制备根据本发明的重组核酸分子的方法,所述方法包括将对本发明的多肽(肽标签结合配偶体)进行编码的本发明的核酸分子插入到载体核酸中。
优选地容纳在载体中的本发明的核酸分子可以通过任何适当的手段引入到细胞中。合适的转化或转染技术在文献中很好地进行了描述。许多技术是已知的并且可以用于将此类载体引入到原核或真核细胞中以进行表达。出于此目的的优选宿主细胞包含昆虫细胞系、酵母、哺乳动物细胞系或大肠杆菌,如菌株BL21(DE3)。本发明还延伸到含有核酸分子,具体地是是如上定义的载体的经转化或经转染的原核或真核宿主细胞。
因此,在另一方面,提供了一种含有如上所述的核酸分子和/或载体的重组宿主细胞。
“重组”意指已将核酸分子和/或载体引入到宿主细胞中。宿主细胞可以或可以不天然含有核酸分子的内源副本,但其是重组的,因为已经引入了核酸分子和/或载体的外源或另外的内源副本。
本发明的另外的方面提供了一种制备本发明的多肽(肽标签结合配偶体)或如上文定义的重组多肽的方法,所述方法包括在由此对所述多肽(肽标签结合配偶体)进行编码的所述核酸分子进行表达并且回收由此产生的所述分子(多肽(肽标签结合配偶体))的条件下培养含有如上定义的核酸分子的宿主细胞。所表达的多肽(肽标签结合配偶体)形成本发明的另外的方面。
在一些实施例中,本文公开的肽标签和/或本发明的或用于本发明的方法和用途的多肽(肽标签结合配偶体)可以以合成方式生成,例如通过连接氨基酸或更小的合成生成的肽,或更方便地通过对如上文所述的所述多肽进行编码的核酸分子的重组表达。
本发明的核酸分子可以通过本领域已知的任何合适的手段以合成方式生成。
因此,本文公开的肽标签和/或本发明的多肽(肽标签结合配偶体)可以是分离的、经纯化的、重组的或合成的肽标签或多肽。
术语“多肽”在本文中与术语“蛋白质”可互换使用。如以上指出的,术语多肽或蛋白质通常包含包括至少40个连续氨基酸残基,例如至少50个、60个、70个、80个、90个、100个、150个氨基酸,如40-1000个、50-900个、60-800个、70-700个、80-600个、90-500个、100-400个氨基酸的任何氨基酸序列。
类似地,本发明的核酸分子可以是分离的、经纯化的、重组的或经合成的核酸分子。
因此,可替代地看到的,本发明的多肽和核酸分子优选地是非天然的,即非天然存在的分子。
本文使用了标准氨基酸命名法。因此,氨基酸残基的全名与单字母代码或三字母缩写可互换使用。例如,赖氨酸可以被K或Lys取代,异亮氨酸可以被I或Ile取代,等等。此外,术语天门冬氨酸和天冬氨酸以及谷氨酸盐和谷氨酸在本文中可互换使用并且可以分别被Asp或D、或Glu或E代替。
虽然设想了本文公开的肽标签和本发明的并用于本发明的多肽(肽标签结合配偶体)可以以重组方式产生,并且这是本发明的优选实施例,但显而易见的是本文公开的肽标签和本发明的多肽(肽标签结合配偶体)可以如上定义的通过其它手段与蛋白质或其它实体,例如分子或组分缀合。换言之,肽标签或多肽(肽标签结合配偶体)和其它分子、组分或实体,例如蛋白质,可以通过任何合适的手段,例如以重组方式单独产生,并且随后缀合(接合)以形成可以用于本发明的方法和用途的肽标签-其它组分缀合物或多肽(肽标签结合配偶体)-其它组分缀合物。例如,本文公开的肽标签和/或本发明的多肽(肽标签结合配偶体)可以如上所述以合成方式或以重组方式产生,并且通过非肽接头或间隔子,例如化学接头或间隔子与另一组分,例如蛋白质缀合。
因此,在一些实施例中,肽标签和/或多肽(肽标签结合配偶体)和其它组分,例如蛋白质,可以通过键直接或通过连接基团间接接合在一起。在采用连接基团的情况下,可以选择此类基团以提供肽标签或多肽(肽标签结合配偶体)与其它实体(例如蛋白质)通过连接基团的共价连接。所关注的连接基团可能差别很大,这取决于其它实体,例如蛋白质的性质。在存在的情况下,所述连接基团在许多实施例中是生物学惰性的。
许多连接基团是本领域的技术人员已知的并且可用于本发明。在代表性实施例中,连接基团总体上为至少约50道尔顿,通常为至少约100道尔顿并且可以大至1000道尔顿或更大,例如,如果连接基团含有间隔子,则至多1000000道尔顿,但总体上不会超过约500道尔顿并且通常将不会超过约300道尔顿。总体上,此类接头将包括封端在任何端部处的具有能够与肽标签或结合配偶体和其它分子或组分,例如蛋白质共价结合的反应性官能团的间隔子基团。
所关注的间隔子基团可以包含脂肪族和不饱和烃链、含有如氧(如聚乙二醇等醚)或氮(多胺)等杂原子的间隔子、肽、碳水化合物、可能含有杂原子的环形或无环系统。间隔子基团还可以包含与金属结合的配体,使得金属离子的存在使两个或更多个配体配位以形成复合物。具体的间隔子元素包含:1,4-二氨基己烷、苯二甲胺、对苯二甲酸、3,6-二氧苯贰酸、乙二胺-N,N-二乙酸、1,1'-亚乙基双(5-氧-3-吡咯烷羧酸)、4,4'-亚乙基二哌啶、低聚乙二醇和聚乙二醇。潜在的反应性官能团包含亲核官能团(胺、醇、硫醇、酰肼)、亲电官能团(醛、酯、乙烯基酮、环氧化物、异氰酸酯、马来酰亚胺)、能够进行环加成反应、形成二硫键或与金属结合的官能团。具体实例包含伯胺和仲胺、异羟肟酸、N-羟基琥珀酰亚胺酯、N-羟基琥珀酰亚胺碳酸酯、氧代羰基咪唑、硝基苯酯、三氟乙基酯、缩水甘油醚、乙烯基砜和马来酰亚胺。可用于肽标签/多肽结合配偶体缀合物的特定接头基团包含杂官能化合物,如叠氮苯甲酰肼、N-[4-(对叠氮基水杨基氨基)丁基]-3'-[2'-吡啶基二硫基]丙酰胺)、双磺基琥珀酰亚胺辛二酸酯、二甲基己二酰亚胺、双琥珀酰亚胺酒石酸酯、N-马来酰亚胺基丁酰氧基琥珀酰亚胺酯、N-羟基磺基琥珀酰亚胺基-4-叠氮苯甲酸酯、N-琥珀酰亚胺基[4-叠氮苯基]-1,3'-二硫代丙酸酯、N-琥珀酰亚胺基[4-碘乙酰基]氨基苯甲酸酯、戊二醛和琥珀酰亚胺基-4-[N-马来酰亚胺基甲基]环己烷-1-羧酸酯、3-(2-吡啶基二硫代)丙酸N-羟基琥珀酰亚胺酯(SPDP)、4-(N-马来酰亚胺基甲基)-环己烷-1-羧酸N-羟基琥珀酰亚胺酯(SMCC)等。例如,间隔子可以利用叠氮化物与炔烃反应形成或利用四嗪与反式环辛烯或降冰片烯反应形成。
在一些实施例中,可能有用的是对肽标签和/或多肽(肽标签结合配偶体)中的一个或多个残基进行修饰以促进这些分子的缀合和/或提高肽标签和/或多肽(肽标签结合配偶体)的稳定性。因此,在一些实施例中,本文公开的肽标签或本发明的或用于本发明的多肽(肽标签结合配偶体)可以包括非天然或非标准氨基酸。
在一些实施例中,本文公开的肽标签或本发明的或用于本发明的多肽(肽标签结合配偶体)可以包括一个或多个,例如至少1个、2个、3个、4个、5个非常规氨基酸,如10个、15个、20个或更多个非常规氨基酸,即具有不是由标准遗传代码编码的侧链的氨基酸,其在本文中被称为“非编码的氨基酸”。此类氨基酸是本领域众所周知的并且可以选自通过代谢过程形成的氨基酸,如鸟氨酸或酒石酸,和/或经人工修饰的氨基酸,如9H-芴-9-基甲氧羰基(Fmoc)、(叔)-丁(氧)羰基(Boc)、2,2,5,7,8-五甲基色满-6-磺酰基(Pmc)保护的氨基酸或具有苄氧基-羰基(Z)基团的氨基酸。
可用于肽标签或本发明的和用于本发明的多肽(肽标签结合配偶体)的非标准或结构类似氨基酸的实例是D氨基酸、酰胺等排体(如N-甲基酰胺、逆反酰胺、硫代酰胺、硫酯、膦酸酯、酮亚甲基、羟基亚甲基、氟乙烯基、(E)-乙烯基、亚甲基氨基、亚甲基硫基或烷烃)、L-N甲基氨基酸、D-α甲基氨基酸、D-N-甲基氨基酸。可用于本文公开的肽标签和/或本发明的和用于本发明的多肽的另外的非标准氨基酸公开于Willis和Chin,《自然化学(NatChem.)》2018;10(8):831-837中于WO2018/189517和WO2018/197854的表1中,所述文献全部在此通过引用并入。
在一些实施例中,可能有用的是将本文公开的肽标签和/或本发明的多肽(肽标签结合配偶体)与固体底物(即固相或固体支撑物)融合或缀合,并且将显而易见的是这可以通过任何方便的方式实现。因此,固定的方式或手段和固体支撑物可以根据选择选自如本领域广泛已知和文献中描述的任何数量的固定手段和固体支撑物。因此,肽标签和/或多肽(肽标签结合配偶体)可以例如通过肽标签或多肽(肽标签结合配偶体)的结构域或部分(例如经化学交联的)与支撑物直接结合。在一些实施例中,肽标签或多肽(肽标签结合配偶体)可以通过接头基团的手段或通过中间结合基团(例如通过生物素-链霉亲和素相互作用的手段)间接结合。因此,肽标签或多肽(肽标签结合配偶体)可以与固体支撑物共价或非共价连接。连接可以是可逆的(例如可切割的)或不可逆的连接。因此,在一些实施例中,连接可以以酶促方式、以化学方式或用光切割,例如连接可以是光敏连接。
因此,在一些实施例中,肽标签或多肽(肽标签结合配偶体)可以利用用于提供在支撑物上的固定的手段(例如能够与其结合配偶体,即同源结合配偶体,例如链霉亲和素或抗体结合的亲和结合配偶体,例如生物素或半抗原)提供。在一些实施例中,肽标签或多肽(肽标签结合配偶体)与固体支撑物之间的相互作用必须强大到足以允许进行洗涤步骤,即肽标签或多肽(肽标签结合配偶体)与固体支撑物之间的相互作用不会被洗涤步骤破坏(显著破坏)。例如,优选的是利用每个洗涤步骤,将少于5%,优选地少于4%、3%、2%、1%、0.5%或0.1%的肽标签或多肽(肽标签结合配偶体)从固相去除或洗脱。
固体支撑物(相或底物)可以是目前广泛用于或建议用于固定、分离等的任何众所周知的支撑物或基质。这些可以采取颗粒的形式(例如可以是磁性的、顺磁性的或非磁性的珠)、片材、凝胶、过滤器、膜、纤维、毛细管、载玻片、阵列或微量滴定条、管、板或孔等。
所述支撑物可以由玻璃、二氧化硅、乳胶或聚合材料,例如多糖聚合物材料,如琼脂糖(例如琼脂糖凝胶)制成。合适的是呈现高表面积的用于结合本发明的多肽的材料。此类支撑物可以具有不规则表面并且可以是例如多孔的或例如颗粒等微粒、纤维、网、烧结体或筛。微粒材料,例如珠,由于其更大的结合能力可用,特别是聚合物珠。
方便地,根据本发明使用的微粒状固体支撑物将包括球形珠。珠的大小并不关键,但其大约直径可以为例如至少约1μm并且优选地至少约2μm、5μm、10μm或20μm,并且其最大直径优选地不多于约500μm,并且例如不多于约100μm。
单分散颗粒,即大小基本上均匀(例如直径标准偏差小于5%的大小)的那些的优点是其提供了非常均匀的反应再现性。代表性单分散聚合物颗粒可以通过US-A-4336173中描述的技术产生。
然而,为了协助操纵和分离,磁珠是有利的。如本文所用,术语“磁性”意指当放置在磁场中时支撑物能够具有赋予其的磁矩,并且因此在所述磁场的作用下可移位。换言之,包括磁性颗粒的支撑物可以通过磁性聚集容易地去除,这提供了在异肽键形成步骤之后将颗粒分离的快速、简单且高效的方式。
在一些实施例中,固体支撑物是树脂,例如直链淀粉树脂。
在另外的实施例中,本发明提供了一种试剂盒,具体地用于本发明的方法和用途,即用于通过异肽键将两个分子或组分缀合的试剂盒,其中所述复合物中的所述分子或组分中的两个通过异肽键缀合,其中所述试剂盒包括:
(a)如上定义的多肽(肽标签结合配偶体),所述多肽任选地与分子或组分,例如蛋白质,如包括如上定义的多肽(肽标签结合配偶体)的重组或合成多肽缀合或融合;以及
(b)如上定义的肽(肽标签),所述肽任选地与分子或组分,例如蛋白质缀合或融合;和/或
(c)对如(a)中定义的多肽(肽标签结合配偶体)进行编码的核酸分子,具体地是载体;以及
(d)对如(b)中定义的肽标签进行编码的核酸分子,具体地是载体。
显而易见的是,本文公开的肽标签和本发明的多肽(肽标签结合配偶体)可以有广泛范围的效用。可替代地看到的,本文公开的肽标签和本发明的多肽(肽标签结合配偶体)可以用于各个行业。
例如,在一些实施例中,本文公开的肽标签和本发明的多肽(肽标签结合配偶体)可用于将荧光或其它生物物理学探针或标记物靶向到特定蛋白质。在此方面,可以对所关注的蛋白质进行修饰以并入如上讨论的肽标签(例如,SEQ ID NO:3-6之一),并且荧光或其它生物物理学探针或标记物可以与多肽(肽标签结合配偶体,例如SEQ ID NO:1或2)融合或缀合。经修饰的蛋白质和探针或标记物可以在适于允许在肽标签与多肽(肽标签结合配偶体)之间自发形成异肽键的条件下接触在一起,由此通过异肽键用标记物或探针对蛋白质进行标记。例如,本发明的标记的多肽可用于无抗体的蛋白质印迹,即其中标记的多肽用于在无需单独标记的抗体的情况下检测含有SpyTag肽(例如,具有如SEQ ID NO:3-6之一中所示的氨基酸序列的肽)的多肽。
在一些实施例中,本文公开的肽标签和本发明的多肽(肽标签结合配偶体)可用于蛋白质组学的蛋白质固定化。在此方面,可以对所关注的蛋白质进行修饰以并入肽标签(例如,SEQ ID NO:3-6之一),并且固体底物可以与多肽(肽标签结合配偶体,例如SEQ ID NO:1或2)融合或缀合。经修饰的蛋白质和固体底物可以在适于允许在肽标签与多肽(肽标签结合配偶体)之间自发形成异肽键的条件下接触在一起,由此通过异肽键将蛋白质固定在固体底物上。将显而易见的是,本文公开的肽标签和本发明的多肽(肽标签结合配偶体)可以用于将多个蛋白质同时固定在固相/底物上,即在多路复用反应中。
在仍另外的实施例中,本文公开的肽标签和本发明的多肽(肽标签结合配偶体)可用于将抗原与病毒样颗粒、病毒、细菌或多聚化支架缀合以进行免疫。例如,在表面上产生展示本发明的多肽(肽标签结合配偶体)(例如SEQ ID NO:1或2)的病毒样颗粒、病毒或细菌将促进包括肽标签(例如,SEQ ID NO:3-6之一)的抗原通过异肽键与其表面缀合。在此方面,抗原多聚化引起大大增强的免疫应答。因此,在一些实施例中,与本发明的多肽融合的分子或组分是病毒衣壳蛋白和/或与肽标签融合的分子或组分是抗原,例如与特定疾病,例如感染、自身免疫性疾病、过敏或癌症相关的抗原。
在其它实施例中,本文公开的肽标签和本发明的多肽(肽标签结合配偶体)可用于使酶环化,例如通过将肽标签和结合配偶体与酶的每个端部融合并随后允许在肽标签与多肽(肽标签结合配偶体)之间自发形成异肽键。在此方面,酶的环化已被证明可增加酶弹性。
具体地,酶或酶聚合物(融合蛋白)的环化可以提高酶聚合物中的蛋白质或蛋白质单元的热稳定性。在此方面,酶是许多方法中的宝贵工具,但不稳定且难以回收。酶聚合物对温度、pH和有机溶剂具有更大的稳定性,并且越来越期望将酶聚合物用于工业工艺中。然而,酶聚合物生成通常使用戊二醛非特异性反应,并且这会使许多潜在有用的酶损害或变性(即降低其活性)。使用本文公开的肽标签和本发明的多肽(肽标签结合配偶体)通过异肽键将蛋白质位点特异性连接到链(聚合物)中预期会增强酶弹性,如在诊断或添加到动物饲料中的酶中。在特别优选的实施例中,酶可以如上所讨论的通过环化来稳定。
本文公开的肽标签和本发明的多肽(肽标签结合配偶体)还可以用于将多种酶连接到如WO 2016/193746中所述的用于推动代谢效率的通路中。在此方面,酶通常聚集在一起以在细胞内的通路中起作用,并且传统上难以将多种酶一起连接在细胞外(体外)。因此,本文公开的肽标签和本发明的多肽(肽标签结合配偶体)可以用于偶联或缀合酶以产生融合蛋白并且因此增强多步骤酶通路的活性,这可用于一系列工业转化和诊断。
本文公开的肽标签和本发明的多肽(肽标签结合配偶体)还将用于产生抗体聚合物。在此方面,抗体是最重要类别的药物之一并且通常附着在表面上使用。然而,样品中的抗原混合以及因此在所述样品中捕获所述抗原在表面附近是低效的。通过延长抗体链,预计将提高捕获效率。这在循环肿瘤细胞分离中尤其有价值,所述肿瘤细胞分离目前是用于实现早期癌症诊断的最有希望的方式之一。
在仍另外的实施例中,本文公开的肽标签和本发明的多肽(肽标签结合配偶体)可用于产生用于激活细胞信号传导的药物。在此方面,用于激活细胞功能的最有效方式中的许多方式是通过蛋白质配体。然而,在自然界中,蛋白质配体通常不会单独操作,而是与其它信号传导分子的特定组合一起操作。因此,本文公开的肽标签和本发明的多肽(肽标签结合配偶体)允许产生可以提供对细胞信号传导的最优激活的定制的融合蛋白(即蛋白质组)。这些融合蛋白(蛋白质组)可用于控制细胞存活、分裂或分化。
在仍另外的实施例中,本文公开的肽标签和本发明的多肽(肽标签结合配偶体)可用于生成水凝胶以供真核细胞,例如神经元、干细胞的生长、生物材料的制备、用染料或酶进行的抗体功能化和通过环化稳定酶。
现在将参考以下附图在以下非限制性实例中更详细地描述本发明的多肽:
图1示出了描绘SpyTag/SpyCatcher对在(A)10nM、(B)100nM和(C)10μM下的反应速率的图表。在25℃下用相同量的SpyCatcher变体(均值±1s.d.,n=3)对指定浓度的SpyTag-sfGFP变体进行温育持续所指示时间。
图2示出了对与SpyTag003反应的SpyCatcher003的恒定常数进行定量的图表。将10nM SpyTag003-MBP与10nM SpyCatcher003-sfGFP(均值±1s.d.,n=3)反应。示出了最佳拟合线的方程、相关系数和导出的二阶速率常数。
图3示出了考马斯染色的SDS-PAGE凝胶的照片,其示出了各种多肽混合物的产物。SDS-PAGE凝胶示出SpyTag003和SpyCatcher003反应到高产率并且99%完成。用其中任一种成分两倍过量的SpyTag003-MBP对SpyCatcher003进行温育持续11/2小时。
图4示出了描绘SpyCatcher003的差示扫描量热法的图表。指出了熔化温度(Tm)和半最大值全宽度(FWHM)。
图5示出了显示SpyCatcher003与SpyTag003 DA(SEQ ID NO:11)相互作用的ITC的绘图。
图6示出了(A)细胞表面构建体的卡通模型;(B)从承载SpyCatcher、SpyCatcher003或SpyCatcher003 EA并且用myc标签的抗体通过流式细胞术对表面表达进行染色的HEK细胞的流式细胞术获得的图表;(C)从承载SpyCatcher、SpyCatcher003或SpyCatcher003 EA的在流式细胞术之前用SpyTag003-mKate2温育并染色的HEK细胞的流式细胞术获得的图表;以及(D)示出了对表面反应性的量化的图表。如(C)中的通过流式细胞术分析的细胞的SpyTag003染色的时间过程(均值±1s.d.,n=3)。
图7示出了通过蛋白质印迹产生的硝酸纤维素膜的照片。用SpyCatcher003-680(左)和抗GAPDH作为上样对照(在不同荧光波长下用二级抗体检测;中央)对来自黑腹果蝇(Drosophila melanogaster)、大肠杆菌、人Expi293细胞或酿酒酵母(Saccharomycescerevisiae)的细胞裂解物同时进行印迹处理。这2个信号的合并示出在右边。在+泳道中,将3pmol SpyTag003-MBPa掺杂到裂解物中作为阳性对照。
实例
实例1-产生扩散受控的蛋白质偶联:SpyTag003/SpyCatcher003
使用合理设计以提高SpyTag/SpyCatcher相互作用的电荷互补性和氢结合能力,目的是进一步改变反应性以朝扩散极限移动。
先前在WO 2018/197854中示出,用天冬氨酸取代位于SpyCatcher002(SEQ ID NO:7)的位置97处的谷氨酰胺残基导致多肽与SpyTag肽的反应速率增加。假设位于此位置处的天冬氨酸可以与赖氨酸108形成静电相互作用,由此增加SpyCatcher变体的两个环之间的相互作用的稳定性。
然而,意外地发现用谷氨酸对位于位置108处的赖氨酸进行的非保守取代进一步提高了SpyCatcher变体的反应速率。假设此取代可以改善SpyTag003(SEQ ID NO:3)的C末端精氨酸和赖氨酸的长距相互作用。
用谷氨酸对位于SpyCatcher002的位置91处的苏氨酸进行的进一步非保守取代和用天冬氨酸对位于SpyCatcher002的位置103处的天冬酰胺进行的另一个取代也起到提高SpyCatcher变体的反应速率的作用。假设这些突变补充了SpyTag002(SEQ ID NO:4)和SpyTag003(SEQ ID NO:3)肽上带正电的残基的增加,并且可以使SpyCatcher构象预定向以供SpyTag对接,由此提高反应速率。
用脯氨酸对位于SpyCatcher002(SEQ ID NO:7)的位置89处的丙氨酸残基的取代先前已被证明可提高多肽与SpyTag肽的反应速率(参见WO 2018/197854)。
如下所示,相对于SpyCatcher002(SEQ ID NO:7)的这五个取代,即A89P、T91E、Q97D、N103D和K108E组合起来以将SpyCatcher变体(本文被称为SpyCatcher003,SEQ IDNO:1)的反应速率提高另外的数量级。
实例2-对SpyTag003和SpyCatcher003反应速率的验证
通过将SpyCatcher003(SEQ ID NO:1)与超折叠GFP(sfGFP)的N末端融合并且与SpyTag003-MBP反应对异肽键形成的速率进行分析。与sfGFP的融合使得能够通过荧光以对于考马斯染色(Coomassie staining)来说太低的蛋白质浓度(10nM)对反应进行监测。SpyTag003/SpyCatcher003在10nM(图1A)、100nM(图1B)和10μM(图1C)下的反应基本上比前几个传代-SpyTag/SpyCatcher(SEQ ID No:5/8)和SpyTag002/SpyCatcher002(SEQ ID No:4/7)发生得更快。此提高的反应性在所测试的最低浓度(10nM)下最显著,其中SpyTag003/SpyCatcher003(SEQ ID No:3/1)反应在约20分钟内已完成,在此期间发生了最小SpyTag/SpyCatcher反应。SpyTag003/SpyCatcher003(图2)的二阶速率常数为5.5±0.6×105M-1s-1,比SpyTag/SpyCatcher先前示出的1.4×103M-1s-1快几个数量级(Zakeri等人,2012《美国国家科学院院刊》109,E690-E697),并且比SpyTag002/SpyCatcher002的2.0×104M-1s-1快一个数量级(Keeble等人,2017,同上)。考虑到反应物种的大小,003对的异肽形成的速率现在在105-106M-1s-1范围内被描述为扩散受控的蛋白质-蛋白质相互作用的开始。
003对保持与先前的SpyTag/SpyCatcher传代可后向兼容(以下表1和2),并且此分析还表明,Tag和Catcher两者的改变有助于提高反应速度。
表1-SpyCatcher003可与SpyTag肽兼容
速率常数(M<sup>-1</sup>s<sup>-1</sup>) SpyTag-MBP SpyTag002-MBP SpyTag003-MBP
SpyCatcher003-sfGFP 2.4(±0.2)×10<sup>4</sup> 8.3(±0.2)×10<sup>4</sup> 5.5(±0.6)×10<sup>5</sup>
SpyCatcher003-sfGFP与SpyTag003和与MBP相关的早期版本反应的速率常数(均值±1s.d.,n=3)。
表2-SpyTag003可与SpyCatcher多肽兼容
速率常数(M<sup>-1</sup>s<sup>-1</sup>) SpyCatcher-sfGFP SpyCatcher002-sfGFP SpyCatcher003-sfGFP
SpyTag003-MBP 3.9(±0.3)×10<sup>4</sup> 1.3(±0.1)×10<sup>5</sup> 5.5(±0.6)×10<sup>5</sup>
SpyTag003-MBP与SpyCatcher003和与sfGFP相关的早期版本反应的速率常数(均值±1s.d.,n=3)。
通过SDS-PAGE验证了这些蛋白质缺乏副反应,以示出当与过量的其配偶体一起温育时,两种003蛋白质反应到>95%完成(图3)。
实例3-SpyTag003/SpyCatcher003对的生物物理性表征
电喷雾离子化质谱验证了SpyTag003与SpyCatcher003之间的异肽键形成,与组分部分的分子量的总和相比损失了18Da。差示扫描量热法(图4)示出SpyCatcher003的热稳定性(Tm)为48.2℃,接近先前对SpyCatcher(48.5℃)和SpyCatcher002(49.9℃)报告的。因此,用于将SpyCatcher002更改为SpyCatcher003的五个突变的存在对稳定性仅具有很小的影响。尽管Tm略微下降,但峰(10.5℃)的半最大值全宽度(FWHM)比SpyCatcher(16℃)或SpyCatcher002(12℃)小(Keeble等人,2017,同上),这表明蛋白质去折叠更具合作性。
等温滴定量热法(ITC)用于对在SpyTag003与SpyCatcher003相互作用时出现的初始非共价复合物的亲和力进行估计。这是通过使SpyTag003的反应性天冬氨酸突变为丙氨酸以产生SpyTag003 DA-MBP实现的,这种突变方法是先前用于SpyTag/SpyCatcher的方法(Zakeri等人,2012,同上)。与先前示出的SpyTag DA-MBP与SpyCatcher的相对较弱的结合(Kd=200μM)相反(Zakeri等人,2012,同上),SpyTag003 DA-MBP与SpyCatcher003的结合太紧密以至于无法通过ITC进行测量(图5),这表明Kd比10nM更紧密。
实例4-哺乳动物细胞表面处的快速和特异性反应
通过使用转铁蛋白受体-sfGFP融合在人类细胞的质膜上展示对SpyTag003/SpyCatcher003对在哺乳动物细胞上的速度和特异性进行研究(图6A)。通过流式细胞术确认构建体的表面展示,从而对myc标签进行染色(图6B)。此分析揭示了SpyCatcher和SpyCatcher003以及非反应性对照SpyCatcher003 EA(包括取代E77A)的膜表达的水平相似。使用低浓度(20nM)的SpyTag-mKate2针对表面展示的SpyCatcher或使用SpyTag003-mKate2针对表面展示的SpyCatcher003对与SpyTag融合蛋白的反应进行测试。对于SpyTag/SpyCatcher,大级分的细胞与非反应性对照重叠,而对于SpyTag003/SpyCatcher003,可以从用SpyCatcher003 EA染色的背景中清楚地分辨大部分细胞(图6C)。对此染色的动力学进行了跟踪,这示出用003对进行的染色基本上比原始SpyTag/SpyCatcher更快(图6D)。
作为对SpyTag003/Spycatcher003反应的特异性的对照,在与上述相同的条件下对SpyCatcher003 E77A突变体进行了分析。此突变使催化异肽键形成的谷氨酸缺失,因此防止了与SpyTag构建体的反应(Zakeri等人,2012,同上)。尽管SpyCatcher003EA以与野生型相似的水平表达(图6B),但未观察到mKate2荧光的快速增益(图6C和D),这证实了SpyTag003/SpyCatcher003的特定反应正在发生。
实例5–SpyCatcher003对蛋白质印迹的应用
为了进一步测试SpyTag003:SpyCatcher003相互作用的特异性,对来自一系列常见模式生物的裂解物使用了蛋白质印迹。使用与近红外荧光团DyLight680相关的马来酰亚胺对SpyCatcher003S49C进行位点特异性标记。针对来自大肠杆菌、人类细胞(Expi293细胞系)、酿酒酵母和黑腹果蝇的细胞裂解物执行印迹。作为阳性对照,使这些细胞裂解物中的每个细胞裂解物掺杂有少量(3pmol)的SpyTag003融合。对于每个物种,观察到SpyTag003融合的有效识别和与内源性细胞蛋白的最小交叉反应性(图7)。抗甘油醛-3-磷酸脱氢酶(α-GAPDH)上样对照示出物种之间与GADPH的结合有一些差异,但在利用或不利用SpyTag003融合的情况下染色等效(图7)。
方法
质粒和克隆
使用Q5高保真聚合酶(NEB)或KOD聚合酶(EMD密理博公司(EMD Millipore))和Gibson组装通过标准方法执行基于PCR的克隆和定点诱变。通过桑格测序(Sangersequencing)确认所有构建体的同一性。先前对pDEST14-SpyCatcher(GenBank JQ478411,Addgene质粒ID 35044)、pET28a-SpyTag-MBP(Addgene质粒ID 35050)、pDEST14SpyCatcher002(GenBank MF974388,Addgene质粒ID 102827)、pET28a SpyTag002-MBP(GenBank MF974389,Addgene质粒ID 102831)、pJ404-SpyCatcher-sfGFP和pJ404-SpyCatcher002-sfGFP进行了描述(Zakeri等人,2012,同上;Keeble等人,2017,同上)。从pDEST14 SpyCatcher002(Keeble等人,2017,同上)并入以下突变得到pDEST14SpyCatcher003:A89P、T91E、Q97D、N103D和K108E。从并入SpyCatcher003以替代pJ404-SpyCatcher002中的SpyCatcher002得到pJ404-SpyCatcher003-sfGFP(Keeble等人,2017,同上)。pDEST14-SpyCatcher003 S49C包含使得能够用马来酰亚胺染料进行标记的丝氨酸到半胱氨酸突变。通过进行T3H突变并且通过在SpyTag002的N末端处插入Arg-Gly对从pET28a-SpyTag002得到pET28a-SpyTag003-MBP。通过反应性天冬氨酸到丙氨酸的突变(RGVPHIVMVAAYKRYK,SEQ ID NO:11)从pET28a-SpyTag003-MBP得到pET28a-SpyTag003 DA-MBP。
使用以下执行执行SpyCatcher蛋白的哺乳动物膜表达:pENTR4-TfR-sfGFP-myc标签-SpyCatcher(其中TfR是并入C20和A23突变的转铁蛋白受体跨膜结构域)、pENTR4-TfR-sfGFP-myc标签-SpyCatcher003、pENTR4-TfR-sfGFP-myc标签-SpyCatcher003 E77A(其中突变防止与SpyTag形成异肽键)和pENTR4-TfR-sfGFP-myc标签-SpyCatcher003-CnaB2(其中用SpyTag序列延伸SpyCatcher003的C末端以允许如始祖CnaB2结构域中所见的分子间异肽键形成)。pET28-SpyTag003-mKate2具有SpyTag003-接头-mKate2-接头-His6的组织。pET28-SpyTag-mKate2具有与代替SpyTag003的SpyTag相同的布置。pET28-SpyTag003-sfGFP和pET28-SpyTag003-mClover3具有SpyTag003-接头-荧光蛋白-接头-His6的组织。通过反应性天冬氨酸到丙氨酸的突变从pET28a-SpyTag003-mClover3得到pET28-SpyTag003DA-mClover3。pET28-polyTag-MBP具有His10-接头-HA标签-接头-myc标签-接头-Spot标签-接头-SpyTag003-接头-MBP的组织。
通过Ni-NTA进行的细菌蛋白表达和纯化
将pDEST14-SpyCatcher003和pDEST14-SpyCatcher003 S49C转化成化学感受态大肠杆菌C41 DE3(来自牛津大学安东尼沃茨部门(Anthony Watts,University of Oxford)的赠品),而将所有其它构建体转化成大肠杆菌BL21(DE3)RIPL(安捷伦公司(Agilent))。将单个菌落挑选到含有100μg/mL氨苄青霉素(ampicillin,pDEST14和pJ404)或50μg/mL卡那霉素(kanamycin,pET28a)的10mL LB中,并且在37℃下在以200rpm振荡的情况下生长过夜。对在超产率挡板烧瓶(汤姆森仪器公司(Thomson Instrument Company))中补充有0.8%(w/v)葡萄糖和适当抗生素的1L LB接种1/100稀释的饱和过夜培养物,并且在37℃下在以200rpm振荡的情况下生长。在达到OD600 0.5-0.6之后,对培养物接种0.42mM IPTG,并且在30℃下在以200rpm振荡的情况下温育4-5小时。对于pET28a-SpyTag003-mKate2,将单个菌落挑选到自身诱导培养基加上补充有50μg/mL卡那霉素的1L的微量元素(Formedia公司)中,并且在30℃下在以200rpm振荡的情况下生长24小时。在含有混合蛋白酶抑制剂(罗氏公司(Roche)的cOmplete迷你无EDTA蛋白酶抑制剂鸡尾酒)和1mM苯甲基磺酰氟(PMSF)的1×Ni-NTA缓冲液(50mM Tris-HCl、300mM NaCl,pH 7.8)中收获细胞并通过超声对细胞进行裂解。在使用Ni-NTA树脂(凯杰公司(Qiagen))使用标准程序进行纯化之前,以30,000g对细胞裂解物进行离心持续25分钟。洗脱之后,使用3.5kDa分子量截留Spectra/Por透析管(光谱实验室(Spectrum Labs))利用三次缓冲液改变将蛋白质透析到PBS(137mM NaCl、2.7mMKCl、10mM Na2HPO4、1.8mM KH2PO4、pH 7.5)中。使用来自ExPASy ProtParam的消光系数由OD280确定蛋白质浓度。
异肽键形成测定
在pH 7.0和25℃下在琥珀酸-磷酸-甘氨酸缓冲液(12.5mM琥珀酸、43.75mMNaH2PO4、43.75mM甘氨酸;pH使用NaOH调节到7.0)中执行反应(Keeble等人,2017,同上)。使用XCell SureLock系统(赛默飞世尔科技公司(Thermo Fisher Scientific))在180V下使用SDS-PAGE在16%聚丙烯酰胺凝胶上对反应进行分析。使用荧光图像分析仪FLA-3000(富士胶片公司(FujiFilm))和ImageGauge版本5.21软件对带进行量化。
为了测量浓度依赖率(图1A和2),使SpyCatcher-sfGFP、SpyCatcher002-sfGFP和SpyCatcher003-sfGFP与SpyTag-MBP、SpyTag002-MBP和SpyTag003-MBP反应。使用sfGFP融合以使得能够在低至10nM的浓度下执行反应。在加添加6×SDS上样缓冲液[0.23M TrisHCl pH 6.8,24%(v/v)甘油、120μM溴酚蓝、0.23M SDS]之后在Bio-Rad C1000热循环仪中将反应在50℃下淬灭5分钟以保留sfGFP的荧光。通过将共价复合物的带的强度除以泳道中的所有带的强度并乘以100来计算异肽产物形成百分比。为了校正sfGFP在不同时间点的差异光漂白,通过监测SpyCatcher-变体-sfGFP的带的相对强度的降低来确定共价复合物形成的二阶速率常数,以给出在未经反应的SpyCatcher-变体-sfGFP的浓度方面的改变。在反应曲线的线性部分期间对时间点进行分析。针对时间绘制1/[SpyCatcher变体],并且使用Excel(微软公司(Microsoft))和Origin 2015(原点软件公司(OriginLab Corporation)通过线性回归进行分析。一式三份执行实验,并且数据表示均值±1标准偏差。
为了测量到完成的SpyCatcher003和SpyTag003-MBP反应(图5),在pH 7.0的琥珀酸-磷酸-甘氨酸缓冲液中在25℃下执行实验持续1.5小时,其中一个配偶体在2μM下,并且另一个配偶体在2或4μM下。
等温滴定量热法
使用Microcal PEAQ-ITC量热计(马尔文公司(Malvern))在20℃下在PBS pH 7.4中执行实验。在细胞中使用20μM SpyCatcher003,并且利用以注射器20次注射210μMSpyTag003-DA-MBP进行滴定。使用MicroCal PEAQ-ITC分析软件版本1.1.0.1262使用1:1结合模型执行分析。
差示扫描量热法
在MicroCal PEAQ-DSC(马尔文公司)上在PBS pH 7.5中利用30μM SpyCatcher、SpyCatcher002或SpyCatcher003执行实验。在3℃/分钟的扫描速率下以3atm监测从20℃到100℃的热转变。使用MicroCal PEAQ-DSC分析软件版本1.22对数据进行分析。从实验样品中减去缓冲液(PBS pH 7.5)空白并校正浓度和体积,之后减去基线。随后,使用MicroCalPEAQ-DSC分析软件版本1.22和Origin 2015(原点软件公司)将观察到的转变拟合到双态模型中以获得熔化温度(Tm)和半最大值全宽度。
质谱
使30μM SpyCatcher003与60μM SpyTag003肽(SEQ ID NO:3,通过洞察力生物技术(Insight Biotechnology)以>95%纯度合成的固相)在25℃下在SPG缓冲液pH 7.0中反应持续1小时。在分析之前,使用3.5kDa截留Spectra/Por解析管(仕必纯公司(Spectrumlabs))针对10mM醋酸铵pH 7.5对反应进行透析。
将Agilent RapidFire 365平台与Agilent 6550精确质量四极杆飞行时间(Q-TOF)质谱仪耦接。此系统用于在正离子模式下采用喷射流电喷雾离子源(安捷伦公司)执行完整蛋白质质谱。在384孔聚丙烯板(Greiner公司)上制备50μL体积中10μM的样品并酸化成1%(v/v)甲酸。使用RapidFire采样平台在真空下抽吸样品持续0.4秒。将样品上样到C4固相萃取柱上。用0.1%(v/v)甲酸以1.5mL/分钟的流速洗涤5.5秒之后,用含有85%(v/v)乙腈和0.1%(v/v)甲酸的去离子水以1.25mL/分钟对样品进行洗脱持续5.5秒。然后用去离子水对柱进行平衡持续0.5秒。将用于离子化源的氮气干燥气体在225℃下以13L/分钟进行操作。喷射流鞘状气体在350℃下流速为12L/分钟,并且喷嘴电压为1,500V。使用Mass Hunter定性分析软件版本7.0对数据进行分析。使用最大熵算法对蛋白质离子化数据进行解卷积。基于N末端甲酰甲硫氨酸的切割,预测的质量来自ExPASy ProtParam。
SpyCatcher的哺乳动物细胞表达
使TfR-sfGFP-myc标签-SpyCatcher变体在于补充有50U/mL盘尼西林/链霉素(赛默飞世尔科技公司)的Expi293表达培养基(赛默飞世尔科技公司)中培养的悬浮Expi293HEK细胞(赛默飞世尔科技公司)中进行表达。使细胞在湿润化的Multitron细胞培育箱(Infors HT公司)中在37℃下与7%CO2一起生长,在110-125rpm下旋转。用每1μg的质粒DNA 2.7μL ExpiFectamine 293试剂对密度为3.0×106细胞/mL的细胞进行转染。转染后16-22小时添加ExpiFectamine转染增强剂(赛默飞世尔科技公司)。使细胞生长48小时并且然后进行分析。
流式细胞术
在FACS缓冲液[PBS pH 7.5、1mM EDTA、1%牛血清白蛋白、0.1%(w/v)叠氮化钠]中在4℃下通过以300g离心将细胞洗涤两次持续3分钟。为了用抗myc-AlexaFluor 647抗体(英杰公司(Invitrogen))对细胞进行标记,将0.5-1×106个细胞与浓度为5μg/mL的抗体在冰上在FACS缓冲液中反应20分钟,然后在FACS缓冲液中将细胞洗涤两次。使20nM SpyTag变体-mKate2构建体与0.5-1×106细胞在冰上在2mL FACS缓冲液中在由10μM SpyCatcher003淬灭的反应时间的情况下反应,然后在FACS缓冲液中将细胞洗涤两次。在BD Fortessa X20上对细胞进行分析,从而使用DAPI染色对活细胞进行门控。使用FlowJo版本9.0对数据进行分析。一式三份执行实验,并且数据表示均值±1标准偏差。
荧光团缀合
在黑暗中进行以下步骤。将DyLight-马来酰亚胺和DyLight-NHS酯(以下统称为DyLight)在无水DMSO中溶解到最终浓度10μg/μL,将样品等分并在使用之前储存在-80℃下。将Tris(DyLight-马来酰亚胺;pH 8.5)或PBS(DyLight-NHS酯;pH 7.5)缓冲液中的SpyCatcher 003-S49C与相关DyLight一起以染料:蛋白质的10倍摩尔过量进行温育,以确保对蛋白质进行了最大化标记。在RT下翻滚4小时之前,将样品快速移液以彻底混合样品。温育之后,将样品以16,000g离心5分钟以去除聚集体。将膨胀的Sephadex G-25树脂(800μL)添加到Bio-Rad Poly-Prep柱中,并且用4mL PBS进行洗涤以去除残余储存乙醇。允许PBS排干,并且将样品添加到柱中以去除未经缀合的染料。将另外1mL PBS添加到柱的顶部,并且收集300μL级分。将级分1和2池化并在PBS中在4℃下透析3×3小时。
由Nanodrop分光光度计确定缀合效率,并且利用以下方程:
Figure BDA0003334675180000401
ε蛋白质=蛋白质摩尔消光系数
CF=校正因子(可在以下Thermo Fisher Dye信息页中找到,DyLight 680=0.128)
Figure BDA0003334675180000402
蛋白质印迹
使未经转化的大肠杆菌Turbo细胞(NEB)生长8小时,团粒化并在cOmplete迷你无EDTA蛋白酶抑制剂鸡尾酒(罗氏公司)和1mM PMSF存在的情况下在PBS pH 7.4中重悬。使1.5×107个人Expi293细胞团粒化并且在5mL裂解缓冲液[在cOmplete迷你无EDTA蛋白酶抑制剂鸡尾酒(罗氏公司)和1mM PMSF存在的情况下,150mM NaCl、50mM Tris-HCl pH 7.5、1%(v/v)Triton X-100、1mM EDTA]中裂解。酿酒酵母菌株K699是牛津大学内史密斯实验室(Nasmyth laboratory,University of Oxford)的一种赠品。黑腹果蝇样品是GenLysate(G-Biosciences公司)。将裂解物等分并且在使用之前储存在-80℃下。为了通过蛋白质印迹进行测试,将3pmol SpyTag003-MBPa掺杂到细胞裂解物的所选样品中。将样品与6×SDS上样缓冲液混合,并且在Bio-Rad C1000热循环仪中在99℃下加热3分钟。每泳道上样5μg细胞裂解物,但在黑腹果蝇中,上样10μg以抵消弱抗GAPDH识别。
使用XCell SureLock系统(赛默飞世尔公司)在200V下通过16%SDS-PAGE对蛋白质样品和细胞裂解物进行解析。在转移缓冲液[10%(v/v)MeOH、25mM Tris碱、192mM甘氨酸)中在过滤纸(Fisherbrand;FB59025)之间使用XCell II蛋白质印迹模块(赛默飞世尔公司)在35V下将样品转移到经平衡的硝酸纤维素膜(Bio-Rad;162-0112)中持续90分钟。在于具有0.05%(v/v)Tween-20(PBST)的PBS pH 7.4中制成的5%(w/v)脱脂乳中将膜封闭最少1小时。然后用13nM SpyCatcher003-680和1:500抗GAPDH-DyLight 800(赛默飞世尔公司)在具有5%(w/v)脱脂乳的PBST中在25℃下对膜进行探测持续2小时。在保护膜免受光的同时将膜在PBST中洗涤最少3×30分钟,在PBS pH 7.4中洗涤最少1×30分钟,并且在MilliQH2O中冲洗。使用Li-Cor Odyssey Fc对蛋白质印迹进行成像,并且使用Image Studio Lite5.2(Li-Cor)执行图像分析。
序列表
<110> 牛津大学创新有限公司(Oxford University Innovation Limited)
<120> 以增强的速率与肽标签配偶体自发形成异肽键的多肽和其用途
<130> P21117420WP
<150> GB 1903479.2
<151> 2019-03-14
<160> 13
<170> PatentIn Version 3.5
<210> 1
<211> 113
<212> PRT
<213> Artificial Sequence
<220>
<223> SpyCatcher003
<400> 1
Val Thr Thr Leu Ser Gly Leu Ser Gly Glu Gln Gly Pro Ser Gly Asp
1 5 10 15
Met Thr Thr Glu Glu Asp Ser Ala Thr His Ile Lys Phe Ser Lys Arg
20 25 30
Asp Glu Asp Gly Arg Glu Leu Ala Gly Ala Thr Met Glu Leu Arg Asp
35 40 45
Ser Ser Gly Lys Thr Ile Ser Thr Trp Ile Ser Asp Gly His Val Lys
50 55 60
Asp Phe Tyr Leu Tyr Pro Gly Lys Tyr Thr Phe Val Glu Thr Ala Ala
65 70 75 80
Pro Asp Gly Tyr Glu Val Ala Thr Pro Ile Glu Phe Thr Val Asn Glu
85 90 95
Asp Gly Gln Val Thr Val Asp Gly Glu Ala Thr Glu Gly Asp Ala His
100 105 110
Thr
<210> 2
<211> 92
<212> PRT
<213> Artificial Sequence
<220>
<223> 截短的SpyCatcher003
<400> 2
Asp Ser Ala Thr His Ile Lys Phe Ser Lys Arg Asp Glu Asp Gly Arg
1 5 10 15
Glu Leu Ala Gly Ala Thr Met Glu Leu Arg Asp Ser Ser Gly Lys Thr
20 25 30
Ile Ser Thr Trp Ile Ser Asp Gly His Val Lys Asp Phe Tyr Leu Tyr
35 40 45
Pro Gly Lys Tyr Thr Phe Val Glu Thr Ala Ala Pro Asp Gly Tyr Glu
50 55 60
Val Ala Thr Pro Ile Glu Phe Thr Val Asn Glu Asp Gly Gln Val Thr
65 70 75 80
Val Asp Gly Glu Ala Thr Glu Gly Asp Ala His Thr
85 90
<210> 3
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> SpyTag003
<400> 3
Arg Gly Val Pro His Ile Val Met Val Asp Ala Tyr Lys Arg Tyr Lys
1 5 10 15
<210> 4
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> SpyTag002
<400> 4
Val Pro Thr Ile Val Met Val Asp Ala Tyr Lys Arg Tyr Lys
1 5 10
<210> 5
<211> 13
<212> PRT
<213> Artificial Sequence
<220>
<223> SpyTag
<400> 5
Ala His Ile Val Met Val Asp Ala Tyr Lys Pro Thr Lys
1 5 10
<210> 6
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> SpyTag变体
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> X是精氨酸或无氨基酸
<220>
<221> MISC_FEATURE
<222> (1)..(2)
<223> 当位于位置1处的X无氨基酸时,位于位置2处的X无氨基酸
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> X是甘氨酸或无氨基酸
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> X是组氨酸或苏氨酸,优选地是组氨酸
<220>
<221> MISC_FEATURE
<222> (11)..(11)
<223> X是丙氨酸、甘氨酸或缬氨酸,优选地是丙氨酸
<220>
<221> MISC_FEATURE
<222> (14)..(14)
<223> X是精氨酸或赖氨酸,优选地是精氨酸
<400> 6
Xaa Xaa Val Pro Xaa Ile Val Met Val Asp Xaa Tyr Lys Xaa Tyr Lys
1 5 10 15
<210> 7
<211> 113
<212> PRT
<213> Artificial Sequence
<220>
<223> SpyCatcher002
<400> 7
Val Thr Thr Leu Ser Gly Leu Ser Gly Glu Gln Gly Pro Ser Gly Asp
1 5 10 15
Met Thr Thr Glu Glu Asp Ser Ala Thr His Ile Lys Phe Ser Lys Arg
20 25 30
Asp Glu Asp Gly Arg Glu Leu Ala Gly Ala Thr Met Glu Leu Arg Asp
35 40 45
Ser Ser Gly Lys Thr Ile Ser Thr Trp Ile Ser Asp Gly His Val Lys
50 55 60
Asp Phe Tyr Leu Tyr Pro Gly Lys Tyr Thr Phe Val Glu Thr Ala Ala
65 70 75 80
Pro Asp Gly Tyr Glu Val Ala Thr Ala Ile Thr Phe Thr Val Asn Glu
85 90 95
Gln Gly Gln Val Thr Val Asn Gly Glu Ala Thr Lys Gly Asp Ala His
100 105 110
Thr
<210> 8
<211> 113
<212> PRT
<213> Artificial Sequence
<220>
<223> SpyCatcher
<400> 8
Val Asp Thr Leu Ser Gly Leu Ser Ser Glu Gln Gly Gln Ser Gly Asp
1 5 10 15
Met Thr Ile Glu Glu Asp Ser Ala Thr His Ile Lys Phe Ser Lys Arg
20 25 30
Asp Glu Asp Gly Lys Glu Leu Ala Gly Ala Thr Met Glu Leu Arg Asp
35 40 45
Ser Ser Gly Lys Thr Ile Ser Thr Trp Ile Ser Asp Gly Gln Val Lys
50 55 60
Asp Phe Tyr Leu Tyr Pro Gly Lys Tyr Thr Phe Val Glu Thr Ala Ala
65 70 75 80
Pro Asp Gly Tyr Glu Val Ala Thr Ala Ile Thr Phe Thr Val Asn Glu
85 90 95
Gln Gly Gln Val Thr Val Asn Gly Lys Ala Thr Lys Gly Asp Ala His
100 105 110
Ile
<210> 9
<211> 339
<212> DNA
<213> Artificial Sequence
<220>
<223> 经细菌密码子优化的SpyCatcher003
<400> 9
gtaaccacct tatcaggttt atcaggtgag caaggtccgt ccggtgatat gacaactgaa 60
gaagatagtg ctacccatat taaattctca aaacgtgatg aggacggccg tgagttagct 120
ggtgcaacta tggagttgcg tgattcatct ggtaaaacta ttagtacatg gatttcagat 180
ggacatgtga aggatttcta cctgtatcca ggaaaatata catttgtcga aaccgcagca 240
ccagacggtt atgaggtagc aactccaatt gaatttacag ttaatgagga cggtcaggtt 300
actgtagatg gtgaagcaac tgaaggtgac gctcatact 339
<210> 10
<211> 339
<212> DNA
<213> Artificial Sequence
<220>
<223> 经哺乳动物密码子优化的SpyCatcher003
<400> 10
gtgaccacac tgtccggact gtctggagag cagggaccat ccggcgacat gaccacagag 60
gaggattctg ccacacacat caagttcagc aagagggacg aggacggaag agagctggca 120
ggagcaacca tggagctgag ggatagctcc ggcaagacca tcagcacatg gatctccgac 180
ggccacgtga aggatttcta cctgtatccc ggcaagtaca cctttgtgga gacagcagca 240
ccagacggat atgaggtggc aacccctatc gagtttacag tgaacgagga cggacaggtg 300
accgtggatg gagaggcaac agagggcgat gcacacacc 339
<210> 11
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> SpyTag003-DA
<400> 11
Arg Gly Val Pro His Ile Val Met Val Ala Ala Tyr Lys Arg Tyr Lys
1 5 10 15
<210> 12
<211> 113
<212> PRT
<213> Artificial Sequence
<220>
<223> SpyCatcher003 S49C
<400> 12
Val Thr Thr Leu Ser Gly Leu Ser Gly Glu Gln Gly Pro Ser Gly Asp
1 5 10 15
Met Thr Thr Glu Glu Asp Ser Ala Thr His Ile Lys Phe Ser Lys Arg
20 25 30
Asp Glu Asp Gly Arg Glu Leu Ala Gly Ala Thr Met Glu Leu Arg Asp
35 40 45
Cys Ser Gly Lys Thr Ile Ser Thr Trp Ile Ser Asp Gly His Val Lys
50 55 60
Asp Phe Tyr Leu Tyr Pro Gly Lys Tyr Thr Phe Val Glu Thr Ala Ala
65 70 75 80
Pro Asp Gly Tyr Glu Val Ala Thr Pro Ile Glu Phe Thr Val Asn Glu
85 90 95
Asp Gly Gln Val Thr Val Asp Gly Glu Ala Thr Glu Gly Asp Ala His
100 105 110
Thr
<210> 13
<211> 92
<212> PRT
<213> Artificial Sequence
<220>
<223> 截短的SpyCatcher003 S28C
<400> 13
Asp Ser Ala Thr His Ile Lys Phe Ser Lys Arg Asp Glu Asp Gly Arg
1 5 10 15
Glu Leu Ala Gly Ala Thr Met Glu Leu Arg Asp Cys Ser Gly Lys Thr
20 25 30
Ile Ser Thr Trp Ile Ser Asp Gly His Val Lys Asp Phe Tyr Leu Tyr
35 40 45
Pro Gly Lys Tyr Thr Phe Val Glu Thr Ala Ala Pro Asp Gly Tyr Glu
50 55 60
Val Ala Thr Pro Ile Glu Phe Thr Val Asn Glu Asp Gly Gln Val Thr
65 70 75 80
Val Asp Gly Glu Ala Thr Glu Gly Asp Ala His Thr
85 90

Claims (22)

1.一种多肽,其包括:
i)如SEQ ID NO:1中所示的氨基酸序列;或者
ii)(i)的一部分,包括如SEQ ID NO:2中所示的氨基酸序列;
iii)与如SEQ ID NO:1中所示的序列具有至少80%序列同一性的氨基酸序列,其中所述氨基酸序列包括位于位置31处的赖氨酸、位于位置77处的谷氨酸以及以下中的一个或多个:
1)位于位置91处的谷氨酸;
2)位于位置103处的天冬氨酸;以及
3)位于位置108处的谷氨酸;
其中指定的氨基酸残基位于与SEQ ID NO:1中的位置等效的位置处;或者
iv)(iii)的一部分,包括与如SEQ ID NO:2中所示的序列具有至少80%序列同一性的氨基酸序列,其中所述氨基酸序列包括位于位置10处的赖氨酸、位于位置56处的谷氨酸以及以下一个或多个:
1)位于位置70处的谷氨酸;
2)位于位置82处的天冬氨酸;以及
3)位于位置87处的谷氨酸;
其中指定的氨基酸残基位于与SEQ ID NO:2中的位置等效的位置处,
并且其中所述多肽能够与包括如SEQ ID NO:3中所示的氨基酸序列的肽自发地形成异肽键,其中所述异肽键形成在位于SEQ ID NO:3的位置10处的天冬氨酸残基与位于SEQ IDNO:1的位置31或SEQ ID NO:2的位置10处的赖氨酸残基之间。
2.根据权利要求1所述的多肽,其中所述多肽包括与如SEQ ID NO:1中所示的序列具有至少80%序列同一性的氨基酸序列,其中所述氨基酸序列包括位于位置31处的赖氨酸、位于位置77处的谷氨酸以及以下全部:
1)位于位置91处的谷氨酸;
2)位于位置103处的天冬氨酸;以及
3)位于位置108处的谷氨酸;
其中指定的氨基酸残基位于与SEQ ID NO:1中的位置等效的位置处。
3.根据权利要求1或2所述的多肽,其中所述多肽包括与如SEQ ID NO:1中所示的序列具有至少80%序列同一性的氨基酸序列,其中所述氨基酸序列包括位于位置31处的赖氨酸、位于位置77处的谷氨酸以及以下全部:
1)位于位置89处的脯氨酸;
2)位于位置91处的谷氨酸;
3)位于位置97处的天冬氨酸;
4)位于位置103处的天冬氨酸;以及
5)位于位置108处的谷氨酸;
其中指定的氨基酸残基位于与SEQ ID NO:1中的位置等效的位置处。
4.根据权利要求1到3中任一项所述的多肽,其中所述多肽包括与如SEQ ID NO:1中所示的序列具有至少80%序列同一性的氨基酸序列,其中所述氨基酸序列包括位于位置31处的赖氨酸、位于位置77处的谷氨酸以及以下一个或多个:
1)位于位置2处的苏氨酸;
2)位于位置13处的脯氨酸;
3)位于位置37处的精氨酸;
4)位于位置62处的组氨酸;
5)位于位置105处的谷氨酸;以及
6)位于位置113处的苏氨酸,
其中指定的氨基酸残基位于与SEQ ID NO:1中的位置等效的位置处。
5.根据权利要求1到4中任一项所述的多肽,其中所述多肽包括与如SEQ ID NO:1中所示的序列具有至少80%序列同一性的氨基酸序列,其中所述氨基酸序列包括位于位置31处的赖氨酸、位于位置77处的谷氨酸以及以下全部:
1)位于位置2处的苏氨酸;
2)位于位置13处的脯氨酸;
3)位于位置37处的精氨酸;
4)位于位置62处的组氨酸;
5)位于位置89处的脯氨酸;
6)位于位置97处的天冬氨酸;
7)位于位置105处的谷氨酸;以及
8)位于位置113处的苏氨酸,
其中指定的氨基酸残基位于与SEQ ID NO:1中的位置等效的位置处。
6.根据权利要求1到5中任一项所述的多肽,其中所述多肽包括与如SEQ ID NO:1中所示的序列具有至少80%序列同一性的氨基酸序列,其中所述氨基酸序列包括位于位置31处的赖氨酸、位于位置77处的谷氨酸以及以下全部:
1)位于位置2处的苏氨酸;
2)位于位置13处的脯氨酸;
3)位于位置37处的精氨酸;
4)位于位置62处的组氨酸;
5)位于位置89处的脯氨酸;
6)位于位置97处的天冬氨酸;
7)位于位置105处的谷氨酸;以及
8)位于位置113处的苏氨酸,
以及以下两个或更多个:
9)位于位置91处的谷氨酸;
10)位于位置103处的天冬氨酸;以及
11)位于位置108处的谷氨酸,
其中指定的氨基酸残基位于与SEQ ID NO:1中的位置等效的位置处。
7.根据权利要求1到6中任一项所述的多肽,其中所述多肽包括与如SEQ ID NO:1中所示的序列具有至少80%序列同一性的氨基酸序列,其中所述氨基酸序列包括位于位置31处的赖氨酸、位于位置77处的谷氨酸以及以下全部:
1)位于位置2处的苏氨酸;
2)位于位置13处的脯氨酸;
3)位于位置37处的精氨酸;
4)位于位置62处的组氨酸;
5)位于位置89处的脯氨酸;
6)位于位置97处的天冬氨酸;
7)位于位置105处的谷氨酸;以及
8)位于位置113处的苏氨酸,
9)位于位置91处的谷氨酸;
10)位于位置103处的天冬氨酸;以及
11)位于位置108处的谷氨酸,
其中指定的氨基酸残基位于与SEQ ID NO:1中的位置等效的位置处。
8.根据权利要求1到7中任一项所述的多肽,其中所述多肽包括以下一个或两个:
1)位于位置9处的甘氨酸;以及
2)位于位置19处的苏氨酸,
其中指定的氨基酸残基位于与SEQ ID NO:1中的位置等效的位置处。
9.根据权利要求1到8中任一项所述的多肽,其中所述多肽包括以下一个或多个:
1)位于位置34处的谷氨酸;
2)位于位置50处的丝氨酸;
3)位于位置69处的酪氨酸;
4)位于位置83处的甘氨酸;以及
5)位于位置86处的缬氨酸,
其中指定的氨基酸残基位于与SEQ ID NO:1中的位置等效的位置处。
10.根据权利要求1到9中任一项所述的多肽,其中所述多肽包括以下取代中的一个或多个取代:
1)在位置52处用谷氨酰胺取代赖氨酸;
2)在位置63处用天冬氨酸取代缬氨酸;
3)在位置69处用丝氨酸取代酪氨酸;
4)在位置88处用亮氨酸取代苏氨酸;以及
5)在位置96处用脯氨酸取代谷氨酸,
其中指定的氨基酸残基位于与SEQ ID NO:1中的位置等效的位置处。
11.根据权利要求1到10中任一项所述的多肽,其中所述多肽与核酸分子、蛋白质、肽、小分子有机化合物、荧光团、金属配体复合物、多糖、纳米颗粒、2D单层(例如,石墨烯)、纳米管、聚合物、细胞、病毒、病毒样颗粒或其组合缀合。
12.根据权利要求1到10中任一项所述的多肽,其中所述多肽固定在固体底物上。
13.一种重组或合成多肽,其包括与根据权利要求1到10中任一项所述的多肽连接的肽或多肽。
14.一种核酸分子,其包括对根据权利要求1到8中任一项所述的多肽或根据权利要求13所述的重组或合成多肽进行编码的核苷酸序列。
15.一种载体,其包括根据权利要求14所述的核酸分子。
16.一种细胞,其包括根据权利要求14所述的核酸或根据权利要求15所述的载体。
17.一种用于产生或表达根据权利要求1到10中任一项所述的多肽或根据权利要求13所述的重组多肽的方法,所述方法包括以下步骤:
a)用根据权利要求15所述的载体转化或转染宿主细胞;
b)在允许所述多肽表达的条件下培养所述宿主细胞;以及任选地
c)分离所述多肽。
18.一种根据权利要求1到12中任一项所述的多肽的用途,其用于通过异肽键将两个分子或组分缀合,
其中通过异肽键缀合的所述分子或组分包括:
a)第一分子或组分,所述第一分子或组分包括根据权利要求1到12中任一项所述的多肽;以及
b)第二分子或组分,所述第二分子或组分包括选自以下的肽:
(1)包括如SEQ ID NO:5中所示的氨基酸序列的肽;以及
(2)包括如SEQ ID NO:6中所示的氨基酸序列的肽,其中:
(i)位于位置1处的X是精氨酸或无氨基酸;
(ii)位于位置2处的X是甘氨酸或无氨基酸;
(iii)位于位置5处的X是组氨酸或苏氨酸,优选地是组氨酸;
(iv)位于位置11处的X是丙氨酸、甘氨酸或缬氨酸,优选地是丙氨酸;
并且
(v)位于位置14处的X是精氨酸或赖氨酸,优选地是精氨酸;
其中当位于位置1处的X无氨基酸时,位于位置2处的X无氨基酸,
并且其中所述肽能够与包括如SEQ ID NO:1中所示的氨基酸序列的多肽自发地形成异肽键,其中所述异肽键形成在位于SEQ ID NO:6的位置10处的天冬氨酸残基与位于SEQ IDNO:1的位置31处的赖氨酸残基之间。
19.一种用于通过异肽键将两个分子或组分缀合的方法,所述方法包括:
a)提供第一分子或组分,所述第一分子或组分包括根据权利要求1到12中任一项所述的多肽;
b)提供第二分子或组分,所述第二分子或组分包括选自以下的肽:
(1)包括如SEQ ID NO:5中所示的氨基酸序列的肽;以及
(2)包括如SEQ ID NO:6中所示的氨基酸序列的肽,其中:
(i)位于位置1处的X是精氨酸或无氨基酸;
(ii)位于位置2处的X是甘氨酸或无氨基酸;
(iii)位于位置5处的X是组氨酸或苏氨酸,优选地是组氨酸;
(iv)位于位置11处的X是丙氨酸、甘氨酸或缬氨酸,优选地是丙氨酸;
并且
(v)位于位置14处的X是精氨酸或赖氨酸,优选地是精氨酸;
其中当位于位置1处的X无氨基酸时,位于位置2处的X无氨基酸,
并且其中所述肽能够与包括如SEQ ID NO:1中所示的氨基酸序列的多肽自发地形成异肽键,其中所述异肽键形成在位于SEQ ID NO:6的位置10处的天冬氨酸残基与位于SEQ IDNO:1的位置31处的赖氨酸残基之间;
c)使所述第一分子或组分和所述第二分子或组分在使得能够在所述多肽与所述肽之间自发形成异肽键的条件下接触,由此通过异肽键将所述第一分子或组分与所述第二分子或组分缀合以形成复合物。
20.一种试剂盒,其优选地用于在根据权利要求18所述的用途或根据权利要求19所述的方法中使用,其中所述试剂盒包括:
(a)根据权利要求1到12中任一项所述的多肽,所述多肽任选地与分子或组分缀合或融合;以及
(b)选自以下的肽:
(1)包括如SEQ ID NO:5中所示的氨基酸序列的肽;以及
(2)包括如SEQ ID NO:6中所示的氨基酸序列的肽,其中:
(i)位于位置1处的X是精氨酸或无氨基酸;
(ii)位于位置2处的X是甘氨酸或无氨基酸;
(iii)位于位置5处的X是组氨酸或苏氨酸,优选地是组氨酸;
(iv)位于位置11处的X是丙氨酸、甘氨酸或缬氨酸,优选地是丙氨酸;
并且
(v)位于位置14处的X是精氨酸或赖氨酸,优选地是精氨酸;
其中当位于位置1处的X无氨基酸时,位于位置2处的X无氨基酸,
并且其中所述肽能够与包括如SEQ ID NO:1中所示的氨基酸序列的多肽自发地形成异肽键,其中所述异肽键形成在位于SEQ ID NO:6的位置10处的天冬氨酸残基与位于SEQ IDNO:1的位置31处的赖氨酸残基之间,所述肽任选地与分子或组分缀合或融合;和/或
(c)对如(a)所定义的多肽进行编码的核酸分子,具体地是载体;以及
(d)对如(b)所定义的肽进行编码的核酸分子,具体地是载体。
21.根据权利要求18所述的用途、根据权利要求19所述的方法或根据权利要求20所述的试剂盒,其中(2)的所述肽包括以下一个或多个:
1)位于位置5处的组氨酸;
2)位于位置11处的丙氨酸;以及
3)位于位置14处的精氨酸,
其中指定的氨基酸残基位于与SEQ ID NO:6中的位置等效的位置处。
22.根据权利要求18或21所述的用途、根据权利要求19或21所述的方法或根据权利要求20或21所述的试剂盒,其中(2)的所述肽包括如SEQ ID NO:3或4中所示的氨基酸序列。
CN202080033169.0A 2019-03-14 2020-03-13 以增强的速率与肽标签配偶体自发形成异肽键的多肽和其用途 Pending CN113767111A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GBGB1903479.2A GB201903479D0 (en) 2019-03-14 2019-03-14 Polypeptide with enchanced rate of spontaneous isopeptide bond formation with it's peptide tag partner and uses thereof
GB1903479.2 2019-03-14
PCT/GB2020/050652 WO2020183198A1 (en) 2019-03-14 2020-03-13 Polypeptide with enhanced rate of spontaneous isopeptide bond formation with its peptide tag partner and uses thereof

Publications (1)

Publication Number Publication Date
CN113767111A true CN113767111A (zh) 2021-12-07

Family

ID=66381195

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080033169.0A Pending CN113767111A (zh) 2019-03-14 2020-03-13 以增强的速率与肽标签配偶体自发形成异肽键的多肽和其用途

Country Status (7)

Country Link
US (1) US20220135628A1 (zh)
EP (1) EP3938380A1 (zh)
JP (1) JP2022525160A (zh)
CN (1) CN113767111A (zh)
AU (1) AU2020234063A1 (zh)
GB (1) GB201903479D0 (zh)
WO (1) WO2020183198A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114732898A (zh) * 2022-04-01 2022-07-12 中国人民解放军军事科学院军事医学研究院 一种CpG佐剂与抗原定点共价结合方法
CN115975055A (zh) * 2023-01-16 2023-04-18 四川大学 一种可在温和溶液条件下用于疫苗抗原等蛋白共价连接的新型Tag/Catcher共价连接体系

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2020243436A1 (en) * 2019-03-18 2021-10-07 Bio-Rad Abd Serotec Gmbh Antigen binding fragments conjugated to a plurality of Fc isotypes and subclasses
GB202019817D0 (en) 2020-12-15 2021-01-27 Univ Oxford Innovation Ltd Ligand-binding polypeptides and uses thereof
GB202104999D0 (en) 2021-04-08 2021-05-26 Univ Oxford Innovation Ltd Polypeptides that interact with peptide tags at loops or termini and uses thereof
GB202117283D0 (en) 2021-11-30 2022-01-12 Univ Oxford Innovation Ltd Switchable polypeptide and its use for gentle affinity purification

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011098772A1 (en) * 2010-02-11 2011-08-18 Isis Innovation Limited Peptide tag systems that spontaneously form an irreversible link to protein partners via isopeptide bonds
WO2016193746A1 (en) * 2015-06-05 2016-12-08 Oxford University Innovation Limited Methods and products for fusion protein synthesis
CN107708720A (zh) * 2015-04-06 2018-02-16 苏伯多曼有限责任公司 含有从头结合结构域的多肽及其用途
WO2018093274A1 (en) * 2016-11-16 2018-05-24 Auckland Uniservices Limited Methods for protein ligation and uses thereof
CN108715846A (zh) * 2018-05-31 2018-10-30 齐鲁工业大学 一种基于异肽键扫描的蛋白质工程方法及其在蛋白质工程中应用
WO2018197854A1 (en) * 2017-04-24 2018-11-01 Oxford University Innovation Limited Proteins and peptide tags with enhanced rate of spontaneous isopeptide bond formation and uses thereof

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU530410B2 (en) 1978-02-21 1983-07-14 Sintef Preparing aqueous emulsions
GB201705750D0 (en) 2017-04-10 2017-05-24 Univ Oxford Innovation Ltd Peptide ligase and use therof

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011098772A1 (en) * 2010-02-11 2011-08-18 Isis Innovation Limited Peptide tag systems that spontaneously form an irreversible link to protein partners via isopeptide bonds
CN107708720A (zh) * 2015-04-06 2018-02-16 苏伯多曼有限责任公司 含有从头结合结构域的多肽及其用途
WO2016193746A1 (en) * 2015-06-05 2016-12-08 Oxford University Innovation Limited Methods and products for fusion protein synthesis
CN108026148A (zh) * 2015-06-05 2018-05-11 牛津大学创新有限公司 融合蛋白合成的方法和产品
WO2018093274A1 (en) * 2016-11-16 2018-05-24 Auckland Uniservices Limited Methods for protein ligation and uses thereof
WO2018197854A1 (en) * 2017-04-24 2018-11-01 Oxford University Innovation Limited Proteins and peptide tags with enhanced rate of spontaneous isopeptide bond formation and uses thereof
CN108715846A (zh) * 2018-05-31 2018-10-30 齐鲁工业大学 一种基于异肽键扫描的蛋白质工程方法及其在蛋白质工程中应用

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114732898A (zh) * 2022-04-01 2022-07-12 中国人民解放军军事科学院军事医学研究院 一种CpG佐剂与抗原定点共价结合方法
CN114732898B (zh) * 2022-04-01 2023-05-09 中国人民解放军军事科学院军事医学研究院 一种CpG佐剂与抗原定点共价结合方法
CN115975055A (zh) * 2023-01-16 2023-04-18 四川大学 一种可在温和溶液条件下用于疫苗抗原等蛋白共价连接的新型Tag/Catcher共价连接体系
CN115975055B (zh) * 2023-01-16 2024-02-02 四川大学 一种可在温和溶液条件下用于疫苗抗原等蛋白共价连接的新型Tag/Catcher共价连接体系

Also Published As

Publication number Publication date
WO2020183198A1 (en) 2020-09-17
EP3938380A1 (en) 2022-01-19
AU2020234063A1 (en) 2021-11-04
JP2022525160A (ja) 2022-05-11
GB201903479D0 (en) 2019-05-01
US20220135628A1 (en) 2022-05-05

Similar Documents

Publication Publication Date Title
KR102642896B1 (ko) 자발적 이소펩타이드 결합 형성 속도가 향상된 단백질 및 펩타이드 태그 및 이의 용도
CN113767111A (zh) 以增强的速率与肽标签配偶体自发形成异肽键的多肽和其用途
JP7075678B2 (ja) ペプチドリガーゼ及びその使用
JP6883529B2 (ja) 融合タンパク質を合成するための方法および製品
US10527609B2 (en) Peptide tag systems that spontaneously form an irreversible link to protein partners via isopeptide bonds
US8759488B2 (en) High stability streptavidin mutant proteins
KR20180087431A (ko) 트랜스글루타미나제 인식 부위를 갖는 fkbp 도메인
EP3891172B1 (en) Polypeptide and its use in affinity purification
Nguyen et al. In vivo biotinylated calpastatin improves the affinity purification of human m-calpain
Qin et al. Function and structure of recombinant single chain calcineurin
CN110582566B (zh) 肽连接酶及其用途
JP4193499B2 (ja) 組換え発光蛋白質およびその複合体
US20030113819A1 (en) Carrier peptide and method for delivery of molecules into cells
CN106977590B (zh) 突变的菜豆根瘤菌亲和素蛋白及其应用
EP4320140A1 (en) Polypeptides that interact with peptide tags at loops or termini and uses thereof
WO2023099876A1 (en) Switchable polypeptide and its use for gentle affinity purification
Tuang Development of a reactive peptide sequence for site-selective bioconjugation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination