CN113597470A

CN113597470A - 分选酶标记的梭菌神经毒素

Info

Publication number: CN113597470A
Application number: CN202080021624.5A
Authority: CN
Inventors: O·洛斯; M·埃利奥特
Original assignee: Ipsen Biopharm Ltd
Current assignee: Ipsen Biopharm Ltd; Ipsen Biopharmaceuticals Inc
Priority date: 2019-01-16
Filing date: 2020-01-16
Publication date: 2021-11-02
Also published as: US20220118113A1; WO2020148542A1; EP3911742A1; GB201900621D0; JP2022517406A

Abstract

本发明涉及一种制备标记多肽的方法，所述方法包括：a.提供一种多肽，其包含：i.分选酶受体位点或分选酶供体位点；ii.非细胞毒性蛋白酶或其蛋白水解失活突变体；iii.能够与靶细胞上的结合位点结合的靶向部分(TM)；和iv.易位结构域；b.孵育多肽与：分选酶；标记底物，所述标记底物分别包含分选酶供体位点或分选酶受体位点，以及缀合的可检测标记；其中分选酶催化：多肽的分选酶受体位点的氨基酸与标记底物的分选酶供体位点的氨基酸之间的缀合；或标记底物的分选酶受体位点的氨基酸与多肽的分选酶供体位点的氨基酸之间的缀合；从而标记多肽；和c.获得标记多肽。本发明还涉及用于标记的多肽、标记多肽、编码所述多肽的核酸以及使用和制造所述多肽的方法。

Description

分选酶标记的梭菌神经毒素

本发明涉及标记的多肽及其制备和使用方法。

梭菌属(genus Clostridia)中的细菌产生高毒力和特定的蛋白质毒素，这种毒素毒害其被运送到的神经元和其他细胞。此类梭菌神经毒素的实例包括破伤风梭菌(C.Tetani，TeNT)和肉毒杆菌(C.botulinum，BoNT)血清型A-G和X产生的神经毒素(参见WO2018/009903 A2)，以及巴拉特梭菌(C.Baratii)和丁酸梭菌(C.Butyricum)产生的神经毒素。

在梭菌神经毒素中，已知有一些毒力最强的毒素。举例来说，取决于血清型，肉毒杆菌神经毒素对小鼠具有0.5至5ng/kg的中位致死剂量(LD₅₀)值。破伤风毒素和肉毒杆菌毒素均通过抑制受影响的神经元的功能，特别是抑制神经递质的释放而起作用。肉毒杆菌毒素作用于神经肌接头并抑制周围神经系统的胆碱能传递，而破伤风毒素作用于中枢神经系统。

梭菌神经毒素在梭菌属中表达为单链多肽。每种梭菌神经毒素均具有一条催化轻链，该轻链与一条重链(包含N-末端易位结构域和C-末端受体结合结构域)被称为活化环的暴露区域隔开。在蛋白质成熟过程中，活化环的蛋白水解裂解将通过二硫键结合在一起的梭菌神经毒素的轻链和重链分开，从而产生完全活化的双链毒素。

本领域中还已知重新靶向的梭菌神经毒素，其可以被修饰以包括称为靶向部分(TM)的外源配体。选择TM以提供对所需靶细胞的结合特异性，并且作为重新靶向过程的一部分，可以去除梭菌神经毒素的天然结合部分(例如，H_C结构域或H_CC结构域)。重新靶向技术描述在，例如：EP-B-0689459；WO 1994/021300；EP-B-0939818；US 6,461,617；US 7,192,596；WO 1998/007864；EP-B-0826051；US 5,989,545；US 6,395,513；US 6,962,703；WO1996/033273；EP-B-0996468；US 7,052,702；WO 1999/017806；EP-B-1107794；US 6,632,440；WO 2000/010598；WO 2001/21213；WO 2006/059093；WO 2000/62814；WO 2000/04926；WO 1993/15766；WO 2000/61192；和WO 1999/58571；所有内容通过引用整体并入本文。

另一变体包括从一种或多种非细胞毒性蛋白酶、梭菌神经毒素易位或结合结构域、或具有等同/相似功能的多肽制备的多肽。

梭菌神经毒素(或本文所述的其他多肽)对SNARE蛋白的结合、易位和蛋白水解切割仍知之甚少。因此，仍然需要允许对这些阶段中的每一阶段进行可视化的测定法，特别是实时和/或在活细胞中的测定法。这种测定法将促进梭菌神经毒素疗法的开发和表征，尤其是新BoNT疗法、杂合毒素和重新靶向的梭菌神经毒素(及其变体)的表征。

此外，用于常规方法中以可视化梭菌神经毒素和其他此类多肽的抗体(例如荧光抗体)也不太好，其特异性和/或灵敏度有限。此外，这样的常规方法通常依赖于细胞的固定，这可能对细胞结构产生不利影响，并且不适合实况/实时成像，尤其是在复杂的生物系统中，例如动物体内。因此，需要改善的/替代技术。

本发明克服了一个或多个上述问题。

本发明人惊奇地发现，分选酶可用于将可检测标记缀合至本发明的多肽(包含非细胞毒性蛋白酶或其蛋白水解失活突变体；结合靶细胞上的结合位点的靶向部分(TM)；和易位结构域)而不降低标记多肽的效力。换句话说，当与等同的未标记多肽相比时，标记多肽表现出相似的(或改善的)细胞结合、易位和SNARE蛋白切割。这是完全出乎意料的，因为使用替代技术(例如非位点特异性标记和SNAP标记)标记的多肽表现出降低的效力。

此外，本发明的包含分选酶受体或供体位点的多肽可以容易地被纯化和表达，这再次是令人惊讶的，因为GFP标记与表达/纯化困难相关，表明分选酶受体或供体位点的掺入不会负面影响多肽结构或折叠。

此外，包括使用分选酶的方法允许产生双标记的多肽，这也允许使细胞内体内发生的易位事件可视化，该事件是梭菌神经毒素(和重新靶向的梭菌神经毒素)运输最不被了解的方面之一。有利地，本发明允许使用实时成像显微术可视化易位，并且将极大地帮助理解几种细胞模型和组织中的易位机制。

本发明的标记多肽为实况和/或实时监测所述多肽的作用机制开辟了新途径，并去除了对固定产品的需要，所述固定对细胞结构有不利影响。因此，本发明允许在更复杂的生物系统中可视化毒素，例如在离体组织制备物(例如脑切片)、组织病理学样品和动物体内，而且并不限于简单的细胞系统，例如根据常规技术的永生化细胞系和神经元。因此，本发明的多肽可用于(例如)测量离开施用部位的多肽分布。

一方面，本发明提供了一种制备标记多肽的方法，所述方法包括：

a.提供一种多肽，其包含：

i.分选酶受体或供体位点；

ii.非细胞毒性蛋白酶或其蛋白水解失活突变体；

iii.能够与靶细胞上的结合位点结合的靶向部分(TM)；和

iv.易位结构域；

b.孵育多肽与：

分选酶；和

标记底物，其包含分选酶供体或受体位点和缀合的可检测标记；

其中分选酶催化分选酶受体位点的氨基酸和分选酶供体位点的氨基酸之间的缀合，从而标记多肽；和

c.获得标记多肽。

当本发明的方法包括使用包含分选酶受体位点的多肽时，包含缀合的可检测标记(例如，如b.中所指)的标记底物包含分选酶供体位点。类似地，当本发明的方法包括使用包含分选酶供体位点的多肽时，包含缀合的可检测标记(例如，如b.中所指)的标记底物包含分选酶受体位点。

本发明因此涉及分选酶受体位点和相应的分选酶供体位点的用途，其中分选酶能够催化分选酶受体位点的氨基酸和分选酶供体位点的氨基酸的缀合。因此，选择用于本发明的相应分选酶受体和供体位点，使得可以通过分选酶进行缀合。

因此，在一个实施方案中，本发明的方法包括：

a.提供一种多肽，其包含：

i.分选酶受体位点；

ii.非细胞毒性蛋白酶或其蛋白水解失活突变体；

iii.能够与靶细胞上的结合位点结合的靶向部分(TM)；和

iv.易位结构域；

b.孵育多肽与：

分选酶；和

标记底物，其包含分选酶供体和缀合的可检测标记；

c.获得标记多肽。

在另一个实施方案中，本发明的方法包括：

a.提供一种多肽，其包含：

i.分选酶供体位点；

ii.非细胞毒性蛋白酶或其蛋白水解失活突变体；

iii.能够与靶细胞上的结合位点结合的靶向部分(TM)；和

iv.易位结构域；

b.孵育多肽与：

分选酶；和

标记底物，其包含分选酶受体位点和缀合的可检测标记；

c.获得标记多肽。

本发明还提供了可通过本发明的方法获得的标记多肽。

在一个实施方案中，在多肽的分选酶受体或供体位点上或附近缀合可检测标记，所述多肽包含非细胞毒性蛋白酶或其蛋白水解失活突变体；靶向部分(TM)；和易位结构域。

在一个实施方案中，在分选酶受体或供体位点上缀合可检测标记，例如，将可检测标记直接缀合至分选酶受体或供体位点的氨基酸。或者，可检测标记可以缀合至分选酶受体或供体位点的C-端，例如缀合至分选酶受体或供体位点的C-端1-50，例如1-25或1-10个氨基酸。

在另一个实施方案中，可检测标记缀合至分选酶受体或供体位点的N-端，例如缀合至分选酶受体或供体位点的N-端1-50，例如1-25或1-10个氨基酸。

如本文所用，术语―可获得”还包括术语―获得”。在一个实施方案中，术语―可获得”是指获得。

在相关方面，提供了用于使用分选酶标记的多肽，所述多肽包含：

i.分选酶受体或供体位点；

ii.能够在靶细胞中切割胞吐融合器(exocytic fusion apparatus)的蛋白质的非细胞毒性蛋白酶或其蛋白水解失活突变体；

iii.能够与靶细胞上的结合位点结合的靶向部分(TM)；和

iv.能够将非细胞毒性蛋白酶从内体内穿过内体膜易位到靶细胞的胞质溶胶内的易位结构域；

其中当所述多肽包含分选酶供体位点时，所述分选酶供体位点位于所述多肽的N-端，并且其中当所述分选酶供体位点包含G_n或A_n时，n至少为2；和

其中所述供体位点的N-端残基是所述多肽的N-端残基；或者

其中所述多肽包含一个或多个位于所述分选酶供体位点和可切割位点N-端的氨基酸残基，当所述可切割位点被切割时，暴露分选酶供体位点的N-端。

在一个实施方案中，用于使用分选酶标记的多肽包含：

i.分选酶供体位点；

ii.能够在靶细胞中切割胞吐融合器的蛋白质的非细胞毒性蛋白酶或其蛋白水解失活突变体；

iii.能够与靶细胞上的结合位点结合的靶向部分(TM)；和

其中所述分选酶供体位点位于所述多肽的N-端，并且其中当所述分选酶供体位点包含G_n或A_n时，n至少为2；和

其中所述供体位点的N-端残基是所述多肽的N-端残基。

在一个实施方案中，用于使用分选酶标记的多肽包含：

i.分选酶供体位点；

iii.能够与靶细胞上的结合位点结合的靶向部分(TM)；和

其中所述多肽包含一个或多个位于所述分选酶供体位点和可切割位点N-端的氨基酸残基，当所述可切割位点被切割时，露分选酶供体位点的N-端。

在一个实施方案中，用于使用分选酶标记的多肽包含：

i.分选酶受体位点；

iii.能够与靶细胞上的结合位点结合的靶向部分(TM)；和

iv.能够将非细胞毒性蛋白酶从内体内穿过内体膜易位到靶细胞的胞质溶胶内的易位结构域。

该多肽适用于本发明的方法。

本发明的多肽可包含分选酶受体位点。或者，所述多肽可包含分选酶供体位点。

在优选的实施方案中，所述多肽包含分选酶受体位点和分选酶供体位点。

本发明的多肽可包含与SEQ ID NO:2具有至少70％序列同一性的多肽序列。在一个实施方案中，本发明的多肽包含与SEQ ID NO:2具有至少80％或90％序列同一性的多肽序列。优选地，本发明的多肽包含如SEQ ID NO：2所示的多肽(更优选地由其组成)。

本发明的多肽可包含与SEQ ID NO:4具有至少70％序列同一性的多肽序列。在一个实施方案中，本发明的多肽包含与SEQ ID NO:4具有至少80％或90％序列同一性的多肽序列。优选地，本发明的多肽包含如SEQ ID NO：4所示的多肽(更优选地由其组成)。

本发明的多肽可包含与SEQ ID NO:40具有至少70％序列同一性的多肽序列。在一个实施方案中，本发明的多肽包含与SEQ ID NO:40具有至少80％或90％序列同一性的多肽序列。优选地，本发明的多肽包含如SEQ ID NO：40所示的多肽(更优选地由其组成)。

多肽可由本发明的核酸编码。

本发明还提供了一种标记多肽，所述多肽包含：

i.与所述多肽缀合的可检测标记；

ii.非细胞毒性蛋白酶或其蛋白水解失活突变体；

iii.能够与靶细胞上的结合位点结合的靶向部分(TM)；和

iv.易位结构域。

本发明还提供了一种标记多肽，所述多肽包含：

i.与所述多肽缀合的可检测标记；

ii.氨基酸序列，其包含(A/P/S)X(T/S/A/C)G_n(SEQ ID NO:59)，其中X是任何氨基酸且n为至少1，L(A/P/S)X(T/S/A/C)A_n(SEQ ID NO:60)，其中X是任何氨基酸且n为至少1，NPQTN(SEQ ID NO:61)，YPRTG(SEQ ID NO:62)，IPQTG(SEQ ID NO:63)，VPDTG(SEQ ID NO:64)，LPXTGS(SEQ ID NO:65),其中X是任何氨基酸，NPKTG(SEQ ID NO:46)，XPETG(SEQ IDNO:47)，LGATG(SEQ ID NO:48)，IPNTG(SEQ ID NO:49)，IPETG(SEQ ID NO:50)，NSKTA(SEQID NO:51)，NPQTG(SEQ ID NO:52)，NAKTN(SEQ ID NO:53)，NPQSS(SEQ ID NO:54)，LPXTX(SEQ ID NO:55),其中X是任何氨基酸，NPX₁TX₂(SEQ ID NO:56)，其中X₁是Lys或Gln且X₂是Asn、Asp或Gly，X₁PX₂X₃G(SEQ ID NO:57)，其中X₁是Leu、Ile、Val或Met，X₂是任何氨基酸，X₃是Ser、Thr或Ala，LPEX₁G(SEQ ID NO:58)，其中X₁是Ala、Cys或Ser，LPXS(SEQ ID NO:66)，LAXT(SEQ ID NO:67)，MPXT(SEQ ID NO:68)，MPXTG(SEQ ID NO:69)，LAXS(SEQ ID NO:70)，NPXT(SEQ ID NO:71)，NPXTG(SEQ ID NO:72)，NAXT(SEQ ID NO:73)，NAXTG(SEQ ID NO:74)，NAXS(SEQ ID NO:75)，NAXSG(SEQ ID NO:76)，LPXP(SEQ ID NO:77)，LPXPG(SEQ IDNO:78),其中X是任何氨基酸，LRXTG_n(SEQ ID NO:111)或LPAXG_n(SEQ ID NO:106)，其中X是任何氨基酸且n为至少1；

iii.非细胞毒性蛋白酶或其蛋白水解失活突变体；

iv.能够与靶细胞上的结合位点结合的靶向部分(TM)；和

v.易位结构域。

本发明还提供了一种标记多肽，所述多肽包含：

i.与所述多肽缀合的可检测标记；

ii.氨基酸序列，其包含L(A/P/S)X(T/S/A/C)G_n，其中X是任何氨基酸且n为至少1，L(A/P/S)X(T/S/A/C)A_n，其中X为任何氨基酸，n为至少1，NPQTN，YPRTG，IPQTG，VPDTG或LPXTGS,其中X为任何氨基酸；

iii.非细胞毒性蛋白酶或其蛋白水解失活突变体；

iv.能够与靶细胞上的结合位点结合的靶向部分(TM)；和

v.易位结构域。

在一个实施方案中，标记多肽包含：

i.与所述多肽缀合的可检测标记；

ii.氨基酸序列，其包含L(A/P/S)X(T/S/A/C)G_n，其中X是任何氨基酸且n为至少1，NPQTN，YPRTG，IPQTG，VPDTG，LPXTGS，其中X是任何氨基酸，NPKTG，XPETG，LGATG，IPNTG，IPETG，NSKTA，NPQTG，NAKTN，NPQSS，LPXTX，其中X是任何氨基酸，NPX₁TX₂，其中X₁是Lys或Gln且X₂是Asn、Asp或Gly，X₁PX₂X₃G,其中X₁是Leu、Ile、Val或Met，X₂是任何氨基酸，X₃是Ser、Thr或Ala，LPEX₁G，其中X₁是Ala、Cys或Ser，LPXS，LAXT，MPXT，MPXTG，LAXS，NPXT，NPXTG，NAXT，NAXTG，NAXS，NAXSG，LPXP，LPXPG,其中X是任何氨基酸，LRXTG_n或LPAXG_n，其中X是任何氨基酸且n为至少1；

iii.非细胞毒性蛋白酶或其蛋白水解失活突变体；

iv.能够与靶细胞上的结合位点结合的靶向部分(TM)；和

v.易位结构域。

在一个实施方案中，标记多肽包含：

i.与所述多肽缀合的可检测标记；

Ii.氨基酸序列，其包含L(A/P/S)X(T/S/A/C)G_n,其中X是任何氨基酸且n为至少1，NPQTN，YPRTG，IPQTG，VPDTG或LPXTGS,其中X是任何氨基酸；

iii.非细胞毒性蛋白酶或其蛋白水解失活突变体；

iv.能够与靶细胞上的结合位点结合的靶向部分(TM)；和

v.易位结构域。

在一个实施方案中，与等同的未标记多肽相比，本发明的标记多肽表现出相似的细胞结合、易位和SNARE蛋白切割。在另一个实施方案中，与等同的未标记多肽相比，标记多肽表现出改善的细胞结合、易位和/或SNARE蛋白切割。在一个特别优选的实施方案中，与等同的未标记多肽相比，标记多肽表现出改善的细胞结合、易位和SNARE蛋白切割。可以使用本领域已知的和/或本文所述的任何技术来测定细胞结合、易位和/或SNARE蛋白切割。在一个实施方案中，可以使用基于细胞的或体内测定法来测定细胞结合、易位和/或SNARE蛋白切割。合适的测定法可以包括数字外展评分(DAS)、背根神经节(DRG)测定法、脊髓神经元(SCN)测定法和小鼠膈神经半膈(PNHD)测定法，它们是本领域常规的测定法。合适的测定法可以是Donald等人(2018)，Pharmacol Res Perspect，e00446，1-14中描述的测定法，其通过引用并入本文。优选地，合适的测定法是如Fonfria，E.，S.Donald和V.A.Cadd(2016)，"Botulinum neurotoxin A and an engineered derivate targeted secretioninhibitor(TSI)A enter cells via different vesicular compartments.”J ReceptSignal Transduct Res 36(1):79-88中所述的SNAP25切割测定法，其通过引用并入本文。

在一个实施方案中，在氨基酸序列上或氨基酸序列附近缀合可检测标记，所述氨基酸序列包含L(A/P/S)X(T/S/A/C)G_n，L(A/P/S)X(T/S/A/C)A_n，NPQTN，YPRTG，IPQTG，VPDTG，LPXTGS，NPKTG，XPETG，LGATG，IPNTG，IPETG，NSKTA，NPQTG，NAKTN，NPQSS，LPXTX,其中X是任何氨基酸，NPX₁TX₂,其中X₁是Lys或Gln且X₂是Asn、Asp或Gly，X₁PX₂X₃G,其中X₁是Leu、Ile、Val或Met，X₂是任何氨基酸且X₃是Ser、Thr或Ala，LPEX₁G,其中X₁是Ala、Cys或Ser，LPXS，LAXT，MPXT，MPXTG，LAXS，NPXT，NPXTG，NAXT，NAXTG，NAXS，NAXSG，LPXP，LPXPG,其中X是任何氨基酸，LRXTG_n或LPAXG_n，其中X是任何氨基酸且n为至少1。在一个实施方案中，可检测标记缀合在氨基酸序列上或附近，所述氨基酸序列包含L(A/P/S)X(T/S/A/C)G_n，L(A/P/S)X(T/S/A/C)A_n，NPQTN，YPRTG，IPQTG，VPDTG或LPXTGS。

在一个实施方案中，氨基酸序列可以位于多肽的TM的C-端，所述氨基酸序列包含L(A/P/S)X(T/S/A/C)G_n，L(A/P/S)X(T/S/A/C)A_n，NPQTN，YPRTG，IPQTG，VPDTG，LPXTGS，NPKTG，XPETG，LGATG，IPNTG，IPETG，NSKTA，NPQTG，NAKTN，NPQSS，LPXTX,其中X是任何氨基酸，NPX₁TX₂,其中X₁是Lys或Gln且X₂是Asn、Asp或Gly，X₁PX₂X₃G,其中X₁是Leu、Ile、Val或Met，X₂是任何氨基酸且X₃是Ser、Thr或Ala，LPEX₁G,其中X₁是Ala、Cys或Ser，LPXS，LAXT，MPXT，MPXTG，LAXS，NPXT，NPXTG，NAXT，NAXTG，NAXS，NAXSG，LPXP，LPXPG,其中X是任何氨基酸，LRXTG_n或LPAXG_n，其中X是任何氨基酸且n为至少1。在一个实施方案中，氨基酸序列可以位于多肽的TM的C-端，所述氨基酸序列包含L(A/P/S)X(T/S/A/C)G_n，L(A/P/S)X(T/S/A/C)A_n，NPQTN，YPRTG，IPQTG，VPDTG或LPXTGS。在另一个实施方案中，氨基酸序列可以位于多肽的非细胞毒性蛋白酶或其蛋白水解失活突变体的N-端，所述氨基酸序列包含L(A/P/S)X(T/S/A/C)G_n，L(A/P/S)X(T/S/A/C)A_n，NPQTN，YPRTG，IPQTG，VPDTG，LPXTGS，NPKTG，XPETG，LGATG，IPNTG，IPETG，NSKTA，NPQTG，NAKTN，NPQSS，LPXTX，其中X是任何氨基酸，NPX₁TX₂,其中X₁是Lys或Gln且X₂是Asn、Asp或Gly，X₁PX₂X₃G,其中X₁是Leu、Ile、Val或Met，X₂是任何氨基酸且X₃是Ser、Thr或Ala，LPEX₁G,其中X₁是Ala、Cys或Ser，LPXS，LAXT，MPXT，MPXTG，LAXS，NPXT，NPXTG，NAXT，NAXTG，NAXS，NAXSG，LPXP，LPXPG,其中X是任何氨基酸，LRXTG_n或LPAXG_n，其中X是任何氨基酸且n为至少1。在另一个实施方案中，氨基酸序列可以位于多肽的非细胞毒性蛋白酶或其蛋白水解失活突变体的N-端，所述氨基酸序列包含L(A/P/S)X(T/S/A/C)G_n，L(A/P/S)X(T/S/A/C)A_n，NPQTN，YPRTG，IPQTG，VPDTG或LPXTGS。

在一个实施方案中，标记多肽包含两个或更多个可检测标记，优选地标记多肽包含两个可检测标记。在优选实施方案中，可检测标记是不同的，例如不同颜色的荧光团。

第一和第二(或更多)可检测标记可以缀合在氨基酸序列上或附近，所述氨基酸序列包含L(A/P/S)X(T/S/A/C)G_n，L(A/P/S)X(T/S/A/C)A_n，NPQTN，YPRTG，IPQTG，VPDTG，LPXTGS，NPKTG，XPETG，LGATG，IPNTG，IPETG，NSKTA，NPQTG，NAKTN，NPQSS，LPXTX，其中X是任何氨基酸，NPX₁TX₂,其中X₁是Lys或Gln且X₂是Asn、Asp或Gly，X₁PX₂X₃G,其中X₁是Leu、Ile、Val或Met，X₂是任何氨基酸且X₃是Ser、Thr或Ala，LPEX₁G,其中X₁是Ala、Cys或Ser，LPXS，LAXT，MPXT，MPXTG，LAXS，NPXT，NPXTG，NAXT，NAXTG，NAXS，NAXSG，LPXP，LPXPG，其中X是任何氨基酸，LRXTG_n或LPAXG_n，其中X是任何氨基酸且n为至少1，其中第一和第二(或更多)可检测标记缀合在标记多肽的不同位点上。第一和第二(或更多)可检测标记可以缀合在氨基酸序列上或附近，所述氨基酸序列包含L(A/P/S)X(T/S/A/C)G_n，L(A/P/S)X(T/S/A/C)A_n，NPQTN，YPRTG，IPQTG，VPDTG或LPXTGS，其中第一和第二(或更多)可检测标记缀合在标记多肽的不同位点上。例如，第一可检测标记可以缀合至位于非细胞毒性蛋白酶或其蛋白水解失活突变体的N-端的氨基酸序列上，第二可检测标记可以缀合至位于TM的C-端的氨基酸序列上(反之亦然)。优选地，其中第一和第二(或更多)可检测标记缀合的氨基酸序列的序列不同。

在一个实施方案中，可检测标记缀合至以下氨基酸序列：L(A/P/S)X(T/S/A/C)G_n，L(A/P/S)X(T/S/A/C)A_n，NPQTN，YPRTG，IPQTG，VPDTG，LPXTGS，NPKTG，XPETG，LGATG，IPNTG，IPETG，NSKTA，NPQTG，NAKTN，NPQSS，LPXTX,其中X是任何氨基酸，NPX₁TX₂,其中X₁是Lys或Gln且X₂是Asn、Asp或Gly，X₁PX₂X₃G,其中X₁是Leu、Ile、Val或Met，X₂是任何氨基酸且X₃是Ser、Thr或Ala，LPEX₁G,其中X₁是Ala、Cys或Ser，LPXS，LAXT，MPXT，MPXTG，LAXS，NPXT，NPXTG，NAXT，NAXTG，NAXS，NAXSG，LPXP，LPXPG，其中X是任何氨基酸，LRXTG_n或LPAXG_n，其中X是任何氨基酸且n为至少1。或者，可检测标记可以缀合至以下氨基酸序列的C-端：L(A/P/S)X(T/S/A/C)G_n，L(A/P/S)X(T/S/A/C)A_n，NPQTN，YPRTG，IPQTG，VPDTG，LPXTGS，NPKTG，XPETG，LGATG，IPNTG，IPETG，NSKTA，NPQTG，NAKTN，NPQSS，LPXTX,其中X是任何氨基酸，NPX₁TX₂，其中X₁是Lys或Gln且X₂是Asn、Asp或Gly，X₁PX₂X₃G，其中X₁是Leu、Ile、Val或Met，X₂是任何氨基酸且X₃是Ser、Thr或Ala，LPEX₁G,其中X₁是Ala、Cys或Ser，LPXS，LAXT，MPXT，MPXTG，LAXS，NPXT，NPXTG，NAXT，NAXTG，NAXS，NAXSG，LPXP，LPXPG,其中X是任何氨基酸，LRXTG_n或LPAXG_n，其中X是任何氨基酸且n为至少1，例如，缀合至以下氨基酸序列的C端的1-50，例如1-25或1-10个氨基酸：L(A/P/S)X(T/S/A/C)G_n，L(A/P/S)X(T/S/A/C)A_n，NPQTN，YPRTG，IPQTG，VPDTG，LPXTGS，NPKTG，XPETG，LGATG，IPNTG，IPETG，NSKTA，NPQTG，NAKTN，NPQSS，LPXTX，其中X是任何氨基酸，NPX₁TX₂,其中X₁是Lys或Gln且X₂是Asn、Asp或Gly，X₁PX₂X₃G,其中X₁是Leu、Ile，Val或Met，X₂是任何氨基酸且X₃是Ser、Thr或Ala，LPEX₁G，其中X₁是Ala、Cys或Ser，LPXS，LAXT，MPXT，MPXTG，LAXS，NPXT，NPXTG，NAXT，NAXTG，NAXS，NAXSG，LPXP，LPXPG，其中X是任何氨基酸，LRXTG_n或LPAXG_n，其中X是任何氨基酸且n为至少1。

在一个实施方案中，可检测标记缀合在L(A/P/S)X(T/S/A/C)G_n，L(A/P/S)X(T/S/A/C)A_n，NPQTN，YPRTG，IPQTG，VPDTG或LPXTGS上。或者，可检测标记可以缀合至L(A/P/S)X(T/S/A/C)G_n，L(A/P/S)X(T/S/A/C)A_n，NPQTN，YPRTG，IPQTG，VPDTG或LPXTGS的C-端，例如，缀合至L(A/P/S)X(T/S/A/C)G_n，L(A/P/S)X(T/S/A/C)A_n，NPQTN，YPRTG，IPQTG，VPDTG或LPXTGS的C-端的1-50，例如1-25或1-10个氨基酸。

在另一个实施方案中，可检测标记缀合至以下氨基酸序列的N-端：L(A/P/S)X(T/S/A/C)G_n，L(A/P/S)X(T/S/A/C)A_n，NPQTN，YPRTG，IPQTG，VPDTG，LPXTGS，NPKTG，XPETG，LGATG，IPNTG，IPETG，NSKTA，NPQTG，NAKTN，NPQSS，LPXTX，其中X是任何氨基酸，NPX₁TX₂,其中X₁是Lys或Gln且X₂是Asn、Asp或Gly，X₁PX₂X₃G,其中X₁是Leu、Ile、Val或Met，X₂是任何氨基酸且X₃是Ser、Thr或Ala，LPEX₁G,其中X₁是Ala、Cys或Ser，LPXS，LAXT，MPXT，MPXTG，LAXS，NPXT，NPXTG，NAXT，NAXTG，NAXS，NAXSG，LPXP，LPXPG，其中X是任何氨基酸，LRXTG_n或LPAXG_n，其中X是任何氨基酸且n为至少1，例如，L(A/P/S)X(T/S/A/C)G_n的N-端的1-50,例如1-25或1-10个氨基酸。

在一个实施方案中，可检测标记缀合至L(A/P/S)X(T/S/A/C)G_n，L(A/P/S)X(T/S/A/C)A_n，NPQTN，YPRTG，IPQTG，VPDTG或LPXTGS的N-端，例如，L(A/P/S)X(T/S/A/C)G_n的N-端的1-50,例如1-25或1-10个氨基酸。

在氨基酸序列包含L(A/P/S)X(T/S/A/C)A_n的实施方案中，X是任何氨基酸，n可以是至少2、3、4、5、6、7、8、9或10，这样的氨基酸序列可以包含LPXTA_n(SEQ ID NO:102)。优选n为1-10，更优选为1-4。在这样的实施方案中，缀合的可检测标记和包含L(A/P/S)X(T/S/A/C)A_n的氨基酸序列，其中X是任何氨基酸且n为至少1，表明该多肽已被分选酶(例如来自化脓性链球菌(Streptococcus pyogenes))成功标记。

在一个特别优选的实施方案中，氨基酸序列包含L(A/P/S)X(T/S/A/C)G_n，其中X是任何氨基酸且n为至少1。这样的氨基酸序列可以包含LPXSG_n(SEQ ID NO:103)，LAXTG_n(SEQID NO:104)，LPXTG_n(SEQ ID NO:105)，LPXCG_n(SEQ ID NO:107)，LAXSG_n(SEQ ID NO:108)，LPXAG_n(SEQ ID NO:109)或LSXTG_n(SEQ ID NO:110)。优选地，氨基酸序列可包含LPXSG_n，LAXTG_n，LPXTG_n或LAXSG。

在一个实施方案中，氨基酸序列包含LRXTG_n，其中X是任何氨基酸且n为至少1。

在一个实施方案中，氨基酸序列包含LPAXG_n，其中X是任何氨基酸且n为至少1。

缀合的可检测标记和包含L(A/P/S)X(T/S/A/C)G_n的氨基酸序列，其中X是任何氨基酸且n为至少1，表明该多肽已被分选酶成功标记。在一个实施方案中，n可以是至少2、3、4、5、6、7、8、9或10。优选n为1-10，更优选为1-4。

在一个实施方案中，可检测标记缀合至L(A/P/S)X(T/S/A/C)G_n上或附近。

在一个实施方案中，可检测标记缀合至L(A/P/S)X(T/S/A/C)G_n上，例如缀合至其G氨基酸残基上。或者，可检测标记可以缀合至L(A/P/S)X(T/S/A/C)G_n的C-端，例如L(A/P/S)X(T/S/A/C)G_n的C-端的1-50，例如1-25或1-10个氨基酸。

在另一个实施方案中，可检测标记缀合至L(A/P/S)X(T/S/A/C)G_n的N-端，例如L(A/P/S)X(T/S/A/C)G_n的N-端的1-50，例如1-25或1-10个氨基酸。

在一个实施方案中，可检测标记缀合至氨基酸序列LPXSG_n上或附近，其中n为至少1，例如至少2、3、4、5、6、7、8、9或10。优选地其中n为1-10，更优选为1-5。可检测标记优选地缀合至LPXSG_n的C-端，例如缀合至LPXSG_n的C-端的赖氨酸残基。X是任何氨基酸，例如E。

在一个实施方案中，可检测标记缀合至氨基酸序列LAXTG_n上或附近，其中n为至少1，例如至少2、3、4、5、6、7、8、9或10。优选地其中n为1-10，更优选为1-4。可检测标记优选地缀合至LAXTG_n的N-端，例如缀合至LAXTG_n的N-端的组氨酸残基。X是任何氨基酸，例如E。

在一个实施方案中，第一可检测标记缀合至氨基酸序列LPXSG_n上或附近(其中n为至少1，例如至少2、3、4、5、6、7、8、9或10，优选地，其中n为1-10，更优选1-5)，并且第二可检测标记缀合至氨基酸序列LAXTG_n上或附近(其中n为至少1，例如至少2、3、4、5、6、7、8、9或10，优选地，其中n为1-10，更优选1-4)。第一可检测标记优选地缀合至LPXSG_n的C-端，例如缀合至LPXSG_n的C-端的赖氨酸残基，并且第二可检测标记优选地缀合至LAXTG_n的N-端，例如缀合至LAXTG_n的N-端的组氨酸残基。X是任何氨基酸，例如E。在一个实施方案中，第一可检测标记位于多肽的TM的C-端，并且第二可检测标记位于多肽的非细胞毒性蛋白酶或其蛋白水解失活突变体(优选非细胞毒性蛋白酶)的N-端。

本发明的标记多肽可包含与SEQ ID NO:26具有至少70％序列同一性的多肽序列。在一个实施方案中，本发明的标记多肽包含与SEQ ID NO:26具有至少80％或90％序列同一性的多肽序列。优选地，本发明的标记多肽包含如SEQ ID NO：26所示的多肽(更优选地由其组成)。

本文所述的分选酶可以是分选酶A、分选酶B、分选酶C或分选酶D。Mazmanian，S.K.，G.Liu，H.Ton-That and O.Schneewind(1999)."Staphylococcus aureus sortase，an enzyme that anchors surface proteins to the cell wall."Science 285(5428):760-763和Paterson，G.K.和T.J.Mitchell(2004)."The biology of Gram-positivesortase enzymes."Trends Microbiol 12(2):89-95提供了分选酶的生物学特性的综述，两者都通过引用并入本文。

本发明还涵盖分选酶变体。分选酶变体适当地具有改变的特异性，使得它们识别替代的分选酶位点(例如受体位点)。分选酶变体描述于Dorr，B.M.，H.O.Ham，C.An，E.L.Chaikof and D.R.Liu(2014)."Reprogramming the specificity of sortaseenzymes."Proc Natl Acad Sci U S A 111(37):13343-13348，Chen，I.，B.M.Dorr andD.R.Liu(2011)."A general strategy for the evolution of bond-forming enzymesusing yeast display."Proc Natl Acad Sci U S A 108(28):11399-11404，Dorr，B.M.，H.O.Ham，C.An，E.L.Chaikof and D.R.Liu(2014)."Reprogramming the specificity ofsortase enzymes."Proc Natl Acad Sci U S A 111(37):13343-13348，以及Chen，L.，J.Cohen，X.Song，A.Zhao，Z.Ye，C.J.Feulner，P.Doonan，W.Somers，L.Lin and P.R.Chen(2016)."Improved variants of SrtA for site-specific conjugation on antibodiesand proteins with high efficiency."Sci Rep 6:31899；其中每一个都通过引用并入本文。可以使用所述参考文献中描述的方法生成定制的分选酶变体。当在本发明中使用所述变体时，技术人员将选择由分选酶变体识别的合适的分选酶供体和/或受体位点。本领域技术人员将进一步认识到，所述分选酶供体和/或受体位点可能与本文呈现的那些不同。

在一个实施方案中，分选酶变体可以包含进化的金黄色葡萄球菌分选酶A。进化的分选酶A可以包含相对于本文描述的SEQ ID NO:31的序列的一个或多个突变。例如，进化的分选酶A可以包含相对于SEQ ID NO：31的序列一个或多个以下的突变：P86L，P94S，P94R，N98S，A104T，E106G，A118T，F122S，F122Y，D124G，N127S，K134R，F154R，D160N，D165A，K173E，G174S，K177E，I182V，K190E，K196T，或其组合。在一些实施方案中，本文提供了进化的分选酶，其包含这些突变中的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18或全部19个突变。上述氨基酸取代可提供进化的分选酶，其有效地使用不被相应的亲本野生型分选酶结合的受体和/或供体位点。例如，在一些实施方案中，进化的分选酶利用具有序列LPXTG的分选酶受体位点和具有N-端聚甘氨酸基序的供体位点。在一些实施方案中，进化的分选酶利用(分别)与亲本分选酶所使用的受体和/或供体位点不同的受体和/或供体位点，例如包括LPXS，LAXT，LAXTG(SEQ ID NO:116)，MPXT，MPXTG，LAXS，LAXSG(SEQ ID NO:120)，NPXT，NPXTG，NAXT，NAXTG，NAXS,NAXSG，LPXP，LPXPG，或LPXTA(SEQ ID NO:114)基序的分选酶受体位点。

优选地，分选酶是分选酶A或其变体。分选酶A是一种转肽酶，其识别蛋白质的(优选C-端)L(A/P/S)X(T/S/A/C)(G/A)基序，以在(T/S/A/C)和G/A之间进行切割，然后将酰基组分转移到含有(优选N-端)(寡)甘氨酸(其中基序是L(A/P/S)X(T/S/A/C)G)或(寡)丙氨酸(其中基序是(A/P/S)X(T/S/A/C)A)的亲核试剂。在一个实施方案中，分选酶A可以是可从化脓性链球菌(Streptococcus pyogenes)获得的一种分选酶(例如SEQ ID NO:37)，所述分选酶识别(尤其是)具有序列LPXTA的分选酶受体位点，在这种情况下，优选分选酶受体位点是A_n，其中n为至少1。Antos等人(2009)，J Am Chem Soc，131，10800-10801中描述了化脓性链球菌分选酶的用途，该文献通过引用并入本文。

优选地，分选酶A可以是可从金黄色葡萄球菌(Staphylococcus aureus)或其变体获得的分选酶。

在一个实施方案中，分选酶受体位点可以包含L(A/P/S)X(T/S/A/C)(G/A)，NPQTN，YPRTG，IPQTG，VPDTG或LPXTGS，其中X是任何氨基酸(或由其组成)。例如，分选酶受体位点可以包含L(A/P/S)X(T/S/A/C)G，NPQTN，YPRTG，IPQTG，VPDTG或LPXTGS，其中X是任何氨基酸(或由其组成)。

在一个实施方案中，分选酶受体位点可以包含NPKTG，XPETG，LGATG，IPNTG，IPETG，NSKTA，NPQTG，NAKTN，NPQSS，LPXTX，其中X是任何氨基酸，NPX₁TX₂,其中X₁是Lys或Gln，X₂为Asn、Asp或Gly，X₁PX₂X₃G，其中X₁是Leu、Ile、Val或Met，X₂是任何氨基酸，X₃是Ser、Thr或Ala，LPEX₁G,其中X₁是Ala、Cys或Ser，LPXS，LAXT，MPXT，MPXTG，LAXS，NPXT，NPXTG，NAXT，NAXTG，NAXS，NAXSG，LPXP，LPXPG,其中X是任何氨基酸，LRXTG(SEQ ID NO:123)或LPAXG(SEQ IDNO:118),其中X是任何氨基酸(或由其组成)。

分选酶受体位点X₁PX₂X₃G可以被分选酶A识别。在分选酶受体位点包含X₁PX₂X₃G(或由其组成)的一些实施方案中，X₂可以是Asp、Glu、Ala、Gln、Lys或Met。在一些实施方案中，所述分选酶受体位点包含LPX₁TG，其中X₁是任何氨基酸(或由其组成)。在其他实施方案中，分选酶受体位点包含LPKTG，LPATG，LPNTG，LPETG，LPNAG，LPNTA，LGATG，IPNTG或IPETG(或由其组成)。

分选酶受体位点NPX₁TX₂可以被分选酶B识别。在一些实施方案中，分选酶受体位点包含NPQTN，NPKTG，NSKTA，NPQTG，NAKTN或NPQSS(或由其组成)。

分选酶受体位点LPXTX可以被分选酶C识别。

在一个实施方案中，分选酶受体位点不包含NPKTG，XPETG，LGATG，IPNTG，IPETG，NSKTA，NPQTG，NAKTN，NPQSS，LPXTX，其中X是任何氨基酸，NPX₁TX₂,其中X₁是Lys或Gln，X₂为Asn、Asp或Gly，X₁PX₂X₃G，其中X₁是Leu、Ile、Val或Met，X₂是任何氨基酸，X₃是Ser、Thr或Ala，LPEX₁G,其中X₁是Ala、Cys或Ser，LPXS，LAXT，MPXT，MPXTG，LAXS，NPXT，NPXTG，NAXT，NAXTG，NAXS，NAXSG，LPXP，LPXPG,其中X是任何氨基酸，LRXTG或LPAXG,其中X是任何氨基酸(或由其组成)。

在使用分选酶A的实施方案中，分选酶位点(例如受体或供体位点)是分选酶A位点。

在一个优选的实施方案中，本文所述的分选酶受体位点可以是分选酶A位点。分选酶A共有受体位点可以是L(A/P/S)X(T/S/A/C)(G/A)，其中X是任何氨基酸，例如E。然而，优选地分选酶A共有受体位点是L(A/P/S)X(T/S/A/C)G。

在一个实施方案中，分选酶A受体位点包含或选自LPXSG(SEQ ID NO:115)，LAXTG，LPXTG(SEQ ID NO:117)，LPAXG，LPXCG(SEQ ID NO:119)，LAXSG，LPXAG(SEQ ID NO:121)，LSXTG(SEQ ID NO:122)，LRXTG和LPXTA。优选地，分选酶A受体位点可选自LPXSG、LAXTG、LPXTG和LAXSG，更优选LPXSG或LAXTG。例如，分选酶A受体位点可以是LPESG(SEQ ID NO:112)或LAETG(SEQ ID NO:113)，如本文所示例。

在一些实施方案中，本文所述的分选酶受体位点后接一个或多个C-端氨基酸残基，例如1-50，1-10或优选地1-5(例如2)个氨基酸残基。在一些实施方案中，分选酶受体位点后接一个或多个酸性氨基酸残基。酸性氨基酸残基可以是天冬氨酸或谷氨酸。

分选酶供体位点可包含G_n，其中n为至少1、2、3、4、5、6、7、8、9或10(或由其组成)。在一个实施方案中，n至少为2。优选地，n为2-10，例如2-5。更优选地，n为4。这种供体位点可以优选地是分选酶A位点，优选用于与分选酶A受体位点L(A/P/S)X(T/S/A/C)G一起使用。

在一些实施方案中，分选酶供体位点可以是G_nK，其中n为至少1(例如至少1、2、3、4、5、6、7、8、9或10，在一个实施方案中，n为至少2，优选n为2-10，例如2-5)。

在一个实施方案中，用于本发明的分选酶受体位点包含L(A/P/S)X(T/S/A/C)G，其中X是任何氨基酸(或由其组成)，并且用于本发明的分选酶供体位点包含G_n，其中n为至少1、2、3、4、5、6、7、8、9或10(或由其组成)。

分选酶供体位点可包含A_n，其中n为至少1、2、3、4、5、6、7、8、9或10(或由其组成)。在一个实施方案中，n至少为2。优选地，n为2-10，例如2-5。更优选地，n为4。这种供体位点可以优选地是分选酶A位点，优选用于与分选酶A受体位点L(A/P/S)X(T/S/A/C)A一起使用。

在一个实施方案中，用于本发明的分选酶受体位点包含L(A/P/S)X(T/S/A/C)A，其中X是任何氨基酸(或由其组成)，并且用于本发明的分选酶供体位点包含A_n，其中n为至少1、2、3、4、5、6、7、8、9或10(或由其组成)。

在分选酶受体或供体位点的上下文中，X可以是任何氨基酸，例如选自标准氨基酸：天冬氨酸、谷氨酸、精氨酸、赖氨酸、组氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、甲硫氨酸、色氨酸、半胱氨酸、丙氨酸、甘氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸和苯丙氨酸。在一些实施方案中，X可以是除脯氨酸之外的任何氨基酸。

当使用非分选酶A受体位点时，例如：

金黄色葡萄球菌(Staphylococcus aureus)分选酶B位点：NPQTN；

肺炎链球菌(Streptococcus pneumoniae)分选酶B位点：YPRTG、IPQTG或VPDTG；

化脓性链球菌(Streptococcus pyogenes)分选酶B位点：LPXTGS；

肺炎链球菌(Streptococcus pneumoniae)分选酶C位点：YPRTG、IPQTG或VPDTG；和

肺炎链球菌(Streptococcus pneumoniae)分选酶D位点：YPRTG、IPQTG或VPDTG；

本领域技术人员将根据本领域的教导选择合适的供体位点，用于与所述非分选酶A受体位点一起使用。

分选酶B可以是与SEQ ID NO:32或34具有至少70％序列同一性的催化活性多肽。在一个实施方案中，分选酶B可以是与SEQ ID NO:32或34具有至少80％或90％序列同一性的催化活性多肽。优选地，分选酶B可以是包含SEQ ID NO:32或34(更优选地由其组成)的催化活性多肽。

分选酶C可以是与SEQ ID NO:35具有至少70％序列同一性的催化活性多肽。在一个实施方案中，分选酶C可以是与SEQ ID NO:35具有至少80％或90％序列同一性的催化活性多肽。优选地，分选酶C可以是包含SEQ ID NO:35(更优选地由其组成)的催化活性多肽。

分选酶D可以是与SEQ ID NO:36具有至少70％序列同一性的催化活性多肽。在一个实施方案中，分选酶D可以是与SEQ ID NO:36具有至少80％或90％序列同一性的催化活性多肽。优选地，分选酶D可以是包含SEQ ID NO:36(更优选地由其组成)的催化活性多肽。

分选酶受体位点优选地位于多肽的C-端。分选酶供体位点优选地位于多肽的N-端。

在本文上下文中使用的术语―位于C-端”可以是指受体位点的C-端残基位于多肽的C-端残基的N-端最多50个氨基酸残基，例如受体位点的C-端残基位于多肽C-端残基的N-端1-50，优选10-40个氨基酸残基。在特别优选的实施方案中，受体位点的C-端残基可以是多肽的C-端残基。

在多肽的分选酶受体位点的C-端有一个或多个残基的实施方案中，优选在将多肽用于本文所述的标记方法之前去除所述一个或多个残基。

在本文上下文中使用的术语―位于N-端”可以是指供体位点的C-端残基位于多肽N-端残基的C-端最多50个氨基酸残基，例如供体位点的N-端残基位于多肽N-端残基的C-端1-50，优选1-25个氨基酸残基。在特别优选的实施方案中，供体位点的N-端残基可以是多肽的N-端残基。

在多肽的分选酶供体位点N-端有一个或多个残基的实施方案中，优选在将多肽用于本文所述的标记方法之前去除所述一个或多个残基。

在一个实施方案中，分选酶受体或供体位点位于多肽的TM的C-端。在一个实施方案中，分选酶受体或供体位点位于非细胞毒性蛋白酶或其蛋白水解失活突变体的N-端。

在一个实施方案中，本发明的多肽包含至少两个分选酶受体位点、至少两个分选酶供体位点、或至少一个分选酶受体位点和至少一个分选酶供体位点。优选地，本发明的多肽包含一个分选酶受体位点和一个分选酶供体位点。当在本发明的方法中标记时，如本文所述包含至少两个(优选两个)位点的多肽包含至少两个(优选两个)可检测标记。对于此类多肽，至少两个位点优选是不同的，例如一个位点可以是供体位点且一个位点可以是受体位点，或者当至少两个位点相同时(例如两个都是供体位点或两个都是受体位点)，优选位点具有不同的氨基酸序列。这允许使用不同的分选酶来介导标记，例如识别不同受体位点的分选酶。

在一个实施方案中，本发明的多肽包含位于多肽的TM的C-端的分选酶受体位点和位于非细胞毒性蛋白酶或其蛋白水解失活突变体(优选非细胞毒性蛋白酶)N-端的分选酶供体位点。

在一个实施方案中，标记多肽的方法包括两步标记方法。在一个实施方案中，步骤之一包括使用识别多肽或标记底物的第一分选酶受体位点的分选酶，第二步骤包括使用识别多肽或标记底物的不同受体位点的不同分选酶。本领域技术人员将理解，如果使用两个以上不同的分选酶受体位点，该方法可以包括两个以上的标记步骤和使用两个以上不同的分选酶，其中每个分选酶识别不同的分选酶受体位点之一。

优选地，多肽包含受体位点和供体位点，所述受体位点包含LPXSG(或由其组成)，所述供体位点包含G_n，其中n为2-5(或由其组成)。在特别优选的实施方案中，多肽包含受体位点和供体位点，所述受体位点包含LPESG(或由其组成)，所述供体位点包含G₃(或由其组成)。

在一个实施方案中，本发明的方法包括：

a.提供包含分选酶受体位点和分选酶供体位点的多肽；

b.孵育多肽与：

第一分选酶，其识别分选酶受体位点；和

第一标记底物，其包含分选酶供体和缀合的可检测标记；

其中第一分选酶催化分选酶受体位点的氨基酸和分选酶供体位点的氨基酸之间的结合，从而标记多肽；

c.进一步孵育多肽与：

第二标记底物，其包含不同分选酶受体位点和缀合的可检测标记，其中分选酶受体位点与多肽的分选酶受体位点不同；和

第二分选酶，其识别不同的分选酶受体位点(优选不识别多肽的分选酶受体位点)；

其中第二分选酶催化不同的分选酶受体位点的氨基酸和分选酶供体位点的氨基酸之间的结合，从而进一步标记多肽；和

d.获得标记多肽。

本领域技术人员将理解，上述方法的步骤b.和c.可以以任何顺序进行。

在另一个实施方案中，本发明的方法包括：

a.提供包含第一分选酶受体位点和第二分选酶受体位点的多肽，其中第一和第二分选酶受体位点是不同的；

b.孵育多肽与：

第一分选酶，其识别第一分选酶受体位点(并且优选不识别第二分选酶受体位点)；和

标记底物，其包含分选酶供体和缀合的可检测标记；

其中第一分选酶催化第一分选酶受体位点的氨基酸和分选酶供体位点的氨基酸之间的结合，从而标记多肽；

c.进一步孵育多肽与：

第二分选酶，其识别第二分选酶受体位点(并且优选不识别第一分选酶受体位点)；和

标记底物，其包含分选酶供体和缀合的可检测标记；

其中第二分选酶催化第二分选酶受体位点的氨基酸和分选酶供体位点的氨基酸之间的结合，从而进一步标记多肽；和

d.获得标记多肽。

在步骤c.中，标记底物优选地包含与步骤b.的标记底物不同的可检测标记，例如不同颜色的荧光团。

在另一个实施方案中，本发明的方法包括：

a.提供包含第一选酶供体位点和第二分选酶供体位点的多肽；

b.孵育多肽与：

第一标记底物，其包含第一分选酶受体位点和缀合的可检测标记；和

第一分选酶，其识别第一分选酶受体位点(并且优选不识别第二分选酶受体位点)；

其中第一分选酶催化第一分选酶受体位点的氨基酸和第一或第二分选酶供体位点的氨基酸之间的结合，从而标记多肽；

c.进一步孵育多肽与：

第二标记底物，其包含第二分选酶受体位点和缀合的可检测标记，其中第二分选酶受体位点与第一分选酶受体位点不同；和

第二分选酶，其识别第二分选酶受体位点(并且不识别第一分选酶受体位点)；和

其中第二分选酶催化第二分选酶受体位点的氨基酸和第一或第二分选酶供体位点的氨基酸之间的结合，从而进一步标记多肽；和

d.获得标记多肽。

在一个优选实施方案中，本发明的方法包括：

a.提供一种包含分选酶受体位点和分选酶供体位点的多肽，所述分选酶受体位点包含LPXSG，其中X是任何氨基酸，并且所述分选酶供体位点包含G_n，其中n是2-5；

b.孵育多肽与：

第一分选酶,其识别包含LPXSG的分选酶受体位点(并且优选地不识别包含LAXTG的分选酶受体位点)；和

第一标记底物，其包含分选酶供体位点和缀合的可检测标记的，所述分选酶供体位点包含G_n，其中n为2-10(优选2-5)；

其中第一分选酶催化多肽的分选酶受体位点的氨基酸和第一标记底物的分选酶供体位点的氨基酸之间的结合，从而标记多肽；

c.孵育多肽与：

包含分选酶受体位点和缀合的可检测标记的第二标记底物，所述分选酶受体位点包含LAXTG，其中X是任何氨基酸；和

第二分选酶,其识别包含LAXTG的分选酶受体位点(并且优选地不识别包含LPXSG的分选酶受体位点)；

其中第二分选酶催化第二标记底物的分选酶受体位点的氨基酸和多肽的分选酶供体位点的氨基酸之间的结合，从而进一步标记多肽；和

d.获得标记多肽。

与第一和第二标记底物缀合的可检测标记优选地是不同的，例如是不同颜色的荧光团。

技术人员将理解，在旨在向多肽添加多于两个可检测标记的情况下，该多肽可包含多于两个位点(例如供体或受体位点),并且该方法可迭代地进行。

术语―不识别分选酶受体位点”(或其变换)可表示当与识别所述位点的分选酶对多肽的活性相比较时,分选酶对包含受试分选酶受体位点的多肽具有较低的活性(例如切割或缀合)。在一个实施方案中，术语―不识别分选酶受体位点可表示当与识别所述位点的分选酶对多肽的活性相比较时,分选酶对包含受试分选酶受体位点的多肽基本上不具有、或不具有活性(例如切割或缀合)。在一个实施方案中，术语―不识别分选酶受体位点”(或其变换)可表示当与所述分选酶对包含分选酶所识别的分选酶受体位点的多肽的活性相比较时,分选酶对包含受试分选酶受体位点的多肽具有较低的活性(例如切割或缀合)。在一个实施方案中，术语―不识别分选酶受体位点”可表示当与所述分选酶对包含分选酶所识别的分选酶受体位点的多肽的活性相比较时,分选酶对包含受试分选酶受体位点的多肽基本上不具有、或不具有活性(例如切割或缀合)。被分选酶识别的分选酶受体位点可以是本领域已知的被所述分选酶识别的位点。

本发明方法的孵育步骤可以在允许使用分选酶成功标记多肽的任何条件下进行。此类条件可由技术人员使用常规技术/优化来确定。

技术人员可以使用常规技术确定用于本文所述方法的孵育步骤中的多肽、分选酶和标记底物的量。在一个实施方案中，该方法包括相对于多肽和分选酶使用过量的标记底物，以及任选地相对于多肽使用过量的分选酶。在一个实施方案中，该方法包括使用重量比为1:2:20的多肽与分选酶与标记底物。在另一个实施方案中，该方法包括使用摩尔比为1:2:20的多肽与分选酶与标记底物。

本领域技术人员还可以使用常规技术确定本文所述方法的孵育步骤的反应条件。例如，反应可以进行至少2、4、6、8、10或12小时。优选地，反应可以进行至少10小时。反应可以在1-40℃，例如1-37℃下进行。在一个实施方案中，反应可以在1-10℃，优选3-5℃，例如约4℃下进行。反应时间可根据所用温度进行调整，例如较低的温度可能需要较长的孵育时间。

在本发明方法的孵育步骤之后，可以将任何游离的标记底物和/或分选酶和/或未标记多肽与标记多肽分离。在一个实施方案中，通过分选酶或标记多肽上的标签，优选地通过标记多肽上的标签(例如His-标签)实现分离。标签可以存在于标记的多肽上，但不存在于未标记的多肽上，例如其中标签存在于已经与标记的多肽缀合的标记底物上。

在一个实施方案中，当多肽包含两个或更多个位点并且所述方法包括两个或更多个孵育/标记步骤时，可以采用分离步骤。可以在每个孵育/标记步骤之后采用分离步骤。

在一个实施方案中，本发明的方法包括第一孵育和第二孵育(例如，如本文详述的)，其中在第一孵育之后，使用第一标签将标记的多肽与未标记的多肽分离。优选地，第一标签不存在于标记的多肽，但存在于未标记的多肽上，并且未标记的多肽可以通过免疫耗竭的方式去除。第一标签可以是Strep-标签。在一个实施方案中，在第二孵育之后，使用第二标签将双标记的多肽与任何单标记(或未标记)的多肽分离。优选地，第二标签存在于双标记的多肽上，但不存在于单标记(或未标记)的多肽中，并且双标记的多肽可以通过免疫亲和色谱法的方式分离。第二标签可以是His-标签。

在用于使用分选酶标记的多肽包含分选酶供体位点的实施方案中，所述位点的N-端可以被保护，例如通过其N-端的一个或多个氨基酸残基被保护。有利地，这可以防止进一步包含分选酶受体位点的多肽的环化。所述一个或多个氨基酸可以通过可切割位点例如TEV切割位点的方式去除，从而暴露所述分选酶供体位点的N-端。因此，本发明的方法可以包括使分选酶供体的N-端脱保护的步骤，例如通过去除其N-端的一个或多个氨基酸。脱保护步骤可以在第一和第二孵育步骤之间进行。

在本发明的多肽包含可切割位点(例如分选酶供体位点N-端的可切割位点)的一个实施方案中，所述可切割位点可以是任何可切割位点。在一个实施方案中，可切割位点可以是梭菌神经毒素的非天然(即外源性)位点。在一些实施方案中，可切割位点是蛋白酶识别位点或其变体，条件是该变体可被相关蛋白酶切割。可切割位点可以是被肠激酶、因子Xa、烟草蚀刻病毒(TEV)、凝血酶、PreScission、ADAM17、人气道胰蛋白酶样蛋白酶(HAT)、弹性蛋白酶、弗林蛋白酶、颗粒酶或半胱天冬酶2、3、4、7、9或10切割的位点。可切割位点可包含与SEQ ID NO：84，85，86，87，88，89，90，91，92，93，94，95，96，97，98，99或100中的任一个具有至少70％序列同一性的多肽序列。在一个实施方案中，可切割位点可包含与SEQ IDNO：84，85，86，87，88，89，90，91，92，93，94，95，96，97，98，99或100中的任一个具有至少80％或90％序列同一性的多肽序列。在另一个实施方案中，可切割位点包含非梭菌可切割位点(优选地由其组成)，所述非梭菌可切割位点具有如SEQ ID NO：84，85，86，87，88，89，90，91，92，93，94，95，96，97，98，99或100中任一个所示的多肽序列。优选地，可切割位点包含如SEQID NO：87所示的TEV切割位点(更优选地由其组成)。

用于本发明的分选酶可以包含与SEQ ID NO:14具有至少70％序列同一性的多肽序列。在一个实施方案中，用于本发明的分选酶可以包含与SEQ ID NO:14具有至少80％或90％序列同一性的多肽。优选地，用于本发明的分选酶可以包含如SEQ ID NO:14所示的多肽序列(更优选地由其组成)。

用于本发明的分选酶可由核酸序列编码，所述核酸序列与SEQ ID NO:13具有至少70％序列同一性。在一个实施方案中，用于本发明的分选酶可由核酸序列编码，所述核酸序列与SEQ ID NO:13具有至少80％或90％序列同一性。优选地，用于本发明的分选酶可由核酸序列编码，所述核酸序列包含SEQ ID NO:13所示的核酸序列(更优选地由其组成)。

用于本发明的分选酶可以包含与SEQ ID NO:16具有至少70％序列同一性的多肽序列。在一个实施方案中，用于本发明的分选酶可以包含与SEQ ID NO:16具有至少80％或90％序列同一性的多肽。优选地，用于本发明的分选酶可以包含如SEQ ID NO:16所示的多肽序列(更优选地由其组成)。

用于本发明的分选酶可由核酸序列编码，所述核酸序列与SEQ ID NO:15具有至少70％序列同一性。在一个实施方案中，用于本发明的分选酶可由核酸序列编码，所述核酸序列与SEQ ID NO:15具有至少80％或90％序列同一性。优选地，用于本发明的分选酶可由核酸序列编码，所述核酸序列包含如SEQ ID NO:15所示的核酸序列(更优选地由其组成)。

分选酶A可以是与SEQ ID NO:31、33或37具有至少70％序列同一性的催化活性多肽。在一个实施方案中，分选酶A可以是与SEQ ID NO:31、33或37具有至少80％或90％序列同一性的催化活性多肽。优选地，分选酶A可以是催化活性的，其包含SEQ ID NO:31、33或37(或由其组成)。

本发明可以包括使用至少两种分选酶(更优选使用两种分选酶)，例如其中所述分选酶包含分别与SEQ ID NO：14和16具有至少70％序列同一性的多肽。在一个实施方案中，本发明可以包括使用至少两种分选酶，其中所述分选酶包含分别与SEQ ID NO：14和16具有至少80％或90％序列同一性的多肽。优选地，本发明可以包括使用至少两种分选酶，其中所述分选酶包含分别具有SEQ ID NO：14和16的多肽(更优选地由其组成)。

在包括使用分选酶的方法中使用的标记底物是分选酶底物，并且其包含分选酶供体或受体位点和缀合的可检测标记。当标记底物旨在用于标记包含分选酶受体位点的多肽时，标记底物包含分选酶供体位点，反之亦然。标记底物可以是肽或多肽，优选肽。

标记底物可包含本文所述的任何分选酶供体或受体位点。标记底物还可以包含一个或多个标签，例如纯化标签(例如His-标签)，以帮助其纯化或与标记多肽的分离。

在一个实施方案中，标记底物包含分选酶供体位点。包含分选酶供体位点的标记底物的示例由SEQ ID NO:29提供。因此，在一个实施方案中，提供了一种标记底物，其包含与SEQ ID NO:29具有至少70％序列同一性的多肽序列。标记底物可包含与SEQ ID NO:29具有至少80％或90％序列同一性的多肽序列。优选地，标记底物包含如SEQ ID NO：29所示的多肽序列(更优选地由其组成)。

在一个实施方案中，标记底物包含分选酶受体位点。包含分选酶受体位点的标记底物的示例由SEQ ID NO:30提供。因此，在一个实施方案中，提供了一种标记底物，其包含与SEQ ID NO:30具有至少70％序列同一性的多肽序列。标记底物可包含与SEQ ID NO:30具有至少80％或90％序列同一性的多肽序列。优选地，标记底物包含如SEQ ID NO：30所示的多肽序列(更优选地由其组成)。

分选酶受体位点优选地位于标记底物的C-端。分选酶供体位点优选地位于标记底物的N-端。

本发明的多肽优选地用作双链多肽，其中两条链通过二硫键的方式连接在一起。在此类实施方案中，多肽可包含位于两条多肽链之一或两者的N-端的分选酶供体位点。例如，双链多肽可包含非细胞毒性蛋白酶(或其蛋白水解失活的突变体)和/或其易位结构域的N-端的分选酶供体位点。在分选酶供体位点在多肽的易位结构域的N-端的实施方案中，分选酶供体位点可能仅可用于当多肽已经转化为双链形式(例如通过蛋白水解活化)的本发明的方法中。

在本文上下文中使用的术语―位于C-端”可以指受体位点的C-端残基位于标记底物的C-端残基的N-端最多50个氨基酸残基，例如，受体位点的C-端残基位于标记底物的C-端残基的N-端1-50，优选10-40个氨基酸残基。在特别优选的实施方案中，受体位点的C-端残基可以是标记底物的C-端残基。

在标记底物的分选酶受体位点的C-端有一个或多个残基的实施方案中，优选在将标记底物用于本文所述的标记方法之前去除所述一个或多个残基。

在本文上下文中使用的术语―位于N-端”可以指供体位点的C-端残基位于标记底物的N-端残基的C-端最多50个氨基酸残基，例如，供体位点的N-端残基位于标记底物的N-端残基的C-端1-50，优选1-25个氨基酸残基。在特别优选的实施方案中，供体位点的N-端残基可以是标记底物的N-端残基。

在标记底物的分选酶供体位点N-端有一个或多个残基的实施方案中，优选在将标记底物用于本文所述的标记方法之前去除所述一个或多个残基。

通过原理证明数据，本发明人已经证明，与分选酶介导的标记类似的任何标记技术都可以用于本发明而不会对本发明多肽的效力(例如结合、易位和/或催化活性)产生负面影响。因此，本发明涵盖能够将标记的多肽与本发明的多肽缀合的替代酶的用途。这些酶可以代替分选酶或与分选酶一起使用(优选地，一起使用，例如，当在另外的位点标记时)。也可用于本发明的酶可包括替代的转肽酶或连接酶。因此，本文关于分选酶描述的实施方案可应用于替代的转肽酶或连接酶。

在一个实施方案中，本发明可以包括使用连接酶，例如butelase1(或其变体)，其是可从植物种Clitoria ternatea获得的连接酶，并描述于Nguyen，G.K.，Y.Cao，W.Wang，C.F.Liu and J.P.Tam(2015)."Site-Specific N-Terminal Labeling of Peptides andProteins using Butelase 1 and Thiodepsipeptide."Angew Chem Int Ed Engl 54(52):15694-15698 and Nguyen et al(2016)，Nature Protocols，11，10，1977-1988，其通过引用并入本文。当本发明包括使用转肽酶或连接酶替代分选酶时，标记底物分别是所述转肽酶或连接酶的底物。

在使用butelase1的实施方案中，多肽包含butelase1受体或供体位点，并且使用包含butelase1供体或受体位点和缀合的可检测标记的标记底物。类似于包括使用分选酶的方法，其中多肽包含butelase受体位点，包含缀合的可检测标记的标记底物包含butelase供体位点(反之亦然)。在这样的实施方案中，标记底物是butelase(例如butelase1)的底物。

Butelase在C-端Asn/Asp-His-Val共有序列的Asn/Asp和His之间切割并且可以连接包含N-端氨基酸序列Xaa-(Ile/Leu/Val/Cys)的多肽，其中Xaa是除脯氨酸外的任何氨基酸，以在Asn/Asp-Xaa-(Ile/Leu/Val/Cys)之间形成键。在一个实施方案中，butelase受体位点包含Asn/Asp-His-Val(或由其组成)。在一个实施方案中，butelase供体位点包含Xaa-(Ile/Leu/Val/Cys)，其中Xaa是除脯氨酸之外的任何氨基酸(或由其组成)。

在butelase位点的上下文中，Xaa可选自(例如)标准氨基酸：天冬氨酸、谷氨酸、精氨酸、赖氨酸、组氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、甲硫氨酸、色氨酸、半胱氨酸、丙氨酸、甘氨酸、缬氨酸、亮氨酸、异亮氨酸和苯丙氨酸。

因此，提供了一种制备标记多肽的方法，所述方法包括：

a.提供一种多肽，其包含：

i.butelase受体或供体位点；

ii.非细胞毒性蛋白酶或其蛋白水解失活突变体；

iii.能够与靶细胞上的结合位点结合的靶向部分(TM)；和

iv.易位结构域；

b.孵育多肽与：

butelase(例如butelase1)；和

包含butelase供体或受体位点和缀合的可检测标记的标记底物；

其中butelase催化butelase受体位点的氨基酸和butelase供体位点的氨基酸之间的结合，从而标记多肽；和

c.获得标记多肽。

在另一方面，本发明提供了用butelase标记的多肽，其包含：

butelase受体或供体位点；

能够在靶细胞中切割胞吐融合器的蛋白质的非细胞毒性蛋白酶或其蛋白水解失活突变体；

能够与靶细胞上的结合位点结合的靶向部分(TM)；和

能够将非细胞毒性蛋白酶从内体内穿过内体膜易位到靶细胞的胞质溶胶内的易位结构域；

其中当多肽包含butelase供体位点时，butelase供体位点位于多肽的N-端；和

其中所述供体位点的N-端残基是所述多肽的N-端残基；或者

其中所述多肽包含一个或多个位于所述butelase供体位点和可切割位点N-端的氨基酸残基，当所述可切割位点被切割时，暴露butelase供体位点的N-端。

本发明还提供了一种标记多肽，所述多肽包含：

i.与所述多肽缀合的可检测标记；

ii.包含Asn/Asp-Xaa-(Ile/Leu/Val/Cys)的氨基酸序列，其中Xaa为除脯氨酸外的任何氨基酸；

iii.非细胞毒性蛋白酶或其蛋白水解失活突变体；

iv.能够与靶细胞上的结合位点结合的靶向部分(TM)；和

v.易位结构域。

因此，标记多肽可以包含缀合在氨基酸序列上或附近的可检测标记，所述氨基酸序列包含Asn/Asp-Xaa-(Ile/Leu/Val/Cys)(或由其组成),其中Xaa是除脯氨酸之外的任何氨基酸。

在一个实施方案中，转肽酶或连接酶，例如butelase1与分选酶组合使用以获得具有两个或更多个标记的多肽。因此，在一个实施方案中，本发明的多肽可以包含至少一个如本文所述的分选酶受体或供体位点，以及至少一个butelase(例如butelase1)受体或供体位点。

Butelase 1可以是包含与SEQ ID NO:27或28(优选SEQ ID NO:28)具有至少70％序列同一性的多肽序列的催化活性多肽。在一个实施方案中，butelase 1可包含与SEQ IDNO:27或28(优选SEQ ID NO:28)具有至少80％、90％或95％序列同一性的多肽序列。优选地，butelase 1可以包含如SEQ ID NO:27或28(优选SEQ ID NO:28)所示的多肽序列(更优选地由其组成)。

其他连接酶可包括PATG(SEQ ID NO:41)，PCY1(SEQ ID NO:42)，POPB(SEQ ID NO:43)或Butelase同源物OaAEP1b SEQ ID NO:44和45)(Harris等人(2015)，Nat Commun，6，10199)。当所述连接酶具有信号肽或其他N-端前导序列时，优选在用于本发明之前去除所述信号肽或前导序列。

POPB及其合适的使用方法在本领域中有所教导。例如，如Luo H(2014)，Chemistryand Biology 21:1610-1617中所述，在此引入作为参考。

因此，用于本发明的连接酶可以包含与SEQ ID NO：41-44中的任一个具有至少70％序列同一性的多肽序列。在一个实施方案中，连接酶可以包含与SEQ ID NO：41-44中的任一个具有至少80％、90％或95％序列同一性的多肽序列。优选地，连接酶可以包含如SEQID NO：41-44中的任一个所示的多肽序列(更优选地由其组成)。

本发明包括本领域技术人员已知的任何合适的可检测标记的使用。可检测标记可以是可以通过标记的光学特性在视觉上检测到的标记。可以使用荧光技术，例如荧光显微镜来检测这样的标记。因此，在一个特别优选的实施方案中，可检测标记是荧光团。优选地，可检测标记是(或包含)荧光染料，例如HiLyte荧光染料(可从AnaSpec商购)、AlexaFluor(可从Thermo Fisher商购)、Atto(可从Sigma-Aldrich商购)、Quantum Dots(可从Sigma-Aldrich商购)、Janelia Fluor染料(可从Janelia，US商购)等。在优选的实施方案中，可检测标记不包含多糖和/或多元醇和/或细菌或病毒聚合物(例如多糖或多肽)。

一方面，本发明还提供了一种测定本发明多肽的方法，所述方法包括：

a.使靶细胞与本发明的标记多肽接触；和

b.检测可检测标记。

此类方法可以在体外或体内进行(例如在哺乳动物中，例如非人类哺乳动物，例如小鼠)。优选地，该方法在体外进行。当在体内进行时，该方法可以包括取出组织样品用于离体分析。

本发明的方法优选使用活细胞/组织进行，优选实时进行。所述方法有利地允许测定本发明多肽的结合、运输和易位。

该方法可以是脉冲追踪实验或包括脉冲步骤(例如包括使用标记多肽)和追踪步骤(例如不包括使用标记多肽并且任选地包括使用未标记多肽)。

检测可检测标记允许检测多肽或其部分。例如，当多肽包含与非细胞毒性蛋白酶或其蛋白水解失活突变体缀合的第一可检测标记和与易位结构域或TM缀合的第二可检测标记时，该方法可包括检测两个所述可检测标记。

本发明的方法可以包括检测是否存在两个或更多个可检测标记的共定位。可以使用本领域技术人员已知的任何技术(例如FRET和相关技术)来实现检测。在一个实施方案中，本发明的方法包括检测两个或更多个可检测标记共定位的变化，例如随时间的变化。在多肽包含与非细胞毒性蛋白酶或其蛋白水解失活突变体缀合的第一可检测标记和与易位结构域或TM缀合的第二可检测标记的实施方案中，检测第一和第二可检测标记的共定位的减少(例如随时间的减少)可以允许测量非细胞毒性蛋白酶或其蛋白水解失活突变体从内体向外的易位。可将发生这种共定位变化所需的时间|用于确定易位率。检测到共定位没有变化(例如，基本上没有变化)可能表明没有发生易位。

该方法可包括检测细胞胞质溶胶中第一可检测标记的存在和/或细胞内体中第二可检测标记的存在，这也可提供易位测定。同样，在内体中检测第一和第二可检测标记(共定位)可能表明多肽已被成功内吞。

在一些实施方案中，本发明的方法可以包括定量可检测标记的量，例如在细胞中的特定位置和/或在特定时间过程中。这种定量可以通过检测细胞中特定位置处的可检测标记的强度来确定(例如随时间)。或者或另外地，可通过测定包含存在于细胞中的所述可检测标记的团块的数量或大小来进行定量。

在一个实施方案中，本发明的方法包括：

i)使靶细胞与本发明的标记多肽接触，所述标记多肽待被评估内体释放能力，其中所述靶细胞包含细胞膜，所述细胞膜包含存在于所述细胞的细胞膜外表面上的结合位点；

ii)将所述标记多肽与所述靶细胞孵育，从而允许

a)所述标记多肽与存在于靶细胞上的结合位点结合并形成与其的结合复合物，从而允许所述结合复合物通过内吞作用进入靶细胞；

b)在所述细胞内形成一个或多个内体，其中所述一个或多个内体包含所述标记多肽；和

c)所述标记多肽通过穿过一个或多个内体的内体膜进入靶细胞的胞质溶胶中；

iii)去除未与靶细胞上存在的结合位点结合的过量标记多肽；

iv)在预定时间段后，检测存在于一个或多个内体中的标记多肽的量，或检测存在于所述靶细胞的胞质溶胶中的标记多肽的量；

v)比较步骤iv)中检测到的标记多肽的量与对照值，其中所述对照值代表在步骤iv)之前存在于一个或多个内体中的标记多肽的量或存在于胞质溶胶中的标记多肽的量；

vi)通过确定存在于一个或多个内体中的标记多肽的量的相对变化，或通过确定存在于所述靶细胞的胞质溶胶中的标记多肽的量的相对变化，计算标记多肽的内体释放值。

靶细胞可以是真核细胞，例如哺乳动物细胞，例如本文所述的靶细胞。

孵育步骤ii)可以进行任何给定的时间段，例如进行5分钟至5天的时间段。典型的时间段是1-12小时，例如2-10小时、4-8小时或6-8小时。在此期间，靶细胞(即细胞膜的外表面)可能暴露于标记多肽(通常是过量的标记多肽)，从而达到―稳态”，其中标记多肽以大致相同的速率进入和离开细胞内内体。该时间点代表进行步骤iii和/或iv)的最佳时间点。

步骤iii)可以包括减少或去除靶细胞外部的标记多肽的来源，从而减少进入细胞的标记多肽的量(或基本上阻止)进入细胞的标记多肽。进入靶细胞的标记多肽的量的所述减少进而提供进入内体的标记多肽的量的变化，这继而导致离开内体和/或进入靶细胞的胞质溶胶的标记多肽的量(或速率)的变化。在一个实施方案中，离开内体结构的标记多肽的量(或速率)可以提供测定法的基础——所述离开内体结构的标记多肽的量(或速率)可以通过内体中存在的标记多肽的量的变化和/或胞质溶胶中存在的标记多肽的量的变化来测量。当测量内体中存在的标记多肽的量时，通常观察到存在的标记多肽的量减少。当测量存在于胞质溶胶中的标记多肽的量时，可以观察到存在于胞质溶胶中的标记多肽的量的增加或减少。例如，当在建立标记多肽的稳态内体转运之前启动步骤iii)时，可以观察到胞质溶胶中标记多肽的量增加。或者，当标记多肽从靶细胞的细胞分泌速率超过标记多肽从内体进入胞质溶胶的内体转运速率时，可以观察到胞质溶胶中标记多肽的量减少。

测定法中使用的靶细胞可以固定在表面上。细胞的固定可以作为预测定步骤(即预固定)进行，或者可以作为测定方案的一部分进行。因此，在一个实施方案中，测定法中的细胞被预固定。可以通过任何常规方式进行靶细胞的固定。例如，将细胞以高密度接种到测定板中并在进行测定法之前使其附着。或者，将细胞接种到测定板中并在使用前培养数天以提供汇合的单层。可以通过使用常规包被增强细胞附着，例如聚-D-赖氨酸包被板。

在一个实施方案中，可以在步骤iii)之前或期间进行靶细胞的固定，从而提供一种用于将所述细胞与游离的(例如未结合的或外源的)标记多肽分离的简单方法。或者，可以在步骤iii)之后进行固定，例如以促进检测步骤iv)。

步骤iii)可包括过滤步骤或亲和配体步骤，在此期间将靶细胞与过量的(例如未结合的或外源的)标记多肽分离。步骤iii)可以包括洗涤步骤，其中例如使用常规缓冲液将过量的(例如未结合的或外源的)标记多肽从靶细胞中洗掉。过量的标记多肽旨在指存在于测定介质中、靶细胞外部且尚未与存在于靶细胞表面上的结合位点结合的标记多肽。

步骤iv)中标记多肽的检测通常在步骤iii)之后不久进行。举例来说，步骤iv)的典型时间范围在步骤iii)之后5分钟至5小时之间。在一个实施方案中，步骤iv)在步骤iii)之后15-240分钟、或30-180分钟、或45-150分钟进行。可以在多个时间点重复进行检测步骤iv)，例如以10分钟或15分钟或30分钟的间隔进行——这将允许计算内体释放速率。

可以通过任何常规方式进行检测步骤iv)。标记多肽的检测可以基于所述标记多肽的细胞内定位进行。

比较步骤v)利用对照值的使用，所述对照值代表在检测步骤iv)之前存在于内体和/或胞质溶胶中的标记多肽的量。对照值通常通过与在检测步骤iv)中测定标记多肽的量相同的手段/方法测定。对照值通常代表在步骤iii)期间或之前存在于内体和/或胞质溶胶中的标记多肽的量。举例来说，对照值可以代表在步骤ii)期间或结束时存在于内体和/或胞质溶胶中的标记多肽的量——在一个实施方案中，对照值代表当已建立―稳态”易位速率时，即当标记多肽以大约相同的速率进入和离开细胞内内体时，存在于内体和/或胞质溶胶中的标记多肽的量。

在前述实施方案中，术语标记多肽还可以包括其一部分，例如非细胞毒性蛋白酶结构域、易位结构域或TM(例如易位结构域和TM)。该方法还可以包括检测两个或更多个标记，例如在多肽的一部分上的标记和在多肽的第二部分上的标记。

在一个实施方案中，本发明的方法还可包括测定胞吐融合器的蛋白质(例如SNARE蛋白)的切割。

可使用本领域技术人员已知的任何合适的技术来检测可检测标记。在一个实施方案中，使用显微镜检测可检测标记。用于检测可检测标记的技术可包括任何合适的光、共焦(优选3D实时共焦显微镜)、超分辨率或单分子成像技术(例如光学显微镜、共焦显微镜、超分辨率显微镜或单分子成像)。在本发明的方法中可以使用显微镜，如STED、PALM、STORM和TIRF。这样的显微技术已经很好地建立了并且具有高分辨率。

术语―蛋白水解失活突变体”旨在涵盖非细胞毒性蛋白酶突变体，当与其非突变形式相比时，其在靶细胞中表现出显著减少的胞吐融合器的蛋白质切割。优选地，蛋白水解失活突变体包含蛋白水解失活梭菌神经毒素L链。在一个实施方案中，蛋白水解失活突变体可以包含SEQ ID NO：38或40的L链。

在一个实施方案中，―蛋白水解失活突变体”基本上不表现出非细胞毒性蛋白酶活性，优选地不表现出非细胞毒性蛋白酶活性。术语―基本上不表现非细胞毒性蛋白酶活性”是指蛋白水解失活突变体具有低于5％的其非突变体(即蛋白水解活性)形式的非细胞毒性蛋白酶活性，例如具有低于2％、1％或优选地低于0.1％的其非突变体形式的非细胞毒性蛋白酶活性。可在体外通过以下测定非细胞毒性蛋白酶活性：孵育测试非细胞毒性蛋白酶突变体与SNARE蛋白，比较被测试非细胞毒性蛋白酶切割的SNARE蛋白的量，与在相同条件下被其非突变体(即，蛋白水解活性)形式切割的SNARE蛋白的量。常规技术，例如SDS-PAGE和蛋白质印迹，可用于定量切割的SNARE蛋白的量。WO2019/145577A1中描述了合适的体外测定法，其通过引用并入本文。或者或另外，可使用本文所述的基于细胞的测定法。

在一个实施方案中，蛋白水解失活突变体可以具有使所述蛋白酶活性失活的一个或多个突变。例如，非细胞毒性蛋白酶的蛋白水解失活突变体可包含BoNT/A L链，其包含活性位点残基的突变，例如His223、Glu224、His227、Glu262和/或Tyr366。位置编号对应于SEQID NO：17的氨基酸位置，并且可以通过将多肽与SEQ ID NO：17比对来确定。

本发明的多肽优选具有一种或多种与梭菌神经毒素(例如肉毒杆菌神经毒素)相关的活性。换言之，本发明的多肽可以是活性神经毒素。例如，本发明的多肽可以切割靶细胞中的胞吐融合器的蛋白质，能够结合靶细胞上的结合位点和/或具有易位活性。优选地，本发明的多肽可以切割靶细胞中的胞吐融合器的蛋白质，能够结合靶细胞上的结合位点，并且具有易位活性。因此，优选地，多肽不经历(并且尚未经历)解毒处理。例如，多肽可以不被(并且曾经没有被)化学失活和/或热失活。在一个实施方案中，多肽不接触(并且曾经没有接触)交联剂，更优选多肽不接触(并且曾经没有接触)甲醛。

本文所述的多肽优选包含能够切割靶细胞中的胞吐融合器的蛋白质的非细胞毒性蛋白酶。

本发明多肽的靶向部分(TM)优选能够结合靶细胞上的结合位点，该结合位点能够进行内吞作用以掺入靶细胞内的内体中。

易位结构域优选地能够将非细胞毒性蛋白酶从内体内穿过内体膜易位到靶细胞的胞质溶胶内。

在一个优选的实施方案中，本文所述多肽的非细胞毒性蛋白酶包含梭菌神经毒素L链。更优选地，梭菌神经毒素L链是肉毒杆菌神经毒素L链。

在一个优选的实施方案中，本文所述多肽的易位结构域包含梭菌神经毒素易位结构域。更优选地，梭菌神经毒素易位结构域是肉毒杆菌神经毒素易位结构域。

在一个实施方案中，本文所述的多肽缺乏梭菌神经毒素的功能性H_C结构域。

在一个替代实施方案中，本文所述的多肽包含梭菌神经毒素结合结构域(H_C结构域)TM。更优选地，梭菌神经毒素结合结构域(H_C结构域)TM是肉毒杆菌神经毒素结合结构域(H_C结构域)TM。

因此，在一个优选的实施方案中，本文所述的多肽包含梭菌神经毒素L链、梭菌神经毒素易位结构域和非梭菌TM。

在同样优选的替代实施方案中，本文所述的多肽包含梭菌神经毒素L链和梭菌神经毒素H-链(具有梭菌神经毒素易位结构域[H_N]和H_C结构域)。在此类实施方案中，本文所述的多肽是梭菌神经毒素。

更优选地，本文所述的多肽包含肉毒杆菌神经毒素L链、肉毒杆菌神经毒素易位结构域和非梭菌TM。

在同样优选的替代实施方案中，本文所述的多肽包含肉毒杆菌神经毒素L链和肉毒杆菌神经毒素H-链(具有肉毒杆菌神经毒素易位结构域[H_N]和H_C结构域)。在此类实施方案中，本文所述的多肽是肉毒杆菌神经毒素。

优选地，多肽是肉毒杆菌神经毒素(BoNT)，其进一步包含分选酶受体和/或供体位点和/或与其缀合的可检测标记以及氨基酸序列，所述氨基酸序列包含L(A/P/S)X(T/S/A/C)G_n，其中X为任何氨基酸且n为至少1，L(A/P/S)X(T/S/A/C)A_n，其中X为任何氨基酸且n为至少1、NPQTN、YPRTG、IPQTG、VPDTG、LPXTGS，其中X是任何氨基酸，NPKTG、XPETG、LGATG、IPNTG、IPETG、NSKTA、NPQTG、NAKTN、NPQSS、LPXTX，其中X是任何氨基酸，NPX₁TX₂，其中X₁为Lys或Gln且X₂为Asn、Asp或Gly，X₁PX₂X₃G，其中X₁为Leu、Ile、Val或Met，X₂为任何氨基酸且X₃为Ser、Thr或Ala，LPEX₁G，其中X₁是Ala、Cys或Ser，LPXS，LAXT，MPXT，MPXTG，LAXS，NPXT，NPXTG，NAXT，NAXTG，NAXS，NAXSG，LPXP，LPXPG，其中X是任何氨基酸，LRXTG_n或LPAXG_n，其中X为任何氨基酸且n为至少1(更优选L(A/P/S)X(T/S/A/C)G_n，其中X为任何氨基酸且n为至少1)。BoNT可以是选自BoNT/A、BoNT/B、BoNT/C、BoNT/D、BoNT/E、BoNT/F、BoNT/G或BoNT/X中的一个或多个。还包括其变体，其包含非细胞毒性蛋白酶的蛋白水解失活突变体。

优选地，多肽是肉毒杆菌神经毒素(BoNT)，其进一步包含分选酶受体和/或供体位点和/或与其缀合的可检测标记，以及氨基酸序列，所述氨基酸序列包含L(A/P/S)X(T/S/A/C)G_n，其中X为任何氨基酸且n为至少1，L(A/P/S)X(T/S/A/C)A_n，其中X为任何氨基酸且n为至少1，NPQTN、YPRTG、IPQTG、VPDTG或LPXTGS，其中X是任何氨基酸(更优选地L(A/P/S)X(T/S/A/C)G_n，其中X是任何氨基酸并且n为至少1)。BoNT可以是选自BoNT/A、BoNT/B、BoNT/C、BoNT/D、BoNT/E、BoNT/F、BoNT/G或BoNT/X中的一个或多个。还包括其变体，其包含非细胞毒性蛋白酶的蛋白水解失活突变体。

或者，多肽可以是破伤风神经毒素(TeNT)，其进一步包含分选酶受体和/或供体位点和/或与其缀合的可检测标记以及氨基酸序列，所述氨基酸序列包含L(A/P/S)X(T/S/A/C)G_n，其中X为任何氨基酸且n为至少1，L(A/P/S)X(T/S/A/C)A_n，其中X为任何氨基酸且n为至少1、NPQTN、YPRTG、IPQTG、VPDTG、LPXTGS，其中X是任何氨基酸，NPKTG、XPETG、LGATG、IPNTG、IPETG、NSKTA、NPQTG、NAKTN、NPQSS、LPXTX，其中X是任何氨基酸，NPX₁TX₂，其中X₁为Lys或Gln且X₂为Asn、Asp或Gly，X₁PX₂X₃G，其中X₁为Leu、Ile、Val或Met，X₂为任何氨基酸且X₃为Ser、Thr或Ala，LPEX₁G，其中X₁是Ala、Cys或Ser，LPXS，LAXT，MPXT，MPXTG，LAXS，NPXT，NPXTG，NAXT，NAXTG，NAXS，NAXSG，LPXP，LPXPG，其中X是任何氨基酸，LRXTG_n或LPAXG_n，其中X为任何氨基酸且n为至少1(更优选L(A/P/S)X(T/S/A/C)G_n，其中X为任何氨基酸且n为至少1)。还包括其变体，其包含非细胞毒性蛋白酶的蛋白水解失活突变体。

或者，多肽可以是破伤风神经毒素(TeNT)，其进一步包含分选酶受体和/或供体位点和/或与其缀合的可检测标记，以及氨基酸序列，所述氨基酸序列包含L(A/P/S)X(T/S/A/C)G_n，其中X为任何氨基酸且n为至少1，L(A/P/S)X(T/S/A/C)A_n，其中X为任何氨基酸且n为至少1，NPQTN、YPRTG、IPQTG、VPDTG或LPXTGS，其中X是任何氨基酸(更优选地L(A/P/S)X(T/S/A/C)G_n，其中X是任何氨基酸并且n为至少1)。还包括其变体，其包含非细胞毒性蛋白酶的蛋白水解失活突变体。

BoNT/A、BoNT/B、BoNT/C、BoNT/D、BoNT/E、BoNT/F、BoNT/G、BoNT/X和TeNT的代表性多肽序列在本文中分别描述为SEQ ID NO：17-25。可以修饰所述多肽序列以包括用于本发明的分选酶受体或供体位点。

本发明的多肽可以是以下多肽，其包含分选酶受体和/或供体位点和/或与其缀合的可检测标记以及氨基酸序列，所述氨基酸序列包含L(A/P/S)X(T/S/A/C)G_n，其中X为任何氨基酸且n为至少1，L(A/P/S)X(T/S/A/C)A_n，其中X为任何氨基酸且n为至少1，NPQTN、YPRTG、IPQTG、VPDTG、LPXTGS，其中X是任何氨基酸，NPKTG、XPETG、LGATG、IPNTG、IPETG、NSKTA、NPQTG、NAKTN、NPQSS、LPXTX，其中X是任何氨基酸，NPX₁TX₂，其中X₁为Lys或Gln且X₂为Asn、Asp或Gly，X₁PX₂X₃G，其中X₁为Leu、Ile、Val或Met，X₂为任何氨基酸且X₃为Ser、Thr或Ala，LPEX₁G，其中X₁是Ala、Cys或Ser，LPXS，LAXT，MPXT，MPXTG，LAXS，NPXT，NPXTG，NAXT，NAXTG，NAXS，NAXSG，LPXP，LPXPG，其中X是任何氨基酸，LRXTG_n或LPAXG_n，其中X为任何氨基酸且n为至少1(更优选L(A/P/S)X(T/S/A/C)G_n，其中X为任何氨基酸且n为至少1)，并且所述多肽进一步包含与SEQ ID NO：17-25中的任一具有至少70％序列同一性的多肽序列。在一个实施方案中，本发明的多肽可以是以下多肽，其包含分选酶受体和/或供体位点和/或与其缀合的可检测标记以及氨基酸序列，所述氨基酸序列包含L(A/P/S)X(T/S/A/C)G_n，其中X为任何氨基酸且n为至少1，L(A/P/S)X(T/S/A/C)A_n，其中X为任何氨基酸且n为至少1，NPQTN、YPRTG、IPQTG、VPDTG、LPXTGS，其中X是任何氨基酸，NPKTG、XPETG、LGATG、IPNTG、IPETG、NSKTA、NPQTG、NAKTN、NPQSS、LPXTX，其中X是任何氨基酸，NPX₁TX₂，其中X₁为Lys或Gln且X₂为Asn、Asp或Gly，X₁PX₂X₃G，其中X₁为Leu、Ile、Val或Met，X₂为任何氨基酸且X₃为Ser、Thr或Ala，LPEX₁G，其中X₁是Ala、Cys或Ser，LPXS，LAXT，MPXT，MPXTG，LAXS，NPXT，NPXTG，NAXT，NAXTG，NAXS，NAXSG，LPXP，LPXPG，其中X是任何氨基酸，LRXTG_n或LPAXG_n，其中X为任何氨基酸且n为至少1(更优选L(A/P/S)X(T/S/A/C)G_n，其中X为任何氨基酸且n为至少1)，并且其中所述多肽进一步包含与SEQ ID NO：17-25中的任一个具有至少80％或90％序列同一性的多肽序列。优选地，本发明的多肽可以是以下多肽，其包含分选酶受体和/或供体位点和/或与其缀合的可检测标记以及氨基酸序列，所述氨基酸序列包含L(A/P/S)X(T/S/A/C)G_n，其中X为任何氨基酸且n为至少1，L(A/P/S)X(T/S/A/C)A_n，其中X为任何氨基酸且n为至少1、NPQTN、YPRTG、IPQTG、VPDTG、LPXTGS，其中X是任何氨基酸，NPKTG、XPETG、LGATG、IPNTG、IPETG、NSKTA、NPQTG、NAKTN、NPQSS、LPXTX，其中X是任何氨基酸，NPX₁TX₂，其中X₁为Lys或Gln且X₂为Asn、Asp或Gly，X₁PX₂X₃G，其中X₁为Leu、Ile、Val或Met，X₂为任何氨基酸且X₃为Ser、Thr或Ala，LPEX₁G，其中X₁是Ala、Cys或Ser，LPXS，LAXT，MPXT，MPXTG，LAXS，NPXT，NPXTG，NAXT，NAXTG，NAXS，NAXSG，LPXP，LPXPG，其中X是任何氨基酸，LRXTG_n或LPAXG_n，其中X为任何氨基酸且n为至少1(更优选L(A/P/S)X(T/S/A/C)G_n，其中X为任何氨基酸且n为至少1)，并且其中所述多肽进一步包含包括SEQ ID NO：17-25中的任一(更优选地由其组成)的多肽。

本发明的多肽可以是以下多肽，其包含分选酶受体和/或供体位点和/或与其缀合的可检测标记，以及氨基酸序列，所述氨基酸序列包含L(A/P/S)X(T/S/A/C)G_n，其中X为任何氨基酸且n为至少1，L(A/P/S)X(T/S/A/C)A_n，其中X为任何氨基酸且n为至少1，NPQTN、YPRTG、IPQTG、VPDTG或LPXTGS，其中X是任何氨基酸(更优选地L(A/P/S)X(T/S/A/C)G_n，其中X是任何氨基酸并且n为至少1)，并且其中所述多肽进一步包含与SEQ ID NO：17-25中的任一个具有至少70％序列同一性的多肽序列。在一个实施方案中，本发明的多肽可以是以下多肽，其包含分选酶受体和/或供体位点和/或与其缀合的可检测标记，以及氨基酸序列，所述氨基酸序列包含L(A/P/S)X(T/S/A/C)G_n，其中X为任何氨基酸且n为至少1，L(A/P/S)X(T/S/A/C)A_n，其中X为任何氨基酸且n为至少1，NPQTN、YPRTG、IPQTG、VPDTG或LPXTGS，其中X是任何氨基酸(更优选地L(A/P/S)X(T/S/A/C)G_n，其中X是任何氨基酸并且n为至少1)，并且其中所述多肽进一步包含与SEQ ID NO：17-25中的任一个具有至少80％或90％序列同一性的多肽序列。优选地，本发明的多肽可以是以下多肽，其包含分选酶受体和/或供体位点和/或与其缀合的可检测标记，以及氨基酸序列，所述氨基酸序列包含L(A/P/S)X(T/S/A/C)G_n，其中X为任何氨基酸且n为至少1，L(A/P/S)X(T/S/A/C)A_n，其中X为任何氨基酸且n为至少1，NPQTN、YPRTG、IPQTG、VPDTG或LPXTGS，其中X是任何氨基酸(更优选地L(A/P/S)X(T/S/A/C)G_n，其中X是任何氨基酸并且n为至少1)，并且其中所述多肽进一步包含包括SEQ ID NO：17-25中任一(更优选地由其组成)的多肽。

或者，本发明的多肽可以是以下多肽，其包含分选酶受体和/或供体位点和/或与其缀合的可检测标记以及氨基酸序列，所述氨基酸序列包含L(A/P/S)X(T/S/A/C)G_n，其中X为任何氨基酸且n为至少1，L(A/P/S)X(T/S/A/C)A_n，其中X为任何氨基酸且n为至少1，NPQTN、YPRTG、IPQTG、VPDTG、LPXTGS，其中X是任何氨基酸，NPKTG、XPETG、LGATG、IPNTG、IPETG、NSKTA、NPQTG、NAKTN、NPQSS、LPXTX，其中X是任何氨基酸，NPX₁TX₂，其中X₁为Lys或Gln且X₂为Asn、Asp或Gly，X₁PX₂X₃G，其中X₁为Leu、Ile、Val或Met，X₂为任何氨基酸且X₃为Ser、Thr或Ala，LPEX₁G，其中X₁是Ala、Cys或Ser，LPXS，LAXT，MPXT，MPXTG，LAXS，NPXT，NPXTG，NAXT，NAXTG，NAXS，NAXSG，LPXP，LPXPG，其中X是任何氨基酸，LRXTG_n或LPAXG_n，其中X为任何氨基酸且n为至少1(更优选L(A/P/S)X(T/S/A/C)G_n，其中X为任何氨基酸且n为至少1)，并且其中所述多肽进一步包含与SEQ ID NO:38具有至少70％序列同一性的多肽序列。在一个实施方案中，本发明的多肽可以是以下多肽，其包含分选酶受体和/或供体位点和/或与其缀合的可检测标记以及氨基酸序列，所述氨基酸序列包含L(A/P/S)X(T/S/A/C)G_n，其中X为任何氨基酸且n为至少1，L(A/P/S)X(T/S/A/C)A_n，其中X为任何氨基酸且n为至少1，NPQTN、YPRTG、IPQTG、VPDTG、LPXTGS，其中X是任何氨基酸，NPKTG、XPETG、LGATG、IPNTG、IPETG、NSKTA、NPQTG、NAKTN、NPQSS、LPXTX，其中X是任何氨基酸，NPX₁TX₂，其中X₁为Lys或Gln且X₂为Asn、Asp或Gly，X₁PX₂X₃G，其中X₁为Leu、Ile、Val或Met，X₂为任何氨基酸且X₃为Ser、Thr或Ala，LPEX₁G，其中X₁是Ala、Cys或Ser，LPXS，LAXT，MPXT，MPXTG，LAXS，NPXT，NPXTG，NAXT，NAXTG，NAXS，NAXSG，LPXP，LPXPG，其中X是任何氨基酸，LRXTG_n或LPAXG_n，其中X为任何氨基酸且n为至少1(更优选L(A/P/S)X(T/S/A/C)G_n，其中X为任何氨基酸且n为至少1)，并且其中所述多肽进一步包含与SEQ ID NO：38具有至少80％或90％序列同一性的多肽序列。优选地，本发明的多肽可以是以下多肽，其包含分选酶受体和/或供体位点和/或与其缀合的可检测标记以及氨基酸序列，所述氨基酸序列包含L(A/P/S)X(T/S/A/C)G_n，其中X为任何氨基酸且n为至少1，L(A/P/S)X(T/S/A/C)A_n，其中X为任何氨基酸且n为至少1、NPQTN、YPRTG、IPQTG、VPDTG、LPXTGS，其中X是任何氨基酸，NPKTG、XPETG、LGATG、IPNTG、IPETG、NSKTA、NPQTG、NAKTN、NPQSS、LPXTX，其中X是任何氨基酸，NPX₁TX₂，其中X₁为Lys或Gln且X₂为Asn、Asp或Gly，X₁PX₂X₃G，其中X₁为Leu、Ile、Val或Met，X₂为任何氨基酸且X₃为Ser、Thr或Ala，LPEX₁G，其中X₁是Ala、Cys或Ser，LPXS，LAXT，MPXT，MPXTG，LAXS，NPXT，NPXTG，NAXT，NAXTG，NAXS，NAXSG，LPXP，LPXPG，其中X是任何氨基酸，LRXTG_n或LPAXG_n，其中X为任何氨基酸且n为至少1(更优选L(A/P/S)X(T/S/A/C)G_n，其中X为任何氨基酸且n为至少1)，并且其中所述多肽进一步包含包括SEQ ID NO：38(更优选地由其组成)的多肽。

或者，本发明的多肽可以是以下多肽，其包含分选酶受体和/或供体位点和/或与其缀合的可检测标记，以及氨基酸序列，所述氨基酸序列包含L(A/P/S)X(T/S/A/C)G_n，其中X为任何氨基酸且n为至少1，L(A/P/S)X(T/S/A/C)A_n，其中X为任何氨基酸且n为至少1，NPQTN、YPRTG、IPQTG、VPDTG或LPXTGS，其中X是任何氨基酸(更优选地L(A/P/S)X(T/S/A/C)G_n，其中X是任何氨基酸并且n为至少1)，并且其中所述多肽进一步包含与SEQ ID NO：38具有至少70％序列同一性的多肽序列。在一个实施方案中，本发明的多肽可以是以下多肽，其包含分选酶受体和/或供体位点和/或与其缀合的可检测标记，以及氨基酸序列，所述氨基酸序列包含L(A/P/S)X(T/S/A/C)G_n，其中X为任何氨基酸且n为至少1，L(A/P/S)X(T/S/A/C)A_n，其中X为任何氨基酸且n为至少1，NPQTN、YPRTG、IPQTG、VPDTG或LPXTGS，其中X是任何氨基酸(更优选地L(A/P/S)X(T/S/A/C)G_n，其中X是任何氨基酸并且n为至少1)，并且其中所述多肽进一步包含与SEQ ID NO：38具有至少80％或90％序列同一性的多肽序列。优选地，本发明的多肽可以是以下多肽，其包含分选酶受体和/或供体位点和/或与其缀合的可检测标记，以及氨基酸序列，所述氨基酸序列包含L(A/P/S)X(T/S/A/C)G_n，其中X为任何氨基酸且n为至少1，L(A/P/S)X(T/S/A/C)A_n，其中X为任何氨基酸且n为至少1，NPQTN、YPRTG、IPQTG、VPDTG或LPXTGS，其中X是任何氨基酸(更优选地L(A/P/S)X(T/S/A/C)G_n，其中X是任何氨基酸并且n为至少1)，并且其中所述多肽进一步包含包括SEQ ID NO：38(更优选地由其组成)的多肽。

本文所述的多肽(或编码其的核苷酸序列)可包含一个或多个标签(例如纯化标签)，例如His-标签或Strep-标签。本发明还旨在涵盖其中标签被去除的多肽序列(和编码其的核苷酸序列)，例如在其使用之前。多肽还可包含一个或多个切割位点，例如TEV切割位点，以促进标签的去除。

本发明适用于多种不同的梭菌神经毒素。因此，在本发明的上下文中，术语“梭菌神经毒素”包括由以下梭菌产生的毒素：肉毒杆菌(肉毒杆菌神经毒素血清型A、B、C1、D、E、F、G、H和X)，破伤风梭菌(破伤风神经毒素)，丁酸梭菌(肉毒杆菌神经毒素血清型E)和巴拉特梭菌(肉毒杆菌神经毒素血清型F)，以及修饰的梭菌神经毒素或衍生自上述物质的衍生物。术语“梭菌神经毒素”还包括血清型H的肉毒杆菌神经毒素。优选地，梭菌神经毒素不是BoNT/C1。

肉毒杆菌神经毒素(BoNT)是由肉毒杆菌产生的一种大蛋白复合物形式，由BoNT本身与许多辅助蛋白复合组成。目前有九种不同类别的肉毒杆菌神经毒素，即：肉毒杆菌神经毒素血清型A、B、C1、D、E、F、G、H和X，其均具有相似的结构和作用方式。可以基于通过特异性中和抗血清的失活来区分不同的BoNT血清型，其中通过血清型的这种分类与氨基酸水平的序列同一性百分比相关。根据氨基酸序列同一性百分比，将给定血清型的BoNT蛋白进一步分为不同的亚型。

BoNT在胃肠道中吸收，进入大循环后，与胆碱能神经末梢的突触前膜结合并阻止其神经递质乙酰胆碱的释放。BoNT/B、BoNT/D、BoNT/F和BoNT/G裂解小突触泡蛋白/囊泡相关膜蛋白(VAMP)；BoNT/C1、BoNT/A和BoNT/E裂解25kDa的突触体相关蛋白(SNAP-25)；BoNT/C1裂解突触融合蛋白。发现BoNT/X可以裂解SNAP-25、VAMP1、VAMP2、VAMP3、VAMP4、VAMP5、Ykt6和突触融合蛋白1。

破伤风梭菌产生单一血清型的破伤风毒素。丁酸梭菌产生BoNT/E，而巴拉特梭菌产生BoNT/F。

术语“梭菌神经毒素”也意图包括修饰的梭菌神经毒素及其衍生物，包括但不限于以下所述的那些。修饰的梭菌神经毒素或衍生物可包含一个或多个氨基酸，所述氨基酸与梭菌神经毒素的天然(未修饰)形式相比已被修饰，或者所述修饰的梭菌神经毒素或衍生物可包含一个或多个插入的在天然(未修饰)形式中不存在的氨基酸。举例来说，相对于天然(未修饰的)梭菌神经毒素序列，修饰的梭菌神经毒素可以在一个或多个结构域中具有修饰的氨基酸序列。这样的修饰可以修饰毒素的功能方面，例如生物活性或持久性。因此，在一个实施方案中，本发明的多肽是修饰的梭菌神经毒素，或修饰的梭菌神经毒素衍生物，或梭菌神经毒素衍生物。

修饰的梭菌神经毒素可以在重链的氨基酸序列中具有一个或多个修饰(如修饰的H_C结构域)，其中，所述修饰的重链以比天然(未修饰的)梭菌神经毒素更高或更低的亲合力与靶神经细胞结合。在H_C结构域中这样的修饰可包括在H_C结构域的神经节苷脂结合位点中的修饰残基，或在改变与神经节苷脂受体和/或靶神经细胞的蛋白受体的结合的蛋白(SV2或突触结合蛋白)结合位点中的修饰残基。此类修饰的梭菌神经毒素的示例描述于WO2006/027207和WO 2006/114308中，二者均在此通过引用整体并入本文。

修饰的梭菌神经毒素可在轻链的氨基酸序列中具有一个或多个修饰，例如在底物结合或催化结构域中的修饰，其可改变或修改修饰的L链的SNARE蛋白特异性。此类修饰的梭菌神经毒素的示例描述于WO 2010/120766和US 2011/0318385中，二者均在此通过引用整体并入本文。

修饰的梭菌神经毒素可包含一个或多个修饰，其增加或降低修饰的梭菌神经毒素的生物活性和/或生物持久性。例如，修饰的梭菌神经毒素可包含基于亮氨酸或酪氨酸的基序，其中所述基序增加或降低修饰的梭菌神经毒素的生物活性和/或生物持久性。合适的基于亮氨酸的基序包括xDxxxLL(SEQ ID NO:79)、xExxxLL(SEQ ID NO:80)、xExxxIL(SEQ IDNO:81)和xExxxLM(SEQ ID NO:82)(其中x是任何氨基酸)。合适的基于酪氨酸的基序包括Y-x-x-Hy(SEQ ID NO:83)(其中Hy是疏水性氨基酸)。包含基于亮氨酸和酪氨酸的基序的修饰的梭菌神经毒素的示例在WO 2002/08268中描述，其通过引用整体并入本文。

术语“梭菌神经毒素”旨在包括杂合和嵌合的梭菌神经毒素。杂合梭菌神经毒素包含来自一种梭菌神经毒素或其亚型的轻链的至少一部分，以及来自另一种梭菌神经毒素或梭菌神经毒素亚型的重链的至少一部分。在一个实施方案中，杂合梭菌神经毒素可包含来自一种梭菌神经毒素亚型的轻链的整个轻链和来自另一种梭菌神经毒素亚型的重链。在另一个实施方案中，嵌合的梭菌神经毒素可以包含一种梭菌神经毒素亚型的重链的一部分(例如结合结构域)，其中重链的另一部分来自另一种梭菌神经毒素亚型。类似地或可替代地，治疗元件可包含来自不同梭菌神经毒素的轻链部分。此类杂合或嵌合的梭菌神经毒素可用作，例如，向对给定梭菌神经毒素亚型具有免疫抗性的患者、向对给定梭菌神经毒素重链结合结构域可能具有低于平均受体浓度的患者、或向可能具有膜或囊泡毒素底物(例如SNAP-25，VAMP和突触融合蛋白)的蛋白酶抗性变体的患者递送此类梭菌神经毒素的治疗益处的手段。杂合和嵌合的梭菌神经毒素描述于US 8,071,110，其公开内容在此整体引用作为参考。因此，在一个实施方案中，本发明的工程化的梭菌神经毒素是工程化的杂合梭菌神经毒素或工程化的嵌合梭菌神经毒素。

术语―梭菌神经毒素”也旨在包含由非梭菌微生物表达的新发现的肉毒杆菌神经毒素蛋白家族成员，例如肠球菌编码的毒素，其与BoNT/X具有最接近的序列同一性，称为BoNT/Wo的Weissella oryzae编码的毒素(NCBI参考序列：WP_027699549.1)，其在W89-W90处裂解VAMP2，粪肠球菌编码的毒素(GenBank：OTO22244.1)，其裂解VAMP2和SNAP25，以及Chryseobacterium pipero编码的毒素(NCBI Ref.Seq：WP_034687872.1)。

本发明多肽的―生物活性”成分由非细胞毒性蛋白酶提供。这组独特的蛋白酶通过称为SNARE蛋白的蛋白水解切割细胞内转运蛋白(例如SNAP-25、VAMP或突触融合蛋白)起作用——参见Gerald K(2002)"Cell and Molecular Biology”(第4版)John Wiley&Sons，Inc.。首字母缩略词SNARE源自术语可溶性NSF连接受体(Soluble NSF AttachmentReceptor)，其中NSF的意思是N-乙马来酰胺-灵敏性因子(N-ethylmaleimide-SensitiveFactor).SNARE蛋白，其是细胞内囊泡形成不可缺少的，并因此是通过囊泡转运从细胞分泌分子所不可缺少的。因此，一旦递送至目的靶细胞，非细胞毒性蛋白酶能够抑制靶细胞的细胞分泌。

非细胞毒性蛋白酶是一类不杀伤细胞的离散分子；相反，其通过抑制细胞进程而不是蛋白质合成发挥作用。非细胞毒性蛋白酶作为较大毒素分子的一部分由多种植物和多种微生物(如梭菌属物种和奈瑟氏球菌属物种)产生。

梭菌神经毒素代表一组主要的非细胞毒性毒素分子，其包含通过二硫键连接在一起的两条多肽链。这两条链称为重链(H链)和轻链(L链)，其中重链(H链)具有的分子量约为100kDa，而轻链(L链)具有的分子量约为50kDa。L链具有蛋白酶功能，并对参与胞吐过程的囊泡和/或质膜相关(SNARE)蛋白(例如小突触泡蛋白、突触融合蛋白或SNAP-25)表现出高的底物特异性。这些底物是神经分泌机制的重要组成部分。

奈瑟氏球菌属物种(最重要地来自淋病奈瑟氏球菌种(N.gonorrhoeae))和链球菌属物种(最重要地来自肺炎链球菌种(S.pneumoniae))产生功能上类似的非细胞毒性毒素分子。这种非细胞毒性蛋白酶的示例是IgA蛋白酶(参见WO99/58571，其通过引用整体并入本文)。因此，本发明的非细胞毒性蛋白酶优选为梭菌神经毒素蛋白酶或IgA蛋白酶。

现在转向本发明的靶向部分(TM)组分，正是该组分使本发明的多肽与靶细胞结合。

因此，本发明的TM与靶细胞上的受体结合。例如，本发明的TM可以结合神经元细胞上的受体，例如感觉或运动神经元上的受体。或者，本发明的TM可以与EGF受体结合。在一个实施方案中，靶细胞是神经元细胞，例如运动或感觉神经元。在另一个实施方案中，靶细胞是表达EGF受体的细胞。然而，本领域技术人员可以基于靶细胞上所述肽的结合位点(例如细胞表面受体)的存在来选择用于靶向所选靶细胞的肽TM。

在一个实施方案中，本发明的多肽可以包含TM，其含有一种或多种以下肽：生长激素释放激素(GHRH)肽、生长抑素肽、皮质抑素肽、生长激素抑制素、铃蟾肽、尿紧张素肽、黑色素浓缩激素肽、KISS-1肽、促性腺激素释放激素(GnRH)肽或催乳素释放肽。所述TM和包含其的多肽描述于WO2009/150469中，其通过引用并入本文。

在一个实施方案中，本发明的多肽可包含TM，所述TM包含一种或多种以下肽：瘦素肽、胰岛素样生长因子(IGF)肽、转化生长因子(TGF)肽、VIP-胰高血糖素-GRF-分泌素超家族肽、PACAP肽、血管活性肠肽(VIP)、食欲素肽、白细胞介素肽、神经生长因子(NGF)肽、血管内皮生长因子(VEGF)肽、甲状腺激素肽、雌激素肽、ErbB肽、表皮生长因子(EGF)肽、EGF和TGF-α嵌合肽、双调蛋白肽、β细胞素肽、表观基因肽、表皮调节素肽、肝素结合EGF(HB-EGF)肽、铃蟾肽、尿紧张素肽、黑色素浓缩激素(MCH)肽、Kisspeptin-10肽、Kisspeptin-54肽、促肾上腺皮质激素释放激素肽、尿皮质素1肽或尿皮质素2肽。所述TM和包含其的多肽描述于WO2009/150470中，其通过引用并入本文。

在另一个实施方案中，本发明的多肽可以包含TM，所述TM包含以下一种或多种：促甲状腺激素(TSH)；TSH受体抗体；胰岛特异性单唾液酸神经节苷脂GM2-1的抗体；胰岛素、胰岛素样生长因子和两者受体的抗体；TSH释放激素(protirelin)及其受体的抗体；FSH/LH释放激素(促性腺激素)及其受体的抗体；促肾上腺皮质激素释放激素(CRH)及其受体的抗体；和ACTH及其受体的抗体。所述TM和包含其的多肽描述于WO 01/21213中，其通过引用并入本文。

本发明的多肽可包含3个主要组分：非细胞毒性蛋白酶或其蛋白水解失活突变体；TM；和易位结构域。与制备此类融合蛋白相关的通用技术通常称为重新靶向毒素技术。作为示例，我们参考：WO94/21300；WO96/33273；WO98/07864；WO00/10598；WO01/21213；WO06/059093；WO00/62814；WO00/04926；WO93/15766；WO00/61192；和WO99/58571。所有这些出版物均通过引用并入本文。

更详细地，本发明的TM组分可以与本发明的蛋白酶组分或易位组分融合。所述融合优选地通过共价键进行，例如通过直接共价键或通过间隔子/接头分子进行。蛋白酶组分和易位组分优选地通过共价键连接在一起，例如通过直接共价键或通过间隔子/接头分子连接在一起。合适的间隔子/连接的分子是本领域公知的，并且通常包含长度在5至40之间，优选地在10至30个氨基酸残基之间的基于氨基酸的序列。

在使用中，多肽具有双链构象，其中蛋白酶组分和易位组分连接在一起，优选通过二硫键连接在一起。

因此，本发明的多肽和标记多肽可以是单链形式或双链形式，优选地为双链形式。

本发明的多肽可以通过技术人员熟知的常规化学缀合技术制备。例如，参考Hermanson，G.T.(1996)，Bioconjugate techniques，Academic Press，和Wong，S.S.(1991)，Chemistry of protein conjugation and cross-linking，CRC Press，Nagy等人，PNAS 95第1794-99页(1998)。例如，EP0257742中提供了用于将合成的TM附着到本发明的多肽的更详细的方法。上述关于缀合的出版物通过引用并入本文。

或者，可以通过单一多肽融合蛋白的重组制备来制备多肽(参见，例如，WO98/07864)。该技术基于体内细菌机制，通过该机制制备天然梭菌神经毒素(即全毒素)，并产生具有以下―简化”结构排列的融合蛋白：

NH₂-[蛋白酶组分]-[易位组分]-[TM]-COOH

根据WO98/07864，TM放置于融合蛋白的C-末端。然后通过用蛋白酶处理活化融合蛋白，所述蛋白酶切割蛋白酶组分和易位组分之间的位点。因此产生了双链蛋白，其包含作为多肽单链的蛋白酶组分，该多肽单链共价连接(通过二硫桥)至包含易位组分和TM的另一条多肽单链。

或者，根据WO06/059093，融合蛋白的TM组分位于线性融合蛋白序列的中间，在蛋白酶切割位点和易位组分之间。这确保了TM附着至易位结构域(即与天然梭菌全毒素发生的情况一样)，尽管在这种情况下，这两个组分相对于天然全毒素在顺序上是颠倒的。随后在蛋白酶切割位点上的切割暴露了TM的N-端部分，并提供了双链多肽融合蛋白。

上述蛋白酶切割序列可以通过常规手段，例如通过定点诱变在DNA水平引入(和/或去除任何固有的切割序列)。可以手动或借助计算机软件(例如DNASTAR，Inc.的MapDraw程序)进行筛选以确认切割序列的存在。虽然可以使用任何蛋白酶切割位点(即梭菌或非梭菌的)，但以下是优选的：

另外的蛋白酶切割位点包括被非细胞毒性蛋白酶，例如被梭菌神经毒素裂解的识别序列。这些切割位点包括被非细胞毒性蛋白酶，例如梭菌神经毒素切割的SNARE(例如SNAP-25，突触融合蛋白，VAMP)蛋白识别序列。在US2007/0166332中提供了具体示例，其通过引用整体并入本文。

术语蛋白酶切割位点还包括内含肽，其是一种自切割序列。例如，通过改变存在的还原剂的浓度，可控制自剪切反应。上面提到的―活化”切割位点也可以用作―破坏性”切割位点(下文讨论)，如果将其掺入本发明的多肽中。

在一个优选的实施方案中，本发明的融合蛋白可以包含一个或多个位于N-端和/或C-端的纯化标签。虽然可以使用任何纯化标签，但以下是优选的：

His-标签(例如，6×组氨酸)，优选作为C-端和/或N-端标签

MBP-标签(麦芽糖结合蛋白)，优选作为N-端标签

GST-标签(谷胱甘肽-S-转移酶)，优选作为N-端标签

His-MBP-标签，优选作为N-端标签

GST-MBP-标签，优选作为N-端标签

硫氧还蛋白-标签，优选作为N-端标签

CBD-标签(几丁质结合结构域)，优选作为N-端标签。

融合蛋白中可包含一个或多个肽间隔子/接头分子。例如，可以在纯化标签和融合蛋白分子的其余部分之间使用肽间隔子。

在一个方面，本发明提供了一种制造用于使用分选酶标记的多肽的方法，所述方法包括：

a.提供编码多肽的核酸序列，其中所述多肽包含：

i.非细胞毒性蛋白酶或其蛋白水解失活突变体；

ii.能够与靶细胞上的结合位点结合的靶向部分(TM)；和

iii.易位结构域；和

b.将分选酶受体或供体位点引入所述核酸，从而产生编码包含分选酶受体或供体位点的多肽的修饰核酸。

可以通过本领域技术人员已知的任何修饰/方法来实现分选酶受体或供体位点的引入，例如通过替换、插入或缺失编码所得多肽中的氨基酸残基的序列的方式。例如，可以使用标准的分子克隆技术通过修饰核酸序列来引入修饰，例如通过定点诱变，其中编码所需氨基酸的短链DNA(寡核苷酸)用于代替原始编码序列(通过使用聚合酶，或通过用各种酶(例如连接酶和限制性核酸内切酶)插入/缺失基因的一部分)。或者，可以化学合成修饰的基因序列。

优选地，该方法进一步包括在宿主细胞中表达修饰的核酸。更优选地，该方法进一步包括在宿主细胞中表达修饰的核酸并获得表达的多肽。可以使用本文所述的方法活化多肽。

本发明还扩展到可通过本发明的方法获得的多肽。

在―获得标记多肽”或―获得表达多肽”的上下文中使用的术语―获得”，可以指分离多肽。分离可以通过任何纯化方法实现，例如本领域技术人员已知的色谱法或免疫亲和方法。

用于制备方法中的核酸可以是编码本文所述多肽的核酸。例如，这样的核酸可以编码与SEQ ID NO：6、8、17-25或38中的任何一个具有至少70％序列同一性的多肽。在一个实施方案中，核酸可以编码与SEQ ID NO：6、8、17-25或38中的任一个具有至少80％或90％序列同一性的多肽。优选地，核酸可以编码包含SEQ ID NO：6、8、17-25或38中任何一个的多肽(更优选地由其组成)。

用于制备方法中的核酸可以是包含核酸序列的核酸，所述核酸序列与SEQ ID NO:5或7中的任一个具有至少70％序列同一性。在一个实施方案中，核酸可以是包含核酸序列的核酸，所述核酸序列与SEQ ID NO:5或7中的任一个具有至少80％或90％的序列同一性。优选地，核酸可以包含SEQ ID NO:5或7(更优选地由其组成)。

因此，本发明提供了编码本发明多肽的核酸(例如DNA)序列(例如修饰的核酸)。所述核酸可以包含在载体形式中，例如质粒，其可以任选地包含复制起点、核酸整合位点、启动子、终止子和核糖体结合位点中的一个或多个。

本发明的核酸(例如修饰的核酸)可以包含核酸序列，所述核酸序列与SEQ ID NO：1、3或39具有至少70％序列同一性。在一个实施方案中，本发明的核酸可以包含核酸序列，所述核酸序列与SEQ ID NO：1、3或39具有至少80％或90％序列同一性。优选地，本发明的核酸包含如SEQ ID NO：1、3或39所示的核酸序列(更优选地由其组成)。

本发明的核酸(例如修饰的核酸)可以是编码与SEQ ID NO：2、4或40具有至少70％序列同一性的多肽的核酸。在一个实施方案中，本发明的核酸可以是编码与SEQ ID NO：2、4或40具有至少80％或90％序列同一性的多肽的核酸。优选地，本发明的核酸可以是编码多肽的核酸，所述多肽包含SEQ ID NO：2、4或40(更优选地由其组成)。

本发明还涵盖包含本发明的核酸或载体的宿主细胞。

本发明还包括在宿主细胞中，特别是在大肠杆菌中或通过杆状病毒表达系统表达上述核酸序列的方法。

本发明还包括一种用于活化本发明多肽的方法，所述方法包括使所述多肽与蛋白酶(例如FXa)接触，该蛋白酶在位于非细胞毒性蛋白酶组分和易位组分之间的识别位点(切割位点，例如FXa位点)上切割多肽，从而将多肽转化为双链多肽，其中非细胞毒性蛋白酶组分和易位组分通过二硫键连接在一起。在一个优选的实施方案中，识别位点对于天然存在的梭菌神经毒素和/或天然存在的IgA蛋白酶是非天然的。

可以进一步修饰本发明的多肽以减少或防止与分散到非靶向区域相关的不想要的副作用。根据该实施方案，多肽包含破坏性切割位点。破坏性切割位点不同于―活化”位点(即双链形成)，其可被第二蛋白酶切割，而不被非细胞毒性蛋白酶切割。此外，当第二蛋白酶在破坏性切割位点如此切割时，多肽具有降低的效力(例如降低的与预期靶细胞结合的能力、降低的易位活性和/或降低的非细胞毒性蛋白酶活性)。出于完整性的考虑，本发明的任何―破坏性”切割位点都可以独立地用作本发明多肽中的―活化”位点。

因此，根据该实施方案，本发明提供了多肽，其可以在位点外的位置被可控地失活和/或破坏。

在一个优选的实施方案中，破坏性切割位点被第二蛋白酶(即破坏性蛋白酶)识别和切割，所述第二蛋白酶选自循环蛋白酶(例如细胞外蛋白酶，例如血清蛋白酶或凝血级联蛋白酶)、组织相关蛋白酶(例如基质金属蛋白酶(MMP)，例如肌肉的MMP)和细胞内蛋白酶(优选靶细胞中不存在的蛋白酶)。

因此，在使用中，如果本发明的多肽从其预期靶细胞分散远离和/或被非靶细胞吸收，则该多肽将通过破坏性切割位点(通过第二蛋白酶)的切割而失活。

在一个实施方案中，破坏性切割位点被位点外细胞类型内存在的第二蛋白酶识别和切割。在该实施方案中，位点外细胞和靶细胞优选地是不同的细胞类型。或者(或另外)，破坏性切割位点被存在于位点外位置(例如靶细胞的远端)的第二蛋白酶识别和切割。因此，当细胞外发生破坏性切割时，靶细胞和位点外细胞可以是相同或不同的细胞类型。在这点上，靶细胞和位点外细胞可以各自具有与本发明的相同多肽结合的受体。

当多肽位于位点外位置内或位点外位置上时，本发明的破坏性切割位点提供对多肽的失活/破坏。在这点上，在破坏性切割位点上的切割使多肽的效力最小化(与缺少相同破坏性切割位点、或具有非切割形式的相同破坏性位点的相同多肽相比时)。举例来说，降低的效力包括：降低的结合(与哺乳动物细胞受体)和/或降低的易位(穿过哺乳动物细胞的内体膜，向胞质溶胶方向)、和/或降低的SNARE蛋白切割。

当选择本发明上下文中的破坏性切割位点时，优选破坏性切割位点不是作为本发明多肽的制造过程的一部分，可单独用于本发明多肽的翻译后修饰的任何蛋白酶的底物。在这方面，本发明的非细胞毒性蛋白酶通常采用蛋白酶活化事件(通过单独―活化”蛋白酶切割位点，该蛋白酶切割位点在结构上不同于本发明的破坏性切割位点)。活化切割位点的目的是切割本发明多肽的非细胞毒性蛋白酶与易位或结合组分之间的肽键，从而提供―活化的”双链多肽，其中所述两个组分通过二硫键连接在一起。

因此，为了帮助确保本发明多肽的破坏性切割位点不会对―活化”切割位点以及随后的二硫键形成产生不利影响，优选地将前者在距离―活化”切割位点至少20、至少30、至少40、至少50、更优选至少60、至少70、至少80个(连续)氨基酸残基的位置上引入本发明的多肽。

就多肽的天然组分而言，破坏性切割位点和活化切割位点优选是外源的(即工程化的/人工的)。换句话说，所述切割位点优选不是多肽的相应天然组分所固有的。举例来说，可根据本发明工程化(分别)基于BoNT/A L链或H-链的蛋白酶或易位组分，以包括切割位点。然而，所述切割位点不会存在于相应的BoNT天然L链或H链中。类似地，当工程化多肽的靶向部分组分以包括蛋白酶切割位点时，所述切割位点应不存在于相应靶向部分的相应天然序列中。

在本发明的一个优选实施方案中，破坏性切割位点和―活化”切割位点不被相同的蛋白酶切割。在一个实施方案中，两个切割位点彼此的不同之处在于，各自识别序列内的至少一个，更优选至少两个，特别优选至少三个，最优选至少四个容许的氨基酸是不同的。

举例来说，在梭菌L链和H_N组分之间含有因子Xa―活化”位点的多肽嵌合体的情况下，优选使用不是因子Xa位点的破坏性切割位点，可以将其插入到L链和/或H_N和/或TM组分中的其他地方。在这种情况下，多肽可以被修饰以提供L链和H_N组分之间的替代―活化”位点(例如，肠激酶切割位点)，在这种情况下，可以将单独的因子Xa切割位点掺入多肽的其他地方，作为破坏性切割位点。或者，可以保留L链和H_N组分之间存在的Xa因子―活化”位点，并掺入替代切割位点，例如凝血酶切割位点作为破坏性切割位点。

当在本发明的任何组分的一级序列内鉴定适合于包含切割位点的位点时，优选选择与待插入的提议切割位点密切匹配的一级序列。通过这样做，将最小的结构变化引入到多肽中。例如，切割位点通常包含至少3个连续的氨基酸残基。因此，在优选的实施方案中，选择的切割位点已经(在正确的位置上)具有引入新切割位点所需的至少一个，优选至少两个氨基酸残基。举例来说，在一个实施方案中，可以引入半胱天冬酶3切割位点(DMQD)。在这点上，鉴定的优选插入位置已经包括选自以下的一级序列，例如：Dxxx，xMxx，xxQx，xxxD，DMxx，DxQx，DxxD，xMQx，xMxD，xxQD，DMQx，xMQD，DxQD和DMxD。

类似地，优选将切割位点引入表面暴露区域。在表面暴露区域内，优选存在环区域。

在本发明的一个优选实施方案中，破坏性切割位点被引入以下位置中的一个或多个，这些位置基于BoNT/A的一级氨基酸序列。虽然插入位置是通过参考BoNT/A鉴定的(为方便起见)，可以容易地与所述BoNT/A位置比对替代蛋白酶结构域和/或易位结构域的一级氨基酸序列。

对于蛋白酶组分，优选以下位置中的一个或多个：27-31，56-63，73-75，78-81，99-105，120-124，137-144，161-165，169-173，187-194，202-214，237-241，243-250，300-304，323-335，375-382，391-400和413-423。上述编号优选从本发明蛋白酶组分的N-端开始。

在一个优选的实施方案中，破坏性切割位点位于距蛋白酶组分的N-端8个以上氨基酸残基，优选10个以上氨基酸残基，更优选25个以上氨基酸残基，特别优选50个以上氨基酸残基的位置。类似地，在一个优选的实施方案中，破坏性切割位点位于距蛋白酶组分的C-端20个以上氨基酸残基，优选30个以上氨基酸残基，更优选40个以上氨基酸残基，特别优选50个以上氨基酸残基的位置。

对于易位组件，优选以下位置中的一个或多个：474-479，483-495，507-543，557-567，576-580，618-631，643-650，669-677，751-767，823-834，845-859。上述编号优选确认本发明易位结构域组分的N-端的起始位置为449，以及易位结构域组分的C-端的终止位置为871。

在一个优选的实施方案中，破坏性切割位点位于距易位组分的N-端10个以上氨基酸残基，优选25个以上氨基酸残基，更优选40个以上氨基酸残基，特别优选50个以上氨基酸残基的位置。类似地，在一个优选的实施方案中，破坏性切割位点位于距易位组分的C-端10个以上氨基酸残基，优选25个以上氨基酸残基，更优选40个以上氨基酸残基，特别优选50个以上氨基酸残基的位置。

在一个优选的实施方案中，破坏性切割位点位于距TM组分的N-端10个以上氨基酸残基，优选25个以上氨基酸残基，更优选40个以上氨基酸残基，特别优选50个以上氨基酸残基的位置。类似地，在一个优选的实施方案中，破坏性切割位点位于距TM组分的C-端10个以上氨基酸残基，优选25个以上氨基酸残基，更优选40个以上氨基酸残基，特别优选50个以上氨基酸残基的位置。

本发明的多肽可以包括一个或多个(例如两个、三个、四个、五个或更多个)破坏性蛋白酶切割位点。当包括多于一个破坏性切割位点时，每个切割位点可以相同或不同。在这方面，使用多于一个破坏性切割位点提供了改善的位点外失活。类似地，使用两个或更多个不同的破坏性切割位点提供了额外的设计灵活性。

可以将破坏性切割位点工程化到任何以下多肽组分中：非细胞毒性蛋白酶组分；易位组分；靶向部分；或间隔肽(如果存在)。在这方面，选择破坏性切割位点以确保对多肽效力的不利影响最小(例如，通过使对靶向/结合区和/或易位结构域和/或非细胞毒性蛋白酶结构域的作用最小)，同时确保多肽在离开其靶位点/靶细胞是不稳定的。

优选的破坏性切割位点(以及相应的第二蛋白酶)列于下表中。列出的切割位点纯粹是说明性的，并不旨在限制本发明。

在本发明的上下文中，基质金属蛋白酶(MMP)是一组优选的破坏性蛋白酶。在该组中，优选ADAM17(EC 3.4.24.86，也称为TACE)，其切割多种膜锚定的细胞表面蛋白以使细胞外结构域―脱落”。另外，优选的MMP包括蛇毒蛋白酶(adamalysin)、serralysins和龙虾肽酶(astacin)。

另一组优选的破坏性蛋白酶是哺乳动物血液蛋白酶，例如凝血酶、凝血因子VIIa、凝血因子IXa、凝血因子Xa、凝血因子XIa、凝血因子XIIa、激肽释放酶、蛋白C和MBP相关丝氨酸蛋白酶。

在本发明的一个实施方案中，所述破坏性切割位点包含识别序列，其具有至少3或4个，优选5或6个，更优选6或7个，特别优选至少8个连续的氨基酸残基。在这方面，识别序列越长(就连续氨基酸残基而言)，通过非预期的第二蛋白酶发生破坏性位点的非特异性切割的可能性就越小。

优选地将本发明的破坏性切割位点引入蛋白酶组分和/或靶向部分和/或易位组分和/或间隔肽。在这四种组分中，优选蛋白酶组分。因此，多肽可以通过直接破坏非细胞毒性蛋白酶和/或结合和/或易位组分而快速失活。

本发明的多肽可以配制成药物组合物的一部分，其包含多肽以及选自药学上可接受的载体、赋形剂、佐剂、推进剂和/或盐的至少一种组分。

本发明的多肽可以配制用于口服、肠胃外、连续输注、植入、吸入或局部应用。适合注射的组合物可以是溶液、悬浮液或乳液或干粉的形式，所述干粉在使用前溶解或悬浮在合适的载剂中。

局部递送装置可包括气溶胶或其他喷雾剂(例如雾化器)。在这方面，多肽的气溶胶制剂能够递送至肺和/或其他鼻和/或支气管或气道通道。

优选的施用途径选自：全身(例如iv)、腹腔镜和/或局部注射(例如，经蝶窦直接注射到肿瘤中)。

在用于注射的制剂的情况下，任选地包括药物活性物质，以帮助多肽保留在施用部位或降低多肽从施用部位的去除。这种药物活性物质的一个示例是血管收缩剂，例如肾上腺素。这种制剂的优点是施用后使多肽的停留时间增加，并因此增加和/或增强多肽的作用。

本发明的多肽的施用剂量范围是产生期望的治疗效果的剂量范围。应当理解，所需的剂量范围取决于多肽或组合物的确切性质、施用途径、制剂性质、患者的年龄、患者病症的性质、程度或严重性、禁忌症(如果有)和主治医师的判断。可以使用优化的标准经验程序调整这些剂量水平的变化。

合适的日剂量(每千克患者体重)在0.0001-1mg/kg的范围内，优选0.0001-0.5mg/kg，更优选0.002-0.5mg/kg，特别优选0.004-0.5mg/kg。单位剂量可以从少于1毫克到30mg不等，但通常在每剂0.01到1mg的范围内，可以每天施用，或优选以更低的频率施用，例如每周或每月六次施用。

一种特别优选的给药方案是基于2.5ng多肽作为1X剂量。在这方面，优选剂量范围是1X–100X(即2.5-250ng)。

通常利用多肽和无热原的无菌载剂制备液体剂型。根据使用的载剂和浓度，多肽可以溶解或悬浮在载剂中。在制备溶液时，可以将多肽溶解在载剂体中，如有必要，可通过添加氯化钠使溶液等渗，并使用无菌技术通过无菌过滤器过滤灭菌，然后填充到合适的无菌小瓶或安瓿瓶中并密封。或者，如果溶液的稳定性足够，则可以通过高压灭菌对密封容器中的溶液进行灭菌。有利地，可以将添加剂溶解在载剂中，所述添加剂例如为缓冲剂、增溶剂、稳定剂、防腐剂或杀菌剂、助悬剂或乳化剂和/或局部麻醉剂。

通过使用无菌技术在无菌区域将预先灭菌的成分填充到无菌容器中，可以制备干粉，以在使用前溶解或悬浮在合适的载剂中。可替代地，可以使用无菌技术在无菌区域中将成分溶解到合适的容器中。然后将产品冷冻干燥，并将容器无菌密封。

以基本上相同的方式制备适合于肌内、皮下或皮内注射的肠胃外混悬剂，不同之处在于将无菌组分悬浮在无菌载剂体中，而不是溶解，并且不能通过过滤来实现灭菌。可以以无菌状态分离组分，或者可选地，可以在分离后例如通过γ辐射将其灭菌。

有利地，在一种或多种组合物中包括助悬剂，例如聚乙烯吡咯烷酮，以促进组分的均匀分布。

靶向部分(TM)是指在功能上与结合位点相互作用的任何化学结构，以产生本发明的多肽与靶细胞(通常是哺乳动物细胞，尤其是人细胞)表面之间的物理结合。术语TM包括能够与靶细胞上的结合位点结合的任何分子(即，天然存在的分子，或其化学/物理修饰的变体)，该结合位点优选能够内化(例如内体形成)-也称为受体介导的内吞作用。TM可以具有内体膜易位功能，在这种情况下，本发明的活性剂中不需要存在单独的TM和易位结构域组分。在前面的描述中，已经描述了特定的TM。提及所述TM仅是示例性的，并且本发明包括其所有变体和衍生物，所述变体和衍生物具有与靶细胞上的结合位点结合(即靶向)的基本能力，优选其中结合位点能够内化。

本发明的TM与所讨论的靶细胞结合(优选特异性结合)。术语―特异性结合”优选意指给定的TM以10⁶M^-1或更大，优选10⁷M^-1或更大，或10⁸M^-1或更大，或10⁹M^-1或更大的结合亲和力(Ka)与靶细胞结合。本发明的TM(当处于游离形式时，即当与任何蛋白酶和/或易位组分分开时)，优选地表现出对所讨论的靶受体的结合亲和力(IC₅₀)范围为0.05-18nM。

本发明的TM优选不是小麦胚芽凝集素(WGA)。

本说明书中提及的TM包括其片段和变体，所述片段和变体保留了与所讨论的靶细胞结合的能力。举例来说，变体可与参考TM具有至少80％、优选至少90％、更优选至少95％、最优选至少97％或至少99％的氨基酸序列同源性——后者是本申请中记载的任何TM序列。因此，变体可包括氨基酸的一种或多种类似物(例如非天然氨基酸)或取代的键。此外，举例而言，当与TM相关使用时，术语片段是指具有参考TM的至少5个，优选至少10个，更优选至少20个，最优选至少25个氨基酸残基的肽。术语片段还涉及上述变体。因此，举例来说，本发明的片段可包含具有至少7、10、14、17、20、25、28、29或30个氨基酸的肽序列，其中所述肽序列与参考肽的相应肽序列的(连续)氨基酸相比具有至少80％的序列同源性。

TM可以包含更长的氨基酸序列，例如，至少30或35个氨基酸残基，或至少40或45个氨基酸残基，只要TM能够与靶细胞结合。

确认TM与所选择的靶细胞结合是常规操作。例如，可以采用简单的放射性置换实验，其中在过量未标记的TM存在下，将代表靶细胞的组织或细胞暴露于标记的(例如氚化的)TM。在这样的实验中，可以评估非特异性和特异性结合的相对比例，从而允许确认TM与靶细胞的结合。任选地，该测定法可以包括一种或多种结合拮抗剂，并且该测定法还可以包括观察TM结合的丧失。这种类型实验的示例可以在Hulme，E.C.(1990)，Receptor-bindingstudies，a brief outline,第303-311页，In Receptor biochemistry，A PracticalApproach，Ed.E.C.Hulme,牛津大学出版社中找到。

在一些实施方案中，本发明的多肽缺少梭菌神经毒素的功能性H_C结构域。因此，在结合测定法中，所述多肽不能结合大鼠突触体膜(通过梭菌神H_C组分)，如在Shone等人(1985)Eur.J.Biochem.151,75-82所述。在优选的实施方案中，所述多肽优选缺少梭菌神经毒素全毒素的最后50个C-末端氨基酸。在另一个实施方案中，所述多肽优选缺少梭菌神经毒素全毒素的最后100个，优选最后150个，更优选最后200个，特别优选最后250个，最优选最后300个C-末端氨基酸残基。或者，可以通过诱变消除/降低H_C的结合活性-举例来说，简单参照BoNT/A，神经节苷脂结合口袋中的一个或两个氨基酸残基突变(W1266到L和Y1267到F)的修饰导致H_C区失去其受体结合功能。可以对非A型血清型的梭菌肽组分进行类似的突变，例如，基于肉毒杆菌B具有突变(W1262至L和Y1263至F)或肉毒杆菌E(W1224至L和Y1225至F)的构建体。活性位点的其他突变实现了相同的H_C受体结合活性的消除，例如A型肉毒杆菌毒素中的Y1267S和其他梭菌神经毒素中相应的高度保守的残基。Rummel等人(2004)(Molecular Microbiol.51:631-634)中描述了该突变以及其他突变的细节，其通过引用并入本文。

在另一个实施方案中，本发明的多肽缺少梭菌神经毒素的功能性H_C结构域，并且也缺少任何功能等同的TM。因此，所述多肽缺少梭菌神经毒素的天然结合功能，并且在结合测定法中不能结合大鼠突触体膜(通过梭菌H_C组分，或通过任何功能上等同的TM)，如Shone等人(1985)Eur.J.Biochem.151，75-82中所述。

天然梭菌神经毒素的H_C肽包含约400-440个氨基酸残基，并由两个功能不同的结构域组成，每个结构域约25kDa，即，N-末端区域(通常称为H_CN肽或结构域)和C-末端区域(通常称为H_CC肽或结构域)。以下出版物已证实了这一事实，在此通过引用将其整体并入本文：Umland TC(1997)Nat.Struct.Biol.4:788-792；Herreros J(2000)Biochem.J.347:199-204；Halpern J(1993)J.Biol.Chem.268:15,pp.11188-11192；Rummel A(2007)PNAS 104:359-364；Lacey DB(1998)Nat.Struct.Biol.5:898-902；Knapp(1998)Am.Cryst.Assoc.Abstract Papers 25:90；Swaminathan and Eswaramoorthy(2000)Nat.Struct.Biol.7:1751-1759；and Rummel A(2004)Mol.Microbiol.51(3),631-643。此外，已经有充分的文献证明，构成C-末端160-200个氨基酸残基的C-末端区域(H_CC)负责梭菌神经毒素与其天然细胞受体(即神经肌接头处的神经末梢)的结合，-上述出版物也证实了这一事实。因此，贯穿本说明书，提及缺少功能性重链H_C肽(或结构域)、使得重链不能与天然梭菌神经毒素结合的细胞表面受体结合的梭菌重链，意味着该梭菌重链仅缺少功能性H_CC肽。换句话说，H_CC肽区域被部分或全部删除，或以其他方式修饰(例如，通过常规化学或蛋白水解处理)以失活其对神经肌接头处神经末端的天然结合能力。

因此，在一个实施方案中，本发明的梭菌H_N肽缺少梭菌神经毒素的C-末端肽部分(H_CC)的一部分，因此缺少天然梭菌神经毒素的H_C结合功能。举例来说，在一个实施方案中，C-末端延伸的梭菌H_N肽缺少梭菌神经毒素重链的C-末端的40个氨基酸残基，或C-末端的60个氨基酸残基，或C-末端的80个氨基酸残基，或C-末端的100个氨基酸残基，或C-末端的120个氨基酸残基，或C-末端的140个氨基酸残基，或C-末端的150个氨基酸残基，或C-末端的160个氨基酸残基。在另一个实施方案中，本发明的梭菌H_N肽缺少梭菌神经毒素的完整C-末端肽部分(H_CC)，因此缺少天然梭菌神经毒素的H_C结合功能。举例来说，在一个实施方案中，梭菌H_N肽缺少梭菌神经毒素重链的C-末端的165个氨基酸残基，或C-末端的170个氨基酸残基，或C-末端的175个氨基酸残基，或C-末端的180个氨基酸残基，或C-末端的185个氨基酸残基，或C-末端的190个氨基酸残基，或C-末端的195个氨基酸残基。进一步举例来说，本发明的梭菌H_N肽缺少选自以下的梭菌H_CC参考序列：

A型肉毒杆菌神经毒素-氨基酸残基(Y1111-L1296)

B型肉毒杆菌神经毒素-氨基酸残基(Y1098-E1291)

C型肉毒杆菌神经毒素-氨基酸残基(Y1112-E1291)

D型肉毒杆菌神经毒素-氨基酸残基(Y1099-E1276)

E型肉毒杆菌神经毒素-氨基酸残基(Y1086-K1252)

F型肉毒杆菌神经毒素-氨基酸残基(Y1106-E1274)

G型肉毒杆菌神经毒素-氨基酸残基(Y1106-E1297)

破伤风神经毒素-氨基酸残基(Y1128-D1315)。

以上鉴定的参考序列应被视为指导，因为根据血清亚型可能会发生细微变化。

本发明的蛋白酶包括能够切割真核细胞中的一种或多种胞吐融合器的蛋白质的所有非细胞毒性蛋白酶。

本发明的蛋白酶优选为细菌蛋白酶(或其片段)。更优选地，细菌蛋白酶选自梭菌属或奈瑟氏球菌属/链球菌属(例如梭菌L链或奈瑟氏球菌IgA蛋白酶，优选来自淋病奈瑟氏球菌或肺炎链球菌)。

本发明还包括非细胞毒性蛋白酶变体(即天然存在的蛋白酶分子的变体)，只要蛋白酶变体仍然表现出必需的蛋白酶活性。举例来说，变体可与参考蛋白酶序列具有至少70％，优选至少80％，更优选至少90％，最优选至少95或至少98％的氨基酸序列同源性。因此，术语变体包括具有增强(或降低的)内肽酶活性的非细胞毒性蛋白酶——这里特别提及增加的K_cat/K_m的BoNT/A突变体Q161A、E54A和K165L，参见Ahmed，S.A.(2008)ProteinJ.DOI10.1007/s10930-007-9118-8，其通过引用并入本文。当与蛋白酶相关使用时，术语片段通常是指肽，其具有参考蛋白酶的至少150个，优选至少200个，更优选至少250个，最优选至少300个氨基酸残基。与TM―片段”组分(上文讨论)类似，本发明的蛋白酶―片段”包括基于参考序列的蛋白酶变体的片段。

本发明的蛋白酶优选表现出丝氨酸或金属蛋白酶活性(例如内肽酶活性)。蛋白酶优选对SNARE蛋白(例如SNAP-25、小突触泡蛋白/VAMP、或突触融合蛋白)具有特异性。

特别提及神经毒素的蛋白酶结构域，例如细菌神经毒素的蛋白酶结构域。因此，本发明包括使用天然存在的神经毒素结构域，以及重组制备的所述天然存在的神经毒素的形式。

示例性神经毒素由梭菌产生，术语梭菌神经毒素包括由破伤风梭菌(TeNT)和肉毒杆菌(BoNT)血清型A-G产生的神经毒素，以及由巴拉特梭菌(C.baratii)和丁酸梭菌(C.butyricum)产生的密切相关的BoNT样神经毒素。上述缩写在本说明书中通篇使用。例如，命名法BoNT/A表示神经毒素的来源为BoNT(血清型A)。相应的命名法适用于其他BoNT血清型。

BoNT是已知最有效的毒素，取决于血清型，其对小鼠的中位致死剂量(LD50)值为0.5至5ng/kg。BoNT在胃肠道中吸收，进入大循环后，与胆碱能神经末梢的突触前膜结合并阻止其神经递质乙酰胆碱的释放。BoNT/B、BoNT/D、BoNT/F和BoNT/G切割小突触泡蛋白/囊泡相关膜蛋白(VAMP)；BoNT/C、BoNT/A和BoNT/E切割25kDa的突触体相关蛋白(SNAP-25)；并且BoNT/C切割突触融合蛋白。

BoNT具有共同的结构，是约150kDa的双链蛋白，由约100kDa的重链(H链)通过单个二硫键共价连接到约50kDa的轻链(L链)组成。H链由两个结构域组成，每个结构域约为50kDa。高亲和力的神经元结合需要C-端结构域(H_C)，而N-端结构域(H_N)被认为参与膜易位。L链是一种锌依赖性金属蛋白酶，其负责切割底物SNARE蛋白。

术语L链片段是指神经毒素L链的一个组分，该片段表现出金属蛋白酶活性并且能够蛋白水解切割参与细胞胞吐作用的囊泡和/或质膜相关蛋白。

合适的蛋白酶(参考)序列的示例包括：

A型肉毒杆菌神经毒素-氨基酸残基(1-448)

B型肉毒杆菌神经毒素-氨基酸残基(1-440)

C型肉毒杆菌神经毒素-氨基酸残基(1-441)

D型肉毒杆菌神经毒素-氨基酸残基(1-445)

E型肉毒杆菌神经毒素-氨基酸残基(1-422)

F型肉毒杆菌神经毒素-氨基酸残基(1-439)

G型肉毒杆菌神经毒素-氨基酸残基(1-441)

破伤风神经毒素-氨基酸残基(1-457)

IgA蛋白酶-氨基酸残基(1-959)*

*Pohlner，J.等人(1987)，Nature 325，第458-462页,其通过引用并入本文。

对于最近鉴定的BoNT/X，据报道L链对应于其氨基酸1-439，其中L链边界可能相差约25个氨基酸(例如1-414或1-464)。

以上鉴定的参考序列应被视为指导，因为根据血清亚型可能会发生细微变化。举例来说，US 2007/0166332(通过引用整体并入本文)引用了略有不同的梭菌序列：

A型肉毒杆菌神经毒素-氨基酸残基(M1-K448)

B型肉毒杆菌神经毒素-氨基酸残基(M1-K441)

C型肉毒杆菌神经毒素-氨基酸残基(M1-K449)

D型肉毒杆菌神经毒素-氨基酸残基(M1-R445)

E型肉毒杆菌神经毒素-氨基酸残基(M1-R422)

F型肉毒杆菌神经毒素-氨基酸残基(M1-K439)

G型肉毒杆菌神经毒素-氨基酸残基(M1-K446)

破伤风神经毒素-氨基酸残基(M1-A457)

包含轻链的多种梭菌毒素片段可用于本发明的方面，条件是这些轻链片段可特异性靶向神经递质释放器的核心组分并因此参与执行总体细胞机制，梭菌毒素通过该机制蛋白水解切割底物。梭菌毒素的轻链长度约为420-460个氨基酸，包含酶促结构域。研究表明，梭菌毒素轻链的全长对于酶促结构域的酶促活性并不是必需的。作为非限制性示例，酶促活性不需要BoNT/A轻链的前八个氨基酸。作为另一个非限制性示例，酶促活性不需要TeNT轻链的前八个氨基酸。同样，轻链的羧基端也不是活性所必需的。作为非限制性示例，酶促活性不需要BoNT/A轻链的最后32个氨基酸(残基417-448)。作为另一个非限制性示例，酶促活性不需要TeNT轻链的最后31个氨基酸(残基427-457)。因此，该实施方案的方面可包括包含酶促结构域的梭菌毒素轻链，所述酶促结构域具有例如至少350个氨基酸、至少375个氨基酸、至少400个氨基酸、至少425个氨基酸和至少450个氨基酸的长度。该实施方案的其他方面可包括包含酶促结构域的梭菌毒素轻链，所述酶促结构域具有例如最多350个氨基酸、最多375个氨基酸、最多400个氨基酸、最多425个氨基酸和最多450个氨基酸的长度。

本发明的非细胞毒性蛋白酶组分优选包含BoNT/A、BoNT/B、BoNT/C、BoNT/D、BoNT/E、BoNT/F、BoNT/G或BoNT/X血清型L链(或其片段或其变体)。

本发明的多肽，尤其是其蛋白酶组分，可以被聚乙二醇化——这可以帮助增加稳定性，例如蛋白酶组分的作用持续时间。当蛋白酶包含BoNT/A、B或C₁蛋白酶时，聚乙二醇化是特别优选的。聚乙二醇化优选包括将PEG添加至蛋白酶组分的N-端。举例来说，蛋白酶的N-端可以延伸一个或多个可以相同或不同的氨基酸(例如半胱氨酸)残基。一个或多个所述氨基酸残基可以具有其自身连接的PEG分子(例如，共价连接的)。在WO2007/104567中描述了该技术的示例，该申请的全部内容通过引用并入本文。

易位结构域是能够使蛋白酶易位到靶细胞中的分子，从而在靶细胞的胞质溶胶内发生蛋白酶活性的功能性表达。可以通过许多常规测定法中的任何一种来确认任何分子(例如蛋白质或肽)是否具有本发明必需的易位功能。

例如，Shone C.(1987)描述了使用脂质体的体外测定法，所述脂质体受到测试分子的攻击。通过从脂质体中释放的K⁺和/或标记的NAD来确认必需的易位功能的存在，所述K⁺和/或标记的NAD可以容易地监测[参见Shone C.(1987)Eur.J.Biochem；第167卷(1):第175-180页]。

Blaustein R.(1987)提供了另一个示例，其描述了使用平面磷脂双层膜的简单的体外测定法。用测试分子攻击膜，并通过所述膜的跨膜电导的增加来确认必需的易位功能[参见Blaustein(1987)FEBS Letts；第226卷,第1号:第115-120页]。

Methods in Enzymology Vol 220and 221，Membrane Fusion Techniques，PartsA and B，Academic Press 1993提供了能够评估膜融合并因此鉴定适用于本发明的易位结构域的其他方法。

本发明还包括易位结构域变体，优选地，只要所述结构域变体仍显示出必需的易位活性。举例来说，变体可与参考易位结构域具有至少70％，优选至少80％，更优选至少90％，最优选至少95％或至少98％的氨基酸序列同源性。当与易位结构域相关使用时，术语片段是指肽，其具有参考易位结构域的至少20个，优选至少40个，更优选至少80个，最优选至少100个氨基酸残基。在梭菌易位结构域的情况下，该片段优选具有参考易位结构域(例如H_N结构域)的至少100个，优选至少150个，更优选至少200个，最优选至少250个氨基酸残基。与TM―片段”组分(上文讨论)类似，本发明的易位―片段”包括基于参考序列的易位结构域变体的片段。

易位结构域优选地能够在低pH条件下在脂质膜中形成离子可渗透的孔。优选地，已经发现仅使用能够在内体膜内形成孔的蛋白质分子的那些部分。

易位结构域可获自微生物蛋白来源，特别是获自细菌或病毒蛋白来源。因此，在一个实施方案中，易位结构域是酶的易位结构域，例如，细菌毒素或病毒蛋白的易位结构域。

众所周知，细菌毒素分子的某些结构域能够形成此类孔。还已知病毒表达的膜融合蛋白的某些易位结构域能够形成此类孔。这样的结构域可以在本发明中使用。

易位结构域可以是梭菌来源的，例如H_N结构域(或其功能性组分)。H_N表示梭菌神经毒素的H链的一部分或片段(大约等同于H链的氨基-末端的一半)，或与完整H链中的该片段相对应的结构域。H链可缺少H链的H_C组分的天然结合功能。在一些实施方案中，可通过删除H_C氨基酸序列去除H_C功能(通过核酸酶或蛋白酶处理，在DNA合成水平上或在合成后水平上去除)。可替代地，在一些实施方案中，可以通过化学或生物处理使H_C功能失活。因此，在一些实施方案中，H链不能结合与天然梭菌神经毒素(即全毒素)结合的靶细胞上的结合位点。

合适的(参考)易位结构域的示例包括：

A型肉毒杆菌神经毒素-氨基酸残基(449-871)

B型肉毒杆菌神经毒素-氨基酸残基(441-858)

C型肉毒杆菌神经毒素-氨基酸残基(442-866)

D型肉毒杆菌神经毒素-氨基酸残基(446-862)

E型肉毒杆菌神经毒素-氨基酸残基(423-845)

F型肉毒杆菌神经毒素-氨基酸残基(440-864)

G型肉毒杆菌神经毒素-氨基酸残基(442-863)

破伤风神经毒素-氨基酸残基(458-879)

A型肉毒杆菌神经毒素-氨基酸残基(A449-K871)

B型肉毒杆菌神经毒素-氨基酸残基(A442-S858)

C型肉毒杆菌神经毒素-氨基酸残基(T450-N866)

D型肉毒杆菌神经毒素-氨基酸残基(D446-N862)

E型肉毒杆菌神经毒素-氨基酸残基(K423-K845)

F型肉毒杆菌神经毒素-氨基酸残基(A440-K864)

G型肉毒杆菌神经毒素-氨基酸残基(S447-S863)

破伤风神经毒素-氨基酸残基(S458-V879)

在本发明的上下文中，多种具有易位结构域的梭菌毒素H_N区可用于本发明的方面，优选地只要这些活性片段可以促进非细胞毒性蛋白酶(例如梭菌L链)从细胞内的小泡释放进入靶细胞的细胞质，从而参与执行整个细胞机制，梭菌毒素通过该机制蛋白水解切割底物。梭菌毒素重链的H_N区长度约为410-430个氨基酸，并包含一个易位结构域。研究表明，来自梭菌毒素重链的H_N区的全长对于易位结构域的易位活性不是必需的。因此，本实施方案的方面可包括包含易位结构域的梭菌毒素H_N区，所述易位结构域具有例如至少350个氨基酸，至少375个氨基酸，至少400个氨基酸和至少425个氨基酸的长度。本实施方案的其他方面可包括包含易位结构域的梭菌毒素H_N区，所述易位结构域具有例如至多350个氨基酸，至多375个氨基酸，至多400个氨基酸和至多425个氨基酸的长度。

有关肉毒杆菌(Clostridium botulinum)和破伤风梭菌(C.tetani)产生毒素的遗传基础的更多详细信息，参见Henderson等人(1997)in The lostridia:MolecularBiology and Pathogenesis，Academic press。

术语H_N包括天然存在的神经毒素H_N部分和修饰的H_N部分，所述修饰的H_N部分具有在自然界中不存在的氨基酸序列和/或合成的氨基酸残基，优选地只要该修饰的H_N部分仍表现出上述易位功能。

备选地，易位结构域可以是非梭菌来源的。非梭菌(参考)易位结构域来源的示例包括但不限于白喉毒素的易位结构域[O’Keefe等人，Proc.Natl.Acad.Sci.USA(1992)89，6202-6206；Silverman等人，J.Biol.Chem.(1993)269，22524-22532；和London，E.(1992)Biochem.Biophys.Acta.，1112，pp.25-51]，A型假单胞菌外毒素的易位结构域[Prior等人Biochemistry(1992)31，3555-3559]，炭疽毒素的易位结构域[Blanke等人Proc.Natl.Acad.Sci.USA(1996)93，8437-8442],各种具有易位功能的促融合或疏水性肽[Plank等人J.Biol.Chem.(1994)269，12918-12924；和Wagner等人(1992)PNAS，89，pp.7934-7938],和两亲性肽[Murata等人(1992)Biochem.，31,第1986-1992页]。易位结构域可以反映天然存在的蛋白质中存在的易位结构域，或者可以包含氨基酸变异，优选地只要变异不破坏易位结构域的易位能力。

适用于本发明的病毒(参考)易位结构域的具体示例包括病毒表达的膜融合蛋白的某些易位结构域。例如，Wagner等人(1992)和Murata等人(1992)描述了源自流感病毒血凝素N-末端区域的许多促融合和两亲性肽的易位(即,膜融合和囊泡化)功能。其他已知具有所需易位活性的病毒表达的膜融合蛋白是Semliki森林病毒(SFV)促融合肽的易位结构域、水疱性口炎病毒(VSV)糖蛋白G的易位结构域、SER病毒F蛋白的易位结构域和泡沫病毒包膜糖蛋白的易位结构域。病毒编码的Aspike蛋白在本发明的上下文中具有特定的应用，例如，SFV的E1蛋白和VSV的G蛋白的G蛋白。

表(下表)中列出的(参考)易位结构域的使用包括其序列变体的使用。变体可以包含一个或多个保守核酸取代和/或核酸缺失或插入，优选地只要该变体具有必需的易位功能。变体还可以包含一个或多个氨基酸取代和/或氨基酸缺失或插入，优选地只要该变体具有必需的易位功能。

梭菌神经毒素H_C结构域参考序列的示例包括：

BoNT/A-N872-L1296

BoNT/B-E859-E1291

BoNT/C1-N867-E1291

BoNT/D-S863-E1276

BoNT/E-R846-K1252

BoNT/F-K865-E1274

BoNT/G-N864-E1297

TeNT-I880-D1315

对于最近鉴定的BoNT/X，据报道H_C结构域对应于其氨基酸893-1306，其中结构域边界可能相差约25个氨基酸(例如，868-1306或918-1306)。

本发明的多肽还可包含易位促进结构域。所述结构域促进将非细胞毒性蛋白酶递送至靶细胞的胞质溶胶中，并且描述在例如，WO 08/008803和WO 08/008805中，其各自通过引用并入本文。

举例来说，合适的易位促进结构域包括包膜病毒促融合肽结构域，例如，合适的融合肽结构域包括流感病毒融合肽结构域(例如23个氨基酸的甲型流感病毒融合肽结构域)、α病毒融合肽结构域(例如26个氨基酸的Semliki森林病毒融合肽结构域)、水疱病毒融合肽结构域(例如21个氨基酸的水疱性口炎病毒融合肽结构域)、呼吸道病毒融合肽结构域(例如25个氨基酸的仙台病毒融合肽结构域)、麻疹病毒融合肽结构域(例如25个氨基酸的犬瘟热病毒融合肽结构域)、avulavirus病毒融合肽结构域(例如25个氨基酸的新城病毒融合肽结构域)、henipavirus病毒融合肽结构域(例如25个氨基酸的亨德拉病毒融合肽结构域)、间质性肺炎病毒融合肽结构域(例如25个氨基酸的人间质性肺炎病毒融合肽结构域)或spumavirus病毒融合肽结构域，如猿猴泡沫病毒融合肽结构域；或其片段或变体。

作为进一步的示例，易位促进结构域可包含梭菌毒素H_CN结构域或其片段或变体。更详细地，梭菌毒素H_CN易位促进结构域可以具有至少200个氨基酸，至少225个氨基酸，至少250个氨基酸，至少275个氨基酸的长度。在这方面，梭菌毒素H_CN易位促进结构域优选具有至多200个氨基酸，至多225个氨基酸，至多250个氨基酸或至多275个氨基酸的长度。具体(参考)示例包括：

A型肉毒杆菌神经毒素-氨基酸残基(872-1110)

B型肉毒杆菌神经毒素-氨基酸残基(859-1097)

C型肉毒杆菌神经毒素-氨基酸残基(867-1111)

D型肉毒杆菌神经毒素-氨基酸残基(863-1098)

E型肉毒杆菌神经毒素-氨基酸残基(846-1085)

F型肉毒杆菌神经毒素-氨基酸残基(865-1105)

G型肉毒杆菌神经毒素-氨基酸残基(864-1105)

破伤风神经毒素-氨基酸残基(880-1127)

上述序列位置可能会根据血清型/亚型略有差别，合适的(参考)梭菌毒素H_CN结构域的其他示例包括：

A型肉毒杆菌神经毒素-氨基酸残基(874-1110)

B型肉毒杆菌神经毒素-氨基酸残基(861-1097)

C型肉毒杆菌神经毒素-氨基酸残基(869-1111)

D型肉毒杆菌神经毒素-氨基酸残基(865-1098)

E型肉毒杆菌神经毒素-氨基酸残基(848-1085)

F型肉毒杆菌神经毒素-氨基酸残基(867-1105)

G型肉毒杆菌神经毒素-氨基酸残基(866-1105)

破伤风神经毒素-氨基酸残基(882-1127)

任何上述促进结构域可与任何适用于本发明的前述易位结构域肽组合。因此，举例来说，非梭菌促进结构域可以与非梭菌易位结构域肽或与梭菌易位结构域肽组合。或者，可将梭菌毒素H_CN易位促进结构域与非梭菌易位结构域肽组合。或者，可将梭菌毒素H_CN促进结构域与梭菌易位结构域肽组合，其示例包括：

A型肉毒杆菌神经毒素-氨基酸残基(449-1110)

B型肉毒杆菌神经毒素-氨基酸残基(442-1097)

C型肉毒杆菌神经毒素-氨基酸残基(450-1111)

D型肉毒杆菌神经毒素-氨基酸残基(446-1098)

E型肉毒杆菌神经毒素-氨基酸残基(423-1085)

F型肉毒杆菌神经毒素-氨基酸残基(440-1105)

G型肉毒杆菌神经毒素-氨基酸残基(447-1105)

破伤风神经毒素-氨基酸残基(458-1127)

与本发明的各种方法相关的实施方案旨在同等地应用于其他方法、多肽(例如适合标记多肽或标记的多肽)、核酸，反之亦然。

序列同源性

多种序列比对方法中的任何都可以用于确定同一性百分比，包括但不限于全局方法、局部方法和混合方法，例如区段方法。确定同一性百分比的方案是本领域技术人员范围内的常规程序。全局方法从分子的开始到结束比对序列，并通过累加各个残基对的分数和通过施加空位罚分来确定最佳比对。非限制性方法包括，例如CLUSTAL W，参见例如JulieD.Thompson等人，CLUSTAL W:Improving the Sensitivity of Progressive MultipleSequence Alignment Through Sequence Weighting，Position-Specific Gap Penaltiesand Weight Matrix Choice，22(22)Nucleic Acids Research 4673-4680(1994)；和迭代改进，参见例如，Osamu Gotoh，Significant Improvement in Accuracy of MultipleProtein Sequence Alignments by Iterative Refinement as Assessed by Referenceto Structural Alignments，264(4)J.MoI.Biol.823-838(1996)。局部方法通过鉴定所有输入序列共有的一个或多个保守基序来比对序列。非限制性方法包括，例如火柴盒(Match-box)，参见例如Eric Depiereux and Ernest Feytmans，Match-Box:A Fundamentally NewAlgorithm for the Simultaneous Alignment of Several Protein Sequences，8(5)CABIOS 501-509(1992)；Gibbs采样，参见例如C.E.Lawrence等人，Detecting SubtleSequence Signals:A Gibbs Sampling Strategy for Multiple Alignment，262(5131)Science 208-214(1993)；Align-M，参见，例如，Ivo Van WaIIe等人，Align-M-A NewAlgorithm for Multiple Alignment of Highly Divergent Sequences，20(9)Bioinformatics:1428-1435(2004)。

因此，通过常规方法确定序列同一性百分比。参见，例如，Altschul等人，Bull.Math.Bio.48:603-16，1986 and Henikoff and Henikoff，Proc.Natl.Acad.Sci.USA89:10915-19，1992。简而言之，如下所示，使用空位开放罚分10，空位延伸罚分1，以及Henikoff和Henikoff的―blosum 62”评分矩阵(同上)对两个氨基酸序列进行比对，以优化比对得分(氨基酸由标准的单字母代码表示)。两个或更多个核酸或氨基酸序列之间的―序列同一性百分比”是该序列共有的相同位置数目的函数。因此，同一性％可以计算为相同核苷酸/氨基酸的数目除以核苷酸/氨基酸的总数，再乘以100。％序列同一性的计算也可以考虑需要引入以优化两个或更多个序列比对的空位的数目，以及每个空位的长度。可以使用本领域技术人员熟悉的特定数学算法(例如BLAST)进行序列比较和确定两个或多个序列之间的同一性百分比。

确定序列同一性的比对得分

然后，百分比同一性计算为：

引入较长序列以比对两个序列的空位数目]

基本上同源的多肽的特征在于具有一个或多个氨基酸取代、缺失或添加。这些变化优选是不重要的，即，保守的氨基酸取代(见下文)和不显著影响多肽折叠或活性的其他取代；小的缺失，通常缺失1至约30个氨基酸；和小的氨基或羧基末端延伸，例如氨基末端甲硫氨酸残基，最多约20-25个残基的小接头肽或亲和标签。

保守氨基酸取代

碱性：精氨酸

赖氨酸

组氨酸

酸性：谷氨酸

天冬氨酸

极性：谷氨酰胺

天冬酰胺

疏水性：亮氨酸

异亮氨酸

缬氨酸

芳香族：苯丙氨酸

色氨酸

酪氨酸

小的：甘氨酸

丙氨酸

丝氨酸

苏氨酸

甲硫氨酸

除20个标准氨基酸外，非标准氨基酸(例如4-羟基脯氨酸、6-N-甲基赖氨酸、2-氨基异丁酸、异缬氨酸和α-甲基丝氨酸)可以取代本发明多肽的氨基酸残基。有限数量的非保守氨基酸、不是由遗传密码子编码的氨基酸和非天然氨基酸可以取代多肽氨基酸残基。本发明的多肽还可以包含非天然存在的氨基酸残基。

非天然存在的氨基酸包括但不限于，反式-3-甲基脯氨酸、2,4-甲醇基-脯氨酸、顺式-4-羟基脯氨酸、反式-4-羟基脯氨酸、N-甲基甘氨酸、别苏氨酸、甲基苏氨酸、羟乙基半胱氨酸、羟乙基高半胱氨酸、硝基谷氨酰胺、高谷氨酰胺、哌啶酸、叔亮氨酸、正缬氨酸、2-氮杂苯丙氨酸、3-氮杂苯丙氨酸、4-氮杂苯丙氨酸和4-氟苯丙氨酸。用于将非天然存在的氨基酸残基并入蛋白质中的几种方法是本领域已知的。例如，可以使用体外系统，其中使用化学氨酰化的抑制子tRNA抑制无义突变。合成氨基酸和氨酰化tRNA的方法是本领域已知的。包含无义突变的质粒的转录和翻译是在无细胞系统中进行的，该系统包含大肠杆菌S30提取物以及可商购的酶和其他试剂。蛋白质通过色谱法纯化。参见，例如，Robertson等人，J.Am.Chem.Soc.113:2722，1991；Ellman等人，Methods Enzymol.202:301，1991；Chung等人，Science 259:806-9，1993；和Chung等人，Proc.Natl.Acad.Sci.USA 90:10145-9，1993)。在第二种方法中，通过显微注射突变的mRNA和化学氨酰化的抑制子tRNA在非洲爪蟾卵母细胞中进行翻译(Turcatti等人，J.Biol.Chem.271:19991-8，1996)。在第三种方法中，在不存在待替代的天然氨基酸(例如，苯丙氨酸)和存在期望的非天然存在的氨基酸(例如，2-氮杂苯丙氨酸、3-氮杂苯丙氨酸、4-氮杂苯丙氨酸或4-氟苯丙氨酸)的情况下培养大肠杆菌细胞。将非天然存在的氨基酸并入多肽，代替其天然对应物。参见，Koide等人，Biochem.33:7470-6，1994。可通过体外化学修饰将天然存在的氨基酸残基转化为非天然存在的物质。化学修饰可以与定点诱变组合使用，以进一步扩大取代范围(Wynn andRichards，Protein Sci.2:395-403，1993)。

有限数量的非保守氨基酸、不是由遗传密码子编码的氨基酸、非天然存在的氨基酸和非天然氨基酸可以取代本发明多肽的氨基酸残基。

可以根据本领域已知的程序来鉴定本发明多肽中的必需氨基酸，例如定点诱变或丙氨酸扫描诱变(Cunningham and Wells，Science 244:1081-5，1989)。也可以通过结构的物理分析来确定生物相互作用的位点，如通过核磁共振、晶体学、电子衍射或光亲和标记等技术，结合假定的接触位点氨基酸突变来确定。参见，例如，de Vos等人，Science 255:306-12，1992；Smith等人，J.Mol.Biol.224:899-904，1992；Wlodaver等人，FEBS Lett.309:59-64，1992。还可以从与本发明多肽的相关组分(例如易位或蛋白酶组分)的同源性分析中推断出必需氨基酸的鉴定。

可以使用诱变和筛选的已知方法进行多种氨基酸取代，并进行测试，例如Reidhaar-Olson和Sauer(Science 241:53-7，1988)或Bowie和Sauer(Proc.Natl.Acad.Sci.USA 86:2152-6，1989)中公开的那些方法。简而言之，这些作者公开了同时使多肽中的两个或更多个位置随机化，选择功能性多肽，然后对诱变的多肽进行测序以确定每个位置上允许取代的光谱的方法。可以使用的其他方法包括噬菌体展示(例如，Lowman等人，Biochem.30:10832-7，1991；Ladner等人，美国专利号5,223,409；Huse，WIPO公开WO 92/06204)和区域定向诱变(Derbyshire等人，Gene 46:145，1986；Ner等人，DNA 7:127，1988)。

可以使用诱变和筛选的已知方法进行多种氨基酸取代，并进行测试，例如Reidhaar-Olson and Sauer(Science 241:53-7，1988)或Bowie and Sauer(Proc.Natl.Acad.Sci.USA 86:2152-6，1989)中公开的那些方法。简而言之，这些作者公开了同时使多肽中的两个或更多个位置随机化，选择功能性多肽，然后对诱变的多肽进行测序以确定每个位置上允许取代的光谱的方法。可以使用的其他方法包括噬菌体展示(例如，Lowman等人，Biochem.30:10832-7，1991；Ladner等人，美国专利号5,223,409；Huse，WIPO公开WO 92/06204)和区域定向诱变(Derbyshire等人，Gene 46:145，1986；Ner等人，DNA 7:127，1988)。

除非另有定义，否则本文中使用的所有技术和科学术语具有与本公开所属领域的普通技术人员通常所理解的相同含义。Singleton等人，DICTIONARY OF MICROBIOLOGY ANDMOLECULAR BIOLOGY，第20版，John Wiley and Sons，New York(1994)，和Hale&Marham，THEHARPER COLLINS DICTIONARY OF BIOLOGY，Harper Perennial，NY(1991)，为熟练的技术人员提供了本公开中使用的许多术语的通用词典。

本公开内容不受本文公开的示例性方法和材料的限制，并且与本文描述的那些方法或材料类似或等同的任何方法和材料都可以用于本公开内容的实施方案的实践或测试。数字范围包括定义范围的数字。除非另有说明，否则任何核酸序列都以5'至3'的方向从左至右书写；氨基酸序列分别以氨基至羧基的方向从左至右书写。

本文提供的标题不是对本公开的各个方面或实施方案的限制。

在本文中，使用氨基酸名称、三字母缩写或单字母缩写来指代氨基酸。如本文所用，术语―蛋白质”包括蛋白质、多肽和肽。如本文所用，术语―氨基酸序列”与术语―多肽”和/或术语―蛋白质”同义。在一些情况下，术语―氨基酸序列”与术语―肽”同义。在一些情况下，术语―氨基酸序列”与术语―酶”同义。术语―蛋白质”和―多肽”在本文可互换使用。在本公开和权利要求中，可以使用氨基酸残基的常规单字母和三字母密码子。根据IUPACIUB生化命名联合委员会(JCBN)定义氨基酸的3个字母密码子。还应理解，由于遗传密码子的简并性，多肽可以被一个以上的核苷酸序列编码。

术语的其他定义可能在整个说明书中出现。在更详细地描述示例性实施方案之前，应当理解，本公开不限于所描述的特定实施方案，并因此可以变化。还应理解，本文中使用的术语仅出于描述具体实施方案的目的，而不旨在进行限制，因为本公开的范围仅由所附权利要求书限定。

在提供值的范围的情况下，应理解的是，除非上下文另外明确指出，否则在该范围的上限和下限之间、每个居中值至下限单位的十分之一，具体包括在本公开内。在指定范围内的任何指定值或居中值与该指定范围内的任何其他指定值或居中值之间的每个较小范围都包括在本公开中。这些较小范围的上限和下限可以独立地包括在该范围内或排除在该范围内，并且每个范围也包括在本公开内，其中包括在较小范围内的上下限之一、均不包括、或包括二者，以所述范围内的任何明确排除的限为准。在所述范围包括一个或两个限的情况下，排除这些限中所包括的任一个或两个的范围也包括在本公开中。

必须注意的是，如本文和所附权利要求书中所使用的，单数形式的―一个”，―一种”和―该”包括复数指示物，除非上下文另外明确指出。因此，例如，提及―多肽”包括多种这样的候选试剂，并且提及―多肽”包括提及一种或多种多肽及本领域技术人员已知的其等同物，等等。

本文所讨论的出版物仅在本申请的提交日期之前提供其公开内容。本文中的任何内容均不应解释为承认此类出版物构成了所附权利要求的现有技术。

附图说明

现在将参考以下附图和实施例仅以举例的方式描述本发明的实施方案。

图1显示配体多肽双标记策略的示意图。蛋白质在C-端包含SrtA识别位点，随后是Strep标签。在N-端，蛋白质包含由TEV切割位点保护的甘氨酸延伸。还生成了包含连接到所选荧光团的甘氨酸段，和包含SrtA识别位点和6His标签(HT)的第二肽。两种不同的SrtA酶允许在N-和C-端对不同颜色的荧光团进行位点特异性标记。

图2显示了未标记、单标记和双标记多肽的SNAP-25切割测定法。A.3、10、30、100、300和1000nM未标记的EGF-配体多肽、TxRed标记的EGF-多肽、SNAP594-标记的EGF-配体多肽、单个SrtA介导的标记的EGF-配体多肽和双SrtA标记的EGF-配体多肽在皮层神经元中的SNAP-25切割。作为对照，没有配体(无配体)的多肽用于所有浓度。暴露于多肽24小时。B.3、10、30、100、300和1000nM未标记的痛敏肽-配体多肽和双SrtA介导的标记的痛敏肽-多肽在皮层神经元中的SNAP-25切割。作为对照，没有配体(无配体)的多肽用于所有浓度。暴露于多肽24小时。

图3显示了双标记的EGF-配体多肽的实时共聚焦成像。A.用EGF-配体多肽处理的A549细胞的共聚焦实时成像记录的快照，该EGF-配体多肽在N-端标记HF555，在C-端标记HF488。图像(右)是大图像(左)上显示的方框区域的快照，所述大图像从添加蛋白质后0.5分钟开始，以不同的时间间隔拍摄。从3分钟开始可以看到形成该多肽特征的聚集物。B.用EGF-配体多肽处理的A549细胞的共聚焦实时成像记录的快照，该EGF-配体多肽在N-端标记HF555，在C-端标记HF488。图像(右)是大图像(左)上显示的方框区域的快照，所述大图像从添加蛋白质后30分钟开始，以不同的时间间隔拍摄。从45分钟开始可以看到聚集物的消失。

图4显示了双标记的全长蛋白水解失活的BoNT/A1突变体(称为BoNT/A(0))的示意图。分选酶供体和受体位点和规程与图1相同。

图5显示了使用荧光(左)和考马斯染色(右)成像的双标记的蛋白水解失活的BoNT/A(BoNT/A(0))的SDS-PAGE分析。泳道1和4显示蛋白质阶梯，泳道2和5为未还原的双标记BoNT/A(0)，泳道3和6显示还原的双标记(L链底部和H链顶部)BoNT/A(0)。

图6显示了以5秒间隔记录的单标记BoNT/A(0)的随时间推移的单分子TIRF显微镜图像。白色箭头显示整个时间中以秒为单位移动的单分子。

序列表

在任何以下SEQ ID NO中指示初始Met氨基酸残基或相应的初始密码子时，所述残基/密码子是任选的。如果说明书中描述的序列与ST.25序列表中的序列有任何差异，以说明书中的序列为准。

SEQ ID NO:1-带有双标记的SrtA位点的EGF-配体(EGF TM)多肽的核苷酸序列

SEQ ID NO:2-带有双标记的SrtA位点的EGF-配体(EGF Tm)多肽的多肽序列

SEQ ID NO:3-带有双标记的SrtA位点的痛敏肽-配体(痛敏肽TM)多肽的核苷酸序列

SEQ ID NO:4-带有双标记的SrtA位点的痛敏肽-配体(痛敏肽TM)多肽的多肽序列

SEQ ID NO:5-EGF-配体(EGF TM)多肽的核苷酸序列

SEQ ID NO:6-EGF-配体(EGF Tm)多肽的多肽序列

SEQ ID NO:7-痛敏肽-配体(痛敏肽TM)多肽的核苷酸序列

SEQ ID NO:8-痛敏肽-配体(痛敏肽TM)多肽的多肽序列

SEQ ID NO:9–GFP标签的EGF-配体多肽的核苷酸序列

SEQ ID NO:10–GFP标签的EGF-配体多肽的多肽序列

SEQ ID NO:11–SNAP标签的EGF-配体多肽的核苷酸序列

SEQ ID NO:12–SNAP标签的EGF-配体多肽的多肽序列

SEQ ID NO:13–分选酶A的核苷酸序列(靶向LPESG)

SEQ ID NO:14–分选酶A的多肽序列(靶向LPESG)

SEQ ID NO:15–分选酶A的核苷酸序列(靶向LAETG)

SEQ ID NO:16–分选酶A的多肽序列(靶向LAETG)

SEQ ID NO:17-BoNT/A-UniProt P10845

SEQ ID NO:18-BoNT/B-UniProt P10844

SEQ ID NO:19-BoNT/C-UniProt P18640

SEQ ID NO:20-BoNT/D-UniProt P19321

SEQ ID NO:21-BoNT/E-UniProt Q00496

SEQ ID NO:22-BoNT/F-UniProt A7GBG3

SEQ ID NO:23-BoNT/G-UniProt Q60393

SEQ ID NO:24-BoNT/X的多肽序列

SEQ ID NO:25-TeNT–UniProt P04958

SEQ ID NO:26–标记的EGF TM多肽的多肽序列

SEQ ID NO:27–C.ternatea butelase 1的多肽序列(加上信号肽)

SEQ ID NO:28–C.ternatea butelase 1的多肽序列(减去信号肽)

SEQ ID NO:29–带有缀合的可检测标记和分选酶供体位点的肽

SEQ ID NO:30–带有缀合的可检测标记和分选酶受体位点的肽

SEQ ID NO:31–金黄色葡萄球菌分选酶A的多肽序列

SEQ ID NO:32–金黄色葡萄球菌分选酶B的多肽序列

SEQ ID NO:33–肺炎链球菌分选酶A的多肽序列

SEQ ID NO:34–肺炎链球菌分选酶B的多肽序列

SEQ ID NO:35–肺炎链球菌分选酶C的多肽序列

SEQ ID NO:36–肺炎链球菌分选酶D的多肽序列

SEQ ID NO:37–化脓性链球菌分选酶A的多肽序列

SEQ ID NO:38–蛋白水解失活的BoNT/A(0)突变体的多肽序列

SEQ ID NO:39–带有双标记的SrtA位点的全长蛋白水解失活的BoNT/A(0)突变体的核苷酸序列

SEQ ID NO:40–带有双标记的SrtA位点的全长蛋白水解失活的BoNT/A(0)突变体的多肽序列

SEQ ID NO:41–Prochloron didemni PATG的多肽序列

SEQ ID NO:42–Saponaria vaccaria PCY1的多肽序列

SEQ ID NO:43-Galerina marginata POPB的多肽序列

SEQ ID NO:44–Oldenlandia affinis Butelase同源物OaAEP1b的多肽序列(加上信号肽)

SEQ ID NO:45–Oldenlandia affinis Butelase同源物OaAEP1b的多肽序列(减去信号肽)

SEQ ID NO:1-带有双标记的SrtA位点的EGF-配体多肽的核苷酸序列

TGGCGAATGGGACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTAGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGTCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGCTTACAATTTAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAATTAATTCTTAGAAAAACTCATCGAGCATCAAATGAAACTGCAATTTATTCATATCAGGATTATCAATACCATATTTTTGAAAAAGCCGTTTCTGTAATGAAGGAGAAAACTCACCGAGGCAGTTCCATAGGATGGCAAGATCCTGGTATCGGTCTGCGATTCCGACTCGTCCAACATCAATACAACCTATTAATTTCCCCTCGTCAAAAATAAGGTTATCAAGTGAGAAATCACCATGAGTGACGACTGAATCCGGTGAGAATGGCAAAAGTTTATGCATTTCTTTCCAGACTTGTTCAACAGGCCAGCCATTACGCTCGTCATCAAAATCACTCGCATCAACCAAACCGTTATTCATTCGTGATTGCGCCTGAGCGAGACGAAATACGCGATCGCTGTTAAAAGGACAATTACAAACAGGAATCGAATGCAACCGGCGCAGGAACACTGCCAGCGCATCAACAATATTTTCACCTGAATCAGGATATTCTTCTAATACCTGGAATGCTGTTTTCCCGGGGATCGCAGTGGTGAGTAACCATGCATCATCAGGAGTACGGATAAAATGCTTGATGGTCGGAAGAGGCATAAATTCCGTCAGCCAGTTTAGTCTGACCATCTCATCTGTAACATCATTGGCAACGCTACCTTTGCCATGTTTCAGAAACAACTCTGGCGCATCGGGCTTCCCATACAATCGATAGATTGTCGCACCTGATTGCCCGACATTATCGCGAGCCCATTTATACCCATATAAATCAGCATCCATGTTGGAATTTAATCGCGGCCTAGAGCAAGACGTTTCCCGTTGAATATGGCTCATAACACCCCTTGTATTACTGTTTATGTAAGCAGACAGTTTTATTGTTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATCGGCGATAATGGCCTGCTTCTCGCCGAAACGTTTGGTGGCGGGACCAGTGACGAAGGCTTGAGCGAGGGCGTGCAAGATTCCGAATACCGCAAGCGACAGGCCGATCATCGTCGCGCTCCAGCGAAAGCGGTCCTCGCCGAAAATGACCCAGAGCGCTGCCGGCACCTGTCCTACGAGTTGCATGATAAAGAAGACAGTCATAAGTGCGGCGACGATAGTCATGCCCCGCGCCCACCGGAAGGAGCTGACTGGGTTGAAGGCTCTCAAGGGCATCGGTCGAGATCCCGGTGCCTAATGAGTGAGCTAACTTACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCCAGGGTGGTTTTTCTTTTCACCAGTGAGACGGGCAACAGCTGATTGCCCTTCACCGCCTGGCCCTGAGAGAGTTGCAGCAAGCGGTCCACGCTGGTTTGCCCCAGCAGGCGAAAATCCTGTTTGATGGTGGTTAACGGCGGGATATAACATGAGCTGTCTTCGGTATCGTCGTATCCCACTACCGAGATATCCGCACCAACGCGCAGCCCGGACTCGGTAATGGCGCGCATTGCGCCCAGCGCCATCTGATCGTTGGCAACCAGCATCGCAGTGGGAACGATGCCCTCATTCAGCATTTGCATGGTTTGTTGAAAACCGGACATGGCACTCCAGTCGCCTTCCCGTTCCGCTATCGGCTGAATTTGATTGCGAGTGAGATATTTATGCCAGCCAGCCAGACGCAGACGCGCCGAGACAGAACTTAATGGGCCCGCTAACAGCGCGATTTGCTGGTGACCCAATGCGACCAGATGCTCCACGCCCAGTCGCGTACCGTCTTCATGGGAGAAAATAATACTGTTGATGGGTGTCTGGTCAGAGACATCAAGAAATAACGCCGGAACATTAGTGCAGGCAGCTTCCACAGCAATGGCATCCTGGTCATCCAGCGGATAGTTAATGATCAGCCCACTGACGCGTTGCGCGAGAAGATTGTGCACCGCCGCTTTACAGGCTTCGACGCCGCTTCGTTCTACCATCGACACCACCACGCTGGCACCCAGTTGATCGGCGCGAGATTTAATCGCCGCGACAATTTGCGACGGCGCGTGCAGGGCCAGACTGGAGGTGGCAACGCCAATCAGCAACGACTGTTTGCCCGCCAGTTGTTGTGCCACGCGGTTGGGAATGTAATTCAGCTCCGCCATCGCCGCTTCCACTTTTTCCCGCGTTTTCGCAGAAACGTGGCTGGCCTGGTTCACCACGCGGGAAACGGTCTGATAAGAGACACCGGCATACTCTGCGACATCGTATAACGTTACTGGTTTCACATTCACCACCCTGAATTGACTCTCTTCCGGGCGCTATCATGCCATACCGCGAAAGGTTTTGCGCCATTCGATGGTGTCCGGGATCTCGACGCTCTCCCTTATGCGACTCCTGCATTAGGAAGCAGCCCAGTAGTAGGTTGAGGCCGTTGAGCACCGCCGCCGCAAGGAATGGTGCATGCAAGGAGATGGCGCCCAACAGTCCCCCGGCCACGGGGCCTGCCACCATACCCACGCCGAAACAAGCGCTCATGAGCCCGAAGTGGCGAGCCCGATCTTCCCCATCGGTGATGTCGGCGATATAGGCGCCAGCAACCGCACCTGTGGCGCCGGTGATGCCGGCCACGATGCGTCCGGCGTAGAGGATCGAGATCTCGATCCCGCGAAATTAATACGACTCACTATAGGGGAATTGTGAGCGGATAACAATTCCCCTCAAGAAATAATTTTGTTTAACTTTAAGAAGGAGATATACATATgggatccatgGAGAACCTGTATTTTCAGGGCGGCGGTGGCAGCGGCGGCAGCGGCGGCAGCcctttcgttaacaaacagttcaactataaagacccagttaacggtgttgacattgcttacatcaaaatcccgaacgctggccagatgcagccggtaaaggcattcaaaatccacaacaaaatctgggttatcccggaacgtgatacctttactaacccggaagaaggtgacctgaacccgccaccggaagcgaaacaggtgccggtatcttactatgactccacctacctgtctaccgataacgaaaaggacaactacctgaaaggtgttactaaactgttcgagcgtatttactccaccgacctgggccgtatgctgctgactagcatcgttcgcggtatcccgttctggggcggttctaccatcgataccgaactgaaagtaatcgacactaactgcatcaacgttattcagccggacggttcctatcgttccgaagaactgaacctggtgatcatcggcccgtctgctgatatcatccagttcgagtgtaagagctttggtcacgaagttctgaacctcacccgtaacggctacggttccactcagtacatccgtttctctccggacttcaccttcggttttgaagaatccctggaagtagacacgaacccactgctgggcgctggtaaattcgcaactgatcctgcggttaccctggctcacgaactgattcatgcaggccaccgcctgtacggtatcgccatcaatccgaaccgtgtcttcaaagttaacaccaacgcgtattacgagatgtccggtctggaagttagcttcgaagaactgcgtacttttggcggtcacgacgctaaattcatcgactctctgcaagaaaacgagttccgtctgtactactataacaagttcaaagatatcgcatccaccctgaacaaagcgaaatccatcgtgggtaccactgcttctctccagtacatgaagaacgtttttaaagaaaaatacctgctcagcgaagacacctccggcaaattctctgtagacaagttgaaattcgataaactttacaaaatgctgactgaaatttacaccgaagacaacttcgttaagttctttaaagttctgaaccgcaaaacctatctgaacttcgacaaggcagtattcaaaatcaacatcgtgccgaaagttaactacactatctacgatggtttcaacctgcgtaacaccaacctggctgctaattttaacggccagaacacggaaatcaacaacatgaacttcacaaaactgaaaaacttcactggtctgttcgagttttacaagctgctgtgcgtcgacggcatcattacctccaaaactaaatctctgatagaaggtagaaacaaagcgctgaacctgcagtgtatcaaggttaacaactgggatttattcttcagcccgagtgaagacaacttcaccaacgacctgaacaaaggtgaagaaatcacctcagatactaacatcgaagcagccgaagaaaacatctcgctggacctgatccagcagtactacctgacctttaatttcgacaacgagccggaaaacatttctatcgaaaacctgagctctgatatcatcggccagctggaactgatgccgaacatcgaacgtttcccaaacggtaaaaagtacgagctggacaaatataccatgttccactacctgcgcgcgcaggaatttgaacacggcaaatcccgtatcgcactgactaactccgttaacgaagctctgctcaacccgtcccgtgtatacaccttcttctctagcgactacgtgaaaaaggtcaacaaagcgactgaagctgcaatgttcttgggttgggttgaacagcttgtttatgattttaccgacgagacgtccgaagtatctactaccgacaaaattgcggatatcactatcatcatcccgtacatcggtccggctctgaacattggcaacatgctgtacaaagacgacttcgttggcgcactgatcttctccggtgcggtgatcctgctggagttcatcccggaaatcgccatcccggtactgggcacctttgctctggtttcttacattgcaaacaaggttctgactgtacaaaccatcgacaacgcgctgagcaaacgtaacgaaaaatgggatgaagtttacaaatatatcgtgaccaactggctggctaaggttaatactcagatcgacctcatccgcaaaaaaatgaaagaagcactggaaaaccaggcggaagctaccaaggcaatcattaactaccagtacaaccagtacaccgaggaagaaaaaaacaacatcaacttcaacatcgacgatctgtcctctaaactgaacgaatccatcaacaaagctatgatcaacatcaacaagttcctgaaccagtgctctgtaagctatctgatgaactccatgatcccgtacggtgttaaacgtctggaggacttcgatgcgtctctgaaagacgccctgctgaaatacatttacgacaaccgtggcactctgatcggtcaggttgatcgtctgaaggacaaagtgaacaataccttatcgaccgacatcccttttcagctcagtaaatatgtcgataaccaacgccttttgtccactctagaaggcggTGGCGGTAGCGGTGGCGGTGGCAGCGGCGGTGGCGGTAGCGCACTAGacAACAGCGACCCTAAATGCCCACTgAGTCATGAAGGATACTGCCTTAATGATGGTGTTTGTATGTACATAGGAACATTGGACCGTTATGCTTGCAATTGTGTAGTGGGCTATGTCGGGGAAAGGTGTCAATATCGAGATCTCAAGCTGGCAGAGTTAAGAgggctagaagcaGGCGGCAGCGGCGGCGGCAGCGGCCTGCCCGAAAGCGGTGGCGGATCTGCTTGGTCTCACCCGCAGTTCGAAAAAGGTGGTGGTTCTGGTGGTGGTTCTGGTGGTTCTGCTTGGTCTCACCCGCAGTTCGAAAAAtaatgaAAGCTTGCGGCCGCACTCGAGCACCACCACCACCACCACTGAGATCCGGCTGCTAACAAAGCCCGAAAGGAAGCTGAGTTGGCTGCTGCCACCGCTGAGCAATAACTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTTTGCTGAAAGGAGGAACTATATCCGGAT

SEQ ID NO:2-带有双标记的SrtA位点的EGF-配体多肽的多肽序列MENLYFQGGGGSGGSGGSPFVNKQFNYKDPVNGVDIAYIKIPNAGQMQPVKAFKIHNKIWVIPERDTFTNPEEGDLNPPPEAKQVPVSYYDSTYLSTDNEKDNYLKGVTKLFERIYSTDLGRMLLTSIVRGIPFWGGSTIDTELKVIDTNCINVIQPDGSYRSEELNLVIIGPSADIIQFECKSFGHEVLNLTRNGYGSTQYIRFSPDFTFGFEESLEVDTNPLLGAGKFATDPAVTLAHELIHAGHRLYGIAINPNRVFKVNTNAYYEMSGLEVSFEELRTFGGHDAKFIDSLQENEFRLYYYNKFKDIASTLNKAKSIVGTTASLQYMKNVFKEKYLLSEDTSGKFSVDKLKFDKLYKMLTEIYTEDNFVKFFKVLNRKTYLNFDKAVFKINIVPKVNYTIYDGFNLRNTNLAANFNGQNTEINNMNFTKLKNFTGLFEFYKLLCVDGIITSKTKSLIEGRNKALNLQCIKVNNWDLFFSPSEDNFTNDLNKGEEITSDTNIEAAEENISLDLIQQYYLTFNFDNEPENISIENLSSDIIGQLELMPNIERFPNGKKYELDKYTMFHYLRAQEFEHGKSRIALTNSVNEALLNPSRVYTFFSSDYVKKVNKATEAAMFLGWVEQLVYDFTDETSEVSTTDKIADITIIIPYIGPALNIGNMLYKDDFVGALIFSGAVILLEFIPEIAIPVLGTFALVSYIANKVLTVQTIDNALSKRNEKWDEVYKYIVTNWLAKVNTQIDLIRKKMKEALENQAEATKAIINYQYNQYTEEEKNNINFNIDDLSSKLNESINKAMININKFLNQCSVSYLMNSMIPYGVKRLEDFDASLKDALLKYIYDNRGTLIGQVDRLKDKVNNTLSTDIPFQLSKYVDNQRLLSTLEGGGGSGGGGSGGGGSALDNSDPKCPLSHEGYCLNDGVCMYIGTLDRYACNCVVGYVGERCQYRDLKLAELRGLEAGGSGGGSGLPESGGGSAWSHPQFEKGGGSGGGSGGSAWSHPQFEK

SEQ ID NO:3-带有双标记的SrtA位点的痛敏肽-配体多肽的核苷酸序列

TGGCGAATGGGACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTAGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGTCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGCTTACAATTTAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAATTAATTCTTAGAAAAACTCATCGAGCATCAAATGAAACTGCAATTTATTCATATCAGGATTATCAATACCATATTTTTGAAAAAGCCGTTTCTGTAATGAAGGAGAAAACTCACCGAGGCAGTTCCATAGGATGGCAAGATCCTGGTATCGGTCTGCGATTCCGACTCGTCCAACATCAATACAACCTATTAATTTCCCCTCGTCAAAAATAAGGTTATCAAGTGAGAAATCACCATGAGTGACGACTGAATCCGGTGAGAATGGCAAAAGTTTATGCATTTCTTTCCAGACTTGTTCAACAGGCCAGCCATTACGCTCGTCATCAAAATCACTCGCATCAACCAAACCGTTATTCATTCGTGATTGCGCCTGAGCGAGACGAAATACGCGATCGCTGTTAAAAGGACAATTACAAACAGGAATCGAATGCAACCGGCGCAGGAACACTGCCAGCGCATCAACAATATTTTCACCTGAATCAGGATATTCTTCTAATACCTGGAATGCTGTTTTCCCGGGGATCGCAGTGGTGAGTAACCATGCATCATCAGGAGTACGGATAAAATGCTTGATGGTCGGAAGAGGCATAAATTCCGTCAGCCAGTTTAGTCTGACCATCTCATCTGTAACATCATTGGCAACGCTACCTTTGCCATGTTTCAGAAACAACTCTGGCGCATCGGGCTTCCCATACAATCGATAGATTGTCGCACCTGATTGCCCGACATTATCGCGAGCCCATTTATACCCATATAAATCAGCATCCATGTTGGAATTTAATCGCGGCCTAGAGCAAGACGTTTCCCGTTGAATATGGCTCATAACACCCCTTGTATTACTGTTTATGTAAGCAGACAGTTTTATTGTTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATCGGCGATAATGGCCTGCTTCTCGCCGAAACGTTTGGTGGCGGGACCAGTGACGAAGGCTTGAGCGAGGGCGTGCAAGATTCCGAATACCGCAAGCGACAGGCCGATCATCGTCGCGCTCCAGCGAAAGCGGTCCTCGCCGAAAATGACCCAGAGCGCTGCCGGCACCTGTCCTACGAGTTGCATGATAAAGAAGACAGTCATAAGTGCGGCGACGATAGTCATGCCCCGCGCCCACCGGAAGGAGCTGACTGGGTTGAAGGCTCTCAAGGGCATCGGTCGAGATCCCGGTGCCTAATGAGTGAGCTAACTTACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCCAGGGTGGTTTTTCTTTTCACCAGTGAGACGGGCAACAGCTGATTGCCCTTCACCGCCTGGCCCTGAGAGAGTTGCAGCAAGCGGTCCACGCTGGTTTGCCCCAGCAGGCGAAAATCCTGTTTGATGGTGGTTAACGGCGGGATATAACATGAGCTGTCTTCGGTATCGTCGTATCCCACTACCGAGATATCCGCACCAACGCGCAGCCCGGACTCGGTAATGGCGCGCATTGCGCCCAGCGCCATCTGATCGTTGGCAACCAGCATCGCAGTGGGAACGATGCCCTCATTCAGCATTTGCATGGTTTGTTGAAAACCGGACATGGCACTCCAGTCGCCTTCCCGTTCCGCTATCGGCTGAATTTGATTGCGAGTGAGATATTTATGCCAGCCAGCCAGACGCAGACGCGCCGAGACAGAACTTAATGGGCCCGCTAACAGCGCGATTTGCTGGTGACCCAATGCGACCAGATGCTCCACGCCCAGTCGCGTACCGTCTTCATGGGAGAAAATAATACTGTTGATGGGTGTCTGGTCAGAGACATCAAGAAATAACGCCGGAACATTAGTGCAGGCAGCTTCCACAGCAATGGCATCCTGGTCATCCAGCGGATAGTTAATGATCAGCCCACTGACGCGTTGCGCGAGAAGATTGTGCACCGCCGCTTTACAGGCTTCGACGCCGCTTCGTTCTACCATCGACACCACCACGCTGGCACCCAGTTGATCGGCGCGAGATTTAATCGCCGCGACAATTTGCGACGGCGCGTGCAGGGCCAGACTGGAGGTGGCAACGCCAATCAGCAACGACTGTTTGCCCGCCAGTTGTTGTGCCACGCGGTTGGGAATGTAATTCAGCTCCGCCATCGCCGCTTCCACTTTTTCCCGCGTTTTCGCAGAAACGTGGCTGGCCTGGTTCACCACGCGGGAAACGGTCTGATAAGAGACACCGGCATACTCTGCGACATCGTATAACGTTACTGGTTTCACATTCACCACCCTGAATTGACTCTCTTCCGGGCGCTATCATGCCATACCGCGAAAGGTTTTGCGCCATTCGATGGTGTCCGGGATCTCGACGCTCTCCCTTATGCGACTCCTGCATTAGGAAGCAGCCCAGTAGTAGGTTGAGGCCGTTGAGCACCGCCGCCGCAAGGAATGGTGCATGCAAGGAGATGGCGCCCAACAGTCCCCCGGCCACGGGGCCTGCCACCATACCCACGCCGAAACAAGCGCTCATGAGCCCGAAGTGGCGAGCCCGATCTTCCCCATCGGTGATGTCGGCGATATAGGCGCCAGCAACCGCACCTGTGGCGCCGGTGATGCCGGCCACGATGCGTCCGGCGTAGAGGATCGAGATCTCGATCCCGCGAAATTAATACGACTCACTATAGGGGAATTGTGAGCGGATAACAATTCCCCTCAAGAAATAATTTTGTTTAACTTTAAGAAGGAGATATACATatgGAGAACCTGTATTTTCAGGGCGGCGGTGGCAGCGGCGGCAGCGGCGGCAGCGGCAGCATGcctTTTGTGAACAAACAGTTCAACTATAAGGATCCGGTTAATGGTGTGGATATCGCCTATATCAAAATTCCGAATGCAGGTCAGATGCAGCCGGTTAAAGCCTTTAAAATCCATAACAAAATTTGGGTGATTCCGGAACGTGATACCTTTACCAATCCGGAAGAAGGTGATCTGAATCCGCCTCCGGAAGCAAAACAGGTTCCGGTTAGCTATTATGATAGCACCTATCTGAGCACCGATAACGAGAAAGATAACTATCTGAAAGGTGTGACCAAACTGTTTGAACGCATTTATAGTACCGATCTGGGTCGTATGCTGCTGACCAGCATTGTTCGTGGTATTCCGTTTTGGGGTGGTAGCACCATTGATACCGAACTGAAAGTTATTGACACCAACTGCATTAATGTGATTCAGCCGGATGGTAGCTATCGTAGCGAAGAACTGAATCTGGTTATTATTGGTCCGAGCGCAGATATCATTCAGTTTGAATGTAAATCCTTTGGCCACGAAGTTCTGAATCTGACCCGTAATGGTTATGGTAGTACCCAGTATATTCGTTTCAGTCCGGATTTTACCTTTGGCTTTGAAGAAAGCCTGGAAGTTGATACAAATCCGCTGTTAGGTGCAGGTAAATTTGCAACCGATCCGGCAGTTACCCTGGCACATGAACTGATTCATGCCGGTCATCGTCTGTATGGTATTGCAATTAATCCGAACCGTGTGTTCAAAGTGAATACCAACGCATATTATGAAATGAGCGGTCTGGAAGTGTCATTTGAAGAACTGCGTACCTTTGGTGGTCATGATGCCAAATTTATCGATAGCCTGCAAGAAAATGAATTTCGCCTGTACTACTATAACAAATTCAAGGATATTGCGAGCACCCTGAATAAAGCCAAAAGCATTGTTGGCACCACCGCAAGCCTGCAGTATATGAAAAATGTGTTTAAAGAAAAATATCTGCTGAGCGAAGATACCAGCGGTAAATTTAGCGTTGACAAACTGAAATTCGATAAACTGTACAAGATGCTGACCGAGATTTATACCGAAGATAACTTCGTGAAGTTTTTCAAAGTGCTGAACCGCAAAACCTACCTGAACTTTGATAAAGCCGTGTTCAAAATCAACATCGTGCCGAAAGTGAACTATACCATCTATGATGGTTTTAACCTGCGCAATACCAATCTGGCAGCAAACTTTAATGGTCAGAACACCGAAATCAACAACATGAACTTTACCAAACTGAAGAACTTCACCGGTCTGTTCGAATTTTACAAACTGCTGTGTGTGGATGGCATTATTACCAGCAAAACCAAATCCGATGATGACGATAAATTCGGTGGTTTTACCGGTGCACGTAAAAGCGCACGTAAACGTAAAAATCAGGCACTGGCAGGCGGTGGTGGTAGCGGTGGCGGTGGTTCAGGTGGTGGTGGCTCAGCACTGGTTCTGCAGTGTATTAAAGTTAATAACTGGGACCTGTTTTTTAGCCCGAGCGAGGATAATTTCACCAACGATCTGAACAAAGGCGAAGAAATTACCAGCGATACCAATATTGAAGCAGCCGAAGAAAACATTAGCCTGGATCTGATTCAGCAGTATTATCTGACCTTCAACTTCGATAATGAGCCGGAAAATATCAGCATTGAAAACCTGAGCAGCGATATTATTGGCCAGCTGGAACTGATGCCGAATATTGAACGTTTTCCGAACGGCAAAAAATACGAGCTGGATAAATACACCATGTTCCATTATCTGCGTGCCCAAGAATTTGAACATGGTAAAAGCCGTATTGCACTGACCAATAGCGTTAATGAAGCACTGCTGAACCCGAGCCGTGTTTATACCTTTTTTAGCAGCGATTACGTGAAAAAGGTTAACAAAGCAACCGAAGCAGCCATGTTTTTAGGTTGGGTTGAACAGCTGGTTTATGATTTCACCGATGAAACCAGCGAAGTTAGCACCACCGATAAAATTGCAGATATTACCATCATCATCCCGTATATCGGTCCGGCACTGAATATTGGCAATATGCTGTATAAAGACGATTTTGTGGGTGCCCTGATCTTTAGCGGTGCAGTTATTCTGCTGGAATTTATTCCGGAAATTGCCATTCCGGTTCTGGGCACCTTTGCACTGGTGAGCTATATTGCAAATAAAGTTCTGACCGTGCAGACCATCGATAATGCACTGAGCAAACGTAACGAAAAATGGGATGAAGTGTACAAGTATATCGTGACCAATTGGCTGGCAAAAGTTAACACCCAGATTGACCTGATTCGCAAGAAGATGAAAGAAGCACTGGAAAACCAGGCAGAAGCAACCAAAGCCATTATTAACTATCAGTACAACCAGTACACCGAAGAAGAGAAGAATAACATCAACTTCAACATCGATGATCTGAGCAGCAAGCTGAATGAAAGCATCAACAAAGCCATGATCAACATTAACAAATTTCTGAATCAGTGCAGCGTGAGCTATCTGATGAATAGCATGATTCCGTATGGTGTGAAACGTCTGGAAGATTTTGATGCAAGCCTGAAAGATGCCCTGCTGAAATATATCTATGATAATCGTGGCACCCTGATTGGTCAGGTTGATCGTCTGAAAGATAAAGTGAACAACACCCTGAGTACCGATATTCCTTTTCAGCTGAGCAAATATGTGGATAATCAGCGTCTGCTGAGTACCCTGGATGGCGGCAGCGGCGGCGGCAGCGGCCTGCCCGAAAGCGGTGGCGGATCTGCTTGGTCTCACCCGCAGTTCGAAAAAGGTGGTGGTTCTGGTGGTGGTTCTGGTGGTTCTGCTTGGTCTCACCCGCAGTTCGAAAAAtaatgaAAGCTTGCGGCCGCACTCGAGCACCACCACCACCACCACTGAGATCCGGCTGCTAACAAAGCCCGAAAGGAAGCTGAGTTGGCTGCTGCCACCGCTGAGCAATAACTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTTTGCTGAAAGGAGGAACTATATCCGGAT

SEQ ID NO:4-带有双标记的SrtA位点的痛敏肽-配体多肽的多肽序列

MENLYFQGGGGSGGSGGSGSMPFVNKQFNYKDPVNGVDIAYIKIPNAGQMQPVKAFKIHNKIWVIPERDTFTNPEEGDLNPPPEAKQVPVSYYDSTYLSTDNEKDNYLKGVTKLFERIYSTDLGRMLLTSIVRGIPFWGGSTIDTELKVIDTNCINVIQPDGSYRSEELNLVIIGPSADIIQFECKSFGHEVLNLTRNGYGSTQYIRFSPDFTFGFEESLEVDTNPLLGAGKFATDPAVTLAHELIHAGHRLYGIAINPNRVFKVNTNAYYEMSGLEVSFEELRTFGGHDAKFIDSLQENEFRLYYYNKFKDIASTLNKAKSIVGTTASLQYMKNVFKEKYLLSEDTSGKFSVDKLKFDKLYKMLTEIYTEDNFVKFFKVLNRKTYLNFDKAVFKINIVPKVNYTIYDGFNLRNTNLAANFNGQNTEINNMNFTKLKNFTGLFEFYKLLCVDGIITSKTKSDDDDKFGGFTGARKSARKRKNQALAGGGGSGGGGSGGGGSALVLQCIKVNNWDLFFSPSEDNFTNDLNKGEEITSDTNIEAAEENISLDLIQQYYLTFNFDNEPENISIENLSSDIIGQLELMPNIERFPNGKKYELDKYTMFHYLRAQEFEHGKSRIALTNSVNEALLNPSRVYTFFSSDYVKKVNKATEAAMFLGWVEQLVYDFTDETSEVSTTDKIADITIIIPYIGPALNIGNMLYKDDFVGALIFSGAVILLEFIPEIAIPVLGTFALVSYIANKVLTVQTIDNALSKRNEKWDEVYKYIVTNWLAKVNTQIDLIRKKMKEALENQAEATKAIINYQYNQYTEEEKNNINFNIDDLSSKLNESINKAMININKFLNQCSVSYLMNSMIPYGVKRLEDFDASLKDALLKYIYDNRGTLIGQVDRLKDKVNNTLSTDIPFQLSKYVDNQRLLSTLDGGSGGGSGLPESGGGSAWSHPQFEKGGG

SEQ ID NO:5-EGF-配体多肽的核苷酸序列

TGGCGAATGGGACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTAGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGTCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGCTTACAATTTAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAATTAATTCTTAGAAAAACTCATCGAGCATCAAATGAAACTGCAATTTATTCATATCAGGATTATCAATACCATATTTTTGAAAAAGCCGTTTCTGTAATGAAGGAGAAAACTCACCGAGGCAGTTCCATAGGATGGCAAGATCCTGGTATCGGTCTGCGATTCCGACTCGTCCAACATCAATACAACCTATTAATTTCCCCTCGTCAAAAATAAGGTTATCAAGTGAGAAATCACCATGAGTGACGACTGAATCCGGTGAGAATGGCAAAAGTTTATGCATTTCTTTCCAGACTTGTTCAACAGGCCAGCCATTACGCTCGTCATCAAAATCACTCGCATCAACCAAACCGTTATTCATTCGTGATTGCGCCTGAGCGAGACGAAATACGCGATCGCTGTTAAAAGGACAATTACAAACAGGAATCGAATGCAACCGGCGCAGGAACACTGCCAGCGCATCAACAATATTTTCACCTGAATCAGGATATTCTTCTAATACCTGGAATGCTGTTTTCCCGGGGATCGCAGTGGTGAGTAACCATGCATCATCAGGAGTACGGATAAAATGCTTGATGGTCGGAAGAGGCATAAATTCCGTCAGCCAGTTTAGTCTGACCATCTCATCTGTAACATCATTGGCAACGCTACCTTTGCCATGTTTCAGAAACAACTCTGGCGCATCGGGCTTCCCATACAATCGATAGATTGTCGCACCTGATTGCCCGACATTATCGCGAGCCCATTTATACCCATATAAATCAGCATCCATGTTGGAATTTAATCGCGGCCTAGAGCAAGACGTTTCCCGTTGAATATGGCTCATAACACCCCTTGTATTACTGTTTATGTAAGCAGACAGTTTTATTGTTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATCGGCGATAATGGCCTGCTTCTCGCCGAAACGTTTGGTGGCGGGACCAGTGACGAAGGCTTGAGCGAGGGCGTGCAAGATTCCGAATACCGCAAGCGACAGGCCGATCATCGTCGCGCTCCAGCGAAAGCGGTCCTCGCCGAAAATGACCCAGAGCGCTGCCGGCACCTGTCCTACGAGTTGCATGATAAAGAAGACAGTCATAAGTGCGGCGACGATAGTCATGCCCCGCGCCCACCGGAAGGAGCTGACTGGGTTGAAGGCTCTCAAGGGCATCGGTCGAGATCCCGGTGCCTAATGAGTGAGCTAACTTACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCCAGGGTGGTTTTTCTTTTCACCAGTGAGACGGGCAACAGCTGATTGCCCTTCACCGCCTGGCCCTGAGAGAGTTGCAGCAAGCGGTCCACGCTGGTTTGCCCCAGCAGGCGAAAATCCTGTTTGATGGTGGTTAACGGCGGGATATAACATGAGCTGTCTTCGGTATCGTCGTATCCCACTACCGAGATATCCGCACCAACGCGCAGCCCGGACTCGGTAATGGCGCGCATTGCGCCCAGCGCCATCTGATCGTTGGCAACCAGCATCGCAGTGGGAACGATGCCCTCATTCAGCATTTGCATGGTTTGTTGAAAACCGGACATGGCACTCCAGTCGCCTTCCCGTTCCGCTATCGGCTGAATTTGATTGCGAGTGAGATATTTATGCCAGCCAGCCAGACGCAGACGCGCCGAGACAGAACTTAATGGGCCCGCTAACAGCGCGATTTGCTGGTGACCCAATGCGACCAGATGCTCCACGCCCAGTCGCGTACCGTCTTCATGGGAGAAAATAATACTGTTGATGGGTGTCTGGTCAGAGACATCAAGAAATAACGCCGGAACATTAGTGCAGGCAGCTTCCACAGCAATGGCATCCTGGTCATCCAGCGGATAGTTAATGATCAGCCCACTGACGCGTTGCGCGAGAAGATTGTGCACCGCCGCTTTACAGGCTTCGACGCCGCTTCGTTCTACCATCGACACCACCACGCTGGCACCCAGTTGATCGGCGCGAGATTTAATCGCCGCGACAATTTGCGACGGCGCGTGCAGGGCCAGACTGGAGGTGGCAACGCCAATCAGCAACGACTGTTTGCCCGCCAGTTGTTGTGCCACGCGGTTGGGAATGTAATTCAGCTCCGCCATCGCCGCTTCCACTTTTTCCCGCGTTTTCGCAGAAACGTGGCTGGCCTGGTTCACCACGCGGGAAACGGTCTGATAAGAGACACCGGCATACTCTGCGACATCGTATAACGTTACTGGTTTCACATTCACCACCCTGAATTGACTCTCTTCCGGGCGCTATCATGCCATACCGCGAAAGGTTTTGCGCCATTCGATGGTGTCCGGGATCTCGACGCTCTCCCTTATGCGACTCCTGCATTAGGAAGCAGCCCAGTAGTAGGTTGAGGCCGTTGAGCACCGCCGCCGCAAGGAATGGTGCATGCAAGGAGATGGCGCCCAACAGTCCCCCGGCCACGGGGCCTGCCACCATACCCACGCCGAAACAAGCGCTCATGAGCCCGAAGTGGCGAGCCCGATCTTCCCCATCGGTGATGTCGGCGATATAGGCGCCAGCAACCGCACCTGTGGCGCCGGTGATGCCGGCCACGATGCGTCCGGCGTAGAGGATCGAGATCTCGATCCCGCGAAATTAATACGACTCACTATAGGGGAATTGTGAGCGGATAACAATTCCCCTCAAGAAATAATTTTGTTTAACTTTAAGAAGGAGATATACATATgggatccatggagttcgttaacaaacagttcaactataaagacccagttaacggtgttgacattgcttacatcaaaatcccgaacgctggccagatgcagccggtaaaggcattcaaaatccacaacaaaatctgggttatcccggaacgtgatacctttactaacccggaagaaggtgacctgaacccgccaccggaagcgaaacaggtgccggtatcttactatgactccacctacctgtctaccgataacgaaaaggacaactacctgaaaggtgttactaaactgttcgagcgtatttactccaccgacctgggccgtatgctgctgactagcatcgttcgcggtatcccgttctggggcggttctaccatcgataccgaactgaaagtaatcgacactaactgcatcaacgttattcagccggacggttcctatcgttccgaagaactgaacctggtgatcatcggcccgtctgctgatatcatccagttcgagtgtaagagctttggtcacgaagttctgaacctcacccgtaacggctacggttccactcagtacatccgtttctctccggacttcaccttcggttttgaagaatccctggaagtagacacgaacccactgctgggcgctggtaaattcgcaactgatcctgcggttaccctggctcacgaactgattcatgcaggccaccgcctgtacggtatcgccatcaatccgaaccgtgtcttcaaagttaacaccaacgcgtattacgagatgtccggtctggaagttagcttcgaagaactgcgtacttttggcggtcacgacgctaaattcatcgactctctgcaagaaaacgagttccgtctgtactactataacaagttcaaagatatcgcatccaccctgaacaaagcgaaatccatcgtgggtaccactgcttctctccagtacatgaagaacgtttttaaagaaaaatacctgctcagcgaagacacctccggcaaattctctgtagacaagttgaaattcgataaactttacaaaatgctgactgaaatttacaccgaagacaacttcgttaagttctttaaagttctgaaccgcaaaacctatctgaacttcgacaaggcagtattcaaaatcaacatcgtgccgaaagttaactacactatctacgatggtttcaacctgcgtaacaccaacctggctgctaattttaacggccagaacacggaaatcaacaacatgaacttcacaaaactgaaaaacttcactggtctgttcgagttttacaagctgctgtgcgtcgacggcatcattacctccaaaactaaatctctgatagaaggtagaaacaaagcgctgaacctgcagtgtatcaaggttaacaactgggatttattcttcagcccgagtgaagacaacttcaccaacgacctgaacaaaggtgaagaaatcacctcagatactaacatcgaagcagccgaagaaaacatctcgctggacctgatccagcagtactacctgacctttaatttcgacaacgagccggaaaacatttctatcgaaaacctgagctctgatatcatcggccagctggaactgatgccgaacatcgaacgtttcccaaacggtaaaaagtacgagctggacaaatataccatgttccactacctgcgcgcgcaggaatttgaacacggcaaatcccgtatcgcactgactaactccgttaacgaagctctgctcaacccgtcccgtgtatacaccttcttctctagcgactacgtgaaaaaggtcaacaaagcgactgaagctgcaatgttcttgggttgggttgaacagcttgtttatgattttaccgacgagacgtccgaagtatctactaccgacaaaattgcggatatcactatcatcatcccgtacatcggtccggctctgaacattggcaacatgctgtacaaagacgacttcgttggcgcactgatcttctccggtgcggtgatcctgctggagttcatcccggaaatcgccatcccggtactgggcacctttgctctggtttcttacattgcaaacaaggttctgactgtacaaaccatcgacaacgcgctgagcaaacgtaacgaaaaatgggatgaagtttacaaatatatcgtgaccaactggctggctaaggttaatactcagatcgacctcatccgcaaaaaaatgaaagaagcactggaaaaccaggcggaagctaccaaggcaatcattaactaccagtacaaccagtacaccgaggaagaaaaaaacaacatcaacttcaacatcgacgatctgtcctctaaactgaacgaatccatcaacaaagctatgatcaacatcaacaagttcctgaaccagtgctctgtaagctatctgatgaactccatgatcccgtacggtgttaaacgtctggaggacttcgatgcgtctctgaaagacgccctgctgaaatacatttacgacaaccgtggcactctgatcggtcaggttgatcgtctgaaggacaaagtgaacaataccttatcgaccgacatcccttttcagctcagtaaatatgtcgataaccaacgccttttgtccactctagaaggcggTGGCGGTAGCGGTGGCGGTGGCAGCGGCGGTGGCGGTAGCGCACTAGacAACAGCGACCCTAAATGCCCACTgAGTCATGAAGGATACTGCCTTAATGATGGTGTTTGTATGTACATAGGAACATTGGACCGTTATGCTTGCAATTGTGTAGTGGGCTATGTCGGGGAAAGGTGTCAATATCGAGATCTCAAGCTGGCAGAGTTAAGAgggctagaagcaCACCATCATCACcaccatcaccatcaccattaatgaAAGCTTGCGGCCGCACTCGAGCACCACCACCACCACCACTGAGATCCGGCTGCTAACAAAGCCCGAAAGGAAGCTGAGTTGGCTGCTGCCACCGCTGAGCAATAACTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTTTGCTGAAAGGAGGAACTATATCCGGAT

SEQ ID NO:6-EGF-配体多肽的多肽序列

MEFVNKQFNYKDPVNGVDIAYIKIPNAGQMQPVKAFKIHNKIWVIPERDTFTNPEEGDLNPPPEAKQVPVSYYDSTYLSTDNEKDNYLKGVTKLFERIYSTDLGRMLLTSIVRGIPFWGGSTIDTELKVIDTNCINVIQPDGSYRSEELNLVIIGPSADIIQFECKSFGHEVLNLTRNGYGSTQYIRFSPDFTFGFEESLEVDTNPLLGAGKFATDPAVTLAHELIHAGHRLYGIAINPNRVFKVNTNAYYEMSGLEVSFEELRTFGGHDAKFIDSLQENEFRLYYYNKFKDIASTLNKAKSIVGTTASLQYMKNVFKEKYLLSEDTSGKFSVDKLKFDKLYKMLTEIYTEDNFVKFFKVLNRKTYLNFDKAVFKINIVPKVNYTIYDGFNLRNTNLAANFNGQNTEINNMNFTKLKNFTGLFEFYKLLCVDGIITSKTKSLIEGRNKALNLQCIKVNNWDLFFSPSEDNFTNDLNKGEEITSDTNIEAAEENISLDLIQQYYLTFNFDNEPENISIENLSSDIIGQLELMPNIERFPNGKKYELDKYTMFHYLRAQEFEHGKSRIALTNSVNEALLNPSRVYTFFSSDYVKKVNKATEAAMFLGWVEQLVYDFTDETSEVSTTDKIADITIIIPYIGPALNIGNMLYKDDFVGALIFSGAVILLEFIPEIAIPVLGTFALVSYIANKVLTVQTIDNALSKRNEKWDEVYKYIVTNWLAKVNTQIDLIRKKMKEALENQAEATKAIINYQYNQYTEEEKNNINFNIDDLSSKLNESINKAMININKFLNQCSVSYLMNSMIPYGVKRLEDFDASLKDALLKYIYDNRGTLIGQVDRLKDKVNNTLSTDIPFQLSKYVDNQRLLSTLEGGGGSGGGGSGGGGSALDNSDPKCPLSHEGYCLNDGVCMYIGTLDRYACNCVVGYVGERCQYRDLKLAELRGLEAHHHHHHHHHH

SEQ ID NO:7-痛敏肽-配体多肽的核苷酸序列

TGGCGAATGGGACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTAGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGTCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGCTTACAATTTAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAATTAATTCTTAGAAAAACTCATCGAGCATCAAATGAAACTGCAATTTATTCATATCAGGATTATCAATACCATATTTTTGAAAAAGCCGTTTCTGTAATGAAGGAGAAAACTCACCGAGGCAGTTCCATAGGATGGCAAGATCCTGGTATCGGTCTGCGATTCCGACTCGTCCAACATCAATACAACCTATTAATTTCCCCTCGTCAAAAATAAGGTTATCAAGTGAGAAATCACCATGAGTGACGACTGAATCCGGTGAGAATGGCAAAAGTTTATGCATTTCTTTCCAGACTTGTTCAACAGGCCAGCCATTACGCTCGTCATCAAAATCACTCGCATCAACCAAACCGTTATTCATTCGTGATTGCGCCTGAGCGAGACGAAATACGCGATCGCTGTTAAAAGGACAATTACAAACAGGAATCGAATGCAACCGGCGCAGGAACACTGCCAGCGCATCAACAATATTTTCACCTGAATCAGGATATTCTTCTAATACCTGGAATGCTGTTTTCCCGGGGATCGCAGTGGTGAGTAACCATGCATCATCAGGAGTACGGATAAAATGCTTGATGGTCGGAAGAGGCATAAATTCCGTCAGCCAGTTTAGTCTGACCATCTCATCTGTAACATCATTGGCAACGCTACCTTTGCCATGTTTCAGAAACAACTCTGGCGCATCGGGCTTCCCATACAATCGATAGATTGTCGCACCTGATTGCCCGACATTATCGCGAGCCCATTTATACCCATATAAATCAGCATCCATGTTGGAATTTAATCGCGGCCTAGAGCAAGACGTTTCCCGTTGAATATGGCTCATAACACCCCTTGTATTACTGTTTATGTAAGCAGACAGTTTTATTGTTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATCGGCGATAATGGCCTGCTTCTCGCCGAAACGTTTGGTGGCGGGACCAGTGACGAAGGCTTGAGCGAGGGCGTGCAAGATTCCGAATACCGCAAGCGACAGGCCGATCATCGTCGCGCTCCAGCGAAAGCGGTCCTCGCCGAAAATGACCCAGAGCGCTGCCGGCACCTGTCCTACGAGTTGCATGATAAAGAAGACAGTCATAAGTGCGGCGACGATAGTCATGCCCCGCGCCCACCGGAAGGAGCTGACTGGGTTGAAGGCTCTCAAGGGCATCGGTCGAGATCCCGGTGCCTAATGAGTGAGCTAACTTACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCCAGGGTGGTTTTTCTTTTCACCAGTGAGACGGGCAACAGCTGATTGCCCTTCACCGCCTGGCCCTGAGAGAGTTGCAGCAAGCGGTCCACGCTGGTTTGCCCCAGCAGGCGAAAATCCTGTTTGATGGTGGTTAACGGCGGGATATAACATGAGCTGTCTTCGGTATCGTCGTATCCCACTACCGAGATATCCGCACCAACGCGCAGCCCGGACTCGGTAATGGCGCGCATTGCGCCCAGCGCCATCTGATCGTTGGCAACCAGCATCGCAGTGGGAACGATGCCCTCATTCAGCATTTGCATGGTTTGTTGAAAACCGGACATGGCACTCCAGTCGCCTTCCCGTTCCGCTATCGGCTGAATTTGATTGCGAGTGAGATATTTATGCCAGCCAGCCAGACGCAGACGCGCCGAGACAGAACTTAATGGGCCCGCTAACAGCGCGATTTGCTGGTGACCCAATGCGACCAGATGCTCCACGCCCAGTCGCGTACCGTCTTCATGGGAGAAAATAATACTGTTGATGGGTGTCTGGTCAGAGACATCAAGAAATAACGCCGGAACATTAGTGCAGGCAGCTTCCACAGCAATGGCATCCTGGTCATCCAGCGGATAGTTAATGATCAGCCCACTGACGCGTTGCGCGAGAAGATTGTGCACCGCCGCTTTACAGGCTTCGACGCCGCTTCGTTCTACCATCGACACCACCACGCTGGCACCCAGTTGATCGGCGCGAGATTTAATCGCCGCGACAATTTGCGACGGCGCGTGCAGGGCCAGACTGGAGGTGGCAACGCCAATCAGCAACGACTGTTTGCCCGCCAGTTGTTGTGCCACGCGGTTGGGAATGTAATTCAGCTCCGCCATCGCCGCTTCCACTTTTTCCCGCGTTTTCGCAGAAACGTGGCTGGCCTGGTTCACCACGCGGGAAACGGTCTGATAAGAGACACCGGCATACTCTGCGACATCGTATAACGTTACTGGTTTCACATTCACCACCCTGAATTGACTCTCTTCCGGGCGCTATCATGCCATACCGCGAAAGGTTTTGCGCCATTCGATGGTGTCCGGGATCTCGACGCTCTCCCTTATGCGACTCCTGCATTAGGAAGCAGCCCAGTAGTAGGTTGAGGCCGTTGAGCACCGCCGCCGCAAGGAATGGTGCATGCAAGGAGATGGCGCCCAACAGTCCCCCGGCCACGGGGCCTGCCACCATACCCACGCCGAAACAAGCGCTCATGAGCCCGAAGTGGCGAGCCCGATCTTCCCCATCGGTGATGTCGGCGATATAGGCGCCAGCAACCGCACCTGTGGCGCCGGTGATGCCGGCCACGATGCGTCCGGCGTAGAGGATCGAGATCTCGATCCCGCGAAATTAATACGACTCACTATAGGGGAATTGTGAGCGGATAACAATTCCCCTCAAGAAATAATTTTGTTTAACTTTAAGAAGGAGATATACATATGGGCAGCATGGAATTTGTGAACAAACAGTTCAACTATAAGGATCCGGTTAATGGTGTGGATATCGCCTATATCAAAATTCCGAATGCAGGTCAGATGCAGCCGGTTAAAGCCTTTAAAATCCATAACAAAATTTGGGTGATTCCGGAACGTGATACCTTTACCAATCCGGAAGAAGGTGATCTGAATCCGCCTCCGGAAGCAAAACAGGTTCCGGTTAGCTATTATGATAGCACCTATCTGAGCACCGATAACGAGAAAGATAACTATCTGAAAGGTGTGACCAAACTGTTTGAACGCATTTATAGTACCGATCTGGGTCGTATGCTGCTGACCAGCATTGTTCGTGGTATTCCGTTTTGGGGTGGTAGCACCATTGATACCGAACTGAAAGTTATTGACACCAACTGCATTAATGTGATTCAGCCGGATGGTAGCTATCGTAGCGAAGAACTGAATCTGGTTATTATTGGTCCGAGCGCAGATATCATTCAGTTTGAATGTAAATCCTTTGGCCACGAAGTTCTGAATCTGACCCGTAATGGTTATGGTAGTACCCAGTATATTCGTTTCAGTCCGGATTTTACCTTTGGCTTTGAAGAAAGCCTGGAAGTTGATACAAATCCGCTGTTAGGTGCAGGTAAATTTGCAACCGATCCGGCAGTTACCCTGGCACATGAACTGATTCATGCCGGTCATCGTCTGTATGGTATTGCAATTAATCCGAACCGTGTGTTCAAAGTGAATACCAACGCATATTATGAAATGAGCGGTCTGGAAGTGTCATTTGAAGAACTGCGTACCTTTGGTGGTCATGATGCCAAATTTATCGATAGCCTGCAAGAAAATGAATTTCGCCTGTACTACTATAACAAATTCAAGGATATTGCGAGCACCCTGAATAAAGCCAAAAGCATTGTTGGCACCACCGCAAGCCTGCAGTATATGAAAAATGTGTTTAAAGAAAAATATCTGCTGAGCGAAGATACCAGCGGTAAATTTAGCGTTGACAAACTGAAATTCGATAAACTGTACAAGATGCTGACCGAGATTTATACCGAAGATAACTTCGTGAAGTTTTTCAAAGTGCTGAACCGCAAAACCTACCTGAACTTTGATAAAGCCGTGTTCAAAATCAACATCGTGCCGAAAGTGAACTATACCATCTATGATGGTTTTAACCTGCGCAATACCAATCTGGCAGCAAACTTTAATGGTCAGAACACCGAAATCAACAACATGAACTTTACCAAACTGAAGAACTTCACCGGTCTGTTCGAATTTTACAAACTGCTGTGTGTGGATGGCATTATTACCAGCAAAACCAAATCCGATGATGACGATAAATTCGGTGGTTTTACCGGTGCACGTAAAAGCGCACGTAAACGTAAAAATCAGGCACTGGCAGGCGGTGGTGGTAGCGGTGGCGGTGGTTCAGGTGGTGGTGGCTCAGCACTGGTTCTGCAGTGTATTAAAGTTAATAACTGGGACCTGTTTTTTAGCCCGAGCGAGGATAATTTCACCAACGATCTGAACAAAGGCGAAGAAATTACCAGCGATACCAATATTGAAGCAGCCGAAGAAAACATTAGCCTGGATCTGATTCAGCAGTATTATCTGACCTTCAACTTCGATAATGAGCCGGAAAATATCAGCATTGAAAACCTGAGCAGCGATATTATTGGCCAGCTGGAACTGATGCCGAATATTGAACGTTTTCCGAACGGCAAAAAATACGAGCTGGATAAATACACCATGTTCCATTATCTGCGTGCCCAAGAATTTGAACATGGTAAAAGCCGTATTGCACTGACCAATAGCGTTAATGAAGCACTGCTGAACCCGAGCCGTGTTTATACCTTTTTTAGCAGCGATTACGTGAAAAAGGTTAACAAAGCAACCGAAGCAGCCATGTTTTTAGGTTGGGTTGAACAGCTGGTTTATGATTTCACCGATGAAACCAGCGAAGTTAGCACCACCGATAAAATTGCAGATATTACCATCATCATCCCGTATATCGGTCCGGCACTGAATATTGGCAATATGCTGTATAAAGACGATTTTGTGGGTGCCCTGATCTTTAGCGGTGCAGTTATTCTGCTGGAATTTATTCCGGAAATTGCCATTCCGGTTCTGGGCACCTTTGCACTGGTGAGCTATATTGCAAATAAAGTTCTGACCGTGCAGACCATCGATAATGCACTGAGCAAACGTAACGAAAAATGGGATGAAGTGTACAAGTATATCGTGACCAATTGGCTGGCAAAAGTTAACACCCAGATTGACCTGATTCGCAAGAAGATGAAAGAAGCACTGGAAAACCAGGCAGAAGCAACCAAAGCCATTATTAACTATCAGTACAACCAGTACACCGAAGAAGAGAAGAATAACATCAACTTCAACATCGATGATCTGAGCAGCAAGCTGAATGAAAGCATCAACAAAGCCATGATCAACATTAACAAATTTCTGAATCAGTGCAGCGTGAGCTATCTGATGAATAGCATGATTCCGTATGGTGTGAAACGTCTGGAAGATTTTGATGCAAGCCTGAAAGATGCCCTGCTGAAATATATCTATGATAATCGTGGCACCCTGATTGGTCAGGTTGATCGTCTGAAAGATAAAGTGAACAACACCCTGAGTACCGATATTCCTTTTCAGCTGAGCAAATATGTGGATAATCAGCGTCTGCTGAGTACCCTGGATCATCATCACCATCACCACTAAAAGCTTGCGGCCGCACTCGAGCACCACCACCACCACCACTGAGATCCGGCTGCTAACAAAGCCCGAAAGGAAGCTGAGTTGGCTGCTGCCACCGCTGAGCAATAACTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTTTGCTGAAAGGAGGAACTATATCCGGAT

SEQ ID NO:8-痛敏肽-配体多肽的多肽序列

MGSMEFVNKQFNYKDPVNGVDIAYIKIPNAGQMQPVKAFKIHNKIWVIPERDTFTNPEEGDLNPPPEAKQVPVSYYDSTYLSTDNEKDNYLKGVTKLFERIYSTDLGRMLLTSIVRGIPFWGGSTIDTELKVIDTNCINVIQPDGSYRSEELNLVIIGPSADIIQFECKSFGHEVLNLTRNGYGSTQYIRFSPDFTFGFEESLEVDTNPLLGAGKFATDPAVTLAHELIHAGHRLYGIAINPNRVFKVNTNAYYEMSGLEVSFEELRTFGGHDAKFIDSLQENEFRLYYYNKFKDIASTLNKAKSIVGTTASLQYMKNVFKEKYLLSEDTSGKFSVDKLKFDKLYKMLTEIYTEDNFVKFFKVLNRKTYLNFDKAVFKINIVPKVNYTIYDGFNLRNTNLAANFNGQNTEINNMNFTKLKNFTGLFEFYKLLCVDGIITSKTKSDDDDKFGGFTGARKSARKRKNQALAGGGGSGGGGSGGGGSALVLQCIKVNNWDLFFSPSEDNFTNDLNKGEEITSDTNIEAAEENISLDLIQQYYLTFNFDNEPENISIENLSSDIIGQLELMPNIERFPNGKKYELDKYTMFHYLRAQEFEHGKSRIALTNSVNEALLNPSRVYTFFSSDYVKKVNKATEAAMFLGWVEQLVYDFTDETSEVSTTDKIADITIIIPYIGPALNIGNMLYKDDFVGALIFSGAVILLEFIPEIAIPVLGTFALVSYIANKVLTVQTIDNALSKRNEKWDEVYKYIVTNWLAKVNTQIDLIRKKMKEALENQAEATKAIINYQYNQYTEEEKNNINFNIDDLSSKLNESINKAMININKFLNQCSVSYLMNSMIPYGVKRLEDFDASLKDALLKYIYDNRGTLIGQVDRLKDKVNNTLSTDIPFQLSKYVDNQRLLSTLDHHHHHH

SEQ ID NO:9–GFP标签的EGF-配体多肽的核苷酸序列

TGGCGAATGGGACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTAGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGTCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGCTTACAATTTAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAATTAATTCTTAGAAAAACTCATCGAGCATCAAATGAAACTGCAATTTATTCATATCAGGATTATCAATACCATATTTTTGAAAAAGCCGTTTCTGTAATGAAGGAGAAAACTCACCGAGGCAGTTCCATAGGATGGCAAGATCCTGGTATCGGTCTGCGATTCCGACTCGTCCAACATCAATACAACCTATTAATTTCCCCTCGTCAAAAATAAGGTTATCAAGTGAGAAATCACCATGAGTGACGACTGAATCCGGTGAGAATGGCAAAAGTTTATGCATTTCTTTCCAGACTTGTTCAACAGGCCAGCCATTACGCTCGTCATCAAAATCACTCGCATCAACCAAACCGTTATTCATTCGTGATTGCGCCTGAGCGAGACGAAATACGCGATCGCTGTTAAAAGGACAATTACAAACAGGAATCGAATGCAACCGGCGCAGGAACACTGCCAGCGCATCAACAATATTTTCACCTGAATCAGGATATTCTTCTAATACCTGGAATGCTGTTTTCCCGGGGATCGCAGTGGTGAGTAACCATGCATCATCAGGAGTACGGATAAAATGCTTGATGGTCGGAAGAGGCATAAATTCCGTCAGCCAGTTTAGTCTGACCATCTCATCTGTAACATCATTGGCAACGCTACCTTTGCCATGTTTCAGAAACAACTCTGGCGCATCGGGCTTCCCATACAATCGATAGATTGTCGCACCTGATTGCCCGACATTATCGCGAGCCCATTTATACCCATATAAATCAGCATCCATGTTGGAATTTAATCGCGGCCTAGAGCAAGACGTTTCCCGTTGAATATGGCTCATAACACCCCTTGTATTACTGTTTATGTAAGCAGACAGTTTTATTGTTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATCGGCGATAATGGCCTGCTTCTCGCCGAAACGTTTGGTGGCGGGACCAGTGACGAAGGCTTGAGCGAGGGCGTGCAAGATTCCGAATACCGCAAGCGACAGGCCGATCATCGTCGCGCTCCAGCGAAAGCGGTCCTCGCCGAAAATGACCCAGAGCGCTGCCGGCACCTGTCCTACGAGTTGCATGATAAAGAAGACAGTCATAAGTGCGGCGACGATAGTCATGCCCCGCGCCCACCGGAAGGAGCTGACTGGGTTGAAGGCTCTCAAGGGCATCGGTCGAGATCCCGGTGCCTAATGAGTGAGCTAACTTACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCCAGGGTGGTTTTTCTTTTCACCAGTGAGACGGGCAACAGCTGATTGCCCTTCACCGCCTGGCCCTGAGAGAGTTGCAGCAAGCGGTCCACGCTGGTTTGCCCCAGCAGGCGAAAATCCTGTTTGATGGTGGTTAACGGCGGGATATAACATGAGCTGTCTTCGGTATCGTCGTATCCCACTACCGAGATATCCGCACCAACGCGCAGCCCGGACTCGGTAATGGCGCGCATTGCGCCCAGCGCCATCTGATCGTTGGCAACCAGCATCGCAGTGGGAACGATGCCCTCATTCAGCATTTGCATGGTTTGTTGAAAACCGGACATGGCACTCCAGTCGCCTTCCCGTTCCGCTATCGGCTGAATTTGATTGCGAGTGAGATATTTATGCCAGCCAGCCAGACGCAGACGCGCCGAGACAGAACTTAATGGGCCCGCTAACAGCGCGATTTGCTGGTGACCCAATGCGACCAGATGCTCCACGCCCAGTCGCGTACCGTCTTCATGGGAGAAAATAATACTGTTGATGGGTGTCTGGTCAGAGACATCAAGAAATAACGCCGGAACATTAGTGCAGGCAGCTTCCACAGCAATGGCATCCTGGTCATCCAGCGGATAGTTAATGATCAGCCCACTGACGCGTTGCGCGAGAAGATTGTGCACCGCCGCTTTACAGGCTTCGACGCCGCTTCGTTCTACCATCGACACCACCACGCTGGCACCCAGTTGATCGGCGCGAGATTTAATCGCCGCGACAATTTGCGACGGCGCGTGCAGGGCCAGACTGGAGGTGGCAACGCCAATCAGCAACGACTGTTTGCCCGCCAGTTGTTGTGCCACGCGGTTGGGAATGTAATTCAGCTCCGCCATCGCCGCTTCCACTTTTTCCCGCGTTTTCGCAGAAACGTGGCTGGCCTGGTTCACCACGCGGGAAACGGTCTGATAAGAGACACCGGCATACTCTGCGACATCGTATAACGTTACTGGTTTCACATTCACCACCCTGAATTGACTCTCTTCCGGGCGCTATCATGCCATACCGCGAAAGGTTTTGCGCCATTCGATGGTGTCCGGGATCTCGACGCTCTCCCTTATGCGACTCCTGCATTAGGAAGCAGCCCAGTAGTAGGTTGAGGCCGTTGAGCACCGCCGCCGCAAGGAATGGTGCATGCAAGGAGATGGCGCCCAACAGTCCCCCGGCCACGGGGCCTGCCACCATACCCACGCCGAAACAAGCGCTCATGAGCCCGAAGTGGCGAGCCCGATCTTCCCCATCGGTGATGTCGGCGATATAGGCGCCAGCAACCGCACCTGTGGCGCCGGTGATGCCGGCCACGATGCGTCCGGCGTAGAGGATCGAGATCTCGATCCCGCGAAATTAATACGACTCACTATAGGGGAATTGTGAGCGGATAACAATTCCCCTCAAGAAATAATTTTGTTTAACTTTAAGAAGGAGATATACATATgATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCACGGCATGGACGAGCTGTACAAGGGCGGCAGCGGCGGCGGCAGCGGCGGCggatccatggagttcgttaacaaacagttcaactataaagacccagttaacggtgttgacattgcttacatcaaaatcccgaacgctggccagatgcagccggtaaaggcattcaaaatccacaacaaaatctgggttatcccggaacgtgatacctttactaacccggaagaaggtgacctgaacccgccaccggaagcgaaacaggtgccggtatcttactatgactccacctacctgtctaccgataacgaaaaggacaactacctgaaaggtgttactaaactgttcgagcgtatttactccaccgacctgggccgtatgctgctgactagcatcgttcgcggtatcccgttctggggcggttctaccatcgataccgaactgaaagtaatcgacactaactgcatcaacgttattcagccggacggttcctatcgttccgaagaactgaacctggtgatcatcggcccgtctgctgatatcatccagttcgagtgtaagagctttggtcacgaagttctgaacctcacccgtaacggctacggttccactcagtacatccgtttctctccggacttcaccttcggttttgaagaatccctggaagtagacacgaacccactgctgggcgctggtaaattcgcaactgatcctgcggttaccctggctcacgaactgattcatgcaggccaccgcctgtacggtatcgccatcaatccgaaccgtgtcttcaaagttaacaccaacgcgtattacgagatgtccggtctggaagttagcttcgaagaactgcgtacttttggcggtcacgacgctaaattcatcgactctctgcaagaaaacgagttccgtctgtactactataacaagttcaaagatatcgcatccaccctgaacaaagcgaaatccatcgtgggtaccactgcttctctccagtacatgaagaacgtttttaaagaaaaatacctgctcagcgaagacacctccggcaaattctctgtagacaagttgaaattcgataaactttacaaaatgctgactgaaatttacaccgaagacaacttcgttaagttctttaaagttctgaaccgcaaaacctatctgaacttcgacaaggcagtattcaaaatcaacatcgtgccgaaagttaactacactatctacgatggtttcaacctgcgtaacaccaacctggctgctaattttaacggccagaacacggaaatcaacaacatgaacttcacaaaactgaaaaacttcactggtctgttcgagttttacaagctgctgtgcgtcgacggcatcattacctccaaaactaaatctctgatagaaggtagaaacaaagcgctgaacctgcagtgtatcaaggttaacaactgggatttattcttcagcccgagtgaagacaacttcaccaacgacctgaacaaaggtgaagaaatcacctcagatactaacatcgaagcagccgaagaaaacatctcgctggacctgatccagcagtactacctgacctttaatttcgacaacgagccggaaaacatttctatcgaaaacctgagctctgatatcatcggccagctggaactgatgccgaacatcgaacgtttcccaaacggtaaaaagtacgagctggacaaatataccatgttccactacctgcgcgcgcaggaatttgaacacggcaaatcccgtatcgcactgactaactccgttaacgaagctctgctcaacccgtcccgtgtatacaccttcttctctagcgactacgtgaaaaaggtcaacaaagcgactgaagctgcaatgttcttgggttgggttgaacagcttgtttatgattttaccgacgagacgtccgaagtatctactaccgacaaaattgcggatatcactatcatcatcccgtacatcggtccggctctgaacattggcaacatgctgtacaaagacgacttcgttggcgcactgatcttctccggtgcggtgatcctgctggagttcatcccggaaatcgccatcccggtactgggcacctttgctctggtttcttacattgcaaacaaggttctgactgtacaaaccatcgacaacgcgctgagcaaacgtaacgaaaaatgggatgaagtttacaaatatatcgtgaccaactggctggctaaggttaatactcagatcgacctcatccgcaaaaaaatgaaagaagcactggaaaaccaggcggaagctaccaaggcaatcattaactaccagtacaaccagtacaccgaggaagaaaaaaacaacatcaacttcaacatcgacgatctgtcctctaaactgaacgaatccatcaacaaagctatgatcaacatcaacaagttcctgaaccagtgctctgtaagctatctgatgaactccatgatcccgtacggtgttaaacgtctggaggacttcgatgcgtctctgaaagacgccctgctgaaatacatttacgacaaccgtggcactctgatcggtcaggttgatcgtctgaaggacaaagtgaacaataccttatcgaccgacatcccttttcagctcagtaaatatgtcgataaccaacgccttttgtccactctagaaggcggTGGCGGTAGCGGTGGCGGTGGCAGCGGCGGTGGCGGTAGCGCACTAGacAACAGCGACCCTAAATGCCCACTaAGTCATGAAGGATACTGCCTTAATGATGGTGTTTGTATGTACATAGGAACATTGGACCGTTATGCTTGCAATTGTGTAGTGGGCTATGTCGGGGAAAGGTGTCAATATCGAGATCTCAAGCTGGCAGAGTTAAGAgggctagaagcaCACCATCATCACcaccatcaccatcaccattaatgaAAGCTTGCGGCCGCACTCGAGCACCACCACCACCACCACTGAGATCCGGCTGCTAACAAAGCCCGAAAGGAAGCTGAGTTGGCTGCTGCCACCGCTGAGCAATAACTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTTTGCTGAAAGGAGGAACTATATCCGGAT

SEQ ID NO:10–GFP标签的EGF-配体多肽的多肽序列

MVSKGEELFTGVVPILVELDGDVNGHKFSVSGEGEGDATYGKLTLKFICTTGKLPVPWPTLVTTLTYGVQCFSRYPDHMKQHDFFKSAMPEGYVQERTIFFKDDGNYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNYNSHNVYIMADKQKNGIKVNFKIRHNIEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQSALSKDPNEKRDHMVLLEFVTAAGITHGMDELYKGGSGGGSGGGSMEFVNKQFNYKDPVNGVDIAYIKIPNAGQMQPVKAFKIHNKIWVIPERDTFTNPEEGDLNPPPEAKQVPVSYYDSTYLSTDNEKDNYLKGVTKLFERIYSTDLGRMLLTSIVRGIPFWGGSTIDTELKVIDTNCINVIQPDGSYRSEELNLVIIGPSADIIQFECKSFGHEVLNLTRNGYGSTQYIRFSPDFTFGFEESLEVDTNPLLGAGKFATDPAVTLAHELIHAGHRLYGIAINPNRVFKVNTNAYYEMSGLEVSFEELRTFGGHDAKFIDSLQENEFRLYYYNKFKDIASTLNKAKSIVGTTASLQYMKNVFKEKYLLSEDTSGKFSVDKLKFDKLYKMLTEIYTEDNFVKFFKVLNRKTYLNFDKAVFKINIVPKVNYTIYDGFNLRNTNLAANFNGQNTEINNMNFTKLKNFTGLFEFYKLLCVDGIITSKTKSLIEGRNKALNLQCIKVNNWDLFFSPSEDNFTNDLNKGEEITSDTNIEAAEENISLDLIQQYYLTFNFDNEPENISIENLSSDIIGQLELMPNIERFPNGKKYELDKYTMFHYLRAQEFEHGKSRIALTNSVNEALLNPSRVYTFFSSDYVKKVNKATEAAMFLGWVEQLVYDFTDETSEVSTTDKIADITIIIPYIGPALNIGNMLYKDDFVGALIFSGAVILLEFIPEIAIPVLGTFALVSYIANKVLTVQTIDNALSKRNEKWDEVYKYIVTNWLAKVNTQIDLIRKKMKEALENQAEATKAIINYQYNQYTEEEKNNINFNIDDLSSKLNESINKAMININKFLNQCSVSYLMNSMIPYGVKRLEDFDASLKDALLKYIYDNRGTLIGQVDRLKDKVNNTLSTDIPFQLSKYVDNQRLLSTLEGGGGSGGGGSGGGGSALDNSDPKCPLSHEGYCLNDGVCMYIGTLDRYACNCVVGYVGERCQYRDLKLAELRGLEAHHHHHHHHHH

SEQ ID NO:11–SNAP标签的EGF-配体多肽的核苷酸序列

TGGCGAATGGGACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTAGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGTCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGCTTACAATTTAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAATTAATTCTTAGAAAAACTCATCGAGCATCAAATGAAACTGCAATTTATTCATATCAGGATTATCAATACCATATTTTTGAAAAAGCCGTTTCTGTAATGAAGGAGAAAACTCACCGAGGCAGTTCCATAGGATGGCAAGATCCTGGTATCGGTCTGCGATTCCGACTCGTCCAACATCAATACAACCTATTAATTTCCCCTCGTCAAAAATAAGGTTATCAAGTGAGAAATCACCATGAGTGACGACTGAATCCGGTGAGAATGGCAAAAGTTTATGCATTTCTTTCCAGACTTGTTCAACAGGCCAGCCATTACGCTCGTCATCAAAATCACTCGCATCAACCAAACCGTTATTCATTCGTGATTGCGCCTGAGCGAGACGAAATACGCGATCGCTGTTAAAAGGACAATTACAAACAGGAATCGAATGCAACCGGCGCAGGAACACTGCCAGCGCATCAACAATATTTTCACCTGAATCAGGATATTCTTCTAATACCTGGAATGCTGTTTTCCCGGGGATCGCAGTGGTGAGTAACCATGCATCATCAGGAGTACGGATAAAATGCTTGATGGTCGGAAGAGGCATAAATTCCGTCAGCCAGTTTAGTCTGACCATCTCATCTGTAACATCATTGGCAACGCTACCTTTGCCATGTTTCAGAAACAACTCTGGCGCATCGGGCTTCCCATACAATCGATAGATTGTCGCACCTGATTGCCCGACATTATCGCGAGCCCATTTATACCCATATAAATCAGCATCCATGTTGGAATTTAATCGCGGCCTAGAGCAAGACGTTTCCCGTTGAATATGGCTCATAACACCCCTTGTATTACTGTTTATGTAAGCAGACAGTTTTATTGTTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATCGGCGATAATGGCCTGCTTCTCGCCGAAACGTTTGGTGGCGGGACCAGTGACGAAGGCTTGAGCGAGGGCGTGCAAGATTCCGAATACCGCAAGCGACAGGCCGATCATCGTCGCGCTCCAGCGAAAGCGGTCCTCGCCGAAAATGACCCAGAGCGCTGCCGGCACCTGTCCTACGAGTTGCATGATAAAGAAGACAGTCATAAGTGCGGCGACGATAGTCATGCCCCGCGCCCACCGGAAGGAGCTGACTGGGTTGAAGGCTCTCAAGGGCATCGGTCGAGATCCCGGTGCCTAATGAGTGAGCTAACTTACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCCAGGGTGGTTTTTCTTTTCACCAGTGAGACGGGCAACAGCTGATTGCCCTTCACCGCCTGGCCCTGAGAGAGTTGCAGCAAGCGGTCCACGCTGGTTTGCCCCAGCAGGCGAAAATCCTGTTTGATGGTGGTTAACGGCGGGATATAACATGAGCTGTCTTCGGTATCGTCGTATCCCACTACCGAGATATCCGCACCAACGCGCAGCCCGGACTCGGTAATGGCGCGCATTGCGCCCAGCGCCATCTGATCGTTGGCAACCAGCATCGCAGTGGGAACGATGCCCTCATTCAGCATTTGCATGGTTTGTTGAAAACCGGACATGGCACTCCAGTCGCCTTCCCGTTCCGCTATCGGCTGAATTTGATTGCGAGTGAGATATTTATGCCAGCCAGCCAGACGCAGACGCGCCGAGACAGAACTTAATGGGCCCGCTAACAGCGCGATTTGCTGGTGACCCAATGCGACCAGATGCTCCACGCCCAGTCGCGTACCGTCTTCATGGGAGAAAATAATACTGTTGATGGGTGTCTGGTCAGAGACATCAAGAAATAACGCCGGAACATTAGTGCAGGCAGCTTCCACAGCAATGGCATCCTGGTCATCCAGCGGATAGTTAATGATCAGCCCACTGACGCGTTGCGCGAGAAGATTGTGCACCGCCGCTTTACAGGCTTCGACGCCGCTTCGTTCTACCATCGACACCACCACGCTGGCACCCAGTTGATCGGCGCGAGATTTAATCGCCGCGACAATTTGCGACGGCGCGTGCAGGGCCAGACTGGAGGTGGCAACGCCAATCAGCAACGACTGTTTGCCCGCCAGTTGTTGTGCCACGCGGTTGGGAATGTAATTCAGCTCCGCCATCGCCGCTTCCACTTTTTCCCGCGTTTTCGCAGAAACGTGGCTGGCCTGGTTCACCACGCGGGAAACGGTCTGATAAGAGACACCGGCATACTCTGCGACATCGTATAACGTTACTGGTTTCACATTCACCACCCTGAATTGACTCTCTTCCGGGCGCTATCATGCCATACCGCGAAAGGTTTTGCGCCATTCGATGGTGTCCGGGATCTCGACGCTCTCCCTTATGCGACTCCTGCATTAGGAAGCAGCCCAGTAGTAGGTTGAGGCCGTTGAGCACCGCCGCCGCAAGGAATGGTGCATGCAAGGAGATGGCGCCCAACAGTCCCCCGGCCACGGGGCCTGCCACCATACCCACGCCGAAACAAGCGCTCATGAGCCCGAAGTGGCGAGCCCGATCTTCCCCATCGGTGATGTCGGCGATATAGGCGCCAGCAACCGCACCTGTGGCGCCGGTGATGCCGGCCACGATGCGTCCGGCGTAGAGGATCGAGATCTCGATCCCGCGAAATTAATACGACTCACTATAGGGGAATTGTGAGCGGATAACAATTCCCCTCAAGAAATAATTTTGTTTAACTTTAAGAAGGAGATATACATATgATGGACAAAGACTGCGAAATGAAGCGCACCACCCTGGATAGCCCTCTGGGCAAGCTGGAACTGTCTGGGTGCGAACAGGGCCTGCACCGTATCATCTTCCTGGGCAAAGGAACATCTGCCGCCGACGCCGTGGAAGTGCCTGCCCCAGCCGCCGTGCTGGGCGGACCAGAGCCACTGATGCAGGCCACCGCCTGGCTCAACGCCTACTTTCACCAGCCTGAGGCCATCGAGGAGTTCCCTGTGCCAGCCCTGCACCACCCAGTGTTCCAGCAGGAGAGCTTTACCCGCCAGGTGCTGTGGAAACTGCTGAAAGTGGTGAAGTTCGGAGAGGTCATCAGCTACAGCCACCTGGCCGCCCTGGCCGGCAATCCCGCCGCCACCGCCGCCGTGAAAACCGCCCTGAGCGGAAATCCCGTGCCCATTCTGATCCCCTGCCACCGGGTGGTGCAGGGCGACCTGGACGTGGGGGGCTACGAGGGCGGGCTCGCCGTGAAAGAGTGGCTGCTGGCCCACGAGGGCCACAGACTGGGCAAGCCTGGGCTGGGTGGCGGCAGCGGCGGCGGCAGCGGCGGCggatccatggagttcgttaacaaacagttcaactataaagacccagttaacggtgttgacattgcttacatcaaaatcccgaacgctggccagatgcagccggtaaaggcattcaaaatccacaacaaaatctgggttatcccggaacgtgatacctttactaacccggaagaaggtgacctgaacccgccaccggaagcgaaacaggtgccggtatcttactatgactccacctacctgtctaccgataacgaaaaggacaactacctgaaaggtgttactaaactgttcgagcgtatttactccaccgacctgggccgtatgctgctgactagcatcgttcgcggtatcccgttctggggcggttctaccatcgataccgaactgaaagtaatcgacactaactgcatcaacgttattcagccggacggttcctatcgttccgaagaactgaacctggtgatcatcggcccgtctgctgatatcatccagttcgagtgtaagagctttggtcacgaagttctgaacctcacccgtaacggctacggttccactcagtacatccgtttctctccggacttcaccttcggttttgaagaatccctggaagtagacacgaacccactgctgggcgctggtaaattcgcaactgatcctgcggttaccctggctcacgaactgattcatgcaggccaccgcctgtacggtatcgccatcaatccgaaccgtgtcttcaaagttaacaccaacgcgtattacgagatgtccggtctggaagttagcttcgaagaactgcgtacttttggcggtcacgacgctaaattcatcgactctctgcaagaaaacgagttccgtctgtactactataacaagttcaaagatatcgcatccaccctgaacaaagcgaaatccatcgtgggtaccactgcttctctccagtacatgaagaacgtttttaaagaaaaatacctgctcagcgaagacacctccggcaaattctctgtagacaagttgaaattcgataaactttacaaaatgctgactgaaatttacaccgaagacaacttcgttaagttctttaaagttctgaaccgcaaaacctatctgaacttcgacaaggcagtattcaaaatcaacatcgtgccgaaagttaactacactatctacgatggtttcaacctgcgtaacaccaacctggctgctaattttaacggccagaacacggaaatcaacaacatgaacttcacaaaactgaaaaacttcactggtctgttcgagttttacaagctgctgtgcgtcgacggcatcattacctccaaaactaaatctctgatagaaggtagaaacaaagcgctgaacctgcagtgtatcaaggttaacaactgggatttattcttcagcccgagtgaagacaacttcaccaacgacctgaacaaaggtgaagaaatcacctcagatactaacatcgaagcagccgaagaaaacatctcgctggacctgatccagcagtactacctgacctttaatttcgacaacgagccggaaaacatttctatcgaaaacctgagctctgatatcatcggccagctggaactgatgccgaacatcgaacgtttcccaaacggtaaaaagtacgagctggacaaatataccatgttccactacctgcgcgcgcaggaatttgaacacggcaaatcccgtatcgcactgactaactccgttaacgaagctctgctcaacccgtcccgtgtatacaccttcttctctagcgactacgtgaaaaaggtcaacaaagcgactgaagctgcaatgttcttgggttgggttgaacagcttgtttatgattttaccgacgagacgtccgaagtatctactaccgacaaaattgcggatatcactatcatcatcccgtacatcggtccggctctgaacattggcaacatgctgtacaaagacgacttcgttggcgcactgatcttctccggtgcggtgatcctgctggagttcatcccggaaatcgccatcccggtactgggcacctttgctctggtttcttacattgcaaacaaggttctgactgtacaaaccatcgacaacgcgctgagcaaacgtaacgaaaaatgggatgaagtttacaaatatatcgtgaccaactggctggctaaggttaatactcagatcgacctcatccgcaaaaaaatgaaagaagcactggaaaaccaggcggaagctaccaaggcaatcattaactaccagtacaaccagtacaccgaggaagaaaaaaacaacatcaacttcaacatcgacgatctgtcctctaaactgaacgaatccatcaacaaagctatgatcaacatcaacaagttcctgaaccagtgctctgtaagctatctgatgaactccatgatcccgtacggtgttaaacgtctggaggacttcgatgcgtctctgaaagacgccctgctgaaatacatttacgacaaccgtggcactctgatcggtcaggttgatcgtctgaaggacaaagtgaacaataccttatcgaccgacatcccttttcagctcagtaaatatgtcgataaccaacgccttttgtccactctagaaggcggTGGCGGTAGCGGTGGCGGTGGCAGCGGCGGTGGCGGTAGCGCACTAGacAACAGCGACCCTAAATGCCCACTaAGTCATGAAGGATACTGCCTTAATGATGGTGTTTGTATGTACATAGGAACATTGGACCGTTATGCTTGCAATTGTGTAGTGGGCTATGTCGGGGAAAGGTGTCAATATCGAGATCTCAAGCTGGCAGAGTTAAGAgggctagaagcaCACCATCATCACcaccatcaccatcaccattaatgaAAGCTTGCGGCCGCACTCGAGCACCACCACCACCACCACTGAGATCCGGCTGCTAACAAAGCCCGAAAGGAAGCTGAGTTGGCTGCTGCCACCGCTGAGCAATAACTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTTTGCTGAAAGGAGGAACTATATCCGGAT

SEQ ID NO:12–SNAP标记的EGF-配体多肽的多肽序列

MDKDCEMKRTTLDSPLGKLELSGCEQGLHRIIFLGKGTSAADAVEVPAPAAVLGGPEPLMQATAWLNAYFHQPEAIEEFPVPALHHPVFQQESFTRQVLWKLLKVVKFGEVISYSHLAALAGNPAATAAVKTALSGNPVPILIPCHRVVQGDLDVGGYEGGLAVKEWLLAHEGHRLGKPGLGGGSGGGSGGGSMEFVNKQFNYKDPVNGVDIAYIKIPNAGQMQPVKAFKIHNKIWVIPERDTFTNPEEGDLNPPPEAKQVPVSYYDSTYLSTDNEKDNYLKGVTKLFERIYSTDLGRMLLTSIVRGIPFWGGSTIDTELKVIDTNCINVIQPDGSYRSEELNLVIIGPSADIIQFECKSFGHEVLNLTRNGYGSTQYIRFSPDFTFGFEESLEVDTNPLLGAGKFATDPAVTLAHELIHAGHRLYGIAINPNRVFKVNTNAYYEMSGLEVSFEELRTFGGHDAKFIDSLQENEFRLYYYNKFKDIASTLNKAKSIVGTTASLQYMKNVFKEKYLLSEDTSGKFSVDKLKFDKLYKMLTEIYTEDNFVKFFKVLNRKTYLNFDKAVFKINIVPKVNYTIYDGFNLRNTNLAANFNGQNTEINNMNFTKLKNFTGLFEFYKLLCVDGIITSKTKSLIEGRNKALNLQCIKVNNWDLFFSPSEDNFTNDLNKGEEITSDTNIEAAEENISLDLIQQYYLTFNFDNEPENISIENLSSDIIGQLELMPNIERFPNGKKYELDKYTMFHYLRAQEFEHGKSRIALTNSVNEALLNPSRVYTFFSSDYVKKVNKATEAAMFLGWVEQLVYDFTDETSEVSTTDKIADITIIIPYIGPALNIGNMLYKDDFVGALIFSGAVILLEFIPEIAIPVLGTFALVSYIANKVLTVQTIDNALSKRNEKWDEVYKYIVTNWLAKVNTQIDLIRKKMKEALENQAEATKAIINYQYNQYTEEEKNNINFNIDDLSSKLNESINKAMININKFLNQCSVSYLMNSMIPYGVKRLEDFDASLKDALLKYIYDNRGTLIGQVDRLKDKVNNTLSTDIPFQLSKYVDNQRLLSTLEGGGGSGGGGSGGGGSALDNSDPKCPLSHEGYCLNDGVCMYIGTLDRYACNCVVGYVGERCQYRDLKLAELRGLEAHHHHHHHHHH

SEQ ID NO:13–分选酶A的核苷酸序列(靶向LPESG)

TGGCGAATGGGACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTAGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGTCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGCTTACAATTTAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAATTAATTCTTAGAAAAACTCATCGAGCATCAAATGAAACTGCAATTTATTCATATCAGGATTATCAATACCATATTTTTGAAAAAGCCGTTTCTGTAATGAAGGAGAAAACTCACCGAGGCAGTTCCATAGGATGGCAAGATCCTGGTATCGGTCTGCGATTCCGACTCGTCCAACATCAATACAACCTATTAATTTCCCCTCGTCAAAAATAAGGTTATCAAGTGAGAAATCACCATGAGTGACGACTGAATCCGGTGAGAATGGCAAAAGTTTATGCATTTCTTTCCAGACTTGTTCAACAGGCCAGCCATTACGCTCGTCATCAAAATCACTCGCATCAACCAAACCGTTATTCATTCGTGATTGCGCCTGAGCGAGACGAAATACGCGATCGCTGTTAAAAGGACAATTACAAACAGGAATCGAATGCAACCGGCGCAGGAACACTGCCAGCGCATCAACAATATTTTCACCTGAATCAGGATATTCTTCTAATACCTGGAATGCTGTTTTCCCGGGGATCGCAGTGGTGAGTAACCATGCATCATCAGGAGTACGGATAAAATGCTTGATGGTCGGAAGAGGCATAAATTCCGTCAGCCAGTTTAGTCTGACCATCTCATCTGTAACATCATTGGCAACGCTACCTTTGCCATGTTTCAGAAACAACTCTGGCGCATCGGGCTTCCCATACAATCGATAGATTGTCGCACCTGATTGCCCGACATTATCGCGAGCCCATTTATACCCATATAAATCAGCATCCATGTTGGAATTTAATCGCGGCCTAGAGCAAGACGTTTCCCGTTGAATATGGCTCATAACACCCCTTGTATTACTGTTTATGTAAGCAGACAGTTTTATTGTTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATCGGCGATAATGGCCTGCTTCTCGCCGAAACGTTTGGTGGCGGGACCAGTGACGAAGGCTTGAGCGAGGGCGTGCAAGATTCCGAATACCGCAAGCGACAGGCCGATCATCGTCGCGCTCCAGCGAAAGCGGTCCTCGCCGAAAATGACCCAGAGCGCTGCCGGCACCTGTCCTACGAGTTGCATGATAAAGAAGACAGTCATAAGTGCGGCGACGATAGTCATGCCCCGCGCCCACCGGAAGGAGCTGACTGGGTTGAAGGCTCTCAAGGGCATCGGTCGAGATCCCGGTGCCTAATGAGTGAGCTAACTTACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCCAGGGTGGTTTTTCTTTTCACCAGTGAGACGGGCAACAGCTGATTGCCCTTCACCGCCTGGCCCTGAGAGAGTTGCAGCAAGCGGTCCACGCTGGTTTGCCCCAGCAGGCGAAAATCCTGTTTGATGGTGGTTAACGGCGGGATATAACATGAGCTGTCTTCGGTATCGTCGTATCCCACTACCGAGATATCCGCACCAACGCGCAGCCCGGACTCGGTAATGGCGCGCATTGCGCCCAGCGCCATCTGATCGTTGGCAACCAGCATCGCAGTGGGAACGATGCCCTCATTCAGCATTTGCATGGTTTGTTGAAAACCGGACATGGCACTCCAGTCGCCTTCCCGTTCCGCTATCGGCTGAATTTGATTGCGAGTGAGATATTTATGCCAGCCAGCCAGACGCAGACGCGCCGAGACAGAACTTAATGGGCCCGCTAACAGCGCGATTTGCTGGTGACCCAATGCGACCAGATGCTCCACGCCCAGTCGCGTACCGTCTTCATGGGAGAAAATAATACTGTTGATGGGTGTCTGGTCAGAGACATCAAGAAATAACGCCGGAACATTAGTGCAGGCAGCTTCCACAGCAATGGCATCCTGGTCATCCAGCGGATAGTTAATGATCAGCCCACTGACGCGTTGCGCGAGAAGATTGTGCACCGCCGCTTTACAGGCTTCGACGCCGCTTCGTTCTACCATCGACACCACCACGCTGGCACCCAGTTGATCGGCGCGAGATTTAATCGCCGCGACAATTTGCGACGGCGCGTGCAGGGCCAGACTGGAGGTGGCAACGCCAATCAGCAACGACTGTTTGCCCGCCAGTTGTTGTGCCACGCGGTTGGGAATGTAATTCAGCTCCGCCATCGCCGCTTCCACTTTTTCCCGCGTTTTCGCAGAAACGTGGCTGGCCTGGTTCACCACGCGGGAAACGGTCTGATAAGAGACACCGGCATACTCTGCGACATCGTATAACGTTACTGGTTTCACATTCACCACCCTGAATTGACTCTCTTCCGGGCGCTATCATGCCATACCGCGAAAGGTTTTGCGCCATTCGATGGTGTCCGGGATCTCGACGCTCTCCCTTATGCGACTCCTGCATTAGGAAGCAGCCCAGTAGTAGGTTGAGGCCGTTGAGCACCGCCGCCGCAAGGAATGGTGCATGCAAGGAGATGGCGCCCAACAGTCCCCCGGCCACGGGGCCTGCCACCATACCCACGCCGAAACAAGCGCTCATGAGCCCGAAGTGGCGAGCCCGATCTTCCCCATCGGTGATGTCGGCGATATAGGCGCCAGCAACCGCACCTGTGGCGCCGGTGATGCCGGCCACGATGCGTCCGGCGTAGAGGATCGAGATCTCGATCCCGCGAAATTAATACGACTCACTATAGGGGAATTGTGAGCGGATAACAATTCCCCTCAAGAAATAATTTTGTTTAACTTTAAGAAGGAGATATCATATGCAGGCAAAACCGCAGATTCCGAAAGATAAAAGCAAAGTGGCAGGCTATATTGAAATTCCGGATGCCGATATTAAAGAACCGGTTTATCCGGGTCCTGCAACACGTGAACAGCTGGATCGTGGTGTTTGTTTTGTTGAAGAAAATGAGAGCCTGGATGATCAGAACATTAGCATTACCGGTCATACCGCAATTGATCGTCCGAATTATCAGTTTACCAATCTGCGTGCAGCCAAACCGGGTAGCATGGTTTATCTGAAAGTTGGTAATGAAACCCGCATCTACAAAATGACCAGCATTCGTAATGTTAAACCGACCGCAGTTGGTGTTCTGGATGAACAAAAAGGTAAAGATAAACAGCTGACCCTGGTTACCTGTGATGATTATAACTTTGAAACCGGTGTTTGGGAAACGCGCAAAATCTTTGTTGCAACCGAAGTTAAACATCACCATCACCACCATCATCATCACCATTAAAAGCTTGCGGCCGCACTCGAGCACCACCACCACCACCACTGAGATCCGGCTGCTAACAAAGCCCGAAAGGAAGCTGAGTTGGCTGCTGCCACCGCTGAGCAATAACTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTTTGCTGAAAGGAGGAACTATATCCGGAT

SEQ ID NO:14–分选酶A的多肽序列(靶向LPESG)

MQAKPQIPKDKSKVAGYIEIPDADIKEPVYPGPATREQLDRGVCFVEENESLDDQNISITGHTAIDRPNYQFTNLRAAKPGSMVYLKVGNETRIYKMTSIRNVKPTAVGVLDEQKGKDKQLTLVTCDDYNFETGVWETRKIFVATEVKHHHHHHHHHH

SEQ ID NO:15–分选酶A的核苷酸序列(靶向LAETG)

TGGCGAATGGGACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTAGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGTCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGCTTACAATTTAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAATTAATTCTTAGAAAAACTCATCGAGCATCAAATGAAACTGCAATTTATTCATATCAGGATTATCAATACCATATTTTTGAAAAAGCCGTTTCTGTAATGAAGGAGAAAACTCACCGAGGCAGTTCCATAGGATGGCAAGATCCTGGTATCGGTCTGCGATTCCGACTCGTCCAACATCAATACAACCTATTAATTTCCCCTCGTCAAAAATAAGGTTATCAAGTGAGAAATCACCATGAGTGACGACTGAATCCGGTGAGAATGGCAAAAGTTTATGCATTTCTTTCCAGACTTGTTCAACAGGCCAGCCATTACGCTCGTCATCAAAATCACTCGCATCAACCAAACCGTTATTCATTCGTGATTGCGCCTGAGCGAGACGAAATACGCGATCGCTGTTAAAAGGACAATTACAAACAGGAATCGAATGCAACCGGCGCAGGAACACTGCCAGCGCATCAACAATATTTTCACCTGAATCAGGATATTCTTCTAATACCTGGAATGCTGTTTTCCCGGGGATCGCAGTGGTGAGTAACCATGCATCATCAGGAGTACGGATAAAATGCTTGATGGTCGGAAGAGGCATAAATTCCGTCAGCCAGTTTAGTCTGACCATCTCATCTGTAACATCATTGGCAACGCTACCTTTGCCATGTTTCAGAAACAACTCTGGCGCATCGGGCTTCCCATACAATCGATAGATTGTCGCACCTGATTGCCCGACATTATCGCGAGCCCATTTATACCCATATAAATCAGCATCCATGTTGGAATTTAATCGCGGCCTAGAGCAAGACGTTTCCCGTTGAATATGGCTCATAACACCCCTTGTATTACTGTTTATGTAAGCAGACAGTTTTATTGTTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATCGGCGATAATGGCCTGCTTCTCGCCGAAACGTTTGGTGGCGGGACCAGTGACGAAGGCTTGAGCGAGGGCGTGCAAGATTCCGAATACCGCAAGCGACAGGCCGATCATCGTCGCGCTCCAGCGAAAGCGGTCCTCGCCGAAAATGACCCAGAGCGCTGCCGGCACCTGTCCTACGAGTTGCATGATAAAGAAGACAGTCATAAGTGCGGCGACGATAGTCATGCCCCGCGCCCACCGGAAGGAGCTGACTGGGTTGAAGGCTCTCAAGGGCATCGGTCGAGATCCCGGTGCCTAATGAGTGAGCTAACTTACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCCAGGGTGGTTTTTCTTTTCACCAGTGAGACGGGCAACAGCTGATTGCCCTTCACCGCCTGGCCCTGAGAGAGTTGCAGCAAGCGGTCCACGCTGGTTTGCCCCAGCAGGCGAAAATCCTGTTTGATGGTGGTTAACGGCGGGATATAACATGAGCTGTCTTCGGTATCGTCGTATCCCACTACCGAGATATCCGCACCAACGCGCAGCCCGGACTCGGTAATGGCGCGCATTGCGCCCAGCGCCATCTGATCGTTGGCAACCAGCATCGCAGTGGGAACGATGCCCTCATTCAGCATTTGCATGGTTTGTTGAAAACCGGACATGGCACTCCAGTCGCCTTCCCGTTCCGCTATCGGCTGAATTTGATTGCGAGTGAGATATTTATGCCAGCCAGCCAGACGCAGACGCGCCGAGACAGAACTTAATGGGCCCGCTAACAGCGCGATTTGCTGGTGACCCAATGCGACCAGATGCTCCACGCCCAGTCGCGTACCGTCTTCATGGGAGAAAATAATACTGTTGATGGGTGTCTGGTCAGAGACATCAAGAAATAACGCCGGAACATTAGTGCAGGCAGCTTCCACAGCAATGGCATCCTGGTCATCCAGCGGATAGTTAATGATCAGCCCACTGACGCGTTGCGCGAGAAGATTGTGCACCGCCGCTTTACAGGCTTCGACGCCGCTTCGTTCTACCATCGACACCACCACGCTGGCACCCAGTTGATCGGCGCGAGATTTAATCGCCGCGACAATTTGCGACGGCGCGTGCAGGGCCAGACTGGAGGTGGCAACGCCAATCAGCAACGACTGTTTGCCCGCCAGTTGTTGTGCCACGCGGTTGGGAATGTAATTCAGCTCCGCCATCGCCGCTTCCACTTTTTCCCGCGTTTTCGCAGAAACGTGGCTGGCCTGGTTCACCACGCGGGAAACGGTCTGATAAGAGACACCGGCATACTCTGCGACATCGTATAACGTTACTGGTTTCACATTCACCACCCTGAATTGACTCTCTTCCGGGCGCTATCATGCCATACCGCGAAAGGTTTTGCGCCATTCGATGGTGTCCGGGATCTCGACGCTCTCCCTTATGCGACTCCTGCATTAGGAAGCAGCCCAGTAGTAGGTTGAGGCCGTTGAGCACCGCCGCCGCAAGGAATGGTGCATGCAAGGAGATGGCGCCCAACAGTCCCCCGGCCACGGGGCCTGCCACCATACCCACGCCGAAACAAGCGCTCATGAGCCCGAAGTGGCGAGCCCGATCTTCCCCATCGGTGATGTCGGCGATATAGGCGCCAGCAACCGCACCTGTGGCGCCGGTGATGCCGGCCACGATGCGTCCGGCGTAGAGGATCGAGATCTCGATCCCGCGAAATTAATACGACTCACTATAGGGGAATTGTGAGCGGATAACAATTCCCCTCAAGAAATAATTTTGTTTAACTTTAAGAAGGAGATATACATATGCAGGCAAAACCGCAGATTCCGAAAGATAAAAGCAAAGTGGCAGGCTATATTGAAATTCCGGATGCCGATATTAAAGAACCGGTTTATCCGGGTCCTGCAACACGTGAACAGCTGAATCGTGGTGTTTGTTTTCACGATGAAAATGAGAGCCTGGATGATCAGAATATTAGCATTGCAGGCCATACCTTTATTGATCGTCCGAATTATCAGTTCACCAATCTGAAAGCAGCAAAACCGGGTAGCATGGTTTATTTCAAAGTTGGTAATGAAACCCGCATCTACAAAATGACCAGCATTCGTAAAGTTCATCCGAATGCAGTTGGTGTTCTGGATGAACAAGAAGGCAAAGATAAACAGCTGACCCTGGTTACCTGTGATGATTATAACGAAGAAACCGGTGTTTGGGAAAGCCGTAAAATCTTTGTTGCAACCGAAGTGAAACATCATCACCACCATCACCATCATCATCACTAAAAGCTTGCGGCCGCACTCGAGCACCACCACCACCACCACTGAGATCCGGCTGCTAACAAAGCCCGAAAGGAAGCTGAGTTGGCTGCTGCCACCGCTGAGCAATAACTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTTTGCTGAAAGGAGGAACTATATCCGGAT

SEQ ID NO:16–分选酶A的多肽序列(靶向LAETG)

MQAKPQIPKDKSKVAGYIEIPDADIKEPVYPGPATREQLNRGVCFHDENESLDDQNISIAGHTFIDRPNYQFTNLKAAKPGSMVYFKVGNETRIYKMTSIRKVHPNAVGVLDEQEGKDKQLTLVTCDDYNEETGVWESRKIFVATEVKHHHHHHHHHH

SEQ ID NO:17-BoNT/A-UniProt P10845

MPFVNKQFNYKDPVNGVDIAYIKIPNVGQMQPVKAFKIHNKIWVIPERDTFTNPEEGDLNPPPEAKQVPVSYYDSTYLSTDNEKDNYLKGVTKLFERIYSTDLGRMLLTSIVRGIPFWGGSTIDTELKVIDTNCINVIQPDGSYRSEELNLVIIGPSADIIQFECKSFGHEVLNLTRNGYGSTQYIRFSPDFTFGFEESLEVDTNPLLGAGKFATDPAVTLAHELIHAGHRLYGIAINPNRVFKVNTNAYYEMSGLEVSFEELRTFGGHDAKFIDSLQENEFRLYYYNKFKDIASTLNKAKSIVGTTASLQYMKNVFKEKYLLSEDTSGKFSVDKLKFDKLYKMLTEIYTEDNFVKFFKVLNRKTYLNFDKAVFKINIVPKVNYTIYDGFNLRNTNLAANFNGQNTEINNMNFTKLKNFTGLFEFYKLLCVRGIITSKTKSLDKGYNKALNDLCIKVNNWDLFFSPSEDNFTNDLNKGEEITSDTNIEAAEENISLDLIQQYYLTFNFDNEPENISIENLSSDIIGQLELMPNIERFPNGKKYELDKYTMFHYLRAQEFEHGKSRIALTNSVNEALLNPSRVYTFFSSDYVKKVNKATEAAMFLGWVEQLVYDFTDETSEVSTTDKIADITIIIPYIGPALNIGNMLYKDDFVGALIFSGAVILLEFIPEIAIPVLGTFALVSYIANKVLTVQTIDNALSKRNEKWDEVYKYIVTNWLAKVNTQIDLIRKKMKEALENQAEATKAIINYQYNQYTEEEKNNINFNIDDLSSKLNESINKAMININKFLNQCSVSYLMNSMIPYGVKRLEDFDASLKDALLKYIYDNRGTLIGQVDRLKDKVNNTLSTDIPFQLSKYVDNQRLLSTFTEYIKNIINTSILNLRYESNHLIDLSRYASKINIGSKVNFDPIDKNQIQLFNLESSKIEVILKNAIVYNSMYENFSTSFWIRIPKYFNSISLNNEYTIINCMENNSGWKVSLNYGEIIWTLQDTQEIKQRVVFKYSQMINISDYINRWIFVTITNNRLNNSKIYINGRLIDQKPISNLGNIHASNNIMFKLDGCRDTHRYIWIKYFNLFDKELNEKEIKDLYDNQSNSGILKDFWGDYLQYDKPYYMLNLYDPNKYVDVNNVGIRGYMYLKGPRGSVMTTNIYLNSSLYRGTKFIIKKYASGNKDNIVRNNDRVYINVVVKNKEYRLATNASQAGVEKILSALEIPDVGNLSQVVVMKSKNDQGITNKCKMNLQDNNGNDIGFIGFHQFNNIAKLVASNWYNRQIERSSRTLGCSWEFIPVDDGWGERPL

SEQ ID NO:18-BoNT/B-UniProt P10844

MPVTINNFNYNDPIDNNNIIMMEPPFARGTGRYYKAFKITDRIWIIPERYTFGYKPEDFNKSSGIFNRDVCEYYDPDYLNTNDKKNIFLQTMIKLFNRIKSKPLGEKLLEMIINGIPYLGDRRVPLEEFNTNIASVTVNKLISNPGEVERKKGIFANLIIFGPGPVLNENETIDIGIQNHFASREGFGGIMQMKFCPEYVSVFNNVQENKGASIFNRRGYFSDPALILMHELIHVLHGLYGIKVDDLPIVPNEKKFFMQSTDAIQAEELYTFGGQDPSIITPSTDKSIYDKVLQNFRGIVDRLNKVLVCISDPNININIYKNKFKDKYKFVEDSEGKYSIDVESFDKLYKSLMFGFTETNIAENYKIKTRASYFSDSLPPVKIKNLLDNEIYTIEEGFNISDKDMEKEYRGQNKAINKQAYEEISKEHLAVYKIQMCKSVKAPGICIDVDNEDLFFIADKNSFSDDLSKNERIEYNTQSNYIENDFPINELILDTDLISKIELPSENTESLTDFNVDVPVYEKQPAIKKIFTDENTIFQYLYSQTFPLDIRDISLTSSFDDALLFSNKVYSFFSMDYIKTANKVVEAGLFAGWVKQIVNDFVIEANKSNTMDKIADISLIVPYIGLALNVGNETAKGNFENAFEIAGASILLEFIPELLIPVVGAFLLESYIDNKNKIIKTIDNALTKRNEKWSDMYGLIVAQWLSTVNTQFYTIKEGMYKALNYQAQALEEIIKYRYNIYSEKEKSNINIDFNDINSKLNEGINQAIDNINNFINGCSVSYLMKKMIPLAVEKLLDFDNTLKKNLLNYIDENKLYLIGSAEYEKSKVNKYLKTIMPFDLSIYTNDTILIEMFNKYNSEILNNIILNLRYKDNNLIDLSGYGAKVEVYDGVELNDKNQFKLTSSANSKIRVTQNQNIIFNSVFLDFSVSFWIRIPKYKNDGIQNYIHNEYTIINCMKNNSGWKISIRGNRIIWTLIDINGKTKSVFFEYNIREDISEYINRWFFVTITNNLNNAKIYINGKLESNTDIKDIREVIANGEIIFKLDGDIDRTQFIWMKYFSIFNTELSQSNIEERYKIQSYSEYLKDFWGNPLMYNKEYYMFNAGNKNSYIKLKKDSPVGEILTRSKYNQNSKYINYRDLYIGEKFIIRRKSNSQSINDDIVRKEDYIYLDFFNLNQEWRVYTYKYFKKEEEKLFLAPISDSDEFYNTIQIKEYDEQPTYSCQLLFKKDEESTDEIGLIGIHRFYESGIVFEEYKDYFCISKWYLKEVKRKPYNLKLGCNWQFIPKDEGWTE

SEQ ID NO:19-BoNT/C-UniProt P18640

MPITINNFNYSDPVDNKNILYLDTHLNTLANEPEKAFRITGNIWVIPDRFSRNSNPNLNKPPRVTSPKSGYYDPNYLSTDSDKDPFLKEIIKLFKRINSREIGEELIYRLSTDIPFPGNNNTPINTFDFDVDFNSVDVKTRQGNNWVKTGSINPSVIITGPRENIIDPETSTFKLTNNTFAAQEGFGALSIISISPRFMLTYSNATNDVGEGRFSKSEFCMDPILILMHELNHAMHNLYGIAIPNDQTISSVTSNIFYSQYNVKLEYAEIYAFGGPTIDLIPKSARKYFEEKALDYYRSIAKRLNSITTANPSSFNKYIGEYKQKLIRKYRFVVESSGEVTVNRNKFVELYNELTQIFTEFNYAKIYNVQNRKIYLSNVYTPVTANILDDNVYDIQNGFNIPKSNLNVLFMGQNLSRNPALRKVNPENMLYLFTKFCHKAIDGRSLYNKTLDCRELLVKNTDLPFIGDISDVKTDIFLRKDINEETEVIYYPDNVSVDQVILSKNTSEHGQLDLLYPSIDSESEILPGENQVFYDNRTQNVDYLNSYYYLESQKLSDNVEDFTFTRSIEEALDNSAKVYTYFPTLANKVNAGVQGGLFLMWANDVVEDFTTNILRKDTLDKISDVSAIIPYIGPALNISNSVRRGNFTEAFAVTGVTILLEAFPEFTIPALGAFVIYSKVQERNEIIKTIDNCLEQRIKRWKDSYEWMMGTWLSRIITQFNNISYQMYDSLNYQAGAIKAKIDLEYKKYSGSDKENIKSQVENLKNSLDVKISEAMNNINKFIRECSVTYLFKNMLPKVIDELNEFDRNTKAKLINLIDSHNIILVGEVDKLKAKVNNSFQNTIPFNIFSYTNNSLLKDIINEYFNNINDSKILSLQNRKNTLVDTSGYNAEVSEEGDVQLNPIFPFDFKLGSSGEDRGKVIVTQNENIVYNSMYESFSISFWIRINKWVSNLPGYTIIDSVKNNSGWSIGIISNFLVFTLKQNEDSEQSINFSYDISNNAPGYNKWFFVTVTNNMMGNMKIYINGKLIDTIKVKELTGINFSKTITFEINKIPDTGLITSDSDNINMWIRDFYIFAKELDGKDINILFNSLQYTNVVKDYWGNDLRYNKEYYMVNIDYLNRYMYANSRQIVFNTRRNNNDFNEGYKIIIKRIRGNTNDTRVRGGDILYFDMTINNKAYNLFMKNETMYADNHSTEDIYAIGLREQTKDINDNIIFQIQPMNNTYYYASQIFKSNFNGENISGICSIGTYRFRLGGDWYRHNYLVPTVKQGNYASLLESTSTHWGFVPVSE

SEQ ID NO:20-BoNT/D-UniProt P19321

MTWPVKDFNYSDPVNDNDILYLRIPQNKLITTPVKAFMITQNIWVIPERFSSDTNPSLSKPPRPTSKYQSYYDPSYLSTDEQKDTFLKGIIKLFKRINERDIGKKLINYLVVGSPFMGDSSTPEDTFDFTRHTTNIAVEKFENGSWKVTNIITPSVLIFGPLPNILDYTASLTLQGQQSNPSFEGFGTLSILKVAPEFLLTFSDVTSNQSSAVLGKSIFCMDPVIALMHELTHSLHQLYGINIPSDKRIRPQVSEGFFSQDGPNVQFEELYTFGGLDVEIIPQIERSQLREKALGHYKDIAKRLNNINKTIPSSWISNIDKYKKIFSEKYNFDKDNTGNFVVNIDKFNSLYSDLTNVMSEVVYSSQYNVKNRTHYFSRHYLPVFANILDDNIYTIRDGFNLTNKGFNIENSGQNIERNPALQKLSSESVVDLFTKVCLRLTKNSRDDSTCIKVKNNRLPYVADKDSISQEIFENKIITDETNVQNYSDKFSLDESILDGQVPINPEIVDPLLPNVNMEPLNLPGEEIVFYDDITKYVDYLNSYYYLESQKLSNNVENITLTTSVEEALGYSNKIYTFLPSLAEKVNKGVQAGLFLNWANEVVEDFTTNIMKKDTLDKISDVSVIIPYIGPALNIGNSALRGNFNQAFATAGVAFLLEGFPEFTIPALGVFTFYSSIQEREKIIKTIENCLEQRVKRWKDSYQWMVSNWLSRITTQFNHINYQMYDSLSYQADAIKAKIDLEYKKYSGSDKENIKSQVENLKNSLDVKISEAMNNINKFIRECSVTYLFKNMLPKVIDELNKFDLRTKTELINLIDSHNIILVGEVDRLKAKVNESFENTMPFNIFSYTNNSLLKDIINEYFNSINDSKILSLQNKKNALVDTSGYNAEVRVGDNVQLNTIYTNDFKLSSSGDKIIVNLNNNILYSAIYENSSVSFWIKISKDLTNSHNEYTIINSIEQNSGWKLCIRNGNIEWILQDVNRKYKSLIFDYSESLSHTGYTNKWFFVTITNNIMGYMKLYINGELKQSQKIEDLDEVKLDKTIVFGIDENIDENQMLWIRDFNIFSKELSNEDINIVYEGQILRNVIKDYWGNPLKFDTEYYIINDNYIDRYIAPESNVLVLVQYPDRSKLYTGNPITIKSVSDKNPYSRILNGDNIILHMLYNSRKYMIIRDTDTIYATQGGECSQNCVYALKLQSNLGNYGIGIFSIKNIVSKNKYCSQIFSSFRENTMLLADIYKPWRFSFKNAYTPVAVTNYETKLLSTSSFWKFISRDPGWVE

SEQ ID NO:21-BoNT/E-UniProt Q00496

MPKINSFNYNDPVNDRTILYIKPGGCQEFYKSFNIMKNIWIIPERNVIGTTPQDFHPPTSLKNGDSSYYDPNYLQSDEEKDRFLKIVTKIFNRINNNLSGGILLEELSKANPYLGNDNTPDNQFHIGDASAVEIKFSNGSQDILLPNVIIMGAEPDLFETNSSNISLRNNYMPSNHRFGSIAIVTFSPEYSFRFNDNCMNEFIQDPALTLMHELIHSLHGLYGAKGITTKYTITQKQNPLITNIRGTNIEEFLTFGGTDLNIITSAQSNDIYTNLLADYKKIASKLSKVQVSNPLLNPYKDVFEAKYGLDKDASGIYSVNINKFNDIFKKLYSFTEFDLRTKFQVKCRQTYIGQYKYFKLSNLLNDSIYNISEGYNINNLKVNFRGQNANLNPRIITPITGRGLVKKIIRFCKNIVSVKGIRKSICIEINNGELFFVASENSYNDDNINTPKEIDDTVTSNNNYENDLDQVILNFNSESAPGLSDEKLNLTIQNDAYIPKYDSNGTSDIEQHDVNELNVFFYLDAQKVPEGENNVNLTSSIDTALLEQPKIYTFFSSEFINNVNKPVQAALFVSWIQQVLVDFTTEANQKSTVDKIADISIVVPYIGLALNIGNEAQKGNFKDALELLGAGILLEFEPELLIPTILVFTIKSFLGSSDNKNKVIKAINNALKERDEKWKEVYSFIVSNWMTKINTQFNKRKEQMYQALQNQVNAIKTIIESKYNSYTLEEKNELTNKYDIKQIENELNQKVSIAMNNIDRFLTESSISYLMKIINEVKINKLREYDENVKTYLLNYIIQHGSILGESQQELNSMVTDTLNNSIPFKLSSYTDDKILISYFNKFFKRIKSSSVLNMRYKNDKYVDTSGYDSNININGDVYKYPTNKNQFGIYNDKLSEVNISQNDYIIYDNKYKNFSISFWVRIPNYDNKIVNVNNEYTIINCMRDNNSGWKVSLNHNEIIWTFEDNRGINQKLAFNYGNANGISDYINKWIFVTITNDRLGDSKLYINGNLIDQKSILNLGNIHVSDNILFKIVNCSYTRYIGIRYFNIFDKELDETEIQTLYSNEPNTNILKDFWGNYLLYDKEYYLLNVLKPNNFIDRRKDSTLSINNIRSTILLANRLYSGIKVKIQRVNNSSTNDNLVRKNDQVYINFVASKTHLFPLYADTATTNKEKTIKISSSGNRFNQVVVMNSVGNCTMNFKNNNGNNIGLLGFKADTVVASTWYYTHMRDHTNSNGCFWNFISEEHGWQEK

SEQ ID NO:22-BoNT/F-UniProt A7GBG3

MPVVINSFNYNDPVNDDTILYMQIPYEEKSKKYYKAFEIMRNVWIIPERNTIGTDPSDFDPPASLENGSSAYYDPNYLTTDAEKDRYLKTTIKLFKRINSNPAGEVLLQEISYAKPYLGNEHTPINEFHPVTRTTSVNIKSSTNVKSSIILNLLVLGAGPDIFENSSYPVRKLMDSGGVYDPSNDGFGSINIVTFSPEYEYTFNDISGGYNSSTESFIADPAISLAHELIHALHGLYGARGVTYKETIKVKQAPLMIAEKPIRLEEFLTFGGQDLNIITSAMKEKIYNNLLANYEKIATRLSRVNSAPPEYDINEYKDYFQWKYGLDKNADGSYTVNENKFNEIYKKLYSFTEIDLANKFKVKCRNTYFIKYGFLKVPNLLDDDIYTVSEGFNIGNLAVNNRGQNIKLNPKIIDSIPDKGLVEKIVKFCKSVIPRKGTKAPPRLCIRVNNRELFFVASESSYNENDINTPKEIDDTTNLNNNYRNNLDEVILDYNSETIPQISNQTLNTLVQDDSYVPRYDSNGTSEIEEHNVVDLNVFFYLHAQKVPEGETNISLTSSIDTALSEESQVYTFFSSEFINTINKPVHAALFISWINQVIRDFTTEATQKSTFDKIADISLVVPYVGLALNIGNEVQKENFKEAFELLGAGILLEFVPELLIPTILVFTIKSFIGSSENKNKIIKAINNSLMERETKWKEIYSWIVSNWLTRINTQFNKRKEQMYQALQNQVDAIKTVIEYKYNNYTSDERNRLESEYNINNIREELNKKVSLAMENIERFITESSIFYLMKLINEAKVSKLREYDEGVKEYLLDYISEHRSILGNSVQELNDLVTSTLNNSIPFELSSYTNDKILILYFNKLYKKIKDNSILDMRYENNKFIDISGYGSNISINGDVYIYSTNRNQFGIYSSKPSEVNIAQNNDIIYNGRYQNFSISFWVRIPKYFNKVNLNNEYTIIDCIRNNNSGWKISLNYNKIIWTLQDTAGNNQKLVFNYTQMISISDYINKWIFVTITNNRLGNSRIYINGNLIDEKSISNLGDIHVSDNILFKIVGCNDTRYVGIRYFKVFDTELGKTEIETLYSDEPDPSILKDFWGNYLLYNKRYYLLNLLRTDKSITQNSNFLNINQQRGVYQKPNIFSNTRLYTGVEVIIRKNGSTDISNTDNFVRKNDLAYINVVDRDVEYRLYADISIAKPEKIIKLIRTSNSNNSLGQIIVMDSIGNNCTMNFQNNNGGNIGLLGFHSNNLVASSWYYNNIRKNTSSNGCFWSFISKEHGWQEN

SEQ ID NO:23-BoNT/G-UniProt Q60393

MPVNIKXFNYNDPINNDDIIMMEPFNDPGPGTYYKAFRIIDRIWIVPERFTYGFQPDQFNASTGVFSKDVYEYYDPTYLKTDAEKDKFLKTMIKLFNRINSKPSGQRLLDMIVDAIPYLGNASTPPDKFAANVANVSINKKIIQPGAEDQIKGLMTNLIIFGPGPVLSDNFTDSMIMNGHSPISEGFGARMMIRFCPSCLNVFNNVQENKDTSIFSRRAYFADPALTLMHELIHVLHGLYGIKISNLPITPNTKEFFMQHSDPVQAEELYTFGGHDPSVISPSTDMNIYNKALQNFQDIANRLNIVSSAQGSGIDISLYKQIYKNKYDFVEDPNGKYSVDKDKFDKLYKALMFGFTETNLAGEYGIKTRYSYFSEYLPPIKTEKLLDNTIYTQNEGFNIASKNLKTEFNGQNKAVNKEAYEEISLEHLVIYRIAMCKPVMYKNTGKSEQCIIVNNEDLFFIANKDSFSKDLAKAETIAYNTQNNTIENNFSIDQLILDNDLSSGIDLPNENTEPFTNFDDIDIPVYIKQSALKKIFVDGDSLFEYLHAQTFPSNIENLQLTNSLNDALRNNNKVYTFFSTNLVEKANTVVGASLFVNWVKGVIDDFTSESTQKSTIDKVSDVSIIIPYIGPALNVGNETAKENFKNAFEIGGAAILMEFIPELIVPIVGFFTLESYVGNKGHIIMTISNALKKRDQKWTDMYGLIVSQWLSTVNTQFYTIKERMYNALNNQSQAIEKIIEDQYNRYSEEDKMNINIDFNDIDFKLNQSINLAINNIDDFINQCSISYLMNRMIPLAVKKLKDFDDNLKRDLLEYIDTNELYLLDEVNILKSKVNRHLKDSIPFDLSLYTKDTILIQVFNNYISNISSNAILSLSYRGGRLIDSSGYGATMNVGSDVIFNDIGNGQFKLNNSENSNITAHQSKFVVYDSMFDNFSINFWVRTPKYNNNDIQTYLQNEYTIISCIKNDSGWKVSIKGNRIIWTLIDVNAKSKSIFFEYSIKDNISDYINKWFSITITNDRLGNANIYINGSLKKSEKILNLDRINSSNDIDFKLINCTDTTKFVWIKDFNIFGRELNATEVSSLYWIQSSTNTLKDFWGNPLRYDTQYYLFNQGMQNIYIKYFSKASMGETAPRTNFNNAAINYQNLYLGLRFIIKKASNSRNINNDNIVREGDYIYLNIDNISDESYRVYVLVNSKEIQTQLFLAPINDDPTFYDVLQIKKYYEKTTYNCQILCEKDTKTFGLFGIGKFVKDYGYVWDTYDNYFCISQWYLRRISENINKLRLGCNWQFIPVDEGWTE

SEQ ID NO:24-BoNT/X的多肽序列

MKLEINKFNYNDPIDGINVITMRPPRHSDKINKGKGPFKAFQVIKNIWIVPERYNFTNNTNDLNIPSEPIMEADAIYNPNYLNTPSEKDEFLQGVIKVLERIKSKPEGEKLLELISSSIPLPLVSNGALTLSDNETIAYQENNNIVSNLQANLVIYGPGPDIANNATYGLYSTPISNGEGTLSEVSFSPFYLKPFDESYGNYRSLVNIVNKFVKREFAPDPASTLMHELVHVTHNLYGISNRNFYYNFDTGKIETSRQQNSLIFEELLTFGGIDSKAISSLIIKKIIETAKNNYTTLISERLNTVTVENDLLKYIKNKIPVQGRLGNFKLDTAEFEKKLNTILFVLNESNLAQRFSILVRKHYLKERPIDPIYVNILDDNSYSTLEGFNISSQGSNDFQGQLLESSYFEKIESNALRAFIKICPRNGLLYNAIYRNSKNYLNNIDLEDKKTTSKTNVSYPCSLLNGCIEVENKDLFLISNKDSLNDINLSEEKIKPETTVFFKDKLPPQDITLSNYDFTEANSIPSISQQNILERNEELYEPIRNSLFEIKTIYVDKLTTFHFLEAQNIDESIDSSKIRVELTDSVDEALSNPNKVYSPFKNMSNTINSIETGITSTYIFYQWLRSIVKDFSDETGKIDVIDKSSDTLAIVPYIGPLLNIGNDIRHGDFVGAIELAGITALLEYVPEFTIPILVGLEVIGGELAREQVEAIVNNALDKRDQKWAEVYNITKAQWWGTIHLQINTRLAHTYKALSRQANAIKMNMEFQLANYKGNIDDKAKIKNAISETEILLNKSVEQAMKNTEKFMIKLSNSYLTKEMIPKVQDNLKNFDLETKKTLDKFIKEKEDILGTNLSSSLRRKVSIRLNKNIAFDINDIPFSEFDDLINQYKNEIEDYEVLNLGAEDGKIKDLSGTTSDINIGSDIELADGRENKAIKIKGSENSTIKIAMNKYLRFSATDNFSISFWIKHPKPTNLLNNGIEYTLVENFNQRGWKISIQDSKLIWYLRDHNNSIKIVTPDYIAFNGWNLITITNNRSKGSIVYVNGSKIEEKDISSIWNTEVDDPIIFRLKNNRDTQAFTLLDQFSIYRKELNQNEVVKLYNYYFNSNYIRDIWGNPLQYNKKYYLQTQDKPGKGLIREYWSSFGYDYVILSDSKTITFPNNIRYGALYNGSKVLIKNSKKLDGLVRNKDFIQLEIDGYNMGISADRFNEDTNYIGTTYGTTHDLTTDFEIIQRQEKYRNYCQLKTPYNIFHKSGLMSTETSKPTFHDYRDWVYSSAWYFQNYENLNLRKHTKTNWYFIPKDEGWDED

SEQ ID NO:25-TeNT–UniProt P04958

MPITINNFRYSDPVNNDTIIMMEPPYCKGLDIYYKAFKITDRIWIVPERYEFGTKPEDFNPPSSLIEGASEYYDPNYLRTDSDKDRFLQTMVKLFNRIKNNVAGEALLDKIINAIPYLGNSYSLLDKFDTNSNSVSFNLLEQDPSGATTKSAMLTNLIIFGPGPVLNKNEVRGIVLRVDNKNYFPCRDGFGSIMQMAFCPEYVPTFDNVIENITSLTIGKSKYFQDPALLLMHELIHVLHGLYGMQVSSHEIIPSKQEIYMQHTYPISAEELFTFGGQDANLISIDIKNDLYEKTLNDYKAIANKLSQVTSCNDPNIDIDSYKQIYQQKYQFDKDSNGQYIVNEDKFQILYNSIMYGFTEIELGKKFNIKTRLSYFSMNHDPVKIPNLLDDTIYNDTEGFNIESKDLKSEYKGQNMRVNTNAFRNVDGSGLVSKLIGLCKKIIPPTNIRENLYNRTASLTDLGGELCIKIKNEDLTFIAEKNSFSEEPFQDEIVSYNTKNKPLNFNYSLDKIIVDYNLQSKITLPNDRTTPVTKGIPYAPEYKSNAASTIEIHNIDDNTIYQYLYAQKSPTTLQRITMTNSVDDALINSTKIYSYFPSVISKVNQGAQGILFLQWVRDIIDDFTNESSQKTTIDKISDVSTIVPYIGPALNIVKQGYEGNFIGALETTGVVLLLEYIPEITLPVIAALSIAESSTQKEKIIKTIDNFLEKRYEKWIEVYKLVKAKWLGTVNTQFQKRSYQMYRSLEYQVDAIKKIIDYEYKIYSGPDKEQIADEINNLKNKLEEKANKAMININIFMRESSRSFLVNQMINEAKKQLLEFDTQSKNILMQYIKANSKFIGITELKKLESKINKVFSTPIPFSYSKNLDCWVDNEEDIDVILKKSTILNLDINNDIISDISGFNSSVITYPDAQLVPGINGKAIHLVNNESSEVIVHKAMDIEYNDMFNNFTVSFWLRVPKVSASHLEQYGTNEYSIISSMKKHSLSIGSGWSVSLKGNNLIWTLKDSAGEVRQITFRDLPDKFNAYLANKWVFITITNDRLSSANLYINGVLMGSAEITGLGAIREDNNITLKLDRCNNNNQYVSIDKFRIFCKALNPKEIEKLYTSYLSITFLRDFWGNPLRYDTEYYLIPVASSSKDVQLKNITDYMYLTNAPSYTNGKLNIYYRRLYNGLKFIIKRYTPNNEIDSFVKSGDFIKLYVSYNNNEHIVGYPKDGNAFNNLDRILRVGYNAPGIPLYKKMEAVKLRDLKTYSVQLKLYDDKNASLGLVGTHNGQIGNDPNRDILIASNWYFNHLKDKILGCDWYFVPTDEGWTND

SEQ ID NO:26–标记的EGF TM多肽的多肽序列

*HHHHHHLAETGGSGGSGGSEFVNKQFNYKDPVNGVDIAYIKIPNAGQMQPVKAFKIHNKIWVIPERDTFTNPEEGDLNPPPEAKQVPVSYYDSTYLSTDNEKDNYLKGVTKLFERIYSTDLGRMLLTSIVRGIPFWGGSTIDTELKVIDTNCINVIQPDGSYRSEELNLVIIGPSADIIQFECKSFGHEVLNLTRNGYGSTQYIRFSPDFTFGFEESLEVDTNPLLGAGKFATDPAVTLAHELIHAGHRLYGIAINPNRVFKVNTNAYYEMSGLEVSFEELRTFGGHDAKFIDSLQENEFRLYYYNKFKDIASTLNKAKSIVGTTASLQYMKNVFKEKYLLSEDTSGKFSVDKLKFDKLYKMLTEIYTEDNFVKFFKVLNRKTYLNFDKAVFKINIVPKVNYTIYDGFNLRNTNLAANFNGQNTEINNMNFTKLKNFTGLFEFYKLLCVDGIITSKTKSLIEGRNKALNLQCIKVNNWDLFFSPSEDNFTNDLNKGEEITSDTNIEAAEENISLDLIQQYYLTFNFDNEPENISIENLSSDIIGQLELMPNIERFPNGKKYELDKYTMFHYLRAQEFEHGKSRIALTNSVNEALLNPSRVYTFFSSDYVKKVNKATEAAMFLGWVEQLVYDFTDETSEVSTTDKIADITIIIPYIGPALNIGNMLYKDDFVGALIFSGAVILLEFIPEIAIPVLGTFALVSYIANKVLTVQTIDNALSKRNEKWDEVYKYIVTNWLAKVNTQIDLIRKKMKEALENQAEATKAIINYQYNQYTEEEKNNINFNIDDLSSKLNESINKAMININKFLNQCSVSYLMNSMIPYGVKRLEDFDASLKDALLKYIYDNRGTLIGQVDRLKDKVNNTLSTDIPFQLSKYVDNQRLLSTLEGGGGSGGGGSGGGGSALDNSDPKCPLSHEGYCLNDGVCMYIGTLDRYACNCVVGYVGERCQYRDLKLAELRGLEAGGSGGGSGLPESGK

*＝HiLyte555；

＝HiLyte488

SEQ ID NO:27–C.ternatea butelase 1的多肽序列(加上信号肽)

MKNPLAILFLIATVVAVVSGIRDDFLRLPSQASKFFQADDNVEGTRWAVLVAGSKGYVNYRHQADVCHAYQILKKGGLKDENIIVFMYDDIAYNESNPHPGVIINHPYGSDVYKGVPKDYVGEDINPPNFYAVLLANKSALTGTGSGKVLDSGPNDHVFIYYTDHGGAGVLGMPSKPYIAASDLNDVLKKKHASGTYKSIVFYVESCESGSMFDGLLPEDHNIYVMGASDTGESSWVTYCPLQHPSPPPEYDVCVGDLFSVAWLEDCDVHNLQTETFQQQYEVVKNKTIVALIEDGTHVVQYGDVGLSKQTLFVYMGTDPANDNNTFTDKNSLGTPRKAVSQRDADLIHYWEKYRRAPEGSSRKAEAKKQLREVMAHRMHIDNSVKHIGKLLFGIEKGHKMLNNVRPAGLPVVDDWDCFKTLIRTFETHCGSLSEYGMKHMRSFANLCNAGIRKEQMAEASAQACVSIPDNPWSSLHAGFSV

SEQ ID NO:28–C.ternatea butelase 1的多肽序列(减去信号肽)

IRDDFLRLPSQASKFFQADDNVEGTRWAVLVAGSKGYVNYRHQADVCHAYQILKKGGLKDENIIVFMYDDIAYNESNPHPGVIINHPYGSDVYKGVPKDYVGEDINPPNFYAVLLANKSALTGTGSGKVLDSGPNDHVFIYYTDHGGAGVLGMPSKPYIAASDLNDVLKKKHASGTYKSIVFYVESCESGSMFDGLLPEDHNIYVMGASDTGESSWVTYCPLQHPSPPPEYDVCVGDLFSVAWLEDCDVHNLQTETFQQQYEVVKNKTIVALIEDGTHVVQYGDVGLSKQTLFVYMGTDPANDNNTFTDKNSLGTPRKAVSQRDADLIHYWEKYRRAPEGSSRKAEAKKQLREVMAHRMHIDNSVKHIGKLLFGIEKGHKMLNNVRPAGLPVVDDWDCFKTLIRTFETHCGSLSEYGMKHMRSFANLCNAGIRKEQMAEASAQACVSIPDNPWSSLHAGFSV

SEQ ID NO:29–带有缀合的可检测标记和分选酶供体位点的肽

GGGGK

＝HiLyte488

SEQ ID NO:30–带有缀合的可检测标记和分选酶受体位点的肽

*HHHHHHLAETGGG

*＝HiLyte555

SEQ ID NO:31–金黄色葡萄球菌分选酶A的多肽序列

MKKWTNRLMTIAGVVLILVAAYLFAKPHIDNYLHDKDKDEKIEQYDKNVKEQASKDKKQQAKPQIPKDKSKVAGYIEIPDADIKEPVYPGPATPEQLNRGVSFAEENESLDDQNISIAGHTFIDRPNYQFTNLKAAKKGSMVYFKVGNETRKYKMTSIRDVKPTDVGVLDEQKGKDKQLTLITCDDYNEKTGVWEKRKIFVATEVK

SEQ ID NO:32–金黄色葡萄球菌分选酶B的多肽序列

MRMKRFLTIVQILLVVIIIIFGYKIVQTYIEDKQERANYEKLQQKFQMLMSKHQEHVRPQFESLEKINKDIVGWIKLSGTSLNYPVLQGKTNHDYLNLDFEREHRRKGSIFMDFRNELKNLNHNTILYGHHVGDNTMFDVLEDYLKQSFYEKHKIIEFDNKYGKYQLQVFSAYKTTTKDNYIRTDFENDQDYQQFLDETKRKSVINSDVNVTVKDRIMTLSTCEDAYSETTKRIVVVAKIIKVS

SEQ ID NO:33–肺炎链球菌分选酶A的多肽序列

MEKLYIHLKNLRKVAVVMLLVFTTFYLLLMFLNQSDNQEIAKNIEKFNDSVIVAKTDNTKADIKEIEKNIEKVRKIEGGNVERVNQLTSENEKVKENIDLNIEEEIIENSYKSLETTDNFEKLGIIEIPKIDLNLSIFKGKPFVNTKNRQDTMLYGAVTNKKNQKMGRENYVLASHIISNSNLLFTSINQLEKGDVITLKDSEYSYQYTVYNNFIVSKDETWILNDIKDYSILTLYTCYDDSTKLPENRVVIRAVLTDIN

SEQ ID NO:34–肺炎链球菌分选酶B的多肽序列

MAKTKKQKRNNLLLGVVFFIGXAVMAYPLVSRLYYRVESNQQIADFDKEKATLDEADIDERMKLAQAFNDSLNNVVSGDPWSEEMKKKGRAEYARMLEIHERMGHVEIPAIDVDLPVYAGTAEEVLQQGAGHLEGTSLPIGGNSTHAVITAHTGLPTAKMFTDLTKLKVGDKFYVHNIKEVMAYQVDQVKVIEPTNFDDLLIVPGHDYVTLLTCTPYMINTHRLLVRGHRIPYVAEVEEEFIAANKLSHLYRYLFYVAVGLIVILLWIIRRLRKKKRQSERALKALKEATKEVKVEDE

其中X是Met或Ile。

SEQ ID NO:35–肺炎链球菌分选酶C的多肽序列

MDNSRRSRKKGTKKKKHPLILLLIFLVGFAVAIYPLVSRYYYRIESNEVIKEFDETVSQMDKAELEERWRLAQAFNATLKPSEILDPFTEQEKKKGVSEYANMLKVHERIGYVEIPAIDQEIPMYVGTSEDILQKGAGLLEGASLPVGGKNTHTVITAHRGLPTAELFSQLDKMKKGDIFYLHVLDQVLAYQVDQIVTVEPNDFEPVLIQHGEDYATLLTCTPYMINSHRLLVRGKRIPYTAPIAERNRAVRERGQFWLWLLLGAMAVILLLLYRVYRNRRIVKGLEKQLEGRHVKD

SEQ ID NO:36–肺炎链球菌分选酶D的多肽序列

MSRTKLRALLGYLLMLVACLIPIYCFGQMVLQSLGQVKGHATFVKSMTTEMYQEQQNHSLAYNQRLASQNRIVDPFLAEGYEVNYQVSDDPDAVYGYLSIPSLEIMEPVYLGADYHHLGMGLAHVDGTPLPMDGTGIRSVIAGHRAEPSHVFFRHLDQLKVGDALYYDNGQEIVEYQMMDTEIILPSEWEKLESVSSKNIMTLITCDPIPTFNKRLLVNFERVAVYQKSDPQTAAVARVAFTKEGQSVSRVATSQWLYRGLVVLAFLGILFVLWKLARLLRGK

SEQ ID NO:37–化脓性链球菌分选酶A的多肽序列

MVKKQKRRKIKSMSWARKLLIAVLLILGLALLFNKPIRNTLIARNSNKYQVTKVSKKQIKKNKEAKSTFDFQAVEPVSTESVLQAQMAAQQLPVIGGIAIPELGINLPIFKGLGNTELIYGAGTMKEEQVMGGENNYSLASHHIFGITGSSQMLFSPLERAQNGMSIYLTDKEKIYEYIIKDVFTVAPERVDVIDDTAGLKEVTLVTCTDIEATERIIVKGELKTEYDFDKAPADVLKAFNHSYNQVST

SEQ ID NO:38–蛋白水解失活的BoNT/A(0)突变体的多肽序列

MPFVNKQFNYKDPVNGVDIAYIKIPNAGQMQPVKAFKIHNKIWVIPERDTFTNPEEGDLNPPPEAKQVPVSYYDSTYLSTDNEKDNYLKGVTKLFERIYSTDLGRMLLTSIVRGIPFWGGSTIDTELKVIDTNCINVIQPDGSYRSEELNLVIIGPSADIIQFECKSFGHEVLNLTRNGYGSTQYIRFSPDFTFGFEESLEVDTNPLLGAGKFATDPAVTLAHQLIYAGHRLYGIAINPNRVFKVNTNAYYEMSGLEVSFEELRTFGGHDAKFIDSLQENEFRLYYYNKFKDIASTLNKAKSIVGTTASLQYMKNVFKEKYLLSEDTSGKFSVDKLKFDKLYKMLTEIYTEDNFVKFFKVLNRKTYLNFDKAVFKINIVPKVNYTIYDGFNLRNTNLAANFNGQNTEINNMNFTKLKNFTGLFEFYKLLCVRGIITSKTKSLDKGYNKALNDLCIKVNNWDLFFSPSEDNFTNDLNKGEEITSDTNIEAAEENISLDLIQQYYLTFNFDNEPENISIENLSSDIIGQLELMPNIERFPNGKKYELDKYTMFHYLRAQEFEHGKSRIALTNSVNEALLNPSRVYTFFSSDYVKKVNKATEAAMFLGWVEQLVYDFTDETSEVSTTDKIADITIIIPYIGPALNIGNMLYKDDFVGALIFSGAVILLEFIPEIAIPVLGTFALVSYIANKVLTVQTIDNALSKRNEKWDEVYKYIVTNWLAKVNTQIDLIRKKMKEALENQAEATKAIINYQYNQYTEEEKNNINFNIDDLSSKLNESINKAMININKFLNQCSVSYLMNSMIPYGVKRLEDFDASLKDALLKYIYDNRGTLIGQVDRLKDKVNNTLSTDIPFQLSKYVDNQRLLSTFTEYIKNIINTSILNLRYESNHLIDLSRYASKINIGSKVNFDPIDKNQIQLFNLESSKIEVILKNAIVYNSMYENFSTSFWIRIPKYFNSISLNNEYTIINCMENNSGWKVSLNYGEIIWTLQDTQEIKQRVVFKYSQMINISDYINRWIFVTITNNRLNNSKIYINGRLIDQKPISNLGNIHASNNIMFKLDGCRDTHRYIWIKYFNLFDKELNEKEIKDLYDNQSNSGILKDFWGDYLQYDKPYYMLNLYDPNKYVDVNNVGIRGYMYLKGPRGSVMTTNIYLNSSLYRGTKFIIKKYASGNKDNIVRNNDRVYINVVVKNKEYRLATNASQAGVEKILSALEIPDVGNLSQVVVMKSKNDQGITNKCKMNLQDNNGNDIGFIGFHQFNNIAKLVASNWYNRQIERSSRTLGCSWEFIPVDDGWGERPL

SEQ ID NO:39-带有双标记的SrtA位点的全长蛋白水解失活的BoNT/A(0)突变体的核苷酸序列

ATGGAGAACCTGTATTTTCAGGGCGGCGGTGGCAGCGGCGGCAGCGGCGGCAGCCCGTTTGTGAACAAGCAGTTCAACTATAAAGATCCGGTTAATGGTGTGGATATCGCCTATATCAAAATTCCGAATGCAGGTCAGATGCAGCCGGTTAAAGCCTTTAAAATCCATAACAAAATTTGGGTGATTCCGGAACGTGATACCTTTACCAATCCGGAAGAAGGTGATCTGAATCCGCCTCCGGAAGCAAAACAGGTTCCGGTTAGCTATTATGATAGCACCTATCTGAGCACCGATAACGAGAAAGATAACTATCTGAAAGGTGTGACCAAACTGTTTGAACGCATTTATAGTACCGATCTGGGTCGTATGCTGCTGACCAGCATTGTTCGTGGTATTCCGTTTTGGGGTGGTAGCACCATTGATACCGAACTGAAAGTTATTGACACCAACTGCATTAATGTGATTCAGCCGGATGGTAGCTATCGTAGCGAAGAACTGAATCTGGTTATTATTGGTCCGAGCGCAGATATCATTCAGTTTGAATGTAAAAGCTTTGGCCACGAAGTTCTGAATCTGACCCGTAATGGTTATGGTAGTACCCAGTATATTCGTTTCAGTCCGGATTTTACCTTTGGCTTTGAAGAAAGCCTGGAAGTTGATACAAATCCGCTGTTAGGTGCAGGTAAATTTGCAACCGATCCGGCAGTTACCCTGGCACACCAGCTGATTTATGCCGGTCATCGTCTGTATGGTATTGCCATTAATCCGAATCGTGTGTTCAAAGTGAATACCAACGCCTATTATGAAATGAGCGGTCTGGAAGTGAGTTTTGAAGAACTGCGTACCTTTGGTGGTCATGATGCCAAATTTATCGATAGCCTGCAAGAAAATGAATTTCGCCTGTACTACTATAACAAATTCAAGGATATTGCGAGCACCCTGAATAAAGCCAAAAGCATTGTTGGCACCACCGCAAGCCTGCAGTATATGAAAAATGTGTTTAAAGAAAAATATCTGCTGAGCGAAGATACCAGCGGTAAATTTAGCGTTGACAAACTGAAATTCGATAAACTGTACAAGATGCTGACCGAGATTTATACCGAAGATAACTTCGTGAAGTTTTTCAAAGTGCTGAACCGCAAAACCTACCTGAACTTTGATAAAGCCGTGTTCAAAATCAACATCGTGCCGAAAGTGAACTATACCATCTATGATGGTTTTAACCTGCGCAATACCAATCTGGCAGCAAACTTTAATGGTCAGAACACCGAAATCAACAACATGAACTTTACCAAACTGAAGAACTTCACCGGTCTGTTCGAATTTTACAAACTGCTGTGTGTTCGTGGCATTATTACCAGCAAAACCAAAAGTCTGGATAAAGGCTACAATAAAGCCCTGAATGATCTGTGCATTAAGGTGAATAATTGGGACCTGTTTTTTAGCCCGAGCGAGGATAATTTCACCAACGATCTGAACAAAGGCGAAGAAATTACCAGCGATACCAATATTGAAGCAGCCGAAGAAAACATTAGCCTGGATCTGATTCAGCAGTATTATCTGACCTTCAACTTCGATAATGAGCCGGAAAATATCAGCATTGAAAACCTGAGCAGCGATATTATTGGCCAGCTGGAACTGATGCCGAATATTGAACGTTTTCCGAACGGCAAAAAATACGAGCTGGATAAATACACCATGTTCCATTATCTGCGTGCCCAAGAATTTGAACATGGTAAAAGCCGTATTGCACTGACCAATAGCGTTAATGAAGCACTGCTGAACCCGAGCCGTGTTTATACCTTTTTTAGCAGCGATTACGTGAAAAAGGTTAACAAAGCAACCGAAGCAGCCATGTTTTTAGGTTGGGTTGAACAGCTGGTTTATGATTTCACCGATGAAACCAGCGAAGTTAGCACCACCGATAAAATTGCAGATATTACCATCATCATCCCGTATATCGGTCCGGCACTGAATATTGGCAATATGCTGTATAAAGACGATTTTGTGGGTGCCCTGATTTTTAGCGGTGCAGTTATTCTGCTGGAATTTATTCCGGAAATTGCCATTCCGGTTCTGGGCACCTTTGCACTGGTGAGCTATATTGCAAATAAAGTTCTGACCGTGCAGACCATCGATAATGCACTGAGCAAACGTAACGAAAAATGGGATGAAGTGTACAAGTATATCGTGACCAATTGGCTGGCAAAAGTTAACACCCAGATTGACCTGATTCGCAAGAAGATGAAAGAAGCACTGGAAAATCAGGCAGAAGCAACCAAAGCCATTATCAACTATCAGTATAACCAGTACACCGAAGAAGAGAAAAATAACATCAACTTCAACATCGACGATCTGTCCAGCAAACTGAACGAAAGCATCAACAAAGCCATGATTAACATTAACAAATTTCTGAACCAGTGCAGCGTGAGCTATCTGATGAATAGCATGATTCCGTATGGTGTGAAACGTCTGGAAGATTTTGATGCAAGCCTGAAAGATGCCCTGCTGAAATATATCTATGATAATCGTGGCACCCTGATTGGTCAGGTTGATCGTCTGAAAGATAAAGTGAACAACACCCTGAGTACCGATATTCCTTTTCAGCTGAGCAAATATGTGGATAATCAGCGTCTGCTGTCAACCTTTACCGAATACATTAAGAACATCATCAACACCAGCATTCTGAACCTGCGTTATGAAAGCAATCATCTGATTGATCTGAGCCGTTATGCCAGCAAAATCAATATAGGCAGCAAGGTTAACTTCGACCCGATTGACAAAAATCAGATACAGCTGTTTAATCTGGAAAGCAGCAAAATTGAGGTGATCCTGAAAAACGCCATTGTGTATAATAGCATGTACGAGAATTTCTCGACCAGCTTTTGGATTCGTATCCCGAAATACTTTAATAGCATCAGCCTGAACAACGAGTACACCATTATTAACTGCATGGAAAACAATAGCGGCTGGAAAGTTAGCCTGAATTATGGCGAAATTATCTGGACCCTGCAGGATACCCAAGAAATCAAACAGCGTGTGGTTTTCAAATACAGCCAGATGATTAATATCAGCGACTATATCAACCGCTGGATTTTTGTGACCATTACCAATAATCGCCTGAATAACAGCAAGATCTATATTAACGGTCGTCTGATTGACCAGAAACCGATTAGTAATCTGGGTAATATTCATGCGAGCAACAACATCATGTTTAAACTGGATGGTTGTCGTGATACCCATCGTTATATTTGGATCAAGTACTTCAACCTGTTCGATAAAGAGTTGAACGAAAAAGAAATTAAAGACCTGTATGATAACCAGAGCAACAGCGGTATTCTGAAGGATTTTTGGGGAGATTATCTGCAGTATGACAAACCGTATTATATGCTGAATCTGTACGACCCGAATAAATACGTGGATGTGAATAATGTTGGCATCCGTGGTTATATGTACCTGAAAGGTCCGCGTGGTAGCGTTATGACCACAAACATTTATCTGAATAGCAGCCTGTATCGCGGAACCAAATTCATCATTAAAAAGTATGCCAGCGGCAACAAGGATAATATTGTGCGTAATAATGATCGCGTGTACATTAACGTTGTGGTGAAGAATAAAGAATATCGCCTGGCAACCAATGCAAGCCAGGCAGGCGTTGAAAAAATTCTGAGTGCCCTGGAAATTCCGGATGTTGGTAATCTGAGCCAGGTTGTTGTGATGAAAAGCAAAAATGATCAGGGCATCACCAACAAGTGCAAAATGAATCTGCAGGACAATAACGGCAACGATATTGGTTTTATTGGCTTCCACCAGTTCAACAATATTGCGAAACTGGTTGCAAGCAATTGGTATAATCGTCAGATTGAACGTAGCAGTCGTACCCTGGGTTGTAGCTGGGAATTTATCCCTGTGGATGATGGTTGGGGTGAACGTCCGCTGGGCGGCAGCGGCGGCGGCAGCGGCCTGCCCGAAAGCGGTGGCGGATCTGCTTGGTCTCACCCGCAGTTCGAAAAAGGTGGTGGTTCTGGTGGTGGTTCTGGTGGTTCTGCTTGGTCTCACCCGCAGTTCGAAAAATAATGA

SEQ ID NO:40-带有双标记的SrtA位点的全长蛋白水解失活的BoNT/A(0)突变体的多肽序列

MENLYFQGGGGSGGSGGSPFVNKQFNYKDPVNGVDIAYIKIPNAGQMQPVKAFKIHNKIWVIPERDTFTNPEEGDLNPPPEAKQVPVSYYDSTYLSTDNEKDNYLKGVTKLFERIYSTDLGRMLLTSIVRGIPFWGGSTIDTELKVIDTNCINVIQPDGSYRSEELNLVIIGPSADIIQFECKSFGHEVLNLTRNGYGSTQYIRFSPDFTFGFEESLEVDTNPLLGAGKFATDPAVTLAHQLIYAGHRLYGIAINPNRVFKVNTNAYYEMSGLEVSFEELRTFGGHDAKFIDSLQENEFRLYYYNKFKDIASTLNKAKSIVGTTASLQYMKNVFKEKYLLSEDTSGKFSVDKLKFDKLYKMLTEIYTEDNFVKFFKVLNRKTYLNFDKAVFKINIVPKVNYTIYDGFNLRNTNLAANFNGQNTEINNMNFTKLKNFTGLFEFYKLLCVRGIITSKTKSLDKGYNKALNDLCIKVNNWDLFFSPSEDNFTNDLNKGEEITSDTNIEAAEENISLDLIQQYYLTFNFDNEPENISIENLSSDIIGQLELMPNIERFPNGKKYELDKYTMFHYLRAQEFEHGKSRIALTNSVNEALLNPSRVYTFFSSDYVKKVNKATEAAMFLGWVEQLVYDFTDETSEVSTTDKIADITIIIPYIGPALNIGNMLYKDDFVGALIFSGAVILLEFIPEIAIPVLGTFALVSYIANKVLTVQTIDNALSKRNEKWDEVYKYIVTNWLAKVNTQIDLIRKKMKEALENQAEATKAIINYQYNQYTEEEKNNINFNIDDLSSKLNESINKAMININKFLNQCSVSYLMNSMIPYGVKRLEDFDASLKDALLKYIYDNRGTLIGQVDRLKDKVNNTLSTDIPFQLSKYVDNQRLLSTFTEYIKNIINTSILNLRYESNHLIDLSRYASKINIGSKVNFDPIDKNQIQLFNLESSKIEVILKNAIVYNSMYENFSTSFWIRIPKYFNSISLNNEYTIINCMENNSGWKVSLNYGEIIWTLQDTQEIKQRVVFKYSQMINISDYINRWIFVTITNNRLNNSKIYINGRLIDQKPISNLGNIHASNNIMFKLDGCRDTHRYIWIKYFNLFDKELNEKEIKDLYDNQSNSGILKDFWGDYLQYDKPYYMLNLYDPNKYVDVNNVGIRGYMYLKGPRGSVMTTNIYLNSSLYRGTKFIIKKYASGNKDNIVRNNDRVYINVVVKNKEYRLATNASQAGVEKILSALEIPDVGNLSQVVVMKSKNDQGITNKCKMNLQDNNGNDIGFIGFHQFNNIAKLVASNWYNRQIERSSRTLGCSWEFIPVDDGWGERPLGGSGGGSGLPESGGGSAWSHPQFEKGGGSGGGSGGSAWSHPQFEK

SEQ ID NO:41–Prochloron didemni PATG的多肽序列

MFSIMITIDYPFTVSLNRDIQVTSTEDYYTLQVTESDPSAWLTFATTPAMDMAFDHLKAGTTTESLVQTLAELGGPAAREQFALTLQQLDERGWLSYAVLPLAEAIPMVESAELNLPGNPHWMETGVTLSRFAYQHPYEGTMVLESPLSKFRVKLLDWRASALLAQLAQPQTLGTIAPPPYLGPETAYQFLNLLWATGFLASDHEPVSLQLWDFHNLLFHSRSRLGRHDYPGTDLNVDNWSDFPVVKPPMSDRIVPLPRPNLEALMSNDATLTEAIETRKSVREYDDDNPITIEQLGELL

YRAARVTKLLSPEERFGKLWQQNKPVFEEAGVDEGEFSHRPYPGGGAMYELEIYPVVRLCQGLSQGVYHYDPLNHQLEQIVESKDDIFAVSGSPLASKLGPHVLLVITARFGRLFRLYRSVAYALVLKHVGVLQQNLYLVATNMGLAPCAGGAGDSDAFAQVTGIDYVEESAVGEFILGSLASEVESDVVEGEDEIESAGVSASEVESSATKQKVALHPHDLDERIPGLADLHNQTLGDPQITIVIIDGDPDYTLSCFEGAEVSKVFPYWHEPAEPITPEDYAAFQSIRDQGLKGKEKEE

ALEAVIPDTKDRIVLNDHACHVTSTIVGQEHSPVFGIAPNCRVINMPQDAVIRGNYDDVMSPLNLARAIDLALELGANIIHCAFCRPTQTSEGEEILVQAIKKCQDNNVLIVSPTGNNSNESWCLPAVLPGTLAVGAAKVDGTPCHFSNWGGNNTKEGILAPGEEILGAQPCTEEPVRLTGTSMAAPVMTGISALLMSLQVQQGKPVDAEAVRTALLKTAIPCDPEVVEEPERCLRGFVNIPGAMKVLFGQPSVTVSFAGGQATRTEHPGYATVAPASIPEPMAERATPAVQAATATEMV

IAPSTEPANPATVEASTAFSGNVYALGTIGYDFGDEARRDTFKERMADPYDARQMVDYLDRNPDEARSLIWTLNLEGDVIYALDPKGPFATNVYEIFLQMLAGQLEPETSADFIERLSVPARRTTRTVELFSGEVMPVVNVRDPRGMYGWNVNALVDAALATVEYEEADEDSLRQGLTAFLNRVYHDLHNLGQTSRDRALNFTVTNTFQAASTFAQAIASGRQLDTIEVNKSPYCRLNSDCWDVLLTFYDPEHGRRSRRVFRFTLDVVYVLPVTVGSIKSWSLPGKGTVSK

SEQ ID NO:42–Saponaria vaccaria PCY1的多肽序列

MATSGFSKPLHYPPVRRDETVVDDYFGVKVADPYRWLEDPNSEETKEFVDNQEKLANSVLEECELIDKFKQKIIDFVNFPRCGVPFRRANKYFHFYNSGLQAQNVFQMQDDLDGKPEVLYDPNLREGGRSGLSLYSVSEDAKYFAFGIHSGLTEWVTIKILKTEDRSYLPDTLEWVKFSPAIWTHDNKGFFYCPYPPLKEGEDHMTRSAVNQEARYHFLGTDQSEDILLWRDLENPAHHLKCQITDDGKYFLLYILDGCDDANKVYCLDLTKLPNGLESFRGREDSAPFMKLIDSFDASY

TAIANDGSVFTFQTNKDAPRKKLVRVDLNNPSVWTDLVPESKKDLLESAHAVNENQLILRYLSDVKHVLEIRDLESGALQHRLPIDIGSVDGITARRRDSVVFFKFTSILTPGIVYQCDLKNDPTQLKIFRESVVPDFDRSEFEVKQVFVPSKDGTKIPIFIAARKGISLDGSHPCEMHGYGGFGINMMPTFSASRIVFLKHLGGVFCLANIRGGGEYGEEWHKAGFRDKKQNVFDDFISAAEYLISSGYTKARRVAIEGGSNGGLLVAACINQRPDLFGCAEANCGVMDMLRFHKFTLG

YLWTGDYGCSDKEEEFKWLIKYSPIHNVRRPWEQPGNEETQYPATMILTADHDDRVVPLHSFKLLATMQHVLCTSLEDSPQKNPIIARIQRKAAHYGRATMTQIAEVADRYGFMAKALEAPWID

SEQ ID NO:43-Galerina marginata POPB的多肽序列

MSSVTWAPGNYPSTRRSDHVDTYQSASKGEVPVPDPYQWLEESTDEVDKWTTAQADLAQSYLDQNADIQKLAEKFRASRNYAKFSAPTLLDDGHWYWFYNRGLQSQSVLYRSKEPALPDFSKGDDNVGDVFFDPNVLAADGSAGMVLCKFSPDGKFFAYAVSHLGGDYSTIYVRSTSSPLSQASVAQGVDGRLSDEVKWFKFSTIIWTKDSKGFLYQRYPARERHEGTRSDRNAMMCYHKVGTTQEEDIIVYQDNEHPEWIYGADTSEDGKYLYLYQFKDTSKKNLLWVAELDEDGVKSG

IHWRKVVNEYAADYNIITNHGSLVYIKTNLNAPQYKVITIDLSKDEPEIRDFIPEEKDAKLAQVNCANEEYFVAIYKRNVKDEIYLYSKAGVQLTRLAPDFVGAASIANRQKQTHFFLTLSGFNTPGTIARYDFTAPETQRFSILRTTKVNELDPDDFESTQVWYESKDGTKIPMFIVRHKSTKFDGTAAAIQYGYGGFATSADPFFSPIILTFLQTYGAIFAVPSIRGGGEFGEEWHKGGRRETKVNTFDDFIAAAQFLVKNKYAAPGKVAINGASNGGLLVMGSIVRAPEGTFGAAVP

EGGVADLLKFHKFTGGQAWISEYGNPSIPEEFDYIYPLSPVHNVRTDKVMPATLITVNIGDGRVVPMHSFKFIATLQHNVPQNPHPLLIKIDKSWLGHGMGKPTDKNVKDAADKWGFIARALGLELKTVE

MVRYLAGAVLLLVVLSVAAAVSGARDGDYLHLPSEVSRFFRPQETNDDHGEDSVGTRWAVLIAGSKGYANYRHQAGVCHAYQILKRGGLKDENIVVFMYDDIAYNESNPRPGVIINSPHGSDVYAGVPKDYTGEEVNAKNFLAAILGNKS

AITGGSGKVVDSGPNDHIFIYYTDHGAAGVIGMPSKPYLYADELNDALKKKHASGTYKSLVFYLEACESGSMFEGILPEDLNIYALTSTNTTESSWCYYCPAQENPPPPEYNVCLGDLFSVAWLEDSDVQNSWYETLNQQYHHVDKRISH

ASHATQYGNLKLGEEGLFVYMGSNPANDNYTSLDGNALTPSSIVVNQRDADLLHLWEKFRKAPEGSARKEVAQTQIFKAMSHRVHIDSSIKLIGKLLFGIEKCTEILNAVRPAGQPLVDDWACLRSLVGTFETHCGSLSEYGMRHTRTIA

NICNAGISEEQMAEAASQACASIP

ARDGDYLHLPSEVSRFFRPQETNDDHGEDSVGTRWAVLIAGSKGYANYRHQAGVCHAYQILKRGGLKDENIVVFMYDDIAYNESNPRPGVIINSPHGSDVYAGVPKDYTGEEVNAKNFLAAILGNKSAITGGSGKVVDSGPNDHIFIYYTDHGAAGVIGMPSKPYLYADELNDALKKKHASGTYKSLVFYLEACESGSMFEGILPEDLNIYALTSTNTTESSWCYYCPAQENPPPPEYNVCLGDLFSVAWLEDSDVQNSWYETLNQQYHHVDKRISHASHATQYGNLKLGEEGLFVYMGSNPANDNYTSLDGNALTPSSIVVNQRDADLLHLWEKFRKAPEGSARKEVAQTQIFKAMSHRVHIDSSIKLIGKLLFGIEKCTEILNAVRPAGQPLVDDWACLRSLVGTFETHCGSLSEYGMRHTRTIANICNAGISEEQMAEAASQACASIP

实施例

实施例1

德克萨斯红、eGFP、SNAP和SrtA介导的单标记和双标记的EGF配体多肽的设计

尝试了多种标记多肽的策略。目的是获得标记版本的多肽，该版本不影响多肽的结构特征及其运输入细胞和有效切割SNARE蛋白的能力，并以与未标记版本类似的方式。

尝试了EGF配体多肽的4种不同标记策略(Fonfria，E.，S.Donald和V.A.Cadd(2016)."Botulinum neurotoxin A and an engineered derivate targeted secretioninhibitor(TSI)A enter cells via different vesicular compartments."J ReceptSignal Transduct Res 36(1):79-88)。必要时，在克隆后使用标准程序重组表达和纯化多肽，如之前公开的(Masuyer，G.，M.Beard，V.A.Cadd，J.A.Chaddock和K.R.Acharya(2011)。"Structure and activity of a functional derivative of Clostridium botulinumneurotoxin B."J Struct Biol 174(1):52-57，Somm，E.，N.Bonnet，A.Martinez，P.M.Marks，V.A.Cadd，M.Elliott，A.Toulotte，S.L.Ferrari，R.Rizzoli，P.S.Huppi，E.Harper，S.Melmed，R.Jones and M.L.Aubert(2012)."A botulinum toxin-derivedtargeted secretion inhibitor downregulates the GH/IGF1 axis."J Clin Invest122(9):3295-3306)。简而言之，在大肠杆菌感受态细菌中重组表达多肽。使用亲和柱、然后进行阴离子交换层析纯化表达的多肽，酶促活化以产生双链复合物，最后使用疏水相互作用进行抛光步骤。

1.根据制造商的方案，使用德克萨斯红-X蛋白标记试剂盒(Thermo FisherScientific)标记如上所述纯化的未修饰的EGF-配体多肽。通过共聚焦显微镜和实时成像证实了蛋白质的成功标记。用于标记的多肽的核苷酸和多肽序列分别如SEQ ID NO：5和6所示。

2.通过标准克隆程序在EGF配体多肽的N-端标记增强型绿色荧光蛋白(eGFP)。核苷酸和多肽序列分别如SEQ ID NO：9和10所示。如上所述进行蛋白质表达和纯化。表达后，尝试对eGFP标记的EGF配体多肽进行纯化，但未成功。

3.通过标准克隆程序在EGF-配体多肽的N-端标记SNAP-标签底物(New EnglandBiolabs)。核苷酸和多肽序列分别如SEQ ID NO：11和12所示。该蛋白质的表达和纯化是成功的。根据制造商的方案，使用SNAP-表面594荧光底物(New England Biolabs)对SNAP标记的EGF配体多肽进行标记。通过共聚焦显微镜和实时成像证实了蛋白质的成功标记。

4.还尝试产生含有用于位点特异性标记的非天然氨基酸的多肽。然而，由于表达和/或纯化困难，这些尝试没有成功。

5.用两个不同的分选酶A(SrtA)识别位点标记EGF-配体多肽(即具有EGF Tm的多肽)，两个识别位点中的一个在N-端，一个在C-端。SrtA的使用允许在同一蛋白质上缀合两种不同颜色的荧光团。多肽的构建如图1所示。选择SrtA的两个突变版本(Dorr，B.M.，H.O.Ham，C.An，E.L.Chaikof和D.R.Liu(2014)."Reprogramming the specificity ofsortase enzymes."Proc Natl Acad Sci U S A 111(37):13343-13348)(SEQ ID NO:14和16)。已证明其对它们各自的识别位点具有100％的特异性。克隆EGF配体多肽，其在C-端具有第一SrtA的LPESG识别位点，随后是双Strep标签识别位点(IBA-lifesciences)，该位点允许初始的亲和介导的蛋白质纯化。核苷酸和多肽序列分别如SEQ ID NO：1和2所示。单独地，获得了含有与所选荧光团缀合的甘氨酸残基段(Eurogentec)。该肽的序列是：GGGGK(HF488)(SEQ ID NO:29)。在SrtA介导的反应期间，LPESG位点的甘氨酸被SrtA(SEQ ID NO:14)切割，存在于荧光肽上的甘氨酸段被SrtA识别，用于介导多肽和肽之间的缀合。这产生了荧光单标记的EGF配体多肽。需要注意的是，标记的多肽不再具有Strep标签，使用反向亲和介导的纯化步骤来选择多肽的标记部分。为了双标记EGF配体多肽，在起始密码子和烟草蚀刻病毒(TEV)切割识别位点之后的多肽N-端位点处克隆了3个甘氨酸残基的段。引入TEV位点是为了在上文详述的初始C-端SrtA反应期间帮助防止甘氨酸残基段发生蛋白质环化。单独地，获得了含有与所选荧光团缀合的LAETG识别位点的肽(Eurogentec)。该肽的序列是：HiLyte Fluor^TM555-HHHHHHLAETGGG(SEQ ID NO:30)。此外，在LAETG位点之前放置了6His-标签(6HT)，以便于在SrtA反应后纯化蛋白质(SEQ ID NO:16)。类似地对C-端位点进行SrtA反应，最终的双标记EGF-配体蛋白使用His亲和纯化步骤进行纯化。通过SDS-PAGE凝胶电泳、共聚焦显微镜和实时成像证实了蛋白质成功的单标记和双标记。

在感受态大肠杆菌细菌中表达具有C-端His标签的分选酶A(SrtA)蛋白，并使用亲和捕获柱进行纯化。

在4℃下过夜进行多肽和荧光肽的分选酶缀合，使用的多肽与SrtA与荧光肽的比率分别为1:2:20当量。

在本实施例中，EGF-配体多肽在C-端易位-配体部分与HiLyte 555荧光团缀合，在N-端轻链部分与HiLyte 488荧光团缀合。成功表达了含有SrtA识别位点的多肽和SrtA的两个变体。有利地，通过产生能够用两种不同颜色的荧光团标记的多肽，可以可视化两条轻链(包含非细胞毒性蛋白酶)和蛋白质的易位配体部分的运输机制。

实施例2

SrtA介导的双标记痛敏肽配体多肽的设计

使用用于EGF-配体多肽的策略，产生具有痛敏肽配体TM(痛敏肽-配体多肽)的多肽，用于双荧光标记。用于双标记该多肽的设计、纯化和荧光肽与用于EGF配体多肽的完全相同。通过SDS-PAGE凝胶电泳、共聚焦显微镜和实时成像证实了多肽成功的双标记。含有分选酶位点的多肽的核苷酸和多肽序列分别如SEQ ID NO：3和4所示。

使用SNAP25切割测定法验证标记的蛋白质

为了确定配体多肽的标记不影响它们与其各自受体的结合、运输到细胞中和易位的能力，进行了SNAP25切割测定法以确定标记多肽与未标记形式相比的相对效力。类似的效力谱表明标记多肽的运输与未标记版本类似。如先前所述进行SNAP25切割测定法(Fonfria，E.，S.Donald and V.A.Cadd(2016)."Botulinum neurotoxin A and anengineered derivate targeted secretion inhibitor(TSI)A enter cells viadifferent vesicular compartments."J Recept Signal Transduct Res 36(1):79-88)。简而言之，用3-1000nM的每种标记和未标记的蛋白质处理皮层神经元24小时。处理后，在补充有0.1M二硫苏糖醇和250单位/ml核酸酶(benzonase，Sigma)的NuPAGE裂解缓冲液(Thermo Fischer Scientific)中收获细胞。通过SDS-PAGE分离裂解物，并使用针对SNAP-25(Sigma)的一抗进行蛋白质印迹。这些抗体能够识别SNAP25的切割和未切割部分。通过切割的SNAP25与未切割的SNAP25的比例确定相对效力(图2)。图2A显示了EGF-配体多肽的剂量反应效力。与未标记的多肽相比，德克萨斯红和SNAP594标记的版本表现出强的效力降低，其值与无配体的对照多肽相似。相比之下，SrtA介导的单标记和双标记多肽显示出与未标记版本相似的效力，表明这种标记策略不影响蛋白质结构及其细胞运输机制。类似地，与未标记的对照多肽相比，痛敏肽配体多肽的双标记不影响其在皮层神经元中的效力(图2B)。

总之，最初试用了简单而直接的标记技术，例如使用德克萨斯红染料的非位点特异性标记，和SNAP标签的位点特异性版本。然而，尽管这些标记策略是成功的，但与未标记的对应物相比，它们显示出影响多肽的效力，这表明在德克萨斯红或SNAP标签的情况下，添加几种荧光分子影响标记多肽的运输特性。由于缺乏标记蛋白的表达，尝试产生eGFP标签的EGF-配体多肽是不成功的。与此形成鲜明对比，SNAP25切割测定法证实，在EGF-配体和痛敏肽-配体多肽上添加两个荧光团不影响它们的效力，这表明标记多肽的作用机制与其未标记的对应物相似。鉴于SNAP和德克萨斯红标记对效力的负面影响，这是令人惊讶的。

实施例3

永生化细胞系中双标记的EGF-配体多肽的可视化

选择双标记SrtA介导的技术作为标记本发明多肽的最佳策略。为了可视化哺乳动物细胞中标记的多肽，进行了3D实时共聚焦显微镜检查。用50nM双标记的EGF-配体多肽处理人肺腺癌细胞(A549)，并使用配备AiryScan(Zeiss)的Zeiss 880共聚焦显微镜随时间连续成像。对于这些实验，EGF-配体多肽在N-端用HiLyte 555荧光团(AnaSpec)标记，在C-端用HiLyte 488荧光团(AnaSpec)标记。图3显示在A549细胞内化过程中，由EGF-配体多肽形成的双色聚集体的快照图像。从图3A可以看出，在将多肽加入细胞后3分钟出现聚集体，并且它们的大小和数量随时间增加。在图3B中，显示荧光聚集体随时间消失，在加入多肽后65分钟完全消失。

使用双标记的EGF配体多肽进行的实时成像清楚地验证了标记技术和监测标记多肽的实时内化和运输的能力。

已经证明分选酶标记是有利的并且不影响效力，这现在可以应用于其他梭菌神经毒素，包括BoNT血清型(和衍生物)。

实施例4

SrtA介导的双标记BoNT/A多肽的设计

修饰全长蛋白水解失活BoNT/A(0)突变体(SEQ ID NO:38)，以允许使用分选酶进行双荧光标记(参见图4)。双标记多肽序列如SEQ ID NO:40所示，而编码所述多肽的核苷酸序列如SEQ ID NO:39所示。用于双标记SEQ ID NO:40的设计、纯化和荧光肽与实施例1中的EGF-配体多肽相同。通过SDS-PAGE证实了多肽的双标记是成功的(图5)。更详细地说，通过使用考马斯染色，可以可视化代表多肽L链和H链结构域的两条带，同时将凝胶暴露在紫外线下证明(通过荧光)成功标记了L链和H链。

实施例5

原代皮层神经元中单标记的BoNT/A(0)多肽的可视化

为了在原代神经元细胞中可视化标记的BoNT/A(0)多肽，在用其处理的神经元中进行单分子实时TIRF显微镜检查。原代皮层神经元用1nM单标记的BoNT/A(0)多肽处理，并使用定制的单分子TIRF显微镜随时间连续成像。对于这些实验，BoNT/A(0)多肽在N-端用HiLyte 555或HiLyte 488荧光团(AnaSpec)标记。图6显示了单色分子BoNT/A(0)被运输到原代皮层神经元的随时间推移的图像。从图6可以看出，单个BoNT/A(0)分子(白色箭头)在所选神经元区域内快速移动。单标记BoNT/A(0)多肽的单分子实时TIRF成像清楚地表明，可以使用专门的高分辨率显微技术可视化运输到神经元的BoNT/A(0)单分子。

已经证明BoNT/A(0)的单标记可以在原代神经元的单个分子水平上可视化，这种方法现在可以应用于其他梭菌神经毒素血清型和衍生物，包括那些具有非细胞毒性蛋白酶活性的血清型和衍生物。

以上说明书中提及的所有出版物均通过引用并入本文。在不脱离本发明的范围和主旨的情况下，本发明所描述的方法和系统的各种修改和变化对本领域技术人员将是显而易见的。尽管已经结合特定的优选实施方案描述了本发明，但是应当理解，所要求保护的发明不应不适当地限于这样的特定实施方案。实际上，对于生物化学和生物技术或相关领域的技术人员而言，对描述的用于执行本发明的方式进行各种修改，使其落入以下权利要求的范围内，是显而易见的。

Claims

1.一种制备标记多肽的方法，所述方法包括：

a.提供一种多肽，其包含：

i.分选酶受体位点或分选酶供体位点；

ii.非细胞毒性蛋白酶或其蛋白水解失活突变体；

iii.能够与靶细胞上的结合位点结合的靶向部分(TM)；和

iv.易位结构域；

b.孵育多肽与：

分选酶；和

分别包含分选酶供体位点或分选酶受体位点的标记底物，和缀合的可检测标记；其中分选酶催化：

多肽的分选酶受体位点的氨基酸与标记底物的分选酶供体位点的氨基酸之间的缀合；或

标记底物的分选酶受体位点的氨基酸与多肽的分选酶供体位点的氨基酸之间的缀合；从而标记多肽；和

c.获得标记多肽。

2.用于使用分选酶标记的多肽，所述多肽包含：

i.分选酶受体或供体位点；

iii.能够与靶细胞上的结合位点结合的靶向部分(TM)；和

其中所述供体位点的N-端残基是所述多肽的N-端残基；或者

3.根据权利要求1所述的方法或根据权利要求2所述的多肽，其中所述分选酶受体或供体位点位于所述TM的C-端或其中所述分选酶受体或供体位点位于所述非细胞毒性蛋白酶或其蛋白水解失活突变体的N-端。

4.根据前述权利要求中任一项所述的方法或多肽，其中：

所述分选酶受体位点包含L(A/P/S)X(T/S/A/C)(G/A)、NPQTN、YPRTG、IPQTG、VPDTG或LPXTGS，其中X是任何氨基酸(或由其组成)，和/或其中所述分选酶供体位点包含G_n或A_N，其中n是至少1(或由其组成)。

5.根据前述权利要求中任一项所述的方法或多肽，其中：

所述分选酶受体位点包含L(A/P/S)X(T/S/A/C)G，其中X是任何氨基酸，NPQTN，YPRTG，IPQTG，VPDTG,或LPXTGS,其中X是任何氨基酸(或由其组成)，和/或其中所述分选酶供体位点包含G_n，其中n是至少1(或由其组成)。

6.根据前述权利要求中任一项所述的方法或多肽，其中所述分选酶是分选酶A(SrtA)。

7.根据前述权利要求中任一项所述的方法或多肽，其中所述多肽包含：至少两个分选酶受体位点；至少两个分选酶供体位点；或至少一个分选酶受体位点和至少一个分选酶供体位点。

8.根据权利要求7所述的方法或多肽，其中所述至少两个位点不同，优选地其中所述至少两个位点具有不同的氨基酸序列。

9.根据权利要求7或8所述的方法或多肽，其中：

所述第一分选酶受体或供体位点位于所述TM的C-端，第二分选酶受体或供体位点位于非细胞毒性蛋白酶或其蛋白水解失活突变体的N-端；或者，所述第一分选酶受体或供体位点位于非细胞毒性蛋白酶或其蛋白水解失活突变体的N-端，而所述第二分选酶受体或供体位点位于所述TM的C-端。

10.根据前述权利要求中任一项所述的方法或多肽，其中所述多肽包含与SEQ ID NO:2、4或40具有至少70％序列同一性的多肽序列。

11.根据前述权利要求中任一项所述的方法或多肽，其中所述多肽包含与SEQ ID NO:2、4或40具有至少80％序列同一性的多肽序列。

12.根据前述权利要求中任一项所述的方法或多肽，其中所述多肽包含与SEQ ID NO:2、4或40具有至少90％序列同一性的多肽序列。

13.根据前述权利要求中任一项所述的方法或多肽，其中所述多肽包含如SEQ ID NO:2、4或40所示的多肽序列(优选由其组成)。

14.一种标记多肽，所述多肽包括：

i.与所述多肽缀合的可检测标记；

ii.氨基酸序列，其包含L(A/P/S)X(T/S/A/C)G_n，其中X是任何氨基酸且n为至少1，L(A/P/S)X(T/S/A/C)A_n，其中X是任何氨基酸且n为至少1，NPQTN，YPRTG，IPQTG，VPDTG，LPXTGS,其中X是任何氨基酸，NPKTG，XPETG，LGATG，IPNTG，IPETG，NSKTA，NPQTG，NAKTN，NPQSS，LPXTX，其中X是任何氨基酸，NPX₁TX₂，其中X₁是Lys或Gln且X₂是Asn、Asp或Gly，X₁PX₂X₃G,其中X₁是Leu、Ile、Val或Met，X₂是任何氨基酸且X₃是Ser、Thr或Ala，LPEX₁G，其中X₁是Ala、Cys或Ser，LPXS，LAXT，MPXT，MPXTG，LAXS，NPXT，NPXTG，NAXT，NAXTG，NAXS，NAXSG，LPXP，LPXPG,其中X是任何氨基酸，LRXTG_n或LPAXG_n，其中X是任何氨基酸且n为至少1；

iii.非细胞毒性蛋白酶或其蛋白水解失活突变体；

iv.能够与靶细胞上的结合位点结合的靶向部分(TM)；和

v.易位结构域。

15.根据权利要求14所述的标记多肽，其中氨基酸序列包含L(A/P/S)X(T/S/A/C)G_n，L(A/P/S)X(T/S/A/C)A_n，NPQTN，YPRTG，IPQTG，VPDTG，LPXTGS，NPKTG，XPETG，LGATG，IPNTG，IPETG，NSKTA，NPQTG，NAKTN，NPQSS，LPXTX，NPX₁TX₂，X₁PX₂X₃G，LPEX₁G，LPXS，LAXT，MPXT，MPXTG，LAXS，NPXT，NPXTG，NAXT，NAXTG，NAXS，NAXSG，LPXP，LPXPG，LRXTG_n或LPAXG_n，其中X是任何氨基酸且n为至少1，并且所述氨基酸序列位于TM的C-端；或其中氨基酸序列包含L(A/P/S)X(T/S/A/C)G_n，L(A/P/S)X(T/S/A/C)A_n，NPQTN，YPRTG，IPQTG，VPDTG，LPXTGS，NPKTG，XPETG，LGATG，IPNTG，IPETG，NSKTA，NPQTG，NAKTN，NPQSS，LPXTX，NPX₁TX₂，X₁PX₂X₃G，LPEX₁G，LPXS，LAXT，MPXT，MPXTG，LAXS，NPXT，NPXTG，NAXT，NAXTG，NAXS，NAXSG，LPXP，LPXPG,其中X是任何氨基酸，LRXTG_n或LPAXG_n，其中X是任何氨基酸且n为至少1个，并且所述氨基酸序列位于非细胞毒性蛋白酶或其蛋白水解失活突变体的N-端。

16.根据权利要求14或15所述的标记多肽，其包含与所述多肽缀合的另外的可检测标记和另外的氨基酸序列，所述另外的氨基酸序列包含L(A/P/S)X(T/S/A/C)G_n，其中X是任何氨基酸且n为至少1，L(A/P/S)X(T/S/A/C)A_n，其中X为任何氨基酸且n为至少1，NPQTN，YPRTG，IPQTG，VPDTG，LPXTGS,其中X是任何氨基酸，NPKTG，XPETG，LGATG，IPNTG，IPETG，NSKTA，NPQTG，NAKTN，NPQSS，LPXTX，NPX₁TX₂，X₁PX₂X₃G，LPEX₁G，LPXS，LAXT，MPXT，MPXTG，LAXS，NPXT，NPXTG，NAXT，NAXTG，NAXS，NAXSG，LPXP，LPXPG，LRXTG_n或LPAXG_n。

17.根据权利要求16所述的标记多肽，其中(第一)氨基酸序列不同于另外的(第二)氨基酸序列。

18.根据权利要求16或17所述的标记多肽，其中：

(第一)氨基酸序列位于TM的C-端，另外的(第二)氨基酸序列位于非细胞毒性蛋白酶或其蛋白水解失活突变体的N端；或者(第一)氨基酸序列位于非细胞毒性蛋白酶或其蛋白水解失活突变体的N-端，另外的(第二)氨基酸序列位于TM的C-端。

19.根据权利要求14-18中任一项所述的标记多肽，其中所述多肽包含与SEQ ID NO:2、4、26或40具有至少70％序列同一性的多肽序列。

20.根据权利要求14-19中任一项所述的标记多肽，其中所述多肽包含与SEQ ID NO:2、4、26或40具有至少80％序列同一性的多肽序列。

21.根据权利要求14-20中任一项所述的标记多肽，其中所述多肽包含与SEQ ID NO:2、4、26或40具有至少90％序列同一性的多肽序列。

22.根据权利要求14-21中任一项所述的标记多肽，其中所述多肽包含如SEQ ID NO:26所示的多肽序列(优选由其组成)。

23.根据前述权利要求中任一项所述的方法、多肽或标记多肽，其中所述非细胞毒性蛋白酶包含梭菌神经毒素L链。

24.根据前述权利要求中任一项所述的方法、多肽或标记多肽，其中所述易位结构域包含梭菌神经毒素易位结构域。

25.根据前述权利要求中任一项所述的方法、多肽或标记多肽，其中所述多肽缺少梭菌神经毒素的功能性H_C结构域。

26.根据权利要求1-24中任一项所述的方法、多肽或标记多肽，其中所述TM是梭菌神经毒素H_C肽。

27.根据权利要求1-24或26中任一项所述的方法、多肽或标记多肽，其中所述多肽是梭菌神经毒素。

28.根据权利要求1-24或26-27中任一项所述的方法、多肽或标记多肽，其中所述多肽是肉毒杆菌神经毒素(BoNT)。

29.根据前述权利要求中任一项所述的方法、多肽或标记多肽，其中所述多肽包含肉毒杆菌神经毒素L链或其蛋白水解失活突变体。

30.根据权利要求1-24或26-29中任一项所述的方法、多肽或标记多肽，其中所述多肽包含肉毒杆菌神经毒素H链。

31.根据权利要求1-24或26-30中任一项所述的方法、多肽或标记多肽，其中所述多肽选自：BoNT/A、BoNT/B、BoNT/C、BoNT/D、BoNT/E、BoNT/F、BoNT/G、BoNT/X或TenT。

32.一种标记多肽，其可通过权利要求1或3-13或23-31中任一项所述的方法获得。

33.根据权利要求1或3-32中任一项所述的方法或标记多肽，其中与等同的未标记多肽相比，所述标记多肽不表现出降低的效力。

34.根据权利要求1或3-33中任一项所述的方法或标记多肽，其中与等同的未标记多肽相比，所述标记多肽表现出相似的细胞结合、易位和SNARE蛋白切割。

35.根据权利要求1或3-34中任一项所述的方法或标记多肽，其中与等同的未标记多肽相比，所述标记多肽表现出改善的细胞结合、易位和/或SNARE蛋白切割。

36.根据权利要求1或3-35中任一项所述的方法或标记多肽，其中与等同的未标记多肽相比，所述标记多肽表现出改善的细胞结合、易位和SNARE蛋白切割。

37.一种测定多肽的方法，所述方法包括：

a.使靶细胞与根据权利要求14-36中任一项所述的标记多肽接触；和

b.检测可检测标记。

38.一种编码权利要求2-13或23-31中任一项所述的多肽的核酸。

39.根据权利要求38所述的核酸，其中所述核酸包含与SEQ ID NO:1、3或39具有至少70％序列同一性的核酸序列。

40.根据权利要求38或39所述的核酸，其中所述核酸包含与SEQ ID NO:1、3或39具有至少80％序列同一性的核酸序列。

41.根据权利要求38-40中任一项所述的核酸，其中所述核酸包含与SEQ ID NO:1、3或39具有至少90％序列同一性的核酸序列。

42.根据权利要求38-41中任一项所述的核酸，其中所述核酸包含如SEQ ID NO：1、3或39所示的核酸序列(优选由其组成)。

43.一种制造用于使用分选酶标记的多肽的方法，所述方法包括：

a.提供编码多肽的核酸序列，其中所述多肽包含：

i.非细胞毒性蛋白酶或其蛋白水解失活突变体；

ii.能够与靶细胞上的结合位点结合的靶向部分(TM)；和

iii.易位结构域；和

b.将分选酶受体或供体位点引入所述核酸，从而产生编码包含分选酶受体或供体位点的多肽的修饰核酸；和

c.任选地在宿主细胞中表达修饰的核酸；和

d.任选地获得表达的多肽。

44.根据权利要求43所述的方法，其中步骤a.的核酸包含与SEQ ID NO:5或7具有至少70％序列同一性的核酸序列。

45.根据权利要求43或44所述的方法，其中步骤a.的核酸包含与SEQ ID NO:5或7具有至少80％序列同一性的核酸序列。

46.根据权利要求43-45中任一项所述的方法，其中步骤a.的核酸包含与SEQ ID NO:5或7具有至少90％序列同一性的核酸序列。

47.根据权利要求43-46中任一项所述的方法，其中步骤a.的核酸包含如SEQ ID NO:5或7所示的核酸序列(优选由其组成)。

48.根据权利要求43-47中任一项所述的方法，其中修饰的核酸包含与SEQ ID NO:1、3或39具有至少70％序列同一性的核酸序列。

49.根据权利要求43-48中任一项所述的方法，其中修饰的核酸包含与SEQ ID NO:1、3或39具有至少80％序列同一性的核酸序列。

50.根据权利要求43-49中任一项所述的方法，其中修饰的核酸包含与SEQ ID NO:1、3或39具有至少90％序列同一性的核酸序列。

51.根据权利要求43-50中任一项所述的方法，其中修饰的核酸包含如SEQ ID NO：1、3或39所示的核酸序列(优选由其组成)。

52.根据权利要求43-51中任一项所述的方法，其中修饰的核酸表达多肽，所述多肽包含与SEQ ID NO:2、4、26或40具有至少70％序列同一性的多肽序列。

53.根据权利要求43-52中任一项所述的方法，其中修饰的核酸表达多肽，所述多肽包含与SEQ ID NO:2、4、26或40具有至少80％序列同一性的多肽序列。

54.根据权利要求43-53中任一项所述的方法，其中修饰的核酸表达多肽，所述多肽包含与SEQ ID NO:2、4、26或40具有至少90％序列同一性的多肽序列。

55.根据权利要求43-54中任一项所述的方法，其中修饰的核酸表达多肽，所述多肽包含SEQ ID NO:2、4、26或40所示的多肽序列(优选由其组成)。

56.一种制备标记多肽的方法，所述方法包括：

a.提供一种多肽，其包含：

i.转肽酶或连接酶受体位点或转肽酶或连接酶供体位点；

ii.非细胞毒性蛋白酶或其蛋白水解失活突变体；

iii.能够与靶细胞上的结合位点结合的靶向部分(TM)；和

iv.易位结构域；

b.孵育多肽与：

转肽酶或连接酶；

和标记底物，所述标记底物分别包含转肽酶或连接酶供体位点或转肽酶或连接酶受体位点，以及缀合的可检测标记；

其中转肽酶或连接酶催化：

多肽的转肽酶或连接酶受体位点的氨基酸与标记底物的转肽酶或连接酶供体位点的氨基酸之间的缀合；或者

标记底物的转肽酶或连接酶受体位点的氨基酸与多肽的转肽酶或连接酶供体位点的氨基酸之间的缀合；

从而标记多肽；和

c.获得标记多肽。

57.根据权利要求56所述的方法，其中所述连接酶为butelase、PATG、PCY1或POPB。

58.根据权利要求56或57所述的方法，其中所述连接酶是butelase，优选butelase 1。

59.一种用于使用butelase标记的多肽，所述多肽包含：

i.butelase受体或供体位点；

iii.能够与靶细胞上的结合位点结合的靶向部分(TM)；和

其中所述供体位点的N-端残基是所述多肽的N-端残基；或者

60.一种标记多肽，所述多肽包括：

i.与所述多肽缀合的可检测标记；

ii.氨基酸序列，其包含Asn/Asp-Xaa-(Ile/Leu/Val/Cys)，其中Xaa为除脯氨酸外的任何氨基酸；

iii.非细胞毒性蛋白酶或其蛋白水解失活突变体；

iv.能够与靶细胞上的结合位点结合的靶向部分(TM)；和

v.易位结构域。

61.根据权利要求1-37或43-60中任一项所述的方法、多肽或标记多肽，其中所述可检测标记是荧光团。

62.根据权利要求61所述的方法、多肽或标记多肽，其中所述荧光团选自：HiLyte、AlexaFluor、Atto、Quantum Dot和Janelia Fluor。

63.根据权利要求1、3-37、43-58或60-62中任一项所述的方法或标记多肽，其中所述标记多肽包含两个或更多个可检测标记。

64.根据权利要求63所述的方法或标记多肽，其中所述两个或更多个可检测标记是不同的荧光团。

65.根据权利要求1-13、23-31、33-36、43-55或61-64中任一项所述的方法或多肽，其中所述分选酶受体位点包含NPKTG，XPETG，LGATG，IPNTG，IPETG，NSKTA，NPQTG，NAKTN，NPQSS，LPXTX,其中X是任何氨基酸，NPX₁TX₂,其中X₁是Lys或Gln且X₂为Asn、Asp或Gly，X₁PX₂X₃G，其中X₁是Leu、Ile、Val或Met，X₂是任何氨基酸且X₃是Ser、Thr或Ala，LPEX₁G,其中X₁是Ala、Cys或Ser，LPXS，LAXT，MPXT，MPXTG，LAXS，NPXT，NPXTG，NAXT，NAXTG，NAXS，NAXSG，LPXP，LPXPG，LRXTG或LPAXG，其中X是任何氨基酸(或由其组成)。