RU2801120C2 - Sortase-labeled clostridia neurotoxins - Google Patents

Sortase-labeled clostridia neurotoxins Download PDF

Info

Publication number
RU2801120C2
RU2801120C2 RU2021121995A RU2021121995A RU2801120C2 RU 2801120 C2 RU2801120 C2 RU 2801120C2 RU 2021121995 A RU2021121995 A RU 2021121995A RU 2021121995 A RU2021121995 A RU 2021121995A RU 2801120 C2 RU2801120 C2 RU 2801120C2
Authority
RU
Russia
Prior art keywords
polypeptide
sortase
amino acid
site
labeled
Prior art date
Application number
RU2021121995A
Other languages
Russian (ru)
Other versions
RU2021121995A (en
Inventor
Омар ЛОСС
Марк ЭЛЛИОТ
Original Assignee
Ипсен Биофарм Лимитед
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ипсен Биофарм Лимитед filed Critical Ипсен Биофарм Лимитед
Publication of RU2021121995A publication Critical patent/RU2021121995A/en
Application granted granted Critical
Publication of RU2801120C2 publication Critical patent/RU2801120C2/en

Links

Images

Abstract

FIELD: biotechnology.
SUBSTANCE: method of obtaining a labeled polypeptide, a labeled polypeptide for its visualization, and a method of determining at least the internalization and/or intracellular transport of the labeled polypeptide are proposed. A polypeptide containing an acceptor site for sortase or a donor site for sortase, a non-cytotoxic protease containing the L-chain of clostridial neurotoxin, or its proteolytically inactive mutant, a targeting part (TP) that is capable of binding to a binding site on a target cell, and a translocation domain are obtained. The polypeptide is incubated with sortase and a labeled substrate containing a sortase donor site or an acceptor site for sortase, respectively, and a conjugated detectable label. A labeled polypeptide that does not have reduced potency compared to the equivalent unlabeled polypeptide and/or exhibits similar cell binding, translocation, and cleavage of the SNARE protein to the equivalent unlabeled polypeptid are obtained.
EFFECT: visualization of cell binding, translocation and/or cleavage of the SNARE protein using a cell-based assay or in vivo.
15 cl, 6 dwg, 5 ex

Description

Настоящее изобретение относится к меченым полипептидам и к способам их получения и применения.The present invention relates to labeled polypeptides and methods for their preparation and use.

Бактерии рода Clostridia продуцируют в высокой степени сильнодействующие и специфические белковые токсины, которые могут отравлять нейроны и другие клетки, к которым они доставляются. Примеры таких клостридиальных нейротоксинов включают нейротоксины, продуцируемые C. tetani (TeNT) и C. botulinum (BoNT) серотипов A-G и X (см. WO 2018/009903 A2), а также нейротоксины, продуцируемые C. baratii и C. butyricum.Bacteria of the genus Clostridia produce highly potent and specific protein toxins that can poison neurons and other cells to which they are delivered. Examples of such clostridial neurotoxins include those produced by C. tetani (TeNT) and C. botulinum (BoNT) serotypes A-G and X (see WO 2018/009903 A2) as well as neurotoxins produced by C. baratii and C. butyricum.

К клостридиальным нейротоксинам принадлежат некоторые из наиболее известных сильнодействующих токсинов. В качестве примера, ботулиновые нейротоксины имеют величины срединной летальной дозы (LD50) для мышей в диапазоне от 0,5 до 5 нг/кг в зависимости от серотипа. Как столбнячные, так и ботулиновые токсины действуют посредством ингибирования функции пораженных нейронов, в частности, высвобождения нейротрансмиттеров. В то время как ботулиновый токсин действует на нейромышечные соединения и ингибирует холинэргическую передачу в периферической нервной системе, столбнячный токсин действует в центральной нервной системе.Clostridial neurotoxins are some of the most potent toxins known. As an example, botulinum neurotoxins have median lethal dose (LD 50 ) values in mice ranging from 0.5 to 5 ng/kg depending on serotype. Both tetanus and botulinum toxins act by inhibiting the function of affected neurons, in particular the release of neurotransmitters. While botulinum toxin acts on neuromuscular junctions and inhibits cholinergic transmission in the peripheral nervous system, tetanus toxin acts in the central nervous system.

Клостридиальные нейротоксины экспрессируются в Clostridium в качестве одноцепочечных полипептидов. Каждый клостридиальный нейротоксин имеет каталитическую легкую цепь, отделенную от тяжелой цепи (охватывающую N-концевой домен транслокации и C-концевой рецептор-связывающий домен) находящейся на поверхности областью, называемой петлей активации. В ходе созревания белка протеолитическое расщепление петли активации разделяет легкую и тяжелую цепи клостридиального нейротоксина, которые удерживаются вместе дисульфидным мостиком, с образованием полностью активного двухцепочечного токсина.Clostridial neurotoxins are expressed in Clostridium as single chain polypeptides. Each clostridial neurotoxin has a catalytic light chain separated from the heavy chain (spanning the N-terminal translocation domain and the C-terminal receptor-binding domain) by a surface region called the activation loop. During protein maturation, proteolytic cleavage of the activation loop separates the light and heavy chains of the clostridial neurotoxin, which are held together by a disulfide bridge, to form a fully active double-stranded toxin.

Также в данной области известны перенацеленные клостридиальные нейротоксины, которые могут быть модифицированы включением экзогенного лиганда, известного ка нацеливающая часть (TM). TM выбирают для обеспечения специфичности связывания в отношении требуемой клетки-мишени, и в качестве части процесса перенацеливания нативная связывающая часть клостридиального нейротоксина (например, HC-домен или HCC-домен) может быть удалена. Технология перенацеливания описана, например, в: EP-B-0689459; WO 1994/021300; EP-B-0939818; US 6461617; US 7192596; WO 1998/007864; EP-B-0826051; US 5989545; US 6395513; US 6962703; WO 1996/033273; EP-B-0996468; US 7,052,702; WO 1999/017806; EP-B-1107794; US 6,632,440; WO 2000/010598; WO 2001/21213; WO 2006/059093; WO 2000/62814; WO 2000/04926; WO 1993/15766; WO 2000/61192; и WO 1999/58571; все из которых включены в качестве ссылок в полном объеме.Also known in the art are retargeted clostridial neurotoxins that can be modified to include an exogenous ligand known as the targeting moiety (TM). The TM is chosen to provide binding specificity for the desired target cell, and as part of the retargeting process, the native binding portion of the clostridial neurotoxin (eg, HC domain or H CC domain) can be removed. Retargeting technology is described, for example, in: EP-B-0689459; WO 1994/021300; EP-B-0939818; US 6461617; US 7192596; WO 1998/007864; EP-B-0826051; US 5989545; US 6395513; US 6962703; WO 1996/033273; EP-B-0996468; US 7,052,702; WO 1999/017806; EP-B-1107794; US 6,632,440; WO2000/010598; WO 2001/21213; W02006/059093; WO 2000/62814; WO2000/04926; WO 1993/15766; WO2000/61192; and WO 1999/58571; all of which are incorporated by reference in their entirety.

Следующий вариант включает полипептиды, полученные из одного или нескольких из нецитотоксической протеазы, доменов транслокации или связывания клостридиальных нейротоксинов или из полипептидов с эквивалентной/сходной функциональностью.A further variant includes polypeptides derived from one or more of a non-cytotoxic protease, clostridial neurotoxin translocation or binding domains, or from polypeptides of equivalent/similar functionality.

Связывание, транслокация и протеолитическое расщепление белков SNARE клостридиальными нейротоксинами (или другими полипептидами, описанными в настоящем описании) остаются малопонятными. Таким образом, остается потребность в способе анализа, который позволяет визуализацию каждой из этих стадий, в частности, в реальном времени и/или в живых клетках. Такой анализ может облегчить разработку и охарактеризацию терапевтических средств на основе клостридиальных нейротоксинов, особенно охарактеризацию новых терапевтических средств на основе BoNT, гибридных токсинов и перенацеленных клостридиальных нейротоксинов (и их вариантов).Binding, translocation, and proteolytic cleavage of SNARE proteins by clostridial neurotoxins (or other polypeptides described herein) remain poorly understood. Thus, there remains a need for an assay method that allows visualization of each of these steps, in particular in real time and/or in living cells. Such an analysis may facilitate the development and characterization of clostridial neurotoxin therapeutics, especially the characterization of novel BoNT therapeutics, hybrid toxins, and retargeted clostridial neurotoxins (and variants thereof).

Более того, количество антител (например, флуоресцентных антител), используемых в обычных способах для визуализации клостридиальных нейротоксинов и других таких полипептидов, является низким, с ограниченной специфичностью и/или чувствительностью. Более того, такие обычные способы, как правило, основаны на фиксации клеток, что может иметь неблагоприятный эффект на клеточную архитектуру, и они непригодны для прижизненной визуализации/визуализации в реальном времени, в частности, в комплексных биологических системах, например, у животных in vivo. Таким образом, сохраняется потребность в усовершенствованных/альтернативных способах.Moreover, the amount of antibodies (eg, fluorescent antibodies) used in conventional methods to visualize clostridial neurotoxins and other such polypeptides is low, with limited specificity and/or sensitivity. Moreover, such conventional methods are generally based on cell fixation, which can have an adverse effect on cell architecture, and are unsuitable for in vivo/real-time imaging, particularly in complex biological systems, e.g., in in vivo animals. . Thus, there remains a need for improved/alternative methods.

Настоящее изобретение решает одну или несколько из вышеупомянутых проблем.The present invention solves one or more of the above problems.

Авторы настоящего изобретения неожиданно обнаружили, что сортазу можно использовать для конъюгации поддающейся детекции метки с полипептидами по изобретению (включающими нецитотоксическую протеазу или ее протеолитически неактивный мутант; нацеливающую часть (TM), которая связывается с участком связывания на клетке-мишени; и домен транслокации) без снижения эффективности меченого полипептида. Иными словами, меченые полипептиды демонстрируют сходное (или улучшенное) связывание клеток, транслокацию и расщепление белка SNARE с эквивалентным немеченым полипептидом. Это было полностью неожиданным, учитывая, что полипептиды, меченные с использованием альтернативных технологий (например, несайтспецифическое мечение и SNAP-мечение), демонстрировали сниженную эффективность.The present inventors have surprisingly found that sortase can be used to conjugate a detectable label to the polypeptides of the invention (comprising a non-cytotoxic protease or a proteolytically inactive mutant thereof; a targeting moiety (TM) that binds to a binding site on a target cell; and a translocation domain) without reducing the effectiveness of the labeled polypeptide. In other words, labeled polypeptides show similar (or improved) cell binding, translocation, and cleavage of the SNARE protein to an equivalent unlabeled polypeptide. This was completely unexpected given that polypeptides labeled using alternative technologies (eg, non-site-specific labeling and SNAP labeling) showed reduced efficacy.

Более того, полипептиды по изобретению, содержащие акцепторный или донорный участок сортазы, могут быть без труда очищены и экспрессированы, вновь это было неожиданным, учитывая, что мечение посредством GFP было ассоциировано с трудностями экспрессии/очистки, что указывает на то, что включение акцепотрных или донорных участков для сортазы не оказывало отрицательного влияния на структуру или укладку полипептида.Moreover, the polypeptides of the invention containing the sortase acceptor or donor site can be readily purified and expressed, again unexpected given that GFP labeling has been associated with expression/purification difficulties, indicating that the inclusion of acceptor or donor sites for sortase did not adversely affect the structure or folding of the polypeptide.

Кроме того, способы, включающие использование сортазы, позволяли получение полипептида с двойным мечением, что также позволяло визуализацию событий транслокации, происходящих в клеточных эндосомах, одного из наименее понятных аспектов перемещения клостридиального нейротоксина (и перенацеленного клостридиального нейротоксина). Преимущественно, настоящее изобретение обеспечивает визуализацию транслокации с использованием живой визуализирующей микроскопии и внесет значительный вклад в понимание механизмов транслокации в нескольких клеточных моделях и тканях.In addition, methods involving the use of sortase allowed the production of a double-labeled polypeptide, which also allowed the visualization of translocation events occurring in cellular endosomes, one of the least understood aspects of clostridial neurotoxin (and retargeted clostridial neurotoxin) movement. Advantageously, the present invention provides visualization of translocation using live imaging microscopy and will make a significant contribution to understanding the mechanisms of translocation in several cell models and tissues.

Меченые полипептиды по изобретению открывают новые направления для мониторинга прижизненно и/или в реальном времени механизма действия указанных полипептидов и устраняют необходимость в фиксирующих продуктах, что имеет неблагоприятный эффект на клеточную архитектуру. Таким образом, настоящее изобретение позволяет визуализацию токсинов в более комплексных биологических системах, таких как препараты тканей ex vivo (например, срезы головного мозга), гистопатологические образцы, и у животных in vivo, и оно не ограничивается простыми клеточными системами, такими как иммортализованные клеточные линии и нейроны, как в случае общепринятых способов. Таким образом, полипептиды по настоящему изобретению могут использоваться (например) для выявления распределения полипептида от области введения.The labeled polypeptides of the invention open up new avenues for in vivo and/or real time monitoring of the mechanism of action of said polypeptides and obviate the need for fixative products that have an adverse effect on cellular architecture. Thus, the present invention allows the imaging of toxins in more complex biological systems such as ex vivo tissue preparations (e.g. brain sections), histopathological specimens, and in vivo animals, and is not limited to simple cell systems such as immortalized cell lines. and neurons, as in the case of conventional methods. Thus, the polypeptides of the present invention can be used (for example) to detect the distribution of the polypeptide from the site of administration.

В одном аспекте изобретение относится к способу получения меченого полипептида, включающему:In one aspect, the invention relates to a method for producing a labeled polypeptide, comprising:

a. получение полипептида, содержащего:a. obtaining a polypeptide containing:

i. акцепторный или донорный участок для сортазы;i. an acceptor or donor site for sortase;

ii. нецитотоксическую протеазу или ее протеолитически неактивный мутант;ii. a non-cytotoxic protease or a proteolytically inactive mutant thereof;

iii. нацеливающую часть (TM), которая способна связываться с участком связывания на клетке-мишени; иiii. a targeting portion (TM) that is capable of binding to a binding site on a target cell; And

iv. домен транслокации;iv. translocation domain;

b. инкубацию полипептида с:b. incubation of the polypeptide with:

сортазой; иsortase; And

меченым субстратом, содержащим донорный и акцепторный участок для сортазы и конъюгированную поддающуюся детекции метку;a labeled substrate containing a sortase donor and acceptor site and a conjugated detectable label;

где сортаза катализирует конъюгацию между аминокислотой акцепторного участка для сортазы и аминокислотой донорного участка для сортазы, с осуществлением тем самым мечения полипептида; иwhere the sortase catalyzes the conjugation between the amino acid of the acceptor site for sortase and the amino acid of the donor site for sortase, thereby labeling the polypeptide; And

c. получение меченого полипептида.c. obtaining a labeled polypeptide.

Когда способ по изобретению включает использование полипептида, содержащего акцепторный участок для сортазы, меченый субстрат, содержащий конъюгированную поддающуюся детекции метку (например, как указано в b.), содержит донорный участок для сортазы. Аналогично, когда способ по изобретению включает использование полипептида, содержащего донорный участок для сортазы, меченый субстрат, содержащий конъюгированную поддающуюся детекции метку (например, как указано в b.), содержит акцепторный участок для сортазы.When the method of the invention includes the use of a polypeptide containing a sortase acceptor site, the labeled substrate containing a conjugated detectable label (eg, as indicated in b.) contains a sortase donor site. Similarly, when the method of the invention includes the use of a polypeptide containing a sortase donor site, a labeled substrate containing a conjugated detectable label (eg, as indicated in b.) contains a sortase acceptor site.

Таким образом, изобретение относится к применению акцепторного участка для сортазы и соответствующего донорного участка для сортазы, где сортаза способна катализировать конъюгацию аминокислоты акцепторного участка для сортазы и аминокислоты донорного участка для сортазы. Таким образом, соответствующие акцепторные и донорные участки для сортазы для применения в рамках изобретения выбирают таким образом, чтобы могла осуществляться конъюгация посредством сортазы.Thus, the invention relates to the use of a sortase acceptor site and a corresponding sortase donor site, wherein the sortase is capable of catalyzing the conjugation of an amino acid of the sortase acceptor site and an amino acid of the sortase donor site. Thus, the appropriate acceptor and donor sites for sortase to be used within the scope of the invention are chosen so that conjugation by sortase can be carried out.

Таким образом, в одном варианте осуществления способ по изобретению включает:Thus, in one embodiment, the method of the invention comprises:

a. получение полипептида, содержащего:a. obtaining a polypeptide containing:

i. акцепторный участок для сортазы;i. acceptor site for sortase;

ii. нецитотоксическую протеазу или ее протеолитически неактивный мутант;ii. a non-cytotoxic protease or a proteolytically inactive mutant thereof;

iii. нацеливающую часть (TM), которая способна связываться с участком связывания на клетке-мишени; иiii. a targeting portion (TM) that is capable of binding to a binding site on a target cell; And

iv. домен транслокации;iv. translocation domain;

b. инкубацию полипептида с:b. incubation of the polypeptide with:

сортазой; иsortase; And

меченым субстратом, содержащим донорный участок для сортазы и конъюгированную поддающуюся детекции метку;a labeled substrate containing a sortase donor site and a conjugated detectable label;

где сортаза катализирует конъюгацию между аминокислотой акцепторного участка для сортазы и аминокислотой донорного участка для сортазы, с осуществлением тем самым мечения полипептида; иwhere the sortase catalyzes the conjugation between the amino acid of the acceptor site for sortase and the amino acid of the donor site for sortase, thereby labeling the polypeptide; And

c. получение меченого полипептида.c. obtaining a labeled polypeptide.

В другом варианте осуществления способ по изобретению включает:In another embodiment, the method of the invention comprises:

a. получение полипептида, содержащего:a. obtaining a polypeptide containing:

i. донорный участок для сортазы;i. donor site for sortase;

ii. нецитотоксическую протеазу или ее протеолитически неактивный мутант;ii. a non-cytotoxic protease or a proteolytically inactive mutant thereof;

iii. нацеливающую часть (TM), которая способна связываться с участком связывания на клетке-мишени; иiii. a targeting portion (TM) that is capable of binding to a binding site on a target cell; And

iv. домен транслокации;iv. translocation domain;

b. инкубацию полипептида с:b. incubation of the polypeptide with:

сортазой; иsortase; And

меченым субстратом, содержащим акцепторный участок для сортазы и конъюгированную поддающуюся детекции метку;a labeled substrate containing an acceptor site for sortase and a conjugated detectable label;

где сортаза катализирует конъюгацию между аминокислотой акцепторного участка для сортазы и аминокислотой донорного участка для сортазы, с осуществлением тем самым мечения полипептида; иwhere the sortase catalyzes the conjugation between the amino acid of the acceptor site for sortase and the amino acid of the donor site for sortase, thereby labeling the polypeptide; And

c. получение меченого полипептида.c. obtaining a labeled polypeptide.

Также настоящее изобретение относится к меченому полипептиду, который может быть получен способом по изобретению.Also, the present invention relates to a labeled polypeptide, which can be obtained by the method according to the invention.

В одном варианте осуществления поддающаяся детекции метка конъюгирована в или вблизи акцепторного или донорного участка для сортазы в полипептиде, включающем нецитотоксическую протеазу или ее протеолитически неактивный мутант; нацеливающую часть (TM) и домен транслокации.In one embodiment, the detectable label is conjugated at or near an acceptor or donor site for sortase in a polypeptide comprising a non-cytotoxic protease or a proteolytically inactive mutant thereof; a targeting moiety (TM) and a translocation domain.

В одном варианте осуществления поддающаяся детекции метка конъюгирована с акцепторным или донорным участком для сортазы, например, конъюгирована непосредственно с аминокислотой акцепторного или донорного участка для сортазы. Альтернативно поддающаяся детекции метка может быть конъюгирована с C-концевой стороны от акцепторного или донорного участка для сортазы, например, на расстоянии 1-50, например 1-25 или 1-10 аминокислот от C-конца акцепторного или донорного участка для сортазы.In one embodiment, the detectable label is conjugated to a sortase acceptor or donor site, for example conjugated directly to an amino acid of the sortase acceptor or donor site. Alternatively, the detectable label can be conjugated C-terminally from the sortase acceptor or donor site, for example 1-50, eg 1-25 or 1-10 amino acids from the C-terminus of the sortase acceptor or donor site.

В другом варианте осуществления поддающаяся детекции метка конъюгирована с N-концевой стороны от акцепторного или донорного участка для сортазы, например, на расстоянии 1-50, например, 1-25 или 1-10 аминокислот от N-конца акцепторного или донорного участка для сортазы.In another embodiment, the detectable label is conjugated N-terminally from the sortase acceptor or donor site, e.g., 1-50, e.g., 1-25 or 1-10 amino acids from the N-terminus of the sortase acceptor or donor site.

Термин "который может быть получен", как его используют в рамках изобретения, также охватывает термин "полученный". В одном варианте осуществления термин " который может быть получен " означает "полученный".The term "obtainable" as used herein also encompasses the term "obtained". In one embodiment, the term "obtainable" means "obtained".

В родственном аспекте изобретение относится к полипептиду для мечения с использованием сортазы, причем полипептид содержит:In a related aspect, the invention relates to a polypeptide for labeling using sortase, and the polypeptide contains:

i. акцепторный или донорный участок для сортазы;i. an acceptor or donor site for sortase;

ii. нецитотоксическую протеазу, которая способна расщеплять белок аппарата экзоцитарного слияния в клетке-мишени, или ее протеолитически неактивный мутант;ii. a non-cytotoxic protease that is capable of cleaving a protein of the exocytic fusion apparatus in the target cell, or a proteolytically inactive mutant thereof;

iii. нацеливающую часть (TM), которая способна связываться с участком связывания на клетке-мишени; иiii. a targeting portion (TM) that is capable of binding to a binding site on a target cell; And

iv. домен транслокации, который способен транслоцировать нецитотоксическую протеазу из эндосомы через эндосомальную мембрану и в цитозоль клетки-мишени;iv. a translocation domain that is capable of translocating a non-cytotoxic protease from the endosome across the endosomal membrane and into the cytosol of the target cell;

где, когда полипептид содержит донорный участок для сортазы, донорный участок для сортазы находится на N-конце полипептида, и где, когда донорный участок для сортазы содержит Gn или An, n равен по меньшей мере 2; иwhere, when the polypeptide contains a sortase donor site, the sortase donor site is at the N-terminus of the polypeptide, and where, when the sortase donor site contains G n or A n , n is at least 2; And

где N-концевой остаток донорного участка представляет собой N-концевой остаток полипептида; илиwhere the N-terminal residue of the donor site is the N-terminal residue of the polypeptide; or

где полипептид содержит один или несколько аминокислотных остатков с N-концевой стороны от донорного участка для сортазы и расщепляемый участок, который при расщеплении экспонирует N-конец донорного участка для сортазы.wherein the polypeptide comprises one or more amino acid residues N-terminally from the sortase donor site and a cleavage site which, when cleaved, exposes the N-terminus of the sortase donor site.

В одном варианте осуществления полипептид для мечения с использованием сортазы содержит:In one embodiment, the sortase labeling polypeptide comprises:

i. донорный участок для сортазы;i. donor site for sortase;

ii. нецитотоксическую протеазу, которая способна расщеплять белок аппарата экзоцитарного слияния в клетке-мишени, или ее протеолитически неактивный мутант;ii. a non-cytotoxic protease that is capable of cleaving a protein of the exocytic fusion apparatus in the target cell, or a proteolytically inactive mutant thereof;

iii. нацеливающую часть (TM), которая способна связываться с участком связывания на клетке-мишени; иiii. a targeting portion (TM) that is capable of binding to a binding site on a target cell; And

iv. домен транслокации, который способен транслоцировать нецитотоксическую протеазу из эндосомы через эндосомальную мембрану и в цитозоль клетки-мишени;iv. a translocation domain that is capable of translocating a non-cytotoxic protease from the endosome across the endosomal membrane and into the cytosol of the target cell;

где донорный участок для сортазы находится на N-конце полипептида, и где, когда донорный участок для сортазы содержит Gn или An, n равен по меньшей мере 2; иwhere the sortase donor site is at the N-terminus of the polypeptide, and where, when the sortase donor site contains G n or A n , n is at least 2; And

где N-концевой остаток донорного участка представляет собой N-концевой остаток полипептида.where the N-terminal residue of the donor site is the N-terminal residue of the polypeptide.

В одном варианте осуществления полипептид для мечения с использованием сортазы содержит:In one embodiment, the sortase labeling polypeptide comprises:

i. донорный участок для сортазы;i. donor site for sortase;

ii. нецитотоксическую протеазу, которая способна расщеплять белок аппарата экзоцитарного слияния в клетке-мишени, или ее протеолитически неактивный мутант;ii. a non-cytotoxic protease that is capable of cleaving a protein of the exocytic fusion apparatus in the target cell, or a proteolytically inactive mutant thereof;

iii. нацеливающую часть (TM), которая способна связываться с участком связывания на клетке-мишени; иiii. a targeting portion (TM) that is capable of binding to a binding site on a target cell; And

iv. домен транслокации, который способен транслоцировать нецитотоксическую протеазу из эндосомы через эндосомальную мембрану и в цитозоль клетки-мишени;iv. a translocation domain that is capable of translocating a non-cytotoxic protease from the endosome across the endosomal membrane and into the cytosol of the target cell;

где донорный участок для сортазы находится на N-конце полипептида, и где, когда донорный участок для сортазы содержит Gn или An, n равен по меньшей мере 2; иwhere the sortase donor site is at the N-terminus of the polypeptide, and where, when the sortase donor site contains G n or A n , n is at least 2; And

где полипептид содержит один или несколько аминокислотных остатков с N-концевой стороны от донорного участка для сортазы и расщепляемый участок, который при расщеплении экспонирует N-конец донорного участка для сортазы.wherein the polypeptide comprises one or more amino acid residues N-terminally from the sortase donor site and a cleavage site which, when cleaved, exposes the N-terminus of the sortase donor site.

В одном варианте осуществления полипептид для мечения с использованием сортазы содержит:In one embodiment, the sortase labeling polypeptide comprises:

i. акцепторный участок для сортазы;i. acceptor site for sortase;

ii. нецитотоксическую протеазу, которая способна расщеплять белок аппарата экзоцитарного слияния в клетке-мишени, или ее протеолитически неактивный мутант;ii. a non-cytotoxic protease that is capable of cleaving a protein of the exocytic fusion apparatus in the target cell, or a proteolytically inactive mutant thereof;

iii. нацеливающую часть (TM), которая способна связываться с участком связывания на клетке-мишени; иiii. a targeting portion (TM) that is capable of binding to a binding site on a target cell; And

iv. домен транслокации, который способен транслоцировать нецитотоксическую протеазу из эндосомы через эндосомальную мембрану и в цитозоль клетки-мишени.iv. a translocation domain that is capable of translocating a non-cytotoxic protease from the endosome across the endosomal membrane and into the cytosol of the target cell.

Полипептид подходящим образом используется в способе по изобретению.The polypeptide is suitably used in the method of the invention.

Полипептид по изобретению может содержать акцепторный участок для сортазы. Альтернативно указанный полипептид может содержать донорный участок для сортазы.The polypeptide of the invention may contain an acceptor site for sortase. Alternatively, said polypeptide may contain a sortase donor site.

В предпочтительном варианте осуществления указанный полипептид содержит акцепторный участок для сортазы и донорный участок для сортазы.In a preferred embodiment, said polypeptide comprises a sortase acceptor site and a sortase donor site.

Полипептид по настоящему изобретению может содержать полипептидную последовательность, обладающую по меньшей мере 70% идентичностью последовательности с SEQ ID NO: 2. В одном варианте осуществления полипептид по изобретению содержит полипептидную последовательность, обладающую по меньшей мере 80% или 90% идентичностью последовательности с SEQ ID NO: 2. Предпочтительно, полипептид по изобретению содержит (более предпочтительно состоит из) полипептид, представленный как SEQ ID NO: 2.The polypeptide of the present invention may contain a polypeptide sequence having at least 70% sequence identity with SEQ ID NO: 2. In one embodiment, the polypeptide of the invention contains a polypeptide sequence having at least 80% or 90% sequence identity with SEQ ID NO: : 2. Preferably, the polypeptide of the invention comprises (more preferably consists of) the polypeptide shown as SEQ ID NO: 2.

Полипептид по настоящему изобретению может содержать полипептидную последовательность, обладающую по меньшей мере 70% идентичностью последовательности с SEQ ID NO: 4. В одном варианте осуществления полипептид по изобретению содержит полипептидную последовательность, обладающую по меньшей мере 80% или 90% идентичностью последовательности с SEQ ID NO: 4. Предпочтительно, полипептид по изобретению содержит (более предпочтительно состоит из) полипептид, представленный как SEQ ID NO: 4.The polypeptide of the present invention may contain a polypeptide sequence having at least 70% sequence identity with SEQ ID NO: 4. In one embodiment, the polypeptide of the invention contains a polypeptide sequence having at least 80% or 90% sequence identity with SEQ ID NO: : 4. Preferably, the polypeptide of the invention comprises (more preferably consists of) the polypeptide shown as SEQ ID NO: 4.

Полипептид по настоящему изобретению может содержать полипептидную последовательность, обладающую по меньшей мере 70% идентичностью последовательности с SEQ ID NO: 40. В одном варианте осуществления полипептид по изобретению содержит полипептидную последовательность, обладающую по меньшей мере 80% или 90% идентичностью последовательности с SEQ ID NO: 40. Предпочтительно, полипептид по изобретению содержит (более предпочтительно состоит из) полипептид, представленный как SEQ ID NO: 40.The polypeptide of the present invention may contain a polypeptide sequence having at least 70% sequence identity with SEQ ID NO: 40. In one embodiment, the polypeptide of the invention contains a polypeptide sequence having at least 80% or 90% sequence identity with SEQ ID NO: : 40. Preferably, the polypeptide of the invention comprises (more preferably consists of) the polypeptide shown as SEQ ID NO: 40.

Полипептид может кодироваться нуклеиновой кислотой по изобретению.The polypeptide may be encoded by the nucleic acid of the invention.

Изобретение также относится к меченому полипептиду, причем полипептид содержит:The invention also relates to a labeled polypeptide, wherein the polypeptide contains:

i. поддающуюся детекции метку, конъюгированную с полипептидом;i. a detectable label conjugated to the polypeptide;

ii. нецитотоксическую протеазу или ее протеолитически неактивный мутант;ii. a non-cytotoxic protease or a proteolytically inactive mutant thereof;

iii. нацеливающую часть (TM), которая способна связываться с участком связывания на клетке-мишени; иiii. a targeting portion (TM) that is capable of binding to a binding site on a target cell; And

iv. домен транслокации.iv. translocation domain.

Изобретение также относится к меченому полипептиду, причем полипептид содержит:The invention also relates to a labeled polypeptide, wherein the polypeptide contains:

i. поддающуюся детекции метку, конъюгированную с полипептидом;i. a detectable label conjugated to the polypeptide;

ii. аминокислотную последовательность, которая содержит L(A/P/S)X(T/S/A/C)Gn (SEQ ID NO: 59), где X представляет собой любую аминокислоту и n равен по меньшей мере 1, L(A/P/S)X(T/S/A/C)An (SEQ ID NO: 60), где X представляет собой любую аминокислоту и n равен по меньшей мере 1, NPQTN (SEQ ID NO: 61), YPRTG (SEQ ID NO: 62), IPQTG (SEQ ID NO: 63), VPDTG (SEQ ID NO: 64), LPXTGS (SEQ ID NO: 65), где X представляет собой любую аминокислоту, NPKTG (SEQ ID NO: 46), XPETG (SEQ ID NO: 47), LGATG (SEQ ID NO: 48), IPNTG (SEQ ID NO: 49), IPETG (SEQ ID NO: 50), NSKTA (SEQ ID NO: 51), NPQTG (SEQ ID NO: 52), NAKTN (SEQ ID NO: 53), NPQSS (SEQ ID NO: 54), LPXTX (SEQ ID NO: 55), где X представляет собой любую аминокислоту, NPX1TX2 (SEQ ID NO: 56), где X1 представляет собой Lys или Gln и X2 представляет собой Asn, Asp или Gly, X1PX2X3G (SEQ ID NO: 57), где X1 представляет собой Leu, Ile, Val или Met, X2 представляет собой любую аминокислоту и X3 представляет собой Ser, Thr или Ala, LPEX1G (SEQ ID NO: 58), где X1 представляет собой Ala, Cys или Ser, LPXS (SEQ ID NO: 66), LAXT (SEQ ID NO: 67), MPXT (SEQ ID NO: 68), MPXTG (SEQ ID NO: 69), LAXS (SEQ ID NO: 70), NPXT (SEQ ID NO: 71), NPXTG (SEQ ID NO: 72), NAXT (SEQ ID NO: 73), NAXTG (SEQ ID NO: 74), NAXS (SEQ ID NO: 75), NAXSG (SEQ ID NO: 76), LPXP (SEQ ID NO: 77), LPXPG (SEQ ID NO: 78), где X представляет собой любую аминокислоту, LRXTGn (SEQ ID NO: 111) или LPAXGn (SEQ ID NO: 106), где X представляет собой любую аминокислоту и n равен по меньшей мере 1;ii. amino acid sequence that contains L(A/P/S)X(T/S/A/C)Gn(SEQ ID NO: 59), where X is any amino acid and n is at least 1, L(A/P/S)X(T/S/A/C)An(SEQ ID NO: 60), where X is any amino acid and n is at least 1, NPQTN (SEQ ID NO: 61), YPRTG (SEQ ID NO: 62), IPQTG (SEQ ID NO: 63), VPDTG (SEQ ID NO: 64), LPXTGS (SEQ ID NO: 65) where X is any amino acid, NPKTG (SEQ ID NO: 46), XPETG (SEQ ID NO: 47), LGATG (SEQ ID NO: 48) , IPNTG (SEQ ID NO: 49), IPETG (SEQ ID NO: 50), NSKTA (SEQ ID NO: 51), NPQTG (SEQ ID NO: 52), NAKTN (SEQ ID NO: 53), NPQSS (SEQ ID NO: 54), LPXTX (SEQ ID NO: 55), where X is any amino acid, NPX1TX2(SEQ ID NO: 56), where X1 is Lys or Gln and X2 is Asn, Asp or Gly, X1PX2X3G (SEQ ID NO: 57), where X1is Leu, Ile, Val or Met, X2is any amino acid and X3is Ser, Thr or Ala, LPEX1G (SEQ ID NO: 58), where X1 is Ala, Cys or Ser, LPXS (SEQ ID NO: 66), LAXT (SEQ ID NO: 67), MPXT (SEQ ID NO: 68), MPXTG (SEQ ID NO: 69), LAXS (SEQ ID NO: 70), NPXT (SEQ ID NO: 71), NPXTG (SEQ ID NO: 72), NAXT (SEQ ID NO: 73), NAXTG (SEQ ID NO: 74), NAXS (SEQ ID NO: 75), NAXSG ( SEQ ID NO: 76), LPXP (SEQ ID NO: 77), LPXPG (SEQ ID NO: 78), where X is any amino acid, LRXTGn(SEQ ID NO: 111) or LPAXGn(SEQ ID NO: 106), where X is any amino acid and n is at least 1;

iii. нецитотоксическую протеазу или ее протеолитически неактивный мутант;iii. a non-cytotoxic protease or a proteolytically inactive mutant thereof;

iv. нацеливающую часть (TM), которая способна связываться с участком связывания на клетке-мишени; иiv. a targeting portion (TM) that is capable of binding to a binding site on a target cell; And

v. домен транслокации.v. translocation domain.

Изобретение также относится к меченому полипептиду, причем полипептид содержит:The invention also relates to a labeled polypeptide, wherein the polypeptide contains:

i. поддающуюся детекции метку, конъюгированную с полипептидом;i. a detectable label conjugated to the polypeptide;

ii. аминокислотную последовательность, которая содержит L(A/P/S)X(T/S/A/C)Gn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1, L(A/P/S)X(T/S/A/C)An, где X представляет собой любую аминокислоту и n равен по меньшей мере 1, NPQTN, YPRTG, IPQTG, VPDTG, или LPXTGS, где X представляет собой любую аминокислоту;ii. an amino acid sequence that contains L(A/P/S)X(T/S/A/C)G n, where X is any amino acid and n is at least 1, L(A/P/S)X( T/S/A/C)A n, where X is any amino acid and n is at least 1, NPQTN, YPRTG, IPQTG, VPDTG, or LPXTGS, where X is any amino acid;

iii. нецитотоксическую протеазу или ее протеолитически неактивный мутант;iii. a non-cytotoxic protease or a proteolytically inactive mutant thereof;

iv. нацеливающую часть (TM), которая способна связываться с участком связывания на клетке-мишени; иiv. a targeting portion (TM) that is capable of binding to a binding site on a target cell; And

v. домен транслокации.v. translocation domain.

В одном варианте осуществления меченый полипептид содержит:In one embodiment, the labeled polypeptide contains:

i. поддающуюся детекции метку, конъюгированную с полипептидом;i. a detectable label conjugated to the polypeptide;

ii. аминокислотную последовательность, которая содержит L(A/P/S)X(T/S/A/C)Gn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1, NPQTN, YPRTG, IPQTG, VPDTG, LPXTGS, где X представляет собой любую аминокислоту, NPKTG, XPETG, LGATG, IPNTG, IPETG, NSKTA, NPQTG, NAKTN, NPQSS, LPXTX, где X представляет собой любую аминокислоту, NPX1TX2, где X1 представляет собой Lys или Gln и X2 представляет собой Asn, Asp или Gly, X1PX2X3G, где X1 представляет собой Leu, Ile, Val или Met, X2 представляет собой любую аминокислоту и X3 представляет собой Ser, Thr или Ala, LPEX1G, где X1 представляет собой Ala, Cys или Ser, LPXS, LAXT, MPXT, MPXTG, LAXS, NPXT, NPXTG, NAXT, NAXTG, NAXS, NAXSG, LPXP, LPXPG, где X представляет собой любую аминокислоту, LRXTGn или LPAXGn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1;ii. amino acid sequence that contains L(A/P/S)X(T/S/A/C)Gnwhere X is any amino acid and n is at least 1, NPQTN, YPRTG, IPQTG, VPDTG, LPXTGS, where X is any amino acid, NPKTG, XPETG, LGATG, IPNTG, IPETG, NSKTA, NPQTG, NAKTN, NPQSS, LPXTX where X is any amino acid, NPX1TX2, where X1 is Lys or Gln and X2 is Asn, Asp or Gly, X1PX2X3G, where X1is Leu, Ile, Val or Met, X2is any amino acid and X3is Ser, Thr or Ala, LPEX1G, where X1 is Ala, Cys or Ser, LPXS, LAXT, MPXT, MPXTG, LAXS, NPXT, NPXTG, NAXT, NAXTG, NAXS, NAXSG, LPXP, LPXPG, where X is any amino acid, LRXTGn or LPAXGn, where X is any amino acid and n is at least 1;

iii. нецитотоксическую протеазу или ее протеолитически неактивный мутант;iii. a non-cytotoxic protease or a proteolytically inactive mutant thereof;

iv. нацеливающую часть (TM), которая способна связываться с участком связывания на клетке-мишени; иiv. a targeting portion (TM) that is capable of binding to a binding site on a target cell; And

v. домен транслокации.v. translocation domain.

В одном варианте осуществления меченый полипептид содержит:In one embodiment, the labeled polypeptide contains:

i. поддающуюся детекции метку, конъюгированную с полипептидом;i. a detectable label conjugated to the polypeptide;

ii. аминокислотную последовательность, которая содержит L(A/P/S)X(T/S/A/C)Gn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1, NPQTN, YPRTG, IPQTG, VPDTG, или LPXTGS, где X представляет собой любую аминокислоту;ii. an amino acid sequence that contains L(A/P/S)X(T/S/A/C)G n , where X is any amino acid and n is at least 1, NPQTN, YPRTG, IPQTG, VPDTG, or LPXTGS where X is any amino acid;

iii. нецитотоксическую протеазу или ее протеолитически неактивный мутант;iii. a non-cytotoxic protease or a proteolytically inactive mutant thereof;

iv. нацеливающую часть (TM), которая способна связываться с участком связывания на клетке-мишени; иiv. a targeting portion (TM) that is capable of binding to a binding site on a target cell; And

v. домен транслокации.v. translocation domain.

В одном варианте осуществления меченый полипептид по изобретению демонстрирует сходное связывание клеток, транслокацию и расщепление белка SNARE с эквивалентным немеченым полипептидом. В другом варианте осуществления меченый полипептид демонстрирует улучшенное связывание клеток, транслокацию и/или расщепление белка SNARE по сравнению с эквивалентным немеченым полипептидом. В особенно предпочтительном варианте осуществления меченый полипептид демонстрирует улучшенное связывание клеток, транслокацию и расщепление белка SNARE по сравнению с эквивалентным немеченым полипептидом. Связывание клеток, транслокация и/или расщепление белка SNARE могут быть определены с использованием любого способа, известного в данной области и/или описанного в настоящем описании. В одном варианте осуществления связывание клеток, транслокация и/или расщепление белка SNARE могут быть определены с использованием анализа на клеточной основе или in vivo. Подходящие способы анализа могут включать числовой показатель отведения (DAS), анализ ганглиев задних корешков (DRG), анализ нейронов спинного мозга (SCN) и анализ диафрагмального нерва купола диафрагмы (PNHD), которые являются стандартными в данной области. Подходящий анализ может представлять собой анализ, описанный в Donald et al. (2018), Pharmacol Res Perspect, e00446, 1-14, который включен в настоящее описание в качестве ссылки. Предпочтительно, подходящим анализом является анализ расщепления SNAP25, как описано в Fonfria, E., S. Donald and V.A. Cadd (2016), "Botulinum neurotoxin A and an engineered derivate targeted secretion inhibitor (TSI) A enter cells via different vesicular compartments." J Recept Signal Transduct Res 36(1): 79-88, которая включена в настоящее описание в качестве ссылки.In one embodiment, a labeled polypeptide of the invention exhibits similar cell binding, translocation, and SNARE protein cleavage to an equivalent unlabeled polypeptide. In another embodiment, the labeled polypeptide exhibits improved cell binding, translocation and/or cleavage of the SNARE protein compared to an equivalent unlabeled polypeptide. In a particularly preferred embodiment, the labeled polypeptide exhibits improved cell binding, translocation, and cleavage of the SNARE protein compared to an equivalent unlabeled polypeptide. Cell binding, translocation and/or cleavage of the SNARE protein can be determined using any method known in the art and/or described herein. In one embodiment, cell binding, translocation, and/or cleavage of the SNARE protein can be determined using a cell-based or in vivo assay. Suitable assays may include abduction score score (DAS), dorsal root ganglion (DRG) assay, spinal cord neuron (SCN) assay, and dome phrenic nerve (PNHD) assay, which are standard in the art. A suitable assay may be the assay described in Donald et al. (2018), Pharmacol Res Perspect, e00446, 1-14, which is incorporated herein by reference. Preferably, a suitable assay is a SNAP25 cleavage assay as described in Fonfria, E., S. Donald and V.A. Cadd (2016), "Botulinum neurotoxin A and an engineered derivate targeted secretion inhibitor (TSI) A enter cells via different vesicular compartments." J Recept Signal Transduct Res 36(1): 79-88, which is incorporated herein by reference.

В одном варианте осуществления поддающаяся детекции метка конъюгирована с или вблизи последовательности, содержащей L(A/P/S)X(T/S/A/C)Gn, L(A/P/S)X(T/S/A/C)An, NPQTN, YPRTG, IPQTG, VPDTG, LPXTGS, NPKTG, XPETG, LGATG, IPNTG, IPETG, NSKTA, NPQTG, NAKTN, NPQSS, LPXTX, где X представляет собой любую аминокислоту, NPX1TX2, где X1 представляет собой Lys или Gln и X2 представляет собой Asn, Asp или Gly, X1PX2X3G, где X1 представляет собой Leu, Ile, Val или Met, X2 представляет собой любую аминокислоту и X3 представляет собой Ser, Thr или Ala, LPEX1G, где X1 представляет собой Ala, Cys или Ser, LPXS, LAXT, MPXT, MPXTG, LAXS, NPXT, NPXTG, NAXT, NAXTG, NAXS, NAXSG, LPXP, LPXPG, где X представляет собой любую аминокислоту, LRXTGn или LPAXGn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1. В одном варианте осуществления поддающаяся детекции метка конъюгирована с или вблизи последовательности, содержащей L(A/P/S)X(T/S/A/C)Gn, L(A/P/S)X(T/S/A/C)An, NPQTN, YPRTG, IPQTG, VPDTG или LPXTGS.In one embodiment, the detectable label is conjugated to or near a sequence containing L(A/P/S)X(T/S/A/C)Gn, L(A/P/S)X(T/S/A/C)An, NPQTN, YPRTG, IPQTG, VPDTG, LPXTGS, NPKTG, XPETG, LGATG, IPNTG, IPETG, NSKTA, NPQTG, NAKTN, NPQSS, LPXTX, where X is any amino acid, NPX1TX2, where X1 is Lys or Gln and X2 is Asn, Asp or Gly, X1PX2X3G, where X1is Leu, Ile, Val or Met, X2is any amino acid and X3is Ser, Thr or Ala, LPEX1G, where X1 is Ala, Cys or Ser, LPXS, LAXT, MPXT, MPXTG, LAXS, NPXT, NPXTG, NAXT, NAXTG, NAXS, NAXSG, LPXP, LPXPG, where X is any amino acid, LRXTGn or LPAXGn, where X is any amino acid and n is at least 1. In one embodiment, the detectable label is conjugated to or near a sequence containing L(A/P/S)X(T/S/A/C)Gn, L(A/P/S)X(T/S/A/C)An, NPQTN, YPRTG, IPQTG, VPDTG or LPXTGS.

В одном варианте осуществления аминокислотная последовательность, содержащая L(A/P/S)X(T/S/A/C)Gn, L(A/P/S)X(T/S/A/C)An, NPQTN, YPRTG, IPQTG, VPDTG, LPXTGS, NPKTG, XPETG, LGATG, IPNTG, IPETG, NSKTA, NPQTG, NAKTN, NPQSS, LPXTX, где X представляет собой любую аминокислоту, NPX1TX2, где X1 представляет собой Lys или Gln и X2 представляет собой Asn, Asp или Gly, X1PX2X3G, где X1 представляет собой Leu, Ile, Val или Met, X2 представляет собой любую аминокислоту и X3 представляет собой Ser, Thr или Ala, LPEX1G, где X1 представляет собой Ala, Cys или Ser, LPXS, LAXT, MPXT, MPXTG, LAXS, NPXT, NPXTG, NAXT, NAXTG, NAXS, NAXSG, LPXP, LPXPG, где X представляет собой любую аминокислоту, LRXTGn или LPAXGn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1, может находиться с C-концевой стороны от TM полипептида. В одном варианте осуществления аминокислотная последовательность, содержащая L(A/P/S)X(T/S/A/C)Gn, L(A/P/S)X(T/S/A/C)An, NPQTN, YPRTG, IPQTG, VPDTG или LPXTGS, может находиться с C-концевой стороны от TM полипептида. В другом варианте осуществления аминокислотная последовательность, содержащая L(A/P/S)X(T/S/A/C)Gn, L(A/P/S)X(T/S/A/C)An, NPQTN, YPRTG, IPQTG, VPDTG, LPXTGS, NPKTG, XPETG, LGATG, IPNTG, IPETG, NSKTA, NPQTG, NAKTN, NPQSS, LPXTX, где X представляет собой любую аминокислоту, NPX1TX2, где X1 представляет собой Lys или Gln и X2 представляет собой Asn, Asp или Gly, X1PX2X3G, где X1 представляет собой Leu, Ile, Val или Met, X2 представляет собой любую аминокислоту и X3 представляет собой Ser, Thr или Ala, LPEX1G, где X1 представляет собой Ala, Cys или Ser, LPXS, LAXT, MPXT, MPXTG, LAXS, NPXT, NPXTG, NAXT, NAXTG, NAXS, NAXSG, LPXP, LPXPG, где X представляет собой любую аминокислоту, LRXTGn или LPAXGn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1, может находиться с N-концевой стороны от нецитотоксической протеазы или ее протеолитически неактивного мутанта в полипептиде. В другом варианте осуществления аминокислотная последовательность, содержащая L(A/P/S)X(T/S/A/C)Gn, L(A/P/S)X(T/S/A/C)An, NPQTN, YPRTG, IPQTG, VPDTG или LPXTGS, может находиться с N-концевой стороны от нецитотоксической протеазы или ее протеолитически неактивного мутанта в полипептиде.In one embodiment, an amino acid sequence containing L(A/P/S)X(T/S/A/C)Gn, L(A/P/S)X(T/S/A/C)An, NPQTN, YPRTG, IPQTG, VPDTG, LPXTGS, NPKTG, XPETG, LGATG, IPNTG, IPETG, NSKTA, NPQTG, NAKTN, NPQSS, LPXTX, where X is any amino acid, NPX1TX2, where X1 is Lys or Gln and X2 is Asn, Asp or Gly, X1PX2X3G, where X1is Leu, Ile, Val or Met, X2is any amino acid and X3is Ser, Thr or Ala, LPEX1G, where X1 is Ala, Cys or Ser, LPXS, LAXT, MPXT, MPXTG, LAXS, NPXT, NPXTG, NAXT, NAXTG, NAXS, NAXSG, LPXP, LPXPG, where X is any amino acid, LRXTGn or LPAXGn, where X is any amino acid and n is at least 1, may be on the C-terminal side of the TM polypeptide. In one embodiment, an amino acid sequence containing L(A/P/S)X(T/S/A/C)Gn, L(A/P/S)X(T/S/A/C)An, NPQTN, YPRTG, IPQTG, VPDTG or LPXTGS, may be C-terminal of the TM polypeptide. In another embodiment, an amino acid sequence containing L(A/P/S)X(T/S/A/C)Gn, L(A/P/S)X(T/S/A/C)An, NPQTN, YPRTG, IPQTG, VPDTG, LPXTGS, NPKTG, XPETG, LGATG, IPNTG, IPETG, NSKTA, NPQTG, NAKTN, NPQSS, LPXTX, where X is any amino acid, NPX1TX2, where X1 is Lys or Gln and X2 is Asn, Asp or Gly, X1PX2X3G, where X1is Leu, Ile, Val or Met, X2is any amino acid and X3is Ser, Thr or Ala, LPEX1G, where X1 is Ala, Cys or Ser, LPXS, LAXT, MPXT, MPXTG, LAXS, NPXT, NPXTG, NAXT, NAXTG, NAXS, NAXSG, LPXP, LPXPG, where X is any amino acid, LRXTGn or LPAXGn, where X is any amino acid and n is at least 1, may be N-terminal to a non-cytotoxic protease or proteolytically inactive mutant thereof in the polypeptide. In another embodiment, an amino acid sequence containing L(A/P/S)X(T/S/A/C)Gn, L(A/P/S)X(T/S/A/C)An, NPQTN, YPRTG, IPQTG, VPDTG, or LPXTGS, may be N-terminal to a non-cytotoxic protease or proteolytically inactive mutant thereof in a polypeptide.

В одном варианте осуществления меченый полипептид содержит две или более поддающихся детекции меток, предпочтительно меченый полипептид содержит две поддающихся детекции метки. В предпочтительном варианте осуществления поддающиеся детекции метки различаются, например, представляют собой флуорофоры разного цвета.In one embodiment, the labeled polypeptide contains two or more detectable labels, preferably the labeled polypeptide contains two detectable labels. In a preferred embodiment, the detectable labels are different, such as different colored fluorophores.

Первая и вторая (или более) поддающиеся детекции метки могут быть конъюгированы с или вблизи аминокислотной последовательности, содержащей L(A/P/S)X(T/S/A/C)Gn, L(A/P/S)X(T/S/A/C)An, NPQTN, YPRTG, IPQTG, VPDTG, LPXTGS, NPKTG, XPETG, LGATG, IPNTG, IPETG, NSKTA, NPQTG, NAKTN, NPQSS, LPXTX, где X представляет собой любую аминокислоту, NPX1TX2, где X1 представляет собой Lys или Gln и X2 представляет собой Asn, Asp или Gly, X1PX2X3G, где X1 представляет собой Leu, Ile, Val или Met, X2 представляет собой любую аминокислоту и X3 представляет собой Ser, Thr или Ala, LPEX1G, где X1 представляет собой Ala, Cys или Ser, LPXS, LAXT, MPXT, MPXTG, LAXS, NPXT, NPXTG, NAXT, NAXTG, NAXS, NAXSG, LPXP, LPXPG, где X представляет собой любую аминокислоту, LRXTGn или LPAXGn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1, где первая и вторая (или более) поддающиеся детекции метки конъюгированы с различными участками меченого полипептида. Первая и вторая (или более) поддающиеся детекции метки могут быть конъюгированы с или вблизи аминокислотной последовательности, содержащей L(A/P/S)X(T/S/A/C)Gn, L(A/P/S)X(T/S/A/C)An, NPQTN, YPRTG, IPQTG, VPDTG или LPXTGS, где первая и вторая (или более) поддающиеся детекции метки конъюгированы с различными участками меченого полипептида. Например, первая поддающаяся детекции метка может быть конъюгирована с аминокислотной последовательностью, находящейся с N-концевой стороны от нецитотоксической протеазы или ее протеолитически неактивного мутанта, и вторая поддающаяся детекции метка может быть конъюгирована с аминокислотной последовательностью, находящейся с C-концевой стороны от TM (или наоборот). Предпочтительно аминокислотные последовательности, с которыми конъюгированы первая и вторая (или более) поддающиеся детекции метки, различаются.The first and second (or more) detectable labels can be conjugated to or near an amino acid sequence containing L(A/P/S)X(T/S/A/C)Gn, L(A/P/S)X(T/S/A/C)An, NPQTN, YPRTG, IPQTG, VPDTG, LPXTGS, NPKTG, XPETG, LGATG, IPNTG, IPETG, NSKTA, NPQTG, NAKTN, NPQSS, LPXTX, where X is any amino acid, NPX1TX2, where X1 is Lys or Gln and X2 is Asn, Asp or Gly, X1PX2X3G, where X1is Leu, Ile, Val or Met, X2is any amino acid and X3is Ser, Thr or Ala, LPEX1G, where X1 is Ala, Cys or Ser, LPXS, LAXT, MPXT, MPXTG, LAXS, NPXT, NPXTG, NAXT, NAXTG, NAXS, NAXSG, LPXP, LPXPG, where X is any amino acid, LRXTGn or LPAXGn, where X is any amino acid and n is at least 1, where the first and second (or more) detectable labels are conjugated to different regions of the labeled polypeptide. The first and second (or more) detectable labels can be conjugated to or near an amino acid sequence containing L(A/P/S)X(T/S/A/C)Gn, L(A/P/S)X(T/S/A/C)An, NPQTN, YPRTG, IPQTG, VPDTG, or LPXTGS, wherein the first and second (or more) detectable labels are conjugated to different regions of the labeled polypeptide. For example, the first detectable label may be conjugated to the amino acid sequence N-terminal of the non-cytotoxic protease or its proteolytically inactive mutant, and the second detectable label may be conjugated to the amino acid sequence C-terminal of the TM (or vice versa). Preferably, the amino acid sequences to which the first and second (or more) detectable tags are conjugated are different.

В одном варианте осуществления поддающаяся детекции метка конъюгирована с L(A/P/S)X(T/S/A/C)Gn, L(A/P/S)X(T/S/A/C)An, NPQTN, YPRTG, IPQTG, VPDTG, LPXTGS, NPKTG, XPETG, LGATG, IPNTG, IPETG, NSKTA, NPQTG, NAKTN, NPQSS, LPXTX, где X представляет собой любую аминокислоту, NPX1TX2, где X1 представляет собой Lys или Gln и X2 представляет собой Asn, Asp или Gly, X1PX2X3G, где X1 представляет собой Leu, Ile, Val или Met, X2 представляет собой любую аминокислоту и X3 представляет собой Ser, Thr или Ala, LPEX1G, где X1 представляет собой Ala, Cys или Ser, LPXS, LAXT, MPXT, MPXTG, LAXS, NPXT, NPXTG, NAXT, NAXTG, NAXS, NAXSG, LPXP, LPXPG, где X представляет собой любую аминокислоту, LRXTGn или LPAXGn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1. Альтернативно поддающаяся детекции метка может быть конъюгирована с C-концевой стороны от L(A/P/S)X(T/S/A/C)Gn, L(A/P/S)X(T/S/A/C)An, NPQTN, YPRTG, IPQTG, VPDTG, LPXTGS, NPKTG, XPETG, LGATG, IPNTG, IPETG, NSKTA, NPQTG, NAKTN, NPQSS, LPXTX, где X представляет собой любую аминокислоту, NPX1TX2, где X1 представляет собой Lys или Gln и X2 представляет собой Asn, Asp или Gly, X1PX2X3G, где X1 представляет собой Leu, Ile, Val или Met, X2 представляет собой любую аминокислоту и X3 представляет собой Ser, Thr или Ala, LPEX1G, где X1 представляет собой Ala, Cys или Ser, LPXS, LAXT, MPXT, MPXTG, LAXS, NPXT, NPXTG, NAXT, NAXTG, NAXS, NAXSG, LPXP, LPXPG, где X представляет собой любую аминокислоту, LRXTGn или LPAXGn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1, например, на расстоян 1-50, например, 1-25 или 1-10 аминокислот с C-концевой стороны от L(A/P/S)X(T/S/A/C)Gn, L(A/P/S)X(T/S/A/C)An, NPQTN, YPRTG, IPQTG, VPDTG, LPXTGS, NPKTG, XPETG, LGATG, IPNTG, IPETG, NSKTA, NPQTG, NAKTN, NPQSS, LPXTX, где X представляет собой любую аминокислоту, NPX1TX2, где X1 представляет собой Lys или Gln и X2 представляет собой Asn, Asp или Gly, X1PX2X3G, где X1 представляет собой Leu, Ile, Val или Met, X2 представляет собой любую аминокислоту и X3 представляет собой Ser, Thr или Ala, LPEX1G, где X1 представляет собой Ala, Cys или Ser, LPXS, LAXT, MPXT, MPXTG, LAXS, NPXT, NPXTG, NAXT, NAXTG, NAXS, NAXSG, LPXP, LPXPG, где X представляет собой любую аминокислоту, LRXTGn или LPAXGn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1.In one embodiment, the detectable label is conjugated to L(A/P/S)X(T/S/A/C)Gn, L(A/P/S)X(T/S/A/C)An, NPQTN, YPRTG, IPQTG, VPDTG, LPXTGS, NPKTG, XPETG, LGATG, IPNTG, IPETG, NSKTA, NPQTG, NAKTN, NPQSS, LPXTX, where X is any amino acid, NPX1TX2, where X1 is Lys or Gln and X2 is Asn, Asp or Gly, X1PX2X3G, where X1is Leu, Ile, Val or Met, X2is any amino acid and X3is Ser, Thr or Ala, LPEX1G, where X1 is Ala, Cys or Ser, LPXS, LAXT, MPXT, MPXTG, LAXS, NPXT, NPXTG, NAXT, NAXTG, NAXS, NAXSG, LPXP, LPXPG, where X is any amino acid, LRXTGn or LPAXGn, where X is any amino acid and n is at least 1. Alternatively, a detectable label can be conjugated at the C-terminus of L(A/P/S)X(T/S/A/C)Gn, L(A/P/S)X(T/S/A/C)An, NPQTN, YPRTG, IPQTG, VPDTG, LPXTGS, NPKTG, XPETG, LGATG, IPNTG, IPETG, NSKTA, NPQTG, NAKTN, NPQSS, LPXTX, where X is any amino acid, NPX1TX2, where X1 is Lys or Gln and X2 is Asn, Asp or Gly, X1PX2X3G, where X1is Leu, Ile, Val or Met, X2is any amino acid and X3is Ser, Thr or Ala, LPEX1G, where X1 is Ala, Cys or Ser, LPXS, LAXT, MPXT, MPXTG, LAXS, NPXT, NPXTG, NAXT, NAXTG, NAXS, NAXSG, LPXP, LPXPG, where X is any amino acid, LRXTGn or LPAXGn, where X is any amino acid and n is at least 1, such as 1-50, such as 1-25 or 1-10 amino acids C-terminal from L(A/P/S)X(T/ S/A/C)Gn, L(A/P/S)X(T/S/A/C)An, NPQTN, YPRTG, IPQTG, VPDTG, LPXTGS, NPKTG, XPETG, LGATG, IPNTG, IPETG, NSKTA, NPQTG, NAKTN, NPQSS, LPXTX, where X is any amino acid, NPX1TX2, where X1 is Lys or Gln and X2 is Asn, Asp or Gly, X1PX2X3G, where X1is Leu, Ile, Val or Met, X2is any amino acid and X3is Ser, Thr or Ala, LPEX1G, where X1 is Ala, Cys or Ser, LPXS, LAXT, MPXT, MPXTG, LAXS, NPXT, NPXTG, NAXT, NAXTG, NAXS, NAXSG, LPXP, LPXPG, where X is any amino acid, LRXTGn or LPAXGn, where X is any amino acid and n is at least 1.

В одном варианте осуществления поддающаяся детекции метка конъюгирована с L(A/P/S)X(T/S/A/C)Gn, L(A/P/S)X(T/S/A/C)An, NPQTN, YPRTG, IPQTG, VPDTG или LPXTGS. Альтернативно поддающаяся детекции метка может быть конъюгирована с C-концевой стороны от L(A/P/S)X(T/S/A/C)Gn, L(A/P/S)X(T/S/A/C)An, NPQTN, YPRTG, IPQTG, VPDTG или LPXTGS, например, на расстоянии 1-50, например, 1-25 или 1-10 аминокислот с C-концевой стороны от L(A/P/S)X(T/S/A/C)Gn, L(A/P/S)X(T/S/A/C)An, NPQTN, YPRTG, IPQTG, VPDTG или LPXTGS.In one embodiment, the detectable label is conjugated to L(A/P/S)X(T/S/A/C)G n , L(A/P/S)X(T/S/A/C)A n , NPQTN, YPRTG, IPQTG, VPDTG or LPXTGS. Alternatively, the detectable label may be C-terminally conjugated from L(A/P/S)X(T/S/A/C)G n , L(A/P/S)X(T/S/A/ C)A n , NPQTN, YPRTG, IPQTG, VPDTG or LPXTGS, e.g. 1-50, e.g. 1-25 or 1-10 amino acids C-terminal from L(A/P/S)X(T /S/A/C)G n , L(A/P/S)X(T/S/A/C)A n , NPQTN, YPRTG, IPQTG, VPDTG, or LPXTGS.

В другом варианте осуществления поддающаяся детекции метка конъюгирована с N-концевой стороны от L(A/P/S)X(T/S/A/C)Gn, L(A/P/S)X(T/S/A/C)An, NPQTN, YPRTG, IPQTG, VPDTG, LPXTGS, NPKTG, XPETG, LGATG, IPNTG, IPETG, NSKTA, NPQTG, NAKTN, NPQSS, LPXTX, где X представляет собой любую аминокислоту, NPX1TX2, где X1 представляет собой Lys или Gln и X2 представляет собой Asn, Asp или Gly, X1PX2X3G, где X1 представляет собой Leu, Ile, Val или Met, X2 представляет собой любую аминокислоту и X3 представляет собой Ser, Thr или Ala, LPEX1G, где X1 представляет собой Ala, Cys или Ser, LPXS, LAXT, MPXT, MPXTG, LAXS, NPXT, NPXTG, NAXT, NAXTG, NAXS, NAXSG, LPXP, LPXPG, где X представляет собой любую аминокислоту, LRXTGn или LPAXGn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1, например, на расстоянии 1-50, например, 1-25 или 1-10 аминокислот с N-концевой стороны от L(A/P/S)X(T/S/A/C)Gn.In another embodiment, the detectable label is N-terminally conjugated from L(A/P/S)X(T/S/A/C)Gn, L(A/P/S)X(T/S/A/C)An, NPQTN, YPRTG, IPQTG, VPDTG, LPXTGS, NPKTG, XPETG, LGATG, IPNTG, IPETG, NSKTA, NPQTG, NAKTN, NPQSS, LPXTX, where X is any amino acid, NPX1TX2, where X1 is Lys or Gln and X2 is Asn, Asp or Gly, X1PX2X3G, where X1is Leu, Ile, Val or Met, X2is any amino acid and X3is Ser, Thr or Ala, LPEX1G, where X1 is Ala, Cys or Ser, LPXS, LAXT, MPXT, MPXTG, LAXS, NPXT, NPXTG, NAXT, NAXTG, NAXS, NAXSG, LPXP, LPXPG, where X is any amino acid, LRXTGn or LPAXGn, where X is any amino acid and n is at least 1, such as 1-50, such as 1-25 or 1-10 amino acids N-terminal from L(A/P/S)X(T/ S/A/C)Gn.

В другом варианте осуществления поддающаяся детекции метка конъюгирована с N-концевой стороны от L(A/P/S)X(T/S/A/C)Gn, L(A/P/S)X(T/S/A/C)An, NPQTN, YPRTG, IPQTG, VPDTG или LPXTGS, например, на расстоянии 1-50, например, 1-25 или 1-10 аминокислот с N-концевой стороны от L(A/P/S)X(T/S/A/C)Gn.In another embodiment, the detectable label is N-terminally conjugated from L(A/P/S)X(T/S/A/C)G n , L(A/P/S)X(T/S/A /C)A n , NPQTN, YPRTG, IPQTG, VPDTG or LPXTGS, e.g. 1-50, e.g. 1-25 or 1-10 amino acids N-terminal from L(A/P/S)X( T/S/A/C)G n .

В вариантах осуществления, где аминокислотная последовательность содержит L(A/P/S)X(T/S/A/C)An, X представляет собой любую аминокислоту и n может составлять по меньшей мере 2, 3, 4, 5, 6, 7, 8, 9 или 10, например, аминокислотная последовательность может содержать LPXTAn (SEQ ID NO: 102). Предпочтительно n составляет 1-10, более предпочтительно 1-4. В таких вариантах осуществления конъюгированные поддающаяся детекции метка и аминокислотная последовательность, которая содержит L(A/P/S)X(T/S/A/C)An, где X представляет собой любую аминокислоту и n равен по меньшей мере 1, указывают на то, что полипептид успешно мечен сортазой (например, из Streptococcus pyogenes).In embodiments where the amino acid sequence contains L(A/P/S)X(T/S/A/C)A n , X is any amino acid and n can be at least 2, 3, 4, 5, 6 , 7, 8, 9 or 10, for example, the amino acid sequence may contain LPXTA n (SEQ ID NO: 102). Preferably n is 1-10, more preferably 1-4. In such embodiments, a conjugated detectable label and an amino acid sequence that contains L(A/P/S)X(T/S/A/C)A n , where X is any amino acid and n is at least 1, indicate that the polypeptide has been successfully labeled with a sortase (eg, from Streptococcus pyogenes).

В особенно предпочтительном варианте осуществления аминокислотная последовательность содержит L(A/P/S)X(T/S/A/C)Gn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1. Такая аминокислотная последовательность может содержать LPXSGn (SEQ ID NO: 103), LAXTGn (SEQ ID NO: 104), LPXTGn (SEQ ID NO: 105), LPXCGn (SEQ ID NO: 107), LAXSGn (SEQ ID NO: 108), LPXAGn (SEQ ID NO: 109), или LSXTGn (SEQ ID NO: 110). Предпочтительно аминокислотная последовательность может содержать LPXSGn, LAXTGn, LPXTGn или LAXSGn.In a particularly preferred embodiment, the amino acid sequence comprises L(A/P/S)X(T/S/A/C)G n , where X is any amino acid and n is at least 1. Such amino acid sequence may contain LPXSG n (SEQ ID NO: 103), LAXTG n (SEQ ID NO: 104), LPXTG n (SEQ ID NO: 105), LPXCG n (SEQ ID NO: 107), LAXSG n (SEQ ID NO: 108), LPXAG n (SEQ ID NO: 109), or LSXTG n (SEQ ID NO: 110). Preferably the amino acid sequence may contain LPXSG n , LAXTG n , LPXTG n or LAXSG n .

В одном варианте осуществления аминокислотная последовательность содержит LRXTGn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1.In one embodiment, the amino acid sequence contains LRXTG n , where X is any amino acid and n is at least 1.

В одном варианте осуществления аминокислотная последовательность содержит LPAXGn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1.In one embodiment, the amino acid sequence contains LPAXG n , where X is any amino acid and n is at least 1.

Конъюгированные поддающаяся детекции метка и аминокислотная последовательность, которая содержит L(A/P/S)X(T/S/A/C)Gn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1, указывают на то, что полипептид успешно мечен сортазой. В одном варианте осуществления n может составлять по меньшей мере 2, 3, 4, 5, 6, 7, 8, 9 или 10. Предпочтительно n составляет 1-10, более предпочтительно 1-4.A conjugated detectable label and an amino acid sequence that contains L(A/P/S)X(T/S/A/C)G n , where X is any amino acid and n is at least 1, indicates that the polypeptide was successfully labeled with sortase. In one embodiment, n may be at least 2, 3, 4, 5, 6, 7, 8, 9 or 10. Preferably n is 1-10, more preferably 1-4.

В одном варианте осуществления поддающаяся детекции метка конъюгирована с или вблизи L(A/P/S)X(T/S/A/C)Gn.In one embodiment, the detectable label is conjugated to or near L(A/P/S)X(T/S/A/C)G n .

В одном варианте осуществления поддающаяся детекции метка конъюгирована с L(A/P/S)X(T/S/A/C)Gn, например, с ее аминокислотным остатком G. Альтернативно поддающаяся детекции метка может быть конъюгирована с C-концевой стороны от L(A/P/S)X(T/S/A/C)Gn, например, на расстоянии 1-50, например, 1-25 или 1-10 аминокислот с C-концевой стороны от L(A/P/S)X(T/S/A/C)Gn.In one embodiment, the detectable label is conjugated to L(A/P/S)X(T/S/A/C)G n , such as its amino acid residue G. Alternatively, the detectable label can be conjugated at the C-terminal side from L(A/P/S)X(T/S/A/C)G n , for example, at a distance of 1-50, for example, 1-25 or 1-10 amino acids from the C-terminal side of L(A/ P/S)X(T/S/A/C)G n .

В другом варианте осуществления поддающаяся детекции метка конъюгирована с N-концевой стороны от L(A/P/S)X(T/S/A/C)Gn, например, на расстоянии 1-50, например, 1-25 или 1-10 аминокислот с N-концевой стороны от L(A/P/S)X(T/S/A/C)Gn.In another embodiment, the detectable label is N-terminally conjugated to L(A/P/S)X(T/S/A/C)G n , such as 1-50, such as 1-25 or 1 -10 amino acids N-terminal from L(A/P/S)X(T/S/A/C)G n .

В одном варианте осуществления поддающаяся детекции метка конъюгирована с или вблизи аминокислотной последовательности LPXSGn, где n равен по меньшей мере 1, например по меньшей мере 2, 3, 4, 5, 6, 7, 8, 9 или 10. Предпочтительно n составляет 1-10, более предпочтительно 1-5. Поддающаяся детекции метка предпочтительно конъюгирована с C-концевой стороны от LPXSGn, например, с остатком лизина с C-концевой стороны от LPXSGn. X представляет собой любую аминокислоту, такую как E.In one embodiment, the detectable label is conjugated to or near the amino acid sequence LPXSG n , where n is at least 1, such as at least 2, 3, 4, 5, 6, 7, 8, 9, or 10. Preferably, n is 1 -10, more preferably 1-5. The detectable label is preferably conjugated at the C-terminal side of LPXSG n , for example, with a lysine residue at the C-terminal side of LPXSG n . X is any amino acid such as E.

В одном варианте осуществления поддающаяся детекции метка конъюгирована с или вблизи аминокислотной последовательности LAXTGn, где n равен по меньшей мере 1, например, по меньшей мере 2, 3, 4, 5, 6, 7, 8, 9 или 10. Предпочтительно, n составляет 1-10, более предпочтительно 1-4. Поддающаяся детекции метка предпочтительно конъюгирована с N-концевой стороны от LAXTGn, например, с остатком гистидина с N-концевой стороны от LAXTGn. X представляет собой любую аминокислоту, такую как E.In one embodiment, the detectable label is conjugated to or near the amino acid sequence LAXTG n , where n is at least 1, such as at least 2, 3, 4, 5, 6, 7, 8, 9, or 10. Preferably, n is 1-10, more preferably 1-4. The detectable label is preferably conjugated at the N-terminal side of LAXTG n , for example, with a histidine residue at the N-terminal side of LAXTG n . X is any amino acid such as E.

В одном варианте осуществления первая поддающаяся детекции метка конъюгирована с или вблизи аминокислотной последовательности LPXSGn (где n равен по меньшей мере 1, например по меньшей мере 2, 3, 4, 5, 6, 7, 8, 9 или 10, предпочтительно где n составляет 1-10, более предпочтительно 1-5) и вторая поддающаяся детекции метка конъюгирована с или вблизи аминокислотной последовательности LAXTGn (где n равен по меньшей мере 1, например по меньшей мере 2, 3, 4, 5, 6, 7, 8, 9 или 10, предпочтительно где n составляет 1-10, более предпочтительно 1-4). Первая поддающаяся детекции метка предпочтительно конъюгирована с C-концевой стороны от LPXSGn, например, с остатком лизина с C-концевой стороны от LPXSGn и вторая поддающаяся детекции метка предпочтительно конъюгирована с N-концевой стороны от LAXTGn, например, с остатком гистидина с N-концевой стороны от LAXTGn. X представляет собой любую аминокислоту, такую как E. В одном варианте осуществления первая поддающаяся детекции метка находится с C-концевой стороны от TM полипептида, и вторая поддающаяся детекции метка находится с N-концевой стороны от нецитотоксической протеазы или ее протеолитически неактивного мутанта (предпочтительно нецитотоксической протеазы) в полипептиде.In one embodiment, the first detectable label is conjugated to or near the amino acid sequence LPXSG n (where n is at least 1, such as at least 2, 3, 4, 5, 6, 7, 8, 9, or 10, preferably where n is 1-10, more preferably 1-5) and the second detectable label is conjugated to or near the amino acid sequence LAXTG n (where n is at least 1, e.g. at least 2, 3, 4, 5, 6, 7, 8 , 9 or 10, preferably where n is 1-10, more preferably 1-4). The first detectable label is preferably conjugated at the C-terminal side of LPXSG n , for example, with a lysine residue at the C-terminal side of LPXSG n and the second detectable label is preferably conjugated at the N-terminal side of LAXTG n , for example, with a histidine residue with N-terminal side from LAXTG n . X is any amino acid, such as E. In one embodiment, the first detectable label is C-terminal of the TM polypeptide and the second detectable label is N-terminal of the non-cytotoxic protease or its proteolytically inactive mutant (preferably the non-cytotoxic protease) in the polypeptide.

Меченый полипептид по настоящему изобретению может содержать полипептидную последовательность, обладающую по меньшей мере 70% идентичностью последовательности с SEQ ID NO: 26. В одном варианте осуществления меченый полипептид по изобретению содержит полипептидную последовательность, обладающую по меньшей мере 80% или 90% идентичностью последовательности с SEQ ID NO: 26. Предпочтительно, меченый полипептид по изобретению содержит (более предпочтительно состоит из) полипептид, представленный в качестве SEQ ID NO: 26.The labeled polypeptide of the present invention may comprise a polypeptide sequence having at least 70% sequence identity with SEQ ID NO: 26. In one embodiment, the labeled polypeptide of the invention comprises a polypeptide sequence having at least 80% or 90% sequence identity with SEQ ID NO: 26. Preferably, the labeled polypeptide of the invention comprises (more preferably consists of) the polypeptide shown as SEQ ID NO: 26.

Сортаза, описанная в настоящем описании, может представлять собой сортазу A, сортазу B, сортазу C или сортазу D. Обзор биологических свойств сортаз представлен в Mazmanian, S.K., G. Liu, H. Ton-That and O. Schneewind (1999). "Staphylococcus aureus sortase, an enzyme that anchors surface proteins to the cell wall." Science 285(5428): 760-763 и Paterson, G.K. and T.J. Mitchell (2004). "The biology of Gram-positive sortase enzymes." Trends Microbiol 12(2): 89-95, обе их которых включены в настоящее описание в качестве ссылок.The sortase described herein may be sortase A, sortase B, sortase C, or sortase D. For a review of the biological properties of sortases, see Mazmanian, S.K., G. Liu, H. Ton-That and O. Schneewind (1999). "Staphylococcus aureus sortase, an enzyme that anchors surface proteins to the cell wall." Science 285(5428): 760-763 and Paterson, G.K. and T.J. Mitchell (2004). "The biology of Gram-positive sortase enzymes." Trends Microbiol 12(2): 89-95, both of which are incorporated herein by reference.

Также настоящее изобретения охватывает варианты сортаз. Варианты сортаз в подходящем случае обладают измененной специфичностью, так что они распознают альтернативные участки сортаз (например, акцепторные участки). Варианты сортаз описаны в Dorr, B.M., H.O. Ham, C. An, E.L. Chaikof and D.R. Liu (2014). "Reprogramming the specificity of sortase enzymes." Proc Natl Acad Sci U S A 111(37): 13343-13348, Chen, I., B.M. Dorr and D.R. Liu (2011). "A general strategy for the evolution of bond-forming enzymes using yeast display." Proc Natl Acad Sci U S A 108(28): 11399-11404, Dorr, B.M., H.O. Ham, C. An, E.L. Chaikof and D.R. Liu (2014). "Reprogramming the specificity of sortase enzymes." Proc Natl Acad Sci U S A 111(37): 13343-13348, и Chen, L., J. Cohen, X. Song, A. Zhao, Z. Ye, C. J. Feulner, P. Doonan, W. Somers, L.Lin and P. . Chen (2016). "Improved variants of SrtA for site-specific conjugation on antibodies and proteins with high efficiency." Sci Rep 6: 31899, каждая из которых включена в настоящее описание в качестве ссылки. Специализированные варианты сортаз можно получать с использованием методологии, описанной в указанных источниках литературы. Специалист в данной области выберет подходящие донорные и/или акцепторные участки для сортазы, распознаваемые вариантом сортазы, при использовании указанного варианта в рамках настоящего изобретения. Кроме того, специалисту в данной области будет понятно, что указанные донорные и/или акцепторные участки для сортазы могут отличаться от участков, приведенных в настоящем описании.Also, the present invention covers sortase variants. Sortase variants suitably have altered specificity so that they recognize alternative sortase sites (eg, acceptor sites). Sortase variants are described in Dorr, B.M., H.O. Ham, C. An, E.L. Chaikof and D.R. Liu (2014). "Reprogramming the specificity of sortase enzymes." Proc Natl Acad Sci U S A 111(37): 13343-13348, Chen, I., B.M. Dorr and D.R. Liu (2011). "A general strategy for the evolution of bond-forming enzymes using yeast display." Proc Natl Acad Sci U S A 108(28): 11399-11404, Dorr, B.M., H.O. Ham, C. An, E.L. Chaikof and D.R. Liu (2014). "Reprogramming the specificity of sortase enzymes." Proc Natl Acad Sci U S A 111(37): 13343-13348, and Chen, L., J. Cohen, X. Song, A. Zhao, Z. Ye, C. J. Feulner, P. Doonan, W. Somers, L. Lin and P. . Chen (2016). "Improved variants of SrtA for site-specific conjugation on antibodies and proteins with high efficiency." Sci Rep 6: 31899, each of which is incorporated herein by reference. Specialized variants of sortases can be obtained using the methodology described in the references indicated. The person skilled in the art will select appropriate sortase donor and/or acceptor sites recognized by the sortase variant when using said variant within the scope of the present invention. In addition, a person skilled in the art will understand that these donor and/or acceptor sites for sortase may differ from the sites described in the present description.

В одном варианте осуществления вариант сортазы может включать модифицированную сортазу A Staphylococcus aureus. Модифицированная сортаза A может включать одну или несколько мутаций относительно последовательности SEQ ID NO: 31, описанной в настоящем описании. Например, модифицированная сортаза A может содержать одну или несколько из следующих мутаций относительно последовательности SEQ ID NO: 31: P86L, P94S, P94R, N98S, A104T, E106G, A118T, F122S, F122Y, D124G, N127S, K134R, F154R, D160N, D165A, K173E, G174S, K177E, I182V, K190E, K196T или их комбинацию. В некоторых вариантах осуществления в рамках настоящего изобретения предусматривается модифицированная сортаза, которая включает 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18 или все 19 из этих мутаций. Вышеупомянутые аминокислотные замены могут обеспечить модифицированную сортазу, которая эффективно использует акцепторные и/или донорные участки, с которыми не связывается соответствующая исходная сортаза дикого типа. Например, в некоторых вариантах осуществления модифицированная сортаза использует акцепторный участок для сортазы, имеющий последовательность LPXTG, и донорный участок, имеющий N-концевой полиглициновый мотив. В некоторых вариантах осуществления модифицированная сортаза использует акцепторный и/или донорный участок, который отличается от акцепторного и/или донорного участка (соответственно), используемого исходной сортазой, например, акцепторного участка для сортазы, включающего мотив LPXS, LAXT, LAXTG (SEQ ID NO: 116), MPXT, MPXTG, LAXS, LAXSG (SEQ ID NO: 120), NPXT, NPXTG, NAXT, NAXTG, NAXS, NAXSG, LPXP, LPXPG или LPXTA (SEQ ID NO: 114).In one embodiment, the sortase variant may include a modified Staphylococcus aureus sortase A. The modified sortase A may include one or more mutations relative to the sequence of SEQ ID NO: 31 described in the present description. For example, modified sortase A may contain one or more of the following mutations relative to the sequence of SEQ ID NO: 31: P86L, P94S, P94R, N98S, A104T, E106G, A118T, F122S, F122Y, D124G, N127S, K134R, F154R, D160N, D165A , K173E, G174S, K177E, I182V, K190E, K196T or a combination. In some embodiments, the present invention provides a modified sortase that includes 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, or all 19 of these mutations. The above amino acid substitutions can provide a modified sortase that efficiently utilizes acceptor and/or donor sites that the corresponding wild-type parent sortase does not bind to. For example, in some embodiments, the modified sortase uses a sortase acceptor site having an LPXTG sequence and a donor site having an N-terminal polyglycine motif. In some embodiments, the modified sortase uses an acceptor and/or donor site that is different from the acceptor and/or donor site (respectively) used by the original sortase, e.g., an acceptor site for sortase comprising an LPXS, LAXT, LAXTG motif (SEQ ID NO: 116), MPXT, MPXTG, LAXS, LAXSG (SEQ ID NO: 120), NPXT, NPXTG, NAXT, NAXTG, NAXS, NAXSG, LPXP, LPXPG or LPXTA (SEQ ID NO: 114).

Предпочтительно сортаза представляет собой сортазу A или ее вариант. Сортаза A представляет собой транспептидазу, которая распознает (предпочтительно C-концевой) мотив L(A/P/S)X(T/S/A/C)(G/A) белков для расщепления между (T/S/A/C) и G/A, а затем переносит ацильный компонент на нуклеофил, содержащий (предпочтительно N-концевой) (олиго)глицин (где мотив представляет собой L(A/P/S)X(T/S/A/C)G) или (олиго)аланин (где мотив представляет собой L(A/P/S)X(T/S/A/C)A). В одном варианте осуществления сортаза A может представлять собой сортазу, получаемую из Streptococcus pyogenes (например, SEQ ID NO: 37), причем указанная сортаза распознает (среди прочих) акцепторный участок для сортазы, имеющий последовательность LPXTA, в таких случаях предпочтительно акцепторный участок для сортазы представляет собой An, где n равен по меньшей мере 1. Применение сортазы S. pyogenes описано в Antos et al (2009), J Am Chem Soc, 131, 10800-10801, которая включена в настоящее описание в качестве ссылки.Preferably, the sortase is sortase A or a variant thereof. Sortase A is a transpeptidase that recognizes the (preferably C-terminal) L(A/P/S)X(T/S/A/C)(G/A) motif of proteins to cleave between (T/S/A/C ) and G/A, and then transfers the acyl moiety to a nucleophile containing (preferably N-terminal) (oligo)glycine (where the motif is L(A/P/S)X(T/S/A/C)G) or (oligo)alanine (wherein the motif is L(A/P/S)X(T/S/A/C)A). In one embodiment, sortase A may be a sortase derived from Streptococcus pyogenes (e.g., SEQ ID NO: 37), wherein said sortase recognizes (among others) a sortase acceptor site having the sequence LPXTA, in such cases, preferably a sortase acceptor site is A n , where n is at least 1. The use of S. pyogenes sortase is described in Antos et al (2009), J Am Chem Soc, 131, 10800-10801, which is incorporated herein by reference.

Предпочтительно, сортаза A может представлять собой сортазу, получаемую из Staphylococcus aureus, или ее вариант.Preferably, sortase A may be a sortase derived from Staphylococcus aureus, or a variant thereof.

В одном варианте осуществления акцепторный участок для сортазы может содержать (или состоять из) L(A/P/S)X(T/S/A/C)(G/A), NPQTN, YPRTG, IPQTG, VPDTG, или LPXTGS, где X представляет собой любую аминокислоту. Например, акцепторный участок для сортазы может содержать (или состоять из) L(A/P/S)X(T/S/A/C)G, NPQTN, YPRTG, IPQTG, VPDTG или LPXTGS, где X представляет собой любую аминокислоту.In one embodiment, the sortase acceptor site may comprise (or consist of) L(A/P/S)X(T/S/A/C)(G/A), NPQTN, YPRTG, IPQTG, VPDTG, or LPXTGS, where X is any amino acid. For example, a sortase acceptor site may comprise (or consist of) L(A/P/S)X(T/S/A/C)G, NPQTN, YPRTG, IPQTG, VPDTG, or LPXTGS, where X is any amino acid.

В одном варианте осуществления акцепторный участок для сортазы может содержать (или состоять из) NPKTG, XPETG, LGATG, IPNTG, IPETG, NSKTA, NPQTG, NAKTN, NPQSS, LPXTX, где X представляет собой любую аминокислоту, NPX1TX2, где X1 представляет собой Lys или Gln и X2 представляет собой Asn, Asp или Gly, X1PX2X3G, где X1 представляет собой Leu, Ile, Val или Met, X2 представляет собой любую аминокислоту и X3 представляет собой Ser, Thr или Ala, LPEX1G, где X1 представляет собой Ala, Cys или Ser, LPXS, LAXT, MPXT, MPXTG, LAXS, NPXT, NPXTG, NAXT, NAXTG, NAXS, NAXSG, LPXP, LPXPG, где X представляет собой любую аминокислоту, LRXTG (SEQ ID NO: 123) или LPAXG (SEQ ID NO: 118), где X представляет собой любую аминокислоту.In one embodiment, the sortase acceptor site may comprise (or consist of) NPKTG, XPETG, LGATG, IPNTG, IPETG, NSKTA, NPQTG, NAKTN, NPQSS, LPXTX, where X is any amino acid, NPX1TX2, where X1 is Lys or Gln and X2 is Asn, Asp or Gly, X1PX2X3G, where X1is Leu, Ile, Val or Met, X2is any amino acid and X3is Ser, Thr or Ala, LPEX1G, where X1 is Ala, Cys or Ser, LPXS, LAXT, MPXT, MPXTG, LAXS, NPXT, NPXTG, NAXT, NAXTG, NAXS, NAXSG, LPXP, LPXPG, where X is any amino acid, LRXTG (SEQ ID NO: 123) or LPAXG (SEQ ID NO: 118), where X is any amino acid.

Акцепторный участок для сортазы X1PX2X3G может распознаваться сортазой A. В некоторых вариантах осуществления, где акцепторный участок для сортазы содержит (или состоит из) X1PX2X3G, X2 может представлять собой Asp, Glu, Ala, Gln, Lys или Met. в некоторых вариантах осуществления указанный акцепторный участок для сортазы содержит (или состоит из) LPX1TG, где X1 представляет собой любую аминокислоту. В других вариантах осуществления акцепторный участок для сортазы содержит (или состоит из): LPKTG, LPATG, LPNTG, LPETG, LPNAG, LPNTA, LGATG, IPNTG или IPETG.The acceptor site for sortase X 1 PX 2 X 3 G may be recognized by sortase A. In some embodiments, where the acceptor site for sortase contains (or consists of) X 1 PX 2 X 3 G, X 2 may be Asp, Glu, Ala , Gln, Lys or Met. in some embodiments, said sortase acceptor site comprises (or consists of) LPX 1 TG, where X 1 is any amino acid. In other embodiments, the sortase acceptor site comprises (or consists of): LPKTG, LPATG, LPNTG, LPETG, LPNAG, LPNTA, LGATG, IPNTG, or IPETG.

Акцепторный участок для сортазы NPX1TX2 может распознаваться сортазой B. В некоторых вариантах осуществления акцепторный участок для сортазы содержит (или состоит из): NPQTN, NPKTG, NSKTA, NPQTG, NAKTN или NPQSS.The NPX 1 TX 2 sortase acceptor site can be recognized by sortase B. In some embodiments, the sortase acceptor site comprises (or consists of): NPQTN, NPKTG, NSKTA, NPQTG, NAKTN, or NPQSS.

Акцепторный участок для сортазы LPXTX может распознаваться сортазой C.Acceptor site for sortase LPXTX can be recognized by sortase C.

В одном варианте осуществления акцепторный участок для сортазы не содержит (или не состоит из) NPKTG, XPETG, LGATG, IPNTG, IPETG, NSKTA, NPQTG, NAKTN, NPQSS, LPXTX, где X представляет собой любую аминокислоту, NPX1TX2, где X1 представляет собой Lys или Gln и X2 представляет собой Asn, Asp или Gly, X1PX2X3G, где X1 представляет собой Leu, Ile, Val или Met, X2 представляет собой любую аминокислоту и X3 представляет собой Ser, Thr или Ala, LPEX1G, где X1 представляет собой Ala, Cys или Ser, LPXS, LAXT, MPXT, MPXTG, LAXS, NPXT, NPXTG, NAXT, NAXTG, NAXS, NAXSG, LPXP, LPXPG, где X представляет собой любую аминокислоту, LRXTG или LPAXG, где X представляет собой любую аминокислоту.In one embodiment, the sortase acceptor site does not contain (or does not consist of) NPKTG, XPETG, LGATG, IPNTG, IPETG, NSKTA, NPQTG, NAKTN, NPQSS, LPXTX, where X is any amino acid, NPX 1 TX 2 , where X 1 is Lys or Gln and X 2 is Asn, Asp or Gly, X 1 PX 2 X 3 G where X 1 is Leu, Ile, Val or Met, X 2 is any amino acid and X 3 is Ser , Thr or Ala, LPEX 1 G, where X 1 is Ala, Cys or Ser, LPXS, LAXT, MPXT, MPXTG, LAXS, NPXT, NPXTG, NAXT, NAXTG, NAXS, NAXSG, LPXP, LPXPG, where X is any amino acid, LRXTG or LPAXG, where X is any amino acid.

В вариантах осуществления, где используется сортаза A, участок сортазы (например, акцепторный или донорный участок) представляет собой участок сортазы A.In embodiments where sortase A is used, the sortase A region (e.g., acceptor or donor region) is the sortase A region.

В предпочтительном варианте осуществления акцепторный участок для сортазы, описанный в настоящем описании, может представлять собой участок сортазы A. Консенсусный акцепторный участок сортазы A может представлять собой L(A/P/S)X(T/S/A/C)(G/A), где X представляет собой любую аминокислоту, такую как E. Однако является предпочтительным, чтобы консенсусный акцепторный участок сортазы A представлял собой L(A/P/S)X(T/S/A/C)G.In a preferred embodiment, the sortase A acceptor site described herein may be the sortase A site. The sortase A consensus acceptor site may be L(A/P/S)X(T/S/A/C)(G/ A), where X is any amino acid such as E. However, it is preferred that the consensus acceptor site of sortase A is L(A/P/S)X(T/S/A/C)G.

В одном варианте осуществления акцепторный участок сортазы A содержит или выбран из LPXSG (SEQ ID NO: 115), LAXTG, LPXTG (SEQ ID NO: 117), LPAXG, LPXCG (SEQ ID NO: 119), LAXSG, LPXAG (SEQ ID NO: 121), LSXTG (SEQ ID NO: 122), LRXTG и LPXTA. Предпочтительно акцепторный участок сортазы A может быть выбран из LPXSG, LAXTG, LPXTG и LAXSG, более предпочтительно LPXSG или LAXTG. Например, акцепторный участок сортазы A может представлять собой LPESG (SEQ ID NO: 112) или LAETG (SEQ ID NO: 113), как проиллюстрировано в настоящем описании.In one embodiment, the acceptor site of sortase A comprises or is selected from LPXSG (SEQ ID NO: 115), LAXTG, LPXTG (SEQ ID NO: 117), LPAXG, LPXCG (SEQ ID NO: 119), LAXSG, LPXAG (SEQ ID NO: 119), LAXSG, LPXAG (SEQ ID NO: 117). : 121), LSXTG (SEQ ID NO: 122), LRXTG and LPXTA. Preferably, the acceptor site of sortase A can be selected from LPXSG, LAXTG, LPXTG and LAXSG, more preferably LPXSG or LAXTG. For example, the acceptor site of sortase A can be LPESG (SEQ ID NO: 112) or LAETG (SEQ ID NO: 113) as illustrated herein.

В некоторых вариантах осуществления после акцепторного участка для сортазы, описанного в настоящем описании, следует один или несколько C-концевых аминокислотных остатков, как например, 1-50, 1-10 или предпочтительно 1-5 (например, 2) аминокислотных остатков. В некоторых вариантах осуществления после акцепторного участка для сортазы следует один или несколько кислотных аминокислотных остатков. Кислотный аминокислотный остаток может представлять собой аспартат или глутамат.In some embodiments, the sortase acceptor site described herein is followed by one or more C-terminal amino acid residues, such as 1-50, 1-10, or preferably 1-5 (eg, 2) amino acid residues. In some embodiments, the sortase acceptor site is followed by one or more acidic amino acid residues. The acidic amino acid residue may be aspartate or glutamate.

Донорный участок для сортазы может содержать (или состоять из) Gn, где n равен по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9 или 10. В одном варианте осуществления n равен по меньшей мере 2. Предпочтительно n равен 2-10, как например, 2-5. Более предпочтительно n равен 4. Такой донорный участок предпочтительно может представлять собой участок для сортазы A, предпочтительно для применения с акцепторным участком для сортазы A L(A/P/S)X(T/S/A/C)G.The sortase donor site may comprise (or consist of) G n , where n is at least 1, 2, 3, 4, 5, 6, 7, 8, 9, or 10. In one embodiment, n is at least 2 Preferably n is 2-10, such as 2-5. More preferably, n is 4. Such a donor site may preferably be a sortase A site, preferably for use with an acceptor site for sortase AL(A/P/S)X(T/S/A/C)G.

В некоторых вариантах осуществления донорный участок для сортазы может представлять собой GnK, где n равен по меньшей мере 1 (например по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9 или 10, в одном варианте осуществления n равен по меньшей мере 2, и предпочтительно n равен 2-10, как например, 2-5).In some embodiments, the sortase donor site may be G n K, where n is at least 1 (e.g., at least 1, 2, 3, 4, 5, 6, 7, 8, 9, or 10, in one embodiment implementation n is at least 2, and preferably n is 2-10, such as 2-5).

В одном варианте осуществления акцепторный участок для сортазы для применения в рамках изобретения содержит (или состоит из) L(A/P/S)X(T/S/A/C)G, где X представляет собой любую аминокислоту, и донорный участок для сортазы для применения в рамках изобретения содержит (или состоит из) Gn, где n равен по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9 или 10.In one embodiment, a sortase acceptor site for use in the present invention comprises (or consists of) L(A/P/S)X(T/S/A/C)G, where X is any amino acid, and a donor site for sortase for use within the scope of the invention contains (or consists of) G n where n is at least 1, 2, 3, 4, 5, 6, 7, 8, 9 or 10.

Донорный участок для сортазы может содержать (или состоять из) An, где n равен по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9 или 10. В одном варианте осуществления n равен по меньшей мере 2. Предпочтительно n равен 2-10, как например, 2-5. Более предпочтительно n равен 4. Такой донорный участок предпочтительно может представлять собой участок для сортазы A, предпочтительно для применения с акцепторным участком для сортазы A L(A/P/S)X(T/S/A/C)A.The sortase donor site may comprise (or consist of) A n , where n is at least 1, 2, 3, 4, 5, 6, 7, 8, 9, or 10. In one embodiment, n is at least 2 Preferably n is 2-10, such as 2-5. More preferably, n is 4. Such a donor site may preferably be a sortase A site, preferably for use with an acceptor site for sortase AL(A/P/S)X(T/S/A/C)A.

В одном варианте осуществления акцепторный участок для сортазы для применения в рамках изобретения содержит (или состоит из) L(A/P/S)X(T/S/A/C)A, где X представляет собой любую аминокислоту, и донорный участок для сортазы для применения в рамках изобретения содержит (или состоит из) An, где n равен по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9 или 10.In one embodiment, a sortase acceptor site for use in the invention comprises (or consists of) L(A/P/S)X(T/S/A/C)A, where X is any amino acid, and a donor site for sortase for use within the scope of the invention contains (or consists of) A n where n is at least 1, 2, 3, 4, 5, 6, 7, 8, 9 or 10.

В контексте акцпторных или донорных участков для сортаз, X может представлять собой любую аминокислоту, например, выбранную из стандартных аминокислот: аспарагиновая кислота, глутаминовая кислота, аргинин, лизин, гистидин, аспарагин, глутамин, серин, треонин, тирозин, метионин, триптофан, цистеин, аланин, глицин, валин, лейцин, изолейцин, пролин и фенилаланин. В некоторых вариантах осуществления X может представлять собой любую аминокислоту за исключением пролина.In the context of acceptor or donor sites for sortases, X can be any amino acid, for example, selected from the standard amino acids: aspartic acid, glutamic acid, arginine, lysine, histidine, asparagine, glutamine, serine, threonine, tyrosine, methionine, tryptophan, cysteine , alanine, glycine, valine, leucine, isoleucine, proline and phenylalanine. In some embodiments, X may be any amino acid except for proline.

Когда используется акцепторный участок не сортазы A, такой как:When a non-sortase A acceptor site is used, such as:

участок сортазы B Staphylococcus aureus: NPQTN;Sortase B region of Staphylococcus aureus: NPQTN;

участок сортазы B Streptococcus pneumoniae: YPRTG, IPQTG или VPDTG;Streptococcus pneumoniae sortase B region: YPRTG, IPQTG, or VPDTG;

участок сортазы B Streptococcus pyogenes: LPXTGS;Streptococcus pyogenes sortase B region: LPXTGS;

участок сортазы C Streptococcus pneumoniae: YPRTG, IPQTG или VPDTG; иStreptococcus pneumoniae sortase C region: YPRTG, IPQTG, or VPDTG; And

участок сортазы D Streptococcus pneumoniae: YPRTG, IPQTG или VPDTG;Streptococcus pneumoniae sortase D region: YPRTG, IPQTG, or VPDTG;

специалист в данной области выберет подходящий донорный участок для применения с указанным акцепторным участком не сортазы A, исходя из информации, имеющейся в данной области.one of skill in the art will select an appropriate donor site for use with said non-sortase A acceptor site based on knowledge in the art.

Сортаза B может представлять собой каталитически активный полипептид, обладающий по меньшей мере 70% идентичностью последовательности с SEQ ID NO: 32 или 34. В одном варианте осуществления сортаза B может представлять собой каталитически активный полипептид, обладающий по меньшей мере 80% или 90% идентичностью последовательности с SEQ ID NO: 32 или 34. Предпочтительно сортаза B может представлять собой каталитически активный полипептид, содержащий (более предпочтительно состоящий из) SEQ ID NO: 32 или 34.Sortase B can be a catalytically active polypeptide having at least 70% sequence identity with SEQ ID NO: 32 or 34. In one embodiment, sortase B can be a catalytically active polypeptide having at least 80% or 90% sequence identity with SEQ ID NO: 32 or 34. Preferably, sortase B may be a catalytically active polypeptide comprising (more preferably consisting of) SEQ ID NO: 32 or 34.

Сортаза C может представлять собой каталитически активный полипептид, обладающий по меньшей мере 70% идентичностью последовательности с SEQ ID NO: 35. В одном варианте осуществления сортаза C может представлять собой каталитически активный полипептид, обладающий по меньшей мере 80% или 90% идентичностью последовательности с SEQ ID NO: 35. Предпочтительно сортаза C может представлять собой каталитически активный полипептид, содержащий (более предпочтительно состоящий из) SEQ ID NO: 35.Sortase C can be a catalytically active polypeptide having at least 70% sequence identity with SEQ ID NO: 35. In one embodiment, sortase C can be a catalytically active polypeptide having at least 80% or 90% sequence identity with SEQ ID NO: 35. Preferably, sortase C may be a catalytically active polypeptide comprising (more preferably consisting of) SEQ ID NO: 35.

Сортаза D может представлять собой каталитически активный полипептид, обладающий по меньшей мере 70% идентичностью последовательности с SEQ ID NO: 36. В одном варианте осуществления сортаза D может представлять собой каталитически активный полипептид, обладающий по меньшей мере 80% или 90% идентичностью последовательности с SEQ ID NO: 36. Предпочтительно сортаза D может представлять собой каталитически активный полипептид, содержащий (более предпочтительно состоящий из) SEQ ID NO: 36.Sortase D may be a catalytically active polypeptide having at least 70% sequence identity with SEQ ID NO: 36. In one embodiment, sortase D may be a catalytically active polypeptide having at least 80% or 90% sequence identity with SEQ ID NO: 36. Preferably, sortase D may be a catalytically active polypeptide comprising (more preferably consisting of) SEQ ID NO: 36.

Акцепторный участок для сортазы предпочтительно находится на C-конце полипептида. Донорный участок для сортазы предпочтительно находится на N-конце полипептида.The acceptor site for sortase is preferably located at the C-terminus of the polypeptide. The sortase donor site is preferably located at the N-terminus of the polypeptide.

Термин "находящийся на C-конце", как используют в этом контексте, может означать, что C-концевой остаток акцепторного участка находится на расстоянии вплоть до 50 аминокислотных остатков с N-концевой стороны от C-концевого остатка полипептида, например, что C-концевой остаток акцепторного участка находится на расстоянии 1-50, предпочтительно 10-40 аминокислотных остатков с N-концевой стороны от C-концевого остатка полипептида. В особенно предпочтительных вариантах осуществления C-концевой остаток акцепторного участка может представлять собой C-концевой остаток полипептида.The term "located at the C-terminus", as used in this context, may mean that the C-terminal residue of the acceptor region is up to 50 amino acid residues N-terminal from the C-terminal residue of the polypeptide, for example, that C- the terminal residue of the acceptor site is at a distance of 1-50, preferably 10-40 amino acid residues from the N-terminal side of the C-terminal residue of the polypeptide. In particularly preferred embodiments, the C-terminal residue of the acceptor region may be the C-terminal residue of the polypeptide.

В вариантах осуществления, где существует один или несколько остатков с C-концевой стороны от акцепторного участка для сортазы полипептида, предпочтительно, чтобы указанные один или несколько остатков были удалены перед использованием полипептида в способе мечения, описанном в настоящем описании.In embodiments where there is one or more residues C-terminal from the acceptor site for sortase of the polypeptide, it is preferred that said one or more residues be removed prior to using the polypeptide in the labeling method described herein.

Термин "находящийся на N-конце", как используют в этом контексте, может означать, что C-концевой остаток донорного участка находится на расстоянии вплоть до 50 аминокислотных остатков с C-концевой стороны от N-концевого остатка полипептида, например, что N-концевой остаток донорного участка находится на расстоянии 1-50, предпочтительно 1-25 аминокислотных остатков с C-концевой стороны от N-концевого остатка полипептида. В особенно предпочтительных вариантах осуществления N-концевой остаток донорного участка может представлять собой N-концевой остаток полипептида.The term "located at the N-terminus", as used in this context, may mean that the C-terminal residue of the donor site is up to 50 amino acid residues from the C-terminal side of the N-terminal residue of the polypeptide, for example, that N- the end residue of the donor site is at a distance of 1-50, preferably 1-25 amino acid residues from the C-terminal side of the N-terminal residue of the polypeptide. In particularly preferred embodiments, the N-terminal residue of the donor site may be the N-terminal residue of the polypeptide.

В вариантах осуществления, где с N-концевой стороны от донорного участка для сортазы в полипептиде находится один или несколько остатков, предпочтительно, чтобы указанные один или несколько остатков были удалены перед применением полипептида в способе мечения, описанном в настоящем описании.In embodiments where one or more residues are present on the N-terminal side of the sortase donor site in the polypeptide, it is preferred that said one or more residues be removed before the polypeptide is used in the labeling method described herein.

В одном варианте осуществления акцепторный или донорный участок для сортазы находится с C-концевой стороны от TM полипептида. В одном варианте осуществления акцепторный или донорный участок для сортазы находится с N-концевой стороны от нецитотоксической протеазы или ее протеолитически неактивного мутанта.In one embodiment, the sortase acceptor or donor site is C-terminal to the TM polypeptide. In one embodiment, the sortase acceptor or donor site is N-terminal to a non-cytotoxic protease or a proteolytically inactive mutant thereof.

В одном варианте осуществления полипептид по изобретению содержит по меньшей мере два акцепторных участка для сортазы, по меньшей мере два донорных участка для сортазы, или по меньшей мере один акцепторный участок для сортазы и по меньшей мере один донорный участок для сортазы. Предпочтительно полипептид по изобретению содержит один акцепторный участок для сортазы и один донорный участок для сортазы. При мечении в способе по изобретению полипептиды, содержащие по меньшей мере два (предпочтительно два) участка, как описано в настоящем описании, содержат по меньшей мере две (предпочтительно две) поддающихся детекции метки. Для таких полипептидов по меньшей мере два участка предпочтительно различаются, например, один участок может представлять собой донорный участок, и один может представлять собой акцепторный участок, или альтернативно, когда по меньшей мере два участка являются одинаковыми (например, оба участка донорные или оба участка акцепторные), предпочтительно, чтобы участки имели различные аминокислотные последовательности. Это позволяет использовать различные сортазы для опосредования мечения, такие как сортазы, которые распознают различные акцепторные участки.In one embodiment, the polypeptide of the invention comprises at least two sortase acceptor sites, at least two sortase donor sites, or at least one sortase acceptor site and at least one sortase donor site. Preferably, the polypeptide of the invention contains one sortase acceptor site and one sortase donor site. When labeled in the method of the invention, polypeptides containing at least two (preferably two) sites, as described herein, contain at least two (preferably two) detectable labels. For such polypeptides, at least two sites are preferably different, for example, one site may be a donor site and one may be an acceptor site, or alternatively, when at least two sites are the same (for example, both donor sites or both acceptor sites ), preferably the regions have different amino acid sequences. This allows different sortases to be used to mediate labeling, such as sortases that recognize different acceptor sites.

В одном варианте осуществления полипептид по изобретению содержит акцепторный участок для сортазы, находящийся с C-концевой стороны от TM полипептида и донорный участок для сортазы, находящийся с N-концевой стороны от нецитотоксической протеазы или ее протеолитически неактивного мутанта (предпочтительно нецитотоксической протеазы).In one embodiment, the polypeptide of the invention comprises a sortase acceptor site located C-terminally from the TM polypeptide and a sortase donor site located N-terminally from a non-cytotoxic protease or a proteolytically inactive mutant thereof (preferably a non-cytotoxic protease).

В одном варианте осуществления способ мечения полипептида включает двухстадийный процесс мечения. В одном варианте осуществления одна из стадий включает применение сортазы, которая распознает первый акцепторный участок для сортазы в полипептиде или меченом субстрате, и вторая стадия включает использование отличающейся сортазы, которая распознает отличающийся акцепторный участок полипептида или меченого субстрата. Специалисту в данной области будет понятно, что, если используют более двух различных участков для сортазы, способ может включать более двух стадий мечения и в нем может использоваться две различных сортазы, где каждая сортаза распознает один из различных акцепторных участков для сортазы.In one embodiment, a method for labeling a polypeptide comprises a two step labeling process. In one embodiment, one of the steps includes using a sortase that recognizes a first sortase acceptor site in the polypeptide or labeled substrate, and a second step includes using a different sortase that recognizes a different acceptor site for the polypeptide or labeled substrate. One skilled in the art will appreciate that if more than two different sortase sites are used, the method may include more than two labeling steps and may use two different sortases, where each sortase recognizes one of the different sortase acceptor sites.

Предпочтительно полипептид содержит акцепторный участок, содержащий (или состоящий из) LPXSG, и донорный участок, содержащий (или состоящий из) Gn, где n равен 2-5. В особенно предпочтительном варианте осуществления полипептид содержит акцепторный участок, содержащий (или состоящий из) LPESG, и донорный участок, содержащий (или состоящий из) G3.Preferably the polypeptide contains an acceptor site containing (or consisting of) LPXSG, and a donor site containing (or consisting of) G n where n is 2-5. In a particularly preferred embodiment, the polypeptide contains an acceptor site containing (or consisting of) LPESG, and a donor site containing (or consisting of) G 3 .

В одном варианте осуществления способ по изобретению включает:In one embodiment, the method of the invention comprises:

a. получение полипептида, содержащего акцепторный участок для сортазы и донорный участок для сортазы;a. obtaining a polypeptide containing an acceptor site for sortase and a donor site for sortase;

b. инкубацию полипептида с:b. incubation of the polypeptide with:

первой сортазой, которая распознает акцепторный участок для сортазы; иa first sortase that recognizes an acceptor site for sortase; And

первым меченым субстратом, содержащим донорный участок для сортазы и конъюгированную поддающуюся детекции метку;a first labeled substrate containing a sortase donor site and a conjugated detectable label;

где первая сортаза катализирует соединение аминокислоты акцепторного участка для сортазы и аминокислоты донорного участка для сортазы, с осуществлением тем самым мечения полипептида;where the first sortase catalyzes the connection of the amino acid of the acceptor site for the sortase and the amino acid of the donor site for the sortase, thereby labeling the polypeptide;

c. дальнейшую инкубацию полипептида с:c. further incubation of the polypeptide with:

вторым меченым субстратом, содержащим другой акцепторный участок для сортазы и конъюгированную поддающуюся детекции метку, где акцепторный участок для сортазы отличается от акцепторного участка для сортазы в полипептиде; иa second labeled substrate comprising a different sortase acceptor site and a conjugated detectable label, wherein the sortase acceptor site is different from the sortase acceptor site in the polypeptide; And

второй сортазой, которая распознает другой акцепторный участок для сортазы (и предпочтительно не распознает акцепторный участок для сортазы в полипептиде);a second sortase that recognizes a different sortase acceptor site (and preferably does not recognize a sortase acceptor site in the polypeptide);

где вторая сортаза катализирует соединение между аминокислотой другого акцепторного участка для сортазы и аминокислотой донорного участка для сортазы, тем самым далее осуществляя мечение полипептида; иwhere the second sortase catalyzes the connection between the amino acid of another acceptor site for sortase and the amino acid of the donor site for sortase, thereby further labeling the polypeptide; And

d. получение меченого полипептида.d. obtaining a labeled polypeptide.

Специалисту в данной области будет понятно, что порядок стадий b. и c. вышеупомянутого способа может быть любым.One skilled in the art will appreciate that the order of steps b. and c. the above method can be any.

В другом варианте осуществления способ по изобретению включает:In another embodiment, the method of the invention comprises:

a. получение полипептида, содержащего первый акцепторный участок для сортазы и второй акцепторный участок для сортазы, где первый и второй акцепторные участки для сортазы различаются;a. obtaining a polypeptide containing a first acceptor site for sortase and a second acceptor site for sortase, where the first and second acceptor sites for sortase differ;

b. инкубацию полипептида с:b. incubation of the polypeptide with:

первой сортазой, которая распознает первый акцепторный участок для сортазы (и предпочтительно не распознает второй акцепторный участок для сортазы); иa first sortase that recognizes a first sortase acceptor site (and preferably does not recognize a second sortase acceptor site); And

меченым субстратом, содержащим донорный участок для сортазы и конъюгированную поддающуюся детекции метку;a labeled substrate containing a sortase donor site and a conjugated detectable label;

где первая сортаза катализирует соединение аминокислоты первого акцепторного участка для сортазы и аминокислоты донорного участка для сортазы, с осуществлением тем самым мечения полипептида;where the first sortase catalyzes the connection of the amino acid of the first acceptor site for sortase and the donor site amino acid for sortase, thereby carrying out labeling of the polypeptide;

c. дальнейшую инкубацию полипептида с:c. further incubation of the polypeptide with:

второй сортазой, которая распознает второй акцепторный участок для сортазы (и предпочтительно не распознает первый акцепторный участок для сортазы); иa second sortase that recognizes the second sortase acceptor site (and preferably does not recognize the first sortase acceptor site); And

меченым субстратом, содержащим донорный участок для сортазы и конъюгированную поддающуюся детекции метку;a labeled substrate containing a sortase donor site and a conjugated detectable label;

где вторая сортаза катализирует соединение аминокислоты второго акцепторного участка для сортазы с аминокислотой донорного участка для сортазы, тем самым далее осуществляя мечение полипептида; иwhere the second sortase catalyzes the connection of the amino acid of the second acceptor site for sortase with the amino acid donor site for sortase, thereby further labeling the polypeptide; And

d. получение меченого полипептида.d. obtaining a labeled polypeptide.

Специалисту в данной области будет понятно, что порядок стадий b. и c. вышеупомянутого способа может быть любым.One skilled in the art will appreciate that the order of steps b. and c. the above method can be any.

На стадии c. меченый субстрат предпочтительно содержит отличающуюся поддающуюся детекции метку от меченого субстрата стадии b., например, флуорофоры различного цвета.At stage c. the labeled substrate preferably contains a different detectable label from the labeled substrate of step b., for example different colored fluorophores.

В другом варианте осуществления способ по изобретению включает:In another embodiment, the method of the invention comprises:

a. получение полипептида, содержащего первый донорный участок для сортазы и второй донорный участок для сортазы;a. obtaining a polypeptide comprising a first sortase donor site and a second sortase donor site;

b. инкубацию полипептида с:b. incubation of the polypeptide with:

первым меченым субстратом, содержащим первый акцепторный участок для сортазы и конъюгированную поддающуюся детекции метку; иa first labeled substrate containing a first sortase acceptor site and a conjugated detectable label; And

первой сортазой, которая распознает первый акцепторный участок для сортазы (и предпочтительно не распознает второй акцепторный участок для сортазы);a first sortase that recognizes a first sortase acceptor site (and preferably does not recognize a second sortase acceptor site);

где первая сортаза катализирует соединение аминокислоты первого акцепторного участка для сортазы с аминокислотой первого или второго донорного участка для сортазы, с осуществлением тем самым мечения полипептида;where the first sortase catalyzes the connection of the amino acid of the first acceptor site for sortase with the amino acid of the first or second donor site for sortase, thereby implementing labeling of the polypeptide;

c. дальнейшую инкубацию полипептида с:c. further incubation of the polypeptide with:

вторым меченым субстратом, содержащим второй акцепторный участок для сортазы и конъюгированную поддающуюся детекции метку, где второй акцепторный участок для сортазы отличается от первого акцепторного участка для сортазы; иa second labeled substrate comprising a second sortase acceptor site and a conjugated detectable label, wherein the second sortase acceptor site is different from the first sortase acceptor site; And

второй сортазой, которая распознает второй акцепторный участок для сортазы (и не распознает первый акцепторный участок для сортазы); иa second sortase that recognizes the second sortase acceptor site (and does not recognize the first sortase acceptor site); And

где вторая сортаза катализирует соединение аминокислоты второго акцепторного участка для сортазы с аминокислотой первого или второго донорного участка для сортазы, тем самым далее осуществляя мечение полипептида; иwhere the second sortase catalyzes the connection of the amino acid of the second acceptor site for sortase with the amino acid of the first or second donor site for sortase, thereby further labeling the polypeptide; And

d. получение меченого полипептида.d. obtaining a labeled polypeptide.

Специалисту в данной области будет понятно, что порядок стадий b. и c. вышеупомянутого способа может быть любым.One skilled in the art will appreciate that the order of steps b. and c. the above method can be any.

На стадии c. меченый субстрат предпочтительно содержит отличающуюся поддающуюся детекции метку от меченого субстрата стадии b., например, флуорофоры различного цвета.At stage c. the labeled substrate preferably contains a different detectable label from the labeled substrate of step b., for example different colored fluorophores.

В предпочтительном варианте осуществления способ по изобретению включает:In a preferred embodiment, the method of the invention comprises:

a. получение полипептида, содержащего акцепторный участок для сортазы, содержащий LPXSG, где X представляет собой любую аминокислоту, и донорный участок для сортазы, содержащий Gn, где n равен 2-5;a. obtaining a polypeptide containing a sortase acceptor site containing LPXSG, where X is any amino acid, and a sortase donor site containing G n where n is 2-5;

b. инкубацию полипептида с:b. incubation of the polypeptide with:

первой сортазой, которая распознает акцепторный участок для сортазы, содержащий LPXSG (и предпочтительно не распознает акцепторный участок для сортазы, содержащий LAXTG); иa first sortase that recognizes a sortase acceptor site containing LPXSG (and preferably does not recognize a sortase acceptor site containing LAXTG); And

первым меченым субстратом, содержащим донорный участок для сортазы, содержащий Gn, где n равен 2-10 (предпочтительно 2-5) и конъюгированную поддающуюся детекции метку;a first labeled substrate containing a sortase donor site containing G n where n is 2-10 (preferably 2-5) and a conjugated detectable label;

где первая сортаза катализирует соединение аминокислоты акцепторного участка для сортазы полипептида с аминокислотой донорного участка для сортазы первого меченого субстрата, с осуществлением тем самым мечения полипептида;where the first sortase catalyzes the connection of the amino acid of the acceptor site for the sortase of the polypeptide with the amino acid of the donor site for the sortase of the first labeled substrate, thereby labeling the polypeptide;

c. инкубацию полипептида с:c. incubation of the polypeptide with:

вторым меченым субстратом, содержащим акцепторный участок для сортазы, содержащий LAXTG, где X представляет собой любую аминокислоту, и конъюгированную поддающуюся детекции метку; иa second labeled substrate containing a sortase acceptor site containing LAXTG, where X is any amino acid, and a conjugated detectable label; And

второй сортазой, которая распознает акцепторный участок для сортазы, содержащий LAXTG (и предпочтительно не распознает акцепторный участок для сортазы, содержащий LPXSG);a second sortase that recognizes a sortase acceptor site containing LAXTG (and preferably does not recognize a sortase acceptor site containing LPXSG);

где вторая сортаза катализирует соединение аминокислоты акцепторного участка для сортазы второго меченого субстрата с аминокислотой донорного участка для сортазы в полипептиде, тем самым далее осуществляя мечение полипептида; иwherein the second sortase catalyzes the association of the amino acid of the sortase acceptor site of the second labeled substrate with the amino acid of the sortase donor site in the polypeptide, thereby further labeling the polypeptide; And

d. получение меченого полипептида.d. obtaining a labeled polypeptide.

Специалисту в данной области понятно, что порядок стадий b. и c. вышеупомянутого способа может быть любым.One skilled in the art will appreciate that the order of steps b. and c. the above method can be any.

Поддающиеся детекции метки, конъюгированные с первым и вторым мечеными субстратами, предпочтительно различаются, как например, флуорофоры разного цвета.The detectable labels conjugated to the first and second labeled substrates preferably differ, such as different colored fluorophores.

Специалисту в данной области будет понятно, что, когда намереваются добавить более двух поддающихся детекции меток к полипептиду, полипептид может содержать более двух участков (например, донорных или акцепторных участков) и что способ можно проводить неоднократно.One skilled in the art will appreciate that when more than two detectable labels are intended to be added to a polypeptide, the polypeptide may contain more than two sites (eg, donor or acceptor sites) and that the method may be carried out repeatedly.

Термин "не распознает акцепторный участок для сортазы" (или его перестановки) может означать, что сортаза обладает более низкой активностью (например, расщепление или конъюгация) в отношении полипептида, содержащего данный акцепторный участок для сортазы, по сравнению с активностью в отношении полипептида сортазы, который распознает указанный участок. В одном варианте осуществления термин "не распознает акцепторный участок для сортазы" может означать, что сортаза по существу не имеет или не имеет активности (например, расщепление или конъюгация) в отношении полипептида, содержащего данный акцепторный участок для сортазы, по сравнению с активностью в отношении полипептида сортазы, который распознает указанный участок. В одном варианте осуществления термин "не распознает акцепторный участок для сортазы" (или его перестановки) может означать, что сортаза обладает более низкой активностью (например, расщепление или конъюгация) в отношении полипептида, содержащего данный акцепторный участок для сортазы, по сравнению с активностью указанной сортазы в отношении полипептида, содержащего акцепторный участок для сортазы, распознаваемый сортазой. В одном варианте осуществления термин "не распознает акцепторный участок для сортазы" может означать, что сортаза по существу не имеет или не имеет активности (например, расщепление или конъюгация) в отношении полипептида, содержащего данный акцепторный участок для сортазы, по сравнению с активностью указанной сортазы в отношении полипептида, содержащего акцепторный участок для сортазы, распознаваемый сортазой. Акцепторный участок для сортазы, распознаваемый сортазой, может представлять собой участок для сортазы, известный в данной области в качестве распознаваемого указанной сортазой.The term "does not recognize the sortase acceptor site" (or permutations thereof) may mean that the sortase has lower activity (e.g., cleavage or conjugation) for the polypeptide containing the sortase acceptor site than it does for the sortase polypeptide, which recognizes the specified region. In one embodiment, the term "does not recognize a sortase acceptor site" may mean that sortase has essentially no or no activity (e.g., cleavage or conjugation) on a polypeptide containing that sortase acceptor site, as compared to activity on a sortase polypeptide that recognizes the specified site. In one embodiment, the term "does not recognize the sortase acceptor site" (or permutations thereof) may mean that the sortase has a lower activity (e.g., cleavage or conjugation) on the polypeptide containing the sortase acceptor site, compared to the activity of the specified sortase with respect to a polypeptide containing a sortase acceptor site recognized by sortase. In one embodiment, the term "does not recognize a sortase acceptor site" may mean that the sortase has essentially no or no activity (e.g., cleavage or conjugation) on the polypeptide containing the sortase acceptor site, as compared to the activity of said sortase. with respect to a polypeptide containing an acceptor site for sortase recognized by sortase. A sortase acceptor site recognized by a sortase may be a sortase site known in the art to be recognized by said sortase.

Стадию инкубацию способа по изобретению можно проводить в любых условиях, которые позволяют успешное мечение полипептида с использованием сортазы. Такие условия могут быть определены специалистом в данной области с использованием стандартных способов/оптимизации.The incubation step of the method of the invention can be carried out under any conditions that allow successful labeling of the polypeptide using sortase. Such conditions can be determined by a person skilled in the art using standard techniques/optimization.

Количества полипептида, сортазы и меченого субстрата для применения на стадии инкубации способа, как описано в настоящем описании, могут быть определены специалистом в данной области с использованием стандартных способов. В одном варианте осуществления способ включает применение избытка меченого субстрата для полипептида относительно сортазы, и необязательно избытка сортазы относительно полипептида. В одном варианте осуществления способ включает использование соотношения масс полипептида, сортазы и меченого субстрата 1:2:20. В другом варианте осуществления способ включает использование молярного соотношения полипептида, сортазы и меченого субстрата 1:2:20.The amounts of polypeptide, sortase, and labeled substrate for use in the incubation step of the method as described herein can be determined by one of skill in the art using standard methods. In one embodiment, the method comprises using an excess of labeled substrate for the polypeptide relative to sortase, and optionally an excess of sortase relative to the polypeptide. In one embodiment, the method comprises using a 1:2:20 mass ratio of polypeptide, sortase, and labeled substrate. In another embodiment, the method includes using a 1:2:20 molar ratio of polypeptide, sortase, and labeled substrate.

Условия реакции для стадии инкубации способа, как описано в настоящем описании, также могут быть определены специалистом в данной области с использованием стандартных способов. Например, реакцию можно проводить в течение по меньшей мере 2, 4, 6, 8, 10 или 12 часов. Предпочтительно реакцию можно проводить в течение по меньшей мере 10 часов. Реакцию можно проводить при 1-40°C, например, 1-37°C. В одном варианте осуществления реакцию можно проводить при 1-10°C, предпочтительно 3-5°C, например, приблизительно 4°C. Время реакции можно корректировать в зависимости от используемой температуры, например, более низкие температуры могут требовать более длительного времени инкубации.The reaction conditions for the process incubation step as described herein can also be determined by one of ordinary skill in the art using standard methods. For example, the reaction can be carried out for at least 2, 4, 6, 8, 10 or 12 hours. Preferably, the reaction can be carried out for at least 10 hours. The reaction can be carried out at 1-40°C, for example 1-37°C. In one embodiment, the reaction can be carried out at 1-10°C, preferably 3-5°C, for example, approximately 4°C. The reaction time can be adjusted depending on the temperature used, for example, lower temperatures may require longer incubation times.

После стадии инкубации способа по изобретению любой свободный меченый субстрат, и/или сортаза, и/или немеченый полипептид могут быть отделены от меченого полипептида. В одном варианте осуществления разделения достигают посредством метки на сортазе или меченом полипептиде, предпочтительно метки (например His-метки) на меченом полипептиде. Метка может присутствовать на меченом полипептиде, но не на немеченом полипептиде, например, где метка присутствует на меченом субстрате, конъюгированном с меченым полипептидом.After the incubation step of the method of the invention, any free labeled substrate and/or sortase and/or unlabeled polypeptide can be separated from the labeled polypeptide. In one embodiment, resolution is achieved by a label on the sortase or labeled polypeptide, preferably a label (eg, His tag) on the labeled polypeptide. The label may be present on the labeled polypeptide but not on the unlabeled polypeptide, for example where the label is present on a labeled substrate conjugated to the labeled polypeptide.

В одном варианте осуществления стадию разделения можно использовать, когда полипептид содержит два или более участков и способ включает две или более стадий инкубации/мечения. Стадию разделения можно использовать после каждой стадии инкубации/мечения.In one embodiment, a separation step can be used when the polypeptide contains two or more regions and the method includes two or more incubation/labeling steps. A separation step can be used after each incubation/labeling step.

В одном варианте осуществления способ по изобретению включает первую инкубацию и вторую инкубацию (например, как подробно описано в настоящем описании), где после первой инкубации используют первую метку для отделения меченого полипептида от немеченого полипептида. Предпочтительно первая метка отсутствует в меченом полипептиде, но присутствует в немеченом полипептиде, и немеченый полипептид может быть удален посредством иммунодеплеции. Первая метка может представлять собой Strep-метку. В одном варианте осуществления после второй инкубацию используют вторую метку для отделения двукратно меченого полипептида от любого однократно меченного (или немеченого) полипептида. Предпочтительно вторая метка присутствует в двукратно меченом полипептиде, но отсутствует в однократно меченном (или немеченом) полипептиде, и двукратно меченый полипептид может быть отделен посредством иммуноаффинной хроматографии. Вторая метка может представлять собой His-метку.In one embodiment, the method of the invention includes a first incubation and a second incubation (eg, as detailed herein) where, after the first incubation, a first label is used to separate the labeled polypeptide from the unlabeled polypeptide. Preferably, the first tag is absent from the labeled polypeptide but is present from the unlabeled polypeptide, and the unlabeled polypeptide can be removed by immunodepletion. The first label may be a Strep label. In one embodiment, after the second incubation, a second label is used to separate the doubly labeled polypeptide from any single labeled (or unlabeled) polypeptide. Preferably, the second label is present in the doubly labeled polypeptide but not in the singly labeled (or unlabeled) polypeptide, and the doubly labeled polypeptide can be separated by immunoaffinity chromatography. The second tag may be a His tag.

В вариантах осуществления, где полипептид для мечения с использованием сортазы содержит донорный участок для сортазы, N-конец указанного участка может быть защищен, например, посредством одного или нескольких аминокислотных остатков с N-концевой стороны от него. Преимущественно, это может препятствовать циркуляризации полипептида, дополнительно содержащего акцепторный участок для сортазы. Указанная одна или несколько аминокислот могут быть удалены посредством расщепляемого участка, такого как участок расщепления TEV, тем самым экспонируя N-конец указанного донорного участка для сортазы. Таким образом, способ по изобретению может включать стадию удаления защитной группы с N-конца донора для сортазы, например, посредством удаления одной или нескольких аминокислот с N-концевой стороны от него. Стадию удаления защитной группы можно проводить между первой и второй стадиями инкубации.In embodiments where the sortase labeling polypeptide comprises a sortase donor site, the N-terminus of said site may be protected, for example, by one or more amino acid residues N-terminally therefrom. Advantageously, this may prevent the circularization of a polypeptide further containing an acceptor site for sortase. Said one or more amino acids can be removed by a cleavable site, such as a TEV cleavage site, thereby exposing the N-terminus of said donor site to sortase. Thus, the method of the invention may include the step of deprotecting the N-terminus of the sortase donor, for example by removing one or more amino acids N-terminally therefrom. The deprotection step can be carried out between the first and second incubation steps.

В одном варианте осуществления, когда полипептид по изобретению содержит участок расщепления (например, участок расщепления с N-концевой стороны от донорного участка для сортазы), указанный участок расщепления может представлять собой любой участок расщепления. В одном варианте осуществления участок расщепления может представлять собой участок, который является ненативным (т.е. экзогенным) для клостридиального нейротоксина. В некоторых вариантах осуществления участок расщепления представляет собой участок распознавания протеазой или его вариант при условии, что вариант расщепляется соответствующей протеазой. Участок расщепления может представлять собой участок, расщепляемый энтерокиназой, фактором Xa, вирусом гравировки табака (TEV), тромбином, PreScission, ADAM17, трипсин-подобной протеазой дыхательных путей человека (HAT), эластазой, фурином, гранзимом или каспазой 2, 3, 4, 7, 9 или 10. Участок расщепления может содержать полипептидную последовательность, обладающую по меньшей мере 70% идентичностью последовательности с любой из SEQ ID NO: 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 или 100. В одном варианте осуществления участок расщепления может содержать полипептидную последовательность, обладающую по меньшей мере 80% или 90% идентичностью последовательности с любой из SEQ ID NO: 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 или 100. В другом варианте осуществления участок расщепления содержит (предпочтительно состоит из) неклостридиального участка расщепления с полипептидной последовательностью, представленной в качестве любой из SEQ ID NO: 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 или 100. Предпочтительно, участок расщепления содержит (более предпочтительно состоит из) участок расщепления TEV, представленный в качестве SEQ ID NO: 87.In one embodiment, when a polypeptide of the invention contains a cleavage site (eg, a cleavage site on the N-terminal side of a sortase donor site), said cleavage site can be any cleavage site. In one embodiment, the cleavage site may be a site that is non-native (ie, exogenous) to the clostridial neurotoxin. In some embodiments, the cleavage site is a protease recognition site, or a variant thereof, provided that the variant is cleaved by the appropriate protease. The cleavage site may be one cleaved by enterokinase, factor Xa, tobacco etch virus (TEV), thrombin, PreScission, ADAM17, human airway trypsin-like protease (HAT), elastase, furin, granzyme, or caspase 2, 3, 4, 7, 9, or 10. The cleavage site may comprise a polypeptide sequence having at least 70% sequence identity with any of SEQ ID NOs: 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 or 100. In one embodiment, the cleavage site may contain a polypeptide sequence having at least 80% or 90% sequence identity with any of SEQ ID NOs: 84, 85, 86, 87, 88 , 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, or 100. In another embodiment, the cleavage site comprises (preferably consists of) a non-clostridial cleavage site with a polypeptide sequence represented as any of the SEQs. ID NO: 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, or 100. Preferably, the cleavage site comprises (more preferably consists of) a cleavage site TEV presented as SEQ ID NO: 87.

Сортаза для применения в рамках настоящего изобретения может содержать полипептидную последовательность, обладающую по меньшей мере 70% идентичностью последовательности с SEQ ID NO: 14. В одном варианте осуществления сортаза для применения в рамках настоящего изобретения может содержать полипептид, обладающий по меньшей мере 80% или 90% идентичностью последовательности с SEQ ID NO: 14. Предпочтительно, сортаза для применения в рамках настоящего изобретения может содержать (более предпочтительно состоять из) полипептидную последовательность, представленную в качестве SEQ ID NO: 14.A sortase for use in the present invention may contain a polypeptide sequence having at least 70% sequence identity with SEQ ID NO: 14. In one embodiment, a sortase for use in the present invention may contain a polypeptide having at least 80% or 90 % sequence identity with SEQ ID NO: 14. Preferably, sortase for use in the present invention may contain (more preferably consist of) the polypeptide sequence shown as SEQ ID NO: 14.

Сортаза для применения в рамках изобретения может кодироваться последовательностью нуклеиновой кислоты, обладающей по меньшей мере 70% идентичностью последовательности с SEQ ID NO: 13. В одном варианте осуществления сортаза для применения в рамках настоящего изобретения может кодироваться последовательностью нуклеиновой кислоты, обладающей по меньшей мере 80% или 90% идентичностью последовательности с SEQ ID NO: 13. Предпочтительно сортаза для применения в рамках настоящего изобретения может кодироваться последовательностью нуклеиновой кислоты, содержащей (более предпочтительно состоящей из) последовательность нуклеиновой кислоты, представленную в качестве SEQ ID NO: 13.A sortase for use within the scope of the invention may be encoded by a nucleic acid sequence having at least 70% sequence identity with SEQ ID NO: 13. In one embodiment, a sortase for use within the scope of the present invention may be encoded by a nucleic acid sequence having at least 80% or 90% sequence identity with SEQ ID NO: 13. Preferably, sortase for use in the present invention may be encoded by a nucleic acid sequence containing (more preferably consisting of) the nucleic acid sequence shown as SEQ ID NO: 13.

Сортаза для применения в рамках настоящего изобретения может содержать полипептидную последовательность, обладающую по меньшей мере 70% идентичностью последовательности с SEQ ID NO: 16. В одном варианте осуществления сортаза для применения в рамках настоящего изобретения может содержать полипептид, обладающий по меньшей мере 80% или 90% идентичностью последовательности с SEQ ID NO: 16. Предпочтительно, сортаза для применения в рамках настоящего изобретения может содержать (более предпочтительно состоять из) полипептидную последовательность, представленную в качестве SEQ ID NO: 16.A sortase for use in the present invention may contain a polypeptide sequence having at least 70% sequence identity with SEQ ID NO: 16. In one embodiment, a sortase for use in the present invention may contain a polypeptide having at least 80% or 90 % sequence identity with SEQ ID NO: 16. Preferably, sortase for use in the present invention may contain (more preferably consist of) the polypeptide sequence shown as SEQ ID NO: 16.

Сортаза для применения в рамках изобретения может кодироваться последовательностью нуклеиновой кислоты, обладающей по меньшей мере 70% идентичностью последовательности с SEQ ID NO: 15. В одном варианте осуществления сортаза для применения в рамках настоящего изобретения может кодироваться последовательностью нуклеиновой кислоты, обладающей по меньшей мере 80% или 90% идентичностью последовательности с SEQ ID NO: 15. Предпочтительно, сортаза для применения в рамках настоящего изобретения может кодироваться последовательностью нуклеиновой кислоты, содержащей (более предпочтительно состоящей из) последовательность нуклеиновой кислоты, представленную в качестве SEQ ID NO: 15.A sortase for use within the scope of the invention may be encoded by a nucleic acid sequence having at least 70% sequence identity with SEQ ID NO: 15. In one embodiment, a sortase for use within the scope of the present invention may be encoded by a nucleic acid sequence having at least 80% or 90% sequence identity with SEQ ID NO: 15. Preferably, sortase for use in the present invention may be encoded by a nucleic acid sequence containing (more preferably consisting of) the nucleic acid sequence shown as SEQ ID NO: 15.

Сортаза A может представлять собой каталитически активный полипептид, обладающий по меньшей мере 70% идентичностью последовательности с SEQ ID NO: 31, 33 или 37. В одном варианте осуществления сортаза A может представлять собой каталитически активный полипептид, обладающий по меньшей мере 80% или 90% идентичностью последовательности с SEQ ID NO: 31, 33 или 37. Предпочтительно сортаза A может представлять собой каталитически активный полипептид, содержащий (более предпочтительно состоящий из) SEQ ID NO: 31, 33 или 37.Sortase A can be a catalytically active polypeptide having at least 70% sequence identity with SEQ ID NO: 31, 33 or 37. In one embodiment, sortase A can be a catalytically active polypeptide having at least 80% or 90% sequence identity with SEQ ID NO: 31, 33, or 37. Preferably, sortase A may be a catalytically active polypeptide comprising (more preferably consisting of) SEQ ID NO: 31, 33, or 37.

Настоящее изобретение может охватывать применение по меньшей мере двух сортаз (более предпочтительно двух), например, где указанные сортазы содержат полипептиды, обладающие по меньшей мере 70% идентичностью последовательности с SEQ ID NO: 14 и 16, соответственно. В одном варианте осуществления настоящее изобретение может охватывать применение по меньшей мере двух сортаз, где указанные сортазы содержат полипептиды, обладающие по меньшей мере 80% или 90% идентичностью последовательности с SEQ ID NO: 14 и 16, соответственно. Предпочтительно, настоящее изобретение может включать применение по меньшей мере двух сортаз, где указанные сортазы содержат (более предпочтительно состоят) полипептиды, имеющие SEQ ID NO: 14 и 16, соответственно.The present invention may encompass the use of at least two sortases (more preferably two), for example, wherein said sortases comprise polypeptides having at least 70% sequence identity with SEQ ID NOs: 14 and 16, respectively. In one embodiment, the present invention may encompass the use of at least two sortases, wherein said sortases comprise polypeptides having at least 80% or 90% sequence identity with SEQ ID NOs: 14 and 16, respectively. Preferably, the present invention may involve the use of at least two sortases, wherein said sortases comprise (more preferably consist of) polypeptides having SEQ ID NOs: 14 and 16, respectively.

Меченый субстрат для применения в способах, включающих применение сортазы, представляет собой субстрат сортазы, и содержит донорный или акцепторный участок для сортазы и конъюгирован с поддающейся детекции меткой. Когда предусматривается, что меченый субстрат предназначен для мечения полипептида, содержащего акцепторный участок для сортазы, меченый субстрат содержит донорный участок для сортазы и наоборот. Меченый субстрат может представлять собой пептид или полипептид, предпочтительно пептид.A labeled substrate for use in methods involving the use of sortase is a sortase substrate, and contains a sortase donor or acceptor site and is conjugated to a detectable label. Where the labeled substrate is intended to label a polypeptide containing a sortase acceptor site, the labeled substrate contains a sortase donor site and vice versa. The labeled substrate may be a peptide or polypeptide, preferably a peptide.

Меченый субстрат может содержать любой из донорного или акцепторного участков для сортазы, описанных в настоящем описании. Меченый субстрат также может содержать одну или несколько меток, таких как метки для очистки (например, His-метка) для облегчения его очистки или отделения от меченого полипептида.The labeled substrate may contain any of the sortase donor or acceptor sites described herein. The labeled substrate may also contain one or more labels, such as purification labels (eg, a His tag) to facilitate its purification or separation from the labeled polypeptide.

В одном варианте осуществления меченый субстрат содержит донорный участок для сортазы. Пример меченого субстрата, содержащего донорный участок для сортазы, приведен под SEQ ID NO: 29. Таким образом, в одном варианте осуществления предусматривается меченый субстрат, содержащий полипептидную последовательность, обладающую по меньшей мере 70% идентичностью последовательности с SEQ ID NO: 29. Меченый субстрат может содержать полипептидную последовательность, обладающую по меньшей мере 80% или 90% идентичностью последовательности с SEQ ID NO: 29. Предпочтительно меченый субстрат содержит (более предпочтительно состоит из) полипептидную последовательность, представленную в качестве SEQ ID NO: 29.In one embodiment, the labeled substrate contains a sortase donor site. An example of a labeled substrate containing a sortase donor site is given under SEQ ID NO: 29. Thus, in one embodiment, a labeled substrate is provided containing a polypeptide sequence having at least 70% sequence identity with SEQ ID NO: 29. Labeled substrate may contain a polypeptide sequence having at least 80% or 90% sequence identity with SEQ ID NO: 29. Preferably, the labeled substrate contains (more preferably consists of) the polypeptide sequence shown as SEQ ID NO: 29.

В одном варианте осуществления меченый субстрат содержит акцепторный участок для сортазы. Пример меченого субстрата, содержащего акцепторный участок для сортазы, представлен под SEQ ID NO: 30. Таким образом, в одном варианте осуществления предусматривается меченый субстрат, содержащий полипептидную последовательность, обладающую по меньшей мере 70% идентичностью последовательности с SEQ ID NO: 30. Меченый субстрат может содержать полипептидную последовательность, обладающую по меньшей мере 80% или 90% идентичностью последовательности с SEQ ID NO: 30. Предпочтительно меченый субстрат содержит (более предпочтительно состоит из) полипептидную последовательность, представленную в качестве SEQ ID NO: 30.In one embodiment, the labeled substrate contains an acceptor site for sortase. An example of a labeled substrate containing an acceptor site for sortase is provided under SEQ ID NO: 30. Thus, in one embodiment, a labeled substrate is provided containing a polypeptide sequence having at least 70% sequence identity with SEQ ID NO: 30. Labeled substrate may contain a polypeptide sequence having at least 80% or 90% sequence identity with SEQ ID NO: 30. Preferably, the labeled substrate contains (more preferably consists of) the polypeptide sequence shown as SEQ ID NO: 30.

Акцепторный участок для сортазы предпочтительно находится на C-конце меченого субстрата. Донорный участок для сортазы предпочтительно находится на N-конце меченого субстрата.The acceptor site for sortase is preferably located at the C-terminus of the labeled substrate. The sortase donor site is preferably located at the N-terminus of the labeled substrate.

Полипептид по изобретению предпочтительно предназначен для применения в качестве двухцепочечного полипептида, где две цепи соединены вместе посредством дисульфидной связи. В таких вариантах осуществления полипептид может содержать донорный участок для сортазы, находящийся на N-конце одной из двух полипептидных цепей. Например, двухцепочечный полипептид может содержать донорный участок для сортазы с N-концевой стороны от нецитотоксической протеазы (или ее протеолитически неактивного мутанта) и/или ее домена транслокации. В вариантах осуществления, где донорный участок для сортазы находится с N-концевой стороны от домена транслокации полипептида, донорный участок для сортазы может быть доступен для применения в способе по изобретению только после конвертирования полипептида в двухцепочечную форму (например, посредством протеолитической активации).The polypeptide of the invention is preferably intended for use as a double chain polypeptide, where the two chains are joined together via a disulfide bond. In such embodiments, the polypeptide may comprise a sortase donor site located at the N-terminus of one of the two polypeptide chains. For example, a double-stranded polypeptide may contain a sortase donor site on the N-terminal side of a non-cytotoxic protease (or a proteolytically inactive mutant thereof) and/or its translocation domain. In embodiments where the sortase donor site is N-terminal to the translocation domain of the polypeptide, the sortase donor site may only be available for use in the method of the invention after the polypeptide has been converted to a double-stranded form (e.g., via proteolytic activation).

Термин "находящийся на C-конце", как используют в этом контексте, может означать, что C-концевой остаток акцепторного участка находится на расстоянии вплоть до 50 аминокислотных остатков с N-концевой стороны от C-концевого остатка меченого субстрата, например, что C-концевой остаток акцепторного участка находится на расстоянии 1-50, предпочтительно 10-40 аминокислотных остатков с N-концевой стороны от C-концевого остатка меченого субстрата. В особенно предпочтительных вариантах осуществления C-концевой остаток акцепторного участка может представлять собой C-концевой остаток меченого субстрата.The term "located at the C-terminus", as used in this context, may mean that the C-terminal residue of the acceptor site is up to 50 amino acid residues N-terminal from the C-terminal residue of the labeled substrate, for example that C -terminal residue of the acceptor site is located at a distance of 1-50, preferably 10-40 amino acid residues from the N-terminal side of the C-terminal residue of the labeled substrate. In particularly preferred embodiments, the C-terminal residue of the acceptor site may be the C-terminal residue of a labeled substrate.

В вариантах осуществления, в которых существует один или несколько остатков с C-концевой стороны от акцепторного участка для сортазы меченого субстрата, предпочтительно, чтобы указанные один или несколько остатков были удалены перед использованием меченого субстрата в способе мечения, описанном в настоящем описании.In embodiments where there is one or more residues C-terminal from the acceptor site for sortase of the labeled substrate, it is preferred that these one or more residues be removed prior to using the labeled substrate in the labeling method described herein.

Термин "находящийся на N-конце", как используют в этом контексте, может означать, что C-концевой остаток донорного участка находится на расстоянии вплоть до 50 аминокислотных остатков с C-концевой стороны от N-концевого остатка меченого субстрата, например, что N-концевой остаток донорного участка находится на расстоянии 1-50, предпочтительно 1-25 аминокислотных остатков с C-концевой стороны от N-концевого остатка меченого субстрата. В особенно предпочтительных вариантах осуществления N-концевой остаток донорного участка может представлять собой N-концевой остаток меченого субстрата.The term "located at the N-terminus", as used in this context, may mean that the C-terminal residue of the donor site is up to 50 amino acid residues on the C-terminal side of the N-terminal residue of the labeled substrate, for example, that N -terminal residue of the donor site is located at a distance of 1-50, preferably 1-25 amino acid residues from the C-terminal side of the N-terminal residue of the labeled substrate. In particularly preferred embodiments, the N-terminal residue of the donor site may be the N-terminal residue of a labeled substrate.

В вариантах осуществления, где существует один или несколько остатков с N-концевой стороны от донорного участка для сортазы в меченом субстрате, предпочтительно, чтобы указанные один или несколько остатков были удалены перед использованием меченого субстрата в способе мечения, описанном в настоящем описании.In embodiments where there is one or more residues N-terminal from the sortase donor site in the labeled substrate, it is preferred that these one or more residues be removed prior to using the labeled substrate in the labeling method described herein.

Посредством данных для проверки и подтверждения принципа, авторы настоящего изобретения продемонстрировали, что в рамках настоящего изобретения может использоваться любой способ мечения, сходный с опосредуемым сортазой мечением, без негативного влияния на эффективность (например, связывание, транслокация и/или каталитическая активность) полипептида по изобретению. Таким образом, настоящее изобретение охватывает применение альтернативных ферментов, которые способны конъюгировать меченый полипептид с полипептидом по изобретению. Их можно использовать вместо или в дополнение к сортазе (предпочтительно дополнительно, например, когда проводят мечение в дополнительном участке). Ферменты, которые также применимы в рамках настоящего изобретения, могут включать альтернативные транспептидазы или лигазы. Таким образом, варианты осуществления, описанные в настоящем описании в отношении сортаз, могут быть применены к альтернативным транспептидазам или лигазам.Through validation and proof of principle data, the present inventors have demonstrated that any labeling method similar to sortase-mediated labeling can be used within the scope of the present invention without adversely affecting the potency (e.g., binding, translocation, and/or catalytic activity) of the polypeptide of the invention. . Thus, the present invention encompasses the use of alternative enzymes that are capable of conjugating a labeled polypeptide to a polypeptide of the invention. They can be used in place of or in addition to sortase (preferably in addition, for example when labeling is carried out in an additional site). Enzymes that are also applicable within the scope of the present invention may include alternative transpeptidases or ligases. Thus, the embodiments described herein with respect to sortases can be applied to alternative transpeptidases or ligases.

В одном варианте осуществления настоящее изобретение может охватывать применение лигазы, такой как бутелаза 1 (или ее вариант), которая представляет собой лигазу, получаемую из растений вида Clitoria ternatea и описана в Nguyen, G.K., Y. Cao, W. Wang, C.F. Liu and J.P. Tam (2015). "Site-Specific N-Terminal Labeling of Peptides and Proteins using Butelase 1 and Thiodepsipeptide." Angew Chem Int Ed Engl 54(52): 15694-15698 and Nguyen et al. (2016), Nature Protocols, 11, 10, 1977-1988, которые включены в настоящее описание в качестве ссылок. Когда изобретение включает применение транспептидазы или лигазы в альтернативной сортазе, меченый субстрат представляет собой субстрат указанной транспептидазы или лигазы, соответственно.In one embodiment, the present invention may cover the use of a ligase such as butelase 1 (or a variant thereof), which is a ligase derived from plants of the species Clitoria ternatea and is described in Nguyen, G.K., Y. Cao, W. Wang, C.F. Liu and J.P. Tam (2015). "Site-Specific N-Terminal Labeling of Peptides and Proteins using Butelase 1 and Thiodepsipeptide." Angew Chem Int Ed Engl 54(52): 15694-15698 and Nguyen et al. (2016), Nature Protocols, 11, 10, 1977-1988, which are incorporated herein by reference. When the invention involves the use of a transpeptidase or ligase in an alternative sortase, the labeled substrate is the substrate of said transpeptidase or ligase, respectively.

В вариантах осуществления, где используют бутелазу 1, полипептид содержит акцепторный или донорый участок для бутелазы 1, и используется меченый субстрат, содержащий донорный или акцепторный участок для бутелазы 1 и конъюгированную поддающуюся детекции метку. Аналогично способам, включающим применение сортазы, где полипептид содержит акцепторный участок для бутелазы, меченый субстрат, содержащий конъюгированную поддающуюся детекции метку, содержит донорный участок для бутелазы (и наоборот). В таких вариантах осуществления меченый субстрат представляет собой субстрат бутелазы (например, бутелазы 1).In embodiments where butelase 1 is used, the polypeptide contains an acceptor or donor site for butelase 1, and a labeled substrate containing a donor or acceptor site for butelase 1 and a conjugated detectable label is used. Similar to methods involving the use of sortase, where the polypeptide contains an acceptor site for butelase, a labeled substrate containing a conjugated detectable label contains a donor site for butelase (and vice versa). In such embodiments, the labeled substrate is a butelase (eg, butelase 1) substrate.

Бутелаза осуществляет расщепление между Asn/Asp и His C-концевой консенсусной последовательности Asn/Asp-His-Val, и она может лигировать полипептид, содержащий N-концевую аминокислотную последовательность Xaa-(Ile/Leu/Val/Cys), где Xaa представляет собой любую аминокислоту кроме пролина, с образованием связи между Asn/Asp-Xaa-(Ile/Leu/Val/Cys). В одном варианте осуществления акцепторный участок для бутелазы содержит (или состоит из) Asn/Asp-His-Val. В одном варианте осуществления донорный участок для бутелазы содержит (или состоит из) Xaa-(Ile/Leu/Val/Cys), где Xaa представляет собой любую аминокислоту кроме пролина.Butelase cleaves between Asn/Asp and His the C-terminal consensus sequence Asn/Asp-His-Val, and it can ligate a polypeptide containing the N-terminal amino acid sequence Xaa-(Ile/Leu/Val/Cys), where Xaa is any amino acid other than proline to form a bond between Asn/Asp-Xaa-(Ile/Leu/Val/Cys). In one embodiment, the butelase acceptor site contains (or consists of) Asn/Asp-His-Val. In one embodiment, the butelase donor site contains (or consists of) Xaa-(Ile/Leu/Val/Cys), where Xaa is any amino acid other than proline.

В контексте участков бутелазы Xaa может быть выбрана (например) из стандартных аминокислот: аспарагиновая кислота, глутаминовая кислота, аргинин, лизин, гистидин, аспарагин, глутамин, серин, треонин, тирозин, метионин, триптофан, цистеин, аланин, глицин, валин, лейцин, изолейцин и фенилаланин.In the context of butelase sites, Xaa can be selected from (for example) standard amino acids: aspartic acid, glutamic acid, arginine, lysine, histidine, asparagine, glutamine, serine, threonine, tyrosine, methionine, tryptophan, cysteine, alanine, glycine, valine, leucine , isoleucine and phenylalanine.

Таким образом, предусматривается способ получения меченого полипептида, причем способ включает:Thus, a method for producing a labeled polypeptide is provided, the method comprising:

a. получение полипептида, содержащего:a. obtaining a polypeptide containing:

i. акцепторный или донорный участок для бутелазы;i. an acceptor or donor site for butelase;

ii. нецитотоксическую протеазу или ее протеолитически неактивный мутант;ii. a non-cytotoxic protease or a proteolytically inactive mutant thereof;

iii. нацеливающую часть (TM), которая способна связываться с участком связывания на клетке-мишени; иiii. a targeting portion (TM) that is capable of binding to a binding site on a target cell; And

iv. домен транслокации;iv. translocation domain;

b. инкубацию полипептида с:b. incubation of the polypeptide with:

бутелазой (например, бутелазой 1); иbutelase (for example, butelase 1); And

меченым субстратом, содержащим донорный или акцепторный участок для бутелазы и конъюгированную поддающуюся детекции метку;a labeled substrate containing a butelase donor or acceptor site and a conjugated detectable label;

где бутелаза катализирует конъюгацию между аминокислотой акцепторного участка бутелазы и аминокислотой донорного участка бутелазы, с осуществлением тем самым мечения полипептида; иwhere butelase catalyzes the conjugation between the amino acid of the butelase acceptor site and the amino acid of the butelase donor site, thereby labeling the polypeptide; And

c. получение меченого полипептида.c. obtaining a labeled polypeptide.

В другом аспекте изобретение относится к полипептиду для мечения бутелазой, содержащему:In another aspect, the invention relates to a polypeptide for labeling with butelase, containing:

акцепторный или донорный участок для бутелазы;an acceptor or donor site for butelase;

нецитотоксическую протеазу, которая способна расщеплять белок аппарата экзоцитарного слияния в клетке-мишени, или ее протеолитически неактивный мутант;a non-cytotoxic protease that is capable of cleaving a protein of the exocytic fusion apparatus in the target cell, or a proteolytically inactive mutant thereof;

нацеливающую часть (TM), которая способна связываться с участком связывания на клетке-мишени; иa targeting portion (TM) that is capable of binding to a binding site on a target cell; And

домен транслокации, который способен транслоцировать нецитотоксическую протеазу из эндосомы через эндосомальную мембрану и в цитозоль клетки-мишени;a translocation domain that is capable of translocating a non-cytotoxic protease from the endosome across the endosomal membrane and into the cytosol of the target cell;

где, когда полипептид содержит донорный участок для бутелазы, донорный участок для бутелазы находится на N-конце полипептида; иwhere, when the polypeptide contains a butelase donor site, the butelase donor site is at the N-terminus of the polypeptide; And

где N-концевой остаток донорного участка представляет собой N-концевой остаток полипептида; илиwhere the N-terminal residue of the donor site is the N-terminal residue of the polypeptide; or

где полипептид содержит один или несколько аминокислотных остатков с N-концевой стороны от донорного участка для бутелазы и участок расщепления, который при расщеплении экспонирует N-конец донорного участка для бутелазы.wherein the polypeptide comprises one or more amino acid residues N-terminally from the butelase donor site and a cleavage site which, when cleaved, exposes the N-terminus of the butelase donor site.

Изобретение также относится к меченому полипептиду, причем полипептид содержит:The invention also relates to a labeled polypeptide, wherein the polypeptide contains:

i. поддающуюся детекции метку, конъюгированную с полипептидом;i. a detectable label conjugated to the polypeptide;

ii. аминокислотную последовательность, которая содержит Asn/Asp-Xaa-(Ile/Leu/Val/Cys), где Xaa представляет собой любую аминокислоту кроме пролина;ii. an amino acid sequence that contains Asn/Asp-Xaa-(Ile/Leu/Val/Cys), where Xaa is any amino acid other than proline;

iii. нецитотоксическую протеазу или ее протеолитически неактивный мутант;iii. a non-cytotoxic protease or a proteolytically inactive mutant thereof;

iv. нацеливающую часть (TM), которая способна связываться с участком связывания на клетке-мишени; иiv. a targeting portion (TM) that is capable of binding to a binding site on a target cell; And

v. домен транслокации.v. translocation domain.

Таким образом, меченый полипептид может содержать поддающуюся детекции метку, конъюгированную с или вблизи аминокислотной последовательности, которая содержит (или состоит из) Asn/Asp-Xaa-(Ile/Leu/Val/Cys), где Xaa представляет собой любую аминокислоту кроме пролина.Thus, a labeled polypeptide may contain a detectable label conjugated to or near an amino acid sequence that contains (or consists of) Asn/Asp-Xaa-(Ile/Leu/Val/Cys), where Xaa is any amino acid other than proline.

В одном варианте осуществления транспептидазу или лигазу, такую как бутелаза 1, используют в комбинации с сортазой для получения полипептида, имеющего две или более меток. Таким образом, в одном варианте осуществления полипептид по изобретению может содержать по меньшей мере один акцепторный или донорный участок для сортазы, как описано в настоящем описании, и по меньшей мере один акцепторный или донорный участок для бутелазы (например, бутелазы 1).In one embodiment, a transpeptidase or ligase, such as butelase 1, is used in combination with sortase to produce a polypeptide having two or more tags. Thus, in one embodiment, a polypeptide of the invention may comprise at least one sortase acceptor or donor site as described herein and at least one butelase (eg, butelase 1) acceptor or donor site.

Бутелаза 1 может представлять собой каталитически активный полипептид, содержащий полипептидную последовательность, обладающую по меньшей мере 70% идентичностью последовательности с SEQ ID NO: 27 или 28 (предпочтительно SEQ ID NO: 28). В одном варианте осуществления бутелаза 1 может содержать полипептидную последовательность, обладающую по меньшей мере 80%, 90% или 95% идентичностью последовательности с SEQ ID NO: 27 или 28 (предпочтительно SEQ ID NO: 28). Предпочтительно бутелаза 1 может содержать (более предпочтительно состоять из) полипептидную последовательность, представленную в качестве SEQ ID NO: 27 или 28 (предпочтительно SEQ ID NO: 28).Butelase 1 may be a catalytically active polypeptide containing a polypeptide sequence having at least 70% sequence identity with SEQ ID NO: 27 or 28 (preferably SEQ ID NO: 28). In one embodiment, butelase 1 may contain a polypeptide sequence having at least 80%, 90% or 95% sequence identity with SEQ ID NO: 27 or 28 (preferably SEQ ID NO: 28). Preferably, butelase 1 may comprise (more preferably consist of) the polypeptide sequence shown as SEQ ID NO: 27 or 28 (preferably SEQ ID NO: 28).

Другие лигазы могут включать PATG (SEQ ID NO: 41), PCY1 (SEQ ID NO: 42), POPB (SEQ ID NO: 43) или гомолог бутелазы OaAEP1b SEQ ID NO: 44 и 45) (Harris et al (2015), Nat Commun, 6, 10199). Когда указанные лигазы имеют сигнальный пептид или другую N-концевую лидерную последовательность, указанный сигнальный пептид или лидерную последовательность предпочтительно удаляют перед применением в рамках настоящего изобретения.Other ligases may include PATG (SEQ ID NO: 41), PCY1 (SEQ ID NO: 42), POPB (SEQ ID NO: 43), or the butelase homologue OaAEP1b SEQ ID NO: 44 and 45) (Harris et al (2015), Nat Commun, 6, 10199). When said ligases have a signal peptide or other N-terminal leader, said signal peptide or leader is preferably removed prior to use in the present invention.

POPB, а также подходящие способы ее применения описаны в данной области. Например, они описаны в Luo H (2014), Chemistry and Biology 21: 1610-1617, которая включена в настоящее описание в качестве ссылки.POPB, as well as suitable methods of using it, are described in the art. For example, they are described in Luo H (2014), Chemistry and Biology 21: 1610-1617, which is incorporated herein by reference.

Таким образом, лигаза для применения в рамках настоящего изобретения может содержать полипептидную последовательность, обладающую по меньшей мере 70% идентичностью последовательности с любой из SEQ ID NO: 41-44. В одном варианте осуществления лигаза может содержать полипептидную последовательность, обладающую по меньшей мере 80%, 90% или 95% идентичностью последовательности с любой из SEQ ID NO: 41-44. Предпочтительно лигаза может содержать (более предпочтительно состоять из) полипептидную последовательность, показанную в качестве любой из SEQ ID NO: 41-44.Thus, a ligase for use in the present invention may contain a polypeptide sequence having at least 70% sequence identity with any of SEQ ID NOs: 41-44. In one embodiment, the ligase may contain a polypeptide sequence having at least 80%, 90% or 95% sequence identity with any of SEQ ID NOs: 41-44. Preferably, the ligase may contain (more preferably consist of) the polypeptide sequence shown as any of SEQ ID NOs: 41-44.

Настоящее изобретение охватывает применение любой подходящей поддающейся детекции метки, известной специалисту в данной области. Поддающаяся детекции метка может представлять собой метку, детекцию которой можно проводить визуально вследствие оптических свойств метки. Детекцию такой метки можно проводить с использованием флуоресцентных способов, например, флуоресцентной микроскопии. Таким образом, в особенно предпочтительном варианте осуществления поддающаяся детекции метка представляет собой флуорофор. Предпочтительно поддающаяся детекции метка представляет собой (или содержит) флуоресцентный краситель, такой как флуоресцентные красители HiLyte (коммерчески доступные от AnaSpec), AlexaFluor (коммерчески доступный от Thermo Fisher), Atto (коммерчески доступный от Sigma-Aldrich), Quantum Dots, коммерчески доступный от Sigma-Aldrich), красители Janelia Fluor (available from Janelia, US), среди прочих. В предпочтительном варианте осуществления поддающаяся детекции метка не содержит полисахарид, и/или многоатомный спирт, и/или бактериальный или вирусный полимер (например, полисахарид или полипептид).The present invention encompasses the use of any suitable detectable label known to a person skilled in the art. A detectable label may be a label that can be detected visually due to the optical properties of the label. The detection of such a label can be carried out using fluorescence methods, for example, fluorescence microscopy. Thus, in a particularly preferred embodiment, the detectable label is a fluorophore. Preferably, the detectable label is (or contains) a fluorescent dye, such as the fluorescent dyes HiLyte (commercially available from AnaSpec), AlexaFluor (commercially available from Thermo Fisher), Atto (commercially available from Sigma-Aldrich), Quantum Dots, commercially available from Sigma-Aldrich), Janelia Fluor dyes (available from Janelia, US), among others. In a preferred embodiment, the detectable label does not contain a polysaccharide and/or a polyhydric alcohol and/or a bacterial or viral polymer (eg a polysaccharide or a polypeptide).

В одном аспекте изобретение также относится к способу анализа полипептида по настоящему изобретению, причем способ включает:In one aspect, the invention also relates to a method for analyzing a polypeptide of the present invention, the method comprising:

a. приведение клетки-мишени в контакт с меченым полипептидом по изобретению; иa. bringing the target cell into contact with the labeled polypeptide of the invention; And

b. детекцию поддающейся детекции метки.b. detecting a detectable label.

Такие способы можно проводить in vitro или in vivo (например, у млекопитающего, такого как не являющееся человеком млекопитающее, например, мышь). Предпочтительно способы проводят in vitro. При проведении in vivo способ может включать извлечение образца ткани для анализа ex vivo.Such methods can be carried out in vitro or in vivo (eg, in a mammal, such as a non-human mammal, eg, a mouse). Preferably, the methods are carried out in vitro. When performed in vivo, the method may include removing a tissue sample for ex vivo analysis.

Способы по изобретению предпочтительно проводят с использованием живых клеток/тканей, предпочтительно в реальном времени. Преимущественно указанные способы позволяют определение связывания, перемещения и транслокации полипептида по изобретению.The methods of the invention are preferably carried out using living cells/tissues, preferably in real time. Advantageously, these methods allow determination of the binding, movement and translocation of a polypeptide of the invention.

Способ может представлять собой эксперимент "пульс-чейз" или включать импульсную стадию (например, включающую применение меченого полипептида) и стадию отслеживания (например, не включающую применение меченого полипептида и необязательно включающую применение немеченого полипептида).The method may be a pulse-chase experiment or include a pulse step (eg, involving the use of a labeled polypeptide) and a tracking step (eg, not including the use of a labeled polypeptide and optionally including the use of an unlabeled polypeptide).

Детекция поддающейся детекции метки позволяет детекцию полипептида или его части. Например, когда полипептид содержит первую поддающуюся детекции метку, конъюгированную с нецитотоксической протеазой или ее протеолитически неактивным мутантом, и вторую поддающуюся детекции метку, конъюгированную с доменом транслокации или TM, способ может включать детекцию обеих указанных поддающихся детекции меток.Detection of a detectable label allows detection of the polypeptide or a portion thereof. For example, when the polypeptide contains a first detectable label conjugated to a non-cytotoxic protease or a proteolytically inactive mutant thereof and a second detectable label conjugated to a translocation or TM domain, the method may include detecting both of said detectable labels.

Способ по изобретению может включать детекцию наличия или отсутствия совместной локализации двух или более поддающихся детекции меток. Детекцию можно осуществлять с использованием любого способа, известного специалисту в данной области (например, FRET и сходные способы). В одном варианте осуществления способ по изобретению включает детекцию изменения совместной локализации двух или более поддающихся детекции меток, например, с течением времени. В вариантах осуществления, где полипептид содержит первую поддающуюся детекции метку, конъюгированную с нецитотоксической протеазой или ее протеолитически неактивным мутантом, и вторую поддающуюся детекции метку, конъюгированную с доменом транслокации или TM, детекция уменьшения совместной локализации первой и второй поддающихся детекции меток (например, с течением времени) может позволить определение транслокации нецитотоксической протеазы или ее протеолитически неактивного мутанта из эндосомы. Время, которое отнимает такое изменение совместной локализации, может использоваться для определения скорости транслокации. Детекция отсутствия изменения (например, по существу отсутствия изменения) совместной локализации может указывать на то, что транслокация не произошла.The method of the invention may include detecting the presence or absence of co-localization of two or more detectable labels. Detection can be performed using any method known to the person skilled in the art (eg, FRET and similar methods). In one embodiment, the method of the invention includes detecting a change in co-localization of two or more detectable labels, eg, over time. In embodiments where the polypeptide comprises a first detectable label conjugated to a non-cytotoxic protease or a proteolytically inactive mutant thereof and a second detectable label conjugated to a translocation domain or TM, detecting a decrease in co-localization of the first and second detectable labels (e.g., over time). time) may allow detection of translocation of a non-cytotoxic protease or its proteolytically inactive mutant from the endosome. The time taken by such a change in co-localization can be used to determine the rate of translocation. Detection of no change (eg, essentially no change) of co-localization may indicate that no translocation has occurred.

Способ может включать детекцию присутствия первой поддающейся детекции метки в цитозоле клетки и/или второй поддающейся детекции метки в эндосоме клетки, которая может быть осуществлена посредством анализа транслокации. Аналогично, детекция первой и второй поддающихся детекции меток (совместная локализация) в эндосоме может указывать на то, что произошел успешный эндоцитоз полипептида.The method may include detecting the presence of a first detectable label in the cytosol of the cell and/or a second detectable label in the endosome of the cell, which can be performed by translocation analysis. Similarly, detection of the first and second detectable marks (co-localization) in the endosome may indicate that successful endocytosis of the polypeptide has occurred.

В некоторых вариантах осуществления способ по изобретению может включать количественное определение поддающейся детекции метки, например в конкретном положении в клетке и/или на протяжении конкретного периода времени. Такое количественное определение можно проводить посредством детекции интенсивности поддающейся детекции метки в конкретном положении в клетке (например, с течением времени). Альтернативно или дополнительно, количественное определение можно проводить посредством определения количества или размера агломератов, содержащих указанную поддающуюся детекции метку, присутствующих к клетке.In some embodiments, the implementation of the method according to the invention may include quantitative determination of a detectable label, for example, at a specific position in the cell and/or over a specific period of time. Such a quantification can be carried out by detecting the intensity of a detectable label at a particular position in the cell (eg, over time). Alternatively or additionally, the quantification can be carried out by determining the number or size of agglomerates containing the specified detectable label present to the cell.

В одном варианте осуществления способ по изобретению включает:In one embodiment, the method of the invention comprises:

i) приведение в контакт клетки-мишени с меченым полипептидом по изобретению, который подлежит оценке в отношении способности высвобождения из эндосомы, где указанная клетка-мишень содержит клеточную мембрану, включающую участок связывания, присутствующий на наружной поверхности клеточной мембраны указанной клетки;i) contacting a target cell with a labeled polypeptide of the invention to be evaluated for release from an endosome, wherein said target cell contains a cell membrane comprising a binding site present on the outer surface of the cell membrane of said cell;

ii) инкубацию меченого полипептида с указанной клеткой-мишени, тем самым позволяяii) incubating the labeled polypeptide with said target cell, thereby allowing

a) меченому полипептиду связывать и образовывать связанный комплекс с участком связывания, присутствующим на клетке-мишени, тем самым позволяя указанному связанному комплексу входить в клетку-мишень посредством эндоцитоза;a) the labeled polypeptide bind and form an associated complex with the binding site present on the target cell, thereby allowing said associated complex to enter the target cell via endocytosis;

b) образовываться одной или нескольким эндосомам в указанной клетке, где одна или несколько эндосом содержат меченый полипептид; иb) be formed by one or more endosomes in the specified cell, where one or more endosomes contain a labeled polypeptide; And

c) входить указанному меченому полипептиду в цитозоль клетки-мишени посредством прохождения через эндосомальную мембрану одной или нескольких эндосом;c) enter the specified labeled polypeptide in the cytosol of the target cell by passing through the endosomal membrane of one or more endosomes;

iii) удаление избытка меченого полипептида, который не связался с участками связывания, присутствующими на клетках-мишенях;iii) removing excess labeled polypeptide that has not bound to binding sites present on the target cells;

iv) детекцию через определенный период времени количества меченого полипептда, присутствующего в одной или нескольких эндосомах, или детекцию количества меченого полипептида, присутствующего в цитозоле указанной клетки-мишени;iv) detecting, after a certain period of time, the amount of labeled polypeptide present in one or more endosomes, or detecting the amount of labeled polypeptide present in the cytosol of said target cell;

v) сравнение количества меченого полипептида, выявленного на стадии iv), с контрольной величиной, где указанная контрольная величина представляет собой количество меченого полипептида, присутствующее водной или нескольких эндосомах, или количество меченого полипептида, присутствующего в цитозоле перед стадией iv);v) comparing the amount of labeled polypeptide detected in step iv) with a control value, where said control value is the amount of labeled polypeptide present in aqueous or multiple endosomes or the amount of labeled polypeptide present in the cytosol prior to step iv);

vi) вычисление величины высвобождения из эндосом для меченого полипептида посредством определения относительного изменения количества меченого полипептида, которое присутствует в одной или нескольких эндосомах, или посредством определения относительного изменения количества меченого полипептида, присутствующего в цитозоле указанной клетки-мишени.vi) calculating the amount of release from endosomes for the labeled polypeptide by determining the relative change in the amount of labeled polypeptide that is present in one or more endosomes, or by determining the relative change in the amount of labeled polypeptide present in the cytosol of said target cell.

Клетка-мишень может представлять собой эукариотическую клетку, такую как клетка млекопитающего, например, клетка-мишень, описанная в настоящем описании.The target cell may be a eukaryotic cell such as a mammalian cell, for example the target cell described herein.

Стадию инкубации ii) можно проводить в течение любого данного периода времени, например, в течение периода времени от 5 минут до 5 суток. Типичный период времени составляет 1-12 часов, например 2-10 часов, 4-8 часов, или 6-8 часов. В ходе этого периода клетка-мишень (т.е. наружная поверхность клеточной мембраны) может подвергаться воздействию меченого полипептида (как правило, избытка меченого полипептида) с результатом в виде достижения "стационарного состояния", при котором меченый полипептид входит в и покидает внутриклеточные эндосомы приблизительно с одной скоростью. Этот момент времени соответствует оптимальному моменту времени для проведения стадий iii) и/ или iv).The incubation step ii) can be carried out for any given period of time, for example, for a period of 5 minutes to 5 days. A typical time period is 1-12 hours, such as 2-10 hours, 4-8 hours, or 6-8 hours. During this period, the target cell (i.e., the outer surface of the cell membrane) may be exposed to the labeled polypeptide (typically an excess of labeled polypeptide) resulting in a "steady state" in which the labeled polypeptide enters and exits intracellular endosomes. at approximately the same speed. This point in time corresponds to the optimal point in time for carrying out steps iii) and/or iv).

Стадия iii) может вовлекать сокращение или устранение источника меченого полипептида снаружи клетки-мишени, тем самым уменьшая количество меченого полипептида, входящего в клетку (или по существу препятствуя ему). Указанное уменьшение количества меченого полипептида, входящего в клетку-мишень, в свою очередь обеспечивает изменение количества меченого полипептида, входящего в эндосому, что в свою очередь приводит к изменению количества (или скорости) меченого полипептида, выходящего из эндосом и/или входящего в цитозоль клетки-мишени. Оно представляет собой количество (или скорость) меченого полипептида, покидающего структуры эндосом, которое в одном варианте осуществления может стать основой анализа - указанное количество (или скорость) меченого полипептида, покидающего структуры эндосом, можно измерять по изменению количества меченого полипептида, присутствующего в эндосомах и/ или по изменению количества меченого полипептида, присутствующего в цитозоле. При измерении количества меченого полипептида, присутствующего в эндосомах, как правило, наблюдают уменьшение количества присутствующего меченого полипептида. При измерении количества меченого полипептида, присутствующего в цитозоле, можно наблюдать увеличение или уменьшение количества меченого полипептида, присутствующего в цитозоле. В качестве примера, увеличение количества меченого полипептида в цитозоле может наблюдаться, когда стадию iii) начинают до установления стационарного эндосомального транспорта меченого полипептида. Альтернативно уменьшение количества меченого полипептида в цитозоле может наблюдаться, когда скорость клеточной секреции меченого полипептида из клетки-мишени превышает скорость эндосомального транспорта меченого полипептида из эндосом в цитозоль.Step iii) may involve reducing or eliminating the source of the labeled polypeptide from outside the target cell, thereby reducing (or substantially preventing) the amount of labeled polypeptide entering the cell. This decrease in the amount of labeled polypeptide entering the target cell, in turn, provides a change in the amount of labeled polypeptide entering the endosome, which in turn leads to a change in the amount (or rate) of the labeled polypeptide leaving the endosomes and/or entering the cytosol of the cell -targets. It represents the amount (or rate) of labeled polypeptide leaving endosome structures, which in one embodiment can be the basis of the analysis - the amount (or rate) of labeled polypeptide leaving endosome structures can be measured by the change in the amount of labeled polypeptide present in endosomes and / or by changing the amount of labeled polypeptide present in the cytosol. When measuring the amount of labeled polypeptide present in endosomes, a decrease in the amount of labeled polypeptide present is typically observed. By measuring the amount of labeled polypeptide present in the cytosol, an increase or decrease in the amount of labeled polypeptide present in the cytosol can be observed. As an example, an increase in the amount of labeled polypeptide in the cytosol can be observed when step iii) is started before stationary endosomal transport of the labeled polypeptide is established. Alternatively, a decrease in the amount of labeled polypeptide in the cytosol can be observed when the rate of cellular secretion of the labeled polypeptide from the target cell exceeds the rate of endosomal transport of the labeled polypeptide from endosomes to the cytosol.

Клетки-мишени, используемые в анализе, могут быть иммобилизованы на поверхности. Иммобилизацию клеток можно проводить в качестве стадии до анализа (т.е. до иммобилизации), или ее можно проводить в качестве части протокола анализа. Таким образом, в одном варианте осуществления, клетки в анализе являются предварительно иммобилизованными. Иммобилизацию клеток-мишеней можно проводить любыми общепринятыми способами. В качестве примера, клетки высевают в планшеты для анализа с высокой плотностью, и перед проведением анализа им позволяют прикрепиться. Альтернативно клетки высевают на чашки для анализа и культивируют в течение нескольких суток перед применением для получения смыкающегося монослоя. Прикрепление клеток может быть усилено с использованием общепринятых покрытий, таких как чашки, покрытые поли-D-лизином.The target cells used in the assay may be immobilized on the surface. Cell immobilization can be done as a pre-analysis step (ie, prior to immobilization), or it can be done as part of the assay protocol. Thus, in one embodiment, the cells in the assay are pre-immobilized. Immobilization of target cells can be carried out by any conventional means. As an example, cells are seeded in high density assay plates and allowed to adhere prior to assay. Alternatively, cells are plated on assay dishes and cultured for several days prior to use to obtain a contiguous monolayer. Cell attachment can be enhanced using conventional coatings such as poly-D-lysine coated dishes.

В одном варианте осуществления иммобилизацию клеток-мишеней можно проводить до или в ходе стадии iii), тем самым обеспечивая простое средство для отделения указанных клеток от свободного от клеток (например, несвязанного или экзогенного) меченого полипептида. Альтернативно иммобилизацию можно проводить после стадии iii), например, для упрощения стадии детекции iv).In one embodiment, immobilization of target cells can be performed prior to or during step iii), thereby providing a simple means for separating said cells from cell-free (eg, unbound or exogenous) labeled polypeptide. Alternatively, immobilization can be carried out after step iii), for example, to simplify the detection step iv).

Стадия iii) может включать стадию фильтрования или стадию с аффинном лигандом, в ходе которой клетки отделяют от избыточного (например, несвязанного или экзогенного) меченого полипептида. Стадия iii) может включать стадию промывания, в которой избыточный (например, несвязанный или экзогенный) меченый полипептид вымывают из клеток-мишеней, например с использованием общепринятого буфера. Подразумевается, что избыточный меченый полипептид означает меченый полипептид, который присутствует в среде для анализа снаружи клеток-мишеней и который еще не связался с участком связывания, присутствующим на поверхности клеток-мишеней.Step iii) may include a filtration step or an affinity ligand step in which cells are separated from excess (eg, unbound or exogenous) labeled polypeptide. Step iii) may include a washing step in which excess (eg, unbound or exogenous) labeled polypeptide is washed out of the target cells, eg using a conventional buffer. An excess labeled polypeptide is meant to mean a labeled polypeptide that is present in the assay medium on the outside of the target cells and that has not yet bound to a binding site present on the surface of the target cells.

Детекцию меченого полипептида на стадии iv), как правило, проводят вскоре после стадии iii). В качестве примера, типичный период времени для стадии iv) составляет от 5 минут до 5 часов после стадии iii). В одном варианте осуществления стадию iv) проводят в течение 15-240 минут, или 30-180 минут, или 45-150 минут после стадии iii). Стадию детекции iv) можно повторять на протяжении нескольких временных интервалов, например, с интервалами 10 минут, или 15 минут, или 30 минут - это позволит вычисление скорости эндосомального высвобождения.Detection of the labeled polypeptide in step iv) is generally carried out shortly after step iii). As an example, a typical time period for step iv) is 5 minutes to 5 hours after step iii). In one embodiment, step iv) is carried out within 15-240 minutes, or 30-180 minutes, or 45-150 minutes after step iii). The detection step iv) can be repeated over several time intervals, for example at intervals of 10 minutes, or 15 minutes, or 30 minutes - this will allow the calculation of the rate of endosomal release.

Стадию детекции iv) можно проводить любыми общепринятыми способами. Детекция меченого полипептида может быть основана на внутриклеточной локализации указанного меченого полипептида.The detection step iv) can be carried out by any conventional means. The detection of a labeled polypeptide may be based on the intracellular localization of said labeled polypeptide.

В стадии сравнения v) используется контрольная величина, которая соответствует количеству меченого полипептида, присутствующего в эндосомах и/ или цитозоле до стадии детекции iv). Контрольную величину, как правило, определяют посредством тех же средств/способа, посредством которых определяют количество меченого полипептида на стадии детекции iv). Контрольная величина, как правило, соответствует количеству меченого полипептида, присутствующего в эндосомах и/или цитозоле на входе или до стадии iii). В качестве примера, контрольная величина может соответствовать количеству меченого полипептида, присутствующего в эндосомах и/или цитозоле в ходе или в конце стадии ii) - в одном варианте осуществления контрольная величина соответствует количеству меченого полипептида, который присутствует в эндосомах и/или цитозоле после установления "стационарной" скорости транслокации, а именно, когда меченый полипептид входит в и покидает внутриклеточные эндосомы приблизительно с одинаковой скоростью.In comparison step v) a reference value is used which corresponds to the amount of labeled polypeptide present in the endosomes and/or cytosol prior to detection step iv). The control value is generally determined by the same means/method by which the amount of labeled polypeptide is determined in the detection step iv). The control value generally corresponds to the amount of labeled polypeptide present in the endosomes and/or cytosol at or before step iii). As an example, the control value may correspond to the amount of labeled polypeptide present in the endosomes and/or cytosol during or at the end of step ii) - in one embodiment, the control value corresponds to the amount of labeled polypeptide that is present in the endosomes and/or cytosol after establishing " "stationary" rate of translocation, namely, when the labeled polypeptide enters and leaves intracellular endosomes at approximately the same rate.

В вышеуказанных вариантах осуществления термин "меченый полипептид" также может охватывать его часть, такую как нецитотоксический протеазный домен, домен транслокации или TM (например, домен транслокации и TM). Способы также могут включать детекцию двух или более меток, таких как метка на одной части полипептида и метка на второй части полипептида.In the above embodiments, the term "labeled polypeptide" may also encompass a portion thereof, such as a non-cytotoxic protease domain, a translocation domain, or TM (eg, a translocation domain and TM). The methods may also include detecting two or more labels, such as a label on one part of the polypeptide and a label on the second part of the polypeptide.

В одном варианте осуществления способ по изобретению также может включать анализ расщепления белка аппарата экзоцитарного слияния (например, белка SNARE).In one embodiment, the method of the invention may also include an assay for cleavage of an exocytic fusion apparatus protein (eg, SNARE protein).

Детекцию поддающейся детекции метки можно проводить с использованием любых подходящих способов, известных специалисту в данной области. В одном варианте осуществления для детекции поддающейся детекции метки используют микроскопию. Способы детекции поддающейся детекции метки могут включать любой подходящий световой, конфокальный (предпочтительно прижизненная конфокальная 3D-микроскопия) способ визуализации, способ визуализации сверхвысокого разрешения или способ визуализации единичных молекул (например, световая микроскопия, конфокальная микроскопия, микроскопия сверхвысокого разрешения или микроскопия единичных молекул). В способах по изобретению могут использоваться такие микроскопы, как STED, PALM, STORM и TIRF. Такие способы микроскопии являются хорошо отработанными и имеют высокое разрешение.The detection of a detectable label can be carried out using any suitable methods known to the person skilled in the art. In one embodiment, microscopy is used to detect a detectable label. Methods for detecting a detectable label may include any suitable light, confocal (preferably in vivo confocal 3D microscopy) imaging technique, super resolution imaging technique, or single molecule imaging technique (e.g., light microscopy, confocal microscopy, super resolution microscopy, or single molecule microscopy). Microscopes such as STED, PALM, STORM and TIRF can be used in the methods of the invention. Such microscopy methods are well developed and have high resolution.

Подразумевают, что термин "протеолитически неактивный мутант" охватывает мутант нецитотоксической протеазы, который демонстрирует значительно сниженное расщепление белков аппарата экзоцитарного слияния в клетке-мишени по сравнению с ее немутантной формой. Предпочтительно, протеолитически неактивный мутант включает протеолитически неактивную L-цепь клостридиального нейротоксина. В одном варианте осуществления протеолитически неактивный мутант может содержать L-цепь SEQ ID NO: 38 или 40.The term "proteolytically inactive mutant" is meant to encompass a non-cytotoxic protease mutant that exhibits significantly reduced cleavage of the proteins of the exocytic fusion apparatus in the target cell compared to its wild form. Preferably, the proteolytically inactive mutant comprises a proteolytically inactive Clostridial neurotoxin L chain. In one embodiment, the proteolytically inactive mutant may comprise the L chain of SEQ ID NO: 38 or 40.

В одном варианте осуществления "протеолитически неактивный мутант" по существу не обладает активностью нецитотоксической протеазы, предпочтительно не обладает активностью нецитотоксической протеазы. Термин "по существу не обладает активностью нецитотоксической протеазы" означает, что протеолитически активный мутант имеет менее чем 5% от активности нецитотоксической протеазы его немутантной (т.е. протеолитически активной) формы, например, менее 2%, 1% или предпочтительно 0,1% от активности нецитотоксической протеазы его немутантной формы. Активность нецитотоксической протеазы может быть определена in vitro посредством инкубации мутанта нецитотоксической протеазы с белком SNARE и сравнения количества белка SNARE, расщепленного тестируемой нецитотоксической протеазой, с количеством белка SNARE, расщепленного его немутантной (т.е. протеолитически активной) формой в тех же условиях. Для количественного определения расщепленного белка SNARE можно использовать стандартные способы, такие как SDS-PAGE и вестерн-блоттинг. Подходящие способы анализа in vitro описаны в WO 2019/145577 A1, которая включена в настоящее описание в качестве ссылки. Альтернативно или дополнительно, можно использовать клеточный анализ, описанный в настоящем описании.In one embodiment, the "proteolytically inactive mutant" is substantially devoid of non-cytotoxic protease activity, preferably devoid of non-cytotoxic protease activity. The term "substantially no non-cytotoxic protease activity" means that the proteolytically active mutant has less than 5% of the non-cytotoxic protease activity of its wild-type (i.e., proteolytically active) form, e.g., less than 2%, 1%, or preferably 0.1 % of the activity of the non-cytotoxic protease of its wild-type form. Non-cytotoxic protease activity can be determined in vitro by incubating the non-cytotoxic protease mutant with the SNARE protein and comparing the amount of SNARE protein cleaved by the non-cytotoxic protease under test with the amount of SNARE protein cleaved by its non-mutant (i.e., proteolytically active) form under the same conditions. To quantify the cleaved SNARE protein, standard methods such as SDS-PAGE and Western blotting can be used. Suitable in vitro assay methods are described in WO 2019/145577 A1, which is incorporated herein by reference. Alternatively or additionally, you can use the cellular analysis described in the present description.

В одном варианте осуществления протеолитически неактивный мутант может иметь одну или несколько мутаций, которые инактивируют протеазу. Например, протеолитически неактивный мутант нецитотоксической протеазы может содержать L-цепь BoNT/A, содержащую мутацию остатка активного центра, такую как His223, Glu224, His227, Glu262 и/или Tyr366. Нумерация положений соответствует положениям аминокислот SEQ ID NO: 17 и может быть установлена посредством выравнивания полипептида с SEQ ID NO: 17.In one embodiment, the proteolytically inactive mutant may have one or more mutations that inactivate the protease. For example, a proteolytically inactive non-cytotoxic protease mutant may comprise a BoNT/A L chain containing an active site residue mutation such as His223, Glu224, His227, Glu262 and/or Tyr366. The position numbering corresponds to the amino acid positions of SEQ ID NO: 17 and can be established by aligning the polypeptide to SEQ ID NO: 17.

Полипептид по изобретению предпочтительно обладает одной или несколькими видами активности, ассоциированными с клостридиальным нейротоксином (например, ботулиническим нейротоксином). Иными словами, полипептид по изобретению может представлять собой активный нейротоксин. Например, полипептид по изобретению может отщеплять белок от аппарата экзоцитарного слияния клетки-мишени, может быть способным связываться с участком связывания на клетке-мишени и/или может обладать активностью транслокации. Предпочтительно, полипептид по изобретению может расщеплять белок аппарата экзоцитарного слияния в клетке-мишени, может быть способным связывать участок связывания на клетке-мишени и может обладать активностью транслокации. Таким образом, предпочтительно полипептид не подвергается (и не подвергался) детоксикационной обработке. Например, полипептид может не быть (и мог не быть) химически инактивированным и/или инактивированным нагреванием. В одном варианте осуществления полипептид не приводят в контакт (и не приводили в контакт) с сшивающим агентом, более предпочтительно, полипептид не приводят в контакт (и не приводили в контакт) с формальдегидом.The polypeptide of the invention preferably has one or more activities associated with a clostridial neurotoxin (eg, botulinum neurotoxin). In other words, the polypeptide of the invention may be an active neurotoxin. For example, a polypeptide of the invention may cleave a protein from an exocytic fusion apparatus of a target cell, may be capable of binding to a binding site on a target cell, and/or may have translocation activity. Preferably, the polypeptide of the invention may cleave a protein of the exocytic fusion apparatus in the target cell, may be capable of binding a binding site on the target cell, and may have translocation activity. Thus, preferably the polypeptide is not (and has not been) detoxified. For example, the polypeptide may not be (and might not be) chemically inactivated and/or heat inactivated. In one embodiment, the polypeptide is not (and has not been) contacted with a crosslinker, more preferably the polypeptide is not (and has not been) contacted with formaldehyde.

Полипептид, описанный в настоящем описании, предпочтительно содержит нецитотоксическую протеазу, которая способна расщеплять белок аппарата экзоцитарного слияния в клетке-мишени.The polypeptide described herein preferably contains a non-cytotoxic protease that is capable of cleaving the protein of the exocytic fusion apparatus in the target cell.

Нацеливающая часть (TM) полипептида по изобретению предпочтительно способна связываться с участком связывания на клетке-мишени, который способен претерпевать эндоцитоз для включения в эндосому в клетке-мишени.The targeting portion (TM) of a polypeptide of the invention is preferably capable of binding to a binding site on a target cell that is capable of undergoing endocytosis for incorporation into an endosome in the target cell.

Домен транслокации предпочтительно способен к транслокации нецитотоксической протеазы из эндосомы через эндососмальную мембрану и в цитозоль клетки-мишени.The translocation domain is preferably capable of translocating a non-cytotoxic protease from the endosome across the endosome membrane and into the cytosol of the target cell.

В предпочтительном варианте осуществления нецитотоксическая протеаза полипептида, описанного в настоящем описании, содержит L-цепь клостридиального нейротоксина. Более предпочтительно, L-цепь клостридиального нейротоксина представляет собой L-цепь ботулинического нейротоксина.In a preferred embodiment, the non-cytotoxic protease of the polypeptide described herein comprises the L chain of a clostridial neurotoxin. More preferably, the Clostridial neurotoxin L chain is a botulinum neurotoxin L chain.

В предпочтительном варианте осуществления домен транслокации полипептида, описанного в настоящем описании, содержит домен транслокации клостридиального нейротоксина. Более предпочтительно, домен транслокации клостридиального нейротоксина представляет собой домен транслокации ботулинического нейротоксина.In a preferred embodiment, the translocation domain of the polypeptide described herein comprises a clostridial neurotoxin translocation domain. More preferably, the clostridial neurotoxin translocation domain is a botulinum neurotoxin translocation domain.

В одном варианте осуществления полипептид, описанный в настоящем описании, лишен функционального HC-домена клостридиального нейротоксина.In one embodiment, the polypeptide described herein lacks a functional clostridial neurotoxin H C domain.

В альтернативном варианте осуществления полипептид, описанный в настоящем описании, содержит TM связывающего домена (HC-домена) клостридиального нейротоксина. Более предпочтительно, TM связывающего домена (HC-домена) клостридиального нейротоксина представляет собой TM связывающего домена (HC-домена) ботулинического нейротоксина.In an alternative embodiment, the polypeptide described herein contains the TM binding domain ( HC domain) of a clostridial neurotoxin. More preferably, the TM binding domain ( HC domain) of clostridial neurotoxin is the TM binding domain ( HC domain) of botulinum neurotoxin.

Таким образом, в предпочтительном варианте осуществления полипептид, описанный в настоящем описании, содержит L-цепь клостридиального нейротоксина, домен транслокации клостридиального нейротоксина и неклостридиальную TM.Thus, in a preferred embodiment, the polypeptide described herein comprises a clostridial neurotoxin L chain, a clostridial neurotoxin translocation domain, and a non-clostridial TM.

В равной степени предпочтительном альтернативном варианте осуществления полипептид, описанный в настоящем описании, содержит L-цепь клостридиального нейротоксина и H-цепь клостридиального нейротоксина (имеющую домен транслокации клостридиального нейротоксина [HN] и HC-домен). В таких вариантах осуществления полипептид, описанный в настоящем описании, представляет собой клостридиальный нейротоксин.An equally preferred alternative embodiment, the polypeptide described herein comprises a clostridial neurotoxin L chain and a clostridial neurotoxin H chain (having a clostridial neurotoxin translocation domain [H N ] and an HC domain). In such embodiments, the polypeptide described herein is a clostridial neurotoxin.

Более предпочтительно, полипептид, описанный в настоящем описании, содержит L-цепь ботулинического нейротоксина, домен транслокации ботулинического нейротоксина и неклостридиальную TM.More preferably, the polypeptide described herein comprises a botulinum neurotoxin L chain, a botulinum neurotoxin translocation domain, and non-clostridial TM.

В равной степени предпочтительном альтернативном варианте осуществления полипептид, описанный в настоящем описании, содержит L-цепь ботулинического нейротоксина и H-цепь ботулинического нейротоксина (имеющую домен транслокации ботулинического нейротоксина [HN] и HC-домен). В таких вариантах осуществления полипептид, описанный в настоящем описании, представляет собой ботулинический нейротоксин.An equally preferred alternative embodiment, the polypeptide described herein comprises a botulinum neurotoxin L chain and a botulinum neurotoxin H chain (having a botulinum neurotoxin translocation domain [H N ] and an HC domain). In such embodiments, the polypeptide described herein is a botulinum neurotoxin.

Предпочтительно полипептид представляет собой ботулинический нейротоксин (BoNT), дополнительно содержащий акцепторный и/или донорный участок для сортазы и/или поддающуюся детекции метку, конъюгированную с ним, и аминокислотную последовательность, которая содержит L(A/P/S)X(T/S/A/C)Gn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1, L(A/P/S)X(T/S/A/C)An, где X представляет собой любую аминокислоту и n равен по меньшей мере 1, NPQTN, YPRTG, IPQTG, VPDTG, LPXTGS, где X представляет собой любую аминокислоту, NPKTG, XPETG, LGATG, IPNTG, IPETG, NSKTA, NPQTG, NAKTN, NPQSS, LPXTX, где X представляет собой любую аминокислоту, NPX1TX2, где X1 представляет собой Lys или Gln и X2 представляет собой Asn, Asp или Gly, X1PX2X3G, где X1 представляет собой Leu, Ile, Val или Met, X2 представляет собой любую аминокислоту и X3 представляет собой Ser, Thr или Ala, LPEX1G, где X1 представляет собой Ala, Cys или Ser, LPXS, LAXT, MPXT, MPXTG, LAXS, NPXT, NPXTG, NAXT, NAXTG, NAXS, NAXSG, LPXP, LPXPG, где X представляет собой любую аминокислоту, LRXTGn или LPAXGn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1 (более предпочтительно L(A/P/S)X(T/S/A/C)Gn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1). BoNT может представлять собой один или несколько, выбранных из BoNT/A, BoNT/B, BoNT/C, BoNT/D, BoNT/E, BoNT/F, BoNT/G или BoNT/X. Также предусматриваются их варианты, включающие протеолитически неактивный мутант нецитотоксической протеазы.Preferably, the polypeptide is a botulinum neurotoxin (BoNT) further comprising an acceptor and/or donor site for sortase and/or a detectable label conjugated thereto and an amino acid sequence that contains L(A/P/S)X(T/S /A/C)Gnwhere X is any amino acid and n is at least 1, L(A/P/S)X(T/S/A/C)Anwhere X is any amino acid and n is at least 1, NPQTN, YPRTG, IPQTG, VPDTG, LPXTGS, where X is any amino acid, NPKTG, XPETG, LGATG, IPNTG, IPETG, NSKTA, NPQTG, NAKTN, NPQSS, LPXTX where X is any amino acid, NPX1TX2, where X1 is Lys or Gln and X2 is Asn, Asp or Gly, X1PX2X3G, where X1is Leu, Ile, Val or Met, X2is any amino acid and X3is Ser, Thr or Ala, LPEX1G, where X1 is Ala, Cys or Ser, LPXS, LAXT, MPXT, MPXTG, LAXS, NPXT, NPXTG, NAXT, NAXTG, NAXS, NAXSG, LPXP, LPXPG, where X is any amino acid, LRXTGn or LPAXGn, where X is any amino acid and n is at least 1 (more preferably L(A/P/S)X(T/S/A/C)Gnwhere X is any amino acid and n is at least 1). The BoNT may be one or more selected from BoNT/A, BoNT/B, BoNT/C, BoNT/D, BoNT/E, BoNT/F, BoNT/G, or BoNT/X. Variants thereof are also contemplated, including a proteolytically inactive non-cytotoxic protease mutant.

Предпочтительно полипептид представляет собой ботулинический нейротоксин (BoNT), дополнительно содержащий акцепторный и/или донорный участок для сортазы и/или поддающуюся детекции метку, конъюгированную с ним, и аминокислотную последовательность, которая содержит L(A/P/S)X(T/S/A/C)Gn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1, L(A/P/S)X(T/S/A/C)An, где X представляет собой любую аминокислоту и n равен по меньшей мере 1, NPQTN, YPRTG, IPQTG, VPDTG, или LPXTGS, где X представляет собой любую аминокислоту (более предпочтительно L(A/P/S)X(T/S/A/C)Gn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1). BoNT может представлять собой один или несколько, выбранных из BoNT/A, BoNT/B, BoNT/C, BoNT/D, BoNT/E, BoNT/F, BoNT/G или BoNT/X. Также предусматриваются их варианты, включающие протеолитически неактивный мутант нецитотоксической протеазы.Preferably, the polypeptide is a botulinum neurotoxin (BoNT) further comprising an acceptor and/or donor site for sortase and/or a detectable label conjugated thereto and an amino acid sequence that contains L(A/P/S)X(T/S /A/C)G n where X is any amino acid and n is at least 1, L(A/P/S)X(T/S/A/C)A n where X is any amino acid and n is at least 1, NPQTN, YPRTG, IPQTG, VPDTG, or LPXTGS, where X is any amino acid (more preferably L(A/P/S)X(T/S/A/C)G n , where X is any amino acid and n is at least 1). The BoNT may be one or more selected from BoNT/A, BoNT/B, BoNT/C, BoNT/D, BoNT/E, BoNT/F, BoNT/G, or BoNT/X. Variants thereof are also contemplated, including a proteolytically inactive non-cytotoxic protease mutant.

Альтернативно полипептид может представлять собой столбнячный нейротоксин (TeNT), дополнительно содержащий акцепторный и/или донорный участок для сортазы и/или поддающуюся детекции метку, конъюгированную с ним, и аминокислотную последовательность, которая содержит L(A/P/S)X(T/S/A/C)Gn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1, L(A/P/S)X(T/S/A/C)An, где X представляет собой любую аминокислоту и n равен по меньшей мере 1, NPQTN, YPRTG, IPQTG, VPDTG, LPXTGS, где X представляет собой любую аминокислоту, NPKTG, XPETG, LGATG, IPNTG, IPETG, NSKTA, NPQTG, NAKTN, NPQSS, LPXTX, где X представляет собой любую аминокислоту, NPX1TX2, где X1 представляет собой Lys или Gln и X2 представляет собой Asn, Asp или Gly, X1PX2X3G, где X1 представляет собой Leu, Ile, Val или Met, X2 представляет собой любую аминокислоту и X3 представляет собой Ser, Thr или Ala, LPEX1G, где X1 представляет собой Ala, Cys или Ser, LPXS, LAXT, MPXT, MPXTG, LAXS, NPXT, NPXTG, NAXT, NAXTG, NAXS, NAXSG, LPXP, LPXPG, где X представляет собой любую аминокислоту, LRXTGn или LPAXGn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1 (более предпочтительно L(A/P/S)X(T/S/A/C)Gn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1). Также предусматриваются его варианты, содержащие протеолитически неактивный мутант нецитотоксической протеазы.Alternatively, the polypeptide may be a tetanus neurotoxin (TeNT) further comprising an acceptor and/or donor site for sortase and/or a detectable label conjugated thereto and an amino acid sequence that contains L(A/P/S)X(T/ S/A/C)Gnwhere X is any amino acid and n is at least 1, L(A/P/S)X(T/S/A/C)Anwhere X is any amino acid and n is at least 1, NPQTN, YPRTG, IPQTG, VPDTG, LPXTGS, where X is any amino acid, NPKTG, XPETG, LGATG, IPNTG, IPETG, NSKTA, NPQTG, NAKTN, NPQSS, LPXTX where X is any amino acid, NPX1TX2, where X1 is Lys or Gln and X2 is Asn, Asp or Gly, X1PX2X3G, where X1is Leu, Ile, Val or Met, X2is any amino acid and X3is Ser, Thr or Ala, LPEX1G, where X1 is Ala, Cys or Ser, LPXS, LAXT, MPXT, MPXTG, LAXS, NPXT, NPXTG, NAXT, NAXTG, NAXS, NAXSG, LPXP, LPXPG, where X is any amino acid, LRXTGn or LPAXGn, where X is any amino acid and n is at least 1 (more preferably L(A/P/S)X(T/S/A/C)Gnwhere X is any amino acid and n is at least 1). Variants containing a proteolytically inactive non-cytotoxic protease mutant are also contemplated.

Альтернативно полипептид может представлять собой столбнячный нейротоксин (TeNT), дополнительно содержащий акцепторный и/или донорный участок для сортазы и/или поддающуюся детекции метку, конъюгированную с ним, и аминокислотную последовательность, которая содержит L(A/P/S)X(T/S/A/C)Gn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1, L(A/P/S)X(T/S/A/C)An, где X представляет собой любую аминокислоту и n равен по меньшей мере 1, NPQTN, YPRTG, IPQTG, VPDTG, или LPXTGS, где X представляет собой любую аминокислоту (более предпочтительно L(A/P/S)X(T/S/A/C)Gn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1). Также предусматриваются его варианты, содержащие протеолитически неактивный мутант нецитотоксической протеазы.Alternatively, the polypeptide may be a tetanus neurotoxin (TeNT) further comprising an acceptor and/or donor site for sortase and/or a detectable label conjugated thereto and an amino acid sequence that contains L(A/P/S)X(T/ S/A/C)G n where X is any amino acid and n is at least 1, L(A/P/S)X(T/S/A/C)A n where X is any amino acid and n is at least 1, NPQTN, YPRTG, IPQTG, VPDTG, or LPXTGS, where X is any amino acid (more preferably L(A/P/S)X(T/S/A/C)G n , where X is any amino acid and n is at least 1). Variants containing a proteolytically inactive non-cytotoxic protease mutant are also contemplated.

Репрезентативные полипептидные последовательности для BoNT/A, BoNT/B, BoNT/C, BoNT/D, BoNT/E, BoNT/F, BoNT/G, BoNT/X и TeNT описаны в настоящем описании в качестве SEQ ID NO: 17-25, соответственно. Указанные полипептидные последовательности могут быть модифицированы включением акцепторного или донорного участка для сортазы для применения в рамках настоящего изобретения.Representative polypeptide sequences for BoNT/A, BoNT/B, BoNT/C, BoNT/D, BoNT/E, BoNT/F, BoNT/G, BoNT/X and TeNT are described herein as SEQ ID NOs: 17-25 , respectively. These polypeptide sequences may be modified to include an acceptor or donor site for sortase for use in the present invention.

Полипептид по изобретению может представлять собой полипептид, содержащий акцепторный и/или донорный участок для сортазы и/или поддающуюся детекции метку, конъюгированную с ним, и аминокислотную последовательность, которая содержит L(A/P/S)X(T/S/A/C)Gn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1, L(A/P/S)X(T/S/A/C)An, где X представляет собой любую аминокислоту и n равен по меньшей мере 1, NPQTN, YPRTG, IPQTG, VPDTG, LPXTGS, где X представляет собой любую аминокислоту, NPKTG, XPETG, LGATG, IPNTG, IPETG, NSKTA, NPQTG, NAKTN, NPQSS, LPXTX, где X представляет собой любую аминокислоту, NPX1TX2, где X1 представляет собой Lys или Gln и X2 представляет собой Asn, Asp или Gly, X1PX2X3G, где X1 представляет собой Leu, Ile, Val или Met, X2 представляет собой любую аминокислоту и X3 представляет собой Ser, Thr или Ala, LPEX1G, где X1 представляет собой Ala, Cys или Ser, LPXS, LAXT, MPXT, MPXTG, LAXS, NPXT, NPXTG, NAXT, NAXTG, NAXS, NAXSG, LPXP, LPXPG, где X представляет собой любую аминокислоту, LRXTGn или LPAXGn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1 (более предпочтительно L(A/P/S)X(T/S/A/C)Gn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1) и где полипептид дополнительно содержит полипептидную последовательность, обладающую по меньшей мере 70% идентичностью последовательности с любой из SEQ ID NO: 17-25. В одном варианте осуществления полипептид по изобретению может представлять собой полипептид, содержащий акцепторный и/или донорный участок для сортазы и/или поддающуюся детекции метку, конъюгированную с ним, и аминокислотную последовательность, которая содержит L(A/P/S)X(T/S/A/C)Gn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1, L(A/P/S)X(T/S/A/C)An, где X представляет собой любую аминокислоту и n равен по меньшей мере 1, NPQTN, YPRTG, IPQTG, VPDTG, LPXTGS, где X представляет собой любую аминокислоту, NPKTG, XPETG, LGATG, IPNTG, IPETG, NSKTA, NPQTG, NAKTN, NPQSS, LPXTX, где X представляет собой любую аминокислоту, NPX1TX2, где X1 представляет собой Lys или Gln и X2 представляет собой Asn, Asp или Gly, X1PX2X3G, где X1 представляет собой Leu, Ile, Val или Met, X2 представляет собой любую аминокислоту и X3 представляет собой Ser, Thr или Ala, LPEX1G, где X1 представляет собой Ala, Cys или Ser, LPXS, LAXT, MPXT, MPXTG, LAXS, NPXT, NPXTG, NAXT, NAXTG, NAXS, NAXSG, LPXP, LPXPG, где X представляет собой любую аминокислоту, LRXTGn или LPAXGn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1 (более предпочтительно L(A/P/S)X(T/S/A/C)Gn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1) и где полипептид дополнительно содержит полипептидную последовательность, обладающую по меньшей мере 80% или 90% идентичностью последовательности с любой из SEQ ID NO: 17-25. Предпочтительно полипептид по изобретению может представлять собой полипептид, содержащий акцепторный и/или донорный участок для сортазы и/или поддающуюся детекции метку, конъюгированную с ним, и аминокислотную последовательность, которая содержит L(A/P/S)X(T/S/A/C)Gn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1, L(A/P/S)X(T/S/A/C)An, где X представляет собой любую аминокислоту и n равен по меньшей мере 1, NPQTN, YPRTG, IPQTG, VPDTG, LPXTGS, где X представляет собой любую аминокислоту, NPKTG, XPETG, LGATG, IPNTG, IPETG, NSKTA, NPQTG, NAKTN, NPQSS, LPXTX, где X представляет собой любую аминокислоту, NPX1TX2, где X1 представляет собой Lys или Gln и X2 представляет собой Asn, Asp или Gly, X1PX2X3G, где X1 представляет собой Leu, Ile, Val или Met, X2 представляет собой любую аминокислоту и X3 представляет собой Ser, Thr или Ala, LPEX1G, где X1 представляет собой Ala, Cys или Ser, LPXS, LAXT, MPXT, MPXTG, LAXS, NPXT, NPXTG, NAXT, NAXTG, NAXS, NAXSG, LPXP, LPXPG, где X представляет собой любую аминокислоту, LRXTGn или LPAXGn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1 (более предпочтительно L(A/P/S)X(T/S/A/C)Gn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1) и где полипептид дополнительно включает полипептид, содержащий (более предпочтительно состоящий из) любую из SEQ ID NO: 17-25.The polypeptide of the invention may be a polypeptide containing an acceptor and/or donor site for sortase and/or a detectable label conjugated thereto and an amino acid sequence that contains L(A/P/S)X(T/S/A/ C)Gnwhere X is any amino acid and n is at least 1, L(A/P/S)X(T/S/A/C)Anwhere X is any amino acid and n is at least 1, NPQTN, YPRTG, IPQTG, VPDTG, LPXTGS, where X is any amino acid, NPKTG, XPETG, LGATG, IPNTG, IPETG, NSKTA, NPQTG, NAKTN, NPQSS, LPXTX where X is any amino acid, NPX1TX2, where X1 is Lys or Gln and X2 is Asn, Asp or Gly, X1PX2X3G, where X1is Leu, Ile, Val or Met, X2is any amino acid and X3is Ser, Thr or Ala, LPEX1G, where X1 is Ala, Cys or Ser, LPXS, LAXT, MPXT, MPXTG, LAXS, NPXT, NPXTG, NAXT, NAXTG, NAXS, NAXSG, LPXP, LPXPG, where X is any amino acid, LRXTGn or LPAXGn, where X is any amino acid and n is at least 1 (more preferably L(A/P/S)X(T/S/A/C)Gnwhere X is any amino acid and n is at least 1) and wherein the polypeptide further comprises a polypeptide sequence having at least 70% sequence identity with any of SEQ ID NOs: 17-25. In one embodiment, the polypeptide of the invention may be a polypeptide comprising an acceptor and/or donor site for sortase and/or a detectable label conjugated thereto and an amino acid sequence that contains L(A/P/S)X(T/ S/A/C)Gnwhere X is any amino acid and n is at least 1, L(A/P/S)X(T/S/A/C)Anwhere X is any amino acid and n is at least 1, NPQTN, YPRTG, IPQTG, VPDTG, LPXTGS, where X is any amino acid, NPKTG, XPETG, LGATG, IPNTG, IPETG, NSKTA, NPQTG, NAKTN, NPQSS, LPXTX where X is any amino acid, NPX1TX2, where X1 is Lys or Gln and X2 is Asn, Asp or Gly, X1PX2X3G, where X1is Leu, Ile, Val or Met, X2is any amino acid and X3is Ser, Thr or Ala, LPEX1G, where X1 is Ala, Cys or Ser, LPXS, LAXT, MPXT, MPXTG, LAXS, NPXT, NPXTG, NAXT, NAXTG, NAXS, NAXSG, LPXP, LPXPG, where X is any amino acid, LRXTGn or LPAXGn, where X is any amino acid and n is at least 1 (more preferably L(A/P/S)X(T/S/A/C)Gnwhere X is any amino acid and n is at least 1) and wherein the polypeptide further comprises a polypeptide sequence having at least 80% or 90% sequence identity with any of SEQ ID NOs: 17-25. Preferably, the polypeptide of the invention may be a polypeptide containing an acceptor and/or donor site for sortase and/or a detectable label conjugated thereto and an amino acid sequence that contains L(A/P/S)X(T/S/A /C)Gnwhere X is any amino acid and n is at least 1, L(A/P/S)X(T/S/A/C)Anwhere X is any amino acid and n is at least 1, NPQTN, YPRTG, IPQTG, VPDTG, LPXTGS, where X is any amino acid, NPKTG, XPETG, LGATG, IPNTG, IPETG, NSKTA, NPQTG, NAKTN, NPQSS, LPXTX where X is any amino acid, NPX1TX2, where X1 is Lys or Gln and X2 is Asn, Asp or Gly, X1PX2X3G, where X1is Leu, Ile, Val or Met, X2is any amino acid and X3is Ser, Thr or Ala, LPEX1G, where X1 is Ala, Cys or Ser, LPXS, LAXT, MPXT, MPXTG, LAXS, NPXT, NPXTG, NAXT, NAXTG, NAXS, NAXSG, LPXP, LPXPG, where X is any amino acid, LRXTGn or LPAXGn, where X is any amino acid and n is at least 1 (more preferably L(A/P/S)X(T/S/A/C)Gnwhere X is any amino acid and n is at least 1) and wherein the polypeptide further comprises a polypeptide comprising (more preferably consisting of) any of SEQ ID NOs: 17-25.

Полипептид по изобретению может представлять собой полипептид, содержащий акцепторный и/или донорный участок для сортазы и/или поддающуюся детекции метку, конъюгированную с ним, и аминокислотную последовательность, которая содержит L(A/P/S)X(T/S/A/C)Gn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1, L(A/P/S)X(T/S/A/C)An, где X представляет собой любую аминокислоту и n равен по меньшей мере 1, NPQTN, YPRTG, IPQTG, VPDTG, или LPXTGS, где X представляет собой любую аминокислоту (более предпочтительно L(A/P/S)X(T/S/A/C)Gn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1) и где полипептид дополнительно содержит полипептидную последовательность, обладающую по меньшей мере 70% идентичностью последовательности с любой из SEQ ID NO: 17-25. В одном варианте осуществления полипептид по изобретению может представлять собой полипептид, содержащий акцепторный и/или донорный участок для сортазы и/или поддающуюся детекции метку, конъюгированную с ним, и аминокислотную последовательность, которая содержит L(A/P/S)X(T/S/A/C)Gn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1, L(A/P/S)X(T/S/A/C)An, где X представляет собой любую аминокислоту и n равен по меньшей мере 1, NPQTN, YPRTG, IPQTG, VPDTG, или LPXTGS, где X представляет собой любую аминокислоту (более предпочтительно L(A/P/S)X(T/S/A/C)Gn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1) и где полипептид дополнительно содержит полипептидную последовательность, обладающую по меньшей мере 80% или 90% идентичностью последовательности с любой из SEQ ID NO: 17-25. Предпочтительно полипептид по изобретению может представлять собой полипептид, содержащий акцепторный и/или донорный участок для сортазы и/или поддающуюся детекции метку, конъюгированную с ним, и аминокислотную последовательность, которая содержит L(A/P/S)X(T/S/A/C)Gn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1, L(A/P/S)X(T/S/A/C)An, где X представляет собой любую аминокислоту и n равен по меньшей мере 1, NPQTN, YPRTG, IPQTG, VPDTG, или LPXTGS, где X представляет собой любую аминокислоту (более предпочтительно L(A/P/S)X(T/S/A/C)Gn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1) и где полипептид дополнительно включает полипептид, содержащий (более предпочтительно состоящий из) любую из SEQ ID NO 17-25.The polypeptide of the invention may be a polypeptide containing an acceptor and/or donor site for sortase and/or a detectable label conjugated thereto and an amino acid sequence that contains L(A/P/S)X(T/S/A/ C)G n where X is any amino acid and n is at least 1, L(A/P/S)X(T/S/A/C)A n where X is any amino acid and n is equal to at least 1, NPQTN, YPRTG, IPQTG, VPDTG, or LPXTGS, where X is any amino acid (more preferably L(A/P/S)X(T/S/A/C)G n , where X is any amino acid and n is at least 1) and wherein the polypeptide further comprises a polypeptide sequence having at least 70% sequence identity with any of SEQ ID NOs: 17-25. In one embodiment, the polypeptide of the invention may be a polypeptide comprising an acceptor and/or donor site for sortase and/or a detectable label conjugated thereto and an amino acid sequence that contains L(A/P/S)X(T/ S/A/C)G n where X is any amino acid and n is at least 1, L(A/P/S)X(T/S/A/C)A n where X is any amino acid and n is at least 1, NPQTN, YPRTG, IPQTG, VPDTG, or LPXTGS, where X is any amino acid (more preferably L(A/P/S)X(T/S/A/C)G n , where X is any amino acid and n is at least 1) and wherein the polypeptide further comprises a polypeptide sequence having at least 80% or 90% sequence identity with any of SEQ ID NOs: 17-25. Preferably, the polypeptide of the invention may be a polypeptide containing an acceptor and/or donor site for sortase and/or a detectable label conjugated thereto and an amino acid sequence that contains L(A/P/S)X(T/S/A /C)G n where X is any amino acid and n is at least 1, L(A/P/S)X(T/S/A/C)A n where X is any amino acid and n is at least 1, NPQTN, YPRTG, IPQTG, VPDTG, or LPXTGS, where X is any amino acid (more preferably L(A/P/S)X(T/S/A/C)G n , where X is any amino acid and n is at least 1) and wherein the polypeptide further comprises a polypeptide comprising (more preferably consisting of) any of SEQ ID NOs 17-25.

Альтернативно полипептид по изобретению может представлять собой полипептид, содержащий акцепторный и/или донорный участок для сортазы и/или поддающуюся детекции метку, конъюгированную с ним, и аминокислотную последовательность, которая содержит L(A/P/S)X(T/S/A/C)Gn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1, L(A/P/S)X(T/S/A/C)An, где X представляет собой любую аминокислоту и n равен по меньшей мере 1, NPQTN, YPRTG, IPQTG, VPDTG, LPXTGS, где X представляет собой любую аминокислоту, NPKTG, XPETG, LGATG, IPNTG, IPETG, NSKTA, NPQTG, NAKTN, NPQSS, LPXTX, где X представляет собой любую аминокислоту, NPX1TX2, где X1 представляет собой Lys или Gln и X2 представляет собой Asn, Asp или Gly, X1PX2X3G, где X1 представляет собой Leu, Ile, Val или Met, X2 представляет собой любую аминокислоту и X3 представляет собой Ser, Thr или Ala, LPEX1G, где X1 представляет собой Ala, Cys или Ser, LPXS, LAXT, MPXT, MPXTG, LAXS, NPXT, NPXTG, NAXT, NAXTG, NAXS, NAXSG, LPXP, LPXPG, где X представляет собой любую аминокислоту, LRXTGn или LPAXGn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1 (более предпочтительно L(A/P/S)X(T/S/A/C)Gn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1) и где полипептид дополнительно содержит полипептидную последовательность, обладающую по меньшей мере 70% идентичностью последовательности с SEQ ID NO: 38. В одном варианте осуществления полипептид по изобретению может представлять собой полипептид, содержащий акцепторный и/или донорный участок для сортазы и/или поддающуюся детекции метку, конъюгированную с ним, и аминокислотную последовательность, которая содержит L(A/P/S)X(T/S/A/C)Gn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1, L(A/P/S)X(T/S/A/C)An, где X представляет собой любую аминокислоту и n равен по меньшей мере 1, NPQTN, YPRTG, IPQTG, VPDTG, LPXTGS, где X представляет собой любую аминокислоту, NPKTG, XPETG, LGATG, IPNTG, IPETG, NSKTA, NPQTG, NAKTN, NPQSS, LPXTX, где X представляет собой любую аминокислоту, NPX1TX2, где X1 представляет собой Lys или Gln и X2 представляет собой Asn, Asp или Gly, X1PX2X3G, где X1 представляет собой Leu, Ile, Val или Met, X2 представляет собой любую аминокислоту и X3 представляет собой Ser, Thr или Ala, LPEX1G, где X1 представляет собой Ala, Cys или Ser, LPXS, LAXT, MPXT, MPXTG, LAXS, NPXT, NPXTG, NAXT, NAXTG, NAXS, NAXSG, LPXP, LPXPG, где X представляет собой любую аминокислоту, LRXTGn или LPAXGn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1 (более предпочтительно L(A/P/S)X(T/S/A/C)Gn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1) и где полипептид дополнительно содержит полипептидную последовательность, обладающую по меньшей мере 80% или 90% идентичностью последовательности с SEQ ID NO: 38. Предпочтительно полипептид по изобретению может представлять собой полипептид, содержащий акцепторный и/или донорный участок для сортазы и/или поддающуюся детекции метку, конъюгированную с ним, и аминокислотную последовательность, которая содержит L(A/P/S)X(T/S/A/C)Gn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1, L(A/P/S)X(T/S/A/C)An, где X представляет собой любую аминокислоту и n равен по меньшей мере 1, NPQTN, YPRTG, IPQTG, VPDTG, LPXTGS, где X представляет собой любую аминокислоту, NPKTG, XPETG, LGATG, IPNTG, IPETG, NSKTA, NPQTG, NAKTN, NPQSS, LPXTX, где X представляет собой любую аминокислоту, NPX1TX2, где X1 представляет собой Lys или Gln и X2 представляет собой Asn, Asp или Gly, X1PX2X3G, где X1 представляет собой Leu, Ile, Val или Met, X2 представляет собой любую аминокислоту и X3 представляет собой Ser, Thr или Ala, LPEX1G, где X1 представляет собой Ala, Cys или Ser, LPXS, LAXT, MPXT, MPXTG, LAXS, NPXT, NPXTG, NAXT, NAXTG, NAXS, NAXSG, LPXP, LPXPG, где X представляет собой любую аминокислоту, LRXTGn или LPAXGn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1 (более предпочтительно L(A/P/S)X(T/S/A/C)Gn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1) и где полипептид дополнительно включает полипептид содержащий (более предпочтительно состоящий из) SEQ ID NO: 38.Alternatively, the polypeptide of the invention may be a polypeptide comprising an acceptor and/or donor site for sortase and/or a detectable label conjugated thereto and an amino acid sequence that contains L(A/P/S)X(T/S/A /C)Gnwhere X is any amino acid and n is at least 1, L(A/P/S)X(T/S/A/C)Anwhere X is any amino acid and n is at least 1, NPQTN, YPRTG, IPQTG, VPDTG, LPXTGS, where X is any amino acid, NPKTG, XPETG, LGATG, IPNTG, IPETG, NSKTA, NPQTG, NAKTN, NPQSS, LPXTX where X is any amino acid, NPX1TX2, where X1 is Lys or Gln and X2 is Asn, Asp or Gly, X1PX2X3G, where X1is Leu, Ile, Val or Met, X2is any amino acid and X3is Ser, Thr or Ala, LPEX1G, where X1 is Ala, Cys or Ser, LPXS, LAXT, MPXT, MPXTG, LAXS, NPXT, NPXTG, NAXT, NAXTG, NAXS, NAXSG, LPXP, LPXPG, where X is any amino acid, LRXTGn or LPAXGn, where X is any amino acid and n is at least 1 (more preferably L(A/P/S)X(T/S/A/C)Gnwhere X is any amino acid and n is at least 1) and where the polypeptide further comprises a polypeptide sequence having at least 70% sequence identity with SEQ ID NO: 38. In one embodiment, the polypeptide of the invention may be a polypeptide, containing an acceptor and/or donor site for sortase and/or a detectable label conjugated to it, and an amino acid sequence that contains L(A/P/S)X(T/S/A/C)Gnwhere X is any amino acid and n is at least 1, L(A/P/S)X(T/S/A/C)Anwhere X is any amino acid and n is at least 1, NPQTN, YPRTG, IPQTG, VPDTG, LPXTGS, where X is any amino acid, NPKTG, XPETG, LGATG, IPNTG, IPETG, NSKTA, NPQTG, NAKTN, NPQSS, LPXTX where X is any amino acid, NPX1TX2, where X1 is Lys or Gln and X2 is Asn, Asp or Gly, X1PX2X3G, where X1is Leu, Ile, Val or Met, X2is any amino acid and X3is Ser, Thr or Ala, LPEX1G, where X1 is Ala, Cys or Ser, LPXS, LAXT, MPXT, MPXTG, LAXS, NPXT, NPXTG, NAXT, NAXTG, NAXS, NAXSG, LPXP, LPXPG, where X is any amino acid, LRXTGn or LPAXGn, where X is any amino acid and n is at least 1 (more preferably L(A/P/S)X(T/S/A/C)Gnwhere X is any amino acid and n is at least 1) and wherein the polypeptide further comprises a polypeptide sequence having at least 80% or 90% sequence identity with SEQ ID NO: 38. Preferably, the polypeptide of the invention may be a polypeptide containing an acceptor and/or donor site for sortase and/or a detectable label conjugated to it, and an amino acid sequence that contains L(A/P/S)X(T/S/A/C)Gnwhere X is any amino acid and n is at least 1, L(A/P/S)X(T/S/A/C)Anwhere X is any amino acid and n is at least 1, NPQTN, YPRTG, IPQTG, VPDTG, LPXTGS, where X is any amino acid, NPKTG, XPETG, LGATG, IPNTG, IPETG, NSKTA, NPQTG, NAKTN, NPQSS, LPXTX where X is any amino acid, NPX1TX2, where X1 is Lys or Gln and X2 is Asn, Asp or Gly, X1PX2X3G, where X1is Leu, Ile, Val or Met, X2is any amino acid and X3is Ser, Thr or Ala, LPEX1G, where X1 is Ala, Cys or Ser, LPXS, LAXT, MPXT, MPXTG, LAXS, NPXT, NPXTG, NAXT, NAXTG, NAXS, NAXSG, LPXP, LPXPG, where X is any amino acid, LRXTGn or LPAXGn, where X is any amino acid and n is at least 1 (more preferably L(A/P/S)X(T/S/A/C)Gnwhere X is any amino acid and n is at least 1) and wherein the polypeptide further comprises a polypeptide comprising (more preferably consisting of) SEQ ID NO: 38.

Альтернативно полипептид по изобретению может представлять собой полипептид, содержащий акцепторный и/или донорный участок для сортазы и/или поддающуюся детекции метку, конъюгированную с ним, и аминокислотную последовательность, которая содержит L(A/P/S)X(T/S/A/C)Gn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1, L(A/P/S)X(T/S/A/C)An, где X представляет собой любую аминокислоту и n равен по меньшей мере 1, NPQTN, YPRTG, IPQTG, VPDTG, или LPXTGS, где X представляет собой любую аминокислоту (более предпочтительно L(A/P/S)X(T/S/A/C)Gn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1) и где полипептид дополнительно содержит полипептидную последовательность, обладающую по меньшей мере 70% идентичностью последовательности с SEQ ID NO: 38. В одном варианте осуществления полипептид по изобретению может представлять собой полипептид, содержащий акцепторный и/или донорный участок для сортазы и/или поддающуюся детекции метку, конъюгированную с ним, и аминокислотную последовательность, которая содержит L(A/P/S)X(T/S/A/C)Gn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1, L(A/P/S)X(T/S/A/C)An, где X представляет собой любую аминокислоту и n равен по меньшей мере 1, NPQTN, YPRTG, IPQTG, VPDTG, или LPXTGS, где X представляет собой любую аминокислоту (более предпочтительно L(A/P/S)X(T/S/A/C)Gn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1) и где полипептид дополнительно содержит полипептидную последовательность, обладающую по меньшей мере 80% или 90% идентичностью последовательности с SEQ ID NO: 38. Предпочтительно полипептид по изобретению может представлять собой полипептид, содержащий акцепторный и/или донорный участок для сортазы и/или поддающуюся детекции метку, конъюгированную с ним, и аминокислотную последовательность, которая содержит L(A/P/S)X(T/S/A/C)Gn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1, L(A/P/S)X(T/S/A/C)An, где X представляет собой любую аминокислоту и n равен по меньшей мере 1, NPQTN, YPRTG, IPQTG, VPDTG, или LPXTGS, где X представляет собой любую аминокислоту (более предпочтительно L(A/P/S)X(T/S/A/C)Gn, где X представляет собой любую аминокислоту и n равен по меньшей мере 1) и где полипептид дополнительно включает полипептид содержащий (более предпочтительно состоящий из) SEQ ID NO: 38.Alternatively, the polypeptide of the invention may be a polypeptide comprising an acceptor and/or donor site for sortase and/or a detectable label conjugated thereto and an amino acid sequence that contains L(A/P/S)X(T/S/A /C)G n where X is any amino acid and n is at least 1, L(A/P/S)X(T/S/A/C)A n where X is any amino acid and n is at least 1, NPQTN, YPRTG, IPQTG, VPDTG, or LPXTGS, where X is any amino acid (more preferably L(A/P/S)X(T/S/A/C)G n , where X is any amino acid and n is at least 1) and wherein the polypeptide further comprises a polypeptide sequence having at least 70% sequence identity with SEQ ID NO: 38. In one embodiment, the polypeptide of the invention may be a polypeptide containing an acceptor and/or a sortase donor site and/or a detectable label conjugated thereto, and an amino acid sequence that contains L(A/P/S)X(T/S/A/C)G n , where X is any amino acid and n is at least 1, L(A/P/S)X(T/S/A/C)A n , where X is any amino acid and n is at least 1, NPQTN, YPRTG, IPQTG, VPDTG, or LPXTGS where X is any amino acid (more preferably L(A/P/S)X(T/S/A/C)G n where X is any amino acid and n is at least 1) and where the polypeptide is further contains a polypeptide sequence having at least 80% or 90% sequence identity with SEQ ID NO: 38. Preferably, the polypeptide of the invention may be a polypeptide containing an acceptor and/or donor site for sortase and/or a detectable label conjugated to it , and an amino acid sequence that contains L(A/P/S)X(T/S/A/C)G n , where X is any amino acid and n is at least 1, L(A/P/S) X(T/S/A/C)A n where X is any amino acid and n is at least 1, NPQTN, YPRTG, IPQTG, VPDTG, or LPXTGS where X is any amino acid (more preferably L(A /P/S)X(T/S/A/C)G n , where X is any amino acid and n is at least 1) and where the polypeptide further comprises a polypeptide comprising (more preferably consisting of) SEQ ID NO: 38 .

Полипептиды, описанные в настоящем описании (или нуклеотидные последовательности, кодирующие их) могут содержать одну или несколько меток (например, меток для очистки), таких как His-метка или Strep-метка. Подразумевается, что настоящее изобретение также охватывает полипептидные последовательности (и нуклеотидные последовательности, кодирующие их), из которых метка удалена, например, перед их применением. Полипептид также может содержать один или несколько участков расщепления, таких как участок расщепления TEV, для упрощения удаления метки.The polypeptides described herein (or the nucleotide sequences encoding them) may contain one or more tags (eg, purification tags), such as a His tag or a Strep tag. The present invention is also intended to cover polypeptide sequences (and the nucleotide sequences encoding them) that have been delabeled, for example, prior to their use. The polypeptide may also contain one or more cleavage sites, such as a TEV cleavage site, to facilitate label removal.

Настоящее изобретение является пригодным для применения для многих различных типов клостридиального нейротоксина. Таким образом, в контексте настоящего изобретения, термин "клостридиальный нейротоксин" охватывает токсины, продуцируемые C. botulinum (ботулинический нейротоксин серотипов A, B, C1, D, E, F, G, H и X), C. tetani (столбнячный нейротоксин), C. butyricum (ботулинический нейротоксин серотипа E), и C. baratii (ботулинический нейротоксин серотипа F), а также модифицированные клостридиальные нейротоксины или производные, происходящие из любого из вышеуказанных. Термин "клостридиальный нейротоксин" также охватывает ботулинический нейротоксин серотипа H. Предпочтительно клостридиальный нейротоксин не является BoNT/C1.The present invention is applicable to many different types of clostridial neurotoxin. Thus, in the context of the present invention, the term "clostridial neurotoxin" encompasses toxins produced by C. botulinum (botulinum neurotoxin serotypes A, B, C1, D, E, F, G, H and X), C. tetani (tetanus neurotoxin) , C. butyricum (botulinum neurotoxin serotype E), and C. baratii (botulinum neurotoxin serotype F), as well as modified clostridial neurotoxins or derivatives derived from any of the above. The term "clostridial neurotoxin" also encompasses botulinum neurotoxin serotype H. Preferably, the clostridial neurotoxin is not BoNT/C1.

Ботулинический нейротоксин (BoNT) продуцируется C. botulinum в форме крупного белкового комплекса, состоящего из самого BoNT в комплексе с рядом вспомогательных белков. В настоящее время существует девять различных классов ботулинического нейротоксина, а именно: серотипы ботулинического нейротоксина A, B, C1, D, E, F, G, H и X, все из которых обладают сходными структурами и способами действия. Различные серотипы BoNT могут различаться на основе инактивации посредством специфической нейтрализующей антисыворотки, причем такая классификация по серотипам коррелирует с процентной идентичностью последовательностей на уровне аминокислот. Белки BoNT данного серотипа далее подразделяют на различные серотипы на основе процентной идентичности аминокислотных последовательностей.Botulinum neurotoxin (BoNT) is produced by C. botulinum in the form of a large protein complex consisting of BoNT itself in complex with a number of accessory proteins. There are currently nine different classes of botulinum neurotoxin, namely botulinum neurotoxin serotypes A, B, C1, D, E, F, G, H, and X, all of which have similar structures and modes of action. Different BoNT serotypes can differ based on inactivation by a specific neutralizing antiserum, with such serotype classification correlated with percent sequence identity at the amino acid level. BoNT proteins of a given serotype are further subdivided into different serotypes based on percent amino acid sequence identity.

BoNT всасываются в желудочно-кишечном тракте и после проникновения в общий кровоток связываются с пресинаптической мембраной холинэргических нервных окончаний и препятствует высвобождению их нейротрансмиттера ацетилхолина. BoNT/B, BoNT/D, BoNT/F и BoNT/G расщепляют синаптобревин/ассоциированный с везикулами белок (VAMP); BoNT/C1, BoNT/A и BoNT/E расщепляют ассоциированный с синаптосомами белок размером 25 кДа (SNAP-25); и BoNT/C1 расщепляет синтаксин. Было обнаружено, что BoNT/X расщепляет SNAP-25, VAMP1, VAMP2, VAMP3, VAMP4, VAMP5, Ykt6 и синтаксин 1.BoNTs are absorbed in the gastrointestinal tract and, after entering the general circulation, bind to the presynaptic membrane of cholinergic nerve endings and prevent the release of their neurotransmitter acetylcholine. BoNT/B, BoNT/D, BoNT/F and BoNT/G cleave synaptobrevin/vesicle-associated protein (VAMP); BoNT/C1, BoNT/A, and BoNT/E cleave a 25 kDa synaptosome-associated protein (SNAP-25); and BoNT/C1 cleaves the syntaxin. BoNT/X has been found to cleave SNAP-25, VAMP1, VAMP2, VAMP3, VAMP4, VAMP5, Ykt6, and syntaxin 1.

Столбнячный токсин продуцируется в одном серотипе C. tetani. C. butyricum продуцируют BoNT/E, в то время как C. baratii продуцируют BoNT/F.Tetanus toxin is produced in one serotype of C. tetani. C. butyricum produce BoNT/E while C. baratii produce BoNT/F.

Также подразумевается, что термин "клостридиальный нейротоксин" охватывает модифицированные клостридиальные нейротоксины и их производные, включая, но не ограничиваясь ими, нейротоксины, описанные ниже. Модифицированный клостридиальный нейротоксин или производное может содержать одну или несколько аминокислот, которые модифицированы по сравнению с нативной (немодифицированной) формой клостридиального нейротоксина, или может содержать одну или несколько встроенных аминокислот, которые не присутствуют в нативной (немодифицированной) форме клостридиального нейротоксина. В качестве примера, модифицированный клостридиальный нейротоксин может иметь модифицированные аминокислотные последовательности в одном или нескольких доменах относительно нативной (немодифицированной) последовательности клостридиального нейротоксина. Такие модификации могут модифицировать функциональные аспекты токсина, например биологическую активность или стабильность. Таким образом, в одном варианте осуществления полипептид по изобретению представляет собой модифицированный клостридиальный нейротоксин или модифицированное производное клостридиального нейротоксина, или производное клостридиального нейротоксина.The term "clostridial neurotoxin" is also intended to encompass modified clostridial neurotoxins and their derivatives, including, but not limited to, the neurotoxins described below. The modified clostridial neurotoxin or derivative may contain one or more amino acids that are modified from the native (unmodified) form of the clostridial neurotoxin, or may contain one or more built-in amino acids that are not present in the native (unmodified) form of the clostridial neurotoxin. As an example, a modified clostridial neurotoxin may have modified amino acid sequences in one or more domains relative to a native (unmodified) clostridial neurotoxin sequence. Such modifications may modify the functional aspects of the toxin, such as biological activity or stability. Thus, in one embodiment, the polypeptide of the invention is a modified clostridial neurotoxin, or a modified clostridial neurotoxin derivative, or a clostridial neurotoxin derivative.

Модифицированный клостридиальный нейротоксин может иметь одну или несколько модификаций в аминокислотной последовательности тяжелой цепи (такой как модифицированный домен HC), где указанная модифицированная тяжелая цепь связывается с нервными клетками, являющимися мишенями, с более высокой или более низкой аффинностью, чем нативный (немодифицированный) клостридиальный нейротоксин. Такие модификации в HC-домене могут включать модификацию остатков в ганглиозид-связывающем участке HC-домена или в связывающем белок (SV2 или синаптотагмин) участке, которая изменяет связывание с рецептором ганглиозида и/или рецептором белка нервной клетки, являющейся мишенью. Примеры таких модифицированных клостридиальных нейротоксинов описаны в WO 2006/027207 и WO 2006/114308, обе из которых включены в настоящее описание в качестве ссылок в полном объеме.The modified clostridial neurotoxin may have one or more modifications in the amino acid sequence of the heavy chain (such as a modified HC domain) wherein said modified heavy chain binds to target nerve cells with higher or lower affinity than native (unmodified) clostridial neurotoxin. Such modifications in the HC domain may include modification of residues in the ganglioside-binding region of the HC domain or protein-binding (SV2 or synaptotagmin) region that alters binding to the ganglioside receptor and/or protein receptor of the target nerve cell. Examples of such modified clostridial neurotoxins are described in WO 2006/027207 and WO 2006/114308, both of which are incorporated herein by reference in their entirety.

Модифицированный клостридиальный нейротоксин может иметь одну или несколько модификаций в аминокислотной последовательности легкой цепи, например, модификации в связывающем субстрат или каталитическом домене, которые могут изменять или модифицировать специфичность модифицированной L-цепи в отношении белка SNARE. Примеры таких модифицированных клостридиальных нейротоксинов описаны в WO 2010/120766 и US 2011/0318385, обе из которых включены в настоящее описание в качестве ссылок в полном объеме.The modified clostridial neurotoxin may have one or more modifications in the amino acid sequence of the light chain, such as modifications in the substrate binding or catalytic domain, which may alter or modify the specificity of the modified L chain for the SNARE protein. Examples of such modified clostridial neurotoxins are described in WO 2010/120766 and US 2011/0318385, both of which are incorporated herein by reference in their entirety.

Модифицированный клостридиальный нейротоксин может содержать одну или несколько модификаций, которые повышают или снижают биологическую активность и/или биологическую стабильность модифицированного клостридиального нейротоксина. Например, модифицированный клостридиальный нейротоксин может содержать мотив на основе лейцина или тирозина, где указанный мотив повышает или снижает биологическую активность и/или биологическую стабильность модифицированного клостридиального нейротоксина. Подходящие мотивы на основе лейцина включают xDxxxLL (SEQ ID NO: 79), xExxxLL (SEQ ID NO: 80), xExxxIL (SEQ ID NO: 81) и xExxxLM (SEQ ID NO: 82) (где x представляет собой любую аминокислоту). Подходящие мотивы на основе тирозина включают Y-x-x-Hy (SEQ ID NO: 83) (где Hy представляет собой гидрофобную аминокислоту). Примеры модифицированных клостридиальных нейротоксинов, содержащих мотивы на основе лейцина и тирозина, описаны в WO 2002/08268, которая включена в настоящее описание в качестве ссылки в полном объеме.The modified clostridial neurotoxin may contain one or more modifications that increase or decrease the biological activity and/or biological stability of the modified clostridial neurotoxin. For example, the modified clostridial neurotoxin may comprise a leucine or tyrosine-based motif, wherein said motif increases or decreases the biological activity and/or biological stability of the modified clostridial neurotoxin. Suitable leucine-based motifs include xDxxxLL (SEQ ID NO: 79), xExxxLL (SEQ ID NO: 80), xExxxIL (SEQ ID NO: 81) and xExxxLM (SEQ ID NO: 82) (where x is any amino acid). Suitable tyrosine-based motifs include Y-x-x-Hy (SEQ ID NO: 83) (where Hy is a hydrophobic amino acid). Examples of modified clostridial neurotoxins containing leucine and tyrosine motifs are described in WO 2002/08268, which is incorporated herein by reference in its entirety.

Подразумевается, что термин "клостридиальный нейротоксин" охватывает гибридные и химерные клостридиальные нейротоксины. Гибридный клостридиальный нейротоксин содержит по меньшей мере часть легкой цепи из одного клостридиального нейротоксина или его подтипа, и по меньшей мере часть тяжелой цепи из другого клостридиального нейротоксина или подтипа клостридиального нейротоксина. В одном варианте осуществления гибридный клостридиальный нейротоксин может содержать всю легкую цепь из одного подтипа клостридиального нейротоксина и тяжелую цепь из другого подтипа клостридиального нейротоксина. В другом варианте осуществления химерный клостридиальный нейротоксин может содержать часть (например, связывающий домен) тяжелой цепи одного подтипа клостридиального нейротоксина, причем другая часть тяжелой цепи происходит из другого подтипа клостридиального нейротоксина. Аналогично или альтернативно, терапевтический элемент может содержать части легких цепей из различных клостридиальных нейротоксинов. Такие гибридные или химерные клостридиальные нейротоксины являются пригодными, например, в качестве средств для обеспечения терапевтической пользы таких клостридиальных нейротоксинов у пациентов, которые являются иммунологически резистентными к данному подтипу клостридиального нейротоксина, у пациентов, которые могут иметь более низкую чем средняя концентрация рецепторов к данному связывающему тяжелую цепь домену клостридиального нейротоксина, или у пациентов, которые могут иметь резистентный к протеазам вариант мембранного или везикулярного субстрата токсина (например, SNAP-25, VAMP и синтаксин). Гибридные и химерные клостридиальные нейротоксины описаны в US 8071110, которая включена в настоящее описание в качестве ссылки в полном объеме. Таким образом, в одном варианте осуществления сконструированный клостридиальный нейротоксин по изобретению представляет собой сконструированный гибридный клостридиальный нейротоксин или сконструированный химерный клостридиальный нейротоксин.The term "clostridial neurotoxin" is intended to encompass hybrid and chimeric clostridial neurotoxins. The hybrid clostridial neurotoxin comprises at least a portion of a light chain from one clostridial neurotoxin or subtype thereof and at least a portion of a heavy chain from another clostridial neurotoxin or clostridial neurotoxin subtype. In one embodiment, the hybrid clostridial neurotoxin may comprise an entire light chain from one clostridial neurotoxin subtype and a heavy chain from another clostridial neurotoxin subtype. In another embodiment, the chimeric clostridial neurotoxin may comprise a portion (eg, a binding domain) of the heavy chain of one clostridial neurotoxin subtype, with the other portion of the heavy chain derived from a different clostridial neurotoxin subtype. Similarly or alternatively, the therapeutic element may comprise light chain portions from various clostridial neurotoxins. Such hybrid or chimeric clostridial neurotoxins are useful, for example, as a means to provide therapeutic benefit of such clostridial neurotoxins in patients who are immunologically resistant to a given clostridial neurotoxin subtype, in patients who may have a lower than average concentration of receptors for a given heavy binding chain domain of a clostridial neurotoxin, or in patients who may have a protease-resistant variant of the toxin's membrane or vesicular substrate (eg, SNAP-25, VAMP, and syntaxin). Hybrid and chimeric clostridial neurotoxins are described in US 8071110, which is incorporated herein by reference in its entirety. Thus, in one embodiment, the engineered clostridial neurotoxin of the invention is an engineered hybrid clostridial neurotoxin or an engineered chimeric clostridial neurotoxin.

Также предусматривается, что термин "клостридиальный нейротоксин" охватывает вновь открытые представители белкового семейства ботулинических нейротоксинов, экспрессируемые неклостридиальными микроорганизмами, такие как кодируемый Enterococcus токсин, который имеет наиболее высокую идентичность последовательности с BoNT/X, кодируемый Weissella oryzae токсин, называемый BoNT/Wo (NCBI Ref Seq: WP_027699549.1), который расщепляет VAMP2 в W89-W90, кодируемый Enterococcus faecium токсин (GenBank: OTO22244.1), который расщепляет VAMP2 и SNAP25, и кодируемый Chryseobacterium pipero токсин (NCBI Ref.Seq: WP_034687872.1).The term "clostridial neurotoxin" is also intended to cover newly discovered members of the botulinum neurotoxin protein family expressed by non-clostridial microorganisms, such as the Enterococcus encoded toxin which has the highest sequence identity with BoNT/X, the Weissella oryzae encoded toxin referred to as BoNT/Wo (NCBI Ref Seq: WP_027699549.1) which cleaves VAMP2 in W89-W90, Enterococcus faecium encoded toxin (GenBank: OTO22244.1) which cleaves VAMP2 and SNAP25, and Chryseobacterium pipero encoded toxin (NCBI Ref. Seq: WP_034687872.1).

"Биологически активный" компонент полипептидов по настоящему изобретению обеспечивается нецитотоксической протеазой. Эта обособленная группа протеаз действует посредством протеолитического расщепления внутриклеточных транспортных белков, известных как белки SNARE (например, SNAP-25, VAMP или синтаксин) - см. Gerald K (2002) "Cell and Molecular Biology" (4th edition) John Wiley & Sons, Inc. Сокращенное название SNARE происходит из термина "рецептор, связывающий растворимый NSF (Soluble NSF Attachment Receptor)", где NSF означает N-этилмалеинимид-чувствительный фактор (N-ethylmaleimide-Sensitive Factor). Белки SNARE необходимы для образования внутриклеточных везикул и, таким образом, для секреции молекулы посредством везикулярного транспорта из клетки. Таким образом, после доставки в желаемую клетку-мишень нецитотоксическая протеаза способна ингибировать клеточную секрецию из клетки-мишени.The "bioactive" component of the polypeptides of the present invention is provided by a non-cytotoxic protease. This distinct group of proteases act through the proteolytic cleavage of intracellular transport proteins known as SNARE proteins (e.g. SNAP-25, VAMP or syntaxin) - see Gerald K (2002) "Cell and Molecular Biology" ( 4th edition) John Wiley & Sons , Inc. The abbreviated name SNARE comes from the term "Soluble NSF Attachment Receptor", where NSF stands for N-ethylmaleimide-sensitive factor (N-ethylmaleimide-Sensitive Factor). SNARE proteins are required for the formation of intracellular vesicles and thus for secretion of the molecule via vesicular transport out of the cell. Thus, once delivered to the desired target cell, the non-cytotoxic protease is able to inhibit cellular secretion from the target cell.

Нецитотоксические протеазы представляют собой обособленный класс молекул, которые не уничтожают клетки; вместо этого, они действуют, ингибируя клеточные процессы, отличные от синтеза белков. Нецитотоксические протеазы продуцируются в качестве части более крупной молекулы токсина различными растениями и различными микроорганизмами, такими как Clostridium sp. и Neisseria sp.Non-cytotoxic proteases are a distinct class of molecules that do not kill cells; instead, they act by inhibiting cellular processes other than protein synthesis. Non-cytotoxic proteases are produced as part of a larger toxin molecule by various plants and various microorganisms such as Clostridium sp. and Neisseria sp.

Клостридиальные нейротоксины представляют собой большую группу нецитотоксических молекул токсинов, и они содержат две полипептидных цепи, соединенных вместе дисульфидной связью. Две цепи называются тяжелой цепью (H-цепь), которая имеет молекулярную массу приблизительно 100 кДа, и легкой цепью (L-цепь), которая имеет молекулярную массу приблизительно 50 кДа. Она представляет собой L-цепь, которая обладает функцией протеазы и демонстрирует высокую субстратную специфичность в отношении белков, ассоциированных с везикулами и/или плазматической мембраной (SNARE), вовлеченных в экзоцитарный процесс (например, синаптобревин, синтаксин или SNAP-25). Эти субстраты являются важными компонентами неейросекреторного аппарата.Clostridial neurotoxins are a large group of non-cytotoxic toxin molecules and they contain two polypeptide chains linked together by a disulfide bond. The two chains are called the heavy chain (H chain), which has a molecular weight of approximately 100 kDa, and the light chain (L chain), which has a molecular weight of approximately 50 kDa. It is an L chain that has protease function and exhibits high substrate specificity for vesicle and/or plasma membrane associated proteins (SNARE) involved in the exocytic process (eg synaptobrevin, syntaxin or SNAP-25). These substrates are important components of the neurosecretory apparatus.

Neisseria sp., особенно важно вида N. gonorrhoeae, и Streptococcus sp., особенно важно вида S. pneumoniae, продуцируют функционально сходные нецитотоксические молекулы токсинов. Примером такой нецитотоксической протеазы является IgA-протеаза (см. WO99/58571, которая включена в настоящее описание в качестве ссылки в полном объеме). Таким образом, нецитотоксическая протеаза по настоящему изобретению предпочтительно представляет собой протеазу клостридиального нейротоксина или IgA-протеазу.Neisseria sp., especially N. gonorrhoeae species, and Streptococcus sp., especially S. pneumoniae species, produce functionally similar non-cytotoxic toxin molecules. An example of such a non-cytotoxic protease is the IgA protease (see WO99/58571, which is incorporated herein by reference in its entirety). Thus, the non-cytotoxic protease of the present invention is preferably a clostridial neurotoxin protease or an IgA protease.

Обращаясь далее к компоненту в виде нацеливающей части (TM) по настоящему изобретению, именно этот компонент связывает полипептид по настоящему изобретению с клеткой-мишенью.Referring further to the targeting portion (TM) component of the present invention, it is this component that binds the polypeptide of the present invention to the target cell.

Таким образом, TM по настоящему изобретению связывается с рецептором на клетке-мишени. В качестве примера, TM по настоящему изобретению может связываться с рецептором на нейрональной клетке, таким как рецептор на чувствительном или двигательном нейроне. Альтернативно TM по настоящему изобретению может связываться с рецептором EGF. В одном варианте осуществления клетка-мишень представляет собой нейрональную клетку, такую как двигательный или чувствительный нейрон. В другом варианте осуществления клетка-мишень представляет собой клетку, экспрессирующую рецептор EGF. Однако специалист в данной области может выбрать пептид TM для нацеливания на выбранную клетку-мишень на основе присутствия участка связывания (например, рецептор клеточной поверхности) для указанного пептида на клетке-мишени.Thus, the TM of the present invention binds to a receptor on the target cell. As an example, the TM of the present invention can bind to a receptor on a neuronal cell, such as a receptor on a sensory or motor neuron. Alternatively, the TM of the present invention may bind to the EGF receptor. In one embodiment, the target cell is a neuronal cell, such as a motor or sensory neuron. In another embodiment, the target cell is a cell that expresses the EGF receptor. However, one of skill in the art can select a TM peptide to target a selected target cell based on the presence of a binding site (eg, cell surface receptor) for said peptide on the target cell.

В одном варианте осуществления полипептид по изобретению может содержать TM, содержащий один или несколько из следующих пептидов: пептид рилизинг-фактора гормона роста (GHRH), пептид соматостатина, пептид кортистатина, пептид грелина, пептид бомбезина, пептид уротензина, пептид меланин-концентрирующего гормона, пептид KISS-1, пептид гонадотропин-рилизинг гормона (GnRH) или пролактин-рилизинг пептид. Указанные TM и полипептиды, содержащие их, описаны в WO 2009/150469, которая включена в настоящее описание в качестве ссылки.In one embodiment, the polypeptide of the invention may comprise a TM comprising one or more of the following peptides: growth hormone releasing factor (GHRH) peptide, somatostatin peptide, cortistatin peptide, ghrelin peptide, bombesin peptide, urotensin peptide, melanin concentrating hormone peptide, KISS-1 peptide, gonadotropin-releasing hormone (GnRH) peptide, or prolactin-releasing peptide. These TMs and polypeptides containing them are described in WO 2009/150469, which is incorporated herein by reference.

В одном варианте осуществления полипептид по изобретению может содержать TM, содержащую один или несколько из следующих пептидов: пептид лептина, пептид инсулиноподобного фактора роста (IGF), пептид трансформирующего фактора роста (TGF), пептид суперсемейства VIP-глюкагон-GRF-секретин, пептид PACAP, вазоактивный интестинальный пептид (VIP), пептид орексина, пептид интерлейкина, пептид фактора роста нервов (NGF), пептид сосудисто-эндотелиального фактора роста (VEGF), пептид гормона щитовидной железы, пептид эстрогена, пептид ErbB, пептид эпидермального фактора роста (EGF), химерный пептид EGF и TGF-α, пептид амфирегулина, пептид бетацеллюлина, пептид эпигена, пептид эпирегулина, пептид гепарин-связывающего EGF (HB-EGF), пептид бомбезина, пептид уротензина, пептид меланин-концентрирующего гормона (MCH), пептид Kisspeptin-10, пептид Kisspeptin-54, пептид кортикотропин-рилизинг гормона, пептид урокортина 1 или пептид урокортина 2. Указанные TM и полипептиды, содержащие их, описаны в WO2009/150470, которая включена в настоящее описание в качестве ссылки.In one embodiment, a polypeptide of the invention may comprise a TM comprising one or more of the following peptides: leptin peptide, insulin like growth factor (IGF) peptide, transforming growth factor (TGF) peptide, VIP-glucagon-GRF-secretin superfamily peptide, PACAP peptide , vasoactive intestinal peptide (VIP), orexin peptide, interleukin peptide, nerve growth factor (NGF) peptide, vascular endothelial growth factor (VEGF) peptide, thyroid hormone peptide, estrogen peptide, ErbB peptide, epidermal growth factor (EGF) peptide , EGF-TGF-α chimeric peptide, amphiregulin peptide, betacellulin peptide, epigen peptide, epiregulin peptide, heparin-binding EGF (HB-EGF) peptide, bombesin peptide, urotensin peptide, melanin-concentrating hormone (MCH) peptide, Kisspeptin- 10, Kisspeptin-54 peptide, corticotropin-releasing hormone peptide, urocortin 1 peptide, or urocortin 2 peptide. These TMs and polypeptides containing them are described in WO2009/150470, which is incorporated herein by reference.

В другом варианте осуществления полипептид по изобретению может содержать TM, содержащую один или несколько из следующих: тиреостимулирующий гормон (TSH); антитела к рецептору TSH; антитела к специфическому для островков моносиалоганглиозиду, GM2-1; инсулин, инсулиноподобный фактор роста и антитела к рецепторам обоих из них; рилизинг-гормон TSH (протирелин) и антитела к его рецептору; рилизинг-гормон FSH/LH (гонадорелин) и антитела к его рецептору; кортикотрофин-рилизинг гормон (CRH) и антитела к его рецептору; и ACTH и антитела к его рецептору. Указанные TM и полипептиды, содержащие их, описаны в WO 01/21213, которая включена в настоящее описание в качестве ссылки.In another embodiment, the polypeptide of the invention may comprise a TM containing one or more of the following: thyroid stimulating hormone (TSH); antibodies to the TSH receptor; antibodies to islet-specific monosialoganglioside, GM2-1; insulin, insulin-like growth factor and antibodies to the receptors of both of them; releasing hormone TSH (protirelin) and antibodies to its receptor; releasing hormone FSH/LH (gonadorelin) and antibodies to its receptor; corticotrophin-releasing hormone (CRH) and antibodies to its receptor; and ACTH and antibodies to its receptor. These TMs and polypeptides containing them are described in WO 01/21213, which is incorporated herein by reference.

Полипептиды по настоящему изобретению могут содержать 3 основных компонента: нецитотоксическая протеаза или ее протеолитически неактивный мутант; TM и домен транслокации. Основную технологию, ассоциированную с получением таких слитых белков, также называют технологией перенацеленных токсинов. В качестве примера, см.: WO94/21300; WO96/33273; WO98/07864; WO00/10598; WO01/21213; WO06/059093; WO00/62814; WO00/04926; WO93/15766; WO00/61192 и WO99/58571. Все из этих публикаций включены в настоящее описание в качестве ссылок.The polypeptides of the present invention may contain 3 main components: a non-cytotoxic protease or a proteolytically inactive mutant thereof; TM and translocation domain. The core technology associated with making such fusion proteins is also referred to as retargeted toxin technology. For an example, see: WO94/21300; WO96/33273; WO98/07864; WO00/10598; WO01/21213; WO06/059093; WO00/62814; WO00/04926; WO93/15766; WO00/61192 and WO99/58571. All of these publications are incorporated herein by reference.

Более подробно, компонент TM по настоящему изобретению может быть слит либо с протеазным компонентом, либо с компонентом транслокации по настоящему изобретению. Указанное слияние предпочтительно осуществляют посредством ковалентной связи, например, либо прямо ковалентной связи, либо через спейсерную/линкерную молекулу. Протеазный компонент и компонент транслокации предпочтительно связаны вместе через ковалентную связь, например, либо прямую ковалентную связь, либо через спейсерную/линкерную молекулу. Подходящие спейсерные/линкерные молекулы хорошо известны в данной области, и, как правило, содержат последовательность на основе аминокислот длиной 5-40, предпочтительно 10-30 аминокислотных остатков.In more detail, the TM component of the present invention may be fused to either a protease component or a translocation component of the present invention. Said fusion is preferably carried out via a covalent bond, for example either a direct covalent bond or via a spacer/linker molecule. The protease component and the translocation component are preferably linked together via a covalent bond, eg either a direct covalent bond or a spacer/linker molecule. Suitable spacer/linker molecules are well known in the art and typically contain a sequence based on amino acids 5-40, preferably 10-30 amino acid residues in length.

Применяемые полипептиды имеют двухцепочечную конформацию, где протеазный компонент и компонент транслокации связаны вместе, предпочтительно через дисульфидную связь.The polypeptides used have a double chain conformation wherein the protease component and the translocation component are linked together, preferably via a disulfide bond.

Таким образом, полипептиды и меченые полипептиды по изобретению могут быть в одноцепочечной форме или двухцепочечной форме, предпочтительно в двухцепочечной форме.Thus, the polypeptides and labeled polypeptides of the invention may be in single chain form or double chain form, preferably in double chain form.

Полипептиды по настоящему изобретению можно получать посредством общепринятых способов химической конъюгации, которые хорошо известны специалисту в данной области. В качестве примера могут быть упомянуты Hermanson, G.T. (1996), Bioconjugate techniques, Academic Press, and to Wong, S.S. (1991), Chemistry of protein conjugation and cross-linking, CRC Press, Nagy et al., PNAS 95 p1794-99 (1998). Дополнительные детальные методологии для связывания синтетических TM с полипептидом по настоящему изобретению приведены, например, в EP0257742. Вышеупомянутые публикации, касающиеся конъюгации, включены в настоящее описание в качестве ссылок.The polypeptides of the present invention can be obtained by conventional methods of chemical conjugation, which are well known to the person skilled in the art. By way of example, Hermanson, G.T. (1996), Bioconjugate techniques, Academic Press, and to Wong, S.S. (1991), Chemistry of protein conjugation and cross-linking, CRC Press, Nagy et al., PNAS 95 p1794-99 (1998). Additional detailed methodologies for linking synthetic TMs to the polypeptide of the present invention are given, for example, in EP0257742. The aforementioned publications relating to conjugation are incorporated herein by reference.

Альтернативно полипептиды можно получать посредством рекомбинантного получения единого белка из слитых полипептидов (см., например, WO98/07864). Этот способ основан на бактериальном механизме in vivo, посредством которого получают нативный клостридиальный нейротоксин (т.е. голотоксин), и он приводит к слитому белку, имеющему следующую "упрощенную" структурную организацию:Alternatively, polypeptides can be obtained by recombinant production of a single protein from fused polypeptides (see, for example, WO98/07864). This method is based on an in vivo bacterial mechanism whereby native clostridial neurotoxin (i.e. holotoxin) is produced and results in a fusion protein having the following "simplified" structural organization:

NH2 - [протеазный компонент] - [компонент транслокации] - [TM] - COOHNH 2 - [protease component] - [translocation component] - [TM] - COOH

Согласно WO98/07864, TM помещают с C-концевой стороны слитого белка. Затем слитый белок активируют посредством обработки протеазой, которая осуществляет расщепление в участке между протеазным компонентом и компонентом транслокации. Таким образом, получают двухцепочечный белок, содержащий протеазный компонент в качестве единой полипептидной цепи, ковалентно связанной (через дисульфидный мостик) с другой единой полипептидной цепью, содержащей компонент транслокации плюс TM.According to WO98/07864, TM is placed on the C-terminal side of the fusion protein. The fusion protein is then activated by treatment with a protease which cleaves at the site between the protease component and the translocation component. Thus, a double-stranded protein is obtained containing the protease component as a single polypeptide chain, covalently linked (through a disulfide bridge) to another single polypeptide chain containing the translocation component plus TM.

Альтернативно, согласно WO06/059093, компонент TM слитого белка находится в середине линейной слитой белковой последовательности между участком расщепления протеазой и компонентом транслокации. Это приводит к тому, что TM связан с доменом транслокации (т.е. как и в случае нативного клостридиального голотоксина), хотя в этом случае порядок этих двух компонентов является обратным по отношению к нативному голотоксину. Последующее расщепление в участке расщепления протеазой экспонирует N-концевую часть TM и обеспечивает двухцепочечный полипептидный слитый белок.Alternatively, according to WO06/059093, the TM component of the fusion protein is located in the middle of the linear fusion protein sequence between the protease cleavage site and the translocation component. This results in the TM being associated with the translocation domain (ie, as in the case of the native clostridial holotoxin), although in this case the order of the two components is reversed with respect to the native holotoxin. Subsequent cleavage at the protease cleavage site exposes the N-terminal portion of TM and provides a double-stranded polypeptide fusion protein.

Вышеупомянутая последовательность(и) расщепления протеазой может быть внесена (и/ или любая собственная последовательность расщепления удалена) на уровне ДНК общепринятыми способами, такими как сайт-направленный мутагенез. Скрининг для подтверждения присутствия последовательностей расщепления можно проводить вручную или с помощью компьютерного программного обеспечения (например, программа MapDraw от DNASTAR, Inc.). В то время как можно использовать любой участок расщепления протеазой (т.е. клостридиальный или неклостридиальный), предпочтительными являются следующие:The above protease cleavage sequence(s) can be introduced (and/or any native cleavage sequence removed) at the DNA level by conventional methods such as site-directed mutagenesis. Screening to confirm the presence of cleavage sequences can be performed manually or using computer software (eg, MapDraw program from DNASTAR, Inc.). While any protease cleavage site (i.e. clostridial or non-clostridial) may be used, the following are preferred:

Энтерокиназа (DDDDK↓, SEQ ID NO: 84)Enterokinase (DDDDK↓, SEQ ID NO: 84)

Фактор Xa (IEGR↓ / IDGR↓, SEQ ID NO: 85 и 86)Factor Xa (IEGR↓ / IDGR↓, SEQ ID NOs: 85 and 86)

TEV (вирус гравировки табака) (ENLYFQ↓G, SEQ ID NO: 87)TEV (tobacco etch virus) (ENLYFQ↓G, SEQ ID NO: 87)

Тромбин (LVPR↓GS, SEQ ID NO: 88)Thrombin (LVPR↓GS, SEQ ID NO: 88)

PreScission (LEVLFQ↓GP, SEQ ID NO: 89).PreScission (LEVLFQ↓GP, SEQ ID NO: 89).

Дополнительные участки расщепления протеазой включают последовательности распознавания, которые расщепляются нецитотоксической протеазой, например, клостридиальным нейротоксином. Они включают последовательности распознавания белков SNARE (например, SNAP-25, синтаксин, VAMP), которые расщепляются нецитотоксическими протеазами, такими как клостридиальные нейротоксины. Конкретные примеры приведены в US2007/0166332, которая включена в настоящее описание в качестве ссылки в полном объеме.Additional protease cleavage sites include recognition sequences that are cleaved by a non-cytotoxic protease, such as clostridial neurotoxin. These include SNARE protein recognition sequences (eg, SNAP-25, syntaxin, VAMP) that are cleaved by non-cytotoxic proteases such as clostridial neurotoxins. Specific examples are given in US2007/0166332, which is incorporated herein by reference in its entirety.

Также под термином "участок расщепления протеазой" подразумевается интеин, который представляет собой саморасщепляющуюся последовательность. Реакция самосплайсинга является контролируемой, например, посредством варьирования концентрации присутствующего восстановителя. Вышеупомянутые "активационные" участка расщепления также могут использоваться в качестве "деструктивного" участка расщепления (рассмотренного ниже), если его намереваются включить в полипептид по настоящему изобретению.Also, the term "protease cleavage site" refers to intein, which is a self-cleaving sequence. The self-splicing reaction is controlled, for example by varying the concentration of the reducing agent present. The above "activation" cleavage sites can also be used as a "destructive" cleavage site (discussed below), if it is intended to be included in the polypeptide of the present invention.

В предпочтительном варианте осуществления слитый белок по настоящему изобретению может содержать одну или несколько N-концевых и/ или C-концевых меток для очистки. В то время как можно использовать любую метку для очистки, предпочтительными являются следующие:In a preferred embodiment, the fusion protein of the present invention may contain one or more N-terminal and/or C-terminal purification tags. While any label can be used for cleaning, the following are preferred:

His-метка (например 6×гистидин), предпочтительно в качестве C-концевой и/ или N-концевой метки,His tag (e.g. 6xhistidine), preferably as C-terminal and/or N-terminal tag,

MBP-метка (мальтоза-связывающий белок), предпочтительно в качестве N-концевой метки,MBP tag (maltose binding protein), preferably as N-terminal tag,

GST-метка (глутатион-S-трансфераза), предпочтительно в качестве N-концевой метки,GST tag (glutathione-S-transferase), preferably as an N-terminal tag,

His-MBP-метка, предпочтительно в качестве N-концевой метки,His-MBP tag, preferably as an N-terminal tag,

GST-MBP-метка, предпочтительно в качестве N-концевой метки,GST-MBP tag, preferably as N-terminal tag,

Тиоредоксиновая метка, предпочтительно в качестве N-концевой метки,Thioredoxin tag, preferably as N-terminal tag,

CBD-метка (хитин-связывающий домен), предпочтительно в качестве N-концевой метки.CBD tag (chitin binding domain), preferably as N-terminal tag.

В слитый белок может быть включена одна или несколько пептидных спейсерных/линкерных молекул. Например, пептидный спейсер может использоваться между меткой для очистки и остальной частью молекулы слитого белка.One or more peptide spacer/linker molecules may be included in the fusion protein. For example, a peptide spacer may be used between the purification label and the rest of the fusion protein molecule.

В одном аспекте изобретение относится к способу производства полипептида для мечения с использованием сортазы, причем способ включает:In one aspect, the invention relates to a method for producing a polypeptide for labeling using sortase, the method comprising:

a. предоставление последовательности нуклеиновой кислоты, кодирующей полипептид, где полипептид содержит:a. providing a nucleic acid sequence encoding a polypeptide, where the polypeptide contains:

i. нецитотоксическую протеазу или ее протеолитически неактивный мутант;i. a non-cytotoxic protease or a proteolytically inactive mutant thereof;

ii. нацеливающую часть (TM), которая способна связываться с участком связывания на клетке-мишени; иii. a targeting portion (TM) that is capable of binding to a binding site on a target cell; And

iii. домен транслокации; иiii. translocation domain; And

b. внесение акцепторного или донорного участка для сортазы в указанную нуклеиновую кислоту, тем самым получая модифицированную нуклеиновую кислоту, которая кодирует полипептид, содержащий акцепторный или донорный участок для сортазы.b. introducing a sortase acceptor or donor site into said nucleic acid, thereby obtaining a modified nucleic acid that encodes a polypeptide containing a sortase acceptor or donor site.

Внесение акцепторного или донорного участка для сортазы можно осуществлять посредством любых модификаций/способов, известных специалисту в данной области, например, посредством замещения, вставки или делеции последовательностей, кодирующих аминокислотные остатки в конечном полипептиде. В качестве примера, модификации можно вносить посредством модификации последовательности нуклеиновой кислоты с использованием стандартных способов молекулярного клонирования, например, посредством сайт-направленного мутагенеза, где короткие цепи ДНК (олигонуклеотиды), кодирующие желаемую аминокислоту(ы) используют для замены исходной кодирующей последовательности с использованием фермента полимеразы, или посредством встраивания/делеции частей гена с использованием различных ферментов (например, лигазы и эндонуклеазы рестрикции). Альтернативно модифицированная последовательность гена может быть химически синтезирована.The introduction of an acceptor or donor site for sortase can be carried out by any modifications/methods known to a person skilled in the art, for example, by substitution, insertion or deletion of sequences encoding amino acid residues in the final polypeptide. As an example, modifications can be made by modifying the nucleic acid sequence using standard molecular cloning techniques, such as site-directed mutagenesis, where short DNA chains (oligonucleotides) encoding the desired amino acid(s) are used to replace the original coding sequence using an enzyme. polymerase, or by inserting/deleting portions of the gene using various enzymes (eg, ligases and restriction endonucleases). Alternatively, the modified gene sequence can be chemically synthesized.

Предпочтительно способ дополнительно включает экспрессию модифицированной нуклеиновой кислоты в клетке-хозяине. Более предпочтительно, способ дополнительно включает экспрессию модифицированной нуклеиновой кислоты в клетке-хозяине и получение экспрессированного полипептида. Полипептид может быть активирован с использованием способа, описанного в настоящем описании.Preferably, the method further comprises expressing the modified nucleic acid in the host cell. More preferably, the method further comprises expressing the modified nucleic acid in a host cell and obtaining an expressed polypeptide. The polypeptide can be activated using the method described in the present description.

Также изобретение относится к полипептиду, получаемому способом по изобретению.The invention also relates to a polypeptide obtainable by the method of the invention.

Термин "получение", используемый в контексте "получения меченого полипептида" или "получения экспрессированного полипептида", может означать выделение полипептида. Выделение можно осуществлять любыми способами очистки, такими как хроматографические или иммуноаффинные способы, известные специалисту в данной области.The term "obtaining" as used in the context of "obtaining a labeled polypeptide" or "obtaining an expressed polypeptide" may mean isolating the polypeptide. The selection can be carried out by any purification methods, such as chromatographic or immunoaffinity methods known to the person skilled in the art.

Нуклеиновая кислота для применения в способах производства может представлять собой нуклеиновую кислоту, кодирующую полипептид, описанный в настоящем описании. Например, такая нуклеиновая кислота может кодировать полипептид, обладающий по меньшей мере 70% идентичностью последовательности с любой из SEQ ID NO: 6, 8, 17-25 или 38. В одном варианте осуществления нуклеиновая кислота может кодировать полипептид, обладающий по меньшей мере 80% или 90% идентичностью последовательности с любой из SEQ ID NO: 6, 8, 17-25 или 38. Предпочтительно нуклеиновая кислота может кодировать полипептид, содержащий (более предпочтительно состоящий из) любую из SEQ ID NO: 6, 8, 17-25 или 38.Nucleic acid for use in production methods can be a nucleic acid encoding a polypeptide described in the present description. For example, such a nucleic acid may encode a polypeptide having at least 70% sequence identity with any of SEQ ID NOs: 6, 8, 17-25, or 38. In one embodiment, the nucleic acid may encode a polypeptide having at least 80% or 90% sequence identity with any of SEQ ID NOs: 6, 8, 17-25 or 38. Preferably, the nucleic acid may encode a polypeptide containing (more preferably consisting of) any of SEQ ID NOs: 6, 8, 17-25 or 38.

Нуклеиновая кислота для применения в способах производства может представлять собой нуклеиновую кислоту, содержащую последовательность нуклеиновой кислоты, обладающую по меньшей мере 70% идентичностью последовательности с любой из SEQ ID NO: 5 или 7. В одном варианте осуществления a нуклеиновая кислота может представлять собой нуклеиновую кислоту, содержащую последовательность нуклеиновой кислоты, обладающую по меньшей мере 80% или 90% идентичностью последовательности с любой из SEQ ID NO: 5 или 7. Предпочтительно нуклеиновая кислота может содержать (более предпочтительно состоять из) SEQ ID NO: 5 или 7.A nucleic acid for use in manufacturing methods may be a nucleic acid comprising a nucleic acid sequence having at least 70% sequence identity with any of SEQ ID NO: 5 or 7. In one embodiment, a nucleic acid may be a nucleic acid containing a nucleic acid sequence having at least 80% or 90% sequence identity with any of SEQ ID NO: 5 or 7. Preferably, the nucleic acid may contain (more preferably consist of) SEQ ID NO: 5 or 7.

Таким образом, настоящее изобретение относится к последовательности нуклеиновой кислоты (например ДНК) последовательность (например, модифицированная нуклеиновая кислота), кодирующей полипептид по изобретению. Такая нуклеиновая кислота может быть включена в форме вектора, такого как плазмида, который необязательно может включать один или несколько из ориджина репликации, участка встраивания нуклеиновой кислоты, промотора, терминатора и участка связывания рибосомы.Thus, the present invention relates to a nucleic acid sequence (eg DNA) sequence (eg modified nucleic acid) encoding a polypeptide according to the invention. Such a nucleic acid may be included in the form of a vector, such as a plasmid, which may optionally include one or more of an origin of replication, a nucleic acid insertion site, a promoter, a terminator, and a ribosome binding site.

Нуклеиновая кислота (например, модифицированная нуклеиновая кислота) по настоящему изобретению может содержать последовательность нуклеиновой кислоты, обладающую по меньшей мере 70% идентичностью последовательности с SEQ ID NO: 1, 3 или 39. В одном варианте осуществления нуклеиновая кислота по настоящему изобретению может содержать последовательность нуклеиновой кислоты, обладающую по меньшей мере 80% или 90% идентичностью последовательности с SEQ ID NO: 1,3 или 39. Предпочтительно, нуклеиновая кислота по настоящему изобретению содержит (более предпочтительно состоит из) последовательность нуклеиновой кислоты, представленную в качестве SEQ ID NO: 1, 3 или 39.The nucleic acid (e.g., modified nucleic acid) of the present invention may comprise a nucleic acid sequence having at least 70% sequence identity with SEQ ID NO: 1, 3, or 39. In one embodiment, the nucleic acid of the present invention may comprise a nucleic acid sequence of the present invention. acid having at least 80% or 90% sequence identity with SEQ ID NO: 1,3 or 39. Preferably, the nucleic acid of the present invention contains (more preferably consists of) the nucleic acid sequence shown as SEQ ID NO: 1 , 3 or 39.

Нуклеиновая кислота (например, модифицированная нуклеиновая кислота) по настоящему изобретению может представлять собой нуклеиновую кислоту, которая кодирует полипептид, обладающий по меньшей мере 70% идентичностью последовательности с SEQ ID NO: 2,4 или 40. В одном варианте осуществления нуклеиновая кислота по настоящему изобретению может представлять собой нуклеиновую кислоту, которая кодирует полипептид, обладающий по меньшей мере 80% или 90% идентичностью последовательности с SEQ ID NO: 2, 4 или 40. Предпочтительно, нуклеиновая кислота по настоящему изобретению может представлять собой нуклеиновую кислоту, которая кодирует полипептид, содержащий (более предпочтительно состоящий из) SEQ ID NO: 2, 4 или 40.The nucleic acid (e.g., modified nucleic acid) of the present invention may be a nucleic acid that encodes a polypeptide having at least 70% sequence identity with SEQ ID NO: 2,4, or 40. In one embodiment, the nucleic acid of the present invention may be a nucleic acid that encodes a polypeptide having at least 80% or 90% sequence identity with SEQ ID NO: 2, 4 or 40. Preferably, the nucleic acid of the present invention may be a nucleic acid that encodes a polypeptide containing (more preferably consisting of) SEQ ID NO: 2, 4 or 40.

Настоящее изобретение также охватывает клетку-хозяина, содержащую нуклеиновую кислоту или вектор по изобретению.The present invention also encompasses a host cell containing the nucleic acid or vector of the invention.

Настоящее изобретение также охватывает способ экспрессии описанной выше последовательности нуклеиновой кислоты в клетке-хозяине, в частности, в E. coli, или посредством бакуловирусной экспрессирующей системы.The present invention also encompasses a method for expressing a nucleic acid sequence as described above in a host cell, in particular E. coli, or via a baculovirus expression system.

Настоящее изобретение также относится к способу активации полипептида по настоящему изобретению, причем указанный способ включает приведение полипептида в контакт с протеазой (например, FXa), которая расщепляет полипептид в участке распознавания (участок расщепления, такой как участок FXa), находящемся между компонентом нецитотоксической протеазой и компонентом транслокации, тем самым конвертируя полипептид в двухцепочечный полипептид, где нецитотоксическая протеаза и компоненты транслокации соединены вместе дисульфидной связью. В предпочтительном варианте осуществления участок распознавания не является нативным для встречающегося в природе клостридиального нейротоксина и/ или для встречающейся в природе протеазы IgA.The present invention also relates to a method for activating a polypeptide of the present invention, said method comprising contacting the polypeptide with a protease (eg, FXa) that cleaves the polypeptide at a recognition site (cleavage site, such as the FXa site) located between the non-cytotoxic protease component and a translocation component, thereby converting the polypeptide to a double-stranded polypeptide wherein the non-cytotoxic protease and the translocation components are joined together by a disulfide bond. In a preferred embodiment, the recognition site is not native to a naturally occurring clostridial neurotoxin and/or to a naturally occurring IgA protease.

Полипептиды по настоящему изобретению могут быть далее модифицированы для уменьшения или предупреждения нежелательных побочных эффектов, ассоциированных с распределением в области, не являющиеся мишенью. Согласно этому варианту осуществления, полипептид содержит деструктивный участок расщепления. Деструктивный участок расщепления отличается от "активационного" участка (т.е. образование двойной цепи) и расщепляется второй протеазой, но не нецитотоксической протеазой. Более того, при расщеплении таким образом в деструктивном участке расщепления посредством второй протеазы полипептид имеет сниженную эффективность (например, сниженную способность связываться с предполагаемой клеткой-мишенью, сниженную активность транслокации и/или сниженную активность нецитотоксической протеазы). Для полноты, любой из "деструктивных" участков расщепления по настоящему изобретению может отдельно использоваться в качестве "активационного" участка в полипептиде по настоящему изобретению.The polypeptides of the present invention can be further modified to reduce or prevent unwanted side effects associated with distribution to non-target areas. In this embodiment, the polypeptide contains a destructive cleavage site. The destructive cleavage site is distinct from the "activation" site (ie, double strand formation) and is cleaved by a second protease, but not by a non-cytotoxic protease. Moreover, when cleaved in this manner at a destructive cleavage site by a second protease, the polypeptide has reduced potency (eg, reduced ability to bind to the intended target cell, reduced translocation activity, and/or reduced non-cytotoxic protease activity). For completeness, any of the "destructive" cleavage sites of the present invention can separately be used as an "activation" site in the polypeptide of the present invention.

Таким образом, согласно этому варианту осуществления, настоящее изобретение относится к полипептиду, который может быть контролируемым образом инактивирован и/или разрушен в положении вне целевой области.Thus, according to this embodiment, the present invention relates to a polypeptide that can be inactivated and/or destroyed in a controlled manner at a position outside the target region.

В предпочтительном варианте осуществления деструктивный участок расщепления распознается и расщепляется второй протеазой (т.е. деструктивной протеазой), выбранной из циркулирующей протеазы (например, внеклеточная протеаза, такая как сывороточная протеаза или протеаза каскада свертывания крови), ассоциированной с тканью протеаза (например, матриксная металлопротеиназа (MMP), такая как MMP мышц) и внутриклеточной протеазы (предпочтительно протеаза, которая отсутствует в клетке-мишени).In a preferred embodiment, the destructive cleavage site is recognized and cleaved by a second protease (i.e., a destructive protease) selected from a circulating protease (e.g., an extracellular protease such as a serum or coagulation cascade protease), a tissue-associated protease (e.g., a matrix a metalloproteinase (MMP) such as muscle MMP) and an intracellular protease (preferably a protease that is not present in the target cell).

Таким образом, если при применении полипептид по настоящему изобретению распределяется в другом направлении от предполагаемой клетки-мишени и/ или захватывается не являющейся мишенью клеткой, полипептид инактивируется посредством расщепления деструктивного участка расщепления (второй протеазой).Thus, if in use the polypeptide of the present invention is distributed in a different direction from the intended target cell and/or taken up by a non-target cell, the polypeptide is inactivated by cleavage of the destructive cleavage site (second protease).

В одном варианте осуществления деструктивный участок расщепления распознается и расщепляется второй протеазой, которая присутствует в типе клеток вне целевой области. В этом варианте осуществления клетка вне целевой области и клетка-мишень предпочтительно представляют собой различные типы клеток. Альтернативно (или дополнительно), деструктивный участок расщепления распознается и расщепляется второй протеазой, которая присутствует вне целевой области (например, далеко от клетки-мишени). Таким образом, когда деструктивное расщепление происходит внеклеточно, клетка-мишень и клетка вне целевой области могут представлять собой один и тот же или различающиеся типы клеток. В этом отношении, клетка-мишень и клетка вне целевой области могут иметь рецепторы, с которыми связывается один и тот же полипептид по изобретению.In one embodiment, the destructive cleavage site is recognized and cleaved by a second protease that is present in a cell type outside the target region. In this embodiment, the cell outside the target area and the target cell are preferably different types of cells. Alternatively (or additionally), the destructive cleavage site is recognized and cleaved by a second protease that is present outside the target region (eg, away from the target cell). Thus, when destructive cleavage occurs extracellularly, the target cell and the cell outside the target region may be the same or different cell types. In this respect, a target cell and a cell outside the target area may have receptors to which the same polypeptide of the invention binds.

Деструктивный участок расщепления по настоящему изобретению обеспечивает инактивацию/разрушение полипептида, когда полипептид находится в или вблизи не являющейся целевой области. В связи с этим, расщепление в деструктивном участке расщепления минимизирует эффективность полипептида (по сравнению с идентичным полипептидом, лишенным того же деструктивного участка расщепления или обладающим тем же деструктивным участком, но в нерасщепленной форме). В качестве примера, сниженная эффективность включает: снижение связывания (с рецептором клеток млекопитающих) и/ или снижение транслокации (через эндосомальную мембрану клеточной линии млекопитающих в направлении цитозоля) и/ или снижение расщепление белка SNARE.The destructive cleavage site of the present invention provides for the inactivation/destruction of a polypeptide when the polypeptide is in or near a non-target region. Therefore, cleavage at a destructive cleavage site minimizes the effectiveness of the polypeptide (as compared to an identical polypeptide lacking the same destructive cleavage site or having the same destructive site but in uncleaved form). By way of example, reduced efficacy includes: reduced binding (to a mammalian cell receptor) and/or reduced translocation (through the endosomal membrane of a mammalian cell line towards the cytosol) and/or reduced cleavage of the SNARE protein.

При выборе деструктивного участка(ов) расщепления в контексте настоящего изобретения предпочтительно, чтобы деструктивный участок(и) расщепления не являлся субстратом для каких-либо протеаз, которые могут отдельно использоваться для посттрансляционной модификации полипептида по настоящему изобретению в качестве части процесса его производства. В связи с этим, нецитотоксические протеазы по настоящему изобретению, как правило, используют событие активации протеазы (через отдельный "активационный" участок расщепления протеазой, который структурно отличается от деструктивного участка расщепления по настоящему изобретению). Целью активационного участка расщепления является расщепление пептидной связи между нецитотоксической протеазой и компонентом траслокации или связывания в полипептиде по настоящему изобретению, тем самым обеспечивая "активированный" двухцепочечный полипептид, где указанные два компонента связаны вместе посредством дисульфидной связи.When choosing a destructive cleavage site(s) in the context of the present invention, it is preferred that the destructive cleavage site(s) is not a substrate for any proteases that can be used separately to post-translationally modify the polypeptide of the present invention as part of its manufacturing process. In this regard, the non-cytotoxic proteases of the present invention typically utilize the protease activation event (via a separate "activation" protease cleavage site that is structurally different from the destructive cleavage site of the present invention). The purpose of the cleavage activation site is to cleave the peptide bond between the non-cytotoxic protease and the tralocation or binding component in the polypeptide of the present invention, thereby providing an "activated" double-stranded polypeptide, wherein the two components are linked together via a disulfide bond.

Таким образом, для облегчения обеспечения того, чтобы деструктивный участок(и) расщепления полипептидов по настоящему изобретению не оказывали неблагоприятного влияния на "активационный" участок расщепления и последующее образование дисульфидной связи, первый из них предпочтительно вносят в полипептид по настоящему изобретению в положении на расстоянии по меньшей мере 20, по меньшей мере 30, по меньшей мере 40, по меньшей мере 50, и более предпочтительно по меньшей мере 60, по меньшей мере 70, по меньшей мере 80 (последовательно расположенных) аминокислотных остатков от "активационного" участка расщепления.Thus, in order to facilitate ensuring that the destructive cleavage site(s) of the polypeptides of the present invention do not adversely affect the "activation" cleavage site and subsequent disulfide bond formation, the first of these is preferably introduced into the polypeptide of the present invention at a position at a distance of at least 20, at least 30, at least 40, at least 50, and more preferably at least 60, at least 70, at least 80 (consecutive) amino acid residues from the "activation" cleavage site.

Деструктивный участок(и) расщепления и активационный участок расщепления предпочтительно являются экзогенными (т.е. сконструированными/искусственными) относительно нативных компонентов полипептида. Иными словами, указанные участки расщепления предпочтительно не являются неотъемлемыми участками соответствующих нативных компонентов полипептида. В качестве примера, протеазный компонент или компонент транслокации на основе L-цепи или H-цепи BoNT/A (соответственно) можно модифицировать в соответствии с настоящим изобретением для включения участка расщепления. Однако указанное расщепление не будет происходить в соответствующей нативной L-цепи или H-цепи BoNT. Аналогично, когда компонент нацеливающей части в полипептиде модифицирован для включения участка расщепления протеазой, указанный участок расщепления не присутствует в соответствующей нативной последовательности соответствующей нацеливающей части.The destructive cleavage site(s) and the activation cleavage site are preferably exogenous (ie engineered/artificial) relative to the native components of the polypeptide. In other words, said cleavage sites are preferably not integral to the respective native components of the polypeptide. As an example, a protease or translocation component based on the L chain or H chain of BoNT/A (respectively) can be modified in accordance with the present invention to include a cleavage site. However, said cleavage will not occur in the corresponding native L chain or H chain of BoNT. Similarly, when a component of a targeting moiety in a polypeptide is modified to include a protease cleavage site, said cleavage site is not present in the corresponding native sequence of the corresponding targeting moiety.

В предпочтительном варианте осуществления настоящего изобретения деструктивный участок(и) расщепления и "активационный" участок расщепления не расщепляются одной и той же протеазой. В одном варианте осуществления два участка расщепления отличаются друг от друга тем, что по меньшей мере один, более предпочтительно по меньшей мере две, особенно предпочтительно по меньшей мере три и наиболее предпочтительно по меньшей мере четыре из допустимых аминокислот в соответствующих последовательностях распознавания отличаются.In a preferred embodiment of the present invention, the destructive cleavage site(s) and the "activation" cleavage site are not cleaved by the same protease. In one embodiment, the two cleavage sites differ from each other in that at least one, more preferably at least two, particularly preferably at least three, and most preferably at least four of the allowed amino acids in the respective recognition sequences are different.

В качестве примера, в случае полипептидной химеры, содержащей "активационный" участок фактора Xa между клостридиальными компонентами L-цепью и HN предпочтительно использовать деструктивный участок расщепления, который представляет собой участок, отличный от участка фактора Xa, который может быть встроен где-либо в компоненте(ах) L-цепи, и/ или HN, и/или TM. Согласно этому сценарию, полипептид может быть модифицирован внесением альтернативного "активационного" участка между компонентами L-цепью и HN (например, участок расщепления энтерокиназой), и в этом случае отдельный участок расщепления фактором Xa может быть включен куда-либо в полипептид в качестве деструктивного участка расщепления. Альтернативно существующий "активационный" участок фактора Xa между компонентами L-цепью и HN может быть сохранен и альтернативный участок расщепления, такой как участок расщепления тромбином, включен в качестве деструктивного участка расщепления.As an example, in the case of a polypeptide chimera containing a factor Xa "activation" site between the clostridial components of the L-chain and HN , it is preferable to use a destructive cleavage site that is a site other than the factor Xa site that can be inserted anywhere in component(s) of the L-chain, and/or H N , and/or TM. In this scenario, the polypeptide can be modified by introducing an alternative "activation" site between the L-chain and H N components (e.g., an enterokinase cleavage site), in which case a separate factor Xa cleavage site can be included somewhere in the polypeptide as a destructive site. splitting area. Alternatively, the existing factor Xa "activation" site between the L chain and H N components may be retained and an alternative cleavage site, such as a thrombin cleavage site, included as a destructive cleavage site.

При идентификации подходящих участков в первичной последовательности любых из компонентов по настоящему изобретению для включения участка(ов) расщепления является предпочтительным выбор первичной последовательности, которая в высокой степени соответствует предполагаемому участку расщепления, подлежащему встраиванию. Посредством этого в полипептид вносятся минимальные структурные изменения. В качестве примера, участки расщепления, как правило, содержат по меньшей мере 3 последовательно расположенных аминокислотных остатка. Таким образом, в предпочтительном варианте осуществления выбирают участок расщепления, который уже имеет (в правильном положении(ях)) по меньшей мере один, предпочтительно по меньшей мере два аминокислотных остатка, которые необходимы для внесения нового участка расщепления. В качестве примера, в одном варианте осуществления можно вносить участок расщепления каспазой 3 (DMQD). В этом отношении, идентифицируют предпочтительное положение для встраивания, которое уже включает первичную последовательность, выбранную, например, из Dxxx, xMxx, xxQx, xxxD, DMxx, DxQx, DxxD, xMQx, xMxD, xxQD, DMQx, xMQD, DxQD и DMxD.In identifying suitable sites in the primary sequence of any of the components of the present invention to include the cleavage site(s), it is preferable to select a primary sequence that closely matches the intended cleavage site to be inserted. Through this, minimal structural changes are made to the polypeptide. By way of example, cleavage sites typically contain at least 3 consecutive amino acid residues. Thus, in a preferred embodiment, a cleavage site is selected that already has (in the correct position(s)) at least one, preferably at least two, amino acid residues that are necessary to introduce a new cleavage site. As an example, in one embodiment, a caspase 3 cleavage site (DMQD) can be introduced. In this regard, a preferred insertion position is identified which already includes a primary sequence selected from, for example, Dxxx, xMxx, xxQx, xxxD, DMxx, DxQx, DxxD, xMQx, xMxD, xxQD, DMQx, xMQD, DxQD and DMxD.

Аналогично, предпочтительно вносить участки расщепления в экспонированные на поверхность области. В экспонированных на поверхности областях предпочтительными являются существующие области петель.Likewise, it is preferable to introduce cleavage sites into the areas exposed to the surface. In surface-exposed regions, existing loop regions are preferred.

В предпочтительном варианте осуществления настоящего изобретения деструктивный участок(и) расщепления вносят в одно или несколько из следующих положений, которые основаны на первичной аминокислотной последовательности BoNT/A. В то время как положения встраивания идентифицируют (для удобства) на основе BoNT/A первичные аминокислотные последовательности альтернативных протеазных доменов и/или доменов транслокации могут быть без труда выровнены с указанными положениями BoNT/A.In a preferred embodiment of the present invention, the destructive cleavage site(s) is introduced at one or more of the following positions, which are based on the primary amino acid sequence of BoNT/A. While insertion positions are identified (for convenience) based on BoNT/A, the primary amino acid sequences of alternative protease and/or translocation domains can be easily aligned to the indicated BoNT/A positions.

Для протеазного компонента являются предпочтительными одно или несколько из следующих положений: 27-31, 56-63, 73-75, 78-81, 99-105, 120-124, 137-144, 161-165, 169-173, 187-194, 202-214, 237-241, 243-250, 300-304, 323-335, 375-382, 391-400 и 413-423. Приведенная выше нумерация предпочтительно начинается с N-конца протеазного компонента по настоящему изобретению.For the protease component, one or more of the following positions are preferred: 194, 202-214, 237-241, 243-250, 300-304, 323-335, 375-382, 391-400 and 413-423. The above numbering preferably starts from the N-terminus of the protease component of the present invention.

В предпочтительном варианте осуществления деструктивный участок(и) расщепления находится в положении на расстоянии более 8 аминокислотных остатков, предпочтительно более 10 аминокислотных остатков, более предпочтительно более 25 аминокислотных остатков, особенно предпочтительно более 50 аминокислотных остатков от N-конца протеазного компонента. Аналогично, в предпочтительном варианте осуществления деструктивный участок(и) расщепления находится в положении на расстоянии более 20 аминокислотных остатков, предпочтительно более 30 аминокислотных остатков, более предпочтительно более 40 аминокислотных остатков, особенно предпочтительно более 50 аминокислотных остатков от C-конца протеазного компонента.In a preferred embodiment, the destructive cleavage site(s) is at a position more than 8 amino acid residues, preferably more than 10 amino acid residues, more preferably more than 25 amino acid residues, particularly preferably more than 50 amino acid residues from the N-terminus of the protease component. Similarly, in a preferred embodiment, the destructive cleavage site(s) is at a position more than 20 amino acid residues, preferably more than 30 amino acid residues, more preferably more than 40 amino acid residues, particularly preferably more than 50 amino acid residues from the C-terminus of the protease component.

Что касается компонента транслокации, предпочтительными являются одно или несколько из следующих положений: 474-479, 483-495, 507-543, 557-567, 576-580, 618-631, 643-650, 669-677, 751-767, 823-834, 845-859. Согласно приведенной выше нумерации, за начальное положение предпочтительно признается положение 449 для N-концевого компонента домена транслокации по настоящему изобретению, и за конечное положение признается положение 871 для C-концевого компонента домена транслокации.With respect to the translocation component, one or more of the following positions are preferred: 823-834, 845-859. According to the above numbering, position 449 for the N-terminal component of the translocation domain of the present invention is preferably recognized as the start position, and position 871 for the C-terminal component of the translocation domain is recognized as the end position.

В предпочтительном варианте осуществления деструктивный участок(и) расщепления находится в положении на расстоянии более 10 аминокислотных остатков, предпочтительно более 25 аминокислотных остатков, более предпочтительно более 40 аминокислотных остатков, особенно предпочтительно более 50 аминокислотных остатков от N-конца компонента транслокации. Аналогично, в предпочтительном варианте осуществления деструктивный участок(и) расщепления находится в положении на расстоянии более 10 аминокислотных остатков, предпочтительно более 25 аминокислотных остатков, более предпочтительно более 40 аминокислотных остатков, особенно предпочтительно более 50 аминокислотных остатков от C-конца компонента транслокации.In a preferred embodiment, the destructive cleavage site(s) is at a position more than 10 amino acid residues, preferably more than 25 amino acid residues, more preferably more than 40 amino acid residues, particularly preferably more than 50 amino acid residues from the N-terminus of the translocation component. Similarly, in a preferred embodiment, the destructive cleavage site(s) is at a position more than 10 amino acid residues, preferably more than 25 amino acid residues, more preferably more than 40 amino acid residues, particularly preferably more than 50 amino acid residues from the C-terminus of the translocation component.

В предпочтительном варианте осуществления деструктивный участок(и) расщепления находится на расстоянии более 10 аминокислотных остатков, предпочтительно более 25 аминокислотных остатков, более предпочтительно более 40 аминокислотных остатков, особенно предпочтительно более 50 аминокислотных остатков от N-конца компонента TM. Аналогично, в предпочтительном варианте осуществления деструктивный участок(и) расщепления находится в положении на расстоянии более 10 аминокислотных остатков, предпочтительно более 25 аминокислотных остатков, более предпочтительно более 40 аминокислотных остатков, особенно предпочтительно более 50 аминокислотных остатков от C-конца компонента TM.In a preferred embodiment, the destructive cleavage site(s) is more than 10 amino acid residues, preferably more than 25 amino acid residues, more preferably more than 40 amino acid residues, particularly preferably more than 50 amino acid residues from the N-terminus of the TM component. Similarly, in a preferred embodiment, the destructive cleavage site(s) is at a position more than 10 amino acid residues, preferably more than 25 amino acid residues, more preferably more than 40 amino acid residues, particularly preferably more than 50 amino acid residues from the C-terminus of the TM component.

Полипептид по настоящему изобретению может включать один или несколько (например, два, три, четыре, пять или более) деструктивных участков расщепления протеазой. Когда включено более одного деструктивного участка расщепления, участки расщепления могут быть одинаковыми или могут различаться. В этом отношении использование более одного деструктивного участка расщепления обеспечивает улучшенную инактивацию вне целевой области. Аналогично, использование двух или более различных деструктивных участков расщепления обеспечивает дополнительную универсальность конструкции.The polypeptide of the present invention may include one or more (eg, two, three, four, five or more) destructive protease cleavage sites. When more than one destructive cleavage site is included, the cleavage sites may be the same or may be different. In this regard, the use of more than one destructive cleavage site provides improved inactivation outside the target region. Likewise, the use of two or more different destructive cleavage sites provides additional design versatility.

Деструктивный участок(и) расщепления может быть встроен в любой из следующих компонентов полипептида: компонент нецитотоксической протеазы; компонент транслокации; нацеливающая часть или спейсерный пептид (при наличии). В этом отношении, деструктивный участок(и) расщепления выбирают для обеспечения минимального неблагоприятного эффекта на эффективность полипептида (например, посредством наличия минимального эффекта на нацеливающие/связывающие области и/или домен транслокации, и/ или на домен нецитотоксической протеазы), одновременно обеспечивая неустойчивость полипептида на отдалении от его целевой области/клетки-мишени.The destructive cleavage site(s) may be incorporated into any of the following polypeptide components: a non-cytotoxic protease component; translocation component; targeting moiety or spacer peptide (if available). In this regard, the destructive cleavage site(s) is chosen to provide a minimal adverse effect on the potency of the polypeptide (e.g., by having a minimal effect on the targeting/binding regions and/or the translocation domain and/or the non-cytotoxic protease domain) while concurrently providing for the instability of the polypeptide. away from its target area/target cell.

Предпочтительные деструктивные участки расщепления (плюс соответствующие вторые протеазы) приведены в таблице ниже. Приведенные участки расщепления являются только иллюстративными и не предназначены для ограничения настоящего изобретения.Preferred destructive cleavage sites (plus corresponding second proteases) are shown in the table below. The cleavage sites shown are illustrative only and are not intended to limit the present invention.

Вторая протеазаSecond protease Последовательность распознавания в деструктивном участке расщепления Recognition sequence in the destructive cleavage site Допустимое варьирование последовательностей распознавания
P4-P3-P2-P1-▼-P1’-P2’-P3’
Permissible variation in recognition sequences
P4-P3-P2-P1-▼-P1'-P2'-P3'
P4P4 P3P3 P2P2 P1P1 P1’P1' P2’P2' P3’P3' Тромбин Thrombin LVPR▼GS (SEQ ID NO: 88)LVPR▼GS (SEQ ID NO: 88) A, F,G, I,L, T,V или MA, F, G, I, L, T, V or M A, F,G, I,L, T,V, W или AA, F, G, I, L, T, V, W or A PP RR Не D или ENot D or E Не D или ENot D or E ------ ТромбинThrombin GR▼GGR▼G GG RR GG Фактор Xa Xa factor IEGR▼ (SEQ ID NO: 85)IEGR▼ (SEQ ID NO: 85) A, F,G, I,L, T,V или MA, F, G, I, L, T, V or M D или ED or E GG RR ------ ------ ------ ADAM17 ADAM17 PLAQA▼VRSSS (SEQ ID NO: 90)PLAQA▼VRSSS (SEQ ID NO: 90) Трипсин-подобная протеаза дыхательных путей человека (HAT) Trypsin-like human airway protease (HAT) SKGR▼SLIGRV (SEQ ID NO: 91)SKGR▼SLIGRV (SEQ ID NO: 91) ACE (пептидил-дипептидаза A)ACE (peptidyl dipeptidase A) ------ ------ ------ ------ Не PNot P Не D или ENot D or E N/AN/A Эластаза (лейкоцитарная)Elastase (leukocyte) MEA▼VTY (SEQ ID NO: 92)MEA▼VTY (SEQ ID NO: 92) M, RM, R EE A, HA, H V, T V, T V, T, HV, T, H YY ------ Фурин Furin RXR/KR▼ (SEQ ID NO: 93)RXR/KR▼ (SEQ ID NO: 93) RR XX R или KR or K RR ГранзимGranzim IEPD▼ (SEQ ID NO: 94)IPPD▼ (SEQ ID NO: 94) II EE PP DD ------ ------ ------ Каспаза 1Caspase 1 F, W,Y, LF, W, Y, L ------ H, A,TH,A,T DD Не P, E.D.Q.K или RNot P, E.D.Q.K or R ------ ------ Каспаза 2 Caspase 2 DVAD▼ (SEQ ID NO: 95)DVAD▼ (SEQ ID NO: 95) DD VV AA DD Не P, E.D.Q.K или RNot P, E.D.Q.K or R ------ ------ Каспаза 3 Caspase 3 DMQD▼ (SEQ ID NO: 96)DMQD▼ (SEQ ID NO: 96) DD MM QQ DD Не P, E.D.Q.K или RNot P, E.D.Q.K or R ------ ------ Каспаза 4 Caspase 4 LEVD▼ (SEQ ID NO: 97)LEVD▼ (SEQ ID NO: 97) LL EE VV DD Не P, E.D.Q.K или RNot P, E.D.Q.K or R ------ ------ Каспаза 5Caspase 5 L или WL or W EE HH DD ------ ------ ------ Каспаза 6Caspase 6 VV EE H или IH or I DD Не P, E.D.Q.K или RNot P, E.D.Q.K or R ------ ------ Каспаза 7 Caspase 7 DEVD▼ (SEQ ID NO: 98)DEVD▼ (SEQ ID NO: 98) DD EE VV DD Не P, E.D.Q.K или RNot P, E.D.Q.K or R ------ ------ Каспаза 8Caspase 8 I или LI or L EE TT DD Не P, E.D.Q.K или RNot P, E.D.Q.K or R ------ ------ Каспаза 9 Caspase 9 LEHD▼ (SEQ ID NO: 99)LEHD▼ (SEQ ID NO: 99) LL EE HH DD ------ ------ ------ Каспаза 10 Caspase 10 IEHD▼ (SEQ ID NO: 100)IEHD▼ (SEQ ID NO: 100) II EE HH DD ------ ------ ------

Матриксные металлопротеиназы (MMP) являются предпочтительной группой деструктивных протеаз в контексте настоящего изобретения. В этой группе ADAM17 (EC 3.4.24.86, также известная как TACE), является предпочтительной и расщепляет множество заякоренных на мембране белков клеточной поверхности для "слущивания" внеклеточных доменов. Дополнительные предпочтительные MMP включают адамализины, серрализины и астацины.Matrix metalloproteinases (MMPs) are a preferred group of destructive proteases in the context of the present invention. Within this group, ADAM17 (EC 3.4.24.86, also known as TACE) is preferred and cleaves many membrane-anchored cell surface proteins to shed extracellular domains. Additional preferred MMPs include the adamalysins, serralisins, and astacins.

Другой группой предпочтительных деструктивных протеаз является протеаза крови млекопитающих, такая как тромбин, фактор свертывания VIIa, фактор свертывания IXa, фактор свертывания Xa, фактор свертывания XIa, фактор свертывания XIIa, калликреин, белок C и MBP-ассоциированная сериновая протеаза.Another group of preferred destructive proteases is the mammalian blood protease such as thrombin, coagulation factor VIIa, coagulation factor IXa, coagulation factor Xa, coagulation factor XIa, coagulation factor XIIa, kallikrein, protein C, and MBP-associated serine protease.

В одном варианте осуществления настоящего изобретения указанный деструктивный участок расщепления содержит последовательность распознавания, имеющую по меньшей мере 3 или 4, предпочтительно 5 или 6, более предпочтительно 6 или 7, и особенно предпочтительно по меньшей мере 8 последовательно расположенных аминокислотных остатков. В связи с этим, чем более длинной (с точки зрения последовательно расположенных аминокислотных остатков) является последовательность распознавания, тем менее вероятным является неспецифическое расщепление деструктивного участка посредством непредусмотренной второй протеазы.In one embodiment of the present invention, said destructive cleavage site comprises a recognition sequence having at least 3 or 4, preferably 5 or 6, more preferably 6 or 7, and particularly preferably at least 8 contiguous amino acid residues. In this regard, the longer (in terms of consecutive amino acid residues) is the recognition sequence, the less likely is the non-specific cleavage of the destructive site by an unintended second protease.

Предпочтительно, чтобы деструктивный участок расщепления по настоящему изобретению был внесен в протеазный компонент, и/или нацеливающую часть, и/или в компонент транслокации, и/или в спейсерный пептид. Из этих четырех компонентов протеазный компонент является предпочтительным. Таким образом, полипептид может быть быстро инактивирован посредством прямого разрушения компонента нецитотоксической протеазы, и/или компонента связывания и/или компонента транслокации.Preferably, the destructive cleavage site of the present invention is incorporated into the protease component and/or the targeting portion and/or the translocation component and/or the spacer peptide. Of these four components, the protease component is preferred. Thus, the polypeptide can be rapidly inactivated by direct destruction of the non-cytotoxic protease component and/or the binding component and/or the translocation component.

Полипептиды по изобретению могут быть составлены в качестве части фармацевтической композиции, содержащей полипептид, вместе по меньшей мере с одним компонентом, выбранным из фармацевтически приемлемого носителя, эксципиента, адъюванта, пропеллента и/или соли.The polypeptides of the invention may be formulated as part of a pharmaceutical composition containing the polypeptide, together with at least one component selected from a pharmaceutically acceptable carrier, excipient, adjuvant, propellant and/or salt.

Полипептиды по настоящему изобретению могут быть составлены для перорального, парентерального введения, непрерывной инфузии, имплантации, ингаляции или местного применения. Композиции, пригодные для инъекции, могут иметь форму растворов, суспензий или эмульсий, или сухих порошков, которые растворяют или суспендируют в подходящем носителе перед применением.The polypeptides of the present invention can be formulated for oral, parenteral administration, continuous infusion, implantation, inhalation or topical application. Compositions suitable for injection may take the form of solutions, suspensions or emulsions, or dry powders, which are dissolved or suspended in a suitable vehicle before use.

Средства локальной доставки могут включать аэрозоль или другой спрей (например, небулайзер). В этом отношении, аэрозольный состав полипептида позволяет доставку в легкие и/или другие носовые и/или бронхиальные, или дыхательные пути.Local delivery means may include an aerosol or other spray (eg, nebulizer). In this regard, the aerosol formulation of the polypeptide allows delivery to the lungs and/or other nasal and/or bronchial or airways.

Предпочтительный путь введения выбран из: системного (например, в/в), лапараскопического и/или локализованной инъекции (например, транссфеноидальной инъекции непосредственно в опухоль).The preferred route of administration is selected from: systemic (eg iv), laparoscopic and/or localized injection (eg transsphenoidal injection directly into the tumor).

В случае составов для инъекции, является необязательным включение фармацевтически активного вещества для облегчения удержания или уменьшения выхода полипептида из области введения. Одним из примеров такого фармацевтически активного вещества является сосудосуживающее средство, такое как адреналин. Такой состав обеспечивает преимущество повышения времени нахождения полипептида после введения и, таким образом, повышения и/или усиления его эффекта.In the case of formulations for injection, it is optional to include a pharmaceutically active agent to facilitate retention or to reduce the release of the polypeptide from the area of administration. One example of such a pharmaceutically active substance is a vasoconstrictor such as adrenaline. Such a composition provides the advantage of increasing the residence time of the polypeptide after administration and thus enhancing and/or enhancing its effect.

Диапазоны дозировок для введения полипептидов по настоящему изобретению представляют собой диапазоны, которые вызывают желаемый терапевтический эффект. Будет понятно, что требуемый диапазон дозировок зависит от точной природы полипептида или композиции, пути введения, природы состава, возраста пациента, природы, степени или тяжести состояния пациента, противопоказаний, при их наличии, и мнения лечащего врача. Эти дозировки могут варьироваться с использованием стандартных эмпирических способов оптимизации.Dosage ranges for administering the polypeptides of the present invention are those that produce the desired therapeutic effect. It will be understood that the required dosage range depends on the precise nature of the polypeptide or composition, the route of administration, the nature of the composition, the age of the patient, the nature, extent or severity of the patient's condition, contraindications, if any, and the judgment of the attending physician. These dosages can be varied using standard empirical optimization techniques.

Подходящие суточные дозировки (на кг массы тела пациента) находятся в диапазоне 0,0001-1 мг/кг, предпочтительно 0,0001-0,5 мг/кг, более предпочтительно 0,002-0,5 мг/кг, и особенно предпочтительно 0,004-0,5 мг/кг. Единичная дозировка может варьироваться от менее 1 микрограмма до 30 мг, однако, как правило, она находится в диапазоне от 0,01 до 1 мг на дозу, которую можно вводить каждые сутки или предпочтительно менее часто, например, раз в неделю или раз в шесть месяцев.Suitable daily dosages (per kg of body weight of the patient) are in the range of 0.0001-1 mg/kg, preferably 0.0001-0.5 mg/kg, more preferably 0.002-0.5 mg/kg, and particularly preferably 0.004- 0.5 mg/kg. A single dosage may vary from less than 1 microgram to 30 mg, however, it is usually in the range of 0.01 to 1 mg per dose, which can be administered every day or preferably less often, for example, once a week or every six months.

Особенно предпочтительный режим дозирования основан на 2,5 нг полипептида в качестве 1X дозы. В этом отношении, предпочтительные дозировки находятся в диапазоне 1X-100X (т.е. 2,5-250 нг).A particularly preferred dosing regimen is based on 2.5 ng of the polypeptide as a 1X dose. In this regard, preferred dosages are in the range of 1X-100X (ie 2.5-250 ng).

Жидкие дозированные формы, как правило, получают с использованием полипептида и свободного от пирогенов стерильного носителя. Полипептид, в зависимости от используемого носителя и концентрации, может быть либо растворен, либо суспендирован в носителе. При получении растворов полипептид можно растворять в носителе, раствор при необходимости можно преобразовывать в изотонический посредством добавления хлорида натрия и стерилизовать фильтрацией через стерильный фильтр с использованием асептических способов перед заполнением стерильных флаконов или ампул и герметизации. Альтернативно, если стабильность раствора является достаточной, раствор в его закрытых контейнерах можно стерилизовать автоклавированием. Преимущественно, добавки, такие как буферные вещества, солюбилизирующие вещества, стабилизрующие вещества, консерванты или бактерицидные средства, суспендирующие средства или эмульгаторы, и/или местные анестетики могут быть растворены в носителе.Liquid dosage forms are typically prepared using the polypeptide and a pyrogen-free, sterile carrier. The polypeptide, depending on the carrier and concentration used, may be either dissolved or suspended in the carrier. When preparing solutions, the polypeptide can be dissolved in a vehicle, the solution can be converted to isotonic if necessary by the addition of sodium chloride, and sterilized by filtration through a sterile filter using aseptic methods before filling into sterile vials or ampoules and sealing. Alternatively, if the stability of the solution is sufficient, the solution in its closed containers can be sterilized by autoclaving. Advantageously, additives such as buffering agents, solubilizing agents, stabilizing agents, preservatives or bactericides, suspending agents or emulsifiers, and/or local anesthetics may be dissolved in the carrier.

Сухие порошки, которые растворяют или суспендируют в подходящем носителе перед применением можно получать путем заполнения предварительно стерилизованными ингредиентами стерильного контейнера с использованием асептического способа в стерильной зоне. Альтернативно ингредиенты могут быть растворены в подходящих контейнерах с использованием асептического способа в стерильной зоне. Затем продукт лиофилизируют и контейнеры запечатывают в асептических условиях.Dry powders which are dissolved or suspended in a suitable carrier prior to use can be prepared by filling the pre-sterilized ingredients into a sterile container using aseptic technique in a sterile area. Alternatively, the ingredients may be dissolved in suitable containers using an aseptic process in a sterile area. The product is then lyophilized and the containers are sealed under aseptic conditions.

Парентеральные суспензии, пригодные для внутримышечной, подкожной или внутрикожной инъекции, приготавливают по существу одним и тем же способом, за исключением того, что стерильные компоненты суспендируют в стерильном носителе вместо растворения, и стерилизация не может быть осуществлена посредством фильтрации. Компоненты можно выделять в стерильном состоянии или альтернативно они могут быть стерилизованы после выделения, например, посредством облучения гамма-излучением.Parenteral suspensions suitable for intramuscular, subcutaneous or intradermal injection are prepared in essentially the same manner, except that the sterile components are suspended in a sterile vehicle instead of being dissolved and sterilization cannot be accomplished by filtration. The components may be isolated in a sterile state, or alternatively they may be sterilized after isolation, for example by irradiation with gamma radiation.

Преимущественно, в композицию(и) включают суспендирующее вещество, например, поливинилпирролидон, для облегчения однородного распределения компонентов.Preferably, a suspending agent, such as polyvinylpyrrolidone, is included in the composition(s) to facilitate uniform distribution of the components.

Нацеливающая часть (TM) означает любую химическую структуру, которая функционально взаимодействует с участком связывания, вызывая физическую ассоциацию между полипептидом по изобретению и поверхностью клетки-мишени (как правило, клетка млекопитающих, особенно клетка человека). Термин "TM" охватывает любую молекулу (т.е. встречающаяся в природе молекула или ее химически/физически модифицированный вариант), которая способна связываться с участком связывания на клетке-мишени, которая предпочтительно способна к интернализации (например, формированию эндосом) - также называемой рецептор-опосредуемым эндоцитозом. TM может обладать функцией транслокации через эндосомальную мембрану, и в этом случае в средстве по настоящему изобретению не должны присутствовать TM и домен транслокации в качестве отдельных компонентов. На протяжении предшествующего описания описаны конкретные TM. Указание на указанные TM является только иллюстративным, и настоящее изобретение охватывает все их варианты и производные, которые обладают базовой способностью к связыванию (т.е. нацеливанию) с участком связывания на клетке-мишени, предпочтительно где участок связывания способен к интернализации.Targeting moiety (TM) means any chemical structure that operably interacts with the binding site to cause physical association between the polypeptide of the invention and the surface of a target cell (generally a mammalian cell, especially a human cell). The term "TM" encompasses any molecule (i.e., a naturally occurring molecule or a chemically/physically modified variant thereof) that is capable of binding to a binding site on a target cell, which is preferably capable of internalizing (e.g., forming endosomes) - also referred to as receptor-mediated endocytosis. TM may have the function of translocation across the endosomal membrane, in which case TM and the translocation domain should not be present as separate components in the agent of the present invention. Throughout the foregoing description, specific TMs have been described. Reference to these TMs is illustrative only, and the present invention encompasses all variants and derivatives thereof that have a basic ability to bind (ie, target) to a binding site on a target cell, preferably where the binding site is capable of internalization.

TM по настоящему изобретению связывается (предпочтительно специфически связывается) с рассматриваемой клеткой-мишенью. Термин "специфически связывается" предпочтительно означает, что данный TM связывается с клеткой-мишенью с аффинностью связывания (Ka) 106 M-1 или более, предпочтительно 107 M-1 или более, или 108 M-1 или более, или 109 M-1 или более. TM по настоящему изобретению (когда они находятся в свободной форме, а именно, когда они отделены от какого-либо протеазного компонента и/или компонента транслокации), предпочтительно демонстрируют аффинность связывания (IC50) в отношении рассматриваемого рецептора-мишени в диапазоне 0,05-18 нМ.The TM of the present invention binds (preferably binds specifically) to the target cell in question. The term "specifically binds" preferably means that the TM binds to the target cell with a binding affinity (Ka) of 10 6 M -1 or more, preferably 10 7 M -1 or more, or 10 8 M -1 or more, or 10 9 M -1 or more. The TMs of the present invention (when in free form, namely when separated from any protease and/or translocation component) preferably exhibit a binding affinity (IC 50 ) for the target receptor in question in the range of 0.05 -18 nM.

TM по настоящему изобретению предпочтительно не является агглютинином зародышей пшеницы (WGA).The TM of the present invention is preferably not wheat germ agglutinin (WGA).

Указание на TM в настоящем описании охватывает его фрагменты и варианты, которые сохраняют способность к связыванию рассматриваемой клетки-мишени. В качестве примера, вариант может обладать по меньшей мере 80%, предпочтительно по меньшей мере 90%, более предпочтительно по меньшей мере 95% и наиболее предпочтительно по меньшей мере 97 или по меньшей мере 99% гомологией аминокислотной последовательности с эталонным TM - причем последний представляет собой любую последовательность TM, указанную в настоящей заявке. Таким образом, вариант может включать один или несколько аналогов аминокислот (например, неприродная аминокислота), или замещенную связь. Также в качестве примера термин "фрагмент", когда его используют в отношении TM, означает пептид, имеющий по меньшей мере пять, предпочтительно по меньшей мере десять, более предпочтительно по меньшей мере двадцать и наиболее предпочтительно по меньшей мере двадцать пять аминокислотных остатков эталонного TM. Термин фрагмент также относится к вышеупомянутым вариантам. Таким образом, в качестве примера, фрагмент по настоящему изобретению может содержать пептидную последовательность, имеющую по меньшей мере 7, 10, 14, 17, 20, 25, 28, 29 или 30 аминокислот, где пептидная последовательность обладает по меньшей мере 80% гомологией последовательности на протяжении соответствующих аминокислот пептидной последовательности (последовательно расположенных) эталонного пептида.The indication of TM in the present description covers its fragments and variants, which retain the ability to bind the target cell in question. By way of example, a variant may have at least 80%, preferably at least 90%, more preferably at least 95%, and most preferably at least 97 or at least 99% amino acid sequence homology with the reference TM - the latter representing any sequence TM specified in this application. Thus, a variant may include one or more amino acid analogs (eg, a non-natural amino acid), or a substituted bond. Also by way of example, the term "fragment" when used in relation to TM means a peptide having at least five, preferably at least ten, more preferably at least twenty, and most preferably at least twenty-five amino acid residues of a reference TM. The term fragment also refers to the above options. Thus, by way of example, a fragment of the present invention may comprise a peptide sequence having at least 7, 10, 14, 17, 20, 25, 28, 29, or 30 amino acids, wherein the peptide sequence shares at least 80% sequence homology. over the corresponding amino acids of the peptide sequence (consecutive) of the reference peptide.

TM может содержать более длинную аминокислотную последовательность, например, по меньшей мере 30 или 35 аминокислотных остатков, или по меньшей мере 40 или 45 аминокислотных остатков при условии, что TM способен связываться с клеткой-мишенью.The TM may contain a longer amino acid sequence, such as at least 30 or 35 amino acid residues, or at least 40 or 45 amino acid residues, provided that the TM is capable of binding to the target cell.

Подтверждение того, что TM связывается с выбранной клеткой-мишенью, можно проводить стандартным способом. Например, можно использовать простой эксперимент по радиоактивному вытеснению, в котором ткань или клетки, соответствующие клеткам-мишеням, подвергают воздействию меченого (например, тритием) TM в присутствии избытка немеченого TM. В таком эксперименте можно оценивать относительное соотношение неспецифического и специфического связывания, тем самым позволяя подтверждение того, что TM связывается с клеткой-мишенью. Необязательно, анализ может включать один или несколько антагонистов связывания, и анализ, кроме того, может включать выявление снижения связывания TM. Примеры этого типа эксперимента могут быть найдены в Hulme, E.C. (1990), Receptor-binding studies, a brief outline, pp. 303-311, Receptor biochemistry, A Practical Approach, Ed. E.C. Hulme, Oxford University Press.Confirmation that TM binds to the selected target cell can be done in a standard manner. For example, a simple radioactive displacement experiment can be used in which tissue or cells corresponding to target cells are exposed to labeled (eg, tritium) TM in the presence of an excess of unlabeled TM. In such an experiment, the relative ratio of non-specific to specific binding can be assessed, thereby allowing confirmation that TM binds to the target cell. Optionally, the assay may include one or more binding antagonists, and the assay may further include detection of decreased TM binding. Examples of this type of experiment can be found in Hulme, E.C. (1990), Receptor-binding studies, a brief outline, pp. 303-311, Receptor biochemistry, A Practical Approach, Ed. E.C. Hulme, Oxford University Press.

В некоторых вариантах осуществления полипептиды по настоящему изобретению лишены функционального HC-домена клостридиального нейротоксина. Таким образом, указанные полипептиды неспособны связывать синаптосомальные мембраны крысы (через клостридиальный компонент HC) в анализах связывания, как описано в Shone et al. (1985) Eur. J. Biochem. 151, 75-82. В предпочтительном варианте осуществления полипептиды предпочтительно лишены последних 50 C-концевых аминокислот клостридиального нейротоксина голотоксина. В другом варианте осуществления полипептиды предпочтительно лишены последних 100, предпочтительно последних 150, более предпочтительно последних 200, особенно предпочтительно последних 250, и наиболее предпочтительно последних 300 C-концевых аминокислотных остатков клостридиального нейротоксина голотоксина. Альтернативно активность связывания HC может быть устранена/уменьшена посредством мутагенеза - в качестве примера, обращаясь к BoNT/ A для удобства, модификация посредством мутации одного или двух аминокислотных остатков (W1266 на L и Y1267 на F) в связывающем кармане ганглиозида приводит к утрате HC-областью ее функции связывания рецептора. Аналогичные мутации можно вносить в клостридиальные пептидные компоненты не серотипа A, например, в конструкцию на основе ботулинического токсина B с мутациями (W1262 на L и Y1263 на F) или ботулинического токсина E (W1224 на L и Y1225 на F). Другие мутации активного центра достигают того же устранения активности связывания HC-рецептора, например, Y1267S в ботулиническом токсине типа A и соответствующего высококонсервативного остатка в других клостридиальных нейротоксинах. Детали этих и других мутаций описаны в Rummel et al (2004) (Molecular Microbiol. 51:631-634), которая включена в настоящее описание в качестве ссылки.In some embodiments, the implementation of the polypeptides of the present invention lacks a functional H C -domain of clostridial neurotoxin. Thus, these polypeptides are unable to bind rat synaptosomal membranes (via the clostridial HC component) in binding assays as described in Shone et al. (1985) Euro. J Biochem. 151, 75-82. In a preferred embodiment, the polypeptides preferably lack the last 50 C-terminal amino acids of the clostridial neurotoxin holotoxin. In another embodiment, the polypeptides preferably lack the last 100, preferably the last 150, more preferably the last 200, particularly preferably the last 250, and most preferably the last 300 C-terminal amino acid residues of the clostridial neurotoxin holotoxin. Alternatively, HC binding activity can be abolished/reduced by mutagenesis - as an example, referring to BoNT/A for convenience, modification by mutation of one or two amino acid residues (W1266 to L and Y1267 to F) in the ganglioside binding pocket results in loss of H The C -region of its receptor binding function. Similar mutations can be introduced into non-serotype A clostridial peptide components, such as mutated botulinum toxin B constructs (W1262 on L and Y1263 on F) or botulinum toxin E (W1224 on L and Y1225 on F). Other active site mutations achieve the same elimination of HC receptor binding activity, for example, Y1267S in botulinum toxin type A and the corresponding highly conserved residue in other clostridial neurotoxins. Details of these and other mutations are described in Rummel et al (2004) (Molecular Microbiol. 51:631-634), which is incorporated herein by reference.

В другом варианте осуществления полипептиды по настоящему изобретению лишены функционального HC-домена клостридиального нейротоксина, а также лишены какого-либо функционально эквивалентного TM. Таким образом, указанные полипептиды лишены природной функции связывания клостридиального нейротоксина и неспособны связывать синаптосомальные мембраны крысы (через клостридиальный компонент HC или через любой функционально эквивалентный TM) в анализах связывания, как описано в Shone et al. (1985) Eur. J. Biochem. 151, 75-82.In another embodiment, the polypeptides of the present invention lack a functional clostridial neurotoxin H C domain and also lack any functionally equivalent TM. Thus, these polypeptides lack the natural clostridial neurotoxin binding function and are unable to bind rat synaptosomal membranes (via the clostridial HC component or via any functionally equivalent TM) in binding assays as described in Shone et al. (1985) Euro. J Biochem. 151, 75-82.

HC-пептид нативного клостридиального нейротоксина содержит приблизительно 400-440 аминокислотных остатков и состоит из двух функционально обособленных домена размером приблизительно 25 кДа каждый, а именно, N-концевой области (часто обозначаемой как пептид или домен HCN) и C-концевой области (часто обозначаемой как пептид или домен HCC). Этот факт подтверждается следующими публикациями, каждая из которых включена в настоящее описание в качестве ссылки в полном объеме: Umland TC (1997) Nat. Struct. Biol. 4: 788-792; Herreros J (2000) Biochem. J. 347: 199-204; Halpern J (1993) J. Biol. Chem. 268: 15, pp. 11188-11192; Rummel A (2007) PNAS 104: 359-364; Lacey DB (1998) Nat. Struct. Biol. 5: 898-902; Knapp (1998) Am. Cryst. Assoc. Abstract Papers 25: 90; Swaminathan and Eswaramoorthy (2000) Nat. Struct. Biol. 7: 1751-1759; и Rummel A (2004) Mol. Microbiol. 51(3), 631-643. Более того, широко известно, что C-концевая область (HCC), которая составляет C-концевые 160-200 аминокислотных остатков, ответственна за связывание клостридиального нейротоксина с его природными клеточным рецепторами, а именно, с нервными окончаниями в нервно-мышечном соединении - этот факт также подтвержден вышеописанными публикациями. Таким образом, указание на протяжении настоящего описания на клостридиальную тяжелую цепь, лишенную функционального HC-пептида (или домена) тяжелой цепи, так чтобы тяжелая цепь была неспособна связываться с рецепторами клеточной поверхности, с которыми связывается нативный клостридиальный нейротоксин, означает, что клостридиальная тяжелая цепь лишена функционального HCC-пептида. Иными словами, область HCC-пептида либо частично, либо полностью удалена или иным образом модифицирована (например, посредством общепринятой химической или протеолитической обработки) для инактивации ее нативной связывающей способности в отношении нервных окончаний в нервно-мышечном соединении.The HC peptide of a native clostridial neurotoxin contains approximately 400-440 amino acid residues and consists of two functionally distinct domains of approximately 25 kDa each, namely an N-terminal region (often referred to as a peptide or HCN domain) and a C-terminal region ( often referred to as a peptide or HCC domain). This fact is confirmed by the following publications, each of which is incorporated herein by reference in its entirety: Umland TC (1997) Nat. Struct. Biol. 4:788-792; Herreros J (2000) Biochem. J. 347: 199-204; Halpern J (1993) J. Biol. Chem. 268:15, pp. 11188-11192; Rummel A (2007) PNAS 104: 359-364; Lacey DB (1998) Nat. Struct. Biol. 5: 898-902; Knapp (1998) Am. Cryst. Assoc. Abstract Papers 25:90; Swaminathan and Eswaramoorthy (2000) Nat. Struct. Biol. 7: 1751-1759; and Rummel A (2004) Mol. microbiol. 51(3), 631-643. Moreover, it is widely known that the C-terminal region (H CC ), which makes up the C-terminal 160-200 amino acid residues, is responsible for the binding of clostridial neurotoxin to its natural cellular receptors, namely, nerve endings at the neuromuscular junction - this fact is also confirmed by the above publications. Thus, reference throughout this specification to a clostridial heavy chain lacking a functional heavy chain HC peptide (or domain) such that the heavy chain is unable to bind to cell surface receptors to which the native clostridial neurotoxin binds means that clostridial heavy chain the chain is devoid of a functional H CC peptide. In other words, the H CC region of the peptide is either partially or completely removed or otherwise modified (eg, by conventional chemical or proteolytic treatment) to inactivate its native nerve ending binding capacity at the neuromuscular junction.

Таким образом, в одном варианте осуществления клостридиальный пептид HN по настоящему изобретению лишен части C-концевого пептидного участка (HCC) клостридиального нейротоксина и, таким образом, лишен функции связывания HC нативного клостридиального нейротоксина. В качестве примера, в одном варианте осуществления удлиненный на C-конце клостридиальный HN-пептид лишен 40 C-концевых аминокислотных остатков или 60 C-концевых аминокислотных остатков, или 80 C-концевых аминокислотных остатков, или 100 C-концевых аминокислотных остатков, или 120 C-концевых аминокислотных остатков, или 140 C-концевых аминокислотных остатков, или 150 C-концевых аминокислотных остатков, или 160 C-концевых аминокислотных остатков тяжелой цепи клостридиального нейротоксина. В другом варианте осуществления клостридиальный HN-пептид по настоящему изобретению лишен целой C-концевой пептидной части (HCC) клостридиального нейротоксина и, таким образом, лишен функции связывания HC нативного клостридиального нейротоксина. В качестве примера, в одном варианте осуществления клостридиальный HN-пептид лишен 165 C-концевых аминокислотных остатков, или 170 C-концевых 170 аминокислотных остатков, или 175 C-концевых аминокислотных остатков, или 180 C-концевых аминокислотных остатков, или 185 C-концевых аминокислотных остатков, или 190 C-концевых аминокислотных остатков, или 195 C-концевых аминокислотных остатков тяжелой цепи клостридиального нейротоксина. В качестве следующего примера, клостридиальный HN-пептид по настоящему изобретению лишен клостридиальной эталонной последовательности HCC, выбранной из группы, состоящей из следующих:Thus, in one embodiment, the H N clostridial peptide of the present invention lacks a portion of the C-terminal peptide region (H CC ) of the clostridial neurotoxin and thus lacks the HC binding function of the native clostridial neurotoxin. As an example, in one embodiment, a C-terminally extended clostridial H N -peptide lacks 40 C-terminal amino acid residues, or 60 C-terminal amino acid residues, or 80 C-terminal amino acid residues, or 100 C-terminal amino acid residues, or 120 C-terminal amino acid residues, or 140 C-terminal amino acid residues, or 150 C-terminal amino acid residues, or 160 C-terminal amino acid residues of the clostridial neurotoxin heavy chain. In another embodiment, the clostridial H N -peptide of the present invention lacks the entire C-terminal peptide portion (H CC ) of the clostridial neurotoxin and thus lacks the HC binding function of the native clostridial neurotoxin. As an example, in one embodiment, the clostridial H N -peptide lacks 165 C-terminal amino acid residues, or 170 C-terminal 170 amino acid residues, or 175 C-terminal amino acid residues, or 180 C-terminal amino acid residues, or 185 C- terminal amino acid residues, or 190 C-terminal amino acid residues, or 195 C-terminal amino acid residues of the clostridial neurotoxin heavy chain. As a further example, the clostridial H N -peptide of the present invention lacks a clostridial H CC reference sequence selected from the group consisting of the following:

Ботулинический нейротоксин типа A - аминокислотные остатки (Y1111-L1296)Botulinum neurotoxin type A - amino acid residues (Y1111-L1296)

Ботулинический нейротоксин типа B - аминокислотные остатки (Y1098-E1291)Botulinum neurotoxin type B - amino acid residues (Y1098-E1291)

Ботулинический нейротоксин типа C - аминокислотные остатки (Y1112-E1291)Botulinum neurotoxin type C - amino acid residues (Y1112-E1291)

Ботулинический нейротоксин типа D - аминокислотные остатки (Y1099-E1276)Botulinum neurotoxin type D - amino acid residues (Y1099-E1276)

Ботулинический нейротоксин типа E - аминокислотные остатки (Y1086-K1252)Botulinum neurotoxin type E - amino acid residues (Y1086-K1252)

Ботулинический нейротоксин типа F - аминокислотные остатки (Y1106-E1274)Botulinum neurotoxin type F - amino acid residues (Y1106-E1274)

Ботулинический нейротоксин типа G - аминокислотные остатки (Y1106-E1297)Botulinum neurotoxin type G - amino acid residues (Y1106-E1297)

Столбнячный нейротоксин - аминокислотные остатки (Y1128-D1315).Tetanus neurotoxin - amino acid residues (Y1128-D1315).

Идентифицированные выше эталонные последовательности должны считаться определяющими, поскольку между подсеротипами может существовать небольшое варьирование.The reference sequences identified above should be considered definitive as there may be little variation between subserotypes.

Протеаза по настоящему изобретению охватывает все нецитотоксические протеазы, которые способны расщеплять один или несколько белков аппарата экзоцитарного слияния в эукариотических клетках.The protease of the present invention encompasses all non-cytotoxic proteases that are capable of cleaving one or more proteins of the exocytic fusion apparatus in eukaryotic cells.

Протеаза по настоящему изобретению предпочтительно представляет собой бактериальную протеазу (или ее фрагмент). Более предпочтительно, бактериальная протеаза выбрана из родов Clostridium или Neisseria/ Streptococcus (например, клостридиальная L-цепь, или IgA-протеаза нейсерий, предпочтительно из N. gonorrhoeae или S. pneumoniae).The protease of the present invention is preferably a bacterial protease (or a fragment thereof). More preferably, the bacterial protease is selected from the genera Clostridium or Neisseria/Streptococcus (eg, Clostridial L chain, or Neisseria IgA protease, preferably from N. gonorrhoeae or S. pneumoniae).

Настоящее изобретение также охватывает варианты нецитотоксических протеаз (т.е. варианты встречающихся в природе молекул протеаз) при условии, что варианты протеаз все еще демонстрируют требуемую протеазную активность. В качестве примера, вариант может обладать по меньшей мере 70%, предпочтительно по меньшей мере 80%, более предпочтительно по меньшей мере 90% и наиболее предпочтительно по меньшей мере 95 или по меньшей мере 98% гомологией аминокислотных последовательностей с эталонной последовательностью протеазы. Таким образом, термин вариант включает нецитотоксические протеазы, обладающие повышенной (или сниженной) эндопептидазной активностью - конкретно в настоящем описании упоминается повышенное значение Kcat/Km мутантов BoNT/A Q161A, E54A и K165L, см. Ahmed, S.A. (2008) Protein J. DOI 10.1007/s10930-007-9118-8, которая включена в качестве ссылки. Термин "фрагмент", когда его используют в отношении протеазы, как правило, означает пептид, имеющий по меньшей мере 150, предпочтительно по меньшей мере 200, более предпочтительно по меньшей мере 250 и наиболее предпочтительно по меньшей мере 300 аминокислотных остатков эталонной протеазы. Как и в случае компонента, представляющего собой "фрагмент" TM (описанный выше), протеазные "фрагменты" по настоящему изобретению охватывают фрагменты вариантов протеаз на основе эталонной последовательности.The present invention also encompasses non-cytotoxic protease variants (ie, variants of naturally occurring protease molecules), provided that the protease variants still exhibit the desired protease activity. By way of example, a variant may share at least 70%, preferably at least 80%, more preferably at least 90%, and most preferably at least 95 or at least 98% amino acid sequence homology with a protease reference sequence. Thus, the term variant includes non-cytotoxic proteases having increased (or decreased) endopeptidase activity - specifically, the present description refers to increased K cat /K m of BoNT/A mutants Q161A, E54A and K165L, see Ahmed, SA (2008) Protein J DOI 10.1007/s10930-007-9118-8, which is incorporated by reference. The term "fragment" when used in relation to a protease generally means a peptide having at least 150, preferably at least 200, more preferably at least 250, and most preferably at least 300 amino acid residues of a reference protease. As with the TM "fragment" component (described above), the protease "fragments" of the present invention encompass fragments of protease variants based on a reference sequence.

Протеаза по настоящему изобретению предпочтительно демонстрирует активность сериновой протеазы или металлопротеиназы (например, активность эндопептидазы). Протеаза предпочтительно является специфичной в отношении белка SNARE (например, SNAP-25, синаптобревин/VAMP или синтаксин).The protease of the present invention preferably exhibits serine protease or metalloproteinase activity (eg, endopeptidase activity). The protease is preferably specific for a SNARE protein (eg SNAP-25, synaptobrevin/VAMP or syntaxin).

В частности, могут быть упомянуты протеазные домены нейротоксинов, например, протеазные домены бактериальных нейротоксинов. Таким образом, настоящее изобретение охватывает применение доменов нейротоксинов, которые встречаются в природе, а также полученных рекомбинантными способами версий указанных встречающихся в природе нейротоксинов.In particular, the protease domains of neurotoxins may be mentioned, for example the protease domains of bacterial neurotoxins. Thus, the present invention encompasses the use of naturally occurring neurotoxin domains as well as recombinantly produced versions of said naturally occurring neurotoxins.

Иллюстративные нейротоксины продуцируются клостридиями, и термин "клостридиальный нейротоксин" охватывает нейротоксины, продуцируемые C. tetani (TeNT) и C. botulinum (BoNT) серотипов A-G, а также близкородственные BoNT-подобные нейротоксины, продуцируемые C. baratii и C. butyricum. На протяжении настоящего описания используются вышеупомянутые сокращенные обозначения. Например, номенклатура BoNT/A обозначает, что источником нейротоксина является BoNT (серотип A). Соответствующая номенклатура применима к другим серотипам BoNT.Exemplary neurotoxins are produced by clostridia, and the term "clostridial neurotoxin" encompasses neurotoxins produced by C. tetani (TeNT) and C. botulinum (BoNT) serotypes A-G, as well as closely related BoNT-like neurotoxins produced by C. baratii and C. butyricum. Throughout the present description, the aforementioned abbreviations are used. For example, the nomenclature BoNT/A indicates that the source of the neurotoxin is BoNT (serotype A). The corresponding nomenclature applies to other BoNT serotypes.

BoNT являются наиболее сильнодействующими из известных токсинов со срединной величиной летальной дозы (LD50) для мышей в диапазоне от 0,5 до 5 нг/кг в зависимости от серотипа. BoNT адсорбируются в желудочно-кишечном тракте и после попадания в общий кровоток связываются с пресинаптической мембраной холинэргических нервных окончаний и препятствуют высвобождению их нейротрансмиттера ацетилхолина. BoNT/B, BoNT/D, BoNT/F и BoNT/G расщепляют синаптобревин/ассоциированный с везикулами мембранный белок (VAMP); BoNT/C, BoNT/A и BoNT/E расщепляют ассоциированный с синаптосомами белок 25 кДа (SNAP-25); и BoNT/C расщепляет синтаксин.BoNTs are the most potent known toxins with a median lethal dose (LD50) in mice ranging from 0.5 to 5 ng/kg depending on serotype. BoNTs are adsorbed in the gastrointestinal tract and, after entering the general circulation, bind to the presynaptic membrane of cholinergic nerve endings and prevent the release of their neurotransmitter acetylcholine. BoNT/B, BoNT/D, BoNT/F and BoNT/G cleave synaptobrevin/vesicle-associated membrane protein (VAMP); BoNT/C, BoNT/A, and BoNT/E cleave a 25 kDa synaptosome-associated protein (SNAP-25); and BoNT/C cleaves the syntaxin.

BoNT обладают общей структурой, являясь двухцепочечными белками массой ~150 кДа, состоящими из тяжелой цепи (H-цепь) массой ~100 кДа, ковалентно связанной одной дисульфидной связью с легкой цепью (L-цепь) массой ~50 кДа. H-цепь состоит из двух доменов, каждый массой ~50 кДа. C-концевой домен (HC) необходим для высокоаффинного нейронального связывания, в то время как N-концевой домен (HN) предположительно вовлечен в транслокацию через мембрану. L-цепь представляет собой цинк-зависимую металлопротеиназу, ответственную за расщепление белка SNARE, являющегося субстратом.BoNTs share a common structure, being ~150 kDa double-stranded proteins consisting of a ~100 kDa heavy chain (H chain) covalently linked by a single disulfide bond to a ~50 kDa light chain (L chain). The H chain consists of two domains, each with a mass of ~50 kDa. The C-terminal domain (H C ) is required for high affinity neuronal binding, while the N-terminal domain (H N ) is thought to be involved in transmembrane translocation. The L chain is a zinc dependent metalloproteinase responsible for cleaving the substrate SNARE protein.

Термин фрагмент L-цепи означает компонент L-цепи нейротоксина, который демонстрирует активность металлопротеиназы и способен протеолитически расщеплять белок, ассоциированный с везикулами и/или плазматической мембраной, вовлеченный в клеточный экзоцитоз.The term L chain fragment means a component of the L chain of a neurotoxin that exhibits metalloproteinase activity and is capable of proteolytically cleaving a vesicle and/or plasma membrane associated protein involved in cellular exocytosis.

Примеры подходящих (эталонных) последовательностей протеаз включают:Examples of suitable (reference) protease sequences include:

Ботулинический нейротоксин типа A - аминокислотные остатки (1-448)Botulinum neurotoxin type A - amino acid residues (1-448)

Ботулинический нейротоксин типа B - аминокислотные остатки (1-440)Botulinum neurotoxin type B - amino acid residues (1-440)

Ботулинический нейротоксин типа C - аминокислотные остатки (1-441)Botulinum neurotoxin type C - amino acid residues (1-441)

Ботулинический нейротоксин типа D - аминокислотные остатки (1-445)Botulinum neurotoxin type D - amino acid residues (1-445)

Ботулинический нейротоксин типа E - аминокислотные остатки (1-422)Botulinum neurotoxin type E - amino acid residues (1-422)

Ботулинический нейротоксин типа F - аминокислотные остатки (1-439)Botulinum neurotoxin type F - amino acid residues (1-439)

Ботулинический нейротоксин типа G - аминокислотные остатки (1-441)Botulinum neurotoxin type G - amino acid residues (1-441)

Столбнячный нейротоксин - аминокислотные остатки (1-457)Tetanus neurotoxin - amino acid residues (1-457)

IgA-протеаза - аминокислотные остатки (1-959)*IgA protease - amino acid residues (1-959)*

* Pohlner, J. et al. (1987). Nature 325, pp. 458-462, которая включена в настоящее описание в качестве ссылки.*Pohlner, J. et al. (1987). Nature 325, pp. 458-462, which is incorporated herein by reference.

Для недавно идентифицированного BoNT/X было описано, что L-цепь соответствует его аминокислотам 1-439, причем граница L-цепи потенциально варьируется приблизительно на 25 аминокислот (например, 1-414 или 1-464).For the newly identified BoNT/X, the L chain has been described to correspond to its amino acids 1-439, with the L chain boundary potentially varying by about 25 amino acids (eg, 1-414 or 1-464).

Указанные выше эталонная последовательность должна рассматриваться в качестве ориентира, поскольку в зависимости от подсеротипов может встречаться небольшое варьирование. В качестве примера, в US 2007/0166332 (включенной в настоящее описание в качестве ссылки) цитированы несколько различающиеся клостридиальные последовательности:The above reference sequence should be considered as a guide as there may be slight variation between subserotypes. As an example, US 2007/0166332 (incorporated herein by reference) cites slightly different clostridial sequences:

Ботулинический нейротоксин типа A - аминокислотные остатки (M1-K448)Botulinum neurotoxin type A - amino acid residues (M1-K448)

Ботулинический нейротоксин типа B - аминокислотные остатки (M1-K441)Botulinum neurotoxin type B - amino acid residues (M1-K441)

Ботулинический нейротоксин типа C - аминокислотные остатки (M1-K449)Botulinum neurotoxin type C - amino acid residues (M1-K449)

Ботулинический нейротоксин типа D - аминокислотные остатки (M1-R445)Botulinum neurotoxin type D - amino acid residues (M1-R445)

Ботулинический нейротоксин типа E - аминокислотные остатки (M1-R422)Botulinum neurotoxin type E - amino acid residues (M1-R422)

Ботулинический нейротоксин типа F - аминокислотные остатки (M1-K439)Botulinum neurotoxin type F - amino acid residues (M1-K439)

Ботулинический нейротоксин типа G - аминокислотные остатки (M1-K446)Botulinum neurotoxin type G - amino acid residues (M1-K446)

Столбнячный нейротоксин - аминокислотные остатки (M1-A457).Tetanus neurotoxin - amino acid residues (M1-A457).

В аспектах настоящего изобретения могут использоваться различные фрагменты клостридиальных токсинов, содержащие легкую цепь, при условии, что эти фрагменты легкой цепи могут специфически нацеливаться на основные компоненты аппарата высвобождения нейротрансмиттеров и, таким образом, участвовать в осуществлении всего клеточного механизма, посредством которого клостридиальный токсин протеолитически расщепляет субстрат. Легкие цепи клостридиальных токсинов имеют длину приблизительно 420-460 аминокислот и содержат домен фермента. Исследование показало, что вся длина клостридиального токсина не является необходимой для ферментативной активности ферментного домена. В качестве неограничивающего примера, первые восемь аминокислот легкой цепи BoNT/A не являются необходимыми для ферментативной активности. В качестве другого неограничивающего примера, первые восемь аминокислот легкой цепи TeNT не являются необходимыми для ферментативной активности. Аналогично, карбоксильный конец легкой цепи не является необходимым для активности. В качестве неограничивающего примера, последние 32 аминокислоты легкой цепи BoNT/A (остатки 417-448) не являются необходимыми для ферментативной активности. В качестве другого неограничивающего примера, последняя 31 аминокислота легкой цепи TeNT (остатки 427-457) не является необходимой для ферментативной активности. Таким образом, аспекты этого варианта осуществления могут включать легкие цепи клостридиального токсина, содержащие ферментный домен, имеющий длину, например, по меньшей мере 350 аминокислот, по меньшей мере 375 аминокислот, по меньшей мере 400 аминокислот, по меньшей мере 425 аминокислот и по меньшей мере 450 аминокислот. Другие аспекты этого варианта осуществления могут включать легкие цепи клостридиального токсина, содержащие ферментный домен, имеющий длину, например, не более 350 аминокислот, не более 375 аминокислот, не более 400 аминокислот, не более 425 аминокислот и не более 450 аминокислот.Various light chain fragments of clostridial toxins can be used in aspects of the present invention, provided that these light chain fragments can specifically target major components of the neurotransmitter release apparatus and thus participate in the entire cellular machinery by which clostridial toxin proteolytically cleaves substrate. The light chains of clostridial toxins are approximately 420-460 amino acids in length and contain an enzyme domain. The study showed that the entire length of the clostridial toxin is not necessary for enzymatic activity of the enzymatic domain. As a non-limiting example, the first eight amino acids of the BoNT/A light chain are not essential for enzymatic activity. As another non-limiting example, the first eight amino acids of the TeNT light chain are not essential for enzymatic activity. Likewise, the carboxyl end of the light chain is not essential for activity. As a non-limiting example, the last 32 amino acids of the BoNT/A light chain (residues 417-448) are not essential for enzymatic activity. As another non-limiting example, the last 31 amino acids of the TeNT light chain (residues 427-457) are not required for enzymatic activity. Thus, aspects of this embodiment may include clostridial toxin light chains comprising an enzyme domain having a length of, for example, at least 350 amino acids, at least 375 amino acids, at least 400 amino acids, at least 425 amino acids, and at least 450 amino acids. Other aspects of this embodiment may include clostridial toxin light chains comprising an enzyme domain having a length of, for example, no more than 350 amino acids, no more than 375 amino acids, no more than 400 amino acids, no more than 425 amino acids, and no more than 450 amino acids.

Компонент нецитотоксической протеазы по настоящему изобретению предпочтительно содержит L-цепь серотипа BoNT/A, BoNT/B, BoNT/C, BoNT/D, BoNT/E, BoNT/F, BoNT/G или BoNT/X (или ее фрагмент или вариант).The non-cytotoxic protease component of the present invention preferably comprises an L chain of serotype BoNT/A, BoNT/B, BoNT/C, BoNT/D, BoNT/E, BoNT/F, BoNT/G or BoNT/X (or a fragment or variant thereof) .

Полипептиды по настоящему изобретению, особенно их протеазный компонент, могут быть пегилированными, это может помочь повысить стабильность, например, длительность действия протеазного компонента. Пегилирование является особенно предпочтительным, когда протеаза включает протеазу B или C1 BoNT/A. Пегилирование предпочтительно включает присоединение ПЭГ к N-концу протеазного компонента. В качестве примера, N-конец протеазы может быть удлинен на один или несколько аминокислотных остатков (например цистеин), которые могут быть одинаковыми или могут различаться. Один или несколько из указанных аминокислотных остатков могут иметь их собственную присоединенную к ним (например, ковалентно связанную) молекулу ПЭГ. Пример этой технологии описан в WO2007/104567, которая включена в качестве ссылки в полном объеме.The polypeptides of the present invention, especially their protease component, may be pegylated, which may help improve stability, eg, the duration of action of the protease component. PEGylation is particularly preferred when the protease includes BoNT/A protease B or C 1 . Pegylation preferably involves attaching a PEG to the N-terminus of the protease moiety. As an example, the N-terminus of the protease may be extended by one or more amino acid residues (eg cysteine), which may be the same or may be different. One or more of these amino acid residues may have their own attached (eg, covalently linked) PEG molecule. An example of this technology is described in WO2007/104567, which is incorporated by reference in its entirety.

Домен транслокации представляет собой молекулу, которая обеспечивает транслокацию протеазы в клетку-мишень, так чтобы в цитозоле клетки-мишени происходило функциональное проявление протеазной активности. Наличие у какой-либо молекулы (например, белка или пептида) требуемой функции транслокации по настоящему изобретению может быть подтверждено любым из ряда общепринятых способов анализа.A translocation domain is a molecule that allows for the translocation of a protease into a target cell such that functional expression of protease activity occurs in the cytosol of the target cell. The presence of any molecule (eg, protein or peptide) of the desired translocation function of the present invention can be confirmed by any of a number of conventional methods of analysis.

Например, Shone C. (1987) описал способ анализа in vitro с использованием липосом, нагруженных тестируемой молекулой. Присутствие требуемой функции транслокации подтверждают по высвобождению из липосом K+ и/или меченого NAD, мониторинг которого можно без труда проводить [см. Shone C. (1987) Eur. J. Biochem; vol. 167(1): pp. 175-180].For example, Shone C. (1987) described an in vitro assay method using liposomes loaded with a test molecule. The presence of the desired translocation function is confirmed by the release from liposomes of K + and/or labeled NAD, which can be easily monitored [see. Shone C. (1987) Eur. J. Biochem; vol. 167(1): pp. 175-180].

Следующий пример предоставлен Blaustein R. (1987), где описан простой анализ in vitro с использованием плоских фосфолипидных бислойных мембран. Мембраны нагружают тестируемой молекулой и требуемую функцию транслокации подтверждают повышением проводимости через указанные мембраны [см. Blaustein (1987) FEBS Letts; vol. 226, no. 1: pp. 115-120].The following example is provided by Blaustein R. (1987), which describes a simple in vitro assay using planar phospholipid bilayer membranes. The membranes are loaded with the test molecule and the desired translocation function is confirmed by increasing the conductivity across said membranes [cf. Blaustein (1987) F.E.B.S. Letts; vol. 226, no. 1: pp. 115-120].

Дополнительная методология обеспечения оценки слияния мембран и, таким образом, идентификации доменов транслокации, пригодных для применения в рамках настоящего изобретения, представлена в Methods in Enzymology Vol 220 and 221, Membrane Fusion Techniques, Parts A and B, Academic Press 1993.Additional methodology for providing evaluation of membrane fusion and thus identification of translocation domains suitable for use in the present invention is provided in Methods in Enzymology Vol 220 and 221, Membrane Fusion Techniques, Parts A and B, Academic Press 1993.

Настоящее изобретение также охватывает варианты доменов транслокации, предпочтительно при условии, что варианты доменов все еще демонстрируют требуемую активность транслокации. В качестве примера, вариант может обладать по меньшей мере 70%, предпочтительно по меньшей мере 80%, более предпочтительно по меньшей мере 90%, и наиболее предпочтительно по меньшей мере 95% или по меньшей мере 98% гомологией аминокислотной последовательности с эталонным доменом транслокации. Термин "фрагмент", когда его используют в отношении домена транслокации, означает пептид, имеющий по меньшей мере 20, предпочтительно по меньшей мере 40, более предпочтительно по меньшей мере 80, и наиболее предпочтительно по меньшей мере 100 аминокислотных остатков эталонного домена транслокации. В случае клостридиального домена транслокации, фрагмент предпочтительно имеет по меньшей мере 100, предпочтительно по меньшей мере 150, более предпочтительно по меньшей мере 200, и наиболее предпочтительно по меньшей мере 250 аминокислотных остатков эталонного домена транслокации (например, HN-домена). Что касается компонента в виде "фрагмента" TM (описанного выше), "фрагменты" транслокации по настоящему изобретению охватывают фрагменты вариантов доменов транслокации на основе эталонных последовательностей.The present invention also encompasses translocation domain variants, preferably as long as the domain variants still exhibit the desired translocation activity. By way of example, a variant may share at least 70%, preferably at least 80%, more preferably at least 90%, and most preferably at least 95% or at least 98% amino acid sequence homology with the translocation reference domain. The term "fragment" when used in relation to a translocation domain means a peptide having at least 20, preferably at least 40, more preferably at least 80, and most preferably at least 100 amino acid residues of a translocation reference domain. In the case of a clostridial translocation domain, the fragment preferably has at least 100, preferably at least 150, more preferably at least 200, and most preferably at least 250 amino acid residues of the translocation reference domain (eg, H N -domain). With respect to the TM “fragment” component (described above), translocation “fragments” of the present invention encompass fragments of translocation domain variants based on reference sequences.

Домен транслокации предпочтительно способен образовывать проницаемые для ионов поры в липидных мембранах в условиях низкого значения pH. Предпочтительно было обнаружено, что могут использоваться только те части белковой молекулы, которые способны к образованию пор в эндосомальной мембране.The translocation domain is preferably capable of forming ion-permeable pores in lipid membranes under low pH conditions. Preferably, it has been found that only those portions of the protein molecule capable of forming pores in the endosomal membrane can be used.

Домен транслокации может быть получен из микробного источника белка, в частности, из бактериального или вирусного источника белка. Таким образом, в одном варианте осуществления домен транслокации представляет собой транслоцирующийся домен фермента, такой как бактериальный токсин или вирусный белок.The translocation domain may be derived from a microbial protein source, in particular a bacterial or viral protein source. Thus, in one embodiment, the translocation domain is a translocation domain of an enzyme, such as a bacterial toxin or a viral protein.

Хорошо известно, что определенные домены молекул бактериальных токсинов способны образовывать такие поры. Также известно, что определенные домены транслокации экспрессируемых вирусами мембранных белков слияния способны образовывать такие поры. Такие домены могут использоваться в рамках настоящего изобретения.It is well known that certain domains of bacterial toxin molecules are capable of forming such pores. It is also known that certain translocation domains of virally expressed membrane fusion proteins are capable of forming such pores. Such domains may be used within the scope of the present invention.

Домен транслокации может быть клостридиального происхождения, такой как HN-домен (или его функциональный компонент). HN означает часть или фрагмент H-цепи клостридиального нейротоксина, приблизительно эквивалентную N-концевой половине H-цепи, или домен, соответствующий фрагменту интактной H-цепи. H-цепь может быть лишена натуральной функции связывания HC-компонента H-цепи. В некоторых вариантах осуществления функция HC может быть устранена посредством делеции аминокислотной последовательности HC (либо на уровне синтеза ДНК, либо на уровне после синтеза посредством обработки нуклеазой или протеазой). Альтернативно в некоторых вариантах осуществления функция HC может быть инактивирована посредством химической или биологической обработки. Таким образом, в некоторых вариантах осуществления H-цепь не способна связываться с участком связывания на клетке-мишени, с которой связывается нативный клостридиальный нейротоксин (т.е. голотоксин).The translocation domain may be of clostridial origin, such as the H N domain (or a functional component thereof). H N denotes a portion or fragment of the H chain of a clostridial neurotoxin approximately equivalent to the N-terminal half of the H chain, or a domain corresponding to a fragment of an intact H chain. The H chain may be deprived of the natural binding function of the H C component of the H chain. In some embodiments, HC function can be abolished by deletion of the HC amino acid sequence (either at the level of DNA synthesis or at the post-synthesis level via nuclease or protease treatment). Alternatively, in some embodiments, the HC function may be inactivated by chemical or biological treatment. Thus, in some embodiments, the H chain is unable to bind to a binding site on a target cell to which native clostridial neurotoxin (ie, holotoxin) binds.

Примеры походящих (эталонных) доменов транслокации включают:Examples of suitable (reference) translocation domains include:

Ботулинический нейротоксин типа A - аминокислотные остатки (449-871)Botulinum neurotoxin type A - amino acid residues (449-871)

Ботулинический нейротоксин типа B - аминокислотные остатки (441-858)Botulinum neurotoxin type B - amino acid residues (441-858)

Ботулинический нейротоксин типа C - аминокислотные остатки (442-866)Botulinum neurotoxin type C - amino acid residues (442-866)

Ботулинический нейротоксин типа D - аминокислотные остатки (446-862)Botulinum neurotoxin type D - amino acid residues (446-862)

Ботулинический нейротоксин типа E - аминокислотные остатки (423-845)Botulinum neurotoxin type E - amino acid residues (423-845)

Ботулинический нейротоксин типа F - аминокислотные остатки (440-864)Botulinum neurotoxin type F - amino acid residues (440-864)

Ботулинический нейротоксин типа G - аминокислотные остатки (442-863)Botulinum neurotoxin type G - amino acid residues (442-863)

Столбнячный нейротоксин - аминокислотные остатки (458-879).Tetanus neurotoxin - amino acid residues (458-879).

Идентифицированная выше эталонная последовательность должна считаться ориентиром, поскольку в зависимости от подсеротипов может встречаться небольшое варьирование. В качестве примера, в US 2007/0166332 (включенной в настоящее описание в качестве ссылки) цитированы несколько различающиеся клостридиальные последовательности:The reference sequence identified above should be considered as a guide, as there may be slight variation between subserotypes. As an example, US 2007/0166332 (incorporated herein by reference) cites slightly different clostridial sequences:

Ботулинический нейротоксин типа A - аминокислотные остатки (A449-K871)Botulinum neurotoxin type A - amino acid residues (A449-K871)

Ботулинический нейротоксин типа B - аминокислотные остатки (A442-S858)Botulinum neurotoxin type B - amino acid residues (A442-S858)

Ботулинический нейротоксин типа C - аминокислотные остатки (T450-N866)Botulinum neurotoxin type C - amino acid residues (T450-N866)

Ботулинический нейротоксин типа D - аминокислотные остатки (D446-N862)Botulinum neurotoxin type D - amino acid residues (D446-N862)

Ботулинический нейротоксин типа E - аминокислотные остатки (K423-K845)Botulinum neurotoxin type E - amino acid residues (K423-K845)

Ботулинический нейротоксин типа F - аминокислотные остатки (A440-K864)Botulinum neurotoxin type F - amino acid residues (A440-K864)

Ботулинический нейротоксин типа G - аминокислотные остатки (S447-S863)Botulinum neurotoxin type G - amino acid residues (S447-S863)

Столбнячный нейротоксин - аминокислотные остатки (S458-V879).Tetanus neurotoxin - amino acid residues (S458-V879).

В контексте настоящего изобретения в аспектах настоящего изобретения могут использоваться различные области HN клостридиального токсина, содержащего домен транслокации, предпочтительно при условии, что эти активные фрагменты могут способствовать высвобождению нецитотоксической протеазы (например, клостридиальной L-цепи) из внутриклеточных везикул в цитоплазму клетки-мишени и, таким образом, участвовать в осуществлении всего клеточного механизма, посредством которого клостридиальный токсин протеолитически расщепляет субстрат. Области HN из тяжелых цепей клостридиальных токсинов имеют длину приблизительно 410-430 аминокислот и содержат домен транслокации. Исследование показало, что вся длина HN-области тяжелой цепи клостридиального токсина не является необходимой для активности транслокации домена транслокации. Таким образом, аспекты этого варианта осуществления могут включать области HN клостридиального токсина, содержащие домен транслокации, имеющий длину, например, по меньшей мере 350 аминокислот, по меньшей мере 375 аминокислот, по меньшей мере 400 аминокислот и по меньшей мере 425 аминокислот. Другие аспекты этого варианта осуществления могут включать области HN клостридиального токсина, содержащие домен транслокации, имеющий длину, например, не более 350 аминокислот, не более 375 аминокислот, не более 400 аминокислот и не более 425 аминокислот.In the context of the present invention, various H N regions of a clostridial toxin containing a translocation domain can be used in aspects of the present invention, preferably provided that these active moieties can promote the release of a non-cytotoxic protease (e.g., the clostridial L chain) from intracellular vesicles into the cytoplasm of the target cell and thus participate in the entire cellular mechanism by which the clostridial toxin proteolytically cleaves the substrate. The H N regions of the heavy chains of clostridial toxins are approximately 410-430 amino acids in length and contain a translocation domain. The study showed that the entire length of the Clostridium toxin heavy chain H N region is not necessary for translocation domain translocation activity. Thus, aspects of this embodiment may include Clostridial toxin H N regions comprising a translocation domain having a length of, for example, at least 350 amino acids, at least 375 amino acids, at least 400 amino acids, and at least 425 amino acids. Other aspects of this embodiment may include Clostridial toxin H N regions comprising a translocation domain having a length of, for example, no more than 350 amino acids, no more than 375 amino acids, no more than 400 amino acids, and no more than 425 amino acids.

Для дальнейших деталей, касающихся генетической основы продуцирования токсинов в Clostridium botulinum и C. tetani, см. Henderson et al (1997) в The Clostridia: Molecular Biology and Pathogenesis, Academic press.For further details regarding the genetic basis of toxin production in Clostridium botulinum and C. tetani, see Henderson et al (1997) in The Clostridia: Molecular Biology and Pathogenesis, Academic press.

Термин "HN" охватывает встречающиеся в природе части нейротоксина HN и модифицированные части HN, имеющие аминокислотные последовательности, которые не встречаются в природе, и/или синтетические аминокислотные остатки, предпочтительно при условии, что модифицированные части HN все еще демонстрируют вышеупомянутую функцию транслокации.The term "H N " encompasses naturally occurring portions of the neurotoxin H N and modified portions of H N having amino acid sequences that are not naturally occurring and/or synthetic amino acid residues, preferably as long as the modified portions of H N still exhibit the aforementioned function. translocations.

Альтернативно домен транслокации может иметь неклостридиальное происхождение. Примеры источников неклостридиальных (этолонных) доменов транслокации включают, но не ограничиваются ими, домен транслокации дифтерийного токсина [O’Keefe et al., Proc. Natl. Acad. Sci. USA (1992) 89, 6202-6206; Silverman et al., J. Biol. Chem. (1993) 269, 22524-22532; and London, E. (1992) Biochem. Biophys. Acta., 1112, pp.25-51], домен транслокации экзотоксина типа A Pseudomonas [Prior et al. Biochemistry (1992) 31, 3555-3559], домены транслокации токсина сибирской язвы [Blanke et al. Proc. Natl. Acad. Sci. USA (1996) 93, 8437-8442], различные фузогенные или гидрофобные пептиды с функцией транслокации [Plank et al. J. Biol. Chem. (1994) 269, 12918-12924; и Wagner et al (1992) PNAS, 89, pp.7934-7938], и амфифильные пептиды [Murata et al. (1992) Biochem., 31, pp.1986-1992]. Домен транслокации может соответствовать домену транслокации, присутствующему во встречающемся в природе белке, или может включать варьирование аминокислот, предпочтительно при условии, что варьирование не нарушает способности к транслокации у домена транслокации.Alternatively, the translocation domain may be of non-clostridial origin. Examples of sources of non-clostridial (reference) translocation domains include, but are not limited to, the diphtheria toxin translocation domain [O'Keefe et al., Proc. Natl. Acad. sci. USA (1992) 89, 6202-6206; Silverman et al., J. Biol. Chem. (1993) 269, 22524-22532; and London, E. (1992) Biochem. Biophys. Acta., 1112, pp.25-51], Pseudomonas type A exotoxin translocation domain [Prior et al. Biochemistry (1992) 31, 3555-3559], anthrax toxin translocation domains [Blanke et al. Proc. Natl. Acad. sci. USA (1996) 93, 8437-8442], various fusogenic or hydrophobic peptides with translocation function [Plank et al. J Biol. Chem. (1994) 269, 12918-12924; and Wagner et al (1992) PNAS, 89, pp. 7934-7938], and amphiphilic peptides [Murata et al. (1992) Biochem., 31, pp. 1986-1992]. The translocation domain may correspond to a translocation domain present in a naturally occurring protein, or may include amino acid variation, preferably as long as the variation does not impair the translocation capability of the translocation domain.

Конкретные примеры вирусных (эталонных) доменов транслокации, пригодных для применения в рамках настоящего изобретения, включают определенные домены транслокации экспрессируемые вирусами мембранных белков слияния. Например, Wagner et al. (1992) и Murata et al. (1992) описывают функцию к транслокации (т.е. слияние с мембраной и везикуляция) ряда фузогенных и амфифильных пептидов, происходящих из N-концевой области гемагглютинина вируса гриппа. Другие экспрессируемые вирусами мембранные белки слияния, известные тем, что они обладают желаемой активностью транслокации, представляют собой домен транслокации фузогенного пептида вируса леса Семлики (SFV), домен транслокации гликопротеина G вируса везикулярного стоматита (VSV), домен транслокации F-белка вируса SER и домен транслокации гликопротеина оболочки пенящих вирусов. Кодируемые вирусами белки Aspike являются особенно применимыми в контексте настоящего изобретения, например, белок E1 SFV и белок G VSV.Specific examples of viral (reference) translocation domains suitable for use in the present invention include certain translocation domains expressed by viruses of membrane fusion proteins. For example, Wagner et al. (1992) and Murata et al. (1992) describe the translocation function (ie, membrane fusion and vesiculation) of a number of fusogenic and amphiphilic peptides derived from the N-terminal region of influenza virus hemagglutinin. Other virally expressed membrane fusion proteins known to have desirable translocation activity are the Semliki Forest Virus (SFV) fusogenic peptide translocation domain, the vesicular stomatitis virus (VSV) G glycoprotein translocation domain, the SER virus F protein translocation domain, and the translocation of the envelope glycoprotein of foaming viruses. Viral encoded Aspike proteins are particularly useful in the context of the present invention, eg SFV E1 protein and VSV G protein.

Использование (эталонных) доменов транслокации, приведенных в таблице (ниже), включает применение их вариантов последовательности. Вариант может содержать одну или несколько консервативных замен нуклеиновых кислот, и/ или делеций или вставок нуклеиновых кислот, предпочтительно при условии, что вариант обладает требуемой функцией транслокации. Вариант также может содержать одну или несколько аминокислотных замен и/или делеций или вставок аминокислот, предпочтительно при условии, что вариант обладает требуемой функцией транслокации.The use of the (reference) translocation domains shown in the table (below) includes the use of their sequence variants. The variant may contain one or more conservative nucleic acid substitutions and/or deletions or insertions of nucleic acids, preferably provided that the variant has the desired translocation function. The variant may also contain one or more amino acid substitutions and/or amino acid deletions or insertions, preferably provided that the variant has the desired translocation function.

Источник домена транслокации Source of translocation domain Аминокислотные остаткиAmino acid residues СсылкиLinks Дифтерийный токсинdiphtheria toxin 194-380194-380 Silverman et al., 1994, J. Biol. Chem. 269, 22524-22532
London E., 1992, Biochem. Biophys. Acta., 1113, 25-51
Silverman et al., 1994, J. Biol. Chem. 269, 22524-22532
London E., 1992, Biochem. Biophys. Acta., 1113, 25-51
Домен II экзотоксина pseudomonas Domain II of pseudomonas exotoxin 405-613405-613 Prior et al., 1992, Biochemistry 31, 3555-3559
Kihara & Pastan, 1994, Bioconj Chem. 5, 532-538
Prior et al., 1992, Biochemistry 31, 3555-3559
Kihara & Pastan, 1994, Bioconj Chem. 5, 532-538
Гемагглютинин вируса гриппа Influenza virus hemagglutinin GLFGAIAGFIENGWEGMIDGWYG (SEQ ID NO: 101), и
Его варианты
GLFGAIAGFIENGWEGMIDGWYG (SEQ ID NO: 101), and
Its variants
Plank et al., 1994, J. Biol. Chem. 269, 12918-12924
Wagner et al., 1992, PNAS, 89, 7934-7938
Murata et al., 1992, Biochemistry 31, 1986-1992
Plank et al., 1994, J. Biol. Chem. 269, 12918-12924
Wagner et al., 1992, PNAS 89, 7934-7938
Murata et al., 1992, Biochemistry 31, 1986-1992
Фузогенный белок вируса леса СемликиFusogenic protein of Semliki forest virus Домен транслокацииTranslocation domain Kielian et al., 1996, J Cell Biol. 134(4), 863-872Kielian et al., 1996, J Cell Biol. 134(4), 863-872 Гликопротеин G вируса везикулярного стоматита Glycoprotein G of vesicular stomatitis virus 118-139118-139 Yao et al., 2003, Virology 310(2), 319-332Yao et al., 2003, Virology 310(2), 319-332 F-белок вируса SER SER virus F protein Домен транслокацииTranslocation domain Seth et al., 2003, J Virol 77(11) 6520-6527Seth et al., 2003, J Virol 77(11) 6520-6527 Гликопротеин оболочки пенящего вируса гликопротеинFoaming virus envelope glycoprotein glycoprotein Домен транслокацииTranslocation domain Picard- Maureau et al., 2003, J Virol. 77(8), 4722-4730Picard-Maureau et al., 2003, J Virol. 77(8), 4722-4730

Примеры эталонных последовательностей домена HC клостридиального нейротоксина включают:Examples of clostridial neurotoxin H C domain reference sequences include:

BoNT/A - N872-L1296BoNT/A - N872-L1296

BoNT/B - E859-E1291BoNT/B - E859-E1291

BoNT/C1 - N867-E1291BoNT/C1 - N867-E1291

BoNT/D - S863-E1276BoNT/D - S863-E1276

BoNT/E - R846-K1252BoNT/E - R846-K1252

BoNT/F - K865-E1274BoNT/F - K865-E1274

BoNT/G - N864-E1297BoNT/G - N864-E1297

TeNT - I880-D1315.TeNT - I880-D1315.

Для недавно идентифицированного BoNT/X, HC-домен был описан в качестве соответствующего его аминокислотам 893-1306, причем границы домена потенциально варьируются в пределах приблизительно 25 аминокислот (например, 868-1306 или 918-1306).For the newly identified BoNT/X, the HC domain has been described as corresponding to its amino acids 893-1306, with domain boundaries potentially varying by about 25 amino acids (eg, 868-1306 or 918-1306).

Полипептиды по настоящему изобретению, кроме того, могут содержать способствующий транслокации домен. Указанный домен способствует доставке нецитотоксической протеазы в цитозоль клетки-мишени и описан, например, в WO 08/008803 и WO 08/008805, каждая из которых включена в настоящее описание в качестве ссылки.The polypeptides of the present invention may also contain a translocation promoting domain. The specified domain facilitates the delivery of non-cytotoxic protease into the cytosol of the target cell and is described, for example, in WO 08/008803 and WO 08/008805, each of which is incorporated herein by reference.

В качестве примера, подходящие способствующие транслокации домены включают домен фузогенного пептида оболочечного вируса, например, подходящие домены фузогенных пептидов включают домен фузогенного пептида вируса гриппа (например, домен фузогенного пептида вируса гриппа A из 23 аминокислот), домен фузогенного пептида альфавируса (например, домен фузогенного пептида вируса леса Семлики из 26 аминокислот), домен фузогенного пептида везикуловируса (например, домен фузогенного пептида вируса везикулярного стоматита из 21 аминокислоты), домен фузогенного пептида респировируса (например, домен фузогенного пептида вируса Сендай из 25 аминокислот), домен фузогенного пептида морбиливируса (например, домен фузогенного пептида вируса собачьей чумы из 25 аминокислот), домен фузогенного пептида авулавируса (например, домен фузогенного пептида вируса болезни Ньюкасла из 25 аминокислот), домен фузогенного пептида хенипавируса (например, домен фузогенного пептида вируса Хендра из 25 аминокислот), домен фузогенного пептида метапневмовируса (например, домен фузогенного пептида метапневмовируса человека из 25 аминокислот) или домен фузогенного пептида спумавируса, такой как домен фузогенного пептида пенящего вируса обезьян; или их фрагменты или варианты.By way of example, suitable translocation promoting domains include an enveloped virus fusogenic peptide domain, e.g., suitable fusogenic peptide domains include an influenza virus fusogenic peptide domain (e.g., a 23 amino acid influenza A virus fusogenic peptide domain), an alphavirus fusogenic peptide domain (e.g., a fusogenic peptide domain). vesiculovirus fusogenic peptide domain (e.g., 21 amino acid vesicular stomatitis virus fusogenic peptide domain), respirovirus fusogenic peptide domain (e.g., 25 amino acid Sendai virus fusogenic peptide domain), morbilivirus fusogenic peptide domain (e.g. , 25 amino acid canine distemper virus fusogenic peptide domain), avulavirus fusogenic peptide domain (e.g., 25 amino acid Newcastle disease virus fusogenic peptide domain), henipavirus fusogenic peptide domain (e.g., 25 amino acid Hendra virus fusogenic peptide domain), fusogenic peptide domain a metapneumovirus (eg, a 25 amino acid human metapneumovirus fusogenic peptide domain) or a spumavirus fusogenic peptide domain, such as a simian foaming virus fusogenic peptide domain; or their fragments or variants.

В качестве следующего примера, способствующий транслокации домен может включать домен HCN клостридиального токсина или его фрагмент или вариант. Более подробно, способствующий транслокации домен HCN клостридиального токсина может иметь длину по меньшей мере 200 аминокислот, по меньшей мере 225 аминокислот, по меньшей мере 250 аминокислот, по меньшей мере 275 аминокислот. В связи с этим способствующий транслокации домен HCN клостридиального токсина предпочтительно имеет длину не более 200 аминокислот, не более 225 аминокислот, не более 250 аминокислот или не более 275 аминокислот. Конкретные (эталонные) примеры включают:As a further example, a translocation promoting domain may include the H CN domain of a clostridial toxin, or a fragment or variant thereof. In more detail, the translocation promoting domain H CN of the clostridial toxin may be at least 200 amino acids long, at least 225 amino acids long, at least 250 amino acids long, at least 275 amino acids long. Therefore, the translocation promoting domain H CN of the clostridial toxin is preferably no more than 200 amino acids, no more than 225 amino acids, no more than 250 amino acids, or no more than 275 amino acids. Specific (reference) examples include:

Ботулинический нейротоксин типа A - аминокислотные остатки (872-1110)Botulinum neurotoxin type A - amino acid residues (872-1110)

Ботулинический нейротоксин типа B - аминокислотные остатки (859-1097)Botulinum neurotoxin type B - amino acid residues (859-1097)

Ботулинический нейротоксин типа C - аминокислотные остатки (867-1111)Botulinum neurotoxin type C - amino acid residues (867-1111)

Ботулинический нейротоксин типа D - аминокислотные остатки (863-1098)Botulinum neurotoxin type D - amino acid residues (863-1098)

Ботулинический нейротоксин типа E - аминокислотные остатки (846-1085)Botulinum neurotoxin type E - amino acid residues (846-1085)

Ботулинический нейротоксин типа F - аминокислотные остатки (865-1105)Botulinum neurotoxin type F - amino acid residues (865-1105)

Ботулинический нейротоксин типа G - аминокислотные остатки (864-1105)Botulinum neurotoxin type G - amino acid residues (864-1105)

Столбнячный нейротоксин - аминокислотные остатки (880-1127).Tetanus neurotoxin - amino acid residues (880-1127).

Указанные выше положения последовательностей могут несколько варьироваться в зависимости от серотипа/ подтипа, и следующие примеры подходящих (эталонных) доменов HCN клостридиального токсина включают:The above sequence positions may vary somewhat depending on the serotype/subtype, and the following examples of suitable (reference) clostridial toxin H CN domains include:

Ботулинический нейротоксин типа A - аминокислотные остатки (874-1110)Botulinum neurotoxin type A - amino acid residues (874-1110)

Ботулинический нейротоксин типа B - аминокислотные остатки (861-1097)Botulinum neurotoxin type B - amino acid residues (861-1097)

Ботулинический нейротоксин типа C - аминокислотные остатки (869-1111)Botulinum neurotoxin type C - amino acid residues (869-1111)

Ботулинический нейротоксин типа D - аминокислотные остатки (865-1098)Botulinum neurotoxin type D - amino acid residues (865-1098)

Ботулинический нейротоксин типа E - аминокислотные остатки (848-1085)Botulinum neurotoxin type E - amino acid residues (848-1085)

Ботулинический нейротоксин типа F - аминокислотные остатки (867-1105)Botulinum neurotoxin type F - amino acid residues (867-1105)

Ботулинический нейротоксин типа G - аминокислотные остатки (866-1105)Botulinum neurotoxin type G - amino acid residues (866-1105)

Столбнячный нейротоксин - аминокислотные остатки (882-1127).Tetanus neurotoxin - amino acid residues (882-1127).

Любые из описанных выше способствующих доменов можно комбинировать с любыми из ранее описанных пептидов доменов транслокации, которые пригодны для применения в рамках настоящего изобретения. Таким образом, в качестве примера, неклостридиальный способствующий домен можно комбинировать с пептидом неклостридиального домена транслокации или с пептидом транслокации клостридиального домена. Альтернативно способствующий транслокации домен HCN клостридиального токсина можно комбинировать с пептидом неклостридиального домена транслокации. Альтернативно, способствующий домен HCN клостридиального токсина можно комбинировать с пептидом клостридиального домена транслокации, примеры которого включают:Any of the facilitating domains described above can be combined with any of the previously described translocation domain peptides that are suitable for use in the present invention. Thus, by way of example, a non-clostridial facilitating domain can be combined with a non-clostridial translocation domain peptide or with a clostridial domain translocation peptide. Alternatively, the translocation promoting domain H CN of a clostridial toxin can be combined with a peptide of a non-clostridial translocation domain. Alternatively, the clostridial toxin H CN promoting domain can be combined with a clostridial translocation domain peptide, examples of which include:

Ботулинический нейротоксин типа A - аминокислотные остатки (449-1110)Botulinum neurotoxin type A - amino acid residues (449-1110)

Ботулинический нейротоксин типа B - аминокислотные остатки (442-1097)Botulinum neurotoxin type B - amino acid residues (442-1097)

Ботулинический нейротоксин типа C - аминокислотные остатки (450-1111)Botulinum neurotoxin type C - amino acid residues (450-1111)

Ботулинический нейротоксин типа D - аминокислотные остатки (446-1098)Botulinum neurotoxin type D - amino acid residues (446-1098)

Ботулинический нейротоксин типа E - аминокислотные остатки (423-1085)Botulinum neurotoxin type E - amino acid residues (423-1085)

Ботулинический нейротоксин типа F - аминокислотные остатки (440-1105)Botulinum neurotoxin type F - amino acid residues (440-1105)

Ботулинический нейротоксин типа G - аминокислотные остатки (447-1105)Botulinum neurotoxin type G - amino acid residues (447-1105)

Столбнячный токсин - аминокислотные остатки (458-1127).Tetanus toxin - amino acid residues (458-1127).

Предусматривается, что варианты осуществления, касающиеся различных способов, в равной степени применимы к другим способом, полипептидам, например, полипептидам, пригодным для мечения или меченым полипептидам, нуклеиновым кислотам, и наоборот.It is contemplated that embodiments relating to various methods are equally applicable to other methods, polypeptides, eg, labelable or labeled polypeptides, nucleic acids, and vice versa.

ГОМОЛОГИЯ ПОСЛЕДОВАТЕЛЬНОСТЕЙSEQUENCE HOMOLOGY

Для определения процентной идентичности можно использовать любой из различных способов выравнивания, включая, но не ограничиваясь ими, глобальные способы, локальные способы и гибридные способы, например, такие как способы сегментного подхода. Протоколы для определения процентной идентичности являются стандартными методиками, входящим в объем способностей специалиста в данной области. Глобальные способы выравнивают последовательности сначала до конца молекулы и определяют наилучшее выравнивание путем суммирования показателей индивидуальных пар остатков и путем применения штрафов за пропуски. Неограничивающие способы включают, например, CLUSTAL W, см., например, Julie D. Thompson et al., CLUSTAL W: Improving the Sensitivity of Progressive Multiple Sequence Alignment Through Sequence Weighting, Position-Specific Gap Penalties and Weight Matrix Choice, 22(22) Nucleic Acids Research 4673-4680 (1994); и итеративное уточнение, см., например, Osamu Gotoh, Significant Improvement in Accuracy of Multiple Protein Sequence Alignments by Iterative Refinement as Assessed by Reference to Structural Alignments, 264(4) J. MoI. Biol. 823-838 (1996). Локальные способы выравнивают последовательности посредством идентификации одного или нескольких консервативных мотивов, общих для всех из входных последовательностей. Неограничивающие способы включают, например, Match-box, см., например, Eric Depiereux and Ernest Feytmans, Match-Box: A Fundamentally New Algorithm for the Simultaneous Alignment of Several Protein Sequences, 8(5) CABIOS 501-509 (1992); Gibbs sampling, см., например, C. E. Lawrence et al., Detecting Subtle Sequence Signals: A Gibbs Sampling Strategy for Multiple Alignment, 262 (5131) Science 208-214 (1993); Align-M, см., например, Ivo Van Walle et al., Align-M - A New Algorithm for Multiple Alignment of Highly Divergent Sequences, 20(9) Bioinformatics:1428-1435 (2004).Any of various alignment methods can be used to determine percent identity, including, but not limited to, global methods, local methods, and hybrid methods such as, for example, segment approach methods. Protocols for determining percent identity are standard techniques and are within the ability of one skilled in the art. Global methods align sequences first to the end of the molecule and determine the best alignment by summing the scores of individual residue pairs and by applying gap penalties. Non-limiting methods include, for example, CLUSTAL W, see, for example, Julie D. Thompson et al., CLUSTAL W: Improving the Sensitivity of Progressive Multiple Sequence Alignment Through Sequence Weighting, Position-Specific Gap Penalties and Weight Matrix Choice, 22(22 ) Nucleic Acids Research 4673-4680 (1994); and iterative refinement, see, for example, Osamu Gotoh, Significant Improvement in Accuracy of Multiple Protein Sequence Alignments by Iterative Refinement as Assessed by Reference to Structural Alignments, 264(4) J. MoI. Biol. 823-838 (1996). Local methods align sequences by identifying one or more conservative motifs common to all of the input sequences. Non-limiting methods include, for example, Match-box, see, for example, Eric Depiereux and Ernest Feytmans, Match-Box: A Fundamentally New Algorithm for the Simultaneous Alignment of Several Protein Sequences, 8(5) CABIOS 501-509 (1992); Gibbs sampling, see, for example, C. E. Lawrence et al., Detecting Subtle Sequence Signals: A Gibbs Sampling Strategy for Multiple Alignment, 262 (5131) Science 208-214 (1993); Align-M, see, for example, Ivo Van Walle et al., Align-M - A New Algorithm for Multiple Alignment of Highly Divergent Sequences, 20(9) Bioinformatics:1428-1435 (2004).

Таким образом, процентную идентичность последовательностей определяют общепринятыми способами. См., например, Altschul et al., Bull. Math. Bio. 48: 603-16, 1986 и Henikoff and Henikoff, Proc. Natl. Acad. Sci. USA 89:10915-19, 1992. В кратком изложении, две аминокислотных последовательности выравнивают для оптимизации показателей выравнивания с использованием штрафа за внесение делеции 10, штрафа за продолжение делеции 1 и оценочной матрицы "blosum 62", Henikoff and Henikoff (там же), как показано ниже (аминокислоты указаны посредством стандартного однобуквенного кода).Thus, percent sequence identity is determined by conventional methods. See, for example, Altschul et al., Bull. Math. Bio. 48: 603-16, 1986 and Henikoff and Henikoff, Proc. Natl. Acad. sci. USA 89:10915-19, 1992. Briefly, two amino acid sequences are aligned to optimize alignment scores using a deletion insertion penalty of 10, a deletion continuation penalty of 1, and a "blosum 62" scoring matrix, Henikoff and Henikoff (ibid.), as shown below (amino acids are indicated by the standard one-letter code).

"Процентная идентичность последовательностей" между двумя или более последовательностями нуклеиновых кислот или аминокислот является функцией количества идентичных положений между последовательностями. Таким образом, % идентичность можно вычислять как количество идентичных нуклеотидов/аминокислот на общее количество нуклеотидов/аминокислот, умноженное на 100. В вычислении % идентичности последовательностей также учитывается количество пропусков и длина каждого пропуска, который необходимо вносить для оптимизации выравнивания двух или более последовательностей. Сравнение последовательностей и определение процентной идентичности между двумя или более последовательностями можно проводить с использованием специальных математических алгоритмов, таких как BLAST, которые известны специалисту в данной области.The "percent sequence identity" between two or more nucleic acid or amino acid sequences is a function of the number of identical positions between the sequences. Thus, % identity can be calculated as the number of identical nucleotides/amino acids per total number of nucleotides/amino acids multiplied by 100. The calculation of % sequence identity also takes into account the number of gaps and the length of each gap that needs to be made to optimize the alignment of two or more sequences. Comparison of sequences and determination of percent identity between two or more sequences can be performed using special mathematical algorithms such as BLAST, which are known to the person skilled in the art.

ПОКАЗАТЕЛИ ВЫРАВНИВАНИЯ ДЛЯ ОПРЕДЕЛЕНИЯ ИДЕНТИЧНОСТИ ПОСЛЕДОВАТЕЛЬНОСТЕЙALIGNMENT PERFORMANCE FOR IDENTIFICATION OF SEQUENCES

Затем процентную идентичность вычисляют следующим образом:The percent identity is then calculated as follows:

Общее количество идентичных совпаденийTotal number of identical matches

__________________________________________ × 100__________________________________________ × 100

[длина наиболее длинной последовательности плюс количество пропусков, внесенное в более длинную последовательность, для выравнивания двух последовательностей][length of the longest sequence plus the number of gaps introduced into the longer sequence to align the two sequences]

По существу гомологичные полипептиды характеризуются наличием одной или нескольких аминокислотных замен, делеций или вставок. Эти изменения предпочтительно являются незначительными, т.е. представляют собой консервативные аминокислотные замены (см. ниже) и другие замены, которые не оказывают значительного влияния на сворачивание и активность полипептида; небольшие делеции, как правило, от одной до приблизительно 30 аминокислот; и небольшие N- или C-концевые удлинения, такие как N-концевой остаток метионина, небольшой линкерный пептид из вплоть до приблизительно 20-25 остатков, или аффинную метку.Essentially homologous polypeptides are characterized by the presence of one or more amino acid substitutions, deletions or insertions. These changes are preferably minor, ie. are conservative amino acid substitutions (see below) and other substitutions that do not significantly affect the folding and activity of the polypeptide; small deletions, typically one to about 30 amino acids; and small N- or C-terminal extensions such as an N-terminal methionine residue, a small linker peptide of up to about 20-25 residues, or an affinity tag.

КОНСЕРВАТИВНЫЕ АМИНОКИСЛОТНЫЕ ЗАМЕНЫCONSERVATIVE AMINO ACID SUBSTITUTIONS

Основные: аргинин, лизин, гистидинBasic: arginine, lysine, histidine

Кислотные: глутаминовая кислота, аспарагиновая кислотаAcidic: glutamic acid, aspartic acid

Полярные: глутамин, аспарагинPolar: glutamine, asparagine

Гидрофобные: лейцин, изолейцин, валинHydrophobic: leucine, isoleucine, valine

Ароматические: фенилаланин, триптофан, тирозинAromatic: phenylalanine, tryptophan, tyrosine

Небольшие: глицин, аланин, серин, треонин, метионин.Small: glycine, alanine, serine, threonine, methionine.

В дополнение к 20 стандартным аминокислотам, нестандартными аминокислотами (такими как 4-гидроксипролин, 6-N-метиллизин, 2-аминоизомасляная кислота, изовалин и α-метилсерин) можно заменять аминокислотные остатки полипептидов по настоящему изобретению. Аминокислотные остатки полипептида можно заменять ограниченным количеством неконсервативных аминокислот, аминокислот, которые не кодируются генетическим кодом и неприродных аминокислот. Полипептиды по настоящему изобретению также могут содержать не встречающиеся в природе аминокислотные остатки.In addition to the 20 standard amino acids, non-standard amino acids (such as 4-hydroxyproline, 6-N-methyllysine, 2-aminoisobutyric acid, isovaline, and α-methylserine) can be substituted for the amino acid residues of the polypeptides of the present invention. The amino acid residues of the polypeptide can be replaced by a limited number of non-conservative amino acids, amino acids that are not encoded by the genetic code, and non-natural amino acids. The polypeptides of the present invention may also contain non-naturally occurring amino acid residues.

Не встречающиеся в природе аминокислоты включают, но не ограничиваются ими, транс-3-метилпролин, 2,4-метанoпролин, цис-4-гидроксипролин, транс-4-гидроксипролин, N-метилглицин, аллотреонин, метилтреонин, гидроксиэтилцистеин, гидроксиэтилгомоцистеин, нитроглутамин, гомоглутамин, пипеколиновую кислоту, трет-лейцин, норвалин, 2-азафенилаланин, 3-азафенилаланин, 4-азафенилаланин и 4-фторфенилаланин. В данной области известно несколько способов включения не встречающихся в природе аминокислотных остатков в белки. Например, можно использовать систему in vitro, где нонсенс-мутации подавляются с использованием химически аминоацилированных супрессорных тРНК. Способы синтеза аминокислот и аминоацилирования тРНК известны в данной области. Транскрипцию и трансляцию плазмид, содержащих нонсенс-мутации, проводят в бесклеточной системе, содержащей экстракт E. coli S30 и коммерчески доступные ферменты и другие реагенты. Белки очищают посредством хроматографии. См., например, Robertson et al., J. Am. Chem. Soc. 113:2722, 1991; Ellman et al., Methods Enzymol. 202:301, 1991; Chung et al., Science 259:806-9, 1993; и Chung et al., Proc. Natl. Acad. Sci. USA 90:10145-9, 1993). Во втором способе трансляцию проводят в ооцитах Xenopus посредством микроинъекции мутантной мРНК и химически аминоацилированных супрессорных тРНК (Turcatti et al., J. Biol. Chem. 271:19991-8, 1996). В третьем способе клетки E. coli культивируют в отсутствии природной аминокислоты, подлежащей замене (например, фенилаланин) и в присутствии желаемой не встречающейся в природе аминокислоты(аминокислот) (например, 2-азафенилаланин, 3-азафенилаланин, 4-азафенилаланин или 4-фторфенилаланин). Не встречающуюся в природе аминокислоту включают в полипептид вместо ее природного аналога. См., Koide et al., Biochem. 33:7470-6, 1994. Встречающиеся в природе аминокислотные остатки можно конвертировать в не встречающиеся в природе формы посредством химической модификации in vitro. Химическую модификацию можно комбинировать с сайт-направленным мутагенезом для дальнейшего расширения диапазона замен (Wynn and Richards, Proteins Sci. 2:395-403, 1993).Non-naturally occurring amino acids include, but are not limited to, trans-3-methylproline, 2,4-methanoproline, cis-4-hydroxyproline, trans-4-hydroxyproline, N-methylglycine, allothreonine, methylthreonine, hydroxyethylcysteine, hydroxyethylhomocysteine, nitroglutamine, homoglutamine, pipecolic acid, tert-leucine, norvaline, 2-azaphenylalanine, 3-azaphenylalanine, 4-azaphenylalanine, and 4-fluorophenylalanine. Several methods are known in the art for incorporating non-naturally occurring amino acid residues into proteins. For example, an in vitro system can be used where nonsense mutations are suppressed using chemically aminoacylated suppressor tRNAs. Methods for amino acid synthesis and tRNA aminoacylation are known in the art. Transcription and translation of plasmids containing nonsense mutations is carried out in a cell-free system containing E. coli S30 extract and commercially available enzymes and other reagents. Proteins are purified by chromatography. See, for example, Robertson et al., J. Am. Chem. soc. 113:2722, 1991; Ellman et al., Methods Enzymol. 202:301, 1991; Chung et al., Science 259:806-9, 1993; and Chung et al., Proc. Natl. Acad. sci. USA 90:10145-9, 1993). In the second method, translation is carried out in Xenopus oocytes by microinjection of mutant mRNA and chemically aminoacylated suppressor tRNAs (Turcatti et al., J. Biol. Chem. 271:19991-8, 1996). In a third method, E. coli cells are cultured in the absence of the natural amino acid to be replaced (e.g., phenylalanine) and in the presence of the desired non-naturally occurring amino acid(s) (e.g., 2-azaphenylalanine, 3-azaphenylalanine, 4-azaphenylalanine, or 4-fluorophenylalanine). ). A non-naturally occurring amino acid is included in the polypeptide in place of its natural counterpart. See, Koide et al., Biochem. 33:7470-6, 1994. Naturally occurring amino acid residues can be converted to non-naturally occurring forms by in vitro chemical modification. Chemical modification can be combined with site-directed mutagenesis to further expand the range of substitutions (Wynn and Richards, Proteins Sci. 2:395-403, 1993).

Аминокислотные остатки полипептидов по настоящему изобретению могут быть замещены неконсервативными аминокислотами, аминокислотами, которые не кодируются генетическим кодом, не встречающимися в природе аминокислотами, и неприродными аминокислотами.Amino acid residues of the polypeptides of the present invention may be substituted with non-conservative amino acids, amino acids that are not encoded by the genetic code, non-naturally occurring amino acids, and non-natural amino acids.

Незаменимые аминокислоты в полипептидах по настоящему изобретению можно идентифицировать с помощью методик, известных в данной области, таких как сайт-направленный мутагенез или аланин-сканирующий мутагенез (Cunningham and Wells, Science 244: 1081-5, 1989). Участки биологического взаимодействия также могут быть определены посредством физического анализа структуры, при определены такими способами, как ядерный магнитный резонанс, кристаллография, электрогография или фотоаффинное мечение, совместно с мутацией предполагаемых аминокислот участков контакта. См., например, de Vos et al., Science 255:306-12, 1992; Smith et al., J. Mol. Biol. 224:899-904, 1992; Wlodaver et al., FEBS Lett. 309:59-64, 1992. Тип незаменимых аминокислот также может быть установлен посредством анализа гомологов с родственными компонентами (например, компоненты транслокации или протеазные компоненты) полипептидов по настоящему изобретению.Essential amino acids in the polypeptides of the present invention can be identified using techniques known in the art, such as site-directed mutagenesis or alanine-scanning mutagenesis (Cunningham and Wells, Science 244: 1081-5, 1989). The sites of biological interaction can also be determined by physical analysis of the structure, when determined by such methods as nuclear magnetic resonance, crystallography, electrogography or photoaffinity labeling, in conjunction with the mutation of the putative amino acids of the contact sites. See, for example, de Vos et al., Science 255:306-12, 1992; Smith et al., J. Mol. Biol. 224:899-904, 1992; Wlodaver et al., FEBS Lett. 309:59-64, 1992. The type of essential amino acids can also be determined by analyzing homologues with related components (eg, translocation components or protease components) of the polypeptides of the present invention.

Множество аминокислотных замен можно вносить и тестировать с использованием известных способов мутагенеза и скрининга, таких как способы, описанные Reidhaar-Olson and Sauer (Science 241:53-7, 1988) или Bowie and Sauer (Proc. Natl. Acad. Sci. USA 86:2152-6, 1989). В кратком изложении, эти авторы описывают способы одновременной рандомизации двух или более положений в полипептиде, селекции функционального полипептида, а затем секвенирования подвергнутых мутагенезу полипептидов для определения спектра допустимых замен в каждом положении. Другие способы, которые можно использовать, включают фаговый дисплей (например, Lowman et al., Biochem. 30:10832-7, 1991; Ladner et al., патент США № 5223409; Huse, публикация WIPO WO 92/06204) и мутагенез, целенаправленно воздействующий на область (Derbyshire et al., Gene 46:145, 1986; Ner et al., DNA 7:127, 1988).A variety of amino acid substitutions can be made and tested using known mutagenesis and screening methods such as those described by Reidhaar-Olson and Sauer (Science 241:53-7, 1988) or Bowie and Sauer (Proc. Natl. Acad. Sci. USA 86 :2152-6, 1989). Briefly, these authors describe methods for simultaneously randomizing two or more positions in a polypeptide, selecting a functional polypeptide, and then sequencing the mutated polypeptides to determine the spectrum of allowable substitutions at each position. Other methods that can be used include phage display (e.g., Lowman et al., Biochem. 30:10832-7, 1991; Ladner et al., US Patent No. 5223409; Huse, WIPO publication WO 92/06204) and mutagenesis, targeting an area (Derbyshire et al., Gene 46:145, 1986; Ner et al., DNA 7:127, 1988).

Множество аминокислотных замен можно вносить и тестировать с использованием известных способов мутагенеза и скрининга, таких как способы, описанные Reidhaar-Olson and Sauer (Science 241:53-7, 1988) или Bowie and Sauer (Proc. Natl. Acad. Sci. USA 86:2152-6, 1989). В кратком изложении, эти авторы описывают способы одновременной рандомизации двух или более положений в полипептиде, выбора функционального полипептида, а затем секвенирования подвергнутых мутагенезу полипептидов для определения спектра допустимых замен в каждом положении. Другие способы, которые могут использоваться, включают фаговый дисплей (например, Lowman et al., Biochem. 30:10832-7, 1991; Ladner et al., патент США № 5223409; Huse, публикация WIPO WO 92/06204) и направленный на область мутагенез (Derbyshire et al., Gene 46:145, 1986; Ner et al., DNA 7:127, 1988).A variety of amino acid substitutions can be made and tested using known mutagenesis and screening methods such as those described by Reidhaar-Olson and Sauer (Science 241:53-7, 1988) or Bowie and Sauer (Proc. Natl. Acad. Sci. USA 86 :2152-6, 1989). Briefly, these authors describe methods for simultaneously randomizing two or more positions in a polypeptide, selecting a functional polypeptide, and then sequencing the mutated polypeptides to determine the spectrum of valid substitutions at each position. Other methods that can be used include phage display (e.g., Lowman et al., Biochem. 30:10832-7, 1991; Ladner et al., US Patent No. 5223409; Huse, WIPO publication WO 92/06204) and directed to mutagenesis region (Derbyshire et al., Gene 46:145, 1986; Ner et al., DNA 7:127, 1988).

Если не определено иначе, все технические и научные термины, используемые в настоящем описании, обладают тем же значением, которое обычно подразумевают специалистом в области, к которой относится настоящее изобретение. В Singleton, et al., DICTIONARY OF MICROBIOLOGY AND MOLECULAR BIOLOGY, 20 ED., John Wiley and Sons, New York (1994), и Hale & Marham, THE HARPER COLLINS DICTIONARY OF BIOLOGY, Harper Perennial, NY (1991) предоставлен специалисту в данной области общий словарь многих из терминов, используемых в настоящем описании.Unless otherwise defined, all technical and scientific terms used in the present description have the same meaning, which is usually meant by a person skilled in the field to which the present invention relates. In Singleton, et al., DICTIONARY OF MICROBIOLOGY AND MOLECULAR BIOLOGY, 20 ED., John Wiley and Sons, New York (1994), and Hale & Marham, THE HARPER COLLINS DICTIONARY OF BIOLOGY, Harper Perennial, NY (1991) in this area a general vocabulary of many of the terms used in the present description.

Настоящее изобретение не ограничивается иллюстративными способами и материалами, описанными в настоящем описании, и любые способы и материалы, сходные или эквивалентные способам, описанным в настоящем описании, можно использовать для применения на практике или тестирования вариантов осуществления изобретения. Числовые диапазоны включают числа, определяющие диапазон. Если нет иных указаний, любые последовательности нуклеиновых кислот написаны слева направо в ориентации от 5' к 3'; аминокислотные последовательности написаны слева направо в ориентации от N к С, соответственно.The present invention is not limited to the exemplary methods and materials described herein, and any methods and materials similar or equivalent to those described herein may be used to practice or test embodiments of the invention. Numeric ranges include numbers that define the range. Unless otherwise indicated, any nucleic acid sequences are written from left to right in a 5' to 3' orientation; amino acid sequences are written from left to right in N to C orientation, respectively.

Заголовки, приведенные в настоящем описании, не являются ограничениями различных аспектов и вариантов осуществления настоящего изобретения.The headings given in the present description are not limitations of the various aspects and embodiments of the present invention.

Аминокислоты указывают в настоящем описании с использованием названия аминокислот, трехбуквенного сокращенного обозначения или однобуквенного сокращенного обозначения. Термин "белок", как используют в рамках изобретения, включает белки, полипептиды и пептиды. Как используют в рамках изобретения, термин "аминокислотная последовательность" является синонимом термина "полипептид" и/или термина "белок". В некоторых случаях термин "аминокислотная последовательность" является синонимом термина "пептид". В некоторых случаях термин "аминокислотная последовательность" является синонимом термина "фермент". Термины "белок" и "полипептид" используют в настоящем описании взаимозаменяемо. В настоящем описании и формуле изобретения можно использовать общепринятые однобуквенные и трехбуквенные коды аминокислотных остатков. 3-буквенный код аминокислот при определении в соответствии с Joint Commission on Biochemical Nomenclature (JCBN) IUPACIUB. Также понятно, что полипептид может кодироваться более чем одной нуклеотидной последовательностью вследствие вырожденности генетического кода.Amino acids are referred to herein using the amino acid name, the three-letter abbreviation, or the one-letter abbreviation. The term "protein" as used herein includes proteins, polypeptides and peptides. As used herein, the term "amino acid sequence" is synonymous with the term "polypeptide" and/or the term "protein". In some cases, the term "amino acid sequence" is synonymous with the term "peptide". In some cases, the term "amino acid sequence" is synonymous with the term "enzyme". The terms "protein" and "polypeptide" are used interchangeably herein. In the present description and claims, conventional one-letter and three-letter codes for amino acid residues can be used. 3-letter amino acid code as determined in accordance with the Joint Commission on Biochemical Nomenclature (JCBN) IUPACIUB. It is also understood that a polypeptide may be encoded by more than one nucleotide sequence due to the degeneracy of the genetic code.

На протяжении настоящего описания могут быть приведены другие определения. Перед более подробным описанием иллюстративных вариантов осуществления, следует понимать, что настоящее изобретение не ограничивается конкретными описанными вариантами осуществления, и они по существу могут варьироваться. Также понятно, что терминология, используемая в настоящем описании, приведена только для цели описания конкретных вариантов осуществления и не предназначена для ограничения, поскольку объем настоящего изобретения определяется прилагаемой формулой изобретения.Throughout the present description, other definitions may be given. Before describing the exemplary embodiments in more detail, it should be understood that the present invention is not limited to the specific embodiments described, and as such may vary. It is also understood that the terminology used in the present specification is for the purpose of describing specific embodiments only and is not intended to be limiting as the scope of the present invention is defined by the appended claims.

Когда предусматривается диапазон величин, понятно, что также конкретно предусматривается каждая входящая в этот диапазон величина до десятой доли единицы, если контекст не предусматривает иное, между верхним и нижним пределами этого диапазона. Изобретение охватывает каждый меньший диапазон между какой-либо указанной величиной или входящей в него величиной в указанном диапазоне и любой другой указанной или входящей в него величиной в этом указанном диапазоне. Верхний и нижний пределы этих меньших диапазонов могут быть независимо включены или исключены из диапазона, и изобретение охватывает каждый диапазон, где любой, ни один или оба из этих пределов включены в меньшие диапазоны при условии какого-либо конкретного исключенного предела в указанном диапазоне. Когда указанный диапазон включает один или оба из пределов, также изобретение включает любой или оба из этих включенных пределов.When a range of values is provided, it is understood that each value within the range up to a tenth of one is also specifically provided, unless the context otherwise requires, between the upper and lower limits of that range. The invention encompasses every smaller range between any specified value or its included value in the specified range and any other specified or included value in this specified range. The upper and lower limits of these smaller ranges can be independently included or excluded from the range, and the invention covers each range where either, neither, or both of these limits are included in the smaller ranges, subject to any particular excluded limit in said range. When the specified range includes one or both of the limits, the invention also includes any or both of these included limits.

Необходимо отметить, что, как используют в рамках изобретения и в прилагаемой формуле изобретения, форма единственного числа включает множественное число, если контекст явно не указывает на иное. Таким образом, например, указание на "полипептид" включает множество таких средств-кандидатов и указание на "полипептид" включает указание на один или несколько полипептидов и их эквивалентов, известных специалистам в данной области, и т.д.It should be noted that, as used within the scope of the invention and in the appended claims, the singular form includes the plural unless the context clearly indicates otherwise. Thus, for example, a reference to "polypeptide" includes a plurality of such candidate agents, and a reference to "polypeptide" includes a reference to one or more polypeptides and their equivalents known to those skilled in the art, and so on.

Публикации, описанные в настоящем описании, предоставлены только для их раскрытия до даты подачи настоящей заявки. Ничто в настоящем описании не следует истолковывать как допущение того, что такие публикации составляют уровень техники для прилагаемой формулы изобретения.The publications described in this specification are provided for disclosure only prior to the filing date of this application. Nothing in this specification should be construed as an admission that such publications constitute prior art for the appended claims.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙBRIEF DESCRIPTION OF THE DRAWINGS

Варианты осуществления изобретения описаны далее только в качестве примеров с помощью прилагаемых чертежей и примеров.Embodiments of the invention are described below, by way of example only, with the aid of the accompanying drawings and examples.

На фиг.1 представлена схема стратегии двойного мечения полипептидов с лигандами. Белок содержит участок распознавания SrtA на C-конце, за которым следует Strep-метка. На N-конце белок содержит участок из остатков глицина, защищенных участком расщепления TEV. Также получали пептид, содержащий участок из остатков глицина, связанных с предпочтительным для выбора флуорофором, и второй пептид, содержащий участок распознавания SrtA и 6 His-метку (HT). Два различных фермента SrtA позволяют сайт-специфическое мечение флуорофоров различного цвета на N- и C-концах.Figure 1 is a diagram of a strategy for double labeling polypeptides with ligands. The protein contains a SrtA recognition site at the C-terminus followed by a Strep tag. At the N-terminus, the protein contains a site of glycine residues protected by a TEV cleavage site. Also received a peptide containing a plot of glycine residues associated with the preferred choice of fluorophore, and the second peptide containing the site of recognition of SrtA and 6 His-tag (HT). Two different SrtA enzymes allow site-specific labeling of fluorophores of different colors at the N- and C-termini.

На фиг.2 представлен анализ расщепления SNAP-25 для немеченых однократно меченых и двукратно меченых полипептидов. A. Расщепление SNAP-25 в кортикальных нейронах посредством 3, 10, 30, 100, 300 и 1000 нМ немеченого полипептида с EGF-лигандом, меченного TxRed EGF-полипептида, меченного SNAP594 полипептида с EGF-лигандом, однократно меченного посредством SrtA полипептида с EGF-лигандом и двукратно меченного посредством SrtA полипептида с EGF-лигандом. В качестве контроля использовали полипептид без лиганда (несвязанный с лигандом) для всех концентраций. Воздействие полипептидов проводили в течение 24 ч. B. Расщепление посредством SNAP-25 в кортикальных нейронов посредством 3, 10, 30, 100, 300 и 1000 нМ немеченого полипептида с ноцицептин-лигандом и двукратно меченого посредством SrtA ноцицептин-полипептида. В качестве контроля использовали полипептид без лиганда (несвязанный с лигандом) для всех концентраций. Воздействие полипептидов проводили в течение 24 ч.Figure 2 shows the SNAP-25 cleavage analysis for unlabeled singly labeled and doubly labeled polypeptides. A. Cleavage of SNAP-25 in cortical neurons by 3, 10, 30, 100, 300 and 1000 nM unlabeled EGF Ligand polypeptide, TxRed labeled EGF polypeptide, SNAP594 labeled EGF Ligand polypeptide, SrtA singly labeled EGF polypeptide ligand and doubly labeled with SrtA polypeptide with EGF ligand. Ligand-free (ligand-free) polypeptide was used as a control for all concentrations. Polypeptide exposure was performed for 24 hours. B. SNAP-25 cleavage in cortical neurons with 3, 10, 30, 100, 300, and 1000 nM unlabeled nociceptin ligand polypeptide and doubly labeled with SrtA nociceptin polypeptide. Ligand-free (ligand-free) polypeptide was used as a control for all concentrations. The impact of polypeptides was carried out for 24 hours.

На фиг.3 представлена прижизненная кофокальная визуализация двукратно меченого полипептида с EGF-лигандом. A. Фотография конфокальной прижизненной визуализации, регистрирующая клетки A549, обработанные полипептидом с EGF-лигандом, меченным посредством HF555 на N-конце и HF488 на C-конце. Изображения (справа) представляют собой фотографии заключенной в рамку области, представленной на крупном изображении (слева), полученные с различными интервалами, начиная с 0,5 минуты после добавления белка. Образование агломератов, характерных для этого полипептидов, может наблюдаться после 3 минуты. B. Фотография прижизненной конфокальной визуализации, регистрирующей клетки A549, обработанные полипептидом с EGF-лигандом, меченным HF555 на N-конце и HF488 на C-конце. Изображения (справа) представляют собой фотографии заключенной в рамку области, представленной на крупном изображении (слева), полученные с различными интервалами, начиная с 30 минуты после добавления белка. Исчезновение агломератов может наблюдаться после 45 минуты.Figure 3 shows intravital cofocal imaging of a doubly labeled polypeptide with an EGF ligand. A. Confocal in vivo imaging photograph showing A549 cells treated with an EGF ligand polypeptide labeled with HF555 at the N-terminus and HF488 at the C-terminus. The images (right) are photographs of the boxed area shown in the large image (left) taken at various intervals starting at 0.5 minutes after protein addition. The formation of agglomerates characteristic of this polypeptide can be observed after 3 minutes. B. In vivo confocal imaging photograph showing A549 cells treated with an EGF ligand polypeptide tagged with HF555 at the N-terminus and HF488 at the C-terminus. The images (right) are photographs of the boxed area shown in the large image (left) taken at various intervals starting at 30 minutes after protein addition. The disappearance of agglomerates can be observed after 45 minutes.

На фиг.4 представлена схема двукратно меченого полноразмерного протеолитически инактивированного мутанта BoNT/A1, обозначаемого как BoNT/A(0). Донорные и акцепторные участки сортазы и протокол являются такими же, как и на фиг.1.4 is a diagram of a doubly labeled full-length proteolytically inactivated BoNT/A1 mutant, referred to as BoNT/A(0). The donor and acceptor sites of sortase and the protocol are the same as in Fig.1.

На фиг.5 представлен анализ SDS-PAGE двукратно меченого протеолитически инактивированного BoNT/A (BoNT/A(0)), визуализированного с использованием флуоресцентного окрашивания (слева) и окрашивания Кумасси (справа). На дорожках 1 и 4 представлен маркер молекулярной массы белка, на дорожках 2 и 5 представлен невосстановленный двукратно меченный BoNT/A(0) и на дорожках 3 и 6 представлен восстановленный двукратно меченный (L-цепь снизу и H-цепь сверху) BoNT/A(0).Figure 5 shows the SDS-PAGE analysis of doubly labeled proteolytically inactivated BoNT/A (BoNT/A(0)), visualized using fluorescent staining (left) and Coomassie staining (right). Lanes 1 and 4 represent the protein molecular weight marker, lanes 2 and 5 represent unreduced doubly labeled BoNT/A(0) and lanes 3 and 6 represent reduced doubly labeled (L-chain below and H-chain above) BoNT/A (0).

На фиг.6 представлены изображения времяпролетной микроскопии TIRF единичных молекул для однократно меченного BoNT/A(0), зарегистрированные с интервалами 5 секунд. Белой стрелкой показано движение единичной молекулы с течением времени в секундах.6 shows single molecule time-of-flight TIRF microscopy images of singly labeled BoNT/A(0) taken at 5 second intervals. The white arrow shows the movement of a single molecule over time in seconds.

СПИСОК ПОСЛЕДОВАТЕЛЬНОСТЕЙSEQUENCE LIST

Когда первоначальный аминокислотный остаток Met или соответствующий первоначальный кодон указан в любой из приведенных ниже SEQ ID NO, указанный остаток/кодон является необязательным. В случае каких-либо различий между последовательностями, описанными в описании и последовательности в списке последовательностей ST.25, последовательности в описании имеют преимущество.When the initial Met amino acid residue or the corresponding initial codon is listed in any of the following SEQ ID NOs, the specified residue/codon is optional. In case of any difference between the sequences described in the description and the sequences in the ST.25 sequence listing, the sequences in the description take precedence.

SEQ ID NO: 1 - Нуклеотидная последовательность полипептида с EGF-лигандом (EGF TM) с участками двукратного мечения посредством SrtA.SEQ ID NO: 1 - Nucleotide sequence of an EGF ligand polypeptide (EGFTM) with SrtA double-labeled sites.

SEQ ID NO: 2 - Полипептидная последовательность полипептида с EGF-лигандом (EGF TM) с участками двукратного мечения посредством SrtA.SEQ ID NO: 2 - Polypeptide sequence of an EGF ligand polypeptide (EGF TM ) with SrtA doubly labeled regions.

SEQ ID NO: 3 - Нуклеотидная последовательность полипептида с ноцицептин-лигандом (ноцицептин TM) с участками двукратного мечения посредством SrtASEQ ID NO: 3 - Nucleotide sequence of a nociceptin ligand polypeptide (nociceptin TM) with SrtA double-labeled sites

SEQ ID NO: 4 - Полипептидная последовательность полипептида с ноцицептин-лигандом (ноцицептин TM) с участками двукратного мечения посредством SrtASEQ ID NO: 4 - Polypeptide sequence of a nociceptin ligand (nociceptin TM) polypeptide with SrtA doubly labeled regions

SEQ ID NO: 5 - Нуклеотидная последовательность полипептида с EGF-лигандом (EGF TM)SEQ ID NO: 5 - Nucleotide sequence of polypeptide with EGF ligand (EGF TM)

SEQ ID NO: 6 - Полипептидная последовательность полипептида с EGF-лигандом (EGF TM)SEQ ID NO: 6 - Polypeptide sequence of polypeptide with EGF ligand (EGF TM)

SEQ ID NO: 7 - Нуклеотидная последовательность полипептида с ноцицептин-лигандом (ноцицептин TM)SEQ ID NO: 7 - Nucleotide sequence of the nociceptin ligand polypeptide (nociceptin TM)

SEQ ID NO: 8 - Полипептидная последовательность полипептида с ноцицептин-лигандом (ноцицептин TM)SEQ ID NO: 8 - Polypeptide sequence of a nociceptin ligand polypeptide (nociceptin TM)

SEQ ID NO: 9 - Нуклеотидная последовательность GFP-меченного полипептида с EGF-лигандомSEQ ID NO: 9 - Nucleotide sequence of GFP-tagged polypeptide with EGF ligand

SEQ ID NO: 10 - Полипептидная последовательность GFP-меченного полипептида с EGF-лигандомSEQ ID NO: 10 - Polypeptide sequence of GFP-tagged polypeptide with EGF ligand

SEQ ID NO: 11 - Нуклеотидная последовательность SNAP-меченного полипептида с EGF-лигандомSEQ ID NO: 11 - Nucleotide sequence of SNAP-tagged polypeptide with EGF ligand

SEQ ID NO: 12 - Полипептидная последовательность SNAP-меченного полипептида с EGF-лигандомSEQ ID NO: 12 - Polypeptide sequence of SNAP-tagged polypeptide with EGF ligand

SEQ ID NO: 13 - Нуклеотидная последовательность сортазы A (нацеливание на LPESG)SEQ ID NO: 13 - Sortase A Nucleotide Sequence (LPESG Targeting)

SEQ ID NO: 14 - Полипептидная последовательность сортазы A (нацеливание на LPESG)SEQ ID NO: 14 - Sortase A polypeptide sequence (LPESG targeting)

SEQ ID NO: 15 - Нуклеотидная последовательность сортазы A (нацеливание на LAETG)SEQ ID NO: 15 - Sortase A Nucleotide Sequence (LAETG Targeting)

SEQ ID NO: 16 - Полипептидная последовательность сортазы A (нацеливание на LAETG)SEQ ID NO: 16 - Sortase A polypeptide sequence (LAETG targeting)

SEQ ID NO: 17 - BoNT/A - UniProt P10845SEQ ID NO: 17 - BoNT/A - UniProt P10845

SEQ ID NO: 18 - BoNT/B - UniProt P10844SEQ ID NO: 18 - BoNT/B - UniProt P10844

SEQ ID NO: 19 - BoNT/C - UniProt P18640SEQ ID NO: 19 - BoNT/C - UniProt P18640

SEQ ID NO: 20 - BoNT/D - UniProt P19321SEQ ID NO: 20 - BoNT/D - UniProt P19321

SEQ ID NO: 21 - BoNT/E - UniProt Q00496SEQ ID NO: 21 - BoNT/E - UniProt Q00496

SEQ ID NO: 22 - BoNT/F - UniProt A7GBG3SEQ ID NO: 22 - BoNT/F - UniProt A7GBG3

SEQ ID NO: 23 - BoNT/G - UniProt Q60393SEQ ID NO: 23 - BoNT/G - UniProt Q60393

SEQ ID NO: 24 - Полипептидная последовательность BoNT/XSEQ ID NO: 24 - BoNT/X polypeptide sequence

SEQ ID NO: 25 - TeNT - UniProt P04958SEQ ID NO: 25 - TeNT - UniProt P04958

SEQ ID NO: 26 - Полипептидная последовательность меченого полипептида EGF TMSEQ ID NO: 26 - Polypeptide sequence of labeled EGF TM polypeptide

SEQ ID NO: 27 - Полипептидная последовательность бутелазы C. ternatea 1 (плюс сигнальный пептид)SEQ ID NO: 27 - C. ternatea 1 butelase polypeptide sequence (plus signal peptide)

SEQ ID NO: 28 - Полипептидная последовательность бутелазы 1 C. ternatea (минус сигнальный пептид)SEQ ID NO: 28 - C. ternatea butelase 1 polypeptide sequence (minus signal peptide)

SEQ ID NO: 29 - Пептид с конъюгированными поддающейся детекции меткой и донорным участком для сортазыSEQ ID NO: 29 - Peptide with conjugated detectable label and sortase donor site

SEQ ID NO: 30 - Пептид с конъюгированной поддающейся детекции меткой и акцепторным участком для сортазыSEQ ID NO: 30 - Peptide with conjugated detectable label and acceptor site for sortase

SEQ ID NO: 31 - Полипептидная последовательность сортазы A Staphylococcus aureusSEQ ID NO: 31 - Staphylococcus aureus sortase A polypeptide sequence

SEQ ID NO: 32 - Полипептидная последовательность сортазы B Staphylococcus aureusSEQ ID NO: 32 - Staphylococcus aureus sortase B polypeptide sequence

SEQ ID NO: 33 - Полипептидная последовательность сортазы A Streptococcus pneumoniaeSEQ ID NO: 33 - Streptococcus pneumoniae sortase A polypeptide sequence

SEQ ID NO: 34 - Полипептидная последовательность сортазы B Streptococcus pneumoniaeSEQ ID NO: 34 - Streptococcus pneumoniae sortase B polypeptide sequence

SEQ ID NO: 35 - Полипептидная последовательность сортазы C Streptococcus pneumoniaeSEQ ID NO: 35 - Streptococcus pneumoniae sortase C polypeptide sequence

SEQ ID NO: 36 - Полипептидная последовательность сортазы D Streptococcus pneumoniaeSEQ ID NO: 36 - Streptococcus pneumoniae sortase D polypeptide sequence

SEQ ID NO: 37 - Полипептидная последовательность сортазы A Streptococcus pyogenesSEQ ID NO: 37 - Streptococcus pyogenes sortase A polypeptide sequence

SEQ ID NO: 38 - Полипептидная последовательность протеолитически неактивный мутант BoNT/A(0)SEQ ID NO: 38 - Polypeptide sequence of proteolytically inactive BoNT/A(0) mutant

SEQ ID NO: 39 - Нуклеотидная последовательность полноразмерного протеолитически неактивного мутанта BoNT/A(0) с участками двукратного мечения посредством SrtASEQ ID NO: 39 - Nucleotide sequence of full-length proteolytically inactive BoNT/A(0) mutant with SrtA double-labeled sites

SEQ ID NO: 40 - Полипептидная последовательность полноразмерного протеолитически неактивного мутанта BoNT/A(0) с участками двукратного мечения посредством SrtASEQ ID NO: 40 - Polypeptide sequence of full length proteolytically inactive BoNT/A(0) mutant with SrtA double tagged sites

SEQ ID NO: 41 - Полипептидная последовательность PATG Prochloron didemniSEQ ID NO: 41 - PATG Prochloron didemni polypeptide sequence

SEQ ID NO: 42 - Полипептидная последовательность PCY1 Saponaria vaccariaSEQ ID NO: 42 - PCY1 Saponaria vaccaria polypeptide sequence

SEQ ID NO: 43 - Полипептидная последовательность POPB Galerina marginataSEQ ID NO: 43 - POPB Galerina marginata polypeptide sequence

SEQ ID NO: 44 - Полипептидная последовательность гомолога бутелазы OaAEP1b Oldenlandia affinis (плюс сигнальный пептид)SEQ ID NO: 44 - Oldenlandia affinis OaAEP1b butelase homologue polypeptide sequence (plus signal peptide)

SEQ ID NO: 45 - Полипептидная последовательность гомолога бутелазы OaAEP1b Oldenlandia affinis (минус сигнальный пептид)SEQ ID NO: 45 - Oldenlandia affinis OaAEP1b butelase homologue polypeptide sequence (minus signal peptide)

SEQ ID NO: 1 - Нуклеотидная последовательность полипептида с EGF-лигандом с участками двукратного мечения посредством SrtASEQ ID NO: 1 - Nucleotide sequence of EGF ligand polypeptide with SrtA double-labeled sites

TGGCGAATGGGACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTAGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGTCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGCTTACAATTTAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAATTAATTCTTAGAAAAACTCATCGAGCATCAAATGAAACTGCAATTTATTCATATCAGGATTATCAATACCATATTTTTGAAAAAGCCGTTTCTGTAATGAAGGAGAAAACTCACCGAGGCAGTTCCATAGGATGGCAAGATCCTGGTATCGGTCTGCGATTCCGACTCGTCCAACATCAATACAACCTATTAATTTCCCCTCGTCAAAAATAAGGTTATCAAGTGAGAAATCACCATGAGTGACGACTGAATCCGGTGAGAATGGCAAAAGTTTATGCATTTCTTTCCAGACTTGTTCAACAGGCCAGCCATTACGCTCGTCATCAAAATCACTCGCATCAACCAAACCGTTATTCATTCGTGATTGCGCCTGAGCGAGACGAAATACGCGATCGCTGTTAAAAGGACAATTACAAACAGGAATCGAATGCAACCGGCGCAGGAACACTGCCAGCGCATCAACAATATTTTCACCTGAATCAGGATATTCTTCTAATACCTGGAATGCTGTTTTCCCGGGGATCGCAGTGGTGAGTAACCATGCATCATCAGGAGTACGGATAAAATGCTTGATGGTCGGAAGAGGCATAAATTCCGTCAGCCAGTTTAGTCTGACCATCTCATCTGTAACATCATTGGCAACGCTACCTTTGCCATGTTTCAGAAACAACTCTGGCGCATCGGGCTTCCCATACAATCGATAGATTGTCGCACCTGATTGCCCGACATTATCGCGAGCCCATTTATACCCATATAAATCAGCATCCATGTTGGAATTTAATCGCGGCCTAGAGCAAGACGTTTCCCGTTGAATATGGCTCATAACACCCCTTGTATTACTGTTTATGTAAGCAGACAGTTTTATTGTTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATCGGCGATAATGGCCTGCTTCTCGCCGAAACGTTTGGTGGCGGGACCAGTGACGAAGGCTTGAGCGAGGGCGTGCAAGATTCCGAATACCGCAAGCGACAGGCCGATCATCGTCGCGCTCCAGCGAAAGCGGTCCTCGCCGAAAATGACCCAGAGCGCTGCCGGCACCTGTCCTACGAGTTGCATGATAAAGAAGACAGTCATAAGTGCGGCGACGATAGTCATGCCCCGCGCCCACCGGAAGGAGCTGACTGGGTTGAAGGCTCTCAAGGGCATCGGTCGAGATCCCGGTGCCTAATGAGTGAGCTAACTTACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCCAGGGTGGTTTTTCTTTTCACCAGTGAGACGGGCAACAGCTGATTGCCCTTCACCGCCTGGCCCTGAGAGAGTTGCAGCAAGCGGTCCACGCTGGTTTGCCCCAGCAGGCGAAAATCCTGTTTGATGGTGGTTAACGGCGGGATATAACATGAGCTGTCTTCGGTATCGTCGTATCCCACTACCGAGATATCCGCACCAACGCGCAGCCCGGACTCGGTAATGGCGCGCATTGCGCCCAGCGCCATCTGATCGTTGGCAACCAGCATCGCAGTGGGAACGATGCCCTCATTCAGCATTTGCATGGTTTGTTGAAAACCGGACATGGCACTCCAGTCGCCTTCCCGTTCCGCTATCGGCTGAATTTGATTGCGAGTGAGATATTTATGCCAGCCAGCCAGACGCAGACGCGCCGAGACAGAACTTAATGGGCCCGCTAACAGCGCGATTTGCTGGTGACCCAATGCGACCAGATGCTCCACGCCCAGTCGCGTACCGTCTTCATGGGAGAAAATAATACTGTTGATGGGTGTCTGGTCAGAGACATCAAGAAATAACGCCGGAACATTAGTGCAGGCAGCTTCCACAGCAATGGCATCCTGGTCATCCAGCGGATAGTTAATGATCAGCCCACTGACGCGTTGCGCGAGAAGATTGTGCACCGCCGCTTTACAGGCTTCGACGCCGCTTCGTTCTACCATCGACACCACCACGCTGGCACCCAGTTGATCGGCGCGAGATTTAATCGCCGCGACAATTTGCGACGGCGCGTGCAGGGCCAGACTGGAGGTGGCAACGCCAATCAGCAACGACTGTTTGCCCGCCAGTTGTTGTGCCACGCGGTTGGGAATGTAATTCAGCTCCGCCATCGCCGCTTCCACTTTTTCCCGCGTTTTCGCAGAAACGTGGCTGGCCTGGTTCACCACGCGGGAAACGGTCTGATAAGAGACACCGGCATACTCTGCGACATCGTATAACGTTACTGGTTTCACATTCACCACCCTGAATTGACTCTCTTCCGGGCGCTATCATGCCATACCGCGAAAGGTTTTGCGCCATTCGATGGTGTCCGGGATCTCGACGCTCTCCCTTATGCGACTCCTGCATTAGGAAGCAGCCCAGTAGTAGGTTGAGGCCGTTGAGCACCGCCGCCGCAAGGAATGGTGCATGCAAGGAGATGGCGCCCAACAGTCCCCCGGCCACGGGGCCTGCCACCATACCCACGCCGAAACAAGCGCTCATGAGCCCGAAGTGGCGAGCCCGATCTTCCCCATCGGTGATGTCGGCGATATAGGCGCCAGCAACCGCACCTGTGGCGCCGGTGATGCCGGCCACGATGCGTCCGGCGTAGAGGATCGAGATCTCGATCCCGCGAAATTAATACGACTCACTATAGGGGAATTGTGAGCGGATAACAATTCCCCTCAAGAAATAATTTTGTTTAACTTTAAGAAGGAGATATACATATgggatccatgGAGAACCTGTATTTTCAGGGCGGCGGTGGCAGCGGCGGCAGCGGCGGCAGCcctttcgttaacaaacagttcaactataaagacccagttaacggtgttgacattgcttacatcaaaatcccgaacgctggccagatgcagccggtaaaggcattcaaaatccacaacaaaatctgggttatcccggaacgtgatacctttactaacccggaagaaggtgacctgaacccgccaccggaagcgaaacaggtgccggtatcttactatgactccacctacctgtctaccgataacgaaaaggacaactacctgaaaggtgttactaaactgttcgagcgtatttactccaccgacctgggccgtatgctgctgactagcatcgttcgcggtatcccgttctggggcggttctaccatcgataccgaactgaaagtaatcgacactaactgcatcaacgttattcagccggacggttcctatcgttccgaagaactgaacctggtgatcatcggcccgtctgctgatatcatccagttcgagtgtaagagctttggtcacgaagttctgaacctcacccgtaacggctacggttccactcagtacatccgtttctctccggacttcaccttcggttttgaagaatccctggaagtagacacgaacccactgctgggcgctggtaaattcgcaactgatcctgcggttaccctggctcacgaactgattcatgcaggccaccgcctgtacggtatcgccatcaatccgaaccgtgtcttcaaagttaacaccaacgcgtattacgagatgtccggtctggaagttagcttcgaagaactgcgtacttttggcggtcacgacgctaaattcatcgactctctgcaagaaaacgagttccgtctgtactactataacaagttcaaagatatcgcatccaccctgaacaaagcgaaatccatcgtgggtaccactgcttctctccagtacatgaagaacgtttttaaagaaaaatacctgctcagcgaagacacctccggcaaattctctgtagacaagttgaaattcgataaactttacaaaatgctgactgaaatttacaccgaagacaacttcgttaagttctttaaagttctgaaccgcaaaacctatctgaacttcgacaaggcagtattcaaaatcaacatcgtgccgaaagttaactacactatctacgatggtttcaacctgcgtaacaccaacctggctgctaattttaacggccagaacacggaaatcaacaacatgaacttcacaaaactgaaaaacttcactggtctgttcgagttttacaagctgctgtgcgtcgacggcatcattacctccaaaactaaatctctgatagaaggtagaaacaaagcgctgaacctgcagtgtatcaaggttaacaactgggatttattcttcagcccgagtgaagacaacttcaccaacgacctgaacaaaggtgaagaaatcacctcagatactaacatcgaagcagccgaagaaaacatctcgctggacctgatccagcagtactacctgacctttaatttcgacaacgagccggaaaacatttctatcgaaaacctgagctctgatatcatcggccagctggaactgatgccgaacatcgaacgtttcccaaacggtaaaaagtacgagctggacaaatataccatgttccactacctgcgcgcgcaggaatttgaacacggcaaatcccgtatcgcactgactaactccgttaacgaagctctgctcaacccgtcccgtgtatacaccttcttctctagcgactacgtgaaaaaggtcaacaaagcgactgaagctgcaatgttcttgggttgggttgaacagcttgtttatgattttaccgacgagacgtccgaagtatctactaccgacaaaattgcggatatcactatcatcatcccgtacatcggtccggctctgaacattggcaacatgctgtacaaagacgacttcgttggcgcactgatcttctccggtgcggtgatcctgctggagttcatcccggaaatcgccatcccggtactgggcacctttgctctggtttcttacattgcaaacaaggttctgactgtacaaaccatcgacaacgcgctgagcaaacgtaacgaaaaatgggatgaagtttacaaatatatcgtgaccaactggctggctaaggttaatactcagatcgacctcatccgcaaaaaaatgaaagaagcactggaaaaccaggcggaagctaccaaggcaatcattaactaccagtacaaccagtacaccgaggaagaaaaaaacaacatcaacttcaacatcgacgatctgtcctctaaactgaacgaatccatcaacaaagctatgatcaacatcaacaagttcctgaaccagtgctctgtaagctatctgatgaactccatgatcccgtacggtgttaaacgtctggaggacttcgatgcgtctctgaaagacgccctgctgaaatacatttacgacaaccgtggcactctgatcggtcaggttgatcgtctgaaggacaaagtgaacaataccttatcgaccgacatcccttttcagctcagtaaatatgtcgataaccaacgccttttgtccactctagaaggcggTGGCGGTAGCGGTGGCGGTGGCAGCGGCGGTGGCGGTAGCGCACTAGacAACAGCGACCCTAAATGCCCACTgAGTCATGAAGGATACTGCCTTAATGATGGTGTTTGTATGTACATAGGAACATTGGACCGTTATGCTTGCAATTGTGTAGTGGGCTATGTCGGGGAAAGGTGTCAATATCGAGATCTCAAGCTGGCAGAGTTAAGAgggctagaagcaGGCGGCAGCGGCGGCGGCAGCGGCCTGCCCGAAAGCGGTGGCGGATCTGCTTGGTCTCACCCGCAGTTCGAAAAAGGTGGTGGTTCTGGTGGTGGTTCTGGTGGTTCTGCTTGGTCTCACCCGCAGTTCGAAAAAtaatgaAAGCTTGCGGCCGCACTCGAGCACCACCACCACCACCACTGAGATCCGGCTGCTAACAAAGCCCGAAAGGAAGCTGAGTTGGCTGCTGCCACCGCTGAGCAATAACTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTTTGCTGAAAGGAGGAACTATATCCGGATTGGCGAATGGGACGCGCCCTGTAGCGGCCGCATTAAGCGCGGCGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTT GATTAGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGTCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTAACAAAATATTAACG CTTACAATTTAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAATTAATTCTTAGAAAAACTCATCGAGCATCAAATGAAACTGCAATTTATTCATATCAGGATTATCAATACCATATTTTTGAAAAAGCCGTTTCTGTAATGAAGGAGAAAACTCACCGAGGCAGTTCCATAGGATGGCAAGATCCTGGTATCGG TCTGCGATTCCGACTCGTCCAACATCAATACAACCTATTAATTTCCCCTCGTCAAAAATAAGGTTATCAAGTGAGAAATCACCATGAGTGACGACTGAATCCGGTGAGAATGGCAAAAGTTTATGCATTTCTTTCCAGACTTGTTCAACAGGCCAGCCATTACGCTCGTCATCAAAATCACTCGCATCAACCAAACCGTTATTCATTCGTGATTGCGCCTGAGCGAGACGAAATACGCGATCGC TGTTAAAAGGACAATTACAAACAGGAATCGAATGCAACCGGCGCAGGAACACTGCCAGCGCATCAACAATATTTTCACCTGAATCAGGATATTCTTCTAATACCTGGAATGCTGTTTTCCCGGGGATCGCAGTGGTGAGTAACCATGCATCATCAGGAGTACGGATAAAATGCTTGATGGTCGGAAGAGGCATAAATTCCGTCAGCCAGTTTAGTCTGACCATCTCATCTGTAACATCATTG GCAACGCTACCTTTGCCATGTTTCAGAAACAACTCTGGCGCATCGGGCTTCCCATACAATCGATAGATTGTCGCACCTGATTGCCCGACATTATCGCGAGCCCATTTATACCCATATAAATCAGCATCCATGTTGGAATTTAATCGCGGCCTAGAGCAAGACGTTTCCCGTTGAATATGGCTCATAACACCCCTTGTATTACTGTTTATGTAAGCAGACAAGTTTTATTGTTCATGACCAAAATCCC TTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACT TCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCT TCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTT TGCGTGGCCTTTTGCTCACATCGGCGATAATGGCCTGCTTCTCGCCGAAACGTTTGGTGGCGGGACCAGTGACGAAGGCTTGAGCGAGGCGTGCAAGATTCCGAATACCGCAAGCGACAGGCCGATCATCGTCGCGCTCCAGCGAAAGCGGTCCTCGCCGAAAATGACCCAGAGCGCTGCCGGCACCTGTCCTACGAGTTGCATGATAAAGAAGACAGTCATAAGTGCGGCGACG ATAGTCATGCCCCGCGCCCACCGGAAGGAGCTGACTGGTTGAAGGCTCTCAAGGGCATCGGTCGAGATCCCGGTGCCTAATGAGTGAGCTAACTTACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCCAGGGTGGTTTTTCTT TTCACCAGTGAGACGGGCAACAGCTGATTGCCCTTCACCGCCTGGCCCTGAGAGAGTTGCAGCAAGCGGTCCACGCTGGTTTGCCCCAGCAGGCGAAAATCCTGTTTGATGGTGGTTAACGGCGGGATATAACATGAGCTGTCTTCGGTATCGTCGTATCCCACTACCGAGATATCCGCACCAACGCGCAGCCCGGACTCGGTAATGGCGCGCATTGCGCCCAGCGCCATCT GATCGTTGGCAACCAGCATCGCAGTGGGAACGATGCCCTCATTCAGCATTTGCATGGTTTGTTGAAAACCGGACATGGCACTCCAGTCGCCTTCCCGTTCCGCTATCGGCTGAATTTGATTGCGAGTGAGATATTTATGCCAGCCAGCCAGACGCAGACGCGCCGAGACAGAACTTAATGGGCCCGCTAACAGCGCGATTTGCTGGTGACCCAATGCGACCAGATGCTCCACGCCCAGTC GCGTACCGTCTTCATGGGAGAAAATAATACTGTTGATGGGTGTCTGGTCAGAGACATCAAGAAATAACGCCGGAACATTAGTGTCAGGCAGCTTCCACAGCAATGGCATCCTGGTCATCCAGCGGATAGTTAATGATCAGCCCACTGACGCGTTGCGCGAGAAGATTGTGCACCGCCGCTTTACAGGCTTCGACGCCGCTTCGTTCTACCATCGACACCACCGCTGGCACCCAGTTGA TCGGCGCGAGATTTAATCGCCGCGACAATTTGCGACGGCGCGTGCAGGGCCAGACTGGAGGTGGCAACGCCAATCAGCAACGACTGTTTGCCCGCCAGTTGTTGTGCCACGCGGTTGGGAATGTAATTCAGCTCCGCCATCGCCGCTTCCACTTTTTCCCGCGTTTTCGCAGAAACGTGGCTGGCCTGGTTCACCACGCGGGAAACGGTCTGATAAGAGACACCGGCAT ACTCTGCGACATCGTATAACGTTACTGGTTTCACATTCACCACCCTGAATTGACTCTCTTCCGGGCGCTATCATGCCATACCGCGAAAGGTTTTGCGCCATTCGATGGTGTCCGGGATCTCGACGCTCTCCCTTATGCGACTCCTGCATTAGGAAGCAGCCCAGTAGTAGGTTGAGGCCGTTGAGCACCGCCCGCAAGGAATGGTGCATGCAAGGAGATGGCGCCCCAACAGTCCCCC GGCCACGGGGCCTGCCACCATACCCACGCCGAAACAAGCGCTCATGAGCCCGAAGTGGCGAGCCCGAATCTTCCCCATCGGTGATGTCGGCGATATAGGCGCCAGCAACCGCACCTGTGGCGCCGGTGATGCCGGCCACGATGCGTCCGGCGTAGAGGATCGAGATCTCGATCCCGAAATTAATACGACTCACTATAGGGGAATTGTGAGCGGATAACAATTCCCCTCAAGAA ATAATTTTGTTTAACTTTAAAGGAGATACATATgggatccatgGAGAACCTGTATTTCAGGGCGGCGGTGGCAGCGGCGCAGCGGCGGCAGCcctttcgttaacaaacagttcaactataaagacccagttaacggtgttgacattgcttacatcaaaatcccgaacgctggccagatgcagccggtaaaggcattcaaaatccacaacaaa atctgggttacccggaacgtgatacctttactaacccggaagaaggtgacctgaacccgccaccggaagcgaaacaggtgccggtatcttactatgactccacctacctgtctaccgataacgaaaaggacaactacctgaaaggtgttactaaactgttcgagcgtatttactccaccgacctgggccgtatgctgctgactagcatcg ttcgcggtatcccgttctggggcggttctaccatcgataccgaactgaaagtaatcgacactaactgcatcaacgtttattcagccggacggttcctatcgttccgaagaactgaacctggtgatcatcggcccgtctgctgatatcatccagttcgagtgtaagagctttggtcacgaagttctgaacctcacccgtaacggctacggttccactcagta catccgtttctctccggacttcaccttcggttttgaagaatccctggaagtagacacgaacccactgctgggcgctggtaaattcgcaactgatcctgcggttaccctggctcacgaactgattcatgcaggccaccgcctgtacggtatcgccatcaatccgaaccgtgtcttcaaagttaacaccaacgcgtattacgagatgtccggtct ggaagttagcttcgaagaactgcgtacttttggcggtcacgacgctaaattcatcgactctctgcaagaaaacgagttccgtctgtactactataacaagttcaaagatatcgcatccaccctgaacaaagcgaaatccatcgtgggtaccactgcttctctccagtacatgaagaacgtttttaaagaaaaatacctgctcagcgaagacacc tccggcaaattctctgtagacaagttgaaattcgataaactttacaaaatgctgactgaaatttacaccgaagacaacttcgttaagttctttaaagttctgaaccgcaaaacctatctgaacttcgacaaggcagtattcaaaatcaacatcgtgccgaaagttaactacactatctacgatggtttcaacctgcgtaacaccaacctgg ctgctaattttaacggccagaacacggaaatcaacaacatgaacttcacaaaactgaaaaacttcactggtctgttcgagttttacaagctgctgtgcgtcgacggcatcatcattacctccaaaactaaatctctgatagaaggtagaaacaaagcgctgaacctgcagtgtatcaaggttaacaactgggatttattcttcagcccga gtgaagacaacttcaccaacgacctgaacaaaggtgaagaaatcacctcagatactaacatcgaagcagccgaagaaaacatctcgctggacctgatccagcagtactacctgacctttaatttcgacaacgagccggaaaacatttctatcgaaaacctgagctctgatatcatcggccagctggaactgatgccgaacatcgaacgtttcccaa acggtaaaaagtacgagctggacaaatataccatgttccactacctgcgcgcgcaggaatttgaacacggcaaatcccgtatcgcactgactaactccgttaacgaagctctgctcaacccgtcccgtgtatacaccttcttctctagcgactacgtgaaaaaggtcaacaaagcgactgaagctgcaatgttcttgggtt gggttgaacagcttgtttatgattttaccgacgagacgtccgaagtatctactaccgacaaaattgcggatatcactatcatcatcccgtacatcggtccggctgaacattggcaacatgctgtacaaagacgacttcgttggcgcactgatcttctccggtgcggtgatcctgctggagttcatcccggaaatcgccatcccgg tactgggcacctttgctctggtttcttacattgcaaacaaggttctgactgtacaaaccatcgacaacgcgctgagcaaacgtaacgaaaaatgggatgaagtttacaaatatatcgtgaccaactggctggctaaggttaatactcagatcgacctcatccgcaaaaaaatgaaagaagcactggaaaaccaggcggaagctaccaa ggcaatcattaactaccagtacaaccagtacaccgaggaagaaaaaaacaacatcaacttcaacatcgacgatctgtcctctaaactgaacgaatccatcaacaaagctatgatcaacatcaacaagttcctgaaccagtgctctgtaagctatctgatgaactccatgatcccgtacggtgttaaacgtctggaggacttcgatgcg tctctgaaagacgccctgctgaaatacatttacgacaaccgtggcactctgatcggtcaggttgatcgtctgaaggacaaagtgaacaataccttatcgaccgacatcccttttcagctcagtaaatatgtcgataaccaacgccttttgtccactctagaaggcggTGGCGGTAGCGGTGGCGGTGGCAGCGGCGTGGCGGTAGCGCACT AGacAACAGCGACCCTAAATGCCCACTgAGTCATGAAGGATACTGCCTTAATGATGGTGTTTGTATGTACATAGGAACATTGGACCGTTATGCTTGCAATTGTGTAGTGGGCTATGTCGGGGAAAGGTGTCAATATCGATCTCAAGCTGGCAGAGTTAAGAgggctagaagcaGGCGGCAGCGGCGGCGGCAGCGGCCTGCCCGAAAGCGGTGGCGGATCTGCTTGG TCTCACCCGCAGTTCGAAAAAGGTGGTGGTTCTGGTGGTGGTTCTGGTGGTTCTGCTTGGTCTCACCCGCAGTTCGAAAAAtaatgaAAGCTTGCGGCCGCACTCGAGCACCACCACCACCACCACTGAGATCCGGCTGCTAACAAAGCCCGAAAGGAAGCTGAGTTGGCTGCTGCCACCGCTGAGCAATAACTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTT GAGGGGTTTTTTGCTGAAAGGAGGAACTATATCCGGAT

SEQ ID NO: 2 - Полипептидная последовательность полипептида с EGF-лигадом с участками двукратного мечения посредством SrtASEQ ID NO: 2 - Polypeptide sequence of EGF ligand polypeptide with SrtA double-labeled sites

MENLYFQGGGGSGGSGGSPFVNKQFNYKDPVNGVDIAYIKIPNAGQMQPVKAFKIHNKIWVIPERDTFTNPEEGDLNPPPEAKQVPVSYYDSTYLSTDNEKDNYLKGVTKLFERIYSTDLGRMLLTSIVRGIPFWGGSTIDTELKVIDTNCINVIQPDGSYRSEELNLVIIGPSADIIQFECKSFGHEVLNLTRNGYGSTQYIRFSPDFTFGFEESLEVDTNPLLGAGKFATDPAVTLAHELIHAGHRLYGIAINPNRVFKVNTNAYYEMSGLEVSFEELRTFGGHDAKFIDSLQENEFRLYYYNKFKDIASTLNKAKSIVGTTASLQYMKNVFKEKYLLSEDTSGKFSVDKLKFDKLYKMLTEIYTEDNFVKFFKVLNRKTYLNFDKAVFKINIVPKVNYTIYDGFNLRNTNLAANFNGQNTEINNMNFTKLKNFTGLFEFYKLLCVDGIITSKTKSLIEGRNKALNLQCIKVNNWDLFFSPSEDNFTNDLNKGEEITSDTNIEAAEENISLDLIQQYYLTFNFDNEPENISIENLSSDIIGQLELMPNIERFPNGKKYELDKYTMFHYLRAQEFEHGKSRIALTNSVNEALLNPSRVYTFFSSDYVKKVNKATEAAMFLGWVEQLVYDFTDETSEVSTTDKIADITIIIPYIGPALNIGNMLYKDDFVGALIFSGAVILLEFIPEIAIPVLGTFALVSYIANKVLTVQTIDNALSKRNEKWDEVYKYIVTNWLAKVNTQIDLIRKKMKEALENQAEATKAIINYQYNQYTEEEKNNINFNIDDLSSKLNESINKAMININKFLNQCSVSYLMNSMIPYGVKRLEDFDASLKDALLKYIYDNRGTLIGQVDRLKDKVNNTLSTDIPFQLSKYVDNQRLLSTLEGGGGSGGGGSGGGGSALDNSDPKCPLSHEGYCLNDGVCMYIGTLDRYACNCVVGYVGERCQYRDLKLAELRGLEAGGSGGGSGLPESGGGSAWSHPQFEKGGGSGGGSGGSAWSHPQFEKMENLYFQGGGGSGGSGGSPFVNKQFNYKDPVNGVDIAYIKIPNAGQMQPVKAFKIHNKIWVIPERDTTFTNPEEGDLNPPPEAKQVPVSYYDSTYLSTDNEKDNYLKGVTKLFERIYSTDLGRMLLTSIVRGIPFWGGSTIDTELKVIDTNCINVIQPDGSYRSEELNLVIIGPSADIIQFECKSFGHEVLNLTRNGYG STQYIRFSPDFTFGFEESLEVDTNPLLGAGKFATDPAVTLAHELIHAGHRLYGIAINPNRVFKVNTNAYYEMSGLEVSFEELRTFGGHDAKFIDSLQENEFRLYYYNKFKDIASTLNKAKSIVGTTASLQYMKNVFKEKYLLSEDTSGKFSVDKLKFDKLYKMLTEIYTEDNFVKFFKVLNRKTYLNFDKAVF KINIVPKVNYTIYDGFNLRNTNLAANFNGQNTEINNMNFTKLKNFTGLFEFYKLLCVDGIITSKTKSLIEGRNKALNLQCIKVNNWDLFFSPSEDNFTNDLNKGEEITSDTNIEAAEENISLDLIQQYYLTFNFDNEPENISIENLSSDIIGQLELMPNIERFPNGKKYELDKYTMFHYLRAQEFEHGKSRIALTNSVNEALLNPSR VYTFFSSDYVKKVNKATEAAMFLGWVEQLVYDFTDETSEVSTTDKIADITIIIPYIGPALNIGNMLYKDDFVGALIFSGAVILLEFIPEIAIPVLGTFALVSYIANKVLTVQTIDNALSKRNEKWDEVYKYIVTNWLAKVNTQIDLIRKKMKEALENQAEATKAIINYQYNQYTEEEKNNINFNIDDLSSKLNESINKAMININK FLNQCSVSYLMNSMIPYGVKRLEDFDASLKDALLKYIYDNRGTLIGQVDRLKDKVNNTLSTDIPFQLSKYVDNQRLLSTLEGGGGSGGGGSGGGGSALDNSDPKCPLSHEGYCLNDGVCMYIGTLDRYACNCVVGYVGERCQYRDLKLAELRGLEAGGSGGGSGLPESGGGSAWSHPQFEKGGGSGGGSG GSAWSHPQFEK

SEQ ID NO: 3 - Нуклеотидная последовательность полипептида с ноцицептин-лигандом с участками двукратного мечения посредством SrtASEQ ID NO: 3 - Nucleotide sequence of the nociceptin ligand polypeptide with SrtA double-labeled sites

TGGCGAATGGGACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTAGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGTCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGCTTACAATTTAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAATTAATTCTTAGAAAAACTCATCGAGCATCAAATGAAACTGCAATTTATTCATATCAGGATTATCAATACCATATTTTTGAAAAAGCCGTTTCTGTAATGAAGGAGAAAACTCACCGAGGCAGTTCCATAGGATGGCAAGATCCTGGTATCGGTCTGCGATTCCGACTCGTCCAACATCAATACAACCTATTAATTTCCCCTCGTCAAAAATAAGGTTATCAAGTGAGAAATCACCATGAGTGACGACTGAATCCGGTGAGAATGGCAAAAGTTTATGCATTTCTTTCCAGACTTGTTCAACAGGCCAGCCATTACGCTCGTCATCAAAATCACTCGCATCAACCAAACCGTTATTCATTCGTGATTGCGCCTGAGCGAGACGAAATACGCGATCGCTGTTAAAAGGACAATTACAAACAGGAATCGAATGCAACCGGCGCAGGAACACTGCCAGCGCATCAACAATATTTTCACCTGAATCAGGATATTCTTCTAATACCTGGAATGCTGTTTTCCCGGGGATCGCAGTGGTGAGTAACCATGCATCATCAGGAGTACGGATAAAATGCTTGATGGTCGGAAGAGGCATAAATTCCGTCAGCCAGTTTAGTCTGACCATCTCATCTGTAACATCATTGGCAACGCTACCTTTGCCATGTTTCAGAAACAACTCTGGCGCATCGGGCTTCCCATACAATCGATAGATTGTCGCACCTGATTGCCCGACATTATCGCGAGCCCATTTATACCCATATAAATCAGCATCCATGTTGGAATTTAATCGCGGCCTAGAGCAAGACGTTTCCCGTTGAATATGGCTCATAACACCCCTTGTATTACTGTTTATGTAAGCAGACAGTTTTATTGTTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATCGGCGATAATGGCCTGCTTCTCGCCGAAACGTTTGGTGGCGGGACCAGTGACGAAGGCTTGAGCGAGGGCGTGCAAGATTCCGAATACCGCAAGCGACAGGCCGATCATCGTCGCGCTCCAGCGAAAGCGGTCCTCGCCGAAAATGACCCAGAGCGCTGCCGGCACCTGTCCTACGAGTTGCATGATAAAGAAGACAGTCATAAGTGCGGCGACGATAGTCATGCCCCGCGCCCACCGGAAGGAGCTGACTGGGTTGAAGGCTCTCAAGGGCATCGGTCGAGATCCCGGTGCCTAATGAGTGAGCTAACTTACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCCAGGGTGGTTTTTCTTTTCACCAGTGAGACGGGCAACAGCTGATTGCCCTTCACCGCCTGGCCCTGAGAGAGTTGCAGCAAGCGGTCCACGCTGGTTTGCCCCAGCAGGCGAAAATCCTGTTTGATGGTGGTTAACGGCGGGATATAACATGAGCTGTCTTCGGTATCGTCGTATCCCACTACCGAGATATCCGCACCAACGCGCAGCCCGGACTCGGTAATGGCGCGCATTGCGCCCAGCGCCATCTGATCGTTGGCAACCAGCATCGCAGTGGGAACGATGCCCTCATTCAGCATTTGCATGGTTTGTTGAAAACCGGACATGGCACTCCAGTCGCCTTCCCGTTCCGCTATCGGCTGAATTTGATTGCGAGTGAGATATTTATGCCAGCCAGCCAGACGCAGACGCGCCGAGACAGAACTTAATGGGCCCGCTAACAGCGCGATTTGCTGGTGACCCAATGCGACCAGATGCTCCACGCCCAGTCGCGTACCGTCTTCATGGGAGAAAATAATACTGTTGATGGGTGTCTGGTCAGAGACATCAAGAAATAACGCCGGAACATTAGTGCAGGCAGCTTCCACAGCAATGGCATCCTGGTCATCCAGCGGATAGTTAATGATCAGCCCACTGACGCGTTGCGCGAGAAGATTGTGCACCGCCGCTTTACAGGCTTCGACGCCGCTTCGTTCTACCATCGACACCACCACGCTGGCACCCAGTTGATCGGCGCGAGATTTAATCGCCGCGACAATTTGCGACGGCGCGTGCAGGGCCAGACTGGAGGTGGCAACGCCAATCAGCAACGACTGTTTGCCCGCCAGTTGTTGTGCCACGCGGTTGGGAATGTAATTCAGCTCCGCCATCGCCGCTTCCACTTTTTCCCGCGTTTTCGCAGAAACGTGGCTGGCCTGGTTCACCACGCGGGAAACGGTCTGATAAGAGACACCGGCATACTCTGCGACATCGTATAACGTTACTGGTTTCACATTCACCACCCTGAATTGACTCTCTTCCGGGCGCTATCATGCCATACCGCGAAAGGTTTTGCGCCATTCGATGGTGTCCGGGATCTCGACGCTCTCCCTTATGCGACTCCTGCATTAGGAAGCAGCCCAGTAGTAGGTTGAGGCCGTTGAGCACCGCCGCCGCAAGGAATGGTGCATGCAAGGAGATGGCGCCCAACAGTCCCCCGGCCACGGGGCCTGCCACCATACCCACGCCGAAACAAGCGCTCATGAGCCCGAAGTGGCGAGCCCGATCTTCCCCATCGGTGATGTCGGCGATATAGGCGCCAGCAACCGCACCTGTGGCGCCGGTGATGCCGGCCACGATGCGTCCGGCGTAGAGGATCGAGATCTCGATCCCGCGAAATTAATACGACTCACTATAGGGGAATTGTGAGCGGATAACAATTCCCCTCAAGAAATAATTTTGTTTAACTTTAAGAAGGAGATATACATatgGAGAACCTGTATTTTCAGGGCGGCGGTGGCAGCGGCGGCAGCGGCGGCAGCGGCAGCATGcctTTTGTGAACAAACAGTTCAACTATAAGGATCCGGTTAATGGTGTGGATATCGCCTATATCAAAATTCCGAATGCAGGTCAGATGCAGCCGGTTAAAGCCTTTAAAATCCATAACAAAATTTGGGTGATTCCGGAACGTGATACCTTTACCAATCCGGAAGAAGGTGATCTGAATCCGCCTCCGGAAGCAAAACAGGTTCCGGTTAGCTATTATGATAGCACCTATCTGAGCACCGATAACGAGAAAGATAACTATCTGAAAGGTGTGACCAAACTGTTTGAACGCATTTATAGTACCGATCTGGGTCGTATGCTGCTGACCAGCATTGTTCGTGGTATTCCGTTTTGGGGTGGTAGCACCATTGATACCGAACTGAAAGTTATTGACACCAACTGCATTAATGTGATTCAGCCGGATGGTAGCTATCGTAGCGAAGAACTGAATCTGGTTATTATTGGTCCGAGCGCAGATATCATTCAGTTTGAATGTAAATCCTTTGGCCACGAAGTTCTGAATCTGACCCGTAATGGTTATGGTAGTACCCAGTATATTCGTTTCAGTCCGGATTTTACCTTTGGCTTTGAAGAAAGCCTGGAAGTTGATACAAATCCGCTGTTAGGTGCAGGTAAATTTGCAACCGATCCGGCAGTTACCCTGGCACATGAACTGATTCATGCCGGTCATCGTCTGTATGGTATTGCAATTAATCCGAACCGTGTGTTCAAAGTGAATACCAACGCATATTATGAAATGAGCGGTCTGGAAGTGTCATTTGAAGAACTGCGTACCTTTGGTGGTCATGATGCCAAATTTATCGATAGCCTGCAAGAAAATGAATTTCGCCTGTACTACTATAACAAATTCAAGGATATTGCGAGCACCCTGAATAAAGCCAAAAGCATTGTTGGCACCACCGCAAGCCTGCAGTATATGAAAAATGTGTTTAAAGAAAAATATCTGCTGAGCGAAGATACCAGCGGTAAATTTAGCGTTGACAAACTGAAATTCGATAAACTGTACAAGATGCTGACCGAGATTTATACCGAAGATAACTTCGTGAAGTTTTTCAAAGTGCTGAACCGCAAAACCTACCTGAACTTTGATAAAGCCGTGTTCAAAATCAACATCGTGCCGAAAGTGAACTATACCATCTATGATGGTTTTAACCTGCGCAATACCAATCTGGCAGCAAACTTTAATGGTCAGAACACCGAAATCAACAACATGAACTTTACCAAACTGAAGAACTTCACCGGTCTGTTCGAATTTTACAAACTGCTGTGTGTGGATGGCATTATTACCAGCAAAACCAAATCCGATGATGACGATAAATTCGGTGGTTTTACCGGTGCACGTAAAAGCGCACGTAAACGTAAAAATCAGGCACTGGCAGGCGGTGGTGGTAGCGGTGGCGGTGGTTCAGGTGGTGGTGGCTCAGCACTGGTTCTGCAGTGTATTAAAGTTAATAACTGGGACCTGTTTTTTAGCCCGAGCGAGGATAATTTCACCAACGATCTGAACAAAGGCGAAGAAATTACCAGCGATACCAATATTGAAGCAGCCGAAGAAAACATTAGCCTGGATCTGATTCAGCAGTATTATCTGACCTTCAACTTCGATAATGAGCCGGAAAATATCAGCATTGAAAACCTGAGCAGCGATATTATTGGCCAGCTGGAACTGATGCCGAATATTGAACGTTTTCCGAACGGCAAAAAATACGAGCTGGATAAATACACCATGTTCCATTATCTGCGTGCCCAAGAATTTGAACATGGTAAAAGCCGTATTGCACTGACCAATAGCGTTAATGAAGCACTGCTGAACCCGAGCCGTGTTTATACCTTTTTTAGCAGCGATTACGTGAAAAAGGTTAACAAAGCAACCGAAGCAGCCATGTTTTTAGGTTGGGTTGAACAGCTGGTTTATGATTTCACCGATGAAACCAGCGAAGTTAGCACCACCGATAAAATTGCAGATATTACCATCATCATCCCGTATATCGGTCCGGCACTGAATATTGGCAATATGCTGTATAAAGACGATTTTGTGGGTGCCCTGATCTTTAGCGGTGCAGTTATTCTGCTGGAATTTATTCCGGAAATTGCCATTCCGGTTCTGGGCACCTTTGCACTGGTGAGCTATATTGCAAATAAAGTTCTGACCGTGCAGACCATCGATAATGCACTGAGCAAACGTAACGAAAAATGGGATGAAGTGTACAAGTATATCGTGACCAATTGGCTGGCAAAAGTTAACACCCAGATTGACCTGATTCGCAAGAAGATGAAAGAAGCACTGGAAAACCAGGCAGAAGCAACCAAAGCCATTATTAACTATCAGTACAACCAGTACACCGAAGAAGAGAAGAATAACATCAACTTCAACATCGATGATCTGAGCAGCAAGCTGAATGAAAGCATCAACAAAGCCATGATCAACATTAACAAATTTCTGAATCAGTGCAGCGTGAGCTATCTGATGAATAGCATGATTCCGTATGGTGTGAAACGTCTGGAAGATTTTGATGCAAGCCTGAAAGATGCCCTGCTGAAATATATCTATGATAATCGTGGCACCCTGATTGGTCAGGTTGATCGTCTGAAAGATAAAGTGAACAACACCCTGAGTACCGATATTCCTTTTCAGCTGAGCAAATATGTGGATAATCAGCGTCTGCTGAGTACCCTGGATGGCGGCAGCGGCGGCGGCAGCGGCCTGCCCGAAAGCGGTGGCGGATCTGCTTGGTCTCACCCGCAGTTCGAAAAAGGTGGTGGTTCTGGTGGTGGTTCTGGTGGTTCTGCTTGGTCTCACCCGCAGTTCGAAAAAtaatgaAAGCTTGCGGCCGCACTCGAGCACCACCACCACCACCACTGAGATCCGGCTGCTAACAAAGCCCGAAAGGAAGCTGAGTTGGCTGCTGCCACCGCTGAGCAATAACTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTTTGCTGAAAGGAGGAACTATATCCGGATTGGCGAATGGGACGCGCCCTGTAGCGGCCGCATTAAGCGCGGCGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTT GATTAGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGTCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTAACAAAATATTAACG CTTACAATTTAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAATTAATTCTTAGAAAAACTCATCGAGCATCAAATGAAACTGCAATTTATTCATATCAGGATTATCAATACCATATTTTTGAAAAAGCCGTTTCTGTAATGAAGGAGAAAACTCACCGAGGCAGTTCCATAGGATGGCAAGATCCTGGTATCGG TCTGCGATTCCGACTCGTCCAACATCAATACAACCTATTAATTTCCCCTCGTCAAAAATAAGGTTATCAAGTGAGAAATCACCATGAGTGACGACTGAATCCGGTGAGAATGGCAAAAGTTTATGCATTTCTTTCCAGACTTGTTCAACAGGCCAGCCATTACGCTCGTCATCAAAATCACTCGCATCAACCAAACCGTTATTCATTCGTGATTGCGCCTGAGCGAGACGAAATACGCGATCGC TGTTAAAAGGACAATTACAAACAGGAATCGAATGCAACCGGCGCAGGAACACTGCCAGCGCATCAACAATATTTTCACCTGAATCAGGATATTCTTCTAATACCTGGAATGCTGTTTTCCCGGGGATCGCAGTGGTGAGTAACCATGCATCATCAGGAGTACGGATAAAATGCTTGATGGTCGGAAGAGGCATAAATTCCGTCAGCCAGTTTAGTCTGACCATCTCATCTGTAACATCATTG GCAACGCTACCTTTGCCATGTTTCAGAAACAACTCTGGCGCATCGGGCTTCCCATACAATCGATAGATTGTCGCACCTGATTGCCCGACATTATCGCGAGCCCATTTATACCCATATAAATCAGCATCCATGTTGGAATTTAATCGCGGCCTAGAGCAAGACGTTTCCCGTTGAATATGGCTCATAACACCCCTTGTATTACTGTTTATGTAAGCAGACAAGTTTTATTGTTCATGACCAAAATCCC TTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACT TCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCT TCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTT TGCGTGGCCTTTTGCTCACATCGGCGATAATGGCCTGCTTCTCGCCGAAACGTTTGGTGGCGGGACCAGTGACGAAGGCTTGAGCGAGGCGTGCAAGATTCCGAATACCGCAAGCGACAGGCCGATCATCGTCGCGCTCCAGCGAAAGCGGTCCTCGCCGAAAATGACCCAGAGCGCTGCCGGCACCTGTCCTACGAGTTGCATGATAAAGAAGACAGTCATAAGTGCGGCGACG ATAGTCATGCCCCGCGCCCACCGGAAGGAGCTGACTGGTTGAAGGCTCTCAAGGGCATCGGTCGAGATCCCGGTGCCTAATGAGTGAGCTAACTTACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCCAGGGTGGTTTTTCTT TTCACCAGTGAGACGGGCAACAGCTGATTGCCCTTCACCGCCTGGCCCTGAGAGAGTTGCAGCAAGCGGTCCACGCTGGTTTGCCCCAGCAGGCGAAAATCCTGTTTGATGGTGGTTAACGGCGGGATATAACATGAGCTGTCTTCGGTATCGTCGTATCCCACTACCGAGATATCCGCACCAACGCGCAGCCCGGACTCGGTAATGGCGCGCATTGCGCCCAGCGCCATCT GATCGTTGGCAACCAGCATCGCAGTGGGAACGATGCCCTCATTCAGCATTTGCATGGTTTGTTGAAAACCGGACATGGCACTCCAGTCGCCTTCCCGTTCCGCTATCGGCTGAATTTGATTGCGAGTGAGATATTTATGCCAGCCAGCCAGACGCAGACGCGCCGAGACAGAACTTAATGGGCCCGCTAACAGCGCGATTTGCTGGTGACCCAATGCGACCAGATGCTCCACGCCCAGTC GCGTACCGTCTTCATGGGAGAAAATAATACTGTTGATGGGTGTCTGGTCAGAGACATCAAGAAATAACGCCGGAACATTAGTGTCAGGCAGCTTCCACAGCAATGGCATCCTGGTCATCCAGCGGATAGTTAATGATCAGCCCACTGACGCGTTGCGCGAGAAGATTGTGCACCGCCGCTTTACAGGCTTCGACGCCGCTTCGTTCTACCATCGACACCACCGCTGGCACCCAGTTGA TCGGCGCGAGATTTAATCGCCGCGACAATTTGCGACGGCGCGTGCAGGGCCAGACTGGAGGTGGCAACGCCAATCAGCAACGACTGTTTGCCCGCCAGTTGTTGTGCCACGCGGTTGGGAATGTAATTCAGCTCCGCCATCGCCGCTTCCACTTTTTCCCGCGTTTTCGCAGAAACGTGGCTGGCCTGGTTCACCACGCGGGAAACGGTCTGATAAGAGACACCGGCAT ACTCTGCGACATCGTATAACGTTACTGGTTTCACATTCACCACCCTGAATTGACTCTCTTCCGGGCGCTATCATGCCATACCGCGAAAGGTTTTGCGCCATTCGATGGTGTCCGGGATCTCGACGCTCTCCCTTATGCGACTCCTGCATTAGGAAGCAGCCCAGTAGTAGGTTGAGGCCGTTGAGCACCGCCCGCAAGGAATGGTGCATGCAAGGAGATGGCGCCCCAACAGTCCCCC GGCCACGGGGCCTGCCACCATACCCACGCCGAAACAAGCGCTCATGAGCCCGAAGTGGCGAGCCCGAATCTTCCCCATCGGTGATGTCGGCGATATAGGCGCCAGCAACCGCACCTGTGGCGCCGGTGATGCCGGCCACGATGCGTCCGGCGTAGAGGATCGAGATCTCGATCCCGAAATTAATACGACTCACTATAGGGGAATTGTGAGCGGATAACAATTCCCCTCAAGAA ATAATTTTGTTTAACTTTAAAGGAGATACATatgGAGAACCTGTATTTCAGGGCGGCGGTGGCAGCGGCGGCAGCGGCGCAGCGGCAGCATGcctTTTGTGAACAAACAGTTCAACTATAAGGATCCGGTTAATGGTGTGGATATCGCCTATATCAAAATTCCGAATGCAGGTCAGATGCAGCCGGTTAAAGCCTTTAAAATCCATAACAAAATTTGGGTGATTCCGGA ACGTGATACCTTTACCAATCCGGAAGAAGGTGATCTGAATCCGCCTCCGGAAGCAAAACAGGTTCCGGTTAGCTATTATGATAGCACCTATCTGAGCACCGATAACGAGAAAGATAACTATCTGAAAGGTGTGACCAAACTGTTTGAACGCATTTATAGTACCGATCTGGGTCGTATGCTGCTGACCAGCATTGTTCGTGGTATTCCGTTTTGGGGTGGTAGCACCATTGATA CCGAACTGAAAGTTATTGACACCAACTGCATTAATGTGATTCAGCCGGATGGTAGCTATCGTAGCGAAGAACTGAATCTGGTTATTATTGGTCCGAGCGCAGATATCATTCAGTTTGAATGTAAATCCTTTGGCCACGAAGTTCTGAATCTGACCCGTAATGGTTATGGTAGTACCCAGTATATTCGTTTCAGTCCGGATTTTACCTTTGGCTTTTGAAGAAAGCCTGGA AGTTGATACAAATCCGCTGTTAGGTGCAGGTAAATTTGCAACCGATCCGGCAGTTACCCTGGCACATGAACTGATTCATGCCGGTCATCGTCTGTATGGTATTGCAATTAATCCGAACCGTGTGTTCAAAGTGAATACCAACGCATATTATGAAATGAGCGGTCTGGAAGTGTCATTTGAAGAACTGCGTACCTTTGGTGGTCATGATGCCAAATTTATCGATAGCCTGCAAGAAA ATGAATTTCGCCTGTACTACTATAACAAATTCAAGGATATTGCGAGCACCCTGAATAAAGCCAAAAGCATTGTTGGCACCACCGCAAGCCTGCAGTATATGAAAAATGTGTTTAAAGAAAAAATATCTGCTGAGCGAAGATACCAGCGGTAAATTTAGCGTTGACAAACTGAAATTCGATAAACTGTACAAGATGCTGACCGAGATTTATACCGAAGATAACTTCGTGAAGTTTTTCAAAGTGCTGA ACCGCAAAACCTACCTGAACTTTGATAAAGCCGTGTTCAAAATCAACATCGTGCCGAAAGTGAACTATACCATCTATGATGGTTTTAACCTGCGCAATACCAATCTGGCAGCAAACTTTAATGGTCAGAACACCGAAATCAACAACATGAACTTTACCAAACTGAAGAACTTCACCGGTCTGTTCGAATTTTACAAACTGCTGTGTGTGTGGATGGCATTATTACCAGCAAAACCAAATCCGATGATGA CGATAAATTCGGTGGTTTTACCGGTGCACGTAAAAGCGCACGTAAACGTAAAAATCAGGCACTGGCAGGCGGTGGTGGTAGCGGTGGCGGTGGTTCAGGTGGTGGTGGCTCAGCACTGGTTCTGCAGTGTATTAAAGTTAATAACTGGGACCTGTTTTTAAGCCCGAGCGAGGATAATTTCACCAACGATCTGAACAAAGGCGAAGAAATTACCAGCGATACCAATATT GAAGCAGCCGAAGAAAACATTAGCCTGGATCTGATTCAGCAGTATTATCTGACCTTCAACTTCGATAATGAGCCGGAAAATATCAGCATTGAAAACCTGAGCAGCGATATTTGGCCAGCTGGAACTGATGCCGAATATTGAACGTTTTCCGAACGGCAAAAATACGAGCTGGATAAATACACCATGTTCCATTATCTGCGTGCCCAAGAATTTGAACATGGTAAAAGCCGTATTGCACTGA CCAATAGCGTTAATGAAGCACTGCTGAACCCGAGCCGTGTTTATACCTTTTTTAGCAGCGATTACGTGTGAAAAAGGTTAACAAAGCAACCGAAGCAGCCATGTTTTTAGGTTGGGTTGAACAGCTGGTTTATGATTTCACCGATGAAACCAGCGAAGTTAGCACCACCGATAAAATTGCAGATATTACCATCATCATCCCGTATATCGGTCCGGCACTGAATATTGGCAATATGCTGT ATAAAGACGATTTTGTGGGTGCCCTGATCTTTAGCGGTGCAGTTATTCTGCTGGAATTTATTCCGGAAATTGCCATTCCGGTTCTGGGCACCTTTGCACTGGTGAGCTATATTGCAAATAAAGTTCTGACCGTGCAGACCCATCGATAATGCACTGAGCAAACGTAACGAAAAATGGGATGAAGTGTACAAGTATATCGTGACCAATTGGCTGGCAAAAGTTAACACCCAGATTGA CCTGATTCGCAAGAAGATGAAAGAAGCACTGGAAAACCAGGCAGAAGCAACCAAAGCCATTATTAACTATCAGTACAACCAGTACACCGAAGAAGAGAGAATAACATCAACTTCAACATCGATGATCTGAGCAGCAAGCTGAATGAAAGCATCAACAAAGCCATGATCAACATTAACAAATTTCTGAATCAGTGCAGCGTGAGCTATCTGATGAATAGCATGATTCCGTATGGTGTGAA ACGTCTGGAAGATTTTGATGCAAGCCTGAAAGATGCCCTGCTGAAATATATCTATGATAATCGTGGCACCCTGATTGGTCAGGTTGATCGTCTGAAAGATAAAGTGAACAACACCCTGAGTACCGATATTTCCTTTTCAGCTGAGCAAATATGTGGATAATCAGCGTCTGCTGAGTACCCTGGATGGCGGCAGCGGCGGCGGCAGCGGCCTGCCCGAAAGCGGTGGCGGATCTGCT TGGTCTCACCCGCAGTTCGAAAAAGGTGGTGGTTCTGGTGGTGGTTCTGGTGGTTCTGCTTGGTCTCACCCGCAGTTCGAAAAAtaatgaAAGCTTGCGGCCGCACTCGAGCACCACCACCACCACCACTGAGATCCGGCTGCTAACAAAGCCCGAAAGGAAGCTGAGTTGGCTGCTGCCACCGCTGAGCAATAACTAGCATAACCCCTTGGGCCTCTAAACGGG TCTTGAGGGGTTTTTTGCTGAAAGGAGGAACTATATCCGGAT

SEQ ID NO: 4 - Полипептидная последовательность полипептида с ноцицептин-лигандом с участками двукратного мечения посредством SrtASEQ ID NO: 4 - Polypeptide sequence of the nociceptin ligand polypeptide with SrtA double-labeled sites

MENLYFQGGGGSGGSGGSGSMPFVNKQFNYKDPVNGVDIAYIKIPNAGQMQPVKAFKIHNKIWVIPERDTFTNPEEGDLNPPPEAKQVPVSYYDSTYLSTDNEKDNYLKGVTKLFERIYSTDLGRMLLTSIVRGIPFWGGSTIDTELKVIDTNCINVIQPDGSYRSEELNLVIIGPSADIIQFECKSFGHEVLNLTRNGYGSTQYIRFSPDFTFGFEESLEVDTNPLLGAGKFATDPAVTLAHELIHAGHRLYGIAINPNRVFKVNTNAYYEMSGLEVSFEELRTFGGHDAKFIDSLQENEFRLYYYNKFKDIASTLNKAKSIVGTTASLQYMKNVFKEKYLLSEDTSGKFSVDKLKFDKLYKMLTEIYTEDNFVKFFKVLNRKTYLNFDKAVFKINIVPKVNYTIYDGFNLRNTNLAANFNGQNTEINNMNFTKLKNFTGLFEFYKLLCVDGIITSKTKSDDDDKFGGFTGARKSARKRKNQALAGGGGSGGGGSGGGGSALVLQCIKVNNWDLFFSPSEDNFTNDLNKGEEITSDTNIEAAEENISLDLIQQYYLTFNFDNEPENISIENLSSDIIGQLELMPNIERFPNGKKYELDKYTMFHYLRAQEFEHGKSRIALTNSVNEALLNPSRVYTFFSSDYVKKVNKATEAAMFLGWVEQLVYDFTDETSEVSTTDKIADITIIIPYIGPALNIGNMLYKDDFVGALIFSGAVILLEFIPEIAIPVLGTFALVSYIANKVLTVQTIDNALSKRNEKWDEVYKYIVTNWLAKVNTQIDLIRKKMKEALENQAEATKAIINYQYNQYTEEEKNNINFNIDDLSSKLNESINKAMININKFLNQCSVSYLMNSMIPYGVKRLEDFDASLKDALLKYIYDNRGTLIGQVDRLKDKVNNTLSTDIPFQLSKYVDNQRLLSTLDGGSGGGSGLPESGGGSAWSHPQFEKGGGMENLYFQGGGGSGGSGGSGSMPFVNKQFNYKDPVNGVDIAYIKIPNAGQMQPVKAFKIHNKIWVIPERDTTFTNPEEGDLNPPPEAKQVPVSYYDSTYLSTDNEKDNYLKGVTKLFERIYSTDLGRMLLTSIVRGIPFWGGSTIDTELKVIDTNCINVIQPDGSYRSEELNLVIIGPSADIIQFECKSFGHEVLNLTRNG YGSTQYIRFSPDFTFGFEESLEVDTNPLLGAGKFATDPAVTLAHELIHAGHRLYGIAINPNRVFKVNTNAYYEMSGLEVSFEELRTFGGHDAKFIDSLQENEFRLYYYNKFKDIASTLNKAKSIVGTTASLQYMKNVFKEKYLLSEDTSGKFSVDKLKFDKLYKMLTEIYTEDNFVKFFKVLNRKTYLNFDK AVFKINIVPKVNYTIYDGFNLRNTNLAANFNGQNTEINNMNFTKLKNFTGLFEFYKLLCVDGIITSKTKSDDDDKFGGFTGARKSARKRKNQALAGGGGSGGGGSGGGGSALVLQCIKVNNWDLFFSPSEDNFTNDLNKGEEITSDTNIEAAEENISLDLIQQYYLTFNFDNEPENISIENLSSDIIGQLELMPNIERFP NGKKYELDKYTMFHYLRAQEFEHGKSRIALTNSVNEALLNPSRVYTFFSSDYVKKVNKATEAAMFLGWVEQLVYDFTDETSEVSTTDKIADITIIIPYIGPALNIGNMLYKDDFVGALIFSGAVILLEFIPEIAIPVLGTFALVSYIANKVLTVQTIDNALSKRNEKWDEVYKYIVTNWLAKVNTQIDLIRKKMKEALENQAEAT KAIINYQYNQYTEEEKNNINFNIDDLSSKLNESINKAMININKFLNQCSVSYLMNSMIPYGVKRLEDFDASLKDALLKYIYDNRGTLIGQVDRLKDKVNNTLSTDIPFQLSKYVDNQRLLSTLDGGSGGGSGLPESGGGSAWSHPQFEKGGG

SEQ ID NO: 5 - Нуклеотидная последовательность полипептида с EGF-лигандомSEQ ID NO: 5 - Nucleotide sequence of EGF ligand polypeptide

TGGCGAATGGGACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTAGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGTCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGCTTACAATTTAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAATTAATTCTTAGAAAAACTCATCGAGCATCAAATGAAACTGCAATTTATTCATATCAGGATTATCAATACCATATTTTTGAAAAAGCCGTTTCTGTAATGAAGGAGAAAACTCACCGAGGCAGTTCCATAGGATGGCAAGATCCTGGTATCGGTCTGCGATTCCGACTCGTCCAACATCAATACAACCTATTAATTTCCCCTCGTCAAAAATAAGGTTATCAAGTGAGAAATCACCATGAGTGACGACTGAATCCGGTGAGAATGGCAAAAGTTTATGCATTTCTTTCCAGACTTGTTCAACAGGCCAGCCATTACGCTCGTCATCAAAATCACTCGCATCAACCAAACCGTTATTCATTCGTGATTGCGCCTGAGCGAGACGAAATACGCGATCGCTGTTAAAAGGACAATTACAAACAGGAATCGAATGCAACCGGCGCAGGAACACTGCCAGCGCATCAACAATATTTTCACCTGAATCAGGATATTCTTCTAATACCTGGAATGCTGTTTTCCCGGGGATCGCAGTGGTGAGTAACCATGCATCATCAGGAGTACGGATAAAATGCTTGATGGTCGGAAGAGGCATAAATTCCGTCAGCCAGTTTAGTCTGACCATCTCATCTGTAACATCATTGGCAACGCTACCTTTGCCATGTTTCAGAAACAACTCTGGCGCATCGGGCTTCCCATACAATCGATAGATTGTCGCACCTGATTGCCCGACATTATCGCGAGCCCATTTATACCCATATAAATCAGCATCCATGTTGGAATTTAATCGCGGCCTAGAGCAAGACGTTTCCCGTTGAATATGGCTCATAACACCCCTTGTATTACTGTTTATGTAAGCAGACAGTTTTATTGTTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATCGGCGATAATGGCCTGCTTCTCGCCGAAACGTTTGGTGGCGGGACCAGTGACGAAGGCTTGAGCGAGGGCGTGCAAGATTCCGAATACCGCAAGCGACAGGCCGATCATCGTCGCGCTCCAGCGAAAGCGGTCCTCGCCGAAAATGACCCAGAGCGCTGCCGGCACCTGTCCTACGAGTTGCATGATAAAGAAGACAGTCATAAGTGCGGCGACGATAGTCATGCCCCGCGCCCACCGGAAGGAGCTGACTGGGTTGAAGGCTCTCAAGGGCATCGGTCGAGATCCCGGTGCCTAATGAGTGAGCTAACTTACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCCAGGGTGGTTTTTCTTTTCACCAGTGAGACGGGCAACAGCTGATTGCCCTTCACCGCCTGGCCCTGAGAGAGTTGCAGCAAGCGGTCCACGCTGGTTTGCCCCAGCAGGCGAAAATCCTGTTTGATGGTGGTTAACGGCGGGATATAACATGAGCTGTCTTCGGTATCGTCGTATCCCACTACCGAGATATCCGCACCAACGCGCAGCCCGGACTCGGTAATGGCGCGCATTGCGCCCAGCGCCATCTGATCGTTGGCAACCAGCATCGCAGTGGGAACGATGCCCTCATTCAGCATTTGCATGGTTTGTTGAAAACCGGACATGGCACTCCAGTCGCCTTCCCGTTCCGCTATCGGCTGAATTTGATTGCGAGTGAGATATTTATGCCAGCCAGCCAGACGCAGACGCGCCGAGACAGAACTTAATGGGCCCGCTAACAGCGCGATTTGCTGGTGACCCAATGCGACCAGATGCTCCACGCCCAGTCGCGTACCGTCTTCATGGGAGAAAATAATACTGTTGATGGGTGTCTGGTCAGAGACATCAAGAAATAACGCCGGAACATTAGTGCAGGCAGCTTCCACAGCAATGGCATCCTGGTCATCCAGCGGATAGTTAATGATCAGCCCACTGACGCGTTGCGCGAGAAGATTGTGCACCGCCGCTTTACAGGCTTCGACGCCGCTTCGTTCTACCATCGACACCACCACGCTGGCACCCAGTTGATCGGCGCGAGATTTAATCGCCGCGACAATTTGCGACGGCGCGTGCAGGGCCAGACTGGAGGTGGCAACGCCAATCAGCAACGACTGTTTGCCCGCCAGTTGTTGTGCCACGCGGTTGGGAATGTAATTCAGCTCCGCCATCGCCGCTTCCACTTTTTCCCGCGTTTTCGCAGAAACGTGGCTGGCCTGGTTCACCACGCGGGAAACGGTCTGATAAGAGACACCGGCATACTCTGCGACATCGTATAACGTTACTGGTTTCACATTCACCACCCTGAATTGACTCTCTTCCGGGCGCTATCATGCCATACCGCGAAAGGTTTTGCGCCATTCGATGGTGTCCGGGATCTCGACGCTCTCCCTTATGCGACTCCTGCATTAGGAAGCAGCCCAGTAGTAGGTTGAGGCCGTTGAGCACCGCCGCCGCAAGGAATGGTGCATGCAAGGAGATGGCGCCCAACAGTCCCCCGGCCACGGGGCCTGCCACCATACCCACGCCGAAACAAGCGCTCATGAGCCCGAAGTGGCGAGCCCGATCTTCCCCATCGGTGATGTCGGCGATATAGGCGCCAGCAACCGCACCTGTGGCGCCGGTGATGCCGGCCACGATGCGTCCGGCGTAGAGGATCGAGATCTCGATCCCGCGAAATTAATACGACTCACTATAGGGGAATTGTGAGCGGATAACAATTCCCCTCAAGAAATAATTTTGTTTAACTTTAAGAAGGAGATATACATATgggatccatggagttcgttaacaaacagttcaactataaagacccagttaacggtgttgacattgcttacatcaaaatcccgaacgctggccagatgcagccggtaaaggcattcaaaatccacaacaaaatctgggttatcccggaacgtgatacctttactaacccggaagaaggtgacctgaacccgccaccggaagcgaaacaggtgccggtatcttactatgactccacctacctgtctaccgataacgaaaaggacaactacctgaaaggtgttactaaactgttcgagcgtatttactccaccgacctgggccgtatgctgctgactagcatcgttcgcggtatcccgttctggggcggttctaccatcgataccgaactgaaagtaatcgacactaactgcatcaacgttattcagccggacggttcctatcgttccgaagaactgaacctggtgatcatcggcccgtctgctgatatcatccagttcgagtgtaagagctttggtcacgaagttctgaacctcacccgtaacggctacggttccactcagtacatccgtttctctccggacttcaccttcggttttgaagaatccctggaagtagacacgaacccactgctgggcgctggtaaattcgcaactgatcctgcggttaccctggctcacgaactgattcatgcaggccaccgcctgtacggtatcgccatcaatccgaaccgtgtcttcaaagttaacaccaacgcgtattacgagatgtccggtctggaagttagcttcgaagaactgcgtacttttggcggtcacgacgctaaattcatcgactctctgcaagaaaacgagttccgtctgtactactataacaagttcaaagatatcgcatccaccctgaacaaagcgaaatccatcgtgggtaccactgcttctctccagtacatgaagaacgtttttaaagaaaaatacctgctcagcgaagacacctccggcaaattctctgtagacaagttgaaattcgataaactttacaaaatgctgactgaaatttacaccgaagacaacttcgttaagttctttaaagttctgaaccgcaaaacctatctgaacttcgacaaggcagtattcaaaatcaacatcgtgccgaaagttaactacactatctacgatggtttcaacctgcgtaacaccaacctggctgctaattttaacggccagaacacggaaatcaacaacatgaacttcacaaaactgaaaaacttcactggtctgttcgagttttacaagctgctgtgcgtcgacggcatcattacctccaaaactaaatctctgatagaaggtagaaacaaagcgctgaacctgcagtgtatcaaggttaacaactgggatttattcttcagcccgagtgaagacaacttcaccaacgacctgaacaaaggtgaagaaatcacctcagatactaacatcgaagcagccgaagaaaacatctcgctggacctgatccagcagtactacctgacctttaatttcgacaacgagccggaaaacatttctatcgaaaacctgagctctgatatcatcggccagctggaactgatgccgaacatcgaacgtttcccaaacggtaaaaagtacgagctggacaaatataccatgttccactacctgcgcgcgcaggaatttgaacacggcaaatcccgtatcgcactgactaactccgttaacgaagctctgctcaacccgtcccgtgtatacaccttcttctctagcgactacgtgaaaaaggtcaacaaagcgactgaagctgcaatgttcttgggttgggttgaacagcttgtttatgattttaccgacgagacgtccgaagtatctactaccgacaaaattgcggatatcactatcatcatcccgtacatcggtccggctctgaacattggcaacatgctgtacaaagacgacttcgttggcgcactgatcttctccggtgcggtgatcctgctggagttcatcccggaaatcgccatcccggtactgggcacctttgctctggtttcttacattgcaaacaaggttctgactgtacaaaccatcgacaacgcgctgagcaaacgtaacgaaaaatgggatgaagtttacaaatatatcgtgaccaactggctggctaaggttaatactcagatcgacctcatccgcaaaaaaatgaaagaagcactggaaaaccaggcggaagctaccaaggcaatcattaactaccagtacaaccagtacaccgaggaagaaaaaaacaacatcaacttcaacatcgacgatctgtcctctaaactgaacgaatccatcaacaaagctatgatcaacatcaacaagttcctgaaccagtgctctgtaagctatctgatgaactccatgatcccgtacggtgttaaacgtctggaggacttcgatgcgtctctgaaagacgccctgctgaaatacatttacgacaaccgtggcactctgatcggtcaggttgatcgtctgaaggacaaagtgaacaataccttatcgaccgacatcccttttcagctcagtaaatatgtcgataaccaacgccttttgtccactctagaaggcggTGGCGGTAGCGGTGGCGGTGGCAGCGGCGGTGGCGGTAGCGCACTAGacAACAGCGACCCTAAATGCCCACTgAGTCATGAAGGATACTGCCTTAATGATGGTGTTTGTATGTACATAGGAACATTGGACCGTTATGCTTGCAATTGTGTAGTGGGCTATGTCGGGGAAAGGTGTCAATATCGAGATCTCAAGCTGGCAGAGTTAAGAgggctagaagcaCACCATCATCACcaccatcaccatcaccattaatgaAAGCTTGCGGCCGCACTCGAGCACCACCACCACCACCACTGAGATCCGGCTGCTAACAAAGCCCGAAAGGAAGCTGAGTTGGCTGCTGCCACCGCTGAGCAATAACTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTTTGCTGAAAGGAGGAACTATATCCGGATTGGCGAATGGGACGCGCCCTGTAGCGGCCGCATTAAGCGCGGCGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTT GATTAGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGTCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTAACAAAATATTAACG CTTACAATTTAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAATTAATTCTTAGAAAAACTCATCGAGCATCAAATGAAACTGCAATTTATTCATATCAGGATTATCAATACCATATTTTTGAAAAAGCCGTTTCTGTAATGAAGGAGAAAACTCACCGAGGCAGTTCCATAGGATGGCAAGATCCTGGTATCGG TCTGCGATTCCGACTCGTCCAACATCAATACAACCTATTAATTTCCCCTCGTCAAAAATAAGGTTATCAAGTGAGAAATCACCATGAGTGACGACTGAATCCGGTGAGAATGGCAAAAGTTTATGCATTTCTTTCCAGACTTGTTCAACAGGCCAGCCATTACGCTCGTCATCAAAATCACTCGCATCAACCAAACCGTTATTCATTCGTGATTGCGCCTGAGCGAGACGAAATACGCGATCGC TGTTAAAAGGACAATTACAAACAGGAATCGAATGCAACCGGCGCAGGAACACTGCCAGCGCATCAACAATATTTTCACCTGAATCAGGATATTCTTCTAATACCTGGAATGCTGTTTTCCCGGGGATCGCAGTGGTGAGTAACCATGCATCATCAGGAGTACGGATAAAATGCTTGATGGTCGGAAGAGGCATAAATTCCGTCAGCCAGTTTAGTCTGACCATCTCATCTGTAACATCATTG GCAACGCTACCTTTGCCATGTTTCAGAAACAACTCTGGCGCATCGGGCTTCCCATACAATCGATAGATTGTCGCACCTGATTGCCCGACATTATCGCGAGCCCATTTATACCCATATAAATCAGCATCCATGTTGGAATTTAATCGCGGCCTAGAGCAAGACGTTTCCCGTTGAATATGGCTCATAACACCCCTTGTATTACTGTTTATGTAAGCAGACAAGTTTTATTGTTCATGACCAAAATCCC TTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACT TCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCT TCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTT TGCGTGGCCTTTTGCTCACATCGGCGATAATGGCCTGCTTCTCGCCGAAACGTTTGGTGGCGGGACCAGTGACGAAGGCTTGAGCGAGGCGTGCAAGATTCCGAATACCGCAAGCGACAGGCCGATCATCGTCGCGCTCCAGCGAAAGCGGTCCTCGCCGAAAATGACCCAGAGCGCTGCCGGCACCTGTCCTACGAGTTGCATGATAAAGAAGACAGTCATAAGTGCGGCGACG ATAGTCATGCCCCGCGCCCACCGGAAGGAGCTGACTGGTTGAAGGCTCTCAAGGGCATCGGTCGAGATCCCGGTGCCTAATGAGTGAGCTAACTTACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCCAGGGTGGTTTTTCTT TTCACCAGTGAGACGGGCAACAGCTGATTGCCCTTCACCGCCTGGCCCTGAGAGAGTTGCAGCAAGCGGTCCACGCTGGTTTGCCCCAGCAGGCGAAAATCCTGTTTGATGGTGGTTAACGGCGGGATATAACATGAGCTGTCTTCGGTATCGTCGTATCCCACTACCGAGATATCCGCACCAACGCGCAGCCCGGACTCGGTAATGGCGCGCATTGCGCCCAGCGCCATCT GATCGTTGGCAACCAGCATCGCAGTGGGAACGATGCCCTCATTCAGCATTTGCATGGTTTGTTGAAAACCGGACATGGCACTCCAGTCGCCTTCCCGTTCCGCTATCGGCTGAATTTGATTGCGAGTGAGATATTTATGCCAGCCAGCCAGACGCAGACGCGCCGAGACAGAACTTAATGGGCCCGCTAACAGCGCGATTTGCTGGTGACCCAATGCGACCAGATGCTCCACGCCCAGTC GCGTACCGTCTTCATGGGAGAAAATAATACTGTTGATGGGTGTCTGGTCAGAGACATCAAGAAATAACGCCGGAACATTAGTGTCAGGCAGCTTCCACAGCAATGGCATCCTGGTCATCCAGCGGATAGTTAATGATCAGCCCACTGACGCGTTGCGCGAGAAGATTGTGCACCGCCGCTTTACAGGCTTCGACGCCGCTTCGTTCTACCATCGACACCACCGCTGGCACCCAGTTGA TCGGCGCGAGATTTAATCGCCGCGACAATTTGCGACGGCGCGTGCAGGGCCAGACTGGAGGTGGCAACGCCAATCAGCAACGACTGTTTGCCCGCCAGTTGTTGTGCCACGCGGTTGGGAATGTAATTCAGCTCCGCCATCGCCGCTTCCACTTTTTCCCGCGTTTTCGCAGAAACGTGGCTGGCCTGGTTCACCACGCGGGAAACGGTCTGATAAGAGACACCGGCAT ACTCTGCGACATCGTATAACGTTACTGGTTTCACATTCACCACCCTGAATTGACTCTCTTCCGGGCGCTATCATGCCATACCGCGAAAGGTTTTGCGCCATTCGATGGTGTCCGGGATCTCGACGCTCTCCCTTATGCGACTCCTGCATTAGGAAGCAGCCCAGTAGTAGGTTGAGGCCGTTGAGCACCGCCCGCAAGGAATGGTGCATGCAAGGAGATGGCGCCCCAACAGTCCCCC GGCCACGGGGCCTGCCACCATACCCACGCCGAAACAAGCGCTCATGAGCCCGAAGTGGCGAGCCCGAATCTTCCCCATCGGTGATGTCGGCGATATAGGCGCCAGCAACCGCACCTGTGGCGCCGGTGATGCCGGCCACGATGCGTCCGGCGTAGAGGATCGAGATCTCGATCCCGAAATTAATACGACTCACTATAGGGGAATTGTGAGCGGATAACAATTCCCCTCAAGAA ATAATTTTGTTTAACTTTAAAGGAGATACATATGggatccatggagttcgttaacaaacagttcaactataaagacccagttaacggtgttgacattgcttacatcaaaatcccgaacgctggccagatgcagccggtaaaggcattcaaaatccacaacaaaatctgggttatcccggaacgtgataccttttactaacccggaagaaggtgacct gaacccgccaccggaagcgaaacaggtgccggtatcttactatgactccacctacctgtctaccgataacgaaaaggacaactacctgaaaggtgttactaaactgttcgagcgtatttactccaccgacctgggccgtatgctgctgactagcatcgttcgcggtatcccgttctggggcggttctaccatcgataccgaactgaaagtaat cgacactaactgcatcaacgtttattcagccggacggttcctatcgttccgaagaactgaacctggtgatcatcggcccgtctgctgatatcatccagttcgagtgtaagagctttggtcacgaagttctgaacctcacccgtaacggctacggttccactcagtacatccgtttctctccggacttcaccttcggttttgaagaatccctggaagtagacacgaac ccactgctgggcgctggtaaattcgcaactgatcctgcggttaccctggctcacgaactgattcatgcaggccaccgcctgtacggtatcgccatcaatccgaaccgtgtcttcaaagttaacaccaacgcgtattacgagatgtccggtctggaagttagcttcgaagaactgcgtacttttggcggtcacgacgctaaat tcatcgactctctgcaagaaaacgagttccgtctgtactactataacaagttcaaagatatcgcatccaccctgaacaaagcgaaatccatcgtgggtaccactgcttctctccagtacatgaagaacgtttttaaagaaaaatacctgctcagcgaagacacctccggcaaattctctgtagacaagttgaaattcgataaactttacaaaatg ctgactgaaatttacaccgaagacaacttcgttaagttctttaaagttctgaaccgcaaaacctatctgaacttcgacaaggcagtattcaaaatcaacatcgtgccgaaagttaactacactatctacgatggtttcaacctgcgtaacaccaacctggctgctaattttaacggccagaacacggaaatcaacaacatgaacttcacaaaactga aaaacttcactggtctgttcgagttttacaagctgctgtgcgtcgacggcatcattacctccaaaactaaatctctgatagaaggtagaaacaaagcgctgaacctgcagtgtatcaaggttaacaactgggatttattcttcagcccgagtgaagacaacttcaccaacgacctgaacaaaggtgaagaaatcacctcagatact aacatcgaagcagccgaagaaaacatctcgctggacctgatccagcagtactacctgacctttaatttcgacaacgagccggaaaacatttctatcgaaaacctgagctctgatatcatcggccagctggaactgatgccgaacatcgaacgtttcccaaacggtaaaaagtacgagctggacaaatataccatgttccactacctgcgg cgcaggaatttgaacacggcaaatcccgtatcgcactgactaactccgttaacgaagctgctcaacccgtcccgtgtatacaccttcttctctagcgactacgtgaaaaaggtcaacaaagcgactgaagctgcaatgttcttgggttgggttgaacagcttgtttatgattttaccgacgagacgtccgaagtatctactact accgaca aa caaaccatcgacaacgcgctgagcaaacgtaacgaaaaatgggatgaagtttacaaattatcgtgaccaactggctggctaaggttaatactcagatcgacctcatccgcaaaaaaatgaaagaagcactggaaaaccaggcggaagctaccaaggcaatcattaactaccagtacaaccagtacaccgaggaagaaaaaaacaacatca acttcaacatcgacgatctgtcctctaaactgaacgaatccatcaacaaagctatgatcaacatcaacaagttcctgaaccagtgctctgtaagctatctgatgaactccatgatcccgtacggtgttaaacgtctggaggacttcgatgcgtctctgaaagacgccctgctgaaatacatttacgacaaccgtggcactctgatc ggtcaggttgatcgtctgaaggacaaagtgaacaataccttatcgaccgacatcccttttcagctcagtaaatatgtcgataaccaacgccttttgtccactctagaaggcggTGGCGGTAGCGGTGGCGGTGGCAGCGGCGGTGGCGGTAGCGCACTAGacAACAGCGACCCTAAATGCCCACTgAGTCATGAAGGATACTGCCTTAATGATGGTGTT TGTATGTACATAGGAACATTGGACCGTTATGCTTGCAATTGTGTAGTGGGCTATGTCGGGGAAAGGTGTCAATATCGAGATCTCAAGCTGGCAGAGTTAAGAgggctagaagcaCACCATCATCACcaccatcaccatcaccattaatgaAAGCTTGCGGCCGCACTCGAGCACCACCACCACCACCACTGAGATCCGGCTGCTAACAAAGCCCGAAAGGAAGCTGAGTTGGCTGCT GCCACCGCTGAGCAATAACTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTTTGCTGAAAGGAGGAACTATATCCGGAT

SEQ ID NO: 6 - Полипептидная последовательность полипептида с EGF-лигандомSEQ ID NO: 6 - Polypeptide sequence of an EGF ligand polypeptide

MEFVNKQFNYKDPVNGVDIAYIKIPNAGQMQPVKAFKIHNKIWVIPERDTFTNPEEGDLNPPPEAKQVPVSYYDSTYLSTDNEKDNYLKGVTKLFERIYSTDLGRMLLTSIVRGIPFWGGSTIDTELKVIDTNCINVIQPDGSYRSEELNLVIIGPSADIIQFECKSFGHEVLNLTRNGYGSTQYIRFSPDFTFGFEESLEVDTNPLLGAGKFATDPAVTLAHELIHAGHRLYGIAINPNRVFKVNTNAYYEMSGLEVSFEELRTFGGHDAKFIDSLQENEFRLYYYNKFKDIASTLNKAKSIVGTTASLQYMKNVFKEKYLLSEDTSGKFSVDKLKFDKLYKMLTEIYTEDNFVKFFKVLNRKTYLNFDKAVFKINIVPKVNYTIYDGFNLRNTNLAANFNGQNTEINNMNFTKLKNFTGLFEFYKLLCVDGIITSKTKSLIEGRNKALNLQCIKVNNWDLFFSPSEDNFTNDLNKGEEITSDTNIEAAEENISLDLIQQYYLTFNFDNEPENISIENLSSDIIGQLELMPNIERFPNGKKYELDKYTMFHYLRAQEFEHGKSRIALTNSVNEALLNPSRVYTFFSSDYVKKVNKATEAAMFLGWVEQLVYDFTDETSEVSTTDKIADITIIIPYIGPALNIGNMLYKDDFVGALIFSGAVILLEFIPEIAIPVLGTFALVSYIANKVLTVQTIDNALSKRNEKWDEVYKYIVTNWLAKVNTQIDLIRKKMKEALENQAEATKAIINYQYNQYTEEEKNNINFNIDDLSSKLNESINKAMININKFLNQCSVSYLMNSMIPYGVKRLEDFDASLKDALLKYIYDNRGTLIGQVDRLKDKVNNTLSTDIPFQLSKYVDNQRLLSTLEGGGGSGGGGSGGGGSALDNSDPKCPLSHEGYCLNDGVCMYIGTLDRYACNCVVGYVGERCQYRDLKLAELRGLEAHHHHHHHHHHMEFVNKQFNYKDPVNGVDIAYIKIPNAGQMQPVKAFKIHNKIWVIPERDTFTNPEEGDLNPPPEAKQVPVSYYDSTYLSTDNEKDNYLKGVTKLFERIYSTDLGRMLLTSIVRGIPFWGGSTIDTELKVIDTNCINVIQPDGSYRSEELNLVIIGPSADIIQFECKSFGHEVLNLTRNGYGSTQYIRFSPDFTFGFEESLEV DTNPLLGAGKFATDPAVTLAHELIHAGHRLYGIAINPNRVFKVNTNAYYEMSGLEVSFEELRTFGGHDAKFIDSLQENEFRLYYYNKFKDIASTLNKAKSIVGTTASLQYMKNVFKEKYLLSEDTSGKFSVDKLKFDKLYKMLTEIYTEDNFVKFFKVLNRKTYLNFDKAVFKINIVPKVNYTIYDGFNLR NTNLAANFNGQNTEINNMNFTKLKNFTGLFEFYKLLCVDGIITSKTKSLIEGRNKALNLQCIKVNNWDLFFSPSEDNFTNDLNKGEEITSDTNIEAAEENISLDLIQQYYLTFNFDNEPENISIENLSSDIIGQLELMPNIERFPNGKKYELDKYTMFHYLRAQEFEHGKSRIALTNSVNEALLNPSRVYTFFSSDYVKKVNKATE AAMFLGWVEQLVYDFTDETSEVSTTDKIADITIIIPYIGPALNIGNMLYKDDFVGALIFSGAVILLEFIPEIAIPVLGTFALVSYIANKVLTVQTIDNALSKRNEKWDEVYKYIVTNWLAKVNTQIDLIRKKMKEALENQAEATKAIINYQYNQYTEEEKNNINFNIDDLSSKLNESINKAMININKFLNQCSVSYLMNSMIPYG VKRLEDFDASLKDALLKYIYDNRGTLIGQVDRLKDKVNNTLSTDIPFQLSKYVDNQRLLSTLEGGGGSGGGGSGGGGSALDNSDPKCPLSHEGYCLNDGVCMYIGTLDRYACNCVVGYVGERCQYRDLKLAELRGLEAHHHHHHHHHH

SEQ ID NO: 7 - Нуклеотидная последовательность полипептида с ноцицептин-лигандомSEQ ID NO: 7 - Nucleotide sequence of the nociceptin ligand polypeptide

TGGCGAATGGGACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTAGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGTCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGCTTACAATTTAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAATTAATTCTTAGAAAAACTCATCGAGCATCAAATGAAACTGCAATTTATTCATATCAGGATTATCAATACCATATTTTTGAAAAAGCCGTTTCTGTAATGAAGGAGAAAACTCACCGAGGCAGTTCCATAGGATGGCAAGATCCTGGTATCGGTCTGCGATTCCGACTCGTCCAACATCAATACAACCTATTAATTTCCCCTCGTCAAAAATAAGGTTATCAAGTGAGAAATCACCATGAGTGACGACTGAATCCGGTGAGAATGGCAAAAGTTTATGCATTTCTTTCCAGACTTGTTCAACAGGCCAGCCATTACGCTCGTCATCAAAATCACTCGCATCAACCAAACCGTTATTCATTCGTGATTGCGCCTGAGCGAGACGAAATACGCGATCGCTGTTAAAAGGACAATTACAAACAGGAATCGAATGCAACCGGCGCAGGAACACTGCCAGCGCATCAACAATATTTTCACCTGAATCAGGATATTCTTCTAATACCTGGAATGCTGTTTTCCCGGGGATCGCAGTGGTGAGTAACCATGCATCATCAGGAGTACGGATAAAATGCTTGATGGTCGGAAGAGGCATAAATTCCGTCAGCCAGTTTAGTCTGACCATCTCATCTGTAACATCATTGGCAACGCTACCTTTGCCATGTTTCAGAAACAACTCTGGCGCATCGGGCTTCCCATACAATCGATAGATTGTCGCACCTGATTGCCCGACATTATCGCGAGCCCATTTATACCCATATAAATCAGCATCCATGTTGGAATTTAATCGCGGCCTAGAGCAAGACGTTTCCCGTTGAATATGGCTCATAACACCCCTTGTATTACTGTTTATGTAAGCAGACAGTTTTATTGTTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATCGGCGATAATGGCCTGCTTCTCGCCGAAACGTTTGGTGGCGGGACCAGTGACGAAGGCTTGAGCGAGGGCGTGCAAGATTCCGAATACCGCAAGCGACAGGCCGATCATCGTCGCGCTCCAGCGAAAGCGGTCCTCGCCGAAAATGACCCAGAGCGCTGCCGGCACCTGTCCTACGAGTTGCATGATAAAGAAGACAGTCATAAGTGCGGCGACGATAGTCATGCCCCGCGCCCACCGGAAGGAGCTGACTGGGTTGAAGGCTCTCAAGGGCATCGGTCGAGATCCCGGTGCCTAATGAGTGAGCTAACTTACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCCAGGGTGGTTTTTCTTTTCACCAGTGAGACGGGCAACAGCTGATTGCCCTTCACCGCCTGGCCCTGAGAGAGTTGCAGCAAGCGGTCCACGCTGGTTTGCCCCAGCAGGCGAAAATCCTGTTTGATGGTGGTTAACGGCGGGATATAACATGAGCTGTCTTCGGTATCGTCGTATCCCACTACCGAGATATCCGCACCAACGCGCAGCCCGGACTCGGTAATGGCGCGCATTGCGCCCAGCGCCATCTGATCGTTGGCAACCAGCATCGCAGTGGGAACGATGCCCTCATTCAGCATTTGCATGGTTTGTTGAAAACCGGACATGGCACTCCAGTCGCCTTCCCGTTCCGCTATCGGCTGAATTTGATTGCGAGTGAGATATTTATGCCAGCCAGCCAGACGCAGACGCGCCGAGACAGAACTTAATGGGCCCGCTAACAGCGCGATTTGCTGGTGACCCAATGCGACCAGATGCTCCACGCCCAGTCGCGTACCGTCTTCATGGGAGAAAATAATACTGTTGATGGGTGTCTGGTCAGAGACATCAAGAAATAACGCCGGAACATTAGTGCAGGCAGCTTCCACAGCAATGGCATCCTGGTCATCCAGCGGATAGTTAATGATCAGCCCACTGACGCGTTGCGCGAGAAGATTGTGCACCGCCGCTTTACAGGCTTCGACGCCGCTTCGTTCTACCATCGACACCACCACGCTGGCACCCAGTTGATCGGCGCGAGATTTAATCGCCGCGACAATTTGCGACGGCGCGTGCAGGGCCAGACTGGAGGTGGCAACGCCAATCAGCAACGACTGTTTGCCCGCCAGTTGTTGTGCCACGCGGTTGGGAATGTAATTCAGCTCCGCCATCGCCGCTTCCACTTTTTCCCGCGTTTTCGCAGAAACGTGGCTGGCCTGGTTCACCACGCGGGAAACGGTCTGATAAGAGACACCGGCATACTCTGCGACATCGTATAACGTTACTGGTTTCACATTCACCACCCTGAATTGACTCTCTTCCGGGCGCTATCATGCCATACCGCGAAAGGTTTTGCGCCATTCGATGGTGTCCGGGATCTCGACGCTCTCCCTTATGCGACTCCTGCATTAGGAAGCAGCCCAGTAGTAGGTTGAGGCCGTTGAGCACCGCCGCCGCAAGGAATGGTGCATGCAAGGAGATGGCGCCCAACAGTCCCCCGGCCACGGGGCCTGCCACCATACCCACGCCGAAACAAGCGCTCATGAGCCCGAAGTGGCGAGCCCGATCTTCCCCATCGGTGATGTCGGCGATATAGGCGCCAGCAACCGCACCTGTGGCGCCGGTGATGCCGGCCACGATGCGTCCGGCGTAGAGGATCGAGATCTCGATCCCGCGAAATTAATACGACTCACTATAGGGGAATTGTGAGCGGATAACAATTCCCCTCAAGAAATAATTTTGTTTAACTTTAAGAAGGAGATATACATATGGGCAGCATGGAATTTGTGAACAAACAGTTCAACTATAAGGATCCGGTTAATGGTGTGGATATCGCCTATATCAAAATTCCGAATGCAGGTCAGATGCAGCCGGTTAAAGCCTTTAAAATCCATAACAAAATTTGGGTGATTCCGGAACGTGATACCTTTACCAATCCGGAAGAAGGTGATCTGAATCCGCCTCCGGAAGCAAAACAGGTTCCGGTTAGCTATTATGATAGCACCTATCTGAGCACCGATAACGAGAAAGATAACTATCTGAAAGGTGTGACCAAACTGTTTGAACGCATTTATAGTACCGATCTGGGTCGTATGCTGCTGACCAGCATTGTTCGTGGTATTCCGTTTTGGGGTGGTAGCACCATTGATACCGAACTGAAAGTTATTGACACCAACTGCATTAATGTGATTCAGCCGGATGGTAGCTATCGTAGCGAAGAACTGAATCTGGTTATTATTGGTCCGAGCGCAGATATCATTCAGTTTGAATGTAAATCCTTTGGCCACGAAGTTCTGAATCTGACCCGTAATGGTTATGGTAGTACCCAGTATATTCGTTTCAGTCCGGATTTTACCTTTGGCTTTGAAGAAAGCCTGGAAGTTGATACAAATCCGCTGTTAGGTGCAGGTAAATTTGCAACCGATCCGGCAGTTACCCTGGCACATGAACTGATTCATGCCGGTCATCGTCTGTATGGTATTGCAATTAATCCGAACCGTGTGTTCAAAGTGAATACCAACGCATATTATGAAATGAGCGGTCTGGAAGTGTCATTTGAAGAACTGCGTACCTTTGGTGGTCATGATGCCAAATTTATCGATAGCCTGCAAGAAAATGAATTTCGCCTGTACTACTATAACAAATTCAAGGATATTGCGAGCACCCTGAATAAAGCCAAAAGCATTGTTGGCACCACCGCAAGCCTGCAGTATATGAAAAATGTGTTTAAAGAAAAATATCTGCTGAGCGAAGATACCAGCGGTAAATTTAGCGTTGACAAACTGAAATTCGATAAACTGTACAAGATGCTGACCGAGATTTATACCGAAGATAACTTCGTGAAGTTTTTCAAAGTGCTGAACCGCAAAACCTACCTGAACTTTGATAAAGCCGTGTTCAAAATCAACATCGTGCCGAAAGTGAACTATACCATCTATGATGGTTTTAACCTGCGCAATACCAATCTGGCAGCAAACTTTAATGGTCAGAACACCGAAATCAACAACATGAACTTTACCAAACTGAAGAACTTCACCGGTCTGTTCGAATTTTACAAACTGCTGTGTGTGGATGGCATTATTACCAGCAAAACCAAATCCGATGATGACGATAAATTCGGTGGTTTTACCGGTGCACGTAAAAGCGCACGTAAACGTAAAAATCAGGCACTGGCAGGCGGTGGTGGTAGCGGTGGCGGTGGTTCAGGTGGTGGTGGCTCAGCACTGGTTCTGCAGTGTATTAAAGTTAATAACTGGGACCTGTTTTTTAGCCCGAGCGAGGATAATTTCACCAACGATCTGAACAAAGGCGAAGAAATTACCAGCGATACCAATATTGAAGCAGCCGAAGAAAACATTAGCCTGGATCTGATTCAGCAGTATTATCTGACCTTCAACTTCGATAATGAGCCGGAAAATATCAGCATTGAAAACCTGAGCAGCGATATTATTGGCCAGCTGGAACTGATGCCGAATATTGAACGTTTTCCGAACGGCAAAAAATACGAGCTGGATAAATACACCATGTTCCATTATCTGCGTGCCCAAGAATTTGAACATGGTAAAAGCCGTATTGCACTGACCAATAGCGTTAATGAAGCACTGCTGAACCCGAGCCGTGTTTATACCTTTTTTAGCAGCGATTACGTGAAAAAGGTTAACAAAGCAACCGAAGCAGCCATGTTTTTAGGTTGGGTTGAACAGCTGGTTTATGATTTCACCGATGAAACCAGCGAAGTTAGCACCACCGATAAAATTGCAGATATTACCATCATCATCCCGTATATCGGTCCGGCACTGAATATTGGCAATATGCTGTATAAAGACGATTTTGTGGGTGCCCTGATCTTTAGCGGTGCAGTTATTCTGCTGGAATTTATTCCGGAAATTGCCATTCCGGTTCTGGGCACCTTTGCACTGGTGAGCTATATTGCAAATAAAGTTCTGACCGTGCAGACCATCGATAATGCACTGAGCAAACGTAACGAAAAATGGGATGAAGTGTACAAGTATATCGTGACCAATTGGCTGGCAAAAGTTAACACCCAGATTGACCTGATTCGCAAGAAGATGAAAGAAGCACTGGAAAACCAGGCAGAAGCAACCAAAGCCATTATTAACTATCAGTACAACCAGTACACCGAAGAAGAGAAGAATAACATCAACTTCAACATCGATGATCTGAGCAGCAAGCTGAATGAAAGCATCAACAAAGCCATGATCAACATTAACAAATTTCTGAATCAGTGCAGCGTGAGCTATCTGATGAATAGCATGATTCCGTATGGTGTGAAACGTCTGGAAGATTTTGATGCAAGCCTGAAAGATGCCCTGCTGAAATATATCTATGATAATCGTGGCACCCTGATTGGTCAGGTTGATCGTCTGAAAGATAAAGTGAACAACACCCTGAGTACCGATATTCCTTTTCAGCTGAGCAAATATGTGGATAATCAGCGTCTGCTGAGTACCCTGGATCATCATCACCATCACCACTAAAAGCTTGCGGCCGCACTCGAGCACCACCACCACCACCACTGAGATCCGGCTGCTAACAAAGCCCGAAAGGAAGCTGAGTTGGCTGCTGCCACCGCTGAGCAATAACTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTTTGCTGAAAGGAGGAACTATATCCGGATTGGCGAATGGGACGCGCCCTGTAGCGGCCGCATTAAGCGCGGCGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTT GATTAGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGTCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTAACAAAATATTAACG CTTACAATTTAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAATTAATTCTTAGAAAAACTCATCGAGCATCAAATGAAACTGCAATTTATTCATATCAGGATTATCAATACCATATTTTTGAAAAAGCCGTTTCTGTAATGAAGGAGAAAACTCACCGAGGCAGTTCCATAGGATGGCAAGATCCTGGTATCGG TCTGCGATTCCGACTCGTCCAACATCAATACAACCTATTAATTTCCCCTCGTCAAAAATAAGGTTATCAAGTGAGAAATCACCATGAGTGACGACTGAATCCGGTGAGAATGGCAAAAGTTTATGCATTTCTTTCCAGACTTGTTCAACAGGCCAGCCATTACGCTCGTCATCAAAATCACTCGCATCAACCAAACCGTTATTCATTCGTGATTGCGCCTGAGCGAGACGAAATACGCGATCGC TGTTAAAAGGACAATTACAAACAGGAATCGAATGCAACCGGCGCAGGAACACTGCCAGCGCATCAACAATATTTTCACCTGAATCAGGATATTCTTCTAATACCTGGAATGCTGTTTTCCCGGGGATCGCAGTGGTGAGTAACCATGCATCATCAGGAGTACGGATAAAATGCTTGATGGTCGGAAGAGGCATAAATTCCGTCAGCCAGTTTAGTCTGACCATCTCATCTGTAACATCATTG GCAACGCTACCTTTGCCATGTTTCAGAAACAACTCTGGCGCATCGGGCTTCCCATACAATCGATAGATTGTCGCACCTGATTGCCCGACATTATCGCGAGCCCATTTATACCCATATAAATCAGCATCCATGTTGGAATTTAATCGCGGCCTAGAGCAAGACGTTTCCCGTTGAATATGGCTCATAACACCCCTTGTATTACTGTTTATGTAAGCAGACAAGTTTTATTGTTCATGACCAAAATCCC TTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACT TCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCT TCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTT TGCGTGGCCTTTTGCTCACATCGGCGATAATGGCCTGCTTCTCGCCGAAACGTTTGGTGGCGGGACCAGTGACGAAGGCTTGAGCGAGGCGTGCAAGATTCCGAATACCGCAAGCGACAGGCCGATCATCGTCGCGCTCCAGCGAAAGCGGTCCTCGCCGAAAATGACCCAGAGCGCTGCCGGCACCTGTCCTACGAGTTGCATGATAAAGAAGACAGTCATAAGTGCGGCGACG ATAGTCATGCCCCGCGCCCACCGGAAGGAGCTGACTGGTTGAAGGCTCTCAAGGGCATCGGTCGAGATCCCGGTGCCTAATGAGTGAGCTAACTTACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCCAGGGTGGTTTTTCTT TTCACCAGTGAGACGGGCAACAGCTGATTGCCCTTCACCGCCTGGCCCTGAGAGAGTTGCAGCAAGCGGTCCACGCTGGTTTGCCCCAGCAGGCGAAAATCCTGTTTGATGGTGGTTAACGGCGGGATATAACATGAGCTGTCTTCGGTATCGTCGTATCCCACTACCGAGATATCCGCACCAACGCGCAGCCCGGACTCGGTAATGGCGCGCATTGCGCCCAGCGCCATCT GATCGTTGGCAACCAGCATCGCAGTGGGAACGATGCCCTCATTCAGCATTTGCATGGTTTGTTGAAAACCGGACATGGCACTCCAGTCGCCTTCCCGTTCCGCTATCGGCTGAATTTGATTGCGAGTGAGATATTTATGCCAGCCAGCCAGACGCAGACGCGCCGAGACAGAACTTAATGGGCCCGCTAACAGCGCGATTTGCTGGTGACCCAATGCGACCAGATGCTCCACGCCCAGTC GCGTACCGTCTTCATGGGAGAAAATAATACTGTTGATGGGTGTCTGGTCAGAGACATCAAGAAATAACGCCGGAACATTAGTGTCAGGCAGCTTCCACAGCAATGGCATCCTGGTCATCCAGCGGATAGTTAATGATCAGCCCACTGACGCGTTGCGCGAGAAGATTGTGCACCGCCGCTTTACAGGCTTCGACGCCGCTTCGTTCTACCATCGACACCACCGCTGGCACCCAGTTGA TCGGCGCGAGATTTAATCGCCGCGACAATTTGCGACGGCGCGTGCAGGGCCAGACTGGAGGTGGCAACGCCAATCAGCAACGACTGTTTGCCCGCCAGTTGTTGTGCCACGCGGTTGGGAATGTAATTCAGCTCCGCCATCGCCGCTTCCACTTTTTCCCGCGTTTTCGCAGAAACGTGGCTGGCCTGGTTCACCACGCGGGAAACGGTCTGATAAGAGACACCGGCAT ACTCTGCGACATCGTATAACGTTACTGGTTTCACATTCACCACCCTGAATTGACTCTCTTCCGGGCGCTATCATGCCATACCGCGAAAGGTTTTGCGCCATTCGATGGTGTCCGGGATCTCGACGCTCTCCCTTATGCGACTCCTGCATTAGGAAGCAGCCCAGTAGTAGGTTGAGGCCGTTGAGCACCGCCCGCAAGGAATGGTGCATGCAAGGAGATGGCGCCCCAACAGTCCCCC GGCCACGGGGCCTGCCACCATACCCACGCCGAAACAAGCGCTCATGAGCCCGAAGTGGCGAGCCCGAATCTTCCCCATCGGTGATGTCGGCGATATAGGCGCCAGCAACCGCACCTGTGGCGCCGGTGATGCCGGCCACGATGCGTCCGGCGTAGAGGATCGAGATCTCGATCCCGAAATTAATACGACTCACTATAGGGGAATTGTGAGCGGATAACAATTCCCCTCAAGAA ATAATTTTGTTTAACTTTAAAGGAGATACATATGGGCAGCATGGAATTTGTGAACAAACAGTTCAACTATAAGGATCCGGTTAATGGTGTGGATATCGCCTATATCAAAATTCCGAATGCAGGTCAGATGCAGCCGTTAAAGCCTTTAAAATCCATAACAAAATTTGGGTGATTCCGGAACGTGATACCTTTACCAATCCGGAAGAAGGTGATCTGAATCCGCCTCCGGAAGCA AAACAGGTTCCGGTTAGCTATTATGATAGCACCTATCTGAGCACCGATAACGAGAAAGATAACTATCTGAAAGGTGTGACCAAACTGTTTGAACGCATTTATAGTACCGATCTGGGTCGTATGCTGCTGACCAGCATTGTTCGTGGTATTCCGTTTTGGGGTGGTAGCACCATTGATACCGAACTGAAAGTTATTGACACCAACTGCATTAATGTGATTCAGCCGGATGGTAG CTATCGTAGCGAAGAACTGAATCTGGTTATTATTGGTCCGAGCGCAGATATCATTCAGTTTGAATGTAAATCCTTTGGCCACGAAGTTCTGAATCTGACCCGTAATGGTTATGGTAGTACCCAGTATATTCGTTTCAGTCCGGATTTTACCTTTGGCTTTGAAGAAAGCCTGGAAGTTGATACAAATCCGCTGTTAGGTGCAGGTAAATTTGCAACCGATCCGGCAG TTACCCTGGCACATGAACTGATTCATGCCGGTCATCGTCTGTATGGTATTGCAATTAATCCGAACCGTGTGTTCAAAGTGAATACCAACGCATATTATGAAATGAGCGGTCTGGAAGTGTCATTTGAAGAACTGCGTACCTTTGGTGGTCATGATGCCAAATTTATCGATAGCCTGCAAGAAAATGAATTTCGCCTGTACTACTATAACAAATTCAAGGATATTGCGAGCACCCTGAATAAA GCCAAAAGCATTGTTGGCACCACCGCAAGCCTGCAGTATATGAAAAATGTGTTTAAAGAAAATATCTGCTGAGCGAAGATACCAGCGGTAAATTTAGCGTTGACAAACTGAAATTCGATAAACTGTACAAGATGCTGACCGAGATTTATACCGAAGATAACTTCGTGAAGTTTTTCAAAGTGCTGAACCGCAAAACCTACCTGAACTTTGATAAAGCCGTGTTCAAAATCAACATCGTGCCGAA AGTGAACTATACCATCTATGATGGTTTTAACCTGCGCAATACCAATCTGGCAGCAAACTTTAATGGTCAGAACACCGAAATCAACAACATGAACTTTACCAAACTGAAGAACTTCACCGGTCTGTTCGAATTTTACAAACTGCTGTGTGTGGATGGCATTATTACCAGCAAAACCAAATCCGATGATGACGATAAATTCGGTGGTTTTACCGGTGCACGTAAAAGCGCACGTAAACGTAAAAATC AGGCACTGGCAGGCGGTGGTGGTAGCGGTGGCGGTGGTTCAGGTGGTGGTGGCTCAGCACTGGTTCTGCAGTGTATTAAAGTTAATAACTGGGACCTGTTTTTTAGCCCGAGCGAGGATAATTTCACCAACGATCTGAACAAAGGCGAAGAAATTACCAGCGATACCAATATTGAAGCAGCCGAAGAAAACATTAGCCTGGATCTGATTCAGCAGTATTATCTGACCTT CAACTTCGATAATGAGCCGGAAAATATCAGCATTGAAAACCTGAGCAGCGATATTATTGGCCAGCTGGAACTGATGCCGAATATTGAACGTTTTCCGAACGGCAAAAAATACGAGCTGGATAAATACACCATGTTCCATTATCTGCGTGCCCAAGAATTTGAACATGGTAAAAGCCGTATTGCACTGACCAATAGCGTTAATGAAGCACTGCTGAACCCGAGCCGTGTTTATACCTTTTAGCA GCGATTACGTGAAAAAGGTTAACAAAGCAACCGAAGCAGCCATGTTTTTAGGTTGGGTTGAACAGCTGGTTTATGATTTCACCGATGAAACCAGCGAAGTTAGCACCACCGATAAAATTGCAGATATTACCATCATCATCCCGTATATCGGTCCGGCACTGAATATTGGCAATATGCTGTATAAAGACGATTTTGTGGGTGCCCTGAATCTTTAGCGGTGCAGTTATTCTGCTG GAATTTATTCCGGAAATTGCCATTCCGGTTCTGGCACCTTTGCACTGGTGAGCTATATTGCAAATAAAGTTCTGACCGTGCAGACCCATCGATAATGCACTGAGCAAACGTAACGAAAAATGGGATGAAGTGTACAAGTATATCGTGACCAATTGGCTGGCAAAAGTTAACACCCAGATTGACCTGATTCGCAAGAAGATGAAAGAAGCACTGGAAAACCAGGCAGAAGCAACCAAA GCCATTATTAACTATCAGTACAACCAGTACACCGAAGAAGAGAAGAATAACATCAACTTCAACATCGATGATCTGAGCAGCAAGCTGAATGAAAGCATCAACAAAGCCATGATCAACATTAACAAATTTCTGAATCAGTGCAGCGTGAGCTATCTGATGAATAGCATGATTCCGTATGGTGTGAAACGTCTGGAAGATTTTGATGCAAGCCTGAAAGATGCCCTGCTGAAATATATCTATGATA ATCGTGGCACCCTGATTGGTCAGGTTGATCGTCTGAAAGATAAAGTGAACAACACCCTGAGTACCGATATTCCCTTTTCAGCTGAGCAAATATGTGGATAATCAGCGTCTGCTGAGTACCCTGGATCATCATCACCATCACCACTAAAAGCTTGCGGCCGCACTCGAGCACCACCACCACCACCACTGAGATCCGGCTGCTAACAAAGCCCGAAAGGAAGCTGAGTTGGCTGCTGCCACC GCTGAGCAATAACTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTTTGCTGAAAGGAGGAACTATATCCGGAT

SEQ ID NO: 8 - Полипептидная последовательность полипептида с ноцицептин-лигандомSEQ ID NO: 8 - Polypeptide sequence of the nociceptin ligand polypeptide

MGSMEFVNKQFNYKDPVNGVDIAYIKIPNAGQMQPVKAFKIHNKIWVIPERDTFTNPEEGDLNPPPEAKQVPVSYYDSTYLSTDNEKDNYLKGVTKLFERIYSTDLGRMLLTSIVRGIPFWGGSTIDTELKVIDTNCINVIQPDGSYRSEELNLVIIGPSADIIQFECKSFGHEVLNLTRNGYGSTQYIRFSPDFTFGFEESLEVDTNPLLGAGKFATDPAVTLAHELIHAGHRLYGIAINPNRVFKVNTNAYYEMSGLEVSFEELRTFGGHDAKFIDSLQENEFRLYYYNKFKDIASTLNKAKSIVGTTASLQYMKNVFKEKYLLSEDTSGKFSVDKLKFDKLYKMLTEIYTEDNFVKFFKVLNRKTYLNFDKAVFKINIVPKVNYTIYDGFNLRNTNLAANFNGQNTEINNMNFTKLKNFTGLFEFYKLLCVDGIITSKTKSDDDDKFGGFTGARKSARKRKNQALAGGGGSGGGGSGGGGSALVLQCIKVNNWDLFFSPSEDNFTNDLNKGEEITSDTNIEAAEENISLDLIQQYYLTFNFDNEPENISIENLSSDIIGQLELMPNIERFPNGKKYELDKYTMFHYLRAQEFEHGKSRIALTNSVNEALLNPSRVYTFFSSDYVKKVNKATEAAMFLGWVEQLVYDFTDETSEVSTTDKIADITIIIPYIGPALNIGNMLYKDDFVGALIFSGAVILLEFIPEIAIPVLGTFALVSYIANKVLTVQTIDNALSKRNEKWDEVYKYIVTNWLAKVNTQIDLIRKKMKEALENQAEATKAIINYQYNQYTEEEKNNINFNIDDLSSKLNESINKAMININKFLNQCSVSYLMNSMIPYGVKRLEDFDASLKDALLKYIYDNRGTLIGQVDRLKDKVNNTLSTDIPFQLSKYVDNQRLLSTLDHHHHHHMGSMEFVNKQFNYKDPVNGVDIAYIKIPNAGQMQPVKAFKIHNKIWVIPERDTFTNPEEGDLNPPPEAKQVPVSYYDSTYLSTDNEKDNYLKGVTKLFERIYSTDLGRMLLTSIVRGIPFWGGSTIDTELKVIDTNCINVIQPDGSYRSEELNLVIIGPSADIIQFECKSFGHEVLNLTRNGYGSTQYIRFSPDFTFGFEE SLEVDTNPLLGAGKFATDPAVTLAHELIHAGHRLYGIAINPNRVFKVNTNAYYEMSGLEVSFEELRTFGGHDAKFIDSLQENEFRLYYYNKFKDIASTLNKAKSIVGTTASLQYMKNVFKEKYLLSEDTSGKFSVDKLKFDKLYKMLTEIYTEDNFVKFFKVLNRKTYLNFDKAVFKINIVPKVNYTIYDGF NLRNTNLAANFNGQNTEINNMNFTKLKNFTGLFEFYKLLCVDGIITSKTKSDDDDKFGGFTGARKSARKRKNQALAGGGGSGGGGSGGGGSALVLQCIKVNNWDLFFSPSEDNFTNDLNKGEEITSDTNIEAAEENISLDLIQQYYLTFNFDNEPENISIENLSSDIIGQLELMPNIERFPNGKKYELDKYTMFHYLRAQ EFEHGKSRIALTNSVNEALLNPSRVYTFFSSDYVKKVNKATEAAMFLGWVEQLVYDFTDETSEVSTTDKIADITIIIPYIGPALNIGNMLYKDDFVGALIFSGAVILLEFIPEIAIPVLGTFALVSYIANKVLTVQTIDNALSKRNEKWDEVYKYIVTNWLAKVNTQIDLIRKKMKEALENQAEATKAIINYQYNQYTEEEKNN INFNIDDLSSKLNESINKAMININKFLNQCSVSYLMNSMIPYGVKRLEDFDASLKDALLKYIYDNRGTLIGQVDRLKDKVNNTLSTDIPFQLSKYVDNQRLLSTLDHHHHHH

SEQ ID NO: 9 - Нуклеотидная последовательность GFP-меченного полипептида с EGF-лигандомSEQ ID NO: 9 - Nucleotide sequence of GFP-tagged polypeptide with EGF ligand

TGGCGAATGGGACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTAGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGTCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGCTTACAATTTAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAATTAATTCTTAGAAAAACTCATCGAGCATCAAATGAAACTGCAATTTATTCATATCAGGATTATCAATACCATATTTTTGAAAAAGCCGTTTCTGTAATGAAGGAGAAAACTCACCGAGGCAGTTCCATAGGATGGCAAGATCCTGGTATCGGTCTGCGATTCCGACTCGTCCAACATCAATACAACCTATTAATTTCCCCTCGTCAAAAATAAGGTTATCAAGTGAGAAATCACCATGAGTGACGACTGAATCCGGTGAGAATGGCAAAAGTTTATGCATTTCTTTCCAGACTTGTTCAACAGGCCAGCCATTACGCTCGTCATCAAAATCACTCGCATCAACCAAACCGTTATTCATTCGTGATTGCGCCTGAGCGAGACGAAATACGCGATCGCTGTTAAAAGGACAATTACAAACAGGAATCGAATGCAACCGGCGCAGGAACACTGCCAGCGCATCAACAATATTTTCACCTGAATCAGGATATTCTTCTAATACCTGGAATGCTGTTTTCCCGGGGATCGCAGTGGTGAGTAACCATGCATCATCAGGAGTACGGATAAAATGCTTGATGGTCGGAAGAGGCATAAATTCCGTCAGCCAGTTTAGTCTGACCATCTCATCTGTAACATCATTGGCAACGCTACCTTTGCCATGTTTCAGAAACAACTCTGGCGCATCGGGCTTCCCATACAATCGATAGATTGTCGCACCTGATTGCCCGACATTATCGCGAGCCCATTTATACCCATATAAATCAGCATCCATGTTGGAATTTAATCGCGGCCTAGAGCAAGACGTTTCCCGTTGAATATGGCTCATAACACCCCTTGTATTACTGTTTATGTAAGCAGACAGTTTTATTGTTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATCGGCGATAATGGCCTGCTTCTCGCCGAAACGTTTGGTGGCGGGACCAGTGACGAAGGCTTGAGCGAGGGCGTGCAAGATTCCGAATACCGCAAGCGACAGGCCGATCATCGTCGCGCTCCAGCGAAAGCGGTCCTCGCCGAAAATGACCCAGAGCGCTGCCGGCACCTGTCCTACGAGTTGCATGATAAAGAAGACAGTCATAAGTGCGGCGACGATAGTCATGCCCCGCGCCCACCGGAAGGAGCTGACTGGGTTGAAGGCTCTCAAGGGCATCGGTCGAGATCCCGGTGCCTAATGAGTGAGCTAACTTACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCCAGGGTGGTTTTTCTTTTCACCAGTGAGACGGGCAACAGCTGATTGCCCTTCACCGCCTGGCCCTGAGAGAGTTGCAGCAAGCGGTCCACGCTGGTTTGCCCCAGCAGGCGAAAATCCTGTTTGATGGTGGTTAACGGCGGGATATAACATGAGCTGTCTTCGGTATCGTCGTATCCCACTACCGAGATATCCGCACCAACGCGCAGCCCGGACTCGGTAATGGCGCGCATTGCGCCCAGCGCCATCTGATCGTTGGCAACCAGCATCGCAGTGGGAACGATGCCCTCATTCAGCATTTGCATGGTTTGTTGAAAACCGGACATGGCACTCCAGTCGCCTTCCCGTTCCGCTATCGGCTGAATTTGATTGCGAGTGAGATATTTATGCCAGCCAGCCAGACGCAGACGCGCCGAGACAGAACTTAATGGGCCCGCTAACAGCGCGATTTGCTGGTGACCCAATGCGACCAGATGCTCCACGCCCAGTCGCGTACCGTCTTCATGGGAGAAAATAATACTGTTGATGGGTGTCTGGTCAGAGACATCAAGAAATAACGCCGGAACATTAGTGCAGGCAGCTTCCACAGCAATGGCATCCTGGTCATCCAGCGGATAGTTAATGATCAGCCCACTGACGCGTTGCGCGAGAAGATTGTGCACCGCCGCTTTACAGGCTTCGACGCCGCTTCGTTCTACCATCGACACCACCACGCTGGCACCCAGTTGATCGGCGCGAGATTTAATCGCCGCGACAATTTGCGACGGCGCGTGCAGGGCCAGACTGGAGGTGGCAACGCCAATCAGCAACGACTGTTTGCCCGCCAGTTGTTGTGCCACGCGGTTGGGAATGTAATTCAGCTCCGCCATCGCCGCTTCCACTTTTTCCCGCGTTTTCGCAGAAACGTGGCTGGCCTGGTTCACCACGCGGGAAACGGTCTGATAAGAGACACCGGCATACTCTGCGACATCGTATAACGTTACTGGTTTCACATTCACCACCCTGAATTGACTCTCTTCCGGGCGCTATCATGCCATACCGCGAAAGGTTTTGCGCCATTCGATGGTGTCCGGGATCTCGACGCTCTCCCTTATGCGACTCCTGCATTAGGAAGCAGCCCAGTAGTAGGTTGAGGCCGTTGAGCACCGCCGCCGCAAGGAATGGTGCATGCAAGGAGATGGCGCCCAACAGTCCCCCGGCCACGGGGCCTGCCACCATACCCACGCCGAAACAAGCGCTCATGAGCCCGAAGTGGCGAGCCCGATCTTCCCCATCGGTGATGTCGGCGATATAGGCGCCAGCAACCGCACCTGTGGCGCCGGTGATGCCGGCCACGATGCGTCCGGCGTAGAGGATCGAGATCTCGATCCCGCGAAATTAATACGACTCACTATAGGGGAATTGTGAGCGGATAACAATTCCCCTCAAGAAATAATTTTGTTTAACTTTAAGAAGGAGATATACATATgATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCACGGCATGGACGAGCTGTACAAGGGCGGCAGCGGCGGCGGCAGCGGCGGCggatccatggagttcgttaacaaacagttcaactataaagacccagttaacggtgttgacattgcttacatcaaaatcccgaacgctggccagatgcagccggtaaaggcattcaaaatccacaacaaaatctgggttatcccggaacgtgatacctttactaacccggaagaaggtgacctgaacccgccaccggaagcgaaacaggtgccggtatcttactatgactccacctacctgtctaccgataacgaaaaggacaactacctgaaaggtgttactaaactgttcgagcgtatttactccaccgacctgggccgtatgctgctgactagcatcgttcgcggtatcccgttctggggcggttctaccatcgataccgaactgaaagtaatcgacactaactgcatcaacgttattcagccggacggttcctatcgttccgaagaactgaacctggtgatcatcggcccgtctgctgatatcatccagttcgagtgtaagagctttggtcacgaagttctgaacctcacccgtaacggctacggttccactcagtacatccgtttctctccggacttcaccttcggttttgaagaatccctggaagtagacacgaacccactgctgggcgctggtaaattcgcaactgatcctgcggttaccctggctcacgaactgattcatgcaggccaccgcctgtacggtatcgccatcaatccgaaccgtgtcttcaaagttaacaccaacgcgtattacgagatgtccggtctggaagttagcttcgaagaactgcgtacttttggcggtcacgacgctaaattcatcgactctctgcaagaaaacgagttccgtctgtactactataacaagttcaaagatatcgcatccaccctgaacaaagcgaaatccatcgtgggtaccactgcttctctccagtacatgaagaacgtttttaaagaaaaatacctgctcagcgaagacacctccggcaaattctctgtagacaagttgaaattcgataaactttacaaaatgctgactgaaatttacaccgaagacaacttcgttaagttctttaaagttctgaaccgcaaaacctatctgaacttcgacaaggcagtattcaaaatcaacatcgtgccgaaagttaactacactatctacgatggtttcaacctgcgtaacaccaacctggctgctaattttaacggccagaacacggaaatcaacaacatgaacttcacaaaactgaaaaacttcactggtctgttcgagttttacaagctgctgtgcgtcgacggcatcattacctccaaaactaaatctctgatagaaggtagaaacaaagcgctgaacctgcagtgtatcaaggttaacaactgggatttattcttcagcccgagtgaagacaacttcaccaacgacctgaacaaaggtgaagaaatcacctcagatactaacatcgaagcagccgaagaaaacatctcgctggacctgatccagcagtactacctgacctttaatttcgacaacgagccggaaaacatttctatcgaaaacctgagctctgatatcatcggccagctggaactgatgccgaacatcgaacgtttcccaaacggtaaaaagtacgagctggacaaatataccatgttccactacctgcgcgcgcaggaatttgaacacggcaaatcccgtatcgcactgactaactccgttaacgaagctctgctcaacccgtcccgtgtatacaccttcttctctagcgactacgtgaaaaaggtcaacaaagcgactgaagctgcaatgttcttgggttgggttgaacagcttgtttatgattttaccgacgagacgtccgaagtatctactaccgacaaaattgcggatatcactatcatcatcccgtacatcggtccggctctgaacattggcaacatgctgtacaaagacgacttcgttggcgcactgatcttctccggtgcggtgatcctgctggagttcatcccggaaatcgccatcccggtactgggcacctttgctctggtttcttacattgcaaacaaggttctgactgtacaaaccatcgacaacgcgctgagcaaacgtaacgaaaaatgggatgaagtttacaaatatatcgtgaccaactggctggctaaggttaatactcagatcgacctcatccgcaaaaaaatgaaagaagcactggaaaaccaggcggaagctaccaaggcaatcattaactaccagtacaaccagtacaccgaggaagaaaaaaacaacatcaacttcaacatcgacgatctgtcctctaaactgaacgaatccatcaacaaagctatgatcaacatcaacaagttcctgaaccagtgctctgtaagctatctgatgaactccatgatcccgtacggtgttaaacgtctggaggacttcgatgcgtctctgaaagacgccctgctgaaatacatttacgacaaccgtggcactctgatcggtcaggttgatcgtctgaaggacaaagtgaacaataccttatcgaccgacatcccttttcagctcagtaaatatgtcgataaccaacgccttttgtccactctagaaggcggTGGCGGTAGCGGTGGCGGTGGCAGCGGCGGTGGCGGTAGCGCACTAGacAACAGCGACCCTAAATGCCCACTaAGTCATGAAGGATACTGCCTTAATGATGGTGTTTGTATGTACATAGGAACATTGGACCGTTATGCTTGCAATTGTGTAGTGGGCTATGTCGGGGAAAGGTGTCAATATCGAGATCTCAAGCTGGCAGAGTTAAGAgggctagaagcaCACCATCATCACcaccatcaccatcaccattaatgaAAGCTTGCGGCCGCACTCGAGCACCACCACCACCACCACTGAGATCCGGCTGCTAACAAAGCCCGAAAGGAAGCTGAGTTGGCTGCTGCCACCGCTGAGCAATAACTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTTTGCTGAAAGGAGGAACTATATCCGGATTGGCGAATGGGACGCGCCCTGTAGCGGCCGCATTAAGCGCGGCGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTT GATTAGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGTCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTAACAAAATATTAACG CTTACAATTTAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAATTAATTCTTAGAAAAACTCATCGAGCATCAAATGAAACTGCAATTTATTCATATCAGGATTATCAATACCATATTTTTGAAAAAGCCGTTTCTGTAATGAAGGAGAAAACTCACCGAGGCAGTTCCATAGGATGGCAAGATCCTGGTATCGG TCTGCGATTCCGACTCGTCCAACATCAATACAACCTATTAATTTCCCCTCGTCAAAAATAAGGTTATCAAGTGAGAAATCACCATGAGTGACGACTGAATCCGGTGAGAATGGCAAAAGTTTATGCATTTCTTTCCAGACTTGTTCAACAGGCCAGCCATTACGCTCGTCATCAAAATCACTCGCATCAACCAAACCGTTATTCATTCGTGATTGCGCCTGAGCGAGACGAAATACGCGATCGC TGTTAAAAGGACAATTACAAACAGGAATCGAATGCAACCGGCGCAGGAACACTGCCAGCGCATCAACAATATTTTCACCTGAATCAGGATATTCTTCTAATACCTGGAATGCTGTTTTCCCGGGGATCGCAGTGGTGAGTAACCATGCATCATCAGGAGTACGGATAAAATGCTTGATGGTCGGAAGAGGCATAAATTCCGTCAGCCAGTTTAGTCTGACCATCTCATCTGTAACATCATTG GCAACGCTACCTTTGCCATGTTTCAGAAACAACTCTGGCGCATCGGGCTTCCCATACAATCGATAGATTGTCGCACCTGATTGCCCGACATTATCGCGAGCCCATTTATACCCATATAAATCAGCATCCATGTTGGAATTTAATCGCGGCCTAGAGCAAGACGTTTCCCGTTGAATATGGCTCATAACACCCCTTGTATTACTGTTTATGTAAGCAGACAAGTTTTATTGTTCATGACCAAAATCCC TTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACT TCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCT TCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTT TGCGTGGCCTTTTGCTCACATCGGCGATAATGGCCTGCTTCTCGCCGAAACGTTTGGTGGCGGGACCAGTGACGAAGGCTTGAGCGAGGCGTGCAAGATTCCGAATACCGCAAGCGACAGGCCGATCATCGTCGCGCTCCAGCGAAAGCGGTCCTCGCCGAAAATGACCCAGAGCGCTGCCGGCACCTGTCCTACGAGTTGCATGATAAAGAAGACAGTCATAAGTGCGGCGACG ATAGTCATGCCCCGCGCCCACCGGAAGGAGCTGACTGGTTGAAGGCTCTCAAGGGCATCGGTCGAGATCCCGGTGCCTAATGAGTGAGCTAACTTACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCCAGGGTGGTTTTTCTT TTCACCAGTGAGACGGGCAACAGCTGATTGCCCTTCACCGCCTGGCCCTGAGAGAGTTGCAGCAAGCGGTCCACGCTGGTTTGCCCCAGCAGGCGAAAATCCTGTTTGATGGTGGTTAACGGCGGGATATAACATGAGCTGTCTTCGGTATCGTCGTATCCCACTACCGAGATATCCGCACCAACGCGCAGCCCGGACTCGGTAATGGCGCGCATTGCGCCCAGCGCCATCT GATCGTTGGCAACCAGCATCGCAGTGGGAACGATGCCCTCATTCAGCATTTGCATGGTTTGTTGAAAACCGGACATGGCACTCCAGTCGCCTTCCCGTTCCGCTATCGGCTGAATTTGATTGCGAGTGAGATATTTATGCCAGCCAGCCAGACGCAGACGCGCCGAGACAGAACTTAATGGGCCCGCTAACAGCGCGATTTGCTGGTGACCCAATGCGACCAGATGCTCCACGCCCAGTC GCGTACCGTCTTCATGGGAGAAAATAATACTGTTGATGGGTGTCTGGTCAGAGACATCAAGAAATAACGCCGGAACATTAGTGTCAGGCAGCTTCCACAGCAATGGCATCCTGGTCATCCAGCGGATAGTTAATGATCAGCCCACTGACGCGTTGCGCGAGAAGATTGTGCACCGCCGCTTTACAGGCTTCGACGCCGCTTCGTTCTACCATCGACACCACCGCTGGCACCCAGTTGA TCGGCGCGAGATTTAATCGCCGCGACAATTTGCGACGGCGCGTGCAGGGCCAGACTGGAGGTGGCAACGCCAATCAGCAACGACTGTTTGCCCGCCAGTTGTTGTGCCACGCGGTTGGGAATGTAATTCAGCTCCGCCATCGCCGCTTCCACTTTTTCCCGCGTTTTCGCAGAAACGTGGCTGGCCTGGTTCACCACGCGGGAAACGGTCTGATAAGAGACACCGGCAT ACTCTGCGACATCGTATAACGTTACTGGTTTCACATTCACCACCCTGAATTGACTCTCTTCCGGGCGCTATCATGCCATACCGCGAAAGGTTTTGCGCCATTCGATGGTGTCCGGGATCTCGACGCTCTCCCTTATGCGACTCCTGCATTAGGAAGCAGCCCAGTAGTAGGTTGAGGCCGTTGAGCACCGCCCGCAAGGAATGGTGCATGCAAGGAGATGGCGCCCCAACAGTCCCCC GGCCACGGGGCCTGCCACCATACCCACGCCGAAACAAGCGCTCATGAGCCCGAAGTGGCGAGCCCGAATCTTCCCCATCGGTGATGTCGGCGATATAGGCGCCAGCAACCGCACCTGTGGCGCCGGTGATGCCGGCCACGATGCGTCCGGCGTAGAGGATCGAGATCTCGATCCCGAAATTAATACGACTCACTATAGGGGAATTGTGAGCGGATAACAATTCCCCTCAAGAA ATAATTTTGTTTAACTTTAAAGGAGATACATATgATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACC CTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTG GAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAG TTCGTGACCGCCGCCGGGATCACTCACGGCATGGACGAGCTGTACAAGGGCGGCAGCGGCGGCGCAGCGGCGGCggatccatggagttcgttaacaaacagttcaactataaagacccagttaacggtgttgacattgcttacatcaaaatcccgaacgctggccagatgcagccggtaaaggcattcaaaatccacaacaaaatctgggttatccc ggaacgtgatacctttactaacccggaagaaggtgacctgaacccgccaccggaagcgaaacaggtgccggtatcttactatgactccacctacctgtctaccgataacgaaaaggacaactacctgaaaggtgttactaaactgttcgagcgtatttactccaccgacctgggccgtatgctgctgactagcatcgttcgcggtatc ccgttctggggcggttctaccatcgataccgaactgaaagtaatcgacactaactgcatcaacgttattcagccggacggttcctatcgttccgaagaactgaacctggtgatcatcggcccgtctgctgattcatccagttcgagtgtaagagctttggtcacgaagttctgaacctcacccgtaacggctacggttccactcagtacatccgtttctctcc ggacttcaccttcggttttgaagaatccctggaagtagacacgaacccactgctgggcgctggtaaattcgcaactgatcctgcggttaccctggctcacgaactgattcatgcaggccaccgcctgtacggtatcgccatcaatccgaaccgtgtcttcaaagttaacaccaacgcgtattacgagatgtccggtctggaagttagcttc gaagaactgcgtacttttggcggtcacgacgctaaattcatcgactctctgcaagaaaacgagttccgtctgtactactataacaagttcaaagatatcgcatccaccctgaacaaagcgaaatccatcgtgggtaccactgcttctctccagtacatgaagaacgtttttaaagaaaaatacctgctcagcgaagacacctccggcaaattct ctgtagacaagttgaaattcgataaactttacaaaatgctgactgaaatttacaccgaagacaacttcgttaagttctttaaagttctgaaccgcaaaacctatctgaacttcgacaaggcagtattcaaaatcaacatcgtgccgaaagttaactacactatctacgatggtttcaacctgcgtaacaccaacctggctgctaattttaac ggccagaacacggaaatcaacaacatgaacttcacaaaactgaaaaacttcactggtctgttcgagttttacaagctgctgtgcgtcgacggcatcattacctccaaaactaaatctctgatagaaggtagaaacaaagcgctgaacctgcagtgtatcaaggttaacaactgggatttattcttcagcccgagtgaagacaacttca ccaacgacctgaacaaaggtgaagaaatcacctcagatactaacatcgaagcagccgaagaaaacatctcgctggacctgatccagcagtactacctgacctttaatttcgacaacgagccggaaaacatttctatcgaaaacctgagctctgatcatcggccagctggaactgatgccgaacatcgaacgtttcccaaacggtaaaaagt acgagctggacaaatataccatgttccactacctgcgcgcgcaggaatttgaacacggcaaatcccgtatcgcactgactaactccgttaacgaagctctgctcaacccgtcccgtgtatacaccttcttctctctagcgactacgtgaaaaaggtcaacaaagcgactgaagctgcaatgttcttgggttgggttgaacagctt gtttatgattttaccgacgagacgtccgaagtatctactaccgacaaaattgcggatatcactatcatcatcccgtacatcggtccggctctgaacattggcaacatgctgtacaaagacgacttcgttggcgcactgatcttctccggtgcggtgatcctgctggagttcatcccggaaatcgccatcccggtactgggcacctttt gctctggtttcttacattgcaaacaaggttctgactgtacaaaccatcgacaacgcgctgagcaaacgtaacgaaaaatgggatgaagtttacaaatatatcgtgaccaactggctggctaaggttaatactcagatcgacctcatccgcaaaaaaatgaaagaagcactggaaaaccaggcggaagctaccaaggcaatcattaactacca gtacaaccagtacaccgaggaagaaaaaaacaacatcaacttcaacatcgacgatctgtcctctaaactgaacgaatccatcaacaaagctatgatcaacatcaacaagttcctgaaccagtgctctgtaagctatctgatgaactccatgatcccgtacggtgttaaacgtctggaggacttcgatgcgtctctgaaagacg ccctgctgaaatacatttacgacaaccgtggcactctgatcggtcaggttgatcgtctgaaggacaaagtgaacaataccttatcgaccgacatcccttttcagctcagtaaatatgtcgataaccaacgccttttgtccactctagaaggcggTGGCGGTAGCGGTGGCGGTGGCAGCGGCGGTGGCGGTAGCGCACTAGacAACAGCGACCCT AAATGCCCACTaAGTCATGAAGGATACTGCCTTAATGATGGTGTTTGTATGTACATAGGAACATTGGACCGTTATGCTTGCAATTGTGTAGTGGGCTATGTCGGGGAAAGGTGTCAATATCGAGATCTCAAGCTGGCAGAGTTAAGAgggctagaagcaCACCATCATCACcaccatcaccatcaccattaatgaAAGCTTGCGGCCGCACTCGAGCACCACCACCACCACCACTGAGA TCCGGCCTGCTAACAAAGCCCGAAAGGAAGCTGAGTTGGCTGCTGCCACCGCTGAGCAATAACTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGTTTTTTGCTGAAAGGAGGAACTATATCCGGAT

SEQ ID NO: 10 - Полипептидная последовательность GFP-меченного полипептида с EGF-лигандомSEQ ID NO: 10 - Polypeptide sequence of GFP-tagged polypeptide with EGF ligand

MVSKGEELFTGVVPILVELDGDVNGHKFSVSGEGEGDATYGKLTLKFICTTGKLPVPWPTLVTTLTYGVQCFSRYPDHMKQHDFFKSAMPEGYVQERTIFFKDDGNYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNYNSHNVYIMADKQKNGIKVNFKIRHNIEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQSALSKDPNEKRDHMVLLEFVTAAGITHGMDELYKGGSGGGSGGGSMEFVNKQFNYKDPVNGVDIAYIKIPNAGQMQPVKAFKIHNKIWVIPERDTFTNPEEGDLNPPPEAKQVPVSYYDSTYLSTDNEKDNYLKGVTKLFERIYSTDLGRMLLTSIVRGIPFWGGSTIDTELKVIDTNCINVIQPDGSYRSEELNLVIIGPSADIIQFECKSFGHEVLNLTRNGYGSTQYIRFSPDFTFGFEESLEVDTNPLLGAGKFATDPAVTLAHELIHAGHRLYGIAINPNRVFKVNTNAYYEMSGLEVSFEELRTFGGHDAKFIDSLQENEFRLYYYNKFKDIASTLNKAKSIVGTTASLQYMKNVFKEKYLLSEDTSGKFSVDKLKFDKLYKMLTEIYTEDNFVKFFKVLNRKTYLNFDKAVFKINIVPKVNYTIYDGFNLRNTNLAANFNGQNTEINNMNFTKLKNFTGLFEFYKLLCVDGIITSKTKSLIEGRNKALNLQCIKVNNWDLFFSPSEDNFTNDLNKGEEITSDTNIEAAEENISLDLIQQYYLTFNFDNEPENISIENLSSDIIGQLELMPNIERFPNGKKYELDKYTMFHYLRAQEFEHGKSRIALTNSVNEALLNPSRVYTFFSSDYVKKVNKATEAAMFLGWVEQLVYDFTDETSEVSTTDKIADITIIIPYIGPALNIGNMLYKDDFVGALIFSGAVILLEFIPEIAIPVLGTFALVSYIANKVLTVQTIDNALSKRNEKWDEVYKYIVTNWLAKVNTQIDLIRKKMKEALENQAEATKAIINYQYNQYTEEEKNNINFNIDDLSSKLNESINKAMININKFLNQCSVSYLMNSMIPYGVKRLEDFDASLKDALLKYIYDNRGTLIGQVDRLKDKVNNTLSTDIPFQLSKYVDNQRLLSTLEGGGGSGGGGSGGGGSALDNSDPKCPLSHEGYCLNDGVCMYIGTLDRYACNCVVGYVGERCQYRDLKLAELRGLEAHHHHHHHHHHMVSKGEELFTGVVPILVELDGDVNGHKFSVSGEGEGDATYGKLTLKFICTTGKLPVPWPTLVTTLTYGVQCFSRYPDHMKQHDFFKSAMPEGYVQERTIFFKDDGNYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNYNSHNVYIMADKQKNGIKVNFKIRHNIEDGSVQLADHYQQNTPIGDGPV LLPDNHYLSTQSALSKDPNEKRDHMVLLEFVTAAGITHGMDELYKGGSGGGSGGGSMEFVNKQFNYKDPVNGVDIAYIKIPNAGQMQPVKAFKIHNKIWVIPERDTTFNPEEGDLNPPPEAKQVPVSYYDSTYLSTDNEKDNYLKGVTKLFERIYSTDLGRMLLTSIVRGIPFWGGSTIDTELKVIDTNCINVIQPDGSYRS EELNLVIIGPSADIIQFECKSFGHEVLNLTRNGYGSTQYIRFSPDFTFGFEESLEVDTNPLLGAGKFATDPAVTLAHELIHAGHRLYGIAINPNRVFKVNTNAYYEMSGLEVSFEELRTFGGHDAKFIDSLQENEFRLYYYNKFKDIASTLNKAKSIVGTTASLQYMKNVFKEKYLLSEDTSGKFSVDKLKFDKLYK MLTEIYTEDNFVKFFKVLNRKTYLNFDKAVFKINIVPKVNYTIYDGFNLRNTNLAANFNGQNTEINNMNFTKLKNFTGLFEFYKLLCVDGIITSKTKSLIEGRNKALNLQCIKVNNWDLFFSPSEDNFTNDLNKGEEITSDTNIEAAEENISLDLIQQYYLTFNFDNEPENISIENLSSDIIGQLELMPNIERFPNGKKYEL DKYTMFHYLRAQEFEHGKSRIALTNSVNEALLNPSRVYTFFSSDYVKKVNKATEAAMFLGWVEQLVYDFTDETSEVSTTDKIADITIIIPYIGPALNIGNMLYKDDFVGALIFSGAVILLEFIPEIAIPVLGTFALVSYIANKVLTVQTIDNALSKRNEKWDEVYKYIVTNWLAKVNTQIDLIRKKMKEALENQAEATKAIINYQ YNQYTEEEKNNINFNIDDLSSKLNESINKAMININKFLNQCSVSYLMNSMIPYGVKRLEDFDASLKDALLKYIYDNRGTLIGQVDRLKDKVNNTLSTDIPFQLSKYVDNQRLLSTLEGGGGSGGGGSGGGGSALDNSDPKCPLSHEGYCLNDGVCMYIGTLDRYACNCVVGYVGERCQYRDLKLAELRGLEAH HHHHHHHH

SEQ ID NO: 11 - Нуклеотидная последовательность SNAP-меченного полипептида с EGF-лигандомSEQ ID NO: 11 - Nucleotide sequence of SNAP-tagged polypeptide with EGF ligand

TGGCGAATGGGACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTAGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGTCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGCTTACAATTTAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAATTAATTCTTAGAAAAACTCATCGAGCATCAAATGAAACTGCAATTTATTCATATCAGGATTATCAATACCATATTTTTGAAAAAGCCGTTTCTGTAATGAAGGAGAAAACTCACCGAGGCAGTTCCATAGGATGGCAAGATCCTGGTATCGGTCTGCGATTCCGACTCGTCCAACATCAATACAACCTATTAATTTCCCCTCGTCAAAAATAAGGTTATCAAGTGAGAAATCACCATGAGTGACGACTGAATCCGGTGAGAATGGCAAAAGTTTATGCATTTCTTTCCAGACTTGTTCAACAGGCCAGCCATTACGCTCGTCATCAAAATCACTCGCATCAACCAAACCGTTATTCATTCGTGATTGCGCCTGAGCGAGACGAAATACGCGATCGCTGTTAAAAGGACAATTACAAACAGGAATCGAATGCAACCGGCGCAGGAACACTGCCAGCGCATCAACAATATTTTCACCTGAATCAGGATATTCTTCTAATACCTGGAATGCTGTTTTCCCGGGGATCGCAGTGGTGAGTAACCATGCATCATCAGGAGTACGGATAAAATGCTTGATGGTCGGAAGAGGCATAAATTCCGTCAGCCAGTTTAGTCTGACCATCTCATCTGTAACATCATTGGCAACGCTACCTTTGCCATGTTTCAGAAACAACTCTGGCGCATCGGGCTTCCCATACAATCGATAGATTGTCGCACCTGATTGCCCGACATTATCGCGAGCCCATTTATACCCATATAAATCAGCATCCATGTTGGAATTTAATCGCGGCCTAGAGCAAGACGTTTCCCGTTGAATATGGCTCATAACACCCCTTGTATTACTGTTTATGTAAGCAGACAGTTTTATTGTTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATCGGCGATAATGGCCTGCTTCTCGCCGAAACGTTTGGTGGCGGGACCAGTGACGAAGGCTTGAGCGAGGGCGTGCAAGATTCCGAATACCGCAAGCGACAGGCCGATCATCGTCGCGCTCCAGCGAAAGCGGTCCTCGCCGAAAATGACCCAGAGCGCTGCCGGCACCTGTCCTACGAGTTGCATGATAAAGAAGACAGTCATAAGTGCGGCGACGATAGTCATGCCCCGCGCCCACCGGAAGGAGCTGACTGGGTTGAAGGCTCTCAAGGGCATCGGTCGAGATCCCGGTGCCTAATGAGTGAGCTAACTTACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCCAGGGTGGTTTTTCTTTTCACCAGTGAGACGGGCAACAGCTGATTGCCCTTCACCGCCTGGCCCTGAGAGAGTTGCAGCAAGCGGTCCACGCTGGTTTGCCCCAGCAGGCGAAAATCCTGTTTGATGGTGGTTAACGGCGGGATATAACATGAGCTGTCTTCGGTATCGTCGTATCCCACTACCGAGATATCCGCACCAACGCGCAGCCCGGACTCGGTAATGGCGCGCATTGCGCCCAGCGCCATCTGATCGTTGGCAACCAGCATCGCAGTGGGAACGATGCCCTCATTCAGCATTTGCATGGTTTGTTGAAAACCGGACATGGCACTCCAGTCGCCTTCCCGTTCCGCTATCGGCTGAATTTGATTGCGAGTGAGATATTTATGCCAGCCAGCCAGACGCAGACGCGCCGAGACAGAACTTAATGGGCCCGCTAACAGCGCGATTTGCTGGTGACCCAATGCGACCAGATGCTCCACGCCCAGTCGCGTACCGTCTTCATGGGAGAAAATAATACTGTTGATGGGTGTCTGGTCAGAGACATCAAGAAATAACGCCGGAACATTAGTGCAGGCAGCTTCCACAGCAATGGCATCCTGGTCATCCAGCGGATAGTTAATGATCAGCCCACTGACGCGTTGCGCGAGAAGATTGTGCACCGCCGCTTTACAGGCTTCGACGCCGCTTCGTTCTACCATCGACACCACCACGCTGGCACCCAGTTGATCGGCGCGAGATTTAATCGCCGCGACAATTTGCGACGGCGCGTGCAGGGCCAGACTGGAGGTGGCAACGCCAATCAGCAACGACTGTTTGCCCGCCAGTTGTTGTGCCACGCGGTTGGGAATGTAATTCAGCTCCGCCATCGCCGCTTCCACTTTTTCCCGCGTTTTCGCAGAAACGTGGCTGGCCTGGTTCACCACGCGGGAAACGGTCTGATAAGAGACACCGGCATACTCTGCGACATCGTATAACGTTACTGGTTTCACATTCACCACCCTGAATTGACTCTCTTCCGGGCGCTATCATGCCATACCGCGAAAGGTTTTGCGCCATTCGATGGTGTCCGGGATCTCGACGCTCTCCCTTATGCGACTCCTGCATTAGGAAGCAGCCCAGTAGTAGGTTGAGGCCGTTGAGCACCGCCGCCGCAAGGAATGGTGCATGCAAGGAGATGGCGCCCAACAGTCCCCCGGCCACGGGGCCTGCCACCATACCCACGCCGAAACAAGCGCTCATGAGCCCGAAGTGGCGAGCCCGATCTTCCCCATCGGTGATGTCGGCGATATAGGCGCCAGCAACCGCACCTGTGGCGCCGGTGATGCCGGCCACGATGCGTCCGGCGTAGAGGATCGAGATCTCGATCCCGCGAAATTAATACGACTCACTATAGGGGAATTGTGAGCGGATAACAATTCCCCTCAAGAAATAATTTTGTTTAACTTTAAGAAGGAGATATACATATgATGGACAAAGACTGCGAAATGAAGCGCACCACCCTGGATAGCCCTCTGGGCAAGCTGGAACTGTCTGGGTGCGAACAGGGCCTGCACCGTATCATCTTCCTGGGCAAAGGAACATCTGCCGCCGACGCCGTGGAAGTGCCTGCCCCAGCCGCCGTGCTGGGCGGACCAGAGCCACTGATGCAGGCCACCGCCTGGCTCAACGCCTACTTTCACCAGCCTGAGGCCATCGAGGAGTTCCCTGTGCCAGCCCTGCACCACCCAGTGTTCCAGCAGGAGAGCTTTACCCGCCAGGTGCTGTGGAAACTGCTGAAAGTGGTGAAGTTCGGAGAGGTCATCAGCTACAGCCACCTGGCCGCCCTGGCCGGCAATCCCGCCGCCACCGCCGCCGTGAAAACCGCCCTGAGCGGAAATCCCGTGCCCATTCTGATCCCCTGCCACCGGGTGGTGCAGGGCGACCTGGACGTGGGGGGCTACGAGGGCGGGCTCGCCGTGAAAGAGTGGCTGCTGGCCCACGAGGGCCACAGACTGGGCAAGCCTGGGCTGGGTGGCGGCAGCGGCGGCGGCAGCGGCGGCggatccatggagttcgttaacaaacagttcaactataaagacccagttaacggtgttgacattgcttacatcaaaatcccgaacgctggccagatgcagccggtaaaggcattcaaaatccacaacaaaatctgggttatcccggaacgtgatacctttactaacccggaagaaggtgacctgaacccgccaccggaagcgaaacaggtgccggtatcttactatgactccacctacctgtctaccgataacgaaaaggacaactacctgaaaggtgttactaaactgttcgagcgtatttactccaccgacctgggccgtatgctgctgactagcatcgttcgcggtatcccgttctggggcggttctaccatcgataccgaactgaaagtaatcgacactaactgcatcaacgttattcagccggacggttcctatcgttccgaagaactgaacctggtgatcatcggcccgtctgctgatatcatccagttcgagtgtaagagctttggtcacgaagttctgaacctcacccgtaacggctacggttccactcagtacatccgtttctctccggacttcaccttcggttttgaagaatccctggaagtagacacgaacccactgctgggcgctggtaaattcgcaactgatcctgcggttaccctggctcacgaactgattcatgcaggccaccgcctgtacggtatcgccatcaatccgaaccgtgtcttcaaagttaacaccaacgcgtattacgagatgtccggtctggaagttagcttcgaagaactgcgtacttttggcggtcacgacgctaaattcatcgactctctgcaagaaaacgagttccgtctgtactactataacaagttcaaagatatcgcatccaccctgaacaaagcgaaatccatcgtgggtaccactgcttctctccagtacatgaagaacgtttttaaagaaaaatacctgctcagcgaagacacctccggcaaattctctgtagacaagttgaaattcgataaactttacaaaatgctgactgaaatttacaccgaagacaacttcgttaagttctttaaagttctgaaccgcaaaacctatctgaacttcgacaaggcagtattcaaaatcaacatcgtgccgaaagttaactacactatctacgatggtttcaacctgcgtaacaccaacctggctgctaattttaacggccagaacacggaaatcaacaacatgaacttcacaaaactgaaaaacttcactggtctgttcgagttttacaagctgctgtgcgtcgacggcatcattacctccaaaactaaatctctgatagaaggtagaaacaaagcgctgaacctgcagtgtatcaaggttaacaactgggatttattcttcagcccgagtgaagacaacttcaccaacgacctgaacaaaggtgaagaaatcacctcagatactaacatcgaagcagccgaagaaaacatctcgctggacctgatccagcagtactacctgacctttaatttcgacaacgagccggaaaacatttctatcgaaaacctgagctctgatatcatcggccagctggaactgatgccgaacatcgaacgtttcccaaacggtaaaaagtacgagctggacaaatataccatgttccactacctgcgcgcgcaggaatttgaacacggcaaatcccgtatcgcactgactaactccgttaacgaagctctgctcaacccgtcccgtgtatacaccttcttctctagcgactacgtgaaaaaggtcaacaaagcgactgaagctgcaatgttcttgggttgggttgaacagcttgtttatgattttaccgacgagacgtccgaagtatctactaccgacaaaattgcggatatcactatcatcatcccgtacatcggtccggctctgaacattggcaacatgctgtacaaagacgacttcgttggcgcactgatcttctccggtgcggtgatcctgctggagttcatcccggaaatcgccatcccggtactgggcacctttgctctggtttcttacattgcaaacaaggttctgactgtacaaaccatcgacaacgcgctgagcaaacgtaacgaaaaatgggatgaagtttacaaatatatcgtgaccaactggctggctaaggttaatactcagatcgacctcatccgcaaaaaaatgaaagaagcactggaaaaccaggcggaagctaccaaggcaatcattaactaccagtacaaccagtacaccgaggaagaaaaaaacaacatcaacttcaacatcgacgatctgtcctctaaactgaacgaatccatcaacaaagctatgatcaacatcaacaagttcctgaaccagtgctctgtaagctatctgatgaactccatgatcccgtacggtgttaaacgtctggaggacttcgatgcgtctctgaaagacgccctgctgaaatacatttacgacaaccgtggcactctgatcggtcaggttgatcgtctgaaggacaaagtgaacaataccttatcgaccgacatcccttttcagctcagtaaatatgtcgataaccaacgccttttgtccactctagaaggcggTGGCGGTAGCGGTGGCGGTGGCAGCGGCGGTGGCGGTAGCGCACTAGacAACAGCGACCCTAAATGCCCACTaAGTCATGAAGGATACTGCCTTAATGATGGTGTTTGTATGTACATAGGAACATTGGACCGTTATGCTTGCAATTGTGTAGTGGGCTATGTCGGGGAAAGGTGTCAATATCGAGATCTCAAGCTGGCAGAGTTAAGAgggctagaagcaCACCATCATCACcaccatcaccatcaccattaatgaAAGCTTGCGGCCGCACTCGAGCACCACCACCACCACCACTGAGATCCGGCTGCTAACAAAGCCCGAAAGGAAGCTGAGTTGGCTGCTGCCACCGCTGAGCAATAACTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTTTGCTGAAAGGAGGAACTATATCCGGATTGGCGAATGGGACGCGCCCTGTAGCGGCCGCATTAAGCGCGGCGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTT GATTAGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGTCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTAACAAAATATTAACG CTTACAATTTAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAATTAATTCTTAGAAAAACTCATCGAGCATCAAATGAAACTGCAATTTATTCATATCAGGATTATCAATACCATATTTTTGAAAAAGCCGTTTCTGTAATGAAGGAGAAAACTCACCGAGGCAGTTCCATAGGATGGCAAGATCCTGGTATCGG TCTGCGATTCCGACTCGTCCAACATCAATACAACCTATTAATTTCCCCTCGTCAAAAATAAGGTTATCAAGTGAGAAATCACCATGAGTGACGACTGAATCCGGTGAGAATGGCAAAAGTTTATGCATTTCTTTCCAGACTTGTTCAACAGGCCAGCCATTACGCTCGTCATCAAAATCACTCGCATCAACCAAACCGTTATTCATTCGTGATTGCGCCTGAGCGAGACGAAATACGCGATCGC TGTTAAAAGGACAATTACAAACAGGAATCGAATGCAACCGGCGCAGGAACACTGCCAGCGCATCAACAATATTTTCACCTGAATCAGGATATTCTTCTAATACCTGGAATGCTGTTTTCCCGGGGATCGCAGTGGTGAGTAACCATGCATCATCAGGAGTACGGATAAAATGCTTGATGGTCGGAAGAGGCATAAATTCCGTCAGCCAGTTTAGTCTGACCATCTCATCTGTAACATCATTG GCAACGCTACCTTTGCCATGTTTCAGAAACAACTCTGGCGCATCGGGCTTCCCATACAATCGATAGATTGTCGCACCTGATTGCCCGACATTATCGCGAGCCCATTTATACCCATATAAATCAGCATCCATGTTGGAATTTAATCGCGGCCTAGAGCAAGACGTTTCCCGTTGAATATGGCTCATAACACCCCTTGTATTACTGTTTATGTAAGCAGACAAGTTTTATTGTTCATGACCAAAATCCC TTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACT TCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCT TCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTT TGCGTGGCCTTTTGCTCACATCGGCGATAATGGCCTGCTTCTCGCCGAAACGTTTGGTGGCGGGACCAGTGACGAAGGCTTGAGCGAGGCGTGCAAGATTCCGAATACCGCAAGCGACAGGCCGATCATCGTCGCGCTCCAGCGAAAGCGGTCCTCGCCGAAAATGACCCAGAGCGCTGCCGGCACCTGTCCTACGAGTTGCATGATAAAGAAGACAGTCATAAGTGCGGCGACG ATAGTCATGCCCCGCGCCCACCGGAAGGAGCTGACTGGTTGAAGGCTCTCAAGGGCATCGGTCGAGATCCCGGTGCCTAATGAGTGAGCTAACTTACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCCAGGGTGGTTTTTCTT TTCACCAGTGAGACGGGCAACAGCTGATTGCCCTTCACCGCCTGGCCCTGAGAGAGTTGCAGCAAGCGGTCCACGCTGGTTTGCCCCAGCAGGCGAAAATCCTGTTTGATGGTGGTTAACGGCGGGATATAACATGAGCTGTCTTCGGTATCGTCGTATCCCACTACCGAGATATCCGCACCAACGCGCAGCCCGGACTCGGTAATGGCGCGCATTGCGCCCAGCGCCATCT GATCGTTGGCAACCAGCATCGCAGTGGGAACGATGCCCTCATTCAGCATTTGCATGGTTTGTTGAAAACCGGACATGGCACTCCAGTCGCCTTCCCGTTCCGCTATCGGCTGAATTTGATTGCGAGTGAGATATTTATGCCAGCCAGCCAGACGCAGACGCGCCGAGACAGAACTTAATGGGCCCGCTAACAGCGCGATTTGCTGGTGACCCAATGCGACCAGATGCTCCACGCCCAGTC GCGTACCGTCTTCATGGGAGAAAATAATACTGTTGATGGGTGTCTGGTCAGAGACATCAAGAAATAACGCCGGAACATTAGTGTCAGGCAGCTTCCACAGCAATGGCATCCTGGTCATCCAGCGGATAGTTAATGATCAGCCCACTGACGCGTTGCGCGAGAAGATTGTGCACCGCCGCTTTACAGGCTTCGACGCCGCTTCGTTCTACCATCGACACCACCGCTGGCACCCAGTTGA TCGGCGCGAGATTTAATCGCCGCGACAATTTGCGACGGCGCGTGCAGGGCCAGACTGGAGGTGGCAACGCCAATCAGCAACGACTGTTTGCCCGCCAGTTGTTGTGCCACGCGGTTGGGAATGTAATTCAGCTCCGCCATCGCCGCTTCCACTTTTTCCCGCGTTTTCGCAGAAACGTGGCTGGCCTGGTTCACCACGCGGGAAACGGTCTGATAAGAGACACCGGCAT ACTCTGCGACATCGTATAACGTTACTGGTTTCACATTCACCACCCTGAATTGACTCTCTTCCGGGCGCTATCATGCCATACCGCGAAAGGTTTTGCGCCATTCGATGGTGTCCGGGATCTCGACGCTCTCCCTTATGCGACTCCTGCATTAGGAAGCAGCCCAGTAGTAGGTTGAGGCCGTTGAGCACCGCCCGCAAGGAATGGTGCATGCAAGGAGATGGCGCCCCAACAGTCCCCC GGCCACGGGGCCTGCCACCATACCCACGCCGAAACAAGCGCTCATGAGCCCGAAGTGGCGAGCCCGAATCTTCCCCATCGGTGATGTCGGCGATATAGGCGCCAGCAACCGCACCTGTGGCGCCGGTGATGCCGGCCACGATGCGTCCGGCGTAGAGGATCGAGATCTCGATCCCGAAATTAATACGACTCACTATAGGGGAATTGTGAGCGGATAACAATTCCCCTCAAGAA ATAATTTTGTTTAACTTTAAAGGAGATACATATgATGGACAAAGACTGCGAAATGAAGCGCACCACTGGATAGCCCTCTGGGCAAGCTGGAACTGTCTGGGTGCGAACAGGGCCTGCACCGTATCATCTTCCTGGGCAAAGGAACATCTGCCGCCGACGCCGTGGAAGTGCCTGCCCCAGCCGCCGTGCTGGGCGGACCAGAGCCACTGATGCAGGCCACCGCCTGG CTCAACGCCTACTTTCACCAGCCTGAGGCCATCGAGGAGTTCCCTGTGCCAGCCCTGCACCACCCAGTGTTCCAGCAGGAGAGCTTTACCCGCCAGGTGCTGTGGAAACTGCTGAAAGTGGTGAAGTTCGGAGAGTCATCAGCTACAGCCACCTGGCCGCCCTGGCCGGCAATCCCGCCGCCACCGCCCGTGAAAACCGCCCTGAGCGGAAATCCCGTGCCCATTCTGATCCCC TGCCACCGGGTGGTGCAGGGCGACCTGGACGTGGGGGCTACGAGGGCGGGCTCGCCGTGAAAGAGTGGCTGCTGGCCCACGAGGGCACAGACTGGGCAAGCCTGGGCTGGGTGGCGGCAGCGGCGGCGGCAGCGGCGGCggatccatggagttcgttaacaaacagttcaactataaagacccagttaacggtgttgacattgcttacatca aaatcccgaacgctggccagatgcagccggtaaaggcattcaaaatccacaacaaaatctgggttatcccggaacgtgatacctttactaacccggaagaaggtgacctgaacccgccaccggaagcgaaacaggtgccggtatcttactatgactccacctacctgtctaccgataacgaaaaggacaactacctgaaaggtgttacta aactgttcgagcgtatttactccaccgacctgggccgtatgctgctgactagcatcgttcgcggtatcccgttctggggcggttaccatcgataccgaactgaaagtaatcgacactaactgcatcaacgttattcagccggacggttcctatcgttccgaagaactgaacctggtgatcatcggcccgtctgctgatatcatccagttcgag tgtaagagctttggtcacgaagttctgaacctcacccgtaacggctacggttccactcagtacatccgttctctccggacttcaccttcggttttgaagaatccctggaagtagacacgaacccactgctgggcgctggtaaattcgcaactgatcctgcggttaccctggctcacgaactgattcatgcaggccaccgcctgtacggtatcgccatcaat ccgaaccgtgtcttcaaagttaacaccaacgcgtattacgagatgtccggtctggaagttagcttcgaagaactgcgtacttttggcggtcacgacgctaaattcatcgactctctgcaagaaaacgagttccgtctgtactactactataacaagttcaaagatatcgcatccaccctgaacaaagcgaaatccatcgtgggtacc actgcttctctccagtacatgaagaacgtttttaaagaaaaatacctgctcagcgaagacacctccggcaaattctctgtagacaagttgaaattcgataaactttacaaaatgctgactgaaatttacaccgaagacaacttcgttaagttctttaaagttctgaaccgcaaaacctatctgaacttcgacaaggcagtattcaaaatcaacat cgtgccgaaagttaactacactatctacgatggtttcaacctgcgtaacaccaacctggctgctaattttaacggccagaacacggaaatcaacaacatgaacttcacaaaactgaaaaacttcactggtctgttcgagttttacaagctgctgtgcgtcgacggcatcattacctccaaaactaaatctctgatagaaggtagaaacaa agcgctgaacctgcagtgtatcaaggttaacaactgggatttattcttcagcccgagtgaagacaacttcaccaacgacctgaacaaaggtgaagaaatcacctcagatactaacatcgaagcagccgaagaaaacatctcgctggacctgatccagcagtactacctgacctttaatttcgacaacgagccggaaaacatttctatcgaaa acctgagctctgatatcatcggccagctggaactgatgccgaacatcgaacgtttcccaaacggtaaaaagtacgagctggacaaatataccatgttccactacctgcgcgcgcaggaatttgaacacggcaaatcccgtatcgcactgactaactccgttaacgaagctctgctcaacccgtcccgtgtatacaccttcttctctag cgactacgtgaaaaaggtcaacaaagcgactgaagctgcaatgttcttgggttgggttgaacagcttgtttatgattttaccgacgagacgtccgaagtatctactaccgacaaaattgcggatatcactatcatcatcccgtacatcggtccggctctgaacattggcaacagctgctgtacaaagacgacttcgttggcgcactga tcttctccggtgcggtgatcctgctggagttcatcccggaaatcgccatcccggtactgggcacctttgctctggtttcttacattgcaaacaaggttctgactgtacaaaccatcgacaacgcgctgagcaaacgtaacgaaaaatgggatgaagtttacaaattatcgtgaccaactggctggctaaggttaatactcagatc gacctcatccgcaaaaaaatgaaagaagcactggaaaaccaggcggaagctaccaaggcaatcattaactaccagtacaaccagtacaccgaggaagaaaaaaaacaacatcaacttcaacatcgacgatctgtcctctaaactgaacgaatccatcaacaaagctatgatcaacatcaacaagttcctgaaccagtgctctgtaagctatct gatgaactccatgatcccgtacggtgttaaacgtctggaggacttcgatgcgtctctgaaagacgccctgctgaaatacatttacgacaaccgtggcactctgatcggtcaggttgatcgtctgaaggacaaagtgaacaataccttatcgaccgacatcccttttcagctcagtaaatatgtcgataaccaacgccttttgtcc actctagaaggcggTGGCGGTAGCGGTGGCGGTGGCAGCGGCGGTGGCGGTAGCGCACTAGacAACAGCGACCCTAAATGCCCACTaAGTCATGAAGGATACTGCCTTAATGATGGTGTTTGTATGTACATAGGAACATTGGACCGTTATGCTTGCAATTGTGTAGTGGGCTATGTCGGGGAAAGGTGTCAATATCGAGATCTCAAGCTGGCAGTTAAGAgggct agaagcaCACCATCATCACcaccatcaccatcaccattaatgaAAGCTTGCGGCCGCACTCGAGCACCACCACCACCACCACTGAGATCCGGCTGCTAACAAAGCCCGAAAGGAAGCTGAGTTGGCTGCTGCCACCGCTGAGCAATAACTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTGCTGAAAGGAGGAACTATATCCGGAT

SEQ ID NO: 12 - Полипептидная последовательность SNAP-меченного полипептида с EGF-лигандомSEQ ID NO: 12 - Polypeptide sequence of SNAP-tagged polypeptide with EGF ligand

MDKDCEMKRTTLDSPLGKLELSGCEQGLHRIIFLGKGTSAADAVEVPAPAAVLGGPEPLMQATAWLNAYFHQPEAIEEFPVPALHHPVFQQESFTRQVLWKLLKVVKFGEVISYSHLAALAGNPAATAAVKTALSGNPVPILIPCHRVVQGDLDVGGYEGGLAVKEWLLAHEGHRLGKPGLGGGSGGGSGGGSMEFVNKQFNYKDPVNGVDIAYIKIPNAGQMQPVKAFKIHNKIWVIPERDTFTNPEEGDLNPPPEAKQVPVSYYDSTYLSTDNEKDNYLKGVTKLFERIYSTDLGRMLLTSIVRGIPFWGGSTIDTELKVIDTNCINVIQPDGSYRSEELNLVIIGPSADIIQFECKSFGHEVLNLTRNGYGSTQYIRFSPDFTFGFEESLEVDTNPLLGAGKFATDPAVTLAHELIHAGHRLYGIAINPNRVFKVNTNAYYEMSGLEVSFEELRTFGGHDAKFIDSLQENEFRLYYYNKFKDIASTLNKAKSIVGTTASLQYMKNVFKEKYLLSEDTSGKFSVDKLKFDKLYKMLTEIYTEDNFVKFFKVLNRKTYLNFDKAVFKINIVPKVNYTIYDGFNLRNTNLAANFNGQNTEINNMNFTKLKNFTGLFEFYKLLCVDGIITSKTKSLIEGRNKALNLQCIKVNNWDLFFSPSEDNFTNDLNKGEEITSDTNIEAAEENISLDLIQQYYLTFNFDNEPENISIENLSSDIIGQLELMPNIERFPNGKKYELDKYTMFHYLRAQEFEHGKSRIALTNSVNEALLNPSRVYTFFSSDYVKKVNKATEAAMFLGWVEQLVYDFTDETSEVSTTDKIADITIIIPYIGPALNIGNMLYKDDFVGALIFSGAVILLEFIPEIAIPVLGTFALVSYIANKVLTVQTIDNALSKRNEKWDEVYKYIVTNWLAKVNTQIDLIRKKMKEALENQAEATKAIINYQYNQYTEEEKNNINFNIDDLSSKLNESINKAMININKFLNQCSVSYLMNSMIPYGVKRLEDFDASLKDALLKYIYDNRGTLIGQVDRLKDKVNNTLSTDIPFQLSKYVDNQRLLSTLEGGGGSGGGGSGGGGSALDNSDPKCPLSHEGYCLNDGVCMYIGTLDRYACNCVVGYVGERCQYRDLKLAELRGLEAHHHHHHHHHHMDKDCEMKRTTLDSPLGKLELSGCEQGLHRIIFLGKGTSAADAVEVPAPAAVLGGPEPLMQATAWLNAYFHQPEAIEEFPVPALHHPVFQQESFTRQVLWKLLKVVKFGEVISYSHLAALAGNPAATAAVKTALSGNPVPILIPCHRVVQGDLDVGGYEGGLAVKEWLLAHEGHRLGKPGLGGGSGGGS GGGSMEFVNKQFNYKDPVNGVDIAYIKIPNAGQMQPVKAFKIHNKIWVIPERDTFTNPEEGDLNPPPEAKQVPVSYYDSTYLSTDNEKDNYLKGVTKLFERIYSTDLGRMLLTSIVRGIPFWGGSTIDTELKVIDTNCINVIQPDGSYRSEELNLVIIGPSADIIQFECKSFGHEVLNLTRNGYGSTQYIRFSPDFTFGFEE SLEVDTNPLLGAGKFATDPAVTLAHELIHAGHRLYGIAINPNRVFKVNTNAYYEMSGLEVSFEELRTFGGHDAKFIDSLQENEFRLYYYNKFKDIASTLNKAKSIVGTTASLQYMKNVFKEKYLLSEDTSGKFSVDKLKFDKLYKMLTEIYTEDNFVKFFKVLNRKTYLNFDKAVFKINIVPKVNYTIYDGF NLRNTNLAANFNGQNTEINNMNFTKLKNFTGLFEFYKLLCVDGIITSKTKSLIEGRNKALNLQCIKVNNWDLFFSPSEDNFTNDLNKGEEITSDTNIEAAEENISLDLIQQYYLTFNFDNEPENISIENLSSDIIGQLELMPNIERFPNGKKYELDKYTMFHYLRAQEFEHGKSRIALTNSVNEALLNPSRVYTFFSSDYVKKV NKATEAAMFLGWVEQLVYDFTDETSEVSTTDKIADITIIIPYIGPALNIGNMLYKDDFVGALIFSGAVILLEFIPEIAIPVLGTFALVSYIANKVLTVQTIDNALSKRNEKWDEVYKYIVTNWLAKVNTQIDLIRKKMKEALENQAEATKAIINYQYNQYTEEEKNNINFNIDDLSSKLNESINKAMININKFLNQCSVSYLMNSMIP YGVKRLEDFDASLKDALLKYIYDNRGTLIGQVDRLKDKVNNTLSTDIPFQLSKYVDNQRLLSTLEGGGGSGGGGSGGGGSALDNSDPKCPLSHEGYCLNDGVCMYIGTLDRYACNCVVGYVGERCQYRDLKLAELRGLEAHHHHHHHHHH

SEQ ID NO: 13 - Нуклеотидная последовательность сортазы A (нацеливание на LPESG)SEQ ID NO: 13 - Sortase A Nucleotide Sequence (LPESG Targeting)

TGGCGAATGGGACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTAGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGTCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGCTTACAATTTAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAATTAATTCTTAGAAAAACTCATCGAGCATCAAATGAAACTGCAATTTATTCATATCAGGATTATCAATACCATATTTTTGAAAAAGCCGTTTCTGTAATGAAGGAGAAAACTCACCGAGGCAGTTCCATAGGATGGCAAGATCCTGGTATCGGTCTGCGATTCCGACTCGTCCAACATCAATACAACCTATTAATTTCCCCTCGTCAAAAATAAGGTTATCAAGTGAGAAATCACCATGAGTGACGACTGAATCCGGTGAGAATGGCAAAAGTTTATGCATTTCTTTCCAGACTTGTTCAACAGGCCAGCCATTACGCTCGTCATCAAAATCACTCGCATCAACCAAACCGTTATTCATTCGTGATTGCGCCTGAGCGAGACGAAATACGCGATCGCTGTTAAAAGGACAATTACAAACAGGAATCGAATGCAACCGGCGCAGGAACACTGCCAGCGCATCAACAATATTTTCACCTGAATCAGGATATTCTTCTAATACCTGGAATGCTGTTTTCCCGGGGATCGCAGTGGTGAGTAACCATGCATCATCAGGAGTACGGATAAAATGCTTGATGGTCGGAAGAGGCATAAATTCCGTCAGCCAGTTTAGTCTGACCATCTCATCTGTAACATCATTGGCAACGCTACCTTTGCCATGTTTCAGAAACAACTCTGGCGCATCGGGCTTCCCATACAATCGATAGATTGTCGCACCTGATTGCCCGACATTATCGCGAGCCCATTTATACCCATATAAATCAGCATCCATGTTGGAATTTAATCGCGGCCTAGAGCAAGACGTTTCCCGTTGAATATGGCTCATAACACCCCTTGTATTACTGTTTATGTAAGCAGACAGTTTTATTGTTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATCGGCGATAATGGCCTGCTTCTCGCCGAAACGTTTGGTGGCGGGACCAGTGACGAAGGCTTGAGCGAGGGCGTGCAAGATTCCGAATACCGCAAGCGACAGGCCGATCATCGTCGCGCTCCAGCGAAAGCGGTCCTCGCCGAAAATGACCCAGAGCGCTGCCGGCACCTGTCCTACGAGTTGCATGATAAAGAAGACAGTCATAAGTGCGGCGACGATAGTCATGCCCCGCGCCCACCGGAAGGAGCTGACTGGGTTGAAGGCTCTCAAGGGCATCGGTCGAGATCCCGGTGCCTAATGAGTGAGCTAACTTACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCCAGGGTGGTTTTTCTTTTCACCAGTGAGACGGGCAACAGCTGATTGCCCTTCACCGCCTGGCCCTGAGAGAGTTGCAGCAAGCGGTCCACGCTGGTTTGCCCCAGCAGGCGAAAATCCTGTTTGATGGTGGTTAACGGCGGGATATAACATGAGCTGTCTTCGGTATCGTCGTATCCCACTACCGAGATATCCGCACCAACGCGCAGCCCGGACTCGGTAATGGCGCGCATTGCGCCCAGCGCCATCTGATCGTTGGCAACCAGCATCGCAGTGGGAACGATGCCCTCATTCAGCATTTGCATGGTTTGTTGAAAACCGGACATGGCACTCCAGTCGCCTTCCCGTTCCGCTATCGGCTGAATTTGATTGCGAGTGAGATATTTATGCCAGCCAGCCAGACGCAGACGCGCCGAGACAGAACTTAATGGGCCCGCTAACAGCGCGATTTGCTGGTGACCCAATGCGACCAGATGCTCCACGCCCAGTCGCGTACCGTCTTCATGGGAGAAAATAATACTGTTGATGGGTGTCTGGTCAGAGACATCAAGAAATAACGCCGGAACATTAGTGCAGGCAGCTTCCACAGCAATGGCATCCTGGTCATCCAGCGGATAGTTAATGATCAGCCCACTGACGCGTTGCGCGAGAAGATTGTGCACCGCCGCTTTACAGGCTTCGACGCCGCTTCGTTCTACCATCGACACCACCACGCTGGCACCCAGTTGATCGGCGCGAGATTTAATCGCCGCGACAATTTGCGACGGCGCGTGCAGGGCCAGACTGGAGGTGGCAACGCCAATCAGCAACGACTGTTTGCCCGCCAGTTGTTGTGCCACGCGGTTGGGAATGTAATTCAGCTCCGCCATCGCCGCTTCCACTTTTTCCCGCGTTTTCGCAGAAACGTGGCTGGCCTGGTTCACCACGCGGGAAACGGTCTGATAAGAGACACCGGCATACTCTGCGACATCGTATAACGTTACTGGTTTCACATTCACCACCCTGAATTGACTCTCTTCCGGGCGCTATCATGCCATACCGCGAAAGGTTTTGCGCCATTCGATGGTGTCCGGGATCTCGACGCTCTCCCTTATGCGACTCCTGCATTAGGAAGCAGCCCAGTAGTAGGTTGAGGCCGTTGAGCACCGCCGCCGCAAGGAATGGTGCATGCAAGGAGATGGCGCCCAACAGTCCCCCGGCCACGGGGCCTGCCACCATACCCACGCCGAAACAAGCGCTCATGAGCCCGAAGTGGCGAGCCCGATCTTCCCCATCGGTGATGTCGGCGATATAGGCGCCAGCAACCGCACCTGTGGCGCCGGTGATGCCGGCCACGATGCGTCCGGCGTAGAGGATCGAGATCTCGATCCCGCGAAATTAATACGACTCACTATAGGGGAATTGTGAGCGGATAACAATTCCCCTCAAGAAATAATTTTGTTTAACTTTAAGAAGGAGATATCATATGCAGGCAAAACCGCAGATTCCGAAAGATAAAAGCAAAGTGGCAGGCTATATTGAAATTCCGGATGCCGATATTAAAGAACCGGTTTATCCGGGTCCTGCAACACGTGAACAGCTGGATCGTGGTGTTTGTTTTGTTGAAGAAAATGAGAGCCTGGATGATCAGAACATTAGCATTACCGGTCATACCGCAATTGATCGTCCGAATTATCAGTTTACCAATCTGCGTGCAGCCAAACCGGGTAGCATGGTTTATCTGAAAGTTGGTAATGAAACCCGCATCTACAAAATGACCAGCATTCGTAATGTTAAACCGACCGCAGTTGGTGTTCTGGATGAACAAAAAGGTAAAGATAAACAGCTGACCCTGGTTACCTGTGATGATTATAACTTTGAAACCGGTGTTTGGGAAACGCGCAAAATCTTTGTTGCAACCGAAGTTAAACATCACCATCACCACCATCATCATCACCATTAAAAGCTTGCGGCCGCACTCGAGCACCACCACCACCACCACTGAGATCCGGCTGCTAACAAAGCCCGAAAGGAAGCTGAGTTGGCTGCTGCCACCGCTGAGCAATAACTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTTTGCTGAAAGGAGGAACTATATCCGGATTGGCGAATGGGACGCGCCCTGTAGCGGCCGCATTAAGCGCGGCGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTT GATTAGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGTCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTAACAAAATATTAACG CTTACAATTTAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAATTAATTCTTAGAAAAACTCATCGAGCATCAAATGAAACTGCAATTTATTCATATCAGGATTATCAATACCATATTTTTGAAAAAGCCGTTTCTGTAATGAAGGAGAAAACTCACCGAGGCAGTTCCATAGGATGGCAAGATCCTGGTATCGG TCTGCGATTCCGACTCGTCCAACATCAATACAACCTATTAATTTCCCCTCGTCAAAAATAAGGTTATCAAGTGAGAAATCACCATGAGTGACGACTGAATCCGGTGAGAATGGCAAAAGTTTATGCATTTCTTTCCAGACTTGTTCAACAGGCCAGCCATTACGCTCGTCATCAAAATCACTCGCATCAACCAAACCGTTATTCATTCGTGATTGCGCCTGAGCGAGACGAAATACGCGATCGC TGTTAAAAGGACAATTACAAACAGGAATCGAATGCAACCGGCGCAGGAACACTGCCAGCGCATCAACAATATTTTCACCTGAATCAGGATATTCTTCTAATACCTGGAATGCTGTTTTCCCGGGGATCGCAGTGGTGAGTAACCATGCATCATCAGGAGTACGGATAAAATGCTTGATGGTCGGAAGAGGCATAAATTCCGTCAGCCAGTTTAGTCTGACCATCTCATCTGTAACATCATTG GCAACGCTACCTTTGCCATGTTTCAGAAACAACTCTGGCGCATCGGGCTTCCCATACAATCGATAGATTGTCGCACCTGATTGCCCGACATTATCGCGAGCCCATTTATACCCATATAAATCAGCATCCATGTTGGAATTTAATCGCGGCCTAGAGCAAGACGTTTCCCGTTGAATATGGCTCATAACACCCCTTGTATTACTGTTTATGTAAGCAGACAAGTTTTATTGTTCATGACCAAAATCCC TTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACT TCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCT TCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTT TGCGTGGCCTTTTGCTCACATCGGCGATAATGGCCTGCTTCTCGCCGAAACGTTTGGTGGCGGGACCAGTGACGAAGGCTTGAGCGAGGCGTGCAAGATTCCGAATACCGCAAGCGACAGGCCGATCATCGTCGCGCTCCAGCGAAAGCGGTCCTCGCCGAAAATGACCCAGAGCGCTGCCGGCACCTGTCCTACGAGTTGCATGATAAAGAAGACAGTCATAAGTGCGGCGACG ATAGTCATGCCCCGCGCCCACCGGAAGGAGCTGACTGGTTGAAGGCTCTCAAGGGCATCGGTCGAGATCCCGGTGCCTAATGAGTGAGCTAACTTACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCCAGGGTGGTTTTTCTT TTCACCAGTGAGACGGGCAACAGCTGATTGCCCTTCACCGCCTGGCCCTGAGAGAGTTGCAGCAAGCGGTCCACGCTGGTTTGCCCCAGCAGGCGAAAATCCTGTTTGATGGTGGTTAACGGCGGGATATAACATGAGCTGTCTTCGGTATCGTCGTATCCCACTACCGAGATATCCGCACCAACGCGCAGCCCGGACTCGGTAATGGCGCGCATTGCGCCCAGCGCCATCT GATCGTTGGCAACCAGCATCGCAGTGGGAACGATGCCCTCATTCAGCATTTGCATGGTTTGTTGAAAACCGGACATGGCACTCCAGTCGCCTTCCCGTTCCGCTATCGGCTGAATTTGATTGCGAGTGAGATATTTATGCCAGCCAGCCAGACGCAGACGCGCCGAGACAGAACTTAATGGGCCCGCTAACAGCGCGATTTGCTGGTGACCCAATGCGACCAGATGCTCCACGCCCAGTC GCGTACCGTCTTCATGGGAGAAAATAATACTGTTGATGGGTGTCTGGTCAGAGACATCAAGAAATAACGCCGGAACATTAGTGTCAGGCAGCTTCCACAGCAATGGCATCCTGGTCATCCAGCGGATAGTTAATGATCAGCCCACTGACGCGTTGCGCGAGAAGATTGTGCACCGCCGCTTTACAGGCTTCGACGCCGCTTCGTTCTACCATCGACACCACCGCTGGCACCCAGTTGA TCGGCGCGAGATTTAATCGCCGCGACAATTTGCGACGGCGCGTGCAGGGCCAGACTGGAGGTGGCAACGCCAATCAGCAACGACTGTTTGCCCGCCAGTTGTTGTGCCACGCGGTTGGGAATGTAATTCAGCTCCGCCATCGCCGCTTCCACTTTTTCCCGCGTTTTCGCAGAAACGTGGCTGGCCTGGTTCACCACGCGGGAAACGGTCTGATAAGAGACACCGGCAT ACTCTGCGACATCGTATAACGTTACTGGTTTCACATTCACCACCCTGAATTGACTCTCTTCCGGGCGCTATCATGCCATACCGCGAAAGGTTTTGCGCCATTCGATGGTGTCCGGGATCTCGACGCTCTCCCTTATGCGACTCCTGCATTAGGAAGCAGCCCAGTAGTAGGTTGAGGCCGTTGAGCACCGCCCGCAAGGAATGGTGCATGCAAGGAGATGGCGCCCCAACAGTCCCCC GGCCACGGGGCCTGCCACCATACCCACGCCGAAACAAGCGCTCATGAGCCCGAAGTGGCGAGCCCGAATCTTCCCCATCGGTGATGTCGGCGATATAGGCGCCAGCAACCGCACCTGTGGCGCCGGTGATGCCGGCCACGATGCGTCCGGCGTAGAGGATCGAGATCTCGATCCCGAAATTAATACGACTCACTATAGGGGAATTGTGAGCGGATAACAATTCCCCTCAAGAA ATAATTTTGTTTAACTTTAAAGGAGATATCATATGCAGGCAAAACCGCAGATTCCGAAAGATAAAAGCAAAGTGGCAGGCTATATTGAAATTCCGGATGCCGATATTAAAGAACCGGTTTATCCGGGTCCTGCAACACGTGAACAGCTGGATCGTGGTGTTTGTTTTGTTGAAGAAAATGAGAGCCTGGATGATCAGAACATTAGCATTACCGGTCATACCGCAATTGATCGTCC GAATTATCAGTTTACCAATCTGCGTGCAGCCAAACCGGGTAGCATGGTTTATCTGAAAGTTGGTAATGAAACCCGCATCTACAAAATGACCAGCATTCGTAATGTTAAACCGACCGCAGTTGGTGTTCTGGATGAACAAAAAGGTAAAGATAAACAGCTGACCCTGGTTACCTGTGTGATGATTATAACTTTGAAACCGGTGTTTGGGAAACGCGCAAAATCTTTGTTGC AACCGAAGTTAAACATCACCATCACCACCATCATCACCATTAAAAGCTTGCGGCCGCACTCGAGCACCACCACCACCACCACTGAGATCCGGCTGCTAACAAAGCCCGAAAGGAAGCTGAGTTGGCTGCTGCCACCGCTGAGCAATAACTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGTTTTTTGCTGAAAGGAGGAACTATATCCGGAT

SEQ ID NO: 14 - Полипептидная последовательность сортазы A (нацеливание на LPESG)SEQ ID NO: 14 - Sortase A polypeptide sequence (LPESG targeting)

MQAKPQIPKDKSKVAGYIEIPDADIKEPVYPGPATREQLDRGVCFVEENESLDDQNISITGHTAIDRPNYQFTNLRAAKPGSMVYLKVGNETRIYKMTSIRNVKPTAVGVLDEQKGKDKQLTLVTCDDYNFETGVWETRKIFVATEVKHHHHHHHHHHMQAKPQIPKDKSKVAGYIEIPDADIKEPVYPGPATREQLDRGVCFVEENESLDDQNISITGHTAIDRPNYQFTNLRAAKPGSMVYLKVGNETRIYKMTSIRNVKPTAVGVLDEQKGKDKQLTLVTCDDYNFETGVWETKIFVATEVKHHHHHHHHH

SEQ ID NO: 15 - Нуклеотидная последовательность сортазы A (нацеливание на LAETG)SEQ ID NO: 15 - Sortase A Nucleotide Sequence (LAETG Targeting)

TGGCGAATGGGACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTAGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGTCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGCTTACAATTTAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAATTAATTCTTAGAAAAACTCATCGAGCATCAAATGAAACTGCAATTTATTCATATCAGGATTATCAATACCATATTTTTGAAAAAGCCGTTTCTGTAATGAAGGAGAAAACTCACCGAGGCAGTTCCATAGGATGGCAAGATCCTGGTATCGGTCTGCGATTCCGACTCGTCCAACATCAATACAACCTATTAATTTCCCCTCGTCAAAAATAAGGTTATCAAGTGAGAAATCACCATGAGTGACGACTGAATCCGGTGAGAATGGCAAAAGTTTATGCATTTCTTTCCAGACTTGTTCAACAGGCCAGCCATTACGCTCGTCATCAAAATCACTCGCATCAACCAAACCGTTATTCATTCGTGATTGCGCCTGAGCGAGACGAAATACGCGATCGCTGTTAAAAGGACAATTACAAACAGGAATCGAATGCAACCGGCGCAGGAACACTGCCAGCGCATCAACAATATTTTCACCTGAATCAGGATATTCTTCTAATACCTGGAATGCTGTTTTCCCGGGGATCGCAGTGGTGAGTAACCATGCATCATCAGGAGTACGGATAAAATGCTTGATGGTCGGAAGAGGCATAAATTCCGTCAGCCAGTTTAGTCTGACCATCTCATCTGTAACATCATTGGCAACGCTACCTTTGCCATGTTTCAGAAACAACTCTGGCGCATCGGGCTTCCCATACAATCGATAGATTGTCGCACCTGATTGCCCGACATTATCGCGAGCCCATTTATACCCATATAAATCAGCATCCATGTTGGAATTTAATCGCGGCCTAGAGCAAGACGTTTCCCGTTGAATATGGCTCATAACACCCCTTGTATTACTGTTTATGTAAGCAGACAGTTTTATTGTTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATCGGCGATAATGGCCTGCTTCTCGCCGAAACGTTTGGTGGCGGGACCAGTGACGAAGGCTTGAGCGAGGGCGTGCAAGATTCCGAATACCGCAAGCGACAGGCCGATCATCGTCGCGCTCCAGCGAAAGCGGTCCTCGCCGAAAATGACCCAGAGCGCTGCCGGCACCTGTCCTACGAGTTGCATGATAAAGAAGACAGTCATAAGTGCGGCGACGATAGTCATGCCCCGCGCCCACCGGAAGGAGCTGACTGGGTTGAAGGCTCTCAAGGGCATCGGTCGAGATCCCGGTGCCTAATGAGTGAGCTAACTTACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCCAGGGTGGTTTTTCTTTTCACCAGTGAGACGGGCAACAGCTGATTGCCCTTCACCGCCTGGCCCTGAGAGAGTTGCAGCAAGCGGTCCACGCTGGTTTGCCCCAGCAGGCGAAAATCCTGTTTGATGGTGGTTAACGGCGGGATATAACATGAGCTGTCTTCGGTATCGTCGTATCCCACTACCGAGATATCCGCACCAACGCGCAGCCCGGACTCGGTAATGGCGCGCATTGCGCCCAGCGCCATCTGATCGTTGGCAACCAGCATCGCAGTGGGAACGATGCCCTCATTCAGCATTTGCATGGTTTGTTGAAAACCGGACATGGCACTCCAGTCGCCTTCCCGTTCCGCTATCGGCTGAATTTGATTGCGAGTGAGATATTTATGCCAGCCAGCCAGACGCAGACGCGCCGAGACAGAACTTAATGGGCCCGCTAACAGCGCGATTTGCTGGTGACCCAATGCGACCAGATGCTCCACGCCCAGTCGCGTACCGTCTTCATGGGAGAAAATAATACTGTTGATGGGTGTCTGGTCAGAGACATCAAGAAATAACGCCGGAACATTAGTGCAGGCAGCTTCCACAGCAATGGCATCCTGGTCATCCAGCGGATAGTTAATGATCAGCCCACTGACGCGTTGCGCGAGAAGATTGTGCACCGCCGCTTTACAGGCTTCGACGCCGCTTCGTTCTACCATCGACACCACCACGCTGGCACCCAGTTGATCGGCGCGAGATTTAATCGCCGCGACAATTTGCGACGGCGCGTGCAGGGCCAGACTGGAGGTGGCAACGCCAATCAGCAACGACTGTTTGCCCGCCAGTTGTTGTGCCACGCGGTTGGGAATGTAATTCAGCTCCGCCATCGCCGCTTCCACTTTTTCCCGCGTTTTCGCAGAAACGTGGCTGGCCTGGTTCACCACGCGGGAAACGGTCTGATAAGAGACACCGGCATACTCTGCGACATCGTATAACGTTACTGGTTTCACATTCACCACCCTGAATTGACTCTCTTCCGGGCGCTATCATGCCATACCGCGAAAGGTTTTGCGCCATTCGATGGTGTCCGGGATCTCGACGCTCTCCCTTATGCGACTCCTGCATTAGGAAGCAGCCCAGTAGTAGGTTGAGGCCGTTGAGCACCGCCGCCGCAAGGAATGGTGCATGCAAGGAGATGGCGCCCAACAGTCCCCCGGCCACGGGGCCTGCCACCATACCCACGCCGAAACAAGCGCTCATGAGCCCGAAGTGGCGAGCCCGATCTTCCCCATCGGTGATGTCGGCGATATAGGCGCCAGCAACCGCACCTGTGGCGCCGGTGATGCCGGCCACGATGCGTCCGGCGTAGAGGATCGAGATCTCGATCCCGCGAAATTAATACGACTCACTATAGGGGAATTGTGAGCGGATAACAATTCCCCTCAAGAAATAATTTTGTTTAACTTTAAGAAGGAGATATACATATGCAGGCAAAACCGCAGATTCCGAAAGATAAAAGCAAAGTGGCAGGCTATATTGAAATTCCGGATGCCGATATTAAAGAACCGGTTTATCCGGGTCCTGCAACACGTGAACAGCTGAATCGTGGTGTTTGTTTTCACGATGAAAATGAGAGCCTGGATGATCAGAATATTAGCATTGCAGGCCATACCTTTATTGATCGTCCGAATTATCAGTTCACCAATCTGAAAGCAGCAAAACCGGGTAGCATGGTTTATTTCAAAGTTGGTAATGAAACCCGCATCTACAAAATGACCAGCATTCGTAAAGTTCATCCGAATGCAGTTGGTGTTCTGGATGAACAAGAAGGCAAAGATAAACAGCTGACCCTGGTTACCTGTGATGATTATAACGAAGAAACCGGTGTTTGGGAAAGCCGTAAAATCTTTGTTGCAACCGAAGTGAAACATCATCACCACCATCACCATCATCATCACTAAAAGCTTGCGGCCGCACTCGAGCACCACCACCACCACCACTGAGATCCGGCTGCTAACAAAGCCCGAAAGGAAGCTGAGTTGGCTGCTGCCACCGCTGAGCAATAACTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTTTGCTGAAAGGAGGAACTATATCCGGATTGGCGAATGGGACGCGCCCTGTAGCGGCCGCATTAAGCGCGGCGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTT GATTAGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGTCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTAACAAAATATTAACG CTTACAATTTAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAATTAATTCTTAGAAAAACTCATCGAGCATCAAATGAAACTGCAATTTATTCATATCAGGATTATCAATACCATATTTTTGAAAAAGCCGTTTCTGTAATGAAGGAGAAAACTCACCGAGGCAGTTCCATAGGATGGCAAGATCCTGGTATCGG TCTGCGATTCCGACTCGTCCAACATCAATACAACCTATTAATTTCCCCTCGTCAAAAATAAGGTTATCAAGTGAGAAATCACCATGAGTGACGACTGAATCCGGTGAGAATGGCAAAAGTTTATGCATTTCTTTCCAGACTTGTTCAACAGGCCAGCCATTACGCTCGTCATCAAAATCACTCGCATCAACCAAACCGTTATTCATTCGTGATTGCGCCTGAGCGAGACGAAATACGCGATCGC TGTTAAAAGGACAATTACAAACAGGAATCGAATGCAACCGGCGCAGGAACACTGCCAGCGCATCAACAATATTTTCACCTGAATCAGGATATTCTTCTAATACCTGGAATGCTGTTTTCCCGGGGATCGCAGTGGTGAGTAACCATGCATCATCAGGAGTACGGATAAAATGCTTGATGGTCGGAAGAGGCATAAATTCCGTCAGCCAGTTTAGTCTGACCATCTCATCTGTAACATCATTG GCAACGCTACCTTTGCCATGTTTCAGAAACAACTCTGGCGCATCGGGCTTCCCATACAATCGATAGATTGTCGCACCTGATTGCCCGACATTATCGCGAGCCCATTTATACCCATATAAATCAGCATCCATGTTGGAATTTAATCGCGGCCTAGAGCAAGACGTTTCCCGTTGAATATGGCTCATAACACCCCTTGTATTACTGTTTATGTAAGCAGACAAGTTTTATTGTTCATGACCAAAATCCC TTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACT TCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCT TCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTT TGCGTGGCCTTTTGCTCACATCGGCGATAATGGCCTGCTTCTCGCCGAAACGTTTGGTGGCGGGACCAGTGACGAAGGCTTGAGCGAGGCGTGCAAGATTCCGAATACCGCAAGCGACAGGCCGATCATCGTCGCGCTCCAGCGAAAGCGGTCCTCGCCGAAAATGACCCAGAGCGCTGCCGGCACCTGTCCTACGAGTTGCATGATAAAGAAGACAGTCATAAGTGCGGCGACG ATAGTCATGCCCCGCGCCCACCGGAAGGAGCTGACTGGTTGAAGGCTCTCAAGGGCATCGGTCGAGATCCCGGTGCCTAATGAGTGAGCTAACTTACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCCAGGGTGGTTTTTCTT TTCACCAGTGAGACGGGCAACAGCTGATTGCCCTTCACCGCCTGGCCCTGAGAGAGTTGCAGCAAGCGGTCCACGCTGGTTTGCCCCAGCAGGCGAAAATCCTGTTTGATGGTGGTTAACGGCGGGATATAACATGAGCTGTCTTCGGTATCGTCGTATCCCACTACCGAGATATCCGCACCAACGCGCAGCCCGGACTCGGTAATGGCGCGCATTGCGCCCAGCGCCATCT GATCGTTGGCAACCAGCATCGCAGTGGGAACGATGCCCTCATTCAGCATTTGCATGGTTTGTTGAAAACCGGACATGGCACTCCAGTCGCCTTCCCGTTCCGCTATCGGCTGAATTTGATTGCGAGTGAGATATTTATGCCAGCCAGCCAGACGCAGACGCGCCGAGACAGAACTTAATGGGCCCGCTAACAGCGCGATTTGCTGGTGACCCAATGCGACCAGATGCTCCACGCCCAGTC GCGTACCGTCTTCATGGGAGAAAATAATACTGTTGATGGGTGTCTGGTCAGAGACATCAAGAAATAACGCCGGAACATTAGTGTCAGGCAGCTTCCACAGCAATGGCATCCTGGTCATCCAGCGGATAGTTAATGATCAGCCCACTGACGCGTTGCGCGAGAAGATTGTGCACCGCCGCTTTACAGGCTTCGACGCCGCTTCGTTCTACCATCGACACCACCGCTGGCACCCAGTTGA TCGGCGCGAGATTTAATCGCCGCGACAATTTGCGACGGCGCGTGCAGGGCCAGACTGGAGGTGGCAACGCCAATCAGCAACGACTGTTTGCCCGCCAGTTGTTGTGCCACGCGGTTGGGAATGTAATTCAGCTCCGCCATCGCCGCTTCCACTTTTTCCCGCGTTTTCGCAGAAACGTGGCTGGCCTGGTTCACCACGCGGGAAACGGTCTGATAAGAGACACCGGCAT ACTCTGCGACATCGTATAACGTTACTGGTTTCACATTCACCACCCTGAATTGACTCTCTTCCGGGCGCTATCATGCCATACCGCGAAAGGTTTTGCGCCATTCGATGGTGTCCGGGATCTCGACGCTCTCCCTTATGCGACTCCTGCATTAGGAAGCAGCCCAGTAGTAGGTTGAGGCCGTTGAGCACCGCCCGCAAGGAATGGTGCATGCAAGGAGATGGCGCCCCAACAGTCCCCC GGCCACGGGGCCTGCCACCATACCCACGCCGAAACAAGCGCTCATGAGCCCGAAGTGGCGAGCCCGAATCTTCCCCATCGGTGATGTCGGCGATATAGGCGCCAGCAACCGCACCTGTGGCGCCGGTGATGCCGGCCACGATGCGTCCGGCGTAGAGGATCGAGATCTCGATCCCGAAATTAATACGACTCACTATAGGGGAATTGTGAGCGGATAACAATTCCCCTCAAGAA ATAATTTTGTTTAACTTTAAAGGAGATACATATGCAGGCAAAACCGCAGATTCCGAAAGATAAAAGCAAAGTGGCAGGCTATATTGAAATTCCGGATGCCGATATTAAAGAACCGGTTTATCCGGGTCCTGCAACACGTGAACAGCTGAATCGTGGTGTTTGTTTTCACGATGAAAATGAGAGCCTGGATGATCAGAATATTAGCATTGCAGGCCATACCTTTATTGATCGTCCGAAT TATCAGTTCACCAATCTGAAAGCAGCAAAACCGGGTAGCATGGTTTATTTCAAAGTTGGTAATGAAACCCGCATTCTACAAAATGACCAGCATTCGTAAAGTTCATCCGAATGCAGTTGGTGTTCTGGATGAACAAGAAGGCAAAGATAAACAGCTGACCCTGGTTACCTGTGATGATTATAACGAAGAAACCGGTGTTTGGGAAAGCCGTAAAATCTTTGTTGCAACCGAAG TGAAACATCATCACCACCATCACCATCATCATCACTAAAAGCTTGCGGCCGCACTCGAGCACCACCACCACCACCACTGAGATCCGGCTGCTAACAAAGCCCGAAAGGAAGCTGAGTTGGCTGCTGCCACCGCTGAGCAATAACTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTTTGCTGAAAGGAGGAACTATATCCGGAT

SEQ ID NO: 16 - Полипептидная последовательность сортазы A (нацеливание на LAETG)SEQ ID NO: 16 - Sortase A polypeptide sequence (LAETG targeting)

MQAKPQIPKDKSKVAGYIEIPDADIKEPVYPGPATREQLNRGVCFHDENESLDDQNISIAGHTFIDRPNYQFTNLKAAKPGSMVYFKVGNETRIYKMTSIRKVHPNAVGVLDEQEGKDKQLTLVTCDDYNEETGVWESRKIFVATEVKHHHHHHHHHHMQAKPQIPKDKSKVAGYIEIPDADIKEPVYPGPATREQLNRGVCFHDENESLDDQNISIAGHTFIDRPNYQFTNLKAAKPGSMVYFKVGNETRIYKMTSIRKVHPNAVGVLDEQEGKDKQLTLVTCDDYNEETGVWESRKIFVATEVKHHHHHHHHH

SEQ ID NO: 17 - BoNT/A - UniProt P10845SEQ ID NO: 17 - BoNT/A - UniProt P10845

MPFVNKQFNYKDPVNGVDIAYIKIPNVGQMQPVKAFKIHNKIWVIPERDTFTNPEEGDLNMPFVNKQFNYKDPVNGVDIAYIKIPNVGQMQPVKAFKIHNKIWVIPERDTTFTNPEEGDLN

PPPEAKQVPVSYYDSTYLSTDNEKDNYLKGVTKLFERIYSTDLGRMLLTSIVRGIPFWGGPPPEAKQVPVSYYDSTYLSTDNEKDNYLKGVTKLFERIYSTDLGRMLLTSIVRGIPFWGG

STIDTELKVIDTNCINVIQPDGSYRSEELNLVIIGPSADIIQFECKSFGHEVLNLTRNGYSTIDTELKVIDTNCINVIQPDGSYRSEELNLVIIGPSADIIQFECKSFGHEVLNLTRNGY

GSTQYIRFSPDFTFGFEESLEVDTNPLLGAGKFATDPAVTLAHELIHAGHRLYGIAINPNGSTQYIRFSPDFTFGFEESLEVDTNPLLGAGKFATDPAVTLAHELIHAGHRLYGIAINPN

RVFKVNTNAYYEMSGLEVSFEELRTFGGHDAKFIDSLQENEFRLYYYNKFKDIASTLNKARVFKVNTNAYYEMSGLEVSFEELRTFGGHDAKFIDSLQENEFRLYYYNKFKDIASTLNKA

KSIVGTTASLQYMKNVFKEKYLLSEDTSGKFSVDKLKFDKLYKMLTEIYTEDNFVKFFKVKSIVGTTASLQYMKNVFKEKYLLSEDTSGKFSVDKLKFDKLYKMLTEIYTEDNFVKFFKV

LNRKTYLNFDKAVFKINIVPKVNYTIYDGFNLRNTNLAANFNGQNTEINNMNFTKLKNFTLNRKTYLNFDKAVFKINIVPKVNYTIYDGFNLRNTNLAANFNGQNTEINNMNFTKLKNFT

GLFEFYKLLCVRGIITSKTKSLDKGYNKALNDLCIKVNNWDLFFSPSEDNFTNDLNKGEEGLFEFYKLLCVRGIITSKTKSLDKGYNKALNDLCIKVNNWDLFFSPSEDNFTNDLNKGEE

ITSDTNIEAAEENISLDLIQQYYLTFNFDNEPENISIENLSSDIIGQLELMPNIERFPNGITSDTNIEAAEENISLDLIQQYYLTFNFDNEPENISIENLSSDIIGQLELMPNIERFPNG

KKYELDKYTMFHYLRAQEFEHGKSRIALTNSVNEALLNPSRVYTFFSSDYVKKVNKATEAKKYELDKYTMFHYLRAQEFEHGKSRIALTNSVNEALLNPSRVYTFFSSDYVKKVNKATEA

AMFLGWVEQLVYDFTDETSEVSTTDKIADITIIIPYIGPALNIGNMLYKDDFVGALIFSGAMFLGWVEQLVYDFTDETSEVSTTDKIADITIIIPYIGPALNIGNMLYKDDFVGALIFSG

AVILLEFIPEIAIPVLGTFALVSYIANKVLTVQTIDNALSKRNEKWDEVYKYIVTNWLAKAVILLEFIPEIAIPVLGTFALVSYIANKVLTVQTIDNALSKRNEKWDEVYKYIVTNWLAK

VNTQIDLIRKKMKEALENQAEATKAIINYQYNQYTEEEKNNINFNIDDLSSKLNESINKAVNTQIDLIRKKMKEALENQAEATKAIINYQYNQYTEEEKNNINFNIDDLSSKLNESINKA

MININKFLNQCSVSYLMNSMIPYGVKRLEDFDASLKDALLKYIYDNRGTLIGQVDRLKDKMININKFLNQCSVSYLMNSMIPYGVKRLEDFDASLKDALLKYIYDNRGTLIGQVDRLKDK

VNNTLSTDIPFQLSKYVDNQRLLSTFTEYIKNIINTSILNLRYESNHLIDLSRYASKINIVNNTLSTDIPFQLSKYVDNQRLLSTFTEYIKNIINTSILNLRYESNHLIDLSRYASKINI

GSKVNFDPIDKNQIQLFNLESSKIEVILKNAIVYNSMYENFSTSFWIRIPKYFNSISLNNGSKVNFDPIDKNQIQLFNLESSKIEVILKNAIVYNSMYENFSTSFWIRIPKYFNSISLNN

EYTIINCMENNSGWKVSLNYGEIIWTLQDTQEIKQRVVFKYSQMINISDYINRWIFVTITEYTIINCMENNSGWKVSLNYGEIIWTLQDTQEIKQRVVFKYSQMINISDYINRWIFVTIT

NNRLNNSKIYINGRLIDQKPISNLGNIHASNNIMFKLDGCRDTHRYIWIKYFNLFDKELNNRLNNSKIYINGRLIDQKPISNLGNIHASNNIMFKLDGCRDTHRYIWIKYFNLFDKELN

EKEIKDLYDNQSNSGILKDFWGDYLQYDKPYYMLNLYDPNKYVDVNNVGIRGYMYLKGPREKEIKDLYDNQSNSGILKDFWGDYLQYDKPYYMLNLYDPNKYVDVNNVGIRGYMYLKGPR

GSVMTTNIYLNSSLYRGTKFIIKKYASGNKDNIVRNNDRVYINVVVKNKEYRLATNASQAGSVMTTNIYLNSSLYRGTKFIIKKYASGNKDNIVRNNDRVYINVVVKNKEYRLATNASQA

GVEKILSALEIPDVGNLSQVVVMKSKNDQGITNKCKMNLQDNNGNDIGFIGFHQFNNIAKGVEKILSALEIPDVGNLSQVVVMKSKNDQGITNKCKMNLQDNNGNDIGFIGFHQFNNIAK

LVASNWYNRQIERSSRTLGCSWEFIPVDDGWGERPLLVASNWYNRQIERSSRTLGCSWEFIPVDDGWGERPL

SEQ ID NO: 18 - BoNT/B - UniProt P10844SEQ ID NO: 18 - BoNT/B - UniProt P10844

MPVTINNFNYNDPIDNNNIIMMEPPFARGTGRYYKAFKITDRIWIIPERYTFGYKPEDFNMPVTINNFNYNDPIDNNNIIMMEPPFARGTGRYYKAFKITDRIWIIPERYTFGYKPEDFN

KSSGIFNRDVCEYYDPDYLNTNDKKNIFLQTMIKLFNRIKSKPLGEKLLEMIINGIPYLGKSSGIFNRDVCEYYDPDYLNTNDKKNIFLQTMIKLFNRIKSKPLGEKLLEMIINGIPYLG

DRRVPLEEFNTNIASVTVNKLISNPGEVERKKGIFANLIIFGPGPVLNENETIDIGIQNHDRRVPLEEFNTNIASVTVNKLISNPGEVERKKGIFANLIIFGPGPVLNENETIDIGIQNH

FASREGFGGIMQMKFCPEYVSVFNNVQENKGASIFNRRGYFSDPALILMHELIHVLHGLYFASREGFGGIMQMKFCPEYVSVFNNVQENKGASIFNRRGYFSDPALILMHELIHVLHGLY

GIKVDDLPIVPNEKKFFMQSTDAIQAEELYTFGGQDPSIITPSTDKSIYDKVLQNFRGIVGIKVDDLPIVPNEKKFFMQSTDAIQAEELYTFGGQDPSIITPSTDKSIYDKVLQNFRGIV

DRLNKVLVCISDPNININIYKNKFKDKYKFVEDSEGKYSIDVESFDKLYKSLMFGFTETNDRLNKVLVCISDPNININIYKNKFKDKYKFVEDSEGKYSIDVESFDKLYKSLMFGFTETN

IAENYKIKTRASYFSDSLPPVKIKNLLDNEIYTIEEGFNISDKDMEKEYRGQNKAINKQAIAENYKIKTRASYFSDSLPPVKIKNLLDNEIYTIEEGFNISDKDMEKEYRGQNKAINKQA

YEEISKEHLAVYKIQMCKSVKAPGICIDVDNEDLFFIADKNSFSDDLSKNERIEYNTQSNYEEISKEHLAVYKIQMCKSVKAPGICIDVDNEDLFFIADKNSFSDDLSKNERIEYNTQSN

YIENDFPINELILDTDLISKIELPSENTESLTDFNVDVPVYEKQPAIKKIFTDENTIFQYYIENDFPINELILDTDLISKIELPSENTESLTDFNVDVPVYEKQPAIKKIFTDENTIFQY

LYSQTFPLDIRDISLTSSFDDALLFSNKVYSFFSMDYIKTANKVVEAGLFAGWVKQIVNDLYSQTFPLDIRDISLTSSFDDALLFSNKVYSFFSMDYIKTANKVVEAGLFAGWVKQIVND

FVIEANKSNTMDKIADISLIVPYIGLALNVGNETAKGNFENAFEIAGASILLEFIPELLIFVIEANKSNTMDKIADISLIVPYIGLALNVGNETAKGNFENAFEIAGASILLEFIPELLI

PVVGAFLLESYIDNKNKIIKTIDNALTKRNEKWSDMYGLIVAQWLSTVNTQFYTIKEGMYPVVGAFLLESYIDNKNKIIKTIDNALTKRNEKWSDMYGLIVAQWLSTVNTQFYTIKEGMY

KALNYQAQALEEIIKYRYNIYSEKEKSNINIDFNDINSKLNEGINQAIDNINNFINGCSVKALNYQAQALEEIIKYRYNIYSEKEKSNINIDFNDINSKLNEGINQAIDNINNFINGCSV

SYLMKKMIPLAVEKLLDFDNTLKKNLLNYIDENKLYLIGSAEYEKSKVNKYLKTIMPFDLSYLMKKMIPLAVEKLLDFDNTLKKNLLNYIDENKLYLIGSAEYEKSKVNKYLKTIMPFDL

SIYTNDTILIEMFNKYNSEILNNIILNLRYKDNNLIDLSGYGAKVEVYDGVELNDKNQFKSIYTNDTILIEMFNKYNSEILNNIILNLRYKDNNLIDLSGYGAKVEVYDGVELNDKNQFK

LTSSANSKIRVTQNQNIIFNSVFLDFSVSFWIRIPKYKNDGIQNYIHNEYTIINCMKNNSLTSSANSKIRVTQNQNIIFNSVFLDFSVSFWIRIPKYKNDGIQNYIHNEYTIINCMKNNS

GWKISIRGNRIIWTLIDINGKTKSVFFEYNIREDISEYINRWFFVTITNNLNNAKIYINGGWKISIRGNRIIWTLIDINGKTKSVFFEYNIREDISEYINRWFFVTITNNLNNAKIYING

KLESNTDIKDIREVIANGEIIFKLDGDIDRTQFIWMKYFSIFNTELSQSNIEERYKIQSYKLESNTDIKDIREVIANGEIIFKLDGDIDRTQFIWMKYFSIFNTELSQSNIEERYKIQSY

SEYLKDFWGNPLMYNKEYYMFNAGNKNSYIKLKKDSPVGEILTRSKYNQNSKYINYRDLYSEYLKDFWGNPLMYNKEYYMFNAGNKNSYIKLKKDSPVGEILTRSKYNQNSKYINYRDLY

IGEKFIIRRKSNSQSINDDIVRKEDYIYLDFFNLNQEWRVYTYKYFKKEEEKLFLAPISDIGEKFIIRRKSNSQSINDDIVRKEDYIYLDFFNLNQEWRVYTYKYFKKEEEKLFLAPISD

SDEFYNTIQIKEYDEQPTYSCQLLFKKDEESTDEIGLIGIHRFYESGIVFEEYKDYFCISSDEFYNTIQIKEYDEQPTYSCQLLFKKDEESTDEIGLIGIHRFYESGIVFEEYKDYFCIS

KWYLKEVKRKPYNLKLGCNWQFIPKDEGWTEKWYLKEVKRKPYNLKLGCNWQFIPKDEGWTE

SEQ ID NO: 19 - BoNT/C - UniProt P18640SEQ ID NO: 19 - BoNT/C - UniProt P18640

MPITINNFNYSDPVDNKNILYLDTHLNTLANEPEKAFRITGNIWVIPDRFSRNSNPNLNKMPITINNFNYSDPVDNKNILYLDTHLNTLANEPEKAFRITGNIWVIPDRFSRNSNPNLNK

PPRVTSPKSGYYDPNYLSTDSDKDPFLKEIIKLFKRINSREIGEELIYRLSTDIPFPGNNPPRVTSPKSGYYDPNYLSTDSDKDPFLKEIIKLFKRINSREIGEELIYRLSTDIPFPGNN

NTPINTFDFDVDFNSVDVKTRQGNNWVKTGSINPSVIITGPRENIIDPETSTFKLTNNTFNTPINTFDFDVDFNSVDVKTRQGNNWVKTGSINPSVIITGPRENIIDPETSTFKLTNNTF

AAQEGFGALSIISISPRFMLTYSNATNDVGEGRFSKSEFCMDPILILMHELNHAMHNLYGAAQEGFGALSIIISSPRFMLTYSNATNDVGEGRFSKSEFCMDPILILMHELNHAMHNLYG

IAIPNDQTISSVTSNIFYSQYNVKLEYAEIYAFGGPTIDLIPKSARKYFEEKALDYYRSIIAIPNDQTISSVSNIFYSQYNVKLEYAEIYAFGGPTIDLIPKSARKYFEEKALDYYRSI

AKRLNSITTANPSSFNKYIGEYKQKLIRKYRFVVESSGEVTVNRNKFVELYNELTQIFTEAKRLNSITTANPSSFNKYIGEYKQKLIRKYRFVVESSGEVTVNRNKFVELYNELTQIFTE

FNYAKIYNVQNRKIYLSNVYTPVTANILDDNVYDIQNGFNIPKSNLNVLFMGQNLSRNPAFNYAKIYNVQNRKIYLSNVYTPVTANILDDNVYDIQNGFNIPKSNLNVLFMGQNLSRNPA

LRKVNPENMLYLFTKFCHKAIDGRSLYNKTLDCRELLVKNTDLPFIGDISDVKTDIFLRKLRKVNPENMLYLFTKFCHKAIDGRSLYNKTLDCRELLVKNTDLPFIGDISDVKTDIFLRK

DINEETEVIYYPDNVSVDQVILSKNTSEHGQLDLLYPSIDSESEILPGENQVFYDNRTQNDINEETEVIYYPDNVSVDQVILSKNTSEHGQLDLLYPSIDSESEILPGENQVFYDNRTQN

VDYLNSYYYLESQKLSDNVEDFTFTRSIEEALDNSAKVYTYFPTLANKVNAGVQGGLFLMVDYLNSYYYLESQKLSDNVEDFTFTRSIEEALDNSAKVYTYFPTLANKVNAGVQGGLFLM

WANDVVEDFTTNILRKDTLDKISDVSAIIPYIGPALNISNSVRRGNFTEAFAVTGVTILLWANDVVEDFTTNILRKDTLDKISDVSAIIPYIGPALNISNSVRRGNFTEAFAVTGVTILL

EAFPEFTIPALGAFVIYSKVQERNEIIKTIDNCLEQRIKRWKDSYEWMMGTWLSRIITQFEAFPEFTIPALGAFVIYSKVQERNEIIKTIDNCLEQRIKRWKDSYEWMMGTWLSRIITQF

NNISYQMYDSLNYQAGAIKAKIDLEYKKYSGSDKENIKSQVENLKNSLDVKISEAMNNINNNISYQMYDSLNYQAGAIKAKIDLEYKKYSGSDKENIKSQVENLKNSLDVKISEAMNNIN

KFIRECSVTYLFKNMLPKVIDELNEFDRNTKAKLINLIDSHNIILVGEVDKLKAKVNNSFKFIRECSVTYLFKNMLPKVIDELNEFDRNTKAKLINLIDSHNIILVGEVDKLKAKVNNSF

QNTIPFNIFSYTNNSLLKDIINEYFNNINDSKILSLQNRKNTLVDTSGYNAEVSEEGDVQQNTIPFNIFSYTNNSLLKDIINEYFNNINDSKILSLQNRKNTLVDTSGYNAEVSEEGDVQ

LNPIFPFDFKLGSSGEDRGKVIVTQNENIVYNSMYESFSISFWIRINKWVSNLPGYTIIDLNPIFPFDFKLGSSGEDRGKVIVTQNENIVYNSMYESFSISFWIRINKWVSNLPGYTIID

SVKNNSGWSIGIISNFLVFTLKQNEDSEQSINFSYDISNNAPGYNKWFFVTVTNNMMGNMSVKNNSGWSIGIISNFLVFTLKQNEDSEQSINFSYDISNNAPGYNKWFFVTVTNNMMGNM

KIYINGKLIDTIKVKELTGINFSKTITFEINKIPDTGLITSDSDNINMWIRDFYIFAKELKIYINGKLIDTIKVKELTGINFSKTITFEINKIPDTGLITSDSDNINMWIRDFYIFAKEL

DGKDINILFNSLQYTNVVKDYWGNDLRYNKEYYMVNIDYLNRYMYANSRQIVFNTRRNNNDGKDINILFNSLQYTNVVKDYWGNDLRYNKEYYMVNIDYLNRYMYANSRQIVFNTRRNNNN

DFNEGYKIIIKRIRGNTNDTRVRGGDILYFDMTINNKAYNLFMKNETMYADNHSTEDIYADFNEGYKIIIKRIRGNTNDTRVRGGDILYFDMTINNKAYNLFMKNETMYADNHSTEDIYA

IGLREQTKDINDNIIFQIQPMNNTYYYASQIFKSNFNGENISGICSIGTYRFRLGGDWYRIGLREQTKDINDNIIFQIQPMNNTYYYASQIFKSNFNGENISGICSIGTYRFRLGGDWYR

HNYLVPTVKQGNYASLLESTSTHWGFVPVSEHNYLVPTVKQGNYASLLESTSTHWGFVPVSE

SEQ ID NO: 20 - BoNT/D - UniProt P19321SEQ ID NO: 20 - BoNT/D - UniProt P19321

MTWPVKDFNYSDPVNDNDILYLRIPQNKLITTPVKAFMITQNIWVIPERFSSDTNPSLSKMTWPVKDFNYSDPVNDNDILYLRIPQNKLITTPVKAFMITQNIWVIPERFSSDTNPSLSK

PPRPTSKYQSYYDPSYLSTDEQKDTFLKGIIKLFKRINERDIGKKLINYLVVGSPFMGDSPPRPTSKYQSYYDPSYLSTDEQKDTFLKGIIKLFKRINERDIGKKLINYLVVGSPFMGDS

STPEDTFDFTRHTTNIAVEKFENGSWKVTNIITPSVLIFGPLPNILDYTASLTLQGQQSNSTPEDTFDFTRHTTNIAVEKFENGSWKVTNIITPSVLIFGPLPNILDYTASLTLQGQQSN

PSFEGFGTLSILKVAPEFLLTFSDVTSNQSSAVLGKSIFCMDPVIALMHELTHSLHQLYGPSFEGFGTLSILKVAPEFLLTFSDVTSNQSSAVLGKSIFCMDPVIALMHELTHSLHQLYG

INIPSDKRIRPQVSEGFFSQDGPNVQFEELYTFGGLDVEIIPQIERSQLREKALGHYKDIINIPSDKRIRPQVSEGFFSQDGPNVQFEELYTFGGLDVEIIPQIERSQLREKALGHYKDI

AKRLNNINKTIPSSWISNIDKYKKIFSEKYNFDKDNTGNFVVNIDKFNSLYSDLTNVMSEAKRLNNINKTIPSSWISNIDKYKKIFSEKYNFDKDNTGNFVVNIDKFNSLYSDLTNVMSE

VVYSSQYNVKNRTHYFSRHYLPVFANILDDNIYTIRDGFNLTNKGFNIENSGQNIERNPAVVYSSQYNVKNRTHYFSRHYLPVFANILDDNIYTIRDGFNLTNKGFNIENSGQNIERNPA

LQKLSSESVVDLFTKVCLRLTKNSRDDSTCIKVKNNRLPYVADKDSISQEIFENKIITDELQKLSSESVVDLFTKVCLRLTKNSRDDSTCIKVKNNRLPYVADKDSISQEIFENKIITDE

TNVQNYSDKFSLDESILDGQVPINPEIVDPLLPNVNMEPLNLPGEEIVFYDDITKYVDYLTNVQNYSDKFSLDESILDGQVPINPEIVDPLLPNVNMEPLNLPGEEIVFYDDITKYVDYL

NSYYYLESQKLSNNVENITLTTSVEEALGYSNKIYTFLPSLAEKVNKGVQAGLFLNWANENSYYYLESQKLSNNVENITLTTSVEEALGYSNKIYTFLPSLAEKVNKGVQAGLFLNWANE

VVEDFTTNIMKKDTLDKISDVSVIIPYIGPALNIGNSALRGNFNQAFATAGVAFLLEGFPVVEDFTTNIMKKDTLDKISDVSVIIPYIGPALNIGNSALRGNFNQAFATAGVAFLLEGFP

EFTIPALGVFTFYSSIQEREKIIKTIENCLEQRVKRWKDSYQWMVSNWLSRITTQFNHINEFTIPALGVFTFYSSIQEREKIIKTIENCLEQRVKRWKDSYQWMVSNWLSRITTQFNHIN

YQMYDSLSYQADAIKAKIDLEYKKYSGSDKENIKSQVENLKNSLDVKISEAMNNINKFIRYQMYDSLSYQADAIKAKIDLEYKKYSGSDKENIKSQVENLKNSLDVKISEAMNNINKFIR

ECSVTYLFKNMLPKVIDELNKFDLRTKTELINLIDSHNIILVGEVDRLKAKVNESFENTMECSVTYLFKNMLPKVIDELNKFDLRTKTELINLIDSHNIILVGEVDRLKAKVNESFENTM

PFNIFSYTNNSLLKDIINEYFNSINDSKILSLQNKKNALVDTSGYNAEVRVGDNVQLNTIPFNIFSYTNNSLLKDIINEYFNSINDSKILSLQNKKNALVDTSGYNAEVRVGDNVQLNTI

YTNDFKLSSSGDKIIVNLNNNILYSAIYENSSVSFWIKISKDLTNSHNEYTIINSIEQNSYTNDFKLSSSGDKIIVNLNNNILYSAIYENSSVSFWIKISKDLTNSHNEYTIINSIEQNS

GWKLCIRNGNIEWILQDVNRKYKSLIFDYSESLSHTGYTNKWFFVTITNNIMGYMKLYINGWKLCIRNGNIEWILQDVNRKYKSLIFDYSESLSHTGYTNKWFFVTITNNIMGYMKLYIN

GELKQSQKIEDLDEVKLDKTIVFGIDENIDENQMLWIRDFNIFSKELSNEDINIVYEGQIGELKQSQKIEDLDEVKLDKTIVFGIDENIDENQMLWIRDFNIFSKELSNEDINIVYEGQI

LRNVIKDYWGNPLKFDTEYYIINDNYIDRYIAPESNVLVLVQYPDRSKLYTGNPITIKSVLRNVIKDYWGNPLKFDTEYYIINDNYIDRYIAPESNVLVLVQYPDRSKLYTGNPITIKSV

SDKNPYSRILNGDNIILHMLYNSRKYMIIRDTDTIYATQGGECSQNCVYALKLQSNLGNYSDKNPYSRILNGDNIILHMLYNSRKYMIIRDTDTIYATQGGECSQNCVYALKLQSNLGNY

GIGIFSIKNIVSKNKYCSQIFSSFRENTMLLADIYKPWRFSFKNAYTPVAVTNYETKLLSGIGIFSIKNIVSKNKYCSQIFSSFRENTMLLADIYKPWRFSFKNAYTPVAVTNYETKLLS

TSSFWKFISRDPGWVETSSFWKFISRDPGWVE

SEQ ID NO: 21 - BoNT/E - UniProt Q00496SEQ ID NO: 21 - BoNT/E - UniProt Q00496

MPKINSFNYNDPVNDRTILYIKPGGCQEFYKSFNIMKNIWIIPERNVIGTTPQDFHPPTSMPKINSFNYNDPVNDRTILYIKPGGCQEFYKSFNIMKNIWIIPERNVIGTTPQDFHPPTS

LKNGDSSYYDPNYLQSDEEKDRFLKIVTKIFNRINNNLSGGILLEELSKANPYLGNDNTPLKNGDSSYYDPNYLQSDEEKDRFLKIVTKIFNRINNNLSGGILLEELSKANPYLGNDNTP

DNQFHIGDASAVEIKFSNGSQDILLPNVIIMGAEPDLFETNSSNISLRNNYMPSNHRFGSDNQFHIGDASAVEIKFSNGSQDILLPNVIIMGAEPDLFETNSSNISLRNNYMPSNHRFGS

IAIVTFSPEYSFRFNDNCMNEFIQDPALTLMHELIHSLHGLYGAKGITTKYTITQKQNPLIAIVTFSPEYSFRFNDNCMNEFIQDPALTLMHELIHSLHGLYGAKGITTKYTITQKQNPL

ITNIRGTNIEEFLTFGGTDLNIITSAQSNDIYTNLLADYKKIASKLSKVQVSNPLLNPYKITNIRGTNIEEFLTFGGTDLNIITSAQSNDIYTNLLADYKKIASKLSKVQVSNPLLNPYK

DVFEAKYGLDKDASGIYSVNINKFNDIFKKLYSFTEFDLRTKFQVKCRQTYIGQYKYFKLDVFEAKYGLDKDASGIYSVNINKFNDIFKKLYSFTEFDLRTKFQVKCRQTYIGQYKYFKL

SNLLNDSIYNISEGYNINNLKVNFRGQNANLNPRIITPITGRGLVKKIIRFCKNIVSVKGSNLLNDSIYNISEGYNINNLKVNFRGQNANLNPRIITPITGRGLVKKIIRFCKNIVSVKG

IRKSICIEINNGELFFVASENSYNDDNINTPKEIDDTVTSNNNYENDLDQVILNFNSESAIRKSICIEINNGELFFVASENSYNDDNINTPKEIDDTVTSNNNYENDLDQVILNFNSESA

PGLSDEKLNLTIQNDAYIPKYDSNGTSDIEQHDVNELNVFFYLDAQKVPEGENNVNLTSSPGLSDEKLNLTIQNDAYIPKYDSNGTSDIEQHDVNELNVFFYLDAQKVPEGENNVNLTSS

IDTALLEQPKIYTFFSSEFINNVNKPVQAALFVSWIQQVLVDFTTEANQKSTVDKIADISIDTALLEQPKIYTFFSSEFINNVNKPVQAALFVSWIQQVLVDFTTEANQKSTVDKIADIS

IVVPYIGLALNIGNEAQKGNFKDALELLGAGILLEFEPELLIPTILVFTIKSFLGSSDNKIVVPYIGLALNIGNEAQKGNFKDALELLGAGILLEFEPELLIPTILVFTIKSFLGSSDNK

NKVIKAINNALKERDEKWKEVYSFIVSNWMTKINTQFNKRKEQMYQALQNQVNAIKTIIENKVIKAINNALKERDEKWKEVYSFIVSNWMTKINTQFNKRKEQMYQALQNQVNAIKTIIE

SKYNSYTLEEKNELTNKYDIKQIENELNQKVSIAMNNIDRFLTESSISYLMKIINEVKINSKYNSYTLEKNELTNKYDIKQIENELNQKVSIAMNNIDRFLTESSISYLMKIINEVKIN

KLREYDENVKTYLLNYIIQHGSILGESQQELNSMVTDTLNNSIPFKLSSYTDDKILISYFKLREYDENVKTYLLNYIIQHGSILGESQQELNSMVTDTLNNSIPFKLSSYTDKILISYF

NKFFKRIKSSSVLNMRYKNDKYVDTSGYDSNININGDVYKYPTNKNQFGIYNDKLSEVNINKFFKRIKSSSVLNMRYKNDKYVDTSGYDSNININGDVYKYPTNKNQFGIYNDKLSEVNI

SQNDYIIYDNKYKNFSISFWVRIPNYDNKIVNVNNEYTIINCMRDNNSGWKVSLNHNEIISQNDYIIYDNKYKNFSISFWVRIPNYDNKIVNVNNEYTIINCMRDNNSGWKVSLNHNEII

WTFEDNRGINQKLAFNYGNANGISDYINKWIFVTITNDRLGDSKLYINGNLIDQKSILNLWTFEDNRGINQKLAFNYGNANGISDYINKWIFVTITNDRLGDSKLYINGNLIDQKSILNL

GNIHVSDNILFKIVNCSYTRYIGIRYFNIFDKELDETEIQTLYSNEPNTNILKDFWGNYLGNIHVSDNILFKIVNCSYTRYIGIRYFNIFDKELDETEIQTLYSNEPNTNILKDFWGNYL

LYDKEYYLLNVLKPNNFIDRRKDSTLSINNIRSTILLANRLYSGIKVKIQRVNNSSTNDNLYDKEYYLLNVLKPNNFIDRRKDSTLSINNIRSTILLANRLYSGIKVKIQRVNNSSTNDN

LVRKNDQVYINFVASKTHLFPLYADTATTNKEKTIKISSSGNRFNQVVVMNSVGNCTMNFLVRKNDQVYINFVASKTHLFPLYADTATTNKEKTIKISSSGNRFNQVVVMNSVGNCTMNF

KNNNGNNIGLLGFKADTVVASTWYYTHMRDHTNSNGCFWNFISEEHGWQEKKNNNGNNIGLLGFKADTVVASTWYYTHMRDHTNSNGCFWNFISEEHGWQEK

SEQ ID NO: 22 - BoNT/F - UniProt A7GBG3SEQ ID NO: 22 - BoNT/F - UniProt A7GBG3

MPVVINSFNYNDPVNDDTILYMQIPYEEKSKKYYKAFEIMRNVWIIPERNTIGTDPSDFDMPVVINSFNYNDPVNDDTILYMQIPYEEKSKKYYKAFEIMRNVWIIPERNTIGTDPSDFD

PPASLENGSSAYYDPNYLTTDAEKDRYLKTTIKLFKRINSNPAGEVLLQEISYAKPYLGNPPASLENGSSAYYDPNYLTTDAEKDRYLKTTIKLFKRINSNPAGEVLLQEISYAKPYLGN

EHTPINEFHPVTRTTSVNIKSSTNVKSSIILNLLVLGAGPDIFENSSYPVRKLMDSGGVYEHTPINEFHPVTRTSVNIKSSTNVKSSIILNLLVLGAGPDIFENSSYPVRKLMDSGGVY

DPSNDGFGSINIVTFSPEYEYTFNDISGGYNSSTESFIADPAISLAHELIHALHGLYGARDPSNDGFGSINIVTFSPEYEYTFNDISGGYNSSTESFIADPAISLAHELIHALHGLYGAR

GVTYKETIKVKQAPLMIAEKPIRLEEFLTFGGQDLNIITSAMKEKIYNNLLANYEKIATRGVTYKETIKVKQAPLMIAEKPIRLEEFLTFGGQDLNIITSAMKEKIYNNLLANYEKIATR

LSRVNSAPPEYDINEYKDYFQWKYGLDKNADGSYTVNENKFNEIYKKLYSFTEIDLANKFLSRVNSAPPEYDINEYKDYFQWKYGLDKNADGSYTVNENKFNEIYKKLYSFTEIDLANKF

KVKCRNTYFIKYGFLKVPNLLDDDIYTVSEGFNIGNLAVNNRGQNIKLNPKIIDSIPDKGKVKCRNTYFIKYGFLKVPNLLDDDIYTVSEGFNIGNLAVNNRGQNIKLNPKIIDSIPDKG

LVEKIVKFCKSVIPRKGTKAPPRLCIRVNNRELFFVASESSYNENDINTPKEIDDTTNLNLVEKIVKFCKSVIPRKGTKAPPRLCIRVNNRELFVASESSYNENDINTPKEIDDTTNLN

NNYRNNLDEVILDYNSETIPQISNQTLNTLVQDDSYVPRYDSNGTSEIEEHNVVDLNVFFNNYRNLDEVILDYNSETIPQISNQTLNTLVQDDSYVPRYDSNGTSEIEEHNVVDLNVFF

YLHAQKVPEGETNISLTSSIDTALSEESQVYTFFSSEFINTINKPVHAALFISWINQVIRYLHAQKVPEGETNISLTSSIDTALSEESQVYTFFSSEEFINTINKPVHAALFISWINQVIR

DFTTEATQKSTFDKIADISLVVPYVGLALNIGNEVQKENFKEAFELLGAGILLEFVPELLDFTTEATQKSTFDKIADISLVVPYVGLALNIGNEVQKENFKEAFELLGAGILLEFVPELL

IPTILVFTIKSFIGSSENKNKIIKAINNSLMERETKWKEIYSWIVSNWLTRINTQFNKRKIPTILVFTIKSFIGSSENKNKIIKAINNSLMERETKWKEIYSWIVSNWLTRINTQFNKRK

EQMYQALQNQVDAIKTVIEYKYNNYTSDERNRLESEYNINNIREELNKKVSLAMENIERFEQMYQALQNQVDAIKTVIEYKYNNYTSDERNRLESEYNINNIREELNKKVSLAMENIERF

ITESSIFYLMKLINEAKVSKLREYDEGVKEYLLDYISEHRSILGNSVQELNDLVTSTLNNITESSIFYLMKLINEAKVSKLREYDEGVKEYLLDYISEHRSILGNSVQELNDLVTSTLNN

SIPFELSSYTNDKILILYFNKLYKKIKDNSILDMRYENNKFIDISGYGSNISINGDVYIYSIPFELSSYTNDKILILYFNKLYKKIKDNSILDMRYENNKFIDISGYGSNISINGDVYIY

STNRNQFGIYSSKPSEVNIAQNNDIIYNGRYQNFSISFWVRIPKYFNKVNLNNEYTIIDCSTNRNQFGIYSSKPSEVNIAQNNDIIYNGRYQNFSISFWVRIPKYFNKVNLNNEYTIIDC

IRNNNSGWKISLNYNKIIWTLQDTAGNNQKLVFNYTQMISISDYINKWIFVTITNNRLGNIRNNNSGWKISLNYNKIIWTLQDTAGNNQKLVFNYTQMISISDYINKWIFVTITNNRLGN

SRIYINGNLIDEKSISNLGDIHVSDNILFKIVGCNDTRYVGIRYFKVFDTELGKTEIETLSRIYINGNLIDEKSISNLGDIHVSDNILFKIVGCNDTRYVGIRYFKVFDTELGKTEIETL

YSDEPDPSILKDFWGNYLLYNKRYYLLNLLRTDKSITQNSNFLNINQQRGVYQKPNIFSNYSDEPDPSILKDFWGNYLLYNKRYYLLNLLRTDKSITQNSNFLNINQQRGVYQKPNIFSN

TRLYTGVEVIIRKNGSTDISNTDNFVRKNDLAYINVVDRDVEYRLYADISIAKPEKIIKLTRLYTGVEVIIRKNGSTDISNTDNFVRKNDLAYINVVDRDVEYRLYADISIAKPEKIIKL

IRTSNSNNSLGQIIVMDSIGNNCTMNFQNNNGGNIGLLGFHSNNLVASSWYYNNIRKNTSIRTSNSNNSLGQIIVMDSIGNNCTMNFQNNNGGNIGLLGFHSNNLVASSWYYNNIRKNTS

SNGCFWSFISKEHGWQENSNGCFWSFISKEHGWQEN

SEQ ID NO: 23 - BoNT/G - UniProt Q60393SEQ ID NO: 23 - BoNT/G - UniProt Q60393

MPVNIKXFNYNDPINNDDIIMMEPFNDPGPGTYYKAFRIIDRIWIVPERFTYGFQPDQFNMPVNIKXFNYNDPINNDDIIMMEPFNDPGPGTYYKAFRIIDRIWIVPERFTYGFQPDQFN

ASTGVFSKDVYEYYDPTYLKTDAEKDKFLKTMIKLFNRINSKPSGQRLLDMIVDAIPYLGASTGVFSKDVYEYYDPTYLKTDAEKDKFLKTMIKLFNRINSKPSGQRLLDMIVDAIPYLG

NASTPPDKFAANVANVSINKKIIQPGAEDQIKGLMTNLIIFGPGPVLSDNFTDSMIMNGHNASTPPDKFAANVANVSINKKIIQPGAEDQIKGLMTNLIIFGPGPVLSDNFTDSIMIMNGH

SPISEGFGARMMIRFCPSCLNVFNNVQENKDTSIFSRRAYFADPALTLMHELIHVLHGLYSPISEGFGARMMIRFCPSCLNVFNNVQENKDTSIFSRRAYFADPALTLMHELIHVLHGLY

GIKISNLPITPNTKEFFMQHSDPVQAEELYTFGGHDPSVISPSTDMNIYNKALQNFQDIAGIKISNLPITPNTKEFFMQHSDPVQAEELYTFGGHDPSVISPSTDMNIYNKALQNFQDIA

NRLNIVSSAQGSGIDISLYKQIYKNKYDFVEDPNGKYSVDKDKFDKLYKALMFGFTETNLNRLNIVSSAQGSGIDISLYKQIYKNKYDFVEDPNGKYSVDKDKFDKLYKALMFGFTETNL

AGEYGIKTRYSYFSEYLPPIKTEKLLDNTIYTQNEGFNIASKNLKTEFNGQNKAVNKEAYAGEYGIKTRYSYFSEYLPPIKTEKLLDNTIYTQNEGFNIASKNLKTEFNGQNKAVNKEAY

EEISLEHLVIYRIAMCKPVMYKNTGKSEQCIIVNNEDLFFIANKDSFSKDLAKAETIAYNEEISLEHLVIYRIAMCKPVMYKNTGKSEQCIIVNNEDLFFIANKDSFSKDLAKAETIAYN

TQNNTIENNFSIDQLILDNDLSSGIDLPNENTEPFTNFDDIDIPVYIKQSALKKIFVDGDTQNNTIENNFSIDQLILDNDLSSGIDLPNENTEPFTNFDDIDIPVYIKQSALKKIFVDGD

SLFEYLHAQTFPSNIENLQLTNSLNDALRNNNKVYTFFSTNLVEKANTVVGASLFVNWVKSLFEYLHAQTFPSNIENLQLTNSLNDALRNNNKVYTFFSTNLVEKANTVVGASLFVNWVK

GVIDDFTSESTQKSTIDKVSDVSIIIPYIGPALNVGNETAKENFKNAFEIGGAAILMEFIGVIDDFTSESTQKSTIDKVSDVSIIIPYIGPALNVGNETAKENFKNAFEIGGAAILMEFI

PELIVPIVGFFTLESYVGNKGHIIMTISNALKKRDQKWTDMYGLIVSQWLSTVNTQFYTIPELIVPIVGFFTLESYVGNKGHIIMTISNALKKRDQKWTDMYGLIVSQWLSTVNTQFYTI

KERMYNALNNQSQAIEKIIEDQYNRYSEEDKMNINIDFNDIDFKLNQSINLAINNIDDFIKERMYNALNNQSQAIEKIIEDQYNRYSEEDKMNINIDFNDIDFKLNQSINLAINNIDDFI

NQCSISYLMNRMIPLAVKKLKDFDDNLKRDLLEYIDTNELYLLDEVNILKSKVNRHLKDSNQCSISYLMNRMIPLAVKKLKDFDDNLKRDLLEYIDTNELYLLDEVNILKSKVNRHLKDS

IPFDLSLYTKDTILIQVFNNYISNISSNAILSLSYRGGRLIDSSGYGATMNVGSDVIFNDIPFDLSLYTKDTILIQVFNNYISNISSNAILSLSYRGGRLIDSSGYGATMNVGSDVIFND

IGNGQFKLNNSENSNITAHQSKFVVYDSMFDNFSINFWVRTPKYNNNDIQTYLQNEYTIIIGNGQFKLNNSENSNITAHQSKFVVYDSMFDNFSINFWVRTPKYNNNDIQTYLQNEYTII

SCIKNDSGWKVSIKGNRIIWTLIDVNAKSKSIFFEYSIKDNISDYINKWFSITITNDRLGSCIKNDSGWKVSIKGNRIIWTLIDVNAKSKSIFFEEYSIKDNISDYINKWFSITITNDRLG

NANIYINGSLKKSEKILNLDRINSSNDIDFKLINCTDTTKFVWIKDFNIFGRELNATEVSNANIYINGSLKKSEKILNLDRINSSNDIDFKLINCTDTTKFVWIKDFNIFGRELNATEVS

SLYWIQSSTNTLKDFWGNPLRYDTQYYLFNQGMQNIYIKYFSKASMGETAPRTNFNNAAISLYWIQSSTNTLKDFWGNPLRYDTQYYLFNQGMQNIYIKYFSKASMGETAPRTNFNNAAI

NYQNLYLGLRFIIKKASNSRNINNDNIVREGDYIYLNIDNISDESYRVYVLVNSKEIQTQNYQNLYLGLRFIIKKASNSRNINNDNIVREGDYIYLNIDNISDESYRVYVLVNSKEIQTQ

LFLAPINDDPTFYDVLQIKKYYEKTTYNCQILCEKDTKTFGLFGIGKFVKDYGYVWDTYDLFLAPINDDPTFYDVLQIKKYYEKTTYNCQILCEKDTKTFGLFGIGKFVKDYGYVWDTYD

NYFCISQWYLRRISENINKLRLGCNWQFIPVDEGWTENYFCISQWYLRRISENINKLRLGCNWQFIPVDEGWTE

SEQ ID NO: 24 - Полипептидная последовательность BoNT/XSEQ ID NO: 24 - BoNT/X polypeptide sequence

MKLEINKFNYNDPIDGINVITMRPPRHSDKINKGKGPFKAFQVIKNIWIVPERYNFTNNTMKLEINKFNYNDPIDGINVITMRPPRHSDKINKGKGPFKAFQVIKNIWIVPERYNFTNNT

NDLNIPSEPIMEADAIYNPNYLNTPSEKDEFLQGVIKVLERIKSKPEGEKLLELISSSIPNDLNIPSEPIMEADAIYNPNYLNTPSEKDEFLQGVIKVLERIKSKPEGEKLLELISSIP

LPLVSNGALTLSDNETIAYQENNNIVSNLQANLVIYGPGPDIANNATYGLYSTPISNGEGLPLVSNGALTLSDNETIAYQENNNIVSNLQANLVIYGPGPDIANNATYGLYSTPISNGEG

TLSEVSFSPFYLKPFDESYGNYRSLVNIVNKFVKREFAPDPASTLMHELVHVTHNLYGISTLSEVSFSPFYLKPFDESYGNYRSLVNIVNKFVKREFAPDPASTLMHELVHVTHNLYGIS

NRNFYYNFDTGKIETSRQQNSLIFEELLTFGGIDSKAISSLIIKKIIETAKNNYTTLISENRNFYYNFDTGKIETSRQQNSLIFEELLTFGGIDSKAISSLIIKKIIETAKNNYTTLISE

RLNTVTVENDLLKYIKNKIPVQGRLGNFKLDTAEFEKKLNTILFVLNESNLAQRFSILVRRLNTTVVENDLLKYIKNKIPVQGRRLGNFKLDTAEFEKKLNTILFVLNESNLAQRFSILVR

KHYLKERPIDPIYVNILDDNSYSTLEGFNISSQGSNDFQGQLLESSYFEKIESNALRAFIKHYLKERPIDPIYVNILDDNSYSTLEGFNISSQGSNDFQGQLLESSYFEKIESNALRAFI

KICPRNGLLYNAIYRNSKNYLNNIDLEDKKTTSKTNVSYPCSLLNGCIEVENKDLFLISNKICPRNGLLYNAIYRNSKNYLNNIDLEDKKTTSKTNVSYPCSLLNGCIEVENKDLFLISN

KDSLNDINLSEEKIKPETTVFFKDKLPPQDITLSNYDFTEANSIPSISQQNILERNEELYKDSLNDINLSEEKIKPETTVFFKDKLPPQDITLSNYDFTEANSIPSISQQNILERNEELY

EPIRNSLFEIKTIYVDKLTTFHFLEAQNIDESIDSSKIRVELTDSVDEALSNPNKVYSPFEPIRNSLFEIKTIYVDKLTTFHFLEAQNIDESIDSSKIRVELTDSVDEALSNPNKVYSPF

KNMSNTINSIETGITSTYIFYQWLRSIVKDFSDETGKIDVIDKSSDTLAIVPYIGPLLNIKNMSNTINSIETGITSTYIFYQWLRSIVKDFSDETGKIDVIDKSSDTLAIVPYIGPLLNI

GNDIRHGDFVGAIELAGITALLEYVPEFTIPILVGLEVIGGELAREQVEAIVNNALDKRDGNDIRHGDFVGAIELAGITALLEYVPEFTIPILVGLEVIGGELAREQVEAIVNNALDKRD

QKWAEVYNITKAQWWGTIHLQINTRLAHTYKALSRQANAIKMNMEFQLANYKGNIDDKAKQKWAEVYNITKAQWWGTIHLQINTRLAHTYKALSRQANAIKMNMEFQLANYKGNIDDKAK

IKNAISETEILLNKSVEQAMKNTEKFMIKLSNSYLTKEMIPKVQDNLKNFDLETKKTLDKIKNAISETEILLNKSVEQAMKNTEKFMIKLSNSYLTKEMIPKVQDNLKNFDLETKKTLDK

FIKEKEDILGTNLSSSLRRKVSIRLNKNIAFDINDIPFSEFDDLINQYKNEIEDYEVLNLFIKEKEDILGTNLSSSLRRKVSIRLNKNIAFDINDIPFSEFDDLINQYKNEIEDYEVLNL

GAEDGKIKDLSGTTSDINIGSDIELADGRENKAIKIKGSENSTIKIAMNKYLRFSATDNFGAEDGKIKDLSGTTSDINIGSDIELADGRENKAIKIKGSENSTIKIAMNKYLRFSATDNF

SISFWIKHPKPTNLLNNGIEYTLVENFNQRGWKISIQDSKLIWYLRDHNNSIKIVTPDYISISFWIKHPKPTNLLNNGIEYTLVENFNQRGWKISIQDSKLIWYLRDHNNSIKIVTPDYI

AFNGWNLITITNNRSKGSIVYVNGSKIEEKDISSIWNTEVDDPIIFRLKNNRDTQAFTLLAFNGWNLITITNNRSKGSIVYVNGSKIEEKDISSIWNTEVDDPIIFRLKNNRDTQAFTLL

DQFSIYRKELNQNEVVKLYNYYFNSNYIRDIWGNPLQYNKKYYLQTQDKPGKGLIREYWSDQFSIYRKELNQNEVVKLYNYYFNSNYIRDIWGNPLQYNKKYYLQTQDKPGKGLIREYWS

SFGYDYVILSDSKTITFPNNIRYGALYNGSKVLIKNSKKLDGLVRNKDFIQLEIDGYNMGSFGYDYVILSDSKTITFPNNIRYGALYNGSKVLIKNSKKLDGLVRNKDFIQLEIDGYNMG

ISADRFNEDTNYIGTTYGTTHDLTTDFEIIQRQEKYRNYCQLKTPYNIFHKSGLMSTETSISADRFNEDTNYIGTTYGTTHDLTTDFEIIQRQEKYRNYCQLKTPYNIFHKSGLMSTETS

KPTFHDYRDWVYSSAWYFQNYENLNLRKHTKTNWYFIPKDEGWDEDKPTFHDYRDWVYSSAWYFQNYENLNLRKHTKTNWYFIPKDEGWDED

SEQ ID NO: 25 - TeNT - UniProt P04958SEQ ID NO: 25 - TeNT - UniProt P04958

MPITINNFRYSDPVNNDTIIMMEPPYCKGLDIYYKAFKITDRIWIVPERYEFGTKPEDFNMPITINNFRYSDPVNNDTIIMMEPPYCKGLDIYYKAFKITDRIWIVPERYEFGTKPEDFN

PPSSLIEGASEYYDPNYLRTDSDKDRFLQTMVKLFNRIKNNVAGEALLDKIINAIPYLGNPPSSLIEGASEYYDPNYLRTDSDKDRFLQTMVKLFNRIKNNVAGEALLDKIINAIPYLGN

SYSLLDKFDTNSNSVSFNLLEQDPSGATTKSAMLTNLIIFGPGPVLNKNEVRGIVLRVDNSYSLLDKFDTNNSNSVSFNLLEQDPSGATTKSAMLTNLIIFGPGPVLNKNEVRGIVLRVDN

KNYFPCRDGFGSIMQMAFCPEYVPTFDNVIENITSLTIGKSKYFQDPALLLMHELIHVLHKNYFPCRDGFGSIMQMAFCPEYVPTFDNVIENITSLTIGKSKYFQDPALLLMHELIHVLH

GLYGMQVSSHEIIPSKQEIYMQHTYPISAEELFTFGGQDANLISIDIKNDLYEKTLNDYKGLYGMQVSSHEIIPSKQEIYMQHTYPISAEELFTFGGQDANLISIDIKNDLYEKTLNDYK

AIANKLSQVTSCNDPNIDIDSYKQIYQQKYQFDKDSNGQYIVNEDKFQILYNSIMYGFTEAIANKLSQVTSCNDPNIDIDSYKQIYQQKYQFDKDSNGQYIVNEDKFQILYNSIMYGFTE

IELGKKFNIKTRLSYFSMNHDPVKIPNLLDDTIYNDTEGFNIESKDLKSEYKGQNMRVNTIELGKKFNIKTRLSYFSMNHDPVKIPNLLDDTIYNDTEGFNIESKDLKSEYKGQNMRVNT

NAFRNVDGSGLVSKLIGLCKKIIPPTNIRENLYNRTASLTDLGGELCIKIKNEDLTFIAENAFRNVDGSGLVSKLIGLCKKIIPPTNIRENLYNRTASLTDLGGELCIKIKNEDLTFIAE

KNSFSEEPFQDEIVSYNTKNKPLNFNYSLDKIIVDYNLQSKITLPNDRTTPVTKGIPYAPKNSFSEEPFQDEIVSYNTKNKPLNFNYSLDKIIVDYNLQSKITLPNDRTTPVTKGIPYAP

EYKSNAASTIEIHNIDDNTIYQYLYAQKSPTTLQRITMTNSVDDALINSTKIYSYFPSVIEYKSNAASTIEIHNIDDNTTIYQYLYAQKSPTTLQRITMTNSVDDALINSTKIYSYFPSVI

SKVNQGAQGILFLQWVRDIIDDFTNESSQKTTIDKISDVSTIVPYIGPALNIVKQGYEGNSKVNQGAQGILFLQWVRDIIDDFTNESSQKTTIDKISDVSTIVPYIGPALNIVKQGYEGN

FIGALETTGVVLLLEYIPEITLPVIAALSIAESSTQKEKIIKTIDNFLEKRYEKWIEVYKFIGALETTGVVLLLEYIPEITLPVIAALSIAESSTQKEKIIKTIDNFLEKRYEKWIEVYK

LVKAKWLGTVNTQFQKRSYQMYRSLEYQVDAIKKIIDYEYKIYSGPDKEQIADEINNLKNLVKAKWLGTVNTQFQKRSYQMYRSLEYQVDAIKKIIDYEYKIYSGPDKEQIADEINNLKN

KLEEKANKAMININIFMRESSRSFLVNQMINEAKKQLLEFDTQSKNILMQYIKANSKFIGKLEEKANKAMININIFMRESSRSFLVNQMINEAKKQLLEFDTQSKNILMQYIKANSKFIG

ITELKKLESKINKVFSTPIPFSYSKNLDCWVDNEEDIDVILKKSTILNLDINNDIISDISITELKKLESKINKVFSTPIPFSYSKNLDCWVDNEEDIDVILKKSTILNLDINNDIISDIS

GFNSSVITYPDAQLVPGINGKAIHLVNNESSEVIVHKAMDIEYNDMFNNFTVSFWLRVPKGFNSSVITYPDAQLVPGINGKAIHLVNNESSEVIVHKAMDIEYNDMFNNFTVSFWLRVPK

VSASHLEQYGTNEYSIISSMKKHSLSIGSGWSVSLKGNNLIWTLKDSAGEVRQITFRDLPVSASHLEQYGTNEYSIISSMKKHSLSIGSGWSVSLKGNNLIWTLKDSAGEVRQITFRDLP

DKFNAYLANKWVFITITNDRLSSANLYINGVLMGSAEITGLGAIREDNNITLKLDRCNNNDKFNAYLANKWVFITITNDRLSSANLYINGVLMGSAEITGLGAIREDNNITLKLDRCNNN

NQYVSIDKFRIFCKALNPKEIEKLYTSYLSITFLRDFWGNPLRYDTEYYLIPVASSSKDVNQYVSIDKFRIFCKALNPKEIEKLYTSYLSITFLRDFWGNPLRYDTEYYLIPVASSSKDV

QLKNITDYMYLTNAPSYTNGKLNIYYRRLYNGLKFIIKRYTPNNEIDSFVKSGDFIKLYVQLKNITDYMYLTNAPSYTNGKLNIYYRRLYNGLKFIIKRYTPNNEIDSFVKSGDFIKLYV

SYNNNEHIVGYPKDGNAFNNLDRILRVGYNAPGIPLYKKMEAVKLRDLKTYSVQLKLYDDSYNNNEHIVGYPKDGNAFNNLDRILRVGYNAPGIPLYKKMEAVKLRDLKTYSVQLKLYDD

KNASLGLVGTHNGQIGNDPNRDILIASNWYFNHLKDKILGCDWYFVPTDEGWTNDKNASLGLVGTHNGQIGNDPNRDILIASNWYFNHLKDKILGCDWYFVPTDEGWTND

SEQ ID NO: 26 - Полипептидная последовательность меченого полипептида EGF TMSEQ ID NO: 26 - Polypeptide sequence of labeled EGF TM polypeptide

*HHHHHHLAETGGSGGSGGSEFVNKQFNYKDPVNGVDIAYIKIPNAGQMQPVKAFKIHNKIWVIPERDTFTNPEEGDLNPPPEAKQVPVSYYDSTYLSTDNEKDNYLKGVTKLFERIYSTDLGRMLLTSIVRGIPFWGGSTIDTELKVIDTNCINVIQPDGSYRSEELNLVIIGPSADIIQFECKSFGHEVLNLTRNGYGSTQYIRFSPDFTFGFEESLEVDTNPLLGAGKFATDPAVTLAHELIHAGHRLYGIAINPNRVFKVNTNAYYEMSGLEVSFEELRTFGGHDAKFIDSLQENEFRLYYYNKFKDIASTLNKAKSIVGTTASLQYMKNVFKEKYLLSEDTSGKFSVDKLKFDKLYKMLTEIYTEDNFVKFFKVLNRKTYLNFDKAVFKINIVPKVNYTIYDGFNLRNTNLAANFNGQNTEINNMNFTKLKNFTGLFEFYKLLCVDGIITSKTKSLIEGRNKALNLQCIKVNNWDLFFSPSEDNFTNDLNKGEEITSDTNIEAAEENISLDLIQQYYLTFNFDNEPENISIENLSSDIIGQLELMPNIERFPNGKKYELDKYTMFHYLRAQEFEHGKSRIALTNSVNEALLNPSRVYTFFSSDYVKKVNKATEAAMFLGWVEQLVYDFTDETSEVSTTDKIADITIIIPYIGPALNIGNMLYKDDFVGALIFSGAVILLEFIPEIAIPVLGTFALVSYIANKVLTVQTIDNALSKRNEKWDEVYKYIVTNWLAKVNTQIDLIRKKMKEALENQAEATKAIINYQYNQYTEEEKNNINFNIDDLSSKLNESINKAMININKFLNQCSVSYLMNSMIPYGVKRLEDFDASLKDALLKYIYDNRGTLIGQVDRLKDKVNNTLSTDIPFQLSKYVDNQRLLSTLEGGGGSGGGGSGGGGSALDNSDPKCPLSHEGYCLNDGVCMYIGTLDRYACNCVVGYVGERCQYRDLKLAELRGLEAGGSGGGSGLPESGK†*HHHHHLAETGGSGGSGGSEFVNKQFNYKDPVNGVDIAYIKIPNAGQMQPVKAFKIHNKIWVIPERDTTFTNPEEGDLNPPPEAKQVPVSYYDSTYLSTDNEKDNYLKGVTKLFERIYSTDLGRMLLTSIVRGIPFWGGSTIDTELKVIDTNCINVIQPDGSYRSEELNLVIIGPSADIIQFECKSFGHEVLNLTRNGY GSTQYIRFSPDFTFGFEESLEVDTNPLLGAGKFATDPAVTLAHELIHAGHRLYGIAINPNRVFKVNTNAYYEMSGLEVSFEELRTFGGHDAKFIDSLQENEFRLYYYNKFKDIASTLNKAKSIVGTTASLQYMKNVFKEKYLLSEDTSGKFSVDKLKFDKLYKMLTEIYTEDNFVKFFKVLNRKTYLNFDKAV FKINIVPKVNYTIYDGFNLRNTNLAANFNGQNTEINNMNFTKLKNFTGLFEFYKLLCVDGIITSKTKSLIEGRNKALNLQCIKVNNWDLFFSPSEDNFTNDLNKGEEITSDTNIEAAEENISLDLIQQYYLTFNFDNEPENISIENLSSDIIGQLELMPNIERFPNGKKYELDKYTMFHYLRAQEFEHGKSRIALTNSVNEALLNP SRVYTFFSSDYVKKVNKATEAAMFLGWVEQLVYDFTDETSEVSTTDKIADITIIIPYIGPALNIGNMLYKDDFVGALIFSGAVILLEFIPEIAIPVLGTFALVSYIANKVLTVQTIDNALSKRNEKWDEVYKYIVTNWLAKVNTQIDLIRKKMKEALENQAEATKAIINYQYNQYTEEEKNNINFNIDDLSSKLNESINKAMININ KFLNQCSVSYLMNSMIPYGVKRLEDFDASLKDALLKYIYDNRGTLIGQVDRLKDKVNNTLSTDIPFQLSKYVDNQRLLSTLEGGGGSGGGGSGGGGSALDNSDPKCPLSHEGYCLNDGVCMYIGTLDRYACNCVVGYVGERCQYRDLKLAELRGLEAGGSGGGSGLPESGK†

* = HiLyte555; † = HiLyte488* = HiLyte555; †=HiLyte488

SEQ ID NO: 27 - Полипептидная последовательность бутелазы 1 C. ternatea 1 (плюс сигнальный пептид)SEQ ID NO: 27 - C. ternatea 1 butelase 1 polypeptide sequence (plus signal peptide)

MKNPLAILFLIATVVAVVSGIRDDFLRLPSQASKFFQADDNVEGTRWAVLVAGSKGYVNYMKNPLAILFLIATVVAVVSGIRDDFFLRLPSQASKFFQADDNVEGTRWAVLVAGSKGYVNY

RHQADVCHAYQILKKGGLKDENIIVFMYDDIAYNESNPHPGVIINHPYGSDVYKGVPKDYRHQADVCHAYQILKKGGLKDENIIVFMYDDIAYNESNPHPGVIINHPYGSDVYKGVPKDY

VGEDINPPNFYAVLLANKSALTGTGSGKVLDSGPNDHVFIYYTDHGGAGVLGMPSKPYIAVGEDINPPNFYAVLLANKSALTGTGTGSGKVLDSGPNDHVFIYYTDHGGAGVLGMPSKPYIA

ASDLNDVLKKKHASGTYKSIVFYVESCESGSMFDGLLPEDHNIYVMGASDTGESSWVTYCASDLNDVLKKKHASGTYKSIVFYVESCESGSMFDGLLPEDHNIYVMGASDTGESSWVTYC

PLQHPSPPPEYDVCVGDLFSVAWLEDCDVHNLQTETFQQQYEVVKNKTIVALIEDGTHVVPLQHPSPPPEYDVCVGDLFSVAWLEDCDVHNLQTETFQQQYEVVKNKTIVALIEDGTHVV

QYGDVGLSKQTLFVYMGTDPANDNNTFTDKNSLGTPRKAVSQRDADLIHYWEKYRRAPEGQYGDVGLSKQTLFVYMGTDPANDNNTFTDKNSLGTPRKAVSQRDADLIHYWEKYRRAPEG

SSRKAEAKKQLREVMAHRMHIDNSVKHIGKLLFGIEKGHKMLNNVRPAGLPVVDDWDCFKSSRKAEAKKQLREVMAHRMHIDNSVKHIGKLLFGIEKGHKMLNNVRPAGLPVVDDWDCFK

TLIRTFETHCGSLSEYGMKHMRSFANLCNAGIRKEQMAEASAQACVSIPDNPWSSLHAGFTLIRTFETHCGSLSEYGMKHMRSFANLCNAGIRKEQMAEASAQACVSIPDNPWSSLHAGF

SVSV

SEQ ID NO: 28 - Полипептидная последовательность бутелазы 1 C. ternatea (минус сигнальный пептид)SEQ ID NO: 28 - C. ternatea butelase 1 polypeptide sequence (minus signal peptide)

IRDDFLRLPSQASKFFQADDNVEGTRWAVLVAGSKGYVNYRHQADVCHAYQILKKGGLKDIRDDFLRLPSQASKFFQADDNVEGTRWAVLVAGSKGYVNYRHQADVCHAYQILKKGGLKD

ENIIVFMYDDIAYNESNPHPGVIINHPYGSDVYKGVPKDYVGEDINPPNFYAVLLANKSAENIIVFMYDDIAYNESNPHPGVIINHPYGSDVYKGVPKDYVGEDINPPNFYAVLLANKSA

LTGTGSGKVLDSGPNDHVFIYYTDHGGAGVLGMPSKPYIAASDLNDVLKKKHASGTYKSILTGTGSGKVLDSGPNDHVFIYYTDHGGAGVLGMPSKPYIAASDLNDVLKKKHASGTYKSI

VFYVESCESGSMFDGLLPEDHNIYVMGASDTGESSWVTYCPLQHPSPPPEYDVCVGDLFSVFYVESCESGSMFDGLLPEDHNIYVMGASDTGESSWVTYCPLQHPSPPPEYDVCVGDLFS

VAWLEDCDVHNLQTETFQQQYEVVKNKTIVALIEDGTHVVQYGDVGLSKQTLFVYMGTDPVAWLEDCDVHNLQTETFQQQYEVVKNKTIVALIEDGTHVVQYGDVGLSKQTLFVYMGTDP

ANDNNTFTDKNSLGTPRKAVSQRDADLIHYWEKYRRAPEGSSRKAEAKKQLREVMAHRMHANDNNTFTDKNSLGTPRKAVSQRDADLIHYWEKYRRAPEGSSRKAEAKKQLREVMAHRMH

IDNSVKHIGKLLFGIEKGHKMLNNVRPAGLPVVDDWDCFKTLIRTFETHCGSLSEYGMKHIDNSVKHIGKLLFGIEKGHKMLNNVRPAGLPVVDDWDCFKTLIRTFETHCGSLSEYGMKH

MRSFANLCNAGIRKEQMAEASAQACVSIPDNPWSSLHAGFSVMRSFANLCNAGIRKEQMAEASAQACVSIPDNPWSSLHAGFSV

SEQ ID NO: 29 - Пептид с конъюгированной поддающейся детекции меткой и донорным участком для сортазыSEQ ID NO: 29 - Peptide with conjugated detectable label and sortase donor site

GGGGK†GGGGK†

† = HiLyte488†=HiLyte488

SEQ ID NO: 30 - Пептид с конъюгированной поддающейся детекции меткой и акцепторным участком для сортазыSEQ ID NO: 30 - Peptide with conjugated detectable label and acceptor site for sortase

*HHHHHHLAETGGG*HHHHHHLAETGGG

* = HiLyte555*=HiLyte555

SEQ ID NO: 31 - Полипептидная последовательность сортазы A Staphylococcus aureusSEQ ID NO: 31 - Staphylococcus aureus sortase A polypeptide sequence

MKKWTNRLMTIAGVVLILVAAYLFAKPHIDNYLHDKDKDEKIEQYDKNVKEQASKDKKQQMKKWTNRLMTIAGVVLILVAAYLFAKPHIDNYLHDKDKDEKIEQYDKNVKEQASKDKKQQ

AKPQIPKDKSKVAGYIEIPDADIKEPVYPGPATPEQLNRGVSFAEENESLDDQNISIAGHAKPQIPKDKSKVAGYIEIPDADIKEPVYPGPATPEQLNRGVSFAEENESLDDQNISIAGH

TFIDRPNYQFTNLKAAKKGSMVYFKVGNETRKYKMTSIRDVKPTDVGVLDEQKGKDKQLTTFIDRPNYQFTNLKAAKKGSMVYFKVGNETRKYKMTSIRDVKPTDVGVLDEQKGKDKQLT

LITCDDYNEKTGVWEKRKIFVATEVKLITCDDYNEKTGVWEKRKIFVATEVK

SEQ ID NO: 32 - Полипептидная последовательность сортазы B Staphylococcus aureusSEQ ID NO: 32 - Staphylococcus aureus sortase B polypeptide sequence

MRMKRFLTIVQILLVVIIIIFGYKIVQTYIEDKQERANYEKLQQKFQMLMSKHQEHVRPQMRMKRFLTIVQILLVVIIIIFGYKIVQTYIEDKQERANYEKLQQKFQMLMSKHQEHVRPQ

FESLEKINKDIVGWIKLSGTSLNYPVLQGKTNHDYLNLDFEREHRRKGSIFMDFRNELKNFESLEKINKDIVGWIKLSGTSLNYPVLQGKTNHDYLNLDFEREHRRKGSIFMDFRNELKN

LNHNTILYGHHVGDNTMFDVLEDYLKQSFYEKHKIIEFDNKYGKYQLQVFSAYKTTTKDNLNHNTILYGHHVGDNTMFDVLEDYLKQSFYEKHKIIEFDNKYGKYQLQVFSAYKTTTKDN

YIRTDFENDQDYQQFLDETKRKSVINSDVNVTVKDRIMTLSTCEDAYSETTKRIVVVAKIYIRTDFENDQDYQQFLDETKRKSVINSDVNVTVKDRIMTLSTCEDAYSETTKRIVVVAKI

IKVSIKVS

SEQ ID NO: 33 - Полипептидная последовательность сортазы A Streptococcus pneumoniaeSEQ ID NO: 33 - Streptococcus pneumoniae sortase A polypeptide sequence

MEKLYIHLKNLRKVAVVMLLVFTTFYLLLMFLNQSDNQEIAKNIEKFNDSVIVAKTDNTKMEKLYIHLKNLRKVAVVMLLVFTTFYLLLMFLNQSDNQEIAKNIEKFNDSVIVAKTDNTK

ADIKEIEKNIEKVRKIEGGNVERVNQLTSENEKVKENIDLNIEEEIIENSYKSLETTDNFADIKEIEKNIEKVRKIEGGNVERVNQLTSENEKVKENIDLNIEEEEIIENSYKSLETTDNF

EKLGIIEIPKIDLNLSIFKGKPFVNTKNRQDTMLYGAVTNKKNQKMGRENYVLASHIISNEKLGIIEIPKIDLNLSIFKGKPFVNTKNRQDTMLYGAVTNKKNQKMGRENYVLASHIISN

SNLLFTSINQLEKGDVITLKDSEYSYQYTVYNNFIVSKDETWILNDIKDYSILTLYTCYDSNLLFTSINQLEKGDVITLKDSEYSYQYTVYNNFIVSKDETWILNDIKDYSILTLYTCYD

DSTKLPENRVVIRAVLTDINDSTKLPENRVVIRAVLTDIN

SEQ ID NO: 34 - Полипептидная последовательность сортазы B Streptococcus pneumoniaeSEQ ID NO: 34 - Streptococcus pneumoniae sortase B polypeptide sequence

MAKTKKQKRNNLLLGVVFFIGXAVMAYPLVSRLYYRVESNQQIADFDKEKATLDEADIDEMAKTKKQKRNNLLLGVVFFIGXAVMAYPLVSRLYYRVESNQQIADFDKEKATLDEADIDE

RMKLAQAFNDSLNNVVSGDPWSEEMKKKGRAEYARMLEIHERMGHVEIPAIDVDLPVYAGRMKLAQAFNDSLNNVVSGDPWSEEMKKKGRAEYARMLEIHERMGHVEIPAIDVDLPVYAG

TAEEVLQQGAGHLEGTSLPIGGNSTHAVITAHTGLPTAKMFTDLTKLKVGDKFYVHNIKETAEEVLQQGAGHLEGTSLPIGGNSTHAVITAHTGLPTAKMFTDLTKLKVGDKFYVHNIKE

VMAYQVDQVKVIEPTNFDDLLIVPGHDYVTLLTCTPYMINTHRLLVRGHRIPYVAEVEEEVMAYQVDQVKVIEPTNFDDLLIVPGHDYVTLLTTCTPYMINTHRLLVRGHRIPYVAEVEEE

FIAANKLSHLYRYLFYVAVGLIVILLWIIRRLRKKKRQSERALKALKEATKEVKVEDEFIAANKLSHLYRYLFYVAVGLIVILLWIIRRLRKKKRQSERALKALKEATKEVKVEDE

где X представляет собой Met или Ile.where X is Met or Ile.

SEQ ID NO: 35 - Полипептидная последовательность сортазы C Streptococcus pneumoniaeSEQ ID NO: 35 - Streptococcus pneumoniae sortase C polypeptide sequence

MDNSRRSRKKGTKKKKHPLILLLIFLVGFAVAIYPLVSRYYYRIESNEVIKEFDETVSQMMDNSRRSRKKGTKKKKHPLILLLIFLVGFAVAIYPLVSRYYYRIESNEVIKEFDETVSQM

DKAELEERWRLAQAFNATLKPSEILDPFTEQEKKKGVSEYANMLKVHERIGYVEIPAIDQDKAELEERWRLAQAFNATLKPSEILDPFTEQEKKKGVSEYANMLKVHERIGYVEIPAIDQ

EIPMYVGTSEDILQKGAGLLEGASLPVGGKNTHTVITAHRGLPTAELFSQLDKMKKGDIFEIPMYVGTSEDILQKGAGLLEGASLPVGGKNTHTVITAHRGLPTAELFSQLDKMKKGDIF

YLHVLDQVLAYQVDQIVTVEPNDFEPVLIQHGEDYATLLTCTPYMINSHRLLVRGKRIPYYLHVLDQVLAYQVDQIVTVEPNDFEPVLIQHGEDYATLLTCTPYMINSHRLLVRGKRIPY

TAPIAERNRAVRERGQFWLWLLLGAMAVILLLLYRVYRNRRIVKGLEKQLEGRHVKDTAPIAERNRAVRERGQFWLWLLLGAMAVILLLLYRVYRNRRIVKGLEKQLEGRHVKD

SEQ ID NO: 36 - Полипептидная последовательность сортазы D Streptococcus pneumoniaeSEQ ID NO: 36 - Streptococcus pneumoniae sortase D polypeptide sequence

MSRTKLRALLGYLLMLVACLIPIYCFGQMVLQSLGQVKGHATFVKSMTTEMYQEQQNHSLMSRTKLRALLGYLLMLVACLIPIYCFGQMVLQSLGQVKGHATFVKSMTTEMYQEQQNHSL

AYNQRLASQNRIVDPFLAEGYEVNYQVSDDPDAVYGYLSIPSLEIMEPVYLGADYHHLGMAYNQRLASQNRIVDPFLAEGYEVNYQVSDDPDAVYGYLSIPSLEIMEPVYLGADYHHLGM

GLAHVDGTPLPMDGTGIRSVIAGHRAEPSHVFFRHLDQLKVGDALYYDNGQEIVEYQMMDGLAHVDGTPLPMDGTGIRSVIAGHRAEPSHVFFRHLDQLKVGDALYYDNGQEIVEYQMMD

TEIILPSEWEKLESVSSKNIMTLITCDPIPTFNKRLLVNFERVAVYQKSDPQTAAVARVATEIILPSEWEKLESVSSKNIMTLITCDPIPTFNKRLLVNFERVAVYQKSDPQTAAVARVA

FTKEGQSVSRVATSQWLYRGLVVLAFLGILFVLWKLARLLRGKFTKEGQSVSRVATSQWLYRGLVVLAFLGILFVLWKLARLLRGK

SEQ ID NO: 37 - Полипептидная последовательность сортазы A Streptococcus pyogenesSEQ ID NO: 37 - Streptococcus pyogenes sortase A polypeptide sequence

MVKKQKRRKIKSMSWARKLLIAVLLILGLALLFNKPIRNTLIARNSNKYQVTKVSKKQIKMVKKQKRRKIKSMSWARKLLIAVLLILGLALLFNKPIRNTLIARNSNKYQVTKVSKKQIK

KNKEAKSTFDFQAVEPVSTESVLQAQMAAQQLPVIGGIAIPELGINLPIFKGLGNTELIYKNKEAKSTFDFQAVEPVSTESVLQAQMAAQQLPVIGGIAIPELGINLPIFKGLGNTELIY

GAGTMKEEQVMGGENNYSLASHHIFGITGSSQMLFSPLERAQNGMSIYLTDKEKIYEYIIGAGTMKEEQVMGGENNYSLASHHIFGITGSSQMLFSPLERAQNGMSIYLTDKEKIYEYII

KDVFTVAPERVDVIDDTAGLKEVTLVTCTDIEATERIIVKGELKTEYDFDKAPADVLKAFKDVFTVAPERVDVIDDTAGLKEVTLVTCTDIEATERIIVKGELKTEYDFDKAPADVLKAF

NHSYNQVSTNHSYNQVST

SEQ ID NO: 38 - Полипептидная последовательность протеолитически неактивного мутанта BoNT/A(0)SEQ ID NO: 38 - Polypeptide sequence of the proteolytically inactive BoNT/A(0) mutant

MPFVNKQFNYKDPVNGVDIAYIKIPNAGQMQPVKAFKIHNKIWVIPERDTFTNPEEGDLNPPPEAKQVPVSYYDSTYLSTDNEKDNYLKGVTKLFERIYSTDLGRMLLTSIVRGIPFWGGSTIDTELKVIDTNCINVIQPDGSYRSEELNLVIIGPSADIIQFECKSFGHEVLNLTRNGYGSTQYIRFSPDFTFGFEESLEVDTNPLLGAGKFATDPAVTLAHQLIYAGHRLYGIAINPNRVFKVNTNAYYEMSGLEVSFEELRTFGGHDAKFIDSLQENEFRLYYYNKFKDIASTLNKAKSIVGTTASLQYMKNVFKEKYLLSEDTSGKFSVDKLKFDKLYKMLTEIYTEDNFVKFFKVLNRKTYLNFDKAVFKINIVPKVNYTIYDGFNLRNTNLAANFNGQNTEINNMNFTKLKNFTGLFEFYKLLCVRGIITSKTKSLDKGYNKALNDLCIKVNNWDLFFSPSEDNFTNDLNKGEEITSDTNIEAAEENISLDLIQQYYLTFNFDNEPENISIENLSSDIIGQLELMPNIERFPNGKKYELDKYTMFHYLRAQEFEHGKSRIALTNSVNEALLNPSRVYTFFSSDYVKKVNKATEAAMFLGWVEQLVYDFTDETSEVSTTDKIADITIIIPYIGPALNIGNMLYKDDFVGALIFSGAVILLEFIPEIAIPVLGTFALVSYIANKVLTVQTIDNALSKRNEKWDEVYKYIVTNWLAKVNTQIDLIRKKMKEALENQAEATKAIINYQYNQYTEEEKNNINFNIDDLSSKLNESINKAMININKFLNQCSVSYLMNSMIPYGVKRLEDFDASLKDALLKYIYDNRGTLIGQVDRLKDKVNNTLSTDIPFQLSKYVDNQRLLSTFTEYIKNIINTSILNLRYESNHLIDLSRYASKINIGSKVNFDPIDKNQIQLFNLESSKIEVILKNAIVYNSMYENFSTSFWIRIPKYFNSISLNNEYTIINCMENNSGWKVSLNYGEIIWTLQDTQEIKQRVVFKYSQMINISDYINRWIFVTITNNRLNNSKIYINGRLIDQKPISNLGNIHASNNIMFKLDGCRDTHRYIWIKYFNLFDKELNEKEIKDLYDNQSNSGILKDFWGDYLQYDKPYYMLNLYDPNKYVDVNNVGIRGYMYLKGPRGSVMTTNIYLNSSLYRGTKFIIKKYASGNKDNIVRNNDRVYINVVVKNKEYRLATNASQAGVEKILSALEIPDVGNLSQVVVMKSKNDQGITNKCKMNLQDNNGNDIGFIGFHQFNNIAKLVASNWYNRQIERSSRTLGCSWEFIPVDDGWGERPLMPFVNKQFNYKDPVNGVDIAYIKIPNAGQMQPVKAFKIHNKIWVIPERDTFTNPEEGDLNPPPEAKQVPVSYYDSTYLSTDNEKDNYLKGVTKLFERIYSTDLGRMLLTSIVRGIPFWGGSTIDTELKVIDTNCINVIQPDGSYRSEELNLVIIGPSADIIQFECKSFGHEVLNLTRNGYGSTQYIRFSPDFTFGFEESLEV DTNPLLGAGKFATDPAVTLAHQLIYAGHRLYGIAINPNRVFKVNTNAYYEMSGLEVSFEELRTFGGHDAKFIDSLQENEFRLYYYNKFKDIASTLNKAKSIVGTTASLQYMKNVFKEKYLLSEDTSGKFSVDKLKFDKLYKMLTEIYTEDNFVKFFKVLNRKTYLNFDKAVFKINIVPKVNYTIYDGFN LRNTNLAANFNGQNTEINNMNFTKLKNFTGLFEFYKLLCVRGIITSKTKSLDKGYNKALNDLCIKVNNWDLFFSPSEDNFTNDLNKGEEITSDTNIEAAEENISLDLIQQYYLTFNFDNEPENISIENLSSDIIGQLELMPNIERFPNGKKYELDKYTMFHYLRAQEFEHGKSRIALTNSVNEALLNPSRVYTFFSSDYVKKVNKATE AAMFLGWVEQLVYDFTDETSEVSTTDKIADITIIIPYIGPALNIGNMLYKDDFVGALIFSGAVILLEFIPEIAIPVLGTFALVSYIANKVLTVQTIDNALSKRNEKWDEVYKYIVTNWLAKVNTQIDLIRKKMKEALENQAEATKAIINYQYNQYTEEEKNNINFNIDDLSSKLNESINKAMININKFLNQCSVSYLMNSMIPYG VKRLEDFDASLKDALLKYIYDNRGTLIGQVDRLKDKVNNTLSTDIPFQLSKYVDNQRLLSTFTEYIKNIINTSILNLRYESNHLIDLSRYASKINIGSKVNFDPIDKNQIQLFNLESSKIEVILKNAIVYNSMYENFSTSFWIRIPKYFNSISLNNEYTIINCMENNSGWKVSLNYGEIIWTLQDTQEIKQRVVFKYSQ MINISDYINRWIFVTITNNRLNNSKIYINGRLIDQKPISNLGNIHASNNIMFKLDGCRDTHRYIWIKYFNLFDKELNEKEIKDLYDNQSNSGILKDFWGDYLQYDKPYYMLNLYDPNKYVDVNNVGIRGYMYLKGPPRGSVMTTNIYLNSSLYRGTKFIIKKYASGNKDNIVRNNDRVYINVVVKNKEYRLATNASQAGVE KILSALEIPDVGNLSQVVVMKSKNDQGITNKCKMNLQDNNGNDIGFIGFHQFNNIAKLVASNWYNRQIERSSRTLGCSWEFIPVDDGWGERPL

SEQ ID NO: 39 - Нуклеотидная последовательность полноразмерного протеолитически неактивного мутанта BoNT/A(0) с участками двукратного мечения посредством SrtASEQ ID NO: 39 - Nucleotide sequence of full-length proteolytically inactive BoNT/A(0) mutant with SrtA double-labeled sites

ATGGAGAACCTGTATTTTCAGGGCGGCGGTGGCAGCGGCGGCAGCGGCGGCAGCCCGTTTGTGAACAAGCAGTTCAACTATAAAGATCCGGTTAATGGTGTGGATATCGCCTATATCAAAATTCCGAATGCAGGTCAGATGCAGCCGGTTAAAGCCTTTAAAATCCATAACAAAATTTGGGTGATTCCGGAACGTGATACCTTTACCAATCCGGAAGAAGGTGATCTGAATCCGCCTCCGGAAGCAAAACAGGTTCCGGTTAGCTATTATGATAGCACCTATCTGAGCACCGATAACGAGAAAGATAACTATCTGAAAGGTGTGACCAAACTGTTTGAACGCATTTATAGTACCGATCTGGGTCGTATGCTGCTGACCAGCATTGTTCGTGGTATTCCGTTTTGGGGTGGTAGCACCATTGATACCGAACTGAAAGTTATTGACACCAACTGCATTAATGTGATTCAGCCGGATGGTAGCTATCGTAGCGAAGAACTGAATCTGGTTATTATTGGTCCGAGCGCAGATATCATTCAGTTTGAATGTAAAAGCTTTGGCCACGAAGTTCTGAATCTGACCCGTAATGGTTATGGTAGTACCCAGTATATTCGTTTCAGTCCGGATTTTACCTTTGGCTTTGAAGAAAGCCTGGAAGTTGATACAAATCCGCTGTTAGGTGCAGGTAAATTTGCAACCGATCCGGCAGTTACCCTGGCACACCAGCTGATTTATGCCGGTCATCGTCTGTATGGTATTGCCATTAATCCGAATCGTGTGTTCAAAGTGAATACCAACGCCTATTATGAAATGAGCGGTCTGGAAGTGAGTTTTGAAGAACTGCGTACCTTTGGTGGTCATGATGCCAAATTTATCGATAGCCTGCAAGAAAATGAATTTCGCCTGTACTACTATAACAAATTCAAGGATATTGCGAGCACCCTGAATAAAGCCAAAAGCATTGTTGGCACCACCGCAAGCCTGCAGTATATGAAAAATGTGTTTAAAGAAAAATATCTGCTGAGCGAAGATACCAGCGGTAAATTTAGCGTTGACAAACTGAAATTCGATAAACTGTACAAGATGCTGACCGAGATTTATACCGAAGATAACTTCGTGAAGTTTTTCAAAGTGCTGAACCGCAAAACCTACCTGAACTTTGATAAAGCCGTGTTCAAAATCAACATCGTGCCGAAAGTGAACTATACCATCTATGATGGTTTTAACCTGCGCAATACCAATCTGGCAGCAAACTTTAATGGTCAGAACACCGAAATCAACAACATGAACTTTACCAAACTGAAGAACTTCACCGGTCTGTTCGAATTTTACAAACTGCTGTGTGTTCGTGGCATTATTACCAGCAAAACCAAAAGTCTGGATAAAGGCTACAATAAAGCCCTGAATGATCTGTGCATTAAGGTGAATAATTGGGACCTGTTTTTTAGCCCGAGCGAGGATAATTTCACCAACGATCTGAACAAAGGCGAAGAAATTACCAGCGATACCAATATTGAAGCAGCCGAAGAAAACATTAGCCTGGATCTGATTCAGCAGTATTATCTGACCTTCAACTTCGATAATGAGCCGGAAAATATCAGCATTGAAAACCTGAGCAGCGATATTATTGGCCAGCTGGAACTGATGCCGAATATTGAACGTTTTCCGAACGGCAAAAAATACGAGCTGGATAAATACACCATGTTCCATTATCTGCGTGCCCAAGAATTTGAACATGGTAAAAGCCGTATTGCACTGACCAATAGCGTTAATGAAGCACTGCTGAACCCGAGCCGTGTTTATACCTTTTTTAGCAGCGATTACGTGAAAAAGGTTAACAAAGCAACCGAAGCAGCCATGTTTTTAGGTTGGGTTGAACAGCTGGTTTATGATTTCACCGATGAAACCAGCGAAGTTAGCACCACCGATAAAATTGCAGATATTACCATCATCATCCCGTATATCGGTCCGGCACTGAATATTGGCAATATGCTGTATAAAGACGATTTTGTGGGTGCCCTGATTTTTAGCGGTGCAGTTATTCTGCTGGAATTTATTCCGGAAATTGCCATTCCGGTTCTGGGCACCTTTGCACTGGTGAGCTATATTGCAAATAAAGTTCTGACCGTGCAGACCATCGATAATGCACTGAGCAAACGTAACGAAAAATGGGATGAAGTGTACAAGTATATCGTGACCAATTGGCTGGCAAAAGTTAACACCCAGATTGACCTGATTCGCAAGAAGATGAAAGAAGCACTGGAAAATCAGGCAGAAGCAACCAAAGCCATTATCAACTATCAGTATAACCAGTACACCGAAGAAGAGAAAAATAACATCAACTTCAACATCGACGATCTGTCCAGCAAACTGAACGAAAGCATCAACAAAGCCATGATTAACATTAACAAATTTCTGAACCAGTGCAGCGTGAGCTATCTGATGAATAGCATGATTCCGTATGGTGTGAAACGTCTGGAAGATTTTGATGCAAGCCTGAAAGATGCCCTGCTGAAATATATCTATGATAATCGTGGCACCCTGATTGGTCAGGTTGATCGTCTGAAAGATAAAGTGAACAACACCCTGAGTACCGATATTCCTTTTCAGCTGAGCAAATATGTGGATAATCAGCGTCTGCTGTCAACCTTTACCGAATACATTAAGAACATCATCAACACCAGCATTCTGAACCTGCGTTATGAAAGCAATCATCTGATTGATCTGAGCCGTTATGCCAGCAAAATCAATATAGGCAGCAAGGTTAACTTCGACCCGATTGACAAAAATCAGATACAGCTGTTTAATCTGGAAAGCAGCAAAATTGAGGTGATCCTGAAAAACGCCATTGTGTATAATAGCATGTACGAGAATTTCTCGACCAGCTTTTGGATTCGTATCCCGAAATACTTTAATAGCATCAGCCTGAACAACGAGTACACCATTATTAACTGCATGGAAAACAATAGCGGCTGGAAAGTTAGCCTGAATTATGGCGAAATTATCTGGACCCTGCAGGATACCCAAGAAATCAAACAGCGTGTGGTTTTCAAATACAGCCAGATGATTAATATCAGCGACTATATCAACCGCTGGATTTTTGTGACCATTACCAATAATCGCCTGAATAACAGCAAGATCTATATTAACGGTCGTCTGATTGACCAGAAACCGATTAGTAATCTGGGTAATATTCATGCGAGCAACAACATCATGTTTAAACTGGATGGTTGTCGTGATACCCATCGTTATATTTGGATCAAGTACTTCAACCTGTTCGATAAAGAGTTGAACGAAAAAGAAATTAAAGACCTGTATGATAACCAGAGCAACAGCGGTATTCTGAAGGATTTTTGGGGAGATTATCTGCAGTATGACAAACCGTATTATATGCTGAATCTGTACGACCCGAATAAATACGTGGATGTGAATAATGTTGGCATCCGTGGTTATATGTACCTGAAAGGTCCGCGTGGTAGCGTTATGACCACAAACATTTATCTGAATAGCAGCCTGTATCGCGGAACCAAATTCATCATTAAAAAGTATGCCAGCGGCAACAAGGATAATATTGTGCGTAATAATGATCGCGTGTACATTAACGTTGTGGTGAAGAATAAAGAATATCGCCTGGCAACCAATGCAAGCCAGGCAGGCGTTGAAAAAATTCTGAGTGCCCTGGAAATTCCGGATGTTGGTAATCTGAGCCAGGTTGTTGTGATGAAAAGCAAAAATGATCAGGGCATCACCAACAAGTGCAAAATGAATCTGCAGGACAATAACGGCAACGATATTGGTTTTATTGGCTTCCACCAGTTCAACAATATTGCGAAACTGGTTGCAAGCAATTGGTATAATCGTCAGATTGAACGTAGCAGTCGTACCCTGGGTTGTAGCTGGGAATTTATCCCTGTGGATGATGGTTGGGGTGAACGTCCGCTGGGCGGCAGCGGCGGCGGCAGCGGCCTGCCCGAAAGCGGTGGCGGATCTGCTTGGTCTCACCCGCAGTTCGAAAAAGGTGGTGGTTCTGGTGGTGGTTCTGGTGGTTCTGCTTGGTCTCACCCGCAGTTCGAAAAATAATGAATGGAGAACCTGTATTTCAGGGCGGCGGTGGCAGCGGCGGCAGCGGCGCAGCCCGTTTGTGAACAAGCAGTTCAACTATAAAGATCCGGTTAATGGTGTGGATATCGCCTATATCAAAATTCCGAATGCAGGTCAGATGCAGCCGGTTAAAGCCTTTAAAATCCATAACAAAATTTGGGTGATTCCGGAACGTGATACCTTTACCAATCCGGAAGAAGGTGATCTGA ATCCGCCTCCGGAAGCAAAACAGGTTCCGGTTAGCTATTATGATAGCACCTATCTGAGCACCGATAACGAGAAAGATAACTATCTGAAAGGTGTGACCAAACTGTTTGAACGCATTTATAGTACCGATCTGGGTCGTATGCTGCTGACCAGCATTGTTCGTGGTATTCCGTTTTGGGGTGGTAGCACCATTGATACCGAACTGAAAGTTATTGACACCAACTGCATTAATGTGAT TCAGCGGATGGTAGCTATCGTAGCGAAGAACTGAATCTGGTTATTATTGGTCCGAGCGCAGATATCATTCAGTTTGAATGTAAAAGCTTTGGCCACGAAGTTCTGAATCTGACCCGTAATGGTTATGGTAGTACCCAGTATATTCGTTTCAGTCCGGATTTTACCTTTGGCTTTTGAAGAAAGCCTGGAAGTTGATACAAATCCGCTGTTAGGTGCAGGTAAAT TTGCAACCGATCCGGCAGTTACCCTGGCACACCAGCTGATTTATGCCGGTCATCGTCTGTATGGTATTGCCATTAATCCGAATCGTGTGTTCAAAGTGAATACCAACGCCTATTATGAAATGAGCGGTCTGGAAGTGAGTTTTGAAGAACTGCGTACCTTTGGTGGTCATGATGCCAAATTTATCGATAGCCTGCAAGAAAATGAATTTCGCCTGTACTATAACAAATTCAAGGATATT GCGAGCACCCTGAATAAAGCCAAAAGCATTGTTGGCACCACCGCAAGCCTGCAGTATATGAAAAATGTGTTTAAAGAAAATATCTGCTGAGCGAAGATACCAGCGGTAAATTTAGCGTTGACAAACTGAAATTCGATAAACTGTACAAGATGCTGACCGAGATTTATACCGAAGATAACTTCGTGAAGTTTTTCAAAGTGCTGAACCGCAAAACCTACCTGAACTTTGATAAAGCCGTGTTCAAA ATCAACATCGTGCCGAAAGTGAACTATACCATCTATGATGGTTTTAACCTGCGCAATACCAATCTGGCAGCAAACTTTAATGGTCAGAACACCGAAATCAACAACATGAACTTTACCAAACTGAAGAACTTCACCGGTCTGTTCGAATTTTACAAACTGCTGTGTGTTCGTGGCATTATTACCAGCAAAACCAAAAGTCTGGATAAAGGCTACAATAAAGCCCTGAATGATCTGTGCATTAAGG TGAATAATTGGGACCTGTTTTTTAGCCCGAGCGAGGATAATTTCACCAACGATCTGAACAAAGGCGAAGAAATTACCAGCGATACCAATATTGAAGCAGCCGAAGAAAACATTAGCCTGGATCTGATTCAGCAGTATTATCTGACCTTCAACTTCGATAATGAGCCGGAAAATATCAGCATTGAAAACCTGAGCAGCGATATTATTGGCCAGCTGGAACTGATGCCGAATATTGAACGTTTTCCGAAC GGCAAAAAATACGAGCTGGATAAATACACCATGTTCCATTATCTGCGTGCCCAAGAATTTGAACATGGTAAAAGCCGTATTGCACTGACCAATAGCGTTAATGAAGCACTGCTGAACCCGAGCCGTGTTTATACCTTTTTTAGCAGCGATTACGTGAAAAAGGTTAACAAAGCAACCGAAGCAGCCATGTTTTAGGTTGGGTTGAACAGCTGGTTTATGATTTCACCGATG AAACCAGCGAAGTTAGCACCACCGATAAAATTGCAGATATTACCATCATCATCCCGTATATCGGTCCGGCACTGAATATTGGCAATATGCTGTATAAAGACGATTTTGTGGGTGCCCTGATTTTTTAGCGGTGCAGTTATTCTGCTGGAATTTATTCCGGAAATTGCCATTCCGGTTCTGGGCACCTTTGCACTGGTGAGCTATATTGCAAATAAAGTTCTGACCGTGCAGACCATCGATA ATGCACTGAGCAAACGTAACGAAAAATGGGATGAAGTGTACAAGTATATCGTGACCAATTGGCTGGCAAAAGTTAACACCCAGATTGACCTGATTCGCAAGAAGATGAAAGAAGCACTGGAAAATCAGGCAGAAGCAACCAAAGCCATTATCAACTATCAGTATAACCAGTACACCGAAGAAGAGAAAAATAACATCAACTTCAACATCGACGATCTGTCCAGCAAACTGAACGAAAGCAT CAACAAAGCCATGATTAACATTAACAAATTTCTGAACCAGTGCAGCGTGAGCTATCTGATGAATAGCATGATTCCGTATGGTGTGTGAAACGTCTGGAAGATTTTGATGCAAGCCTGAAAGATGCCCTGCTGAAATATATCTATGATAATCGTGGCACCCTGATTGGTCAGGTTGATCGTCTGAAAGATAAAGTGAACAACACCCTGAGTACCGATATTCCCTTTTCAGCTGAGCAAATATGTG GATAATCAGCGTCTGCTGTCAACCTTTACCGAATACATTAAGAACATCATCAACACAGCATTCTGAACCTGCGTTATGAAAGCAATCATCTGATTGATCTGAGCCGTTATGCCAGCAAAATCAATATAGGCAGCAAGGTTAACTTCGACCCGATTGACAAAAATCAGATACAGCTGTTTAATCTGGAAAGCAGCAAAATTGAGGTGATCCTGAAAAACGCCATTGTGTATAATAGCATGTACG AGAATTTCTCGACCAGCTTTTGGATTCGTATCCCGAAATACTTTAATAGCATCAGCCTGAACAACGAGTACACCATTATTAACTGCATGGAAAACAATAGCGGCTGGAAAGTTAGCCCTGAATTATGGCGAAATTATCTGGACCCTGCAGGATACCCAAGAAATCAAAACAGCGTGTGGTTTTCAAATACAGCCAGATGATTAATATCAGCGACTATATCAACCGCTGGATTTTTGTGACCATTA CCAATAATCGCCTGAATAACAGCAAGATCTATATTAACGGTCGTCTGATTGACCAGAAACCGATTAGTAATCTGGGTAATATTCATGCGAGCAACAACATCATGTTTAAACTGGATGGTTGTCGTGATACCCATCGTTATATTTGGATCAAGTACTTCAACCTGTTCGATAAAAGTTGAACGAAAAAGAAATTAAAGACCTGTATGATAACCAGAAGCAACAGCGGTATTCTGAAGGATT TTTGGGGAGATTATCTGCAGTATGACAAACCGTATTATATGCTGAATCTGTACGACCCGAATAAATACGTGGATGTGAATAATGTTGGCATCCGTGGTTATATGTACCTGAAAGGTCCGCGTGGTAGCGTTATGACCACAAACATTTATCTGAATAGCAGCCTGTATCGCGGAACCAAATTCATCATTAAAAAGTATGCCAGCGGCAACAAGGATAATATTGTGCGTAATAATGATCGCG TGTACATTAACGTTGTGGTGAAGAATAAAGAATATCGCCTGGCAACCAATGCAAGCCAGGCAGGCGTTGAAAAAATTCTGAGTGCCCTGGAAATTCCGGATGTTGGTAATCTGAGCCAGGTTGTTGTGATGAAAAGCAAAAATGATCAGGCATCACCAACAAGTGCAAAATGAATCTGCAGGACAATAACGGCAACGATATTGGTTTTATTGGCTTCCACCAGTTCAACA ATATTGCGAAACTGGTTGCAAGCAATTGGTATAATCGTCAGATTGAACGTAGCAGTCGTACCCTGGGTTGTAGCTGGGAATTTATCCCTGTGTGGATGATGGTTGGGGTGAACGTCCGCTGGGCGGCAGCGGCGGCGGCAGCGGCCTGCCCGAAACGGTGGCGGATCTGCTTGGTCTCACCCGCAGTTCGAAAAAGGTGGTGGTTCTGGTGGTGG TTCTGGTGGTTCTGCTTGGTCTCACCCGCAGTTCGAAAAATAATGA

SEQ ID NO: 40 - Полипептидная последовательность полноразмерного протеолитически неактивного мутанта BoNT/A(0) с участками двукратного мечения посредством SrtASEQ ID NO: 40 - Polypeptide sequence of full length proteolytically inactive BoNT/A(0) mutant with SrtA double tagged sites

MENLYFQGGGGSGGSGGSPFVNKQFNYKDPVNGVDIAYIKIPNAGQMQPVKAFKIHNKIWVIPERDTFTNPEEGDLNPPPEAKQVPVSYYDSTYLSTDNEKDNYLKGVTKLFERIYSTDLGRMLLTSIVRGIPFWGGSTIDTELKVIDTNCINVIQPDGSYRSEELNLVIIGPSADIIQFECKSFGHEVLNLTRNGYGSTQYIRFSPDFTFGFEESLEVDTNPLLGAGKFATDPAVTLAHQLIYAGHRLYGIAINPNRVFKVNTNAYYEMSGLEVSFEELRTFGGHDAKFIDSLQENEFRLYYYNKFKDIASTLNKAKSIVGTTASLQYMKNVFKEKYLLSEDTSGKFSVDKLKFDKLYKMLTEIYTEDNFVKFFKVLNRKTYLNFDKAVFKINIVPKVNYTIYDGFNLRNTNLAANFNGQNTEINNMNFTKLKNFTGLFEFYKLLCVRGIITSKTKSLDKGYNKALNDLCIKVNNWDLFFSPSEDNFTNDLNKGEEITSDTNIEAAEENISLDLIQQYYLTFNFDNEPENISIENLSSDIIGQLELMPNIERFPNGKKYELDKYTMFHYLRAQEFEHGKSRIALTNSVNEALLNPSRVYTFFSSDYVKKVNKATEAAMFLGWVEQLVYDFTDETSEVSTTDKIADITIIIPYIGPALNIGNMLYKDDFVGALIFSGAVILLEFIPEIAIPVLGTFALVSYIANKVLTVQTIDNALSKRNEKWDEVYKYIVTNWLAKVNTQIDLIRKKMKEALENQAEATKAIINYQYNQYTEEEKNNINFNIDDLSSKLNESINKAMININKFLNQCSVSYLMNSMIPYGVKRLEDFDASLKDALLKYIYDNRGTLIGQVDRLKDKVNNTLSTDIPFQLSKYVDNQRLLSTFTEYIKNIINTSILNLRYESNHLIDLSRYASKINIGSKVNFDPIDKNQIQLFNLESSKIEVILKNAIVYNSMYENFSTSFWIRIPKYFNSISLNNEYTIINCMENNSGWKVSLNYGEIIWTLQDTQEIKQRVVFKYSQMINISDYINRWIFVTITNNRLNNSKIYINGRLIDQKPISNLGNIHASNNIMFKLDGCRDTHRYIWIKYFNLFDKELNEKEIKDLYDNQSNSGILKDFWGDYLQYDKPYYMLNLYDPNKYVDVNNVGIRGYMYLKGPRGSVMTTNIYLNSSLYRGTKFIIKKYASGNKDNIVRNNDRVYINVVVKNKEYRLATNASQAGVEKILSALEIPDVGNLSQVVVMKSKNDQGITNKCKMNLQDNNGNDIGFIGFHQFNNIAKLVASNWYNRQIERSSRTLGCSWEFIPVDDGWGERPLGGSGGGSGLPESGGGSAWSHPQFEKGGGSGGGSGGSAWSHPQFEKMENLYFQGGGGSGGSGGSPFVNKQFNYKDPVNGVDIAYIKIPNAGQMQPVKAFKIHNKIWVIPERDTTFTNPEEGDLNPPPEAKQVPVSYYDSTYLSTDNEKDNYLKGVTKLFERIYSTDLGRMLLTSIVRGIPFWGGSTIDTELKVIDTNCINVIQPDGSYRSEELNLVIIGPSADIIQFECKSFGHEVLNLTRNGYG STQYIRFSPDFTFGFEESLEVDTNPLLGAGKFATDPAVTLAHQLIYAGHRLYGIAINPNRVFKVNTNAYYEMSGLEVSFEELRTFGGHDAKFIDSLQENEFRLYYYNKFKDIASTLNKAKSIVGTTASLQYMKNVFKEKYLLSEDTSGKFSVDKLKFDKLYKMLTEIYTEDNFVKFFKVLNRKTYLNFDKAV FKINIVPKVNYTIYDGFNLRNTNLAANFNGQNTEINNMNFTKLKNFTGLFEFYKLLCVRGIITSKTKSLDKGYNKALNDLCIKVNNWDLFFSPSEDNFTNDLNKGEEITSDTNIEAAEENISLDLIQQYYLTFNFDNEPENISIENLSSDIIGQLELMPNIERFPNGKKYELDKYTMFHYLRAQEFEHGKSRIALTNSVNEALLNPSR VYTFFSSDYVKKVNKATEAAMFLGWVEQLVYDFTDETSEVSTTDKIADITIIIPYIGPALNIGNMLYKDDFVGALIFSGAVILLEFIPEIAIPVLGTFALVSYIANKVLTVQTIDNALSKRNEKWDEVYKYIVTNWLAKVNTQIDLIRKKMKEALENQAEATKAIINYQYNQYTEEEKNNINFNIDDLSSKLNESINKAMININK FLNQCSVSYLMNSMIPYGVKRLEDFDASLKDALLKYIYDNRGTLIGQVDRLKDKVNNTLSTDIPFQLSKYVDNQRLLSTFTEYIKNIINTSILNLRYESNHLIDLSRYASKINIGSKVNFDPIDKNQIQLFNLESSKIEVILKNAIVYNSMYENFSTSFWIRIPKYFNSISLNNEYTIINCMENNSGWKVSLNYGEIIWTL QDTQEIKQRVVFKYSQMINISDYINRWIFVTITNNRLNNSKIYINGRLIDQKPISNLGNIHASNNIMFKLDGCRDTHRYIWIKYFNLFDKELNEKEIKDLYDNQSNSGILKDFWGDYLQYDKPYYMLNLYDPNKYVDVNNVGIRGYMYLKGPPRGSVMTTNIYLNSSLYRGTKDNIVFIIKKYASGNKDNIVRNNDRVYIN VVVKNKEYRLATNASQAGVEKILSALEIPDVGNLSQVVVMKSKNDQGITNKCKMNLQDNNGNDIGFIGFHQFNNIAKLVASNWYNRQIERSSRTLGCSWEFIPVDDGWGERPLGGSGGGSGLPESGGGSAWSHPQFEKGGGSGGGSGGSAWSHPQFEK

SEQ ID NO: 41 - Полипептидная последовательность PATG Prochloron didemniSEQ ID NO: 41 - PATG Prochloron didemni polypeptide sequence

MFSIMITIDYPFTVSLNRDIQVTSTEDYYTLQVTESDPSAWLTFATTPAMDMAFDHLKAGTTTESLVQTLAELGGPAAREQFALTLQQLDERGWLSYAVLPLAEAIPMVESAELNLPGNPHWMETGVTLSRFAYQHPYEGTMVLESPLSKFRVKLLDWRASALLAQLAQPQTLGTIAPPPYLGPETAYQFLNLLWATGFLASDHEPVSLQLWDFHNLLFHSRSRLGRHDYPGTDLNVDNWSDFPVVKPPMSDRIVPLPRPNLEALMSNDATLTEAIETRKSVREYDDDNPITIEQLGELLYRAARVTKLLSPEERFGKLWQQNKPVFEEAGVDEGEFSHRPYPGGGAMYELEIYPVVRLCQGLSQGVYHYDPLNHQLEQIVESKDDIFAVSGSPLASKLGPHVLLVITARFGRLFRLYRSVAYALVLKHVGVLQQNLYLVATNMGLAPCAGGAGDSDAFAQVTGIDYVEESAVGEFILGSLASEVESDVVEGEDEIESAGVSASEVESSATKQKVALHPHDLDERIPGLADLHNQTLGDPQITIVIIDGDPDYTLSCFEGAEVSKVFPYWHEPAEPITPEDYAAFQSIRDQGLKGKEKEEALEAVIPDTKDRIVLNDHACHVTSTIVGQEHSPVFGIAPNCRVINMPQDAVIRGNYDDVMSPLNLARAIDLALELGANIIHCAFCRPTQTSEGEEILVQAIKKCQDNNVLIVSPTGNNSNESWCLPAVLPGTLAVGAAKVDGTPCHFSNWGGNNTKEGILAPGEEILGAQPCTEEPVRLTGTSMAAPVMTGISALLMSLQVQQGKPVDAEAVRTALLKTAIPCDPEVVEEPERCLRGFVNIPGAMKVLFGQPSVTVSFAGGQATRTEHPGYATVAPASIPEPMAERATPAVQAATATEMVIAPSTEPANPATVEASTAFSGNVYALGTIGYDFGDEARRDTFKERMADPYDARQMVDYLDRNPDEARSLIWTLNLEGDVIYALDPKGPFATNVYEIFLQMLAGQLEPETSADFIERLSVPARRTTRTVELFSGEVMPVVNVRDPRGMYGWNVNALVDAALATVEYEEADEDSLRQGLTAFLNRVYHDLHNLGQTSRDRALNFTVTNTFQAASTFAQAIASGRQLDTIEVNKSPYCRLNSDCWDVLLTFYDPEHGRRSRRVFRFTLDVVYVLPVTVGSIKSWSLPGKGTVSKMFSIMITIDYPFTVSLNRDIQVTSTEDYYTLQVTESDPSAWLTFATTPAMDMAFDHLKAGTTTESLVQTLAELGGPAAREQFALTLQQLDERGWLSYAVLPLAEAIPMVESAELNLPGNPHWMETGVTLSRFAYQHPYEGTMVLESPLSKFRVKLLDWRASALLAQLAQPQTLGTIAPPPYLGPETAYQFLNLLWATGF LASDHEPVSLQLWDFHNLLFHSRSRLGRHDYPGTDLNVDNWSDFPVVKPPMSDRIVPLPRPNLEALMSNDATLTEAIETRKSVREYDDDNPITIEQLGELLYRAARVTKLLSPEERFGKLWQQNKPVFEEAGVDEGEFSHRPYPGGGAMYELEIYPVVRLCQGLSQGVYHYDPLNHQLEQIVESKDDIFAVSGSPLASKLGPHV LLVITARFGRLFRLYRSVAYALVLKHVGVLQQNLYLVATNMGLAPCAGGAGDSDAFAQVTGIDYVEESAVGEFILGSLASEVESDVVEGEDEIESAGVSASEVESSATKQKVALHPHDLDERIPGLADLHNQTLGDPQITIVIIDGDPDYTLSCFEGAEVSKVFPYWHEPAEPITPEDYAAFQSIRDQGLKGKEKEEALEAVIPD TKDRIVLNDHACHVTSTIVGQEHSPVFGIAPNCRVINMPQDAVIRGNYDDVMSPLNLARAIDLALELGANIIHCAFCRPTQTSEGEEILVQAIKKCQDNNVLIVSPTGNNSNESWCLPAVLPGTLAVGAAKVDGTPCHFSNWGGNNTKEGILAPGEEILGAQPCTEEPVRLTGTSMAAPVMTGISALLMSLQVQQGKPVDAEAVRTALLKTA IPCDPEVVEEPERCLRGFVNIPGAMKVLFGQPSVTVSFAGGQATRTEHPGYATVAPASIPEPMAERATPAVQAATATEMVIAPSTEPANPATVEASTAFSGNVYALGTIGYDFGDEARRDTFKERMADPYDARQMVDYLDRNPDEARSLIWTLNLEGDVIYALDPKGPFATNVYEIFLQMLAGQLEPETSADFIERLSVPARRTTRTVELFS GEVMPVVNVRDPRGMYGWNVNALVDAALATVEYEEADEDSLRQGLTAFLNRVYHDLHNLGQTSRDRALNFTVTNTFQAASTFAQAIASGRQLDTIEVNKSPYCRLNSDCWDVLLTFYDPEHGRRSRRVFRFTLDVVYVLPVTVGSIKSWSLPGKGTVSK

SEQ ID NO: 42 - Полипептидная последовательность PCY1 Saponaria vaccariaSEQ ID NO: 42 - PCY1 Saponaria vaccaria polypeptide sequence

MATSGFSKPLHYPPVRRDETVVDDYFGVKVADPYRWLEDPNSEETKEFVDNQEKLANSVLEECELIDKFKQKIIDFVNFPRCGVPFRRANKYFHFYNSGLQAQNVFQMQDDLDGKPEVLYDPNLREGGRSGLSLYSVSEDAKYFAFGIHSGLTEWVTIKILKTEDRSYLPDTLEWVKFSPAIWTHDNKGFFYCPYPPLKEGEDHMTRSAVNQEARYHFLGTDQSEDILLWRDLENPAHHLKCQITDDGKYFLLYILDGCDDANKVYCLDLTKLPNGLESFRGREDSAPFMKLIDSFDASYTAIANDGSVFTFQTNKDAPRKKLVRVDLNNPSVWTDLVPESKKDLLESAHAVNENQLILRYLSDVKHVLEIRDLESGALQHRLPIDIGSVDGITARRRDSVVFFKFTSILTPGIVYQCDLKNDPTQLKIFRESVVPDFDRSEFEVKQVFVPSKDGTKIPIFIAARKGISLDGSHPCEMHGYGGFGINMMPTFSASRIVFLKHLGGVFCLANIRGGGEYGEEWHKAGFRDKKQNVFDDFISAAEYLISSGYTKARRVAIEGGSNGGLLVAACINQRPDLFGCAEANCGVMDMLRFHKFTLGYLWTGDYGCSDKEEEFKWLIKYSPIHNVRRPWEQPGNEETQYPATMILTADHDDRVVPLHSFKLLATMQHVLCTSLEDSPQKNPIIARIQRKAAHYGRATMTQIAEVADRYGFMAKALEAPWIDMATSGFSKPLHYPPVRRDETVVDDYFGVKVADPYRWLEDPNSEETKEFVDNQEKLANSVLEECELIDKFKQKIIDFVNFPRCGVPFRRANKYFHFYNSGLQAQNVFQMQDDLDGKPEVLYDPNLREGGRSGLSLYSVSEDAKYFAFGIHSGLTEWVTIKILKTEDRSYLPDTLEWVKFSPAIWTHDNKGFFYCPY PPLKEGEDHMTRSAVNQEARYHFLGTDQSEDILLWRDLENPAHHLKCQITDDGKYFLLYILDGCDDANKVYCLDLTKLPNGLESFRGREDSAPFMKLIDSFDASYTAIANDGSVFTFQTNKDAPRKKLVRVDLNNPSVWTDLVPESKKDLLESAHAVNENQLILRYLSDVKHVLEIRDLESGALQHRLPIDIGSVDGITARRRDSV VFFKFTSILTPGIVYQCDLKNDPTQLKIFRESVVPDFDRSEFEVKQVFVPSKDGTKIPIFIAARKGISLDGSHPCEMHGYGGFGINMMPTFSASRIVFLKHLGGVFCLANIRGGGEYGEEWHKAGFRDKKQNVFDDFISAAEYLISSGYTKARRVAIEGGSNGGLLVAACINQRPDLFGCAEANCGVMDMLRFHKFTLGYL WTGDYGCSDKEEEFKWLIKYSPIHNVRRPWEQPGNEETQYPATMILTADHDDRVVPLHSFKLLATMQHVLCTSLEDSPQKNPIIARIQRKAAHYGRATMTQIAEVADRYGFMAKALEAPWID

SEQ ID NO: 43 - Полипептидная последовательность POPB Galerina marginataSEQ ID NO: 43 - POPB Galerina marginata polypeptide sequence

MSSVTWAPGNYPSTRRSDHVDTYQSASKGEVPVPDPYQWLEESTDEVDKWTTAQADLAQSYLDQNADIQKLAEKFRASRNYAKFSAPTLLDDGHWYWFYNRGLQSQSVLYRSKEPALPDFSKGDDNVGDVFFDPNVLAADGSAGMVLCKFSPDGKFFAYAVSHLGGDYSTIYVRSTSSPLSQASVAQGVDGRLSDEVKWFKFSTIIWTKDSKGFLYQRYPARERHEGTRSDRNAMMCYHKVGTTQEEDIIVYQDNEHPEWIYGADTSEDGKYLYLYQFKDTSKKNLLWVAELDEDGVKSGIHWRKVVNEYAADYNIITNHGSLVYIKTNLNAPQYKVITIDLSKDEPEIRDFIPEEKDAKLAQVNCANEEYFVAIYKRNVKDEIYLYSKAGVQLTRLAPDFVGAASIANRQKQTHFFLTLSGFNTPGTIARYDFTAPETQRFSILRTTKVNELDPDDFESTQVWYESKDGTKIPMFIVRHKSTKFDGTAAAIQYGYGGFATSADPFFSPIILTFLQTYGAIFAVPSIRGGGEFGEEWHKGGRRETKVNTFDDFIAAAQFLVKNKYAAPGKVAINGASNGGLLVMGSIVRAPEGTFGAAVPEGGVADLLKFHKFTGGQAWISEYGNPSIPEEFDYIYPLSPVHNVRTDKVMPATLITVNIGDGRVVPMHSFKFIATLQHNVPQNPHPLLIKIDKSWLGHGMGKPTDKNVKDAADKWGFIARALGLELKTVEMSSVTWAPGNYPSTRRSDHVDTYQSASKGEVPVPDPYQWLEESTDEVDKWTTAQADLAQSYLDQNADIQKLAEKFRASRNYAKFSAPTLLDDGHWYWFYNRGLQSQSVLYRSKEPALPDFSKGDDNVGDVFFDPNVLAADGSAGMVLCKFSPDGKFFAYAVSHLGGDYSTIYVRSTSSPLSQASVAQGVDGR LSDEVKWFKFSTIIWTKDSKGFLYQRYPARERHEGTRSDRNAMMCYHKVGTTQEEDIIVYQDNEHPEWIYGADTSEDGKYLYQFKDTSKKNLLWVAELDEDGVKSGIHWRKVVNEYAADYNIITNHGSLVYIKTNLNAPQYKVITIDLSKDEPEIRDFIPEEKDAKLAQVNCANEEYFVAIYKRNVKDE IYLYSKAGVQLTRLAPDFVGAASIANRQKQTHFFLTLSGFNTPGTIARYDFTAPETQRFSILRTTKVNELDPDDFESTQVWYESKDGTKIPMFIVRHKSTKFDGTAAAIQYGYGGFATSADPFFSPIILTFLQTYGAIFAVPSIRGGGEFGEEWHKGGRRETKVNTFDDFIAAAQFLVKNKYAAPGKVAINGASNGGLLVMGSIVRAP EGTFGAAVPEGGVADLLKFHKFTGGQAWISEYGNPSIPEEFDYIYPLSPVHNVRTDKVMPATLITVNIGDGRVVPMHSFKFIATLQHNVPQNPHPLLIKIDKSWLGHGMGKPTDKNVKDAADKWGFIARALGLELKTVE

SEQ ID NO: 44 - Полипептидная последовательность гомолога бутелазы OaAEP1b Oldenlandia affinis (плюс сигнальный пептид)SEQ ID NO: 44 - Oldenlandia affinis OaAEP1b butelase homologue polypeptide sequence (plus signal peptide)

MVRYLAGAVLLLVVLSVAAAVSGARDGDYLHLPSEVSRFFRPQETNDDHGEDSVGTRWAVLIAGSKGYANYRHQAGVCHAYQILKRGGLKDENIVVFMYDDIAYNESNPRPGVIINSPHGSDVYAGVPKDYTGEEVNAKNFLAAILGNKS AITGGSGKVVDSGPNDHIFIYYTDHGAAGVIGMPSKPYLYADELNDALKKKHASGTYKSLVFYLEACESGSMFEGILPEDLNIYALTSTNTTESSWCYYCPAQENPPPPEYNVCLGDLFSVAWLEDSDVQNSWYETLNQQYHHVDKRISHASHATQYGNLKLGEEGLFVYMGSNPANDNYTSLDGNALTPSSIVVNQRDADLLHLWEKFRKAPEGSARKEVAQTQIFKAMSHRVHIDSSIKLIGKLLFGIEKCTEILNAVRPAGQPLVDDWACLRSLVGTFETHCGSLSEYGMRHTRTIA NICNAGISEEQMAEAASQACASIPMVRYLAGAVLLLVVLSVAAAAVSGARDGDYLHLPSEVSRFFRPQETNDDHGEDSVGTRWAVLIAGSKGYANYRHQAGVCHAYQILKRGGLKDENIVVFMYDDIAYNESNPRPGVIINSPHGSDVYAGVPKDYTGEEVNAKNFLAAILGNKS AITGGSGKVVDSGPNDHIFIYYTDHGAAGVIGMPSKPYLYADELNDAL KKKHASGTYKSLVFYLEACESGSMFEGILPEDLNIYALTSTNTTESSWCYYCPAQENPPPPEYNVCLGDLFSVAWLEDSDVQNSWYETLNQQYHHVDKRISHASHATQYGNLKLGEEGLFVYMGSNPANDNYTSLDGNALTPSSIVVNQRDADLLHLWEKFRKAPEGSARKEVAQTQIFKAMSHRVHIDSSIKLIGKLLF GIEKCTEILNAVRPAGQPLVDDWACLRSLVGTFETHCGSLSEYGMRHTRTIA NICNAGISEEQMAEAASQACASIP

SEQ ID NO: 45 - Полипептидная последовательность гомолога бутелазы OaAEP1b Oldenlandia affinis (минус сигнальный пептид)SEQ ID NO: 45 - Oldenlandia affinis OaAEP1b butelase homologue polypeptide sequence (minus signal peptide)

ARDGDYLHLPSEVSRFFRPQETNDDHGEDSVGTRWAVLIAGSKGYANYRHQAGVCHAYQILKRGGLKDENIVVFMYDDIAYNESNPRPGVIINSPHGSDVYAGVPKDYTGEEVNAKNFLAAILGNKSAITGGSGKVVDSGPNDHIFIYYTDHGAAGVIGMPSKPYLYADELNDALKKKHASGTYKSLVFYLEACESGSMFEGILPEDLNIYALTSTNTTESSWCYYCPAQENPPPPEYNVCLGDLFSVAWLEDSDVQNSWYETLNQQYHHVDKRISHASHATQYGNLKLGEEGLFVYMGSNPANDNYTSLDGNALTPSSIVVNQRDADLLHLWEKFRKAPEGSARKEVAQTQIFKAMSHRVHIDSSIKLIGKLLFGIEKCTEILNAVRPAGQPLVDDWACLRSLVGTFETHCGSLSEYGMRHTRTIANICNAGISEEQMAEAASQACASIPARDGDYLHLPSEVSRFFRPQETNDDHGEDSVGTRWAVLIAGSKGYANYRHQAGVCHAYQILKRGGLKDENIVVFMYDDIAYNESNPRPGVIINSPHGSDVYAGVPKDYTGEEVNAKNFLAAILGNKSAITGGSGKVVDSGPNDHIFIYYTDHGAAGVIGMPSKPYLYADELNDALKKKHASGTYKSLVFYLEACESGS MFEGILPEDLNIYALTSTNTTESSWCYYCPAQENPPPPEYNVCLGDLFSVAWLEDSDVQNSWYETLNQQYHHVDKRISHASHATQYGNLKLGEEGLFVYMGSNPANDNYTSLDGNALTPSSIVVNQRDADLLHLWEKFRKAPEGSARKEVAQTQIFKAMSHRVHIDSSIKLIGKLLFGIEKCTEILNAVRPAGQPLVDDWA CLRSLVGTFETHCGSLSEYGMRHTRTIANICNAGISEEQMAEAASQACASIP

ПРИМЕРЫEXAMPLES

ПРИМЕР 1EXAMPLE 1

Конструирование однократно и двукратно меченного посредством техасского крастного, eGFP, SNAP и SrtA полипептида с EGF-лигандомConstruction of Texas Red, eGFP, SNAP, and SrtA singly and doubly labeled EGF ligand polypeptide

Было опробовано несколько стратегий мечения. Целью было получение меченой версии полипептида, которая не влияла на его структурные характеристики и на его способность к транспорту в клетки и расщеплению белков SNARE эффективно и аналогично немеченой версии.Several labeling strategies have been tried. The goal was to obtain a labeled version of the polypeptide that did not affect its structural characteristics and its ability to transport into cells and cleave SNARE proteins efficiently and similarly to the unlabeled version.

Было опробовано 4 различных стратегии мечения полипептида с EGF-лигандом (Fonfria, E., S. Donald and V.A. Cadd (2016). "Botulinum neurotoxin A and an engineered derivate targeted secretion inhibitor (TSI) A enter cells via different vesicular compartments." J Recept Signal Transduct Res 36(1): 79-88). После клонирования при необходимости полипептид экспрессировали рекомбинантными способами и очищали с использованием стандартных методик, как опубликовано ранее (Masuyer, G., M. Beard, V.A. Cadd, J. A. Chaddock and K.R. Acharya (2011). "Structure and activity of a functional derivative of Clostridium botulinum neurotoxin B." J Struct Biol 174(1): 52-57, Somm, E., N. Bonnet, A. Martinez, P.M. Marks, V.A. Cadd, M. Elliott, A. Toulotte, S.L. Ferrari, R. Rizzoli, P.S. Huppi, E. Harper, S. Melmed, R. Jones and M.L. Aubert (2012). "A botulinum toxin-derived targeted secretion inhibitor downregulates the GH/IGF1 axis." J Clin Invest 122(9): 3295-3306). В кратком изложении, полипептид экспрессировали рекомбинантными способами в компетентных бактериях E. coli. Экспрессированный полипептид очищали с использованием аффинной колонки, а затем анионообменной хроматографии, ферментативной активации с получением двухцепочечного комплекса и, наконец, стадии полировки с использованием гидрофобного взаимодействия.Four different strategies for labeling the polypeptide with EGF ligand have been tried (Fonfria, E., S. Donald and V.A. Cadd (2016). "Botulinum neurotoxin A and an engineered derivate targeted secretion inhibitor (TSI) A enter cells via different vesicular compartments." J Recept Signal Transduct Res 36(1): 79-88). After cloning, if necessary, the polypeptide was expressed by recombinant methods and purified using standard techniques as previously published (Masuyer, G., M. Beard, V.A. Cadd, J.A. Chaddock and K.R. Acharya (2011). "Structure and activity of a functional derivative of Clostridium botulinum neurotoxin B." J Struct Biol 174(1): 52-57, Somm, E., N. Bonnet, A. Martinez, P. M. Marks, V. A. Cadd, M. Elliott, A. Toulotte, S. L. Ferrari, R. Rizzoli , P.S. Huppi, E. Harper, S. Melmed, R. Jones and M.L. Aubert (2012) "A botulinum toxin-derived targeted secretion inhibitor downregulates the GH/IGF1 axis." J Clin Invest 122(9): 3295-3306 ). Briefly, the polypeptide was expressed by recombinant methods in competent E. coli bacteria. The expressed polypeptide was purified using an affinity column, followed by anion exchange chromatography, enzymatic activation to give a double-stranded complex, and finally a polishing step using hydrophobic interaction.

1. Немодифицированный пептид с EGF-лигандом, очищенный, как описано выше, метили с использованием набора Texas Red-X Protein Labelling Kit (Thermo Fisher Scientific) в соответствии с протоколом изготовителя. Успешное мечение белка подтверждали посредством конфокальной микроскопии и прижизненной визуализации. Нуклеотидные и полипептидные последовательности для полипептида, использованного для мечения, представлены в качестве SEQ ID NO: 5 и 6, соответственно.1. The unmodified EGF Ligand peptide, purified as described above, was labeled using the Texas Red-X Protein Labeling Kit (Thermo Fisher Scientific) according to the manufacturer's protocol. Successful labeling of the protein was confirmed by confocal microscopy and intravital imaging. The nucleotide and polypeptide sequences for the labeled polypeptide are shown as SEQ ID NOs: 5 and 6, respectively.

2. Полипептид с EGF-лигандом метили на N-конце усиленным зеленым флуоресцентным белком (eGFP) посредством стандартных методик клонирования. Нуклеотидные и полипептидные последовательности представлены в качестве SEQ ID NO: 9 и 10, соответственно. Экспрессию и очистку белка проводили, как указано выше. После экспрессии была безуспешно предпринята попытка очистить меченный eGFP полипептид с EGF-лигандом.2. The EGF ligand polypeptide was labeled at the N-terminus with enhanced green fluorescent protein (eGFP) by standard cloning techniques. Nucleotide and polypeptide sequences are shown as SEQ ID NOs: 9 and 10, respectively. Protein expression and purification were performed as described above. After expression, an unsuccessful attempt was made to purify the eGFP labeled EGF ligand polypeptide.

3. Полипептид с EGF-лигандом метили на N-конце посредством субстрата SNAP-метка (New England Biolabs) с использованием стандартных методик клонирования. Нуклеотидные и полипептидные последовательности представлены в качестве SEQ ID NO: 11 и 12, соответственно. Экспрессия и очистка этого белка была успешной. Мечение SNAP-меченного полипептида с EGF-лигандом проводили с использованием флуоресцентного субстрата SNAP-Surface 594 (New England Biolabs) в соответствии с протоколом изготовителя. Успешное мечение белка подтверждали посредством конфокальной микроскопии и прижизненной визуализации.3. The EGF ligand polypeptide was labeled at the N-terminus with a SNAP tag substrate (New England Biolabs) using standard cloning techniques. Nucleotide and polypeptide sequences are shown as SEQ ID NOs: 11 and 12, respectively. Expression and purification of this protein was successful. Labeling of the SNAP-tagged polypeptide with EGF ligand was performed using SNAP-Surface 594 fluorescent substrate (New England Biolabs) according to the manufacturer's protocol. Successful labeling of the protein was confirmed by confocal microscopy and intravital imaging.

4. Также предпринимались попытки получить полипептиды, содержащие неприродные аминокислоты, для сайт-специфического мечения. Однако эти попытки оказались неуспешными вследствие затрудненной экспрессии и/или очистки.4. Attempts have also been made to obtain polypeptides containing non-natural amino acids for site-specific labeling. However, these attempts were unsuccessful due to difficult expression and/or purification.

5. Полипептид с EGF-лигандом (т.е. полипептид, имеющий EGF TM) метили двумя различными участками распознавания сортазой A (SrtA), один на N-конце и один на C-конце. Использование SrtA позволяло конъюгацию двух флорофоров различного цвета на одном и том же белке. Полипептид конструировали, как проиллюстрировано на фиг.1. Было выбрано две мутантных версии SrtA (Dorr, B.M., H.O. Ham, C. An, E.L. Chaikof and D.R. Liu (2014). "Reprogrammming the specificity of sortase enzymes". Proc Natl Acad Sci U S A 111(37): 13343-13348) (SEQ ID NO: 14 и 16). Было показано, что они обладают 100% специфичностью в отношении их соответствующих участков распознавания. Полипептид с EGF-лигандом клонировали с участком распознавания LPESG для первой SrtA на C-конце, за которым следовал двойной участок распознавания StrepTag (IBA-lifesciences), что позволяет первоначальную аффинно-опосредуемую очистку белка. Нуклеотидные и полипептидные последовательности представлены в качестве SEQ ID NO: 1 и 2, соответственно. Отдельно получали пептид, содержащий участок остатков глицина, конъюгированных с выбранным флуорофором (Eurogentec). Последовательность этого пептида представляла собой: GGGGK(HF488) (SEQ ID NO: 29). В ходе SrtA-опосредуемой реакции глицин в участке LPESG отщеплялся посредством SrtA (SEQ ID NO: 14), и участок из остатков глицина, присутствующий на флуоресцентном пептиде, распознавался SrtA и использовался для опосредования конъюгации между полипептидом и пептидом. Это обеспечивало однократно флуоресцентно меченый полипептид с EGF-лигандом. Следует отметить, что меченый полипептид более не имел Strep-метки, и обратную аффинно-опосредуемую стадию очистки использовали для отбора меченой части полипептида. Для двукратно меченого полипептида с EGF-лигандом участок из 3 остатков глицина клонирования на N-конце полипептида после начального кодона и участка распознавания вирусом гравировки табака (TEV) для расщепления. Участок TEV вносили, чтобы помочь защитить участков из остатков глицина от циркуляризации в ходе первоначальной C-концевой реакции SrtA как подробно описано выше. Отдельно получали пептид, содержащий участок распознавания LAETG, конъюгированный с выбранным флуорофором (Eurogentec). Последовательность этого пептида представляла собой: HiLyte Fluor™ 555-HHHHHHLAETGGG (SEQ ID NO: 30). Кроме того, перед участком LAETG помещали 6 His-метку (6HT) для простоты очистки белка после реакции SrtA (SEQ ID NO: 16). Реакцию SrtA проводили аналогично C-концевому участку и конечный двукратно меченый белок с EGF-лигандом очищали с использованием стадии His-аффинной очистки. Успешное однократное и двойное мечение белка было подтверждено посредством SDS-PAGE гель-электрофореза, конфокальной микроскопии и прижизненной микроскопии.5. An EGF ligand polypeptide (ie, a polypeptide having EGFTM) was labeled with two different sortase A (SrtA) recognition sites, one at the N-terminus and one at the C-terminus. The use of SrtA allowed the conjugation of two fluorophores of different colors on the same protein. The polypeptide was designed as illustrated in Fig.1. Two mutant versions of SrtA were selected (Dorr, B.M., H.O. Ham, C. An, E.L. Chaikof and D.R. Liu (2014). "Reprogrammming the specificity of sortase enzymes". Proc Natl Acad Sci U S A 111(37): 13343-13348) (SEQ ID NOS: 14 and 16). They have been shown to have 100% specificity for their respective recognition sites. The EGF ligand polypeptide was cloned with a LPESG recognition site for the first SrtA at the C-terminus followed by a dual StrepTag recognition site (IBA-lifesciences), allowing initial affinity-mediated protein purification. Nucleotide and polypeptide sequences are shown as SEQ ID NOs: 1 and 2, respectively. Separately, a peptide containing a region of glycine residues conjugated to a selected fluorophore (Eurogentec) was prepared. The sequence of this peptide was: GGGGK(HF488) (SEQ ID NO: 29). During the SrtA-mediated reaction, glycine in the LPESG region was cleaved off by SrtA (SEQ ID NO: 14) and the region of glycine residues present on the fluorescent peptide was recognized by SrtA and used to mediate conjugation between polypeptide and peptide. This provided a singly fluorescently labeled polypeptide with an EGF ligand. It should be noted that the labeled polypeptide no longer had a Strep tag and a reverse affinity-mediated purification step was used to select the labeled portion of the polypeptide. For a doubly labeled polypeptide with an EGF ligand, a cloning 3 glycine residue region at the N-terminus of the polypeptide after the start codon and tobacco etch virus (TEV) recognition region for cleavage. The TEV site was added to help protect the glycine residue sites from circularization during the initial SrtA C-terminal reaction as detailed above. Separately, a peptide containing the LAETG recognition site conjugated to a selected fluorophore (Eurogentec) was prepared. The sequence of this peptide was: HiLyte Fluor™ 555-HHHHHHLAETGGG (SEQ ID NO: 30). In addition, a 6 His tag (6HT) was placed in front of the LAETG region for ease of purification of the protein after the SrtA reaction (SEQ ID NO: 16). The SrtA reaction was carried out similarly to the C-terminal region and the final doubly labeled EGF ligand protein was purified using a His affinity purification step. Successful single and double labeling of the protein was confirmed by SDS-PAGE gel electrophoresis, confocal microscopy and in vivo microscopy.

Белки сортазы A (SrtA), имеющие C-концевую His-метку, экспрессировали в компетентных бактериях E. coli и очищали с использованием аффинной улавливающей колонки.Sortase A (SrtA) proteins having a C-terminal His tag were expressed in competent E. coli bacteria and purified using an affinity capture column.

Конъюгацию посредством сортазы полипептида и флуоресцентных пептидов проводили в течение ночи при 4°C с использованием соотношения эквивалентов полипептида и SrtA и флуоресцентного пептида 1 к 2 к 20, соответственно.Sortase conjugation of the polypeptide and fluorescent peptides was performed overnight at 4° C. using an equivalent ratio of polypeptide and SrtA and fluorescent peptide of 1 to 2 to 20, respectively.

В настоящем примере полипептид с EGF-лигандом конъюгировали с флуорофором HiLyte 555 на C-концевой части домен транслокации-лиганд и флуорофором HiLyte 488 на N-концевой части легкой цепи. Экспрессия полипептида, содержащего участки распознавания SrtA и два варианта SrtA, была успешной. Преимущественно, посредством получения полипептида, который может быть мечен двумя различными цветными флуорофорами, можно визуализировать механизмы транспорта как легкой цепи (содержащей нецитотоксическую протеазу), так и частей домен транслокации-лиганд в белке.In the present example, the EGF ligand polypeptide was conjugated to the HiLyte 555 fluorophore at the C-terminal portion of the translocation-ligand domain and the HiLyte 488 fluorophore at the N-terminal portion of the light chain. Expression of a polypeptide containing SrtA recognition sites and two SrtA variants was successful. Advantageously, by providing a polypeptide that can be labeled with two different colored fluorophores, one can visualize the transport mechanisms of both the light chain (containing a non-cytotoxic protease) and the translocation domain-ligand portions of the protein.

ПРИМЕР 2EXAMPLE 2

Конструирование двукратно меченного посредством SrtA полипептида с ноцицептин-лигандомConstruction of SrtA doubly labeled nociceptin ligand polypeptide

Полипептид, имеющий ноцицептин-лиганд с TM (полипептид с ноцицептин-лигандом), получали для двукратного флуоресцентного мечения с использованием стратегии, использованной для полипептида с EGF-лигандом. Конструирование, очистка и флуоресцентные пептиды, использованные для двукратного мечения этого полипептида, были в точности такими же, как и для полипептида с EGF-лигандом. Успешное двукратное мечение полипептида подтверждали посредством SDS-PAGE гель-электрофореза, конфокальной микроскопии и прижизненной визуализации. Нуклеотидные и полипептидные последовательности для полипептида, содержащего участки сортазы, представлены в качестве SEQ ID NO: 3 и 4, соответственно.A polypeptide having a nociceptin ligand with TM (nociceptin ligand polypeptide) was prepared for double fluorescent labeling using the strategy used for the EGF ligand polypeptide. The design, purification and fluorescent peptides used to double label this polypeptide were exactly the same as for the EGF ligand polypeptide. Successful double labeling of the polypeptide was confirmed by SDS-PAGE gel electrophoresis, confocal microscopy and in vivo imaging. The nucleotide and polypeptide sequences for the polypeptide containing the sortase regions are shown as SEQ ID NOs: 3 and 4, respectively.

Подтверждение меченых белков с использованием анализа отщепления SNAP25Confirmation of labeled proteins using SNAP25 cleavage assay

Для определения того, что мечение полипептидов с лигандами не влияет на их способность связываться с их соответствующими рецепторами, транспортировкой в клетки и транслокацией, проводили анализ отщепления SNAP25 для определения относительной эффективности меченых полипептидов по сравнению с немечеными версиями. Сходный профиль эффективности может указывать на то, что меченый полипептид транспортируется аналогично немеченой версии. Анализ отщепления SNAP25 проводили, как описано ранее (Fonfria, E., S. Donald and V.A. Cadd (2016). "Botulinum neurotoxin A and an engineered derivate targeted secretion inhibitor (TSI) A enter cells via different vesicular compartments." J Recept Signal Transduct Res 36(1): 79-88). В кратком изложении, кортикальные нейроны обрабатывали 3-1000 нМ каждого из меченого и немеченого белка в течение 24 часов. После обработки клетки собирали в буфер для лизиса NuPAGE (Thermo Fischer Scientific), дополненный 0,1 M дитиотреитолом и 250 единиц/мл бензоназы (Sigma). Лизаты разделяли посредством SDS-PAGE и подвергали вестерн-блоттингу с использованием первичных антител против SNAP-25 (Sigma). Эти антитела позволяют распознавание как расщепленной, так и нерасщепленной части SNAP25. Относительную эффективность определяли по соотношению расщепленного SNAP25 и нерасщепленного SNAP25 (фиг.2). На фиг.2A представлена эффективность ответа на дозу полипептида с EGF-лигандом. По сравнению с немеченым полипептидом, меченные посредством техасского красного и SNAP594 версии продемонстрировали выраженное снижение эффективности с величинами, сходными с контрольным полипептидом без лиганда. Напротив, однократно и двукратно меченные посредством SrtA полипептиды продемонстрировали эффективность, сходную с немеченой версией, показав, что эта стратегия мечения не влияет на архитектуру белка и его механизмы клеточного транспорта. Аналогично двукратное мечение полипептида с ноцицептин-лигандом не влияло на его эффективность в кортикальных нейронах (фиг.2B) по сравнению с немеченым контрольным полипептидом.To determine that labeling polypeptides with ligands does not affect their ability to bind to their respective receptors, transport into cells, and translocation, SNAP25 cleavage assays were performed to determine the relative potency of labeled polypeptides compared to unlabeled versions. A similar efficacy profile may indicate that the labeled polypeptide is transported similarly to the unlabeled version. SNAP25 cleavage assay was performed as previously described (Fonfria, E., S. Donald and V.A. Cadd (2016). "Botulinum neurotoxin A and an engineered derivate targeted secretion inhibitor (TSI) A enter cells via different vesicular compartments." J Recept Signal Transduct Res 36(1): 79-88). Briefly, cortical neurons were treated with 3-1000 nM each of labeled and unlabeled protein for 24 hours. After treatment, cells were collected in NuPAGE lysis buffer (Thermo Fischer Scientific) supplemented with 0.1 M dithiothreitol and 250 units/ml benzonase (Sigma). Lysates were separated by SDS-PAGE and subjected to Western blotting using primary antibodies against SNAP-25 (Sigma). These antibodies allow recognition of both the cleaved and uncleaved portion of SNAP25. Relative potency was determined by the ratio of cleaved SNAP25 to uncleaved SNAP25 (FIG. 2). Figure 2A shows the dose response efficacy of an EGF ligand polypeptide. Compared to the unlabeled polypeptide, the Texas Red and SNAP594 labeled versions showed a marked decrease in potency with values similar to the control polypeptide without ligand. In contrast, SrtA singly and doubly labeled polypeptides demonstrated similar efficacy to the unlabeled version, showing that this labeling strategy does not affect protein architecture and its cellular transport mechanisms. Similarly, double labeling of the polypeptide with nociceptin ligand did not affect its efficacy in cortical neurons (FIG. 2B) compared to the unlabeled control polypeptide.

В целом, изначально опробовали простые и ясные способы мечения, такие как несайтспецифическое мечение с использованием красителя техасского красного и SNAP-метки, первоначально опробованной сайт-специфической версии. Однако, хотя эти стратегии мечения были успешными, было показано, что они влияют на эффективность полипептидов по сравнению с немеченым аналогом, что указывает на то, что добавление нескольких флуоресцентных молекул в случае техасского красного или SNAP-метки влияло на свойства транспортировки меченого полипептида. Попытка получить eGFP-меченный полипептид с EGF-лигандом была неуспешной вследствие отсутствия экспрессии меченого белка. В противоположность этому, анализ отщепления SNAP25 подтвердил, что два флуорофора на полипептидах с EGF-лигандом и ноцицептин-лигандом не влияли на их эффективность, что указывает на то, что механизмы действия меченых полипептидов являются сходными с их немечеными аналогами. Это было неожиданным ввиду негативного влияния, которое оказывало мечение посредством SNAP и техасского красного, на эффективность.In general, simple and clear labeling methods were initially tried, such as non-site-specific labeling using Texas red dye and a SNAP tag, the site-specific version originally tested. However, although these labeling strategies were successful, they were shown to affect the efficiency of the polypeptides compared to the unlabeled counterpart, indicating that the addition of several fluorescent molecules in the case of Texas Red or SNAP tag affected the transport properties of the labeled polypeptide. An attempt to produce an eGFP-tagged polypeptide with an EGF ligand was unsuccessful due to the lack of expression of the tagged protein. In contrast, the SNAP25 cleavage assay confirmed that the two fluorophores on the EGF Ligand and Nociceptin Ligand polypeptides did not affect their efficacy, indicating that the mechanisms of action of the labeled polypeptides are similar to their unlabeled counterparts. This was unexpected due to the negative impact that labeling with SNAP and Texas Red had on performance.

ПРИМЕР 3EXAMPLE 3

Визуализация двукратно меченого полипептида с EGF-лигандом в иммортализованных клеточных линияхVisualization of doubly labeled polypeptide with EGF ligand in immortalized cell lines

Способ опосредуемого SrtA двукратного мечения был выбран в качестве оптимальной стратегии для мечения полипептидов по изобретению. Для визуализации меченого полипептида в клетках млекопитающих проводили прижизненную конфокальную 3D-микроскопию. Клетки аденокарциномы легкого человека (A549) обрабатывали 50 нМ двукратно меченым полипептидом с EGF-лигандом и визуализировали непрерывно с течением времени с использованием конфокального микроскопа Zeiss 880, оборудованного AiryScan (Zeiss). Для этих экспериментов полипептид с EGF-лигандом метили на N-конце посредством флуорофора HiLyte 555 (AnaSpec) и на C-конце посредством флуорофора HiLyte 488 (AnaSpec). На фиг.3 представлены фотографии агломератов с двойным окрашиванием, образовавшихся из полипептида с EGF-лигандом в ходе интернализации в клетки A549. Из фиг.3A можно видеть, что агломераты появлялись через 3 минуты после добавления полипептида к клеткам, и их размер и количество возрастало с течением времени. На фиг.3B представлено исчезновение флуоресцентного агломерата с течением времени с полным исчезновением через 65 минут после добавления полипептида.The SrtA-mediated double labeling method was chosen as the optimal strategy for labeling the polypeptides of the invention. To visualize the labeled polypeptide in mammalian cells, in vivo confocal 3D microscopy was performed. Human lung adenocarcinoma (A549) cells were treated with 50 nM doubly labeled EGF ligand polypeptide and visualized continuously over time using a Zeiss 880 confocal microscope equipped with AiryScan (Zeiss). For these experiments, the EGF ligand polypeptide was labeled at the N-terminus with the HiLyte 555 fluorophore (AnaSpec) and at the C-terminus with the HiLyte 488 fluorophore (AnaSpec). Figure 3 shows photographs of double stained agglomerates formed from the EGF ligand polypeptide during internalization into A549 cells. From figa it can be seen that the agglomerates appeared 3 minutes after adding the polypeptide to the cells, and their size and number increased over time. On figv shows the disappearance of the fluorescent agglomerate over time with complete disappearance after 65 minutes after adding the polypeptide.

Прижизненная визуализация, проведенная с использованием двукратно меченного полипептида с EGF-лигандом, полностью подтвердила этот способ мечения и возможность осуществлять мониторинг прижизненной интернализации и транспорта меченых полипептидов.In vivo imaging using a doubly labeled EGF ligand polypeptide fully confirmed this labeling method and the ability to monitor intra vivo internalization and transport of labeled polypeptides.

После демонстрации того, что мечение сортазой является преимущественным и не влияет на эффективность, его далее можно использовать для других клостридиальных нейротоксинов, включая серотипы BoNT (и производные).Once it has been demonstrated that sortase labeling is advantageous and does not affect performance, it can then be used for other clostridial neurotoxins, including BoNT serotypes (and derivatives).

ПРИМЕР 4EXAMPLE 4

Конструирование полипептида BoNT/A с опосредуемым SrtA двукратным мечениемConstruction of a BoNT/A polypeptide with SrtA mediated double labeling

Полноразмерный протеолитически неактивный мутант BoNT/A(0) (SEQ ID NO: 38) модифицировали, чтобы обеспечить двукратное флуоресцентное мечение с использованием сортазы (см. фиг.4). Двукратно меченная полипептидная последовательность представлена в качестве SEQ ID NO: 40, в то время как нуклеотидная последовательность, кодирующая указанный полипептид, представлена в качестве SEQ ID NO: 39. Конструирование, очистка и флуоресцентные пептиды, использованные для двукратного мечения SEQ ID NO: 40, были такими же, как и для полипептида с EGF-лигандом согласно примеру 1. Успешное двукратное мечение полипептида было подтверждено посредством SDS-PAGE (фиг.5). Более подробно, с использованием окрашивания Кумасси можно визуализировать обе полосы, соответствующие доменам L-цепи и H-цепи полипептида, в то время как воздействие на гель УФ-излучения продемонстрировало (посредством флуоресценции) успешное мечение как L-цепи, так и H-цепи.The full-length proteolytically inactive BoNT/A(0) mutant (SEQ ID NO: 38) was modified to allow sortase double fluorescent labeling (see FIG. 4). The doubly labeled polypeptide sequence is shown as SEQ ID NO: 40, while the nucleotide sequence encoding said polypeptide is given as SEQ ID NO: 39. Construction, purification, and fluorescent peptides used to double label SEQ ID NO: 40, were the same as for the EGF ligand polypeptide according to Example 1. Successful double labeling of the polypeptide was confirmed by SDS-PAGE (FIG. 5). In more detail, using Coomassie staining, both bands corresponding to the L-chain and H-chain domains of the polypeptide can be visualized, while exposing the gel to UV radiation demonstrated (via fluorescence) successful labeling of both the L-chain and the H-chain .

ПРИМЕР 5EXAMPLE 5

Визуализация однократно меченого полипептида BoNT/A(0) в первичных кортикальных нейронахVisualization of singly labeled BoNT/A(0) polypeptide in primary cortical neurons

Для визуализации меченого полипептида BoNT/A(0) в первичных нейрональных клетках проводили прижизненную TIRF-микроскопию единичных молекул в обработанных им нейронах. Первичные кортикальные нейроны обрабатывали 1 нМ однократно меченнм полипептидом BoNT/A(0) и визуализировали непрерывно с течением времени с использованием специализированной TIRF-микроскопии единичных молекул. Для этих экспериментов полипептид BoNT/A(0) метили на N-конце посредством либо флуорофора HiLyte 555, либо флуорофора HiLyte 488 (AnaSpec). На фиг.6 представлены изображения с течением времени однократно окрашенной молекулы BoNT/A(0), транспортируемой в первичные кортикальные нейроны. Из фиг.6 можно видеть, что единичная молекула BoNT/A(0) (белая стрелка) двигается быстро в пределах выбранной нейрональной области. Прижизненная TIRF-визуализация единичных молекул однократно меченнго полипептида BoNT/A(0) отчетливо демонстрирует, что единичные молекулы BoNT/A(0), транспортирующиеся в нейроны, можно визуализировать с использованием специализированных способов микроскопии высокого разрешения.To visualize the labeled BoNT/A(0) polypeptide in primary neuronal cells, in vivo TIRF microscopy of single molecules was performed in neurons treated with it. Primary cortical neurons were treated with 1 nM singly labeled BoNT/A(0) polypeptide and imaged continuously over time using specialized single molecule TIRF microscopy. For these experiments, the BoNT/A(0) polypeptide was labeled at the N-terminus with either HiLyte 555 fluorophore or HiLyte 488 fluorophore (AnaSpec). Figure 6 shows images over time of a singly stained BoNT/A(0) molecule transported to primary cortical neurons. From Figure 6, it can be seen that a single BoNT/A(0) molecule (white arrow) moves rapidly within the selected neuronal region. In vivo TIRF imaging of single molecules of the BoNT/A(0) singly labeled polypeptide clearly demonstrates that single BoNT/A(0) molecules transported into neurons can be visualized using specialized high resolution microscopy techniques.

После демонстрации того, что однократное мечение BoNT/A(0) может быть визуализировано на уровне единичной молекулы в первичных нейронах, этот способ может быть далее применен в отношении других серотипов и производных клостридиального нейротоксина, включая серотипы, обладающие активностью нецитотоксической протеазы.After demonstrating that single BoNT/A(0) labeling can be visualized at the single molecule level in primary neurons, this method can be further applied to other serotypes and clostridial neurotoxin derivatives, including serotypes with non-cytotoxic protease activity.

Все публикации, упомянутые в приведенном выше описании, включены в настоящее описание в качестве ссылки. Различные модификации и изменения описанных способов и систем по настоящему изобретению станут очевидными специалистам в данной области без отклонения от объема и сущности настоящего изобретения. Хотя настоящее изобретение описано применительно к конкретным предпочтительным вариантам осуществления, следует понимать, что заявленное изобретение не должно чрезмерно ограничиваться такими конкретными вариантами осуществления. Действительно, подразумевается, что различные модификации описанных способов осуществления изобретения, которые являются очевидными в области биохимии и биотехнологии или родственных областях, входят в объем прилагаемой ниже формулы изобретения.All publications mentioned in the above description are included in the present description by reference. Various modifications and variations of the described methods and systems of the present invention will become apparent to those skilled in the art without departing from the scope and spirit of the present invention. Although the present invention has been described in connection with specific preferred embodiments, it should be understood that the claimed invention should not be unduly limited to such specific embodiments. Indeed, various modifications of the described methods of carrying out the invention, which are obvious in the field of biochemistry and biotechnology or related fields, are intended to be included in the scope of the following claims.

Claims (74)

1. Способ получения меченого полипептида, включающий:1. A method for producing a labeled polypeptide, including: a. получение полипептида, содержащего:a. obtaining a polypeptide containing: i. акцепторный участок для сортазы или донорный участок для сортазы;i. an acceptor site for sortase or a donor site for sortase; ii. нецитотоксическую протеазу, содержащую L-цепь клостридиального нейротоксина, или ее протеолитически неактивный мутант;ii. a non-cytotoxic protease containing the L-chain of clostridial neurotoxin, or a proteolytically inactive mutant thereof; iii. нацеливающую часть (TM), которая способна связываться с участком связывания на клетке-мишени; иiii. a targeting portion (TM) that is capable of binding to a binding site on a target cell; And iv. домен транслокации;iv. translocation domain; b. инкубацию полипептида с:b. incubation of the polypeptide with: сортазой; иsortase; And меченым субстратом, содержащим донорный участок для сортазы или акцепторный участок для сортазы, соответственно, и конъюгированную поддающуюся детекции метку;a labeled substrate containing a sortase donor site or an acceptor site for sortase, respectively, and a conjugated detectable label; где сортаза катализирует:where sortase catalyzes: конъюгацию между аминокислотой акцепторного участка для сортазы в полипептиде и аминокислотой донорного участка для сортазы в меченом субстрате; илиconjugation between an amino acid of a sortase acceptor site in the polypeptide and an amino acid of a sortase donor site in the labeled substrate; or конъюгацию между аминокислотой акцепторного участка для сортазы в меченом субстрате и аминокислотой донорного участка для сортазы в полипептиде;conjugation between an amino acid of a sortase acceptor site in the labeled substrate and an amino acid of a sortase donor site in the polypeptide; с осуществлением тем самым мечения полипептида; иthereby effecting labeling of the polypeptide; And c. получение меченого полипептида, где меченый полипептид не имеет сниженную эффективность по сравнению с эквивалентным немеченым полипептидом и/или где меченый полипептид демонстрирует сходное связывание клеток, транслокацию и расщепление белка SNARE с эквивалентным немеченым полипептидом.c. obtaining a labeled polypeptide, where the labeled polypeptide has no reduced efficiency compared to the equivalent unlabeled polypeptide and/or where the labeled polypeptide shows similar cell binding, translocation and cleavage of the SNARE protein with the equivalent unlabeled polypeptide. 2. Способ по п.1, где:2. The method according to claim 1, where: a. акцепторный или донорный участок для сортазы находится с C-концевой стороны от TM или где акцепторный или донорный участок для сортазы находится с N-концевой стороны от нецитотоксической протеазы или ее протеолитически неактивного мутанта; и/илиa. the sortase acceptor or donor site is C-terminal of the TM or where the sortase acceptor or donor site is N-terminal of the non-cytotoxic protease or a proteolytically inactive mutant thereof; and/or b. b. i. акцепторный участок для сортазы содержит: L(A/P/S)X(T/S/A/C)(G/A); NPQTN; YPRTG; IPQTG; VPDTG; или LPXTGS, где X представляет собой любую аминокислоту; и/или i. the acceptor site for sortase contains: L(A/P/S)X(T/S/A/C)(G/A); NPQTN; YPRTG; IPQTG; VPDTG; or LPXTGS, where X is any amino acid; and/or ii. где донорный участок для сортазы содержит Gn или An, где n равен 1-10; илиii. where the donor site for sortase contains G n or A n where n is 1-10; or c. c. i. акцепторный участок для сортазы содержит: L(A/P/S)X(T/S/A/C)G, где X представляет собой любую аминокислоту; NPQTN; YPRTG; IPQTG; VPDTG; или LPXTGS, где X представляет собой любую аминокислоту; и/или i. the acceptor site for sortase contains: L(A/P/S)X(T/S/A/C)G, where X is any amino acid; NPQTN; YPRTG; IPQTG; VPDTG; or LPXTGS, where X is any amino acid; and/or ii. где донорный участок для сортазы содержит Gn, где n равен 1-10; и/илиii. where the donor site for sortase contains G n where n is 1-10; and/or d. сортаза представляет собой сортазу A (SrtA).d. sortase is sortase A (SrtA). 3. Способ по п. 1, где:3. The method according to claim 1, where: a. акцепторный или донорный участок для сортазы находится с C-концевой стороны от TM или где акцепторный или донорный участок для сортазы находится с N-концевой стороны от нецитотоксической протеазы или ее протеолитически неактивного мутанта; и/илиa. the sortase acceptor or donor site is C-terminal of the TM or where the sortase acceptor or donor site is N-terminal of the non-cytotoxic protease or a proteolytically inactive mutant thereof; and/or b.b. i. L(A/P/S)X(T/S/A/C)G, где X представляет собой любую аминокислоту; NPQTN; YPRTG; IPQTG; VPDTG; или LPXTGS, где X представляет собой любую аминокислоту; и/илиi. L(A/P/S)X(T/S/A/C)G, where X is any amino acid; NPQTN; YPRTG; IPQTG; VPDTG; or LPXTGS, where X is any amino acid; and/or ii. где донорный участок для сортазы состоит из Gn или An, где n равен 1-10; или ii. where the donor site for sortase consists of Gnor An, where n equals 1-10; or c.c. i. акцепторный участок для сортазы состоит из: L(A/P/S)X(T/S/A/C)G, где X представляет собой любую аминокислоту; NPQTN; YPRTG; IPQTG; VPDTG; или LPXTGS, где X представляет собой любую аминокислоту; и/илиi. the acceptor site for sortase consists of: L(A/P/S)X(T/S/A/C)G, where X is any amino acid; NPQTN; YPRTG; IPQTG; VPDTG; or LPXTGS, where X is any amino acid; and/or ii. где донорный участок для сортазы состоит из Gn, где n равен 1-10; и/илиii. where the donor site for sortase consists of G n where n is 1-10; and/or d. сортаза представляет собой сортазу A (SrtA).d. sortase is sortase A (SrtA). 4. Способ по п.1, где полипептид содержит по меньшей мере два акцепторных участка для сортазы; по меньшей мере два донорных участка для сортазы; или по меньшей мере один акцепторный участок для сортазы и по меньшей мере один донорный участок для сортазы.4. The method according to claim 1, where the polypeptide contains at least two acceptor sites for sortase; at least two sortase donor sites; or at least one sortase acceptor site and at least one sortase donor site. 5. Способ по п.4, где по меньшей мере два участка различаются, предпочтительно где по меньшей мере два участка имеют различные аминокислотные последовательности,5. The method according to claim 4, where at least two sections are different, preferably where at least two sections have different amino acid sequences, где:Where: первый акцепторный или донорный участок для сортазы находится с C-концевой стороны от TM и второй акцепторный или донорный участок для сортазы находится с N-концевой стороны от нецитотоксической протеазы или ее протеолитически неактивного мутанта; илиthe first sortase acceptor or donor site is C-terminal of the TM and the second sortase acceptor or donor site is N-terminal of the non-cytotoxic protease or a proteolytically inactive mutant thereof; or первый акцепторный или донорный участок для сортазы находится с N-концевой стороны от нецитотоксической протеазы или ее протеолитически неактивного мутанта и второй акцепторный или донорный участок для сортазы находится с C-концевой стороны от TM.the first sortase acceptor or donor site is N-terminal of the non-cytotoxic protease or a proteolytically inactive mutant thereof; and the second sortase acceptor or donor site is C-terminal of the TM. 6. Меченый полипептид для его визуализации, содержащий:6. Labeled polypeptide for its visualization, containing: i. поддающуюся детекции метку, конъюгированную с полипептидом;i. a detectable label conjugated to the polypeptide; ii. аминокислотную последовательность, которая содержит:ii. amino acid sequence that contains: a. L(A/P/S)X(T/S/A/C)Gn, где X представляет собой любую аминокислоту и n равен 1-10; a. L(A/P/S)X(T/S/A/C)G n where X is any amino acid and n is 1-10; b. L(A/P/S)X(T/S/A/C)An, где X представляет собой любую аминокислоту и n равен 1-10; b. L(A/P/S)X(T/S/A/C)A n , where X is any amino acid and n is 1-10; c. NPQTN; c. NPQTN; d. YPRTG; d. YPRTG; e. IPQTG; e. IPQTG; f. VPDTG; или f. VPDTG; or g. LPXTGS, где X представляет собой любую аминокислоту;g. LPXTGS, where X is any amino acid; iii. нецитотоксическую протеазу, содержащую L-цепь клостридиального нейротоксина, или ее протеолитически неактивный мутант;iii. a non-cytotoxic protease containing the L-chain of clostridial neurotoxin, or a proteolytically inactive mutant thereof; iv. нацеливающую часть (TM), которая способна связываться с участком связывания на клетке-мишени; иiv. a targeting portion (TM) that is capable of binding to a binding site on a target cell; And v. домен транслокации,v. translocation domain, где меченый полипептид не имеет сниженную эффективность по сравнению с эквивалентным немеченым полипептидом и/или где меченый полипептид демонстрирует сходное связывание клеток, транслокацию и расщепление белка SNARE с эквивалентным немеченым полипептидом.where the labeled polypeptide has no reduced potency compared to an equivalent unlabeled polypeptide and/or where the labeled polypeptide exhibits similar cell binding, translocation and cleavage of the SNARE protein to an equivalent unlabeled polypeptide. 7. Меченый полипептид по п.6, где:7. Labeled polypeptide according to claim 6, where: a. аминокислотная последовательность, которая содержит: L(A/P/S)X(T/S/A/C)Gn; L(A/P/S)X(T/S/A/C)An; NPQTN; YPRTG; IPQTG; VPDTG; или LPXTGS, находится с C-концевой стороны от TM; или a. an amino acid sequence that contains: L(A/P/S)X(T/S/A/C)G n ; L(A/P/S)X(T/S/A/C)A n ; NPQTN; YPRTG; IPQTG; VPDTG; or LPXTGS, located on the C-terminal side of the TM; or b. где аминокислотная последовательность, которая содержит: L(A/P/S)X(T/S/A/C)Gn; L(A/P/S)X(T/S/A/C)An; NPQTN; YPRTG; IPQTG; VPDTG; или LPXTGS, находится с N-концевой стороны от нецитотоксической протеазы или ее протеолитически неактивного мутанта.b. where the amino acid sequence that contains: L(A/P/S)X(T/S/A/C)G n ; L(A/P/S)X(T/S/A/C)A n ; NPQTN; YPRTG; IPQTG; VPDTG; or LPXTGS, is N-terminal to a non-cytotoxic protease or a proteolytically inactive mutant thereof. 8. Меченый полипептид по п.6, содержащий дополнительную поддающуюся детекции метку, конъюгированную с полипептидом, и дополнительную аминокислотную последовательность, которая содержит:8. A labeled polypeptide according to claim 6, containing an additional detectable label conjugated to the polypeptide and an additional amino acid sequence that contains: a. L(A/P/S)X(T/S/A/C)Gn, где X представляет собой любую аминокислоту и n равен 1-10; a. L(A/P/S)X(T/S/A/C)G n where X is any amino acid and n is 1-10; b. L(A/P/S)X(T/S/A/C)An, где X представляет собой любую аминокислоту и n равен 1-10; b. L(A/P/S)X(T/S/A/C)A n , where X is any amino acid and n is 1-10; c. NPQTN; c. NPQTN; d. YPRTG; d. YPRTG; e. IPQTG; e. IPQTG; f. VPDTG; или f. VPDTG; or g. LPXTGS, где X представляет собой любую аминокислоту.g. LPXTGS where X is any amino acid. 9. Меченый полипептид по п.8, где9. Labeled polypeptide according to claim 8, where a. аминокислотная последовательность по п.6 отличается от дополнительной аминокислотной последовательности; и/илиa. the amino acid sequence of claim 6 is different from the additional amino acid sequence; and/or b. аминокислотная последовательность по п.6 находится с C-концевой стороны от TM, и дополнительная аминокислотная последовательность находится с N-концевой стороны от нецитотоксической протеазы или ее протеолитически неактивного мутанта; илиb. the amino acid sequence of claim 6 is C-terminal of TM and the additional amino acid sequence is N-terminal of the non-cytotoxic protease or proteolytically inactive mutant thereof; or аминокислотная последовательность по п.6 находится с N-концевой стороны от нецитотоксической протеазы или ее протеолитически неактивного мутанта и дополнительная аминокислотная последовательность находится с C-концевой стороны от TM.the amino acid sequence of claim 6 is N-terminal from the non-cytotoxic protease or proteolytically inactive mutant thereof, and the additional amino acid sequence is from the C-terminal side of TM. 10. Способ по любому из пп. 1-5 или меченый полипептид по любому из пп. 6-9, где домен транслокации включает домен транслокации клостридиального нейротоксина; и/или где TM представляет собой HC-пептид клостридиального нейротоксина.10. The method according to any one of paragraphs. 1-5 or labeled polypeptide according to any one of paragraphs. 6-9, where the translocation domain includes a clostridial neurotoxin translocation domain; and/or where TM is an HC -peptide of a clostridial neurotoxin. 11. Способ по любому из пп. 1-5 или меченый полипептид по любому из пп. 6-9, где полипептид представляет собой клостридиальный нейротоксин; и/илигде полипептид представляет собой ботулинический нейротоксин (BoNT); и/или где полипептид выбран из: BoNT/A, BoNT/B, BoNT/C, BoNT/D, BoNT/E, BoNT/F, BoNT/G, BoNT/X или TeNT.11. The method according to any one of paragraphs. 1-5 or labeled polypeptide according to any one of paragraphs. 6-9, where the polypeptide is a clostridial neurotoxin; and/or where the polypeptide is a botulinum neurotoxin (BoNT); and/or where the polypeptide is selected from: BoNT/A, BoNT/B, BoNT/C, BoNT/D, BoNT/E, BoNT/F, BoNT/G, BoNT/X or TeNT. 12. Способ по любому из пп. 1-5 или меченый полипептид по любому из пп. 6-9, где полипептид не содержит функционального домена HС клостридиального нейротоксина.12. The method according to any one of paragraphs. 1-5 or labeled polypeptide according to any one of paragraphs. 6-9, where the polypeptide does not contain a functional H domainWITHclostridial neurotoxin. 13. Способ определения по меньшей мере интернализации и/или внутриклеточного транспорта меченого полипептида, включающий:13. A method for determining at least the internalization and/or intracellular transport of a labeled polypeptide, comprising: a. приведение клетки-мишени в контакт с меченым полипептидом по п.6; иa. bringing the target cell into contact with the labeled polypeptide according to claim 6; And b. детекцию поддающейся детекции метки.b. detecting a detectable label. 14. Способ по любому из пп. 1-5 или 13 или меченый полипептид по любому из пп. 6-9, где поддающаяся детекции метка представляет собой флуоресцентный краситель, предпочтительно где флуоресцентный краситель выбран из: HiLyte, AlexaFluor, Atto, Quantum Dots и Janelia Fluor.14. The method according to any one of paragraphs. 1-5 or 13 or a labeled polypeptide according to any one of paragraphs. 6-9 wherein the detectable label is a fluorescent dye, preferably wherein the fluorescent dye is selected from: HiLyte, AlexaFluor, Atto, Quantum Dots and Janelia Fluor. 15. Способ по любому из пп. 1-5 или 13 или меченый полипептид по любому из пп. 6-9, где меченый полипептид содержит две или более поддающихся детекции меток, предпочтительно где две или более поддающихся детекции меток представляют собой флуорофоры разного цвета.15. The method according to any one of paragraphs. 1-5 or 13 or a labeled polypeptide according to any one of paragraphs. 6-9, wherein the labeled polypeptide contains two or more detectable labels, preferably wherein the two or more detectable labels are different colored fluorophores.
RU2021121995A 2019-01-16 2020-01-16 Sortase-labeled clostridia neurotoxins RU2801120C2 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
GB1900621.2 2019-01-16

Publications (2)

Publication Number Publication Date
RU2021121995A RU2021121995A (en) 2023-01-26
RU2801120C2 true RU2801120C2 (en) 2023-08-02

Family

ID=

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011091419A2 (en) * 2010-01-25 2011-07-28 New York Universiy Recombinant derivatives of botulinum neurotoxins engineered for trafficking studies and neuronal delivery
WO2011133704A2 (en) * 2010-04-20 2011-10-27 Whitehead Institute For Biomedical Researh Modified polypeptides and proteins and uses thereof
WO2014183066A2 (en) * 2013-05-10 2014-11-13 Whitehead Institute For Biomedical Research Protein modification of living cells using sortase
RU2670135C2 (en) * 2014-05-29 2018-10-18 Проуселл Терапьютикс Инк. Novel cell penetrating peptide, conjugate thereof with botulinum toxin, and use thereof

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011091419A2 (en) * 2010-01-25 2011-07-28 New York Universiy Recombinant derivatives of botulinum neurotoxins engineered for trafficking studies and neuronal delivery
WO2011133704A2 (en) * 2010-04-20 2011-10-27 Whitehead Institute For Biomedical Researh Modified polypeptides and proteins and uses thereof
WO2014183066A2 (en) * 2013-05-10 2014-11-13 Whitehead Institute For Biomedical Research Protein modification of living cells using sortase
RU2670135C2 (en) * 2014-05-29 2018-10-18 Проуселл Терапьютикс Инк. Novel cell penetrating peptide, conjugate thereof with botulinum toxin, and use thereof

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ANTOS J. M. et al. Site-Specific N- and C-Terminal Labeling of a Single Polypeptide Using Sortases of Different Specificity. J. AM. CHEM. SOC., 2009, v.131, p.10800-10801. *
FISCHER A. et al. Botulinum Neurotoxin Devoid of Receptor Binding Domain Translocates Active Protease. PLoS Pathogens, 2008, v.4, no.12, e1000245, p.1-9. *
POPP M. et al. Sortagging: a versatile method for protein labeling. Nature Chemical Biology, 2007, v.3, no.11, p.707-708. doi:10.1038/nchembio.2007.31. *

Similar Documents

Publication Publication Date Title
US10744190B2 (en) Method for suppressing spasmodic torticollis
ES2436816T3 (en) Non-cytotoxic fusion proteins comprising EGF muteins
RU2651492C2 (en) Therapeutic fusion proteins
AU2019348732B2 (en) Clostridial neurotoxins comprising an exogenous activation loop
JP2012518403A5 (en)
CA2392202C (en) Constructs for delivery of therapeutic agents to neuronal cells
TW201639876A (en) Chimeric polypeptides
KR20220070284A (en) Non-toxic Clostridial Neurotoxin Polypeptides for Use in Treating Neurological Disorders
JP2020039349A (en) Suppression of itch
US20150353908A1 (en) Therapeutics for suppressing osteoporosis
US20220118113A1 (en) Sortase-labelled clostridium neurotoxins
RU2801120C2 (en) Sortase-labeled clostridia neurotoxins
AU2022242859A1 (en) Clostridial neurotoxins comprising an exogenous activation loop
WO2024069175A1 (en) Clostridial neurotoxins comprising an activating endosomal protease cleavage site
WO2024069176A1 (en) Clostridial neurotoxins comprising an activating exogenous protease cleavage site