RU2782212C2

RU2782212C2 - Гликозилированные слитые белки vwf с улучшенной фармакокинетикой

Info

Publication number: RU2782212C2
Application number: RU2018144112A
Authority: RU
Inventors: Кристоф КАННИХТ; Барбара СОЛЕЦКА-ВИТУЛСКА; Стефан ВИНГЕ; Тило ШВИНТЕК
Original assignee: Октафарма Аг
Priority date: 2016-05-20
Filing date: 2017-04-26
Publication date: 2022-10-24

Abstract

Изобретение относится к биотехнологии. Представлен слитый белок, содержащий основной белок и один или более пептиды удлинения, где аминокислотная последовательность основного белка идентична или схожа с аминокислотной последовательностью белка крови человека или его фрагмента. Причем указанный(е) пептид(ы) удлинения содержит(ат) кластер O-гликозилированных аминокислот с по меньшей мере двумя О-гликозилированными аминокислотами и имеет(ют) идентичность последовательности по меньшей мере 90% к SEQ ID NO: 1. Также представлены: композиция первого белка и второго белка для лечения или профилактики нарушения свертываемости крови, комплекс, образованный слитым белком, полинуклеотид, кодирующий слитый белок, вектор, клетка-хозяин, содержащей полинуклеотид, применение слитого белка для повышения времени полужизни второго белка и применение фармацевтической композиции или комплекса для лечения или профилактики нарушения свертываемости крови. Изобретение позволяет получить слитый белок, который имеет повышенное время полужизни по сравнению с основным белком и его можно использовать для повышения времени полужизни партнера по связыванию. 8 н. и 23 з.п. ф-лы, 3 табл., 4 ил., 3 пр.

Description

ОБЛАСТЬ ИЗОБРЕТЕНИЯ

Изобретение относится к пролонгированию времени полужизни белков, в частности, факторов свертывания человека, таких как фактор фон Виллебранда (VWF) и фактор VIII (FVIII).

ПРЕДПОСЫЛКИ ИЗОБРЕТЕНИЯ

Гемофилия является группой наследственных генетических нарушений, влияющих на способность организма контролировать свертывание крови или коагуляцию. При наиболее распространенной форме, гемофилии A, наблюдают недостаточность фактора свертывания VIII (FVIII). Гемофилия A встречается с частотой приблизительно 1 на 5000-10000 рожденных мальчиков. Белок FVIII является необходимым кофактором для свертывания крови с многофункциональными свойствами. Недостаточность FVIII можно лечить с использованием полученных из плазмы концентратов FVIII или рекомбинантно полученного FVIII. Лечение концентратами FVIII приводит к нормализации жизни пациентов с гемофилией.

Пациентов с гемофилией A лечат с использованием FVIII по мере необходимости или в качестве профилактического терапевтического средства, вводимого несколько раз в неделю. В случае профилактического лечения 15-25 МЕ/кг массы тела FVIII вводят три раза в неделю, что необходимо в связи с постоянной потребностью в FVIII и его небольшого времени полужизни в кровотоке, составляющем у людей всего приблизительно 11 часов (Ewenstein et al., 2004).

В крови в нормальных условиях молекула FVIII всегда связана со своим кофактором фактором фон Виллебранда (VWF), защищающим молекулу FVIII от различных форм дегенерации. Нековалентный комплекс FVIII и VWF имеет высокую аффинность связывания 0,2-0,3 нМ (Vlot et al., 1996).

Исторически сложилось так, что гемофилию A лечили с использованием FVIII, полученного из плазмы крови человека. Однако, с 1990-х гг. на рынке появились различные рекомбинантно полученные белки FVIII. Однако, ни полученные из плазмы, ни полученные рекомбинантно белки FVIII не имеют оптимальных фармакокинетических свойств. Подобно многим другим терапевтическим белкам, они подвергаются метаболическому кругообороту под действием пептидаз, что значительно ограничивает их время полужизни in vivo.

Как описано Tiede et al. (2015), попытки пролонгирования времени полужизни FVIII включают слияние с Fc (элоктат, элокта, эфмороктоког альфа), добавление полиэтиленгликоля (туроктоког альфа пегол [N8-GP], BAY 94-9027, BAX 855) и одноцепочечную конструкцию (CSL627). С помощью всех этих технологий изменяют молекулу FVIII, и это приводит к пролонгированному приблизительно в 1,5 раз времени полужизни FVIII.

Дальнейшее увеличение времени полужизни FVIII ограничено временем полужизни VWF. Как показано Yee et al., домена D'D3 VWF человека достаточно для стабилизации FVIII в плазме. Однако, слитый белок D'D3-Fc способен увеличивать время полужизни FVIII только у мышей VWF-/-. У мышей с гемофилией A конструкция D'D3-Fc не приводит к пролонгированию времени полужизни FVIII по причине неэффективной конкуренции фрагментов белка с эндогенным VWF за связывание FVIII.

В WO 2014/011819 A2 описывают успешное пролонгирование времени полужизни конструкции FVIII, содержащей домен D'D3 VWF, домен Fc IgG и XTEN. Т.к. эта конструкция не связывается с эндогенным VWF, тот же эффект пролонгирования времени полужизни наблюдают у мышей с двойным нокаутом VWF/FVIII (DKO) и мышей с гемофилией A. Однако, хотя конструкция полностью функциональна in vitro, она проявляет значительно сниженную активность in vivo.

Другие подходы для повышения времени полужизни терапевтических белков включают генетическое слияние терапевтического белка с белком с природно большим временем полужизни, таким как трансферрин и альбумин, или с белковыми доменами, такими как C-концевой пептид (CTP) хорионического гонадотропина (CG).

CG принадлежит к семейству гликопротеиновых гормонов, включающему лютеинизирующий гормон (LH), фолликулостимулирующий гормон (FSH) и тиреотропный гормон (TSH). Эти гликогормоны являются гетеродимерами и состоят из общей α-субъединицы и уникальных β-субъединиц, придающих им разные активности. Время полужизни CG человека (hCG) значительно больше времени полужизни LH, FSH и TSH. Показано, что O-гликозилированный CTP hCG-β отвечает за пролонгирование его времени полужизни. Описывают, что CTP состоит из последовательности FQSSSS*KAPPPS*LPSPS*RLPGPS*DTPILPQ, содержащей четыре участка O-гликозилирования (обозначенных как S*) (Birken et al., 1977).

Как описано Strohl et al (2015), разработаны различные слитые белки терапевтического белка и CTP, и сейчас они проходят клинические исследования. Терапевтические белки включают FSH (Elonva®), FVIIa, FIX, IFN-β и оксинтомодулин.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

Настоящее изобретение, помимо прочего, основано на обнаружении того, что добавление кластера O-гликозилированных аминокислот (присутствующего в полноразмерном VWF человек) к фрагменту VWF приводит к значительному повышению его времени полужизни. Время полужизни слитого белка пролонгируют по сравнению с фрагментом VWF без дополнительного O-гликанового кластера.

Таким образом, в первом аспекте изобретение относится к слитому белку, содержащему основной белок и по меньшей мере один пептид удлинения, где аминокислотная последовательность основного белка идентична или схожа с аминокислотной последовательностью белка млекопитающего, такого как VWF, или его фрагмента, и указанный пептид удлинения содержит кластер O-гликозилированных аминокислот.

Примечательно, что пептид удлинения, включающий кластер O-гликозилированных аминокислот, добавляемых к фрагменту VWF, получают из этого конкретного белка, а именно VWF. Таким образом, авторы настоящего изобретения определяли общий принцип повышения времени полужизни белков. Этим общим принципом является добавление внутреннего кластера O-гликозилированных аминокислот белка к указанному белку или его фрагменту.

Таким образом, в предпочтительном варианте осуществления слитого белка по первому аспекту аминокислотная последовательность одного или нескольких пептидов удлинения идентична или схожа с неповторяющейся частью аминокислотной последовательности указанного белка млекопитающего или фрагмента, в частности, указанного основного белка.

Другим выводом из результатов, полученных авторами настоящего изобретения, является то, что кластер O-гликозилированных аминокислот VWF, определенный в SEQ ID NO: 1, применим в качестве пептида для увеличения времени полужизни.

Т.к. свойство увеличения времени полужизни не ограничено VWF, в дополнительном предпочтительном варианте осуществления первого аспекта один или более пептидов удлинения имеют идентичность последовательности по меньшей мере 90%, предпочтительно - по меньшей мере 95%, более предпочтительно - по меньшей мере 98%, наиболее предпочтительно - по меньшей мере 100% по отношению к O-гликозилированному пептиду VWF, в частности, SEQ ID NO: 1.

Во втором аспекте изобретение относится к полинуклеотиду, кодирующему слитый белок по первому аспекту.

В третьем аспекте изобретение относится к вектору, содержащему полинуклеотид по второму аспекту.

В четвертом аспекте изобретение относится к клетке-хозяину, содержащей полинуклеотид по второму аспекту или вектор по третьему аспекту, где клетка-хозяин представляет собой клетку млекопитающего.

Авторы настоящего изобретения обнаружили, что повышается не только время полужизни VWF, но также и время полужизни его партнера по связыванию FVIII. Таким образом, в пятом аспекте изобретение относится к применению слитого белка по первому аспекту для повышения времени полужизни второго белка, где слитый белок способен связываться с указанным вторым белком.

Таким образом, в полученном комплексе или композиции слитого белка и второго белка второй белок также имеет повышенное время полужизни.

Таким образом, в шестом аспекте изобретение относится к композиции первого белка и второго белка, где указанный первый белок является слитым белком по первому аспекту и способен связываться с указанным вторым белком, и указанный второй белок является терапевтическим белком, содержащим аминокислотную последовательность, идентичную или схожую с аминокислотной последовательностью второго белка млекопитающего или его фрагмента.

В седьмом аспекте изобретение относится к комплексу первого белка и второго белка, где указанный первый белок является слитым белком по первому аспекту, и указанный второй белок имеет аминокислотную последовательность, идентичную или схожую с аминокислотной последовательностью второго белка млекопитающего или его фрагмента.

И наконец, в восьмом аспекте, изобретение также относится к фармацевтической композиции, содержащей слитый белок по первому аспекту, композицию по шестому аспекту или комплекс по седьмому аспекту, для применения в лечении или профилактике нарушения свертываемости, предпочтительно выбранного из лечения PUP или лечения ITI и другого родственного нарушения свертываемости.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

На фиг. 1 схематически представлены A) фрагмент VWF OCTA 11, и B) слитый белок по изобретению с фрагментом VWF в качестве основного белка: OCTA 12; C) слитый белок по изобретению с фрагментом VWF в качестве основного белка: OCTA14; D) слитый белок по изобретению с фрагментом VWF в качестве основного белка: OCTA15.

На фиг. 2 представлена временная зависимость активности FVIII после внутривенного введения FVIII, составленного совместно с разными белками VWF или полученным из плазмы полноразмерного VWF, в плазме мышей с двойным нокаутом (DKO) FVIII/VWF. Точки данных и планки погрешностей соответствуют среднему значению и стандартному отклонению (SD) для 5 значений. Из-за небольшого размера несколько из планок погрешностей неразличимы.

На фиг. 3 представлена временная зависимость концентрации антигена OCTA 12 после подкожного введения 100 ед./кг FVIII, составленного совместно с OCTA 12, в плазме карликовой свиньи.

На фиг. 4 представлена временная зависимость концентрации антигена FVIII после подкожной и внутривенной инъекции 100 ед./кг FVIII или подкожной инъекции 100 ед./кг FVIII, составленного совместно с белком VWF OCTA 12, в плазме карликовой свиньи.

ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ

Для обеспечения четкого и последовательного понимания описания и формулы изобретения и объема, данного этим терминам, представлены следующие определения.

Определения

В рамках изобретения "пептид" может состоять из любого количества аминокислот любого типа, предпочтительно, природных аминокислот, предпочтительно, соединенных пептидными связями. В частности, пептид содержит по меньшей мере 3 аминокислоты, предпочтительно - по меньшей мере 5, по меньшей мере 7, по меньшей мере 9, по меньшей мере 12 или по меньшей мере 15 аминокислот. Кроме того, нет верхнего предела длины пептида. Однако, предпочтительно, длина пептида по изобретению не превышает 500 аминокислот, более предпочтительно - не превышает 300 аминокислот; даже более предпочтительно - не превышает 250 аминокислот.

Таким образом, термин "пептид" включает термин "олигопептиды", как правило, относящийся к пептидам с длиной от 2 до 10 аминокислот, и термин "полипептиды", как правило, относящийся к пептидам с длиной более 10 аминокислот.

В рамках изобретения "белок" может содержать одну или несколько полипептидных цепей. Белки с несколькими полипептидными цепями часто экспрессируются в виде одной полипептидной цепи с одного гена и расщепляются посттрансляционно. Таким образом, термины "полипептид" и "белок" используют взаимозаменяемо. В рамках изобретения полипептиды и белки включают химически синтезированные белки, а также природно синтезированные белки, кодируемые генами. Полипептиды или белки можно получать из природного источника, такого как кровь человека, или в культуре клеток в виде рекомбинантных белков.

В рамках изобретения термин "терапевтический белок" относится к белкам или полипептидам с терапевтическим эффектом, т.е. белкам, используемым в качестве активного фармацевтического ингредиента.

По изобретению термины "предшественник белка", "про-белок" или "про-пептид" относятся к неактивному белку (или пептиду), который можно превращать в активную форму посредством посттрансляционной модификации, ферментативного расщепления части аминокислотной последовательности.

Родство между двумя аминокислотными последовательностями или двумя нуклеотидными последовательностями описывают с помощью параметра "идентичность последовательности". В целях по настоящему изобретению, степень идентичности последовательности между двумя аминокислотными последовательностями определяют с использованием алгоритма Needleman-Wunsch (Needleman and Wunsch, 1970, J. Mol. Biol. 48: 443-453), реализованного в программе Needle в пакете EMBOSS (EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000, Trends Genet. 16: 276-277), предпочтительно, версии 3.0.0 или более поздней версии. Необязательными используемыми параметрами являются штраф за открытие пропуска 10, штраф за увеличение пропуска 0,5 и подстановочная матрица EBLOSUM62 (EMBOSS-версия BLOSUM62). Выходные данные Needle, помеченные как "наибольшая идентичность" (полученные с использованием опции "no brief"), используют в качестве процента идентичности и вычисляют следующим образом:

(Идентичные остатки×100)/(длина выравнивания - общее количество пропусков при выравнивании).

В целях по настоящему изобретению, степень идентичности последовательности между двумя нуклеотидными последовательностями определяют с использованием алгоритма Needleman-Wunsch (Needleman and Wunsch, 1970, выше) реализованного в программе Needle в пакете EMBOSS (EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000, Trends Genet. 16: 276-277), предпочтительно, версии 3.0.0 или более поздней версии. Необязательными используемыми параметрами являются штраф за открытие пропуска 10, штраф за увеличение пропуска 0,5 и подстановочная матрица EDNAFULL (EMBOSS-версия NCBI NUC4.4). Выходные данные Needle, помеченные как "наибольшая идентичность" (полученные с использованием опции "no brief"), используют в качестве процента идентичности и вычисляют следующим образом:

(Идентичные дезоксирибонуклеотиды×100)/(длина выравнивания - общее количество пропусков при выравнивании)

В рамках изобретения термины "сходство" и "схожий" в отношении определения пептида или полинуклеотида относятся к определенной степени идентичности аминокислотной последовательности или нуклеотидной последовательности по отношению к референсу. Принято, чтобы схожая аминокислотная последовательность включала аминокислотную последовательность, по меньшей мере на 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или даже 99% идентичную рассматриваемой последовательности. Как правило, схожие последовательности будут включать одинаковые остатки в положениях, важные для функционирования пептида или полинуклеотида, такие как остатки в активном центре или гликозилированные аминокислоты, однако они могут включать любое количество консервативных аминокислотных замен. Принято, чтобы схожая нуклеотидная последовательность включала нуклеотидную последовательность, по меньшей мере на 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или даже 99% идентичную рассматриваемой последовательности.

В рамках изобретения термин "идентичный" относится к 100% идентичности аминокислотной или нуклеотидной последовательности по отношению к референсной последовательности.

Термин "рекомбинантный" при использовании по отношению к клетке, нуклеиновой кислоте, белку или вектору свидетельствует о том, что клетку, нуклеиновую кислоту, белок или вектор модифицировали посредством встраивания гетерологичной нуклеиновой кислоты или белка или изменения нативной нуклеиновой кислоты или белка, или что клетку получают из клетки, модифицированной таким образом. Таким образом, например, рекомбинантные клетки экспрессируют гены, не обнаруживаемые в нативной (нерекомбинантной) форме клетки, или экспрессируют нативные гены на иных уровнях или в иных условиях, чем в природе.

В рамках изобретения термин "время полужизни" представляет собой время, необходимое концентрации в плазме/крови, чтобы снизиться на 50% после достигнутого псевдоравновесия распределения (в соответствии с определением в Toutain et al., 2005). Термин "время полужизни" также обозначают как "время полужизни в кровотоке", "конечный период полувыведения" или "время полувыведения".

В рамках изобретения термины "трансформированный", "стабильно трансформированный" и "трансгенный", используемые в отношении клетки, означают, что клетка содержит ненативную (например, гетерологичную) последовательность нуклеиновой кислоты, интегрированную в ее геном или содержащуюся в виде эписомы, поддерживаемую во множестве поколений.

В рамках изобретения термин "фрагмент" относится к полипептиду, имеющему амино-концевую и/или карбокси-концевую делецию одной или нескольких аминокислот по сравнению с нативным белком или белком дикого типа, но в котором остальная аминокислотная последовательность идентична соответствующим положениям в аминокислотной последовательности, прослеживаемой из полноразмерной кДНК. Фрагменты, как правило, составляют по меньшей мере 50 аминокислот в длину.

В рамках изобретения термин "гликозилирование" относится к присоединению гликанов к молекулам, например, белкам. Гликозилирование может являться ферментативной реакцией. Присоединение может осуществляться с помощью ковалентных связей. Таким образом, в рамках изобретения гликозилированный полипептид является полипептидом, к которому присоединены один или множество гликанов. Фраза "высокогликозилированный" относится к молекуле, такой как фермент, гликозилированный по всем или почти всем из доступных участков гликозилирования, например O-сцепленным или N-сцепленным участкам гликозилирования.

В рамках изобретения термин "гликан" относится к полисахариду, или олигосахариду, или углеводной части гликопротеина или гликозилированного полипептида. Гликаны могут являться гомо- или гетерополимерами моносахаридных остатков. Они могут являться линейными или разветвленными молекулами. Гликаны, как правило, содержат по меньшей мере три сахара и могут являться линейными или разветвленными. Гликан может включать природные остатки сахаров (например, глюкозу, N-ацетилглюкозамин, N-ацетилнейраминовую кислоту, N-ацетилгалактозамин, галактозу, маннозу, фукозу, арабинозу, рибозу, ксилозу и т.д.) и/или модифицированные сахара (например, 2′-фторрибозу, 2′-дезоксирибозу, фосфоманнозу, 6′-сульфо-N-ацетилглюкозамин и т.д.).

В рамках изобретения термин "O-гликаны" относится к гликанам, как правило, обнаруживаемым ковалентно связанными с остатками серина и треонина гликопротеинов млекопитающих. O-гликаны могут являться α-сцепленными через остаток N-ацетилгалактозамина (GalNAc) с -OH серина или треонина O-гликозидной связью. Другие связи включают гликаны с α-сцепленной O-фукозой, β-сцепленной O-ксилозой, α-сцепленной O-маннозой, β-сцепленным O-GlcNAc (N-ацетилглюкозамином), α- или β-сцепленной O-галактозой и α- или β-сцепленной O-глюкозой.

В рамках изобретения термины "кластер O-гликозилирования", "O-гликановый кластер" и "кластер O-гликозилированных аминокислот" используют взаимозаменяемо, и они относятся к двум или более O-гликозилированным аминокислотам.

В рамках изобретения термин "сиалированный" относится к молекулам, в частности, гликанам, прореагировавшим с сиаловой кислотой или ее производными.

Переходный термин "содержащий", являющийся синонимом для терминов "включающий" или "отличающийся", является включительным или открытым и не исключает дополнительные, неперечисленные элементы или стадии способа. Переходная фраза "состоящий из" исключает любой элемент, стадию или ингредиент, не указанный в формуле изобретения, за исключением примесей, как правило, связанных с ними. Если фраза "состоит из" фигурирует в пункте формулы изобретения, а не сразу после преамбулы, она ограничивает только элемент, указанный в пункте; другие элементы не исключены из формулы изобретения в целом. Переходная фраза "состоящий, по существу, из" ограничивает объем формулы изобретения конкретными материалами или стадиями "и тем, что материально не влияет на основные и новые характеристики" описываемого в заявке изобретения. "Пункт "состоящий, по существу, из" охватывает среднюю позицию между замкнутыми пунктами, написанными в формате "состоящий из" и полностью открытыми пунктами, составленными в формате "содержащий"".

В контексте изобретения по практическим соображениям термин "гликозилированный белок", такой как слитый белок, используют в единственном числе. Как правило, на практике, белки встречаются в композиции белковых молекул одного типа. Однако в случае гликозилированных белков гликозилирование не будет идентичным в каждой молекуле композиции. Например, не все отдельные молекулы композиции могут являться гликозилированными на 100%. Кроме того, могут иметь место различия в гликанах, связанных со специфическим O-участком гликозилирования. Таким образом, в настоящей заявке ссылка на "слитый белок" также относится к композиции молекул слитых белков с идентичными аминокислотными последовательностями, но различиями в структуре O-гликана.

В рамках изобретения термины "аффинность связывания" или "аффинность" свидетельствуют о силе связывания между двумя молекулами, в частности, лигандом и белком-мишенью. На аффинности связывания влияют нековалентные межмолекулярные взаимодействия между двумя молекулами, такие как водородные связи, электростатические взаимодействия, гидрофобные взаимодействия и вандерваальсовы силы.

В рамках изобретения термин "иммунный ответ" относится к адаптивному или врожденному иммунному ответу. Термин "врожденный иммунный ответ" относится к неспецифическим защитным механизмам, активирующимся сразу или в течение нескольких часов после появления антигена в организме. Эти механизмы включают физические барьеры, такие как кожа, химические вещества в крови и клетки иммунной системы, атакующие чужеродные клетки в организме. Врожденный иммунный ответ активируется химическими свойствами антигена. Адаптивный иммунный ответ относится к антиген-специфическому иммунному ответу. В связи с этим, антиген сначала должен быть подвергнут обработке и распознаванию. После распознавания антигена адаптивная иммунная система создает большое количество иммунных клеток, конкретно предназначенных для воздействия на этот антиген.

Слитый белок

В первом аспекте изобретение относится к слитому белку, содержащему основной белок и по меньшей мере один пептид удлинения, где аминокислотная последовательность основного белка является идентичной или схожей с аминокислотной последовательностью белка млекопитающего или его фрагмента, и указанный пептид удлинения содержит кластер O-гликозилированных аминокислот.

Авторы настоящего изобретения идентифицировали модификацию белков, приводящую к повышению времени полужизни, а именно, добавление пептида удлинения, содержащего кластер O-гликозилированных аминокислот. Как показано в примерах, слияние кластера O-гликозилирования 1 VWF человека в качестве пептида удлинения с фрагментом VWF приводит к получению слитого белка (OCTA 12) с повышенным временем полужизни по сравнению с фрагментом VWF (OCTA 11) в отдельности.

Время полужизни (t_1/2) можно вычислять посредством линейного регрессионного анализа линейно-логарифмической части отдельных кривых концентрация в плазме-время или посредством нелинейной регрессии с использованием однофазной модели экспоненциального уменьшения. Примерами программного обеспечения для вычисления являются GraphPad Prism версии 6.07 (La Jolla, CA 92037 USA) и WinNonlin версии 6,4 (Pharsight Corporation, Mountain View, CA, USA).

Вычисления основаны на следующих уравнениях:

K_el=константа скорости элиминации

t_½=время полувыведения

c=концентрация

t=время

Таким образом, в одном из вариантов осуществления слитый белок имеет повышенное время полужизни по сравнению с основным белком без пептида удлинения.

Т.к. можно было повысить время полужизни фрагмента VWF с использованием кластера гликозилированных аминокислот, полученного из VWF, авторы настоящего изобретения идентифицировали новый принцип пролонгирования времени полужизни. Т.е. повышение времени полужизни белка или фрагмента белка посредством добавления кластера O-гликозилированных аминокислот, также присутствующего в природном белке.

Таким образом, в одном из вариантов осуществления слитого белка аминокислотная последовательность одного или нескольких пептидов удлинения является идентичной или схожей с частью указанного белка млекопитающего. Эта часть белка млекопитающего, в частности, является неповторяющейся аминокислотной последовательностью.

В рамках изобретения неповторяющаяся аминокислотная последовательность является последовательностью, обнаруживаемой в природном белке млекопитающего по изобретению только в одной копии. Таким образом, неповторяющаяся аминокислотная последовательность явно исключает какие-либо повторяющиеся природные последовательности в белках. В частности, последовательность считают повторяющейся, если последовательность состоит из более чем 20 аминокислот, предпочтительно - более чем 15 аминокислот, более предпочтительно - более чем 10 аминокислот, и белок млекопитающего содержит несколько этих последовательностей.

Повторяющиеся последовательности можно получать из так называемых тандемных повторов с переменным количеством звеньев. Тандемный повтор с переменным количеством звеньев (VNTR) является участком в геноме, где короткая нуклеотидная последовательность организована в виде "тандемного повтора". "Тандемные повторы" встречаются в ДНК, когда паттерн из одного или нескольких нуклеотидов повторяется и повторы являются непосредственно смежными друг с другом. VNTR обнаруживают на многих хромосомах, и часто наблюдают вариации их длины от индивидуума к индивидууму. В случае, когда тандемные повторы локализуются в белок-кодирующих последовательностях ДНК, это приводит к повторам в аминокислотной последовательности. Примерами являются тандемные повторы, обнаруживаемые во всех членах семейства муциновых белков. Муцины являются семейством высокомолекулярных, сильно гликозилированных белков, продуцируемых эпителиальными тканями в большинстве организмов царства Животных. Неповторяющаяся аминокислотная последовательность по изобретению явно исключает такие тандемные повторы в аминокислотной последовательности, в частности, муциновые тандемные повторы.

Пептид удлинения не только можно получать из того же белка млекопитающего, что и основной белок, но, более конкретно, он может содержать часть, также присутствующую в основном белке. Таким образом, в одном из вариантов осуществления аминокислотная последовательность одного или нескольких пептидов удлинения является идентичной или схожей с частью неповторяющейся аминокислотной последовательности указанного основного белка.

Предпочтительно, один или более пептидов удлинения не получают из β-субъединицы хорионического гонадотропина (CG-β). Показано, что C-концевой пептид (CTP) β-субъединицы хорионического гонадотропина повышает время полужизни других белков, таких как FSH, FVIIa и FIX. Однако, в случае, когда был описан hCG с дополнительным CTP, т.е. несколькими копиями CTP, этот белок конкретно исключен из объекта настоящего изобретения. Таким образом, в частности, пептид удлинения не является идентичным или схожим с CTP CG-β.

По настоящему изобретению две или более O-гликозилированных аминокислот в непосредственной близости в аминокислотной последовательности считают кластером. Таким образом, в одном из вариантов осуществления слитого белка кластер O-гликозилированных аминокислот по меньшей мере одного пептида удлинения содержит по меньшей мере две O-гликозилированных аминокислоты. Кластер может содержать, например, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 или 15 O-гликозилированных аминокислот.

Теоретически, эффект повышения времени полужизни основан на отрицательном заряде O-гликанов. Таким образом, эффект пролонгирования времени полужизни должен повышаться с количеством O-гликозилированных аминокислот в кластере. Таким образом, кластер, предпочтительно, содержит по меньшей мере три O-гликозилированных аминокислоты. Как показано в примерах, значительного эффекта повышения времени полужизни достигали с использованием пептида удлинения с кластером из четырех O-гликозилированных аминокислот. Таким образом, в предпочтительном варианте осуществления кластер содержит по меньшей мере четыре O-гликозилированных аминокислоты.

В дополнение к O-гликозилированным аминокислотам кластера также могут присутствовать N-гликозилированные аминокислоты. Предпочтительно, в кластере O-гликозилирования нет N-гликозилированных аминокислотов.

В случае наличия нескольких пептидов удлинения, кластеры пептидов удлинения могут содержать разное количество O-гликозилированных аминокислот. Например, слитый белок может содержать один кластер с двумя и второй кластер с четырьмя O-гликозилированными аминокислотами. Кроме того, один кластер может содержать три участка O-гликозилирования, а другой - четыре участка O-гликозилирования.

O-гликозилированные аминокислоты пептида удлинения могут являться O-гликозилированными аминокислотами серином (Ser) и треонином (Thr) муцинового типа. Однако, в этой области также известны O-гликозилированный тирозин (Tyr), гидроксилизин (гидрокси-Lys) или гидроксипролин (гидрокси-Pro). Таким образом, одну или несколько O-гликозилированных аминокислот в слитом белке, в частности, в пептиде удлинения, можно выбирать из Ser, Thr, Tyr, гидрокси-Lys и гидрокси-Pro.

Пептид удлинения, слитый с фрагментом VWF в OCTA 12, что приводит к пролонгированию времени полужизни указанного фрагмента, содержит O-гликозилированные остатки треонина и остатки серина. Таким образом, в одном из вариантов осуществления первого аспекта кластер O-гликозилированных аминокислот содержит по меньшей мере один O-гликозилированный треонин. Предпочтительно, указанный кластер содержит и треонин, и серин в качестве O-гликозилированных аминокислот. Примечательно, что пептид удлинения OCTA 12 содержит два соседних остатка треонина, являющихся O-гликозилированными. Таким образом, в одном из вариантов осуществления пептид удлинения содержит по меньшей мере два соседних O-гликозилированных остатка треонина.

Как описано выше, полагают, что отрицательный заряд поверхности белка, генерируемый O-гликанами, приводит к пролонгированию времени полужизни. Не желая быть связанными какой-либо теорией, полагают, что для проявления эффекта необходимы два или более O-гликана в непосредственной близости. Эффект может быть слабым или отсутствовать, если пропуски между O-гликанами являются слишком большими, т.е. при менее чем одной O-гликозилированной аминокислоте на 15 аминокислот. Таким образом, в одном из вариантов осуществления слитого белка по меньшей мере один пептид удлинения содержит по меньшей мере одну O-гликозилированную аминокислоту на 15 аминокислот.

Более предпочтительно, по меньшей мере один пептид удлинения содержит по меньшей мере один O-участок гликозилирования на 10 аминокислот. Как показано в примерах, тестируемый пептид удлинения содержит кластеры с одним O-участком гликозилирования на 8 аминокислот. Таким образом, в предпочтительном варианте осуществления один или более кластеров содержат по меньшей мере один участок гликозилирования на 8 аминокислот.

Длину пептида удлинения определяют в соответствии с двумя разными аспектами. Пептид удлинения должен быть достаточно длинным, чтобы содержать участки распознавания, способствующие гликозилированию O-гликозилированных аминокислот. Таким образом, пептид удлинения должен составлять по меньшей мере 10 аминокислот в длину. С другой стороны, чем короче пептид удлинения, тем менее вероятно, что он будет мешать структурной целостности или активности и, таким образом, терапевтическому эффекту основного белка. Таким образом, пептид удлинения не должен превышать 100 аминокислот. В одном из вариантов осуществления один или более пептидов удлинения имеют длину в диапазоне от 15 до 60 аминокислот. Чтобы позволить четырем аминокислотам быть O-гликозилированными в пептиде удлинения, длина, предпочтительно, должна составлять в диапазоне от 22 до 40 аминокислот. Более предпочтительно, длина пептида удлинения приблизительно равна длине пептидов удлинения в OCTA 12, т.е. в диапазоне от 26 до 36 аминокислот. В одном из вариантов осуществления один или более пептидов удлинения имеют длину приблизительно 31 аминокислота.

Результаты, полученные авторами настоящего изобретения, не только приводят к выводу о принципе добавления одной или нескольких копий O-гликозилированного пептида, естественным образом присутствующего в белке, для повышения времени полужизни того же белка или его фрагмента. Кроме того, эти результаты свидетельствуют о том, что конкретный O-гликозилированный пептид VWF, по аналогии с CTP, может повышать время полужизни других белков, т.е. белков в целом.

Таким образом, в одном из вариантов осуществления один или более пептидов удлинения имеют идентичность последовательности по меньшей мере 90% по отношению к O-гликозилированному пептиду VWF человека. Этот полученный из VWF человека пептид удлинения можно подвергать слиянию с другими белками млекопитающих или их фрагментами, такими как FVIII. Идентичность последовательности одного или нескольких пептидов удлинения, предпочтительно, составляет по меньшей мере 95% по отношению к O-гликозилированному пептиду VWF человека. Более предпочтительно, идентичность последовательности составляет по меньшей мере 98%. Наиболее предпочтительно, последовательность пептида удлинения является идентичной O-гликозилированному пептиду VWF человека.

O-гликозилированный пептид VWF человека включает предпочтительно, по меньшей мере, частично, кластер 2O-гликозилирования VWF (аминокислоты 1238-1268 SEQ ID NO: 2): QEPGGLVVPPTDAPVSPTTLYVEDISEPPLH (SEQ ID NO: 1) или его вариант. Таким образом, в одном из вариантов осуществления пептид удлинения имеет идентичность последовательности по отношению к SEQ ID NO: 1 по меньшей мере 90%. Идентичность последовательности по отношению к SEQ ID NO: 1, предпочтительно, составляет по меньшей мере 95%. Более предпочтительно, идентичность последовательности пептида удлинения по отношению к SEQ ID NO: 1 составляет по меньшей мере 98%. Наиболее предпочтительно, один или более пептидов удлинения имеют идентичность последовательности 100% по отношению к SEQ ID NO: 1.

Основной белок основан на белке млекопитающего, т.е. содержит аминокислотную последовательность, схожую или идентичную белку млекопитающего или его фрагменту. Белок млекопитающего, в частности, является белком человека.

Белок млекопитающего, по отношению к которому аминокислотная последовательность основного белка является схожей или идентичной, может являться гликозилированным белком. В одном из вариантов осуществления слитого белка основной белок содержит гликозилированную часть белка млекопитающего. В другом варианте осуществления основной белок содержит по меньшей мере один кластер O-гликозилированных аминокислот. Этот кластер O-гликозилированных аминокислот может являться идентичным кластеру O-гликозилированных аминокислот в пептиде удлинения.

Белок млекопитающего, на котором основан основной белок, более предпочтительно, является белком крови. В одном из вариантов осуществления белок млекопитающего является белком крови человека.

Белок крови млекопитающего может являться фактором свертывания, транспортным белком, ингибитором протеазы, иммуноглобулином, клеточным белком плазмы, аполипопротеином, фактором комплемента, фактором роста, антиангиогенным белком, сильно гликозилированным белком, фактором крови или другим белком крови.

Фактор свертывания, в частности, фактор свертывания человека, предпочтительно, выбран из группы, состоящей из фибриногена (FI), протромбина (FII), тканевого фактора (FIII), FV, FVII, FVIII, FIX, FX, FXI, FXII, и FXIII, VWF и ADAMTS13.

Следует понимать, что факторы свертывания FI, FII, FV, FVII, FVIII, FIX, FX, FXI, FXII, и FXIII могут находиться в неактивной или активированной форме. Таким образом, в контексте по изобретению, ссылка на FI, FII, FV, FVII, FVIII, FIX, FX, FXI, FXII, и FXIII включает активированные формы FIa (фибрина), FIIa (тромбина), FVa, FIXa, FVIIa, FVIIIa, FXa, FXIa, FXIIa и FXIIIa, соответственно, если четко не указано иное или это не следует из контекста, активированную форму исключают логически. Таким образом, например, в этом контексте FI, FII, FV, FIX, FVII, FVIII, FX, FXI, FXII и FXIII можно читать как FI/FIa, FII/FIIa, FV/FVa, FVII/FVIIa, FVIII/FVIIIa, FIX/FXIa, FX/FXa, FXI/FXIa, FXII/FXIIa и FXIII/FXIIIa.

Транспортный белок, в частности, транспортный белок человека, можно выбирать из альбумина, трансферрина, церулоплазмина, гаптоглобина, гемоглобина и гемопексина.

В одном из вариантов осуществления белок млекопитающего является ингибитором протеазы, в частности, ингибитором протеазы человека. Примерами таких ингибиторов протеаз являются β-антитромбин, α-антитромбин, прелатентный антитромбин, окисленный антитромбин, 2-макроглобулин, ингибитор C1, ингибитор пути тканевого фактора (TFPI), кофактор гепарина II, ингибитор протеина C (PAI-3), протеин C, протеин S и протеин Z.

Примерами иммуноглобулинов являются поликлональные антитела (IgG), моноклональные антитела, IgG1, IgG2, IgG3, IgG4, IgA, IgA1, IgA2, IgM, IgE, IgD и белок Бенс-Джонса.

Клеточно-родственный белок плазмы может являться, например, фибронектином, тромбоглобулином или тромбоцитарным фактором 4. Примерами аполипопротеинов являются апо-A-I, апо-A-II и апо-E.

Факторами комплемента по изобретению являются, например, фактор B, фактор D, фактор H, фактор I, инактиватор C3b, пропердин, C4-связывающий белок и т.д.

Примеры факторов роста включают фактор роста тромбоцитов (PDGF), эпидермальный фактор роста (EGF), трансформирующий фактор роста альфа (TGF-α), трансформирующий фактор роста бета (TGF-α), фактор роста фибробластов (FGF) и фактор роста гепатоцитов (HGF).

Антиангиогенные белки включают латентный антитромбин, прелатентный антитромбин, окисленный антитромбин и плазминоген.

Примерами сильно гликозилированных белков являются альфа-1-кислый гликопротеин, антихимотрипсин, интер-α-ингибитор трипсина, α-2-HS-гликопротеин, C-реактивный белок.

Факторами крови могут являться, например, эритропоэтин, интерферон, опухолевые факторы, tPA или gCSF.

Другие белки крови человека включают богатый гистидином гликопротеин, маннозосвязывающий лектин, C4-связывающий белок, фибронектин, GC-глобулин, плазминоген/плазмин, α-1-микроглобулин, C-реактивный белок.

Белок млекопитающего, в частности, выбран из VWF человека, фибриногена, протромбина, FIII, FV, FVII, FVIII, FIX, FX, FXI, FXII, FXIII, ADAMTS13, антитромбина, альфа-1-антитрипсина, ингибитора C1, антихимотрипсина, PAI-1, PAI-3, 2-макроглобулина, TFPI, кофактора гепарина II, протеина Z, протеина C и протеина S.

Фактор VIII у людей кодируется геном F8, содержащим 187000 пар оснований в шести экзонах. Транскрибируемая мРНК имеет длину 9029 пар оснований и транслируется в белок из 2351 аминокислоты, из которого удалены 19 аминокислот. Молекула FVIII у людей гликозилирована по 31 аминокислоте, 25 из которых N-гликозилированы и 6 - O-гликозилированы (см. Kannicht et al., 2013).

После трансляции цепь аминокислот расщепляется специфическими протеазами в определенных положениях, что приводит к образованию тяжелой цепи из приблизительно 200 кДа и легкой цепи из приблизительно 80 кДа. Организация доменов, как правило, представляет собой A1-A2-B-A3-C1-C2. Легкая цепь состоит из доменов A3-C1-C2. Тяжелая цепь, в принципе, состоит из доменов A1-A2-B. Тяжелые цепи, обнаруживаемые в плазме, имеют гетерогенную композицию с молекулярными массами, варьирующимися от 90 до 200 кДа. Причиной этого является гетерогенность его гликозилирования, существование вариантов сплайсинга и существование протеолитических продуктов, таких как лишенная домена B тяжелая цепь A1-A2. Аминокислотную последовательность полноразмерного FVIII определяют по аминокислотам 20-2351 P00451 в UniProtKB, версии последовательности 1 от 21 июля 1986 года (в дальнейшем UniProtKB P00451.1).

В одном из вариантов осуществления белок млекопитающего, по отношению к которому основной белок является схожим или идентичным, является полноразмерным FVIII человека, определенным по аминокислотам 20-2351 UniProtKB P00451.1. В другом варианте осуществления основной белок является FVIII, в котором отсутствует, по меньшей мере, часть B-домена. В связи с этим, может отсутствовать весь B-домен. Отсутствующую часть B-домена, необязательно, заменяют линкером. Линкерная последовательность, в частности, содержит последовательность следующих аминокислот SFSQNSRHQAYRYRRG (SEQ ID NO: 12). Примером FVIII, в котором B-домен заменяют линкером, является симоктоког альфа, активный ингредиент Nuwiq^® или Vihuma^®. Симоктоког альфа имеет следующую последовательность:

ATRRYYLGAVELSWDYMQSDLGELPVDARFPPRVPKSFPFNTSVVYKKTLFVEFTDHLFNIAKPRPPWMGLLGPTIQAEVYDTVVITLKNMASHPVSLHAVGVSYWKASEGAEYDDQTSQREKEDDKVFPGGSHTYVWQVLKENGPMASDPLCLTYSYLSHVDLVKDLNSGLIGALLVCREGSLAKEKTQTLHKFILLFAVFDEGKSWHSETKNSLMQDRDAASARAWPKMHTVNGYVNRSLPGLIGCHRKSVYWHVIGMGTTPEVHSIFLEGHTFLVRNHRQASLEISPITFLTAQTLLMDLGQFLLFCHISSHQHDGMEAYVKVDSCPEEPQLRMKNNEEAEDYDDDLTDSEMDVVRFDDDNSPSFIQIRSVAKKHPKTWVHYIAAEEEDWDYAPLVLAPDDRSYKSQYLNNGPQRIGRKYKKVRFMAYTDETFKTREAIQHESGILGPLLYGEVGDTLLIIFKNQASRPYNIYPHGITDVRPLYSRRLPKGVKHLKDFPILPGEIFKYKWTVTVEDGPTKSDPRCLTRYYSSFVNMERDLASGLIGPLLICYKESVDQRGNQIMSDKRNVILFSVFDENRSWYLTENIQRFLPNPAGVQLEDPEFQASNIMHSINGYVFDSLQLSVCLHEVAYWYILSIGAQTDFLSVFFSGYTFKHKMVYEDTLTLFPFSGETVFMSMENPGLWILGCHNSDFRNRGMTALLKVSSCDKNTGDYYEDSYEDISAYLLSKNNAIEPRSFSQNSRHQAYRYRRGEITRTTLQSDQEEIDYDDTISVEMKKEDFDIYDEDENQSPRSFQKKTRHYFIAAVERLWDYGMSSSPHVLRNRAQSGSVPQFKKVVFQEFTDGSFTQPLYRGELNEHLGLLGPYIRAEVEDNIMVTFRNQASRPYSFYSSLISYEEDQRQGAEPRKNFVKPNETKTYFWKVQHHMAPTKDEFDCKAWAYFSDVDLEKDVHSGLIGPLLVCHTNTLNPAHGRQVTVQEFALFFTIFDETKSWYFTENMERNCRAPCNIQMEDPTFKENYRFHAINGYIMDTLPGLVMAQDQRIRWYLLSMGSNENIHSIHFSGHVFTVRKKEEYKMALYNLYPGVFETVEMLPSKAGIWRVECLIGEHLHAGMSTLFLVYSNKCQTPLGMASGHIRDFQITASGQYGQWAPKLARLHYSGSINAWSTKEPFSWIKVDLLAPMIIHGIKTQGARQKFSSLYISQFIIMYSLDGKKWQTYRGNSTGTLMVFFGNVDSSGIKHNIFNPPIIARYIRLHPTHYSIRSTLRMELMGCDLNSCSMPLGMESKAISDAQITASSYFTNMFATWSPSKARLHLQGRSNAWRPQVNNPKEWLQVDFQKTMKVTGVTTQGVKSLLTSMYVKEFLISSSQDGHQWTLFFQNGKVKVFQGNQDSFTPVVNSLDPPLLTRYLRIHPQSWVHQIALRMEVLGCEAQDLY (SEQ ID NO: 13)

VWF является мультимерным адгезивным гликопротеином, присутствующим в плазме млекопитающих, обладающим множеством физиологических функций. При первичном гемостазе, VWF действует в качестве медиатора между специфическими рецепторами на поверхности тромбоцитов и компонентами внеклеточного матрикса, такими как коллаген. Кроме того, VWF служит в качестве носителя и стабилизирующего белка для прокоагулянта фактора VIII. VWF синтезируется в эндотелиальных клетках и мегакариоцитах в качестве молекулы-предшественника из 2813 аминокислот.

Организация доменов VWF, как правило, представляет собой Til3-D3-TIL4-A1-A2-A3-D4-C1-C2-C3-CK.

Полипептид-предшественник, пре-про-VWF, состоит из сигнального пептида из 22 остатков, про-пептида из 741 остатка (домены D1-D2) и полипептида из 2050 остатков, обнаруживаемого в зрелом факторе фон Виллебранда в плазме (Fischer et al., 1994). Полноразмерный VWF определен в записи P04275 UniprotKB (версия записи 224 от 12 апреля 2017 года).

VWF человека по настоящему изобретению имеет аминокислотную последовательность любой из последовательностей указанной UniprotKB P04275, в частности, SEQ ID NO: 2 (изоформа 1). VWF содержит два кластера O-гликозилированных аминокислот. Первый кластер O-гликозилированных аминокислот обнаруживают между аминокислотами 1238-1268 SEQ ID NO: 2. Второй кластер включает аминокислоты 1468-1487 SEQ ID NO: 2.

После секреции в плазму VWF циркулирует в форме различных молекул разного размера. Эти молекулы VWF состоят из олиго- и мультимеров зрелой субъединицы из 2050 аминокислотных остатков. VWF, как правило, можно обнаружить в плазме в качестве мультимеров с диапазоном размеров приблизительно от 500 до 20000 кДа (Furlan et al., 1996).

В одном из вариантов осуществления основной белок имеет аминокислотную последовательность, идентичную или схожую с последовательностью зрелого VWF человека.

В другом варианте осуществления основной белок имеет аминокислотную последовательность, схожую или идентичную последовательности фрагмента VWF человека.

Например, в фрагменте VWF человека могут отсутствовать один или более доменов A1, A2, A3, D4, C1, C2, C3, CK относительно зрелого VWF человека (Til3-D3-TIL4-A1-A2-A3-D4-C1-C2-C3-CK). Фрагмент VWF, например, может иметь организацию доменов, выбранную из следующей группы, состоящей из Til3-D3-TIL4-A1, Til3-D3-TIL4-A1-A2, Til3-D3-TIL4-A1-A2-A3, Til3-D3-TIL4-A1-A2-A3-D4, Til3-D3-TIL4-A1-A2-A3-D4-C1, Til3-D3-TIL4-A1-A2-A3-D4-C1-C2 и Til3-D3-TIL4-A1-A2-A3-D4-C1-C2-C3-CK.

В связи с этим, фрагмент VWF человека, в частности, является фрагментом, начинающимся с аминокислоты 764 SEQ ID NO: 2. Аминокислоты 764-1035 SEQ ID NO: 2 содержат FVIII-связывающий домен VWF.

Основной белок, например, может содержать фрагмент VWF, как определено в WO 2015/185758 A2. Как представлено в WO 2015/185758 A2, комплекс FVIII и фрагментов VWF, как определено, проявляет сниженное связывание с фосфолипидными мембранами по сравнению с FVIII в отдельности, а также сниженное связывание с коллагеном III и гепарином по сравнению с комплексом FVIII и полноразмерного VWF.

Фрагмент VWF, предпочтительно, начинающийся с аминокислоты 764 SEQ ID NO: 2, предпочтительно, заканчивается аминокислотой в диапазоне 1905-2153 SEQ ID NO: 2. В одном из вариантов осуществления фрагмент VWF заканчивается аминокислотой VWF в диапазоне 2030-2153 SEQ ID NO: 2. В дополнительном варианте осуществления изобретения фрагмент VWF заканчивается аминокислотой в диапазоне 2100-2153 SEQ ID NO: 2.

В одном из вариантов осуществления основной белок имеет аминокислотную последовательность, схожую или идентичную аминокислотам 764-1268 SEQ ID NO: 2. В одном из вариантов осуществления аминокислотная последовательность основного белка имеет идентичность по меньшей мере 90% по отношению к аминокислотам 764-1268 SEQ ID NO: 2. Аминокислотная последовательность основного белка также может иметь идентичность по меньшей мере 95% по отношению к аминокислотам 764-1268 SEQ ID NO: 2. Кроме того, идентичность аминокислотной последовательности основного белка по отношению к аминокислотам 764-1268 SEQ ID NO: 2 может составлять по меньшей мере 98%. В частности, аминокислотная последовательность основного белка может иметь идентичность 100% по отношению к аминокислотам 764-1268 SEQ ID NO: 2.

В одном из вариантов осуществления основной белок имеет аминокислотную последовательность, схожую или идентичную аминокислотам 764-1905 SEQ ID NO: 2. В одном из вариантов осуществления аминокислотная последовательность основного белка имеет идентичность по меньшей мере 90% по отношению к аминокислотам 764-1905 SEQ ID NO: 2. Аминокислотная последовательность основного белка также может иметь идентичность по меньшей мере 95% по отношению к аминокислотам 764-1905 SEQ ID NO: 2. Кроме того, идентичность аминокислотной последовательности основного белка по отношению к аминокислотам 764-1905 SEQ ID NO: 2 может составлять по меньшей мере 98%. В частности, аминокислотная последовательность основного белка может иметь идентичность 100% по отношению к аминокислотам 764-1905 SEQ ID NO: 2.

Слитый белок может содержать любое количество пептидов удлинения, например, один, два, три, четыре, пять, шесть, семь, восемь, девять или десять пептидов удлинения. Слитый белок OCTA 12 содержит две копии пептида удлинения и проявляет значительное повышение времени полужизни по сравнению с фрагментом VWF OCTA 11. Таким образом, в одном из вариантов осуществления слитый белок содержит по меньшей мере два пептида удлинения.

Следует понимать, что эффект пролонгирования времени полужизни, по меньшей мере, частично основан на отрицательном заряде O-гликанов пептида удлинения. Таким образом, повышение количества копий пептида удлинения приводит к дополнительному усилению эффекта пролонгирования времени полужизни. Это подтверждено с помощью OCTA 14, содержащего четыре копии пептида удлинения. Таким образом, в одном из вариантов осуществления слитый белок содержит по меньшей мере четыре пептида удлинения.

С другой стороны, с повышением количества копий пептида удлинения повышается вероятность того, что пептиды удлинения будут мешать структурной целостности или активности и, таким образом, терапевтическому эффекту основного белка. Таким образом, в одном из вариантов осуществления количество пептидов удлинения составляет менее 11.

Слитый белок может содержать дополнительные пептидные компоненты помимо основного белка и пептидов удлинения. В частности, помимо пептида удлинения по изобретению слитый белок может содержать дополнительные пептиды для пролонгирования времени полужизни, такие как CTP, XTEN, трансферрин или его фрагменты, альбумин или его фрагменты.

Также возможно, что основной белок является фрагментом белка млекопитающего, и слитый белок содержит дополнительный фрагмент того же белка млекопитающего. В частности, два фрагмента разделяют одним или несколькими пептидами удлинения. Примером такого белка является OCTA 15, содержащий аминокислоты 764-1268 VWF, два пептида удлинения с последовательностью SEQ ID NO: 1 и "домен цистеиновый узел" VWF, состоящий из аминокислот 2721-2813 SEQ ID NO: 2.

В слитом белке один или более пептидов удлинения можно соединять с N-концом или C-концом основного белка. В частности, слитый белок может содержать один или более пептидов удлинения, соединенных с N-концом, и один или более пептидов удлинения, соединенных с C-концом основного белка.

Т.к. слитый белок может содержать дополнительные пептиды помимо основного белка и одного или нескольких пептидов удлинения. Таким образом, пептиды удлинения можно напрямую или косвенно соединять с основным белком. В связи с этим, термин "соединенный напрямую" означает, что аминокислотные последовательности основного белка и пептида удлинения являются смежными. Термин "косвенно соединенные" означает, что между основным белком и пептидом удлинения находится дополнительный пептид. В частности, линкерный пептид может находиться между основным белком и пептидом удлинения. Линкер может содержать участок расщепления, что делает пептид удлинения отщепляемым от основного белка.

Основной белок, один или более пептидов удлинения и, необязательно, дополнительные пептиды можно получать, соединяя гены, кДНК или последовательности, кодирующие их. Таким образом, основной белок, один или более пептидов удлинения и, необязательно, дополнительные пептиды соединены пептидными связями. По изобретению, пептиды слитого белка фактически можно соединять с помощью других линкеров, таких как химические линкеры или гликозидные связи. Предпочтительно, пептиды слитого белка соединены пептидными связями.

В одном из вариантов осуществления пептид удлинения напрямую соединяют с C-концом основного белка. В частности, слитый белок содержит по меньшей мере два последовательных пептида удлинения, соединенных с C-концом основного белка.

Слитый белок можно соединять с двумя или несколькими аффинными метками. Примерами аффинных меток являются полигистидин, протеин A, глутатион-S-трансфераза, вещество P, FLAG, стрептавидин и константная область тяжелой цепи иммуноглобулина. Хотя аффинная метка, как правило, является частью аминокислотной последовательности полной конструкции, ее не считают частью слитого белка. Одну или несколько аффинных меток, предпочтительно, соединяют с C-концом или N-концом слитого белка. В случае, когда слитый белок соединяют с одной или несколькими аффинными метками, он, предпочтительно, содержит участок расщепления между аффинной меткой и остальной частью белка, что делает аффинную метку отщепляемой, например, посредством расщепления протеазами.

В одном из вариантов осуществления один пептид удлинения образует N-конец слитого белка. Как описано выше, N-концевую аминокислоту указанного пептида удлинения, необязательно, соединяют с аффинной меткой. В одном из вариантов осуществления один пептид удлинения образует C-конец слитого белка. Как описано выше, C-концевую аминокислоту указанного пептида удлинения, необязательно, соединяют с аффинной меткой.

В одном из вариантов осуществления слитый белок содержит по меньшей мере 4, предпочтительно - по меньшей мере 8, более предпочтительно - по меньшей мере 12 дополнительных O-гликанов по сравнению с основным белком.

В одном из вариантов осуществления слитый белок содержит домен димеризации; в частности, основной белок содержит домен димеризации. В VWF димеры образуются посредством связывания CK-доменов. Таким образом, в случае, когда основной белок является фрагментом VWF, он, предпочтительно, содержит CK-домен.

Типичным слитым белком по изобретению является OCTA 12. OCTA 12 имеет следующую аминокислотную последовательность (SEQ ID NO: 3):

SLSCRPPMVKLVCPADNLRAEGLECTKTCQNYDLECMSMGCVSGCLCPPGMVRHENRCVALERCPCFHQGKEYAPGETVKIGCNTCVCQDRKWNCTDHVCDATCSTIGMAHYLTFDGLKYLFPGECQYVLVQDYCGSNPGTFRILVGNKGCSHPSVKCKKRVTILVEGGEIELFDGEVNVKRPMKDETHFEVVESGRYIILLLGKALSVVWDRHLSISVVLKQTYQEKVCGLCGNFDGIQNNDLTSSNLQVEEDPVDFGNSWKVSSQCADTRKVPLDSSPATCHNNIMKQTMVDSSCRILTSDVFQDCNKLVDPEPYLDVCIYDTCSCESIGDCACFCDTIAAYAHVCAQHGKVVTWRTATLCPQSCEERNLRENGYECEWRYNSCAPACQVTCQHPEPLACPVQCVEGCHAHCPPGKILDELLQTCVDPEDCPVCEVAGRRFASGKKVTLNPSDPEHCQICHCDVVNLTCEACQEPGGLVVPPTDAPVSPTTLYVEDISEPPLHQEPGGLVVPPTDAPVSPTTLYVEDISEPPLHQEPGGLVVPPTDAPVSPTTLYVEDISEPPLH

OCTA 12 является слитым белком фрагмента VWF, соответствующего аминокислотам 764-1268 SEQ ID NO: 2, и двух копий пептида удлинения (помеченного полужирным шрифтом), связанных с C-концом, состоящим из аминокислот 1238-1268 SEQ ID NO: 2.

В одном из вариантов осуществления аминокислотная последовательность слитого белка имеет идентичность по меньшей мере 90% по отношению к SEQ ID NO: 3. Аминокислотная последовательность слитого белка также может иметь идентичность по меньшей мере 95% по отношению к SEQ ID NO: 3. Кроме того, идентичность аминокислотной последовательности слитого белка по отношению к SEQ ID NO: 3 может составлять по меньшей мере 98%. В частности, аминокислотная последовательность слитого белка может иметь идентичность 100% по отношению к SEQ ID NO: 3.

Следующая последовательность (SEQ ID NO: 4) представляет собой OCTA 12 с дополнительным сигнальным пептидом из 12 аминокислот (выделено полужирным шрифтом и подчеркнуто). При экспрессии этого пептида получают мономерную форму OCTA 12. Сигнальный пептид отщепляется.

MIPARFAGVLLALALILPGTLC SLSCRPPMVKLVCPADNLRAEGLECTKTCQNYDLECMSMGCVSGCLCPPGMVRHENRCVALERCPCFHQGKEYAPGETVKIGCNTCVCQDRKWNCTDHVCDATCSTIGMAHYLTFDGLKYLFPGECQYVLVQDYCGSNPGTFRILVGNKGCSHPSVKCKKRVTILVEGGEIELFDGEVNVKRPMKDETHFEVVESGRYIILLLGKALSVVWDRHLSISVVLKQTYQEKVCGLCGNFDGIQNNDLTSSNLQVEEDPVDFGNSWKVSSQCADTRKVPLDSSPATCHNNIMKQTMVDSSCRILTSDVFQDCNKLVDPEPYLDVCIYDTCSCESIGDCACFCDTIAAYAHVCAQHGKVVTWRTATLCPQSCEERNLRENGYECEWRYNSCAPACQVTCQHPEPLACPVQCVEGCHAHCPPGKILDELLQTCVDPEDCPVCEVAGRRFASGKKVTLNPSDPEHCQICHCDVVNLTCEACQEPGGLVVPPTDAPVSPTTLYVEDISEPPLHQEPGGLVVPPTDAPVSPTTLYVEDISEPPLHQEPGGLVVPPTDAPVSPTTLYVEDISEPPLH (SEQ ID NO: 4)

В одном из вариантов осуществления аминокислотная последовательность слитого белка имеет идентичность по меньшей мере 90% по отношению к SEQ ID NO: 4. Аминокислотная последовательность слитого белка также может иметь идентичность по меньшей мере 95% по отношению к SEQ ID NO: 4. Кроме того, идентичность аминокислотной последовательности слитого белка по отношению к SEQ ID NO: 4 может составлять по меньшей мере 98%. В частности, аминокислотная последовательность слитого белка может иметь идентичность 100% по отношению к SEQ ID NO: 4.

Дополнительным типичным слитым белком по изобретению является про-OCTA 12, включающий OCTA 12 и пропептид (выделен полужирным шрифтом) с сигнальным пептидом (выделен полужирным шрифтом и подчеркнут). Про-OCTA 12 определен в SEQ ID NO: 5:

MIPARFAGVLLALALILPGTLC AEGTRGRSSTARCSLFGSDFVNTFDGSMYSFAGYCSYLLAGGCQKRSFSIIGDFQNGKRVSLSVYLGEFFDIHLFVNGTVTQGDQRVSMPYASKGLYLETEAGYYKLSGEAYGFVARIDGSGNFQVLLSDRYFNKTCGLCGNFNIFAEDDFMTQEGTLTSDPYDFANSWALSSGEQWCERASPPSSSCNISSGEMQKGLWEQCQLLKSTSVFARCHPLVDPEPFVALCEKTLCECAGGLECACPALLEYARTCAQEGMVLYGWTDHSACSPVCPAGMEYRQCVSPCARTCQSLHINEMCQERCVDGCSCPEGQLLDEGLCVESTECPCVHSGKRYPPGTSLSRDCNTCICRNSQWICSNEECPGECLVTGQSHFKSFDNRYFTFSGICQYLLARDCQDHSFSIVIETVQCADDRDAVCTRSVTVRLPGLHNSLVKLKHGAGVAMDGQDVQLPLLKGDLRIQHTVTASVRLSYGEDLQMDWDGRGRLLVKLSPVYAGKTCGLCGNYNGNQGDDFLTPSGLAEPRVEDFGNAWKLHGDCQDLQKQHSDPCALNPRMTRFSEEACAVLTSPTFEACHRAVSPLPYLRNCRYDVCSCSDGRECLCGALASYAAACAGRGVRVAWREPGRCELNCPKGQVYLQCGTPCNLTCRSLSYPDEECNEACLEGCFCPPGLYMDERGDCVPKAQCPCYYDGEIFQPEDIFSDHHTMCYCEDGFMHCTMSGVPGSLLPDAVLSSPLSHRSKRSLSCRPPMVKLVCPADNLRAEGLECTKTCQNYDLECMSMGCVSGCLCPPGMVRHENRCVALERCPCFHQGKEYAPGETVKIGCNTCVCQDRKWNCTDHVCDATCSTIGMAHYLTFDGLKYLFPGECQYVLVQDYCGSNPGTFRILVGNKGCSHPSVKCKKRVTILVEGGEIELFDGEVNVKRPMKDETHFEVVESGRYIILLLGKALSVVWDRHLSISVVLKQTYQEKVCGLCGNFDGIQNNDLTSSNLQVEEDPVDFGNSWKVSSQCADTRKVPLDSSPATCHNNIMKQTMVDSSCRILTSDVFQDCNKLVDPEPYLDVCIYDTCSCESIGDCACFCDTIAAYAHVCAQHGKVVTWRTATLCPQSCEERNLRENGYECEWRYNSCAPACQVTCQHPEPLACPVQCVEGCHAHCPPGKILDELLQTCVDPEDCPVCEVAGRRFASGKKVTLNPSDPEHCQICHCDVVNLTCEACQEPGGLVVPPTDAPVSPTTLYVEDISEPPLHQEPGGLVVPPTDAPVSPTTLYVEDISEPPLHQEPGGLVVPPTDAPVSPTTLYVEDISEPPLH (SEQ ID NO: 5)

Экспрессия про-OCTA 12 приводит к образованию димеров. После расщепления пропептида остаются пропептидные димеры.

В одном из вариантов осуществления аминокислотная последовательность слитого белка имеет идентичность по меньшей мере 90% по отношению к SEQ ID NO: 5. Аминокислотная последовательность слитого белка также может иметь идентичность по меньшей мере 95% по отношению к SEQ ID NO: 5. Кроме того, идентичность аминокислотной последовательности слитого белка по отношению к SEQ ID NO: 5 может составлять по меньшей мере 98%. В частности, аминокислотная последовательность слитого белка может иметь идентичность 100% по отношению к SEQ ID NO: 5.

Дополнительным типичным слитым белком по изобретению является OCTA 14. OCTA 14 имеет следующую аминокислотную последовательность:

SLSCRPPMVKLVCPADNLRAEGLECTKTCQNYDLECMSMGCVSGCLCPPGMVRHENRCVALERCPCFHQGKEYAPGETVKIGCNTCVCQDRKWNCTDHVCDATCSTIGMAHYLTFDGLKYLFPGECQYVLVQDYCGSNPGTFRILVGNKGCSHPSVKCKKRVTILVEGGEIELFDGEVNVKRPMKDETHFEVVESGRYIILLLGKALSVVWDRHLSISVVLKQTYQEKVCGLCGNFDGIQNNDLTSSNLQVEEDPVDFGNSWKVSSQCADTRKVPLDSSPATCHNNIMKQTMVDSSCRILTSDVFQDCNKLVDPEPYLDVCIYDTCSCESIGDCACFCDTIAAYAHVCAQHGKVVTWRTATLCPQSCEERNLRENGYECEWRYNSCAPACQVTCQHPEPLACPVQCVEGCHAHCPPGKILDELLQTCVDPEDCPVCEVAGRRFASGKKVTLNPSDPEHCQICHCDVVNLTCEACQEPGGLVVPPTDAPVSPTTLYVEDISEPPLHQEPGGLVVPPTDAPVSPTTLYVEDISEPPLHQEPGGLVVPPTDAPVSPTTLYVEDISEPPLHQEPGGLVVPPTDAPVSPTTLYVEDISEPPLHQEPGGLVVPPTDAPVSPTTLYVEDISEPPLH (SEQ ID NO: 6)

OCTA 14 является слитым белком фрагмента VWF, соответствующего аминокислотам 764-1268 SEQ ID NO: 2, и четырех копий пептида удлинения (выделены полужирным шрифтом), связанных с C-концом, состоящим из аминокислот 1238-1268 SEQ ID NO: 2.

В одном из вариантов осуществления аминокислотная последовательность слитого белка имеет идентичность по меньшей мере 90% по отношению к SEQ ID NO: 6. Аминокислотная последовательность слитого белка также может иметь идентичность по меньшей мере 95% по отношению к SEQ ID NO: 6. Кроме того, идентичность аминокислотной последовательности слитого белка по отношению к SEQ ID NO: может составлять по меньшей мере 98%. В частности, аминокислотная последовательность слитого белка может иметь идентичность 100% по отношению к SEQ ID NO: 6.

Следующая последовательность (SEQ ID NO: 7) представляет собой OCTA 14 с дополнительным сигнальным пептидом из 12 аминокислот (выделен полужирным шрифтом и подчеркнут). При экспрессии этого пептида получают мономерную форму OCTA 14. Сигнальный пептид отщепляется.

MIPARFAGVLLALALILPGTLC SLSCRPPMVKLVCPADNLRAEGLECTKTCQNYDLECMSMGCVSGCLCPPGMVRHENRCVALERCPCFHQGKEYAPGETVKIGCNTCVCQDRKWNCTDHVCDATCSTIGMAHYLTFDGLKYLFPGECQYVLVQDYCGSNPGTFRILVGNKGCSHPSVKCKKRVTILVEGGEIELFDGEVNVKRPMKDETHFEVVESGRYIILLLGKALSVVWDRHLSISVVLKQTYQEKVCGLCGNFDGIQNNDLTSSNLQVEEDPVDFGNSWKVSSQCADTRKVPLDSSPATCHNNIMKQTMVDSSCRILTSDVFQDCNKLVDPEPYLDVCIYDTCSCESIGDCACFCDTIAAYAHVCAQHGKVVTWRTATLCPQSCEERNLRENGYECEWRYNSCAPACQVTCQHPEPLACPVQCVEGCHAHCPPGKILDELLQTCVDPEDCPVCEVAGRRFASGKKVTLNPSDPEHCQICHCDVVNLTCEACQEPGGLVVPPTDAPVSPTTLYVEDISEPPLHQEPGGLVVPPTDAPVSPTTLYVEDISEPPLHQEPGGLVVPPTDAPVSPTTLYVEDISEPPLHQEPGGLVVPPTDAPVSPTTLYVEDISEPPLHQEPGGLVVPPTDAPVSPTTLYVEDISEPPLH(SEQ ID NO: 7)

В одном из вариантов осуществления аминокислотная последовательность слитого белка имеет идентичность по меньшей мере 90% по отношению к SEQ ID NO: 7. Аминокислотная последовательность слитого белка также может иметь идентичность по меньшей мере 95% по отношению к SEQ ID NO: 7. Кроме того, идентичность аминокислотной последовательности слитого белка по отношению к SEQ ID NO: 7 может составлять по меньшей мере 98%. В частности, аминокислотная последовательность слитого белка может иметь идентичность 100% по отношению к SEQ ID NO: 7.

Дополнительным типичным слитым белком по изобретению является про-OCTA 14, включающий OCTA 14 и пропептид (выделен полужирным шрифтом) с сигнальным пептидом (выделен полужирным шрифтом и подчеркнут). Про-OCTA 14 определен в SEQ ID NO: 8:

MIPARFAGVLLALALILPGTLC AEGTRGRSSTARCSLFGSDFVNTFDGSMYSFAGYCSYLLAGGCQKRSFSIIGDFQNGKRVSLSVYLGEFFDIHLFVNGTVTQGDQRVSMPYASKGLYLETEAGYYKLSGEAYGFVARIDGSGNFQVLLSDRYFNKTCGLCGNFNIFAEDDFMTQEGTLTSDPYDFANSWALSSGEQWCERASPPSSSCNISSGEMQKGLWEQCQLLKSTSVFARCHPLVDPEPFVALCEKTLCECAGGLECACPALLEYARTCAQEGMVLYGWTDHSACSPVCPAGMEYRQCVSPCARTCQSLHINEMCQERCVDGCSCPEGQLLDEGLCVESTECPCVHSGKRYPPGTSLSRDCNTCICRNSQWICSNEECPGECLVTGQSHFKSFDNRYFTFSGICQYLLARDCQDHSFSIVIETVQCADDRDAVCTRSVTVRLPGLHNSLVKLKHGAGVAMDGQDVQLPLLKGDLRIQHTVTASVRLSYGEDLQMDWDGRGRLLVKLSPVYAGKTCGLCGNYNGNQGDDFLTPSGLAEPRVEDFGNAWKLHGDCQDLQKQHSDPCALNPRMTRFSEEACAVLTSPTFEACHRAVSPLPYLRNCRYDVCSCSDGRECLCGALASYAAACAGRGVRVAWREPGRCELNCPKGQVYLQCGTPCNLTCRSLSYPDEECNEACLEGCFCPPGLYMDERGDCVPKAQCPCYYDGEIFQPEDIFSDHHTMCYCEDGFMHCTMSGVPGSLLPDAVLSSPLSHRSKRSLSCRPPMVKLVCPADNLRAEGLECTKTCQNYDLECMSMGCVSGCLCPPGMVRHENRCVALERCPCFHQGKEYAPGETVKIGCNTCVCQDRKWNCTDHVCDATCSTIGMAHYLTFDGLKYLFPGECQYVLVQDYCGSNPGTFRILVGNKGCSHPSVKCKKRVTILVEGGEIELFDGEVNVKRPMKDETHFEVVESGRYIILLLGKALSVVWDRHLSISVVLKQTYQEKVCGLCGNFDGIQNNDLTSSNLQVEEDPVDFGNSWKVSSQCADTRKVPLDSSPATCHNNIMKQTMVDSSCRILTSDVFQDCNKLVDPEPYLDVCIYDTCSCESIGDCACFCDTIAAYAHVCAQHGKVVTWRTATLCPQSCEERNLRENGYECEWRYNSCAPACQVTCQHPEPLACPVQCVEGCHAHCPPGKILDELLQTCVDPEDCPVCEVAGRRFASGKKVTLNPSDPEHCQICHCDVVNLTCEACQEPGGLVVPPTDAPVSPTTLYVEDISEPPLHQEPGGLVVPPTDAPVSPTTLYVEDISEPPLHQEPGGLVVPPTDAPVSPTTLYVEDISEPPLHQEPGGLVVPPTDAPVSPTTLYVEDISEPPLHQEPGGLVVPPTDAPVSPTTLYVEDISEPPLH (SEQ ID NO: 8)

В одном из вариантов осуществления аминокислотная последовательность слитого белка имеет идентичность по меньшей мере 90% по отношению к SEQ ID NO: 8. Аминокислотная последовательность слитого белка также может иметь идентичность по меньшей мере 95% по отношению к SEQ ID NO: 8. Кроме того, идентичность аминокислотной последовательности слитого белка по отношению к SEQ ID NO: 8 может составлять по меньшей мере 98%. В частности, аминокислотная последовательность слитого белка может иметь идентичность 100% по отношению к SEQ ID NO: 8.

Дополнительным типичным слитым белком по изобретению является OCTA 15. OCTA 15 имеет следующую аминокислотную последовательность:

SLSCRPPMVKLVCPADNLRAEGLECTKTCQNYDLECMSMGCVSGCLCPPGMVRHENRCVALERCPCFHQGKEYAPGETVKIGCNTCVCQDRKWNCTDHVCDATCSTIGMAHYLTFDGLKYLFPGECQYVLVQDYCGSNPGTFRILVGNKGCSHPSVKCKKRVTILVEGGEIELFDGEVNVKRPMKDETHFEVVESGRYIILLLGKALSVVWDRHLSISVVLKQTYQEKVCGLCGNFDGIQNNDLTSSNLQVEEDPVDFGNSWKVSSQCADTRKVPLDSSPATCHNNIMKQTMVDSSCRILTSDVFQDCNKLVDPEPYLDVCIYDTCSCESIGDCACFCDTIAAYAHVCAQHGKVVTWRTATLCPQSCEERNLRENGYECEWRYNSCAPACQVTCQHPEPLACPVQCVEGCHAHCPPGKILDELLQTCVDPEDCPVCEVAGRRFASGKKVTLNPSDPEHCQICHCDVVNLTCEACQEPGGLVVPPTDAPVSPTTLYVEDISEPPLHQEPGGLVVPPTDAPVSPTTLYVEDISEPPLHQEPGGLVVPPTDAPVPTTLYVEDISEPPLH EEPECNDITARLQYVKVGSCKSEVEVDIHYCQGKCASKAMYSIDINDVQDQCSCCSPTRTEPMQVALHCTNGSVVYHEVLNAMECKCSPRKCSK (SEQ ID NO: 9)

OCTA 15 является слитым белком фрагмента VWF, соответствующего аминокислотам 764-1268 SEQ ID NO: 2, двух копий пептида удлинения (выделен полужирным шрифтом), связанных с C-концом, состоящим из аминокислот 1238-1268 SEQ ID NO: 2, и "домена цистеиновый узел" VWF, состоящего из аминокислот 2721-2813 SEQ ID NO: 2.

В одном из вариантов осуществления аминокислотная последовательность слитого белка имеет идентичность по меньшей мере 90% по отношению к SEQ ID NO: 9. Аминокислотная последовательность слитого белка также может иметь идентичность по меньшей мере 95% по отношению к SEQ ID NO: 9. Кроме того, идентичность аминокислотной последовательности слитого белка по отношению к SEQ ID NO: 9 может составлять по меньшей мере 98%. В частности, аминокислотная последовательность слитого белка может иметь идентичность 100% по отношению к SEQ ID NO: 9.

Следующая последовательность (SEQ ID NO: 10) представляет собой OCTA 15 с дополнительным сигнальным пептидом из 12 аминокислот (выделен полужирным шрифтом и подчеркнут). При экспрессии этого пептида получают димерную форму OCTA 15. Сигнальный пептид отщепляется.

MIPARFAGVLLALALILPGTLC SLSCRPPMVKLVCPADNLRAEGLECTKTCQNYDLECMSMGCVSGCLCPPGMVRHENRCVALERCPCFHQGKEYAPGETVKIGCNTCVCQDRKWNCTDHVCDATCSTIGMAHYLTFDGLKYLFPGECQYVLVQDYCGSNPGTFRILVGNKGCSHPSVKCKKRVTILVEGGEIELFDGEVNVKRPMKDETHFEVVESGRYIILLLGKALSVVWDRHLSISVVLKQTYQEKVCGLCGNFDGIQNNDLTSSNLQVEEDPVDFGNSWKVSSQCADTRKVPLDSSPATCHNNIMKQTMVDSSCRILTSDVFQDCNKLVDPEPYLDVCIYDTCSCESIGDCACFCDTIAAYAHVCAQHGKVVTWRTATLCPQSCEERNLRENGYECEWRYNSCAPACQVTCQHPEPLACPVQCVEGCHAHCPPGKILDELLQTCVDPEDCPVCEVAGRRFASGKKVTLNPSDPEHCQICHCDVVNLTCEACQEPGGLVVPPTDAPVSPTTLYVEDISEPPLHQEPGGLVVPPTDAPVSPTTLYVEDISEPPLHQEPGGLVVPPTDAPVPTTLYVEDISEPPLHEEPECNDITARLQYVKVGSCKSEVEVDIHYCQGKCASKAMYSIDINDVQDQCSCCSPTRTEPMQVALHCTNGSVVYHEVLNAMECKCSPRKCSK (SEQ ID NO: 10)

В одном из вариантов осуществления аминокислотная последовательность слитого белка имеет идентичность по меньшей мере 90% по отношению к SEQ ID NO: 10. Аминокислотная последовательность слитого белка также может иметь идентичность по меньшей мере 95% по отношению к SEQ ID NO: 10. Кроме того, идентичность аминокислотной последовательности слитого белка по отношению к SEQ ID NO: 10 может составлять по меньшей мере 98%. В частности, аминокислотная последовательность слитого белка может иметь идентичность 100% по отношению к SEQ ID NO: 10.

Дополнительным типичным слитым белком по изобретению является про-OCTA 15, включающий OCTA 15 и пропептид (выделен полужирным шрифтом) с сигнальным пептидом (выделен полужирным шрифтом и подчеркнут). Экспрессия этой последовательности будет приводить к образованию мультимеров. Про-OCTA 15 определен в SEQ ID NO: 11:

MIPARFAGVLLALALILPGTLC AEGTRGRSSTARCSLFGSDFVNTFDGSMYSFAGYCSYLLAGGCQKRSFSIIGDFQNGKRVSLSVYLGEFFDIHLFVNGTVTQGDQRVSMPYASKGLYLETEAGYYKLSGEAYGFVARIDGSGNFQVLLSDRYFNKTCGLCGNFNIFAEDDFMTQEGTLTSDPYDFANSWALSSGEQWCERASPPSSSCNISSGEMQKGLWEQCQLLKSTSVFARCHPLVDPEPFVALCEKTLCECAGGLECACPALLEYARTCAQEGMVLYGWTDHSACSPVCPAGMEYRQCVSPCARTCQSLHINEMCQERCVDGCSCPEGQLLDEGLCVESTECPCVHSGKRYPPGTSLSRDCNTCICRNSQWICSNEECPGECLVTGQSHFKSFDNRYFTFSGICQYLLARDCQDHSFSIVIETVQCADDRDAVCTRSVTVRLPGLHNSLVKLKHGAGVAMDGQDVQLPLLKGDLRIQHTVTASVRLSYGEDLQMDWDGRGRLLVKLSPVYAGKTCGLCGNYNGNQGDDFLTPSGLAEPRVEDFGNAWKLHGDCQDLQKQHSDPCALNPRMTRFSEEACAVLTSPTFEACHRAVSPLPYLRNCRYDVCSCSDGRECLCGALASYAAACAGRGVRVAWREPGRCELNCPKGQVYLQCGTPCNLTCRSLSYPDEECNEACLEGCFCPPGLYMDERGDCVPKAQCPCYYDGEIFQPEDIFSDHHTMCYCEDGFMHCTMSGVPGSLLPDAVLSSPLSHRSKRSLSCRPPMVKLVCPADNLRAEGLECTKTCQNYDLECMSMGCVSGCLCPPGMVRHENRCVALERCPCFHQGKEYAPGETVKIGCNTCVCQDRKWNCTDHVCDATCSTIGMAHYLTFDGLKYLFPGECQYVLVQDYCGSNPGTFRILVGNKGCSHPSVKCKKRVTILVEGGEIELFDGEVNVKRPMKDETHFEVVESGRYIILLLGKALSVVWDRHLSISVVLKQTYQEKVCGLCGNFDGIQNNDLTSSNLQVEEDPVDFGNSWKVSSQCADTRKVPLDSSPATCHNNIMKQTMVDSSCRILTSDVFQDCNKLVDPEPYLDVCIYDTCSCESIGDCACFCDTIAAYAHVCAQHGKVVTWRTATLCPQSCEERNLRENGYECEWRYNSCAPACQVTCQHPEPLACPVQCVEGCHAHCPPGKILDELLQTCVDPEDCPVCEVAGRRFASGKKVTLNPSDPEHCQICHCDVVNLTCEACQEPGGLVVPPTDAPVSPTTLYVEDISEPPLHQEPGGLVVPPTDAPVSPTTLYVEDISEPPLHQEPGGLVVPPTDAPVPTTLYVEDISEPPLHEEPECNDITARLQYVKVGSCKSEVEVDIHYCQGKCASKAMYSIDINDVQDQCSCCSPTRTEPMQVALHCTNGSVVYHEVLNAMECKCSPRKCSK (SEQ ID NO: 11)

В одном из вариантов осуществления аминокислотная последовательность слитого белка имеет идентичность по меньшей мере 90% по отношению к SEQ ID NO: 11. Аминокислотная последовательность слитого белка также может иметь идентичность по меньшей мере 95% по отношению к SEQ ID NO: 11. Кроме того, идентичность аминокислотной последовательности слитого белка по отношению к SEQ ID NO: 11 может составлять по меньшей мере 98%. В частности, аминокислотная последовательность слитого белка может иметь идентичность 100% по отношению к SEQ ID NO: 11.

В одном из вариантов осуществления изобретения слитый белок является модифицированным белком FVIII на основе симоктокога альфа с двумя или более копиями пептида удлинения.

В этом варианте осуществления основной белок, предпочтительно, является идентичным или схожим с тяжелой цепью FVIII, в частности, с аминокислотами 20-759 UniprotKB P00451.1. Слитый белок с основным белком, идентичным или схожим с тяжелой цепью FVIII, в частности, с аминокислотами 20-759 UniprotKB P00451.1, предпочтительно, дополнительно содержит линкер, схожий или идентичный SEQ ID NO: 12, и дополнительную аминокислотную последовательность, схожую или идентичную легкой цепи, соответствующей аминокислотам 1668-2351 в записи UniprotKB P0045.1.

Пептиды удлинения можно подвергать слиянию с C-концом легкой цепи. Альтернативно, пептиды удлинения находится между тяжелой цепью и легкой цепью. В связи с этим, пептиды удлинения можно соединять с C-концом или N-концом линкера. Пептидами удлинения также можно заменять линкер. Кроме того, линкерная последовательность может прерываться одним или несколькими пептидами удлинения. Также возможно, чтобы пептиды удлинения находились между тяжелой и легкой цепью и на C-конце легкой цепи.

Предпочтительно, слитый белок, основанный на симоктокоге альфа, содержит, с N-конца к C-концу, тяжелую цепь FVIII, первую часть линкера, два или более, предпочтительно, три пептида удлинения (выделены полужирным шрифтом), вторую часть линкера (подчеркнута и выделена полужирным шрифтом) и легкую цепь. Примером такого белка является белок, определенный в SEQ ID NO: 14:

ATRRYYLGAVELSWDYMQSDLGELPVDARFPPRVPKSFPFNTSVVYKKTLFVEFTDHLFNIAKPRPPWMGLLGPTIQAEVYDTVVITLKNMASHPVSLHAVGVSYWKASEGAEYDDQTSQREKEDDKVFPGGSHTYVWQVLKENGPMASDPLCLTYSYLSHVDLVKDLNSGLIGALLVCREGSLAKEKTQTLHKFILLFAVFDEGKSWHSETKNSLMQDRDAASARAWPKMHTVNGYVNRSLPGLIGCHRKSVYWHVIGMGTTPEVHSIFLEGHTFLVRNHRQASLEISPITFLTAQTLLMDLGQFLLFCHISSHQHDGMEAYVKVDSCPEEPQLRMKNNEEAEDYDDDLTDSEMDVVRFDDDNSPSFIQIRSVAKKHPKTWVHYIAAEEEDWDYAPLVLAPDDRSYKSQYLNNGPQRIGRKYKKVRFMAYTDETFKTREAIQHESGILGPLLYGEVGDTLLIIFKNQASRPYNIYPHGITDVRPLYSRRLPKGVKHLKDFPILPGEIFKYKWTVTVEDGPTKSDPRCLTRYYSSFVNMERDLASGLIGPLLICYKESVDQRGNQIMSDKRNVILFSVFDENRSWYLTENIQRFLPNPAGVQLEDPEFQASNIMHSINGYVFDSLQLSVCLHEVAYWYILSIGAQTDFLSVFFSGYTFKHKMVYEDTLTLFPFSGETVFMSMENPGLWILGCHNSDFRNRGMTALLKVSSCDKNTGDYYEDSYEDISAYLLSKNNAIEPR SFSQNSRH QEPGGLVVPPTDAPVSPTTLYVEDISEPPLHQEPGGLVVPPTDAPVSPTTLYVEDISEPPLHQEPGGLVVPPTDAPVSPTTLYVEDISEPPLH RYRRG EITRTTLQSDQEEIDYDDTISVEMKKEDFDIYDEDENQSPRSFQKKTRHYFIAAVERLWDYGMSSSPHVLRNRAQSGSVPQFKKVVFQEFTDGSFTQPLYRGELNEHLGLLGPYIRAEVEDNIMVTFRNQASRPYSFYSSLISYEEDQRQGAEPRKNFVKPNETKTYFWKVQHHMAPTKDEFDCKAWAYFSDVDLEKDVHSGLIGPLLVCHTNTLNPAHGRQVTVQEFALFFTIFDETKSWYFTENMERNCRAPCNIQMEDPTFKENYRFHAINGYIMDTLPGLVMAQDQRIRWYLLSMGSNENIHSIHFSGHVFTVRKKEEYKMALYNLYPGVFETVEMLPSKAGIWRVECLIGEHLHAGMSTLFLVYSNKCQTPLGMASGHIRDFQITASGQYGQWAPKLARLHYSGSINAWSTKEPFSWIKVDLLAPMIIHGIKTQGARQKFSSLYISQFIIMYSLDGKKWQTYRGNSTGTLMVFFGNVDSSGIKHNIFNPPIIARYIRLHPTHYSIRSTLRMELMGCDLNSCSMPLGMESKAISDAQITASSYFTNMFATWSPSKARLHLQGRSNAWRPQVNNPKEWLQVDFQKTMKVTGVTTQGVKSLLTSMYVKEFLISSSQDGHQWTLFFQNGKVKVFQGNQDSFTPVVNSLDPPLLTRYLRIHPQSWVHQIALRMEVLGCEAQDLY (SEQ ID NO: 14)

В одном из вариантов осуществления аминокислотная последовательность слитого белка имеет идентичность по меньшей мере 90% по отношению к SEQ ID NO: 14. Аминокислотная последовательность слитого белка также может иметь идентичность по меньшей мере 95% по отношению к SEQ ID NO: 14. Кроме того, идентичность аминокислотной последовательности слитого белка по отношению к SEQ ID NO: 14 может составлять по меньшей мере 98%. В частности, аминокислотная последовательность слитого белка может иметь идентичность 100% по отношению к SEQ ID NO: 14.

Альтернативно, слитый белок, основанный на симоктокоге альфа, содержит два или более, предпочтительно, три пептида удлинения (выделены полужирным шрифтом), соединенных с C-концом симоктокога альфа. Примером такого белка является белок, определенный в SEQ ID NO: 21. В одном из вариантов осуществления аминокислотная последовательность слитого белка имеет идентичность по меньшей мере 90% по отношению к SEQ ID NO: 21. Аминокислотная последовательность слитого белка также может иметь идентичность по меньшей мере 95% по отношению к SEQ ID NO: 21. Кроме того, идентичность аминокислотной последовательности слитого белка по отношению к SEQ ID NO: 21 может составлять по меньшей мере 98%. В частности, аминокислотная последовательность слитого белка может иметь идентичность 100% по отношению к SEQ ID NO: 21.

Полинуклеотид

Во втором аспекте изобретение относится к выделенному полинуклеотиду, содержащему последовательность нуклеиновой кислоты, кодирующую слитый белок по первому аспекту изобретения.

Выделенный полинуклеотид может являться молекулой ДНК или молекулой РНК. Предпочтительно, выделенный полинуклеотид является молекулой ДНК, в частности, молекулой кДНК. Способы, используемые для выделения или клонирования полинуклеотида, кодирующего пептид, известны в этой области и включают выделение из геномной ДНК, получение из кДНК или их комбинацию. Клонирование полинуклеотидов из такой геномной ДНК можно осуществлять, например, с использованием хорошо известной полимеразной цепной реакции (ПЦР) или скрининга антител в экспрессионных библиотеках для определения клонированных фрагментов ДНК с общими структурными признаками (см., например, Innis et al, 1990) PCR: A Guide to Methods and Application, Academic Press, New York. Можно использовать другие способы амплификации нуклеиновой кислоты, такие как лигазная цепная реакция (LCR), активированная лигированием транскрипция (LAT) и амплификация на основе последовательности полинуклеотида (NASBA).

В частности, последовательность выделенного полинуклеотида может содержать первую часть, кодирующую основной белок, и по меньшей мере одну вторую часть последовательности. Первая часть, предпочтительно, является схожей или идентичной SEQ ID NO: 15. Первая часть, предпочтительно, имеет степень идентичности последовательности по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98%, по меньшей мере 99% или 100% по отношению к SEQ ID NO: 15.

По меньшей мере одна вторая часть, предпочтительно, является схожей или идентичной SEQ ID NO: 16. Вторая часть, предпочтительно, имеет степень идентичности последовательности по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98%, по меньшей мере 99% или 100% по отношению к SEQ ID NO: 16.

Выделенный полинуклеотид может являться молекулой ДНК, кодирующей слитый белок с аминокислотной последовательностью, схожей или идентичной последовательности, выбранной из группы, состоящей из SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 14 и SEQ ID NO: 21.

В частности, выделенный полинуклеотид может являться молекулой ДНК, кодирующей слитый белок, имеющий аминокислотную последовательность с идентичностью по меньшей мере 90%, предпочтительно - по меньшей мере 95%, более предпочтительно - по меньшей мере 98%, наиболее предпочтительно - 100% по отношению к SEQ ID NO: 4. Альтернативно, выделенный полинуклеотид может являться молекулой ДНК, кодирующей слитый белок, имеющий аминокислотную последовательность с идентичностью по меньшей мере 90%. Кроме того, выделенный полинуклеотид может являться молекулой ДНК, кодирующей слитый белок, имеющий аминокислотную последовательность с идентичностью по меньшей мере 90%, предпочтительно - по меньшей мере 95%, более предпочтительно - по меньшей мере 98%, наиболее предпочтительно - 100% по отношению к SEQ ID NO: 5. В одном из вариантов осуществления выделенный полинуклеотид является молекулой ДНК, кодирующей слитый белок, имеющий аминокислотную последовательность с идентичностью по меньшей мере 90%, предпочтительно - по меньшей мере 95%, более предпочтительно - по меньшей мере 98%, наиболее предпочтительно - 100% по отношению к SEQ ID NO: 7. В одном из вариантов осуществления выделенный полинуклеотид является молекулой ДНК, кодирующей слитый белок, имеющий аминокислотную последовательность с идентичностью по меньшей мере 90%, предпочтительно - по меньшей мере 95%, более предпочтительно - по меньшей мере 98%, наиболее предпочтительно - 100% по отношению к SEQ ID NO: 8. В одном из вариантов осуществления выделенный полинуклеотид является молекулой ДНК, кодирующей слитый белок, имеющий аминокислотную последовательность с идентичностью по меньшей мере 90%, предпочтительно - по меньшей мере 95%, более предпочтительно - по меньшей мере 98%, наиболее предпочтительно - 100% по отношению к SEQ ID NO: 10. В одном из вариантов осуществления выделенный полинуклеотид является молекулой ДНК, кодирующей слитый белок, имеющий аминокислотную последовательность с идентичностью по меньшей мере 90%, предпочтительно - по меньшей мере 95%, более предпочтительно - по меньшей мере 98%, наиболее предпочтительно - 100% по отношению к SEQ ID NO: 11. В одном из вариантов осуществления выделенный полинуклеотид является молекулой ДНК, кодирующей слитый белок, имеющий аминокислотную последовательность с идентичностью по меньшей мере 90%, предпочтительно - по меньшей мере 95%, более предпочтительно - по меньшей мере 98%, наиболее предпочтительно - 100% по отношению к SEQ ID NO: 14. В одном из вариантов осуществления выделенный полинуклеотид является молекулой ДНК, кодирующей слитый белок, имеющий аминокислотную последовательность с идентичностью по меньшей мере 90%, предпочтительно - по меньшей мере 95%, более предпочтительно - по меньшей мере 98%, наиболее предпочтительно - 100% по отношению к SEQ ID NO: 21.

Выделенный полинуклеотид может являться молекулой ДНК с последовательностью, схожей или идентичной последовательности, выбранной из группы, состоящей из SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19, SEQ ID NO: 20 и SEQ ID NO: 22.

В одном из вариантов осуществления одна цепь выделенного полинуклеотида имеет идентичность последовательности по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98%, по меньшей мере 99% или 100% по отношению к SEQ ID NO: 17.

В дополнительном варианте осуществления изобретения выделенный полинуклеотид имеет идентичность последовательности по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98%, по меньшей мере 99% или 100% по отношению к SEQ ID NO: 18. В другом варианте осуществления выделенный полинуклеотид имеет идентичность последовательности по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98%, по меньшей мере 99% или 100% по отношению к SEQ ID NO: 19. В одном из вариантов осуществления выделенный полинуклеотид имеет идентичность последовательности по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98%, по меньшей мере 99% или 100% по отношению к SEQ ID NO: 20. В одном из вариантов осуществления выделенный полинуклеотид имеет идентичность последовательности по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98%, по меньшей мере 99% или 100% по отношению к SEQ ID NO: 20.

Список полинуклеотидных последовательностей:

SEQ ID NO: 15: ДНК, кодирующая OCTA 11 (AA 1-1268 SEQ ID NO: 2)

SEQ ID NO: 16: ДНК, кодирующая пептид удлинения (SEQ ID NO: 1)

SEQ ID NO: 17: ДНК, кодирующая про-OCTA 12 (SEQ ID NO: 5)

SEQ ID NO: 18: ДНК, кодирующая про-OCTA 14 (SEQ ID NO: 8)

SEQ ID NO: 19: ДНК, кодирующая про-OCTA 15 (SEQ ID NO: 11)

SEQ ID NO: 20: ДНК, кодирующая симоктоког альфа с тремя пептидами удлинения в линкерной области (SEQ ID NO 14)

SEQ ID NO: 22: последовательность ДНК, кодирующая симоктоког альфа с тремя C-концевыми пептидами удлинения (SEQ ID NO: 21)

Экспрессирующий вектор

В третьем аспекте изобретение также относится к экспрессирующим векторам, содержащим полинуклеотид по второму аспекту изобретения.

Экспрессирующий вектор, предпочтительно, дополнительно содержит контрольные элементы, такие как промотор и транскрипционные и трансляционные стоп-сигналы. Полинуклеотид по второму аспекту и контрольные элементы можно соединять для получения рекомбинантного экспрессирующего вектора, который может включать один или более участков рестрикции, чтобы сделать возможной инсерцию или замену полинуклеотида, кодирующего полипептид, в таких участках. Полинуклеотид можно встраивать в подходящий экспрессирующий вектор для экспрессии. При получении экспрессирующего вектора кодирующую последовательность располагают в экспрессирующем векторе таким образом, что кодирующая последовательность функционально связана с подходящими контрольными последовательностями для экспрессии.

Рекомбинантный экспрессирующий вектор может являться любым вектором (например, плазмидой или вирусом), который можно подвергать способам рекомбинантной ДНК и который может вызывать экспрессию полинуклеотида по четвертому аспекту изобретения. Выбор экспрессирующего вектора, как правило, будет зависеть от совместимости экспрессирующего вектора с клеткой-хозяином, в которую будут встраивать экспрессирующий вектор. Экспрессирующие векторы могут быть линейными или представлять собой замкнутую кольцевую плазмиду.

Экспрессирующий вектор, предпочтительно, адаптируют для экспрессии в клетках млекопитающих. Экспрессирующий вектор может являться автономно реплицирующимся вектором, т.е. вектором, существующим в экстрахромосомном виде, репликация которого не зависит от хромосомной репликации, например, плазмидой, экстрахромосомным элементом, минихромосомой или искусственной хромосомой. В случае автономной репликации вектор может дополнительно содержать участок начала репликации, позволяющий вектору автономно реплицироваться в интересующей клетке-хозяине. Участок начала репликации может являться любым плазмидным репликатором, опосредующим автономную репликацию, функционирующим в клетке. Термин "участок начала репликации" или "плазмидный репликатор" означает полинуклеотид, позволяющий плазмиде или вектору реплицироваться in vivo.

Вектор, предпочтительно, является вектором, который при встраивании в клетку-хозяина интегрируется в геном и реплицируется с хромосомами, в которые он интегрируется. В случае интеграции в геном клетки-хозяина экспрессирующий вектор может быть основан на любом другом элементе экспрессирующего вектора для интеграции в геном посредством гомологичной или негомологичной рекомбинации. Альтернативно, вектор может содержать дополнительные полинуклеотиды для регуляции интеграции посредством гомологичной рекомбинации в геном клетки-хозяина в конкретный участок хромосомы.

Векторы по настоящему изобретению, предпочтительно, содержат один или более (например, несколько) селективных маркеров, делающих возможной простую селекцию трансформированных, трансфицированных, трансдуцированных или т.п. клеток. Селективный маркер является геном, продукт которого обеспечивает биоцидное действие или вирусную резистентность, резистентность к тяжелым металлам, прототрофность у ауксотрофов и т.п.

Способы, используемые для лигирования описываемых выше элементов для конструирования рекомбинантных экспрессирующих векторов по настоящему изобретению хорошо известны специалисту в этой области (см., например, Sambrook et al., 1989, выше).

В одном из вариантов осуществления остов вектора по третьему аспекту выбран из pCDNA3, pCDNA3,1, pCDNA4, pCDNA5, pCDNA6, pCEP4, pCEP-puro, pCET1019, pCMV, pEF1, pEF4, pEF5, pEF6, pExchange, pEXPR, pIRES и pSCAS.

Клетка-хозяин

В четвертом аспекте изобретение относится к клетке-хозяину, содержащему экспрессирующий вектор по третьему аспекту изобретения. Экспрессирующий вектор по третьему аспекту встраивают в клетку-хозяина таким образом, что экспрессирующий вектор поддерживают в виде хромосомного интегранта или самореплицирующегося экстрахромосомного вектора, как описано выше. Термин "клетка-хозяин" включает любое потомство родительской клетки, не идентичное родительской клетке по причине мутаций, возникающих при репликации. Выбор клетки-хозяина, в значительной степени, будет зависеть от гена, кодирующего полипептид, и его источника.

В одном из вариантов осуществления слитый белок получают посредством экспрессии в линии клеток-хозяев млекопитающего. Слитый белок, предпочтительно, получают в линии клеток-хозяев человека. В целом, любая линия клеток-хозяев человека подходит для экспрессии слитого белка. Предпочтительного гликозилирования слитого белка, в частности, достигают с использованием линий клеток почки человека. Предпочтительными линиями клеток почки человека являются линии клеток HEK, в частности, линии клеток HEK 293.

Примерами линий клеток HEK для получения гликозилированного полипептида являются HEK 293 F, Flp-In™-293 (Invitrogen, R75007), 293 (ATCC^® CRL-1573), 293 EBNA, 293 H (ThermoScientific 11631017), 293S, 293T (ATCC^® CRL-3216^™), 293T/17 (ATCC® CRL11268™), 293T/17 SF (ATCC^® ACS4500™), HEK 293 STF (ATCC^® CRL 3249™), HEK-293.2sus (ATCC^® CRL-1573™). Предпочтительной линией клеток для получения полипептида является линия клеток HEK 293 F.

Другие линии клеток, подходящие в качестве клеток-хозяев для экспрессии, включают линии клеток, полученные из клеток миелолейкоза человека. Конкретными примерами клеток-хозяев являются K562, NM-F9, NM-D4, NM-H9D8, NM-H9D8-E6, NM H9D8- E6Q12, GT-2X, GT-5s и клетки, полученные из любых из указанных клеток-хозяев. K562 является линией клеток миелолейкоза человека, находящейся в American Type Culture Collection (ATCC CCL-243). Остальные линии клеток получают из клеток K562 и выбирают по конкретным признакам гликозилирования.

Применение слитого белка

Как показано в примерах, пептиды удлинения SEQ ID NO: 1 в слитых белках OCTA 12 и OCTA 14 не только приводят к повышению времени полужизни слитого белка по сравнению с основным белком, т.е. фрагментом VWF. Слитые белки OCTA 12 и OCTA 14 при введении пациенту вместе с FVIII, партнером по связыванию VWF, также приводят к повышению времени полужизни FVIII.

Таким образом, в пятом аспекте изобретение относится к применению слитого белка по первому аспекту для повышения времени полужизни второго белка, где слитый белок способен связываться с указанным вторым белком.

Применение также можно описать как способ лечения пациента с использованием терапевтического белка, где способ включает введение терапевтического белка, например, белка FVIII вместе со слитым белком по первому аспекту.

Композиция и белковый комплекс

Таким образом, концепция изобретения, а именно пролонгирование времени полужизни, обеспечиваемое пептидами удлинения, не ограничено слитым белком, но, кроме того, можно повышать время полужизни второго белка, связывающегося со слитым белком.

Первый белок может связываться со вторым белком ковалентно или нековалентно с образованием комплекса. Таким образом, настоящее изобретение также относится к комплексу первого белка и второго белка, где указанный первый белок является слитым белком по первому аспекту, и указанный второй белок имеет аминокислотную последовательность, идентичную или схожую с аминокислотной последовательностью второго белка млекопитающего или его фрагмента. Таким образом, комплексы образуются посредством нековалентного связывания первого белка со вторым белком.

В одном из вариантов осуществления первый белок связывается со вторым белком ковалентно. Линкер, облегчающий связывание первого и второго белка, можно выбирать из дисульфидного мостика, пептидной связи, химического линкера или гликозидной связи.

Альтернативно, первый белок связывается со вторым белком нековалентно. В случае нековалентного связывания первый белок, в частности, может содержать специфический связывающий домен, делающий возможным связывание указанного второго белка, т.е. связывающий домен второго белка. В зависимости от локализации одного или нескольких пептидов удлинения в последовательности первого белка они могут находиться в разных положениях первого белка. Предпочтительно, один или более пептидов удлинения локализуются в положении, экспонируемом на поверхности белка в свернутом состоянии. Один или более пептидов удлинения могут находиться в любом положении относительно участка связывания второго белка, например, связывающего домена.

В одном из вариантов осуществления композиции один или более пептидов удлинения находятся в положении первого белка в свернутом состоянии, не мешающем связыванию первого белка со вторым белком.

В одном из вариантов осуществления время полужизни второго белка, например, FVIII, связанного с первым белком, например, фрагментом VWF, повышается по сравнению со свободной формой указанного второго белка, например, белка FVIII.

Предпочтительно, время полужизни второго белка, например, белка FVIII, связанного с первым белком, например, OCTA 12, повышается по сравнению с указанным вторым белком, связанным с нативным белком млекопитающего, например, зрелым VWF.

Более предпочтительно, второй белок, например, белок FVIII, связанный с первым белком, например, OCTA 12, повышается по сравнению с указанным вторым белком, связанным с основным белком, без слитого пептида, например, OCTA 11.

Второй белок млекопитающего можно выбирать из списка, представленного выше для белка млекопитающего. Однако в композиции или комплексе второй белок млекопитающего не является тем же, что и первый белок млекопитающего.

В одном из вариантов осуществления второй белок млекопитающего является белком крови, в частности, белком крови человека. Предпочтительно, второй белок млекопитающего является фактором свертывания, в частности, фактором свертывания человека.

В одном из вариантов осуществления второй белок млекопитающего, по отношению к которому основной белок является схожим или идентичным, является полноразмерным FVIII человека, определяемым по аминокислотам 20-2351 UniProtKB P00451.1. В другом варианте осуществления основной белок является FVIII, в котором отсутствует, по меньшей мере, часть B-домена. В связи с этим может отсутствовать весь B-домен. Отсутствующую часть B-домена, необязательно, заменяют линкером. Линкерная последовательность, в частности, имеет следующую аминокислотную последовательность SFSQNSRHQAYRYRRG (SEQ ID NO: 12). Примером FVIII, в котором B-домен заменяют линкером, является симоктоког альфа (SEQ ID NO: 13), активный ингредиент Nuwiq^® или Vihuma^®.

В одном из вариантов осуществления белок FVIII является белком FVIII человека со сниженным иммунным ответом у пациентов.

Сниженный иммунный ответ на белок FVIII, предпочтительно, основан на связывании с SIGLEC SIG-5, SIG-7, SIG-8 и SIG-9. Не будучи связанными какой-либо теорией, полагают, что связывание с SIGLEC на антигенпрезентирующих клетках (подобных, например, дендритным клеткам) приводит к отрицательной регуляции экспрессии провоспалительных рецепторов и положительной регуляции экспрессии иммуносупрессорных рецепторов на поверхности клетки. Кроме того, связывание приводит к повышенной продукции противовоспалительных цитокинов, сниженной продукции провоспалительных цитокинов и, в результате, к ингибированию пролиферации T-клеток и продукции антител. Таким образом, связывание SIGLEC SIG-5, SIG-7, SIG-8 и SIG-9 приводит к сниженному иммунному ответу или повышенной иммунологической толерантности, когда гликозилированный полипептид вводят пациенту.

Связывание SIGLEC и, таким образом, сниженный иммунный ответ основаны на повышении количества или процентной доли O-гликанов с сиалированным кором 2 и/или удлиненным кором 1 в гликозилированном белке по сравнению с количеством O-гликанов с сиалированным кором 2 и/или удлиненным кором 1 природного FVIII человека.

Таким образом, в одном из вариантов осуществления белок FVIII имеет повышенное количество или процентную долю O-гликанов с сиалированным кором 2 и/или удлиненным кором 1 в гликозилированном белке по сравнению с количеством O-гликанов с сиалированным кором 2 и/или удлиненным кором 1 природного FVIII человека.

В случае, когда второй белок является белком FVIII, основной белок первого белка, предпочтительно, является фрагментом VWF, содержащим связывающий домен FVIII, что делает возможным связывание с белком FVIII.

В одном из вариантов осуществления композиции первый белок имеет аминокислотную последовательность с идентичностью по меньшей мере 95%, предпочтительно - по меньшей мере 98% более предпочтительно - 100% по отношению к SEQ ID NO: 3, и второй белок имеет аминокислотную последовательность с идентичностью по меньшей мере 95%, предпочтительно - по меньшей мере 98%, более предпочтительно - 100% по отношению к SEQ ID NO: 13.

В одном из вариантов осуществления композиции первый белок имеет аминокислотную последовательность с идентичностью по меньшей мере 95%, предпочтительно - по меньшей мере 98%. более предпочтительно - 100% по отношению к SEQ ID NO: 6, и второй белок имеет аминокислотную последовательность с идентичностью по меньшей мере 95%, предпочтительно - по меньшей мере 98% более предпочтительно - 100% по отношению к SEQ ID NO: 13.

В одном из вариантов осуществления композиции первый белок имеет аминокислотную последовательность с идентичностью по меньшей мере 95%, предпочтительно - по меньшей мере 98% более предпочтительно - 100% по отношению к SEQ ID NO: 9, и второй белок имеет аминокислотную последовательность с идентичностью по меньшей мере 95%, предпочтительно - по меньшей мере 98%, более предпочтительно - 100% по отношению к SEQ ID NO: 13.

Т.к. в крови пациента слитый белок, содержащий фрагмент VWF, в частности, OCTA 12, конкурирует с эндогенным VWF за связывание с белком FVIII, предпочтительно, чтобы композиция содержала слитый белок, содержащий фрагмент VWF, в частности, OCTA 12, в молярном избытке по сравнению с белком FVIII.

Предпочтительно, молярное соотношение первого белка и второго белка находится в диапазоне от 0,1 до 250, предпочтительно - в диапазоне от 0,5 до 50, более предпочтительно - в диапазоне от 1 до 25, наиболее предпочтительно - в диапазоне от 2 до 10.

Для образования стабильного нековалентно связанного комплекса и, таким образом, пролонгирования времени полужизни второго белка аффинность связывания первого белка со вторым белком, определяемая равновесной константой диссоциации (K_D), должна составлять менее 10 мкМ. Предпочтительно, равновесная константа диссоциации фрагмента VWF в первом белке и белка FVIII находится в диапазоне от 0,05 до 3 нМ.

Первый и второй белок можно получать посредством раздельной рекомбинантной экспрессии, а затем соединять. Альтернативно, первый и второй белок рекомбинантно экспрессируют в одной клетке. В этом случае первый и второй белок могут кодироваться одним вектором или двумя разными векторами.

Конструкции VWF, используемые в примерах, т.е. OCTA 12, OCTA 14 и OCTA 15, экспрессировали в форме их про-белков, что приводит к образованию димеров или, в случае OCTA 15, к образованию мультимеров. Эти димеры остаются интактными даже после расщепления про-пептида, и, таким образом, каждая из копий конструкции VWF в димере может связываться с белком FVIII. Таким образом, в одном из вариантов осуществления комплекс содержит две копии первого и второго белка, где две копии первого белка образуют димер. Этот димер первого белка, предпочтительно, является нековалентно связанным димером.

Фармацевтическая композиция и медицинское применение

Как описано выше, слитый белок по первому аспекту, композиция по шестому аспекту и комплекс по седьмому аспекту изобретения обладают преимуществом повышенного времени полужизни в крови пациентов и, таким образом, повышенного терапевтического эффекта у пациентов. Таким образом, слитый белок по первому аспекту, композиция по шестому аспекту и комплекс по седьмому аспекту, в частности, применимы в качестве активных ингредиентов для лечения. Предпочтительно, они применимы для лечения или профилактики нарушения свертываемости. Слитый белок по первому аспекту, композицию по шестому аспекту, в частности, белковый комплекс, представленный в настоящем описании, можно вводить в отдельности или в форме фармацевтических композиций.

Таким образом, в восьмом аспекте изобретение относится к фармацевтической композиции слитого белка по первому аспекту, композиции по шестому аспекту и комплекса по седьмому аспекту.

По изобретению фармацевтическая композиция может содержать эффективное количество слитого белка по первому аспекту, композиции по шестому аспекту и комплекса по седьмому аспекту, составленных по меньшей мере с одним фармацевтически приемлемым носителем. Фармацевтические композиции по вариантам осуществления можно получать и вводить индивидууму любыми способами, хорошо известными в области фармацевтики. См., например, Goodman & Gilman's The Pharmacological Basis of Therapeutics, Hardman et al., eds., McGraw-Hill Professional (10th ed., 2001); Remington: The Science and Practice of Pharmacy, Gennaro, ed., Lippincott Williams & Wilkins (20th ed., 2003); and Pharmaceutical Dosage Forms and Drug Delivery Systems, Ansel et al. (eds), Lippincott Williams & Wilkins (7th ed., 1999). Кроме того, фармацевтические композиции по вариантам осуществления также можно составлять так, чтобы они включали другие медицински применимые лекарственные средства или биологические средства. Фармацевтическая композиция, как правило, содержит терапевтически эффективное количество слитого белка или белкового комплекса в комбинации с фармацевтически приемлемым носителем. Фармацевтически приемлемый носитель является любым носителем, известным в этой области. Примеры фармацевтически приемлемых носителей включают стерильную воду без пирогенов и стерильный физиологический раствор без пирогенов. Другие формы фармацевтически приемлемых носителей, которые можно использовать для вариантов осуществления изобретения, включают связывающие средства, разрыхлители, поверхностно-активные вещества, ускорители абсорбции, влагоудерживающие средства, абсорбирующие средства, смазочные средства, наполнители, увлажнители, консерванты, стабилизаторы, эмульгаторы, солюбилизаторы, соли, контролирующие осмотическое давление, разбавители, такие как буферы, и эксципиенты, как правило, используемые в зависимости от используемой формы состава. Необязательно, их выбирают и используют в соответствии с единицей дозирования полученного состава.

Таким образом, девятый аспект изобретения также относится к способу лечения или профилактики нарушения свертываемости у пациента, включающему введение указанному пациенту фармацевтической композиции по восьмому аспекту.

В рамках изобретения термин "нарушение свертываемости" относится к заболеванию или состоянию, нарушающему нормальный гемостаз. Нарушение свертываемости может являться, например, гемофилией A, гемофилией B, недостаточностью фактора VIII, недостаточностью фактора XI, болезнью фон Виллебранда, тромбастенией Гланцманна, синдромом Бернара-Сулье, идиопатической тромбоцитопенической пурпурой, внутримозговым кровоизлиянием, травмой, черепно-мозговой травмой и т.п.

В рамках изобретения термин "гемофилия" относится к группе нарушений свертываемости, ассоциированных с повышенным временем свертывания по сравнению с временем свертывания у здоровых индивидуумов без гемофилии. Гемофилия включает гемофилию A, являющуюся нарушением, приводящим к продукции дефектного фактора VIII, гемофилию B, являющуюся нарушением, приводящим к продукции дефектного фактора IX, и приобретенную гемофилию A, редкое нарушение свертываемости, вызываемое аутоантителами против фактора свертывания (F) VIII.

Нарушение свертываемости, предпочтительно, является гемофилией A или B. Лечение может представлять собой, например, лечение гемофилии PUPS (пациентов, ранее не подвергнутых лечению), или лечение с индукцией иммунологической толерантности (ITI), и/или другое лечение родственных гемофилических нарушений.

Для применения in vivo фармацевтические композиции можно вводить пациенту любым общепринятым способом введения, например, перорально, парентерально или посредством ингаляции. Парентеральное введение включает внутривенную инъекцию, подкожную инъекцию, интраперитонеальную инъекцию, внутримышечную инъекцию, введение жидких средств, суспензий, эмульсий и капельное введение. В случае парентерального введения фармацевтическая композиция должна являться инъецируемым средством, таким как жидкое средство или суспензия.

В других вариантах осуществления фармацевтическую композицию вводят пациенту перорально. В этих вариантах осуществления форма лекарственного средства включает твердые составы, такие как таблетки, таблетки с покрытием, порошки, гранулы, капсулы и пилюли, жидкие составы, такие как жидкие средства (например, глазные капли, назальные капли), суспензия, эмульсия и сироп, ингаляционные средства, такие как аэрозольные средства, атомайзеры и небулайзеры, и липосомные средства. В некоторых других вариантах осуществления гликозилированный полипептид, белковый комплекс или фармацевтическую композицию вводят посредством ингаляции в дыхательные пути пациента для воздействия на трахею и/или легкие индивидуума.

В одном из вариантов осуществления восьмого аспекта применение включает внутривенную или невнутривенную инъекцию. Невнутривенная инъекция, предпочтительно, является подкожной инъекцией.

Все публикации и патенты, процитированные в описании, включены в него в полном объеме в качестве ссылок. Если материал, включенный в качестве ссылки, противоречит или не соответствует описанию, описание обладает приоритетом относительно любого такого материала.

ПРИМЕРЫ

Пример 1 - Рекомбинантная экспрессия белков VWF

Следующие рекомбинантные белки VWF транзиторно экспрессировали в линии клеток HEK 293 F с C-концевой меткой Strep-Tag и очищали посредством аффинной хроматографии StrepTactin (IBA GmbH):

- OCTA 11

- OCTA 12

OCTA 12 является слитым белком по изобретению. OCTA 11 является сравнительным фрагментом VWF. Белки VWF схематически изображены на фиг. 1. Экспрессия про-белков приводит к образованию димеров. Пептидные димеры также остаются после расщепления пропептида.

Синтез и клонирование генов

В качестве первой стадии, гены, кодирующие про-белки белков VWF, синтезировали в GeneArt (Thermo Fisher Scientific):

- про-OCTA 11

- про-OCTA 12

Гены, кодирующие про-белки, клонировали в экспрессирующий вектор pDSG (IBA GmbH), содержащий метку Twin-Strep-tag. Отдельные культуры E.coli TOP10 (IBA GmbH) трансформировали с использованием векторных конструкций и отдельные клоны подвергали селекции после инкубации в течение ночи при 37°C на чашках с содержащим ампициллин LB-агаром.

Получение плазмидной ДНК осуществляли с использованием наборов QIAamp DNA Mini или Maxi kit (Qiagen) по инструкциям производителя. С помощью секвенирования подтверждали целостность векторов, в частности, правильную ориентацию и целостность генов, кодирующих про-OCTA 11, про-OCTA 12.

Экспрессия белка

Для эукариотической экспрессии белков VWF клетки MEXi-293 (IBA GmbH), выращенные в среде для трансфекции MEXi (IBA GmbH), трансфицировали с использованием 1,5 мг/л конструкций с использованием 4,5 мг/мл линейного полиэтиленимина 25 кДа. После инкубации в течение 2-4 при 37°C, 5% CO₂ и 100-150 об./мин., культуру разводили 1:2 средой для трансфекции MEXi и продолжали культивирование до достижения жизнеспособности клеток 75%.

Затем супернатант отделяли от клеток посредством центрифугирования при 4°C и 300×g. Для минимизации ингибиторного эффекта биотина в среде для культивирования клеток и для коррекции pH к супернатанту добавляли 0,1 объема буфера (1 M Трис-HCl, 1,5 мМ NaCl, 10 мМ ЭДТА, pH 8,0) и 0,09% (об./об.) раствора BioLock (IBA GmbH) и инкубировали в течение 20 мин при 4°C.

Очистка белка

После центрифугирования супернатант наносили на колонку Strep-Tactin XT (IBA GmbH), промывали пять раз промывочным буфером (100 мМ Трис-HCl, 150 мМ NaCl, 1 мМ ЭДТА, pH 8,0) и связанные белки, содержащие метку Strep-tag, элюировали с помощью элюирующего буфера (100 мМ Трис-HCl, 150 мМ NaCl, 1 мМ ЭДТА, 10 мМ дестиобиотин, pH 8,0).

Пример 2 - Влияние полноразмерного VWF или белков VWF на время полужизни FVIII при совместном введении с FVIII мышам с двойным нокаутом (DKO) FVIII/VWF

2.1 Предпосылки

В этом эксперименте исследовали влияние белков VWF, полученных по примеру 1, и полноразмерного, полученного из плазмы VWF (pdVWF) на время полужизни FVIII.

Известно, что полноразмерный VWF и FVIII являются партнерами по связыванию, образующими нековалентный комплекс. Время полужизни FVIII в кровотоке определяется, в основном, временем полужизни VWF в кровотоке.

Т.к. в сыворотке эндогенный VWF конкурирует с вводимыми белками VWF (фрагментами) за связывание с FVIII, это конкурирование будет влиять на любой эффект вводимых белков VWF в отношении времени полужизни FVIII.

Таким образом, в этом эксперименте мышей C57Bl/6 с двойным нокаутом FVIII и VWF (FVIII/VWF-DKO) использовали в качестве модельных организмов для оценки влияния VWF на время полужизни FVIII.

2.2 Эксперимент

2.2.1 FVIII-содержащие продукты

Получали следующие FVIII-содержащие продукты:

1) FVIII в отдельности

2) FVIII и OCTA 11

3) FVIII и OCTA 12

4) FVIII и pdVWF

Белки VWF OCTA 11 и OCTA 12 получали, как описано в примере 1. pdVWF представлял собой концентрат VWF Wilate (Octapharma). FVIII являлся FVIII с делецией B-домена из линии клеток человека (Nuwiq, Octapharma). Продукт Nuwiq содержит следующую буферную композицию:

Аргинин HCl	25,6 мМ
Сахароза	15,8 мМ
NaCl	308 мМ
Плюроник F68	0,14 мМ
Цитрат натрия	3,6 мМ
Хлорид кальция	2,0 мМ

Молярное соотношение белка VWF и FVIII в FVIII-содержащих продуктах 2)-4) составляло 5:1. Белки VWF добавляли в продукт Nuwiq (FVIII).

2.2.2 Линия мышей FVIII/VWF-DKO

Использовали мышей C57Bl/6 с двойным нокаутом FVIII и VWF (FVIII/VWF-DKO).

2.2.3 Введение продуктов

Четыре FVIII-содержащих продукта вводили 20 мышам FVIII/VWF-DKO посредством инфузии в хвостовую вену в дозе 240 МЕ FVIII/кг (~6 МЕ/мышь).

2.2.4 Забор образцов и анализ

Образцы крови мышей получали через 5 минут и 1, 4, 8, 12, 24, 36 и 48 часов после введения FVIII-содержащих продуктов. Образцы крови получали из ретроорбитального сосудистого сплетения мышей. Для каждой временной точки получали образцы крови 5 мышей на FVIII-содержащий продукт и анализировали по отдельности. Образец от каждой мыши получали во временной точке 5 мин и максимально в двух дополнительных временных точках.

Активность FVIII в каждом из образцов крови анализировали с использованием хромогенного анализа (CHROMOGENIX).

2.3 Результаты

Вместе со значениями активности FVIII в образцах крови определяли динамику активности FVIII для каждого из FVIII-содержащих продуктов, как показано на фиг. 2.

Как и для каждой временной точки и FVIII-содержащего продукта, проводили измерения в образцах крови пяти животных, каждая точка данных на фиг. 2 представляет собой среднее для 5 значений.

Кроме того, активность FVIII в отдельных временных точках представляли в виде процента активности FVIII через 5 минут после введения, которую определяли как 100% активности для каждого из FVIII-содержащих продуктов.

Время полужизни FVIII в пяти продуктах вычисляли после аппроксимации кривой с использованием линейного регрессионного анализа линейно-логарифмической части отдельных кривых концентрация в плазме-время или посредством нелинейной регрессии с использованием однофазной модели экспоненциального уменьшения. Программным обеспечением, используемым для вычисления, являлось GraphPad Prism версии 6.07 (La Jolla, CA 92037 USA) и WinNonlin версии 6.4 (Pharsight Corporation, Mountain View, CA, USA).

Вычисления были основаны на следующих уравнениях:

K_el=константа скорости элиминации

t_½=время полувыведения

c=концентрация

t=время

Результаты представлены в таблице 1.

Таблица 1. Конечное время полужизни FVIII у мышей DKO
FVIII-содержащий продукт	t_1/2 [ч.]
1) FVIII в отдельности	0,07
2) FVIII и OCTA 11	0,45
3) FVIII и OCTA 12	1,03
4) FVIII и flVWF	0,32

Из этих чисел очевидно, что совместное введение FVIII с любым из белков VWF приводит к повышению времени полужизни. Совместное введение FVIII с pdVWF приводит к ~4,6-кратному повышению времени полужизни FVIII (0,31).

FVIII, вводимый совместно с белком VWF OCTA 11, демонстрирует сравнимое время полужизни 0,45 ч. (приблизительно 1,4-кратное повышение).

Примечательно, что совместное введение с белком VWF OCTA 12 приводит к времени полужизни FVIII 1,03 ч., что представляет собой повышение приблизительно в 3,2 раза по сравнению с flVWF. Повышение является 14,7-кратным по сравнению с FVIII.

Эти результаты свидетельствуют о том, что дополнительные O-гликановые повторы, присутствующие в OCTA 12, приводят к значительному эффекту пролонгирования времени полужизни в отношении фрагмента VWF и, в свою очередь, комплекса VWF/FVIII. Кроме того, эти результаты свидетельствуют о том, что добавление копий характерного O-гликанового кластера может повышать время полужизни белка.

Пример 3 - Фармакокинетический профиль FVIII и VWF OCTA 12 после IV и подкожного (SQ) введения у карликовых свиней

3.1 Предпосылки

Доставка SQ лекарственных средств привлекает все больше внимания в области факторов свертывания. Однако по причине очень низкого высвобождения этот путь пока не применим для введения FVIII. Карликовая свинья является наиболее известной моделью на животных для тестирования SQ введения лекарственных средств по причине близкого сходства со структурой эпидермиса человека. Целью этого эксперимента являлась оценка времени полужизни VWF OCTA 12 и FVIII при введении в отдельности или с пятикратным молярным избытком OCTA 12 у карликовой свиньи с помощью SQ пути. Кроме того, время полужизни FVIII при введении в отдельности общепринятым IV путем сравнивали с FVIII, вводимым SQ с VWF OCTA 12 или без него.

3.2 Эксперимент

Для этого исследования использовали девять самок карликовых свиней Aachener возрастом от 10 до 14 месяцев. Масса тела составляла от 13,7 до 19,5 кг. IV инъекцию делали в латеральную ушную вену, SQ инъекцию делали под кожу в паховой области. Доза составляла 100 ед. FVIII/кг BW, использовали 3 животных на группу с каждым продуктом:

- Группа 1: FVIII в отдельности, SQ

- Группа 2: FVIII с OCTA 12, SQ

- Группа 3: FVIII в отдельности, IV

Для получения 2×200 мкл плазмы с цитратом натрия на животное и время забора собирали достаточное количество крови из яремной вены всех животных в следующие моменты времени: 0 (до введения дозы), 0,5, 1, 2, 4, 8, 24, 32, 48, 72, 96 и 120 ч. после каждого введения.

Цельную кровь собирали в пробирки, содержащие цитрат натрия (0,15 M) в качестве антикоагулянта, и сразу охлаждали с использованием системы IsoTherm-Rack (Eppendorf). Плазму отделяли посредством центрифугирования в пределах 30 минут после забора крови. Сразу после центрифугирования образцы плазмы замораживали и хранили при ≤-20°C до транспортировки.

Каждый образец тестировали на антиген FVIII с использованием набора Asserachrom (Diagnostica Stago). OCTA 12 количественно анализировали с использованием анализа ELISA следующим образом: покрытый Strep-Tactin® XT микропланшет (IBA GmbH) блокировали блокирующим буфером (1% BSA in PBS) в течение 2 ч. при RT. Образцы плазмы разводили блокирующим буфером 1:15 и наносили на планшет. Через 2 ч. инкубации при 37°C фрагмент VWF определяли с использованием pAb против VWF (Dako P0226). После каждой инкубации планшет промывали 3 раза 0,1% Tween в PBS.

Фармакокинетическую оценку данных анализа осуществляли с использованием WinNonlin версии 6.4 (Pharsight Corporation, Mountain View, CA, USA).

3.3 Результаты

На фигуре 3 показана динамика концентрации VWF OCTA 12 в плазме карликовой свиньи после SQ введения смеси FVIII/VWF OCTA 12. Как представлено в таблице 2, OCTA 12 циркулирует с временем полужизни 219,31 ч. Время полужизни определяли, как описано в примере 2.

Таблица 2. Фармакокинетические параметры антигена VWF OCTA 12 у карликовых свиней. Значения представляют собой среднее±SD для трех животных.
Фармакокинетические параметры антигена OCTA 12
Группа/доза/путь		C _max [нМ]	t _max [ч.]	t _1/2 [ч.]
Группа 2: 100 ед./кг BW FVIII с OCTA 12 SQ.		0,93±0,38	8,00	219,31
C_max	наибольшая измеренная концентрация в плазме
t_max	время Cmax
t_1/2	конечное время полужизни

У свиней с болезнью фон Виллебранда (VWD) время полужизни полноразмерного рекомбинантного VWF человека (rhVWF) составляет приблизительно от 10 до 16 часов, и время полужизни полученного VWF свиньи в плазме составляет от 10 до 18 часов (Nichols et al.). Время полужизни фрагмента VWF, содержащего только связывающие домены FVIII, меньше времени полужизни flVWF, как показано Yee et al. на мышах с недостаточностью VWF. Таким образом, время полужизни OCTA 12 составляет приблизительно в 14-22 раза больше времени полужизни rhVWF у свиньи.

Кроме того, также наблюдали значительный эффект пролонгирования в отношении времени полужизни FVIII. Как показано на фигуре 4 и в таблице 3, FVIII при совместном введении с OCTA 12 имеет время полужизни 25,3 ч, что представляет собой 6,7-кратное повышение времени полужизни по сравнению с FVIII в отдельности, вводимого тем же путем (SQ), и 3,9-кратное улучшение по сравнению с FVIII, вводимым в отдельности общепринятым IV путем.

Таблица 3. Фармакокинетические параметры антигена FVIII у карликовых свиней. Значения представляют собой среднее±SD для трех животных.
Фармакокинетические параметры антигена FVIII
Группа/доза/путь	C _max [ед./мл]	t _max [ч.]	t _1/2 [ч.]
Группа 1: 100 ед./кг BW FVIII в отдельности SQ	0,03±0,015	8,00	3,78±1,31
Группа 2: 100 ед./кг BW FVIII с OCTA 12 SQ	0,178±0,09	8,00	25,30±11,24
Группа 3: FVIII в отдельности IV	2,56±0,26	1,00	6,45±2,32

Множество модификаций и других вариантов осуществления изобретения, представленного в настоящем описании, будут очевидны специалисту в области, к которой относится изобретение, который может извлечь пользу из идеи, представленной в изложенном выше описании и прилагаемых чертежах. Таким образом, следует понимать, что изобретение не должно быть ограничено конкретными описанными вариантами осуществления, и что в объем формулы изобретения должны быть включены модификации и другие варианты осуществления. Хотя в настоящем описании используют конкретные термины, их используют исключительно в общем и описательном смысле, а не для ограничения.

ССЫЛКИ

Birken S, Canﬁeld RE. Isolation and amino acid sequence of COOH-terminal fragments from the beta subunit of human choriogonadotropin. J Biol Chem. 1977; vol. 252 pg. 5386-5392

Ewenstein BM, Collins P, Tarantino MD, Negrier C, Blanchette V, Shapiro AD, Baker D, Spotts G, Sensel M, Yi SE, Gomperts ED. Hemophilia therapy innovation development of an advanced category recombinant factor VIII by a plasma/albumin-free method Proceedings of a Special Symposium at the XIXth Congress of the International Society on Thrombosis and Haemostasis; 2004, vol. 41, pg. 1-16.

Fischer B, Mitterer A, Schlokat U, DenBouwmeester R, Dorner ʺStructural analysis of recombinant von Willebrand factor: identification of hetero- and homo-dimersʺ FFEBS Lett. 1994 Sep 12; 351(3):345-8. Erratum in: FEBS Lett 1994 Oct 24; 353(3):337.

Furlan M. ʺVon Willebrand factor: molecular size and functional activityʺ Ann Hematol. 1996 Jun; 72(6):341-8.

Kannicht C, Ramstrom M, Kohla G, et al. Characterisation of the post-translational modifications of a novel, human cell line-derived recombinant human factor VIII. Thromb Res. 2013; 131(1):78-88.

Needleman SB, Wunsch CD. A general method applicable to the search for similarities in the amino acid sequence of two proteins. J Mol Biol. 1970; vol. 48(3); pg. 443-453.

Nichols TC, Bellinger DA, Merricks EP, et al. Porcine and Canine von Willebrand Factor and von Willebrand Disease: Hemostasis, Thrombosis, and Atherosclerosis Studies. Thrombosis. 2010;2010:461238.

Strohl WR. Fusion Proteins for Half-Life Extension of Biologics as a Strategy to Make Biobetters. BioDrugs. 2015 Aug; vol. 29(4), pg. 215-239.

Tiede A. Half-life extended factor VIII for the treatment of hemophilia A. J Thromb Haemost. 2015 Jun; vol. 13 Suppl 1; pg. S176-179

Vlot AJ, Koppelman SJ, Meijers JC, Dama C, van den Berg HM, Bouma BN, Sixma JJ, Willems GM. Kinetics of factor VIII-von Willebrand factor association. Blood. 1996 1; vol. 87(5); pg. 1809-1816

Yee A, Gildersleeve RD, Gu S, Kretz CA, McGee BM, Carr KM, Pipe SW, Ginsburg D. A von Willebrand factor fragment containing the D'D3 domains is sufficient to stabilize coagulation factor VIII in mice. Blood. 2014 Jul 17; vol. 124(3); pg. 445-452.

Innis et al, 1990 PCR: A Guide to Methods and Application, Academic Press, New York.

--->

СПИСОК ПОСЛЕДОВАТЕЛЬНОСТЕЙ

<110> Octapharma AG

<120> ГЛИКОЗИЛИРОВАННЫЕ СЛИТЫЕ БЕЛКИ VWF С УЛУЧШЕННОЙ ФАРМАКОКИНЕТИКОЙ

<130> 4830P1098WORU

<140> 2018144112

<141> 2017-04-26

<150> EP 16170690.8

<151> 2016-05-20

<160> 22

<170> PatentIn version 3.5

<210> 1

<211> 31

<212> БЕЛОК

<213> Homo sapiens

<400> 1

Gln Glu Pro Gly Gly Leu Val Val Pro Pro Thr Asp Ala Pro Val Ser

1 5 10 15

Pro Thr Thr Leu Tyr Val Glu Asp Ile Ser Glu Pro Pro Leu His

20 25 30

<210> 2

<211> 2813

<212> БЕЛОК

<213> Homo sapiens

<400> 2

Met Ile Pro Ala Arg Phe Ala Gly Val Leu Leu Ala Leu Ala Leu Ile

1 5 10 15

Leu Pro Gly Thr Leu Cys Ala Glu Gly Thr Arg Gly Arg Ser Ser Thr

20 25 30

Ala Arg Cys Ser Leu Phe Gly Ser Asp Phe Val Asn Thr Phe Asp Gly

35 40 45

Ser Met Tyr Ser Phe Ala Gly Tyr Cys Ser Tyr Leu Leu Ala Gly Gly

50 55 60

Cys Gln Lys Arg Ser Phe Ser Ile Ile Gly Asp Phe Gln Asn Gly Lys

65 70 75 80

Arg Val Ser Leu Ser Val Tyr Leu Gly Glu Phe Phe Asp Ile His Leu

85 90 95

Phe Val Asn Gly Thr Val Thr Gln Gly Asp Gln Arg Val Ser Met Pro

100 105 110

Tyr Ala Ser Lys Gly Leu Tyr Leu Glu Thr Glu Ala Gly Tyr Tyr Lys

115 120 125

Leu Ser Gly Glu Ala Tyr Gly Phe Val Ala Arg Ile Asp Gly Ser Gly

130 135 140

Asn Phe Gln Val Leu Leu Ser Asp Arg Tyr Phe Asn Lys Thr Cys Gly

145 150 155 160

Leu Cys Gly Asn Phe Asn Ile Phe Ala Glu Asp Asp Phe Met Thr Gln

165 170 175

Glu Gly Thr Leu Thr Ser Asp Pro Tyr Asp Phe Ala Asn Ser Trp Ala

180 185 190

Leu Ser Ser Gly Glu Gln Trp Cys Glu Arg Ala Ser Pro Pro Ser Ser

195 200 205

Ser Cys Asn Ile Ser Ser Gly Glu Met Gln Lys Gly Leu Trp Glu Gln

210 215 220

Cys Gln Leu Leu Lys Ser Thr Ser Val Phe Ala Arg Cys His Pro Leu

225 230 235 240

Val Asp Pro Glu Pro Phe Val Ala Leu Cys Glu Lys Thr Leu Cys Glu

245 250 255

Cys Ala Gly Gly Leu Glu Cys Ala Cys Pro Ala Leu Leu Glu Tyr Ala

260 265 270

Arg Thr Cys Ala Gln Glu Gly Met Val Leu Tyr Gly Trp Thr Asp His

275 280 285

Ser Ala Cys Ser Pro Val Cys Pro Ala Gly Met Glu Tyr Arg Gln Cys

290 295 300

Val Ser Pro Cys Ala Arg Thr Cys Gln Ser Leu His Ile Asn Glu Met

305 310 315 320

Cys Gln Glu Arg Cys Val Asp Gly Cys Ser Cys Pro Glu Gly Gln Leu

325 330 335

Leu Asp Glu Gly Leu Cys Val Glu Ser Thr Glu Cys Pro Cys Val His

340 345 350

Ser Gly Lys Arg Tyr Pro Pro Gly Thr Ser Leu Ser Arg Asp Cys Asn

355 360 365

Thr Cys Ile Cys Arg Asn Ser Gln Trp Ile Cys Ser Asn Glu Glu Cys

370 375 380

Pro Gly Glu Cys Leu Val Thr Gly Gln Ser His Phe Lys Ser Phe Asp

385 390 395 400

Asn Arg Tyr Phe Thr Phe Ser Gly Ile Cys Gln Tyr Leu Leu Ala Arg

405 410 415

Asp Cys Gln Asp His Ser Phe Ser Ile Val Ile Glu Thr Val Gln Cys

420 425 430

Ala Asp Asp Arg Asp Ala Val Cys Thr Arg Ser Val Thr Val Arg Leu

435 440 445

Pro Gly Leu His Asn Ser Leu Val Lys Leu Lys His Gly Ala Gly Val

450 455 460

Ala Met Asp Gly Gln Asp Val Gln Leu Pro Leu Leu Lys Gly Asp Leu

465 470 475 480

Arg Ile Gln His Thr Val Thr Ala Ser Val Arg Leu Ser Tyr Gly Glu

485 490 495

Asp Leu Gln Met Asp Trp Asp Gly Arg Gly Arg Leu Leu Val Lys Leu

500 505 510

Ser Pro Val Tyr Ala Gly Lys Thr Cys Gly Leu Cys Gly Asn Tyr Asn

515 520 525

Gly Asn Gln Gly Asp Asp Phe Leu Thr Pro Ser Gly Leu Ala Glu Pro

530 535 540

Arg Val Glu Asp Phe Gly Asn Ala Trp Lys Leu His Gly Asp Cys Gln

545 550 555 560

Asp Leu Gln Lys Gln His Ser Asp Pro Cys Ala Leu Asn Pro Arg Met

565 570 575

Thr Arg Phe Ser Glu Glu Ala Cys Ala Val Leu Thr Ser Pro Thr Phe

580 585 590

Glu Ala Cys His Arg Ala Val Ser Pro Leu Pro Tyr Leu Arg Asn Cys

595 600 605

Arg Tyr Asp Val Cys Ser Cys Ser Asp Gly Arg Glu Cys Leu Cys Gly

610 615 620

Ala Leu Ala Ser Tyr Ala Ala Ala Cys Ala Gly Arg Gly Val Arg Val

625 630 635 640

Ala Trp Arg Glu Pro Gly Arg Cys Glu Leu Asn Cys Pro Lys Gly Gln

645 650 655

Val Tyr Leu Gln Cys Gly Thr Pro Cys Asn Leu Thr Cys Arg Ser Leu

660 665 670

Ser Tyr Pro Asp Glu Glu Cys Asn Glu Ala Cys Leu Glu Gly Cys Phe

675 680 685

Cys Pro Pro Gly Leu Tyr Met Asp Glu Arg Gly Asp Cys Val Pro Lys

690 695 700

Ala Gln Cys Pro Cys Tyr Tyr Asp Gly Glu Ile Phe Gln Pro Glu Asp

705 710 715 720

Ile Phe Ser Asp His His Thr Met Cys Tyr Cys Glu Asp Gly Phe Met

725 730 735

His Cys Thr Met Ser Gly Val Pro Gly Ser Leu Leu Pro Asp Ala Val

740 745 750

Leu Ser Ser Pro Leu Ser His Arg Ser Lys Arg Ser Leu Ser Cys Arg

755 760 765

Pro Pro Met Val Lys Leu Val Cys Pro Ala Asp Asn Leu Arg Ala Glu

770 775 780

Gly Leu Glu Cys Thr Lys Thr Cys Gln Asn Tyr Asp Leu Glu Cys Met

785 790 795 800

Ser Met Gly Cys Val Ser Gly Cys Leu Cys Pro Pro Gly Met Val Arg

805 810 815

His Glu Asn Arg Cys Val Ala Leu Glu Arg Cys Pro Cys Phe His Gln

820 825 830

Gly Lys Glu Tyr Ala Pro Gly Glu Thr Val Lys Ile Gly Cys Asn Thr

835 840 845

Cys Val Cys Arg Asp Arg Lys Trp Asn Cys Thr Asp His Val Cys Asp

850 855 860

Ala Thr Cys Ser Thr Ile Gly Met Ala His Tyr Leu Thr Phe Asp Gly

865 870 875 880

Leu Lys Tyr Leu Phe Pro Gly Glu Cys Gln Tyr Val Leu Val Gln Asp

885 890 895

Tyr Cys Gly Ser Asn Pro Gly Thr Phe Arg Ile Leu Val Gly Asn Lys

900 905 910

Gly Cys Ser His Pro Ser Val Lys Cys Lys Lys Arg Val Thr Ile Leu

915 920 925

Val Glu Gly Gly Glu Ile Glu Leu Phe Asp Gly Glu Val Asn Val Lys

930 935 940

Arg Pro Met Lys Asp Glu Thr His Phe Glu Val Val Glu Ser Gly Arg

945 950 955 960

Tyr Ile Ile Leu Leu Leu Gly Lys Ala Leu Ser Val Val Trp Asp Arg

965 970 975

His Leu Ser Ile Ser Val Val Leu Lys Gln Thr Tyr Gln Glu Lys Val

980 985 990

Cys Gly Leu Cys Gly Asn Phe Asp Gly Ile Gln Asn Asn Asp Leu Thr

995 1000 1005

Ser Ser Asn Leu Gln Val Glu Glu Asp Pro Val Asp Phe Gly Asn

1010 1015 1020

Ser Trp Lys Val Ser Ser Gln Cys Ala Asp Thr Arg Lys Val Pro

1025 1030 1035

Leu Asp Ser Ser Pro Ala Thr Cys His Asn Asn Ile Met Lys Gln

1040 1045 1050

Thr Met Val Asp Ser Ser Cys Arg Ile Leu Thr Ser Asp Val Phe

1055 1060 1065

Gln Asp Cys Asn Lys Leu Val Asp Pro Glu Pro Tyr Leu Asp Val

1070 1075 1080

Cys Ile Tyr Asp Thr Cys Ser Cys Glu Ser Ile Gly Asp Cys Ala

1085 1090 1095

Cys Phe Cys Asp Thr Ile Ala Ala Tyr Ala His Val Cys Ala Gln

1100 1105 1110

His Gly Lys Val Val Thr Trp Arg Thr Ala Thr Leu Cys Pro Gln

1115 1120 1125

Ser Cys Glu Glu Arg Asn Leu Arg Glu Asn Gly Tyr Glu Cys Glu

1130 1135 1140

Trp Arg Tyr Asn Ser Cys Ala Pro Ala Cys Gln Val Thr Cys Gln

1145 1150 1155

His Pro Glu Pro Leu Ala Cys Pro Val Gln Cys Val Glu Gly Cys

1160 1165 1170

His Ala His Cys Pro Pro Gly Lys Ile Leu Asp Glu Leu Leu Gln

1175 1180 1185

Thr Cys Val Asp Pro Glu Asp Cys Pro Val Cys Glu Val Ala Gly

1190 1195 1200

Arg Arg Phe Ala Ser Gly Lys Lys Val Thr Leu Asn Pro Ser Asp

1205 1210 1215

Pro Glu His Cys Gln Ile Cys His Cys Asp Val Val Asn Leu Thr

1220 1225 1230

Cys Glu Ala Cys Gln Glu Pro Gly Gly Leu Val Val Pro Pro Thr

1235 1240 1245

Asp Ala Pro Val Ser Pro Thr Thr Leu Tyr Val Glu Asp Ile Ser

1250 1255 1260

Glu Pro Pro Leu His Asp Phe Tyr Cys Ser Arg Leu Leu Asp Leu

1265 1270 1275

Val Phe Leu Leu Asp Gly Ser Ser Arg Leu Ser Glu Ala Glu Phe

1280 1285 1290

Glu Val Leu Lys Ala Phe Val Val Asp Met Met Glu Arg Leu Arg

1295 1300 1305

Ile Ser Gln Lys Trp Val Arg Val Ala Val Val Glu Tyr His Asp

1310 1315 1320

Gly Ser His Ala Tyr Ile Gly Leu Lys Asp Arg Lys Arg Pro Ser

1325 1330 1335

Glu Leu Arg Arg Ile Ala Ser Gln Val Lys Tyr Ala Gly Ser Gln

1340 1345 1350

Val Ala Ser Thr Ser Glu Val Leu Lys Tyr Thr Leu Phe Gln Ile

1355 1360 1365

Phe Ser Lys Ile Asp Arg Pro Glu Ala Ser Arg Ile Thr Leu Leu

1370 1375 1380

Leu Met Ala Ser Gln Glu Pro Gln Arg Met Ser Arg Asn Phe Val

1385 1390 1395

Arg Tyr Val Gln Gly Leu Lys Lys Lys Lys Val Ile Val Ile Pro

1400 1405 1410

Val Gly Ile Gly Pro His Ala Asn Leu Lys Gln Ile Arg Leu Ile

1415 1420 1425

Glu Lys Gln Ala Pro Glu Asn Lys Ala Phe Val Leu Ser Ser Val

1430 1435 1440

Asp Glu Leu Glu Gln Gln Arg Asp Glu Ile Val Ser Tyr Leu Cys

1445 1450 1455

Asp Leu Ala Pro Glu Ala Pro Pro Pro Thr Leu Pro Pro Asp Met

1460 1465 1470

Ala Gln Val Thr Val Gly Pro Gly Leu Leu Gly Val Ser Thr Leu

1475 1480 1485

Gly Pro Lys Arg Asn Ser Met Val Leu Asp Val Ala Phe Val Leu

1490 1495 1500

Glu Gly Ser Asp Lys Ile Gly Glu Ala Asp Phe Asn Arg Ser Lys

1505 1510 1515

Glu Phe Met Glu Glu Val Ile Gln Arg Met Asp Val Gly Gln Asp

1520 1525 1530

Ser Ile His Val Thr Val Leu Gln Tyr Ser Tyr Met Val Thr Val

1535 1540 1545

Glu Tyr Pro Phe Ser Glu Ala Gln Ser Lys Gly Asp Ile Leu Gln

1550 1555 1560

Arg Val Arg Glu Ile Arg Tyr Gln Gly Gly Asn Arg Thr Asn Thr

1565 1570 1575

Gly Leu Ala Leu Arg Tyr Leu Ser Asp His Ser Phe Leu Val Ser

1580 1585 1590

Gln Gly Asp Arg Glu Gln Ala Pro Asn Leu Val Tyr Met Val Thr

1595 1600 1605

Gly Asn Pro Ala Ser Asp Glu Ile Lys Arg Leu Pro Gly Asp Ile

1610 1615 1620

Gln Val Val Pro Ile Gly Val Gly Pro Asn Ala Asn Val Gln Glu

1625 1630 1635

Leu Glu Arg Ile Gly Trp Pro Asn Ala Pro Ile Leu Ile Gln Asp

1640 1645 1650

Phe Glu Thr Leu Pro Arg Glu Ala Pro Asp Leu Val Leu Gln Arg

1655 1660 1665

Cys Cys Ser Gly Glu Gly Leu Gln Ile Pro Thr Leu Ser Pro Ala

1670 1675 1680

Pro Asp Cys Ser Gln Pro Leu Asp Val Ile Leu Leu Leu Asp Gly

1685 1690 1695

Ser Ser Ser Phe Pro Ala Ser Tyr Phe Asp Glu Met Lys Ser Phe

1700 1705 1710

Ala Lys Ala Phe Ile Ser Lys Ala Asn Ile Gly Pro Arg Leu Thr

1715 1720 1725

Gln Val Ser Val Leu Gln Tyr Gly Ser Ile Thr Thr Ile Asp Val

1730 1735 1740

Pro Trp Asn Val Val Pro Glu Lys Ala His Leu Leu Ser Leu Val

1745 1750 1755

Asp Val Met Gln Arg Glu Gly Gly Pro Ser Gln Ile Gly Asp Ala

1760 1765 1770

Leu Gly Phe Ala Val Arg Tyr Leu Thr Ser Glu Met His Gly Ala

1775 1780 1785

Arg Pro Gly Ala Ser Lys Ala Val Val Ile Leu Val Thr Asp Val

1790 1795 1800

Ser Val Asp Ser Val Asp Ala Ala Ala Asp Ala Ala Arg Ser Asn

1805 1810 1815

Arg Val Thr Val Phe Pro Ile Gly Ile Gly Asp Arg Tyr Asp Ala

1820 1825 1830

Ala Gln Leu Arg Ile Leu Ala Gly Pro Ala Gly Asp Ser Asn Val

1835 1840 1845

Val Lys Leu Gln Arg Ile Glu Asp Leu Pro Thr Met Val Thr Leu

1850 1855 1860

Gly Asn Ser Phe Leu His Lys Leu Cys Ser Gly Phe Val Arg Ile

1865 1870 1875

Cys Met Asp Glu Asp Gly Asn Glu Lys Arg Pro Gly Asp Val Trp

1880 1885 1890

Thr Leu Pro Asp Gln Cys His Thr Val Thr Cys Gln Pro Asp Gly

1895 1900 1905

Gln Thr Leu Leu Lys Ser His Arg Val Asn Cys Asp Arg Gly Leu

1910 1915 1920

Arg Pro Ser Cys Pro Asn Ser Gln Ser Pro Val Lys Val Glu Glu

1925 1930 1935

Thr Cys Gly Cys Arg Trp Thr Cys Pro Cys Val Cys Thr Gly Ser

1940 1945 1950

Ser Thr Arg His Ile Val Thr Phe Asp Gly Gln Asn Phe Lys Leu

1955 1960 1965

Thr Gly Ser Cys Ser Tyr Val Leu Phe Gln Asn Lys Glu Gln Asp

1970 1975 1980

Leu Glu Val Ile Leu His Asn Gly Ala Cys Ser Pro Gly Ala Arg

1985 1990 1995

Gln Gly Cys Met Lys Ser Ile Glu Val Lys His Ser Ala Leu Ser

2000 2005 2010

Val Glu Leu His Ser Asp Met Glu Val Thr Val Asn Gly Arg Leu

2015 2020 2025

Val Ser Val Pro Tyr Val Gly Gly Asn Met Glu Val Asn Val Tyr

2030 2035 2040

Gly Ala Ile Met His Glu Val Arg Phe Asn His Leu Gly His Ile

2045 2050 2055

Phe Thr Phe Thr Pro Gln Asn Asn Glu Phe Gln Leu Gln Leu Ser

2060 2065 2070

Pro Lys Thr Phe Ala Ser Lys Thr Tyr Gly Leu Cys Gly Ile Cys

2075 2080 2085

Asp Glu Asn Gly Ala Asn Asp Phe Met Leu Arg Asp Gly Thr Val

2090 2095 2100

Thr Thr Asp Trp Lys Thr Leu Val Gln Glu Trp Thr Val Gln Arg

2105 2110 2115

Pro Gly Gln Thr Cys Gln Pro Ile Leu Glu Glu Gln Cys Leu Val

2120 2125 2130

Pro Asp Ser Ser His Cys Gln Val Leu Leu Leu Pro Leu Phe Ala

2135 2140 2145

Glu Cys His Lys Val Leu Ala Pro Ala Thr Phe Tyr Ala Ile Cys

2150 2155 2160

Gln Gln Asp Ser Cys His Gln Glu Gln Val Cys Glu Val Ile Ala

2165 2170 2175

Ser Tyr Ala His Leu Cys Arg Thr Asn Gly Val Cys Val Asp Trp

2180 2185 2190

Arg Thr Pro Asp Phe Cys Ala Met Ser Cys Pro Pro Ser Leu Val

2195 2200 2205

Tyr Asn His Cys Glu His Gly Cys Pro Arg His Cys Asp Gly Asn

2210 2215 2220

Val Ser Ser Cys Gly Asp His Pro Ser Glu Gly Cys Phe Cys Pro

2225 2230 2235

Pro Asp Lys Val Met Leu Glu Gly Ser Cys Val Pro Glu Glu Ala

2240 2245 2250

Cys Thr Gln Cys Ile Gly Glu Asp Gly Val Gln His Gln Phe Leu

2255 2260 2265

Glu Ala Trp Val Pro Asp His Gln Pro Cys Gln Ile Cys Thr Cys

2270 2275 2280

Leu Ser Gly Arg Lys Val Asn Cys Thr Thr Gln Pro Cys Pro Thr

2285 2290 2295

Ala Lys Ala Pro Thr Cys Gly Leu Cys Glu Val Ala Arg Leu Arg

2300 2305 2310

Gln Asn Ala Asp Gln Cys Cys Pro Glu Tyr Glu Cys Val Cys Asp

2315 2320 2325

Pro Val Ser Cys Asp Leu Pro Pro Val Pro His Cys Glu Arg Gly

2330 2335 2340

Leu Gln Pro Thr Leu Thr Asn Pro Gly Glu Cys Arg Pro Asn Phe

2345 2350 2355

Thr Cys Ala Cys Arg Lys Glu Glu Cys Lys Arg Val Ser Pro Pro

2360 2365 2370

Ser Cys Pro Pro His Arg Leu Pro Thr Leu Arg Lys Thr Gln Cys

2375 2380 2385

Cys Asp Glu Tyr Glu Cys Ala Cys Asn Cys Val Asn Ser Thr Val

2390 2395 2400

Ser Cys Pro Leu Gly Tyr Leu Ala Ser Thr Ala Thr Asn Asp Cys

2405 2410 2415

Gly Cys Thr Thr Thr Thr Cys Leu Pro Asp Lys Val Cys Val His

2420 2425 2430

Arg Ser Thr Ile Tyr Pro Val Gly Gln Phe Trp Glu Glu Gly Cys

2435 2440 2445

Asp Val Cys Thr Cys Thr Asp Met Glu Asp Ala Val Met Gly Leu

2450 2455 2460

Arg Val Ala Gln Cys Ser Gln Lys Pro Cys Glu Asp Ser Cys Arg

2465 2470 2475

Ser Gly Phe Thr Tyr Val Leu His Glu Gly Glu Cys Cys Gly Arg

2480 2485 2490

Cys Leu Pro Ser Ala Cys Glu Val Val Thr Gly Ser Pro Arg Gly

2495 2500 2505

Asp Ser Gln Ser Ser Trp Lys Ser Val Gly Ser Gln Trp Ala Ser

2510 2515 2520

Pro Glu Asn Pro Cys Leu Ile Asn Glu Cys Val Arg Val Lys Glu

2525 2530 2535

Glu Val Phe Ile Gln Gln Arg Asn Val Ser Cys Pro Gln Leu Glu

2540 2545 2550

Val Pro Val Cys Pro Ser Gly Phe Gln Leu Ser Cys Lys Thr Ser

2555 2560 2565

Ala Cys Cys Pro Ser Cys Arg Cys Glu Arg Met Glu Ala Cys Met

2570 2575 2580

Leu Asn Gly Thr Val Ile Gly Pro Gly Lys Thr Val Met Ile Asp

2585 2590 2595

Val Cys Thr Thr Cys Arg Cys Met Val Gln Val Gly Val Ile Ser

2600 2605 2610

Gly Phe Lys Leu Glu Cys Arg Lys Thr Thr Cys Asn Pro Cys Pro

2615 2620 2625

Leu Gly Tyr Lys Glu Glu Asn Asn Thr Gly Glu Cys Cys Gly Arg

2630 2635 2640

Cys Leu Pro Thr Ala Cys Thr Ile Gln Leu Arg Gly Gly Gln Ile

2645 2650 2655

Met Thr Leu Lys Arg Asp Glu Thr Leu Gln Asp Gly Cys Asp Thr

2660 2665 2670

His Phe Cys Lys Val Asn Glu Arg Gly Glu Tyr Phe Trp Glu Lys

2675 2680 2685

Arg Val Thr Gly Cys Pro Pro Phe Asp Glu His Lys Cys Leu Ala

2690 2695 2700

Glu Gly Gly Lys Ile Met Lys Ile Pro Gly Thr Cys Cys Asp Thr

2705 2710 2715

Cys Glu Glu Pro Glu Cys Asn Asp Ile Thr Ala Arg Leu Gln Tyr

2720 2725 2730

Val Lys Val Gly Ser Cys Lys Ser Glu Val Glu Val Asp Ile His

2735 2740 2745

Tyr Cys Gln Gly Lys Cys Ala Ser Lys Ala Met Tyr Ser Ile Asp

2750 2755 2760

Ile Asn Asp Val Gln Asp Gln Cys Ser Cys Cys Ser Pro Thr Arg

2765 2770 2775

Thr Glu Pro Met Gln Val Ala Leu His Cys Thr Asn Gly Ser Val

2780 2785 2790

Val Tyr His Glu Val Leu Asn Ala Met Glu Cys Lys Cys Ser Pro

2795 2800 2805

Arg Lys Cys Ser Lys

2810

<210> 3

<211> 567

<212> БЕЛОК

<213> Homo sapiens

<400> 3

Ser Leu Ser Cys Arg Pro Pro Met Val Lys Leu Val Cys Pro Ala Asp

1 5 10 15

Asn Leu Arg Ala Glu Gly Leu Glu Cys Thr Lys Thr Cys Gln Asn Tyr

20 25 30

Asp Leu Glu Cys Met Ser Met Gly Cys Val Ser Gly Cys Leu Cys Pro

35 40 45

Pro Gly Met Val Arg His Glu Asn Arg Cys Val Ala Leu Glu Arg Cys

50 55 60

Pro Cys Phe His Gln Gly Lys Glu Tyr Ala Pro Gly Glu Thr Val Lys

65 70 75 80

Ile Gly Cys Asn Thr Cys Val Cys Gln Asp Arg Lys Trp Asn Cys Thr

85 90 95

Asp His Val Cys Asp Ala Thr Cys Ser Thr Ile Gly Met Ala His Tyr

100 105 110

Leu Thr Phe Asp Gly Leu Lys Tyr Leu Phe Pro Gly Glu Cys Gln Tyr

115 120 125

Val Leu Val Gln Asp Tyr Cys Gly Ser Asn Pro Gly Thr Phe Arg Ile

130 135 140

Leu Val Gly Asn Lys Gly Cys Ser His Pro Ser Val Lys Cys Lys Lys

145 150 155 160

Arg Val Thr Ile Leu Val Glu Gly Gly Glu Ile Glu Leu Phe Asp Gly

165 170 175

Glu Val Asn Val Lys Arg Pro Met Lys Asp Glu Thr His Phe Glu Val

180 185 190

Val Glu Ser Gly Arg Tyr Ile Ile Leu Leu Leu Gly Lys Ala Leu Ser

195 200 205

Val Val Trp Asp Arg His Leu Ser Ile Ser Val Val Leu Lys Gln Thr

210 215 220

Tyr Gln Glu Lys Val Cys Gly Leu Cys Gly Asn Phe Asp Gly Ile Gln

225 230 235 240

Asn Asn Asp Leu Thr Ser Ser Asn Leu Gln Val Glu Glu Asp Pro Val

245 250 255

Asp Phe Gly Asn Ser Trp Lys Val Ser Ser Gln Cys Ala Asp Thr Arg

260 265 270

Lys Val Pro Leu Asp Ser Ser Pro Ala Thr Cys His Asn Asn Ile Met

275 280 285

Lys Gln Thr Met Val Asp Ser Ser Cys Arg Ile Leu Thr Ser Asp Val

290 295 300

Phe Gln Asp Cys Asn Lys Leu Val Asp Pro Glu Pro Tyr Leu Asp Val

305 310 315 320

Cys Ile Tyr Asp Thr Cys Ser Cys Glu Ser Ile Gly Asp Cys Ala Cys

325 330 335

Phe Cys Asp Thr Ile Ala Ala Tyr Ala His Val Cys Ala Gln His Gly

340 345 350

Lys Val Val Thr Trp Arg Thr Ala Thr Leu Cys Pro Gln Ser Cys Glu

355 360 365

Glu Arg Asn Leu Arg Glu Asn Gly Tyr Glu Cys Glu Trp Arg Tyr Asn

370 375 380

Ser Cys Ala Pro Ala Cys Gln Val Thr Cys Gln His Pro Glu Pro Leu

385 390 395 400

Ala Cys Pro Val Gln Cys Val Glu Gly Cys His Ala His Cys Pro Pro

405 410 415

Gly Lys Ile Leu Asp Glu Leu Leu Gln Thr Cys Val Asp Pro Glu Asp

420 425 430

Cys Pro Val Cys Glu Val Ala Gly Arg Arg Phe Ala Ser Gly Lys Lys

435 440 445

Val Thr Leu Asn Pro Ser Asp Pro Glu His Cys Gln Ile Cys His Cys

450 455 460

Asp Val Val Asn Leu Thr Cys Glu Ala Cys Gln Glu Pro Gly Gly Leu

465 470 475 480

Val Val Pro Pro Thr Asp Ala Pro Val Ser Pro Thr Thr Leu Tyr Val

485 490 495

Glu Asp Ile Ser Glu Pro Pro Leu His Gln Glu Pro Gly Gly Leu Val

500 505 510

Val Pro Pro Thr Asp Ala Pro Val Ser Pro Thr Thr Leu Tyr Val Glu

515 520 525

Asp Ile Ser Glu Pro Pro Leu His Gln Glu Pro Gly Gly Leu Val Val

530 535 540

Pro Pro Thr Asp Ala Pro Val Ser Pro Thr Thr Leu Tyr Val Glu Asp

545 550 555 560

Ile Ser Glu Pro Pro Leu His

565

<210> 4

<211> 589

<212> БЕЛОК

<213> Homo sapiens

<400> 4

Met Ile Pro Ala Arg Phe Ala Gly Val Leu Leu Ala Leu Ala Leu Ile

1 5 10 15

Leu Pro Gly Thr Leu Cys Ser Leu Ser Cys Arg Pro Pro Met Val Lys

20 25 30

Leu Val Cys Pro Ala Asp Asn Leu Arg Ala Glu Gly Leu Glu Cys Thr

35 40 45

Lys Thr Cys Gln Asn Tyr Asp Leu Glu Cys Met Ser Met Gly Cys Val

50 55 60

Ser Gly Cys Leu Cys Pro Pro Gly Met Val Arg His Glu Asn Arg Cys

65 70 75 80

Val Ala Leu Glu Arg Cys Pro Cys Phe His Gln Gly Lys Glu Tyr Ala

85 90 95

Pro Gly Glu Thr Val Lys Ile Gly Cys Asn Thr Cys Val Cys Gln Asp

100 105 110

Arg Lys Trp Asn Cys Thr Asp His Val Cys Asp Ala Thr Cys Ser Thr

115 120 125

Ile Gly Met Ala His Tyr Leu Thr Phe Asp Gly Leu Lys Tyr Leu Phe

130 135 140

Pro Gly Glu Cys Gln Tyr Val Leu Val Gln Asp Tyr Cys Gly Ser Asn

145 150 155 160

Pro Gly Thr Phe Arg Ile Leu Val Gly Asn Lys Gly Cys Ser His Pro

165 170 175

Ser Val Lys Cys Lys Lys Arg Val Thr Ile Leu Val Glu Gly Gly Glu

180 185 190

Ile Glu Leu Phe Asp Gly Glu Val Asn Val Lys Arg Pro Met Lys Asp

195 200 205

Glu Thr His Phe Glu Val Val Glu Ser Gly Arg Tyr Ile Ile Leu Leu

210 215 220

Leu Gly Lys Ala Leu Ser Val Val Trp Asp Arg His Leu Ser Ile Ser

225 230 235 240

Val Val Leu Lys Gln Thr Tyr Gln Glu Lys Val Cys Gly Leu Cys Gly

245 250 255

Asn Phe Asp Gly Ile Gln Asn Asn Asp Leu Thr Ser Ser Asn Leu Gln

260 265 270

Val Glu Glu Asp Pro Val Asp Phe Gly Asn Ser Trp Lys Val Ser Ser

275 280 285

Gln Cys Ala Asp Thr Arg Lys Val Pro Leu Asp Ser Ser Pro Ala Thr

290 295 300

Cys His Asn Asn Ile Met Lys Gln Thr Met Val Asp Ser Ser Cys Arg

305 310 315 320

Ile Leu Thr Ser Asp Val Phe Gln Asp Cys Asn Lys Leu Val Asp Pro

325 330 335

Glu Pro Tyr Leu Asp Val Cys Ile Tyr Asp Thr Cys Ser Cys Glu Ser

340 345 350

Ile Gly Asp Cys Ala Cys Phe Cys Asp Thr Ile Ala Ala Tyr Ala His

355 360 365

Val Cys Ala Gln His Gly Lys Val Val Thr Trp Arg Thr Ala Thr Leu

370 375 380

Cys Pro Gln Ser Cys Glu Glu Arg Asn Leu Arg Glu Asn Gly Tyr Glu

385 390 395 400

Cys Glu Trp Arg Tyr Asn Ser Cys Ala Pro Ala Cys Gln Val Thr Cys

405 410 415

Gln His Pro Glu Pro Leu Ala Cys Pro Val Gln Cys Val Glu Gly Cys

420 425 430

His Ala His Cys Pro Pro Gly Lys Ile Leu Asp Glu Leu Leu Gln Thr

435 440 445

Cys Val Asp Pro Glu Asp Cys Pro Val Cys Glu Val Ala Gly Arg Arg

450 455 460

Phe Ala Ser Gly Lys Lys Val Thr Leu Asn Pro Ser Asp Pro Glu His

465 470 475 480

Cys Gln Ile Cys His Cys Asp Val Val Asn Leu Thr Cys Glu Ala Cys

485 490 495

Gln Glu Pro Gly Gly Leu Val Val Pro Pro Thr Asp Ala Pro Val Ser

500 505 510

Pro Thr Thr Leu Tyr Val Glu Asp Ile Ser Glu Pro Pro Leu His Gln

515 520 525

Glu Pro Gly Gly Leu Val Val Pro Pro Thr Asp Ala Pro Val Ser Pro

530 535 540

Thr Thr Leu Tyr Val Glu Asp Ile Ser Glu Pro Pro Leu His Gln Glu

545 550 555 560

Pro Gly Gly Leu Val Val Pro Pro Thr Asp Ala Pro Val Ser Pro Thr

565 570 575

Thr Leu Tyr Val Glu Asp Ile Ser Glu Pro Pro Leu His

580 585

<210> 5

<211> 1330

<212> БЕЛОК

<213> Homo sapiens

<400> 5

Met Ile Pro Ala Arg Phe Ala Gly Val Leu Leu Ala Leu Ala Leu Ile

1 5 10 15

Leu Pro Gly Thr Leu Cys Ala Glu Gly Thr Arg Gly Arg Ser Ser Thr

20 25 30

Ala Arg Cys Ser Leu Phe Gly Ser Asp Phe Val Asn Thr Phe Asp Gly

35 40 45

Ser Met Tyr Ser Phe Ala Gly Tyr Cys Ser Tyr Leu Leu Ala Gly Gly

50 55 60

Cys Gln Lys Arg Ser Phe Ser Ile Ile Gly Asp Phe Gln Asn Gly Lys

65 70 75 80

Arg Val Ser Leu Ser Val Tyr Leu Gly Glu Phe Phe Asp Ile His Leu

85 90 95

Phe Val Asn Gly Thr Val Thr Gln Gly Asp Gln Arg Val Ser Met Pro

100 105 110

Tyr Ala Ser Lys Gly Leu Tyr Leu Glu Thr Glu Ala Gly Tyr Tyr Lys

115 120 125

Leu Ser Gly Glu Ala Tyr Gly Phe Val Ala Arg Ile Asp Gly Ser Gly

130 135 140

Asn Phe Gln Val Leu Leu Ser Asp Arg Tyr Phe Asn Lys Thr Cys Gly

145 150 155 160

Leu Cys Gly Asn Phe Asn Ile Phe Ala Glu Asp Asp Phe Met Thr Gln

165 170 175

Glu Gly Thr Leu Thr Ser Asp Pro Tyr Asp Phe Ala Asn Ser Trp Ala

180 185 190

Leu Ser Ser Gly Glu Gln Trp Cys Glu Arg Ala Ser Pro Pro Ser Ser

195 200 205

Ser Cys Asn Ile Ser Ser Gly Glu Met Gln Lys Gly Leu Trp Glu Gln

210 215 220

Cys Gln Leu Leu Lys Ser Thr Ser Val Phe Ala Arg Cys His Pro Leu

225 230 235 240

Val Asp Pro Glu Pro Phe Val Ala Leu Cys Glu Lys Thr Leu Cys Glu

245 250 255

Cys Ala Gly Gly Leu Glu Cys Ala Cys Pro Ala Leu Leu Glu Tyr Ala

260 265 270

Arg Thr Cys Ala Gln Glu Gly Met Val Leu Tyr Gly Trp Thr Asp His

275 280 285

Ser Ala Cys Ser Pro Val Cys Pro Ala Gly Met Glu Tyr Arg Gln Cys

290 295 300

Val Ser Pro Cys Ala Arg Thr Cys Gln Ser Leu His Ile Asn Glu Met

305 310 315 320

Cys Gln Glu Arg Cys Val Asp Gly Cys Ser Cys Pro Glu Gly Gln Leu

325 330 335

Leu Asp Glu Gly Leu Cys Val Glu Ser Thr Glu Cys Pro Cys Val His

340 345 350

Ser Gly Lys Arg Tyr Pro Pro Gly Thr Ser Leu Ser Arg Asp Cys Asn

355 360 365

Thr Cys Ile Cys Arg Asn Ser Gln Trp Ile Cys Ser Asn Glu Glu Cys

370 375 380

Pro Gly Glu Cys Leu Val Thr Gly Gln Ser His Phe Lys Ser Phe Asp

385 390 395 400

Asn Arg Tyr Phe Thr Phe Ser Gly Ile Cys Gln Tyr Leu Leu Ala Arg

405 410 415

Asp Cys Gln Asp His Ser Phe Ser Ile Val Ile Glu Thr Val Gln Cys

420 425 430

Ala Asp Asp Arg Asp Ala Val Cys Thr Arg Ser Val Thr Val Arg Leu

435 440 445

Pro Gly Leu His Asn Ser Leu Val Lys Leu Lys His Gly Ala Gly Val

450 455 460

Ala Met Asp Gly Gln Asp Val Gln Leu Pro Leu Leu Lys Gly Asp Leu

465 470 475 480

Arg Ile Gln His Thr Val Thr Ala Ser Val Arg Leu Ser Tyr Gly Glu

485 490 495

Asp Leu Gln Met Asp Trp Asp Gly Arg Gly Arg Leu Leu Val Lys Leu

500 505 510

Ser Pro Val Tyr Ala Gly Lys Thr Cys Gly Leu Cys Gly Asn Tyr Asn

515 520 525

Gly Asn Gln Gly Asp Asp Phe Leu Thr Pro Ser Gly Leu Ala Glu Pro

530 535 540

Arg Val Glu Asp Phe Gly Asn Ala Trp Lys Leu His Gly Asp Cys Gln

545 550 555 560

Asp Leu Gln Lys Gln His Ser Asp Pro Cys Ala Leu Asn Pro Arg Met

565 570 575

Thr Arg Phe Ser Glu Glu Ala Cys Ala Val Leu Thr Ser Pro Thr Phe

580 585 590

Glu Ala Cys His Arg Ala Val Ser Pro Leu Pro Tyr Leu Arg Asn Cys

595 600 605

Arg Tyr Asp Val Cys Ser Cys Ser Asp Gly Arg Glu Cys Leu Cys Gly

610 615 620

Ala Leu Ala Ser Tyr Ala Ala Ala Cys Ala Gly Arg Gly Val Arg Val

625 630 635 640

Ala Trp Arg Glu Pro Gly Arg Cys Glu Leu Asn Cys Pro Lys Gly Gln

645 650 655

Val Tyr Leu Gln Cys Gly Thr Pro Cys Asn Leu Thr Cys Arg Ser Leu

660 665 670

Ser Tyr Pro Asp Glu Glu Cys Asn Glu Ala Cys Leu Glu Gly Cys Phe

675 680 685

Cys Pro Pro Gly Leu Tyr Met Asp Glu Arg Gly Asp Cys Val Pro Lys

690 695 700

Ala Gln Cys Pro Cys Tyr Tyr Asp Gly Glu Ile Phe Gln Pro Glu Asp

705 710 715 720

Ile Phe Ser Asp His His Thr Met Cys Tyr Cys Glu Asp Gly Phe Met

725 730 735

His Cys Thr Met Ser Gly Val Pro Gly Ser Leu Leu Pro Asp Ala Val

740 745 750

Leu Ser Ser Pro Leu Ser His Arg Ser Lys Arg Ser Leu Ser Cys Arg

755 760 765

Pro Pro Met Val Lys Leu Val Cys Pro Ala Asp Asn Leu Arg Ala Glu

770 775 780

Gly Leu Glu Cys Thr Lys Thr Cys Gln Asn Tyr Asp Leu Glu Cys Met

785 790 795 800

Ser Met Gly Cys Val Ser Gly Cys Leu Cys Pro Pro Gly Met Val Arg

805 810 815

His Glu Asn Arg Cys Val Ala Leu Glu Arg Cys Pro Cys Phe His Gln

820 825 830

Gly Lys Glu Tyr Ala Pro Gly Glu Thr Val Lys Ile Gly Cys Asn Thr

835 840 845

Cys Val Cys Gln Asp Arg Lys Trp Asn Cys Thr Asp His Val Cys Asp

850 855 860

Ala Thr Cys Ser Thr Ile Gly Met Ala His Tyr Leu Thr Phe Asp Gly

865 870 875 880

Leu Lys Tyr Leu Phe Pro Gly Glu Cys Gln Tyr Val Leu Val Gln Asp

885 890 895

Tyr Cys Gly Ser Asn Pro Gly Thr Phe Arg Ile Leu Val Gly Asn Lys

900 905 910

Gly Cys Ser His Pro Ser Val Lys Cys Lys Lys Arg Val Thr Ile Leu

915 920 925

Val Glu Gly Gly Glu Ile Glu Leu Phe Asp Gly Glu Val Asn Val Lys

930 935 940

Arg Pro Met Lys Asp Glu Thr His Phe Glu Val Val Glu Ser Gly Arg

945 950 955 960

Tyr Ile Ile Leu Leu Leu Gly Lys Ala Leu Ser Val Val Trp Asp Arg

965 970 975

His Leu Ser Ile Ser Val Val Leu Lys Gln Thr Tyr Gln Glu Lys Val

980 985 990

Cys Gly Leu Cys Gly Asn Phe Asp Gly Ile Gln Asn Asn Asp Leu Thr

995 1000 1005

Ser Ser Asn Leu Gln Val Glu Glu Asp Pro Val Asp Phe Gly Asn

1010 1015 1020

Ser Trp Lys Val Ser Ser Gln Cys Ala Asp Thr Arg Lys Val Pro

1025 1030 1035

Leu Asp Ser Ser Pro Ala Thr Cys His Asn Asn Ile Met Lys Gln

1040 1045 1050

Thr Met Val Asp Ser Ser Cys Arg Ile Leu Thr Ser Asp Val Phe

1055 1060 1065

Gln Asp Cys Asn Lys Leu Val Asp Pro Glu Pro Tyr Leu Asp Val

1070 1075 1080

Cys Ile Tyr Asp Thr Cys Ser Cys Glu Ser Ile Gly Asp Cys Ala

1085 1090 1095

Cys Phe Cys Asp Thr Ile Ala Ala Tyr Ala His Val Cys Ala Gln

1100 1105 1110

His Gly Lys Val Val Thr Trp Arg Thr Ala Thr Leu Cys Pro Gln

1115 1120 1125

Ser Cys Glu Glu Arg Asn Leu Arg Glu Asn Gly Tyr Glu Cys Glu

1130 1135 1140

Trp Arg Tyr Asn Ser Cys Ala Pro Ala Cys Gln Val Thr Cys Gln

1145 1150 1155

His Pro Glu Pro Leu Ala Cys Pro Val Gln Cys Val Glu Gly Cys

1160 1165 1170

His Ala His Cys Pro Pro Gly Lys Ile Leu Asp Glu Leu Leu Gln

1175 1180 1185

Thr Cys Val Asp Pro Glu Asp Cys Pro Val Cys Glu Val Ala Gly

1190 1195 1200

Arg Arg Phe Ala Ser Gly Lys Lys Val Thr Leu Asn Pro Ser Asp

1205 1210 1215

Pro Glu His Cys Gln Ile Cys His Cys Asp Val Val Asn Leu Thr

1220 1225 1230

Cys Glu Ala Cys Gln Glu Pro Gly Gly Leu Val Val Pro Pro Thr

1235 1240 1245

Asp Ala Pro Val Ser Pro Thr Thr Leu Tyr Val Glu Asp Ile Ser

1250 1255 1260

Glu Pro Pro Leu His Gln Glu Pro Gly Gly Leu Val Val Pro Pro

1265 1270 1275

Thr Asp Ala Pro Val Ser Pro Thr Thr Leu Tyr Val Glu Asp Ile

1280 1285 1290

Ser Glu Pro Pro Leu His Gln Glu Pro Gly Gly Leu Val Val Pro

1295 1300 1305

Pro Thr Asp Ala Pro Val Ser Pro Thr Thr Leu Tyr Val Glu Asp

1310 1315 1320

Ile Ser Glu Pro Pro Leu His

1325 1330

<210> 6

<211> 629

<212> БЕЛОК

<213> Homo sapiens

<400> 6

Ser Leu Ser Cys Arg Pro Pro Met Val Lys Leu Val Cys Pro Ala Asp

1 5 10 15

Asn Leu Arg Ala Glu Gly Leu Glu Cys Thr Lys Thr Cys Gln Asn Tyr

20 25 30

Asp Leu Glu Cys Met Ser Met Gly Cys Val Ser Gly Cys Leu Cys Pro

35 40 45

Pro Gly Met Val Arg His Glu Asn Arg Cys Val Ala Leu Glu Arg Cys

50 55 60

Pro Cys Phe His Gln Gly Lys Glu Tyr Ala Pro Gly Glu Thr Val Lys

65 70 75 80

Ile Gly Cys Asn Thr Cys Val Cys Gln Asp Arg Lys Trp Asn Cys Thr

85 90 95

Asp His Val Cys Asp Ala Thr Cys Ser Thr Ile Gly Met Ala His Tyr

100 105 110

Leu Thr Phe Asp Gly Leu Lys Tyr Leu Phe Pro Gly Glu Cys Gln Tyr

115 120 125

Val Leu Val Gln Asp Tyr Cys Gly Ser Asn Pro Gly Thr Phe Arg Ile

130 135 140

Leu Val Gly Asn Lys Gly Cys Ser His Pro Ser Val Lys Cys Lys Lys

145 150 155 160

Arg Val Thr Ile Leu Val Glu Gly Gly Glu Ile Glu Leu Phe Asp Gly

165 170 175

Glu Val Asn Val Lys Arg Pro Met Lys Asp Glu Thr His Phe Glu Val

180 185 190

Val Glu Ser Gly Arg Tyr Ile Ile Leu Leu Leu Gly Lys Ala Leu Ser

195 200 205

Val Val Trp Asp Arg His Leu Ser Ile Ser Val Val Leu Lys Gln Thr

210 215 220

Tyr Gln Glu Lys Val Cys Gly Leu Cys Gly Asn Phe Asp Gly Ile Gln

225 230 235 240

Asn Asn Asp Leu Thr Ser Ser Asn Leu Gln Val Glu Glu Asp Pro Val

245 250 255

Asp Phe Gly Asn Ser Trp Lys Val Ser Ser Gln Cys Ala Asp Thr Arg

260 265 270

Lys Val Pro Leu Asp Ser Ser Pro Ala Thr Cys His Asn Asn Ile Met

275 280 285

Lys Gln Thr Met Val Asp Ser Ser Cys Arg Ile Leu Thr Ser Asp Val

290 295 300

Phe Gln Asp Cys Asn Lys Leu Val Asp Pro Glu Pro Tyr Leu Asp Val

305 310 315 320

Cys Ile Tyr Asp Thr Cys Ser Cys Glu Ser Ile Gly Asp Cys Ala Cys

325 330 335

Phe Cys Asp Thr Ile Ala Ala Tyr Ala His Val Cys Ala Gln His Gly

340 345 350

Lys Val Val Thr Trp Arg Thr Ala Thr Leu Cys Pro Gln Ser Cys Glu

355 360 365

Glu Arg Asn Leu Arg Glu Asn Gly Tyr Glu Cys Glu Trp Arg Tyr Asn

370 375 380

Ser Cys Ala Pro Ala Cys Gln Val Thr Cys Gln His Pro Glu Pro Leu

385 390 395 400

Ala Cys Pro Val Gln Cys Val Glu Gly Cys His Ala His Cys Pro Pro

405 410 415

Gly Lys Ile Leu Asp Glu Leu Leu Gln Thr Cys Val Asp Pro Glu Asp

420 425 430

Cys Pro Val Cys Glu Val Ala Gly Arg Arg Phe Ala Ser Gly Lys Lys

435 440 445

Val Thr Leu Asn Pro Ser Asp Pro Glu His Cys Gln Ile Cys His Cys

450 455 460

Asp Val Val Asn Leu Thr Cys Glu Ala Cys Gln Glu Pro Gly Gly Leu

465 470 475 480

Val Val Pro Pro Thr Asp Ala Pro Val Ser Pro Thr Thr Leu Tyr Val

485 490 495

Glu Asp Ile Ser Glu Pro Pro Leu His Gln Glu Pro Gly Gly Leu Val

500 505 510

Val Pro Pro Thr Asp Ala Pro Val Ser Pro Thr Thr Leu Tyr Val Glu

515 520 525

Asp Ile Ser Glu Pro Pro Leu His Gln Glu Pro Gly Gly Leu Val Val

530 535 540

Pro Pro Thr Asp Ala Pro Val Ser Pro Thr Thr Leu Tyr Val Glu Asp

545 550 555 560

Ile Ser Glu Pro Pro Leu His Gln Glu Pro Gly Gly Leu Val Val Pro

565 570 575

Pro Thr Asp Ala Pro Val Ser Pro Thr Thr Leu Tyr Val Glu Asp Ile

580 585 590

Ser Glu Pro Pro Leu His Gln Glu Pro Gly Gly Leu Val Val Pro Pro

595 600 605

Thr Asp Ala Pro Val Ser Pro Thr Thr Leu Tyr Val Glu Asp Ile Ser

610 615 620

Glu Pro Pro Leu His

625

<210> 7

<211> 651

<212> БЕЛОК

<213> Homo sapiens

<400> 7

Met Ile Pro Ala Arg Phe Ala Gly Val Leu Leu Ala Leu Ala Leu Ile

1 5 10 15

Leu Pro Gly Thr Leu Cys Ser Leu Ser Cys Arg Pro Pro Met Val Lys

20 25 30

Leu Val Cys Pro Ala Asp Asn Leu Arg Ala Glu Gly Leu Glu Cys Thr

35 40 45

Lys Thr Cys Gln Asn Tyr Asp Leu Glu Cys Met Ser Met Gly Cys Val

50 55 60

Ser Gly Cys Leu Cys Pro Pro Gly Met Val Arg His Glu Asn Arg Cys

65 70 75 80

Val Ala Leu Glu Arg Cys Pro Cys Phe His Gln Gly Lys Glu Tyr Ala

85 90 95

Pro Gly Glu Thr Val Lys Ile Gly Cys Asn Thr Cys Val Cys Gln Asp

100 105 110

Arg Lys Trp Asn Cys Thr Asp His Val Cys Asp Ala Thr Cys Ser Thr

115 120 125

Ile Gly Met Ala His Tyr Leu Thr Phe Asp Gly Leu Lys Tyr Leu Phe

130 135 140

Pro Gly Glu Cys Gln Tyr Val Leu Val Gln Asp Tyr Cys Gly Ser Asn

145 150 155 160

Pro Gly Thr Phe Arg Ile Leu Val Gly Asn Lys Gly Cys Ser His Pro

165 170 175

Ser Val Lys Cys Lys Lys Arg Val Thr Ile Leu Val Glu Gly Gly Glu

180 185 190

Ile Glu Leu Phe Asp Gly Glu Val Asn Val Lys Arg Pro Met Lys Asp

195 200 205

Glu Thr His Phe Glu Val Val Glu Ser Gly Arg Tyr Ile Ile Leu Leu

210 215 220

Leu Gly Lys Ala Leu Ser Val Val Trp Asp Arg His Leu Ser Ile Ser

225 230 235 240

Val Val Leu Lys Gln Thr Tyr Gln Glu Lys Val Cys Gly Leu Cys Gly

245 250 255

Asn Phe Asp Gly Ile Gln Asn Asn Asp Leu Thr Ser Ser Asn Leu Gln

260 265 270

Val Glu Glu Asp Pro Val Asp Phe Gly Asn Ser Trp Lys Val Ser Ser

275 280 285

Gln Cys Ala Asp Thr Arg Lys Val Pro Leu Asp Ser Ser Pro Ala Thr

290 295 300

Cys His Asn Asn Ile Met Lys Gln Thr Met Val Asp Ser Ser Cys Arg

305 310 315 320

Ile Leu Thr Ser Asp Val Phe Gln Asp Cys Asn Lys Leu Val Asp Pro

325 330 335

Glu Pro Tyr Leu Asp Val Cys Ile Tyr Asp Thr Cys Ser Cys Glu Ser

340 345 350

Ile Gly Asp Cys Ala Cys Phe Cys Asp Thr Ile Ala Ala Tyr Ala His

355 360 365

Val Cys Ala Gln His Gly Lys Val Val Thr Trp Arg Thr Ala Thr Leu

370 375 380

Cys Pro Gln Ser Cys Glu Glu Arg Asn Leu Arg Glu Asn Gly Tyr Glu

385 390 395 400

Cys Glu Trp Arg Tyr Asn Ser Cys Ala Pro Ala Cys Gln Val Thr Cys

405 410 415

Gln His Pro Glu Pro Leu Ala Cys Pro Val Gln Cys Val Glu Gly Cys

420 425 430

His Ala His Cys Pro Pro Gly Lys Ile Leu Asp Glu Leu Leu Gln Thr

435 440 445

Cys Val Asp Pro Glu Asp Cys Pro Val Cys Glu Val Ala Gly Arg Arg

450 455 460

Phe Ala Ser Gly Lys Lys Val Thr Leu Asn Pro Ser Asp Pro Glu His

465 470 475 480

Cys Gln Ile Cys His Cys Asp Val Val Asn Leu Thr Cys Glu Ala Cys

485 490 495

Gln Glu Pro Gly Gly Leu Val Val Pro Pro Thr Asp Ala Pro Val Ser

500 505 510

Pro Thr Thr Leu Tyr Val Glu Asp Ile Ser Glu Pro Pro Leu His Gln

515 520 525

Glu Pro Gly Gly Leu Val Val Pro Pro Thr Asp Ala Pro Val Ser Pro

530 535 540

Thr Thr Leu Tyr Val Glu Asp Ile Ser Glu Pro Pro Leu His Gln Glu

545 550 555 560

Pro Gly Gly Leu Val Val Pro Pro Thr Asp Ala Pro Val Ser Pro Thr

565 570 575

Thr Leu Tyr Val Glu Asp Ile Ser Glu Pro Pro Leu His Gln Glu Pro

580 585 590

Gly Gly Leu Val Val Pro Pro Thr Asp Ala Pro Val Ser Pro Thr Thr

595 600 605

Leu Tyr Val Glu Asp Ile Ser Glu Pro Pro Leu His Gln Glu Pro Gly

610 615 620

Gly Leu Val Val Pro Pro Thr Asp Ala Pro Val Ser Pro Thr Thr Leu

625 630 635 640

Tyr Val Glu Asp Ile Ser Glu Pro Pro Leu His

645 650

<210> 8

<211> 1392

<212> БЕЛОК

<213> Homo sapiens

<400> 8

Met Ile Pro Ala Arg Phe Ala Gly Val Leu Leu Ala Leu Ala Leu Ile

1 5 10 15

Leu Pro Gly Thr Leu Cys Ala Glu Gly Thr Arg Gly Arg Ser Ser Thr

20 25 30

Ala Arg Cys Ser Leu Phe Gly Ser Asp Phe Val Asn Thr Phe Asp Gly

35 40 45

Ser Met Tyr Ser Phe Ala Gly Tyr Cys Ser Tyr Leu Leu Ala Gly Gly

50 55 60

Cys Gln Lys Arg Ser Phe Ser Ile Ile Gly Asp Phe Gln Asn Gly Lys

65 70 75 80

Arg Val Ser Leu Ser Val Tyr Leu Gly Glu Phe Phe Asp Ile His Leu

85 90 95

Phe Val Asn Gly Thr Val Thr Gln Gly Asp Gln Arg Val Ser Met Pro

100 105 110

Tyr Ala Ser Lys Gly Leu Tyr Leu Glu Thr Glu Ala Gly Tyr Tyr Lys

115 120 125

Leu Ser Gly Glu Ala Tyr Gly Phe Val Ala Arg Ile Asp Gly Ser Gly

130 135 140

Asn Phe Gln Val Leu Leu Ser Asp Arg Tyr Phe Asn Lys Thr Cys Gly

145 150 155 160

Leu Cys Gly Asn Phe Asn Ile Phe Ala Glu Asp Asp Phe Met Thr Gln

165 170 175

Glu Gly Thr Leu Thr Ser Asp Pro Tyr Asp Phe Ala Asn Ser Trp Ala

180 185 190

Leu Ser Ser Gly Glu Gln Trp Cys Glu Arg Ala Ser Pro Pro Ser Ser

195 200 205

Ser Cys Asn Ile Ser Ser Gly Glu Met Gln Lys Gly Leu Trp Glu Gln

210 215 220

Cys Gln Leu Leu Lys Ser Thr Ser Val Phe Ala Arg Cys His Pro Leu

225 230 235 240

Val Asp Pro Glu Pro Phe Val Ala Leu Cys Glu Lys Thr Leu Cys Glu

245 250 255

Cys Ala Gly Gly Leu Glu Cys Ala Cys Pro Ala Leu Leu Glu Tyr Ala

260 265 270

Arg Thr Cys Ala Gln Glu Gly Met Val Leu Tyr Gly Trp Thr Asp His

275 280 285

Ser Ala Cys Ser Pro Val Cys Pro Ala Gly Met Glu Tyr Arg Gln Cys

290 295 300

Val Ser Pro Cys Ala Arg Thr Cys Gln Ser Leu His Ile Asn Glu Met

305 310 315 320

Cys Gln Glu Arg Cys Val Asp Gly Cys Ser Cys Pro Glu Gly Gln Leu

325 330 335

Leu Asp Glu Gly Leu Cys Val Glu Ser Thr Glu Cys Pro Cys Val His

340 345 350

Ser Gly Lys Arg Tyr Pro Pro Gly Thr Ser Leu Ser Arg Asp Cys Asn

355 360 365

Thr Cys Ile Cys Arg Asn Ser Gln Trp Ile Cys Ser Asn Glu Glu Cys

370 375 380

Pro Gly Glu Cys Leu Val Thr Gly Gln Ser His Phe Lys Ser Phe Asp

385 390 395 400

Asn Arg Tyr Phe Thr Phe Ser Gly Ile Cys Gln Tyr Leu Leu Ala Arg

405 410 415

Asp Cys Gln Asp His Ser Phe Ser Ile Val Ile Glu Thr Val Gln Cys

420 425 430

Ala Asp Asp Arg Asp Ala Val Cys Thr Arg Ser Val Thr Val Arg Leu

435 440 445

Pro Gly Leu His Asn Ser Leu Val Lys Leu Lys His Gly Ala Gly Val

450 455 460

Ala Met Asp Gly Gln Asp Val Gln Leu Pro Leu Leu Lys Gly Asp Leu

465 470 475 480

Arg Ile Gln His Thr Val Thr Ala Ser Val Arg Leu Ser Tyr Gly Glu

485 490 495

Asp Leu Gln Met Asp Trp Asp Gly Arg Gly Arg Leu Leu Val Lys Leu

500 505 510

Ser Pro Val Tyr Ala Gly Lys Thr Cys Gly Leu Cys Gly Asn Tyr Asn

515 520 525

Gly Asn Gln Gly Asp Asp Phe Leu Thr Pro Ser Gly Leu Ala Glu Pro

530 535 540

Arg Val Glu Asp Phe Gly Asn Ala Trp Lys Leu His Gly Asp Cys Gln

545 550 555 560

Asp Leu Gln Lys Gln His Ser Asp Pro Cys Ala Leu Asn Pro Arg Met

565 570 575

Thr Arg Phe Ser Glu Glu Ala Cys Ala Val Leu Thr Ser Pro Thr Phe

580 585 590

Glu Ala Cys His Arg Ala Val Ser Pro Leu Pro Tyr Leu Arg Asn Cys

595 600 605

Arg Tyr Asp Val Cys Ser Cys Ser Asp Gly Arg Glu Cys Leu Cys Gly

610 615 620

Ala Leu Ala Ser Tyr Ala Ala Ala Cys Ala Gly Arg Gly Val Arg Val

625 630 635 640

Ala Trp Arg Glu Pro Gly Arg Cys Glu Leu Asn Cys Pro Lys Gly Gln

645 650 655

Val Tyr Leu Gln Cys Gly Thr Pro Cys Asn Leu Thr Cys Arg Ser Leu

660 665 670

Ser Tyr Pro Asp Glu Glu Cys Asn Glu Ala Cys Leu Glu Gly Cys Phe

675 680 685

Cys Pro Pro Gly Leu Tyr Met Asp Glu Arg Gly Asp Cys Val Pro Lys

690 695 700

Ala Gln Cys Pro Cys Tyr Tyr Asp Gly Glu Ile Phe Gln Pro Glu Asp

705 710 715 720

Ile Phe Ser Asp His His Thr Met Cys Tyr Cys Glu Asp Gly Phe Met

725 730 735

His Cys Thr Met Ser Gly Val Pro Gly Ser Leu Leu Pro Asp Ala Val

740 745 750

Leu Ser Ser Pro Leu Ser His Arg Ser Lys Arg Ser Leu Ser Cys Arg

755 760 765

Pro Pro Met Val Lys Leu Val Cys Pro Ala Asp Asn Leu Arg Ala Glu

770 775 780

Gly Leu Glu Cys Thr Lys Thr Cys Gln Asn Tyr Asp Leu Glu Cys Met

785 790 795 800

Ser Met Gly Cys Val Ser Gly Cys Leu Cys Pro Pro Gly Met Val Arg

805 810 815

His Glu Asn Arg Cys Val Ala Leu Glu Arg Cys Pro Cys Phe His Gln

820 825 830

Gly Lys Glu Tyr Ala Pro Gly Glu Thr Val Lys Ile Gly Cys Asn Thr

835 840 845

Cys Val Cys Gln Asp Arg Lys Trp Asn Cys Thr Asp His Val Cys Asp

850 855 860

Ala Thr Cys Ser Thr Ile Gly Met Ala His Tyr Leu Thr Phe Asp Gly

865 870 875 880

Leu Lys Tyr Leu Phe Pro Gly Glu Cys Gln Tyr Val Leu Val Gln Asp

885 890 895

Tyr Cys Gly Ser Asn Pro Gly Thr Phe Arg Ile Leu Val Gly Asn Lys

900 905 910

Gly Cys Ser His Pro Ser Val Lys Cys Lys Lys Arg Val Thr Ile Leu

915 920 925

Val Glu Gly Gly Glu Ile Glu Leu Phe Asp Gly Glu Val Asn Val Lys

930 935 940

Arg Pro Met Lys Asp Glu Thr His Phe Glu Val Val Glu Ser Gly Arg

945 950 955 960

Tyr Ile Ile Leu Leu Leu Gly Lys Ala Leu Ser Val Val Trp Asp Arg

965 970 975

His Leu Ser Ile Ser Val Val Leu Lys Gln Thr Tyr Gln Glu Lys Val

980 985 990

Cys Gly Leu Cys Gly Asn Phe Asp Gly Ile Gln Asn Asn Asp Leu Thr

995 1000 1005

Ser Ser Asn Leu Gln Val Glu Glu Asp Pro Val Asp Phe Gly Asn

1010 1015 1020

Ser Trp Lys Val Ser Ser Gln Cys Ala Asp Thr Arg Lys Val Pro

1025 1030 1035

Leu Asp Ser Ser Pro Ala Thr Cys His Asn Asn Ile Met Lys Gln

1040 1045 1050

Thr Met Val Asp Ser Ser Cys Arg Ile Leu Thr Ser Asp Val Phe

1055 1060 1065

Gln Asp Cys Asn Lys Leu Val Asp Pro Glu Pro Tyr Leu Asp Val

1070 1075 1080

Cys Ile Tyr Asp Thr Cys Ser Cys Glu Ser Ile Gly Asp Cys Ala

1085 1090 1095

Cys Phe Cys Asp Thr Ile Ala Ala Tyr Ala His Val Cys Ala Gln

1100 1105 1110

His Gly Lys Val Val Thr Trp Arg Thr Ala Thr Leu Cys Pro Gln

1115 1120 1125

Ser Cys Glu Glu Arg Asn Leu Arg Glu Asn Gly Tyr Glu Cys Glu

1130 1135 1140

Trp Arg Tyr Asn Ser Cys Ala Pro Ala Cys Gln Val Thr Cys Gln

1145 1150 1155

His Pro Glu Pro Leu Ala Cys Pro Val Gln Cys Val Glu Gly Cys

1160 1165 1170

His Ala His Cys Pro Pro Gly Lys Ile Leu Asp Glu Leu Leu Gln

1175 1180 1185

Thr Cys Val Asp Pro Glu Asp Cys Pro Val Cys Glu Val Ala Gly

1190 1195 1200

Arg Arg Phe Ala Ser Gly Lys Lys Val Thr Leu Asn Pro Ser Asp

1205 1210 1215

Pro Glu His Cys Gln Ile Cys His Cys Asp Val Val Asn Leu Thr

1220 1225 1230

Cys Glu Ala Cys Gln Glu Pro Gly Gly Leu Val Val Pro Pro Thr

1235 1240 1245

Asp Ala Pro Val Ser Pro Thr Thr Leu Tyr Val Glu Asp Ile Ser

1250 1255 1260

Glu Pro Pro Leu His Gln Glu Pro Gly Gly Leu Val Val Pro Pro

1265 1270 1275

Thr Asp Ala Pro Val Ser Pro Thr Thr Leu Tyr Val Glu Asp Ile

1280 1285 1290

Ser Glu Pro Pro Leu His Gln Glu Pro Gly Gly Leu Val Val Pro

1295 1300 1305

Pro Thr Asp Ala Pro Val Ser Pro Thr Thr Leu Tyr Val Glu Asp

1310 1315 1320

Ile Ser Glu Pro Pro Leu His Gln Glu Pro Gly Gly Leu Val Val

1325 1330 1335

Pro Pro Thr Asp Ala Pro Val Ser Pro Thr Thr Leu Tyr Val Glu

1340 1345 1350

Asp Ile Ser Glu Pro Pro Leu His Gln Glu Pro Gly Gly Leu Val

1355 1360 1365

Val Pro Pro Thr Asp Ala Pro Val Ser Pro Thr Thr Leu Tyr Val

1370 1375 1380

Glu Asp Ile Ser Glu Pro Pro Leu His

1385 1390

<210> 9

<211> 660

<212> БЕЛОК

<213> Homo sapiens

<400> 9

Ser Leu Ser Cys Arg Pro Pro Met Val Lys Leu Val Cys Pro Ala Asp

1 5 10 15

Asn Leu Arg Ala Glu Gly Leu Glu Cys Thr Lys Thr Cys Gln Asn Tyr

20 25 30

Asp Leu Glu Cys Met Ser Met Gly Cys Val Ser Gly Cys Leu Cys Pro

35 40 45

Pro Gly Met Val Arg His Glu Asn Arg Cys Val Ala Leu Glu Arg Cys

50 55 60

Pro Cys Phe His Gln Gly Lys Glu Tyr Ala Pro Gly Glu Thr Val Lys

65 70 75 80

Ile Gly Cys Asn Thr Cys Val Cys Gln Asp Arg Lys Trp Asn Cys Thr

85 90 95

Asp His Val Cys Asp Ala Thr Cys Ser Thr Ile Gly Met Ala His Tyr

100 105 110

Leu Thr Phe Asp Gly Leu Lys Tyr Leu Phe Pro Gly Glu Cys Gln Tyr

115 120 125

Val Leu Val Gln Asp Tyr Cys Gly Ser Asn Pro Gly Thr Phe Arg Ile

130 135 140

Leu Val Gly Asn Lys Gly Cys Ser His Pro Ser Val Lys Cys Lys Lys

145 150 155 160

Arg Val Thr Ile Leu Val Glu Gly Gly Glu Ile Glu Leu Phe Asp Gly

165 170 175

Glu Val Asn Val Lys Arg Pro Met Lys Asp Glu Thr His Phe Glu Val

180 185 190

Val Glu Ser Gly Arg Tyr Ile Ile Leu Leu Leu Gly Lys Ala Leu Ser

195 200 205

Val Val Trp Asp Arg His Leu Ser Ile Ser Val Val Leu Lys Gln Thr

210 215 220

Tyr Gln Glu Lys Val Cys Gly Leu Cys Gly Asn Phe Asp Gly Ile Gln

225 230 235 240

Asn Asn Asp Leu Thr Ser Ser Asn Leu Gln Val Glu Glu Asp Pro Val

245 250 255

Asp Phe Gly Asn Ser Trp Lys Val Ser Ser Gln Cys Ala Asp Thr Arg

260 265 270

Lys Val Pro Leu Asp Ser Ser Pro Ala Thr Cys His Asn Asn Ile Met

275 280 285

Lys Gln Thr Met Val Asp Ser Ser Cys Arg Ile Leu Thr Ser Asp Val

290 295 300

Phe Gln Asp Cys Asn Lys Leu Val Asp Pro Glu Pro Tyr Leu Asp Val

305 310 315 320

Cys Ile Tyr Asp Thr Cys Ser Cys Glu Ser Ile Gly Asp Cys Ala Cys

325 330 335

Phe Cys Asp Thr Ile Ala Ala Tyr Ala His Val Cys Ala Gln His Gly

340 345 350

Lys Val Val Thr Trp Arg Thr Ala Thr Leu Cys Pro Gln Ser Cys Glu

355 360 365

Glu Arg Asn Leu Arg Glu Asn Gly Tyr Glu Cys Glu Trp Arg Tyr Asn

370 375 380

Ser Cys Ala Pro Ala Cys Gln Val Thr Cys Gln His Pro Glu Pro Leu

385 390 395 400

Ala Cys Pro Val Gln Cys Val Glu Gly Cys His Ala His Cys Pro Pro

405 410 415

Gly Lys Ile Leu Asp Glu Leu Leu Gln Thr Cys Val Asp Pro Glu Asp

420 425 430

Cys Pro Val Cys Glu Val Ala Gly Arg Arg Phe Ala Ser Gly Lys Lys

435 440 445

Val Thr Leu Asn Pro Ser Asp Pro Glu His Cys Gln Ile Cys His Cys

450 455 460

Asp Val Val Asn Leu Thr Cys Glu Ala Cys Gln Glu Pro Gly Gly Leu

465 470 475 480

Val Val Pro Pro Thr Asp Ala Pro Val Ser Pro Thr Thr Leu Tyr Val

485 490 495

Glu Asp Ile Ser Glu Pro Pro Leu His Gln Glu Pro Gly Gly Leu Val

500 505 510

Val Pro Pro Thr Asp Ala Pro Val Ser Pro Thr Thr Leu Tyr Val Glu

515 520 525

Asp Ile Ser Glu Pro Pro Leu His Gln Glu Pro Gly Gly Leu Val Val

530 535 540

Pro Pro Thr Asp Ala Pro Val Pro Thr Thr Leu Tyr Val Glu Asp Ile

545 550 555 560

Ser Glu Pro Pro Leu His Glu Glu Pro Glu Cys Asn Asp Ile Thr Ala

565 570 575

Arg Leu Gln Tyr Val Lys Val Gly Ser Cys Lys Ser Glu Val Glu Val

580 585 590

Asp Ile His Tyr Cys Gln Gly Lys Cys Ala Ser Lys Ala Met Tyr Ser

595 600 605

Ile Asp Ile Asn Asp Val Gln Asp Gln Cys Ser Cys Cys Ser Pro Thr

610 615 620

Arg Thr Glu Pro Met Gln Val Ala Leu His Cys Thr Asn Gly Ser Val

625 630 635 640

Val Tyr His Glu Val Leu Asn Ala Met Glu Cys Lys Cys Ser Pro Arg

645 650 655

Lys Cys Ser Lys

660

<210> 10

<211> 682

<212> БЕЛОК

<213> Homo sapiens

<400> 10

Met Ile Pro Ala Arg Phe Ala Gly Val Leu Leu Ala Leu Ala Leu Ile

1 5 10 15

Leu Pro Gly Thr Leu Cys Ser Leu Ser Cys Arg Pro Pro Met Val Lys

20 25 30

Leu Val Cys Pro Ala Asp Asn Leu Arg Ala Glu Gly Leu Glu Cys Thr

35 40 45

Lys Thr Cys Gln Asn Tyr Asp Leu Glu Cys Met Ser Met Gly Cys Val

50 55 60

Ser Gly Cys Leu Cys Pro Pro Gly Met Val Arg His Glu Asn Arg Cys

65 70 75 80

Val Ala Leu Glu Arg Cys Pro Cys Phe His Gln Gly Lys Glu Tyr Ala

85 90 95

Pro Gly Glu Thr Val Lys Ile Gly Cys Asn Thr Cys Val Cys Gln Asp

100 105 110

Arg Lys Trp Asn Cys Thr Asp His Val Cys Asp Ala Thr Cys Ser Thr

115 120 125

Ile Gly Met Ala His Tyr Leu Thr Phe Asp Gly Leu Lys Tyr Leu Phe

130 135 140

Pro Gly Glu Cys Gln Tyr Val Leu Val Gln Asp Tyr Cys Gly Ser Asn

145 150 155 160

Pro Gly Thr Phe Arg Ile Leu Val Gly Asn Lys Gly Cys Ser His Pro

165 170 175

Ser Val Lys Cys Lys Lys Arg Val Thr Ile Leu Val Glu Gly Gly Glu

180 185 190

Ile Glu Leu Phe Asp Gly Glu Val Asn Val Lys Arg Pro Met Lys Asp

195 200 205

Glu Thr His Phe Glu Val Val Glu Ser Gly Arg Tyr Ile Ile Leu Leu

210 215 220

Leu Gly Lys Ala Leu Ser Val Val Trp Asp Arg His Leu Ser Ile Ser

225 230 235 240

Val Val Leu Lys Gln Thr Tyr Gln Glu Lys Val Cys Gly Leu Cys Gly

245 250 255

Asn Phe Asp Gly Ile Gln Asn Asn Asp Leu Thr Ser Ser Asn Leu Gln

260 265 270

Val Glu Glu Asp Pro Val Asp Phe Gly Asn Ser Trp Lys Val Ser Ser

275 280 285

Gln Cys Ala Asp Thr Arg Lys Val Pro Leu Asp Ser Ser Pro Ala Thr

290 295 300

Cys His Asn Asn Ile Met Lys Gln Thr Met Val Asp Ser Ser Cys Arg

305 310 315 320

Ile Leu Thr Ser Asp Val Phe Gln Asp Cys Asn Lys Leu Val Asp Pro

325 330 335

Glu Pro Tyr Leu Asp Val Cys Ile Tyr Asp Thr Cys Ser Cys Glu Ser

340 345 350

Ile Gly Asp Cys Ala Cys Phe Cys Asp Thr Ile Ala Ala Tyr Ala His

355 360 365

Val Cys Ala Gln His Gly Lys Val Val Thr Trp Arg Thr Ala Thr Leu

370 375 380

Cys Pro Gln Ser Cys Glu Glu Arg Asn Leu Arg Glu Asn Gly Tyr Glu

385 390 395 400

Cys Glu Trp Arg Tyr Asn Ser Cys Ala Pro Ala Cys Gln Val Thr Cys

405 410 415

Gln His Pro Glu Pro Leu Ala Cys Pro Val Gln Cys Val Glu Gly Cys

420 425 430

His Ala His Cys Pro Pro Gly Lys Ile Leu Asp Glu Leu Leu Gln Thr

435 440 445

Cys Val Asp Pro Glu Asp Cys Pro Val Cys Glu Val Ala Gly Arg Arg

450 455 460

Phe Ala Ser Gly Lys Lys Val Thr Leu Asn Pro Ser Asp Pro Glu His

465 470 475 480

Cys Gln Ile Cys His Cys Asp Val Val Asn Leu Thr Cys Glu Ala Cys

485 490 495

Gln Glu Pro Gly Gly Leu Val Val Pro Pro Thr Asp Ala Pro Val Ser

500 505 510

Pro Thr Thr Leu Tyr Val Glu Asp Ile Ser Glu Pro Pro Leu His Gln

515 520 525

Glu Pro Gly Gly Leu Val Val Pro Pro Thr Asp Ala Pro Val Ser Pro

530 535 540

Thr Thr Leu Tyr Val Glu Asp Ile Ser Glu Pro Pro Leu His Gln Glu

545 550 555 560

Pro Gly Gly Leu Val Val Pro Pro Thr Asp Ala Pro Val Pro Thr Thr

565 570 575

Leu Tyr Val Glu Asp Ile Ser Glu Pro Pro Leu His Glu Glu Pro Glu

580 585 590

Cys Asn Asp Ile Thr Ala Arg Leu Gln Tyr Val Lys Val Gly Ser Cys

595 600 605

Lys Ser Glu Val Glu Val Asp Ile His Tyr Cys Gln Gly Lys Cys Ala

610 615 620

Ser Lys Ala Met Tyr Ser Ile Asp Ile Asn Asp Val Gln Asp Gln Cys

625 630 635 640

Ser Cys Cys Ser Pro Thr Arg Thr Glu Pro Met Gln Val Ala Leu His

645 650 655

Cys Thr Asn Gly Ser Val Val Tyr His Glu Val Leu Asn Ala Met Glu

660 665 670

Cys Lys Cys Ser Pro Arg Lys Cys Ser Lys

675 680

<210> 11

<211> 1423

<212> БЕЛОК

<213> Homo sapiens

<400> 11

Met Ile Pro Ala Arg Phe Ala Gly Val Leu Leu Ala Leu Ala Leu Ile

1 5 10 15

Leu Pro Gly Thr Leu Cys Ala Glu Gly Thr Arg Gly Arg Ser Ser Thr

20 25 30

Ala Arg Cys Ser Leu Phe Gly Ser Asp Phe Val Asn Thr Phe Asp Gly

35 40 45

Ser Met Tyr Ser Phe Ala Gly Tyr Cys Ser Tyr Leu Leu Ala Gly Gly

50 55 60

Cys Gln Lys Arg Ser Phe Ser Ile Ile Gly Asp Phe Gln Asn Gly Lys

65 70 75 80

Arg Val Ser Leu Ser Val Tyr Leu Gly Glu Phe Phe Asp Ile His Leu

85 90 95

Phe Val Asn Gly Thr Val Thr Gln Gly Asp Gln Arg Val Ser Met Pro

100 105 110

Tyr Ala Ser Lys Gly Leu Tyr Leu Glu Thr Glu Ala Gly Tyr Tyr Lys

115 120 125

Leu Ser Gly Glu Ala Tyr Gly Phe Val Ala Arg Ile Asp Gly Ser Gly

130 135 140

Asn Phe Gln Val Leu Leu Ser Asp Arg Tyr Phe Asn Lys Thr Cys Gly

145 150 155 160

Leu Cys Gly Asn Phe Asn Ile Phe Ala Glu Asp Asp Phe Met Thr Gln

165 170 175

Glu Gly Thr Leu Thr Ser Asp Pro Tyr Asp Phe Ala Asn Ser Trp Ala

180 185 190

Leu Ser Ser Gly Glu Gln Trp Cys Glu Arg Ala Ser Pro Pro Ser Ser

195 200 205

Ser Cys Asn Ile Ser Ser Gly Glu Met Gln Lys Gly Leu Trp Glu Gln

210 215 220

Cys Gln Leu Leu Lys Ser Thr Ser Val Phe Ala Arg Cys His Pro Leu

225 230 235 240

Val Asp Pro Glu Pro Phe Val Ala Leu Cys Glu Lys Thr Leu Cys Glu

245 250 255

Cys Ala Gly Gly Leu Glu Cys Ala Cys Pro Ala Leu Leu Glu Tyr Ala

260 265 270

Arg Thr Cys Ala Gln Glu Gly Met Val Leu Tyr Gly Trp Thr Asp His

275 280 285

Ser Ala Cys Ser Pro Val Cys Pro Ala Gly Met Glu Tyr Arg Gln Cys

290 295 300

Val Ser Pro Cys Ala Arg Thr Cys Gln Ser Leu His Ile Asn Glu Met

305 310 315 320

Cys Gln Glu Arg Cys Val Asp Gly Cys Ser Cys Pro Glu Gly Gln Leu

325 330 335

Leu Asp Glu Gly Leu Cys Val Glu Ser Thr Glu Cys Pro Cys Val His

340 345 350

Ser Gly Lys Arg Tyr Pro Pro Gly Thr Ser Leu Ser Arg Asp Cys Asn

355 360 365

Thr Cys Ile Cys Arg Asn Ser Gln Trp Ile Cys Ser Asn Glu Glu Cys

370 375 380

Pro Gly Glu Cys Leu Val Thr Gly Gln Ser His Phe Lys Ser Phe Asp

385 390 395 400

Asn Arg Tyr Phe Thr Phe Ser Gly Ile Cys Gln Tyr Leu Leu Ala Arg

405 410 415

Asp Cys Gln Asp His Ser Phe Ser Ile Val Ile Glu Thr Val Gln Cys

420 425 430

Ala Asp Asp Arg Asp Ala Val Cys Thr Arg Ser Val Thr Val Arg Leu

435 440 445

Pro Gly Leu His Asn Ser Leu Val Lys Leu Lys His Gly Ala Gly Val

450 455 460

Ala Met Asp Gly Gln Asp Val Gln Leu Pro Leu Leu Lys Gly Asp Leu

465 470 475 480

Arg Ile Gln His Thr Val Thr Ala Ser Val Arg Leu Ser Tyr Gly Glu

485 490 495

Asp Leu Gln Met Asp Trp Asp Gly Arg Gly Arg Leu Leu Val Lys Leu

500 505 510

Ser Pro Val Tyr Ala Gly Lys Thr Cys Gly Leu Cys Gly Asn Tyr Asn

515 520 525

Gly Asn Gln Gly Asp Asp Phe Leu Thr Pro Ser Gly Leu Ala Glu Pro

530 535 540

Arg Val Glu Asp Phe Gly Asn Ala Trp Lys Leu His Gly Asp Cys Gln

545 550 555 560

Asp Leu Gln Lys Gln His Ser Asp Pro Cys Ala Leu Asn Pro Arg Met

565 570 575

Thr Arg Phe Ser Glu Glu Ala Cys Ala Val Leu Thr Ser Pro Thr Phe

580 585 590

Glu Ala Cys His Arg Ala Val Ser Pro Leu Pro Tyr Leu Arg Asn Cys

595 600 605

Arg Tyr Asp Val Cys Ser Cys Ser Asp Gly Arg Glu Cys Leu Cys Gly

610 615 620

Ala Leu Ala Ser Tyr Ala Ala Ala Cys Ala Gly Arg Gly Val Arg Val

625 630 635 640

Ala Trp Arg Glu Pro Gly Arg Cys Glu Leu Asn Cys Pro Lys Gly Gln

645 650 655

Val Tyr Leu Gln Cys Gly Thr Pro Cys Asn Leu Thr Cys Arg Ser Leu

660 665 670

Ser Tyr Pro Asp Glu Glu Cys Asn Glu Ala Cys Leu Glu Gly Cys Phe

675 680 685

Cys Pro Pro Gly Leu Tyr Met Asp Glu Arg Gly Asp Cys Val Pro Lys

690 695 700

Ala Gln Cys Pro Cys Tyr Tyr Asp Gly Glu Ile Phe Gln Pro Glu Asp

705 710 715 720

Ile Phe Ser Asp His His Thr Met Cys Tyr Cys Glu Asp Gly Phe Met

725 730 735

His Cys Thr Met Ser Gly Val Pro Gly Ser Leu Leu Pro Asp Ala Val

740 745 750

Leu Ser Ser Pro Leu Ser His Arg Ser Lys Arg Ser Leu Ser Cys Arg

755 760 765

Pro Pro Met Val Lys Leu Val Cys Pro Ala Asp Asn Leu Arg Ala Glu

770 775 780

Gly Leu Glu Cys Thr Lys Thr Cys Gln Asn Tyr Asp Leu Glu Cys Met

785 790 795 800

Ser Met Gly Cys Val Ser Gly Cys Leu Cys Pro Pro Gly Met Val Arg

805 810 815

His Glu Asn Arg Cys Val Ala Leu Glu Arg Cys Pro Cys Phe His Gln

820 825 830

Gly Lys Glu Tyr Ala Pro Gly Glu Thr Val Lys Ile Gly Cys Asn Thr

835 840 845

Cys Val Cys Gln Asp Arg Lys Trp Asn Cys Thr Asp His Val Cys Asp

850 855 860

Ala Thr Cys Ser Thr Ile Gly Met Ala His Tyr Leu Thr Phe Asp Gly

865 870 875 880

Leu Lys Tyr Leu Phe Pro Gly Glu Cys Gln Tyr Val Leu Val Gln Asp

885 890 895

Tyr Cys Gly Ser Asn Pro Gly Thr Phe Arg Ile Leu Val Gly Asn Lys

900 905 910

Gly Cys Ser His Pro Ser Val Lys Cys Lys Lys Arg Val Thr Ile Leu

915 920 925

Val Glu Gly Gly Glu Ile Glu Leu Phe Asp Gly Glu Val Asn Val Lys

930 935 940

Arg Pro Met Lys Asp Glu Thr His Phe Glu Val Val Glu Ser Gly Arg

945 950 955 960

Tyr Ile Ile Leu Leu Leu Gly Lys Ala Leu Ser Val Val Trp Asp Arg

965 970 975

His Leu Ser Ile Ser Val Val Leu Lys Gln Thr Tyr Gln Glu Lys Val

980 985 990

Cys Gly Leu Cys Gly Asn Phe Asp Gly Ile Gln Asn Asn Asp Leu Thr

995 1000 1005

Ser Ser Asn Leu Gln Val Glu Glu Asp Pro Val Asp Phe Gly Asn

1010 1015 1020

Ser Trp Lys Val Ser Ser Gln Cys Ala Asp Thr Arg Lys Val Pro

1025 1030 1035

Leu Asp Ser Ser Pro Ala Thr Cys His Asn Asn Ile Met Lys Gln

1040 1045 1050

Thr Met Val Asp Ser Ser Cys Arg Ile Leu Thr Ser Asp Val Phe

1055 1060 1065

Gln Asp Cys Asn Lys Leu Val Asp Pro Glu Pro Tyr Leu Asp Val

1070 1075 1080

Cys Ile Tyr Asp Thr Cys Ser Cys Glu Ser Ile Gly Asp Cys Ala

1085 1090 1095

Cys Phe Cys Asp Thr Ile Ala Ala Tyr Ala His Val Cys Ala Gln

1100 1105 1110

His Gly Lys Val Val Thr Trp Arg Thr Ala Thr Leu Cys Pro Gln

1115 1120 1125

Ser Cys Glu Glu Arg Asn Leu Arg Glu Asn Gly Tyr Glu Cys Glu

1130 1135 1140

Trp Arg Tyr Asn Ser Cys Ala Pro Ala Cys Gln Val Thr Cys Gln

1145 1150 1155

His Pro Glu Pro Leu Ala Cys Pro Val Gln Cys Val Glu Gly Cys

1160 1165 1170

His Ala His Cys Pro Pro Gly Lys Ile Leu Asp Glu Leu Leu Gln

1175 1180 1185

Thr Cys Val Asp Pro Glu Asp Cys Pro Val Cys Glu Val Ala Gly

1190 1195 1200

Arg Arg Phe Ala Ser Gly Lys Lys Val Thr Leu Asn Pro Ser Asp

1205 1210 1215

Pro Glu His Cys Gln Ile Cys His Cys Asp Val Val Asn Leu Thr

1220 1225 1230

Cys Glu Ala Cys Gln Glu Pro Gly Gly Leu Val Val Pro Pro Thr

1235 1240 1245

Asp Ala Pro Val Ser Pro Thr Thr Leu Tyr Val Glu Asp Ile Ser

1250 1255 1260

Glu Pro Pro Leu His Gln Glu Pro Gly Gly Leu Val Val Pro Pro

1265 1270 1275

Thr Asp Ala Pro Val Ser Pro Thr Thr Leu Tyr Val Glu Asp Ile

1280 1285 1290

Ser Glu Pro Pro Leu His Gln Glu Pro Gly Gly Leu Val Val Pro

1295 1300 1305

Pro Thr Asp Ala Pro Val Pro Thr Thr Leu Tyr Val Glu Asp Ile

1310 1315 1320

Ser Glu Pro Pro Leu His Glu Glu Pro Glu Cys Asn Asp Ile Thr

1325 1330 1335

Ala Arg Leu Gln Tyr Val Lys Val Gly Ser Cys Lys Ser Glu Val

1340 1345 1350

Glu Val Asp Ile His Tyr Cys Gln Gly Lys Cys Ala Ser Lys Ala

1355 1360 1365

Met Tyr Ser Ile Asp Ile Asn Asp Val Gln Asp Gln Cys Ser Cys

1370 1375 1380

Cys Ser Pro Thr Arg Thr Glu Pro Met Gln Val Ala Leu His Cys

1385 1390 1395

Thr Asn Gly Ser Val Val Tyr His Glu Val Leu Asn Ala Met Glu

1400 1405 1410

Cys Lys Cys Ser Pro Arg Lys Cys Ser Lys

1415 1420

<210> 12

<211> 16

<212> БЕЛОК

<213> Homo sapiens

<400> 12

Ser Phe Ser Gln Asn Ser Arg His Gln Ala Tyr Arg Tyr Arg Arg Gly

1 5 10 15

<210> 13

<211> 1440

<212> БЕЛОК

<213> Homo sapiens

<400> 13

Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr

1 5 10 15

Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro

20 25 30

Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys

35 40 45

Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro

50 55 60

Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val

65 70 75 80

Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val

85 90 95

Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala

100 105 110

Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val

115 120 125

Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn

130 135 140

Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser

145 150 155 160

His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu

165 170 175

Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu

180 185 190

His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp

195 200 205

His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser

210 215 220

Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg

225 230 235 240

Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His

245 250 255

Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu

260 265 270

Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile

275 280 285

Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly

290 295 300

Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met

305 310 315 320

Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg

325 330 335

Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp

340 345 350

Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe

355 360 365

Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His

370 375 380

Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu

385 390 395 400

Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro

405 410 415

Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr

420 425 430

Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile

435 440 445

Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile

450 455 460

Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile

465 470 475 480

Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys

485 490 495

His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys

500 505 510

Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys

515 520 525

Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala

530 535 540

Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp

545 550 555 560

Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe

565 570 575

Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln

580 585 590

Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe

595 600 605

Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser

610 615 620

Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu

625 630 635 640

Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr

645 650 655

Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro

660 665 670

Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp

675 680 685

Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala

690 695 700

Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu

705 710 715 720

Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala

725 730 735

Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Gln Ala Tyr Arg

740 745 750

Tyr Arg Arg Gly Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln Glu

755 760 765

Glu Ile Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp

770 775 780

Phe Asp Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln

785 790 795 800

Lys Lys Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp

805 810 815

Tyr Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser

820 825 830

Gly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp

835 840 845

Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu

850 855 860

Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met

865 870 875 880

Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser

885 890 895

Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys

900 905 910

Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln

915 920 925

His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala

930 935 940

Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile

945 950 955 960

Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His Gly

965 970 975

Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp

980 985 990

Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg

995 1000 1005

Ala Pro Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn

1010 1015 1020

Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro

1025 1030 1035

Gly Leu Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu

1040 1045 1050

Ser Met Gly Ser Asn Glu Asn Ile His Ser Ile His Phe Ser Gly

1055 1060 1065

His Val Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu

1070 1075 1080

Tyr Asn Leu Tyr Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro

1085 1090 1095

Ser Lys Ala Gly Ile Trp Arg Val Glu Cys Leu Ile Gly Glu His

1100 1105 1110

Leu His Ala Gly Met Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys

1115 1120 1125

Cys Gln Thr Pro Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe

1130 1135 1140

Gln Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu

1145 1150 1155

Ala Arg Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys

1160 1165 1170

Glu Pro Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile

1175 1180 1185

Ile His Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser

1190 1195 1200

Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys

1205 1210 1215

Lys Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val

1220 1225 1230

Phe Phe Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe

1235 1240 1245

Asn Pro Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His

1250 1255 1260

Tyr Ser Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp

1265 1270 1275

Leu Asn Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile

1280 1285 1290

Ser Asp Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe

1295 1300 1305

Ala Thr Trp Ser Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg

1310 1315 1320

Ser Asn Ala Trp Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu

1325 1330 1335

Gln Val Asp Phe Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr

1340 1345 1350

Gln Gly Val Lys Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe

1355 1360 1365

Leu Ile Ser Ser Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe

1370 1375 1380

Gln Asn Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe

1385 1390 1395

Thr Pro Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr

1400 1405 1410

Leu Arg Ile His Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg

1415 1420 1425

Met Glu Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr

1430 1435 1440

<210> 14

<211> 1530

<212> БЕЛОК

<213> Homo sapiens

<400> 14

Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr

1 5 10 15

Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro

20 25 30

Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys

35 40 45

Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro

50 55 60

Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val

65 70 75 80

Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val

85 90 95

Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala

100 105 110

Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val

115 120 125

Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn

130 135 140

Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser

145 150 155 160

His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu

165 170 175

Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu

180 185 190

His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp

195 200 205

His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser

210 215 220

Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg

225 230 235 240

Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His

245 250 255

Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu

260 265 270

Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile

275 280 285

Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly

290 295 300

Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met

305 310 315 320

Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg

325 330 335

Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp

340 345 350

Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe

355 360 365

Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His

370 375 380

Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu

385 390 395 400

Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro

405 410 415

Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr

420 425 430

Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile

435 440 445

Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile

450 455 460

Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile

465 470 475 480

Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys

485 490 495

His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys

500 505 510

Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys

515 520 525

Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala

530 535 540

Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp

545 550 555 560

Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe

565 570 575

Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln

580 585 590

Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe

595 600 605

Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser

610 615 620

Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu

625 630 635 640

Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr

645 650 655

Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro

660 665 670

Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp

675 680 685

Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala

690 695 700

Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu

705 710 715 720

Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala

725 730 735

Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Gln Glu Pro Gly

740 745 750

Gly Leu Val Val Pro Pro Thr Asp Ala Pro Val Ser Pro Thr Thr Leu

755 760 765

Tyr Val Glu Asp Ile Ser Glu Pro Pro Leu His Gln Glu Pro Gly Gly

770 775 780

Leu Val Val Pro Pro Thr Asp Ala Pro Val Ser Pro Thr Thr Leu Tyr

785 790 795 800

Val Glu Asp Ile Ser Glu Pro Pro Leu His Gln Glu Pro Gly Gly Leu

805 810 815

Val Val Pro Pro Thr Asp Ala Pro Val Ser Pro Thr Thr Leu Tyr Val

820 825 830

Glu Asp Ile Ser Glu Pro Pro Leu His Arg Tyr Arg Arg Gly Glu Ile

835 840 845

Thr Arg Thr Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr Asp Asp

850 855 860

Thr Ile Ser Val Glu Met Lys Lys Glu Asp Phe Asp Ile Tyr Asp Glu

865 870 875 880

Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys Thr Arg His Tyr

885 890 895

Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly Met Ser Ser Ser

900 905 910

Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser Val Pro Gln Phe

915 920 925

Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser Phe Thr Gln Pro

930 935 940

Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu Leu Gly Pro Tyr

945 950 955 960

Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr Phe Arg Asn Gln

965 970 975

Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile Ser Tyr Glu Glu

980 985 990

Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn Phe Val Lys Pro Asn

995 1000 1005

Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln His His Met Ala Pro

1010 1015 1020

Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr Phe Ser Asp

1025 1030 1035

Val Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile Gly Pro Leu

1040 1045 1050

Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His Gly Arg Gln

1055 1060 1065

Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu

1070 1075 1080

Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg

1085 1090 1095

Ala Pro Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn

1100 1105 1110

Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro

1115 1120 1125

Gly Leu Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu

1130 1135 1140

Ser Met Gly Ser Asn Glu Asn Ile His Ser Ile His Phe Ser Gly

1145 1150 1155

His Val Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu

1160 1165 1170

Tyr Asn Leu Tyr Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro

1175 1180 1185

Ser Lys Ala Gly Ile Trp Arg Val Glu Cys Leu Ile Gly Glu His

1190 1195 1200

Leu His Ala Gly Met Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys

1205 1210 1215

Cys Gln Thr Pro Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe

1220 1225 1230

Gln Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu

1235 1240 1245

Ala Arg Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys

1250 1255 1260

Glu Pro Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile

1265 1270 1275

Ile His Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser

1280 1285 1290

Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys

1295 1300 1305

Lys Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val

1310 1315 1320

Phe Phe Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe

1325 1330 1335

Asn Pro Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His

1340 1345 1350

Tyr Ser Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp

1355 1360 1365

Leu Asn Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile

1370 1375 1380

Ser Asp Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe

1385 1390 1395

Ala Thr Trp Ser Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg

1400 1405 1410

Ser Asn Ala Trp Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu

1415 1420 1425

Gln Val Asp Phe Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr

1430 1435 1440

Gln Gly Val Lys Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe

1445 1450 1455

Leu Ile Ser Ser Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe

1460 1465 1470

Gln Asn Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe

1475 1480 1485

Thr Pro Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr

1490 1495 1500

Leu Arg Ile His Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg

1505 1510 1515

Met Glu Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr

1520 1525 1530

<210> 15

<211> 3807

<212> ДНК

<213> Homo sapiens

<400> 15

atgatccccg ccagatttgc cggcgtgctg ctggccctgg ctctgatcct gcctggaaca 60

ctgtgtgccg agggcaccag aggcagatcc agcaccgcca gatgcagcct gttcggcagc 120

gacttcgtga acaccttcga cggcagcatg tacagcttcg ccggctactg ctcctacctg 180

ctggctggcg gctgccagaa gcggagcttt agcatcatcg gcgacttcca gaacggcaag 240

cgggtgtccc tgagcgtgta cctgggcgag ttcttcgaca tccacctgtt cgtgaacggc 300

accgtgaccc agggcgatca gagggtgtcc atgccctacg ccagcaaggg cctgtacctg 360

gaaacagagg ccggctatta caagctgagc ggcgaggcct acggcttcgt ggccagaatc 420

gatggcagcg gcaacttcca ggtgctgctg agcgaccggt acttcaacaa gacctgcggc 480

ctgtgcggca atttcaacat cttcgccgag gacgacttca tgacccagga aggcaccctg 540

accagcgacc cctacgactt cgccaatagc tgggccctgt ctagcggcga gcagtggtgc 600

gaaagagcca gccctcctag cagcagctgc aacatcagca gcggcgagat gcagaaaggc 660

ctgtgggagc agtgccagct gctgaagtcc accagcgtgt tcgccaggtg ccaccctctg 720

gtggaccctg agccttttgt ggccctgtgc gagaaaacac tgtgcgagtg tgccggcgga 780

ctggaatgtg cctgtcctgc cctgctggaa tacgccagaa cctgcgctca ggaagggatg 840

gtgctgtacg gctggaccga ccactctgcc tgtagccctg tgtgtcctgc cggcatggaa 900

tatcggcagt gcgtgtcccc ctgcgccagg acctgtcaga gcctgcacat caacgagatg 960

tgccaggaac gctgcgtgga cggctgtagc tgtcctgagg gacagctgct ggatgagggc 1020

ctgtgtgtgg aaagcaccga gtgcccttgt gtgcacagcg gcaagagata cccccctggc 1080

accagcctga gccgggactg caatacctgc atctgccgga acagccagtg gatctgctcc 1140

aacgaggaat gccctggcga gtgcctcgtg acaggccaga gccacttcaa gagcttcgac 1200

aacagatact tcaccttcag cggcatctgc cagtatctgc tggccagaga ctgccaggac 1260

cacagcttca gcatcgtgat cgagacagtg cagtgcgccg acgacagaga tgccgtgtgc 1320

accagatccg tgaccgtgcg gctgcctggc ctgcacaaca gcctcgtgaa gctgaaacac 1380

ggcgctgggg tggccatgga cggacaggac gtgcagctgc ctctgctgaa gggcgacctg 1440

agaatccagc acaccgtgac agcctctgtg cggctgagct acggcgagga cctccagatg 1500

gactgggatg gcaggggcag actgctcgtg aaactgagcc cagtgtatgc cggcaagact 1560

tgtggactgt gtggcaacta caacggcaac cagggcgacg atttcctgac cccttctggc 1620

ctggccgagc cccgggtgga agattttggc aacgcctgga agctgcacgg cgactgtcag 1680

gatctccaga agcagcacag cgacccttgc gccctgaacc cccggatgac cagattcagc 1740

gaagaggcct gtgccgtgct gaccagccct acctttgagg cctgccacag agccgtgtct 1800

ccactgcctt acctgcggaa ttgcagatac gacgtgtgct cctgctccga cggccgcgaa 1860

tgtctgtgtg gcgccctggc ctcttatgcc gccgcttgtg ctggaagagg cgtgcgggtg 1920

gcatggcggg aaccaggcag atgcgagctg aactgcccta agggccaggt gtacctccag 1980

tgcggcaccc cctgcaacct gacctgtaga agcctgagct accccgacga agagtgcaac 2040

gaggcctgtc tggaaggctg cttttgccct cccggcctgt atatggacga gcggggcgat 2100

tgtgtgccca aggcccagtg cccctgctac tacgacggcg agattttcca gcccgaggac 2160

atcttcagcg accaccacac catgtgctac tgcgaggatg gcttcatgca ctgcaccatg 2220

agcggcgtgc caggctccct gctgcctgat gctgtgctgt ctagccccct gagccacaga 2280

agcaagagaa gcctgtcttg cagacccccc atggtcaagc tcgtgtgccc tgccgacaac 2340

ctgagagccg agggcctgga atgcaccaag acatgccaga actacgacct ggaatgcatg 2400

agcatgggct gcgtgtccgg ctgtctgtgc cctcctggca tggtgcgcca cgagaataga 2460

tgcgtggccc tggaacggtg cccgtgcttt catcagggca aagagtacgc cccaggcgaa 2520

accgtgaaga tcggctgcaa cacatgcgtg tgtcaggacc ggaagtggaa ctgcaccgac 2580

cacgtgtgcg acgccacctg tagcacaatc ggcatggccc actacctgac cttcgatggc 2640

ctgaagtacc tgttccccgg cgagtgtcag tacgtgctgg tgcaggatta ctgcggcagc 2700

aaccccggca ccttcagaat cctcgtgggc aacaagggct gtagccaccc ctccgtgaag 2760

tgcaagaaac gcgtgaccat cctggtggaa ggcggagaga tcgagctgtt cgacggcgaa 2820

gtgaacgtga agcggcccat gaaggacgag acacacttcg aggtggtgga aagcggccgg 2880

tacatcatcc tgctgctggg caaagccctg tccgtcgtgt gggacagaca cctgagcatc 2940

agcgtggtgc tgaagcagac ctaccaggaa aaagtgtgcg ggctgtgtgg gaactttgac 3000

ggcatccaga acaacgatct gaccagcagc aatctccagg tggaagagga ccccgtggac 3060

ttcggcaatt cctggaaggt gtccagccag tgtgccgaca ccagaaaggt gcccctggat 3120

agcagccccg ccacatgcca caacaacatc atgaagcaga caatggtgga cagcagctgc 3180

cgcatcctga cctccgatgt gtttcaggac tgcaacaaac tggtggaccc cgaaccctac 3240

ctggacgtgt gcatctacga cacatgcagc tgcgagagca tcggcgattg cgcctgcttc 3300

tgcgacacca ttgccgccta cgcccatgtg tgcgcccagc acggaaaggt cgtgacttgg 3360

agaaccgcca ccctgtgccc acagagctgc gaggaacgga acctgcggga aaacggctac 3420

gagtgcgagt ggcggtacaa cagctgtgcc ccagcctgcc aagtgacctg ccagcaccct 3480

gaacctctgg cttgccccgt gcagtgcgtg gaaggatgtc acgcccattg cccacccggc 3540

aagatcctgg atgagctgct ccagacctgt gtggacccag aggactgccc agtgtgcgaa 3600

gtggccggaa gaagattcgc ctccggcaag aaagtgaccc tgaatccctc cgaccccgag 3660

cactgtcaga tttgtcactg cgacgtcgtg aatctgacat gcgaagcctg ccaggaacct 3720

ggcggactgg tggtgcctcc tacagatgcc cctgtgtccc ccaccaccct gtacgtggaa 3780

gatatcagcg agccccccct gcactaa 3807

<210> 16

<211> 93

<212> ДНК

<213> Homo sapiens

<400> 16

caggaacctg gcggactggt ggtgcctcct acagatgccc ctgtgtcccc caccaccctg 60

tacgtggaag atatcagcga gccccccctg cac 93

<210> 17

<211> 3993

<212> ДНК

<213> Homo sapiens

<400> 17

atgatccccg ccagatttgc cggcgtgctg ctggccctgg ctctgatcct gcctggaaca 60

ctgtgtgccg agggcaccag aggcagatcc agcaccgcca gatgcagcct gttcggcagc 120

gacttcgtga acaccttcga cggcagcatg tacagcttcg ccggctactg ctcctacctg 180

ctggctggcg gctgccagaa gcggagcttt agcatcatcg gcgacttcca gaacggcaag 240

cgggtgtccc tgagcgtgta cctgggcgag ttcttcgaca tccacctgtt cgtgaacggc 300

accgtgaccc agggcgatca gagggtgtcc atgccctacg ccagcaaggg cctgtacctg 360

gaaacagagg ccggctatta caagctgagc ggcgaggcct acggcttcgt ggccagaatc 420

gatggcagcg gcaacttcca ggtgctgctg agcgaccggt acttcaacaa gacctgcggc 480

ctgtgcggca atttcaacat cttcgccgag gacgacttca tgacccagga aggcaccctg 540

accagcgacc cctacgactt cgccaatagc tgggccctgt ctagcggcga gcagtggtgc 600

gaaagagcca gccctcctag cagcagctgc aacatcagca gcggcgagat gcagaaaggc 660

ctgtgggagc agtgccagct gctgaagtcc accagcgtgt tcgccaggtg ccaccctctg 720

gtggaccctg agccttttgt ggccctgtgc gagaaaacac tgtgcgagtg tgccggcgga 780

ctggaatgtg cctgtcctgc cctgctggaa tacgccagaa cctgcgctca ggaagggatg 840

gtgctgtacg gctggaccga ccactctgcc tgtagccctg tgtgtcctgc cggcatggaa 900

tatcggcagt gcgtgtcccc ctgcgccagg acctgtcaga gcctgcacat caacgagatg 960

tgccaggaac gctgcgtgga cggctgtagc tgtcctgagg gacagctgct ggatgagggc 1020

ctgtgtgtgg aaagcaccga gtgcccttgt gtgcacagcg gcaagagata cccccctggc 1080

accagcctga gccgggactg caatacctgc atctgccgga acagccagtg gatctgctcc 1140

aacgaggaat gccctggcga gtgcctcgtg acaggccaga gccacttcaa gagcttcgac 1200

aacagatact tcaccttcag cggcatctgc cagtatctgc tggccagaga ctgccaggac 1260

cacagcttca gcatcgtgat cgagacagtg cagtgcgccg acgacagaga tgccgtgtgc 1320

accagatccg tgaccgtgcg gctgcctggc ctgcacaaca gcctcgtgaa gctgaaacac 1380

ggcgctgggg tggccatgga cggacaggac gtgcagctgc ctctgctgaa gggcgacctg 1440

agaatccagc acaccgtgac agcctctgtg cggctgagct acggcgagga cctccagatg 1500

gactgggatg gcaggggcag actgctcgtg aaactgagcc cagtgtatgc cggcaagact 1560

tgtggactgt gtggcaacta caacggcaac cagggcgacg atttcctgac cccttctggc 1620

ctggccgagc cccgggtgga agattttggc aacgcctgga agctgcacgg cgactgtcag 1680

gatctccaga agcagcacag cgacccttgc gccctgaacc cccggatgac cagattcagc 1740

gaagaggcct gtgccgtgct gaccagccct acctttgagg cctgccacag agccgtgtct 1800

ccactgcctt acctgcggaa ttgcagatac gacgtgtgct cctgctccga cggccgcgaa 1860

tgtctgtgtg gcgccctggc ctcttatgcc gccgcttgtg ctggaagagg cgtgcgggtg 1920

gcatggcggg aaccaggcag atgcgagctg aactgcccta agggccaggt gtacctccag 1980

tgcggcaccc cctgcaacct gacctgtaga agcctgagct accccgacga agagtgcaac 2040

gaggcctgtc tggaaggctg cttttgccct cccggcctgt atatggacga gcggggcgat 2100

tgtgtgccca aggcccagtg cccctgctac tacgacggcg agattttcca gcccgaggac 2160

atcttcagcg accaccacac catgtgctac tgcgaggatg gcttcatgca ctgcaccatg 2220

agcggcgtgc caggctccct gctgcctgat gctgtgctgt ctagccccct gagccacaga 2280

agcaagagaa gcctgtcttg cagacccccc atggtcaagc tcgtgtgccc tgccgacaac 2340

ctgagagccg agggcctgga atgcaccaag acatgccaga actacgacct ggaatgcatg 2400

agcatgggct gcgtgtccgg ctgtctgtgc cctcctggca tggtgcgcca cgagaataga 2460

tgcgtggccc tggaacggtg cccgtgcttt catcagggca aagagtacgc cccaggcgaa 2520

accgtgaaga tcggctgcaa cacatgcgtg tgtcaggacc ggaagtggaa ctgcaccgac 2580

cacgtgtgcg acgccacctg tagcacaatc ggcatggccc actacctgac cttcgatggc 2640

ctgaagtacc tgttccccgg cgagtgtcag tacgtgctgg tgcaggatta ctgcggcagc 2700

aaccccggca ccttcagaat cctcgtgggc aacaagggct gtagccaccc ctccgtgaag 2760

tgcaagaaac gcgtgaccat cctggtggaa ggcggagaga tcgagctgtt cgacggcgaa 2820

gtgaacgtga agcggcccat gaaggacgag acacacttcg aggtggtgga aagcggccgg 2880

tacatcatcc tgctgctggg caaagccctg tccgtcgtgt gggacagaca cctgagcatc 2940

agcgtggtgc tgaagcagac ctaccaggaa aaagtgtgcg ggctgtgtgg gaactttgac 3000

ggcatccaga acaacgatct gaccagcagc aatctccagg tggaagagga ccccgtggac 3060

ttcggcaatt cctggaaggt gtccagccag tgtgccgaca ccagaaaggt gcccctggat 3120

agcagccccg ccacatgcca caacaacatc atgaagcaga caatggtgga cagcagctgc 3180

cgcatcctga cctccgatgt gtttcaggac tgcaacaaac tggtggaccc cgaaccctac 3240

ctggacgtgt gcatctacga cacatgcagc tgcgagagca tcggcgattg cgcctgcttc 3300

tgcgacacca ttgccgccta cgcccatgtg tgcgcccagc acggaaaggt cgtgacttgg 3360

agaaccgcca ccctgtgccc acagagctgc gaggaacgga acctgcggga aaacggctac 3420

gagtgcgagt ggcggtacaa cagctgtgcc ccagcctgcc aagtgacctg ccagcaccct 3480

gaacctctgg cttgccccgt gcagtgcgtg gaaggatgtc acgcccattg cccacccggc 3540

aagatcctgg atgagctgct ccagacctgt gtggacccag aggactgccc agtgtgcgaa 3600

gtggccggaa gaagattcgc ctccggcaag aaagtgaccc tgaatccctc cgaccccgag 3660

cactgtcaga tttgtcactg cgacgtcgtg aatctgacat gcgaagcctg ccaggaacct 3720

ggcggactgg tggtgcctcc tacagatgcc cctgtgtccc ccaccaccct gtacgtggaa 3780

gatatcagcg agccccccct gcaccaggaa cctggcggac tggtggtgcc tcctacagac 3840

gctcctgtgt ctcctacaac actgtatgtg gaagatattt ccgagcctcc tctgcatcag 3900

gaaccagggg gcctggtggt gccaccaact gatgcaccag tgtctccaac tactctgtac 3960

gtggaagata tttctgaacc ccccctgcat taa 3993

<210> 18

<211> 4179

<212> ДНК

<213> Homo sapiens

<400> 18

atgatccccg ccagatttgc cggcgtgctg ctggccctgg ctctgatcct gcctggaaca 60

ctgtgtgccg agggcaccag aggcagatcc agcaccgcca gatgcagcct gttcggcagc 120

gacttcgtga acaccttcga cggcagcatg tacagcttcg ccggctactg ctcctacctg 180

ctggctggcg gctgccagaa gcggagcttt agcatcatcg gcgacttcca gaacggcaag 240

cgggtgtccc tgagcgtgta cctgggcgag ttcttcgaca tccacctgtt cgtgaacggc 300

accgtgaccc agggcgatca gagggtgtcc atgccctacg ccagcaaggg cctgtacctg 360

gaaacagagg ccggctatta caagctgagc ggcgaggcct acggcttcgt ggccagaatc 420

gatggcagcg gcaacttcca ggtgctgctg agcgaccggt acttcaacaa gacctgcggc 480

ctgtgcggca atttcaacat cttcgccgag gacgacttca tgacccagga aggcaccctg 540

accagcgacc cctacgactt cgccaatagc tgggccctgt ctagcggcga gcagtggtgc 600

gaaagagcca gccctcctag cagcagctgc aacatcagca gcggcgagat gcagaaaggc 660

ctgtgggagc agtgccagct gctgaagtcc accagcgtgt tcgccaggtg ccaccctctg 720

gtggaccctg agccttttgt ggccctgtgc gagaaaacac tgtgcgagtg tgccggcgga 780

ctggaatgtg cctgtcctgc cctgctggaa tacgccagaa cctgcgctca ggaagggatg 840

gtgctgtacg gctggaccga ccactctgcc tgtagccctg tgtgtcctgc cggcatggaa 900

tatcggcagt gcgtgtcccc ctgcgccagg acctgtcaga gcctgcacat caacgagatg 960

tgccaggaac gctgcgtgga cggctgtagc tgtcctgagg gacagctgct ggatgagggc 1020

ctgtgtgtgg aaagcaccga gtgcccttgt gtgcacagcg gcaagagata cccccctggc 1080

accagcctga gccgggactg caatacctgc atctgccgga acagccagtg gatctgctcc 1140

aacgaggaat gccctggcga gtgcctcgtg acaggccaga gccacttcaa gagcttcgac 1200

aacagatact tcaccttcag cggcatctgc cagtatctgc tggccagaga ctgccaggac 1260

cacagcttca gcatcgtgat cgagacagtg cagtgcgccg acgacagaga tgccgtgtgc 1320

accagatccg tgaccgtgcg gctgcctggc ctgcacaaca gcctcgtgaa gctgaaacac 1380

ggcgctgggg tggccatgga cggacaggac gtgcagctgc ctctgctgaa gggcgacctg 1440

agaatccagc acaccgtgac agcctctgtg cggctgagct acggcgagga cctccagatg 1500

gactgggatg gcaggggcag actgctcgtg aaactgagcc cagtgtatgc cggcaagact 1560

tgtggactgt gtggcaacta caacggcaac cagggcgacg atttcctgac cccttctggc 1620

ctggccgagc cccgggtgga agattttggc aacgcctgga agctgcacgg cgactgtcag 1680

gatctccaga agcagcacag cgacccttgc gccctgaacc cccggatgac cagattcagc 1740

gaagaggcct gtgccgtgct gaccagccct acctttgagg cctgccacag agccgtgtct 1800

ccactgcctt acctgcggaa ttgcagatac gacgtgtgct cctgctccga cggccgcgaa 1860

tgtctgtgtg gcgccctggc ctcttatgcc gccgcttgtg ctggaagagg cgtgcgggtg 1920

gcatggcggg aaccaggcag atgcgagctg aactgcccta agggccaggt gtacctccag 1980

tgcggcaccc cctgcaacct gacctgtaga agcctgagct accccgacga agagtgcaac 2040

gaggcctgtc tggaaggctg cttttgccct cccggcctgt atatggacga gcggggcgat 2100

tgtgtgccca aggcccagtg cccctgctac tacgacggcg agattttcca gcccgaggac 2160

atcttcagcg accaccacac catgtgctac tgcgaggatg gcttcatgca ctgcaccatg 2220

agcggcgtgc caggctccct gctgcctgat gctgtgctgt ctagccccct gagccacaga 2280

agcaagagaa gcctgtcttg cagacccccc atggtcaagc tcgtgtgccc tgccgacaac 2340

ctgagagccg agggcctgga atgcaccaag acatgccaga actacgacct ggaatgcatg 2400

agcatgggct gcgtgtccgg ctgtctgtgc cctcctggca tggtgcgcca cgagaataga 2460

tgcgtggccc tggaacggtg cccgtgcttt catcagggca aagagtacgc cccaggcgaa 2520

accgtgaaga tcggctgcaa cacatgcgtg tgtcaggacc ggaagtggaa ctgcaccgac 2580

cacgtgtgcg acgccacctg tagcacaatc ggcatggccc actacctgac cttcgatggc 2640

ctgaagtacc tgttccccgg cgagtgtcag tacgtgctgg tgcaggatta ctgcggcagc 2700

aaccccggca ccttcagaat cctcgtgggc aacaagggct gtagccaccc ctccgtgaag 2760

tgcaagaaac gcgtgaccat cctggtggaa ggcggagaga tcgagctgtt cgacggcgaa 2820

gtgaacgtga agcggcccat gaaggacgag acacacttcg aggtggtgga aagcggccgg 2880

tacatcatcc tgctgctggg caaagccctg tccgtcgtgt gggacagaca cctgagcatc 2940

agcgtggtgc tgaagcagac ctaccaggaa aaagtgtgcg ggctgtgtgg gaactttgac 3000

ggcatccaga acaacgatct gaccagcagc aatctccagg tggaagagga ccccgtggac 3060

ttcggcaatt cctggaaggt gtccagccag tgtgccgaca ccagaaaggt gcccctggat 3120

agcagccccg ccacatgcca caacaacatc atgaagcaga caatggtgga cagcagctgc 3180

cgcatcctga cctccgatgt gtttcaggac tgcaacaaac tggtggaccc cgaaccctac 3240

ctggacgtgt gcatctacga cacatgcagc tgcgagagca tcggcgattg cgcctgcttc 3300

tgcgacacca ttgccgccta cgcccatgtg tgcgcccagc acggaaaggt cgtgacttgg 3360

agaaccgcca ccctgtgccc acagagctgc gaggaacgga acctgcggga aaacggctac 3420

gagtgcgagt ggcggtacaa cagctgtgcc ccagcctgcc aagtgacctg ccagcaccct 3480

gaacctctgg cttgccccgt gcagtgcgtg gaaggatgtc acgcccattg cccacccggc 3540

aagatcctgg atgagctgct ccagacctgt gtggacccag aggactgccc agtgtgcgaa 3600

gtggccggaa gaagattcgc ctccggcaag aaagtgaccc tgaatccctc cgaccccgag 3660

cactgtcaga tttgtcactg cgacgtcgtg aatctgacat gcgaagcctg ccaggaacct 3720

ggcggactgg tggtgcctcc tacagatgcc cctgtgtccc ccaccaccct gtacgtggaa 3780

gatatcagcg agccccccct gcaccaagaa cctggtggac tggtggtgcc tcctacagat 3840

gctcctgtgt ctcccaccac actgtacgtg gaagatatca gcgagcctcc tctgcaccaa 3900

gagccaggcg gacttgtggt cccaccaact gatgcccctg tcagccctac aactctgtac 3960

gtcgaggaca tctccgagcc accactgcat caagaacctg gcggccttgt cgttcctcca 4020

acagacgcac ctgttagccc aactacactg tatgttgagg acataagcga accgcctctc 4080

catcaagaac ccggtggtct tgttgtccca cctacagacg ccccagtctc tcctaccact 4140

ctctatgtcg aagatatttc cgaacctcca ctgcactaa 4179

<210> 19

<211> 4275

<212> ДНК

<213> Homo sapiens

<400> 19

atgatccccg ccagatttgc cggcgtgctg ctggccctgg ctctgatcct gcctggaaca 60

ctgtgtgccg agggcaccag aggcagatcc agcaccgcca gatgcagcct gttcggcagc 120

gacttcgtga acaccttcga cggcagcatg tacagcttcg ccggctactg ctcctacctg 180

ctggctggcg gctgccagaa gcggagcttt agcatcatcg gcgacttcca gaacggcaag 240

cgggtgtccc tgagcgtgta cctgggcgag ttcttcgaca tccacctgtt cgtgaacggc 300

accgtgaccc agggcgatca gagggtgtcc atgccctacg ccagcaaggg cctgtacctg 360

gaaacagagg ccggctatta caagctgagc ggcgaggcct acggcttcgt ggccagaatc 420

gatggcagcg gcaacttcca ggtgctgctg agcgaccggt acttcaacaa gacctgcggc 480

ctgtgcggca atttcaacat cttcgccgag gacgacttca tgacccagga aggcaccctg 540

accagcgacc cctacgactt cgccaatagc tgggccctgt ctagcggcga gcagtggtgc 600

gaaagagcca gccctcctag cagcagctgc aacatcagca gcggcgagat gcagaaaggc 660

ctgtgggagc agtgccagct gctgaagtcc accagcgtgt tcgccaggtg ccaccctctg 720

gtggaccctg agccttttgt ggccctgtgc gagaaaacac tgtgcgagtg tgccggcgga 780

ctggaatgtg cctgtcctgc cctgctggaa tacgccagaa cctgcgctca ggaagggatg 840

gtgctgtacg gctggaccga ccactctgcc tgtagccctg tgtgtcctgc cggcatggaa 900

tatcggcagt gcgtgtcccc ctgcgccagg acctgtcaga gcctgcacat caacgagatg 960

tgccaggaac gctgcgtgga cggctgtagc tgtcctgagg gacagctgct ggatgagggc 1020

ctgtgtgtgg aaagcaccga gtgcccttgt gtgcacagcg gcaagagata cccccctggc 1080

accagcctga gccgggactg caatacctgc atctgccgga acagccagtg gatctgctcc 1140

aacgaggaat gccctggcga gtgcctcgtg acaggccaga gccacttcaa gagcttcgac 1200

aacagatact tcaccttcag cggcatctgc cagtatctgc tggccagaga ctgccaggac 1260

cacagcttca gcatcgtgat cgagacagtg cagtgcgccg acgacagaga tgccgtgtgc 1320

accagatccg tgaccgtgcg gctgcctggc ctgcacaaca gcctcgtgaa gctgaaacac 1380

ggcgctgggg tggccatgga cggacaggac gtgcagctgc ctctgctgaa gggcgacctg 1440

agaatccagc acaccgtgac agcctctgtg cggctgagct acggcgagga cctccagatg 1500

gactgggatg gcaggggcag actgctcgtg aaactgagcc cagtgtatgc cggcaagact 1560

tgtggactgt gtggcaacta caacggcaac cagggcgacg atttcctgac cccttctggc 1620

ctggccgagc cccgggtgga agattttggc aacgcctgga agctgcacgg cgactgtcag 1680

gatctccaga agcagcacag cgacccttgc gccctgaacc cccggatgac cagattcagc 1740

gaagaggcct gtgccgtgct gaccagccct acctttgagg cctgccacag agccgtgtct 1800

ccactgcctt acctgcggaa ttgcagatac gacgtgtgct cctgctccga cggccgcgaa 1860

tgtctgtgtg gcgccctggc ctcttatgcc gccgcttgtg ctggaagagg cgtgcgggtg 1920

gcatggcggg aaccaggcag atgcgagctg aactgcccta agggccaggt gtacctccag 1980

tgcggcaccc cctgcaacct gacctgtaga agcctgagct accccgacga agagtgcaac 2040

gaggcctgtc tggaaggctg cttttgccct cccggcctgt atatggacga gcggggcgat 2100

tgtgtgccca aggcccagtg cccctgctac tacgacggcg agattttcca gcccgaggac 2160

atcttcagcg accaccacac catgtgctac tgcgaggatg gcttcatgca ctgcaccatg 2220

agcggcgtgc caggctccct gctgcctgat gctgtgctgt ctagccccct gagccacaga 2280

agcaagagaa gcctgtcttg cagacccccc atggtcaagc tcgtgtgccc tgccgacaac 2340

ctgagagccg agggcctgga atgcaccaag acatgccaga actacgacct ggaatgcatg 2400

agcatgggct gcgtgtccgg ctgtctgtgc cctcctggca tggtgcgcca cgagaataga 2460

tgcgtggccc tggaacggtg cccgtgcttt catcagggca aagagtacgc cccaggcgaa 2520

accgtgaaga tcggctgcaa cacatgcgtg tgtcaggacc ggaagtggaa ctgcaccgac 2580

cacgtgtgcg acgccacctg tagcacaatc ggcatggccc actacctgac cttcgatggc 2640

ctgaagtacc tgttccccgg cgagtgtcag tacgtgctgg tgcaggatta ctgcggcagc 2700

aaccccggca ccttcagaat cctcgtgggc aacaagggct gtagccaccc ctccgtgaag 2760

tgcaagaaac gcgtgaccat cctggtggaa ggcggagaga tcgagctgtt cgacggcgaa 2820

gtgaacgtga agcggcccat gaaggacgag acacacttcg aggtggtgga aagcggccgg 2880

tacatcatcc tgctgctggg caaagccctg tccgtcgtgt gggacagaca cctgagcatc 2940

agcgtggtgc tgaagcagac ctaccaggaa aaagtgtgcg ggctgtgtgg gaactttgac 3000

ggcatccaga acaacgatct gaccagcagc aatctccagg tggaagagga ccccgtggac 3060

ttcggcaatt cctggaaggt gtccagccag tgtgccgaca ccagaaaggt gcccctggat 3120

agcagccccg ccacatgcca caacaacatc atgaagcaga caatggtgga cagcagctgc 3180

cgcatcctga cctccgatgt gtttcaggac tgcaacaaac tggtggaccc cgaaccctac 3240

ctggacgtgt gcatctacga cacatgcagc tgcgagagca tcggcgattg cgcctgcttc 3300

tgcgacacca ttgccgccta cgcccatgtg tgcgcccagc acggaaaggt cgtgacttgg 3360

agaaccgcca ccctgtgccc acagagctgc gaggaacgga acctgcggga aaacggctac 3420

gagtgcgagt ggcggtacaa cagctgtgcc ccagcctgcc aagtgacctg ccagcaccct 3480

gaacctctgg cttgccccgt gcagtgcgtg gaaggatgtc acgcccattg cccacccggc 3540

aagatcctgg atgagctgct ccagacctgt gtggacccag aggactgccc agtgtgcgaa 3600

gtggccggaa gaagattcgc ctccggcaag aaagtgaccc tgaatccctc cgaccccgag 3660

cactgtcaga tttgtcactg cgacgtcgtg aatctgacat gcgaagcctg ccaggaacct 3720

ggcggactgg tggtgcctcc tacagatgcc cctgtgtccc ccaccaccct gtacgtggaa 3780

gatatcagcg agccccccct gcaccaagaa cctggtggac tggtggtgcc tcctacagat 3840

gctcctgtgt ctcccaccac actgtacgtg gaagatatca gcgagcctcc tctgcaccaa 3900

gagccaggcg gacttgtggt cccaccaact gatgcccctg tcagccctac aactctgtac 3960

gtcgaggaca tctccgagcc accactgcac gaggaacccg agtgcaacga tatcaccgcc 4020

agactgcagt acgtgaaagt gggcagctgc aagagcgagg tggaagtgga catccactac 4080

tgccagggca agtgtgccag caaggccatg tacagcatcg acatcaacga cgtgcaggac 4140

cagtgcagct gctgcagccc aacaagaacc gagcctatgc aggtcgccct gcactgtaca 4200

aatggcagcg tggtgtacca cgaggtgctg aacgccatgg aatgcaagtg cagccccaga 4260

aagtgcagca agtaa 4275

<210> 20

<211> 4659

<212> ДНК

<213> Homo sapiens

<400> 20

atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagtgcc 60

accagaagat actacctggg tgcagtggaa ctgtcatggg actatatgca aagtgatctc 120

ggtgagctgc ctgtggacgc aagatttcct cctagagtgc caaaatcttt tccattcaac 180

acctcagtcg tgtacaaaaa gactctgttt gtagaattca cggatcacct tttcaacatc 240

gctaagccaa ggccaccctg gatgggtctg ctaggtccta ccatccaggc tgaggtttat 300

gatacagtgg tcattacact taagaacatg gcttcccatc ctgtcagtct tcatgctgtt 360

ggtgtatcct actggaaagc ttctgaggga gctgaatatg atgatcagac cagtcaaagg 420

gagaaagaag atgataaagt cttccctggt ggaagccata catatgtctg gcaggtcctg 480

aaagagaatg gtccaatggc ctctgaccca ctgtgcctta cctactcata tctttctcat 540

gtggacctgg taaaagactt gaattcaggc ctcattggag ccctactagt atgtagagaa 600

gggagtctgg ccaaggaaaa gacacagacc ttgcacaaat ttatactact ttttgctgta 660

tttgatgaag ggaaaagttg gcactcagaa acaaagaact ccttgatgca ggatagggat 720

gctgcatctg ctcgggcctg gcctaaaatg cacacagtca atggttatgt aaacaggtct 780

ctgccaggtc tgattggatg ccacaggaaa tcagtctatt ggcatgtgat tggaatgggc 840

accactcctg aagtgcactc aatattcctc gaaggtcaca catttcttgt gaggaaccat 900

cgccaggcgt ccttggaaat ctcgccaata actttcctta ctgctcaaac actcttgatg 960

gaccttggac agtttctact gttttgtcat atctcttccc accaacatga tggcatggaa 1020

gcttatgtca aagtagacag ctgtccagag gaaccccaac tacgaatgaa aaataatgaa 1080

gaagcggaag actatgatga tgatcttact gattctgaaa tggatgtggt caggtttgat 1140

gatgacaact ctccttcctt tatccaaatt cgctcagttg ccaagaagca tcctaaaact 1200

tgggtacatt acattgctgc tgaagaggag gactgggact atgctccctt agtcctcgcc 1260

cccgatgaca gaagttataa aagtcaatat ttgaacaatg gccctcagcg gattggtagg 1320

aagtacaaaa aagtccgatt tatggcatac acagatgaaa cctttaagac tcgtgaagct 1380

attcagcatg aatcaggaat cttgggacct ttactttatg gggaagttgg agacacactg 1440

ttgattatat ttaagaatca agcaagcaga ccatataaca tctaccctca cggaatcact 1500

gatgtccgtc ctttgtattc aaggagatta ccaaaaggtg taaaacattt gaaggatttt 1560

ccaattctgc caggagaaat attcaaatat aaatggacag tgactgtaga agatgggcca 1620

actaaatcag atcctcggtg cctgacccgc tattactcta gtttcgttaa tatggagaga 1680

gatctagctt caggactcat tggccctctc ctcatctgct acaaagaatc tgtagatcaa 1740

agaggaaacc agataatgtc agacaagagg aatgtcatcc tgttttctgt atttgatgag 1800

aaccgaagct ggtacctcac agagaatata caacgctttc tccccaatcc agctggagtg 1860

cagcttgagg atccagagtt ccaagcctcc aacatcatgc acagcatcaa tggctatgtt 1920

tttgatagtt tgcagttgtc agtttgtttg catgaggtgg catactggta cattctaagc 1980

attggagcac agactgactt cctttctgtc ttcttctctg gatatacctt caaacacaaa 2040

atggtctatg aagacacact caccctattc ccattctcag gagaaactgt cttcatgtcg 2100

atggaaaacc caggtctatg gattctgggg tgccacaact cagactttcg gaacagaggc 2160

atgaccgcct tactgaaggt ttctagttgt gacaagaaca ctggtgatta ttacgaggac 2220

agttatgaag atatttcagc atacttgctg agtaaaaaca atgccattga accaagaagc 2280

ttctcccaga attcaagaca tcaggaacct ggcggactgg tggtgcctcc tacagatgcc 2340

cctgtgtccc ccaccaccct gtacgtggaa gatatcagcg agccccccct gcaccaggaa 2400

cctggcggac tggtggtgcc tcctacagac gctcctgtgt ctcctacaac actgtatgtg 2460

gaagatattt ccgagcctcc tctgcatcag gaaccagggg gcctggtggt gccaccaact 2520

gatgcaccag tgtctccaac tactctgtac gtggaagata tttctgaacc ccccctgcat 2580

caagcttatc gataccgtcg aggggaaata actcgtacta ctcttcagtc agatcaagag 2640

gaaattgact atgatgatac catatcagtt gaaatgaaga aggaagattt tgacatttat 2700

gatgaggatg aaaatcagag cccccgcagc tttcaaaaga aaacacgaca ctattttatt 2760

gctgcagtgg agaggctctg ggattatggg atgagtagct ccccacatgt tctaagaaac 2820

agggctcaga gtggcagtgt ccctcagttc aagaaagttg ttttccagga atttactgat 2880

ggctccttta ctcagccctt ataccgtgga gaactaaatg aacatttggg actcctgggg 2940

ccatatataa gagcagaagt tgaagataat atcatggtaa ctttcagaaa tcaggcctct 3000

cgtccctatt ccttctattc tagccttatt tcttatgagg aagatcagag gcaaggagca 3060

gaacctagaa aaaactttgt caagcctaat gaaaccaaaa cttacttttg gaaagtgcaa 3120

catcatatgg cacccactaa agatgagttt gactgcaaag cctgggctta tttctctgat 3180

gttgacctgg aaaaagatgt gcactcaggc ctgattggac cccttctggt ctgccacact 3240

aacacactga accctgctca tgggagacaa gtgacagtac aggaatttgc tctgtttttc 3300

accatctttg atgagaccaa aagctggtac ttcactgaaa atatggaaag aaactgcagg 3360

gctccctgca atatccagat ggaagatccc acttttaaag agaattatcg cttccatgca 3420

atcaatggct acataatgga tacactacct ggcttagtaa tggctcagga tcaaaggatt 3480

cgatggtatc tgctcagcat gggcagcaat gaaaacatcc attctattca tttcagtgga 3540

catgtgttca ctgtacgaaa aaaagaggag tataaaatgg cactgtacaa tctctatcca 3600

ggtgtttttg agacagtgga aatgttacca tccaaagctg gaatttggcg ggtggaatgc 3660

cttattggcg agcatctaca tgctgggatg agcacacttt ttctggtgta cagcaataag 3720

tgtcagactc ccctgggaat ggcttctgga cacattagag attttcagat tacagcttca 3780

ggacaatatg gacagtgggc cccaaagctg gccagacttc attattccgg atcaatcaat 3840

gcctggagca ccaaggagcc cttttcttgg atcaaggtgg atctgttggc accaatgatt 3900

attcacggca tcaagaccca gggtgcccgt cagaagttct ccagcctcta catctctcag 3960

tttatcatca tgtatagtct tgatgggaag aagtggcaga cttatcgagg aaattccact 4020

ggaaccttaa tggtcttctt tggcaatgtg gattcatctg ggataaaaca caatattttt 4080

aaccctccaa ttattgctcg atacatccgt ttgcacccaa ctcattatag cattcgcagc 4140

actcttcgca tggagttgat gggctgtgat ttaaatagtt gcagcatgcc attgggaatg 4200

gagagtaaag caatatcaga tgcacagatt actgcttcat cctactttac caatatgttt 4260

gccacctggt ctccttcaaa agctcgactt cacctccaag ggaggagtaa tgcctggaga 4320

cctcaggtga ataatccaaa agagtggctg caagtggact tccagaagac aatgaaagtc 4380

acaggagtaa ctactcaggg agtaaaatct ctgcttacca gcatgtatgt gaaggagttc 4440

ctcatctcca gcagtcaaga tggccatcag tggaccctct tttttcagaa tggcaaagta 4500

aaggtttttc agggaaatca agactccttc acacctgtgg tgaactctct agacccaccg 4560

ttactgactc gctaccttcg aattcacccc cagagttggg tgcaccagat tgccctgagg 4620

atggaggttc tgggctgcga ggcacaggac ctctactga 4659

<210> 21

<211> 1533

<212> БЕЛОК

<213> Homo sapiens

<400> 21

Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr

1 5 10 15

Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro

20 25 30

Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys

35 40 45

Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro

50 55 60

Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val

65 70 75 80

Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val

85 90 95

Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala

100 105 110

Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val

115 120 125

Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn

130 135 140

Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser

145 150 155 160

His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu

165 170 175

Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu

180 185 190

His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp

195 200 205

His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser

210 215 220

Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg

225 230 235 240

Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His

245 250 255

Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu

260 265 270

Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile

275 280 285

Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly

290 295 300

Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met

305 310 315 320

Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg

325 330 335

Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp

340 345 350

Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe

355 360 365

Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His

370 375 380

Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu

385 390 395 400

Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro

405 410 415

Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr

420 425 430

Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile

435 440 445

Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile

450 455 460

Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile

465 470 475 480

Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys

485 490 495

His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys

500 505 510

Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys

515 520 525

Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala

530 535 540

Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp

545 550 555 560

Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe

565 570 575

Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln

580 585 590

Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe

595 600 605

Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser

610 615 620

Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu

625 630 635 640

Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr

645 650 655

Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro

660 665 670

Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp

675 680 685

Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala

690 695 700

Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu

705 710 715 720

Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala

725 730 735

Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Gln Ala Tyr Arg

740 745 750

Tyr Arg Arg Gly Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln Glu

755 760 765

Glu Ile Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp

770 775 780

Phe Asp Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln

785 790 795 800

Lys Lys Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp

805 810 815

Tyr Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser

820 825 830

Gly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp

835 840 845

Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu

850 855 860

Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met

865 870 875 880

Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser

885 890 895

Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys

900 905 910

Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln

915 920 925

His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala

930 935 940

Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile

945 950 955 960

Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His Gly

965 970 975

Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp

980 985 990

Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg

995 1000 1005

Ala Pro Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn

1010 1015 1020

Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro

1025 1030 1035

Gly Leu Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu

1040 1045 1050

Ser Met Gly Ser Asn Glu Asn Ile His Ser Ile His Phe Ser Gly

1055 1060 1065

His Val Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu

1070 1075 1080

Tyr Asn Leu Tyr Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro

1085 1090 1095

Ser Lys Ala Gly Ile Trp Arg Val Glu Cys Leu Ile Gly Glu His

1100 1105 1110

Leu His Ala Gly Met Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys

1115 1120 1125

Cys Gln Thr Pro Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe

1130 1135 1140

Gln Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu

1145 1150 1155

Ala Arg Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys

1160 1165 1170

Glu Pro Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile

1175 1180 1185

Ile His Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser

1190 1195 1200

Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys

1205 1210 1215

Lys Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val

1220 1225 1230

Phe Phe Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe

1235 1240 1245

Asn Pro Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His

1250 1255 1260

Tyr Ser Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp

1265 1270 1275

Leu Asn Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile

1280 1285 1290

Ser Asp Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe

1295 1300 1305

Ala Thr Trp Ser Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg

1310 1315 1320

Ser Asn Ala Trp Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu

1325 1330 1335

Gln Val Asp Phe Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr

1340 1345 1350

Gln Gly Val Lys Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe

1355 1360 1365

Leu Ile Ser Ser Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe

1370 1375 1380

Gln Asn Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe

1385 1390 1395

Thr Pro Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr

1400 1405 1410

Leu Arg Ile His Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg

1415 1420 1425

Met Glu Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr Gln Glu Pro

1430 1435 1440

Gly Gly Leu Val Val Pro Pro Thr Asp Ala Pro Val Ser Pro Thr

1445 1450 1455

Thr Leu Tyr Val Glu Asp Ile Ser Glu Pro Pro Leu His Gln Glu

1460 1465 1470

Pro Gly Gly Leu Val Val Pro Pro Thr Asp Ala Pro Val Ser Pro

1475 1480 1485

Thr Thr Leu Tyr Val Glu Asp Ile Ser Glu Pro Pro Leu His Gln

1490 1495 1500

Glu Pro Gly Gly Leu Val Val Pro Pro Thr Asp Ala Pro Val Ser

1505 1510 1515

Pro Thr Thr Leu Tyr Val Glu Asp Ile Ser Glu Pro Pro Leu His

1520 1525 1530

<210> 22

<211> 4659

<212> ДНК

<213> Homo sapiens

<400> 22

atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagtgcc 60

accagaagat actacctggg tgcagtggaa ctgtcatggg actatatgca aagtgatctc 120

ggtgagctgc ctgtggacgc aagatttcct cctagagtgc caaaatcttt tccattcaac 180

acctcagtcg tgtacaaaaa gactctgttt gtagaattca cggatcacct tttcaacatc 240

gctaagccaa ggccaccctg gatgggtctg ctaggtccta ccatccaggc tgaggtttat 300

gatacagtgg tcattacact taagaacatg gcttcccatc ctgtcagtct tcatgctgtt 360

ggtgtatcct actggaaagc ttctgaggga gctgaatatg atgatcagac cagtcaaagg 420

gagaaagaag atgataaagt cttccctggt ggaagccata catatgtctg gcaggtcctg 480

aaagagaatg gtccaatggc ctctgaccca ctgtgcctta cctactcata tctttctcat 540

gtggacctgg taaaagactt gaattcaggc ctcattggag ccctactagt atgtagagaa 600

gggagtctgg ccaaggaaaa gacacagacc ttgcacaaat ttatactact ttttgctgta 660

tttgatgaag ggaaaagttg gcactcagaa acaaagaact ccttgatgca ggatagggat 720

gctgcatctg ctcgggcctg gcctaaaatg cacacagtca atggttatgt aaacaggtct 780

ctgccaggtc tgattggatg ccacaggaaa tcagtctatt ggcatgtgat tggaatgggc 840

accactcctg aagtgcactc aatattcctc gaaggtcaca catttcttgt gaggaaccat 900

cgccaggcgt ccttggaaat ctcgccaata actttcctta ctgctcaaac actcttgatg 960

gaccttggac agtttctact gttttgtcat atctcttccc accaacatga tggcatggaa 1020

gcttatgtca aagtagacag ctgtccagag gaaccccaac tacgaatgaa aaataatgaa 1080

gaagcggaag actatgatga tgatcttact gattctgaaa tggatgtggt caggtttgat 1140

gatgacaact ctccttcctt tatccaaatt cgctcagttg ccaagaagca tcctaaaact 1200

tgggtacatt acattgctgc tgaagaggag gactgggact atgctccctt agtcctcgcc 1260

cccgatgaca gaagttataa aagtcaatat ttgaacaatg gccctcagcg gattggtagg 1320

aagtacaaaa aagtccgatt tatggcatac acagatgaaa cctttaagac tcgtgaagct 1380

attcagcatg aatcaggaat cttgggacct ttactttatg gggaagttgg agacacactg 1440

ttgattatat ttaagaatca agcaagcaga ccatataaca tctaccctca cggaatcact 1500

gatgtccgtc ctttgtattc aaggagatta ccaaaaggtg taaaacattt gaaggatttt 1560

ccaattctgc caggagaaat attcaaatat aaatggacag tgactgtaga agatgggcca 1620

actaaatcag atcctcggtg cctgacccgc tattactcta gtttcgttaa tatggagaga 1680

gatctagctt caggactcat tggccctctc ctcatctgct acaaagaatc tgtagatcaa 1740

agaggaaacc agataatgtc agacaagagg aatgtcatcc tgttttctgt atttgatgag 1800

aaccgaagct ggtacctcac agagaatata caacgctttc tccccaatcc agctggagtg 1860

cagcttgagg atccagagtt ccaagcctcc aacatcatgc acagcatcaa tggctatgtt 1920

tttgatagtt tgcagttgtc agtttgtttg catgaggtgg catactggta cattctaagc 1980

attggagcac agactgactt cctttctgtc ttcttctctg gatatacctt caaacacaaa 2040

atggtctatg aagacacact caccctattc ccattctcag gagaaactgt cttcatgtcg 2100

atggaaaacc caggtctatg gattctgggg tgccacaact cagactttcg gaacagaggc 2160

atgaccgcct tactgaaggt ttctagttgt gacaagaaca ctggtgatta ttacgaggac 2220

agttatgaag atatttcagc atacttgctg agtaaaaaca atgccattga accaagaagc 2280

ttctcccaga attcaagaca tcaagcttat cgataccgtc gaggggaaat aactcgtact 2340

actcttcagt cagatcaaga ggaaattgac tatgatgata ccatatcagt tgaaatgaag 2400

aaggaagatt ttgacattta tgatgaggat gaaaatcaga gcccccgcag ctttcaaaag 2460

aaaacacgac actattttat tgctgcagtg gagaggctct gggattatgg gatgagtagc 2520

tccccacatg ttctaagaaa cagggctcag agtggcagtg tccctcagtt caagaaagtt 2580

gttttccagg aatttactga tggctccttt actcagccct tataccgtgg agaactaaat 2640

gaacatttgg gactcctggg gccatatata agagcagaag ttgaagataa tatcatggta 2700

actttcagaa atcaggcctc tcgtccctat tccttctatt ctagccttat ttcttatgag 2760

gaagatcaga ggcaaggagc agaacctaga aaaaactttg tcaagcctaa tgaaaccaaa 2820

acttactttt ggaaagtgca acatcatatg gcacccacta aagatgagtt tgactgcaaa 2880

gcctgggctt atttctctga tgttgacctg gaaaaagatg tgcactcagg cctgattgga 2940

ccccttctgg tctgccacac taacacactg aaccctgctc atgggagaca agtgacagta 3000

caggaatttg ctctgttttt caccatcttt gatgagacca aaagctggta cttcactgaa 3060

aatatggaaa gaaactgcag ggctccctgc aatatccaga tggaagatcc cacttttaaa 3120

gagaattatc gcttccatgc aatcaatggc tacataatgg atacactacc tggcttagta 3180

atggctcagg atcaaaggat tcgatggtat ctgctcagca tgggcagcaa tgaaaacatc 3240

cattctattc atttcagtgg acatgtgttc actgtacgaa aaaaagagga gtataaaatg 3300

gcactgtaca atctctatcc aggtgttttt gagacagtgg aaatgttacc atccaaagct 3360

ggaatttggc gggtggaatg ccttattggc gagcatctac atgctgggat gagcacactt 3420

tttctggtgt acagcaataa gtgtcagact cccctgggaa tggcttctgg acacattaga 3480

gattttcaga ttacagcttc aggacaatat ggacagtggg ccccaaagct ggccagactt 3540

cattattccg gatcaatcaa tgcctggagc accaaggagc ccttttcttg gatcaaggtg 3600

gatctgttgg caccaatgat tattcacggc atcaagaccc agggtgcccg tcagaagttc 3660

tccagcctct acatctctca gtttatcatc atgtatagtc ttgatgggaa gaagtggcag 3720

acttatcgag gaaattccac tggaacctta atggtcttct ttggcaatgt ggattcatct 3780

gggataaaac acaatatttt taaccctcca attattgctc gatacatccg tttgcaccca 3840

actcattata gcattcgcag cactcttcgc atggagttga tgggctgtga tttaaatagt 3900

tgcagcatgc cattgggaat ggagagtaaa gcaatatcag atgcacagat tactgcttca 3960

tcctacttta ccaatatgtt tgccacctgg tctccttcaa aagctcgact tcacctccaa 4020

gggaggagta atgcctggag acctcaggtg aataatccaa aagagtggct gcaagtggac 4080

ttccagaaga caatgaaagt cacaggagta actactcagg gagtaaaatc tctgcttacc 4140

agcatgtatg tgaaggagtt cctcatctcc agcagtcaag atggccatca gtggaccctc 4200

ttttttcaga atggcaaagt aaaggttttt cagggaaatc aagactcctt cacacctgtg 4260

gtgaactctc tagacccacc gttactgact cgctaccttc gaattcaccc ccagagttgg 4320

gtgcaccaga ttgccctgag gatggaggtt ctgggctgcg aggcacagga cctctaccag 4380

gaacctggcg gactggtggt gcctcctaca gatgcccctg tgtcccccac caccctgtac 4440

gtggaagata tcagcgagcc ccccctgcac caggaacctg gcggactggt ggtgcctcct 4500

acagacgctc ctgtgtctcc tacaacactg tatgtggaag atatttccga gcctcctctg 4560

catcaggaac cagggggcct ggtggtgcca ccaactgatg caccagtgtc tccaactact 4620

ctgtacgtgg aagatatttc tgaacccccc ctgcattga 4659

<---

Claims

1. Слитый белок, содержащий основной белок и один или более пептидов удлинения, где аминокислотная последовательность основного белка идентична или схожа с аминокислотной последовательностью белка крови человека или его фрагмента и указанный(е) пептид(ы) удлинения содержит(ат) кластер O-гликозилированных аминокислот с по меньшей мере двумя О-гликозилированными аминокислотами и имеет(ют) идентичность последовательности по меньшей мере 90% к SEQ ID NO: 1 и где слитый белок имеет повышенное время полужизни по сравнению с основным белком без пептида(ов) удлинения.

2. Слитый белок по п.1, где кластеры O-гликозилированных аминокислот пептидов удлинения содержат по меньшей мере три, по меньшей мере четыре O-гликозилированных аминокислоты.

3. Слитый белок по любому из пп. 1 или 2, где один или более пептидов удлинения имеют идентичность последовательности по меньшей мере 95%, более предпочтительно - по меньшей мере 98%, наиболее предпочтительно - по меньшей мере 100% по отношению к O-гликозилированному пептиду фактора фон Виллебранда (VWF), в частности SEQ ID NO: 1.

4. Слитый белок по любому из предшествующих пунктов, содержащий по меньшей мере две копии, предпочтительно - по меньшей мере четыре копии пептида удлинения.

5. Слитый белок по любому из предшествующих пунктов, где пептид удлинения напрямую или косвенно слит с C-концом основного белка.

6. Слитый белок по любому из предшествующих пунктов, где пептид удлинения образует C-конец слитого белка, где C-концевая аминокислота указанного пептида удлинения, необязательно, соединена с аффинной меткой слитого пептида.

7. Слитый белок по любому из пп. 3-6, где основной белок содержит по меньшей мере один кластер O-гликозилированных аминокислот.

8. Слитый белок по любому из предшествующих пунктов, где слитый белок содержит домен димеризации, в частности основной белок содержит домен димеризации.

9. Слитый белок по любому из предшествующих пунктов, где белок млекопитающего является фактором свертывания или ингибитором протеазы, более предпочтительно выбран из группы, состоящей из VWF, протромбина, фибриногена, FIII, FV, FVII, FVIII, FIX, FX, FXI, FXII, FXIII, ADAMTS13, антитромбина, альфа-1-антитрипсина, ингибитора C1, антихимотрипсина, PAI-1, PAI-3, 2-макроглобулина, TFPI, кофактора гепарина II, протеина Z, протеина C и протеина S.

10. Слитый белок по любому из предшествующих пунктов, где основной белок имеет идентичность последовательности по меньшей мере 90%, предпочтительно - по меньшей мере 95%, более предпочтительно - по меньшей мере 98%, наиболее предпочтительно - 100% по отношению к аминокислотам 764-1268 SEQ ID NO: 2.

11. Слитый белок по любому из предшествующих пунктов, где слитый белок содержит по меньшей мере 4, предпочтительно - по меньшей мере 8, более предпочтительно - по меньшей мере 12 дополнительных O-гликанов по сравнению с основным белком.

12. Слитый белок по любому из предшествующих пунктов, где аминокислотная последовательность слитого белка имеет идентичность по меньшей мере 90%, предпочтительно - по меньшей мере 95%, более предпочтительно - по меньшей мере 98%, наиболее предпочтительно - 100% по отношению к последовательности, выбранной из SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 14 или SEQ ID NO: 21.

13. Слитый белок по любому из предшествующих пунктов, где слитый белок получают посредством экспрессии в линии клеток млекопитающего, предпочтительно - линии клеток человека, более предпочтительно - линии клеток почки человека, наиболее предпочтительно - линии эмбриональных клеток почки человек, в частности линии клеток HEK293, такой как HEK293F, где указанные клетки не являются клетками, полученными путем разрушения эмбриона человека.

14. Композиция первого белка и второго белка для лечения или профилактики нарушения свертываемости, где указанный первый белок является слитым белком по любому из пп. 1-13 и способен связываться с указанным вторым белком и указанный второй белок является терапевтическим белком, содержащим аминокислотную последовательность, идентичную или схожую с аминокислотной последовательностью второго белка крови человека или его фрагмента, где второй белок крови человека выбирают из VWF, протромбина, фибриногена, FIII, FV, FVII, FVIII, FIX, FX, FXI, FXII, FXIII, ADAMTS13, антитромбина, альфа-1-антитрипсина, ингибитора C1, антихимотрипсина, PAI-1, PAI-3, 2-макроглобулина, TFPI, кофактора гепарина II, протеина Z, протеина C и протеина S.

15. Композиция по п. 14, где время полужизни второго белка, связанного с первым белком, повышается по сравнению со свободной формой указанного второго белка, предпочтительно, где время полужизни второго белка, связанного с первым белком, повышается по сравнению с указанным вторым белком, связанным с нативным белком млекопитающего, или основным белком без слитого пептида.

16. Композиция по п. 14 или 15, где молярное соотношение первого белка и второго белка находится в диапазоне от 0,1 до 250, предпочтительно - в диапазоне от 0,5 до 50, более предпочтительно - в диапазоне от 1 до 25, наиболее предпочтительно - в диапазоне от 2 до 10.

17. Композиция по любому из пп. 14-16, где аффинность связывания первого белка со вторым белком находится в диапазоне от 0,05 до 3 нМ.

18. Композиция по любому из пп. 14-17, где второй белок млекопитающего является белком крови, более предпочтительно указанный второй белок млекопитающего является белком плазмы, наиболее предпочтительно указанный второй белок является фактором свертывания.

19. Композиция по любому из пп. 14-18, где второй белок является белком FVIII, выбранным из полноразмерного FVIII, белка FVIII, в котором по меньшей мере часть B-домена отсутствует, и белка FVIII, в котором по меньшей мере часть B-домена заменяют пептидом удлинения, где пептид удлинения определяют по любому из пп. 1-3.

20. Композиция по любому из пп. 14-19, где один или более пептидов удлинения находятся в положении в свернутом состоянии первого белка, не мешающем связыванию первого белка со вторым белком.

21. Комплекс первого белка и второго белка для лечения или профилактики нарушения свертываемости, где указанный первый белок является слитым белком по любому из пп. 1-13 и указанный второй белок представляет собой терапевтический белок, содержащий аминокислотную последовательность, идентичную или схожую с аминокислотной последовательностью второго белка крови человека или его фрагмента, где второй белок крови человека выбирают из VWF, протромбина, фибриногена, FIII, FV, FVII, FVIII, FIX, FX, FXI, FXII, FXIII, ADAMTS13, антитромбина, альфа-1-антитрипсина, ингибитора C1, антихимотрипсина, PAI-1, PAI-3, 2-макроглобулина, TFPI, кофактора гепарина II, протеина Z, протеина C и протеина S.

22. Комплекс по п. 21, где первый белок нековалентно связан со вторым белком.

23. Комплекс по п. 21 или 22, содержащий две копии первого и второго белка, где две копии первого белка образуют димер, предпочтительно нековалентно связанный димер.

24. Комплекс по п. 21, где первый белок ковалентно связан со вторым белком, где линкер выбран из пептидной связи, химического линкера или гликозидной связи.

25. Полинуклеотид, кодирующий слитый белок по любому из пп. 1-13.

26. Полинуклеотид по п. 25, кодирующий слитый белок по п. 12.

27. Экспрессирующий вектор, содержащий полинуклеотид по п. 25 или 26, где остов вектора, предпочтительно, выбран из pCDNA3, pCDNA3.1, pCDNA4, pCDNA5, pCDNA6, pCEP4, pCEP-puro, pCET1019, pCMV, pEF1, pEF4, pEF5, pEF6, pExchange, pEXPR, pIRES и pSCAS.

28. Клетка-хозяин для получения слитого белка по любому из пп. 1-13, содержащая полинуклеотид по п. 25 или 26 или вектор по п. 27, где клетка-хозяин является клеткой линии клеток млекопитающего, предпочтительно - линии клеток человека, более предпочтительно - линии клеток почки человека, наиболее предпочтительно - линии эмбриональных клеток почки человека, в частности линии клеток HEK293, такой как HEK293F, где указанная клетка не является клеткой, полученной путем разрушения эмбриона человека.

29. Применение слитого белка по любому из пп. 1-13 для повышения времени полужизни второго белка, где слитый белок способен связываться с указанным вторым белком.

30. Применение фармацевтической композиции, содержащей слитый белок по любому из пп. 1-13, композиции по любому из пп. 14-20 или комплекса по любому из пп. 21-24 для лечения или профилактики нарушения свертываемости, предпочтительно, выбранного из лечения пациентов, ранее не подвергнутых лечению (PUP), и лечения с индукцией иммунологической толерантности (ITI) и/или родственных нарушений свертываемости.

31. Применение по п. 30, где применение включает внутривенную или невнутривенную инъекцию, предпочтительно подкожную инъекцию.