RU2819144C2

RU2819144C2 - Молекулы нуклеиновой кислоты и пути их применения

Info

Publication number: RU2819144C2
Application number: RU2020109872A
Authority: RU
Inventors: Алексей СЕРЕГИН; Туняо Лю; Сюзанна ПАТАРРОЙО-УАЙТ; Дуглас ДРАГЕР; Роберт Т. Питерс; Цзяюнь ЛЮ
Original assignee: Байоверетив Терапьютикс Инк.
Priority date: 2017-08-09
Filing date: 2018-08-09
Publication date: 2024-05-14

Abstract

Изобретение относится к области биотехнологии. Описана группа изобретений, включающая молекулу нуклеиновой кислоты для экспрессии терапевтического белка у субъекта, фармацевтическую композицию для лечения заболевания, дефицита, нарушения или состояния, связанного с фактором коагуляции, и способ обеспечения экспрессии фактора свертывания крови у пациента. В одном из вариантов реализации молекула нуклеиновой кислоты содержит в направлении от 5' к 3': первый ITR, генную кассету, содержащую нуклеотид, кодирующий терапевтический белок, и второй ITR. Изобретение расширяет арсенал средств для экспрессии фактора свертывания крови у пациента. 3 н. и 15 з.п. ф-лы, 4 ил., 9 табл., 7 пр.

Description

ССЫЛКА НА ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ, ПОДАННЫЙ В ЭЛЕКТРОННОМ ВИДЕ

[1] Содержание перечня последовательностей, предоставленного в электронном виде в виде текстового файла в формате ASCII (название: 4159_493PC01_ST25; размер: 434561 байт и дата создания: 9 августа 2018 г.), включено в данный документ посредством ссылки во всей своей полноте.

ПРЕДПОСЫЛКИ К СОЗДАНИЮ ИЗОБРЕТЕНИЯ

[2] Генная терапия предоставляет характеризующиеся длительным действием средства лечения ряда различных заболеваний. В прежнее время генная терапия, как правило, основывалась на применении вирусов. Имеется множество вирусных средств, которые могут быть выбраны для данной цели, каждое из которых характеризуется отличающимися свойствами, которые будут делать их более или менее подходящими для генной терапии. Zhou et al., Adv Drug Deliv Rev. 106(Pt A):3-26, 2016. Однако нежелательные свойства некоторых вирусных векторов, в том числе их иммуногенные профили или их склонность вызывать рак, привели к появлению опасений в отношении клинической безопасности и до недавнего времени ограничивали их текущее применение в клинической практике определенными областями применения, например связанными с вакцинами и онколитическими стратегиями. Cotter et al., Front Biosci. 10:1098-105 (2005).

[3] Аденоассоциированный вирус (AAV) является одним из наиболее широко исследуемых генотерапевтических векторов. AAV представляет собой белковую оболочку, окружающую и защищающую геном на основе небольшой однонитевой ДНК, составляющей примерно 4,8 тысяч пар нуклеотидов (т. п. н.). Naso et al., BioDrugs, 31(4): 317-334, 2017. AAV принадлежит к семейству парвовирусов и для осуществления своей репликации полагается на коинфекцию другими вирусами, главным образом аденовирусами. Id. Его однонитевой геном содержит три гена: Rep (репликация), Cap (капсид) и aap (сборка). Id. Данные кодирующие последовательности фланкированы инвертированными концевыми повторами (ITR), которые необходимы для репликации и упаковки генома. Id. Оба цис-действующих ITR AAV характеризуются длиной, составляющей примерно 145 нуклеотидов, с наличием прерывающихся палиндромных последовательностей, которые могут сворачиваться в Т-образные шпилечные структуры, которые функционируют в качестве праймеров в ходе инициации репликации ДНК.

[4] Однако применение стандартного AAV в качестве вектора доставки генов привело к некоторым недостаткам. Один из основных недостатков связан с ограниченной пакующей способностью вируса AAV, составляющей приблизительно 4,5 т. п. н. гетерологичной ДНК. (Dong et al., Hum Gene Ther. 7(17): 2101-12, 1996). Кроме того, введение векторов на основе AAV может индуцировать иммунный ответ у людей. Хотя было показано, что AAV характеризуется меньшей степенью иммуногенности, чем некоторые другие вирусы (т. е. аденовирус), капсидные белки могут активировать различные компоненты иммунной системы человека. См. Naso et al., 2017. AAV является распространенным вирусом в человеческой популяции, и большинство людей подвергалось воздействию AAV, соответственно у большинства людей уже развился иммунный ответ в отношении конкретных вариантов, воздействию которых они подвергались ранее. Данный предсуществующий адаптивный ответ может включать NAb и T-клетки, которые могут снижать клиническую эффективность последующих повторных инфекций, вызванных AAV, и/или уничтожение клеток, которые были подвергнуты трансдукции, что делает пациентов с предсуществующим иммунитетом в отношении AAV неподходящими для лечения с применением генной терапии на основе AVV. Независимо от того, вводят его местно или системно, вирус будет рассматриваться как чужеродный белок, в связи с чем адаптивная иммунная система будет производить попытки к его устранению. Кроме того, нейтрализующее антитело к AAV, индуцированное введением AAV, препятствует проведению многократных процедур лечения с помощью AAV в случае, когда терапевтический уровень эффективности не был достигнут при первой процедуре лечения с помощью AAV. Кроме того, имеются данные, свидетельствующие о том, что T-образные шпилечные петли ITR AAV подвержены подавлению белками/белковыми комплексами клетки-хозяина, которые связывают T-образные шпилечные структуры ITR AAV. См., например, Zhou et al., Scientific Reports 7:5432 (July 14, 2017).

[5] Таким образом, в данной области техники существует потребность в эффективной и устойчивой экспрессии целевых последовательностей, например, терапевтических белков и/или miRNA, в условиях in vitro и in vivo, избегая при этом некоторых из нежелательных последствий и ограничений, присущих существующей технологии векторов на основе AAV.

КРАТКОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ

[6] В одном аспекте настоящее изобретение направлено на молекулу нуклеиновой кислоты, содержащую первый инвертированный концевой повтор (ITR), второй ITR и генную кассету, кодирующую терапевтический белок; где первый ITR и/или второй ITR представляют собой ITR вируса, отличного от аденоассоциированного вируса (вируса, отличного от AAV), при этом генная кассета расположена между первым ITR и вторым ITR, и где терапевтический белок предусматривает фактор свертывания крови. В некоторых вариантах осуществления вирус, отличный от AAV, выбран из группы, состоящей из представителей семейства вирусов Parvoviridae и любой их комбинации. В некоторых вариантах осуществления первый ITR представляет собой ITR вируса, отличного от AAV, и второй ITR представляет собой ITR аденоассоциированного вируса (AAV), или где первый ITR представляет собой ITR AAV, и второй ITR представляет собой ITR вируса, отличного от AAV. В других вариантах осуществления первый ITR и второй ITR представляют собой ITR вируса, отличного от AAV. В некоторых вариантах осуществления первый ITR и второй ITR являются идентичными. В некоторых вариантах осуществления первый ITR и/или второй ITR содержат палиндромную последовательность, которая является непрерывной. В других вариантах осуществления первый ITR и/или второй ITR содержат палиндромную последовательность, которая является прерывистой.

[7] В некоторых вариантах осуществления вирус, отличный от AAV, в молекуле нуклеиновой кислоты является представителем семейства вирусов Parvoviridae. В некоторых вариантах осуществления представитель семейства вирусов Parvoviridae выбран из группы, состоящей из Bocavirus, Dependovirus, Erythrovirus, Amdovirus, Parvovirus, Densovirus, Iteravirus, Contravirus, Aveparvovirus, Copiparvovirus, Protoparvovirus, Tetraparvovirus, Ambidensovirus, Brevidensovirus, Hepandensovirus, Penstyldensovirus и любой их комбинации. В некоторых вариантах осуществления представителем семейства вирусов Parvoviridae является эритровирус, представляющий собой парвовирус B19 (вирус человека). В некоторых вариантах осуществления представитель семейства вирусов Parvoviridae представляет собой штамм парвовируса мускусных уток (MDPV). В некоторых вариантах осуществления штамм MDPV представляет собой аттенуированный штамм FZ91-30. В некоторых вариантах осуществления штамм MDPV представляет собой патогенный штамм YY. Еще в некоторых вариантах осуществления представителем рода Dependoparvovirus является представитель Dependovirus, представляющий собой штамм парвовируса гусей (GPV). В некоторых вариантах осуществления штамм GPV представляет собой аттенуированный штамм 82-0321V. В некоторых вариантах осуществления штамм GPV представляет собой патогенный штамм B. В некоторых вариантах осуществления представитель семейства вирусов Parvoviridae выбран из группы, состоящей из парвовируса свиней (U44978), мелкого вируса мышей (U34256), собачьего парвовируса (M19296), вируса энтерита норок (D00765) и любой их комбинации.

[8] В некоторых вариантах осуществления молекула нуклеиновой кислоты дополнительно содержит промотор. В некоторых вариантах осуществления промотор представляет собой тканеспецифический промотор. В некоторых вариантах осуществления промотор управляет экспрессией терапевтического белка в гепатоцитах, эндотелиальных клетках, мышечных клетках, синусоидальных клетках или любой их комбинации. В некоторых вариантах осуществления промотор расположен в направлении 5' относительно последовательности нуклеиновой кислоты, кодирующей фактор свертывания крови. В некоторых вариантах осуществления промотор выбран из группы, состоящей из промотора тиретина мыши (mTTR), эндогенного промотора фактора VIII человека (F8), промотора альфа-1-антитрипсина человека (hAAT), минимального промотора альбумина человека, промотора альбумина мыши, промотора тристетрапролина (TTP), промотора CASI, промотора CAG, промотора цитомегаловируса (CMV), промотора α1-антитрипсина (AAT), мышечной креатинкиназы (MCK), тяжелой цепи миозина альфа (αMHC), миоглобина (MB), десмина (DES), SPc5-12, 2R5Sc5-12, dMCK, tMCK, фосфоглицераткиназы (PGK) и любой их комбинации. В некоторых вариантах осуществления промотор предусматривает промотор TTP.

[9] В некоторых вариантах осуществления молекула нуклеиновой кислоты дополнительно содержит интронную последовательность. В некоторых вариантах осуществления интронная последовательность расположен в направлении 5' относительно последовательности нуклеиновой кислоты, кодирующей фактор свертывания крови. В некоторых вариантах осуществления интронная последовательность расположена в направлении 3' относительно промотора. В некоторых вариантах осуществления при этом интронная последовательность предусматривает синтетическую интронную последовательность. В некоторых вариантах осуществления интронная последовательность содержит SEQ ID NO: 115.

[10] В некоторых вариантах осуществления молекула нуклеиновой кислоты содержит посттранскрипционный регуляторный элемент. В некоторых вариантах осуществления посттранскрипционный регуляторный элемент расположен в направлении 3' относительно последовательности нуклеиновой кислоты, кодирующей фактор свертывания крови. В некоторых вариантах осуществления посттранскрипционный регуляторный элемент предусматривает мутантный посттранскрипционный регуляторный элемент вируса гепатита сурков (WPRE), сайт связывания microRNA, последовательность, направляющую ДНК к ядру, или любую их комбинации. В некоторых вариантах осуществления сайт связывания microRNA предусматривает сайт связывания с miR142-3p.

[11] В некоторых вариантах осуществления молекула нуклеиновой кислоты содержит последовательность poly(А)-хвоста 3'-UTR. В некоторых вариантах осуществления последовательность poly(А)-хвоста 3'-UTR выбрана из группы, состоящей из poly(A) bGH, poly(A) актина, poly(A) гемоглобина и любой их комбинации. В некоторых вариантах осуществления последовательность poly(А)-хвоста 3'-UTR предусматривает poly(A) bGH.

[12] В некоторых вариантах осуществления молекула нуклеиновой кислоты содержит энхансерную последовательность. В некоторых вариантах осуществления энхансерная последовательность расположена между первым ITR и вторым ITR.

[13] В некоторых вариантах осуществления молекула нуклеиновой кислоты содержит в следующем порядке: первый ITR, генную кассету и второй ITR; где генная кассета содержит последовательность тканеспецифического промотора, интронную последовательность, последовательность нуклеиновой кислоты, кодирующей терапевтический белок, например фактор свертывания крови, или miRNA, посттранскрипционный регуляторный элемент и последовательность poly(А)-хвоста 3'-UTR.

[14] В некоторых вариантах осуществления молекула нуклеиновой кислоты содержит в следующем порядке: последовательность тканеспецифического промотора, интронную последовательность, последовательность нуклеиновой кислоты, кодирующей полипептид FVIII, посттранскрипционный регуляторный элемент и последовательность poly(А)-хвоста 3'-UTR.

[15] В одном варианте осуществления молекула нуклеиновой кислоты содержит

(a) первый ITR, представляющий собой ITR вируса, отличного от AAV, являющегося представителем семейства Parvoviridae;

(b) последовательность тканеспецифического промотора, например промотора TTP;

(c) интрон, например синтетический интрон;

(d) нуклеотидную последовательность, кодирующую терапевтический белок, например фактор свертывания крови, или miRNA;

(e) посттранскрипционный регуляторный элемент, например WPRE;

(f) последовательность poly(А)-хвоста 3'-UTR, например bGHpA; и

(g) второй ITR, представляющий собой ITR вируса, отличного от AAV, являющегося представителем семейства Parvoviridae.

[16] В некоторых вариантах осуществления молекула нуклеиновой кислоты предусматривает однонитевую нуклеиновую кислоту. В некоторых вариантах осуществления генная кассета предусматривает двухнитевую нуклеиновую кислоту.

[17] В некоторых вариантах осуществления молекула нуклеиновой кислоты содержит ген, кодирующий терапевтический белок, например фактор свертывания крови, где фактор свертывания крови экспрессируется гепатоцитами, эндотелиальными клетками, мышечными клетками, синусоидальными клетками или любой их комбинацией. В некоторых вариантах осуществления фактор свертывания крови включает фактор I (FI), фактор II (FII), фактор V (FV), фактор VII (FVII), фактор VIII (FVIII), фактор IX (FIX), фактор X (FX), фактор XI (FXI), фактор XII (FXII), фактор XIII (FVIII), фактор фон Виллебранда (VWF), прекалликреин, высокомолекулярный кининоген, фибронектин, антитромбин III, кофактор гепарина II, белок C, белок S, белок Z, ингибитор белок Z-подобной протеазы (ZPI), плазминоген, альфа-2-антиплазмин, тканевой активатор плазминогена (tPA), урокиназу, ингибитор активатора плазминогена 1 (PAI-1), ингибитор активатора плазминогена 2 (PAI2) или любую их комбинацию. В некоторых вариантах осуществления фактор свертывания крови представляет собой FVIII. В некоторых вариантах осуществления FVIII предусматривает полноразмерный зрелый FVIII. В некоторых вариантах осуществления FVIII содержит аминокислотную последовательность, которая на по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична аминокислотной последовательности под SEQ ID NO: 106. В некоторых вариантах осуществления FVIII содержит домен A1, домен A2, домен A3, домен C1, домен C2 и частичный домен B или вообще не содержит его. В некоторых вариантах осуществления FVIII содержит аминокислотную последовательность, которая на по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична аминокислотной последовательности под SEQ ID NO:109.

[18] В некоторых вариантах осуществления фактор свертывания крови содержит гетерологичный компонент. В некоторых вариантах осуществления гетерологичный компонент выбран из группы, состоящей из альбумина или его фрагмента, Fc-области иммуноглобулина, C-концевого пептида (CTP) β-субъединицы хорионического гонадотропина человека, последовательности PAS, последовательности HAP, трансферрина или его фрагмента, альбумин-связывающего компонента, их производного и любой их комбинации. В некоторых вариантах осуществления гетерологичный компонент связан с N-концом или C-концом FVIII или вставлен между двумя аминокислотами в FVIII. В некоторых вариантах осуществления гетерологичный компонент вставлен между двумя аминокислотами в одном или нескольких сайтах вставки, выбранных из сайтов вставки, перечисленных в таблице 5. В некоторых вариантах осуществления FVIII дополнительно содержит домен A1, домен A2, домен C1, домен C2, необязательный домен B и гетерологичный компонент, где гетерологичный компонент вставлен непосредственно ниже аминокислоты 745, соответствуя зрелому FVIII (SEQ ID NO: 106).

[19] В некоторых вариантах осуществления FVIII дополнительно содержит партнера по связыванию FcRn. В некоторых вариантах осуществления партнер по связыванию FcRn предусматривает Fc-область константного домена иммуноглобулина. В некоторых вариантах осуществления последовательность нуклеиновой кислоты, кодирующая FVIII, является кодон-оптимизированной. В некоторых вариантах осуществления последовательность нуклеиновой кислоты, кодирующая FVIII, является кодон-оптимизированной для экспрессии у человека.

[20] В некоторых вариантах осуществления последовательность нуклеиновой кислоты, кодирующая FVIII, предусматривает нуклеотидную последовательность, которая на по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или приблизительно 100% идентична нуклеотидной последовательности под SEQ ID NO: 107. В некоторых вариантах осуществления последовательность нуклеиновой кислоты, кодирующая FVIII, предусматривает нуклеотидную последовательность, которая на по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или приблизительно 100% идентична нуклеотидной последовательности под SEQ ID NO: 71.

[21] В некоторых вариантах осуществления молекула нуклеиновой кислоты составлена со средством доставки. В некоторых вариантах осуществления средство доставки предусматривает одну или несколько липидных наночастиц. В некоторых вариантах осуществления средство доставки выбрано из группы, состоящей из липосом, нелипидных полимерных молекул, эндосом и любой их комбинации.

[22] В некоторых вариантах осуществления молекула нуклеиновой кислоты составлена для внутривенной, трансдермальной, внутрикожной, подкожной, пульмональной или пероральной доставки или любой их комбинации. В некоторых вариантах осуществления молекула нуклеиновой кислоты составлена для внутривенной доставки.

[23] В некоторых вариантах осуществления в данном документе представлен вектор, содержащий молекулу нуклеиновой кислоты, как описано в тексте настоящего раскрытия. В некоторых вариантах осуществления в данном документе представлен полипептид, кодируемый молекулой нуклеиновой кислоты, как описано в тексте настоящего раскрытия. В некоторых вариантах осуществления в данном документе представлена клетка-хозяин, содержащая молекулу нуклеиновой кислоты, как описано в тексте настоящего раскрытия.

[24] В некоторых вариантах осуществления в данном документе представлена фармацевтическая композиция, содержащая (a) нуклеиновую кислоту, как описано в данном документе, вектор, содержащий молекулу нуклеиновой кислоты, как описано в тексте настоящего раскрытия, полипептид, кодируемый молекулой нуклеиновой кислоты, как описано в тексте настоящего раскрытия, или клетку-хозяина, содержащую молекулу нуклеиновой кислоты, как описано в тексте настоящего раскрытия; (b) LNP и (c) фармацевтически приемлемое вспомогательное вещество. В некоторых вариантах осуществления в данном документе представлен набор, содержащий молекулу нуклеиновой кислоты, как описано в тексте настоящего раскрытия, и инструкции по введению молекулы нуклеиновой кислоты нуждающемуся в этом субъекту. В некоторых вариантах осуществления в данном документе представлена бакуловирусная система получения молекулы нуклеиновой кислоты, описанной в данном документе. В некоторых вариантах осуществления в данном документе представлена бакуловирусная система, где молекулу нуклеиновой кислоты, раскрытую в данном документе, получают в клетках насекомого.

[25] В некоторых вариантах осуществления в данном документе представлена система доставки на основе наночастиц для экспрессионных конструкций, где экспрессионная конструкция содержит молекулу нуклеиновой кислоты, описанную в данном документе.

[26] Также в данном документе раскрыт способ получения полипептида со свертывающей активностью, включающий культивирование клетки-хозяина, раскрытой в данном документе, в подходящих условиях и извлечение полипептида со свертывающей активностью. В некоторых вариантах осуществления в данном документе раскрыт способ обеспечения экспрессии фактора свертывания крови у нуждающегося в этом субъекта, включающий введение субъекту молекулы нуклеиновой кислоты, раскрытой в данном документе, вектора, раскрытого в данном документе, полипептида, раскрытого в данном документе, или фармацевтической композиции, раскрытой в данном документе. В некоторых вариантах осуществления в данном документе раскрыт способ лечения субъекта, имеющего дефицит фактора свертывания крови, включающий введение субъекту молекулы нуклеиновой кислоты, раскрытой в данном документе, вектора, раскрытого в данном документе, полипептида, раскрытого в данном документе, или фармацевтической композиции, раскрытой в данном документе. В некоторых вариантах осуществления молекула нуклеиновой кислоты вводится внутривенно, трансдермально, внутрикожно, подкожно, перорально, пульмонально или любой их комбинацией. В некоторых вариантах осуществления молекула нуклеиновой кислоты вводится внутривенно. В некоторых вариантах осуществления способ дополнительно включает введение субъекту второго средства. В некоторых вариантах осуществления субъектом является млекопитающее. В некоторых вариантах осуществления субъект представляет собой человека.

[27] В некоторых вариантах осуществления введение молекулы нуклеиновой кислоты субъекту приводит к увеличению активности FVIII относительно активности FVIII у субъекта до введения, где активность FVIII увеличивается в по меньшей мере приблизительно 2 раза, по меньшей мере приблизительно 3 раза, по меньшей мере приблизительно 4 раза, по меньшей мере приблизительно 5 раз, по меньшей мере приблизительно 6 раз, по меньшей мере приблизительно 7 раз, по меньшей мере приблизительно 8 раз, по меньшей мере приблизительно 9 раз, по меньшей мере приблизительно 10 раз, по меньшей мере приблизительно 11 раз, по меньшей мере приблизительно 12 раз, по меньшей мере приблизительно 13 раз, по меньшей мере приблизительно 14 раз, по меньшей мере приблизительно 15 раз, по меньшей мере приблизительно 20 раз, по меньшей мере приблизительно 25 раз, по меньшей мере приблизительно 30 раз, по меньшей мере приблизительно 35 раз, по меньшей мере приблизительно 40 раз, по меньшей мере приблизительно 50 раз, по меньшей мере приблизительно 60 раз, по меньшей мере приблизительно 70 раз, по меньшей мере приблизительно 80 раз, по меньшей мере приблизительно 90 раз или по меньшей мере приблизительно 100 раз.

[28] В некоторых вариантах осуществления у субъекта имеется нарушение свертываемости крови. В некоторых вариантах осуществления нарушение свертываемости крови представляет собой гемофилию. В некоторых вариантах осуществления нарушение свертываемости крови представляет собой гемофилию A.

КРАТКОЕ ОПИСАНИЕ ГРАФИЧЕСКИХ МАТЕРИАЛОВ

[29] На фиг. 1A показано схематическое представление однонитевой кассеты экспрессии фактора свертывания крови (например, FVIII). Показаны местоположения 5'-ITR от вируса, отличного от AAV (со шпилечной петлей на конце ssDNA-структуры), 3'-ITR от вируса, отличного от AAV (со шпилечной петлей), последовательности промотора (например, TTPp) и последовательности трансгена, например последовательности FVIIIco6XTEN с XTEN144, вставленным в пределах домена B. В иллюстративной кассете экспрессии также показаны дополнительные возможные элементы, например последовательность интрона, последовательность WPREmut и последовательность bGHpA.

[30] На фиг. 1B-1D показаны схематические представления плазмид, применяемых для получения однонитевых кассет экспрессии фактора свертывания крови, таких как кассета, показанная на фиг. 1A, где ITR кассеты получены от AAV2 (фиг. 1B), B19 (фиг. 1C) или GPV (фиг. 1D). Плазмидная конструкция, содержащая кассету экспрессии ssFVIII, как показано в данном документе, подвергалась расщеплению посредством PvuII (в сайтах PvuII) (фиг. 1B) или LguI (в сайтах LguI) (фиг. 1C и 1D) с высвобождением вирусного генома. Двухнитевую ДНК нагревали до 95^oC с получением ssDNA, а затем инкубировали при 4°C для обеспечения образования структуры, образуемой ITR.

[31] На фиг. 2A показано филогенетическое древо, иллюстрирующее взаимосвязь между различными представителями семейства парвовирусов. B19, AAV-2 и GPV обозначены посредством очерченных рамок.

[32] На фиг. 2B показано схематическое изображение различных кассет, включая шпилечные структуры.

[33] На фиг. 3A и 3B показаны выравнивания для ITR B19, GPV и AAV2 (фиг. 3A) и B19 и GPV (фиг. 3B). Области, выделенные серым, показывают гомологию.

[34] На фиг. 4A-4C показана активность FVIII в плазме крови после введения однонитевой "оголенной" ДНК FVIII-AAV (ssAAV-FVIII; фиг. 2A), ssDNA-B19 FVIII (фиг. 2B) или ssDNA-GPV FVIII (фиг. 2C) посредством гидродинамической инъекции (HDI) у мышей Hem A. Измеряли активность FVIII (как процентную долю относительно контроля) в образцах плазмы крови через 24 часа, 3 дня, 2 недели, 3 недели, 1 месяц, 2 месяца, 3 месяца и 4 месяца у мышей, обработанных посредством одной HDI ssDNA в количестве 50 мкг/мышь (фиг. 2C), 20 мкг/мышь (фиг. 2A и 2B), 10 мкг/мышь (фиг. 2A и 2C) или 5 мкг/мышь (фиг. 2A). HDI 5 мкг/мышь плазмидной ДНК осуществляли в качестве контроля (фиг. 2A-2C).

ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ

[35] В настоящем изобретении описываются плазмидоподобные молекулы нуклеиновой кислоты, содержащие первый инвертированный концевой повтор (ITR), второй ITR и генную кассету, например, кодирующую терапевтический белок или miRNA, где первый ITR и/или второй ITR представляют собой ITR вируса, отличного от аденоассоциированного вируса (например, первый ITR и/или второй ITR получены от вируса, отличного от AAV). В некоторых вариантах осуществления генная кассета кодирует терапевтический белок. В некоторых вариантах осуществления терапевтический белок предусматривает белок, выбранный из фактора свертывания крови, фактора роста, гормона, цитокина, антитела, их фрагмента или их комбинации. В некоторых вариантах осуществления генная кассета кодирует X-сцепленный дистрофин, MTM1 (миотубуларин), тирозингидроксилазу, AADC, циклогидролазу, SMN1, FXN (фратаксин), GUCY2D, RS1, CFH, HTRA, ARMS, CFB/CC2, CNGA/CNGB, Prf65, ARSA, PSAP, IDUA (MPS I), IDS (MPS II), PAH, GAA (кислую альфа-глюкозидазу) или любую их комбинацию.

[36] В некоторых вариантах осуществления терапевтический белок предусматривает фактор свертывания крови. В одном конкретном варианте осуществления терапевтический белок предусматривает белок FVIII или FIX.

[37] В некоторых вариантах осуществления генная кассета кодирует miRNA. В некоторых вариантах осуществления miRNA понижает экспрессию целевого гена, выбранного из SOD1, HTT, RHO или любой их комбинации.

[38] В определенных вариантах осуществления вирус, отличный от AAV, выбран из группы, состоящей из представителей семейства вирусов Parvoviridae и любой их комбинации. Настоящее изобретение дополнительно направлено на способы обеспечения экспрессии терапевтического белка, например фактора свертывания крови, например FVIII, у нуждающегося в этом субъекта, включающие введение субъекту молекулы нуклеиновой кислоты, содержащей первый инвертированный концевой повтор (ITR), второй ITR и генную кассету, например, кодирующую терапевтический белок или miRNA, где первый ITR и/или второй ITR представляют собой ITR вируса, отличного от аденоассоциированного вируса (вируса, отличного от AAV). В некоторых вариантах осуществления в настоящем изобретении описывается выделенная молекула нуклеиновой кислоты, содержащая нуклеотидную последовательность, которая характеризуется гомологией последовательностей с нуклеотидной последовательностью, выбранной из SEQ ID NO: 113 и 120.

[39] Иллюстративные конструкции согласно настоящему изобретению проиллюстрированы в прилагаемых фигурах и перечне последовательностей. В целях обеспечения четкого понимания описания и формулы изобретения следующие определения представлены ниже.

I. Определения

[40] Следует отметить, что форма единственного числа объекта относится к одному или нескольким таким объектам; например, под "нуклеотидной последовательностью" понимают одну или несколько нуклеотидных последовательностей. Аналогичным образом, под "терапевтическим белком" и "miRNA" понимают один или несколько терапевтических белков и одну или несколько miRNA соответственно. В связи с этим формы единственного числа, термины "один или несколько" и "по меньшей мере один" могут использоваться в данном документе взаимозаменяемо.

[41] Термин "приблизительно" используется в данном документе в значении примерно, порядка, около или ориентировочно. Если термин "приблизительно" используется в сочетании с числовым диапазоном, то он модифицирует данный диапазон, расширяя границы выше и ниже изложенных числовых значений. В целом, термин "приблизительно" применяют в данном документе для модификации числового значения выше и ниже заявленного значения с отклонением на 10 процентов, вверх или вниз (выше или ниже).

[42] Также используемый в данном документе "и/или" относится к и охватывает любые и все возможные комбинации одного или нескольких соответствующих перечисленных объектов, а также отсутствие комбинаций в случае интерпретации как альтернативы ("или").

[43] "Нуклеиновые кислоты", "молекулы нуклеиновой кислоты", "нуклеотиды", "нуклеотидная(-ые) последовательность(-и)" и "полинуклеотид" применяются взаимозаменяемо и относятся к полимерной форме сложных фосфатных эфиров рибонуклеозидов (аденозина, гуанозина, уридина или цитидина; "молекулам РНК") или дезоксирибонуклеозидов (дезоксиаденозина, дезоксигуанозина, дезокситимидина или дезоксицитидина; "молекулам ДНК") или любым сложным фосфатным эфирам их аналогов, как например фосфоротиоаты и сложные тиоэфиры, находящимся либо в однонитевой форме, либо в виде двухнитевой спирали. Последовательности однонитевой нуклеиновой кислоты относятся к однонитевой ДНК (ssDNA) или однонитевой РНК (ssRNA). Возможны двухнитевые спирали ДНК-ДНК, ДНК-РНК и РНК-РНК. Термин молекула нуклеиновой кислоты, и в частности молекула ДНК или РНК, относится только к первичной и вторичной структуре молекулы и не ограничивает ее какими-либо конкретными третичными формами. Таким образом, данный термин включает двухнитевую ДНК, обнаруживаемую, среди прочего, в линейных или кольцевых молекулах ДНК (например, фрагментах рестрикции), плазмидах, сверхспиральной ДНК и хромосомах. В рамках обсуждения структуры конкретной двухнитевой молекулы ДНК последовательности могут описываться в данном документе в соответствии с обычными правилами, предусматривающими приведение только последовательности в направлении 5'-3' вдоль нетранскрибируемый нити ДНК (т. е. нити, имеющей последовательность, гомологичную mRNA). "Рекомбинантная молекула ДНК" представляет собой молекулу ДНК, которая была подвергнута молекулярно-биологической манипуляции. ДНК включает без ограничения cDNA, геномную ДНК, плазмидную ДНК, синтетическую ДНК и полусинтетическую ДНК. "Композиция на основе нуклеиновой кислоты" согласно настоящему изобретению содержит одну или несколько нуклеиновых кислот, описанных в данном документе.

[44] Используемый в данном документе "инвертированный концевой повтор" (или "ITR") относится к подподпоследовательности нуклеиновой кислоты, расположенной на либо 5'-, либо 3'-конце последовательности однонитевой нуклеиновой кислоты, которая содержит набор нуклеотидов (исходную последовательность), ниже которой следует обратный комплемент, т. е. палиндромная последовательность. Промежуточная последовательность нуклеотидов между исходной последовательностью и обратным комплементом может характеризоваться любой длиной, в том числе нулевой. В одном варианте осуществления ITR, пригодный в настоящем изобретении, содержит одну или несколько "палиндромных последовательностей". ITR может выполнять любое количество функций. В некоторых вариантах осуществления ITR, описанный в данном документе, образует шпилечную структуру. В некоторых вариантах осуществления ITR образует T-образную шпилечная структура. В некоторых вариантах осуществления ITR образует отличную от T-образной шпилечную структуру, например U-образную шпилечную структуру. В некоторых вариантах осуществления ITR способствует долговременному сохранению молекулы нуклеиновой кислоты в ядре клетки. В некоторых вариантах осуществления ITR способствует постоянному сохранению молекулы нуклеиновой кислоты в ядре клетки (например, в течение всей продолжительности жизни клетки). В некоторых вариантах осуществления ITR способствует стабильности молекулы нуклеиновой кислоты в ядре клетки. В некоторых вариантах осуществления ITR способствует удерживанию молекулы нуклеиновой кислоты в ядре клетки. В некоторых вариантах осуществления ITR способствует непрерывности нахождения молекулы нуклеиновой кислоты в ядре клетки. В некоторых вариантах осуществления ITR подавляет или предупреждает разрушение молекулы нуклеиновой кислоты в ядре клетки.

[45] В одном варианте осуществления исходная последовательность и/или обратный комплемент содержат приблизительно 2-600 нуклеотидов, приблизительно 2-550 нуклеотидов, приблизительно 2-500 нуклеотидов, приблизительно 2-450 нуклеотидов, приблизительно 2-400 нуклеотидов, приблизительно 2-350 нуклеотидов, приблизительно 2-300 нуклеотидов или приблизительно 2-250 нуклеотидов. В некоторых вариантах осуществления исходная последовательность и/или обратный комплемент содержат приблизительно 5-600 нуклеотидов, приблизительно 10-600 нуклеотидов, приблизительно 15-600 нуклеотидов, приблизительно 20-600 нуклеотидов, приблизительно 25-600 нуклеотидов, приблизительно 30-600 нуклеотидов, приблизительно 35-600 нуклеотидов, приблизительно 40-600 нуклеотидов, приблизительно 45-600 нуклеотидов, приблизительно 50-600 нуклеотидов, приблизительно 60-600 нуклеотидов, приблизительно 70-600 нуклеотидов, приблизительно 80-600 нуклеотидов, приблизительно 90-600 нуклеотидов, приблизительно 100-600 нуклеотидов, приблизительно 150-600 нуклеотидов, приблизительно 200-600 нуклеотидов, приблизительно 300-600 нуклеотидов, приблизительно 350-600 нуклеотидов, приблизительно 400-600 нуклеотидов, приблизительно 450-600 нуклеотидов, приблизительно 500-600 нуклеотидов или приблизительно 550-600 нуклеотидов. В некоторых вариантах осуществления исходная последовательность и/или обратный комплемент содержат приблизительно 5-550 нуклеотидов, приблизительно 5-500 нуклеотидов, приблизительно 5-450 нуклеотидов, приблизительно 5-400 нуклеотидов, приблизительно 5-350 нуклеотидов, приблизительно 5-300 нуклеотидов или приблизительно 5-250 нуклеотидов. В некоторых вариантах осуществления исходная последовательность и/или обратный комплемент содержат приблизительно 10-550 нуклеотидов, приблизительно 15-500 нуклеотидов, приблизительно 20-450 нуклеотидов, приблизительно 25-400 нуклеотидов, приблизительно 30-350 нуклеотидов, приблизительно 35-300 нуклеотидов или приблизительно 40-250 нуклеотидов. В некоторых вариантах осуществления исходная последовательность и/или обратный комплемент содержат приблизительно 225 нуклеотидов, приблизительно 250 нуклеотидов, приблизительно 275 нуклеотидов, приблизительно 300 нуклеотидов, приблизительно 325 нуклеотидов, приблизительно 350 нуклеотидов, приблизительно 375 нуклеотидов, приблизительно 400 нуклеотидов, приблизительно 425 нуклеотидов, приблизительно 450 нуклеотидов, приблизительно 475 нуклеотидов, приблизительно 500 нуклеотидов, приблизительно 525 нуклеотидов, приблизительно 550 нуклеотидов, приблизительно 575 нуклеотидов или приблизительно 600 нуклеотидов. В конкретных вариантах осуществления исходная последовательность и/или обратный комплемент содержат приблизительно 400 нуклеотидов.

[46] В других вариантах осуществления исходная последовательность и/или обратный комплемент содержат приблизительно 2-200 нуклеотидов, приблизительно 5-200 нуклеотидов, приблизительно 10-200 нуклеотидов, приблизительно 20-200 нуклеотидов, приблизительно 30-200 нуклеотидов, приблизительно 40-200 нуклеотидов, приблизительно 50-200 нуклеотидов, приблизительно 60-200 нуклеотидов, приблизительно 70-200 нуклеотидов, приблизительно 80-200 нуклеотидов, приблизительно 90-200 нуклеотидов, приблизительно 100-200 нуклеотидов, приблизительно 125-200 нуклеотидов, приблизительно 150-200 нуклеотидов или приблизительно 175-200 нуклеотидов. В других вариантах осуществления исходная последовательность и/или обратный комплемент содержат приблизительно 2-150 нуклеотидов, приблизительно 5-150 нуклеотидов, приблизительно 10-150 нуклеотидов, приблизительно 20-150 нуклеотидов, приблизительно 30-150 нуклеотидов, приблизительно 40-150 нуклеотидов, приблизительно 50-150 нуклеотидов, приблизительно 75-150 нуклеотидов, приблизительно 100-150 нуклеотидов или приблизительно 125-150 нуклеотидов. В других вариантах осуществления исходная последовательность и/или обратный комплемент содержат приблизительно 2-100 нуклеотидов, приблизительно 5-100 нуклеотидов, приблизительно 10-100 нуклеотидов, приблизительно 20-100 нуклеотидов, приблизительно 30-100 нуклеотидов, приблизительно 40-100 нуклеотидов, приблизительно 50-100 нуклеотидов или приблизительно 75-100 нуклеотидов. В других вариантах осуществления исходная последовательность и/или обратный комплемент содержат приблизительно 2-50 нуклеотидов, приблизительно 10-50 нуклеотидов, приблизительно 20-50 нуклеотидов, приблизительно 30-50 нуклеотидов, приблизительно 40-50 нуклеотидов, приблизительно 3-30 нуклеотидов, приблизительно 4-20 нуклеотидов или приблизительно 5-10 нуклеотидов. В другом варианте осуществления исходная последовательность и/или обратный комплемент состоят из двух нуклеотидов, трех нуклеотидов, четырех нуклеотидов, пяти нуклеотидов, шести нуклеотидов, семи нуклеотидов, восьми нуклеотидов, девяти нуклеотидов, десяти нуклеотидов, 11 нуклеотидов, 12 нуклеотидов, 13 нуклеотидов, 14 нуклеотидов, 15 нуклеотидов, 16 нуклеотидов, 17 нуклеотидов, 18 нуклеотидов, 19 нуклеотидов или 20 нуклеотидов. В других вариантах осуществления промежуточный нуклеотид между исходной последовательностью и обратным комплементом предусматривает (например, состоит из) 0 нуклеотидов, 1 нуклеотид, два нуклеотида, три нуклеотида, четыре нуклеотида, пять нуклеотидов, шесть нуклеотидов, семь нуклеотидов, восемь нуклеотидов, девять нуклеотидов, 10 нуклеотидов, 11 нуклеотидов, 12 нуклеотидов, 13 нуклеотидов, 14 нуклеотидов, 15 нуклеотидов, 16 нуклеотидов, 17 нуклеотидов, 18 нуклеотидов, 19 нуклеотидов или 20 нуклеотидов.

[47] Следовательно, "ITR", используемый в данном документе, может заворачиваться на себя и образовывать двухнитевой сегмент. Например, последовательность GATCXXXXGATC содержит исходную последовательность GATC и ее комплемент (3'CTAG5') при сворачивании с образованием двойной спирали. В некоторых вариантах осуществления ITR содержит непрерывную палиндромную последовательность (например, GATCGATC) между исходной последовательностью и обратным комплементом. В некоторых вариантах осуществления ITR содержит прерывистую палиндромную последовательность (например, GATCXXXXGATC) между исходной последовательностью и обратным комплементом. В некоторых вариантах осуществления комплементарные участки непрерывной или прерывистой палиндромной последовательности взаимодействуют друг с другом с образованием структуры "шпилечной петли". Применяемая в данном документе структура "шпилечной петли" образуется, когда по меньшей мере две комплементарные последовательности в однонитевой нуклеотидной молекуле подвергаются спариванию оснований с образованием двухнитевого участка. В некоторых вариантах осуществления только часть ITR образует шпилечную петлю. В других вариантах осуществления весь ITR образует шпилечную петлю.

[48] В настоящем изобретении по меньшей мере один ITR представляет собой ITR вируса, отличного от аденоассоциированного вируса (вируса, отличного от AAV). В некоторых вариантах осуществления ITR представляет собой ITR вируса, отличного от AAV, являющегося представителем семейства вирусов Parvoviridae. В некоторых вариантах осуществления ITR представляет собой ITR вируса, отличного от AAV, являющегося представителем рода Dependovirus или рода Erythrovirus. В конкретных вариантах осуществления ITR представляет собой ITR парвовируса гусей (GPV), парвовируса мускусных уток (MDPV) или эритровируса, представляющего собой парвовирус B19 (также известного как парвовирус B19, эритропарвовирус приматов 1, вирус B19 и эритровирус). В некоторых вариантах осуществления один ITR из двух ITR представляет собой ITR AAV. В других вариантах осуществления один ITR из двух ITR в конструкции представляет собой ITR AAV серотипа, выбранного из серотипа 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 и любой их комбинации. В одном конкретном варианте осуществления ITR получен из AAV серотипа 2, например ITR AAV серотипа 2.

[49] В определенных аспектах настоящего изобретения молекула нуклеиновой кислоты содержит два ITR, представляющие собой 5'-ITR и 3'-ITR, где 5'-ITR располагается на 5'-конце молекулы нуклеиновой кислоты, и 3'-ITR располагается на 3'-конце молекулы нуклеиновой кислоты. 5'-ITR и 3'-ITR могут быть получены из одного и того же вируса или различных вирусов. В некоторых вариантах осуществления 5'-ITR получен из AAV и 3'-ITR не является полученным из вируса AAV (например, вируса, отличного от AAV). В некоторых вариантах осуществления 3'-ITR получен из AAV и 5'-ITR не является полученным из вируса AAV (например, вируса, отличного от AAV). В других вариантах осуществления 5'-ITR не является полученным из вируса AAV (например, вируса, отличного от AAV) и 3'-ITR получен из того же или другого вируса, отличного от вируса AAV.

[50] Термин "парвовирус", используемый в данном документе, охватывает семейство Parvoviridae, в том числе без ограничения автономно реплицирующиеся парвовирусы и депендовирусы. Автономные парвовирусы включают, например, представителей родов Bocavirus, Dependovirus, Erythrovirus, Amdovirus, Parvovirus, Densovirus, Iteravirus, Contravirus, Aveparvovirus, Copiparvovirus, Protoparvovirus, Tetraparvovirus, Ambidensovirus, Brevidensovirus, Hepandensovirus, и Penstyldensovirus.

[51] Иллюстративные автономные парвовирусы включают без ограничения парвовирус свиней, мелкий вирус мышей, собачий парвовирус, вирус энтерита норок, парвовирус крупного рогатого скота, куриный парвовирус, вирус панлейкопении у кошек, кошачий парвовирус, парвовирус гусей, парвовирус H1, парвовирус мускусных уток, парвовирус змей и вирус B19. Другие автономные парвовирусы известны специалистам в данной области техники. См., например, FIELDS et al. VIROLOGY, volume 2, chapter 69 (4th ed., Lippincott-Raven Publishers).

[52] Термин "вирус, отличный от AAV", используемый в данном документе, охватывает нуклеиновые кислоты, белки и вирусы семейства Parvoviridae, за исключением любых аденоассоциированных вирусов (AAV) семейства Parvoviridae. "Вирус, отличный от AAV", включает без ограничения автономно реплицирующихся представителей родов Bocavirus, Dependovirus, Erythrovirus, Amdovirus, Parvovirus, Densovirus, Iteravirus, Contravirus, Aveparvovirus, Copiparvovirus, Protoparvovirus, Tetraparvovirus, Ambidensovirus, Brevidensovirus, Hepandensovirus и Penstyldensovirus.

[53] Используемый в данном документе термин "аденоассоциированный вирус" (AAV) включает без ограничения AAV типа 1, AAV типа 2, AAV типа 3 (в том числе типов 3A и 3B), AAV типа 4, AAV типа 5, AAV типа 6, AAV типа 7, AAV типа 8, AAV типа 9, AAV типа 10, AAV типа 11, AAV типа 12, AAV типа 13, AAV змей, AAV птиц, AAV крупного рогатого скота, AAV собак, AAV лошадей, AAV овец, AAV коз, AAV креветок, серотипы и клады AAV, раскрытые в Gao et al. (J. Virol. 78:6381 (2004)) и Moris et al. (Virol. 33:375 (2004)), и любой другой AAV, известный в настоящее время или открытый впоследствии. См., например, FIELDS et al. VIROLOGY, volume 2, chapter 69 (4th ed., Lippincott-Raven Publishers).

[54] Термин "полученный из", используемый в данном документе, относится к компоненту, который выделен из или изготовлен с применением указанных молекулы или организма, или информации (например, аминокислотной последовательности или последовательности нуклеиновой кислоты), полученной из указанных молекулы или организма. Например, последовательность нуклеиновой кислоты (например, ITR), которая получена из второй последовательности нуклеиновой кислоты (например, ITR), может предусматривать нуклеотидную последовательность, которая является идентичной или по сути аналогичной нуклеотидной последовательности второй последовательности нуклеиновой кислоты. В случае нуклеотидов или полипептидов производные молекулы могут быть получены путем, например, естественного мутагенеза, искусственного направленного мутагенеза или искусственного случайного мутагенеза. Мутагенез, применяемый для получения нуклеотидов или полипептидов, может являться преднамеренно направленным, или преднамеренно случайным, или их комбинацией. Мутагенез нуклеотида или полипептида с созданием отличающегося нуклеотида или полипептида, полученного из первого, может быть случайным событием (например, обусловленным неточностью работы полимеразы), и идентификация полученного нуклеотида или полипептида может быть осуществлена путем подходящих способов скрининга, например, как рассматривается в данном документе. Мутагенез полипептида, как правило, предусматривает манипуляции с полинуклеотидом, который кодирует полипептид. В некоторых вариантах осуществления нуклеотидная или аминокислотная последовательность, которая получена из второй нуклеотидной или аминокислотной последовательности, характеризуется по меньшей мере 50%, по меньшей мере 51%, по меньшей мере 52%, по меньшей мере 53%, по меньшей мере 54%, по меньшей мере 55%, по меньшей мере 56%, по меньшей мере 57%, по меньшей мере 58%, по меньшей мере 59%, по меньшей мере 60%, по меньшей мере 61%, по меньшей мере 62%, по меньшей мере 63%, по меньшей мере 64%, по меньшей мере 65%, по меньшей мере 66%, по меньшей мере 67%, по меньшей мере 68%, по меньшей мере 69%, по меньшей мере 70%, по меньшей мере 71%, по меньшей мере 72%, по меньшей мере 73%, по меньшей мере 74%, по меньшей мере 75%, по меньшей мере 76%, по меньшей мере 77%, по меньшей мере 78%, по меньшей мере 79%, по меньшей мере 80%, по меньшей мере 81%, по меньшей мере 82%, по меньшей мере 83%, по меньшей мере 84%, по меньшей мере 85%, по меньшей мере 86%, по меньшей мере 87%, по меньшей мере 88%, по меньшей мере 89%, по меньшей мере 90%, по меньшей мере 91%, по меньшей мере 92%, по меньшей мере 93%, по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98%, по меньшей мере 99% или 100% идентичностью последовательности со второй нуклеотидной или аминокислотной последовательностью соответственно, где первая нуклеотидная или аминокислотная последовательность сохраняет биологическую активность второй нуклеотидной или аминокислотной последовательности. В других вариантах осуществления ITR, полученный из ITR вируса, отличного от AAV (или AAV), характеризуется по меньшей мере 90% идентичностью с ITR вируса, отличного от AAV (или ITR AAV соответственно), где ITR вируса, отличного от AAV (или AAV), сохраняет функциональное свойство ITR вируса, отличного от AAV (или ITR AAV соответственно). В некоторых вариантах осуществления ITR, полученный из ITR вируса, отличного от AAV (или AAV), характеризуется по меньшей мере 80% идентичностью с ITR вируса, отличного от AAV (или ITR AAV соответственно), где ITR вируса, отличного от AAV (или AAV), сохраняет функциональное свойство ITR вируса, отличного от AAV (или ITR AAV соответственно). В некоторых вариантах осуществления ITR, полученный из ITR вируса, отличного от AAV (или AAV), характеризуется по меньшей мере 70% идентичностью с ITR вируса, отличного от AAV (или ITR AAV соответственно), где ITR вируса, отличного от AAV (или AAV), сохраняет функциональное свойство ITR вируса, отличного от AAV (или ITR AAV соответственно). В некоторых вариантах осуществления ITR, полученный из ITR вируса, отличного от AAV (или AAV), характеризуется по меньшей мере 60% идентичностью с ITR вируса, отличного от AAV (или ITR AAV соответственно), где ITR вируса, отличного от AAV (или AAV), сохраняет функциональное свойство ITR вируса, отличного от AAV (или ITR AAV соответственно). В некоторых вариантах осуществления ITR, полученный из ITR вируса, отличного от AAV (или AAV), характеризуется по меньшей мере 50% идентичностью с ITR вируса, отличного от AAV (или ITR AAV соответственно), где ITR вируса, отличного от AAV (или AAV), сохраняет функциональное свойство ITR вируса, отличного от AAV (или ITR AAV соответственно).

[55] В некоторых вариантах осуществления ITR, полученный из ITR вируса, отличного от AAV (или AAV), содержит или состоит из фрагмента ITR вируса, отличного от AAV (или AAV). В некоторых вариантах осуществления ITR, полученный из ITR вируса, отличного от AAV (или AAV), содержит или состоит из фрагмента ITR вируса, отличного от AAV (или AAV), где фрагмент содержит по меньшей мере приблизительно 5 нуклеотидов, по меньшей мере приблизительно 10 нуклеотидов, по меньшей мере приблизительно 15 нуклеотидов, по меньшей мере приблизительно 20 нуклеотидов, по меньшей мере приблизительно 25 нуклеотидов, по меньшей мере приблизительно 30 нуклеотидов, по меньшей мере приблизительно 35 нуклеотидов, по меньшей мере приблизительно 40 нуклеотидов, по меньшей мере приблизительно 45 нуклеотидов, по меньшей мере приблизительно 50 нуклеотидов, по меньшей мере приблизительно 55 нуклеотидов, по меньшей мере приблизительно 60 нуклеотидов, по меньшей мере приблизительно 65 нуклеотидов, по меньшей мере приблизительно 70 нуклеотидов, по меньшей мере приблизительно 75 нуклеотидов, по меньшей мере приблизительно 80 нуклеотидов, по меньшей мере приблизительно 85 нуклеотидов, по меньшей мере приблизительно 90 нуклеотидов, по меньшей мере приблизительно 95 нуклеотидов, по меньшей мере приблизительно 100 нуклеотидов, по меньшей мере приблизительно 125 нуклеотидов, по меньшей мере приблизительно 150 нуклеотидов, по меньшей мере приблизительно 175 нуклеотидов, по меньшей мере приблизительно 200 нуклеотидов, по меньшей мере приблизительно 225 нуклеотидов, по меньшей мере приблизительно 250 нуклеотидов, по меньшей мере приблизительно 275 нуклеотидов, по меньшей мере приблизительно 300 нуклеотидов, по меньшей мере приблизительно 325 нуклеотидов, по меньшей мере приблизительно 350 нуклеотидов, по меньшей мере приблизительно 375 нуклеотидов, по меньшей мере приблизительно 400 нуклеотидов, по меньшей мере приблизительно 425 нуклеотидов, по меньшей мере приблизительно 450 нуклеотидов, по меньшей мере приблизительно 475 нуклеотидов, по меньшей мере приблизительно 500 нуклеотидов, по меньшей мере приблизительно 525 нуклеотидов, по меньшей мере приблизительно 550 нуклеотидов, по меньшей мере приблизительно 575 нуклеотидов или по меньшей мере приблизительно 600 нуклеотидов; где ITR, полученный из ITR вируса, отличного от AAV (или AAV), сохраняет функциональное свойство ITR вируса, отличного от AAV (или ITR AAV соответственно). В некоторых вариантах осуществления ITR, полученный из ITR вируса, отличного от AAV (или AAV), содержит или состоит из фрагмента ITR вируса, отличного от AAV (или AAV), где фрагмент содержит по меньшей мере приблизительно 129 нуклеотидов, и где ITR, полученный из ITR вируса, отличного от AAV (или AAV) сохраняет функциональное свойство ITR вируса, отличного от AAV (или ITR AAV соответственно). В некоторых вариантах осуществления ITR, полученный из ITR вируса, отличного от AAV (или AAV), содержит или состоит из фрагмента ITR вируса, отличного от AAV (или AAV), где фрагмент содержит по меньшей мере приблизительно 102 нуклеотидов, и где ITR, полученный из ITR вируса, отличного от AAV (или AAV) сохраняет функциональное свойство ITR вируса, отличного от AAV (или ITR AAV соответственно).

[56] В некоторых вариантах осуществления ITR, полученный из ITR вируса, отличного от AAV (или AAV), содержит или состоит из фрагмента ITR вируса, отличного от AAV (или AAV), где фрагмент составляет по меньшей мере приблизительно 5%, по меньшей мере приблизительно 10%, по меньшей мере приблизительно 15%, по меньшей мере приблизительно 20%, по меньшей мере приблизительно 25%, по меньшей мере приблизительно 30%, по меньшей мере приблизительно 35%, по меньшей мере приблизительно 40%, по меньшей мере приблизительно 45%, по меньшей мере приблизительно 50%, по меньшей мере приблизительно 55%, по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% от длины ITR вируса, отличного от AAV (или AAV).

[57] В некоторых вариантах осуществления нуклеотидная или аминокислотная последовательность, которая получена из второй нуклеотидной или аминокислотной последовательности, характеризуется по меньшей мере 50%, по меньшей мере 51%, по меньшей мере 52%, по меньшей мере 53%, по меньшей мере 54%, по меньшей мере 55%, по меньшей мере 56%, по меньшей мере 57%, по меньшей мере 58%, по меньшей мере 59%, по меньшей мере 60%, по меньшей мере 61%, по меньшей мере 62%, по меньшей мере 63%, по меньшей мере 64%, по меньшей мере 65%, по меньшей мере 66%, по меньшей мере 67%, по меньшей мере 68%, по меньшей мере 69%, по меньшей мере 70%, по меньшей мере 71%, по меньшей мере 72%, по меньшей мере 73%, по меньшей мере 74%, по меньшей мере 75%, по меньшей мере 76%, по меньшей мере 77%, по меньшей мере 78%, по меньшей мере 79%, по меньшей мере 80%, по меньшей мере 81%, по меньшей мере 82%, по меньшей мере 83%, по меньшей мере 84%, по меньшей мере 85%, по меньшей мере 86%, по меньшей мере 87%, по меньшей мере 88%, по меньшей мере 89%, по меньшей мере 90%, по меньшей мере 91%, по меньшей мере 92%, по меньшей мере 93%, по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98%, по меньшей мере 99% или 100% идентичностью последовательности с гомологичной частью второй нуклеотидной или аминокислотной последовательности соответственно, когда они выравнены надлежащим образом, где первая нуклеотидная или аминокислотная последовательность сохраняет биологическую активность второй нуклеотидной или аминокислотной последовательности. В других вариантах осуществления ITR, полученный из ITR вируса, отличного от AAV (или AAV), характеризуется по меньшей мере 90% идентичностью с гомологичной частью ITR вируса, отличного от AAV (или ITR AAV соответственно), когда они выравнены надлежащим образом, где первая нуклеотидная или аминокислотная последовательность сохраняет биологическую активность второй нуклеотидной или аминокислотной последовательности. В некоторых вариантах осуществления ITR, полученный из ITR вируса, отличного от AAV (или AAV), характеризуется по меньшей мере 80% идентичностью с гомологичной частью ITR вируса, отличного от AAV (или ITR AAV соответственно), когда они выравнены надлежащим образом, где первая нуклеотидная или аминокислотная последовательность сохраняет биологическую активность второй нуклеотидной или аминокислотной последовательности. В некоторых вариантах осуществления ITR, полученный из ITR вируса, отличного от AAV (или AAV), характеризуется по меньшей мере 70% идентичностью с гомологичной частью ITR вируса, отличного от AAV (или ITR AAV соответственно), когда они выравнены надлежащим образом, где первая нуклеотидная или аминокислотная последовательность сохраняет биологическую активность второй нуклеотидной или аминокислотной последовательности. В некоторых вариантах осуществления ITR, полученный из ITR вируса, отличного от AAV (или AAV), характеризуется по меньшей мере 60% идентичностью с гомологичной частью ITR вируса, отличного от AAV (или ITR AAV соответственно), когда они выравнены надлежащим образом, где первая нуклеотидная или аминокислотная последовательность сохраняет биологическую активность второй нуклеотидной или аминокислотной последовательности. В некоторых вариантах осуществления ITR, полученный из ITR вируса, отличного от AAV (или AAV), характеризуется по меньшей мере 50% идентичностью с гомологичной частью ITR вируса, отличного от AAV (или ITR AAV соответственно), когда они выравнены надлежащим образом, где первая нуклеотидная или аминокислотная последовательность сохраняет биологическую активность второй нуклеотидной или аминокислотной последовательности.

[58] "Не имеющие капсида" или "безкапсидные" вектор или молекула нуклеиновой кислоты относятся к векторной конструкции, не предусматривающей наличия капсида. В некоторых вариантах осуществления безкапсидный вектор или молекула нуклеиновой кислоты не содержат последовательностей, кодирующих, например, белок Rep AAV.

[59] Как используется в данном документе, "кодирующая область" или "кодирующая последовательность" представляют собой часть полинуклеотида, состоящую из кодонов, транслируемых в аминокислоты. Хотя "стоп-кодон" (TAG, TGA или TAA), как правило, не транслируется в аминокислоту, он может считаться частью кодирующей области, однако любые фланкирующие последовательности, например промоторы, сайты связывания рибосом, терминаторы транскрипции, интроны и т. п., не составляют часть кодирующей области. Границы кодирующей области обычно определяются старт-кодоном на 5'-конце, кодирующим амино-конец получаемого полипептида, и стоп-кодоном трансляции на 3'-конце, кодирующим карбоксильный конец получаемого полипептида. Две или более кодирующие области могут присутствовать в одной полинуклеотидной конструкции, например, в одном векторе, или в отдельных полинуклеотидных конструкциях, например, в отдельных (различных) векторах. Отсюда следует, что один вектор может содержать только одну кодирующую область или содержать две или более кодирующих областей.

[60] Определенные белки, секретируемые клетками млекопитающих, связаны с секреторным сигнальным пептидом, отщепляющимся от зрелого белка после начала экспорта растущей белковой цепи через гранулярный эндоплазматический ретикулум. Специалистам в данной области техники известно, что сигнальные полипептиды обычно слиты с N-концом полипептида, и отщепляются от полного или "полноразмерного" полипептида с образованием секретируемой или "зрелой" формы полипептида. В определенных вариантах осуществления применяют нативный сигнальный пептид или функциональное производное такой последовательности, которое сохраняет способность к управлению секрецией полипептида, функционально связанного с ним. В качестве альтернативы, можно применять гетерологичный сигнальный пептид млекопитающего, например, тканевой активатор плазминогена (ТРА) человека или сигнальный пептид ß-глюкуронидазы мыши или его функциональное производное.

[61] Термин "ниже" относится к нуклеотидной последовательности, которая расположена в направлении 3' относительно эталонной нуклеотидной последовательности. В определенных вариантах осуществления расположенные ниже нуклеотидные последовательности относятся к последовательностям, которые следуют за точкой начала транскрипции. Например, кодон инициации трансляции гена расположен ниже относительно сайта начала транскрипции.

[62] Термин "выше" относится к нуклеотидной последовательности, которая расположена в направлении 5' относительно эталонной нуклеотидной последовательности. В определенных вариантах осуществления расположенные выше нуклеотидные последовательности относятся к последовательностям, которые расположены со стороны 5'-конца относительно кодирующей области или точки начала транскрипции. Например, большинство промоторов расположены выше сайта начала транскрипции.

[63] Как используется в данном документе, термин "регуляторная область гена" или "регуляторная область" относится к нуклеотидным последовательностям, расположенным выше (5'-некодирующие последовательности), в пределах или ниже (3'-некодирующие последовательности) кодирующей области, и которые влияют на транскрипцию, процессинг РНК, стабильность или трансляцию связанной кодирующей области. Регуляторные области могут включать промоторы, лидерные последовательности трансляции, интроны, последовательности, узнающие сайты полиаденилирования, сайты процессинга РНК, сайты связывания эффекторов и структуры "стебель-петля". Если кодирующая область предназначена для экспрессии в эукариотической клетке, сигнал полиаденилирования и последовательность терминации транскрипции обычно будут размещены в направлении 3' относительно кодирующей последовательности.

[64] Полинуклеотид, который кодирует продукт, например miRNA или продукт гена (например, полипептид, такой как терапевтический белок), может содержать промотор и/или другие элементы, осуществляющие контроль экспрессии (например, транскрипции или трансляции), функционально связанные с одной или несколькими кодирующими областями. В функциональной связи кодирующая область для продукта гена, например полипептида, связана с одной или несколькими регуляторными областями таким образом, что экспрессия продукта гена находится под влиянием или контролем регуляторной(-ых) области(-ей). Например, кодирующая область и промотор считаются "функционально связанными", если индуцирование функции промотора приводит к транскрипции mRNA, кодирующей продукт гена, кодируемого кодирующей областью, и если природа связи между промотором и кодирующей областью не препятствует способности промотора управлять экспрессией продукта гена или не препятствует способности ДНК-матрицы транскрибироваться. Другие элементы, осуществляющие контроль экспрессии, помимо промотора, например энхансеры, операторы, репрессоры и сигналы терминации транскрипции, также могут быть функционально связаны с кодирующей областью для управления экспрессией продукта гена.

[65] "Последовательности, осуществляющие контроль транскрипции", относятся к регуляторным последовательностям ДНК, таким как промоторы, энхансеры, терминаторы и т. п., которые обеспечивают осуществление экспрессии кодирующей последовательности в клетке-хозяине. Специалистам в данной области техники известны разнообразные области, осуществляющие контроль транскрипции. Они включают без ограничения области, осуществляющие контроль транскрипции, функционирующие в клетках позвоночных, такие как без ограничения промоторные и энхансерные сегменты цитомегаловирусов (промотор гена немедленного раннего ответа вместе с интроном A), вируса обезьян 40 (промотор гена раннего ответа) и ретровирусов (таких как вирус саркомы Рауса). Другие области, осуществляющие контроль транскрипции, включают области, полученные из генов позвоночных, таких как гены актина, белка теплового шока, бычьего гормона роста и ß-глобина кролика, а также другие последовательности, способные осуществлять контроль экспрессии генов в эукариотических клетках. Дополнительные подходящие области, осуществляющие контроль транскрипции, включают тканеспецифические промоторы и энхансеры, а также индуцируемые лимфокинами промоторы (например, промоторы, индуцируемые интерферонами или интерлейкинами).

[66] Аналогично, разнообразные элементы, осуществляющие контроль трансляции, известны средним специалистам в данной области техники. Они включают без ограничения сайты связывания рибосомы, кодоны инициации и терминации трансляции и элементы, полученные из пикорнавирусов (в частности, сайт внутренней посадки рибосомы или IRES, также называемый CITE-последовательностью).

[67] Термин "экспрессия", используемый в данном документе, относится к процессу, посредством которого из полинуклеотида вырабатывается продукт гена, например, РНК или полипептид. Она включает без ограничения транскрипцию полинуклеотида с образованием матричной РНК (mRNA), транспортной РНК (tRNA), малой шпилечной РНК (shRNA), малой интерферирующей РНК (siRNA) или любого другого продукта, представляющего собой РНК, и трансляцию mRNA с образованием полипептида. Экспрессия приводит к образованию "продукта гена". Как используется в данном документе, продукт гена может представлять собой либо нуклеиновую кислоту, например, информационную РНК, получаемую путем транскрипции гена, либо полипептид, который транслируется с транскрипта. Продукты гена, описанные в данном документе, дополнительно включают нуклеиновые кислоты с посттранскрипционными модификациями, например, полиаденилированием или сплайсингом, или полипептиды с посттрансляционными модификациями, например, метилированием, гликозилированием, добавлением липидов, ассоциацией с другими белковыми субъединицами, протеолитическим расщеплением. Термин "выход", используемый в данном документе, относится к количеству полипептида, полученному посредством экспрессии гена.

[68] "Вектор" относится к любому носителю для клонирования нуклеиновой кислоты и/или ее переноса в клетку-хозяина. Вектор может представлять собой репликон, к которому может быть присоединен другой сегмент нуклеиновой кислоты так, чтобы обеспечить репликацию присоединенного сегмента. "Репликон" относится к любому генетическому элементу (например, плазмиде, фагу, космиде, хромосоме, вирусу), который функционирует как автономная единица репликации in vivo, т. e. способен реплицироваться под своим собственным контролем. Термин "вектор" включает носители для введения нуклеиновой кислоты в клетку in vitro, ex vivo или in vivo. В данной области техники известно и используется большое количество векторов, в том числе, например, плазмиды, модифицированные вирусы эукариот или модифицированные бактериофаги. Вставка полинуклеотида в подходящий вектор может быть осуществлена посредством лигирования соответствующих полинуклеотидных фрагментов в выбранный вектор, который имеет комплементарные "липкие" концы.

[69] Векторы могут быть сконструированы так, чтобы кодировать селектируемые маркеры или репортерные гены, которые обеспечивают отбор или идентификацию клеток, в которые встроился вектор. Экспрессия селектируемых маркеров или репортерных генов обеспечивает идентификацию и/или отбор клеток-хозяев, которые содержат и экспрессируют другие кодирующие области, содержащиеся в векторе. Примеры генов селектируемых маркеров, известных и применяемых в данной области техники, включают гены, обеспечивающие устойчивость к ампициллину, стрептомицину, гентамицину, канамицину, гигромицину, гербициду биалафосу, сульфонамиду и т. п.; и гены, которые применяют в качестве фенотипических маркеров, т. е. гены, регулирующие синтез антоцианов, ген изопентанилтрансферазы и т. п. Примеры репортерных генов, известных и применяемых в данной области техники, включают люциферазу (Luc), зеленый флуоресцентный белок (GFP), хлорамфениколацетилтрансферазу (CAT), β-галактозидазу (LacZ), β-глюкуронидазу (Gus) и т. п. Селектируемые маркеры также можно рассматривать как репортерные гены.

[70] Термин "клетка-хозяин", используемый в данном документе, относится, например, к микроорганизмам, клеткам дрожжей, клеткам насекомых и клеткам млекопитающих, которые можно применять или применяются в качестве реципиентов ssDNA или векторов. Термин включает потомство исходной клетки, которая была трансдуцирована. Таким образом, применяемая в данном документе "клетка-хозяин", как правило, относится к клетке, которая была трансдуцирована последовательностью экзогенной ДНК. Следует понимать, что потомство одной родительской клетки не обязательно является полностью идентичным исходному родителю в отношении морфологии или в отношении комплемента геномной или общей ДНК вследствие естественной, случайной или преднамеренной мутации. В некоторых вариантах осуществления клетка-хозяин может представлять собой клетку-хозяина in vitro.

[71] Термин "селектируемый маркер" относится к идентифицирующему фактору, обычно гену антибиотика или устойчивости к химическому воздействию, в отношении которого можно осуществлять селекцию на основе эффекта маркерного гена, например устойчивость к антибиотику, устойчивость к гербициду, колориметрические маркеры, ферменты, флуоресцентные маркеры и т. п., где эффект применяют для отслеживания наследуемости представляющей интерес нуклеиновой кислоты и/или идентификации клетки или организма, которые унаследовали представляющую интерес нуклеиновую кислоту. Примеры генов селектируемых маркеров, известных и применяемых в данной области техники, включают гены, обеспечивающие устойчивость к ампициллину, стрептомицину, гентамицину, канамицину, гигромицину, гербициду биалафосу, сульфонамиду и т. п.; и гены, которые применяют в качестве фенотипических маркеров, т. е. гены, регулирующие синтез антоцианов, ген изопентанилтрансферазы и т. п.

[72] Термин "репортерный ген" относится к нуклеиновой кислоте, кодирующей идентифицирующий фактор, идентификацию которого можно осуществлять на основе эффекта репортерного гена, где эффект применяют для отслеживания наследуемости представляющей интерес нуклеиновой кислоты, идентификации клетки или организма, которые унаследовали представляющую интерес нуклеиновую кислоту, и/или для измерения индуцирования экспрессии гена или транскрипции. Примеры репортерных генов, известных и применяемых в данной области техники, включают люциферазу (Luc), зеленый флуоресцентный белок (GFP), хлорамфениколацетилтрансферазу (CAT), β-галактозидазу (LacZ), β-глюкуронидазу (Gus) и т. п. Гены селективных маркеров также можно рассматривать как репортерные гены.

[73] "Промотор" и "промоторная последовательность" применяют взаимозаменяемо и относятся к последовательности ДНК, способной к осуществлению контроля экспрессии кодирующей последовательности или функциональной РНК. В целом, кодирующая последовательность расположена в направлении 3' относительно промоторной последовательности. Промоторы могут быть получены целиком из нативного гена или состоять из различных элементов, полученных из различных промоторов, встречающихся в природе, или даже содержать сегменты синтетической ДНК. Специалистам в данной области техники будет понятно, что различные промоторы могут управлять экспрессией гена в различных тканях или типах клеток, или на различных стадиях развития, или в ответ на различные условия окружающей среды или физиологические условия. Промоторы, которые обуславливают экспрессию гена в большинстве типов клеток в большинстве случаев, обычно называют "конститутивными промоторами". Промоторы, которые обуславливают экспрессию гена в конкретном типе клеток, обычно называют "клеточноспецифическими промоторами" или "тканеспецифическими промоторами". Промоторы, которые обуславливают экспрессию гена на конкретной стадии развития или дифференцировки клеток, обычно называют "промоторами, специфическими для стадии развития" или "промоторами, специфическими в отношении дифференцировки клеток". Промоторы, которые являются индуцируемыми и обуславливают экспрессию гена после подвергания воздействию или обработки клетки средством, биологической молекулой, химическим веществом, лигандом, светом или т. п., которые индуцируют промотор, обычно называют "индуцибельными промоторами" или "регулируемыми промоторами". Кроме того, следует понимать, что поскольку в большинстве случаев точные границы регуляторных последовательностей полностью определены не были, фрагменты ДНК различной длины могут характеризоваться идентичной промоторной активностью.

[74] Промоторная последовательность, как правило, ограничена со стороны своего 3'-конца сайтом инициации транскрипции и продолжается выше (в 5'-направлении) с включением минимального числа оснований или элементов, необходимых для инициации транскрипции на поддающихся обнаружению находящихся выше фонового уровнях. В пределах промоторной последовательности можно будет обнаружить сайт инициации транскрипции (в подходящем случае определенный, например, посредством картирования с помощью нуклеазы S1), а также домены связывания белка (консенсусные последовательности), ответственные за связывание РНК-полимеразы.

[75] В некоторых вариантах осуществления молекула нуклеиновой кислоты содержит тканеспецифический промотор. В определенных вариантах осуществления тканеспецифический промотор управляет экспрессией терапевтического белка, например фактора свертывания крови, в печени, например в гепатоцитах и/или эндотелиальных клетках. В конкретных вариантах осуществления промотор выбран из группы, состоящей из промотора тиретина мыши (mTTR), эндогенного промотора фактора VIII человека (F8), промотора альфа-1-антитрипсина человека (hAAT), минимального промотора альбумина человека, промотора альбумина мыши, промотора тристетрапролина (TTP), промотора CASI, промотора CAG, промотора цитомегаловируса (CMV), промотора фосфоглицераткиназы (PGK) и любой их комбинации. В некоторых вариантах осуществления промотор выбран из специфического для печени промотора (например, α1-антитрипсина (AAT)), специфического для мышц промотора (например, мышечной креатинкиназы (MCK), тяжелой цепи миозина альфа (αMHC), миоглобина (MB) и десмина (DES)), синтетического промотора (например, SPc5-12, 2R5Sc5-12, dMCK и tMCK) и любой их комбинации. В одном конкретном варианте осуществления промотор предусматривает промотор TTP.

[76] Термины "рестрикционная эндонуклеаза" и "рестрикционный фермент" применяются взаимозаменяемо и относятся к ферменту, который связывается и вносит разрывы в пределах конкретной нуклеотидной последовательности в пределах двухнитевой ДНК.

[77] Термин "плазмида" относится к внехромосомному элементу, зачастую несущему ген, который не является частью центрального метаболизма клетки, и обычно имеющему форму кольцевых двухнитевых молекул ДНК. Такие элементы могут представлять собой автономно реплицирующиеся последовательности, интегрирующиеся в геном последовательности, фаговые или нуклеотидные последовательности, линейные, кольцевые или сверхспиральные, из одно- или двухнитевой ДНК или РНК, полученные из любого источника, к которым присоединен или добавлен путем рекомбинации ряд нуклеотидных последовательностей с образованием уникальной конструкции, которая способна вводить промоторный фрагмент и последовательность ДНК, кодирующую выбранный продукт гена, вместе с соответствующей 3'-нетранслируемой последовательностью в клетку.

[78] Векторы на основе вирусов эукариот, которые можно применять, включают без ограничения векторы на основе аденовируса, векторы на основе ретровируса, векторы на основе аденоассоциированного вируса, на основе поксвируса, например, векторы на основе вируса осповакцины, векторы на основе бакуловируса или векторы на основе герпесвируса. Отличные от вирусных векторы включают плазмиды, липосомы, электрически заряженные липиды (цитофектины), комплексы ДНК-белок и биополимеры.

[79] "Клонирующий вектор" относится к "репликону", который представляет собой единицу длины нуклеиновой кислоты, которая реплицируется последовательно и которая содержит точку начала репликации, такую как плазмида, фаг или космида, к которой может быть присоединен другой сегмент нуклеиновой кислоты так, чтобы обеспечить репликацию присоединенного сегмента. Определенные клонирующие векторы способны реплицироваться в одном типе клеток, например бактериях, а экспрессироваться в другом, например эукариотических клетках. Клонирующие векторы обычно содержат одну или несколько последовательностей, которые можно применять для отбора клеток, содержащих вектор, и/или один или несколько сайтов множественного клонирования для вставки последовательностей нуклеиновых кислот, представляющих интерес.

[80] Термин "вектор экспрессии" относится к носителю, сконструированному с возможностью обеспечения экспрессии вставленной последовательности нуклеиновой кислоты после вставки в клетку-хозяина. Вставленная последовательность нуклеиновой кислоты находится в функциональной связи с регуляторными областями, как описано выше.

[81] Векторы вводят в клетки-хозяева с помощью способов, хорошо известных из уровня техники, например, посредством трансфекции, электропорации, микроинъекции, трансдукции, слияния клеток, DEAE-декстрана, осаждения фосфатом кальция, липофекции (слияния лизосом), применения генной пушки или транспортера ДНК-вектора. Термины "культура", "культивировать" и "культивирование", как используется в данном документе, означают инкубацию клеток в условиях in vitro, которые обеспечивают рост или деление клеток или поддержание клеток в живом состоянии. Используемый в данном документе термин "культивируемые клетки" означает клетки, которые размножаются in vitro.

[82] Подразумевается, что используемый в данном документе термин "полипептид" охватывает "полипептид" в единственном числе, а также "полипептиды" во множественном числе и относится к молекуле, состоящей из мономеров (аминокислот), линейно связанных амидными связями (также известными как пептидные связи). Термин "полипептид" относится к любой цепи или цепям из двух или более аминокислот и не относится к конкретной длине продукта. Таким образом, пептиды, дипептиды, трипептиды, олигопептиды, "белок", "аминокислотная цепь" или любой другой термин, используемый для обозначения цепи или цепей из двух или более аминокислот, включены в определение "полипептида", и термин "полипептид" можно использовать вместо любого из этих терминов или взаимозаменяемо с любым из них. Также подразумевается, что термин "полипептид" относится к продуктам постэкспрессионных модификаций полипептида, включая без ограничения гликозилирование, ацетилирование, фосфорилирование, амидирование, получение производных с помощью известных защитных/блокирующих групп, протеолитическое расщепление или модификацию с помощью аминокислот, не встречающихся в природе. Полипептид может происходить из природного биологического источника или быть получен с помощью рекомбинантной технологии, но не обязательно транслирован с определенной последовательности нуклеиновой кислоты. Он может быть получен любым способом, в том числе путем химического синтеза.

[83] Термин "аминокислота" включает аланин (Ala или A); аргинин (Arg или R); аспарагин (Asn или N); аспарагиновую кислоту (Asp или D); цистеин (Cys или C); глутамин (Gln или Q); глутаминовую кислоту (Glu или E); глицин (Gly или G); гистидин (His или H); изолейцин (Ile или I): лейцин (Leu или L); лизин (Lys или K); метионин (Met или M); фенилаланин (Phe или F); пролин (Pro или P); серин (Ser или S); треонин (Thr или T); триптофан (Trp или W); тирозин (Tyr или Y) и валин (Val или V). Нетрадиционные аминокислоты также находятся в пределах объема настоящего изобретения и включают норлейцин, орнитин, норвалин, гомосерин и другие аналоги аминокислотных остатков, такие как описанные в Ellman et al. Meth. Enzym. 202:301-336 (1991). Для получения таких не встречающихся в природе аминокислотных остатков можно использовать процедуры согласно вышеуказанному Noren et al. Science 244:182 (1989) и Ellman et al.. Вкратце, такие процедуры предусматривают химическую активацию супрессорной tRNA c не встречающимся в природе аминокислотным остатком с последующими транскрипцией и трансляцией РНК in vitro. Введения нетрадиционной аминокислоты можно также достигать с применением химических способов образования пептидной связи, известных из уровня техники. Используемый в данном документе термин "полярная аминокислота" включает аминокислоты, которые характеризуются нулевым суммарным зарядом, однако характеризуются отличными от нуля частичными зарядами в различных частях своих боковых цепей (например, M, F, W, S, Y, N, Q, C). Такие аминокислоты могут участвовать в гидрофобных взаимодействиях и электростатических взаимодействиях. Используемый в данном документе термин "заряженная аминокислота" включает аминокислоты, которые характеризуются отличным от нуля суммарным зарядом на своих боковых цепях (например, R, K, H, E, D). Такие аминокислоты могут участвовать в гидрофобных взаимодействиях и электростатических взаимодействиях.

[84] Также в настоящее изобретение включены фрагменты или варианты полипептидов и любая их комбинация. Термины "фрагмент" или "вариант" в отношении полипептидных связывающих доменов или связывающих молекул по настоящему изобретению, включают любые полипептиды, которые сохраняют по меньшей мере некоторые из свойств эталонного полипептида (например, аффинность связывания FcRn для FcRn-связывающего домена или варианта Fc, коагуляционную активность для варианта FVIII или FVIII-связывающую активность для фрагмента VWF). Фрагменты полипептидов включают фрагменты, полученные посредством протеолиза, а также фрагменты, полученные посредством делеции, в дополнение к конкретным фрагментам антитела, обсуждаемым в данном документе в другом месте, но не включают встречающийся в природе полноразмерный полипептид (или зрелый полипептид). Варианты полипептидных связывающих доменов или связывающих молекул по настоящему изобретению, включают фрагменты, описанные выше, а также полипептиды с аминокислотными последовательностями, измененными в результате аминокислотных замен, делеций или вставок. Варианты могут быть встречающимися в природе или не встречающимися в природе. Не встречающиеся в природе варианты можно получить с помощью известных из уровня техники методик мутагенеза. Вариантные полипептиды могут содержать консервативные или неконсервативные аминокислотные замены, делеции или добавления.

[85] "Консервативная аминокислотная замена" представляет собой замену, при которой аминокислотный остаток замещается аминокислотным остатком со сходной боковой цепью. Семейства аминокислотных остатков, имеющих сходные боковые цепи, определены в уровне техники, включая основные боковые цепи (например, лизин, аргинин, гистидин), кислые боковые цепи (например, аспарагиновая кислота, глутаминовая кислота), незаряженные полярные боковые цепи (например, глицин, аспарагин, глутамин, серин, треонин, тирозин, цистеин), неполярные боковые цепи (например, аланин, валин, лейцин, изолейцин, пролин, фенилаланин, метионин, триптофан), бета-разветвленные боковые цепи (например, треонин, валин, изолейцин) и ароматические боковые цепи (например, тирозин, фенилаланин, триптофан, гистидин). Таким образом, если аминокислота в полипептиде замещается другой аминокислотой из того же семейства боковых цепей, то замена считается консервативной. В другом варианте осуществления нить из аминокислот можно подвергнуть консервативному замещению сходной в структурном отношении нитью, которая отличается порядком расположения и/или составом представителей семейства боковых цепей.

[86] Термин "процентная идентичность", известный из уровня техники, означает взаимосвязь между двумя или более полипептидными последовательностями или двумя или более полинуклеотидными последовательностями, определенную путем сравнения последовательностей. В уровне техники "идентичность" также означает степень сходства последовательности между полипептидными или полинуклеотидными последовательностями, в соответствующих случаях, определенную по степени соответствия между нитями таких последовательностей. "Идентичность" может быть легко рассчитана с помощью известных способов, в том числе без ограничения тех, которые описаны в Computational Molecular Biology (Lesk, A. M., ed.) Oxford University Press, New York (1988); Biocomputing: Informatics and Genome Projects (Smith, D. W., ed.) Academic Press, New York (1993); Computer Analysis of Sequence Data, Part I (Griffin, A. M., and Griffin, H. G., eds.) Humana Press, New Jersey (1994); Sequence Analysis in Molecular Biology (von Heinje, G., ed.) Academic Press (1987) и Sequence Analysis Primer (Gribskov, M. and Devereux, J., eds.) Stockton Press, New York (1991). Предпочтительные способы определения идентичности разработаны с обеспечением самой высокой степени соответствия между исследуемыми последовательностями. Способы определения идентичности запрограммированы в находящихся в открытом доступе компьютерных программах. Выравнивание последовательностей и расчеты процентной идентичности можно осуществлять с применением программного обеспечения для анализа последовательностей, такого как программа Megalign из программного пакета для биоинформационных вычислений LASERGENE (DNASTAR Inc., Мадисон, Висконсин), пакет программ GCG (Wisconsin Package версии 9.0, Genetics Computer Group (GCG), Мадисон, Висконсин), BLASTP, BLASTN, BLASTX (Altschul et al., J. Mol. Biol. 215:403 (1990)) и DNASTAR (DNASTAR, Inc. 1228 С. Парк Стрит, Мадисон, Висконсин, 53715, США). В контексте настоящей заявки будет понятно, что в случаях применения программного обеспечения для анализа последовательностей результаты анализа будут основываться на "значениях по умолчанию" рассматриваемой программы, если не указано иное. Используемые в данном документе "значения по умолчанию" будут означать любой набор значений или параметров, которые изначально загружаются с программным обеспечением при первом запуске. Для целей определения процентной идентичности между последовательностью терапевтического белка, например фактора свертывания крови, согласно настоящему изобретению и эталонной последовательностью только нуклеотиды в эталонной последовательности, соответствующие нуклеотидам в последовательности терапевтического белка, например фактора свертывания крови, согласно настоящему изобретению, используют для расчета процентной идентичности. Например, при сравнении нуклеотидной последовательности полноразмерного FVIII, содержащего домен B, с оптимизированной нуклеотидной последовательностью FVIII с удаленным доменом B (BDD) согласно настоящему изобретению часть выравнивания, включающая домен A1, A2, A3, C1 и C2, будет использоваться для расчета процентной идентичности. Нуклеотиды в части последовательности полноразмерного FVIII, кодирующей домен B (что приведет к большому "гэпу" в выравнивании), не будут учитываться в качестве несовпадений. Кроме того, при определении процентной идентичности между оптимизированной последовательностью FVIII с BDD согласно настоящему изобретению или ее указанной частью (например, нуклеотидами 58-2277 и 2320-4374 из SEQ ID NO:3) и эталонной последовательностью процентная идентичность будет рассчитана при выравнивании с делением числа совпадающих нуклеотидов на общее число нуклеотидов в полной последовательности оптимизированной последовательности FVIII с BDD или ее указанной части, как указано в данном документе.

[87] Как используется в данном документе, нуклеотиды, соответствующие нуклеотидам в конкретной последовательности согласно настоящему изобретению, идентифицированы путем выравнивания последовательности согласно настоящему изобретению с обеспечением максимальной идентичности с эталонной последовательностью. Номер, используемый для идентификации эквивалентной аминокислоты в эталонной последовательности соответствует номеру, используемому для идентификации соответствующей аминокислоты в последовательности согласно настоящему изобретению.

[88] "Слитый" или "химерный" белок содержит первую аминокислотную последовательность, соединенную со второй аминокислотной последовательностью, с которой она естественным образом не соединена в природе. Аминокислотные последовательности, которые в обычных условиях существуют в отдельных белках, могут быть объединены в слитом полипептиде, или аминокислотные последовательности, которые в обычных условиях существуют в одном и том же белке, могут быть размещены в новом порядке в слитом полипептиде, например, при слиянии домена фактора VIII по настоящему изобретению с Fc-доменом Ig. Слитый белок создают, например, путем химического синтеза или путем создания полинуклеотида, в котором области пептида кодируются в необходимом взаиморасположении, и обеспечения его трансляции. Химерный белок может дополнительно содержать вторую аминокислотную последовательность, связанную с первой аминокислотной последовательностью с помощью ковалентной непептидной связи или нековалентной связи.

[89] Используемый в данном документе термин "сайт вставки" относится к положению в полипептиде или его фрагменте, варианте или производном, которое находится непосредственно выше положения, в которое может быть вставлен гетерологичный компонент. "Сайт вставки" указан в виде числа, причем число является номером аминокислоты в эталонной последовательности. Например, "сайт вставки" в FVIII относится к номеру аминокислоты в последовательности в зрелом нативном FVIII (SEQ ID NO: 15), которому соответствует сайт вставки, который располагается непосредственно за положением вставки в направлении N-конца. Например, фраза "a3 содержит гетерологичный компонент в сайте вставки, который соответствует аминокислоте 1656 из SEQ ID NO: 15" указывает на то, что гетерологичный компонент расположен между двумя аминокислотами, соответствующими аминокислоте 1656 и аминокислоте 1657 из SEQ ID NO: 15.

[90] Используемая в данном документе фраза "непосредственно ниже аминокислоты" относится к положению прямо после концевой карбоксильной группы аминокислоты. Аналогично, фраза "непосредственно выше аминокислоты" относится к положению прямо после концевой аминогруппы аминокислоты.

[91] Термины "вставленный", "вставлен", "вставлен в" или грамматически родственные термины, используемые в данном документе, относятся к положению гетерологичного компонента в полипептиде, например, фактора свертывания крови, относительно аналогичного положения в родительском полипептиде. Например, в определенном варианте осуществления "вставлен" и т. п. относятся к положению гетерологичного компонента в полипептиде рекомбинантного FVIII относительно аналогичного положения в нативном зрелом FVIII человека. Используемые в данном документе термины относятся к характеристикам полипептида и не указывают, не подразумевают или не предполагают каких-либо способов или процесса, с помощью которых был получен полипептид.

[92] Используемый в данном документе термин "период полужизни" относится к биологическому периоду полужизни конкретного полипептида in vivo. Период полужизни можно выразить в виде времени, необходимого для выведения из кровотока и/или других тканей животного половины количества, введенного субъекту. Если кривую клиренса данного полипептида строят в виде функции времени, кривая обычно является двухфазной с быстрой α-фазой и более длинной β-фазой. Обычно α-фаза отображает уравновешивание содержания введенного полипептида Fc между внутри- и внесосудистым пространством и частично определяется размером полипептида. Обычно β-фаза отображает катаболизм полипептида во внутрисосудистом пространстве. В некоторых вариантах осуществления терапевтический белок, например фактор свертывания крови, например FVIII, и химерные белки, содержащие его, являются монофазными и, таким образом, характеризуются отсутствием альфа-фазы и наличием только отдельной бета-фазы. Следовательно, в определенных вариантах осуществления термин период полужизни, используемый в данном документе, относится к периоду полужизни полипептида в β-фазе.

[93] Термин "соединенный", используемый в данном документе, относится к первой аминокислотной последовательности или нуклеотидной последовательности, ковалентно или нековалентно присоединенной соответственно ко второй аминокислотной последовательности или нуклеотидной последовательности. Первая аминокислотная или нуклеотидная последовательность может быть непосредственно присоединена ко второй аминокислотной или нуклеотидной последовательности или объединена с ней, или, в качестве альтернативы, промежуточная последовательность может ковалентно соединять первую последовательность со второй последовательностью. Термин "соединенный" означает не только слияние первой аминокислотной последовательности со второй аминокислотной последовательностью на С-конце или N-конце, но также включает вставку всей первой аминокислотной последовательности (или второй аминокислотной последовательности) между любыми двумя аминокислотами во второй аминокислотной последовательности (или соответственно в первой аминокислотной последовательности). В одном варианте осуществления первая аминокислотная последовательность может быть соединена со второй аминокислотной последовательностью с помощью пептидной связи или линкера. Первая нуклеотидная последовательность может быть соединена со второй нуклеотидной последовательностью с помощью фосфодиэфирной связи или линкера. Линкер может представлять собой пептид или полипептид (в случае полипептидных цепей), или нуклеотид или цепь нуклеотидов (в случае цепей нуклеотидов), или любой химический компонент (как в случае полипептидных, так и полинуклеотидных цепей). Термин "соединенный" также обозначается дефисом (-).

[94] Гемостаз, используемый в данном документе, означает остановку или замедление кровотечения или кровоизлияния; или остановку или замедление кровотока через кровеносный сосуд или часть тела.

[95] Гемостатическое нарушение, как используется в данном документе, означает генетически наследуемое или приобретенное состояние, характеризующееся склонностью к кровоизлиянию, происходящему спонтанно либо в результате травмы, из-за нарушенной способности или неспособности образовывать фибриновый сгусток. Примеры таких нарушений включают формы гемофилии. Тремя основными формами являются гемофилия A (дефицит фактора VIII), гемофилия B (дефицит фактора IX или "болезнь Кристмаса") и гемофилия C (дефицит фактора XI, легкая склонность к кровотечению). Другие гемостатические нарушения включают, например, болезнь фон Виллебранда, дефицит фактора XI (дефицит PTA), дефицит фактора XII, дефициты или аномалии структуры фибриногена, протромбина, фактора V, фактора VII, фактора X или фактора XIII, синдром Бернара-Сулье, который представляет собой дефект или дефицит GPIb. GPIb, рецептор vWF, может быть дефектным и приводить к невозможности образования первичного сгустка (первичного гемостаза) и повышенной склонности к кровотечению, а также к тромбастении Гланцманна-Негели (тромбастении Гланцманна). При печеночной недостаточности (острой и хронической формах) имеет место недостаточная выработка печенью факторов коагуляции; это может увеличивать риск кровотечения.

[96] Выделенные молекулы нуклеиновой кислоты, выделенные полипептиды или векторы, содержащие выделенную молекулу нуклеиновой кислоты, согласно настоящему изобретению можно применять профилактически. Используемый в данном документе термин "профилактическое лечение" относится к введению молекулы до эпизода кровотечения. В одном варианте осуществления субъект, нуждающийся в общем гемостатическом средстве, подвергается или вскоре подвергнется хирургическому вмешательству. Полинуклеотид, полипептид или вектор согласно настоящему изобретению можно вводить до или после хирургического вмешательства в качестве профилактического средства. Полинуклеотид, полипептид или вектор согласно настоящему изобретению можно вводить во время или после хирургического вмешательства для контроля эпизода острого кровотечения. Хирургическое вмешательство может включать без ограничения трансплантацию печени, резекцию печени, стоматологические процедуры или трансплантацию стволовых клеток.

[97] Выделенные молекулы нуклеиновой кислоты, выделенные полипептиды или векторы согласно настоящему изобретению также применяют для лечения по необходимости. Термин "лечение по необходимости" относится к введению выделенной молекулы нуклеиновой кислоты, выделенного полипептида или вектора в ответ на симптомы эпизода кровотечения или перед действием, которое может вызвать кровотечение. В одном аспекте лечение по необходимости может быть назначено субъекту, когда начинается кровотечение, например после травмы, или когда ожидается кровотечение, например перед хирургическим вмешательством. В другом аспекте лечение по необходимости может быть назначено перед действиями, которые увеличивают риск кровотечения, такими как контактные виды спорта.

[98] Используемый в данном документе термин "острое кровотечение" относится к эпизоду кровотечения независимо от первопричины. Например, у субъекта может быть травма, уремия, наследственное нарушение гемостаза (например, дефицит фактора VII), тромбоцитарное нарушение или устойчивость вследствие развития антител к факторам свертывания крови.

[99] "Лечить", "лечение" или "осуществление лечения", как используется в данном документе, относится, например, к уменьшению тяжести заболевания или состояния; уменьшению продолжительности течения заболевания; облегчению одного или нескольких симптомов, ассоциированных с заболеванием или состоянием; обеспечению благоприятных эффектов у субъекта с заболеванием или состоянием, при этом не обязательно с излечением заболевания или состояния, или профилактике одного или нескольких симптомов, связанных с заболеванием или состоянием. В одном варианте осуществления термин "осуществление лечения" или "лечение" означает поддержание у субъекта, например, остаточного уровня содержания FVIII на уровне по меньшей мере приблизительно 1 МЕ/дл, 2 МЕ/дл, 3 МЕ/дл, 4 МЕ/дл, 5 МЕ/дл, 6 МЕ/дл, 7 МЕ/дл, 8 МЕ/дл, 9 МЕ/дл, 10 МЕ/дл, 11 МЕ/дл, 12 МЕ/дл, 13 МЕ/дл, 14 МЕ/дл, 15 МЕ/дл, 16 МЕ/дл, 17 МЕ/дл, 18 МЕ/дл, 19 МЕ/дл, 20 МЕ/дл, 25 МЕ/дл, 30 МЕ/дл, 35 МЕ/дл, 40 МЕ/дл, 45 МЕ/дл, 50 МЕ/дл, 55 МЕ/дл, 60 МЕ/дл, 65 МЕ/дл, 70 МЕ/дл, 75 МЕ/дл, 80 МЕ/дл, 85 МЕ/дл, 90 МЕ/дл, 95 МЕ/дл, 100 МЕ/дл, 105 МЕ/дл, 110 МЕ/дл, 115 МЕ/дл, 120 МЕ/дл, 125 МЕ/дл, 130 МЕ/дл, 135 МЕ/дл, 140 МЕ/дл, 145 МЕ/дл или 150 МЕ/дл путем введения выделенной молекулы нуклеиновой кислоты, выделенного полипептида или вектора согласно настоящему изобретению. В другом варианте осуществления осуществление лечения или лечение означает поддержание остаточного уровня содержания FVIII на уровне от приблизительно 1 до приблизительно 150 МЕ/дл, от приблизительно 1 до приблизительно 125 МЕ/дл, от приблизительно 1 до приблизительно 100 МЕ/дл, от приблизительно 1 до приблизительно 90 МЕ/дл, от приблизительно 1 до приблизительно 85 МЕ/дл, от приблизительно 1 до приблизительно 80 МЕ/дл, от приблизительно 1 до приблизительно 75 МЕ/дл, от приблизительно 1 до приблизительно 70 МЕ/дл, от приблизительно 1 до приблизительно 65 МЕ/дл, от приблизительно 1 до приблизительно 60 МЕ/дл, от приблизительно 1 до приблизительно 55 МЕ/дл, от приблизительно 1 до приблизительно 50 МЕ/дл, от приблизительно 1 до приблизительно 45 МЕ/дл, от приблизительно 1 до приблизительно 40 МЕ/дл, от приблизительно 1 до приблизительно 35 МЕ/дл, от приблизительно 1 до приблизительно 30 МЕ/дл, от приблизительно 1 до приблизительно 25 МЕ/дл, от приблизительно 25 до приблизительно 125 МЕ/дл, от приблизительно 50 до приблизительно 100 МЕ/дл, от приблизительно 50 до приблизительно 75 МЕ/дл, от приблизительно 75 до приблизительно 100 МЕ/дл, от приблизительно 1 до приблизительно 20 МЕ/дл, от приблизительно 2 до приблизительно 20 МЕ/дл, от приблизительно 3 до приблизительно 20 МЕ/дл, от приблизительно 4 до приблизительно 20 МЕ/дл, от приблизительно 5 до приблизительно 20 МЕ/дл, от приблизительно 6 до приблизительно 20 МЕ/дл, от приблизительно 7 до приблизительно 20 МЕ/дл, от приблизительно 8 до приблизительно 20 МЕ/дл, от приблизительно 9 до приблизительно 20 МЕ/дл или от приблизительно 10 до приблизительно 20 МЕ/дл. Лечение или осуществление лечения заболевания или состояния может также включать поддержание активности FVIII у субъекта на уровне, сравнимом по меньшей мере приблизительно с 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 100%, 105%, 110%, 115%, 120%, 125%, 130%, 135%, 140%, 145%, или 150% активности FVIII у субъекта, не страдающего гемофилией. Минимальный остаточный уровень, необходимый для лечения, может быть измерен с помощью одного или нескольких известных способов и может быть скорректирован (увеличен или уменьшен) для каждого человека.

[100] "Введение", как используется в данном документе, означает предоставление фармацевтически приемлемой молекулы нуклеиновой кислоты, полипептида, экспрессируемого посредством нее, или вектора, содержащего молекулу нуклеиновой кислоты, согласно настоящему изобретению субъекту фармацевтически приемлемым путем. Пути введения могут быть внутривенными, например внутривенной инъекцией и внутривенной инфузией. Дополнительные пути введения включают, например, подкожное, внутримышечное, пероральное, назальное и легочное введение. Молекулы нуклеиновой кислоты, полипептиды и векторы можно вводить в составе фармацевтической композиции, содержащей по меньшей мере одно вспомогательное вещество.

[101] Термин "фармацевтически приемлемый", используемый в данном документе, относится к молекулярным объектам и композициям, которые являются физиологически переносимыми и, как правило, не вызывают токсичности или аллергической или подобной нежелательной реакции, такой как расстройство желудка, головокружение и т. п., при введении человеку. Необязательно, используемый в данном документе термин" фармацевтически приемлемый" означает одобрение регулирующим органом федерального правительства или правительства штатов или приведение в Фармакопее США или другой общепризнанной фармакопее для применения у животных, и более конкретно у людей.

[102] Используемая в данном документе фраза "нуждающийся в этом субъект" включает субъектов, таких как субъекты-млекопитающие, которые получат пользу от введения молекулы нуклеиновой кислоты, полипептида или вектора согласно настоящему изобретению, например в отношении улучшения гемостаза. В одном варианте осуществления субъекты включают без ограничения индивидуумов с гемофилией. В другом варианте осуществления субъекты включают без ограничения индивидуумов, у которых выработался ингибитор терапевтического белка, например фактора свертывания крови, например FVIII, и которые, таким образом, нуждаются в терапии шунтирующего действия. Субъектом может являться взрослый или несовершеннолетний (например, в возрасте до 12 лет).

[103] Используемый в данном документе термин "терапевтический белок" относится к любому полипептиду, известному из уровня техники, который можно вводить субъекту. В некоторых вариантах осуществления терапевтический белок предусматривает белок, выбранный из фактора свертывания крови, фактора роста, антитела, их функционального фрагмента или их комбинации. Используемый в данном документе термин "фактор свертывания крови" относится к молекулам или их аналогам, встречающимся в природе или полученным рекомбинантным путем, которые предупреждают или снижают продолжительность эпизода кровотечения у субъекта. Другими словами, он подразумевает молекулы, характеризующиеся положительной свертывающей активностью, т. е. отвечающими за превращение фибриногена в сеть из нерастворимого фибрина, обуславливающую коагулирование или свертывание крови. "Фактор свертывания крови", используемый в данном документе, включает активированный фактор свертывания крови, его зимоген или активируемый фактор свертывания крови. "Активируемый фактор свертывания крови" представляет собой фактор свертывания крови в неактивной форме (например, в форме его зимогена), который способен к переходу в активную форму. Термин "фактор свертывания крови" включает без ограничения фактор I (FI), фактор II (FII), фактор V (FV), FVII, FVIII, FIX, фактор X (FX), фактор XI (FXI), фактор XII (FXII), фактор XIII (FXIII), фактор фон Виллебранда (VWF), прекалликреин, высокомолекулярный кининоген, фибронектин, антитромбин III, кофактор гепарина II, белок C, белок S, белок Z, ингибитор белок Z-подобной протеазы (ZPI), плазминоген, альфа-2-антиплазмин, тканевой активатор плазминогена (tPA), урокиназу, ингибитор активатора плазминогена 1 (PAI-1), ингибитор активатора плазминогена 2 (PAI2), их зимогены, их активированные формы или любую их комбинацию.

[104] Свертывающая активность, применяемая в данном документе, означает способность принимать участие в каскаде биохимических реакций, который приводит к образованию фибринового сгустка и/или уменьшает тяжесть, продолжительность или частоту кровоизлияния или эпизода кровотечения.

[105] "Фактор роста", используемый в данном документе, включает любой фактор роста, известный из уровня техники, в том числе цитокины и гормоны. В некоторых вариантах осуществления фактор роста выбран из адреномедуллина (AM), ангиопоэтина (Ang), аутокринного фактора миграции, костного морфогенетического белка (BMP) (например, BMP2, BMP4, BMP5, BMP7), представителя семейства цилиарных нейротрофических факторов (например, цилиарного нейротрофического фактора (CNTF), фактора, ингибирующего лейкоз (LIF), интерлейкина-6 (IL-6)), колониестимулирующего фактора (например, макрофагального колониестимулирующего фактора (m-CSF), гранулоцитарного колониестимулирующего фактора (G-CSF), гранулоцитарно-макрофагального колониестимулирующего фактора (GM-CSF)), эпидермального фактора роста (EGF), эфрина (например, эфрина A1, эфрина A2, эфрина A3, эфрина A4, эфрина A5, эфрина B1, эфрина B2, эфрина B3), эритропоэтина (EPO), фактора роста фибробластов (FGF) (например, FGF1, FGF2, FGF3, FGF4, FGF5, FGF6, FGF7, FGF8, FGF9, FGF10, FGF11, FGF12, FGF13, FGF14, FGF15, FGF16, FGF17, FGF18, FGF19, FGF20, FGF21, FGF22, FGF23), фетального бычьего соматотропина (FBS), представителя семейства GDNF (например, нейротрофического фактора линии глиальных клеток (GDNF), нейротурина, персефина и артемина), фактора роста и дифференцировки-9 (GDF9), фактора роста гепатоцитов (HGF), фактора роста, происходящего из гепатомы (HDGF), инсулина, инсулиноподобных факторов роста (например, инсулиноподобного фактора роста-1 (IGF-1) или IGF-2, интерлейкина (IL) (например, IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, IL-7), фактора роста кератиноцитов (KGF), фактора, стимулирующего миграцию (MSF), белка, стимулирующего макрофаги (MSP или белка, подобного фактору роста гепатоцитов (HGFLP)), миостатина (GDF-8), нейрегулина (например, нейрегулина 1 (NRG1), NRG2, NRG3, NRG4), нейротрофина (например, нейротрофического фактора головного мозга (BDNF), фактор роста нервов (NGF), нейротрофина-3 (NT-3), NT-4, плацентарного фактора роста (PGF), тромбоцитарного фактора роста (PDGF), реналазы (RNLS), фактора роста Т-клеток (TCGF), тромбопоэтина (TPO), трансформирующего фактора роста (например, трансформирующего фактора роста-альфа (TGF-α), TGF-β, фактора некроза опухоли-альфа (TNF-α) и фактора роста эндотелия сосудов (VEGF).

[106] В некоторых вариантах осуществления терапевтический белок кодируется геном, выбранным из X-сцепленного дистрофина, MTM1 (миотубуларина), тирозингидроксилазы, AADC, циклогидролазы, SMN1, FXN (фратаксина), GUCY2D, RS1, CFH, HTRA, ARMS, CFB/CC2, CNGA/CNGB, Prf65, ARSA, PSAP, IDUA (MPS I), IDS (MPS II), PAH, GAA (кислой альфа-глюкозидазы) или любой их комбинации.

[107] Используемые в данном документе термины "гетерологичный" или "экзогенный" относятся к таким молекулам, которые, в данном контексте, обычно не встречаются, например, в клетке или в полипептиде. Например, экзогенная или гетерологичная молекула может быть введена в клетку и присутствуют только после проведения манипуляции с клеткой, например, путем трансфекции или других способов генной инженерии, или гетерологичная аминокислотная последовательность может быть представлена в белке, в котором она обычно не встречается.

[108] Используемый в данном документе термин "гетерологичная нуклеотидная последовательность" относится к нуклеотидной последовательности, которая не встречается в природе с данной полинуклеотидной последовательностью. В одном варианте осуществления гетерологичная нуклеотидная последовательность кодирует полипептид, способный обеспечивать увеличение периода полужизни терапевтического белка, например фактора свертывания крови, например FVIII. В другом варианте осуществления гетерологичная нуклеотидная последовательность кодирует полипептид, который увеличивает гидродинамический радиус терапевтического белка, например фактора свертывания крови, например FVIII. В других вариантах осуществления гетерологичная нуклеотидная последовательность кодирует полипептид, который улучшает одно или несколько фармакокинетических свойств терапевтического белка без значительного влияния на его биологическую активность или функцию (например, прокоагулянтную активность). В некоторых вариантах осуществления терапевтический белок связан с кодируемым гетерологичной нуклеотидной последовательностью полипептидом или присоединен к нему с помощью линкера. Неограничивающие примеры полипептидных компонентов, кодируемых гетерологичными нуклеотидными последовательностями, включают константную область иммуноглобулина или ее часть, альбумин или его фрагмент, альбумин-связывающий компонент, трансферрин, полипептиды PAS согласно заявке на патент США № 20100292130, последовательность HAP, трансферрин или его фрагмент, C-концевой пептид (CTP) β-субъединицы хорионического гонадотропина человека, альбумин-связывающую малую молекулу, последовательность XTEN, компоненты, связывающие FcRn (например, полные Fc-области или их части, которые связываются с FcRn), одноцепочечные Fc-области (ScFc-области, например, описанные в US 2008/0260738, WO 2008/012543 или WO 2008/1439545), полиглициновые линкеры, полисериновые линкеры, пептиды и короткие полипептиды из 6-40 аминокислот на основе двух типов аминокислот, выбранных из глицина (G), аланина (A), серина (S), треонина (T), глутамата (E) и пролина (P), характеризующиеся различной степенью образования вторичной структуры, составляющей от менее 50% до более 50%, среди прочего, или две или более их комбинаций. В некоторых вариантах осуществления полипептид, кодируемый гетерологичной нуклеотидной последовательностью, связан с компонентом, не являющимся полипептидом. Неограничивающие примеры компонентов, не являющихся полипептидом, включают полиэтиленгликоль (PEG), альбумин-связывающие малые молекулы, полисиаловую кислоту, гидроксиэтилкрахмал (HES), их производное или любые их комбинации.

[109] Используемый в данном документе термин "Fc-область" определяется как часть полипептида, которая соответствует Fc-области нативного Ig, т. e. образована путем димерной ассоциации соответствующих Fc-доменов двух его тяжелых цепей. Нативная Fc-область образует гомодимер с другой Fc-областью. В отличие от этого, термины "генетически слитая Fc-область" или "одноцепочечная Fc-область" (scFc-область), используемые в данном документе, относятся к синтетической димерной Fc-области, состоящей из Fc-доменов, генетически соединенных в одну полипептидную цепь (т. е. кодируемых одной непрерывной генетической последовательностью).

[110] В одном варианте осуществления "Fc-область" относится к части одной тяжелой цепи Ig, начинающейся в шарнирной области непосредственно выше сайта расщепления папаином (т. е. остатком 216 в IgG, если принять первый остаток константной области тяжелой цепи за 114) и заканчивающейся на С-конце антитела. Соответственно, полный Fc-домен содержит по меньшей мере шарнирный домен, CH2-домен и CH3-домен.

[111] Fc-область константной области Ig в зависимости от изотипа Ig может включать в себя домены CH2, CH3 и CH4, а также шарнирную область. Химерные белки, содержащие Fc-область Ig, наделяют химерный белок несколькими необходимыми свойствами, включая увеличенную стабильность, увеличенный период полужизни в сыворотке крови (см. Capon et al., 1989, Nature 337:525), а также связывание с Fc-рецепторами, такими как неонатальный Fc-рецептор (FcRn) (патенты США №№ 6086875, 6485726, 6030613; WO 03/077834; US2003-0235536A1, которые включены в данный документ посредством ссылки во всей своей полноте).

[112] "Эталонная нуклеотидная последовательность", при использовании в данном документе для сравнения с нуклеотидной последовательностью согласно настоящему изобретению, представляет собой полинуклеотидную последовательность, по сути идентичную нуклеотидной последовательности согласно настоящему изобретению, за исключением того, что последовательность не является оптимизированной. Например, эталонная нуклеотидная последовательность для молекулы нуклеиновой кислоты, состоящей из кодон-оптимизированной FVIII с BDD под SEQ ID NO: 1 и гетерологичной нуклеотидной последовательности, которая кодирует одноцепочечную Fc-область, связанной с SEQ ID NO: 1 со стороны своего 3'-конца, представляет собой молекулу нуклеиновой кислоты, состоящую из исходной (или "родительской") FVIII с BDD под SEQ ID NO: 16 и идентичной гетерологичной нуклеотидной последовательности, которая кодирует одноцепочечную Fc-область, связанную с SEQ ID NO: 16 со стороны своего 3'-конца.

[113] Используемый в данном документе в отношении нуклеотидных последовательностей термин "оптимизированный" относится к полинуклеотидной последовательности, которая кодирует полипептид, где полинуклеотидная последовательность была подвергнута мутации для улучшения какого-либо свойства данной полинуклеотидной последовательности. В некоторых вариантах осуществления оптимизацию выполняют для повышения уровней транскрипции, повышения уровней трансляции, повышения устойчивых уровней mRNA, повышения или снижения связывания регуляторных белков, таких как общие факторы транскрипции, повышения или снижения сплайсинга или повышения выхода полипептида, получаемого из полинуклеотидной последовательности. Примеры изменений, которые можно вносить в полинуклеотидную последовательность для ее оптимизации, включают оптимизацию в отношении кодонов, оптимизацию содержания G/C, удаление последовательностей повторов, удаление богатых AT элементов, удаление криптических сайтов сплайсинга, удаление элементов, действующих в цис-положении, которые подавляют транскрипцию или трансляцию, добавление или удаление последовательностей poly-T или poly-A, добавление последовательностей около сайта инициации транскрипции, которые усиливают транскрипцию, как например консенсусные последовательности Козак, удаление последовательностей, которые могут образовывать структуры "стебель-петля", удаление дестабилизирующих последовательностей и две или более их комбинаций.

II. Молекулы нуклеиновой кислоты

[114] Настоящее изобретение направлено на плазмидоподобную не предусматривающую наличия капсида молекулу нуклеиновой кислоты, которая кодирует терапевтический белок или ген, который может модулировать экспрессию целевого белка. Капсид, представляющий собой белковую оболочку вируса, заключает в себе генетический материал вируса. Известно, что капсиды способствуют выполнению функций вириона путем защиты вирусного генома, доставки генома к хозяину и взаимодействия с хозяином. Тем не менее, вирусные капсиды могут являться фактором, ограничивающим пакующую способность векторов и/или индуцирующим иммунные ответы, особенно при применении в генной терапии.

[115] Векторы на основе AAV стали одним из наиболее распространенных типов генотерапевтических векторов. Однако наличие капсида ограничивает применимость вектора на основе AAV в генной терапии. В частности, капсид сам по себе может ограничивать размер трансгена, который включают в вектор, до менее 4,5 т. п. н. Различные терапевтические белки, которые могут быть применимыми в генной терапии, легко могут превышать данный размер даже до добавления регуляторных элементов.

[116] Кроме того, белки, из которых состоит капсид, могут выступать в качестве антигенов, которые могут становиться мишенью для иммунной системы субъекта. AAV широко распространен среди населения в целом, при этом большинство людей подвергались воздействию AAV в течение своей жизни. В результате этого у большинства потенциальных реципиентов генной терапии, по всей вероятности, уже развился иммунный ответ в отношении AAV, и, таким образом, для них с большей долей вероятности терапия окажется неэффективной.

[117] Определенные аспекты настоящего изобретения направлены на преодоление таких недостатков векторов на основе AAV. В частности, определенные аспекты настоящего изобретения направлены на молекулу нуклеиновой кислоты, содержащую первый ITR, второй ITR и генную кассету, например, кодирующую терапевтический белок и/или miRNA. В некоторых вариантах осуществления молекула нуклеиновой кислоты не содержит ген, кодирующий капсидный белок, белок репликации и/или белок сборки. В некоторых вариантах осуществления генная кассета кодирует терапевтический белок. В некоторых вариантах осуществления терапевтический белок предусматривает фактор свертывания крови. В некоторых вариантах осуществления генная кассета кодирует miRNA. В некоторых вариантах осуществления генная кассета расположена между первым ITR и вторым ITR. В некоторых вариантах осуществления молекула нуклеиновой кислоты дополнительно содержит одну или несколько некодирующих областей. В некоторых вариантах осуществления одна или несколько некодирующих областей включают промоторную последовательность, интрон, посттранскрипционный регуляторный элемент, последовательность poly(А) 3'-UTR или любую их комбинацию.

[118] В одном варианте осуществления генная кассета предусматривает однонитевую нуклеиновую кислоту. В другом варианте осуществления генная кассета предусматривает двухнитевую нуклеиновую кислоту.

[119] В одном варианте осуществления молекула нуклеиновой кислоты содержит

(a) первый ITR, который представляет собой ITR вируса, отличного от AAV, являющегося представителем семейства Parvoviridae;

(c) интрон, например синтетический интрон;

(d) нуклеотид, кодирующий miRNA или терапевтический белок, например фактор свертывания крови;

(f) последовательность poly(А)-хвоста 3'-UTR, например bGHpA;

(g) второй ITR, который представляет собой ITR вируса, отличного от AAV, являющегося представителем семейства Parvoviridae.

[120] В одном варианте осуществления молекула нуклеиновой кислоты содержит

(c) интрон, например синтетический интрон;

(d) нуклеотид, кодирующий miRNA, где miRNA понижает экспрессию целевого гена, выбранного из SOD1, HTT, RHO и любой их комбинации;

[121] В одном варианте осуществления молекула нуклеиновой кислоты содержит

(c) интрон, например синтетический интрон;

(d) нуклеотид, кодирующий X-сцепленный дистрофин, MTM1 (миотубуларин), тирозингидроксилазу, AADC, циклогидролазу, SMN1, FXN (фратаксин), GUCY2D, RS1, CFH, HTRA, ARMS, CFB/CC2, CNGA/CNGB, Prf65, ARSA, PSAP, IDUA (MPS I), IDS (MPS II), PAH, GAA (кислую альфа-глюкозидазу) или любую их комбинацию;

[122] В одном варианте осуществления молекула нуклеиновой кислоты содержит

(a) первый ITR, который представляет собой ITR AAV, например генома AAV серотипа 2;

(c) интрон, например синтетический интрон;

(d) нуклеотид, кодирующий FVIII; где нуклеотид характеризуется по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидной последовательностью, выбранной из SEQ ID NO: 1-14 или SEQ ID NO: 71, при этом FVIII, кодируемый нуклеотидом, сохраняет активность FVIII;

(g) второй ITR, который представляет собой ITR AAV, например генома AAV серотипа 2.

[123] В одном варианте осуществления молекула нуклеиновой кислоты содержит

(c) интрон, например синтетический интрон;

(d) нуклеотид, кодирующий miRNA, где miRNA понижает экспрессию целевого гена, например SOD1, HTT, RHO и любой их комбинации;

[124] В одном варианте осуществления молекула нуклеиновой кислоты содержит

(c) интрон, например синтетический интрон;

[125] В другом варианте осуществления молекула нуклеиновой кислоты содержит

(a) первый ITR;

(c) интрон, например синтетический интрон;

(g) второй ITR,

где один из первого ITR или второго ITR представляет собой ITR вируса, отличного от AAV, являющегося представителем семейства Parvoviridae, и другой ITR представляет собой ITR AAV, например генома AAV серотипа 2.

[126] В другом варианте осуществления молекула нуклеиновой кислоты содержит

(a) первый ITR;

(b) последовательность тканеспецифического промотора, промотора TTP;

(c) интрон, например синтетический интрон;

(g) второй ITR,

где первый ITR является синтетическим ITR, второй ITR является синтетическим ITR, или как первый ITR, так и второй ITR являются синтетическими ITR.

A. Инвертированные концевые повторы

[127] Определенные аспекты настоящего изобретения направлены на молекулу нуклеиновой кислоты, содержащую первый ITR, например 5'-ITR, и второй ITR, например 3'-ITR. Как правило, ITR вовлечены в репликацию и спасение ДНК парвовируса (например, AAV) или вырезание из прокариотических плазмид (Samulski et al., 1983, 1987; Senapathy et al., 1984; Gottlieb and Muzyczka, 1988). Кроме того, ITR, очевидно, представляют собой минимальные последовательности, требующиеся для провирусной интеграции AAV и для упаковки ДНК AAV в вирионы (McLaughlin et al., 1988; Samulski et al., 1989). Такие элементы являются ключевыми для эффективного размножения генома парвовируса. Предполагается, что минимальные определяющие элементы, совершенно необходимые для функции ITR, представляют собой Rep-связывающий сайт (например, RBS; GCGCGCTCGCTCGCTC (SEQ ID NO: 104) для AAV2) и сайт концевого разрешения (например, TRS; AGTTGG (SEQ ID NO: 105) для AAV2) с вариабельной палиндромной последовательностью, обеспечивающей возможность образования шпилечной структуры. Палиндромные нуклеотидные области, как правило, осуществляют свою функцию вместе в цис-положении в качестве точки начала репликации ДНК и в качестве сигнальных последовательностей упаковки для вируса. Комплементарные последовательности в ITR подвергаются укладке в шпилечную структуру в ходе репликации ДНК. В некоторых вариантах осуществления ITR подвергаются укладке в шпилечную T-образную структуру. В других вариантах осуществления ITR подвергаются укладке в шпилечные структуры, отличные от T-образной, например, в U-образную шпилечную структуру. Данные свидетельствуют о том, что T-образные шпилечные структуры в ITR AAV могут подавлять экспрессию трансгена, фланкированного ITR. См., например, Zhou et al., Scientific Reports 7:5432 (July 14, 2017). За счет использования ITR, которые не образует T-образные шпилечные структуры, этой формы подавления можно избежать. Следовательно, в определенных аспектах полинуклеотид, содержащий ITR не из AAV, характеризуется улучшенной экспрессией трансгена по сравнению с полинуклеотидом, содержащим ITR AAV, который образует T-образную шпильку.

[128] В некоторых вариантах осуществления ITR содержит встречающийся в природе ITR, например, ITR содержит весь ITR парвовируса или его часть. В некоторых вариантах осуществления ITR содержит синтетическую последовательность. В одном варианте осуществления первый ITR или второй ITR содержат синтетическую последовательность. В другом варианте осуществления каждый из первого ITR и второго ITR содержит синтетическую последовательность. В некоторых вариантах осуществления первый ITR или второй ITR содержат встречающуюся в природе последовательность. В другом варианте осуществления каждый из первого ITR и второго ITR содержит встречающуюся в природе последовательность.

[129] В некоторых вариантах осуществления ITR содержит часть встречающегося в природе ITR, например усеченного ITR, или состоит из него. В некоторых вариантах осуществления ITR содержит фрагмент встречающегося в природе ITR или состоит из него, где фрагмент содержит по меньшей мере приблизительно 5 нуклеотидов, по меньшей мере приблизительно 10 нуклеотидов, по меньшей мере приблизительно 15 нуклеотидов, по меньшей мере приблизительно 20 нуклеотидов, по меньшей мере приблизительно 25 нуклеотидов, по меньшей мере приблизительно 30 нуклеотидов, по меньшей мере приблизительно 35 нуклеотидов, по меньшей мере приблизительно 40 нуклеотидов, по меньшей мере приблизительно 45 нуклеотидов, по меньшей мере приблизительно 50 нуклеотидов, по меньшей мере приблизительно 55 нуклеотидов, по меньшей мере приблизительно 60 нуклеотидов, по меньшей мере приблизительно 65 нуклеотидов, по меньшей мере приблизительно 70 нуклеотидов, по меньшей мере приблизительно 75 нуклеотидов, по меньшей мере приблизительно 80 нуклеотидов, по меньшей мере приблизительно 85 нуклеотидов, по меньшей мере приблизительно 90 нуклеотидов, по меньшей мере приблизительно 95 нуклеотидов, по меньшей мере приблизительно 100 нуклеотидов, по меньшей мере приблизительно 125 нуклеотидов, по меньшей мере приблизительно 150 нуклеотидов, по меньшей мере приблизительно 175 нуклеотидов, по меньшей мере приблизительно 200 нуклеотидов, по меньшей мере приблизительно 225 нуклеотидов, по меньшей мере приблизительно 250 нуклеотидов, по меньшей мере приблизительно 275 нуклеотидов, по меньшей мере приблизительно 300 нуклеотидов, по меньшей мере приблизительно 325 нуклеотидов, по меньшей мере приблизительно 350 нуклеотидов, по меньшей мере приблизительно 375 нуклеотидов, по меньшей мере приблизительно 400 нуклеотидов, по меньшей мере приблизительно 425 нуклеотидов, по меньшей мере приблизительно 450 нуклеотидов, по меньшей мере приблизительно 475 нуклеотидов, по меньшей мере приблизительно 500 нуклеотидов, по меньшей мере приблизительно 525 нуклеотидов, по меньшей мере приблизительно 550 нуклеотидов, по меньшей мере приблизительно 575 нуклеотидов или по меньшей мере приблизительно 600 нуклеотидов; где ITR сохраняет функциональное свойство встречающегося в природе ITR. В определенных вариантах осуществления ITR содержит фрагмент встречающегося в природе ITR или состоит из него, где фрагмент содержит по меньшей мере приблизительно 129 нуклеотидов; где ITR сохраняет функциональное свойство встречающегося в природе ITR. В определенных вариантах осуществления ITR содержит фрагмент встречающегося в природе ITR или состоит из него, где фрагмент содержит по меньшей мере приблизительно 102 нуклеотида; где ITR сохраняет функциональное свойство встречающегося в природе ITR.

[130] В некоторых вариантах осуществления ITR содержит часть встречающегося в природе ITR вируса или состоит из нее, где фрагмент составляет по меньшей мере приблизительно 5%, по меньшей мере приблизительно 10%, по меньшей мере приблизительно 15%, по меньшей мере приблизительно 20%, по меньшей мере приблизительно 25%, по меньшей мере приблизительно 30%, по меньшей мере приблизительно 35%, по меньшей мере приблизительно 40%, по меньшей мере приблизительно 45%, по меньшей мере приблизительно 50%, по меньшей мере приблизительно 55%, по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% от длины встречающегося в природе ITR; где фрагмент сохраняет функциональное свойство встречающегося в природе ITR.

[131] В определенных вариантах осуществления ITR содержит или состоит из последовательности, которая характеризуется по меньшей мере 50%, по меньшей мере 51%, по меньшей мере 52%, по меньшей мере 53%, по меньшей мере 54%, по меньшей мере 55%, по меньшей мере 56%, по меньшей мере 57%, по меньшей мере 58%, по меньшей мере 59%, по меньшей мере 60%, по меньшей мере 61%, по меньшей мере 62%, по меньшей мере 63%, по меньшей мере 64%, по меньшей мере 65%, по меньшей мере 66%, по меньшей мере 67%, по меньшей мере 68%, по меньшей мере 69%, по меньшей мере 70%, по меньшей мере 71%, по меньшей мере 72%, по меньшей мере 73%, по меньшей мере 74%, по меньшей мере 75%, по меньшей мере 76%, по меньшей мере 77%, по меньшей мере 78%, по меньшей мере 79%, по меньшей мере 80%, по меньшей мере 81%, по меньшей мере 82%, по меньшей мере 83%, по меньшей мере 84%, по меньшей мере 85%, по меньшей мере 86%, по меньшей мере 87%, по меньшей мере 88%, по меньшей мере 89%, по меньшей мере 90%, по меньшей мере 91%, по меньшей мере 92%, по меньшей мере 93%, по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98%, по меньшей мере 99% или 100% идентичностью последовательности с гомологичной частью встречающегося в природе ITR при их соответствующем выравнивании; где ITR сохраняет функциональное свойство встречающегося в природе ITR. В других вариантах осуществления ITR содержит или состоит из последовательности, которая характеризуется по меньшей мере 90% идентичностью последовательности с гомологичной частью встречающегося в природе ITR при их соответствующем выравнивании; где ITR сохраняет функциональное свойство встречающегося в природе ITR. В некоторых вариантах осуществления ITR содержит или состоит из последовательности, которая характеризуется по меньшей мере 80% идентичностью последовательности с гомологичной частью встречающегося в природе ITR при их соответствующем выравнивании; где ITR сохраняет функциональное свойство встречающегося в природе ITR. В некоторых вариантах осуществления ITR содержит или состоит из последовательности, которая характеризуется по меньшей мере 70% идентичностью последовательности с гомологичной частью встречающегося в природе ITR при их соответствующем выравнивании; где ITR сохраняет функциональное свойство встречающегося в природе ITR. В некоторых вариантах осуществления ITR содержит или состоит из последовательности, которая характеризуется по меньшей мере 60% идентичностью последовательности с гомологичной частью встречающегося в природе ITR при их соответствующем выравнивании; где ITR сохраняет функциональное свойство встречающегося в природе ITR. В некоторых вариантах осуществления ITR содержит или состоит из последовательности, которая характеризуется по меньшей мере 50% идентичностью последовательности с гомологичной частью встречающегося в природе ITR при их соответствующем выравнивании; где ITR сохраняет функциональное свойство встречающегося в природе ITR.

[132] В некоторых вариантах осуществления ITR содержит ITR из генома AAV. В некоторых вариантах осуществления ITR представляет собой ITR из генома AAV, выбранного из AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11 и любой их комбинации. В конкретном варианте осуществления ITR представляет собой ITR из генома AAV2. В другом варианте осуществления ITR представляет собой синтетическую последовательность, генетически сконструированную с включением на ее 5′- и 3′-концах ITR, полученных из одного или нескольких геномов AAV.

[133] В некоторых вариантах осуществления ITR не является полученным из генома AAV. В некоторых вариантах осуществления ITR представляет собой ITR вируса, отличного от AAV. В некоторых вариантах осуществления ITR представляет собой ITR из генома вируса, отличного от AAV, из семейства вирусов Parvoviridae, выбранного из группы, состоящей без ограничения из Bocavirus, Dependovirus, Erythrovirus, Amdovirus, Parvovirus, Densovirus, Iteravirus, Contravirus, Aveparvovirus, Copiparvovirus, Protoparvovirus, Tetraparvovirus, Ambidensovirus, Brevidensovirus, Hepandensovirus, Penstyldensovirus и любой их комбинации. В определенных вариантах осуществления ITR получен из эритровируса, представляющего собой парвовирус B19 (вирус человека). В другом варианте осуществления ITR получен из штамма парвовируса мускусных уток (MDPV). В определенных вариантах осуществления штамм MDPV является аттенуированным, например, представляет собой штамм FZ91-30 MDPV. В других вариантах осуществления штамм MDPV является патогенным, например, представляет собой штамм YY MDPV. В некоторых вариантах осуществления ITR получен из парвовируса свиней, например, парвовируса U44978 свиней. В некоторых вариантах осуществления ITR получен из мелкого вируса мышей, например, мелкого вируса мышей U34256. В некоторых вариантах осуществления ITR получен из собачьего парвовируса, например, собачьего парвовируса M19296. В некоторых вариантах осуществления ITR получен из вируса энтерита норок, например, вируса энтерита норок D00765. В некоторых вариантах осуществления ITR получен из вируса рода Dependoparvovirus. В одном варианте осуществления Dependoparvovirus представляет собой штамм парвовируса гусей (GPV) рода Dependovirus. В конкретном варианте осуществления штамм GPV является аттенуированным, например, представляет собой штамм 82-0321V GPV. В другом конкретном варианте осуществления штамм GPV является патогенным, например, представляет собой штамм B GPV.

[134] Первый ITR и второй ITR молекулы нуклеиновой кислоты могут быть получены из одного и того же генома, например, из генома одного и того же вируса, или из различных геномов, например, из геномов двух или более различных геномов вирусов. В определенных вариантах осуществления первый ITR и второй ITR получены из одного и того же генома AAV. В конкретном варианте осуществления два ITR, присутствующих в молекуле нуклеиновой кислоты по настоящему изобретению, являются одинаковыми, и могут, в частности, представлять собой ITR AAV2. В других вариантах осуществления первый ITR получен из генома AAV, а второй ITR не является полученным из генома AAV (например, генома вируса, отличного от AAV). В других вариантах осуществления первый ITR не является полученным из генома AAV (например, генома вируса, отличного от AAV), а второй ITR получен из генома AAV. В еще одних вариантах осуществления как первый ITR, так и второй ITR не являются полученными из генома AAV (например, генома вируса, отличного от AAV). В одном конкретном варианте осуществления первый ITR и второй ITR являются идентичными.

[135] В некоторых вариантах осуществления первый ITR получен из генома AAV, а второй ITR получен из генома, выбранного из группы, состоящей из Bocavirus, Dependovirus, Erythrovirus, Amdovirus, Parvovirus, Densovirus, Iteravirus, Contravirus, Aveparvovirus, Copiparvovirus, Protoparvovirus, Tetraparvovirus, Ambidensovirus, Brevidensovirus, Hepandensovirus, Penstyldensovirus и любой их комбинации. В других вариантах осуществления второй ITR получен из генома AAV, а первый ITR получен из генома, выбранного из группы, состоящей из Bocavirus, Dependovirus, Erythrovirus, Amdovirus, Parvovirus, Densovirus, Iteravirus, Contravirus, Aveparvovirus, Copiparvovirus, Protoparvovirus, Tetraparvovirus, Ambidensovirus, Brevidensovirus, Hepandensovirus, Penstyldensovirus и любой их комбинации. В других вариантах осуществления первый ITR и второй ITR получены из генома, выбранного из группы, состоящей из Bocavirus, Dependovirus, Erythrovirus, Amdovirus, Parvovirus, Densovirus, Iteravirus, Contravirus, Aveparvovirus, Copiparvovirus, Protoparvovirus, Tetraparvovirus, Ambidensovirus, Brevidensovirus, Hepandensovirus, Penstyldensovirus, и любой их комбинации, где первый ITR и второй ITR получены из одного и того же генома. В других вариантах осуществления первый ITR и второй ITR получены из генома, выбранного из группы, состоящей из Bocavirus, Dependovirus, Erythrovirus, Amdovirus, Parvovirus, Densovirus, Iteravirus, Contravirus, Aveparvovirus, Copiparvovirus, Protoparvovirus, Tetraparvovirus, Ambidensovirus, Brevidensovirus, Hepandensovirus, Penstyldensovirus и любой их комбинации, где первый ITR и второй ITR получены из различных геномов.

[136] В некоторых вариантах осуществления первый ITR получен из генома AAV, а второй ITR получен из эритровируса, представляющего собой парвовирус B19 (вирус человека). В других вариантах осуществления второй ITR получен из генома AAV, а первый ITR получен из эритровируса, представляющего собой парвовирус B19 (вирус человека).

[137] В определенных вариантах осуществления первый ITR и/или второй ITR содержат весь или часть ITR, полученного из B19, или состоят из них. В некоторых вариантах осуществления первый ITR и/или второй ITR содержат или состоят из нуклеотидной последовательности, которая на по меньшей мере приблизительно 50%, по меньшей мере приблизительно 55%, по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична нуклеотидной последовательности, выбранной из SEQ ID NO: 167, 168, 169, 170 и 171, где первый ITR и/или второй ITR сохраняют функциональное свойство ITR B19, из которого они были получены. В некоторых вариантах осуществления первый ITR и/или второй ITR содержат или состоят из нуклеотидной последовательности, которая на по меньшей мере приблизительно 50%, по меньшей мере приблизительно 55%, по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична нуклеотидной последовательности, выбранной из SEQ ID NO: 167, 168, 169, 170 и 171, где первый ITR и/или второй ITR являются способными к образованию шпилечной структуры. В определенных вариантах осуществления шпилечная структура не содержит T-образную шпильку.

[138] В некоторых вариантах осуществления первый ITR и/или второй ITR содержат или состоят из нуклеотидной последовательности, выбранной из SEQ ID NO: 167, 168, 169, 170 и 171. В некоторых вариантах осуществления первый ITR и/или второй ITR содержат или состоят из нуклеотидной последовательности, изложенной под SEQ ID NO: 167. В некоторых вариантах осуществления первый ITR и/или второй ITR содержат или состоят из нуклеотидной последовательности, изложенной под SEQ ID NO: 168. В некоторых вариантах осуществления первый ITR и/или второй ITR содержат или состоят из нуклеотидной последовательности, изложенной под SEQ ID NO: 169. В некоторых вариантах осуществления первый ITR и/или второй ITR содержат или состоят из нуклеотидной последовательности, изложенной под SEQ ID NO: 170. В некоторых вариантах осуществления первый ITR и/или второй ITR содержат или состоят из нуклеотидной последовательности, изложенной под SEQ ID NO: 171.

Таблица 1. Образцы последовательностей ITR парвовируса

Парвовирус	ID ITR	Описание	Длина (п.о.)	Последовательность
B19	Дикий тип	Gene Bank: KY940273.1	383	CCAAATCAGATGCCGCCGGTCGCCGCCGGTAGGCGGGACTTCCGGTACAAGATGGCGGACAATTACGTCATTTCCTGTGACGTCATTTCCTGTGACGTCACTTCCGGTGGGCGGGACTTCCGGAATTAGGGTTGGCTCTGGGCCAGCTTGCTTGGGGTTGCCTTGACACTAAGACAAGCGGCGCGCCGCTTGATCTTAGTGGCACGTCAACCCCAAGCGCTGGCCCAGAGCCAACCCTAATTCCGGAAGTCCCGCCCACCGGAAGTGACGTCACAGGAAATGACGTCACAGGAAATGACGTAATTGTCCGCCATCTTGTACCGGAAGTCCCGCCTACCGGCGGCGACCGGCGGCATCTGATTTGGTGTCTTCTTTTAAATTTT (SEQ ID NO: 167)
	d135	За исключением первых 135 нуклеотидов	248	CTCTGGGCCAGCTTGCTTGGGGTTGCCTTGACACTAAGACAAGCGGCGCGCCGCTTGATCTTAGTGGCACGTCAACCCCAAGCGCTGGCCCAGAGCCAACCCTAATTCCGGAAGTCCCGCCCACCGGAAGTGACGTCACAGGAAATGACGTCACAGGAAATGACGTAATTGTCCGCCATCTTGTACCGGAAGTCCCGCCTACCGGCGGCGACCGGCGGCATCTGATTTGGTGTCTTCTTTTAAATTTT (SEQ ID NO: 168)
	v1	Минимальная последовательность на основе сравнения с AAV2	129	CGGCGCGCCGCTTGATCTTAGTGGCACGTCAACCAGCGCTGGCCCAGAGCCAACCCTAATTCCGGAAGTCCTCAGTCCGCCATCTTGCCCGCCTACCGGCGGCGACCGGCGGCATCATTTGGTGTTCTT (SEQ ID NO: 169)
	v2	За исключением первых 135 нуклеотидов и соответствующих комплементарных 135 нуклеотидов в палиндромной последовательности	113	CTCTGGGCCAGCTTGCTTGGGGTTGCCTTGACACTAAGACAAGCGGCGCGCCGCTTGATCTTAGTGGCACGTCAACCCCAAGCGCTGGCCCAGAGTGTCTTCTTTTAAATTTT (SEQ ID NO: 170)
	v3	Минимальная последовательность на основе сравнения с GPV	340	CAAATCAGATGCCGCCGGTCGCCGCCGGTAGGCGGGACTTCCGGTACAAGATGGCGGACAATTACGTCATTTCCTGTGACGTATTTCCTGTGACGTACTTCCGGTGGCGGGACTTCCGGAATTTTGGCTCTGGGCCAGCTTGCTTGGGGTTGCCTTGACCAAGCGCGCGCCGCTTGATCACCCCAAGCGCTGGCCCAGAGCCACCTAACCGGAAGTCCCCCCACCGGAAGTGACGTCACAGGAAAGACGTCACAGGAAGTAATTGTCCGCCATCTTGTACCGGAAGTCCCGCACCGGCGGCGACCGGCGGCATCTGATTTGGTGTCTTCTTTTAAATTTT (SEQ ID NO: 171)
GPV	Дикий тип	Gene Bank: U25749.1	444	CTCATTGGAGGGTTCGTTCGTTCGAACCAGCCAATCAGGGGAGGGGGAAGTGACGCAAGTTCCGGTCACATGCTTCCGGTGACGCACATCCGGTGACGTAGTTCCGGTCACGTGCTTCCTGTCACGTGTTTCCGGTCACGTGACTTCCGGTCATGTGACTTCCGGTGACGTGTTTCCGGCTGTTAGGTTGACCACGCGCATGCCGCGCGGTCAGCCCAATAGTTAAGCCGGAAACACGTCACCGGAAGTCACATGACCGGAAGTCACGTGACCGGAAACACGTGACAGGAAGCACGTGACCGGAACTACGTCACCGGATGTGCGTCACCGGAAGCATGTGACCGGAACTTGCGTCACTTCCCCCTCCCCTGATTGGCTGGTTCGAACGAACGAACCCTCCAATGAGACTCAAGGACAAGAGGATATTTTGCGCGCCAGGAAGTG (SEQ ID NO: 172)
	d162	За исключением первых 162 нуклеотидов	282	CGGTGACGTGTTTCCGGCTGTTAGGTTGACCACGCGCATGCCGCGCGGTCAGCCCAATAGTTAAGCCGGAAACACGTCACCGGAAGTCACATGACCGGAAGTCACGTGACCGGAAACACGTGACAGGAAGCACGTGACCGGAACTACGTCACCGGATGTGCGTCACCGGAAGCATGTGACCGGAACTTGCGTCACTTCCCCCTCCCCTGATTGGCTGGTTCGAACGAACGAACCCTCCAATGAGACTCAAGGACAAGAGGATATTTTGCGCGCCAGGAAGTG (SEQ ID NO: 173)
	v1	Минимальная последовательность на основе сравнения с AAV2	145	TTGACCACGCGCATGCCGCGCGGTCAGCCCAATAGTTAAGCCGGGTGACCACACGTGACAGGAAGCACGGGATGTGCGTCACCGGAAGCAGTGACCGGGCTGGTTCGAACGAACGAACCCTCCAACTCAAGGACAAGAGGATATT (SEQ ID NO: 174)
	v2	За исключением первых 162 нуклеотидов и соответствующих комплементарных 162 нуклеотидов в палиндромной последовательности	120	CGGTGACGTGTTTCCGGCTGTTAGGTTGACCACGCGCATGCCGCGCGGTCAGCCCAATAGTTAAGCCGGAAACACGTCACCGACTCAAGGACAAGAGGATATTTTGCGCGCCAGGAAGTG (SEQ ID NO: 175)
	v3	Минимальная последовательность на основе сравнения с B19	102	GGGAACAATCAGGGGAAGTGACCGGTGACGTCATGTAACTTGCGTCACTTCCCGTTCGAACGAACGAACGAGACTCAAGGACAAGAGGCGCGCCAGGAAGTG (SEQ ID NO: 176)
AAV2	Дикий тип	Gene Bank: NC_001401.2	145	TTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCT (SEQ ID NO: 177)
AAV2	GTx	Используемый в векторах GTx	130	CTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCT (SEQ ID NO: 178)

[139] В определенных вариантах осуществления первый ITR и/или второй ITR содержат нуклеотидную последовательность, где нуклеотидная последовательность содержит минимальную нуклеотидную последовательность, изложенную под SEQ ID NO: 169, и где нуклеотидная последовательность на по меньшей мере приблизительно 50%, по меньшей мере приблизительно 55%, по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична нуклеотидной последовательности, изложенной под SEQ ID NO: 167, сохраняют функциональное свойство ITR B19, из которого они были получены. В некоторых вариантах осуществления первый ITR и/или второй ITR содержат нуклеотидную последовательность, где нуклеотидная последовательность содержит минимальную нуклеотидную последовательность, изложенную под SEQ ID NO: 169, и где нуклеотидная последовательность на по меньшей мере приблизительно 50%, по меньшей мере приблизительно 55%, по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична нуклеотидной последовательности, изложенной под SEQ ID NO: 167, где первый ITR и/или второй ITR являются способными к образованию шпилечной структуры. В определенных вариантах осуществления шпилечная структура не содержит T-образную шпильку.

[140] В некоторых вариантах осуществления первый ITR получен из генома AAV, а второй ITR получен из GPV. В других вариантах осуществления второй ITR получен из генома AAV, а первый ITR получен из GPV.

[141] В определенных вариантах осуществления первый ITR и/или второй ITR содержат весь или часть ITR, полученного из GPV, или состоят из них. В некоторых вариантах осуществления первый ITR и/или второй ITR содержат или состоят из нуклеотидной последовательности, которая на по меньшей мере приблизительно 50%, по меньшей мере приблизительно 55%, по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична нуклеотидной последовательности, выбранной из SEQ ID NO: 172, 173, 174, 175 и 176, где первый ITR и/или второй ITR сохраняют функциональное свойство ITR GPV, из которого они были получены. В некоторых вариантах осуществления первый ITR и/или второй ITR содержат весь или часть ITR, полученного из GPV, или состоят из них. В некоторых вариантах осуществления первый ITR и/или второй ITR содержат или состоят из нуклеотидной последовательности, которая на по меньшей мере приблизительно 50%, по меньшей мере приблизительно 55%, по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична нуклеотидной последовательности, выбранной из SEQ ID NO: 172, 173, 174, 175 и 176, где первый ITR и/или второй ITR являются способными к образованию шпилечной структуры. В определенных вариантах осуществления шпилечная структура не содержит T-образную шпильку. В некоторых вариантах осуществления первый ITR и/или второй ITR содержат или состоят из нуклеотидной последовательности, выбранной из SEQ ID NO: 172, 173, 174, 175 и 176. В некоторых вариантах осуществления первый ITR и/или второй ITR содержат или состоят из нуклеотидной последовательности, изложенной под SEQ ID NO: 172. В некоторых вариантах осуществления первый ITR и/или второй ITR содержат или состоят из нуклеотидной последовательности, изложенной под SEQ ID NO: 173. В некоторых вариантах осуществления первый ITR и/или второй ITR содержат или состоят из нуклеотидной последовательности, изложенной под SEQ ID NO: 174. В некоторых вариантах осуществления первый ITR и/или второй ITR содержат или состоят из нуклеотидной последовательности, изложенной под SEQ ID NO: 175. В некоторых вариантах осуществления первый ITR и/или второй ITR содержат или состоят из нуклеотидной последовательности, изложенной под SEQ ID NO: 176.

[142] В определенных вариантах осуществления первый ITR и/или второй ITR содержат нуклеотидную последовательность, где нуклеотидная последовательность содержит минимальную нуклеотидную последовательность, изложенную под SEQ ID NO: 174, и где нуклеотидная последовательность на по меньшей мере приблизительно 50%, по меньшей мере приблизительно 55%, по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична нуклеотидной последовательности, изложенной под SEQ ID NO: 172, где первый ITR и/или второй ITR сохраняют функциональное свойство ITR GPV, из которого они были получены. В некоторых вариантах осуществления первый ITR и/или второй ITR содержат нуклеотидную последовательность, где нуклеотидная последовательность содержит минимальную нуклеотидную последовательность, изложенную под SEQ ID NO: 174, и где нуклеотидная последовательность на по меньшей мере приблизительно 50%, по меньшей мере приблизительно 55%, по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична нуклеотидной последовательности, изложенной под SEQ ID NO: 172, где первый ITR и/или второй ITR являются способными к образованию шпилечной структуры. В определенных вариантах осуществления шпилечная структура не содержит T-образную шпильку.

[143] В определенных вариантах осуществления первый ITR и/или второй ITR содержат нуклеотидную последовательность, где нуклеотидная последовательность содержит минимальную нуклеотидную последовательность, изложенную под SEQ ID NO: 176, и где нуклеотидная последовательность на по меньшей мере приблизительно 50%, по меньшей мере приблизительно 55%, по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична нуклеотидной последовательности, изложенной под SEQ ID NO: 172, где первый ITR и/или второй ITR сохраняют функциональное свойство ITR GPV, из которого они были получены. В некоторых вариантах осуществления первый ITR и/или второй ITR содержат нуклеотидную последовательность, где нуклеотидная последовательность содержит минимальную нуклеотидную последовательность, изложенную под SEQ ID NO: 176, и где нуклеотидная последовательность на по меньшей мере приблизительно 50%, по меньшей мере приблизительно 55%, по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична нуклеотидной последовательности, изложенной под SEQ ID NO: 172, где первый ITR и/или второй ITR являются способными к образованию шпилечной структуры. В определенных вариантах осуществления шпилечная структура не содержит T-образную шпильку.

[144] В определенных вариантах осуществления один из первого ITR и/или второго ITR содержит весь или часть ITR, полученного из AAV2, или состоит из них. В некоторых вариантах осуществления первый ITR или второй ITR содержат или состоят из нуклеотидной последовательности, которая на по меньшей мере приблизительно 50%, по меньшей мере приблизительно 55%, по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична нуклеотидной последовательности, изложенной под SEQ ID NO: 177 или 178, где первый ITR и/или второй ITR сохраняют функциональное свойство ITR AAV2, из которого они были получены. В некоторых вариантах осуществления первый ITR или второй ITR содержат или состоят из нуклеотидной последовательности, которая на по меньшей мере приблизительно 50%, по меньшей мере приблизительно 55%, по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична нуклеотидной последовательности, изложенной под SEQ ID NO: 177 или 178, где первый ITR и/или второй ITR являются способными к образованию шпилечной структуры. В определенных вариантах осуществления шпилечная структура не содержит T-образную шпильку. В некоторых вариантах осуществления первый ITR и/или второй ITR содержат или состоят из нуклеотидной последовательности, изложенной под SEQ ID NO: 177 или 178. В некоторых вариантах осуществления первый ITR и/или второй ITR содержат или состоят из нуклеотидной последовательности, изложенной под SEQ ID NO: 177. В некоторых вариантах осуществления первый ITR и/или второй ITR содержат или состоят из нуклеотидной последовательности, изложенной под SEQ ID NO: 178.

[145] В некоторых вариантах осуществления первый ITR получен из генома AAV, а второй ITR получен из штамма парвовируса мускусных уток (MDPV). В других вариантах осуществления второй ITR получен из генома AAV, а первый ITR получен из штамма парвовируса мускусных уток (MDPV). В определенных вариантах осуществления штамм MDPV является аттенуированным, например, представляет собой штамм FZ91-30 MDPV. В других вариантах осуществления штамм MDPV является патогенным, например, представляет собой штамм YY MDPV.

[146] В некоторых вариантах осуществления первый ITR получен из генома AAV, а второй ITR получен из Dependoparvovirus. В некоторых вариантах осуществления второй ITR получен из генома AAV, а первый ITR получен из Dependoparvovirus. В других вариантах осуществления первый ITR получен из генома AAV, а второй ITR получен из штамма парвовируса гусей (GPV), относящегося к роду Dependovirus. В других вариантах осуществления второй ITR получен из генома AAV, а первый ITR получен из штамма GPV, относящегося к роду Dependovirus. В определенных вариантах осуществления штамм GPV является аттенуированным, например, представляет собой штамм 82-0321V GPV. В других вариантах осуществления штамм GPV является патогенным, например, представляет собой штамм В GPV.

[147] В определенных вариантах осуществления первый ITR получен из генома AAV, а второй ITR получен из генома, выбранного из группы, состоящей из парвовируса свиней, например, штамма U44978 парвовируса свиней; мелкого вируса мышей, например, штамма U34256 мелкого вируса мышей; парвовируса собак, например, штамма M19296 парвовируса собак; вируса энтерита норок, например, штамма D00765 вируса энтерита норок; и любой их комбинации. В других вариантах осуществления второй ITR получен из генома AAV, а первый ITR получен из генома, выбранного из группы, состоящей из парвовируса свиней, например, штамма U44978 парвовируса свиней; мелкого вируса мышей, например, штамма U34256 мелкого вируса мышей; парвовируса собак, например, штамма M19296 парвовируса собак; вируса энтерита норок, например, штамма D00765 вируса энтерита норок; и любой их комбинации.

[148] В другом конкретном варианте осуществления ITR представляет собой синтетическую последовательность, генетически сконструированную с включением на ее 5′- и 3′-концах ITR, не полученных из генома AAV. В другом конкретном варианте осуществления ITR представляет собой синтетическую последовательность, генетически сконструированную с включением на ее 5′- и 3′-концах ITR, полученных из одного или нескольких геномов вирусов, отличных от AAV. Два ITR, присутствующих в молекуле нуклеиновой кислоты по настоящему изобретению, могут быть из одного и того же или различных геномов вирусов, отличных от AAV. В частности, ITR могут быть получены из одного и того же генома вируса, отличного от AAV. В конкретном варианте осуществления два ITR, присутствующих в молекуле нуклеиновой кислоты по настоящему изобретению, являются одинаковыми, и могут, в частности, представлять собой ITR AAV2.

[149] В некоторых вариантах осуществления последовательность ITR содержит одну или несколько палиндромных последовательностей. Палиндромная последовательность ITR, раскрытого в данном документе, включает без ограничения нативные палиндромные последовательности (т. е. последовательности, выявленные в природе), синтетические последовательности (т. е. последовательности, не выявленные в природе), такие как псевдопалиндромные последовательности, и их комбинации или модифицированные формы. "Псевдопалиндромная последовательность" представляет собой палиндромную последовательность ДНК, включающую несовершенную палиндромную последовательность, которая обладает менее 80%, в том числе менее 70%, 60%, 50%, 40%, 30%, 20%, 10% или 5% идентичностью или не обладает идентичностью последовательности нуклеиновой кислоты c последовательностями в нативной AAV или отличной от AAV палиндромной последовательности, которая образует вторичную структуру. Нативные палиндромные последовательности могут быть получены или выделены из любого генома, раскрытого в данном документе. Синтетическая палиндромная последовательность может быть основана на любом геноме, раскрытом в данном документе.

[150] Палиндромная последовательность может быть непрерывный или прерывистой. В некоторых вариантах осуществления палиндромная последовательность является прерывистой, при этом палиндромная последовательность содержит вставку в виде второй последовательность. В некоторых вариантах осуществления вторая последовательность содержит промотор, энхансер, сайт интеграции для интегразы (например, сайты для Cre- или Flp-рекомбиназы), открытую рамку считывания для генного продукта или их комбинацию.

[151] В некоторых вариантах осуществления ITR образует структуры типа "шпилька-петля". В одном варианте осуществления первый ITR образует шпилечную структуру. В другом варианте осуществления второй ITR образует шпилечную структуру. Еще в одном варианте осуществления как первый ITR, так и второй ITR образуют шпилечные структуры. В некоторых вариантах осуществления первый ITR и/или второй ITR не образуют T-образную шпилечную структуру. В определенных вариантах осуществления первый ITR и/или второй ITR образуют шпилечную структуру, отличную от T-образной. В некоторых вариантах осуществления шпилечная структура, отличная от T-образной, предусматривает U-образную шпилечную структуру.

[152] В некоторых вариантах осуществления ITR в молекуле нуклеиновой кислоты, описанной в данном документе, может представлять собой транскрипционно активируемый ITR. Транскрипционно активируемый ITR может содержат весь ITR дикого типа или его часть, которые были транскрипционно активированы за счет включения по меньшей мере одного транскрипционно активного элемента. Различные типы транскрипционно активных элементов являются подходящими для применения в данном контексте. В некоторых вариантах осуществления транскрипционно активный элемент представляет собой конститутивный транскрипционно активный элемент. Конститутивные транскрипционно активные элементы обеспечивает уровень транскрипции гена на постоянной основе, и они являются предпочтительными, если требуется, чтобы трансген экспрессировался на постоянной основе. В других вариантах осуществления транскрипционно активный элемент является индуцируемым траскрипционно активным элементом. Индуцируемые транскрипционно активные элементы в целом проявляют низкую активность в отсутствие индуктора (или индуцирующего условия), но положительно регулируются в присутствии индуктора (или при переключении в индуцирующее условие). Индуцируемые транскрипционно активные элементы могут быть предпочтительными, если экспрессия требуется лишь в течение определенных периодов времени или в определенных местоположениях, или если требуется повысить уровень экспрессии с применением индуцирующего средства. Транскрипционно активные элементы также могут быть тканеспецифическими; то есть они проявляют активность только в некоторых типах тканей или клеток.

[153] Транскрипционно активные элементы могут быть встроены в ITR посредством различных способов. В некоторых вариантах осуществления транскрипционно активный элемент встроен на 5′-конце относительно любой части ITR или 3′-конце относительно любой части ITR. В других вариантах осуществления транскрипционно активный элемент транскрипционно активированного ITR расположен между двумя последовательностями ITR. Если транскрипционно активный элемент содержит два или более элементов, которые должны быть расположены раздельно друг от друга, тогда эти элементы могут чередоваться с частями ITR. В некоторых вариантах осуществления шпилечная структура ITR удалена и заменена инвертированными повторами транскрипционного элемента. Данный последняя структура будет образовывать шпильку, имитирующую удаленную часть в структуре. Множественные тандемные транскрипционно активные элементы также могут присутствовать в транскрипционно активированном ITR, при этом они могут быть расположены смежно или раздельно друг от друга. Кроме того, сайты связывания белка (например, Rep-связывающие сайты) можно вводить в транскрипционно активные элементы транскрипционно активированных ITR. Транскрипционно активный элемент может содержат любую последовательность, обеспечивающую возможность контролируемой транскрипции ДНК за счет РНК-полимеразы с образованием РНК, и может содержать, например, транскрипционно активный элемент, который определен ниже.

[154] Транскрипционно активированные ITR обеспечивают как транскрипционную активацию, так и функции ITR в молекуле нуклеиновой кислоты в нуклеотидной последовательности относительно ограниченной длины, которая эффективно увеличивает длину трансгена до максимума, который может переноситься, и экспрессироваться из молекулы нуклеиновой кислоты. Встраивание транскрипционно активного элемента в ITR может быть выполнено посредством множества способов. Сравнение последовательности ITR и требование последовательности в отношении транскрипционно активного элемента может обеспечить возможность тщательного анализа способов кодирования данного элемента в пределах ITR. Например, транскрипционная активность может быть добавлена в ITR посредством введения специфических изменений в последовательность ITR, что обеспечивает репликацию функциональных элементов транскрипционно активного элемента. В данной области техники существует ряд методик эффективного добавления, удаления и/или изменения конкретных нуклеотидных последовательностей в конкретных сайтах (см., например, Deng and Nickoloff (1992) Anal. Biochem. 200:81-88). Другой способ создания транскрипционно активируемых ITR включает введение сайта для рестриктазы в требуемом местоположении в ITR. Кроме того, множественные транскрипционно активные элементы могут быть включены в транскрипционно активируемый ITR с применением способов, известных из уровня техники.

[155] В качестве примера транскрипционно активируемые ITR могут быть получены путем включения одного или нескольких транскрипционно активных элементов, таких как TATA-бокс, GC-бокс, CCAAT-бокс, сайт Sp1, область Inr, сайт CRE (регуляторный элемент cAMP), сайт ATF-1/CRE, APBβ-бокс, APBα-бокс, CArG-бокс, CCAC-бокс, или любого другого элемента, вовлеченного в транскрипцию и известного из уровня техники.

B. Терапевтические белки

[156] Определенные аспекты настоящего изобретения направлены на молекулу нуклеиновой кислоты, содержащую первый ITR, второй ITR и генную кассету, кодирующую терапевтический белок. В некоторых вариантах осуществления генная кассета кодирует один терапевтический белок. В некоторых вариантах осуществления генная кассета кодирует более одного терапевтического белка. В некоторых вариантах осуществления генная кассета кодирует две или более копий одного и того же терапевтического белка. В некоторых вариантах осуществления генная кассета кодирует два или более вариантов одного и того же терапевтического белка. В некоторых вариантах осуществления генная кассета кодирует два или более различных терапевтических белка.

[157] Определенные варианты осуществления настоящего изобретения направлены на молекулу нуклеиновой кислоты, содержащую первый ITR, второй ITR и генную кассету, кодирующую терапевтический белок, где терапевтический белок представляет собой фактор свертывания крови. В некоторых вариантах осуществления фактор свертывания крови выбран из группы, состоящей из FI, FII, FIII, FIV, FV, FVI, FVII, FVIII, FIX, FX, FXI, FXII, FXIII), VWF, прекалликреина, высокомолекулярного кининогена, фибронектина, антитромбина III, кофактора II гепарина, белка C, белка S, белка Z, ингибитора протеазы, связанного с Z-белком (ZPI), плазминогена, альфа-2-антиплазмина, тканевого активатора плазминогена (tPA), урокиназы, ингибитора-1 активатора плазминогена (PAI-1), ингибитора-2 активатора плазминогена (PAI2), их любого зимогена, их любой активной формы и любой их комбинации. В одном варианте осуществления фактор свертывания крови представляет собой FVIII или его вариант или фрагмент. В другом варианте осуществления фактор свертывания крови представляет собой FIX или его вариант или фрагмент. В другом варианте осуществления фактор свертывания крови представляет собой FVII или его вариант или фрагмент. В другом варианте осуществления фактор свертывания крови представляет собой VWF или его вариант или фрагмент.

1. Факторы свертывания крови

[158] В некоторых вариантах осуществления молекула нуклеиновой кислоты содержит первый ITR, второй ITR и генную кассету, кодирующую терапевтический белок, где терапевтический белок представляет собой полипептид фактора VIII. Используемый в данном документе термин "фактор VIII", сокращенно называемый по всей настоящей заявке как "FVIII", означает функциональный полипептид FVIII с его нормальной функцией в коагуляции, если не указано иное. Таким образом, термин "FVIII" включает варианты полипептидов, которые являются функционально активными. "Белок FVIII" используется взаимозаменяемо с полипептидом (или белком) FVIII или FVIII. Примеры функций FVIII включают без ограничения способность активировать коагуляцию, способность действовать в качестве кофактора для фактора IX или способность образовывать теназный комплекс с фактором IX в присутствии Ca²⁺ и фосфолипидов, который затем обеспечивает превращение фактора X в активированную форму Xa. Белок FVIII может представлять собой белок FVIII человека, свиньи, собаки, крысы или мыши. Кроме того, путем сравнения FVIII людей и FVIII других видов идентифицировали консервативные остатки, которые, вероятно, необходимы для функционирования (Cameron et al., Thromb. Haemost. 79:317-22 (1998); US 6251632). Известны полноразмерные полипептидные и полинуклеотидные последовательности, а также многие функциональные фрагменты, мутантные и модифицированные варианты. Различные аминокислотные и нуклеотидные последовательности FVIII раскрыты, например, в публикациях заявок на патент США №№ 2015/0158929 A1, 2014/0308280 A1 и 2014/0370035 A1 и в международной публикации № WO 2015/106052 A1. Полипептиды FVIII включают, например, полноразмерный FVIII, полноразмерный FVIII без Met на N-конце, зрелый FVIII (без сигнальной последовательности), зрелый FVIII с дополнительным Met на N-конце и/или FVIII с полной или частичной делецией домена B. Варианты FVIII содержат делеции домена B, будь то частичные или полные делеции.

a. FVIII и полинуклеотидные последовательности, кодирующие белок FVIII

[159] В некоторых вариантах осуществления молекула нуклеиновой кислоты содержит первый ITR, второй ITR и генную кассету, кодирующую терапевтический белок, где терапевтический белок представляет собой полипептид фактора VIII. Используемый в данном документе термин "фактор VIII", сокращенно называемый по всей настоящей заявке как "FVIII", означает функциональный полипептид FVIII с его нормальной функцией в коагуляции, если не указано иное. Таким образом, термин "FVIII" включает варианты полипептидов, которые являются функционально активными. "Белок FVIII" используется взаимозаменяемо с полипептидом (или белком) FVIII или FVIII. Примеры функций FVIII включают без ограничения способность активировать коагуляцию, способность действовать в качестве кофактора для фактора IX или способность образовывать теназный комплекс с фактором IX в присутствии Ca²⁺ и фосфолипидов, который затем обеспечивает превращение фактора X в активированную форму Xa. Белок FVIII может представлять собой белок FVIII человека, свиньи, собаки, крысы или мыши. Кроме того, путем сравнения FVIII людей и FVIII других видов идентифицировали консервативные остатки, которые, вероятно, необходимы для функционирования (Cameron et al., Thromb. Haemost. 79:317-22 (1998); US 6251632). Известны полноразмерные полипептидные и полинуклеотидные последовательности, а также многие функциональные фрагменты, мутантные и модифицированные варианты. Различные аминокислотные и нуклеотидные последовательности FVIII раскрыты, например, в публикациях заявок на патент США №№ 2015/0158929 A1, 2014/0308280 A1 и 2014/0370035 A1 и в международной публикации № WO 2015/106052 A1. Полипептиды FVIII включают, например, полноразмерный FVIII, полноразмерный FVIII без Met на N-конце, зрелый FVIII (без сигнальной последовательности), зрелый FVIII с дополнительным Met на N-конце и/или FVIII с полной или частичной делецией домена B. Варианты FVIII содержат делеции домена B, будь то частичные или полные делеции.

[160] Часть FVIII в химерном белке, используемом в данном документе, обладает активностью FVIII. Активность FVIII можно измерять с помощью любого способа, известного из уровня техники. Доступен ряд тестов для оценки функции системы коагуляции: определение активированного частичного тромбопластинового времени (aPTT), хромогенный анализ, анализ ROTEM, определение протромбинового времени (PT) (также используется для определения INR), определение концентрации фибриногена (чаще всего с помощью метода Клаусса), подсчет количества тромбоцитов, определение тромбоцитарной функции (чаще всего с помощью PFA-100), TCT, определение времени свертывания крови, тест смешивания (устраняется ли аномалия при смешивании плазмы крови пациента с нормальной плазмой крови), анализы факторов коагуляции, определение антител к фосфолипидам, D-димера, генетические тесты (например, определение фактора V Лейдена, мутации протромбина G20210A), определение времени свертывания с разбавленным ядом гадюки Рассела (dRVVT), различные тесты тромбоцитарной функции, тромбоэластография (TEG или Sonoclot), тромбоэластометрия (TEM^®, например ROTEM^®) или определение времени лизиса эуглобулина (ELT).

[161] Тест aPTT является показателем функционирования, измеряющим эффективность как "внутреннего" (также называемого контактным путем активации), так и общего путей коагуляции. Этот тест обычно используют для измерения свертывающей активности коммерчески доступных рекомбинантных факторов свертывания крови, например, FVIII. Он используется в сочетании с протромбиновым временем (PT), с помощью которого измеряют внешний путь.

[162] Анализ ROTEM предоставляет информацию о всей кинетике гемостаза: времени свертывания крови, образовании сгустка, стабильности и лизисе сгустка. Различные параметры тромбоэластометрии зависят от активности системы плазменной коагуляции, функции тромбоцитов, фибринолиза или многих факторов, которые влияют на эти взаимодействия. Этот анализ может дать полное представление о вторичном гемостазе.

[163] Механизм хромогенного анализа основан на принципах каскада коагуляции крови, где активированный FVIII ускоряет превращение фактора X в фактор Xa в присутствии активированного фактора IX, фосфолипидов и ионов кальция. Активность фактора Ха оценивают путем гидролиза субстрата п-нитроанилида (pNA), специфического для фактора Ха. Начальная скорость высвобождения п-нитроанилина, измеренная при 405 нМ, прямо пропорциональна активности фактора Xa и, следовательно, активности FVIII в образце.

[164] Хромогенный анализ рекомендован подкомитетом по FVIII и фактору IX научного и стандартизационного комитета (SSC) Международного общества по тромбозу и гемостазу (ISTH). С 1994 года хромогенный анализ также являлся эталонным способом определения эффективности концентрата FVIII в Европейской фармакопее. Таким образом, в одном варианте осуществления химерный полипептид, содержащий FVIII, обладает активностью FVIII, сопоставимой с таковой у химерного полипептида, содержащего зрелый FVIII или BDD FVIII (например, ADVATE^®, REFACTO^® или ELOCTATE^®).

[165] В другом варианте осуществления химерный белок, содержащий FVIII, согласно настоящему изобретению характеризуется скоростью образования фактора Xa, сопоставимой с таковой у химерного белка, содержащего зрелый FVIII или BDD FVIII (например, ADVATE^®, REFACTO^® или ELOCTATE^®).

[166] Чтобы активировать фактор X в фактор Xa, активированный фактор IX (фактор IXa) гидролизует одну связь между аргинином и изолейцином в факторе X с образованием фактора Xa в присутствии Ca²⁺, мембранных фосфолипидов и кофактора FVIII. Следовательно, взаимодействие FVIII с фактором IX является критически важным в пути коагуляции. В определенных вариантах осуществления химерный полипептид, содержащий FVIII, может взаимодействовать с фактором IXa со скоростью, сопоставимой с таковой у химерного полипептида, содержащего зрелую последовательность FVIII или BDD FVIII (например, ADVATE^®, REFACTO^® или ELOCTATE^®).

[167] Кроме того, FVIII связывается с фактором фон Виллебранда, находясь в неактивной форме, в кровотоке. FVIII быстро разрушается, когда он не связан с VWF, и отщепляется от VWF под действием тромбина. В некоторых вариантах осуществления химерный полипептид, содержащий FVIII, связывается с фактором фон Виллебранда на уровне, сопоставимом с таковым у химерного полипептида, содержащего последовательность зрелого FVIII или BDD FVIII (например, ADVATE^®, REFACTO^® или ELOCTATE^®).

[168] FVIII можно инактивировать с помощью активированного белка С в присутствии кальция и фосфолипидов. Активированный белок C расщепляет тяжелую цепь FVIII после аргинина 336 в домене A1, что разрушает сайт взаимодействия с субстратом фактора X, и расщепляет после аргинина 562 в домене A2, что усиливает диссоциацию домена A2, а также разрушает сайт взаимодействия с фактором IXa. Это расщепление также обеспечивает разделение пополам домена A2 (43 кДа) и образование доменов A2-N (18 кДа) и A2-C (25 кДа). Таким образом, активированный белок C может катализировать множественные сайты расщепления в тяжелой цепи. В одном варианте осуществления химерный полипептид, содержащий FVIII, инактивируется активированным белком С на уровне, сопоставимом с таковым у химерного полипептида, содержащего зрелую последовательность FVIII или BDD FVIII (например, ADVATE^®, REFACTO^® или ELOCTATE^®).

[169] В других вариантах осуществления химерный полипептид, содержащий FVIII, обладает активностью FVIII in vivo, сопоставимой с таковой у химерного полипептида, содержащего зрелую последовательность FVIII или BDD FVIII (например, ADVATE^®, REFACTO^® или ELOCTATE^®). В конкретном варианте осуществления химерный полипептид, содержащий FVIII, способен обеспечивать защиту у мыши с HemA на уровне, сопоставимом с таковым у химерного полипептида, содержащего зрелую последовательность FVIII или BDD FVIII (например, ADVATE^®, REFACTO^® или ELOCTATE^®), на модели рассечения хвостовой вены у мышей HemA.

[170] "Домен B" в FVIII, используемый в данном документе, является тем же доменом B, известным из уровня техники, который определяют по идентичности внутренней аминокислотной последовательности и сайтам протеолитического расщепления тромбином, например, остаткам Ser741-Arg1648 зрелого FVIII человека. Другие домены FVIII человека определяют по следующим аминокислотным остаткам относительно зрелого FVIII человека: A1, остатки Ala1-Arg372; A2, остатки Ser373-Arg740; A3, остатки Ser1690-Ile2032; C1, остатки Arg2033-Asn2172; C2, остатки Ser2173-Tyr2332 зрелого FVIII. Номера остатков последовательности, используемые в данном документе, без ссылки на какие-либо номера SEQ ID соответствуют последовательности FVIII без последовательности сигнального пептида (19 аминокислот), если не указано иное. Последовательность A3-C1-C2, также известная как тяжелая цепь FVIII, включает остатки Ser1690-Tyr2332. Оставшаяся последовательность, остатки Glu1649-Arg1689, обычно относится к активационному пептиду легкой цепи FVIII. Из уровня техники также известны местоположения границ всех доменов, в том числе доменов B, для FVIII свиньи, мыши и собаки. В одном варианте осуществления домен B FVIII удален посредством делеции ("FVIII с делецией домена В" или "BDD FVIII"). Примером BDD FVIII является REFACTO^® (рекомбинантный BDD FVIII). В одном конкретном варианте осуществления вариант FVIII с делецией домена B содержит делецию аминокислотных остатков 746-1648 зрелого FVIII.

[171] "FVIII с делецией домена B" может характеризоваться полной или частичной делециями, раскрытыми в патентах США №№ 6316226, 6346513, 7041635, 5789203, 6060447, 5595886, 6228620, 5972885, 6048720, 5543502, 5610278, 5171844, 5112950, 4868112 и 6458563 и в международной публикации № WO 2015106052 A1 (PCT/US2015/010738). В некоторых вариантах осуществления последовательность FVIII с делецией домена B, используемая в способах согласно настоящему изобретению, содержит любую из делеций, раскрытых от столбца 4, строки 4 до столбца 5, строки 28 и в примерах 1-5 патента США № 6316226 (также в US 6346513). В другом варианте осуществления фактор VIII с делецией домена В представляет собой фактор VIII с делецией домена В S743/Q1638 (SQ BDD FVIII) (например, фактор VIII, имеющий делецию от аминокислоты 744 до аминокислоты 1637, например, фактор VIII, содержащий аминокислоты 1-743 и аминокислоты 1638-2332 зрелого FVIII). В некоторых вариантах осуществления FVIII с делецией домена B, используемый в способах согласно настоящему изобретению, имеет делецию, раскрытую в столбце 2, строках 26-51 и в примерах 5-8 патента США № 5789203 (также в US 6060447, US 5595886 и US 6228620). В некоторых вариантах осуществления фактор VIII с делецией домена В имеет делецию, описанную от столбца 1, строки 25 до столбца 2, строки 40 в патенте США № 5972885; в столбце 6, строках 1-22 и в примере 1 патента США № 6048720; в столбце 2, строках 17-46 патента США № 5543502; от столбца 4, строки 22 до столбца 5, строки 36 патента США № 5171844; в столбце 2, строках 55-68, на фигуре 2 и в примере 1 патента США № 5112950; от столбца 2, строки 2 до столбца 19, строки 21 и в таблице 2 патента США № 4868112; от столбца 2, строки 1 до столбца 3, строки 19, от столбца 3, строки 40 до столбца 4, строки 67, от столбца 7, строки 43 до столбца 8, строки 26 и от столбца 11, строки 5 до столбца 13, строки 39 патента США № 7041635 или в столбце 4, строках 25-53 патента США № 6458563. В некоторых вариантах осуществления FVIII с делецией домена B имеет делецию большей части домена В, но все еще содержит аминоконцевые последовательности домена В, которые необходимы для протеолитического процессинга in vivo первичного продукта трансляции в две полипептидные цепи, как это раскрыто в WO 91/09122. В некоторых вариантах осуществления FVIII с делецией домена B конструируют с делецией аминокислот 747-1638, т. е. практически с полной делецией домена В. Hoeben R.C., et al. J. Biol. Chem. 265 (13): 7318-7323 (1990). Фактор VIII с делецией домена В также может содержать делецию аминокислот 771-1666 или аминокислот 868-1562 FVIII. Meulien P., et al. Protein Eng. 2(4): 301-6 (1988). Дополнительные делеции домена В, которые являются частью настоящего изобретения, включают делецию аминокислот 982-1562 или 760-1639 (Toole et al., Proc. Natl. Acad. Sci. U.S.A. (1986) 83, 5939-5942)), 797-1562 (Eaton, et al. Biochemistry (1986) 25:8343-8347)), 741-1646 (Kaufman (опубликованная заявка согласно PCT № WO 87/04187)), 747-1560 (Sarver, et al., DNA (1987) 6:553-564)), 741-1648 (Pasek (заявка согласно PCT № 88/00831)), или 816-1598, или 741-1648 (Lagner (Behring Inst. Mitt. (1988) No 82:16-25, EP 295597)). В одном конкретном варианте осуществления FVIII с делецией домена B содержит делецию аминокислотных остатков 746-1648 зрелого FVIII. В другом варианте осуществления FVIII с делецией домена B содержит делецию аминокислотных остатков 745-1648 зрелого FVIII. В некоторых вариантах осуществления BDD FVIII включает одноцепочечный FVIII, который содержит делецию аминокислот 765-1652, соответствующих зрелому полноразмерному FVIII (также известный как одноцепочечный rVIII и AFSTYLA®). См. патент США № 7041635.

[172] В других вариантах осуществления BDD FVIII включает полипептид FVIII, содержащий фрагменты домена В, в которых сохранены один или несколько сайтов N-связанного гликозилирования, например, остатки 757, 784, 828, 900, 963 или необязательно 943, которые соответствуют аминокислотной последовательности полноразмерной последовательности FVIII. Примеры фрагментов домена В включают 226 аминокислот или 163 аминокислоты из домена В, как это раскрыто в Miao, H.Z., et al., Blood 103(a): 3412-3419 (2004), Kasuda, A, et al., J. Thromb. Haemost. 6. 1352-1359 (2008) и Pipe, S.W., et al., J. Thromb. Haemost. 9. 2235-2242 (2011) (т. e. первые 226 аминокислот или 163 аминокислоты из домена В сохранены). В еще одних других вариантах осуществления BDD FVIII дополнительно содержит точечную мутацию в остатке 309 (из Phe в Ser) для улучшения экспрессии белка BDD FVIII. См. Miao, H.Z., et al., Blood 103(a): 3412-3419 (2004). В еще одних других вариантах осуществления BDD FVIII включает полипептид FVIII, содержащий часть домена В, но не содержащий один или несколько сайтов расщепления фурином (например, Arg1313 и Arg 1648). См. Pipe, S.W., et al., J. Thromb. Haemost. 9. 2235-2242 (2011). В некоторых вариантах осуществления BDD FVIII включает одноцепочечный FVIII, который содержит делецию аминокислот 765-1652, соответствующих зрелому полноразмерному FVIII (также известный как одноцепочечный rVIII и AFSTYLA®). См. патент США № 7041635. Каждая из вышеизложенных делеций может быть осуществлена в любой последовательности FVIII.

[173] Известно множество функциональных вариантов FVIII, обсуждаемых выше и ниже. Кроме того, у пациентов с гемофилией были идентифицированы сотни нефункциональных мутаций в FVIII, и было определено, что эффект данных мутаций в отношении функции FVIII обусловлен в большей степени их местом положения в 3-мерной структуре FVIII, а не природой замены (Cutler et al., Hum. Mutat. 19:274-8 (2002), включенная в данный документ посредством ссылки во всей своей полноте). Кроме того, путем сравнения FVIII от людей и FVIII от других видов идентифицировали консервативные остатки, которые, вероятно, необходимы для функционирования (Cameron et al., Thromb. Haemost. 79:317-22 (1998); US 6251632, включенные в данный документ посредством ссылки во всей своей полноте).

[174] В некоторых вариантах осуществления FVIII полипептид содержит вариант FVIII или его фрагмент, где вариант FVIII или его фрагмент обладает активностью FVIII. В некоторых вариантах осуществления генная кассета кодирует полноразмерный полипептид FVIII. В других вариантах осуществления генная кассета кодирует полипептид FVIII с удаленным доменом B (BDD), где весь домен B FVIII или его часть удалены. В одном конкретном варианте осуществления генная кассета кодирует полипептид, содержащий аминокислотную последовательность, характеризующуюся по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 86%, по меньшей мере приблизительно 87%, по меньшей мере приблизительно 88%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с SEQ ID NO: 106, 107, 109, 110, 111 или 112. В некоторых вариантах осуществления генная кассета кодирует полипептид, характеризующийся аминокислотной последовательностью под SEQ ID NO: 17, или его фрагмент. В некоторых вариантах осуществления генная кассета кодирует полипептид, характеризующийся аминокислотной последовательностью под SEQ ID NO: 106, или его фрагмент. В некоторых вариантах осуществления генная кассета содержит нуклеотидную последовательность, которая характеризуется по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с SEQ ID NO: 107. В некоторых вариантах осуществления генная кассета кодирует полипептид, характеризующийся аминокислотной последовательностью под SEQ ID NO: 109, или его фрагмент. В некоторых вариантах осуществления генная кассета содержит нуклеотидную последовательность, которая характеризуется по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с SEQ ID NO: 16. В некоторых вариантах осуществления генная кассета содержит нуклеотидную последовательность, которая характеризуется по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с SEQ ID NO: 109.

[175] В некоторых вариантах осуществления генная кассета по настоящему изобретению кодирует полипептид FVIII, содержащий сигнальный пептид или его фрагмент. В других вариантах осуществления генная кассета кодирует полипептид FVIII, в котором отсутствует сигнальный пептид. В некоторых вариантах осуществления сигнальный пептид содержит аминокислоты 1-19 из SEQ ID NO: 17.

[176] В некоторых вариантах осуществления генная кассета содержит нуклеотидную последовательность, кодирующую полипептид FVIII, где нуклеотидная последовательность является кодон-оптимизированной. В определенных вариантах осуществления генная кассета содержит нуклеотидную последовательность, которая раскрыта в международной заявке PCT/US2017/015879, которая включена посредством ссылки во всей своей полноте. В некоторых вариантах осуществления генная кассета содержит нуклеотидную последовательность, кодирующую полипептид FVIII, где нуклеотидная последовательность является кодон-оптимизированной. В определенных вариантах осуществления генная кассета содержит нуклеотидную последовательность, которая характеризуется по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидной последовательностью, выбранной из SEQ ID NO: 1-14. В некоторых вариантах осуществления генная кассета содержит нуклеотидную последовательность, которая характеризуется по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с SEQ ID NO: 71. В некоторых вариантах осуществления генная кассета содержит нуклеотидную последовательность, которая характеризуется по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с SEQ ID NO: 19.

i. Кодон-оптимизированные нуклеотидные последовательности, кодирующие полипептиды FVIII

[177] В некоторых вариантах осуществления молекула нуклеиновой кислоты по настоящему изобретению содержит первый ITR, второй ITR и генную кассету, кодирующую терапевтический белок, где первый ITR и второй ITR получены из генома AAV, и где генная кассета содержит кодон-оптимизированную нуклеотидную последовательность, кодирующую полипептид FVIII. В некоторых вариантах осуществления кодон-оптимизированная нуклеотидная последовательность кодирует полноразмерный полипептид FVIII. В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность кодирует полипептид FVIII с удаленным доменом B (BDD), где весь домен B FVIII или его часть удалены. В одном конкретном варианте осуществления кодон-оптимизированная нуклеотидная последовательность кодирует полипептид, содержащий аминокислотную последовательность, характеризующуюся по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 86%, по меньшей мере приблизительно 87%, по меньшей мере приблизительно 88%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с SEQ ID NO: 17, или его фрагмент. В одном варианте осуществления кодон-оптимизированная нуклеотидная последовательность кодирует полипептид, характеризующийся аминокислотной последовательностью под SEQ ID NO: 17, или его фрагмент.

[178] В некоторых вариантах осуществления кодон-оптимизированная нуклеотидная последовательность по настоящему изобретению кодирует полипептид FVIII, содержащий сигнальный пептид, или его фрагмент. В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность кодирует полипептид FVIII, в котором отсутствует сигнальный пептид. В некоторых вариантах осуществления сигнальный пептид содержит аминокислоты 1-19 из SEQ ID NO: 17.

[179] В некоторых вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит нуклеотидную последовательность, которая содержит первую последовательность нуклеиновой кислоты, кодирующую N-концевую часть полипептида FVIII, и вторую последовательность нуклеиновой кислоты, кодирующую C-концевую часть полипептида FVIII; где первая последовательность нуклеиновой кислоты характеризуется по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с (i) нуклеотидами 58-1791 из SEQ ID NO: 3 или (ii) нуклеотидами 58-1791 из SEQ ID NO: 4; и где N-концевая часть и C-концевая часть вместе обладают активностью полипептида FVIII. В одном конкретном варианте осуществления первая последовательность нуклеиновой кислоты характеризуется по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 58-1791 из SEQ ID NO: 3. В другом варианте осуществления первая последовательность нуклеиновой кислоты характеризуется по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 58-1791 из SEQ ID NO: 4. В других вариантах осуществления первая нуклеотидная последовательность содержит нуклеотиды 58-1791 из SEQ ID NO: 3 или нуклеотиды 58-1791 из SEQ ID NO: 4.

[180] В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит нуклеотидную последовательность, которая содержит первую последовательность нуклеиновой кислоты, кодирующую N-концевую часть полипептида FVIII, и вторую последовательность нуклеиновой кислоты, кодирующую C-концевую часть полипептида FVIII; где первая последовательность нуклеиновой кислоты характеризуется по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с (i) нуклеотидами 1-1791 из SEQ ID NO: 3 или (ii) нуклеотидами 1-1791 из SEQ ID NO: 4; и где N-концевая часть и C-концевая часть вместе обладают активностью полипептида FVIII. В одном варианте осуществления первая нуклеотидная последовательность содержит нуклеотиды 1-1791 из SEQ ID NO: 3 или нуклеотиды 1-1791 из SEQ ID NO: 4. В другом варианте осуществления вторая нуклеотидная последовательность характеризуется по меньшей мере 60%, по меньшей мере 70%, по меньшей мере 80%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 1792-4374 из SEQ ID NO: 3 или 1792-4374 из SEQ ID NO: 4. В одном конкретном варианте осуществления вторая нуклеотидная последовательность содержит нуклеотиды 1792-4374 из SEQ ID NO: 3 или 1792-4374 из SEQ ID NO: 4. В еще одном варианте осуществления вторая нуклеотидная последовательность характеризуется по меньшей мере 60%, по меньшей мере 70%, по меньшей мере 80%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 1792-2277 и 2320-4374 из SEQ ID NO: 3 или 1792-2277 и 2320-4374 из SEQ ID NO: 4 (т. е. нуклеотидами 1792-4374 из SEQ ID NO: 3 или 1792-4374 из SEQ ID NO: 4 без нуклеотидов, кодирующих домен B или фрагмент домена B). В одном конкретном варианте осуществления вторая нуклеотидная последовательность содержит нуклеотиды 1792-2277 и 2320-4374 из SEQ ID NO: 3 или 1792-2277 и 2320-4374 из SEQ ID NO: 4 (т. е. нуклеотиды 1792-4374 из SEQ ID NO: 3 или 1792-4374 из SEQ ID NO: 4 без нуклеотидов, кодирующих домен B или фрагмент домена B).

[181] В некоторых вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит нуклеотидную последовательность, которая содержит первую последовательность нуклеиновой кислоты, кодирующую N-концевую часть полипептида FVIII, и вторую последовательность нуклеиновой кислоты, кодирующую C-концевую часть полипептида FVIII; где вторая последовательность нуклеиновой кислоты характеризуется по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с (i) нуклеотидами 1792-4374 из SEQ ID NO: 5 или (ii) нуклеотидами 1792-4374 из SEQ ID NO: 6; и где N-концевая часть и C-концевая часть вместе обладают активностью полипептида FVIII. В определенных вариантах осуществления вторая последовательность нуклеиновой кислоты характеризуется по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 1792-4374 из SEQ ID NO: 5. В других вариантах осуществления вторая последовательность нуклеиновой кислоты характеризуется по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 1792-4374 из SEQ ID NO: 6. В одном конкретном варианте осуществления вторая последовательность нуклеиновой кислоты содержит нуклеотиды 1792-4374 из SEQ ID NO: 5 или 1792-4374 из SEQ ID NO: 6. В некоторых вариантах осуществления первая последовательность нуклеиновой кислоты, связанная со второй последовательностью нуклеиновой кислоты, приведенной выше, характеризуется по меньшей мере 60%, по меньшей мере 70%, по меньшей мере 80%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 58-1791 из SEQ ID NO: 5 или нуклеотидами 58-1791 из SEQ ID NO: 6. В других вариантах осуществления первая последовательность нуклеиновой кислоты, связанная со второй последовательностью нуклеиновой кислоты, приведенной выше, характеризуется по меньшей мере 60%, по меньшей мере 70%, по меньшей мере 80%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 1-1791 из SEQ ID NO: 5 или нуклеотидами 1-1791 из SEQ ID NO: 6.

[182] В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит нуклеотидную последовательность, которая содержит первую последовательность нуклеиновой кислоты, кодирующую N-концевую часть полипептида FVIII, и вторую последовательность нуклеиновой кислоты, кодирующую C-концевую часть полипептида FVIII; где вторая последовательность нуклеиновой кислоты характеризуется по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с (i) нуклеотидами 1792-2277 и 2320-4374 из SEQ ID NO: 5 (т. е. нуклеотидами 1792-4374 из SEQ ID NO: 5 без нуклеотидов, кодирующих домен B или фрагмент домена B) или (ii) 1792-2277 и 2320-4374 из SEQ ID NO: 6 (т. е. нуклеотидами 1792-4374 из SEQ ID NO: 6 без нуклеотидов, кодирующих домен B или фрагмент домена B); и где N-концевая часть и C-концевая часть вместе обладают активностью полипептида FVIII. В определенных вариантах осуществления вторая последовательность нуклеиновой кислоты характеризуется по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 1792-2277 и 2320-4374 из SEQ ID NO: 5 (т. е. нуклеотидами 1792-4374 из SEQ ID NO: 5 без нуклеотидов, кодирующих домен B или фрагмент домена B). В других вариантах осуществления вторая последовательность нуклеиновой кислоты характеризуется по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 1792-2277 и 2320-4374 из SEQ ID NO: 6 (т. е. нуклеотидами 1792-4374 из SEQ ID NO: 6 без нуклеотидов, кодирующих домен B или фрагмент домена B). В одном конкретном варианте осуществления вторая последовательность нуклеиновой кислоты содержит нуклеотиды 1792-2277 и 2320-4374 из SEQ ID NO: 5 или 1792-2277 и 2320-4374 из SEQ ID NO: 6 (т. е. нуклеотиды 1792-4374 из SEQ ID NO: 5 или 1792-4374 из SEQ ID NO: 6 без нуклеотидов, кодирующих домен B или фрагмент домена B). В некоторых вариантах осуществления первая последовательность нуклеиновой кислоты, связанная со второй последовательностью нуклеиновой кислоты, приведенной выше, характеризуется по меньшей мере 60%, по меньшей мере 70%, по меньшей мере 80%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 58-1791 из SEQ ID NO: 5 или нуклеотидами 58-1791 из SEQ ID NO: 6. В других вариантах осуществления первая последовательность нуклеиновой кислоты, связанная со второй последовательностью нуклеиновой кислоты, приведенной выше, характеризуется по меньшей мере 60%, по меньшей мере 70%, по меньшей мере 80%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 1-1791 из SEQ ID NO: 5 или нуклеотидами 1-1791 из SEQ ID NO: 6.

[183] В некоторых вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит нуклеотидную последовательность, которая содержит первую последовательность нуклеиновой кислоты, кодирующую N-концевую часть полипептида FVIII, и вторую последовательность нуклеиновой кислоты, кодирующую C-концевую часть полипептида FVIII; где первая последовательность нуклеиновой кислоты характеризуется по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с (i) нуклеотидами 58-1791 из SEQ ID NO: 1, (ii) нуклеотидами 58-1791 из SEQ ID NO: 2, (iii) нуклеотидами 58-1791 из SEQ ID NO: 70 или (iv) нуклеотидами 58-1791 из SEQ ID NO: 71; и где N-концевая часть и C-концевая часть вместе обладают активностью полипептида FVIII. В других вариантах осуществления первая нуклеотидная последовательность содержит нуклеотиды 58-1791 из SEQ ID NO: 1, нуклеотиды 58-1791 из SEQ ID NO: 2, (iii) нуклеотиды 58-1791 из SEQ ID NO: 70 или (iv) нуклеотиды 58-1791 из SEQ ID NO: 71.

[184] В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит нуклеотидную последовательность, которая содержит первую последовательность нуклеиновой кислоты, кодирующую N-концевую часть полипептида FVIII, и вторую последовательность нуклеиновой кислоты, кодирующую C-концевую часть полипептида FVIII; где первая последовательность нуклеиновой кислоты характеризуется по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с (i) нуклеотидами 1-1791 из SEQ ID NO: 1, (ii) нуклеотидами 1-1791 из SEQ ID NO: 2, (iii) нуклеотидами 1-1791 из SEQ ID NO: 70 или (iv) нуклеотидами 1-1791 из SEQ ID NO: 71; и где N-концевая часть и C-концевая часть вместе обладают активностью полипептида FVIII. В одном варианте осуществления первая нуклеотидная последовательность содержит нуклеотиды 1-1791 из SEQ ID NO: 1, нуклеотиды 1-1791 из SEQ ID NO: 2, (iii) нуклеотиды 1-1791 из SEQ ID NO: 70 или (iv) нуклеотиды 1-1791 из SEQ ID NO: 71. В другом варианте осуществления вторая нуклеотидная последовательность, связанная с первой нуклеотидной последовательностью, характеризуется по меньшей мере 60%, по меньшей мере 70%, по меньшей мере 80%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 1792-4374 из SEQ ID NO: 1, 1792-4374 из SEQ ID NO: 2, (iii) нуклеотидами 1792-4374 из SEQ ID NO: 70 или (iv) нуклеотидами 1792-4374 из SEQ ID NO: 71. В одном конкретном варианте осуществления вторая нуклеотидная последовательность, связанная с первой нуклеотидной последовательностью, содержит (i) нуклеотиды 1792-4374 из SEQ ID NO: 1, (ii) нуклеотиды 1792-4374 из SEQ ID NO: 2, (iii) нуклеотиды 1792-4374 из SEQ ID NO: 70 или (iv) нуклеотиды 1792-4374 из SEQ ID NO: 71. В других вариантах осуществления вторая нуклеотидная последовательность, связанная с первой нуклеотидной последовательностью, характеризуется по меньшей мере 60%, по меньшей мере 70%, по меньшей мере 80%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с (i) нуклеотидами 1792-2277 и 2320-4374 из SEQ ID NO: 1, (ii) нуклеотидами 1792-2277 и 2320-4374 из SEQ ID NO: 2, (iii) нуклеотидами 1792-2277 и 2320-4374 из SEQ ID NO: 70 или (iv) нуклеотидами 1792-2277 и 2320-4374 из SEQ ID NO: 71. В одном варианте осуществления вторая нуклеотидная последовательность содержит (i) нуклеотиды 1792-2277 и 2320-4374 из SEQ ID NO: 1, (ii) нуклеотиды 1792-2277 и 2320-4374 из SEQ ID NO: 2, (iii) нуклеотиды 1792-2277 и 2320-4374 из SEQ ID NO: 70 или (iv) нуклеотиды 1792-2277 и 2320-4374 из SEQ ID NO: 71.

[185] В другом варианте осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит нуклеотидную последовательность, которая содержит первую последовательность нуклеиновой кислоты, кодирующую N-концевую часть полипептида FVIII, и вторую последовательность нуклеиновой кислоты, кодирующую C-концевую часть полипептида FVIII; где вторая последовательность нуклеиновой кислоты характеризуется по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с (i) нуклеотидами 1792-4374 из SEQ ID NO: 1, (ii) нуклеотидами 1792-4374 из SEQ ID NO: 2, (iii) нуклеотидами 1792-4374 из SEQ ID NO: 70 или (iv) нуклеотидами 1792-4374 из SEQ ID NO: 71; и где N-концевая часть и C-концевая часть вместе обладают активностью полипептида FVIII. В одном конкретном варианте осуществления вторая последовательность нуклеиновой кислоты содержит (i) нуклеотиды 1792-4374 из SEQ ID NO: 1, (ii) нуклеотиды 1792-4374 из SEQ ID NO: 2, (iii) нуклеотиды 1792-4374 из SEQ ID NO: 70 или (iv) нуклеотиды 1792-4374 из SEQ ID NO: 71. В некоторых вариантах осуществления кодон-оптимизированная последовательность, кодирующая полипептид FVIII, содержит нуклеотидную последовательность, которая содержит первую последовательность нуклеиновой кислоты, кодирующую N-концевую часть полипептида FVIII, и вторую последовательность нуклеиновой кислоты, кодирующую C-концевую часть полипептида FVIII; где вторая последовательность нуклеиновой кислоты характеризуется по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с (i) нуклеотидами 1792-2277 и 2320-4374 из SEQ ID NO: 1, (ii) нуклеотидами 1792-2277 и 2320-4374 из SEQ ID NO: 2, (iii) нуклеотидами 1792-2277 и 2320-4374 из SEQ ID NO: 70 или (iv) нуклеотидами 1792-2277 и 2320-4374 из SEQ ID NO: 71 (т. е. нуклеотидами 1792-4374 из SEQ ID NO: 1, нуклеотидами 1792-4374 из SEQ ID NO: 2, нуклеотидами 1792-4374 из SEQ ID NO: 70 или нуклеотидами 1792-4374 из SEQ ID NO: 71 без нуклеотидов, кодирующих домен B или фрагмент домена B); и где N-концевая часть и C-концевая часть вместе обладают активностью полипептида FVIII. В одном варианте осуществления вторая последовательность нуклеиновой кислоты содержит (i) нуклеотиды 1792-2277 и 2320-4374 из SEQ ID NO: 1, (ii) нуклеотиды 1792-2277 и 2320-4374 из SEQ ID NO: 2, (iii) нуклеотиды 1792-2277 и 2320-4374 из SEQ ID NO: 70 или (iv) нуклеотиды 1792-2277 и 2320-4374 из SEQ ID NO: 71 (т. е. нуклеотиды 1792-4374 из SEQ ID NO: 1, нуклеотиды 1792-4374 из SEQ ID NO: 2, нуклеотиды 1792-4374 из SEQ ID NO: 70 или нуклеотиды 1792-4374 из SEQ ID NO: 71 без нуклеотидов, кодирующих домен B или фрагмент домена B).

[186] В некоторых вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит нуклеотидную последовательность, кодирующую полипептид с активностью FVIII, где нуклеотидная последовательность содержит последовательность нуклеиновой кислоты, характеризующуюся по меньшей мере 90%, по меньшей мере 91%, по меньшей мере 92%, по меньшей мере 93%, по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 58-4374 из SEQ ID NO: 1. В других вариантах осуществления нуклеотидная последовательность содержит последовательность нуклеиновой кислоты, характеризующуюся по меньшей мере 90%, по меньшей мере 91%, по меньшей мере 92%, по меньшей мере 93%, по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 58-2277 и 2320-4374 из SEQ ID NO: 1 (т. е. нуклеотидами 58-4374 из SEQ ID NO: 1 без нуклеотидов, кодирующих домен B или фрагмент домена B). В других вариантах осуществления последовательность нуклеиновой кислоты характеризуется по меньшей мере 90%, по меньшей мере 91%, по меньшей мере 92%, по меньшей мере 93%, по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с SEQ ID NO: 1. В других вариантах осуществления нуклеотидная последовательность содержит нуклеотиды 58-2277 и 2320-4374 из SEQ ID NO: 1 (т. е. нуклеотиды 58-4374 из SEQ ID NO: 1 без нуклеотидов, кодирующих домен B или фрагмент домена B) или нуклеотиды 58-4374 из SEQ ID NO: 1. В еще одних других вариантах осуществления нуклеотидная последовательность содержит нуклеотиды 1-2277 и 2320-4374 из SEQ ID NO: 1 (т. е. нуклеотиды 1-4374 из SEQ ID NO: 1 без нуклеотидов, кодирующих домен B или фрагмент домена B) или нуклеотиды 1-4374 из SEQ ID NO: 1.

[187] В некоторых вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит нуклеотидную последовательность, кодирующую полипептид с активностью FVIII, где нуклеотидная последовательность содержит последовательность нуклеиновой кислоты, характеризующуюся по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 58-4374 из SEQ ID NO: 2. В других вариантах осуществления нуклеотидная последовательность содержит последовательность нуклеиновой кислоты, характеризующуюся по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 58-2277 и 2320-4374 из SEQ ID NO: 2. В других вариантах осуществления последовательность нуклеиновой кислоты характеризуется по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с SEQ ID NO: 2. В других вариантах осуществления нуклеотидная последовательность содержит нуклеотиды 58-2277 и 2320-4374 из SEQ ID NO: 2 (т. е. нуклеотиды 58-4374 из SEQ ID NO: 2 без нуклеотидов, кодирующих домен B или фрагмент домена B) или нуклеотиды 58-4374 из SEQ ID NO: 2. В еще одних других вариантах осуществления нуклеотидная последовательность содержит нуклеотиды 1-2277 и 2320-4374 из SEQ ID NO: 2 (т. е. нуклеотиды 1-4374 из SEQ ID NO: 2 без нуклеотидов, кодирующих домен B или фрагмент домена B) или нуклеотиды 1-4374 из SEQ ID NO: 2.

[188] В некоторых вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит нуклеотидную последовательность, кодирующую полипептид с активностью FVIII, где нуклеотидная последовательность содержит последовательность нуклеиновой кислоты, характеризующуюся по меньшей мере 85%, по меньшей мере 86%, по меньшей мере 87%, по меньшей мере 88%, по меньшей мере 89%, по меньшей мере 90%, по меньшей мере 91%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 58-4374 из SEQ ID NO: 70. В других вариантах осуществления нуклеотидная последовательность содержит последовательность нуклеиновой кислоты, характеризующуюся по меньшей мере 85%, по меньшей мере 86%, по меньшей мере 87%, по меньшей мере 88%, по меньшей мере 89%, по меньшей мере 90%, по меньшей мере 91%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 58-2277 и 2320-4374 из SEQ ID NO: 70 (т. е. нуклеотидами 58-4374 из SEQ ID NO: 70 без нуклеотидов, кодирующих домен B или фрагмент домена B). В других вариантах осуществления последовательность нуклеиновой кислоты характеризуется по меньшей мере 85%, по меньшей мере 86%, по меньшей мере 87%, по меньшей мере 88%, по меньшей мере 89%, по меньшей мере 90%, по меньшей мере 91%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с SEQ ID NO: 70. В других вариантах осуществления нуклеотидная последовательность содержит нуклеотиды 58-2277 и 2320-4374 из SEQ ID NO: 70 (т. е. нуклеотиды 58-4374 из SEQ ID NO: 70 без нуклеотидов, кодирующих домен B или фрагмент домена B) или нуклеотиды 58-4374 из SEQ ID NO: 70. В еще одних других вариантах осуществления нуклеотидная последовательность содержит нуклеотиды 1-2277 и 2320-4374 из SEQ ID NO: 70 (т. е. нуклеотиды 1-4374 из SEQ ID NO: 70 без нуклеотидов, кодирующих домен B или фрагмент домена B) или нуклеотиды 1-4374 из SEQ ID NO: 70.

[189] В некоторых вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит нуклеотидную последовательность, кодирующую полипептид с активностью FVIII, где нуклеотидная последовательность содержит последовательность нуклеиновой кислоты, характеризующуюся по меньшей мере 85%, по меньшей мере 86%, по меньшей мере 87%, по меньшей мере 88%, по меньшей мере 89%, по меньшей мере 90%, по меньшей мере 91%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 58-4374 из SEQ ID NO: 71. В других вариантах осуществления нуклеотидная последовательность содержит последовательность нуклеиновой кислоты, характеризующуюся по меньшей мере 85%, по меньшей мере 86%, по меньшей мере 87%, по меньшей мере 88%, по меньшей мере 89%, по меньшей мере 90%, по меньшей мере 91%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 58-2277 и 2320-4374 из SEQ ID NO: 71 (т. е. нуклеотидами 58-4374 из SEQ ID NO: 71 без нуклеотидов, кодирующих домен B или фрагмент домена B). В других вариантах осуществления последовательность нуклеиновой кислоты характеризуется по меньшей мере 85%, по меньшей мере 86%, по меньшей мере 87%, по меньшей мере 88%, по меньшей мере 89%, по меньшей мере 90%, по меньшей мере 91%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с SEQ ID NO: 71. В других вариантах осуществления нуклеотидная последовательность содержит нуклеотиды 58-2277 и 2320-4374 из SEQ ID NO: 71 (т. е. нуклеотиды 58-4374 из SEQ ID NO: 71 без нуклеотидов, кодирующих домен B или фрагмент домена B) или нуклеотиды 58-4374 из SEQ ID NO: 71. В еще одних других вариантах осуществления нуклеотидная последовательность содержит нуклеотиды 1-2277 и 2320-4374 из SEQ ID NO: 71 (т. е. нуклеотиды 1-4374 из SEQ ID NO: 71 без нуклеотидов, кодирующих домен B или фрагмент домена B) или нуклеотиды 1-4374 из SEQ ID NO: 71.

[190] В некоторых вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит нуклеотидную последовательность, кодирующую полипептид с активностью FVIII, где нуклеотидная последовательность содержит последовательность нуклеиновой кислоты, характеризующуюся по меньшей мере 92%, по меньшей мере 93%, по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 58-4374 из SEQ ID NO: 3. В других вариантах осуществления нуклеотидная последовательность содержит последовательность нуклеиновой кислоты, характеризующуюся по меньшей мере 92%, по меньшей мере 93%, по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 58-2277 и 2320-4374 из SEQ ID NO: 3 (т. е. нуклеотидами 58-4374 из SEQ ID NO: 3 без нуклеотидов, кодирующих домен B или фрагмент домена B). В определенных вариантах осуществления последовательность нуклеиновой кислоты характеризуется по меньшей мере 92%, по меньшей мере 93%, по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с SEQ ID NO: 3. В некоторых вариантах осуществления нуклеотидная последовательность содержит нуклеотиды 58-2277 и 2320-4374 из SEQ ID NO: 3 (т. е. нуклеотиды 58-4374 из SEQ ID NO: 3 без нуклеотидов, кодирующих домен B или фрагмент домена B) или нуклеотиды 58-4374 из SEQ ID NO: 3. В еще одних других вариантах осуществления нуклеотидная последовательность содержит нуклеотиды 58-2277 и 2320-4374 из SEQ ID NO: 3 (т. е. нуклеотиды 1-4374 из SEQ ID NO: 3 без нуклеотидов, кодирующих домен B или фрагмент домена B) или нуклеотиды 1-4374 из SEQ ID NO: 3.

[191] В некоторых вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит нуклеотидную последовательность, кодирующую полипептид с активностью FVIII, где нуклеотидная последовательность содержит последовательность нуклеиновой кислоты, характеризующуюся по меньшей мере 91%, по меньшей мере 92%, по меньшей мере 93%, по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 58-4374 из SEQ ID NO: 4. В других вариантах осуществления нуклеотидная последовательность содержит последовательность нуклеиновой кислоты, характеризующуюся по меньшей мере 91%, по меньшей мере 92%, по меньшей мере 93%, по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 58-2277 и 2320-4374 из SEQ ID NO: 4 (т. е. нуклеотидами 58-4374 из SEQ ID NO: 4 без нуклеотидов, кодирующих домен B или фрагмент домена B). В других вариантах осуществления последовательность нуклеиновой кислоты характеризуется по меньшей мере 91%, по меньшей мере 92%, по меньшей мере 93%, по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с SEQ ID NO: 4. В других вариантах осуществления нуклеотидная последовательность содержит нуклеотиды 58-2277 и 2320-4374 из SEQ ID NO: 4 (т. е. нуклеотиды 58-4374 из SEQ ID NO: 4 без нуклеотидов, кодирующих домен B или фрагмент домена B) или нуклеотиды 58-4374 из SEQ ID NO: 4. В еще одних других вариантах осуществления нуклеотидная последовательность содержит нуклеотиды 1-2277 и 2320-4374 из SEQ ID NO: 4 (т. е. нуклеотиды 1-4374 из SEQ ID NO: 4 без нуклеотидов, кодирующих домен B или фрагмент домена B) или нуклеотиды 1-4374 из SEQ ID NO: 4.

[192] В некоторых вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит нуклеотидную последовательность, кодирующую полипептид с активностью FVIII, где нуклеотидная последовательность содержит последовательность нуклеиновой кислоты, характеризующуюся по меньшей мере 89%, по меньшей мере 90%, по меньшей мере 91%, по меньшей мере 92%, по меньшей мере 93%, по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 58-4374 из SEQ ID NO: 5. В других вариантах осуществления нуклеотидная последовательность содержит последовательность нуклеиновой кислоты, характеризующуюся по меньшей мере 89%, по меньшей мере 90%, по меньшей мере 91%, по меньшей мере 92%, по меньшей мере 93%, по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 58-2277 и 2320-4374 из SEQ ID NO: 5 (т. е. нуклеотидами 58-4374 из SEQ ID NO: 5 без нуклеотидов, кодирующих домен B или фрагмент домена B). В определенных вариантах осуществления последовательность нуклеиновой кислоты характеризуется по меньшей мере 89%, по меньшей мере 90%, по меньшей мере 91%, по меньшей мере 92%, по меньшей мере 93%, по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с SEQ ID NO: 5. В некоторых вариантах осуществления нуклеотидная последовательность содержит нуклеотиды 58-2277 и 2320-4374 из SEQ ID NO: 5 (т. е. нуклеотиды 58-4374 из SEQ ID NO: 5 без нуклеотидов, кодирующих домен B или фрагмент домена B) или нуклеотиды 58-4374 из SEQ ID NO: 5. В еще одних других вариантах осуществления нуклеотидная последовательность содержит нуклеотиды 1-2277 и 2320-4374 из SEQ ID NO: 5 (т. е. нуклеотиды 1-4374 из SEQ ID NO: 5 без нуклеотидов, кодирующих домен B или фрагмент домена B) или нуклеотиды 1-4374 из SEQ ID NO: 5.

[193] В некоторых вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит нуклеотидную последовательность, кодирующую полипептид с активностью FVIII, где нуклеотидная последовательность содержит последовательность нуклеиновой кислоты, характеризующуюся по меньшей мере 89%, по меньшей мере 90%, по меньшей мере 91%, по меньшей мере 92%, по меньшей мере 93%, по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 58-4374 из SEQ ID NO: 6. В других вариантах осуществления нуклеотидная последовательность содержит последовательность нуклеиновой кислоты, характеризующуюся по меньшей мере 89%, по меньшей мере 90%, по меньшей мере 91%, по меньшей мере 92%, по меньшей мере 93%, по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с нуклеотидами 58-2277 и 2320-4374 из SEQ ID NO: 6 (т. е. нуклеотидами 58-4374 из SEQ ID NO: 6 без нуклеотидов, кодирующих домен B или фрагмент домена B). В определенных вариантах осуществления последовательность нуклеиновой кислоты характеризуется по меньшей мере 89%, по меньшей мере 90%, по меньшей мере 91%, по меньшей мере 92%, по меньшей мере 93%, по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности с SEQ ID NO: 6. В некоторых вариантах осуществления нуклеотидная последовательность содержит нуклеотиды 58-2277 и 2320-4374 из SEQ ID NO: 6 (т. е. нуклеотиды 58-4374 из SEQ ID NO: 6 без нуклеотидов, кодирующих домен B или фрагмент домена B) или нуклеотиды 58-4374 из SEQ ID NO: 6. В еще одних других вариантах осуществления нуклеотидная последовательность содержит нуклеотиды 1-2277 и 2320-4374 из SEQ ID NO: 6 (т. е. нуклеотиды 1-4374 из SEQ ID NO: 6 без нуклеотидов, кодирующих домен B или фрагмент домена B) или нуклеотиды 1-4374 из SEQ ID NO: 6.

[194] В некоторых вариантах осуществления кодон-оптимизированная нуклеотидная последовательность по настоящему изобретению кодирует полипептид FVIII, содержащий последовательность нуклеиновой кислоты, кодирующую сигнальный пептид. В определенных вариантах осуществления сигнальный пептид представляет собой сигнальный пептид FVIII. В некоторых вариантах осуществления последовательность нуклеиновой кислоты, кодирующая сигнальный пептид, является кодон-оптимизированной. В одном конкретном варианте осуществления последовательность нуклеиновой кислоты, кодирующая сигнальный пептид, характеризуется по меньшей мере 60%, по меньшей мере 70%, по меньшей мере 80%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98, по меньшей мере 99% или по меньшей мере 100% идентичностью последовательности с (i) нуклеотидами 1-57 из SEQ ID NO: 1; (ii) нуклеотидами 1-57 из SEQ ID NO: 2; (iii) нуклеотидами 1-57 из SEQ ID NO: 3; (iv) нуклеотидами 1-57 из SEQ ID NO: 4; (v) нуклеотидами 1-57 из SEQ ID NO: 5; (vi) нуклеотидами 1-57 из SEQ ID NO: 6; (vii) нуклеотидами 1-57 из SEQ ID NO: 70; (viii) нуклеотидами 1-57 из SEQ ID NO: 71 или (ix) нуклеотидами 1-57 из SEQ ID NO: 68.

[195] SEQ ID NO: 1-6, 70 и 71 являются оптимизированными вариантами SEQ ID NO: 16, исходной, или "родительской", или "дикотипной" нуклеотидной последовательности FVIII. SEQ ID NO: 16 кодирует FVIII человека с удаленным доменом B. Хотя SEQ ID NO: 1-6, 70 и 71 получены из конкретной формы FVIII с удаленным доменом B (SEQ ID NO: 16), следует понимать, что настоящее изобретение также включает оптимизированные варианты нуклеиновых кислот, кодирующих другие варианты FVIII. Например, другие варианты FVIII могут включать полноразмерные FVIII, FVIII с другими делециями домена B (описанные в данном документе) или другие фрагменты FVIII, сохраняющие активность FVIII.

[196] В одном варианте осуществления генная кассета содержит конструкцию на основе FVIII, которая включает полинуклеотидную последовательность (6526 нуклеотидов), приведенную в таблицах 2A - 2C. В одном варианте осуществления генная кассета содержит конструкцию на основе FVIII, которая включает полинуклеотидную последовательность (6526 нуклеотидов), приведенную в таблице 2В.

[197] В определенных вариантах осуществления выделенная молекула нуклеиновой кислоты содержит нуклеотидную последовательность, характеризующуюся по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или приблизительно 100% идентичностью последовательности с нуклеотидной последовательностью под SEQ ID NO: 179 или 182, где выделенная молекула нуклеиновой кислоты сохраняет способность к экспрессии функционального белка FVIII.

Таблица 2A. Пример конструкции на основе FVIII (нуклеотиды 1-6526; SEQ ID NO: 110)

Описание	Последовательность
5'-ITR (инвертированный концевой повтор AAV2 на 5'-конце) (SEQ ID NO:111)	1 -- CTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTT GGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCT -- 130
Каркасная последовательность плазмиды (PBS)-1 (SEQ ID NO:112)	131 -- GCGGCAATTCAGTCGATAACTATAACGGTCCTAAGGTAGCGATTTAAATACGCGCTCT CTTAAGGTAGCCCCGGGACGCGTCAATTGAGATCTGGATCCGGTACCGAATTCGCGGCCGCCTCGACGACTAGCGTTTAATTAA -- 272
TTPp (специфический для печени промотор) (SEQ ID NO:113)	273 -- ACGCGTGTCTGTCTGCACATTTCGTAGAGCGAGTGTTCCGATACTCTAATCTCCCTAG GCAAGGTTCATATTTGTGTAGGTTACTTATTCTCCTTTTGTTGACTAAGTCAATAATCAGAATCAGCAGGTTTGGAGTCAGCTTGGCAGGGATCAGCAGCCTGGGTTGGAAGGAGGGGGTATAAAAGCCCCTTCACCAGGAGAAGCCGTCACACAGATCCACAAGCTCCTG -- 501
PBS-2 (SEQ ID NO:114)	502 -- AG -- 503
Синтетический интрон (SEQ ID NO:115)	504 -- GTAAGTGCCGTGTGTGGTTCCCGCGGGCCTGGCCTCTTTACGGGTTATGGCCCTTGCG TGCCTTGAATTACTGACACTGACATCCACTTTTTCTTTTTCTCCACAG --609
PBS-3 (SEQ ID NO:116)	610 -- CTAGCGCCACC -- 620
FVIIIco6XTEN (SEQ ID NO:117) (открытая рамка считывания для кодон-оптимизированного FVIII варианта 6, содержащего XTEN144; последовательность XTEN обозначена двойным подчеркиванием (SEQ ID NO:118))	621 -- ATGCAGATTGAGCTGTCCACTTGTTTCTTCCTGTGCCTCCTGCGCTTCTGTTTCTCCG CCACTCGCCGGTACTACCTTGGAGCCGTGGAGCTTTCATGGGACTACATGCAGAGCGACCTGGGCGAACTCCCCGTGGATGCCAGATTCCCCCCCCGCGTGCCAAAGTCCTTCCCCTTTAACACCTCCGTGGTGTACAAGAAAACCCTCTTTGTCGAGTTCACTGACCACCTGTTCAACATCGCCAAGCCGCGCCCACCTTGGATGGGCCTCCTGGGACCGACCATTCAAGCTGAAGTGTACGACACCGTGGTGATCACCCTGAAGAACATGGCGTCCCACCCCGTGTCCCTGCATGCGGTCGGAGTGTCCTACTGGAAGGCCTCCGAAGGAGCTGAGTACGACGACCAGACTAGCCAGCGGGAAAAGGAGGACGATAAAGTGTTCCCGGGCGGCTCGCATACTTACGTGTGGCAAGTCCTGAAGGAAAACGGACCTATGGCATCCGATCCTCTGTGCCTGACTTACTCCTACCTTTCCCATGTGGACCTCGTGAAGGACCTGAACAGCGGGCTGATTGGTGCACTTCTCGTGTGCCGCGAAGGTTCGCTCGCTAAGGAAAAGACCCAGACCCTCCATAAGTTCATCCTTTTGTTCGCTGTGTTCGATGAAGGAAAGTCATGGCATTCCGAAACTAAGAACTCGCTGATGCAGGACCGGGATGCCGCCTCAGCCCGCGCCTGGCCTAAAATGCATACAGTCAACGGATACGTGAATCGGTCACTGCCCGGGCTCATCGGTTGTCACAGAAAGTCCGTGTACTGGCACGTCATCGGCATGGGCACTACGCCTGAAGTGCACTCCATCTTCCTGGAAGGGCACACCTTCCTCGTGCGCAACCACCGCCAGGCCTCTCTGGAAATCTCCCCGATTACCTTTCTGACCGCCCAGACTCTGCTCATGGACCTGGGGCAGTTCCTTCTCTTCTGCCACATCTCCAGCCATCAGCACGACGGAATGGAGGCCTACGTGAAGGTGGACTCATGCCCGGAAGAACCTCAGTTGCGGATGAAGAACAACGAGGAGGCCGAGGACTATGACGACGATTTGACTGACTCCGAGATGGACGTCGTGCGGTTCGATGACGACAACAGCCCCAGCTTCATCCAGATTCGCAGCGTGGCCAAGAAGCACCCCAAAACCTGGGTGCACTACATCGCGGCCGAGGAAGAAGATTGGGACTACGCCCCGTTGGTGCTGGCACCCGATGACCGGTCGTACAAGTCCCAGTATCTGAACAATGGTCCGCAGCGGATTGGCAGAAAGTACAAGAAAGTGCGGTTCATGGCGTACACTGACGAAACGTTTAAGACCCGGGAGGCCATTCAACATGAGAGCGGCATTCTGGGACCACTGCTGTACGGAGAGGTCGGCGATACCCTGCTCATCATCTTCAAAAACCAGGCCTCCCGGCCTTACAACATCTACCCTCACGGAATCACCGACGTGCGGCCACTCTACTCGCGGCGCCTGCCGAAGGGCGTCAAGCACCTGAAAGACTTCCCTATCCTGCCGGGCGAAATCTTCAAGTATAAGTGGACCGTCACCGTGGAGGACGGGCCCACCAAGAGCGATCCTAGGTGTCTGACTCGGTACTACTCCAGCTTCGTGAACATGGAACGGGACCTGGCATCGGGACTCATTGGACCGCTGCTGATCTGCTACAAAGAGTCGGTGGATCAACGCGGCAACCAGATCATGTCCGACAAGCGCAACGTGATCCTGTTCTCCGTGTTTGATGAAAACAGATCCTGGTACCTCACTGAAAACATCCAGAGGTTCCTCCCAAACCCCGCAGGAGTGCAACTGGAGGACCCTGAGTTTCAGGCCTCGAATATCATGCACTCGATTAACGGTTACGTGTTCGACTCGCTGCAACTGAGCGTGTGCCTCCATGAAGTCGCTTACTGGTACATTCTGTCCATCGGCGCCCAGACTGACTTCCTGAGCGTGTTCTTTTCCGGTTACACCTTTAAGCACAAGATGGTGTACGAAGATACCCTGACCCTGTTCCCTTTCTCCGGCGAAACGGTGTTCATGTCGATGGAGAACCCGGGTCTGTGGATTCTGGGATGCCACAACAGCGACTTTCGGAACCGCGGAATGACTGCCCTGCTGAAGGTGTCCTCATGCGACAAGAACACCGGAGACTACTACGAGGACTCCTACGAGGATATCTCAGCCTACCTCCTGTCCAAGAACAACGCGATCGAGCCGCGCAGCTTCAGCCAGAACGGCGCGCCAACATCAGAGAGCGCCACCCCTGAAAGTGGTCCCGGGAGCGAGCCAGCCACATCTGGGTCGGAAACGCCAGGCACAAGTGAGTCTGCAACTCCCGAGTCCGGACCTGGCTCCGAGCCTGCCACTAGCGGCTCCGAGACTCCGGGAACTTCCGAGAGCGCTACACCAGAAAGCGGACCCGGAACCAGTACCGAACCTAGCGAGGGCTCTGCTCCGGGCAGCCCAGCCGGCTCTCCTACATCCACGGAGGAGGGCACTTCCGAATCCGCCACCCCGGAGTCAGGGCCAGGATCTGAACCCGCTACCTCAGGCAGTGAGACGCCAGGAACGAGCGAGTCCGCTACACCGGAGAGTGGGCCAGGGAGCCCTGCTGGATCTCCTACGTCCACTGAGGAAGGGTCACCAGCGGGCTCGCCCACCAGCACTGAAGAAGGTGCCTCGAGCCCGCCTGTGCTGAAGAGGCACCAGCGAGAAATTACCCGGACCACCCTCCAATCGGATCAGGAGGAAATCGACTACGACGACACCATCTCGGTGGAAATGAAGAAGGAAGATTTCGATATCTACGACGAGGACGAAAATCAGTCCCCTCGCTCATTCCAAAAGAAAACTAGACACTACTTTATCGCCGCGGTGGAAAGACTGTGGGACTATGGAATGTCATCCAGCCCTCACGTCCTTCGGAACCGGGCCCAGAGCGGATCGGTGCCTCAGTTCAAGAAAGTGGTGTTCCAGGAGTTCACCGACGGCAGCTTCACCCAGCCGCTGTACCGGGGAGAACTGAACGAACACCTGGGCCTGCTCGGTCCCTACATCCGCGCGGAAGTGGAGGATAACATCATGGTGACCTTCCGTAACCAAGCATCCAGACCTTACTCCTTCTATTCCTCCCTGATCTCATACGAGGAGGACCAGCGCCAAGGCGCCGAGCCCCGCAAGAACTTCGTCAAGCCCAACGAGACTAAGACCTACTTCTGGAAGGTCCAACACCATATGGCCCCGACCAAGGATGAGTTTGACTGCAAGGCCTGGGCCTACTTCTCCGACGTGGACCTTGAGAAGGATGTCCATTCCGGCCTGATCGGGCCGCTGCTCGTGTGTCACACCAACACCCTGAACCCAGCGCATGGACGCCAGGTCACCGTCCAGGAGTTTGCTCTGTTCTTCACCATTTTTGACGAAACTAAGTCCTGGTACTTCACCGAGAATATGGAGCGAAACTGTAGAGCGCCCTGCAATATCCAGATGGAAGATCCGACTTTCAAGGAGAACTATAGATTCCACGCCATCAACGGGTACATCATGGATACTCTGCCGGGGCTGGTCATGGCCCAGGATCAGAGGATTCGGTGGTACTTGCTGTCAATGGGATCGAACGAAAACATTCACTCCATTCACTTCTCCGGTCACGTGTTCACTGTGCGCAAGAAGGAGGAGTACAAGATGGCGCTGTACAATCTGTACCCCGGGGTGTTCGAAACTGTGGAGATGCTGCCGTCCAAGGCCGGCATCTGGAGAGTGGAGTGCCTGATCGGAGAGCACCTCCACGCGGGGATGTCCACCCTCTTCCTGGTGTACTCGAATAAGTGCCAGACCCCGCTGGGCATGGCCTCGGGCCACATCAGAGACTTCCAGATCACAGCAAGCGGACAATACGGCCAATGGGCGCCGAAGCTGGCCCGCTTGCACTACTCCGGATCGATCAACGCATGGTCCACCAAGGAACCGTTCTCGTGGATTAAGGTGGACCTCCTGGCCCCTATGATTATCCACGGAATTAAGACCCAGGGCGCCAGGCAGAAGTTCTCCTCCCTGTACATCTCGCAATTCATCATCATGTACAGCCTGGACGGGAAGAAGTGGCAGACTTACAGGGGAAACTCCACCGGCACCCTGATGGTCTTTTTCGGCAACGTGGATTCCTCCGGCATTAAGCACAACATCTTCAACCCACCGATCATAGCCAGATATATTAGGCTCCACCCCACTCACTACTCAATCCGCTCAACTCTTCGGATGGAACTCATGGGGTGCGACCTGAACTCCTGCTCCATGCCGTTGGGGATGGAATCAAAGGCTATTAGCGACGCCCAGATCACCGCGAGCTCCTACTTCACTAACATGTTCGCCACCTGGAGCCCCTCCAAGGCCAGGCTGCACTTGCAGGGACGGTCAAATGCCTGGCGGCCGCAAGTGAACAATCCGAAGGAATGGCTTCAAGTGGATTTCCAAAAGACCATGAAAGTGACCGGAGTCACCACCCAGGGAGTGAAGTCCCTTCTGACCTCGATGTATGTGAAGGAGTTCCTGATTAGCAGCAGCCAGGACGGGCACCAGTGGACCCTGTTCTTCCAAAACGGAAAGGTCAAGGTGTTCCAGGGGAACCAGGACTCGTTCACACCCGTGGTGAACTCCCTGGACCCCCCACTGCTGACGCGGTACTTGAGGATTCATCCTCAGTCCTGGGTCCATCAGATTGCATTGCGAATGGAAGTCCTGGGCTGCGAGGCCCAGGACCTGTACTGA -- 5444
PBS-4 (SEQ ID NO:119)	5445 -- ATCAGCCTGAGCTCGCTGA -- 5463
WPRE (мутантный посттранскрипционный регуляторный элемент вируса гепатита сурков) (SEQ ID NO:120)	5464 -- TCATAATCAACCTCTGGATTACAAAATTTGTGAAAGATTGACTGGTATTCTTAACTA TGTTGCTCCTTTTACGCTATGTGGATACGCTGCTTTAATGCCTTTGTATCATGCTATTGCTTCCCGTATGGCTTTCATTTTCTCCTCCTTGTATAAATCCTGGTTGCTGTCTCTTTATGAGGAGTTGTGGCCCGTTGTCAGGCAACGTGGCGTGGTGTGCACTGTGTTTGCTGACGCAACCCCCACTGGTTGGGGCATTGCCACCACCTGTCAGCTCCTTTCCGGGACTTTCGCTTTCCCCCTCCCTATTGCCACGGCGGAACTCATCGCCGCCTGCCTTGCCCGCTGCTGGACAGGGGCTCGGCTGTTGGGCACTGACAATTCCGTGGTGTTGTCGGGGAAATCATCGTCCTTTCCTTGGCTGCTCGCCTGTGTTGCCACCTGGATTCTGCGCGGGACGTCCTTCTGCTACGTCCCTTCGGCCCTCAATCCAGCGGACCTTCCTTCCCGCGGCCTGCTGCCGGCTCTGCGGCCTCTTCCGCGTCTTCGCCTTCGCCCTCAGACGAGTCGGATCTCCCTTTGGGCCGCCTCCCCGCTG -- 6058
PBS-5 (SEQ ID NO:121)	6059 -- ATCAGCCT -- 6066
bGHpA (сигнальная последовательность полиаденилирования из бычьего гормона роста) (SEQ ID NO:122)	6067 -- CGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCT TGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGA --6277
PBS-6 (SEQ ID NO:123)	6278 -- TGCGGTGGGCTCTATGGCTTCTGAGGCGGAAAGAACGGGCTCGAGAAGCTTCTAGAT ATCCTCTCTTAAGGTAGCATCGAGATTTAAATTAGGGATAACAGGGTAATGGCGCGGGCCGC -- 6396
3'-ITR (инвертированный концевой повтор AAV2 на 3'-конце) (SEQ ID NO:124)	6397 -- AGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTG AGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAG -- 6526

Таблица 2B. Пример конструкции B19-FVIII (нуклеотиды 1-6762; SEQ ID NO: 179)

Описание	Последовательность
5'-ITR (SEQ ID NO: 180)	1 - CTCTGGGCCAGCTTGCTTGGGGTTGCCTTGACACTAAGACAAGCGGCGCGCCGCTTGATCTTAGTGGCACGTCAACCCCAAGCGCTGGCCCAGAGCCAACCCTAATTCCGGAAGTCCCGCCCACCGGAAGTGACGTCACAGGAAATGACGTCACAGGAAATGACGTAATTGTCCGCCATCTTGTACCGGAAGT CCCGCCTACCGGCGGCGACCGGCGGCATCTGATTTGGTGTCTTCTTTTAA ATTTT -- 248
TTPp (специфический для печени промотор) (SEQ ID NO:113)	391 - ACGCGTGTCTGTCTGCACATTTCGTAGAGCGAGTGTTCCGATACTCTAATCTCCCTAG GCAAGGTTCATATTTGTGTAGGTTACTTATTCTCCTTTTGTTGACTAAGTCAATAATCAGAATCAGCAGGTTTGGAGTCAGCTTGGCAGGGATCAGCAGCCTGGGTTGGAAGGAGGGGGTATAAAAGCCCCTTCACCAGG AGAAGCCGTCACACAGATCCACAAGCTCCTG -- 619
Синтетический интрон (SEQ ID NO:115)	622 - GTAAGTGCCGTGTGTGGTTCCCGCGGGCCTGGCCTCTTTACGGGTTA TGGCCCTTGCGTGCCTTGAATTACTGACACTGACATCCACTTTTTCTTTTTCTCCACAG --727
FVIIIco6XTEN (SEQ ID NO:117) (открытая рамка считывания для кодон-оптимизированного FVIII варианта 6, содержащего XTEN144; последовательность XTEN обозначена двойным подчеркиванием (SEQ ID NO:118))	739 - ATGCAGATTGAGCTGTCCACTTGTTTCTTCCTGTGCCTCCTGCGCTTC TGTTTCTCCGCCACTCGCCGGTACTACCTTGGAGCCGTGGAGCTTTCATGGGACTACATGCAGAGCGACCTGGGCGAACTCCCCGTGGATGCCAGATTCCCCCCCCGCGTGCCAAAGTCCTTCCCCTTTAACACCTCCGTGGTGTACAAGAAAACCCTCTTTGTCGAGTTCACTGACCACCTGTTCAACATCGCCAAGCCGCGCCCACCTTGGATGGGCCTCCTGGGACCGACCATTCAAGCTGAAGTGTACGACACCGTGGTGATCACCCTGAAGAACATGGCGTCCCACCCCGTGTCCCTGCATGCGGTCGGAGTGTCCTACTGGAAGGCCTCCGAAGGAGCTGAGTACGACGACCAGACTAGCCAGCGGGAAAAGGAGGACGATAAAGTGTTCCCGGGCGGCTCGCATACTTACGTGTGGCAAGTCCTGAAGGAAAACGGACCTATGGCATCCGATCCTCTGTGCCTGACTTACTCCTACCTTTCCCATGTGGACCTCGTGAAGGACCTGAACAGCGGGCTGATTGGTGCACTTCTCGTGTGCCGCGAAGGTTCGCTCGCTAAGGAAAAGACCCAGACCCTCCATAAGTTCATCCTTTTGTTCGCTGTGTTCGATGAAGGAAAGTCATGGCATTCCGAAACTAAGAACTCGCTGATGCAGGACCGGGATGCCGCCTCAGCCCGCGCCTGGCCTAAAATGCATACAGTCAACGGATACGTGAATCGGTCACTGCCCGGGCTCATCGGTTGTCACAGAAAGTCCGTGTACTGGCACGTCATCGGCATGGGCACTACGCCTGAAGTGCACTCCATCTTCCTGGAAGGGCACACCTTCCTCGTGCGCAACCACCGCCAGGCCTCTCTGGAAATCTCCCCGATTACCTTTCTGACCGCCCAGACTCTGCTCATGGACCTGGGGCAGTTCCTTCTCTTCTGCCACATCTCCAGCCATCAGCACGACGGAATGGAGGCCTACGTGAAGGTGGACTCATGCCCGGAAGAACCTCAGTTGCGGATGAAGAACAACGAGGAGGCCGAGGACTATGACGACGATTTGACTGACTCCGAGATGGACGTCGTGCGGTTCGATGACGACAACAGCCCCAGCTTCATCCAGATTCGCAGCGTGGCCAAGAAGCACCCCAAAACCTGGGTGCACTACATCGCGGCCGAGGAAGAAGATTGGGACTACGCCCCGTTGGTGCTGGCACCCGATGACCGGTCGTACAAGTCCCAGTATCTGAACAATGGTCCGCAGCGGATTGGCAGAAAGTACAAGAAAGTGCGGTTCATGGCGTACACTGACGAAACGTTTAAGACCCGGGAGGCCATTCAACATGAGAGCGGCATTCTGGGACCACTGCTGTACGGAGAGGTCGGCGATACCCTGCTCATCATCTTCAAAAACCAGGCCTCCCGGCCTTACAACATCTACCCTCACGGAATCACCGACGTGCGGCCACTCTACTCGCGGCGCCTGCCGAAGGGCGTCAAGCACCTGAAAGACTTCCCTATCCTGCCGGGCGAAATCTTCAAGTATAAGTGGACCGTCACCGTGGAGGACGGGCCCACCAAGAGCGATCCTAGGTGTCTGACTCGGTACTACTCCAGCTTCGTGAACATGGAACGGGACCTGGCATCGGGACTCATTGGACCGCTGCTGATCTGCTACAAAGAGTCGGTGGATCAACGCGGCAACCAGATCATGTCCGACAAGCGCAACGTGATCCTGTTCTCCGTGTTTGATGAAAACAGATCCTGGTACCTCACTGAAAACATCCAGAGGTTCCTCCCAAACCCCGCAGGAGTGCAACTGGAGGACCCTGAGTTTCAGGCCTCGAATATCATGCACTCGATTAACGGTTACGTGTTCGACTCGCTGCAACTGAGCGTGTGCCTCCATGAAGTCGCTTACTGGTACATTCTGTCCATCGGCGCCCAGACTGACTTCCTGAGCGTGTTCTTTTCCGGTTACACCTTTAAGCACAAGATGGTGTACGAAGATACCCTGACCCTGTTCCCTTTCTCCGGCGAAACGGTGTTCATGTCGATGGAGAACCCGGGTCTGTGGATTCTGGGATGCCACAACAGCGACTTTCGGAACCGCGGAATGACTGCCCTGCTGAAGGTGTCCTCATGCGACAAGAACACCGGAGACTACTACGAGGACTCCTACGAGGATATCTCAGCCTACCTCCTGTCCAAGAACAACGCGATCGAGCCGCGCAGCTTCAGCCAGAACGGCGCGCCAACATCAGAGAGCGCCACCCCTGAAAGTGGTCCCGGGAGCGAGCCAGCCACATCTGGGTCGGAAACGCCAGGCACAAGTGAGTCTGCAACTCCCGAGTCCGGACCTGGCTCCGAGCCTGCCACTAGCGGCTCCGAGACTCCGGGAACTTCCGAGAGCGCTACACCAGAAAGCGGACCCGGAACCAGTACCGAACCTAGCGAGGGCTCTGCTCCGGGCAGCCCAGCCGGCTCTCCTACATCCACGGAGGAGGGCACTTCCGAATCCGCCACCCCGGAGTCAGGGCCAGGATCTGAACCCGCTACCTCAGGCAGTGAGACGCCAGGAACGAGCGAGTCCGCTACACCGGAGAGTGGGCCAGGGAGCCCTGCTGGATCTCCTACGTCCACTGAGGAAGGGTCACCAGCGGGCTCGCCCACCAGCACTGAAGAAGGTGCCTCGAGCCCGCCTGTGCTGAAGAGGCACCAGCGAGAAATTACCCGGACCACCCTCCAATCGGATCAGGAGGAAATCGACTACGACGACACCATCTCGGTGGAAATGAAGAAGGAAGATTTCGATATCTACGACGAGGACGAAAATCAGTCCCCTCGCTCATTCCAAAAGAAAACTAGACACTACTTTATCGCCGCGGTGGAAAGACTGTGGGACTATGGAATGTCATCCAGCCCTCACGTCCTTCGGAACCGGGCCCAGAGCGGATCGGTGCCTCAGTTCAAGAAAGTGGTGTTCCAGGAGTTCACCGACGGCAGCTTCACCCAGCCGCTGTACCGGGGAGAACTGAACGAACACCTGGGCCTGCTCGGTCCCTACATCCGCGCGGAAGTGGAGGATAACATCATGGTGACCTTCCGTAACCAAGCATCCAGACCTTACTCCTTCTATTCCTCCCTGATCTCATACGAGGAGGACCAGCGCCAAGGCGCCGAGCCCCGCAAGAACTTCGTCAAGCCCAACGAGACTAAGACCTACTTCTGGAAGGTCCAACACCATATGGCCCCGACCAAGGATGAGTTTGACTGCAAGGCCTGGGCCTACTTCTCCGACGTGGACCTTGAGAAGGATGTCCATTCCGGCCTGATCGGGCCGCTGCTCGTGTGTCACACCAACACCCTGAACCCAGCGCATGGACGCCAGGTCACCGTCCAGGAGTTTGCTCTGTTCTTCACCATTTTTGACGAAACTAAGTCCTGGTACTTCACCGAGAATATGGAGCGAAACTGTAGAGCGCCCTGCAATATCCAGATGGAAGATCCGACTTTCAAGGAGAACTATAGATTCCACGCCATCAACGGGTACATCATGGATACTCTGCCGGGGCTGGTCATGGCCCAGGATCAGAGGATTCGGTGGTACTTGCTGTCAATGGGATCGAACGAAAACATTCACTCCATTCACTTCTCCGGTCACGTGTTCACTGTGCGCAAGAAGGAGGAGTACAAGATGGCGCTGTACAATCTGTACCCCGGGGTGTTCGAAACTGTGGAGATGCTGCCGTCCAAGGCCGGCATCTGGAGAGTGGAGTGCCTGATCGGAGAGCACCTCCACGCGGGGATGTCCACCCTCTTCCTGGTGTACTCGAATAAGTGCCAGACCCCGCTGGGCATGGCCTCGGGCCACATCAGAGACTTCCAGATCACAGCAAGCGGACAATACGGCCAATGGGCGCCGAAGCTGGCCCGCTTGCACTACTCCGGATCGATCAACGCATGGTCCACCAAGGAACCGTTCTCGTGGATTAAGGTGGACCTCCTGGCCCCTATGATTATCCACGGAATTAAGACCCAGGGCGCCAGGCAGAAGTTCTCCTCCCTGTACATCTCGCAATTCATCATCATGTACAGCCTGGACGGGAAGAAGTGGCAGACTTACAGGGGAAACTCCACCGGCACCCTGATGGTCTTTTTCGGCAACGTGGATTCCTCCGGCATTAAGCACAACATCTTCAACCCACCGATCATAGCCAGATATATTAGGCTCCACCCCACTCACTACTCAATCCGCTCAACTCTTCGGATGGAACTCATGGGGTGCGACCTGAACTCCTGCTCCATGCCGTTGGGGATGGAATCAAAGGCTATTAGCGACGCCCAGATCACCGCGAGCTCCTACTTCACTAACATGTTCGCCACCTGGAGCCCCTCCAAGGCCAGGCTGCACTTGCAGGGACGGTCAAATGCCTGGCGGCCGCAAGTGAACAATCCGAAGGAATGGCTTCAAGTGGATTTCCAAAAGACCATGAAAGTGACCGGAGTCACCACCCAGGGAGTGAAGTCCCTTCTGACCTCGATGTATGTGAAGGAGTTCCTGATTAGCAGCAGCCAGGACGGGCACCAGTGGACCCTGTTCTTCCAAAACGGAAAGGTCAAGGTGTTCCAGGGGAACCAGGACTCGTTCACACCCGTGGTGAACTCCCTGGACCCCCCACTGCTGACGCGGTACTTGAGGATTCATCCTCAGTCCTGGGTCCATCAGATTGCATTGCGAATGGAAGTCCTGGGCTGCGAGGCCCAGGACCTGTACTGA -- 5562
WPRE (мутантный посттранскрипционный регуляторный элемент вируса гепатита сурков) (SEQ ID NO:120)	5582 - TCATAATCAACCTCTGGATTACAAAATTTGTGAAAGATTGACTGGT ATTCTTAACTATGTTGCTCCTTTTACGCTATGTGGATACGCTGCTTTAATGCCTTTGTATCATGCTATTGCTTCCCGTATGGCTTTCATTTTCTCCTCCTTGTATAAATCCTGGTTGCTGTCTCTTTATGAGGAGTTGTGGCCCGTTGTCAGGCAACGTGGCGTGGTGTGCACTGTGTTTGCTGACGCAACCCCCACTGGTTGGGGCATTGCCACCACCTGTCAGCTCCTTTCCGGGACTTTCGCTTTCCCCCTCCCTATTGCCACGGCGGAACTCATCGCCGCCTGCCTTGCCCGCTGCTGGACAGGGGCTCGGCTGTTGGGCACTGACAATTCCGTGGTGTTGTCGGGGAAATCATCGTCCTTTCCTTGGCTGCTCGCCTGTGTTGCCACCTGGATTCTGCGCGGGACGTCCTTCTGCTACGTCCCTTCGGCCCTCAATCCAGCGGACCTTCCTTCCCGCGGCCTGCTGCCGGCTCTGCGGCCTCTTCCGCGTCTTCGCCTTCGCCCTCAGACGAGTCGGATCTCCCTTTGGGCCGCCTCCCCGCTG -- 6176
bGHpA (сигнальная последовательность полиаденилирования из бычьего гормона роста) (SEQ ID NO:122)	6185 - CGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCC GTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGA -- 6395
3'-ITR, инвертированный концевой повтор (SEQ ID NO: 181)	6515 - CTCTGGGCCAGCTTGCTTGGGGTTGCCTTGACACTAAGACAAGCGG CGCGCCGCTTGATCTTAGTGGCACGTCAACCCCAAGCGCTGGCCCAGAGCCAACCCTAATTCCGGAAGTCCCGCCCACCGGAAGTGACGTCACAGGAAATGACGTCACAGGAAATGACGTAATTGTCCGCCATCTTGTACCGGAAGTCCCGCCTACCGGCGGCGACCGGCGGCATCTGATTTGGTGTCTTCTTTTAAATTTT -- 6762
Полноразмерная последовательность (SEQ ID NO: 179)
CTCTGGGCCAGCTTGCTTGGGGTTGCCTTGACACTAAGACAAGCGGCGCGCCGCTTGATCTTAGTGGCACGTCAACCCCAAGCGCTGGCCCAGAGCCAACCCTAATTCCGGAAGTCCCGCCCACCGGAAGTGACGTCACAGGAAATGACGTCACAGGAAATGACGTAATTGTCCGCCATCTTGTACCGGAAGTCCCGCCTACCGGCGGCGACCGGCGGCATCTGATTTGGTGTCTTCTTTTAAATTTTGCGGCAATTCAGTCGATAACTATAACGGTCCTAAGGTAGCGATTTAAATACGCGCTCTCTTAAGGTAGCCCCGGGACGCGTCAATTGAGATCTGGATCCGGTACCGAATTCGCGGCCGCCTCGACGACTAGCGTTTAATTAAACGCGTGTCTGTCTGCACATTTCGTAGAGCGAGTGTTCCGATACTCTAATCTCCCTAGGCAAGGTTCATATTTGTGTAGGTTACTTATTCTCCTTTTGTTGACTAAGTCAATAATCAGAATCAGCAGGTTTGGAGTCAGCTTGGCAGGGATCAGCAGCCTGGGTTGGAAGGAGGGGGTATAAAAGCCCCTTCACCAGGAGAAGCCGTCACACAGATCCACAAGCTCCTGAGGTAAGTGCCGTGTGTGGTTCCCGCGGGCCTGGCCTCTTTACGGGTTATGGCCCTTGCGTGCCTTGAATTACTGACACTGACATCCACTTTTTCTTTTTCTCCACAGCTAGCGCCACCATGCAGATTGAGCTGTCCACTTGTTTCTTCCTGTGCCTCCTGCGCTTCTGTTTCTCCGCCACTCGCCGGTACTACCTTGGAGCCGTGGAGCTTTCATGGGACTACATGCAGAGCGACCTGGGCGAACTCCCCGTGGATGCCAGATTCCCCCCCCGCGTGCCAAAGTCCTTCCCCTTTAACACCTCCGTGGTGTACAAGAAAACCCTCTTTGTCGAGTTCACTGACCACCTGTTCAACATCGCCAAGCCGCGCCCACCTTGGATGGGCCTCCTGGGACCGACCATTCAAGCTGAAGTGTACGACACCGTGGTGATCACCCTGAAGAACATGGCGTCCCACCCCGTGTCCCTGCATGCGGTCGGAGTGTCCTACTGGAAGGCCTCCGAAGGAGCTGAGTACGACGACCAGACTAGCCAGCGGGAAAAGGAGGACGATAAAGTGTTCCCGGGCGGCTCGCATACTTACGTGTGGCAAGTCCTGAAGGAAAACGGACCTATGGCATCCGATCCTCTGTGCCTGACTTACTCCTACCTTTCCCATGTGGACCTCGTGAAGGACCTGAACAGCGGGCTGATTGGTGCACTTCTCGTGTGCCGCGAAGGTTCGCTCGCTAAGGAAAAGACCCAGACCCTCCATAAGTTCATCCTTTTGTTCGCTGTGTTCGATGAAGGAAAGTCATGGCATTCCGAAACTAAGAACTCGCTGATGCAGGACCGGGATGCCGCCTCAGCCCGCGCCTGGCCTAAAATGCATACAGTCAACGGATACGTGAATCGGTCACTGCCCGGGCTCATCGGTTGTCACAGAAAGTCCGTGTACTGGCACGTCATCGGCATGGGCACTACGCCTGAAGTGCACTCCATCTTCCTGGAAGGGCACACCTTCCTCGTGCGCAACCACCGCCAGGCCTCTCTGGAAATCTCCCCGATTACCTTTCTGACCGCCCAGACTCTGCTCATGGACCTGGGGCAGTTCCTTCTCTTCTGCCACATCTCCAGCCATCAGCACGACGGAATGGAGGCCTACGTGAAGGTGGACTCATGCCCGGAAGAACCTCAGTTGCGGATGAAGAACAACGAGGAGGCCGAGGACTATGACGACGATTTGACTGACTCCGAGATGGACGTCGTGCGGTTCGATGACGACAACAGCCCCAGCTTCATCCAGATTCGCAGCGTGGCCAAGAAGCACCCCAAAACCTGGGTGCACTACATCGCGGCCGAGGAAGAAGATTGGGACTACGCCCCGTTGGTGCTGGCACCCGATGACCGGTCGTACAAGTCCCAGTATCTGAACAATGGTCCGCAGCGGATTGGCAGAAAGTACAAGAAAGTGCGGTTCATGGCGTACACTGACGAAACGTTTAAGACCCGGGAGGCCATTCAACATGAGAGCGGCATTCTGGGACCACTGCTGTACGGAGAGGTCGGCGATACCCTGCTCATCATCTTCAAAAACCAGGCCTCCCGGCCTTACAACATCTACCCTCACGGAATCACCGACGTGCGGCCACTCTACTCGCGGCGCCTGCCGAAGGGCGTCAAGCACCTGAAAGACTTCCCTATCCTGCCGGGCGAAATCTTCAAGTATAAGTGGACCGTCACCGTGGAGGACGGGCCCACCAAGAGCGATCCTAGGTGTCTGACTCGGTACTACTCCAGCTTCGTGAACATGGAACGGGACCTGGCATCGGGACTCATTGGACCGCTGCTGATCTGCTACAAAGAGTCGGTGGATCAACGCGGCAACCAGATCATGTCCGACAAGCGCAACGTGATCCTGTTCTCCGTGTTTGATGAAAACAGATCCTGGTACCTCACTGAAAACATCCAGAGGTTCCTCCCAAACCCCGCAGGAGTGCAACTGGAGGACCCTGAGTTTCAGGCCTCGAATATCATGCACTCGATTAACGGTTACGTGTTCGACTCGCTGCAACTGAGCGTGTGCCTCCATGAAGTCGCTTACTGGTACATTCTGTCCATCGGCGCCCAGACTGACTTCCTGAGCGTGTTCTTTTCCGGTTACACCTTTAAGCACAAGATGGTGTACGAAGATACCCTGACCCTGTTCCCTTTCTCCGGCGAAACGGTGTTCATGTCGATGGAGAACCCGGGTCTGTGGATTCTGGGATGCCACAACAGCGACTTTCGGAACCGCGGAATGACTGCCCTGCTGAAGGTGTCCTCATGCGACAAGAACACCGGAGACTACTACGAGGACTCCTACGAGGATATCTCAGCCTACCTCCTGTCCAAGAACAACGCGATCGAGCCGCGCAGCTTCAGCCAGAACGGCGCGCCAACATCAGAGAGCGCCACCCCTGAAAGTGGTCCCGGGAGCGAGCCAGCCACATCTGGGTCGGAAACGCCAGGCACAAGTGAGTCTGCAACTCCCGAGTCCGGACCTGGCTCCGAGCCTGCCACTAGCGGCTCCGAGACTCCGGGAACTTCCGAGAGCGCTACACCAGAAAGCGGACCCGGAACCAGTACCGAACCTAGCGAGGGCTCTGCTCCGGGCAGCCCAGCCGGCTCTCCTACATCCACGGAGGAGGGCACTTCCGAATCCGCCACCCCGGAGTCAGGGCCAGGATCTGAACCCGCTACCTCAGGCAGTGAGACGCCAGGAACGAGCGAGTCCGCTACACCGGAGAGTGGGCCAGGGAGCCCTGCTGGATCTCCTACGTCCACTGAGGAAGGGTCACCAGCGGGCTCGCCCACCAGCACTGAAGAAGGTGCCTCGAGCCCGCCTGTGCTGAAGAGGCACCAGCGAGAAATTACCCGGACCACCCTCCAATCGGATCAGGAGGAAATCGACTACGACGACACCATCTCGGTGGAAATGAAGAAGGAAGATTTCGATATCTACGACGAGGACGAAAATCAGTCCCCTCGCTCATTCCAAAAGAAAACTAGACACTACTTTATCGCCGCGGTGGAAAGACTGTGGGACTATGGAATGTCATCCAGCCCTCACGTCCTTCGGAACCGGGCCCAGAGCGGATCGGTGCCTCAGTTCAAGAAAGTGGTGTTCCAGGAGTTCACCGACGGCAGCTTCACCCAGCCGCTGTACCGGGGAGAACTGAACGAACACCTGGGCCTGCTCGGTCCCTACATCCGCGCGGAAGTGGAGGATAACATCATGGTGACCTTCCGTAACCAAGCATCCAGACCTTACTCCTTCTATTCCTCCCTGATCTCATACGAGGAGGACCAGCGCCAAGGCGCCGAGCCCCGCAAGAACTTCGTCAAGCCCAACGAGACTAAGACCTACTTCTGGAAGGTCCAACACCATATGGCCCCGACCAAGGATGAGTTTGACTGCAAGGCCTGGGCCTACTTCTCCGACGTGGACCTTGAGAAGGATGTCCATTCCGGCCTGATCGGGCCGCTGCTCGTGTGTCACACCAACACCCTGAACCCAGCGCATGGACGCCAGGTCACCGTCCAGGAGTTTGCTCTGTTCTTCACCATTTTTGACGAAACTAAGTCCTGGTACTTCACCGAGAATATGGAGCGAAACTGTAGAGCGCCCTGCAATATCCAGATGGAAGATCCGACTTTCAAGGAGAACTATAGATTCCACGCCATCAACGGGTACATCATGGATACTCTGCCGGGGCTGGTCATGGCCCAGGATCAGAGGATTCGGTGGTACTTGCTGTCAATGGGATCGAACGAAAACATTCACTCCATTCACTTCTCCGGTCACGTGTTCACTGTGCGCAAGAAGGAGGAGTACAAGATGGCGCTGTACAATCTGTACCCCGGGGTGTTCGAAACTGTGGAGATGCTGCCGTCCAAGGCCGGCATCTGGAGAGTGGAGTGCCTGATCGGAGAGCACCTCCACGCGGGGATGTCCACCCTCTTCCTGGTGTACTCGAATAAGTGCCAGACCCCGCTGGGCATGGCCTCGGGCCACATCAGAGACTTCCAGATCACAGCAAGCGGACAATACGGCCAATGGGCGCCGAAGCTGGCCCGCTTGCACTACTCCGGATCGATCAACGCATGGTCCACCAAGGAACCGTTCTCGTGGATTAAGGTGGACCTCCTGGCCCCTATGATTATCCACGGAATTAAGACCCAGGGCGCCAGGCAGAAGTTCTCCTCCCTGTACATCTCGCAATTCATCATCATGTACAGCCTGGACGGGAAGAAGTGGCAGACTTACAGGGGAAACTCCACCGGCACCCTGATGGTCTTTTTCGGCAACGTGGATTCCTCCGGCATTAAGCACAACATCTTCAACCCACCGATCATAGCCAGATATATTAGGCTCCACCCCACTCACTACTCAATCCGCTCAACTCTTCGGATGGAACTCATGGGGTGCGACCTGAACTCCTGCTCCATGCCGTTGGGGATGGAATCAAAGGCTATTAGCGACGCCCAGATCACCGCGAGCTCCTACTTCACTAACATGTTCGCCACCTGGAGCCCCTCCAAGGCCAGGCTGCACTTGCAGGGACGGTCAAATGCCTGGCGGCCGCAAGTGAACAATCCGAAGGAATGGCTTCAAGTGGATTTCCAAAAGACCATGAAAGTGACCGGAGTCACCACCCAGGGAGTGAAGTCCCTTCTGACCTCGATGTATGTGAAGGAGTTCCTGATTAGCAGCAGCCAGGACGGGCACCAGTGGACCCTGTTCTTCCAAAACGGAAAGGTCAAGGTGTTCCAGGGGAACCAGGACTCGTTCACACCCGTGGTGAACTCCCTGGACCCCCCACTGCTGACGCGGTACTTGAGGATTCATCCTCAGTCCTGGGTCCATCAGATTGCATTGCGAATGGAAGTCCTGGGCTGCGAGGCCCAGGACCTGTACTGAATCAGCCTGAGCTCGCTGATCATAATCAACCTCTGGATTACAAAATTTGTGAAAGATTGACTGGTATTCTTAACTATGTTGCTCCTTTTACGCTATGTGGATACGCTGCTTTAATGCCTTTGTATCATGCTATTGCTTCCCGTATGGCTTTCATTTTCTCCTCCTTGTATAAATCCTGGTTGCTGTCTCTTTATGAGGAGTTGTGGCCCGTTGTCAGGCAACGTGGCGTGGTGTGCACTGTGTTTGCTGACGCAACCCCCACTGGTTGGGGCATTGCCACCACCTGTCAGCTCCTTTCCGGGACTTTCGCTTTCCCCCTCCCTATTGCCACGGCGGAACTCATCGCCGCCTGCCTTGCCCGCTGCTGGACAGGGGCTCGGCTGTTGGGCACTGACAATTCCGTGGTGTTGTCGGGGAAATCATCGTCCTTTCCTTGGCTGCTCGCCTGTGTTGCCACCTGGATTCTGCGCGGGACGTCCTTCTGCTACGTCCCTTCGGCCCTCAATCCAGCGGACCTTCCTTCCCGCGGCCTGCTGCCGGCTCTGCGGCCTCTTCCGCGTCTTCGCCTTCGCCCTCAGACGAGTCGGATCTCCCTTTGGGCCGCCTCCCCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTTCTGAGGCGGAAAGAACGGGCTCGAGAAGCTTCTAGATATCCTCTCTTAAGGTAGCATCGAGATTTAAATTAGGGATAACAGGGTAATGGCGCGGGCCGCAAAATTTAAAAGAAGACACCAAATCAGATGCCGCCGGTCGCCGCCGGTAGGCGGGACTTCCGGTACAAGATGGCGGACAATTACGTCATTTCCTGTGACGTCATTTCCTGTGACGTCACTTCCGGTGGGCGGGACTTCCGGAATTAGGGTTGGCTCTGGGCCAGCGCTTGGGGTTGACGTGCCACTAAGATCAAGCGGCGCGCCGCTTGTCTTAGTGTCAAGGCAACCCCAAGCAAGCTGGCCCAGAG

Таблица 2C. Пример конструкции GPV-FVIII (нуклеотиды 1-6830; SEQ ID NO: 182)

Описание	Последовательность
5'-ITR (SEQ ID NO: 183)	1 - CGGTGACGTGTTTCCGGCTGTTAGGTTGACCACGCGCATGCCGCGCGGTCAGCCCAATA GTTAAGCCGGAAACACGTCACCGGAAGTCACATGACCGGAAGTCACGTGACCGGAAACACGTGACAGGAAGCACGTGACCGGAACTACGTCACCGGATGTGCGTCACCGGAAGCATGTGACCGGAACTTGCGTCACTTCCCCCTCCCCTGATTGGCTGGTTCGAACGAACGAACCCTCCAATGAGACTCAAGGACAAGAGGATATTTTGCGCGCCAGGAAGTG -- 282
TTPp (специфический для печени промотор) (SEQ ID NO:113)	425 - ACGCGTGTCTGTCTGCACATTTCGTAGAGCGAGTGTTCCGATACTCTAATCTCCCTAG GCAAGGTTCATATTTGTGTAGGTTACTTATTCTCCTTTTGTTGACTAAGTCAATAATCAGAATCAGCAGGTTTGGAGTCAGCTTGGCAGGGATCAGCAGCCTGGGTTGGAAGGAGGGGGTATAAAAGCCCCTTCACCAGGAGAAGCCGTCACACAGATCCACAAGCTCCTG -- 653
Синтетический интрон (SEQ ID NO:115)	656 - GTAAGTGCCGTGTGTGGTTCCCGCGGGCCTGGCCTCTTTACGGGTTATGGCCCTTGCG TGCCTTGAATTACTGACACTGACATCCACTTTTTCTTTTTCTCCACAG -- 761
FVIIIco6XTEN (SEQ ID NO:117) (открытая рамка считывания для кодон-оптимизированного FVIII варианта 6, содержащего XTEN144; последовательность XTEN обозначена двойным подчеркиванием (SEQ ID NO:118))	773 - ATGCAGATTGAGCTGTCCACTTGTTTCTTCCTGTGCCTCCTGCGCTTCTGTTTCTCCG CCACTCGCCGGTACTACCTTGGAGCCGTGGAGCTTTCATGGGACTACATGCAGAGCGACCTGGGCGAACTCCCCGTGGATGCCAGATTCCCCCCCCGCGTGCCAAAGTCCTTCCCCTTTAACACCTCCGTGGTGTACAAGAAAACCCTCTTTGTCGAGTTCACTGACCACCTGTTCAACATCGCCAAGCCGCGCCCACCTTGGATGGGCCTCCTGGGACCGACCATTCAAGCTGAAGTGTACGACACCGTGGTGATCACCCTGAAGAACATGGCGTCCCACCCCGTGTCCCTGCATGCGGTCGGAGTGTCCTACTGGAAGGCCTCCGAAGGAGCTGAGTACGACGACCAGACTAGCCAGCGGGAAAAGGAGGACGATAAAGTGTTCCCGGGCGGCTCGCATACTTACGTGTGGCAAGTCCTGAAGGAAAACGGACCTATGGCATCCGATCCTCTGTGCCTGACTTACTCCTACCTTTCCCATGTGGACCTCGTGAAGGACCTGAACAGCGGGCTGATTGGTGCACTTCTCGTGTGCCGCGAAGGTTCGCTCGCTAAGGAAAAGACCCAGACCCTCCATAAGTTCATCCTTTTGTTCGCTGTGTTCGATGAAGGAAAGTCATGGCATTCCGAAACTAAGAACTCGCTGATGCAGGACCGGGATGCCGCCTCAGCCCGCGCCTGGCCTAAAATGCATACAGTCAACGGATACGTGAATCGGTCACTGCCCGGGCTCATCGGTTGTCACAGAAAGTCCGTGTACTGGCACGTCATCGGCATGGGCACTACGCCTGAAGTGCACTCCATCTTCCTGGAAGGGCACACCTTCCTCGTGCGCAACCACCGCCAGGCCTCTCTGGAAATCTCCCCGATTACCTTTCTGACCGCCCAGACTCTGCTCATGGACCTGGGGCAGTTCCTTCTCTTCTGCCACATCTCCAGCCATCAGCACGACGGAATGGAGGCCTACGTGAAGGTGGACTCATGCCCGGAAGAACCTCAGTTGCGGATGAAGAACAACGAGGAGGCCGAGGACTATGACGACGATTTGACTGACTCCGAGATGGACGTCGTGCGGTTCGATGACGACAACAGCCCCAGCTTCATCCAGATTCGCAGCGTGGCCAAGAAGCACCCCAAAACCTGGGTGCACTACATCGCGGCCGAGGAAGAAGATTGGGACTACGCCCCGTTGGTGCTGGCACCCGATGACCGGTCGTACAAGTCCCAGTATCTGAACAATGGTCCGCAGCGGATTGGCAGAAAGTACAAGAAAGTGCGGTTCATGGCGTACACTGACGAAACGTTTAAGACCCGGGAGGCCATTCAACATGAGAGCGGCATTCTGGGACCACTGCTGTACGGAGAGGTCGGCGATACCCTGCTCATCATCTTCAAAAACCAGGCCTCCCGGCCTTACAACATCTACCCTCACGGAATCACCGACGTGCGGCCACTCTACTCGCGGCGCCTGCCGAAGGGCGTCAAGCACCTGAAAGACTTCCCTATCCTGCCGGGCGAAATCTTCAAGTATAAGTGGACCGTCACCGTGGAGGACGGGCCCACCAAGAGCGATCCTAGGTGTCTGACTCGGTACTACTCCAGCTTCGTGAACATGGAACGGGACCTGGCATCGGGACTCATTGGACCGCTGCTGATCTGCTACAAAGAGTCGGTGGATCAACGCGGCAACCAGATCATGTCCGACAAGCGCAACGTGATCCTGTTCTCCGTGTTTGATGAAAACAGATCCTGGTACCTCACTGAAAACATCCAGAGGTTCCTCCCAAACCCCGCAGGAGTGCAACTGGAGGACCCTGAGTTTCAGGCCTCGAATATCATGCACTCGATTAACGGTTACGTGTTCGACTCGCTGCAACTGAGCGTGTGCCTCCATGAAGTCGCTTACTGGTACATTCTGTCCATCGGCGCCCAGACTGACTTCCTGAGCGTGTTCTTTTCCGGTTACACCTTTAAGCACAAGATGGTGTACGAAGATACCCTGACCCTGTTCCCTTTCTCCGGCGAAACGGTGTTCATGTCGATGGAGAACCCGGGTCTGTGGATTCTGGGATGCCACAACAGCGACTTTCGGAACCGCGGAATGACTGCCCTGCTGAAGGTGTCCTCATGCGACAAGAACACCGGAGACTACTACGAGGACTCCTACGAGGATATCTCAGCCTACCTCCTGTCCAAGAACAACGCGATCGAGCCGCGCAGCTTCAGCCAGAACGGCGCGCCAACATCAGAGAGCGCCACCCCTGAAAGTGGTCCCGGGAGCGAGCCAGCCACATCTGGGTCGGAAACGCCAGGCACAAGTGAGTCTGCAACTCCCGAGTCCGGACCTGGCTCCGAGCCTGCCACTAGCGGCTCCGAGACTCCGGGAACTTCCGAGAGCGCTACACCAGAAAGCGGACCCGGAACCAGTACCGAACCTAGCGAGGGCTCTGCTCCGGGCAGCCCAGCCGGCTCTCCTACATCCACGGAGGAGGGCACTTCCGAATCCGCCACCCCGGAGTCAGGGCCAGGATCTGAACCCGCTACCTCAGGCAGTGAGACGCCAGGAACGAGCGAGTCCGCTACACCGGAGAGTGGGCCAGGGAGCCCTGCTGGATCTCCTACGTCCACTGAGGAAGGGTCACCAGCGGGCTCGCCCACCAGCACTGAAGAAGGTGCCTCGAGCCCGCCTGTGCTGAAGAGGCACCAGCGAGAAATTACCCGGACCACCCTCCAATCGGATCAGGAGGAAATCGACTACGACGACACCATCTCGGTGGAAATGAAGAAGGAAGATTTCGATATCTACGACGAGGACGAAAATCAGTCCCCTCGCTCATTCCAAAAGAAAACTAGACACTACTTTATCGCCGCGGTGGAAAGACTGTGGGACTATGGAATGTCATCCAGCCCTCACGTCCTTCGGAACCGGGCCCAGAGCGGATCGGTGCCTCAGTTCAAGAAAGTGGTGTTCCAGGAGTTCACCGACGGCAGCTTCACCCAGCCGCTGTACCGGGGAGAACTGAACGAACACCTGGGCCTGCTCGGTCCCTACATCCGCGCGGAAGTGGAGGATAACATCATGGTGACCTTCCGTAACCAAGCATCCAGACCTTACTCCTTCTATTCCTCCCTGATCTCATACGAGGAGGACCAGCGCCAAGGCGCCGAGCCCCGCAAGAACTTCGTCAAGCCCAACGAGACTAAGACCTACTTCTGGAAGGTCCAACACCATATGGCCCCGACCAAGGATGAGTTTGACTGCAAGGCCTGGGCCTACTTCTCCGACGTGGACCTTGAGAAGGATGTCCATTCCGGCCTGATCGGGCCGCTGCTCGTGTGTCACACCAACACCCTGAACCCAGCGCATGGACGCCAGGTCACCGTCCAGGAGTTTGCTCTGTTCTTCACCATTTTTGACGAAACTAAGTCCTGGTACTTCACCGAGAATATGGAGCGAAACTGTAGAGCGCCCTGCAATATCCAGATGGAAGATCCGACTTTCAAGGAGAACTATAGATTCCACGCCATCAACGGGTACATCATGGATACTCTGCCGGGGCTGGTCATGGCCCAGGATCAGAGGATTCGGTGGTACTTGCTGTCAATGGGATCGAACGAAAACATTCACTCCATTCACTTCTCCGGTCACGTGTTCACTGTGCGCAAGAAGGAGGAGTACAAGATGGCGCTGTACAATCTGTACCCCGGGGTGTTCGAAACTGTGGAGATGCTGCCGTCCAAGGCCGGCATCTGGAGAGTGGAGTGCCTGATCGGAGAGCACCTCCACGCGGGGATGTCCACCCTCTTCCTGGTGTACTCGAATAAGTGCCAGACCCCGCTGGGCATGGCCTCGGGCCACATCAGAGACTTCCAGATCACAGCAAGCGGACAATACGGCCAATGGGCGCCGAAGCTGGCCCGCTTGCACTACTCCGGATCGATCAACGCATGGTCCACCAAGGAACCGTTCTCGTGGATTAAGGTGGACCTCCTGGCCCCTATGATTATCCACGGAATTAAGACCCAGGGCGCCAGGCAGAAGTTCTCCTCCCTGTACATCTCGCAATTCATCATCATGTACAGCCTGGACGGGAAGAAGTGGCAGACTTACAGGGGAAACTCCACCGGCACCCTGATGGTCTTTTTCGGCAACGTGGATTCCTCCGGCATTAAGCACAACATCTTCAACCCACCGATCATAGCCAGATATATTAGGCTCCACCCCACTCACTACTCAATCCGCTCAACTCTTCGGATGGAACTCATGGGGTGCGACCTGAACTCCTGCTCCATGCCGTTGGGGATGGAATCAAAGGCTATTAGCGACGCCCAGATCACCGCGAGCTCCTACTTCACTAACATGTTCGCCACCTGGAGCCCCTCCAAGGCCAGGCTGCACTTGCAGGGACGGTCAAATGCCTGGCGGCCGCAAGTGAACAATCCGAAGGAATGGCTTCAAGTGGATTTCCAAAAGACCATGAAAGTGACCGGAGTCACCACCCAGGGAGTGAAGTCCCTTCTGACCTCGATGTATGTGAAGGAGTTCCTGATTAGCAGCAGCCAGGACGGGCACCAGTGGACCCTGTTCTTCCAAAACGGAAAGGTCAAGGTGTTCCAGGGGAACCAGGACTCGTTCACACCCGTGGTGAACTCCCTGGACCCCCCACTGCTGACGCGGTACTTGAGGATTCATCCTCAGTCCTGGGTCCATCAGATTGCATTGCGAATGGAAGTCCTGGGCTGCGAGGCCCAGGACCTGTACTGA --5596
WPRE (мутантный посттранскрипционный регуляторный элемент вируса гепатита сурков) (SEQ ID NO:120)	5616 - TCATAATCAACCTCTGGATTACAAAATTTGTGAAAGATTGACTGGTATTCTTAACT ATGTTGCTCCTTTTACGCTATGTGGATACGCTGCTTTAATGCCTTTGTATCATGCTATTGCTTCCCGTATGGCTTTCATTTTCTCCTCCTTGTATAAATCCTGGTTGCTGTCTCTTTATGAGGAGTTGTGGCCCGTTGTCAGGCAACGTGGCGTGGTGTGCACTGTGTTTGCTGACGCAACCCCCACTGGTTGGGGCATTGCCACCACCTGTCAGCTCCTTTCCGGGACTTTCGCTTTCCCCCTCCCTATTGCCACGGCGGAACTCATCGCCGCCTGCCTTGCCCGCTGCTGGACAGGGGCTCGGCTGTTGGGCACTGACAATTCCGTGGTGTTGTCGGGGAAATCATCGTCCTTTCCTTGGCTGCTCGCCTGTGTTGCCACCTGGATTCTGCGCGGGACGTCCTTCTGCTACGTCCCTTCGGCCCTCAATCCAGCGGACCTTCCTTCCCGCGGCCTGCTGCCGGCTCTGCGGCCTCTTCCGCGTCTTCGCCTTCGCCCTCAGACGAGTCGGATCTCCCTTTGGGCCGCCTCCCCGCTG -- 6210
bGHpA (сигнальная последовательность полиаденилирования из бычьего гормона роста) (SEQ ID NO:122)	6219 - CGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTT GACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGA -- 6429
3'-ITR, инвертированный концевой повтор (SEQ ID NO: 184)	6549 -- CGGTGACGTGTTTCCGGCTGTTAGGTTGACCACGCGCATGCCGCGCGGTCAGCCCA ATAGTTAAGCCGGAAACACGTCACCGGAAGTCACATGACCGGAAGTCACGTGACCGGAAACACGTGACAGGAAGCACGTGACCGGAACTACGTCACCGGATGTGCGTCACCGGAAGCATGTGACCGGAACTTGCGTCACTTCCCCCTCCCCTGATTGGCTGGTTCGAACGAACGAACCCTCCAATGAGACTCAAGGACAAGAGGATATTTTGCGCGCCAGGAAGTG -- 6830
Полноразмерная последовательность (SEQ ID NO: 182)
CGGTGACGTGTTTCCGGCTGTTAGGTTGACCACGCGCATGCCGCGCGGTCAGCCCAATAGTTAAGCCGGAAACACGTCACCGGAAGTCACATGACCGGAAGTCACGTGACCGGAAACACGTGACAGGAAGCACGTGACCGGAACTACGTCACCGGATGTGCGTCACCGGAAGCATGTGACCGGAACTTGCGTCACTTCCCCCTCCCCTGATTGGCTGGTTCGAACGAACGAACCCTCCAATGAGACTCAAGGACAAGAGGATATTTTGCGCGCCAGGAAGTGGCGGCAATTCAGTCGATAACTATAACGGTCCTAAGGTAGCGATTTAAATACGCGCTCTCTTAAGGTAGCCCCGGGACGCGTCAATTGAGATCTGGATCCGGTACCGAATTCGCGGCCGCCTCGACGACTAGCGTTTAATTAAACGCGTGTCTGTCTGCACATTTCGTAGAGCGAGTGTTCCGATACTCTAATCTCCCTAGGCAAGGTTCATATTTGTGTAGGTTACTTATTCTCCTTTTGTTGACTAAGTCAATAATCAGAATCAGCAGGTTTGGAGTCAGCTTGGCAGGGATCAGCAGCCTGGGTTGGAAGGAGGGGGTATAAAAGCCCCTTCACCAGGAGAAGCCGTCACACAGATCCACAAGCTCCTGAGGTAAGTGCCGTGTGTGGTTCCCGCGGGCCTGGCCTCTTTACGGGTTATGGCCCTTGCGTGCCTTGAATTACTGACACTGACATCCACTTTTTCTTTTTCTCCACAGCTAGCGCCACCATGCAGATTGAGCTGTCCACTTGTTTCTTCCTGTGCCTCCTGCGCTTCTGTTTCTCCGCCACTCGCCGGTACTACCTTGGAGCCGTGGAGCTTTCATGGGACTACATGCAGAGCGACCTGGGCGAACTCCCCGTGGATGCCAGATTCCCCCCCCGCGTGCCAAAGTCCTTCCCCTTTAACACCTCCGTGGTGTACAAGAAAACCCTCTTTGTCGAGTTCACTGACCACCTGTTCAACATCGCCAAGCCGCGCCCACCTTGGATGGGCCTCCTGGGACCGACCATTCAAGCTGAAGTGTACGACACCGTGGTGATCACCCTGAAGAACATGGCGTCCCACCCCGTGTCCCTGCATGCGGTCGGAGTGTCCTACTGGAAGGCCTCCGAAGGAGCTGAGTACGACGACCAGACTAGCCAGCGGGAAAAGGAGGACGATAAAGTGTTCCCGGGCGGCTCGCATACTTACGTGTGGCAAGTCCTGAAGGAAAACGGACCTATGGCATCCGATCCTCTGTGCCTGACTTACTCCTACCTTTCCCATGTGGACCTCGTGAAGGACCTGAACAGCGGGCTGATTGGTGCACTTCTCGTGTGCCGCGAAGGTTCGCTCGCTAAGGAAAAGACCCAGACCCTCCATAAGTTCATCCTTTTGTTCGCTGTGTTCGATGAAGGAAAGTCATGGCATTCCGAAACTAAGAACTCGCTGATGCAGGACCGGGATGCCGCCTCAGCCCGCGCCTGGCCTAAAATGCATACAGTCAACGGATACGTGAATCGGTCACTGCCCGGGCTCATCGGTTGTCACAGAAAGTCCGTGTACTGGCACGTCATCGGCATGGGCACTACGCCTGAAGTGCACTCCATCTTCCTGGAAGGGCACACCTTCCTCGTGCGCAACCACCGCCAGGCCTCTCTGGAAATCTCCCCGATTACCTTTCTGACCGCCCAGACTCTGCTCATGGACCTGGGGCAGTTCCTTCTCTTCTGCCACATCTCCAGCCATCAGCACGACGGAATGGAGGCCTACGTGAAGGTGGACTCATGCCCGGAAGAACCTCAGTTGCGGATGAAGAACAACGAGGAGGCCGAGGACTATGACGACGATTTGACTGACTCCGAGATGGACGTCGTGCGGTTCGATGACGACAACAGCCCCAGCTTCATCCAGATTCGCAGCGTGGCCAAGAAGCACCCCAAAACCTGGGTGCACTACATCGCGGCCGAGGAAGAAGATTGGGACTACGCCCCGTTGGTGCTGGCACCCGATGACCGGTCGTACAAGTCCCAGTATCTGAACAATGGTCCGCAGCGGATTGGCAGAAAGTACAAGAAAGTGCGGTTCATGGCGTACACTGACGAAACGTTTAAGACCCGGGAGGCCATTCAACATGAGAGCGGCATTCTGGGACCACTGCTGTACGGAGAGGTCGGCGATACCCTGCTCATCATCTTCAAAAACCAGGCCTCCCGGCCTTACAACATCTACCCTCACGGAATCACCGACGTGCGGCCACTCTACTCGCGGCGCCTGCCGAAGGGCGTCAAGCACCTGAAAGACTTCCCTATCCTGCCGGGCGAAATCTTCAAGTATAAGTGGACCGTCACCGTGGAGGACGGGCCCACCAAGAGCGATCCTAGGTGTCTGACTCGGTACTACTCCAGCTTCGTGAACATGGAACGGGACCTGGCATCGGGACTCATTGGACCGCTGCTGATCTGCTACAAAGAGTCGGTGGATCAACGCGGCAACCAGATCATGTCCGACAAGCGCAACGTGATCCTGTTCTCCGTGTTTGATGAAAACAGATCCTGGTACCTCACTGAAAACATCCAGAGGTTCCTCCCAAACCCCGCAGGAGTGCAACTGGAGGACCCTGAGTTTCAGGCCTCGAATATCATGCACTCGATTAACGGTTACGTGTTCGACTCGCTGCAACTGAGCGTGTGCCTCCATGAAGTCGCTTACTGGTACATTCTGTCCATCGGCGCCCAGACTGACTTCCTGAGCGTGTTCTTTTCCGGTTACACCTTTAAGCACAAGATGGTGTACGAAGATACCCTGACCCTGTTCCCTTTCTCCGGCGAAACGGTGTTCATGTCGATGGAGAACCCGGGTCTGTGGATTCTGGGATGCCACAACAGCGACTTTCGGAACCGCGGAATGACTGCCCTGCTGAAGGTGTCCTCATGCGACAAGAACACCGGAGACTACTACGAGGACTCCTACGAGGATATCTCAGCCTACCTCCTGTCCAAGAACAACGCGATCGAGCCGCGCAGCTTCAGCCAGAACGGCGCGCCAACATCAGAGAGCGCCACCCCTGAAAGTGGTCCCGGGAGCGAGCCAGCCACATCTGGGTCGGAAACGCCAGGCACAAGTGAGTCTGCAACTCCCGAGTCCGGACCTGGCTCCGAGCCTGCCACTAGCGGCTCCGAGACTCCGGGAACTTCCGAGAGCGCTACACCAGAAAGCGGACCCGGAACCAGTACCGAACCTAGCGAGGGCTCTGCTCCGGGCAGCCCAGCCGGCTCTCCTACATCCACGGAGGAGGGCACTTCCGAATCCGCCACCCCGGAGTCAGGGCCAGGATCTGAACCCGCTACCTCAGGCAGTGAGACGCCAGGAACGAGCGAGTCCGCTACACCGGAGAGTGGGCCAGGGAGCCCTGCTGGATCTCCTACGTCCACTGAGGAAGGGTCACCAGCGGGCTCGCCCACCAGCACTGAAGAAGGTGCCTCGAGCCCGCCTGTGCTGAAGAGGCACCAGCGAGAAATTACCCGGACCACCCTCCAATCGGATCAGGAGGAAATCGACTACGACGACACCATCTCGGTGGAAATGAAGAAGGAAGATTTCGATATCTACGACGAGGACGAAAATCAGTCCCCTCGCTCATTCCAAAAGAAAACTAGACACTACTTTATCGCCGCGGTGGAAAGACTGTGGGACTATGGAATGTCATCCAGCCCTCACGTCCTTCGGAACCGGGCCCAGAGCGGATCGGTGCCTCAGTTCAAGAAAGTGGTGTTCCAGGAGTTCACCGACGGCAGCTTCACCCAGCCGCTGTACCGGGGAGAACTGAACGAACACCTGGGCCTGCTCGGTCCCTACATCCGCGCGGAAGTGGAGGATAACATCATGGTGACCTTCCGTAACCAAGCATCCAGACCTTACTCCTTCTATTCCTCCCTGATCTCATACGAGGAGGACCAGCGCCAAGGCGCCGAGCCCCGCAAGAACTTCGTCAAGCCCAACGAGACTAAGACCTACTTCTGGAAGGTCCAACACCATATGGCCCCGACCAAGGATGAGTTTGACTGCAAGGCCTGGGCCTACTTCTCCGACGTGGACCTTGAGAAGGATGTCCATTCCGGCCTGATCGGGCCGCTGCTCGTGTGTCACACCAACACCCTGAACCCAGCGCATGGACGCCAGGTCACCGTCCAGGAGTTTGCTCTGTTCTTCACCATTTTTGACGAAACTAAGTCCTGGTACTTCACCGAGAATATGGAGCGAAACTGTAGAGCGCCCTGCAATATCCAGATGGAAGATCCGACTTTCAAGGAGAACTATAGATTCCACGCCATCAACGGGTACATCATGGATACTCTGCCGGGGCTGGTCATGGCCCAGGATCAGAGGATTCGGTGGTACTTGCTGTCAATGGGATCGAACGAAAACATTCACTCCATTCACTTCTCCGGTCACGTGTTCACTGTGCGCAAGAAGGAGGAGTACAAGATGGCGCTGTACAATCTGTACCCCGGGGTGTTCGAAACTGTGGAGATGCTGCCGTCCAAGGCCGGCATCTGGAGAGTGGAGTGCCTGATCGGAGAGCACCTCCACGCGGGGATGTCCACCCTCTTCCTGGTGTACTCGAATAAGTGCCAGACCCCGCTGGGCATGGCCTCGGGCCACATCAGAGACTTCCAGATCACAGCAAGCGGACAATACGGCCAATGGGCGCCGAAGCTGGCCCGCTTGCACTACTCCGGATCGATCAACGCATGGTCCACCAAGGAACCGTTCTCGTGGATTAAGGTGGACCTCCTGGCCCCTATGATTATCCACGGAATTAAGACCCAGGGCGCCAGGCAGAAGTTCTCCTCCCTGTACATCTCGCAATTCATCATCATGTACAGCCTGGACGGGAAGAAGTGGCAGACTTACAGGGGAAACTCCACCGGCACCCTGATGGTCTTTTTCGGCAACGTGGATTCCTCCGGCATTAAGCACAACATCTTCAACCCACCGATCATAGCCAGATATATTAGGCTCCACCCCACTCACTACTCAATCCGCTCAACTCTTCGGATGGAACTCATGGGGTGCGACCTGAACTCCTGCTCCATGCCGTTGGGGATGGAATCAAAGGCTATTAGCGACGCCCAGATCACCGCGAGCTCCTACTTCACTAACATGTTCGCCACCTGGAGCCCCTCCAAGGCCAGGCTGCACTTGCAGGGACGGTCAAATGCCTGGCGGCCGCAAGTGAACAATCCGAAGGAATGGCTTCAAGTGGATTTCCAAAAGACCATGAAAGTGACCGGAGTCACCACCCAGGGAGTGAAGTCCCTTCTGACCTCGATGTATGTGAAGGAGTTCCTGATTAGCAGCAGCCAGGACGGGCACCAGTGGACCCTGTTCTTCCAAAACGGAAAGGTCAAGGTGTTCCAGGGGAACCAGGACTCGTTCACACCCGTGGTGAACTCCCTGGACCCCCCACTGCTGACGCGGTACTTGAGGATTCATCCTCAGTCCTGGGTCCATCAGATTGCATTGCGAATGGAAGTCCTGGGCTGCGAGGCCCAGGACCTGTACTGAATCAGCCTGAGCTCGCTGATCATAATCAACCTCTGGATTACAAAATTTGTGAAAGATTGACTGGTATTCTTAACTATGTTGCTCCTTTTACGCTATGTGGATACGCTGCTTTAATGCCTTTGTATCATGCTATTGCTTCCCGTATGGCTTTCATTTTCTCCTCCTTGTATAAATCCTGGTTGCTGTCTCTTTATGAGGAGTTGTGGCCCGTTGTCAGGCAACGTGGCGTGGTGTGCACTGTGTTTGCTGACGCAACCCCCACTGGTTGGGGCATTGCCACCACCTGTCAGCTCCTTTCCGGGACTTTCGCTTTCCCCCTCCCTATTGCCACGGCGGAACTCATCGCCGCCTGCCTTGCCCGCTGCTGGACAGGGGCTCGGCTGTTGGGCACTGACAATTCCGTGGTGTTGTCGGGGAAATCATCGTCCTTTCCTTGGCTGCTCGCCTGTGTTGCCACCTGGATTCTGCGCGGGACGTCCTTCTGCTACGTCCCTTCGGCCCTCAATCCAGCGGACCTTCCTTCCCGCGGCCTGCTGCCGGCTCTGCGGCCTCTTCCGCGTCTTCGCCTTCGCCCTCAGACGAGTCGGATCTCCCTTTGGGCCGCCTCCCCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTTCTGAGGCGGAAAGAACGGGCTCGAGAAGCTTCTAGATATCCTCTCTTAAGGTAGCATCGAGATTTAAATTAGGGATAACAGGGTAATGGCGCGGGCCGCCACTTCCTGGCGCGCAAAATATCCTCTTGTCCTTGAGTCTCATTGGAGGGTTCGTTCGTTCGAACCAGCCAATCAGGGGAGGGGGAAGTGACGCAAGTTCCGGTCACATGCTTCCGGTGACGCACATCCGGTGACGTAGTTCCGGTCACGTGCTTCCTGTCACGTGTTTCCGGTCACGTGACTTCCGGTCATGTGACTTCCGGTGACGTGTTTCCGGCTTAACTATTGGGCTGACCGCGCGGCATGCGCGTGGTCAACCTAACAGCCGGAAACACGTCACCG

A. Индекс адаптации кодонов

[198] В одном варианте осуществления генная кассета содержит кодон-оптимизированную нуклеотидную последовательность, кодирующую полипептид FVIII, где индекс адаптации кодонов человека для кодон-оптимизированной нуклеотидной последовательности повышен по сравнению с SEQ ID NO: 16. Например, кодон-оптимизированная нуклеотидная последовательность может характеризоваться индексом адаптации кодонов человека, составляющим по меньшей мере приблизительно 0,75 (75%), по меньшей мере приблизительно 0,76 (76%), по меньшей мере приблизительно 0,77 (77%), по меньшей мере приблизительно 0,78 (78%), по меньшей мере приблизительно 0,79 (79%), по меньшей мере приблизительно 0,80 (80%), по меньшей мере приблизительно 0,81 (81%), по меньшей мере приблизительно 0,82 (82%), по меньшей мере приблизительно 0,83 (83%), по меньшей мере приблизительно 0,84 (84%), по меньшей мере приблизительно 0,85 (85%), по меньшей мере приблизительно 0,86 (86%), по меньшей мере приблизительно 0,87 (87%), по меньшей мере приблизительно 0,88 (88%), по меньшей мере приблизительно 0,89 (89%), по меньшей мере приблизительно 0,90 (90%), по меньшей мере приблизительно 0,91 (91%), по меньшей мере приблизительно 0,92 (92%), по меньшей мере приблизительно 0,93 (93%), по меньшей мере приблизительно 0,94 (94%), по меньшей мере приблизительно 0,95 (95%), по меньшей мере приблизительно 0,96 (96%), по меньшей мере приблизительно 0,97 (97%), по меньшей мере приблизительно 0,98 (98%) или по меньшей мере приблизительно 0,99 (99%). В некоторых вариантах осуществления кодон-оптимизированная нуклеотидная последовательность характеризуется индексом адаптации кодонов человека, который составляет по меньшей мере приблизительно 0,88 (88%). В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность характеризуется индексом адаптации кодонов человека, который составляет по меньшей мере приблизительно 0,91 (91%). В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность характеризуется индексом адаптации кодонов человека, который составляет по меньшей мере приблизительно 0,91 (97%).

[199] В одном конкретном варианте осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит нуклеотидную последовательность, которая содержит первую последовательность нуклеиновой кислоты, кодирующую N-концевую часть полипептида FVIII, и вторую последовательность нуклеиновой кислоты, кодирующую C-концевую часть полипептида FVIII; где первая последовательность нуклеиновой кислоты характеризуется по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 86%, по меньшей мере приблизительно 87%, по меньшей мере приблизительно 88%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с (i) нуклеотидами 58-1791 из SEQ ID NO: 3; (ii) нуклеотидами 1-1791 из SEQ ID NO: 3; (iii) нуклеотидами 58-1791 из SEQ ID NO: 4 или (iv) нуклеотидами 1-1791 из SEQ ID NO: 4; где N-концевая часть и C-концевая часть вместе обладают активностью полипептида FVIII; и где индекс адаптации кодонов человека для нуклеотидной последовательности повышен по сравнению с SEQ ID NO: 16. В некоторых вариантах осуществления нуклеотидная последовательность характеризуется индексом адаптации кодонов человека, составляющим по меньшей мере приблизительно 0,75 (75%), по меньшей мере приблизительно 0,76 (76%), по меньшей мере приблизительно 0,77 (77%), по меньшей мере приблизительно 0,78 (78%), по меньшей мере приблизительно 0,79 (79%), по меньшей мере приблизительно 0,80 (80%), по меньшей мере приблизительно 0,81 (81%), по меньшей мере приблизительно 0,82 (82%), по меньшей мере приблизительно 0,83 (83%), по меньшей мере приблизительно 0,84 (84%), по меньшей мере приблизительно 0,85 (85%), по меньшей мере приблизительно 0,86 (86%), по меньшей мере приблизительно 0,87 (87%), по меньшей мере приблизительно 0,88 (88%), по меньшей мере приблизительно 0,89 (89%), по меньшей мере приблизительно 0,90 (90%) или по меньшей мере приблизительно 0,91 (91%). В одном конкретном варианте осуществления нуклеотидная последовательность характеризуется индексом адаптации кодонов человека, который составляет по меньшей мере приблизительно 0,88 (88%). В другом варианте осуществления нуклеотидная последовательность характеризуется индексом адаптации кодонов человека, который составляет по меньшей мере приблизительно 0,91 (91%).

[200] В другом варианте осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит нуклеотидную последовательность, которая содержит первую последовательность нуклеиновой кислоты, кодирующую N-концевую часть полипептида FVIII, и вторую последовательность нуклеиновой кислоты, кодирующую C-концевую часть полипептида FVIII; где вторая последовательность нуклеиновой кислоты характеризуется по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 86%, по меньшей мере приблизительно 87%, по меньшей мере приблизительно 88%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с (i) нуклеотидами 1792-2277 и 2320-4374 из SEQ ID NO: 5 или (ii) 1792-2277 и 2320-4374 из SEQ ID NO: 6; где N-концевая часть и C-концевая часть вместе обладают активностью полипептида FVIII; и где индекс адаптации кодонов человека для нуклеотидной последовательности повышен по сравнению с SEQ ID NO: 16. В некоторых вариантах осуществления нуклеотидная последовательность характеризуется индексом адаптации кодонов человека, составляющим по меньшей мере приблизительно 0,75 (75%), по меньшей мере приблизительно 0,76 (76%), по меньшей мере приблизительно 0,77 (77%), по меньшей мере приблизительно 0,78 (78%), по меньшей мере приблизительно 0,79 (79%), по меньшей мере приблизительно 0,80 (80%), по меньшей мере приблизительно 0,81 (81%), по меньшей мере приблизительно 0,82 (82%), по меньшей мере приблизительно 0,83 (83%), по меньшей мере приблизительно 0,84 (84%), по меньшей мере приблизительно 0,85 (85%), по меньшей мере приблизительно 0,86 (86%), по меньшей мере приблизительно 0,87 (87%) или по меньшей мере приблизительно 0,88 (88%). В одном конкретном варианте осуществления нуклеотидная последовательность характеризуется индексом адаптации кодонов человека, который составляет по меньшей мере приблизительно 0,83 (83%). В другом варианте осуществления нуклеотидная последовательность характеризуется индексом адаптации кодонов человека, который составляет по меньшей мере приблизительно 0,88 (88%).

[201] В некоторых вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит нуклеотидную последовательность, кодирующую полипептид с активностью FVIII, где нуклеотидная последовательность содержит последовательность нуклеиновой кислоты, характеризующуюся по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с нуклеотидами 58-2277 и 2320-4374 из аминокислотной последовательности, выбранной из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 и 71 (т. е. нуклеотидами 58-4374 из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 или 71 без нуклеотидов, кодирующих домен B или фрагмент домена B); и где индекс адаптации кодонов человека для нуклеотидной последовательности повышен по сравнению с SEQ ID NO: 16. В некоторых вариантах осуществления нуклеотидная последовательность характеризуется индексом адаптации кодонов человека, составляющим по меньшей мере приблизительно 0,75 (75%), по меньшей мере приблизительно 0,76 (76%), по меньшей мере приблизительно 0,77 (77%), по меньшей мере приблизительно 0,78 (78%), по меньшей мере приблизительно 0,79 (79%), по меньшей мере приблизительно 0,80 (80%), по меньшей мере приблизительно 0,81 (81%), по меньшей мере приблизительно 0,82 (82%), по меньшей мере приблизительно 0,83 (83%), по меньшей мере приблизительно 0,84 (84%), по меньшей мере приблизительно 0,85 (85%), по меньшей мере приблизительно 0,86 (86%), по меньшей мере приблизительно 0,87 (87%) или по меньшей мере приблизительно 0,88 (88%). В одном конкретном варианте осуществления нуклеотидная последовательность характеризуется индексом адаптации кодонов человека, который составляет по меньшей мере приблизительно 0,75 (75%). В другом варианте осуществления нуклеотидная последовательность характеризуется индексом адаптации кодонов человека, который составляет по меньшей мере приблизительно 0,83 (83%). В другом варианте осуществления нуклеотидная последовательность характеризуется индексом адаптации кодонов человека, который составляет по меньшей мере приблизительно 0,88 (88%). В другом варианте осуществления нуклеотидная последовательность характеризуется индексом адаптации кодонов человека, который составляет по меньшей мере приблизительно 0,91 (91%). В другом варианте осуществления нуклеотидная последовательность характеризуется индексом адаптации кодонов человека, который составляет по меньшей мере приблизительно 0,97 (97%).

[202] В некоторых вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII по настоящему изобретению, характеризуется повышенной частотой используемости оптимальных кодонов (FOP) по сравнению с SEQ ID NO: 16. В определенных вариантах осуществления FOP для кодон-оптимизированной нуклеотидной последовательности, кодирующей полипептид FVIII, составляет по меньшей мере приблизительно 40, по меньшей мере приблизительно 45, по меньшей мере приблизительно 50, по меньшей мере приблизительно 55, по меньшей мере приблизительно 60, по меньшей мере приблизительно 64, по меньшей мере приблизительно 65, по меньшей мере приблизительно 70, по меньшей мере приблизительно 75, по меньшей мере приблизительно 79, по меньшей мере приблизительно 80, по меньшей мере приблизительно 85 или по меньшей мере приблизительно 90.

[203] В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII по настоящему изобретению, характеризуется повышенной относительной частотой используемости синонимичных кодонов (RCSU) по сравнению с SEQ ID NO: 16. В некоторых вариантах осуществления RCSU для выделенной молекулы нуклеиновой кислоты составляет более 1,5. В других вариантах осуществления RCSU для выделенной молекулы нуклеиновой кислоты составляет более 2,0. В определенных вариантах осуществления RCSU для выделенной молекулы нуклеиновой кислоты составляет по меньшей мере приблизительно 1,5, по меньшей мере приблизительно 1,6, по меньшей мере приблизительно 1,7, по меньшей мере приблизительно 1,8, по меньшей мере приблизительно 1,9, по меньшей мере приблизительно 2,0, по меньшей мере приблизительно 2,1, по меньшей мере приблизительно 2,2, по меньшей мере приблизительно 2,3, по меньшей мере приблизительно 2,4, по меньшей мере приблизительно 2,5, по меньшей мере приблизительно 2,6 или по меньшей мере приблизительно 2,7.

[204] В еще одних других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII по настоящему изобретению, характеризуется повышенным эффективным количеством кодонов по сравнению с SEQ ID NO: 16. В некоторых вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, характеризуется эффективным количеством кодонов, составляющим менее приблизительно 50, менее приблизительно 45, менее приблизительно 40, менее приблизительно 35, менее приблизительно 30 или менее приблизительно 25. В одном конкретном варианте осуществления выделенная молекула нуклеиновой кислоты характеризуется эффективным количеством кодонов, составляющим приблизительно 40, приблизительно 35, приблизительно 30, приблизительно 25 или приблизительно 20.

B. Оптимизация содержания G/C

[205] В некоторых вариантах осуществления генная кассета содержит кодон-оптимизированную нуклеотидную последовательность, кодирующий полипептид FVIII, где кодон-оптимизированная нуклеотидная последовательность содержит более высокую процентную долю G/C нуклеотидов по сравнению с процентной долей G/C нуклеотидов в SEQ ID NO: 16. В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, характеризуется содержанием G/C, составляющим по меньшей мере приблизительно 45%, по меньшей мере приблизительно 46%, по меньшей мере приблизительно 47%, по меньшей мере приблизительно 48%, по меньшей мере приблизительно 49%, по меньшей мере приблизительно 50%, по меньшей мере приблизительно 51%, по меньшей мере приблизительно 52%, по меньшей мере приблизительно 53%, по меньшей мере приблизительно 54%, по меньшей мере приблизительно 55%, по меньшей мере приблизительно 56%, по меньшей мере приблизительно 57%, по меньшей мере приблизительно 58%, по меньшей мере приблизительно 59% или по меньшей мере приблизительно 60%.

[206] В одном конкретном варианте осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит первую последовательность нуклеиновой кислоты, кодирующую N-концевую часть полипептида FVIII, и вторую последовательность нуклеиновой кислоты, кодирующую C-концевую часть полипептида FVIII; где первая последовательность нуклеиновой кислоты характеризуется по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 86%, по меньшей мере приблизительно 87%, по меньшей мере приблизительно 88%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с (i) нуклеотидами 58-1791 из SEQ ID NO: 3; (ii) нуклеотидами 1-1791 из SEQ ID NO: 3; (iii) нуклеотидами 58-1791 из SEQ ID NO: 4 или (iv) нуклеотидами 1-1791 из SEQ ID NO: 4; где N-концевая часть и C-концевая часть вместе обладают активностью полипептида FVIII; и где нуклеотидная последовательность содержит более высокую процентную долю G/C нуклеотидов по сравнению с процентной долей G/C нуклеотидов в SEQ ID NO: 16. В некоторых вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, характеризуется содержанием G/C, составляющим по меньшей мере приблизительно 45%, по меньшей мере приблизительно 46%, по меньшей мере приблизительно 47%, по меньшей мере приблизительно 48%, по меньшей мере приблизительно 49%, по меньшей мере приблизительно 50%, по меньшей мере приблизительно 51%, по меньшей мере приблизительно 52%, по меньшей мере приблизительно 53%, по меньшей мере приблизительно 54%, по меньшей мере приблизительно 55%, по меньшей мере приблизительно 56%, по меньшей мере приблизительно 57% или по меньшей мере приблизительно 58%. В одном конкретном варианте осуществления нуклеотидная последовательность, которая кодирует полипептид с активностью FVIII, характеризуется содержанием G/C, составляющим по меньшей мере приблизительно 58%.

[207] В другом варианте осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит первую последовательность нуклеиновой кислоты, кодирующую N-концевую часть полипептида FVIII, и вторую последовательность нуклеиновой кислоты, кодирующую C-концевую часть полипептида FVIII; где вторая последовательность нуклеиновой кислоты характеризуется по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 86%, по меньшей мере приблизительно 87%, по меньшей мере приблизительно 88%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с (i) нуклеотидами 1792-4374 из SEQ ID NO: 5; (ii) нуклеотидами 1792-4374 из SEQ ID NO: 6, (iii) нуклеотидами 1792-2277 и 2320-4374 из SEQ ID NO: 5 (т. е. нуклеотидами 1792-4374 из SEQ ID NO: 5 без нуклеотидов, кодирующих домен B или фрагмент домена B) или (iv) 1792-2277 и 2320-4374 из SEQ ID NO: 6 (т. е. нуклеотидами 1792-4374 из SEQ ID NO: 6 без нуклеотидов, кодирующих домен В или фрагмент домена В); где N-концевая часть и C-концевая часть вместе обладают активностью полипептида FVIII; и где кодон-оптимизированная нуклеотидная последовательность содержит более высокую процентную долю G/C нуклеотидов по сравнению с процентной долей G/C нуклеотидов в SEQ ID NO: 16. В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, характеризуется содержанием G/C, составляющим по меньшей мере приблизительно 45%, по меньшей мере приблизительно 46%, по меньшей мере приблизительно 47%, по меньшей мере приблизительно 48%, по меньшей мере приблизительно 49%, по меньшей мере приблизительно 50%, по меньшей мере приблизительно 51%, по меньшей мере приблизительно 52%, по меньшей мере приблизительно 53%, по меньшей мере приблизительно 54%, по меньшей мере приблизительно 55%, по меньшей мере приблизительно 56% или по меньшей мере приблизительно 57%. В одном конкретном варианте осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, характеризуется содержанием G/C, составляющим по меньшей мере приблизительно 52%. В другом варианте осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, характеризуется содержанием G/C, составляющим по меньшей мере приблизительно 55%. В другом варианте осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, характеризуется содержанием G/C, составляющим по меньшей мере приблизительно 57%.

[208] В других вариантах осуществления генная кассета содержит кодон-оптимизированную нуклеотидную последовательность, кодирующую полипептид FVIII, где кодон-оптимизированная нуклеотидная последовательность содержит последовательность нуклеиновой кислоты, характеризующуюся по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с (i) нуклеотидами 58-4374 или (ii) нуклеотидами 58-2277 и 2320-4374 из аминокислотной последовательности, выбранной из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 и 71 (т. е. нуклеотидами 58-4374 из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 или 71 без нуклеотидов, кодирующих домен B или фрагмент домена B); и где нуклеотидная последовательность содержит более высокую процентную долю G/C нуклеотидов по сравнению с процентной долей G/C нуклеотидов в SEQ ID NO: 16. В другом варианте осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, характеризуется содержанием G/C, составляющим по меньшей мере приблизительно 45%. В одном конкретном варианте осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, характеризуется содержанием G/C, составляющим по меньшей мере приблизительно 52%. В другом варианте осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, характеризуется содержанием G/C, составляющим по меньшей мере приблизительно 55%. В другом варианте осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, характеризуется содержанием G/C, составляющим по меньшей мере приблизительно 57%. В другом варианте осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, характеризуется содержанием G/C, составляющим по меньшей мере приблизительно 58%. В еще одном варианте осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, характеризуется содержанием G/C, составляющим по меньшей мере приблизительно 60%.

[209] "Содержание G/C" (или содержание гуанина-цитозина) или "процентная доля G/C нуклеотидов" относится к процентной доле азотистых оснований в молекуле ДНК, которые представляют собой либо гуанин, либо цитозин. Содержание G/C можно рассчитать с использованием следующей формулы:

(III).

[210] Гены человека в значительной степени являются неоднородными по содержанию в них G/C, при этом некоторые гены характеризуются содержанием G/C, составляющим всего лишь 20%, а другие гены характеризуются содержанием G/C, составляющим вплоть до 95%. В целом гены, богатые G/C, имеют более высокий уровень экспрессии. В действительности было продемонстрировано, что повышение содержания G/C в гене может привести к повышенной экспрессии данного гена, главным образом из-за повышения транскрипции и более высоких уровней mRNA в состоянии равновесия. См. Kudla et al., PLoS Biol., 4(6): e180 (2006).

C. Последовательности, подобные области прикрепления к матриксу

[211] В некоторых вариантах осуществления генная кассета содержит кодон-оптимизированную нуклеотидную последовательность, кодирующую полипептид FVIII, где кодон-оптимизированная нуклеотидная последовательность содержит меньше последовательностей MARS/ARS по сравнению с SEQ ID NO: 16. В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит не более 6, не более 5, не более 4, не более 3 или не более 2 последовательностей MARS/ARS. В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит не более 1 последовательности MARS/ARS. В еще одних вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, не содержит последовательности MARS/ARS.

[212] В одном конкретном варианте осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит первую последовательность нуклеиновой кислоты, кодирующую N-концевую часть полипептида FVIII, и вторую последовательность нуклеиновой кислоты, кодирующую C-концевую часть полипептида FVIII; где первая последовательность нуклеиновой кислоты характеризуется по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 86%, по меньшей мере приблизительно 87%, по меньшей мере приблизительно 88%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с (i) нуклеотидами 58-1791 из SEQ ID NO: 3; (ii) нуклеотидами 1-1791 из SEQ ID NO: 3; (iii) нуклеотидами 58-1791 из SEQ ID NO: 4 или (iv) нуклеотидами 1-1791 из SEQ ID NO: 4; где N-концевая часть и C-концевая часть вместе обладают активностью полипептида FVIII; и где кодон-оптимизированная нуклеотидная последовательность содержит меньше последовательностей MARS/ARS по сравнению с SEQ ID NO: 16. В других вариантах осуществления нуклеотидная последовательность, кодирующая полипептид с активностью FVIII, содержит не более 6, не более 5, не более 4, не более 3 или не более 2 последовательностей MARS/ARS. В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит не более 1 последовательности MARS/ARS. В еще одних вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, не содержит последовательности MARS/ARS.

[213] В другом варианте осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит первую последовательность нуклеиновой кислоты, кодирующую N-концевую часть полипептида FVIII, и вторую последовательность нуклеиновой кислоты, кодирующую C-концевую часть полипептида FVIII; где вторая последовательность нуклеиновой кислоты характеризуется по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 86%, по меньшей мере приблизительно 87%, по меньшей мере приблизительно 88%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с (i) нуклеотидами 1792-4374 из SEQ ID NO: 5; (ii) нуклеотидами 1792-4374 из SEQ ID NO: 6, (iii) нуклеотидами 1792-2277 и 2320-4374 из SEQ ID NO: 5 (т. е. нуклеотидами 1792-4374 из SEQ ID NO: 5 без нуклеотидов, кодирующих домен B или фрагмент домена B) или (iv) нуклеотидами 1792-2277 и 2320-4374 из SEQ ID NO: 6 (т. е. нуклеотидами 1792-4374 из SEQ ID NO: 6 без нуклеотидов, кодирующих домен В или фрагмент домена В); где N-концевая часть и C-концевая часть вместе обладают активностью полипептида FVIII; и где кодон-оптимизированная нуклеотидная последовательность содержит меньше последовательностей MARS/ARS по сравнению с SEQ ID NO: 16. В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит не более 6, не более 5, не более 4, не более 3 или не более 2 последовательностей MARS/ARS. В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит не более 1 последовательности MARS/ARS. В еще одних вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, не содержит последовательности MARS/ARS.

[214] В других вариантах осуществления генная кассета содержит кодон-оптимизированную нуклеотидную последовательность, кодирующую полипептид FVIII, где кодон-оптимизированная нуклеотидная последовательность содержит последовательность нуклеиновой кислоты, характеризующуюся по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с (i) нуклеотидами 58-4374 из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 или 71 или (ii) нуклеотидами 58-2277 и 2320-4374 из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 или 71 (т. е. нуклеотидами 58-4374 из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 или 71 без нуклеотидов, кодирующих домен B или фрагмент домена B); и где кодон-оптимизированная нуклеотидная последовательность содержит меньше последовательностей MARS/ARS по сравнению с SEQ ID NO: 16. В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит не более 6, не более 5, не более 4, не более 3 или не более 2 последовательностей MARS/ARS. В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит не более 1 последовательности MARS/ARS. В еще одних вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, не содержит последовательности MARS/ARS.

[215] Были идентифицированы богатые AT элементы в нуклеотидной последовательности FVIII человека, которая обладает сходством последовательности с автономно реплицирующимися последовательностями (ARS) и областями прикрепления к матриксу (MAR) Saccharomyces cerevisiae. (Fallux et al., Mol. Cell. Biol. 16:4264-4272 (1996). Один из данных элементов продемонстрировал связывание с ядерными факторами in vitro и подавление экспрессии репортерного гена хлорамфеникол-ацетилтрансферазы (CAT). Id. Было сделано предположение, что такие последовательности могут способствовать подавлению транскрипции гена FVIII человека. Таким образом, в одном варианте осуществления все последовательности MAR/ARS удалены в кодон-оптимизированной нуклеотидной последовательности, кодирующей полипептид FVIII по настоящему изобретению. Существует четыре последовательности MAR/ARS ATATTT (SEQ ID NO: 21) и три последовательности MAR/ARS AAATAT (SEQ ID NO: 22) в родительской последовательности FVIII (SEQ ID NO: 16). Все данные сайта подвергали мутации с разрушением последовательностей MAR/ARS в оптимизированных последовательностях FVIII (SEQ ID NO: 1-6). Местоположение каждого из данных элементов и последовательность соответствующих нуклеотидов в оптимизированных последовательностях показаны в таблице 3 ниже.

Таблица 3. Краткое описание изменений в репрессирующих элементах

Местоположение элемента	Начиная с последовательности BDD FVIII (SEQ ID NO: 16)	Оптимизированная последовательность BDD FVIII
Местоположение элемента		SEQ ID NO: 1	SEQ ID NO: 2	SEQ ID NO: 3	SEQ ID NO: 4	SEQ ID NO: 5	SEQ ID NO: 6	SEQ ID NO: 70	SEQ ID NO: 71
Дестабилизирующие последовательности
639	ATTTA	GTTTA	GTTCA	GTTCA	GTTCA	GTTCA	GTTCA	GTTCA	GTTCA
1338	ATTTA	GTTTA	GTTCA	CTTCA	GTTCA	GTTCA	GTTCA	CTTCA	GTTCA
1449	ATTTA	CTTTA	CTTCA	CTTCA	CTTCA	CTTCA	CTTCA	CTTCA	CTTCA
1590	TAAAT	TAAAT	CAAGT	CAAGT	TAAGT	CAAGT	CAAGT	CAAGT	TAAGT
1623	TAAAT	CAAAA	GAAGA	CTAAG	CAAGA	CAAGA	CAAGA	TAAGT	CAAGA
2410	ATTTA	ATCTA	ATCTA	ATCTA	ATCTA	ATCTA	ATCTA	ATCTA	ATCTA
2586	ATTTA	GTTTA	GTTCA	GTTCA	GTTCA	GTTCA	GTTCA	GTTCA	GTTCA
2630	TAAAT	TGAAT	TGAAC	TGAAC	TGAAC	TCAAT	TGAAC	TCAAT	TGAAC
3884	ATTTA	ATCTG	ACCTG	ACCTG	ACCTG	ATCTG	ACCTG	ATCTG	ACCTG
3887	TAAAT	TGAAC	TGAAC	TGAAC	TGAAC	TGAAC	TGAAC	TGAAC	TGAAC
Потенциальные сайты связывания промотора
641	TTATA	TTATC	TCATC	TCATT	TCATC	TCATC	TCATC	TCATT	TCATC
1275	TATAA	CTATA	TTACA	CTACA	GTACA	CTACA	CTACA	CTACA	GTACA
1276	TTATA	TATAA	TACAA	TACAA	TACAA	TACAA	TACAA	TACAA	TACAA
1445	TTATA	TCATC	TCATC	TTATC	TCATC	TCATC	TCATC	TTATC	TCATC
1474	TATAA	TATAA	TACAA	TACAA	TACAA	TACAA	TACAA	TACAA	TACAA
1588	TATAA	TATAA	TACAA	TACAA	TATAA	TACAA	TACAA	TACAA	TATAA
2614	TTATA	CTGTA	CTGTA	CTGTA	CTGTA	TTGTA	CTGTA	TTGTA	CTGTA
2661	TATAA	CATCA	CATCA	CATCA	CATCA	CATCA	CATCC	CATCA	CATCC
3286	TATAA	TATAA	TACAA	TACAA	TACAA	TACAA	TACAA	TACAA	TACAA
3840	TTATA	TTATA	TTACT	CTACA	CTACA	CTACA	CTACT	CTACA	CTACT
Последовательности, подобные области прикрепления к матриксу (MARS/ARS)
1287	ATATTT	GTATCT	GTACCT	GTACCT	GTATCT	GTACCT	GTACCT	GTACCT	GTATCT
1447	ATATTT	ATCTTT	ATCTTC	ATCTTC	ATCTTC	ATCTTC	ATCTTC	ATCTTC	ATCTTC
1577	AAATAT	AAATCT	AGATCT	AAATCT	AAATCT	AGATCT	AGATCT	AAATCT	AAATCT
1585	AAATAT	AAGTAT	AAGTAC	AAGTAC	AAGTAT	AAGTAC	AAGTAC	AAGTAC	AAGTAT
2231	ATATTT	ACATCA	ATATCA	ACATCA	ACATCA	ACATCT	ATATCT	ACATCT	ATATCT
3054	AAATAT	AAACAT	GAATAT	GAACAT	GAACAT	GAACAT	GAATAT	GAACAT	GAATAT
3788	ATATTT	ATATCT	ATATCT	ACATCT	ACATCT	ACATCT	ACATCT	ACATCT	ACATCT
Последовательности богатых AU элементов (ARE)
2468	ATTTTATT	ACTTCATC	ACTTCATC	ACTTCATT	ACTTCATT	ACTTTATT	ACTTTATC	ACTTTATT	ACTTTATC
3790	ATTTTTAA	ATCTTTAA	ATCTTCAA	ATCTTCAA	ATCTTCAA	ATCTTCAA	ATCTTCAA	ATCTTCAA	ATCTTCAA
Последовательности poly-A/poly-T
3273	AAAAAAA	GAAAAAA	GAAGAAG	GAAGAAG	GAAGAAG	GAAGAAG	CAAGAAG	GAAGAAG	CAAGAAG
4195	TTTTTT	TTCTTT	TTCTTC	TTCTTC	TTCTTC	TTCTTC	TTCTTC	TTCTTCC	TTCTTCC
Сайты сплайсинга
2203	GGTGAT	GGGGAC	GGCGAC	GGGGAC	GGGGAC	GGAGAC	GGAGAC	GGAGAC	GGAGAC

D. Дестабилизирующие последовательности

[216] В некоторых вариантах осуществления генная кассета содержит кодон-оптимизированную нуклеотидную последовательность, кодирующую полипептид FVIII, где кодон-оптимизированная нуклеотидная последовательность содержит меньше дестабилизирующих элементов по сравнению с SEQ ID NO: 16. В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит не более 9, не более 8, не более 7, не более 6 или не более 5 дестабилизирующих элементов. В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит не более 4, не более 3, не более 2 или не более 1 дестабилизирующего элемента. В еще одних вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, не содержит дестабилизирующего элемента.

[217] В одном конкретном варианте осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит первую последовательность нуклеиновой кислоты, кодирующую N-концевую часть полипептида FVIII, и вторую последовательность нуклеиновой кислоты, кодирующую C-концевую часть полипептида FVIII; где первая последовательность нуклеиновой кислоты характеризуется по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 86%, по меньшей мере приблизительно 87%, по меньшей мере приблизительно 88%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с (i) нуклеотидами 58-1791 из SEQ ID NO: 3; (ii) нуклеотидами 1-1791 из SEQ ID NO: 3; (iii) нуклеотидами 58-1791 из SEQ ID NO: 4 или (iv) нуклеотидами 1-1791 из SEQ ID NO: 4; где N-концевая часть и C-концевая часть вместе обладают активностью полипептида FVIII; и где кодон-оптимизированная нуклеотидная последовательность содержит меньше дестабилизирующих элементов по сравнению с SEQ ID NO: 16. В других вариантах осуществления нуклеотидная последовательность, кодирующая полипептид с активностью FVIII, содержит не более 9, не более 8, не более 7, не более 6 или не более 5 дестабилизирующих элементов. В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит не более 4, не более 3, не более 2 или не более 1 дестабилизирующего элемента. В еще одних вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, не содержит дестабилизирующего элемента.

[218] В другом варианте осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит первую последовательность нуклеиновой кислоты, кодирующую N-концевую часть полипептида FVIII, и вторую последовательность нуклеиновой кислоты, кодирующую C-концевую часть полипептида FVIII; где вторая последовательность нуклеиновой кислоты характеризуется по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 86%, по меньшей мере приблизительно 87%, по меньшей мере приблизительно 88%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с (i) нуклеотидами 1792-4374 из SEQ ID NO: 5; (ii) нуклеотидами 1792-4374 из SEQ ID NO: 6; (iii) нуклеотидами 1792-2277 и 2320-4374 из SEQ ID NO: 5 (т. е. нуклеотидами 1792-4374 из SEQ ID NO: 5 без нуклеотидов, кодирующих домен B или фрагмент домена B) или (iv) нуклеотидами 1792-2277 и 2320-4374 из SEQ ID NO: 6 (т. е. нуклеотидами 1792-4374 из SEQ ID NO: 6 без нуклеотидов, кодирующих домен В или фрагмент домена В); где N-концевая часть и C-концевая часть вместе обладают активностью полипептида FVIII; и где кодон-оптимизированная нуклеотидная последовательность содержит меньше дестабилизирующих элементов по сравнению с SEQ ID NO: 16. В других вариантах осуществления нуклеотидная последовательность, кодирующая полипептид с активностью FVIII, содержит не более 9, не более 8, не более 7, не более 6 или не более 5 дестабилизирующих элементов. В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит не более 4, не более 3, не более 2 или не более 1 дестабилизирующего элемента. В еще одних вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, не содержит дестабилизирующего элемента.

[219] В других вариантах осуществления генная кассета содержит кодон-оптимизированную нуклеотидную последовательность, кодирующую полипептид FVIII, где кодон-оптимизированная нуклеотидная последовательность содержит последовательность нуклеиновой кислоты, характеризующуюся по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с (i) нуклеотидами 58-4374 из аминокислотной последовательности, выбранной из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 и 71, или (ii) нуклеотидами 58-2277 и 2320-4374 из аминокислотной последовательности, выбранной из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 и 71 (т. е. нуклеотидами 58-4374 из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 или 71 без нуклеотидов, кодирующих домен B или фрагмент домена B); и где кодон-оптимизированная нуклеотидная последовательность содержит меньше дестабилизирующих элементов по сравнению с SEQ ID NO: 16. В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит не более 9, не более 8, не более 7, не более 6 или не более 5 дестабилизирующих элементов. В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит не более 4, не более 3, не более 2 или не более 1 дестабилизирующего элемента. В еще одних вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, не содержит дестабилизирующего элемента.

[220] Существует десять дестабилизирующих элементов в родительской последовательности FVIII (SEQ ID NO: 16): шесть последовательностей ATTTA (SEQ ID NO: 23) и четыре последовательности TAAAT (SEQ ID NO: 24). В одном варианте осуществления последовательности данных сайтов подвергали мутации с целью разрушения дестабилизирующих элементов в оптимизированных FVIII SEQ ID NO: 1-6, 70 и 71. Местоположение каждого из данных элементов и последовательность соответствующих нуклеотидов в оптимизированных последовательностях показаны в таблице 3.

Е. Потенциальные сайты связывания промотора

[221] В некоторых вариантах осуществления генная кассета содержит кодон-оптимизированную нуклеотидную последовательность, кодирующую полипептид FVIII, где нуклеотидная последовательность содержит меньше потенциальных сайтов связывания промотора по сравнению с SEQ ID NO: 16. В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит не более 9, не более 8, не более 7, не более 6 или не более 5 потенциальных сайтов связывания промотора. В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит не более 4, не более 3, не более 2 или не более 1 потенциального сайта связывания промотора. В еще одних вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, не содержит потенциального сайта связывания промотора.

[222] В одном конкретном варианте осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит первую последовательность нуклеиновой кислоты, кодирующую N-концевую часть полипептида FVIII, и вторую последовательность нуклеиновой кислоты, кодирующую C-концевую часть полипептида FVIII; где первая последовательность нуклеиновой кислоты характеризуется по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 86%, по меньшей мере приблизительно 87%, по меньшей мере приблизительно 88%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с (i) нуклеотидами 58-1791 из SEQ ID NO: 3; (ii) нуклеотидами 1-1791 из SEQ ID NO: 3; (iii) нуклеотидами 58-1791 из SEQ ID NO: 4 или (iv) нуклеотидами 1-1791 из SEQ ID NO: 4; где N-концевая часть и C-концевая часть вместе обладают активностью полипептида FVIII; и где кодон-оптимизированная нуклеотидная последовательность содержит меньше потенциальных сайтов связывания промотора по сравнению с SEQ ID NO: 16. В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит не более 9, не более 8, не более 7, не более 6 или не более 5 потенциальных сайтов связывания промотора. В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит не более 4, не более 3, не более 2 или не более 1 потенциального сайта связывания промотора. В еще одних вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, не содержит потенциального сайта связывания промотора.

[223] В другом варианте осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит первую последовательность нуклеиновой кислоты, кодирующую N-концевую часть полипептида FVIII, и вторую последовательность нуклеиновой кислоты, кодирующую C-концевую часть полипептида FVIII; где вторая последовательность нуклеиновой кислоты характеризуется по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 86%, по меньшей мере приблизительно 87%, по меньшей мере приблизительно 88%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с (i) нуклеотидами 1792-4374 из SEQ ID NO: 5; (ii) нуклеотидами 1792-4374 из SEQ ID NO: 6; (iii) нуклеотидами 1792-2277 и 2320-4374 из SEQ ID NO: 5 (т. е. нуклеотидами 1792-4374 из SEQ ID NO: 5 без нуклеотидов, кодирующих домен B или фрагмент домена B) или (iv) нуклеотидами 1792-2277 и 2320-4374 из SEQ ID NO: 6 (т. е. нуклеотидами 1792-4374 из SEQ ID NO: 6 без нуклеотидов, кодирующих домен В или фрагмент домена В); где N-концевая часть и C-концевая часть вместе обладают активностью полипептида FVIII; и где кодон-оптимизированная нуклеотидная последовательность содержит меньше потенциальных сайтов связывания промотора по сравнению с SEQ ID NO: 16. В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит не более 9, не более 8, не более 7, не более 6 или не более 5 потенциальных сайтов связывания промотора. В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит не более 4, не более 3, не более 2 или не более 1 потенциального сайта связывания промотора. В еще одних вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, не содержит потенциального сайта связывания промотора.

[224] В других вариантах осуществления генная кассета содержит кодон-оптимизированную нуклеотидную последовательность, кодирующую полипептид FVIII, где нуклеотидная последовательность содержит последовательность нуклеиновой кислоты, характеризующуюся по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с (i) нуклеотидами 58-4374 из аминокислотной последовательности, выбранной из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 и 71, или (ii) нуклеотидами 58-2277 и 2320-4374 из аминокислотной последовательности, выбранной из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 и 71 (т. е. нуклеотидами 58-4374 из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 или 71 без нуклеотидов, кодирующих домен B или фрагмент домена B); и где кодон-оптимизированная нуклеотидная последовательность содержит меньше потенциальных сайтов связывания промотора по сравнению с SEQ ID NO: 16. В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит не более 9, не более 8, не более 7, не более 6 или не более 5 потенциальных сайтов связывания промотора. В других вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит не более 4, не более 3, не более 2 или не более 1 потенциального сайта связывания промотора. В еще одних вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, не содержит потенциального сайта связывания промотора.

[225] TATA-боксы представляют собой регуляторные последовательности, часто выявляемые в промоторных участках у эукариот. Они служат в качестве сайта связывания TATA-связывающего белка (TBP), основного транскрипционного фактора. TATA-боксы обычно содержат последовательность TATAA (SEQ ID NO: 28) или ее родственный вариант. Однако в пределах кодирующей последовательности TATA-боксы могут подавлять трансляцию полноразмерного белка. Существует десять потенциальных последовательностей связывания промотора в последовательности BDD FVIII дикого типа (SEQ ID NO: 16): пять последовательностей TATAA (SEQ ID NO: 28) и пять последовательностей TTATA (SEQ ID NO: 29). В некоторых вариантах осуществления по меньшей мере 1, по меньшей мере 2, по меньшей мере 3 или по меньшей мере 4 сайта связывания промотора удалены в генах FVIII по настоящему изобретению. В некоторых вариантах осуществления по меньшей мере 5 сайтов связывания промотора удалены в генах FVIII по настоящему изобретению. В других вариантах осуществления по меньшей мере 6, по меньшей мере 7 или по меньшей мере 8 сайтов связывания промотора удалены в генах FVIII по настоящему изобретению. В одном варианте осуществления по меньшей мере 9 сайтов связывания промотора удалены в генах FVIII по настоящему изобретению. В одном конкретном варианте осуществления все сайты связывания промотора удалены в генах FVIII по настоящему изобретению. Местоположение каждого данного сайта связывания промотора и последовательность соответствующих нуклеотидов в оптимизированных последовательностях показаны в таблице 3.

F. Другие отрицательные регуляторные элементы, действующие в цис-положении

[226] В дополнение к последовательностям MAR/ARS дестабилизирующим элементам и потенциальным сайтам связывания промотора, описанным выше, несколько дополнительный потенциально ингибиторных последовательностей можно идентифицировать в последовательности BDD FVIII дикого типа (SEQ ID NO: 16). Две последовательности богатых AU элементов (ARE) можно идентифицировать (ATTTTATT (SEQ ID NO: 30) и ATTTTTAA (SEQ ID NO: 31) наряду с сайтом poly-A (AAAAAAA; SEQ ID NO: 26), сайтом poly-T (TTTTTT; SEQ ID NO: 25) и сайтом сплайсинга (GGTGAT; SEQ ID NO: 27) в неоптимизированной последовательности BDD FVIII. Один или несколько таких элементов можно удалить из оптимизированных последовательностей FVIII. Местоположение каждого из данных сайтов и последовательность соответствующих нуклеотидов в оптимизированных последовательностях показаны в таблице 3.

[227] В определенных вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит первую последовательность нуклеиновой кислоты, кодирующую N-концевую часть полипептида FVIII, и вторую последовательность нуклеиновой кислоты, кодирующую C-концевую часть полипептида FVIII; где первая последовательность нуклеиновой кислоты характеризуется по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 86%, по меньшей мере приблизительно 87%, по меньшей мере приблизительно 88%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с (i) нуклеотидами 58-1791 из SEQ ID NO: 3; (ii) нуклеотидами 1-1791 из SEQ ID NO: 3; (iii) нуклеотидами 58-1791 из SEQ ID NO: 4 или (iv) нуклеотидами 1-1791 из SEQ ID NO: 4; где N-концевая часть и C-концевая часть вместе обладают активностью полипептида FVIII; и где кодон-оптимизированная нуклеотидная последовательность не содержит одного или нескольких отрицательных регуляторных элементов, действующих в цис-положении, например, сайт сплайсинга, последовательность poly-T, последовательность poly-A, последовательность ARE или любые их комбинации.

[228] В другом варианте осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит первую последовательность нуклеиновой кислоты, кодирующую N-концевую часть полипептида FVIII, и вторую последовательность нуклеиновой кислоты, кодирующую C-концевую часть полипептида FVIII; где вторая последовательность нуклеиновой кислоты характеризуется по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 86%, по меньшей мере приблизительно 87%, по меньшей мере приблизительно 88%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с (i) нуклеотидами 1792-4374 из SEQ ID NO: 5; (ii) нуклеотидами 1792-4374 из SEQ ID NO: 6; (iii) нуклеотидами 1792-2277 и 2320-4374 из SEQ ID NO: 5 (т. е. нуклеотидами 1792-4374 из SEQ ID NO: 5 без нуклеотидов, кодирующих домен B или фрагмент домена B) или (iv) нуклеотидами 1792-2277 и 2320-4374 из SEQ ID NO: 6 (т. е. нуклеотидами 1792-4374 из SEQ ID NO: 6 без нуклеотидов, кодирующих домен В и фрагмент домена В; где N-концевая часть и C-концевая часть вместе обладают активностью полипептида FVIII; и где кодон-оптимизированная нуклеотидная последовательность не содержит одного или нескольких отрицательных регуляторных элементов, действующих в цис-положении, например, сайт сплайсинга, последовательность poly-Т, последовательность poly-A, последовательность ARE или любые их комбинации.

[229] В других вариантах осуществления генная кассета содержит кодон-оптимизированную нуклеотидную последовательность, кодирующую полипептид FVIII, где нуклеотидная последовательность содержит последовательность нуклеиновой кислоты, характеризующуюся по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с (i) нуклеотидами 58-4374 из аминокислотной последовательности, выбранной из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 и 71, или (ii) нуклеотидами 58-2277 и 2320-4374 из аминокислотной последовательности, выбранной из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 и 71 (т. е. нуклеотидами 58-4374 из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 или 71 без нуклеотидов, кодирующих домен B или фрагмент домена B); и где кодон-оптимизированная нуклеотидная последовательность не содержит одного или нескольких отрицательных регуляторных элементов, действующих в цис-положении, например, сайт сплайсинга, последовательность poly-Т, последовательность poly-A, последовательность ARE или любые их комбинации.

[230] В некоторых вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит первую последовательность нуклеиновой кислоты, кодирующую N-концевую часть полипептида FVIII, и вторую последовательность нуклеиновой кислоты, кодирующую C-концевую часть полипептида FVIII; где первая последовательность нуклеиновой кислоты характеризуется по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 86%, по меньшей мере приблизительно 87%, по меньшей мере приблизительно 88%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с (i) нуклеотидами 58-1791 из SEQ ID NO: 3; (ii) нуклеотидами 1-1791 из SEQ ID NO: 3; (iii) нуклеотидами 58-1791 из SEQ ID NO: 4 или (iv) нуклеотидами 1-1791 из SEQ ID NO: 4; где N-концевая часть и C-концевая часть вместе обладают активностью полипептида FVIII; и где кодон-оптимизированная нуклеотидная последовательность не содержит сайта сплайсинга GGTGAT (SEQ ID NO: 27). В некоторых вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит первую последовательность нуклеиновой кислоты, кодирующую N-концевую часть полипептида FVIII, и вторую последовательность нуклеиновой кислоты, кодирующую C-концевую часть полипептида FVIII; где первая последовательность нуклеиновой кислоты характеризуется по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 86%, по меньшей мере приблизительно 87%, по меньшей мере приблизительно 88%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с (i) нуклеотидами 58-1791 из SEQ ID NO: 3; (ii) нуклеотидами 1-1791 из SEQ ID NO: 3; (iii) нуклеотидами 58-1791 из SEQ ID NO: 4 или (iv) нуклеотидами 1-1791 из SEQ ID NO: 4; где N-концевая часть и C-концевая часть вместе обладают активностью полипептида FVIII; и где кодон-оптимизированная нуклеотидная последовательность не содержит последовательности poly-T (SEQ ID NO: 25). В некоторых вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит первую последовательность нуклеиновой кислоты, кодирующую N-концевую часть полипептида FVIII, и вторую последовательность нуклеиновой кислоты, кодирующую C-концевую часть полипептида FVIII; где первая последовательность нуклеиновой кислоты характеризуется по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 86%, по меньшей мере приблизительно 87%, по меньшей мере приблизительно 88%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с (i) нуклеотидами 58-1791 из SEQ ID NO: 3; (ii) нуклеотидами 1-1791 из SEQ ID NO: 3; (iii) нуклеотидами 58-1791 из SEQ ID NO: 4 или (iv) нуклеотидами 1-1791 из SEQ ID NO: 4; где N-концевая часть и C-концевая часть вместе обладают активностью полипептида FVIII; и где кодон-оптимизированная нуклеотидная последовательность не содержит последовательности poly-A (SEQ ID NO: 26). В некоторых вариантах осуществления кодон-оптимизированная нуклеотидная последовательность, кодирующая полипептид FVIII, содержит первую последовательность нуклеиновой кислоты, кодирующую N-концевую часть полипептида FVIII, и вторую последовательность нуклеиновой кислоты, кодирующую C-концевую часть полипептида FVIII; где первая последовательность нуклеиновой кислоты характеризуется по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 86%, по меньшей мере приблизительно 87%, по меньшей мере приблизительно 88%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с (i) нуклеотидами 58-1791 из SEQ ID NO: 3; (ii) нуклеотидами 1-1791 из SEQ ID NO: 3; (iii) нуклеотидами 58-1791 из SEQ ID NO: 4 или (iv) нуклеотидами 1-1791 из SEQ ID NO: 4; где N-концевая часть и C-концевая часть вместе обладают активностью полипептида FVIII; и где кодон-оптимизированная нуклеотидная последовательность не содержит элемента ARE (SEQ ID NO: 30 или SEQ ID NO: 31).

[231] В некоторых вариантах осуществления генная кассета содержит кодон-оптимизированную нуклеотидную последовательность, кодирующую полипептид FVIII, где кодон-оптимизированная нуклеотидная последовательность содержит последовательность нуклеиновой кислоты, характеризующуюся по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с (i) нуклеотидами 58-4374 из аминокислотной последовательности, выбранной из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 и 71, или (ii) нуклеотидами 58-2277 и 2320-4374 из аминокислотной последовательности, выбранной из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 и 71 (т. е. нуклеотидами 58-4374 из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 или 71 без нуклеотидов, кодирующих домен B или фрагмент домена B); и где кодон-оптимизированная нуклеотидная последовательность не содержит сайта сплайсинга GGTGAT (SEQ ID NO: 27). В некоторых вариантах осуществления генная кассета содержит кодон-оптимизированную нуклеотидную последовательность, кодирующую полипептид FVIII, где кодон-оптимизированная нуклеотидная последовательность содержит последовательность нуклеиновой кислоты, характеризующуюся по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с (i) нуклеотидами 58-4374 из аминокислотной последовательности, выбранной из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 и 71, или (ii) нуклеотидами 58-2277 и 2320-4374 из аминокислотной последовательности, выбранной из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 и 71 (т. е. нуклеотидами 58-4374 из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 или 71 без нуклеотидов, кодирующих домен B или фрагмент домена B); и где кодон-оптимизированная нуклеотидная последовательность не содержит последовательности poly-T (SEQ ID NO: 25). В некоторых вариантах осуществления генная кассета содержит кодон-оптимизированную нуклеотидную последовательность, кодирующую полипептид FVIII, где кодон-оптимизированная нуклеотидная последовательность содержит последовательность нуклеиновой кислоты, характеризующуюся по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с (i) нуклеотидами 58-4374 из аминокислотной последовательности, выбранной из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 и 71, или (ii) нуклеотидами 58-2277 и 2320-4374 из аминокислотной последовательности, выбранной из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 и 71 (т. е. нуклеотидами 58-4374 из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 или 71 без нуклеотидов, кодирующих домен B или фрагмент домена B); и где кодон-оптимизированная нуклеотидная последовательность не содержит последовательности poly-A (SEQ ID NO: 26). В некоторых вариантах осуществления генная кассета содержит кодон-оптимизированную нуклеотидную последовательность, кодирующую полипептид FVIII, где кодон-оптимизированная нуклеотидная последовательность содержит последовательность нуклеиновой кислоты, характеризующуюся по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 89%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98% или по меньшей мере приблизительно 99% идентичностью последовательности с (i) нуклеотидами 58-4374 из аминокислотной последовательности, выбранной из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 и 71, или (ii) нуклеотидами 58-2277 и 2320-4374 из аминокислотной последовательности, выбранной из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 и 71 (т. е. нуклеотидами 58-4374 из SEQ ID NO: 1, 2, 3, 4, 5, 6, 70 или 71 без нуклеотидов, кодирующих домен B или фрагмент домена B); и где кодон-оптимизированная нуклеотидная последовательность не содержит элемента ARE (SEQ ID NO: 30 или SEQ ID NO: 31).

[232] В других вариантах осуществления оптимизированная последовательность FVIII по настоящему изобретению не содержит одного или нескольких из противовирусных мотивов, структур типа "cтебель-петля" и последовательностей повтора.

[233] В еще одних других вариантах осуществления нуклеотиды, окружающие сайт инициации транскрипции, заменены на консенсусную последовательность Козак (GCCGCCACCATGC (SEQ ID NO: 32), где подчеркнутые нуклеотиды представляют собой старт-кодон). В других вариантах осуществления сайты рестрикции можно добавить или удалить с целью улучшения процесса клонирования.

b. FIX и полинуклеотидные последовательности, кодирующие белок FIX

[234] В некоторых вариантах осуществления молекула нуклеиновой кислоты содержит первый ITR, второй ITR и генную кассету, кодирующую терапевтический белок, где терапевтический белок содержит полипептид FIX. В некоторых вариантах осуществления полипептид FIX содержит FIX или его вариант или фрагмент, где FIX или его вариант или фрагмент характеризуется активностью FIX.

[235] FIX человека представляет собой сериновую протеазу, которая является важным компонентом внутреннего пути каскада коагуляции крови. "Фактор IX" или "FIX", как используется в данном документе, относится к белку, представляющему собой фактор коагуляции, и его разновидностям и вариантам с отличающейся последовательностью и включает без ограничения одноцепочечную последовательность полипептида-предшественника FIX человека из 461 аминокислоты ("препро"-форму), одноцепочечную последовательность зрелого FIX человека из 415 аминокислот (SEQ ID NO: 125) и вариант FIX с R338L (Padua) (SEQ ID NO: 126). FIX включает любую форму молекулы FIX с типичными характеристиками фактора коагуляции крови FIX. Подразумевается, что "фактор IX" и "FIX", как используется в данном документе, охватывают полипептиды, которые содержат домены Gla (область, содержащую остатки γ-карбоксиглутаминовой кислоты), EGF1 и EGF2 (области, содержащие последовательности, гомологичные эпидермальному фактору роста человека), активационный пептид ("AP", образованный остатками R136-R180 зрелого FIX) и C-концевой протеазный домен ("Pro") или эти домены под синонимичными названиями, известными из уровня техники, или могут представлять собой усеченный фрагмент или вариант с отличающейся последовательностью, сохраняющий по меньшей мере часть биологической активности нативного белка. FIX или варианты с отличающейся последовательностью были клонированы, как описано в патентах США №№ 4770999 и 7700734, и кДНК, кодирующая FIX человека, была выделена, охарактеризована и клонирована в векторы экспрессии (см., например, Choo et al., Nature 299:178-180 (1982); Fair et al., Blood 64:194-204 (1984); и Kurachi et al., Proc. Natl. Acad. Sci., U.S.A. 79:6461-6464 (1982)). Один конкретный вариант FIX, вариант FIX с R338L (Padua) (SEQ ID NO: 2), охарактеризованный Simioni et al., 2009, содержит мутацию, обуславливающую приобретение функции, что коррелирует с увеличением активности варианта Padua почти в 8 раз по сравнению с нативным FIX (таблица 4). Варианты FIX также могут включать любой полипептид FIX, имеющий одну или несколько консервативных аминокислотных замен, которые не влияют на активность полипептида FIX в качестве FIX. В некоторых вариантах осуществления вариант FIX содержит rFIX-альбумин, слитый с помощью расщепляемого линкера, например, IDELVION®. См. US 7939632, полностью включенный в данный документ посредством ссылки.

Таблица 4. Иллюстративные примеры последовательностей FIX

SEQ ID NO: 125 (зрелый полипептид FIX)

1:YNSGKLEEFV QGNLERECME EKCSFEEARE VFENTERTTE FWKQYVDGDQ CESNPCLNGG
61:SCKDDINSYE CWCPFGFEGK NCELDVTCNI KNGRCEQFCK NSADNKVVCS CTEGYRLAEN 121:QKSCEPAVPF PCGRVSVSQT SKLTRAETVF PDVDYVNSTE AETILDNITQ STQSFNDFTR
181:VVGGEDAKPG QFPWQVVLNG KVDAFCGGSI VNEKWIVTAA HCVETGVKIT VVAGEHNIEE
241:TEHTEQKRNV IRIIPHHNYN AAINKYNHDI ALLELDEPLV LNSYVTPICI ADKEYTNIFL
301:KFGSGYVSGW GRVFHKGRSA LVLQYLRVPL VDRATCLRST KFTIYNNMFC AGFHEGGRDS
361:CQGDSGGPHV TEVEGTSFLT GIISWGEECA MKGKYGIYTK VSRYVNWIKE KTKLT

SEQ ID NO: 126 (зрелый полипептид FIX Padua (R338L))

1:YNSGKLEEFV QGNLERECME EKCSFEEARE VFENTERTTE FWKQYVDGDQ CESNPCLNGG
61:SCKDDINSYE CWCPFGFEGK NCELDVTCNI KNGRCEQFCK NSADNKVVCS CTEGYRLAEN 121:QKSCEPAVPF PCGRVSVSQT SKLTRAETVF PDVDYVNSTE AETILDNITQ STQSFNDFTR
181:VVGGEDAKPG QFPWQVVLNG KVDAFCGGSI VNEKWIVTAA HCVETGVKIT VVAGEHNIEE
241:TEHTEQKRNV IRIIPHHNYN AAINKYNHDI ALLELDEPLV LNSYVTPICI ADKEYTNIFL
301:KFGSGYVSGW GRVFHKGRSA LVLQYLRVPL VDRATCLLST KFTIYNNMFC AGFHEGGRDS
361:CQGDSGGPHV TEVEGTSFLT GIISWGEECA MKGKYGIYTK VSRYVNWIKE KTKLT

SEQ ID NO: 127 (сигнальный полипептид и пропептид FIX)

1: MQRVNMIMAE SPGLITICLL GYLLSAECTV FLDHENANKI LNRPKR

SEQ ID NO: 160 (FIX-линкер-альбумин)

YNSGKLEEFV QGNLERECME EKCSFEEARE VFENTERTTE FWKQYVDGDQ 50
CESNPCLNGG SCKDDINSYE CWCPFGFEGK NCELDVTCNI KNGRCEQFCK 100
NSADNKVVCS CTEGYRLAEN QKSCEPAVPF PCGRVSVSQT SKLTRAETVF 150
PDVDYVNSTE AETILDNITQ STQSFNDFTR VVGGEDAKPG QFPWQVVLNG 200
KVDAFCGGSI VNEKWIVTAA HCVETGVKIT VVAGEHNIEE TEHTEQKRNV 250
IRIIPHHNYN AAINKYNHDI ALLELDEPLV LNSYVTPICI ADKEYTNIFL 300
KFGSGYVSGW GRVFHKGRSA LVLQYLRVPL VDRATCLRST KFTIYNNMFC 350
AGFHEGGRDS CQGDSGGPHV TEVEGTSFLT GIISWGEECA MKGKYGIYTK 400
VSRYVNWIKE KTKLTPVSQT SKLTRAETVF PDVDAHKSEV AHRFKDLGEE 450
NFKALVLIAF AQYLQQCPFE DHVKLVNEVT EFAKTCVADE SAENCDKSLH 500
TLFGDKLCTV ATLRETYGEM ADCCAKQEPE RNECFLQHKD DNPNLPRLVR 550
PEVDVMCTAF HDNEETFLKK YLYEIARRHP YFYAPELLFF AKRYKAAFTE 600
CCQAADKAAC LLPKLDELRD EGKASSAKQR LKCASLQKFG ERAFKAWAVA 650
RLSQRFPKAE FAEVSKLVTD LTKVHTECCH GDLLECADDR ADLAKYICEN 700
QDSISSKLKE CCEKPLLEKS HCIAEVENDE MPADLPSLAA DFVESKDVCK 750
NYAEAKDVFL GMFLYEYARR HPDYSVVLLL RLAKTYETTL EKCCAAADPH 800
ECYAKVFDEF KPLVEEPQNL IKQNCELFEQ LGEYKFQNAL LVRYTKKVPQ 850
VSTPTLVEVS RNLGKVGSKC CKHPEAKRMP CAEDYLSVVL NQLCVLHEKT 900
PVSDRVTKCC TESLVNRRPC FSALEVDETY VPKEFNAETF TFHADICTLS 950
EKERQIKKQT ALVELVKHKP KATKEQLKAV MDDFAAFVEK CCKADDKETC 1000
FAEEGKKLVA ASQAALGL 1018

SEQ ID NO: 161 (FIX)

YNSGKLEEFVQGNLERECMEEKCSFEEAREVFENTERTTEFWKQYVDGDQCESNPCLNGGSCKDDINSYECWCPFGFEGKNCELDVTCNIKNGRCEQFCKNSADNKVVCSCTEGYRLAENQKSCEPAVPFPCGRVSVSQTSKLTRAETVFPDVDYVNSTEAETILDNITQSTQSFNDFTRVVGGEDAKPGQFPWQVVLNGKVDAFCGGSIVNEKWIVTAAHCVETGVKITVVAGEHNIEETEHTEQKRNVIRIIPHHNYNAAINKYNHDIALLELDEPLVLNSYVTPICIADKEYTNIFLKFGSGYVSGWGRVFHKGRSALVLQYLRVPLVDRATCLRSTKFTIYNNMFCAGFHEGGRDSCQGDSGGPHVTEVEGTSFLTGIISWGEECAMKGKYGIYTKVSRYVNWIKEKTKLTPVSQTSKLT

SEQ ID NO: 162 (линкер)

RAETVFPDV

SEQ ID NO: 163 (альбумин)

DAHKSEVAHRFKDLGEENFKALVLIAFAQYLQQCPFEDHVKLVNEVTEFAKTCVADESAENCDKSLHTLFGDKLCTVATLRETYGEMADCCAKQEPERNECFLQHKDDNPNLPRLVRPEVDVMCTAFHDNEETFLKKYLYEIARRHPYFYAPELLFFAKRYKAAFTECCQAADKAACLLPKLDELRDEGKASSAKQRLKCASLQKFGERAFKAWAVARLSQRFPKAEFAEVSKLVTDLTKVHTECCHGDLLECADDRADLAKYICENQDSISSKLKECCEKPLLEKSHCIAEVENDEMPADLPSLAADFVESKDVCKNYAEAKDVFLGMFLYEYARRHPDYSVVLLLRLAKTYETTLEKCCAAADPHECYAKVFDEFKPLVEEPQNLIKQNCELFEQLGEYKFQNALLVRYTKKVPQVSTPTLVEVSRNLGKVGSKCCKHPEAKRMPCAEDYLSVVLNQLCVLHEKTPVSDRVTKCCTESLVNRRPCFSALEVDETYVPKEFNAETFTFHADICTLSEKERQIKKQTALVELVKHKPKATKEQLKAVMDDFAAFVEKCCKADDKETCFAEEGKKLVAASQAALGL

SEQ ID NO: 164 (FIX(XTEN)-Fc)*

MQRVNMIMAESPGLITICLLGYLLSAECTVFLDHENANKILNRPKRYNSGKLEEFVQGNLERECMEEKCSFEEAREVFENTERTTEFWKQYVDGDQCESNPCLNGGSCKDDINSYECWCPFGFEGKNCELDVTCNIKNGRCEQFCKNSADNKVVCSCTEGYRLAENQKSCEPAVPFPCGRVSVSQTSKLTRAETVFPDVDYVNSTEAETILDGPSPGSPTSTEEGTSESATPESGPGSEPATSGSETPGTSESATPESGPGTSTEPSEGSAPGTSTEPSEGSAPGASSNITQSTQSFNDFTRVVGGEDAKPGQFPWQVVLNGKVDAFCGGSIVNEKWIVTAAHCVETGVKITVVAGEHNIEETEHTEQKRNVIRIIPHHNYNAAINKYNHDIALLELDEPLVLNSYVTPICIADKEYTNIFLKFGSGYVSGWGRVFHKGRSALVLQYLRVPLVDRATCLLSTKFTIYNNMFCAGFHEGGRDSCQGDSGGPHVTEVEGTSFLTGIISWGEECAMKGKYGIYTKVSRYVNWIKEKTKLTDKTHTCPPCPAPELLGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVKFNWYVDGVEVHNAKTKPREEQYNSTYRVVSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVYTLPPSRDELTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALHNHYTQKSLSLSPG

SEQ ID NO: 165 (FIX-FXIa-AE288)*

YNSGKLEEFVQGNLERECMEEKCSFEEAREVFENTERTTEFWKQYVDGDQCESNPCLNGGSCKDDINSYECWCPFGFEGKNCELDVTCNIKNGRCEQFCKNSADNKVVCSCTEGYRLAENQKSCEPAVPFPCGRVSVSQTSKLTRAETVFPDVDYVNSTEAETILDNITQSTQSFNDFTRVVGGEDAKPGQFPWQVVLNGKVDAFCGGSIVNEKWIVTAAHCVETGVKITVVAGEHNIEETEHTEQKRNVIRIIPHHNYNAAINKYNHDIALLELDEPLVLNSYVTPICIADKEYTNIFLKFGSGYVSGWGRVFHKGRSALVLQYLRVPLVDRATCLRSTKFTIYNNMFCAGFHEGGRDSCQGDSGGPHVTEVEGTSFLTGIISWGEECAMKGKYGIYTKVSRYVNWIKEKTKLTGKLTRAETGGTSESATPESGPGSEPATSGSETPGTSESATPESGPGSEPATSGSETPGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSESATPESGPGSEPATSGSETPGTSESATPESGPGSPAGSPTSTEEGSPAGSPTSTEEGTSTEPSEGSAPGTSESATPESGPGTSESATPESGPGTSESATPESGPGSEPATSGSETPGSEPATSGSETPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGSAPGSEPATSGSETPGTSESATPESGPGTSTEPSEGSAP

SEQ ID NO: 166 (FIX-Fc-Fc)**

MQRVNMIMAESPGLITICLLGYLLSAECTVFLDHENANKILNRPKRYNSGKLEEFVQGNLERECMEEKCSFEEAREVFENTERTTEFWKQYVDGDQCESNPCLNGGSCKDDINSYECWCPFGFEGKNCELDVTCNIKNGRCEQFCKNSADNKVVCSCTEGYRLAENQKSCEPAVPFPCGRVSVSQTSKLTRAETVFPDVDYVNSTEAETILDNITQSTQSFNDFTRVVGGEDAKPGQFPWQVVLNGKVDAFCGGSIVNEKWIVTAAHCVETGVKITVVAGEHNIEETEHTEQKRNVIRIIPHHNYNAAINKYNHDIALLELDEPLVLNSYVTPICIADKEYTNIFLKFGSGYVSGWGRVFHKGRSALVLQYLRVPLVDRATCLRSTKFTIYNNMFCAGFHEGGRDSCQGDSGGPHVTEVEGTSFLTGIISWGEECAMKGKYGIYTKVSRYVNWIKEKTKLTDKTHTCPPCPAPELLGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVKFNWYVDGVEVHNAKTKPREEQYNSTYRVVSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVYTLPPSRDELTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALHNHYTQKSLSLSPGKRRRRSGGGGSGGGGSGGGGSGGGGSRRRRDKTHTCPPCPAPELLGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVKFNWYVDGVEVHNAKTKPREEQYNSTYRVVSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVYTLPPSRDELTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALHNHYTQKSLSLSPGK

* Серая штриховка=сигнальный пептид; подчеркивание=последовательность XTEN; жирный шрифт=Fc.

** SEQ ID NO: 67 из патента США № 9856468, включенного в данный документ посредством ссылки во всей своей полноте.

[236] Полипептид FIX имеет размер 55 кДа, синтезируется в виде полипептидной цепи, представляющей собой препроформу (SEQ ID NO: 125), которая состоит из трех следующих областей: сигнального пептида из 28 аминокислот (аминокислоты с 1 по 28 из SEQ ID NO: 127), пропептида из 18 аминокислот (аминокислоты с 29 по 46), который необходим для гамма-карбоксилирования остатков глутаминовой кислоты, и зрелого фактора IX из 415 аминокислот (SEQ ID NO: 125 или 126). Пропептид представляет собой последовательность из 18 аминокислотных остатков, расположенную с N-концевой стороны от гамма-карбоксиглутаматного домена. Пропептид связывается с витамин K-зависимой гамма-карбоксилазой и затем отщепляется от полипептида-предшественника FIX под действием эндогенной протеазы, наиболее вероятно PACE (фермента, расщепляющего белок в месте спаренных основных аминокислот), также известной как фурин или PCSK3. Без гамма-карбоксилирования домен Gla не способен связывать кальций, принимая правильную конформацию, необходимую для заякоривания белка на отрицательно заряженных фосфолипидных поверхностях, что тем самым делает фактор IX нефункциональным. Даже в случае, когда домен Gla является карбоксилированным, его надлежащее функционирование также зависит от отщепления пропептида, поскольку остающийся пропептид препятствует конформационным изменениям домена Gla, необходимым для оптимального связывания с кальцием и фосфолипидами. У людей образующийся в результате зрелый фактор IX секретируется клетками печени в кровоток в виде неактивного зимогена, одноцепочечного белка из 415 аминокислотных остатков, который содержит примерно 17% по весу углеводов (Schmidt, A. E., et al. (2003) Trends Cardiovasc Med, 13: 39).

[237] Зрелый FIX состоит из нескольких доменов, которыми в конфигурации от N- к C-концу являются: домен Gla, домен EGF1, домен EGF2, домен активационного пептида (AP) и протеазный (или каталитический) домен. Короткий линкер соединяет домен EGF2 с доменом AP. FIX содержит два активационных пептида, образованных соответственно из R145-A146 и R180-V181. После активации одноцепочечный FIX становится 2-цепочечной молекулой, в которой две цепи связаны дисульфидной связью. Факторы свертывания крови можно сконструировать путем замещения их активационных пептидов, что в результате приводит к изменению специфичности активации. У млекопитающих зрелый FIX должен быть активирован активированным фактором XI с получением фактора IXa. Протеазный домен при активации FIX до FIXa обеспечивает каталитическую активность FIX. Активированный фактор VIII (FVIIIa) представляет собой специфический кофактор, необходимый для полного проявления активности FIXa.

[238] В определенных вариантах осуществления полипептид FIX представляет собой плазматический FIX в виде его аллельной формы по Thr148 и обладает структурными и функциональными характеристиками, сходными с характеристиками эндогенного FIX.

[239] Многие функциональные варианты FIX известны из уровня техники. В международной публикации № WO 02/040544 A3 на странице 4 в строках 9-30 и на странице 15 в строках 6-31 раскрыты мутантные формы, демонстрирующие увеличенную устойчивость к ингибированию гепарином. В международной публикации № WO 03/020764 A2 в таблицах 2 и 3 (на страницах 14-24) и на странице 12 в строках 1-27 раскрыты мутантные формы FIX с пониженной T-клеточной иммуногенностью. В международной публикации № WO 2007/149406 A2 от страницы 4, строки 1 до страницы 19, строки 11 раскрыты функциональные мутантные молекулы FIX, демонстрирующие увеличенную стабильность белков, увеличенный период полужизни in vivo и in vitro и увеличенную устойчивость к протеазам. В WO 2007/149406 A2 от страницы 19, строки 12 до страницы 20, строки 9 также раскрыты химерные и другие вариантные молекулы FIX. В международной публикации № WO 08/118507 A2 от страницы 5, строки 14 до страницы 6, строки 5 раскрыты мутантные формы FIX, демонстрирующие увеличенную свертывающую активность. В международной публикации № WO 09/051717 A2 от страницы 9, строки 11 до страницы 20, строки 2 раскрыты мутантные формы FIX, имеющие увеличенное количество сайтов N-связанного и/или O-связанного гликозилирования, что приводит к увеличению периода полужизни и/или степени обнаружения. В международной публикации № WO 09/137254 A2 от страницы 2, абзаца [006] до страницы 5, абзаца [011] и от страницы 16, абзаца [044] до страницы 24, абзаца [057] также раскрыты мутантные формы фактора IX с увеличенным количеством сайтов гликозилирования. В международной публикации № WO 09/130198 A2 от страницы 4, строки 26 до страницы 12, строки 6 раскрыты функциональные мутантные молекулы FIX, которые имеют увеличенное количество сайтов гликозилирования, что приводит к увеличению периода полужизни. В международной публикации № WO 09/140015 A2 от страницы 11, абзаца [0043] до страницы 13, абзаца [0053] раскрыты функциональные мутантные формы FIX, имеющие увеличенное количество остатков Cys, которые можно использовать для конъюгирования с полимером (например, PEG). Полипептиды FIX, описанные в международной заявке № PCT/US2011/043569, поданной 11 июля 2011 г. и опубликованной как WO 2012/006624 12 января 2012 г., также включены в данный документ посредством ссылки во всей своей полноте. В некоторых вариантах осуществления полипептид FIX содержит полипептид FIX, слитый с альбумином, например, FIX-альбумин. В определенных вариантах осуществления полипептид FIX представляет собой IDELVION® или rIX-FP.

[240] В дополнение, у субъектов с гемофилией были идентифицированы сотни нефункциональных мутаций в FIX, многие из которых раскрыты в таблице 6 на страницах 11-14 международной публикации № WO 09/137254 A2. Такие нефункциональные мутации не включены в настоящее изобретение, но обеспечивают дополнительные указания в отношении того, какие мутации с большей или меньшей долей вероятности приводят к образованию функционального полипептида FIX.

[241] В одном варианте осуществления полипептид FIX (или часть слитого полипептида, представляющая собой фактор IX) содержит аминокислотную последовательность, на по меньшей мере 70%, на по меньшей мере 80%, на по меньшей мере 85%, на по меньшей мере 90%, на по меньшей мере 95%, на по меньшей мере 96%, на по меньшей мере 97%, на по меньшей мере 98%, на по меньшей мере 99% или на 100% идентичную последовательности, изложенной под SEQ ID NO: 1 или 2 (аминокислоты с 1 по 415 из SEQ ID NO: 125 или 126), или, в качестве альтернативы, последовательность пропептида или последовательность пропептида и сигнальную последовательность (полноразмерный FIX). В другом варианте осуществления полипептид FIX содержит аминокислотную последовательность, на по меньшей мере 70%, на по меньшей мере 80%, на по меньшей мере 85%, на по меньшей мере 90%, на по меньшей мере 95%, на по меньшей мере 96%, на по меньшей мере 97%, на по меньшей мере 98%, на по меньшей мере 99% или на 100% идентичную последовательности, изложенной под SEQ ID NO: 2.

[242] Коагулянтная активность FIX выражается в международных единицах (МЕ). Одна МЕ активности FIX примерно соответствует количеству FIX в одном миллилитре нормальной плазмы крови человека. Доступны несколько анализов для измерения активности FIX, в том числе одностадийный анализ свертывания крови (активированного частичного тромбопластинового времени; aPTT), анализ времени образования тромбина (TGA) и ротационная тромбоэластометрия (ROTEM^®). Настоящее изобретение охватывает последовательности, характеризующиеся гомологией с последовательностями FIX, фрагменты последовательностей, которые являются природными, как, например, полученными от людей, приматов, отличных от человека, млекопитающих (в том числе домашних животных), и неприродные варианты последовательностей, которые сохраняют по меньшей мере часть биологической активности или биологической функции FIX и/или которые являются применимыми для предупреждения, лечения заболевания, дефицита, нарушения или состояния, связанного с фактором коагуляции (например, эпизодов кровотечения, связанных с травмой, хирургической операцией, при дефиците фактора коагуляции), опосредованного влияния на него или уменьшения интенсивности его проявлений. Последовательности, характеризующиеся гомологией с FIX человека, можно найти с помощью стандартных методик поиска гомологии, таких как BLAST от NCBI.

[243] В определенных вариантах осуществления последовательность FIX является кодон-оптимизированной. Примеры кодон-оптимизированных последовательностей FIX включают без ограничения SEQ ID NO: 1 и 54-58 из международной публикации № WO 2016/004113 А1, которая включена в данный документ посредством ссылки во всей своей полноте.

c. FVII и полинуклеотидные последовательности, кодирующие белок FVII

[244] В некоторых вариантах осуществления молекула нуклеиновой кислоты содержит первый ITR, второй ITR и генную кассету, кодирующую терапевтический белок, где терапевтический белок содержит полипептид, представляющий собой фактор VII. В некоторых вариантах осуществления полипептид FVII содержит FVII или его вариант или фрагмент, где его вариант или фрагмент характеризуется активностью FVII.

[245] "Фактор VII" ("FVII" или "F7"; также упоминается как фактор 7, фактор свертывания крови VII, сывороточный фактор VII, сывороточный ускоритель превращения протромбина, SPCA, проконвертин и эптаког альфа) представляет собой сериновую протеазу, которая является частью каскада коагуляции крови. В одном варианте осуществления фактор свертывания крови, кодируемый нуклеиновой кислотой, описанной в данном документе, представляет собой FVII. Рекомбинантный активированный фактор VII ("FVII") стал широко использоваться для лечения массивного кровотечения, такого как возникающее у пациентов с гемофилией A или B, дефицитом фактора свертывания крови XI, FVII, нарушением функции тромбоцитов, тромбоцитопенией или болезнью фон Виллебранда.

[246] Рекомбинантный активированный FVII (rFVIIa; NovoSeven^®) используется для лечения эпизодов кровотечения у (i) пациентов с гемофилией с нейтрализующими антителами к FVIII или FIX (ингибиторами), (ii) пациентов с дефицитом FVII или (iii) пациентов с гемофилией A или B с ингибиторами, проходящими хирургические процедуры. Однако, NovoSeven^® демонстрирует низкую эффективность. Часто требуются повторные дозы FVIIa в высокой концентрации для контроля кровотечения из-за его низкого сродства к активированным тромбоцитам, короткого периода полужизни и низкой ферментативной активности в отсутствие тканевого фактора. Соответственно, существует неудовлетворенная медицинская потребность в лучших вариантах лечения и предупреждения для пациентов с гемофилией с ингибиторами FVIII и FIX и/или с дефицитом FVII.

[247] В одном варианте осуществления генная кассета кодирует зрелую форму FVII или его вариант. FVII содержит домен Gla, два домена EGF (EGF-1 и EGF-2) и домен сериновой протеазы (или домен пептидазы S1), который является высококонсервативным среди всех представителей сериновых протеаз семейства пептидаз S1, таких как, например, химотрипсин. FVII встречается в виде одноцепочечного зимогена (т. е. активируемого FVII) и полностью активированной двухцепочечной формы.

C. Факторы роста

[248] В некоторых вариантах осуществления молекула нуклеиновой кислоты содержит первый ITR, второй ITR и генную кассету, кодирующую терапевтический белок, где терапевтический белок содержит фактор роста. Фактор роста может быть выбран из любого фактора роста, известного из уровня техники. В некоторых вариантах осуществления фактор роста представляет собой гормон. В других вариантах осуществления фактор роста представляет собой цитокин. В некоторых вариантах осуществления фактор роста представляет собой хемокин.

[249] В некоторых вариантах осуществления фактор роста представляет собой адреномедуллин (AM). В некоторых вариантах осуществления фактор роста представляет собой ангиопоэтин (Ang). В некоторых вариантах осуществления фактор роста представляет собой аутокринный фактор миграции. В некоторых вариантах осуществления фактор роста представляет собой костный морфогенетический белок (BMP). В некоторых вариантах осуществления BMP выбран из BMP2, BMP4, BMP5 и BMP7. В некоторых вариантах осуществления фактор роста является представителем семейства цилиарных нейротрофических факторов. В некоторых вариантах осуществления представитель семейства цилиарных нейротрофических факторов выбран из цилиарного нейротрофического фактора (CNTF), фактора, ингибирующего лейкоз (LIF), интерлейкина-6 (IL-6). В некоторых вариантах осуществления фактор роста представляет собой колониестимулирующий фактор. В некоторых вариантах осуществления колониестимулирующий фактор выбран из макрофагального колониестимулирующего фактора (m-CSF), гранулоцитарного колониестимулирующего фактора (G-CSF) и гранулоцитарно-макрофагального колониестимулирующего фактора (GM-CSF). В некоторых вариантах осуществления фактор роста представляет собой эпидермальный фактор роста (EGF). В некоторых вариантах осуществления фактор роста представляет собой эфрин. В некоторых вариантах осуществления эфрин выбран из эфрина А1, эфрина А2, эфрина А3, эфрина А4, эфрина А5, эфрина В1, эфрина В2 и эфрина В3. В некоторых вариантах осуществления фактор роста представляет собой эритропоэтин (EPO). В некоторых вариантах осуществления фактор роста представляет собой фактор роста фибробластов (FGF). В некоторых вариантах осуществления FGF выбран из FGF1, FGF2, FGF3, FGF4, FGF5, FGF6, FGF7, FGF8, FGF9, FGF10, FGF11, FGF12, FGF13, FGF14, FGF15, FGF16, FGF17, FGF18, FGF19, FGF20, FGF21, FGF22 и FGF23. В некоторых вариантах осуществления фактор роста представляет собой фетальный бычий соматотропин (FBS). В некоторых вариантах осуществления фактор роста является представителем семейства GDNF. В некоторых вариантах осуществления представитель семейства GDNF выбран из нейротрофического фактора линии глиальных клеток (GDNF), нейротурина, персефина и артемина. В некоторых вариантах осуществления фактор роста представляет собой фактор роста и дифференцировки-9 (GDF9). В некоторых вариантах осуществления фактор роста представляет собой фактор роста гепатоцитов (HGF). В некоторых вариантах осуществления фактор роста представляет собой фактор роста, происходящий из гепатомы (HDGF). В некоторых вариантах осуществления фактор роста представляет собой инсулин. В некоторых вариантах осуществления фактор роста представляет собой инсулиноподобный фактор роста. В некоторых вариантах осуществления инсулиноподобный фактор роста представляет собой инсулиноподобный фактор роста-1 (IGF-1) или IGF-2. В некоторых вариантах осуществления фактор роста представляет собой интерлейкин (IL). В некоторых вариантах осуществления IL выбран из IL-1, IL-2, IL-3, IL-4, IL-5, IL-6 и IL-7. В некоторых вариантах осуществления фактор роста представляет собой фактор роста кератиноцитов (KGF). В некоторых вариантах осуществления фактор роста представляет собой фактор, стимулирующий миграцию (MSF). В некоторых вариантах осуществления фактор роста представляет собой белок, стимулирующий макрофаги (MSP или белок, подобный фактору роста гепатоцитов (HGFLP)). В некоторых вариантах осуществления фактор роста представляет собой миостатин (GDF-8). В некоторых вариантах осуществления фактор роста представляет собой нейрегулин. В некоторых вариантах осуществления нейрегулин выбран из нейрегулина 1 (NRG1), NRG2, NRG3 и NRG4. В некоторых вариантах осуществления фактор роста представляет собой нейротрофин. В некоторых вариантах осуществления фактор роста представляет собой нейротрофический фактор головного мозга (BDNF). В некоторых вариантах осуществления фактор роста представляет собой фактор роста нервов (NGF). В некоторых вариантах осуществления NGF представляет собой нейротрофин-3 (NT-3) или NT-4. В некоторых вариантах осуществления фактор роста представляет собой плацентарный фактор роста (PGF). В некоторых вариантах осуществления фактор роста представляет собой фактор роста тромбоцитов (PDGF). В некоторых вариантах осуществления фактор роста представляет собой реналазу (RNLS). В некоторых вариантах осуществления фактор роста представляет собой фактор роста Т-клеток (TCGF). В некоторых вариантах осуществления фактор роста представляет собой тромбопоэтин (TPO). В некоторых вариантах осуществления фактор роста представляет собой трансформирующий фактор роста. В некоторых вариантах осуществления трансформирующий фактор роста представляет собой трансформирующий фактор роста-альфа (TGF-α) или TGF-β. В некоторых вариантах осуществления фактор роста представляет собой фактор некроза опухоли-альфа (TNF-α). В некоторых вариантах осуществления фактор роста представляет собой фактор роста эндотелия сосудов (VEGF).

D. MicroRNA (miRNA)

[250] MicroRNA (miRNA) представляют собой небольшие некодирующие молекулы РНК (приблизительно 18-22 нуклеотидов), которые отрицательно регулируют экспрессию генов, ингибируя трансляцию или индуцируя деградацию информационной РНК (mRNA). С момента их открытия стало известно, что miRNA участвуют в различных клеточных процессах, в том числе в апоптозе, дифференцировке и пролиферации клеток, и они, как было показано, играют ключевую роль в канцерогенезе. Способность miRNA регулировать экспрессию генов делает экспрессию miRNA in vivo ценным инструментом в генной терапии.

[251] Определенные аспекты настоящего изобретения относятся к плазмидоподобным молекулам нуклеиновой кислоты, содержащим первый ITR, второй ITR и генную кассету, кодирующую miRNA, где первый ITR и/или второй ITR представляют собой ITR, полученные из вируса, отличного от аденоассоциированного вируса (например, первый ITR и/или второй ITR получены из вируса, отличного от AAV). miRNA может представлять собой любую miRNA, известную из уровня техники. В некоторых вариантах осуществления miRNA понижает экспрессию гена-мишени. В определенных вариантах осуществления ген-мишень выбран из SOD1, HTT, RHO или любой их комбинации.

[252] В некоторых вариантах осуществления генная кассета кодирует одну miRNA. В некоторых вариантах осуществления генная кассета кодирует более одной miRNA. В некоторых вариантах осуществления генная кассета кодирует две или более различные miRNA. В некоторых вариантах осуществления генная кассета кодирует две или более копии одной и той же miRNA. В некоторых вариантах осуществления генная кассета кодирует два или более варианта одного и того же терапевтического белка. В определенных вариантах осуществления генная кассета кодирует одну или несколько miRNA и один или несколько терапевтических белков.

[253] В некоторых вариантах осуществления miRNA представляет собой miRNA, встречающуюся в природе. В некоторых вариантах осуществления miRNA представляет собой сконструированную miRNA. В некоторых вариантах осуществления miRNA представляет собой искусственную miRNA. В определенных вариантах осуществления miRNA включает сконструированную miRNA для miHTT, раскрытую в Evers et al., Molecular Therapy 26(9):1-15 (электронная публикация до выхода в печать в июне 2018 г.). В определенных вариантах осуществления miRNA включает в себя искусственную miRNA miR-SOD1, раскрытую в Dirren et al., Annals of Clinical and Translational Neurology 2(2):167-84 (февраль 2015 г.). В определенных вариантах осуществления miRNA включает в себя miR-708, которая нацеливается на RHO (см. Behrman et al., JCB 192(6):919-27 (2011).

[254] В некоторых вариантах осуществления miRNA повышает экспрессию гена путем понижения экспрессии ингибитора гена. В некоторых вариантах осуществления ингибитор представляет собой природный ингибитор, например, ингибитор дикого типа. В некоторых вариантах осуществления ингибитор образуется на мутантном, гетерологичном и/или неправильно экспрессирующемся гене.

E. Гетерологичные компоненты

[255] В некоторых вариантах осуществления молекула нуклеиновой кислоты содержит первый ITR, второй ITR и генную кассету, кодирующую терапевтический белок, где терапевтический белок содержит по меньшей мере один гетерологичный компонент. В некоторых вариантах осуществления гетерологичный компонент слит с N-концом или C-концом терапевтического белка. В других вариантах осуществления гетерологичный компонент вставлен между двумя аминокислотами в терапевтическом белке.

[256] В некоторых вариантах осуществления терапевтический белок содержит полипептид FVIII и гетерологичный компонент, который вставлен между двумя аминокислотами в полипептиде FVIII. В некоторых вариантах осуществления гетерологичный компонент вставлен в полипептид FVIII в одном или нескольких сайтах вставки, выбранных из таблицы 5. В некоторых вариантах осуществления гетерологичная аминокислотная последовательность может быть вставлена в полипептид, представляющий собой фактор свертывания крови, кодируемый молекулой нуклеиновой кислоты по настоящему изобретению, в любом сайте, раскрытом в международной публикации № WO 2013/123457 A1, WO 2015/106052 A1 или публикации заявки на патент США № 2015/0158929 А1, которые включены в данный документ посредством ссылки во всей своей полноте. В одном конкретном варианте осуществления терапевтический белок содержит FVIII и гетерологичный компонент, где гетерологичный компонент вставлен в FVIII непосредственно ниже аминокислоты 745 относительно зрелого FVIII. В одном конкретном варианте осуществления терапевтический белок содержит FVIII и XTEN, где XTEN вставлен в FVIII непосредственно ниже аминокислоты 745 относительно зрелого FVIII. В одном конкретном варианте осуществления FVIII содержит делецию аминокислот 746-1646, соответствующих зрелому FVIII человека (SEQ ID NO:15), и гетерологичный компонент вставлен непосредственно ниже аминокислоты 745, соответствующей зрелому FVIII человека (SEQ ID NO:15).

Таблица 5. Сайты вставки гетерологичного компонента в FVIII

Сайт вставки	Домен	Сайт вставки	Домен	Сайт вставки	Домен
3	A1	375	A2	1749	A3
18	A1	378	A2	1796	A3
22	A1	399	A2	1802	A3
26	A1	403	A2	1827	A3
40	A1	409	A2	1861	A3
60	A1	416	A2	1896	A3
65	A1	442	A2	1900	A3
81	A1	487	A2	1904	A3
116	A1	490	A2	1905	A3
119	A1	494	A2	1910	A3
130	A1	500	A2	1937	A3
188	A1	518	A2	2019	A3
211	A1	599	A2	2068	C1
216	A1	603	A2	2111	C1
220	A1	713	A2	2120	C1
224	A1	745	B	2171	C2
230	A1	1656	Область a3	2188	C2
333	A1	1711	A3	2227	C2
336	A1	1720	A3	2332	CT
339	A1	1725	A3

[257] В некоторых вариантах осуществления терапевтический белок содержит полипептид FIX и гетерологичный компонент, который вставлен между двумя аминокислотами в полипептиде FIX. В некоторых вариантах осуществления гетерологичный компонент вставлен в полипептид FIX в одном или нескольких сайтах вставки, выбранных из таблицы 5. В некоторых вариантах осуществления гетерологичная аминокислотная последовательность может быть вставлена в полипептид, представляющий собой фактор свертывания крови, кодируемый молекулой нуклеиновой кислоты по настоящему изобретению, в любом сайте, раскрытом в международной заявке № PCT/US2017/015879, которая включена в данный документ посредством ссылки во всей своей полноте. В одном конкретном варианте осуществления терапевтический белок содержит полипептид FIX и гетерологичный компонент, где гетерологичный компонент вставлен в полипептид FIX непосредственно ниже аминокислоты 166 относительно зрелого FIX. В одном конкретном варианте осуществления терапевтический белок содержит полипептид FIX и XTEN, где XTEN вставлен в FIX непосредственно ниже аминокислоты 166 относительно зрелого FVIII.

Таблица 6. Сайты вставки гетерологичного компонента в FIX

Сайт вставки	Домен	Сайт вставки	Домен	Сайт вставки	Домен
52	EGF1	149	AP	257	Каталитический
59	EGF1	162	AP	265	Каталитический
66	EGF1	166	AP	277	Каталитический
80	EGF1	174	AP	283	Каталитический
85	EGF2	188	Каталитический	292	Каталитический
89	EGF2	202	Каталитический	316	Каталитический
103	EGF2	224	Каталитический	341	Каталитический
105	EGF2	226	Каталитический	354	Каталитический
113	EGF2	228	Каталитический	392	Каталитический
129	Линкер	230	Каталитический	403	Каталитический
142	Линкер	240	Каталитический	413	Каталитический

[258] В других вариантах осуществления терапевтические белки по настоящему изобретению дополнительно содержат две, три, четыре, пять, шесть, семь или восемь гетерологичных нуклеотидных последовательностей. В некоторых вариантах осуществления все гетерологичные компоненты являются идентичными. В некоторых вариантах осуществления по меньшей мере один гетерологичный компонент отличается от других гетерологичных компонентов. В некоторых вариантах осуществления настоящее изобретение может включать два, три, четыре, пять, шесть или более семи гетерологичных компонентов в тандеме.

[259] В некоторых вариантах осуществления гетерологичный компонент увеличивает период полужизни (является "средством, удлиняющим период полужизни") терапевтического белка.

[260] В некоторых вариантах осуществления гетерологичный компонент представляет собой пептид или полипептид с неструктурными или структурными характеристиками, которые связаны с продлением периода полужизни in vivo при встраивании в белок по настоящему изобретению. Неограничивающие примеры включают альбумин, фрагменты альбумина, Fc-фрагменты иммуноглобулинов, C-концевой пептид (CTP) β-субъединицы хорионического гонадотропина человека, последовательность HAP, последовательность XTEN, трансферрин или его фрагмент, полипептид PAS, полиглициновые линкеры, полисериновые линкеры, альбумин-связывающие компоненты или любые фрагменты, производные, варианты или комбинации этих полипептидов. В одном конкретном варианте осуществления гетерологичная аминокислотная последовательность представляет собой константную область иммуноглобулина или ее часть, трансферрин, альбумин или последовательность PAS. В некоторых аспектах гетерологичный компонент включает в себя фактор фон Виллебранда или его фрагмент. В других связанных аспектах гетерологичный компонент может включать в себя сайт присоединения (например, аминокислоту цистеин) компонента, не являющегося полипептидом, такого как полиэтиленгликоль (PEG), гидроксиэтилкрахмал (HES), полисиаловая кислота или любые производные, варианты или комбинации этих элементов. В некоторых аспектах гетерологичный компонент включает в себя аминокислоту цистеин, которая функционирует как сайт присоединения компонента, не являющегося полипептидом, такого как полиэтиленгликоль (PEG), гидроксиэтилкрахмал (HES), полисиаловая кислота или любые производные, варианты или комбинации этих элементов.

[261] В одном конкретном варианте осуществления первый гетерологичный компонент представляет собой молекулу, удлиняющую период полужизни, которая известна из уровня техники, и второй гетерологичный компонент представляет собой молекулу, удлиняющую период полужизни, которая известна из уровня техники. В определенных вариантах осуществления первый гетерологичный компонент (например, первый Fc-компонент) и второй гетерологичный компонент (например, второй Fc-компонент) связаны друг с другом с образованием димера. В одном варианте осуществления второй гетерологичный компонент представляет собой второй Fc-компонент, где второй Fc-компонент соединен или связан с первым гетерологичным компонентом, например, с первым Fc-компонентом. Например, второй гетерологичный компонент (например, второй Fc-компонент) может быть связан с первым гетерологичным компонентом (например, первым Fc-компонентом) с помощью линкера или связан с первым гетерологичным компонентом ковалентной или нековалентной связью.

[262] В некоторых вариантах осуществления гетерологичный компонент представляет собой полипептид, содержащий по меньшей мере приблизительно 10, по меньшей мере приблизительно 100, по меньшей мере приблизительно 200, по меньшей мере приблизительно 300, по меньшей мере приблизительно 400, по меньшей мере приблизительно 500, по меньшей мере приблизительно 600, по меньшей мере приблизительно 700, по меньшей мере приблизительно 800, по меньшей мере приблизительно 900, по меньшей мере приблизительно 1000, по меньшей мере приблизительно 1100, по меньшей мере приблизительно 1200, по меньшей мере приблизительно 1300, по меньшей мере приблизительно 1400, по меньшей мере приблизительно 1500, по меньшей мере приблизительно 1600, по меньшей мере приблизительно 1700, по меньшей мере приблизительно 1800, по меньшей мере приблизительно 1900, по меньшей мере приблизительно 2000, по меньшей мере приблизительно 2500, по меньшей мере приблизительно 3000 или по меньшей мере приблизительно 4000 аминокислот, состоящий по сути из них или состоящий из них. В других вариантах осуществления гетерологичный компонент представляет собой полипептид, содержащий от приблизительно 100 до приблизительно 200 аминокислот, от приблизительно 200 до приблизительно 300 аминокислот, от приблизительно 300 до приблизительно 400 аминокислот, от приблизительно 400 до приблизительно 500 аминокислот, от приблизительно 500 до приблизительно 600 аминокислот, от приблизительно 600 до приблизительно 700 аминокислот, от приблизительно 700 до приблизительно 800 аминокислот, от приблизительно 800 до приблизительно 900 аминокислот или от приблизительно 900 до приблизительно 1000 аминокислот, состоящий по сути из них или состоящий из них.

[263] В определенных вариантах осуществления гетерологичный компонент улучшает одно или несколько фармакокинетических свойств терапевтического белка без значительного влияния на его биологическую активность или функцию.

[264] В определенных вариантах осуществления гетерологичный компонент увеличивает период полужизни in vivo и/или in vitro терапевтического белка по настоящему изобретению. В других вариантах осуществления гетерологичный компонент способствует визуализации или локализации терапевтического белка по настоящему изобретению или его фрагмента (например, фрагмента, содержащего гетерологичный компонент после протеолитического расщепления белка FVIII). Визуализация и/или локализация терапевтического белка по настоящему изобретению или его фрагмента может выполняться в условиях in vivo, in vitro, ex vivo или в их комбинациях.

[265] В других вариантах осуществления гетерологичный компонент увеличивает стабильность терапевтического белка по настоящему изобретению или его фрагмента (например, фрагмента, содержащего гетерологичный компонент после протеолитического расщепления терапевтического белка, например, фактора свертывания крови). Используемый в данном документе термин "стабильность" относится к принятому в данном области техники показателю, отображающему поддержание одного или нескольких физических свойств терапевтического белка в ответ на условия окружающей среды (например, повышенную или пониженную температуру). В определенных аспектах физическое свойство может представлять собой поддержание ковалентной структуры терапевтического белка (например, отсутствие протеолитического расщепления, нежелательного окисления или дезамидирования). В других аспектах физическое свойство также может представлять собой присутствие терапевтического белка в правильно свернутом состоянии (например, отсутствие растворимых или нерастворимых агрегатов или осадков). В одном аспекте стабильность терапевтического белка измеряют путем анализа биофизического свойства терапевтического белка, например, термостабильности, профиля разворачивания под действием pH, стабильного удаления сайтов гликозилирования, растворимости, биохимической функции (например, способности связываться с белком, рецептором или лигандом) и т. д. и/или их комбинации. В другом аспекте биохимическая функция демонстрируется по аффинности связывания при взаимодействии. В одном аспекте показателем стабильности белка является термостабильность, т. е. устойчивость к тепловой нагрузке. Стабильность можно измерять с применением способов, известных из уровня техники, таких как HPLC (высокоэффективная жидкостная хроматография), SEC (эксклюзионная хроматография), DLS (динамическое рассеяние света) и т. д. Способы измерения термостабильности включают без ограничения дифференциальную сканирующую калориметрию (DSC), дифференциальную сканирующую флуориметрию (DSF), круговой дихроизм (CD) и анализ стабильности при тепловой нагрузке.

[266] В определенных аспектах терапевтический белок, кодируемый молекулой нуклеиновой кислоты по настоящему изобретению, содержит по меньшей мере одно средство, удлиняющее период полужизни, т. е. гетерологичный компонент, который увеличивает период полужизни in vivo терапевтического белка по сравнению с периодом полужизни in vivo соответствующего терапевтического белка, в котором отсутствует такой гетерологичный компонент. Период полужизни терапевтического белка in vivo может быть определен с помощью любых способов, известных специалистам в данной области, например, посредством анализов активности (например, хромогенного анализа или одностадийного анализа свертывания крови с определением aPTT, где терапевтический белок содержит полипептид FVIII), ELISA, ROTEM^® и т. д.

[267] В некоторых вариантах осуществления присутствие одного или нескольких средств, удлиняющих период полужизни, приводит к увеличению периода полужизни терапевтического белка по сравнению с периодом полужизни соответствующего белка, в котором отсутствуют такие одно или несколько средств, удлиняющих период полужизни. Период полужизни терапевтического белка, содержащего средство, удлиняющее период полужизни, является в по меньшей мере приблизительно 1,5 раза, по меньшей мере приблизительно 2 раза, по меньшей мере приблизительно 2,5 раза, по меньшей мере приблизительно 3 раза, по меньшей мере приблизительно 4 раза, по меньшей мере приблизительно 5 раз, по меньшей мере приблизительно 6 раз, по меньшей мере приблизительно 7 раз, по меньшей мере приблизительно 8 раз, по меньшей мере приблизительно 9 раз, по меньшей мере приблизительно 10 раз, по меньшей мере приблизительно 11 раз или по меньшей мере приблизительно 12 раз более длительным, чем период полужизни in vivo соответствующего терапевтического белка, в котором отсутствует такое средство, удлиняющее период полужизни.

[268] В одном варианте осуществления период полужизни терапевтического белка, содержащего средство, удлиняющее период полужизни, является в от приблизительно 1,5 раза до приблизительно 20 раз, от приблизительно 1,5 раза до приблизительно 15 раз или от приблизительно 1,5 раза до приблизительно 10 раз более длительным, чем период полужизни in vivo соответствующего белка, в котором отсутствует такое средство, удлиняющее период полужизни. В другом варианте осуществления период полужизни терапевтического белка, содержащего средство, удлиняющее период полужизни, является удлиненным в от приблизительно 2 раз до приблизительно 10 раз, от приблизительно 2 раз до приблизительно 9 раз, от приблизительно 2 раз до приблизительно 8 раз, от приблизительно 2 раз до приблизительно 7 раз, от приблизительно 2 раз до приблизительно 6 раз, от приблизительно 2 раз до приблизительно 5 раз, от приблизительно 2 раз до приблизительно 4 раз, от приблизительно 2 раз до приблизительно 3 раз, от приблизительно 2,5 раза до приблизительно 10 раз, от приблизительно 2,5 раза до приблизительно 9 раз, от приблизительно 2,5 раза до приблизительно 8 раз, от приблизительно 2,5 раза до приблизительно 7 раз, от приблизительно 2,5 раза до приблизительно 6 раз, от приблизительно 2,5 раза до приблизительно 5 раз, от приблизительно 2,5 раза до приблизительно 4 раз, от приблизительно 2,5 раза до приблизительно 3 раз, от приблизительно 3 раз до приблизительно 10 раз, от приблизительно 3 раз до приблизительно 9 раз, от приблизительно 3 раз до приблизительно 8 раз, от приблизительно 3 раз до приблизительно 7 раз, от приблизительно 3 раз до приблизительно 6 раз, от приблизительно 3 раз до приблизительно 5 раз, от приблизительно 3 раз до приблизительно 4 раз, от приблизительно 4 раз до приблизительно 6 раз, от приблизительно 5 раз до приблизительно 7 раз или от приблизительно 6 раз до приблизительно 8 раз по сравнению с периодом полужизни in vivo соответствующего белка, в котором отсутствует такое средство, удлиняющее период полужизни.

[269] В других вариантах осуществления период полужизни терапевтического белка, содержащего средство, удлиняющее период полужизни, составляет по меньшей мере приблизительно 17 часов, по меньшей мере приблизительно 18 часов, по меньшей мере приблизительно 19 часов, по меньшей мере приблизительно 20 часов, по меньшей мере приблизительно 21 час, по меньшей мере приблизительно 22 часа, по меньшей мере приблизительно 23 часа, по меньшей мере приблизительно 24 часа, по меньшей мере приблизительно 25 часов, по меньшей мере приблизительно 26 часов, по меньшей мере приблизительно 27 часов, по меньшей мере приблизительно 28 часов, по меньшей мере приблизительно 29 часов, по меньшей мере приблизительно 30 часов, по меньшей мере приблизительно 31 час, по меньшей мере приблизительно 32 часа, по меньшей мере приблизительно 33 часа, по меньшей мере приблизительно 34 часа, по меньшей мере приблизительно 35 часов, по меньшей мере приблизительно 36 часов, по меньшей мере приблизительно 48 часов, по меньшей мере приблизительно 60 часов, по меньшей мере приблизительно 72 часа, по меньшей мере приблизительно 84 часа, по меньшей мере приблизительно 96 часов или по меньшей мере приблизительно 108 часов.

[270] В еще нескольких других вариантах осуществления период полужизни терапевтического белка, содержащего средство, удлиняющее период полужизни, составляет от приблизительно 15 часов до приблизительно двух недель, от приблизительно 16 часов до приблизительно одной недели, от приблизительно 17 часов до приблизительно одной недели, от приблизительно 18 часов до приблизительно одной недели, от приблизительно 19 часов до приблизительно одной недели, от приблизительно 20 часов до приблизительно одной недели, от приблизительно 21 часа до приблизительно одной недели, от приблизительно 22 часов до приблизительно одной недели, от приблизительно 23 часов до приблизительно одной недели, от приблизительно 24 часов до приблизительно одной недели, от приблизительно 36 часов до приблизительно одной недели, от приблизительно 48 часов до приблизительно одной недели, от приблизительно 60 часов до приблизительно одной недели, от приблизительно 24 часов до приблизительно шести дней, от приблизительно 24 часов до приблизительно пяти дней, от приблизительно 24 часов до приблизительно четырех дней, от приблизительно 24 часов до приблизительно трех дней или от приблизительно 24 часов до приблизительно двух дней.

[271] В некоторых вариантах осуществления средний период полужизни терапевтического белка, содержащего средство, удлиняющее период полужизни, у субъекта составляет приблизительно 15 часов, приблизительно 16 часов, приблизительно 17 часов, приблизительно 18 часов, приблизительно 19 часов, приблизительно 20 часов, приблизительно 21 час, приблизительно 22 часа, приблизительно 23 часа, приблизительно 24 часа (1 день), приблизительно 25 часов, приблизительно 26 часов, приблизительно 27 часов, приблизительно 28 часов, приблизительно 29 часов, приблизительно 30 часов, приблизительно 31 час, приблизительно 32 часа, приблизительно 33 часа, приблизительно 34 часа, приблизительно 35 часов, приблизительно 36 часов, приблизительно 40 часов, приблизительно 44 часа, приблизительно 48 часов (2 дня), приблизительно 54 часа, приблизительно 60 часов, приблизительно 72 часа (3 дня), приблизительно 84 часа, приблизительно 96 часов (4 дня), приблизительно 108 часов, приблизительно 120 часов (5 дней), приблизительно шесть дней, приблизительно семь дней (одна неделя), приблизительно восемь дней, приблизительно девять дней, приблизительно 10 дней, приблизительно 11 дней, приблизительно 12 дней, приблизительно 13 дней или приблизительно 14 дней.

[272] Одно или несколько средств, удлиняющих период полужизни, могут быть слиты с С-концом или N-концом терапевтического белка или вставлены в терапевтический белок.

1. Константная область иммуноглобулина или ее часть

[273] В другом аспекте гетерологичный компонент содержит одну или несколько константных областей иммуноглобулина или их частей (например, Fc-область). В одном варианте осуществления выделенная молекула нуклеиновой кислоты по настоящему изобретению дополнительно содержит гетерологичную последовательность нуклеиновой кислоты, которая кодирует константную область иммуноглобулина или ее часть. В некоторых вариантах осуществления константная область иммуноглобулина или ее часть представляет собой Fc-область.

[274] Константная область иммуноглобулина состоит из доменов, обозначенных как СН- (константные, тяжелая цепь) домены (СН1, СН2 и т. д.). В зависимости от изотипа (т. е. IgG, IgM, IgA, IgD или IgE) константная область может состоять из трех или четырех доменов СН. Константные области некоторых изотипов (например, IgG) также содержат шарнирную область. См. Janeway et al. 2001, Immunobiology, Garland Publishing, N.Y., N.Y.

[275] Константная область иммуноглобулина или ее часть по настоящему изобретению могут быть получены из ряда различных источников. В одном варианте осуществления константная область иммуноглобулина или ее часть получены из иммуноглобулина человека. Однако, следует понимать, что константная область иммуноглобулина или ее часть могут быть получены из иммуноглобулина другого вида млекопитающего, в том числе, например, вида грызуна (например, мыши, крысы, кролика, морской свинки) или примата, отличного от человека (например, шимпанзе, макака). Кроме того, константная область иммуноглобулина или ее часть могут быть получены из любого класса иммуноглобулинов, в том числе IgM, IgG, IgD, IgA и IgE, и любого изотипа иммуноглобулинов, в том числе IgG1, IgG2, IgG3 и IgG4. В одном варианте осуществления применяют изотип IgG1 человека.

[276] Разнообразные последовательности генов константных областей иммуноглобулинов (например, последовательности генов константных областей человека) доступны в форме общедоступных депонирований. Можно выбрать последовательность домена константной области, обладающую конкретной эффекторной функцией (или не обладающую конкретной эффекторной функцией) или имеющую конкретную модификацию для снижения иммуногенности. Было опубликовано большое количество последовательностей антител и генов, кодирующих антитела, и подходящие последовательности константных областей Ig (например, последовательности шарнирных областей, СН2 и/или СН3 или их части) могут быть получены из этих последовательностей с применением методик, принятых в данной области техники. Генетический материал, полученный с применением любого из вышеуказанных способов, можно затем подвергать изменению или синтезу с получением полипептидов по настоящему изобретению. Дополнительно следует понимать, что объем настоящего изобретения охватывает аллели, варианты и мутации последовательностей ДНК константных областей.

[277] Последовательности константной области иммуноглобулина или ее части могут быть клонированы, например, с применением полимеразной цепной реакции и праймеров, выбранных для амплификации домена, представляющего интерес. Для клонирования константной области иммуноглобулина или ее части из антитела можно выделить мРНК из клеток гибридомы, селезенки или лимфатических клеток, подвергнуть ее обратной транскрипции с образованием ДНК и амплифицировать гены антитела с помощью ПЦР. Способы ПЦР-амплификации подробно описаны в патентах США №№ 4683195; 4683202; 4800159; 4965188 и, например, в "PCR Protocols: A Guide to Methods and Applications" Innis et al. eds., Academic Press, San Diego, CA (1990); Ho et al. 1989. Gene 77:51; Horton et al. 1993. Methods Enzymol. 217:270). ПЦР можно инициировать с помощью консенсусных праймеров для константной области или с помощью более специфичных праймеров на основе опубликованных последовательностей ДНК и аминокислот, соответствующих тяжелым и легким цепям. ПЦР также можно применять для выделения ДНК-клонов, кодирующих легкие и тяжелые цепи антител. В этом случае можно осуществлять скрининг библиотек с помощью консенсусных праймеров или более крупных гомологичных зондов, таких как зонды для константных областей мыши. Из уровня техники известны многочисленные наборы праймеров, подходящие для амплификации генов антител (например, 5’-праймеры на основе N-концевой последовательности очищенных антител (Benhar and Pastan. 1994. Protein Engineering 7:1509); праймеры для быстрой амплификации концов кДНК (Ruberti, F. et al. 1994. J. Immunol. Methods 173:33); праймеры для лидерных последовательностей антител (Larrick et al. 1989 Biochem. Biophys. Res. Commun. 160:1250). Клонирование последовательностей антител дополнительно описано в выданном Newman et al. патенте США № 5658570, заявка на который была подана 25 января 1995 г., который включен в данный документ посредством ссылки.

[278] Используемая в данном документе константная область иммуноглобулина может включать все домены и шарнирную область или их части. В одном варианте константная область иммуноглобулина или ее часть содержат домен СН2, домен СН3 и шарнирную область, т. е. Fc-область или партнера по связыванию FcRn.

[279] Используемый в данном документе термин "Fc-область" определяется как часть полипептида, которая соответствует Fc-области нативного Ig, т. e. образована путем димерной ассоциации соответствующих Fc-доменов двух его тяжелых цепей. Нативная Fc-область образует гомодимер с другой Fc-областью. В отличие от этого, термины "генетически слитая Fc-область" или "одноцепочечная Fc-область" (scFc-область), используемые в данном документе, относятся к синтетической димерной Fc-области, состоящей из Fc-доменов, генетически соединенных в одну полипептидную цепь (т. е. кодируемых одной непрерывной генетической последовательностью). См. международную публикацию № WO 2012/006635, включенную в данный документ посредством ссылки во всей своей полноте.

[280] В одном варианте осуществления "Fc-область" относится к части одной тяжелой цепи Ig, начинающейся в шарнирной области непосредственно выше сайта расщепления папаином (т. е. остатком 216 в IgG, если принять первый остаток константной области тяжелой цепи за 114) и заканчивающейся на С-конце антитела. Соответственно, полная Fc-область содержит по меньшей мере шарнирный домен, CH2-домен и CH3-домен.

[281] Константная область иммуноглобулина или ее часть может быть партнером по связыванию FcRn. FcRn активен в зрелых эпителиальных тканях и экспрессируется в просвете кишечника, легочных дыхательных путях, поверхностях носа, поверхностях влагалища, поверхностях толстой и прямой кишки (патент США № 6485726). Партнер по связыванию FcRn представляет собой часть иммуноглобулина, которая связывается с FcRn.

[282] Рецептор FcRn был выделен у некоторых видов млекопитающих, в том числе у людей. Известны последовательности FcRn человека, FcRn обезьяны, FcRn крысы и FcRn мыши (Story et al. 1994, J. Exp. Med. 180:2377). Рецептор FcRn связывает IgG (но не иммуноглобулины из других классов, таких как IgA, IgM, IgD и IgE) при относительно низком значении pH, осуществляет активный транспорт IgG через клетки по направлению от просвета к серозной оболочке, а затем высвобождает IgG при относительно более высоком значении pH, обнаруживаемом в интерстициальных жидкостях. Он экспрессируется в зрелой эпителиальной ткани (патенты США №№ 6485726, 6030613, 6086875; WO 03/077834; US2003-0235536A1), в том числе в эпителии легких и кишечника (Israel et al. 1997, Immunology 92:69), эпителии почечных проксимальных канальцев (Kobayashi et al. 2002, Am. J. Physiol. Renal Physiol. 282: F358), а также эпителии полости носа, на поверхностях влагалища и поверхностях билиарного дерева.

[283] Партнеры по связыванию FcRn, применимые в настоящем изобретении, охватывают молекулы, которые могут специфично связываться с рецептором FcRn, в том числе целый IgG, Fc-фрагмент IgG и другие фрагменты, которые включают в себя полную связывающую область для рецептора FcRn. Область Fc-части IgG, которая связывается с рецептором FcRn, была описана с использованием рентгеноструктурной кристаллографии (Burmeister et al. 1994, Nature 372:379). Основная область контакта Fc с FcRn находится вблизи стыка доменов CH2 и CH3. Все области контакта Fc-FcRn находятся в пределах одной тяжелой цепи Ig. Партнеры по связыванию FcRn включают целый IgG, Fc-фрагмент IgG и другие фрагменты IgG, которые включают в себя полную связывающую область для FcRn. Основные сайты контакта включают аминокислотные остатки 248, 250-257, 272, 285, 288, 290-291, 308-311 и 314 из домена CH2 и аминокислотные остатки 385-387, 428 и 433-436 из домена CH3. Все из ссылок на нумерацию аминокислот иммуноглобулинов или фрагментов или областей иммуноглобулинов приводятся согласно Kabat et al. 1991, Sequences of Proteins of Immunological Interest, U.S. Department of Public Health, Bethesda, Md.

[284] Fc-области или партнеры по связыванию FcRn, связанные с FcRn, могут эффективно переноситься через эпителиальные барьеры с помощью FcRn с обеспечением таким образом неинвазивного способа системного введения желаемой терапевтической молекулы. Кроме того, слитые белки, содержащие Fc-область или партнера по связыванию FcRn, подвергаются эндоцитозу клетками, экспрессирующими FcRn. Но вместо маркировки для деградации эти слитые белки снова возвращаются в кровоток, что, таким образом, увеличивает период полужизни этих белков in vivo. В определенных вариантах осуществления части константных областей иммуноглобулина представляют собой Fc-область или партнера по связыванию FcRn, который обычно связывается посредством дисульфидных связей и других неспецифических взаимодействий с другой Fc-областью или другим партнером по связыванию FcRn с образованием димеров и мультимеров более высокого порядка.

[285] Два рецептора FcRn могут связывать одну молекулу Fc. Кристаллографические данные позволяют предположить, что каждая молекула FcRn связывает один полипептид гомодимера Fc. В одном варианте осуществления связывание партнера по связыванию FcRn, например, Fc-фрагмента IgG, с биологически активной молекулой обеспечивает способ доставки биологически активной молекулы пероральным, трансбуккальным, сублингвальным, ректальным, вагинальным путем, в виде аэрозоля, вводимого назально или посредством легочного пути, или посредством глазного пути. В другом варианте осуществления белок, представляющий собой фактор свертывания крови, можно вводить инвазивным способом, например, подкожным, внутривенным путем.

[286] Область партнера по связыванию FcRn представляет собой молекулу или ее часть, которая может специфично связываться с рецептором FcRn с последующим активным транспортом Fc-области с помощью рецептора FcRn. "Специфично связывающийся" относится к двум молекулам, образующим комплекс, который является относительно стабильным при физиологических условиях. Специфичное связывание характеризуется высокой аффинностью и емкостью от низкой до умеренной, в отличие от неспецифичного связывания, которое обычно характеризуется низкой аффинностью и емкостью от умеренной до высокой. Как правило, связывание считается специфичным, если константа аффинности KA превышает 10⁶ M^-1 или превышает 10⁸ M^-1. При необходимости неспецифичное связывание можно снизить без существенного влияния на специфичное связывание путем изменения условий связывания. Соответствующие условия связывания, такие как концентрация молекул, ионная сила раствора, температура, допустимое время связывания, концентрация блокирующего средства (например, сывороточного альбумина, казеина молока) и т. д., могут быть оптимизированы специалистом в данной области с применением обычных методик.

[287] В определенных вариантах осуществления терапевтический белок, кодируемый молекулой нуклеиновой кислоты согласно настоящему изобретению, содержит одну или несколько усеченных Fc-областей, которые, тем не менее, являются достаточными для придания Fc-области свойств связывания с Fc-рецептором (FcR). Например, часть Fc-области, которая связывается с FcRn (т. e. FcRn-связывающая часть), содержит приблизительно аминокислоты 282-438 из IgG1 согласно нумерации EU (при этом основными сайтами контакта являются аминокислоты 248, 250-257, 272, 285, 288, 290-291, 308-311 и 314 из CH2-домена и аминокислотные остатки 385-387, 428 и 433-436 из CH3-домена). Таким образом, Fc-область согласно настоящему изобретению может содержать FcRn-связывающую часть или состоять из нее. FcRn-связывающие части могут быть получены из тяжелых цепей любого изотипа, в том числе IgG1, IgG2, IgG3 и IgG4. В одном варианте осуществления применяют FcRn-связывающую часть из антитела изотипа IgG1 человека. В другом варианте осуществления применяют FcRn-связывающую часть из антитела изотипа IgG4 человека.

[288] Fc-область может быть получена из ряда различных источников. В одном варианте осуществления Fc-область полипептида получена из иммуноглобулина человека. Однако, следует понимать, что Fc-компонент может быть получен из иммуноглобулина другого вида млекопитающего, в том числе, например, вида грызуна (например, мыши, крысы, кролика, морской свинки) или примата, отличного от человека (например, шимпанзе, макака). Более того, полипептидные Fc-домены или их части могут быть получены из любого класса иммуноглобулинов, в том числе IgM, IgG, IgD, IgA и IgE, и любого изотипа иммуноглобулинов, в том числе IgG1, IgG2, IgG3 и IgG4. В другом варианте осуществления применяют изотип IgG1 человека.

[289] В определенных вариантах осуществления вариант Fc обеспечивает изменение по меньшей мере одной эффекторной функции, придаваемой Fc-компонентом, содержащим указанный Fc-домен дикого типа (например, улучшение или снижение способности Fc-области к связыванию с Fc-рецепторами (например, FcγRI, FcγRII или FcγRIII) или белками системы комплемента (например, C1q) или к запуску антителозависимой цитотоксичности (ADCC), фагоцитоза или комплементзависимой цитотоксичности (CDCC)). В других вариантах осуществления в варианте Fc представлен сконструированный цистеиновый остаток.

[290] В качестве Fc-области по настоящему изобретению можно использовать известные из уровня техники варианты Fc, которые, как известно, придают изменение (например, усиление или снижение) эффекторной функции и/или связывания FcR или FcRn. В частности, Fc-область по настоящему изобретению может содержать, например, изменение (например, замену) в одном или нескольких аминокислотных положениях, раскрытых в международных публикациях согласно PCT WO88/07089A1, WO96/14339A1, WO98/05787A1, WO98/23289A1, WO99/51642A1, WO99/58572A1, WO00/09560A2, WO00/32767A1, WO00/42072A2, WO02/44215A2, WO02/060919A2, WO03/074569A2, WO04/016750A2, WO04/029207A2, WO04/035752A2, WO04/063351A2, WO04/074455A2, WO04/099249A2, WO05/040217A2, WO04/044859, WO05/070963A1, WO05/077981A2, WO05/092925A2, WO05/123780A2, WO06/019447A1, WO06/047350A2 и WO06/085967A2; публикациях заявок на патент США №№ US2007/0231329, US2007/0231329, US2007/0237765, US2007/0237766, US2007/0237767, US2007/0243188, US20070248603, US20070286859, US20080057056 или патентах США №№ 5648260; 5739277; 5834250; 5869046; 6096871; 6121022; 6194551; 6242195; 6277375; 6528624; 6538124; 6737056; 6821505; 6998253; 7083784; 7404956 и 7317091, каждый из которых включен в данный документ посредством ссылки. В одном варианте осуществления конкретное изменение (например, конкретная замена одной или нескольких аминокислот, раскрытых в уровне техники) может быть осуществлено в одном или нескольких раскрытых аминокислотных положениях. В другом варианте осуществления может быть осуществлено другое изменение в одном или нескольких раскрытых аминокислотных положениях (например, другая замена в одном или нескольких аминокислотных положениях, раскрытых в уровне техники).

[291] Fc-область IgG или его партнер по связыванию FcRn могут быть модифицированы в соответствии с хорошо известными процедурами, такими как сайт-направленный мутагенез и т. п., с получением модифицированных IgG или Fc-фрагментов или их частей, которые будут связываться с FcRn. Такие модификации включают модификации в отдалении от сайтов контакта с FcRn, а также модификации в пределах сайтов контакта, которые обеспечивают сохранение или даже усиление связывания с FcRn. Например, следующие отдельные аминокислотные остатки в Fc IgG1 человека (Fcγ1) могут быть заменены без значительной потери аффинности связывания Fc в отношении FcRn: P238A, S239A, K246A, K248A, D249A, M252A, T256A, E258A, T260A, D265A, S267A, H268A, E269A, D270A, E272A, L274A, N276A, Y278A, D280A, V282A, E283A, H285A, N286A, T289A, K290A, R292A, E293A, E294A, Q295A, Y296F, N297A, S298A, Y300F, R301A, V303A, V305A, T307A, L309A, Q311A, D312A, N315A, K317A, E318A, K320A, K322A, S324A, K326A, A327Q, P329A, A330Q, P331A, E333A, K334A, T335A, S337A, K338A, K340A, Q342A, R344A, E345A, Q347A, R355A, E356A, M358A, T359A, K360A, N361A, Q362A, Y373A, S375A, D376A, A378Q, E380A, E382A, S383A, N384A, Q386A, E388A, N389A, N390A, Y391F, K392A, L398A, S400A, D401A, D413A, K414A, R416A, Q418A, Q419A, N421A, V422A, S424A, E430A, N434A, T437A, Q438A, K439A, S440A, S444A, и K447A, где, например, P238A представляет пролин дикого типа, замененный аланином в положении под номером 238. В качестве примера, конкретный вариант осуществления включает мутацию N297A, обеспечивающую удаление высококонсервативного сайта N-гликозилирования. Аминокислоты дикого типа в положениях, указанных выше, могут быть заменены, в дополнение к аланину, другими аминокислотами. Мутации могут быть введены в Fc по отдельности, что приводит к образованию более ста Fc-областей, отличных от нативного Fc. Кроме того, комбинации из двух, трех или более из этих отдельных мутаций могут быть введены вместе, что приводит к образованию еще нескольких сотен Fc-областей.

[292] Определенные из вышеуказанных мутаций могут придавать новое функциональное свойство Fc-области или партнеру по связыванию FcRn. Например, один вариант осуществления включает N297A, обеспечивающую удаление высококонсервативного сайта N-гликозилирования. Эффект этой мутации заключается в снижении иммуногенности, за счет чего увеличивается период полужизни Fc-области в кровотоке, и обеспечении отсутствия у Fc-области способности к связыванию с FcγRI, FcγRIIA, FcγRIIB и FcγRIIIA без нарушения аффинности в отношении FcRn (Routledge et al. 1995, Transplantation 60:847; Friend et al. 1999, Transplantation 68:1632; Shields et al. 1995, J. Biol. Chem. 276:6591). В качестве дополнительного примера нового функционального свойства, возникающего в результате вышеописанных мутаций, аффинность в отношении FcRn в некоторых случаях может увеличиваться, превышая таковую у дикого типа. Эту увеличенную аффинность могут отражать увеличенная скорость ассоциации, сниженная скорость диссоциации или как увеличенная скорость ассоциации, так и сниженная скорость диссоциации. Примеры мутаций, которые, как полагают, придают увеличенную аффинность в отношении FcRn, включают без ограничения T256A, T307A, E380A и N434A (Shields et al. 2001, J. Biol. Chem. 276:6591).

[293] Кроме того, по меньшей мере три Fc-гамма-рецептора человека, по-видимому, распознают сайт связывания в IgG в нижней шарнирной области, обычно аминокислоты 234-237. Следовательно, другой пример нового функционального свойства и потенциальной сниженной иммуногенности может возникать в результате мутаций в этой области, как, например, путем замещения аминокислот 233-236 "ELLG" IgG1 человека (SEQ ID NO: 45) соответствующей последовательностью "PVA" из IgG2 (с одной аминокислотной делецией). Было показано, что FcγRI, FcγRII, и FcγRIII, которые опосредуют различные эффекторные функции, не будут связываться с IgG1 при введении таких мутаций. Ward and Ghetie 1995, Therapeutic Immunology 2:77, и Armour et al. 1999, Eur. J. Immunol. 29:2613.

[294] В другом варианте осуществления константная область иммуноглобулина или ее часть содержит аминокислотную последовательность в шарнирной области или ее части, которая образует одну или несколько дисульфидных связей со второй константной областью иммуноглобулина или ее частью. Вторая константная область иммуноглобулина или ее часть может быть связана со вторым полипептидом с объединением терапевтического белка и второго полипептида. В некоторых вариантах осуществления второй полипептид представляет собой энхансерный компонент. Используемый в данном документе термин "энхансерный компонент" относится к молекуле, ее фрагменту или компоненту полипептида, которые способны усиливать активность терапевтического белка. Энхансерный компонент может представлять собой кофактор, как, например, в случае, когда терапевтический белок представляет собой фактор свертывания крови, растворимый тканевой фактор (sTF) или прокоагулянтный пептид. Таким образом, после активации фактора свертывания крови энхансерный компонент доступен для усиления активности фактора свертывания крови.

[295] В определенных вариантах осуществления терапевтический белок, кодируемый молекулой нуклеиновой кислоты по настоящему изобретению, содержит аминокислотную замену в константной области иммуноглобулина или ее части (например, варианты Fc), обеспечивающую изменение антигеннезависимых эффекторных функций константной области Ig, в частности периода полужизни белка в кровотоке.

2. scFc-области

[296] В другом аспекте гетерологичный компонент содержит scFc-область (одноцепочечный Fc). В одном варианте осуществления выделенная молекула нуклеиновой кислоты по настоящему изобретению дополнительно содержит гетерологичную последовательность нуклеиновой кислоты, которая кодирует scFc-область. scFc-область содержит по меньшей мере две константные области иммуноглобулина или их части (например, Fc-компоненты или домены (например, 2, 3, 4, 5, 6 или более Fc-компонентов или доменов)) в одной и той же линейной полипептидной цепи, которая способна к сворачиванию (например, внутримолекулярному или межмолекулярному сворачиванию) с образованием одной функциональной scFc-области, связанной воедино пептидным линкером для Fc. Например, в одном варианте осуществления полипептид по настоящему изобретению способен связываться посредством его scFc-области с по меньшей мере одним Fc-рецептором (например, FcRn, рецептором FcγR (например, FcγRIII) или белком системы комплемента (например, C1q)) для улучшения периода полужизни, или запуска иммунной эффекторной функции (например, антителозависимой цитотоксичности (ADCC), фагоцитоза или комплементзависимой цитотоксичности (CDCC)), и/или для улучшения технологичности.

3. CTP

[297] В другом аспекте гетерологичный компонент содержит один C-концевой пептид (CTP) β-субъединицы хорионического гонадотропина человека или его фрагмент, вариант или производное. Известно, что один или несколько CTP-пептидов, вставленных в рекомбинантный белок, увеличивают период полужизни in vivo этого белка. См., например, патент США № 5712122, включенный в данный документ посредством ссылки во всей своей полноте.

[298] Иллюстративные CTP-пептиды включают DPRFQDSSSSKAPPPSLPSPSRLPGPSDTPIL (SEQ ID NO: 33) или SSSSKAPPPSLPSPSRLPGPSDTPILPQ (SEQ ID NO: 34). См., например, публикацию заявки на патент США № US 2009/0087411 A1, включенную посредством ссылки.

4. Последовательность XTEN

[299] В некоторых вариантах осуществления гетерологичный компонент содержит одну или несколько последовательностей XTEN, их фрагментов, вариантов или производных. Как используется в данном документе, "последовательность XTEN" относится к полипептидам увеличенной длины с не встречающимися в природе по сути неповторяющимися последовательностями, которые состоят в основном из небольших гидрофильных аминокислот, при этом последовательность характеризуется низкой степенью образования или отсутствием вторичной или третичной структуры при физиологических условиях. Являясь гетерологичным компонентом, XTEN могут служить в качестве компонента, удлиняющего период полужизни. Кроме того, XTEN может обеспечивать желаемые свойства, в том числе без ограничения улучшенные фармакокинетические параметры и характеристики растворимости.

[300] Встраивание гетерологичного компонента, содержащего последовательность XTEN, в белок по настоящему изобретению может придавать белку одно или несколько из следующих преимущественных свойств: конформационную гибкость, повышенную растворимость в воде, высокую степень устойчивости к протеазам, низкую иммуногенность, низкую степень связывания с рецепторами млекопитающих или увеличенные значения гидродинамического радиуса (или радиуса Стокса).

[301] В некоторых аспектах последовательность XTEN может обеспечивать увеличение фармакокинетических свойств, как, например, увеличение длительности периода полужизни in vivo или увеличение площади под кривой (AUC), так что белок по настоящему изобретению сохраняется in vivo и обладает прокоагулянтной активностью в течение увеличенного периода времени по сравнению с таким же белком, но без гетерологичного компонента XTEN.

[302] В некоторых вариантах осуществления последовательность XTEN, применимая в настоящем изобретении, представляет собой пептид или полипептид, содержащий более чем приблизительно 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1200, 1400, 1600, 1800, или 2000 аминокислотных остатков. В определенных вариантах осуществления XTEN представляет собой пептид или полипептид, содержащий более чем от приблизительно 20 до приблизительно 3000 аминокислотных остатков, более чем от 30 до приблизительно 2500 остатков, более чем от 40 до приблизительно 2000 остатков, более чем от 50 до приблизительно 1500 остатков, более чем от 60 до приблизительно 1000 остатков, более чем от 70 до приблизительно 900 остатков, более чем от 80 до приблизительно 800 остатков, более чем от 90 до приблизительно 700 остатков, более чем от 100 до приблизительно 600 остатков, более чем от 110 до приблизительно 500 остатков или более чем от 120 до приблизительно 400 остатков. В одном конкретном варианте осуществления XTEN содержит аминокислотную последовательность длиной более 42 аминокислот и менее 144 аминокислот.

[303] Последовательность XTEN по настоящему изобретению может содержать один или несколько мотивов последовательности из 5-14 (например, от 9 до 14) аминокислотных остатков или аминокислотную последовательность, на по меньшей мере 80%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99% идентичную мотиву последовательности, где мотив содержит 4-6 типов аминокислот (например, 5 аминокислот), выбранных из группы, состоящей из глицина (G), аланина (A), серина (S), треонина (T), глутамата (E) и пролина (P), состоит по сути из них или состоит из них. См. US 2010-0239554 A1.

[304] В некоторых вариантах осуществления XTEN содержит неперекрывающиеся мотивы последовательностей, в которых приблизительно 80%, или по меньшей мере приблизительно 85%, или по меньшей мере приблизительно 90%, или приблизительно 91%, или приблизительно 92%, или приблизительно 93%, или приблизительно 94%, или приблизительно 95%, или приблизительно 96%, или приблизительно 97%, или приблизительно 98%, или приблизительно 99%, или приблизительно 100% последовательности состоит из нескольких звеньев неперекрывающихся последовательностей, выбранных из одного семейства мотивов, выбранного из таблицы 7, что в результате дает последовательность, характерную для определенного семейства. Используемый в данном документе термин "семейство" означает, что XTEN содержит мотивы, выбранные только из одной категории мотивов из таблицы 7, т. е. XTEN на основе AD, AE, AF, AG, AM, AQ, BC или BD, и что любые другие аминокислоты в XTEN, не относящиеся к мотиву из семейства, выбраны для достижения необходимого свойства, как, например, для обеспечения встраивания сайта рестрикции рядом с кодирующими нуклеотидами, встраивания последовательности для расщепления или для достижения лучшего связывания с терапевтическим белком. В некоторых вариантах осуществления семейств XTEN последовательность XTEN содержит несколько звеньев неперекрывающихся мотивов последовательностей из семейства мотивов AD, или семейства мотивов AE, или семейства мотивов AF, или семейства мотивов AG, или семейства мотивов AM, или семейства мотивов AQ, или семейства BC, или семейства BD, в результате чего XTEN демонстрирует диапазон гомологии, описанный выше. В других вариантах осуществления XTEN содержит несколько звеньев последовательностей мотивов из двух или более семейств мотивов из таблицы 7. Эти последовательности могут быть выбраны для достижения необходимых физических/химических характеристик, в том числе таких свойств, как суммарный заряд, гидрофильность, отсутствие вторичной структуры или отсутствие повторяемости, которые определяются аминокислотным составом мотивов, которые более полно описаны ниже. В вариантах осуществления, описанных выше в данном абзаце данного документа, мотивы, встраиваемые в XTEN, могут быть отобраны и собраны с применением способов, описанных в данном документе, для получения XTEN из от приблизительно 36 до приблизительно 3000 аминокислотных остатков.

Таблица 7. Мотивы последовательностей XTEN из 12 аминокислот и семейства мотивов

Семейство мотива*	ПОСЛЕДОВАТЕЛЬНОСТЬ МОТИВА	SEQ ID NO:
AD	GESPGGSSGSES	73
AD	GSEGSSGPGESS	74
AD	GSSESGSSEGGP	75
AD	GSGGEPSESGSS	76
AE, AM	GSPAGSPTSTEE	77
AE, AM, AQ	GSEPATSGSETP	78
AE, AM, AQ	GTSESATPESGP	79
AE, AM, AQ	GTSTEPSEGSAP	80
AF, AM	GSTSESPSGTAP	81
AF, AM	GTSTPESGSASP	82
AF, AM	GTSPSGESSTAP	83
AF, AM	GSTSSTAESPGP	84
AG, AM	GTPGSGTASSSP	85
AG, AM	GSSTPSGATGSP	86
AG, AM	GSSPSASTGTGP	87
AG, AM	GASPGTSSTGSP	88
AQ	GEPAGSPTSTSE	89
AQ	GTGEPSSTPASE	90
AQ	GSGPSTESAPTE	91
AQ	GSETPSGPSETA	92
AQ	GPSETSTSEPGA	93
AQ	GSPSEPTEGTSA	94
BC	GSGASEPTSTEP	95
BC	GSEPATSGTEPS	96
BC	GTSEPSTSEPGA	97
BC	GTSTEPSEPGSA	98
BD	GSTAGSETSTEA	99
BD	GSETATSGSETA	100
BD	GTSESATSESGA	101
BD	GTSTEASEGSAS	102

* Обозначает отдельные последовательности мотивов, которые при совместном применении в различных перестановках дают в результате "последовательность, характерную для определенного семейства".

[305] Примеры последовательностей XTEN, которые можно применять в качестве гетерологичных компонентов в терапевтических белках по настоящему изобретению, раскрыты, например, в публикациях заявок на патент США №№ 2010/0239554 A1, 2010/0323956 A1, 2011/0046060 A1, 2011/0046061 A1, 2011/0077199 A1 или 2011/0172146 A1 или публикациях международных заявок на патент №№ WO 2010091122 A1, WO 2010144502 A2, WO 2010144508 A1, WO 2011028228 A1, WO 2011028229 A1 или WO 2011028344 A2, каждая из которых включена в данный документ посредством ссылки во всей своей полноте.

[306] XTEN может иметь различную длину в случае вставки в терапевтический белок или связывания с ним. В одном варианте осуществления длину последовательности(последовательностей) XTEN выбирают с учетом свойства или функции, которые должны быть достигнуты в слитом белке. В зависимости от предполагаемого свойства или функции XTEN может представлять собой короткую последовательность или последовательность средней длины или более длинную последовательность, которые могут служить в качестве носителей. В определенных вариантах осуществления XTEN включает короткие сегменты из от приблизительно 6 до приблизительно 99 аминокислотных остатков, сегменты средней длины из от приблизительно 100 до приблизительно 399 аминокислотных остатков и более длинные сегменты из от приблизительно 400 до приблизительно 1000 и не более чем приблизительно 3000 аминокислотных остатков. Таким образом, XTEN, вставленный в терапевтический белок или связанный с ним, может иметь длину, составляющую приблизительно 6, приблизительно 12, приблизительно 36, приблизительно 40, приблизительно 42, приблизительно 72, приблизительно 96, приблизительно 144, приблизительно 288, приблизительно 400, приблизительно 500, приблизительно 576, приблизительно 600, приблизительно 700, приблизительно 800, приблизительно 864, приблизительно 900, приблизительно 1000, приблизительно 1500, приблизительно 2000, приблизительно 2500 или не более чем приблизительно 3000 аминокислотных остатков. В других вариантах осуществления длина последовательностей XTEN составляет от приблизительно 6 до приблизительно 50, от приблизительно 50 до приблизительно 100, от приблизительно 100 до 150, от приблизительно 150 до 250, от приблизительно 250 до 400, от приблизительно 400 до приблизительно 500, от приблизительно 500 до приблизительно 900, от приблизительно 900 до 1500, от приблизительно 1500 до 2000 или от приблизительно 2000 до приблизительно 3000 аминокислотных остатков. Точная длина XTEN, вставленного в терапевтический белок или связанного с ним, может варьироваться, при этом не оказывая отрицательного влияния на активность терапевтического белка. В одном варианте осуществления один или несколько из XTEN, применяемых в данном документе, имеют длину 42 аминокислоты, 72 аминокислоты, 144 аминокислоты, 288 аминокислот, 576 аминокислот или 864 аминокислоты и могут быть выбраны из одной или нескольких последовательностей, характерных для определенного семейства XTEN, т. е. AD, AE, AF, AG, AM, AQ, BC или BD.

[307] В некоторых вариантах осуществления терапевтический белок содержит полипептид FVIII и XTEN, где XTEN содержит 288 аминокислот. В одном варианте осуществления терапевтический белок содержит полипептид FVIII и XTEN, где XTEN содержит 288 аминокислот, и XTEN вставлен в домен B полипептида FVIII. В одном конкретном варианте осуществления терапевтический белок содержит полипептид FVIII и XTEN, содержащий SEQ ID NO:109, и XTEN вставлен в домен B полипептида FVIII. В одном конкретном варианте осуществления терапевтический белок содержит полипептид FVIII и XTEN, содержащий SEQ ID NO:109, и XTEN вставлен в полипептид FVIII непосредственно ниже аминокислоты 745 зрелого FVIII.

[308] В некоторых вариантах осуществления терапевтический белок содержит полипептид FIX и XTEN, где XTEN содержит 72 аминокислоты. В одном варианте осуществления терапевтический белок содержит полипептид FIX и XTEN, где XTEN содержит 72 аминокислоты, и XTEN вставлен в полипептид FIX непосредственно ниже аминокислоты 166 зрелого FIX.

[309] В некоторых вариантах осуществления последовательность XTEN, применяемая в настоящем изобретении, является на по меньшей мере 60%, 70%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, или 100% идентичной последовательности, выбранной из группы, состоящей из AE42, AG42, AE48, AM48, AE72, AG72, AE108, AG108, AE144, AF144, AG144, AE180, AG180, AE216, AG216, AE252, AG252, AE288, AG288, AE324, AG324, AE360, AG360, AE396, AG396, AE432, AG432, AE468, AG468, AE504, AG504, AF504, AE540, AG540, AF540, AD576, AE576, AF576, AG576, AE612, AG612, AE624, AE648, AG648, AG684, AE720, AG720, AE756, AG756, AE792, AG792, AE828, AG828, AD836, AE864, AF864, AG864, AM875, AE912, AM923, AM1318, BC864, BD864, AE948, AE1044, AE1140, AE1236, AE1332, AE1428, AE1524, AE1620, AE1716, AE1812, AE1908, AE2004A, AG948, AG1044, AG1140, AG1236, AG1332, AG1428, AG1524, AG1620, AG1716, AG1812, AG1908, AG2004, и любой их комбинации. См. US 2010-0239554 A1. В одном конкретном варианте осуществления XTEN содержит AE42, AE72, AE144, AE288, AE576, AE864, AG 42, AG72, AG144, AG288, AG576, AG864, или любую их комбинацию.

[310] Иллюстративные последовательности XTEN, которые можно применять в качестве гетерологичных компонентов в терапевтическом белке по настоящему изобретению, включают XTEN AE42-4 (SEQ ID NO: 46, кодируемую SEQ ID NO: 47), XTEN AE144-2A (SEQ ID NO: 48, кодируемую SEQ ID NO: 49), XTEN AE144-3B (SEQ ID NO: 50, кодируемую SEQ ID NO: 51), XTEN AE144-4A (SEQ ID NO: 52, кодируемую SEQ ID NO: 53), XTEN AE144-5A (SEQ ID NO: 54, кодируемую SEQ ID NO: 55), XTEN AE144-6B (SEQ ID NO: 56, кодируемую SEQ ID NO: 57), XTEN AG144-1 (SEQ ID NO: 58, кодируемую SEQ ID NO: 59), XTEN AG144-A (SEQ ID NO: 60, кодируемую SEQ ID NO: 61), XTEN AG144-B (SEQ ID NO: 62, кодируемую SEQ ID NO: 63), XTEN AG144-C (SEQ ID NO: 64, кодируемую SEQ ID NO: 65), а также XTEN AG144-F (SEQ ID NO: 66, кодируемую SEQ ID NO: 67). В одном конкретном варианте осуществления XTEN кодируется SEQ ID NO:18.

[311] В другом варианте осуществления последовательность XTEN выбрана из группы, состоящей из AE36 (SEQ ID NO: 130), AE42 (SEQ ID NO: 131), AE72 (SEQ ID NO: 132), AE78 (SEQ ID NO: 133), AE144 (SEQ ID NO: 134), AE144_2A (SEQ ID NO: 48), AE144_3B (SEQ ID NO: 50), AE144_4A (SEQ ID NO: 52), AE144_5A (SEQ ID NO: 54), AE144_6B (SEQ ID NO: 135), AG144 (SEQ ID NO: 136), AG144_A (SEQ ID NO: 137), AG144_B (SEQ ID NO: 62), AG144_C (SEQ ID NO: 64), AG144_F (SEQ ID NO: 66), AE288 (SEQ ID NO: 138), AE288_2 (SEQ ID NO: 139), AG288 (SEQ ID NO: 140), AE576 (SEQ ID NO: 141), AG576 (SEQ ID NO: 142), AE864 (SEQ ID NO: 143), AG864 (SEQ ID NO: 144), XTEN_AE72_2A_1 (SEQ ID NO:145), XTEN_AE72_2A_2 (SEQ ID NO: 146), XTEN_AE72_3B_1 (SEQ ID NO: 147), XTEN_AE72_3B_2 (SEQ ID NO: 148), XTEN_AE72_4A_2 (SEQ ID NO: 149), XTEN_AE72_5A_2 (SEQ ID NO: 150), XTEN_AE72_6B_1 (SEQ ID NO: 151), XTEN_AE72_6B_2 (SEQ ID NO: 152), XTEN_AE72_1A_1 (SEQ ID NO: 153), XTEN_AE72_1A_2 (SEQ ID NO: 154), XTEN_AE144_1A (SEQ ID NO: 155), AE150 (SEQ ID NO: 156), AG150 (SEQ ID NO: 157), AE294 (SEQ ID NO: 158), AG294 (SEQ ID NO: 159), и любых их комбинаций. В конкретном варианте осуществления последовательность XTEN выбрана из группы, состоящей из AE72, AE144 и AE288. Аминокислотные последовательности для определенных последовательностей XTEN по настоящему изобретению показаны в таблице 8.

Таблица 8. Последовательности XTEN

XTEN	Аминокислотная последовательность
AE42-4 (SEQ ID NO: 46)	GAPGSPAGSPTSTEEGTSESATPESGPGSEPATSGSETPASS
AE144-2A (SEQ ID NO: 48)	TSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGTSTEPSEGSAPGTSESATPESGPGSEPATSGSETPGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGTSESATPESGPG
A144-3B (SEQ ID NO: 50)	SPAGSPTSTEEGTSESATPESGPGSEPATSGSETPGTSESATPESGPGTSTEPSEGSAPGTSTEPSEGSAPGTSTEPSEGSAPGTSTEPSEGSAPGTSTEPSEGSAPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPG
AE144-4A (SEQ ID NO: 52)	TSESATPESGPGSEPATSGSETPGTSESATPESGPGSEPATSGSETPGTSESATPESGPGTSTEPSEGSAPGTSESATPESGPGSPAGSPTSTEEGSPAGSPTSTEEGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPG
AE144-5A (SEQ ID NO: 54)	TSESATPESGPGSEPATSGSETPGTSESATPESGPGSEPATSGSETPGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSESATPESGPGSEPATSGSETPGTSESATPESGPGSPAGSPTSTEEGSPAGSPTSTEEG
AE144-6B (SEQ ID NO: 56)	TSTEPSEGSAPGTSESATPESGPGTSESATPESGPGTSESATPESGPGSEPATSGSETPGSEPATSGSETPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGSAPGSEPATSGSETPGTSESATPESGPGTSTEPSEGSAPG
AG144-1 (SEQ ID NO: 58)	PGSSPSASTGTGPGSSPSASTGTGPGTPGSGTASSSPGSSTPSGATGSPGSSPSASTGTGPGASPGTSSTGSPGTPGSGTASSSPGSSTPSGATGSPGTPGSGTASSSPGASPGTSSTGSPGASPGTSSTGSPGTPGSGTASSS
AG144-A (SEQ ID NO: 60)	GASPGTSSTGSPGSSPSASTGTGPGSSPSASTGTGPGTPGSGTASSSPGSSTPSGATGSPGSSPSASTGTGPGASPGTSSTGSPGTPGSGTASSSPGSSTPSGATGSPGTPGSGTASSSPGASPGTSSTGSPGASPGTSSTGSP
AG144-B (SEQ ID NO: 62)	GTPGSGTASSSPGSSTPSGATGSPGASPGTSSTGSPGTPGSGTASSSPGSSTPSGATGSPGSSPSASTGTGPGSSPSASTGTGPGSSTPSGATGSPGSSTPSGATGSPGASPGTSSTGSPGASPGTSSTGSPGASPGTSSTGSP
AG144-C (SEQ ID NO: 64)	GTPGSGTASSSPGASPGTSSTGSPGASPGTSSTGSPGASPGTSSTGSPGSSPSASTGTGPGTPGSGTASSSPGASPGTSSTGSPGASPGTSSTGSPGASPGTSSTGSPGSSTPSGATGSPGSSTPSGATGSPGASPGTSSTGSP
XTEN AG144-F (SEQ ID NO: 66)	GSSPSASTGTGPGSSPSASTGTGPGASPGTSSTGSPGASPGTSSTGSPGSSTPSGATGSPGSSPSASTGTGPGASPGTSSTGSPGSSPSASTGTGPGTPGSGTASSSPGSSTPSGATGSPGSSTPSGATGSPGASPGTSSTGSP
AE36 (SEQ ID NO: 130)	GSPAGSPTSTEEGTSESATPESGPGSEPATSGSETP
AE42 (SEQ ID NO: 131)	GAPGSPAGSPTSTEEGTSESATPESGPGSEPATSGSETPASS
AE72 (SEQ ID NO: 132)	GAPTSESATPESGPGSEPATSGSETPGTSESATPESGPGSEPATSGSETPGTSESATPESGPGTSTEPSEGSAPGASS
AE78 (SEQ ID NO: 133)	GAPTSESATPESGPGSEPATSGSETPGTSESATPESGPGSEPATSGSETPGTSESATPESGPGTSTEPSEGSAPGASS
AE144 (SEQ ID NO: 134)	GSEPATSGSETPGTSESATPESGPGSEPATSGSETPGSPAGSPTSTEEGTSTEPSEGSAPGSEPATSGSETPGSEPATSGSETPGSEPATSGSETPGTSTEPSEGSAPGTSESAPESGPGSEPATSGSETPGTSTEPSEGSAP
AE144_6B (SEQ ID NO: 135)	TSTEPSEGSAPGTSESATPESGPGTSESATPESGPGTSESATPESGPGSEPATSGSETPGSEPATSGSETPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGSAPGSEPATSGSETPGTSESATPESGPGTSTEPSEGSAPG
AG144 (SEQ ID NO:136)	GTPGSGTASSSPGSSTPSGATGSPGSSPSASTGTGPGSSPSASTGTGPGASPGTSSTGSPGASPGTSSTGSPGSSTPSGATGSPGSSPSASTGTGPGASPGTSSTGSPGSSPSASTGTGPGTPGSGTASSSPGSSTPSGATGSP
AG144_A (SEQ ID NO: 137)	GASPGTSSTGSPGSSPSASTGTGPGSSPSASTGTGPGTPGSGTASSSPGSSTPSGATGSPGSSPSASTGTGPGASPGTSSTGSPGTPGSGTASSSPGSSTPSGATGSPGTPGSGTASSSPGASPGTSSTGSPGASPGTSSTGSP
AE288 (SEQ ID NO: 138)	GTSESATPESGPGSEPATSGSETPGTSESATPESGPGSEPATSGSETPGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSESATPESGPGSEPATSGSETPGTSESATPESGPGSPAGSPTSTEEGSPAGSPTSTEEGTSTEPSEGSAPGTSESATPESGPGTSESATPESGPGTSESATPESGPGSEPATSGSETPGSEPATSGSETPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGSAPGSEPATSGSETPGTSESATPESGPGTSTEPSEGSAP
AE288_2 (SEQ ID NO: 139)	GSPAGSPTSTEEGTSESATPESGPGSEPATSGSETPGTSESATPESGPGTSTEPSEGSAPGTSTEPSEGSAPGTSTEPSEGSAPGTSTEPSEGSAPGTSTEPSEGSAPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSESATPESGPGSEPATSGSETPGTSESATPESGPGSEPATSGSETPGTSESATPESGPGTSTEPSEGSAPGTSESATPESGPGSPAGSPTSTEEGSPAGSPTSTEEGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAP
AG288 (SEQ ID NO: 140)	PGASPGTSSTGSPGASPGTSSTGSPGTPGSGTASSSPGSSTPSGATGSPGTPGSGTASSSPGSSTPSGATGSPGTPGSGTASSSPGSSTPSGATGSPGSSTPSGATGSPGSSPSASTGTGPGSSPSASTGTGPGASPGTSSTGSPGTPGSGTASSSPGSSTPSGATGSPGSSPSASTGTGPGSSPSASTGTGPGASPGTSSTGSPGASPGTSSTGSPGSSTPSGATGSPGSSPSASTGTGPGASPGTSSTGSPGSSPSASTGTGPGTPGSGTASSSPGSSTPSGATGS
AE576 (SEQ ID NO: 141)	GSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGSEPATSGSETPGSEPATSGSETPGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGTSTEPSEGSAPGTSESATPESGPGSEPATSGSETPGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGTSESATPESGPGSPAGSPTSTEEGTSESATPESGPGSEPATSGSETPGTSESATPESGPGTSTEPSEGSAPGTSTEPSEGSAPGTSTEPSEGSAPGTSTEPSEGSAPGTSTEPSEGSAPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSESATPESGPGSEPATSGSETPGTSESATPESGPGSEPATSGSETPGTSESATPESGPGTSTEPSEGSAPGTSESATPESGPGSPAGSPTSTEEGSPAGSPTSTEEGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAP
AG576 (SEQ ID NO: 142)	PGTPGSGTASSSPGSSTPSGATGSPGSSPSASTGTGPGSSPSASTGTGPGSSTPSGATGSPGSSTPSGATGSPGASPGTSSTGSPGASPGTSSTGSPGASPGTSSTGSPGTPGSGTASSSPGASPGTSSTGSPGASPGTSSTGSPGASPGTSSTGSPGSSPSASTGTGPGTPGSGTASSSPGASPGTSSTGSPGASPGTSSTGSPGASPGTSSTGSPGSSTPSGATGSPGSSTPSGATGSPGASPGTSSTGSPGTPGSGTASSSPGSSTPSGATGSPGSSTPSGATGSPGSSTPSGATGSPGSSPSASTGTGPGASPGTSSTGSPGASPGTSSTGSPGTPGSGTASSSPGASPGTSSTGSPGASPGTSSTGSPGASPGTSSTGSPGASPGTSSTGSPGTPGSGTASSSPGSSTPSGATGSPGTPGSGTASSSPGSSTPSGATGSPGTPGSGTASSSPGSSTPSGATGSPGSSTPSGATGSPGSSPSASTGTGPGSSPSASTGTGPGASPGTSSTGSPGTPGSGTASSSPGSSTPSGATGSPGSSPSASTGTGPGSSPSASTGTGPGASPGTSSTGS
AE864 (SEQ ID NO: 143)	GSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGSEPATSGSETPGSEPATSGSETPGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGTSTEPSEGSAPGTSESATPESGPGSEPATSGSETPGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGTSESATPESGPGSPAGSPTSTEEGTSESATPESGPGSEPATSGSETPGTSESATPESGPGTSTEPSEGSAPGTSTEPSEGSAPGTSTEPSEGSAPGTSTEPSEGSAPGTSTEPSEGSAPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSESATPESGPGSEPATSGSETPGTSESATPESGPGSEPATSGSETPGTSESATPESGPGTSTEPSEGSAPGTSESATPESGPGSPAGSPTSTEEGSPAGSPTSTEEGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGTSESATPESGPGSEPATSGSETPGTSESATPESGPGSEPATSGSETPGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSESATPESGPGSEPATSGSETPGTSESATPESGPGSPAGSPTSTEEGSPAGSPTSTEEGTSTEPSEGSAPGTSESATPESGPGTSESATPESGPGTSESATPESGPGSEPATSGSETPGSEPATSGSETPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGSAPGSEPATSGSETPGTSESATPESGPGTSTEPSEGSAP
AG864 (SEQ ID NO: 144)	GASPGTSSTGSPGSSPSASTGTGPGSSPSASTGTGPGTPGSGTASSSPGSSTPSGATGSPGSSPSASTGTGPGASPGTSSTGSPGTPGSGTASSSPGSSTPSGATGSPGTPGSGTASSSPGASPGTSSTGSPGASPGTSSTGSPGTPGSGTASSSPGSSTPSGATGSPGASPGTSSTGSPGTPGSGTASSSPGSSTPSGATGSPGSSPSASTGTGPGSSPSASTGTGPGSSTPSGATGSPGSSTPSGATGSPGASPGTSSTGSPGASPGTSSTGSPGASPGTSSTGSPGTPGSGTASSSPGASPGTSSTGSPGASPGTSSTGSPGASPGTSSTGSPGSSPSASTGTGPGTPGSGTASSSPGASPGTSSTGSPGASPGTSSTGSPGASPGTSSTGSPGSSTPSGATGSPGSSTPSGATGSPGASPGTSSTGSPGTPGSGTASSSPGSSTPSGATGSPGSSTPSGATGSPGSSTPSGATGSPGSSPSASTGTGPGASPGTSSTGSPGASPGTSSTGSPGTPGSGTASSSPGASPGTSSTGSPGASPGTSSTGSPGASPGTSSTGSPGASPGTSSTGSPGTPGSGTASSSPGSSTPSGATGSPGTPGSGTASSSPGSSTPSGATGSPGTPGSGTASSSPGSSTPSGATGSPGSSTPSGATGSPGSSPSASTGTGPGSSPSASTGTGPGASPGTSSTGSPGTPGSGTASSSPGSSTPSGATGSPGSSPSASTGTGPGSSPSASTGTGPGASPGTSSTGSPGASPGTSSTGSPGSSTPSGATGSPGSSPSASTGTGPGASPGTSSTGSPGSSPSASTGTGPGTPGSGTASSSPGSSTPSGATGSPGSSTPSGATGSPGASPGTSSTGSP
XTEN_AE72_2A_1 (SEQ ID NO: 145)	TSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGTSTEPSEGSAPG
XTEN_AE72_2A_2 (SEQ ID NO: 146)	TSESATPESGPGSEPATSGSETPGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGTSESATPESGPG
XTEN_AE72_3B_1 (SEQ ID NO:147)	SPAGSPTSTEEGTSESATPESGPGSEPATSGSETPGTSESATPESGPGTSTEPSEGSAPGTSTEPSEGSAPG
XTEN_AE72_3B_2 (SEQ ID NO: 148)	TSTEPSEGSAPGTSTEPSEGSAPGTSTEPSEGSAPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPG
XTEN_AE72_4A_2 (SEQ ID NO: 149)	TSESATPESGPGSPAGSPTSTEEGSPAGSPTSTEEGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPG
XTEN_AE72_5A_2 (SEQ ID NO: 150)	SPAGSPTSTEEGTSESATPESGPGSEPATSGSETPGTSESATPESGPGSPAGSPTSTEEGSPAGSPTSTEEG
XTEN_AE72_6B_1 (SEQ ID NO: 151)	TSTEPSEGSAPGTSESATPESGPGTSESATPESGPGTSESATPESGPGSEPATSGSETPGSEPATSGSETPG
XTEN_AE72_6B_2 (SEQ ID NO: 152)	SPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGSAPGSEPATSGSETPGTSESATPESGPGTSTEPSEGSAPG
XTEN_AE72_1A_1 (SEQ ID NO: 153)	SPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGSAPG
XTEN_AE72_1A_2 (SEQ ID NO: 154)	TSESATPESGPGSEPATSGSETPGSEPATSGSETPGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPG
XTEN_AE144_1A (SEQ ID NO: 155)	SPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGSEPATSGSETPGSEPATSGSETPGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPG
AE150 (SEQ ID NO: 156)	GAPGSEPATSGSETPGTSESATPESGPGSEPATSGSETPGSPAGSPTSTEEGTSTEPSEGSAPGSEPATSGSETPGSEPATSGSETPGSEPATSGSETPGTSTEPSEGSAPGTSESATPESGPGSEPATSGSETPGTSTEPSEGSAPASS
G150 (SEQ ID NO: 157)	GAPGTPGSGTASSSPGSSTPSGATGSPGSSPSASTGTGPGSSPSASTGTGPGASPGTSSTGSPGASPGTSSTGSPGSSTPSGATGSPGSSPSASTGTGPGASPGTSSTGSPGSSPSASTGTGPGTPGSGTASSSPGSSTPSGATGSPASS
AE294 (SEQ ID NO: 158)	GAPGTSESATPESGPGSEPATSGSETPGTSESATPESGPGSEPATSGSETPGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSESATPESGPGSEPATSGSETPGTSESATPESGPGSPAGSPTSTEEGSPAGSPTSTEEGTSTEPSEGSAPGTSESATPESGPGTSESATPESGPGTSESATPESGPGSEPATSGSETPGSEPATSGSETPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGSAPGSEPATSGSETPGTSESATPESGPGTSTEPSEGSAPASS
AG294 (SEQ ID NO: 159)	GAPPGASPGTSSTGSPGASPGTSSTGSPGTPGSGTASSSPGSSTPSGATGSPGTPGSGTASSSPGSSTPSGATGSPGTPGSGTASSSPGSSTPSGATGSPGSSTPSGATGSPGSSPSASTGTGPGSSPSASTGTGPGASPGTSSTGSPGTPGSGTASSSPGSSTPSGATGSPGSSPSASTGTGPGSSPSASTGTGPGASPGTSSTGSPGASPGTSSTGSPGSSTPSGATGSPGSSPSASTGTGPGASPGTSSTGSPGSSPSASTGTGPGTPGSGTASSSPGSSTPSGATGSASS

[312] В некоторых вариантах осуществления менее 100% аминокислот XTEN выбраны из глицина (G), аланина (A), серина (S), треонина (T), глутамата (E) и пролина (P) или менее чем 100% последовательности состоит из мотивов последовательностей из таблицы 7 или последовательностей XTEN, представленных в данном документе. В таких вариантах осуществления остальные аминокислотные остатки XTEN выбраны из любых других 14 природных L-аминокислот, но могут быть предпочтительно выбраны из гидрофильных аминокислот, так чтобы последовательность XTEN содержала по меньшей мере приблизительно 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или по меньшей мере приблизительно 99% гидрофильных аминокислот. Содержание гидрофобных аминокислот в XTEN, используемом в конструкциях, получаемых путем конъюгации, может представлять собой содержание гидрофобных аминокислот, составляющее менее 5%, или менее 2%, или менее 1%. Гидрофобные остатки, которые являются менее предпочтительными при конструировании XTEN, включают триптофан, фенилаланин, тирозин, лейцин, изолейцин, валин и метионин. Кроме того, последовательности XTEN могут содержать менее 5%, или менее 4%, или менее 3%, или менее 2%, или менее 1%, или ни одной из следующих аминокислот: метионина (например, во избежание окисления) или аспарагина и глутамина (во избежание дезамидирования).

[313] Одна или несколько последовательностей XTEN могут быть вставлены на С-конце или на N-конце терапевтического белка или вставлены между двумя аминокислотами в аминокислотной последовательности терапевтического белка. Например, если терапевтический белок содержит полипептид FVIII, XTEN может быть вставлен между двумя аминокислотами в одном или нескольких сайтах вставки, выбранных из таблицы 5. Если терапевтический белок содержит полипептид FIX, XTEN может быть вставлен между двумя аминокислотами в одном или нескольких сайтах вставки, выбранных из таблицы 5.

[314] Дополнительные примеры последовательностей XTEN, которые можно применять согласно настоящему изобретению, раскрыты в публикациях заявок на патент США №№ 2010/0239554 A1, 2010/0323956 A1, 2011/0046060 A1, 2011/0046061 A1, 2011/0077199 A1 или 2011/0172146 A1 или международных заявках на патент №№ WO 2010091122 A1, WO 2010144502 A2, WO 2010144508 A1, WO 2011028228 A1, WO 2011028229 A1, WO 2011028344 A2, WO 2014/011819 A2 или WO 2015/023891.

5. Альбумин или его фрагмент, производное или его вариант

[315] В некоторых вариантах осуществления гетерологичный компонент включает в себя альбумин или его функциональный фрагмент. Сывороточный альбумин человека (HSA или HA), белок из 609 аминокислот в своей полноразмерной форме, отвечает за значительную долю осмотического давления сыворотки крови, а также выполняет функцию носителя эндогенных и экзогенных лигандов. Термин "альбумин", используемый в данном документе, включает полноразмерный альбумин или его функциональный фрагмент, вариант, производное или аналог. Примеры альбумина или его фрагментов или вариантов раскрыты в публикациях заявок на патент США №№ 2008/0194481A1, 2008/0004206 A1, 2008/0161243 A1, 2008/0261877 A1 или 2008/0153751 A1 или в публикациях заявок согласно PCT №№ 2008/033413 A2, 2009/058322 A1 или 2007/021494 A2, которые включены в данный документ посредством ссылки во всей своей полноте.

[316] В одном варианте осуществления терапевтический белок по настоящему изобретению содержит альбумин, его фрагмент или вариант, который дополнительно связан со вторым гетерологичным компонентом, выбранным из группы, состоящей из константной области иммуноглобулина или ее части (например, Fc-области), последовательности PAS, HES, PEG и любой их комбинации.

6. Альбумин-связывающий компонент

[317] В определенных вариантах осуществления гетерологичный компонент представляет собой альбумин-связывающий компонент, который включает в себя альбумин-связывающий пептид, бактериальный альбумин-связывающий домен, фрагмент альбумин-связывающего антитела или любые их комбинации.

[318] Например, альбумин-связывающий белок может представлять собой бактериальный альбумин-связывающий белок, антитело или фрагмент антитела, в том числе доменные антитела (см. патент США № 6696245). Альбумин-связывающий белок, например, может представлять собой бактериальный альбумин-связывающий домен, такой как домен стрептококкового белка G (Konig, T. and Skerra, A. (1998) J. Immunol. Methods 218, 73-83). Другими примерами альбумин-связывающих пептидов, которые можно применять в качестве партнера по конъюгации, являются, например, пептиды, имеющие консенсусную последовательность Cys-Xaa₁-Xaa₂-Xaa₃-Xaa₄-Cys, где Xaa₁ представляет собой Asp, Asn, Ser, Thr или Trp; Xaa₂ представляет собой Asn, Gln, His, Ile, Leu или Lys; Xaa₃ представляет собой Ala, Asp, Phe, Trp или Tyr; и Xaa₄ представляет собой Asp, Gly, Leu, Phe, Ser или Thr, как описано в заявке на патент США 2003/0069395 или у Dennis et al. (Dennis et al. (2002) J. Biol. Chem. 277, 35035-35043).

[319] Домен 3 из стрептококкового белка G, раскрытого в Kraulis et al., FEBS Lett. 378:190-194 (1996) и Linhult et al., Protein Sci. 11:206-213 (2002), является примером бактериального альбумин-связывающего домена. Примеры альбумин-связывающих пептидов включают ряд пептидов, содержащих сердцевинную последовательность DICLPRWGCLW (SEQ ID NO: 35). См., например, Dennis et al., J. Biol. Chem. 2002, 277: 35035-35043 (2002). Примеры фрагментов альбумин-связывающих антител раскрыты в Muller and Kontermann, Curr. Opin. Mol. Ther. 9:319-326 (2007); Roovers et al., Cancer Immunol. Immunother. 56:303-317 (2007), и Holt et al., Prot. Eng. Design Sci., 21:283-288 (2008), которые включены в данный документ посредством ссылки во всей своей полноте. Примером такого альбумин-связывающего компонента является 2-(3-малеимидопропанамидо)-6-(4-(4-йодфенил)бутанамидо)гексаноат (метка "Albu"), раскрытый в Trussel et al., Bioconjugate Chem. 20:2286-2292 (2009).

[320] Жирные кислоты, в частности длинноцепочечные жирные кислоты (LCFA) и альбумин-связывающие соединения, подобные длинноцепочечным жирным кислотам, могут применяться для удлинения периода полужизни in vivo белков, представляющих собой факторы свертывания крови, по настоящему изобретению. Примером LCFA-подобного альбумин-связывающего соединения является 16-(1-(3-(9-(((2,5-диоксопирролидин-1-илокси)карбонилокси)метил)-7-сульфо-9H-флуорен-2-иламино)-3-оксопропил)-2,5-диоксопирролидин-3-илтио)гексадекановая кислота (см., например, WO 2010/140148).

7. Последовательность PAS

[321] В других вариантах осуществления гетерологичный компонент представляет собой последовательность PAS. Последовательность PAS, как используется в данном документе, означают аминокислотную последовательность, содержащую в основном аланиновые и сериновые остатки или содержащую в основном аланиновые, сериновые и пролиновые остатки, при этом аминокислотная последовательность образует случайную спиральную конформацию при физиологических условиях. Соответственно, последовательность PAS представляет собой структурный блок, полимер из аминокислот или последовательность-кассету, которые содержат аланин, серин и пролин, состоят по сути из них или состоят из них, которые можно применять в качестве части гетерологичного компонента в химерном белке. Тем не менее, специалист в данной области знает, что полимер из аминокислот также может образовывать случайную спиральную конформацию при добавлении в последовательность PAS остатков, отличных от аланина, серина и пролина, в качестве дополнительного составляющего. Используемый в данном документе термин "дополнительное составляющее" означает, что аминокислоты, отличные от аланина, серина и пролина, могут быть добавлены в последовательность PAS в определенной мере, например, в количестве не более чем приблизительно 12%, т. е. приблизительно 12 из 100 аминокислот последовательности PAS, не более чем приблизительно 10%, т. е. приблизительно 10 из 100 аминокислот последовательности PAS, не более чем приблизительно 9%, т. е. приблизительно 9 из 100 аминокислот, не более чем приблизительно 8%, т. е. приблизительно 8 из 100 аминокислот, приблизительно 6%, т. е. приблизительно 6 из 100 аминокислот, приблизительно 5%, т. е. приблизительно 5 из 100 аминокислот, приблизительно 4%, т. е. приблизительно 4 из 100 аминокислот, приблизительно 3%, т. е. приблизительно 3 из 100 аминокислот, приблизительно 2%, т. е. приблизительно 2 из 100 аминокислот, приблизительно 1%, т. е. приблизительно 1 из 100 аминокислот. Аминокислоты, отличные от аланина, серина и пролина, могут быть выбраны из группы, состоящей из Arg, Asn, Asp, Cys, Gln, Glu, Gly, His, Ile, Leu, Lys, Met, Phe, Thr, Trp, Tyr и Val.

[322] При физиологических условиях отрезок последовательности PAS образует случайную спиральную конформацию и тем самым может опосредовать увеличение стабильности in vivo и/или in vitro у белка, представляющего собой фактор свертывания крови. Поскольку домен со случайной спиральной конформацией не принимает стабильную структуру или функцию сам по себе, биологическая активность, опосредованная белком, представляющим собой фактор свертывания крови, по существу сохраняется. В других вариантах осуществления последовательности PAS, которые образуют домен со случайной спиральной конформацией, являются биологически инертными, особенно в отношении протеолиза в плазме крови, иммуногенности, изоэлектрической точки/электростатического поведения, связывания с рецепторами клеточной поверхности или интернализации, но по-прежнему являются биоразлагаемыми, что обеспечивает явные преимущества по сравнению с синтетическими полимерами, такими как PEG.

[323] Неограничивающие примеры последовательностей PAS, образующих случайную спиральную конформацию, включают аминокислотную последовательность, выбранную из группы, состоящей из ASPAAPAPASPAAPAPSAPA (SEQ ID NO: 36), AAPASPAPAAPSAPAPAAPS (SEQ ID NO: 37), APSSPSPSAPSSPSPASPSS (SEQ ID NO: 38), APSSPSPSAPSSPSPASPS (SEQ ID NO: 39), SSPSAPSPSSPASPSPSSPA (SEQ ID NO: 40), AASPAAPSAPPAAASPAAPSAPPA (SEQ ID NO: 41), ASAAAPAAASAAASAPSAAA (SEQ ID NO: 42) и любых их комбинаций. Дополнительные примеры последовательностей PAS известны, например, из публикации заявки на патент США № 2010/0292130 A1 и публикации заявки согласно PCT № WO 2008/155134 A1.

8. Последовательность HAP

[324] В определенных вариантах осуществления гетерологичный компонент представляет собой богатый глицином гомополимер из аминокислот (HAP). Последовательность HAP может содержать последовательность из повторяющихся остатков глицина, которая имеет длину по меньшей мере 50 аминокислот, по меньшей мере 100 аминокислот, 120 аминокислот, 140 аминокислот, 160 аминокислот, 180 аминокислот, 200 аминокислот, 250 аминокислот, 300 аминокислот, 350 аминокислот, 400 аминокислот, 450 аминокислот или 500 аминокислот. В одном варианте осуществления последовательность HAP способна обеспечивать удлинение периода полужизни компонента, слитого или связанного с последовательностью HAP. Неограничивающие примеры последовательности HAP включают без ограничения (Gly)_n, (Gly₄Ser)_n или S(Gly₄Ser)_n, где n равняется 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, или 20. В одном варианте осуществления n равняется 20, 21, 22, 23, 24, 25, 26, 26, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, или 40. В другом варианте осуществления n равняется 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, или 200.

9. Трансферрин или его фрагмент

[325] В определенных вариантах осуществления гетерологичный компонент представляет собой трансферрин или его фрагмент. Можно применять любой трансферрин для получения белков, представляющих собой факторы свертывания крови, по настоящему изобретению. В качестве примера, TF человека дикого типа (TF) представляет собой белок из 679 аминокислот размером примерно 75 кДа (без учета гликозилирования) с двумя основными доменами N (приблизительно 330 аминокислот) и C (приблизительно 340 аминокислот), которые, по-видимому, образуются в результате дупликации гена. См. номера доступа в GenBank NM001063, XM002793, M12530, XM039845, XM 039847 и S95936 (www.ncbi.nlm.nih.gov/), все из которых включены в данный документ посредством ссылки во всей своей полноте. Трансферрин содержит два домена: N-домен и C-домен. N-домен содержит два субдомена N1-домен и N2-домен, а C-домен содержит два субдомена C1-домен и C2-домен.

[326] В одном варианте осуществления гетерологичный компонент трансферрин включает в себя сплайс-вариант трансферрина. В одном примере сплайс-вариант трансферрина может представлять собой сплайс-вариант трансферрина человека, например, с номером доступа в Genbank AAA61140. В другом варианте осуществления часть химерного белка, представляющая собой трансферрин, включает в себя один или несколько доменов последовательности трансферрина, например, N-домен, C-домен, N1-домен, N2-домен, C1-домен, C2-домен или любые их комбинации.

10. Рецепторы, опосредующие выведение

[327] В определенных вариантах осуществления гетерологичный компонент представляет собой рецептор, опосредующий выведение, его фрагмент, вариант или производное. LRP1 представляет собой интегральный мембранный белок размером 600 кДа, который участвует в рецептор-опосредованном выведении различных белков, таких как фактор X. См., например, Narita et al., Blood 91:555-560 (1998).

11. Фактор фон Виллебранда или его фрагменты

[328] В определенных вариантах осуществления гетерологичный компонент представляет собой фактор фон Виллебранда (VWF) или один или несколько его фрагментов.

[329] VWF (также известный как F8VWF) представляет собой крупный мультимерный гликопротеин, присутствующий в плазме крови и продуцируемый конститутивно в эндотелии (в тельцах Вайбеля-Паладе), мегакариоцитах (α-гранулах тромбоцитов) и субэндотелиальной соединительной ткани. Основным мономером VWF является белок из 2813 аминокислот. Каждый мономер содержит ряд специфических доменов с конкретной функцией - домены D' и D3 (которые связываются с фактором VIII), домен A1 (который связывается с тромбоцитарным рецептором GPIb, гепарином и/или, возможно, коллагеном), домен A3 (который связывается с коллагеном), домен C1 (в котором домен RGD связывается с тромбоцитарным интегрином αIIbβ3, когда он активирован) и домен "цистеиновый узел" на C-конце белка (который является общим для VWF и тромбоцитарного фактора роста (PDGF), трансформирующего фактора роста β (TGFβ) и β-субъединицы хорионического гонадотропина человека (βHCG)).

[330] Последовательность мономерного VWF человека из 2813 аминокислот приведена в Genbank под номером доступа NP000543.2. Нуклеотидная последовательность, кодирующая VWF человека, приведена в Genbank под номером доступа NM000552.3. SEQ ID NO: 129 представляет собой аминокислотную последовательность, кодируемую SEQ ID NO: 128. Домен D’ включает аминокислоты с 764 по 866 SEQ ID NO: 129. Домен D3 включает аминокислоты с 867 по 1240 SEQ ID NO: 44.

[331] В плазме крови 95-98% FVIII циркулирует в виде плотного нековалентного комплекса с полноразмерным VWF. Образование этого комплекса важно для поддержания надлежащих уровней FVIIII в плазме крови in vivo. Lenting et al., Blood. 92(11): 3983-96 (1998); Lenting et al., J. Thromb. Haemost. 5(7): 1353-60 (2007). При активации FVIII вследствие протеолиза в положениях 372 и 740 в тяжелой цепи и в положении 1689 в легкой цепи VWF, связанный с FVIII, удаляется от активированного FVIII.

[332] В определенных вариантах осуществления гетерологичный компонент представляет собой полноразмерный фактор фон Виллебранда. В других вариантах осуществления гетерологичный фрагмент представляет собой фрагмент фактора фон Виллебранда. Используемый в данном документе термин "фрагмент VWF" или "фрагменты VWF" означает любые фрагменты VWF, которые взаимодействуют с FVIII и сохраняют по меньшей мере одно или несколько свойств, которые обычно обеспечиваются у FVIII благодаря полноразмерному VWF, например, предотвращение преждевременной активации до FVIIIa, предотвращение преждевременного протеолиза, предотвращение ассоциации с фосфолипидными мембранами, которая может привести к преждевременному выведению, предотвращение связывания с рецепторами, опосредующими выведение FVIII, которые могут связываться с "голым" FVIII, но не с FVIII, связанным с VWF, и/или стабилизацию взаимодействий тяжелой цепи и легкой цепи FVIII. В конкретном варианте осуществления гетерологичный компонент представляет собой фрагмент (VWF), содержащий домен D’ и домен D3 VWF. Фрагмент VWF, содержащий домен D’ и домен D3, может дополнительно содержать домен VWF, выбранный из группы, состоящей из домена A1, домена A2, домена A3, домена D1, домена D2, домена D4, домена B1, домена B2, домена B3, домена C1, домена C2, домена CK, одного или нескольких их фрагментов и любых их комбинаций. Дополнительные примеры полипептида, характеризующегося активностью FVIII, слитого с фрагментом VWF, раскрыты в предварительной заявке на патент США № 61/667901, поданной 3 июля 2012 г., и публикации заявки на патент США № 2015/0023959 А1, обе из которых включены в данный документ посредством ссылки во всей своей полноте.

12. Линкерные компоненты

[333] В определенных вариантах осуществления гетерологичный компонент представляет собой пептидный линкер.

[334] Используемые в данном документе термины "пептидные линкеры" или "линкерные компоненты" относятся к пептидной или полипептидной последовательности (например, синтетической пептидной или полипептидной последовательности), которая соединяет два домена в виде линейной аминокислотной последовательности полипептидной цепи.

[335] В некоторых вариантах осуществления пептидные линкеры могут быть вставлены между терапевтическим белком по настоящему изобретению и гетерологичным компонентом, описанным выше, таким как альбумин. Пептидные линкеры могут обеспечивать гибкость для молекулы химерного полипептида. Обычно линкеры не расщепляются, однако такое расщепление может быть желательным. В одном варианте осуществления эти линкеры не удаляются во время обработки.

[336] Тип линкера, который может присутствовать в химерном белке по настоящему изобретению, представляет собой линкер, расщепляемый протеазами, который содержит сайт расщепления (т. е. субстрат с сайтом расщепления протеазами, например, фактор XIa, Xa или сайт расщепления тромбином) и который может содержать дополнительные линкеры с N-концевой, с С-концевой либо с обеих сторон от сайта расщепления. Эти расщепляемые линкеры при встраивании в конструкцию по настоящему изобретению дают в результате химерную молекулу, имеющую гетерологичный сайт расщепления.

[337] В одном варианте осуществления терапевтический белок, кодируемый молекулой нуклеиновой кислоты по настоящему изобретению, содержит два или более Fc-домена или компонента, связанных с помощью cscFc-линкера с образованием Fc-области, содержащейся в одной полипептидной цепи. cscFc-линкер фланкирован по меньшей мере одним сайтом внутриклеточного процессинга, т. е. сайтом, расщепляемым внутриклеточным ферментом. Расщепление полипептида в по меньшей мере одном сайте внутриклеточного процессинга приводит к образованию полипептида, который содержит по меньшей мере две полипептидные цепи.

[338] В конструкции по настоящему изобретению необязательно могут применяться другие пептидные линкеры, например, для соединения белка, представляющего собой фактор свертывания крови, с Fc-областью. Некоторые иллюстративные линкеры, которые можно применять в связи с настоящим изобретением, включают, например, полипептиды, содержащие аминокислоты GlySer, более подробно описанные ниже.

[339] В одном варианте осуществления пептидный линкер является синтетическим, т. е. не встречающимся в природе. В одном варианте осуществления пептидный линкер включает в себя пептиды (или полипептиды) (которые могут быть встречающимися или не встречающимися в природе), которые содержат аминокислотную последовательность, которая обеспечивает связывание или генетическое слияние первой линейной последовательности аминокислот и второй линейной последовательности аминокислот, с которой она в естественных условиях не связана или генетически не слита в природе. Например, в одном варианте осуществления пептидный линкер может содержать не встречающиеся в природе полипептиды, которые являются модифицированными формами встречающихся в природе полипептидов (например, содержащие мутацию, такую как добавление, замена или делеция). В другом варианте осуществления пептидный линкер может содержать не встречающиеся в природе аминокислоты. В другом варианте осуществления пептидный линкер может содержать встречающиеся в природе аминокислоты, представленные в виде линейной последовательности, которая не встречается в природе. В еще одном варианте осуществления пептидный линкер может содержать встречающуюся в природе полипептидную последовательность.

[340] Например, в определенных вариантах осуществления пептидный линкер можно применять для слияния идентичных Fc-компонентов с образованием таким образом гомодимерной scFc-области. В других вариантах осуществления пептидный линкер можно применять для слияния различных Fc-компонентов (например, Fc-компонента дикого типа и варианта Fc-фрагмента) с образованием таким образом гетеродимерной scFc-области.

[341] В другом варианте осуществления пептидный линкер содержит линкер Gly-Ser или состоит из него. В одном варианте осуществления scFc или cscFc-линкер содержит по меньшей мере часть шарнирной области иммуноглобулина и линкер Gly-Ser. Используемый в данном документе термин "линкер Gly-Ser" относится к пептиду, который состоит из глициновых и сериновых остатков. В определенных вариантах осуществления указанный линкер Gly-Ser может быть вставлен между двумя другими последовательностями пептидного линкера. В других вариантах осуществления линкер Gly-Ser присоединен на одном или обоих концах другой последовательности пептидного линкера. В еще нескольких других вариантах осуществления два или более линкера Gly-Ser последовательно встроены в пептидный линкер. В одном варианте осуществления пептидный линкер по настоящему изобретению содержит по меньшей мере часть верхней шарнирной области (например, полученной из молекулы IgG1, IgG2, IgG3 или IgG4), по меньшей мере часть средней шарнирной области (например, полученной из молекулы IgG1, IgG2, IgG3 или IgG4) и последовательный ряд аминокислотных остатков Gly/Ser.

[342] Пептидные линкеры по настоящему изобретению имеют длину, составляющую по меньшей мере одну аминокислоту, и могут иметь различную длину. В одном варианте осуществления пептидный линкер по настоящему изобретению имеет длину, составляющую от приблизительно 1 до приблизительно 50 аминокислот. Как используется в данном контексте, термин "приблизительно" обозначает +/- два аминокислотных остатка. Поскольку длина линкера должна представлять собой положительное целое число, длина от приблизительно 1 до приблизительно 50 аминокислот в длину означает длину от 1-3 до 48-52 аминокислот в длину. В другом варианте осуществления пептидный линкер по настоящему изобретению имеет длину, составляющую от приблизительно 10 до приблизительно 20 аминокислот. В другом варианте осуществления пептидный линкер по настоящему изобретению имеет длину, составляющую от приблизительно 15 до приблизительно 50 аминокислот. В другом варианте осуществления пептидный линкер по настоящему изобретению имеет длину, составляющую от приблизительно 20 до приблизительно 45 аминокислот. В другом варианте осуществления пептидный линкер по настоящему изобретению имеет длину, составляющую от приблизительно 15 до приблизительно 35 или от приблизительно 20 до приблизительно 30 аминокислот. В другом варианте осуществления пептидный линкер по настоящему изобретению имеет длину, составляющую приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 40, 50, 60, 70, 80, 90, 100, 500, 1000, или 2000 аминокислот. В одном варианте осуществления пептидный линкер по настоящему изобретению имеет длину, составляющую 20 или 30 аминокислот.

[343] В некоторых вариантах осуществления пептидный линкер может содержать по меньшей мере две, по меньшей мере три, по меньшей мере четыре, по меньшей мере пять, по меньшей мере 10, по меньшей мере 20, по меньшей мере 30, по меньшей мере 40, по меньшей мере 50, по меньшей мере 60, по меньшей мере 70, по меньшей мере 80, по меньшей мере 90 или по меньшей мере 100 аминокислот. В других вариантах осуществления пептидный линкер может содержать по меньшей мере 200, по меньшей мере 300, по меньшей мере 400, по меньшей мере 500, по меньшей мере 600, по меньшей мере 700, по меньшей мере 800, по меньшей мере 900 или по меньшей мере 1000 аминокислот. В некоторых вариантах осуществления пептидный линкер может содержать по меньшей мере приблизительно 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400, 1500, 1600, 1700, 1800, 1900, или 2000 аминокислот. Пептидный линкер может содержать 1-5 аминокислот, 1-10 аминокислот, 1-20 аминокислот, 10-50 аминокислот, 50-100 аминокислот, 100-200 аминокислот, 200-300 аминокислот, 300-400 аминокислот, 400-500 аминокислот, 500-600 аминокислот, 600-700 аминокислот, 700-800 аминокислот, 800-900 аминокислот или 900-1000 аминокислот.

[344] Пептидные линкеры можно вводить в полипептидные последовательности с помощью методик, известных из уровня техники. Модификации можно подтверждать с помощью анализа последовательности ДНК. Для трансформации клеток-хозяев для стабильного продуцирования получаемых полипептидов можно применять плазмидную ДНК.

13. Мономерно-димерные гибриды

[345] В некоторых вариантах осуществления терапевтический белок по настоящему изобретению содержит мономерно-димерную гибридную молекулу, содержащую фактор свертывания крови.

[346] Используемый в данном документе термин "мономерно-димерный гибрид" относится к химерному белку, содержащему первую полипептидную цепь и вторую полипептидную цепь, которые связаны друг с другом дисульфидной связью, где первая цепь содержит фактор свертывания крови, например, FVIII, и первую Fc-область, а вторая цепь содержит вторую Fc-область без фактора свертывания крови, состоит по сути из нее или состоит из нее. Таким образом, мономерно-димерная гибридная конструкция представляет собой гибрид, содержащий мономерный компонент, имеющий только один фактор свертывания крови, и димерный компонент, имеющий две Fc-области.

14. Последовательности, контролирующие экспрессию

[347] В некоторых вариантах осуществления молекула нуклеиновой кислоты по настоящему изобретению дополнительно содержит по меньшей мере одну последовательность, контролирующую экспрессию. Последовательность, контролирующая экспрессию, как используется в данном документе, представляет собой любую регуляторную нуклеотидную последовательность, такую как промоторная последовательность или комбинация промотор-энхансер, которая способствует эффективной транскрипции и трансляции кодирующей нуклеиновой кислоты, с которой она функционально связана. Например, молекула нуклеиновой кислоты по настоящему изобретению может быть функционально связана с по меньшей мере одной последовательностью, контролирующей транскрипцию. Последовательность, контролирующая экспрессию гена, может, например, представлять собой промотор млекопитающего или вируса, такой как конститутивный или индуцируемый промотор.

[348] Конститутивные промоторы млекопитающих включают без ограничения промоторы следующих генов: гипоксантин-фосфорибозилтрансферазы (HPRT), аденозиндезаминазы, пируваткиназы, промотор гена бета-актина и другие конститутивные промоторы. Иллюстративные вирусные промоторы, которые функционируют конститутивно в эукариотических клетках, включают, например, промоторы из цитомегаловируса (CMV), вируса обезьян (например, SV40), вируса папилломы, аденовируса, вируса иммунодефицита человека (HIV), вируса саркомы Рауса, цитомегаловируса, длинные концевые повторы (LTR) вируса лейкоза Молони и других ретровирусов, а также промотор гена тимидинкиназы вируса простого герпеса. Средним специалистам в данной области известны другие конститутивные промоторы. Промоторы, применимые в качестве последовательностей, контролирующих экспрессию генов, согласно настоящему изобретению, также включают индуцируемые промоторы. Индуцируемые промоторы обеспечивают экспрессию в присутствии индуцирующего средства. Например, промотор гена металлотионеина индуцируется, способствуя транскрипции и трансляции, в присутствии определенных ионов металлов. Средним специалистам в данной области известны другие индуцируемые промоторы.

[349] В одном варианте осуществления настоящее изобретение предусматривает экспрессию трансгена под контролем тканеспецифического промотора и/или энхансера. В другом варианте осуществления промотор или другая последовательность, контролирующая экспрессию, избирательно усиливает экспрессию трансгена в клетках печени. В определенных вариантах осуществления промотор или другая последовательность, контролирующая экспрессию, избирательно усиливает экспрессию трансгена в гепатоцитах, синусоидальных клетках и/или эндотелиальных клетках. В одном конкретном варианте осуществления промотор или другая последовательность, контролирующая экспрессию, избирательно усиливает экспрессию трансгена в эндотелиальных клетках. В определенных вариантах осуществления промотор или другая последовательность, контролирующая экспрессию, избирательно усиливает экспрессию трансгена в мышечных клетках, клетках центральной нервной системы, глаза, печени, сердца или любой их комбинации. Примеры специфичных для печени промоторов включают без ограничения промотор гена тиретина мыши (mTTR), эндогенный промотор гена фактора VIII человека (F8), промотор гена альфа-1-антитрипсина человека (hAAT), минимальный промотор гена альбумина человека и промотор гена альбумина мыши. В одном конкретном варианте осуществления промотор включает в себя промотор mTTR. Промотор mTTR описан в R. H. Costa et al., 1986, Mol. Cell. Biol. 6:4697. Промотор F8 описан в Figueiredo and Brownlee, 1995, J. Biol. Chem. 270:11828-11838. В некоторых вариантах осуществления промотор выбран из специфичного для печени промотора (например, гена α1-антитрипсина (AAT)), специфичного для мышц промотора (например, гена мышечной креатинкиназы (MCK), тяжелой цепи миозина альфа (αMHC), миоглобина (MB) и десмина (DES)), синтетического промотора (например, SPc5-12, 2R5Sc5-12, dMCK и tMCK) и любой их комбинации.

[350] В одном варианте осуществления промотор выбран из группы, состоящей из промотора гена тиретина мыши (mTTR), эндогенного промотора гена фактора VIII человека (F8), промотора гена альфа-1-антитрипсина человека (hAAT), минимального промотора гена альбумина человека, промотора гена альбумина мыши, TTPp, промотора CASI, промотора CAG, промотора цитомегаловируса (CMV), промотора гена α1-антитрипсина (AAT), мышечной креатинкиназы (MCK), тяжелой цепи миозина альфа (αMHC), миоглобина (MB), десмина (DES), SPc5-12, 2R5Sc5-12, dMCK и tMCK, фосфоглицераткиназы (PGK) и любой их комбинации.

[351] Уровни экспрессии можно дополнительно повысить для достижения терапевтической эффективности с применением одного или нескольких энхансеров. Один или несколько энхансеров могут предоставляться отдельно или вместе с одним или несколькими промоторными элементами. Как правило, последовательность, контролирующая экспрессию, содержит множество энхансерных элементов и тканеспецифический промотор. В одном варианте осуществления энхансер содержит одну или несколько копий энхансера гена α-1-микроглобулина/бикунина (Rouet et al., 1992, J. Biol. Chem. 267:20765-20773; Rouet et al., 1995, Nucleic Acids Res. 23:395-404; Rouet et al., 1998, Biochem. J. 334:577-584; Ill et al., 1997, Blood Coagulation Fibrinolysis 8:S23-S30). В другом варианте осуществления энхансер получен из сайтов связывания специфичных для печени факторов транскрипции, таких как EBP, DBP, HNF1, HNF3, HNF4, HNF6, при этом Enh1 содержит HNF1 (смысловая) - HNF3 (смысловая) - HNF4 (антисмысловая) - HNF1 (антисмысловая) - HNF6 (смысловая) - EBP (антисмысловая) - HNF4 (антисмысловая).

[352] В конкретном примере промотор, применимый для настоящего изобретения, содержит SEQ ID NO: 69 (т. е. промотор ET), который также известен под номером доступа в GenBank AY661265. См. также Vigna et al., Molecular Therapy 11(5):763 (2005). Примеры других подходящих векторов и регуляторных элементов генов описаны в WO 02/092134, EP 1395293 или патентах США №№ 6808905, 7745179 или 7179903, которые включены в данный документ посредством ссылки во всей своей полноте.

[353] В одном варианте осуществления молекула нуклеиновой кислоты по настоящему изобретению дополнительно содержит интронную последовательность. В некоторых вариантах осуществления интронная последовательность расположена в направлении 5' относительно последовательности нуклеиновой кислоты, кодирующей полипептид FVIII. В некоторых вариантах осуществления интронная последовательность представляет собой встречающуюся в природе интронную последовательность. В некоторых вариантах осуществления интронная последовательность представляет собой синтетическую последовательность. В некоторых вариантах осуществления интронная последовательность получена из встречающейся в природе интронной последовательности. В определенных вариантах осуществления интронная последовательность содержит малый Т-интрон SV40. В одном варианте осуществления интронная последовательность содержит SEQ ID NO: 115.

[354] В некоторых вариантах осуществления молекула нуклеиновой кислоты дополнительно содержит посттранскрипционный регуляторный элемент. В определенных вариантах осуществления посттранскрипционный регуляторный элемент включает в себя мутантный посттранскрипционный регуляторный элемент вируса гепатита сурков (WPRE). В одном конкретном варианте осуществления посттранскрипционный регуляторный элемент содержит SEQ ID NO: 120.

[355] В некоторых вариантах осуществления молекула нуклеиновой кислоты содержит сайт связывания microRNA (miRNA). В одном варианте осуществления сайт связывания miRNA представляет собой сайт связывания miRNA для miR-142-3p. В других вариантах осуществления сайт связывания miRNA выбран из сайта связывания miRNA, раскрытого в Rennie et al., RNA Biol. 13(6):554-560 (2016), а также в STarMirDB, доступной по адресу http://sfold.wadsworth.org/starmirDB.php, которые включены в данный документ посредством ссылки во всей своей полноте.

[356] В некоторых вариантах осуществления молекула нуклеиновой кислоты содержит одну или несколько последовательностей, направляющих ДНК к ядру (DTS). DTS способствует транслокации молекул ДНК, содержащих такие последовательности, в ядро. В определенных вариантах осуществления DTS содержит энхансерную последовательность SV40. В определенных вариантах осуществления DTS содержит энхансерную последовательность c-Myc. В некоторых вариантах осуществления DTS расположены между первым ITR и вторым ITR. В некоторых вариантах осуществления DTS расположена в направлении 3' относительно первого ITR и в направлении 5' относительно терапевтического белка. В других вариантах осуществления DTS расположена в направлении 3' относительно терапевтического белка и в направлении 5' относительно второго ITR.

[357] В некоторых вариантах осуществления молекула нуклеиновой кислоты дополнительно содержит последовательность poly(A)-хвоста 3'-UTR. В одном варианте осуществления последовательность poly(A)-хвоста 3'-UTR включает в себя poly(A) bGH. В одном варианте осуществления последовательность poly(A)-хвоста 3'-UTR содержит сайт poly(A) гена актина. В одном варианте осуществления последовательность poly(A)-хвоста 3'-UTR содержит сайт poly(A) гена гемоглобина.

[358] В одном конкретном варианте осуществления последовательность poly(A)-хвоста 3'-UTR содержит SEQ ID NO: 122.

III. Тканеспецифическая экспрессия

[359] В определенных вариантах осуществления будет полезно включить в вектор одну или несколько последовательностей-мишеней для miRNA, которые, например, функционально связаны с трансгеном, кодирующим фактор свертывания крови. Таким образом, в настоящем изобретении также предусмотрена по меньшей мере одна последовательность-мишень для miRNA, функционально связанная с нуклеотидной последовательностью, кодирующей фактор свертывания крови, или иным образом вставленная в вектор. Более чем одна копия последовательности-мишени для miRNA, включенная в вектор, может повысить эффективность системы. Также включены различные последовательности-мишени для miRNA. Например, в векторах, которые экспрессируют более одного трансгена, трансген может находиться под контролем более чем одной последовательности-мишени для miRNA, которые могут быть одинаковыми или разными. Последовательности-мишени для miRNA могут быть расположены в тандеме, но также включены другие схемы расположения. Трансгенная кассета экспрессии, содержащая последовательности-мишени для miRNA, также может быть вставлена в вектор в антисмысловой ориентации. Антисмысловая ориентация может быть применима при получении вирусных частиц во избежание экспрессии продуктов генов, которые в противном случае могут быть токсичными для клеток-продуцентов. В других вариантах осуществления вектор содержит 1, 2, 3, 4, 5, 6, 7 или 8 копий одной и той же или разных последовательностей-мишеней для miRNA. Однако, в определенных других вариантах осуществления вектор не будет содержать какую-либо последовательность-мишень для miRNA. Выбор того, следует ли включать последовательность-мишень для miRNA (и в каком количестве), будет обусловлен известными параметрами, такими как предполагаемая ткань-мишень, требуемый уровень экспрессии и т. д.

[360] В одном варианте осуществления последовательность-мишень представляет собой мишень для miR-223, которая, как сообщалось, наиболее эффективно блокирует экспрессию в миелоидных коммитированных клетках-предшественниках и по меньшей мере частично в более примитивных HSPC. Мишень для miR-223 может блокировать экспрессию в дифференцированных миелоидных клетках, в том числе гранулоцитах, моноцитах, макрофагах, миелоидных дендритных клетках. Мишень для miR-223 также может быть подходящей для путей применения в генной терапии, что основывается на устойчивой экспрессии трансгена в лимфоидной или эритроидной линии дифференцировки. Мишень для miR-223 также может очень эффективно блокировать экспрессию в HSC человека.

[361] В другом варианте осуществления последовательность-мишень представляет собой мишень для miR142 (tccataaagt aggaaacact aca (SEQ ID NO: 43)). В одном варианте осуществления вектор содержит 4 копии последовательностей-мишеней для miR-142. В определенных вариантах осуществления последовательность, комплементарная microRNA, специфичной для гемопоэтических клеток, такой как miR-142 (142T), встроена в 3'-нетранслируемую область вектора, например, лентивирусных векторов (LV), что делает транскрипт, кодируемый трансгеном, чувствительным к понижению экспрессии, опосредованному miRNA. Посредством данного способа можно предотвратить экспрессию трансгена в антигенпрезентирующих клетках (АРС) гемопоэтической линии дифференцировки с поддержанием при этом ее в клетках, отличных от гемопоэтических (Brown et al., Nat Med 2006). С помощью такой стратегии можно производить строгий посттранскрипционный контроль экспрессии трансгена и, таким образом, обеспечивать стабильную доставку и долговременную экспрессию трансгенов. В некоторых вариантах осуществления посредством регуляции с помощью miR-142 предотвращается иммуноопосредованное выведение трансдуцированных клеток и/или индуцируется образование антигенспецифических регуляторных T-клеток (Treg) и опосредуется устойчивая иммунологическая толерантность к антигену, кодируемому трансгеном.

[362] В некоторых вариантах осуществления последовательность-мишень представляет собой мишень для miR181. В Chen C-Z and Lodish H, Seminars in Immunology (2005) 17(2):155-165 раскрыты miR-181, miRNA, специфично экспрессирующиеся в В-клетках костного мозга мышей (Chen and Lodish, 2005). Также раскрыто, что некоторые miRNA человека связаны с формами лейкоза.

[363] Последовательность-мишень может быть полностью или частично комплементарной по отношению к miRNA. Термин "полностью комплементарная" означает, что последовательность-мишень имеет последовательность нуклеиновой кислоты, которая на 100% комплементарна последовательности miRNA, которая ее распознает. Термин "частично комплементарная" означает, что последовательность-мишень является только частично комплементарной последовательности miRNA, которая ее распознает, и при этом частично комплементарная последовательность по-прежнему распознается miRNA. Другими словами, частично комплементарная последовательность в контексте настоящего изобретения является эффективной в распознавании соответствующей miRNA и в осуществлении предотвращения или снижения экспрессии трансгена в клетках, экспрессирующих эту miRNA. Примеры последовательностей-мишеней для miRNA описаны в WO2007/000668, WO2004/094642, WO2010/055413 или WO2010/125471, которые включены в данный документ посредством ссылки во всей своей полноте.

[364] В некоторых вариантах осуществления экспрессия трансгена нацелена на печень. В определенных вариантах осуществления экспрессия трансгена нацелена на гепатоциты. В другом варианте осуществления экспрессия трансгена нацелена на эндотелиальные клетки. В одном конкретном варианте осуществления экспрессия трансгена нацелена на любую ткань, которая в естественных условиях экспрессирует эндогенный FVIII.

[365] В некоторых вариантах осуществления экспрессия трансгена нацелена на центральную нервную систему. В определенных вариантах осуществления экспрессия трансгена нацелена на нейроны. В некоторых вариантах осуществления экспрессия трансгена нацелена на афферентные нейроны. В некоторых вариантах осуществления экспрессия трансгена нацелена на эфферентные нейроны. В некоторых вариантах осуществления экспрессия трансгена нацелена на вставочные нейроны. В некоторых вариантах осуществления экспрессия трансгена нацелена на глиальные клетки. В некоторых вариантах осуществления экспрессия трансгена нацелена на астроциты. В некоторых вариантах осуществления экспрессия трансгена нацелена на олигодендроциты. В некоторых вариантах осуществления экспрессия трансгена нацелена на микроглию. В некоторых вариантах осуществления экспрессия трансгена нацелена на эпендимальные клетки. В некоторых вариантах осуществления экспрессия трансгена нацелена на шванновские клетки. В некоторых вариантах осуществления экспрессия трансгена нацелена на сателлитные клетки.

[366] В некоторых вариантах осуществления экспрессия трансгена нацелена на мышечную ткань. В некоторых вариантах осуществления экспрессия трансгена нацелена на гладкую мускулатуру. В некоторых вариантах осуществления экспрессия трансгена нацелена на сердечную мускулатуру. В некоторых вариантах осуществления экспрессия трансгена нацелена на скелетную мускулатуру.

[367] В некоторых вариантах осуществления экспрессия трансгена нацелена на глаз. В некоторых вариантах осуществления экспрессия трансгена нацелена на фоторецепторные клетки. В некоторых вариантах осуществления экспрессия трансгена нацелена на ганглиозные клетки сетчатки.

IV. Клетки-хозяева

[368] В настоящем изобретении также предусмотрена клетка-хозяин, содержащая молекулу нуклеиновой кислоты или вектор по настоящему изобретению. Используемый в данном документе термин "трансформация" должен использоваться в широком смысле для обозначения введения ДНК в реципиентную клетку-хозяина, что приводит к изменениям генотипа и, следовательно, имеет результатом изменение в реципиентной клетке.

[369] "Клетки-хозяева" относятся к клеткам, которые были трансформированы посредством векторов, сконструированных с использованием методик рекомбинантной ДНК и кодирующих по меньшей мере один гетерологичный ген. Клетки-хозяева по настоящему изобретению предпочтительно происходят от млекопитающих; наиболее предпочтительно происходят от человека или от мыши. Специалистам в данной области вменяется в заслугу способность преимущественно определять конкретные линии клеток-хозяев, которые лучше всего подходят для их цели. Иллюстративные линии клеток-хозяев включают без ограничения CHO, DG44 и DUXB11 (линии клеток яичников китайского хомячка, DHFR-отрицательные), HELA (клетки карциномы шейки матки человека), CVI (линия клеток почки обезьяны), COS (производное CVI с T-антигеном SV40), R1610 (фибробласты китайского хомячка), BALBC/3T3 (фибробласты мыши), HAK (линия клеток почки хомячка), SP2/0 (клетки миеломы мыши), P3×63-Ag3.653 (клетки миеломы мыши), BFA-1c1BPT (эндотелиальные клетки крупного рогатого скота), RAJI (лимфоциты человека), PER.C6^®, NS0, CAP, BHK21 и HEK 293 (клетки почки человека). В одном конкретном варианте осуществления клетка-хозяин выбрана из группы, состоящей из клетки CHO, клетки HEK293, клетки BHK21, клетки PER.C6^®, клетки NS0, клетки CAP и любой их комбинации. В некоторых вариантах осуществления клетки-хозяева по настоящему изобретению происходят от насекомых. В одном конкретном варианте осуществления клетки-хозяева представляют собой клетки SF9. Линии клеток-хозяев обычно доступны из коммерческих служб, Американской коллекции тканевых культур или из опубликованной литературы.

[370] Введение молекул нуклеиновой кислоты или векторов по настоящему изобретению в клетку-хозяина можно осуществлять посредством различных методик, хорошо известных специалистам в данной области. Они включают без ограничения трансфекцию (в том числе электрофорез и электропорацию), слияние протопластов, осаждение фосфатом кальция, слияние клеток с ДНК в оболочке, микроинъекцию и инфицирование интактным вирусом. См., Ridgway, A. A. G. "Mammalian Expression Vectors" Chapter 24.2, pp. 470-472 Vectors, Rodriguez and Denhardt, Eds. (Butterworths, Boston, Mass. 1988). Более предпочтительно, введение плазмиды в хозяина осуществляют посредством электропорации. Трансформированные клетки выращивают в условиях, подходящих для продуцирования легких цепей и тяжелых цепей, и анализируют в отношении синтеза белков тяжелой и/или легкой цепи. Иллюстративные методики анализа включают иммуноферментный анализ (ELISA), радиоиммунологический анализ (RIA) или анализ по методу сортировки клеток с активированной флуоресценцией (FACS), иммуногистохимический анализ и т. п.

[371] Клетки-хозяева, содержащие выделенные молекулы нуклеиновой кислоты или векторы по настоящему изобретению, выращивают в подходящей среде для роста. Используемый в данном документе термин "подходящая среда для роста" означает среду, содержащую питательные вещества, необходимые для роста клеток. Питательные вещества, необходимые для роста клеток, могут включать источник углерода, источник азота, незаменимые аминокислоты, витамины, минералы и факторы роста. Среда необязательно может содержать один или несколько факторов для отбора. Среда необязательно может содержать сыворотку крови новорожденных телят или фетальную телячью сыворотку крови (FCS). В одном варианте осуществления среда по существу не содержит IgG. В среде для роста, как правило, происходит отбор клеток, содержащих ДНК-конструкцию, например, путем отбора по чувствительности к лекарственному средству или дефициту незаменимого питательного вещества, что дополняется наличием селектируемого маркера, присутствующего в ДНК-конструкции или трансфицируемого совместно с ДНК-конструкцией. Культивируемые клетки млекопитающих обычно выращивают в коммерчески доступных средах, содержащих сыворотку крови, или бессывороточных средах (например, MEM, DMEM, DMEM/F12). В одном варианте осуществления среда представляет собой CD OptiCHO (Invitrogen, Карлсбад, Калифорния). В другом варианте осуществления среда представляет собой CD17 (Invitrogen, Карлсбад, Калифорния). Выбор среды, подходящей для конкретной применяемой линии клеток, находится в пределах уровня знаний средних специалистов в данной области.

V. Получение полипептидов

[372] В настоящем изобретении также предусмотрен полипептид, кодируемый молекулой нуклеиновой кислоты по настоящему изобретению. В других вариантах осуществления полипептид по настоящему изобретению кодируется вектором, содержащим нуклеиновые молекулы по настоящему изобретению. В еще нескольких других вариантах осуществления полипептид по настоящему изобретению продуцируется клеткой-хозяином, содержащей нуклеиновые молекулы по настоящему изобретению.

[373] В других вариантах осуществления в настоящем изобретении также предусмотрен способ получения полипептида с активностью фактора свертывания крови, например, FVIII, включающий культивирование клетки-хозяина по настоящему изобретению в условиях, при которых продуцируется полипептид с активностью фактора свертывания крови, например, FVIII, и извлечение полипептида с активностью фактора свертывания крови, например, FVIII. В некоторых вариантах осуществления экспрессия полипептида с активностью фактора свертывания крови, например, FVIII, увеличена относительно клетки-хозяина, культивируемой в тех же условиях, но содержащей эталонную нуклеотидную последовательность (например, SEQ ID NO: 16, родительскую последовательность гена FVIII).

[374] В других вариантах осуществления в настоящем изобретении предусмотрен способ увеличения экспрессии полипептида с активностью фактора свертывания крови, например, FVIII, включающий культивирование клетки-хозяина по настоящему изобретению в условиях, при которых полипептид с активностью фактора свертывания крови, например, FVIII, экспрессируется молекулой нуклеиновой кислоты, где экспрессия полипептида с активностью фактора свертывания крови, например, FVIII, увеличена относительно клетки-хозяина, культивируемой в тех же условиях, содержащей эталонную молекулу нуклеиновой кислоты (например, SEQ ID NO: 16, родительскую последовательность гена FVIII).

[375] В других вариантах осуществления в настоящем изобретении предусмотрен способ улучшения выхода полипептида с активностью фактора свертывания крови, например, FVIII, включающий культивирование клетки-хозяина в условиях, при которых полипептид с активностью фактора свертывания крови, например, FVIII, продуцируется молекулой нуклеиновой кислоты, раскрытой в данном документе, где выход полипептида с активностью фактора свертывания крови, например, FVIII, увеличен относительно клетки-хозяина, культивируемой в тех же условиях, содержащей эталонную последовательность нуклеиновой кислоты (например, SEQ ID NO: 16, родительскую последовательность гена FVIII).

[376] Терапевтический белок, например, фактор свертывания крови, по настоящему изобретению может синтезироваться у трансгенного животного, такого как грызун, коза, овца, свинья или корова. Термин "трансгенные животные" относится к животным, отличным от человека, в геном которых встроен чужеродный ген. Поскольку этот ген присутствует в тканях зародышевой линии, он передается от родителей к потомству. Экзогенные гены вводят в одноклеточные эмбрионы (Brinster et al. 1985, Proc. Natl. Acad.Sci. USA 82:4438). Из уровня техники известны способы получения трансгенных животных, в том числе трансгенных объектов, которые продуцируют молекулы иммуноглобулинов (Wagner et al. 1981, Proc. Natl. Acad. Sci. USA 78: 6376; McKnight et al. 1983, Cell 34: 335; Brinster et al. 1983, Nature 306: 332; Ritchie et al. 1984, Nature 312: 517; Baldassarre et al. 2003, Theriogenology 59: 831; Robl et al. 2003, Theriogenology 59: 107; Malassagne et al. 2003, Xenotransplantation 10 (3): 267).

VII. Фармацевтическая композиция

[377] Композиции, содержащие молекулу нуклеиновой кислоты, полипептид, кодируемый молекулой нуклеиновой кислоты, вектор или клетку-хозяина по настоящему изобретению, могут содержать подходящий фармацевтически приемлемый носитель. Например, они могут содержать вспомогательные вещества и/или вспомогательные средства, которые способствуют переработке активных соединений в препараты, предназначенные для доставки в место действия.

[378] В одном варианте осуществления настоящее изобретение относится к фармацевтической композиции, содержащей (а) молекулу нуклеиновой кислоты, вектор, полипептид или клетку-хозяина, раскрытые в данном документе; и (b) фармацевтически приемлемое вспомогательное вещество.

[379] В некоторых вариантах осуществления фармацевтическая композиция дополнительно содержит средство доставки. В определенных вариантах осуществления средство доставки содержит липидную наночастицу (LNP). В других вариантах осуществления фармацевтическая композиция дополнительно содержит липосомы, другие полимерные молекулы и экзосомы.

[380] Фармацевтическая композиция может быть составлена для парентерального введения (т. е. внутривенного, подкожного или внутримышечного) путем болюсной инъекции. Составы для инъекций могут быть представлены в стандартной лекарственной форме, например, в ампулах или в многодозовых контейнерах с добавленным консервантом. Композиции могут иметь такие формы, как суспензии, растворы или эмульсии в масляных или водных средах-носителях, и содержать средства для составления, такие как суспендирующие, стабилизирующие и/или диспергирующие средства. В качестве альтернативы, активный ингредиент может быть представлен в форме порошка для разведения подходящей средой-носителем, например, апирогенной водой.

[381] Подходящие составы для парентерального введения также включают водные растворы активных соединений в водорастворимой форме, например, водорастворимые соли. Кроме того, можно вводить суспензии активных соединений в виде подходящих масляных инъекционных суспензий. Подходящие липофильные растворители или среды-носители включают жирные масла, например, кунжутное масло, или синтетические сложные эфиры жирных кислот, например, этилолеат или триглицериды. Водные инъекционные суспензии могут содержать вещества, которые увеличивают вязкость суспензии, в том числе, например, натрий-карбоксиметилцеллюлозу, сорбит и декстран. Суспензия также необязательно может содержать стабилизаторы. Также можно применять липосомы для инкапсулирования молекул по настоящему изобретению для доставки в клетки или интерстициальные пространства. Иллюстративными фармацевтически приемлемыми носителями являются физиологически совместимые растворители, дисперсионные среды, покрытия, антибактериальные и противогрибковые средства, изотонические средства и средства, замедляющие всасывание, вода, солевой раствор, фосфатно-солевой буферный раствор, декстроза, глицерин, этанол и т. п. В некоторых вариантах осуществления композиция содержит изотонические средства, например, сахара, многоатомные спирты, такие как маннит, сорбит, или хлорид натрия. В других вариантах осуществления композиции содержат фармацевтически приемлемые вещества, такие как смачивающие средства или незначительные количества вспомогательных веществ, таких как смачивающие или эмульгирующие средства, консерванты или буферы, которые увеличивают срок годности или эффективность активных ингредиентов.

[382] Композиции по настоящему изобретению могут быть представлены в различных формах, в том числе, например, в форме жидкости (например, инъекционных и инфузионных растворов), дисперсий, суспензий, полутвердых и твердых лекарственных форм. Предпочтительная форма зависит от способа введения и терапевтического применения.

[383] Композиция может быть составлена в виде раствора, микроэмульсии, дисперсии, липосомы или другой упорядоченной структуры, подходящей для высокой концентрации лекарственного средства. Стерильные инъекционные растворы можно получить путем помещения активного ингредиента в необходимом количестве в соответствующий растворитель с одним ингредиентом или комбинацией ингредиентов, перечисленных выше, если необходимо, с последующей стерилизующей фильтрацией. Как правило, дисперсии получают путем помещения активного ингредиента в стерильную среду-носитель, которая содержит основную дисперсионную среду и необходимые другие ингредиенты из перечисленных выше. В случае со стерильными порошками для получения стерильных инъекционных растворов предпочтительные способы получения представляют собой вакуумную сушку и сублимационную сушку, которые приводят к получению порошка активного ингредиента и любого дополнительного требуемого ингредиента из их раствора, предварительно подвергнутого стерилизующей фильтрации. Надлежащую текучесть раствора можно поддерживать, например, путем применения покрытия, такого как лецитин, путем поддержания необходимого размера частиц в случае с дисперсией и путем применения поверхностно-активных веществ. Пролонгированное всасывание инъекционных композиций может обеспечиваться включением в композицию средств, которые замедляют всасывание, например, моностеаратных солей и желатина.

[384] Активный ингредиент может быть составлен в составе или устройстве с контролируемым высвобождением. Примеры таких составов и устройств включают имплантаты, трансдермальные пластыри и микроинкапсулированные системы доставки. Можно применять биоразлагаемые, биосовместимые полимеры, такие как этиленвинилацетат, полиангидриды, полигликолевую кислоту, коллаген, сложные полиортоэфиры и полимолочную кислоту. Способы получения таких составов и устройств известны из уровня техники. См., например, Sustained and Controlled Release Drug Delivery Systems, J. R. Robinson, ed., Marcel Dekker, Inc., New York, 1978.

[385] Инъекционные депо-составы можно получать путем образования микроинкапсулированных матриц с лекарственным средством в биоразлагаемых полимерах, таких как сополимер лактида и гликолида. В зависимости от соотношения лекарственного средства и полимера и природы используемого полимера можно контролировать скорость высвобождения лекарственного средства. Другими иллюстративными биоразлагаемыми полимерами являются сложные полиортоэфиры и полиангидриды. Инъецируемые депо-составы также можно получать путем захвата лекарственного средства в липосомы или микроэмульсии.

[386] В композиции могут быть включены дополнительные активные соединения. В одном варианте осуществления молекула нуклеиновой кислоты по настоящему изобретению составлена с фактором свертывания крови или его вариантом, фрагментом, аналогом или производным. Например, фактор свертывания крови включает без ограничения фактор V, фактор VII, фактор VIII, фактор IX, фактор X, фактор XI, фактор XII, фактор XIII, протромбин, фибриноген, фактор фон Виллебранда или рекомбинантный растворимый тканевой фактор (rsTF) или активированные формы любого из предшествующих. Фактор свертывания крови в гемостатическом средстве также может включать в себя антифибринолитические лекарственные средства, например, эпсилон-аминокапроновую кислоту, транексамовую кислоту.

[387] Схемы дозирования могут быть скорректированы для обеспечения оптимального желаемого ответа. Например, можно вводить однократную болюсную дозу, можно вводить несколько разделенных доз на протяжении некоторого периода времени, или дозу можно пропорционально уменьшить или увеличить, как указывают потребности терапевтической ситуации. Преимущественным является составление композиций для парентерального применения в виде лекарственной формы с однократной дозировкой для удобства введения и однородности дозирования. См., например, Remington's Pharmaceutical Sciences (Mack Pub. Co., Easton, Pa. 1980).

[388] В дополнение к активному соединению жидкая лекарственная форма может содержать инертные ингредиенты, такие как вода, этиловый спирт, этилкарбонат, этилацетат, бензиловый спирт, бензилбензоат, пропиленгликоль, 1,3-бутиленгликоль, диметилформамид, масла, глицерин, тетрагидрофурфуриловый спирт, полиэтиленгликоли и сложные эфиры жирных кислот и сорбитана.

[389] Неограничивающие примеры подходящих фармацевтических носителей также описаны в Remington's Pharmaceutical Sciences, E.W. Martin. Некоторые примеры вспомогательных веществ включают крахмал, глюкозу, лактозу, сахарозу, желатин, солод, рис, муку, мел, силикагель, стеарат натрия, моностеарат глицерина, тальк, хлорид натрия, сухое обезжиренное молоко, глицерин, пропиленгликоль, воду, этанол и т. п. Композиция также может содержать рН-буферные реагенты, а также смачивающие или эмульгирующие средства.

[390] Для перорального введения фармацевтическая композиция может иметь форму таблеток или капсул, полученных с помощью традиционных способов. Композиция также может быть получена в виде жидкости, например, сиропа или суспензии. Жидкость может содержать суспендирующие средства (например, сорбитовый сироп, производные целлюлозы или гидрогенизированные пищевые жиры), эмульгирующие средства (лецитин или аравийскую камедь), неводные среды-носители (например, миндальное масло, масляные сложные эфиры, этиловый спирт или фракционированные растительные масла) и консерванты (например, метил- или пропил-п-гидроксибензоаты или сорбиновую кислоту). Препараты могут также содержать ароматизаторы, красители и подсластители. В качестве альтернативы, композиция может быть представлена в виде сухого продукта для разведения с помощью воды или другой подходящей среды-носителя.

[391] Для трансбуккального введения композиция может иметь форму таблеток или пастилок в соответствии с традиционными протоколами.

[392] Для введения путем ингаляции соединения для применения по настоящему изобретению в целях удобства доставляются в форме распыляемого аэрозоля со вспомогательными веществами или без них или в форме аэрозольного спрея из упаковки под давлением или распылителя, необязательно с пропеллентом, например, дихлордифторметаном, трихлорфторметаном, дихлортетрафторметаном, диоксидом углерода или другим подходящим газом. В случае с аэрозолем под давлением единица дозирования может определяться благодаря обеспечению наличия клапана для доставки отмеренного количества. Капсулы и картриджи из, например, желатина для применения в ингаляторе или инсуффляторе могут быть составлены так, чтобы они содержали порошковую смесь соединения и подходящей порошковой основы, такой как лактоза или крахмал.

[393] Фармацевтическая композиция также может быть составлена для ректального введения в виде суппозитория или удерживающей клизмы, например, содержащей традиционные суппозиторные основы, такие как масло какао или другие глицериды.

[394] В некоторых вариантах осуществления композицию вводят посредством пути, выбранного из группы, состоящей из местного введения, внутриглазного введения, парентерального введения, интратекального введения, субдурального введения и перорального введения. Парентеральное введение может представлять собой внутривенное или подкожное введение.

VIII. Способы лечения

[395] В некоторых вариантах осуществления молекула нуклеиновой кислоты содержит первый ITR, второй ITR и генную кассету, где генная кассета содержит фактор свертывания крови, и где молекула нуклеиновой кислоты применяется для лечения заболевания или состояния, затрагивающего свертываемость крови, у нуждающегося в этом субъекта. Заболевание или состояние, затрагивающее свертываемость крови, выбрано из группы, состоящей из коагуляционного нарушения свертываемости крови, гемартроза, мышечного кровотечения, внутриротового кровотечения, кровоизлияния, кровоизлияния в мышцы, внутриротового кровоизлияния, травмы, черепно-мозговой травмы, желудочно-кишечного кровотечения, внутричерепного кровоизлияния, внутрибрюшного кровоизлияния, внутригрудного кровоизлияния, перелома кости, кровотечения в центральной нервной системе, кровотечения в заглоточном пространстве, кровотечения в забрюшинном пространстве, кровотечения во влагалище подвздошно-поясничной мышцы или любой их комбинации. В еще нескольких других вариантах осуществления у субъекта запланировано проведение хирургического вмешательства. В еще нескольких других вариантах осуществления лечение проводится в режиме профилактики или по требованию.

[396] В настоящем изобретении предусмотрен способ лечения нарушения свертываемости крови, включающий введение нуждающемуся в этом субъекту молекулы нуклеиновой кислоты, вектора или полипептида по настоящему изобретению. В некоторых вариантах осуществления нарушение свертываемости крови характеризуется дефицитом фактора свертывания крови, например, FVIII. В некоторых вариантах осуществления нарушение свертываемости крови представляет собой гемофилию. В некоторых вариантах осуществления нарушение свертываемости крови представляет собой гемофилию A. В некоторых вариантах осуществления способа лечения нарушения свертываемости крови активность фактора свертывания крови, например, FVIII, в плазме крови через 24 часа после введения увеличивается относительно субъекта, которому вводят эталонную молекулу нуклеиновой кислоты (например, SEQ ID NO: 16, родительскую последовательность гена FVIII), вектор, содержащий эталонную молекулу нуклеиновой кислоты, или полипептид, кодируемый эталонной молекулой нуклеиновой кислоты.

[397] Настоящее изобретение также относится к способу лечения, уменьшения интенсивности проявлений или предупреждения гемостатического нарушения у субъекта, включающему введение терапевтически эффективного количества выделенной молекулы нуклеиновой кислоты по настоящему изобретению или полипептида, характеризующегося активностью фактора свертывания крови, например, FVIII, кодируемого молекулой нуклеиновой кислоты по настоящему изобретению. Лечение, уменьшение интенсивности проявлений и предупреждение посредством выделенной молекулы нуклеиновой кислоты или кодируемого полипептида может представлять собой терапию шунтирующего действия. У субъекта, получающего терапию шунтирующего действия, может уже быть выработан ингибитор фактора свертывания крови, например, FVIII, или подлежит выработке ингибитор фактора свертывания крови.

[398] Молекулы нуклеиновой кислоты, векторы или полипептиды по настоящему изобретению обеспечивают лечение или предупреждение гемостатического нарушения посредством способствования образованию фибринового сгустка. Полипептид, характеризующийся активностью фактора свертывания крови, например, FVIII, кодируемого молекулой нуклеиновой кислоты по настоящему изобретению, может активировать элемент каскада коагуляции крови. Фактор свертывания крови может участвовать во внешнем пути, внутреннем пути или в них обоих.

[399] Молекулы нуклеиновой кислоты, векторы или полипептиды по настоящему изобретению можно применять для лечения гемостатических нарушений, которые, как известно, поддаются лечению с помощью фактора свертывания крови. Гемостатические нарушения, которые можно лечить посредством способов по настоящему изобретению, включают без ограничения гемофилию A, гемофилию B, болезнь фон Виллебранда, дефицит фактора XI (дефицит PTA), дефицит фактора XII, а также дефициты или аномалии структуры фибриногена, протромбина, фактора V, фактора VII, фактора X или фактора XIII, гемартроз, мышечное кровотечение, внутриротовое кровотечение, кровоизлияние, кровоизлияние в мышцы, внутриротовое кровоизлияние, травму, черепно-мозговую травму, желудочно-кишечное кровотечение, внутричерепное кровоизлияние, внутрибрюшное кровоизлияние, внутригрудное кровоизлияние, перелом кости, кровотечение в центральной нервной системе, кровотечение в заглоточном пространстве, кровотечение в забрюшинном пространстве и кровотечение во влагалище подвздошно-поясничной мышцы.

[400] В некоторых вариантах осуществления гемостатическое нарушение представляет собой наследственное нарушение. В одном варианте осуществления субъект имеет гемофилию А. В других вариантах осуществления гемостатическое нарушение является результатом дефицита фактора свертывания крови. В других вариантах осуществления гемостатическое нарушение является результатом дефицита FVIII. В других вариантах осуществления гемостатическое нарушение может быть результатом дефекта фактора свертывания крови FVIII.

[401] В другом варианте осуществления гемостатическое нарушение может представлять собой приобретенное нарушение. Приобретенное нарушение может быть обусловлено первопричинным вторичным заболеванием или состоянием. Несвязанное состояние может представлять собой, в качестве примера, без ограничения, рак, аутоиммунное заболевание или беременность. Приобретенное нарушение может быть обусловлено пожилым возрастом или приемом лекарственных препаратов для лечения первопричинного вторичного нарушения (например, химиотерапии рака).

[402] Настоящее изобретение также относится к способам лечения субъекта, у которого не имеется гемостатическое нарушение или вторичное заболевание или состояние, приводящее к приобретению гемостатического нарушения. Таким образом, настоящее изобретение относится к способу лечения субъекта, нуждающегося в гемостатическом средстве общего действия, включающему введение терапевтически эффективного количества выделенной молекулы нуклеиновой кислоты, вектора или полипептида по настоящему изобретению. Например, в одном варианте осуществления субъект, нуждающийся в гемостатическом средстве общего действия, подвергается или вскоре подвергнется хирургическому вмешательству. Выделенную молекулу нуклеиновой кислоты, вектор или полипептид по настоящему изобретению можно вводить до или после хирургического вмешательства в качестве профилактического средства. Выделенную молекулу нуклеиновой кислоты, вектор или полипептид по настоящему изобретению можно вводить во время или после хирургического вмешательства для контроля эпизода острого кровотечения. Хирургическое вмешательство может включать без ограничения трансплантацию печени, резекцию печени или трансплантацию стволовых клеток.

[403] В другом варианте осуществления выделенную молекулу нуклеиновой кислоты, вектор или полипептид по настоящему изобретению можно применять для лечения субъекта с эпизодом острого кровотечения, у которого не имеется гемостатическое нарушение. Эпизод острого кровотечения может быть результатом тяжелой травмы, например, хирургического вмешательства, автомобильной аварии, ранения, рваного огнестрельного ранения или другого травматического события, приводящего к неконтролируемому кровотечению.

[404] Выделенную молекулу нуклеиновой кислоты, вектор или белок можно применять для профилактического лечения субъекта с гемостатическим нарушением. Выделенную молекулу нуклеиновой кислоты, вектор или белок можно применения для лечения эпизода острого кровотечения у субъекта с гемостатическим нарушением.

[405] В другом варианте осуществления экспрессия белка, представляющего собой фактор свертывания крови, посредством введения выделенной молекулы нуклеиновой кислоты или вектора по настоящему изобретению не индуцирует иммунный ответ у субъекта. В некоторых вариантах осуществления иммунный ответ включает выработку антител к фактору свертывания крови. В одном варианте осуществления иммунный ответ включает выработку антител к FVIII. В некоторых вариантах осуществления иммунный ответ включает секрецию цитокинов. В некоторых вариантах осуществления иммунный ответ включает активацию B-клеток, T-клеток или как B-клеток, так и T-клеток. В некоторых вариантах осуществления иммунный ответ представляет собой ингибирующий иммунный ответ, где иммунный ответ у субъекта способствует снижению активности белка, представляющего собой фактор свертывания крови, относительно активности фактора свертывания крови у субъекта, у которого не развился иммунный ответ. В определенных вариантах осуществления экспрессия белка, представляющего собой фактор свертывания крови, посредством введения выделенной молекулы нуклеиновой кислоты или вектора по настоящему изобретению обеспечивает предупреждение ингибирующего иммунного ответа на белок, представляющий собой фактор свертывания крови, или белок, представляющий собой фактор свертывания крови, экспрессируемый из выделенной молекулы нуклеиновой кислоты или вектора.

[406] В некоторых вариантах осуществления композицию, содержащую выделенную молекулу нуклеиновой кислоты, вектор или белок, по настоящему изобретению вводят в комбинации с по меньшей мере одним другим средством, которое способствует гемостазу. Указанное другое средство способствует гемостазу в терапевтическом препарате с продемонстрированной свертывающей активностью. В качестве примера, без ограничения, гемостатическое средство может включать в себя FV, FVII, FIX, FX, FXI, FXII, FXIII, протромбин или фибриноген или активированные формы любого из предшествующих. Фактор свертывания крови или гемостатическое средство также могут включать в себя антифибринолитические лекарственные средства, например, эпсилон-аминокапроновую кислоту, транексамовую кислоту.

[407] В одном варианте осуществления настоящего изобретения композиция (например, выделенная молекула нуклеиновой кислоты, вектор или полипептид) представляет собой композицию, в которой фактор свертывания крови присутствует в форме, активируемой при введении субъекту. Такая активируемая молекула может активироваться in vivo в месте свертывания после введения субъекту.

[408] Выделенную молекулу нуклеиновой кислоты, вектор или полипептид можно вводить внутривенно, подкожно, внутримышечно или через любую поверхность слизистой оболочки, например, пероральным, сублингвальным, трансбуккальным, сублингвальным, назальным, ректальным, вагинальным или пульмональным путем. Белок, представляющий собой фактор свертывания крови, может быть имплантирован в твердую биополимерную подложку или связан с ней, что обеспечивает возможность медленного высвобождения химерного белка в желаемом месте.

[409] Для перорального введения фармацевтическая композиция может иметь форму таблеток или капсул, полученных с помощью традиционных способов. Композиция также может быть получена в виде жидкости, например, сиропа или суспензии. Жидкость может содержать суспендирующие средства (например, сорбитовый сироп, производные целлюлозы или гидрогенизированные пищевые жиры), эмульгирующие средства (лецитин или аравийскую камедь), неводные среды-носители (например, миндальное масло, масляные сложные эфиры, этиловый спирт или фракционированные растительные масла) и консерванты (например, метил- или пропил-п-гидроксибензоаты или сорбиновую кислоту). Препараты могут также содержать ароматизаторы, красители и подсластители. В качестве альтернативы, композиция может быть представлена в виде сухого продукта для разведения с помощью воды или другой подходящей среды-носителя.

[410] Для трансбуккального и сублингвального введения композиция может иметь форму таблеток, пастилок или быстрорастворимых пленок в соответствии с традиционными протоколами.

[411] Для введения путем ингаляции полипептид, характеризующийся активностью фактора свертывания крови, для применения по настоящему изобретению в целях удобства доставляется в форме аэрозольного спрея из упаковки под давлением или распылителя (например, в PBS) с подходящим пропеллентом, например, дихлордифторметаном, трихлорфторметаном, дихлортетрафторметаном, диоксидом углерода или другим подходящим газом. В случае с аэрозолем под давлением единица дозирования может определяться благодаря обеспечению наличия клапана для доставки отмеренного количества. Капсулы и картриджи из, например, желатина для применения в ингаляторе или инсуффляторе могут быть составлены так, чтобы они содержали порошковую смесь соединения и подходящей порошковой основы, такой как лактоза или крахмал.

[412] В одном варианте осуществления путь введения выделенной молекулы нуклеиновой кислоты, вектора или полипептида является парентеральным. Используемый в данном документе термин "парентеральный" включает внутривенное, внутриартериальное, внутрибрюшинное, внутримышечное, подкожное, ректальное или вагинальное введение. Внутривенная форма парентерального введения является предпочтительной. Хотя все эти формы введения явно рассматриваются как находящиеся в пределах объема настоящего изобретения, формой для введения будет раствор для инъекций, в частности, для внутривенной или внутриартериальной инъекции или капельного вливания. Обычно подходящая фармацевтическая композиция для инъекций может содержать буфер (например, ацетатный, фосфатный или цитратный буфер), поверхностно-активное вещество (например, полисорбат), необязательно стабилизирующее средство (например, альбумин человека) и т. д. Однако, в других способах, совместимых с изложенными в данном документе идеями, выделенная молекула нуклеиновой кислоты, вектор или полипептид могут доставляться непосредственно в место локализации нежелательной клеточной популяции, за счет чего увеличивается воздействие терапевтического средства на пораженную ткань.

[413] Препараты для парентерального введения включают стерильные водные или неводные растворы, суспензии и эмульсии. Примерами неводных растворителей являются пропиленгликоль, полиэтиленгликоль, растительные масла, такие как оливковое масло, и инъекционные органические сложные эфиры, такие как этилолеат. Водные носители включают воду, спиртовые/водные растворы, эмульсии или суспензии, в том числе солевой раствор и буферные среды. В рассматриваемом изобретении фармацевтически приемлемые носители включают без ограничения 0,01-0,1 M и предпочтительно 0,05 M фосфатный буфер или 0,8% солевой раствор. Другие распространенные среды-носители для парентерального введения включают растворы фосфата натрия, раствор Рингера с декстрозой, раствор декстрозы и хлорида натрия, лактатный раствор Рингера или нелетучие масла. Среды-носители для внутривенного введения включают растворы с добавками жидкости и питательных веществ, растворы с добавками электролитов, как, например, на основе раствора Рингера с декстрозой, и т. п. Могут также присутствовать консерванты и другие добавки, такие как, например, противомикробные средства, антиоксиданты, хелатообразующие средства и инертные газы и т. п.

[414] Более конкретно, фармацевтические композиции, подходящие для инъекционного применения, включают стерильные водные растворы (в случае растворимости в воде) или дисперсии и стерильные порошки для экстемпорального приготовления стерильных инъекционных растворов или дисперсий. В таких случаях композиция должна быть стерильной и должна быть текучей до такой степени, чтобы ее легко было вводить с помощью шприца. Она должна быть стабильной в условиях производства и хранения и предпочтительно будет защищена от загрязняющего действия микроорганизмов, таких как бактерии и грибы. Носитель может представлять собой растворитель или дисперсионную среду, содержащие, например, воду, этанол, многоатомный спирт (например, глицерин, пропиленгликоль и жидкий полиэтиленгликоль и т. п.) и их подходящие смеси. Надлежащую текучесть можно поддерживать, например, путем применения покрытия, такого как лецитин, путем поддержания необходимого размера частиц в случае с дисперсией и путем применения поверхностно-активных веществ.

[415] Фармацевтическая композиция также может быть составлена для ректального введения в виде суппозитория или удерживающей клизмы, например, содержащей традиционные суппозиторные основы, такие как масло какао или другие глицериды.

[416] Эффективные дозы композиций по настоящему изобретению для лечения состояний варьируются в зависимости от множества различных факторов, включающих способ введения, участок-мишень, физиологическое состояние пациента, того, является ли пациент человеком или животным, других вводимых лекарственных препаратов и того, является ли лечение профилактическим или терапевтическим. Обычно пациент является человеком, однако также можно лечить млекопитающих, отличных от человека, в том числе трансгенных млекопитающих. Для оптимизации безопасности и эффективности дозировки для лечения можно подбирать с помощью обычных способов, известных специалистам в данной области.

[417] Молекулу нуклеиновой кислоты, вектор или полипептиды по настоящему изобретению можно необязательно вводить в комбинации с другими средствами, которые являются эффективными при лечении нарушения или состояния, требующего лечения (например, профилактического или терапевтического).

[418] Как используется в данном документе, введение выделенных молекул нуклеиновой кислоты, векторов или полипептидов по настоящему изобретению в сочетании или в комбинации со вспомогательной терапией означает последовательное, одновременное, одинаковое по протяженности, сопутствующее, параллельное или совпадающее во времени введение или применение терапии и раскрытых полипептидов. Специалистам в данной области будет понятно, что введение или применение различных компонентов схемы комбинированной терапии может быть спланировано по времени для повышения общей эффективности лечения. Специалист в данной области (например, врач) сможет легко определить эффективные схемы комбинированной терапии без проведения излишних экспериментов на основании выбранной вспомогательной терапии и идей настоящего описания.

[419] Кроме того, следует понимать, что выделенную молекулу нуклеиновой кислоты, вектор или полипептид по настоящему изобретению можно применять в сочетании или в комбинации со средством или средствами (например, для обеспечения схемы комбинированной терапии). Иллюстративные средства, в комбинации с которыми можно применять полипептид или полинуклеотид по настоящему изобретению, включают средства, которые представляют современный стандарт оказания медицинской помощи при конкретном нарушении, подвергаемом лечению. Такие средства могут быть химическими или биологическими по природе. Термин "биологический препарат" или "биологическое средство" относится к любому фармацевтически активному средству, полученному из живых организмов и/или их продуктов, которое предназначено для применения в качестве терапевтического препарата.

[420] Количество средства, которое следует применять в комбинации с полинуклеотидами или полипептидами по настоящему изобретению, может варьироваться у различных субъектов или может вводиться в соответствии с тем, что известно из уровня техники. См., например, Bruce A Chabner et al., Antineoplastic Agents, в Goodman & Gilman's The Pharmacological Basis of Therapeutics 1233-1287 (Joel G. Hardman et al., eds., 9^th ed. 1996). В другом варианте осуществления вводят количество такого средства, соответствующее стандарту оказания медицинской помощи.

[421] В одном варианте осуществления в данном документе также раскрыт набор, содержащий молекулу нуклеиновой кислоты, раскрытую в данном документе, и инструкции по введению молекулы нуклеиновой кислоты нуждающемуся в этом субъекту. В другом варианте осуществления в данном документе раскрыта бакуловирусная система для получения молекулы нуклеиновой кислоты, представленной в данном документе. Молекулу нуклеиновой кислоты получают в клетках насекомых. В другом варианте осуществления предусмотрена система доставки на основе наночастиц для экспрессионных конструкций. Экспрессионная конструкция содержит молекулу нуклеиновой кислоты, раскрытую в данном документе.

IX. Генная терапия

[422] В определенных аспектах настоящего изобретения предусмотрен способ обеспечения экспрессии генетической конструкции у субъекта, включающий введение выделенной молекулы нуклеиновой кислоты по настоящему изобретению нуждающемуся в этом субъекту. В некоторых аспектах в настоящем изобретении предусмотрен способ увеличения экспрессии полипептида у субъекта, включающий введение выделенной молекулы нуклеиновой кислоты по настоящему изобретению нуждающемуся в этом субъекту. В других аспектах в настоящем изобретении предусмотрен способ модулирования экспрессии полипептида у нуждающегося в этом субъекта, включающий введение выделенной молекулы нуклеиновой кислоты по настоящему изобретению, например, последовательности нуклеиновой кислоты, содержащей miRNA, субъекту. В некоторых аспектах в настоящем изобретении предусмотрен способ понижения экспрессии гена-мишени у нуждающегося в этом субъекта, включающий введение выделенной молекулы нуклеиновой кислоты по настоящему изобретению, например, последовательности нуклеиновой кислоты, содержащей miRNA, субъекту.

[423] Генную терапию соматических клеток исследовали как возможный метод лечения различных состояний, в том числе без ограничения гемофилии А. Генная терапия является особенно привлекательным методом лечения гемофилии, поскольку она обладает потенциалом излечения заболевания благодаря непрерывному эндогенному продуцированию фактора свертывания крови, например, FVIII, после однократного введения вектора. Гемофилия А является особенно пригодной для подхода на основе генной заместительной терапии, поскольку ее клинические проявления в полной мере объясняются отсутствием одного продукта гена (например, FVIII), который циркулирует в плазме крови в незначительных количествах (200 нг/мл).

[424] Белок, представляющий собой фактор свертывания крови, по настоящему изобретению может быть получен in vivo у млекопитающего, например, у пациента-человека, с применением подхода на основе генной терапии для лечения заболевания, затрагивающего свертываемость крови, или нарушения свертываемости крови, выбранного из группы, состоящей из коагуляционного нарушения свертываемости крови, гемартроза, мышечного кровотечения, внутриротового кровотечения, кровоизлияния, кровоизлияния в мышцы, внутриротового кровоизлияния, травмы, черепно-мозговой травмы, желудочно-кишечного кровотечения, внутричерепного кровоизлияния, внутрибрюшного кровоизлияния, внутригрудного кровоизлияния, перелома кости, кровотечения в центральной нервной системе, кровотечения в заглоточном пространстве, кровотечения в забрюшинном пространстве и кровотечения во влагалище подвздошно-поясничной мышцы, что было бы терапевтически благоприятным. В одном варианте осуществления заболевание, затрагивающее свертываемость крови, или нарушение свертываемости крови представляет собой гемофилию. В другом варианте осуществления заболевание, затрагивающее свертываемость крови, или нарушение свертываемости крови представляет собой гемофилию A.

[425] Другие состояния также подходят для лечения с применением молекул нуклеиновой кислоты, раскрытых в данном документе. В определенных вариантах осуществления способы, описанные в данном документе, применяют для лечения заболевания или состояния, которое поражает орган-мишень, выбранный из мышцы, центральной нервной системы (CNS), глаза, печени, сердца, почки, поджелудочной железы, легких, кожи, мочевого пузыря, мочевыводящих путей или любой их комбинации. В определенных вариантах осуществления способы, описанные в данном документе, применяют для лечения заболевания или состояния, выбранного из DMD (мышечной дистрофии Дюшенна), XLMTM (X-сцепленной миотубулярной миопатии), болезни Паркинсона, SMA (спинальной мышечной атрофии), атаксии Фридрейха, GUCY2D-LCA (врожденного амавроза Лебера), XLRS (X-сцепленного ретиношизиса), AMD (возрастной макулярной дегенерации), ACHM (ахроматопсии), RPF65-опосредованного IRD (таблица 9).

Таблица 9. Заболевания и нарушения, поддающиеся лечению посредством способов, раскрытых в данном документе.

Заболевание	Орган-мишень	Дефектный ген	Генная терапия
DMD (мышечная дистрофия Дюшенна)	Мышца	Дистрофин X-сцепленный	Введение гена
XLMTM (X-сцепленная миотубулярная миопатия)	Мышца	MTM1 (миотубулярин)	Введение гена
Болезнь Паркинсона	CNS	Тирозин- гидроксилаза, AADC, циклогидролаза	Введение гена
SMA (спинальная мышечная атрофия)	CNS	SMN1	Введение гена
Атаксия Фридрейха	CNS	FXN (фратаксин)	Введение гена
GUCY2D-LCA Врожденный амавроз Лебера	Глаза	GUCY2D	Введение гена
XLRS X-сцепленный ретиношизис	Глаза	RS1	Введение гена
AMD Возрастная макулярная дегенерация	Глаза	CFH HTRA ARMS CFB/CC2	Введение гена
ACHM Ахроматопсия	Глаза	CNGA/CNGB	Введение гена
RPF65-опосредованное IRD	Глаза	Prf65	Введение гена
Лизосомные болезни накопления	Орган-мишень	Дефектный ген	Генная терапия
MLD Метахроматическая лейкодистрофия (Лизосомная болезнь накопления)	CNS	ARSA PSAP	Введение гена
MPS Формы мукополисахаридоза (Лизосомная болезнь накопления)	Печень	IDUA (MPS I) IDS (MPS II)	Введение гена
PKU Фенилкетонурия (Лизосомная болезнь накопления)	Печень	PAH	Введение гена
Болезнь Помпе Болезнь накопления гликогена II типа	Сердце, печень, мышцы, CNS	GAA (кислая альфа-глюкозидаза)	Введение гена
Терапия с помощью microRNA	Орган-мишень	Дефектный ген	Генная терапия
ALS Боковой амиотрофический склероз	CNS	SOD1¹	miRNA
Болезнь Хантингтона	CNS	HTT²	miRNA
AdRP Аутосомно-доминантный пигментный ретинит	Глаза	RHO³ (родопсин)	miRNA

1. Мутация гена SOD1 обуславливала 20% случаев наследственного ALS. SOD1 дикого типа продемонстрировал антиапоптотические свойства в культурах нейронов, тогда как мутантный SOD1 согласно наблюдениям способствовал апоптозу в митохондриях спинного мозга, но не в митохондриях печени, хотя он в равной степени экспрессируется и там, и там. Понижение экспрессии мутантного SOD1 может обуславливать ингибирование дегенерации двигательных нейронов при ALS. 2. HD является одной из нескольких болезней экспансии тринуклеотидных повторов, которые вызваны превышением длины повторяющегося участка гена пределов нормального диапазона. HTT содержит последовательность из трех оснований ДНК цитозин-аденин-гуанин (CAG), которые повторяются многократно (т. е. ... CAGCAGCAG ...), что известно как тринуклеотидный повтор. CAG представляет собой 3-буквенный генетический код (кодон) для аминокислоты глутамина, поэтому последовательный ряд этих оснований приводит к продуцированию цепи из глутаминовых остатков, известной как полиглутаминовый тракт (или поли-Q-тракт), и повторяющейся части гена, поли-Q-области.Как правило, люди имеют менее 36 повторяющихся глутаминовых остатков в поли-Q-области, что приводит к продуцированию цитоплазматического белка хантингтина. Однако, последовательность из 36 или более глутаминовых остатков приводит к продуцированию белка, который имеет другие характеристики. Эта измененная форма, называемая мутантным хантингтином (mHTT), увеличивает скорость разрушения некоторых типов нейронов. Как правило, количество повторов CAG связано с тем, насколько сильно затронут этот процесс, и обуславливает приблизительно 60% изменчивости возраста начала проявления симптомов. Остальная доля изменчивости объясняется влиянием окружающей среды и других генов, которые модифицируют механизм развития HD. 36-39 повторов приводят к форме заболевания с пониженной пенетрантностью, с гораздо более поздним началом проявления и более медленным прогрессированием симптомов. В некоторых случаях начало проявления может быть настолько поздним, что симптомы так никогда и не отмечаются. При очень большом количестве повторов HD характеризуется полной пенетрантностью и может встречаться в возрасте до 20 лет, и в этом случае ее тогда называют ювенильной HD, акинетико-ригидной HD или вариантом Вестфаля HD. Это составляет приблизительно 7% случаев носительства HD. 3. Большинство мутаций гена RHO, отвечающих за пигментный ретинит, изменяют сворачивание или транспорт белка родопсина. Несколько мутаций вызывают конститутивную активацию родопсина вместо активации в ответ на воздействие света. Исследования позволяют предположить, что измененные варианты родопсина препятствуют осуществлению жизненно важных функций клеток, вызывая саморазрушение палочек (они подвергаются апоптозу). Поскольку палочки необходимы для зрения в условиях низкой освещенности, потеря этих клеток приводит к прогрессирующей ночной слепоте у людей с пигментным ретинитом.

[426] В некоторых вариантах осуществления способы, описанные в данном документе, применяют для лечения лизосомной болезни накопления. В некоторых вариантах осуществления лизосомная болезнь накопления выбрана из MLD (метахроматической лейкодистрофии), MPS (форм мукополисахаридоза), PKU (фенилкетонурии), болезни Помпе, представляющей собой болезнь накопления гликогена II типа, или любой их комбинации.

[427] В некоторых вариантах осуществления способы, описанные в данном документе, применяют в терапии с помощью microRNA (miRNA). В некоторых вариантах осуществления miRNA обеспечивает лечение состояния, вызванного сверхэкспрессией гена или белка. В некоторых вариантах осуществления miRNA обеспечивает лечение состояния, вызванного накоплением белка. В некоторых вариантах осуществления miRNA обеспечивает лечение состояния, вызванного неправильной экспрессией гена или белка. В некоторых вариантах осуществления miRNA обеспечивает лечение состояния, вызванного экспрессией мутантного гена. В некоторых вариантах осуществления miRNA обеспечивает лечение состояния, вызванного экспрессией гетерологичного гена. В определенных вариантах осуществления терапия с помощью miRNA обеспечивает лечение состояния, выбранного из ALS (бокового амиотрофического склероза), болезни Хантингтона, AdRP (аутосомно-доминантного пигментного ретинита) и любой их комбинации. В определенных вариантах осуществления способы по настоящему изобретению включают направленное лечение ALS путем введения молекулы нуклеиновой кислоты, раскрытой в данном документе, где молекула нуклеиновой кислоты содержит генную кассету, кодирующую miRNA, где miRNA целенаправленно воздействует на экспрессию SOD1. В определенных вариантах осуществления miRNA включает в себя искусственную miRNA miR-SOD1, раскрытую в Dirren et al., Annals of Clinical and Translational Neurology 2(2):167-84 (февраль 2015 г.). Мутация гена SOD1 обуславливает 20% случаев наследственного ALS. SOD1 дикого типа продемонстрировал антиапоптотические свойства в культурах нейронов, тогда как мутантный SOD1 согласно наблюдениям способствовал апоптозу в митохондриях спинного мозга, но не в митохондриях печени, хотя он в равной степени экспрессируется и там, и там. Понижение экспрессии мутантного SOD1 может обуславливать ингибирование дегенерации двигательных нейронов при ALS.

[428] В определенных вариантах осуществления способы по настоящему изобретению включают направленное лечение болезни Хантингтона путем введения молекулы нуклеиновой кислоты, раскрытой в данном документе, где молекула нуклеиновой кислоты содержит генную кассету, кодирующую miRNA, где miRNA целенаправленно воздействует на экспрессию HTT. В определенных вариантах осуществления miRNA включает сконструированную miRNA для miHTT, раскрытую в Evers et al., Molecular Therapy 26(9):1-15 (электронная публикация до выхода в печать в июне 2018 г.). Болезнь Хантингтона является одной из нескольких болезней экспансии тринуклеотидных повторов, которые вызваны превышением длины повторяющегося участка гена пределов нормального диапазона. HTT содержит последовательность из трех оснований ДНК цитозин-аденин-гуанин (CAG), которые повторяются многократно (т. е. ... CAGCAGCAG ...), что известно как тринуклеотидный повтор. CAG представляет собой 3-буквенный генетический код (кодон) для аминокислоты глутамина, поэтому последовательный ряд этих повторов приводит к продуцированию цепи из глутаминовых остатков, известной как полиглутаминовый тракт (или поли-Q-тракт), и повторяющейся части гена, поли-Q-области. Как правило, люди имеют менее 36 повторяющихся глутаминовых остатков в поли-Q-области, что приводит к продуцированию цитоплазматического белка хантингтина. Однако, последовательность из 36 или более глутаминовых остатков приводит к продуцированию белка, который имеет другие характеристики. Эта измененная форма, называемая мутантным хантингтином (mHTT), увеличивает скорость разрушения некоторых типов нейронов. Как правило, количество повторов CAG связано с тем, насколько сильно затронут этот процесс, и обуславливает приблизительно 60% изменчивости возраста начала проявления симптомов. Остальная доля изменчивости объясняется влиянием окружающей среды и других генов, которые модифицируют механизм развития болезни Хантингтона. 36-39 повторов приводят к форме заболевания с пониженной пенетрантностью, с гораздо более поздним началом проявления и более медленным прогрессированием симптомов. В некоторых случаях начало проявления может быть настолько поздним, что симптомы так никогда и не отмечаются. При очень большом количестве повторов болезнь Хантингтона характеризуется полной пенетрантностью и может встречаться в возрасте до 20 лет, и в этом случае ее тогда называют ювенильной болезнью Хантингтона, акинетико-ригидной болезнью Хантингтона или вариантом Вестфаля болезни Хантингтона. Это составляет приблизительно 7% случаев носительства болезни Хантингтона.

[429] В определенных вариантах осуществления способы по настоящему изобретению включают направленное лечение аутосомно-доминантного пигментного ретинита (AdRP) путем введения молекулы нуклеиновой кислоты, раскрытой в данном документе, где молекула нуклеиновой кислоты содержит генную кассету, кодирующую miRNA, где miRNA целенаправленно воздействует на экспрессию RHO (родопсина). В определенных вариантах осуществления miRNA включает в себя miR-708 (см. Behrman et al., JCB 192(6):919-27 (2011). Большинство мутаций гена RHO, отвечающих за пигментный ретинит, изменяют сворачивание или транспорт белка родопсина. Несколько мутаций вызывают конститутивную активацию родопсина вместо активации в ответ на воздействие света. Исследования позволяют предположить, что измененные варианты родопсина препятствуют осуществлению жизненно важных функций клеток, вызывая саморазрушение палочек (они подвергаются апоптозу). Поскольку палочки необходимы для зрения в условиях низкой освещенности, потеря этих клеток приводит к прогрессирующей ночной слепоте у людей с пигментным ретинитом.

[430] Все из различных аспектов, вариантов осуществления и возможностей выбора, описанных в данном документе, можно комбинировать во всех без исключения вариантах.

[431] Все публикации, патенты и заявки на патенты, упоминаемые в настоящем описании, включены в данный документ посредством ссылки в такой же степени, как если бы каждая отдельная публикация, патент или заявка на патент была конкретно и отдельно указана как включенная посредством ссылки.

[432] При наличии описания настоящего изобретения в общих чертах может быть достигнуто дополнительное понимание, если обратиться к представленным в данном документе примерам. Эти примеры служат лишь для иллюстративных целей и не предполагаются как ограничивающие.

ПРИМЕРЫ

Пример 1. Создание экспрессионных конструкций FVIII, несущих парвовирусные ITR из AAV и вирусов, отличных от AAV.

Пример 1a. Клонирование кодон-оптимизированного гена FVIII и областей инвертированных концевых повторов (ITR) из AAV в генные кассеты.

[433] Генную кассету FVIII создавали на основе генома AAV серотипа 2. Однако, в данном подходе можно применять и области ITR, происходящие из любого серотипа (в том числе синтетического) (фиг. 1A).

[434] Экспрессионная плазмида AAV2-FVIIIco6XTEN, кодирующая кодон-оптимизированную кодирующую последовательность FVIII под контролем специфичного для печени промотора (TTPp, фиг. 1A и 1B), фланкированную областями инвертированных концевых повторов (ITR) из AAV (AAV-FVIII), была разработана для экспрессии in vitro и in vivo, как показано на фиг. 1В. Генная кассета также содержит элементы WPRE и bGHpA для оптимальной экспрессии трансгена (фиг. 1A и 1B). Фланкированную ITR кодон-оптимизированную последовательность FVIII клонировали в плазмидный каркас, содержащий точку начала репликации ColE1 и кассету экспрессии для бета-лактамазы, которая придает устойчивость к ампициллину (фиг. 1B). Сайты распознавания для рестрикционной эндонуклеазы PvuII, фланкирующие кассету экспрессии, были сконструированы для обеспечения возможности точного вырезания конструкции AAV-FVIII при расщеплении с помощью PvuII (фиг. 1B).

Пример 1b. Клонирование кодон-оптимизированного гена FVIII и областей инвертированных концевых повторов (ITR) из парвовирусов, отличных от AAV, в генные кассеты.

[435] На основании филогенетических взаимоотношений между представителями семейства вирусов Parvoviridae, к которому принадлежит AAV (фиг. 2A), была выдвинута гипотеза, что другие, отличные от AAV, представители рода Dependovirus и представители рода Erythrovirus (и, возможно, все/многие другие представители данного семейства вирусов) используют аналогичные клеточные механизмы для поддержания жизненного цикла вируса и, что наиболее важно, для формирования устойчивой латентной инфекции. Следовательно, области ITR, происходящие из геномов этих вирусов, можно использовать для разработки AAV-подобных (но не на основе AAV) генных кассет экспрессии. Следующие парвовирусы тестировали в отношении пригодности их областей ITR для разработки генетических конструкций для путей применения в генной терапии: штамм B парвовируса гусей (GPV) из рода Dependovirus и эритровирус, представляющий собой парвовирус B19 (фиг. 2A).

[436] Нестабильность парвовирусных областей ITR во время размножения плазмидных векторов в бактериальных клетках является хорошо известным препятствием для создания генетических конструкций и манипуляций с ними. Хотя генетические конструкции, содержащие полноразмерные ITR AAV2 (145 п. о.), были успешно созданы несколькими группами, в том числе и авторами настоящего изобретения, эти конструкции являются крайне нестабильными, и большинство плазмид на основе ITR AAV2 содержат усеченный вариант области ITR размером 130 п. о. (проиллюстрированный в таблице 1). Аналогичным образом, плазмидные конструкции, несущие полноразмерные последовательности ITR как B19, так и GPV, которые были созданы, демонстрировали высокую степень нестабильности в бактериальном хозяине (данные не показаны), что значительно ограничивает применимость этих ITR для разработки генетических векторов для путей применения в генной терапии.

Ранее была разработана обратно-генетическая система для "спасения" рекомбинантного вируса B19, несущего усеченный вариант ITR (Manaresi et al., 2017, Virology, doi: 10.1016/j.virol.2017.05.006) (таблица 2B, ID ITR: B19d135). Таким образом, авторы настоящего изобретения использовали ITR B19d135 для создания генетически стабильной экспрессионной плазмиды FVIII B19-FVIIIco6XTEN (фиг. 1C). Чтобы дополнительно использовать этот подход для синтеза конструкции на основе ITR GPV, авторы настоящего изобретения сравнили полноразмерные последовательности дикого типа ITR B19, GPV и AAV2 (фиг. 3A). Исходя из гомологии первых 135 и 15 нуклеотидов последовательностей ITR B19 и AAV2 соответственно, которые не являются обязательными для функционирования ITR, авторы настоящего изобретения выдвинули гипотезу, что первые 162 нуклеотида ITR GPV можно удалить в целях синтеза стабильных генетических конструкций с полностью функциональными ITR (фиг. 3A, последовательности, заштрихованные серым цветом). Следовательно, аналогично конструкциям AAV2-FVIIIco6XTEN и B19-FVIIIco6XTEN, которые несут усеченные варианты соответствующих им ITR, авторы настоящего изобретения использовали GPVd162 (таблица 2C) для создания стабильной экспрессионной плазмидной конструкции FVIII GPV-FVIIIco6XTEN (фиг. 1D). Примечательно, что ITR как B19, так и GPV полной длины намного длиннее ITR AAV2 полной длины (таблица 1) и не образуют характерную Т-образную шпилечную структуру ITR AAV (фиг. 2B).

[437] Плазмиды B19-FVIIIco6XTEN (фиг. 1C; таблица 2B) и GPV-FVIIIco6XTEN (фиг. 1D; таблица 2C), содержащие кассеты экспрессии FVIII, фланкированные парвовирусными ITR из вирусов, отличных от AAV (B19d135-FVIII и GPVd162-FVIII), создавали согласно описанному в примере 1а. Сайты распознавания для рестрикционной эндонуклеазы LguI использовали для фланкирования обеих кассет экспрессии FVIII (фиг. 1C и 1D).

Пример 1c. Получение однонитевых фрагментов ДНК, содержащих кассеты экспрессии FVIII, фланкированные парвовирусными ITR из AAV и вирусов, отличных от AAV.

[438] Была выдвинута гипотеза, что образование шпилечных структур внутри областей ITR, фланкирующих кассету экспрессии FVIII, будет приводить к устойчивой трансдукции клеток-мишеней. Для исследований с целью подтверждения правильности концепции плазмиду AAV2-FVIIIco6XTEN на основе ITR AAV и плазмиды B19-FVIIIco6XTEN и GPV-FVIIIco6XTEN на основе ITR вируса, отличного от AAV, расщепляли соответственно с помощью PvuII и LguI. Однонитевой (ss) фрагмент AAV-FVIII, B19-FVIII или GPV-FVIII с образованными шпилечными структурами ITR создавали путем денатурации продуктов расщепления двухнитевого фрагмента ДНК (кассеты экспрессии FVIII и плазмидного каркаса) под действием PvuII или LguI при 95^oC и последующего охлаждения при 4^oC для обеспечения возможности сворачивания палиндромных последовательностей ITR (фиг. 1A). Полученные в результате ssAAV-FVIII, ssB19-FVIII или ssGPV-FVIII тестировали в мышиной модели HemA (гемофилии A) в отношении способности обеспечивать устойчивую трансдукцию гепатоцитов.

Пример 1d. Применение бакуловирусной системы экспрессии для создания экспрессионных конструкций FVIII

[439] Используется бакуловирусная система экспрессии, описанная в Li et al., PLoS ONE 8 (8): e69879 (2013), для получения конструкций AAV-FVIII, B19-FVIII и GPV-FVIII в форме молекул ДНК с замкнутыми концами (ceDNA) в клетках насекомых. Было продемонстрировано, что системная доставка кассет экспрессии на основе ceDNA обеспечивает устойчивую трансдукцию гепатоцитов и приводит к стабильной долговременной экспрессии трансгена в печени.

Пример 2. Системная инъекция генетических конструкций, содержащих кассеты экспрессии FVIII, фланкированные парвовирусными ITR из AAV и вирусов, отличных от AAV, приводит к долговременной экспрессии FVIII у мышей HemA.

Пример 2a. Оценивание in vivo экспрессии FVIII, опосредованной ssAAV-FVIII.

[440] Для подтверждения способности ssAAV-FVIII, несущей области ITR из AAV, опосредовать устойчивую экспрессию трансгена in vivo, обеспечивали системную доставку генной кассеты экспрессии посредством гидродинамической инъекции (HDI) мышам HemA в возрасте 5-12 недель (4 животных на группу) при 5 мкг, 10 мкг или 20 мкг генной кассеты экспрессии на основе ssDNA (ssAAV-FVIII) (фиг. 4A). HDI приводит к первичной доставке инъецированного материала в печень экспериментальных животных. Контрольные животные, которым инъецировали 5 мкг/мышь родительской экспрессионной плазмиды, демонстрировали высокие уровни активности FVIII в плазме крови вскоре после введения. Однако, уровень циркулирующего FVIII быстро снижался и становился невыявляемым через 15 дней после инъекции (p.i.). Образцы плазмы крови собирали у экспериментальных животных через 18 часов, 3 дня, 2 недели, 3 недели, 1 месяц, 2 месяца, 3 месяца и 4 месяца после однократной гидродинамической инъекции ssAAV-FVIII. Активность FVIII в плазме крови анализировали с помощью хромогенного анализа активности FVIII. У экспериментальных животных, которым инъецировали 5, 10 и 20 мкг/мышь ssAAV-FVIII, развивалась долговременная экспрессия трансгена со стабильными уровнями циркулирующего FVIII, составляющими приблизительно 8, 16 и 32% от нормального уровня FVIII соответственно (фиг. 4А). Следует подчеркнуть, что авторы настоящего изобретения наблюдали сильный дозозависимый эффект, что позволяет предположить высокую степень корреляции между инъецированной дозой и результатом лечения.

Пример 2b. Оценивание in vivo экспрессии FVIII, опосредованной ssB19-FVIII и ssGPV-FVIII.

[441] Для оценивания in vivo экспрессии FVIII из ssB19-FVIII и ssGPV-FVIII, которые несут парвовирусные области ITR из вирусов, отличных от AAV, B19d135 и GPVd162 соответственно, обеспечивали системную доставку генной кассеты экспрессии ssB19-FVIII при 10 или 20 мкг/мышь и ssGPV-FVIII при 10 или 50 мкг/мышь посредством HDI мышам в возрасте 5-12 недель с гемофилией А (HemA). Образцы крови собирали через 1, 3, 7, 14, 21 и 28 дней p.i., и активность FVIII в крови анализировали с помощью хромогенного анализа активности FVIII. Как наблюдалось ранее в экспериментах с конструкцией AAV-FVIII, контрольные животные, которым инъецировали 5 мкг/мышь родительской экспрессионной плазмиды FVIII, демонстрировали высокие уровни активности FVIII в плазме крови через 24 часа p.i., которые быстро снижались и становились невыявляемыми к моменту времени 14 дней p.i. Экспериментальные животные, которым инъецировали ssB19-FVIII, демонстрировали пиковую активность FVIII в плазме крови через 24 часа p.i., которая затем постепенно снижалась в течение периода 21 дня и стабилизировалась примерно через 28 дней p.i. (фиг. 4B). В то же время у мышей HemA, которым инъецировали ssGPV-FVIII, быстро развивались стабильные уровни активности FVIII в плазме крови примерно на 7 день, которые поддерживались в течение всего периода наблюдения 28 дней (фиг. 4C). Примечательно, что у животных, которым инъецировали 10 мкг/мышь ssAAV-FVIII (фиг. 4A) либо ssGPV-FVIII (фиг. 4C), развивались весьма сходные стабильные уровни активности FVIII в плазме крови, что позволяет предположить, что области ITR как AAV2, так и GPV содержат генетические факторы, необходимые для эффективного обеспечения устойчивой трансдукции клеток-мишеней.

Пример 3. Создание и оценивание in vivo экспрессионных конструкций FVIII, несущих производные парвовирусных ITR из вирусов, отличных от AAV, B19d135 и GPVd162.

Пример 3a. Определение минимальных существенных последовательностей ITR B19 и GPV.

[442] На основании сравнения последовательностей ITR депендовирусов AAV2 и GPV и эритровируса B19 (номера доступа в GenBank NC_001401.2, U25749.1 и KY940273.1 соответственно) авторы настоящего изобретения разработали минимальные последовательности ITR парвовирусов GPV и B19, которые будут необходимыми с дополнительными последовательностями (спейсерами, вставками, инверсиями, добавлениями и/или рекомбинациями с последовательностями дикого типа других парвовирусных ITR) или без них для устойчивой трансдукции эукариотических клеток генетическими конструкциями, несущими такие ITR (фиг. 3A и 3B). Таким образом, выравнивание последовательностей ITR AAV2, GPV и B19 выявило консервативные области B19v1 и GPVv1 среди всех трех видов вирусов, которые представлены в таблицах 2A-2C в виде непрерывных последовательностей без спейсерных областей вариабельной последовательности. Аналогично, варианты минимальных существенных последовательностей B19v3 и GPVv3 были разработаны на основании сравнения последовательностей ITR между B19 и GPR. Поскольку экспрессионные конструкции FVIII, несущие ITR GPVd162, показали лучшие результаты в экспериментах in vivo, чем генетические конструкции, несущие ITR B19d135, авторы настоящего изобретения предположили, что все генетические факторы, необходимые для устойчивой трансдукции, присутствуют в последовательности ITR GPV; однако, в последовательности ITR B19 отсутствуют некоторые из этих генетических факторов. Следовательно, последовательность B19v3 содержит области минимальной последовательности ITR B19, которые являются консервативными среди последовательностей ITR B19 и GPV, а последовательность GPVv3 содержит области минимальной последовательности ITR GPV, которые присутствуют в последовательности ITR GPV и отсутствуют в последовательности ITR B19 (таблицы 2B и 2C). Последовательности B19v2 и GPVv2 создавали путем исключения первых 135 и 162 нуклеотидов и соответствующих комплементарных 135 и 162 нуклеотидов в палиндромных областях ITR последовательностей ITR B19 и GPV соответственно (таблицы 2B и 2C).

Пример 3b. Ориентация палиндромных областей ITR B19 и GPV и их производных в функциональных генетических конструкциях.

[443] Часть парвовирусных ITR состоит из самокомплементарной палиндромной области. Ранее было продемонстрировано для рекомбинантных инфекционных парвовирусов В19, что "спасенные" вирусы, несущие палиндромные области в прямой и обратной ориентациях, демонстрируют сходные свойства роста (Manaresi et al., 2017, Virology, doi: 10.1016/j.virol.2017.05.006). Поэтому авторы настоящего изобретения предполагают, что генетические экспрессионные конструкции, несущие ITR B19 и GPV и их производные, остаются функциональными независимо от того, находятся ли палиндромные области таких ITR в прямой, обратной или любой возможной комбинации 5’ и 3’ ITR по отношению к генной кассете экспрессии.

Пример 3c. Системная инъекция генетических конструкций, несущих производные парвовирусных ITR из вирусов, отличных от AAV, B19d135 и GPVd162 у мышей HemA.

[444] Для оценивания экспрессии FVIII in vivo из конструкций ssDNA, которые несут производные парвовирусных ITR из вирусов, отличных от AAV, B19d135 и GPVd162, обеспечивают системную доставку 5, 10, 20 или 50 мкг/мышь каждой генной кассеты экспрессии на основе ssDNA посредством HDI мышам HemA в возрасте 5-12 недель. Образцы крови собирают через 1, 3, 7, 14, 21 и 28 дней p.i., а затем один раз в месяц в течение периода 4 месяцев. Активность FVIII в крови анализируют с помощью хромогенного анализа активности FVIII.

Пример 4. Получение и оценивание in vivo экспрессионных конструкций ceDNA, несущих производные парвовирусных ITR из вирусов, отличных от AAV, B19d135 и GPVd162, в клетках насекомых.

Пример 4a. Применение бакуловирусной системы экспрессии для создания экспрессионных конструкций ceDNA, несущих производные ITR B19d135 и GPVd162.

[445] Аналогично конструкциям AAV-FVIII, B19-FVIII и GPV-FVIII, описанным в примере 1d, авторы настоящего изобретения применяют бакуловирусную систему экспрессии для получения экспрессионных генетических конструкций FVIII, несущих производные парвовирусных ITR из вирусов, отличных от AAV, B19d135 и GPVd162 в форме ceDNA, в клетках насекомых.

Пример 4b. Системная инъекция экспрессионных конструкций ceDNA, несущих производные парвовирусных ITR из вирусов, отличных от AAV, B19d135 и GPVd162 у мышей HemA.

[446] Для оценивания экспрессии FVIII in vivo из конструкций ceDNA, которые несут производные парвовирусных ITR из вирусов, отличных от AAV, B19d135 и GPVd162, обеспечивают системную доставку 5, 10, 20 или 50 мкг/мышь каждой генной кассеты экспрессии на основе ceDNA посредством HDI мышам HemA в возрасте 5-12 недель. Образцы крови собирают через 1, 3, 7, 14, 21 и 28 дней p.i., а затем один раз в месяц в течение периода 4 месяцев. Активность FVIII в крови анализируют с помощью хромогенного анализа активности FVIII.

Пример 5. Получение составов на основе липидных наночастиц с экспрессионными конструкциями ssDNA и ceDNA FVIII

[447] После получения каждой ssDNA или ceDNA согласно описанному в примерах 1 и 4 каждую генетическую конструкцию составляют в липидных наночастицах (LNP) с применением соответствующих липидных композиций путем микрожидкостного перемешивания (LNP-ssDNA и LNP-ceDNA). Родительские плазмиды, кодирующие кассеты экспрессии FVIII, фланкированные парвовирусными ITR из AAV либо вирусов, отличных от AAV, составленные в LNP, применяют в качестве контролей эффективности трансдукции.

Пример 6. Оценивание in vitro и in vivo LNP-ssDNA и LNP-ceDNA

Пример 6a. Оценивание in vitro экспрессии FVIII, опосредованной ssDNA и ceDNA, в культивируемых гепатоцитах.

[448] Генетические экспрессионные конструкции ssDNA или ceDNA FVIII и соответствующие родительские контрольные плазмиды составляют в LNP согласно описанному в примере 5 для направленной доставки генов. Клетки Huh7 или HEK293T (контрольные, отличные от гепатоцитов) высевают в 24-луночные планшеты для культивирования тканей при 7×10⁴ клеток/лунка и инкубируют в течение ночи. На следующий день составы на основе LNP-ssDNA или LNP-ceDNA добавляют к клеткам при 1000, 500, 250, 125 и 62,5 нг/лунка. Культуральную среду и клетки собирают через 24 и 48 часов после трансдукции. Активность FVIII в культуральной среде измеряют с помощью хромогенного анализа активности FVIII. Экспрессию FVIII в клетках также анализируют с помощью вестерн-блоттинга.

[449] Кроме того, в литературе было показано, что клеточные гистоны регулярно располагаются вдоль эписом rAAV, создавая хроматиноподобную структуру, сходную с нуклеосомным паттерном хромосомной ДНК в клетках. Следовательно, способность этих конструкций формировать хроматиноподобные нуклеосомные структуры, необходимые для устойчивой трансдукции клеток-мишеней, также оценивают с помощью Саузерн-блоттинга.

Пример 6b. Оценивание долговременной экспрессии FVIII, опосредованной ssDNA и ceDNA, составленными в LNP, у мышей HemA после внутривенного введения.

[450] Мышам HemA в возрасте 5-12 недель вводят LNP-ssDNA, LNP-ceDNA либо LNP-pDNA (контрольную плазмиду) при 5, 10, 20, 40, 100 мкг/мышь посредством IV инъекции, N=4/группа. Образцы крови собирают в выбранные моменты времени, начиная с 48 часов после инъекции в течение периода длительностью до 6 месяцев, и активность FVIII в крови анализируют с помощью хромогенного анализа активности FVIII. Профиль экспрессии FVIII у мышей, обработанных с помощью LNP-ssDNA или LNP-ceDNA, сравнивают с таковым у мышей, обработанных с помощью LNP-pDNA, для каждой генетической конструкции, описанной в примерах 1 и 4.

Пример 6c. Оценивание in vivo экспрессии FVIII, опосредованной ssDNA или ceDNA, после бустерной инъекции.

[451] Подгруппе мышей, обработанных с помощью LNP-ssDNA или LNP-ceDNA в примере 6b, дают дополнительную бустерную IV инъекцию соответствующих LNP в той же дозе через 2 месяца после первоначальной инъекции. Образцы крови собирают в выбранные моменты времени, начиная с 48 часов после бустерной инъекции в течение периода длительностью до 6 месяцев. Активность FVIII в крови анализируют с помощью хромогенного анализа активности FVIII. Профиль экспрессии FVIII у мышей, обработанных с помощью LNP-ssDNA или LNP-ceDNA, сравнивают с таковым у мышей, обработанных с помощью соответствующей LNP-pDNA.

Пример 7. Применимость генетических экспрессионных конструкций, несущих ITR, происходящие из B19 или GPV, для общего применения в генной терапии.

Пример 7a. Создание репортерных генетических конструкций, несущих ITR, происходящие из B19 или GPV.

[452] Для демонстрации применимости генетических систем экспрессии на основе ITR из вирусов, отличных от AAV, в качестве платформы для общего применения в путях применения в генной терапии создают репортерные конструкции, содержащие кассету экспрессии для зеленого флуоресцентного белка (GFP) или люциферазы (luc), фланкированную ITR из B19d135 или GPVd162, на основе конструкций, описанных в примере 1b. Таким образом, открытую рамку считывания (ORF) FVIII в B19-FVIIIco6XTEN (фиг. 1C) и GPV-FVIIIco6XTEN (фиг. 1D) заменяют на ORF GFP либо luc с помощью традиционных методик молекулярного клонирования.

[453] Кассеты экспрессии, фланкированные ITR из B19d135 или GPVd162, также создают для фенилаланингидроксилазы (PAH), которую применяют для оценивания экспрессии PAH в соответствующей мышиной модели.

Пример 7b. Получение репортерных генетических конструкций ssDNA, несущих ITR из B19 или GPV.

[454] Конструкции ssDNA репортер/PAH получают согласно описанному в примере 1c. Вкратце, плазмиды расщепляют с помощью LguI. Фрагменты ssDNA с образованными шпилечными структурами ITR создают путем денатурации продуктов расщепления двухнитевого фрагмента ДНК (репортерной кассеты экспрессии и плазмидного каркаса) под действием LguI при 95^oC и последующего охлаждения при 4^oC для обеспечения возможности сворачивания палиндромных последовательностей ITR (фиг. 1A). Полученные в результате конструкции ssDNA тестируют на мышах в отношении способности обеспечивать устойчивую трансдукцию в печени, мышечной ткани, фоторецепторах в глазу и центральной нервной системе (CNS).

Пример 7c. Оценивание in vivo экспрессии репортера, опосредованной ssDNA.

[455] Для подтверждения способности репортерных конструкций ssDNA, описанных в примере 7b, опосредовать устойчивую экспрессию трансгена in vivo мышам в возрасте 5-12 недель (4 животных на группу) инъецируют 5, 10 или 20 мкг/мышь репортерной ssDNA системно, местно для нацеливания на мышечную ткань и клетки CNS и/или субретинально для нацеливания на фоторецепторные клетки.

[456] Для оценивания экспрессии PAH из экспрессионных конструкций на основе ITR из В19 и GPV применяют соответствующую мышиную модель заболевания. Эти генетические конструкции доставляются системно посредством HDI для нацеливания на печень.

ВАРИАНТЫ ОСУЩЕСТВЛЕНИЯ

[457] E1. Молекула нуклеиновой кислоты, содержащая первый инвертированный концевой повтор (ITR), второй ITR и генную кассету, кодирующую терапевтический белок; где первый ITR и/или второй ITR представляют собой ITR вируса, отличного от аденоассоциированного вируса (вируса, отличного от AAV), где генная кассета расположена между первым ITR и вторым ITR, и где терапевтический белок содержит фактор свертывания крови.

[458] E2. Молекула нуклеиновой кислоты согласно E1, где вирус, отличный от AAV, выбран из группы, состоящей из представителя семейства вирусов Parvoviridae.

[459] E3. Молекула нуклеиновой кислоты согласно E1 или E2, где первый ITR представляет собой ITR вируса, отличного от AAV, а второй ITR представляет собой ITR аденоассоциированного вируса (AAV), или где первый ITR представляет собой ITR AAV, а второй ITR представляет собой ITR вируса, отличного от AAV.

[460] E4. Молекула нуклеиновой кислоты согласно E1 или E2, где первый ITR и второй ITR представляют собой ITR вируса, отличного от AAV.

[461] E5. Молекула нуклеиновой кислоты согласно любому из E1, E2 и E4, где первый ITR и второй ITR являются идентичными.

[462] E6. Молекула нуклеиновой кислоты согласно любому из E1-E5, где первый ITR и/или второй ITR содержат палиндромную последовательность, которая является непрерывной.

[463] E7. Молекула нуклеиновой кислоты согласно любому из E1-E5, где первый ITR и/или второй ITR содержат палиндромную последовательность, которая является прерывистой.

[464] E8. Молекула нуклеиновой кислоты согласно любому из E1-E7, где вирус, отличный от AAV, является представителем семейства вирусов Parvoviridae.

[465] E9. Молекула нуклеиновой кислоты согласно E8, где представитель семейства вирусов Parvoviridae выбран из группы, состоящей из Bocavirus, Dependovirus, Erythrovirus, Amdovirus, Parvovirus, Densovirus, Iteravirus, Contravirus, Aveparvovirus, Copiparvovirus, Protoparvovirus, Tetraparvovirus, Ambidensovirus, Brevidensovirus, Hepandensovirus, и Penstyldensovirus.

[466] E10. Молекула нуклеиновой кислоты согласно E8, где представителем семейства вирусов Parvoviridae является эритровирус, представляющий собой парвовирус B19 (вирус человека).

[467] E11. Молекула нуклеиновой кислоты согласно E8, где представитель семейства вирусов Parvoviridae представляет собой штамм парвовируса мускусных уток (MDPV).

[468] E12. Молекула нуклеиновой кислоты согласно E11, где штамм MDPV представляет собой аттенуированный штамм FZ91-30.

[469] E13. Молекула нуклеиновой кислоты согласно E11, где штамм MDPV представляет собой патогенный штамм YY.

[470] E14. Молекула нуклеиновой кислоты согласно E8, где Dependoparvovirus представляет собой штамм парвовируса гусей (GPV) из рода Dependovirus.

[471] E15. Молекула нуклеиновой кислоты согласно E14, где штамм GPV представляет собой аттенуированный штамм 82-0321V.

[472] E16. Молекула нуклеиновой кислоты согласно E14, где штамм GPV представляет собой патогенный штамм B.

[473] E17. Молекула нуклеиновой кислоты согласно E8, где представитель семейства вирусов Parvoviridae выбран из группы, состоящей из парвовируса свиней (U44978), мелкого вируса мышей (U34256), парвовируса собак (M19296) и вируса энтерита норок (D00765).

[474] E18. Молекула нуклеиновой кислоты согласно любому из E1-E17, которая дополнительно содержит промотор.

[475] E19. Молекула нуклеиновой кислоты согласно E18, где промотор представляет собой тканеспецифический промотор.

[476] E20. Молекула нуклеиновой кислоты согласно E18 или E19, где промотор управляет экспрессией терапевтического белка в гепатоцитах, эндотелиальных клетках, мышечных клетках, синусоидальных клетках или любой их комбинации.

[477] E21. Молекула нуклеиновой кислоты согласно E18 или E19, где промотор управляет экспрессией терапевтического белка в гепатоцитах.

[478] E22. Молекула нуклеиновой кислоты согласно любому из E18-E21, где промотор расположен в направлении 5' относительно последовательности нуклеиновой кислоты, кодирующей фактор свертывания крови.

[479] E23. Молекула нуклеиновой кислоты согласно любому из E18-E22, где промотор выбран из группы, состоящей из промотора гена тиретина мыши (mTTR), промотора гена эндогенного фактора VIII человека (F8), промотора гена альфа-1-антитрипсина человека (hAAT), минимального промотора гена альбумина человека, промотора гена альбумина мыши, промотора гена тристетрапролина (TTP), промотора CASI, промотора CAG, промотора цитомегаловируса (CMV), промотора гена α1-антитрипсина (AAT), мышечной креатинкиназы (MCK), тяжелой цепи миозина альфа (αMHC), миоглобина (MB), десмина (DES), SPc5-12, 2R5Sc5-12, dMCK, tMCK и фосфоглицераткиназы (PGK).

[480] E24. Молекула нуклеиновой кислоты согласно любому из E18-E23, где промотор включает в себя промотор TTP.

[481] E25. Молекула нуклеиновой кислоты согласно любому из E1-E24, где нуклеотидная последовательность дополнительно содержит интронную последовательность.

[482] E26. Молекула нуклеиновой кислоты согласно E25, где интронная последовательность расположена в направлении 5' относительно последовательности нуклеиновой кислоты, кодирующей фактор свертывания крови.

[483] E27. Молекула нуклеиновой кислоты согласно E25 или E26, где интронная последовательность расположена в направлении 3' относительно промотора.

[484] E28. Молекула нуклеиновой кислоты согласно любому из E25-E27, где интронная последовательность включает в себя синтетическую интронную последовательность.

[485] E29. Молекула нуклеиновой кислоты согласно любому из E25-E28, где интронная последовательность содержит SEQ ID NO: 115.

[486] E30. Молекула нуклеиновой кислоты согласно любому из E1-E29, где генная кассета дополнительно содержит посттранскрипционный регуляторный элемент.

[487] E31. Молекула нуклеиновой кислоты согласно E30, где посттранскрипционный регуляторный элемент расположен в направлении 3' относительно последовательности нуклеиновой кислоты, кодирующей фактор свертывания крови.

[488] E32. Молекула нуклеиновой кислоты согласно E30 или E31, где посттранскрипционный регуляторный элемент включает в себя мутантный посттранскрипционный регуляторный элемент вируса гепатита сурков (WPRE), сайт связывания microRNA, последовательность, направляющую ДНК к ядру, или любую их комбинацию.

[489] E33. Молекула нуклеиновой кислоты согласно E32, где сайт связывания microRNA включает в себя сайт связывания с miR142-3p.

[490] E34. Молекула нуклеиновой кислоты согласно любому из E1-E33, где генная кассета дополнительно содержит последовательность poly(A)-хвоста 3'-UTR.

[491] E35. Молекула нуклеиновой кислоты согласно E34, где последовательность poly(A)-хвоста 3'-UTR выбрана из группы, состоящей из poly(A) гена bGH, poly(A) гена актина, poly(A) гена гемоглобина и любой их комбинации.

[492] E36. Молекула нуклеиновой кислоты согласно E34 или E35, где последовательность poly(A)-хвоста 3'-UTR включает в себя poly(A) гена bGH.

[493] E37. Молекула нуклеиновой кислоты согласно любому из E1-E36, где генная кассета дополнительно содержит энхансерную последовательность.

[494] E38. Молекула нуклеиновой кислоты согласно E37, где энхансерная последовательность расположена между первым ITR и вторым ITR.

[495] E39. Молекула нуклеиновой кислоты согласно любому из E1-E38, где молекула нуклеиновой кислоты содержит в следующем порядке: первый ITR, генную кассету и второй ITR; где генная кассета содержит последовательность тканеспецифического промотора, интронную последовательность, последовательность нуклеиновой кислоты, кодирующую фактор свертывания крови, посттранскрипционный регуляторный элемент и последовательность poly(A)-хвоста 3'-UTR.

[496] E40. Молекула нуклеиновой кислоты согласно E39, где генная кассета содержит в следующем порядке: последовательность тканеспецифического промотора, интронную последовательность, последовательность нуклеиновой кислоты, кодирующую полипептид FVIII, посттранскрипционный регуляторный элемент и последовательность poly(A)-хвоста 3'-UTR.

[497] E41. Молекула нуклеиновой кислоты согласно E38 или E39, где

[498] (a) первый ITR представляет собой ITR вируса, отличного от AAV, являющегося представителем семейства Parvoviridae;

[499] (b) последовательность тканеспецифического промотора включает в себя промотор TTP;

[500] (c) интрон представляет собой синтетический интрон;

[501] (d) нуклеотидная последовательность кодирует фактор свертывания крови;

[502] (e) посттранскрипционный регуляторный элемент включает в себя WPRE;

[503] (f) последовательность poly(A)-хвоста 3'-UTR включает в себя bGHpA; и

[504] (g) второй ITR представляет собой ITR вируса, отличного от AAV, являющегося представителем семейства Parvoviridae.

[505] E42. Молекула нуклеиновой кислоты согласно любому из E1-E41, где генная кассета содержит однонитевую нуклеиновую кислоту.

[506] E43. Молекула нуклеиновой кислоты согласно любому из E1-E41, где генная кассета содержит двухнитевую нуклеиновую кислоту.

[507] E44. Молекула нуклеиновой кислоты согласно любому из E1-E43, где фактор свертывания крови экспрессируется гепатоцитами, эндотелиальными клетками, мышечными клетками, синусоидальными клетками или любой их комбинацией.

[508] E45. Молекула нуклеиновой кислоты согласно любому из E1-E44, где фактор свертывания крови включает в себя фактор I (FI), фактор II (FII), фактор V (FV), фактор VII (FVII), фактор VIII (FVIII), фактор IX (FIX), фактор X (FX), фактор XI (FXI), фактор XII (FXII), фактор XIII (FVIII), фактор фон Виллебранда (VWF), прекалликреин, высокомолекулярный кининоген, фибронектин, антитромбин III, кофактор гепарина II, белок C, белок S, белок Z, ингибитор протеаз, связанный с белком Z (ZPI), плазминоген, альфа-2-антиплазмин, тканевой активатор плазминогена (tPA), урокиназу, ингибитор активатора плазминогена-1 (PAI-1), ингибитор активатора плазминогена-2 (PAI2) или любую их комбинацию.

[509] E46. Молекула нуклеиновой кислоты согласно любому из E1-E45, где фактор свертывания крови представляет собой FVIII.

[510] E47. Молекула нуклеиновой кислоты согласно E46, где FVIII включает в себя полноразмерный зрелый FVIII.

[511] E48. Молекула нуклеиновой кислоты согласно E47, где FVIII содержит аминокислотную последовательность, которая на по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична аминокислотной последовательности, характеризующейся SEQ ID NO: 106.

[512] E49. Молекула нуклеиновой кислоты согласно E46, где FVIII содержит домен A1, домен A2, домен A3, домен C1, домен C2, а также содержит частичный домен B или вообще не содержит его.

[513] E50. Молекула нуклеиновой кислоты согласно E49, где FVIII содержит аминокислотную последовательность, которая на по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична аминокислотной последовательности под SEQ ID NO:109.

[514] E51. Молекула нуклеиновой кислоты согласно любому из E1-E50, где фактор свертывания крови содержит гетерологичный компонент.

[515] E52. Молекула нуклеиновой кислоты согласно E51, где гетерологичный компонент выбран из группы, состоящей из альбумина или его фрагмента, Fc-области иммуноглобулина, C-концевого пептида (CTP) β-субъединицы хорионического гонадотропина человека, последовательности PAS, последовательности HAP, трансферрина или его фрагмента, альбумин-связывающего компонента, их производного или любой их комбинации.

[516] E53. Молекула нуклеиновой кислоты согласно E51 или E52, где гетерологичный компонент связан с N-концом или C-концом FVIII или вставлен между двумя аминокислотами в FVIII.

[517] E54. Молекула нуклеиновой кислоты согласно E53, где гетерологичный компонент вставлен между двумя аминокислотами в одном или нескольких сайтах вставки, выбранных из сайтов вставки, перечисленных в таблице 5.

[518] E55. Молекула нуклеиновой кислоты согласно любому из E45-E54, где FVIII дополнительно содержит домен A1, домен A2, домен C1, домен C2, необязательный домен B и гетерологичный компонент, где гетерологичный компонент вставлен непосредственно ниже аминокислоты 745, соответствующей зрелому FVIII (SEQ ID NO:106).

[519] E56. Молекула нуклеиновой кислоты согласно любому из E53-55, где FVIII дополнительно содержит партнера по связыванию FcRn.

[520] E57. Молекула нуклеиновой кислоты согласно E56, где партнер по связыванию FcRn содержит Fc-область константного домена иммуноглобулина.

[521] E58. Молекула нуклеиновой кислоты согласно любому из E45-E57, где последовательность нуклеиновой кислоты, кодирующая FVIII, является кодон-оптимизированной.

[522] E59. Молекула нуклеиновой кислоты согласно любому из E45-E58, где последовательность нуклеиновой кислоты, кодирующая FVIII, является кодон-оптимизированной для экспрессии у человека.

[523] E60. Молекула нуклеиновой кислоты согласно E59, где последовательность нуклеиновой кислоты, кодирующая FVIII, содержит нуклеотидную последовательность, которая на по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или приблизительно 100% идентична нуклеотидной последовательности под SEQ ID NO: 107.

[524] E61. Молекула нуклеиновой кислоты согласно E59, где последовательность нуклеиновой кислоты, кодирующая FVIII, содержит нуклеотидную последовательность, которая на по меньшей мере приблизительно 60%, по меньшей мере приблизительно 65%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или приблизительно 100% идентична нуклеотидной последовательности под SEQ ID NO: 71.

[525] E62. Молекула нуклеиновой кислоты согласно любому из E1-61, где молекула нуклеиновой кислоты составлена со средством доставки.

[526] E63. Молекула нуклеиновой кислоты согласно E62, где средство доставки включает в себя липидную наночастицу.

[527] E64. Молекула нуклеиновой кислоты согласно E63, где средство доставки выбрано из группы, состоящей из липосом, нелипидных полимерных молекул, эндосом и любой их комбинации.

[528] E65. Молекула нуклеиновой кислоты согласно любому из E1-E64, где молекула нуклеиновой кислоты составлена для внутривенной, трансдермальной, внутрикожной, подкожной, пульмональной или пероральной доставки или любой их комбинации.

[529] E66. Молекула нуклеиновой кислоты согласно E65, где молекула нуклеиновой кислоты составлена для внутривенной доставки.

[530] E67. Вектор, содержащий молекулу нуклеиновой кислоты согласно любому из E1-E66.

[531] E68. Полипептид, кодируемый молекулой нуклеиновой кислоты согласно любому из E1-E66.

[532] E69. Клетка-хозяин, содержащая молекулу нуклеиновой кислоты согласно любому из E1-66.

[533] E70. Фармацевтическая композиция, содержащая (а) нуклеиновую кислоту согласно любому из E1-66, вектор согласно E67, полипептид согласно E68 или клетку-хозяина согласно E69; (b) LNP и (с) фармацевтически приемлемое вспомогательное вещество.

[534] E71. Набор, содержащий молекулу нуклеиновой кислоты согласно любому из E1-66 и инструкции по введению молекулы нуклеиновой кислоты нуждающемуся в этом субъекту.

[535] E72. Бакуловирусная система для получения молекулы нуклеиновой кислоты согласно любому из E1-E66.

[536] E73. Бакуловирусная система согласно E72, где молекулу нуклеиновой кислоты согласно любому из E1-66 получают в клетках насекомых.

[537] E74. Система доставки на основе наночастиц для экспрессионных конструкций, где экспрессионная конструкция содержит молекулу нуклеиновой кислоты согласно любому из Е1-Е66.

[538] E75. Способ получения полипептида со свертывающей активностью, включающий культивирование клетки-хозяина согласно E69 в подходящих условиях и извлечение полипептида со свертывающей активностью.

[539] E76. Способ обеспечения экспрессии фактора свертывания крови у нуждающегося в этом субъекта, включающий введение субъекту молекулы нуклеиновой кислоты согласно любому из E1-E66, вектора согласно E67, полипептида согласно E68 или фармацевтической композиции согласно E70.

[540] E77. Способ лечения субъекта, имеющего дефицит фактора свертывания крови, включающий введение субъекту молекулы нуклеиновой кислоты согласно любому из E1-E66, вектора согласно E67, полипептида согласно E68 или фармацевтической композиции согласно E70.

[541] E78. Способ согласно E76 или E77, где молекулу нуклеиновой кислоты вводят внутривенно, трансдермально, внутрикожно, подкожно, перорально, пульмонально или с помощью любой их комбинации.

[542] E79. Способ согласно E78, где молекулу нуклеиновой кислоты вводят внутривенно.

[543] E80. Способ согласно любому из E76-E79, дополнительно включающий введение субъекту второго средства.

[544] E81. Способ согласно любому из E76-E80, где субъектом является млекопитающее.

[545] E82. Способ согласно любому из E76-E81, где субъектом является человек.

[546] E83. Способ согласно любому из E76-E82, где введение молекулы нуклеиновой кислоты субъекту приводит к увеличению активности FVIII относительно активности FVIII у субъекта до введения, где активность FVIII увеличивается в по меньшей мере приблизительно 2 раза, по меньшей мере приблизительно 3 раза, по меньшей мере приблизительно 4 раза, по меньшей мере приблизительно 5 раз, по меньшей мере приблизительно 6 раз, по меньшей мере приблизительно 7 раз, по меньшей мере приблизительно 8 раз, по меньшей мере приблизительно 9 раз, по меньшей мере приблизительно 10 раз, по меньшей мере приблизительно 11 раз, по меньшей мере приблизительно 12 раз, по меньшей мере приблизительно 13 раз, по меньшей мере приблизительно 14 раз, по меньшей мере приблизительно 15 раз, по меньшей мере приблизительно 20 раз, по меньшей мере приблизительно 25 раз, по меньшей мере приблизительно 30 раз, по меньшей мере приблизительно 35 раз, по меньшей мере приблизительно 40 раз, по меньшей мере приблизительно 50 раз, по меньшей мере приблизительно 60 раз, по меньшей мере приблизительно 70 раз, по меньшей мере приблизительно 80 раз, по меньшей мере приблизительно 90 раз или по меньшей мере приблизительно 100 раз.

[547] E84. Способ согласно любому из E76-E83, где у субъекта имеется нарушение свертываемости крови.

[548] E85. Способ согласно E84, где нарушение свертываемости крови представляет собой гемофилию.

[549] E86. Способ согласно E84 или E85, где нарушение свертываемости крови представляет собой гемофилию A.

[550] E83. Способ согласно любому из E76-E82, E85 и E86, где введение молекулы нуклеиновой кислоты субъекту приводит к увеличению активности FVIII относительно активности FVIII у субъекта до введения, где активность FVIII увеличивается на по меньшей мере приблизительно 2%, по меньшей мере приблизительно 3%, по меньшей мере приблизительно 4%, по меньшей мере приблизительно 5%, по меньшей мере приблизительно 6%, по меньшей мере приблизительно 7%, по меньшей мере приблизительно 8%, по меньшей мере приблизительно 9%, по меньшей мере приблизительно 10%, по меньшей мере приблизительно 11%, по меньшей мере приблизительно 12%, по меньшей мере приблизительно 13%, по меньшей мере приблизительно 14%, по меньшей мере приблизительно 15%, по меньшей мере приблизительно 20%, по меньшей мере приблизительно 25%, по меньшей мере приблизительно 30%, по меньшей мере приблизительно 35%, по меньшей мере приблизительно 40%, по меньшей мере приблизительно 50%, по меньшей мере приблизительно 60%, по меньшей мере приблизительно 70%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 100%, по меньшей мере приблизительно 110%, по меньшей мере приблизительно 120%, по меньшей мере приблизительно 130%, по меньшей мере приблизительно 140%, по меньшей мере приблизительно 150% относительно нормальной активности FVIII.

Настоящая заявка испрашивает приоритет по предварительной заявке на патент США № 62/543297, поданной 9 августа 2017 г., которая включена в данный документ посредством ссылки во всей своей полноте.

--->

ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ

<110> BIOVERATIV THERAPEUTICS INC.

Seregin, Alexey

Liu, Tongyao

Patarroyo-White, Susannah

Drager, Douglas

Peters, Robert T.

Liu, Jiayun

<120> МОЛЕКУЛЫ НУКЛЕИНОВОЙ КИСЛОТЫ И ПУТИ ИХ ПРИМЕНЕНИЯ

<130> 4159.493PC01/C-K/BMD

<150> US 62/543,297

<151> 2017-08-09

<160> 184

<170> PatentIn версия 3.5

<210> 1

<211> 4374

<212> ДНК

<213> Искусственная последовательность

<220>

<223> coFVIII-5

<400> 1

atgcaaatcg aactgagcac ctgtttcttc ctctgcctgc tgagattctg tttctccgcg

60

acccgccgat actacctggg agcagtggag ctctcctggg attacatgca gagcgacctt

120

ggggagctgc ccgtggatgc caggttccct ccccgggtgc caaagtcgtt tccgttcaac

180

acctccgtgg tgtacaagaa aactctgttc gtggagttca ccgaccacct gttcaatatc

240

gccaagccca gacctccctg gatggggctg ttgggaccta ccatccaagc ggaggtgtac

300

gacactgtgg tcatcactct gaagaacatg gcctcgcatc ccgtgtccct gcacgccgtg

360

ggagtgtctt actggaaagc gtccgagggg gccgaatacg acgaccagac ctcgcagaga

420

gaaaaggaag atgacaaggt gttcccagga ggatcgcaca cctacgtgtg gcaagtgttg

480

aaggagaacg gcccaatggc ctccgacccg ctgtgcctga cctactcgta cctgtcccac

540

gtggacctcg tgaaggacct caactcggga ctgattggag ccctgctggt ctgcagggaa

600

ggctcactgg cgaaagaaaa gactcagacc ttgcacaagt tcattctgct gttcgctgtg

660

ttcgacgagg ggaagtcgtg gcacagcgag actaagaact ccctgatgca agatagagat

720

gccgcctccg cccgggcctg gcctaagatg cacaccgtga acggttacgt gaaccgctcc

780

ctccctggcc tgattggatg ccaccggaag tccgtgtact ggcacgtgat cgggatgggg

840

accacccccg aggtgcacag catcttcctg gaaggtcaca catttctcgt gcgcaaccac

900

cggcaggcct ccctggaaat cagccccatt accttcctca ctgcccagac tctgctgatg

960

gacctgggac agttcctgct gttctgccat atctcctccc accaacatga cggaatggag

1020

gcatacgtga aggtcgattc ctgccctgag gaaccccagc tccgcatgaa gaacaatgag

1080

gaagccgagg actacgacga cgacctgacg gatagcgaga tggatgtggt ccggttcgat

1140

gacgataaca gcccttcctt catccaaatt cgctcggtgg caaagaagca ccccaagacc

1200

tgggtgcatt acattgcggc ggaagaagag gactgggatt atgccccgct tgtcctcgct

1260

cctgacgacc ggagctacaa gagccagtac ctgaacaacg gtccacagag gatcggtaga

1320

aagtacaaga aggtccgctt catggcctat accgacgaaa ccttcaaaac tagagaggcc

1380

atccaacacg aatccggcat cctgggcccg ctcttgtacg gagaagtcgg cgacaccctt

1440

ctcattatct tcaagaacca ggcttcccgg ccgtacaaca tctatccgca tgggatcact

1500

gacgtgcgcc cactgtactc gcggcgcctg cccaagggtg tcaaacacct gaaggatttt

1560

ccgatccttc cgggagaaat cttcaagtac aagtggaccg tgaccgtgga agatggccca

1620

actaagtctg accctagatg cctcacccgc tactactcat ccttcgtcaa catggagcgc

1680

gacctggcca gcggactgat cggcccgctg ctgatttgct acaaggaatc agtggaccaa

1740

cggggaaacc agatcatgtc ggataagagg aacgtcatcc tcttctccgt gtttgacgaa

1800

aaccggtcgt ggtacctgac tgaaaacatc cagcggttcc tccccaaccc cgcgggcgtg

1860

cagctggaag atcctgagtt tcaggcatca aacatcatgc actccattaa cggctacgtg

1920

ttcgattcgc tgcagctgag cgtgtgtctg cacgaagtgg cctactggta catcctgtcc

1980

attggtgccc agactgactt cctgtccgtg tttttctccg gctacacgtt caagcacaag

2040

atggtgtacg aggacaccct gaccctcttc cctttttccg gcgaaactgt gtttatgagc

2100

atggagaatc ccggcctgtg gatcttgggc tgccacaaca gcgacttccg taacagagga

2160

atgactgcgc tgctcaaggt gtccagctgc gacaagaaca ccggagacta ttatgaggac

2220

tcatacgagg acatctccgc ctacctcctg tccaagaata acgccattga acctcggagc

2280

ttcagccaga acccacccgt gcttaagaga catcaacggg agatcactag gaccaccctg

2340

cagtcagacc aggaggaaat cgactacgat gacaccatct cggtcgagat gaagaaggag

2400

gactttgaca tctacgacga agatgaaaac cagagcccga ggtcgttcca aaagaaaacc

2460

cgccactact ttattgctgc tgtcgagcgg ctgtgggact acggaatgtc gtcctcgccg

2520

cacgtgctcc gcaaccgagc ccagagcggc tcggtgccgc aattcaagaa ggtcgtgttc

2580

caggagttca ctgacgggag cttcactcag cctttgtacc ggggagaact caatgaacat

2640

ctcggcctcc tcggacctta catcagagca gaagtggaag ataacatcat ggtcactttc

2700

cgtaaccaag ccagccgccc gtactcgttc tactcctccc tcatttctta cgaagaggac

2760

cagcggcagg gcgcagaacc gcgcaagaac ttcgtgaagc ccaacgaaac caagacctac

2820

ttctggaaag tgcagcatca tatggccccg actaaggacg agtttgactg caaagcctgg

2880

gcctacttct ccgatgtgga cttggagaag gacgtccact ccggcctcat cggtcccctg

2940

ctcgtgtgcc ataccaatac cctgaacccc gcacacggtc gccaggtcac cgtgcaggag

3000

ttcgctctgt tcttcactat cttcgacgaa actaagtcct ggtacttcac cgagaacatg

3060

gagaggaact gcagagcccc ctgtaacatc cagatggagg acccgacgtt caaggaaaac

3120

taccggttcc acgccattaa cggatacatc atggatacgc tgccgggtct tgtgatggcc

3180

caggatcaac ggatcagatg gtacttattg tcgatgggca gcaacgagaa catccactct

3240

attcacttct ccggtcatgt gttcactgtg cggaagaagg aagagtacaa gatggccctg

3300

tacaaccttt atcccggagt gttcgaaact gtggaaatgc tgccgtcgaa ggccggcatt

3360

tggcgcgtgg agtgtttgat tggagaacat ctccatgcgg ggatgtcaac cctgttcctg

3420

gtgtatagca acaagtgcca gactccgctt gggatggcgt caggacacat tagggatttc

3480

cagatcactg cgtccggcca gtacggccaa tgggccccta agctggcccg cctgcattac

3540

tccggatcca ttaacgcctg gtcaaccaag gagccattct cctggatcaa ggtggacctt

3600

ctggccccca tgattatcca cggaattaag acccaggggg cccggcagaa gttctcctca

3660

ctgtacatca gccagttcat aatcatgtac tccctggacg gaaagaagtg gcaaacctac

3720

agggggaaca gcaccggcac actgatggtc tttttcggaa atgtggactc ctccgggatt

3780

aagcataaca tcttcaaccc tccgattatc gctcggtaca ttagacttca ccctacccac

3840

tacagcattc gctccaccct gcggatggaa ctgatgggct gcgatctgaa ctcgtgcagc

3900

atgccgttgg gaatggagtc caaagcaatt tccgacgcgc agatcaccgc ctcgtcctac

3960

tttaccaaca tgttcgccac gtggtcaccg tccaaggccc ggctgcacct ccagggaaga

4020

tccaacgcat ggcggccaca ggtcaacaac cctaaggagt ggctccaggt ggacttccag

4080

aaaaccatga aggtcaccgg agtcacaacc cagggagtga agtcgctgct gacttctatg

4140

tacgtcaagg agttcctgat ctccagcagc caggacgggc accagtggac cctgttcttc

4200

caaaatggaa aggtcaaggt gtttcagggc aatcaggatt cattcacccc ggtggtgaac

4260

tcccttgatc cacccctcct gacccgctac cttcgcatcc acccacagtc ctgggtgcac

4320

cagatcgcgc tgaggatgga ggtcctggga tgcgaagccc aggacctgta ctga

4374

<210> 2

<211> 4374

<212> ДНК

<213> Искусственная последовательность

<220>

<223> coFVIII-4

<400> 2

atgcagatcg agctgagcac gtgcttcttc ctgtgcctgc tgaggttctg cttcagcgcc

60

accaggaggt actacctggg cgccgtggag ctgagctggg actacatgca gagcgacctg

120

ggcgagctgc ccgtggacgc caggttcccc cccagggtgc ccaagagctt ccccttcaac

180

acgagcgtgg tgtacaagaa gaccctgttc gtggagttca ccgaccatct gttcaatatc

240

gccaagccca ggcccccctg gatggggctg ctggggccca cgatccaggc cgaggtgtac

300

gacaccgtgg tcatcaccct gaagaacatg gccagccacc ccgtgagcct gcacgccgtg

360

ggcgtgagct actggaaggc cagcgagggc gccgagtacg acgaccagac cagccagagg

420

gagaaggagg acgacaaggt gttccccggc ggcagccaca cctacgtgtg gcaggtgctg

480

aaggagaatg ggcccatggc cagcgacccc ctgtgcctga cctactctta cctgagccac

540

gtggatctgg tgaaggacct gaacagcggc ctgatcggcg ccctgctggt gtgcagggag

600

ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg

660

ttcgacgagg gcaagagctg gcacagcgag accaagaaca gcctgatgca ggatagggac

720

gccgccagcg ccagggcctg gcccaagatg cacaccgtga acggctacgt gaacaggtct

780

ctgcccggcc tgatcggctg ccacaggaag agcgtgtact ggcacgtgat cggcatgggg

840

accacccccg aggtgcacag catcttcctg gagggccaca cgttcctggt gaggaatcac

900

aggcaggcca gcctggagat cagcccgatc accttcctga ccgcccagac cctgctgatg

960

gacctggggc agttcctgct gttctgccat atcagctctc accagcacga cggcatggag

1020

gcctacgtga aggtggatag ctgccccgag gagccccagc tgaggatgaa gaacaacgag

1080

gaggccgagg actacgacga cgacctgacc gacagcgaga tggacgtggt gaggttcgac

1140

gacgacaata gcccgagctt catccagatc aggagcgtgg ccaagaagca ccccaagacc

1200

tgggtgcatt acatcgccgc cgaggaggag gattgggact acgcccccct ggtgctggcc

1260

cccgacgaca ggtcttacaa gagccagtac ctgaacaacg ggccccagag gatcggcagg

1320

aagtacaaga aggtgaggtt catggcctac accgacgaga ccttcaagac cagggaggcg

1380

atccagcacg agagcgggat cctggggccc ctgctgtacg gcgaggtggg cgacacgctg

1440

ctgatcatct tcaagaacca ggccagcagg ccgtacaata tctaccccca cgggatcacc

1500

gacgtgaggc ccctgtactc taggaggctg cccaagggcg tgaagcacct gaaggacttc

1560

cccatcctgc ccggcgagat cttcaagtac aagtggaccg tgaccgtgga ggacgggccc

1620

acgaagagcg accccaggtg cctgaccagg tactacagct ctttcgtgaa catggagagg

1680

gacctggcca gcggcctgat cgggcccctg ctgatctgct acaaggagag cgtggatcag

1740

aggggcaacc agatcatgag cgacaagagg aacgtgatcc tgttcagcgt gttcgacgag

1800

aataggtctt ggtacctgac cgagaatatc cagaggttcc tgcccaaccc cgccggcgtg

1860

cagctggagg atcccgagtt ccaggccagc aacatcatgc acagcatcaa cggctacgtg

1920

ttcgacagcc tgcagctgag cgtgtgcctg cacgaggtgg cctactggta catcctgagc

1980

atcggcgccc agaccgactt cctgagcgtg ttcttcagcg gctacacctt caagcacaag

2040

atggtgtacg aggataccct gaccctgttc cccttcagcg gcgagaccgt gttcatgagc

2100

atggagaacc ccggcctgtg gatcctgggc tgccataact ccgacttcag gaataggggc

2160

atgaccgccc tgctgaaggt gagctcttgc gacaagaaca ccggcgacta ctacgaggat

2220

agctacgagg atatcagcgc ctacctgctg agcaagaaca acgccatcga gcccaggtct

2280

ttcagccaga acccccccgt gctgaagagg caccagaggg agatcaccag gacgaccctg

2340

cagagcgacc aggaggagat cgactacgac gacacgatca gcgtggagat gaagaaggag

2400

gatttcgaca tctacgacga ggacgagaat cagagcccca ggtctttcca gaagaagacc

2460

aggcattact tcatcgccgc cgtggagagg ctgtgggact acggcatgag cagctctccc

2520

cacgtgctga ggaatagggc ccagagcggc agcgtgcccc agttcaagaa ggtggtgttc

2580

caggagttca ccgacggcag cttcacccag cccctgtaca ggggcgagct gaacgagcac

2640

ctgggcctgc tggggcccta catcagggcc gaggtggagg ataacatcat ggtgaccttc

2700

aggaatcagg ccagcaggcc ctatagcttc tatagctctc tgatcagcta cgaggaggat

2760

cagaggcagg gcgccgagcc caggaagaac ttcgtgaagc ccaacgagac caagacctac

2820

ttctggaagg tgcagcacca catggccccc acgaaggacg agttcgactg caaggcctgg

2880

gcctacttca gcgacgtgga tctggagaag gacgtgcaca gcggcctgat cgggcccctg

2940

ctggtgtgcc acaccaacac cctgaacccc gcccacggca ggcaggtgac cgtgcaggag

3000

ttcgccctgt tcttcaccat cttcgacgag accaagagct ggtacttcac cgagaatatg

3060

gagaggaatt gcagggcccc ctgcaatatc cagatggagg acccgacctt caaggagaat

3120

tacaggttcc acgccatcaa cggctacatc atggacacgc tgcccggcct ggtcatggcc

3180

caggatcaga ggatcaggtg gtatctgctg agcatgggga gcaacgagaa tatccacagc

3240

atccacttca gcggccacgt gttcaccgtg aggaagaagg aggagtacaa gatggccctg

3300

tacaatctgt accccggcgt gttcgagacc gtggagatgc tgcccagcaa ggccgggatc

3360

tggagggtgg agtgcctgat cggcgagcac ctgcacgccg gcatgagcac gctgttcctg

3420

gtgtactcta acaagtgcca gacccccctg gggatggcca gcggccacat cagggacttc

3480

cagatcaccg ccagcggcca gtacggccag tgggccccca agctggccag gctgcactat

3540

tccggaagca tcaacgcctg gagcacgaag gagcccttca gctggatcaa ggtggatctg

3600

ctggccccca tgatcatcca cgggatcaag acccagggcg ccaggcagaa gttcagctct

3660

ctgtatatca gccagttcat catcatgtac tctctggacg gcaagaagtg gcagacctac

3720

aggggcaaca gcaccggcac gctgatggtg ttcttcggca acgtggactc tagcgggatc

3780

aagcacaata tcttcaaccc ccccatcatc gccaggtaca tcaggctgca ccccacccat

3840

tactctatca ggtctaccct gaggatggag ctgatgggct gcgacctgaa cagctgcagc

3900

atgcccctgg ggatggagag caaggccatc agcgacgccc agatcaccgc cagctcttac

3960

ttcaccaaca tgttcgccac ctggagcccg agcaaggcca ggctgcacct gcagggcagg

4020

tctaacgcct ggaggcccca ggtgaacaac cccaaggagt ggctgcaggt ggatttccag

4080

aagaccatga aggtgaccgg cgtgaccacg cagggcgtga agagcctgct gaccagcatg

4140

tacgtgaagg agttcctgat cagctctagc caggacggcc accagtggac cctgttcttc

4200

cagaacggca aggtgaaggt gttccagggc aaccaggata gcttcacccc cgtggtgaac

4260

agcctggacc cccccctgct gaccaggtat ctgaggatcc acccccagag ctgggtgcac

4320

cagatcgccc tgaggatgga ggtgctgggc tgcgaggccc aggatctgta ttga

4374

<210> 3

<211> 4374

<212> ДНК

<213> Искусственная последовательность

<220>

<223> coFVIII-52

<400> 3

atgcaaatcg aactgagcac ctgtttcttc ctctgcctgc tgagattctg tttctccgcg

60

acccgccgat actacctggg agcagtggag ctctcctggg attacatgca gagcgacctt

120

ggggagctgc ccgtggatgc caggttccct ccccgggtgc caaagtcgtt tccgttcaac

180

acctccgtgg tgtacaagaa aactctgttc gtggagttca ccgaccacct gttcaatatc

240

gccaagccca gacctccctg gatggggctg ttgggaccta ccatccaagc ggaggtgtac

300

gacactgtgg tcatcactct gaagaacatg gcctcgcatc ccgtgtccct gcacgccgtg

360

ggagtgtctt actggaaagc gtccgagggg gccgaatacg acgaccagac ctcgcagaga

420

gaaaaggaag atgacaaggt gttcccagga ggatcgcaca cctacgtgtg gcaagtgttg

480

aaggagaacg gcccaatggc ctccgacccg ctgtgcctga cctactcgta cctgtcccac

540

gtggacctcg tgaaggacct caactcggga ctgattggag ccctgctggt ctgcagggaa

600

ggctcactgg cgaaagaaaa gactcagacc ttgcacaagt tcattctgct gttcgctgtg

660

ttcgacgagg ggaagtcgtg gcacagcgag actaagaact ccctgatgca agatagagat

720

gccgcctccg cccgggcctg gcctaagatg cacaccgtga acggttacgt gaaccgctcc

780

ctccctggcc tgattggatg ccaccggaag tccgtgtact ggcacgtgat cgggatgggg

840

accacccccg aggtgcacag catcttcctg gaaggtcaca catttctcgt gcgcaaccac

900

cggcaggcct ccctggaaat cagccccatt accttcctca ctgcccagac tctgctgatg

960

gacctgggac agttcctgct gttctgccat atctcctccc accaacatga cggaatggag

1020

gcatacgtga aggtcgattc ctgccctgag gaaccccagc tccgcatgaa gaacaatgag

1080

gaagccgagg actacgacga cgacctgacg gatagcgaga tggatgtggt ccggttcgat

1140

gacgataaca gcccttcctt catccaaatt cgctcggtgg caaagaagca ccccaagacc

1200

tgggtgcatt acattgcggc ggaagaagag gactgggatt atgccccgct tgtcctcgct

1260

cctgacgacc ggagctacaa gagccagtac ctgaacaacg gtccacagag gatcggtaga

1320

aagtacaaga aggtccgctt catggcctat accgacgaaa ccttcaaaac tagagaggcc

1380

atccaacacg aatccggcat cctgggcccg ctcttgtacg gagaagtcgg cgacaccctt

1440

ctcattatct tcaagaacca ggcttcccgg ccgtacaaca tctatccgca tgggatcact

1500

gacgtgcgcc cactgtactc gcggcgcctg cccaagggtg tcaaacacct gaaggatttt

1560

ccgatccttc cgggagaaat cttcaagtac aagtggaccg tgaccgtgga agatggccca

1620

actaagtctg accctagatg cctcacccgc tactactcat ccttcgtcaa catggagcgc

1680

gacctggcca gcggactgat cggcccgctg ctgatttgct acaaggaatc agtggaccaa

1740

cggggaaacc agatcatgtc ggataagagg aacgtcatcc tcttctccgt gtttgacgaa

1800

aaccggtcgt ggtacctgac cgagaacatc cagaggttcc tgcccaaccc tgctggggtg

1860

cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa tggctacgtg

1920

ttcgacagcc tgcagctgag cgtgtgcctg cacgaggtgg cctactggta catcctgagc

1980

atcggcgccc agaccgactt cctgagcgtg ttcttctctg gctacacctt caagcacaag

2040

atggtgtatg aggacaccct gaccctgttc cccttcagcg gggagactgt cttcatgagc

2100

atggagaacc ctggcctgtg gatcctgggc tgccacaaca gcgacttcag gaacaggggc

2160

atgactgccc tgctgaaagt ctccagctgt gacaagaaca ccggggacta ctacgaggac

2220

agctacgagg acatcagcgc ctacctgctg agcaagaaca atgccatcga gcccaggagc

2280

ttctctcaga accccccagt gctgaagagg caccagaggg agatcaccag gaccaccctg

2340

cagtctgacc aggaggagat cgactatgat gacaccatca gcgtggagat gaagaaggag

2400

gacttcgaca tctacgacga ggacgagaac cagagcccca ggagcttcca gaagaagacc

2460

aggcactact tcattgctgc tgtggagagg ctgtgggact atggcatgtc cagcagcccc

2520

catgtgctga ggaacagggc ccagtctggc agcgtgcccc agttcaagaa agtcgtgttc

2580

caggagttca ccgacggcag cttcacccag cccctgtaca gaggggagct gaacgagcac

2640

ctgggcctgc tgggccccta catcagggcc gaggtggagg acaacatcat ggtgaccttc

2700

aggaaccagg ccagcaggcc ctacagcttc tacagcagcc tgatcagcta cgaggaggac

2760

cagaggcagg gggctgagcc caggaagaac tttgtgaagc ccaatgaaac caagacctac

2820

ttctggaagg tgcagcacca catggccccc accaaggacg agttcgactg caaggcctgg

2880

gcctacttct ctgacgtgga cctggagaag gacgtgcact ctggcctgat tggccccctg

2940

ctggtgtgcc acaccaacac cctgaaccct gcccatggca ggcaggtgac tgtgcaggag

3000

ttcgccctgt tcttcaccat cttcgatgaa accaagagct ggtacttcac tgagaacatg

3060

gagaggaact gcagggcccc ctgcaacatc cagatggagg accccacctt caaggagaac

3120

tacaggttcc atgccatcaa tggctacatc atggacaccc tgcctggcct ggtcatggcc

3180

caggaccaga ggatcaggtg gtatctgctg agcatgggca gcaacgagaa catccacagc

3240

atccacttct ctggccacgt gttcactgtg aggaagaagg aggagtacaa gatggccctg

3300

tacaacctgt accctggggt gttcgaaacc gtggagatgc tgcccagcaa ggccggcatc

3360

tggagggtgg agtgcctgat tggggagcac ctgcacgccg gcatgagcac cctgttcctg

3420

gtgtacagca acaagtgcca gacccccctg ggcatggcct ctggccacat cagggacttc

3480

cagatcactg cctctggcca gtacggccag tgggccccca agctggccag gctgcactac

3540

tccggaagca tcaatgcctg gagcaccaag gagcccttca gctggatcaa agtggacctg

3600

ctggccccca tgatcatcca cggcatcaag acccaggggg ccaggcagaa gttctccagc

3660

ctgtacatca gccagttcat catcatgtac agcctggacg gcaagaagtg gcagacctac

3720

aggggcaaca gcaccggcac cctgatggtg ttcttcggca acgtggacag cagcggcatc

3780

aagcacaaca tcttcaaccc ccccatcatc gccagataca tcaggctgca ccccacccac

3840

tacagcatca ggagcaccct gaggatggag ctgatgggct gtgacctgaa cagctgcagc

3900

atgcccctgg gcatggagag caaggccatc tctgacgccc agatcactgc ctccagctac

3960

ttcaccaaca tgtttgccac ctggagcccc agcaaggcca ggctgcacct gcagggcagg

4020

agcaatgcct ggaggcccca ggtcaacaac cccaaggagt ggctgcaggt ggacttccag

4080

aagaccatga aggtgactgg ggtgaccacc cagggggtga agagcctgct gaccagcatg

4140

tacgtgaagg agttcctgat ctccagcagc caggacggcc accagtggac cctgttcttc

4200

cagaatggca aggtgaaggt gttccagggc aaccaggaca gcttcacccc tgtggtcaac

4260

agcctggacc cccccctgct gaccagatac ctgaggatcc acccccagag ctgggtgcac

4320

cagatcgccc tgaggatgga ggtgctgggc tgtgaggccc aggacctgta ctga

4374

<210> 4

<211> 4374

<212> ДНК

<213> Искусственная последовательность

<220>

<223> coFVIII-62

<400> 4

atgcagattg agctgtccac ttgtttcttc ctgtgcctcc tgcgcttctg tttctccgcc

60

actcgccggt actaccttgg agccgtggag ctttcatggg actacatgca gagcgacctg

120

ggcgaactcc ccgtggatgc cagattcccc ccccgcgtgc caaagtcctt cccctttaac

180

acctccgtgg tgtacaagaa aaccctcttt gtcgagttca ctgaccacct gttcaacatc

240

gccaagccgc gcccaccttg gatgggcctc ctgggaccga ccattcaagc tgaagtgtac

300

gacaccgtgg tgatcaccct gaagaacatg gcgtcccacc ccgtgtccct gcatgcggtc

360

ggagtgtcct actggaaggc ctccgaagga gctgagtacg acgaccagac tagccagcgg

420

gaaaaggagg acgataaagt gttcccgggc ggctcgcata cttacgtgtg gcaagtcctg

480

aaggaaaacg gacctatggc atccgatcct ctgtgcctga cttactccta cctttcccat

540

gtggacctcg tgaaggacct gaacagcggg ctgattggtg cacttctcgt gtgccgcgaa

600

ggttcgctcg ctaaggaaaa gacccagacc ctccataagt tcatcctttt gttcgctgtg

660

ttcgatgaag gaaagtcatg gcattccgaa actaagaact cgctgatgca ggaccgggat

720

gccgcctcag cccgcgcctg gcctaaaatg catacagtca acggatacgt gaatcggtca

780

ctgcccgggc tcatcggttg tcacagaaag tccgtgtact ggcacgtcat cggcatgggc

840

actacgcctg aagtgcactc catcttcctg gaagggcaca ccttcctcgt gcgcaaccac

900

cgccaggcct ctctggaaat ctccccgatt acctttctga ccgcccagac tctgctcatg

960

gacctggggc agttccttct cttctgccac atctccagcc atcagcacga cggaatggag

1020

gcctacgtga aggtggactc atgcccggaa gaacctcagt tgcggatgaa gaacaacgag

1080

gaggccgagg actatgacga cgatttgact gactccgaga tggacgtcgt gcggttcgat

1140

gacgacaaca gccccagctt catccagatt cgcagcgtgg ccaagaagca ccccaaaacc

1200

tgggtgcact acatcgcggc cgaggaagaa gattgggact acgccccgtt ggtgctggca

1260

cccgatgacc ggtcgtacaa gtcccagtat ctgaacaatg gtccgcagcg gattggcaga

1320

aagtacaaga aagtgcggtt catggcgtac actgacgaaa cgtttaagac ccgggaggcc

1380

attcaacatg agagcggcat tctgggacca ctgctgtacg gagaggtcgg cgataccctg

1440

ctcatcatct tcaaaaacca ggcctcccgg ccttacaaca tctaccctca cggaatcacc

1500

gacgtgcggc cactctactc gcggcgcctg ccgaagggcg tcaagcacct gaaagacttc

1560

cctatcctgc cgggcgaaat cttcaagtat aagtggaccg tcaccgtgga ggacgggccc

1620

accaagagcg atcctaggtg tctgactcgg tactactcca gcttcgtgaa catggaacgg

1680

gacctggcat cgggactcat tggaccgctg ctgatctgct acaaagagtc ggtggatcaa

1740

cgcggcaacc agatcatgtc cgacaagcgc aacgtgatcc tgttctccgt gtttgatgaa

1800

aacagatcct ggtacctgac cgagaacatc cagaggttcc tgcccaaccc tgctggggtg

1860

cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa tggctacgtg

1920

ttcgacagcc tgcagctgag cgtgtgcctg cacgaggtgg cctactggta catcctgagc

1980

atcggcgccc agaccgactt cctgagcgtg ttcttctctg gctacacctt caagcacaag

2040

atggtgtatg aggacaccct gaccctgttc cccttcagcg gggagactgt cttcatgagc

2100

atggagaacc ctggcctgtg gatcctgggc tgccacaaca gcgacttcag gaacaggggc

2160

atgactgccc tgctgaaagt ctccagctgt gacaagaaca ccggggacta ctacgaggac

2220

agctacgagg acatcagcgc ctacctgctg agcaagaaca atgccatcga gcccaggagc

2280

ttctctcaga accccccagt gctgaagagg caccagaggg agatcaccag gaccaccctg

2340

cagtctgacc aggaggagat cgactatgat gacaccatca gcgtggagat gaagaaggag

2400

gacttcgaca tctacgacga ggacgagaac cagagcccca ggagcttcca gaagaagacc

2460

aggcactact tcattgctgc tgtggagagg ctgtgggact atggcatgtc cagcagcccc

2520

catgtgctga ggaacagggc ccagtctggc agcgtgcccc agttcaagaa agtcgtgttc

2580

caggagttca ccgacggcag cttcacccag cccctgtaca gaggggagct gaacgagcac

2640

ctgggcctgc tgggccccta catcagggcc gaggtggagg acaacatcat ggtgaccttc

2700

aggaaccagg ccagcaggcc ctacagcttc tacagcagcc tgatcagcta cgaggaggac

2760

cagaggcagg gggctgagcc caggaagaac tttgtgaagc ccaatgaaac caagacctac

2820

ttctggaagg tgcagcacca catggccccc accaaggacg agttcgactg caaggcctgg

2880

gcctacttct ctgacgtgga cctggagaag gacgtgcact ctggcctgat tggccccctg

2940

ctggtgtgcc acaccaacac cctgaaccct gcccatggca ggcaggtgac tgtgcaggag

3000

ttcgccctgt tcttcaccat cttcgatgaa accaagagct ggtacttcac tgagaacatg

3060

gagaggaact gcagggcccc ctgcaacatc cagatggagg accccacctt caaggagaac

3120

tacaggttcc atgccatcaa tggctacatc atggacaccc tgcctggcct ggtcatggcc

3180

caggaccaga ggatcaggtg gtatctgctg agcatgggca gcaacgagaa catccacagc

3240

atccacttct ctggccacgt gttcactgtg aggaagaagg aggagtacaa gatggccctg

3300

tacaacctgt accctggggt gttcgaaacc gtggagatgc tgcccagcaa ggccggcatc

3360

tggagggtgg agtgcctgat tggggagcac ctgcacgccg gcatgagcac cctgttcctg

3420

gtgtacagca acaagtgcca gacccccctg ggcatggcct ctggccacat cagggacttc

3480

cagatcactg cctctggcca gtacggccag tgggccccca agctggccag gctgcactac

3540

tccggaagca tcaatgcctg gagcaccaag gagcccttca gctggatcaa agtggacctg

3600

ctggccccca tgatcatcca cggcatcaag acccaggggg ccaggcagaa gttctccagc

3660

ctgtacatca gccagttcat catcatgtac agcctggacg gcaagaagtg gcagacctac

3720

aggggcaaca gcaccggcac cctgatggtg ttcttcggca acgtggacag cagcggcatc

3780

aagcacaaca tcttcaaccc ccccatcatc gccagataca tcaggctgca ccccacccac

3840

tacagcatca ggagcaccct gaggatggag ctgatgggct gtgacctgaa cagctgcagc

3900

atgcccctgg gcatggagag caaggccatc tctgacgccc agatcactgc ctccagctac

3960

ttcaccaaca tgtttgccac ctggagcccc agcaaggcca ggctgcacct gcagggcagg

4020

agcaatgcct ggaggcccca ggtcaacaac cccaaggagt ggctgcaggt ggacttccag

4080

aagaccatga aggtgactgg ggtgaccacc cagggggtga agagcctgct gaccagcatg

4140

tacgtgaagg agttcctgat ctccagcagc caggacggcc accagtggac cctgttcttc

4200

cagaatggca aggtgaaggt gttccagggc aaccaggaca gcttcacccc tgtggtcaac

4260

agcctggacc cccccctgct gaccagatac ctgaggatcc acccccagag ctgggtgcac

4320

cagatcgccc tgaggatgga ggtgctgggc tgtgaggccc aggacctgta ctga

4374

<210> 5

<211> 4374

<212> ДНК

<213> Искусственная последовательность

<220>

<223> coFVIII-25

<400> 5

atgcagattg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttctctgcc

60

accaggagat actacctggg cgccgtggag ctgagctggg actacatgca gtctgacctg

120

ggcgagctgc cagtggacgc caggttcccc cccagagtgc ccaagagctt ccccttcaac

180

accagcgtgg tgtacaagaa gaccctgttc gtggagttca ctgaccacct gttcaacatc

240

gccaagccca ggcccccctg gatgggcctg ctgggcccca ccatccaggc cgaggtgtac

300

gacaccgtgg tcatcaccct gaagaacatg gccagccacc ccgtctccct gcacgccgtg

360

ggggtgagct actggaaggc ctctgagggc gccgagtacg acgaccagac cagccagagg

420

gagaaggagg acgacaaggt gttccctggg ggcagccaca cctacgtgtg gcaggtcctg

480

aaggagaacg gccccatggc ctctgacccc ctgtgcctga cctacagcta cctgagccac

540

gtggacctgg tgaaggacct gaactctggc ctgattgggg ccctgctggt gtgcagggag

600

ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg

660

ttcgacgagg gcaagagctg gcactctgaa accaagaaca gcctgatgca ggacagggac

720

gccgcctctg ccagggcctg gcccaagatg cacaccgtca acggctacgt caacaggagc

780

ctgcctggcc tgattggctg ccacaggaag agcgtgtact ggcatgtgat cggcatgggc

840

accacccctg aggtgcacag catcttcctg gagggccaca ccttcctggt caggaaccac

900

aggcaggcca gcctggagat cagccccatc accttcctga ccgcccagac cctgctgatg

960

gacctgggcc agttcctgct gttctgccac atctccagcc accagcacga cggcatggag

1020

gcctacgtga aagtggacag ctgccctgag gagccccagc tgaggatgaa gaacaacgag

1080

gaggccgagg actatgatga cgacctgacc gacagcgaga tggacgtggt caggttcgac

1140

gacgacaaca gccccagctt catccagatc aggagcgtgg ccaagaagca ccccaagacc

1200

tgggtgcact acatcgctgc tgaggaggag gactgggact atgcccccct ggtgctggcc

1260

cctgatgaca ggagctacaa gagccagtac ctgaacaatg gcccccagag gattggcagg

1320

aagtacaaga aagtcaggtt catggcctac actgatgaaa ccttcaagac cagggaggcc

1380

atccagcatg agtctggcat cctgggcccc ctgctgtacg gggaggtggg ggacaccctg

1440

ctgatcatct tcaagaacca ggccagcagg ccctacaaca tctaccccca tggcatcacc

1500

gacgtgaggc ccctgtacag caggaggctg cctaaggggg tgaagcacct gaaagacttc

1560

cccatcctgc ctggggagat cttcaagtac aagtggactg tgactgtgga ggacggcccc

1620

accaagagcg accccaggtg cctgaccaga tactacagca gcttcgtcaa catggagagg

1680

gacctggcct ctggcctgat tggccccctg ctgatctgct acaaggagtc tgtggaccag

1740

aggggcaacc agatcatgag cgacaagagg aacgtgatcc tgttctctgt cttcgacgag

1800

aacaggagct ggtacctgac tgaaaacatc cagcggttcc tccccaaccc cgcgggcgtg

1860

cagctggaag atcctgagtt tcaggcatca aacatcatgc actccattaa cggctacgtg

1920

ttcgattcgc tgcagctgag cgtgtgtctg cacgaagtgg cctactggta catcctgtcc

1980

attggtgccc agactgactt cctgtccgtg tttttctccg gctacacgtt caagcacaag

2040

atggtgtacg aggacaccct gaccctcttc cctttttccg gcgaaactgt gtttatgagc

2100

atggagaatc ccggcctgtg gatcttgggc tgccacaaca gcgacttccg taacagagga

2160

atgactgcgc tgctcaaggt gtccagctgc gacaagaaca ccggagacta ttatgaggac

2220

tcatacgagg acatctccgc ctacctcctg tccaagaata acgccattga acctcggagc

2280

ttcagccaga acccacccgt gcttaagaga catcaacggg agatcactag gaccaccctg

2340

cagtcagacc aggaggaaat cgactacgat gacaccatct cggtcgagat gaagaaggag

2400

gactttgaca tctacgacga agatgaaaac cagagcccga ggtcgttcca aaagaaaacc

2460

cgccactact ttattgctgc tgtcgagcgg ctgtgggact acggaatgtc gtcctcgccg

2520

cacgtgctcc gcaaccgagc ccagagcggc tcggtgccgc aattcaagaa ggtcgtgttc

2580

caggagttca ctgacgggag cttcactcag cctttgtacc ggggagaact caatgaacat

2640

ctcggcctcc tcggacctta catcagagca gaagtggaag ataacatcat ggtcactttc

2700

cgtaaccaag ccagccgccc gtactcgttc tactcctccc tcatttctta cgaagaggac

2760

cagcggcagg gcgcagaacc gcgcaagaac ttcgtgaagc ccaacgaaac caagacctac

2820

ttctggaaag tgcagcatca tatggccccg actaaggacg agtttgactg caaagcctgg

2880

gcctacttct ccgatgtgga cttggagaag gacgtccact ccggcctcat cggtcccctg

2940

ctcgtgtgcc ataccaatac cctgaacccc gcacacggtc gccaggtcac cgtgcaggag

3000

ttcgctctgt tcttcactat cttcgacgaa actaagtcct ggtacttcac cgagaacatg

3060

gagaggaact gcagagcccc ctgtaacatc cagatggagg acccgacgtt caaggaaaac

3120

taccggttcc acgccattaa cggatacatc atggatacgc tgccgggtct tgtgatggcc

3180

caggatcaac ggatcagatg gtacttattg tcgatgggca gcaacgagaa catccactct

3240

attcacttct ccggtcatgt gttcactgtg cggaagaagg aagagtacaa gatggccctg

3300

tacaaccttt atcccggagt gttcgaaact gtggaaatgc tgccgtcgaa ggccggcatt

3360

tggcgcgtgg agtgtttgat tggagaacat ctccatgcgg ggatgtcaac cctgttcctg

3420

gtgtatagca acaagtgcca gactccgctt gggatggcgt caggacacat tagggatttc

3480

cagatcactg cgtccggcca gtacggccaa tgggccccta agctggcccg cctgcattac

3540

tccggatcca ttaacgcctg gtcaaccaag gagccattct cctggatcaa ggtggacctt

3600

ctggccccca tgattatcca cggaattaag acccaggggg cccggcagaa gttctcctca

3660

ctgtacatca gccagttcat aatcatgtac tccctggacg gaaagaagtg gcaaacctac

3720

agggggaaca gcaccggcac actgatggtc tttttcggaa atgtggactc ctccgggatt

3780

aagcataaca tcttcaaccc tccgattatc gctcggtaca ttagacttca ccctacccac

3840

tacagcattc gctccaccct gcggatggaa ctgatgggct gcgatctgaa ctcgtgcagc

3900

atgccgttgg gaatggagtc caaagcaatt tccgacgcgc agatcaccgc ctcgtcctac

3960

tttaccaaca tgttcgccac gtggtcaccg tccaaggccc ggctgcacct ccagggaaga

4020

tccaacgcat ggcggccaca ggtcaacaac cctaaggagt ggctccaggt ggacttccag

4080

aaaaccatga aggtcaccgg agtcacaacc cagggagtga agtcgctgct gacttctatg

4140

tacgtcaagg agttcctgat ctccagcagc caggacgggc accagtggac cctgttcttc

4200

caaaatggaa aggtcaaggt gtttcagggc aatcaggatt cattcacccc ggtggtgaac

4260

tcccttgatc cacccctcct gacccgctac cttcgcatcc acccacagtc ctgggtgcac

4320

cagatcgcgc tgaggatgga ggtcctggga tgcgaagccc aggacctgta ctga

4374

<210> 6

<211> 4374

<212> ДНК

<213> Искусственная последовательность

<220>

<223> coFVIII-26

<400> 6

atgcagattg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttctctgcc

60

accaggagat actacctggg cgccgtggag ctgagctggg actacatgca gtctgacctg

120

ggcgagctgc cagtggacgc caggttcccc cccagagtgc ccaagagctt ccccttcaac

180

accagcgtgg tgtacaagaa gaccctgttc gtggagttca ctgaccacct gttcaacatc

240

gccaagccca ggcccccctg gatgggcctg ctgggcccca ccatccaggc cgaggtgtac

300

gacaccgtgg tcatcaccct gaagaacatg gccagccacc ccgtctccct gcacgccgtg

360

ggggtgagct actggaaggc ctctgagggc gccgagtacg acgaccagac cagccagagg

420

gagaaggagg acgacaaggt gttccctggg ggcagccaca cctacgtgtg gcaggtcctg

480

aaggagaacg gccccatggc ctctgacccc ctgtgcctga cctacagcta cctgagccac

540

gtggacctgg tgaaggacct gaactctggc ctgattgggg ccctgctggt gtgcagggag

600

ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg

660

ttcgacgagg gcaagagctg gcactctgaa accaagaaca gcctgatgca ggacagggac

720

gccgcctctg ccagggcctg gcccaagatg cacaccgtca acggctacgt caacaggagc

780

ctgcctggcc tgattggctg ccacaggaag agcgtgtact ggcatgtgat cggcatgggc

840

accacccctg aggtgcacag catcttcctg gagggccaca ccttcctggt caggaaccac

900

aggcaggcca gcctggagat cagccccatc accttcctga ccgcccagac cctgctgatg

960

gacctgggcc agttcctgct gttctgccac atctccagcc accagcacga cggcatggag

1020

gcctacgtga aagtggacag ctgccctgag gagccccagc tgaggatgaa gaacaacgag

1080

gaggccgagg actatgatga cgacctgacc gacagcgaga tggacgtggt caggttcgac

1140

gacgacaaca gccccagctt catccagatc aggagcgtgg ccaagaagca ccccaagacc

1200

tgggtgcact acatcgctgc tgaggaggag gactgggact atgcccccct ggtgctggcc

1260

cctgatgaca ggagctacaa gagccagtac ctgaacaatg gcccccagag gattggcagg

1320

aagtacaaga aagtcaggtt catggcctac actgatgaaa ccttcaagac cagggaggcc

1380

atccagcatg agtctggcat cctgggcccc ctgctgtacg gggaggtggg ggacaccctg

1440

ctgatcatct tcaagaacca ggccagcagg ccctacaaca tctaccccca tggcatcacc

1500

gacgtgaggc ccctgtacag caggaggctg cctaaggggg tgaagcacct gaaagacttc

1560

cccatcctgc ctggggagat cttcaagtac aagtggactg tgactgtgga ggacggcccc

1620

accaagagcg accccaggtg cctgaccaga tactacagca gcttcgtcaa catggagagg

1680

gacctggcct ctggcctgat tggccccctg ctgatctgct acaaggagtc tgtggaccag

1740

aggggcaacc agatcatgag cgacaagagg aacgtgatcc tgttctctgt cttcgacgag

1800

aacaggagct ggtacctcac tgaaaacatc cagaggttcc tcccaaaccc cgcaggagtg

1860

caactggagg accctgagtt tcaggcctcg aatatcatgc actcgattaa cggttacgtg

1920

ttcgactcgc tgcagctgag cgtgtgcctc catgaagtcg cttactggta cattctgtcc

1980

atcggcgccc agactgactt cctgagcgtg ttcttttccg gttacacctt taagcacaag

2040

atggtgtacg aagataccct gaccctgttc cctttctccg gcgaaacggt gttcatgtcg

2100

atggagaacc cgggtctgtg gattctggga tgccacaaca gcgactttcg gaaccgcgga

2160

atgactgccc tgctgaaggt gtcctcatgc gacaagaaca ccggagacta ctacgaggac

2220

tcctacgagg atatctcagc ctacctcctg tccaagaaca acgcgatcga gccgcgcagc

2280

ttcagccaga acccgcctgt gctgaagagg caccagcgag aaattacccg gaccaccctc

2340

caatcggatc aggaggaaat cgactacgac gacaccatct cggtggaaat gaagaaggaa

2400

gatttcgata tctacgacga ggacgaaaat cagtcccctc gctcattcca aaagaaaact

2460

agacactact ttatcgccgc ggtggaaaga ctgtgggact atggaatgtc atccagccct

2520

cacgtccttc ggaaccgggc ccagagcgga tcggtgcctc agttcaagaa agtggtgttc

2580

caggagttca ccgacggcag cttcacccag ccgctgtacc ggggagaact gaacgaacac

2640

ctgggcctgc tcggtcccta catccgcgcg gaagtggagg ataacatcat ggtgaccttc

2700

cgtaaccaag catccagacc ttactccttc tattcctccc tgatctcata cgaggaggac

2760

cagcgccaag gcgccgagcc ccgcaagaac ttcgtcaagc ccaacgagac taagacctac

2820

ttctggaagg tccaacacca tatggccccg accaaggatg agtttgactg caaggcctgg

2880

gcctacttct ccgacgtgga ccttgagaag gatgtccatt ccggcctgat cgggccgctg

2940

ctcgtgtgtc acaccaacac cctgaaccca gcgcatggac gccaggtcac cgtccaggag

3000

tttgctctgt tcttcaccat ttttgacgaa actaagtcct ggtacttcac cgagaatatg

3060

gagcgaaact gtagagcgcc ctgcaatatc cagatggaag atccgacttt caaggagaac

3120

tatagattcc acgccatcaa cgggtacatc atggatactc tgccggggct ggtcatggcc

3180

caggatcaga ggattcggtg gtacttgctg tcaatgggat cgaacgaaaa cattcactcc

3240

attcacttct ccggtcacgt gttcactgtg cgcaagaagg aggagtacaa gatggcgctg

3300

tacaatctgt accccggggt gttcgaaact gtggagatgc tgccgtccaa ggccggcatc

3360

tggagagtgg agtgcctgat cggagagcac ctccacgcgg ggatgtccac cctcttcctg

3420

gtgtactcga ataagtgcca gaccccgctg ggcatggcct cgggccacat cagagacttc

3480

cagatcacag caagcggaca atacggccaa tgggcgccga agctggcccg cttgcactac

3540

tccggatcga tcaacgcatg gtccaccaag gaaccgttct cgtggattaa ggtggacctc

3600

ctggccccta tgattatcca cggaattaag acccagggcg ccaggcagaa gttctcctcc

3660

ctgtacatct cgcaattcat catcatgtac agcctggacg ggaagaagtg gcagacttac

3720

aggggaaact ccaccggcac cctgatggtc tttttcggca acgtggattc ctccggcatt

3780

aagcacaaca tcttcaaccc accgatcata gccagatata ttaggctcca ccccactcac

3840

tactcaatcc gctcaactct tcggatggaa ctcatggggt gcgacctgaa ctcctgctcc

3900

atgccgttgg ggatggaatc aaaggctatt agcgacgccc agatcaccgc gagctcctac

3960

ttcactaaca tgttcgccac ctggagcccc tccaaggcca ggctgcactt gcagggacgg

4020

tcaaatgcct ggcggccgca agtgaacaat ccgaaggaat ggcttcaagt ggatttccaa

4080

aagaccatga aagtgaccgg agtcaccacc cagggagtga agtcccttct gacctcgatg

4140

tatgtgaagg agttcctgat tagcagcagc caggacgggc accagtggac cctgttcttc

4200

caaaacggaa aggtcaaggt gttccagggg aaccaggact cgttcacacc cgtggtgaac

4260

tccctggacc ccccactgct gacgcggtac ttgaggattc atcctcagtc ctgggtccat

4320

cagattgcat tgcgaatgga agtcctgggc tgcgaggccc aggacctgta ctga

4374

<210> 7

<211> 1734

<212> ДНК

<213> Искусственная последовательность

<220>

<223> coFVIII-52-NT58

<400> 7

gcgacccgcc gatactacct gggagcagtg gagctctcct gggattacat gcagagcgac

60

cttggggagc tgcccgtgga tgccaggttc cctccccggg tgccaaagtc gtttccgttc

120

aacacctccg tggtgtacaa gaaaactctg ttcgtggagt tcaccgacca cctgttcaat

180

atcgccaagc ccagacctcc ctggatgggg ctgttgggac ctaccatcca agcggaggtg

240

tacgacactg tggtcatcac tctgaagaac atggcctcgc atcccgtgtc cctgcacgcc

300

gtgggagtgt cttactggaa agcgtccgag ggggccgaat acgacgacca gacctcgcag

360

agagaaaagg aagatgacaa ggtgttccca ggaggatcgc acacctacgt gtggcaagtg

420

ttgaaggaga acggcccaat ggcctccgac ccgctgtgcc tgacctactc gtacctgtcc

480

cacgtggacc tcgtgaagga cctcaactcg ggactgattg gagccctgct ggtctgcagg

540

gaaggctcac tggcgaaaga aaagactcag accttgcaca agttcattct gctgttcgct

600

gtgttcgacg aggggaagtc gtggcacagc gagactaaga actccctgat gcaagataga

660

gatgccgcct ccgcccgggc ctggcctaag atgcacaccg tgaacggtta cgtgaaccgc

720

tccctccctg gcctgattgg atgccaccgg aagtccgtgt actggcacgt gatcgggatg

780

gggaccaccc ccgaggtgca cagcatcttc ctggaaggtc acacatttct cgtgcgcaac

840

caccggcagg cctccctgga aatcagcccc attaccttcc tcactgccca gactctgctg

900

atggacctgg gacagttcct gctgttctgc catatctcct cccaccaaca tgacggaatg

960

gaggcatacg tgaaggtcga ttcctgccct gaggaacccc agctccgcat gaagaacaat

1020

gaggaagccg aggactacga cgacgacctg acggatagcg agatggatgt ggtccggttc

1080

gatgacgata acagcccttc cttcatccaa attcgctcgg tggcaaagaa gcaccccaag

1140

acctgggtgc attacattgc ggcggaagaa gaggactggg attatgcccc gcttgtcctc

1200

gctcctgacg accggagcta caagagccag tacctgaaca acggtccaca gaggatcggt

1260

agaaagtaca agaaggtccg cttcatggcc tataccgacg aaaccttcaa aactagagag

1320

gccatccaac acgaatccgg catcctgggc ccgctcttgt acggagaagt cggcgacacc

1380

cttctcatta tcttcaagaa ccaggcttcc cggccgtaca acatctatcc gcatgggatc

1440

actgacgtgc gcccactgta ctcgcggcgc ctgcccaagg gtgtcaaaca cctgaaggat

1500

tttccgatcc ttccgggaga aatcttcaag tacaagtgga ccgtgaccgt ggaagatggc

1560

ccaactaagt ctgaccctag atgcctcacc cgctactact catccttcgt caacatggag

1620

cgcgacctgg ccagcggact gatcggcccg ctgctgattt gctacaagga atcagtggac

1680

caacggggaa accagatcat gtcggataag aggaacgtca tcctcttctc cgtg

1734

<210> 8

<211> 2583

<212> ДНК

<213> Искусственная последовательность

<220>

<223> coFVIII-52-CT

<400> 8

tttgacgaaa accggtcgtg gtacctgacc gagaacatcc agaggttcct gcccaaccct

60

gctggggtgc agctggagga ccccgagttc caggccagca acatcatgca cagcatcaat

120

ggctacgtgt tcgacagcct gcagctgagc gtgtgcctgc acgaggtggc ctactggtac

180

atcctgagca tcggcgccca gaccgacttc ctgagcgtgt tcttctctgg ctacaccttc

240

aagcacaaga tggtgtatga ggacaccctg accctgttcc ccttcagcgg ggagactgtc

300

ttcatgagca tggagaaccc tggcctgtgg atcctgggct gccacaacag cgacttcagg

360

aacaggggca tgactgccct gctgaaagtc tccagctgtg acaagaacac cggggactac

420

tacgaggaca gctacgagga catcagcgcc tacctgctga gcaagaacaa tgccatcgag

480

cccaggagct tctctcagaa ccccccagtg ctgaagaggc accagaggga gatcaccagg

540

accaccctgc agtctgacca ggaggagatc gactatgatg acaccatcag cgtggagatg

600

aagaaggagg acttcgacat ctacgacgag gacgagaacc agagccccag gagcttccag

660

aagaagacca ggcactactt cattgctgct gtggagaggc tgtgggacta tggcatgtcc

720

agcagccccc atgtgctgag gaacagggcc cagtctggca gcgtgcccca gttcaagaaa

780

gtcgtgttcc aggagttcac cgacggcagc ttcacccagc ccctgtacag aggggagctg

840

aacgagcacc tgggcctgct gggcccctac atcagggccg aggtggagga caacatcatg

900

gtgaccttca ggaaccaggc cagcaggccc tacagcttct acagcagcct gatcagctac

960

gaggaggacc agaggcaggg ggctgagccc aggaagaact ttgtgaagcc caatgaaacc

1020

aagacctact tctggaaggt gcagcaccac atggccccca ccaaggacga gttcgactgc

1080

aaggcctggg cctacttctc tgacgtggac ctggagaagg acgtgcactc tggcctgatt

1140

ggccccctgc tggtgtgcca caccaacacc ctgaaccctg cccatggcag gcaggtgact

1200

gtgcaggagt tcgccctgtt cttcaccatc ttcgatgaaa ccaagagctg gtacttcact

1260

gagaacatgg agaggaactg cagggccccc tgcaacatcc agatggagga ccccaccttc

1320

aaggagaact acaggttcca tgccatcaat ggctacatca tggacaccct gcctggcctg

1380

gtcatggccc aggaccagag gatcaggtgg tatctgctga gcatgggcag caacgagaac

1440

atccacagca tccacttctc tggccacgtg ttcactgtga ggaagaagga ggagtacaag

1500

atggccctgt acaacctgta ccctggggtg ttcgaaaccg tggagatgct gcccagcaag

1560

gccggcatct ggagggtgga gtgcctgatt ggggagcacc tgcacgccgg catgagcacc

1620

ctgttcctgg tgtacagcaa caagtgccag acccccctgg gcatggcctc tggccacatc

1680

agggacttcc agatcactgc ctctggccag tacggccagt gggcccccaa gctggccagg

1740

ctgcactact ccggaagcat caatgcctgg agcaccaagg agcccttcag ctggatcaaa

1800

gtggacctgc tggcccccat gatcatccac ggcatcaaga cccagggggc caggcagaag

1860

ttctccagcc tgtacatcag ccagttcatc atcatgtaca gcctggacgg caagaagtgg

1920

cagacctaca ggggcaacag caccggcacc ctgatggtgt tcttcggcaa cgtggacagc

1980

agcggcatca agcacaacat cttcaacccc cccatcatcg ccagatacat caggctgcac

2040

cccacccact acagcatcag gagcaccctg aggatggagc tgatgggctg tgacctgaac

2100

agctgcagca tgcccctggg catggagagc aaggccatct ctgacgccca gatcactgcc

2160

tccagctact tcaccaacat gtttgccacc tggagcccca gcaaggccag gctgcacctg

2220

cagggcagga gcaatgcctg gaggccccag gtcaacaacc ccaaggagtg gctgcaggtg

2280

gacttccaga agaccatgaa ggtgactggg gtgaccaccc agggggtgaa gagcctgctg

2340

accagcatgt acgtgaagga gttcctgatc tccagcagcc aggacggcca ccagtggacc

2400

ctgttcttcc agaatggcaa ggtgaaggtg ttccagggca accaggacag cttcacccct

2460

gtggtcaaca gcctggaccc ccccctgctg accagatacc tgaggatcca cccccagagc

2520

tgggtgcacc agatcgccct gaggatggag gtgctgggct gtgaggccca ggacctgtac

2580

tga

2583

<210> 9

<211> 1734

<212> ДНК

<213> Искусственная последовательность

<220>

<223> coFVIII-62-NT58

<400> 9

gccactcgcc ggtactacct tggagccgtg gagctttcat gggactacat gcagagcgac

60

ctgggcgaac tccccgtgga tgccagattc cccccccgcg tgccaaagtc cttccccttt

120

aacacctccg tggtgtacaa gaaaaccctc tttgtcgagt tcactgacca cctgttcaac

180

atcgccaagc cgcgcccacc ttggatgggc ctcctgggac cgaccattca agctgaagtg

240

tacgacaccg tggtgatcac cctgaagaac atggcgtccc accccgtgtc cctgcatgcg

300

gtcggagtgt cctactggaa ggcctccgaa ggagctgagt acgacgacca gactagccag

360

cgggaaaagg aggacgataa agtgttcccg ggcggctcgc atacttacgt gtggcaagtc

420

ctgaaggaaa acggacctat ggcatccgat cctctgtgcc tgacttactc ctacctttcc

480

catgtggacc tcgtgaagga cctgaacagc gggctgattg gtgcacttct cgtgtgccgc

540

gaaggttcgc tcgctaagga aaagacccag accctccata agttcatcct tttgttcgct

600

gtgttcgatg aaggaaagtc atggcattcc gaaactaaga actcgctgat gcaggaccgg

660

gatgccgcct cagcccgcgc ctggcctaaa atgcatacag tcaacggata cgtgaatcgg

720

tcactgcccg ggctcatcgg ttgtcacaga aagtccgtgt actggcacgt catcggcatg

780

ggcactacgc ctgaagtgca ctccatcttc ctggaagggc acaccttcct cgtgcgcaac

840

caccgccagg cctctctgga aatctccccg attacctttc tgaccgccca gactctgctc

900

atggacctgg ggcagttcct tctcttctgc cacatctcca gccatcagca cgacggaatg

960

gaggcctacg tgaaggtgga ctcatgcccg gaagaacctc agttgcggat gaagaacaac

1020

gaggaggccg aggactatga cgacgatttg actgactccg agatggacgt cgtgcggttc

1080

gatgacgaca acagccccag cttcatccag attcgcagcg tggccaagaa gcaccccaaa

1140

acctgggtgc actacatcgc ggccgaggaa gaagattggg actacgcccc gttggtgctg

1200

gcacccgatg accggtcgta caagtcccag tatctgaaca atggtccgca gcggattggc

1260

agaaagtaca agaaagtgcg gttcatggcg tacactgacg aaacgtttaa gacccgggag

1320

gccattcaac atgagagcgg cattctggga ccactgctgt acggagaggt cggcgatacc

1380

ctgctcatca tcttcaaaaa ccaggcctcc cggccttaca acatctaccc tcacggaatc

1440

accgacgtgc ggccactcta ctcgcggcgc ctgccgaagg gcgtcaagca cctgaaagac

1500

ttccctatcc tgccgggcga aatcttcaag tataagtgga ccgtcaccgt ggaggacggg

1560

cccaccaaga gcgatcctag gtgtctgact cggtactact ccagcttcgt gaacatggaa

1620

cgggacctgg catcgggact cattggaccg ctgctgatct gctacaaaga gtcggtggat

1680

caacgcggca accagatcat gtccgacaag cgcaacgtga tcctgttctc cgtg

1734

<210> 10

<211> 2583

<212> ДНК

<213> Искусственная последовательность

<220>

<223> coFVIII-62-CT

<400> 10

tttgatgaaa acagatcctg gtacctgacc gagaacatcc agaggttcct gcccaaccct

60

gctggggtgc agctggagga ccccgagttc caggccagca acatcatgca cagcatcaat

120

ggctacgtgt tcgacagcct gcagctgagc gtgtgcctgc acgaggtggc ctactggtac

180

atcctgagca tcggcgccca gaccgacttc ctgagcgtgt tcttctctgg ctacaccttc

240

aagcacaaga tggtgtatga ggacaccctg accctgttcc ccttcagcgg ggagactgtc

300

ttcatgagca tggagaaccc tggcctgtgg atcctgggct gccacaacag cgacttcagg

360

aacaggggca tgactgccct gctgaaagtc tccagctgtg acaagaacac cggggactac

420

tacgaggaca gctacgagga catcagcgcc tacctgctga gcaagaacaa tgccatcgag

480

cccaggagct tctctcagaa ccccccagtg ctgaagaggc accagaggga gatcaccagg

540

accaccctgc agtctgacca ggaggagatc gactatgatg acaccatcag cgtggagatg

600

aagaaggagg acttcgacat ctacgacgag gacgagaacc agagccccag gagcttccag

660

aagaagacca ggcactactt cattgctgct gtggagaggc tgtgggacta tggcatgtcc

720

agcagccccc atgtgctgag gaacagggcc cagtctggca gcgtgcccca gttcaagaaa

780

gtcgtgttcc aggagttcac cgacggcagc ttcacccagc ccctgtacag aggggagctg

840

aacgagcacc tgggcctgct gggcccctac atcagggccg aggtggagga caacatcatg

900

gtgaccttca ggaaccaggc cagcaggccc tacagcttct acagcagcct gatcagctac

960

gaggaggacc agaggcaggg ggctgagccc aggaagaact ttgtgaagcc caatgaaacc

1020

aagacctact tctggaaggt gcagcaccac atggccccca ccaaggacga gttcgactgc

1080

aaggcctggg cctacttctc tgacgtggac ctggagaagg acgtgcactc tggcctgatt

1140

ggccccctgc tggtgtgcca caccaacacc ctgaaccctg cccatggcag gcaggtgact

1200

gtgcaggagt tcgccctgtt cttcaccatc ttcgatgaaa ccaagagctg gtacttcact

1260

gagaacatgg agaggaactg cagggccccc tgcaacatcc agatggagga ccccaccttc

1320

aaggagaact acaggttcca tgccatcaat ggctacatca tggacaccct gcctggcctg

1380

gtcatggccc aggaccagag gatcaggtgg tatctgctga gcatgggcag caacgagaac

1440

atccacagca tccacttctc tggccacgtg ttcactgtga ggaagaagga ggagtacaag

1500

atggccctgt acaacctgta ccctggggtg ttcgaaaccg tggagatgct gcccagcaag

1560

gccggcatct ggagggtgga gtgcctgatt ggggagcacc tgcacgccgg catgagcacc

1620

ctgttcctgg tgtacagcaa caagtgccag acccccctgg gcatggcctc tggccacatc

1680

agggacttcc agatcactgc ctctggccag tacggccagt gggcccccaa gctggccagg

1740

ctgcactact ccggaagcat caatgcctgg agcaccaagg agcccttcag ctggatcaaa

1800

gtggacctgc tggcccccat gatcatccac ggcatcaaga cccagggggc caggcagaag

1860

ttctccagcc tgtacatcag ccagttcatc atcatgtaca gcctggacgg caagaagtgg

1920

cagacctaca ggggcaacag caccggcacc ctgatggtgt tcttcggcaa cgtggacagc

1980

agcggcatca agcacaacat cttcaacccc cccatcatcg ccagatacat caggctgcac

2040

cccacccact acagcatcag gagcaccctg aggatggagc tgatgggctg tgacctgaac

2100

agctgcagca tgcccctggg catggagagc aaggccatct ctgacgccca gatcactgcc

2160

tccagctact tcaccaacat gtttgccacc tggagcccca gcaaggccag gctgcacctg

2220

cagggcagga gcaatgcctg gaggccccag gtcaacaacc ccaaggagtg gctgcaggtg

2280

gacttccaga agaccatgaa ggtgactggg gtgaccaccc agggggtgaa gagcctgctg

2340

accagcatgt acgtgaagga gttcctgatc tccagcagcc aggacggcca ccagtggacc

2400

ctgttcttcc agaatggcaa ggtgaaggtg ttccagggca accaggacag cttcacccct

2460

gtggtcaaca gcctggaccc ccccctgctg accagatacc tgaggatcca cccccagagc

2520

tgggtgcacc agatcgccct gaggatggag gtgctgggct gtgaggccca ggacctgtac

2580

tga

2583

<210> 11

<211> 1734

<212> ДНК

<213> Искусственная последовательность

<220>

<223> coFVIII-25-NT58

<400> 11

gccaccagga gatactacct gggcgccgtg gagctgagct gggactacat gcagtctgac

60

ctgggcgagc tgccagtgga cgccaggttc ccccccagag tgcccaagag cttccccttc

120

aacaccagcg tggtgtacaa gaagaccctg ttcgtggagt tcactgacca cctgttcaac

180

atcgccaagc ccaggccccc ctggatgggc ctgctgggcc ccaccatcca ggccgaggtg

240

tacgacaccg tggtcatcac cctgaagaac atggccagcc accccgtctc cctgcacgcc

300

gtgggggtga gctactggaa ggcctctgag ggcgccgagt acgacgacca gaccagccag

360

agggagaagg aggacgacaa ggtgttccct gggggcagcc acacctacgt gtggcaggtc

420

ctgaaggaga acggccccat ggcctctgac cccctgtgcc tgacctacag ctacctgagc

480

cacgtggacc tggtgaagga cctgaactct ggcctgattg gggccctgct ggtgtgcagg

540

gagggcagcc tggccaagga gaagacccag accctgcaca agttcatcct gctgttcgcc

600

gtgttcgacg agggcaagag ctggcactct gaaaccaaga acagcctgat gcaggacagg

660

gacgccgcct ctgccagggc ctggcccaag atgcacaccg tcaacggcta cgtcaacagg

720

agcctgcctg gcctgattgg ctgccacagg aagagcgtgt actggcatgt gatcggcatg

780

ggcaccaccc ctgaggtgca cagcatcttc ctggagggcc acaccttcct ggtcaggaac

840

cacaggcagg ccagcctgga gatcagcccc atcaccttcc tgaccgccca gaccctgctg

900

atggacctgg gccagttcct gctgttctgc cacatctcca gccaccagca cgacggcatg

960

gaggcctacg tgaaagtgga cagctgccct gaggagcccc agctgaggat gaagaacaac

1020

gaggaggccg aggactatga tgacgacctg accgacagcg agatggacgt ggtcaggttc

1080

gacgacgaca acagccccag cttcatccag atcaggagcg tggccaagaa gcaccccaag

1140

acctgggtgc actacatcgc tgctgaggag gaggactggg actatgcccc cctggtgctg

1200

gcccctgatg acaggagcta caagagccag tacctgaaca atggccccca gaggattggc

1260

aggaagtaca agaaagtcag gttcatggcc tacactgatg aaaccttcaa gaccagggag

1320

gccatccagc atgagtctgg catcctgggc cccctgctgt acggggaggt gggggacacc

1380

ctgctgatca tcttcaagaa ccaggccagc aggccctaca acatctaccc ccatggcatc

1440

accgacgtga ggcccctgta cagcaggagg ctgcctaagg gggtgaagca cctgaaagac

1500

ttccccatcc tgcctgggga gatcttcaag tacaagtgga ctgtgactgt ggaggacggc

1560

cccaccaaga gcgaccccag gtgcctgacc agatactaca gcagcttcgt caacatggag

1620

agggacctgg cctctggcct gattggcccc ctgctgatct gctacaagga gtctgtggac

1680

cagaggggca accagatcat gagcgacaag aggaacgtga tcctgttctc tgtc

1734

<210> 12

<211> 2583

<212> ДНК

<213> Искусственная последовательность

<220>

<223> coFVIII-25-CT

<400> 12

ttcgacgaga acaggagctg gtacctgact gaaaacatcc agcggttcct ccccaacccc

60

gcgggcgtgc agctggaaga tcctgagttt caggcatcaa acatcatgca ctccattaac

120

ggctacgtgt tcgattcgct gcagctgagc gtgtgtctgc acgaagtggc ctactggtac

180

atcctgtcca ttggtgccca gactgacttc ctgtccgtgt ttttctccgg ctacacgttc

240

aagcacaaga tggtgtacga ggacaccctg accctcttcc ctttttccgg cgaaactgtg

300

tttatgagca tggagaatcc cggcctgtgg atcttgggct gccacaacag cgacttccgt

360

aacagaggaa tgactgcgct gctcaaggtg tccagctgcg acaagaacac cggagactat

420

tatgaggact catacgagga catctccgcc tacctcctgt ccaagaataa cgccattgaa

480

cctcggagct tcagccagaa cccacccgtg cttaagagac atcaacggga gatcactagg

540

accaccctgc agtcagacca ggaggaaatc gactacgatg acaccatctc ggtcgagatg

600

aagaaggagg actttgacat ctacgacgaa gatgaaaacc agagcccgag gtcgttccaa

660

aagaaaaccc gccactactt tattgctgct gtcgagcggc tgtgggacta cggaatgtcg

720

tcctcgccgc acgtgctccg caaccgagcc cagagcggct cggtgccgca attcaagaag

780

gtcgtgttcc aggagttcac tgacgggagc ttcactcagc ctttgtaccg gggagaactc

840

aatgaacatc tcggcctcct cggaccttac atcagagcag aagtggaaga taacatcatg

900

gtcactttcc gtaaccaagc cagccgcccg tactcgttct actcctccct catttcttac

960

gaagaggacc agcggcaggg cgcagaaccg cgcaagaact tcgtgaagcc caacgaaacc

1020

aagacctact tctggaaagt gcagcatcat atggccccga ctaaggacga gtttgactgc

1080

aaagcctggg cctacttctc cgatgtggac ttggagaagg acgtccactc cggcctcatc

1140

ggtcccctgc tcgtgtgcca taccaatacc ctgaaccccg cacacggtcg ccaggtcacc

1200

gtgcaggagt tcgctctgtt cttcactatc ttcgacgaaa ctaagtcctg gtacttcacc

1260

gagaacatgg agaggaactg cagagccccc tgtaacatcc agatggagga cccgacgttc

1320

aaggaaaact accggttcca cgccattaac ggatacatca tggatacgct gccgggtctt

1380

gtgatggccc aggatcaacg gatcagatgg tacttattgt cgatgggcag caacgagaac

1440

atccactcta ttcacttctc cggtcatgtg ttcactgtgc ggaagaagga agagtacaag

1500

atggccctgt acaaccttta tcccggagtg ttcgaaactg tggaaatgct gccgtcgaag

1560

gccggcattt ggcgcgtgga gtgtttgatt ggagaacatc tccatgcggg gatgtcaacc

1620

ctgttcctgg tgtatagcaa caagtgccag actccgcttg ggatggcgtc aggacacatt

1680

agggatttcc agatcactgc gtccggccag tacggccaat gggcccctaa gctggcccgc

1740

ctgcattact ccggatccat taacgcctgg tcaaccaagg agccattctc ctggatcaag

1800

gtggaccttc tggcccccat gattatccac ggaattaaga cccagggggc ccggcagaag

1860

ttctcctcac tgtacatcag ccagttcata atcatgtact ccctggacgg aaagaagtgg

1920

caaacctaca gggggaacag caccggcaca ctgatggtct ttttcggaaa tgtggactcc

1980

tccgggatta agcataacat cttcaaccct ccgattatcg ctcggtacat tagacttcac

2040

cctacccact acagcattcg ctccaccctg cggatggaac tgatgggctg cgatctgaac

2100

tcgtgcagca tgccgttggg aatggagtcc aaagcaattt ccgacgcgca gatcaccgcc

2160

tcgtcctact ttaccaacat gttcgccacg tggtcaccgt ccaaggcccg gctgcacctc

2220

cagggaagat ccaacgcatg gcggccacag gtcaacaacc ctaaggagtg gctccaggtg

2280

gacttccaga aaaccatgaa ggtcaccgga gtcacaaccc agggagtgaa gtcgctgctg

2340

acttctatgt acgtcaagga gttcctgatc tccagcagcc aggacgggca ccagtggacc

2400

ctgttcttcc aaaatggaaa ggtcaaggtg tttcagggca atcaggattc attcaccccg

2460

gtggtgaact cccttgatcc acccctcctg acccgctacc ttcgcatcca cccacagtcc

2520

tgggtgcacc agatcgcgct gaggatggag gtcctgggat gcgaagccca ggacctgtac

2580

tga

2583

<210> 13

<211> 1734

<212> ДНК

<213> Искусственная последовательность

<220>

<223> coFVIII-26-NT58

<400> 13

gccaccagga gatactacct gggcgccgtg gagctgagct gggactacat gcagtctgac

60

ctgggcgagc tgccagtgga cgccaggttc ccccccagag tgcccaagag cttccccttc

120

aacaccagcg tggtgtacaa gaagaccctg ttcgtggagt tcactgacca cctgttcaac

180

atcgccaagc ccaggccccc ctggatgggc ctgctgggcc ccaccatcca ggccgaggtg

240

tacgacaccg tggtcatcac cctgaagaac atggccagcc accccgtctc cctgcacgcc

300

gtgggggtga gctactggaa ggcctctgag ggcgccgagt acgacgacca gaccagccag

360

agggagaagg aggacgacaa ggtgttccct gggggcagcc acacctacgt gtggcaggtc

420

ctgaaggaga acggccccat ggcctctgac cccctgtgcc tgacctacag ctacctgagc

480

cacgtggacc tggtgaagga cctgaactct ggcctgattg gggccctgct ggtgtgcagg

540

gagggcagcc tggccaagga gaagacccag accctgcaca agttcatcct gctgttcgcc

600

gtgttcgacg agggcaagag ctggcactct gaaaccaaga acagcctgat gcaggacagg

660

gacgccgcct ctgccagggc ctggcccaag atgcacaccg tcaacggcta cgtcaacagg

720

agcctgcctg gcctgattgg ctgccacagg aagagcgtgt actggcatgt gatcggcatg

780

ggcaccaccc ctgaggtgca cagcatcttc ctggagggcc acaccttcct ggtcaggaac

840

cacaggcagg ccagcctgga gatcagcccc atcaccttcc tgaccgccca gaccctgctg

900

atggacctgg gccagttcct gctgttctgc cacatctcca gccaccagca cgacggcatg

960

gaggcctacg tgaaagtgga cagctgccct gaggagcccc agctgaggat gaagaacaac

1020

gaggaggccg aggactatga tgacgacctg accgacagcg agatggacgt ggtcaggttc

1080

gacgacgaca acagccccag cttcatccag atcaggagcg tggccaagaa gcaccccaag

1140

acctgggtgc actacatcgc tgctgaggag gaggactggg actatgcccc cctggtgctg

1200

gcccctgatg acaggagcta caagagccag tacctgaaca atggccccca gaggattggc

1260

aggaagtaca agaaagtcag gttcatggcc tacactgatg aaaccttcaa gaccagggag

1320

gccatccagc atgagtctgg catcctgggc cccctgctgt acggggaggt gggggacacc

1380

ctgctgatca tcttcaagaa ccaggccagc aggccctaca acatctaccc ccatggcatc

1440

accgacgtga ggcccctgta cagcaggagg ctgcctaagg gggtgaagca cctgaaagac

1500

ttccccatcc tgcctgggga gatcttcaag tacaagtgga ctgtgactgt ggaggacggc

1560

cccaccaaga gcgaccccag gtgcctgacc agatactaca gcagcttcgt caacatggag

1620

agggacctgg cctctggcct gattggcccc ctgctgatct gctacaagga gtctgtggac

1680

cagaggggca accagatcat gagcgacaag aggaacgtga tcctgttctc tgtc

1734

<210> 14

<211> 2583

<212> ДНК

<213> Искусственная последовательность

<220>

<223> coFVIII-26-CT

<400> 14

ttcgacgaga acaggagctg gtacctcact gaaaacatcc agaggttcct cccaaacccc

60

gcaggagtgc aactggagga ccctgagttt caggcctcga atatcatgca ctcgattaac

120

ggttacgtgt tcgactcgct gcagctgagc gtgtgcctcc atgaagtcgc ttactggtac

180

attctgtcca tcggcgccca gactgacttc ctgagcgtgt tcttttccgg ttacaccttt

240

aagcacaaga tggtgtacga agataccctg accctgttcc ctttctccgg cgaaacggtg

300

ttcatgtcga tggagaaccc gggtctgtgg attctgggat gccacaacag cgactttcgg

360

aaccgcggaa tgactgccct gctgaaggtg tcctcatgcg acaagaacac cggagactac

420

tacgaggact cctacgagga tatctcagcc tacctcctgt ccaagaacaa cgcgatcgag

480

ccgcgcagct tcagccagaa cccgcctgtg ctgaagaggc accagcgaga aattacccgg

540

accaccctcc aatcggatca ggaggaaatc gactacgacg acaccatctc ggtggaaatg

600

aagaaggaag atttcgatat ctacgacgag gacgaaaatc agtcccctcg ctcattccaa

660

aagaaaacta gacactactt tatcgccgcg gtggaaagac tgtgggacta tggaatgtca

720

tccagccctc acgtccttcg gaaccgggcc cagagcggat cggtgcctca gttcaagaaa

780

gtggtgttcc aggagttcac cgacggcagc ttcacccagc cgctgtaccg gggagaactg

840

aacgaacacc tgggcctgct cggtccctac atccgcgcgg aagtggagga taacatcatg

900

gtgaccttcc gtaaccaagc atccagacct tactccttct attcctccct gatctcatac

960

gaggaggacc agcgccaagg cgccgagccc cgcaagaact tcgtcaagcc caacgagact

1020

aagacctact tctggaaggt ccaacaccat atggccccga ccaaggatga gtttgactgc

1080

aaggcctggg cctacttctc cgacgtggac cttgagaagg atgtccattc cggcctgatc

1140

gggccgctgc tcgtgtgtca caccaacacc ctgaacccag cgcatggacg ccaggtcacc

1200

gtccaggagt ttgctctgtt cttcaccatt tttgacgaaa ctaagtcctg gtacttcacc

1260

gagaatatgg agcgaaactg tagagcgccc tgcaatatcc agatggaaga tccgactttc

1320

aaggagaact atagattcca cgccatcaac gggtacatca tggatactct gccggggctg

1380

gtcatggccc aggatcagag gattcggtgg tacttgctgt caatgggatc gaacgaaaac

1440

attcactcca ttcacttctc cggtcacgtg ttcactgtgc gcaagaagga ggagtacaag

1500

atggcgctgt acaatctgta ccccggggtg ttcgaaactg tggagatgct gccgtccaag

1560

gccggcatct ggagagtgga gtgcctgatc ggagagcacc tccacgcggg gatgtccacc

1620

ctcttcctgg tgtactcgaa taagtgccag accccgctgg gcatggcctc gggccacatc

1680

agagacttcc agatcacagc aagcggacaa tacggccaat gggcgccgaa gctggcccgc

1740

ttgcactact ccggatcgat caacgcatgg tccaccaagg aaccgttctc gtggattaag

1800

gtggacctcc tggcccctat gattatccac ggaattaaga cccagggcgc caggcagaag

1860

ttctcctccc tgtacatctc gcaattcatc atcatgtaca gcctggacgg gaagaagtgg

1920

cagacttaca ggggaaactc caccggcacc ctgatggtct ttttcggcaa cgtggattcc

1980

tccggcatta agcacaacat cttcaaccca ccgatcatag ccagatatat taggctccac

2040

cccactcact actcaatccg ctcaactctt cggatggaac tcatggggtg cgacctgaac

2100

tcctgctcca tgccgttggg gatggaatca aaggctatta gcgacgccca gatcaccgcg

2160

agctcctact tcactaacat gttcgccacc tggagcccct ccaaggccag gctgcacttg

2220

cagggacggt caaatgcctg gcggccgcaa gtgaacaatc cgaaggaatg gcttcaagtg

2280

gatttccaaa agaccatgaa agtgaccgga gtcaccaccc agggagtgaa gtcccttctg

2340

acctcgatgt atgtgaagga gttcctgatt agcagcagcc aggacgggca ccagtggacc

2400

ctgttcttcc aaaacggaaa ggtcaaggtg ttccagggga accaggactc gttcacaccc

2460

gtggtgaact ccctggaccc cccactgctg acgcggtact tgaggattca tcctcagtcc

2520

tgggtccatc agattgcatt gcgaatggaa gtcctgggct gcgaggccca ggacctgtac

2580

tga

2583

<210> 15

<211> 2332

<212> БЕЛОК

<213> Homo sapiens

<400> 15

Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr

1. 5 10 15

Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro

20 25 30

Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys

35 40 45

Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro

50 55 60

Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val

65 70 75 80

Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val

85 90 95

Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala

100 105 110

Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val

115 120 125

Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn

130 135 140

Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser

145 150 155 160

His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu

165 170 175

Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu

180 185 190

His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp

195 200 205

His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser

210 215 220

Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg

225 230 235 240

Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His

245 250 255

Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu

260 265 270

Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile

275 280 285

Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly

290 295 300

Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met

305 310 315 320

Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg

325 330 335

Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp

340 345 350

Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe

355 360 365

Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His

370 375 380

Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu

385 390 395 400

Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro

405 410 415

Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr

420 425 430

Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile

435 440 445

Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile

450 455 460

Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile

465 470 475 480

Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys

485 490 495

His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys

500 505 510

Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys

515 520 525

Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala

530 535 540

Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp

545 550 555 560

Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe

565 570 575

Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln

580 585 590

Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe

595 600 605

Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser

610 615 620

Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu

625 630 635 640

Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr

645 650 655

Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro

660 665 670

Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp

675 680 685

Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala

690 695 700

Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu

705 710 715 720

Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala

725 730 735

Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Pro Ser Thr Arg

740 745 750

Gln Lys Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn Asp Ile Glu Lys

755 760 765

Thr Asp Pro Trp Phe Ala His Arg Thr Pro Met Pro Lys Ile Gln Asn

770 775 780

Val Ser Ser Ser Asp Leu Leu Met Leu Leu Arg Gln Ser Pro Thr Pro

785 790 795 800

His Gly Leu Ser Leu Ser Asp Leu Gln Glu Ala Lys Tyr Glu Thr Phe

805 810 815

Ser Asp Asp Pro Ser Pro Gly Ala Ile Asp Ser Asn Asn Ser Leu Ser

820 825 830

Glu Met Thr His Phe Arg Pro Gln Leu His His Ser Gly Asp Met Val

835 840 845

Phe Thr Pro Glu Ser Gly Leu Gln Leu Arg Leu Asn Glu Lys Leu Gly

850 855 860

Thr Thr Ala Ala Thr Glu Leu Lys Lys Leu Asp Phe Lys Val Ser Ser

865 870 875 880

Thr Ser Asn Asn Leu Ile Ser Thr Ile Pro Ser Asp Asn Leu Ala Ala

885 890 895

Gly Thr Asp Asn Thr Ser Ser Leu Gly Pro Pro Ser Met Pro Val His

900 905 910

Tyr Asp Ser Gln Leu Asp Thr Thr Leu Phe Gly Lys Lys Ser Ser Pro

915 920 925

Leu Thr Glu Ser Gly Gly Pro Leu Ser Leu Ser Glu Glu Asn Asn Asp

930 935 940

Ser Lys Leu Leu Glu Ser Gly Leu Met Asn Ser Gln Glu Ser Ser Trp

945 950 955 960

Gly Lys Asn Val Ser Ser Thr Glu Ser Gly Arg Leu Phe Lys Gly Lys

965 970 975

Arg Ala His Gly Pro Ala Leu Leu Thr Lys Asp Asn Ala Leu Phe Lys

980 985 990

Val Ser Ile Ser Leu Leu Lys Thr Asn Lys Thr Ser Asn Asn Ser Ala

995 1000 1005

Thr Asn Arg Lys Thr His Ile Asp Gly Pro Ser Leu Leu Ile Glu

1010 1015 1020

Asn Ser Pro Ser Val Trp Gln Asn Ile Leu Glu Ser Asp Thr Glu

1025 1030 1035

Phe Lys Lys Val Thr Pro Leu Ile His Asp Arg Met Leu Met Asp

1040 1045 1050

Lys Asn Ala Thr Ala Leu Arg Leu Asn His Met Ser Asn Lys Thr

1055 1060 1065

Thr Ser Ser Lys Asn Met Glu Met Val Gln Gln Lys Lys Glu Gly

1070 1075 1080

Pro Ile Pro Pro Asp Ala Gln Asn Pro Asp Met Ser Phe Phe Lys

1085 1090 1095

Met Leu Phe Leu Pro Glu Ser Ala Arg Trp Ile Gln Arg Thr His

1100 1105 1110

Gly Lys Asn Ser Leu Asn Ser Gly Gln Gly Pro Ser Pro Lys Gln

1115 1120 1125

Leu Val Ser Leu Gly Pro Glu Lys Ser Val Glu Gly Gln Asn Phe

1130 1135 1140

Leu Ser Glu Lys Asn Lys Val Val Val Gly Lys Gly Glu Phe Thr

1145 1150 1155

Lys Asp Val Gly Leu Lys Glu Met Val Phe Pro Ser Ser Arg Asn

1160 1165 1170

Leu Phe Leu Thr Asn Leu Asp Asn Leu His Glu Asn Asn Thr His

1175 1180 1185

Asn Gln Glu Lys Lys Ile Gln Glu Glu Ile Glu Lys Lys Glu Thr

1190 1195 1200

Leu Ile Gln Glu Asn Val Val Leu Pro Gln Ile His Thr Val Thr

1205 1210 1215

Gly Thr Lys Asn Phe Met Lys Asn Leu Phe Leu Leu Ser Thr Arg

1220 1225 1230

Gln Asn Val Glu Gly Ser Tyr Asp Gly Ala Tyr Ala Pro Val Leu

1235 1240 1245

Gln Asp Phe Arg Ser Leu Asn Asp Ser Thr Asn Arg Thr Lys Lys

1250 1255 1260

His Thr Ala His Phe Ser Lys Lys Gly Glu Glu Glu Asn Leu Glu

1265 1270 1275

Gly Leu Gly Asn Gln Thr Lys Gln Ile Val Glu Lys Tyr Ala Cys

1280 1285 1290

Thr Thr Arg Ile Ser Pro Asn Thr Ser Gln Gln Asn Phe Val Thr

1295 1300 1305

Gln Arg Ser Lys Arg Ala Leu Lys Gln Phe Arg Leu Pro Leu Glu

1310 1315 1320

Glu Thr Glu Leu Glu Lys Arg Ile Ile Val Asp Asp Thr Ser Thr

1325 1330 1335

Gln Trp Ser Lys Asn Met Lys His Leu Thr Pro Ser Thr Leu Thr

1340 1345 1350

Gln Ile Asp Tyr Asn Glu Lys Glu Lys Gly Ala Ile Thr Gln Ser

1355 1360 1365

Pro Leu Ser Asp Cys Leu Thr Arg Ser His Ser Ile Pro Gln Ala

1370 1375 1380

Asn Arg Ser Pro Leu Pro Ile Ala Lys Val Ser Ser Phe Pro Ser

1385 1390 1395

Ile Arg Pro Ile Tyr Leu Thr Arg Val Leu Phe Gln Asp Asn Ser

1400 1405 1410

Ser His Leu Pro Ala Ala Ser Tyr Arg Lys Lys Asp Ser Gly Val

1415 1420 1425

Gln Glu Ser Ser His Phe Leu Gln Gly Ala Lys Lys Asn Asn Leu

1430 1435 1440

Ser Leu Ala Ile Leu Thr Leu Glu Met Thr Gly Asp Gln Arg Glu

1445 1450 1455

Val Gly Ser Leu Gly Thr Ser Ala Thr Asn Ser Val Thr Tyr Lys

1460 1465 1470

Lys Val Glu Asn Thr Val Leu Pro Lys Pro Asp Leu Pro Lys Thr

1475 1480 1485

Ser Gly Lys Val Glu Leu Leu Pro Lys Val His Ile Tyr Gln Lys

1490 1495 1500

Asp Leu Phe Pro Thr Glu Thr Ser Asn Gly Ser Pro Gly His Leu

1505 1510 1515

Asp Leu Val Glu Gly Ser Leu Leu Gln Gly Thr Glu Gly Ala Ile

1520 1525 1530

Lys Trp Asn Glu Ala Asn Arg Pro Gly Lys Val Pro Phe Leu Arg

1535 1540 1545

Val Ala Thr Glu Ser Ser Ala Lys Thr Pro Ser Lys Leu Leu Asp

1550 1555 1560

Pro Leu Ala Trp Asp Asn His Tyr Gly Thr Gln Ile Pro Lys Glu

1565 1570 1575

Glu Trp Lys Ser Gln Glu Lys Ser Pro Glu Lys Thr Ala Phe Lys

1580 1585 1590

Lys Lys Asp Thr Ile Leu Ser Leu Asn Ala Cys Glu Ser Asn His

1595 1600 1605

Ala Ile Ala Ala Ile Asn Glu Gly Gln Asn Lys Pro Glu Ile Glu

1610 1615 1620

Val Thr Trp Ala Lys Gln Gly Arg Thr Glu Arg Leu Cys Ser Gln

1625 1630 1635

Asn Pro Pro Val Leu Lys Arg His Gln Arg Glu Ile Thr Arg Thr

1640 1645 1650

Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr Asp Asp Thr Ile

1655 1660 1665

Ser Val Glu Met Lys Lys Glu Asp Phe Asp Ile Tyr Asp Glu Asp

1670 1675 1680

Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys Thr Arg His Tyr

1685 1690 1695

Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly Met Ser Ser

1700 1705 1710

Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser Val Pro

1715 1720 1725

Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser Phe

1730 1735 1740

Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu

1745 1750 1755

Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val

1760 1765 1770

Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser

1775 1780 1785

Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg

1790 1795 1800

Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys

1805 1810 1815

Val Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys

1820 1825 1830

Ala Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His

1835 1840 1845

Ser Gly Leu Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu

1850 1855 1860

Asn Pro Ala His Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu

1865 1870 1875

Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu

1880 1885 1890

Asn Met Glu Arg Asn Cys Arg Ala Pro Cys Asn Ile Gln Met Glu

1895 1900 1905

Asp Pro Thr Phe Lys Glu Asn Tyr Arg Phe His Ala Ile Asn Gly

1910 1915 1920

Tyr Ile Met Asp Thr Leu Pro Gly Leu Val Met Ala Gln Asp Gln

1925 1930 1935

Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn Ile

1940 1945 1950

His Ser Ile His Phe Ser Gly His Val Phe Thr Val Arg Lys Lys

1955 1960 1965

Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe

1970 1975 1980

Glu Thr Val Glu Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val

1985 1990 1995

Glu Cys Leu Ile Gly Glu His Leu His Ala Gly Met Ser Thr Leu

2000 2005 2010

Phe Leu Val Tyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala

2015 2020 2025

Ser Gly His Ile Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr

2030 2035 2040

Gly Gln Trp Ala Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser

2045 2050 2055

Ile Asn Ala Trp Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys Val

2060 2065 2070

Asp Leu Leu Ala Pro Met Ile Ile His Gly Ile Lys Thr Gln Gly

2075 2080 2085

Ala Arg Gln Lys Phe Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile

2090 2095 2100

Met Tyr Ser Leu Asp Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn

2105 2110 2115

Ser Thr Gly Thr Leu Met Val Phe Phe Gly Asn Val Asp Ser Ser

2120 2125 2130

Gly Ile Lys His Asn Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr

2135 2140 2145

Ile Arg Leu His Pro Thr His Tyr Ser Ile Arg Ser Thr Leu Arg

2150 2155 2160

Met Glu Leu Met Gly Cys Asp Leu Asn Ser Cys Ser Met Pro Leu

2165 2170 2175

Gly Met Glu Ser Lys Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser

2180 2185 2190

Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp Ser Pro Ser Lys Ala

2195 2200 2205

Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln Val

2210 2215 2220

Asn Asn Pro Lys Glu Trp Leu Gln Val Asp Phe Gln Lys Thr Met

2225 2230 2235

Lys Val Thr Gly Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr

2240 2245 2250

Ser Met Tyr Val Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly

2255 2260 2265

His Gln Trp Thr Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe

2270 2275 2280

Gln Gly Asn Gln Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp

2285 2290 2295

Pro Pro Leu Leu Thr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp

2300 2305 2310

Val His Gln Ile Ala Leu Arg Met Glu Val Leu Gly Cys Glu Ala

2315 2320 2325

Gln Asp Leu Tyr

2330

<210> 16

<211> 4371

<212> ДНК

<213> Искусственная последовательность

<220>

<223> BDD-FVIII (не оптимизированная; "родительская"), нуклеотидная

последовательность

<400> 16

atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagtgcc

60

accagaagat actacctggg tgcagtggaa ctgtcatggg actatatgca aagtgatctc

120

ggtgagctgc ctgtggacgc aagatttcct cctagagtgc caaaatcttt tccattcaac

180

acctcagtcg tgtacaaaaa gactctgttt gtagaattca cggatcacct tttcaacatc

240

gctaagccaa ggccaccctg gatgggtctg ctaggtccta ccatccaggc tgaggtttat

300

gatacagtgg tcattacact taagaacatg gcttcccatc ctgtcagtct tcatgctgtt

360

ggtgtatcct actggaaagc ttctgaggga gctgaatatg atgatcagac cagtcaaagg

420

gagaaagaag atgataaagt cttccctggt ggaagccata catatgtctg gcaggtcctg

480

aaagagaatg gtccaatggc ctctgaccca ctgtgcctta cctactcata tctttctcat

540

gtggacctgg taaaagactt gaattcaggc ctcattggag ccctactagt atgtagagaa

600

gggagtctgg ccaaggaaaa gacacagacc ttgcacaaat ttatactact ttttgctgta

660

tttgatgaag ggaaaagttg gcactcagaa acaaagaact ccttgatgca ggatagggat

720

gctgcatctg ctcgggcctg gcctaaaatg cacacagtca atggttatgt aaacaggtct

780

ctgccaggtc tgattggatg ccacaggaaa tcagtctatt ggcatgtgat tggaatgggc

840

accactcctg aagtgcactc aatattcctc gaaggtcaca catttcttgt gaggaaccat

900

cgccaggcgt ccttggaaat ctcgccaata actttcctta ctgctcaaac actcttgatg

960

gaccttggac agtttctact gttttgtcat atctcttccc accaacatga tggcatggaa

1020

gcttatgtca aagtagacag ctgtccagag gaaccccaac tacgaatgaa aaataatgaa

1080

gaagcggaag actatgatga tgatcttact gattctgaaa tggatgtggt caggtttgat

1140

gatgacaact ctccttcctt tatccaaatt cgctcagttg ccaagaagca tcctaaaact

1200

tgggtacatt acattgctgc tgaagaggag gactgggact atgctccctt agtcctcgcc

1260

cccgatgaca gaagttataa aagtcaatat ttgaacaatg gccctcagcg gattggtagg

1320

aagtacaaaa aagtccgatt tatggcatac acagatgaaa cctttaagac tcgtgaagct

1380

attcagcatg aatcaggaat cttgggacct ttactttatg gggaagttgg agacacactg

1440

ttgattatat ttaagaatca agcaagcaga ccatataaca tctaccctca cggaatcact

1500

gatgtccgtc ctttgtattc aaggagatta ccaaaaggtg taaaacattt gaaggatttt

1560

ccaattctgc caggagaaat attcaaatat aaatggacag tgactgtaga agatgggcca

1620

actaaatcag atcctcggtg cctgacccgc tattactcta gtttcgttaa tatggagaga

1680

gatctagctt caggactcat tggccctctc ctcatctgct acaaagaatc tgtagatcaa

1740

agaggaaacc agataatgtc agacaagagg aatgtcatcc tgttttctgt atttgatgag

1800

aaccgaagct ggtacctcac agagaatata caacgctttc tccccaatcc agctggagtg

1860

cagcttgagg atccagagtt ccaagcctcc aacatcatgc acagcatcaa tggctatgtt

1920

tttgatagtt tgcagttgtc agtttgtttg catgaggtgg catactggta cattctaagc

1980

attggagcac agactgactt cctttctgtc ttcttctctg gatatacctt caaacacaaa

2040

atggtctatg aagacacact caccctattc ccattctcag gagaaactgt cttcatgtcg

2100

atggaaaacc caggtctatg gattctgggg tgccacaact cagactttcg gaacagaggc

2160

atgaccgcct tactgaaggt ttctagttgt gacaagaaca ctggtgatta ttacgaggac

2220

agttatgaag atatttcagc atacttgctg agtaaaaaca atgccattga accaagaagc

2280

ttctctcaaa acccaccagt cttgaaacgc catcaacggg aaataactcg tactactctt

2340

cagtcagatc aagaggaaat tgactatgat gataccatat cagttgaaat gaagaaggaa

2400

gattttgaca tttatgatga ggatgaaaat cagagccccc gcagctttca aaagaaaaca

2460

cgacactatt ttattgctgc agtggagagg ctctgggatt atgggatgag tagctcccca

2520

catgttctaa gaaacagggc tcagagtggc agtgtccctc agttcaagaa agttgttttc

2580

caggaattta ctgatggctc ctttactcag cccttatacc gtggagaact aaatgaacat

2640

ttgggactcc tggggccata tataagagca gaagttgaag ataatatcat ggtaactttc

2700

agaaatcagg cctctcgtcc ctattccttc tattctagcc ttatttctta tgaggaagat

2760

cagaggcaag gagcagaacc tagaaaaaac tttgtcaagc ctaatgaaac caaaacttac

2820

ttttggaaag tgcaacatca tatggcaccc actaaagatg agtttgactg caaagcctgg

2880

gcttatttct ctgatgttga cctggaaaaa gatgtgcact caggcctgat tggacccctt

2940

ctggtctgcc acactaacac actgaaccct gctcatggga gacaagtgac agtacaggaa

3000

tttgctctgt ttttcaccat ctttgatgag accaaaagct ggtacttcac tgaaaatatg

3060

gaaagaaact gcagggctcc ctgcaatatc cagatggaag atcccacttt taaagagaat

3120

tatcgcttcc atgcaatcaa tggctacata atggatacac tacctggctt agtaatggct

3180

caggatcaaa ggattcgatg gtatctgctc agcatgggca gcaatgaaaa catccattct

3240

attcatttca gtggacatgt gttcactgta cgaaaaaaag aggagtataa aatggcactg

3300

tacaatctct atccaggtgt ttttgagaca gtggaaatgt taccatccaa agctggaatt

3360

tggcgggtgg aatgccttat tggcgagcat ctacatgctg ggatgagcac actttttctg

3420

gtgtacagca ataagtgtca gactcccctg ggaatggctt ctggacacat tagagatttt

3480

cagattacag cttcaggaca atatggacag tgggccccaa agctggccag acttcattat

3540

tccggatcaa tcaatgcctg gagcaccaag gagccctttt cttggatcaa ggtggatctg

3600

ttggcaccaa tgattattca cggcatcaag acccagggtg cccgtcagaa gttctccagc

3660

ctctacatct ctcagtttat catcatgtat agtcttgatg ggaagaagtg gcagacttat

3720

cgaggaaatt ccactggaac cttaatggtc ttctttggca atgtggattc atctgggata

3780

aaacacaata tttttaaccc tccaattatt gctcgataca tccgtttgca cccaactcat

3840

tatagcattc gcagcactct tcgcatggag ttgatgggct gtgatttaaa tagttgcagc

3900

atgccattgg gaatggagag taaagcaata tcagatgcac agattactgc ttcatcctac

3960

tttaccaata tgtttgccac ctggtctcct tcaaaagctc gacttcacct ccaagggagg

4020

agtaatgcct ggagacctca ggtgaataat ccaaaagagt ggctgcaagt ggacttccag

4080

aagacaatga aagtcacagg agtaactact cagggagtaa aatctctgct taccagcatg

4140

tatgtgaagg agttcctcat ctccagcagt caagatggcc atcagtggac tctctttttt

4200

cagaatggca aagtaaaggt ttttcaggga aatcaagact ccttcacacc tgtggtgaac

4260

tctctagacc caccgttact gactcgctac cttcgaattc acccccagag ttgggtgcac

4320

cagattgccc tgaggatgga ggttctgggc tgcgaggcac aggacctcta c

4371

<210> 17

<211> 1438

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> BDD-FVIII (не оптимизированная; "родительская"),

аминокислотная последовательность

<400> 17

Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr

1. 5 10 15

Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro

20 25 30

Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys

35 40 45

Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro

50 55 60

Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val

65 70 75 80

Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val

85 90 95

Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala

100 105 110

Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val

115 120 125

Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn

130 135 140

Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser

145 150 155 160

His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu

165 170 175

Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu

180 185 190

His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp

195 200 205

His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser

210 215 220

Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg

225 230 235 240

Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His

245 250 255

Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu

260 265 270

Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile

275 280 285

Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly

290 295 300

Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met

305 310 315 320

Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg

325 330 335

Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp

340 345 350

Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe

355 360 365

Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His

370 375 380

Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu

385 390 395 400

Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro

405 410 415

Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr

420 425 430

Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile

435 440 445

Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile

450 455 460

Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile

465 470 475 480

Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys

485 490 495

His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys

500 505 510

Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys

515 520 525

Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala

530 535 540

Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp

545 550 555 560

Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe

565 570 575

Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln

580 585 590

Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe

595 600 605

Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser

610 615 620

Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu

625 630 635 640

Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr

645 650 655

Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro

660 665 670

Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp

675 680 685

Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala

690 695 700

Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu

705 710 715 720

Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala

725 730 735

Ile Glu Pro Arg Ser Phe Ser Gln Asn Pro Pro Val Leu Lys Arg His

740 745 750

Gln Arg Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln Glu Glu Ile

755 760 765

Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp Phe Asp

770 775 780

Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys

785 790 795 800

Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly

805 810 815

Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser

820 825 830

Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser

835 840 845

Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu

850 855 860

Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr

865 870 875 880

Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile

885 890 895

Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn Phe

900 905 910

Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln His His

915 920 925

Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr Phe

930 935 940

Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile Gly Pro

945 950 955 960

Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His Gly Arg Gln

965 970 975

Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr

980 985 990

Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg Ala Pro

995 1000 1005

Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg

1010 1015 1020

Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly Leu

1025 1030 1035

Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met

1040 1045 1050

Gly Ser Asn Glu Asn Ile His Ser Ile His Phe Ser Gly His Val

1055 1060 1065

Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr Asn

1070 1075 1080

Leu Tyr Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser Lys

1085 1090 1095

Ala Gly Ile Trp Arg Val Glu Cys Leu Ile Gly Glu His Leu His

1100 1105 1110

Ala Gly Met Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys Cys Gln

1115 1120 1125

Thr Pro Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe Gln Ile

1130 1135 1140

Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu Ala Arg

1145 1150 1155

Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys Glu Pro

1160 1165 1170

Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile Ile His

1175 1180 1185

Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu Tyr

1190 1195 1200

Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys Trp

1205 1210 1215

Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe Phe

1220 1225 1230

Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn Pro

1235 1240 1245

Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr Ser

1250 1255 1260

Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu Asn

1265 1270 1275

Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp

1280 1285 1290

Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr

1295 1300 1305

Trp Ser Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser Asn

1310 1315 1320

Ala Trp Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln Val

1325 1330 1335

Asp Phe Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln Gly

1340 1345 1350

Val Lys Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu Ile

1355 1360 1365

Ser Ser Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln Asn

1370 1375 1380

Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe Thr Pro

1385 1390 1395

Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr Leu Arg

1400 1405 1410

Ile His Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg Met Glu

1415 1420 1425

Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr

1430 1435

<210> 18

<211> 450

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Нуклеотидная последовательность XTEN

<400> 18

ggcgcgccaa catcagagag cgccacccct gaaagtggtc ccgggagcga gccagccaca

60

tctgggtcgg aaacgccagg cacaagtgag tctgcaactc ccgagtccgg acctggctcc

120

gagcctgcca ctagcggctc cgagactccg ggaacttccg agagcgctac accagaaagc

180

ggacccggaa ccagtaccga acctagcgag ggctctgctc cgggcagccc agccggctct

240

cctacatcca cggaggaggg cacttccgaa tccgccaccc cggagtcagg gccaggatct

300

gaacccgcta cctcaggcag tgagacgcca ggaacgagcg agtccgctac accggagagt

360

gggccaggga gccctgctgg atctcctacg tccactgagg aagggtcacc agcgggctcg

420

cccaccagca ctgaagaagg tgcctcgagc

450

<210> 19

<211> 4824

<212> ДНК

<213> Искусственная последовательность

<220>

<223> coFVIII-52-XTEN

<400> 19

atgcaaatcg aactgagcac ctgtttcttc ctctgcctgc tgagattctg tttctccgcg

60

acccgccgat actacctggg agcagtggag ctctcctggg attacatgca gagcgacctt

120

ggggagctgc ccgtggatgc caggttccct ccccgggtgc caaagtcgtt tccgttcaac

180

acctccgtgg tgtacaagaa aactctgttc gtggagttca ccgaccacct gttcaatatc

240

gccaagccca gacctccctg gatggggctg ttgggaccta ccatccaagc ggaggtgtac

300

gacactgtgg tcatcactct gaagaacatg gcctcgcatc ccgtgtccct gcacgccgtg

360

ggagtgtctt actggaaagc gtccgagggg gccgaatacg acgaccagac ctcgcagaga

420

gaaaaggaag atgacaaggt gttcccagga ggatcgcaca cctacgtgtg gcaagtgttg

480

aaggagaacg gcccaatggc ctccgacccg ctgtgcctga cctactcgta cctgtcccac

540

gtggacctcg tgaaggacct caactcggga ctgattggag ccctgctggt ctgcagggaa

600

ggctcactgg cgaaagaaaa gactcagacc ttgcacaagt tcattctgct gttcgctgtg

660

ttcgacgagg ggaagtcgtg gcacagcgag actaagaact ccctgatgca agatagagat

720

gccgcctccg cccgggcctg gcctaagatg cacaccgtga acggttacgt gaaccgctcc

780

ctccctggcc tgattggatg ccaccggaag tccgtgtact ggcacgtgat cgggatgggg

840

accacccccg aggtgcacag catcttcctg gaaggtcaca catttctcgt gcgcaaccac

900

cggcaggcct ccctggaaat cagccccatt accttcctca ctgcccagac tctgctgatg

960

gacctgggac agttcctgct gttctgccat atctcctccc accaacatga cggaatggag

1020

gcatacgtga aggtcgattc ctgccctgag gaaccccagc tccgcatgaa gaacaatgag

1080

gaagccgagg actacgacga cgacctgacg gatagcgaga tggatgtggt ccggttcgat

1140

gacgataaca gcccttcctt catccaaatt cgctcggtgg caaagaagca ccccaagacc

1200

tgggtgcatt acattgcggc ggaagaagag gactgggatt atgccccgct tgtcctcgct

1260

cctgacgacc ggagctacaa gagccagtac ctgaacaacg gtccacagag gatcggtaga

1320

aagtacaaga aggtccgctt catggcctat accgacgaaa ccttcaaaac tagagaggcc

1380

atccaacacg aatccggcat cctgggcccg ctcttgtacg gagaagtcgg cgacaccctt

1440

ctcattatct tcaagaacca ggcttcccgg ccgtacaaca tctatccgca tgggatcact

1500

gacgtgcgcc cactgtactc gcggcgcctg cccaagggtg tcaaacacct gaaggatttt

1560

ccgatccttc cgggagaaat cttcaagtac aagtggaccg tgaccgtgga agatggccca

1620

actaagtctg accctagatg cctcacccgc tactactcat ccttcgtcaa catggagcgc

1680

gacctggcca gcggactgat cggcccgctg ctgatttgct acaaggaatc agtggaccaa

1740

cggggaaacc agatcatgtc ggataagagg aacgtcatcc tcttctccgt gtttgacgaa

1800

aaccggtcgt ggtacctgac cgagaacatc cagaggttcc tgcccaaccc tgctggggtg

1860

cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa tggctacgtg

1920

ttcgacagcc tgcagctgag cgtgtgcctg cacgaggtgg cctactggta catcctgagc

1980

atcggcgccc agaccgactt cctgagcgtg ttcttctctg gctacacctt caagcacaag

2040

atggtgtatg aggacaccct gaccctgttc cccttcagcg gggagactgt cttcatgagc

2100

atggagaacc ctggcctgtg gatcctgggc tgccacaaca gcgacttcag gaacaggggc

2160

atgactgccc tgctgaaagt ctccagctgt gacaagaaca ccggggacta ctacgaggac

2220

agctacgagg acatcagcgc ctacctgctg agcaagaaca atgccatcga gcccaggagc

2280

ttctctcaga acggcgcgcc aacatcagag agcgccaccc ctgaaagtgg tcccgggagc

2340

gagccagcca catctgggtc ggaaacgcca ggcacaagtg agtctgcaac tcccgagtcc

2400

ggacctggct ccgagcctgc cactagcggc tccgagactc cgggaacttc cgagagcgct

2460

acaccagaaa gcggacccgg aaccagtacc gaacctagcg agggctctgc tccgggcagc

2520

ccagccggct ctcctacatc cacggaggag ggcacttccg aatccgccac cccggagtca

2580

gggccaggat ctgaacccgc tacctcaggc agtgagacgc caggaacgag cgagtccgct

2640

acaccggaga gtgggccagg gagccctgct ggatctccta cgtccactga ggaagggtca

2700

ccagcgggct cgcccaccag cactgaagaa ggtgcctcga gccccccagt gctgaagagg

2760

caccagaggg agatcaccag gaccaccctg cagtctgacc aggaggagat cgactatgat

2820

gacaccatca gcgtggagat gaagaaggag gacttcgaca tctacgacga ggacgagaac

2880

cagagcccca ggagcttcca gaagaagacc aggcactact tcattgctgc tgtggagagg

2940

ctgtgggact atggcatgtc cagcagcccc catgtgctga ggaacagggc ccagtctggc

3000

agcgtgcccc agttcaagaa agtcgtgttc caggagttca ccgacggcag cttcacccag

3060

cccctgtaca gaggggagct gaacgagcac ctgggcctgc tgggccccta catcagggcc

3120

gaggtggagg acaacatcat ggtgaccttc aggaaccagg ccagcaggcc ctacagcttc

3180

tacagcagcc tgatcagcta cgaggaggac cagaggcagg gggctgagcc caggaagaac

3240

tttgtgaagc ccaatgaaac caagacctac ttctggaagg tgcagcacca catggccccc

3300

accaaggacg agttcgactg caaggcctgg gcctacttct ctgacgtgga cctggagaag

3360

gacgtgcact ctggcctgat tggccccctg ctggtgtgcc acaccaacac cctgaaccct

3420

gcccatggca ggcaggtgac tgtgcaggag ttcgccctgt tcttcaccat cttcgatgaa

3480

accaagagct ggtacttcac tgagaacatg gagaggaact gcagggcccc ctgcaacatc

3540

cagatggagg accccacctt caaggagaac tacaggttcc atgccatcaa tggctacatc

3600

atggacaccc tgcctggcct ggtcatggcc caggaccaga ggatcaggtg gtatctgctg

3660

agcatgggca gcaacgagaa catccacagc atccacttct ctggccacgt gttcactgtg

3720

aggaagaagg aggagtacaa gatggccctg tacaacctgt accctggggt gttcgaaacc

3780

gtggagatgc tgcccagcaa ggccggcatc tggagggtgg agtgcctgat tggggagcac

3840

ctgcacgccg gcatgagcac cctgttcctg gtgtacagca acaagtgcca gacccccctg

3900

ggcatggcct ctggccacat cagggacttc cagatcactg cctctggcca gtacggccag

3960

tgggccccca agctggccag gctgcactac tccggaagca tcaatgcctg gagcaccaag

4020

gagcccttca gctggatcaa agtggacctg ctggccccca tgatcatcca cggcatcaag

4080

acccaggggg ccaggcagaa gttctccagc ctgtacatca gccagttcat catcatgtac

4140

agcctggacg gcaagaagtg gcagacctac aggggcaaca gcaccggcac cctgatggtg

4200

ttcttcggca acgtggacag cagcggcatc aagcacaaca tcttcaaccc ccccatcatc

4260

gccagataca tcaggctgca ccccacccac tacagcatca ggagcaccct gaggatggag

4320

ctgatgggct gtgacctgaa cagctgcagc atgcccctgg gcatggagag caaggccatc

4380

tctgacgccc agatcactgc ctccagctac ttcaccaaca tgtttgccac ctggagcccc

4440

agcaaggcca ggctgcacct gcagggcagg agcaatgcct ggaggcccca ggtcaacaac

4500

cccaaggagt ggctgcaggt ggacttccag aagaccatga aggtgactgg ggtgaccacc

4560

cagggggtga agagcctgct gaccagcatg tacgtgaagg agttcctgat ctccagcagc

4620

caggacggcc accagtggac cctgttcttc cagaatggca aggtgaaggt gttccagggc

4680

aaccaggaca gcttcacccc tgtggtcaac agcctggacc cccccctgct gaccagatac

4740

ctgaggatcc acccccagag ctgggtgcac cagatcgccc tgaggatgga ggtgctgggc

4800

tgtgaggccc aggacctgta ctga

4824

<210> 20

<211> 4824

<212> ДНК

<213> Искусственная последовательность

<220>

<223> coFVIII-1-XTEN

<400> 20

atgcagattg agctgtctac ttgctttttc ctgtgcctgc tgaggttttg cttttccgct

60

acacgaaggt attatctggg ggctgtggaa ctgtcttggg attacatgca gagtgacctg

120

ggagagctgc cagtggacgc aaggtttccc cctagagtcc ctaagtcatt ccccttcaac

180

actagcgtgg tctacaagaa aacactgttc gtggagttta ctgatcacct gttcaacatc

240

gcaaagccta ggccaccctg gatgggactg ctggggccaa caatccaggc cgaggtgtac

300

gacaccgtgg tcattacact taagaacatg gcctcacacc ccgtgagcct gcatgctgtg

360

ggcgtcagct actggaaggc ttccgaagga gcagagtatg acgatcagac ttcccagaga

420

gaaaaagagg acgataaggt gtttcctggc ggatctcata cctacgtgtg gcaggtcctg

480

aaagagaatg gccctatggc ctccgaccct ctgtgcctga cctactctta tctgagtcac

540

gtggacctgg tcaaggatct gaacagcggc ctgatcggag ccctgctggt gtgcagggaa

600

ggaagcctgg ctaaggagaa aacccagaca ctgcataagt tcattctgct gttcgccgtg

660

tttgacgaag ggaaatcatg gcacagcgag acaaagaata gtctgatgca ggacagggat

720

gccgcttcag ccagagcttg gcccaaaatg cacactgtga acggctacgt caatcgctca

780

ctgcctgggc tgatcggctg ccaccgaaag agcgtgtatt ggcatgtcat cgggatgggc

840

accacacctg aagtgcactc cattttcctg gagggacata cctttctggt ccgcaaccac

900

cgacaggctt ccctggagat ctctccaatt accttcctga cagcacagac tctgctgatg

960

gacctggggc agttcctgct gttttgccac atcagctccc accagcatga tggcatggag

1020

gcttacgtga aagtggactc ttgtcccgag gaacctcagc tgcggatgaa gaacaatgag

1080

gaagcagaag actatgacga tgacctgacc gactccgaga tggatgtggt ccgattcgat

1140

gacgataaca gcccctcctt tatccagatt agatctgtgg ccaagaaaca ccctaagaca

1200

tgggtccatt acatcgcagc cgaggaagag gactgggatt atgcaccact ggtgctggca

1260

ccagacgatc gctcctacaa atctcagtat ctgaacaatg ggccacagag gattggcaga

1320

aagtacaaga aagtgcggtt catggcatat accgatgaga ccttcaagac tcgcgaagcc

1380

atccagcacg agagcggcat cctgggacca ctgctgtacg gagaagtggg agacaccctg

1440

ctgatcattt tcaagaacca ggccagccgg ccttacaata tctatccaca tgggattaca

1500

gatgtgcgcc ctctgtacag caggagactg ccaaagggcg tcaaacacct gaaggacttc

1560

ccaatcctgc ccggagaaat cttcaagtac aagtggactg tcaccgtcga ggatggcccc

1620

actaagagcg accctcggtg cctgacccgc tactattcta gtttcgtgaa tatggaaaga

1680

gatctggcaa gcggactgat cggaccactg ctgatttgtt acaaagagag cgtggatcag

1740

agaggcaacc agatcatgtc cgacaagcgg aatgtgattc tgttcagtgt ctttgacgaa

1800

aacaggtcat ggtacctgac cgagaacatc cagagattcc tgcctaatcc agctggggtg

1860

cagctggaag atcctgagtt tcaggcatct aacatcatgc atagtattaa tggctacgtg

1920

ttcgacagtt tgcagctgag cgtgtgcctg cacgaggtcg cttactggta tatcctgagc

1980

attggggcac agacagattt cctgagcgtg ttcttttccg gctacacttt taagcataaa

2040

atggtctatg aggacacact gactctgttc cccttcagcg gcgaaaccgt gtttatgagc

2100

atggagaatc ccggactgtg gattctgggg tgccacaaca gcgatttcag aaatcgcgga

2160

atgactgccc tgctgaaagt gtcaagctgt gacaagaaca ccggggacta ctatgaagat

2220

tcatacgagg acatcagcgc atatctgctg tccaaaaaca atgccattga accccggtct

2280

tttagtcaga atggcgcgcc aacatcagag agcgccaccc ctgaaagtgg tcccgggagc

2340

gagccagcca catctgggtc ggaaacgcca ggcacaagtg agtctgcaac tcccgagtcc

2400

ggacctggct ccgagcctgc cactagcggc tccgagactc cgggaacttc cgagagcgct

2460

acaccagaaa gcggacccgg aaccagtacc gaacctagcg agggctctgc tccgggcagc

2520

ccagccggct ctcctacatc cacggaggag ggcacttccg aatccgccac cccggagtca

2580

gggccaggat ctgaacccgc tacctcaggc agtgagacgc caggaacgag cgagtccgct

2640

acaccggaga gtgggccagg gagccctgct ggatctccta cgtccactga ggaagggtca

2700

ccagcgggct cgcccaccag cactgaagaa ggtgcctcga gccctccagt gctgaagcgg

2760

caccagcgcg agatcacccg cactaccctg cagagtgatc aggaagagat cgactacgac

2820

gatacaattt ctgtggaaat gaagaaagag gacttcgata tctatgacga agatgagaac

2880

cagagtcctc gatcattcca gaagaaaacc aggcattact ttattgccgc agtggagcgg

2940

ctgtgggatt atggcatgtc ctctagtcct cacgtgctgc gaaatagggc ccagtcagga

3000

agcgtcccac agttcaagaa agtggtcttc caggagttta cagacgggtc ctttactcag

3060

ccactgtaca ggggcgaact gaacgagcac ctgggactgc tggggcccta tatcagagca

3120

gaagtggagg ataacattat ggtcaccttc agaaatcagg cctctcggcc ttacagtttt

3180

tattcaagcc tgatctctta cgaagaggac cagcgacagg gagctgaacc acgaaaaaac

3240

ttcgtgaagc ctaatgagac caaaacatac ttttggaagg tgcagcacca tatggcccca

3300

acaaaagacg agttcgattg caaggcatgg gcctattttt ctgacgtgga tctggagaag

3360

gacgtgcaca gtggcctgat tggcccactg ctggtgtgcc atactaacac cctgaatcca

3420

gcccacggcc ggcaggtcac tgtccaggag ttcgctctgt tctttaccat ctttgatgag

3480

acaaagagct ggtacttcac cgaaaacatg gagcgaaatt gcagggctcc atgtaacatt

3540

cagatggaag accccacatt caaggagaac taccgctttc atgctatcaa tggatacatc

3600

atggatactc tgcccgggct ggtcatggca caggaccaga gaatccggtg gtatctgctg

3660

agcatgggca gcaacgagaa tatccactca attcatttca gcgggcacgt gtttactgtc

3720

aggaagaaag aagagtacaa gatggccctg tacaacctgt atcccggcgt gttcgaaacc

3780

gtcgagatgc tgcctagcaa ggccggaatc tggagagtgg aatgcctgat tggagagcac

3840

ctgcatgctg ggatgtctac cctgtttctg gtgtacagta ataagtgtca gacacccctg

3900

ggaatggcat ccgggcatat cagggatttc cagattaccg catctggaca gtacggacag

3960

tgggcaccta agctggctag actgcactat tccggatcta tcaacgcttg gtccacaaaa

4020

gagcctttct cttggattaa ggtggacctg ctggccccaa tgatcattca tggcatcaaa

4080

actcagggag ctcggcagaa gttctcctct ctgtacatct cacagtttat catcatgtac

4140

agcctggatg ggaagaaatg gcagacatac cgcggcaata gcacaggaac tctgatggtg

4200

ttctttggca acgtggacag cagcggaatc aagcacaaca ttttcaatcc ccctatcatt

4260

gctagataca tccggctgca cccaacccat tattctattc gaagtacact gaggatggaa

4320

ctgatgggat gcgatctgaa cagttgttca atgcccctgg ggatggagtc caaggcaatc

4380

tctgacgccc agattaccgc cagctcctac ttcactaata tgtttgctac ctggagccct

4440

tccaaagcaa gactgcacct gcaaggccgc agcaacgcat ggcgaccaca ggtgaacaat

4500

cccaaggagt ggttgcaggt cgattttcag aaaactatga aggtgaccgg ggtcacaact

4560

cagggcgtga aaagtctgct gacctcaatg tacgtcaagg agttcctgat ctctagttca

4620

caggacggac atcagtggac actgttcttt cagaacggga aggtgaaagt cttccagggc

4680

aatcaggatt cctttacacc tgtggtcaac agtctagacc ctccactgct gaccagatac

4740

ctgagaatcc accctcagtc ctgggtgcac cagattgccc tgagaatgga agtgctggga

4800

tgcgaggccc aggatctgta ctga

4824

<210> 21

<211> 6

<212> ДНК

<213> Искусственная последовательность

<220>

<223> MAR/ARS

<400> 21

atattt

6

<210> 22

<211> 6

<212> ДНК

<213> Искусственная последовательность

<220>

<223> MAR/ARS

<400> 22

aaatat

6

<210> 23

<211> 5

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Дестабилизирующий элемент

<400> 23

attta

5

<210> 24

<211> 5

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Дестабилизирующий элемент

<400> 24

taaat

5

<210> 25

<211> 6

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Сайт poly-T

<400> 25

tttttt

6

<210> 26

<211> 7

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Сайт poly-A

<400> 26

aaaaaaa

7

<210> 27

<211> 6

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Сайт сплайсинга

<400> 27

ggtgat

6

<210> 28

<211> 5

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TATA-бокс

<400> 28

tataa

5

<210> 29

<211> 5

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TATA-бокс

<400> 29

ttata

5

<210> 30

<211> 8

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Последовательность богатых AU элементов

<400> 30

attttatt

8

<210> 31

<211> 8

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Последовательность богатых AU элементов

<400> 31

atttttaa

8

<210> 32

<211> 13

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Консенсусная последовательность Козак

<400> 32

gccgccacca tgc

13

<210> 33

<211> 32

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Пептид CTP

<400> 33

Asp Pro Arg Phe Gln Asp Ser Ser Ser Ser Lys Ala Pro Pro Pro Ser

1. 5 10 15

Leu Pro Ser Pro Ser Arg Leu Pro Gly Pro Ser Asp Thr Pro Ile Leu

20 25 30

<210> 34

<211> 28

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Пептид CTP

<400> 34

Ser Ser Ser Ser Lys Ala Pro Pro Pro Ser Leu Pro Ser Pro Ser Arg

1. 5 10 15

Leu Pro Gly Pro Ser Asp Thr Pro Ile Leu Pro Gln

20 25

<210> 35

<211> 11

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Коровая последовательность альбумин-связывающего пептида

<400> 35

Asp Ile Cys Leu Pro Arg Trp Gly Cys Leu Trp

1. 5 10

<210> 36

<211> 20

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Последовательность PAS

<400> 36

Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro

1. 5 10 15

Ser Ala Pro Ala

20

<210> 37

<211> 20

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Последовательность PAS

<400> 37

Ala Ala Pro Ala Ser Pro Ala Pro Ala Ala Pro Ser Ala Pro Ala Pro

1. 5 10 15

Ala Ala Pro Ser

20

<210> 38

<211> 20

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Последовательность PAS

<400> 38

Ala Pro Ser Ser Pro Ser Pro Ser Ala Pro Ser Ser Pro Ser Pro Ala

1. 5 10 15

Ser Pro Ser Ser

20

<210> 39

<211> 19

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Последовательность PAS

<400> 39

Ala Pro Ser Ser Pro Ser Pro Ser Ala Pro Ser Ser Pro Ser Pro Ala

1. 5 10 15

Ser Pro Ser

<210> 40

<211> 20

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Последовательность PAS

<400> 40

Ser Ser Pro Ser Ala Pro Ser Pro Ser Ser Pro Ala Ser Pro Ser Pro

1. 5 10 15

Ser Ser Pro Ala

20

<210> 41

<211> 24

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Последовательность PAS

<400> 41

Ala Ala Ser Pro Ala Ala Pro Ser Ala Pro Pro Ala Ala Ala Ser Pro

1. 5 10 15

Ala Ala Pro Ser Ala Pro Pro Ala

20

<210> 42

<211> 20

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Последовательность PAS

<400> 42

Ala Ser Ala Ala Ala Pro Ala Ala Ala Ser Ala Ala Ala Ser Ala Pro

1. 5 10 15

Ser Ala Ala Ala

20

<210> 43

<211> 23

<212> ДНК

<213> Искусственная последовательность

<220>

<223> мишень miR142

<400> 43

tccataaagt aggaaacact aca

23

<210> 44

<211> 2332

<212> БЕЛОК

<213> Homo sapiens

<400> 44

Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr

1. 5 10 15

Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro

20 25 30

Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys

35 40 45

Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro

50 55 60

Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val

65 70 75 80

Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val

85 90 95

Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala

100 105 110

Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val

115 120 125

Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn

130 135 140

Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser

145 150 155 160

His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu

165 170 175

Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu

180 185 190

His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp

195 200 205

His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser

210 215 220

Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg

225 230 235 240

Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His

245 250 255

Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu

260 265 270

Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile

275 280 285

Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly

290 295 300

Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met

305 310 315 320

Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg

325 330 335

Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp

340 345 350

Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe

355 360 365

Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His

370 375 380

Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu

385 390 395 400

Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro

405 410 415

Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr

420 425 430

Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile

435 440 445

Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile

450 455 460

Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile

465 470 475 480

Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys

485 490 495

His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys

500 505 510

Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys

515 520 525

Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala

530 535 540

Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp

545 550 555 560

Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe

565 570 575

Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln

580 585 590

Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe

595 600 605

Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser

610 615 620

Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu

625 630 635 640

Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr

645 650 655

Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro

660 665 670

Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp

675 680 685

Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala

690 695 700

Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu

705 710 715 720

Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala

725 730 735

Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Pro Ser Thr Arg

740 745 750

Gln Lys Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn Asp Ile Glu Lys

755 760 765

Thr Asp Pro Trp Phe Ala His Arg Thr Pro Met Pro Lys Ile Gln Asn

770 775 780

Val Ser Ser Ser Asp Leu Leu Met Leu Leu Arg Gln Ser Pro Thr Pro

785 790 795 800

His Gly Leu Ser Leu Ser Asp Leu Gln Glu Ala Lys Tyr Glu Thr Phe

805 810 815

Ser Asp Asp Pro Ser Pro Gly Ala Ile Asp Ser Asn Asn Ser Leu Ser

820 825 830

Glu Met Thr His Phe Arg Pro Gln Leu His His Ser Gly Asp Met Val

835 840 845

Phe Thr Pro Glu Ser Gly Leu Gln Leu Arg Leu Asn Glu Lys Leu Gly

850 855 860

Thr Thr Ala Ala Thr Glu Leu Lys Lys Leu Asp Phe Lys Val Ser Ser

865 870 875 880

Thr Ser Asn Asn Leu Ile Ser Thr Ile Pro Ser Asp Asn Leu Ala Ala

885 890 895

Gly Thr Asp Asn Thr Ser Ser Leu Gly Pro Pro Ser Met Pro Val His

900 905 910

Tyr Asp Ser Gln Leu Asp Thr Thr Leu Phe Gly Lys Lys Ser Ser Pro

915 920 925

Leu Thr Glu Ser Gly Gly Pro Leu Ser Leu Ser Glu Glu Asn Asn Asp

930 935 940

Ser Lys Leu Leu Glu Ser Gly Leu Met Asn Ser Gln Glu Ser Ser Trp

945 950 955 960

Gly Lys Asn Val Ser Ser Thr Glu Ser Gly Arg Leu Phe Lys Gly Lys

965 970 975

Arg Ala His Gly Pro Ala Leu Leu Thr Lys Asp Asn Ala Leu Phe Lys

980 985 990

Val Ser Ile Ser Leu Leu Lys Thr Asn Lys Thr Ser Asn Asn Ser Ala

995 1000 1005

Thr Asn Arg Lys Thr His Ile Asp Gly Pro Ser Leu Leu Ile Glu

1010 1015 1020

Asn Ser Pro Ser Val Trp Gln Asn Ile Leu Glu Ser Asp Thr Glu

1025 1030 1035

Phe Lys Lys Val Thr Pro Leu Ile His Asp Arg Met Leu Met Asp

1040 1045 1050

Lys Asn Ala Thr Ala Leu Arg Leu Asn His Met Ser Asn Lys Thr

1055 1060 1065

Thr Ser Ser Lys Asn Met Glu Met Val Gln Gln Lys Lys Glu Gly

1070 1075 1080

Pro Ile Pro Pro Asp Ala Gln Asn Pro Asp Met Ser Phe Phe Lys

1085 1090 1095

Met Leu Phe Leu Pro Glu Ser Ala Arg Trp Ile Gln Arg Thr His

1100 1105 1110

Gly Lys Asn Ser Leu Asn Ser Gly Gln Gly Pro Ser Pro Lys Gln

1115 1120 1125

Leu Val Ser Leu Gly Pro Glu Lys Ser Val Glu Gly Gln Asn Phe

1130 1135 1140

Leu Ser Glu Lys Asn Lys Val Val Val Gly Lys Gly Glu Phe Thr

1145 1150 1155

Lys Asp Val Gly Leu Lys Glu Met Val Phe Pro Ser Ser Arg Asn

1160 1165 1170

Leu Phe Leu Thr Asn Leu Asp Asn Leu His Glu Asn Asn Thr His

1175 1180 1185

Asn Gln Glu Lys Lys Ile Gln Glu Glu Ile Glu Lys Lys Glu Thr

1190 1195 1200

Leu Ile Gln Glu Asn Val Val Leu Pro Gln Ile His Thr Val Thr

1205 1210 1215

Gly Thr Lys Asn Phe Met Lys Asn Leu Phe Leu Leu Ser Thr Arg

1220 1225 1230

Gln Asn Val Glu Gly Ser Tyr Asp Gly Ala Tyr Ala Pro Val Leu

1235 1240 1245

Gln Asp Phe Arg Ser Leu Asn Asp Ser Thr Asn Arg Thr Lys Lys

1250 1255 1260

His Thr Ala His Phe Ser Lys Lys Gly Glu Glu Glu Asn Leu Glu

1265 1270 1275

Gly Leu Gly Asn Gln Thr Lys Gln Ile Val Glu Lys Tyr Ala Cys

1280 1285 1290

Thr Thr Arg Ile Ser Pro Asn Thr Ser Gln Gln Asn Phe Val Thr

1295 1300 1305

Gln Arg Ser Lys Arg Ala Leu Lys Gln Phe Arg Leu Pro Leu Glu

1310 1315 1320

Glu Thr Glu Leu Glu Lys Arg Ile Ile Val Asp Asp Thr Ser Thr

1325 1330 1335

Gln Trp Ser Lys Asn Met Lys His Leu Thr Pro Ser Thr Leu Thr

1340 1345 1350

Gln Ile Asp Tyr Asn Glu Lys Glu Lys Gly Ala Ile Thr Gln Ser

1355 1360 1365

Pro Leu Ser Asp Cys Leu Thr Arg Ser His Ser Ile Pro Gln Ala

1370 1375 1380

Asn Arg Ser Pro Leu Pro Ile Ala Lys Val Ser Ser Phe Pro Ser

1385 1390 1395

Ile Arg Pro Ile Tyr Leu Thr Arg Val Leu Phe Gln Asp Asn Ser

1400 1405 1410

Ser His Leu Pro Ala Ala Ser Tyr Arg Lys Lys Asp Ser Gly Val

1415 1420 1425

Gln Glu Ser Ser His Phe Leu Gln Gly Ala Lys Lys Asn Asn Leu

1430 1435 1440

Ser Leu Ala Ile Leu Thr Leu Glu Met Thr Gly Asp Gln Arg Glu

1445 1450 1455

Val Gly Ser Leu Gly Thr Ser Ala Thr Asn Ser Val Thr Tyr Lys

1460 1465 1470

Lys Val Glu Asn Thr Val Leu Pro Lys Pro Asp Leu Pro Lys Thr

1475 1480 1485

Ser Gly Lys Val Glu Leu Leu Pro Lys Val His Ile Tyr Gln Lys

1490 1495 1500

Asp Leu Phe Pro Thr Glu Thr Ser Asn Gly Ser Pro Gly His Leu

1505 1510 1515

Asp Leu Val Glu Gly Ser Leu Leu Gln Gly Thr Glu Gly Ala Ile

1520 1525 1530

Lys Trp Asn Glu Ala Asn Arg Pro Gly Lys Val Pro Phe Leu Arg

1535 1540 1545

Val Ala Thr Glu Ser Ser Ala Lys Thr Pro Ser Lys Leu Leu Asp

1550 1555 1560

Pro Leu Ala Trp Asp Asn His Tyr Gly Thr Gln Ile Pro Lys Glu

1565 1570 1575

Glu Trp Lys Ser Gln Glu Lys Ser Pro Glu Lys Thr Ala Phe Lys

1580 1585 1590

Lys Lys Asp Thr Ile Leu Ser Leu Asn Ala Cys Glu Ser Asn His

1595 1600 1605

Ala Ile Ala Ala Ile Asn Glu Gly Gln Asn Lys Pro Glu Ile Glu

1610 1615 1620

Val Thr Trp Ala Lys Gln Gly Arg Thr Glu Arg Leu Cys Ser Gln

1625 1630 1635

Asn Pro Pro Val Leu Lys Arg His Gln Arg Glu Ile Thr Arg Thr

1640 1645 1650

Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr Asp Asp Thr Ile

1655 1660 1665

Ser Val Glu Met Lys Lys Glu Asp Phe Asp Ile Tyr Asp Glu Asp

1670 1675 1680

Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys Thr Arg His Tyr

1685 1690 1695

Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly Met Ser Ser

1700 1705 1710

Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser Val Pro

1715 1720 1725

Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser Phe

1730 1735 1740

Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu

1745 1750 1755

Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val

1760 1765 1770

Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser

1775 1780 1785

Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg

1790 1795 1800

Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys

1805 1810 1815

Val Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys

1820 1825 1830

Ala Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His

1835 1840 1845

Ser Gly Leu Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu

1850 1855 1860

Asn Pro Ala His Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu

1865 1870 1875

Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu

1880 1885 1890

Asn Met Glu Arg Asn Cys Arg Ala Pro Cys Asn Ile Gln Met Glu

1895 1900 1905

Asp Pro Thr Phe Lys Glu Asn Tyr Arg Phe His Ala Ile Asn Gly

1910 1915 1920

Tyr Ile Met Asp Thr Leu Pro Gly Leu Val Met Ala Gln Asp Gln

1925 1930 1935

Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn Ile

1940 1945 1950

His Ser Ile His Phe Ser Gly His Val Phe Thr Val Arg Lys Lys

1955 1960 1965

Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe

1970 1975 1980

Glu Thr Val Glu Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val

1985 1990 1995

Glu Cys Leu Ile Gly Glu His Leu His Ala Gly Met Ser Thr Leu

2000 2005 2010

Phe Leu Val Tyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala

2015 2020 2025

Ser Gly His Ile Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr

2030 2035 2040

Gly Gln Trp Ala Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser

2045 2050 2055

Ile Asn Ala Trp Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys Val

2060 2065 2070

Asp Leu Leu Ala Pro Met Ile Ile His Gly Ile Lys Thr Gln Gly

2075 2080 2085

Ala Arg Gln Lys Phe Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile

2090 2095 2100

Met Tyr Ser Leu Asp Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn

2105 2110 2115

Ser Thr Gly Thr Leu Met Val Phe Phe Gly Asn Val Asp Ser Ser

2120 2125 2130

Gly Ile Lys His Asn Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr

2135 2140 2145

Ile Arg Leu His Pro Thr His Tyr Ser Ile Arg Ser Thr Leu Arg

2150 2155 2160

Met Glu Leu Met Gly Cys Asp Leu Asn Ser Cys Ser Met Pro Leu

2165 2170 2175

Gly Met Glu Ser Lys Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser

2180 2185 2190

Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp Ser Pro Ser Lys Ala

2195 2200 2205

Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln Val

2210 2215 2220

Asn Asn Pro Lys Glu Trp Leu Gln Val Asp Phe Gln Lys Thr Met

2225 2230 2235

Lys Val Thr Gly Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr

2240 2245 2250

Ser Met Tyr Val Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly

2255 2260 2265

His Gln Trp Thr Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe

2270 2275 2280

Gln Gly Asn Gln Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp

2285 2290 2295

Pro Pro Leu Leu Thr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp

2300 2305 2310

Val His Gln Ile Ala Leu Arg Met Glu Val Leu Gly Cys Glu Ala

2315 2320 2325

Gln Asp Leu Tyr

2330

<210> 45

<211> 4

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Аминокислоты 233-236 из человеческого IgG1

<400> 45

Glu Leu Leu Gly

1

<210> 46

<211> 42

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> XTEN AE42-4, последовательность белка

<400> 46

Gly Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly

1. 5 10 15

Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala

20 25 30

Thr Ser Gly Ser Glu Thr Pro Ala Ser Ser

35 40

<210> 47

<211> 126

<212> ДНК

<213> Искусственная последовательность

<220>

<223> XTEN AE42-4, последовательность ДНК

<400> 47

ggcgcgccag gttctcctgc tggctccccc acctcaacag aagaggggac aagcgaaagc

60

gctacgcctg agagtggccc tggctctgag ccagccacct ccggctctga aacccctgcc

120

tcgagc

126

<210> 48

<211> 144

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> XTEN AE144-2A, последовательность белка

<400> 48

Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly

1. 5 10 15

Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly

20 25 30

Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly

35 40 45

Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu

50 55 60

Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu

65 70 75 80

Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly

85 90 95

Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu

100 105 110

Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu

115 120 125

Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly

130 135 140

<210> 49

<211> 450

<212> ДНК

<213> Искусственная последовательность

<220>

<223> XTEN AE144-2A, последовательность ДНК

<400> 49

ggcgcgccaa ccagtacgga gccgtccgag gggagcgcac caggaagccc ggctgggagc

60

ccgacttcta ccgaagaggg tacatctacc gaaccaagtg aaggttcagc accaggcacc

120

tcaacagaac cctctgaggg ctcggcgcct ggtacaagtg agtccgccac cccagaatcc

180

gggcctggga caagcacaga accttcggaa gggagtgccc ctggaacatc cgaatcggca

240

accccagaat cagggccagg atctgagccc gcgacttcgg gctccgagac gcctgggaca

300

tccaccgagc cctccgaagg atcagcccca ggcaccagca cggagccctc tgagggaagc

360

gcacctggta ccagcgaaag cgcaactccc gaatcaggtc ccggtacgag cgagtcggcg

420

accccggaga gcgggccagg tgcctcgagc

450

<210> 50

<211> 144

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> XTEN AE144-3B, последовательность белка

<400> 50

Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser

1. 5 10 15

Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser

20 25 30

Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly

35 40 45

Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu

50 55 60

Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly

65 70 75 80

Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly

85 90 95

Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu

100 105 110

Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser

115 120 125

Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly

130 135 140

<210> 51

<211> 450

<212> ДНК

<213> Искусственная последовательность

<220>

<223> XTEN AE144-3B, последовательность ДНК

<400> 51

ggcgcgccaa gtcccgctgg aagcccaact agcaccgaag aggggacctc agagtccgcc

60

acccccgagt ccggccctgg ctctgagcct gccactagcg gctccgagac tcctggcaca

120

tccgaaagcg ctacacccga gagtggaccc ggcacctcta ccgagcccag tgagggctcc

180

gcccctggaa caagcaccga gcccagcgaa ggcagcgccc cagggacctc cacagagccc

240

agtgaaggca gtgctcctgg caccagcacc gaaccaagcg agggctctgc acccgggacc

300

tccaccgagc caagcgaagg ctctgcccct ggcacttcca ccgagcccag cgaaggcagc

360

gcccctggga gccccgctgg ctctcccacc agcactgagg agggcacatc taccgaacca

420

agtgaaggct ctgcaccagg tgcctcgagc

450

<210> 52

<211> 144

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> XTEN AE144-4A, последовательность белка

<400> 52

Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala

1. 5 10 15

Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu

20 25 30

Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly

35 40 45

Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu

50 55 60

Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu

65 70 75 80

Ser Gly Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly

85 90 95

Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Ser Pro Ala Gly

100 105 110

Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu

115 120 125

Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly

130 135 140

<210> 53

<211> 450

<212> ДНК

<213> Искусственная последовательность

<220>

<223> XTEN AE144-4A, последовательность ДНК

<400> 53

ggcgcgccaa cgtccgaaag tgctacccct gagtcaggcc ctggtagtga gcctgccaca

60

agcggaagcg aaactccggg gacctcagag tctgccactc ccgaatcggg gccaggctct

120

gaaccggcca cttcagggag cgaaacacca ggaacatcgg agagcgctac cccggagagc

180

gggccaggaa ctagtactga gcctagcgag ggaagtgcac ctggtacaag cgagtccgcc

240

acacccgagt ctggccctgg ctctccagcg ggctcaccca cgagcactga agagggctct

300

cccgctggca gcccaacgtc gacagaagaa ggatcaccag caggctcccc cacatcaaca

360

gaggagggta catcagaatc tgctactccc gagagtggac ccggtacctc cactgagccc

420

agcgagggga gtgcaccagg tgcctcgagc

450

<210> 54

<211> 144

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> XTEN AE144-5A, последовательность белка

<400> 54

Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala

1. 5 10 15

Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu

20 25 30

Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly

35 40 45

Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu

50 55 60

Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser

65 70 75 80

Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly

85 90 95

Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser

100 105 110

Ala Thr Pro Glu Ser Gly Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser

115 120 125

Thr Glu Glu Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly

130 135 140

<210> 55

<211> 450

<212> ДНК

<213> Искусственная последовательность

<220>

<223> XTEN AE144-5A, последовательность ДНК

<400> 55

ggcgcgccaa catcagagag cgccacccct gaaagtggtc ccgggagcga gccagccaca

60

tctgggtcgg aaacgccagg cacaagtgag tctgcaactc ccgagtccgg acctggctcc

120

gagcctgcca ctagcggctc cgagactccg ggaacttccg agagcgctac accagaaagc

180

ggacccggaa ccagtaccga acctagcgag ggctctgctc cgggcagccc agccggctct

240

cctacatcca cggaggaggg cacttccgaa tccgccaccc cggagtcagg gccaggatct

300

gaacccgcta cctcaggcag tgagacgcca ggaacgagcg agtccgctac accggagagt

360

gggccaggga gccctgctgg atctcctacg tccactgagg aagggtcacc agcgggctcg

420

cccaccagca ctgaagaagg tgcctcgagc

450

<210> 56

<211> 144

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> XTEN AE144-6B, последовательность белка

<400> 56

Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser

1. 5 10 15

Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu

20 25 30

Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly

35 40 45

Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Glu Pro Ala

50 55 60

Thr Ser Gly Ser Glu Thr Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser

65 70 75 80

Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly

85 90 95

Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Glu Pro Ala

100 105 110

Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu

115 120 125

Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly

130 135 140

<210> 57

<211> 450

<212> ДНК

<213> Искусственная последовательность

<220>

<223> XTEN AE144-6B, последовательность ДНК

<400> 57

ggcgcgccaa catctaccga gccttccgaa ggctctgccc ctgggacctc agaatctgca

60

acccctgaaa gcggccctgg aacctccgaa agtgccactc ccgagagcgg cccagggaca

120

agcgagtcag caacccctga gtctggaccc ggcagcgagc ctgcaacctc tggctcagag

180

actcccggct cagaacccgc tacctcaggc tccgagacac ccggctctcc tgctgggagt

240

cccacttcca ccgaggaagg aacatccact gagcctagtg agggctctgc ccctggaacc

300

agcacagagc caagtgaggg cagtgcacca ggatccgagc cagcaaccag cgggtccgag

360

actcccggga cctctgagtc tgccacccca gagagcggac ccggcacttc aaccgagccc

420

tccgaaggat cagcaccagg tgcctcgagc

450

<210> 58

<211> 144

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> XTEN AG144-1, последовательность белка

<400> 58

Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser

1. 5 10 15

Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Thr Pro Gly Ser Gly Thr

20 25 30

Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser

35 40 45

Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser

50 55 60

Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr

65 70 75 80

Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser

85 90 95

Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser

100 105 110

Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser

115 120 125

Ser Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser

130 135 140

<210> 59

<211> 450

<212> ДНК

<213> Искусственная последовательность

<220>

<223> XTEN AG144-1, последовательность ДНК

<400> 59

ggcgcgccac ccgggtcgtc cccgtcggcg tccaccggaa cagggccagg gtcatccccg

60

tcagcgtcga ctgggacggg acccgggaca cccggttcgg ggactgcatc ctcctcgcct

120

ggttcgtcca ccccgtcagg agccacgggt tcgccgggaa gcagcccaag cgcatccact

180

ggtacagggc ctggggcttc accgggtact tcatccacgg ggtcaccggg aacgcccgga

240

tcggggacgg cttcctcatc accaggatcg tcaacaccct cgggcgcaac gggcagcccc

300

ggaacccctg gttcgggtac ggcgtcgtcg agccccggtg cgagcccggg aacaagctcg

360

acaggatcgc ctggggcgtc acccggcacg tcgagcacag gcagccccgg aacccctgga

420

tcgggaaccg cgtcgtcaag cgcctcgagc

450

<210> 60

<211> 144

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> XTEN AG144-A, последовательность белка

<400> 60

Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Pro

1. 5 10 15

Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser Thr

20 25 30

Gly Thr Gly Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro

35 40 45

Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro

50 55 60

Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser

65 70 75 80

Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro

85 90 95

Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Thr Pro Gly

100 105 110

Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser

115 120 125

Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro

130 135 140

<210> 61

<211> 450

<212> ДНК

<213> Искусственная последовательность

<220>

<223> XTEN AG144-A, последовательность ДНК

<400> 61

ggcgcgccag gtgcctcgcc gggaacatca tcaactggtt cacccgggtc atccccctcg

60

gcctcaaccg ggacgggtcc cggctcatcc cccagcgcca gcactggaac aggtcctggc

120

actcctggtt ccggtacggc atcgtcatcc ccgggaagct caacaccgtc cggagcgaca

180

ggatcacctg gctcgtcacc ttcggcgtca actggaacgg ggccaggggc ctcacccgga

240

acgtcctcga ctgggtcgcc tggtacgccg ggatcaggaa cggcctcatc ctcgcctggg

300

tcctcaacgc cctcgggtgc gactggttcg ccgggaactc ctggctcggg gacggcctcg

360

tcgtcgcctg gggcatcacc ggggacgagc tccacggggt cccctggagc gtcaccgggg

420

acctcctcga caggtagccc ggcctcgagc

450

<210> 62

<211> 144

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> XTEN AG144-B, последовательность белка

<400> 62

Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr

1. 5 10 15

Pro Ser Gly Ala Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser

20 25 30

Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro

35 40 45

Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro

50 55 60

Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser Thr

65 70 75 80

Gly Thr Gly Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro

85 90 95

Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ala Ser Pro

100 105 110

Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser

115 120 125

Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro

130 135 140

<210> 63

<211> 450

<212> ДНК

<213> Искусственная последовательность

<220>

<223> XTEN AG144-B, последовательность ДНК

<400> 63

ggcgcgccag gtacaccggg cagcggcacg gcttcgtcgt cacccggctc gtccacaccg

60

tcgggagcta cgggaagccc aggagcgtca ccgggaacgt cgtcaacggg gtcaccgggt

120

acgccaggta gcggcacggc cagcagctcg ccaggttcat cgaccccgtc gggagcgact

180

gggtcgcccg gatcaagccc gtcagcttcc actggaacag gacccgggtc gtcgccgtca

240

gcctcaacgg ggacaggacc tggttcatcg acgccgtcag gggcgacagg ctcgcccgga

300

tcgtcaacac cctcgggggc aacggggagc cctggtgcgt cgcctggaac ctcatccacc

360

ggaagcccgg gggcctcgcc gggtacgagc tccacgggat cgcccggagc gtcccccgga

420

acttcaagca cagggagccc tgcctcgagc

450

<210> 64

<211> 144

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> XTEN AG144-C, последовательность белка

<400> 64

Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser Pro

1. 5 10 15

Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser

20 25 30

Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro

35 40 45

Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Thr Pro Gly

50 55 60

Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser

65 70 75 80

Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro

85 90 95

Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Thr

100 105 110

Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala

115 120 125

Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro

130 135 140

<210> 65

<211> 450

<212> ДНК

<213> Искусственная последовательность

<220>

<223> XTEN AG144-C, последовательность ДНК

<400> 65

ggcgcgccag gtacacccgg atcgggtaca gcgtcatcga gccccggtgc gtcacctggt

60

acgtcgagca cggggtcgcc aggggcgtcc cctgggacgt cctcaacagg ctcgcccggt

120

gcgtcacccg gcacgtcgtc cacgggttca cctggtagct ccccttccgc gtccactggc

180

accgggcctg gaactccggg gagcggcaca gcgagctcgt cgccgggagc atcgcctggg

240

acatcgagca ccgggtcgcc aggagcatcg cccggaacat ccagcacagg aagccccggc

300

gcgtcgcccg ggacatcaag cacaggttcc ccgggatcga gcacgccgtc cggagccact

360

ggatcaccag ggagctcgac accttccggc gcaacgggat cgcccggagc cagcccgggt

420

acgtcaagca ctggctcccc tgcctcgagc

450

<210> 66

<211> 144

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> XTEN AG144-F, последовательность белка

<400> 66

Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro

1. 5 10 15

Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser

20 25 30

Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro

35 40 45

Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro

50 55 60

Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser

65 70 75 80

Thr Gly Ser Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro

85 90 95

Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr

100 105 110

Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala

115 120 125

Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro

130 135 140

<210> 67

<211> 450

<212> ДНК

<213> Искусственная последовательность

<220>

<223> XTEN AG144-F, последовательность ДНК

<400> 67

ggcgcgccag gctccagccc ctccgcgagc acgggaaccg gaccaggttc gtcaccctca

60

gcatcaacgg ggacgggacc gggggcgtca ccaggaacgt cctccaccgg ctcgccgggt

120

gcatcacccg gaacgtcatc gaccggatcg ccagggagct cgacgccatc aggcgcaaca

180

ggatcacctg gctcaagccc tagcgcgtca accggcacgg gtccgggtgc ctcccctggc

240

acgtccagca ccggatcacc cggatcgagc ccatccgcct caaccggaac cggacccggt

300

acaccagggt cgggaacagc ctcctcgtca ccaggctcct caaccccctc gggagccacg

360

ggttcgcccg gttcgtcaac gccttccgga gcaactggta gccccggagc atcgccagga

420

acttcgagca cggggtcgcc cgcctcgagc

450

<210> 68

<211> 4374

<212> ДНК

<213> Искусственная последовательность

<220>

<223> coFVIII-1 последовательность ДНК

<400> 68

atgcagattg agctgtctac ttgctttttc ctgtgcctgc tgaggttttg cttttccgct

60

acacgaaggt attatctggg ggctgtggaa ctgtcttggg attacatgca gagtgacctg

120

ggagagctgc cagtggacgc aaggtttccc cctagagtcc ctaagtcatt ccccttcaac

180

actagcgtgg tctacaagaa aacactgttc gtggagttta ctgatcacct gttcaacatc

240

gcaaagccta ggccaccctg gatgggactg ctggggccaa caatccaggc cgaggtgtac

300

gacaccgtgg tcattacact taagaacatg gcctcacacc ccgtgagcct gcatgctgtg

360

ggcgtcagct actggaaggc ttccgaagga gcagagtatg acgatcagac ttcccagaga

420

gaaaaagagg acgataaggt gtttcctggc ggatctcata cctacgtgtg gcaggtcctg

480

aaagagaatg gccctatggc ctccgaccct ctgtgcctga cctactctta tctgagtcac

540

gtggacctgg tcaaggatct gaacagcggc ctgatcggag ccctgctggt gtgcagggaa

600

ggaagcctgg ctaaggagaa aacccagaca ctgcataagt tcattctgct gttcgccgtg

660

tttgacgaag ggaaatcatg gcacagcgag acaaagaata gtctgatgca ggacagggat

720

gccgcttcag ccagagcttg gcccaaaatg cacactgtga acggctacgt caatcgctca

780

ctgcctgggc tgatcggctg ccaccgaaag agcgtgtatt ggcatgtcat cgggatgggc

840

accacacctg aagtgcactc cattttcctg gagggacata cctttctggt ccgcaaccac

900

cgacaggctt ccctggagat ctctccaatt accttcctga cagcacagac tctgctgatg

960

gacctggggc agttcctgct gttttgccac atcagctccc accagcatga tggcatggag

1020

gcttacgtga aagtggactc ttgtcccgag gaacctcagc tgcggatgaa gaacaatgag

1080

gaagcagaag actatgacga tgacctgacc gactccgaga tggatgtggt ccgattcgat

1140

gacgataaca gcccctcctt tatccagatt agatctgtgg ccaagaaaca ccctaagaca

1200

tgggtccatt acatcgcagc cgaggaagag gactgggatt atgcaccact ggtgctggca

1260

ccagacgatc gctcctacaa atctcagtat ctgaacaatg ggccacagag gattggcaga

1320

aagtacaaga aagtgcggtt catggcatat accgatgaga ccttcaagac tcgcgaagcc

1380

atccagcacg agagcggcat cctgggacca ctgctgtacg gagaagtggg agacaccctg

1440

ctgatcattt tcaagaacca ggccagccgg ccttacaata tctatccaca tgggattaca

1500

gatgtgcgcc ctctgtacag caggagactg ccaaagggcg tcaaacacct gaaggacttc

1560

ccaatcctgc ccggagaaat cttcaagtac aagtggactg tcaccgtcga ggatggcccc

1620

actaagagcg accctcggtg cctgacccgc tactattcta gtttcgtgaa tatggaaaga

1680

gatctggcaa gcggactgat cggaccactg ctgatttgtt acaaagagag cgtggatcag

1740

agaggcaacc agatcatgtc cgacaagcgg aatgtgattc tgttcagtgt ctttgacgaa

1800

aacaggtcat ggtacctgac cgagaacatc cagagattcc tgcctaatcc agctggggtg

1860

cagctggaag atcctgagtt tcaggcatct aacatcatgc atagtattaa tggctacgtg

1920

ttcgacagtt tgcagctgag cgtgtgcctg cacgaggtcg cttactggta tatcctgagc

1980

attggggcac agacagattt cctgagcgtg ttcttttccg gctacacttt taagcataaa

2040

atggtctatg aggacacact gactctgttc cccttcagcg gcgaaaccgt gtttatgagc

2100

atggagaatc ccggactgtg gattctgggg tgccacaaca gcgatttcag aaatcgcgga

2160

atgactgccc tgctgaaagt gtcaagctgt gacaagaaca ccggggacta ctatgaagat

2220

tcatacgagg acatcagcgc atatctgctg tccaaaaaca atgccattga accccggtct

2280

tttagtcaga atcctccagt gctgaagagg caccagaggg agatcacccg cactaccctg

2340

cagagtgatc aggaagagat cgactacgac gatacaattt ctgtggaaat gaagaaagag

2400

gacttcgata tctatgacga agatgagaac cagagtcctc gatcattcca gaagaaaacc

2460

aggcattact ttattgccgc agtggagcgg ctgtgggatt atggcatgtc ctctagtcct

2520

cacgtgctgc gaaatagggc ccagtcagga agcgtcccac agttcaagaa agtggtcttc

2580

caggagttta cagacgggtc ctttactcag ccactgtaca ggggcgaact gaacgagcac

2640

ctgggactgc tggggcccta tatcagagca gaagtggagg ataacattat ggtcaccttc

2700

agaaatcagg cctctcggcc ttacagtttt tattcaagcc tgatctctta cgaagaggac

2760

cagcgacagg gagctgaacc acgaaaaaac ttcgtgaagc ctaatgagac caaaacatac

2820

ttttggaagg tgcagcacca tatggcccca acaaaagacg agttcgattg caaggcatgg

2880

gcctattttt ctgacgtgga tctggagaag gacgtgcaca gtggcctgat tggcccactg

2940

ctggtgtgcc atactaacac cctgaatcca gcccacggcc ggcaggtcac tgtccaggag

3000

ttcgctctgt tctttaccat ctttgatgag acaaagagct ggtacttcac cgaaaacatg

3060

gagcgaaatt gcagggctcc atgtaacatt cagatggaag accccacatt caaggagaac

3120

taccgctttc atgctatcaa tggatacatc atggatactc tgcccgggct ggtcatggca

3180

caggaccaga gaatccggtg gtatctgctg agcatgggca gcaacgagaa tatccactca

3240

attcatttca gcgggcacgt gtttactgtc aggaagaaag aagagtacaa gatggccctg

3300

tacaacctgt atcccggcgt gttcgaaacc gtcgagatgc tgcctagcaa ggccggaatc

3360

tggagagtgg aatgcctgat tggagagcac ctgcatgctg ggatgtctac cctgtttctg

3420

gtgtacagta ataagtgtca gacacccctg ggaatggcat ccgggcatat cagggatttc

3480

cagattaccg catctggaca gtacggacag tgggcaccta agctggctag actgcactat

3540

tccggatcta tcaacgcttg gtccacaaaa gagcctttct cttggattaa ggtggacctg

3600

ctggccccaa tgatcattca tggcatcaaa actcagggag ctcggcagaa gttctcctct

3660

ctgtacatct cacagtttat catcatgtac agcctggatg ggaagaaatg gcagacatac

3720

cgcggcaata gcacaggaac tctgatggtg ttctttggca acgtggacag cagcggaatc

3780

aagcacaaca ttttcaatcc ccctatcatt gctagataca tccggctgca cccaacccat

3840

tattctattc gaagtacact gaggatggaa ctgatgggat gcgatctgaa cagttgttca

3900

atgcccctgg ggatggagtc caaggcaatc tctgacgccc agattaccgc cagctcctac

3960

ttcactaata tgtttgctac ctggagccct tccaaagcaa gactgcacct gcaaggccgc

4020

agcaacgcat ggcgaccaca ggtgaacaat cccaaggagt ggttgcaggt cgattttcag

4080

aaaactatga aggtgaccgg ggtcacaact cagggcgtga aaagtctgct gacctcaatg

4140

tacgtcaagg agttcctgat ctctagttca caggacggac atcagtggac actgttcttt

4200

cagaacggga aggtgaaagt cttccagggc aatcaggatt cctttacacc tgtggtcaac

4260

agtctagacc ctccactgct gaccagatac ctgagaatcc accctcagtc ctgggtgcac

4320

cagattgccc tgagaatgga agtgctggga tgcgaggccc aggatctgta ctga

4374

<210> 69

<211> 577

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Промотор ET, последовательность ДНК

<400> 69

ctcgaggtca attcacgcga gttaataatt accagcgcgg gccaaataaa taatccgcga

60

ggggcaggtg acgtttgccc agcgcgcgct ggtaattatt aacctcgcga atattgattc

120

gaggccgcga ttgccgcaat cgcgaggggc aggtgacctt tgcccagcgc gcgttcgccc

180

cgccccggac ggtatcgata agcttaggag cttgggctgc aggtcgaggg cactgggagg

240

atgttgagta agatggaaaa ctactgatga cccttgcaga gacagagtat taggacatgt

300

ttgaacaggg gccgggcgat cagcaggtag ctctagagga tccccgtctg tctgcacatt

360

tcgtagagcg agtgttccga tactctaatc tccctaggca aggttcatat ttgtgtaggt

420

tacttattct ccttttgttg actaagtcaa taatcagaat cagcaggttt ggagtcagct

480

tggcagggat cagcagcctg ggttggaagg agggggtata aaagcccctt caccaggaga

540

agccgtcaca cagatccaca agctcctgcc accatgg

577

<210> 70

<211> 4374

<212> ДНК

<213> Искусственная последовательность

<220>

<223> coFVIII-5

<400> 70

atgcaaatcg aactgagcac ctgtttcttc ctctgcctgc tgagattctg tttctccgcg

60

acccgccgat actacctggg agcagtggag ctctcctggg attacatgca gagcgacctt

120

ggggagctgc ccgtggatgc caggttccct ccccgggtgc caaagtcgtt tccgttcaac

180

acctccgtgg tgtacaagaa aactctgttc gtggagttca ccgaccacct gttcaatatc

240

gccaagccca gacctccctg gatggggctg ttgggaccta ccatccaagc ggaggtgtac

300

gacactgtgg tcatcactct gaagaacatg gcctcgcatc ccgtgtccct gcacgccgtg

360

ggagtgtctt actggaaagc gtccgagggg gccgaatacg acgaccagac ctcgcagaga

420

gaaaaggaag atgacaaggt gttcccagga ggatcgcaca cctacgtgtg gcaagtgttg

480

aaggagaacg gcccaatggc ctccgacccg ctgtgcctga cctactcgta cctgtcccac

540

gtggacctcg tgaaggacct caactcggga ctgattggag ccctgctggt ctgcagggaa

600

ggctcactgg cgaaagaaaa gactcagacc ttgcacaagt tcattctgct gttcgctgtg

660

ttcgacgagg ggaagtcgtg gcacagcgag actaagaact ccctgatgca agatagagat

720

gccgcctccg cccgggcctg gcctaagatg cacaccgtga acggttacgt gaaccgctcc

780

ctccctggcc tgattggatg ccaccggaag tccgtgtact ggcacgtgat cgggatgggg

840

accacccccg aggtgcacag catcttcctg gaaggtcaca catttctcgt gcgcaaccac

900

cggcaggcct ccctggaaat cagccccatt accttcctca ctgcccagac tctgctgatg

960

gacctgggac agttcctgct gttctgccat atctcctccc accaacatga cggaatggag

1020

gcatacgtga aggtcgattc ctgccctgag gaaccccagc tccgcatgaa gaacaatgag

1080

gaagccgagg actacgacga cgacctgacg gatagcgaga tggatgtggt ccggttcgat

1140

gacgataaca gcccttcctt catccaaatt cgctcggtgg caaagaagca ccccaagacc

1200

tgggtgcatt acattgcggc ggaagaagag gactgggatt atgccccgct tgtcctcgct

1260

cctgacgacc ggagctacaa gagccagtac ctgaacaacg gtccacagag gatcggtaga

1320

aagtacaaga aggtccgctt catggcctat accgacgaaa ccttcaaaac tagagaggcc

1380

atccaacacg aatccggcat cctgggcccg ctcttgtacg gagaagtcgg cgacaccctt

1440

ctcattatct tcaagaacca ggcttcccgg ccgtacaaca tctatccgca tgggatcact

1500

gacgtgcgcc cactgtactc gcggcgcctg cccaagggtg tcaaacacct gaaggatttt

1560

ccgatccttc cgggagaaat cttcaagtac aagtggaccg tgaccgtgga agatggccca

1620

actaagtctg accctagatg cctcacccgc tactactcat ccttcgtcaa catggagcgc

1680

gacctggcca gcggactgat cggcccgctg ctgatttgct acaaggaatc agtggaccaa

1740

cggggaaacc agatcatgtc ggataagagg aacgtcatcc tcttctccgt gtttgacgaa

1800

aaccggtcgt ggtacctgac tgaaaacatc cagcggttcc tccccaaccc cgcgggcgtg

1860

cagctggaag atcctgagtt tcaggcatca aacatcatgc actccattaa cggctacgtg

1920

ttcgattcgc tgcagctgag cgtgtgtctg cacgaagtgg cctactggta catcctgtcc

1980

attggtgccc agactgactt cctgtccgtg tttttctccg gctacacgtt caagcacaag

2040

atggtgtacg aggacaccct gaccctcttc cctttttccg gcgaaactgt gtttatgagc

2100

atggagaatc ccggcctgtg gatcttgggc tgccacaaca gcgacttccg taacagagga

2160

atgactgcgc tgctcaaggt gtccagctgc gacaagaaca ccggagacta ttatgaggac

2220

tcatacgagg acatctccgc ctacctcctg tccaagaata acgccattga acctcggagc

2280

ttcagccaga acccacccgt gcttaagaga catcaacggg agatcactag gaccaccctg

2340

cagtcagacc aggaggaaat cgactacgat gacaccatct cggtcgagat gaagaaggag

2400

gactttgaca tctacgacga agatgaaaac cagagcccga ggtcgttcca aaagaaaacc

2460

cgccactact ttattgctgc tgtcgagcgg ctgtgggact acggaatgtc gtcctcgccg

2520

cacgtgctcc gcaaccgagc ccagagcggc tcggtgccgc aattcaagaa ggtcgtgttc

2580

caggagttca ctgacgggag cttcactcag cctttgtacc ggggagaact caatgaacat

2640

ctcggcctcc tcggacctta catcagagca gaagtggaag ataacatcat ggtcactttc

2700

cgtaaccaag ccagccgccc gtactcgttc tactcctccc tcatttctta cgaagaggac

2760

cagcggcagg gcgcagaacc gcgcaagaac ttcgtgaagc ccaacgaaac caagacctac

2820

ttctggaaag tgcagcatca tatggccccg actaaggacg agtttgactg caaagcctgg

2880

gcctacttct ccgatgtgga cttggagaag gacgtccact ccggcctcat cggtcccctg

2940

ctcgtgtgcc ataccaatac cctgaacccc gcacacggtc gccaggtcac cgtgcaggag

3000

ttcgctctgt tcttcactat cttcgacgaa actaagtcct ggtacttcac cgagaacatg

3060

gagaggaact gcagagcccc ctgtaacatc cagatggagg acccgacgtt caaggaaaac

3120

taccggttcc acgccattaa cggatacatc atggatacgc tgccgggtct tgtgatggcc

3180

caggatcaac ggatcagatg gtacttattg tcgatgggca gcaacgagaa catccactct

3240

attcacttct ccggtcatgt gttcactgtg cggaagaagg aagagtacaa gatggccctg

3300

tacaaccttt atcccggagt gttcgaaact gtggaaatgc tgccgtcgaa ggccggcatt

3360

tggcgcgtgg agtgtttgat tggagaacat ctccatgcgg ggatgtcaac cctgttcctg

3420

gtgtatagca acaagtgcca gactccgctt gggatggcgt caggacacat tagggatttc

3480

cagatcactg cgtccggcca gtacggccaa tgggccccta agctggcccg cctgcattac

3540

tccggatcca ttaacgcctg gtcaaccaag gagccattct cctggatcaa ggtggacctt

3600

ctggccccca tgattatcca cggaattaag acccaggggg cccggcagaa gttctcctca

3660

ctgtacatca gccagttcat aatcatgtac tccctggacg gaaagaagtg gcaaacctac

3720

agggggaaca gcaccggcac actgatggtc tttttcggaa atgtggactc ctccgggatt

3780

aagcataaca tcttcaaccc tccgattatc gctcggtaca ttagacttca ccctacccac

3840

tacagcattc gctccaccct gcggatggaa ctgatgggct gcgatctgaa ctcgtgcagc

3900

atgccgttgg gaatggagtc caaagcaatt tccgacgcgc agatcaccgc ctcgtcctac

3960

tttaccaaca tgttcgccac gtggtcaccg tccaaggccc ggctgcacct ccagggaaga

4020

tccaacgcat ggcggccaca ggtcaacaac cctaaggagt ggctccaggt ggacttccag

4080

aaaaccatga aggtcaccgg agtcacaacc cagggagtga agtcgctgct gacttctatg

4140

tacgtcaagg agttcctgat ctccagcagc caggacgggc accagtggac cctgttcttc

4200

caaaatggaa aggtcaaggt gtttcagggc aatcaggatt cattcacccc ggtggtgaac

4260

tcccttgatc cacccctcct gacccgctac cttcgcatcc acccacagtc ctgggtgcac

4320

cagatcgcgc tgaggatgga ggtcctggga tgcgaagccc aggacctgta ctga

4374

<210> 71

<211> 4374

<212> ДНК

<213> Искусственная последовательность

<220>

<223> coFVIII-6

<400> 71

atgcagattg agctgtccac ttgtttcttc ctgtgcctcc tgcgcttctg tttctccgcc

60

actcgccggt actaccttgg agccgtggag ctttcatggg actacatgca gagcgacctg

120

ggcgaactcc ccgtggatgc cagattcccc ccccgcgtgc caaagtcctt cccctttaac

180

acctccgtgg tgtacaagaa aaccctcttt gtcgagttca ctgaccacct gttcaacatc

240

gccaagccgc gcccaccttg gatgggcctc ctgggaccga ccattcaagc tgaagtgtac

300

gacaccgtgg tgatcaccct gaagaacatg gcgtcccacc ccgtgtccct gcatgcggtc

360

ggagtgtcct actggaaggc ctccgaagga gctgagtacg acgaccagac tagccagcgg

420

gaaaaggagg acgataaagt gttcccgggc ggctcgcata cttacgtgtg gcaagtcctg

480

aaggaaaacg gacctatggc atccgatcct ctgtgcctga cttactccta cctttcccat

540

gtggacctcg tgaaggacct gaacagcggg ctgattggtg cacttctcgt gtgccgcgaa

600

ggttcgctcg ctaaggaaaa gacccagacc ctccataagt tcatcctttt gttcgctgtg

660

ttcgatgaag gaaagtcatg gcattccgaa actaagaact cgctgatgca ggaccgggat

720

gccgcctcag cccgcgcctg gcctaaaatg catacagtca acggatacgt gaatcggtca

780

ctgcccgggc tcatcggttg tcacagaaag tccgtgtact ggcacgtcat cggcatgggc

840

actacgcctg aagtgcactc catcttcctg gaagggcaca ccttcctcgt gcgcaaccac

900

cgccaggcct ctctggaaat ctccccgatt acctttctga ccgcccagac tctgctcatg

960

gacctggggc agttccttct cttctgccac atctccagcc atcagcacga cggaatggag

1020

gcctacgtga aggtggactc atgcccggaa gaacctcagt tgcggatgaa gaacaacgag

1080

gaggccgagg actatgacga cgatttgact gactccgaga tggacgtcgt gcggttcgat

1140

gacgacaaca gccccagctt catccagatt cgcagcgtgg ccaagaagca ccccaaaacc

1200

tgggtgcact acatcgcggc cgaggaagaa gattgggact acgccccgtt ggtgctggca

1260

cccgatgacc ggtcgtacaa gtcccagtat ctgaacaatg gtccgcagcg gattggcaga

1320

aagtacaaga aagtgcggtt catggcgtac actgacgaaa cgtttaagac ccgggaggcc

1380

attcaacatg agagcggcat tctgggacca ctgctgtacg gagaggtcgg cgataccctg

1440

ctcatcatct tcaaaaacca ggcctcccgg ccttacaaca tctaccctca cggaatcacc

1500

gacgtgcggc cactctactc gcggcgcctg ccgaagggcg tcaagcacct gaaagacttc

1560

cctatcctgc cgggcgaaat cttcaagtat aagtggaccg tcaccgtgga ggacgggccc

1620

accaagagcg atcctaggtg tctgactcgg tactactcca gcttcgtgaa catggaacgg

1680

gacctggcat cgggactcat tggaccgctg ctgatctgct acaaagagtc ggtggatcaa

1740

cgcggcaacc agatcatgtc cgacaagcgc aacgtgatcc tgttctccgt gtttgatgaa

1800

aacagatcct ggtacctcac tgaaaacatc cagaggttcc tcccaaaccc cgcaggagtg

1860

caactggagg accctgagtt tcaggcctcg aatatcatgc actcgattaa cggttacgtg

1920

ttcgactcgc tgcagctgag cgtgtgcctc catgaagtcg cttactggta cattctgtcc

1980

atcggcgccc agactgactt cctgagcgtg ttcttttccg gttacacctt taagcacaag

2040

atggtgtacg aagataccct gaccctgttc cctttctccg gcgaaacggt gttcatgtcg

2100

atggagaacc cgggtctgtg gattctggga tgccacaaca gcgactttcg gaaccgcgga

2160

atgactgccc tgctgaaggt gtcctcatgc gacaagaaca ccggagacta ctacgaggac

2220

tcctacgagg atatctcagc ctacctcctg tccaagaaca acgcgatcga gccgcgcagc

2280

ttcagccaga acccgcctgt gctgaagagg caccagcgag aaattacccg gaccaccctc

2340

caatcggatc aggaggaaat cgactacgac gacaccatct cggtggaaat gaagaaggaa

2400

gatttcgata tctacgacga ggacgaaaat cagtcccctc gctcattcca aaagaaaact

2460

agacactact ttatcgccgc ggtggaaaga ctgtgggact atggaatgtc atccagccct

2520

cacgtccttc ggaaccgggc ccagagcgga tcggtgcctc agttcaagaa agtggtgttc

2580

caggagttca ccgacggcag cttcacccag ccgctgtacc ggggagaact gaacgaacac

2640

ctgggcctgc tcggtcccta catccgcgcg gaagtggagg ataacatcat ggtgaccttc

2700

cgtaaccaag catccagacc ttactccttc tattcctccc tgatctcata cgaggaggac

2760

cagcgccaag gcgccgagcc ccgcaagaac ttcgtcaagc ccaacgagac taagacctac

2820

ttctggaagg tccaacacca tatggccccg accaaggatg agtttgactg caaggcctgg

2880

gcctacttct ccgacgtgga ccttgagaag gatgtccatt ccggcctgat cgggccgctg

2940

ctcgtgtgtc acaccaacac cctgaaccca gcgcatggac gccaggtcac cgtccaggag

3000

tttgctctgt tcttcaccat ttttgacgaa actaagtcct ggtacttcac cgagaatatg

3060

gagcgaaact gtagagcgcc ctgcaatatc cagatggaag atccgacttt caaggagaac

3120

tatagattcc acgccatcaa cgggtacatc atggatactc tgccggggct ggtcatggcc

3180

caggatcaga ggattcggtg gtacttgctg tcaatgggat cgaacgaaaa cattcactcc

3240

attcacttct ccggtcacgt gttcactgtg cgcaagaagg aggagtacaa gatggcgctg

3300

tacaatctgt accccggggt gttcgaaact gtggagatgc tgccgtccaa ggccggcatc

3360

tggagagtgg agtgcctgat cggagagcac ctccacgcgg ggatgtccac cctcttcctg

3420

gtgtactcga ataagtgcca gaccccgctg ggcatggcct cgggccacat cagagacttc

3480

cagatcacag caagcggaca atacggccaa tgggcgccga agctggcccg cttgcactac

3540

tccggatcga tcaacgcatg gtccaccaag gaaccgttct cgtggattaa ggtggacctc

3600

ctggccccta tgattatcca cggaattaag acccagggcg ccaggcagaa gttctcctcc

3660

ctgtacatct cgcaattcat catcatgtac agcctggacg ggaagaagtg gcagacttac

3720

aggggaaact ccaccggcac cctgatggtc tttttcggca acgtggattc ctccggcatt

3780

aagcacaaca tcttcaaccc accgatcata gccagatata ttaggctcca ccccactcac

3840

tactcaatcc gctcaactct tcggatggaa ctcatggggt gcgacctgaa ctcctgctcc

3900

atgccgttgg ggatggaatc aaaggctatt agcgacgccc agatcaccgc gagctcctac

3960

ttcactaaca tgttcgccac ctggagcccc tccaaggcca ggctgcactt gcagggacgg

4020

tcaaatgcct ggcggccgca agtgaacaat ccgaaggaat ggcttcaagt ggatttccaa

4080

aagaccatga aagtgaccgg agtcaccacc cagggagtga agtcccttct gacctcgatg

4140

tatgtgaagg agttcctgat tagcagcagc caggacgggc accagtggac cctgttcttc

4200

caaaacggaa aggtcaaggt gttccagggg aaccaggact cgttcacacc cgtggtgaac

4260

tccctggacc ccccactgct gacgcggtac ttgaggattc atcctcagtc ctgggtccat

4320

cagattgcat tgcgaatgga agtcctgggc tgcgaggccc aggacctgta ctga

4374

<210> 72

<211> 4824

<212> ДНК

<213> Искусственная последовательность

<220>

<223> coFVIII-6-XTEN

<400> 72

atgcagattg agctgtccac ttgtttcttc ctgtgcctcc tgcgcttctg tttctccgcc

60

actcgccggt actaccttgg agccgtggag ctttcatggg actacatgca gagcgacctg

120

ggcgaactcc ccgtggatgc cagattcccc ccccgcgtgc caaagtcctt cccctttaac

180

acctccgtgg tgtacaagaa aaccctcttt gtcgagttca ctgaccacct gttcaacatc

240

gccaagccgc gcccaccttg gatgggcctc ctgggaccga ccattcaagc tgaagtgtac

300

gacaccgtgg tgatcaccct gaagaacatg gcgtcccacc ccgtgtccct gcatgcggtc

360

ggagtgtcct actggaaggc ctccgaagga gctgagtacg acgaccagac tagccagcgg

420

gaaaaggagg acgataaagt gttcccgggc ggctcgcata cttacgtgtg gcaagtcctg

480

aaggaaaacg gacctatggc atccgatcct ctgtgcctga cttactccta cctttcccat

540

gtggacctcg tgaaggacct gaacagcggg ctgattggtg cacttctcgt gtgccgcgaa

600

ggttcgctcg ctaaggaaaa gacccagacc ctccataagt tcatcctttt gttcgctgtg

660

ttcgatgaag gaaagtcatg gcattccgaa actaagaact cgctgatgca ggaccgggat

720

gccgcctcag cccgcgcctg gcctaaaatg catacagtca acggatacgt gaatcggtca

780

ctgcccgggc tcatcggttg tcacagaaag tccgtgtact ggcacgtcat cggcatgggc

840

actacgcctg aagtgcactc catcttcctg gaagggcaca ccttcctcgt gcgcaaccac

900

cgccaggcct ctctggaaat ctccccgatt acctttctga ccgcccagac tctgctcatg

960

gacctggggc agttccttct cttctgccac atctccagcc atcagcacga cggaatggag

1020

gcctacgtga aggtggactc atgcccggaa gaacctcagt tgcggatgaa gaacaacgag

1080

gaggccgagg actatgacga cgatttgact gactccgaga tggacgtcgt gcggttcgat

1140

gacgacaaca gccccagctt catccagatt cgcagcgtgg ccaagaagca ccccaaaacc

1200

tgggtgcact acatcgcggc cgaggaagaa gattgggact acgccccgtt ggtgctggca

1260

cccgatgacc ggtcgtacaa gtcccagtat ctgaacaatg gtccgcagcg gattggcaga

1320

aagtacaaga aagtgcggtt catggcgtac actgacgaaa cgtttaagac ccgggaggcc

1380

attcaacatg agagcggcat tctgggacca ctgctgtacg gagaggtcgg cgataccctg

1440

ctcatcatct tcaaaaacca ggcctcccgg ccttacaaca tctaccctca cggaatcacc

1500

gacgtgcggc cactctactc gcggcgcctg ccgaagggcg tcaagcacct gaaagacttc

1560

cctatcctgc cgggcgaaat cttcaagtat aagtggaccg tcaccgtgga ggacgggccc

1620

accaagagcg atcctaggtg tctgactcgg tactactcca gcttcgtgaa catggaacgg

1680

gacctggcat cgggactcat tggaccgctg ctgatctgct acaaagagtc ggtggatcaa

1740

cgcggcaacc agatcatgtc cgacaagcgc aacgtgatcc tgttctccgt gtttgatgaa

1800

aacagatcct ggtacctcac tgaaaacatc cagaggttcc tcccaaaccc cgcaggagtg

1860

caactggagg accctgagtt tcaggcctcg aatatcatgc actcgattaa cggttacgtg

1920

ttcgactcgc tgcagctgag cgtgtgcctc catgaagtcg cttactggta cattctgtcc

1980

atcggcgccc agactgactt cctgagcgtg ttcttttccg gttacacctt taagcacaag

2040

atggtgtacg aagataccct gaccctgttc cctttctccg gcgaaacggt gttcatgtcg

2100

atggagaacc cgggtctgtg gattctggga tgccacaaca gcgactttcg gaaccgcgga

2160

atgactgccc tgctgaaggt gtcctcatgc gacaagaaca ccggagacta ctacgaggac

2220

tcctacgagg atatctcagc ctacctcctg tccaagaaca acgcgatcga gccgcgcagc

2280

ttcagccaga acggcgcgcc aacatcagag agcgccaccc ctgaaagtgg tcccgggagc

2340

gagccagcca catctgggtc ggaaacgcca ggcacaagtg agtctgcaac tcccgagtcc

2400

ggacctggct ccgagcctgc cactagcggc tccgagactc cgggaacttc cgagagcgct

2460

acaccagaaa gcggacccgg aaccagtacc gaacctagcg agggctctgc tccgggcagc

2520

ccagccggct ctcctacatc cacggaggag ggcacttccg aatccgccac cccggagtca

2580

gggccaggat ctgaacccgc tacctcaggc agtgagacgc caggaacgag cgagtccgct

2640

acaccggaga gtgggccagg gagccctgct ggatctccta cgtccactga ggaagggtca

2700

ccagcgggct cgcccaccag cactgaagaa ggtgcctcga gcccgcctgt gctgaagagg

2760

caccagcgag aaattacccg gaccaccctc caatcggatc aggaggaaat cgactacgac

2820

gacaccatct cggtggaaat gaagaaggaa gatttcgata tctacgacga ggacgaaaat

2880

cagtcccctc gctcattcca aaagaaaact agacactact ttatcgccgc ggtggaaaga

2940

ctgtgggact atggaatgtc atccagccct cacgtccttc ggaaccgggc ccagagcgga

3000

tcggtgcctc agttcaagaa agtggtgttc caggagttca ccgacggcag cttcacccag

3060

ccgctgtacc ggggagaact gaacgaacac ctgggcctgc tcggtcccta catccgcgcg

3120

gaagtggagg ataacatcat ggtgaccttc cgtaaccaag catccagacc ttactccttc

3180

tattcctccc tgatctcata cgaggaggac cagcgccaag gcgccgagcc ccgcaagaac

3240

ttcgtcaagc ccaacgagac taagacctac ttctggaagg tccaacacca tatggccccg

3300

accaaggatg agtttgactg caaggcctgg gcctacttct ccgacgtgga ccttgagaag

3360

gatgtccatt ccggcctgat cgggccgctg ctcgtgtgtc acaccaacac cctgaaccca

3420

gcgcatggac gccaggtcac cgtccaggag tttgctctgt tcttcaccat ttttgacgaa

3480

actaagtcct ggtacttcac cgagaatatg gagcgaaact gtagagcgcc ctgcaatatc

3540

cagatggaag atccgacttt caaggagaac tatagattcc acgccatcaa cgggtacatc

3600

atggatactc tgccggggct ggtcatggcc caggatcaga ggattcggtg gtacttgctg

3660

tcaatgggat cgaacgaaaa cattcactcc attcacttct ccggtcacgt gttcactgtg

3720

cgcaagaagg aggagtacaa gatggcgctg tacaatctgt accccggggt gttcgaaact

3780

gtggagatgc tgccgtccaa ggccggcatc tggagagtgg agtgcctgat cggagagcac

3840

ctccacgcgg ggatgtccac cctcttcctg gtgtactcga ataagtgcca gaccccgctg

3900

ggcatggcct cgggccacat cagagacttc cagatcacag caagcggaca atacggccaa

3960

tgggcgccga agctggcccg cttgcactac tccggatcga tcaacgcatg gtccaccaag

4020

gaaccgttct cgtggattaa ggtggacctc ctggccccta tgattatcca cggaattaag

4080

acccagggcg ccaggcagaa gttctcctcc ctgtacatct cgcaattcat catcatgtac

4140

agcctggacg ggaagaagtg gcagacttac aggggaaact ccaccggcac cctgatggtc

4200

tttttcggca acgtggattc ctccggcatt aagcacaaca tcttcaaccc accgatcata

4260

gccagatata ttaggctcca ccccactcac tactcaatcc gctcaactct tcggatggaa

4320

ctcatggggt gcgacctgaa ctcctgctcc atgccgttgg ggatggaatc aaaggctatt

4380

agcgacgccc agatcaccgc gagctcctac ttcactaaca tgttcgccac ctggagcccc

4440

tccaaggcca ggctgcactt gcagggacgg tcaaatgcct ggcggccgca agtgaacaat

4500

ccgaaggaat ggcttcaagt ggatttccaa aagaccatga aagtgaccgg agtcaccacc

4560

cagggagtga agtcccttct gacctcgatg tatgtgaagg agttcctgat tagcagcagc

4620

caggacgggc accagtggac cctgttcttc caaaacggaa aggtcaaggt gttccagggg

4680

aaccaggact cgttcacacc cgtggtgaac tccctggacc ccccactgct gacgcggtac

4740

ttgaggattc atcctcagtc ctgggtccat cagattgcat tgcgaatgga agtcctgggc

4800

tgcgaggccc aggacctgta ctga

4824

<210> 73

<211> 12

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Мотив AD

<400> 73

Gly Glu Ser Pro Gly Gly Ser Ser Gly Ser Glu Ser

1. 5 10

<210> 74

<211> 12

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Мотив AD

<400> 74

Gly Ser Glu Gly Ser Ser Gly Pro Gly Glu Ser Ser

1. 5 10

<210> 75

<211> 12

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Мотив AD

<400> 75

Gly Ser Ser Glu Ser Gly Ser Ser Glu Gly Gly Pro

1. 5 10

<210> 76

<211> 12

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Мотив AD

<400> 76

Gly Ser Gly Gly Glu Pro Ser Glu Ser Gly Ser Ser

1. 5 10

<210> 77

<211> 12

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Мотив AE, AM

<400> 77

Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu

1. 5 10

<210> 78

<211> 12

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Мотив AE, AM, AQ

<400> 78

Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro

1. 5 10

<210> 79

<211> 12

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Мотив AE, AM, AQ

<400> 79

Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro

1. 5 10

<210> 80

<211> 12

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Мотив AE, AM, AQ

<400> 80

Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro

1. 5 10

<210> 81

<211> 12

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Мотив AF, AM

<400> 81

Gly Ser Thr Ser Glu Ser Pro Ser Gly Thr Ala Pro

1. 5 10

<210> 82

<211> 12

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Мотив AF, AM

<400> 82

Gly Thr Ser Thr Pro Glu Ser Gly Ser Ala Ser Pro

1. 5 10

<210> 83

<211> 12

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Мотив AF, AM

<400> 83

Gly Thr Ser Pro Ser Gly Glu Ser Ser Thr Ala Pro

1. 5 10

<210> 84

<211> 12

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Мотив AF, AM

<400> 84

Gly Ser Thr Ser Ser Thr Ala Glu Ser Pro Gly Pro

1. 5 10

<210> 85

<211> 12

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Мотив AG, AM

<400> 85

Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro

1. 5 10

<210> 86

<211> 12

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Мотив AG, AM

<400> 86

Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro

1. 5 10

<210> 87

<211> 12

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Мотив AG, AM

<400> 87

Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro

1. 5 10

<210> 88

<211> 12

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Мотив AG, AM

<400> 88

Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro

1. 5 10

<210> 89

<211> 12

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Мотив AQ

<400> 89

Gly Glu Pro Ala Gly Ser Pro Thr Ser Thr Ser Glu

1. 5 10

<210> 90

<211> 12

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Мотив AQ

<400> 90

Gly Thr Gly Glu Pro Ser Ser Thr Pro Ala Ser Glu

1. 5 10

<210> 91

<211> 12

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Мотив AQ

<400> 91

Gly Ser Gly Pro Ser Thr Glu Ser Ala Pro Thr Glu

1. 5 10

<210> 92

<211> 12

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Мотив AQ

<400> 92

Gly Ser Glu Thr Pro Ser Gly Pro Ser Glu Thr Ala

1. 5 10

<210> 93

<211> 12

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Мотив AQ

<400> 93

Gly Pro Ser Glu Thr Ser Thr Ser Glu Pro Gly Ala

1. 5 10

<210> 94

<211> 12

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Мотив AQ

<400> 94

Gly Ser Pro Ser Glu Pro Thr Glu Gly Thr Ser Ala

1. 5 10

<210> 95

<211> 12

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Мотив BD

<400> 95

Gly Ser Gly Ala Ser Glu Pro Thr Ser Thr Glu Pro

1. 5 10

<210> 96

<211> 12

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Мотив BD

<400> 96

Gly Ser Glu Pro Ala Thr Ser Gly Thr Glu Pro Ser

1. 5 10

<210> 97

<211> 12

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Мотив BD

<400> 97

Gly Thr Ser Glu Pro Ser Thr Ser Glu Pro Gly Ala

1. 5 10

<210> 98

<211> 12

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Мотив BD

<400> 98

Gly Thr Ser Thr Glu Pro Ser Glu Pro Gly Ser Ala

1. 5 10

<210> 99

<211> 12

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Мотив BD

<400> 99

Gly Ser Thr Ala Gly Ser Glu Thr Ser Thr Glu Ala

1. 5 10

<210> 100

<211> 12

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Мотив BD

<400> 100

Gly Ser Glu Thr Ala Thr Ser Gly Ser Glu Thr Ala

1. 5 10

<210> 101

<211> 12

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Мотив BD

<400> 101

Gly Thr Ser Glu Ser Ala Thr Ser Glu Ser Gly Ala

1. 5 10

<210> 102

<211> 12

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Мотив BD

<400> 102

Gly Thr Ser Thr Glu Ala Ser Glu Gly Ser Ala Ser

1. 5 10

<210> 103

<211> 1607

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Последовательность белка coFVIII-6-XTEN

<400> 103

Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe

1. 5 10 15

Cys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser

20 25 30

Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg

35 40 45

Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val

50 55 60

Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile

65 70 75 80

Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln

85 90 95

Ala Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser

100 105 110

His Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser

115 120 125

Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp

130 135 140

Asp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu

145 150 155 160

Lys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser

165 170 175

Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile

180 185 190

Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr

195 200 205

Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly

210 215 220

Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp

225 230 235 240

Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr

245 250 255

Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val

260 265 270

Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile

275 280 285

Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser

290 295 300

Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met

305 310 315 320

Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His

325 330 335

Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro

340 345 350

Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp

355 360 365

Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser

370 375 380

Pro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr

385 390 395 400

Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro

405 410 415

Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn

420 425 430

Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met

435 440 445

Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu

450 455 460

Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu

465 470 475 480

Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro

485 490 495

His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys

500 505 510

Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe

515 520 525

Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp

530 535 540

Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg

545 550 555 560

Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu

565 570 575

Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val

580 585 590

Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu

595 600 605

Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp

610 615 620

Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val

625 630 635 640

Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp

645 650 655

Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe

660 665 670

Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr

675 680 685

Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro

690 695 700

Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly

705 710 715 720

Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp

725 730 735

Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys

740 745 750

Asn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Gly Ala Pro Thr

755 760 765

Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr

770 775 780

Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser

785 790 795 800

Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr

805 810 815

Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro

820 825 830

Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr

835 840 845

Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser

850 855 860

Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala

865 870 875 880

Thr Pro Glu Ser Gly Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr

885 890 895

Glu Glu Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Ala

900 905 910

Ser Ser Pro Pro Val Leu Lys Arg His Gln Arg Glu Ile Thr Arg Thr

915 920 925

Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr Asp Asp Thr Ile Ser

930 935 940

Val Glu Met Lys Lys Glu Asp Phe Asp Ile Tyr Asp Glu Asp Glu Asn

945 950 955 960

Gln Ser Pro Arg Ser Phe Gln Lys Lys Thr Arg His Tyr Phe Ile Ala

965 970 975

Ala Val Glu Arg Leu Trp Asp Tyr Gly Met Ser Ser Ser Pro His Val

980 985 990

Leu Arg Asn Arg Ala Gln Ser Gly Ser Val Pro Gln Phe Lys Lys Val

995 1000 1005

Val Phe Gln Glu Phe Thr Asp Gly Ser Phe Thr Gln Pro Leu Tyr

1010 1015 1020

Arg Gly Glu Leu Asn Glu His Leu Gly Leu Leu Gly Pro Tyr Ile

1025 1030 1035

Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr Phe Arg Asn Gln

1040 1045 1050

Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile Ser Tyr Glu

1055 1060 1065

Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn Phe Val Lys

1070 1075 1080

Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln His His Met

1085 1090 1095

Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr Phe

1100 1105 1110

Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile Gly

1115 1120 1125

Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His Gly

1130 1135 1140

Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe

1145 1150 1155

Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn

1160 1165 1170

Cys Arg Ala Pro Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys

1175 1180 1185

Glu Asn Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr

1190 1195 1200

Leu Pro Gly Leu Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr

1205 1210 1215

Leu Leu Ser Met Gly Ser Asn Glu Asn Ile His Ser Ile His Phe

1220 1225 1230

Ser Gly His Val Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys Met

1235 1240 1245

Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe Glu Thr Val Glu Met

1250 1255 1260

Leu Pro Ser Lys Ala Gly Ile Trp Arg Val Glu Cys Leu Ile Gly

1265 1270 1275

Glu His Leu His Ala Gly Met Ser Thr Leu Phe Leu Val Tyr Ser

1280 1285 1290

Asn Lys Cys Gln Thr Pro Leu Gly Met Ala Ser Gly His Ile Arg

1295 1300 1305

Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro

1310 1315 1320

Lys Leu Ala Arg Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser

1325 1330 1335

Thr Lys Glu Pro Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro

1340 1345 1350

Met Ile Ile His Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe

1355 1360 1365

Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp

1370 1375 1380

Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu

1385 1390 1395

Met Val Phe Phe Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn

1400 1405 1410

Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro

1415 1420 1425

Thr His Tyr Ser Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly

1430 1435 1440

Cys Asp Leu Asn Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys

1445 1450 1455

Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn

1460 1465 1470

Met Phe Ala Thr Trp Ser Pro Ser Lys Ala Arg Leu His Leu Gln

1475 1480 1485

Gly Arg Ser Asn Ala Trp Arg Pro Gln Val Asn Asn Pro Lys Glu

1490 1495 1500

Trp Leu Gln Val Asp Phe Gln Lys Thr Met Lys Val Thr Gly Val

1505 1510 1515

Thr Thr Gln Gly Val Lys Ser Leu Leu Thr Ser Met Tyr Val Lys

1520 1525 1530

Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly His Gln Trp Thr Leu

1535 1540 1545

Phe Phe Gln Asn Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp

1550 1555 1560

Ser Phe Thr Pro Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr

1565 1570 1575

Arg Tyr Leu Arg Ile His Pro Gln Ser Trp Val His Gln Ile Ala

1580 1585 1590

Leu Arg Met Glu Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr

1595 1600 1605

<210> 104

<211> 16

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Rep-связывающий сайт (RBS) для AAV2

<400> 104

gcgcgctcgc tcgctc

16

<210> 105

<211> 6

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Сайт концевого разрешения (TRS) для AAV2

<400> 105

agttgg

6

<210> 106

<211> 2328

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Зрелый полноразмерный FVIII

<400> 106

Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr

1. 5 10 15

Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro

20 25 30

Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys

35 40 45

Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro

50 55 60

Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val

65 70 75 80

Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val

85 90 95

Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala

100 105 110

Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val

115 120 125

Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn

130 135 140

Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser

145 150 155 160

His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu

165 170 175

Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu

180 185 190

His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp

195 200 205

His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser

210 215 220

Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg

225 230 235 240

Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His

245 250 255

Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu

260 265 270

Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile

275 280 285

Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly

290 295 300

Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met

305 310 315 320

Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg

325 330 335

Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp

340 345 350

Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe

355 360 365

Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His

370 375 380

Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu

385 390 395 400

Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro

405 410 415

Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr

420 425 430

Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile

435 440 445

Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile

450 455 460

Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile

465 470 475 480

Thr Asp Val Arg Pro Lys Arg Arg Leu Pro Lys Gly Val Lys His Leu

485 490 495

Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys Trp Thr

500 505 510

Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys Leu Thr

515 520 525

Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala Ser Gly

530 535 540

Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp Gln Arg

545 550 555 560

Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe Ser Val

565 570 575

Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln Arg Phe

580 585 590

Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe Gln Ala

595 600 605

Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser Leu Gln

610 615 620

Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu Ser Ile

625 630 635 640

Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr Thr Phe

645 650 655

Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro Phe Ser

660 665 670

Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp Ile Leu

675 680 685

Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala Leu Leu

690 695 700

Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu Asp Ser

705 710 715 720

Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala Ile Glu

725 730 735

Pro Arg Ser Phe Ser Gln Asn Ser Arg His Pro Ser Thr Arg Gln Lys

740 745 750

Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn Asp Ile Glu Lys Thr Asp

755 760 765

Pro Trp Phe Ala His Arg Thr Pro Met Pro Lys Ile Gln Asn Val Ser

770 775 780

Ser Ser Asp Leu Leu Met Leu Leu Arg Gln Ser Pro Thr Pro His Gly

785 790 795 800

Leu Ser Leu Ser Asp Leu Gln Glu Ala Lys Tyr Glu Thr Phe Ser Asp

805 810 815

Asp Pro Ser Pro Gly Ala Ile Asp Ser Asn Asn Ser Leu Ser Glu Met

820 825 830

Thr His Phe Arg Pro Gln Leu His His Ser Gly Asp Met Val Phe Thr

835 840 845

Pro Glu Ser Gly Leu Gln Leu Arg Leu Asn Glu Lys Leu Gly Thr Thr

850 855 860

Ala Ala Thr Glu Leu Lys Lys Leu Asp Phe Lys Val Ser Ser Thr Ser

865 870 875 880

Asn Asn Leu Ile Ser Thr Ile Pro Ser Asp Asn Leu Ala Ala Gly Thr

885 890 895

Asp Asn Thr Ser Ser Leu Gly Pro Pro Ser Met Pro Val His Tyr Asp

900 905 910

Ser Gln Leu Asp Thr Thr Leu Phe Gly Lys Lys Ser Ser Pro Leu Thr

915 920 925

Glu Ser Gly Gly Pro Leu Ser Leu Ser Glu Glu Asn Asn Asp Ser Lys

930 935 940

Leu Leu Glu Ser Gly Leu Met Asn Ser Gln Glu Ser Ser Trp Gly Lys

945 950 955 960

Asn Val Ser Ser Thr Glu Ser Gly Arg Leu Phe Lys Gly Lys Arg Ala

965 970 975

His Gly Pro Ala Leu Leu Thr Lys Asp Asn Ala Leu Phe Lys Val Ser

980 985 990

Ile Ser Leu Leu Lys Thr Asn Lys Thr Ser Asn Asn Ser Ala Thr Asn

995 1000 1005

Arg Lys Thr His Ile Asp Gly Pro Ser Leu Leu Ile Glu Asn Ser

1010 1015 1020

Pro Ser Val Trp Gln Asn Ile Ser Asp Thr Glu Phe Lys Lys Val

1025 1030 1035

Thr Pro Leu Ile His Asp Arg Met Leu Met Asp Lys Asn Ala Thr

1040 1045 1050

Ala Leu Arg Leu Asn His Met Ser Asn Lys Thr Thr Ser Ser Lys

1055 1060 1065

Asn Met Glu Met Val Gln Gln Lys Lys Glu Gly Pro Ile Pro Pro

1070 1075 1080

Asp Ala Gln Asn Pro Asp Met Ser Phe Phe Lys Met Leu Phe Leu

1085 1090 1095

Pro Glu Ser Ala Arg Trp Ile Gln Arg Thr His Gly Lys Asn Ser

1100 1105 1110

Leu Asn Ser Gly Gln Gly Pro Ser Pro Lys Gln Leu Val Ser Leu

1115 1120 1125

Gly Pro Glu Lys Ser Val Glu Gly Gln Asn Phe Leu Ser Glu Lys

1130 1135 1140

Asn Lys Val Val Val Gly Lys Gly Glu Phe Thr Lys Asp Val Gly

1145 1150 1155

Leu Lys Glu Met Val Phe Pro Ser Ser Arg Asn Leu Phe Leu Thr

1160 1165 1170

Asn Leu Asp Asn Leu His Glu Asn Asn Thr His Asn Gln Glu Lys

1175 1180 1185

Lys Ile Gln Glu Glu Ile Glu Lys Lys Glu Thr Leu Ile Gln Glu

1190 1195 1200

Asn Val Val Leu Pro Gln Ile His Thr Val Thr Gly Thr Lys Asn

1205 1210 1215

Phe Met Lys Asn Leu Phe Leu Leu Ser Thr Arg Gln Asn Val Glu

1220 1225 1230

Gly Ser Tyr Asp Gly Ala Tyr Ala Pro Val Leu Gln Asp Phe Arg

1235 1240 1245

Ser Leu Asn Asp Ser Thr Asn Arg Thr Lys Lys His Thr Ala His

1250 1255 1260

Phe Ser Lys Lys Gly Glu Glu Glu Asn Leu Glu Gly Leu Gly Asn

1265 1270 1275

Gln Thr Lys Gln Ile Val Glu Lys Tyr Ala Cys Thr Thr Arg Ile

1280 1285 1290

Ser Pro Asn Thr Ser Gln Gln Asn Phe Val Thr Gln Arg Ser Lys

1295 1300 1305

Arg Ala Leu Lys Gln Phe Arg Leu Pro Leu Glu Glu Thr Glu Leu

1310 1315 1320

Glu Lys Arg Ile Ile Val Asp Asp Thr Ser Thr Gln Trp Ser Lys

1325 1330 1335

Asn Met Lys His Leu Thr Pro Ser Thr Leu Thr Gln Ile Asp Tyr

1340 1345 1350

Asn Glu Lys Glu Lys Gly Ala Ile Thr Gln Ser Pro Leu Ser Asp

1355 1360 1365

Cys Leu Thr Arg Ser His Ser Ile Pro Gln Ala Asn Arg Ser Pro

1370 1375 1380

Leu Pro Ile Ala Lys Val Ser Ser Phe Pro Ser Ile Arg Pro Ile

1385 1390 1395

Tyr Leu Thr Arg Val Leu Phe Gln Asp Asn Ser Ser His Leu Pro

1400 1405 1410

Ala Ala Ser Tyr Arg Lys Lys Asp Ser Gly Val Gln Glu Ser Ser

1415 1420 1425

His Phe Leu Gln Gly Ala Lys Lys Asn Asn Leu Ser Leu Ala Ile

1430 1435 1440

Leu Thr Leu Glu Met Thr Gly Asp Gln Arg Glu Val Gly Ser Leu

1445 1450 1455

Gly Thr Ser Ala Thr Asn Ser Val Thr Tyr Lys Lys Val Glu Asn

1460 1465 1470

Thr Val Leu Pro Lys Pro Asp Leu Pro Lys Thr Ser Gly Lys Val

1475 1480 1485

Glu Leu Leu Pro Lys Val His Ile Tyr Gln Lys Asp Leu Phe Pro

1490 1495 1500

Thr Glu Thr Ser Asn Gly Ser Pro Gly His Leu Asp Leu Val Glu

1505 1510 1515

Gly Ser Leu Leu Gln Gly Thr Glu Gly Ala Ile Lys Trp Asn Glu

1520 1525 1530

Ala Asn Arg Pro Gly Lys Val Pro Phe Leu Arg Val Ala Thr Glu

1535 1540 1545

Ser Ser Ala Lys Thr Pro Ser Lys Leu Leu Asp Pro Leu Ala Trp

1550 1555 1560

Asp Asn His Tyr Gly Thr Gln Ile Pro Lys Glu Glu Trp Lys Ser

1565 1570 1575

Gln Glu Lys Ser Pro Glu Lys Thr Ala Phe Lys Lys Lys Asp Thr

1580 1585 1590

Ile Leu Ser Leu Asn Ala Cys Glu Ser Asn His Ala Ile Ala Ala

1595 1600 1605

Ile Asn Glu Gly Gln Asn Lys Pro Glu Ile Glu Val Thr Trp Ala

1610 1615 1620

Lys Gln Gly Arg Thr Glu Arg Leu Cys Ser Gln Asn Pro Pro Val

1625 1630 1635

Leu Lys Arg His Gln Arg Glu Ile Thr Arg Thr Thr Leu Gln Ser

1640 1645 1650

Asp Gln Glu Glu Ile Asp Tyr Asp Asp Thr Ile Ser Val Glu Met

1655 1660 1665

Lys Lys Glu Asp Phe Asp Ile Tyr Asp Glu Asp Glu Asn Gln Ser

1670 1675 1680

Pro Arg Ser Phe Gln Lys Lys Thr Arg His Tyr Phe Ile Ala Ala

1685 1690 1695

Val Glu Arg Leu Trp Asp Tyr Gly Met Ser Ser Ser Pro His Val

1700 1705 1710

Leu Arg Asn Arg Ala Gln Ser Gly Ser Val Pro Gln Phe Lys Lys

1715 1720 1725

Val Val Phe Gln Glu Phe Thr Asp Gly Ser Phe Thr Gln Pro Leu

1730 1735 1740

Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu Leu Gly Pro Tyr

1745 1750 1755

Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr Phe Arg Asn

1760 1765 1770

Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile Ser Tyr

1775 1780 1785

Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn Phe Val

1790 1795 1800

Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln His His

1805 1810 1815

Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr

1820 1825 1830

Phe Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile

1835 1840 1845

Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His

1850 1855 1860

Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile

1865 1870 1875

Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg

1880 1885 1890

Asn Cys Arg Ala Pro Cys Asn Ile Gln Met Glu Asp Pro Thr Phe

1895 1900 1905

Lys Glu Asn Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile Met Asp

1910 1915 1920

Thr Leu Pro Gly Leu Val Met Ala Gln Asp Gln Arg Ile Arg Trp

1925 1930 1935

Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn Ile His Ser Ile His

1940 1945 1950

Phe Ser Gly His Val Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys

1955 1960 1965

Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe Glu Thr Val Glu

1970 1975 1980

Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val Glu Cys Leu Ile

1985 1990 1995

Gly Glu His Leu His Ala Gly Met Ser Thr Leu Phe Leu Val Tyr

2000 2005 2010

Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala Ser Gly His Ile

2015 2020 2025

Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala

2030 2035 2040

Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser Ile Asn Ala Trp

2045 2050 2055

Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys Val Asp Leu Leu Ala

2060 2065 2070

Pro Met Ile Ile His Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys

2075 2080 2085

Phe Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu

2090 2095 2100

Asp Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr

2105 2110 2115

Leu Met Val Phe Phe Gly Asn Val Asp Ser Ser Gly Ile Lys His

2120 2125 2130

Asn Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr Ile Arg Leu His

2135 2140 2145

Pro Thr His Tyr Ser Ile Arg Ser Thr Leu Arg Met Glu Leu Met

2150 2155 2160

Gly Cys Asp Leu Asn Ser Cys Ser Met Pro Leu Gly Met Glu Ser

2165 2170 2175

Lys Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr

2180 2185 2190

Asn Met Phe Ala Thr Trp Ser Pro Ser Lys Ala Arg Leu His Leu

2195 2200 2205

Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln Val Asn Asn Pro Lys

2210 2215 2220

Glu Trp Leu Gln Val Asp Phe Gln Lys Thr Met Lys Val Thr Gly

2225 2230 2235

Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr Ser Met Tyr Val

2240 2245 2250

Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly His Gln Trp Thr

2255 2260 2265

Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe Gln Gly Asn Gln

2270 2275 2280

Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp Pro Pro Leu Leu

2285 2290 2295

Thr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp Val His Gln Ile

2300 2305 2310

Ala Leu Arg Met Glu Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr

2315 2320 2325

<210> 107

<211> 7053

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Зрелый полноразмерный FVIII

<400> 107

atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagtgcc

60

accagaagat actacctggg tgcagtggaa ctgtcatggg actatatgca aagtgatctc

120

ggtgagctgc ctgtggacgc aagatttcct cctagagtgc caaaatcttt tccattcaac

180

acctcagtcg tgtacaaaaa gactctgttt gtagaattca cggatcacct tttcaacatc

240

gctaagccaa ggccaccctg gatgggtctg ctaggtccta ccatccaggc tgaggtttat

300

gatacagtgg tcattacact taagaacatg gcttcccatc ctgtcagtct tcatgctgtt

360

ggtgtatcct actggaaagc ttctgaggga gctgaatatg atgatcagac cagtcaaagg

420

gagaaagaag atgataaagt cttccctggt ggaagccata catatgtctg gcaggtcctg

480

aaagagaatg gtccaatggc ctctgaccca ctgtgcctta cctactcata tctttctcat

540

gtggacctgg taaaagactt gaattcaggc ctcattggag ccctactagt atgtagagaa

600

gggagtctgg ccaaggaaaa gacacagacc ttgcacaaat ttatactact ttttgctgta

660

tttgatgaag ggaaaagttg gcactcagaa acaaagaact ccttgatgca ggatagggat

720

gctgcatctg ctcgggcctg gcctaaaatg cacacagtca atggttatgt aaacaggtct

780

ctgccaggtc tgattggatg ccacaggaaa tcagtctatt ggcatgtgat tggaatgggc

840

accactcctg aagtgcactc aatattcctc gaaggtcaca catttcttgt gaggaaccat

900

cgccaggcgt ccttggaaat ctcgccaata actttcctta ctgctcaaac actcttgatg

960

gaccttggac agtttctact gttttgtcat atctcttccc accaacatga tggcatggaa

1020

gcttatgtca aagtagacag ctgtccagag gaaccccaac tacgaatgaa aaataatgaa

1080

gaagcggaag actatgatga tgatcttact gattctgaaa tggatgtggt caggtttgat

1140

gatgacaact ctccttcctt tatccaaatt cgctcagttg ccaagaagca tcctaaaact

1200

tgggtacatt acattgctgc tgaagaggag gactgggact atgctccctt agtcctcgcc

1260

cccgatgaca gaagttataa aagtcaatat ttgaacaatg gccctcagcg gattggtagg

1320

aagtacaaaa aagtccgatt tatggcatac acagatgaaa cctttaagac tcgtgaagct

1380

attcagcatg aatcaggaat cttgggacct ttactttatg gggaagttgg agacacactg

1440

ttgattatat ttaagaatca agcaagcaga ccatataaca tctaccctca cggaatcact

1500

gatgtccgtc ctttgtattc aaggagatta ccaaaaggtg taaaacattt gaaggatttt

1560

ccaattctgc caggagaaat attcaaatat aaatggacag tgactgtaga agatgggcca

1620

actaaatcag atcctcggtg cctgacccgc tattactcta gtttcgttaa tatggagaga

1680

gatctagctt caggactcat tggccctctc ctcatctgct acaaagaatc tgtagatcaa

1740

agaggaaacc agataatgtc agacaagagg aatgtcatcc tgttttctgt atttgatgag

1800

aaccgaagct ggtacctcac agagaatata caacgctttc tccccaatcc agctggagtg

1860

cagcttgagg atccagagtt ccaagcctcc aacatcatgc acagcatcaa tggctatgtt

1920

tttgatagtt tgcagttgtc agtttgtttg catgaggtgg catactggta cattctaagc

1980

attggagcac agactgactt cctttctgtc ttcttctctg gatatacctt caaacacaaa

2040

atggtctatg aagacacact caccctattc ccattctcag gagaaactgt cttcatgtcg

2100

atggaaaacc caggtctatg gattctgggg tgccacaact cagactttcg gaacagaggc

2160

atgaccgcct tactgaaggt ttctagttgt gacaagaaca ctggtgatta ttacgaggac

2220

agttatgaag atatttcagc atacttgctg agtaaaaaca atgccattga accaagaagc

2280

ttctcccaga attcaagaca ccctagcact aggcaaaagc aatttaatgc caccacaatt

2340

ccagaaaatg acatagagaa gactgaccct tggtttgcac acagaacacc tatgcctaaa

2400

atacaaaatg tctcctctag tgatttgttg atgctcttgc gacagagtcc tactccacat

2460

gggctatcct tatctgatct ccaagaagcc aaatatgaga ctttttctga tgatccatca

2520

cctggagcaa tagacagtaa taacagcctg tctgaaatga cacacttcag gccacagctc

2580

catcacagtg gggacatggt atttacccct gagtcaggcc tccaattaag attaaatgag

2640

aaactgggga caactgcagc aacagagttg aagaaacttg atttcaaagt ttctagtaca

2700

tcaaataatc tgatttcaac aattccatca gacaatttgg cagcaggtac tgataataca

2760

agttccttag gacccccaag tatgccagtt cattatgata gtcaattaga taccactcta

2820

tttggcaaaa agtcatctcc ccttactgag tctggtggac ctctgagctt gagtgaagaa

2880

aataatgatt caaagttgtt agaatcaggt ttaatgaata gccaagaaag ttcatgggga

2940

aaaaatgtat cgtcaacaga gagtggtagg ttatttaaag ggaaaagagc tcatggacct

3000

gctttgttga ctaaagataa tgccttattc aaagttagca tctctttgtt aaagacaaac

3060

aaaacttcca ataattcagc aactaataga aagactcaca ttgatggccc atcattatta

3120

attgagaata gtccatcagt ctggcaaaat atattagaaa gtgacactga gtttaaaaaa

3180

gtgacacctt tgattcatga cagaatgctt atggacaaaa atgctacagc tttgaggcta

3240

aatcatatgt caaataaaac tacttcatca aaaaacatgg aaatggtcca acagaaaaaa

3300

gagggcccca ttccaccaga tgcacaaaat ccagatatgt cgttctttaa gatgctattc

3360

ttgccagaat cagcaaggtg gatacaaagg actcatggaa agaactctct gaactctggg

3420

caaggcccca gtccaaagca attagtatcc ttaggaccag aaaaatctgt ggaaggtcag

3480

aatttcttgt ctgagaaaaa caaagtggta gtaggaaagg gtgaatttac aaaggacgta

3540

ggactcaaag agatggtttt tccaagcagc agaaacctat ttcttactaa cttggataat

3600

ttacatgaaa ataatacaca caatcaagaa aaaaaaattc aggaagaaat agaaaagaag

3660

gaaacattaa tccaagagaa tgtagttttg cctcagatac atacagtgac tggcactaag

3720

aatttcatga agaacctttt cttactgagc actaggcaaa atgtagaagg ttcatatgac

3780

ggggcatatg ctccagtact tcaagatttt aggtcattaa atgattcaac aaatagaaca

3840

aagaaacaca cagctcattt ctcaaaaaaa ggggaggaag aaaacttgga aggcttggga

3900

aatcaaacca agcaaattgt agagaaatat gcatgcacca caaggatatc tcctaataca

3960

agccagcaga attttgtcac gcaacgtagt aagagagctt tgaaacaatt cagactccca

4020

ctagaagaaa cagaacttga aaaaaggata attgtggatg acacctcaac ccagtggtcc

4080

aaaaacatga aacatttgac cccgagcacc ctcacacaga tagactacaa tgagaaggag

4140

aaaggggcca ttactcagtc tcccttatca gattgcctta cgaggagtca tagcatccct

4200

caagcaaata gatctccatt acccattgca aaggtatcat catttccatc tattagacct

4260

atatatctga ccagggtcct attccaagac aactcttctc atcttccagc agcatcttat

4320

agaaagaaag attctggggt ccaagaaagc agtcatttct tacaaggagc caaaaaaaat

4380

aacctttctt tagccattct aaccttggag atgactggtg atcaaagaga ggttggctcc

4440

ctggggacaa gtgccacaaa ttcagtcaca tacaagaaag ttgagaacac tgttctcccg

4500

aaaccagact tgcccaaaac atctggcaaa gttgaattgc ttccaaaagt tcacatttat

4560

cagaaggacc tattccctac ggaaactagc aatgggtctc ctggccatct ggatctcgtg

4620

gaagggagcc ttcttcaggg aacagaggga gcgattaagt ggaatgaagc aaacagacct

4680

ggaaaagttc cctttctgag agtagcaaca gaaagctctg caaagactcc ctccaagcta

4740

ttggatcctc ttgcttggga taaccactat ggtactcaga taccaaaaga agagtggaaa

4800

tcccaagaga agtcaccaga aaaaacagct tttaagaaaa aggataccat tttgtccctg

4860

aacgcttgtg aaagcaatca tgcaatagca gcaataaatg agggacaaaa taagcccgaa

4920

atagaagtca cctgggcaaa gcaaggtagg actgaaaggc tgtgctctca aaacccacca

4980

gtcttgaaac gccatcaacg ggaaataact cgtactactc ttcagtcaga tcaagaggaa

5040

attgactatg atgataccat atcagttgaa atgaagaagg aagattttga catttatgat

5100

gaggatgaaa atcagagccc ccgcagcttt caaaagaaaa cacgacacta ttttattgct

5160

gcagtggaga ggctctggga ttatgggatg agtagctccc cacatgttct aagaaacagg

5220

gctcagagtg gcagtgtccc tcagttcaag aaagttgttt tccaggaatt tactgatggc

5280

tcctttactc agcccttata ccgtggagaa ctaaatgaac atttgggact cctggggcca

5340

tatataagag cagaagttga agataatatc atggtaactt tcagaaatca ggcctctcgt

5400

ccctattcct tctattctag ccttatttct tatgaggaag atcagaggca aggagcagaa

5460

cctagaaaaa actttgtcaa gcctaatgaa accaaaactt acttttggaa agtgcaacat

5520

catatggcac ccactaaaga tgagtttgac tgcaaagcct gggcttattt ctctgatgtt

5580

gacctggaaa aagatgtgca ctcaggcctg attggacccc ttctggtctg ccacactaac

5640

acactgaacc ctgctcatgg gagacaagtg acagtacagg aatttgctct gtttttcacc

5700

atctttgatg agaccaaaag ctggtacttc actgaaaata tggaaagaaa ctgcagggct

5760

ccctgcaata tccagatgga agatcccact tttaaagaga attatcgctt ccatgcaatc

5820

aatggctaca taatggatac actacctggc ttagtaatgg ctcaggatca aaggattcga

5880

tggtatctgc tcagcatggg cagcaatgaa aacatccatt ctattcattt cagtggacat

5940

gtgttcactg tacgaaaaaa agaggagtat aaaatggcac tgtacaatct ctatccaggt

6000

gtttttgaga cagtggaaat gttaccatcc aaagctggaa tttggcgggt ggaatgcctt

6060

attggcgagc atctacatgc tgggatgagc acactttttc tggtgtacag caataagtgt

6120

cagactcccc tgggaatggc ttctggacac attagagatt ttcagattac agcttcagga

6180

caatatggac agtgggcccc aaagctggcc agacttcatt attccggatc aatcaatgcc

6240

tggagcacca aggagccctt ttcttggatc aaggtggatc tgttggcacc aatgattatt

6300

cacggcatca agacccaggg tgcccgtcag aagttctcca gcctctacat ctctcagttt

6360

atcatcatgt atagtcttga tgggaagaag tggcagactt atcgaggaaa ttccactgga

6420

accttaatgg tcttctttgg caatgtggat tcatctggga taaaacacaa tatttttaac

6480

cctccaatta ttgctcgata catccgtttg cacccaactc attatagcat tcgcagcact

6540

cttcgcatgg agttgatggg ctgtgattta aatagttgca gcatgccatt gggaatggag

6600

agtaaagcaa tatcagatgc acagattact gcttcatcct actttaccaa tatgtttgcc

6660

acctggtctc cttcaaaagc tcgacttcac ctccaaggga ggagtaatgc ctggagacct

6720

caggtgaata atccaaaaga gtggctgcaa gtggacttcc agaagacaat gaaagtcaca

6780

ggagtaacta ctcagggagt aaaatctctg cttaccagca tgtatgtgaa ggagttcctc

6840

atctccagca gtcaagatgg ccatcagtgg actctctttt ttcagaatgg caaagtaaag

6900

gtttttcagg gaaatcaaga ctccttcaca cctgtggtga actctctaga cccaccgtta

6960

ctgactcgct accttcgaat tcacccccag agttgggtgc accagattgc cctgaggatg

7020

gaggttctgg gctgcgaggc acaggacctc tac

7053

<210> 108

<400> 108

000

<210> 109

<211> 1718

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> BIVV001 BDD-FVIII(XTEN) последовательность (без Fc)

<400> 109

Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr

1. 5 10 15

Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro

20 25 30

Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys

35 40 45

Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro

50 55 60

Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val

65 70 75 80

Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val

85 90 95

Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala

100 105 110

Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val

115 120 125

Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn

130 135 140

Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser

145 150 155 160

His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu

165 170 175

Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu

180 185 190

His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp

195 200 205

His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser

210 215 220

Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg

225 230 235 240

Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His

245 250 255

Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu

260 265 270

Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile

275 280 285

Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly

290 295 300

Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met

305 310 315 320

Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg

325 330 335

Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp

340 345 350

Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe

355 360 365

Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His

370 375 380

Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu

385 390 395 400

Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro

405 410 415

Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr

420 425 430

Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile

435 440 445

Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile

450 455 460

Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile

465 470 475 480

Thr Asp Val Arg Pro Lys Arg Arg Leu Pro Lys Gly Val Lys His Leu

485 490 495

Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys Trp Thr

500 505 510

Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys Leu Thr

515 520 525

Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala Ser Gly

530 535 540

Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp Gln Arg

545 550 555 560

Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe Ser Val

565 570 575

Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln Arg Phe

580 585 590

Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe Gln Ala

595 600 605

Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser Leu Gln

610 615 620

Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu Ser Ile

625 630 635 640

Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr Thr Phe

645 650 655

Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro Phe Ser

660 665 670

Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp Ile Leu

675 680 685

Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala Leu Leu

690 695 700

Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu Asp Ser

705 710 715 720

Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala Ile Glu

725 730 735

Pro Arg Ser Phe Ser Gln Asn Gly Thr Ser Glu Ser Ala Thr Pro Glu

740 745 750

Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly

755 760 765

Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala

770 775 780

Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu

785 790 795 800

Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly

805 810 815

Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser

820 825 830

Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser

835 840 845

Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly

850 855 860

Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Ser Pro Ala Gly

865 870 875 880

Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly

885 890 895

Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly

900 905 910

Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Glu Ser

915 920 925

Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser

930 935 940

Glu Thr Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly

945 950 955 960

Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu

965 970 975

Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly

980 985 990

Ser Ala Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly

995 1000 1005

Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr

1010 1015 1020

Glu Pro Ser Glu Gly Ser Ala Pro Ala Ser Ser Glu Ile Thr Arg

1025 1030 1035

Thr Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr Asp Asp Thr

1040 1045 1050

Ile Ser Val Glu Met Lys Lys Glu Asp Phe Asp Ile Tyr Asp Glu

1055 1060 1065

Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys Thr Arg His

1070 1075 1080

Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly Met Ser

1085 1090 1095

Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser Val

1100 1105 1110

Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser

1115 1120 1125

Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly

1130 1135 1140

Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met

1145 1150 1155

Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser

1160 1165 1170

Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro

1175 1180 1185

Arg Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp

1190 1195 1200

Lys Val Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys

1205 1210 1215

Lys Ala Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val

1220 1225 1230

His Ser Gly Leu Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr

1235 1240 1245

Leu Asn Pro Ala His Gly Arg Gln Val Thr Val Gln Glu Phe Ala

1250 1255 1260

Leu Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr

1265 1270 1275

Glu Asn Met Glu Arg Asn Cys Arg Ala Pro Cys Asn Ile Gln Met

1280 1285 1290

Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg Phe His Ala Ile Asn

1295 1300 1305

Gly Tyr Ile Met Asp Thr Leu Pro Gly Leu Val Met Ala Gln Asp

1310 1315 1320

Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn

1325 1330 1335

Ile His Ser Ile His Phe Ser Gly His Val Phe Thr Val Arg Lys

1340 1345 1350

Lys Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val

1355 1360 1365

Phe Glu Thr Val Glu Met Leu Pro Ser Lys Ala Gly Ile Trp Arg

1370 1375 1380

Val Glu Cys Leu Ile Gly Glu His Leu His Ala Gly Met Ser Thr

1385 1390 1395

Leu Phe Leu Val Tyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met

1400 1405 1410

Ala Ser Gly His Ile Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln

1415 1420 1425

Tyr Gly Gln Trp Ala Pro Lys Leu Ala Arg Leu His Tyr Ser Gly

1430 1435 1440

Ser Ile Asn Ala Trp Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys

1445 1450 1455

Val Asp Leu Leu Ala Pro Met Ile Ile His Gly Ile Lys Thr Gln

1460 1465 1470

Gly Ala Arg Gln Lys Phe Ser Ser Leu Tyr Ile Ser Gln Phe Ile

1475 1480 1485

Ile Met Tyr Ser Leu Asp Gly Lys Lys Trp Gln Thr Tyr Arg Gly

1490 1495 1500

Asn Ser Thr Gly Thr Leu Met Val Phe Phe Gly Asn Val Asp Ser

1505 1510 1515

Ser Gly Ile Lys His Asn Ile Phe Asn Pro Pro Ile Ile Ala Arg

1520 1525 1530

Tyr Ile Arg Leu His Pro Thr His Tyr Ser Ile Arg Ser Thr Leu

1535 1540 1545

Arg Met Glu Leu Met Gly Cys Asp Leu Asn Ser Cys Ser Met Pro

1550 1555 1560

Leu Gly Met Glu Ser Lys Ala Ile Ser Asp Ala Gln Ile Thr Ala

1565 1570 1575

Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp Ser Pro Ser Lys

1580 1585 1590

Ala Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln

1595 1600 1605

Val Asn Asn Pro Lys Glu Trp Leu Gln Val Asp Phe Gln Lys Thr

1610 1615 1620

Met Lys Val Thr Gly Val Thr Thr Gln Gly Val Lys Ser Leu Leu

1625 1630 1635

Thr Ser Met Tyr Val Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp

1640 1645 1650

Gly His Gln Trp Thr Leu Phe Phe Gln Asn Gly Lys Val Lys Val

1655 1660 1665

Phe Gln Gly Asn Gln Asp Ser Phe Thr Pro Val Val Asn Ser Leu

1670 1675 1680

Asp Pro Pro Leu Leu Thr Arg Tyr Leu Arg Ile His Pro Gln Ser

1685 1690 1695

Trp Val His Gln Ile Ala Leu Arg Met Glu Val Leu Gly Cys Glu

1700 1705 1710

Ala Gln Asp Leu Tyr

1715

<210> 110

<211> 6526

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Конструкция NB15.1v32 (AAV-FVIIIco6XTEN-ssDNA)

<400> 110

ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt

60

ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact

120

aggggttcct gcggcaattc agtcgataac tataacggtc ctaaggtagc gatttaaata

180

cgcgctctct taaggtagcc ccgggacgcg tcaattgaga tctggatccg gtaccgaatt

240

cgcggccgcc tcgacgacta gcgtttaatt aaacgcgtgt ctgtctgcac atttcgtaga

300

gcgagtgttc cgatactcta atctccctag gcaaggttca tatttgtgta ggttacttat

360

tctccttttg ttgactaagt caataatcag aatcagcagg tttggagtca gcttggcagg

420

gatcagcagc ctgggttgga aggagggggt ataaaagccc cttcaccagg agaagccgtc

480

acacagatcc acaagctcct gaggtaagtg ccgtgtgtgg ttcccgcggg cctggcctct

540

ttacgggtta tggcccttgc gtgccttgaa ttactgacac tgacatccac tttttctttt

600

tctccacagc tagcgccacc atgcagattg agctgtccac ttgtttcttc ctgtgcctcc

660

tgcgcttctg tttctccgcc actcgccggt actaccttgg agccgtggag ctttcatggg

720

actacatgca gagcgacctg ggcgaactcc ccgtggatgc cagattcccc ccccgcgtgc

780

caaagtcctt cccctttaac acctccgtgg tgtacaagaa aaccctcttt gtcgagttca

840

ctgaccacct gttcaacatc gccaagccgc gcccaccttg gatgggcctc ctgggaccga

900

ccattcaagc tgaagtgtac gacaccgtgg tgatcaccct gaagaacatg gcgtcccacc

960

ccgtgtccct gcatgcggtc ggagtgtcct actggaaggc ctccgaagga gctgagtacg

1020

acgaccagac tagccagcgg gaaaaggagg acgataaagt gttcccgggc ggctcgcata

1080

cttacgtgtg gcaagtcctg aaggaaaacg gacctatggc atccgatcct ctgtgcctga

1140

cttactccta cctttcccat gtggacctcg tgaaggacct gaacagcggg ctgattggtg

1200

cacttctcgt gtgccgcgaa ggttcgctcg ctaaggaaaa gacccagacc ctccataagt

1260

tcatcctttt gttcgctgtg ttcgatgaag gaaagtcatg gcattccgaa actaagaact

1320

cgctgatgca ggaccgggat gccgcctcag cccgcgcctg gcctaaaatg catacagtca

1380

acggatacgt gaatcggtca ctgcccgggc tcatcggttg tcacagaaag tccgtgtact

1440

ggcacgtcat cggcatgggc actacgcctg aagtgcactc catcttcctg gaagggcaca

1500

ccttcctcgt gcgcaaccac cgccaggcct ctctggaaat ctccccgatt acctttctga

1560

ccgcccagac tctgctcatg gacctggggc agttccttct cttctgccac atctccagcc

1620

atcagcacga cggaatggag gcctacgtga aggtggactc atgcccggaa gaacctcagt

1680

tgcggatgaa gaacaacgag gaggccgagg actatgacga cgatttgact gactccgaga

1740

tggacgtcgt gcggttcgat gacgacaaca gccccagctt catccagatt cgcagcgtgg

1800

ccaagaagca ccccaaaacc tgggtgcact acatcgcggc cgaggaagaa gattgggact

1860

acgccccgtt ggtgctggca cccgatgacc ggtcgtacaa gtcccagtat ctgaacaatg

1920

gtccgcagcg gattggcaga aagtacaaga aagtgcggtt catggcgtac actgacgaaa

1980

cgtttaagac ccgggaggcc attcaacatg agagcggcat tctgggacca ctgctgtacg

2040

gagaggtcgg cgataccctg ctcatcatct tcaaaaacca ggcctcccgg ccttacaaca

2100

tctaccctca cggaatcacc gacgtgcggc cactctactc gcggcgcctg ccgaagggcg

2160

tcaagcacct gaaagacttc cctatcctgc cgggcgaaat cttcaagtat aagtggaccg

2220

tcaccgtgga ggacgggccc accaagagcg atcctaggtg tctgactcgg tactactcca

2280

gcttcgtgaa catggaacgg gacctggcat cgggactcat tggaccgctg ctgatctgct

2340

acaaagagtc ggtggatcaa cgcggcaacc agatcatgtc cgacaagcgc aacgtgatcc

2400

tgttctccgt gtttgatgaa aacagatcct ggtacctcac tgaaaacatc cagaggttcc

2460

tcccaaaccc cgcaggagtg caactggagg accctgagtt tcaggcctcg aatatcatgc

2520

actcgattaa cggttacgtg ttcgactcgc tgcaactgag cgtgtgcctc catgaagtcg

2580

cttactggta cattctgtcc atcggcgccc agactgactt cctgagcgtg ttcttttccg

2640

gttacacctt taagcacaag atggtgtacg aagataccct gaccctgttc cctttctccg

2700

gcgaaacggt gttcatgtcg atggagaacc cgggtctgtg gattctggga tgccacaaca

2760

gcgactttcg gaaccgcgga atgactgccc tgctgaaggt gtcctcatgc gacaagaaca

2820

ccggagacta ctacgaggac tcctacgagg atatctcagc ctacctcctg tccaagaaca

2880

acgcgatcga gccgcgcagc ttcagccaga acggcgcgcc aacatcagag agcgccaccc

2940

ctgaaagtgg tcccgggagc gagccagcca catctgggtc ggaaacgcca ggcacaagtg

3000

agtctgcaac tcccgagtcc ggacctggct ccgagcctgc cactagcggc tccgagactc

3060

cgggaacttc cgagagcgct acaccagaaa gcggacccgg aaccagtacc gaacctagcg

3120

agggctctgc tccgggcagc ccagccggct ctcctacatc cacggaggag ggcacttccg

3180

aatccgccac cccggagtca gggccaggat ctgaacccgc tacctcaggc agtgagacgc

3240

caggaacgag cgagtccgct acaccggaga gtgggccagg gagccctgct ggatctccta

3300

cgtccactga ggaagggtca ccagcgggct cgcccaccag cactgaagaa ggtgcctcga

3360

gcccgcctgt gctgaagagg caccagcgag aaattacccg gaccaccctc caatcggatc

3420

aggaggaaat cgactacgac gacaccatct cggtggaaat gaagaaggaa gatttcgata

3480

tctacgacga ggacgaaaat cagtcccctc gctcattcca aaagaaaact agacactact

3540

ttatcgccgc ggtggaaaga ctgtgggact atggaatgtc atccagccct cacgtccttc

3600

ggaaccgggc ccagagcgga tcggtgcctc agttcaagaa agtggtgttc caggagttca

3660

ccgacggcag cttcacccag ccgctgtacc ggggagaact gaacgaacac ctgggcctgc

3720

tcggtcccta catccgcgcg gaagtggagg ataacatcat ggtgaccttc cgtaaccaag

3780

catccagacc ttactccttc tattcctccc tgatctcata cgaggaggac cagcgccaag

3840

gcgccgagcc ccgcaagaac ttcgtcaagc ccaacgagac taagacctac ttctggaagg

3900

tccaacacca tatggccccg accaaggatg agtttgactg caaggcctgg gcctacttct

3960

ccgacgtgga ccttgagaag gatgtccatt ccggcctgat cgggccgctg ctcgtgtgtc

4020

acaccaacac cctgaaccca gcgcatggac gccaggtcac cgtccaggag tttgctctgt

4080

tcttcaccat ttttgacgaa actaagtcct ggtacttcac cgagaatatg gagcgaaact

4140

gtagagcgcc ctgcaatatc cagatggaag atccgacttt caaggagaac tatagattcc

4200

acgccatcaa cgggtacatc atggatactc tgccggggct ggtcatggcc caggatcaga

4260

ggattcggtg gtacttgctg tcaatgggat cgaacgaaaa cattcactcc attcacttct

4320

ccggtcacgt gttcactgtg cgcaagaagg aggagtacaa gatggcgctg tacaatctgt

4380

accccggggt gttcgaaact gtggagatgc tgccgtccaa ggccggcatc tggagagtgg

4440

agtgcctgat cggagagcac ctccacgcgg ggatgtccac cctcttcctg gtgtactcga

4500

ataagtgcca gaccccgctg ggcatggcct cgggccacat cagagacttc cagatcacag

4560

caagcggaca atacggccaa tgggcgccga agctggcccg cttgcactac tccggatcga

4620

tcaacgcatg gtccaccaag gaaccgttct cgtggattaa ggtggacctc ctggccccta

4680

tgattatcca cggaattaag acccagggcg ccaggcagaa gttctcctcc ctgtacatct

4740

cgcaattcat catcatgtac agcctggacg ggaagaagtg gcagacttac aggggaaact

4800

ccaccggcac cctgatggtc tttttcggca acgtggattc ctccggcatt aagcacaaca

4860

tcttcaaccc accgatcata gccagatata ttaggctcca ccccactcac tactcaatcc

4920

gctcaactct tcggatggaa ctcatggggt gcgacctgaa ctcctgctcc atgccgttgg

4980

ggatggaatc aaaggctatt agcgacgccc agatcaccgc gagctcctac ttcactaaca

5040

tgttcgccac ctggagcccc tccaaggcca ggctgcactt gcagggacgg tcaaatgcct

5100

ggcggccgca agtgaacaat ccgaaggaat ggcttcaagt ggatttccaa aagaccatga

5160

aagtgaccgg agtcaccacc cagggagtga agtcccttct gacctcgatg tatgtgaagg

5220

agttcctgat tagcagcagc caggacgggc accagtggac cctgttcttc caaaacggaa

5280

aggtcaaggt gttccagggg aaccaggact cgttcacacc cgtggtgaac tccctggacc

5340

ccccactgct gacgcggtac ttgaggattc atcctcagtc ctgggtccat cagattgcat

5400

tgcgaatgga agtcctgggc tgcgaggccc aggacctgta ctgaatcagc ctgagctcgc

5460

tgatcataat caacctctgg attacaaaat ttgtgaaaga ttgactggta ttcttaacta

5520

tgttgctcct tttacgctat gtggatacgc tgctttaatg cctttgtatc atgctattgc

5580

ttcccgtatg gctttcattt tctcctcctt gtataaatcc tggttgctgt ctctttatga

5640

ggagttgtgg cccgttgtca ggcaacgtgg cgtggtgtgc actgtgtttg ctgacgcaac

5700

ccccactggt tggggcattg ccaccacctg tcagctcctt tccgggactt tcgctttccc

5760

cctccctatt gccacggcgg aactcatcgc cgcctgcctt gcccgctgct ggacaggggc

5820

tcggctgttg ggcactgaca attccgtggt gttgtcgggg aaatcatcgt cctttccttg

5880

gctgctcgcc tgtgttgcca cctggattct gcgcgggacg tccttctgct acgtcccttc

5940

ggccctcaat ccagcggacc ttccttcccg cggcctgctg ccggctctgc ggcctcttcc

6000

gcgtcttcgc cttcgccctc agacgagtcg gatctccctt tgggccgcct ccccgctgat

6060

cagcctcgac tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt

6120

ccttgaccct ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat

6180

cgcattgtct gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg

6240

gggaggattg ggaagacaat agcaggcatg ctggggatgc ggtgggctct atggcttctg

6300

aggcggaaag aacgggctcg agaagcttct agatatcctc tcttaaggta gcatcgagat

6360

ttaaattagg gataacaggg taatggcgcg ggccgcagga acccctagtg atggagttgg

6420

ccactccctc tctgcgcgct cgctcgctca ctgaggccgg gcgaccaaag gtcgcccgac

6480

gcccgggctt tgcccgggcg gcctcagtga gcgagcgagc gcgcag

6526

<210> 111

<211> 130

<212> ДНК

<213> Искусственная последовательность

<220>

<223> 5'-ITR (инвертированный концевой повтор AAV2 на 5'-конце)

<400> 111

ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt

60

ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact

120

aggggttcct

130

<210> 112

<211> 142

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Каркасная последовательность плазмиды (PBS)-1

<400> 112

gcggcaattc agtcgataac tataacggtc ctaaggtagc gatttaaata cgcgctctct

60

taaggtagcc ccgggacgcg tcaattgaga tctggatccg gtaccgaatt cgcggccgcc

120

tcgacgacta gcgtttaatt aa

142

<210> 113

<211> 229

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TTPp (специфический для печени промотор)

<400> 113

acgcgtgtct gtctgcacat ttcgtagagc gagtgttccg atactctaat ctccctaggc

60

aaggttcata tttgtgtagg ttacttattc tccttttgtt gactaagtca ataatcagaa

120

tcagcaggtt tggagtcagc ttggcaggga tcagcagcct gggttggaag gagggggtat

180

aaaagcccct tcaccaggag aagccgtcac acagatccac aagctcctg

229

<210> 114

<211> 2

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Каркасная последовательность плазмиды (PBS)-2

<400> 114

ag

2

<210> 115

<211> 106

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Синтетический интрон

<400> 115

gtaagtgccg tgtgtggttc ccgcgggcct ggcctcttta cgggttatgg cccttgcgtg

60

ccttgaatta ctgacactga catccacttt ttctttttct ccacag

106

<210> 116

<211> 11

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Каркасная последовательность плазмиды (PBS)-3

<400> 116

ctagcgccac c

11

<210> 117

<211> 4824

<212> ДНК

<213> Искусственная последовательность

<220>

<223> FVIIIco6XTEN (открытая рамка считывания для оптимизированного

по кодонам FVIII варианта 6, содержащего XTEN144)

<400> 117

atgcagattg agctgtccac ttgtttcttc ctgtgcctcc tgcgcttctg tttctccgcc

60

actcgccggt actaccttgg agccgtggag ctttcatggg actacatgca gagcgacctg

120

ggcgaactcc ccgtggatgc cagattcccc ccccgcgtgc caaagtcctt cccctttaac

180

acctccgtgg tgtacaagaa aaccctcttt gtcgagttca ctgaccacct gttcaacatc

240

gccaagccgc gcccaccttg gatgggcctc ctgggaccga ccattcaagc tgaagtgtac

300

gacaccgtgg tgatcaccct gaagaacatg gcgtcccacc ccgtgtccct gcatgcggtc

360

ggagtgtcct actggaaggc ctccgaagga gctgagtacg acgaccagac tagccagcgg

420

gaaaaggagg acgataaagt gttcccgggc ggctcgcata cttacgtgtg gcaagtcctg

480

aaggaaaacg gacctatggc atccgatcct ctgtgcctga cttactccta cctttcccat

540

gtggacctcg tgaaggacct gaacagcggg ctgattggtg cacttctcgt gtgccgcgaa

600

ggttcgctcg ctaaggaaaa gacccagacc ctccataagt tcatcctttt gttcgctgtg

660

ttcgatgaag gaaagtcatg gcattccgaa actaagaact cgctgatgca ggaccgggat

720

gccgcctcag cccgcgcctg gcctaaaatg catacagtca acggatacgt gaatcggtca

780

ctgcccgggc tcatcggttg tcacagaaag tccgtgtact ggcacgtcat cggcatgggc

840

actacgcctg aagtgcactc catcttcctg gaagggcaca ccttcctcgt gcgcaaccac

900

cgccaggcct ctctggaaat ctccccgatt acctttctga ccgcccagac tctgctcatg

960

gacctggggc agttccttct cttctgccac atctccagcc atcagcacga cggaatggag

1020

gcctacgtga aggtggactc atgcccggaa gaacctcagt tgcggatgaa gaacaacgag

1080

gaggccgagg actatgacga cgatttgact gactccgaga tggacgtcgt gcggttcgat

1140

gacgacaaca gccccagctt catccagatt cgcagcgtgg ccaagaagca ccccaaaacc

1200

tgggtgcact acatcgcggc cgaggaagaa gattgggact acgccccgtt ggtgctggca

1260

cccgatgacc ggtcgtacaa gtcccagtat ctgaacaatg gtccgcagcg gattggcaga

1320

aagtacaaga aagtgcggtt catggcgtac actgacgaaa cgtttaagac ccgggaggcc

1380

attcaacatg agagcggcat tctgggacca ctgctgtacg gagaggtcgg cgataccctg

1440

ctcatcatct tcaaaaacca ggcctcccgg ccttacaaca tctaccctca cggaatcacc

1500

gacgtgcggc cactctactc gcggcgcctg ccgaagggcg tcaagcacct gaaagacttc

1560

cctatcctgc cgggcgaaat cttcaagtat aagtggaccg tcaccgtgga ggacgggccc

1620

accaagagcg atcctaggtg tctgactcgg tactactcca gcttcgtgaa catggaacgg

1680

gacctggcat cgggactcat tggaccgctg ctgatctgct acaaagagtc ggtggatcaa

1740

cgcggcaacc agatcatgtc cgacaagcgc aacgtgatcc tgttctccgt gtttgatgaa

1800

aacagatcct ggtacctcac tgaaaacatc cagaggttcc tcccaaaccc cgcaggagtg

1860

caactggagg accctgagtt tcaggcctcg aatatcatgc actcgattaa cggttacgtg

1920

ttcgactcgc tgcaactgag cgtgtgcctc catgaagtcg cttactggta cattctgtcc

1980

atcggcgccc agactgactt cctgagcgtg ttcttttccg gttacacctt taagcacaag

2040

atggtgtacg aagataccct gaccctgttc cctttctccg gcgaaacggt gttcatgtcg

2100

atggagaacc cgggtctgtg gattctggga tgccacaaca gcgactttcg gaaccgcgga

2160

atgactgccc tgctgaaggt gtcctcatgc gacaagaaca ccggagacta ctacgaggac

2220

tcctacgagg atatctcagc ctacctcctg tccaagaaca acgcgatcga gccgcgcagc

2280

ttcagccaga acggcgcgcc aacatcagag agcgccaccc ctgaaagtgg tcccgggagc

2340

gagccagcca catctgggtc ggaaacgcca ggcacaagtg agtctgcaac tcccgagtcc

2400

ggacctggct ccgagcctgc cactagcggc tccgagactc cgggaacttc cgagagcgct

2460

acaccagaaa gcggacccgg aaccagtacc gaacctagcg agggctctgc tccgggcagc

2520

ccagccggct ctcctacatc cacggaggag ggcacttccg aatccgccac cccggagtca

2580

gggccaggat ctgaacccgc tacctcaggc agtgagacgc caggaacgag cgagtccgct

2640

acaccggaga gtgggccagg gagccctgct ggatctccta cgtccactga ggaagggtca

2700

ccagcgggct cgcccaccag cactgaagaa ggtgcctcga gcccgcctgt gctgaagagg

2760

caccagcgag aaattacccg gaccaccctc caatcggatc aggaggaaat cgactacgac

2820

gacaccatct cggtggaaat gaagaaggaa gatttcgata tctacgacga ggacgaaaat

2880

cagtcccctc gctcattcca aaagaaaact agacactact ttatcgccgc ggtggaaaga

2940

ctgtgggact atggaatgtc atccagccct cacgtccttc ggaaccgggc ccagagcgga

3000

tcggtgcctc agttcaagaa agtggtgttc caggagttca ccgacggcag cttcacccag

3060

ccgctgtacc ggggagaact gaacgaacac ctgggcctgc tcggtcccta catccgcgcg

3120

gaagtggagg ataacatcat ggtgaccttc cgtaaccaag catccagacc ttactccttc

3180

tattcctccc tgatctcata cgaggaggac cagcgccaag gcgccgagcc ccgcaagaac

3240

ttcgtcaagc ccaacgagac taagacctac ttctggaagg tccaacacca tatggccccg

3300

accaaggatg agtttgactg caaggcctgg gcctacttct ccgacgtgga ccttgagaag

3360

gatgtccatt ccggcctgat cgggccgctg ctcgtgtgtc acaccaacac cctgaaccca

3420

gcgcatggac gccaggtcac cgtccaggag tttgctctgt tcttcaccat ttttgacgaa

3480

actaagtcct ggtacttcac cgagaatatg gagcgaaact gtagagcgcc ctgcaatatc

3540

cagatggaag atccgacttt caaggagaac tatagattcc acgccatcaa cgggtacatc

3600

atggatactc tgccggggct ggtcatggcc caggatcaga ggattcggtg gtacttgctg

3660

tcaatgggat cgaacgaaaa cattcactcc attcacttct ccggtcacgt gttcactgtg

3720

cgcaagaagg aggagtacaa gatggcgctg tacaatctgt accccggggt gttcgaaact

3780

gtggagatgc tgccgtccaa ggccggcatc tggagagtgg agtgcctgat cggagagcac

3840

ctccacgcgg ggatgtccac cctcttcctg gtgtactcga ataagtgcca gaccccgctg

3900

ggcatggcct cgggccacat cagagacttc cagatcacag caagcggaca atacggccaa

3960

tgggcgccga agctggcccg cttgcactac tccggatcga tcaacgcatg gtccaccaag

4020

gaaccgttct cgtggattaa ggtggacctc ctggccccta tgattatcca cggaattaag

4080

acccagggcg ccaggcagaa gttctcctcc ctgtacatct cgcaattcat catcatgtac

4140

agcctggacg ggaagaagtg gcagacttac aggggaaact ccaccggcac cctgatggtc

4200

tttttcggca acgtggattc ctccggcatt aagcacaaca tcttcaaccc accgatcata

4260

gccagatata ttaggctcca ccccactcac tactcaatcc gctcaactct tcggatggaa

4320

ctcatggggt gcgacctgaa ctcctgctcc atgccgttgg ggatggaatc aaaggctatt

4380

agcgacgccc agatcaccgc gagctcctac ttcactaaca tgttcgccac ctggagcccc

4440

tccaaggcca ggctgcactt gcagggacgg tcaaatgcct ggcggccgca agtgaacaat

4500

ccgaaggaat ggcttcaagt ggatttccaa aagaccatga aagtgaccgg agtcaccacc

4560

cagggagtga agtcccttct gacctcgatg tatgtgaagg agttcctgat tagcagcagc

4620

caggacgggc accagtggac cctgttcttc caaaacggaa aggtcaaggt gttccagggg

4680

aaccaggact cgttcacacc cgtggtgaac tccctggacc ccccactgct gacgcggtac

4740

ttgaggattc atcctcagtc ctgggtccat cagattgcat tgcgaatgga agtcctgggc

4800

tgcgaggccc aggacctgta ctga

4824

<210> 118

<211> 450

<212> ДНК

<213> Искусственная последовательность

<220>

<223> XTEN144

<400> 118

ggcgcgccaa catcagagag cgccacccct gaaagtggtc ccgggagcga gccagccaca

60

tctgggtcgg aaacgccagg cacaagtgag tctgcaactc ccgagtccgg acctggctcc

120

gagcctgcca ctagcggctc cgagactccg ggaacttccg agagcgctac accagaaagc

180

ggacccggaa ccagtaccga acctagcgag ggctctgctc cgggcagccc agccggctct

240

cctacatcca cggaggaggg cacttccgaa tccgccaccc cggagtcagg gccaggatct

300

gaacccgcta cctcaggcag tgagacgcca ggaacgagcg agtccgctac accggagagt

360

gggccaggga gccctgctgg atctcctacg tccactgagg aagggtcacc agcgggctcg

420

cccaccagca ctgaagaagg tgcctcgagc

450

<210> 119

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Каркасная последовательность плазмиды (PBS)-4

<400> 119

atcagcctga gctcgctga

19

<210> 120

<211> 595

<212> ДНК

<213> Искусственная последовательность

<220>

<223> WPRE (мутантный посттранскрипционный регуляторный элемент

вируса гепатита сурков)

<400> 120

tcataatcaa cctctggatt acaaaatttg tgaaagattg actggtattc ttaactatgt

60

tgctcctttt acgctatgtg gatacgctgc tttaatgcct ttgtatcatg ctattgcttc

120

ccgtatggct ttcattttct cctccttgta taaatcctgg ttgctgtctc tttatgagga

180

gttgtggccc gttgtcaggc aacgtggcgt ggtgtgcact gtgtttgctg acgcaacccc

240

cactggttgg ggcattgcca ccacctgtca gctcctttcc gggactttcg ctttccccct

300

ccctattgcc acggcggaac tcatcgccgc ctgccttgcc cgctgctgga caggggctcg

360

gctgttgggc actgacaatt ccgtggtgtt gtcggggaaa tcatcgtcct ttccttggct

420

gctcgcctgt gttgccacct ggattctgcg cgggacgtcc ttctgctacg tcccttcggc

480

cctcaatcca gcggaccttc cttcccgcgg cctgctgccg gctctgcggc ctcttccgcg

540

tcttcgcctt cgccctcaga cgagtcggat ctccctttgg gccgcctccc cgctg

595

<210> 121

<211> 8

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Каркасная последовательность плазмиды (PBS)-5

<400> 121

atcagcct

8

<210> 122

<211> 211

<212> ДНК

<213> Искусственная последовательность

<220>

<223> bGHpA (сигнал полиаденилирования бычьего гормона роста)

<400> 122

cgactgtgcc ttctagttgc cagccatctg ttgtttgccc ctcccccgtg ccttccttga

60

ccctggaagg tgccactccc actgtccttt cctaataaaa tgaggaaatt gcatcgcatt

120

gtctgagtag gtgtcattct attctggggg gtggggtggg gcaggacagc aagggggagg

180

attgggaaga caatagcagg catgctgggg a

211

<210> 123

<211> 119

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Каркасная последовательность плазмиды (PBS)-6

<400> 123

tgcggtgggc tctatggctt ctgaggcgga aagaacgggc tcgagaagct tctagatatc

60

ctctcttaag gtagcatcga gatttaaatt agggataaca gggtaatggc gcgggccgc

119

<210> 124

<211> 130

<212> ДНК

<213> Искусственная последовательность

<220>

<223> 3'-ITR (инвертированный концевой повтор AAV2 на 3'-конце)

<400> 124

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg

60

ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc

120

gagcgcgcag

130

<210> 125

<211> 415

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Зрелый полипептид FIX

<400> 125

Tyr Asn Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg

1. 5 10 15

Glu Cys Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe

20 25 30

Glu Asn Thr Glu Arg Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly

35 40 45

Asp Gln Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp

50 55 60

Asp Ile Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys

65 70 75 80

Asn Cys Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu

85 90 95

Gln Phe Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr

100 105 110

Glu Gly Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val

115 120 125

Pro Phe Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr

130 135 140

Arg Ala Glu Thr Val Phe Pro Asp Val Asp Tyr Val Asn Ser Thr Glu

145 150 155 160

Ala Glu Thr Ile Leu Asp Asn Ile Thr Gln Ser Thr Gln Ser Phe Asn

165 170 175

Asp Phe Thr Arg Val Val Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe

180 185 190

Pro Trp Gln Val Val Leu Asn Gly Lys Val Asp Ala Phe Cys Gly Gly

195 200 205

Ser Ile Val Asn Glu Lys Trp Ile Val Thr Ala Ala His Cys Val Glu

210 215 220

Thr Gly Val Lys Ile Thr Val Val Ala Gly Glu His Asn Ile Glu Glu

225 230 235 240

Thr Glu His Thr Glu Gln Lys Arg Asn Val Ile Arg Ile Ile Pro His

245 250 255

His Asn Tyr Asn Ala Ala Ile Asn Lys Tyr Asn His Asp Ile Ala Leu

260 265 270

Leu Glu Leu Asp Glu Pro Leu Val Leu Asn Ser Tyr Val Thr Pro Ile

275 280 285

Cys Ile Ala Asp Lys Glu Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser

290 295 300

Gly Tyr Val Ser Gly Trp Gly Arg Val Phe His Lys Gly Arg Ser Ala

305 310 315 320

Leu Val Leu Gln Tyr Leu Arg Val Pro Leu Val Asp Arg Ala Thr Cys

325 330 335

Leu Arg Ser Thr Lys Phe Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly

340 345 350

Phe His Glu Gly Gly Arg Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro

355 360 365

His Val Thr Glu Val Glu Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser

370 375 380

Trp Gly Glu Glu Cys Ala Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys

385 390 395 400

Val Ser Arg Tyr Val Asn Trp Ile Lys Glu Lys Thr Lys Leu Thr

405 410 415

<210> 126

<211> 415

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Зрелый полипептид Padua(R338L)FIX

<400> 126

Tyr Asn Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg

1. 5 10 15

Glu Cys Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe

20 25 30

Glu Asn Thr Glu Arg Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly

35 40 45

Asp Gln Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp

50 55 60

Asp Ile Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys

65 70 75 80

Asn Cys Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu

85 90 95

Gln Phe Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr

100 105 110

Glu Gly Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val

115 120 125

Pro Phe Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr

130 135 140

Arg Ala Glu Thr Val Phe Pro Asp Val Asp Tyr Val Asn Ser Thr Glu

145 150 155 160

Ala Glu Thr Ile Leu Asp Asn Ile Thr Gln Ser Thr Gln Ser Phe Asn

165 170 175

Asp Phe Thr Arg Val Val Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe

180 185 190

Pro Trp Gln Val Val Leu Asn Gly Lys Val Asp Ala Phe Cys Gly Gly

195 200 205

Ser Ile Val Asn Glu Lys Trp Ile Val Thr Ala Ala His Cys Val Glu

210 215 220

Thr Gly Val Lys Ile Thr Val Val Ala Gly Glu His Asn Ile Glu Glu

225 230 235 240

Thr Glu His Thr Glu Gln Lys Arg Asn Val Ile Arg Ile Ile Pro His

245 250 255

His Asn Tyr Asn Ala Ala Ile Asn Lys Tyr Asn His Asp Ile Ala Leu

260 265 270

Leu Glu Leu Asp Glu Pro Leu Val Leu Asn Ser Tyr Val Thr Pro Ile

275 280 285

Cys Ile Ala Asp Lys Glu Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser

290 295 300

Gly Tyr Val Ser Gly Trp Gly Arg Val Phe His Lys Gly Arg Ser Ala

305 310 315 320

Leu Val Leu Gln Tyr Leu Arg Val Pro Leu Val Asp Arg Ala Thr Cys

325 330 335

Leu Leu Ser Thr Lys Phe Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly

340 345 350

Phe His Glu Gly Gly Arg Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro

355 360 365

His Val Thr Glu Val Glu Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser

370 375 380

Trp Gly Glu Glu Cys Ala Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys

385 390 395 400

Val Ser Arg Tyr Val Asn Trp Ile Lys Glu Lys Thr Lys Leu Thr

405 410 415

<210> 127

<211> 46

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> FIX сигнальный полипептид и пропептид

<400> 127

Met Gln Arg Val Asn Met Ile Met Ala Glu Ser Pro Gly Leu Ile Thr

1. 5 10 15

Ile Cys Leu Leu Gly Tyr Leu Leu Ser Ala Glu Cys Thr Val Phe Leu

20 25 30

Asp His Glu Asn Ala Asn Lys Ile Leu Asn Arg Pro Lys Arg

35 40 45

<210> 128

<211> 8442

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Человеческий VWF

<400> 128

atgattcctg ccagatttgc cggggtgctg cttgctctgg ccctcatttt gccagggacc

60

ctttgtgcag aaggaactcg cggcaggtca tccacggccc gatgcagcct tttcggaagt

120

gacttcgtca acacctttga tgggagcatg tacagctttg cgggatactg cagttacctc

180

ctggcagggg gctgccagaa acgctccttc tcgattattg gggacttcca gaatggcaag

240

agagtgagcc tctccgtgta tcttggggaa ttttttgaca tccatttgtt tgtcaatggt

300

accgtgacac agggggacca aagagtctcc atgccctatg cctccaaagg gctgtatcta

360

gaaactgagg ctgggtacta caagctgtcc ggtgaggcct atggctttgt ggccaggatc

420

gatggcagcg gcaactttca agtcctgctg tcagacagat acttcaacaa gacctgcggg

480

ctgtgtggca actttaacat ctttgctgaa gatgacttta tgacccaaga agggaccttg

540

acctcggacc cttatgactt tgccaactca tgggctctga gcagtggaga acagtggtgt

600

gaacgggcat ctcctcccag cagctcatgc aacatctcct ctggggaaat gcagaagggc

660

ctgtgggagc agtgccagct tctgaagagc acctcggtgt ttgcccgctg ccaccctctg

720

gtggaccccg agccttttgt ggccctgtgt gagaagactt tgtgtgagtg tgctgggggg

780

ctggagtgcg cctgccctgc cctcctggag tacgcccgga cctgtgccca ggagggaatg

840

gtgctgtacg gctggaccga ccacagcgcg tgcagcccag tgtgccctgc tggtatggag

900

tataggcagt gtgtgtcccc ttgcgccagg acctgccaga gcctgcacat caatgaaatg

960

tgtcaggagc gatgcgtgga tggctgcagc tgccctgagg gacagctcct ggatgaaggc

1020

ctctgcgtgg agagcaccga gtgtccctgc gtgcattccg gaaagcgcta ccctcccggc

1080

acctccctct ctcgagactg caacacctgc atttgccgaa acagccagtg gatctgcagc

1140

aatgaagaat gtccagggga gtgccttgtc actggtcaat cccacttcaa gagctttgac

1200

aacagatact tcaccttcag tgggatctgc cagtacctgc tggcccggga ttgccaggac

1260

cactccttct ccattgtcat tgagactgtc cagtgtgctg atgaccgcga cgctgtgtgc

1320

acccgctccg tcaccgtccg gctgcctggc ctgcacaaca gccttgtgaa actgaagcat

1380

ggggcaggag ttgccatgga tggccaggac atccagctcc ccctcctgaa aggtgacctc

1440

cgcatccagc atacagtgac ggcctccgtg cgcctcagct acggggagga cctgcagatg

1500

gactgggatg gccgcgggag gctgctggtg aagctgtccc ccgtctatgc cgggaagacc

1560

tgcggcctgt gtgggaatta caatggcaac cagggcgacg acttccttac cccctctggg

1620

ctggcrgagc cccgggtgga ggacttcggg aacgcctgga agctgcacgg ggactgccag

1680

gacctgcaga agcagcacag cgatccctgc gccctcaacc cgcgcatgac caggttctcc

1740

gaggaggcgt gcgcggtcct gacgtccccc acattcgagg cctgccatcg tgccgtcagc

1800

ccgctgccct acctgcggaa ctgccgctac gacgtgtgct cctgctcgga cggccgcgag

1860

tgcctgtgcg gcgccctggc cagctatgcc gcggcctgcg cggggagagg cgtgcgcgtc

1920

gcgtggcgcg agccaggccg ctgtgagctg aactgcccga aaggccaggt gtacctgcag

1980

tgcgggaccc cctgcaacct gacctgccgc tctctctctt acccggatga ggaatgcaat

2040

gaggcctgcc tggagggctg cttctgcccc ccagggctct acatggatga gaggggggac

2100

tgcgtgccca aggcccagtg cccctgttac tatgacggtg agatcttcca gccagaagac

2160

atcttctcag accatcacac catgtgctac tgtgaggatg gcttcatgca ctgtaccatg

2220

agtggagtcc ccggaagctt gctgcctgac gctgtcctca gcagtcccct gtctcatcgc

2280

agcaaaagga gcctatcctg tcggcccccc atggtcaagc tggtgtgtcc cgctgacaac

2340

ctgcgggctg aagggctcga gtgtaccaaa acgtgccaga actatgacct ggagtgcatg

2400

agcatgggct gtgtctctgg ctgcctctgc cccccgggca tggtccggca tgagaacaga

2460

tgtgtggccc tggaaaggtg tccctgcttc catcagggca aggagtatgc ccctggagaa

2520

acagtgaaga ttggctgcaa cacttgtgtc tgtcgggacc ggaagtggaa ctgcacagac

2580

catgtgtgtg atgccacgtg ctccacgatc ggcatggccc actacctcac cttcgacggg

2640

ctcaaatacc tgttccccgg ggagtgccag tacgttctgg tgcaggatta ctgcggcagt

2700

aaccctggga cctttcggat cctagtgggg aataagggat gcagccaccc ctcagtgaaa

2760

tgcaagaaac gggtcaccat cctggtggag ggaggagaga ttgagctgtt tgacggggag

2820

gtgaatgtga agaggcccat gaaggatgag actcactttg aggtggtgga gtctggccgg

2880

tacatcattc tgctgctggg caaagccctc tccgtggtct gggaccgcca cctgagcatc

2940

tccgtggtcc tgaagcagac ataccaggag aaagtgtgtg gcctgtgtgg gaattttgat

3000

ggcatccaga acaatgacct caccagcagc aacctccaag tggaggaaga ccctgtggac

3060

tttgggaact cctggaaagt gagctcgcag tgtgctgaca ccagaaaagt gcctctggac

3120

tcatcccctg ccacctgcca taacaacatc atgaagcaga cgatggtgga ttcctcctgt

3180

agaatcctta ccagtgacgt cttccaggac tgcaacaagc tggtggaccc cgagccatat

3240

ctggatgtct gcatttacga cacctgctcc tgtgagtcca ttggggactg cgcctgcttc

3300

tgcgacacca ttgctgccta tgcccacgtg tgtgcccagc atggcaaggt ggtgacctgg

3360

aggacggcca cattgtgccc ccagagctgc gaggagagga atctccggga gaacgggtat

3420

gagtgtgagt ggcgctataa cagctgtgca cctgcctgtc aagtcacgtg tcagcaccct

3480

gagccactgg cctgccctgt gcagtgtgtg gagggctgcc atgcccactg ccctccaggg

3540

aaaatcctgg atgagctttt gcagacctgc gttgaccctg aagactgtcc agtgtgtgag

3600

gtggctggcc ggcgttttgc ctcaggaaag aaagtcacct tgaatcccag tgaccctgag

3660

cactgccaga tttgccactg tgatgttgtc aacctcacct gtgaagcctg ccaggagccg

3720

ggaggcctgg tggtgcctcc cacagatgcc ccggtgagcc ccaccactct gtatgtggag

3780

gacatctcgg aaccgccgtt gcacgatttc tactgcagca ggctactgga cctggtcttc

3840

ctgctggatg gctcctccag gctgtccgag gctgagtttg aagtgctgaa ggcctttgtg

3900

gtggacatga tggagcggct gcgcatctcc cagaagtggg tccgcgtggc cgtggtggag

3960

taccacgacg gctcccacgc ctacatcggg ctcaaggacc ggaagcgacc gtcagagctg

4020

cggcgcattg ccagccaggt gaagtatgcg ggcagccagg tggcctccac cagcgaggtc

4080

ttgaaataca cactgttcca aatcttcagc aagatcgacc gccctgaagc ctcccgcatc

4140

gccctgctcc tgatggccag ccaggagccc caacggatgt cccggaactt tgtccgctac

4200

gtccagggcc tgaagaagaa gaaggtcatt gtgatcccgg tgggcattgg gccccatgcc

4260

aacctcaagc agatccgcct catcgagaag caggcccctg agaacaaggc cttcgtgctg

4320

agcagtgtgg atgagctgga gcagcaaagg gacgagatcg ttagctacct ctgtgacctt

4380

gcccctgaag cccctcctcc tactctgccc cccgacatgg cacaagtcac tgtgggcccg

4440

gggctcttgg gggtttcgac cctggggccc aagaggaact ccatggttct ggatgtggcg

4500

ttcgtcctgg aaggatcgga caaaattggt gaagccgact tcaacaggag caaggagttc

4560

atggaggagg tgattcagcg gatggatgtg ggccaggaca gcatccacgt cacggtgctg

4620

cagtactcct acatggtgac cgtggagtac cccttcagcg aggcacagtc caaaggggac

4680

atcctgcagc gggtgcgaga gatccgctac cagggcggca acaggaccaa cactgggctg

4740

gccctgcggt acctctctga ccacagcttc ttggtcagcc agggtgaccg ggagcaggcg

4800

cccaacctgg tctacatggt caccggaaat cctgcctctg atgagatcaa gaggctgcct

4860

ggagacatcc aggtggtgcc cattggagtg ggccctaatg ccaacgtgca ggagctggag

4920

aggattggct ggcccaatgc ccctatcctc atccaggact ttgagacgct cccccgagag

4980

gctcctgacc tggtgctgca gaggtgctgc tccggagagg ggctgcagat ccccaccctc

5040

tcccctgcac ctgactgcag ccagcccctg gacgtgatcc ttctcctgga tggctcctcc

5100

agtttcccag cttcttattt tgatgaaatg aagagtttcg ccaaggcttt catttcaaaa

5160

gccaatatag ggcctcgtct cactcaggtg tcagtgctgc agtatggaag catcaccacc

5220

attgacgtgc catggaacgt ggtcccggag aaagcccatt tgctgagcct tgtggacgtc

5280

atgcagcggg agggaggccc cagccaaatc ggggatgcct tgggctttgc tgtgcgatac

5340

ttgacttcag aaatgcatgg tgccaggccg ggagcctcaa aggcggtggt catcctggtc

5400

acggacgtct ctgtggattc agtggatgca gcagctgatg ccgccaggtc caacagagtg

5460

acagtgttcc ctattggaat tggagatcgc tacgatgcag cccagctacg gatcttggca

5520

ggcccagcag gcgactccaa cgtggtgaag ctccagcgaa tcgaagacct ccctaccatg

5580

gtcaccttgg gcaattcctt cctccacaaa ctgtgctctg gatttgttag gatttgcatg

5640

gatgaggatg ggaatgagaa gaggcccggg gacgtctgga ccttgccaga ccagtgccac

5700

accgtgactt gccagccaga tggccagacc ttgctgaaga gtcatcgggt caactgtgac

5760

cgggggctga ggccttcgtg ccctaacagc cagtcccctg ttaaagtgga agagacctgt

5820

ggctgccgct ggacctgccc ctgygtgtgc acaggcagct ccactcggca catcgtgacc

5880

tttgatgggc agaatttcaa gctgactggc agctgttctt atgtcctatt tcaaaacaag

5940

gagcaggacc tggaggtgat tctccataat ggtgcctgca gccctggagc aaggcagggc

6000

tgcatgaaat ccatcgaggt gaagcacagt gccctctccg tcgagstgca cagtgacatg

6060

gaggtgacgg tgaatgggag actggtctct gttccttacg tgggtgggaa catggaagtc

6120

aacgtttatg gtgccatcat gcatgaggtc agattcaatc accttggtca catcttcaca

6180

ttcactccac aaaacaatga gttccaactg cagctcagcc ccaagacttt tgcttcaaag

6240

acgtatggtc tgtgtgggat ctgtgatgag aacggagcca atgacttcat gctgagggat

6300

ggcacagtca ccacagactg gaaaacactt gttcaggaat ggactgtgca gcggccaggg

6360

cagacgtgcc agcccatcct ggaggagcag tgtcttgtcc ccgacagctc ccactgccag

6420

gtcctcctct taccactgtt tgctgaatgc cacaaggtcc tggctccagc cacattctat

6480

gccatctgcc agcaggacag ttgccaccag gagcaagtgt gtgaggtgat cgcctcttat

6540

gcccacctct gtcggaccaa cggggtctgc gttgactgga ggacacctga tttctgtgct

6600

atgtcatgcc caccatctct ggtctacaac cactgtgagc atggctgtcc ccggcactgt

6660

gatggcaacg tgagctcctg tggggaccat ccctccgaag gctgtttctg ccctccagat

6720

aaagtcatgt tggaaggcag ctgtgtccct gaagaggcct gcactcagtg cattggtgag

6780

gatggagtcc agcaccagtt cctggaagcc tgggtcccgg accaccagcc ctgtcagatc

6840

tgcacatgcc tcagcgggcg gaaggtcaac tgcacaacgc agccctgccc cacggccaaa

6900

gctcccacgt gtggcctgtg tgaagtagcc cgcctccgcc agaatgcaga ccagtgctgc

6960

cccgagtatg agtgtgtgtg tgacccagtg agctgtgacc tgcccccagt gcctcactgt

7020

gaacgtggcc tccagcccac actgaccaac cctggcgagt gcagacccaa cttcacctgc

7080

gcctgcagga aggaggagtg caaaagagtg tccccaccct cctgcccccc gcaccgtttg

7140

cccacccttc ggaagaccca gtgctgtgat gagtatgagt gtgcctgcaa ctgtgtcaac

7200

tccacagtga gctgtcccct tgggtacttg gcctcaaccg ccaccaatga ctgtggctgt

7260

accacaacca cctgccttcc cgacaaggtg tgtgtccacc gaagcaccat ctaccctgtg

7320

ggccagttct gggaggaggg ctgcgatgtg tgcacctgca ccgacatgga ggatgccgtg

7380

atgggcctcc gcgtggccca gtgctcccag aagccctgtg aggacagctg tcggtcgggc

7440

ttcacttacg ttctgcatga aggcgagtgc tgtggaaggt gcctgccatc tgcctgtgag

7500

gtggtgactg gctcaccgcg gggggactcc cagtcttcct ggaagagtgt cggctcccag

7560

tgggcctccc cggagaaccc ctgcctcatc aatgagtgtg tccgagtgaa ggaggaggtc

7620

tttatacaac aaaggaacgt ctcctgcccc cagctggagg tccctgtctg cccctcgggc

7680

tttcagctga gctgtaagac ctcagcgtgc tgcccaagct gtcgctgtga gcgcatggag

7740

gcctgcatgc tcaatggcac tgtcattggg cccgggaaga ctgtgatgat cgatgtgtgc

7800

acgacctgcc gctgcatggt gcaggtgggg gtcatctctg gattcaagct ggagtgcagg

7860

aagaccacct gcaacccctg ccccctgggt tacaaggaag aaaataacac aggtgaatgt

7920

tgtgggagat gtttgcctac ggcttgcacc attcagctaa gaggaggaca gatcatgaca

7980

ctgaagcgtg atgagacgct ccaggatggc tgtgatactc acttctgcaa ggtcaatgag

8040

agaggagagt acttctggga gaagagggtc acaggctgcc caccctttga tgaacacaag

8100

tgtcttgctg agggaggtaa aattatgaaa attccaggca cctgctgtga cacatgtgag

8160

gagcctgagt gcaacgacat cactgccagg ctgcagtatg tcaaggtggg aagctgtaag

8220

tctgaagtag aggtggatat ccactactgc cagggcaaat gtgccagcaa agccatgtac

8280

tccattgaca tcaacgatgt gcaggaccag tgctcctgct gctctccgac acggacggag

8340

cccatgcagg tggccctgca ctgcaccaat ggctctgttg tgtaccatga ggttctcaat

8400

gccatggagt gcaaatgctc ccccaggaag tgcagcaagt ga

8442

<210> 129

<211> 2809

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Человеческий VWF

<220>

<221> другой_признак

<222> (540)..(540)

<223> Xaa может представлять собой любую втречающуюся в природе

аминокислоту

<220>

<221> другой_признак

<222> (1944)..(1944)

аминокислоту

<220>

<221> другой_признак

<222> (2012)..(2012)

аминокислоту

<400> 129

Met Ile Pro Ala Arg Phe Ala Gly Val Leu Leu Ala Leu Ala Leu Ile

1. 5 10 15

Leu Pro Gly Thr Leu Cys Ala Glu Gly Thr Arg Gly Arg Ser Ser Thr

20 25 30

Ala Arg Cys Ser Leu Phe Gly Ser Asp Phe Val Asn Thr Phe Asp Gly

35 40 45

Ser Met Tyr Ser Phe Ala Gly Tyr Cys Ser Tyr Leu Leu Ala Gly Gly

50 55 60

Cys Gln Lys Arg Ser Phe Ser Ile Ile Gly Asp Phe Gln Asn Gly Lys

65 70 75 80

Arg Val Ser Leu Ser Val Tyr Leu Gly Glu Phe Phe Asp Ile His Leu

85 90 95

Phe Val Asn Gly Thr Val Thr Gln Gly Asp Gln Arg Val Ser Met Pro

100 105 110

Tyr Ala Ser Lys Gly Leu Tyr Leu Glu Thr Glu Ala Gly Tyr Tyr Lys

115 120 125

Leu Ser Gly Glu Ala Tyr Gly Phe Val Ala Arg Ile Asp Gly Ser Gly

130 135 140

Asn Phe Gln Val Leu Leu Ser Asp Arg Tyr Phe Asn Lys Thr Cys Gly

145 150 155 160

Leu Cys Gly Asn Phe Asn Ile Phe Ala Glu Asp Asp Phe Met Thr Gln

165 170 175

Glu Gly Thr Leu Thr Ser Asp Pro Tyr Asp Phe Ala Asn Ser Trp Ala

180 185 190

Leu Ser Ser Gly Glu Gln Trp Cys Glu Arg Ala Ser Pro Pro Ser Ser

195 200 205

Ser Cys Asn Ile Ser Ser Gly Glu Met Gln Lys Gly Leu Trp Glu Gln

210 215 220

Cys Gln Leu Leu Lys Ser Thr Ser Val Phe Ala Arg Cys His Pro Leu

225 230 235 240

Val Asp Pro Glu Pro Phe Val Cys Glu Lys Thr Leu Cys Glu Cys Ala

245 250 255

Gly Gly Leu Glu Cys Ala Cys Pro Ala Leu Leu Glu Tyr Ala Arg Thr

260 265 270

Cys Ala Gln Glu Gly Met Val Leu Tyr Gly Trp Thr Asp His Ser Ala

275 280 285

Cys Ser Pro Val Cys Pro Ala Gly Met Glu Tyr Arg Gln Cys Val Ser

290 295 300

Pro Cys Ala Arg Thr Cys Gln Ser Leu His Ile Asn Glu Met Cys Gln

305 310 315 320

Glu Arg Cys Val Asp Gly Cys Ser Cys Pro Glu Gly Gln Leu Leu Asp

325 330 335

Glu Gly Leu Cys Val Glu Ser Thr Glu Cys Pro Cys Val His Ser Gly

340 345 350

Lys Arg Tyr Pro Pro Gly Thr Ser Leu Ser Arg Asp Cys Asn Thr Cys

355 360 365

Ile Cys Arg Asn Ser Gln Trp Ile Cys Ser Asn Glu Glu Cys Pro Gly

370 375 380

Glu Cys Leu Val Thr Gly Gln Ser His Phe Lys Ser Phe Asp Asn Arg

385 390 395 400

Tyr Phe Thr Phe Ser Gly Ile Cys Gln Tyr Leu Leu Ala Arg Asp Cys

405 410 415

Gln Asp His Ser Phe Ser Ile Val Ile Glu Thr Val Gln Cys Ala Asp

420 425 430

Asp Arg Asp Ala Val Cys Thr Arg Ser Val Thr Val Arg Leu Pro Gly

435 440 445

Leu His Asn Ser Leu Val Lys Leu Lys His Gly Ala Gly Val Ala Met

450 455 460

Asp Gly Gln Asp Ile Gln Leu Pro Leu Leu Lys Gly Asp Leu Arg Ile

465 470 475 480

Gln His Thr Val Thr Ala Ser Val Arg Leu Ser Tyr Gly Glu Asp Leu

485 490 495

Gln Met Asp Trp Asp Gly Arg Gly Arg Leu Leu Val Lys Leu Ser Pro

500 505 510

Val Tyr Ala Gly Lys Thr Cys Gly Leu Cys Gly Asn Tyr Asn Gly Asn

515 520 525

Gln Gly Asp Asp Phe Leu Thr Pro Ser Gly Leu Xaa Glu Pro Arg Val

530 535 540

Glu Asp Phe Gly Asn Ala Trp Lys Leu His Gly Asp Cys Gln Asp Leu

545 550 555 560

Gln Lys Gln His Ser Asp Pro Cys Ala Leu Asn Pro Arg Met Thr Arg

565 570 575

Phe Ser Glu Glu Ala Cys Ala Val Leu Thr Ser Pro Thr Phe Glu Ala

580 585 590

Cys His Arg Ala Val Ser Pro Leu Pro Tyr Leu Arg Asn Cys Arg Tyr

595 600 605

Asp Val Cys Ser Cys Ser Asp Gly Arg Glu Cys Leu Cys Gly Ala Ser

610 615 620

Tyr Ala Ala Ala Cys Ala Gly Arg Gly Val Arg Val Ala Trp Arg Glu

625 630 635 640

Pro Gly Arg Cys Glu Leu Asn Cys Pro Lys Gly Gln Val Tyr Leu Gln

645 650 655

Cys Gly Thr Pro Cys Asn Leu Thr Cys Arg Ser Leu Ser Tyr Pro Asp

660 665 670

Glu Glu Cys Asn Glu Ala Cys Leu Glu Gly Cys Phe Cys Pro Pro Gly

675 680 685

Leu Tyr Met Asp Glu Arg Gly Asp Cys Val Pro Lys Ala Gln Cys Pro

690 695 700

Cys Tyr Tyr Asp Gly Glu Ile Phe Gln Pro Glu Asp Ile Phe Ser Asp

705 710 715 720

His His Thr Met Cys Tyr Cys Glu Asp Gly Phe Met His Cys Thr Met

725 730 735

Ser Gly Val Pro Gly Ser Leu Leu Pro Asp Ala Val Leu Ser Ser Pro

740 745 750

Leu Ser His Arg Ser Lys Arg Ser Leu Ser Cys Arg Pro Pro Met Val

755 760 765

Lys Leu Val Cys Pro Ala Asp Asn Leu Arg Ala Glu Gly Leu Glu Cys

770 775 780

Thr Lys Thr Cys Gln Asn Tyr Asp Leu Glu Cys Met Ser Met Gly Cys

785 790 795 800

Val Ser Gly Cys Leu Cys Pro Pro Gly Met Val Arg His Glu Asn Arg

805 810 815

Cys Val Ala Leu Glu Arg Cys Pro Cys Phe His Gln Gly Lys Glu Tyr

820 825 830

Ala Pro Gly Glu Thr Val Lys Ile Gly Cys Asn Thr Cys Val Cys Arg

835 840 845

Asp Arg Lys Trp Asn Cys Thr Asp His Val Cys Asp Ala Thr Cys Ser

850 855 860

Thr Ile Gly Met Ala His Tyr Leu Thr Phe Asp Gly Leu Lys Tyr Leu

865 870 875 880

Phe Pro Gly Glu Cys Gln Tyr Val Leu Val Gln Asp Tyr Cys Gly Ser

885 890 895

Asn Pro Gly Thr Phe Arg Ile Leu Val Gly Asn Lys Gly Cys Ser His

900 905 910

Pro Ser Val Lys Cys Lys Lys Arg Val Thr Ile Leu Val Glu Gly Gly

915 920 925

Glu Ile Glu Leu Phe Asp Gly Glu Val Asn Val Lys Arg Pro Met Lys

930 935 940

Asp Glu Thr His Phe Glu Val Val Glu Ser Gly Arg Tyr Ile Ile Leu

945 950 955 960

Leu Leu Gly Lys Ala Leu Ser Val Val Trp Asp Arg His Leu Ser Ile

965 970 975

Ser Val Val Leu Lys Gln Thr Tyr Gln Glu Lys Val Cys Gly Leu Cys

980 985 990

Gly Asn Phe Asp Gly Ile Gln Asn Asn Asp Leu Thr Ser Ser Asn Leu

995 1000 1005

Gln Val Glu Glu Asp Pro Val Asp Phe Gly Asn Ser Trp Lys Val

1010 1015 1020

Ser Ser Gln Cys Ala Asp Thr Arg Lys Val Pro Leu Asp Ser Ser

1025 1030 1035

Pro Ala Thr Cys His Asn Asn Ile Met Lys Gln Thr Met Val Asp

1040 1045 1050

Ser Ser Cys Arg Ile Leu Thr Ser Asp Val Phe Gln Asp Cys Asn

1055 1060 1065

Lys Leu Val Asp Pro Glu Pro Tyr Leu Asp Val Cys Ile Tyr Asp

1070 1075 1080

Thr Cys Ser Cys Glu Ser Ile Gly Asp Cys Ala Cys Phe Cys Asp

1085 1090 1095

Thr Ile Ala Ala Tyr Ala His Val Cys Ala Gln His Gly Lys Val

1100 1105 1110

Val Thr Trp Arg Thr Ala Thr Leu Cys Pro Gln Ser Cys Glu Glu

1115 1120 1125

Arg Asn Leu Arg Glu Asn Gly Tyr Glu Cys Glu Trp Arg Tyr Asn

1130 1135 1140

Ser Cys Ala Pro Ala Cys Gln Val Thr Cys Gln His Pro Glu Pro

1145 1150 1155

Leu Ala Cys Pro Val Gln Cys Val Glu Gly Cys His Ala His Cys

1160 1165 1170

Pro Pro Gly Lys Ile Leu Asp Glu Leu Leu Gln Thr Cys Val Asp

1175 1180 1185

Pro Glu Asp Cys Pro Val Cys Glu Val Ala Gly Arg Arg Phe Ala

1190 1195 1200

Ser Gly Lys Lys Val Thr Leu Asn Pro Ser Asp Pro Glu His Cys

1205 1210 1215

Gln Ile Cys His Cys Asp Val Val Asn Leu Thr Cys Glu Ala Cys

1220 1225 1230

Gln Glu Pro Gly Gly Leu Val Val Pro Pro Thr Asp Ala Pro Val

1235 1240 1245

Ser Pro Thr Thr Leu Tyr Val Glu Asp Ile Ser Glu Pro Pro Leu

1250 1255 1260

His Asp Phe Tyr Cys Ser Arg Leu Leu Asp Leu Val Phe Leu Leu

1265 1270 1275

Asp Gly Ser Ser Arg Leu Ser Glu Ala Glu Phe Glu Val Leu Lys

1280 1285 1290

Ala Phe Val Val Asp Met Met Glu Arg Leu Arg Ile Ser Gln Lys

1295 1300 1305

Trp Val Arg Val Ala Val Val Glu Tyr His Asp Gly Ser His Ala

1310 1315 1320

Tyr Ile Gly Leu Lys Asp Arg Lys Arg Pro Ser Glu Leu Arg Arg

1325 1330 1335

Ile Ala Ser Gln Val Lys Tyr Ala Gly Ser Gln Val Ala Ser Thr

1340 1345 1350

Ser Glu Val Leu Lys Tyr Thr Leu Phe Gln Ile Phe Ser Lys Ile

1355 1360 1365

Asp Arg Pro Glu Ala Ser Arg Ile Ala Leu Leu Leu Met Ala Ser

1370 1375 1380

Gln Glu Pro Gln Arg Met Ser Arg Asn Phe Val Arg Tyr Val Gln

1385 1390 1395

Gly Leu Lys Lys Lys Lys Val Ile Val Ile Pro Val Gly Ile Gly

1400 1405 1410

Pro His Ala Asn Leu Lys Gln Ile Arg Leu Ile Glu Lys Gln Ala

1415 1420 1425

Pro Glu Asn Lys Ala Phe Val Leu Ser Ser Val Asp Glu Leu Glu

1430 1435 1440

Gln Gln Arg Asp Glu Ile Val Ser Tyr Leu Cys Asp Leu Ala Pro

1445 1450 1455

Glu Ala Pro Pro Pro Thr Leu Pro Pro Asp Met Ala Gln Val Thr

1460 1465 1470

Val Gly Pro Gly Leu Leu Gly Val Ser Thr Leu Gly Pro Lys Arg

1475 1480 1485

Asn Ser Met Val Leu Asp Val Ala Phe Val Leu Glu Gly Ser Asp

1490 1495 1500

Lys Ile Gly Glu Ala Asp Phe Asn Arg Ser Lys Glu Phe Met Glu

1505 1510 1515

Glu Val Ile Gln Arg Met Asp Val Gly Gln Asp Ser Ile His Val

1520 1525 1530

Thr Val Leu Gln Tyr Ser Tyr Met Val Thr Val Glu Tyr Pro Phe

1535 1540 1545

Ser Glu Ala Gln Ser Lys Gly Asp Ile Leu Gln Arg Val Arg Glu

1550 1555 1560

Ile Arg Tyr Gln Gly Gly Asn Arg Thr Asn Thr Gly Leu Ala Leu

1565 1570 1575

Arg Tyr Leu Ser Asp His Ser Phe Leu Val Ser Gln Gly Asp Arg

1580 1585 1590

Glu Gln Ala Pro Asn Leu Val Tyr Met Val Thr Gly Asn Pro Ala

1595 1600 1605

Ser Asp Glu Ile Lys Arg Leu Pro Gly Asp Ile Gln Val Val Pro

1610 1615 1620

Ile Gly Val Gly Pro Asn Ala Asn Val Gln Glu Leu Glu Arg Ile

1625 1630 1635

Gly Trp Pro Asn Ala Pro Ile Leu Ile Gln Asp Phe Glu Thr Leu

1640 1645 1650

Pro Arg Glu Ala Pro Asp Leu Val Leu Gln Arg Cys Cys Ser Gly

1655 1660 1665

Glu Gly Leu Gln Ile Pro Thr Leu Ser Pro Ala Pro Asp Cys Ser

1670 1675 1680

Gln Pro Leu Asp Val Ile Leu Leu Leu Asp Gly Ser Ser Ser Phe

1685 1690 1695

Pro Ala Ser Tyr Phe Asp Glu Met Lys Ser Phe Ala Lys Ala Phe

1700 1705 1710

Ile Ser Lys Ala Asn Ile Gly Pro Arg Leu Thr Gln Val Ser Val

1715 1720 1725

Leu Gln Tyr Gly Ser Ile Thr Thr Ile Asp Val Pro Trp Asn Val

1730 1735 1740

Val Pro Glu Lys Ala His Leu Leu Ser Leu Val Asp Val Met Gln

1745 1750 1755

Arg Glu Gly Gly Pro Ser Gln Ile Gly Asp Ala Leu Gly Phe Ala

1760 1765 1770

Val Arg Tyr Leu Thr Ser Glu Met His Gly Ala Arg Pro Gly Ala

1775 1780 1785

Ser Lys Ala Val Val Ile Leu Val Thr Asp Val Ser Val Asp Ser

1790 1795 1800

Val Asp Ala Ala Ala Asp Ala Ala Arg Ser Asn Arg Val Thr Val

1805 1810 1815

Phe Pro Ile Gly Ile Gly Asp Arg Tyr Asp Ala Ala Gln Leu Arg

1820 1825 1830

Ile Leu Ala Gly Pro Ala Gly Asp Ser Asn Val Val Lys Leu Gln

1835 1840 1845

Arg Ile Glu Asp Leu Pro Thr Met Val Thr Leu Gly Asn Ser Phe

1850 1855 1860

Leu His Lys Leu Cys Ser Gly Phe Val Arg Ile Cys Met Asp Glu

1865 1870 1875

Asp Gly Asn Glu Lys Arg Pro Gly Asp Val Trp Thr Leu Pro Asp

1880 1885 1890

Gln Cys His Thr Val Thr Cys Gln Pro Asp Gly Gln Thr Leu Leu

1895 1900 1905

Lys Ser His Arg Val Asn Cys Asp Arg Gly Leu Arg Pro Ser Cys

1910 1915 1920

Pro Asn Ser Gln Ser Pro Val Lys Val Glu Glu Thr Cys Gly Cys

1925 1930 1935

Arg Trp Thr Cys Pro Xaa Val Cys Thr Gly Ser Ser Thr Arg His

1940 1945 1950

Ile Val Thr Phe Asp Gly Gln Asn Phe Lys Leu Thr Gly Ser Cys

1955 1960 1965

Ser Tyr Val Leu Phe Gln Asn Lys Glu Gln Asp Leu Glu Val Ile

1970 1975 1980

Leu His Asn Gly Ala Cys Ser Pro Gly Ala Arg Gln Gly Cys Met

1985 1990 1995

Lys Ser Ile Glu Val Lys His Ser Ala Leu Ser Val Glu Xaa His

2000 2005 2010

Ser Asp Met Glu Val Thr Val Asn Gly Arg Leu Val Ser Val Pro

2015 2020 2025

Tyr Val Gly Gly Asn Met Glu Val Asn Val Tyr Gly Ala Ile Met

2030 2035 2040

His Glu Val Arg Phe Asn His Leu Gly His Ile Phe Thr Phe Thr

2045 2050 2055

Pro Gln Asn Asn Glu Phe Gln Leu Gln Leu Ser Pro Lys Thr Phe

2060 2065 2070

Ala Ser Lys Thr Tyr Gly Leu Cys Gly Ile Cys Asp Glu Asn Gly

2075 2080 2085

Ala Asn Asp Phe Met Leu Arg Asp Gly Thr Val Thr Thr Asp Trp

2090 2095 2100

Lys Thr Leu Val Gln Glu Trp Thr Val Gln Arg Pro Gly Gln Thr

2105 2110 2115

Cys Gln Pro Ile Leu Glu Glu Gln Cys Leu Val Pro Asp Ser Ser

2120 2125 2130

His Cys Gln Val Leu Leu Leu Pro Leu Phe Ala Glu Cys His Lys

2135 2140 2145

Val Leu Ala Pro Ala Thr Phe Tyr Ala Ile Cys Gln Gln Asp Ser

2150 2155 2160

Cys His Gln Glu Gln Val Cys Glu Val Ile Ala Ser Tyr Ala His

2165 2170 2175

Leu Cys Arg Thr Asn Gly Val Cys Val Asp Trp Arg Thr Pro Asp

2180 2185 2190

Phe Cys Ala Met Ser Cys Pro Pro Ser Leu Val Tyr Asn His Cys

2195 2200 2205

Glu His Gly Cys Pro Arg His Cys Asp Gly Asn Val Ser Ser Cys

2210 2215 2220

Gly Asp His Pro Ser Glu Gly Cys Phe Cys Pro Pro Asp Lys Val

2225 2230 2235

Met Leu Glu Gly Ser Cys Val Pro Glu Glu Ala Cys Thr Gln Cys

2240 2245 2250

Ile Gly Glu Asp Gly Val Gln His Gln Phe Leu Glu Ala Trp Val

2255 2260 2265

Pro Asp His Gln Pro Cys Gln Ile Cys Thr Cys Leu Ser Gly Arg

2270 2275 2280

Lys Val Asn Cys Thr Thr Gln Pro Cys Pro Thr Ala Lys Ala Pro

2285 2290 2295

Thr Cys Gly Leu Cys Glu Val Ala Arg Leu Arg Gln Asn Ala Asp

2300 2305 2310

Gln Cys Cys Pro Glu Tyr Glu Cys Val Cys Asp Pro Val Ser Cys

2315 2320 2325

Asp Leu Pro Pro Val Pro His Cys Glu Arg Gly Leu Gln Pro Thr

2330 2335 2340

Leu Thr Asn Pro Gly Glu Cys Arg Pro Asn Phe Thr Cys Ala Cys

2345 2350 2355

Arg Lys Glu Glu Cys Lys Arg Val Ser Pro Pro Ser Cys Pro Pro

2360 2365 2370

His Arg Leu Pro Thr Leu Arg Lys Thr Gln Cys Cys Asp Glu Tyr

2375 2380 2385

Glu Cys Ala Cys Asn Cys Val Asn Ser Thr Val Ser Cys Pro Leu

2390 2395 2400

Gly Tyr Leu Ala Ser Thr Ala Thr Asn Asp Cys Gly Cys Thr Thr

2405 2410 2415

Thr Thr Cys Leu Pro Asp Lys Val Cys Val His Arg Ser Thr Ile

2420 2425 2430

Tyr Pro Val Gly Gln Phe Trp Glu Glu Gly Cys Asp Val Cys Thr

2435 2440 2445

Cys Thr Asp Met Glu Asp Ala Val Met Gly Leu Arg Val Ala Gln

2450 2455 2460

Cys Ser Gln Lys Pro Cys Glu Asp Ser Cys Arg Ser Gly Phe Thr

2465 2470 2475

Tyr Val Leu His Glu Gly Glu Cys Cys Gly Arg Cys Leu Pro Ser

2480 2485 2490

Ala Cys Glu Val Val Thr Gly Ser Pro Arg Gly Asp Ser Gln Ser

2495 2500 2505

Ser Trp Lys Ser Val Gly Ser Gln Trp Ala Ser Pro Glu Asn Pro

2510 2515 2520

Cys Leu Ile Asn Glu Cys Val Arg Val Lys Glu Glu Val Phe Ile

2525 2530 2535

Gln Gln Arg Asn Val Ser Cys Pro Gln Leu Glu Val Pro Val Cys

2540 2545 2550

Pro Ser Gly Phe Gln Leu Ser Cys Lys Thr Ser Ala Cys Cys Pro

2555 2560 2565

Ser Cys Arg Cys Glu Arg Met Glu Ala Cys Met Leu Asn Gly Thr

2570 2575 2580

Val Ile Gly Pro Gly Lys Thr Val Met Ile Asp Val Cys Thr Thr

2585 2590 2595

Cys Arg Cys Met Val Gln Val Gly Val Ile Ser Gly Phe Lys Leu

2600 2605 2610

Glu Cys Arg Lys Thr Thr Cys Asn Pro Cys Pro Leu Gly Tyr Lys

2615 2620 2625

Glu Glu Asn Asn Thr Gly Glu Cys Cys Gly Arg Cys Leu Pro Thr

2630 2635 2640

Ala Cys Thr Ile Gln Leu Arg Gly Gly Gln Ile Met Thr Leu Lys

2645 2650 2655

Arg Asp Glu Thr Leu Gln Asp Gly Cys Asp Thr His Phe Cys Lys

2660 2665 2670

Val Asn Glu Arg Gly Glu Tyr Phe Trp Glu Lys Arg Val Thr Gly

2675 2680 2685

Cys Pro Pro Phe Asp Glu His Lys Cys Leu Ala Glu Gly Gly Lys

2690 2695 2700

Ile Met Lys Ile Pro Gly Thr Cys Cys Asp Thr Cys Glu Glu Pro

2705 2710 2715

Glu Cys Asn Asp Ile Thr Ala Arg Leu Gln Tyr Val Lys Val Gly

2720 2725 2730

Ser Cys Lys Ser Glu Val Glu Val Asp Ile His Tyr Cys Gln Gly

2735 2740 2745

Lys Cys Ala Ser Lys Ala Met Tyr Ser Ile Asp Ile Asn Asp Val

2750 2755 2760

Gln Asp Gln Cys Ser Cys Cys Ser Pro Thr Arg Thr Glu Pro Met

2765 2770 2775

Gln Val Ala Leu His Cys Thr Asn Gly Ser Val Val Tyr His Glu

2780 2785 2790

Val Leu Asn Ala Met Glu Cys Lys Cys Ser Pro Arg Lys Cys Ser

2795 2800 2805

Lys

<210> 130

<211> 36

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> AE36

<400> 130

Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu

1. 5 10 15

Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly

20 25 30

Ser Glu Thr Pro

35

<210> 131

<211> 42

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> AE42

<400> 131

Gly Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly

1. 5 10 15

Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala

20 25 30

Thr Ser Gly Ser Glu Thr Pro Ala Ser Ser

35 40

<210> 132

<211> 78

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> AE72

<400> 132

Gly Ala Pro Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser

1. 5 10 15

Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala

20 25 30

Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu

35 40 45

Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr

50 55 60

Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ala Ser Ser

65 70 75

<210> 133

<211> 78

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> AE78

<400> 133

Gly Ala Pro Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser

1. 5 10 15

Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala

20 25 30

Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu

35 40 45

Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr

50 55 60

Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ala Ser Ser

65 70 75

<210> 134

<211> 143

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> AE144

<400> 134

Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu

1. 5 10 15

Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly

20 25 30

Ser Glu Thr Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu

35 40 45

Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Glu Pro

50 55 60

Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Glu Pro Ala Thr Ser Gly

65 70 75 80

Ser Glu Thr Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro

85 90 95

Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu

100 105 110

Ser Ala Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser

115 120 125

Glu Thr Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro

130 135 140

<210> 135

<211> 144

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> AE144_6B

<400> 135

Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser

1. 5 10 15

Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu

20 25 30

Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly

35 40 45

Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Glu Pro Ala

50 55 60

Thr Ser Gly Ser Glu Thr Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser

65 70 75 80

Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly

85 90 95

Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Glu Pro Ala

100 105 110

Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu

115 120 125

Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly

130 135 140

<210> 136

<211> 144

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> AG144

<400> 136

Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr

1. 5 10 15

Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro Ser Ala Ser Thr

20 25 30

Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro

35 40 45

Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro

50 55 60

Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala

65 70 75 80

Thr Gly Ser Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro

85 90 95

Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Pro

100 105 110

Ser Ala Ser Thr Gly Thr Gly Pro Gly Thr Pro Gly Ser Gly Thr Ala

115 120 125

Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro

130 135 140

<210> 137

<211> 144

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> AG144_A

<400> 137

Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Pro

1. 5 10 15

Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser Thr

20 25 30

Gly Thr Gly Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro

35 40 45

Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro

50 55 60

Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser

65 70 75 80

Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro

85 90 95

Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Thr Pro Gly

100 105 110

Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser

115 120 125

Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro

130 135 140

<210> 138

<211> 288

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> AE288

<400> 138

Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro

1. 5 10 15

Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro

20 25 30

Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro

35 40 45

Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr

50 55 60

Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr

65 70 75 80

Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro

85 90 95

Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu

100 105 110

Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Pro Ala Gly Ser Pro Thr

115 120 125

Ser Thr Glu Glu Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu

130 135 140

Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu

145 150 155 160

Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro

165 170 175

Glu Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro

180 185 190

Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Glu Pro

195 200 205

Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Pro Ala Gly Ser Pro Thr

210 215 220

Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro

225 230 235 240

Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Glu Pro

245 250 255

Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro

260 265 270

Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro

275 280 285

<210> 139

<211> 288

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> AE288_2

<400> 139

Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu

1. 5 10 15

Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly

20 25 30

Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro

35 40 45

Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr

50 55 60

Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu

65 70 75 80

Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro

85 90 95

Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr

100 105 110

Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr

115 120 125

Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro

130 135 140

Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro

145 150 155 160

Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro

165 170 175

Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro

180 185 190

Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr

195 200 205

Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro

210 215 220

Glu Ser Gly Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu

225 230 235 240

Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Ser Pro Ala

245 250 255

Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro

260 265 270

Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro

275 280 285

<210> 140

<211> 288

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> AG288

<400> 140

Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser

1. 5 10 15

Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr

20 25 30

Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser

35 40 45

Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser

50 55 60

Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr

65 70 75 80

Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser

85 90 95

Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser

100 105 110

Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser

115 120 125

Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser

130 135 140

Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser

145 150 155 160

Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro Ser Ala Ser

165 170 175

Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly

180 185 190

Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser

195 200 205

Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly

210 215 220

Ala Thr Gly Ser Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly

225 230 235 240

Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser

245 250 255

Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Thr Pro Gly Ser Gly Thr

260 265 270

Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser

275 280 285

<210> 141

<211> 576

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> AE576

<400> 141

Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu

1. 5 10 15

Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu

20 25 30

Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu

35 40 45

Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr

50 55 60

Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro

65 70 75 80

Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro

85 90 95

Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Pro Ala

100 105 110

Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro

115 120 125

Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro

130 135 140

Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala

145 150 155 160

Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu

165 170 175

Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro

180 185 190

Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr

195 200 205

Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro

210 215 220

Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro

225 230 235 240

Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr

245 250 255

Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro

260 265 270

Glu Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro

275 280 285

Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu

290 295 300

Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly

305 310 315 320

Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro

325 330 335

Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr

340 345 350

Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu

355 360 365

Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro

370 375 380

Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr

385 390 395 400

Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr

405 410 415

Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro

420 425 430

Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro

435 440 445

Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro

450 455 460

Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro

465 470 475 480

Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr

485 490 495

Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro

500 505 510

Glu Ser Gly Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu

515 520 525

Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Ser Pro Ala

530 535 540

Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro

545 550 555 560

Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro

565 570 575

<210> 142

<211> 576

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> AG576

<400> 142

Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser

1. 5 10 15

Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro Ser Ala Ser

20 25 30

Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly

35 40 45

Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser

50 55 60

Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser

65 70 75 80

Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser

85 90 95

Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Thr Pro

100 105 110

Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser Pro Gly Thr Ser

115 120 125

Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser

130 135 140

Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser

145 150 155 160

Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Thr Pro Gly Ser Gly Thr

165 170 175

Ala Ser Ser Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser

180 185 190

Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser

195 200 205

Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly

210 215 220

Ala Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser

225 230 235 240

Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Thr Pro

245 250 255

Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly

260 265 270

Ala Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser

275 280 285

Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser

290 295 300

Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser

305 310 315 320

Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser

325 330 335

Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser

340 345 350

Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser

355 360 365

Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser

370 375 380

Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Thr Pro

385 390 395 400

Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly

405 410 415

Ala Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser

420 425 430

Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Thr Pro

435 440 445

Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly

450 455 460

Ala Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser

465 470 475 480

Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser

485 490 495

Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser

500 505 510

Ser Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser

515 520 525

Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser

530 535 540

Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser

545 550 555 560

Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser

565 570 575

<210> 143

<211> 864

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> AE864

<400> 143

Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu

1. 5 10 15

Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu

20 25 30

Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu

35 40 45

Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr

50 55 60

Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro

65 70 75 80

Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro

85 90 95

Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Pro Ala

100 105 110

Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro

115 120 125

Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro

130 135 140

Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala

145 150 155 160

Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu

165 170 175

Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro

180 185 190

Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr

195 200 205

Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro

210 215 220

Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro

225 230 235 240

Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr

245 250 255

Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro

260 265 270

Glu Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro

275 280 285

Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu

290 295 300

Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly

305 310 315 320

Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro

325 330 335

Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr

340 345 350

Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu

355 360 365

Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro

370 375 380

Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr

385 390 395 400

Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr

405 410 415

Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro

420 425 430

Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro

435 440 445

Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro

450 455 460

Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro

465 470 475 480

Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr

485 490 495

Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro

500 505 510

Glu Ser Gly Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu

515 520 525

Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Ser Pro Ala

530 535 540

Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro

545 550 555 560

Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro

565 570 575

Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro

580 585 590

Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro

595 600 605

Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro

610 615 620

Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr

625 630 635 640

Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr

645 650 655

Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro

660 665 670

Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu

675 680 685

Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Pro Ala Gly Ser Pro Thr

690 695 700

Ser Thr Glu Glu Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu

705 710 715 720

Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu

725 730 735

Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro

740 745 750

Glu Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro

755 760 765

Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Glu Pro

770 775 780

Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Pro Ala Gly Ser Pro Thr

785 790 795 800

Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro

805 810 815

Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Glu Pro

820 825 830

Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro

835 840 845

Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro

850 855 860

<210> 144

<211> 864

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> AG864

<400> 144

Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Pro

1. 5 10 15

Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser Thr

20 25 30

Gly Thr Gly Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro

35 40 45

Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro

50 55 60

Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser

65 70 75 80

Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro

85 90 95

Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Thr Pro Gly

100 105 110

Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser

115 120 125

Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro

130 135 140

Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr

145 150 155 160

Pro Ser Gly Ala Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser

165 170 175

Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro

180 185 190

Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro

195 200 205

Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser Thr

210 215 220

Gly Thr Gly Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro

225 230 235 240

Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ala Ser Pro

245 250 255

Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser

260 265 270

Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro

275 280 285

Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser Pro

290 295 300

Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser

305 310 315 320

Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro

325 330 335

Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Thr Pro Gly

340 345 350

Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser

355 360 365

Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro

370 375 380

Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Thr

385 390 395 400

Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala

405 410 415

Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro

420 425 430

Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr

435 440 445

Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala

450 455 460

Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro

465 470 475 480

Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro

485 490 495

Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser

500 505 510

Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro

515 520 525

Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro

530 535 540

Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser

545 550 555 560

Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro

565 570 575

Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr

580 585 590

Pro Ser Gly Ala Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala

595 600 605

Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro

610 615 620

Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr

625 630 635 640

Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala

645 650 655

Thr Gly Ser Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro

660 665 670

Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro

675 680 685

Gly Thr Ser Ser Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala

690 695 700

Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro

705 710 715 720

Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro

725 730 735

Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser

740 745 750

Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro

755 760 765

Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro

770 775 780

Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser

785 790 795 800

Thr Gly Ser Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro

805 810 815

Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr

820 825 830

Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala

835 840 845

Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro

850 855 860

<210> 145

<211> 72

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> XTEN_AE72_2A_1

<400> 145

Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly

1. 5 10 15

Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly

20 25 30

Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly

35 40 45

Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu

50 55 60

Pro Ser Glu Gly Ser Ala Pro Gly

65 70

<210> 146

<211> 72

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> XTEN_AE72_2A_2

<400> 146

Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala

1. 5 10 15

Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly

20 25 30

Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly

35 40 45

Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Glu Ser

50 55 60

Ala Thr Pro Glu Ser Gly Pro Gly

65 70

<210> 147

<211> 72

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> XTEN_AE72_3B_1

<400> 147

Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser

1. 5 10 15

Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser

20 25 30

Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly

35 40 45

Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu

50 55 60

Pro Ser Glu Gly Ser Ala Pro Gly

65 70

<210> 148

<211> 72

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> XTEN_AE72_3B_2

<400> 148

Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu

1. 5 10 15

Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly

20 25 30

Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly

35 40 45

Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu

50 55 60

Pro Ser Glu Gly Ser Ala Pro Gly

65 70

<210> 149

<211> 72

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> XTEN_AE72_4A_2

<400> 149

Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Pro Ala Gly

1. 5 10 15

Ser Pro Thr Ser Thr Glu Glu Gly Ser Pro Ala Gly Ser Pro Thr Ser

20 25 30

Thr Glu Glu Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly

35 40 45

Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu

50 55 60

Pro Ser Glu Gly Ser Ala Pro Gly

65 70

<210> 150

<211> 72

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> XTEN_AE72_5A_2

<400> 150

Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser

1. 5 10 15

Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser

20 25 30

Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly

35 40 45

Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Ser Pro Ala Gly

50 55 60

Ser Pro Thr Ser Thr Glu Glu Gly

65 70

<210> 151

<211> 72

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> XTEN_AE72_6B_1

<400> 151

Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser

1. 5 10 15

Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu

20 25 30

Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly

35 40 45

Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Glu Pro Ala

50 55 60

Thr Ser Gly Ser Glu Thr Pro Gly

65 70

<210> 152

<211> 72

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> XTEN_AE72_6B_2

<400> 152

Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu

1. 5 10 15

Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly

20 25 30

Ser Ala Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly

35 40 45

Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu

50 55 60

Pro Ser Glu Gly Ser Ala Pro Gly

65 70

<210> 153

<211> 72

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> XTEN_AE72_1A_1

<400> 153

Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser

1. 5 10 15

Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly

20 25 30

Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly

35 40 45

Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu

50 55 60

Pro Ser Glu Gly Ser Ala Pro Gly

65 70

<210> 154

<211> 72

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> XTEN_AE72_1A_2

<400> 154

Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala

1. 5 10 15

Thr Ser Gly Ser Glu Thr Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser

20 25 30

Glu Thr Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly

35 40 45

Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu

50 55 60

Pro Ser Glu Gly Ser Ala Pro Gly

65 70

<210> 155

<211> 144

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> XTEN_AE144_1A

<400> 155

Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser

1. 5 10 15

Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly

20 25 30

Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly

35 40 45

Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu

50 55 60

Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu

65 70 75 80

Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly

85 90 95

Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Pro Ala Gly

100 105 110

Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu

115 120 125

Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly

130 135 140

<210> 156

<211> 150

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> AE150

<400> 156

Gly Ala Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly

1. 5 10 15

Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala

20 25 30

Thr Ser Gly Ser Glu Thr Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser

35 40 45

Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly

50 55 60

Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Glu Pro Ala

65 70 75 80

Thr Ser Gly Ser Glu Thr Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser

85 90 95

Glu Thr Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly

100 105 110

Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala

115 120 125

Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly

130 135 140

Ser Ala Pro Ala Ser Ser

145 150

<210> 157

<211> 150

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> G150

<400> 157

Gly Ala Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly

1. 5 10 15

Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro Ser

20 25 30

Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly

35 40 45

Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly

50 55 60

Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Thr Pro

65 70 75 80

Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly

85 90 95

Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly

100 105 110

Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Thr Pro Gly Ser

115 120 125

Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr

130 135 140

Gly Ser Pro Ala Ser Ser

145 150

<210> 158

<211> 294

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> AE294

<400> 158

Gly Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly

1. 5 10 15

Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser

20 25 30

Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser

35 40 45

Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly

50 55 60

Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly

65 70 75 80

Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu

85 90 95

Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly

100 105 110

Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Pro Ala Gly

115 120 125

Ser Pro Thr Ser Thr Glu Glu Gly Ser Pro Ala Gly Ser Pro Thr Ser

130 135 140

Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly

145 150 155 160

Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Glu Ser

165 170 175

Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu

180 185 190

Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly

195 200 205

Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Pro Ala Gly

210 215 220

Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly

225 230 235 240

Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly

245 250 255

Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser

260 265 270

Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly

275 280 285

Ser Ala Pro Ala Ser Ser

290

<210> 159

<211> 294

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> AG294

<400> 159

Gly Ala Pro Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro

1. 5 10 15

Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Thr Pro Gly

20 25 30

Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala

35 40 45

Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro

50 55 60

Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Thr Pro Gly

65 70 75 80

Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala

85 90 95

Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro

100 105 110

Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro

115 120 125

Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser

130 135 140

Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro

145 150 155 160

Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro

165 170 175

Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser Thr

180 185 190

Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro

195 200 205

Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Thr

210 215 220

Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro Ser Ala Ser Thr

225 230 235 240

Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro

245 250 255

Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Thr Pro Gly

260 265 270

Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala

275 280 285

Thr Gly Ser Ala Ser Ser

290

<210> 160

<211> 1016

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> FIX-линкер-альбумин

<400> 160

Tyr Asn Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg

1. 5 10 15

Glu Cys Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe

20 25 30

Glu Asn Thr Glu Arg Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly

35 40 45

Asp Gln Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp

50 55 60

Asp Ile Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys

65 70 75 80

Asn Cys Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu

85 90 95

Gln Phe Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr

100 105 110

Glu Gly Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val

115 120 125

Pro Phe Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr

130 135 140

Arg Ala Glu Thr Val Phe Pro Asp Val Asp Tyr Val Asn Ser Thr Glu

145 150 155 160

Ala Glu Thr Ile Leu Asp Asn Ile Thr Gln Ser Thr Gln Ser Phe Asn

165 170 175

Asp Phe Thr Arg Val Val Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe

180 185 190

Pro Trp Gln Val Val Leu Asn Gly Lys Val Asp Ala Phe Cys Gly Gly

195 200 205

Ser Ile Val Asn Glu Lys Trp Ile Val Thr Ala Ala His Cys Val Glu

210 215 220

Thr Gly Val Lys Ile Thr Val Val Ala Gly Glu His Asn Ile Glu Glu

225 230 235 240

Thr Glu His Thr Glu Gln Lys Arg Asn Val Ile Arg Ile Ile Pro His

245 250 255

His Asn Tyr Asn Ala Ala Ile Asn Lys Tyr Asn His Asp Ile Ala Leu

260 265 270

Leu Glu Leu Asp Glu Pro Leu Val Leu Asn Ser Tyr Val Thr Pro Ile

275 280 285

Cys Ile Ala Asp Lys Glu Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser

290 295 300

Gly Tyr Val Ser Gly Trp Gly Arg Val Phe His Lys Gly Arg Ser Ala

305 310 315 320

Leu Val Leu Gln Tyr Leu Arg Val Pro Leu Val Asp Arg Ala Thr Cys

325 330 335

Leu Arg Ser Thr Lys Phe Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly

340 345 350

Phe His Glu Gly Gly Arg Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro

355 360 365

His Val Thr Glu Val Glu Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser

370 375 380

Trp Gly Glu Glu Cys Ala Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys

385 390 395 400

Val Ser Arg Tyr Val Asn Trp Ile Lys Glu Lys Thr Lys Leu Thr Pro

405 410 415

Val Ser Gln Thr Ser Lys Leu Thr Arg Ala Glu Thr Val Phe Pro Asp

420 425 430

Val Asp Ala His Lys Ser Glu Val Ala His Arg Phe Lys Asp Leu Gly

435 440 445

Glu Glu Asn Phe Lys Ala Leu Val Leu Ile Ala Phe Ala Gln Tyr Leu

450 455 460

Gln Gln Cys Pro Phe Glu Asp His Val Lys Leu Val Asn Glu Val Thr

465 470 475 480

Glu Phe Ala Lys Thr Cys Val Ala Asp Glu Ser Ala Glu Asn Cys Asp

485 490 495

Lys Ser Leu His Thr Leu Phe Gly Asp Lys Leu Cys Thr Val Ala Thr

500 505 510

Leu Arg Glu Thr Tyr Gly Glu Met Ala Asp Cys Cys Ala Lys Gln Glu

515 520 525

Pro Glu Arg Asn Glu Cys Phe Leu Gln His Lys Asp Asp Asn Pro Asn

530 535 540

Leu Pro Arg Leu Val Arg Pro Glu Val Asp Val Met Cys Thr Ala Phe

545 550 555 560

His Asp Asn Glu Glu Thr Phe Leu Lys Lys Tyr Leu Tyr Glu Ile Ala

565 570 575

Arg Arg His Pro Tyr Phe Tyr Ala Pro Glu Leu Leu Phe Phe Ala Lys

580 585 590

Arg Tyr Lys Ala Ala Phe Thr Glu Cys Cys Gln Ala Ala Asp Lys Ala

595 600 605

Ala Cys Leu Leu Pro Lys Leu Asp Glu Leu Arg Asp Glu Gly Lys Ala

610 615 620

Ser Ser Ala Lys Gln Arg Leu Lys Cys Ala Ser Leu Gln Lys Phe Gly

625 630 635 640

Glu Arg Ala Phe Lys Ala Trp Ala Val Ala Arg Leu Ser Gln Arg Phe

645 650 655

Pro Lys Ala Glu Phe Ala Glu Val Ser Lys Leu Val Thr Asp Leu Thr

660 665 670

Lys Val His Thr Glu Cys Cys His Gly Asp Leu Leu Glu Cys Ala Asp

675 680 685

Asp Arg Ala Asp Leu Ala Lys Tyr Ile Cys Glu Asn Gln Asp Ser Ile

690 695 700

Ser Ser Lys Leu Lys Glu Cys Cys Glu Lys Pro Leu Leu Glu Lys Ser

705 710 715 720

His Cys Ile Ala Glu Val Glu Asn Asp Glu Met Pro Ala Asp Leu Pro

725 730 735

Ser Leu Ala Ala Asp Phe Val Glu Ser Lys Asp Val Cys Lys Asn Tyr

740 745 750

Ala Glu Ala Lys Asp Val Phe Leu Gly Met Phe Leu Tyr Glu Tyr Ala

755 760 765

Arg Arg His Pro Asp Tyr Ser Val Val Leu Leu Leu Arg Leu Ala Lys

770 775 780

Thr Tyr Glu Thr Thr Leu Glu Lys Cys Cys Ala Ala Ala Asp Phe Cys

785 790 795 800

Tyr Ala Lys Val Phe Asp Glu Phe Lys Pro Leu Val Glu Glu Pro Gln

805 810 815

Asn Leu Ile Lys Gln Asn Cys Glu Leu Phe Glu Gln Leu Gly Glu Tyr

820 825 830

Lys Phe Gln Asn Ala Leu Leu Val Arg Tyr Thr Lys Lys Val Pro Gln

835 840 845

Val Ser Thr Pro Thr Leu Val Glu Val Ser Arg Asn Leu Gly Lys Val

850 855 860

Gly Ser Lys Cys Cys Lys His Pro Glu Ala Lys Arg Met Pro Cys Ala

865 870 875 880

Glu Asp Tyr Leu Ser Val Val Leu Asn Gln Leu Cys Val Leu His Glu

885 890 895

Lys Thr Pro Val Ser Asp Arg Val Thr Lys Cys Cys Thr Glu Ser Leu

900 905 910

Val Asn Arg Arg Pro Cys Phe Ser Ala Leu Glu Val Asp Glu Thr Tyr

915 920 925

Val Pro Lys Glu Phe Asn Ala Glu Thr Phe Thr Phe His Ala Asp Ile

930 935 940

Cys Thr Leu Ser Glu Lys Glu Arg Gln Ile Lys Lys Gln Thr Ala Leu

945 950 955 960

Val Glu Leu Val Lys His Lys Pro Lys Ala Thr Lys Glu Gln Leu Lys

965 970 975

Ala Val Met Asp Asp Phe Ala Ala Phe Val Glu Lys Cys Cys Lys Ala

980 985 990

Asp Asp Lys Glu Thr Cys Phe Ala Glu Glu Gly Lys Lys Leu Val Ala

995 1000 1005

Ala Ser Gln Ala Ala Leu Gly Leu

1010 1015

<210> 161

<211> 424

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> FIX

<400> 161

Tyr Asn Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg

1. 5 10 15

Glu Cys Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe

20 25 30

Glu Asn Thr Glu Arg Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly

35 40 45

Asp Gln Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp

50 55 60

Asp Ile Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys

65 70 75 80

Asn Cys Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu

85 90 95

Gln Phe Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr

100 105 110

Glu Gly Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val

115 120 125

Pro Phe Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr

130 135 140

Arg Ala Glu Thr Val Phe Pro Asp Val Asp Tyr Val Asn Ser Thr Glu

145 150 155 160

Ala Glu Thr Ile Leu Asp Asn Ile Thr Gln Ser Thr Gln Ser Phe Asn

165 170 175

Asp Phe Thr Arg Val Val Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe

180 185 190

Pro Trp Gln Val Val Leu Asn Gly Lys Val Asp Ala Phe Cys Gly Gly

195 200 205

Ser Ile Val Asn Glu Lys Trp Ile Val Thr Ala Ala His Cys Val Glu

210 215 220

Thr Gly Val Lys Ile Thr Val Val Ala Gly Glu His Asn Ile Glu Glu

225 230 235 240

Thr Glu His Thr Glu Gln Lys Arg Asn Val Ile Arg Ile Ile Pro His

245 250 255

His Asn Tyr Asn Ala Ala Ile Asn Lys Tyr Asn His Asp Ile Ala Leu

260 265 270

Leu Glu Leu Asp Glu Pro Leu Val Leu Asn Ser Tyr Val Thr Pro Ile

275 280 285

Cys Ile Ala Asp Lys Glu Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser

290 295 300

Gly Tyr Val Ser Gly Trp Gly Arg Val Phe His Lys Gly Arg Ser Ala

305 310 315 320

Leu Val Leu Gln Tyr Leu Arg Val Pro Leu Val Asp Arg Ala Thr Cys

325 330 335

Leu Arg Ser Thr Lys Phe Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly

340 345 350

Phe His Glu Gly Gly Arg Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro

355 360 365

His Val Thr Glu Val Glu Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser

370 375 380

Trp Gly Glu Glu Cys Ala Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys

385 390 395 400

Val Ser Arg Tyr Val Asn Trp Ile Lys Glu Lys Thr Lys Leu Thr Pro

405 410 415

Val Ser Gln Thr Ser Lys Leu Thr

420

<210> 162

<211> 9

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Линкер

<400> 162

Arg Ala Glu Thr Val Phe Pro Asp Val

1. 5

<210> 163

<211> 585

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Альбумин

<400> 163

Asp Ala His Lys Ser Glu Val Ala His Arg Phe Lys Asp Leu Gly Glu

1. 5 10 15

Glu Asn Phe Lys Ala Leu Val Leu Ile Ala Phe Ala Gln Tyr Leu Gln

20 25 30

Gln Cys Pro Phe Glu Asp His Val Lys Leu Val Asn Glu Val Thr Glu

35 40 45

Phe Ala Lys Thr Cys Val Ala Asp Glu Ser Ala Glu Asn Cys Asp Lys

50 55 60

Ser Leu His Thr Leu Phe Gly Asp Lys Leu Cys Thr Val Ala Thr Leu

65 70 75 80

Arg Glu Thr Tyr Gly Glu Met Ala Asp Cys Cys Ala Lys Gln Glu Pro

85 90 95

Glu Arg Asn Glu Cys Phe Leu Gln His Lys Asp Asp Asn Pro Asn Leu

100 105 110

Pro Arg Leu Val Arg Pro Glu Val Asp Val Met Cys Thr Ala Phe His

115 120 125

Asp Asn Glu Glu Thr Phe Leu Lys Lys Tyr Leu Tyr Glu Ile Ala Arg

130 135 140

Arg His Pro Tyr Phe Tyr Ala Pro Glu Leu Leu Phe Phe Ala Lys Arg

145 150 155 160

Tyr Lys Ala Ala Phe Thr Glu Cys Cys Gln Ala Ala Asp Lys Ala Ala

165 170 175

Cys Leu Leu Pro Lys Leu Asp Glu Leu Arg Asp Glu Gly Lys Ala Ser

180 185 190

Ser Ala Lys Gln Arg Leu Lys Cys Ala Ser Leu Gln Lys Phe Gly Glu

195 200 205

Arg Ala Phe Lys Ala Trp Ala Val Ala Arg Leu Ser Gln Arg Phe Pro

210 215 220

Lys Ala Glu Phe Ala Glu Val Ser Lys Leu Val Thr Asp Leu Thr Lys

225 230 235 240

Val His Thr Glu Cys Cys His Gly Asp Leu Leu Glu Cys Ala Asp Asp

245 250 255

Arg Ala Asp Leu Ala Lys Tyr Ile Cys Glu Asn Gln Asp Ser Ile Ser

260 265 270

Ser Lys Leu Lys Glu Cys Cys Glu Lys Pro Leu Leu Glu Lys Ser His

275 280 285

Cys Ile Ala Glu Val Glu Asn Asp Glu Met Pro Ala Asp Leu Pro Ser

290 295 300

Leu Ala Ala Asp Phe Val Glu Ser Lys Asp Val Cys Lys Asn Tyr Ala

305 310 315 320

Glu Ala Lys Asp Val Phe Leu Gly Met Phe Leu Tyr Glu Tyr Ala Arg

325 330 335

Arg His Pro Asp Tyr Ser Val Val Leu Leu Leu Arg Leu Ala Lys Thr

340 345 350

Tyr Glu Thr Thr Leu Glu Lys Cys Cys Ala Ala Ala Asp Pro His Glu

355 360 365

Cys Tyr Ala Lys Val Phe Asp Glu Phe Lys Pro Leu Val Glu Glu Pro

370 375 380

Gln Asn Leu Ile Lys Gln Asn Cys Glu Leu Phe Glu Gln Leu Gly Glu

385 390 395 400

Tyr Lys Phe Gln Asn Ala Leu Leu Val Arg Tyr Thr Lys Lys Val Pro

405 410 415

Gln Val Ser Thr Pro Thr Leu Val Glu Val Ser Arg Asn Leu Gly Lys

420 425 430

Val Gly Ser Lys Cys Cys Lys His Pro Glu Ala Lys Arg Met Pro Cys

435 440 445

Ala Glu Asp Tyr Leu Ser Val Val Leu Asn Gln Leu Cys Val Leu His

450 455 460

Glu Lys Thr Pro Val Ser Asp Arg Val Thr Lys Cys Cys Thr Glu Ser

465 470 475 480

Leu Val Asn Arg Arg Pro Cys Phe Ser Ala Leu Glu Val Asp Glu Thr

485 490 495

Tyr Val Pro Lys Glu Phe Asn Ala Glu Thr Phe Thr Phe His Ala Asp

500 505 510

Ile Cys Thr Leu Ser Glu Lys Glu Arg Gln Ile Lys Lys Gln Thr Ala

515 520 525

Leu Val Glu Leu Val Lys His Lys Pro Lys Ala Thr Lys Glu Gln Leu

530 535 540

Lys Ala Val Met Asp Asp Phe Ala Ala Phe Val Glu Lys Cys Cys Lys

545 550 555 560

Ala Asp Asp Lys Glu Thr Cys Phe Ala Glu Glu Gly Lys Lys Leu Val

565 570 575

Ala Ala Ser Gln Ala Ala Leu Gly Leu

580 585

<210> 164

<211> 763

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> FIX(XTEN)-Fc

<400> 164

Met Gln Arg Val Asn Met Ile Met Ala Glu Ser Pro Gly Leu Ile Thr

1. 5 10 15

Ile Cys Leu Leu Gly Tyr Leu Leu Ser Ala Glu Cys Thr Val Phe Leu

20 25 30

Asp His Glu Asn Ala Asn Lys Ile Leu Asn Arg Pro Lys Arg Tyr Asn

35 40 45

Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg Glu Cys

50 55 60

Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe Glu Asn

65 70 75 80

Thr Glu Arg Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly Asp Gln

85 90 95

Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp Asp Ile

100 105 110

Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys Asn Cys

115 120 125

Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu Gln Phe

130 135 140

Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr Glu Gly

145 150 155 160

Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val Pro Phe

165 170 175

Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr Arg Ala

180 185 190

Glu Thr Val Phe Pro Asp Val Asp Tyr Val Asn Ser Thr Glu Ala Glu

195 200 205

Thr Ile Leu Asp Gly Pro Ser Pro Gly Ser Pro Thr Ser Thr Glu Glu

210 215 220

Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro

225 230 235 240

Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro

245 250 255

Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro

260 265 270

Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ala Ser Ser

275 280 285

Asn Ile Thr Gln Ser Thr Gln Ser Phe Asn Asp Phe Thr Arg Val Val

290 295 300

Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe Pro Trp Gln Val Val Leu

305 310 315 320

Asn Gly Lys Val Asp Ala Phe Cys Gly Gly Ser Ile Val Asn Glu Lys

325 330 335

Trp Ile Val Thr Ala Ala His Cys Val Glu Thr Gly Val Lys Ile Thr

340 345 350

Val Val Ala Gly Glu His Asn Ile Glu Glu Thr Glu His Thr Glu Gln

355 360 365

Lys Arg Asn Val Ile Arg Ile Ile Pro His His Asn Tyr Asn Ala Ala

370 375 380

Ile Asn Lys Tyr Asn His Asp Ile Ala Leu Leu Glu Leu Asp Glu Pro

385 390 395 400

Leu Val Leu Asn Ser Tyr Val Thr Pro Ile Cys Ile Ala Asp Lys Glu

405 410 415

Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser Gly Tyr Val Ser Gly Trp

420 425 430

Gly Arg Val Phe His Lys Gly Arg Ser Ala Leu Val Leu Gln Tyr Leu

435 440 445

Arg Val Pro Leu Val Asp Arg Ala Thr Cys Leu Leu Ser Thr Lys Phe

450 455 460

Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly Phe His Glu Gly Gly Arg

465 470 475 480

Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro His Val Thr Glu Val Glu

485 490 495

Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser Trp Gly Glu Glu Cys Ala

500 505 510

Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys Val Ser Arg Tyr Val Asn

515 520 525

Trp Ile Lys Glu Lys Thr Lys Leu Thr Asp Lys Thr His Thr Cys Pro

530 535 540

Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe

545 550 555 560

Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val

565 570 575

Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe

580 585 590

Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro

595 600 605

Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr

610 615 620

Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val

625 630 635 640

Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala

645 650 655

Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg

660 665 670

Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly

675 680 685

Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro

690 695 700

Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser

705 710 715 720

Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln

725 730 735

Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His

740 745 750

Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly

755 760

<210> 165

<211> 712

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> FIX-FXIa-AE288

<400> 165

Tyr Asn Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg

1. 5 10 15

Glu Cys Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe

20 25 30

Glu Asn Thr Glu Arg Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly

35 40 45

Asp Gln Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp

50 55 60

Asp Ile Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys

65 70 75 80

Asn Cys Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu

85 90 95

Gln Phe Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr

100 105 110

Glu Gly Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val

115 120 125

Pro Phe Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr

130 135 140

Arg Ala Glu Thr Val Phe Pro Asp Val Asp Tyr Val Asn Ser Thr Glu

145 150 155 160

Ala Glu Thr Ile Leu Asp Asn Ile Thr Gln Ser Thr Gln Ser Phe Asn

165 170 175

Asp Phe Thr Arg Val Val Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe

180 185 190

Pro Trp Gln Val Val Leu Asn Gly Lys Val Asp Ala Phe Cys Gly Gly

195 200 205

Ser Ile Val Asn Glu Lys Trp Ile Val Thr Ala Ala His Cys Val Glu

210 215 220

Thr Gly Val Lys Ile Thr Val Val Ala Gly Glu His Asn Ile Glu Glu

225 230 235 240

Thr Glu His Thr Glu Gln Lys Arg Asn Val Ile Arg Ile Ile Pro His

245 250 255

His Asn Tyr Asn Ala Ala Ile Asn Lys Tyr Asn His Asp Ile Ala Leu

260 265 270

Leu Glu Leu Asp Glu Pro Leu Val Leu Asn Ser Tyr Val Thr Pro Ile

275 280 285

Cys Ile Ala Asp Lys Glu Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser

290 295 300

Gly Tyr Val Ser Gly Trp Gly Arg Val Phe His Lys Gly Arg Ser Ala

305 310 315 320

Leu Val Leu Gln Tyr Leu Arg Val Pro Leu Val Asp Arg Ala Thr Cys

325 330 335

Leu Arg Ser Thr Lys Phe Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly

340 345 350

Phe His Glu Gly Gly Arg Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro

355 360 365

His Val Thr Glu Val Glu Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser

370 375 380

Trp Gly Glu Glu Cys Ala Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys

385 390 395 400

Val Ser Arg Tyr Val Asn Trp Ile Lys Glu Lys Thr Lys Leu Thr Gly

405 410 415

Lys Leu Thr Arg Ala Glu Thr Gly Gly Thr Ser Glu Ser Ala Thr Pro

420 425 430

Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro

435 440 445

Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro

450 455 460

Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro

465 470 475 480

Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro

485 490 495

Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu

500 505 510

Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly

515 520 525

Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro

530 535 540

Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Ser Pro Ala

545 550 555 560

Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu

565 570 575

Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro

580 585 590

Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Glu

595 600 605

Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly

610 615 620

Ser Glu Thr Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro

625 630 635 640

Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr

645 650 655

Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu

660 665 670

Gly Ser Ala Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro

675 680 685

Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr

690 695 700

Glu Pro Ser Glu Gly Ser Ala Pro

705 710

<210> 166

<211> 944

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> FIX-Fc-Fc

<400> 166

Met Gln Arg Val Asn Met Ile Met Ala Glu Ser Pro Gly Leu Ile Thr

1. 5 10 15

Ile Cys Leu Leu Gly Tyr Leu Leu Ser Ala Glu Cys Thr Val Phe Leu

20 25 30

Asp His Glu Asn Ala Asn Lys Ile Leu Asn Arg Pro Lys Arg Tyr Asn

35 40 45

Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg Glu Cys

50 55 60

Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe Glu Asn

65 70 75 80

Thr Glu Arg Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly Asp Gln

85 90 95

Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp Asp Ile

100 105 110

Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys Asn Cys

115 120 125

Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu Gln Phe

130 135 140

Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr Glu Gly

145 150 155 160

Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val Pro Phe

165 170 175

Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr Arg Ala

180 185 190

Glu Thr Val Phe Pro Asp Val Asp Tyr Val Asn Ser Thr Glu Ala Glu

195 200 205

Thr Ile Leu Asp Asn Ile Thr Gln Ser Thr Gln Ser Phe Asn Asp Phe

210 215 220

Thr Arg Val Val Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe Pro Trp

225 230 235 240

Gln Val Val Leu Asn Gly Lys Val Asp Ala Phe Cys Gly Gly Ser Ile

245 250 255

Val Asn Glu Lys Trp Ile Val Thr Ala Ala His Cys Val Glu Thr Gly

260 265 270

Val Lys Ile Thr Val Val Ala Gly Glu His Asn Ile Glu Glu Thr Glu

275 280 285

His Thr Glu Gln Lys Arg Asn Val Ile Arg Ile Ile Pro His His Asn

290 295 300

Tyr Asn Ala Ala Ile Asn Lys Tyr Asn His Asp Ile Ala Leu Leu Glu

305 310 315 320

Leu Asp Glu Pro Leu Val Leu Asn Ser Tyr Val Thr Pro Ile Cys Ile

325 330 335

Ala Asp Lys Glu Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser Gly Tyr

340 345 350

Val Ser Gly Trp Gly Arg Val Phe His Lys Gly Arg Ser Ala Leu Val

355 360 365

Leu Gln Tyr Leu Arg Val Pro Leu Val Asp Arg Ala Thr Cys Leu Arg

370 375 380

Ser Thr Lys Phe Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly Phe His

385 390 395 400

Glu Gly Gly Arg Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro His Val

405 410 415

Thr Glu Val Glu Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser Trp Gly

420 425 430

Glu Glu Cys Ala Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys Val Ser

435 440 445

Arg Tyr Val Asn Trp Ile Lys Glu Lys Thr Lys Leu Thr Asp Lys Thr

450 455 460

His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser

465 470 475 480

Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg

485 490 495

Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro

500 505 510

Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala

515 520 525

Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val

530 535 540

Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr

545 550 555 560

Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr

565 570 575

Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu

580 585 590

Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys

595 600 605

Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser

610 615 620

Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp

625 630 635 640

Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser

645 650 655

Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala

660 665 670

Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys

675 680 685

Arg Arg Arg Arg Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly

690 695 700

Gly Gly Gly Ser Gly Gly Gly Gly Ser Arg Arg Arg Arg Asp Lys Thr

705 710 715 720

His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser

725 730 735

Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg

740 745 750

Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro

755 760 765

Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala

770 775 780

Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val

785 790 795 800

Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr

805 810 815

Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr

820 825 830

Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu

835 840 845

Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys

850 855 860

Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser

865 870 875 880

Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp

885 890 895

Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser

900 905 910

Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala

915 920 925

Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys

930 935 940

<210> 167

<211> 383

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Парвовирус B19 KY940273.1

<400> 167

ccaaatcaga tgccgccggt cgccgccggt aggcgggact tccggtacaa gatggcggac

60

aattacgtca tttcctgtga cgtcatttcc tgtgacgtca cttccggtgg gcgggacttc

120

cggaattagg gttggctctg ggccagcttg cttggggttg ccttgacact aagacaagcg

180

gcgcgccgct tgatcttagt ggcacgtcaa ccccaagcgc tggcccagag ccaaccctaa

240

ttccggaagt cccgcccacc ggaagtgacg tcacaggaaa tgacgtcaca ggaaatgacg

300

taattgtccg ccatcttgta ccggaagtcc cgcctaccgg cggcgaccgg cggcatctga

360

tttggtgtct tcttttaaat ttt

383

<210> 168

<211> 248

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Парвовирус B19 d135

<400> 168

ctctgggcca gcttgcttgg ggttgccttg acactaagac aagcggcgcg ccgcttgatc

60

ttagtggcac gtcaacccca agcgctggcc cagagccaac cctaattccg gaagtcccgc

120

ccaccggaag tgacgtcaca ggaaatgacg tcacaggaaa tgacgtaatt gtccgccatc

180

ttgtaccgga agtcccgcct accggcggcg accggcggca tctgatttgg tgtcttcttt

240

taaatttt

248

<210> 169

<211> 129

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Парвовирус v1 AAV2

<400> 169

cggcgcgccg cttgatctta gtggcacgtc aaccagcgct ggcccagagc caaccctaat

60

tccggaagtc ctcagtccgc catcttgccc gcctaccggc ggcgaccggc ggcatcattt

120

ggtgttctt

129

<210> 170

<211> 113

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Парвовирус V2

<400> 170

ctctgggcca gcttgcttgg ggttgccttg acactaagac aagcggcgcg ccgcttgatc

60

ttagtggcac gtcaacccca agcgctggcc cagagtgtct tcttttaaat ttt

113

<210> 171

<211> 340

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Парвовирус V3

<400> 171

caaatcagat gccgccggtc gccgccggta ggcgggactt ccggtacaag atggcggaca

60

attacgtcat ttcctgtgac gtatttcctg tgacgtactt ccggtggcgg gacttccgga

120

attttggctc tgggccagct tgcttggggt tgccttgacc aagcgcgcgc cgcttgatca

180

ccccaagcgc tggcccagag ccacctaacc ggaagtcccc ccaccggaag tgacgtcaca

240

ggaaagacgt cacaggaagt aattgtccgc catcttgtac cggaagtccc gcaccggcgg

300

cgaccggcgg catctgattt ggtgtcttct tttaaatttt

340

<210> 172

<211> 444

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Парвовирус U25749.1

<400> 172

ctcattggag ggttcgttcg ttcgaaccag ccaatcaggg gagggggaag tgacgcaagt

60

tccggtcaca tgcttccggt gacgcacatc cggtgacgta gttccggtca cgtgcttcct

120

gtcacgtgtt tccggtcacg tgacttccgg tcatgtgact tccggtgacg tgtttccggc

180

tgttaggttg accacgcgca tgccgcgcgg tcagcccaat agttaagccg gaaacacgtc

240

accggaagtc acatgaccgg aagtcacgtg accggaaaca cgtgacagga agcacgtgac

300

cggaactacg tcaccggatg tgcgtcaccg gaagcatgtg accggaactt gcgtcacttc

360

cccctcccct gattggctgg ttcgaacgaa cgaaccctcc aatgagactc aaggacaaga

420

ggatattttg cgcgccagga agtg

444

<210> 173

<211> 282

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Парвовирус GPV AAV2 V1

<400> 173

cggtgacgtg tttccggctg ttaggttgac cacgcgcatg ccgcgcggtc agcccaatag

60

ttaagccgga aacacgtcac cggaagtcac atgaccggaa gtcacgtgac cggaaacacg

120

tgacaggaag cacgtgaccg gaactacgtc accggatgtg cgtcaccgga agcatgtgac

180

cggaacttgc gtcacttccc cctcccctga ttggctggtt cgaacgaacg aaccctccaa

240

tgagactcaa ggacaagagg atattttgcg cgccaggaag tg

282

<210> 174

<211> 145

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Парвовирус GPV AAV2 V1

<400> 174

ttgaccacgc gcatgccgcg cggtcagccc aatagttaag ccgggtgacc acacgtgaca

60

ggaagcacgg gatgtgcgtc accggaagca gtgaccgggc tggttcgaac gaacgaaccc

120

tccaactcaa ggacaagagg atatt

145

<210> 175

<211> 120

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Парвовирус GPV V2

<400> 175

cggtgacgtg tttccggctg ttaggttgac cacgcgcatg ccgcgcggtc agcccaatag

60

ttaagccgga aacacgtcac cgactcaagg acaagaggat attttgcgcg ccaggaagtg

120

<210> 176

<211> 102

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Парвовирус GPV V3

<400> 176

gggaacaatc aggggaagtg accggtgacg tcatgtaact tgcgtcactt cccgttcgaa

60

cgaacgaacg agactcaagg acaagaggcg cgccaggaag tg

102

<210> 177

<211> 145

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Парвовирус AAV2 NC_001401.2

<400> 177

ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc

60

cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg

120

gccaactcca tcactagggg ttcct

145

<210> 178

<211> 130

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Парвовирус Gtx

<400> 178

ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt

60

ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact

120

aggggttcct

130

<210> 179

<211> 6762

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Конструкция B19-FVIII

<400> 179

ctctgggcca gcttgcttgg ggttgccttg acactaagac aagcggcgcg ccgcttgatc

60

ttagtggcac gtcaacccca agcgctggcc cagagccaac cctaattccg gaagtcccgc

120

ccaccggaag tgacgtcaca ggaaatgacg tcacaggaaa tgacgtaatt gtccgccatc

180

ttgtaccgga agtcccgcct accggcggcg accggcggca tctgatttgg tgtcttcttt

240

taaattttgc ggcaattcag tcgataacta taacggtcct aaggtagcga tttaaatacg

300

cgctctctta aggtagcccc gggacgcgtc aattgagatc tggatccggt accgaattcg

360

cggccgcctc gacgactagc gtttaattaa acgcgtgtct gtctgcacat ttcgtagagc

420

gagtgttccg atactctaat ctccctaggc aaggttcata tttgtgtagg ttacttattc

480

tccttttgtt gactaagtca ataatcagaa tcagcaggtt tggagtcagc ttggcaggga

540

tcagcagcct gggttggaag gagggggtat aaaagcccct tcaccaggag aagccgtcac

600

acagatccac aagctcctga ggtaagtgcc gtgtgtggtt cccgcgggcc tggcctcttt

660

acgggttatg gcccttgcgt gccttgaatt actgacactg acatccactt tttctttttc

720

tccacagcta gcgccaccat gcagattgag ctgtccactt gtttcttcct gtgcctcctg

780

cgcttctgtt tctccgccac tcgccggtac taccttggag ccgtggagct ttcatgggac

840

tacatgcaga gcgacctggg cgaactcccc gtggatgcca gattcccccc ccgcgtgcca

900

aagtccttcc cctttaacac ctccgtggtg tacaagaaaa ccctctttgt cgagttcact

960

gaccacctgt tcaacatcgc caagccgcgc ccaccttgga tgggcctcct gggaccgacc

1020

attcaagctg aagtgtacga caccgtggtg atcaccctga agaacatggc gtcccacccc

1080

gtgtccctgc atgcggtcgg agtgtcctac tggaaggcct ccgaaggagc tgagtacgac

1140

gaccagacta gccagcggga aaaggaggac gataaagtgt tcccgggcgg ctcgcatact

1200

tacgtgtggc aagtcctgaa ggaaaacgga cctatggcat ccgatcctct gtgcctgact

1260

tactcctacc tttcccatgt ggacctcgtg aaggacctga acagcgggct gattggtgca

1320

cttctcgtgt gccgcgaagg ttcgctcgct aaggaaaaga cccagaccct ccataagttc

1380

atccttttgt tcgctgtgtt cgatgaagga aagtcatggc attccgaaac taagaactcg

1440

ctgatgcagg accgggatgc cgcctcagcc cgcgcctggc ctaaaatgca tacagtcaac

1500

ggatacgtga atcggtcact gcccgggctc atcggttgtc acagaaagtc cgtgtactgg

1560

cacgtcatcg gcatgggcac tacgcctgaa gtgcactcca tcttcctgga agggcacacc

1620

ttcctcgtgc gcaaccaccg ccaggcctct ctggaaatct ccccgattac ctttctgacc

1680

gcccagactc tgctcatgga cctggggcag ttccttctct tctgccacat ctccagccat

1740

cagcacgacg gaatggaggc ctacgtgaag gtggactcat gcccggaaga acctcagttg

1800

cggatgaaga acaacgagga ggccgaggac tatgacgacg atttgactga ctccgagatg

1860

gacgtcgtgc ggttcgatga cgacaacagc cccagcttca tccagattcg cagcgtggcc

1920

aagaagcacc ccaaaacctg ggtgcactac atcgcggccg aggaagaaga ttgggactac

1980

gccccgttgg tgctggcacc cgatgaccgg tcgtacaagt cccagtatct gaacaatggt

2040

ccgcagcgga ttggcagaaa gtacaagaaa gtgcggttca tggcgtacac tgacgaaacg

2100

tttaagaccc gggaggccat tcaacatgag agcggcattc tgggaccact gctgtacgga

2160

gaggtcggcg ataccctgct catcatcttc aaaaaccagg cctcccggcc ttacaacatc

2220

taccctcacg gaatcaccga cgtgcggcca ctctactcgc ggcgcctgcc gaagggcgtc

2280

aagcacctga aagacttccc tatcctgccg ggcgaaatct tcaagtataa gtggaccgtc

2340

accgtggagg acgggcccac caagagcgat cctaggtgtc tgactcggta ctactccagc

2400

ttcgtgaaca tggaacggga cctggcatcg ggactcattg gaccgctgct gatctgctac

2460

aaagagtcgg tggatcaacg cggcaaccag atcatgtccg acaagcgcaa cgtgatcctg

2520

ttctccgtgt ttgatgaaaa cagatcctgg tacctcactg aaaacatcca gaggttcctc

2580

ccaaaccccg caggagtgca actggaggac cctgagtttc aggcctcgaa tatcatgcac

2640

tcgattaacg gttacgtgtt cgactcgctg caactgagcg tgtgcctcca tgaagtcgct

2700

tactggtaca ttctgtccat cggcgcccag actgacttcc tgagcgtgtt cttttccggt

2760

tacaccttta agcacaagat ggtgtacgaa gataccctga ccctgttccc tttctccggc

2820

gaaacggtgt tcatgtcgat ggagaacccg ggtctgtgga ttctgggatg ccacaacagc

2880

gactttcgga accgcggaat gactgccctg ctgaaggtgt cctcatgcga caagaacacc

2940

ggagactact acgaggactc ctacgaggat atctcagcct acctcctgtc caagaacaac

3000

gcgatcgagc cgcgcagctt cagccagaac ggcgcgccaa catcagagag cgccacccct

3060

gaaagtggtc ccgggagcga gccagccaca tctgggtcgg aaacgccagg cacaagtgag

3120

tctgcaactc ccgagtccgg acctggctcc gagcctgcca ctagcggctc cgagactccg

3180

ggaacttccg agagcgctac accagaaagc ggacccggaa ccagtaccga acctagcgag

3240

ggctctgctc cgggcagccc agccggctct cctacatcca cggaggaggg cacttccgaa

3300

tccgccaccc cggagtcagg gccaggatct gaacccgcta cctcaggcag tgagacgcca

3360

ggaacgagcg agtccgctac accggagagt gggccaggga gccctgctgg atctcctacg

3420

tccactgagg aagggtcacc agcgggctcg cccaccagca ctgaagaagg tgcctcgagc

3480

ccgcctgtgc tgaagaggca ccagcgagaa attacccgga ccaccctcca atcggatcag

3540

gaggaaatcg actacgacga caccatctcg gtggaaatga agaaggaaga tttcgatatc

3600

tacgacgagg acgaaaatca gtcccctcgc tcattccaaa agaaaactag acactacttt

3660

atcgccgcgg tggaaagact gtgggactat ggaatgtcat ccagccctca cgtccttcgg

3720

aaccgggccc agagcggatc ggtgcctcag ttcaagaaag tggtgttcca ggagttcacc

3780

gacggcagct tcacccagcc gctgtaccgg ggagaactga acgaacacct gggcctgctc

3840

ggtccctaca tccgcgcgga agtggaggat aacatcatgg tgaccttccg taaccaagca

3900

tccagacctt actccttcta ttcctccctg atctcatacg aggaggacca gcgccaaggc

3960

gccgagcccc gcaagaactt cgtcaagccc aacgagacta agacctactt ctggaaggtc

4020

caacaccata tggccccgac caaggatgag tttgactgca aggcctgggc ctacttctcc

4080

gacgtggacc ttgagaagga tgtccattcc ggcctgatcg ggccgctgct cgtgtgtcac

4140

accaacaccc tgaacccagc gcatggacgc caggtcaccg tccaggagtt tgctctgttc

4200

ttcaccattt ttgacgaaac taagtcctgg tacttcaccg agaatatgga gcgaaactgt

4260

agagcgccct gcaatatcca gatggaagat ccgactttca aggagaacta tagattccac

4320

gccatcaacg ggtacatcat ggatactctg ccggggctgg tcatggccca ggatcagagg

4380

attcggtggt acttgctgtc aatgggatcg aacgaaaaca ttcactccat tcacttctcc

4440

ggtcacgtgt tcactgtgcg caagaaggag gagtacaaga tggcgctgta caatctgtac

4500

cccggggtgt tcgaaactgt ggagatgctg ccgtccaagg ccggcatctg gagagtggag

4560

tgcctgatcg gagagcacct ccacgcgggg atgtccaccc tcttcctggt gtactcgaat

4620

aagtgccaga ccccgctggg catggcctcg ggccacatca gagacttcca gatcacagca

4680

agcggacaat acggccaatg ggcgccgaag ctggcccgct tgcactactc cggatcgatc

4740

aacgcatggt ccaccaagga accgttctcg tggattaagg tggacctcct ggcccctatg

4800

attatccacg gaattaagac ccagggcgcc aggcagaagt tctcctccct gtacatctcg

4860

caattcatca tcatgtacag cctggacggg aagaagtggc agacttacag gggaaactcc

4920

accggcaccc tgatggtctt tttcggcaac gtggattcct ccggcattaa gcacaacatc

4980

ttcaacccac cgatcatagc cagatatatt aggctccacc ccactcacta ctcaatccgc

5040

tcaactcttc ggatggaact catggggtgc gacctgaact cctgctccat gccgttgggg

5100

atggaatcaa aggctattag cgacgcccag atcaccgcga gctcctactt cactaacatg

5160

ttcgccacct ggagcccctc caaggccagg ctgcacttgc agggacggtc aaatgcctgg

5220

cggccgcaag tgaacaatcc gaaggaatgg cttcaagtgg atttccaaaa gaccatgaaa

5280

gtgaccggag tcaccaccca gggagtgaag tcccttctga cctcgatgta tgtgaaggag

5340

ttcctgatta gcagcagcca ggacgggcac cagtggaccc tgttcttcca aaacggaaag

5400

gtcaaggtgt tccaggggaa ccaggactcg ttcacacccg tggtgaactc cctggacccc

5460

ccactgctga cgcggtactt gaggattcat cctcagtcct gggtccatca gattgcattg

5520

cgaatggaag tcctgggctg cgaggcccag gacctgtact gaatcagcct gagctcgctg

5580

atcataatca acctctggat tacaaaattt gtgaaagatt gactggtatt cttaactatg

5640

ttgctccttt tacgctatgt ggatacgctg ctttaatgcc tttgtatcat gctattgctt

5700

cccgtatggc tttcattttc tcctccttgt ataaatcctg gttgctgtct ctttatgagg

5760

agttgtggcc cgttgtcagg caacgtggcg tggtgtgcac tgtgtttgct gacgcaaccc

5820

ccactggttg gggcattgcc accacctgtc agctcctttc cgggactttc gctttccccc

5880

tccctattgc cacggcggaa ctcatcgccg cctgccttgc ccgctgctgg acaggggctc

5940

ggctgttggg cactgacaat tccgtggtgt tgtcggggaa atcatcgtcc tttccttggc

6000

tgctcgcctg tgttgccacc tggattctgc gcgggacgtc cttctgctac gtcccttcgg

6060

ccctcaatcc agcggacctt ccttcccgcg gcctgctgcc ggctctgcgg cctcttccgc

6120

gtcttcgcct tcgccctcag acgagtcgga tctccctttg ggccgcctcc ccgctgatca

6180

gcctcgactg tgccttctag ttgccagcca tctgttgttt gcccctcccc cgtgccttcc

6240

ttgaccctgg aaggtgccac tcccactgtc ctttcctaat aaaatgagga aattgcatcg

6300

cattgtctga gtaggtgtca ttctattctg gggggtgggg tggggcagga cagcaagggg

6360

gaggattggg aagacaatag caggcatgct ggggatgcgg tgggctctat ggcttctgag

6420

gcggaaagaa cgggctcgag aagcttctag atatcctctc ttaaggtagc atcgagattt

6480

aaattaggga taacagggta atggcgcggg ccgcaaaatt taaaagaaga caccaaatca

6540

gatgccgccg gtcgccgccg gtaggcggga cttccggtac aagatggcgg acaattacgt

6600

catttcctgt gacgtcattt cctgtgacgt cacttccggt gggcgggact tccggaatta

6660

gggttggctc tgggccagcg cttggggttg acgtgccact aagatcaagc ggcgcgccgc

6720

ttgtcttagt gtcaaggcaa ccccaagcaa gctggcccag ag

6762

<210> 180

<211> 248

<212> ДНК

<213> Искусственная последовательность

<220>

<223> 5'-ITR

<400> 180

ctctgggcca gcttgcttgg ggttgccttg acactaagac aagcggcgcg ccgcttgatc

60

ttagtggcac gtcaacccca agcgctggcc cagagccaac cctaattccg gaagtcccgc

120

ccaccggaag tgacgtcaca ggaaatgacg tcacaggaaa tgacgtaatt gtccgccatc

180

ttgtaccgga agtcccgcct accggcggcg accggcggca tctgatttgg tgtcttcttt

240

taaatttt

248

<210> 181

<211> 248

<212> ДНК

<213> Искусственная последовательность

<220>

<223> 3'-ITR инвертированный концевой повтор

<400> 181

ctctgggcca gcttgcttgg ggttgccttg acactaagac aagcggcgcg ccgcttgatc

60

ttagtggcac gtcaacccca agcgctggcc cagagccaac cctaattccg gaagtcccgc

120

ccaccggaag tgacgtcaca ggaaatgacg tcacaggaaa tgacgtaatt gtccgccatc

180

ttgtaccgga agtcccgcct accggcggcg accggcggca tctgatttgg tgtcttcttt

240

taaatttt

248

<210> 182

<211> 6830

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Конструкция GPV-FVIII

<400> 182

cggtgacgtg tttccggctg ttaggttgac cacgcgcatg ccgcgcggtc agcccaatag

60

ttaagccgga aacacgtcac cggaagtcac atgaccggaa gtcacgtgac cggaaacacg

120

tgacaggaag cacgtgaccg gaactacgtc accggatgtg cgtcaccgga agcatgtgac

180

cggaacttgc gtcacttccc cctcccctga ttggctggtt cgaacgaacg aaccctccaa

240

tgagactcaa ggacaagagg atattttgcg cgccaggaag tggcggcaat tcagtcgata

300

actataacgg tcctaaggta gcgatttaaa tacgcgctct cttaaggtag ccccgggacg

360

cgtcaattga gatctggatc cggtaccgaa ttcgcggccg cctcgacgac tagcgtttaa

420

ttaaacgcgt gtctgtctgc acatttcgta gagcgagtgt tccgatactc taatctccct

480

aggcaaggtt catatttgtg taggttactt attctccttt tgttgactaa gtcaataatc

540

agaatcagca ggtttggagt cagcttggca gggatcagca gcctgggttg gaaggagggg

600

gtataaaagc cccttcacca ggagaagccg tcacacagat ccacaagctc ctgaggtaag

660

tgccgtgtgt ggttcccgcg ggcctggcct ctttacgggt tatggccctt gcgtgccttg

720

aattactgac actgacatcc actttttctt tttctccaca gctagcgcca ccatgcagat

780

tgagctgtcc acttgtttct tcctgtgcct cctgcgcttc tgtttctccg ccactcgccg

840

gtactacctt ggagccgtgg agctttcatg ggactacatg cagagcgacc tgggcgaact

900

ccccgtggat gccagattcc ccccccgcgt gccaaagtcc ttccccttta acacctccgt

960

ggtgtacaag aaaaccctct ttgtcgagtt cactgaccac ctgttcaaca tcgccaagcc

1020

gcgcccacct tggatgggcc tcctgggacc gaccattcaa gctgaagtgt acgacaccgt

1080

ggtgatcacc ctgaagaaca tggcgtccca ccccgtgtcc ctgcatgcgg tcggagtgtc

1140

ctactggaag gcctccgaag gagctgagta cgacgaccag actagccagc gggaaaagga

1200

ggacgataaa gtgttcccgg gcggctcgca tacttacgtg tggcaagtcc tgaaggaaaa

1260

cggacctatg gcatccgatc ctctgtgcct gacttactcc tacctttccc atgtggacct

1320

cgtgaaggac ctgaacagcg ggctgattgg tgcacttctc gtgtgccgcg aaggttcgct

1380

cgctaaggaa aagacccaga ccctccataa gttcatcctt ttgttcgctg tgttcgatga

1440

aggaaagtca tggcattccg aaactaagaa ctcgctgatg caggaccggg atgccgcctc

1500

agcccgcgcc tggcctaaaa tgcatacagt caacggatac gtgaatcggt cactgcccgg

1560

gctcatcggt tgtcacagaa agtccgtgta ctggcacgtc atcggcatgg gcactacgcc

1620

tgaagtgcac tccatcttcc tggaagggca caccttcctc gtgcgcaacc accgccaggc

1680

ctctctggaa atctccccga ttacctttct gaccgcccag actctgctca tggacctggg

1740

gcagttcctt ctcttctgcc acatctccag ccatcagcac gacggaatgg aggcctacgt

1800

gaaggtggac tcatgcccgg aagaacctca gttgcggatg aagaacaacg aggaggccga

1860

ggactatgac gacgatttga ctgactccga gatggacgtc gtgcggttcg atgacgacaa

1920

cagccccagc ttcatccaga ttcgcagcgt ggccaagaag caccccaaaa cctgggtgca

1980

ctacatcgcg gccgaggaag aagattggga ctacgccccg ttggtgctgg cacccgatga

2040

ccggtcgtac aagtcccagt atctgaacaa tggtccgcag cggattggca gaaagtacaa

2100

gaaagtgcgg ttcatggcgt acactgacga aacgtttaag acccgggagg ccattcaaca

2160

tgagagcggc attctgggac cactgctgta cggagaggtc ggcgataccc tgctcatcat

2220

cttcaaaaac caggcctccc ggccttacaa catctaccct cacggaatca ccgacgtgcg

2280

gccactctac tcgcggcgcc tgccgaaggg cgtcaagcac ctgaaagact tccctatcct

2340

gccgggcgaa atcttcaagt ataagtggac cgtcaccgtg gaggacgggc ccaccaagag

2400

cgatcctagg tgtctgactc ggtactactc cagcttcgtg aacatggaac gggacctggc

2460

atcgggactc attggaccgc tgctgatctg ctacaaagag tcggtggatc aacgcggcaa

2520

ccagatcatg tccgacaagc gcaacgtgat cctgttctcc gtgtttgatg aaaacagatc

2580

ctggtacctc actgaaaaca tccagaggtt cctcccaaac cccgcaggag tgcaactgga

2640

ggaccctgag tttcaggcct cgaatatcat gcactcgatt aacggttacg tgttcgactc

2700

gctgcaactg agcgtgtgcc tccatgaagt cgcttactgg tacattctgt ccatcggcgc

2760

ccagactgac ttcctgagcg tgttcttttc cggttacacc tttaagcaca agatggtgta

2820

cgaagatacc ctgaccctgt tccctttctc cggcgaaacg gtgttcatgt cgatggagaa

2880

cccgggtctg tggattctgg gatgccacaa cagcgacttt cggaaccgcg gaatgactgc

2940

cctgctgaag gtgtcctcat gcgacaagaa caccggagac tactacgagg actcctacga

3000

ggatatctca gcctacctcc tgtccaagaa caacgcgatc gagccgcgca gcttcagcca

3060

gaacggcgcg ccaacatcag agagcgccac ccctgaaagt ggtcccggga gcgagccagc

3120

cacatctggg tcggaaacgc caggcacaag tgagtctgca actcccgagt ccggacctgg

3180

ctccgagcct gccactagcg gctccgagac tccgggaact tccgagagcg ctacaccaga

3240

aagcggaccc ggaaccagta ccgaacctag cgagggctct gctccgggca gcccagccgg

3300

ctctcctaca tccacggagg agggcacttc cgaatccgcc accccggagt cagggccagg

3360

atctgaaccc gctacctcag gcagtgagac gccaggaacg agcgagtccg ctacaccgga

3420

gagtgggcca gggagccctg ctggatctcc tacgtccact gaggaagggt caccagcggg

3480

ctcgcccacc agcactgaag aaggtgcctc gagcccgcct gtgctgaaga ggcaccagcg

3540

agaaattacc cggaccaccc tccaatcgga tcaggaggaa atcgactacg acgacaccat

3600

ctcggtggaa atgaagaagg aagatttcga tatctacgac gaggacgaaa atcagtcccc

3660

tcgctcattc caaaagaaaa ctagacacta ctttatcgcc gcggtggaaa gactgtggga

3720

ctatggaatg tcatccagcc ctcacgtcct tcggaaccgg gcccagagcg gatcggtgcc

3780

tcagttcaag aaagtggtgt tccaggagtt caccgacggc agcttcaccc agccgctgta

3840

ccggggagaa ctgaacgaac acctgggcct gctcggtccc tacatccgcg cggaagtgga

3900

ggataacatc atggtgacct tccgtaacca agcatccaga ccttactcct tctattcctc

3960

cctgatctca tacgaggagg accagcgcca aggcgccgag ccccgcaaga acttcgtcaa

4020

gcccaacgag actaagacct acttctggaa ggtccaacac catatggccc cgaccaagga

4080

tgagtttgac tgcaaggcct gggcctactt ctccgacgtg gaccttgaga aggatgtcca

4140

ttccggcctg atcgggccgc tgctcgtgtg tcacaccaac accctgaacc cagcgcatgg

4200

acgccaggtc accgtccagg agtttgctct gttcttcacc atttttgacg aaactaagtc

4260

ctggtacttc accgagaata tggagcgaaa ctgtagagcg ccctgcaata tccagatgga

4320

agatccgact ttcaaggaga actatagatt ccacgccatc aacgggtaca tcatggatac

4380

tctgccgggg ctggtcatgg cccaggatca gaggattcgg tggtacttgc tgtcaatggg

4440

atcgaacgaa aacattcact ccattcactt ctccggtcac gtgttcactg tgcgcaagaa

4500

ggaggagtac aagatggcgc tgtacaatct gtaccccggg gtgttcgaaa ctgtggagat

4560

gctgccgtcc aaggccggca tctggagagt ggagtgcctg atcggagagc acctccacgc

4620

ggggatgtcc accctcttcc tggtgtactc gaataagtgc cagaccccgc tgggcatggc

4680

ctcgggccac atcagagact tccagatcac agcaagcgga caatacggcc aatgggcgcc

4740

gaagctggcc cgcttgcact actccggatc gatcaacgca tggtccacca aggaaccgtt

4800

ctcgtggatt aaggtggacc tcctggcccc tatgattatc cacggaatta agacccaggg

4860

cgccaggcag aagttctcct ccctgtacat ctcgcaattc atcatcatgt acagcctgga

4920

cgggaagaag tggcagactt acaggggaaa ctccaccggc accctgatgg tctttttcgg

4980

caacgtggat tcctccggca ttaagcacaa catcttcaac ccaccgatca tagccagata

5040

tattaggctc caccccactc actactcaat ccgctcaact cttcggatgg aactcatggg

5100

gtgcgacctg aactcctgct ccatgccgtt ggggatggaa tcaaaggcta ttagcgacgc

5160

ccagatcacc gcgagctcct acttcactaa catgttcgcc acctggagcc cctccaaggc

5220

caggctgcac ttgcagggac ggtcaaatgc ctggcggccg caagtgaaca atccgaagga

5280

atggcttcaa gtggatttcc aaaagaccat gaaagtgacc ggagtcacca cccagggagt

5340

gaagtccctt ctgacctcga tgtatgtgaa ggagttcctg attagcagca gccaggacgg

5400

gcaccagtgg accctgttct tccaaaacgg aaaggtcaag gtgttccagg ggaaccagga

5460

ctcgttcaca cccgtggtga actccctgga ccccccactg ctgacgcggt acttgaggat

5520

tcatcctcag tcctgggtcc atcagattgc attgcgaatg gaagtcctgg gctgcgaggc

5580

ccaggacctg tactgaatca gcctgagctc gctgatcata atcaacctct ggattacaaa

5640

atttgtgaaa gattgactgg tattcttaac tatgttgctc cttttacgct atgtggatac

5700

gctgctttaa tgcctttgta tcatgctatt gcttcccgta tggctttcat tttctcctcc

5760

ttgtataaat cctggttgct gtctctttat gaggagttgt ggcccgttgt caggcaacgt

5820

ggcgtggtgt gcactgtgtt tgctgacgca acccccactg gttggggcat tgccaccacc

5880

tgtcagctcc tttccgggac tttcgctttc cccctcccta ttgccacggc ggaactcatc

5940

gccgcctgcc ttgcccgctg ctggacaggg gctcggctgt tgggcactga caattccgtg

6000

gtgttgtcgg ggaaatcatc gtcctttcct tggctgctcg cctgtgttgc cacctggatt

6060

ctgcgcggga cgtccttctg ctacgtccct tcggccctca atccagcgga ccttccttcc

6120

cgcggcctgc tgccggctct gcggcctctt ccgcgtcttc gccttcgccc tcagacgagt

6180

cggatctccc tttgggccgc ctccccgctg atcagcctcg actgtgcctt ctagttgcca

6240

gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac

6300

tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat

6360

tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca atagcaggca

6420

tgctggggat gcggtgggct ctatggcttc tgaggcggaa agaacgggct cgagaagctt

6480

ctagatatcc tctcttaagg tagcatcgag atttaaatta gggataacag ggtaatggcg

6540

cgggccgcca cttcctggcg cgcaaaatat cctcttgtcc ttgagtctca ttggagggtt

6600

cgttcgttcg aaccagccaa tcaggggagg gggaagtgac gcaagttccg gtcacatgct

6660

tccggtgacg cacatccggt gacgtagttc cggtcacgtg cttcctgtca cgtgtttccg

6720

gtcacgtgac ttccggtcat gtgacttccg gtgacgtgtt tccggcttaa ctattgggct

6780

gaccgcgcgg catgcgcgtg gtcaacctaa cagccggaaa cacgtcaccg

6830

<210> 183

<211> 282

<212> ДНК

<213> Искусственная последовательность

<220>

<223> 5'-ITR

<400> 183

cggtgacgtg tttccggctg ttaggttgac cacgcgcatg ccgcgcggtc agcccaatag

60

ttaagccgga aacacgtcac cggaagtcac atgaccggaa gtcacgtgac cggaaacacg

120

tgacaggaag cacgtgaccg gaactacgtc accggatgtg cgtcaccgga agcatgtgac

180

cggaacttgc gtcacttccc cctcccctga ttggctggtt cgaacgaacg aaccctccaa

240

tgagactcaa ggacaagagg atattttgcg cgccaggaag tg

282

<210> 184

<211> 282

<212> ДНК

<213> Искусственная последовательность

<220>

<223> 3'-ITR инвертированный концевой повтор

<400> 184

cggtgacgtg tttccggctg ttaggttgac cacgcgcatg ccgcgcggtc agcccaatag

60

ttaagccgga aacacgtcac cggaagtcac atgaccggaa gtcacgtgac cggaaacacg

120

tgacaggaag cacgtgaccg gaactacgtc accggatgtg cgtcaccgga agcatgtgac

180

cggaacttgc gtcacttccc cctcccctga ttggctggtt cgaacgaacg aaccctccaa

240

tgagactcaa ggacaagagg atattttgcg cgccaggaag tg

282

<---

Claims

1. Молекула нуклеиновой кислоты для экспрессии терапевтического белка у субъекта, содержащая в направлении от 5' к 3':

(а) первый инвертированный концевой повтор (ITR),

(b) генную кассету, содержащую нуклеотид, кодирующий терапевтический белок, и

(с) второй ITR;

где первый ITR и/или второй ITR представляют собой ITR вируса, отличного от аденоассоциированного вируса (вируса, отличного от AAV),

где первый ITR и/или второй ITR содержит последовательность, выбранную из группы, состоящей из SEQ ID NO: 167-176, и

где молекула нуклеиновой кислоты не имеет капсида.

2. Молекула нуклеиновой кислоты по п.1, где терапевтический белок включает фактор свертывания крови.

3. Молекула нуклеиновой кислоты по п.1 или 2, где первый ITR и/или второй ITR происходит из эритровируса, представляющего собой парвовирус B19 (вирус человека).

4. Молекула нуклеиновой кислоты по п.1 или 2, где первый ITR и/или второй ITR происходит изпарвовируса гусей (GPV).

5. Молекула нуклеиновой кислоты по любому из пп. 1-4, которая дополнительно содержит тканеспецифический промотор.

6. Молекула нуклеиновой кислоты по п.5, где промотор управляет экспрессией терапевтического белка в гепатоцитах, эндотелиальных клетках, мышечных клетках, синусоидальных клетках или любой их комбинации.

7. Молекула нуклеиновой кислоты по п.5 или 6, где промотор выбран из группы, состоящей из промотора тиретина мыши (mTTR), эндогенного промотора фактора VIII человека (F8), промотора альфа-1-антитрипсина человека (hAAT), минимального промотора альбумина человека, промотора альбумина мыши, промотора тристетрапролина (TTP), промотора CASI, промотора CAG, промотора цитомегаловируса (CMV), промотора α1-антитрипсина (AAT), мышечной креатинкиназы (MCK), тяжелой цепи миозина альфа (αMHC), миоглобина (MB), десмина (DES), SPc5-12, 2R5Sc5-12, dMCK, tMCK и фосфоглицераткиназы (PGK).

8. Молекула нуклеиновой кислоты по любому из пп. 1-7, где нуклеотидная последовательность дополнительно содержит:

(a) интронную последовательность,

(b) посттранскрипционный регуляторный элемент,

(c) последовательность poly(А)-хвоста 3'-UTR,

(d) энхансерную последовательность или

(e) любую комбинацию (a)-(d).

9. Молекула нуклеиновой кислоты по п.8, где

(a) интронная последовательность расположена в направлении 5' относительно последовательности нуклеиновой кислоты, кодирующей фактор свертывания крови;

(b) посттранскрипционный регуляторный элемент содержит мутантный посттранскрипционный регуляторный элемент вируса гепатита сурков (WPRE), сайт связывания microRNA, последовательность, направляющую ДНК к ядру, или любую их комбинацию;

(c) последовательность poly(А)-хвоста 3'-UTR выбрана из группы, состоящей из poly(A) bGH, poly(A) актина, poly(A) гемоглобина и любой их комбинации; или

(d) любая комбинация (a)-(c).

10. Молекула нуклеиновой кислоты по п.9, где

(a) интронная последовательность содержит SEQ ID NO: 115;

(b) сайт связывания microRNA содержит сайт связывания с miR142-3p;

(c) последовательность poly(А)-хвоста 3'-UTR содержит poly(A) bGH; или

(d) любая комбинация (a)-(c).

11. Молекула нуклеиновой кислоты по любому из пп. 1-10, где молекула нуклеиновой кислоты содержит в следующем порядке:

(b) последовательность тканеспецифического промотора, которая содержит промотор TTP;

(c) интрон, который представляет собой синтетический интрон;

(d) нуклеотидную последовательность, которая кодирует фактор свертывания крови;

(e) посттранскрипционный регуляторный элемент, который содержит WPRE;

(f) последовательность poly(А)-хвоста 3'-UTR, которая содержит bGHpA; и

12. Молекула нуклеиновой кислоты по любому из пп. 2-11, где фактор свертывания крови включает фактор I (FI), фактор II (FII), фактор V (FV), фактор VII (FVII), фактор VIII (FVIII), фактор IX (FIX), фактор X (FX), фактор XI (FXI), фактор XII (FXII), фактор XIII (FVIII), фактор фон Виллебранда (VWF), прекалликреин, высокомолекулярный кининоген, фибронектин, антитромбин III, кофактор гепарина II, белок C, белок S, белок Z, ингибитор белок Z-подобной протеазы (ZPI), плазминоген, альфа-2-антиплазмин, тканевой активатор плазминогена (tPA), урокиназу, ингибитор активатора плазминогена 1 (PAI-1), ингибитор активатора плазминогена 2 (PAI2) или любую их комбинацию.

13. Молекула нуклеиновой кислоты по п.12, где FVIII содержит аминокислотную последовательность, которая на по меньшей мере приблизительно 70%, по меньшей мере приблизительно 75%, по меньшей мере приблизительно 80%, по меньшей мере приблизительно 85%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или 100% идентична аминокислотной последовательности, представленной последовательностью, выбранной из SEQ ID NO: 71, 106, 107 и 109.

14. Молекула нуклеиновой кислоты по любому из пп. 1-13, где фактор свертывания крови содержит гетерологичный компонент, выбранный из группы, состоящей из альбумина или его фрагмента, Fc-области иммуноглобулина, C-концевого пептида (CTP) β-субъединицы хорионического гонадотропина человека, последовательности PAS, последовательности HAP, трансферрина или его фрагмента, альбуминсвязывающего компонента, их производного или любой их комбинации.

15. Молекула нуклеиновой кислоты по любому из пп. 12-14, где FVIII дополнительно содержит партнера по связыванию FcRn.

16. Молекула нуклеиновой кислоты по любому из пп. 1-15, где молекула нуклеиновой кислоты составлена со средством доставки, включающим липидную наночастицу.

17. Фармацевтическая композиция для лечения заболевания, дефицита, нарушения или состояния, связанного с фактором коагуляции, содержащая молекулу нуклеиновой кислоты по любому из пп. 1-16 и фармацевтически приемлемый носитель.

18. Способ обеспечения экспрессии фактора свертывания крови у пациента, включающий введение пациенту молекулы нуклеиновой кислоты по любому из пп. 1-16 или фармацевтической композиции по п.17.