EA044115B1 - CHIMERIC FACTOR VIII PROTEINS AND THEIR APPLICATION - Google Patents

CHIMERIC FACTOR VIII PROTEINS AND THEIR APPLICATION Download PDF

Info

Publication number
EA044115B1
EA044115B1 EA201691111 EA044115B1 EA 044115 B1 EA044115 B1 EA 044115B1 EA 201691111 EA201691111 EA 201691111 EA 044115 B1 EA044115 B1 EA 044115B1
Authority
EA
Eurasian Patent Office
Prior art keywords
seq
fviii
domain
amino acid
vwf
Prior art date
Application number
EA201691111
Other languages
Russian (ru)
Inventor
Экта Сет Чхабра
Туньяо Лю
Original Assignee
Биовератив Терапьютикс Инк.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Биовератив Терапьютикс Инк. filed Critical Биовератив Терапьютикс Инк.
Publication of EA044115B1 publication Critical patent/EA044115B1/en

Links

Description

Ссылка на перечень последовательностей, поданный в электронном видеLink to sequence listing submitted electronically

Полное содержание списка последовательностей, поданного в электронном виде в текстовом файле формата ASCII (название: 2159_441PC02_SequenceListing_ST25.txt; размер: 823500 байт; дата создания: 9Full contents of the sequence list submitted electronically in an ASCII text file (name: 2159_441PC02_SequenceListing_ST25.txt; size: 823500 bytes; creation date: 9

Января, 2015, включено в настоящий документ посредством ссылки.January, 2015, incorporated herein by reference.

Уровень техникиState of the art

Гемофилия А - это нарушение свертываемости крови, вызываемое дефектами гена, кодирующего фактор свертывания крови VIII (FVIII), и поражающее 1-2 из 10000 новорожденных мальчиков. Graw et al., Nat. Rev. Genet. 6(6): 488-501 (2005). Пациентов с гемофилией А можно лечить путем инфузий очищенного или рекомбинантного FVIII. Все коммерчески доступные продукты FVIII, однако, как известно, имеют период полураспада около 8-12 ч, что требует частого внутривенного введения пациентам. См. Weiner M.A. и Cairo, M.S., Pediatric Hematology Secrets, Lee, M.T., 12. Disorders of Coagulation, Elsevier Health Sciences, 2001; Lillicrap, D. Thromb. Res. 122 Suppl 4:S2-8 (2008). Кроме того, был испробован ряд подходов, с целью продлить период полувыведения FVIII. Например, разрабатываемые подходы к продлению периода полувыведения факторов свертывания крови включают пегилирование, гликопегилирование и конъюгации с альбумином. См. Dumont et al., Blood. 119(13): 3024-3030 (опубликовано онлайн 13 января 2012 года). Тем не менее, по данным литературы, разрабатываемые в настоящее время препараты FVIII длительного действия, независимо от использованного метода белковой инженерии, имеют ограниченные периоды полувыведения - всего лишь до около 1,5-2 ч в доклинических исследованиях на животных моделях. См. там же. Согласующиеся результаты получены и у людей; например, сообщалось, что использование rFVIIIFc увеличивает период полувыведения максимум в около 1,7 раза по сравнению с таковым препарата ADVATE® у пациентов с гемофилией А. См. там же. Таким образом, несмотря на незначительные улучшения, увеличение периода полувыведения может указывать на наличие других ограничивающих факторов Т1/2. См. Liu, Т. et al., 2007 ISTH meeting, abstract #P-M-035; Henrik, A. et al., 2011 ISTH meeting, abstract #P=MO-181; Liu, T. et al., 2011 ISTH meeting abstract #P-WE-131.Hemophilia A is a bleeding disorder caused by defects in the gene encoding clotting factor VIII (FVIII) and affects 1-2 in 10,000 male births. Graw et al., Nat. Rev. Genet. 6(6): 488-501 (2005). Patients with hemophilia A can be treated with infusions of purified or recombinant FVIII. All commercially available FVIII products, however, are known to have a half-life of approximately 8-12 hours, requiring frequent intravenous administration to patients. See Weiner M.A. and Cairo, M.S., Pediatric Hematology Secrets, Lee, M.T., 12. Disorders of Coagulation, Elsevier Health Sciences, 2001; Lillicrap, D. Thromb. Res. 122 Suppl 4:S2-8 (2008). In addition, a number of approaches have been tried to extend the half-life of FVIII. For example, approaches under development to prolong the half-life of coagulation factors include PEGylation, glycopegylation, and albumin conjugation. See Dumont et al., Blood. 119(13): 3024-3030 (published online January 13, 2012). However, according to the literature, long-acting FVIII drugs currently in development, regardless of the protein engineering method used, have limited half-lives - only up to about 1.5-2 hours in preclinical studies in animal models. See also there. Consistent results have been obtained in humans; for example, use of rFVIIIFc has been reported to increase the half-life to a maximum of about 1.7 times that of ADVATE® in patients with hemophilia A. See ibid. Thus, despite minor improvements, an increase in half-life may indicate the presence of other T1/2 limiting factors. See Liu, T. et al., 2007 ISTH meeting, abstract #P-M-035; Henrik, A. et al., 2011 ISTH meeting, abstract #P=MO-181; Liu, T. et al., 2011 ISTH meeting abstract #P-WE-131.

Период полувыведения плазменного фактора фон Виллебранда (ФВ) составляет около 16 часов (варьируя от 13 до 18 ч). Goudemand J, et al., J Thromb Haemost 2005;3:2219-27. На период полувыведения ФВ может влиять ряд факторов: профиль гликозилирования, ADAMTS-13 (дезинтегрин и металлопротеаза с тромбоспондиновым мотивом-13) и различные мутации в гене ФВ.The half-life of plasma von Willebrand factor (VWF) is approximately 16 hours (ranging from 13 to 18 hours). Goudemand J, et al., J Thromb Haemost 2005;3:2219-27. The half-life of VWF can be influenced by a number of factors: glycosylation profile, ADAMTS-13 (disintegrin and metalloprotease with thrombospondin motif-13), and various mutations in the VWF gene.

В плазме 95-98% FVIII циркулирует в тесном нековалентном комплексе с полноразмерным ФВ. Образование этого комплекса важно для поддержания надлежащих плазменных уровней FVIII in vivo. Lenting et al., Blood. 92(11): 3983-96 (1998); Lenting et al., J. Thromb. Haemost. 5(7): 1353-60 (2007). Полноразмерный FVIII дикого типа в основном представлен в виде гетеродимера, состоящего из тяжелой цепи (молекулярная масса - 200 кД) и легкой цепи (молекулярная масса - 73 кДа). При активации FVIII путем протеолиза в позициях 372 и 740 тяжелой цепи и позиции 1689 легкой цепи ФВ, связанный с FVIII, отщепляется от активированного FVIII. Активированный FVIII вместе с активированным фактором IX, кальцием и фосфолипидом (теназный комплекс) индуцирует активацию фактора X, образуя тромбин в больших количествах. Тромбин, в свою очередь, расщепляет фибриноген с образованием растворимых мономеров, которые затем спонтанно полимеризуются, образуя растворимый фибриновый полимер. Тромбин также активирует фактор XIII, который совместно с кальцием перекрестно сшивает и стабилизирует растворимый фибриновый полимер, образуя перекрестно-связанный (нерастворимый) фибрин. Активированный FVIII быстро выводится из кровообращения путем протеолиза.In plasma, 95-98% of FVIII circulates in a close non-covalent complex with full-length VWF. Formation of this complex is important for maintaining proper plasma levels of FVIII in vivo. Lenting et al., Blood. 92(11): 3983-96 (1998); Lenting et al., J. Thromb. Haemost. 5(7): 1353-60 (2007). Full-length wild-type FVIII is mainly present as a heterodimer consisting of a heavy chain (molecular weight - 200 kDa) and a light chain (molecular weight - 73 kDa). When FVIII is activated by proteolysis at positions 372 and 740 of the heavy chain and position 1689 of the light chain, VWF bound to FVIII is cleaved from activated FVIII. Activated FVIII, together with activated factor IX, calcium and phospholipid (tenase complex), induces activation of factor X, generating thrombin in large quantities. Thrombin, in turn, cleaves fibrinogen to form soluble monomers, which then spontaneously polymerize to form soluble fibrin polymer. Thrombin also activates factor XIII, which, together with calcium, cross-links and stabilizes the soluble fibrin polymer, forming cross-linked (insoluble) fibrin. Activated FVIII is rapidly cleared from the circulation by proteolysis.

В связи с необходимостью частого введения и неудобствами, обусловленными схемой введения, все еще существует потребность в разработке препаратов FVIII, требующих менее частого введения, т.е. препарата FVIII, период полувыведения которого превышает вышеупомянутое 1,5-2-разовое ограничение.Due to the need for frequent administration and the inconvenience of the administration schedule, there is still a need to develop FVIII preparations that require less frequent administration, i.e. FVIII drug, the half-life of which exceeds the above-mentioned 1.5-2-fold limit.

Краткое изложение сущности изобретенияSummary of the invention

В настоящем изобретении предложен химерный белок, включающий (i) первый полипептид, состоящий из белка фактора VIII (FVIII), слитого с первой константной областью иммуноглобулина (ИГ) или ее частью, и (ii) второй полипептид, состоящий из белка фактора фон Виллебранда (ФВ), который включает домен D' и домен D3 ФВ, слитого со второй константной областью ИГ или ее частью посредством расположенной между ними последовательности XTEN, отличающийся тем, что последовательность XTEN содержит менее 288 аминокислотных остатков, и отличающийся тем, что первый полипептид связан или соединен со вторым полипептидом. Определенные варианты реализации изобретения включают химерный белок согласно описанию в настоящем документе, отличающийся тем, что последовательность XTEN во втором полипептиде состоит из аминокислотной последовательности длиной от 12 до 287 аминокислот.The present invention provides a chimeric protein comprising (i) a first polypeptide consisting of a factor VIII (FVIII) protein fused to a first immunoglobulin (IG) constant region or portion thereof, and (ii) a second polypeptide consisting of a von Willebrand factor protein ( VWF), which includes domain D' and domain D3 of VWF, fused to the second constant region of the IG or part thereof through the XTEN sequence located between them, characterized in that the XTEN sequence contains less than 288 amino acid residues, and characterized in that the first polypeptide is linked or connected to a second polypeptide. Certain embodiments of the invention include a chimeric protein as described herein, characterized in that the XTEN sequence in the second polypeptide consists of an amino acid sequence ranging from 12 to 287 amino acids in length.

Также раскрыт химерный белок согласно описанию в настоящем документе, отличающийся тем, что химерный белок демонстрирует более продолжительный период полувыведения по сравнению с соответствующим слитым белком, содержащим первый полипептид и второй полипептид, в котором второй полипептид в составе слитого белка включает последовательность XTEN, содержащую по меньшей мере 288 аминокислот. Некоторые варианты реализации изобретения включают последовательность XTEN AE288, содержащую по меньшей мере 288 аминокислот. В некоторых вариантах реализации изобретения AE288 представляет собой последовательность SEQ ID NO: 8.Also disclosed is a chimeric protein as described herein, wherein the chimeric protein exhibits a longer half-life compared to a corresponding fusion protein comprising a first polypeptide and a second polypeptide, wherein the second polypeptide of the fusion protein includes an XTEN sequence containing at least at least 288 amino acids. Some embodiments of the invention include an XTEN AE288 sequence containing at least 288 amino acids. In some embodiments, AE288 is the sequence of SEQ ID NO: 8.

- 1 044115- 1 044115

Также раскрыт химерный белок согласно описанию в настоящем документе, отличающийся тем, что последовательность XTEN второго полипептида содержит около 36, около 42, около 72 или околоAlso disclosed is a chimeric protein as described herein, wherein the XTEN sequence of the second polypeptide contains about 36, about 42, about 72, or about

144 аминокислот. В некоторых вариантах реализации изобретения последовательность XTEN второго полипептида выбрана из АЕ42, АЕ72, АЕ144, AG42, AG72 или AG144.144 amino acids. In some embodiments, the XTEN sequence of the second polypeptide is selected from AE42, AE72, AE144, AG42, AG72, or AG144.

Некоторые варианты реализации изобретения включают химерный белок согласно описанию в настоящем документе, отличающийся тем, что последовательность XTEN второго полипептида выбрана изSome embodiments of the invention include a chimeric protein as described herein, characterized in that the XTEN sequence of the second polypeptide is selected from

SEQ ГО NO: 9, SEQ ГО NO: 10, SEQ ГО NO: И,SEQ GO NO: 9, SEQ GO NO: 10, SEQ GO NO: AND,

SEQ ID NO: 55; SEQ ID NO: 56; SEQ ID NO: 57; SEQ ID NO: 58; SEQ ID NO: 58; SEQ IDSEQ ID NO: 55; SEQ ID NO: 56; SEQ ID NO: 57; SEQ ID NO: 58; SEQ ID NO: 58; SEQ ID

NO: 59; SEQ ID NO: 14; SEQ ID NO: 60; SEQ ID NO: 61; SEQ ID NO: 62; или SEQ ID NO: 63.NO: 59; SEQ ID NO: 14; SEQ ID NO: 60; SEQ ID NO: 61; SEQ ID NO: 62; or SEQ ID NO: 63.

В определенных вариантах реализации изобретения первый полипептид дополнительно содержит вторую последовательность XTEN, которая связывает белок FVIII с первой константной областью ИГ или ее частью. Также раскрыт химерный белок согласно описанию в настоящем документе, отличающийся тем, что первый полипептид содержит третью последовательность XTEN, встроенную в один или более сайтов встраивания в пределах белка FVIII. В некоторых вариантах реализации изобретения первый полипептид дополнительно содержит вторую последовательность XTEN, встроенную в один или более сайтов встраивания в пределах белка FVIII. В определенных вариантах реализации изобретения первый полипептид содержит третью последовательность XTEN, которая связывает белок FVIII с первой константной областью ИГ или ее частью.In certain embodiments of the invention, the first polypeptide further comprises a second XTEN sequence that binds the FVIII protein to the first IG constant region or portion thereof. Also disclosed is a chimeric protein as described herein, wherein the first polypeptide contains a third XTEN sequence inserted into one or more insertion sites within the FVIII protein. In some embodiments, the first polypeptide further comprises a second XTEN sequence inserted at one or more insertion sites within the FVIII protein. In certain embodiments of the invention, the first polypeptide contains a third XTEN sequence that binds the FVIII protein to the first IG constant region or portion thereof.

Также раскрыт химерный белок согласно описанию в настоящем документе, отличающийся тем, что вторая последовательность XTEN, третья последовательность XTEN или вторая и третья последовательности XTEN, каждая независимо от других, выбраны из АЕ42, АЕ72, АЕ864, АЕ576, AE288, АЕ144, AG864, AG576, AG288 и AG144. В некоторых вариантах реализации изобретения вторая последовательность XTEN, третья последовательность XTEN или вторая и третья последовательности XTEN, каждая независимо от других, выбраны изAlso disclosed is a chimeric protein as described herein, wherein the second XTEN sequence, the third XTEN sequence, or the second and third XTEN sequences are each independently selected from AE42, AE72, AE864, AE576, AE288, AE144, AG864, AG576 , AG288 and AG144. In some embodiments, the second XTEN sequence, the third XTEN sequence, or the second and third XTEN sequences are each independently selected from

SEQ ГО NO: 8; SEQ ГО NO: 9, SEQ ГО NO: 10, SEQ ГОSEQ GO NO: 8; SEQ GO NO: 9, SEQ GO NO: 10, SEQ GO

NO: 11, SEQ ID NO: 17; SEQ ID NO: 54; SEQ ID NO: 19; SEQ ID NO: 16; SEQ ГО NO: 18;NO: 11, SEQ ID NO: 17; SEQ ID NO: 54; SEQ ID NO: 19; SEQ ID NO: 16; SEQ GO NO: 18;

SEQ ID NO: 15; SEQ ID NO: 55; SEQ ID NO: 56; SEQ ID NO: 57; SEQ ID NO: 58; SEQ IDSEQ ID NO: 15; SEQ ID NO: 55; SEQ ID NO: 56; SEQ ID NO: 57; SEQ ID NO: 58; SEQ ID

NO: 59; SEQ ID NO: 14; SEQ ID NO: 60; SEQ ID NO: 61; SEQ ID NO: 62; или SEQ ID NO:NO: 59; SEQ ID NO: 14; SEQ ID NO: 60; SEQ ID NO: 61; SEQ ID NO: 62; or SEQ ID NO:

63.63.

В определенных вариантах реализации изобретения вторая последовательность XTEN, третья последовательность XTEN или и вторая, и третья последовательности XTEN, каждая независимо от других, представляют собой AE288 или AG288. В некоторых вариантах реализации изобретения последовательность XTEN во втором полипептиде слита со второй константной областью ИГ или ее частью посредством линкера. В определенных вариантах реализации изобретения линкер представляет собой расщепляемый линкер.In certain embodiments of the invention, the second XTEN sequence, the third XTEN sequence, or both the second and third XTEN sequences are each independently AE288 or AG288. In some embodiments, the XTEN sequence in the second polypeptide is fused to a second IG constant region or portion thereof via a linker. In certain embodiments of the invention, the linker is a cleavable linker.

Некоторые варианты реализации изобретения включают химерный белок согласно описанию в настоящем документе, отличающийся тем, что линкер поддается расщеплению протеазой, выбранной из фактора XIa, фактора XIIa, калликреина, фактора VIIa, фактора IXa, фактора Ха, фактора IIa (тромбина), эластазы 2, гранзима В, протеазы вируса табачной гравировки (TEV), энтерокиназы, протеазы 3С, сортазы А, матриксной металлопротеазы-12 (ММР-12), ММР-13, ММР-17 и ММР-20. В некоторых вариантах реализации изобретения линкер поддается расщеплению фактором IIa (тромбином).Some embodiments of the invention include a chimeric protein as described herein, characterized in that the linker is cleavable by a protease selected from factor XIa, factor XIIa, kallikrein, factor VIIa, factor IXa, factor Xa, factor IIa (thrombin), elastase 2, granzyme B, tobacco etch virus (TEV) protease, enterokinase, protease 3C, sortase A, matrix metalloprotease-12 (MMP-12), MMP-13, MMP-17 and MMP-20. In some embodiments, the linker is cleavable by factor IIa (thrombin).

Также раскрыт химерный белок согласно описанию в настоящем документе, отличающийся тем, что линкер содержит один или более сайтов расщепления, содержащих аминокислотную последовательность, выбранную изAlso disclosed is a chimeric protein as described herein, characterized in that the linker contains one or more cleavage sites containing an amino acid sequence selected from

- 2 044115- 2 044115

RRRR (SEQ ID NO:RRRR (SEQ ID NO:

102), RKRRKR (SEQ ID NO: 103), RRRRS (SEQ ID NO: 104), TQSFNDFTR (SEQ ID NO:102), RKRRKR (SEQ ID NO: 103), RRRRS (SEQ ID NO: 104), TQSFNDFTR (SEQ ID NO:

1), SVSQTSKLTR (SEQ ID NO: 3), DFLAEGGGVR (SEQ ID NO: 4), TTKIKPR (SEQ ID NO: 5), LVPRG (SEQ ID NO: 6), ALRPR (SEQ ID NO: 7), KLTRAET (SEQ ID NO: 121), DFTRVVG (SEQ ID NO: 122), TMTRIVGG (SEQ ID NO: 123), SPFRSTGG (SEQ ID NO: 124), LQVRIVGG (SEQ ID NO: 125), PLGRIVGG (SEQ ID NO: 126), IEGRTVGG (SEQ ID NO: 127), LTPRSLLV (SEQ ID NO: 128), LGPVSGVP (SEQ ID NO: 129), VAGDSLEE (SEQ ID NO: 130), GPAGLGGA (SEQ ID NO: 131), GPAGLRGA (SEQ ID NO: 132), APLGLRLR (SEQ ID NO: 133), PALPLVAQ (SEQ ID NO: 134), ENLYFQG (SEQ ID NO: 135), DDDKIVGG (SEQ ID NO: 136), LEVLFQGP (SEQ ID NO: 137), LPKTGSES (SEQ ID NO: 138), DKNTGDYYEDSYEDISAYLLSKNNAIEPRSFS (SEQ ID NO: 88) и IEPRSFS (SEQ ID NO: 194).1), SVSQTSKLTR (SEQ ID NO: 3), DFLAEGGGVR (SEQ ID NO: 4), TTKIKPR (SEQ ID NO: 5), LVPRG (SEQ ID NO: 6), ALRPR (SEQ ID NO: 7), KLTRAET ( SEQ ID NO: 121), DFTRVVG (SEQ ID NO: 122), TMTRIVGG (SEQ ID NO: 123), SPFRSTGG (SEQ ID NO: 124), LQVRIVGG (SEQ ID NO: 125), PLGRIVGG (SEQ ID NO: 126 ), IEGRTVGG (SEQ ID NO: 127), LTPRSLLV (SEQ ID NO: 128), LGPVSGVP (SEQ ID NO: 129), VAGDSLEE (SEQ ID NO: 130), GPAGLGGA (SEQ ID NO: 131), GPAGLRGA (SEQ ID NO: 132), APLGLRLR (SEQ ID NO: 133), PALPLVAQ (SEQ ID NO: 134), ENLYFQG (SEQ ID NO: 135), DDDKIVGG (SEQ ID NO: 136), LEVLFQGP (SEQ ID NO: 137) , LPKTGSES (SEQ ID NO: 138), DKNTGDYYEDSYEDISAYLLSKNNAIEPRSFS (SEQ ID NO: 88) and IEPRSFS (SEQ ID NO: 194).

В некоторых вариантах реализации изобретения линкер содержит последовательность TLDPRSFLLRNPNDKYEPFWEDEEK (SEQ ID NO. 146). в некоторых вариантах реализации изобретения сайты расщепления содержат аминокислотную последовательность LVPRG (SEQ ID NO.6). в других вариантах реализации изобретения сайт расщепления содержит аминокислотную последовательность IEPRSFS (SEQ ID NO: 194). в еще одних вариантах реализации изобретения сайт расщепления содержит аминокислотную последовательность IEPRSFS (SEQ ID NO. 194), причем сайт расщепления не представляет собой полноразмерную область a2 белка FVIII. В некоторых вариантах реализации изобретения сайт расщепления содержит фрагмент области a2 белка FVIII, содержащий по меньшей мере последовательность IEPR (SEQ ID NO. 200). в других вариантах реализации изобретения сайт расщепления содержит фрагмент области a2 белка FVIII, содержащий по меньшей мере последовательность IEPR (SEQ ID NO. 200), причем сайт расщепления не представляет собой полноразмерную область a2. В определенных вариантах реализации изобретения сайт расщепления поддается расщеплению в тесте на гидролиз тромбином, как предложено в настоящем документе или известно в данной области техники.In some embodiments, the linker comprises the sequence TLDPRSFLLRNPNDKYEPFWEDEEK (SEQ ID NO. 146). in some embodiments, the cleavage sites comprise the amino acid sequence LVPRG (SEQ ID NO.6). in other embodiments, the cleavage site comprises the amino acid sequence IEPRSFS (SEQ ID NO: 194). in still other embodiments, the cleavage site comprises the amino acid sequence IEPRSFS (SEQ ID NO. 194), wherein the cleavage site is not the full-length a2 region of the FVIII protein. In some embodiments, the cleavage site comprises a fragment of the a2 region of the FVIII protein containing at least the sequence IEPR (SEQ ID NO. 200). in other embodiments, the cleavage site comprises a fragment of the a2 region of the FVIII protein containing at least an IEPR sequence (SEQ ID NO. 200), wherein the cleavage site is not the full length a2 region. In certain embodiments of the invention, the cleavage site is amenable to cleavage in a thrombin hydrolysis test, as proposed herein or known in the art.

Некоторые варианты реализации изобретения включают химерный белок согласно описанию в настоящем документе, в котором первая константная область ИГ или ее часть содержит первый фрагмент Fc и/или вторая константная область ИГ или ее часть содержит второй фрагмент Fc. В некоторых вариантах реализации изобретения первая константная область ИГ или ее часть и вторая константная область ИГ или ее часть продлевают период полувыведения химерного белка. В некоторых вариантах реализации изобретения первый полипептид и второй полипептид слиты посредством линкера. В определенных вариантах реализации изобретения первый полипептид и второй полипептид слиты посредством процессируемого линкера. В некоторых вариантах реализации изобретения первая константная область ИГ или ее часть соединена со второй константной областью ИГ или ее частью. В определенных вариантах реализации изобретения первая константная область ИГ или ее часть соединена со второй константной областью ИГ или ее частью ковалентной связью. В некоторых вариантах реализации изобретения ковалентная связь представляет собой дисульфидную связь.Some embodiments of the invention include a chimeric protein as described herein, wherein the first IG constant region or a portion thereof contains a first Fc fragment and/or the second IG constant region or a portion thereof contains a second Fc fragment. In some embodiments, the first IG constant region or portion thereof and the second IG constant region or portion thereof prolong the half-life of the chimeric protein. In some embodiments, the first polypeptide and the second polypeptide are fused through a linker. In certain embodiments of the invention, the first polypeptide and the second polypeptide are fused through a processable linker. In some embodiments of the invention, a first IG constant region or a portion thereof is connected to a second IG constant region or a portion thereof. In certain embodiments of the invention, the first IG constant region or portion thereof is connected to the second IG constant region or portion thereof by a covalent bond. In some embodiments, the covalent bond is a disulfide bond.

- 3 044115- 3 044115

Также описан химерный белок, включающий каждую из нижеприведенных формул (a)-(hh):Also described is a chimeric protein comprising each of the following formulas (a)-(hh):

(a) FVin-Fl:F2-L2-X-Ll-V;(a) FVin-Fl:F2-L2-X-Ll-V;

(b) FVin-Fl:V-Ll-X-L2-F2;(b) FVin-Fl:V-Ll-X-L2-F2;

(с) Fl-FVni:F2-L2-X-Ll-V;(c) Fl-FVni:F2-L2-X-Ll-V;

(d) Fl-FVni:V-Ll-X-L2-F2;(d) Fl-FVni:V-Ll-X-L2-F2;

(е) FVin-X2-Fl:F2-L2-Xl-Ll-V;(e) FVin-X2-Fl:F2-L2-Xl-Ll-V;

(f) FVin-X2-Fl:V-Ll-Xl-L2-F2;(f) FVin-X2-Fl:V-Ll-Xl-L2-F2;

(g) FVin(X2)-Fl:F2-L2-Xl-Ll-V;(g) FVin(X2)-Fl:F2-L2-Xl-Ll-V;

(h) FVin(X2)-Fl:V-Ll-Xl-L2-F2;(h) FVin(X2)-Fl:V-Ll-Xl-L2-F2;

(i) F1-X2-F1:F2-L2-X1-L1-V;(i) F1-X2-F1:F2-L2-X1-L1-V;

(j) F1-X2-F1:V-L1-X1-L2-F2;(j) F1-X2-F1:V-L1-X1-L2-F2;

(k) V-L1-X-L2-F2-L3-FVIII-L4-F1;(k) V-L1-X-L2-F2-L3-FVIII-L4-F1;

(1) V-L1-X-L2-F2-L3-F1-L4-FVIII;(1) V-L1-X-L2-F2-L3-F1-L4-FVIII;

(m) F1-L4-FVDI-L3-F2-L2-X-L1-V;(m) F1-L4-FVDI-L3-F2-L2-X-L1-V;

(n) FVIII-L4-F1-L3-F2-L2-X-L1-V;(n) FVIII-L4-F1-L3-F2-L2-X-L1-V;

(o) FVIII-L4-F1-L3-V-L1-X-L2-F2;(o) FVIII-L4-F1-L3-V-L1-X-L2-F2;

(p) FVIII-L4-F1-L3-F2-L2-X-L1-V;(p) FVIII-L4-F1-L3-F2-L2-X-L1-V;

(q) F2-L2-X-Ll-V-L3-Fl-L4-FVin;(q) F2-L2-X-Ll-V-L3-Fl-L4-FVin;

(r) F2-L2-X-L1-V-L3-FVIII-L4-F1;(r) F2-L2-X-L1-V-L3-FVIII-L4-F1;

(s) V-Ll-Xl-L2-F2-L3-FVni(X2)-L4-Fl;(s) V-Ll-Xl-L2-F2-L3-FVni(X2)-L4-Fl;

(t) V-Ll-Xl-L2-F2-L3-Fl-L4-FVni(X2);(t) V-Ll-Xl-L2-F2-L3-Fl-L4-FVni(X2);

(u) Fl -L4-FVIII(X2)-L3 -F2-L2-X1 -L1 - V;(u) Fl -L4-FVIII(X2)-L3 -F2-L2-X1 -L1 - V;

(v) F-L4-FVIII(X2)-L3 - V-L1 -X1-L2-F2;(v) F-L4-FVIII(X2)-L3 - V-L1 -X1-L2-F2;

(w) FVIII(X2)-L4-F 1-L3 - V-L 1 -X1-L2-F2;(w) FVIII(X2)-L4-F 1-L3 - V-L 1 -X1-L2-F2;

(x) FVIII(X2)-L4-F 1-L3 -F2-L2-X1 -L1 - V;(x) FVIII(X2)-L4-F 1-L3 -F2-L2-X1 -L1 - V;

(y) F2-L2-X1-L1-V-L3-F1-L4-FVIII(X2);(y) F2-L2-X1-L1-V-L3-F1-L4-FVIII(X2);

(z) F2-L2-X1-L1-V-L3-FVIII(X2)-L4-F1;(z) F2-L2-X1-L1-V-L3-FVIII(X2)-L4-F1;

(aa) V-Ll-X2-L2-F2-L3-FVni-L4-X2-L5-Fl;(aa) V-Ll-X2-L2-F2-L3-FVni-L4-X2-L5-Fl;

(bb) V-L 1-X2-L2-F2-L3-F1-L5-X2-L4-F VIII;(bb) V-L 1-X2-L2-F2-L3-F1-L5-X2-L4-F VIII;

(cc) Fl -L5-X2-L4-FVni-L3 -F2-L2-X2-L1 -V;(cc) Fl -L5-X2-L4-FVni-L3 -F2-L2-X2-L1 -V;

(dd) F1-L5-X2-L4-FVIII-L3 - V-L 1-X2-L2-F2;(dd) F1-L5-X2-L4-FVIII-L3 - V-L 1-X2-L2-F2;

(ее) FVID-L5-X2-L4-F2-L3 - V-L 1 -X1-L2-F1;(ee) FVID-L5-X2-L4-F2-L3 - V-L 1 -X1-L2-F1;

(ff) FVID-L5-X2-L4-F2-L3 -Fl -L2-X1 -L1 - V;(ff) FVID-L5-X2-L4-F2-L3 -Fl -L2-X1 -L1 - V;

(gg) F1-L2-X1-L1-V-L3-F2-L4-X2-L5-FVIII; или (hh) F1-L2-X1 -L1 - V-L3 -FVIII-L5-X2-L4-F2;(gg) F1-L2-X1-L1-V-L3-F2-L4-X2-L5-FVIII; or (hh) F1-L2-X1 -L1 - V-L3 -FVIII-L5-X2-L4-F2;

где V представляет собой белок ФВ, содержащий домен D' и домен D3, X или X1 представляет собой первую последовательность XTEN, содержащую менее 288 аминокислот, Х2 представляет собой вторую последовательность XTEN, FVIII содержит белок FVIII, FVIII(X2) включает белок FVIII со второй последовательностью XTEN, встроенной в один или более сайтов встраивания в пределах белка FVIII, F1 представляет собой первую константную область ИГ или ее часть, F2 представляет собой вторую константную область ИГ или ее часть, L1, L2, L3, L4 или L5 представляет собой необязательный линкер, (-) представляет собой пептидную связь и (:) представляет собой ковалентную или нековалентную связь.where V is the VWF protein containing domain D' and domain D3, X or X1 is the first XTEN sequence containing less than 288 amino acids, X2 is the second XTEN sequence, FVIII contains the FVIII protein, FVIII(X2) is the FVIII protein with the second an XTEN sequence inserted into one or more insertion sites within the FVIII protein, F1 is a first IG constant region or a portion thereof, F2 is a second IG constant region or a portion thereof, L1, L2, L3, L4 or L5 is an optional linker , (-) represents a peptide bond and (:) represents a covalent or non-covalent bond.

Некоторые варианты реализации изобретения включают химерный белок согласно описанию в на- 4 044115 стоящем документе, отличающийся тем, что X или X1 состоит из аминокислотной последовательности длиной от 12 до 287 аминокислот.Some embodiments of the invention include a chimeric protein as described herein, wherein X or X1 consists of an amino acid sequence ranging from 12 to 287 amino acids in length.

В определенных вариантах реализации изобретения химерный белок согласно описанию в настоящем документе демонстрирует более продолжительный период полувыведения по сравнению с соответствующим химерным белком, включающим в себя приведенную формулу, с тем исключением, что X или X1 представляет собой AE288. В некоторых вариантах реализации изобретения AE288 представляет собой SEQ ID NO: 8.In certain embodiments of the invention, the chimeric protein as described herein exhibits a longer half-life compared to the corresponding chimeric protein comprising the above formula, except that X or X1 is AE288. In some embodiments, AE288 is SEQ ID NO: 8.

Некоторые варианты реализации изобретения включают химерный белок согласно описанию в настоящем документе, отличающийся тем, что X или X1 в формуле содержит около 36, около 42, около 72 или около 144 аминокислот. В определенных вариантах реализации изобретения X или X1 в формуле выбрана из AE42, AE72, AE144, AG42, AG72 или AG144. В некоторых вариантах реализации изобретения X или X1 в формуле выбрана изSome embodiments of the invention include a chimeric protein as described herein, wherein X or X1 in the formula contains about 36, about 42, about 72, or about 144 amino acids. In certain embodiments, X or X1 in the formula is selected from AE42, AE72, AE144, AG42, AG72, or AG144. In some embodiments, X or X1 in the formula is selected from

SEQ ID NO: 9, SEQ Ш NO: 10, SEQ ID NO: 11, SEQ ID NO: 55; SEQSEQ ID NO: 9, SEQ Ш NO: 10, SEQ ID NO: 11, SEQ ID NO: 55; SEQ

ID NO: 56; SEQ ID NO: 57; SEQ ID NO: 58; SEQ ID NO: 59; SEQ ID NO: 14; SEQ ID NO:ID NO: 56; SEQ ID NO: 57; SEQ ID NO: 58; SEQ ID NO: 59; SEQ ID NO: 14; SEQ ID NO:

60; SEQ ID NO: 61; SEQ ID NO: 62; или SEQ ID NO: 63.60; SEQ ID NO: 61; SEQ ID NO: 62; or SEQ ID NO: 63.

В определенных вариантах реализации изобретения Х2 содержит аминокислотную последовательность длиной по меньшей мере около 36 аминокислот, по меньшей мере около 42 аминокислот, по меньшей мере около 144 аминокислот, по меньшей мере около 288 аминокислот, по меньшей мере около 576 аминокислот, по меньшей мере около 864 аминокислот. В определенных вариантах реализации изобретения Х2 выбрана из AE42, AE72, AE864, AE576, AE288, AE144, AG864, AG576, AG288 и AG144. В некоторых вариантах реализации изобретения Х2 выбрана изIn certain embodiments, X2 comprises an amino acid sequence of at least about 36 amino acids, at least about 42 amino acids, at least about 144 amino acids, at least about 288 amino acids, at least about 576 amino acids, at least about 864 amino acids. amino acids. In certain embodiments, X2 is selected from AE42, AE72, AE864, AE576, AE288, AE144, AG864, AG576, AG288, and AG144. In some embodiments, X2 is selected from

SEQ Ш NO: 8; SEQ Ш NO: 9; SEQ ГО NO: 10; SEQSEQ Ш NO: 8; SEQ Ш NO: 9; SEQ GO NO: 10; SEQ

ID NO: 11; SEQ ID NO: 17; SEQ ID NO: 54; SEQ ID NO: 19; SEQ ID NO: 16; SEQ ID NO: 18; SEQ ID NO: 15; SEQ ID NO: 55; SEQ ID NO: 56; SEQ ID NO: 57; SEQ ID NO: 58; SEQID NO: 11; SEQ ID NO: 17; SEQ ID NO: 54; SEQ ID NO: 19; SEQ ID NO: 16; SEQ ID NO: 18; SEQ ID NO: 15; SEQ ID NO: 55; SEQ ID NO: 56; SEQ ID NO: 57; SEQ ID NO: 58; SEQ

ID NO: 59; SEQ ID NO: 14; SEQ ID NO: 60; SEQ ID NO: 61; SEQ ID NO: 62; или SEQ IDID NO: 59; SEQ ID NO: 14; SEQ ID NO: 60; SEQ ID NO: 61; SEQ ID NO: 62; or SEQ ID

NO: 63.NO: 63.

В определенных вариантах реализации изобретения Х2 представляет собой AE288 или AG288.In certain embodiments of the invention, X2 is AE288 or AG288.

Также раскрыт химерный белок согласно описанию в настоящем документе, содержащий X или X1 и/или Х2, который демонстрирует более продолжительный период полувыведения по сравнению с химерным белком, не содержащим X или X1 и/или Х2. В некоторых вариантах реализации изобретения L1 и/или L2 представляет собой расщепляемый линкер. В определенных вариантах реализации изобретения L4 и/или L5 представляет собой расщепляемый линкер. В определенных вариантах реализации изобретения линкер поддается расщеплению протеазой, выбранной из фактора XIa, фактора XIIa, калликреина, фактора VIIa, фактора IXa, фактора Ха, фактора IIa (тромбина), эластазы 2, гранзима В, протеазы TEV, энтерокиназы, протеазы 3С, сортазы А, ММР-12, ММР-13, ММР-17 и ММР-20. В некоторых вариантах реализации изобретения линкер поддается расщеплению фактором IIa (тромбином).Also disclosed is a chimeric protein as described herein, containing X or X1 and/or X2, which exhibits a longer half-life compared to a chimeric protein not containing X or X1 and/or X2. In some embodiments, L1 and/or L2 is a cleavable linker. In certain embodiments of the invention, L4 and/or L5 is a cleavable linker. In certain embodiments, the linker is cleavable by a protease selected from factor XIa, factor XIIa, kallikrein, factor VIIa, factor IXa, factor Xa, factor IIa (thrombin), elastase 2, granzyme B, TEV protease, enterokinase, 3C protease, sortase A, MMP-12, MMP-13, MMP-17 and MMP-20. In some embodiments, the linker is cleavable by factor IIa (thrombin).

Некоторые варианты реализации изобретения включают химерный белок согласно описанию в настоящем документе, отличающийся тем, что линкер содержит один или более сайтов расщепления, содержащих аминокислотную последовательность, выбранную изSome embodiments of the invention include a chimeric protein as described herein, characterized in that the linker contains one or more cleavage sites containing an amino acid sequence selected from

RRRR (SEQ ГО NO: 102), RKRRKR (SEQ ГО NO: 103), RRRRS (SEQ ГО NO:RRRR (SEQ GO NO: 102), RKRRKR (SEQ GO NO: 103), RRRRS (SEQ GO NO:

104), TQSFNDFTR (SEQ ID NO: 2), SVSQTSKLTR (SEQ ID NO: 3), DFLAEGGGVR (SEQ ID NO: 4), TTKIKPR (SEQ ID NO: 5), LVPRG (SEQ ID NO: 6), ALRPR (SEQ ID NO: 7), KLTRAET (SEQ ID NO: 121), DFTRVVG (SEQ ID NO: 122), TMTRIVGG (SEQ ID NO:104), TQSFNDFTR (SEQ ID NO: 2), SVSQTSKLTR (SEQ ID NO: 3), DFLAEGGGVR (SEQ ID NO: 4), TTKIKPR (SEQ ID NO: 5), LVPRG (SEQ ID NO: 6), ALRPR ( SEQ ID NO: 7), KLTRAET (SEQ ID NO: 121), DFTRVVG (SEQ ID NO: 122), TMTRIVGG (SEQ ID NO:

123), SPFRSTGG (SEQ ID NO: 124), LQVRIVGG (SEQ ID NO: 125), PLGRIVGG (SEQ ID NO: 126), IEGRTVGG (SEQ ID NO: 127), LTPRSLLV (SEQ ID NO: 128), LGPVSGVP (SEQ ID NO: 129), VAGDSLEE (SEQ ID NO: 130), GPAGLGGA (SEQ ID NO: 131), GPAGLRGA (SEQ ID NO: 132), APLGLRLR (SEQ ID NO: 133), PALPLVAQ (SEQ ID NO: 134), ENLYFQG (SEQ ID NO: 135), DDDKIVGG (SEQ ID NO: 136), LEVLFQGP (SEQ ID NO:123), SPFRSTGG (SEQ ID NO: 124), LQVRIVGG (SEQ ID NO: 125), PLGRIVGG (SEQ ID NO: 126), IEGRTVGG (SEQ ID NO: 127), LTPRSLLV (SEQ ID NO: 128), LGPVSGVP ( SEQ ID NO: 129), VAGDSLEE (SEQ ID NO: 130), GPAGLGGA (SEQ ID NO: 131), GPAGLRGA (SEQ ID NO: 132), APLGLRLR (SEQ ID NO: 133), PALPLVAQ (SEQ ID NO: 134 ), ENLYFQG (SEQ ID NO: 135), DDDKIVGG (SEQ ID NO: 136), LEVLFQGP (SEQ ID NO:

137) и LPKTGSES (SEQ ID NO: 138).137) and LPKTGSES (SEQ ID NO: 138).

В некоторых вариантах реализации изобретения линкер содержит последовательность TLDPRSFLLRNPNDKYEPFWEDEEK (SEQ ID NO: 146). в определенных вариантах реализации изобретения линкер содержит аминокислотную последовательность LVPRG (SEQ ID NO: 6). в некоторых вариантах реализации изобретения линкер содержит область a1 FVIII, область а2 FVIII, область а3 FVIII или любое их сочетание. В определенных вариантах реализации изобретения линкер содержит фрагмент области а2 FVIII. В некоторых случаях фрагмент области а2 может содержать последовательность DKNTGDYYEDSYEDISAYLLSKNNAIEPRSFS (SEQ ID NO: 88). в еще одних вариантах реали- 5 044115 зации изобретения может быть использован меньший фрагмент области а2 FVIII, включая фрагмент с последовательностью IEPRSFS (SEQ ID NO: 194). в одном конкретном варианте реализации изобретения линкер содержит аминокислотную последовательность IEPRSFS (SEQ ID NO. 194). в другом варианте реализации изобретения линкер содержит аминокислотную последовательностьIn some embodiments, the linker contains the sequence TLDPRSFLLRNPNDKYEPFWEDEEK (SEQ ID NO: 146). in certain embodiments, the linker comprises the amino acid sequence LVPRG (SEQ ID NO: 6). in some embodiments, the linker comprises a FVIII a1 region, a FVIII a2 region, a FVIII a3 region, or any combination thereof. In certain embodiments, the linker comprises a fragment of the a2 region of FVIII. In some cases, a fragment of the a2 region may contain the sequence DKNTGDYYEDSYEDISAYLLSKNNAIEPRSFS (SEQ ID NO: 88). In yet other embodiments, a smaller fragment of the FVIII a2 region may be used, including a fragment with the sequence IEPRSFS (SEQ ID NO: 194). in one particular embodiment, the linker comprises the amino acid sequence IEPRSFS (SEQ ID NO. 194). in another embodiment of the invention, the linker contains the amino acid sequence

IEPRSFS (SEQ ID NO. 194), причем линкер не представляет собой полноразмерную область а2 FVIII.IEPRSFS (SEQ ID NO. 194), and the linker is not the full-length a2 region of FVIII.

Также раскрыт химерный белок согласно описанию в настоящем документе, отличающийся тем, что область а2 FVIII содержит аминокислотную последовательность, по меньшей мере около на 80%, около на 85%, около на 90%, около на 95% или 100% идентичную либо последовательности ISDKNTGDYYEDSYEDISAYLLSKNNAIEPRSFS (seq id no: 106) либо последовательности DKNTGDYYEDSYEDISAYLLSKNNAIEPRSFS (SEQ ID NO: 88). в некоторых вариантах реализации изобретения область a1 содержит аминокислотную последовательность, по меньшей мере на около 80%, около 85%, около 90%, около 95% или 100% идентичную последовательности ISMKNNEEAEDYDDDLTDSEMDVVRFDDDNSPSFIQIRSV (SEQ ID NO: 107).Also disclosed is a chimeric protein as described herein, wherein the a2 region of FVIII contains an amino acid sequence that is at least about 80%, about 85%, about 90%, about 95%, or 100% identical to either the sequence ISDKNTGDYYEDSYEDISAYLLSKNNAIEPRSFS (seq id no: 106) or the sequence DKNTGDYYEDSYEDISAYLLSKNNAIEPRSFS (SEQ ID NO: 88). in some embodiments, the a1 region contains an amino acid sequence that is at least about 80%, about 85%, about 90%, about 95%, or 100% identical to the sequence ISMKNNEEAEDYDDDLTDSEMDVVRFDDDNSPSFIQIRSV (SEQ ID NO: 107).

В определенных вариантах реализации изобретения область a3 содержит аминокислотную последовательность, по меньшей мере около на 80%, около на 85%, около на 90%, около на 95% или 100% идентичную последовательностиIn certain embodiments, the a3 region contains an amino acid sequence that is at least about 80%, about 85%, about 90%, about 95%, or 100% identical to the sequence

ISEITRTTLQSDQEEIDYDDTISVEMKKEDFDIYDEDENQSPRSFQ (SEQ Ш NO: 108).ISEITRTTLQSDQEEIDYDDTISVEMKKEDFDIYDEDENQSPRSFQ (SEQ Ш NO: 108).

В некоторых вариантах реализации изобретения F1 содержит первый фрагмент Fc и/или F2 содержит второй фрагмент Fc.In some embodiments, F1 contains a first Fc fragment and/or F2 contains a second Fc fragment.

Некоторые варианты реализации изобретения включают химерный белок согласно описанию в настоящем документе, отличающийся тем, что химерный белок, содержащий F1 и F2, демонстрирует более продолжительный период полувыведения по сравнению с химерным белком, не содержащим F1 или F2. В определенных вариантах реализации изобретения L3 представляет собой расщепляемый линкер. В некоторых вариантах реализации изобретения белок ФВ соединен с белком FVIII нековалентной связью. В некоторых вариантах реализации изобретения период полувыведения химерного белка является продленным по сравнению с белком FVIII без белка ФВ и/или последовательности XTEN или по сравнению с FVIII дикого типа. В некоторых вариантах реализации изобретения период полувыведения химерного белка по меньшей мере в около 1,5 раза, по меньшей мере в около 2 раза, по меньшей мере в около 2,5 раза, по меньшей мере в около 3 раза, по меньшей мере в около 4 раза, по меньшей мере в около 5 раз, по меньшей мере в около 6 раз, по меньшей мере в около 7 раз, по меньшей мере в около 8 раз, по меньшей мере в около 9 раз, по меньшей мере в около 10 раз, по меньшей мере в около 11 раз или по меньшей мере в около 12 раз более продолжителен, чем таковой белка FVIII без белка ФВ или последовательности XTEN или чем таковой белка FVIII дикого типа.Some embodiments of the invention include a chimeric protein as described herein, wherein the chimeric protein containing F1 and F2 exhibits a longer half-life compared to a chimeric protein not containing F1 or F2. In certain embodiments of the invention, L3 is a cleavable linker. In some embodiments, the VWF protein is linked to the FVIII protein by a non-covalent bond. In some embodiments, the half-life of the chimeric protein is prolonged compared to FVIII protein without the VWF protein and/or XTEN sequence or compared to wild-type FVIII. In some embodiments, the half-life of the chimeric protein is at least about 1.5-fold, at least about 2-fold, at least about 2.5-fold, at least about 3-fold, at least about 4 times, at least about 5 times, at least about 6 times, at least about 7 times, at least about 8 times, at least about 9 times, at least about 10 times , is at least about 11 times or at least about 12 times longer lasting than that of an FVIII protein without the VWF protein or XTEN sequence or than that of a wild-type FVIII protein.

Также раскрыт химерный белок согласно описанию в настоящем документе, отличающийся тем, что период полувыведения химерного белка составляет по меньшей мере около 17 ч, по меньшей мере около 18 ч, по меньшей мере около 19 ч, по меньшей мере около 20 ч, по меньшей мере около 21 ч, по меньшей мере около 22 ч, по меньшей мере около 23 ч, по меньшей мере около 24 ч, по меньшей мере около 25 ч, по меньшей мере около 26 ч, по меньшей мере около 27 ч, по меньшей мере около 28 ч, по меньшей мере около 29 ч, по меньшей мере около 30 ч, по меньшей мере около 31 ч, по меньшей мере около 32 ч, по меньшей мере около 33 ч, по меньшей мере около 34 ч, по меньшей мере около 35 ч, по меньшей мере около 36 ч, по меньшей мере около 48 ч, по меньшей мере около 60 ч, по меньшей мере около 72 ч, по меньшей мере около 84 ч, по меньшей мере около 96 ч или по меньшей мере около 108 ч. В некоторых вариантах реализации изобретения период полувыведения химерного белка составляет около 40 ч у мышей с гемофилией А. В некоторых вариантах реализации изобретения белок ФВ по существу не связывается с рецептором клиренса ФВ. В некоторых вариантах реализации изобретения белок ФВ способен защищать белок FVIII от расщепления одной или более протеазами, защищая белок FVIII от активации, стабилизируя тяжелую цепь и/или легкую цепь белка FVIII или предотвращая клиренс белка FVIII одним или более фагоцитарными рецепторами.Also disclosed is a chimeric protein as described herein, wherein the half-life of the chimeric protein is at least about 17 hours, at least about 18 hours, at least about 19 hours, at least about 20 hours, at least about 21 hours, at least about 22 hours, at least about 23 hours, at least about 24 hours, at least about 25 hours, at least about 26 hours, at least about 27 hours, at least about 28 hours, at least about 29 hours, at least about 30 hours, at least about 31 hours, at least about 32 hours, at least about 33 hours, at least about 34 hours, at least about 35 hours, at least about 36 hours, at least about 48 hours, at least about 60 hours, at least about 72 hours, at least about 84 hours, at least about 96 hours, or at least about 108 hours In some embodiments, the half-life of the chimeric protein is about 40 hours in mice with hemophilia A. In some embodiments, the VWF protein does not substantially bind to the VWF clearance receptor. In some embodiments, the VWF protein is capable of protecting the FVIII protein from degradation by one or more proteases by protecting the FVIII protein from activation, stabilizing the heavy chain and/or light chain of the FVIII protein, or preventing clearance of the FVIII protein by one or more phagocytic receptors.

Некоторые варианты реализации изобретения включают химерный белок согласно описанию в настоящем документе, отличающийся тем, что белок ФВ ингибирует или предотвращает связывание эндогенного ФВ с белком FVIII, экранируя или блокируя сайт связывания ФВ на белке FVIII. В некоторых вариантах реализации изобретения сайт связывания ФВ расположен в домене A3 или домене С2 белка FVIII, или и в домене A3, и в домене С2. В некоторых вариантах реализации изобретения сайт связывания ФВ содержит аминокислотную последовательность, соответствующую аминокислотам 1669-1689 и 2303-2332 последовательности SEQ ID NO: 65. В некоторых вариантах реализации изобретения первая константная область ИГ или ее часть и вторая константная область ИГ или ее часть одинаковы или отличаются. В определенных вариантах реализации изобретения к белку FVIII присоединены и/или в белок FVIII встроены по меньшей мере две последовательности XTEN, по меньшей мере три последовательности XTEN, по меньшей мере четыре последовательности XTEN, по меньшей мере пять последовательностей XTEN или по меньшей мере шесть последовательностей XTEN.Some embodiments of the invention include a chimeric protein as described herein, wherein the VWF protein inhibits or prevents the binding of endogenous VWF to the FVIII protein by shielding or blocking the VWF binding site on the FVIII protein. In some embodiments, the VWF binding site is located in the A3 domain or the C2 domain of the FVIII protein, or both the A3 domain and the C2 domain. In some embodiments, the VWF binding site comprises an amino acid sequence corresponding to amino acids 1669-1689 and 2303-2332 of SEQ ID NO: 65. In some embodiments, the first IG constant region or a portion thereof and the second IG constant region or a portion thereof are the same or are different. In certain embodiments, at least two XTEN sequences, at least three XTEN sequences, at least four XTEN sequences, at least five XTEN sequences, or at least six XTEN sequences are attached to the FVIII protein and/or inserted into the FVIII protein .

Также раскрыт химерный белок согласно описанию в настоящем документе, отличающийся тем,Also disclosed is a chimeric protein as described herein, characterized in that

- 6 044115 что белок FVIII содержит один или более доменов FVIII, выбранных из домена А1, кислой области al, домена А2, кислой области а2, домена В, домена A3, кислой области а3, домена С1, домена С2, одного или более их фрагментов и любых их сочетаний.- 6 044115 that the FVIII protein contains one or more FVIII domains selected from the A1 domain, the al acidic region, the A2 domain, the a2 acidic region, the B domain, the A3 domain, the a3 acidic region, the C1 domain, the C2 domain, one or more fragments thereof and any combinations thereof.

Также раскрыт химерный белок согласно описанию в настоящем документе, отличающийся тем, что один или более сайтов встраивания в белке FVIII расположены в пределах одного или более доменов белка FVIII, выбранных из домена А1, кислой области a1, домена А2, кислой области а2, домена A3, домена В, домена С1, домена С2 и любых их сочетаний или между одним или более доменами белка FVIII, выбранными из группы, состоящей из домена А1 и кислой области a1, кислой области a1 и домена А2, домена А2 и кислой области а2, кислой области а2 и домена В, домена В и домена A3, домена A3 и домена С1, домена С1 и домена С2 и любых их сочетаний, или между двумя доменами белка FVIII, выбранными из домена А1 и кислой области a1, кислой области a1 и домена А2, домена А2 и кислой области а2, кислой области а2 и домена В, домена В и домена A3, домена A3 и домена С1, домена С1 и домена С2 и любых их сочетаний. В некоторых вариантах реализации изобретения один или более сайтов встраивания в белке FVIII представляют собой одну или более аминокислот, выбранных из группы, состоящей из аминокислотных остатков в табл. 7, табл. 8, табл. 9 и табл. 10. В определенных вариантах реализации изобретения сайты встраивания в белке FVIII расположены непосредственно ниже аминокислоты, соответствующей аминокислоте 745 в зрелом белке FVIII (SEQ ID NO: 65). В определенных вариантах реализации изобретения сайты встраивания в белке FVIII расположены непосредственно ниже аминокислотных остатков, соответствующих остаткам 1656 и 1900 в зрелом белке FVIII (SEQ ID NO: 65). В определенных вариантах реализации изобретения сайты встраивания в белке FVIII расположены непосредственно ниже аминокислотных остатков, соответствующих остаткам 26, 1656 и 1900 в зрелом белке FVIII (SEQ ID NO: 65). В определенных вариантах реализации изобретения сайты встраивания в белке FVIII расположены непосредственно ниже аминокислотных остатков, соответствующих остаткам 403 и 745 в зрелом белке FVIII (SEQ ID NO: 65). В определенных вариантах реализации изобретения сайты встраивания в белке FVIII расположены непосредственно ниже аминокислотных остатков, соответствующих остаткам 745 и 1900 в зрелом белке FVIII (SEQ ID NO: 65). В определенных вариантах реализации изобретения сайты встраивания в белке FVIII расположены непосредственно ниже аминокислотных остатков, соответствующих остаткам 18 и 745 в зрелом белке FVIII (SEQ ID NO: 65). В некоторых вариантах реализации изобретения белок FVIII представляет собой двухцепочечную изоформу FVIII. В некоторых вариантах реализации изобретения белок FVIII представляет собой одноцепочечную изоформу FVIII. В определенных вариантах реализации изобретения белок FVIII содержит домен В или его часть. В некоторых вариантах реализации изобретения белок FVIII представляет собой FVIII с удаленным доменом SQ В.Also disclosed is a chimeric protein as described herein, wherein one or more insertion sites in the FVIII protein are located within one or more domains of the FVIII protein selected from A1 domain, a1 acidic region, A2 domain, a2 acidic region, A3 domain , B domain, C1 domain, C2 domain, and any combinations thereof, or between one or more domains of the FVIII protein selected from the group consisting of A1 domain and a1 acidic region, a1 acidic region and A2 domain, A2 domain and a2 acidic region, acidic the a2 region and the B domain, the B domain and the A3 domain, the A3 domain and the C1 domain, the C1 domain and the C2 domain, and any combination thereof, or between two domains of the FVIII protein selected from the A1 domain and the a1 acidic region, the a1 acidic region and the A2 domain , domain A2 and acidic region a2, acidic region a2 and domain B, domain B and domain A3, domain A3 and domain C1, domain C1 and domain C2 and any combinations thereof. In some embodiments, one or more insertion sites in the FVIII protein are one or more amino acids selected from the group consisting of amino acid residues in table. 7, table. 8, table. 9 and table. 10. In certain embodiments, the insertion sites in the FVIII protein are located immediately downstream of an amino acid corresponding to amino acid 745 in the mature FVIII protein (SEQ ID NO: 65). In certain embodiments, the insertion sites in the FVIII protein are located immediately downstream of amino acid residues corresponding to residues 1656 and 1900 in the mature FVIII protein (SEQ ID NO: 65). In certain embodiments, the insertion sites in the FVIII protein are located immediately downstream of amino acid residues corresponding to residues 26, 1656, and 1900 in the mature FVIII protein (SEQ ID NO: 65). In certain embodiments, the insertion sites in the FVIII protein are located immediately downstream of amino acid residues corresponding to residues 403 and 745 in the mature FVIII protein (SEQ ID NO: 65). In certain embodiments, the insertion sites in the FVIII protein are located immediately downstream of amino acid residues corresponding to residues 745 and 1900 in the mature FVIII protein (SEQ ID NO: 65). In certain embodiments, the insertion sites in the FVIII protein are located immediately downstream of amino acid residues corresponding to residues 18 and 745 in the mature FVIII protein (SEQ ID NO: 65). In some embodiments, the FVIII protein is a double-chain isoform of FVIII. In some embodiments, the FVIII protein is a single chain isoform of FVIII. In certain embodiments, the FVIII protein comprises a B domain or a portion thereof. In some embodiments, the FVIII protein is FVIII with the SQ B domain removed.

Некоторые варианты реализации изобретения включают химерный белок согласно описанию в настоящем документе, отличающийся тем, что одноцепочечная изоформа FVIII содержит по меньшей мере одну аминокислотную замену в позиции, соответствующей остатку 1648, остатку 1645 или обоим остаткам в полноразмерном зрелом полипептиде фактора FVIII (SEQ ID NO: 65) либо остатку 754, остатку 751 или обоим остаткам в факторе VIII с удаленным доменом SQ В (SEQ ID NO: 67). В определенных вариантах реализации изобретения аминокислотная замена представляет собой аминокислоту, отличную от аргинина. В некоторых вариантах реализации изобретения двухцепочечная изоформа FVIII состоит из первой цепи, содержащей тяжелую цепь FVIII, и второй цепи, содержащей легкую цепь FVIII, причем тяжелая цепь и легкая цепь соединены между собой металлической связью. В определенных вариантах реализации изобретения домен D' содержит аминокислотную последовательность, по меньшей мере на 90%, 95%, 96%, 97%, 98%, 99% или 100% идентичную аминокислотам 764-866 последовательности SEQ ID NO: 21. В некоторых вариантах реализации изобретения домен D3 содержит аминокислотную последовательность, по меньшей мере на 90%, 95%, 96%, 97%, 98%, 99% или 100% идентичную аминокислотам 867-1240 последовательности SEQ ID NO: 21. В некоторых вариантах реализации изобретения белок ФВ представляет собой мономер.Some embodiments of the invention include a chimeric protein as described herein, wherein the single chain FVIII isoform contains at least one amino acid substitution at a position corresponding to residue 1648, residue 1645, or both residues in the full-length mature factor FVIII polypeptide (SEQ ID NO: 65) or residue 754, residue 751, or both residues in factor VIII with the SQ B domain deleted (SEQ ID NO: 67). In certain embodiments, the amino acid substitution is an amino acid other than arginine. In some embodiments, the double-chain FVIII isoform consists of a first chain comprising a FVIII heavy chain and a second chain comprising a FVIII light chain, the heavy chain and the light chain being linked together by a metal bond. In certain embodiments, domain D' contains an amino acid sequence that is at least 90%, 95%, 96%, 97%, 98%, 99%, or 100% identical to amino acids 764-866 of SEQ ID NO: 21. In some In embodiments, the D3 domain contains an amino acid sequence that is at least 90%, 95%, 96%, 97%, 98%, 99%, or 100% identical to amino acids 867-1240 of SEQ ID NO: 21. In some embodiments, VWF protein is a monomer.

Также раскрыт химерный белок согласно описанию в настоящем документе, содержащий по меньшей мере два белка ФВ, по меньшей мере три белка ФВ, по меньшей мере четыре белка ФВ, по меньшей мере пять белков ФВ или по меньшей мере шесть белков ФВ. В определенных вариантах реализации изобретения белок ФВ содержит аминокислотную последовательность, по меньшей мере на 90%, 95%, 96%, 97%, 98%, 99% или 100% идентичную аминокислотам 764-1240 последовательности SEQ ID NO: 21. В некоторых вариантах реализации изобретения белок ФВ по существу состоит или состоит из аминокислот 764-1240 последовательности SEQ ID NO: 21. В определенных вариантах реализации изобретения белок ФВ содержит по меньшей мере одну аминокислотную замену в позиции, соответствующей остатку 1099, остатку 1142 или обоим остаткам 1099 и 1142 последовательности SEQ ID NO: 21. В некоторых вариантах реализации изобретения белок ФВ содержит аминокислоту, отличную от цистеина, которая замещает остаток, соответствующий остатку 1099, остатку 1142 или обоим остаткам (1099 и 1142) последовательности SEQ ID NO: 21. В определенных вариантах реализации изобретения белок ФВ дополнительно содержит домен D1, домен D2 или домены D1 и D2 белка ФВ.Also disclosed is a chimeric protein as described herein, comprising at least two VWF proteins, at least three VWF proteins, at least four VWF proteins, at least five VWF proteins, or at least six VWF proteins. In certain embodiments, the VWF protein contains an amino acid sequence that is at least 90%, 95%, 96%, 97%, 98%, 99%, or 100% identical to amino acids 764-1240 of SEQ ID NO: 21. In some embodiments implementation of the invention, the VWF protein consists essentially of or consists of amino acids 764-1240 of the sequence SEQ ID NO: 21. In certain embodiments of the invention, the VWF protein contains at least one amino acid substitution at the position corresponding to residue 1099, residue 1142, or both residues 1099 and 1142 sequence SEQ ID NO: 21. In some embodiments, the VWF protein contains an amino acid other than cysteine that replaces the residue corresponding to residue 1099, residue 1142, or both residues 1099 and 1142 of SEQ ID NO: 21. In certain embodiments of the invention, the VWF protein additionally contains a D1 domain, a D2 domain, or D1 and D2 domains of the VWF protein.

Некоторые варианты реализации изобретения включают химерный белок согласно описанию в на- 7 044115 стоящем документе, отличающийся тем, что белок ФВ дополнительно содержит домен ФВ, выбранный из домена А1, домена А2, домена A3, домена D4, домена В1, домена В2, домена В3, домена С1, доменаSome embodiments of the invention include a chimeric protein as described herein, characterized in that the VWF protein further comprises a VWF domain selected from an A1 domain, an A2 domain, an A3 domain, a D4 domain, a B1 domain, a B2 domain, a B3 domain. , domain C1, domain

С2, домена CK, одного или более их фрагментов и любых их сочетаний.C2, the CK domain, one or more fragments thereof, and any combination thereof.

Также раскрыт химерный белок согласно описанию в настоящем документе, отличающийся тем, что белок ФВ состоит или по существу состоит из: (1) доменов D' и D3 ФВ или их фрагментов; (2) доменов D1, D' и D3 ФВ или их фрагментов; (3) доменов D2, D' и D3 ФВ или их фрагментов; (4) доменов D1, D2, D' и D3 ФВ или их фрагментов; (5) доменов D1, D2, D', D3 и А1 ФВ или их фрагментов.Also disclosed is a chimeric protein as described herein, characterized in that the VWF protein consists or essentially consists of: (1) VWF D' and D3 domains or fragments thereof; (2) domains D1, D' and D3 of VWF or fragments thereof; (3) domains D2, D' and D3 of VWF or fragments thereof; (4) domains D1, D2, D' and D3 of VWF or fragments thereof; (5) domains D1, D2, D', D3 and A1 of VWF or fragments thereof.

Некоторые варианты реализации изобретения включают химерный белок согласно описанию в настоящем документе, отличающийся тем, что белок ФВ дополнительно содержит сигнальный пептид ФВ или FVIII, функционально связанный с белком ФВ.Some embodiments of the invention include a chimeric protein as described herein, wherein the VWF protein further comprises a VWF or FVIII signal peptide operably linked to the VWF protein.

Также раскрыт химерный белок согласно описанию в настоящем документе, отличающийся тем, что один или более линкеров имеют длину по меньшей мере около 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 210, 220, 230, 240, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1200, 1400, 1600, 1800 или 2000 аминокислотных остатков. В некоторых вариантах реализации изобретения один или более линкеров имеют длину от около 1 до около 2000 аминокислотных остатков. В определенных вариантах реализации изобретения один или более линкеров содержат пептид gly/ser. В некоторых вариантах реализации изобретения пептид gly/ser имеет формулу (Gly4Ser)n (SEQ ID NO: 94) или S(Gly4Ser)n (SEQ ID NO: 164), где n представляет собой положительное целое число, выбранное из группы, состоящей из 1, 2, 3, 4, 5, 6, 7, 8, 9 и 10. В определенных вариантах реализации изобретения линкер (Gly4Ser)n представляет собой (Gly4Ser)3 (SEQ ID NO: 100) или (Gly4Ser)4 (SEQ ID NO: 165). В некоторых вариантах реализации изобретения линкер содержит 20 аминокислот, 35 аминокислот, 48 аминокислот, 73 аминокислоты или 95 аминокислот. В определенных вариантах реализации изобретения расщепляемый линкер представляет собой последовательность SGGGGSGGGGSGGGGSGGGGSGGGGSLVPRGSGG (SEQ ID NO: 166).Also disclosed is a chimeric protein as described herein, wherein one or more linkers have a length of at least about 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 210, 220, 230, 240, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 9 00, 950, 1000, 1200, 1400, 1600, 1800 or 2000 amino acid residues. In some embodiments, the one or more linkers are from about 1 to about 2000 amino acid residues in length. In certain embodiments, one or more linkers comprise a gly/ser peptide. In some embodiments, the gly/ser peptide has the formula (Gly 4 Ser) n (SEQ ID NO: 94) or S(Gly 4 Ser) n (SEQ ID NO: 164), where n is a positive integer selected from group consisting of 1, 2, 3, 4, 5, 6, 7, 8, 9 and 10. In certain embodiments, the linker (Gly 4 Ser) n is (Gly 4 Ser) 3 (SEQ ID NO: 100 ) or (Gly4Ser)4 (SEQ ID NO: 165). In some embodiments, the linker contains 20 amino acids, 35 amino acids, 48 amino acids, 73 amino acids, or 95 amino acids. In certain embodiments, the cleavable linker sequence is SGGGGSGGGGSGGGGSGGGGSGGGGSLVPRGSGG (SEQ ID NO: 166).

В некоторых вариантах реализации изобретения химерный белок согласно описанию в настоящем документе полисиалилирован, ПЭГилирован или ГЭКилирован.In some embodiments, the chimeric protein as described herein is polysialylated, PEGylated, or HESylated.

Также раскрыт химерный белок согласно описанию в настоящем документе, отличающийся тем, что первый полипептид содержит последовательность, по меньшей мере на около 80%, 90%, 95%, 99% или 100% идентичнуюAlso disclosed is a chimeric protein as described herein, wherein the first polypeptide contains a sequence that is at least about 80%, 90%, 95%, 99%, or 100% identical to

FVIII161 (SEQ Ш NO: 69),FVIII161 (SEQ Ш NO: 69),

FVIII169 (SEQ ID NO: 70), FVIII173 (SEQ ID NO: 72), FVIII195 (SEQ ID NO: 73), FVIII196 (SEQ ID NO: 74), FVIII199 (SEQ ID NO: 75), FVIII201 (SEQ ID NO: 76), FVIII203 (SEQ ID NO: 77), FVIII204 (SEQ ID NO: 78), FVIII205 (SEQ ID NO: 79), FVIII266 (SEQ ID NO: 80), FVIII267 (SEQ ID NO: 81), FVIII268 (SEQ ID NO: 82), FVIII269 (SEQ ID NO: 83), FVIII271 (SEQ ID NO: 84), FVIII272 (SEQ ID NO: 85) или FVIII282 (SEQ ID NO: 159), и второй полипептид содержит последовательность, по меньшей мере на около 80%, 90%, 95%, 99% или 100% идентичную либо ФВ057 (SEQ ID NO: 152), либо ФВ059 (SEQ ID NO: 197). В некоторых вариантах реализации изобретения первый полипептид содержит FVIII169 (SEQ ID NO: 70) и второй полипептид содержит ФВ057 (SEQ ID NO: 152). В других вариантах реализации изобретения первый полипептид содержит FVIII169 (SEQ ID NO: 70) и второй полипептид содержит ФВ059 (SEQ ID NO: 197). В еще одном варианте реализации изобретения первый полипептид содержит FVIII169 (SEQ ID NO: 70) и второй полипептид содержит ФВ062 (SEQ ID NO: 199). В некоторых вариантах реализации изобретения химерный белок эффективен в предотвращении и/или остановке кровотечения у субъекта, имеющего для этого показания.FVIII169 (SEQ ID NO: 70), FVIII173 (SEQ ID NO: 72), FVIII195 (SEQ ID NO: 73), FVIII196 (SEQ ID NO: 74), FVIII199 (SEQ ID NO: 75), FVIII201 (SEQ ID NO : 76), FVIII203 (SEQ ID NO: 77), FVIII204 (SEQ ID NO: 78), FVIII205 (SEQ ID NO: 79), FVIII266 (SEQ ID NO: 80), FVIII267 (SEQ ID NO: 81), FVIII268 (SEQ ID NO: 82), FVIII269 (SEQ ID NO: 83), FVIII271 (SEQ ID NO: 84), FVIII272 (SEQ ID NO: 85) or FVIII282 (SEQ ID NO: 159), and the second polypeptide contains the sequence at least about 80%, 90%, 95%, 99% or 100% identical to either FV057 (SEQ ID NO: 152) or FV059 (SEQ ID NO: 197). In some embodiments, the first polypeptide contains FVIII169 (SEQ ID NO: 70) and the second polypeptide contains FV057 (SEQ ID NO: 152). In other embodiments, the first polypeptide contains FVIII169 (SEQ ID NO: 70) and the second polypeptide contains FV059 (SEQ ID NO: 197). In yet another embodiment, the first polypeptide contains FVIII169 (SEQ ID NO: 70) and the second polypeptide contains FV062 (SEQ ID NO: 199). In some embodiments, the chimeric protein is effective in preventing and/or stopping bleeding in an eligible subject.

Также раскрыт полинуклеотид или набор полинуклеотидов, кодирующих химерный белок согласно описанию в настоящем документе. В некоторых вариантах реализации изобретения полинуклеотид согласно описанию в настоящем документе дополнительно содержит полинуклеотидную цепь, кодирующую РС5 или РС7.Also disclosed is a polynucleotide or set of polynucleotides encoding a chimeric protein as described herein. In some embodiments, the polynucleotide as described herein further comprises a polynucleotide chain encoding PC5 or PC7.

Некоторые варианты реализации изобретения включают вектор, содержащий полинуклеотид согласно описанию в настоящем документе и один или более промоторов, функционально связанных с полинуклеотидом или набором полинуклеотидов.Some embodiments of the invention include a vector containing a polynucleotide as described herein and one or more promoters operably linked to the polynucleotide or set of polynucleotides.

В некоторых вариантах реализации изобретения вектор согласно описанию в настоящем документе дополнительно содержит дополнительный вектор, содержащий полинуклеотидную цепь, кодирующую РС5 или РС7.In some embodiments, the vector as described herein further comprises an additional vector comprising a polynucleotide chain encoding PC5 or PC7.

Также раскрыта клетка-хозяин, содержащая полинуклеотид или вектор согласно описанию в настоящем документе. В некоторых вариантах реализации изобретения клетка-хозяин представляет собой клетку млекопитающего. В определенных вариантах реализации изобретения клетка млекопитающего выбрана из клетки HEK293 (human embryonic kidney 293; линия эмбриональных клеток почки человека), клетки СНО (chinese hamster ovary; линия клеток яичника китайского хомячка) и клетки ВНК (baby ham- 8 044115 ster kidney; линия клеток почки новорожденного сирийского хомячка).Also disclosed is a host cell containing a polynucleotide or vector as described herein. In some embodiments, the host cell is a mammalian cell. In certain embodiments of the invention, the mammalian cell is selected from a HEK293 cell (human embryonic kidney 293; human embryonic kidney cell line), a CHO cell (Chinese hamster ovary; Chinese hamster ovary cell line), and a BHK cell (baby ham-8 044115 ster kidney line). kidney cells of a newborn Syrian hamster).

Также раскрыта фармацевтическая композиция, содержащая химерный белок, полинуклеотид, вектор или клетку-хозяина согласно описанию в настоящем документе и фармацевтически приемлемый носитель. В некоторых вариантах реализации изобретения химерный белок имеет более продолжительный период полувыведения по сравнению с белком FVIII дикого типа. В определенных вариантах реализации изобретения период полувыведения химерного белка по меньшей мере в около 1,5 раза, по меньшей мере в около 2 раз, по меньшей мере в около 2,5 раза, по меньшей мере в около 3 раз, по меньшей мере в около 4 раз, по меньшей мере в около 5 раз, по меньшей мере в около 6 раз, по меньшей мере в около 7 раз, по меньшей мере в около 8 раз, по меньшей мере в около 9 раз, по меньшей мере в около 10 раз, по меньшей мере в около 11 раз или по меньшей мере в около 12 раз более продолжителен, чем таковой белка FVIII дикого типа.Also disclosed is a pharmaceutical composition comprising a chimeric protein, polynucleotide, vector or host cell as described herein and a pharmaceutically acceptable carrier. In some embodiments, the chimeric protein has a longer half-life than the wild-type FVIII protein. In certain embodiments, the half-life of the chimeric protein is at least about 1.5-fold, at least about 2-fold, at least about 2.5-fold, at least about 3-fold, at least about 4 times, at least about 5 times, at least about 6 times, at least about 7 times, at least about 8 times, at least about 9 times, at least about 10 times , is at least about 11 times or at least about 12 times longer lasting than that of wild-type FVIII protein.

Некоторые варианты реализации изобретения включают композицию согласно описанию в настоящем документе, отличающуюся тем, что период полувыведения химерного белка составляет по меньшей мере около 17 ч, по меньшей мере около 18 ч, по меньшей мере около 19 ч, по меньшей мере около 20 ч, по меньшей мере около 21 ч, по меньшей мере около 22 ч, по меньшей мере около 23 ч, по меньшей мере около 24 ч, по меньшей мере около 25 ч, по меньшей мере около 26 ч, по меньшей мере около 27 ч, по меньшей мере около 28 ч, по меньшей мере около 29 ч, по меньшей мере около 30 ч, по меньшей мере около 31 ч, по меньшей мере около 32 ч, по меньшей мере около 33 ч, по меньшей мере около 34 ч, по меньшей мере около 35 ч, по меньшей мере около 36 ч, по меньшей мере около 48 ч, по меньшей мере около 60 ч, по меньшей мере около 72 ч, по меньшей мере около 84 ч, по меньшей мере около 96 ч или по меньшей мере около 108 ч. В определенных вариантах реализации изобретения период полувыведения химерного белка составляет около 40 ч у мышей с гемофилией А. В некоторых вариантах реализации изобретения композиция согласно описанию в настоящем документе вводится путем, выбранным из группы, состоящей из местного применения, внутриглазного введения, парентерального введения, интратекального введения, субдурального введения и перорального приема. В определенных вариантах реализации изобретения парентеральное введение может представлять собой внутривенное или подкожное введение.Some embodiments of the invention include a composition as described herein, characterized in that the half-life of the chimeric protein is at least about 17 hours, at least about 18 hours, at least about 19 hours, at least about 20 hours, at least about 21 hours, at least about 22 hours, at least about 23 hours, at least about 24 hours, at least about 25 hours, at least about 26 hours, at least about 27 hours, at least at least about 28 hours, at least about 29 hours, at least about 30 hours, at least about 31 hours, at least about 32 hours, at least about 33 hours, at least about 34 hours, at least about 35 hours, at least about 36 hours, at least about 48 hours, at least about 60 hours, at least about 72 hours, at least about 84 hours, at least about 96 hours, or at least about 108 hours. In certain embodiments, the half-life of the chimeric protein is about 40 hours in mice with hemophilia A. In some embodiments, the composition as described herein is administered by a route selected from the group consisting of topical administration, intraocular administration, parenteral administration , intrathecal administration, subdural administration and oral administration. In certain embodiments of the invention, parenteral administration may be intravenous or subcutaneous administration.

В некоторых вариантах реализации изобретения композиция согласно описанию в настоящем документе используется для лечения геморрагического заболевания или состояния у субъекта, нуждающегося в этом. В определенных вариантах реализации изобретения геморрагическое заболевание или состояние выбрано из группы, состоящей из нарушения свертываемости крови, гемартроза, мышечного кровотечения, кровоточивости полости рта, кровоизлияния, кровоизлияния в мышцы, кровоизлияния в полости рта, травмы, травмы головы, желудочно-кишечного кровотечения, внутричерепного кровоизлияния, внутрибрюшного кровоизлияния, кровоизлияния в грудную полость, перелома кости, кровотечения органов центральной нервной системы, кровоизлияния в заглоточном пространстве, кровоизлияния в забрюшинное пространство, кровоизлияния во влагалище подвздошно-поясничной мышцы и любых их комбинаций. В некоторых вариантах реализации изобретения субъекту назначено хирургическое вмешательство. В определенных вариантах реализации изобретения лечение является профилактическим или по требованию.In some embodiments, a composition as described herein is used to treat a hemorrhagic disease or condition in a subject in need thereof. In certain embodiments of the invention, the hemorrhagic disease or condition is selected from the group consisting of a bleeding disorder, hemarthrosis, muscle bleeding, oral bleeding, hemorrhage, muscle hemorrhage, oral hemorrhage, trauma, head injury, gastrointestinal bleeding, intracranial hemorrhage, intra-abdominal hemorrhage, hemorrhage in the chest cavity, bone fracture, bleeding of the central nervous system, hemorrhage in the retropharyngeal space, hemorrhage in the retroperitoneal space, hemorrhage in the iliopsoas muscle sheath and any combinations thereof. In some embodiments, the subject is scheduled for surgery. In certain embodiments of the invention, treatment is prophylactic or on demand.

Также раскрыт способ продления или увеличения периода полувыведения химерного белка, который включает введение эффективного количества химерного белка, полинуклеотида, вектора, клеткихозяина или композиции согласно описанию в настоящем документе субъекту, имеющему для этого показания, причем белок ФВ, последовательность XTEN, первая константная область ИГ или ее часть и вторая константная область ИГ или ее часть увеличивают период полувыведения химерного белка.Also disclosed is a method of prolonging or increasing the half-life of a chimeric protein, which comprises administering an effective amount of a chimeric protein, polynucleotide, vector, host cell, or composition as described herein to a subject having an indication therefor, wherein the VWF protein, the XTEN sequence, the first IG constant region, or part thereof and the second IG constant region or part thereof increases the half-life of the chimeric protein.

Некоторые варианты реализации изобретения включают способ лечения геморрагического заболевания или расстройства у субъекта, имеющего для этого показания, который включает введение эффективного количества химерного белка, полинуклеотида, вектора, клетки-хозяина или композиции согласно описанию в настоящем документе, причем геморрагическое заболевание или расстройство выбрано из группы, состоящей из нарушения свертываемости крови, гемартроза, мышечного кровотечения, кровоточивости полости рта, кровоизлияния, кровоизлияния в мышцы, кровоизлияния в полости рта, травмы, травмы головы, желудочно-кишечного кровотечения, внутричерепного кровоизлияния, внутрибрюшного кровоизлияния, кровоизлияния в грудную полость, перелома кости, кровотечения органов центральной нервной системы, кровоизлияния в заглоточном пространстве, кровоизлияния в забрюшинное пространство и кровоизлияния во влагалище подвздошно-поясничной мышцы. В некоторых вариантах реализации изобретения субъект представляет собой животное. В некоторых вариантах реализации изобретения животное представляет собой человека. В некоторых вариантах реализации изобретения субъект страдает гемофилией А. В определенных вариантах реализации изобретения лечение является профилактическим или по требованию. В некоторых вариантах реализации изобретения эффективное количество составляет от 0,1 мкг/кг до 500 мг/кг.Some embodiments of the invention include a method of treating a hemorrhagic disease or disorder in a subject having an indication therefor, which includes administering an effective amount of a chimeric protein, polynucleotide, vector, host cell, or composition as described herein, wherein the hemorrhagic disease or disorder is selected from the group consisting of bleeding disorder, hemarthrosis, muscle bleeding, oral bleeding, hemorrhage, muscle hemorrhage, oral hemorrhage, trauma, head injury, gastrointestinal bleeding, intracranial hemorrhage, intra-abdominal hemorrhage, chest hemorrhage, bone fracture , bleeding of the organs of the central nervous system, hemorrhage in the retropharyngeal space, hemorrhage in the retroperitoneal space and hemorrhage in the sheath of the iliopsoas muscle. In some embodiments, the subject is an animal. In some embodiments, the animal is a human. In some embodiments, the subject has hemophilia A. In certain embodiments, the treatment is prophylactic or on-demand. In some embodiments, the effective amount is from 0.1 μg/kg to 500 mg/kg.

Также раскрыт способ согласно описанию в настоящем документе, отличающийся тем, что химерный белок, полинуклеотид, вектор, клетка-хозяин или композиция согласно описанию в настоящем документе вводится путем, выбранным из группы, состоящей из местного применения, внутриглазногоAlso disclosed is a method as described herein, wherein the chimeric protein, polynucleotide, vector, host cell, or composition as described herein is administered by a route selected from the group consisting of topical application, intraocular

- 9 044115 введения, парентерального введения, интратекального введения, субдурального введения и перорального приема. В определенных вариантах реализации изобретения парентеральное введение выбрано из группы, состоящей из внутривенного введения, подкожного введения, внутримышечного введения и внутрикожного введения.- 9 044115 administration, parenteral administration, intrathecal administration, subdural administration and oral administration. In certain embodiments, parenteral administration is selected from the group consisting of intravenous administration, subcutaneous administration, intramuscular administration, and intradermal administration.

Некоторые варианты реализации изобретения включают способ изготовления химерного белка, включающий трансфекцию одной или более клеток-хозяев полинуклеотидом или вектором согласно описанию в настоящем документе и экспрессию химерного белка в клетке-хозяине. В некоторых вариантах реализации изобретения способ согласно описанию в настоящем документе дополнительно включает выделение химерного белка. В определенных вариантах реализации изобретения химерный белок эффективен в остановке и/или предотвращении кровотечения у субъекта.Some embodiments of the invention include a method of making a chimeric protein, comprising transfecting one or more host cells with a polynucleotide or vector as described herein and expressing the chimeric protein in the host cell. In some embodiments, the method as described herein further comprises isolating the chimeric protein. In certain embodiments, the chimeric protein is effective in stopping and/or preventing bleeding in a subject.

Краткое описание графических материалов/фигурBrief description of graphics/figures

На фиг. 1 представлено схематическое изображение химерного белка, состоящего из первого полипептида, который содержит белок FVIII (А1-А2-частичный или полный домен В-А3-С1-С2), слитый с фрагментом Fc, причем в сайт встраивания в пределах белка FVIII встроена последовательность XTEN, и второго полипептида, который содержит белок ФВ, содержащий домены D'D3, последовательность XTEN из менее чем 288 аминокислот, расщепляемый тромбином линкер и второй фрагмент Fc. Вставки последовательности XTEN в белок FVIII и/или слияния последовательности XTEN с белком ФВ продлевают период полувыведения химерного белка, увеличивая гидродинамический радиус и блокируя опосредованный рецепторами клиренс. Домены D'D3 белка ФВ блокируют взаимодействие FVIII с эндогенным ФВ, стабилизируют белок FVIII и продлевают полувыведения химерного белка. Домены Fc могут ковалентно связывать домены D'D3 с белком FVIII и продлевать период полувыведения химерного белка через FcRn-опосредованный метаболический путь. Расщепляемый тромбином линкер делает возможным высвобождение доменов D'D3 при активации FVIII и обеспечивает правильное выравнивание между FVIII и доменами D'D3 ФВ.In fig. 1 is a schematic representation of a chimeric protein consisting of a first polypeptide that contains the FVIII protein (A1-A2-partial or full B-A3-C1-C2 domain) fused to an Fc fragment, with the sequence XTEN inserted into the insertion site within the FVIII protein , and a second polypeptide that contains a VWF protein containing D'D3 domains, an XTEN sequence of less than 288 amino acids, a thrombin-cleavable linker, and a second Fc fragment. Insertion of an XTEN sequence into the FVIII protein and/or fusion of an XTEN sequence to the VWF protein prolongs the half-life of the chimeric protein by increasing the hydrodynamic radius and blocking receptor-mediated clearance. The D'D3 domains of the VWF protein block the interaction of FVIII with endogenous VWF, stabilize the FVIII protein and prolong the half-life of the chimeric protein. Fc domains can covalently link D'D3 domains to FVIII protein and prolong the half-life of the chimeric protein through the FcRn-mediated metabolic pathway. The thrombin-cleavable linker allows the release of D'D3 domains upon FVIII activation and ensures proper alignment between FVIII and VWF D'D3 domains.

На фиг. 2 представлена трехплазмидная система экспрессии для гетеродимеров FVIII-XTENFc:D'D3-XTEN-Fc: первая плазмида, содержащая нуклеотидную последовательность, кодирующую одноцепочечный белок FVIII-XTEN-Fc, в котором последовательность XTEN встроена в домен В; вторая плазмида, содержащая нуклеотидную последовательность, кодирующую белок D1D2D'D3-XTEN-Fc, в котором последовательность XTEN содержит менее 288 аминокислот; и третья плазмида, содержащая нуклеотидную последовательность, кодирующую РАСЕ - фермент процессинга пропептида. Когда три полипептида экспрессируются с трех плазмид, полипептидные домены D1D2 белка ФВ могут отщепляться от доменов D'D3 путем внутриклеточного процессинга. Полученный в результате комплекс содержит три продукта: первая молекула представляет собой гетеродимеры FVnI-XTEN/D'D3, вторая молекула представляет собой побочный продукт - гомодимер D'D3-XTEN-Fc, и третья молекула представляет собой еще один побочный продукт, то есть FVIII(XTEN)-Fc.In fig. 2 shows a three-plasmid expression system for FVIII-XTENFc:D'D3-XTEN-Fc heterodimers: the first plasmid containing the nucleotide sequence encoding the single-chain protein FVIII-XTEN-Fc, in which the XTEN sequence is inserted into the B domain; a second plasmid containing a nucleotide sequence encoding a D1D2D'D3-XTEN-Fc protein, in which the XTEN sequence contains less than 288 amino acids; and a third plasmid containing a nucleotide sequence encoding PACE, a propeptide processing enzyme. When three polypeptides are expressed from three plasmids, the D1D2 polypeptide domains of the VWF protein can be cleaved from the D'D3 domains by intracellular processing. The resulting complex contains three products: the first molecule is the FVnI-XTEN/D'D3 heterodimers, the second molecule is a by-product, the D'D3-XTEN-Fc homodimer, and the third molecule is another by-product, i.e. FVIII (XTEN)-Fc.

На фиг. 3 представлены аддитивные эффекты вставок XTEN на продление периода полувыведения гетеродимеров. FVIII169 содержит слитый с фрагментом Fc белок FVIII с удаленным доменом В, в котором последовательность XTEN (например, AE288) встроена в позицию, соответствующую аминокислоте 745 зрелого полноразмерного FVIII. FVIII205 содержит слитый с фрагментом Fc белок FVIII с удаленным доменом В, в котором последовательность XTEN (например, AE144) встроена в позицию, соответствующую аминокислоте 18 зрелого полноразмерного FVIII, и еще одна последовательность XTEN (например, AE288) встроена в позицию, соответствующую аминокислоте 745 зрелого полноразмерного FVIII. ФВ031 содержит домен D' и домен D3 ФВ, слитые с фрагментом Fc с помощью расщепляемого тромбином линкера (без XTEN). ФВ034 содержит домен D' и домен D3 ФВ, слитые с AE288 и фрагментом Fc. Период полувыведения FVIШ69/ФВ031 (перевернутый треугольник) составляет 16,7 ч у мышей с гемофилией А; период полувыведения FVIII205/ФВ031 (круг) составляет 29,4 ч у мышей с гемофилией А; и период полувыведения FVIШ69/ФВ034 (квадрат) составляет 31,1 ч у мышей с гемофилией А.In fig. Figure 3 shows the additive effects of XTEN insertions on prolonging the half-life of heterodimers. FVIII169 contains an Fc fragment-fused FVIII protein with the B domain removed, in which the XTEN sequence (eg, AE288) is inserted at the position corresponding to amino acid 745 of mature full-length FVIII. FVIII205 contains an Fc fusion of an FVIII protein with the B domain removed, in which an XTEN sequence (e.g., AE144) is inserted at amino acid 18 of mature full-length FVIII, and another XTEN sequence (e.g., AE288) is inserted at amino acid 745 mature full-length FVIII. VWF031 contains the VWF D' domain and D3 domain fused to the Fc moiety via a thrombin-cleavable linker (without XTEN). VWF034 contains the VWF D' domain and D3 domain fused to AE288 and an Fc fragment. The half-life of FVIIII9/FV031 (inverted triangle) is 16.7 hours in hemophilia A mice; the half-life of FVIII205/FV031 (circle) is 29.4 hours in mice with hemophilia A; and the half-life of FVIIII9/FV034 (square) is 31.1 hours in hemophilia A mice.

На фиг. 4 показано, что в случае встраивания между доменами D'D3 ФВ и доменами Fc последовательность AE144 XTEN обеспечивает большее продление периода полувыведения, чем AE288 XTEN. Например, в то время как период полувыведения FVIШ69/ФВ034 (квадрат) у мышей с гемофилией А составляет 31,1 ч, период полувыведения FVIШ69//ФВ057 (круг) у мышей с гемофилией А составляет 42 ч. ФВ057 содержит домены D'D3 ФВ, слитые с AE144 и фрагментом Fc.In fig. Figure 4 shows that when inserted between the D'D3 domains of VWF and the Fc domains, the AE144 XTEN sequence provides greater half-life extension than AE288 XTEN. For example, while the half-life of FVIIII69/FV034 (square) in hemophilia A mice is 31.1 hours, the half-life of FVIIII69//FV057 (circle) in hemophilia A mice is 42 hours. FV057 contains VWF D'D3 domains fused to AE144 and an Fc fragment.

На фиг. 5 показано, что для продления периода полувыведения гетеродимеров химерного белка необходимы домены Fc. При сравнении периода полувыведения FVIII205/ФВ031 (круг) у мышей с гемофилией А с таковым белка FVIII263/ФВ050 (квадрат), содержащего мутации в сайтах связывания FcRn (тройная мутация IHH (Indian Hedgehog Homolog) в Fc) и, следовательно, не поддающегося рециркуляции в пути FcRn, период полувыведения FVIII263/ФВ050 (23 ч) короче периода полувыведения FVIII205/ФВ031 (29,4 ч). Это говорит о том, что фрагменты Fc необходимы для продления периода полувыведения.In fig. Figure 5 shows that Fc domains are required to prolong the half-life of chimeric protein heterodimers. Comparing the half-life of FVIII205/FB031 (circle) in hemophilia A mice with that of the FVIII263/FB050 protein (square), which contains mutations in the FcRn binding sites (triple IHH (Indian Hedgehog Homolog) mutation in Fc) and therefore cannot be recycled in the FcRn pathway, the half-life of FVIII263/VWF050 (23 hours) is shorter than the half-life of FVIII205/VWF031 (29.4 hours). This suggests that Fc fragments are required to prolong the half-life.

На фиг. 6А представлена аналогичная мгновенная эффективность гетеродимеров FVIII-XTENFc/D'D3-XTEN-Fc по сравнению с белком FVIII с удаленным доменом В (SQ BDD FVIII) на модели кровотечения, вызванного отрезанием хвоста, у мышей с гемофилией А. Мышам вводили дозу 75 МЕ/кг иIn fig. Figure 6A shows the similar immediate efficacy of FVIII-XTENFc/D'D3-XTEN-Fc heterodimers compared to B domain deleted FVIII protein (SQ BDD FVIII) in a tail-cut hemorrhage model in hemophilia A mice. Mice were dosed with 75 IU /kg and

- 10 044115 измеряли активность в анализе АЧТВ. SQ BDD FVIII показан в форме круга, FVШ169/ФВ034 - в форме квадрата, FVШ169/ФВ057 - в форме ромба, а носитель - в форме перевернутого треугольника. Подробное описание конструкций FVIII169, ФВ034 и ФВ057 приведено в другом месте в настоящем документе. На фиг. 6В показано сравнение мгновенной эффективности FVШ169/ФВ034 и FVIII с удаленным доменом В (SQ BDD FVIII) у мышей с гемофилией А при использовании дозы 37,5 МЕ/кг и измерении активности в анализе АЧТВ. Медианы потери крови (мкл) у мышей в каждой экспериментальной группе обозначены горизонтальными линиями, потери крови (мкл) у мышей линии C57/BL6 обозначены незакрашенными треугольниками; потери крови (мкл) после введения rBDD-FVIII в дозе 37,5 МЕ/кг обозначены незакрашенными кругами; потери крови (мкл) после введения FVШ169/ФВ034 в дозе 37,5 МЕ/кг обозначены незакрашенными квадратами и потери крови (мкл) после введения носителя обозначены перевернутыми треугольниками.- 10 044115 activity was measured in the APTT assay. SQ BDD FVIII is shown in the shape of a circle, FVШ169/ФВ034 - in the shape of a square, FVШ169/ФВ057 - in the shape of a diamond, and the carrier is in the shape of an inverted triangle. Detailed descriptions of the FVIII169, FV034 and FV057 designs are provided elsewhere in this document. In fig. 6B shows a comparison of the immediate efficacy of FVIII169/FV034 and B domain deleted FVIII (SQ BDD FVIII) in hemophilia A mice using a dose of 37.5 IU/kg and measuring activity in the APTT assay. Median blood loss (μL) in mice in each experimental group is indicated by horizontal lines; blood loss (μL) in C57/BL6 mice is indicated by open triangles; blood loss (μl) after administration of rBDD-FVIII at a dose of 37.5 IU/kg is indicated by open circles; blood loss (μL) after administration of FVIII169/FV034 at a dose of 37.5 IU/kg is indicated by open squares and blood loss (μL) after vehicle administration is indicated by inverted triangles.

На фиг. 7А, В показано, что гетеродимер rFVШ169/ФВ057 обеспечивает более длительную защиту у мышей с гемофилией А в модели кровотечения, вызванного рассечением хвостовой вены. На фиг. 7А представлены данные о повторных кровотечениях у мышей, получавших rFVШ169/ФВ057 за 72 ч до повреждения хвоста (квадрат), SQ BDD-FVIII за 48 ч до повреждения хвоста (ромб), SQ BDD-FVIII за 24 ч до повреждения хвоста (перевернутый треугольник) и носитель (круг). Активность измеряли с помощью анализа АЧТВ. По оси абсцисс отложено время в часах, а по оси ординат - процент особей, у которых не наблюдалось кровотечения. На фиг. 7В представлены соответствующие данные по выживанию для четырех категорий мышей, показанных на фиг. 7А. У мышей, получавших rFVIШ69/ФВ057 в дозе 12 МЕ/кг за 72 ч до повреждения хвоста, отмечались аналогичные показатели защиты от повторного кровотечения и выживаемости по сравнению с мышами, получавшими SQ BDD-FVIII за 24 ч до повреждения хвоста.In fig. 7A, B show that the rFVIII169/FV057 heterodimer provides longer-lasting protection in hemophilia A mice in a model of hemorrhage induced by tail vein transection. In fig. Figure 7A shows data on rebleeding in mice treated with rFVIII169/FV057 72 hours before tail injury (square), SQ BDD-FVIII 48 hours before tail injury (diamond), SQ BDD-FVIII 24 hours before tail injury (inverted triangle ) and carrier (circle). Activity was measured using aPTT assay. The x-axis shows time in hours, and the y-axis shows the percentage of individuals who did not experience bleeding. In fig. 7B shows the corresponding survival data for the four categories of mice shown in FIG. 7A. Mice treated with rFVIIII69/FV057 at a dose of 12 IU/kg 72 hours before tail injury showed similar protection from rebleeding and survival compared to mice treated with SQ BDD-FVIII 24 hours before tail injury.

На фиг. 8А представлены сопоставимые показатели повторных кровотечений у мышей, получавших гетеродимеры FVIII-XTEN-Fc/D'D3-XTEN-Fc за 96 ч до повреждения, и мышей, получавших rBDD-FVIII за 24 ч до повреждения. Закрашенные квадраты иллюстрируют данные о повторных кровотечениях у мышей, получавших FVIШ69/ФВ034 за 24 ч до повреждения; незакрашенные квадраты иллюстрируют данные о повторных кровотечениях у мышей, получавших FVIШ69/ФВ034 за 96 ч до повреждения; закрашенные ромбы иллюстрируют данные о повторных кровотечениях у мышей, получавших FVIШ69/ФВ057 за 24 ч до повреждения; незакрашенные ромбы иллюстрируют данные о повторных кровотечениях у мышей, получавших FVIШ69/ФВ057 за 96 ч до повреждения; закрашенные круги иллюстрируют данные о повторных кровотечениях у мышей, получавших rBDD-FVIII за 24 ч до повреждения; незакрашенные круги иллюстрируют данные о повторных кровотечениях у мышей, получавших rBDD-FVIII за 48 ч до повреждения; и закрашенные треугольники иллюстрируют данные о повторных кровотечениях у мышей, получавших носитель. По оси абсцисс отложено время в часах, а по оси ординат - процент особей, у которых не наблюдалось кровотечения.In fig. Figure 8A shows comparable rates of rebleeding between mice treated with FVIII-XTEN-Fc/D'D3-XTEN-Fc heterodimers 96 hours before injury and mice treated with rBDD-FVIII 24 hours before injury. Filled squares illustrate data on rebleeding in mice treated with FVIIII69/FV034 24 hours before injury; open squares illustrate data on rebleeding in mice treated with FVIIII69/FV034 96 hours before injury; filled diamonds illustrate data on rebleeding in mice treated with FVIIII69/FV057 24 hours before injury; open diamonds illustrate data on rebleeding in mice treated with FVIIII69/FV057 96 hours before injury; filled circles illustrate rebleeding data in mice treated with rBDD-FVIII 24 h before injury; open circles illustrate rebleeding data in mice treated with rBDD-FVIII 48 h before injury; and filled triangles illustrate rebleeding data in vehicle-treated mice. The x-axis shows time in hours, and the y-axis shows the percentage of individuals who did not experience bleeding.

На фиг. 8В представлены кривые выживания мышей, получавших гетеродимеры FVIII-XTENFc/D'D3-XTEN-Fc за 96 ч до повреждения, по сравнению с мышами, получавшими rBDD-FVIII за 24 ч до повреждения. По оси абсцисс отложено время в часах, по оси ординат - выживаемость в процентах. Условные обозначения такие же, как на фиг. 8А.In fig. 8B shows the survival curves of mice treated with FVIII-XTENFc/D'D3-XTEN-Fc heterodimers 96 hours before injury compared to mice treated with rBDD-FVIII 24 hours before injury. The x-axis shows time in hours, and the y-axis shows survival rate in percentage. The symbols are the same as in Fig. 8A.

На фиг. 9 представлены схематические изображения типичных гетеродимеров FVIII-ФВ и конструкций FVIII169, FVIII286, ФВ057, ФВ059 и ФВ062. Например, конструкция FVIII169 содержит слитый с фрагментом Fc белок FVIII с удаленным доменом В и заменой R1648A, в котором последовательность XTEN (например, AE288) встроена в позицию, соответствующую аминокислоте 745 зрелого полноразмерного FVIII (A1-a1-A2-a2-288XTEN-a3-A3-C1-C2-Fc). Конструкция FVIII286 содержит слитый с фрагментом Fc белок FVIII с удаленным доменом В и заменой R1648, в котором последовательность XTEN (например, AE288) встроена в позицию, соответствующую аминокислоте 745 зрелого полноразмерного FVIII, с дополнительной областью а2 между FVIII и Fc (A1-a1-A2-a2-288XTEN-a3-A3-C1-C2-a2-Fc). ФВ057 представляет собой слитую конструкцию ФВ-Fc, содержащую домен D'D3 белка ФВ (с двумя аминокислотными заменами в домене D'D3, т.е. С336А и С379А), связанный с фрагментом Fc посредством линкера ФВ, содержащего сайт расщепления тромбином LVPRG (LVPRG; SEQ ID NO: 6) и глицин-сериновый линкер (GS), причем в данной конструкции последовательность XTEN (например, AE144) встроена между доменом D'D3 и линкером ФВ (D'D3-144XTEN-GS+LVPRG-Fc). ФВ059 представляет собой слитую конструкцию ФВ-Fc, содержащую домен D'D3 белка ФВ (с двумя аминокислотными заменами в домене D'D3, т.е. С336А и С379А), связанный с фрагментом Fc посредством кислой области 2 (а2) белка FVIII в качестве линкера ФВ, причем последовательность XTEN (т.е. AE144) встроена между доменом D'D3 и линкером ФВ. ФВ062 представляет собой слитую конструкцию ФВ-Fc, содержащую домен D'D3 белка ФВ (с двумя аминокислотными заменами в домене D'D3, т.е. С336А и С379А), связанный с фрагментом Fc, причем последовательность XTEN (т.е. AE144) встроена между доменом D'D3 и фрагментом Fc (D'D3-144XTEN-Fc).In fig. Figure 9 shows schematic representations of typical FVIII-VWF heterodimers and the FVIII169, FVIII286, FVIII286, FV057, FV059, and FV062 constructs. For example, the FVIII169 construct contains a FVIII protein fused to an Fc fragment with the B domain removed and the R1648A substitution in which the XTEN sequence (e.g., AE288) is inserted at the position corresponding to amino acid 745 of mature full-length FVIII (A1-a1-A2-a2-288XTEN-a3 -A3-C1-C2-Fc). The FVIII286 construct contains a FVIII protein fused to an Fc fragment with the B domain removed and the R1648 substitution in which the XTEN sequence (e.g., AE288) is inserted at the position corresponding to amino acid 745 of mature full-length FVIII, with an additional a2 region between FVIII and Fc (A1-a1- A2-a2-288XTEN-a3-A3-C1-C2-a2-Fc). VWF057 is a VWF-Fc fusion construct containing the D'D3 domain of the VWF protein (with two amino acid substitutions in the D'D3 domain, i.e., C336A and C379A), linked to the Fc fragment via a VWF linker containing the thrombin cleavage site LVPRG ( LVPRG; SEQ ID NO: 6) and a glycine-serine linker (GS), and in this construct the XTEN sequence (for example, AE144) is inserted between the D'D3 domain and the VWF linker (D'D3-144XTEN-GS+LVPRG-Fc) . VWF059 is a VWF-Fc fusion construct containing the D'D3 domain of the VWF protein (with two amino acid substitutions in the D'D3 domain, i.e. C336A and C379A), linked to the Fc fragment via the acidic region 2 (a2) of the FVIII protein as a VWF linker, with the XTEN sequence (i.e. AE144) inserted between the D'D3 domain and the VWF linker. VWF062 is a VWF-Fc fusion construct containing the D'D3 domain of the VWF protein (with two amino acid substitutions in the D'D3 domain, i.e. C336A and C379A) linked to an Fc fragment, the sequence being XTEN (i.e. AE144 ) is inserted between the D'D3 domain and the Fc fragment (D'D3-144XTEN-Fc).

На фиг. 10 представлено схематическое изображение гетеродимерных конструкций FVIII/ФВ, например FVШ169/ФВ057, FVIШ69/ФВ059, FVIШ69/ФВ059A и FVШ169/ФВ073. Стрелкой показан сайт, в который добавляется необязательный линкер для введения сайта расщепления тромбином. FVIШ69/ФВ057 имеет линкер, содержащий LVPRG (SEQ ID NO: 6). FVIШ69/ФВ059 имеет линкер, со- 11 044115 держащий область а2 белка FVIII (т.е.In fig. 10 is a schematic representation of heterodimeric FVIII/VWF constructs, for example FVIII169/FV057, FVIIII69/FV059, FVIIII69/FV059A and FVIII169/FV073. The arrow indicates the site at which an optional linker is added to introduce a thrombin cleavage site. FVIIII69/FV057 has a linker containing LVPRG (SEQ ID NO: 6). FVIIII69/FV059 has a linker containing the a2 region of the FVIII protein (i.e.

ISDKNTGDYYEDSYEDISAYLLSKNNAIEPRSFSDKTH (SEQ ID NO: 106),ISDKNTGDYYEDSYEDISAYLLSKNNAIEPRSFSDKTH (SEQ ID NO: 106),

FVШ169/ФВ059A имеет линкер, содержащий укороченную область а2 белка FVIII (т.е. DKNTGDYYEDSYEDISAYLLSKNNAIEPRSFSDKTH (SEQ ID NO: 88)). FvΠΠ69/φвo73 имеет линкер в пределах конструкции ФВ073 (SEQ ID NO: 175), который содержит фрагмент области а2 белка FVIII, состоящий из IEPRSFS (SEQ ID NO: 194).FVIII169/FV059A has a linker containing a truncated a2 region of the FVIII protein (ie DKNTGDYYEDSYEDISAYLLSKNNAIEPRSFSDKTH (SEQ ID NO: 88)). Fv ΠΠ 69/φbo73 has a linker within the construct FV073 (SEQ ID NO: 175), which contains a fragment of the a2 region of the FVIII protein, consisting of IEPRSFS (SEQ ID NO: 194).

На фиг. 11А-С показаны ДСН-ПААГ-электрофореграммы, полученные после расщепления FVIШ69/ФВ057 тромбином, с использованием FVIII-Fc в качестве контроля. На фиг. 11А представлено окрашивание геля для ДСН-ПААГ-электрофореза антителом к D3 (АВ 96340). Стрелками выделено LCFc:D'D3-XTEN-Fc, представляющий собой нерасщепленный, полноразмерный FVIШ69/ФВ057, и D'D3-144 XTEN, представляющий собой фрагмент, полученный в результате расщепления тромбином. На фиг. 11В представлено окрашивание геля для ДСН-ПААГ-электрофореза антителом к тяжелой цепи (heavy chain, НС) (GMA012). Стрелками выделено тяжелую цепь FVIII (НС) и домен А2 FVIII. На фиг. 11С представлено совмещенное изображение тест-панелей А и В. Образцы отбирали в моменты времени, указанные в верхней части каждой тест-панели. Стрелки указывают на соответствующие белки.In fig. 11A-C show SDS-PAGE electropherograms obtained after digestion of FVIIII69/FV057 with thrombin, using FVIII-Fc as a control. In fig. 11A shows staining of an SDS-PAGE gel with anti-D3 antibody (AB 96340). Arrows highlight LCFc:D'D3-XTEN-Fc, which is an uncleaved, full-length FVIIII69/FV057, and D'D3-144 XTEN, which is a fragment obtained as a result of cleavage with thrombin. In fig. 11B shows staining of an SDS-PAGE gel with a heavy chain antibody (HC) (GMA012). Arrows highlight the FVIII heavy chain (HC) and the A2 domain of FVIII. In fig. 11C is a superimposed image of test panels A and B. Samples were collected at the time points indicated at the top of each test panel. Arrows point to the corresponding proteins.

На фиг. 12А-С показаны ДСН-ПААГ-электрофореграммы, полученные после расщепления FVIШ69/ФВ059 тромбином. На фиг. 12А представлено окрашивание геля для ДСН-ПААГэлектрофореза антителом к D3 (АВ 96340). Стрелками выделено LCFc:D'D3-XTEN-Fc, представляющий собой нерасщепленный, полноразмерный FVIШ69/ФВ059, и DD3-144 XTEN, представляющий собой фрагмент, полученный в результате расщепления тромбином. На фиг. 12В представлено окрашивание геля для ДСН-ПААГ-электрофореза антителом к НС (GMA012). Стрелками выделено нерасщепленный, полноразмерный FVIШ69/ФВ059, D'D3-144 XTEN-аЗ, представляющий собой фрагмент, полученный в результате расщепления тромбином, и А2, представляющий собой домен А2 белка FVIII. На фиг. 12С представлено совмещенное изображение тест-панелей А и В. Образцы отбирали в моменты времени, указанные в верхней части каждой тест-панели.In fig. 12A-C show SDS-PAGE electropherograms obtained after cleavage of FVIIII69/FV059 with thrombin. In fig. 12A shows staining of an SDS-PAGE gel with anti-D3 antibody (AB 96340). Arrows highlight LCFc:D'D3-XTEN-Fc, which is an uncleaved, full-length FVIIII69/FV059, and DD3-144 XTEN, which is a fragment obtained as a result of cleavage with thrombin. In fig. 12B shows SDS-PAGE gel staining with anti-HC antibody (GMA012). The arrows highlight the uncleaved, full-length FVIIII69/FV059, D'D3-144 XTEN-a3, which is a fragment obtained as a result of cleavage by thrombin, and A2, which is the A2 domain of the FVIII protein. In fig. 12C is a composite image of test panels A and B. Samples were collected at the time points indicated at the top of each test panel.

На фиг. 13 представлены данные по мгновенной эффективности у мышей с гемофилией А, получавших FVIШ69/ФВ059 (круг), в сравнении с мышами с гемофилией А, получавшими BDD-FVIII в качестве контроля (квадрат). Показатель кровопотери измеряли после отрезания хвоста, р=0.9883.In fig. Figure 13 shows immediate efficacy data in hemophilia A mice treated with FVIIII69/FV059 (circle) compared to hemophilia A mice treated with BDD-FVIII control (square). Blood loss was measured after tail cutting, p=0.9883.

Подробное описание сущности изобретенияDetailed description of the invention

Настоящее изобретение относится к химерному белку, содержащему два полипептида, первый из которых содержит белок FVIII, слитый с первой константной областью ИГ, и второй из которых содержит белок ФВ, слитый со второй константной областью ИГ или ее частью посредством последовательности XTEN, причем последовательность XTEN содержит менее 288 аминокислотных остатков.The present invention relates to a chimeric protein containing two polypeptides, the first of which contains the FVIII protein fused to a first IG constant region, and the second of which contains the VWF protein fused to a second IG constant region or a portion thereof via an XTEN sequence, wherein the XTEN sequence contains less than 288 amino acid residues.

I. Определения.I. Definitions.

Следует отметить, что существительное в единственном числе подразумевает также и множественное число; например, под определением нуклеотидная последовательность понимают одну или более нуклеотидных последовательностей. Таким образом, термины в единственном числе, термины один или более и по меньшей мере один могут применяться в настоящем документе взаимозаменяемо.It should be noted that a singular noun also implies a plural; for example, by the definition of a nucleotide sequence is meant one or more nucleotide sequences. Thus, the terms singular, one or more, and at least one may be used interchangeably herein.

Более того, использование термина и/или в настоящем документе следует принимать за частное описание любого из двух указанных свойств или компонентов отдельно от второго свойства или компонента или вместе с ним. Следовательно, подразумевается, что термин и/или, примененный в настоящем документе в таком выражении, как А и/или В, включает А и В, А или В, только А и только В.Moreover, the use of the term and/or herein should be taken to specifically describe either of the two specified properties or components separately from or together with the second property or component. Therefore, the term and/or, as used herein in an expression such as A and/or B, is intended to include A and B, A or B, A only and B only.

Аналогично, подразумевается, что термин и/или, примененный в таком выражении, как А, В и/или С, охватывает каждый из следующих аспектов: А, В и С; А, В или С; А или С; А или В; В или С; А и С; А и В; В и С; только А; только В; и только С.Likewise, the term and/or, when used in an expression such as A, B and/or C, is intended to cover each of the following aspects: A, B and C; A, B or C; A or C; A or B; B or C; A and C; A and B; B and C; only A; only in; and only S.

Необходимо понимать, что повсюду в настоящем документе, где для описания аспектов применяется формулировка содержит, также подразумеваются в остальном аналогичные аспекты, описываемые понятиями состоит из и/или по существу состоит из.It should be understood that wherever the phrase contains is used to describe aspects herein, it is also intended to include otherwise similar aspects described by the terms consists of and/or substantially consists of.

Если не указано иное, все технические и научные термины, используемые в настоящем документе, имеют то же значение, что обычно понимается средним специалистом в области техники, к которой относится настоящее изобретение. Например, the Concise Dictionary of Biomedicine and Molecular Biology, Juo, Pei-Show, 2-nd ed., 2002, CRC Press; The Dictionary of Cell and Molecular Biology, 3-е изд., 1999 год, Academic Press; и the Oxford Dictionary Of Biochemistry And Molecular Biology, Revised, 2000, Oxford University Press, предлагают специалисту в данной области техники общий словарь многих терминов, использованных в настоящем описании.Unless otherwise specified, all technical and scientific terms used herein have the same meaning as commonly understood by one of ordinary skill in the art to which this invention relates. For example, the Concise Dictionary of Biomedicine and Molecular Biology, Juo, Pei-Show, 2nd ed., 2002, CRC Press; The Dictionary of Cell and Molecular Biology, 3rd ed., 1999, Academic Press; and the Oxford Dictionary Of Biochemistry And Molecular Biology, Revised, 2000, Oxford University Press, provide one skilled in the art with a general vocabulary for many of the terms used herein.

Единицы, приставки и символы указаны в их принятой форме согласно Международной системе единиц (Systeme International de Unites, СИ). Числовые диапазоны включают числа, определяющие диапазон. Если не указано иное, аминокислотные последовательности записаны слева направо в направлении от амино- до карбоксильного конца. Приведенные в настоящем документе заголовки не ограничивают различные аспекты изобретения, которые могут быть доступны при обращении к описанию в целом. Соответственно, термины, определения которых приведены непосредственно далее по тексту, болееUnits, prefixes and symbols are indicated in their accepted form according to the International System of Units (Systeme International de Unites, SI). Numeric ranges include numbers that define a range. Unless otherwise indicated, amino acid sequences are written from left to right in the direction from amino to carboxyl terminus. The headings set forth herein are not intended to limit the various aspects of the invention that may be apparent by reference to the description as a whole. Accordingly, the terms whose definitions are given immediately below are more

- 12 044115 полно определяются посредством ссылки на описание в полном объеме.- 12 044115 are fully defined by reference to the description in its entirety.

Термин около в настоящем документе означает приблизительно, грубо говоря, примерно или порядка. Когда термин около используют в сочетании с диапазоном числовых значений, он изменяет этот диапазон, расширяя границы выше и ниже указанных далее числовых значений. В целом, термин около может отклонять числовое значение выше или ниже указанного значения на величину, например 10%, в сторону увеличения или уменьшения (выше или ниже).The term about as used herein means approximately, roughly speaking, about or of the order of magnitude. When the term about is used in conjunction with a range of numerical values, it modifies that range by extending the boundaries above and below the following numerical values. In general, the term about can deviate a numerical value above or below a specified value by an amount, such as 10%, upward or downward (above or below).

Подразумевается, что термин полинуклеотид или нуклеотид охватывает одну нуклеиновую кислоту и множество нуклеиновых кислот и относится к выделенной молекуле или конструкции нуклеиновой кислоты, например, матричной РНК (мРНК) или плазмидной ДНК (пДНК). В определенных вариантах реализации изобретения полинуклеотид содержит обычную фосфодиэфирную связь или нестандартную связь (например, амидную связь, как в пептидных нуклеиновых кислотах (ПНК)). Термин нуклеиновая кислота относится к одному или более сегментам нуклеиновой кислоты, например, фрагментам ДНК или РНК, присутствующим в полинуклеотиде. Термин выделенная нуклеиновая кислота или выделенный полинуклеотид подразумевает молекулу нуклеиновой кислоты (ДНК или РНК), которая была удалена из своей нативной среды. Например, рекомбинантный полинуклеотид, кодирующий полипептид фактора VIII и входящий в состав вектора, считается выделенным для целей настоящего изобретения. Дополнительные примеры выделенных полинуклеотидов включают рекомбинантные полинуклеотиды, поддерживаемые в гетерологических клетках-хозяевах или очищенные (частично или существенно) от прочих полинуклеотидов в растворе. Выделенные молекулы РНК включают in vivo или in vitro РНКтранскрипты полинуклеотидов по настоящему изобретению. Выделенные полинуклеотиды или нуклеиновые кислоты согласно настоящему изобретению дополнительно включают таковые молекулы, полученные путем синтеза. К тому же, полинуклеотид или нуклеиновая кислота может включать регуляторные элементы, такие как промоторы, энхансеры, участки связывания рибосом или сигналы терминации транскрипции.The term polynucleotide or nucleotide is intended to encompass a single nucleic acid and multiple nucleic acids and refers to an isolated nucleic acid molecule or construct, such as messenger RNA (mRNA) or plasmid DNA (pDNA). In certain embodiments, the polynucleotide contains a conventional phosphodiester linkage or a non-conventional linkage (eg, an amide linkage, as in peptide nucleic acids (PNAs)). The term nucleic acid refers to one or more segments of nucleic acid, such as DNA or RNA fragments, present in a polynucleotide. The term isolated nucleic acid or isolated polynucleotide refers to a nucleic acid molecule (DNA or RNA) that has been removed from its native environment. For example, a recombinant polynucleotide encoding a factor VIII polypeptide and contained in a vector is considered to be isolated for purposes of the present invention. Additional examples of isolated polynucleotides include recombinant polynucleotides maintained in heterologous host cells or purified (partially or substantially) from other polynucleotides in solution. Isolated RNA molecules include in vivo or in vitro RNA transcripts of the polynucleotides of the present invention. The isolated polynucleotides or nucleic acids of the present invention further include those molecules obtained by synthesis. In addition, the polynucleotide or nucleic acid may include regulatory elements such as promoters, enhancers, ribosome binding sites, or transcription termination signals.

В контексте настоящего документа термин кодирующая область или кодирующая последовательность означает часть полинуклеотида, состоящую из кодонов, поддающихся трансляции в аминокислотную последовательность. Хотя стоп-кодон (TAG, TGA или ТАА), как правило, не транслируется в аминокислоту, он может считаться частью кодирующей области, однако любые фланкирующие последовательности, например промоторы, участки связывания рибосом, терминаторы транскрипции, интроны и тому подобные, не являются частью кодирующей области. Границы кодирующей области, как правило, определяются стартовым кодоном на 5'-конце, кодирующим амино-конец синтезируемого полипептида, и стоп-кодоном трансляции на 3'-конце, кодирующим карбоксильный конец синтезируемого полипептида. Две или более кодирующие области по настоящему изобретению могут присутствовать в одной полинуклеотидной конструкции, например, на одном векторе, или в отдельных полинуклеотидных конструкциях, например, на отдельных (разных) векторах. Отсюда следует, что один вектор может содержать всего одну кодирующую область или две и более кодирующие области, например, один вектор может отдельно кодировать связывающий домен А и связывающий домен В, как описано ниже. К тому же, вектор, полинуклеотид или нуклеиновая кислота по данному изобретению может содержать гетерологические кодирующие области, будь то слитые или не слитые с нуклеиновой кислотой, кодирующей связывающий домен по данному изобретению. Гетерологические кодирующие области включают специализированные элементы или мотивы, такие как секреторный сигнальный пептид или гетерологический функциональный домен, но не ограничиваются ими.As used herein, the term coding region or coding sequence means the portion of a polynucleotide consisting of codons that can be translated into an amino acid sequence. Although a stop codon (TAG, TGA, or TAA) is not typically translated into an amino acid, it may be considered part of the coding region, but any flanking sequences, such as promoters, ribosome binding sites, transcription terminators, introns, and the like, are not part of the coding region. coding region. The boundaries of the coding region are typically defined by a start codon at the 5' end, encoding the amino terminus of the polypeptide being synthesized, and a translation stop codon at the 3' end, encoding the carboxyl terminus of the polypeptide being synthesized. Two or more coding regions of the present invention may be present in a single polynucleotide construct, eg on a single vector, or in separate polynucleotide constructs, eg on separate (different) vectors. It follows that one vector may contain just one coding region or two or more coding regions, for example, one vector may separately encode binding domain A and binding domain B, as described below. In addition, a vector, polynucleotide or nucleic acid of the present invention may contain heterologous coding regions, whether fused or not fused to a nucleic acid encoding a binding domain of the present invention. Heterologous coding regions include, but are not limited to, specialized elements or motifs, such as a secretory signal peptide or a heterologous functional domain.

Определенные белки, секретируемые клетками млекопитающих, соединены с секреторным сигнальным пептидом, который отщепляется от зрелого белка после начала переноса растущей полипептидной цепи через шероховатый эндоплазматический ретикулум. Средним специалистам в данной области техники известно, что сигнальные пептиды обычно соединены с N-концом полипептида и отщепляются от готового или полноразмерного полипептида, чтобы образовалась секретируемая или зрелая форма полипептида. В определенных вариантах реализации изобретения нативный сигнальный пептид или функциональное производное той же последовательности сохраняет способность направлять секрецию полипептида, функционально соединенного с этим пептидом или производным. В альтернативном варианте может использоваться гетерологический сигнальный пептид млекопитающих, например, тканевой активатор плазминогена (ТАП) человека или сигнальный пептид мышиной β-глюкуронидазы, либо их функциональное производное.Certain proteins secreted by mammalian cells are associated with a secretory signal peptide, which is cleaved from the mature protein after the growing polypeptide chain has begun to be transferred through the rough endoplasmic reticulum. Those of ordinary skill in the art will recognize that signal peptides are typically coupled to the N-terminus of a polypeptide and cleaved from the finished or full-length polypeptide to produce the secreted or mature form of the polypeptide. In certain embodiments, the native signal peptide or functional derivative of the same sequence retains the ability to direct secretion of a polypeptide operably linked to the peptide or derivative. Alternatively, a heterologous mammalian signal peptide, such as human tissue plasminogen activator (tPA) or murine β-glucuronidase signal peptide, or a functional derivative thereof, may be used.

Термин ниже(лежащий) применительно к нуклеотидной последовательности означает, что нуклеиновая кислота или нуклеотидная последовательность расположена в 3'-направлении относительно нуклеотидной последовательности сравнения. В определенных вариантах реализации изобретения нижележащие нуклеотидные последовательности означают последовательности, лежащие после точки начала транскрипции. Например, кодон инициации трансляции в гене лежит ниже сайта начала транскрипции. Термин ниже(лежащий) применительно к полипептидной последовательности означает, что аминокислота или сайт встраивания аминокислоты расположены с С-конца аминокислотной последовательности сравнения. Например, сайт встраивания непосредственно ниже аминокислоты, соответствующей аминокислоте 745 в зрелом белке FVIII дикого типа, означает, что сайт встраивания расположен между амино- 13 044115 кислотными остатками, соответствующими остаткам 745 и 746 в зрелом белке FVIII дикого типа.The term downstream of a nucleotide sequence means that the nucleic acid or nucleotide sequence is located in the 3' direction relative to the reference nucleotide sequence. In certain embodiments of the invention, downstream nucleotide sequences refer to sequences downstream of the transcription start point. For example, the translation initiation codon in a gene lies downstream of the transcription start site. The term downstream, when applied to a polypeptide sequence, means that the amino acid or amino acid insertion site is located at the C-terminus of the reference amino acid sequence. For example, an insertion site immediately downstream of an amino acid corresponding to amino acid 745 in the mature wild-type FVIII protein means that the insertion site is located between amino acid residues corresponding to residues 745 and 746 in the mature wild-type FVIII protein.

Термин выше(лежащий) означает нуклеотидную последовательность, которая расположена в 5'направлении относительно нуклеотидной последовательности сравнения. В определенных вариантах реализации изобретения вышележащие нуклеотидные последовательности означают последовательности, расположенные с 5'-стороны кодирующей области или точки начала транскрипции. Например, большинство промоторов расположены выше сайта начала транскрипции.The term upstream means a nucleotide sequence that is located in the 5' direction relative to the reference nucleotide sequence. In certain embodiments, upstream nucleotide sequences refer to sequences located 5' to the coding region or transcription start point. For example, most promoters are located upstream of the transcription start site.

В контексте настоящего документа термин регуляторная область относится к нуклеотидным последовательностям, которые расположены выше (5'-некодирующие последовательности), в пределах или ниже (3'-некодирующие последовательности) кодирующей области и которые влияют на транскрипцию, процессинг РНК, стабильность или трансляцию соответствующей кодирующей области. Регуляторные области могут включать промоторы, лидерные последовательности трансляции, интроны, последовательности распознавания полиаденилирования, участки процессинга РНК, участки связывания эффекторов и структуры типа петля-на-стебле. Если кодирующая область предназначена для экспрессии в эукариотической клетке, сигнал полиаденилирования и последовательность терминации транскрипции обычно расположены в 3'-направлении относительно кодирующей последовательности.As used herein, the term regulatory region refers to nucleotide sequences that are located upstream (5' non-coding sequences), within or downstream (3' non-coding sequences) of a coding region and that affect transcription, RNA processing, stability or translation of the corresponding coding region. areas. Regulatory regions may include promoters, translation leader sequences, introns, polyadenylation recognition sequences, RNA processing sites, effector binding sites, and stem-loop structures. If the coding region is intended for expression in a eukaryotic cell, the polyadenylation signal and transcription termination sequence are typically located 3' to the coding sequence.

Полинуклеотид, кодирующий продукт гена, например, полипептид, может включать промотор и/или прочие элементы контроля транскрипции или трансляции, функционально соединенные с одной или более кодирующими областями. В случае функционального соединения кодирующая область для продукта гена, например полипептида, соединена с одной или более регуляторными областями таким образом, чтобы экспрессия продукта гена находились под влиянием или контролем регуляторной(ых) области(ей). Например, кодирующая область и промотор являются функционально соединенными, если индукция функции промотора приводит к транскрипции мРНК, кодирующей продукт гена, кодируемый кодирующей областью, и если природа связи между промотором и кодирующей областью не препятствует способности промотора направлять экспрессию данного продукта гена или не препятствует способности ДНК-матрицы транскрибироваться в РНК. Прочие элементы контроля транскрипции, помимо промотора, например энхансеры, репрессоры и сигналы терминации транскрипции, также могут быть функционально соединены с кодирующей областью, чтобы направлять экспрессию продукта гена.A polynucleotide encoding a gene product, such as a polypeptide, may include a promoter and/or other transcriptional or translational control elements operably linked to one or more coding regions. In the case of a functional connection, the coding region for a gene product, such as a polypeptide, is connected to one or more regulatory regions such that expression of the gene product is influenced or controlled by the regulatory region(s). For example, a coding region and a promoter are operably linked if induction of promoter function results in the transcription of mRNA encoding the gene product encoded by the coding region, and if the nature of the connection between the promoter and the coding region does not interfere with the ability of the promoter to direct expression of that gene product or does not interfere with the ability of DNA -templates are transcribed into RNA. Other transcriptional control elements in addition to the promoter, such as enhancers, repressors, and transcription termination signals, can also be operably linked to the coding region to direct expression of the gene product.

Специалистам в данной области техники известны различные области контроля транскрипции. Они включают области контроля транскрипции, функционирующие в клетках позвоночных, такие как промоторные и энхансерные сегменты из цитомегаловирусов (немедленно-ранний промотор в сочетании с интроном А), вируса обезьян 40 (ранний промотор) и ретровирусов (например, вируса саркомы Рауса), но не ограничиваются перечисленным. Прочие области контроля транскрипции включают области, полученные из генов позвоночных, таких как гены актина, белков теплового шока, гормона роста крупного рогатого скота и кроличьего β-глобина, а также другие последовательности, способные контролировать экспрессию генов в клетках эукариот. Дополнительные пригодные области контроля транскрипции включают тканеспецифичные промоторы и энхансеры, а также промоторы, индуцируемые лимфокинами (например, промоторы, индуцируемые интерферонами или интерлейкинами).Various areas of transcription control are known to those skilled in the art. These include transcriptional control regions that function in vertebrate cells, such as promoter and enhancer segments from cytomegaloviruses (immediate early promoter combined with intron A), simian virus 40 (early promoter), and retroviruses (eg, Rous sarcoma virus), but not are limited to the above. Other transcriptional control regions include regions derived from vertebrate genes, such as the actin, heat shock protein, bovine growth hormone, and rabbit β-globin genes, as well as other sequences capable of controlling gene expression in eukaryotic cells. Additional useful transcriptional control regions include tissue-specific promoters and enhancers, as well as lymphokine-inducible promoters (eg, promoters inducible by interferons or interleukins).

Аналогичным образом, средним специалистам в данной области техники известны различные элементы контроля трансляции. Они включают участки связывания рибосом, кодоны инициации и терминации транскрипции и элементы, полученные из пикорнавирусов (в частности, участок внутренней посадки рибосомы, или IRES [internal ribosome entry site], также именуемый последовательностью CITE [cap independent transcription enhancer, кэп-независимый энхансер транскрипции]), но не ограничиваются перечисленным.Likewise, those of ordinary skill in the art are aware of various translation control elements. These include ribosome binding sites, transcription initiation and termination codons, and elements derived from picornaviruses (particularly the internal ribosome entry site, or IRES, also called the cap independent transcription enhancer [CITE] sequence ]), but are not limited to the above.

В контексте настоящего документа термин экспрессия относится к процессу, посредством которого полинуклеотид генерирует продукт гена, например РНК или полипептид. Он включает транскрипцию полинуклеотида в матричную РНК (мРНК), транспортную РНК (тРНК), малую шпилечную РНК (мшРНК), малую интерферирующую РНК (миРНК) или любой другой РНК-продукт и трансляцию мРНК в полипептид, но не ограничивается перечисленным. Экспрессия приводит к образованию продукта гена. В контексте настоящего документа продукт гена может представлять собой либо нуклеиновую кислоту, например, матричную РНК, синтезированную посредством транскрипции гена, либо полипептид, транслированный из транскрипта. Продукты генов, описанные в настоящем документе, дополнительно включают нуклеиновые кислоты с посттранскрипционными модификациями, например, полиаденилированием или сплайсингом, либо полипептиды с посттрансляционными модификациями, например, метилированием, гликозилированием, добавлением липидов, объединением с другими белковыми субъединицами или протеолитическим расщеплением.As used herein, the term expression refers to the process by which a polynucleotide generates a gene product, such as RNA or a polypeptide. It includes, but is not limited to, transcription of a polynucleotide into messenger RNA (mRNA), transfer RNA (tRNA), small hairpin RNA (shRNA), small interfering RNA (siRNA) or any other RNA product and translation of mRNA into a polypeptide. Expression results in the formation of a gene product. As used herein, the gene product may be either a nucleic acid, such as messenger RNA, synthesized by transcription of the gene, or a polypeptide translated from the transcript. The gene products described herein further include nucleic acids with post-transcriptional modifications, such as polyadenylation or splicing, or polypeptides with post-translational modifications, such as methylation, glycosylation, addition of lipids, association with other protein subunits, or proteolytic cleavage.

Вектор означает любой носитель для клонирования и/или переноса нуклеиновой кислоты в клетку-хозяина. Вектор может представлять собой репликон, к которому может быть присоединен другой сегмент нуклеиновой кислоты для осуществления репликации присоединенного сегмента. Термин репликон относится к любому генетическому элементу (например, плазмиде, фагу, космиде, хромосоме, вирусу), который функционирует в качестве автономной единицы репликации in vivo, т.е. способен реплицироваться под собственным контролем. Термин вектор включает как вирусные, так и невирусные носители для введения нуклеиновой кислоты в клетку in vitro, ex vivo или in vivo. В данной области тех- 14 044115 ники известно и используется большое количество векторов, включая, например, плазмиды, модифицированные вирусы эукариот или модифицированные вирусы бактерий. Вставка полинуклеотида в подходящий вектор может достигаться путем лигирования соответствующих полинуклеотидных фрагментов с выбранным вектором, имеющим комплементарные липкие концы.Vector means any carrier for cloning and/or transferring a nucleic acid into a host cell. The vector may be a replicon to which another nucleic acid segment may be attached to effect replication of the attached segment. The term replicon refers to any genetic element (e.g., plasmid, phage, cosmid, chromosome, virus) that functions as an autonomous replication unit in vivo, i.e. capable of replicating under its own control. The term vector includes both viral and non-viral vehicles for introducing a nucleic acid into a cell in vitro, ex vivo or in vivo. A large number of vectors are known and used in the art, including, for example, plasmids, modified eukaryotic viruses, or modified bacterial viruses. Insertion of a polynucleotide into a suitable vector can be achieved by ligating the appropriate polynucleotide fragments to the selected vector having complementary overhangs.

Вектор может быть сконструирован таким образом, чтобы кодировать селективные маркеры или репортеры, обеспечивающие отбор или идентификацию клеток, содержащих вектор. Экспрессия селективных маркеров или репортеров позволяет выявить и/или отобрать клетки-хозяев, которые содержат и экспрессируют прочие кодирующие области, расположенные на векторе. Примеры генов селективных маркеров, известных и применяемых в данной области техники, включают: гены, обеспечивающие стойкость к ампициллину, стрептомицину, гентамицину, канамицину, гигромицину, гербициду биалафосу, сульфаниламидам и тому подобным; и гены, используемые в качестве фенотипических маркеров, т.е. регуляторные гены биосинтеза антоцианов, ген изопентанилтрансферазы и тому подобные. Примеры репортеров, известных и применяемых в данной области техники, включают: люциферазу (Luc), зеленый флуоресцентный белок (GFP), хлорамфениколацетилтрансферазу (CAT), β-галактозидазу (LacZ), Рглюкуронидазу (Gus) и тому подобные. Селективные маркеры также можно считать репортерами.The vector can be designed to encode selectable markers or reporters that allow selection or identification of cells containing the vector. Expression of selectable markers or reporters allows the identification and/or selection of host cells that contain and express other coding regions located on the vector. Examples of selectable marker genes known and used in the art include: genes providing resistance to ampicillin, streptomycin, gentamicin, kanamycin, hygromycin, the herbicide bialaphos, sulfonamides and the like; and genes used as phenotypic markers, e.g. regulatory genes for anthocyanin biosynthesis, isopentanyl transferase gene and the like. Examples of reporters known and used in the art include: luciferase (Luc), green fluorescent protein (GFP), chloramphenicol acetyltransferase (CAT), β-galactosidase (LacZ), β-glucuronidase (Gus), and the like. Selectable markers can also be considered reporters.

Термин плазмида относится к внехромосомному элементу, часто несущему ген, который не является частью основного метаболизма клетки, и обычно имеющему форму кольцевых двухцепочечных молекул ДНК. Такие элементы могут представлять собой автономно реплицирующиеся последовательности, встраивающиеся в геном последовательности, фаговые или нуклеотидные последовательности, линейную, кольцевую или суперспиральную одно- или двухцепочечную ДНК или РНК, полученные из любого источника, в которых ряд нуклеотидных последовательностей соединены или рекомбинированы в уникальную конструкцию, которая способна вводить в клетку фрагмент промотора и последовательность ДНК для выбранного продукта гена вместе с подходящей 3'-нетранслируемой последовательностью.The term plasmid refers to an extrachromosomal element, often carrying a gene that is not part of the cell's general metabolism, and usually in the form of circular, double-stranded DNA molecules. Such elements may be autonomously replicating sequences, genomic insertion sequences, phage or nucleotide sequences, linear, circular or supercoiled single- or double-stranded DNA or RNA, obtained from any source, in which a number of nucleotide sequences are joined or recombined into a unique construct that is capable of introducing into a cell a promoter fragment and DNA sequence for a selected gene product along with a suitable 3' untranslated sequence.

Векторы на основе эукариотических вирусов, которые можно применять, включают аденовирусные векторы, ретровирусные векторы, векторы на основе аденоассоциированного вируса и поксвирусные векторы, например векторы на основе вируса осповакцины, бакуловирусные векторы или герпесвирусные векторы, но не ограничиваются перечисленными. Невирусные векторы включают плазмиды, липосомы, электрически заряженные липиды (цитофектины), комплексы ДНК-белок и биополимеры.Eukaryotic virus vectors that can be used include, but are not limited to, adenoviral vectors, retroviral vectors, adeno-associated virus vectors, and poxviral vectors, such as vaccinia virus vectors, baculovirus vectors, or herpesvirus vectors. Nonviral vectors include plasmids, liposomes, electrically charged lipids (cytofectins), DNA-protein complexes, and biopolymers.

Термин клонирующий вектор относится к репликону, который представляет собой последовательно реплицирующийся участок нуклеиновой кислоты единичной длины и который содержит точку начала репликации, такому как плазмида, фаг или космида, к которому может быть присоединен другой сегмент нуклеиновой кислоты для осуществления репликации присоединенного сегмента. Определенные клонирующие векторы способны к репликации в клетках одного типа, например, в бактериях, и экспрессии в клетках другого типа, например, в клетках эукариот. Клонирующие векторы, как правило, содержат одну или более последовательностей, которые можно использовать для отбора клеток, содержащих данный вектор, и/или один или более сайтов множественного клонирования для вставки целевых последовательностей нуклеиновой кислоты.The term cloning vector refers to a replicon that is a unit-length sequentially replicating nucleic acid segment that contains an origin of replication, such as a plasmid, phage, or cosmid, to which another nucleic acid segment can be attached to effect replication of the attached segment. Certain cloning vectors are capable of replication in one cell type, such as bacteria, and expression in another cell type, such as eukaryotic cells. Cloning vectors typically contain one or more sequences that can be used to select cells containing the vector and/or one or more multiple cloning sites for insertion of target nucleic acid sequences.

Термин экспрессионный вектор относится к носителю, разработанному таким образом, чтобы обеспечить экспрессию вставленной последовательности нуклеиновой кислоты после ее введения в клетку-хозяина. Вставленная последовательность нуклеиновой кислоты функционально соединяется с регуляторными областями, как описано выше.The term expression vector refers to a carrier designed to allow expression of the inserted nucleic acid sequence after its introduction into a host cell. The inserted nucleic acid sequence is operably linked to regulatory regions as described above.

Для введения векторов в клетки-хозяев используются способы, хорошо известные в данной области, например, трансфекция, электропорация, микроинъекция, трансдукция, слияние клеток, обработка ДЭАЭ-декстраном, осаждение фосфатом кальция, липофекция (слияние с липосомами), использование генной пушки или переносчика ДНК-векторов.Methods well known in the art are used to introduce vectors into host cells, such as transfection, electroporation, microinjection, transduction, cell fusion, DEAE-dextran treatment, calcium phosphate precipitation, lipofection (fusion with liposomes), gene gun or vector DNA vectors.

В контексте настоящего документа термины культура, культивировать и культивирование означают инкубацию клеток в условиях in vitro, обеспечивающих их рост и деление, или поддержание жизнеспособности клеток. В контексте настоящего документа термин культивируемые клетки означает клетки, которые размножают in vitro.As used herein, the terms culture, culture, and culture mean the incubation of cells under in vitro conditions to allow them to grow and divide, or to maintain cell viability. As used herein, the term cultured cells means cells that are propagated in vitro.

В контексте настоящего документа подразумевается, что термин полипептид охватывает единственное число полипептид и множественное число полипептиды и относится к молекуле, состоящей из мономеров (аминокислот), линейно связанных амидными связями (также известными как пептидные связи). Термин полипептид означает любую цепь или цепи из двух и более аминокислот безотносительно к конкретной длине продукта. Таким образом, под определение полипептид подпадают пептиды, дипептиды, трипептиды, олигопептиды, белки, аминокислотные цепи или любой другой термин, используемый для обозначения цепи или цепей из двух и более аминокислот, и термин полипептид можно использовать вместо любого из этих терминов или взаимозаменяемо с ними. Подразумевается, что термин полипептид также относится к продуктам постэкспрессионных модификаций полипептида, включая гликозилирование, ацетилирование, фосфорилирование, амидирование, дериватизацию с помощью известных защитных/блокирующих групп, протеолитическое расщепления или модификацию не встречающимися в природе аминокислотами, но не ограничиваясь перечисленным. Полипептид может быть получен из природного биологического источника или синтезирован с использованием рекомби- 15 044115 нантных технологий, но не обязательно транслирован с определяющей его последовательности нуклеиновой кислоты. Он может быть получен любым способом, в том числе путем химического синтеза.As used herein, the term polypeptide is intended to include the singular polypeptide and the plural polypeptides and refers to a molecule consisting of monomers (amino acids) linearly linked by amide bonds (also known as peptide bonds). The term polypeptide means any chain or chains of two or more amino acids, without regard to the specific length of the product. Thus, the definition of polypeptide includes peptides, dipeptides, tripeptides, oligopeptides, proteins, amino acid chains or any other term used to designate a chain or chains of two or more amino acids, and the term polypeptide can be used instead of or interchangeably with any of these terms . The term polypeptide is also intended to refer to the products of post-expression modifications of the polypeptide, including, but not limited to, glycosylation, acetylation, phosphorylation, amidation, derivatization with known protecting/blocking groups, proteolytic cleavage, or modification with non-naturally occurring amino acids. The polypeptide may be obtained from a natural biological source or synthesized using recombinant technologies, but is not necessarily translated from its defining nucleic acid sequence. It can be obtained by any method, including chemical synthesis.

Выделенный полипептид или его фрагмент, вариант либо производное относится к полипептиду, который находится вне своей естественной среды. Конкретный уровень очистки не требуется. Например, выделенный полипептид может быть просто извлечен из своей нативной или естественной среды. Рекомбинантные полипептиды и белки, экспрессируемые в клетках-хозяевах, считается выделенным для целей настоящего изобретения, как и нативные или рекомбинантные полипептиды, которые были разделены, фракционированы или частично либо существенно очищены любым подходящим способом.An isolated polypeptide or fragment, variant or derivative thereof refers to a polypeptide that is outside its natural environment. No specific level of cleaning is required. For example, the isolated polypeptide may simply be recovered from its native or natural environment. Recombinant polypeptides and proteins expressed in host cells are considered isolated for purposes of the present invention, as are native or recombinant polypeptides that have been separated, fractionated, or partially or substantially purified by any suitable method.

Настоящее изобретение также включает фрагменты или варианты полипептидов и любые их сочетания. Термин фрагмент или вариант применительно к полипептидным связывающим доменам или связывающим молекулам по настоящему изобретению включает любые полипептиды, сохраняющие по меньшей мере некоторые из свойств (например, аффинность связывания с FcRn для FcRn-связывающего домена или варианта Fc, свертывающая активность для варианта FVIII или FVШ-связывающая активность для фрагмента ФВ) полипептида сравнения. Фрагменты полипептидов включают протеолитические фрагменты, делеционные фрагменты, а также фрагменты специфических антител, обсуждаемые в другом месте в настоящем документе, но не включают встречающийся в природе полноразмерный полипептид (или зрелый полипептид). Варианты полипептидных связывающих доменов или связывающих молекул по настоящему изобретению включает фрагменты согласно вышеприведенному описанию, а также полипептиды с аминокислотными последовательностями, измененными вследствие аминокислотных замен, делеций или вставок. Варианты могут встречаться или не встречаться в природе. Не встречающиеся в природе варианты можно получить, применяя методики мутагенеза, известные в данной области техники. Варианты полипептидов могут содержать консервативные или неконсервативные аминокислотные замены, делеций или добавления.The present invention also includes fragments or variants of polypeptides and any combinations thereof. The term fragment or variant as applied to polypeptide binding domains or binding molecules of the present invention includes any polypeptides retaining at least some of the properties (e.g., FcRn binding affinity for an FcRn binding domain or Fc variant, coagulation activity for a FVIII or FVIII variant binding activity for the VWF fragment) of the reference polypeptide. Polypeptide fragments include proteolytic fragments, deletion fragments, and specific antibody fragments discussed elsewhere herein, but do not include a naturally occurring full-length polypeptide (or mature polypeptide). Variants of the polypeptide binding domains or binding molecules of the present invention include fragments as described above, as well as polypeptides with amino acid sequences altered due to amino acid substitutions, deletions or insertions. Variants may or may not occur in nature. Non-naturally occurring variants can be obtained using mutagenesis techniques known in the art. Polypeptide variants may contain conservative or non-conservative amino acid substitutions, deletions or additions.

В контексте настоящего документа термин белок ФВ или белки ФВ означает любые фрагменты ФВ, которые взаимодействуют с FVIII и сохраняют по меньшей мере одно или более свойств, обычно проявляемых полноразмерным ФВ в отношении FVIII, например, предотвращение преждевременной активации до FVIIIa, предотвращение преждевременного протеолиза, предотвращение ассоциации с фосфолипидными мембранами, что может привести к преждевременному клиренсу, предотвращение связывания с рецепторами клиренса FVIII, которые могут связывать незащищенный FVIII, но не FVIII, связанный с ФВ, и/или стабилизацию взаимодействий между тяжелой цепью и легкой цепью FVIII.As used herein, the term VWF protein or VWF proteins means any VWF fragments that interact with FVIII and retain at least one or more of the properties typically exhibited by full-length VWF with respect to FVIII, e.g., preventing premature activation to FVIIIa, preventing premature proteolysis, preventing association with phospholipid membranes, which may lead to premature clearance, prevention of binding to FVIII clearance receptors, which can bind unprotected FVIII but not VWF-bound FVIII, and/or stabilization of interactions between the heavy chain and the light chain of FVIII.

Консервативная аминокислотная замена представляет собой замену, при которой аминокислотный остаток замещается аминокислотным остатком с аналогичной боковой цепью. В данной области техники определены семейства аминокислотных остатков с аналогичными боковыми цепями, включая основные боковые цепи (например, лизин, аргинин, гистидин), кислые боковые цепи (например, аспарагиновая кислота, глутаминовая кислота), полярные незаряженные боковые цепи (например, глицин, аспарагин, глутамин, серин, треонин, тирозин, цистеин), неполярные боковые цепи (например, аланин, валин, лейцин, изолейцин, пролин, фенилаланин, метионин, триптофан), бета-разветвленные боковые цепи (например, треонин, валин, изолейцин) и ароматические боковые цепи (например, тирозин, фенилаланин, триптофан, гистидин). Следовательно, если аминокислота в полипептиде замещается другой аминокислотой с боковой цепью того же семейства, замена считается консервативной. В другом варианте реализации изобретения цепочка аминокислот может быть консервативно замещена структурно аналогичной цепочкой, отличающейся порядком и/или составом представителей одного семейства боковых цепей.A conservative amino acid substitution is a substitution in which an amino acid residue is replaced by an amino acid residue with a similar side chain. The art defines families of amino acid residues with similar side chains, including basic side chains (e.g., lysine, arginine, histidine), acidic side chains (e.g., aspartic acid, glutamic acid), polar uncharged side chains (e.g., glycine, asparagine , glutamine, serine, threonine, tyrosine, cysteine), non-polar side chains (e.g. alanine, valine, leucine, isoleucine, proline, phenylalanine, methionine, tryptophan), beta-branched side chains (e.g. threonine, valine, isoleucine) and aromatic side chains (eg, tyrosine, phenylalanine, tryptophan, histidine). Therefore, if an amino acid in a polypeptide is replaced by another amino acid with a side chain of the same family, the substitution is considered conservative. In another embodiment, the amino acid chain may be conservatively replaced by a structurally similar chain that differs in the order and/or composition of members of the same side chain family.

Как известно в данной области техники, идентичность последовательностей двух полипептидов определяется сравнением аминокислотной последовательности одного полипептида с последовательностью второго полипептида. В случаях, рассмотренных в настоящем документе, идентичность какоголибо конкретного полипептида по меньшей мере на около 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 99% или 100% другому полипептиду можно определить с использованием методов и программного обеспечения/компьютерных программ, известных в данной области техники, включая программу BESTFIT (Wisconsin Sequence Analysis Package, версия 8 для Unix, Genetics Computer Group, University Research Park, 575 Science Drive, Madison, WI 53711), но не ограничиваясь ею. Программа BESTFIT использует алгоритм локальной гомологии Смита и Ватермана (Smith и Waterman), Advances in Applied Mathematics 2 (1981), 482-489, для поиска сегмента с самой высокой степенью сходства между двумя последовательностями. При использовании BESTFIT или другой программы выравнивания последовательностей для определения того, идентична ли конкретная последовательность, например, на 95% последовательности сравнения по настоящему изобретению, разумеется, устанавливают такие параметры, чтобы процент идентичности рассчитывался для всей длины полипептидной последовательности сравнения и чтобы допускались разрывы в гомологии вплоть до 5% от общего количества аминокислот в последовательности сравнения.As is known in the art, the sequence identity of two polypeptides is determined by comparing the amino acid sequence of one polypeptide with the sequence of a second polypeptide. In the cases discussed herein, a particular polypeptide is at least about 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 99%, or 100% identical to another polypeptide. using methods and software/computer programs known in the art, including the BESTFIT program (Wisconsin Sequence Analysis Package, Version 8 for Unix, Genetics Computer Group, University Research Park, 575 Science Drive, Madison, WI 53711), but not limiting himself to it. The BESTFIT program uses the local homology algorithm of Smith and Waterman, Advances in Applied Mathematics 2 (1981), 482-489, to find the segment with the highest degree of similarity between two sequences. When using BESTFIT or other sequence alignment program to determine whether a particular sequence is, for example, 95% identical to a reference sequence of the present invention, parameters are, of course, set such that the percent identity is calculated over the entire length of the reference polypeptide sequence and that breaks in homology are tolerated up to 5% of the total number of amino acids in the comparison sequence.

В контексте настоящего документа аминокислота, соответствующая аминокислоте или аминокислота, эквивалентная аминокислоте в последовательности белка ФВ или FVIII определяется методом выравнивания, чтобы обеспечить максимальную идентичность или сходность между первой последовательностью ФВ или FVIII и второй последовательностью ФВ или FVIII. Номер, используемый для иден- 16 044115 тификации эквивалентной аминокислоты во второй последовательности ФВ или FVIII, основывается на номере, используемом для идентификации соответствующей аминокислоты в первой последовательности ФВ или FVIII.As used herein, an amino acid corresponding to an amino acid or an amino acid equivalent to an amino acid in a VWF or FVIII protein sequence is determined by alignment to ensure maximum identity or similarity between a first VWF or FVIII sequence and a second VWF or FVIII sequence. The number used to identify the equivalent amino acid in the second VWF or FVIII sequence is based on the number used to identify the corresponding amino acid in the first VWF or FVIII sequence.

В контексте настоящего документа термин сайт встраивания относится к позиции в пределах полипептида FVIII или его фрагмента, варианта либо производного, расположенной непосредственно выше позиции, в которую может встраиваться гетерологический фрагмент. Сайт встраивания указывается в виде числа, представляющего собой номер аминокислоты в зрелом нативном белке FVIII (SEQ ID NO: 65), которой соответствует сайт встраивания, то есть аминокислоты, расположенной непосредственно с N-концевой стороны относительно позиции встраивания. Например, выражение а3 содержит последовательность XTEN в сайте встраивания, отвечающем аминокислоте 1656 последовательности SEQ ID NO: 65, указывает на то, что гетерологический фрагмент расположен между двумя аминокислотами, соответствующими аминокислоте 1656 и аминокислоте 1657 последовательности SEQ ID NO: 65.As used herein, the term insertion site refers to a position within a FVIII polypeptide or fragment, variant, or derivative thereof immediately upstream of a position into which a heterologous fragment may be inserted. The insertion site is indicated as a number representing the number of the amino acid in the mature native FVIII protein (SEQ ID NO: 65) to which the insertion site corresponds, that is, the amino acid located immediately N-terminal to the insertion position. For example, expression a3 contains the sequence XTEN at the insertion site corresponding to amino acid 1656 of SEQ ID NO: 65, indicating that the heterologous fragment is located between two amino acids corresponding to amino acid 1656 and amino acid 1657 of SEQ ID NO: 65.

Выражение непосредственно ниже аминокислоты в контексте настоящего документа относится к позиции непосредственно рядом с концевой карбоксильной группой аминокислоты. Аналогичным образом, выражение непосредственно выше аминокислоты относится к позиции непосредственно рядом с концевой аминогруппой аминокислоты. Следовательно, выражение между двумя аминокислотами сайта встраивания в контексте настоящего документа относится к позиции между двумя соседними аминокислотами, в которую встраивается последовательность XTEN или любой другой полипептид. Таким образом, выражения встроенный непосредственно ниже аминокислоты и встроенный между двумя аминокислотами сайта встраивания используются синонимично выражению встроенный в сайт встраивания.The expression immediately downstream of an amino acid, as used herein, refers to the position immediately adjacent to the terminal carboxyl group of the amino acid. Likewise, the expression immediately upstream of an amino acid refers to the position immediately next to the terminal amino group of an amino acid. Therefore, the expression between two amino acids of an insertion site as used herein refers to the position between two adjacent amino acids into which the XTEN sequence or any other polypeptide is inserted. Thus, the expressions inserted immediately downstream of an amino acid and inserted between two amino acids of an insertion site are used synonymously with the expression inserted into an insertion site.

Термины встроена, встраивается, встраивается в или грамматически родственные термины в контексте настоящего документа относятся к позиции последовательности XTEN в химерном полипептиде относительно аналогичной позиции в нативном зрелом белке FVIII человека. В контексте настоящего документа указанные термины касаются сравнительных характеристик рекомбинантного полипептида FVIII и нативного зрелого FVIII человека и не указывают, не подразумевают и не предполагают никаких методов или процессов, посредством которых был создан химерный полипептид. Например, в отношении химерного полипептида, предлагаемого в настоящем изобретении, выражение последовательность XTEN встроена непосредственно ниже аминокислотного остатка 745 полипептида FVIII означает, что химерный полипептид содержит последовательность XTEN непосредственно ниже аминокислоты, соответствующей аминокислоте 745 в нативном зрелом FVIII человека, например, последовательность XTEN, ограниченную аминокислотами, соответствующими аминокислотам 745 и 746 нативного зрелого FVIII человека.The terms inserted, inserted, inserted into, or grammatically related terms as used herein refer to the position of the XTEN sequence in the chimeric polypeptide relative to the same position in the native mature human FVIII protein. As used herein, these terms refer to the comparative characteristics of a recombinant FVIII polypeptide and native mature human FVIII and do not indicate, imply or suggest any method or process by which the chimeric polypeptide was created. For example, with respect to the chimeric polypeptide of the present invention, the expression XTEN sequence inserted immediately downstream of amino acid residue 745 of the FVIII polypeptide means that the chimeric polypeptide contains the XTEN sequence immediately below the amino acid corresponding to amino acid 745 in native mature human FVIII, for example, the XTEN sequence limited amino acids corresponding to amino acids 745 and 746 of native mature human FVIII.

Термин слитый или химерный белок включает первую аминокислотную последовательность, связанную со второй аминокислотной последовательностью, с которой она естественным образом не связывается в природе. Аминокислотные последовательности, обычно входящие в состав разных белков, могут быть объединены в слитом полипептиде, или же аминокислотные последовательности, обычно существующие в составе одного белка, могут быть расположены в новой конфигурации в составе слитого полипептида, например, в случае слития домена фактора VIII по настоящему изобретению с доменом Fc иммуноглобулина. Слитый белок создают, например, путем химического синтеза или путем создания и трансляции полинуклеотида, кодирующего пептидные участки в желаемом взаимном расположении. Химерный белок может дополнительно содержать вторую аминокислотную последовательность, соединенную с первой аминокислотной последовательностью ковалентной непептидной связью или нековалентной связью.The term fusion or chimeric protein includes a first amino acid sequence linked to a second amino acid sequence to which it does not naturally bind in nature. Amino acid sequences typically present in different proteins may be combined in a fusion polypeptide, or amino acid sequences typically present in a single protein may be arranged in a new configuration within a fusion polypeptide, such as in the case of the factor VIII domain fusion of the present invention with an immunoglobulin Fc domain. The fusion protein is created, for example, by chemical synthesis or by creating and translating a polynucleotide encoding peptide regions in the desired relative arrangement. The chimeric protein may further comprise a second amino acid sequence linked to the first amino acid sequence by a covalent non-peptide bond or non-covalent bond.

В контексте настоящего документа термин период полувыведения относится к биологическому периоду полувыведения конкретного полипептида in vivo. Период полувыведения может быть представлен как время, необходимое для выведения половины введенной субъекту дозы из кровотока и/или из других тканей животного. При построении графика клиренса заданного полипептида как функции времени обычно отмечают двухфазный процесс с быстрой α-фазой и более продолжительной β-фазой. Как правило, α-фаза отображает уравновешивание концентрации введенного полипептида Fc между внутрисосудистым и внесосудистым пространством и частично определяется размером полипептида. β-фаза, как правило, отображает катаболизм полипептида во внутрисосудистом пространстве. В некоторых вариантах реализации изобретения клиренс белка FVIII и химерного белка, содержащего FVIII, подчиняется однофазной модели, следовательно, у них нет альфа-фазы, а только бета-фаза. Таким образом, в определенных вариантах реализации изобретения термин период полувыведения в контексте настоящего документа относится к периоду полувыведения полипептида в β-фазе. Обычный период полувыведения человеческого антитела в фазе β у человека составляет 21 день.As used herein, the term half-life refers to the biological half-life of a particular polypeptide in vivo. The half-life can be thought of as the time required for half of the dose administered to a subject to be eliminated from the bloodstream and/or other tissues of the animal. When plotting the clearance of a given polypeptide as a function of time, a biphasic process is usually noted, with a rapid α phase and a longer β phase. In general, α phase reflects the equilibration of the administered Fc polypeptide concentration between the intravascular and extravascular spaces and is determined in part by the size of the polypeptide. The β phase typically reflects the catabolism of the polypeptide in the intravascular space. In some embodiments, the clearance of the FVIII protein and the FVIII-containing fusion protein follows a single-phase pattern, therefore, they do not have an alpha phase, but only a beta phase. Thus, in certain embodiments of the invention, the term half-life as used herein refers to the half-life of the polypeptide in the β phase. The typical β-phase half-life of a human antibody in humans is 21 days.

Термин связанный в контексте настоящего документа относится к первой аминокислотной последовательности или нуклеотидной последовательности, ковалентно или нековалентно присоединенной ко второй аминокислотной последовательности или нуклеотидной последовательности соответственно. Первая аминокислотная последовательность или нуклеотидная последовательность может быть непосредственно соединена или помещена рядом со второй аминокислотной последовательностью или нук- 17 044115 леотидной последовательностью, либо же, как альтернативный вариант, первая последовательность может ковалентно соединяться со второй последовательностью посредством вставочной последовательности между ними. Термин связанный означает не только слитие первой аминокислотной последовательности со второй аминокислотной последовательностью на С-конце или N-конце, но также включает вставку целой первой аминокислотной последовательности (или второй аминокислотной последовательности) между любыми двумя аминокислотами второй аминокислотной последовательности (или первой аминокислотной последовательности соответственно). В одном варианте реализации изобретения первая аминокислотная последовательность может быть связана со второй аминокислотной последовательностью посредством пептидной связи или линкера. Первая нуклеотидная последовательность может быть связана со второй нуклеотидной последовательностью посредством фосфодиэфирной связи или линкера. Линкер может представлять собой пептид или полипептид (для полипептидных цепей), либо нуклеотид или нуклеотидную цепь (для нуклеотидный цепей), или любую химическую структуру (как для полипептидов, так и для полинуклеотидных цепей). Термин связанный также обозначен дефисом (-).The term linked as used herein refers to a first amino acid sequence or nucleotide sequence covalently or non-covalently linked to a second amino acid sequence or nucleotide sequence, respectively. The first amino acid sequence or nucleotide sequence may be directly linked to or placed adjacent to the second amino acid sequence or nucleotide sequence, or alternatively, the first sequence may be covalently linked to the second sequence by an insertion sequence therebetween. The term linked not only means the fusion of a first amino acid sequence with a second amino acid sequence at the C-terminus or N-terminus, but also includes the insertion of the entire first amino acid sequence (or second amino acid sequence) between any two amino acids of the second amino acid sequence (or first amino acid sequence, respectively) . In one embodiment of the invention, the first amino acid sequence may be linked to the second amino acid sequence via a peptide bond or linker. The first nucleotide sequence may be linked to the second nucleotide sequence via a phosphodiester bond or linker. The linker can be a peptide or polypeptide (for polypeptide chains), or a nucleotide or nucleotide chain (for nucleotide chains), or any chemical structure (for both polypeptides and polynucleotide chains). The term related is also indicated by a hyphen (-).

В контексте настоящего документа термин соединенный с относится к ковалентной или нековалентной связи между первой аминокислотной цепью и второй аминокислотной цепью. В одном варианте реализации изобретения термин соединенный с означает ковалентную непептидную связь или нековалентную связь. Данное соединение может обозначаться двоеточием, т.е. (:). В другом варианте реализации изобретения данный термин означает ковалентную связь, за исключением пептидной связи. Например, аминокислота цистеин содержит тиольную группу, которая может образовывать дисульфидную связь или мостик с тиольной группой второго остатка цистеина. В большинстве встречающихся в природе молекул IgG области СН1 и CL соединены дисульфидной связью и две тяжелые цепи соединены двумя дисульфидными связями в позициях, соответствующих позициям 239 и 242 согласно системе нумерации по Кабату (позициям 226 или 229 по европейской системе нумерации). Примеры ковалентной связи включают пептидную связь, металлическую связь, водородную связь, дисульфидную связь, сигма-связь, пи-связь, дельта-связь, гликозидную связь, агостическую связь, банановую связь, донорно-акцепторную связь, пи-дативную связь, двойную связь, тройную связь, четверную связь, пятерную связь, шестерную связь, конъюгацию, гиперконъюгацию, ароматичность, гаптность или антисвязывание, но не ограничиваются перечисленным. Неограничивающие примеры нековалентной связи включают ионную связь (например, катион-пи-взаимодействие или солевую связь), металлическую связь, водородную связь (например, диводородную связь, диводородный комплекс, низкобарьерную водородную связь или симметричную водородную связь), силу Ван-дер-Ваальса, лондоновские дисперсионные силы, механическую связь, галогенную связь, аурофильность, интеркаляцию, стэкинг, энтропийную силу или химическую полярность.As used herein, the term connected to refers to a covalent or non-covalent bond between a first amino acid chain and a second amino acid chain. In one embodiment of the invention, the term connected to means a covalent non-peptide bond or non-covalent bond. This connection can be indicated by a colon, i.e. (:). In another embodiment, the term refers to a covalent bond other than a peptide bond. For example, the amino acid cysteine contains a thiol group that can form a disulfide bond or bridge with the thiol group of a second cysteine residue. In most naturally occurring IgG molecules, the CH1 and CL regions are joined by a disulfide bond and the two heavy chains are joined by two disulfide bonds at positions corresponding to positions 239 and 242 according to the Kabat numbering system (positions 226 or 229 according to the European numbering system). Examples of covalent bond include peptide bond, metal bond, hydrogen bond, disulfide bond, sigma bond, pi bond, delta bond, glycosidic bond, agostic bond, banana bond, donor-acceptor bond, pi-dative bond, double bond, triple bond, quadruple bond, quinary bond, six bond, conjugation, hyperconjugation, aromaticity, hapticity or anti-bonding, but are not limited to the above. Non-limiting examples of non-covalent bonding include ionic bonding (e.g., cation-pi interaction or salt bond), metal bonding, hydrogen bonding (e.g., dihydrogen bond, dihydrogen complex, low-barrier hydrogen bond, or symmetric hydrogen bond), van der Waals force, London dispersion forces, mechanical bonding, halogen bonding, aurophilicity, intercalation, stacking, entropic force or chemical polarity.

Применяемый в настоящем документе термин мономер-димерный гибрид относится к химерному белку, содержащему первую полипептидную цепь и вторую полипептидную цепь, соединенные между собой дисульфидной связью, причем первая цепь содержит фактор свертывания крови, например фактор VIII, и первый фрагмент Fc, a вторая цепь содержит, состоит по существу или состоит из второго фрагмента Fc без фактора свертывания крови. Таким образом, мономер-димерная гибридная конструкция представляет собой гибрид, содержащий мономерную часть со всего лишь одним фактором свертывания крови и димерную часть с двумя фрагментами Fc.As used herein, the term monomer-dimer hybrid refers to a chimeric protein comprising a first polypeptide chain and a second polypeptide chain linked by a disulfide bond, the first chain containing a blood clotting factor, such as factor VIII, and a first Fc fragment, and the second chain containing , consists essentially of or consists of a second Fc fragment without the coagulation factor. Thus, a monomer-dimer hybrid construct is a hybrid containing a monomer portion with just one coagulation factor and a dimer portion with two Fc moieties.

В контексте настоящего документа термин сайт расщепления или сайт ферментативного расщепления относится к сайту, распознаваемому ферментом. Некоторые сайты ферментативного расщепления содержат сайт внутриклеточного процессинга. В одном варианте реализации изобретения полипептид содержит сайт ферментативного расщепления, расщепляемый ферментом, который активируется во время реакции каскада свертывания крови, так что расщепление таких сайтов происходит в месте образования сгустка. Примеры таких сайтов включают, например, сайты, распознаваемые тромбином, фактором XIa или фактором Ха. Примеры сайтов расщепления фактором XIa включают, например, TQSFNDFTR (SEQ ID NO: 1) и SVSQTSKLTR (SEQ ID NO: 3).As used herein, the term cleavage site or enzymatic cleavage site refers to a site recognized by an enzyme. Some enzymatic cleavage sites contain an intracellular processing site. In one embodiment of the invention, the polypeptide contains an enzymatic cleavage site cleaved by an enzyme that is activated during a reaction of the coagulation cascade such that cleavage of such sites occurs at the site of clot formation. Examples of such sites include, for example, sites recognized by thrombin, factor XIa or factor Xa. Examples of factor XIa cleavage sites include, for example, TQSFNDFTR (SEQ ID NO: 1) and SVSQTSKLTR (SEQ ID NO: 3).

Примеры сайтов расщепления тромбином включают, например,Examples of thrombin cleavage sites include, e.g.

DFLAEGGGVR (SEQ ID NO: 4), TTKIKPR (SEQ ID NO: 5), LVPRG (SEQ IDDFLAEGGGVR (SEQ ID NO: 4), TTKIKPR (SEQ ID NO: 5), LVPRG (SEQ ID

NO: 6), ALRPR (SEQ ID NO: 7), ISDKNTGDYYEDSYEDISAYLLSKNNAIEPRSFS (SEQ IDNO: 6), ALRPR (SEQ ID NO: 7), ISDKNTGDYYEDSYEDISAYLLSKNNAIEPRSFS (SEQ ID

NO: 106), DKNTGDYYEDSYEDISAYLLSKNNAIEPRSFS (SEQ ID NO: 88) и IEPRSFS (SEQ ID NO: 194).NO: 106), DKNTGDYYEDSYEDISAYLLSKNNAIEPRSFS (SEQ ID NO: 88) and IEPRSFS (SEQ ID NO: 194).

Прочие сайты ферментативного расщепления известны в данной области техники и описаны в других местах настоящего документа.Other enzymatic cleavage sites are known in the art and are described elsewhere herein.

В контексте настоящего документа термин сайт процессинга или сайт внутриклеточного процессинга относится к типу сайтов ферментативного расщепления в полипептиде, которые являются мишенью ферментов, выполняющих свою функцию после трансляции полипептида. В одном варианте реализации изобретения такие ферменты выполняют свою функцию во время переноса полипептида из полости аппарата Гольджи в транс-отдел аппарата Гольджи. Ферменты внутриклеточного процессинга расщеAs used herein, the term processing site or intracellular processing site refers to a type of enzymatic cleavage site in a polypeptide that is targeted by enzymes that perform their function after translation of the polypeptide. In one embodiment of the invention, such enzymes perform their function during the transfer of a polypeptide from the cavity of the Golgi apparatus to the trans-golgi apparatus. Intracellular processing enzymes are more common

- 18 044115 пляют полипептиды перед секрецией белка из клетки. Примеры таких сайтов процессинга включают, например, сайты-мишени РАСЕ/фуринового (где РАСЕ представляет собой сокращение от Paired basic Amino acid Cleaving Enzyme - фермент, расщепляющий белок в месте спаренных основных аминокислот) семейства эндопептидаз. Эти ферменты сосредоточены на мембране аппарата Гольджи и расщепляют белки на карбоксильном конце мотива Arg-[любой остаток]-(Lys или Arg)-Arg. В контексте настоящего документа фуриновое семейство ферментов включает, например, PCSK1 (также известный как РС1/РсЗ), PCSK2 (также известный как РС2), PCSK3 (также известный как фурин или РАСЕ), PCSK4 (также известный как РС4), PCSK5 (также известный как РС5 or PC6), PCSK6 (также известный как РАСЕ4) или PCSK7 (также известный как PC7/LPC, РС8 или SPC7). Прочие сайты процессинга известны в данной области техники.- 18 044115 polypeptides are released before protein secretion from the cell. Examples of such processing sites include, for example, target sites of the PACE/furin family of endopeptidases. These enzymes are concentrated on the Golgi membrane and cleave proteins at the carboxyl terminus of the Arg-[any residue]-(Lys or Arg)-Arg motif. As used herein, the furin family of enzymes includes, for example, PCSK1 (also known as PC1/Pc3), PCSK2 (also known as PC2), PCSK3 (also known as furin or PACE), PCSK4 (also known as PC4), PCSK5 (also known as PC5 or PC6), PCSK6 (also known as PACE4) or PCSK7 (also known as PC7/LPC, PC8 or SPC7). Other processing sites are known in the art.

В конструкциях, включающих более одного сайта процессинга или расщепления, следует понимать, что эти сайты могут быть разными или одними и теми же.In designs that include more than one processing or cleavage site, it should be understood that these sites may be different or the same.

Термин фурин относится к ферментам, соответствующим шифру КФ 3.4.21.75. Фурин представляет собой субтилизиноподобную пропротеинконвертазу, также известную как РАСЕ (Paired basic Amino acid Cleaving Enzyme - фермент, расщепляющий белок в месте спаренных основных аминокислот). Фурин удаляет фрагменты неактивных белков-предшественников, чтобы преобразовать их в биологически активные белки. Фурин может отщеплять пропептид ФВ от зрелой молекулы ФВ в процессе внутриклеточного транспорта пропептида ФВ. В некоторых вариантах реализации изобретения фурин отщепляет домен D1D2 от домена D'D3 белка ФВ. В других вариантах реализации изобретения нуклеотидная последовательность, кодирующая фурин, может экспрессироваться вместе с нуклеотидной последовательностью, кодирующей фрагмент ФВ, в результате чего домены D1D2 могут отщепляться фурином внутри клетки.The term furin refers to enzymes corresponding to EC code 3.4.21.75. Furin is a subtilisin-like proprotein convertase, also known as PACE (Paired basic Amino acid Cleaving Enzyme). Furin removes fragments of inactive precursor proteins to convert them into biologically active proteins. Furin can cleave VWF propeptide from the mature VWF molecule during the intracellular transport of VWF propeptide. In some embodiments, furin cleaves the D1D2 domain from the D'D3 domain of the VWF protein. In other embodiments, the nucleotide sequence encoding furin may be expressed together with the nucleotide sequence encoding the VWF fragment, resulting in the D1D2 domains being cleaved by furin within the cell.

В конструкциях, включающих более одного сайта процессинга или расщепления, следует понимать, что эти сайты могут быть разными или одними и теми же.In designs that include more than one processing or cleavage site, it should be understood that these sites may be different or the same.

В контексте настоящего документа термин процессируемый линкер относится к линкеру, содержащему по меньшей мере один сайт внутриклеточного процессинга из описанных в другом месте в настоящем документе.As used herein, the term processable linker refers to a linker containing at least one intracellular processing site described elsewhere herein.

В контексте настоящего документа нарушение гемостаза означает генетически унаследованное или приобретенное состояние, которое характеризуется склонностью к кровотечениям, будь то спонтанным или вызванным травмой, из-за нарушенной или отсутствующей способности к образованию фибринового сгустка. К примерам таких нарушений относятся гемофилии. Тремя основными формами гемофилии являются гемофилия А (недостаточность фактора VIII), гемофилия В (недостаточность фактора IX, или болезнь Кристмаса) и гемофилия С (недостаточность фактора XI, легкая склонность к кровотечениям). Другие нарушения гемостаза включают, например, болезнь Виллебранда, недостаточность фактора XI (недостаточность плазменного предшественника тромбопластина), недостаточность фактора XII, недостаточности или структурные аномалии фибриногена, протромбина, фактора V, фактора VII, фактора X или фактора XIII, синдром Бернара-Сулье, вызванный дефектом или недостаточностью тромбоцитарного гликопротеина 1b (GPIb). GPIb - рецептор ФВ - может быть дефектным и приводить к нарушению образования первичного сгустка (нарушению первичного гемостаза и повышенной склонности к кровотечениям) и к тромбастении Гланцманна-Негели (тромбастении Гланцманна). При печеночной недостаточности (острой и хронической) печень синтезирует факторы свертывания крови в недостаточном количестве, из-за чего может повышаться риск кровотечения.As used herein, disordered hemostasis means a genetically inherited or acquired condition that is characterized by a tendency to bleed, whether spontaneous or caused by trauma, due to an impaired or absent ability to form a fibrin clot. Examples of such disorders include hemophilia. The three main forms of hemophilia are hemophilia A (factor VIII deficiency), hemophilia B (factor IX deficiency, or Christmas disease), and hemophilia C (factor XI deficiency, a mild bleeding tendency). Other hemostasis disorders include, for example, von Willebrand disease, factor XI deficiency (deficiency of the plasma precursor thromboplastin), factor XII deficiency, deficiencies or structural abnormalities of fibrinogen, prothrombin, factor V, factor VII, factor X or factor XIII, Bernard-Soulier syndrome caused by defect or deficiency of platelet glycoprotein 1b (GPIb). GPIb - the VWF receptor - can be defective and lead to impaired formation of the primary clot (impaired primary hemostasis and increased tendency to bleeding) and to Glanzmann-Nageli thrombasthenia (Glanzmann thrombasthenia). In liver failure (acute and chronic), the liver synthesizes clotting factors in insufficient quantities, which may increase the risk of bleeding.

Химерные молекулы по настоящему изобретению можно использовать в профилактических целях. В контексте настоящего документа термин профилактическое лечение относится к введению молекулы до эпизода кровотечения. В одном варианте реализации изобретения субъект, нуждающийся в общем кровоостанавливающем средстве, подвергается хирургическом вмешательству или собирается перенести хирургическое вмешательство. Химерный белок по данному изобретению может быть введен до или после хирургического вмешательства в качестве профилактического средства. Химерный белок по данному изобретению может быть введен до или после хирургического вмешательства для контроля эпизода острого кровотечения. Хирургическое вмешательство может включать трансплантацию печени, резекцию печени, стоматологические процедуры или трансплантацию стволовых клеток, но не ограничивается перечисленным.The chimeric molecules of the present invention can be used for prophylactic purposes. As used herein, the term prophylactic treatment refers to the administration of the molecule before a bleeding episode. In one embodiment of the invention, the subject in need of a general hemostatic agent is undergoing surgery or is about to undergo surgery. The chimeric protein of this invention can be administered before or after surgery as a prophylactic agent. The chimeric protein of this invention can be administered before or after surgery to control an acute bleeding episode. Surgery may include, but is not limited to, a liver transplant, liver resection, dental procedures, or stem cell transplant.

Химерный белок по настоящему изобретению также может использоваться для лечения по требованию. Термин лечение по требованию относится к введению химерной молекулы в ответ на симптомы эпизода кровотечения или перед осуществлением деятельности, которая может привести к кровотечению. В одном аспекте изобретения лечение по требованию может предоставляться субъекту после начала кровотечения, например, после повреждения, или в том случае, когда ожидается кровотечение, например, перед хирургическим вмешательством. В другом аспекте изобретения лечение по требованию может предоставляться перед деятельностью, которая повышает риск кровотечения, например, перед занятием контактным видом спорта.The chimeric protein of the present invention can also be used for on-demand treatment. The term on-demand treatment refers to the administration of a chimeric molecule in response to symptoms of a bleeding episode or before engaging in an activity that may result in bleeding. In one aspect of the invention, on-demand treatment may be provided to a subject after bleeding has begun, such as after an injury, or when bleeding is expected, such as before surgery. In another aspect of the invention, on-demand treatment may be provided before an activity that increases the risk of bleeding, such as before playing a contact sport.

В контексте настоящего документа термин острое кровотечение относится к эпизоду кровотечения независимо от причины, лежащей в его основе. Например, у субъекта может быть травма, уремия,As used herein, the term acute bleeding refers to an episode of bleeding, regardless of the underlying cause. For example, the subject may have trauma, uremia,

- 19 044115 наследственное нарушение свертываемости крови (например, недостаточность фактора VII), заболевание тромбоцитов или резистентность, обусловленная выработкой антител к факторам свертывания крови.- 19 044115 hereditary bleeding disorder (eg factor VII deficiency), platelet disease or resistance due to the production of antibodies to clotting factors.

В контексте настоящего документа термины лечить, лечение, лечащий относятся, например, к уменьшению тяжести заболевания или патологического состояния; уменьшению продолжительности течения заболевания; уменьшению одного или более симптомов, связанных с заболеванием или состоянием; оказанию благоприятного эффекта для субъекта с заболеванием или состоянием, не обязательно излечивая это заболевание или состояние, либо профилактике одного или более симптомов, связанных с заболеванием или состоянием. В одном варианте реализации изобретения термин лечить или лечение означает поддержание минимальной концентрации FVIII на уровне по меньшей мере около 1 МЕ/дл, 2 МЕ/дл, 3 МЕ/дл, 4 МЕ/дл, 5 МЕ/дл, 6 МЕ/дл, 7 МЕ/дл, 8 МЕ/дл, 9 МЕ/дл, 10 МЕ/дл, 11 МЕ/дл, 12 МЕ/дл, 13 МЕ/дл, 14 МЕ/дл, 15 МЕ/дл, 16 МЕ/дл, 17 МЕ/дл, 18 МЕ/дл, 19 МЕ/дл или 20 МЕ/дл у субъекта путем введения химерного белка или фрагмента ФВ по данному изобретению. В другом варианте реализации изобретения лечить или лечение означает поддержание минимальной концентрации FVIII на уровне от около 1 до около 20 МЕ/дл, от около 2 до около 20 МЕ/дл, от около 3 до около 20 МЕ/дл, от около 4 до около 20 МЕ/дл, от около 5 до около 20 МЕ/дл, от около 6 до около 20 МЕ/дл, от около 7 до около 20 МЕ/дл, от около 8 до около 20 МЕ/дл, от около 9 до около 20 МЕ/дл или от около 10 до около 20 МЕ/дл. Лечение заболевания или патологического состояния также может включать поддержание активности FVIII у субъекта на уровне, сопоставимом с уровнем по меньшей мере около 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19% или 20% от активности FVIII у субъекта, не болеющего гемофилией. Минимальную концентрацию, требуемую для лечения, можно измерять с помощью одного или более известных методов и можно корректировать (повышать или снижать) для каждого конкретного пациента.As used herein, the terms treat, treatment, treating refer, for example, to reducing the severity of a disease or condition; reducing the duration of the disease; reducing one or more symptoms associated with a disease or condition; providing a beneficial effect for a subject with a disease or condition, without necessarily curing the disease or condition, or preventing one or more symptoms associated with the disease or condition. In one embodiment, the term treat or treat means maintaining a trough FVIII concentration of at least about 1 IU/dL, 2 IU/dL, 3 IU/dL, 4 IU/dL, 5 IU/dL, 6 IU/dL, 7 IU/dl, 8 IU/dl, 9 IU/dl, 10 IU/dl, 11 IU/dl, 12 IU/dl, 13 IU/dl, 14 IU/dl, 15 IU/dl, 16 IU/dl, 17 IU/dL, 18 IU/dL, 19 IU/dL, or 20 IU/dL in a subject by administering the VWF chimeric protein or fragment of the present invention. In another embodiment, treat or treat means maintaining a trough FVIII concentration of about 1 to about 20 IU/dL, about 2 to about 20 IU/dL, about 3 to about 20 IU/dL, about 4 to about 20 IU/dL, about 5 to about 20 IU/dL, about 6 to about 20 IU/dL, about 7 to about 20 IU/dL, about 8 to about 20 IU/dL, about 9 to about 20 IU/dL or about 10 to about 20 IU/dL. Treatment of a disease or condition may also include maintaining FVIII activity in the subject at a level comparable to a level of at least about 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, or 20% of FVIII activity in a non-hemophiliac subject. The minimum concentration required for treatment can be measured using one or more known methods and can be adjusted (increased or decreased) for each individual patient.

II. Химерные белки.II. Chimeric proteins.

Настоящее изобретение относится к продлению периода полувыведения химерного белка, в котором используется белок ФВ, слитый с последовательностью XTEN, посредством предотвращения или ингибирования ассоциации фактора, ограничивающего период полувыведения FVIII, т.е. эндогенного ФВ, с белком FVIII. Эндогенный ФВ ассоциирован в нековалентных комплексах с около 95-98% FVIII. Хотя эндогенный ФВ представляет собой фактор, ограничивающий период полувыведения FVIII, также известно, что эндогенный ФВ, связанный с белком FVIII, различными способами защищает белок FVIII. Например, полноразмерный ФВ (в виде мультимера массой около 250 кДа) может защищать FVIII от расщепления протеазами и активации FVIII, стабилизировать тяжелую цепь и/или легкую цепь FVIII и предотвращает клиренс FVIII фагоцитарными рецепторами. Однако в то же время эндогенный ФВ ограничивает период полувыведения FVIII, предотвращая пиноцитоз и выводя комплекс FVIII-ФВ из системы через путь клиренса ФВ. Безотносительно к какой-либо теории, считается, что эндогенный ФВ представляет собой фактор, ограничивающий период полувыведения, который не позволяет продлить период полувыведения химерного белка, слитого с компонентом, продлевающим период полувыведения, более чем примерно вдвое по сравнению с FVIII дикого типа. Следовательно, настоящее изобретение направлено на предотвращение или ингибирование взаимодействия между эндогенным ФВ и белком FVIII благодаря использованию белка ФВ, содержащего домен D' и домен D3 (например, фрагмента ФВ), и в то же время на увеличение периода полувыведения полученного(-ых) в результате белка(-ов) FVIII благодаря использованию последовательности XTEN в сочетании с константной областью ИГ или ее частью. В частности, настоящее изобретение показывает, что более короткая последовательность XTEN (т.е. последовательность XTEN длиной менее 288 аминокислот, т.е. последовательность XTEN короче 288 аминокислот) обеспечивает лучшее продление периода полувыведения химерного белка.The present invention relates to prolonging the half-life of a chimeric protein that uses a VWF protein fused to an XTEN sequence by preventing or inhibiting the association of the FVIII half-life limiting factor, i.e. endogenous VWF, with the FVIII protein. Endogenous VWF is associated in non-covalent complexes with about 95-98% of FVIII. Although endogenous VWF is a factor that limits the half-life of FVIII, endogenous VWF bound to the FVIII protein is also known to protect the FVIII protein in various ways. For example, full-length VWF (as a multimer of approximately 250 kDa) can protect FVIII from protease degradation and FVIII activation, stabilize the FVIII heavy chain and/or light chain, and prevent clearance of FVIII by phagocytic receptors. However, at the same time, endogenous VWF limits the half-life of FVIII by preventing pinocytosis and clearing the FVIII-VWF complex from the system through the VWF clearance pathway. Without regard to any theory, it is believed that endogenous VWF is a half-life limiting factor that prevents the half-life of a chimeric protein fused to a half-life prolonging component from extending the half-life of a chimeric protein fused to more than about twice that of wild-type FVIII. Therefore, the present invention is directed to preventing or inhibiting the interaction between endogenous VWF and FVIII protein by using a VWF protein containing a D' domain and a D3 domain (eg, a VWF fragment), and at the same time increasing the half-life of the resulting resulting from the FVIII protein(s) through the use of the XTEN sequence in combination with the IG constant region or part thereof. In particular, the present invention shows that a shorter XTEN sequence (ie, an XTEN sequence less than 288 amino acids in length, ie, an XTEN sequence shorter than 288 amino acids) provides better extension of the half-life of the chimeric protein.

В одном варианте реализации изобретение касается химерного белка, содержащего (i) первый полипептид, состоящий из белка FVIII, слитого с первой константной областью ИГ или ее частью, и (ii) второй полипептид, состоящий из белка ФВ, который включает домен D' и домен D3 ФВ, слитого со второй константной областью ИГ или ее частью посредством расположенной между ними последовательности XTEN, причем последовательность XTEN содержит менее 288 аминокислотных остатков и первый полипептид связан или соединен со вторым полипептидом. В другом варианте реализации последовательность XTEN во втором полипептиде состоит из аминокислотной последовательности длиной от 12 аминокислот до 287 аминокислот. В прочих вариантах реализации химерный белок демонстрирует более продолжительный период полувыведения по сравнению с соответствующим слитым белком, содержащим первый полипептид и второй полипептид, в котором второй полипептид включает последовательность XTEN, содержащую по меньшей мере 288 аминокислот, например, AE288, например, SEQ ID NO: 8. В еще одних вариантах реализации изобретения последовательность XTEN второго полипептида содержит по меньшей мере около 36, по меньшей мере около 42, по меньшей мере около 72 или по меньшей мере около 144 аминокислот, но менее 288 аминокислот, например,In one embodiment, the invention provides a chimeric protein comprising (i) a first polypeptide consisting of an FVIII protein fused to a first IG constant region or portion thereof, and (ii) a second polypeptide consisting of a VWF protein that includes a D' domain and a D3 VWF fused to a second IG constant region or a portion thereof by an intervening XTEN sequence, wherein the XTEN sequence contains less than 288 amino acid residues and the first polypeptide is linked or linked to the second polypeptide. In another embodiment, the XTEN sequence in the second polypeptide consists of an amino acid sequence ranging from 12 amino acids to 287 amino acids in length. In other embodiments, the chimeric protein exhibits a longer half-life compared to a corresponding fusion protein comprising a first polypeptide and a second polypeptide, wherein the second polypeptide includes an XTEN sequence containing at least 288 amino acids, e.g., AE288, e.g., SEQ ID NO: 8. In yet other embodiments, the XTEN sequence of the second polypeptide contains at least about 36, at least about 42, at least about 72, or at least about 144 amino acids, but less than 288 amino acids, e.g.

- 20 044115- 20 044115

AE42, AE72, AE144 (AE144,AE42, AE72, AE144 (AE144,

AE144_2A, AE144_3B, AE144_4A, AE144_5A, AE144_6B), AG42, AG72 или AG144 (AG144, AG144 A, AG144_B, AG144 C, AG144 F), например, SEQ ID NO: 9, SEQ ID NO:AE144_2A, AE144_3B, AE144_4A, AE144_5A, AE144_6B), AG42, AG72 or AG144 (AG144, AG144 A, AG144_B, AG144 C, AG144 F), for example, SEQ ID NO: 9, SEQ ID NO:

10, SEQ ID NO: 11, SEQ ID NO: 55; SEQ ID NO: 56; SEQ ID NO: 57; SEQ ID NO: 58; SEQ ID NO: 59; SEQ ID NO: 14; SEQ ID NO: 60; SEQ ID NO: 61; SEQ ID NO: 62; или SEQ ID NO: 63.10, SEQ ID NO: 11, SEQ ID NO: 55; SEQ ID NO: 56; SEQ ID NO: 57; SEQ ID NO: 58; SEQ ID NO: 59; SEQ ID NO: 14; SEQ ID NO: 60; SEQ ID NO: 61; SEQ ID NO: 62; or SEQ ID NO: 63.

Химерный белок по настоящему изобретению может дополнительно содержать вторую последовательность XTEN, которая связывает белок FVIII с первой константной областью ИГ или ее частью.The chimeric protein of the present invention may further comprise a second XTEN sequence that binds the FVIII protein to the first IG constant region or portion thereof.

В определенных вариантах реализации изобретение касается химерного белка, содержащего (i) первый полипептид, состоящий из белка FVIII, слитого с первой константной областью ИГ или ее частью, и (ii) второй полипептид, состоящий из белка ФВ, который включает домен D' и домен D3 ФВ, слитого со второй константной областью ИГ или ее частью посредством расположенной между ними первой последовательности XTEN, причем последовательность XTEN содержит менее 288 аминокислотных остатков, первый полипептид связан или соединен со вторым полипептидом и первый полипептид дополнительно содержит вторую последовательность XTEN, встроенную в один или более сайтов встраивания в пределах белка FVIII или слитую с белком FVIII и/или первой константной областью ИГ или ее частью. Таким образом, в одном варианте реализации изобретения вторая последовательность XTEN встроена в один или более сайтов встраивания в пределах белка FVIII. В другом варианте реализации изобретения вторая последовательность XTEN слита с белком FVIII и/или с первой константной областью ИГ или ее частью. В прочих вариантах реализации изобретения вторая последовательность XTEN встроена в один или более сайтов встраивания в пределах белка FVIII и третья последовательность XTEN слита с белком FVIII и/или с первой константной областью ИГ или ее частью.In certain embodiments, the invention provides a chimeric protein comprising (i) a first polypeptide consisting of an FVIII protein fused to a first IG constant region or portion thereof, and (ii) a second polypeptide consisting of a VWF protein that includes a D' domain and a D3 VWF fused to a second IG constant region or a portion thereof by a first XTEN sequence located therebetween, wherein the XTEN sequence contains less than 288 amino acid residues, the first polypeptide is linked or linked to a second polypeptide, and the first polypeptide further contains a second XTEN sequence embedded in one or more insertion sites within the FVIII protein or fused to the FVIII protein and/or the first IG constant region or part thereof. Thus, in one embodiment of the invention, the second XTEN sequence is inserted into one or more insertion sites within the FVIII protein. In another embodiment, the second XTEN sequence is fused to the FVIII protein and/or to the first IG constant region or portion thereof. In other embodiments, a second XTEN sequence is inserted into one or more insertion sites within the FVIII protein, and a third XTEN sequence is fused to the FVIII protein and/or to a first IG constant region or portion thereof.

Вторая и/или третья последовательности XTEN могут представлять собой аминокислотные последовательности XTEN любой длины. Например, вторая и/или третья последовательности XTEN могут представлять собой последовательности, описанные в другом месте настоящего документа, например,The second and/or third XTEN sequences may be XTEN amino acid sequences of any length. For example, the second and/or third XTEN sequences may be sequences described elsewhere herein, e.g.

АЕ42, АЕ72, АЕ864, АЕ576,AE42, AE72, AE864, AE576,

АЕ288, АЕ144, AG864, AG576, AG288 и AG144, например, SEQ Ш NO: 8; SEQ Ш NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 17; SEQ ID NO: 54; SEQ ID NO: 19; SEQ ID NO: 16; SEQ ID NO: 18; SEQ ID NO: 15; SEQ ID NO: 55; SEQ ID NO: 56; SEQ ID NO: 57;AE288, AE144, AG864, AG576, AG288 and AG144, for example, SEQ Ш NO: 8; SEQ Ш NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 17; SEQ ID NO: 54; SEQ ID NO: 19; SEQ ID NO: 16; SEQ ID NO: 18; SEQ ID NO: 15; SEQ ID NO: 55; SEQ ID NO: 56; SEQ ID NO: 57;

SEQ ID NO: 58; SEQ ID NO: 59; SEQ ID NO: 14; SEQ ID NO: 60; SEQ ID NO: 61; SEQ IDSEQ ID NO: 58; SEQ ID NO: 59; SEQ ID NO: 14; SEQ ID NO: 60; SEQ ID NO: 61; SEQ ID

NO: 62; или SEQ ID NO: 63.NO: 62; or SEQ ID NO: 63.

В конкретном варианте реализации изобретения вторая и/или третья последовательности XTEN представляют собой AE288 или AG288, например, SEQ ID NO: 8 или 19.In a specific embodiment, the second and/or third XTEN sequences are AE288 or AG288, for example, SEQ ID NO: 8 or 19.

В определенных вариантах реализации изобретение касается химерного белка, содержащего (i) первый полипептид, состоящий из белка FVIII, слитого с первой константной областью ИГ или ее частью посредством необязательного линкера, причем необязательная последовательность XTEN (X2) встроена в один или более сайтов встраивания в пределах белка FVIII или слита с белком FVIII или первой константной областью ИГ или ее частью, и (ii) второй полипептид, состоящий из белка ФВ, который включает домен D' и домен D3 ФВ, слитого со второй константной областью ИГ или ее частью посредством последовательности XTEN (X1), расположенной между белком ФВ и второй константной областью ИГ или ее частью, причем последовательность XTEN (X1) содержит менее 288 аминокислотных остатков и слита с белком ФВ посредством линкера, и причем первый полипептид соединен со вторым полипептидом. В некоторых вариантах реализации изобретение касается химерного белка, содержащего (i) первый полипептид, состоящий из белка FVIII, слитого с первой константной областью ИГ или ее частью посредством необязательного линкера, причем необязательная последовательность XTEN (Х2) встроена в один или более сайтов встраивания в пределах белка FVIII или слита с белком FVIII или первой константной областью ИГ или ее частью, и (ii) второй полипептид, состоящий из белка ФВ, который включает домен D' и домен D3 ФВ, слитого со второй константной областью ИГ или ее частью посредством последовательности XTEN (X1), расположенной между белком ФВ и второй константной областью ИГ или ее частью, причем последовательность XTEN (X1) содержит менее 288 аминокислотных остатков и слита со второй константной областью ИГ или ее частью посредством линкера, и причем первый полипептид соединен со вторым полипептидом. В других вариантах реализации изобретения линкер, посредством которого последовательность XTEN (X1) слита с белком ФВ или со второй константной областью ИГ или ее частью, представляет собой расщепляемый линкер. Неограничивающие примеры расщепляемых линкеров описаны в других местах в данном документе. В конкретном варианте реализации изобретения линкер представляет собой линкер, расщепляемый тромбином.In certain embodiments, the invention provides a chimeric protein comprising (i) a first polypeptide consisting of an FVIII protein fused to a first IG constant region or portion thereof via an optional linker, wherein the optional XTEN (X2) sequence is inserted into one or more insertion sites within FVIII protein or fused to FVIII protein or a first IG constant region or a portion thereof, and (ii) a second polypeptide consisting of a VWF protein that includes a VWF D' domain and a VWF D3 domain fused to a second IG constant region or a portion thereof through the sequence XTEN (X1) located between the VWF protein and the second IG constant region or part thereof, wherein the sequence XTEN (X1) contains less than 288 amino acid residues and is fused to the VWF protein via a linker, and wherein the first polypeptide is connected to the second polypeptide. In some embodiments, the invention provides a chimeric protein comprising (i) a first polypeptide consisting of an FVIII protein fused to a first IG constant region or portion thereof via an optional linker, wherein the optional XTEN (X2) sequence is inserted into one or more insertion sites within FVIII protein or fused to FVIII protein or a first IG constant region or a portion thereof, and (ii) a second polypeptide consisting of a VWF protein that includes a VWF D' domain and a VWF D3 domain fused to a second IG constant region or a portion thereof through the sequence XTEN (X1), located between the VWF protein and the second IG constant region or part thereof, wherein the sequence XTEN (X1) contains less than 288 amino acid residues and is fused to the second IG constant region or part thereof via a linker, and wherein the first polypeptide is connected to the second polypeptide. In other embodiments, the linker by which the XTEN (X1) sequence is fused to the VWF protein or to the second IG constant region or portion thereof is a cleavable linker. Non-limiting examples of cleavable linkers are described elsewhere herein. In a particular embodiment of the invention, the linker is a thrombin-cleavable linker.

В некоторых вариантах реализации изобретения химерный белок представляет собой две полипептидные цепи, первая из которых содержит описанный выше первый полипептид, а вторая содержит опиIn some embodiments, the chimeric protein is two polypeptide chains, the first of which contains the first polypeptide described above, and the second of which contains opi

- 21 044115 санный выше второй полипептид. Например, две полипептидные цепи включают (i) первую цепь, содержащую одноцепочечный белок FVIII, первую константную область ИГ или ее часть и необязательную последовательность XTEN, встроенную в один или более сайтов встраивания в пределах белка FVIII или слитую с белком FVIII или с первой константной областью ИГ или ее частью, и (ii) вторую цепь, содержащую белок ФВ, слитый со второй константной областью ИГ или ее частью посредством расположенной между ними последовательности XTEN (X1), причем последовательность XTEN (X1) содержит менее 288 аминокислот.- 21 044115 the second polypeptide above. For example, the two polypeptide chains include (i) a first chain comprising a single-chain FVIII protein, a first IG constant region or portion thereof, and an optional XTEN sequence inserted into one or more insertion sites within the FVIII protein or fused to the FVIII protein or the first constant region Ig or a portion thereof, and (ii) a second chain comprising a VWF protein fused to a second constant region of Ig or a portion thereof via an intervening sequence XTEN (X1), wherein the sequence XTEN (X1) contains less than 288 amino acids.

В определенных вариантах реализации изобретения химерный белок представляет собой две полипептидные цепи, первая из которых содержит тяжелую цепь белка FVIII, а вторая содержит, в направлении от N-конца до С-конца, легкую цепь белка FVIII, необязательную последовательность XTEN, встроенную в один или более сайтов встраивания в пределах белка FVIII или слитую с белком FVIII или первой константной областью ИГ или ее частью, первую константную область ИГ или ее часть, необязательный линкер (например, процессируемый линкер), белок ФВ, последовательность XTEN (X1), второй необязательный линкер (например, расщепляемый линкер) и вторую константную область ИГ или ее часть.In certain embodiments of the invention, the chimeric protein is two polypeptide chains, the first of which contains the heavy chain of the FVIII protein, and the second of which contains, in the N-terminal to C-terminal direction, the light chain of the FVIII protein, an optional XTEN sequence inserted into one or more than insertion sites within the FVIII protein or fused to the FVIII protein or a first IG constant region or a portion thereof, a first IG constant region or a portion thereof, an optional linker (e.g., a processable linker), a VWF protein, an XTEN (X1) sequence, a second optional linker (eg, a cleavable linker) and a second IG constant region or portion thereof.

В других вариантах реализации изобретения химерный белок представляет собой три полипептидные цепи: (i) первую цепь, содержащую тяжелую цепь белка FVIII, (ii) вторую цепь, содержащую легкую цепь белка FVIII, первую константную область ИГ или ее часть и необязательную последовательность XTEN, встроенную в один или более сайтов встраивания в пределах тяжелой цепи или легкой цепи белка FVIII или слитую с белком FVIII или с первой константной областью ИГ или ее частью, и (iii) третью цепь, содержащую белок ФВ, слитый со второй константной областью ИГ или ее частью посредством расположенной между ними последовательности XTEN (X1), причем первая цепь и вторая цепь соединены посредством нековалентной связи, например, металлической связи, а вторая цепь и третья цепь соединены посредством ковалентной связи, например, дисульфидной связи.In other embodiments, the chimeric protein is three polypeptide chains: (i) a first chain comprising a FVIII protein heavy chain, (ii) a second chain comprising a FVIII protein light chain, a first IG constant region or portion thereof, and an optional XTEN sequence inserted at one or more insertion sites within the heavy chain or light chain of the FVIII protein or fused to the FVIII protein or to the first IG constant region or part thereof, and (iii) a third chain containing the VWF protein fused to the second IG constant region or part thereof via an intervening sequence XTEN (X1), the first chain and the second chain being connected by a non-covalent bond, such as a metal bond, and the second chain and the third chain being connected by a covalent bond, such as a disulfide bond.

В еще одних вариантах реализации изобретения химерный белок представляет собой одноцепочечный белок, содержащий, в направлении от N-конца к С-концу, одноцепочечный белок FVIII, необязательную последовательность XTEN, встроенную в один или более сайтов встраивания в пределах белка FVIII или слитую с белком FVIII или с первой константной областью ИГ или ее частью, необязательный линкер (например, процессируемый линкер), белок ФВ, последовательность XTEN (X1), второй необязательный линкер (например, расщепляемый линкер) и вторую константную область ИГ или ее часть.In yet other embodiments, the chimeric protein is a single chain protein comprising, from N-terminus to C-terminus, a single chain FVIII protein, an optional XTEN sequence inserted into one or more insertion sites within the FVIII protein or fused to the FVIII protein or with a first IG constant region or a portion thereof, an optional linker (eg, a processable linker), a VWF protein, an XTEN (X1) sequence, a second optional linker (for example, a cleavable linker), and a second IG constant region or a portion thereof.

В определенных вариантах реализации изобретения химерный белок содержит одну из нижеприведенных формул (a)-(hh):In certain embodiments of the invention, the chimeric protein contains one of the following formulas (a)-(hh):

(a) FVin-Fl:F2-L2-X-Ll-V;(a) FVin-Fl:F2-L2-X-Ll-V;

(b) FVin-Fl:V-Ll-X-L2-F2;(b) FVin-Fl:V-Ll-X-L2-F2;

(с) Fl-FVni:F2-L2-X-Ll-V;(c) Fl-FVni:F2-L2-X-Ll-V;

(d) Fl-FVni:V-Ll-X-L2-F2;(d) Fl-FVni:V-Ll-X-L2-F2;

- 22 044115 (e) FVin-X2-Fl:F2-L2-Xl-Ll-V;- 22 044115 (e) FVin-X2-Fl:F2-L2-Xl-Ll-V;

(f) FVin-X2-Fl:V-Ll-Xl-L2-F2;(f) FVin-X2-Fl:V-Ll-Xl-L2-F2;

(g) FVIII(X2)-F1:F2-L2-X1-L1-V;(g) FVIII(X2)-F1:F2-L2-X1-L1-V;

(h) FVIII(X2)-F1:V-L1-X1-L2-F2;(h) FVIII(X2)-F1:V-L1-X1-L2-F2;

(i) F1-X2-F1:F2-L2-X1-L1-V;(i) F1-X2-F1:F2-L2-X1-L1-V;

(j) F1-X2-F1:V-L1-X1-L2-F2;(j) F1-X2-F1:V-L1-X1-L2-F2;

(k) V-L1-X-L2-F2-L3-FVIII-L4-F1;(k) V-L1-X-L2-F2-L3-FVIII-L4-F1;

(1) V-L1-X-L2-F2-L3-F1-L4-FVIII;(1) V-L1-X-L2-F2-L3-F1-L4-FVIII;

(m) F1-L4-FVIII-L3-F2-L2-X-L1-V;(m) F1-L4-FVIII-L3-F2-L2-X-L1-V;

(n) FVIII-L4-F1-L3-F2-L2-X-L1-V;(n) FVIII-L4-F1-L3-F2-L2-X-L1-V;

(o) FVIII-L4-F1-L3-V-L1-X-L2-F2;(o) FVIII-L4-F1-L3-V-L1-X-L2-F2;

(p) FVIII-L4-F1-L3-F2-L2-X-L1-V;(p) FVIII-L4-F1-L3-F2-L2-X-L1-V;

(q) F2-L2-X-L1-V-L3-F1-L4-FVIII;(q) F2-L2-X-L1-V-L3-F1-L4-FVIII;

(r) F2-L2-X-L1-V-L3-FVIII-L4-F1;(r) F2-L2-X-L1-V-L3-FVIII-L4-F1;

(s) V-Ll-Xl-L2-F2-L3-FVni(X2)-L4-Fl;(s) V-Ll-Xl-L2-F2-L3-FVni(X2)-L4-Fl;

(t) V-Ll-Xl-L2-F2-L3-Fl-L4-FVni(X2);(t) V-Ll-Xl-L2-F2-L3-Fl-L4-FVni(X2);

(u) Fl -L4-FVni(X2)-L3-F2-L2-X1 -L1 - V;(u) Fl -L4-FVni(X2)-L3-F2-L2-X1 -L1 - V;

(v) F-L4-FVni(X2)-L3-V-Ll-Xl-L2-F2;(v) F-L4-FVni(X2)-L3-V-Ll-Xl-L2-F2;

(w) FVIII(X2)-L4-F 1-L3 - V-L1 -X1-L2-F2;(w) FVIII(X2)-L4-F 1-L3 - V-L1 -X1-L2-F2;

(x) FVIII(X2)-L4-F 1-L3 -F2-L2-X1 -L1 - V;(x) FVIII(X2)-L4-F 1-L3 -F2-L2-X1 -L1 - V;

(y) F2-L2-Xl-Ll-V-L3-Fl-L4-FVni(X2);(y) F2-L2-Xl-Ll-V-L3-Fl-L4-FVni(X2);

(z) F2-L2-Xl-Ll-V-L3-FVni(X2)-L4-Fl;(z) F2-L2-Xl-Ll-V-L3-FVni(X2)-L4-Fl;

(aa) V-L 1-X2-L2-F2-L3-FVIII-L4-X2-L5-F1;(aa) V-L 1-X2-L2-F2-L3-FVIII-L4-X2-L5-F1;

(bb) V-L1-X2-L2-F2-L3-F1-L5-X2-L4-FVIII;(bb) V-L1-X2-L2-F2-L3-F1-L5-X2-L4-FVIII;

(cc) Fl -L5-X2-L4-FVIII-L3 -F2-L2-X2-L1 -V;(cc) Fl -L5-X2-L4-FVIII-L3 -F2-L2-X2-L1 -V;

(dd) F1-L5-X2-L4-FVIII-L3 - V-L 1-X2-L2-F2;(dd) F1-L5-X2-L4-FVIII-L3 - V-L 1-X2-L2-F2;

(ее) FVIII-L5-X2-L4-F2-L3 - V-L 1 -X1-L2-F1;(ee) FVIII-L5-X2-L4-F2-L3 - V-L 1 -X1-L2-F1;

(ff) FVIII-L5-X2-L4-F2-L3 -Fl -L2-X1 -L1 - V;(ff) FVIII-L5-X2-L4-F2-L3 -Fl -L2-X1 -L1 - V;

(gg) Fl-L2-Xl-Ll-V-L3-F2-L4-X2-L5-FVin; или (hh) F1-L2-X1 -L1 - V-L3 -FVIII-L5-X2-L4-F2;(gg) Fl-L2-Xl-Ll-V-L3-F2-L4-X2-L5-FVin; or (hh) F1-L2-X1 -L1 - V-L3 -FVIII-L5-X2-L4-F2;

где V представляет собой белок ФВ, который содержит домен D' и домен D3,where V is the VWF protein, which contains a D' domain and a D3 domain,

X или X1 является первой последовательностью XTEN, имеющей менее чем 288 аминокислот,X or X1 is the first XTEN sequence having less than 288 amino acids,

Х2 представляет собой вторую последовательность XTEN, FVIII включает белок FVIII,X2 is the second XTEN sequence, FVIII includes the FVIII protein,

FVIII(X2), включает белок FVIII, имеющий вторую последовательность XTEN, встроенную в один или более сайтов встраивания в пределах белка FVIII,FVIII(X2), includes an FVIII protein having a second XTEN sequence inserted into one or more insertion sites within the FVIII protein,

F1 представляет собой первую константную область ИГ или ее часть,F1 represents the first constant region of the IG or part thereof,

F2 представляет собой вторую константную область ИГ или ее часть,F2 represents the second constant region of the IG or part thereof,

L1, L2, L3, L4, или L5 представляют собой необязательный линкер, (-) представляет собой пептидную связь; и (:) представляет собой ковалентную связь или нековалентную связь.L1, L2, L3, L4, or L5 represents an optional linker; (-) represents a peptide bond; and (:) represents a covalent bond or a non-covalent bond.

В одном варианте реализации изобретения последовательность X илиIn one embodiment of the invention, the sequence X or

X1 состоит из аминокислотной последовательности длиной от 12 аминокислот до 287 аминокислот. В другом варианте реализации изобретения химерный белок демонстрирует более продолжительный период полувыведения по сравнению с соответствующим химерным белком по формуле, где X или X1 представляет собой AE288, например, SEQ ID NO: 8.X1 consists of an amino acid sequence ranging in length from 12 amino acids to 287 amino acids. In another embodiment, the chimeric protein exhibits a longer half-life compared to the corresponding chimeric protein of the formula wherein X or X1 is AE288, for example, SEQ ID NO: 8.

В других вариантах реализации изобретения X или X1 в формуле содержит по меньшей мере околоIn other embodiments, X or X1 in the formula contains at least about

- 23 044115- 23 044115

36, по меньшей мере около 42, по меньшей мере около 72 или по меньшей мере около 144 аминокислот, но менее 288 аминокислот, например36, at least about 42, at least about 72, or at least about 144 amino acids, but less than 288 amino acids, e.g.

АЕ42, АЕ72, АЕ144 (АЕ144, АЕ144_2А, АЕ144_ЗВ, АЕ144_4А, АЕ144_5А, АЕ144_6В),AE42, AE72, AE144 (AE144, AE144_2A, AE144_ZV, AE144_4A, AE144_5A, AE144_6B),

AG42, AG72 или AG144 (AG144, AG144_A, AG144_B, AG144_C, AG144_F), например, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 55; SEQ ID NO: 56; SEQ IDAG42, AG72 or AG144 (AG144, AG144_A, AG144_B, AG144_C, AG144_F), for example, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 55; SEQ ID NO: 56; SEQ ID

NO: 57; SEQ ID NO: 58; SEQ ID NO: 59; SEQ ID NO: 14; SEQ ID NO: 60; SEQ ID NO: 61;NO: 57; SEQ ID NO: 58; SEQ ID NO: 59; SEQ ID NO: 14; SEQ ID NO: 60; SEQ ID NO: 61;

SEQ ID NO: 62; или SEQ ID NO: 63.SEQ ID NO: 62; or SEQ ID NO: 63.

Еще в одних вариантах реализации изобретения Х2 содержит аминокислотную последовательность длиной по меньшей мере около 36 аминокислот, по меньшей мере 42 аминокислоты, по меньшей мере 144 аминокислоты, по меньшей мере 288 аминокислот, по меньшей мере 576 аминокислот или по меньшей мере 864 аминокислоты, напримерIn yet other embodiments, X2 comprises an amino acid sequence of at least about 36 amino acids, at least 42 amino acids, at least 144 amino acids, at least 288 amino acids, at least 576 amino acids, or at least 864 amino acids in length, for example

АЕ42, АЕ72, АЕ864, АЕ576, АЕ288, АЕ144, AG864, AG576,AE42, AE72, AE864, AE576, AE288, AE144, AG864, AG576,

AG288 или AG144, например, SEQ Ш NO: 9; SEQ Ш NO: 10; SEQ Ш NO: 15; SEQ Ш NO:AG288 or AG144, for example, SEQ Ш NO: 9; SEQ Ш NO: 10; SEQ Ш NO: 15; SEQ Ш NO:

16; SEQ Ш NO: 8; SEQ Ш NO: И; SEQ Ш NO: 17; SEQ Ш NO: 18; SEQ ID NO: 19; или16; SEQ Ш NO: 8; SEQ Ш NO: И; SEQ Ш NO: 17; SEQ Ш NO: 18; SEQ ID NO: 19; or

SEQ ID NO: 14.SEQ ID NO: 14.

В конкретном варианте реализации изобретения Х2 представляет собой AE288 или AG288, например, SEQ ID NO: 8 или 19.In a specific embodiment, X2 is AE288 or AG288, for example, SEQ ID NO: 8 or 19.

В определенных вариантах реализации изобретения химерный белок, содержащий X или X1 и/или Х2, демонстрирует более продолжительный период полувыведения по сравнению с химерным белком, не содержащим X или X1 и/или Х2. В других вариантах реализации изобретения L1 и/или L2 представляет собой расщепляемый линкер. Еще в одних вариантах реализации изобретения L4 и/или L5 представляет собой расщепляемый линкер.In certain embodiments, a chimeric protein containing X or X1 and/or X2 exhibits a longer half-life compared to a chimeric protein not containing X or X1 and/or X2. In other embodiments, L1 and/or L2 is a cleavable linker. In yet other embodiments, L4 and/or L5 is a cleavable linker.

И.А. Белки фактора фон Виллебранда (ФВ).I.A. Von Willebrand factor (VWF) proteins.

ФВ (также известный как F8ФВ) является большим мультимерным гликопротеином, присутствующим в плазме крови и постоянно производимым в эндотелии (в тельцах Вейбел-Палада), мегакариоцитах (альфа-гранулы тромбоцитов) и субэндотелии соединительной ткани. Основной мономер ФВ является белком, состоящим из 2813 аминокислот. Каждый мономер содержит ряд специфических доменов с определенной функцией, домен D'/D3 (который связывается с фактором VIII), домен А1 (который связывается с тромбоцитарным рецептором GPIb, гепарином, и/или, возможно, коллагеном), домен A3 (который связывается с коллагеном), домен С1 (в котором домен RGD связывается с тромбоцитарным интегрином αΠΕβ3, когда он активирован) и домен цистеиновый узел на С терминальном конце белка (который ФВ разделяет с тромбоцитарным фактором роста (PDGF), трансформирующим фактор роста-бета (TGF-β) и бета-хорионическом гонадотропином человека (PHCG)).VWF (also known as F8VWF) is a large multimeric glycoprotein present in blood plasma and continuously produced in the endothelium (Weibel-Palade bodies), megakaryocytes (platelet alpha granules), and connective tissue subendothelium. The main monomer of VWF is a protein consisting of 2813 amino acids. Each monomer contains a number of specific domains with a specific function, the D'/D3 domain (which binds to factor VIII), the A1 domain (which binds to the platelet receptor GPIb, heparin, and/or possibly collagen), the A3 domain (which binds to collagen), the C1 domain (in which the RGD domain binds to the platelet-derived integrin αΠΕβ3 when activated), and the cysteine knot domain at the C terminal end of the protein (which VWF shares with platelet-derived growth factor (PDGF), transforming growth factor-beta (TGF-β ) and beta human chorionic gonadotropin (PHCG)).

В одном варианте реализации изобретения белок ФВ является фрагментом ФВ. Термин фрагмент ФВ в данном контексте включает в себя, но не ограничивается ими, функциональные фрагменты ФВ, содержащие домен D' и домен D3, которые обладают способностью ингибировать связывание эндогенных ФВ с FVIII. В одном варианте реализации изобретения фрагмент ФВ связывается с белком FVIII. В другом варианте реализации изобретения фрагмент ФВ блокирует сайт связывания белка FVIII, тем самым ингибируя взаимодействие белка FVIII с эндогенными ФВ. Фрагменты ФВ включают в себя производные, варианты, мутанты или аналоги, которые сохраняют эту активность ФВ.In one embodiment of the invention, the VWF protein is a fragment of VWF. The term VWF fragment as used herein includes, but is not limited to, functional VWF fragments containing a D' domain and a D3 domain that have the ability to inhibit the binding of endogenous VWF to FVIII. In one embodiment of the invention, the VWF fragment binds to the FVIII protein. In another embodiment, the VWF fragment blocks the binding site of the FVIII protein, thereby inhibiting the interaction of the FVIII protein with endogenous VWF. VWF fragments include derivatives, variants, mutants or analogs that retain this VWF activity.

Аминокислотная последовательность мономера ФВ человека (2813 аминокислот) описана под номером доступа _NP_000543.2_ в Genbank. Нуклеотидная последовательность, кодирующая ФВ, описана под номером доступа _NM_000552.3_ в Genbank. Нуклеотидная последовательность ФВ человека обозначена как SEQ ID NO: 20. SEQ ID NO: 21 представляет собой аминокислотную последовательность полноразмерного ФВ. Каждый домен ФВ представлен в табл. 1.The amino acid sequence of the human VWF monomer (2813 amino acids) is described under accession number _NP_000543.2_ in Genbank. The nucleotide sequence encoding VWF is described under accession number _NM_000552.3_ in Genbank. The nucleotide sequence of human VWF is indicated as SEQ ID NO: 20. SEQ ID NO: 21 is the amino acid sequence of full-length VWF. Each VWF domain is presented in Table. 1.

- 24 044115- 24 044115

Таблица 1Table 1

Последовательности ФВVWF sequences

Домены ФВ FV domains Аминокислотная последовательность Amino acid sequence Сигнальный пептид ФВ (Аминокислоты 1-22 из SEQ ID NO: 21) Signal peptide VWF (Amino Acids 1-22 from SEQ ID NO: 21) 1 1 MIPARFAGVL LALALILPGT LC 22 MIPARFAGVL LALALILPGT LC 22 Область D1D2 ФВ (Аминокислоты 23763 из SEQ ID NO: 21) VWF D1D2 Region (Amino Acids 23763 of SEQ ID NO: 21) 23 51 101 151 201 251 301 351 401 451 501 551 601 651 701 751 23 51 101 151 201 251 301 351 401 451 501 551 601 651 701 751 AEGTRGRS STARCSLFGS DFVNTFDGSM YSFAGYCSYL LAGGCQKRSF SIIGDFQNGK RVSLSVYLGE FFDIHLFVNG TVTQGDQRVS MPYASKGLYL ETEAGYYKLS GEAYGFVARI DGSGNFQVLL SDRYFNKTCG LCGNFNIFAE DDFMTQEGTL TSDPYDFANS WALSSGEQWC ERASPPSSSC NISSGEMQKG LWEQCQLLKS TSVFARCHPL VDPEPFVALC EKTLCECAGG LECACPALLE YARTCAQEGM VLYGWTDHSA CSPVCPAGME YRQCVSPCAR TCQSLHINEM CQERCVDGCS CPEGQLLDEG LCVESTECPC VHSGKRYPPG TSLSRDCNTC ICRNSQWICS NEECPGECLV TGQSHFKSFD NRYFTFSGIC QYLLARDCQD HSFSIVIETV QCADDRDAVC TRSVTVRLPG LHNSLVKLKH GAGVAMDGQDIQLPLLKGDL RIQHTVTASV RLSYGEDLQM DWDGRGRLLV KLSPVYAGKT CGLCGNYNGN QGDDFLTPSG LAEPRVEDFG NAWKLHGDCQ DLQKQHSDPC ALNPRMTRFS EEACAVLTSP TFEACHRAVS PLPYLRNCRY DVCSCSDGRE CLCGALASYA AACAGRGVRV AWREPGRCEL NCPKGQVYLQ CGTPCNLTCR SLSYPDEECN EACLEGCFCP PGLYMDERGD CVPKAQCPCY YDGEIFQPED IFSDHHTMCY CEDGFMHCTM SGVPGSLLPD AVLSSPLSHR SKR 763 AEGTRGRS STARCSLFGS DFVNTFDGSM YSFAGYCSYL LAGGCQKRSF SIIGDFQNGK RVSLSVYLGE FFDIHLFVNG TVTQGDQRVS MPYASKGLYL ETEAGYYKLS GEAYGFVARI DGSGNFQVLL SDRYFNKTCG LCGNFNIFAE DDFMTQEGTL TSDPYDFANS WALSSGEQWC ERASPPSSSC NISSGEMQKG LWEQCQLLKS TSVFARCHPL VDPEPFVALC EKTLCECAGG LECACPALLE YARTCAQEGM VLYGWTDHSA CSPVCPAGME YRQCVSPCAR TCQSLHINEM CQERCVDGCS CPEGQLLDEG LCVESTECPC VHSGKRYPPG TSLSRDCNTC ICRNSQWICS NEECPGECLV TGQSHFKSFD NRYFTFSGIC QYLLARDCQD HSFSIVIETV QCADDRDAVC TRSVTVRLPG LHNSLVKLKH GAGVAMDGQDIQLPLLKGDL RIQHTVTASV RLSYGEDLQM DWDGRGRLLV KLSPVYAGKT CGLCGNYNGN QGDDFLTPSG LAEPRVEDFG NAWKLHGDCQ DLQKQHSDPC ALNPRMTRFS EEACAVLTSP TFEACHRAVS PLPYLRNCRY DVCSCSDGRE CLCGALASYA AACAGRGVRV AWREPGRCEL NCPKGQVYLQ CGTPCNLTCR SLSYPDEECN EACLEGCFCP PGLYMDERGD CVPKAQCPCY YDGEIFQPED IFSDHHTMCY CEDGFMHCTM SGVPGSLLPD AVLSSPLSHR SKR 763 Домен D' ФВ Domain D' VF 764 801 764 801 SLSCRPP MVKLVCPADN LRAEGLECTK TCONYDLECM SMGCVSGCLC PPGMVRHENR CVALERCPCF HOGKEYAPGE SLSCRPP MVKLVCPADN LRAEGLECTK TCONYDLECM SMGCVSGCLC PPGMVRHENR CVALERCPCF HOGKEYAPGE TVKIGCNTCV TVKIGCNTCV

- 25 044115- 25 044115

851 851 CRDRKWNCTD НУСРАТ 866 CRDRKWNCTD NUSRAT 866 Домен D3 ФВ Domain D3 FV 867 867 CSTI GM AHY_LTFDG_LK Y LFPGECQ CSTI GM AHY_LTFDG_LK Y LFPGECQ YVLVQPYCGS YVLVQPYCGS 901 901 NPGTFRILVG NKGCSHPSVK CKKRVTILVE GGEIELFDGE NPGTFRILVG NKGCSHPSVK CKKRVTILVE GGEIELFDGE YNVKRPMKDE YNVKRPMKDE 951 951 THFEVVESGR YIILLLGKAL SVVWDRHLSI SVVLKQTYQE THFEVVESGR YIILLLGKAL SVVWDRHLSI SVVLKQTYQE kvcglcgnfd kvcglcgnfd 1001 1001 GIQNNDLTSS NLQVEEDPVD FGNSWKVSSQ.CADTRKVPLD GIQNNDLTSS NLQVEEDPVD FGNSWKVSSQ.CADTRKVPLD SSPATCHNNI SSPATCHNNI 1051 1051 MKQTMVDSSC RILTSDVFQD CNKLVDPEPY LDVCIYDTCS MKQTMVDSSC RILTSDVFQD CNKLVDPEPY LDVCIYDTCS CESIGDCACF CESIGDCACF 1101 1101 CDTIAAYAHV CAQHGKVVTW RTATLCP^SC EERNLRENGY CDTIAAYAHV CAQHGKVVTW RTATLCP^SC EERNLRENGY ECEWRYNSCA ECEWRYNSCA 1151 1151 PACQVTCQHP EPLACPVQCV EGCHAHCPPG KILDELLQTC PACQVTCQHP EPLACPVQCV EGCHAHCPPG KILDELLQTC YPPEDCPVCE YPPEDCPVCE 1201 1201 VAGRRFASGK KVTLNPSDPE HCQICHCDVV NLTCEACQEP VAGRRFASGK KVTLNPSDPE HCQICHCDVV NLTCEACQEP 1240 1240 Домен А1 ФВ Domain A1 FV 1241 1241 GGLVVPPTDA GGLVVPPTDA 1251 1251 PVSPTTLYVE DISEPPLHDF YCSRLLDLVF LLDGSSRLSE PVSPTTLYVE DISEPPLHDF YCSRLLDLVF LLDGSSRLSE AEFEVLKAFV AEFEVLKAFV 1301 1301 VDMMERLRIS QKWVRVAVVE YHDGSHAYIG LKDRKRPSEL VDMMERLRIS QKWVRVAVVE YHDGSHAYIG LKDRKRPSEL RRIASQVKYA RRIASQVKYA 1351 1351 GSQVASTSEV LKYTLFQIFS KIDRPEASRI ALLLMASQEP GSQVASTSEV LKYTLFQIFS KIDRPEASRI ALLLMASQEP QRMSRNFVRY QRMSRNFVRY 1401 1401 VQGLKKKKVI VIPVGIGPHA NLKQIRLIEK QAPENKAFVL VQGLKKKKVI VIPVGIGPHA NLKQIRLIEK QAPENKAFVL SSVDELEQQR SSVDELEQQR 1451 1451 DEIVSYLCDL APEAPPPTLP PDMAQVTVG 1479 DEIVSYLCDL APEAPPPTLP PDMAQVTVG 1479 1480 1480 P GLLGVSTLGP KRNSMVLDVA P GLLGVSTLGP KRNSMVLDVA 1501 1501 FVLEGSDKIG EADFNRSKEF MEEVIQRMDV GQDSIHVTVL FVLEGSDKIG EADFNRSKEF MEEVIQRMDV GQDSIHVTVL QYSYMVTVEY QYSYMVTVEY 1551 1551 PFSEAQSKGD ILQRVREIRY QGGNRTNTGL ALRYLSDHSF PFSEAQSKGD ILQRVREIRY QGGNRTNTGL ALRYLSDHSF LVSQGDREQA 1600 LVSQGDREQA 1600 1601 1601 PNLVYMVTGN PASDEIKRLP GDIQVVPIGV GPNANVQELE PNLVYMVTGN PASDEIKRLP GDIQVVPIGV GPNANVQELE RIGWPNAPIL RIGWPNAPIL 1651 1651 IQDFETLPRE APDLVLQRCC SGEGLQIPTL SPAPDCSQPL IQDFETLPRE APDLVLQRCC SGEGLQIPTL SPAPDCSQPL DVILLLDGSS DVILLLDGSS 1701 1701 SFPASYFDEM KSFAKAFISK ANIGPRLTQV SVLQYGSITT SFPASYFDEM KSFAKAFISK ANIGPRLTQV SVLQYGSITT IDVPWNVVPE IDVPWNVVPE 1751 1751 KAHLLSLVDV MQREGGPSQI GDALGFAVRY LTSEMHGARP KAHLLSLVDV MQREGGPSQI GDALGFAVRY LTSEMHGARP GASKAVVILV GASKAVVILV 1801 1801 TDVSVDSVDA AADAARSNRV TVFPIGIGDR YDAAQLRILA TDVSVDSVDA AADAARSNRV TVFPIGIGDR YDAAQLRILA

- 26 044115- 26 044115

GPAGDSNVVKGPAGDSNVVK

1851 1851 LQRIEDLPTM VTLGNSFLHK LCSGFVRICM DEDGNEKRPG DVWTLPDQCH LQRIEDLPTM VTLGNSFLHK LCSGFVRICM DEDGNEKRPG DVWTLPDQCH 1901 1901 TVTCQPDGQT LLKSHRVNCD RGLRPSCPNS QSPVKVEETC GCRWTCPCVC TVTCQPDGQT LLKSHRVNCD RGLRPSCPNS QSPVKVEETC GCRWTCPCVC 1951 1951 TGSSTRHIVT FDGQNFKLTG SCSYVLFQNK EQDLEVILHN GACSPGARQG TGSSTRHIVT FDGQNFKLTG SCSYVLFQNK EQDLEVILHN GACSPGARQG 2001 2001 CMKSIEVKHS ALSVEXHSDM EVTVNGRLVS VPYVGGNMEV NVYGAIMHEV CMKSIEVKHS ALSVEXHSDM EVTVNGRLVS VPYVGGNMEV NVYGAIMHEV 2051 2051 RFNHLGHIFT FTPQNNEFQL QLSPKTFASK TYGLCGICDE NGANDFMLRD RFNHLGHIFT FTPQNNEFQL QLSPKTFASK TYGLCGICDE NGANDFMLRD 2101 2101 GTVTTDWKTL VQEWTVQRPG QTCQPILEEQ CLVPDSSHCQ VLLLPLFAEC GTVTTDWKTL VQEWTVQRPG QTCQPILEEQ CLVPDSHCQ VLLLPFAEC 2151 2151 HKVLAPATFY AICQQDSCHQ EQVCEVIASY AHLCRTNGVC VDWRTPDFCA HKVLAPATFY AICQQDSCHQ EQVCEVIASY AHLCRTGNGVC VDWRTPDFCA 2201 2201 MSCPPSLVYN HCEHGCPRHC DGNVSSCGDH PSEGCFCPPD KVMLEGSCVP MSCPPSLVYN HCEHGCPRHC DGNVSSCGDH PSEGCFCPPD KVMLEGSCVP 2251 2251 EEACTQCIGE DGVQHQFLEA WVPDHQPCQI CTCLSGRKVN CTTQPCPTAK EEACTQCIGE DGVQHQFLEA WVPDHQPCQI CTCLSGRKVN CTTQPCPTAK 2301 2301 APTCGLCEVA RLRQNADQCC PEYECVCDPV SCDLPPVPHC ERGLQPTLTN APTCGLCEVA RLRQNADQCC PEYECVCDPV SCDLPPVPHC ERGLQPTLTN 2351 2351 PGECRPNFTC ACRKEECKRV SPPSCPPHRL PTLRKTQCCD EYECACNCVN PGECRPNFTC ACRKEECKRV SPPSCPPHRL PTLRKTQCCD EYECACNCVN 2401 2401 STVSCPLGYL ASTATNDCGC TTTTCLPDKV CVHRSTIYPV GQFWEEGCDV STVSCPLGYL ASTATNDCGC TTTTCLPDKV CVHRSTIYPV GQFWEEGCDV 2451 2451 CTCTDMEDAV MGLRVAQCSQ KPCEDSCRSG FTYVLHEGEC CGRCLPSACE CTCTDMEDAV MGLRVAQCSQ KPCEDSCRSG FTYVLHEGEC CGRCLPSACE 2501 2501 VVTGSPRGDS QSSWKSVGSQ WASPENPCLI NECVRVKEEV FIQQRNVSCP VVTGSPRGDS QSSWKSVGSQ WASPENPCLI NECVRVKEEV FIQQRNVSCP 2551 2551 QLEVPVCPSG FQLSCKTSAC CPSCRCERME ACMLNGTVIG PGKTVMIDVC QLEVPVCPSG FQLSCKTSAC CPSCRCERME ACMLNGTVIG PGKTVMIDVC 2601 2601 TTCRCMVQVG VISGFKLECR KTTCNPCPLG YKEENNTGEC CGRCLPTACT TTCRCMVQVG VISGFKLECR KTTCNPCPLG YKEENNTGEC CGRCLPTACT 2651 2651 IQLRGGQIMT LKRDETLQDG CDTHFCKVNE RGEYFWEKRV TGCPPFDEHK IQLRGGQIMT LKRDETLQDG CDTHFCKVNE RGEYFWEKRV TGCPPFDEHK 2701 2701 CLAEGGKIMKIPGTCCDTCE EPECNDITAR LQYVKVGSCK SEVEVDIHYC CLAEGGKIMKIPGTCCDTCE EPECNDITAR LQYVKVGSCK SEVEVDIHYC 2751 2751 QGKCASKAMY SIDINDVQDQ CSCCSPTRTE PMQVALHCTN GSVVYHEVLN QGKCASKAMY SIDINDVQDQ CSCCSPTRTE PMQVALHCTN GSVVYHEVLN 2801 2801 AMECKCSPRK CSK AMECKCSPRK CSK Нуклеотидная последовательность (SEQ ID NO: 20) Nucleotide sequence (SEQ ID NO: 20) Полоноразмерный Full size 1 1 ATGATTCCTG CCAGATTTGC CGGGGTGCTG CTTGCTCTGG ATGATTCCTG CCAGATTTGC CGGGGTGCTG CTTGCTCTGG

- 27 044115- 27 044115

ФВ FV СССТСАТТТТ 51 GCCAGGGACC CTTTGTGCAG AAGGAACTCG CGGCAGGTCA TCCACGGCCC 101 GATGCAGCCT TTTCGGAAGT GACTTCGTCА ACACCTTTGА TGGGAGCATG 151 ТACAGCTTTG CGGGATACTG СAGTTАССТС CTGGCAGGGG GCTGCCAGAA 201 ACGCTCCTTC TCG ATT ATTG GGG АСТТСС A G A ATGGC А AG AGAGTGAGCC 251 TCTCCGTGTA TCTTGGGGAA TTTTTTGACА ТССATTTGTT TGTCAATGGT 301 ACCGTGACAC AGGGGGACCA AAGAGTCTCC ATGCCCTATG CCTCCAAAGG 351 GCTGTATCTA GAAACTGAGG CTGGGTACTA CAAGCTGTCC GGTGAGGCCT 401 ATGGCTTTGT GGCCAGGATC GATGGCAGCG GCAACTTTCA AGTCCTGCTG 451 TCAGAC AGAT АСТТСААСАА GACCTGCGGG CTGTGTGGCA АСТТТААСАТ 501 CTTTGCTGAA GATGACTTTA TGACCCAAGA AGGGACCTTG ACCTCGGACC 551 CTTATGACTT TGCCAACTCA TGGGCTCTGA GCAGTGGAGA ACAGTGGTGT 601 GAACGGGCAT CTCCTCCCAG CAGCTCATGC ААСАТСТССТ CTGGGGAAAT 651 GCAGAAGGGC CTGTGGGAGC AGTGCCAGCT TCTGAAGAGC ACCTCGGTGT 701 TTGCCCGCTG CCACCCTCTG GTGGACCCCG AGCCTTTTGT GGCCCTGTGT 751 GAGAAGАСТТ TGTGTGAGTG TGCTGGGGGG CTGGAGTGCG CCTGCCCTGC 801 CCTCCTGGAG TACGCCCGGA CCTGTGCCCA GGAGGGAATG GTGCTGTACG 851 GCTGGACCGA ССACAGCGCG TGCAGCCCAG TGTGCCCTGC TGGTATGGAG 901 TATAGGCAGT GTGTGTCCCC TTGCGCCAGG ACCTGCCAGA GCCTGCACAT 951 СAATGAAATG TGTCAGGAGC GATGCGTGGA TGGCTGCAGC TGCCCTGAGG 1001 GACAGCTCCT GGATGAAGGC CTCTGCGTGG AGAGCACCGА GTGTCCCTGC 1051 GTGCATTCCG GAAAGCGCTA CCCTCCCGGC АССТСССТСТ SSSTSATTTTT 51 GCCAGGGACC CTTTGTGCAG AAGGAACTCG CGGCAGGTCA TCCACGGCCC 101 GATGCAGCCT TTTCGGAAGT GACTTCGTCА ACACCTTTGА TGGGAGCATG 151 TACAGCTTTG CGGGATACTG CAGTTASSTS CTGGCAGGGG GCTGCCAGAA 201 ACGCTCCTTC TCG ATT ATTG GGG ACTTCC A G A ATGGC A AG AGAGTGAGCC 251 TCTCCGTGTA TCTTGGGGAA TTTTTTGACA TCSATTTGTT TGTCAATGGT 301 ACCGTGACAC AGGGGGACCA AAGAGTCTCC ATGCCCTATG CCTCCAAAGG 351 GCTGTATCTA GAAACTGAGG CTGGGTACTA CAAGCTGTCC GGTGAGGCCT 401 ATGGCTTTGT GGCCAGGATC GATGGCAGCG GCAACTTTCA AGTCCTGCTG 451 TCAGAC AGAT ASTTSAASAA GACCTGCGGG CTGTGTGGCA ASTTTAASAT 501 CTTTGCTGAA GATGACTTTA TGACCCAAGA AGGGACCTTG ACCTCGGACC 551 CTTATGACTT TGCCAACTCA TGGGCTCTGA GCAGTGGAGA ACAGTGGTGT 601 GAACGGGCAT CTCCTCCCAG CAGCTCATGC AACATTSST CTGGGGAAAT 651 GCAGAAGGGC CTGTGGGAGC AGTGCCAGCT TCTGAAGAGC ACCTCGGTGT 701 TTGCCCGCTG CCACCCTCTG GTGGACCCCG AGCCTTTTGT GGCCCTGTGT 751 GAGAAGASTT TGTGTGAGTG TGCTGGGGGG CTGGAGTGCG CCTGCCCTGC 801 CCTCCTGGAG TACGCCCGGA CCTGTGCCCA GGAGGGAATG GTGCTGTACG 851 GCTGGACCGA CCACAGCGCG TGCAGCCCAG TGTGCCCTGC TGGTATGGAG 901 TATAGGCAGT GTGTGTCCCC TTGCGCCAGG ACCTGCCAGA GCCTGCACAT 951 CAATGAAATG TGTCAGGAGC GATGCGTGGA TGGCTGCAGC TGCCCTGAGG 1001 GACAGCTCCT GGATGAAGGC CTCTGCGTGG AGAGCACCGA GTGTCCCTGC 1051 GTGCATTCCG GAAAGCGCTA CCCTCCCGGC ACCTSSSSTST

- 28 044115- 28 044115

CTCGAGACTGCTCGAGACTG

1101 CAACACCTGC ATTTGCCGAA ACAGCCAGTG GATCTGCAGC AATGAAGAAT1101 CAACACCTGC ATTTGCCGAA ACAGCCAGTG GATCTGCAGC AATGAAGAAT

1151 GTCC AGGGG A GTGCCTTGTC ACTGGTC A AT ССС ACTTC A A GAGCTTTGAC1151 GTCC AGGGG A GTGCCTTGTC ACTGGTC A AT CCC ACTTC A A GAGCTTTGAC

1201 A AC AG AT ACT ТС ACCTTC AG TGGG ATCTGC CAGT ACCTGC TGGCCCGGGA1201 A AC AG AT ACT TC ACCTTC AG TGGG ATCTGC CAGT ACCTGC TGGCCCGGGA

1251 TTGCCAGGAC СACTCCTTCT CCATTGTCAT TGAGACTGTC CAGTGTGCTG1251 TTGCCAGGAC СACTCCTTCT CCATTGTCAT TGAGACTGTC CAGTGTGCTG

1301 ATGACCGCGA CGCTGTGTGC ACCCGCTCCG TCACCGTCCG GCTGCCTGGC1301 ATGACCGCGA CGCTGTGTGC ACCCGCTCCG TCACCGTCCG GCTGCCTGGC

1351 CTGCACAACA GCCTTGTGAA ACTGAAGCAT GGGGCAGGAG TTGCCATGGA1351 CTGCACAACA GCCTTGTGAA ACTGAAGCAT GGGGCAGGAG TTGCCATGGA

1401 TGGCCAGGAC ATCCAGCTCC CCCTCCTGAA AGGTGACCTC CGCATCCAGC1401 TGGCCAGGAC ATCCAGCTCC CCCTCCTGAA AGGTGACCTC CGCATCCAGC

1451 ATACAGTGAC GGCCTCCGTG CGCCTCAGCT ACGGGGAGGA CCTGCAGATG1451 ATACAGTGAC GGCCTCCGTG CGCCTCAGCT ACGGGGAGGA CCTGCAGATG

1501 GACTGGGATG GCCGCGGGAG GCTGCTGGTG AAGCTGTCCC CCGTCTATGC1501 GACTGGGATG GCCGCGGGAG GCTGCTGGTG AAGCTGTCCC CCGTCTATGC

1551 CGGGAAGACC TGCGGCCTGT GTGGGAATTA CAATGGCAAC CAGGGCGACG1551 CGGGAAGACC TGCGGCCTGT GTGGGAATTA CAATGGCAAC CAGGGCGACG

1601 ACTTCCTTAC CCCCTCTGGG CTGGCRGAGC CCCGGGTGGA GGACTTCGGG1601 ACTTCCTTAC CCCCTCTGGG CTGGCRGAGC CCCGGGTGGA GGACTTCGGG

1651 A ACGCCTGG A AGCTGC ACGG GG ACTGCC AG G ACCTGC AG A AGCAGCACAG1651 A ACGCCTGG A AGCTGC ACGG GG ACTGCC AG G ACCTGC AG A AGCAGCACAG

1701 CGATCCCTGC GCCCTCAACC CGCGCATGAC CAGGTTCTCC GAGGAGGCGT1701 CGATCCCTGC GCCCTCAACC CGCGCATGAC CAGGTTCTCC GAGGAGGCGT

1751 GCGCGGTCCT GACGTCCCCC ACATTCGAGG CCTGCCATCG TGCCGTCAGC1751 GCGCGGTCCT GACGTCCCCC ACATTCGAGG CCTGCCATCG TGCCGTCAGC

1801 CCGCTGCCCT ACCTGCGGAA CTGCCGCTAC GACGTGTGCT CCTGCTCGGA1801 CCGCTGCCCT ACCTGCGGAA CTGCCGCTAC GACGTGTGCT CCTGCTCGGA

1851 CGGCCGCGAG TGCCTGTGCG GCGCCCTGGC CAGCTATGCC GCGGCCTGCG1851 CGGCCGCGAG TGCCTGTGCG GCGCCCTGGC CAGCTATGCC GCGGCCTGCG

1901 CGGGGAGAGG CGTGCGCGTC GCGTGGCGCG AGCCAGGCCG CTGTGAGCTG1901 CGGGGAGAGG CGTGCGCGTC GCGTGGCGCG AGCCAGGCCG CTGTGAGCTG

1951 AACTGCCCGA AAGGCCAGGT GTACCTGCAG TGCGGGACCC CCTGCAACCT1951 AACTGCCCGA AAGGCCAGGT GTACCTGCAG TGCGGGACCC CCTGCAACCT

2001 G ACCTGCCGC TCTCTCTCTT ACCCGG ATG A GG A ATGC A AT GAGGCCTGCC2001 G ACCTGCCGC TCTCTCTCTT ACCCGG ATG A GG A ATGC A AT GAGGCCTGCC

2051 TGGAGGGCTG CTTCTGCCCC CCAGGGCTCT ACATGGATGA GAGGGGGGAC2051 TGGAGGGCTG CTTCTGCCCC CCAGGGCTCT ACATGGATGA GAGGGGGGAC

2101 TGCGTGCCCA AGGCCCAGTG CCCCTGTTAC TATGACGGTG2101 TGCGTGCCCA AGGCCCAGTG CCCCTGTTAC TATGACGGTG

- 29 044115- 29 044115

AGATCTTCCAAGATCTTCCA

2151 GCC AG A AG AC ATCTTCTC AG ACC АТС AC AC C ATGTGCT AC TGTGAGGATG2151 GCC AG A AG AC ATCTTCTC AG ACC ATC AC AC C ATGTGCT AC TGTGAGGATG

2201 GCTTCATGCA CTGTACCATG AGTGGAGTCC CCGGAAGCTT GCTGCCTGAC2201 GCTTCATGCA CTGTACCATG AGTGGAGTCC CCGGAAGCTT GCTGCCTGAC

2251 GCTGTCCTCA GCAGTCCCCT GTCTCATCGC AGCAAAAGGA GCCTATCCTG2251 GCTGTCCTCA GCAGTCCCCT GTCTCATCGC AGCAAAAGGA GCCTATCCTG

2301 TCGGCCCCCC ATGGTCAAGC TGGTGTGTCC CGCTGACAAC CTGCGGGCTG2301 TCGGCCCCCC ATGGTCAAGC TGGTGTGTCC CGCTGACAAC CTGCGGGCTG

2351 AAGGGCTCGA GTGTACCAAA ACGTGCCAGA ACTATGACCT GGAGTGCATG2351 AAGGGCTCGA GTGTACCAAA ACGTGCCAGA ACTATGACCT GGAGTGCATG

2401 AGCATGGGCT GTGTCTCTGG CTGCCTCTGC CCCCCGGGCA TGGTCCGGCA2401 AGCATGGGCT GTGTCTCTGG CTGCCTCTGC CCCCCGGGCA TGGTCCGGCA

2451 TGAGAAC AG A TGTGTGGCCC TGGAAAGGTG TCCCTGCTTC CATCAGGGCA2451 TGAGAAC AG A TGTGTGGCCC TGGAAAGGTG TCCCTGCTTC CATCAGGGCA

2501 AGGAGTATGC CCCTGGAGAA ACAGTGAAGA TTGGCTGCAA CACTTGTGTC2501 AGGAGTATGC CCCTGGAGAA ACAGTGAAGA TTGGCTGCAA CACTTGTGTC

2551 TGTCGGGACC GGAAGTGGAA CTGCACAGAC CATGTGTGTG ATGCCACGTG2551 TGTCGGGACC GGAAGTGGAA CTGCACAGAC CATGTGTGTG ATGCCACGTG

2601 CTCCACGATC GGCATGGCCC ACTACCTCAC CTTCGACGGG CTCAAATACC2601 CTCCACGATC GGCATGGCCC ACTACCTCAC CTTCGACGGG CTCAAAATACC

2651 TGTTCCCCGG GGAGTGCCAG TACGTTCTGG TGCAGGATTA CTGCGGCAGT2651 TGTTCCCCGG GGAGTGCCAG TACGTTCTGG TGCAGGATTA CTGCGGCAGT

2701 A ACCCTGGG A CCTTTCGG AT CCT AGTGGGG A AT A AGGG AT GCAGCCACCC2701 A ACCCTGGG A CCTTTCGG AT CCT AGTGGGG A AT A AGGG AT GCAGCCACCC

2751 CTCAGTGAAA TGCAAGAAAC GGGTCACCAT CCTGGTGGAG GGAGGAGAGA2751 CTCAGTGAAA TGCAAGAAAC GGGTCACCAT CCTGGTGGAG GGAGGAGAGA

2801 TTGAGCTGTT TGACGGGGAG GTGAATGTGA AGAGGCCC AT GAAGGATGAG2801 TTGAGCTGTT TGACGGGGAG GTGAATGTGA AGAGGCCC AT GAAGGATGAG

2851 ACTCACTTTG AGGTGGTGGA GTCTGGCCGG TACATCATTC TGCTGCTGGG2851 ACTCACTTTG AGGTGGTGGA GTCTGGCCGG TACATCATTC TGCTGCTGGG

2901 C A A AGCCCTC TCCGTGGTCT GGG ACCGCC A CCTG AGC АТС TCCGTGGTCC2901 C A A AGCCCTC TCCGTGGTCT GGG ACCGCC A CCTG AGC ATC TCCGTGGTCC

2951 TGAAGCAGAC ATACCAGGAG AAAGTGTGTG GCCTGTGTGG GAATTTTGAT2951 TGAAGCAGAC ATACCAGGAG AAAGTGTGTG GCCTGTGTGG GAATTTTGAT

3001 GGC ATCC AG A AC AATG ACCT C ACC AGC AGC AACCTCC AAG TGGAGGAAGA3001 GGC ATCC AG A AC AATG ACCT C ACC AGC AGC AACCTCC AAG TGGAGGAAGA

3051 CCCTGTGGAC TTTGGGAACT CCTGGAAAGT GAGCTCGCAG TGTGCTGACA3051 CCCTGTGGAC TTTGGGAACT CCTGGAAAGT GAGCTCGCAG TGTGCTGACA

3101 CCAGAAAAGT GCCTCTGGAC TCATCCCCTG CCACCTGCCA TAACAACATC3101 CCAGAAAAGT GCCTCTGGAC TCATCCCCTG CCACCTGCCA TAACAACATC

3151 ATG A AGC AG A CG ATGGTGG A TTCCTCCTGT AG A ATCCTT A3151 ATG A AGC AG A CG ATGGTGG A TTCCTCCTGT AG A ATCCTT A

- 30 044115- 30 044115

CCAGTGACGTCCAGTGACGT

3201 CTTCCAGGAC TGCAACAAGC TGGTGGACCC CGAGCCATAT CTGGATGTCT3201 CTTCCAGGAC TGCAACAAGC TGGTGGACCC CGAGCCATAT CTGGATGTCT

3251 GCATTTACGA CACCTGCTCC TGTGAGTCCA TTGGGGACTG CGCCTGCTTC3251 GCATTTACGA CACCTGCTCC TGTGAGTCCA TTGGGGACTG CGCCTGCTTC

3301 TGCGACACCA TTGCTGCCTA TGCCCACGTG TGTGCCCAGC ATGGCAAGGT3301 TGCGACACCA TTGCTGCCTA TGCCCACGTG TGTGCCCAGC ATGGCAAGGT

3351 GGTGACCTGG AGGACGGCCA CATTGTGCCC CCAGAGCTGC GAGGAGAGGA3351 GGTGACCTGG AGGACGGCCA CATTGTGCCC CCAGAGCTGC GAGGAGAGGA

3401 ATCTCCGGGA GAACGGGTAT GAGTGTGAGT GGCGCTATAA CAGCTGTGCA3401 ATCTCCGGGA GAACGGGTAT GAGTGTGAGT GGCGCTATAA CAGCTGTGCA

3451 CCTGCCTGTC AAGTCACGTG TCAGCACCCT GAGCCACTGG CCTGCCCTGT3451 CCTGCCTGTC AAGTCACGTG TCAGCACCCT GAGCCACTGG CCTGCCTGT

3501 GCAGTGTGTG GAGGGCTGCC ATGCCCACTG CCCTCCAGGG AAAATCCTGG3501 GCAGTGTGTG GAGGGCTGCC ATGCCCACTG CCCTCCAGGG AAAATCCTGG

3551 ATGAGCTTTT GCAGACCTGC GTTGACCCTG AAGACTGTCC AGTGTGTGAG3551 ATGAGCTTTT GCAGACCTGC GTTGACCCTG AAGACTGTCC AGTGTGTGAG

3601 GTGGCTGGCC GGCGTTTTGC CTCAGGAAAG AAAGTCACCT TGAATCCCAG3601 GTGGCTGGCC GGCGTTTTGC CTCAGGAAAG AAAGTCACCT TGAATCCCAG

3651 TGACCCTGAG CACTGCCAGA TTTGCCACTG TGATGTTGTC AACCTCACCT3651 TGACCCTGAG CACTGCCAGA TTTGCCACTG TGATGTTGTC AACCTCACCT

3701 GTGAAGCCTG CCAGGAGCCG GGAGGCCTGG TGGTGCCTCC CACAGATGCC3701 GTGAAGCCTG CCAGGAGCCG GGAGGCCTGG TGGTGCCTCC CACAGATGCC

3751 CCGGTGAGCC CCACCACTCT GTATGTGGAG GACATCTCGG AACCGCCGTT3751 CCGGTGAGCC CCACCACTCT GTATGTGGAG GACATCTCGG AACCGCCGTT

3801 GCACGATTTC TACTGCAGCA GGCTACTGGA CCTGGTCTTC CTGCTGGATG3801 GCACGATTTC TACTGCAGCA GGCTACTGGA CCTGGTCTTC CTGCTGGATG

3851 GCTCCTCCAG GCTGTCCGAG GCTGAGTTTG AAGTGCTGAA GGCCTTTGTG3851 GCTCCTCCAG GCTGTCCGAG GCTGAGTTTG AAGTGCTGAA GGCCTTTGTG

3901 GTGGACATGA TGGAGCGGCT GCGCATCTCC CAGAAGTGGG TCCGCGTGGC3901 GTGGACATGA TGGAGCGGCT GCGCATCTCC CAGAAGTGGG TCCGCGTGGC

3951 CGTGGTGGAG TACCACGACG GCTCCCACGC CTACATCGGG CTCAAGGACC3951 CGTGGTGGAG TACCACGACG GCTCCCACGC CTACATCGGG CTCAAGGACC

4001 GGAAGCGACC GTCAGAGCTG CGGCGCATTG CCAGCCAGGT GAAGTATGCG4001 GGAAGCGACC GTCAGAGCTG CGGCGCATTG CCAGCAGGT GAAGTATGCG

4051 GGCAGCCAGG TGGCCTCCAC CAGCGAGGTC TTGAAATACA CACTGTTCCA4051 GGCAGCCAGG TGGCCTCCAC CAGCGAGGTC TTGAAATACA CACTGTTCCA

4101 A ATCTTC AGC A AG ATCG ACC GCCCTG A AGC CTCCCGC АТС GCCCTGCTCC4101 A ATCTTC AGC A AG ATCG ACC GCCCTG A AGC CTCCCGC ATC GCCCTGCTCC

4151 TGATGGCCAG CCAGGAGCCC CAACGGATGT CCCGGAACTT TGTCCGCTAC4151 TGATGGCCAG CCAGGAGCCC CAACGGATGT CCCGGAACTT TGTCCGCTAC

4201 GTCC AGGGCC TGA AG A AG A A G A AGGTC ATT GTG ATCCCGG4201 GTCC AGGGCC TGA AG A AG A A G A AGGTC ATT GTG ATCCCGG

- 31 044115- 31 044115

TGGGCATTGGTGGGCATTGG

4251 GCCCCATGCC AACCTCAAGC AGATCCGCCT CATCGAGAAG CAGGCCCCTG4251 GCCCCATGCC AACCTCAAGC AGATCCGCCT CATCGAGAAG CAGGCCCCTG

4301 AGAACAAGGC CTTCGTGCTG AGCAGTGTGG ATGAGCTGGA GCAGCAAAGG4301 AGAACAAGGC CTTCGTGCTG AGCAGTGTGG ATGAGCTGGA GCAGCAAAGG

4351 GACGAGATCG TTAGCTACCT CTGTGACCTT GCCCCTGAAG CCCCTCCTCC4351 GACGAGATCG TTAGCTACCT CTGTGACCTT GCCCCTGAAG CCCCTCCTCC

4401 TACTCTGCCC CCCGACATGG CACAAGTCAC TGTGGGCCCG GGGCTCTTGG4401 TACTCTGCCC CCCGACATGG CACAAGTCAC TGTGGGCCCG GGGCTCTTGG

4451 GGGTTTCGAC CCTGGGGCCC AAGAGGAACT CCATGGTTCT GGATGTGGCG4451 GGGTTTCGAC CCTGGGGCCC AAGAGGAACT CCATGGTTCT GGATGTGGCG

4501 TTCGTCCTGG AAGGATCGGA CAAAATTGGT GAAGCCGACT TCAACAGGAG4501 TTCGTCCTGG AAGGATCGGA CAAAATTGGT GAAGCCGACT TCAACAGGAG

4551 CAAGGAGTTC ATGGAGGAGG TGATTCAGCG GATGGATGTG GGCCAGGACA4551 CAAGGAGTTC ATGGAGGAGG TGATTCAGCG GATGGATGTG GGCCAGGACA

4601 GCATCCACGT CACGGTGCTG CAGTACTCCT AC ATGGTGAC CGTGGAGTAC4601 GCATCCACGT CACGGTGCTG CAGTACTCCT AC ATGGTGAC CGTGGAGTAC

4651 CCCTTCAGCG AGGCACAGTC CAAAGGGGAC ATCCTGCAGC GGGTGCGAGA4651 CCCTTCAGCG AGGCACAGTC CAAAGGGGAC ATCCTGCAGC GGGTGCGAGA

4701 GATCCGCTAC CAGGGCGGCA ACAGGACCAA CACTGGGCTG GCCCTGCGGT4701 GATCCGCTAC CAGGGCGGCA ACAGGACCAA CACTGGGCTG GCCCTGCGGT

4751 ACCTCTCTGA CCACAGCTTC TTGGTCAGCC AGGGTGACCG GGAGCAGGCG4751 ACCTCTCTGA CCACAGCTTC TTGGTCAGCC AGGGTGACCG GGAGCAGGCG

4801 CCCAACCTGG TCTACATGGT CACCGGAAAT CCTGCCTCTG ATGAGATCAA4801 CCCAACCTGG TCTACATGGT CACCGGAAAT CCTGCCTCTG ATGAGATCAA

4851 GAGGCTGCCT GGAGACATCC AGGTGGTGCC CATTGGAGTG GGCCCTAATG4851 GAGGCTGCCT GGAGACATCC AGGTGGTGCC CATTGGAGTG GGCCTAATG

4901 CCAACGTGCA GGAGCTGGAG AGGATTGGCT GGCCCAATGC CCCTATCCTC4901 CCAACGTGCA GGAGCTGGAG AGGATTGGCT GGCCCAATGC CCCTATCCTC

4951 ATCC AGG ACT TTGAG ACGCT CCCCCGAGAG GCTCCTGACC TGGTGCTGCA4951 ATCC AGG ACT TTGAG ACGCT CCCCCGAGAG GCTCCTGACC TGGTGCTGCA

5001 GAGGTGCTGC TCCGGAGAGG GGCTGCAGAT CCCCACCCTC TCCCCTGCAC5001 GAGGTGCTGC TCCGGAGAGG GGCTGCAGAT CCCCACCCTC TCCCCTGCAC

5051 CTGACTGCAG CCAGCCCCTG GACGTGATCC TTCTCCTGGA TGGCTCCTCC5051 CTGACTGCAG CCAGCCCCTG GACGTGATCC TTCTCCTGGA TGGCTCCTCC

5101 AGTTTCCC AG CTTCTT ATTT TG ATGA A ATG A AG AGTTTCG CCAAGGCTTT5101 AGTTTCCC AG CTTCTT ATTT TG ATGA A ATG A AG AGTTTCG CCAAGGCTTT

5151 С ATTTCAAAA GCC AAT AT AG GGCCTCGTCT С ACTC AGGTG TCAGTGCTGC5151 C ATTTCAAAA GCC AAT AT AG GGCCTCGTCT C ACTC AGGTG TCAGTGCTGC

5201 AGTATGGAAG CATCACCACC ATTGACGTGC CATGGAACGT GGTCCCGGAG5201 AGTATGGAAG CATCACCACC ATTGACGTGC CATGGAACGT GGTCCCGGAG

5251 AAAGCCCATT TGCTGAGCCT TGTGGACGTC ATGCAGCGGG5251 AAAGCCCATT TGCTGAGCCT TGTGGACGTC ATGCAGCGGG

- 32 044115- 32 044115

AGGGAGGCCCAGGGAGGCCC

5301 CAGCCAAATC GGGGATGCCT TGGGCTTTGC TGTGCGATAC TTGACTTCAG5301 CAGCCAAATC GGGGATGCCT TGGGCTTTGC TGTGCGATAC TTGACTTCAG

5351 AAATGCATGG TGCCAGGCCG GGAGCCTCAA AGGCGGTGGT CATCCTGGTC5351 AAATGCATGG TGCCAGGCCG GGAGCCTCAA AGGCGGTGGT CATCCTGGTC

5401 ACGGACGTCT CTGTGGATTC AGTGGATGCA GCAGCTGATG CCGCCAGGTC5401 ACGGACGTCT CTGTGGATTC AGTGGATGCA GCAGCTGATG CCGCCAGGTC

5451 СAACAGAGTG ACAGTGTTCC CTATTGGAAT TGGAGATCGC TACGATGCAG5451 CAACAGAGTG ACAGTGTTCC CTATTGGAAT TGGAGATCGC TACGATGCAG

5501 CCCAGCTACG GATCTTGGCA GGCCCAGCAG GCGACTCCAA CGTGGTGAAG5501 CCCAGCTACG GATCTTGGCA GGCCCAGCAG GCGACTCCAA CGTGGTGAAG

5551 CTCCAGCGAA TCGAAGACCT CCCTACCATG GTCACCTTGG GCAATTCCTT5551 CTCCAGCGAA TCGAAGACCT CCCTACCATG GTCACCTTGG GCAATTCCTT

5601 CCTCC AC AAA CTGTGCTCTG GATTTGTTAG GATTTGC ATG GATGAGGATG5601 CCTCC AC AAA CTGTGCTCTG GATTTGTTAG GATTTGC ATG GATGAGGATG

5651 GGAATGAGAA GAGGCCCGGG GACGTCTGGA CCTTGCCAGA CCAGTGCCAC5651 GGAATGAGAA GAGGCCCGGG GACGTCTGGA CCTTGCCAGA CCAGTGCCAC

5701 ACCGTGACTT GCCAGCCAGA TGGCCAGACC TTGCTGAAGA GTCATCGGGT5701 ACCGTGACTT GCCAGCCAGA TGGCCAGACC TTGCTGAAGA GTCATCGGGT

5751 CAACTGTGAC CGGGGGCTGA GGCCTTCGTG CCCTAACAGC CAGTCCCCTG5751 CAACTGTGAC CGGGGGCTGA GGCCTTCGTG CCCTAACAGC CAGTCCCCTG

5801 TTAAAGTGGA AGAGACCTGT GGCTGCCGCT GGACCTGCCC CTGYGTGTGC5801 TTAAAGTGGA AGAGACCTGT GGCTGCCGCT GGACCTGCCC CTGYGTGTGC

5851 ACAGGCAGCT CCACTCGGCA CATCGTGACC TTTGATGGGC AGAATTTCAA5851 ACAGGCAGCT CCACTCGGCA CATCGTGACC TTTGATGGGC AGAATTTCAA

5901 GCTGACTGGC AGCTGTTCTT ATGTCCTATT ТСААААСAAG GAGCAGGACC5901 GCTGACTGGC AGCTGTTCTT ATGTCCTATT TCAAAACAAG GAGCAGGACC

5951 TGGAGGTGAT TCTCCATAAT GGTGCCTGCA GCCCTGGAGC AAGGCAGGGC5951 TGGAGGTGAT TCTCCATAAT GGTGCCTGCA GCCCTGGAGC AAGGCAGGGC

6001 TGC ATG A A AT CC ATCG AGGT GA AGC AC AGT GCCCTCTCCG TCGAGSTGCA6001 TGC ATG A A AT CC ATCG AGGT GA AGC AC AGT GCCCTCTCCG TCGAGSTGCA

6051 CAGTGACATG GAGGTGACGG TGAATGGGAG ACTGGTCTCT GTTCCTTACG6051 CAGTGACATG GAGGTGACGG TGAATGGGAG ACTGGTCTCT GTTCCTTACG

6101 TGGGTGGG AA C ATGGA AGTC A ACGTTT ATG GTGCC АТС AT GCATGAGGTC6101 TGGGTGGG AA C ATGGA AGTC A ACGTTT ATG GTGCC ATC AT GCATGAGGTC

6151 AG ATTC AATC ACCTTGGTC A С ATCTTC AC A TTC ACTCC AC AAAACAATGA6151 AG ATTC AATC ACCTTGGTC A C ATCTTC AC A TTC ACTCC AC AAAACAATGA

6201 GTTCC A ACTG C AGCTC AGCC CC A AG ACTTT TGCTTC A A AG ACGTATGGTC6201 GTTCC A ACTG C AGCTC AGCC CC A AG ACTTT TGCTTC A A AG ACGTATGGTC

6251 TGTGTGGGAT CTGTGATGAG AACGGAGCCA ATGACTTCAT GCTGAGGGAT6251 TGTGTGGGAT CTGTGATGAG AACGGAGCCA ATGACTTCAT GCTGAGGGAT

6301 GGC AC AGTC A CC AC AG ACTG GAAAAC ACTT GTTCAGGAAT6301 GGC AC AGTC A CC AC AG ACTG GAAAAC ACTT GTTCAGGAAT

- 33 044115- 33 044115

GGACTGTGCAGGACTGTGCA

6351 GCGGCCAGGG CAGACGTGCC AGCCCATCCT GGAGGAGCAG TGTCTTGTCC6351 GCGGCCAGGG CAGACGTGCC AGCCCATCCT GGAGGAGCAG TGTCTTGTCC

6401 CCGACAGCTC CCACTGCCAG GTCCTCCTCT TACCACTGTT TGCTGAATGC6401 CCGACAGCTC CCACTGCCAG GTCCTCCTCT TACCACTGTT TGCTGAATGC

6451 C AC AAGGTCC TGGCTCC AGC С AC ATTCTAT GCCATCTGCC AGCAGGACAG6451 C AC AAGGTCC TGGCTCC AGC C AC ATTCTAT GCCATCTGCC AGCAGGACAG

6501 TTGCCACC AG G AGC AAGTGT GTGAGGTGAT CGCCTCTTAT GCCCACCTCT6501 TTGCCACC AG G AGC AAGTGT GTGAGGTGAT CGCCTCTTAT GCCCACCTCT

6551 GTCGGACCAA CGGGGTCTGC GTTGACTGGA GGACACCTGA TTTCTGTGCT6551 GTCGGACCAA CGGGGTCTGC GTTGACTGGA GGACACCTGA TTTCTGTGCT

6601 ATGTCATGCC CACCATCTCT GGTCTACAAC CACTGTGAGC ATGGCTGTCC6601 ATGTCATGCC CACCATCTCT GGTCTACAAC CACTGTGAGC ATGGCTGTCC

6651 CCGGCACTGT GATGGCAACG TGAGCTCCTG TGGGGACCAT CCCTCCGAAG6651 CCGGCACTGT GATGGCAACG TGAGCTCCTG TGGGGACCAT CCCTCCGAAG

6701 GCTGTTTCTG CCCTCC AG AT A A AGTC ATGT TGG A AGGC AG CTGTGTCCCT6701 GCTGTTTCTG CCCTCC AG AT A A AGTC ATGT TGG A AGGC AG CTGTGTCCCT

6751 GAAGAGGCCT GCACTCAGTG CATTGGTGAG GATGGAGTCC AGCACCAGTT6751 GAAGAGGCCT GCACTCAGTG CATTGGTGAG GATGGAGTCC AGCACCAGTT

6801 CCTGGAAGCC TGGGTCCCGG ACCACCAGCC CTGTCAGATC TGCACATGCC6801 CCTGGAAGCC TGGGTCCCGG ACCACCAGCC CTGTCAGATC TGCACATGCC

6851 TCAGCGGGCG GAAGGTCAAC TGCACAACGC AGCCCTGCCC CACGGCCAAA6851 TCAGCGGGCG GAAGGTCAAC TGCACAACGC AGCCCTGCCC CACGGCCAAA

6901 GCTCCCACGT GTGGCCTGTG TGAAGTAGCC CGCCTCCGCC AGAATGCAGA6901 GCTCCCACGT GTGGCCTGTG TGAAGTAGCC CGCCTCCGCC AGAATGCAGA

6951 CCAGTGCTGC CCCGAGTATG AGTGTGTGTG TGACCCAGTG AGCTGTGACC6951 CCAGTGCTGC CCCGAGTATG AGTGTGTGTG TGACCCAGTG AGCTGTGACC

7001 TGCCCCCAGT GCCTCACTGT GAACGTGGCC TCCAGCCCAC ACTGACCAAC7001 TGCCCCCAGT GCCTCACTGT GAACGTGGCC TCCAGCCCAC ACTGACCAAC

7051 CCTGGCGAGT GCAGACCCAA CTTCACCTGC GCCTGCAGGA AGGAGGAGTG7051 CCTGGCGAGT GCAGACCCAA CTTCACCTGC GCCTGCAGGA AGGAGGAGTG

7101 C A A A AG AGTG TCCCC ACCCT CCTGCCCCCC GC ACCGTTTG CCCACCCTTC7101 C A A A AG AGTG TCCCC ACCCT CCTGCCCCCC GC ACCGTTTG CCCACCCTTC

7151 GG A AG ACCC A GTGCTGTG AT G AGT ATG AGT GTGCCTGC A A CTGTGTCAAC7151 GG A AG ACCC A GTGCTGTG AT G AGT ATG AGT GTGCCTGC A A CTGTGTCAAC

7201 TCCACAGTGA GCTGTCCCCT TGGGTACTTG GCCTCAACCG CCACCAATGA7201 TCCACAGTGA GCTGTCCCCT TGGGTACTTG GCCTCAACCG CCACCAATGA

7251 CTGTGGCTGT ACC AC AACC A CCTGCCTTCC CG AC AAGGTG TGTGTCCACC7251 CTGTGGCTGT ACC AC AACC A CCTGCCTTCC CG AC AAGGTG TGTGTCCACC

7301 GAAGC ACC AT CT ACCCTGTG GGCC AGTTCT GGG AGG AGGG CTGCGATGTG7301 GAAGC ACC AT CT ACCCTGTG GGCC AGTTCT GGG AGG AGGG CTGCGATGTG

7351 TGCACCTGCA CCGACATGGA GGATGCCGTG ATGGGCCTCC7351 TGCACCTGCA CCGACATGGA GGATGCCGTG ATGGGCCTCC

- 34 044115- 34 044115

GCGTGGCCCAGCGTGGCCCA

7401 GTGCTCCCAG AAGCCCTGTG AGGACAGCTG TCGGTCGGGC7401 GTGCTCCCAG AAGCCCTGTG AGGACAGCTG TCGGTCGGGC

TTCACTTACGTTCACTTACG

7451 TTCTGCATGA AGGCGAGTGC TGTGGAAGGT GCCTGCCATC7451 TTCTGCATGA AGGCGAGTGC TGTGGAAGGT GCCTGCCATC

TGCCTGTGAGTGCCTGTGAG

7501 GTGGTGACTG GCTCACCGCG GGGGGACTCC CAGTCTTCCT7501 GTGGTGACTG GCTCACCGCG GGGGGACTCC CAGTCTTCCT

GGAAGAGTGTGGAAGAGTGT

7551 CGGCTCCCAG TGGGCCTCCC CGGAGAACCC CTGCCTCATC7551 CGGCTCCCAG TGGGCCTCCC CGGAGAACCC CTGCCTCATC

AATGAGTGTGAATGAGTGTG

7601 TCCG AGTG A A GG AGG AGGTC TTT AT AC A AC A A AGG A ACGT7601 TCCG AGTG A A GG AGG AGGTC TTT AT AC A AC A A AGG A ACGT

CTCCTGCCCCCTCCTGCCCC

7651 CAGCTGGAGG TCCCTGTCTG CCCCTCGGGC TTTCAGCTGA7651 CAGCTGGAGG TCCCTGTCTG CCCCTCGGGC TTTCAGCTGA

GCTGTAAGACGCTGTAAGAC

7701 CTCAGCGTGC TGCCCAAGCT GTCGCTGTGA GCGCATGGAG7701 CTCAGCGTGC TGCCCAAGCT GTCGCTGTGA GCGCATGGAG

GCCTGCATGCGCCTGCATGC

7751 TCAATGGCAC TGTCATTGGG CCCGGGAAGA CTGTGATGAT7751 TCAATGGAC TGTCATTGGG CCCGGGAAGA CTGTGATGAT

CGATGTGTGCCGATGTGTGC

7801 ACGACCTGCC GCTGCATGGT GCAGGTGGGG GTCATCTCTG7801 ACGACCTGCC GCTGCATGGT GCAGGTGGGG GTCATCTCTG

GATTCAAGCTGATTCAAGCT

7851 GGAGTGCAGG AAGACCACCT GCAACCCCTG CCCCCTGGGT7851 GGAGTGCAGG AAGACCACCT GCAACCCCTG CCCCCTGGGT

TACAAGGAAGTACAAGGAAG

7901 A A A AT A AC AC AGGTG A ATGT TGTGGG AG AT GTTTGCCT AC7901 A A A AT A AC AC AGGTG A ATGT TGTGGG AG AT GTTTGCCT AC

GGCTTGCACCGGCTTGCACC

7951 ATTCAGCTAA GAGGAGGАСА GATCATGACA CTGAAGCGTG7951 ATTCAGCTAA GAGGAGGACA GATCATGACA CTGAAGCGTG

ATGAGACGCTATGAGACGCT

8001 CCAGGATGGC TGTGATACTC ACTTCTGCAA GGTCAATGAG8001 CCAGGATGGC TGTGATACTC ACTTCTGCAA GGTCAATGAG

AGAGGAGAGTAGAGGAGAGT

8051 ACTTCTGGGA GAAGAGGGTC ACAGGCTGCC CACCCTTTGA8051 ACTTCTGGGA GAAGAGGGTC ACAGGCTGCC CACCCTTTGA

TGAACACAAGTGAACACAAG

8101 TGTCTTGCTG AGGG AGGT A A A ATT ATG A A A ATTCC AGGC A8101 TGTCTTGCTG AGGG AGGT A A A ATT ATG A A A ATTCC AGGC A

CCTGCTGTGACCTGCTGTGA

8151 C AC ATGTG AG G AGCCTG AGT GCA ACG AC AT C ACTGCC AGG8151 C AC ATGTG AG G AGCCTG AGT GCA ACG AC AT C ACTGCC AGG

CTGCAGTATGCTGCAGTATG

8201 TCAAGGTGGG AAGCTGTAAG TCTGAAGTAG AGGTGGATAT8201 TCAAGGTGGG AAGCTGTAAG TCTGAAGTAG AGGTGGATAT

CCACTACTGCCCACTACTGC

8251 CAGGGCAAAT GTGCCAGCAA AGCCATGTAC TCCATTGACA8251 CAGGGCAAAT GTGCCAGCAA AGCCATGTAC TCCATTGACA

TCAACGATGTTCAACGATGT

8301 GCAGGACCAG TGCTCCTGCT GCTCTCCGAC ACGGACGGAG8301 GCAGGACCAG TGCTCCTGCT GCTCTCCGAC ACGGACGGAG

CCCATGCAGGCCCATGCAGG

8351 TGGCCCTGCA CTGCACCAAT GGCTCTGTTG TGTACCATGA8351 TGGCCCTGCA CTGCACCAAT GGCTCTGTTG TGTACCATGA

GGTTCTCAATGGTTCTCAAT

8401 GCCATGGAGT GCAAATGCTC CCCCAGGAAG TGCAGCAAGT GA8401 GCCATGGAGT GCAAATGCTC CCCCAGGAAG TGCAGCAAGT GA

В данном контексте белок ФВ может быть фрагментом ФВ, содержащим домен D' и домен D3 из ФВ, в котором фрагмент ФВ связывается с фактором VIII (FVIII) и ингибирует связывание эндогенного ФВ (полноразмерного ФВ) с FVIII. Фрагмент ФВ, содержащий домен D' и домен D3 может дополнительно содержать домен ФВ, выбранный из группы, состоящей из домена А1, домена А2, домена A3, домена D1, домена D2, домена D4, домена В1, домена В2, домена В3, домена С1, домена С2, домена CK, одного или нескольких их фрагментов и любых их сочетаний. В одном варианте реализации изобретения фрагмент ФВ содержит, по существу состоит или состоит из: (1) доменов D' и D3 ФВ или их фрагментов; (2)In this context, the VWF protein may be a VWF fragment containing the D' domain and the D3 domain of VWF, in which the VWF fragment binds to factor VIII (FVIII) and inhibits the binding of endogenous VWF (full-length VWF) to FVIII. The VWF fragment containing domain D' and domain D3 may further comprise a VWF domain selected from the group consisting of A1 domain, A2 domain, A3 domain, D1 domain, D2 domain, D4 domain, B1 domain, B2 domain, B3 domain, C1, C2 domain, CK domain, one or more fragments thereof, and any combination thereof. In one embodiment of the invention, the VWF fragment comprises, consists essentially of, or consists of: (1) VWF D' and D3 domains or fragments thereof; (2)

- 35 044115 доменов D1, D' и D3 ФВ или их фрагментов; (3) доменов D2, D' и D3 ФВ или их фрагментов; (4) доменов D1, D2, D' и D3 ФВ или их фрагментов; (5) доменов D1, D2, D', D3 и А1 ФВ или их фрагментов. Фрагмент ФВ, описанные в настоящем документе, не содержит сайта связывания с рецептором клиренса ФВ. В другом варианте реализации изобретения фрагмент ФВ, описанный в настоящем документе, не является аминокислотами 764-1274 из SEQ ID NO: 21. Фрагмент ФВ по настоящему изобретению может включать в себя любые другие последовательности, связанные с или слитые с фрагментом ФВ. Например, фрагмент ФВ, описанный в настоящем документе, может дополнительно содержать сигнальный пептид.- 35 044115 domains D1, D' and D3 of VWF or their fragments; (3) domains D2, D' and D3 of VWF or fragments thereof; (4) domains D1, D2, D' and D3 of VWF or fragments thereof; (5) domains D1, D2, D', D3 and A1 of VWF or fragments thereof. The VWF fragment described herein does not contain a binding site for the VWF clearance receptor. In another embodiment, the VWF fragment described herein is not amino acids 764-1274 of SEQ ID NO: 21. The VWF fragment of the present invention may include any other sequences linked to or fused to the VWF fragment. For example, the VWF fragment described herein may further comprise a signal peptide.

В одном варианте реализации изобретения фрагмент ФВ, содержащий домен D' и домен D3, связывается или соединяется с белком FVIII. Связываясь или соединяясь с белком FVIII, фрагмент ФВ по настоящему изобретению защищает FVIII от расщепления протеазой и активации FVIII, стабилизирует тяжелую цепь и легкую цепь FVIII и предотвращает клиренс FVIII фагоцитарными рецепторами. В другом варианте реализации изобретения фрагмент ФВ связывается или соединяется с белком FVIII и блокирует или предотвращает связывание белка FVIII с фосфолипидом и активированным протеином С. Путем предотвращения или ингибирования связывания белка FVIII с эндогенным полноразмерным ФВ, фрагмент ФВ по настоящему изобретению снижает клиренс FVIII рецепторами клиренса ФВ, таким образом, продлевается период полувыведения химерного белка. Таким образом, увеличение периода полувыведения химерного белка обуславливается связыванием или соединением с фрагментом ФВ, с отсутствующим сайтом связывания рецептора клиренса ФВ, с белком FVIII и экранированием или защитой белка FVIII фрагментом ФВ от эндогенных ФВ, содержащих сайт связывания рецептора клиренса ФВ. Благодаря связыванию или защите белка FVIII фрагментом ФВ может также обеспечиваться рециркуляция белка FVIII. За счет исключения сайтов связывания рецепторов клиренса ФВ, содержащихся в молекуле полноразмерного ФВ, гетеродимеры FVIII/ФВ по настоящему изобретению защищены от клиренса ФВ с дальнейшим увеличением периода полувыведения FVIII.In one embodiment of the invention, a VWF fragment containing a D' domain and a D3 domain binds or binds to the FVIII protein. By binding or binding to the FVIII protein, the VWF fragment of the present invention protects FVIII from protease degradation and activation of FVIII, stabilizes the heavy chain and light chain of FVIII, and prevents clearance of FVIII by phagocytic receptors. In another embodiment of the invention, the VWF fragment binds or binds to the FVIII protein and blocks or prevents the binding of the FVIII protein to phospholipid and activated protein C. By preventing or inhibiting the binding of the FVIII protein to endogenous full-length VWF, the VWF fragment of the present invention reduces the clearance of FVIII by the VWF clearance receptors , thus prolonging the half-life of the chimeric protein. Thus, the increase in the half-life of the chimeric protein is caused by binding or combining with the VWF fragment, with the missing VWF clearance receptor binding site, with the FVIII protein and shielding or protection of the FVIII protein by the VWF fragment from endogenous VWF containing the VWF clearance receptor binding site. By binding or protecting the FVIII protein by the VWF fragment, recycling of the FVIII protein can also be achieved. By eliminating the VWF clearance receptor binding sites contained in the full-length VWF molecule, the FVIII/VWF heterodimers of the present invention are protected from VWF clearance with a further increase in the half-life of FVIII.

В одном варианте реализации изобретения белок ФВ, пригодный для использования по настоящему изобретению, содержит домен D' и домен D3 из ФВ, причем домен D' по меньшей мере на 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% или 100% идентичен аминокислотам 764-866 из SEQ ID NO: 21, причем белок ФВ предотвращает или ингибирует связывание эндогенного ФВ с FVIII. В другом варианте реализации изобретения белок ФВ содержит домен D' и домен D3 из ФВ, причем домен D3 по меньшей мере на 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% или 100% идентичен аминокислотам 867-1240 из SEQ ID NO: 21, причем белок ФВ предотвращает или ингибирует связывание эндогенного ФВ с FVIII. В некоторых вариантах реализации изобретения белок ФВ, описанный в настоящем документе, по существу состоит или состоит из домена D' и домена D3 ФВ, которые по меньшей мере на 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% или 100% идентичны аминокислотам 764-1240 SEQ ID NO: 21, причем белок ФВ предотвращает или ингибирует связывание эндогенного ФВ с FVIII. В других вариантах реализации изобретения белок ФВ содержит, по существу состоит или состоит из доменов D1, D2, D' и D3, которые по меньшей мере на 60%, 70%, 80%„ 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% или 100% идентичны аминокислотам 23-1240 из SEQ ID NO: 21, причем белок ФВ предотвращает или ингибирует связывание эндогенного ФВ с FVIII. В еще одних вариантах реализации изобретения белок ФВ дополнительно содержит сигнальный пептид, функционально связанный с ним.In one embodiment, a VWF protein suitable for use in the present invention comprises a D' domain and a D3 domain of VWF, wherein the VWF domain is at least 60%, 70%, 80%, 85%, 90%, 95% D'. , 96%, 97%, 98%, 99% or 100% identical to amino acids 764-866 of SEQ ID NO: 21, wherein the VWF protein prevents or inhibits the binding of endogenous VWF to FVIII. In another embodiment, the VWF protein contains a D' domain and a D3 domain of VWF, wherein the VWF domain is at least 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98% D3. , 99% or 100% identical to amino acids 867-1240 of SEQ ID NO: 21, and the VWF protein prevents or inhibits the binding of endogenous VWF to FVIII. In some embodiments, the VWF protein described herein is substantially composed of or consists of a VWF D' domain and a VWF D3 domain that is at least 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% or 100% identical to amino acids 764-1240 SEQ ID NO: 21, and the VWF protein prevents or inhibits the binding of endogenous VWF to FVIII. In other embodiments, the VWF protein contains, consists essentially of, or consists of domains D1, D2, D', and D3 that are at least 60%, 70%, 80%, 70%, 80%, 85%, 90% , 95%, 96%, 97%, 98%, 99% or 100% identical to amino acids 23-1240 of SEQ ID NO: 21, wherein the VWF protein prevents or inhibits the binding of endogenous VWF to FVIII. In yet other embodiments, the VWF protein further comprises a signal peptide operably linked thereto.

В некоторых вариантах реализации изобретения белок ФВ, пригодный для использования по настоящему изобретению, по существу состоит или состоит из (1) домена D'D3, домена D1D'D3, домена D2D'D3 или домена D1D2D'D3 и (2) дополнительной последовательности ФВ, размером до около 10 аминокислот (например, любые последовательности от аминокислот 764-1240 из SEQ ID NO: 21, до аминокислот 764-1250 из SEQ ID NO: 21), до около 15 аминокислот (например, любые последовательности от аминокислот 764-1240 из SEQ ID NO: 21 до аминокислот 764-1255 из SEQ ID NO: 21), до около 20 аминокислот (например, любые последовательности от аминокислот 764-1240 из SEQ ID NO: 21 до аминокислот 764-1260 из SEQ ID NO: 21), до около 25 аминокислот (например, любые последовательности от аминокислот 764-1240 из SEQ ID NO: 21 до аминокислот 764-1265 из SEQ ID NO: 21) или до около 30 аминокислот (например, любые последовательности от аминокислот 764-1240 из SEQ ID NO: 21 до аминокислот 764-1260 из SEQ ID NO: 21). В конкретном варианте реализации изобретения белок ФВ, содержащий или по существу состоящий из домена D' и домена D3, не является ни аминокислотами 7641274 из SEQ ID NO: 21 ни полноразмерным зрелым ФВ. В некоторых вариантах реализации изобретения домен D1D2 экспрессируется в транс положении с доменом D'D3. В некоторых вариантах реализации изобретения домен D1D2 экспрессируется в цис положении с доменом D'D3.In some embodiments, a VWF protein useful for use in the present invention is substantially composed of or consists of (1) a D'D3 domain, a D1D'D3 domain, a D2D'D3 domain, or a D1D2D'D3 domain and (2) additional VWF sequence , up to about 10 amino acids in size (e.g., any sequence from amino acids 764-1240 of SEQ ID NO: 21, to amino acids 764-1250 of SEQ ID NO: 21), up to about 15 amino acids (for example, any sequence from amino acids 764-1240 of SEQ ID NO: 21 to amino acids 764-1255 of SEQ ID NO: 21), up to about 20 amino acids (e.g., any sequence from amino acids 764-1240 of SEQ ID NO: 21 to amino acids 764-1260 of SEQ ID NO: 21 ), up to about 25 amino acids (e.g., any sequence from amino acids 764-1240 of SEQ ID NO: 21 to amino acids 764-1265 from SEQ ID NO: 21) or up to about 30 amino acids (for example, any sequence from amino acids 764-1240 from SEQ ID NO: 21 to amino acids 764-1260 from SEQ ID NO: 21). In a particular embodiment, the VWF protein containing or substantially consisting of a D' domain and a D3 domain is neither amino acids 7,641,274 of SEQ ID NO: 21 nor full-length mature VWF. In some embodiments, the D1D2 domain is expressed in trans with the D'D3 domain. In some embodiments, the D1D2 domain is expressed in cis with the D'D3 domain.

В других вариантах реализации изобретения ФВ белок, содержащий домены D'D3, связанные с доменами D1D2, дополнительно содержит внутриклеточный сайт расщепления, например, (сайт расщепления РАСЕ (фурином) или РС5), позволяющий расщепление доменов D1D2 от доменов D'D3 при экспрессии. Неограничивающие примеры внутриклеточных сайтов расщепления описаны в других местах в настоящем документе.In other embodiments, the VWF protein containing D'D3 domains associated with D1D2 domains further contains an intracellular cleavage site, for example (PACE (furin) or PC5 cleavage site), allowing cleavage of D1D2 domains from D'D3 domains upon expression. Non-limiting examples of intracellular cleavage sites are described elsewhere herein.

В еще одних вариантах реализации изобретения белок ФВ содержит домен D' и домен D3, но не содержит аминокислотной последовательности, выбранной из группы, состоящей из (1) аминокислот 12412813, соответствующих SEQ ID NO: 21, (2) аминокислот 1270-2813, соответствующих SEQ ID NO: 21, (3)In yet other embodiments, the VWF protein contains a D' domain and a D3 domain, but does not contain an amino acid sequence selected from the group consisting of (1) amino acids 12412813 corresponding to SEQ ID NO: 21, (2) amino acids 1270-2813 corresponding to SEQ ID NO: 21, (3)

- 36 044115 аминокислот 1271-2813, соответствующих SEQ ID NO: 21, (4) аминокислот 1272-2813, соответствующих- 36 044115 amino acids 1271-2813 corresponding to SEQ ID NO: 21, (4) amino acids 1272-2813 corresponding

SEQ ID NO: 21, (5) аминокислот 1273-2813, соответствующих SEQ ID NO: 21, (6) аминокислот 12742813, соответствующих SEQ ID NO: 21 и любых их комбинаций.SEQ ID NO: 21, (5) amino acids 1273-2813 corresponding to SEQ ID NO: 21, (6) amino acids 12742813 corresponding to SEQ ID NO: 21 and any combinations thereof.

В еще одних вариантах реализации изобретения белок ФВ понастоящему изобретению содержит, по существу состоит или состоит из аминокислотной последовательности, соответствующей домену D', домену D3 и домену А1, причем аминокислотная последовательность по меньшей мере на 60%, 70%, 75% , 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% или 100% идентична аминокислотам 764-1479 из SEQ ID NO: 21, причем белок ФВ предотвращает или ингибирует связывание эндогенного ФВ с FVIII. В конкретном варианте реализации изобретения белок ФВ не является аминокислотами 764-1274 из SEQ ID NO: 21.In yet other embodiments, the VWF protein of the present invention comprises, consists essentially of, or consists of an amino acid sequence corresponding to a D' domain, a D3 domain, and an A1 domain, wherein the amino acid sequence is at least 60%, 70%, 75%, 80% , 85%, 90%, 95%, 96%, 97%, 98%, 99%, or 100% identical to amino acids 764-1479 of SEQ ID NO: 21, wherein the VWF protein prevents or inhibits the binding of endogenous VWF to FVIII. In a specific embodiment, the VWF protein is not amino acids 764-1274 of SEQ ID NO: 21.

В некоторых вариантах реализации изобретения белок ФВ по настоящему изобретению включает в себя домен D' и домен D3, но не включает в себя по меньшей мере один домен ФВ, выбранный из группы, состоящей из (1) домена А1, (2) домена А2, (3) домена A3, (4) домена D4, (5) домена В1, (6) домена В2, (7) домена В3, (8) домена С1, (9) домена С2, (10) домена CK, (11) домена CK и домена С2, (12) домена CK, домена С2 и домена С1, (13) домена CK, домена С2, домена С1, домена В3, (14) домена CK, домена С2, домена С1, домена В3, домена В2, (15) домена CK, домена С2, домена С1, домена В3, домена В2, и домена В1, (16) домена CK, домена С2, домена С1, домена В3, домена В2, домена В1 и домен D4, (17) домена CK, домена С2, домена С1, домена В3, домена В2, домена В1, домена D4 и домена A3, (18) домена CK, домена С2, домена С1, домена В3, домена В2, домена В1, домена D4, домена A3 и домена А2, (19) домена CK, домена С2, домена С1, домена В3, домена В2, домена В1, домена D4, домена A3, домена А2 и домена А1, и (20) любые их комбинации.In some embodiments, the VWF protein of the present invention includes a D' domain and a D3 domain, but does not include at least one VWF domain selected from the group consisting of (1) an A1 domain, (2) an A2 domain, (3) A3 domain, (4) D4 domain, (5) B1 domain, (6) B2 domain, (7) B3 domain, (8) C1 domain, (9) C2 domain, (10) CK domain, (11 ) CK domain and C2 domain, (12) CK domain, C2 domain and C1 domain, (13) CK domain, C2 domain, C1 domain, B3 domain, (14) CK domain, C2 domain, C1 domain, B3 domain, B2, (15) CK domain, C2 domain, C1 domain, B3 domain, B2 domain, and B1 domain, (16) CK domain, C2 domain, C1 domain, B3 domain, B2 domain, B1 domain, and D4 domain, (17 ) CK domain, C2 domain, C1 domain, B3 domain, B2 domain, B1 domain, D4 domain and A3 domain, (18) CK domain, C2 domain, C1 domain, B3 domain, B2 domain, B1 domain, D4 domain, domain A3 and A2 domain, (19) CK domain, C2 domain, C1 domain, B3 domain, B2 domain, B1 domain, D4 domain, A3 domain, A2 domain and A1 domain, and (20) any combinations thereof.

В еще одних вариантах реализации изобретения белок ФВ содержит D'D3 домены и один или более доменов или модулей. Примеры таких доменов или модулей включают в себя, но не ограничиваются ими, домены и модули, описанные в Zhou et al., Blood опубликовано онлайн 6 апреля 2012 года: DOI 10.1182/blood-2012-01-405134, полное содержание которой включено в настоящий документ посредством ссылки. Например, белок ФВ может содержать домен D'D3 и один или более доменов или модулей, выбранных из группы, состоящей из домена А1, домена А2, домена A3, модуля D4N, модуля VWD4, модуля С8-4, модуля TIL-4, модуля С1, модуля С2, модуля С3, модуля С4, модуля С5, модуля С5, модуля С6 и любых их сочетаний.In yet other embodiments, the VWF protein contains D'D3 domains and one or more domains or modules. Examples of such domains or modules include, but are not limited to, those described in Zhou et al., Blood published online April 6, 2012: DOI 10.1182/blood-2012-01-405134, the entire contents of which are incorporated herein document by reference. For example, a VWF protein may comprise a D'D3 domain and one or more domains or modules selected from the group consisting of an A1 domain, an A2 domain, an A3 domain, a D4N module, a VWD4 module, a C8-4 module, a TIL-4 module, C1, module C2, module C3, module C4, module C5, module C5, module C6 and any combinations thereof.

В еще одних вариантах реализации изобретение белок ФВ связан с гетерологичный фрагментом, причем гетерологичный фрагмент присоединен к N-концу или С-концу белка ФВ или встроен непосредственно ниже одной или более аминокислот (например, один или более сайтов встраивания XTEN) в белке ФВ. Например, сайты встраивания для гетерологичного фрагмента в белок ФВ могут находиться в домене D', домене D3 или обоих доменах. Гетерологичный фрагмент может продлевать период полувыведения.In yet other embodiments, the VWF protein is linked to a heterologous fragment, wherein the heterologous fragment is attached to the N-terminus or C-terminus of the VWF protein or is inserted immediately downstream of one or more amino acids (eg, one or more XTEN insertion sites) in the VWF protein. For example, insertion sites for a heterologous fragment into the VWF protein may be in the D' domain, the D3 domain, or both domains. The heterologous fragment may prolong the half-life.

В некоторых вариантах реализации изобретения белок ФВ, пригодный для использования по настоящему изобретению, образует мультимер, например, димер, тример, тетрамер, пентамер, гексамер, гептамер или мультимеры высшего порядка. В других вариантах реализации изобретения белок ФВ представляет собой мономер, содержащий только один белок ФВ. В некоторых вариантах реализации изобретения белок ФВ по настоящему изобретению может иметь одну или более аминокислотных замен, делеций, вставок или модификаций. В одном варианте реализации изобретения белок ФВ может включать в себя аминокислотные замены, делеций, вставки или модификации таким образом, что белок ФВ теряет способность образовывать дисульфидную связь или образовывать димер или мультимер. В другом варианте реализации изобретения аминокислотная замена находится в пределах домена D' и домена D3. В конкретном варианте реализации изобретения белок ФВ, пригодный для использования по настоящему изобретению, содержит по меньшей мере одну аминокислотную замену в позиции, соответствующей остатку 1099, остатку 1142 или обоим остаткам 1099 и 1142 последовательности SEQ ID NO: 21. По меньшей мере одной аминокислотной заменой могут быть любые аминокислоты, которые не встречающиеся в естественных условиях у ФВ дикого типа. Например, аминокислотной заменой может быть любая аминокислота, отличная от цистеина, например, Изолейцин, аланин, лейцин, аспарагин, лизин, аспарагиновая кислота, метионин, фенилаланин, глутаминовая кислота, треонин, глютамин, триптофан, глицин, валин, пролин, серин, тирозин, аргинин или гистидин. В другом примере аминокислотная замена имеет одну или более аминокислот, которые предотвращают или ингибируют формирования мультимеров у белков ФВ.In some embodiments, the VWF protein useful in the present invention forms a multimer, such as a dimer, trimer, tetramer, pentamer, hexamer, heptamer, or higher order multimers. In other embodiments, the VWF protein is a monomer containing only one VWF protein. In some embodiments, the VWF protein of the present invention may have one or more amino acid substitutions, deletions, insertions, or modifications. In one embodiment, the VWF protein may include amino acid substitutions, deletions, insertions, or modifications such that the VWF protein loses the ability to form a disulfide bond or form a dimer or multimer. In another embodiment, the amino acid substitution is within the D' domain and the D3 domain. In a specific embodiment, a VWF protein suitable for use in the present invention contains at least one amino acid substitution at a position corresponding to residue 1099, residue 1142, or both residues 1099 and 1142 of SEQ ID NO: 21. At least one amino acid substitution may be any amino acids that are not naturally occurring in wild-type VWF. For example, the amino acid substitution can be any amino acid other than cysteine, for example, isoleucine, alanine, leucine, asparagine, lysine, aspartic acid, methionine, phenylalanine, glutamic acid, threonine, glutamine, tryptophan, glycine, valine, proline, serine, tyrosine , arginine or histidine. In another example, the amino acid substitution has one or more amino acids that prevent or inhibit the formation of multimers in VWF proteins.

В некоторых вариантах реализации изобретения белок ФВ, пригодный для использования по настоящему изобретению, может быть дополнительно модифицирован с целью улучшения его взаимодействия с FVIII, например, чтобы повысить аффинность связывания с FVIII. В качестве не ограничивающего примера, белок ФВ содержит остаток серина в положении, соответствующем аминокислоте 764 из SEQ ID NO: 21 и остаток лизина в положении, соответствующем аминокислоте 773 из SEQ ID NO: 21. Остатки 764 и/или 773 могут способствовать аффинности связывания белков ФВ с FVIII. В других вариантах реализации изобретения белки ФВ, пригодные для использования по настоящему изобретению, могут иметь другие модификации, например, белок может быть ПЭГилированный, гликозилированный, ГЭКилированный или полисиалилированный.In some embodiments, the VWF protein useful in the present invention may be further modified to improve its interaction with FVIII, for example, to increase its binding affinity to FVIII. As a non-limiting example, the VWF protein contains a serine residue at the position corresponding to amino acid 764 of SEQ ID NO: 21 and a lysine residue at the position corresponding to amino acid 773 of SEQ ID NO: 21. Residues 764 and/or 773 may contribute to protein binding affinity FV with FVIII. In other embodiments, VWF proteins suitable for use in the present invention may have other modifications, for example, the protein may be PEGylated, glycosylated, HESylated, or polysialylated.

- 37 044115- 37 044115

II. В. Последовательности XTEN.II. B. XTEN sequences.

В данном контексте последовательность XTEN означает удлиненные полипептиды с неповторяющимися последовательностями неестественного происхждения, которые в основном состоят из малых гидрофильных аминокислот с последовательностью, имеющей низкий уровень или не имеющей вовсе вторичной или третичной структуры в физиологических условиях. В качестве партнера химерного белка последовательности XTEN могут служить носителем, придавая определенные желательные фармакокинетические, физико-химические и фармацевтические свойства при соединении с белком ФВ или последовательностью FVIII по настоящему изобретению для создания химерного белка. Такие желательные свойства включают в себя, но не ограничиваются ими, улучшенные фармакокинетическе параметры и характеристики растворимости. В данном контексте термин XTEN специально исключает антитела и фрагменты антител, такие как одноцепочечные антитела или фрагменты Fc легкой цепи или тяжелой цепи.In this context, the sequence XTEN means extended polypeptides with non-repetitive sequences of non-natural origin, which are mainly composed of small hydrophilic amino acids with a sequence having low or no secondary or tertiary structure under physiological conditions. As a chimeric protein partner, XTEN sequences can serve as a carrier to impart certain desired pharmacokinetic, physicochemical and pharmaceutical properties when combined with the VWF protein or FVIII sequence of the present invention to create a chimeric protein. Such desirable properties include, but are not limited to, improved pharmacokinetic parameters and solubility characteristics. As used herein, the term XTEN specifically excludes antibodies and antibody fragments, such as single chain antibodies or light chain or heavy chain Fc fragments.

Настоящее изобретение относится к более короткой последовательности XTEN, которая обеспечивает улучшенные свойства, касающиеся увеличения периода полувыведения, по сравнению с более длинной последовательности XTEN, когда последовательность XTEN слита с белком ФВ и/или второй константной областью ИГ или ее частью. Следовательно, последовательность XTEN, слитая с белком ФВ и/или второй константной областью ИГ или ее частью, имеет длину менее 288 аминокислот, то есть короче 288 аминокислот. В одном варианте реализации изобретения последовательность XTEN, слитая с белком ФВ и/или второй константной областью ИГ или ее частью, состоит из аминокислотной последовательности, имеющей длину от 12 до 287 аминокислот. В другом варианте реализации изобретения последовательность XTEN, слитая с белком ФВ и/или второй константной областью ИГ или ее частью, содержит по меньшей около 36 аминокислот, по меньшей мере около 42 аминокислоты, по меньшей мере около 72 аминокислоты или по меньшей мере около 144 аминокислоты, но меньше чем 288 аминокислот. В других вариантах реализации изобретения последовательность XTEN, слитая с белком ФВ и/или второй константной областью ИГ или ее частью, выбирается из АЕ36, AG36, АЕ42, AG42, АЕ72, AG72, AE144 или AG144. В одном варианте реализации изобретения последовательность XTEN, слитая с белком ФВ и/или второй константной областью ИГ или ее частью, является аминокислотной последовательностью, идентичной по меньшей мере на 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% или 100% последовательностям SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11 или SEQ ID NO: 14, в которых химерный белок проявляет улучшенный период полувыведения по сравнению с химерным белком без последовательности XTEN.The present invention provides a shorter XTEN sequence that provides improved half-life increasing properties compared to a longer XTEN sequence when the XTEN sequence is fused to the VWF protein and/or a second IG constant region or a portion thereof. Therefore, the XTEN sequence fused to the VWF protein and/or the second IG constant region or part thereof is less than 288 amino acids in length, that is, shorter than 288 amino acids. In one embodiment of the invention, the XTEN sequence fused to the VWF protein and/or the second IG constant region or a portion thereof consists of an amino acid sequence having a length of from 12 to 287 amino acids. In another embodiment, the XTEN sequence fused to the VWF protein and/or the second IG constant region or a portion thereof comprises at least about 36 amino acids, at least about 42 amino acids, at least about 72 amino acids, or at least about 144 amino acids , but less than 288 amino acids. In other embodiments, the XTEN sequence fused to the VWF protein and/or the second IG constant region or portion thereof is selected from AE36, AG36, AE42, AG42, AE72, AG72, AE144, or AG144. In one embodiment, the XTEN sequence fused to the VWF protein and/or the second IG constant region or a portion thereof is an amino acid sequence that is at least 80%, 85%, 90%, 95%, 96%, 97% identical, 98%, 99%, or 100% of the sequences of SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, or SEQ ID NO: 14, in which the chimeric protein exhibits an improved half-life compared to the chimeric protein without the XTEN sequence.

Химерный белок по настоящему изобретению может также содержать дополнительную (вторую, третью или больше) последовательность XTEN. Дополнительная последовательность XTEN может также быть слита с белком FVIII или с первой константной областью ИГ или ее частью. Дополнительные последовательности XTEN могут иметь любую длину. Например, дополнительная последовательность XTEN, слитая с белком FVIII или первой константной областью ИГ, представляет собой пептид или полипептид, имеющий примерное число аминокислотных остатков более около 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1200, 1400, 1600, 1800 или 2000. В некоторых вариантах реализации изобретения дополнительная последовательность XTEN представляет собой пептид или полипептид с примерным числом аминокислотных остатков от более около 20 до около 3000 аминокислотных остатков, от более около 30 до около 2500 остатков, от более около 40 до около 2000 остатков, от более около 50 до около 1500 остатков, от более около 60 до около 1000 остатков, от более около 70 до около 900 остатков, от более около 80 до около 800 остатков, от более около 90 до около 700 остатков, от более около 100 до около 600 остатков, от более около 110 до около 500 остатков или более около 120 до около 400 остатков.The chimeric protein of the present invention may also contain an additional (second, third or more) XTEN sequence. The additional XTEN sequence may also be fused to the FVIII protein or to the first IG constant region or part thereof. Additional XTEN sequences can be of any length. For example, the additional XTEN sequence fused to the FVIII protein or the first IG constant region is a peptide or polypeptide having an approximate number of amino acid residues greater than about 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200 , 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1200, 1400, 1600, 1800 or 2000. In some embodiments, additional sequence XTEN is a peptide or polypeptide with an approximate number of amino acid residues from more than about 20 to about 3000 amino acid residues, from more than about 30 to about 2500 residues, from more than about 40 to about 2000 residues, from more than about 50 to about 1500 residues, from more about 60 to about 1000 residues, from more than about 70 to about 900 residues, from more than about 80 to about 800 residues, from more than about 90 to about 700 residues, from more than about 100 to about 600 residues, from more than about 110 to about 500 residues or more from about 120 to about 400 residues.

Последовательности XTEN (т.е. последовательность XTEN, слитая с белком ФВ и/или второй константной областью ИГ или ее частью, или последовательность XTEN, слитая с белком FVIII и/или первой константной областью ИГ или ее частью, или встроена в один или более сайт встраивания в белке FVIII), могут содержать один или более мотивов последовательности от 9 до 14 аминокислотных остатков или аминокислотную последовательность, идентичную по меньшей мере на 80%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99% мотиву последовательности, причем мотив включает в себя, по существу состоит или состоит из 4-6 видов аминокислот, выбранных из группы, состоящей из глицина (G), аланина (А), серина (S), треонина (Т), глутамата (Е) и пролина (Р). См. US 2010-0239554 A1.XTEN sequences (i.e., an XTEN sequence fused to the VWF protein and/or the second IG constant region or part thereof, or an XTEN sequence fused to the FVIII protein and/or the first IG constant region or part thereof, or inserted into one or more insertion site in the FVIII protein) may contain one or more sequence motifs of 9 to 14 amino acid residues or an amino acid sequence identical to at least 80%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99% to a sequence motif, wherein the motif includes, consists essentially of or consists of 4-6 amino acid species selected from the group consisting of glycine (G), alanine (A), serine ( S), threonine (T), glutamate (E) and proline (P). See US 2010-0239554 A1.

В некоторых вариантах реализации изобретения последовательность XTEN содержит неперекрывающиеся мотивы последовательности, в которых по меньшей мере около 80% или по меньшей мере около 85%, или по меньшей мере около 90%, или по меньшей мере около 91%, или по меньшей мере около 92%, или по меньшей мере около 93%, или по меньшей мере около 94%, или по меньшей мере около 95%, или по меньшей мере около 96%, или по меньшей мере около 97%, или по меньшей мере около 98% или по меньшей мере около 99%, или около 100% последовательности состоит из множества единиц неперекрывающихся последовательностей, выбранных из семейства с одним мотивом из табл. 2А, что дает в результате последовательность семейства. В данном контексте термин семейство означает, что XTEN имеет мотивы, выбранные только из одной категории мотивов из табл. 2А; т.е. AD, AE, AF, AG, AM, AQ, ВС или BD XTEN, и что любые другие аминокислоты в XTEN не из семейства мотивовIn some embodiments, the XTEN sequence contains non-overlapping sequence motifs in which at least about 80%, or at least about 85%, or at least about 90%, or at least about 91%, or at least about 92 %, or at least about 93%, or at least about 94%, or at least about 95%, or at least about 96%, or at least about 97%, or at least about 98% or at least about 99%, or about 100% of the sequence consists of a plurality of non-overlapping sequence units selected from the single motif family of Table 1. 2A, resulting in the family sequence. In this context, the term family means that XTEN has motifs selected from only one category of motifs from Table. 2A; those. AD, AE, AF, AG, AM, AQ, BC or BD XTEN, and that any other amino acids in XTEN are not from the motif family

- 38 044115 выбирались для достижения необходимого свойства, например, чтобы обеспечить включение сайта рестрикции посредством кодирующих нуклеотидов, включение последовательности для расщепления или для достижения более эффективной связи с FVIII или ФВ. В некоторых вариантах реализации изобретения XTEN семейств последовательность XTEN включает множество единиц неперекрывающихся мотивов последовательности из семейства мотивов AD, или семейства мотивов АЕ, или семейства мотивов AF, или семейства мотивов AG, или семейства мотивов AM, или семейства мотивов AQ, или семейства мотивов ВС, или семейства мотивов BD, причем выбранная XTEN проявляет диапазон гомологии, описанный выше. В других вариантах реализации изобретения XTEN включает множество единиц мотивов последовательностей из двух или более семейств мотивов из табл. 2А. Эти последовательности могут быть выбраны для достижения желаемых физических/химических свойств, в том числе таких свойств, как суммарный заряд, гидрофильность, отсутствие вторичной структуры или отсутствие повторяемости, которые предоставляются в соответствии с аминокислотным составом мотивов, который более подробно описан ниже. В вариантах реализации изобретения, описанных выше в этом параграфе, мотивы, внедренные в XTEN, могут быть выбраны и собраны с использованием описанных в данном документе способов для достижения размера XTEN от около 36 до около 3000 аминокислотных остатков.- 38 044115 were selected to achieve a desired property, for example, to provide inclusion of a restriction site via coding nucleotides, inclusion of a cleavage sequence, or to achieve more efficient binding to FVIII or VWF. In some embodiments of the XTEN families, the XTEN sequence includes multiple units of non-overlapping sequence motifs from the AD motif family, or the AE motif family, or the AF motif family, or the AG motif family, or the AM motif family, or the AQ motif family, or the BC motif family, or a family of BD motifs, wherein the selected XTEN exhibits the range of homology described above. In other embodiments, XTEN includes a plurality of sequence motif units from two or more of the motif families in Table 1. 2A. These sequences can be selected to achieve desired physical/chemical properties, including properties such as net charge, hydrophilicity, lack of secondary structure, or lack of repeatability, which are provided according to the amino acid composition of the motifs, which is described in more detail below. In the embodiments described above in this paragraph, the motifs embedded in XTEN can be selected and assembled using methods described herein to achieve an XTEN size of from about 36 to about 3000 amino acid residues.

Таблица 2АTable 2A

Мотивы последовательности XTEN из 12 аминокислот и семейства мотивовXTEN 12 amino acid sequence motifs and motif families

Семене тво мотива* Seed of your motive* МОТИВ ПОСЛЕДОВАТЕЛЬНОСТИ MOTIVE SEQUENCES AD AD GESPGGSSGSES (SEQ ID NO: 24) GESPGGSSGSES (SEQ ID NO: 24) AD AD GSEGSSGPGESS (SEQ ID NO: 25) GSEGSSGPGESS (SEQ ID NO: 25) AD AD GSSESGSSEGGP (SEQ ID NO: 26) GSSESGSSEGGP (SEQ ID NO: 26) AD AD GSGGEPSESGSS (SEQ ID NO: 27) GSGGEPSESGSS (SEQ ID NO: 27) АЕ, АМ AE, AM GSPAGSPTSTEE (SEQ ID NO: 28) GSPAGSPTSTEE (SEQ ID NO: 28) АЕ, AM, AQ AE, AM, AQ GSEPATSGSETP (SEQ ID NO: 29) GSEPATSGSETP (SEQ ID NO: 29) АЕ, AM, AQ AE, AM, AQ GTSESATPESGP (SEQ ID NO: 30) GTSESATPESGP (SEQ ID NO: 30) АЕ, AM, AQ AE, AM, AQ GTSTEPSEGSAP (SEQ ID NO: 31) GTSTEPSEGSAP (SEQ ID NO: 31) AF, АМ AF, AM GSTSESPSGTAP (SEQ ID GSTSESPSGTAP (SEQ ID

- 39 044115- 39 044115

NO: 32) NO: 32) AF, AM AF, AM GTSTPESGSASP (SEQ ID NO: 33) GTSTPESGSASP (SEQ ID NO: 33) AF, AM AF, AM GTSPSGESSTAP (SEQ ID NO: 34) GTSPSGESSTAP (SEQ ID NO: 34) AF, AM AF, AM GSTSSTAESPGP (SEQ ID NO: 35) GSTSSTAESPGP (SEQ ID NO: 35) AG, AM A.G., A.M. GTPGSGTASSSP (SEQ ID NO: 36) GTPGSGTASSSP (SEQ ID NO: 36) AG, AM A.G., A.M. GSSTPSGATGSP (SEQ ID NO: 37) GSSTPSGATGSP (SEQ ID NO: 37) AG, AM A.G., A.M. GSSPSASTGTGP (SEQ ID NO: 38) GSSPSASTGTGP (SEQ ID NO: 38) AG, AM A.G., A.M. GASPGTSSTGSP (SEQ ID NO: 39) GASPGTSSTGSP (SEQ ID NO: 39) AQ AQ GEPAGSPTSTSE (SEQ ID NO: 40) GEPAGSPTSTSE (SEQ ID NO: 40) AQ AQ GTGEPSSTPASE (SEQ ID NO: 41) GTGEPSSTPASE (SEQ ID NO: 41) AQ AQ GSGPSTESAPTE (SEQ ID NO: 42) GSGPSTESAPTE (SEQ ID NO: 42) AQ AQ GSETPSGPSETA (SEQ ID NO: 43) GSETPSGPSETA (SEQ ID NO: 43) AQ AQ GPSETSTSEPGA (SEQ ID NO: 44) GPSETSTSEPGA (SEQ ID NO: 44) AQ AQ GSPSEPTEGTSA (SEQ ID NO: 45) GSPSEPTEGTSA (SEQ ID NO: 45) BC B.C. GSGASEPTSTEP (SEQ ID NO: 46) GSGASEPTSTEP (SEQ ID NO: 46) BC B.C. GSEPATSGTEPS (SEQ ID NO: 47) GSEPATSGTEPS (SEQ ID NO: 47) BC B.C. GTSEPSTSEPGA (SEQ ID GTSEPSTSEPGA (SEQ ID

- 40 044115- 40 044115

NO: 48) NO: 48) ВС Sun GTSTEPSEPGSA (SEQ ID NO: 49) GTSTEPSEPGSA (SEQ ID NO: 49) BD BD GSTAGSETSTEA (SEQ ID NO: 50) GSTAGSETSTEA (SEQ ID NO: 50) BD BD GSETATSGSETA (SEQ ID NO: 51) GSETATSGSETA (SEQ ID NO: 51) BD BD GTSESATSESGA (SEQ ID NO: 52) GTSESATSESGA (SEQ ID NO: 52) BD BD GTSTEASEGSAS (SEQ ID NO: 53) GTSTEASEGSAS (SEQ ID NO: 53)

Обозначает отдельные последовательности мотивов, которые, при применении совместно с различными перестановками, дают последовательность семейства.Denotes individual sequences of motifs which, when applied in conjunction with various permutations, yield a family sequence.

В некоторых вариантах реализации изобретения последовательность XTEN, используемая в настоящем изобретении по меньшей мере на 60%, 70%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% идентична последовательности, выбранной из группы, состоящей из АЕ42, AG42, АЕ48, АМ48,In some embodiments, the XTEN sequence used in the present invention is at least 60%, 70%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97 %, 98%, 99% or 100% identical to a sequence selected from the group consisting of AE42, AG42, AE48, AM48,

АЕ72, AG72, АЕ108, AG108, АЕ144, AF144, AG144, АЕ180, AG180, АЕ216, AG216, АЕ252 , AG252, АЕ288, AG288, АЕ324, AG324, АЕ360, AG360, АЕ396, AG396, АЕ432, AG432, АЕ468, AG468, АЕ504, AG504, AF504, АЕ540, AG540, AF540, AD576, АЕ576, AF576, AG576, АЕ612, AG612 , АЕ624, АЕ648, AG648, AG684, АЕ720, AG720, АЕ756, AG756, АЕ792, AG792, АЕ828, AG828, AD836, АЕ864, AF864, AG864, АМ875, АЕ912, АМ923, АМ1318, ВС864, BD864, АЕ948, АЕ1044, АЕ1140 , АЕ1236, АЕ1332, АЕ1428, АЕ1524, АЕ1620, АЕ1716, АЕ1812, АЕ1908, АЕ2004А, AG948, AG1044, AG1140, AG1236, AG1332, AG1428, AG1524, AG1620, AG1716, AG1812, AG1908 и AG2004. См. US 20100239554 А1.AE72, AG72, AE108, AG108, AE144, AF144, AG144, AE180, AG180, AE216, AG216, AE252, AG252, AE288, AG288, AE324, AG324, AE360, AG360, AE396, AG3 96, AE432, AG432, AE468, AG468, AE504, AG504, AF504, AE540, AG540, AF540, AD576, AE576, AF576, AG576, AE612, AG612, AE624, AE648, AG648, AG684, AE720, AG720, AE756, AG756, AE 792, AG792, AE828, AG828, AD836, AE864, AF864, AG864, AM875, AE912, AM923, AM1318, BC864, BD864, AE948, AE1044, AE1140, AE1236, AE1332, AE1428, AE1524, AE1620, AE1716, AE18 12, AE1908, AE2004A, AG948, AG1044, AG1140, AG1236, AG1332, AG1428, AG1524, AG1620, AG1716, AG1812, AG1908 and AG2004. See US 20100239554 A1.

В одном варианте реализации изобретения последовательность XTEN по меньшей мере на 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% или 100% идентична аминокислотной последовательности, выбранной из группы, состоящей изIn one embodiment, the XTEN sequence is at least 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99%, or 100% identical to an amino acid sequence selected from the group consisting of

АЕ42 (SEQ ID NO: 9), АЕ72 (SEQ ID NO: 10), AE144_2A (SEQ IDNO: 55), AE144_3B (SEQ ID NO: 56), AE144_4A (SEQ ID NO: 57), AE144_5A (SEQ ID NO: 58), AE144_6B (SEQ ID NO: 59), AG144_A (SEQ ID NO: 60), AG144_B (SEQ ID NO: 61), AG144_C (SEQ ID NO: 62), AG144_F (SEQ IDNO: 63), AE864 (SEQ ID NO: 15), AE576 (SEQ ID NO: 16), AE288 (SEQ ID NO: 8), AE288_2 (SEQ ID NO: 54), AE144 (SEQ ID NO: 11), AG864 (SEQ ID NO: 17), AG576 (SEQ ID NO: 18), AG288 (SEQ ID NO: 19), AG144 (SEQ ID NO: 14) и любую их комбинацию. В другом варианте реализации изобретения последовательность XTEN выбрана из группы, состоящей изAE42 (SEQ ID NO: 9), AE72 (SEQ ID NO: 10), AE144_2A (SEQ ID NO: 55), AE144_3B (SEQ ID NO: 56), AE144_4A (SEQ ID NO: 57), AE144_5A (SEQ ID NO: 58), AE144_6B (SEQ ID NO: 59), AG144_A (SEQ ID NO: 60), AG144_B (SEQ ID NO: 61), AG144_C (SEQ ID NO: 62), AG144_F (SEQ IDNO: 63), AE864 (SEQ ID NO: 15), AE576 (SEQ ID NO: 16), AE288 (SEQ ID NO: 8), AE288_2 (SEQ ID NO: 54), AE144 (SEQ ID NO: 11), AG864 (SEQ ID NO: 17) , AG576 (SEQ ID NO: 18), AG288 (SEQ ID NO: 19), AG144 (SEQ ID NO: 14) and any combination thereof. In another embodiment of the invention, the XTEN sequence is selected from the group consisting of

АЕ42 (SEQ Ш NO: 9), АЕ72 (SEQ Ш NO: 10), АЕ144_2А (SEQ IDNO: 55), AE144_3B (SEQ ID NO: 56), AE144_4A (SEQ ID NO: 57), AE144_5A (SEQ ID NO: 58), AE144_6B (SEQ ID NO: 59), AG144_A (SEQ ID NO: 60), AG144_B (SEQ ID NO: 61), AG144_C (SEQ ID NO: 62), AG144_F (SEQ IDNO: 63), AE864 (SEQ ID NO: 15), AE576 (SEQ ID NO: 16), AE288 (SEQ ID NO: 8), AE288_2 (SEQ ID NO: 54), AE144 (SEQ ID NO: 11), AG864 (SEQ ID NO: 17), AG576 (SEQ ID NO: 18), AG288 (SEQ ID NO: 19), AG144 (SEQ ID NO: 14) и любую их комбинацию. В конкретном варианте реализации изобретения последовательность XTEN является AE288. Аминокислотные последовательности для определенных последовательностей XTEN по настоящему изобретению приведены в табл. 2В.AE42 (SEQ Ш NO: 9), AE72 (SEQ Ш NO: 10), AE144_2А (SEQ IDNO: 55), AE144_3B (SEQ ID NO: 56), AE144_4A (SEQ ID NO: 57), AE144_5A (SEQ ID NO: 58), AE144_6B (SEQ ID NO: 59), AG144_A (SEQ ID NO: 60), AG144_B (SEQ ID NO: 61), AG144_C (SEQ ID NO: 62), AG144_F (SEQ IDNO: 63), AE864 (SEQ ID NO: 15), AE576 (SEQ ID NO: 16), AE288 (SEQ ID NO: 8), AE288_2 (SEQ ID NO: 54), AE144 (SEQ ID NO: 11), AG864 (SEQ ID NO: 17) , AG576 (SEQ ID NO: 18), AG288 (SEQ ID NO: 19), AG144 (SEQ ID NO: 14) and any combination thereof. In a specific embodiment, the XTEN sequence is AE288. The amino acid sequences for certain XTEN sequences of the present invention are shown in table. 2B.

- 41 044115- 41 044115

Таблица 2ВTable 2B

Последовательности XTENXTEN sequences

XTEN XTEN Аминокислотная последовательность Amino acid sequence АЕ42 SEQ ID NO: 9 AE42 SEQ ID NO: 9 GAPGSPAGSPTSTEEGTSESATPESGPGSEPATSGSETPASS GAPGSPAGSPTSTEEGTSESATPESGPGSEPATSGSETPASS AE72 SEQ ID NO: 10 AE72 SEQ ID NO: 10 GAP TSESATPESG PGSEPATSGS ETPGTSESAT PESGPGSEPA TSGSETPGTS ESATPESGPG TSTEPSEGSA PGASS GAP TSESATPESG PGSEPATSGS ETPGTSESAT PESGPGSEPA TSGSETPGTS ESATPESGPG TSTEPSEGSA PGASS AE144 SEQ ID NO: 11 AE144 SEQ ID NO: 11 GSEPATSGSETPGTSESATPESGPGSEPATSGSETPGSPAGSPTSTEEGT STEPSEG SAPGSEPATSGSETPGSEPATSGSETPGSEPATSGSETPGTSTEPSEGSA PGTSESA PESGPGSEPATSGSETPGTSTEPSEGSAP GSEPATSGSETPGTSESATPESGPGSEPATSGSETPGSPAGSPTSTEEGT STEPSEG SAPGSEPATSGSETPGSEPATSGSETPGSEPATSGSETPGTSTEPSEGSA P.G.T.S.S.A. PESGPGSEPATSGSETPGTSTEPSEGSAP AE144_2A (SEQ ID NO: 55) AE144_2A (SEQ ID NO: 55) TSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGSAPGTS ESATPESGPGTSTEPSEGSAPGTSESATPESGPGSEPATSGSETPGTSTE PSEGSAPGTSTEPSEGSAPGTSESATPESGPGTSESATPESGPG TSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGSAPGTS ESATPESGPGTSTEPSEGSAPGTSESATPESGPGSEPATSGSETPGTSTE PSEGSAPGTSTEPSEGSAPGTSESATPESGPGTSESATPESGPG AE144_3B (SEQ ID NO: 56) AE144_3B (SEQ ID NO: 56) SPAGSPTSTEEGTSESATPESGPGSEPATSGSETPGTSESATPESGPGTS TEPSEGSAPGTSTEPSEGSAPGTSTEPSEGSAPGTSTEPSEGSAPGTSTE PSEGSAPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPG SPAGSPTSTEEGTSESATPESGPGSEPATSGSETPGTSESATPESGPGTS TEPSEGSAPGTSTEPSEGSAPGTSTEPSEGSAPGTSTEPSEGSAPGTSTE PSEGSAPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPG AE144_4A AE144_4A TSESATPESGPGSEPATSGSETPGTSESATPESGPGSEPATSGSETPGTS ESATPESGPGTSTEPSEGSAPGTSESATPESGPGSPAGSPTSTEEGSPAG TSESATPESGPGSEPATSGSETPGTSESATPESGPGSEPATSGSETPGTS ESATPESGPGTSTEPSEGSAPGTSESATPESGPGSPAGSPTSTEEGSPAG

- 42 044115- 42 044115

(SEQ ID NO: 57) (SEQ ID NO: 57) SPTSTEEGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPG SPTSTEEGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPG AE144_5A (SEQ ID NO: 58) AE144_5A (SEQ ID NO: 58) TSESATPESGPGSEPATSGSETPGTSESATPESGPGSEPATSGSETPGTS ESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSESATPESGPGSEPA TSGSETPGTSESATPESGPGSPAGSPTSTEEGSPAGSPTSTEEG TSESATPESGPGSEPATSGSETPGTSESATPESGPGSEPATSGSETPGTS ESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSESATPESGPGSEPA TSGSETPGTSESATPESGPGSPAGSPTSTEEGSPAGSPTSTEEG AE144_6B (SEQ ID NO: 59) AE144_6B (SEQ ID NO: 59) TSTEPSEGSAPGTSESATPESGPGTSESATPESGPGTSESATPESGPGSE PATSGSETPGSEPATSGSETPGSPAGSPTSTEEGTSTEPSEGSAPGTSTE PSEGSAPGSEPATSGSETPGTSESATPESGPGTSTEPSEGSAPG TSTEPSEGSAPGTSESATPESGPGTSESATPESGPGTSESATPESGPGSE PATSGSETPGSEPATSGSETPGSPAGSPTSTEEGTSTEPSEGSAPGTSTE PSEGSAPGSEPATSGSETPGTSESATPESGPGTSTEPSEGSAPG AG144 SEQ ID NO: 14 AG144 SEQ ID NO: 14 GTPGSGTASSSPGSSTPSGATGSPGSSPSASTGTGPGSSPSASTGTGPG ASPGTSST GSPGASPGTSSTGSPGSSTPSGATGSPGSSPSASTGTGPGASPGTSSTGS PGSSPSA STGTGPGTPGSGTASSSPGSSTPSGATGSP GTPGSGTASSSPGSSTPSGATTGSPGSSPSASTGTGPGSSPSASTGTGPG ASPGTSST GSPGASPGTSSTGSPGSSTPSGATGSPGSSPSASTGTGPGASPGTSSTGS PGSSPSA STGTGPGTPGSGTASSSPGSSTPSGATGSP AG144_A (SEQ ID NO: 60) AG144_A (SEQ ID NO: 60) GASPGTSSTGSPGSSPSASTGTGPGSSPSASTGTGPGTPGSGTASSSPGS STPSGATGSPGSSPSASTGTGPGASPGTSSTGSPGTPGSGTASSSPGSST PSGATGSPGTPGSGTASSSPGASPGTSSTGSPGASPGTSSTGSP GASPGTSSTGSPGSSPSASTGTGPGSSPSASTGTGPGTPGSGTASSSPGS STPSGATTGSPGSSPSASTGTGPGASPGTSSTGSPGTPGSGTASSSPGSST PSGATGSPGTPGSGTASSSPGASPGTSSTGSPGASPGTSSTGSP AG144_B (SEQ ID NO: 61) AG144_B (SEQ ID NO: 61) GTPGSGTASSSPGSSTPSGATGSPGASPGTSSTGSPGTPGSGTASSSPGS STPSGATGSPGSSPSASTGTGPGSSPSASTGTGPGSSTPSGATGSPGSST PSGATGSPGASPGTSSTGSPGASPGTSSTGSPGASPGTSSTGSP GTPGSGTASSSPGSSTPSGATGSPGASPGTSSTGSPGTPGSGTASSSPGS STPSGATGSAPGSSPSASTGTGPGSSPSASTGTGPGSSTPSGATGSPGSST PSGATGSPGASPGTSSTGSPGASPGTSSTGSPGASPGTSSTGSP AG144_C (SEQ ID NO: 62) AG144_C (SEQ ID NO: 62) GTPGSGTASSSPGASPGTSSTGSPGASPGTSSTGSPGASPGTSSTGSPGS SPSASTGTGPGTPGSGTASSSPGASPGTSSTGSPGASPGTSSTGSPGASP GTSSTGSPGSSTPSGATGSPGSSTPSGATGSPGASPGTSSTGSP GTPGSGTASSSPGASPGTSSTGSPGASPGTSSTGSPGASPGTSSTGSPGS SPSASTGTGPGTPGSGTASSSPGASPGTSSTGSPGASPGTSSTGSPGASP GTSSTGSPGSSTPSGATGSPGSSTPSGATGSPGASPGTSSTGSP AG144_F (SEQ ID NO: 63) AG144_F (SEQ ID NO: 63) GSSPSASTGTGPGSSPSASTGTGPGASPGTSSTGSPGASPGTSSTGSPGS STPSGATGSPGSSPSASTGTGPGASPGTSSTGSPGSSPSASTGTGPGTPG SGTASSSPGSSTPSGATGSPGSSTPSGATGSPGASPGTSSTGSP GSSPSASTGTGPGSSPSASTGTGPGASPGTSSTGSPGASPGTSSTGSPGS STPSGATGSPGSSPSASTGTGPGASPGTSSTGSPGSSPSASTGTGPGTPG SGTASSSPGSSTPSGATGSPGSSTPSGATGSPGASPGTSSTGSP AE288 SEQ ID NO: 8 AE288 SEQ ID NO: 8 GTSESATPESGPGSEPATSGSETPGTSESATPESGPGSEPATSGSETPGT SESATPESG PGTSTEPSEGSAPGSPAGSPTSTEEGTSESATPESGPGSEPATSGSETPG TSESATPES GPGSPAGSPTSTEEGSPAGSPTSTEEGTSTEPSEGSAPGTSESATPESGP GTSESATPE SGPGTSESATPESGPGSEPATSGSETPGSEPATSGSETPGSPAGSPTSTE EGTSTEPSE GSAPGTSTEPSEGSAPGSEPATSGSETPGTSESATPESGPGTSTEPSEGS GTSESATPESGPGSEPATSGSETPGTSESATPESGPGSEPATSGSETPGT SESATPESG PGTSTEPSEGSAPGSPAGSPTSTEEGTSESATPESGPGSEPATSGSETPG TSESATPES GPGSPAGSPTSTEEGSPAGSPTSTEEGTSTEPSEGSAPGTSESATPESGP GTSESATPE SGPGTSESATPESGPGSEPATSGSETPGSEPATSGSETPGSPAGSPTSTE EGTSTEPS GSAPGTSTEPSEGSAPGSEPATSGSETPGTSESATPESGPGTSTEPSEGS

- 43 044115- 43 044115

AP AP AE288_2 (SEQ ID NO: 54) AE288_2 (SEQ ID NO: 54) GSPAGSPTSTEEGTSESATPESGPGSEPATSGSETPGTSESATPESGPGT STEPSEGSAPGTSTEPSEGSAPGTSTEPSEGSAPGTSTEPSEGSAPGTST EPSEGSAPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSESA TPESGPGSEPATSGSETPGTSESATPESGPGSEPATSGSETPGTSESATP ESGPGTSTEPSEGSAPGTSESATPESGPGSPAGSPTSTEEGSPAGSPTST EEGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAP GSPAGSPTSTEEGTSESATPESGPGSEPATSGSETPGTSESATPESGPGT STEPSEGSAPGTSTEPSEGSAPGTSTEPSEGSAPGTSTEPSEGSAPGTST EPSEGSAPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSESA TPESGPGSEPATSGSETPGTSESATPESGPGSEPATSGSETPGTSESATP ESGPGTSTEPSEGSAPGTSESATPESGPGSPAGSP TSTEEGSPAGSPTST EEGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAP AG288 SEQ ID NO: 19 AG288 SEQ ID NO: 19 PGASPGTSSTGSPGASPGTSSTGSPGTPGSGTASSSPGSSTPSGATGSPG TPGSGTASS SPGSSTPSGATGSPGTPGSGTASSSPGSSTPSGATGSPGSSTPSGATGSP GSSPSASTG TGPGSSPSASTGTGPGASPGTSSTGSPGTPGSGTASSSPGSSTPSGATGS PGSSPSAST GTGPGSSPSASTGTGPGASPGTSSTGSPGASPGTSSTGSPGSSTPSGAT GSPGSSPSAS TGTGPGASPGTSSTGSPGSSPSASTGTGPGTPGSGTASSSPGSSTPSGA TGS PGASPGTSSTGSPGASPGTSSTGSPGTPGSGTASSSPGSSTPSGATGSPG TPGSGTASS SPGSSTPSGATGSPGTPGSGTASSSPGSSTPSGATGSPGSSTPSGATGSP GSSPSASTG TGPGSSPSASTGTGPGASPGTSSTGSPGTPGSGTASSSPGSSTPSGATTGS PGSSPSAST GTGPGSSPSASTGTGPGASPGTSSTGSPGASPGTSSTGSPGSSTPSGAT GSPGSSPSAS TGTGPGGASPGTSSTGSPGSSPSASTGTGPGTPGSGTASSSPGSSTPSGA TGS AE576 SEQ ID NO: 16 AE576 SEQ ID NO: 16 GSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGT STEPSEGSA PGTSTEPSEGSAPGTSESATPESGPGSEPATSGSETPGSEPATSGSETPG SPAGSPTST EEGTSESATPESGPGTSTEPSEGSAPGTSTEPSEGSAPGSPAGSPTSTEE GTSTEPSEG SAPGTSTEPSEGSAPGTSESATPESGPGTSTEPSEGSAPGTSESATPESG PGSEPATSG SETPGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGTSESATPES GPGSPAGSP TSTEEGTSESATPESGPGSEPATSGSETPGTSESATPESGPGTSTEPSEG SAPGTSTEP SEGSAPGTSTEPSEGSAPGTSTEPSEGSAPGTSTEPSEGSAPGTSTEPSE GSAPGSPAG SPTSTEEGTSTEPSEGSAPGTSESATPESGPGSEPATSGSETPGTSESAT PESGPGSEP ATSGSETPGTSESATPESGPGTSTEPSEGSAPGTSESATPESGPGSPAGS PTSTEEGSP AGSPTSTEEGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAP GSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGT STEPSEGSA PGTSTEPSEGSAPGTSESATPESGPGSEPATSGSETPGSEPATSGSETPG SPAGSPTST EEGTSESATPESGPGTSTEPSEGSAPGTSTEPSEGSAPGSPAGSPTSTEE GTSTEPSEG SAPGTSTEPSEGSAPGTSESATPESGPGTSTEPSEGSAPGTSESATPESG PGSEPATSG SETPGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGTSESATPES GPGSPAGSP TSTEEGTSESATPESGPGSEPATSGSETPGTSESATPESGPGTSTEPSEG SAPGTSTEP SEGSAPGTSTEPSEGSAPGTSTEPSEGSAPGTSTEPSEGSAPGTSTEPSE GSAPGSPAG SPTSTEEGTSTEPSEGSAPGTSESATPESGPGSEPATSGSETPGTSESAT PESGPGSEP ATSGSETPGTSESATPESGPGTSTEPSEGSAPGTSESATPESGPGSPAGS PTSTEEGSP AGSPTSTEEGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAP AG576 SEQ ID NO: 18 AG576 SEQ ID NO: 18 PGTPGSGTASSSPGSSTPSGATGSPGSSPSASTGTGPGSSPSASTGTGPG SSTPSGATG SPGSSTPSGATGSPGASPGTSSTGSPGASPGTSSTGSPGASPGTSSTGSP GTPGSGTAS SSPGASPGTSSTGSPGASPGTSSTGSPGASPGTSSTGSPGSSPSASTGTG PGTPGSGTA SSSPGASPGTSSTGSPGASPGTSSTGSPGASPGTSSTGSPGSSTPSGATG SPGSSTPSG ATGSPGASPGTSSTGSPGTPGSGTASSSPGSSTPSGATGSPGSSTPSGAT GSPGSSTPS GATGSPGSSPSASTGTGPGASPGTSSTGSPGASPGTSSTGSPGTPGSGT ASSSPGASPG TSSTGSPGASPGTSSTGSPGASPGTSSTGSPGASPGTSSTGSPGTPGSGT ASSSPGSST PGTPGSGTASSSPGSSTPSGATGSPGSSPSASTGTGPGSSPSASTGTGPG SSTPSGATG SPGSSTPSGATGSPGASPGTSSTGSPGASPGTSSTGSPGASPGTSSTGSP GTPGSGTAS SSPGASPGTSSTGSPGASPGTSSTGSPGASPGTSSTGSPGSSPSASTGTG PGTPGSGTA SSSPGASPGTSSTGSPGASPGTSSTGSPGASPGTSSTGSPGSSTPSGATG SPGSSTPSG ATGSPGASPGTSSTGSPGTPGSGTASSSPGSSTPSGATGSPGSSTPSGAT GSPGSSTPS GATGSPGSSPSASTGTGPGASPGTSSTGSPGASPGTSSTGSPGTPGSGT ASSSPGASPG TSSTGSPGASPGTSSTGSPGASPGTSSTGSPGASPGTSSTGSPGTPGSGT ASSSPGSST

- 44 044115- 44 044115

PSGATGSPGTPGSGTASSSPGSSTPSGATGSPGTPGSGTASSSPGSSTPS GATGSPGSS TPSGATGSPGSSPSASTGTGPGSSPSASTGTGPGASPGTSSTGSPGTPGS GTASSSPGS STPSGATGSPGSSPSASTGTGPGSSPSASTGTGPGASPGTSSTGS PSGATGSPGTPGSGTASSSPGSSTPSGATGSPGTPGSGTASSSPGSSTPS GATGSPGSS TPSGATGSPGSSPSASTGTGPGSSPSASTGTGPGASPGTSSTGSPGTPGS GTASSSPGS STPSGATTGSPGSSPSASTGTGPGSSPSASTGTGPGASPGTSSTGS АЕ864 SEQ ID NO: 15 AG864 SEQ ID NO: 17 AE864 SEQ ID NO: 15 AG864 SEQ ID NO: 17 GSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGT STEPSEGSA PGTSTEPSEGSAPGTSESATPESGPGSEPATSGSETPGSEPATSGSETPG SPAGSPTST EEGTSESATPESGPGTSTEPSEGSAPGTSTEPSEGSAPGSPAGSPTSTEE GTSTEPSEG SAPGTSTEPSEGSAPGTSESATPESGPGTSTEPSEGSAPGTSESATPESG PGSEPATSG SETPGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGTSESATPES GPGSPAGSP TSTEEGTSESATPESGPGSEPATSGSETPGTSESATPESGPGTSTEPSEG SAPGTSTEP SEGSAPGTSTEPSEGSAPGTSTEPSEGSAPGTSTEPSEGSAPGTSTEPSE GSAPGSPAG SPTSTEEGTSTEPSEGSAPGTSESATPESGPGSEPATSGSETPGTSESAT PESGPGSEP ATSGSETPGTSESATPESGPGTSTEPSEGSAPGTSESATPESGPGSPAGS PTSTEEGSP AGSPTSTEEGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGTSES ATPESGPGS EPATSGSETPGTSESATPESGPGSEPATSGSETPGTSESATPESGPGTST EPSEGSAPG SPAGSPTSTEEGTSESATPESGPGSEPATSGSETPGTSESATPESGPGSP AGSPTSTEE GSPAGSPTSTEEGTSTEPSEGSAPGTSESATPESGPGTSESATPESGPGT SESATPESG PGSEPATSGSETPGSEPATSGSETPGSPAGSPTSTEEGTSTEPSEGSAPG TSTEPSEGS APGSEPATSGSETPGTSESATPESGPGTSTEPSEGSAP GASPGTSSTGSPGSSPSASTGTGPGSSPSASTGTGPGTPGSGTASSSPGS STPSGATGS PGSSPSASTGTGPGASPGTSSTGSPGTPGSGTASSSPGSSTPSGATGSPG TPGSGTASS SPGASPGTSSTGSPGASPGTSSTGSPGTPGSGTASSSPGSSTPSGATGSP GASPGTSST GSPGTPGSGTASSSPGSSTPSGATGSPGSSPSASTGTGPGSSPSASTGTG PGSSTPSGA TGSPGSSTPSGATGSPGASPGTSSTGSPGASPGTSSTGSPGASPGTSSTG SPGTPGSGT ASSSPGASPGTSSTGSPGASPGTSSTGSPGASPGTSSTGSPGSSPSASTG TGPGTPGSG TASSSPGASPGTSSTGSPGASPGTSSTGSPGASPGTSSTGSPGSSTPSGA TGSPGSSTP SGATGSPGASPGTSSTGSPGTPGSGTASSSPGSSTPSGATGSPGSSTPSG ATGSPGSST PSGATGSPGSSPSASTGTGPGASPGTSSTGSPGASPGTSSTGSPGTPGS GTASSSPGAS GSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGT STEPSEGSA PGTSTEPSEGSAPGTSESATPESGPGSEPATSGSETPGSEPATSGSETPG SPAGSPTST EEGTSESATPESGPGTSTEPSEGSAPGTSTEPSEGSAPGSPAGSPTSTEE GTSTEPSEG SAPGTSTEPSEGSAPGTSESATPESGPGTSTEPSEGSAPGTSESATPESG PGSEPATSG SETPGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGTSESATPES GPGSPAGSP TSTEEGTSESATPESGPGSEPATSGSETPGTSESATPESGPGTSTEPSEG SAPGTSTEP SEGSAPGTSTEPSEGSAPGTSTEPSEGSAPGTSTEPSEGSAPGTSTEPSE GSAPGSPAG SPTSTEEGTSTEPSEGSAPGTSESATPESGPGSEPATSGSETPGTSESAT PESGPGSEP ATSGSETPGTSESATPESGPGTSTEPSEGSAPGTSESATPESGPGSPAGS PTSTEEGSP AGSPTSTEEGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGTSES ATPESGPGS EPATSGSETPGTSESATPESGPGSEPATSGSETPGTSESATPESGPGTST EPSEGSAPG SPAGSPTSTEEGTSESATPESGPGSEPATSGSETPGTSESATPESGPGSP AGSPTSTEE GSPAGSPTSTEEGTSTEPSEGSAPGTSESATPESGPGTSESATPESGPGT SESATPESG PGSEPATSGSETPGSEPATSGSETPGSPAGSPTSTEEGTSTEPSEGSAPG TSTEPSEGS APGSEPATSGSETPGTSESATPESGPGTSTEPSEGSAP GASPGTSSTGSPGSSPSASTGTGPGSSPSASTGTGPGTPGSGTASSSPGS STPSGATGS PGSSPSASTGTGPGASPGTSSTGSPGTPGSGTASSSPGSSTPSGATGSPG TPGSGTASS SPGASPGTSSTGSPGASPGTSSTGSPGTPGSGTASSSPGSSTPSGATGSP GASPGTSST GSPGTPGSGTASSSPGSSTPSGATTGSPGSSPSASTGTGPGSSPSASTGTG PGSSTPSGA TGSPGSSTPSGATGSPGASPGTSSTGSPGASPGTSSTGSPGASPGTSSTG SPGTPGSGT ASSSPGASPGTSSTGSPGASPGTSSTGSPGASPGTSSTGSPGSSPSASTG TGPGTPGSG TASSSPGASPGTSSTGSPGASPGTSSTGSPGASPGTSSTGSPGSSTPSGA TGSPGSSTP SGATGSPGASPGTSSTGSPGTPGSGTASSSPGSSTPSGATGSPGSSTPSG ATGSPGSST PSGATGSPGSSPSASTGTGPGASPGTSSTGSPGASPGTSSTGSPGTPGS GTASSSPGAS PGTSSTGSPGASPGTSSTGSPGASPGTSSTGSPGASPGTSSTGSPGTPGS GTASSSPGS STPSGATGSPGTPGSGTASSSPGSSTPSGATGSPGTPGSGTASSSPGSST PSGATGSPG SSTPSGATGSPGSSPSASTGTGPGSSPSASTGTGPGASPGTSSTGSPGTP GSGTASSSP GSSTPSGATGSPGSSPSASTGTGPGSSPSASTGTGPGASPGTSSTGSPG ASPGTSSTGS PGSSTPSGATGSPGSSPSASTGTGPGASPGTSSTGSPGSSPSASTGTGPG TPGSGTASS SPGSSTPSGATGSPGSSTPSGATGSPGASPGTSSTGSP PGTSSTGSPGASPGTSSTGSPGASPGTSSTGSPGASPGTSSTGSPGTPGS GTASSSPGS STPSGAATGSPGTPGSGTASSSPGSSTPSGATGSPGTPGSGTASSSPGSST PSGATGSPG SSTPSGATGSPGSSPSASTGTGPGSSPSASTGTGPGASPGTSSTGSPGTP GSGTASSSP GSSTPSGATGSPGSSPSASTGTGPGSSPSASTGTGPGASPGTSSTGSPG ASPGTSSTGS PGSSTPSGATGSPGSSPSASTGTGPGASPGTSSTGSPGSSPSASTGTGPG TPGSGTASS SPGSSTPSGATGSPGSSTPSGATGSPGASPGTSSTGSP

В тех вариантах реализации изобретения, в которых компонент(ы) XTEN менее чем на 100% состоят из аминокислот 4, 5 или 6 типов, выбранных из глицина (G), аланина (А), серина (S), треонина (Т),In those embodiments in which the XTEN component(s) are composed of less than 100% amino acid types 4, 5, or 6 selected from glycine (G), alanine (A), serine (S), threonine (T),

- 45 044115 глутамата (Е) и пролина (Р), или менее 100% последовательности состоит из мотивов последовательности из табл. 3 или последовательностей XTEN из табл. 4 и 13-17, другие аминокислотные остатки в XTEN могут быть выбраны из любой из остальных 14 природных L-аминокислот, но предпочтительно из гидрофильных аминокислот, таких, чтобы последовательность XTEN содержала по меньшей мере около 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, или по меньшей мере около 99% гидрофильных аминокислот. Аминокислоты XTEN, которые не являются глицином (G), аланином (А), серином (S), треонином (Т), глутаматом (E) и пролином (P) могут быть распределены по всей последовательности XTEN, могут быть расположены внутри или между мотивами последовательности или могут быть сконцентрированы в виде одного или более участков последовательности XTEN, например, чтобы создать линкер между XTEN и компонентами FVIII или ФВ. В тех случаях, когда компонент XTEN содержит аминокислоты, отличные от глицина (G), аланина (A), серина (S), треонина (T), глутамата (E) и пролина (P), предпочтительно, чтобы менее чем около 2% или менее чем около 1% аминокислотных остатков были гидрофобными, так чтобы полученные в результате последовательности в целом были лишены вторичной структуры, например, имели не более 2% альфа-спиралей или 2% бета-листов, как определено способами, описанными в настоящем документе. Гидрофобные остатки, менее предпочтительные в структуре XTEN, включают триптофан, фенилаланин, тирозин, лейцин, изолейцин, валин и метионин. Кроме того, можно спроектировать последовательности XTEN таким образом, чтобы они содержали менее 5% или менее 4%, или менее 3%, или менее 2%, или менее 1% или не содержали ни одну из следующих аминокислот: цистеин (во избежание образования дисульфида и окисления), метионин (во избежание окисления), аспарагин и глутамин (во избежание дезамидирования). Таким образом, в некоторых вариантах реализации изобретения компонент XTEN, содержащий другие аминокислоты в дополнение к глицину (G), аланину (A), серину (S), треонину (T), глутамату (E) и пролину (P), имеет последовательность с менее чем 5% остатков, содействующих образованию альфа-спиралей и бета-листов, согласно алгоритму Чоу-Фасмана, и имеет по меньшей мере 90%, или по меньшей мере около 95%, или больше структур статистического клубка, согласно алгоритму GOR.- 45 044115 glutamate (E) and proline (P), or less than 100% of the sequence consists of sequence motifs from table. 3 or XTEN sequences from table. 4 and 13-17, other amino acid residues in XTEN may be selected from any of the remaining 14 natural L-amino acids, but preferably from hydrophilic amino acids such that the XTEN sequence contains at least about 90%, 91%, 92%, 93 %, 94%, 95%, 96%, 97%, 98%, or at least about 99% hydrophilic amino acids. XTEN amino acids that are not glycine (G), alanine (A), serine (S), threonine (T), glutamate (E), and proline (P) may be distributed throughout the XTEN sequence, may be located within or between motifs sequences or may be concentrated into one or more regions of the XTEN sequence, for example, to create a linker between XTEN and FVIII or VWF components. Where the XTEN component contains amino acids other than glycine (G), alanine (A), serine (S), threonine (T), glutamate (E) and proline (P), it is preferable that less than about 2% or less than about 1% of the amino acid residues are hydrophobic such that the resulting sequences generally lack secondary structure, e.g., having no more than 2% alpha helices or 2% beta sheets, as determined by the methods described herein. Hydrophobic residues less favored in the XTEN structure include tryptophan, phenylalanine, tyrosine, leucine, isoleucine, valine, and methionine. Additionally, XTEN sequences can be designed to contain less than 5%, or less than 4%, or less than 3%, or less than 2%, or less than 1%, or none of the following amino acids: cysteine (to avoid disulfide formation and oxidation), methionine (to avoid oxidation), asparagine and glutamine (to avoid deamidation). Thus, in some embodiments, an XTEN component containing other amino acids in addition to glycine (G), alanine (A), serine (S), threonine (T), glutamate (E), and proline (P) has the sequence less than 5% of the residues contributing to the formation of alpha helices and beta sheets according to the Chow-Fasman algorithm, and has at least 90%, or at least about 95% or more random coil structures, according to the GOR algorithm.

В дополнительных вариантах реализации изобретения последовательность XTEN, применяемая в настоящем изобретении, влияет на физическое или химическое свойство, например, фармакокинетику химерного белка по данному изобретению. Последовательность XTEN, применяемая в данном изобретении, может проявлять одно или более из следующих полезных свойств: конформационную гибкость, повышенную растворимость в водной среде, высокую степень устойчивости к протеазам, низкую иммуногенность, низкое сродство с рецепторами клеток млекопитающих и увеличенные гидродинамические (или Стокса) радиусы. В конкретном варианте реализации изобретения последовательность XTEN, связанная с белком FVIII по данному изобретению, улучшает фармакокинетические свойства, такие как увеличение терминального периода полувыведения и увеличение площади под кривой (AUC) таким образом, что химерный белок, описанный в данном документе, остается in vivo увеличенный период времени по сравнению с диким типом FVIII. В дополнительных вариантах реализации изобретения последовательность XTEN, применяемая в настоящем изобретении, улучшает фармакокинетические свойства, такие как увеличение терминального периода полувыведения или увеличение площади под кривой (AUC) таким образом, что белок FVIII остается in vivo увеличенный период времени по сравнению с диким типом FVIII.In additional embodiments, the XTEN sequence used in the present invention affects the physical or chemical property, for example, the pharmacokinetics of the chimeric protein of the present invention. The XTEN sequence used in this invention may exhibit one or more of the following beneficial properties: conformational flexibility, increased aqueous solubility, high protease resistance, low immunogenicity, low affinity for mammalian cell receptors, and increased hydrodynamic (or Stokes) radii . In a specific embodiment, the XTEN sequence linked to the FVIII protein of the present invention improves pharmacokinetic properties such as increased terminal half-life and increased area under the curve (AUC) such that the chimeric protein described herein remains increased in vivo time period compared to wild type FVIII. In additional embodiments, the XTEN sequence used in the present invention improves pharmacokinetic properties, such as increasing the terminal half-life or increasing the area under the curve (AUC) such that the FVIII protein remains in vivo for an increased period of time compared to wild type FVIII.

Один вариант реализации по данному изобретению представляет собой слитый белок FVIII/ФВ, содержащий часть FVIII, слитую с фрагментом Fc, и часть ФВ, слитую с Fc фрагментом, в котором последовательность XTEN (например, AE288) вставляется в часть FVIII, и в котором последовательность XTEN содержит менее 288 аминокислот (например, AE144) вставляется между частью ФВ и фрагментом Fc. Как описано в примерах, вставка XTEN, имеющая менее 288 аминокислот, между частью ФВ и частью Fc имеет большее влияние на фармакокинетику химерного белка, чем вставка XTEN, имеющей 288 аминокислот, между частью ФВ и частью Fc. Например, вставка последовательности XTEN, имеющая менее 288 аминокислот, между участком ФВ и фрагментом Fc в слитый белок FVIII/ФВ может увеличить конечный период полувыведения химерного белка по сравнению с XTEN, имеющей 288 аминокислот. В некоторых вариантах реализации изобретения конечный период полувыведения увеличивается по меньшей мере на около 5% по меньшей мере на около 10% по меньшей мере на около 15% по меньшей мере на около 20% по меньшей мере на около 25%, или по меньшей мере, на кололо 30%, по сравнению со вставкой последовательности XTEN, имеющей 288 аминокислот. В одном конкретном варианте реализации изобретения конечный период полувыведения увеличивается по меньшей мере на около 35% по сравнению со вставкой XTEN, имеющей 288 аминокислот. Вставка последовательности XTEN, имеющая менее 288 аминокислот, может также увеличить значение AUC химерного белка. В некоторых вариантах реализации изобретения значение AUC увеличивается по меньшей мере на около 50%, по меньшей мере на около 100%, или по меньшей мере на около 200% по сравнению со вставкой XTEN, имеющей 288 аминокислот. В конкретном варианте реализации изобретения значение AUC увеличивается примерно в 2 раза. Вставка последовательности XTEN, имеющая менее 288 аминокислот, может также уменьшить клиренс химерного белка. Например, клиренс может быть уменьшен по меньшей мере на около 5% по меньшей мере на около 10% по меньшей мере на около 15% по меньшей мере на около 20% по меньшейOne embodiment of the present invention is a FVIII/VWF fusion protein comprising a FVIII portion fused to an Fc fragment and a VWF portion fused to an Fc fragment, in which an XTEN sequence (e.g., AE288) is inserted into the FVIII portion, and in which the sequence XTEN contains less than 288 amino acids (eg AE144) and is inserted between the VWF portion and the Fc fragment. As described in the Examples, an XTEN insertion of less than 288 amino acids between the VWF portion and the Fc portion has a greater impact on the pharmacokinetics of the chimeric protein than an XTEN insertion of 288 amino acids between the VWF portion and the Fc portion. For example, insertion of an XTEN sequence of less than 288 amino acids between the VWF region and the Fc fragment in an FVIII/VWF fusion protein may increase the terminal half-life of the chimeric protein compared to XTEN having 288 amino acids. In some embodiments, the terminal half-life is increased by at least about 5%, at least about 10%, at least about 15%, at least about 20%, at least about 25%, or at least by 30% compared to the insertion of the XTEN sequence, which has 288 amino acids. In one particular embodiment, the terminal half-life is increased by at least about 35% compared to the XTEN insert having 288 amino acids. Insertion of an XTEN sequence of less than 288 amino acids may also increase the AUC value of the chimeric protein. In some embodiments, the AUC value is increased by at least about 50%, at least about 100%, or at least about 200% compared to an XTEN insert having 288 amino acids. In a specific embodiment of the invention, the AUC value is increased by approximately 2 times. An insertion of an XTEN sequence of less than 288 amino acids may also reduce the clearance of the chimeric protein. For example, clearance may be reduced by at least about 5% at least about 10% at least about 15% at least about 20% at least

- 46 044115 мере на около 25%, или по меньшей мере, на кололо 30%, по сравнению со вставкой последовательности- 46 044115 at least about 25%, or at least about 30%, compared to the insertion sequence

XTEN, имеющей 288 аминокислот. Вставка последовательности XTEN, имеющая менее 288 аминокислот, может увеличить среднее время удержания препарата (MRT) и/или уменьшить кажущийся объем распределения в равновесном состоянии (Vss) по отношению к вставке XTEN, имеющей 288 аминокислот.XTEN, which has 288 amino acids. An XTEN sequence insert having less than 288 amino acids may increase the drug's mean retention time (MRT) and/or decrease the apparent volume of distribution at steady state (Vss) relative to an XTEN insert having 288 amino acids.

Различные способы и анализы могут быть использованы для определения физических/химических свойств белков, содержащих последовательность XTEN. Такие способы включают в себя, но не ограничиваются ими, аналитическое центрифугирование, ЭПР, ионообменную ВЭЖХ, эксклюзионную ВЭЖХ, обращенно-фазовую ВЭЖХ, светорассеяние, капиллярный электрофорез, круговой дихроизм, дифференциальную сканирующую калориметрию, флуоресценцию, ионообменную ВЭЖХ, эксклюзионную ВЭЖХ, ИК, ЯМР, раман-спектроскопию, рефрактометрию и УФ/видимую спектроскопию. Дополнительные способы описаны в Amau et al., Prot Expr and Purif 48, 1-13 (2006 год).Various methods and assays can be used to determine the physical/chemical properties of proteins containing the XTEN sequence. Such methods include them, but are not limited by them, analytical centrifugation, EPR, ion-exchange EVE, exclusive EHH, faceted-phase VEZH, lighting scraping, capillary electrophoresis, circular dichroism, differential scanning calorimetry, fluorescence, ion-exchanging VEZH, ex-exclusive veh JH, ik, yamr , Raman spectroscopy, refractometry and UV/visible spectroscopy. Additional methods are described in Amau et al., Prot Expr and Purif 48, 1-13 (2006).

Дополнительные примеры последовательностей XTEN, которые могут быть использованы в соответствии с данным изобретением, и раскрыты в патентных публикациях США № 2010/0239554 A1, 2010/0323956 A1, 2011/0046060 A1, 2011/0046061 A1, 2011/0077199 A1 или 2011/0172146 A1, или международных патентных публикациях № WO 2010091122 A1, WO 2010144502 A2, WO 2010144508 A1, WO 2011028228 A1, WO 2011028229 A1, WO 2011028344 A2 или WO 20130122617 A1.Additional examples of XTEN sequences, which can be used in accordance with this invention, and disclosed in the patent publications of the USA No. 2010/0239554 A1, 2010/0323956 A1, 2011/0046060 A1, 2011/0046061 A1, 2011/0077199 A1 or 2011/0172146 A1, or international patent publications No. WO 2010091122 A1, WO 2010144502 A2, WO 2010144508 A1, WO 2011028228 A1, WO 2011028229 A1, WO 2011028344 A2 or WO 20130122617 A1 .

II.C. Белок фактора VIII (FVIII).II.C. Factor VIII (FVIII) protein.

В данном контексте белок FVIII означает функциональный полипептид FVIII в его нормальной роли в процессе коагуляции, если не указано иное. Термин белок FVIII включает в себя функциональный фрагмент, вариант, аналог или его производное, которое сохраняет функцию полоноразмероного фактора VIII дикого типа в каскаде реакций коагуляции. Белок FVIII взаимозаменяемо используется с полипептидом (или белком) FVIII или FVIII. Примеры функций FVIII включают, но не ограничиваются ими, способность активировать коагуляцию, способность выступать в качестве кофактора для фактора ГХ, или способность образовывать теназный комплекс с фактором IX в присутствии Ca2+ и фосфолипидов, которые затем преобразует фактор X в активированную форму Ха. Белок FVIII может быть человеческий, свиной, собачий, крысиный или мышиный белок FVIII. Кроме того, сравнение человеческого FVIII с FVIII других видов выявило наличие консервативных остатков, которые могут быть необходимыми для выполнения функции (Cameron et al., Thromb. Haemost. 79:317-22 (1998 год); US 6,251,632).As used herein, FVIII protein means functional FVIII polypeptide in its normal role in the coagulation process unless otherwise indicated. The term FVIII protein includes a functional fragment, variant, analog or derivative thereof that retains the function of full-length wild-type FVIII in the coagulation cascade. FVIII protein is used interchangeably with FVIII or FVIII polypeptide (or protein). Examples of FVIII functions include, but are not limited to, the ability to activate coagulation, the ability to act as a cofactor for factor GC, or the ability to form a tenase complex with factor IX in the presence of Ca 2+ and phospholipids, which factor X then converts to the activated form Xa. The FVIII protein can be human, porcine, canine, rat or mouse FVIII protein. In addition, comparison of human FVIII with FVIII from other species has revealed the presence of conserved residues that may be essential for function (Cameron et al., Thromb. Haemost. 79:317-22 (1998); US 6,251,632).

Для оценки функции системы свертывания крови имеется ряд тестов: определение активированного частичного тромбопластинового времени (АЧТВ), хромогенный анализ, ротационная тромбоэластометрия, определение протромбинового времени (ПТВ) (используется также для определения MHO), определение фибриногена (часто методом Клауса), определение количества тромбоцитов, определение тромбоцитарной функции (часто посредством PFA-100), определение тромбинового времени, определение времени кровотечения, смешанный анализ (исправляется ли отклонение от нормы, если плазму пациента смешать с нормальной плазмой), определение фактора свертывания крови, определение антифосфолипидных антител, определение D-димеров, генетические тесты (например, фактор V Лейдена, протромбиновая мутация G20210A), определение времени разбавленного яда гадюки Рассела (dRVVT), различные функциональные тесты тромбоцитов, тромбоэластография (ТЭГ или Sonoclot), тромбоэластометрия (ТЕМ®, например, ROTEM®) или определение времени лизиса эуглобулина (ELT).A number of tests are available to assess the function of the blood coagulation system: activated partial thromboplastin time (aPTT), chromogenic analysis, rotational thromboelastometry, prothrombin time (PTT) (also used to determine MHO), fibrinogen determination (often by the Claus method), platelet count determination , platelet function test (often by PFA-100), thrombin time test, bleeding time test, mixed test (whether the abnormality is corrected if the patient's plasma is mixed with normal plasma), clotting factor test, antiphospholipid antibody test, D- test dimers, genetic tests (eg, factor V Leiden, prothrombin mutation G20210A), dilute Russell's viper venom time (dRVVT), various platelet function tests, thromboelastography (TEG or Sonoclot), thromboelastometry (TEM®, eg, ROTEM®) or determination Euglobulin lysis time (ELT).

Тест АЧТВ является показателем эффективности измерения эффективности как внутренних (также известный как внутренний путь активации свёртывания крови) так и общих каскадов коагуляции. Этот тест обычно используется для измерения коагулирующей активности коммерчески доступных рекомбинантных факторов свертывания крови, например, FVIII или FIX. Он используется в сочетании с тестом на определение протромбинового времени (ПТВ), который измеряет внешний путь активации свёртывания крови.The APTT test is a performance indicator measuring the efficiency of both intrinsic (also known as the intrinsic pathway of coagulation activation) and common coagulation cascades. This test is commonly used to measure the coagulating activity of commercially available recombinant coagulation factors such as FVIII or FIX. It is used in conjunction with the prothrombin time (PT) test, which measures the extrinsic pathway of activation of blood clotting.

Ротационная тромбоэластометрия предоставляет информацию о всей кинетики гемостаза: время свертывания крови, образование сгустков, стабильность сгустков и лизис. Различные параметры тромбоэластометрии зависят от активности плазматической системы свертывания, функции тромбоцитов, фибринолиза или многих факторов, которые влияют на эти взаимодействия. Этот анализ может предоставить полное представление о вторичном гемостазе.Rotational thromboelastometry provides information on the entire kinetics of hemostasis: clotting time, clot formation, clot stability and lysis. Various parameters of thromboelastometry depend on the activity of the plasmatic coagulation system, platelet function, fibrinolysis, or many factors that influence these interactions. This analysis can provide a complete picture of secondary hemostasis.

Полипептид FVIII и последовательности полинуклеотидов являются известными, как и многие другие функциональные фрагменты, мутанты и их модифицированные варианты. Примеры последовательностей человеческого FVIII (полноразмерные) приведены ниже.The FVIII polypeptide and polynucleotide sequences are known, as are many other functional fragments, mutants and modified variants thereof. Examples of human FVIII sequences (full length) are given below.

Табл. 3. Аминокислотная последовательность полноразмерного фактора VIII (Полноразмерный FVIII (сигнальный пептид FVIII подчеркнут; FVIII тяжелой цепи дважды подчеркнут; Домен В выделен курсивом; и FVIII легкой цепи представлен в виде обычного текста).Table 3. Amino acid sequence of full-length factor VIII (Full-length FVIII (FVIII signal peptide is underlined; heavy chain FVIII is double underlined; Domain B is in italics; and light chain FVIII is presented in plain text).

- 47 044115- 47 044115

Таблица 3Table 3

Сигнальный пептид: (SEQ Ш NO: 64)Signal peptide: (SEQ Ш NO: 64)

MQIELSTCFFLCLLRFCFSMQIELSTCFFLCLLRFCFS

Зрелый фактор VIII (SEQ Ш NO: 65)*Mature factor VIII (SEQ Ш NO: 65)*

ATRRYYLGAVELSWDYMOSDLGELPVDARFPPRVPKSFPFNTSVVYKKTLFVEF TDHLFNIAKPRPPWMGLLGPTIOAEVYDTVVITLKNMASHPVSLHAVGVSYWKASEGA EYDDOTSOREKEDDKVFPGGSHTYVWOVLKENGPMASDPLCLTYSYLSHVDLVKDLN SGLIGALLVCREGSLAKEKTOTLHKFILLFAVFDEGKSWHSETKNSLMODRDAASARA WPKMHTVNGYVNRSLPGLIGCHRKSVYWHVIGMGTTPEVHSIFLEGHTFLVRNHRQAS LEISPITFLTAOTLLMDLGOFLLFCHISSHOHDGMEAYVKVDSCPEEPOLRMKNNEEAED YDDDLTDSEMDVVRFDDDNSPSFIOIRSVAKKHPKTWVHYIAAEEEDWDYAPLVLAPD DRSYKSOYLNNGPORIGRKYKKVRFMAYTDETFKTREAIOHESGILGPLLYGEVGDTLLI IFKNOASRPYNIYPHGITDVRPLYSRRLPKGVKHLKDFPILPGEIFKYKWTVTVEDGPTKS DPRCLTRYYSSFVNMERDLASGLIGPLLICYKESVDORGNOIMSDKRNVILFSVFDENRS WYLTENIORFLPNPAGVOLEDPEFOASNIMHSINGYVFDSLOLSVCLHEVAYWYILSIGA OTDFLSVFFSGYTFKHKMVYEDTLTLFPFSGETVFMSMENPGLWILGCHNSDFRNRGMT ALLKVSSCDKNTGDYYEDSYEDISAYLLSKNNAIEPRSFSQNSRHPSTRQKQFNATTTPEN DIEKTDPWFAHRTPMPKIQNVSSSDLLMLLRQSPTPHGLSLSDLQEAKYETFSDDPSPGAIDS NNSLSEMTHFRPQLHHSGDMVFTPESGLQLRLNEKLGTTAATELKKLDFKVSSTSNNLISTIPS DNLAAGTDNTSSLGPPSMPVHYDSQLDTTLFGKKSSPLTESGGPLSLSEENNDSKLLESGLMN SQESSWGKNVSSTESGRLFKGKRAHGPALLTKDNALFKVSISLLICrNKTSNNSArNRKTHIDGP SLLIENSPSVWQNILESDTEFKKVrPLIHDRMLMDKNATALRLNHMSNKTTSSKNMEMVQQK KEGPIPPDAQNPDMSFFKMLFLPESARWIQRTHGKNSLNSGQGPSPKQLVSLGPEKSVEGQN FLSEKNKVWGKGEFTKDVGLKEMVFPSSRNLFLINLDNLHENNTHNQEKKIQEEIEKKETLI QENWLPQIHTVrGTKNFMKNLFLLSIRQNVEGSYDGAYAPVLQDFRSLNDSTNRTKKHTAH FSKKGEEENLEGLGNQTKQIVEKYACTTRISPNTSQQNFVrQRSKRALKQFRLPLEETELEKRI IVDDTSTQWSKNMKHLTPSTLTQIDYNEKEKGAITQSPLSDCLIRSHSIPQANRSPLPIAKVSSF PSIRPIYLTRVLFQDNSSHLPAASYRKKDSGVQESSHFLQGAKKNNLSLAILTLEMTGDQREVG SLGTSATNSVrYKKVENrVLPKPDLPKTSGKVELLPKVHIYQKDLFPTETSNGSPGHLDLVEGS LLQGTEGAIKWNEANRPGKVPFLRVATESSAKTPSKLLDPLAWDNHYGTQIPKEEWKSQEKS PEKTAFKKKDTILSLNACESNHAIAAINEGQNKPEIEVrWAKQGRTERLCSQNPPVLKRHQREI TRTTLQSDQEEIDYDDTISVEMKKEDFDIYDEDENQSPRSFQKKTRHYFIAAVERLWDY GMSSSPHVLRNRAQSGSVPQFKKVVFQEFTDGSFTQPLYRGELNEHLGLLGPYIRAEVE DNIMVTFRNQASRPYSFYSSLISYEEDQRQGAEPRKNFVKPNETKTYFWKVQHHMAPT KDEFDCKAWAYFSDVDLEKDVHSGLIGPLLVCHTNTLNPAHGRQVTVQEFALFFTIFDE TKSWYFTENMERNCRAPCNIQMEDPTFKENYRFHAINGYIMDTLPGLVMAQDQRIRWY LLSMGSNENIHSIHFSGHVFTVRKKEEYKMALYNLYPGVFETVEMLPSKAGIWRVECLI GEHLHAGMSTLFLVYSNKCQTPLGMASGHIRDFQITASGQYGQWAPKLARLHYSGSIN AWSTKEPFSWIKVDLLAPMIIHGIKTQGARQKFSSLYISQFIIMYSLDGKKWQTYRGNST GTLMVFFGNVDSSGIKHNIFNPPIIARYIRLHPTHYSIRSTLRMELMGCDLNSCSMPLGME SKAISDAQITASSYFTNMFATWSPSKARLHLQGRSNAWRPQVNNPKEWLQVDFQKTMK VTGVTTQGVKSLLTSMYVKEFLISSSQDGHQWTLFFQNGKVKVFQGNQDSFTPVVNSL DPPLLTRYLRIHPQSWVHQIALRMEVLGCEAQDLYATRRYYLGAVELSWDYMOSDLGELPVDARFPPRVPKSFPFNTSVVYKKTLFVEF TDHLFNIAKPRPPWMGLLGPTIOAEVYDTVVITLKNMASHPVSLHAVGVSYWKASEGA EYDDOTSOREKEDDKVFPGGSHTYVWOVLKENGPMASDPLCLTYSYLSHVDLVKDLN SGLIGALLVCREGSLAKEKTOTLHKFILLF AVFDEGKSWHSETKNSLMODRDAASARA WPKMHTVNGYVNRSLPGLIGCHRKSVYWHVIGMGTTPEVHSIFLEGHTFLVRNHRQAS LEISPITFLTAOTLLMDLGOFLLFCHISSHOHDGMEAYVKVDSCPEEPOLRMKNNEEAED YDDDLTDSEMDVVRFDDDNSPSFIOIRSVAKKHPKTWVHYIAAEEEDWDYAPLVLAPD DRSYKSO YLNNNGPORIGRKYKKVRFMAYTDETFKTREAIOHESGILGPLLYGEVGDTLLI IFKNOASRPYNIYPHGITDVRPLYSRRLPKGVKHLKDFPILPGEIFKYKWTVTVEDGPTKS DPRCLTRYYSSFVNMERDLASGLIGPLLICYKESVDORGNOIMSDKRNVILFSVFDENRS WYLTENIORFLPNPAGVOLEDPEFOASNIMHS INGYVFDSLOLSVCLHEVAYWYILSIGA OTDFLSVFFSGYTFKHKMVYEDTLTLFPFSGETVFMSMENPGLWILGCHNSDFRNRGMT ALLKVSSCDKNTGDYYEDSYEDISAYLLSKNNAIEPRSFSQNSRHPSTRQKQFNATTTPEN DIEKTDPWFAHRTPMPKIQNVSSSDLLMLLRQSPTPHGLSLSDLQEAKYETFSDDPS PGaids SLLIENSPSVWQNILESDTEFKKVrPLIHDRMLMDKNATALRLNHMSNKTTSSKNMEMVQQK KEGPIPPDAQNPDMSFFKMLFLPESARWIQRTHGKNSLNSGQGPSPKQLVSLGPEKSVEGQN FLSEKNKVWGKGEFTKDVGLKEMVFPSSRNLFLINLDNLHENNTHNQEKKIQEEIEKKETLI QENW PSIR PIYLTRVLFQDNSSHLPAASYRKKDSGVQESSHFLQGAKKNNLSLAILTLEMTGDQREVG SLGTSATNSVrYKKVENrVLPKPDLPKTSGKVELLPKVHIYQKDLFPTETSNGSPGHLDLVEGS LLQGTEGAIKWNEANRPGKVPFLRVATESSAKTPSKLLDPLAWDNHYGTQIPKEEWKSQ EKS PEKTAFKKKDTILSLNACESNHAIAAINEGQNKPEIEVrWAKQGRTERLCSQNPPVLKRHQREI TRTTLQSDQEEIDYDDTISVEMKKEDFDIYDEDENQSPRSFQKKTRHYFIAAVERLWDY GMSSSPHVLRNRAQSGSVPQFKKVVFQEFTDGSFTQPLYRGELNEHLGLLGPYIRAEVE DNIMV TFRNQASRPYSFYSSLISYEEDQRQGAEPRKNFVKPNETKTYFWKVQHHMAPT KDEFDCKAWAYFSDVDLEKDVHSGLIGPLLVCHTNTLNPAHGRQVTVQEFALFFTIFDE TKSWYFTENMERNCRAPCNIQMEDPTFKENYRFHAINGYIMDTLPGLVMAQDQRIRWY LLSMGSNENIHSIHFSGHVFTVRKKEEY KMALYNLYPGVFETVEMLPSKAGIWRVECLI GEHLHAGMSTLFLVYSNKCQTPLGMASGHIRDFQITASGQYGQWAPKLARLHYSGSIN AWSTKEPFSWIKVDLLAPMIIHGIKTQGARQKFSSLYISQFIIMYSLDGKKWQTYRGNST GTLMVFFGNVDSSGIKHNIFNPPIIARYIRLHPTHYSIRSTLRMEL MGCDLNSSCSMPLGME SKAISDAQITASSYFTNMFATWSPSKARLHLQGRSNAWRPQVNNPKEWLQVDFQKTMK VTGVTTQGVKSLLTSMYVKEFLISSSQDGHQWTLFFQNGKVKVFQGNQDSFTPVVNSL DPPLLTRYLRIHPQSWVHQIALRMEVLGCEAQDLY

- 48 044115- 48 044115

Таблица 4Table 4

Нуклеотидная последовательность, кодирующая полноразмерный FVIII (SEQ ID NO: 66)*Nucleotide sequence encoding full-length FVIII (SEQ ID NO: 66)*

661 ATG CAAATAGAGC TCTCCACCTG661 ATG CAAATAGAGC TCTCCACCTG

721 CTTCTTTCTG TGCCTTTTGC GATTCTGCTT TAGTGCCACC AGAAGATACT ACCTGGGTGC721 CTTCTTTCTG TGCCTTTTGC GATTCTGCTT TAGTGCCACC AGAAGATACT ACCTGGGTGC

781 AGTGGAACTG TCATGGGACT ATATGCAAAG TGATCTCGGT GAGCTGCCTG TGGACGCAAG781 AGTGGAACTG TCATGGGACT ATATGCAAAG TGATCTCGGT GAGCTGCCTG TGGACGCAAG

841 ATTTCCTCCT AGAGTGCCAA AATCTTTTCC ATTCAACACC TCAGTCGTGT ACAAAAAGAC841 ATTTCCTCCT AGAGTGCCAA AATCTTTTCC ATTCAACACC TCAGTCGTGT ACAAAAGAC

901 TCTGTTTGTA GAATTCACGG ATCACCTTTT CAACATCGCT AAGCCAAGGC CACCCTGGAT901 TCTGTTTGTA GAATTCACGG ATCACCTTTT CAACATCGCT AAGCCAAGGC CACCCTGGAT

961 GGGTCTGCTA GGTCCTACCA TCCAGGCTGA GGTTTATGAT ACAGTGGTCA TTACACTTAA961 GGGTCTGCTA GGTCCTACCA TCCAGGCTGA GGTTTATGAT ACAGTGGTCA TTACACTTAA

1021 GAACATGGCT TCCCATCCTG TCAGTCTTCA TGCTGTTGGT GTATCCTACT GGAAAGCTTC1021 GAACATGGCT TCCCATCCTG TCAGTCTTCA TGCTGTTGGT GTATCCTACT GGAAAGCTTC

1081 TGAGGGAGCT GAATATGATG ATCAGACCAG TCAAAGGGAG AAAGAAGATG ATAAAGTCTT1081 TGAGGGAGCT GAATATGATG ATCAGACCAG TCAAAGGGAG AAAGAAGATG ATAAAGTCTT

1141 CCCTGGTGGA AGCCATACAT ATGTCTGGCA GGTCCTGAAA GAGAATGGTC CAATGGCCTC1141 CCCTGGTGGA AGCCATACAT ATGTCTGGCA GGTCCTGAAA GAGAATGGTC CAATGGCCTC

1201 TGACCCACTG TGCCTTACCT ACTCATATCT TTCTCATGTG GACCTGGTAA AAGACTTGAA1201 TGACCCACTG TGCCTTACCT ACTCATATCT TTCTCATGTG GACCTGGTAA AAGACTTGAA

1261 TTCAGGCCTC ATTGGAGCCC TACTAGTATG TAGAGAAGGG AGTCTGGCCA AGGAAAAGAC1261 TTCAGGCCTC ATTGGAGCCC TACTAGTATG TAGAGAAGGG AGTCTGGCCA AGGAAAAGAC

1321 ACAGACCTTG CACAAATTTA TACTACTTTT TGCTGTATTT GATGAAGGGA AAAGTTGGCA1321 ACAGACCTTG CACAAATTTA TACTACTTTT TGCTGTATTT GATGAAGGGA AAAGTTGGCA

1381 CTCAGAAACA AAGAACTCCT TGATGCAGGA TAGGGATGCT GCATCTGCTC GGGCCTGGCC1381 CTCAGAAACA AAGAACTCCT TGATGCAGGA TAGGGATGCT GCATCTGCTC GGGCCTGGCC

1441 TAAAATGCAC ACAGTCAATG GTTATGTAAA CAGGTCTCTG CCAGGTCTGA TTGGATGCCA1441 TAAAATGCAC ACAGTCAATG GTTATGTAAA CAGGTCTCTG CCAGGTCTGA TTGGATGCCA

1501 CAGGAAATCA GTCTATTGGC ATGTGATTGG AATGGGCACC ACTCCTGAAG TGCACTCAAT1501 CAGGAAATCA GTCTATTGGC ATGTGATTGG AATGGGCACC ACTCCTGAAG TGCACTCAAT

- 49 044115- 49 044115

1561 ATTCCTCGAA GGTCACACAT TTCTTGTGAG GAACCATCGC1561 ATTCCTCGAA GGTCACACAT TTCTTGTGAG GAACCATCGC

CAGGCGTCCT TGGAAATCTCCAGGCGTCCT TGGAAATCTC

1621 GCCAATAACT TTCCTTACTG CTCAAACACT CTTGATGGAC CTTGGACAGT TTCTACTGTT1621 GCCAATAACT TTCCTTACTG CTCAAACACT CTTGATGGAC CTTGGACAGT TTCTACTGTT

1681 TTGTCATATC TCTTCCCACC AACATGATGG CATGGAAGCT TATGTCAAAG TAGACAGCTG1681 TTGTCATATC TCTTCCCACC AACATGATGG CATGGAAGCT TATGTCAAAG TAGACAGCTG

1741 TCCAGAGGAA CCCCAACTAC GAATGAAAAA TAATGAAGAA GCGGAAGACT ATGATGATGA1741 TCCAGAGGAA CCCCAACTAC GAATGAAAAA TAATGAAGAA GCGGAAGACT ATGATGATGA

1801 TCTTACTGAT TCTGAAATGG ATGTGGTCAG GTTTGATGAT GACAACTCTC CTTCCTTTAT1801 TCTTACTGAT TCTGAAATGG ATGTGGTCAG GTTTGATGAT GACAACTCTC CTTCCTTTAT

1861 CCAAATTCGC TCAGTTGCCA AGAAGCATCC TAAAACTTGG GTACATTACA TTGCTGCTGA1861 CCAAATTCGC TCAGTTGCCA AGAAGCATCC TAAAACTTGG GTACATTACA TTGCTGCTGA

1921 AGAGGAGGAC TGGGACTATG CTCCCTTAGT CCTCGCCCCC GATGACAGAA GTTATAAAAG1921 AGAGGAGGAC TGGGACTATG CTCCCTTAGT CCTCGCCCCC GATGACAGAA GTTATAAAAG

1981 TCAATATTTG AACAATGGCC CTCAGCGGAT TGGTAGGAAG TACAAAAAAG TCCGATTTAT1981 TCAATATTTG AACAATGGCC CTCAGCGGAT TGGTAGGAAG TACAAAAAAG TCCGATTTAT

2041 GGC AT AC AC A GATGAAACCT TTAAGACTCG TGAAGCTATT CAGCATGAAT CAGGAATCTT2041 GGC AT AC AC A GATGAAACCT TTAAGACTCG TGAAGCTATT CAGCATGAAT CAGGAATCTT

2101 GGGACCTTTA CTTTATGGGG AAGTTGGAGA CACACTGTTG ATTATATTTA AGAATCAAGC2101 GGGACCTTTA CTTTATGGGG AAGTTGGAGA CACACTGTTG ATTATATTTA AGAATCAAGC

2161 AAGCAGACCA TATAACATCT ACCCTCACGG AATCACTGAT GTCCGTCCTT TGTATTCAAG2161 AAGCAGACCA TATAACATCT ACCCTCACGG AATCACTGAT GTCCGTCCTT TGTATTCAAG

2221 GAGATTACCA AAAGGTGTAA AACATTTGAA GGATTTTCCA ATTCTGCCAG GAGAAATATT2221 GAGATTACCA AAAGGTGTAA AACATTTGAA GGATTTTCCA ATTCTGCCAG GAGAAATATT

2281 CAAATATAAA TGGACAGTGA CTGTAGAAGA TGGGCCAACT AAATCAGATC CTCGGTGCCT2281 CAAATATAAA TGGACAGTGA CTGTAGAAGA TGGGCCAACT AAATCAGATC CTCGGTGCCT

2341 GACCCGCTAT TACTCTAGTT TCGTTAATAT GGAGAGAGAT CTAGCTTCAG GACTCATTGG2341 GACCCGCTAT TACTCTAGTT TCGTTAATAT GGAGAGAGAT CTAGCTTCAG GACTCATTGG

2401 CCCTCTCCTC ATCTGCTACA AAGAATCTGT AGATCAAAGA GGAAACCAGA TAATGTCAGA2401 CCCTCTCCTC ATCTGCTACA AAGAATCTGT AGATCAAAGA GGAAACCAGA TAATGTCAGA

2461 CAAGAGGAAT GTCATCCTGT TTTCTGTATT TGATGAGAAC CGAAGCTGGT ACCTCACAGA2461 CAAGAGGAAT GTCATCCTGT TTTCTGTATT TGATGAGAAC CGAAGCTGGT ACCTCACAGA

2521 GAATATACAA CGCTTTCTCC CCAATCCAGC TGGAGTGCAG CTTGAGGATC CAGAGTTCCA2521 GAATATACAA CGCTTTCTCC CCAATCCAGC TGGAGTGCAG CTTGAGGATC CAGAGTTCCA

- 50 044115- 50 044115

2581 AGCCTCCAAC ATCATGCACA GCATCAATGG CTATGTTTTT2581 AGCCTCCAAC ATCATGCACA GCATCAATGG CTATGTTTTT

GATAGTTTGC AGTTGTCAGTGATAGTTTGC AGTTGTCAGT

2641 TTGTTTGCAT GAGGTGGCAT ACTGGTACAT TCTAAGCATT GGAGCACAGA CTGACTTCCT2641 TTGTTTGCAT GAGGTGGCAT ACTGGTACAT TCTAAGCATT GGAGCACAGA CTGACTTCCT

2701 TTCTGTCTTC TTCTCTGGAT ATACCTTCAA ACACAAAATG GTCTATGAAG ACACACTCAC2701 TTCTGTCTTC TTCTCTGGAT ATACCTTCAA ACACAAAATG GTCTATGAAG ACACACTCAC

2761 CCTATTCCCA TTCTCAGGAG AAACTGTCTT CATGTCGATG GAAAACCCAG GTCTATGGAT2761 CCTATTCCCA TTCTCAGGAG AAACTGTCTT CATGTCGATG GAAAACCCAG GTCTATGGAT

2821 TCTGGGGTGC CACAACTCAG ACTTTCGGAA CAGAGGCATG ACCGCCTTAC TGAAGGTTTC2821 TCTGGGGTGC CACAACTCAG ACTTTCGGAA CAGAGGCATG ACCGCCTTAC TGAAGGTTTC

2881 TAGTTGTGAC AAGAACACTG GTGATTATTA CGAGGACAGT TATGAAGATA TTTCAGCATA2881 TAGTTGTGAC AAGAACACTG GTGATTATTA CGAGGACAGT TATGAAGATA TTTCAGCATA

2941 CTTGCTGAGT AAAAACAATG CCATTGAACC AAGAAGCTTC TCCCAGAATT CAAGACACCC2941 CTTGCTGAGT AAAAACAATG CCATTGAACC AAGAAGCTTC TCCCAGAATT CAAGACACCC

3001 TAGCACTAGG CAAAAGCAAT TTAATGCCAC CACAATTCCA GAAAATGACA TAGAGAAGAC3001 TAGCACTAGG CAAAAGCAAT TTAATGCCAC CACAATTCCA GAAAATGACA TAGAGAAGAC

3061 TGACCCTTGG TTTGCACACA GAACACCTAT GCCTAAAATA CAAAATGTCT CCTCTAGTGA3061 TGACCCTTGG TTTGCACACA GAACACCTAT GCCTAAAATA CAAAATGTCT CCTCTAGTGA

3121 TTTGTTGATG CTCTTGCGAC AGAGTCCTAC TCCACATGGG CTATCCTTAT CTGATCTCCA3121 TTTGTTGATG CTCTTGCGAC AGAGTCCTAC TCCACATGGG CTATCCTTAT CTGATCTCCA

3181 AGAAGCCAAA TATGAGACTT TTTCTGATGA TCCATCACCT GGAGCAATAG ACAGTAATAA3181 AGAAGCCAAA TATGAGACTT TTTCTGATGA TCCATCACCT GGAGCAATAG ACAGTAATAA

3241 CAGCCTGTCT GAAATGACAC ACTTCAGGCC ACAGCTCCAT CACAGTGGGG ACATGGTATT3241 CAGCCTGTCT GAAATGACAC ACTTCAGGCC ACAGCTCCAT CACAGTGGGG ACATGGTATT

3301 TACCCCTGAG TCAGGCCTCC AATTAAGATT AAATGAGAAA CTGGGGACAA CTGCAGCAAC3301 TACCCCTGAG TCAGGCCTCC AATTAAGATT AAATGAGAAA CTGGGGACAA CTGCAGCAAC

3361 AGAGTTGAAG AAACTTGATT TCAAAGTTTC TAGTACATCA AATAATCTGA TTTCAACAAT3361 AGAGTTGAAG AAACTTGATT TCAAAGTTTC TAGTACATCA AATAATCTGA TTTCAACAAT

3421 ТССATCAGAC AATTTGGCAG CAGGTACTGA TAATACAAGT TCCTTAGGAC CCCCAAGTAT3421 TCCATCAGAC AATTTGGCAG CAGGTACTGA TAATACAAGT TCCTTAGGAC CCCCAAGTAT

3481 GCCAGTTCAT TATGATAGTC AATTAGATAC CACTCTATTT GGCAAAAAGT CATCTCCCCT3481 GCCAGTTCAT TATGATAGTC AATTAGATAC CACTCTATTT GGCAAAAAGT CATCTCCCCT

3541 TACTGAGTCT GGTGGACCTC TGAGCTTGAG TGAAGAAAAT AATGATTCAA AGTTGTTAGA3541 TACTGAGTCT GGTGGACCTC TGAGCTTGAG TGAAGAAAAT AATGATTCAA AGTTGTTAGA

- 51 044115- 51 044115

3601 ATCAGGTTTA ATGAATAGCC AAGAAAGTTC ATGGGGAAAA3601 ATCAGGTTTA ATGAATAGCC AAGAAAGTTC ATGGGGAAAA

AATGTATCGT CAACAGAGAGAATGTATCGT CAACAGAGAG

3661 TGGTAGGTTA TTTAAAGGGA AAAGAGCTCA TGGACCTGCT TTGTTGACTA AAGATAATGC3661 TGGTAGGTTA TTTAAAGGGA AAAGAGCTCA TGGACCTGCT TTGTTGACTA AAGATAATGC

3721 CTTATTCAAA GTTAGCATCT CTTTGTTAAA GACAAACAAA ACTTCCAATA ATTCAGCAAC3721 CTTATTCAAA GTTAGCATCT CTTTGTTAAA GACAAACAAA ACTTCCAATA ATTCAGCAAC

3781 TAATAGAAAG ACTCACATTG ATGGCCCATC ATTATTAATT GAGAATAGTC CATCAGTCTG3781 TAATAGAAAG ACTCACATTG ATGGCCCATC ATTATTAATT GAGAATAGTC CATCAGTCTG

3841 GCAAAATATA TTAGAAAGTG ACACTGAGTT TAAAAAAGTG ACACCTTTGA TTCATGACAG3841 GCAAAATATA TTAGAAAGTG ACACTGAGTT TAAAAAAGTG ACACCTTTGA TTCATGACAG

3901 AATGCTTATG GACAAAAATG CTACAGCTTT GAGGCTAAAT CATATGTCAA ATAAAACTAC3901 AATGCTTATG GACAAAAATG CTACAGCTTT GAGGCTAAAT CATATGTCAA ATAAAACTAC

3961 TTCATCAAAA AACATGGAAA TGGTCCAACA GAAAAAAGAG GGCCCCATTC CACCAGATGC3961 TTCATCAAAA AACATGGAAA TGGTCCAACA GAAAAAAGAG GGCCCCATTC CACCAGATGC

4021 ACAAAATCCA GATATGTCGT TCTTTAAGAT GCTATTCTTG CCAGAATCAG CAAGGTGGAT4021 ACAAAATCCA GATATGTCGT TCTTTAAGAT GCTATTCTTG CCAGAATCAG CAAGGTGGAT

4081 ACAAAGGACT CATGGAAAGA ACTCTCTGAA CTCTGGGCAA GGCCCCAGTC CAAAGCAATT4081 ACAAAGGACT CATGGAAAGA ACTCTCTGAA CTCTGGGCAA GGCCCCAGTC CAAAGCAATT

4141 AGTATCCTTA GGACCAGAAA AATCTGTGGA AGGTCAGAAT TTCTTGTCTG AGAAAAACAA4141 AGTATCCTTA GGACCAGAAA AATCTGTGGA AGGTCAGAAT TTCTTGTCTG AGAAAACAA

4201 AGTGGTAGTA GGAAAGGGTG AATTTACAAA GGACGTAGGA CTCAAAGAGA TGGTTTTTCC4201 AGTGGTAGTA GGAAAGGGTG AATTTACAAA GGACGTAGGA CTCAAAGAGA TGGTTTTTCC

4261 AAGCAGCAGA AACCTATTTC TTACTAACTT GGATAATTTA CATGAAAATA ATACACACAA4261 AAGCAGCAGA AACCTATTTC TTACTAACTT GGATAATTTA CATGAAAATA ATACACACAAA

4321 TCAAGAAAAA AAAATTCAGG AAGAAATAGA AAAGAAGGAA ACATTAATCC AAGAGAATGT4321 TCAAGAAAAA AAAATTCAGG AAGAAATAGA AAAGAAGGAA ACATTAATCC AAGAGAATGT

4381 AGTTTTGCCT C AGAT AC AT A CAGTGACTGG CACTAAGAAT TTCATGAAGA ACCTTTTCTT4381 AGTTTTGCCT C AGAT AC AT A CAGTGACTGG CACTAAGAAT TTCATGAAGA ACCTTTTTCTT

4441 ACTGAGCACT AGGCAAAATG TAGAAGGTTC ATATGACGGG GCATATGCTC CAGTACTTCA4441 ACTGAGCACT AGGCAAAATG TAGAAGGTTC ATATGACGGG GCATATGCTC CAGTACTTCA

4501 AGATTTTAGG TCATTAAATG ATTCAACAAA TAGAACAAAG AAACACACAG CTCATTTCTC4501 AGATTTTAGG TCATTAAATG ATTCAACAAA TAGAACAAAG AAACACACAG CTCATTTCTC

4561 AAAAAAAGGG GAGGAAGAAA ACTTGGAAGG CTTGGGAAAT CAAACCAAGC AAATTGTAGA4561 AAAAAAAGGG GAGGAAGAAA ACTTGGAAGG CTTGGGAAAT CAAACCAAGC AAATTGTAGA

- 52 044115- 52 044115

4621 GAAATATGCA TGC ACC AC AA GGATATCTCC TAATACAAGC4621 GAAATATGCA TGC ACC AC AA GGATATCTCC TAATACAAGC

CAGCAGAATT TTGTCACGCACAGCAGAATT TTGTCACGCA

4681 ACGTAGTAAG AGAGCTTTGA AACAATTCAG ACTCCCACTA GAAGAAACAG AACTTGAAAA4681 ACGTAGTAAG AGAGCTTTGA AACAATTCAG ACTCCCACTA GAAGAAACAG AACTTGAAAA

4741 AAGGATAATT GTGGATGACA CCTCAACCCA GTGGTCCAAA AACATGAAAC ATTTGACCCC4741 AAGGATAATT GTGGATGACA CCTCAACCCA GTGGTCCAAA AACATGAAAC ATTTGACCCC

4801 GAGCACCCTC ACACAGATAG ACTACAATGA GAAGGAGAAA GGGGCCATTA CTCAGTCTCC4801 GAGCACCCTC ACACAGATAG ACTACAATGA GAAGGAGAAA GGGGCCATTA CTCAGTCTCC

4861 CTTATCAGAT TGCCTTACGA GGAGTCATAG CATCCCTCAA GCAAATAGAT CTCCATTACC4861 CTTATCAGAT TGCCTTACGA GGAGTCATAG CATCCCTCAA GCAAATAGAT CTCCATTACC

4921 CATTGCAAAG GT АТС АТС AT TTCCATCTAT TAGACCTATA TATCTGACCA GGGTCCTATT4921 CATTGCAAAG GT ATS ATS AT TTCCATCTAT TAGACCTATA TATCTGACCA GGGTCCTATT

4981 CCAAGACAAC TCTTCTCATC TTCCAGCAGC ATCTTATAGA AAGAAAGATT CTGGGGTCCA4981 CCAAGACAAC TCTTCTCATC TTCCAGCAGC ATCTTATAGA AAGAAAGATT CTGGGGTCCA

5041 AGAAAGCAGT CATTTCTTAC AAGGAGCCAA AAAAAATAAC CTTTCTTTAG CCATTCTAAC5041 AGAAAGCAGT CATTTCTTAC AAGGAGCCAA AAAAAATAAC CTTTCTTTAG CCATTCTAAC

5101 CTTGGAGATG ACTGGTGATC AAAGAGAGGT TGGCTCCCTG GGGACAAGTG CCACAAATTC5101 CTTGGAGATG ACTGGTGATC AAAGAGAGGT TGGCTCCCTG GGGACAAGTG CCACAAATTC

5161 AGTCACATAC AAGAAAGTTG AGAACACTGT TCTCCCGAAA CCAGACTTGC CCAAAACATC5161 AGTCACATAC AAGAAAGTTG AGAACACTGT TCTCCCGAAA CCAGACTTGC CCAAAACATC

5221 TGGCAAAGTT GAATTGCTTC CAAAAGTTCA CATTTATCAG AAGGACCTAT TCCCTACGGA5221 TGGCAAAGTT GAATTGCTTC CAAAAGTTCA CATTTATCAG AAGGACCTAT TCCCTACGGA

5281 AACTAGCAAT GGGTCTCCTG GCCATCTGGA TCTCGTGGAA GGGAGCCTTC TTCAGGGAAC5281 AACTAGCAAT GGGTCTCCTG GCCATCTGGA TCTCGTGGAA GGGAGCCTTC TTCAGGGAAC

5341 AGAGGGAGCG ATTAAGTGGA ATGAAGCAAA CAGACCTGGA AAAGTTCCCT TTCTGAGAGT5341 AGAGGGAGCG ATTAAGTGGA ATGAAGCAAA CAGACCTGGA AAAGTTCCCT TTCTGAGAGT

5401 AGCAACAGAA AGCTCTGCAA AGACTCCCTC CAAGCTATTG GATCCTCTTG CTTGGGATAA5401 AGCAACAGAA AGCTCTGCAA AGACTCCCTC CAAGCTATTG GATCCTCTTG CTTGGGATAA

5461 CCACTATGGT ACTCAGATAC CAAAAGAAGA GTGGAAATCC CAAGAGAAGT CACCAGAAAA5461 CCACTATGGT ACTCAGATAC CAAAAGAAGA GTGGAAATCC CAAGAGAAGT CACCAGAAAA

5521 AACAGCTTTT AAGAAAAAGG ATACCATTTT GTCCCTGAAC GCTTGTGAAA GCAATCATGC5521 AACAGCTTTT AAGAAAAAGG ATACCATTTT GTCCCTGAAC GCTTGTGAAA GCAATCATGC

5581 AATAGCAGCA ATAAATGAGG GACAAAATAA GCCCGAAATA GAAGTCACCT GGGCAAAGCA5581 AATAGCAGCA ATAAATGAGG GACAAAATAA GCCCGAAATA GAAGTCACCT GGGCAAAGCA

- 53 044115- 53 044115

5641 AGGTAGGACT GAAAGGCTGT GCTCTCAAAA CCCACCAGTC TTGAAACGCC ATCAACGGGA5641 AGGTAGGACT GAAAGGCTGT GCTCTCAAAA CCCACCAGTC TTGAAACGCC ATCAACGGGA

5701 AATAACTCGT ACTACTCTTC AGTCAGATCA AGAGGAAATT GACTATGATG AT АССАТ АТС5701 AATAACTCGT ACTACTCTTC AGTCAGATCA AGAGGAAATT GACTATGATG AT ASSAT ATS

5761 AGTTGAAATG AAGAAGGAAG ATTTTGACAT TTATGATGAG GATGAAAATC AGAGCCCCCG5761 AGTTGAAATG AAGAAGGAAG ATTTTGACAT TTATGATGAG GATGAAAATC AGAGCCCCCG

5821 CAGCTTTCAA AAGAAAACAC GACACTATTT TATTGCTGCA GTGGAGAGGC TCTGGGATTA5821 CAGCTTTCAA AAGAAAACAC GACACTATTT TATTGCTGCA GTGGAGAGGC TCTGGGATTA

5881 TGGGATGAGT AGCTCCCCAC ATGTTCTAAG AAACAGGGCT CAGAGTGGCA GTGTCCCTCA5881 TGGGATGAGT AGCTCCCCAC ATGTTCTAAG AAACAGGGCT CAGAGTGGCA GTGTCCCTCA

5941 GTTCAAGAAA GTTGTTTTCC AGGAATTTAC TGATGGCTCC TTTACTCAGC CCTTATACCG5941 GTTCAAGAAA GTTGTTTTCC AGGAATTTAC TGATGGCTCC TTTACTCAGC CCTTATACCG

6001 TGGAGAACTA AATGAACATT TGGGACTCCT GGGGCCATAT ATAAGAGCAG AAGTTGAAGA6001 TGGAGAACTA AATGAACATT TGGGACTCCT GGGGCCATAT ATAAGAGCAG AAGTTGAAGA

6061 TAATATCATG GTAACTTTCA GAAATCAGGC CTCTCGTCCC TATTCCTTCT ATTCTAGCCT6061 TAATATCATG GTAACTTTCA GAAATCAGGC CTCTCGTCCC TATTCCTTCT ATTCTAGCCT

6121 TATTTCTTAT GAGGAAGATC AGAGGCAAGG AGCAGAACCT AGAAAAAACT TTGTCAAGCC6121 TATTTCTTAT GAGGAAGATC AGAGGCAAGG AGCAGAACCT AGAAAAAACT TTGTCAAGCC

6181 TAATGAAACC AAAACTTACT TTTGGAAAGT GCAACATCAT ATGGCACCCA CTAAAGATGA6181 TAATGAAACC AAAACTTACT TTTGGAAAGT GCAACATCAT ATGGCACCCA CTAAAGATGA

6241 GTTTGACTGC AAAGCCTGGG CTTATTTCTC TGATGTTGAC CTGGAAAAAG ATGTGCACTC6241 GTTTGACTGC AAAGCCTGGG CTTATTTCTC TGATGTTGAC CTGGAAAAAG ATGTGCACTC

6301 AGGCCTGATT GGACCCCTTC TGGTCTGCCA CACTAACACA CTGAACCCTG CTCATGGGAG6301 AGGCCTGATT GGACCCCTTC TGGTCTGCCA CACTAACACA CTGAACCCTG CTCATGGGAG

6361 ACAAGTGACA GTACAGGAAT TTGCTCTGTT TTTCACCATC TTTGATGAGA CCAAAAGCTG6361 ACAAGTGACA GTACAGGAAT TTGCTCTGTT TTTCACCATC TTTGATGAGA CCAAAAGCTG

6421 GTACTTCACT GAAAATATGG AAAGAAACTG CAGGGCTCCC TGCAATATCC AGATGGAAGA6421 GTACTTCACT GAAAATTGG AAAGAAACTG CAGGGCTCCC TGCAATATCC AGATGGAAGA

6481 TCCCACTTTT AAAGAGAATT ATCGCTTCCA TGCAATCAAT GGCTACATAA TGGATACACT6481 TCCCACTTTT AAAGAGAATT ATCGCTTCCA TGCAATCAAT GGCTACATAA TGGATACACT

6541 ACCTGGCTTA GTAATGGCTC AGGATCAAAG GATTCGATGG TATCTGCTCA GCATGGGCAG6541 ACCTGGCTTA GTAATGGCTC AGGATCAAAG GATTCGATGG TATCTGCTCA GCATGGGCAG

6601 CAATGAAAAC ATCCATTCTA TTCATTTCAG TGGACATGTG TTCACTGTAC GAAAAAAAGA6601 CAATGAAAAC ATCCATTCTA TTCATTTCAG TGGACATGTG TTCACTGTAC GAAAAAAAGA

- 54 044115- 54 044115

6661 GG AGT AT AAA ATGGCACTGT ACAATCTCTA TCCAGGTGTT6661 GG AGT AT AAA ATGGCACTGT ACAATCTCTA TCCAGGTGTT

TTTGAGACAG TGGAAATGTTTTTGAGACAG TGGAAATGTT

6721 ACCATCCAAA GCTGGAATTT GGCGGGTGGA ATGCCTTATT6721 ACCATCCAAA GCTGGAATTT GGCGGGTGGA ATGCCTTATT

GGCGAGCATC TACATGCTGGGGCGAGCATC TACATGCTGG

6781 GATGAGCACA CTTTTTCTGG TGTACAGCAA TAAGTGTCAG ACTCCCCTGG GAATGGCTTC6781 GATGAGCACA CTTTTTCTGG TGTACAGCAA TAAGTGTCAG ACTCCCCTGG GAATGGCTTC

6841 TGGACACATT AGAGATTTTC AG ATT AC AGC TTCAGGACAA TATGGACAGT GGGCCCCAAA6841 TGGACACATT AGAGATTTTC AG ATT AC AGC TTCAGGACAA TATGGACAGT GGGCCCCAAA

6901 GCTGGCCAGA CTTCATTATT CCGGATCAAT CAATGCCTGG AGCACCAAGG AGCCCTTTTC6901 GCTGGCCAGA CTTCATTATT CCGGATCAAT CAATGCCTGG AGCACCAAGG AGCCCTTTTC

6961 TTGGATCAAG GTGGATCTGT TGGCACCAAT GATTATTCAC GGCATCAAGA CCCAGGGTGC6961 TTGGATCAAG GTGGATCTGT TGGCACCAAT GATTATTCAC GGCATCAAGA CCCAGGGTGC

7021 CCGTCAGAAG TTCTCCAGCC TCTACATCTC TCAGTTTATC ATCATGTATA GTCTTGATGG7021 CCGTCAGAAG TTCTCCAGCC TCTACATCTC TCAGTTTATC ATCATGTATA GTCTTGATGG

7081 GAAGAAGTGG CAGACTTATC GAGGAAATTC CACTGGAACC TTAATGGTCT TCTTTGGCAA7081 GAAGAAGTGG CAGACTTATC GAGGAAATTC CACTGGAACC TTAATGGTCT TCTTTTGGCAA

7141 TGTGGATTCA TCTGGGATAA AACACAATAT TTTTAACCCT CCAATTATTG CTCGATACAT7141 TGTGGATTCA TCTGGGATAA AACACAATAT TTTTAACCCT CCAATTATTG CTCGATACAT

7201 CCGTTTGCAC CCAACTCATT ATAGCATTCG CAGCACTCTT CGCATGGAGT TGATGGGCTG7201 CCGTTTGCAC CCAACTCATT ATAGCATTCG CAGCACTCTT CGCATGGAGT TGATGGGCTG

7261 TGATTTAAAT AGTTGCAGCA TGCCATTGGG AATGGAGAGT AAAGCAATAT CAGATGCACA7261 TGATTTAAAT AGTTGCAGCA TGCCATTGGG AATGGAGAGT AAAGCAATAT CAGATGCACA

7321 GATTACTGCT TCATCCTACT TTACCAATAT GTTTGCCACC TGGTCTCCTT CAAAAGCTCG7321 GATTACTGCT TCATCCTACT TTACCATAT GTTTGCCACC TGGTCTCCTT CAAAAGCTCG

7381 ACTTCACCTC CAAGGGAGGA GTAATGCCTG GAGACCTCAG GTGAATAATC CAAAAGAGTG7381 ACTTCACCTC CAAGGGAGGA GTAATGCCTG GAGACCTCAG GTGAATAATC CAAAAGAGTG

7441 GCTGCAAGTG GACTTCCAGA AGACAATGAA AGTCACAGGA GTAACTACTC AGGGAGTAAA7441 GCTGCAAGTG GACTTCCAGA AGACAATGAA AGTCACAGGA GTAACTACTC AGGGAGTAAA

7501 ATCTCTGCTT ACCAGCATGT ATGTGAAGGA GTTCCTCATC TCCAGCAGTC AAGATGGCCA7501 ATCTCTGCTT ACCAGCATGT ATGTGAAGGA GTTCCTCATC TCCAGCAGTC AAGATGGCCA

7561 TCAGTGGACT CTCTTTTTTC AGAATGGCAA AGTAAAGGTT TTTCAGGGAA ATCAAGACTC7561 TCAGTGGACT CTCTTTTTTC AGAATGGCAA AGTAAAGGTT TTTCAGGGAA ATCAAGACTC

7621 CTTCACACCT GTGGTGAACT CTCTAGACCC ACCGTTACTG ACTCGCTACC TTCGAATTCA7621 CTTCACACCT GTGGTGAACT CTCTAGACCC ACCGTTACTG ACTCGCTACC TTCGAATTCA

7681 CCCCCAGAGT TGGGTGCACC AGATTGCCCT GAGGATGGAG GTTCTGGGCT GCGAGGCACA7681 CCCCCAGAGT TGGGTGCACC AGATTGCCCT GAGGATGGAG GTTCTGGGCT GCGAGGCACA

7741 GGACCTCTAC ^Подчеркнутые нуклеиновые кислоты кодируют сигнальный пептид7741 GGACCTCTAC ^The underlined nucleic acids encode a signal peptide

Полипептиды FVIII включают полноразмерный FVIII, полноразмерный FVIII без метионина на Nконце, зрелый FVIII (без сигнальной последовательности), зрелый FVIII с дополнительным метионином на N-конце и/или FVIII с полным или частичным удалением домена В. В определенных вариантах реализации изобретения варианты FVIII включают делеции домена В, будь то частичные или полные делеции.FVIII polypeptides include full-length FVIII, full-length FVIII without the methionine at the N-terminus, mature FVIII (without the signal sequence), mature FVIII with an additional methionine at the N-terminus, and/or FVIII with complete or partial removal of the B domain. In certain embodiments, FVIII variants include B domain deletions, whether partial or complete deletions.

Последовательность нативного зрелого фактора FVIII человека представлена в SEQ ID NO: 65. Нативный белок FVIII имеет следующую формулу: А1-а1-А2-а2-В-а3-А3-С1-С2, где A1, A2, и A3 - структурно родственные домены А, В -домены В, С1 и С2 - структурно родственные домены С, и a1, a2 и a3 - кислые спейсерные участки. Ссылаясь на первичную аминокислотную позицию в SEQ ID NO:65, домен A1 FVIII человека простирается от Ala1 до около Arg336, спейсерный участок a1 простирается около от Met337 до около Val374, домен А2 простирается около от Ala375 до около Tyr719, спейсерный домен а2 простирается около от Glu720 до около Arg740, домен В простирается около от Ser741 до околоThe sequence of native mature human FVIII is shown in SEQ ID NO: 65. Native FVIII protein has the following formula: A1-a1-A2-a2-B-a3-A3-C1-C2, where A1, A2, and A3 are structurally related domains A, B are domains B, C1 and C2 are structurally related to domains C, and a1, a2 and a3 are acidic spacer regions. Referring to the primary amino acid position in SEQ ID NO:65, human FVIII domain A1 extends from Ala1 to about Arg336, spacer region a1 extends from about Met337 to about Val374, domain A2 extends from about Ala375 to about Tyr719, spacer domain a2 extends from about Glu720 to about Arg740, domain B extends from about Ser741 to about

- 55 044115- 55 044115

Arg1648, спейсерный домен a3 простирается около от Glu1649 до около Arg1689, домен A3 простирается около от Ser1690 до около Leu2025, домен С1 простирается от около Gly2026 до около Asn2072, и домен С2 простирается около от Ser2073 до Tyr2332. Помимо специфических сайтов протеолитического расщепления обозначение расположения границ между доменами и участками FVIII может отличаться в различных литературных источниках. Границы, представленные в настоящем документе, обозначены как приблизительные путем использования термина около.Arg1648, spacer domain a3 extends from about Glu1649 to about Arg1689, domain A3 extends from about Ser1690 to about Leu2025, domain C1 extends from about Gly2026 to about Asn2072, and domain C2 extends from about Ser2073 to Tyr2332. In addition to specific proteolytic cleavage sites, the designation of the location of the boundaries between FVIII domains and regions may differ in different literature sources. The boundaries presented herein are indicated as approximate by the use of the term approximate.

Ген FVIII человека был выделен и экспрессирован в клетках млекопитающих (Toole, J. J., et al., Nature 312:342-347 (1984 год); Gitschier, J., et al., Nature 312:326-330 (1984 год); Wood, W. I, et al., Nature 312:330-337 (1984 год); Vehar, G A, et al., Nature 312:337-342 (1984 год); WO 87/04187; WO 88/08035; WO 88/03558; и патент США № 4,757,006). Аминокислотная последовательность FVIII была предсказана из кДНК, как показано в патенте США № 4,965,199. Кроме того, FVIII с частично или полностью удаленным доменом В, показан в патентах США № 4,994,371 и 4,868,112. В некоторых вариантах реализации изобретения домен В FVIII человека заменяется на домен В фактора V человека, как показано в патенте США № 5,004,803. Последовательность кДНК, кодирующая фактор VIII человека, и аминокислотная последовательность показаны в SEQ ID NOs: 1 и 2 соответственно из публикации заявки США №2005/0100990.The human FVIII gene has been isolated and expressed in mammalian cells (Toole, J. J., et al., Nature 312:342-347 (1984); Gitschier, J., et al., Nature 312:326-330 (1984); Wood, W. I, et al., Nature 312:330-337 (1984); Vehar, G A, et al., Nature 312:337-342 (1984); WO 87/04187; WO 88/08035; WO 88/03558; and US Patent No. 4,757,006). The amino acid sequence of FVIII was predicted from cDNA, as shown in US patent No. 4,965,199. In addition, FVIII with the B domain partially or completely deleted is shown in US Patent Nos. 4,994,371 and 4,868,112. In some embodiments, the human FVIII B domain is replaced with the human Factor V B domain, as shown in US Pat. No. 5,004,803. The cDNA sequence encoding human factor VIII and the amino acid sequence are shown in SEQ ID NOs: 1 and 2, respectively, from US Application Publication No. 2005/0100990.

Последовательность свиного FVIII опубликована в Toole, J. J., et al., Proc. Natl. Acad. Sci. USA 83:5939-5942 (1986 год). Кроме того, полная последовательность свиной кДНК, полученная посредством ПЦР амплификации последовательностей FVIII из библиотеки кДНК из свиной селезенки, описана в Healey, J. F., et al., Blood 88:4209-4214 (1996 год). Гибридный FVIII (человеческий/свиной), имеющий замены всех доменов, всех субъединиц и конкретных аминокислотных последовательностей, описан в патенте США № 5,364,771 в Lollar и Runge и в WO 93/20093. Совсем недавно были описаны нуклеотидные и соответствующие аминокислотные последовательности доменов А1 и А2 свиного FVIII и химерного FVIII, имеющего свиные домены А1 и/или А2, замещающие соответствующие человеческие домены, в WO 94/11503. Патент США № 5,859,204, Lollar, J. S., также описывает свиную кДНК и предсказанные аминокислотные последовательности. Патент США № 6458563 описывает свиной FVIII с удаленным доменом В.The sequence of porcine FVIII is published in Toole, J. J., et al., Proc. Natl. Acad. Sci. USA 83:5939-5942 (1986). In addition, the complete porcine cDNA sequence obtained by PCR amplification of FVIII sequences from a porcine spleen cDNA library is described in Healey, J. F., et al., Blood 88:4209-4214 (1996). Hybrid FVIII (human/porcine) having substitutions of all domains, all subunits and specific amino acid sequences is described in US Patent No. 5,364,771 to Lollar and Runge and WO 93/20093. More recently, the nucleotide and corresponding amino acid sequences of the A1 and A2 domains of porcine FVIII and a chimeric FVIII having porcine A1 and/or A2 domains replacing the corresponding human domains were described in WO 94/11503. US Patent No. 5,859,204, Lollar, J.S., also describes porcine cDNA and predicted amino acid sequences. US Patent No. 6,458,563 describes porcine FVIII with the B domain deleted.

Патент США № 5,859,204, Lollar, J. S. описывает функциональные мутанты FVIII с пониженной антигенностью и пониженной иммунореактивностью. Патент США № 6,376,463, Lollar, J. S. описывает мутанты FVIII с пониженной иммунореактивностью. Публикация заявки США № 2005/0100990 Saenko et al. описывают функциональные мутации в домене А2 FVIII.US Patent No. 5,859,204, Lollar, J. S. describes functional FVIII mutants with reduced antigenicity and reduced immunoreactivity. US Patent No. 6,376,463, Lollar, J. S. describes FVIII mutants with reduced immunoreactivity. US Application Publication No. 2005/0100990 Saenko et al. describe functional mutations in the A2 domain of FVIII.

В одном варианте реализации изобретения FVIII (или часть FVIII химерного белка) может по меньшей мере на 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% или 100% быть идентичным аминокислотной последовательности FVIII, представляющей собой аминокислоты 1-1438 из SEQ ID NO: 67 или аминокислоты 1-2332 из SEQ ID NO: 65 (без сигнальной последовательности), или аминокислотной последовательности FVIII, представляющей собой аминокислоты 1-19 из SEQ ID NO: 64, и аминокислоты 1-1438 из SEQ ID NO: 67, или аминокислоты 1-19 из SEQ ID NO: 64, и аминокислоты 1-2332 из SEQ ID NO: 65 (с сигнальной последовательностью), в которой FVIII имеет свертывающую активность, например, активирует фактор IX в качестве кофактора, чтобы преобразовать фактор X в активированный фактор X. FVIII (или часть FVIII химерного белка) может быть идентичным аминокислотной последовательности FVIII, представляющей собой аминокислоты 1-1438 из SEQ ID NO: 67 или аминокислоты 12332 из SEQ ID NO: 65 (без сигнальной последовательности). FVIII может дополнительно включать сигнальную последовательность.In one embodiment, the FVIII (or portion of the FVIII chimeric protein) may be at least 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99%, or 100% be identical to the amino acid sequence of FVIII being amino acids 1-1438 of SEQ ID NO: 67 or amino acids 1-2332 of SEQ ID NO: 65 (without signal sequence), or the amino acid sequence of FVIII being amino acids 1-19 of SEQ ID NO: : 64, and amino acids 1-1438 of SEQ ID NO: 67, or amino acids 1-19 of SEQ ID NO: 64, and amino acids 1-2332 of SEQ ID NO: 65 (with a signal sequence) in which FVIII has clotting activity , for example, activates factor IX as a cofactor to convert factor X to activated factor X. FVIII (or the FVIII portion of the chimeric protein) may be identical to the amino acid sequence of FVIII being amino acids 1-1438 of SEQ ID NO: 67 or amino acids 12332 of SEQ ID NO: 65 (no signal sequence). FVIII may further include a signal sequence.

Домен В FVIII в данном контексте является тем же доменом В, известным в данной области техники, который определяется внутренней идентичностью аминокислотной последовательности и сайтов протеолитического расщепления, например, остатки Ser741-Arg1648 полноразмерного FVIII человека. Другие домены FVIII человека определяются следующими аминокислотными остатками: А1, остатки Ala1-Arg372; A2, остатки Ser373-Arg740; A3, остатки Ser1690-Asn2019; C1, остатки Lys2020-Asn2172; C2, остатки Ser2173-Tyr2332. Последовательность А3-С1-С2 включает в себя остатки Ser1690-Tyr2332. Оставшуюся последовательность, остатки Glu1649-Arg1689, обычно называют кислым участком а3. Расположение границ всех доменов, в том числе доменов В свиного, мышиного и собачьего FVIII также известны в данной области техники. В одном варианте реализации изобретения из FVIII удаляется домен В (фактор VIII с удаленным доменом В или FVIII BDD). Примером BDD FVIII является REFACTO® (рекомбинантный BDD FVIII), который имеет ту же последовательность, что и часть фактора VIII из последовательности в табл. 5. (BDD FVIII тяжелой цепи выделен двойным подчеркиванием; домен В выделен курсивом; и BDD FVIII легкой цепи представлен в виде обычного текста). Нуклеотидная последовательность, кодирующая табл. 6 (SEQ ID NO: 68) представлена в табл. 6.Domain B of FVIII in this context is the same domain B known in the art, which is determined by the intrinsic amino acid sequence identity and proteolytic cleavage sites, for example, residues Ser741-Arg1648 of full-length human FVIII. Other human FVIII domains are defined by the following amino acid residues: A1, residues Ala1-Arg372; A2, residues Ser373-Arg740; A3, residues Ser1690-Asn2019; C1, residues Lys2020-Asn2172; C2, residues Ser2173-Tyr2332. The sequence A3-C1-C2 includes residues Ser1690-Tyr2332. The remaining sequence, residues Glu1649-Arg1689, is commonly referred to as the a3 acidic region. The locations of the boundaries of all domains, including the B domains of porcine, mouse and canine FVIII are also known in the art. In one embodiment, the B domain is removed from FVIII (factor VIII with B domain deleted or FVIII BDD). An example of BDD FVIII is REFACTO® (recombinant BDD FVIII), which has the same sequence as the factor VIII portion of the sequence in table. 5. (The heavy chain FVIII BDD is double underlined; the B domain is italicized; and the light chain FVIII BDD is presented in plain text). Nucleotide sequence encoding table. 6 (SEQ ID NO: 68) is presented in table. 6.

- 56 044115- 56 044115

Таблица 5Table 5

Аминокислотная последовательность фактора VIII с удаленным доменом В (BDD FVIII).Amino acid sequence of factor VIII with B domain deleted (BDD FVIII).

BDD FVIII (SEQ ID NO: 67)BDD FVIII (SEQ ID NO: 67)

ATRRYYLGAVELSWDYMOSDLGEL·PVDARFPPRVPKSFPFNTSVVYKKTLFVEF TDHLFNIAKPRPPWMGLLGPTIOAEVYDTVVITLKNMASHPVSLHAVGVSYWKASEGA EYDDOTSOREKEDDKVFPGGSHTYVWOVLKENGPMASDPLCLTYSYLSHVDLVKDLN SGLIGALLVCREGSLAKEKTOTLHKFILLFAVFDEGKSWHSETKNSLMODRDAASARA WPKMHTVNGYVNRSLPGLIGCHRKSVYWHVIGMGTTPEVHSIFLEGHTFLVRNHROAS LEISPITFLTAOTLLMDLGOFLLFCHISSHOHDGMEAYVKVDSCPEEPOLRMKNNEEAED YDDDLTDSEMDVVRFDDDNSPSFIOIRSVAKKHPKTWVHYIAAEEEDWDYAPLVLAPD DRSYKSOYLNNGPORIGRKYKKVRFMAYTDETFKTREAIOHESGILGPLLYGEVGDTLIJ IFKNOASRPYNIYPHGITDVRPLYSRRLPKGVKHLKDFPILPGEIFKYKWTVTVEDGPTKS DPRCLTRYYSSFVNMERDLASGLIGPLLICYKESVDORGNOIMSDKRNVILFSVFDENRS WYLTENIORFLPNPAGVOLEDPEFOASNIMHSINGYVFDSLOLSVCLHEVAYWYILSIGA OTDFLSVFFSGYTFKHKMVYEDTLTLFPFSGETVFMSMENPGLWILGCHNSDFRNRGMT ALLKVSSCDKNTGDYYEDSYEDISAYLLSKNNAIEPRSFSONPPVLKRHOREITRTTLOSD QEEIDYDDTISVEMKKEDFDIYDEDENQSPRSFQKKTRHYFIAAVERLWDYGMSSSPHV LRNRAQSGSVPQFKKVVFQEFTDGSFTQPLYRGELNEHLGLLGPYIRAEVEDNIMVTFR NQASRPYSFYSSLISYEEDQRQGAEPRKNFVKPNETKTYFWKVQHHMAPTKDEFDCKA WAYFSDVDLEKDVHSGLIGPLLVCHTNTLNPAHGRQVTVQEFALFFTIFDETKSWYFTE NMERNCRAPCNIQMEDPTFKENYRFHAINGYIMDTLPGLVMAQDQRIRWYLLSMGSNE NIHSIHFSGHVFTVRKKEEYKMALYNLYPGVFETVEMLPSKAGIWRVECLIGEHLHAGM STLFLVYSNKCQTPLGMASGHIRDFQITASGQYGQWAPKLARLHYSGSINAWSTKEPFS WIKVDLLAPMIIHGIKTQGARQKFSSLYISQFIIMYSLDGKKWQTYRGNSTGTLMVFFGN VDSSGIKHNIFNPPIIARYIRLHPTHYSIRSTLRMELMGCDLNSCSMPLGMESKAISDAQIT ASSYFTNMFATWSPSKARLHLQGRSNAWRPQVNNPKEWLQVDFQKTMKVTGVTTQG VKSLLTSMYVKEFLISSSQDGHQWTLFFQNGKVKVFQGNQDSFTPVVNSLDPPLLTRYL RIHPQSWVHQIALRMEVLGCEAQDLYATRRYYLGAVELSWDYMOSDLGEL·PVDARFPPRVPKSFPFNTSVVYKKTLFVEF TDHLFNIAKPRPPWMGLLGPTIOAEVYDTVVITLKNMASHPVSLHAVGVSYWKASEGA EYDDOTSOREKEDDKVFPGGSHTYVWOVLKENGPMASDPLCLTYSYLSHVDLVKDLN SGLIGALLVCREGSLAKEKTOTLHKFILL FAVFDEGKSWHSETKNSLMODRDAASARA WPKMHTVNGYVNRSLPGLIGCHRKSVYWHVIGMGTTPEVHSIFLEGHTFLVRNHROAS LEISPITFLTAOTLLMDLGOFLLFCHISSHOHDGMEAYVKVDSCPEEPOLRMKNNEEAED YDDDLTDSEMDVVRFDDDNSPSFIOIRSVAKKHPKTWVHYIAAEEEDWDYAPLVLAPD DRSYK SOYLNNNGPORIGRKYKKVRFMAYTDETFKTREAIOHESGILGPLLYGEVGDTLIJ IFKNOASRPYNIYPHGITDVRPLYSRRLPKGVKHLKDFPILPGEIFKYKWTVTVEDGPTKS DPRCLTRYYSSFVNMERDLASGLIGPLLICYKESVDORGNOIMSDKRNVILFSVFDENRS WYLTENIORFLPNPAGVOLEDPEFOASNIM HSINGYVFDSLOLSVCLHEVAYWYILSIGA OTDFLSVFFSGYTFKHKMVYEDTLTLFPFSGETVFMSMENPGLWILGCHNSDFRNRGMT ALLKVSSCDKNTGDYYEDSYEDISAYLLSKNNAIEPRSFSONPPVLKRHOREITRTTLOSD QEEIDYDDTISVEMKKEDFDIYDEDENQSPRSFQKKTRHYFIAAVERLWDYGMS SSPHV LRNRAQSGSVPQFKKVVFQEFTDGSFTQPLYRGELNEHLGLLGPYIRAEVEDNIMVTFR NQASRPYSFYSSLISYEEDQRQGAEPRKNFVKPNETKTYFWKVQHHMAPTKDEFDCKA WAYFSDVDLEKDVHSGLIGPLLVCHTNTLNPAHGRQVTVQEFALFFTIFDETKSWYFTE NMERNCRAPCNIQ MEDPTFKENYRFHAINGYIMDTLPGLVMAQDQRIRWYLLSMGSNE NIHSIHFSGHVFTVRKKEEYKMALYNLYPGVFETVEMLPSKAGIWRVECLIGEHLHAGM STLFLVYSNKCQTPLGMASGHIRDFQITASGQYGQWAPKLARLHYSGSINAWSTKEPFS WIKVDLLAPMIIHGIKTQGARQKFSSLYISQ FIIMYSLDGKKWQTYRGNSTGTLMVFFGN VDSSGIKHNIFNPPIIARYIRLHPTHYSIRSTLRMELMGCDLNSCSSMPLGMESKAISDAQIT ASSYFTNMFATWSPSKARLHLQGRSNAWRPQVNNPKEWLQVDFQKTMKVTGVTTQG VKSLLTSMYVKEFLISSSQDGHQWTLFFQNGKVKVFQGNQDSFTPV VNSLDPPLLTRYL RIHPQSWVHQIALRMEVLGCEAQDLY

Таблица 6 Нуклеотидная последовательность, кодирующаяTable 6 Nucleotide sequence coding

BDD FVIII (SEQ ID NO: 68)*BDD FVIII (SEQ ID NO: 68)*

661 A TGCAAATAGA GCTCTCCACC TGCTTCTTTC661 A TGCAAATAGA GCTCTCCACC TGCTTCTTTC

721 TGTGCCTTTT GCGATTCTGC TTTAGTGCCA CCAGAAGATA CTACCTGGGT GCAGTGGAAC721 TGTGCCTTTT GCGATTCTGC TTTAGTGCCA CCAGAAGATA CTACCTGGGT GCAGTGGAAC

781 TGTCATGGGA CTATATGCAA AGTGATCTCG GTGAGCTGCC TGTGGACGCA AGATTTCCTC781 TGTCATGGGA CTATATGCAA AGTGATCTCG GTGAGCTGCC TGTGGACGCA AGATTTCCTC

841 CTAGAGTGCC AAAATCTTTT CCATTCAACA CCTCAGTCGT GTACAAAAAG ACTCTGTTTG841 CTAGAGTGCC AAAATCTTTT CCATTCAACA CCTCAGTCGT GTACAAAAAG ACTCTGTTTG

901 TAGAATTCAC GGATCACCTT TTCAACATCG CTAAGCCAAG GCCACCCTGG ATGGGTCTGC901 TAGAATTCAC GGATCACCTT TTCAACATCG CTAAGCCAAG GCCACCCTGG ATGGGTCTGC

961 TAGGTCCTAC CATCCAGGCT GAGGTTTATG ATACAGTGGT CATTACACTT AAGAACATGG961 TAGGTCCTAC CATCCAGGCT GAGGTTTATG ATACAGTGGT CATTACACTT AAGAACATGG

- 57 044115- 57 044115

1021 CTTCCCATCC TGTCAGTCTT CATGCTGTTG GTGTATCCTA CTGGAAAGCT TCTGAGGGAG1021 CTTCCCATCC TGTCAGTCTT CATGCTGTTG GTGTATCCTA CTGGAAAGCT TCTGAGGGAG

1081 CTGAATATGA TGATCAGACC AGTCAAAGGG AGAAAGAAGA TGATAAAGTC TTCCCTGGTG1081 CTGAATATGA TGATCAGACC AGTCAAAGGG AGAAAGAAGA TGATAAAGTC TTCCCTGGTG

1141 GAAGCCATAC ATATGTCTGG CAGGTCCTGA AAGAGAATGG TCCAATGGCC TCTGACCCAC1141 GAAGCCATAC ATATGTCTGG CAGGTCCTGA AAGAGAATGG TCCAATGGCC TCTGACCCAC

1201 TGTGCCTTAC CTACTCATAT CTTTCTCATG TGGACCTGGT AAAAGACTTG AATTCAGGCC1201 TGTGCCTTAC CTACTCATAT CTTTCTCATG TGGACCTGGT AAAAGACTTG AATTCAGGCC

1261 TCATTGGAGC CCTACTAGTA TGTAGAGAAG GGAGTCTGGC CAAGGAAAAG ACACAGACCT1261 TCATTGGAGC CCTACTAGTA TGTAGAGAAG GGAGTCTGGC CAAGGAAAAG ACACAGACCT

1321 TGCACAAATT TATACTACTT TTTGCTGTAT TTGATGAAGG GAAAAGTTGG CACTCAGAAA1321 TGCACAAATT TATACTACTT TTTGCTGTAT TTGATGAAGG GAAAAGTTGG CACTCAGAAA

1381 CAAAGAACTC CTTGATGCAG GATAGGGATG CTGCATCTGC TCGGGCCTGG CCTAAAATGC1381 CAAAGAACTC CTTGATGCAG GATAGGGATG CTGCATCTGC TCGGGCCTGG CCTAAAATGC

1441 ACACAGTCAA TGGTTATGTA AACAGGTCTC TGCCAGGTCT GATTGGATGC CACAGGAAAT1441 ACACAGTCAA TGGTTATGTA AACAGGTCTC TGCCAGGTCT GATTGGATGC CACAGGAAAT

1501 CAGTCTATTG GCATGTGATT GGAATGGGCA CCACTCCTGA AGTGCACTCA ATATTCCTCG1501 CAGTCTATTG GCATGTGATT GGAATGGGGCA CCACTCCTGA AGTGCACTCA ATATTCCTCG

1561 AAGGTCACAC ATTTCTTGTG AGGAACCATC GCCAGGCGTC CTTGGAAATC TCGCCAATAA1561 AAGGTCACAC ATTTCTTGTG AGGAACCATC GCCAGGCGTC CTTGGAAATC TCGCCAATAA

1621 CTTTCCTTAC TGCTCAAACA CTCTTGATGG ACCTTGGACA GTTTCTACTG TTTTGTCATA1621 CTTTCCTTAC TGCTCAAACA CTCTTGATGG ACCTTGGACA GTTTCTACTG TTTTGTCATA

1681 TCTCTTCCCA CCAACATGAT GGCATGGAAG CTTATGTCAA AGTAGACAGC TGTCCAGAGG1681 TCTCTTCCCA CCAACATGAT GGCATGGAAG CTTATGTCAA AGTAGACAGC TGTCCAGAGG

1741 AACCCCAACT ACGAATGAAA AATAATGAAG AAGCGGAAGA CTATGATGAT GATCTTACTG1741 AACCCCAACT ACGAATGAAA AATAATGAAG AAGCGGAAGA CTATGATGAT GATCTTACTG

1801 ATTCTGAAAT GGATGTGGTC AGGTTTGATG ATGACAACTC TCCTTCCTTT ATCCAAATTC1801 ATTCTGAAAT GGATGTGGTC AGGTTTGATG ATGACAACTC TCCTTCCTTT ATCCAAATTC

1861 GCTCAGTTGC CAAGAAGCAT CCTAAAACTT GGGTACATTA CATTGCTGCT GAAGAGGAGG1861 GCTCAGTTGC CAAGAAGCAT CCTAAAACTT GGGTACATTA CATTGCTGCT GAAGAGGAGG

1921 ACTGGGACTA TGCTCCCTTA GTCCTCGCCC CCGATGACAG AAGTTATAAA AGTCAATATT1921 ACTGGGACTA TGCTCCCTTA GTCCTCGCCC CCGATGACAG AAGTTATAAA AGTCAATATT

1981 TGAACAATGG CCCTCAGCGG ATTGGTAGGA AGTACAAAAA AGTCCGATTT ATGGCATACA1981 TGAACAATGG CCCTCAGCGG ATTGGTAGGA AGTACAAAAA AGTCCGATTT ATGGCATACA

- 58 044115- 58 044115

2041 CAGATGAAAC CTTTAAGACT CGTGAAGCTA TTCAGCATGA2041 CAGATGAAAC CTTTAAGACT CGTGAAGCTA TTCAGCATGA

ATCAGGAATC TTGGGACCTTATCAGGAATC TTGGGACCTT

2101 TACTTTATGG GGAAGTTGGA GACACACTGT TGATTATATT TAAGAATCAA GCAAGCAGAC2101 TACTTTATGG GGAAGTTGGA GACACACTGT TGATTATATT TAAGAATCAA GCAAGCAGAC

2161 CATATAACAT CTACCCTCAC GGAATCACTG ATGTCCGTCC TTTGTATTCA AGGAGATTAC2161 CATATAACAT CTACCCTCAC GGAATCACTG ATGTCCGTCC TTTGTATTCA AGGAGATTAC

2221 CAAAAGGTGT ААААСATTTG AAGGATTTTC CAATTCTGCC AGGAGAAATA TTCAAATATA2221 CAAAAGGTGT AAAACATTTG AAGGATTTTC CAATTCTGCC AGGAGAAATA TTCAAATATA

2281 AATGGACAGT GACTGTAGAA GATGGGCCAA CTAAATCAGA TCCTCGGTGC CTGACCCGCT2281 AATGGACAGT GACTGTAGAA GATGGGCCAA CTAAATCAGA TCCTCGGTGC CTGACCCGCT

2341 ATTACTCTAG TTTCGTTAAT ATGGAGAGAG ATCTAGCTTC AGGACTCATT GGCCCTCTCC2341 ATTACTCTAG TTTCGTTAAT ATGGAGAGAG ATCTAGCTTC AGGACTCATT GGCCCTCTCC

2401 TCATCTGCTA CAAAGAATCT GTAGATCAAA GAGGAAACCA GATAATGTCA GACAAGAGGA2401 TCATCTGCTA CAAAGAATCT GTAGATCAAA GAGGAAACCA GATAATGTCA GACAAGAGGA

2461 ATGTCATCCT GTTTTCTGTA TTTGATGAGA ACCGAAGCTG GTACCTCACA GAGAATATAC2461 ATGTCATCCT GTTTTCTGTA TTTGATGAGA ACCGAAGCTG GTACCTCACA GAGAATATAC

2521 AACGCTTTCT CCCCAATCCA GCTGGAGTGC AGCTTGAGGA TCCAGAGTTC CAAGCCTCCA2521 AACGCTTTCT CCCCAATCCA GCTGGAGTGC AGCTTGAGGA TCCAGAGTTC CAAGCCTCCA

2581 ACATCATGCA CAGCATCAAT GGCTATGTTT TTGATAGTTT GCAGTTGTCA GTTTGTTTGC2581 ACATCATGCA CAGCATCAAT GGCTATGTTT TTGATAGTTT GCAGTTGTCA GTTTGTTTTGC

2641 ATGAGGTGGC ATACTGGTAC ATTCTAAGCA TTGGAGCACA GACTGACTTC CTTTCTGTCT2641 ATGAGGTGGC ATACTGGTAC ATTCTAAGCA TTGGAGCACA GACTGACTTC CTTTCTGTCT

2701 TCTTCTCTGG ATATACCTTC AAACACAAAA TGGTCTATGA AGACACACTC ACCCTATTCC2701 TCTTCTCTGG ATATACCTTC AAACACAAAA TGGTCTATGA AGACACACTC ACCCTATTCC

2761 CATTCTCAGG AGAAACTGTC TTCATGTCGA TGGAAAACCC AGGTCTATGG ATTCTGGGGT2761 CATTCTCAGG AGAAACTGTC TTCATGTCGA TGGAAAACCC AGGTCTATGG ATTCTGGGGT

2821 GCCACAACTC AGACTTTCGG AACAGAGGCA TGACCGCCTT ACTGAAGGTT TCTAGTTGTG2821 GCCACAACTC AGACTTTCGG AACAGAGGCA TGACCGCCTT ACTGAAGGTT TCTAGTTGTG

2881 ACAAGAACAC TGGTGATTAT TACGAGGACA GTTATGAAGA TATTTCAGCA TACTTGCTGA2881 ACAAGAACAC TGGTGATTAT TACGAGGACA GTTATGAAGA TATTTCAGCA TACTTGCTGA

2941 GTAAAAACAA TGCCATTGAA CCAAGAAGCT TCTCTCAAAA CCCACCAGTC TTGAAACGCC2941 GTAAAACAA TGCCATTGAA CCAAGAAGCT TCTCTCAAAA CCCACCAGTC TTGAAACGCC

3001 ATCAACGGGA AATAACTCGT ACTACTCTTC AGTCAGATCA AGAGGAAATT GACTATGATG3001 ATCAACGGGA AATAACTCGT ACTACTCTTC AGTCAGATCA AGAGGAAATT GACTATGATG

- 59 044115- 59 044115

3061 ATACCATATC AGTTGAAATG AAGAAGGAAG ATTTTGACAT3061 ATACCATATC AGTTGAAATG AAGAAGGAAG ATTTTGACAT

TTATGATGAG GATGAAAATCTTATGATGAG GATGAAAATC

3121 AGAGCCCCCG CAGCTTTCAA AAGAAAACAC GACACTATTT3121 AGAGCCCCCG CAGCTTTCAA AAGAAAACAC GACACTATTT

TATTGCTGCA GTGGAGAGGCTATTGCTGCA GTGGAGAGGC

3181 TCTGGGATTA TGGGATGAGT AGCTCCCCAC ATGTTCTAAG AAACAGGGCT CAGAGTGGCA3181 TCTGGGATTA TGGGATGAGT AGCTCCCCAC ATGTTCTAAG AAACAGGGCT CAGAGTGGCA

3241 GTGTCCCTCA GTTCAAGAAA GTTGTTTTCC AGGAATTTAC TGATGGCTCC TTTACTCAGC3241 GTGTCCCTCA GTTCAAGAAA GTTGTTTTCC AGGAATTTAC TGATGGCTCC TTTACTCAGC

3301 CCTTATACCG TGGAGAACTA AATGAACATT TGGGACTCCT GGGGCCATAT ATAAGAGCAG3301 CCTTATACCG TGGAGAACTA AATGAACATT TGGGACTCCT GGGGCCATAT ATAAGAGCAG

3361 AAGTTGAAGA TAATATCATG GTAACTTTCA GAAATCAGGC CTCTCGTCCC TATTCCTTCT3361 AAGTTGAAGA TAATATCATG GTAACTTTCA GAAATCAGGC CTCTCGTCCC TATTCTTCT

3421 ATTCTAGCCT TATTTCTTAT GAGGAAGATC AGAGGCAAGG AGCAGAACCT AGAAAAAACT3421 ATTCTAGCCT TATTTCTTAT GAGGAAGATC AGAGGCAAGG AGCAGAACCT AGAAAAAACT

3481 TTGTCAAGCC TAATGAAACC AAAACTTACT TTTGGAAAGT GCAACATCAT ATGGCACCCA3481 TTGTCAAGCC TAATGAAACC AAAACTTACT TTTGGAAAGT GCAACATCAT ATGGCACCCA

3541 CTAAAGATGA GTTTGACTGC AAAGCCTGGG CTTATTTCTC TGATGTTGAC CTGGAAAAAG3541 CTAAAGATGA GTTTGACTGC AAAGCCTGGG CTTATTTCTC TGATGTTGAC CTGGAAAAAG

3601 ATGTGCACTC AGGCCTGATT GGACCCCTTC TGGTCTGCCA CACTAACACA CTGAACCCTG3601 ATGTGCACTC AGGCCTGATT GGACCCCTTC TGGTCTGCCA CACTAACACA CTGAACCCTG

3661 CTCATGGGAG ACAAGTGACA GTACAGGAAT TTGCTCTGTT TTTCACCATC TTTGATGAGA3661 CTCATGGGAG ACAAGTGACA GTACAGGAAT TTGCTCTGTT TTTCACCATC TTTGATGAGA

3721 CCAAAAGCTG GTACTTCACT GAAAATATGG AAAGAAACTG CAGGGCTCCC TGCAATATCC3721 CCAAAAGCTG GTACTTCACT GAAAATTGG AAAGAAACTG CAGGGCTCCC TGCAATATCC

3781 AGATGGAAGA TCCCACTTTT AAAGAGAATT ATCGCTTCCA TGCAATCAAT GGCTACATAA3781 AGATGGAAGA TCCCACTTTT AAAGAGAATT ATCGCTTCCA TGCAATCAAT GGCTACATAA

3841 TGGATACACT ACCTGGCTTA GTAATGGCTC AGGATCAAAG GATTCGATGG TATCTGCTCA3841 TGGATACACT ACCTGGCTTA GTAATGGCTC AGGATCAAAG GATTCGATGG TATCTGCTCA

3901 GCATGGGCAG CAATGAAAAC ATCCATTCTA TTCATTTCAG TGGACATGTG TTCACTGTAC3901 GCATGGGCAG CAATGAAAAC ATCCATTCTA TTCATTTCAG TGGACATGTG TTCACTGTAC

3961 GAAAAAAAGA GGAGTATAAA ATGGCACTGT ACAATCTCTA TCCAGGTGTT TTTGAGACAG3961 GAAAAAAAGA GGAGTATAAA ATGGCACTGT ACAATCTCTA TCCAGGTGTT TTTGAGACAG

4021 TGGAAATGTT ACCATCCAAA GCTGGAATTT GGCGGGTGGA ATGCCTTATT GGCGAGCATC4021 TGGAAATGTT ACCATCCAAA GCTGGAATTT GGCGGGTGGA ATGCCTTATT GGCGAGCATC

- 60 044115- 60 044115

4081 TACATGCTGG GATGAGCACA CTTTTTCTGG TGTACAGCAA4081 TACATGCTGG GATGAGCACA CTTTTTCTGG TGTACAGCAA

TAAGTGTCAG ACTCCCCTGGTAAGTGTCAG ACTCCCCTGG

4141 GAATGGCTTC TGGACACATT AGAGATTTTC AGATTACAGC4141 GAATGGCTTC TGGACACATT AGAGATTTTC AGATTACAGC

TTCAGGACAA TATGGACAGTTTCAGGACAA TATGGACAGT

4201 GGGCCCCAAA GCTGGCCAGA CTTCATTATT CCGGATCAAT CAATGCCTGG AGCACCAAGG4201 GGGCCCCAAA GCTGGCCAGA CTTCATTATT CCGGATCAAT CAATGCCTGG AGCACCAAGG

4261 AGCCCTTTTC TTGGATCAAG GTGGATCTGT TGGCACCAAT GATTATTCAC GGCATCAAGA4261 AGCCCTTTTC TTGGATCAAG GTGGATCTGT TGGCACCAAT GATTATTCAC GGCATCAAGA

4321 CCCAGGGTGC CCGTCAGAAG TTCTCCAGCC TCTACATCTC TCAGTTTATC ATCATGTATA4321 CCCAGGGTGC CCGTCAGAAG TTCTCCAGCC TCTACATCTC TCAGTTTATC ATCATGTATA

4381 GTCTTGATGG GAAGAAGTGG CAGACTTATC GAGGAAATTC CACTGGAACC TTAATGGTCT4381 GTCTTGATGG GAAGAAGTGG CAGACTTATC GAGGAAATTC CACTGGAACC TTAATGGTCT

4441 TCTTTGGCAA TGTGGATTCA TCTGGGATAA AACACAATAT TTTTAACCCT CCAATTATTG4441 TCTTTGGCAA TGTGGATTCA TCTGGGATAA AACACAATAT TTTTAACCCT CCAATTATTG

4501 CTCGATACAT CCGTTTGCAC CCAACTCATT ATAGCATTCG CAGCACTCTT CGCATGGAGT4501 CTCGATACAT CCGTTTGCAC CCAACTCATT ATAGCATTCG CAGCACTCTT CGCATGGAGT

4561 TGATGGGCTG TGATTTAAAT AGTTGCAGCA TGCCATTGGG AATGGAGAGT AAAGCAATAT4561 TGATGGGCTG TGATTTAAAT AGTTGCAGCA TGCCATTGGG AATGGAGAGT AAAGCAATAT

4621 CAGATGCACA GATTACTGCT TCATCCTACT TTACCAATAT GTTTGCCACC TGGTCTCCTT4621 CAGATGCACA GATTACTGCT TCATCCTACT TTACCAATAT GTTTGCCACC TGGTCTCCTT

4681 CAAAAGCTCG ACTTCACCTC CAAGGGAGGA GTAATGCCTG GAGACCTCAG GTGAATAATC4681 CAAAAGCTCG ACTTCACCTC CAAGGGAGGA GTAATGCCTG GAGACCTCAG GTGAATAATC

4741 CAAAAGAGTG GCTGCAAGTG GACTTCCAGA AGACAATGAA AGTCACAGGA GTAACTACTC4741 CAAAAGAGTG GCTGCAAGTG GACTTCCAGA AGACAATGAA AGTCACAGGA GTAACTACTC

4801 AGGGAGTAAA ATCTCTGCTT ACCAGCATGT ATGTGAAGGA GTTCCTCATC TCCAGCAGTC4801 AGGGAGTAAA ATCTCTGCTT ACCAGCATGT ATGTGAAGGA GTTCCTCATC TCCAGCAGTC

4861 AAGATGGCCA TCAGTGGACT CTCTTTTTTC AGAATGGCAA AGTAAAGGTT TTTCAGGGAA4861 AAGATGGCCA TCAGTGGACT CTCTTTTTTC AGAATGGCAA AGTAAAGGTT TTTCAGGGAA

4921 ATCAAGACTC CTTCACACCT GTGGTGAACT CTCTAGACCC ACCGTTACTG ACTCGCTACC4921 ATCAAGACTC CTTCACACCT GTGGTGAACT CTCTAGACCC ACCGTTACTG ACTCGCTACC

4981 TTCGAATTCA CCCCCAGAGT TGGGTGCACC AGATTGCCCT GAGGATGGAG GTTCTGGGCT4981 TTCGAATTCA CCCCCAGAGT TGGGTGCACC AGATTGCCCT GAGGATGGAG GTTCTGGGCT

5041 GCGAGGCACA GGACCTCTAC *Подчеркнутые нуклеиновые кислоты кодируют сигнальный пептид5041 GCGAGGCACA GGACCTCTAC *Underlined nucleic acids encode a signal peptide

FVIII с удаленным доменом В может иметь полные или частичные делеции, раскрытые в патентах США № 6,316,226, 6,346,513, 7,041,635, 5,789,203, 6,060,447, 5,595,886, 6,228,620, 5,972,885, 6,048,720, 5,543,502, 5,610,278, 5,171,844, 5,112,950, 4,868,112 и 6,458,563. В некоторых вариантах реализации изобретения последовательность FVIII с удаленным доменом В по данному изобретению содержит любую из делеций, описанную в кол. 4, строка 4 до кол. 5, строка 28 и примеры 1-5 патента США № 6,316,226 (также в патенте США 6,346,513). В другом варианте реализации изобретения фактор VIII с удаленным доменом В является S743/Q1638 фактором VIII с удаленным доменом В (SQ BDD FVIII) (например, фактор VIII с делецией от аминокислоты 744 до аминокислоты 1637, например, фактор VIII, имеющий аминокислоты 1-743 и аминокислоты 1638-2332 из SEQ ID NO: 65, т.е. SEQ ID NO: 67). В некоторых вариантах реализации изобретения FVIII с удаленным доменом В по данному изобретению содержит делецию, описанную в кол. 2, строки 26-51 и примеры 5-8 патента США № 5,789,203 (также США 6,060,447, США 5,595,886 и США 6,228,620). В некоторых вариантах реализации изобретения FVIII с удаленным доменом В по данному изобретению содержит делецию, описанную в кол. 1, строки 25 до кол. 2, строка 40 патента США № 5,972,885; кол.6, строки 1-22 и пример 1 патента США № 6,048,720; кол. 2, строки 17-46 патента США № 5 543 502; кол. 4, строка 22 до кол. 5, строка 36 патента США № 5,171,844; кол. 2, строки 55-68, фигуре 2 и пример 1 патента США № 5,112,950; кол. 2, строка 2 до кол. 19, строка 21 и таблица 2 патента США № 4,868,112; кол. 2, строка 1 до кол. 3, строка 19, кол. 3, строка 40 до кол. 4,FVIII with the B domain deleted may have complete or partial deletions, as disclosed in US Patent Nos. 6,316,226, 6,346,513, 7,041,635, 5,789,203, 6,060,447, 5,595,886, 6,228,620, 5,972,885, 6,048.7 20, 5,543,502, 5,610,278, 5,171,844, 5,112,950, 4,868,112 and 6,458,563. In some embodiments, the B domain deleted FVIII sequence of the present invention comprises any of the deletions described in col. 4, line 4 to count. 5, line 28 and examples 1-5 of US Patent No. 6,316,226 (also in US Patent 6,346,513). In another embodiment, Factor VIII with B domain deleted is S743/Q1638 Factor VIII with B domain deleted (SQ BDD FVIII) (e.g., Factor VIII with a deletion from amino acid 744 to amino acid 1637, e.g., Factor VIII having amino acids 1-743 and amino acids 1638-2332 from SEQ ID NO: 65, i.e. SEQ ID NO: 67). In some embodiments, the B domain deleted FVIII of the present invention contains the deletion described in col. 2, lines 26-51 and examples 5-8 of US Patent No. 5,789,203 (also US 6,060,447, US 5,595,886 and US 6,228,620). In some embodiments, the B domain deleted FVIII of the present invention contains the deletion described in col. 1, lines 25 to count. 2, line 40 of US Pat. No. 5,972,885; Col. 6, lines 1-22 and example 1 of US Patent No. 6,048,720; count 2, lines 17-46 of US Patent No. 5,543,502; count 4, line 22 to count. 5, line 36 of US Patent No. 5,171,844; count 2, lines 55-68, figure 2 and example 1 of US patent No. 5,112,950; count 2, line 2 to count. 19, line 21 and table 2 of US Patent No. 4,868,112; count 2, line 1 to count. 3, line 19, count. 3, line 40 to count. 4,

- 61 044115 строка 67, кол. 7, строка 43 до кол. 8, строка 26 и кол. 11, строка 5 до кол. 13, строка 39 патента США № 7,041,635; или кол. 4, строки 25-53, патента США № 6,458,563. В некоторых вариантах реализации изобретения FVIII с удаленным доменом В имеет делецию большей части домена В, но по-прежнему содержит аминоконцевые последовательности домена В, которые необходимы для протеолитического процессинга первичного продукта трансляции на две полипептидные цепи in vivo, как описано в WO 91/09122. В некоторых вариантах реализации изобретения FVIII с удаленным доменом В создан с удаленными аминокислотами 747-1638, т.е. практически полное удаление домена В. Hoeben R.C., et al., J. Biol. Chem. 265 (13): 7318-7323 (1990 год). FVIII с удаленным доменом В может также содержать делецию аминокислот 771-1666 или аминокислот 868-1562 из FVIII. Meulien P., et al., Protein Eng. 2(4): 301-6 (1988 год). Дополнительные делеции домена В, являющиеся частью настоящего изобретения, включают в себя: делеции аминокислот от 982 до 1562 или от 760 до 1639 (Toole et al., Proc. Natl. Acad. Sci. U.S.A (1986 год) 83, 5939-5942)), от 797 до 1562 (Eaton, et al., Biochemistry (1986 год) 25:8343-8347)), от 741 до 1646 (Kaufman (опубликованная заявка PCT № WO 87/04187)), 747-1560 (Sarver, et al., DNA(1987) 6:553-564)), от 741 до 1648 (Pasek (заявка PCT №88/00831)), или от 816 до 1598, или от 741 до 1648 (Lagner (Behring Inst. Mitt. (1988 год) No 82:16-25, EP 295597)). В другом варианте реализации изобретения BDD FVIII включает в себя полипепдид FVIII, содержащий фрагменты домена В, которые сохраняют один или более N-связанных сайтов гликозилирования, например остатки 757, 784, 828, 900, 963 или, в некоторых случаях, 943, которые соответствуют аминокислотной последовательности полноразмерной последовательности FVIII. Примеры фрагментов доменом В включают 226 аминокислот или 163 аминокислоты домена В, как описано в Miao, H.Z., et al., Blood 103(a): 3412-3419 (2004 год), Kasuda, A, et al., J. Thromb. Haemost. 6: 1352-1359 (2008 год), и Pipe, S.W., et al., J. Thromb. Haemost. 9: 2235-2242 (2011 год) (т.е. первые 226 аминокислот или 163 аминокислот домена В сохраняются). В еще одних вариантах реализации изобретения BDD FVIII дополнительно содержит точечную мутацию в остатке 309 (от Phe до Ser) для улучшения экспрессии белка BDD FVIII. См. Miao, H.Z., et al., Blood 103(a): 3412-3419 (2004 год). В еще одних вариантах реализации изобретения BDD FVIII включает в себя полипепдид FVIII, содержащий часть домена В, но не содержащий один или более сайтов расщепления фурина (например, Arg1313 и Arg 1648). См. Pipe, S.W., et al., J. Thromb. Haemost. 9: 2235-2242 (2011 год). Каждая из вышеупомянутых делеций может быть сделана в любой последовательности FVIII.- 61 044115 line 67, count. 7, line 43 to count. 8, line 26 and count. 11, line 5 to count. 13, line 39 of US Pat. No. 7,041,635; or count. 4, lines 25-53, US Patent No. 6,458,563. In some embodiments, the B domain deleted FVIII has a large portion of the B domain deleted but still contains the amino terminal B domain sequences that are required for proteolytic processing of the primary translation product into two polypeptide chains in vivo, as described in WO 91/09122. In some embodiments, the B domain deleted FVIII is created with amino acids 747-1638 deleted, i.e. almost complete removal of the B domain. Hoeben R.C., et al., J. Biol. Chem. 265 (13): 7318-7323 (1990). FVIII with the B domain deleted may also contain a deletion of amino acids 771-1666 or amino acids 868-1562 from FVIII. Meulien P., et al., Protein Eng. 2(4): 301-6 (1988). Additional B domain deletions that are part of the present invention include: deletions of amino acids 982 to 1562 or 760 to 1639 (Toole et al., Proc. Natl. Acad. Sci. U.S.A (1986) 83, 5939-5942) ), 797 to 1562 (Eaton, et al., Biochemistry (1986) 25:8343-8347)), 741 to 1646 (Kaufman (PCT Application Published No. WO 87/04187)), 747-1560 (Sarver, et al., DNA(1987) 6:553-564)), 741 to 1648 (Pasek (PCT Application No. 88/00831)), or 816 to 1598, or 741 to 1648 (Lagner (Behring Inst. Mitt (1988) No. 82:16-25, EP 295597)). In another embodiment, the FVIII BDD includes an FVIII polypeptide containing B domain fragments that retain one or more N-linked glycosylation sites, such as residues 757, 784, 828, 900, 963, or, in some cases, 943, which correspond to amino acid sequence of the full-length FVIII sequence. Examples of B domain fragments include 226 amino acids or 163 amino acids of B domain, as described in Miao, H. Z., et al., Blood 103(a): 3412-3419 (2004), Kasuda, A, et al., J. Thromb. Haemost. 6: 1352-1359 (2008), and Pipe, S.W., et al., J. Thromb. Haemost. 9: 2235-2242 (2011) (ie, the first 226 amino acids or 163 amino acids of the B domain are retained). In yet other embodiments, BDD FVIII further comprises a point mutation at residue 309 (Phe to Ser) to improve BDD FVIII protein expression. See Miao, H. Z., et al., Blood 103(a): 3412-3419 (2004). In yet other embodiments, the FVIII BDD includes a FVIII polypeptide containing a portion of the B domain but lacking one or more furin cleavage sites (eg, Arg1313 and Arg 1648). See Pipe, S. W., et al., J. Thromb. Haemost. 9: 2235-2242 (2011). Each of the above deletions can be made in any FVIII sequence.

В некоторых вариантах реализации изобретения FVIII имеет частичный домен В. В некоторых вариантах реализации изобретения белком FVIII с частичным доменом В является FVIII 198. FVIII 198 представляет собой частичный домен В, содержащий одноцепочечную FVIIIFc молекулу-226N6. Номер 226 означает N-конец 226 аминокислоты домена В FVIII, и N6 означает шесть сайтов Nгликозилирования в домене В.In some embodiments, FVIII has a partial B domain. In some embodiments, the FVIII protein with a partial B domain is FVIII 198. FVIII 198 is a partial B domain containing a single-chain FVIIIFc molecule-226N6. The number 226 denotes the N-terminal 226 amino acids of the FVIII B domain, and N6 denotes the six Nglycosylation sites in the B domain.

В одном варианте реализации изобретения FVIII расщепляется сразу после аргинина - аминокислота 1648 (в полноразмерном факторе VIII или SEQ ID NO: 65), аминокислота 754 (в S743/Q1638 факторе VIII с удаленным доменом В или SEQ ID NO: 67), или соответствующий остаток аргинина (в других вариантах), что приводит к образованию тяжелой цепи и легкой цепи. В других вариантах реализации изобретения FVIII содержит тяжелую цепь и легкую цепь, которые связаны или соединены с помощью металлической ион-опосредованной нековалентной связи.In one embodiment, FVIII is cleaved immediately after arginine at amino acid 1648 (in full-length Factor VIII or SEQ ID NO: 65), amino acid 754 (in S743/Q1638 domain B deleted Factor VIII or SEQ ID NO: 67), or a corresponding residue arginine (in other variants), which leads to the formation of a heavy chain and a light chain. In other embodiments, FVIII comprises a heavy chain and a light chain that are linked or joined by a metal ion-mediated non-covalent bond.

В другом варианте реализации изобретения FVIII представляет собой одноцепочечный FVIII, который не был расщеплен сразу после аргинина - аминокислота 1648 (в полоноразмерном FVIII или SEQ ID NO: 65), аминокислота 754 (в S743/Q1638 FVIII с удаленным доменом В или SEQ ID NO: 67), или соответствующий остаток аргинина (в других вариантах). Одноцепочечный FVIII может содержать одну или более аминокислотных замен. В одном варианте реализации изобретения аминокислотная замена касается остатка, соответствующего остатку 1648, остатку 1645 или им обоим в полноразмерном полипептиде зрелого фактора VIII (SEQ ID NO: 65), или остатку 754, остатку 751, или им обоим в SQ BDD факторе VIII (SEQ ID NO: 67). Аминокислотной заменой может быть любая аминокислота, кроме аргинина, например, изолейцин, лейцин, лизин, метионин, фенилаланин, треонин, триптофан, валин, аланин, аспарагин, аспарагиновая кислота, цистеин, глутаминовая кислота, глутамин, глицин, пролин, селеноцистеин, серин, тирозин, гистидин, орнитин, пирролизин или таурин.In another embodiment, the FVIII is a single chain FVIII that has not been cleaved immediately after the arginine - amino acid 1648 (in full-length FVIII or SEQ ID NO: 65), amino acid 754 (in S743/Q1638 FVIII with the B domain deleted or SEQ ID NO: 67), or the corresponding arginine residue (in other embodiments). Single chain FVIII may contain one or more amino acid substitutions. In one embodiment, the amino acid substitution is at a residue corresponding to residue 1648, residue 1645, or both in the full-length mature factor VIII polypeptide (SEQ ID NO: 65), or residue 754, residue 751, or both in SQ BDD factor VIII (SEQ ID NO: 67). The amino acid substitution can be any amino acid except arginine, for example, isoleucine, leucine, lysine, methionine, phenylalanine, threonine, tryptophan, valine, alanine, asparagine, aspartic acid, cysteine, glutamic acid, glutamine, glycine, proline, selenocysteine, serine, tyrosine, histidine, ornithine, pyrrolysine or taurine.

FVIII дополнительно может быть расщеплен тромбином, а затем активирован как FVIIIa, выступая в качестве кофактора для активированного фактора IX (FIXa). И активированный FIX вместе с активированным FVIII образует комплекс Xase и преобразует фактор X в активированный фактор X (FXa). Для активации FVIII расщепляется тромбином после трех остатков аргинина - аминокислоты 372, 740 и 1689 (соответствующие аминокислотам 372, 740 и 795 в последовательности FVIII с удаленным доменом В) в результате расщепление образовывается FVIIIa, имеющий цепи А1 - 50 кДа, А2 - 43 кДа и А3-С1-С2 - 73 кДа. В одном варианте реализации изобретения белок FVIII, пригодный для настоящего изобретения, представляет собой неактивный FVIII. В другом варианте реализации изобретения белок FVIII представляет собой активированный FVIII.FVIII can additionally be cleaved by thrombin and then activated as FVIIIa, serving as a cofactor for activated factor IX (FIXa). And activated FIX, together with activated FVIII, forms the Xase complex and converts factor X into activated factor X (FXa). To activate, FVIII is cleaved by thrombin after three arginine residues - amino acids 372, 740 and 1689 (corresponding to amino acids 372, 740 and 795 in the FVIII sequence with the B domain removed) as a result of the cleavage, FVIIIa is formed, having chains A1 - 50 kDa, A2 - 43 kDa and A3-C1-C2 - 73 kDa. In one embodiment, the FVIII protein useful in the present invention is inactive FVIII. In another embodiment of the invention, the FVIII protein is activated FVIII.

Белок, имеющий полипептид FVIII, связанный или соединенный с белком ФВ может содержать последовательность по меньшей мере на 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% или 100% идентичную последовательности SEQ ID NO: 65 или 67, в котором последовательность имеет FVIII свер- 62 044115 тывающую активность, например, активирующую фактор IX в качестве кофактора для преобразования фактора X в активированный фактор X (FXa).The protein having the FVIII polypeptide linked or linked to the VWF protein may contain at least 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% or 100 of the sequence % identical to the sequence of SEQ ID NO: 65 or 67, in which the sequence has FVIII coagulation activity, for example, activating factor IX as a cofactor for converting factor X to activated factor X (FXa).

В данном контексте гибридные или химерные полипептиды и белки включают в себя сочетание первой полипептидной цепи, например, белок ФВ, слитый с последовательностью XTEN, имеющей менее 288 аминокислот, и первой константной областью ИГ или ее частью, и второй полипептидной цепи, например, белок FVIII, слитый со второй константной областью ИГ или ее частью, образуя, таким образом, гетеродимер. В одном варианте реализации изобретения первый полипептид и второй полипептид в гибриде соединены друг с другом посредством белок-белковых взаимодействий, таких как зарядзарядные или гидрофобные взаимодействия. В другом варианте реализации изобретения первый полипептид содержит слитый белок ФВ-XTEN-Fc, и второй полипептид содержит слитый белок FVIII-Fc, образовывая гибридный гетеродимер, в котором XTEN содержит менее 288 аминокислот. В других вариантах реализации изобретения первый полипептид содержит слитый белок ФВ-XTEN-Fc, и второй полипептид содержит слитый белок FVIII(X)-Fc, образовывая гибридный гетеродимер, в котором XTEN содержит менее 288 аминокислот. Первый полипептид и второй полипептид может быть соединен посредством ковалентной связи, например, дисульфидной связи между первым фрагментом Fc и вторым фрагментом Fc. Первый полипептид и второй полипептид дополнительно могут быть соединены друг с другом посредством связывания между фрагментом ФВ и белком FVIII.As used herein, hybrid or chimeric polypeptides and proteins include the combination of a first polypeptide chain, e.g., VWF protein fused to an XTEN sequence of less than 288 amino acids and a first IG constant region or portion thereof, and a second polypeptide chain, e.g., FVIII protein fused to the second IG constant region or part thereof, thus forming a heterodimer. In one embodiment of the invention, the first polypeptide and the second polypeptide in the hybrid are connected to each other through protein-protein interactions, such as charge-charge or hydrophobic interactions. In another embodiment, the first polypeptide contains a VWF-XTEN-Fc fusion protein and the second polypeptide contains a FVIII-Fc fusion protein, forming a hybrid heterodimer in which XTEN contains less than 288 amino acids. In other embodiments, the first polypeptide contains a VWF-XTEN-Fc fusion protein and the second polypeptide contains a FVIII(X)-Fc fusion protein, forming a hybrid heterodimer in which XTEN contains less than 288 amino acids. The first polypeptide and the second polypeptide may be joined by a covalent bond, such as a disulfide bond, between the first Fc moiety and the second Fc moiety. The first polypeptide and the second polypeptide may further be linked to each other through binding between the VWF moiety and the FVIII protein.

Белок FVIII, пригодный к использованию в настоящем изобретении, может включать в себя FVIII, имеющий одну или более дополнительных последовательностей XTEN, которые не влияют на свертывающую активность FVIII. Такие последовательности XTEN могут быть слиты с С-концом или Nконцом белка FVIII или вставляться между одним или более из двух аминокислотных остатков в белке FVIII, причем вставки не влияют на свертывающую активность или функцию FVIII. В одном варианте реализации изобретения вставки улучшают фармакокинетические свойства белка FVIII (например, период полувыведения). В другом варианте реализации изобретения вставки могут быть множественными, например, больше двух, трех, четырех, пяти, шести, семи, восьми, девяти или десяти вставок. Примеры сайтов встраивания включают, но не ограничиваются ими, сайты, перечисленные в таблицах 7, 8, 9, 10, 11, 12, 13, 14, 15 или любые их сочетания.A FVIII protein useful in the present invention may include FVIII having one or more additional XTEN sequences that do not affect the clotting activity of FVIII. Such XTEN sequences can be fused to the C-terminus or N-terminus of the FVIII protein or inserted between one or more of two amino acid residues in the FVIII protein, the insertions not affecting the folding activity or function of FVIII. In one embodiment, the inserts improve the pharmacokinetic properties of the FVIII protein (eg, half-life). In another embodiment of the invention, the inserts may be multiple, for example, more than two, three, four, five, six, seven, eight, nine or ten inserts. Examples of embedding sites include, but are not limited to, the sites listed in Tables 7, 8, 9, 10, 11, 12, 13, 14, 15, or any combination thereof.

Белок FVIII, связанный с одной или более последовательностями XTEN, может быть представлен в виде FVIII(X2) или FVIII(a^b)-X-FVIII(c^d), причем FVIII(a^b) содержит, по существу состоит или состоит из первой части белка FVIII от аминокислотного остатка а до аминокислотного остатка b; X2 содержит, по существу состоит или состоит из одной или более последовательностей XTEN, FVIII(c^d) содержит, по существу состоит или состоит из второй части белка FVIII от аминокислотного остатка с до аминокислотного остатка d;The FVIII protein associated with one or more XTEN sequences may be represented as FVIII(X2) or FVIII( a ^ b )-X-FVIII( c ^ d ), wherein FVIII( a ^ b ) contains, consists essentially of, or consists of the first part of the FVIII protein from amino acid residue a to amino acid residue b; X2 contains, essentially consists of, or consists of one or more XTEN sequences, FVIII(c^d) contains, essentially consists of, or consists of a second portion of the FVIII protein from amino acid residue c to amino acid residue d;

а является N-концевым аминокислотным остатком первой части белка FVIII, b является С-концевым аминокислотным остатком первой части белка FVIII, но также является Nконцевым аминокислотным остатком двух аминокислот сайта встраивания, в который вставляется последовательность XTEN, с является N-концевым аминокислотным остатком второй части белка FVIII, но также является Сконцевым аминокислотным остатком двух аминокислот сайта встраивания, в который вставляется последовательность XTEN, и d является С-концевым аминокислотным остатком белка FVIII, и при этом первая часть белка FVIII и вторая часть белка FVIII не совпадают друг с другом и вместе имеют достаточную длину, чтобы белок FVIII имел свертывающую активность FVIII.a is the N-terminal amino acid residue of the first part of the FVIII protein, b is the C-terminal amino acid residue of the first part of the FVIII protein, but is also the N-terminal amino acid residue of the two amino acid residues of the insertion site into which the XTEN sequence is inserted, c is the N-terminal amino acid residue of the second part of the FVIII protein, but is also the C-terminal amino acid residue of the two amino acids of the insertion site into which the XTEN sequence is inserted, and d is the C-terminal amino acid residue of the FVIII protein, and wherein the first portion of the FVIII protein and the second portion of the FVIII protein are not identical to each other and together are of sufficient length for the FVIII protein to have the clotting activity of FVIII.

В одном варианте реализации изобретения первая часть белка FVIII и вторая часть белка FVIII являются фрагментами SEQ ID NO: 65 (полноразмерная зрелая последовательность FVIII) или SEQ ID NO: 67 (FVIII с удаленным доменом В), например, N-концевая часть и С-концевая часть соответственно. В некоторых вариантах реализации изобретения первая часть белка FVIII содержит домен А1 и домен А2 белка FVIII. Вторая часть белка FVIII содержит домен A3, домен С1 и, в некоторых случаях, домен С2. В еще одних вариантах реализации изобретения первая часть белка FVIII содержит домен А1 и домен А2, и вторая часть белка FVIII содержит часть домена В, домен A3, домен С1 и, в некоторых случаях, домен С2. В еще одних вариантах реализации изобретения первая часть белка FVIII включает домен А1 домен А2 и часть домена В белка FVIII, а вторая часть белка FVIII содержит домен A3, домен С1, и, в некоторых случаях, домен С2. В еще одних вариантах реализации изобретения первая часть белка FVIII содержит домен А1, домен А2 и первую часть домена В белка FVIII. Вторая часть белка FVIII содержит вторую часть домена В, домен A3, домен С1 и, в некоторых случаях, домен С2. В некоторых вариантах реализации изобретения две аминокислоты (b и с) могут представлять собой один или более сайтов встраивания аминокислотных остатков, приведенных в табл. 7, 8, 9, 10, 11, 12, 13, 14 и 15. Например, b может быть аминокислотным остатком, расположенным непосредственно выше сайта, в который одна или более последовательностей XTEN вставлены или связаны, и с может быть аминокислотным остатком, расположенным непосредственно ниже сайта, в который один или более последовательностей XTEN вставлены или связаны. В некоторых вариантах реализации изобретения а является первой зреIn one embodiment, the first portion of the FVIII protein and the second portion of the FVIII protein are fragments of SEQ ID NO: 65 (full-length mature FVIII sequence) or SEQ ID NO: 67 (FVIII with B domain deleted), for example, the N-terminal portion and C- end part accordingly. In some embodiments, the first portion of the FVIII protein comprises an A1 domain and an A2 domain of the FVIII protein. The second portion of the FVIII protein contains an A3 domain, a C1 domain, and, in some cases, a C2 domain. In still other embodiments, the first portion of the FVIII protein comprises an A1 domain and an A2 domain, and the second portion of the FVIII protein comprises a portion of a B domain, an A3 domain, a C1 domain, and, in some cases, a C2 domain. In still other embodiments, the first portion of the FVIII protein includes an A1 domain, an A2 domain, and a portion of the B domain of the FVIII protein, and the second portion of the FVIII protein comprises an A3 domain, a C1 domain, and, in some cases, a C2 domain. In still other embodiments, the first portion of the FVIII protein comprises an A1 domain, an A2 domain, and a first portion of the B domain of the FVIII protein. The second part of the FVIII protein contains the second part of the B domain, the A3 domain, the C1 domain and, in some cases, the C2 domain. In some embodiments, the two amino acids (b and c) may represent one or more insertion sites for the amino acid residues listed in Table 1. 7, 8, 9, 10, 11, 12, 13, 14 and 15. For example, b may be an amino acid residue located immediately upstream of the site into which one or more XTEN sequences are inserted or linked, and c may be an amino acid residue located immediately below the site at which one or more XTEN sequences are inserted or linked. In some embodiments of the invention, a is the first

- 63 044115 лой аминокислотной последовательностью белка FVIII, и d является последней аминокислотной последовательностью белка FVIII. Например, FVIII,(а^b) может быть аминокислотной последовательностью по меньшей мере на 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% или 100% идентичной аминокислотам 1-745 из SEQ ID NO: 67 (аминокислотная последовательность FVIII с удаленным доменом В) или SEQ ID NO: 65 (полноразмерный FVIII), и FVIII(C^d) может быть аминокислотами 746-1438 из SEQ ID NO: 67 или аминокислотами 1641-2332 из SEQ ID NO: 65, соответственно.- 63 044115 is the amino acid sequence of the FVIII protein, and d is the last amino acid sequence of the FVIII protein. For example, FVIII,( a ^b) may be an amino acid sequence at least 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99%, or 100% identical to amino acids 1-745 of SEQ ID NO: 67 (amino acid sequence of FVIII with B domain deleted) or SEQ ID NO: 65 (full-length FVIII), and FVIII( C ^ d ) may be amino acids 746-1438 of SEQ ID NO: 67 or amino acids 1641-2332 of SEQ ID NO: 65, respectively.

В некоторых аспектах сайт встраивания в белке FVIII расположен в пределах одного или более доменов белка FVIII, которыми являются N-конец, домен А1, домен А2, домен A3, домен В, домен С1, домен С2, С-конец или два или более их сочетания, или между двумя доменами белка FVIII, которыми являются домен А1 и кислая область a1, и кислая область a1 и домен А2, домен А2 и а2 кислая область, кислая область а2 и домен В, домен В и домен A3, и домен A3 и домен С1, домен С1 и домен С2 или любые их сочетания. Например, сайты встраивания, в которые последовательность XTEN может быть вставлена, выбрана из группы, состоящей из N-конца и домена A1, N-конца и домена А2, N-конца и домена A3, N-конца и домена В, N-конца и домена C1, N-конца и домена С2, N-конца и С-конца, доменов А1 и А2, доменов А1 и A3, доменов А1 и В, доменов А1 и С1, доменов А1 и С2, домена А1 и С-конца, доменов А2 и A3, доменов А2 и В, доменов А2 и С1, доменов А2 и С2, домена А2 и С-конца, доменов A3 и В, доменов A3 и С1, доменов A3 и С2, домена A3 и С-конца, доменов В и С1, доменов В и С2, домена В и С-конца, доменов С1 и С2, домена С1 и С-конца, домена С2, и С-конца, и двух или более их сочетаний. Не ограничивающие примеры сайтов встраивания перечислены в табл. 7, 8, 9, 10, 11, 12, 13, 14 и 15.In some aspects, the insertion site in the FVIII protein is located within one or more domains of the FVIII protein, which are the N-terminus, the A1 domain, the A2 domain, the A3 domain, the B domain, the C1 domain, the C2 domain, the C-terminus, or two or more of them. combinations, or between two domains of the FVIII protein, which are the A1 domain and the a1 acidic region, and the a1 acidic region and the A2 domain, the A2 domain and the a2 acidic region, the a2 acidic region and the B domain, the B domain and the A3 domain, and the A3 domain and C1 domain, C1 domain and C2 domain, or any combination thereof. For example, the insertion sites into which the XTEN sequence may be inserted are selected from the group consisting of N-terminus and A1 domain, N-terminus and A2 domain, N-terminus and A3 domain, N-terminus and B domain, N-terminus and domain C1, N-terminus and domain C2, N-terminus and C-terminus, domains A1 and A2, domains A1 and A3, domains A1 and B, domains A1 and C1, domains A1 and C2, domain A1 and C-terminus , domains A2 and A3, domains A2 and B, domains A2 and C1, domains A2 and C2, domain A2 and C-terminus, domains A3 and B, domains A3 and C1, domains A3 and C2, domain A3 and C-terminus, domains B and C1, domains B and C2, domain B and C-terminus, domains C1 and C2, domain C1 and C-terminus, domain C2 and C-terminus, and two or more combinations thereof. Non-limiting examples of embedding sites are listed in Table. 7, 8, 9, 10, 11, 12, 13, 14 and 15.

Белок FVIII, в котором последовательность XTEN вставляется непосредственно ниже одной или более аминокислот (например, один или более сайтов встраивания XTEN) в белке FVIII или связывается с С-концом или N-концом, сохраняет активность FVIII после связывания или вставки последовательности XTEN. Последовательность XTEN может быть вставлена в белок FVIII один или более одного раза, два раза, три раза, четыре раза, пять раз, или шесть раз таким образом, что вставки не влияют на активность FVIII (т.е. белок FVIII по-прежнему сохраняет коагуляционное свойство).An FVIII protein in which an XTEN sequence is inserted immediately downstream of one or more amino acids (eg, one or more XTEN insertion sites) in the FVIII protein or linked to the C-terminus or N-terminus retains FVIII activity after binding or insertion of the XTEN sequence. The XTEN sequence may be inserted into the FVIII protein one or more times once, twice, three times, four times, five times, or six times such that the insertions do not affect FVIII activity (i.e., the FVIII protein still retains coagulation property).

Белок FVIII, пригодный к использованию в настоящем изобретении, может быть связан с одним или более полипептидом XTEN на N-конце или на С-конце белка FVIII посредством необязательного линкера или вставлен непосредственно ниже одной или более аминокислот (например, один или более сайтов встраивания XTEN) в белке FVIII посредством одного или более необязательных линкеров. В одном варианте реализации изобретения два аминокислотных остатка, в которые вставляется последовательность XTEN, или аминокислотный остаток, с которым последовательность XTEN связывается, соответствуют двум или одному аминокислотному остатку из SEQ ID NO: 65 (полноразмерный зрелый FVIII), выбранный из группы, состоящей из остатков, представленных в табл. 7, табл. 8, табл. 9 и в табл. 10, и любых их сочетаний.An FVIII protein useful in the present invention may be linked to one or more XTEN polypeptides at the N-terminus or C-terminus of the FVIII protein via an optional linker or inserted immediately downstream of one or more amino acids (e.g., one or more XTEN insertion sites ) in the FVIII protein via one or more optional linkers. In one embodiment, the two amino acid residues into which the XTEN sequence is inserted, or the amino acid residue to which the XTEN sequence binds, correspond to two or one amino acid residue from SEQ ID NO: 65 (full-length mature FVIII), selected from the group consisting of residues , presented in table. 7, table. 8, table. 9 and in table. 10, and any combinations thereof.

В других вариантах реализации изобретения по меньшей мере одна последовательность XTEN вставляется в любой один или более сайтов встраивания XTEN, описанный в данном документе, или любые их сочетания. В одном аспекте по меньшей мере одна последовательность XTEN встраивается в любой один или более сайтов встраивания XTEN, описанный в табл. 7.In other embodiments, at least one XTEN sequence is inserted into any one or more XTEN insertion sites described herein, or any combination thereof. In one aspect, at least one XTEN sequence is inserted into any one or more XTEN insertion sites described in table. 7.

- 64 044115- 64 044115

Таблица 7Table 7

Типовые сайты встраивания XTENTypical XTEN embed sites

No. Точка встраивания XTEN* Embedding point XTEN* Остаток встраивания Remaining embedding FVIII BDD нижележащая последовательност ь FVIII BDD underlying sequence b Домен FVIII Domain FVIII 1 1 0 0 (N-конец) (N-end) ATR ATR Al Al 2 2 3 3 R R RYY RYY Al Al 3 3 17 17 М M QSD QSD Al Al 4 4 18 18 Q Q SDL SDL Al Al 5 5 22 22 G G ELP ELP Al Al 6 6 24 24 L L PVD PVD Al Al 7 7 26 26 V V DAR DAR Al Al 8 8 28 28 А A RFP RFP Al Al 9 9 32 32 Р R RVP RVP Al Al 10 10 38 38 F F PFN PFN Al Al 11 eleven 40 40 F F NTS NTS Al Al 12 12 41 41 N N TSV TSV Al Al 13 13 60 60 N N IAK I.A.K. Al Al 14 14 61 61 I I АКР ACRE Al Al 15 15 65 65 R R PPW PPW Al Al 16 16 81 81 Y Y DTV DTV Al Al 17 17 111 111 G G AEY AEY Al Al 18 18 116 116 D D QTS QTS Al Al 19 19 119 119 S S QRE QRE Al Al 20 20 120 120 Q Q REK REK Al Al

- 65 044115- 65 044115

21 21 128 128 V V FPG FPG Al Al 22 22 129 129 F F PGG PGG Al Al 23 23 130 130 P P GGS G.G.S. Al Al 24 24 182 182 G G SLA SLA Al Al 25 25 185 185 A A KEK KEK Al Al 26 26 188 188 К TO TQT TQT Al Al 27 27 205 205 G G KSW KSW Al Al 28 28 210 210 S S ETK ETK Al Al 29 29 211 211 E E TKN TKN Al Al 30 thirty 216 216 L L MQD MQD Al Al 31 31 220 220 R R DAA DAA Al Al 32 32 222 222 A A ASA A.S.A. Al Al 33 33 223 223 A A SAR SAR Al Al 34 34 224 224 S S ARA ARA Al Al 35 35 230 230 К TO MHT MHT Al Al 36 36 243 243 P P GLI GLI Al Al 37 37 244 244 G G LIG LIG Al Al 38 38 250 250 R R KSV KSV Al Al 39 39 318 318 D D GME G.M.E. Al Al 40 40 333 333 P P QLR QLR Al Al 42 42 334 334 Q Q LRM LRM Al Al 43 43 336 336 R R MKN MKN al al 44 44 339 339 N N NEE NEE al al 45 45 345 345 D D YDD YDD al al 46 46 357 357 V V VRF VRF al al 47 47 367 367 s s FIQ FIQ al al 48 48 370 370 s s RPY RPY al al 49 49 375 375 A A KKH KKH A2 A2 50 50 376 376 К TO КНР China A2 A2 51 51 378 378 H H PKT PKT A2 A2

- 66 044115- 66 044115

52 52 399 399 V V LAP LAP A2 A2 53 53 403 403 D D DRS DRS A2 A2 54 54 405 405 R R SYK SYK A2 A2 55 55 409 409 S S QYL QYL A2 A2 56 56 416 416 P P QRI QRI A2 A2 57 57 434 434 E E TFK TFK A2 A2 58 58 438 438 T T REA REA A2 A2 59 59 441 441 A A IQH IQH A2 A2 60 60 442 442 I I QHE QHE A2 A2 61 61 463 463 I I IFK IFK A2 A2 62 62 487 487 Y Y SRR SRR A2 A2 63 63 490 490 R R LPK LPK A2 A2 64 64 492 492 P P KGV KGV A2 A2 65 65 493 493 К TO GVK GVK A2 A2 66 66 494 494 G G VKH VKH A2 A2 67 67 500 500 D D FPI FPI A2 A2 68 68 506 506 G G EIF EIF A2 A2 69 69 518 518 E E DGP DGP A2 A2 70 70 556 556 К TO ESV ESV A2 A2 71 71 565 565 Q Q IMS IMS A2 A2 72 72 566 566 I I MSD MSD A2 A2 73 73 598 598 P P AGV AGV A2 A2 74 74 599 599 A A GVQ G.V.Q. A2 A2 75 75 603 603 L L EDP EDP A2 A2 76 76 616 616 S S ING ING A2 A2 77 77 686 686 G G LWI L.W.I. A2 A2 78 78 713 713 К TO NTG NTG A2 A2 79 79 719 719 Y Y EDS EDS A2 A2 80 80 730 730 L L LSK LSK A2 A2 81 81 733 733 К TO NNA N.N.A. A2 A2

- 67 044115- 67 044115

82 82 745 745 Ν Ν PPV** PPV** В IN 83 83 1640 1640 Ρ Ρ PVL PVL В IN 84 84 1652 1652 R R TTL TTL В IN 85 85 1656 1656 Q Q SDQ SDQ АЗ AZ 86 86 1685 1685 Ν Ν QSP QSP АЗ AZ 87 87 1711 1711 Μ M SSS SSS АЗ AZ 88 88 1713 1713 S S SPH SPH АЗ AZ 89 89 1720 1720 Ν Ν RAQ R.A.Q. АЗ AZ 90 90 1724 1724 S S GSV GSV АЗ AZ 91 91 1725 1725 G G SVP SVP АЗ AZ 92 92 1726 1726 S S VPQ V.P.Q. АЗ AZ 93 93 1741 1741 G G SFT S.F.T. АЗ AZ 94 94 1744 1744 Τ Τ QPL QPL АЗ AZ 95 95 1749 1749 R R GEL GEL АЗ AZ 96 96 1773 1773 V V TFR TFR АЗ AZ 97 97 1792 1792 Υ Υ EED EED АЗ AZ 98 98 1793 1793 Ε Ε EDQ EDQ АЗ AZ 99 99 1796 1796 Q Q RQG RQG АЗ AZ 100 100 1798 1798 Q Q GAE G.A.E. АЗ AZ 101 101 1799 1799 G G ΑΕΡ ΑΕΡ АЗ AZ 102 102 1802 1802 Ρ Ρ RKN RKN АЗ AZ 103 103 1803 1803 R R KNF KNF АЗ AZ 104 104 1807 1807 V V ΚΡΝ ΚΡΝ АЗ AZ 105 105 1808 1808 к To ΡΝΕ ΡΝΕ АЗ AZ 106 106 1827 1827 к To DEF DEF АЗ AZ 107 107 1844 1844 Ε Ε KDV KDV АЗ AZ 108 108 1861 1861 Ν Ν TLN TLN АЗ AZ 109 109 1863 1863 L L ΝΡΑ ΝΡΑ АЗ AZ ПО BY 1896 1896 Ε Ε RNC R.N.C. АЗ AZ 111 111 1900 1900 R R APC APC АЗ AZ

- 68 044115- 68 044115

112 112 1904 1904 N N IQM IQM A3 A3 113 113 1905 1905 I I QME QME A3 A3 114 114 1910 1910 Р R TFK TFK A3 A3 115 115 1920 1920 А A ING ING A3 A3 116 116 1937 1937 D D QRI QRI A3 A3 117 117 1981 1981 G G VFE VFE A3 A3 118 118 2019 2019 N N KCQ KCQ A3 A3 119 119 2020 2020 К TO CQT C.Q.T. Cl Cl 120 120 2044 2044 G G QWA QWA Cl Cl 121 121 2068 2068 F F SWI SWI Cl Cl 122 122 2073 2073 V V DLL DLL Cl Cl 123 123 2090 2090 R R QKF QKF Cl Cl 124 124 2092 2092 К TO FSS FSS Cl Cl 125 125 2093 2093 F F SSL SSL Cl Cl 126 126 2111 2111 К TO WQT W.Q.T. Cl Cl 127 127 2115 2115 Y Y RGN RGN Cl Cl 128 128 2120 2120 Т T GTL GTL Cl Cl 129 129 2125 2125 V V FFG FFG Cl Cl 130 130 2171 2171 L L NSC N.S.C. Cl Cl 131 131 2173 2173 S S CSM CSM C2 C2 132 132 2188 2188 А A QIT QIT C2 C2 133 133 2223 2223 V V NNP NNP C2 C2 134 134 2224 2224 N N NPK NPK C2 C2 135 135 2227 2227 К TO EWL EWL C2 C2 136 136 2268 2268 G G HQW HQW C2 C2 137 137 2277 2277 N N GKV GKV C2 C2 138 138 2278 2278 G G KVK KVK C2 C2 139 139 2290 2290 F F TPV TPV C2 C2 140 140 2332 2332 Y Y С-конец FVIII C-terminus FVIII CT C.T.

^Указывает на точку вставки XTEN, основываясь на количестве аминокислот зрелого полноразмерного FVIII человека, в котором вставка может быть или на N- или на С-концевой стороне указанной аминокислоты^Indicates the XTEN insertion point based on the number of amino acids of mature full-length human FVIII, in which the insertion may be on either the N- or C-terminal side of the indicated amino acid

В некоторых вариантах реализации изобретения одна или более последовательность XTEN вставлены в пределах около шести аминокислот, вверх или вниз от аминокислот 32, 220, 224, 336, 339, 399, 416, 603, 1656, 1711, 1725, 1905 или 1910, что соответствует SEQ ID NO: 65 или любых их комбинаций.In some embodiments, one or more XTEN sequences are inserted within about six amino acids, upstream or downstream of amino acids 32, 220, 224, 336, 339, 399, 416, 603, 1656, 1711, 1725, 1905, or 1910, corresponding to SEQ ID NO: 65 or any combination thereof.

- 69 044115- 69 044115

Таблица 8Table 8

Типовые диапазоны встраивания XTENTypical XTEN installation ranges

No. Точка встраива ния XTEN XTEN installation point Остаток встраивания Remaining embedding FVIII BDD нижележащ ая последовате льность FVIII BDD underlying sequence Домен FVIII Domain FVIII Расстояние от остатка встраивания * Distance from rest of embedding * 9 9 32 32 Р R RVP RVP Al Al -3,+6 -3,+6 31 31 220 220 R R DAA DAA Al Al - - 34 34 224 224 S S ARA ARA Al Al +5 +5 43 43 336 336 R R MKN MKN al al -1,+6 -1,+6 44 44 339 339 N N ΝΕΕ ΝΕΕ al al -4, +5 -4, +5 52 52 399 399 V V LAP LAP A2 A2 -6, +3 -6, +3 56 56 416 416 Р R QRI QRI A2 A2 +6 +6 75 75 603 603 L L EDP EDP A2 A2 _6, +6 _6, +6 85 85 1656 1656 Q Q SDQ SDQ В IN -3,+6 -3,+6 87 87 1711 1711 м m sss sss A3 A3 -6,+1 -6,+1 91 91 1725 1725 G G SVP SVP A3 A3 +6 +6 113 113 1905 1905 I I QME QME A3 A3 +6 +6 114 114 1910 1910 Р R TFK TFK A3 A3 -5,+6 -5,+6

^Расстояние от остатка встраивания означает относительное количество аминокислот, отдаленных от N-конца (отрицательные числа) или С-конца (положительные числа) указанного остатка встраивания (остаток 0), в котором может происходить встраивание. Обозначение -x относится к сайту встраивания, который на х аминокислот отдален от N-концевой стороны указанного остатка встраивания. Аналогичным образом, обозначение +x относится к сайту встраивания, который на х аминокислот отдален от С-концевой стороны указанного остатка встраивания.^Distance from insertion residue means the relative number of amino acids distant from the N-terminus (negative numbers) or C-terminus (positive numbers) of the specified insertion residue (residue 0) at which insertion can occur. The designation -x refers to an insertion site that is x amino acids distant from the N-terminal side of the indicated insertion residue. Likewise, the designation +x refers to an insertion site that is x amino acids distant from the C-terminal side of the specified insertion residue.

Например, -1, +2 указывает на то, что вставка выполнена на N-конце или С-конце аминокислотных остатков, обозначенных -1, 0, +1 или +2.For example, -1, +2 indicates that the insertion is made at the N-terminus or C-terminus of amino acid residues designated -1, 0, +1 or +2.

В других вариантах реализации изобретения одна или более последовательность XTEN встраивается непосредственно ниже одной или более аминокислот, соответствующих полноразмерному зрелому FVIII человека, выбранных из группы, состоящей из одного или более сайтов встраивания в табл. 9.In other embodiments, one or more XTEN sequences are inserted immediately downstream of one or more amino acids corresponding to full-length mature human FVIII selected from the group consisting of one or more insertion sites in Table. 9.

Таблица 9Table 9

Типовые сайты встраивания или диапазоны XTENTypical embedding sites or XTEN ranges

No. Диапазон точки встраивания XTEN* Embedding point range XTEN* Остаток встраивания Remaining embedding Домен FVIII Domain FVIII 3 3 18-32 18-32 Q Q Al Al 8 8 40 40 F F Al Al 18 18 211-224 211-224 Е E Al Al 27 27 336-403 336-403 R R Al, A2 Al, A2 43 43 599 599 А A A2 A2 47 47 745-1640 745-1640 N N В IN 50 50 1656-1728 1656-1728 Q Q В, аЗ, АЗ B, aZ, AZ 57 57 1796-1804 1796-1804 R R АЗ AZ 65 65 1900-1912 1900-1912 R R АЗ AZ 81 81 2171-2332 2171-2332 L L С1,С2 C1, C2

*означает диапазон сайтов встраивания, пронумерованных согласно числу аминокислот зрелого FVIII человека*denotes the range of insertion sites numbered according to the number of amino acids of mature human FVIII

В еще одних вариантах реализации изобретения одна или более XTEN встраиваются в домены В FVIII. В одном примере, XTEN встраивается между аминокислот 740-1640, соответствующих SEQ ID NO: 65, в которой последовательность FVIII между аминокислотами 740-1640 в некоторых случаях отсутствует. В другом примере, XTEN встраивается между аминокислотами 741-1690, соответствующихIn yet other embodiments, one or more XTENs are inserted into the B domains of FVIII. In one example, XTEN is inserted between amino acids 740-1640 corresponding to SEQ ID NO: 65, in which the FVIII sequence between amino acids 740-1640 is in some cases absent. In another example, XTEN is inserted between amino acids 741-1690, corresponding to

- 70 044115- 70 044115

SEQ ID NO: 65, в которой последовательность FVIII между аминокислотами 740-1690 в некоторых случаях отсутствует. В других примерах, XTEN встраивается между аминокислотами 741-1648, соответствующих SEQ ID NO: 65, в которой последовательность FVIII между аминокислотами 741-1648 в некоторых случаях отсутствует. В еще одних примерах XTEN встраивается между аминокислот 743-1638, соответствующих SEQ ID NO: 65, в которой последовательность FVIII между аминокислотами 743-1638 в некоторых случаях отсутствует. В еще одних примерах, XTEN встраивается между аминокислотами 7451656, соответствующих SEQ ID NO: 65, в которой последовательность FVIII между аминокислотами 7451656 в некоторых случаях отсутствует. В некоторых примерах, XTEN встраивается между аминокислотами 745-1657, соответствующих SEQ ID NO: 65, в которой последовательность FVIII между аминокислотами 745-1657 в некоторых случаях отсутствует. В отдельных примерах, XTEN встраивается между аминокислотами 745-1667, соответствующих SEQ ID NO: 65, в которой последовательность FVIII между аминокислотами 745-1667 в некоторых случаях отсутствует. В еще одних примерах, XTEN встраивается между аминокислотами 745-1686, соответствующих SEQ ID NO: 65, в которой последовательность FVIII между аминокислотами 745-1686 в некоторых случаях отсутствует. В некоторых других примерах, XTEN встраивается между аминокислотами 747-1642, соответствующих SEQ ID NO: 65, в которой последовательность FVIII между аминокислотами 747-1642 в некоторых случаях отсутствует. В еще одних примерах, XTEN встраивается между аминокислотами 751-1667, соответствующих SEQ ID NO: 65, в которой последовательность FVIII между аминокислотами 751-1667 в некоторых случаях отсутствует.SEQ ID NO: 65, in which the FVIII sequence between amino acids 740-1690 is in some cases missing. In other examples, XTEN is inserted between amino acids 741-1648 corresponding to SEQ ID NO: 65, in which the FVIII sequence between amino acids 741-1648 is in some cases absent. In yet other examples, XTEN is inserted between amino acids 743-1638 corresponding to SEQ ID NO: 65, in which the FVIII sequence between amino acids 743-1638 is in some cases absent. In still other examples, XTEN is inserted between amino acids 7451656 corresponding to SEQ ID NO: 65, in which the FVIII sequence between amino acids 7451656 is in some cases absent. In some examples, XTEN is inserted between amino acids 745-1657 corresponding to SEQ ID NO: 65, in which the FVIII sequence between amino acids 745-1657 is in some cases absent. In certain examples, XTEN is inserted between amino acids 745-1667 corresponding to SEQ ID NO: 65, in which the FVIII sequence between amino acids 745-1667 is in some cases absent. In still other examples, XTEN is inserted between amino acids 745-1686 corresponding to SEQ ID NO: 65, in which the FVIII sequence between amino acids 745-1686 is in some cases absent. In some other examples, XTEN is inserted between amino acids 747-1642 corresponding to SEQ ID NO: 65, in which the FVIII sequence between amino acids 747-1642 is in some cases absent. In still other examples, XTEN is inserted between amino acids 751-1667 corresponding to SEQ ID NO: 65, in which the FVIII sequence between amino acids 751-1667 is in some cases absent.

В некоторых вариантах реализации изобретения одна или более XTEN встраивается в одну или более аминокислоту, расположенную непосредственно ниже аминокислоты сайта встраивания, из группы, состоящей из аминокислотных остатков в табл. 10.In some embodiments, one or more XTENs are inserted into one or more amino acids located immediately downstream of the amino acid of the insertion site from the group consisting of amino acid residues in table. 10.

Таблица 10Table 10

Сайты встраивания FVIII XTEN и обозначения конструкцииFVIII XTEN embedding sites and design notations

Номер конструкц ни Design number Домен Domain № вышележащ его остатка.* No. of the overlying residue.* № нижележащ его остатка. * No. the underlying remainder. * Вышележащая последователь ность Overlying sequence Нижележащая последователь ность Below sequence F8X-1 F8X-1 А1 A1 3 3 4 4 ATR ATR RYY RYY F8X-2 F8X-2 А1 A1 18 18 19 19 YMQ YMQ SDL SDL F8X-3 F8X-3 А1 A1 22 22 23 23 DLG DLG ELP ELP

- 71 044115- 71 044115

F8X-4 F8X-4 Al Al 26 26 27 27 LPV LPV DAR DAR F8X-5 F8X-5 Al Al 40 40 41 41 FPF FPF NTS NTS F8X-6 F8X-6 Al Al 60 60 61 61 LFN LFN IAK I.A.K. F8X-7 F8X-7 Al Al 116 116 117 117 YDD YDD QTS QTS F8X-8 F8X-8 Al Al 130 130 131 131 VFP VFP GGS G.G.S. F8X-9 F8X-9 Al Al 188 188 189 189 KEK KEK TQT TQT F8X-10 F8X-10 Al Al 216 216 217 217 NSL NSL MQD MQD F8X-11 F8X-11 Al Al 230 230 231 231 WPK W.P.K. MHT MHT F8X-12 F8X-12 Al Al 333 333 334 334 EEP EEP QLR QLR F8X-13 F8X-13 A2 A2 375 375 376 376 SVA SVA KKH KKH F8X-14 F8X-14 A2 A2 403 403 404 404 APD APD DRS DRS F8X-15 F8X-15 A2 A2 442 442 443 443 EAI EAI QHE QHE F8X-16 F8X-16 A2 A2 490 490 491 491 RRL RRL PKG PKG F8X-17 F8X-17 A2 A2 518 518 519 519 TVE TVE DGP DGP F8X-18 F8X-18 A2 A2 599 599 600 600 NPA NPA GVQ G.V.Q. F8X-19 F8X-19 A2 A2 713 713 714 714 CDK CDK NTG NTG F8X-20 F8X-20 BD BD 745 745 746 746 SQN SQN PPV PPV F8X-21 F8X-21 BD BD 745 745 746 746 SQN SQN PPV PPV F8X-22 F8X-22 BD** BD** 745 745 746 746 SQN SQN PPV PPV F8X-23 F8X-23 A3 A3 1720 1720 1721 1721 APT APT KDE KDE F8X-24 F8X-24 A3 A3 1796 1796 1797 1797 EDQ EDQ RQG RQG F8X-25 F8X-25 A3 A3 1802 1802 1803 1803 AEP AEP RKN RKN F8X-26 F8X-26 A3 A3 1827 1827 1828 1828 PTK PTK DEF DEF F8X-27 F8X-27 A3 A3 1861 1861 1862 1862 HTN HTN TLN TLN F8X-28 F8X-28 A3 A3 1896 1896 1897 1897 NME NME RNC R.N.C. F8X-29 F8X-29 A3 A3 1900 1900 1901 1901 NCR NCR APC APC F8X-3O F8X-3O A3 A3 1904 1904 1905 1905 PCN PCN IQM IQM F8X-31 F8X-31 A3 A3 1937 1937 1938 1938 AQD A.Q.D. QRI QRI F8X-32 F8X-32 Cl Cl 2019 2019 2020 2020 YSN YSN KCQ KCQ F8X-33 F8X-33 Cl Cl 2068 2068 2069 2069 EPF EPF SWI SWI F8X-34 F8X-34 Cl Cl 2111 2111 2112 2112 GKK GKK WQT W.Q.T. F8X-35 F8X-35 Cl Cl 2120 2120 2121 2121 NST NST GTL GTL F8X-36 F8X-36 C2 C2 2171 2171 2172 2172 CDL C.D.L. NSC N.S.C. F8X-37 F8X-37 C2 C2 2188 2188 2189 2189 SDA S.D.A. QIT QIT

- 72 044115- 72 044115

F8X-38 F8X-38 C2 C2 2227 2227 2228 2228 NPK NPK EWL EWL F8X-39 F8X-39 C2 C2 2277 2277 2278 2278 FQN FQN GKV GKV F8X-40 F8X-40 CT C.T. 2332 2332 NA N.A. DLY DLY NA N.A. F8X-41 F8X-41 CT C.T. 2332 2332 NA N.A. DLY DLY NA N.A. F8X-42 F8X-42 Al Al 3 3 4 4 ATR ATR ATR ATR pSDOOOl pSDOOOl A2 A2 403 403 404 404 pSD0002 pSD0002 A2 A2 599 599 600 600 pSD0021 pSD0021 N-конец N-terminus 0 0 1 1 pSD0022 pSD0022 Al Al 32 32 33 33 pSD0023 pSD0023 Al Al 65 65 66 66 pSD0024 pSD0024 Al Al 81 81 82 82 pSD0025 pSD0025 Al Al 119 119 120 120 pSD0026 pSD0026 Al Al 211 211 212 212 pSD0027 pSD0027 Al Al 220 220 221 221 pSD0028 pSD0028 Al Al 224 224 225 225 pSD0029 pSD0029 Al Al 336 336 337 337 pSD0030 pSD0030 Al Al 339 339 340 340 pSD0031 pSD0031 A2 A2 378 378 379 379 pSD0032 pSD0032 A2 A2 399 399 400 400 pSD0033 pSD0033 A2 A2 409 409 410 410 pSD0034 pSD0034 A2 A2 416 416 417 417 pSD0035 pSD0035 A2 A2 487 487 488 488 pSD0036 pSD0036 A2 A2 494 494 495 495 pSD0037 pSD0037 A2 A2 500 500 501 501 pSD0038 pSD0038 A2 A2 603 603 604 604 pSD0039 pSD0039 A3 A3 1656 1656 1657 1657 pSD0040 pSD0040 A3 A3 1711 1711 1712 1712 pSD0041 pSD0041 A3 A3 1725 1725 1726 1726 pSD0042 pSD0042 A3 A3 1749 1749 1750 1750 pSD0043 pSD0043 A3 A3 1905 1905 1906 1906 pSD0044 pSD0044 A3 A3 1910 1910 1911 1911 pDS0062 pDS0062 A3 A3 1900 1900 1901 1901

*Означает количество аминокислот зрелого белка FVIII*Indicates the number of amino acids of the mature FVIII protein

В одном варианте реализации изобретения один или более сайтов встраивания XTEN расположены в пределах одной или более соприкасаемой с поверхностью, гибкой петлевой структурой белка FVIII (например, доступная для встраивания петля). Например, по меньшей мере одна последовательность XTEN может быть встроена в каждый домен A FVIII, содержащий по меньшей мере две доступные для встраивания петли, в которые по меньшей мере один полипептид XTEN может быть встроен без устранения прокоагулирующей активности рекомбинантного белка, или способность рекомбинантных белков должна проявляться in vivo или in vitro в клетке хозяина. Доступные для встраивания петли являются областями, позволяющими встраивание по меньшей мере одной последовательности XTEN, характеризующиеся, среди прочих свойств, высокой доступностью поверхности или доступностью для растворителей и конформационной гибкостью. Домен А1 содержит доступную для встраивания петлю-1 (А1-1) область и доступную для встраивания петлю-2 (А1-2) область, домен А2 содержит доступную для встраивания петлю-1 (А2-1) область и доступную для встраивания петлю-2 (А2-2) область, домен A3 содержит доступную для встраивания петлю-1 (А3-1) область и доступную для встраивания петлю-2 (A3-2) область.In one embodiment, one or more XTEN insertion sites are located within one or more surface-exposed, flexible loop structures of the FVIII protein (eg, an insertion-accessible loop). For example, at least one XTEN sequence may be inserted into each FVIII domain A containing at least two insertable loops into which at least one XTEN polypeptide may be inserted without eliminating the procoagulant activity of the recombinant protein, or the ability of the recombinant proteins to manifest in vivo or in vitro in a host cell. Insertion-accessible loops are regions that allow the insertion of at least one XTEN sequence, characterized by, among other properties, high surface or solvent accessibility and conformational flexibility. Domain A1 contains a region accessible for embedding loop-1 (A1-1) and a region accessible for embedding loop-2 (A1-2); domain A2 contains a region accessible for embedding loop-1 (A2-1) and a region accessible for embedding loop-1 (A2-1). 2 (A2-2) region, domain A3 contains a loop-1 (A3-1) embeddable region and a loop-2 (A3-2) embeddable region.

В одном аспекте первая доступная для встраивания петля в домене A1 FVIII (A1-1) располагаетсяIn one aspect, the first insertion-accessible loop in the FVIII A1 domain (A1-1) is located

- 73 044115 между бета-тяжем 1 и бета-тяжем 2, и вторая доступная для встраивания петля в домене А2 FVIII (A1-2) располагается между бета-тяжем 11 и бета-тяжем 12. Первая доступная для встраивания петля в домене А2 FVIII (A2-1) располагается между бета-тяжем 22 и бета-тяжем 23, и вторая доступная для встраивания петля в домене А2 FVIII (A2-2) располагается между бета-тяжем 32 и бета-тяжем 33. Первая доступная для встраивания петля в домене A3 FVIII (А3-1) располагается между бета-тяжем 38 и бета-тяжем 39, и вторая доступная для встраивания петля в домене A3 FVIII (A3-2) располагается между бета-тяжем 45 и бета-тяжем 46. В некоторых аспектах гибкая с подвижной поверхностью структура, содержащая А1-1 соответствует области в нативном зрелом FVIII человека от около аминокислоты 15 до около аминокислоты 45 в SEQ ID NO: 65, например, от около аминокислоты 18 до около аминокислоты 41 в SEQ ID NO: 65. В других аспектах гибкая структура, содержащая А1-2, соответствует области в нативном зрелом FVIII человека от около аминокислоты 201 до около аминокислоты 232 в SEQ ID NO: 65, например, от около аминокислоты 218 до около аминокислоты 229 в SEQ ID NO: 65. В еще одних аспектах гибкая с подвижной поверхностью структура, содержащая А2-1, соответствует области в нативном зрелом FVIII человека от около аминокислоты 395 до около аминокислоты 421 в SEQ ID NO: 65, например, от около аминокислоты 397 до около аминокислоты 418 в SEQ ID NO: 65. В еще одних вариантах реализации изобретения гибкая с подвижной поверхностью структура, содержащая А2-2, соответствует области в нативном зрелом FVIII человека от около аминокислоты 577 до около аминокислоты 635 в SEQ ID NO: 65, например, от около аминокислоты 595 до около аминокислоты 607 в SEQ ID NO: 65. В некоторых аспектах гибкая с подвижной поверхностью структура, содержащая А3-1, соответствует области в нативном зрелом FVIII человека от около аминокислоты 1705 до около аминокислоты 1732 в SEQ ID NO: 65, например, от около аминокислоты 1711 до около аминокислоты 1725 в SEQ ID NO: 65. В еще одних аспектах гибкая с подвижной поверхностью структура, содержащая A3-2, соответствует области в нативном зрелом FVIII человека от около аминокислоты 1884 до около аминокислоты 1917 в SEQ ID NO: 65, например, от около аминокислоты 1899 до около аминокислоты 1911 в SEQ ID NO: 65.- 73 044115 between beta strand 1 and beta strand 2, and the second insertable loop in the FVIII A2 domain (A1-2) is located between beta strand 11 and beta strand 12. The first insertable loop in the A2 FVIII domain (A2-1) is located between beta strand 22 and beta strand 23, and the second insertable loop in the A2 domain of FVIII (A2-2) is located between beta strand 32 and beta strand 33. The first insertable loop in the FVIII A3 domain (A3-1) is located between beta strand 38 and beta strand 39, and the second insertable loop in the FVIII A3 domain (A3-2) is located between beta strand 45 and beta strand 46. In some aspects a flexible, movable surface structure containing A1-1 corresponds to the region in native mature human FVIII from about amino acid 15 to about amino acid 45 in SEQ ID NO: 65, for example, from about amino acid 18 to about amino acid 41 in SEQ ID NO: 65. In other aspects, the flexible structure containing A1-2 corresponds to the region in native mature human FVIII from about amino acid 201 to about amino acid 232 in SEQ ID NO: 65, for example, from about amino acid 218 to about amino acid 229 in SEQ ID NO: 65. In yet other aspects, the flexible, movable surface structure containing A2-1 corresponds to the region in native mature human FVIII from about amino acid 395 to about amino acid 421 in SEQ ID NO: 65, for example, from about amino acid 397 to about amino acid 418 in SEQ ID NO: : 65. In yet other embodiments, the flexible, movable surface structure containing A2-2 corresponds to the region in native mature human FVIII from about amino acid 577 to about amino acid 635 in SEQ ID NO: 65, for example, from about amino acid 595 to about amino acid 607 in SEQ ID NO: 65. In some aspects, the flexible surface-movable structure containing A3-1 corresponds to the region in native mature human FVIII from about amino acid 1705 to about amino acid 1732 in SEQ ID NO: 65, for example, from about amino acid 1711 to about amino acid 1725 in SEQ ID NO: 65. In yet other aspects, the flexible surface-movable structure containing A3-2 corresponds to the region in native mature human FVIII from about amino acid 1884 to about amino acid 1917 in SEQ ID NO: 65, for example , from about amino acid 1899 to about amino acid 1911 in SEQ ID NO: 65.

В другом варианте реализации изобретения одна или более аминокислота, в которую встроена по меньшей мере одна последовательность XTEN, расположена в пределах домена а3, например, аминокислоты 1649-1689 соответствующие полноразмерному зрелому полипептиду FVIII. В некоторых примерах, XTEN встраивается между аминокислотами 1656-1657, соответствующих SEQ ID NO: 65 (полноразмерный зрелый FVIII). В конкретном варианте реализации изобретения белок FVIII, содержащий последовательность XTEN, встроен непосредственно ниже аминокислоты 1656, соответствующей SEQ ID NO: 65 дополнительно содержит делецию от аминокислоты 745 до аминокислоты 1656, соответствующую SEQ ID NO: 65.In another embodiment, one or more amino acids into which at least one XTEN sequence is inserted is located within the a3 domain, for example, amino acids 1649-1689 corresponding to the full-length mature FVIII polypeptide. In some examples, XTEN is inserted between amino acids 1656-1657 corresponding to SEQ ID NO: 65 (full-length mature FVIII). In a specific embodiment, the FVIII protein containing the XTEN sequence is inserted immediately downstream of amino acid 1656 corresponding to SEQ ID NO: 65 and further comprises a deletion from amino acid 745 to amino acid 1656 corresponding to SEQ ID NO: 65.

В некоторых вариантах реализации изобретения один или более сайты встраивания для одного или более встраивания XTEN расположены непосредственно ниже одной или более аминокислот, соответствующих полноразмерному зрелому FVIII человека, выбранных из группы, состоящей из: (1) аминокислота 3, (2) аминокислота 18, (3) аминокислота 22, (4) аминокислота 26, (5) аминокислота 32, (6) аминокислота 40, (7) аминокислота 60, (8) аминокислота 65, (9) аминокислота 81, (10) аминокислота 116, (11) аминокислота 119, (12) аминокислота 130, (13) аминокислота 188, (14) аминокислота 211, (15) аминокислота 216, (16) аминокислота 220, (17) аминокислота 224, (18) аминокислота 230, (19) аминокислота 333, (20) аминокислота 336, (21) аминокислота 339, (22) аминокислота 375, (23) аминокислота 399, (24) аминокислота 403, (25) аминокислота 409, (26) аминокислота 416, (26) аминокислота 442, (28) аминокислота 487, (29) аминокислота 490, (30) аминокислота 494, (31) аминокислота 500, (32) аминокислота 518, (33) аминокислота 599, (34) аминокислота 603, (35) аминокислота 713, (36) аминокислота 745, (37) аминокислота 1656, (38) аминокислота 1711, (39) аминокислота 1720, (40) аминокислота 1725, (41) аминокислота 1749, (42) аминокислота 1796, (43) аминокислота 1802, (44) аминокислота 1827, (45) аминокислота 1861, (46) аминокислота 1896, (47) аминокислота 1900, (48) аминокислота 1904, (49) аминокислота 1905, (50) аминокислота 1910, (51) аминокислота 1937, (52) аминокислота 2019, (53) аминокислота 2068, (54) аминокислота 2111, (55) аминокислота 2120, (56) аминокислота 2171, (57) аминокислота 2188, (58) аминокислота 2227, (59) аминокислота 2277, и (60) два или более их сочетания.In some embodiments, one or more insertion sites for one or more XTEN insertions are located immediately downstream of one or more amino acids corresponding to full-length mature human FVIII selected from the group consisting of: (1) amino acid 3, (2) amino acid 18, ( 3) amino acid 22, (4) amino acid 26, (5) amino acid 32, (6) amino acid 40, (7) amino acid 60, (8) amino acid 65, (9) amino acid 81, (10) amino acid 116, (11) amino acid 119, (12) amino acid 130, (13) amino acid 188, (14) amino acid 211, (15) amino acid 216, (16) amino acid 220, (17) amino acid 224, (18) amino acid 230, (19) amino acid 333 , (20) amino acid 336, (21) amino acid 339, (22) amino acid 375, (23) amino acid 399, (24) amino acid 403, (25) amino acid 409, (26) amino acid 416, (26) amino acid 442, ( 28) amino acid 487, (29) amino acid 490, (30) amino acid 494, (31) amino acid 500, (32) amino acid 518, (33) amino acid 599, (34) amino acid 603, (35) amino acid 713, (36) amino acid 745, (37) amino acid 1656, (38) amino acid 1711, (39) amino acid 1720, (40) amino acid 1725, (41) amino acid 1749, (42) amino acid 1796, (43) amino acid 1802, (44) amino acid 1827 , (45) amino acid 1861, (46) amino acid 1896, (47) amino acid 1900, (48) amino acid 1904, (49) amino acid 1905, (50) amino acid 1910, (51) amino acid 1937, (52) amino acid 2019, ( 53) amino acid 2068, (54) amino acid 2111, (55) amino acid 2120, (56) amino acid 2171, (57) amino acid 2188, (58) amino acid 2227, (59) amino acid 2277, and (60) two or more combinations thereof .

В одном варианте реализации изобретения белок FVIII, пригодный для использования в настоящем изобретении, содержит две последовательности XTEN, первая последовательность XTEN встроена в первый сайт встраивания XTEN, и вторая XTEN встроена во второй сайт встраивания XTEN. He ограничивающие примеры первого сайта встраивания XTEN и второго сайта встраивания XTEN перечислены в табл. 11.In one embodiment, a FVIII protein useful in the present invention contains two XTEN sequences, a first XTEN sequence inserted into a first XTEN insertion site, and a second XTEN inserted into a second XTEN insertion site. Non-limiting examples of the first XTEN insertion site and the second XTEN insertion site are listed in Table. eleven.

- 74 044115- 74 044115

Таблица 11Table 11

Типовые сайты встраивания для двух XTENTypical embedding sites for two XTENs

Встраив Сайт встраивания 745 26 40 Embedding Embedding site 745 26 40 ание 1 Домен В А1 А1 1 Domain IN A1 A1 Встраи Сайт встраивания 2332 403 403 Embedding Embedding site 2332 403 403 вание 2 Домен СТ А2 А2 2 Domain ST A2 A2 18 18 А1 A1 403 403 А2 A2 26 26 А1 A1 599 599 А2 A2 40 40 А1 A1 599 599 А2 A2 18 18 А1 A1 599 599 А2 A2 1720 1720 АЗ AZ 1900 1900 АЗ AZ 1725 1725 АЗ AZ 1900 1900 АЗ AZ 1711 1711 АЗ AZ 1905 1905 АЗ AZ 1720 1720 АЗ AZ 1905 1905 АЗ AZ 1725 1725 АЗ AZ 1905 1905 АЗ AZ 1656 1656 АЗ AZ 26 26 А1 A1 1656 1656 АЗ AZ 18 18 А1 A1 1656 1656 АЗ AZ 40 40 А1 A1 1656 1656 АЗ AZ 399 399 А2 A2 1656 1656 АЗ AZ 403 403 А2 A2 1656 1656 АЗ AZ 1725 1725 АЗ AZ 1656 1656 АЗ AZ 1720 1720 АЗ AZ 1900 1900 АЗ AZ 18 18 А1 A1 1900 1900 АЗ AZ 26 26 А1 A1 1900 1900 АЗ AZ 40 40 А1 A1 1905 1905 АЗ AZ 18 18 А1 A1 1905 1905 АЗ AZ 40 40 А1 A1 1905 1905 АЗ AZ 26 26 А1 A1 1910 1910 АЗ AZ 26 26 А1 A1 18 18 А1 A1 399 399 А2 A2 26 26 А1 A1 399 399 А2 A2 40 40 А1 A1 399 399 А2 A2 18 18 А1 A1 403 403 А2 A2 1656 1656 АЗ AZ 1900 1900 АЗ AZ 1656 1656 АЗ AZ 1905 1905 АЗ AZ 1711 1711 АЗ AZ 40 40 А1 A1 1711 1711 АЗ AZ 26 26 А1 A1 1720 1720 АЗ AZ 26 26 А1 A1

- 75 044115- 75 044115

1720 1720 АЗ AZ 40 40 А1 A1 1720 1720 АЗ AZ 18 18 А1 A1 1725 1725 АЗ AZ 26 26 А1 A1 1725 1725 АЗ AZ 40 40 А1 A1 1725 1725 АЗ AZ 18 18 А1 A1 1720 1720 АЗ AZ 403 403 А2 A2 1720 1720 АЗ AZ 399 399 А2 A2 1711 1711 АЗ AZ 403 403 А2 A2 1720 1720 АЗ AZ 403 403 А2 A2 1725 1725 АЗ AZ 403 403 А2 A2 1725 1725 АЗ AZ 399 399 А2 A2 1711 1711 АЗ AZ 403 403 А2 A2 1900 1900 АЗ AZ 399 399 А2 A2 1900 1900 АЗ AZ 403 403 А2 A2 1905 1905 АЗ AZ 403 403 А2 A2 1905 1905 АЗ AZ 399 399 А2 A2 1910 1910 АЗ AZ 403 403 А2 A2

Две XTEN, встроенные или связанные с белком FVIII, могут быть одинаковыми или различными. В некоторых вариантах реализации изобретения белок FVIII, пригодный для использования в настоящем изобретении, содержит две последовательности XTEN, встроенные в белок FVIII, первую последовательность XTEN встроенную непосредственно ниже аминокислоты 745, соответствующие SEQ ID NO: 65, и вторую последовательность XTEN, встроенную непосредственно ниже аминокислоты 2332, соответствующей SEQ ID NO: 65 (С-конец). В другом варианте реализации изобретения первая последовательность XTEN встроена непосредственно ниже аминокислоты 18, 26, 40, 1656 или 1720, соответствующей SEQ ID NO: 65, и вторая последовательность XTEN встроена непосредственно ниже аминокислоты 403, соответствующей SEQ ID NO: 65. В еще одних вариантах реализации изобретения первая последовательность XTEN встроена непосредственно ниже аминокислоты 18, 26 или 40, соответствующей SEQ ID NO: 65, и вторая последовательность XTEN встроена непосредственно ниже аминокислоты 599, соответствующей SEQ ID NO: 65. В еще одних вариантах реализации изобретения первая последовательность XTEN встроена непосредственно ниже аминокислоты 1656, соответствующей SEQ ID NO: 65, и вторая последовательность XTEN встроена непосредственно ниже аминокислоты 18, 26, 40, 399, 403, 1725, 1720, 1900, 1905 или 2332, соответствующей SEQ ID NO: 65. В определенных вариантах реализации изобретения первая последовательность XTEN встроена непосредственно ниже аминокислоты 1900, соответствующей SEQ ID NO: 65, и вторая последовательность XTEN встроена непосредственно ниже аминокислоты 18, 26 или 40, соответствующей SEQ ID NO: 65. В некоторых вариантах реализации изобретения первая последовательность XTEN встроена непосредственно ниже аминокислоты 18, 26 или 40, соответствующей SEQ ID NO: 65, и вторая последовательность XTEN встроена непосредственно ниже аминокислоты 399, соответствующей SEQ ID NO: 65. В других вариантах реализации изобретения первая последовательность XTEN встроена непосредственно ниже аминокислоты 1720, соответствующей SEQ ID NO: 65, и вторая последовательность XTEN встроена непосредственно ниже аминокислоты 18, 26 или 40, соответствующей SEQ ID NO: 65. В еще одних вариантах реализации изобретения первая последовательность XTEN встроена непосредственно ниже аминокислоты 1720, соответствующей SEQ ID NO: 65, и вторая последовательность XTEN встроена непосредственно ниже аминокислоты 18, соответствующей SEQ ID NO: 65. В конкретном варианте реализации изобретения белок FVIII, содержащий последовательность XTEN, первая последовательность XTEN встроена непосредственно ниже аминокислоты 745, соответствующей SEQ ID NO: 65, и вторая последовательность XTEN встроена непосредственно ниже аминокислоты 2332, соответствующей SEQ ID NO: 65, в которой белок FVIII дополнительно содержит делецию от аминокислоты 745, соответствующую SEQ ID NO: 65 до аминокислоты 1685, соответствующей SEQ ID NO: 65, мутация или замена аминокислоты 1680, соответствующей SEQ ID NO: 65, например, Y1680F мутация или замена аминокислоты 1648, соответствующей SEQ ID NO: 65, например, R1648A или по меньшей мере две мутации или замены аминокислоты 1648, соответствующей SEQ ID NO: 65, например, R1648A, и аминокислота 1680, соответствующая SEQ ID NO: 65, например, Y1680F. В конкретном варианте реализации изобретения белок FVIII содержит две последовательности XTEN, первая последовательность XTEN встроена непосредственно ниже аминокислоты 1656, соответствующей SEQ ID NO: 65, и вторая последовательность XTEN встроена непосредственно ниже аминокислоты 2332, соответствующей SEQ ID NO: 65, в которой белок FVIII дополнительно содержит делецию от аминокислоты 745 до аминокислоты 1656, соответствующую SEQ ID NO: 65.The two XTENs embedded in or associated with the FVIII protein may be the same or different. In some embodiments, a FVIII protein useful in the present invention contains two XTEN sequences inserted into the FVIII protein, a first XTEN sequence inserted immediately downstream of amino acid 745 corresponding to SEQ ID NO: 65, and a second XTEN sequence inserted immediately downstream of the amino acid 2332 corresponding to SEQ ID NO: 65 (C-terminus). In another embodiment, the first XTEN sequence is inserted immediately below amino acid 18, 26, 40, 1656, or 1720 corresponding to SEQ ID NO: 65, and the second XTEN sequence is inserted immediately below amino acid 403 corresponding to SEQ ID NO: 65. In yet other embodiments implementation of the invention, the first XTEN sequence is inserted immediately below amino acid 18, 26 or 40 corresponding to SEQ ID NO: 65, and the second XTEN sequence is inserted immediately below amino acid 599 corresponding to SEQ ID NO: 65. In yet other embodiments of the invention, the first XTEN sequence is inserted directly below amino acid 1656 corresponding to SEQ ID NO: 65, and a second XTEN sequence is inserted immediately below amino acid 18, 26, 40, 399, 403, 1725, 1720, 1900, 1905, or 2332 corresponding to SEQ ID NO: 65. In certain embodiments of the invention, a first XTEN sequence is inserted immediately below amino acid 1900 corresponding to SEQ ID NO: 65, and a second XTEN sequence is inserted immediately below amino acid 18, 26, or 40 corresponding to SEQ ID NO: 65. In some embodiments of the invention, the first XTEN sequence is inserted immediately below the amino acid 18, 26, or 40, corresponding to SEQ ID NO: 65, and the second XTEN sequence is inserted immediately below amino acid 399, corresponding to SEQ ID NO: 65. In other embodiments, the first XTEN sequence is inserted immediately below amino acid 1720, corresponding to SEQ ID NO: 65 and the second XTEN sequence is inserted immediately below amino acid 18, 26, or 40 corresponding to SEQ ID NO: 65. In yet other embodiments of the invention, the first XTEN sequence is inserted immediately below amino acid 1720 corresponding to SEQ ID NO: 65, and the second XTEN sequence is inserted directly below amino acid 18, corresponding to SEQ ID NO: 65. In a particular embodiment of the invention, the FVIII protein containing the XTEN sequence, the first XTEN sequence is inserted immediately below amino acid 745, corresponding to SEQ ID NO: 65, and the second XTEN sequence is inserted immediately below amino acid 2332, corresponding to SEQ ID NO: 65. SEQ ID NO: 65, wherein the FVIII protein further comprises a deletion from amino acid 745 corresponding to SEQ ID NO: 65 to amino acid 1685 corresponding to SEQ ID NO: 65, a mutation or substitution of amino acid 1680 corresponding to SEQ ID NO: 65, for example, Y1680F a mutation or substitution of amino acid 1648 corresponding to SEQ ID NO: 65, for example, R1648A, or at least two mutations or substitutions of amino acid 1648 corresponding to SEQ ID NO: 65, for example, R1648A, and amino acid 1680 corresponding to SEQ ID NO: 65, for example , Y1680F. In a particular embodiment of the invention, the FVIII protein contains two XTEN sequences, a first XTEN sequence inserted immediately below amino acid 1656 corresponding to SEQ ID NO: 65, and a second XTEN sequence inserted immediately below amino acid 2332 corresponding to SEQ ID NO: 65, in which the FVIII protein is additionally contains a deletion from amino acid 745 to amino acid 1656 corresponding to SEQ ID NO: 65.

-76044115-76044115

В определенных вариантах реализации изобретения белок FVIII содержит три последовательности XTEN, первая последовательность XTEN встроена в первый сайт встраивания XTEN, вторая последовательность XTEN встроена во второй сайт встраивания XTEN, и третья последовательность XTEN встроена в третий сайт встраивания XTEN. Первая, вторая или третья последовательности XTEN могут быть одинаковыми или различными. Первый, второй и третий сайты встраивания могут быть выбраны из группы, включающей любой из сайтов встраивания, раскрытых в данном документе. В некоторых вариантах реализации изобретения белок FVIII, содержащий три последовательности XTEN, может дополнительно нести мутацию или замену, например, аминокислоту 1648, соответствующую SEQ ID NO: 65, например, R1648A. Например, не ограничивающие примеры первого, второго и третьего сайтов встраивания XTEN перечислены в табл. 12.In certain embodiments, the FVIII protein contains three XTEN sequences, a first XTEN sequence is inserted into a first XTEN insertion site, a second XTEN sequence is inserted into a second XTEN insertion site, and a third XTEN sequence is inserted into a third XTEN insertion site. The first, second or third XTEN sequences may be the same or different. The first, second, and third embedding sites may be selected from the group including any of the embedding sites disclosed herein. In some embodiments, the FVIII protein containing three XTEN sequences may additionally carry a mutation or substitution, for example, amino acid 1648 corresponding to SEQ ID NO: 65, for example, R1648A. For example, non-limiting examples of first, second and third XTEN embedding sites are listed in Table. 12.

Таблица 12Table 12

Типовые сайты встраивания для трех XTENTypical embedding sites for three XTENs

Встраивание 1 Embedding 1 Встраивание 2 Embedding 2 Встраивание 3 Embedding 3 Сайт встраивани я Embed site Домен Domain Сайт встраивани я Embed site Домен Domain Сайт встраивания Embed site Домен Domain 26 26 А1 A1 403 403 А2 A2 1656 1656 АЗ AZ 26 26 А1 A1 403 403 А2 A2 1720 1720 АЗ AZ 26 26 А1 A1 403 403 А2 A2 1900 1900 АЗ AZ 26 26 А1 A1 1656 1656 АЗ AZ 1720 1720 АЗ AZ 26 26 А1 A1 1656 1656 АЗ AZ 1900 1900 АЗ AZ 26 26 А1 A1 1720 1720 АЗ AZ 1900 1900 АЗ AZ 403 403 А2 A2 1656 1656 АЗ AZ 1720 1720 АЗ AZ 403 403 А2 A2 1656 1656 АЗ AZ 1900 1900 АЗ AZ 403 403 А2 A2 1720 1720 АЗ AZ 1900 1900 АЗ AZ 1656 1656 АЗ AZ 1720 1720 АЗ AZ 1900 1900 АЗ AZ 745 745 В IN 1900 1900 2332 2332 18 18 А1 A1 745 745 В IN 2332 2332 СТ ST 26 26 А1 A1 745 745 В IN 2332 2332 ст st 40 40 А1 A1 745 745 в V 2332 2332 ст st 18 18 А1 A1 745 745 в V 2332 2332 ст st 40 40 А1 A1 745 745 в V 2332 2332 ст st 403 403 А2 A2 745 745 в V 2332 2332 ст st 399 399 А2 A2 745 745 в V 2332 2332 ст st 1725 1725 АЗ AZ 745 745 в V 2332 2332 ст st 1720 1720 АЗ AZ 745 745 в V 2332 2332 ст st 1711 1711 АЗ AZ 745 745 в V 2332 2332 ст st 1900 1900 АЗ AZ 745 745 в V 2332 2332 ст st 1905 1905 АЗ AZ 745 745 в V 2332 2332 ст st 1910 1910 АЗ AZ 745 745 в V 2332 2332 ст st

В некоторых вариантах реализации изобретения белок FVIII содержит три последовательности XTEN, первая последовательность XTEN встроена непосредственно ниже аминокислоты 26, соответствующей SEQ ID NO: 65, вторая последовательность XTEN встроена непосредственно ниже аминокислоты 403, соответствующей SEQ ID NO: 65, и третья последовательность XTEN встроена непосредственно ниже аминокислоты 1656, 1720 или 1900, соответствующей SEQ ID NO: 65. В других вариантах реализации изобретения первая последовательность XTEN встроена непосредственно ниже аминокислоты 26, соответствующей SEQ ID NO: 65, вторая последовательность XTEN встроена непосредственно ниже аминокислоты 1656, соответствующей SEQ ID NO: 65, и третья последовательность XTEN встроена непосредственно ниже аминокислоты 1720 или 1900, соответствующей SEQ ID NO: 65. В еще одних вариIn some embodiments, the FVIII protein contains three XTEN sequences, the first XTEN sequence is inserted immediately below amino acid 26 corresponding to SEQ ID NO: 65, the second XTEN sequence is inserted immediately below amino acid 403 corresponding to SEQ ID NO: 65, and the third XTEN sequence is inserted directly below amino acid 1656, 1720, or 1900 corresponding to SEQ ID NO: 65. In other embodiments, the first XTEN sequence is inserted immediately below amino acid 26 corresponding to SEQ ID NO: 65, the second XTEN sequence is inserted immediately below amino acid 1656 corresponding to SEQ ID NO: 65, and a third XTEN sequence is inserted immediately downstream of amino acid 1720 or 1900 corresponding to SEQ ID NO: 65. In still other variants

- 77 044115 антах реализации изобретения первая последовательность XTEN встроена непосредственно ниже аминокислоты 26, соответствующей SEQ ID NO: 65, вторая последовательность XTEN встроена непосредственно ниже аминокислоты 1720, соответствующей SEQ ID NO: 65, и третья последовательность XTEN встроена непосредственно ниже аминокислоты 1900, соответствующей SEQ ID NO: 65. В еще одних вариантах реализации изобретения первая последовательность XTEN встроена непосредственно ниже аминокислоты 403, соответствующей SEQ ID NO: 65, вторая последовательность XTEN встроена непосредственно ниже аминокислоты 1656, соответствующей SEQ ID NO: 65, и третья последовательность XTEN встроена непосредственно ниже аминокислоты 1720 или 1900, соответствующей SEQ ID NO: 65. В других вариантах реализации изобретения первая последовательность XTEN встроена непосредственно ниже аминокислоты 403 или 1656, соответствующей SEQ ID NO: 65, вторая последовательность XTEN встроена непосредственно ниже аминокислоты 1720, соответствующей SEQ ID NO: 65, и третья последовательность XTEN встроена непосредственно ниже аминокислоты 1900, соответствующей SEQ ID NO: 65. В других вариантах реализации изобретения первая последовательность XTEN встроена непосредственно ниже аминокислоты 18, 26, 40, 399, 403, 1711, 1720, 1725, 1900, 1905 или 1910, соответствующей SEQ ID NO: 65, вторая последовательность XTEN встроена непосредственно ниже аминокислоты 745, соответствующей SEQ ID NO: 65, и третья последовательность XTEN встроена непосредственно ниже аминокислоты 2332, соответствующей SEQ ID NO: 65.- 77 044115 an embodiment of the invention, a first XTEN sequence is inserted immediately below amino acid 26 corresponding to SEQ ID NO: 65, a second XTEN sequence is inserted immediately below amino acid 1720 corresponding to SEQ ID NO: 65, and a third XTEN sequence is inserted immediately below amino acid 1900 corresponding to SEQ ID NO: 65. In yet other embodiments, a first XTEN sequence is inserted immediately below amino acid 403 corresponding to SEQ ID NO: 65, a second XTEN sequence is inserted immediately below amino acid 1656 corresponding to SEQ ID NO: 65, and a third XTEN sequence is inserted immediately below amino acid 1720 or 1900, corresponding to SEQ ID NO: 65. In other embodiments, the first XTEN sequence is inserted immediately below amino acid 403 or 1656, corresponding to SEQ ID NO: 65, the second XTEN sequence is inserted immediately below amino acid 1720, corresponding to SEQ ID NO: 65 and the third XTEN sequence is inserted immediately below amino acid 1900 corresponding to SEQ ID NO: 65. In other embodiments, the first XTEN sequence is inserted immediately below amino acid 18, 26, 40, 399, 403, 1711, 1720, 1725, 1900, 1905, or 1910, corresponding to SEQ ID NO: 65, a second XTEN sequence is inserted immediately below amino acid 745, corresponding to SEQ ID NO: 65, and a third XTEN sequence is inserted immediately below amino acid 2332, corresponding to SEQ ID NO: 65.

В других вариантах реализации изобретения белок FVIII содержит четыре последовательности XTEN, первая последовательность XTEN встроена в первый сайт встраивания XTEN, вторая последовательность XTEN встроена во второй сайт встраивания XTEN, третья последовательность XTEN встроена в третий сайт встраивания XTEN, и четвертая последовательность XTEN встроена в четвертый сайт встраивания XTEN. Первая, вторая, третья или четвертая последовательности XTEN могут быть одинаковыми, различными или их комбинации. В некоторых вариантах реализации изобретения белок FVIII, содержащий четыре последовательности XTEN, может дополнительно нести мутация или замену, например, аминокислоту 1648, соответствующую SEQ ID NO: 65, например, R1648A. Не ограничивающие примеры первого, второго, третьего и четвертого сайтов встраивания XTEN перечислены в табл. 12.In other embodiments, the FVIII protein contains four XTEN sequences, a first XTEN sequence is inserted into a first XTEN insertion site, a second XTEN sequence is inserted into a second XTEN insertion site, a third XTEN sequence is inserted into a third XTEN insertion site, and a fourth XTEN sequence is inserted into a fourth site. embedding XTEN. The first, second, third or fourth XTEN sequences may be the same, different, or a combination thereof. In some embodiments, the FVIII protein containing four XTEN sequences may additionally carry a mutation or substitution, for example, amino acid 1648 corresponding to SEQ ID NO: 65, for example, R1648A. Non-limiting examples of first, second, third and fourth XTEN embedding sites are listed in Table. 12.

Таблица 13Table 13

Типовые сайты встраивания для четырех XTENTypical embedding sites for four XTENs

Встраивание 1 Embedding 1 Встраивание 2 Embedding 2 Встраивание 3 Embedding 3 Встраивание 4 Embedding 4 Сайт встраивания Embed site Домен Domain Сайт встраивания Embed site Домен Domain Сайт встраивания Embed site Домен Domain Сайт встраивания Embed site Домен Domain 26 26 А1 A1 403 403 А2 A2 1656 1656 аЗ a3 1720 1720 АЗ AZ 26 26 А1 A1 403 403 А2 A2 1656 1656 аЗ a3 1900 1900 АЗ AZ 26 26 А1 A1 403 403 А2 A2 1720 1720 АЗ AZ 1900 1900 АЗ AZ 26 26 А1 A1 1656 1656 аЗ a3 1720 1720 АЗ AZ 1900 1900 АЗ AZ 403 403 А2 A2 1656 1656 аЗ a3 1720 1720 АЗ AZ 1900 1900 АЗ AZ 0040 0040 А1 A1 0403 0403 А2 A2 745 745 В IN 2332 2332 СТ ST 0040 0040 А1 A1 0403 0403 А2 A2 745 745 В IN 2332 2332 ст st 0018 0018 А1 A1 0409 0409 А2 A2 745 745 в V 2332 2332 ст st 0040 0040 А1 A1 0409 0409 А2 A2 745 745 в V 2332 2332 ст st 0040 0040 А1 A1 0409 0409 А2 A2 745 745 в V 2332 2332 ст st

- 78 044115- 78 044115

0018 0018 Al Al 0409 0409 A2 A2 745 745 В IN 2332 2332 СТ ST 0040 0040 Al Al 1720 1720 A3 A3 745 745 В IN 2332 2332 ст st 0026 0026 Al Al 1720 1720 A3 A3 745 745 В IN 2332 2332 ст st 0018 0018 Al Al 1720 1720 A3 A3 745 745 в V 2332 2332 ст st 0018 0018 Al Al 1720 1720 A3 A3 745 745 в V 2332 2332 ст st 0018 0018 Al Al 1720 1720 A3 A3 745 745 в V 2332 2332 ст st 0026 0026 Al Al 1720 1720 A3 A3 745 745 в V 2332 2332 ст st 0018 0018 Al Al 1720 1720 A3 A3 745 745 в V 2332 2332 ст st 0018 0018 Al Al 1900 1900 A3 A3 745 745 в V 2332 2332 ст st 0018 0018 Al Al 1900 1900 A3 A3 745 745 в V 2332 2332 ст st 0026 0026 Al Al 1900 1900 A3 A3 745 745 в V 2332 2332 ст st 0040 0040 Al Al 1900 1900 A3 A3 745 745 в V 2332 2332 ст st 0040 0040 Al Al 1905 1905 A3 A3 745 745 в V 2332 2332 ст st 0018 0018 Al Al 1905 1905 A3 A3 745 745 в V 2332 2332 ст st 0040 0040 Al Al 1905 1905 A3 A3 745 745 в V 2332 2332 ст st 0026 0026 Al Al 1905 1905 A3 A3 745 745 в V 2332 2332 ст st 0018 0018 Al Al 1905 1905 A3 A3 745 745 в V 2332 2332 ст st 0018 0018 Al Al 1905 1905 A3 A3 745 745 в V 2332 2332 ст st 0018 0018 Al Al 1910 1910 A3 A3 745 745 в V 2332 2332 ст st 0018 0018 Al Al 1910 1910 A3 A3 745 745 в V 2332 2332 ст st 0040 0040 Al Al 1910 1910 A3 A3 745 745 в V 2332 2332 ст st 0026 0026 Al Al 1910 1910 A3 A3 745 745 в V 2332 2332 ст st 0018 0018 Al Al 1910 1910 A3 A3 745 745 в V 2332 2332 ст st 0026 0026 Al Al 1910 1910 A3 A3 745 745 в V 2332 2332 ст st 0040 0040 Al Al 1910 1910 A3 A3 745 745 в V 2332 2332 ст st 0018 0018 Al Al 1910 1910 A3 A3 745 745 в V 2332 2332 ст st 0409 0409 A2 A2 1720 1720 A3 A3 745 745 в V 2332 2332 ст st 0403 0403 A2 A2 1720 1720 A3 A3 745 745 в V 2332 2332 ст st 0409 0409 A2 A2 1720 1720 A3 A3 745 745 в V 2332 2332 ст st 0403 0403 A2 A2 1720 1720 A3 A3 745 745 в V 2332 2332 ст st

- 79 044115- 79 044115

0403 0403 А2 A2 1720 1720 АЗ AZ 745 745 В IN 2332 2332 СТ ST 0403 0403 А2 A2 1900 1900 АЗ AZ 745 745 В IN 2332 2332 ст st 0403 0403 А2 A2 1900 1900 АЗ AZ 745 745 В IN 2332 2332 ст st 0409 0409 А2 A2 1900 1900 АЗ AZ 745 745 в V 2332 2332 ст st 0403 0403 А2 A2 1900 1900 АЗ AZ 745 745 в V 2332 2332 ст st 0403 0403 А2 A2 1900 1900 АЗ AZ 745 745 в V 2332 2332 ст st 0409 0409 А2 A2 1900 1900 АЗ AZ 745 745 в V 2332 2332 ст st 0409 0409 А2 A2 1905 1905 АЗ AZ 745 745 в V 2332 2332 ст st 0403 0403 А2 A2 1905 1905 АЗ AZ 745 745 в V 2332 2332 ст st 0403 0403 А2 A2 1905 1905 АЗ AZ 745 745 в V 2332 2332 ст st 0403 0403 А2 A2 1905 1905 АЗ AZ 745 745 в V 2332 2332 ст st 0409 0409 А2 A2 1905 1905 АЗ AZ 745 745 в V 2332 2332 ст st 0403 0403 А2 A2 1905 1905 АЗ AZ 745 745 в V 2332 2332 ст st 0409 0409 А2 A2 1910 1910 АЗ AZ 745 745 в V 2332 2332 ст st 0403 0403 А2 A2 1910 1910 АЗ AZ 745 745 в V 2332 2332 ст st 0403 0403 А2 A2 1910 1910 АЗ AZ 745 745 в V 2332 2332 ст st 0403 0403 А2 A2 1910 1910 АЗ AZ 745 745 в V 2332 2332 ст st 0403 0403 А2 A2 1910 1910 АЗ AZ 745 745 в V 2332 2332 ст st 1720 1720 АЗ AZ 1900 1900 АЗ AZ 745 745 в V 2332 2332 ст st 1720 1720 АЗ AZ 1905 1905 АЗ AZ 745 745 в V 2332 2332 ст st 1720 1720 АЗ AZ 1910 1910 АЗ AZ 745 745 в V 2332 2332 ст st 1720 1720 АЗ AZ 1910 1910 АЗ AZ 745 745 в V 2332 2332 ст st 0403 0403 А2 A2 1656 1656 аЗ a3 1720 1720 АЗ AZ 2332 2332 ст st 0403 0403 А2 A2 1656 1656 аЗ a3 1900 1900 АЗ AZ 2332 2332 ст st 0403 0403 А2 A2 1720 1720 АЗ AZ 1900 1900 АЗ AZ 2332 2332 ст st 1656 1656 аЗ a3 1720 1720 АЗ AZ 1900 1900 АЗ AZ 2332 2332 ст st 0018 0018 А1 A1 0403 0403 А2 A2 1656 1656 аЗ a3 2332 2332 ст st 0018 0018 А1 A1 0403 0403 А2 A2 1720 1720 АЗ AZ 2332 2332 ст st 0018 0018 А1 A1 0403 0403 А2 A2 1900 1900 АЗ AZ 2332 2332 ст st 0018 0018 А1 A1 1656 1656 аЗ a3 1720 1720 АЗ AZ 2332 2332 ст st 0018 0018 А1 A1 1656 1656 аЗ a3 1900 1900 АЗ AZ 2332 2332 ст st 0018 0018 А1 A1 1720 1720 АЗ AZ 1900 1900 АЗ AZ 2332 2332 ст st 0018 0018 А1 A1 0403 0403 А2 A2 0745 0745 В IN 2332 2332 ст st 0018 0018 А1 A1 0745 0745 В IN 1720 1720 АЗ AZ 2332 2332 ст st 0018 0018 А1 A1 0745 0745 В IN 1900 1900 АЗ AZ 2332 2332 ст st 0403 0403 А2 A2 0745 0745 В IN 1720 1720 АЗ AZ 2332 2332 ст st 0403 0403 А2 A2 0745 0745 в V 1900 1900 АЗ AZ 2332 2332 ст st 0745 0745 В IN 1720 1720 АЗ AZ 1900 1900 АЗ AZ 2332 2332 ст st 0188 0188 А1 A1 1900 1900 АЗ AZ 0745 0745 В IN 2332 2332 ст st 0599 0599 1900 1900 АЗ AZ 0745 0745 В IN 2332 2332 ст st 2068 2068 1900 1900 АЗ AZ 0745 0745 в V 2332 2332 ст st 2171 2171 1900 1900 АЗ AZ 0745 0745 в V 2332 2332 ст st 2227 2227 1900 1900 АЗ AZ 0745 0745 в V 2332 2332 ст st 2277 2277 1900 1900 АЗ AZ 0745 0745 в V 2332 2332 ст st

В других вариантах реализации изобретения белок FVIII содержит пять последовательностейIn other embodiments, the FVIII protein contains five sequences

- 80 044115- 80 044115

XTEN, первая последовательность XTEN встроена в первый сайт встраивания XTEN, вторая последовательность XTEN встроена во второй сайт встраивания XTEN, третья последовательность XTEN встроена в третий сайт встраивания XTEN, четвертая последовательность XTEN встроена в четвертый сайт встраивания XTEN, пятая последовательность XTEN встроена в пятый сайт встраивания XTEN. Первая, вторая, третья, четвертая или пятая последовательности XTEN могут быть одинаковыми, различными, или их комбинации. Не ограничивающие примеры первого, второго, третьего, четвертого и пятого сайтов встраивания XTEN перечислены в табл. 14.XTEN, the first XTEN sequence is inserted into the first XTEN insertion site, the second XTEN sequence is inserted into the second XTEN insertion site, the third XTEN sequence is inserted into the third XTEN insertion site, the fourth XTEN sequence is inserted into the fourth XTEN insertion site, the fifth XTEN sequence is inserted into the fifth insertion site XTEN. The first, second, third, fourth or fifth XTEN sequences may be the same, different, or combinations thereof. Non-limiting examples of first, second, third, fourth and fifth XTEN embedding sites are listed in Table. 14.

Таблица 14Table 14

Типовые сайты встраивания для пяти XTENTypical embedding sites for five XTENs

Встраивание XTEN 1 Embedding XTEN 1 Встраивание XTEN 2 Embedding XTEN 2 Встраивание XTEN3 Embedding XTEN3 Встраивание XTEN 4 Embedding XTEN 4 Встраивание XTEN 5 Embedding XTEN 5 0403 0403 1656 1656 1720 1720 1900 1900 2332 2332 0018 0018 0403 0403 1656 1656 1720 1720 2332 2332 0018 0018 0403 0403 1656 1656 1900 1900 2332 2332 0018 0018 0403 0403 1720 1720 1900 1900 2332 2332 0018 0018 1656 1656 1720 1720 1900 1900 2332 2332 0018 0018 0403 0403 0745 0745 1720 1720 2332 2332 0018 0018 0403 0403 0745 0745 1900 1900 2332 2332 0018 0018 0745 0745 1720 1720 1900 1900 2332 2332 0403 0403 0745 0745 1720 1720 1900 1900 2332 2332

В определенных вариантах реализации изобретения белок FVIII содержит шесть последовательностей XTEN, первая последовательность XTEN встроена в первый сайт встраивания XTEN, вторая последовательность XTEN встроена во второй сайт встраивания XTEN, третья последовательность XTEN встроена в третий сайт встраивания XTEN, четвертая последовательность XTEN встроена в четвертый сайт встраивания XTEN, пятая последовательность XTEN встроена в пятый сайт встраивания XTEN и шестая последовательность XTEN встроена в шестой сайт встраивания XTEN. Первая, вторая, третья, четвертая, пятая или шестая последовательности XTEN могут быть одинаковыми, различными, или их комбинации. Примеры шести сайтов встраивания XTEN включают, но не ограничиваются сайтами встраивания, перечисленных в табл. 15.In certain embodiments of the invention, the FVIII protein contains six XTEN sequences, a first XTEN sequence is inserted into a first XTEN insertion site, a second XTEN sequence is inserted into a second XTEN insertion site, a third XTEN sequence is inserted into a third XTEN insertion site, and a fourth XTEN sequence is inserted into a fourth insertion site. XTEN, a fifth XTEN sequence is inserted into a fifth XTEN insertion site, and a sixth XTEN sequence is inserted into a sixth XTEN insertion site. The first, second, third, fourth, fifth or sixth XTEN sequences may be the same, different, or combinations thereof. Examples of six XTEN embedding sites include, but are not limited to, the embedding sites listed in Table. 15.

Таблица 15Table 15

Типовые XTEN сайты встраивания для шести XTENTypical XTEN embed sites for six XTENs

Встраивай ие XTEN 1 Built-in XTEN 1 Встраивай ие XTEN 2 Embedding XTEN 2 Встраивани е XTEN 3 XTEN 3 installation Встраивани е XTEN 4 Installation XTEN 4 Встраивание XTEN 5 Embedding XTEN 5 Встраивание XTEN 5 Embedding XTEN 5 0018 0018 0403 0403 1656 1656 1720 1720 1900 1900 2332 2332 0018 0018 0403 0403 0745 0745 1720 1720 1900 1900 2332 2332

В конкретном примере первая последовательность XTEN встраивается между аминокислотами, соответствующими аминокислотам 26 и 27 последовательности SEQ ID NO: 65, и вторая последовательность XTEN встраивается между аминокислотами, соответствующими аминокислотам 1720 и 1721 последовательности SEQ ID NO: 65 (полноразмерный зрелый FVIII). В другом примере, первая XTEN встраивается между аминокислотами 403 и 404, соответствующих SEQ ID NO: 65, и вторая последовательность XTEN встраивается между аминокислотами, соответствующими аминокислотам 1720 и 1721 последовательности SEQ ID NO: 65. В некоторых примерах, первая XTEN встраивается между аминокислотами 1656 и 1657, соответствующих SEQ ID NO: 65, и вторая последовательность XTEN встраивается между аминокислотами, соответствующими аминокислотам 1720 и 1721 последовательности SEQ ID NO: 65. В других примерах, первая XTEN встраивается между аминокислотами 26 и 27, соответствующих SEQ ID NO: 65, вторая XTEN встраивается между аминокислотами 1656 и 1657, соответствующих SEQ ID NO: 65, и третья XTEN встраивается между аминокислотами 1720 и 1721, соответствующих SEQ ID NO: 65. В еще одних вариантах реализации изобретения первая XTEN встраивается между аминокислотами 403 и 404, соответствующих SEQ ID NO: 65, вторая XTEN встраивается между аминокислотами 1656 и 1657, соответствующих SEQ ID NO: 65, и третья XTEN встраивается между аминокислотами 1720 и 1721, соответствующих SEQ ID NO: 65. В еще одних вариантах реализации изобретения, первая XTEN встраивается между аминокислотами 403 и 404, соответствующих SEQ ID NO: 65, вторая XTEN встраивается между аминокислотами 1656 и 1657, соответствующих SEQ ID NO: 65, и третья XTEN встраивается между аминокислотами 1720 и 1721, соответствующих SEQ ID NO: 65. В некоторых вариантах реализации изобретения первая XTEN встраивается между аминокислотами 26 и 27, соответствующих SEQ ID NO: 65, вторая XTEN встраивается между аминокислотами 1720 и 1721, соответстIn a specific example, a first XTEN sequence is inserted between amino acids corresponding to amino acids 26 and 27 of SEQ ID NO: 65, and a second XTEN sequence is inserted between amino acids corresponding to amino acids 1720 and 1721 of SEQ ID NO: 65 (full-length mature FVIII). In another example, the first XTEN is inserted between amino acids 403 and 404 corresponding to SEQ ID NO: 65, and the second XTEN sequence is inserted between amino acids corresponding to amino acids 1720 and 1721 of SEQ ID NO: 65. In some examples, the first XTEN is inserted between amino acids 1656 and 1657 corresponding to SEQ ID NO: 65, and a second XTEN sequence is inserted between amino acids corresponding to amino acids 1720 and 1721 of SEQ ID NO: 65. In other examples, the first XTEN is inserted between amino acids 26 and 27 corresponding to SEQ ID NO: 65, a second XTEN is inserted between amino acids 1656 and 1657 corresponding to SEQ ID NO: 65, and a third XTEN is inserted between amino acids 1720 and 1721 corresponding to SEQ ID NO: 65. In yet other embodiments, the first XTEN is inserted between amino acids 403 and 404 corresponding to SEQ ID NO: 65, the second XTEN is inserted between amino acids 1656 and 1657, corresponding to SEQ ID NO: 65, and the third XTEN is inserted between amino acids 1720 and 1721, corresponding to SEQ ID NO: 65. In yet other embodiments, the first XTEN is inserted between the amino acids 403 and 404, corresponding to SEQ ID NO: 65, a second XTEN is inserted between amino acids 1656 and 1657, corresponding to SEQ ID NO: 65, and a third XTEN is inserted between amino acids 1720 and 1721, corresponding to SEQ ID NO: 65. In some embodiments, the first XTEN is inserted between amino acids 26 and 27, corresponding to SEQ ID NO: 65, the second XTEN is inserted between amino acids 1720 and 1721, corresponding

- 81 044115 вующих SEQ ID NO: 65, и третья XTEN встраивается между аминокислотами 1900 и 1901, соответствующих SEQ ID NO: 65. В некоторых вариантах реализации изобретения первая XTEN встраивается между аминокислотами 26 и 27, соответствующих SEQ ID NO: 65, вторая XTEN встраивается между аминокислотами 1656 и 1657, соответствующих SEQ ID NO: 65, третья XTEN встраивается между аминокислотами 1720 и 1721, соответствующих SEQ ID NO: 65, и четвертая XTEN встраивается между аминокислотами 1900 и 1901, соответствующих SEQ ID NO: 65.- 81 044115 of SEQ ID NO: 65, and a third XTEN is inserted between amino acids 1900 and 1901, corresponding to SEQ ID NO: 65. In some embodiments, the first XTEN is inserted between amino acids 26 and 27, corresponding to SEQ ID NO: 65, the second XTEN is inserted between amino acids 1656 and 1657 corresponding to SEQ ID NO: 65, a third XTEN is inserted between amino acids 1720 and 1721 corresponding to SEQ ID NO: 65, and a fourth XTEN is inserted between amino acids 1900 and 1901 corresponding to SEQ ID NO: 65.

В конкретных вариантах реализации изобретения последовательность XTEN встраивается между аминокислотами 745-746 полноразмерного фактора VIII или соответствующий сайт встраивания фактора VIII с удаленным доменом В.In particular embodiments, the XTEN sequence is inserted between amino acids 745-746 of full-length Factor VIII or the corresponding Factor VIII insertion site with the B domain removed.

В некоторых вариантах реализации изобретения, химерный белок данного изобретения содержит две полипептидные последовательности, первая полипептидная последовательность, содержащая аминокислотную последовательность по меньшей мере на около 80%, 90%, 95% или 100% идентичную последовательности, выбранной изIn some embodiments, the chimeric protein of the invention comprises two polypeptide sequences, the first polypeptide sequence comprising an amino acid sequence that is at least about 80%, 90%, 95%, or 100% identical to a sequence selected from

FVIII-161 (SEQ ID NO: 69), FVIII-169 (SEQ Ш NO: 70), FVIII-170 (SEQ IDFVIII-161 (SEQ ID NO: 69), FVIII-169 (SEQ Ш NO: 70), FVIII-170 (SEQ ID

NO: 71), FVni-173 (SEQ ID NO: 72); FVIII-195 (SEQ ID NO: 73); FVIII-196 (SEQ ID NO:NO: 71), FVni-173 (SEQ ID NO: 72); FVIII-195 (SEQ ID NO: 73); FVIII-196 (SEQ ID NO:

74), FVIII199 (SEQ ID NO: 75), FVIII-201 (SEQ ID NO: 76); FVIII-203 (SEQ ID NO: 77), FVin-204 (SEQ ID NO: 78), FVIII-205 (SEQ ID NO: 79), FVIII-266 (SEQ ID NO: 80), FVIII267 (SEQ ID NO: 81), FVIII-268 (SEQ ID NO: 82), FVIII-269 (SEQ ID NO: 83), FVIII-271 (SEQ ID NO: 84) или FVIII-272 (SEQ ID NO: 85), и вторую полипептидную последовательность, содержащую аминокислотную последовательность по меньшей мере на около 80%, 90%, 95% или 100% идентичную последовательности, выбранной из ФВ031 (SEQ ID NO: 86), ФВ034 (SEQ ID NO: 87), или ФВ-036.74), FVIII199 (SEQ ID NO: 75), FVIII-201 (SEQ ID NO: 76); FVIII-203 (SEQ ID NO: 77), FVin-204 (SEQ ID NO: 78), FVIII-205 (SEQ ID NO: 79), FVIII-266 (SEQ ID NO: 80), FVIII267 (SEQ ID NO: 81), FVIII-268 (SEQ ID NO: 82), FVIII-269 (SEQ ID NO: 83), FVIII-271 (SEQ ID NO: 84) or FVIII-272 (SEQ ID NO: 85), and a second polypeptide a sequence comprising an amino acid sequence that is at least about 80%, 90%, 95%, or 100% identical to a sequence selected from VF031 (SEQ ID NO: 86), VF034 (SEQ ID NO: 87), or VW-036.

II.D. Константная область ИГ или ее часть.II.D. IG constant region or part thereof.

Химерный белок по данному изобретению также включает в себя две константные области ИГ или их части, первая константная область ИГ или ее часть слита с белком FVIII посредством необязательного линкера, и вторая константная область ИГ или ее часть слита с белком ФВ посредством последовательности XTEN, имеющей менее 288 аминокислот. Константная область ИГ или ее часть может улучшить фармакокинетические или фармакодинамические свойства химерного белка в комбинации с последовательностью XTEN и белком ФВ. В определенных вариантах реализации изобретения первая константная область ИГ или ее часть продлевает период полувыведения молекулы, слитой с константной областью ИГ или ее частью.The chimeric protein of the present invention also includes two IG constant regions or portions thereof, a first IG constant region or portion thereof fused to the FVIII protein via an optional linker, and a second IG constant region or portion thereof fused to the VWF protein via an XTEN sequence having less than 288 amino acids. The IG constant region or part thereof may improve the pharmacokinetic or pharmacodynamic properties of the chimeric protein in combination with the XTEN sequence and the VWF protein. In certain embodiments, the first IG constant region or portion thereof prolongs the half-life of the molecule fused to the IG constant region or portion thereof.

Константная область ИГ состоит из доменов, обозначенных как СН (постоянный тяжелый) домены (CH1, CH2 и т.д.). В зависимости от изотипа, (т.е. IgG, IgM, IgA, IgD или IgE), константная область может состоять из трех или четырех доменов СН. Некоторые изотипы (например, IgG) константные области также содержат шарнирную область. See Janeway et al., 2001 год, Immunobiology, Garland Publishing, Нью-Йорк, штат Нью-ЙоркThe IG constant region consists of domains designated as CH (constant heavy) domains (CH1, CH2, etc.). Depending on the isotype (i.e. IgG, IgM, IgA, IgD or IgE), the constant region may consist of three or four CH domains. Some isotype (eg IgG) constant regions also contain a hinge region. See Janeway et al., 2001, Immunobiology, Garland Publishing, New York, NY

Константная область ИГ или ее часть для получения химерного белка по данному изобретению может быть получена из нескольких различных источников. В некоторых вариантах реализации изобретения константную область ИГ или ее часть получают из ИГ человека. Однако предполагается, что константная область ИГ или ее часть может быть получена из ИГ других видов млекопитающих, включая, например, виды грызунов (например, мышь, крыса, кролик, морская свинка), или виды низших приматов (например, шимпанзе, макака). Кроме того, константная область ИГ или ее часть может быть получена из любого класса ИГ, включая IgM, IgG, IgD, IgA и IgE, и любого изотипа ИГ, в том числе, IgG, IgG2, IgG3 и IgG4. В одном варианте реализации изобретения используется IgG1 человека.The IG constant region or portion thereof for producing the chimeric protein of this invention can be obtained from several different sources. In some embodiments, the IG constant region or a portion thereof is derived from human IG. However, it is contemplated that the IG constant region, or a portion thereof, may be derived from the IG of other mammalian species, including, for example, rodent species (eg, mouse, rat, rabbit, guinea pig) or lower primate species (eg, chimpanzee, macaque). In addition, the Ig constant region or portion thereof may be derived from any class of Ig, including IgM, IgG, IgD, IgA, and IgE, and any isotype of Ig, including IgG, IgG2, IgG3, and IgG4. In one embodiment of the invention, human IgG1 is used.

Разнообразие последовательностей генов константной области ИГ (например, последовательности генов константной области человека) являются доступными в открытых для общественности источниках. Последовательности доменов константной области могут быть выбраны таким образом, чтобы они обладали определенной эффекторной функцией (или чтобы эффекторная функция отсутствовала) или определенной модификацией для снижения иммуногенности. Были опубликованы многие последовательности антител и генов, кодирующих антитела, и подходящие последовательности константной области ИГ (например, шарнирная, CH2 и/или CH3 последовательности или их части) могут быть получены из этих последовательностей с использованием методов, известных в данной области техники. Генетический материал, полученный с использованием любого из вышеописанных способов, затем может быть изменен или синтезирован для получения полипептидов по данному изобретению. Следует также иметь в виду, что рамки настоящего изобретения охватывают аллели, варианты и мутации последовательностей ДНК константной области.A variety of IG constant region gene sequences (eg, human constant region gene sequences) are available in publicly available sources. The constant region domain sequences may be selected to have a particular effector function (or to lack an effector function) or to be modified to reduce immunogenicity. Many antibody and antibody-encoding gene sequences have been published, and suitable IG constant region sequences (eg, hinge, CH2 and/or CH3 sequences or portions thereof) can be derived from these sequences using methods known in the art. Genetic material obtained using any of the methods described above can then be modified or synthesized to produce the polypeptides of this invention. It should also be understood that the scope of the present invention includes alleles, variants and mutations of constant region DNA sequences.

Последовательности константной области ИГ или ее части могут быть клонированы, например, с помощью полимеразной цепной реакции и праймеров, которые выбраны для амплификации домена интереса. Для клонирования последовательности константной области ИГ или ее части из антитела мРНК может быть выделена из гибридомы, селезенки или лимфатических клеток, посредством обратной трансIG constant region sequences or portions thereof can be cloned, for example, using polymerase chain reaction and primers that are selected to amplify the domain of interest. To clone the Ig constant region sequence or part thereof from an antibody, mRNA can be isolated from hybridoma, spleen or lymphatic cells by reverse trans

- 82 044115 крипции транскрибирована в ДНК, и гены антител амплифицированы с помощью ПЦР. Методы ПЦР амплификации описаны подробно в патентах США № 4,683,195; 4,683,202; 4,800,159; 4,965,188; и, например, в PCR Protocols: A Guide to Methods and Applications Innis et al., изд., Academic Press, СанДиего, штат Калифорния (1990 год); Но et al., 1989 год. Gene 77:51; Horton et al., 1993. Methods Enzymol. 217:270). ПЦР может быть инициирована посредством консенсусных праймеров к константной области или более специфическими праймерами на основе опубликованных ДНК и аминокислотных последовательностей тяжелой и легкой цепи. Как было рассмотрено выше, ПЦР также может быть использована для выделения ДНК клонов, кодирующих легкие и тяжелые цепи антител. В этом случае библиотеки могут быть подвергнуты скринингу с помощью консенсусных праймеров или больших гомологичных зондов, таких как зонды константных областей мыши. Многочисленные наборы праймеров, пригодных для амплификации генов антител, известны в данной области техники (например, 5' праймеры на основе Nконцевой последовательности очищенных антител (Benhar и Pastan. 1994 год. Protein Engineering 7:1509); быстрая амплификация концов кДНК (Ruberti, F. et al., 1994 год. J. Immunol. Methods 173:33); лидерные последовательности антител (Larrick et al., 1989 год Biochem. Biophys. Res. Commun. 160:1250). Клонирование последовательностей антител дополнительно описано в Newman et al., Патент США № 5,658,570, поданный 25 января 1995 года, которая включена в настоящий документ посредством ссылки.- 82 044115 transcriptions are transcribed into DNA and antibody genes are amplified using PCR. PCR amplification methods are described in detail in US patents No. 4,683,195; 4,683,202; 4,800,159; 4,965,188; and, for example, PCR Protocols: A Guide to Methods and Applications Innis et al., ed., Academic Press, San Diego, California (1990); But et al., 1989. Gene 77:51; Horton et al., 1993. Methods Enzymol. 217:270). PCR can be initiated using consensus constant region primers or more specific primers based on published heavy and light chain DNA and amino acid sequences. As discussed above, PCR can also be used to isolate DNA clones encoding the light and heavy chains of antibodies. In this case, libraries can be screened using consensus primers or large homologous probes such as mouse constant region probes. Numerous sets of primers suitable for amplification of antibody genes are known in the art (eg, 5' primers based on the N-terminal sequence of purified antibodies (Benhar and Pastan. 1994 Protein Engineering 7:1509); rapid amplification of cDNA ends (Ruberti, F et al., 1994 J. Immunol. Methods 173:33); antibody leader sequences (Larrick et al., 1989 Biochem. Biophys. Res. Commun. 160:1250). Cloning of antibody sequences is further described in Newman et al. al., US Patent No. 5,658,570, filed January 25, 1995, which is incorporated herein by reference.

Константная область ИГ, используемая в данном документе, может включать все домены и шарнирною область или ее часть. В одном варианте реализации изобретения константная область ИГ или ее часть содержит домен CH2, домен CH3 и шарнирную область, т.е. фрагмент Fc или партнер по связыванию FcRn.The IG constant region used herein may include all or part of the domains and the hinge region. In one embodiment of the invention, the IG constant region or a portion thereof comprises a CH2 domain, a CH3 domain, and a hinge region, i.e. Fc fragment or FcRn binding partner.

В данном контексте термин фрагмент Fc определяется как часть полипептида, который соответствует фрагменту Fc нативного ИГ, т.е. как образованный посредством димерной ассоциации соответствующих доменов Fc двух его тяжелых цепей. Нативный фрагмент Fc образует гомодимер с другим фрагментом Fc. В противоположность этому, термин генетически слитый фрагмент Fc или одноцепочечный фрагмент Fc (фрагмент scFc) в данном контексте означает синтетический димерный фрагмент Fc, состоящий из доменов Fc, генетически связанных в одной полипептидной цепи (т.е. закодированных в одной непрерывной генетической последовательности).In this context, the term Fc fragment is defined as the part of the polypeptide that corresponds to the Fc fragment of native Ig, i.e. as formed through the dimeric association of the corresponding Fc domains of its two heavy chains. The native Fc fragment forms a homodimer with another Fc fragment. In contrast, the term genetically fused Fc fragment or single chain Fc fragment (scFc fragment) as used herein means a synthetic dimeric Fc fragment consisting of Fc domains genetically linked on a single polypeptide chain (ie, encoded in a single contiguous genetic sequence).

В одном варианте реализации изобретения фрагмент Fc означает часть одной тяжелой цепи ИГ, начинающуюся в шарнирной области непосредственно перед сайтом расщепления папаином (т.е. остаток 216 в IgG, если принять остаток 114 за первый остаток константной области тяжелой цепи) и заканчивающуюся С-концом антитела. Соответственно, полный домен Fc, содержит по меньшей мере шарнирный домен, домен CH2 и домен CH3.In one embodiment, the Fc fragment is the portion of a single heavy chain of an Ig starting in the hinge region immediately upstream of the papain cleavage site (i.e., residue 216 in IgG, if residue 114 is taken to be the first residue of the heavy chain constant region) and ending at the C terminus antibodies. Accordingly, a complete Fc domain contains at least a hinge domain, a CH2 domain, and a CH3 domain.

Фрагмент Fc константной области ИГ, в зависимости от изотипа ИГ может включать домены CH2, CH3 и СН4, а также шарнирную область. Химерные белки, содержащие фрагмент Fc ИГ предоставляют несколько желательных свойств химерному белку, включая повышенную стабильность, увеличение периода полувыведения в сыворотке (см. Capon и соавт, 1989 год, Nature 337:525) а также связывание с рецепторами Fc, таким как неонатальный рецептор Fc (FcRn) (патент США № 6,086,875, 6,485,726, 6,030,613; WO 03/077834; US2003-0235536A1), которые включены в данный документ посредством ссылки.The Fc fragment of the Ig constant region, depending on the Ig isotype, may include the CH2, CH3 and CH4 domains, as well as the hinge region. Chimeric proteins containing the Fc fragment of IG provide several desirable properties to the chimeric protein, including increased stability, increased serum half-life (see Capon et al, 1989, Nature 337:525) and binding to Fc receptors, such as the neonatal Fc receptor (FcRn) (US Patent No. 6,086,875, 6,485,726, 6,030,613; WO 03/077834; US2003-0235536A1), which are incorporated herein by reference.

Константная область ИГ или ее часть может быть партнером по связыванию FcRn. FcRn проявляет активность во взрослых эпителиальных тканях и экспрессируется в просвете кишечника, дыхательных путях, назальных поверхностях, вагинальных поверхностях, толстой кишке и ректальных поверхностях (патент США № 6,485,726). Партнер по связыванию FcRn является частью ИГ, которая связывается с FcRn.The IG constant region or part thereof may be a binding partner of FcRn. FcRn is active in adult epithelial tissues and is expressed in the intestinal lumen, respiratory tract, nasal surfaces, vaginal surfaces, colon and rectal surfaces (US Patent No. 6,485,726). The FcRn binding partner is the part of the IG that binds to FcRn.

Рецептор FcRn был выделен из нескольких видов млекопитающих, включая человека. Последовательности FcRn человека, FcRn обезьяны, FcRn крысы, и FcRn мыши известны (Story et al., 1994, J. Exp. Med. 180:2377). Рецептор FcRn связывает IgG (но не другие классы ИГ, такие как IgA, IgM, IgD и IgE) при относительно низком значении pH, активно транспортирует IgG трансцеллюлярно от просвета к серозной оболочке, и затем высвобождает IgG при относительно высоком значении pH, которое характерно для интерстициальных жидкостей. Он экспрессируется в зрелой эпителиальной ткани (патенты США № 6,086,875, 6,485,726, 6,030,613; WO 03/077834; US2003-0235536 A1), включая легочный и кишечный эпителий (Israel et al., 1997 год, Immunology 92:69) проксимальный почечный тубулярный эпителий (Kobayashi et al., 2002 год, Am. J. Physiol. Renal Physiol. 282:F358), а также назальный эпителий, поверхности влагалища и поверхности желчных проток.The FcRn receptor has been isolated from several mammalian species, including humans. The sequences of human FcRn, monkey FcRn, rat FcRn, and mouse FcRn are known (Story et al., 1994, J. Exp. Med. 180:2377). The FcRn receptor binds IgG (but not other classes of Ig such as IgA, IgM, IgD, and IgE) at relatively low pH, actively transports IgG transcellularly from the lumen to the serosa, and then releases IgG at the relatively high pH that characterizes interstitial fluids. It is expressed in mature epithelial tissue (US Patent Nos. 6,086,875, 6,485,726, 6,030,613; WO 03/077834; US2003-0235536 A1), including pulmonary and intestinal epithelium (Israel et al., 1997, Immunology 92:69) proximal renal tuba polar epithelium (Kobayashi et al., 2002, Am. J. Physiol. Renal Physiol. 282:F358), as well as nasal epithelium, vaginal surfaces, and bile duct surfaces.

Партнеры по связыванию FcRn, пригодные к использованию в данном изобретении, включают молекулы, которые могут специфически связываются с рецептором FcRn, включая цельный IgG, фрагмент Fc из IgG и другие фрагменты, которые имеют полную область связывания рецептора FcRn. Область участка Fc IgG, которая связывается с рецептором FcRn была описана на основе рентгеновской кристаллографии (Burmeister et al., 1994 год, Nature 372:379). Основная площадь контакта Fc с FcRn находится рядом с местом соединения доменов CH2 и CH3. Все контакты Fc-FcRn находятся в пределах одной тяжелой цепи IgG. Партнеры по связыванию FcRn включают цельный IgG, фрагмент Fc из IgG и другие фрагменты IgG, которые имеют полную область связывания FcRn. Основные контактные сайты включают аминокислотные остатки 248, 250-257, 272, 285, 288, 290-291, 308-311 и 314 домена CH2 и аминокис- 83 044115 лотные остатки 385-387, 428 и 433-436 домена CH3. Все ссылки на нумерацию аминокислот иммуноглобулинов или фрагментов иммуноглобулинов, или областей иммуноглобулинов основаны на Kabat et al.,FcRn binding partners useful in the present invention include molecules that can specifically bind to the FcRn receptor, including whole IgG, an Fc fragment of IgG, and other fragments that have a complete FcRn receptor binding region. The region of the Fc portion of IgG that binds to the FcRn receptor has been described based on X-ray crystallography (Burmeister et al., 1994, Nature 372:379). The main area of contact between Fc and FcRn is located near the junction of the CH2 and CH3 domains. All Fc-FcRn contacts are within one IgG heavy chain. FcRn binding partners include whole IgG, the Fc fragment of IgG, and other IgG fragments that have a complete FcRn binding region. The main contact sites include amino acid residues 248, 250-257, 272, 285, 288, 290-291, 308-311 and 314 of the CH2 domain and amino acid residues 83044115 385-387, 428 and 433-436 of the CH3 domain. All references to amino acid numbering of immunoglobulins or immunoglobulin fragments or regions of immunoglobulins are based on Kabat et al.,

1991 год, Sequences of Proteins of Immunological Interest, Департамент общественного здравоохранения1991, Sequences of Proteins of Immunological Interest, Department of Public Health

США, Бетесда, штат Мэриленд.USA, Bethesda, Maryland.

Фрагмент Fc или партнер по связыванию FcRn, связанные с FcRn, могут эффективно перемещаться через эпителиальные барьеры посредством FcRn, таким образом, обеспечивая неинвазивные способы для системного введения желаемой терапевтической молекулы. Кроме того, слитые белки, содержащие фрагмент Fc или партнер по связыванию FcRn, подвергаются эндоцитозу клетками, экспрессирующими FcRn. Но вместо того, чтобы быть помеченными для деградации, эти слитые белки вновь возвращаются обратно в кровоток, тем самым увеличивая in vivo период полувыведения этих белков. В определенных вариантах реализации изобретения частями константных областей ИГ являются фрагмент Fc или партнер по связыванию FcRn, которые обычно ассоциируется с помощью дисульфидных связей и других неспецифических взаимодействий с другим фрагментом Fc или другим партнером по связыванию FcRn с образованием димеров и мультимеров высокого порядка.The Fc fragment or FcRn binding partner bound to FcRn can be efficiently translocated across epithelial barriers by FcRn, thereby providing non-invasive methods for systemic administration of the desired therapeutic molecule. In addition, fusion proteins containing an Fc moiety or an FcRn binding partner are endocytosed by FcRn-expressing cells. But rather than being tagged for degradation, these fusion proteins are released back into the bloodstream, thereby increasing the in vivo half-life of these proteins. In certain embodiments, portions of the IG constant regions are an Fc moiety or FcRn binding partner, which typically associate through disulfide bonds and other nonspecific interactions with another Fc moiety or other FcRn binding partner to form dimers and higher order multimers.

Два рецептора FcRn могут связывать с одной молекулой Fc.Two FcRn receptors can bind to one Fc molecule.

Кристаллографические данные свидетельствуют о том, что каждая молекула FcRn связывается с одним полипептидом в гомодимере Fc. В одном варианте реализации изобретения связывание партнера по связыванию FcRn, например, фрагмента Fc IgG с биологически активной молекулой обеспечивает средство доставки биологически активной молекулы перорально, буккально, сублингвально, ректально, вагинально, в форме аэрозоля назально или ингаляционно через легочный путь, или через глаза. В другом варианте реализации изобретения химерный белок может быть введен инвазивным способом, например, подкожно, внутривенно.Crystallographic evidence suggests that each FcRn molecule binds to one polypeptide in the Fc homodimer. In one embodiment, the binding of an FcRn binding partner, e.g., an IgG Fc fragment, to a biologically active molecule provides a means of delivering the biologically active molecule orally, buccally, sublingually, rectally, vaginally, in nasal aerosol or inhalation via the pulmonary route, or via the eye. In another embodiment of the invention, the chimeric protein can be administered in an invasive manner, for example, subcutaneously, intravenously.

Партнер по связыванию FcRn представляет собой молекулу или ее часть, которая может специфически связывается с рецептором FcRn с последующей активной транспортировкой посредством рецептора FcRn фрагмента Fc. Специфически связанные означает две молекулы, образующие комплекс, проявляющий относительную стабильность в физиологических условиях. Специфическое связывание характеризуется высокой аффинностью и низкой или средней связывающей способностью, что отличается от неспецифического связывания, которое обычно имеет низкую аффинность и умеренную или высокую связывающую способность. Как правило, связывание считается специфическим, когда константа аффинности KA выше, чем 106 М-1, или выше чем 108 М-1. При необходимости, неспецифическое связывание может быть уменьшено без существенного влияния на специфическое связывание варьированием условий связывания. Соответствующие условия связывания, такие как концентрация молекул, ионная сила раствора, температуры, время, требуемое для связывания, концентрация блокирующего агента (например, сывороточный альбумин, молочный казеин) и т.д., могут быть оптимизированы специалистом в данной области техники с использованием обычных методов.An FcRn binding partner is a molecule or part thereof that can specifically bind to an FcRn receptor, followed by active trafficking of an Fc moiety through the FcRn receptor. Specifically bound means two molecules forming a complex that exhibits relative stability under physiological conditions. Specific binding is characterized by high affinity and low to moderate binding capacity, which is different from nonspecific binding, which generally has low affinity and moderate to high binding capacity. Generally, binding is considered specific when the affinity constant KA is greater than 106 M -1 or greater than 10 8 M -1 . If necessary, nonspecific binding can be reduced without significantly affecting specific binding by varying the binding conditions. Appropriate binding conditions such as concentration of molecules, ionic strength of solution, temperatures, time required for binding, concentration of blocking agent (eg, whey albumin, milk casein), etc. can be optimized by one skilled in the art using conventional methods.

В некоторых вариантах реализации изобретения химерный белок по настоящему изобретению содержит один или более укороченных фрагментов Fc, которые, тем не менее, являются достаточными для придания рецептору Fc (FcR) связывающих свойств фрагменту Fc. Например, часть фрагмента Fc, который связывается с FcRn (т.е. связывающая часть FcRn) содержит от около 282-438 аминокислот IgG1, нумерация EU (первичные контактные сайты являются аминокислотами 248, 250-257, 272, 285, 288, 290291, 308-311, 314 домена CH2 и аминокислотные остатки 385-387, 428, 433-436 домена CH3. Таким образом, фрагмент Fc по настоящему изобретению может содержать или включать в себя связывающую часть FcRn. Связывающая часть FcRn может быть получена из тяжелых цепей любого изотипа, включая IgG1, IgG2, IgG3 и IgG4. В одном варианте реализации изобретения используется связывающая часть FcRn из антитела изотипа IgG1 человека. В другом варианте реализации изобретения используется связывающая часть FcRn из антитела изотипа IgG4 человека.In some embodiments, the chimeric protein of the present invention contains one or more truncated Fc fragments that are still sufficient to impart Fc receptor (FcR) binding properties to the Fc fragment. For example, the portion of the Fc fragment that binds to FcRn (i.e., the FcRn binding portion) contains from about amino acids 282-438 of IgG1, EU numbering (primary contact sites are amino acids 248, 250-257, 272, 285, 288, 290,291, 308-311, 314 of the CH2 domain and amino acid residues 385-387, 428, 433-436 of the CH3 domain. Thus, the Fc fragment of the present invention may contain or include an FcRn binding moiety. The FcRn binding moiety may be derived from any heavy chain isotype, including IgG1, IgG2, IgG3 and IgG4. In one embodiment, an FcRn binding moiety from a human IgG1 isotype antibody is used. In another embodiment, an FcRn binding moiety from a human IgG4 isotype antibody is used.

В другом варианте реализации изобретения фрагмент Fc включает в себя аминокислотную последовательность домена Fc или полученный из домена Fc. В некоторых вариантах реализации изобретения фрагмент Fc содержит по меньшей мере один(ну): шарнирную область (например, верхнюю, среднюю, и/или нижнюю шарнирную область), домен СН1 (около 216-230 аминокислот фрагмента Fc антитела в соответствии с нумерацией EU), домен CH2 (около 231-340 аминокислот фрагмента Fc антитела в соответствии с нумерацией EU), домен CH3 (около 341-438 аминокислот фрагмента Fc антитела в соответствии с нумерацией EU), домен СН4 или вариант, часть, или его фрагмент. В других вариантах реализации изобретения фрагмент Fc содержит полный домен Fc (т.е. шарнирный домен, домен CH2, и домен CH3) В некоторых вариантах реализации изобретения фрагмент Fc содержит, по существу состоит или состоит из шарнирного домена (или его части), слитого с доменом CH3 (или его частью), шарнирного домена (или его части), слитого с доменом CH2 (или его частью), домена CH2 (или его части), слитого с доменом CH3 (или его частью), домена CH2 (или его части), слитого как с шарнирным доменом (или его частью), так и с доменом CH3 (или его частью). В еще одних вариантах реализации изобретения домен Fc не имеет по меньшей мере части домена CH2 (например, целого или части домена CH2). В конкретном варианте реализации изобретения фрагмент Fc содержит или состоит из аминокислот, соответствующих номерам EU 221-447.In another embodiment, the Fc fragment includes the amino acid sequence of an Fc domain or derived from an Fc domain. In some embodiments, the Fc fragment comprises at least one: hinge region (e.g., upper, middle, and/or lower hinge region), CH1 domain (about 216-230 amino acids of the antibody Fc fragment according to EU numbering) , CH2 domain (about 231-340 amino acids of the antibody Fc fragment according to EU numbering), CH3 domain (about 341-438 amino acids of the antibody Fc fragment according to EU numbering), CH4 domain or a variant, part, or fragment thereof. In other embodiments, the Fc fragment comprises a complete Fc domain (i.e., a hinge domain, a CH2 domain, and a CH3 domain). In some embodiments, the Fc fragment comprises, consists essentially of, or consists of a hinge domain (or a portion thereof) fused with a CH3 domain (or part thereof), a hinge domain (or part thereof) fused to a CH2 domain (or part thereof), a CH2 domain (or part thereof) fused to a CH3 domain (or part thereof), a CH2 domain (or part thereof) part) fused to both the hinge domain (or part thereof) and the CH3 domain (or part thereof). In yet other embodiments, the Fc domain lacks at least a portion of a CH2 domain (eg, all or part of a CH2 domain). In a specific embodiment of the invention, the Fc fragment contains or consists of amino acids corresponding to EU numbers 221-447.

- 84 044115- 84 044115

Фрагменты Fc, обозначенные как F, F1 или F2 в данном документе, могут быть получены из нескольких различных источников. В одном варианте реализации изобретения полипептид фрагмента Fc получают из ИГ человека. Однако предполагается, что фрагмент Fc может быть получен из ИГ других видов млекопитающих, включая, например, виды грызунов (например, мышь, крыса, кролик, морская свинка), или виды низших приматов (например, шимпанзе, макака). Кроме того, полипептид доменов Fc или его частей может быть получена из любого класса ИГ, включая IgM, IgG, IgD, IgA и IgE, и любого изотипа ИГ, в том числе, IgG1, IgG2, IgG3 и IgG4. В другом варианте реализации изобретения используется изотип IgG1 человека.Fc fragments, designated F, F1 or F2 herein, can be obtained from several different sources. In one embodiment of the invention, the Fc fragment polypeptide is derived from human IG. However, it is contemplated that the Fc fragment may be derived from the IG of other mammalian species, including, for example, rodent species (eg, mouse, rat, rabbit, guinea pig), or lower primate species (eg, chimpanzee, macaque). In addition, the Fc domain polypeptide or portions thereof may be derived from any class of Ig, including IgM, IgG, IgD, IgA, and IgE, and any isotype of Ig, including IgG1, IgG2, IgG3, and IgG4. In another embodiment, the human IgG1 isotype is used.

В определенных вариантах реализации изобретения вариант Fc предоставляет изменение по меньшей мере одной эффекторной функции, которой наделен фрагмент Fc, содержащий указанный домен Fc дикого типа (например, улучшение или ухудшение способности фрагмента Fc к связыванию с рецепторами Fc (например FcyRI, FcyRII или FcyRIII) или белки комплемента (например C1q) или чтобы вызвать антитело-зависимую цитотоксичность (ADCC), фагоцитоз и комплемент-зависимую цитотоксичность (CDCC)). В других вариантах реализации изобретения вариант Fc содержит сконструированный остаток цистеина.In certain embodiments, the Fc variant provides a change in at least one effector function conferred on the Fc fragment containing said wild-type Fc domain (e.g., improving or impairing the ability of the Fc fragment to bind to Fc receptors (e.g., FcyRI, FcyRII, or FcyRIII), or complement proteins (eg C1q) or to cause antibody-dependent cytotoxicity (ADCC), phagocytosis and complement-dependent cytotoxicity (CDCC)). In other embodiments, the Fc variant contains a engineered cysteine residue.

В фрагментах Fc настоящего изобретения могут использоваться принятые в данной области техники варианты Fc с известной способностью вызывать изменения (например, улучшение или ухудшение) эффекторной функции и/или FcR или FcRn связывания. В частности, связывающая молекула по данному изобретению может иметь, например, изменение (например, замену) одной или более аминокислотных позиций, описанных в международных публикацияхThe Fc fragments of the present invention may use Fc variants accepted in the art with a known ability to cause changes (eg, improvement or impairment) in effector function and/or FcR or FcRn binding. In particular, the binding molecule of this invention may have, for example, a change (eg, substitution) of one or more amino acid positions described in international publications

РСТ WO88/07089A1, WO96/14339A1, WO98/05787A1, WO98/23289A1, WO99/51642A1, WO99/58572A1, WO00/09560A2, WO00/32767A1, WO00/42072A2, WO02/44215A2, WO02/060919A2, WO03/074569A2, WO04/016750A2, WO04/029207A2, WO04/035752A2, WO04/063351A2, WO04/074455A2, WO04/099249A2, WO05/040217A2, WO04/044859, WO05/070963A1, WO05/077981A2, WO05/092925A2, WO05/123780A2, WO06/019447A1, WO06/047350A2 и WO06/085967A2; публикациях патентов США № US2007/0231329, US2007/0231329, US2007/0237765, US2007/0237766, US2007/0237767, US2007/0243188, US20070248603, US20070286859, US20080057056;PCT WO88/07089A1, WO96/14339A1, WO98/05787A1, WO98/23289A1, WO99/51642A1, WO99/58572A1, WO00/09560A2, WO00/32767A1, WO00/42072A2, WO0 2/44215A2, WO02/060919A2, WO03/074569A2, WO04 /016750A2, WO04/029207A2, WO04/035752A2, WO04/063351A2, WO04/074455A2, WO04/099249A2, WO05/040217A2, WO04/044859, WO05/070963A1, WO 05/077981A2, WO05/092925A2, WO05/123780A2, WO06/019447A1 , WO06/047350A2 and WO06/085967A2; US patent publications No. US2007/0231329, US2007/0231329, US2007/0237765, US2007/0237766, US2007/0237767, US2007/0243188, US20070248603, US20070286859, US20080 057056;

или патентах США 5,648,260; 5,739,277; 5,834,250; 5,869,046; 6,096,871; 6,121,022; 6,194,551; 6,242,195; 6,277,375; 6,528,624; 6,538,124; 6,737,056; 6,821,505; 6,998,253; 7,083,784; 7,404,956 и 7,317,091, каждый из которых включен в настоящее описание посредством ссылки. В одном варианте реализации изобретения специфическое изменение (например, специфическую замену одной или более аминокислот, описанных в данной области техники) может быть сделано в одной или более описанных аминокислотных позициях. В другом варианте реализации изобретения различные изменения в одной или более из описанных аминокислотных позиций (например, различные замены одной или более аминокислотной позиции, описанной в данной области техники), могут быть сделаны.or US Patents 5,648,260; 5,739,277; 5,834,250; 5,869,046; 6,096,871; 6,121,022; 6,194,551; 6,242,195; 6,277,375; 6,528,624; 6,538,124; 6,737,056; 6,821,505; 6,998,253; 7,083,784; 7,404,956 and 7,317,091, each of which is incorporated herein by reference. In one embodiment of the invention, a specific change (eg, a specific substitution of one or more amino acids described in the art) can be made at one or more described amino acid positions. In another embodiment, various changes to one or more of the described amino acid positions (eg, various substitutions of one or more amino acid positions described in the art) can be made.

Фрагмент Fc или партнер по связыванию FcRn IgG может быть изменен в соответствии с хорошо известными процедурами, такими как сайт-направленный мутагенез и тому подобное, чтобы получить модифицированный IgG или фрагменты Fc, или их части, которые будут связываться с FcRn. Такие модификации включают модификации удаленных от FcRn сайтов контакта, а также модификации в сайтах контакта, которые сохраняют или даже усиливают связывание с FcRn. Например, следующие остатки одной аминокислоты в Fc IgG1 человека (Fcy1) могут быть заменены без существенной потери аффинности связывания Fc с FcRn:The Fc fragment or FcRn binding partner of an IgG can be modified according to well-known procedures such as site-directed mutagenesis and the like to produce modified IgG or Fc fragments, or portions thereof, that will bind to FcRn. Such modifications include modifications at contact sites distant from FcRn, as well as modifications at contact sites that maintain or even enhance binding to FcRn. For example, the following single amino acid residues in the human IgG1 Fc (Fcy1) can be replaced without significant loss of Fc binding affinity to FcRn:

Р238А, S239A, К246А,P238A, S239A, K246A,

К248А, D249A, М252А, Т256А, Е258А, Т260А, D265A, S267A, Н268А, Е269А, D270A, Е272А, L274A, N276A, Y278A, D280A, V282A, Е283А, Н285А, N286A, Т289А, К290А,K248A, D249A, M252A, T256A, E258A, T260A, D265A, S267A, H268A, E269A, D270A, E272A, L274A, N276A, Y278A, D280A, V282A, E283A, H285A, N286A, T2 89A, K290A,

R292A, Е293А, Е294А, Q295A, Y296F, N297A, S298A, Y300F, R301A, V3O3A, V305A,R292A, E293A, E294A, Q295A, Y296F, N297A, S298A, Y300F, R301A, V3O3A, V305A,

Т307А, L309A, Q311A, D312A, N315A, К317А, Е318А, К320А, К322А, S324A, К326А,T307A, L309A, Q311A, D312A, N315A, K317A, E318A, K320A, K322A, S324A, K326A,

A327Q, Р329А, A33OQ, Р331А, ЕЗЗЗА, К334А, Т335А, S337A, К338А, К340А, Q342A,A327Q, P329A, A33OQ, P331A, EZZZA, K334A, T335A, S337A, K338A, K340A, Q342A,

R344A, Е345А, Q347A, R355A, Е356А, М358А, Т359А, К360А, N361A, Q362A, Y373A,R344A, E345A, Q347A, R355A, E356A, M358A, T359A, K360A, N361A, Q362A, Y373A,

S375A, D376A, A378Q, Е38ОА, Е382А, S383A, N384A, Q386A, Е388А, N389A, N390A,S375A, D376A, A378Q, E38OA, E382A, S383A, N384A, Q386A, E388A, N389A, N390A,

Y391F, К392А, L398A, S400A, D401A, D413A, К414А, R416A, Q418A, Q419A, N421A,Y391F, K392A, L398A, S400A, D401A, D413A, K414A, R416A, Q418A, Q419A, N421A,

V422A, S424A, Е430А, N434A, Т437А, Q438A, К439А, S440A, S444A, и К447А, где, например, Р238А представляет замену пролина дикого типа на аланина в положении номер 238.V422A, S424A, E430A, N434A, T437A, Q438A, K439A, S440A, S444A, and K447A, where, for example, P238A represents a substitution of wild-type proline for alanine at position number 238.

В качестве примера, конкретный вариант реализации изобретения включает в себя мутацию N297A, удаAs an example, a particular embodiment of the invention includes the N297A mutation, where

- 85 044115 ляющую высококонсервативный сайт N-гликозилирования. В дополнение к аланину другие аминокислоты могут быть заменены на аминокислоты дикого типа в положениях, указанных выше. Мутации могут быть внесены в Fc по одной, приводя к образованию более ста фрагментов Fc, отличных от нативного Fc. Кроме того, комбинации из двух, трех или более этих отдельных мутаций могут быть введены вместе, приводя к образованию еще сотен фрагментов Fc. Более того, один из фрагментов Fc конструкции по данному изобретению может быть мутирован, и другой фрагмент Fc конструкции не мутирован вообще, или они оба могут быть мутированы, но иметь различные мутации.- 85 044115 laying a highly conserved N-glycosylation site. In addition to alanine, other amino acids may be replaced with wild-type amino acids at the positions indicated above. Mutations can be introduced into Fc one at a time, resulting in the formation of more than one hundred Fc fragments different from the native Fc. Additionally, combinations of two, three, or more of these individual mutations can be introduced together, resulting in the formation of hundreds more Fc fragments. Moreover, one of the Fc fragments of the construct of this invention may be mutated and the other Fc fragment of the construct is not mutated at all, or they may both be mutated but have different mutations.

Некоторые из указанных выше мутаций могут придавать новые функциональные возможности фрагменту Fc или партнеру по связыванию FcRn. Например, один вариант реализации изобретения включает в себя мутацию N297A, удаляющую высококонсервативный сайт N-гликозилирования Эффектом этой мутации является снижение иммуногенности, тем самым увеличивается период полувыведения из крови фрагмента Fc, и делает фрагмент Fc неспособным к связыванию с FcyRI, FcyRIIA, FcyRIIB, и FcyRIIIA, без ущерба для аффинности FcRn (Routledge et al., 1995, Transplantation 60:847; Friend et al., 1999, Transplantation 68:1632; Shields et al., 1995, J. Biol. Chem. 276:6591). В качестве еще одного примера новых функциональных возможностей, возникающих из-за мутаций, описанных выше, аффинность к FcRn может быть увеличена сверх уровня дикого типа в некоторых случаях. Эта повышенная аффиность может соответствовать увеличенной скорости ассоциации, уменьшенной скорости диссоциации или как увеличенной скорости ассоциации, так и уменьшенной скорости диссоциации. Примеры мутаций, которые, как полагают, придают повышенную аффинность к FcRn, включают, но не ограничиваются ими, Т256А, Т307А, Е380А и N434A (Shields et al., 2001 год, J. Biol. Chem. 276:6591).Some of the above mutations may impart new functionality to the Fc fragment or FcRn binding partner. For example, one embodiment of the invention includes the N297A mutation, which removes a highly conserved N-glycosylation site. The effect of this mutation is to reduce immunogenicity, thereby increasing the blood half-life of the Fc fragment, and render the Fc fragment incapable of binding to FcyRI, FcyRIIA, FcyRIIB, and FcyRIIIA, without compromising FcRn affinity (Routledge et al., 1995, Transplantation 60:847; Friend et al., 1999, Transplantation 68:1632; Shields et al., 1995, J. Biol. Chem. 276:6591). As another example of new functionality arising from the mutations described above, affinity for FcRn can be increased beyond wild-type levels in some cases. This increased affinity may correspond to an increased rate of association, a decreased rate of dissociation, or both an increased rate of association and a decreased rate of dissociation. Examples of mutations believed to confer increased affinity for FcRn include, but are not limited to, T256A, T307A, E380A, and N434A (Shields et al., 2001, J. Biol. Chem. 276:6591).

Кроме того, по меньшей мере три гамма-рецепторов Fc человека, по-видимому, распознают сайт связывания на IgG в нижней шарнирной области, который, как правило, соответствует аминокислотам 234-237. Таким образом, еще один пример новых функциональных возможностей и потенциального снижения иммуногенности может возникнуть из-за мутаций в этой области, как, например, путем замены аминокислот 233-236 IgG1 человека ELLG в соответствующую последовательность из IgG2 PVA (с удалением одной аминокислоты). Как это было показано, что FcyRI, FcyRII, и FcyRIII, которые опосредуют различные эффекторные функции, не будут связываться с IgG1, когда введены такие мутации. Ward и Ghetie 1995 год, Therapeutic Immunology 2:77 и Armour et al., 1999 год, Eur. J. Immunol. 29:2613.In addition, at least three human Fc gamma receptors appear to recognize a binding site on IgG in the lower hinge region, which typically corresponds to amino acids 234-237. Thus, another example of new functionality and potential reduction in immunogenicity may arise from mutations in this region, such as by replacing amino acids 233-236 of human IgG1 ELLG with the corresponding sequence from IgG2 PVA (removing one amino acid). It has been shown that FcyRI, FcyRII, and FcyRIII, which mediate various effector functions, will not bind to IgG1 when such mutations are introduced. Ward and Ghetie 1995 Therapeutic Immunology 2:77 and Armor et al. 1999 Eur. J. Immunol. 29:2613.

В одном варианте реализации изобретения константной областью ИГ или ее частью, например, фрагмент Fc, является полипептид, включающий последовательность PKNSSMISNTP (SEQ ID NO: 89 или SEQ ID NO: 3 патента США № 5,739,277) и в некоторых случаях дополнительно включающий в себя последовательность, выбранную из HQLGTQ (SEQ ID NO: 90), HQNLSDGK (SEQ ID NO: 91), HQNTSDGK (SEQ ID NO: 92), или V1SSHLGQ (SEQ ID NO: 93) (или SEQ ID NO: 11, 1, 2 и 31, соответственно из патента США № 5,739,277).In one embodiment, the IG constant region or portion thereof, e.g., an Fc fragment, is a polypeptide comprising the sequence PKNSSMISNTP (SEQ ID NO: 89 or SEQ ID NO: 3 of US Pat. No. 5,739,277) and in some cases further including the sequence selected from HQLGTQ (SEQ ID NO: 90), HQNLSDGK (SEQ ID NO: 91), HQNTSDGK (SEQ ID NO: 92), or V1SSHLGQ (SEQ ID NO: 93) (or SEQ ID NO: 11, 1, 2 and 31, respectively from US patent No. 5,739,277).

В другом варианте реализации изобретения константная область иммуноглобулина или ее часть содержит аминокислотную последовательность в шарнирной области или ее части, которая образует одну или более дисульфидных связей с другой константной областью иммуноглобулина или ее частью. Дисульфидная связи константной области иммуноглобулина или ее части соединяет первый полипептид, содержащий FVIII и второй полипептид, содержащий фрагмент ФВ, таким образом, что эндогенный ФВ не заменяет фрагмент ФВ и не связывается с FVIII. Таким образом, дисульфидная связь между первой константной области иммуноглобулина или ее частью и константной областью второго иммуноглобулина или ее частью предотвращает взаимодействие между эндогенным ФВ и белком FVIII. Ингибирование взаимодействия между ФВ и белком FVIII позволяет в два раза увеличить лимит периода полувыведения химерного белка. Шарнирная область или ее часть может быть дополнительно связана с одним или более доменами CH1, CH2, CH3, их фрагментами, а также любыми их сочетаниями. В конкретном варианте реализации изобретения константной областью ИГ или ее частью является шарнирная область и домен CH2.In another embodiment, an immunoglobulin constant region or portion thereof comprises an amino acid sequence in a hinge region or portion thereof that forms one or more disulfide bonds with another immunoglobulin constant region or portion thereof. The disulfide bond of the immunoglobulin constant region or portion thereof connects the first polypeptide containing FVIII and the second polypeptide containing the VWF fragment such that endogenous VWF does not replace the VWF fragment and does not bind to FVIII. Thus, a disulfide bond between a first immunoglobulin constant region or portion thereof and a second immunoglobulin constant region or portion thereof prevents interaction between endogenous VWF and the FVIII protein. Inhibiting the interaction between VWF and the FVIII protein makes it possible to double the half-life limit of the chimeric protein. The hinge region or portion thereof may be further associated with one or more CH1, CH2, CH3 domains, fragments thereof, or any combination thereof. In a particular embodiment of the invention, the IG constant region or part thereof is a hinge region and a CH2 domain.

В некоторых вариантах реализации изобретения константная область ИГ или ее часть является геми-гликозилированной. Например, химерный белок, содержащий два фрагмента Fc или партнера по связыванию FcRn, может содержать первый гликозилированный фрагмент Fc (например, гликозилированную область CH2), или партнер по связыванию FcRn и второй агликозилированный фрагмент Fc (например, агликозилированная область CH2) или партнер по связыванию FcRn. В одном варианте реализации изобретения линкер может быть размещен между гликозилированными и агликозилированными фрагментами Fc. В другом варианте реализации изобретения фрагмент Fc или связывающий партнер FcRn полностью гликозилируется, т.е. все фрагменты Fc гликозилированы. В других вариантах реализации изобретения фрагмент Fc может быть агликозилированным, т.е. ни один из фрагментов Fc не гликозилирован.In some embodiments, the Ig constant region or portion thereof is hemi-glycosylated. For example, a chimeric protein containing two Fc fragments or an FcRn binding partner may comprise a first glycosylated Fc fragment (e.g., a CH2 glycosylated region) or FcRn binding partner and a second glycosylated Fc fragment (e.g., a CH2 glycosylated region) or binding partner FcRn. In one embodiment of the invention, the linker can be placed between glycosylated and aglycosylated Fc moieties. In another embodiment, the Fc fragment or FcRn binding partner is fully glycosylated, i.e. all Fc fragments are glycosylated. In other embodiments, the Fc fragment may be aglycosylated, i.e. none of the Fc fragments are glycosylated.

В некоторых вариантах реализации изобретения химерный белок по данному изобретению содержит аминокислотную замену в константной области ИГ или ее части (например, вариант Fc), которая изменяет антиген-независимые эффекторные функции константной области ИГ, в частности, период полувыведения белка из крови.In some embodiments, the chimeric protein of the present invention contains an amino acid substitution in the Ig constant region or a portion thereof (e.g., an Fc variant) that alters the antigen-independent effector functions of the Ig constant region, particularly the half-life of the protein from the blood.

Такие белки демонстрируют увеличенную или сниженную способность к связыванию с FcRn по сравнению с белками, в которых отсутствуют эти замены и, следовательно, имеют увеличенный илиSuch proteins exhibit increased or decreased ability to bind to FcRn compared to proteins that lack these substitutions and therefore have increased or

- 86 044115 уменьшенный период полувыведения в сыворотке крови, соответственно. Предполагается, что варианты Fc с улучшенной аффинностью к FcRn, имеют более продолжительный период полувыведения в сыворотке, и такие молекулы имеют полезное применение в способах лечения млекопитающих, когда желательным является продолжительный период полувыведения вводимого полипептида, например, для лечения хронического заболевания или расстройства (см., например, патенты США 7,348,004, 7,404,956 и 7,862,820). В отличие от этого, ожидается, что варианты Fc со сниженной аффинностью связывания с FcRn, имеют более короткие периоды полувыведения, и такие молекулы могут быть также использованы, например, для введения млекопитающему, когда сокращенное время пребывания в кровотоке может быть более предпочтительным, например, для диагностической визуализации в естественных условиях или в ситуациях, когда начальный полипептид имеет токсические побочные эффекты, если он присутствует в кровотоке в течение продолжительного периода времени. Также менее вероятной является способность вариантов Fc со сниженной аффинностью связывания с FcRn преодолевать плацентарный барьер и, таким образом, они также является полезными при лечении заболеваний или расстройств у беременных женщин. Кроме того, другие применения, в которых сниженная аффинность связывания с FcRn может быть необходимой, включают те применения, в которых необходима локализация в головном мозге, почках и/или печени. В одном типовом варианте реализации изобретения химерный белок по данному проявляет сниженную способность к прохождению через эпителий почечных клубочков из сосудистой системы. В другом варианте реализации изобретения химерный белок по данному изобретению проявляет сниженную способность к прохождению через гематоэнцефалический барьер (ГЭБ) из головного мозга в сосудистую систему. В одном варианте реализации изобретения белок с модифицированной способностью к связыванию с FcRn содержит по меньшей мере один фрагмент Fc или партнер по связыванию FcRn (например, один или два фрагмента Fc или партнера по связыванию FcRn), имеющий одну или более аминокислотных замен в пределах связывающей петли FcRn константной области ИГ. Связывающая петля FcRn состоит из аминокислотных остатков 280-299 (в соответствии с нумерацией EU) дикого типа, полноразмерного фрагмента Fc. В других вариантах реализации изобретения константная область ИГ или ее часть в химерном белке по данному изобретению, имеющая модифицированную аффинность связывания с FcRn содержит по меньшей мере один фрагмент Fc или связывающий партнер FcRn, имеющий одну или более аминокислотных замен в пределах 15 к зоны контакта FcRn. В данном контексте термин 15 к FcRn зона контакта включает остатки, занимающие следующие позиции в полноразмерном фрагменте Fc дикого типа: 243-261, 275-280, 282-293, 302-319, 336- 348, 367, 369, 372-389, 391, 393, 408, 424, 425-440 (нумерация EU). В других вариантах реализации изобретения константная область ИГ или ее часть по данному изобретению, имеющая модифицированную аффинность связывания с FcRn содержит по меньшей мере один фрагмент Fc или связывающий партнер FcRn, имеющий одну или более аминокислотных замен, соответствующих любой из следующих позиций EU: 256, 277-281, 283-288, 303-309, 313, 338, 342, 376, 381, 384, 385, 387, 434 (например, N434A или N434K), и 438. Типичные замены аминокислот, которые модифицируют связывающую активность с FcRn, описаны в международной публикации PCT № 05/047327, которая в полном объеме включена в данный документ посредством ссылки.- 86 044115 reduced half-life in serum, respectively. Fc variants with improved affinity for FcRn are expected to have a longer half-life in serum, and such molecules have useful applications in mammalian treatments where a long half-life of the administered polypeptide is desired, for example, for the treatment of a chronic disease or disorder (see eg US Patents 7,348,004, 7,404,956 and 7,862,820). In contrast, Fc variants with reduced binding affinity to FcRn are expected to have shorter half-lives and such molecules may also be used, for example, for administration to a mammal where a reduced residence time in the bloodstream may be more advantageous, e.g. for diagnostic imaging in vivo or in situations where the initial polypeptide has toxic side effects if present in the bloodstream for an extended period of time. Also less likely are Fc variants with reduced binding affinity to FcRn to cross the placental barrier and thus also be useful in the treatment of diseases or disorders in pregnant women. Additionally, other applications in which reduced binding affinity to FcRn may be necessary include those applications in which localization to the brain, kidney and/or liver is required. In one exemplary embodiment of the invention, the chimeric protein herein exhibits a reduced ability to pass through the glomerular epithelium from the vascular system. In another embodiment, the chimeric protein of the invention exhibits a reduced ability to cross the blood-brain barrier (BBB) from the brain into the vasculature. In one embodiment, the protein with modified FcRn binding ability comprises at least one Fc fragment or FcRn binding partner (e.g., one or two Fc fragments or FcRn binding partner) having one or more amino acid substitutions within the binding loop FcRn constant region of IG. The FcRn binding loop consists of amino acid residues 280-299 (according to EU numbering) of the wild type, full-length Fc fragment. In other embodiments, an IG constant region or portion thereof in a chimeric protein of the invention having a modified FcRn binding affinity comprises at least one Fc fragment or FcRn binding partner having one or more amino acid substitutions within 15 k of the FcRn contact region. In this context, the term 15 to FcRn contact zone includes residues occupying the following positions in the full-length wild-type Fc fragment: 243-261, 275-280, 282-293, 302-319, 336-348, 367, 369, 372-389, 391, 393, 408, 424, 425-440 (EU numbering). In other embodiments, an Ig constant region or portion thereof of the invention having a modified FcRn binding affinity comprises at least one Fc fragment or FcRn binding partner having one or more amino acid substitutions corresponding to any of the following EU positions: 256, 277 -281, 283-288, 303-309, 313, 338, 342, 376, 381, 384, 385, 387, 434 (eg, N434A or N434K), and 438. Typical amino acid substitutions that modify FcRn binding activity are are described in PCT International Publication No. 05/047327, which is incorporated herein by reference in its entirety.

Фрагмент Fc или партнер по связыванию FcRn, используемый по данному изобретению, может также содержать известную в данной области техники аминокислотную замену, которая изменяет уровень гликозилирование химерного белка. Например, фрагмент Fc или партнер по связывания FcRn химерного белка, связанный с фрагментом ФВ или белком FVIII, может содержать фрагмент Fc, имеющий мутацию, что приводит к снижению уровня гликозилирования (например, N- или О-связанное гликозилирование) или может содержать модифицированную гликоформу фрагмента Fc дикого типа (например, низкий уровень фукозы или фукозо-свободного гликана).The Fc fragment or FcRn binding partner used in this invention may also contain an amino acid substitution known in the art that alters the level of glycosylation of the chimeric protein. For example, an Fc fragment or FcRn binding partner of a chimeric protein linked to a VWF fragment or an FVIII protein may contain an Fc fragment that has a mutation that results in reduced levels of glycosylation (eg, N- or O-linked glycosylation) or may contain a modified glycoform wild-type Fc fragment (eg, low fucose or fucose-free glycan).

В одном варианте реализации изобретения непроцессированный химерный белок по данному изобретению может содержать генетически слитый фрагмент Fc (например, фрагмент scFc), имеющих в его составе две или более константные области ИГ или ее части, независимо выбираемыми из константной области ИГ или ее части, описанной в данном документе. В одном варианте реализации изобретения фрагменты Fc димерных фрагментов Fc являются одним и тем же. В другом варианте реализации изобретения по меньшей мере два фрагмента Fc являются различными. Например, фрагмент Fc или партнер по связывания FcRn белков по данному изобретению содержат одинаковое количество аминокислотных остатков, или они могут отличаться по длине одного или более аминокислотных остатков (например, около 5 аминокислотных остатков (например, 1, 2, 3, 4 или 5 аминокислотных остатков), около 10 остатков, около 15 остатков, около 20 остатков, около 30 остатков, около 40 остатков или около 50 остатков). В еще одних вариантах реализации изобретения фрагмент Fc или партнер по связыванию FcRn по данному изобретению могут отличаться по одной или более позиции в аминокислотной последовательности. Например, по меньшей мере, два из фрагмента Fc или партнера по связыванию FcRn могут отличаться по около 5 аминокислотным позициям (например, 1, 2, 3, 4 или 5 аминокислотным позициям), около 10 позициям, около 15 позициям, около 20 позициям, около 30 позициям, около 40 позициям или около 50 позициям).In one embodiment, the full-length chimeric protein of the present invention may comprise a genetically fused Fc fragment (e.g., an scFc fragment) having two or more IG constant regions or portions thereof independently selected from the IG constant region or portion thereof described in this document. In one embodiment of the invention, the Fc fragments of the dimeric Fc fragments are the same. In another embodiment of the invention, at least two Fc fragments are different. For example, the Fc fragment or FcRn binding partner of the proteins of the present invention contain the same number of amino acid residues, or they may differ in the length of one or more amino acid residues (e.g., about 5 amino acid residues (e.g., 1, 2, 3, 4, or 5 amino acid residues) residues), about 10 residues, about 15 residues, about 20 residues, about 30 residues, about 40 residues or about 50 residues). In yet other embodiments, the Fc fragment or FcRn binding partner of the invention may differ at one or more positions in the amino acid sequence. For example, at least two of the Fc fragment or FcRn binding partner may differ at about 5 amino acid positions (e.g., 1, 2, 3, 4, or 5 amino acid positions), about 10 positions, about 15 positions, about 20 positions, about 30 positions, about 40 positions or about 50 positions).

- 87 044115- 87 044115

II. E. Линкеры.II. E. Linkers.

Химерный белок по данному изобретению дополнительно содержит один или более линкеров. Одним типом линкеров является расщепляемый линкер, который может быть расщеплен с помощью различных протеаз при введении субъекту в естественных условиях, например, в сайте коагуляции. В одном варианте реализации изобретения расщепляемый линкер позволяет отщепить фрагмент, например, белок ФВ, от последовательности XTEN, следовательно, от химерного белка в месте коагуляционного каскада, позволяя тем самым активированному FVIII (FVIIIa) проявлять свою FVIIIa активность. Другой тип линкера представляет собой процессируемый линкер, который содержит внутриклеточный сайт расщепления и, таким образом, может быть расщеплен с помощью процессингового внутриклеточного фермента в клетке-хозяине, что делает удобным процесс экспрессии полипептида и образование химерного белка.The chimeric protein of this invention further contains one or more linkers. One type of linker is a cleavable linker, which can be cleaved by various proteases when administered to a subject in vivo, for example, at a coagulation site. In one embodiment, the cleavable linker allows a fragment, for example a VWF protein, to be cleaved from the XTEN sequence, hence the chimeric protein, at the site of the coagulation cascade, thereby allowing activated FVIII (FVIIIa) to exhibit its FVIIIa activity. Another type of linker is a processable linker that contains an intracellular cleavage site and thus can be cleaved by an intracellular processing enzyme in a host cell, thereby facilitating expression of the polypeptide and formation of the chimeric protein.

Один или более линкеров могут находиться между любыми двумя белками в химерном белке. В одном варианте реализации изобретения химерный белок содержит первый полипептид, содержащий (I) белок FVIII и (II) первую константную область ИГ или ее часть и второй полипептид, содержащий (III) белок ФВ, (IV) линкер (например, расщепляемый линкер), (V) последовательность XTEN, и (VI) вторую константную область ИГ или ее часть. В другом варианте реализации изобретения химерный белок содержит первый полипептид, содержащий (I) белок FVIII и (II) первую константную область ИГ или ее часть и второй полипептид, содержащий (III) белок ФВ, (IV) последовательность XTEN, (V) линкер (например, расщепляемый линкер) и (VI) вторую константную область ИГ или ее часть. В других вариантах реализации изобретения химерный белок содержит первый полипептид, содержащий (I) белок FVIII и (II) первую константную область ИГ или ее часть и второй полипептид, содержащий (III) белок ФВ, (IV) первый линкер (например, расщепляемый линкер), (V) последовательность XTEN, (VI) второй линкер (например, расщепляемый линкер) и (VII) вторую константную область ИГ или ее часть. В определенных вариантах реализации изобретения первый полипептид дополнительно содержит линкер, например, расщепляемый линкер между белком FVIII и первой константной областью ИГ.One or more linkers may be present between any two proteins in a chimeric protein. In one embodiment, the chimeric protein comprises a first polypeptide comprising (I) an FVIII protein and (II) a first IG constant region or portion thereof, and a second polypeptide comprising (III) an FVIII protein, (IV) a linker (e.g., a cleavable linker), (V) an XTEN sequence, and (VI) a second IG constant region or portion thereof. In another embodiment, the chimeric protein comprises a first polypeptide comprising (I) an FVIII protein and (II) a first IG constant region or portion thereof, and a second polypeptide comprising (III) a VWF protein, (IV) an XTEN sequence, (V) a linker ( for example, a cleavable linker) and (VI) a second IG constant region or part thereof. In other embodiments, the chimeric protein comprises a first polypeptide comprising (I) an FVIII protein and (II) a first IG constant region or portion thereof, and a second polypeptide comprising (III) an FVIII protein, (IV) a first linker (e.g., a cleavable linker) , (V) an XTEN sequence, (VI) a second linker (eg, a cleavable linker), and (VII) a second IG constant region or portion thereof. In certain embodiments, the first polypeptide further comprises a linker, for example, a cleavable linker between the FVIII protein and the first IG constant region.

В некоторых вариантах реализации изобретения химерный белок содержит одну цепь, содержащую (I) белок FVIII, (II) первую константную область ИГ или ее часть, (III) линкер (например, процессируемый линкер), (IV) белок ФВ, (V) последовательность XTEN и (VI) вторую константную область ИГ или ее часть. В других вариантах реализации изобретения химерный белок содержит одну цепь, содержащую (I) белок FVIII, (II) первую константную область ИГ или ее часть, (III) первый линкер (например, процессируемый линкер), (IV) белок ФВ, (V) второй линкер (например, расщепляемый линкер), (VI) последовательность XTEN и (VII) вторую константную область ИГ или ее часть. Процессируемый линкер может быть процессирован после того, как химерный белок экспрессируется в клетке-хозяине; таким образом, химерный белок, продуцируемый в клетке-хозяине, может быть в окончательной форме, состоящей из двух или трех полипептидных цепей.In some embodiments, the chimeric protein comprises a single chain comprising (I) an FVIII protein, (II) a first IG constant region or portion thereof, (III) a linker (e.g., a processable linker), (IV) a VWF protein, (V) a sequence XTEN and (VI) the second constant region of the IG or part thereof. In other embodiments, the chimeric protein comprises a single chain comprising (I) an FVIII protein, (II) a first IG constant region or portion thereof, (III) a first linker (e.g., a processable linker), (IV) a VWF protein, (V) a second linker (eg, a cleavable linker), (VI) an XTEN sequence, and (VII) a second IG constant region or portion thereof. The processable linker can be processed after the chimeric protein is expressed in the host cell; thus, the chimeric protein produced in the host cell may be in a final form consisting of two or three polypeptide chains.

Линкер, пригодный к использованию в настоящем изобретении, может содержать органическую молекулу. В одном варианте реализации изобретения линкер содержит полимер, например, полиэтиленгликоль (ПЭГ) или гидроксиэтилкрахмал (ГЕК). В другом варианте реализации изобретения линкер содержит аминокислотную последовательность. Линкер может содержать по меньшей мере около 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 300, 400 ,500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400, 1500, 1600, 1700, 1800, 1900 или 2000 аминокислот. Линкер может содержать 1-5 аминокислот, 1-10 аминокислот, 1-20 аминокислот, 10-50 аминокислот, 50-100 аминокислот, 100-200 аминокислот, 200-300 аминокислот, 300-400 аминокислот, 400-500 аминокислот, 500-600 аминокислот, 600-700 аминокислот, 700-800 аминокислот, 800-900 аминокислот или 900-1000 аминокислот. В одном варианте реализации изобретения линкер содержит последовательность XTEN. Дополнительные примеры последовательностей XTEN могут быть использованы по данному изобретению и раскрыты в патентных публикациях США № 2010/0239554 A1, 2010/0323956 A1, 2011/0046060 A1, 2011/0046061 A1, 2011/0077199 A1 или 2011/0172146 A1, или международных патентных публикациях № WO 2010091122 Al, WO 2010144502 А2, WO 2010144508 A1, WO 2011028228 A1, WO 2011028229 A1, или WO 2011028344 А2. В другом варианте реализации изобретения линкер является последовательностью PAS.A linker useful in the present invention may comprise an organic molecule. In one embodiment of the invention, the linker contains a polymer, for example, polyethylene glycol (PEG) or hydroxyethyl starch (HES). In another embodiment of the invention, the linker comprises an amino acid sequence. The linker may contain at least about 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1100, 1200 , 1300, 1400, 1500, 1600, 1700, 1800, 1900 or 2000 amino acids. The linker may contain 1-5 amino acids, 1-10 amino acids, 1-20 amino acids, 10-50 amino acids, 50-100 amino acids, 100-200 amino acids, 200-300 amino acids, 300-400 amino acids, 400-500 amino acids, 500- 600 amino acids, 600-700 amino acids, 700-800 amino acids, 800-900 amino acids or 900-1000 amino acids. In one embodiment of the invention, the linker contains the sequence XTEN. Additional examples of XTEN sequences may be used herein and are disclosed in US Patent Publication No. 2010/0239554 A1, 2010/0323956 A1, 2011/0046060 A1, 2011/0046061 A1, 2011/0077199 A1 or 2011/0172146 A1, or international patent publications No. WO 2010091122 Al, WO 2010144502 A2, WO 2010144508 A1, WO 2011028228 A1, WO 2011028229 A1, or WO 2011028344 A2. In another embodiment of the invention, the linker is a PAS sequence.

В одном варианте реализации изобретения линкер является полимером, например, полиэтиленгликолем (ПЭГ) или гидроксиэтилкрахмалом (ГЕК). В другом варианте реализации изобретения линкер является аминокислотной последовательностью. Линкер может содержать по меньшей мере около 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 300, 400 ,500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400, 1500, 1600, 1700, 1800, 1900 или 2000 аминокислот. Линкер может содержать 1-5 аминокислот, 1-10 аминокислот, 1-20 аминокислот, 10-50 аминокислот, 50-100 аминокислот, 100-200 аминокислот, 200-300 аминокислот, 300-400 аминокислот, 400-500 аминокислот, 500-600 аминокислот, 600-700 аминокислот, 700-800 аминокислот, 800-900 аминокислот или 900-1000 аминокислот.In one embodiment of the invention, the linker is a polymer, for example, polyethylene glycol (PEG) or hydroxyethyl starch (HES). In another embodiment of the invention, the linker is an amino acid sequence. The linker may contain at least about 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1100, 1200 , 1300, 1400, 1500, 1600, 1700, 1800, 1900 or 2000 amino acids. The linker may contain 1-5 amino acids, 1-10 amino acids, 1-20 amino acids, 10-50 amino acids, 50-100 amino acids, 100-200 amino acids, 200-300 amino acids, 300-400 amino acids, 400-500 amino acids, 500- 600 amino acids, 600-700 amino acids, 700-800 amino acids, 800-900 amino acids or 900-1000 amino acids.

Примеры линкеров хорошо известны в данной области техники. В одном варианте реализации изобретения линкер содержит последовательность Gn. Линкер может содержать последовательность (GA)n. Линкер может содержать последовательность (GGS)n. В других вариантах реализации изобретения линкер содержит (GGGS)n (SEQ ID NO: 101). В еще одних вариантах реализации изобретения линкер содержит последовательность (GGS)n(GGGGS)n (SEQ ID NO: 95). В этих случаях n может быть целым числомExamples of linkers are well known in the art. In one embodiment of the invention, the linker comprises a G n sequence. The linker may contain the sequence (GA) n . The linker may contain the sequence (GGS) n . In other embodiments, the linker contains (GGGS) n (SEQ ID NO: 101). In yet other embodiments, the linker comprises the sequence (GGS) n (GGGGS) n (SEQ ID NO: 95). In these cases n can be an integer

- 88 044115 от 1 до 100. В других случаях n может быть целым числом от 1 до 20, например, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10,- 88 044115 from 1 to 100. In other cases, n can be an integer from 1 to 20, for example, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10,

11, 12, 13, 14, 15, 16, 17, 18, 19 или 20. Примеры линкеров включают, но не ограничиваются ими,11, 12, 13, 14, 15, 16, 17, 18, 19 or 20. Examples of linkers include, but are not limited to,

GGG, SGGSGGS (SEQ Ш NO: 96),GGG, SGGSGGS (SEQ Ш NO: 96),

GGSGGSGGSGGSGGG (SEQ ID NO: 97), GGSGGSGGGGSGGGGS (SEQ ID NO: 98), GGSGGSGGSGGSGGSGGS (SEQ ID NO: 99), или GGGGSGGGGSGGGGS (SEQ ID NO: 100).GGSGGSGGSGGSGGG (SEQ ID NO: 97), GGSGGSGGGGSGGGGS (SEQ ID NO: 98), GGSGGSGGSGGSGGSGGS (SEQ ID NO: 99), or GGGGSGGGGSGGGGS (SEQ ID NO: 100).

Линкер не устраняет или не уменьшает активность белка ФВ или свертывающую активность фактора VIII. В некоторых случаях линкер повышает активность белка ФВ или свертывающую активность белка фактора VIII, например, за счет дополнительного уменьшения эффекта стерического несоответствия и делает белок ФВ или часть фактора VIII более доступными для их целевого сайта связывания.The linker does not eliminate or reduce VWF protein activity or factor VIII coagulation activity. In some cases, the linker increases the activity of the VWF protein or the coagulation activity of the factor VIII protein, for example, by further reducing the effect of steric mismatch and makes the VWF protein or part of the factor VIII more accessible to its target binding site.

В одном варианте реализации изобретения линкер, полезный для химерного белка, имеет длину 1525 аминокислот. В другом варианте реализации изобретения линкер, полезный для химерного белка, имеет длину 15-20 аминокислот. В некоторых вариантах реализации изобретения линкер для химерного белка имеет длину 10-25 аминокислот. В другом варианте реализации изобретения линкер для химерного белка имеет длину 15 аминокислот. В еще одних вариантах реализации изобретения линкер для химерного белка является (GGGGS)n (SEQ ID NO: 94) где G представляет собой глицин, S представляет собой серии и N представляет собой целое число от 1 до 20.In one embodiment of the invention, the linker useful for the chimeric protein is 1525 amino acids in length. In another embodiment of the invention, the linker useful for the chimeric protein is 15-20 amino acids in length. In some embodiments, the linker for the chimeric protein is 10-25 amino acids in length. In another embodiment, the linker for the chimeric protein is 15 amino acids in length. In yet other embodiments, the linker for the chimeric protein is (GGGGS) n (SEQ ID NO: 94) wherein G is glycine, S is series, and N is an integer from 1 to 20.

II. F. Сайты расщепленияII. F. Cleavage Sites

Расщепляемые линкеры могут включать в себя фрагмент, способный отщепляться либо химически (например, гидролиз эфирной связи), ферментативно (т.е. включение последовательности для расщепления протеазой) или фотолитически (например, хромофор, такой как 3-амино-3-(2-нитрофенил) пропионовая кислота (ANP)) для того, чтобы освободить одну молекула от другой.Cleavable linkers may include a moiety capable of being cleaved either chemically (eg, hydrolysis of an ester bond), enzymatically (eg, inclusion of a sequence for protease cleavage), or photolytically (eg, a chromophore such as 3-amino-3-(2- nitrophenyl) propionic acid (ANP)) in order to free one molecule from the other.

В одном варианте реализации изобретения расщепляемый линкер содержит один или более расщепляемых сайтов на N-конце или С-конце, или обоих. В другом варианте реализации расщепляемый линкер по существу состоит или состоит из одного или более расщепляемых сайтов. В других вариантах реализации изобретения линкер содержит гетерологические линкерные аминокислотные последовательности, описанные в данном документе, или полимеры, и один или более расщепляемых сайтов.In one embodiment of the invention, the cleavable linker contains one or more cleavage sites at the N-terminus or the C-terminus, or both. In another embodiment, the cleavable linker is substantially composed of or consists of one or more cleavable sites. In other embodiments, the linker comprises heterologous linker amino acid sequences described herein, or polymers, and one or more cleavage sites.

В некоторых вариантах реализации изобретения расщепляемый линкер содержит один или более сайтов расщепления, которые могут быть расщеплены в клетке-хозяине (т.е. внутриклеточные процессинговые сайты). Неограничивающие примеры сайтов расщепления включают: RRRR (SEQ ID NO: 102), RKRRKR (SEQ ID NO: ЮЗ) и RRRRS (SEQ ID NO: 104).In some embodiments, the cleavable linker contains one or more cleavage sites that can be cleaved in the host cell (ie, intracellular processing sites). Non-limiting examples of cleavage sites include: RRRR (SEQ ID NO: 102), RKRRKR (SEQ ID NO: SW) and RRRRS (SEQ ID NO: 104).

В некоторых вариантах реализации изобретения расщепляемый линкер содержит область a1 FVIII, область а2 FVIII, область a3 FVIII, сайт расщепления тромбином, который содержит X-V-P-R (SEQ ID NO: 105) и мотив взаимодействия с экзосайтом PAR1, в котором X представляет собой алифатическую аминокислоту или любые их комбинации, содержит область а2, содержащую аминокислотную последовательность, по меньшей мере около на 80%, около на 85%, около на 90%, около на 95% или на 100% идентичную последовательности от Glu720 до Arg740, соответствующего полноразмерного FVIII, в котором область а2 способна расщепляться тромбином. В конкретном варианте реализации изобретения расщепляемый линкер, полезный по данному изобретению, содержит две области а2, содержащие ISDKNTGDYYEDSYEDISAYLLSKNNAIEPRSFS (SEQ ID NO: 106).In some embodiments, the cleavable linker comprises a FVIII a1 region, a FVIII a2 region, a FVIII a3 region, a thrombin cleavage site that contains X-V-P-R (SEQ ID NO: 105), and a PAR1 exosite interaction motif in which X is an aliphatic amino acid or any combinations thereof, contains an a2 region containing an amino acid sequence at least about 80%, about 85%, about 90%, about 95%, or 100% identical to the sequence Glu720 to Arg740 corresponding to full-length FVIII, in which region a2 is capable of being cleaved by thrombin. In a specific embodiment, the cleavable linker useful in this invention contains two a2 regions containing ISDKNTGDYYEDSYEDISAYLLSKNNAIEPRSFS (SEQ ID NO: 106).

В других вариантах реализации изобретения расщепляемый линкер по данному изобретению содержит область a1, содержащую аминокислотную последовательность, по меньшей мере около на 80%, около на 85%, около на 90%, около на 95% или на 100% идентичную последовательности от Met337 до Arg372, соответствующего полноразмерного FVIII, в котором область a1 способна расщепляться тромбином. В конкретном варианте реализации изобретения область a1, содержит ISMKNNEEAEDYDDDLTDSEMDVVRFDDDNSPSFIQIRSV (SEQ ID NO: 107).In other embodiments, the cleavable linker of the invention comprises an a1 region comprising an amino acid sequence that is at least about 80%, about 85%, about 90%, about 95%, or 100% identical to the sequence from Met337 to Arg372 , corresponding to full-length FVIII, in which the a1 region is capable of being cleaved by thrombin. In a specific embodiment of the invention, region a1 contains ISMKNNEEAEDYDDDLTDSEMDVVRFDDDNSPSFIQIRSV (SEQ ID NO: 107).

В некоторых вариантах реализации изобретения расщепляемый линкер по данному изобретению содержит область а3, содержащую аминокислотную последовательность, по меньшей мере около на 80%, около на 85%, около на 90%, около на 95% или на 100% идентичную последовательности от Glu1649 до Arg1689, соответствующего полноразмерного FVIII, в котором область a3 способна расщепляться тромбином. В конкретном варианте реализации изобретения расщепляемый линкер, полезный по данному изобретению, содержит две области а3, содержащиеIn some embodiments, the cleavable linker of the invention comprises an a3 region comprising an amino acid sequence that is at least about 80%, about 85%, about 90%, about 95%, or 100% identical to the sequence from Glu1649 to Arg1689 , corresponding to full-length FVIII, in which the a3 region is capable of being cleaved by thrombin. In a specific embodiment of the invention, the cleavable linker useful in this invention contains two a3 regions containing

ISDKNTGDYYEDSYEDISAYLLSKNNAIEPRSFS (SEQ ID NO: 108).ISDKNTGDYYEDSYEDISAYLLSKNNAIEPRSFS (SEQ ID NO: 108).

В других вариантах реализации изобретения расщепляемый линкер содержит сайт расщепления тромбином, содержащий X-V-P-R (SEQ ID NO: 105) и мотив взаимодействия с экзосайтом PAR1, в котором мотив взаимодействия с экзосайтом PAR1 содержит S-F-L-L-R-N (SEQ ID NO: 109). Мотив взаимодействия с экзосайтом PAR1 может дополнительно содержать аминокислотную последовательность, выбранную изIn other embodiments, the cleavable linker comprises a thrombin cleavage site containing X-V-P-R (SEQ ID NO: 105) and a PAR1 exosite interaction motif, wherein the PAR1 exosite interaction motif contains S-F-L-L-R-N (SEQ ID NO: 109). The PAR1 exosite interaction motif may further comprise an amino acid sequence selected from

- 89 044115- 89 044115

Ρ,Ρ,

Ρ-Ν, P-N-D, P-N-D-K (SEQ ID NO: 110), P-N-D-K-Y (SEQ ID NO: 111), P-N-D-K-Y-E (SEQ ID NO: 112), P-N-D-K-Y-E-P (SEQ ID NO: 113), P-N-D-K-Y-E-P-F (SEQ ID NO: 114), P-ND-K-Y-E-P-F-W (SEQ ID NO: 115), P-N-D-K-Y-E-P-F-W-E (SEQ ID NO: 116), P-N-D-K-YE-P-F-W-E-D (SEQ ID NO: 117), P-N-D-K-Y-E-P-F-W-E-D-E (SEQ ID NO: 118), P-N-D-KY-E-P-F-W-E-D-E-E (SEQ ID NO: 119), P-N-D-K-Y-E-P-F-W-E-D-E-E-S (SEQ ID NO: 120) или любых их комбинации. В некоторых вариантах реалзизации изобретения алифатическая аминокислота выбирается из глицина, аланина, валина, лейцина или изолейцина.P-N, P-N-D, P-N-D-K (SEQ ID NO: 110), P-N-D-K-Y (SEQ ID NO: 111), P-N-D-K-Y-E (SEQ ID NO: 112), P-N-D-K-Y-E-P (SEQ ID NO: 113), P-N-D-K-Y-E-P-F (SEQ ID NO: 114 ) , P-ND-K-Y-E-P-F-W (SEQ ID NO: 115), P-N-D-K-Y-E-P-F-W-E (SEQ ID NO: 116), P-N-D-K-YE-P-F-W-E-D (SEQ ID NO: 117), P-N-D-K-Y-E-P-F-W-E-D-E (SEQ ID NO: 118 ), P-N-D-KY-E-P-F-W-E-D-E-E (SEQ ID NO: 119), P-N-D-K-Y-E-P-F-W-E-D-E-E-S (SEQ ID NO: 120) or any combination thereof. In some embodiments, the aliphatic amino acid is selected from glycine, alanine, valine, leucine, or isoleucine.

В других вариантах реализации изобретения расщепляемый линкер содержит один или более сайтов расщепления, которые расщепляются посредством протеазы, после того, как химерный белок, содержащий расщепляемый линкер, вводят субъекту. В одном варианте реализации изобретения сайт расщепления поддается расщеплению протеазой, выбранной из гурппы, содержащей фактор XIa, фактор XIIa, калликреин, фактор VIIa, фактор IXa, фактор Ха, фактор IIa (тромбин), эластазу 2, ММР-12, ММР13, ММР-17 и ММР-20. В другом варианте реализации изобретения сайт расщепления выбирается из группы, содержащей сайт расщепления FXIa (например, KLTR^AET (SEQ ID NO: 121)), сайт расщепления FXIa (например, DFTR^VVG (SEQ ID NO: 122)), сайт расщепления FXIIa (например, TMTR^IVGG (SEQ ID NO: 123)), сайт расщепления калликреином (например, SPFR^STGG (SEQ ID NO: 124)), сайт расщепления FVIIa (например, LQVR^IVGG (SEQ ID NO: 125)), сайт расщепления FIXa (например, PLGR^IVGG (SEQ ID NO: 126)), сайт расщепления FXa (например, IEGR^TVGG (SEQ ID NO: 127)), сайт расщепления FIIa (тромбином) сайт расщепления (например, LTPR^SLLV (SEQ ID NO: 128)), сайт расщепления еластазой 2 (например, LGPVkSGVP (SEQ ID NO: 129)), сайт расщепления гранзимом В (например, VAGD^SLEE (SEQ ID NO: 130)), сайт расщепления ММР-12 (например, GPAG^LGGA (SEQ ID NO: 131)), сайт расщепления ММР-13 (например, GPAG^LRGA (SEQ ID NO: 132)), сайт расщепления ММР-17 (например, APLG^LRLR (SEQ ID NO: 133)), сайт расщепления ММР-20 (например, PALP^LVAQ (SEQ ID NO: 134)), сайт расщепления TEV (например, ENLYFQ^G (SEQ ID NO: 135)), сайт расщепления энтерокиназой (например, DDDK^IVGG (SEQ ID NO: 136)), сайт расщепления (PRESCISSION™) протеазой 3С (например, LEVLFQ^GP (SEQ ID NO: 137)), и сайт расщепления сортазой А (например, LPKT^GSES) (SEQ ID NO: 138). В некоторых вариантах реализации изобретения сайт расщепления FXIa включает, но не ограничивается ими, например, TQSFNDFTR (SEQ ID NO: 1) или SVSQTSKLTR (SEQ ID NO: 3).In other embodiments, the cleavable linker contains one or more cleavage sites that are cleaved by a protease after the chimeric protein containing the cleavable linker is administered to a subject. In one embodiment, the cleavage site is cleavable by a protease selected from the group consisting of factor XIa, factor XIIa, kallikrein, factor VIIa, factor IXa, factor Xa, factor IIa (thrombin), elastase 2, MMP-12, MMP13, MMP- 17 and MMR-20. In another embodiment of the invention, the cleavage site is selected from the group consisting of an FXIa cleavage site (e.g., KLTR^AET (SEQ ID NO: 121)), an FXIa cleavage site (e.g., DFTR^VVG (SEQ ID NO: 122)), a cleavage site FXIIa (e.g., TMTR^IVGG (SEQ ID NO: 123)), kallikrein cleavage site (e.g., SPFR^STGG (SEQ ID NO: 124)), FVIIa cleavage site (e.g., LQVR^IVGG (SEQ ID NO: 125) ), FIXa cleavage site (e.g. PLGR^IVGG (SEQ ID NO: 126)), FXa cleavage site (e.g. IEGR^TVGG (SEQ ID NO: 127)), FIIa (thrombin) cleavage site (e.g. LTPR ^SLLV (SEQ ID NO: 128)), elastase 2 cleavage site (e.g. LGPVkSGVP (SEQ ID NO: 129)), granzyme B cleavage site (e.g. VAGD^SLEE (SEQ ID NO: 130)), MMP cleavage site -12 (e.g., GPAG^LGGA (SEQ ID NO: 131)), MMP-13 cleavage site (e.g., GPAG^LRGA (SEQ ID NO: 132)), MMP-17 cleavage site (e.g., APLG^LRLR (SEQ ID NO: 133)), MMP-20 cleavage site (e.g., PALP^LVAQ (SEQ ID NO: 134)), TEV cleavage site (e.g., ENLYFQ^G (SEQ ID NO: 135)), enterokinase cleavage site (e.g. , DDDK^IVGG (SEQ ID NO: 136)), a 3C protease cleavage site (PRESCISSION™) (e.g., LEVLFQ^GP (SEQ ID NO: 137)), and a sortase A cleavage site (e.g., LPKT^GSES) (SEQ ID NO: 138). In some embodiments, the FXIa cleavage site includes, but is not limited to, TQSFNDFTR (SEQ ID NO: 1) or SVSQTSKLTR (SEQ ID NO: 3).

Неограничивающие примеры сайтов расщепления тромбином включают, например, DFLAEGGGVR (SEQ IDNon-limiting examples of thrombin cleavage sites include, for example, DFLAEGGGVR (SEQ ID

NO: 4), TTKIKPR (SEQ ID NO: 5), LVPRG (SEQ ID NO: 6), DKNTGDYYEDSYEDISAYLLSKNNAIEPRSFS (SEQ ID NO: 88), или IEPRSFS (SEQ ID NO: 194) и последовательность, содержащую, по существу состоящую из или состоящую из ALRPR (SEQ ID NO: 7) (например, ALRPRVVGGA (SEQ ID NO: 145)). В типовых вариантах реализации изобретения сайтом расщепления является последовательностьNO: 4), TTKIKPR (SEQ ID NO: 5), LVPRG (SEQ ID NO: 6), DKNTGDYYEDSYEDISAYLLSKNNAIEPRSFS (SEQ ID NO: 88), or IEPRSFS (SEQ ID NO: 194) and a sequence comprising essentially consisting of or consisting of ALRPR (SEQ ID NO: 7) (for example, ALRPRVVGGA (SEQ ID NO: 145)). In exemplary embodiments of the invention, the cleavage site is the sequence

TLDPRSFLLRNPNDKYEPFWEDEEK (SEQ ID NO: 146). в другом варианте реализации изобретения сайт расщепления содержитTLDPRSFLLRNPNDKYEPFWEDEEK (SEQ ID NO: 146). in another embodiment of the invention, the cleavage site contains

DKNTGDYYEDSYEDISAYLLSKNNAIEPRSFS (SEQ ГО NO: 88) или ее фрагмент. В одном конкретном варианте реализации изобретения сайт расщепления содержит IEPRSFS (SEQ ID NO: 194). в другом варианте реализации изобретения сайт расщепления содержит EPRSFS (SEQ ID NO: 195), причем сайт расщепления не представляет собой полноразмерную область а2 белка FVIII. В еще одном варианте реализации изобретения сайт расщепления содержит IEPR (SEQ ID NO: 200). В другом варианте реализации изобретения сайт расщепления содержит IEPR (SEQ ID NO: 200), причем сайт расщепления не представляет собой полноразмерную область а2 белка FVIII или не содержит полноразмерную область а2 FVIII. В других вариантах реализации изобретения сайт расщепления содержитDKNTGDYYEDSYEDISAYLLSKNNAIEPRSFS (SEQ GO NO: 88) or a fragment thereof. In one particular embodiment of the invention, the cleavage site comprises IEPRSFS (SEQ ID NO: 194). in another embodiment, the cleavage site comprises EPRSFS (SEQ ID NO: 195), and the cleavage site is not the full-length a2 region of the FVIII protein. In yet another embodiment, the cleavage site comprises an IEPR (SEQ ID NO: 200). In another embodiment, the cleavage site comprises an IEPR (SEQ ID NO: 200), wherein the cleavage site is not a full-length a2 region of the FVIII protein or does not contain a full-length a2 region of FVIII. In other embodiments, the cleavage site comprises

- 90 044115- 90 044115

DKNTGDYYED SYEDISAYLLSKNNAIEPRSFS (SEQ ГО NODKNTGDYYED SYEDISAYLLSKNNAIEPRSFS (SEQ GO NO

88), KNTGDYYEDSYEDISAYLLSKNNAIEPRSFS 88), KNTGDYYEDSYEDISAYLLSKNNAIEPRSFS (SEQ (SEQ ID NO: ID NO: 139), 139), NTGDYYEDSYEDISAYLLS KNNAIEPRSFS NTGDYYEDSYEDISAYLLS KNNAIEPRSFS (SEQ (SEQ ID ID NO: NO: 140), 140), TGDYYEDSYEDISAYLLS KNNAIEPRSFS TGDYYEDSYEDISAYLLS KNNAIEPRSFS (SEQ (SEQ ID ID NO: NO: 141), 141), GDYYEDSYEDISAYLLS KNNAIEPRSFS GDYYEDSYEDISAYLLS KNNAIEPRSFS (SEQ (SEQ ID ID NO: NO: 142), 142), DYYEDSYEDISAYLLS KNNAIEPRSFS DYYEDSYEDISAYLLS KNNAIEPRSFS (SEQ (SEQ ID ID NO: NO: 143), 143), YYEDSYEDISAYLLS KNNAIEPRSFS YYEDSYEDISAYLLS KNNAIEPRSFS (SEQ (SEQ ID ID NO: NO: 144), 144),

YEDSYEDISAYLLSKNNAIEPRSFS (SEQ ID NO: 176), EDSYEDISAYLLSKNNAIEPRSFS (SEQ ID NO: 177), DSYEDISAYLLSKNNAIEPRSFS (SEQ ID NO: 178), SYEDISAYLLSKNNAIEPRSFS (SEQ ID NO: 179), YEDISAYLLSKNNAIEPRSFS (SEQ ID NO: 180), EDISAYLLSKNNAIEPRSFS (SEQ ID NO: 181), DISAYLLSKNNAIEPRSFS (SEQ ID NO: 182), ISAYLLSKNNAIEPRSFS (SEQ ID NO: 183), SAYLLSKNNAIEPRSFS (SEQ ID NO: 184), AYLLSKNNAIEPRSFS (SEQ ID NO: 185), YLLSKNNAIEPRSFS (SEQ ID NO: 186), LLSKNNAIEPRSFS (SEQ ID NO: 187), LSKNNAIEPRSFS (SEQ ID NO: 188), SKNNAIEPRSFS (SEQ ID NO: 189), KNNAIEPRSFS (SEQ ID NO: 190), NNAIEPRSFS (SEQ ID NO: 191), NAIEPRSFS (SEQ ID NO: 192), AIEPRSFS (SEQ ID NO: 193), или IEPRSFS (SEQ ID NO: 194).YEDSYEDISAYLLSKNNAIEPRSFS (SEQ ID NO: 176), EDSYEDISAYLLSKNNAIEPRSFS (SEQ ID NO: 177), DSYEDISAYLLSKNNAIEPRSFS (SEQ ID NO: 178), SYEDISAYLLSKNNAIEPRSFS (SEQ ID NO: 179), YEDISAYLLSKNNAIEPRSFS (SEQ ID NO: 180), EDISAYLLSKNNAIEPRSFS (SEQ ID NO : 181), DISAYLLSKNNAIEPRSFS (SEQ ID NO: 182), ISAYLLSKNNAIEPRSFS (SEQ ID NO: 183), SAYLLSKNNAIEPRSFS (SEQ ID NO: 184), AYLLSKNNAIEPRSFS (SEQ ID NO: 185), YLLSKNNAIEPRSFS (SEQ ID NO: 186), LLSKNNAIEPRSFS (SEQ ID NO: 187), LSKNNAIEPRSFS (SEQ ID NO: 188), SKNNAIEPRSFS (SEQ ID NO: 189), KNNAIEPRSFS (SEQ ID NO: 190), NNAIEPRSFS (SEQ ID NO: 191), NAIEPRSFS (SEQ ID NO: 192), AIEPRSFS (SEQ ID NO: 193), or IEPRSFS (SEQ ID NO: 194).

В других вариантах реализации изобретения сайт расщепления содержит DKNTGDYYEDSYEDISAYLLSKNNAIEPRSFS (SEQ ГО NO: 88),In other embodiments, the cleavage site comprises DKNTGDYYEDSYEDISAYLLSKNNAIEPRSFS (SEQ GO NO: 88),

KNTGDYYEDSYED ISAYLLSKNNAIEPRSFS KNTGDYYEDSYED ISAYLLSKNNAIEPRSFS (SEQ (SEQ ID ID NO: NO: 139), 139), NTGDYYEDSYEDISAYLLS KNNAIEPRSFS NTGDYYEDSYEDISAYLLS KNNAIEPRSFS (SEQ (SEQ ID ID NO: NO: 140), 140), TGDYYEDSYEDISAYLLS KNNAIEPRSFS TGDYYEDSYEDISAYLLS KNNAIEPRSFS (SEQ (SEQ ID ID NO: NO: 141), 141), GDYYEDSYEDISAYLLS KNNAIEPRSFS GDYYEDSYEDISAYLLS KNNAIEPRSFS (SEQ (SEQ ID ID NO: NO: 142), 142), DYYEDSYEDISAYLLS KNNAIEPRSFS DYYEDSYEDISAYLLS KNNAIEPRSFS (SEQ (SEQ ID ID NO: NO: 143), 143), YYEDSYEDISAYLLS KNNAIEPRSFS YYEDSYEDISAYLLS KNNAIEPRSFS (SEQ (SEQ ID ID NO: NO: 144), 144),

YEDSYEDISAYLLSKNNAIEPRSFS (SEQ ID NO: 176), EDSYEDISAYLLSKNNAIEPRSFS (SEQ ID NO: 177), DSYEDISAYLLSKNNAIEPRSFS (SEQ ID NO: 178), SYEDISAYLLSKNNAIEPRSFS (SEQ ID NO: 179), YEDISAYLLSKNNAIEPRSFS (SEQ ID NO: 180), EDISAYLLSKNNAIEPRSFS (SEQ ID NO: 181), DISAYLLSKNNAIEPRSFS (SEQ ID NO: 182), ISAYLLSKNNAIEPRSFS (SEQ ID NO: 183), SAYLLSKNNAIEPRSFS (SEQ ID NO: 184), AYLLSKNNAIEPRSFS (SEQ ID NO: 185), YLLSKNNAIEPRSFS (SEQ ID NO: 186), LLSKNNAIEPRSFS (SEQ ID NO: 187), LSKNNAIEPRSFS (SEQ ID NO: 188), SKNNAIEPRSFS (SEQ ID NO: 189), KNNAIEPRSFS (SEQ ID NO: 190), NNAIEPRSFS (SEQ ID NO: 191), NAIEPRSFS (SEQ ID NO: 192), AIEPRSFS (SEQ ID NO: 193), или IEPRSFS (SEQ ID NO: 194), причем сайт расщепления не представляет собой полноразмерную область а2 белка FVIII. В определенных вариантах реализации изобретения сайт расщепления поддается расщеплению в тесте на гидролиз тромбином, как предложено в настоящем документе или известно в данной области техники.YEDSYEDISAYLLSKNNAIEPRSFS (SEQ ID NO: 176), EDSYEDISAYLLSKNNAIEPRSFS (SEQ ID NO: 177), DSYEDISAYLLSKNNAIEPRSFS (SEQ ID NO: 178), SYEDISAYLLSKNNAIEPRSFS (SEQ ID NO: 179), YEDISAYLLSKNNAIEPRSFS (SEQ ID NO: 180), EDISAYLLSKNNAIEPRSFS (SEQ ID NO : 181), DISAYLLSKNNAIEPRSFS (SEQ ID NO: 182), ISAYLLSKNNAIEPRSFS (SEQ ID NO: 183), SAYLLSKNNAIEPRSFS (SEQ ID NO: 184), AYLLSKNNAIEPRSFS (SEQ ID NO: 185), YLLSKNNAIEPRSFS (SEQ ID NO: 186), LLSKNNAIEPRSFS (SEQ ID NO: 187), LSKNNAIEPRSFS (SEQ ID NO: 188), SKNNAIEPRSFS (SEQ ID NO: 189), KNNAIEPRSFS (SEQ ID NO: 190), NNAIEPRSFS (SEQ ID NO: 191), NAIEPRSFS (SEQ ID NO: 192), AIEPRSFS (SEQ ID NO: 193), or IEPRSFS (SEQ ID NO: 194), and the cleavage site is not the full-length a2 region of the FVIII protein. In certain embodiments of the invention, the cleavage site is amenable to cleavage in a thrombin hydrolysis test, as proposed herein or known in the art.

III. Полинуклеотиды, векторы и клетки-хозяева.III. Polynucleotides, vectors and host cells.

Также по данному изобретению приводится полинуклеотид, кодирующих химерный белок по данному изобретению. В одном варианте реализации изобретения первая полипептидная цепь и вторая полипептидная цепь могут быть закодированы с помощью одной полинуклеотидной цепи. В другом варианте реализации изобретения первая полипептидная цепь и вторая полипептидная цепь кодируются двумя различными полинуклеотидами, например, первой нуклеотидной последовательностью и второй нуклеотидной последовательностью. В другом варианте реализации изобретения первая нуклеотидная последовательность и вторая нуклеотидная последовательности являются двумя различными полинуклеотидами (например, различные векторы).Also provided according to this invention is a polynucleotide encoding a chimeric protein according to this invention. In one embodiment of the invention, the first polypeptide chain and the second polypeptide chain may be encoded by a single polynucleotide chain. In another embodiment, the first polypeptide chain and the second polypeptide chain are encoded by two different polynucleotides, for example, a first nucleotide sequence and a second nucleotide sequence. In another embodiment of the invention, the first nucleotide sequence and the second nucleotide sequence are two different polynucleotides (eg, different vectors).

Изобретение включает в себя полинуклеотид, кодирующий одну полипептидную цепь (например, FVIII(X2)-F1-L3-F2-L2-X1-L1-V), в котором FVIII(X2), содержит белок FVIII, в котором последовательThe invention includes a polynucleotide encoding a single polypeptide chain (for example, FVIII(X2)-F1-L3-F2-L2-X1-L1-V), in which FVIII(X2), contains the FVIII protein, in which the sequence

- 91 044115 ность XTEN встраивается в один или более сайтов встраивания, F1 содержит первую константную область ИГ или ее часть, например, первый фрагмент Fc, L1 содержит первый линкер, V содержит белок ФВ, X1 содержит последовательность XTEN, имеющую длину менее 288 аминокислот, L2 содержит второй линкер, L3 содержит третий линкер, и F2 содержит вторую константную область ИГ или ее часть, например, второй фрагмент Fc. Изобретение также включает в себя два полинуклеотида, первая полинуклеотидая последовательность кодирует первый полипептид, который содержит белок FVIII, слитый с первой константной областью ИГ или ее частью, и вторая полинуклеотидная последовательность кодирует второй полипептид, который содержит белок ФВ, последовательность XTEN, имеющую длину менее 288 аминокислот, и вторую константную область ИГ или ее часть. В некоторых вариантах реализации изобретения химерный белок, содержащий две полипептидные цепи или три полипептидные цепи, может быть кодирован с помощью одной полинуклеотидной цепи, а затем процессирован в две или три (или более) полипептидные цепи. В еще одних вариантах реализации изобретения химерный белок, содержащий эти полипептидные цепи, может быть кодирован с помощью двух или трех полинуклеотидных цепей.- 91 044115 XTEN is inserted into one or more insertion sites, F1 contains the first IG constant region or part thereof, for example, the first Fc fragment, L1 contains the first linker, V contains the VWF protein, X1 contains the XTEN sequence having a length of less than 288 amino acids, L2 contains a second linker, L3 contains a third linker, and F2 contains a second IG constant region or part thereof, for example, a second Fc fragment. The invention also includes two polynucleotides, a first polynucleotide sequence encoding a first polypeptide that contains an FVIII protein fused to a first IG constant region or a portion thereof, and a second polynucleotide sequence encoding a second polypeptide that contains a VWF protein, an XTEN sequence having a length of less than 288 amino acids, and a second IG constant region or part thereof. In some embodiments, a chimeric protein comprising two polypeptide chains or three polypeptide chains may be encoded by a single polynucleotide chain and then processed into two or three (or more) polypeptide chains. In yet other embodiments, a chimeric protein comprising these polypeptide chains may be encoded using two or three polynucleotide chains.

В других вариантах реализации изобретения набор полинуклеотидов дополнительно содержит дополнительную нуклеотидную цепь (например, вторую нуклеотидную цепь, когда химерный полипептид кодируется первой полинуклеотидной цепью или третьей нуклеотидной цепью, когда химерный белок кодируется двумя полинуклеотидными цепями), которая кодирует белок конвертазу. Белок конвертаза может быть выбран из группы, состоящей из пропротеинконвертазы субтилизин/кексин типа 5 (PCSK5 или РС5), пропротеинконвертазы субтилизин/кексин типа 7 (PCSK7 или РС5), дрожжевого Кех 2, пропротеинконвертазы субтилизин/кексин типа 3 (РАСЕ или PCSK3) и двух или более их сочетаний. В некоторых вариантах реализации изобретения белком конвертазой является PACE, РС5 или РС7. В типовом варианте реализации изобретения белком конвертазой является РС5 или РС7. Смотри международную заявку № PCT/US 2011/043568.In other embodiments, the set of polynucleotides further comprises an additional nucleotide strand (e.g., a second nucleotide strand when the chimeric polypeptide is encoded by a first polynucleotide strand or a third nucleotide strand when the chimeric protein is encoded by two polynucleotide strands) that encodes a convertase protein. The convertase protein may be selected from the group consisting of proprotein convertase subtilisin/kexin type 5 (PCSK5 or PC5), proprotein convertase subtilisin/kexin type 7 (PCSK7 or PC5), yeast Kex 2, proprotein convertase subtilisin/kexin type 3 (PACE or PCSK3), and two or more combinations of them. In some embodiments, the convertase protein is PACE, PC5, or PC7. In an exemplary embodiment of the invention, the convertase protein is PC5 or PC7. See international application No. PCT/US 2011/043568.

В данном контексте экспрессионный вектор означает любую конструкцию нуклеиновой кислоты, которая содержит элементы, необходимые для транскрипции и трансляции вставленной кодирующей последовательности, или в случае РНК-вирусного вектора, необходимые элементы для репликации и трансляции при интродукции в соответствующую клетку-хозяина. Экспрессионные векторы могут включать в себя плазмиды, фагмиды, вирусы и их производные.As used herein, an expression vector means any nucleic acid construct that contains elements necessary for transcription and translation of the inserted coding sequence, or in the case of an RNA viral vector, elements necessary for replication and translation upon introduction into an appropriate host cell. Expression vectors may include plasmids, phagemids, viruses, and derivatives thereof.

Экспрессионные векторы по данному изобретению будут включать в себя полинуклеотиды, кодирующие химерный белок, описанный в данном документе. В одном варианте реализации изобретения одна или более кодирующих последовательностей для первого полипептида, содержащего белок FVIII и первую константную область ИГ, для второго полипептида, содержащего белок ФВ, последовательность XTEN, имеющую менее 288 аминокислот и вторую константную область ИГ или ее часть, или для обоих полипептидов функционально связаны с последовательностью, контролирующей экспрессию. В данном контексте две последовательности нуклеиновой кислоты функционально связаны, когда они ковалентно связаны таким образом, чтобы обеспечить сохранность функциональных возможностей каждого компонента последовательности нуклеиновой кислоты. О кодирующей последовательности и последовательности контроля экспрессии гена говорят, что они функционально связаны, если они ковалентно связаны таким образом, чтобы экспрессия или транскрипция и/или трансляция кодирующей последовательности находились под влиянием или контролем последовательности контроля экспрессии гена. О двух последовательностях ДНК говорят, что они функционально связаны, если индукция промотора на 5'-конце последовательности экспрессии гена приводит к транскрипции кодирующей последовательности, и если природа связи между двумя последовательностями ДНК (1) не приводит к мутации сдвига рамки считывания, (2) не мешает способности области промотора направлять транскрипцию кодирующей последовательности или (3) не мешает соответствующему РНК-транскрипту транслироваться в белок. Таким образом, последовательность экспрессии гена будет функционально связана с кодирующей последовательностью нуклеиновой кислоты, если последовательность экспрессии гена способна осуществлять транскрипцию последовательности, кодирующую последовательность нуклеиновой кислоты таким образом, чтобы полученный в результате транскрипт транслировался в желаемый белок или полипептид.Expression vectors of this invention will include polynucleotides encoding the chimeric protein described herein. In one embodiment, one or more coding sequences for a first polypeptide comprising an FVIII protein and a first IG constant region, for a second polypeptide comprising an VWF protein, an XTEN sequence having less than 288 amino acids and a second IG constant region or a portion thereof, or both polypeptides are functionally linked to an expression control sequence. As used herein, two nucleic acid sequences are operably linked when they are covalently linked in a manner that preserves the functionality of each component of the nucleic acid sequence. A coding sequence and a gene expression control sequence are said to be operably linked if they are covalently linked such that expression or transcription and/or translation of the coding sequence is influenced or controlled by the gene expression control sequence. Two DNA sequences are said to be functionally related if induction of a promoter at the 5' end of the gene expression sequence results in transcription of the coding sequence, and if the nature of the linkage between the two DNA sequences (1) does not result in a frameshift mutation, (2) does not interfere with the ability of the promoter region to direct transcription of the coding sequence or (3) does not interfere with the corresponding RNA transcript being translated into protein. Thus, a gene expression sequence will be operably linked to a nucleic acid coding sequence if the gene expression sequence is capable of transcribing the sequence encoding the nucleic acid sequence such that the resulting transcript is translated into the desired protein or polypeptide.

В данном контексте, последовательностью контроля экспрессии гена является любая регуляторная нуклеотидная последовательность, например, последовательность промотора или комбинация промоторэнхансер, содействующая эффективной транскрипции и трансляции кодирующей нуклеиновой кислоты, с которой она функционально связана. Последовательность контроля экспрессии гена, может быть, например, промотором млекопитающих или вирусным промотором, таким как конститутивный или индуцируемый промотор. Конститутивные промоторы млекопитающих включают, но не ограничиваются ими, промоторы для следующих генов: гипоксантин фосфорибозилтрансферазы (HPRT), аденозиндезаминазы, пируват-киназы, промотор бета-актина, и другие конститутивные промоторы. Типичные вирусные промоторы, которые функционируют конститутивно в эукариотических клетках, включают, например, промоторы из цитомегаловируса (CMV), вируса обезьян (например, SV40), вирус папилломы, аденовирус, вирус иммунодефицита человека (ВИЧ), вирус саркомы Рауса, цитомегаловирус, длинные терминальные повторы (LTR) вирус лейкоза Молони и другие ретровирусы, и промотор тимидинкиназы вируса простого герпеса. Другие конститутивные промоторы известны специалистам в данной областиAs used herein, a gene expression control sequence is any regulatory nucleotide sequence, such as a promoter sequence or promoter enhancer combination, that promotes efficient transcription and translation of the encoding nucleic acid to which it is operably linked. The gene expression control sequence may, for example, be a mammalian promoter or a viral promoter, such as a constitutive or inducible promoter. Mammalian constitutive promoters include, but are not limited to, promoters for the following genes: hypoxanthine phosphoribosyltransferase (HPRT), adenosine deaminases, pyruvate kinases, beta-actin promoter, and other constitutive promoters. Typical viral promoters that function constitutively in eukaryotic cells include, for example, those from cytomegalovirus (CMV), simian virus (eg, SV40), papillomavirus, adenovirus, human immunodeficiency virus (HIV), Rous sarcoma virus, cytomegalovirus, long terminal repeats (LTR) of Moloney leukemia virus and other retroviruses, and the herpes simplex virus thymidine kinase promoter. Other constitutive promoters are known to those skilled in the art.

- 92 044115 техники. Промоторы, пригодные в качестве последовательностей экспрессии гена по данному изобретению, также включают в себя индуцируемые промоторы. Индуцируемые промоторы экспрессируются в присутствии индуцирующего агента. Например, промотор металлотионеина индуцирует активацию транскрипции и трансляции в присутствии некоторых ионов металлов. Другие индуцируемые промоторы известны обычным специалистам в данной области техники.- 92 044115 technology. Promoters useful as gene expression sequences of the present invention also include inducible promoters. Inducible promoters are expressed in the presence of an inducing agent. For example, the metallothionein promoter induces transcriptional and translational activation in the presence of certain metal ions. Other inducible promoters are known to those of ordinary skill in the art.

В целом, последовательность контроля экспрессии гена по мере необходимости должна включать в себя 5'-нетранскрибируемую и 5'-нетранслируемую последовательности, участвующие в инициации транскрипции и трансляции соответственно, такие как TATA-бокс, кэпирующая последовательность, последовательность CAAT и т.п. В частности, такие 5'-нетранскрибированные последовательности включает промоторную область, которая включает в себя последовательность промотора для транскрипционного контроля над функционально связанной кодирующей нуклеиновой кислотой. По желанию, в некоторых случаях, последовательность экспрессии гена включает в себя последовательности энхансера или вышележащие активаторные последовательности.In general, the gene expression control sequence, as required, should include 5' non-transcribed and 5' non-translated sequences involved in the initiation of transcription and translation, respectively, such as a TATA box, a capping sequence, a CAAT sequence, and the like. In particular, such 5' untranscribed sequences include a promoter region, which includes a promoter sequence for transcriptional control of the operably linked coding nucleic acid. Optionally, in some cases, the gene expression sequence includes enhancer sequences or upstream activator sequences.

Вирусный вектор включает, но не ограничивается, последовательности нуклеиновых кислот из следующих вирусов: ретровирусы, такие как вирус Молони мышиного лейкоза, вирус саркомы мышей Харви, вирус опухоли молочной железы мышей и вирус саркомы Рауса; аденовирус, аденоассоциированный вирус; вирусы SV40 типа; полиомавирусы; вирусы Эпштейна-Барр; вирусы папилломы; вирус герпеса; вирус коровьей оспы; вирус полиомиелита; и РНК-содержащий вирус, такой как ретровирус. Можно легко использовать и другие векторы, хорошо известные в данной области техники. Некоторые вирусные векторы основаны на нецитопатических эукариотических вирусах, в которых второстепенные гены были заменены на гены интереса. Нецитопатические вирусы включают ретровирусы, жизненный цикл которых включает в себя обратную транскрипцию геномной вирусной РНК в ДНК с последующей провирусной интеграций в ДНК клетки-хозяина. Ретровирусы были одобрены для исследований генной терапии человека. Наиболее полезными являются дефектные по репликации ретровирусы (т.е. способные направлять синтез необходимых белков, но не способные синтезировать инфекционную частицу). Такие генетически измененные ретровирусные экспрессионные векторы имеют полезность для высокоэффективной трансдукции генов in vivo. Стандартные протоколы для получения ретровирусов, дефектных по репликации, (включая этапы введения экзогенного генетического материала в плазмиду, трансфекцию пакующей клеточной линии плазмидой, получения рекомбинантных ретровирусов посредством пакующей клеточной линии, сбор вирусных частиц из тканевой культуральной среды и инфицирование клетокмишеней вирусными частицами) представлены в Kriegler, M., Gene Transfer and Expression, A Laboratory Manual, W.H. Freeman Co., Нью-Йорк (1990 год) и Murry, E. J., Methods in Molecular Biology, Vol. 7, Humana Press, Inc., Клифтон, штат Нью-Джерси (1991 год).The viral vector includes, but is not limited to, nucleic acid sequences from the following viruses: retroviruses such as Moloney murine leukemia virus, Harvey murine sarcoma virus, murine mammary tumor virus and Rous sarcoma virus; adenovirus, adeno-associated virus; SV40 type viruses; polyomaviruses; Epstein-Barr viruses; papilloma viruses; herpes virus; cowpox virus; polio virus; and an RNA virus such as a retrovirus. Other vectors well known in the art can easily be used. Some viral vectors are based on noncytopathic eukaryotic viruses in which nonessential genes have been replaced with genes of interest. Noncytopathic viruses include retroviruses whose life cycle involves reverse transcription of genomic viral RNA into DNA followed by proviral integration into the DNA of the host cell. Retroviruses have been approved for human gene therapy research. The most useful are replication-defective retroviruses (i.e., capable of directing the synthesis of necessary proteins, but not capable of synthesizing an infectious particle). Such genetically engineered retroviral expression vectors are useful for highly efficient gene transduction in vivo. Standard protocols for the production of replication-defective retroviruses (including the steps of introducing exogenous genetic material into a plasmid, transfecting a packaging cell line with the plasmid, producing recombinant retroviruses through the packaging cell line, collecting viral particles from tissue culture medium, and infecting target cells with viral particles) are presented in Kriegler , M., Gene Transfer and Expression, A Laboratory Manual, W.H. Freeman Co., New York (1990) and Murry, E. J., Methods in Molecular Biology, Vol. 7, Humana Press, Inc., Clifton, NJ (1991).

В одном варианте реализации изобретения вирусом является аденоассоциированный вирус, вирус двухцепочечной ДНК. Аденоассоциированный вирус может быть сконструирован таким образом, чтобы быть дефектным по репликации и способным инфицировать широкий диапазон типов клеток и видов. Кроме того, он имеет такие преимущества, как термостабильность и липидная устойчивость к растворению; высокие частоты трансдукции в клетках различных линий, включая гемопоэтические клетки; и отсутствие ингибирования суперинфекции, таким образом, что позволяет осуществлять несколько серий трансдукции. Как сообщается, аденоассоциированный вирус может сайт-специфически интегрироваться в клеточную ДНК человека, тем самым сводя к минимуму возможность инсерционного мутагенеза и изменчивости экспрессионной характеристики встроенного гена ретровирусной инфекции. Кроме того, аденоассоциированные вирусные инфекции дикого типа были проведены в культуре ткани более 100 пассажей в отсутствии селективного давления, подразумевая, что геномная интеграция аденоассоциированного вируса является относительно стабильным событием. Аденоассоциированный вирус может также функционировать как внехромосомный фактор.In one embodiment, the virus is an adeno-associated virus, a double-stranded DNA virus. Adeno-associated virus can be engineered to be replication defective and capable of infecting a wide range of cell types and species. In addition, it has the advantages of heat stability and lipid dissolution resistance; high frequencies of transduction in cells of various lineages, including hematopoietic cells; and lack of inhibition of superinfection, thus allowing multiple series of transduction. It is reported that the adeno-associated virus can site-specifically integrate into human cellular DNA, thereby minimizing the possibility of insertional mutagenesis and variability in the expression characteristics of the integrated retroviral infection gene. In addition, wild-type adeno-associated virus infections were carried out in tissue culture for over 100 passages in the absence of selective pressure, implying that adeno-associated virus genomic integration is a relatively stable event. Adeno-associated virus may also function as an extrachromosomal factor.

Другие векторы включают плазмидные векторы. Плазмидные векторы широко описаны в данной области техники и хорошо известны специалистам в данной области техники. См., например, Sambrook et al., Molecular Cloning: A Laboratory Manual, Second Edition, Cold Spring Harbor Laboratory Press, 1989 год. В последние несколько лет было обнаружено, что плазмидные векторы являются особенно предпочтительным для доставки генов в клетки in vivo из-за их неспособности интегрироваться и реплицироваться внутри генома хозяина. Тем не менее, эти плазмиды имеют промотор, совместимый с клеткойхозяином, могут экспрессировать пептид из гена, функционально закодированного в плазмиде. Некоторые часто используемые плазмиды, доступные от коммерческих поставщиков, включают pBR322, pUC18, pUC19, различные pcDNA плазмиды, PRC/CMV, различные PCMV плазмиды, pSV40 и pBlueScript. Дополнительные примеры конкретных плазмид включают pcDNA3.1, номер по каталогу V79020; pcDNA3.1/hygro, номер по каталогу V87020; pcDNA4/Myc-His, номер по каталогу V86320; и pBudCE4.1, номер по каталогу V53220, все из Инвитроджен (Карлсбад, штат Калифорния). Другие плазмиды хорошо известны обычным специалистам в данной области техники. Кроме того, плазмиды могут быть специально разработаны с использованием стандартных методов молекулярной биологии, чтобы удалить и/или добавить специфические фрагменты ДНК.Other vectors include plasmid vectors. Plasmid vectors are widely described in the art and are well known to those skilled in the art. See, for example, Sambrook et al., Molecular Cloning: A Laboratory Manual, Second Edition, Cold Spring Harbor Laboratory Press, 1989. In the last few years, plasmid vectors have been found to be particularly advantageous for delivering genes to cells in vivo due to their inability to integrate and replicate within the host genome. However, these plasmids have a promoter compatible with the host cell that can express a peptide from a gene functionally encoded in the plasmid. Some commonly used plasmids available from commercial suppliers include pBR322, pUC18, pUC19, various pcDNA plasmids, PRC/CMV, various PCMV plasmids, pSV40 and pBlueScript. Additional examples of specific plasmids include pcDNA3.1, catalog number V79020; pcDNA3.1/hygro, catalog number V87020; pcDNA4/Myc-His, cat. no. V86320; and pBudCE4.1, part number V53220, all from Invitrogen (Carlsbad, CA). Other plasmids are well known to those of ordinary skill in the art. In addition, plasmids can be specifically designed using standard molecular biology techniques to remove and/or add specific DNA fragments.

В одной системе экспрессии на основе насекомых, которая может быть использована для полученияIn one insect-based expression system that can be used to produce

- 93 044115 белков по данному изобретению, Autographa californica вирус ядерного гипергидроза (AcNPV) используется в качестве вектора для экспрессии чужеродных генов. Вирус растет в клетках Spodoptera frugiperda. Кодирующая последовательность может быть клонирована во второстепенных областях (например, ген полигедрона) вируса и помещена под контроль промотора AcNPV (например, промотор полигедрона). Успешное введение кодирующей последовательности приведет к инактивации гена полигедрона и образования невкрапленного рекомбинантного вируса (т.е. у вируса отсутствует белковый слой, кодируемый геном полигедрона). Эти рекомбинантные вирусы затем используются для инфицирования клеток Spodoptera frugiperda, в которых экспрессируется вставленный ген. (см., например, Smith et al. (1983 год) J Virol 46:584; патент США № 4,215,051). Дополнительные примеры этих систем экспрессии можно найти в Ausubel et al., ред. (1989 год) Current Protocols in Molecular Biology, Vol. 2, Greene Publish. Assoc. & Wiley Interscience.- 93 044115 proteins of this invention, Autographa californica nuclear hyperhidrosis virus (AcNPV) is used as a vector for the expression of foreign genes. The virus grows in Spodoptera frugiperda cells. The coding sequence can be cloned into minor regions (eg, polyhedron gene) of the virus and placed under the control of the AcNPV promoter (eg, polyhedron promoter). Successful introduction of the coding sequence will result in inactivation of the polyhedron gene and the formation of an uninterspersed recombinant virus (i.e., the virus lacks the protein layer encoded by the polyhedron gene). These recombinant viruses are then used to infect Spodoptera frugiperda cells that express the inserted gene. (See, eg, Smith et al. (1983) J Virol 46:584; US Pat. No. 4,215,051). Additional examples of these expression systems can be found in Ausubel et al., eds. (1989) Current Protocols in Molecular Biology, Vol. 2, Greene Publish. Assoc. & Wiley Interscience.

Еще одной системой, которая может быть использована для экспрессии белков по данному изобретению, является система экспрессии гена глутаминсинтетазы, также упоминается как система экспрессии GS (Lonza Biologics PLC, Беркшир Великобритания). Эта система экспрессии подробно описана в патенте США №5,981,216.Another system that can be used to express the proteins of this invention is the glutamine synthetase gene expression system, also referred to as the GS expression system (Lonza Biologics PLC, Berkshire UK). This expression system is described in detail in US Patent No. 5,981,216.

В клетках-хозяевах млекопитающих может быть использован ряд систем экспрессии, основанных на вирусах. В тех случаях, когда используют аденовирус в качестве экспрессионного вектора экспрессии, кодирующая последовательность может быть лигирована с контрольным за транскрипцией/трансляцией комплексом аденовируса, например, поздним промотором и трехкомпонентной лидерной последовательностью. Этот химерный ген затем может быть встроен в геном аденовируса с помощью рекомбинации in vitro или in vivo. Встраивание во второстепенную область вирусного генома (например, область Е1 или Е3) приводит к получению рекомбинантного вируса, который является жизнеспособным и способен экспрессировать пептид у инфицированных хозяев. (См., например, Logan & Shenk (1984 год) Proc Natl Acad Sci USA 81:3655). В альтернативном варианте 7.5 К промотор вируса осповакцины может быть использован. (См., например, Mackett et al. (1982 год) Proc Natl Acad Sci USA 79:7415; Mackett et al. (1984 год) J Virol 49:857; Panicali et al. (1982 год) Proc Natl Acad Sci USA 79:4927.A number of virus-based expression systems can be used in mammalian host cells. In cases where an adenovirus is used as an expression vector, the coding sequence may be ligated to the adenovirus transcription/translation control complex, eg, a late promoter and a tripartite leader sequence. This chimeric gene can then be inserted into the adenovirus genome by in vitro or in vivo recombination. Insertion into a minor region of the viral genome (eg, the E1 or E3 region) results in a recombinant virus that is viable and capable of expressing the peptide in infected hosts. (See, for example, Logan & Shenk (1984) Proc Natl Acad Sci USA 81:3655). Alternatively, a 7.5K vaccinia virus promoter may be used. (See, for example, Mackett et al. (1982) Proc Natl Acad Sci USA 79:7415; Mackett et al. (1984) J Virol 49:857; Panicali et al. (1982) Proc Natl Acad Sci USA 79:4927.

Для повышения эффективности продуцирования полинуклеотиды могут быть созданы, чтобы кодировать множество белковых единиц по данному изобретению, разделенных ферментативными сайтами расщепления. Полученный полипептид может быть расщеплен (например, путем обработки с соответствующим ферментом) для того, чтобы восстановить полипептидные единицы. Это может увеличить выход полипептидов, управляемых одним промотором. При использовании в соответствующих вирусных системах экспрессии, трансляция каждого полипептида, кодируемого мРНК, направлена внутрь транскрипта; например, с помощью участка внутренней посадки рибосомы, IRES. Таким образом, полицистронная конструкция направляет транскрипцию одной большой полицистронной мРНК, которая, в свою очередь, направляет трансляцию нескольких, отдельных полипептидов. Этот подход исключает продуцирование и ферментативную обработку полипротеинов и может значительно увеличить выход полипептидов, управляемых одним промотором.To improve production efficiency, polynucleotides can be designed to encode multiple protein units of the invention separated by enzymatic cleavage sites. The resulting polypeptide can be cleaved (eg, by treatment with an appropriate enzyme) in order to restore the polypeptide units. This may increase the yield of polypeptides driven by a single promoter. When used in appropriate viral expression systems, translation of each polypeptide encoded by the mRNA is directed toward the interior of the transcript; for example, using the internal ribosome entry site, IRES. Thus, the polycistronic construct directs the transcription of one large polycistronic mRNA, which in turn directs the translation of several, separate polypeptides. This approach eliminates the production and enzymatic processing of polyproteins and can significantly increase the yield of polypeptides driven by a single promoter.

Векторы, используемые в трансформации, как правило, содержат селективный маркер, используемый для идентификации трансформантов. В бактериальных системах это может включать в себя ген устойчивости к антибиотику, такой как ампициллин или канамицин. Селективные маркеры для использования в культивируемых клетках млекопитающих включают гены, которые придают устойчивость к лекарственным средствам, таким как неомицин, гигромицин и метотрексат. Селективный маркер может быть амплифицируемым селективным маркером. Одним амплифицируемым селективным маркером является ген дигидрофолатредуктазы (DHFR). Simonsen С С et al. (1983 год) Proc Natl Acad Sci USA 80:2495-9. Селективные маркеры были проверенны Thilly (1986 год) Mammalian Cell Technology, Butterworth Publishers, Стоунхэм, штат Массачусетс, и выбор селективных маркеров находится в компетенции среднего специалиста в данной области техники.Vectors used in transformation typically contain a selection marker used to identify transformants. In bacterial systems, this may include a resistance gene for an antibiotic such as ampicillin or kanamycin. Selectable markers for use in cultured mammalian cells include genes that confer resistance to drugs such as neomycin, hygromycin and methotrexate. The selectable marker may be an amplifiable selectable marker. One amplifiable selectable marker is the dihydrofolate reductase (DHFR) gene. Simonsen C et al. (1983) Proc Natl Acad Sci USA 80:2495-9. The selectable markers have been tested by Thilly (1986) Mammalian Cell Technology, Butterworth Publishers, Stoneham, Massachusetts, and the selection of selectable markers is within the skill of one of ordinary skill in the art.

Селективные маркеры могут быть введены в клетку посредством отдельной плазмиды одновременно с геном интереса, или же они могут быть введены посредством одной и той же плазмиды. Если на одной и той же плазмиде селектируемый маркер и ген интереса могут находиться под контролем различных промоторов или одного и того же промотора, поздняя расстановка продуцирует бицистронное сообщение. Конструкции такого типа известны в данной области техники (например, патент США № 4,713,339).Selectable markers can be introduced into a cell via a separate plasmid at the same time as the gene of interest, or they can be introduced via the same plasmid. While on the same plasmid the selectable marker and the gene of interest may be under the control of different promoters or the same promoter, late placement produces a bicistronic message. Designs of this type are known in the art (eg, US Pat. No. 4,713,339).

Экспрессионные векторы могут кодировать метки, которые позволяют произвести легкую очистку рекомбинантно продуцируемого белка. Примеры включают, но не ограничиваются ими, вектор pUR278 (Ruther et al. (1983 год) EMBO J 2:1791), в котором кодирующие последовательности для экспрессируемого белка могут быть лигированы в вектор в рамке с кодирующей областью lac z, так чтобы продуцировался меченый слитый белок; векторы pGEX могут быть использованы для экспрессии белков по данному изобретению с использованием глутатион S-трансферазы (GST) в качестве метки. Обычно эти белки растворимы и могут быть легко очищены от клеток посредством адсорбции на глутатион-агарозных микроносителях с последующим элюированием в присутствии свободного глутатиона. Векторы включают в себя сайты расщепления (тромбин или фактор Xa протеазы или ПРОТЕАЗА PRESCISSION™Expression vectors can encode tags that allow easy purification of the recombinantly produced protein. Examples include, but are not limited to, vector pUR278 (Ruther et al. (1983) EMBO J 2:1791), in which coding sequences for an expressed protein can be ligated into the vector in frame with the lac z coding region so that a tagged protein is produced. fusion protein; pGEX vectors can be used to express the proteins of this invention using glutathione S-transferase (GST) as a tag. Typically, these proteins are soluble and can be easily purified from cells by adsorption onto glutathione-agarose microcarriers followed by elution in the presence of free glutathione. Vectors include cleavage sites (thrombin or factor Xa protease or PRESCISSION™ PROTEASE

- 94 044115 (Pharmacia, Пипак, штат Нью-Джерси)) для легкого удаления метки после очистки.- 94 044115 (Pharmacia, Peapack, NJ) for easy tag removal after cleaning.

Экспрессионный вектор или векторы затем трансфицируются или котрансфицируются в подходящую клетку-мишень, которая будет экспрессировать полипептиды. Способы трансфекции, известные в данной области техники, включают, но не ограничиваются ими, осаждение фосфатом кальция (Wigler et al. (1978 год) Cell 14:725), электропорация (Neumann et al. (1982 год) EMBO J 1:841) и реагенты на основе липосом. Разнообразие векторных систем экспрессии в клетке хозяине могут быть использованы для экспрессии белков, описанных в данном документе, включая как прокариотические и эукариотические клетки. К ним относятся, но не ограничиваются ими, микроорганизмы, такие как бактерии (например, Е. coli) трансформированные с помощью рекомбинантных экспрессионных векторов ДНК бактериофага или плазмидной ДНК, содержащих соответствующую кодирующую последовательность; дрожжи или мицелиальные грибы, трансформированные с помощью рекомбинантных экспрессионных векторов дрожжевых или мицелиальных грибов, содержащих соответствующую кодирующую последовательность; системы клеток насекомых, инфицированные рекомбинаннтными вирусными экспрессионными векторами (например, бакуловирус), содержащих соответствующую кодирующую последовательность; системы клеток растений, инфицированные рекомбинантными вирусными экспрессионными векторами (например, вирус мозаики цветной капусты или вирус мозаики табака) или трансформированные с помощью рекомбинантных плазмидных экспрессионных векторов (например, Ti плазмида), содержащих соответствующую кодирующую последовательность; или системы клеток животных, в том числе клетки млекопитающих (например, HEK293, СНО, Cos, HeLa, HKB11 и ВНК клетки).The expression vector or vectors are then transfected or cotransfected into a suitable target cell that will express the polypeptides. Transfection methods known in the art include, but are not limited to, calcium phosphate precipitation (Wigler et al. (1978) Cell 14:725), electroporation (Neumann et al. (1982) EMBO J 1:841) and liposome-based reagents. A variety of host cell expression vector systems can be used to express the proteins described herein, including both prokaryotic and eukaryotic cells. These include, but are not limited to, microorganisms such as bacteria (eg E. coli) transformed with recombinant bacteriophage DNA or plasmid DNA expression vectors containing the appropriate coding sequence; yeast or filamentous fungi transformed with recombinant yeast or filamentous fungal expression vectors containing the appropriate coding sequence; insect cell systems infected with recombinant viral expression vectors (eg, baculovirus) containing the appropriate coding sequence; plant cell systems infected with recombinant viral expression vectors (eg, cauliflower mosaic virus or tobacco mosaic virus) or transformed with recombinant plasmid expression vectors (eg, Ti plasmid) containing the appropriate coding sequence; or animal cell systems, including mammalian cells (eg, HEK293, CHO, Cos, HeLa, HKB11 and BHK cells).

В одном варианте реализации изобретения клетка-хозяин является эукариотической клеткой. В данном контексте эукариотическая клетка относится к любой животной или растительной клетки, имеющей точно определенное ядро. Эукариотические клетки животных включают клетки позвоночных, например, млекопитающих и клетки беспозвоночных, например, насекомых. Эукариотические клетки растений, в частности, могут включать дрожжевые клетки, но не ограничиваться ими. Эукариотическая клетка отличается от прокариотической клетки, например, бактерии.In one embodiment of the invention, the host cell is a eukaryotic cell. In this context, a eukaryotic cell refers to any animal or plant cell that has a well-defined nucleus. Eukaryotic animal cells include vertebrate cells, such as mammals, and invertebrate cells, such as insects. Eukaryotic plant cells may include, but are not limited to, yeast cells. A eukaryotic cell is different from a prokaryotic cell, such as a bacterium.

В некоторых вариантах реализации изобретения эукариотическая клетка представляет собой клетку млекопитающего. Клетка млекопитающего представляет собою любую клетку, происходящую от млекопитающего. Клетки млекопитающих, в частности, могут включать клеточные линии млекопитающих, но не ограничиваться ими. В одном варианте реализации изобретения клетка млекопитающего представляет собой человеческую клетку. В другом варианте реализации изобретения клетка млекопитающего представляет собой клетку HEK293, которая является линией эмбриональных клеток человеческой почки. Клетки HEK293, доступны в виде CRL-1533 из Американской коллекции типов культур, Манассас, штат Вирджиния, а также в виде 293-Н клеток, каталожный № 11631-017 или 293-F клеток, каталожный № 11625-019 от Инвитроджен (Карлсбат, штат Калифорния). В некоторых вариантах реализации изобретения клетка млекопитающего представляет собой PER.C6® клетку, которая является линией клеток, происходящей из сетчатки. PER.C6® клетки доступны от Круселл (Лейден, Нидерланды). В других вариантах реализации изобретения клетка млекопитающего представляет собой клетку из линии клеток яичника китайского хомячка (СНО). Клетки СНО доступны из Американской коллекции типов культур, Манассас, штат Вирджиния, (например, СНО-Ki; CCL-61). В еще одних вариантах реализации изобретения клетка млекопитающего представляет собой клетку из линии клеток почки новорожденного сирийского хомячка (ВНК). Клетки ВНК доступны из Американской коллекции типов культур, Манассас, штат Вирджиния, (например, CRL-1632). В некоторых вариантах реализации изобретения клетка млекопитающего представляет собой HKB11 клетку, которая является гибридной клеточной линией от клеток линии HEK293 и линии В-клеток человека. Mei et al., Mol. Biotechnol. 34(2): 165-78 (2006 год).In some embodiments, the eukaryotic cell is a mammalian cell. A mammalian cell is any cell derived from a mammal. Mammalian cells may particularly include, but are not limited to, mammalian cell lines. In one embodiment of the invention, the mammalian cell is a human cell. In another embodiment, the mammalian cell is a HEK293 cell, which is a human embryonic kidney cell line. HEK293 cells, available as CRL-1533 from the American Type Culture Collection, Manassas, VA, and as 293-H cells, catalog no. 11631-017, or 293-F cells, catalog no. 11625-019 from Invitrogen (Carlsbat, California State). In some embodiments, the mammalian cell is a PER.C6® cell, which is a retinal-derived cell line. PER.C6® cells are available from Krusell (Leiden, The Netherlands). In other embodiments, the mammalian cell is a cell from the Chinese hamster ovary (CHO) cell line. CHO cells are available from the American Type Culture Collection, Manassas, VA (eg, CHO-Ki; CCL-61). In yet other embodiments, the mammalian cell is a cell from a neonatal Syrian hamster kidney (SHK) cell line. BHK cells are available from the American Type Culture Collection, Manassas, VA (eg, CRL-1632). In some embodiments, the mammalian cell is an HKB11 cell, which is a hybrid cell line from the HEK293 cell line and a human B cell line. Mei et al., Mol. Biotechnol. 34(2): 165-78 (2006).

В одном варианте реализации изобретения плазмиду, содержащую FVIII (X2)-Fc слитую кодирующую последовательность, белок ФВ-L1-X1-L2-Fc кодирующую последовательность или обе эти последовательности и селективный маркер, например, устойчивость к зеоцину, трансфицировали в клетки HEK293 для продуцирования химерного белка.In one embodiment, a plasmid containing an FVIII(X2)-Fc fusion coding sequence, a VWF-L1-X1-L2-Fc protein coding sequence, or both, and a selectable marker, e.g., zeocin resistance, is transfected into HEK293 cells to produce chimeric protein.

В другом варианте реализации изобретения плазмиду, содержащую FVIII-Fc слитую кодирующую последовательность, белок ФВ-L1-X-L2-Fc кодирующую последовательность или обе эти последовательности и селективный маркер, например, устойчивость к зеоцину, трансфицировали в клетки HEK293 для продуцирования химерного белка.In another embodiment, a plasmid containing an FVIII-Fc fusion coding sequence, a VWF-L1-X-L2-Fc protein coding sequence, or both, and a selectable marker, such as zeocin resistance, is transfected into HEK293 cells to produce a chimeric protein.

В некоторых вариантах реализации изобретения первую плазмиду, содержащую FVIII(X2)-Fc слитую кодирующую последовательность и первый селективный маркер, например, устойчивость к зеоцину, и вторую плазмиду, содержащую белок ФВ-L1-X1-L2-Fc кодирующую последовательность и второй селективный маркер, например, ген устойчивости к неомицину и третью плазмиду, содержащую кодирующую последовательность белка конвертазы и третий селективный маркер, например, ген устойчивости к гигромицину, трансфицировали в клетки HEK293 для получения химерного белка. Первая и вторая плазмиды могут быть введены в равных количествах (например, молярное соотношение 1:1), или они могут быть введены в неравных количествах.In some embodiments, a first plasmid comprising an FVIII(X2)-Fc fusion coding sequence and a first selectable marker, such as zeocin resistance, and a second plasmid comprising the VWF-L1-X1-L2-Fc protein coding sequence and a second selectable marker , for example, a neomycin resistance gene and a third plasmid containing a convertase protein coding sequence and a third selectable marker, for example, a hygromycin resistance gene, were transfected into HEK293 cells to produce a chimeric protein. The first and second plasmids may be administered in equal amounts (eg, a 1:1 molar ratio), or they may be administered in unequal amounts.

В еще одних вариантах реализации изобретения первую плазмиду, содержащую FVIII-Fc слитуюIn yet other embodiments, the first plasmid comprising an FVIII-Fc fusion

- 95 044115 кодирующую последовательность и первый селективный маркер, например, устойчивость к зеоцину, и вторую плазмиду, содержащую белок ФВ-L1-X-L2-Fc кодирующую последовательность и второй селективный маркер например, ген устойчивости к неомицину и третью плазмиду, содержащую кодирующую последовательность белка конвертазы и третий селективный маркер, например, ген устойчивости к гигромицину, трансфицировали в клетки HEK293 для получения химерного белка. Первая и вторая плазмиды могут быть введены в равных количествах (например, молярное соотношение 1:1), или они могут быть введены в неравных количествах.- 95 044115 a coding sequence and a first selectable marker, for example, resistance to zeocin, and a second plasmid containing the VWF-L1-X-L2-Fc protein, a coding sequence and a second selectable marker, for example, a neomycin resistance gene and a third plasmid containing the coding sequence convertase protein and a third selectable marker, such as the hygromycin resistance gene, were transfected into HEK293 cells to produce the chimeric protein. The first and second plasmids may be administered in equal amounts (eg, a 1:1 molar ratio), or they may be administered in unequal amounts.

В еще одних вариантах реализации изобретения первую плазмиду, содержащую FVIII(X2)-Fc слитую кодирующую последовательность и первый селективный маркер, например, устойчивость к зеоцину, и вторую плазмиду, содержащую белок ФВ-L1-X1-L2-Fc слитую кодирующую последовательность и второй селективный маркер, например, ген устойчивости к неомицину и третью плазмиду, содержащую кодирующую последовательность белка конвертазы и третий селективный маркер, например, ген устойчивости к гигромицину, трансфицировали в клетки HEK293 для получения химерного белка. Первая и вторая плазмиды могут быть введены в равных количествах (например, молярное соотношение 1:1), или они могут быть введены в неравных количествах.In still other embodiments, a first plasmid comprising an FVIII(X2)-Fc fusion coding sequence and a first selectable marker, such as zeocin resistance, and a second plasmid comprising the VWF-L1-X1-L2-Fc protein fusion coding sequence and a second a selectable marker, eg, a neomycin resistance gene; and a third plasmid containing a convertase protein coding sequence and a third selectable marker, eg, a hygromycin resistance gene, were transfected into HEK293 cells to produce a chimeric protein. The first and second plasmids may be administered in equal amounts (eg, a 1:1 molar ratio), or they may be administered in unequal amounts.

В некоторых вариантах реализации изобретения первую плазмиду, содержащую FVIII (с или без XTEN)-F1-L3-F2-L2-X-L1-V кодирующую последовательность и первый селективный маркер, например, устойчивость к зеоцину, и вторую плазмиду, содержащую кодирующую последовательность белка конвертазы и второй селективный маркер, например, ген устойчивости к гигромицину, трансфицировали в клетки HEK293 для получения химерного белка. Промоторы для кодирующей последовательности FVIII(X)-F1 и кодирующей последовательности V-L2-X-L1-F2 могут быть различными или они могут быть одинаковыми.In some embodiments, a first plasmid comprising a FVIII (with or without XTEN)-F1-L3-F2-L2-X-L1-V coding sequence and a first selectable marker, such as zeocin resistance, and a second plasmid comprising the coding sequence convertase protein and a second selectable marker, such as a hygromycin resistance gene, were transfected into HEK293 cells to produce the chimeric protein. The promoters for the FVIII(X)-F1 coding sequence and the V-L2-X-L1-F2 coding sequence may be different or they may be the same.

В еще одних вариантах реализации изобретения трансфицированные клетки являются стабильно трансфицированными. Эти клетки могут быть отобраны и поддерживаться в виде стабильной клеточной линии с использованием стандартных методов, известных специалистам в данной области.In yet other embodiments, the transfected cells are stably transfected. These cells can be selected and maintained as a stable cell line using standard methods known to those skilled in the art.

Клетки-хозяева, содержащие конструкции ДНК белка, выращивают в подходящей питательной среде. Используемый в данном документе термин соответствующая питательная среда означает среду, содержащую питательные вещества, необходимые для роста клеток. Питательные вещества, необходимые для роста клеток могут включать в себя источник углерода, источник азота, незаменимые аминокислоты, витамины, минералы и факторы роста. В некоторых случаях, среда может содержать один или более факторов выбора. В некоторых случаях, среда может содержать бычью сыворотку или эмбриональную телячью сыворотку (ЭТС). В одном варианте реализации изобретения среда практически не содержит IgG. Питательная среда, как правило, выбирается для клеток, содержащих конструкцию ДНК, через, например, отбор по чувствительности к лекарственному препарату или недостаток необходимого питательного вещества, которое дополняется через селектируемый маркер на конструкции ДНК или котрансфицируется с конструкцией ДНК. Культивируемые клетки млекопитающих обычно выращивают в коммерчески доступной среде, содержащей сыворотку, или бессывороточной среде (например, MEM, DMEM, DMEM/F12). В одном варианте реализации изобретения средой является CD293 (Инвитроджен, Карлсбат, Калифорния). В другом варианте реализации изобретения средой является CD17 (Инвитроджен, Карлсбат, Калифорния). Выбор среды, подходящей для конкретной используемой клеточной линии, определяется уровнем средних специалистов в данной области техники.Host cells containing the protein DNA constructs are grown in a suitable growth medium. As used herein, the term appropriate culture medium means a medium containing nutrients necessary for cell growth. Nutrients required for cell growth may include a carbon source, a nitrogen source, essential amino acids, vitamins, minerals, and growth factors. In some cases, the environment may contain one or more selection factors. In some cases, the medium may contain bovine serum or fetal bovine serum (FBS). In one embodiment of the invention, the medium contains substantially no IgG. The culture medium is typically selected for cells containing the DNA construct, through, for example, selection for drug sensitivity or lack of an essential nutrient, which is supplemented through a selectable marker on the DNA construct or cotransfected with the DNA construct. Cultured mammalian cells are typically grown in commercially available serum-containing or serum-free media (eg, MEM, DMEM, DMEM/F12). In one embodiment, the medium is CD293 (Invitrogen, Carlsbath, Calif.). In another embodiment, the medium is CD17 (Invitrogen, Carlsbath, Calif.). The choice of medium suitable for the particular cell line used is determined by the level of those of ordinary skill in the art.

Для того, чтобы коэкспрессировать две полипептидные цепи химерного белка, клетки-хозяева культивируют в условиях, которые позволяют экспрессию обеих цепей. В контексте данного документа, культивирование означает поддержание живых клеток in vitro по меньшей мере на протяжении определенного времени. Поддержание может включать в себя, хотя и не обязательно, увеличение популяции живых клеток. Например, клетки, поддерживаемые в культуре, могут быть статическими в популяции, но по-прежнему жизнеспособными и способны производить желаемый продукт, например, рекомбинантный белок или рекомбинантный слитый белок. Подходящие условия для культивирования эукариотических клеток хорошо известны в данной области техники и включают в себя надлежащий выбор питательных сред, добавки к питательным средам, температуру, pH, насыщение кислородом и тому подобное. Для коммерческих целей, культивирование может включать в себя использование любого из различных типов систем промышленного масштаба, в том числе встряхиваемые колбы, вращающиеся флаконы, биореакторы с полыми волокнами, биореакторы с механическим перемешиванием, аэрлифтные биореакторы, волновые биореакторы и другие.In order to co-express two polypeptide chains of a chimeric protein, host cells are cultured under conditions that allow expression of both chains. As used herein, culture means maintaining living cells in vitro for at least a certain period of time. Maintenance may include, but does not necessarily include, increasing the population of living cells. For example, cells maintained in culture may be static in the population but still be viable and capable of producing the desired product, such as a recombinant protein or recombinant fusion protein. Suitable conditions for culturing eukaryotic cells are well known in the art and include proper selection of culture media, culture media additives, temperature, pH, oxygenation, and the like. For commercial purposes, cultivation may involve the use of any of various types of industrial scale systems, including shake flasks, spinner flasks, hollow fiber bioreactors, mechanically stirred bioreactors, airlift bioreactors, wave bioreactors, and others.

Условия культивирования клеток также подбираются таким образом, чтобы позволить фрагменту ФВ соединиться с белком FVIII. Условия, обеспечивающие экспрессию фрагмента ФВ и/или белка FVIII могут включать в себя наличие источника витамина К. Например, в одном варианте реализации изобретения стабильно трансфицированные клетки HEK293 культивируются в среде CD293 (Инвитроджен, Карлсбат, Калифорния) или среде OptiCHO (Инвитроджен, Карлсбат, Калифорния) с добавлением 4 мМ глутамина.Cell culture conditions are also selected to allow the VWF fragment to combine with the FVIII protein. Conditions that allow expression of the VWF fragment and/or FVIII protein may include the presence of a source of vitamin K. For example, in one embodiment, stably transfected HEK293 cells are cultured in CD293 medium (Invitrogen, Carlsbath, Calif.) or OptiCHO medium (Invitrogen, Carlsbath, Calif.) California) with the addition of 4 mM glutamine.

В одном аспекте, настоящее изобретение относится к способу экспрессии, изготовления или производства химерного белка настоящего изобретения, который включает а) трансфекцию клетки-хозяина,In one aspect, the present invention relates to a method of expressing, making or producing a chimeric protein of the present invention, which includes a) transfecting a host cell,

- 96 044115 содержащей полинуклеотид, кодирующий химерный белок и b) культивирование клетки-хозяина в культуральной среде, в условиях, подходящих для экспрессии химерного белка, причем химерный белок является экспрессированным.- 96 044115 containing a polynucleotide encoding a chimeric protein and b) culturing the host cell in a culture medium, under conditions suitable for expression of the chimeric protein, wherein the chimeric protein is expressed.

В дополнительных вариантах реализации изобретения в среду секретируется белковый продукт, содержащий белок FVIII, связанный с первой константной областью ИГ или ее частью и/или белок ФВ, слитый со второй константной областью ИГ или ее частью с помощью последовательности XTEN. Среда отделяется от клеток, концентрируется, фильтруется, а затем пропускается через две или три колонки для аффинной хроматографии, например, колонку белка А и одну или две анионообменные колонки.In additional embodiments, a protein product is secreted into the medium comprising an FVIII protein linked to a first IG constant region or a portion thereof and/or a VWF protein fused to a second IG constant region or a portion thereof using the XTEN sequence. The medium is separated from the cells, concentrated, filtered, and then passed through two or three affinity chromatography columns, such as a protein A column and one or two anion exchange columns.

В некоторых аспектах настоящее изобретение относится к химерному белку, полученному способами, описанными в данном документе.In some aspects, the present invention relates to a chimeric protein produced by the methods described herein.

Производство in vitro позволяет выход на промышленные масштабы для получения большого количества желаемых измененных полипептидов данного изобретения. Методики культивирования клеток млекопитающих в условиях культивирования тканей известны в данной области техники и включают в себя гомогенную суспензионную культуру, например, в аэролифтном реакторе или в реакторе непрерывного действия с мешалкой, или иммобилизированной или инкапсулированной культуре клеток, например, в полых волокнах, микрокапсулах, на агарозных микрогранулах или керамических картриджах. Хроматография включает в себя, например, аффинную хроматографию, ионообменную хроматографию, гидрофобную хроматографию, гель-фильтрацию, хроматографию с обращенной фазой и адсорбционную хроматографию (Strategies for Protein Purification and Characterization:In vitro production allows for industrial scale production of large quantities of the desired modified polypeptides of the present invention. Techniques for culturing mammalian cells under tissue culture conditions are known in the art and include homogeneous suspension culture, for example, in an airlift reactor or in a continuous stirred tank reactor, or immobilized or encapsulated cell culture, for example, in hollow fibers, microcapsules, agarose microbeads or ceramic cartridges. Chromatography includes, for example, affinity chromatography, ion exchange chromatography, hydrophobic interaction chromatography, gel filtration, reverse phase chromatography and adsorption chromatography (Strategies for Protein Purification and Characterization:

IV. Фармацевтическая композиция.IV. Pharmaceutical composition.

Композиции, содержащие химерный белок настоящего изобретения могут содержать подходящий фармацевтически приемлемый носитель. Например, они могут содержать наполнители и/или вспомогательные вещества, которые облегчают переработку активных соединений в препараты, предназначенные для доставки к месту действия.Compositions containing the chimeric protein of the present invention may contain a suitable pharmaceutically acceptable carrier. For example, they may contain excipients and/or excipients that facilitate the processing of the active compounds into drugs intended for delivery to the site of action.

Фармацевтическая композиция может быть приготовлена для парентерального введения (т.е. внутривенно, подкожно или внутримышечно) путем болюсной инъекции. Лекарственные формы для инъекции могут быть представлены в единичной лекарственной форме, например, в ампулах или в многодозовых контейнерах с добавленным консервантом. Композиции могут принимать формы суспензий, растворов или эмульсий в масляных или водных жидких носителях, и содержать вспомогательные агенты, такие как суспендирующие, стабилизирующие и/или диспергирующие агенты. В альтернативном варианте, активный ингредиент может быть в форме порошка для разбавления с подходящим носителем, например, апирогенной водой.The pharmaceutical composition can be prepared for parenteral administration (ie, intravenously, subcutaneously or intramuscularly) by bolus injection. Injectable dosage forms may be presented in single dosage form, such as ampoules, or in multi-dose containers with an added preservative. The compositions may take the form of suspensions, solutions or emulsions in oily or aqueous liquid vehicles, and contain auxiliary agents such as suspending, stabilizing and/or dispersing agents. Alternatively, the active ingredient may be in powder form for reconstitution with a suitable carrier, for example, pyrogen-free water.

Подходящие для парентерального введения лекарственные формы также включают водные растворы активных соединений в водорастворимой форме, например, водорастворимые соли. Кроме того, могут быть введены суспензии активных соединений в виде подходящих масляных суспензий для инъекций. Подходящие липофильные растворители и носители включают жирные масла, например, кунжутное масло или синтетические сложные эфиры жирных кислот, например, этилолеат или триглицериды. Водные суспензии для инъекций могут содержать вещества, которые увеличивают вязкость суспензии, в том числе, например, карбоксиметилцеллюлозу натрия, сорбит и декстран. В некоторых случаях, суспензия может также содержать стабилизаторы. Для инкапсулирования молекул изобретения с целью доставки в клетки или интерстициальные пространства также могут быть использованы липосомы. Примерные фармацевтически приемлемые носители представляют собой физиологически совместимые растворители, дисперсионные среды, покрытия, антибактериальные и противогрибковые агенты, изотонические и задерживающие всасывание агенты, воду, физиологический раствор, физиологический раствор с фосфатным буфером, декстрозу, глицерин, этанол и тому подобные. В некоторых вариантах реализации изобретения композиция содержит изотонические агенты, например, сахара, полиспирты, такие как маннит, сорбит или хлорид натрия. В других вариантах реализации изобретения композиции содержат фармацевтически приемлемые вещества, такие как смачивающие агенты или небольшие количества вспомогательных веществ, таких как смачивающие или эмульсифицирующие агенты, консерванты или буферы, которые увеличивают срок хранения или эффективность активных ингредиентов.Dosage forms suitable for parenteral administration also include aqueous solutions of the active compounds in water-soluble form, for example, water-soluble salts. In addition, suspensions of the active compounds can be administered in the form of suitable oily injection suspensions. Suitable lipophilic solvents and carriers include fatty oils, for example sesame oil, or synthetic fatty acid esters, for example ethyl oleate or triglycerides. Aqueous injection suspensions may contain substances that increase the viscosity of the suspension, including, for example, sodium carboxymethylcellulose, sorbitol and dextran. In some cases, the suspension may also contain stabilizers. Liposomes can also be used to encapsulate the molecules of the invention for delivery into cells or interstitial spaces. Exemplary pharmaceutically acceptable carriers include physiologically compatible solvents, dispersion media, coatings, antibacterial and antifungal agents, isotonic and absorption delaying agents, water, saline, phosphate buffered saline, dextrose, glycerol, ethanol, and the like. In some embodiments, the composition contains isotonic agents, such as sugars, polyalcohols such as mannitol, sorbitol, or sodium chloride. In other embodiments, the compositions contain pharmaceutically acceptable agents such as wetting agents or small amounts of excipients such as wetting or emulsifying agents, preservatives or buffers that increase the shelf life or potency of the active ingredients.

Композиции данного изобретения могут быть представлены в различных формах, включая, например, жидкости (например, инъекционные и нерастворимые растворы), дисперсии, суспензии, полутвердые и твердые лекарственные формы. Выбор предпочтительной формы зависит от способа введения и терапевтического применения.The compositions of this invention may be presented in various forms, including, for example, liquids (eg, injectable and insoluble solutions), dispersions, suspensions, semi-solid and solid dosage forms. The choice of the preferred form depends on the route of administration and therapeutic use.

Композиция может быть сформулирована в виде раствора, микроэмульсии, дисперсии, липосомы или другой упорядоченной структуры, подходящей для высокой концентрации лекарственного средства. Стерильные инъекционные растворы могут быть получены путем объединения активного ингредиента в необходимом количестве в подходящем растворителе с одним или комбинацией ингредиентов, перечисленных выше, по необходимости, с последующей стерилизующей фильтрацией. В общем, дисперсии получают введением активного ингредиента в стерильный растворитель, который содержит основную дисперсионную среду и необходимые другие ингредиенты из перечисленных выше. В случае использования стерильных порошков для изготовления стерильных инъекционных растворов предпочтительнымиThe composition may be formulated as a solution, microemulsion, dispersion, liposome, or other ordered structure suitable for high drug concentrations. Sterile injection solutions can be prepared by combining the active ingredient in the required amount in a suitable solvent with one or a combination of the ingredients listed above, as necessary, followed by sterilizing filtration. In general, dispersions are prepared by introducing the active ingredient into a sterile diluent that contains the basic dispersion medium and the necessary other ingredients listed above. In the case of using sterile powders for the preparation of sterile injection solutions, it is preferable

- 97 044115 способами приготовления являются вакуумная сушка и лиофилизация, в результате которых образуется порошкообразное вещество активного ингредиента, а также любой необходимый дополнительный ингредиент из раствора, предварительно стерилизованного путем фильтрации. Надлежащая текучесть раствора может поддерживаться, например, посредством покрытия оболочкой, такой как лецитин, путем поддержания требуемого размера частиц в случае дисперсии, а также использованием поверхностноактивных веществ. Пролонгированная абсорбция инъекционных композиций может осуществляться путем включения в композицию вещества, которое задерживает абсорбцию, например, солей моностеарата и желатина.- 97 044115 methods of preparation are vacuum drying and lyophilization, which results in the formation of a powdered substance of the active ingredient, as well as any necessary additional ingredient, from a solution previously sterilized by filtration. Proper fluidity of the solution can be maintained, for example, by coating with a coating such as lecithin, by maintaining the required particle size in the case of a dispersion, and by the use of surfactants. Prolonged absorption of injectable compositions can be achieved by including in the composition a substance that delays absorption, for example, monostearate and gelatin salts.

Активный ингредиент может быть приготовлен с лекарственной формой или устройством, которые имеют контролируемое высвобождение. Примеры таких лекарственных форм и устройств включают имплантаты, трансдермальные пластыри и микроинкапсулированные системы доставки. Могут использоваться биоразрушаемые, биосовместимые полимеры, например, этиленвинилацетат, полиангидриды, полигликолевая кислота, коллаген, полиортоэфиры и полимолочная кислота. Способы получения таких лекарственных форм и устройств известны в данной области техники. См., например, Sustained and Controlled Release Drug Delivery Systems, J. R. Robinson, изд., Marcel Dekker, Inc., Нью-Йорк, 1978.The active ingredient may be formulated in a dosage form or device that has a controlled release. Examples of such dosage forms and devices include implants, transdermal patches, and microencapsulated delivery systems. Biodegradable, biocompatible polymers can be used, such as ethylene vinyl acetate, polyanhydrides, polyglycolic acid, collagen, polyorthoesters and polylactic acid. Methods for preparing such dosage forms and devices are known in the art. See, for example, Sustained and Controlled Release Drug Delivery Systems, J. R. Robinson, ed., Marcel Dekker, Inc., New York, 1978.

Инъекционные лекарственные формы пролонгированного действия могут быть изготовлены путем формирования микроинкапсулированных матриц лекарственного средства в поддающихся биологическому разложению полимерах, таких как полилактид-полигликолид. В зависимости от соотношения лекарственного средства и полимера, а также природы применяемого полимера, скоростью высвобождения лекарственного средства можно управлять. Другими типичными поддающимися биологическому разложению полимерами являются полиортоэфиры и полиангидриды. Инъекционные лекарственные формы пролонгированного действия также могут быть получены включением лекарственного средства в липосомы или микроэмульсии.Long-acting injectable dosage forms can be prepared by forming microencapsulated drug matrices in biodegradable polymers such as polylactide-polyglycolide. Depending on the drug to polymer ratio and the nature of the polymer used, the rate of drug release can be controlled. Other typical biodegradable polymers are polyorthoesters and polyanhydrides. Long-acting injectable dosage forms can also be prepared by incorporating the drug into liposomes or microemulsions.

Дополнительные активные соединения могут быть введены в состав композиций. В одном варианте реализации изобретения химерный белок изобретения приготовлен с другим фактором свертывания крови или его вариантом, фрагментом, аналогом или производным. Так, например, фактор свертывания крови включает, не ограничиваясь, фактор V, фактор VII, фактор VIII, фактор IX, фактор X, фактор XI, фактор XII, фактор XIII, протромбин, фибриноген, фактор фон Виллебранда или рекомбинантный растворимый тканевый фактор (rsTF) или активированные формы любого из предыдущих факторов. Фактор свертывания крови гемостатического средства также может включать антифибринолитические лекарственные средства, например, аминокапроновую кислоту, транекзамовую кислоту.Additional active compounds may be included in the compositions. In one embodiment, the chimeric protein of the invention is formulated with another coagulation factor or a variant, fragment, analog or derivative thereof. For example, coagulation factor includes, but is not limited to, factor V, factor VII, factor VIII, factor IX, factor X, factor XI, factor XII, factor XIII, prothrombin, fibrinogen, von Willebrand factor, or recombinant soluble tissue factor (rsTF ) or activated forms of any of the previous factors. The blood clotting factor of the hemostatic agent may also include antifibrinolytic drugs, for example, aminocaproic acid, tranexamic acid.

Схемы дозирования могут быть подобраны для обеспечения оптимального желаемого ответа. Так, например, может быть введена одноразовая доза, в динамике могут быть введены несколько раздельных доз, или доза может быть пропорционально уменьшена или увеличена, как указывается при остроте терапевтической ситуации. Преимущественным является формулировать парентеральные композиции в одноразовой дозированной форме для простоты введения и однородности дозы. См., например, Remington's Pharmaceutical Sciences (Mack Pub. Co., Истон, штат Пенсильвания. 1980 год).Dosing regimens can be adjusted to provide the optimal desired response. So, for example, a single dose can be administered, several separate doses can be administered over time, or the dose can be proportionally reduced or increased, as indicated by the severity of the therapeutic situation. It is advantageous to formulate parenteral compositions in unit dosage form for ease of administration and dose uniformity. See, for example, Remington's Pharmaceutical Sciences (Mack Pub. Co., Easton, PA. 1980).

В дополнение к активным соединениям, жидкая лекарственная форма может содержать инертные разбавители такие как вода, этиловый спирт, этилкарбонат, этилацетат, бензиловый спирт, бензилбензоат, пропиленгликоль, 1,3-бутиленгликоль, диметилформамид, масла, глицерин, тетрагидрофурфуриловый спирт, полиэтиленгликоли и жирнокислотные эфиры сорбитана.In addition to the active compounds, the liquid dosage form may contain inert diluents such as water, ethyl alcohol, ethyl carbonate, ethyl acetate, benzyl alcohol, benzyl benzoate, propylene glycol, 1,3-butylene glycol, dimethylformamide, oils, glycerin, tetrahydrofurfuryl alcohol, polyethylene glycols and fatty acid esters. sorbitan.

Не ограничивающие изобретение примеры подходящих фармацевтических носителей описаны также в Remington's Pharmaceutical Sciences E. W. Martin. Некоторые примеры наполнителей включают крахмал, глюкозу, лактозу, сахарозу, желатин, солод, рис, муку, мел, силикагель, стеарат натрия, моностеарат глицерина, тальк, хлорид натрия, сухое обезжиренное молоко, глицерин, пропилен, гликоль, воду, этанол и тому подобные. Композиция может также содержать pH забуферивающие реагенты и увлажняющие или эмульсирующие агенты.Non-limiting examples of suitable pharmaceutical carriers are also described in Remington's Pharmaceutical Sciences E. W. Martin. Some examples of excipients include starch, glucose, lactose, sucrose, gelatin, malt, rice, flour, chalk, silica gel, sodium stearate, glycerol monostearate, talc, sodium chloride, skim milk powder, glycerin, propylene, glycol, water, ethanol, etc. similar. The composition may also contain pH buffering agents and wetting or emulsifying agents.

Для перорального введения фармацевтическая композиция может принимать форму таблеток или капсул, полученных обычными способами. Композиция также может быть приготовлена в виде жидкости, например, сиропа или суспензии. Жидкость может содержать суспендирующие агенты (например, сироп сорбита, производные целлюлозы или гидрогенизированные пищевые жиры), эмульгирующие агенты (лецитин или аравийскую камедь), неводные носители (например, миндальное масло, жирные сложные эфиры, этиловый спирт или фракционированные растительные масла) и консерванты (например, метил или пропил-п-гидроксибензоаты или сорбиновую кислоту). Препараты могут также включать ароматизаторы, красители и подсластители. В альтернативном варианте, композиция может быть представлена в виде сухого продукта для разведения водой или другим подходящим носителем.For oral administration, the pharmaceutical composition may take the form of tablets or capsules prepared by conventional methods. The composition may also be formulated as a liquid, such as a syrup or suspension. The liquid may contain suspending agents (for example, sorbitol syrup, cellulose derivatives or hydrogenated edible fats), emulsifying agents (lecithin or gum acacia), non-aqueous vehicles (for example, almond oil, fatty esters, ethyl alcohol or fractionated vegetable oils) and preservatives ( for example, methyl or propyl p-hydroxybenzoates or sorbic acid). The preparations may also include flavorings, colors and sweeteners. Alternatively, the composition may be presented as a dry product for reconstitution with water or other suitable carrier.

Для буккального введения, в соответствии с обычными протоколами, композиция может принимать форму таблеток или пастилок.For buccal administration, according to conventional protocols, the composition may take the form of tablets or lozenges.

Для введения путем ингаляции, соединения, используемые в соответствии с настоящим изобретением, обычно доставляются в виде распыленного аэрозоля с или без вспомогательных веществ или в виде аэрозольного спрея из аэрозольной упаковки или распылителя, в некоторых случаях, с газомвытеснителем, например, дихлордифторметаном, трихлорфторметаном, дихлортетрафторметаном, диок- 98 044115 сидом углерода или другим подходящим газом. В случае аэрозоля под давлением, единица дозы может быть определена с помощью клапана для доставки дозированного количества. Для использования в ингаляторе или инсуффляторе могут быть сформулированы капсулы и картриджи из, например, желатина с содержанием порошкообразной смеси соединения и подходящей порошковой основы, такой как лактоза или крахмал.For administration by inhalation, the compounds used in accordance with the present invention are typically delivered as a nebulized aerosol with or without excipients or as an aerosol spray from an aerosol container or nebulizer, in some cases with a propellant, e.g., dichlorodifluoromethane, trichlorofluoromethane, dichlorotetrafluoromethane , carbon dioxide or other suitable gas. In the case of a pressurized aerosol, the dose unit can be determined by using a valve to deliver the metered quantity. For use in an inhaler or insufflator, capsules and cartridges may be formulated from, for example, gelatin containing a powder mixture of the compound and a suitable powder base such as lactose or starch.

Фармацевтическая композиция также может быть приготовлена для ректального введения в виде суппозитория или удерживающей клизмы, например, содержащих обычные суппозиторные основы, такие как масло какао или другие глицериды.The pharmaceutical composition may also be prepared for rectal administration in the form of a suppository or retention enema, for example containing conventional suppository bases such as cocoa butter or other glycerides.

В одном варианте реализации изобретения фармацевтическая композиция содержит химерный белок, полинуклеотид, кодирующий химерный белок, вектор, содержащий полинуклеотид, или клеткухозяина, содержащую вектор и фармацевтически приемлемый носитель. Белок FVIII в химерном белке имеет более продолжительный период полувыведения по сравнению с белком FVIII дикого типа или соответствующим белком FVIII без фрагмента ФВ. В одном варианте реализации изобретения, в котором период полувыведения химерного белка по меньшей мере в около 1,5 раза, по меньшей мере в около 2 раза, по меньшей мере в около 2,5 раза, по меньшей мере в около 3 раза, по меньшей мере в около 4 раза, по меньшей мере в около 5 раз, по меньшей мере в около 6 раз, по меньшей мере в около 7 раз, по меньшей мере в около 8 раз, по меньшей мере в около 9 раз, по меньшей мере в около 10 раз, по меньшей мере в около 11 раз или по меньшей мере в около 12 раз более продолжителен чем таковой у белка FVIII дикого типа. В другом варианте реализации изобретения период полувыведения Фактора VIII составляет по меньшей мере около 17 ч, по меньшей мере около 18 ч, по меньшей мере около 19 ч, по меньшей мере около 20 ч, по меньшей мере около 21 ч, по меньшей мере около 22 ч, по меньшей мере около 23 ч, по меньшей мере около 24 ч, по меньшей мере около 25 ч, по меньшей мере около 26 ч, по меньшей мере около 27 ч, по меньшей мере около 28 ч, по меньшей мере около 29 ч, по меньшей мере около 30 ч, по меньшей мере около 31 ч, по меньшей мере около 32 ч, по меньшей мере около 33 ч, по меньшей мере около 34 ч, по меньшей мере около 35 ч, по меньшей мере около 36 ч, по меньшей мере около 48 ч, по меньшей мере около 60 ч, по меньшей мере около 72 ч, по меньшей мере около 84 ч, по меньшей мере около 96 ч или по меньшей мере около 108 ч.In one embodiment, the pharmaceutical composition comprises a chimeric protein, a polynucleotide encoding the chimeric protein, a vector containing the polynucleotide, or a host cell containing the vector, and a pharmaceutically acceptable carrier. The FVIII protein in the chimeric protein has a longer half-life compared to wild-type FVIII protein or the corresponding FVIII protein without the VWF fragment. In one embodiment of the invention, wherein the half-life of the chimeric protein is at least about 1.5 times, at least about 2 times, at least about 2.5 times, at least about 3 times, at least at least about 4 times, at least about 5 times, at least about 6 times, at least about 7 times, at least about 8 times, at least about 9 times, at least about about 10 times, at least about 11 times, or at least about 12 times longer than that of wild-type FVIII protein. In another embodiment, the half-life of Factor VIII is at least about 17 hours, at least about 18 hours, at least about 19 hours, at least about 20 hours, at least about 21 hours, at least about 22 hours, at least about 23 hours, at least about 24 hours, at least about 25 hours, at least about 26 hours, at least about 27 hours, at least about 28 hours, at least about 29 hours , at least about 30 hours, at least about 31 hours, at least about 32 hours, at least about 33 hours, at least about 34 hours, at least about 35 hours, at least about 36 hours, at least about 48 hours, at least about 60 hours, at least about 72 hours, at least about 84 hours, at least about 96 hours, or at least about 108 hours.

В некоторых вариантах реализации изобретения композиция вводится путем, выбранным из группы, состоящей из местного введения, интраокулярного введения, парентерального введения, интратекального введения, субдурального введения и перорального введения. Парентеральное введение может быть внутривенным или подкожным введением.In some embodiments, the composition is administered by a route selected from the group consisting of local administration, intraocular administration, parenteral administration, intrathecal administration, subdural administration, and oral administration. Parenteral administration may be intravenous or subcutaneous administration.

В других вариантах реализации изобретения композиция используется для лечения геморрагического заболевания или состояния, у пациента, имеющего для этого показания. Геморрагическое заболевание или состояние выбрано из группы, состоящей из кровотечения, вызванного нарушением свертываемости крови, гемартроза, мышечного кровотечения, кровотечения полости рта, кровоизлияния, мышечного кровоизлияния, кровоизлияния полости рта, травмы, травмы головы, желудочно-кишечного кровотечения, внутричерепного кровоизлияния, внутрибрюшного кровоизлияния, внутригрудного кровоизлияния, перелома костей, кровотечения центральной нервной системы, кровотечения в заглоточном пространстве, кровотечения в забрюшинном пространстве, кровотечения во влагалище подвздошнопоясничной мышцы и их любых комбинациях. В других вариантах реализации изобретения субъект планирует перенести операцию. В еще одних вариантах реализации изобретения лечение является профилактическим или по требованию.In other embodiments, the composition is used to treat a hemorrhagic disease or condition in a patient indicated for it. The hemorrhagic disease or condition is selected from the group consisting of bleeding due to a bleeding disorder, hemarthrosis, muscle hemorrhage, oral hemorrhage, hemorrhage, muscle hemorrhage, oral hemorrhage, trauma, head injury, gastrointestinal hemorrhage, intracranial hemorrhage, intra-abdominal hemorrhage , intrathoracic hemorrhage, bone fracture, bleeding of the central nervous system, bleeding in the retropharyngeal space, bleeding in the retroperitoneal space, bleeding in the sheath of the iliopsoas muscle and any combinations thereof. In other embodiments, the subject is planning to undergo surgery. In yet other embodiments, the treatment is prophylactic or on demand.

V. Генная терапия.V. Gene therapy.

Химерный белок настоящего изобретения может быть получен in vivo в организме млекопитающего, например, человеческого пациента, с использованием подходов генной терапии, а также может быть терапевтически полезным для лечения геморрагического заболевания или расстройства, выбранного из группы, состоящей из кровотечения, вызванного нарушением свертываемости крови, гемартроза, мышечного кровотечения, кровотечения полости рта, кровоизлияния, мышечного кровоизлияния, кровоизлияния полости рта, травмы, травмы головы, желудочно-кишечного кровотечения, внутричерепного кровоизлияния, внутрибрюшного кровоизлияния, внутригрудного кровоизлияния, перелома костей, кровотечения центральной нервной системы, кровотечения в заглоточном пространстве, кровотечения в забрюшинном пространстве и кровотечения во влагалище подвздошно-поясничной мышцы. В одном варианте реализации изобретения геморрагическое заболевание или расстройство является гемофилией. В другом варианте реализации изобретения геморрагическое заболевание или расстройство является гемофилией А. Это включает в себя введение подходящей химерной, функционально связанной с подходящими регуляторными последовательностями нуклеиновой кислоты, кодирующей белок. В определенном варианте реализации изобретения эти последовательности входят в состав вирусного вектора. Подходящие для такой генной терапии вирусные векторы включают аденовирусные векторы, лентивирусные векторы, бакуловирусные векторы, векторы на основе вируса Эпштейна-Барра, паповавирусные векторы, векторы на основе вируса коровьей оспы, векторы на основе вируса простого герпеса и векторы на основе аденоассоциированного вируса (AAV). Вирусный вектор может быть вирусным вектором с дефектной репликацией. В других вариантах реализации изобретения аденовирусный вектор имеет делецию в егоThe chimeric protein of the present invention can be produced in vivo in a mammal, such as a human patient, using gene therapy approaches, and may also be therapeutically useful for treating a hemorrhagic disease or disorder selected from the group consisting of bleeding caused by a bleeding disorder, hemarthrosis, muscle bleeding, oral bleeding, hemorrhage, muscle hemorrhage, oral hemorrhage, trauma, head injury, gastrointestinal bleeding, intracranial hemorrhage, intra-abdominal hemorrhage, intrathoracic hemorrhage, bone fracture, bleeding of the central nervous system, bleeding in the retropharyngeal space, bleeding in the retroperitoneal space and bleeding in the sheath of the iliopsoas muscle. In one embodiment of the invention, the bleeding disease or disorder is hemophilia. In another embodiment of the invention, the hemorrhagic disease or disorder is hemophilia A. This involves the introduction of a suitable chimeric protein encoding nucleic acid operably linked to suitable regulatory sequences. In a certain embodiment of the invention, these sequences are included in the viral vector. Suitable viral vectors for such gene therapy include adenoviral vectors, lentiviral vectors, baculoviral vectors, Epstein-Barr virus vectors, papovavirus vectors, vaccinia virus vectors, herpes simplex virus vectors, and adeno-associated virus (AAV) vectors. . The viral vector may be a replication-defective viral vector. In other embodiments, the adenoviral vector has a deletion in its

- 99 044115- 99 044115

Е1 гене или Е3 гене. Когда используется аденовирусный вектор, млекопитающее может не подвергаться воздействию нуклеиновой кислоты, кодирующей селектируемый маркерный ген. В других вариантах реализации изобретения последовательности включены в невирусный вектор, известный специалистам в данной области техники.E1 gene or E3 gene. When an adenoviral vector is used, the mammal may not be exposed to the nucleic acid encoding the selectable marker gene. In other embodiments, the sequences are included in a non-viral vector known to those skilled in the art.

VI. Способы использования химерного белка.VI. Methods of using chimeric protein.

Настоящее изобретение относится к способу использования химерного белка, описанного в настоящем документе, для предотвращения или ингибирования связывания эндогенного ФВ с белком FVIII. Настоящее изобретение относится к способу использования химерного белка, имеющего белок FVIII связанный с XTEN и константную область ИГ или его часть.The present invention relates to a method of using the chimeric protein described herein to prevent or inhibit the binding of endogenous VWF to the FVIII protein. The present invention relates to a method of using a chimeric protein having an FVIII protein associated with XTEN and an IG constant region or part thereof.

Один аспект настоящего изобретения относится к предотвращению или ингибированию взаимодействия FVIII с эндогенным ФВ путем блокирования или экранирования сайта связывания ФВ на FVIII от эндогенного ФВ и в то же время продлевая период полувыведения химерного белка с использованием последовательности XTEN в комбинации с константной областью ИГ или его части, что также может увеличителем периода полувыведения. В одном варианте реализации изобретение относится к способу конструирования белка FVIII, имеющего более длительный период полувыведения, чем FVIII дикого типа. Химерный белок, который является пригодным для использования в способе, включает любой один или более химерный белок, описанный в настоящем документе.One aspect of the present invention relates to preventing or inhibiting the interaction of FVIII with endogenous VWF by blocking or shielding the VWF binding site on FVIII from endogenous VWF and at the same time prolonging the half-life of the chimeric protein using the XTEN sequence in combination with the IG constant region or part thereof, which may also increase the half-life. In one embodiment, the invention relates to a method for constructing an FVIII protein having a longer half-life than wild-type FVIII. A chimeric protein that is suitable for use in the method includes any one or more chimeric proteins described herein.

Другой вариант реализации настоящего изобретения включает в себя способ введения субъекту, имеющему для этого показания, химерного белка, содержащего белок FVIII, имеющий более продолжительный период полувыведения, чем такой у дикого типа FVIII, причем способ включает введение химерного белка, описанного в настоящем документе, субъекту.Another embodiment of the present invention includes a method of administering to a subject having an indication for this purpose a chimeric protein comprising an FVIII protein having a longer half-life than that of wild type FVIII, the method comprising administering the chimeric protein described herein to the subject .

В одном варианте реализации изобретение относится к способу использования последовательности XTEN и константной области ИГ или его части для продления периода полувыведения химерного белка, содержащего белок FVIII и белок ФВ, что предотвращает или ингибирует взаимодействие эндогенного ФВ с белком FVIII. Белок FVIII связан с последовательностью XTEN (например, FVIII(X)) и затем связан или соединен с белком ФВ, слитым с XTEN и константной областью ИГ или его частью, является экранированным или защищенным от пути клиренса ФВ и поэтому имеет сниженный клиренс по сравнению с белком FVIII, не связанным с белком ФВ. Таким образом экранированный белок FVIII имеет максимальное продление периода полувыведения по сравнению с белком FVIII, не связанным или соединенным с последовательностью XTEN и белком ФВ. В некоторых вариантах реализации изобретения белок FVIII, соединенный с или защищенный белком ФВ и связанный с последовательностью XTEN, не очищается через рецептор клиренса ФВ. В некоторых вариантах реализации изобретения белок FVIII, соединенный с или защищенный белком ФВ и связанный с последовательностью XTEN, выводится из системы медленнее, чем белок FVIII, не соединенный с или защищенный белком ФВ и связанный с последовательностью XTEN.In one embodiment, the invention relates to a method of using an XTEN sequence and an IG constant region or portion thereof to prolong the half-life of a chimeric protein comprising an FVIII protein and a VWF protein, thereby preventing or inhibiting the interaction of endogenous VWF with the FVIII protein. The FVIII protein is associated with an XTEN sequence (eg, FVIII(X)) and is then associated or coupled to a VWF protein fused to XTEN and the IG constant region or part thereof, is shielded or protected from the VWF clearance pathway, and therefore has reduced clearance compared to FVIII protein not related to VWF protein. Thus, shielded FVIII protein has the maximum half-life extension compared to FVIII protein unbound or coupled to the XTEN sequence and VWF protein. In some embodiments, the FVIII protein coupled to or protected by the VWF protein and linked to the XTEN sequence is not cleared through the VWF clearance receptor. In some embodiments, FVIII protein coupled to or protected by the VWF protein and linked to the XTEN sequence is cleared from the system more slowly than FVIII protein not coupled to or protected by the VWF protein and linked to the XTEN sequence.

В одном аспекте химерный белок, содержащий белок FVIII, связанный с последовательностью XTEN, или белок FVIII, связанный или соединенный с белком ФВ, связанным с XTEN, имеет пониженный клиренс из кровотока, так как белок ФВ не содержит сайт связывания с рецептором клиренса ФВ. Белок ФВ предотвращает или ингибирует клиренс FVIII, связанного или соединенного с белком ФВ, из системы через путь клиренса ФВ. Пригодные для настоящего изобретения белки ФВ могут также обеспечить, по меньшей мере одно или более ФВ-подобных FVIII свойств защиты, которые обеспечиваются эндогенными ФВ. В некоторых вариантах реализации изобретения белок ФВ или последовательность XTEN могут также скрывать один или более сайт связывания с рецептором клиренса FVIII, таким образом, предотвращая клиренс FVIII через свой собственный путь клиренса.In one aspect, a chimeric protein comprising an FVIII protein linked to an XTEN sequence, or a FVIII protein bound or fused to a VWF protein linked to XTEN, has reduced clearance from the bloodstream because the VWF protein does not contain a binding site for the VWF clearance receptor. The VWF protein prevents or inhibits the clearance of FVIII bound or coupled to the VWF protein from the system through the VWF clearance pathway. VWF proteins useful for the present invention may also provide at least one or more VWF-like protective properties that are provided by endogenous VWF. In some embodiments, the VWF protein or XTEN sequence may also conceal one or more FVIII clearance receptor binding sites, thereby preventing clearance of FVIII through its own clearance pathway.

В некоторых вариантах реализации изобретения предотвращение или ингибирование связывания белка FVIII с эндогенным ФВ через белок ФВ или последовательность XTEN может происходить in vitro или in vivo.In some embodiments, preventing or inhibiting the binding of FVIII protein to endogenous VWF via the VWF protein or XTEN sequence may occur in vitro or in vivo.

Также предложен способ продления периода полувыведения химерного белка, включающий введение химерного белка, описанного в настоящем документе, субъекту, имеющему для этого показания. Период полувыведения неактивированного FVIII, связанного или соединенного с полноразмерным ФВ, составляет около 12-14 ч в плазме крови. При БФВ типа 3, при которой ФВ практически отсутствует в кровотоке, период полувыведения FVIII составляет всего около шести часов, что у таких пациентов приводит к появлению симптомов от легкой до умеренной гемофилии А из-за снижения концентрации FVIII. Период полувыведения химерного белка настоящего изобретения, связанного или соединенного с фрагментом ФВ или последовательностью XTEN, может стать по меньшей мере в около 1,5 раза, 1,6 раза, 1,7 раза, 1,8 раза, 1,9 раза, 2,0 раза, 2,1 раза, в 2,2 раза, 2,3 раза, 2,4 раза, 2,6 раза, 2,7 раза, 2,8 раза, 2,9 раза, 3,0 раза, 3,1 раза, 3,2 раза, 3,3 раза, 3,4 раза, 3,5 раза, 3,6 раза, 3,7 раза, 3,8 раза, 3,9 раза, или в 4,0 раза более продолжительным, чем период полувыведения неактивированного FVIII, связанного или соединенного с полноразмерным ФВ.Also provided is a method of prolonging the half-life of a chimeric protein, comprising administering the chimeric protein described herein to a subject having an indication therefor. The half-life of inactivated FVIII bound or conjugated to full-length VWF is approximately 12-14 hours in plasma. In VWD type 3, in which there is virtually no VWF in the bloodstream, the half-life of FVIII is only about six hours, resulting in mild to moderate hemophilia A symptoms in these patients due to decreased concentrations of FVIII. The half-life of a chimeric protein of the present invention bound or linked to a VWF fragment or an XTEN sequence can become at least about 1.5-fold, 1.6-fold, 1.7-fold, 1.8-fold, 1.9-fold, 2 ,0 times, 2.1 times, 2.2 times, 2.3 times, 2.4 times, 2.6 times, 2.7 times, 2.8 times, 2.9 times, 3.0 times, 3.1 times, 3.2 times, 3.3 times, 3.4 times, 3.5 times, 3.6 times, 3.7 times, 3.8 times, 3.9 times, or 4.0 times times longer than the half-life of inactivated FVIII bound or coupled to full-length VWF.

В одном варианте реализации изобретения химерный белок, содержащий первый полипептид, содержащий белок FVIII и первую константную область ИГ или ее часть, и второй полипептид, содержащий белок ФВ, XTEN, содержащий менее 288 аминокислот, а также константную область ИГ или егоIn one embodiment, a chimeric protein comprising a first polypeptide comprising the FVIII protein and a first IG constant region or a portion thereof, and a second polypeptide containing the VWF protein, XTEN, containing less than 288 amino acids, and the IG constant region or a portion thereof

- 100 044115 часть, обладает периодом полувыведения по меньшей мере в около 2 раза, 2,5 раза, 3,0 раза, 3,5 раза, 4,0 раза, 4,5 раза, 5,0 раза, 5,5 раза, 6,0 раза, 7 раз, 8 раз, 9 раз или в 10 раз более продолжительным, чем соответствующий химерный белок, содержащий такой же первый полипептид и второй полипептид без последовательности XTEN или FVIII дикого типа. В другом варианте реализации изобретения химерный белок, содержащий первый полипептид, содержащий белок FVIII и первую константную область ИГ или его часть, и второй полипептид, содержащий белок ФВ, XTEN, содержащий менее 288 аминокислот, и константную область ИГ или его часть, обладает периодом полувыведения в около 2-5 раз, около 3-10 раз, около 5-15 раз, около 10-20 раз, около 15-25 раз, около 20-30 раз, около 25-35 раз, около 30-40 раз, около 35-45 раз более продолжительным, чем соответствующий химерный белок, содержащий такой же первый полипептид и второй полипептид без последовательности XTEN или FVIII дикого типа. В конкретном варианте реализации изобретения, период полувыведения химерного белка данного изобретения становится, по меньшей мере в около 30, 31, 32, 33, 34, 35, 36, 37, 38, 39 или 40 раз более продолжительным, чем период полувыведения FVIII дикого типа в мышах с двойным нокаутом по FVIII и ФВ.- 100 044115 part, has a half-life of at least about 2 times, 2.5 times, 3.0 times, 3.5 times, 4.0 times, 4.5 times, 5.0 times, 5.5 times , 6.0 times, 7 times, 8 times, 9 times, or 10 times longer than the corresponding chimeric protein containing the same first polypeptide and a second polypeptide without the wild-type XTEN or FVIII sequence. In another embodiment, a chimeric protein comprising a first polypeptide comprising FVIII protein and a first IG constant region or a portion thereof, and a second polypeptide comprising the VWF protein, XTEN, containing less than 288 amino acids and an IG constant region or portion thereof, has a half-life about 2-5 times, about 3-10 times, about 5-15 times, about 10-20 times, about 15-25 times, about 20-30 times, about 25-35 times, about 30-40 times, about 35-45 times longer than the corresponding chimeric protein containing the same first polypeptide and a second polypeptide without the wild-type XTEN or FVIII sequence. In a particular embodiment, the half-life of the chimeric protein of the present invention becomes at least about 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, or 40 times longer than the half-life of wild-type FVIII in FVIII and VWF double knockout mice.

В определенных вариантах реализации изобретения химерный белок демонстрирует период полувыведения около 40 ч у мышей.In certain embodiments of the invention, the chimeric protein exhibits a half-life of about 40 hours in mice.

В некоторых вариантах реализации изобретения период полувыведения химерного белка является более продолжительным, чем период полувыведения FVIII, соединенного с эндогенным ФВ. В других вариантах реализации изобретения период полувыведения химерного белка является, по меньшей мере в около 1,5 раза, в 2 раза, в 2,5 раза, в 3,5 раза, в 3,6 раза, в 3,7 раза, в 3,8 раза, в 3,9 раза, в 4,0 раза, в 4,5 раза или в 5,0 раза большим чем период полувыведения FVIII дикого типа или белка FVIII, связанного с эндогенным ФВ.In some embodiments, the half-life of the chimeric protein is longer than the half-life of FVIII coupled to endogenous VWF. In other embodiments, the half-life of the chimeric protein is at least about 1.5 times, 2 times, 2.5 times, 3.5 times, 3.6 times, 3.7 times, 3.8-fold, 3.9-fold, 4.0-fold, 4.5-fold, or 5.0-fold greater than the half-life of wild-type FVIII or endogenous VWF-bound FVIII protein.

В некоторых вариантах реализации изобретения в результате реализации изобретения период полувыведения химерного белка является продленным по сравнению с белком FVIII без белка ФВ или FVIII дикого типа. Период полувыведения химерного белка изобретения является по меньшей мере в около 1,5 раза, по меньшей мере в около 2 раза, по меньшей мере в около 2,5 раза, по меньшей мере в около 3 раза, по меньшей мере в около 4 раза, по меньшей мере в около 5 раз, по меньшей мере в около 6 раз, по меньшей мере в около 7 раз, по меньшей мере в около 8 раз, по меньшей мере в около 9 раз, по меньшей мере в около 10 раз, по меньшей мере в около 11 раз или по меньшей мере в около 12 раз более продолжительным, чем период полувыведения химерного белка без белка ФВ или FVIII дикого типа. В одном варианте реализации изобретения период полувыведения FVIII является в от около 1,5 раза до около 20 раз, в от около 1,5 раза до около 15 раз или в от около 1,5 раза до около 10 раз более продолжительным, чем период полувыведения FVIII дикого типа. В другом варианте реализации изобретения период полувыведения FVIII продлевается в от около 2 раз до 10 раз, от около 2 раз до около 9 раз, от около 2 раз до около 8 раз, от около 2 раз до около 7 раз, от около 2 раз до около 6 раз, от около 2 раз до около 5 раз, от около 2 раз до около 4 раз, от около 2 раз до около 3 раз, от около 2,5 раз до около 10 раз, от около 2,5 раз до около 9 раз, от около 2,5 раз до около 8 раз, от около 2,5 раз до около 7 раз, от около 2,5 раз до около 6 раз, от около 2,5 раз до около 5 раз, от около 2,5 раз до около 4 раз, от около 2,5 раз до около 3 раз, от около 3 раз до около 10 раз, от около 3 раз до около 9 раз, от около 3 раз до около 8 раз, от около 3 раз до 7 раз, от около 3 раз до около 6 раз, от около 3 раз до около 5 раз, от около 3 раз до около 4 раз, от около 4 раз до около 6 раз, от около 5 раз до около 7 раз или от около 6 раз до около 8 раз по сравнению с FVIII дикого типа или белка FVIII без белка ФВ. В других вариантах реализации изобретения период полувыведения химерного белка изобретения составляет, по меньшей мере около 17 ч, по меньшей мере около 18 ч, по меньшей мере около 19 ч, по меньшей мере около 20 ч, по меньшей мере около 21 ч, по меньшей мере около 22 ч, по меньшей мере около 23 ч, по меньшей мере около 24 ч, по меньшей мере около 25 ч, по меньшей мере около 26 ч, по меньшей мере около 27 ч, по меньшей мере около 28 ч, по меньшей мере около 29 ч, по меньшей мере около 30 ч, по меньшей мере около 31 ч, по меньшей мере около 32 ч, по меньшей мере около 33 ч, по меньшей мере около 34 ч, по меньшей мере около 35 ч, по меньшей мере около 36 ч, по меньшей мере около 40 ч, по меньшей мере около 48 ч, по меньшей мере около 60 ч, по меньшей мере около 72 ч, по меньшей мере около 84 ч, по меньшей мере около 96 ч или по меньшей мере около 108 ч. В еще других вариантах реализации изобретения период полувыведения химерного белка изобретения составляет от около 15 ч до около двух недель, от около 16 ч до около одной недели, от около 17 ч до около одной недели, от около 18 ч до около одной недели, от около 19 ч до около одной недели, от около 20 ч до около одной недели, от около 21 ч до около одной недели, от около 22 ч до около одной недели, от около 23 ч до около одной недели, от около 24 ч до около одной недели, от около 36 ч до около одной недели, от около 48 ч до около одной недели, от около 60 ч до около одной недели, от около 24 ч до около шести дней, от около 24 ч до около пяти дней, от около 24 ч до около четырех дней, от около 24 ч до около трех дней, или от около 24 ч до около двух дней.In some embodiments, the result of the invention is that the half-life of the chimeric protein is prolonged compared to FVIII protein without VWF protein or wild-type FVIII. The half-life of the chimeric protein of the invention is at least about 1.5 times, at least about 2 times, at least about 2.5 times, at least about 3 times, at least about 4 times, at least about 5 times, at least about 6 times, at least about 7 times, at least about 8 times, at least about 9 times, at least about 10 times, at least at least about 11 times or at least about 12 times longer than the half-life of the chimeric protein without wild-type VWF or FVIII protein. In one embodiment, the half-life of FVIII is about 1.5 times to about 20 times, about 1.5 times to about 15 times, or about 1.5 times to about 10 times longer than the half-life FVIII wild type. In another embodiment, the half-life of FVIII is extended by about 2 times to about 10 times, about 2 times to about 9 times, about 2 times to about 8 times, about 2 times to about 7 times, about 2 times to about 7 times. about 6 times, from about 2 times to about 5 times, from about 2 times to about 4 times, from about 2 times to about 3 times, from about 2.5 times to about 10 times, from about 2.5 times to about 9 times, from about 2.5 times to about 8 times, from about 2.5 times to about 7 times, from about 2.5 times to about 6 times, from about 2.5 times to about 5 times, from about 2 ,5 times to about 4 times, from about 2.5 times to about 3 times, from about 3 times to about 10 times, from about 3 times to about 9 times, from about 3 times to about 8 times, from about 3 times up to 7 times, from about 3 times to about 6 times, from about 3 times to about 5 times, from about 3 times to about 4 times, from about 4 times to about 6 times, from about 5 times to about 7 times or from about 6-fold to about 8-fold compared to wild-type FVIII or FVIII protein without VWF protein. In other embodiments, the half-life of the chimeric protein of the invention is at least about 17 hours, at least about 18 hours, at least about 19 hours, at least about 20 hours, at least about 21 hours, at least about 22 hours, at least about 23 hours, at least about 24 hours, at least about 25 hours, at least about 26 hours, at least about 27 hours, at least about 28 hours, at least about 29 hours, at least about 30 hours, at least about 31 hours, at least about 32 hours, at least about 33 hours, at least about 34 hours, at least about 35 hours, at least about 36 hours, at least about 40 hours, at least about 48 hours, at least about 60 hours, at least about 72 hours, at least about 84 hours, at least about 96 hours, or at least about 108 hours In yet other embodiments, the half-life of the chimeric protein of the invention is from about 15 hours to about two weeks, from about 16 hours to about one week, from about 17 hours to about one week, from about 18 hours to about one week, from about 19 hours to about one week, from about 20 hours to about one week, from about 21 hours to about one week, from about 22 hours to about one week, from about 23 hours to about one week, from about 24 hours to about one week, from about 36 hours to about one week, from about 48 hours to about one week, from about 60 hours to about one week, from about 24 hours to about six days, from about 24 hours to about five days, from about 24 hours to about four days, from about 24 hours to about three days, or from about 24 hours to about two days.

В некоторых вариантах реализации изобретения средний период полувыведения химерного белка изобретения на субъект составляет около 15 ч, около 16 ч, около 17 ч, около 18 ч, около 19 ч, около 20 ч, около 21 ч, около 22 ч, около 23 ч, около 24 ч (1 день), около 25 ч, около 26 ч, около 27 ч, около 28 ч, около 29 ч, около 30 ч, около 31 ч, около 32 ч, около 33 ч, около 34 ч, около 35 ч, около 36 ч, около 40 ч, около 44 ч, около 48 ч (2 дня), около 54 ч, около 60 ч, около 72 ч (3 дня), около 84 ч, около 96 ч (4 дня),In some embodiments, the average half-life of the chimeric protein of the invention per subject is about 15 hours, about 16 hours, about 17 hours, about 18 hours, about 19 hours, about 20 hours, about 21 hours, about 22 hours, about 23 hours, about 24 hours (1 day), about 25 hours, about 26 hours, about 27 hours, about 28 hours, about 29 hours, about 30 hours, about 31 hours, about 32 hours, about 33 hours, about 34 hours, about 35 h, about 36 h, about 40 h, about 44 h, about 48 h (2 days), about 54 h, about 60 h, about 72 h (3 days), about 84 h, about 96 h (4 days),

- 101 044115 около 108 ч, около 120 ч (5 дней), около шести дней, около семи дней (одну неделю), около восьми дней, около девяти дней, около 10 дней, около 11 дней, около 12 дней, около 13 дней или около 14 дней.- 101 044115 about 108 hours, about 120 hours (5 days), about six days, about seven days (one week), about eight days, about nine days, about 10 days, about 11 days, about 12 days, about 13 days or about 14 days.

В дополнение, изобретение обеспечивает способ лечения или профилактики геморрагического заболевания или расстройства, включающий введение эффективного количества химерного белка. В одном варианте реализации изобретения геморрагическое заболевание или расстройство выбрано из группы, состоящей из кровотечения, вызванного нарушением свертываемости крови, гемартроза, мышечного кровотечения, кровотечения полости рта, кровоизлияния, мышечного кровоизлияния, кровоизлияния полости рта, травмы, травмы головы, желудочно-кишечного кровотечения, внутричерепного кровоизлияния, внутрибрюшного кровоизлияния, внутригрудного кровоизлияния, перелома костей, кровотечения центральной нервной системы, кровотечения в заглоточном пространстве, кровотечения в забрюшинном пространстве и кровотечения во влагалище подвздошно-поясничной мышцы. В конкретном варианте реализации изобретения геморрагическое заболевание или расстройство является гемофилией А.In addition, the invention provides a method of treating or preventing a hemorrhagic disease or disorder, comprising administering an effective amount of a chimeric protein. In one embodiment of the invention, the hemorrhagic disease or disorder is selected from the group consisting of bleeding caused by a bleeding disorder, hemarthrosis, muscular bleeding, oral bleeding, hemorrhage, muscular hemorrhage, oral hemorrhage, trauma, head trauma, gastrointestinal bleeding, intracranial hemorrhage, intra-abdominal hemorrhage, intrathoracic hemorrhage, bone fracture, central nervous system bleeding, retropharyngeal bleeding, retroperitoneal bleeding and iliopsoas sheath bleeding. In a specific embodiment of the invention, the hemorrhagic disease or disorder is hemophilia A.

Химерный белок, содержащий последовательность XTEN и константную область ИГ или ее часть в комбинации с белком ФВ, описанным в настоящем документе, который предотвращает или ингибирует взаимодействие белка FVIII с эндогенным ФВ, полученным при помощи данного изобретения, имеет множество применений, как будет признано специалистом в данной области техники, в том числе, но не ограничиваясь способами лечения субъекта, имеющего гемостатическое расстройство и способами лечения субъекта, нуждающегося в общем кровоостанавливающем средстве. В одном варианте реализации изобретение относится к способу лечения субъекта, имеющего гемостатическое расстройство, включающему введение эффективного количества химерного белка.A chimeric protein containing an XTEN sequence and an IG constant region or portion thereof in combination with a VWF protein described herein that prevents or inhibits the interaction of the FVIII protein with endogenous VWF produced by the present invention has many uses as will be recognized by one skilled in the art. of the art, including, but not limited to, methods of treating a subject having a hemostatic disorder and methods of treating a subject in need of a general hemostatic agent. In one embodiment, the invention provides a method of treating a subject having a hemostatic disorder, comprising administering an effective amount of a chimeric protein.

Часть белка фактора FVIII в химерном белке лечит или предотвращает гемостатическое расстройство, выступая в качестве кофактора к фактору IX на отрицательно заряженной поверхности фосфолипида, тем самым формируя комплекс Xase. Связывание активированных факторов свертывания крови на фосфолипидной поверхности локализует этот процесс в местах повреждения сосудов. На фосфолипидной поверхности, фактор VIIa увеличивает максимальную скорость активации фактора X под действием фактора IXa в около 200000 раз, что приводит ко второму большому импульсу образования тромбина.The factor FVIII protein portion of the chimeric protein treats or prevents a hemostatic disorder by acting as a cofactor to factor IX on the negatively charged phospholipid surface, thereby forming the Xase complex. Binding of activated blood coagulation factors on the phospholipid surface localizes this process to sites of vascular damage. At the phospholipid surface, factor VIIa increases the maximum rate of activation of factor X by factor IXa by about 200,000-fold, resulting in a second major pulse of thrombin generation.

Химерный белок изобретения может быть использован для лечения любого гемостатического расстройства. Гемостатические расстройства, которые можно лечить с помощью введения химерного белка изобретения включают в себя, но без ограничений, гемофилию А, а также дефициты или структурные аномалии, относящиеся к фактору VIII. В одном варианте реализации изобретения гемостатическое расстройство является гемофилией А.The chimeric protein of the invention can be used to treat any hemostatic disorder. Hemostatic disorders that can be treated by administration of the chimeric protein of the invention include, but are not limited to, hemophilia A, as well as deficiencies or structural abnormalities related to factor VIII. In one embodiment of the invention, the hemostatic disorder is hemophilia A.

Химерный белок изобретения может быть использован в профилактических целях для лечения субъекта с гемостатическим расстройством. Химерный белок изобретения может быть использован для лечения острого эпизода кровотечения у субъекта с гемостатическим расстройством. В другом варианте реализации изобретения гемостатическое расстройство может быть результатом дефектного фактора свертывания крови, например, фактора фон Виллебранда. В одном варианте реализации изобретения гемостатическое расстройство представляет собой наследственное расстройство. В другом варианте реализации изобретения гемостатическое расстройство представляет собой приобретенное расстройство. Приобретенное расстройство может возникнуть в результате лежащего в основе вторичного заболевания или состояния. Состоянием, не связанным с заболеванием может быть, в качестве примера, но не в качестве ограничения, рак, аутоиммунное заболевание или беременность. Приобретенное расстройство может возникнуть в результате старости или от лекарств для лечения, лежащего в основе вторичного расстройства (например, химиотерапии рака).The chimeric protein of the invention can be used prophylactically to treat a subject with a hemostatic disorder. The chimeric protein of the invention can be used to treat an acute episode of bleeding in a subject with a hemostatic disorder. In another embodiment, the hemostatic disorder may be the result of a defective coagulation factor, such as von Willebrand factor. In one embodiment of the invention, the hemostatic disorder is an inherited disorder. In another embodiment of the invention, the hemostatic disorder is an acquired disorder. An acquired disorder may result from an underlying secondary disease or condition. A non-disease condition may include, by way of example and not limitation, cancer, an autoimmune disease, or pregnancy. An acquired disorder may result from old age or from medications to treat an underlying secondary disorder (eg, cancer chemotherapy).

Изобретение также относится к способам лечения субъекта, который не имеет врожденного гемостатического расстройства, но имеет вторичное заболевание или состояние, приводящее к приобретению гемостатического расстройства, например, из-за развития анти-FVIII антитела или хирургического вмешательства. Таким образом, изобретение относится к способу лечения субъекта, нуждающегося в общем кровоостанавливающем средстве, включающем введение терапевтически эффективного количества химерного белка, полученного настоящими способами.The invention also relates to methods of treating a subject who does not have a congenital hemostatic disorder, but has a secondary disease or condition leading to the acquisition of a hemostatic disorder, for example, due to the development of anti-FVIII antibodies or surgery. Thus, the invention relates to a method of treating a subject in need of a general hemostatic agent, comprising administering a therapeutically effective amount of a chimeric protein produced by the present methods.

Настоящее изобретение также относится к способам снижения иммуногенности FVIII или индуцирования меньшей иммуногенности против FVIII, включающим введение эффективного количества химерных белков описанных в данном документе, или полинуклеотидов, кодирующие то же самое.The present invention also provides methods for reducing the immunogenicity of FVIII or inducing less immunogenicity against FVIII, comprising administering an effective amount of chimeric proteins described herein, or polynucleotides encoding the same.

В одном варианте реализации изобретения субъект, нуждающийся в общем кровоостанавливающем средстве, подвергается хирургическом вмешательству или собирается перенести хирургическое вмешательство. Химерный белок изобретения может быть введен до, во время или после операции в качестве профилактического курс лечения. Химерный белок изобретения может быть введен до, во время или после операции для контроля эпизода острого кровотечения.In one embodiment of the invention, the subject in need of a general hemostatic agent is undergoing surgery or is about to undergo surgery. The chimeric protein of the invention may be administered before, during or after surgery as a prophylactic course of treatment. The chimeric protein of the invention can be administered before, during or after surgery to control an episode of acute bleeding.

Химерный белок изобретения может быть использован для лечения субъекта, имеющего эпизод острого кровотечения и не имеющего гемостатическое расстройство. Эпизод острого кровотечения может возникнуть в результате тяжелой травмы, например, операции, автомобильной аварии, раны, рваной раны в результате ружейного выстрела или любого другого травматического события, приводящего к неконтролируемому кровотечению. Не ограничивающие примеры эпизодов кровотечения включают наThe chimeric protein of the invention can be used to treat a subject having an acute bleeding episode and not having a hemostatic disorder. An episode of acute bleeding may occur as a result of severe trauma, such as surgery, a car accident, a wound, a gunshot laceration, or any other traumatic event that results in uncontrolled bleeding. Non-limiting examples of bleeding episodes include:

- 102 044115 рушение свертываемости крови, гемартроз, мышечное кровотечение, кровотечение полости рта, кровоизлияние, мышечное кровоизлияние, кровоизлияние полости рта, травму, травму головы, желудочнокишечное кровотечение, внутричерепное кровоизлияние, внутрибрюшное кровоизлияние, внутригрудное кровоизлияние, перелом костей, кровотечение центральной нервной системы, кровотечение в заглоточном пространстве, кровотечение в забрюшинном пространстве, кровотечение во влагалище подвздошнопоясничной мышцы и их любые комбинации.- 102 044115 bleeding disorder, hemarthrosis, muscle bleeding, oral bleeding, hemorrhage, muscle hemorrhage, oral hemorrhage, trauma, head injury, gastrointestinal bleeding, intracranial hemorrhage, intra-abdominal hemorrhage, intrathoracic hemorrhage, bone fracture, central nervous system bleeding, bleeding in the retropharyngeal space, bleeding in the retroperitoneal space, bleeding in the sheath of the iliopsoas muscle and any combination thereof.

В профилактическом применении одна или более композиций, содержащих химерный белок настоящего изобретения, или их смесь, вводятся пациенту, который еще не находится в болезненном состоянии для повышения сопротивляемости пациента или уменьшения симптомов, связанных с заболеванием или расстройством. Такое количество определяется как профилактически эффективная доза. В терапевтических целях иногда требуются относительно высокие дозы (например, от около 1 до 400 мг/кг полипептида на дозу, при дозах от 5 до 25 мг, являются более широко используемыми для радиоиммуноконьюгатов и более высокие дозы для полипептидов, модифицированных цитотоксическим лекарственным веществом) через относительно короткие промежутки времени до снижения прогрессирования заболевания или его прекращения, и до тех пор, пока пациент не показывает частичное или полное облегчение симптомов заболевания. После этого пациенту может вводиться профилактический режим.In prophylactic use, one or more compositions containing a chimeric protein of the present invention, or a mixture thereof, is administered to a patient who is not already in a disease state to enhance the patient's resistance or reduce symptoms associated with a disease or disorder. This amount is defined as a prophylactically effective dose. For therapeutic purposes, relatively high doses are sometimes required (eg, about 1 to 400 mg/kg polypeptide per dose, with doses of 5 to 25 mg being more commonly used for radioimmunoconjugates and higher doses for cytotoxic drug-modified polypeptides) via relatively short periods of time until disease progression decreases or stops, and until the patient shows partial or complete relief of disease symptoms. The patient can then be placed on a prophylactic regimen.

В некоторых вариантах реализации изобретения химерный белок или композицию данного изобретения используют для лечения при необходимости, которое включает лечение острого эпизода кровотечения, гемартроза, мышечного кровотечения, кровотечения из полости рта, кровоизлияния, кровоизлияния в мышцах, внутриротового кровотечения, травмы, травмы головы (черепно-мозговой травмы), желудочно-кишечного кровотечения, внутричерепного кровоизлияния, внутрибрюшного кровоизлияния, внутригрудного кровоизлияния, перелома костей, кровотечения в центральной нервной системе, кровоизлияния в заглоточном пространстве, кровоизлияния в забрюшинном пространстве или кровотечение во влагалище подвздошно-поясничной мышцы. Субъект может, нуждается в хирургической профилактике, периоперационном ведении или уходе для хирургического вмешательства. Такие операции включают в себя, например, небольшие операции, обширное хирургическое вмешательство, удаление зуба, миндалин, паховое грыжесечение, синовэктомию, полную замену коленного сустава, трепанацию черепа, остеосинтез, травматологию, внутричерепную хирургию, внутрибрюшную хирургию, внутригрудную хирургию или операции по протезированию сустава.In some embodiments, the chimeric protein or composition of the invention is used for treatment as needed, which includes treatment of an acute episode of bleeding, hemarthrosis, muscle bleeding, oral bleeding, hemorrhage, muscle hemorrhage, intraoral bleeding, trauma, head trauma (cranial brain injury), gastrointestinal bleeding, intracranial hemorrhage, intra-abdominal hemorrhage, intrathoracic hemorrhage, bone fracture, bleeding in the central nervous system, hemorrhage in the retropharyngeal space, hemorrhage in the retroperitoneal space, or bleeding in the iliopsoas muscle sheath. The subject may require surgical prophylaxis, perioperative management, or care for surgery. Such operations include, for example, minor operations, major surgery, tooth extraction, tonsillectomy, inguinal hernia repair, synovectomy, total knee replacement, craniotomy, osteosynthesis, traumatology, intracranial surgery, intra-abdominal surgery, intrathoracic surgery or joint replacement surgery. .

В одном варианте реализации изобретения химерный белок настоящего изобретения вводят внутривенно, подкожно, внутримышечно или через любую поверхность слизистой оболочки, например, орально, сублингвально, трансбуккально, назально, ректально, вагинально или ингаляционным путем. Химерный белок, содержащий фрагмент ФВ и белка FVIII настоящего изобретения, может быть внедрен внутрь или связан с биополимерной твердой подложкой, которая позволяет медленное выделение химерного белка к месту кровотечения или внедрение в бандаж/перевязку. Доза химерного белка будет варьировать в зависимости от субъекта и от конкретного способа введения. Дозы могут варьировать от 0,1 до 100000 мкг/кг веса тела. В одном варианте реализации изобретения диапазон дозирования составляет 0,1-1000 мкг/кг. В другом варианте реализации изобретения диапазон дозирования составляет 0,1500 мкг/кг. Белок можно вводить непрерывно или через определенные промежутки времени. In vitro тесты могут быть использованы для определения оптимальных диапазонов доз и/или графиков для введения. In vitro тесты, которые измеряют активность фактора свертывания крови, известны в данной области, например, STA-CLOT VIIa-rTF клоттинговый тест или ROTEM клоттинговый тест. Кроме того, эффективные дозы могут быть экстраполированы из кривых доза-эффект, полученных на животных моделях, например, собаке, больной гемофилией (Mount со соавт. 2002, Blood 99(8):2670).In one embodiment, the chimeric protein of the present invention is administered intravenously, subcutaneously, intramuscularly, or through any mucosal surface, for example, orally, sublingually, buccally, nasally, rectally, vaginally, or inhalation. The chimeric protein containing the VWF and FVIII protein fragment of the present invention can be incorporated into or associated with a biopolymer solid support that allows slow release of the chimeric protein to the site of bleeding or insertion into a bandage/ligation. The dose of the chimeric protein will vary depending on the subject and the specific route of administration. Doses can vary from 0.1 to 100,000 mcg/kg body weight. In one embodiment of the invention, the dosage range is 0.1-1000 μg/kg. In another embodiment of the invention, the dosage range is 0.1500 μg/kg. Protein can be administered continuously or at regular intervals. In vitro tests can be used to determine optimal dose ranges and/or schedules for administration. In vitro tests that measure clotting factor activity are known in the art, for example the STA-CLOT VIIa-rTF clotting test or the ROTEM clotting test. In addition, effective doses can be extrapolated from dose-response curves obtained in animal models, such as the hemophiliac dog (Mount et al. 2002, Blood 99(8):2670).

Теперь, детально описав настоящее изобретение, то же самое будет более четко понято при ссылке на следующие примеры, которые при сем включены только с целью иллюстрации и не предназначены для ограничения данного изобретения. Все патенты, публикации и статьи, упомянутые в данном документе, являются прямо и конкретно включенными в настоящий документ в качестве ссылки.Having now described the present invention in detail, the same will be more clearly understood by reference to the following examples, which are hereby included for purposes of illustration only and are not intended to limit the present invention. All patents, publications and articles referenced herein are expressly and specifically incorporated herein by reference.

ПримерыExamples

Во всех примерах были использованы следующие материалы и методы, если не указано другое.The following materials and methods were used in all examples unless otherwise noted.

Материалы и методы.Materials and methods.

В основном, если не указано другое, на практике настоящего изобретения используются обычные методы химии, биофизики, молекулярной биологии, технологии рекомбинантной ДНК, иммунологии (в частности, например, технология антитела), и стандартные методы электрофореза. См., например,In general, unless otherwise indicated, the practice of the present invention uses conventional methods of chemistry, biophysics, molecular biology, recombinant DNA technology, immunology (particularly, for example, antibody technology), and standard electrophoresis techniques. See, for example,

- 103 044115- 103 044115

Sambrook, Fritsch andSambrook, Fritsch and

Maniatis, Molecular Cloning: Cold Spring Harbor Laboratory Press (1989 год); AntibodyManiatis, Molecular Cloning: Cold Spring Harbor Laboratory Press (1989); Antibody

Engineering Protocols (Methods in Molecular Biology), 510, Paul, S., Humana Pr (1996 год);Engineering Protocols (Methods in Molecular Biology), 510, Paul, S., Humana Pr (1996);

Antibody Engineering: A Practical Approach (Practical Approach Series, 169), McCafferty,Antibody Engineering: A Practical Approach (Practical Approach Series, 169), McCafferty,

Изд., Irl Pr (1996 год); Antibodies: A Laboratory Manual, Harlow co coaem.., CS.H.L. Press,Ed., Irl Pr (1996); Antibodies: A Laboratory Manual, Harlow cocoaem.., CS.H.L. Press,

Pub. (1999 год); и Current Protocols in Molecular Biology, изд. Ausubel co coaem.., JohnPub. (1999); and Current Protocols in Molecular Biology, ed. Ausubel co coaem.., John

Wiley & Sons (1992 год).Wiley & Sons (1992).

Пример 1. Гетеродимеры FVIII-XTEN-Fc/D'D3-XTEN-Fc.Example 1. FVIII-XTEN-Fc/D'D3-XTEN-Fc heterodimers.

Настоящее изобретение относится к получению химерной молекулы FVIII, соединенной с доменом D'D3 белка фактора фон Виллебранда (ФВ) через Fc-домен IgG. Прикрепленный домен D'D3 предотвращает взаимодействие FVIII с эндогенными ФВ мультимерами. Эта молекула служит платформой для включения других технологий продления полужизни с целью улучшения фармакокинетики химерного белка. Последовательности XTEN были включены в домен В FVIII и между D'D3 и регионом Fc для увеличения периода полувыведения гетеродимера FVIII/ФВ.The present invention relates to the production of a chimeric FVIII molecule linked to the D'D3 domain of von Willebrand factor (VWF) protein via the Fc domain of IgG. The docked D'D3 domain prevents FVIII from interacting with endogenous VWF multimers. This molecule serves as a platform to incorporate other half-life extension technologies to improve the pharmacokinetics of the chimeric protein. XTEN sequences were included in the FVIII B domain and between D'D3 and the Fc region to increase the half-life of the FVIII/VWF heterodimer.

Сайт расщепления тромбином между D'D3 и Fc обеспечивает высвобождение домена D'D3 после активации молекулы FVIII тромбином.The thrombin cleavage site between D'D3 and Fc mediates the release of the D'D3 domain upon activation of the FVIII molecule by thrombin.

Пример 2. Плазмидная конструкция гетеродимеров FVIII-XTEN-Fc/D'D3-Fc Клонирование тройной мутации ФВ050- IHH в ФВ031.Example 2. Plasmid construction of heterodimers FVIII-XTEN-Fc/D'D3-Fc Cloning of the triple mutation FV050-IHH into FV031.

Тройная мутация IHH в Fc препятствует взаимодействию с FcRn, таким образом, молекула, содержащая Fc, не используется повторно по пути FcRn. Тремя мутациями в Fc являются I253 А, Н310А, Н435А.The IHH triple mutation in Fc prevents interaction with FcRn, so the Fc-containing molecule is not recycled through the FcRn pathway. The three mutations in Fc are I253A, H310A, H435A.

ФВ050 был создан путем замены региона Fc плазмиды ФВ031 с Fc-фрагментом, содержащим тройную мутацию IHH между сайтами рестрикции RsRII и Not 1.FB050 was created by replacing the Fc region of plasmid FB031 with an Fc fragment containing a triple IHH mutation between the RsRII and Not 1 restriction sites.

Клонирование ФВ057- Клонирование ФВ-Fc с 144 АЕ XTEN +35 а.к. расщепляемого тромбином линкера.Cloning FV057- Cloning FV-Fc with 144 AE XTEN +35 a.k. thrombin-cleavable linker.

Олигонуклеотиды.Oligonucleotides.

ESC 155-Олигонуклеотид для 144 АЕ XTEN в ФВ034-revESC 155-Oligonucleotide for 144 AE XTEN in FV034-rev

CCCCGCCACCGGATCCCCCGCCACCGGATCCCCCGCCACCGGATCCCCCGCCCCCCGCCACCGGATCCCCCGCCACCGGATCCCCCGCCACCGGATCCCCCGCC

ACCGGAACCTCCACCGCCGCTCGAGGCACCTTCTTCAGTGCTGGTGGGCGAGCCCGCACCGGAACCTCCACCGCCGCTCGAGGCACCTTCTTCAGTGCTGGTGGGCGAGCCCGC

TGGTGACCCTTCCTCTGGTGACCCTTCCTC

ESC 155-Олигонуклеотид для 144 АЕ XTEN- GS линкер в ФВ034-revESC 155-Oligonucleotide for 144 AE XTEN-GS linker in FV034-rev

GGGGAAGAGGAAGACTGACGGTCCGCCCAGGAGTTCTGGAGCTGGGCACGGGGGGAAGAGGAAGACTGACGGTCCGCCCAGGAGTTCTGGAGCTGGGCACGG

TGGGCATGTGTGAGTTTTGTCGCCTCCGCTGCCCCGGGGGACCAGGGATCCCCCGCCTGGGCATGTGTGAGTTTTGTCGCCTCCGCTGCCCCGGGGGACCAGGGATCCCCCGCC

ACCGGATCCCCCGCCACCGGATCCCCCGCCACCGGATCCCCCGCCACCGGATCCCCCGCCACCGGATCCCCCGCCACCGGATCCCCCGCC

ESC 157-Олигонуклеотид для 144 АЕ XTEN в ФВ031-FwdESC 157-Oligonucleotide for 144 AE XTEN in FV031-Fwd

GTGAAGCCTGCCAGGAGCCGATATCGGGCGCGCCAACATCAGAGAGCGCCAGTGAAGCCTGCCAGGAGCCGATATCGGGCGCGCAACATCAGAGAGCGCCA

CCCCTGAAAGTGGTCCCGGGAGCGAGCCAGCCCCCTGAAAGTGGTCCCGGGAGCGAGCCAGC

Для получения 144 AE-XTEN + 35 а.к. GS линкера с сайтом расщепления тромбином была дважды проведена ПЦР.To receive 144 AE-XTEN + 35 a.k. The GS linker with the thrombin cleavage site was PCR performed twice.

Первая реакция ПЦР проводилась с использованием кодирующей ДНК 144- АЕ XTEN в качестве матрицы и пары праймеров ESC157/ ESC155. Полученный в результате этой реакции ПЦР-продукт длиной около 550 п. н. использовался в качестве матрицы для второй ПЦР-реакции, и был амплифицирован с помощью пары праймеров ESC 157/156. Эта реакция дала продукт длиной ~ 700 п. н. Этот ПЦРпродукт длиной 700 п. н. и плазмида ФВ034 затем обрабатывались с EcoRV-HF и RsRII. Каркас плазмиды от расщепленного.The first PCR reaction was carried out using 144-AE XTEN coding DNA as a template and the primer pair ESC157/ESC155. The PCR product obtained as a result of this reaction is approximately 550 bp in length. was used as a template for the second PCR reaction, and was amplified using the primer pair ESC 157/156. This reaction yielded a product of ~700 bp. This PCR product is 700 bp long. and plasmid FV034 were then treated with EcoRV-HF and RsRII. Plasmid backbone from split.

ФВ034 затем использовался для лигирования 700 п. н. ПЦР-продукта.VWF034 was then used to ligate 700 bp. PCR product.

Клонирование тройной мутации ФВ058- IHH в ФВ034.Cloning of the triple mutation FV058-IHH into FV034.

Тройная мутация IHH в Fc препятствует взаимодействию с FcRn, таким образом, молекула, содержащая Fc, не используется повторно по пути FcRn. Тремя мутациями в Fc являются I253 А, Н310А, Н435 А.The IHH triple mutation in Fc prevents interaction with FcRn, so the Fc-containing molecule is not recycled through the FcRn pathway. The three mutations in Fc are I253 A, H310A, H435 A.

ФВ058 был создан путем замены региона Fc плазмиды ФВ034 с Fc-фрагментом, содержащим тройную мутацию IHH между сайтами рестрикции RsRII и Not 1.FV058 was created by replacing the Fc region of plasmid FV034 with an Fc fragment containing a triple IHH mutation between the RsRII and Not 1 restriction sites.

Клонирование FVIII-263- FVIII 205 с тройной мутацией IHH.Cloning of FVIII-263-FVIII 205 with triple IHH mutation.

Тройная мутация IHH в Fc препятствует взаимодействию с FcRn, таким образом, молекула, содержащая Fc, не используется повторно по пути FcRn. Тремя мутациями в Fc являются I253 А, Н310А, Н435А.The IHH triple mutation in Fc prevents interaction with FcRn, so the Fc-containing molecule is not recycled through the FcRn pathway. The three mutations in Fc are I253A, H310A, H435A.

FVIII-263 был создан путем замены региона Fc плазмиды FVIII 205 с Fc-фрагментом, содержащимFVIII-263 was created by replacing the Fc region of the FVIII 205 plasmid with an Fc fragment containing

- 104 044115 тройную мутацию IHH между сайтами рестрикции RsRII и Not 1.- 104 044115 triple mutation IHH between the RsRII and Not 1 restriction sites.

Клонирование FVIII-282- FVIII-Fc с 144 АЕ XTEN в домене В.Cloning of FVIII-282-FVIII-Fc with 144 AE XTEN in domain B.

ESC 158-Олигонуклеотид для 144 АЕ XTEN в домене B-fwdESC 158-Oligonucleotide for 144 AE XTEN in the B-fwd domain

AAGAAGCTTCTCTCAAAACGGCGCGCCAACATCAGAGAGCGCCACCCCTGAAAGTGAAGAAGCTTCTCTCAAAACGGCGCGCCAACATCAGAGAGCGCCACCCCTGAAAGTG

GTCCCGGGAGCGAGCCAGCCACATCTGGGTCGGAAACGCCAGGCGTCCCGGGAGCGAGCCAGCCACATCTGGGTCGGAAACGCCAGGC

ESC 159-Олигонуклеотид для 144 АЕ XTEN в домене В-revESC 159-Oligonucleotide for 144 AE XTEN in the B-rev domain

GGTATCATCATAATCGATTTCCTCTTGATCTGACTGAAGAGTAGTACGAGTTATTTCGGTATCATCATAATCGATTTCCTCTTGATCTGACTGAAGAGTAGTACGAGTTATTTC

AGCTTGATGGCGTTTCAAGACTGGTGGGCTCGAGGCACCTTCTTCAGTGCTGGTGGGAGCTTGATGGCGTTTCAAGACTGGTGGGCTCGAGGCACCTTCTTCAGTGCTGGTGGG

CGAGCCCGCTGGTGACCCTTCCTCAGTGGACGTAGGCGAGCCCGCTGGTGACCCTTCCTCAGTGGACGTAGG

Первая реакция ПНР проводилась с использованием кодирующей ДНК 144-АЕ XTEN в качестве матрицы и пары праймеров ESC158/ESC159. Из этой реакции получается ПЦР-продукт длиной около 550 п. н., а плазмида FVIII 169 затем обрабатывается с ASCii и Cla1. Плазмидный каркас от расщепленного FVIII 169 затем используется для лигирования 550 п. н. продукта ПЦР для получения FVIII 282.The first PNR reaction was carried out using 144-AE XTEN coding DNA as a template and the primer pair ESC158/ESC159. From this reaction a PCR product of approximately 550 bp is obtained, and the FVIII 169 plasmid is then processed with ASCii and Cla1. The plasmid backbone from the digested FVIII 169 is then used for 550 bp ligation. PCR product to obtain FVIII 282.

Клонирование FVIII-283- FVIII169 с тройной мутацией IHH.Cloning of FVIII-283-FVIII169 with triple IHH mutation.

Тройная мутация IHH в Fc препятствует взаимодействию с FcRn, таким образом, молекула, содержащая Fc, не используется повторно по пути FcRn. Тремя мутациями в Fc являются I253 А, Н310А, Н435А.The IHH triple mutation in Fc prevents interaction with FcRn, so the Fc-containing molecule is not recycled through the FcRn pathway. The three mutations in Fc are I253A, H310A, H435A.

FVIII-283 был создан путем замены региона Fc плазмиды FVIII 169 с Fc-фрагментом, содержащим тройную мутацию IHH между сайтами рестрикции RsRII и Not 1.FVIII-283 was created by replacing the Fc region of plasmid FVIII 169 with an Fc fragment containing a triple IHH mutation between the RsRII and Not 1 restriction sites.

Пример 3. Получение FVIII-XTEN-Fc/D'D3-XTEN-Fc в клетках HEK293.Example 3. Production of FVIII-XTEN-Fc/D'D3-XTEN-Fc in HEK293 cells.

Фиг. 2. Схематическое изображение, иллюстрирующее экспрессию конструкта FVIII-XTENFc/D'D3-XTEN-Fc. С использованием Полиэтиленимина (ПЭИ) была сделана контрансфекция трех плазмид в клетках HEK293. Первая плазмида получает экспрессию FVIII-XTEN-Fc, вторая плазмида экспрессирует D1D2D'D3-XTEN-Fc, и третья плазмида экспрессирует РАСЕ/фурин, который требуется для ферментативного удаления пропептида, то есть, домена D1D2 из D1D2D'D3-XTEN-Fc. Продукты этой трехплазмидной системы экспрессии включают гетеродимер FVIII-XTEN-Fc/D'D3-XTEN-Fc, гомодимер D'D3-XTEN-Fc и следы гемизиготно выглядящих видов FVIII-XTEN-Fc.Fig. 2. Schematic representation illustrating the expression of the FVIII-XTENFc/D'D3-XTEN-Fc construct. Using Polyethylenimine (PEI), three plasmids were contransfected into HEK293 cells. The first plasmid expresses FVIII-XTEN-Fc, the second plasmid expresses D1D2D'D3-XTEN-Fc, and the third plasmid expresses PACE/furin, which is required to enzymatically remove the propeptide, i.e., the D1D2 domain from D1D2D'D3-XTEN-Fc. The products of this three-plasmid expression system include the FVIII-XTEN-Fc/D'D3-XTEN-Fc heterodimer, the D'D3-XTEN-Fc homodimer, and traces of the hemizygous-appearing FVIII-XTEN-Fc species.

Пример 4. Очистка гетеродимеров FVIII-XTEN-Fc/D'D3-XTEN-Fc.Example 4. Purification of FVIII-XTEN-Fc/D'D3-XTEN-Fc heterodimers.

С целью очистки гетеродимеров FVIII-XTEN-Fc/D'D3-XTEN-Fc для первой концентрации кондиционированной среды в 10 раз, используется стадия тангенциальной поточной фильтрации (ТПФ). Продукты в фильтрате затем дополнительно очищаются с использованием аффинной хроматографии с последующей обессоливающей колонкой. Чистота молекулы является приемлемой по эксклюзионной ВЭЖХ и дополнительно подтверждается с помощью Вестерн-блоттинга. Специфическая активность молекулы сопоставима с доменом В удаленного FVIII, как измеряется с помощью анализа активности FVIII (пример 5) и измерения ОП280.In order to purify the FVIII-XTEN-Fc/D'D3-XTEN-Fc heterodimers for the first 10-fold concentration of the conditioned medium, a tangential flow filtration (TFF) step is used. The products in the filtrate are then further purified using affinity chromatography followed by a desalting column. The purity of the molecule is acceptable by size exclusion HPLC and is further confirmed by Western blotting. The specific activity of the molecule is comparable to the B domain of deleted FVIII, as measured by the FVIII activity assay (Example 5) and OD280 measurement.

Пример 5. Специфическая активность гетеродимеров FVIII-XTEN-Fc/D'D3-XTEN-Fc.Example 5. Specific activity of FVIII-XTEN-Fc/D'D3-XTEN-Fc heterodimers.

Активность гетеродимеров FVIII-XTEN-Fc/D'D3-XTEN-Fc измеряется с помощью хромогенного анализа FVIII и анализа активированного частичного тромбопластинового времени (АЧТВ) FVIII. Специфическая хромогенная активность и специфическая активность АЧТВ SQ BDD-FVIII, rFVIШ69/ФВ034 и rFVШ169/ФВ057 изложены в табл. 16. По сравнению с SQ BDD-FVIII, мы наблюдали сопоставимые специфические хромогенные виды деятельности и 60 % сокращение специфической активности АЧТВ для rFVIШ69/ФВ034 и rFVШ169/ФВ057.The activity of FVIII-XTEN-Fc/D'D3-XTEN-Fc heterodimers is measured using the FVIII chromogenic assay and the FVIII activated partial thromboplastin time (aPTT) assay. The specific chromogenic activity and specific APTT activity of SQ BDD-FVIII, rFVIШ69/FV034 and rFVIШ169/FV057 are presented in Table. 16. Compared with SQ BDD-FVIII, we observed comparable specific chromogenic activities and a 60% reduction in specific aPTT activity for rFVIIII69/FV034 and rFVIIII169/FV057.

Таблица 16Table 16

Специфическая активность гетеродимерных вариантовSpecific activity of heterodimeric variants

FVIII FVIII SQ BDD-FVIII SQ BDD-FVIII rFVIII169/OB034 rFVIII169/OB034 rFVIII160/OB057 rFVIII160/OB057 Специфическая хромогенная активность (МЕ/пмоль) Specific chromogenic activity (IU/pmol) 0,9 - 2,0 0.9 - 2.0 1,1-1,2 1.1-1.2 0,8-1,6 0.8-1.6 Специфическая активность АЧТВ (МЕ/пмоль) Specific activity APTT (IU/pmol) 0,75-1,7 0.75-1.7 0,4 0.4 0,3-0,6 0.3-0.6

Хромогенный анализ FVIII.Chromogenic analysis of FVIII.

Активность FVIII измерялась с использованием набора COATEST SP FVIII из DiaPharma (продукцияFVIII activity was measured using the COATEST SP FVIII kit from DiaPharma (products

- 105 044115 #: K824086), все инкубирования были выполнены на 37°С пластинчатом нагревателе при встряхивании.- 105 044115 #: K824086), all incubations were performed on a 37°C plate heater with shaking.

Восьмой Международный Стандарт Свертывания Крови Фактора VIII:C ВОЗ, Концентрат, с кодовым именем 07/350 используется в качестве анализа стандарта, диапазон стандарта был от 100 мМЕ/мл до 0,78 мМЕ/мл. Контроль объединенного анализа нормальной человеческой плазмы и тестируемые образцы (разведенные буфером 1X Coatest) добавляются в 2HB 96-луночные плашки Immulon в двух повторах (25 мкл/лунка). Свежеприготовленная смесь IXa/FX/Фосфолипид (50 мкл), 25 мкл 25 мМ CaCl2, и 50 мкл субстрата FXa последовательно добавлялись в каждую лунку с 5-минутной инкубацией между каждым добавлением. После инкубирования с субстратом, для окончания цветной реакции добавлялись 25 мкл 20% уксусной кислоты, поглощение OD405 измерялось с помощью прибора SpectraMax плюс (Молекуляр Девайсес). Данные анализировались с помощью программного обеспечения SoftMax Pro (версия 5.2). Нижний предел количественного определения (НПКО) составляет 7,8 мМЕ/мл.The WHO Eighth International Standard for Blood Clotting Factor VIII:C, Concentrate, code name 07/350 is used as the assay standard, the range of the standard was from 100 mIU/ml to 0.78 mIU/ml. Normal human plasma pool assay control and test samples (diluted in 1X Coatest buffer) are added to 2HB 96-well Immulon plates in duplicate (25 µl/well). Freshly prepared IXa/FX/Phospholipid mixture (50 μl), 25 μl of 25 mM CaCl 2 , and 50 μl of FXa substrate were sequentially added to each well with a 5-minute incubation between each addition. After incubation with the substrate, 25 µl of 20% acetic acid was added to complete the color reaction, and the OD 405 absorbance was measured using a SpectraMax plus (Molecular Devices). Data were analyzed using SoftMax Pro software (version 5.2). The lower limit of quantification (LOQ) is 7.8 mIU/ml.

Анализ АЧТВ FVIII.APTT FVIII analysis.

Анализ АЧТВ FVIII осуществлялся на анализаторе коагуляции Sysmex СА-1500 следующим образом: Сначала 50 мкл вручную разбавленных образцов, стандартов и Контролей в АЧТВ буфере (50 мМ Трис, 100 мМ NaCl, 1% ЧСА, pH 7,4) добавлялись прибором в реакционную кювету, с последующим добавлением 50 мкл FVIII-дефицитной плазмы (Джордж Кинг Био-Медикал, продукт #: 0800). После инкубации при температуре 37°С в течение 1 мин, 50 мкл реагента АЧТВ (активированный реагент цефалопластина Actin® FSL - Дейд Беринг, ссылка # В4219-2) добавлялись к реакционной смеси, и инкубировались при 37°С в течение 4-х мин. Впоследствии, добавлялись 50 мкл 20 мМ CaCl2 (Дейд Беринг, ссылка # ORFO37), и реакционная кювета немедленно переносилась в одну из четырех позиций канала спектрофотометра для измерения количества преломленного света в смеси, которое, с помощью программного алгоритма прибора, конвертировалось в возникновение свертываемости. Зафиксированное время свертывания крови было отрезком времени от добавления CaCl2 до наступления образования сгустка. Анализ стандарта генерируется путем разбавления Восьмого Международного Стандарта FVIII ВОЗ в буфере АЧТВ в диапазоне от 100 мМЕ/мл до 0,78 мМЕ/мл. Калибровочная кривая была построена как время свертывания крови (в секундах) в виде Y-оси в сравнении с логарифмом (база 10) активности FVIII (мМЕ/мл) в виде Х-оси в MS Excel, активность отдельных образцов рассчитывалась с использованием формулы для линейной регрессии этой калибровочной кривой. На основе проведения анализа, нижний предел количественного определения (НПКО) составлял 7,8 мМЕ/мл.APTT FVIII analysis was performed on a Sysmex CA-1500 coagulation analyzer as follows: First, 50 μl of manually diluted samples, standards and Controls in APTT buffer (50 mM Tris, 100 mM NaCl, 1% HSA, pH 7.4) was added by the instrument to the reaction cuvette , followed by the addition of 50 μl of FVIII-deficient plasma (George King Bio-Medical, product #: 0800). After incubation at 37°C for 1 min, 50 µl of APTT reagent (activated cephaloplastin reagent Actin® FSL - Dade Behring, reference # B4219-2) was added to the reaction mixture, and incubated at 37°C for 4 min . Subsequently, 50 µl of 20 mM CaCl 2 (Dade Behring, reference #ORFO37) was added and the reaction cuvette was immediately transferred to one of the four positions of the spectrophotometer channel to measure the amount of refracted light in the mixture, which, using the instrument's software algorithm, was converted into the occurrence of clotting . The recorded clotting time was the length of time from the addition of CaCl2 to the onset of clot formation. The assay standard is generated by diluting the WHO Eighth International Standard FVIII in aPTT buffer ranging from 100 mIU/mL to 0.78 mIU/mL. The calibration curve was plotted as clotting time (in seconds) on the Y-axis versus the logarithm (base 10) of FVIII activity (mIU/mL) on the X-axis in MS Excel, with the activity of individual samples calculated using the formula for linear regression of this calibration curve. Based on the assay, the lower limit of quantitation (LOQ) was 7.8 mIU/mL.

Пример 6. Аддитивный эффект вставок XTEN на продление периода полувыведения гетеродимера.Example 6: Additive effect of XTEN insertions on prolonging heterodimer half-life.

Вставки XTEN были включены в гетеродимеры для продления периода полувыведения. Вставка одной аминокислоты (а.к.) 288 AE-XTEN в домене В FVIII приводит к периоду полувыведения гетеродимера длительностью 16,7 ч у мышей с гемофилией А, как демонстрируется rFVΠΠ69/ФВ031 на фиг. 3. Для дальнейшего улучшения периода полувыведения гетеродимера, вторая вставка XTEN длиной 144 а.к. или 288 а.к. была включена в FVIII169/OB031 как в домен A1 FVIII, так и непосредственно вниз по течению фрагмента D'D3, соответственно, варианты гетеродимера были названы FVШ205/ФВ031 и FVИI169/ФВ034.XTEN inserts were incorporated into heterodimers to prolong the half-life. Insertion of a single amino acid (aa) 288 of AE-XTEN in the B domain of FVIII results in a heterodimer half-life of 16.7 hours in hemophilia A mice, as demonstrated by rFVΠΠ69/FV031 in FIG. 3. To further improve the half-life of the heterodimer, a second 144 aa long XTEN insert. or 288 a.k. was included in FVIII169/OB031 both in the FVIII A1 domain and immediately downstream of the D'D3 fragment, respectively, the heterodimer variants were named FVIII205/OB031 and FVII169/OB034.

Периоды полувыведения rFVIШ69/ФВ031, rFVШ205/ФВ031 и rFVIШ69/ФВ034 оценивались на FVIII-дефицитных (HemA) мышах путем однократного внутривенного введения тестируемых молекул в дозе 200 МЕ/кг. Образцы плазмы собирались в определенных временных точках, как показано на фиг. 3, FVIII активность образцов определялась с помощью хромогенного анализа FVIII, параметры ФК рассчитывались с использованием программы WinNonlin-Phoenix и перечислены в табл. 17.The half-lives of rFVIIII69/FV031, rFVIIII205/FV031 and rFVIIII69/FV034 were assessed in FVIII-deficient (HemA) mice by single intravenous administration of the test molecules at a dose of 200 IU/kg. Plasma samples were collected at specific time points as shown in FIG. 3, FVIII activity of the samples was determined using the FVIII chromogenic assay; PK parameters were calculated using the WinNonlin-Phoenix program and listed in Table. 17.

Как показано на фиг. 3 и табл. 17, добавление второй вставки XTEN как в домен A1 FVIII, так и вниз по течению D'D3 дополнительно улучшает период полувыведения гетеродимера на 29,45 или 31,10, соответственно. Кроме того, обе вставки XTEN демонстрировали более чем 2-х кратное улучшение клиренса и AUC.As shown in FIG. 3 and table. 17, addition of a second XTEN insert in both the A1 domain of FVIII and downstream of D'D3 further improves the half-life of the heterodimer by 29.45 or 31.10, respectively. In addition, both XTEN inserts demonstrated a greater than 2-fold improvement in clearance and AUC.

Таблица 17Table 17

Параметр ФК гетеродимеров мышей HemAPK parameter of HemA mouse heterodimers

FVIII FVIII Вставки XTEN XTEN inserts Т 1/2 (ч) T 1/2 (h) MRT (ч) MRT (h) С1 (мл/ч/кг) C1 (ml/h/kg) Vss (мл/кг) Vss (ml/kg) AUC_D (кг*ч/мл) AUC_D (kg*h/ml) Встраива ние 1 Installation 1 Встраивай ие 2 Embed 2 rFVIII169/OB031 rFVIII169/OB031 В*-АЕ288 B*-AE288 16,65 16.65 18,44 18.44 3,57 3.57 85,72 85.72 0,28 0.28 rFVIII205/OB031 rFVIII205/OB031 В*-АЕ288 B*-AE288 А1-АЕ144 A1-AE144 29,45 29.45 36,02 36.02 1,76 1.76 63,56 63.56 0,57 0.57 rFVIII169/OB034 rFVIII169/OB034 В*-АЕ288 B*-AE288 D’D3- АЕ288 D'D3- AE288 31,10 31.10 34,57 34.57 1,73 1.73 59,77 59.77 0,58 0.58

Пример 7. 144 а.к. AE-XTEN предоставляет лучший период полувыведения чем 288 а.к. AE-XTEN при вставке между доменами D'D3 и Fc.Example 7. 144 a.k. AE-XTEN provides a better half-life than 288 aa. AE-XTEN when inserted between the D'D3 and Fc domains.

Другой гетеродимер-FVIШ69/ФВ057 был сконструирован в попытке определения оптимальнойAnother heterodimer, FVIIII69/FV057, was constructed in an attempt to determine the optimal

- 106 044115 длины вставки XTEN в цепи D'D3-XTEN-Fc, в которой длина вставки XTEN была уменьшена с 288 а.к. до 144 а.к. Как показано на фиг. 4, по сравнению с rFVШ169/ФВ034, период полувыведения гFVΠΠ69/ФВ057 был увеличен с 31 ч до 42 ч. Улучшенный клиренс и AUC также наблюдаются для гFVΠΠ69/ФВ057, данные приведены в табл. 18. Таким образом, при вставке между D'D3 и доменом Fc гетеродимеров FVIII-XTEN-Fc/D'D3-XTEN-Fc, 144 а.к. вставка AE-XTEN является более оптимальной, чем АЕ-288 а.к. XTEN.- 106 044115 length of the XTEN insertion in the D'D3-XTEN-Fc chain, in which the length of the XTEN insertion was reduced from 288 aa. up to 144 a.k. As shown in FIG. 4, compared to rFVΠΠ169/FV034, the half-life of gFVΠΠ69/FV057 was increased from 31 hours to 42 hours. Improved clearance and AUC were also observed for gFVΠΠ69/FV057, data are shown in table. 18. Thus, when inserted between D'D3 and the Fc domain of the FVIII-XTEN-Fc/D'D3-XTEN-Fc heterodimers, 144 aa. insert AE-XTEN is more optimal than AE-288 a.k. XTEN.

Таблица 18Table 18

Параметры ФК гFVШ169/ФВ034 и гFVШ169/ФВ057 в мышах HemAPK parameters of gFVSh169/FV034 and gFVSh169/FV057 in HemA mice

FVIII FVIII Т 1/2 (ч) T 1/2 (h) MRT (ч) MRT (h) С1 (мл/ч/кг) C1 (ml/h/kg) Vss (мл/кг) Vss (ml/kg) AUC_D (кг*ч/мл) AUC_D (kg*h/ml) гРУШ169/ФВ034 GRUSH169/FV034 31,10 31.10 34,57 34.57 1,73 1.73 59,77 59.77 0,58 0.58 rFVIIIl 69/ФВ057 rFVIIIl 69/FV057 42,23 42.23 53,24 53.24 0,97 0.97 51,44 51.44 1,03 1.03

Пример 8. Домен Fc продлевает период полувыведения гетеродимера.Example 8: The Fc domain prolongs the half-life of the heterodimer.

Домены Fc продлевают период полувыведения их слитых белков путем FcRn-опосредованного пути рециркуляции. С целью подтверждения необходимости домена Fc для продолжения периода полувыведения гетеродимера, Fc-домены дикого типа были заменены тройным мутантом (I253A/H310A/H435A; IHH) в гFVШ205/ФВ031 с образованием гFVШ263/ФВ050, полное устранение связывания FcRn было подтверждено с помощью анализа Поверхностного Плазмонного Резонанса (Биакор) для гFVШ263/ФВ050. Период полувыведения FVШ263/ФВ050 оценивался у мышей HemA по сравнению с гFVШ205/ФВ031. Как показано на фиг. 5 и в табл. 19, улучшенная скорость клиренса, также как и уменьшенный период полувыведения и AUC, наблюдались для гFVШ263/ФВ050. Этот результат демонстрировал, что в дополнение к обеспечению ковалентного связывания FVIII и D'D3, домены Fc также являются необходимыми для улучшения периода полувыведения гетеродимера.Fc domains extend the half-life of their fusion proteins through the FcRn-mediated recycling pathway. To confirm the requirement of the Fc domain for prolonging the half-life of the heterodimer, the wild-type Fc domains were replaced by a triple mutant (I253A/H310A/H435A; IHH) in gFVIII205/FV031 to form gFVIII263/FV050, complete elimination of FcRn binding was confirmed by Surface assay. Plasmonic Resonance (Biacor) for gFVSh263/FV050. The half-life of FVIII263/FV050 was assessed in HemA mice compared with gFVIII205/FV031. As shown in FIG. 5 and in table. 19, an improved clearance rate, as well as a reduced half-life and AUC, were observed for gFVIII263/FV050. This result demonstrated that in addition to mediating covalent binding of FVIII and D'D3, Fc domains are also required to improve the half-life of the heterodimer.

Таблица 19Table 19

Параметры ФК гFVШ205/ФВ031 и гFVШ263/ФВ040 в мышах HemAPK parameters of gFVSh205/FV031 and gFVSh263/FV040 in HemA mice

FVIII FVIII Мутация в домене Fc Mutation in the Fc domain т 1/2 (ч) t 1/2 (h) MRT (ч) MRT (h) С1 (мл/ч/кг) C1 (ml/h/kg) Vss (мл/кг) Vss (ml/kg) AUC_D (кг*ч/мл) AUC_D (kg*h/ml) гРУШ205/ФВ031 GRUSH205/FV031 Отсутствие Absence 29,45 29.45 36,02 36.02 1,76 1.76 63,56 63.56 0,57 0.57 гРУШ263/ФВ050 GRUSH263/FV050 IHH IHH 22,96 22.96 26,15 26.15 2,36 2.36 61,69 61.69 0,42 0.42

Пример 9. Мгновенная эффективность гетеродимеров FVIII-XTEN-Fc/D'D3-XTEN-Fc на модели кровотечения хвоста мышей HemA.Example 9. Instantaneous efficacy of FVIII-XTEN-Fc/D'D3-XTEN-Fc heterodimers in the HemA mouse tail bleeding model.

Мгновенная эффективность лидирующих кандидатов гетеродимеров оценивалась с использованием модели кровотечения хвоста мышей HemA.The immediate efficacy of the leading heterodimer candidates was assessed using the HemA mouse tail bleeding model.

Самцы мышей HemA в возрасте 8-12 недель рандомизпровались на 4 лечебные группы и подвергались одному внутривенному введению SQ BDD-FVIII, гFVΠΠ69/ФВ034, гFVШ169/ФВ057 или раствора наполнителя, соответственно. В целях имитирования эпизодического лечения FVIII (для воссоздания 50100% от нормального уровня плазматического FVIII), выбранная доза лечения FVIII составляет 75 МЕ/кг, как измерено активностью АЧТВ FVIII. При такой величине дозы, все тестируемые варианты FVIII будут воспроизводить ~70% от нормальной активности мышиного плазматического FVIII, по истечении 5 мин после введения дозы.Male HemA mice, 8-12 weeks of age, were randomized into 4 treatment groups and received one intravenous injection of SQ BDD-FVIII, gFVΠΠ69/FV034, gFVIII169/FV057, or vehicle solution, respectively. In order to simulate episodic FVIII treatment (to recreate 50-100% of normal plasma FVIII levels), the selected FVIII treatment dose is 75 IU/kg, as measured by FVIII aPTT activity. At this dose level, all FVIII variants tested would reproduce ~70% of normal murine plasma FVIII activity within 5 min of dosing.

Объем потери крови каждого отдельного животного в исследовании отображен на графике, на фиг. 6. Значительное снижение объема потери крови наблюдалось для всех групп лечения FVIII по сравнению с животными, которые обрабатывались наполнителем. В пределах трех групп лечения FVIII, не было обнаружено статистически значимых отличий в снижении потери крови, предполагая что молекулы гетеродимеров могут потенциально быть такими же эффективными как SQ BDD-FVIII для лечения при необходимости.The amount of blood loss from each individual animal in the study is plotted in FIG. 6. A significant reduction in blood loss was observed for all FVIII treatment groups compared to vehicle-treated animals. Within the three FVIII treatment groups, no statistically significant differences were found in the reduction of blood loss, suggesting that heterodimer molecules could potentially be as effective as SQ BDD-FVIII for treatment when needed.

Объем потери крови каждого отдельного животного в исследовании отображен на графике, на фиг. 6. Значительное снижение объема потери крови наблюдалось для всех групп лечения FVIII по сравнению с животными, которые обрабатывались наполнителем. В пределах трех групп лечения FVIII, не было обнаружено статистически значимых отличий в снижении потери крови, предполагая что молекулы гетеродимеров могут потенциально быть такими же эффективными как SQ BDD-FVIII для лечения при необходимости.The amount of blood loss from each individual animal in the study is plotted in FIG. 6. A significant reduction in blood loss was observed for all FVIII treatment groups compared to vehicle-treated animals. Within the three FVIII treatment groups, no statistically significant differences were found in the reduction of blood loss, suggesting that heterodimer molecules could potentially be as effective as SQ BDD-FVIII for treatment when needed.

Кроме того, мыши HemA обрабатывались более низкой дозой (37,5 МЕ/кг) rBDD-FVIII или FVШ169/ФВ034, результаты проиллюстрированы на фиг. 6В. Как и при дозе 75 МЕ/кг, гFVΠΠ69/ФВ034 обеспечивали такую же защиту для мышей HemA после повреждения хвоста, что и BDD-FVIII, показывая тем самым, что молекула по-прежнему является эффективной для лечения тяжелых эпизодов кровотечений при ~35% от нормального циркулирующего мышиного уровня FVIII в мышах HemA.In addition, HemA mice were treated with a lower dose (37.5 IU/kg) of rBDD-FVIII or FVIII169/FV034, the results are illustrated in Fig. 6B. As at 75 IU/kg, gFVΠΠ69/FV034 provided the same protection in HemA mice after tail injury as BDD-FVIII, showing that the molecule is still effective in treating severe bleeding episodes at ~35% of normal circulating murine FVIII levels in HemA mice.

- 107 044115- 107 044115

Процедура повреждения хвоста проводилась следующим образом.The tail injury procedure was carried out as follows.

Кратко, мыши анестезировались с помощью коктейля 50 мг/кг кетамина/0,5 мг/кг дексмедетомидина до начала повреждения хвоста и помещались на электрическую грелку 37°С, чтобы помочь поддержать температуру тела. Хвосты мышей затем погружались в 37°С физиологический раствор в течение 10 мин, с целью расширения боковой вены. После того, как вена расширялась, через хвостовую вену вводились варианты FVIII или раствор наполнителя, а по истечении 5 мин после введения дозы, дистальные 5 мм хвоста отрезались с использованием скальпеля с прямым краем #11. Пролитая кровь собиралась в 13 мл 37°С физиологического раствора в течение 30 мин, а объем кровопотери определялся изменением веса трубки для сбора крови: объем потери крови=(конечный вес трубки для сбора крови - начальный вес +0,10) мл. Статистический анализ проводился с использованием t-критерия (критерий Манна-Уитни) и одним из способов дисперсионного анализа (критерий Краскела-Уоллиса, апостериорный: критерий множественного сравнения Данна).Briefly, mice were anesthetized with a 50 mg/kg ketamine/0.5 mg/kg dexmedetomidine cocktail until the onset of tail injury and placed on a 37°C electric heating pad to help maintain body temperature. The tails of the mice were then immersed in 37°C saline for 10 min to dilate the lateral vein. Once the vein was dilated, FVIII variants or vehicle solution was injected via the tail vein, and 5 min after dosing, the distal 5 mm of the tail was cut away using a #11 straight edge scalpel. The spilled blood was collected in 13 ml of 37°C saline solution for 30 min, and the volume of blood loss was determined by changing the weight of the blood collection tube: volume of blood loss = (final weight of the blood collection tube - initial weight +0.10) ml. Statistical analysis was performed using t-test (Mann-Whitney test) and one of the analysis of variance methods (Kruskal-Wallis test, post hoc: Dunn's multiple comparison test).

Пример 10. Профилактическая эффективность гетеродимеров FVIII-XTEN-Fc/D'D3-XTEN-Fc на модели кровотечения разрезанной хвостовой вены мыши HemA.Example 10. Preventive efficacy of FVIII-XTEN-Fc/D'D3-XTEN-Fc heterodimers in the HemA mouse cut tail vein bleeding model.

Профилактическая эффективность FVШ169/ФВ057 была проверена на модели разрезанной хвостовой вены (tail vein transection - TVT) мыши HemA. TVT модель индуцирует кровотечение путем повреждения боковой вены хвоста мыши, такое повреждение имитирует спонтанные эпизоды кровотечения у пациентов с гемофилией (нарушением свертываемости крови).The preventive efficacy of FVIII169/FV057 was tested in the HemA mouse tail vein transection (TVT) model. The TVT model induces bleeding by damaging the lateral vein of the mouse's tail, an injury that mimics spontaneous bleeding episodes in patients with hemophilia (a bleeding disorder).

Самцы мышей HemA в возрасте 8-10 недель рандомизировались в 4 лечебные группы, и обрабатывались либо FVШ169/ФВ057 за 72 ч до повреждения хвостовой вены, или SQ BDD-FVIII за 24 ч или 48 ч до повреждения. Животные, которые обрабатывались наполнителем, использовались в качестве отрицательного контроля. На графике, на фиг. 7 отображены случаи повторного кровотечения или эвтаназии изза чрезмерной потери крови в течение 24 ч после повреждения.Male HemA mice, 8–10 weeks old, were randomized into 4 treatment groups and treated with either FVIII169/FV057 72 h before tail vein injury or SQ BDD-FVIII 24 h or 48 h before injury. Animals that were treated with vehicle were used as negative controls. On the graph, in Fig. Figure 7 shows cases of rebleeding or euthanasia due to excessive blood loss within 24 hours after injury.

Как проиллюстрировано на фиг. 7, в отличие от мышей, которых обрабатывали SQ BDD-FVIII за 48 ч до TVT, у которых после повреждения наблюдалась лишь ограниченная защита, мыши, получавшие rFVШ169/ФВ057 за 72 ч до повреждения хвоста имели аналогичную защиту от повторного кровотечения и выживаемость по сравнению с мышами, получавшими SQ BDD-FVIII лечение за 24 ч до TVT, что означает, что rFVШ169/ФВ057 может обеспечить, по меньшей мере в 3 раза или более (например, в 4 раза) длительную защиту мышей HemA в модели TVT. Таким образом, FVШ169/ФВ057 может значительно снизить частоту лечения текущей профилактики FVIII.As illustrated in FIG. 7, in contrast to mice treated with SQ BDD-FVIII 48 h before TVT, which showed only limited protection after injury, mice treated with rFVIII169/FV057 72 h before tail injury had similar protection against rebleeding and survival compared with mice receiving SQ BDD-FVIII treatment 24 h before TVT, which means that rFVIII169/FV057 can provide at least 3-fold or greater (eg, 4-fold) long-term protection in HemA mice in the TVT model. Thus, FVIII169/FV057 may significantly reduce the treatment frequency of current FVIII prophylaxis.

Подобным образом мыши HemA обрабатывались гетеродимерами FVIII-XTEN-Fc/D'D3-XTEN-Fc: rFVШ169/ФВ034 и rFVШ169/ФВ057 за 24 ч или 96 ч до повреждения хвостовой вены. Данные о лечении повторного кровотечения и выживаемости были сопоставлены с данными лечения BDD-FVIII за 24 или 48 ч до повреждения и наполнителя. В то время как повторное кровотечение у мышей, получавших rBDD-FVIII, в течение 24 ч до повреждения хвостовой вены, было похожим на такое у мышей, лечившихся носителем, данные о повторном кровотечении мышей, лечившихся гетеродимерами за 24 ч до повреждения, являются значительно лучшими, чем в группе лечения наполнителем. Кроме того, данные повторного кровотечения мышей, лечившихся гетеродимерами, за 96 ч до повреждения были сопоставимы с мышами, получавшими rBDD-FVIII за 24 ч до повреждения. Что касается коэффициента выживаемости через 24 ч после повреждения TVT, в отличие от потребности менее чем 50% коэффициента выживаемости мышей, лечившихся rBDD-FVIII, более чем 90% мышей выжили после повреждения TVT с лечением гетеродимерами FVIII-XTEN-Fc/D'D3-XTEN-Fc, когда молекулы FVIII вводились за 24 ч до повреждения. Кроме того, выживаемость у мышей, получавших гетеродимеры FVIII-XTEN-Fc/D'D3XTEN-Fc за 96 ч до повреждения хвостовой вены была лучше (в случае rFVШ169/ФВ034) или сопоставимой (в случае с rFVШ169/ФВ057) по сравнению с мышами, получавшими лечение rBDD-FVIII за 24 ч до повреждения. Данные и повторного кровотечения и выживаемости указывали на 4-кратную эффективность пролонгации лечения гетеродимером FVIII-XTEN-Fc/D'D3-XTEN-Fc в сравнении с лечением rBDD-FVIII.Similarly, HemA mice were treated with FVIII-XTEN-Fc/D'D3-XTEN-Fc heterodimers: rFVIII169/FV034 and rFVIII169/FV057 24 h or 96 h before tail vein injury. Treatment data for rebleeding and survival were compared with data for BDD-FVIII treatment 24 or 48 hours before injury and vehicle. While rebleeding in rBDD-FVIII-treated mice within 24 hours before tail vein injury was similar to that in vehicle-treated mice, data on rebleeding in mice treated with heterodimers 24 hours before injury are significantly better. than in the vehicle treatment group. In addition, rebleeding data from heterodimer-treated mice 96 h before injury were comparable to mice treated with rBDD-FVIII 24 h before injury. Regarding the survival rate 24 h after TVT injury, in contrast to the requirement of less than 50% survival rate of mice treated with rBDD-FVIII, more than 90% of mice survived after TVT injury with treatment with FVIII-XTEN-Fc/D'D3- heterodimers XTEN-Fc when FVIII molecules were administered 24 h before injury. In addition, survival in mice treated with FVIII-XTEN-Fc/D'D3XTEN-Fc heterodimers 96 hours before tail vein injury was better (in the case of rFVIII169/FV034) or comparable (in the case of rFVIII169/FV057) compared with mice , treated with rBDD-FVIII 24 hours before injury. Both rebleeding and survival data indicated a 4-fold prolongation efficacy of FVIII-XTEN-Fc/D'D3-XTEN-Fc heterodimer treatment compared with rBDD-FVIII treatment.

Модель разрезанной хвостовой вены мышей HemA.HemA mouse cut tail vein model.

Процедура разреза хвостовой вены хвоста проводилась следующим образом. Мышей анестезировали коктейлем, содержащим 50 мг/кг кетамина, 0,125 мг/кг дексмедетомидина и 0,1 мг/кг бупренекса. При адекватной глубине наркоза, боковую хвостовую вену мышей разрезали хирургическим скальпелем с прямым краем номер 11 в области, где диаметр хвоста составляет примерно 2,7 мм. Для обеспечения четкого наблюдения за раной, пролитая кровь смывалась теплым физиологическим раствором. Обработанные мыши затем один раз размещались в чистой клетке с подстилкой из белой бумаги на ближайшие 24 ч. Вплоть до 12 ч после повреждения хвоста, у мышей наблюдалось повторное кровотечение хвоста и физическая активность. Умирающие мыши немедленно подвергались эвтаназии, а окончательное наблюдение проводили через 24 ч после повреждения хвоста. Для имитации ситуации кровотечения у пациентов с гемофилией и обеспечения полного восстановления животного от анестезии, 1 мг/кг раствора атипамезола предоставлялся для отмены эффекта дексмедетомидина в начале процедуры рассечения хвостовой вены. С целью ночного обезболивания в конце 12-часового периода наблюдения вводилась дополнительная доза 0,1 мг/кг бупренекса. Кривая выживаемости времени до повторного кровотечения иThe procedure for cutting the caudal vein of the tail was carried out as follows. Mice were anesthetized with a cocktail containing 50 mg/kg ketamine, 0.125 mg/kg dexmedetomidine, and 0.1 mg/kg buprenex. With an adequate depth of anesthesia, the lateral tail vein of the mice was cut with a number 11 straight edge surgical scalpel in the area where the tail diameter is approximately 2.7 mm. To ensure clear observation of the wound, spilled blood was washed off with warm saline. Treated mice were then housed once in a clean cage with white paper bedding for the next 24 hours. Up to 12 hours after tail injury, mice experienced repeated tail bleeding and physical activity. Dying mice were immediately euthanized and final observation was made 24 h after tail injury. To simulate the bleeding situation in patients with hemophilia and ensure complete recovery of the animal from anesthesia, 1 mg/kg atipamezole solution was provided to reverse the effect of dexmedetomidine at the beginning of the tail vein dissection procedure. For nighttime analgesia, an additional dose of 0.1 mg/kg buprenex was administered at the end of the 12-hour observation period. Survival curve of time to rebleeding and

- 108 044115 времени до эвтаназии генерировалась для анализа данных, а для статистической оценки использовался логранговый (Кокса-Мантеля) критерий.- 108 044115 time to euthanasia was generated for data analysis, and the log-rank (Cox-Mantel) test was used for statistical evaluation.

Пример 11. Приготовление FVШ169/ФВ059 и других конструктов Клонирование pSYN FVIII 310.Example 11. Preparation of FVIII169/FV059 and other constructs Cloning pSYN FVIII 310.

Синтетический ДНК-фрагмент фланкированный сайтом BamH1 на N-конце и сайтом Cla1 на Сконце был коммерчески изготовлен. Эта синтетическая ДНК использовалась для замены региона BamHl на Cla1 в конструкте pSYN FVIII 169 (SEQ ID NO: 155). И синтетическая ДНК и ДНК pSYN FVIII 169 были дважды расщеплены с использованием BamH1 и Cla1, расщепленная синтетическая ДНК встраивалась в расщепленный pSYN FVIII 169 для создания pSYN FVIII 310 (SEQ ID NO:168; табл. 20).A synthetic DNA fragment flanked by a BamH1 site at the N-terminus and a Cla1 site at the C-terminus was commercially produced. This synthetic DNA was used to replace the BamHl region with Cla1 in the pSYN FVIII 169 construct (SEQ ID NO: 155). Both synthetic DNA and pSYN FVIII 169 DNA were double-digested using BamH1 and Cla1, and the digested synthetic DNA was incorporated into digested pSYN FVIII 169 to create pSYN FVIII 310 (SEQ ID NO:168; Table 20).

Клонирование pSYN FVIII 312.Cloning of pSYN FVIII 312.

Синтетический ДНК-фрагмент фланкированный сайтом BamH1 на N-конце и сайтом Afe 1 на Сконце был коммерчески изготовлен. Эта синтетическая ДНК использовалась для замены BamH1 на регион Afe1 в конструкте pSYN FVIII 169 (SEQ ID NO: 155). И синтетическая ДНК и ДНК pSYN FVIII 169 были дважды расщеплены с использованием BamH1 и Afe1, расщепленная синтетическая ДНК встраивалась в расщепленный pSYN FVIII 169 для создания pSYN FVIII 312 (SEQ ID NO: 169; табл. 20). pSYN FVIII 312A (SEQ ID NO: 2; табл. 20) был создан из pSYN FVIII312 с целью удаления сайта AscI, кодирующего разрыв аминокислотных остатков на стыке FVIII и XTEN.A synthetic DNA fragment flanked by a BamH1 site at the N-terminus and an Afe 1 site at the C-terminus was commercially produced. This synthetic DNA was used to replace BamH1 with the Afe1 region in the pSYN FVIII 169 construct (SEQ ID NO: 155). Both synthetic DNA and pSYN FVIII 169 DNA were double-digested using BamH1 and Afe1, and the digested synthetic DNA was incorporated into digested pSYN FVIII 169 to create pSYN FVIII 312 (SEQ ID NO: 169; Table 20). pSYN FVIII 312A (SEQ ID NO: 2; Table 20) was created from pSYN FVIII312 to remove the AscI site encoding the amino acid residue gap at the junction of FVIII and XTEN.

Таблица 20Table 20

Синтетические конструкты FVIIISynthetic FVIII constructs

Конструкт Construct Последовательность белка Protein sequence pSYN FVIII 169 pSYN FVIII 169 PRSFSQNGAPGTSESATPESGPGSEPATSGSETPGTSESATPESGPGSEP ATSGSETPGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSESA PRSFSQNGAPGTSESATPESGPGSEPATSGSETPGTSESATPESGPGSEP ATSGSETPGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSESA TPESGPGSEPATSGSETPGTSESATPESGPGSPAGSPTSTEEGSPAGSPTS TPESGPGSEPATSGSETPGTSESATPESGPGSPAGSPTSTEEGSPAGSPTS TEEGTSTEPSEGSAPGTSESATPESGPGTSESATPESGPGTSESATPESGP TEEGTSTEPSEGSAPGTSESATPESGPGTSESATPESGPGTSESATPESGP GSEPATSGSETPGSEPATSGSETPGSPAGSPTSTEEGTSTEPSEGSAPGT GSEPATSGSETPGSEPATSGSETPGSPAGSPTSTEEGTSTEPSEGSAPGT STEPSEGSAPGSEPATSGSETPGTSESATPESGPGTSTEPSEGSAPASSPP STEPSEGSAPGSEPATSGSETPGTSESATPESGPGTSTEPSEGSAPASSPP VLKRHQAEITR (SEQ ID NO: 167) (Подчеркнуты = остатки XTEN; не подчеркнуты = остатки FVIII) VLKRHQAEITR (SEQ ID NO: 167) (Underlined = XTEN residues; not underlined = FVIII residues) pSYN FVIII 310 pSYN FVIII 310 PRSFGAPGTSESATPESGPGSEPATSGSETPGTSESATPESGPGSEPATS GSETPGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSESATPES PRSFGAPGTSESATPESGPGSEPATSGSETPGTSESATPESGPGSEPATS GSETPGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSESATPES GPGSEPATSGSETPGTSESATPESGPGSPAGSPTSTEEGSPAGSPTSTEE GPGSEPATSGSETPGTSESATPESGPGSPAGSPTSTEEGSPAGSPTSTEE GTSTEPSEGSAPGTSESATPESGPGTSESATPESGPGTSESATPESGPGS GTSTEPSEGSAPGTSESATPESGPGTSESATPESGPGTSESATPESGPGS EPATSGSETPGSEPATSGSETPGSPAGSPTSTEEGTSTEPSEGSAPGTSTE EPATSGSETPGSEPATSGSETPGSPAGSPTSTEEGTSTEPSEGSAPGTSTE PSEGSAPGSEPATSGSETPGTSESATPESGPGTSTEPSEGSAPASSEITR PSEGSAPGSEPATSGSETPGTSESATPESGPGTSTEPSEGSAPASSEITR (SEQ ID NO: 168) (Подчеркнуты = остатки XTEN; не подчеркнуты = остатки FVIII) (SEQ ID NO: 168) (Underlined = XTEN residues; not underlined = FVIII residues) pSYN FVIII 312 pSYN FVIII 312 PRSFSONGAPGTSESATPESGPGSEPATSGSETPGTSESATPESGPGSEP ATSGSETPGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSESA PRSFSONGAPGTSESATPESGPGSEPATSGSETPGTSESATPESGPGSEP ATSGSETPGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSESA TPESGPGSEPATSGSETPGTSESATPESGPGSPAGSPTSTEEGSPAGSPTS TPESGPGSEPATSGSETPGTSESATPESGPGSPAGSPTSTEEGSPAGSPTS TEEGTSTEPSEGSAPGTSESATPESGPGTSESATPESGPGTSESATPESGP TEEGTSTEPSEGSAPGTSESATPESGPGTSESATPESGPGTSESATPESGP GSEPATSGSETPGSEPATSGSETPGSPAGSPTSTEEGTSTEPSEGSAPGT GSEPATSGSETPGSEPATSGSETPGSPAGSPTSTEEGTSTEPSEGSAPGT STEPSEGSAPGSEPATSGSETPGTSESATPESGPGTSTEPSEGSAPASSEI STEPSEGSAPGSEPATSGSETPGTSESATPESGPGTSTEPSEGSAPASSEI

- 109 044115- 109 044115

TR (SEQ ID NO: 169) (Подчеркнуты = остатки XTEN; не подчеркнуты = остатки FVIII) TR (SEQ ID NO: 169) (Underlined = XTEN residues; not underlined = FVIII residues) pSYN FVIII 312А pSYN FVIII 312A PRSFSONGTSESATPESGPGSEPATSGSETPGTSESATPESGPGSEPATS GSETPGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSESATPES PRSFSONGTSESATPESGPGSEPATSGSETPGTSESATPESGPGSEPATS GSETPGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSESATPES GPGSEPATSGSETPGTSESATPESGPGSPAGSPTSTEEGSPAGSPTSTEE GPGSEPATSGSETPGTSESATPESGPGSPAGSPTSTEEGSPAGSPTSTEE GTSTEPSEGSAPGTSESATPESGPGTSESATPESGPGTSESATPESGPGS GTSTEPSEGSAPGTSESATPESGPGTSESATPESGPGTSESATPESGPGS EPATSGSETPGSEPATSGSETPGSPAGSPTSTEEGTSTEPSEGSAPGTSTE EPATSGSETPGSEPATSGSETPGSPAGSPTSTEEGTSTEPSEGSAPGTSTE PSEGSAPGSEPATSGSETPGTSESATPESGPGTSTEPSEGSAPASSEITR PSEGSAPGSEPATSGSETPGTSESATPESGPGTSTEPSEGSAPASSEITR (SEQ ID NO: 2) (подобная последовательность, что иpSYNFVIII 312, удалены только остатки, соответствующие сайту Asci, т.е. разрыву) (Подчеркнуты = остатки XTEN; не подчеркнуты = остатки FVIII) (SEQ ID NO: 2) (similar sequence to pSYNFVIII 312, only the residues corresponding to the Asci site, i.e. the break, have been removed) (Underlined = XTEN residues; not underlined = FVIII residues)

Клонирование pSYN ФВ059 и ФВ073.Cloning of pSYN VF059 and VF073.

Были созданы различные синтетические фрагменты ДНК, кодирующие различные линкерные регионы между DD3-XTEN и Fc. Эти синтетические фрагменты ДНК фланкированы сайтом ASC1 на Nконце и сайтом Not 1 на С-конце. Эти синтетические ДНК использовались для замены региона Asc1 на Not1 в конструкте pSYN ФВ057 (SEQ ID NO: 152). Конструкт ФВ059 pSYN (табл. 21) содержит линкерный регион (SEQ ID NO: 13), который включает в себя весь кислый регион 2 (а2) FVIII. Как сообщается, этот сайт расщепляется тромбином и при активации FVIII высвобождается DD3XTEN. Конструкт ФВ073 pSYN (табл. 21) содержит только сайт расщепления тромбином кислого региона 2 (а2) FVIII (т.е. IEPRSFS) (SEQ ID NO: 23). И синтетическая ДНК и ДНК pSYN ФВ057 были дважды расщеплены с использованием Asc1 и Not1. Расщепленная синтетическая ДНК встраивалась в расщепленный pSYN ФВ057 для создания pSYN ФВ059 и pSYN ФВ073. Конструкт ФВ59А pSYN (табл. 21) был сформирован из pSYN ФВ059 путем удаления сайта рестрикции EcoRV. Гетеродимерные белки FVIШ69/ФВ057 и FVIШ69/ФВ059 были созданы путем коэкспрессии FVIII169 и ФВ057 или ФВ059 в клетках HEK293.Various synthetic DNA fragments were generated encoding different linker regions between DD3-XTEN and Fc. These synthetic DNA fragments are flanked by an ASC1 site at the N-terminus and a Not 1 site at the C-terminus. These synthetic DNAs were used to replace the Asc1 region with Not1 in the pSYN FB057 construct (SEQ ID NO: 152). The FV059 pSYN construct (Table 21) contains a linker region (SEQ ID NO: 13) that includes the entire FVIII acidic region 2(a2). This site is reported to be cleaved by thrombin and upon FVIII activation to release DD3XTEN. The FV073 pSYN construct (Table 21) contains only the thrombin cleavage site of the FVIII acidic region 2 (a2) (ie, IEPRSFS) (SEQ ID NO: 23). Both synthetic DNA and pSYN FB057 DNA were double-digested using Asc1 and Not1. The digested synthetic DNA was inserted into the digested pSYN VWF057 to create pSYN VWF059 and pSYN VWF073. The FB59A pSYN construct (Table 21) was generated from FB059 pSYN by removing the EcoRV restriction site. The heterodimeric proteins FVIIII69/FV057 and FVIIII69/FV059 were created by coexpression of FVIII169 and FVIII169 and VF057 or VF059 in HEK293 cells.

- 110 044115- 110 044115

Таблица 21Table 21

Синтетические конструкты ФВ - регионы расщепляемого линкераSynthetic VWF constructs - cleavable linker regions

Конструкт Construct Последовательность белка Protein sequence pSYN ФВ057 pSYN FV057 TSTEEGASSGGGGSGGGGSGGGGSGGGGSGGGGSGGGGSGGGGSLVPR GSGGDKTH (SEQ ID NO: 12) Выделенная курсивом и подчеркнутая последовательность показывает GS линкер и сайт расщепления тромбином LVPR (также заштрихован). TSTEEGASSGGGGSGGGGSGGGGSGGGGSGGGGSGGGGSGGGGSLVPR GSGGDKTH (SEQ ID NO: 12) The italicized and underlined sequence shows the GS linker and the LVPR thrombin cleavage site (also shaded). pSYN ФВ059 pSYN FV059 TSTEEGASISDKNTGDYYEDSYEDISAYLLSKNNAIEPRSFSDKTH (SEQ ID NO: 13) Выделенная курсивом и подчеркнутая последовательность показывает 32 а.к. из кислого региона 2 FVIII (а2). Заштрихованная последовательность показывает сайт расщепления тромбином, используемый в pSYN ФВ059А. TSTEEGASISDKNTGDYYEDSYEDISAYLLSKNNAIEPRSFSDKTH (SEQ ID NO: 13) The italicized and underlined sequence shows 32 aa. from acidic region 2 of FVIII (a2). The shaded sequence shows the thrombin cleavage site used in pSYN FB059A. pSYN ФВ059А pSYN FV059A TSTEEGASSDKNTGDYYEDSYEDISAYLLSKNNAIEPRSFSDKTH (SEQ ID NO: 22) Выделенная курсивом и подчеркнутая последовательность показывает 32 а.к. из кислого региона 2 FVIII (а2). Эта последовательность представляет собой аналогичную последовательность для ФВ059, за исключением того, что остатки соответствующие сайту EcoRV (т.е., IS) удалены. TSTEEGASSDKNTGDYYEDSYEDISAYLLSKNNAIEPRSFSDKTH (SEQ ID NO: 22) The italicized and underlined sequence shows 32 aa. from acidic region 2 of FVIII (a2). This sequence is similar to that of VF059, except that the residues corresponding to the EcoRV site (ie, IS) are deleted. pSYN ФВ073 pSYN FV073 TSTEEGASSGGGGSGGGGSGGGGSGGGGSGGGGSGGGGSIEPRSFSGSG GDKTH (SEQ ID NO: 23) Выделенная курсивом и подчеркнутая последовательность показывает линкер GS с укороченным сайтом расщепления тромбином из кислого региона 2 FVIII (заштрихованные 7 аминокислот-IEPRSFS). TSTEEGASSGGGGSGGGGSGGGGSGGGGSGGGGSGGGGSIEPRSFSGSG GDKTH (SEQ ID NO: 23) The italicized and underlined sequence shows the GS linker with a truncated thrombin cleavage site from FVIII acidic region 2 (shaded 7 amino acids-IEPRSFS).

Пример 12. Расщепление гетеродимера FVIII тромбином для анализа высвобождения D'D3 из Fc.Example 12 Thrombin cleavage of FVIII heterodimer to assay release of D'D3 from Fc.

Два гетеродимерных белка FVIII испытывались в экспериментах расщепления тромбином, а также проверялся их уровень расщепления тромбином. Два гетеродимерных конструкта, используемые в данном эксперименте, являлись гетеродимером FVШ169/ФВ057 и гетеродимером FVIШ69/ФВ059 вместе с FVIIIFc. Гетеродимеры FVIШ69/ФВ057 и FVIIH69/OB059 описаны выше. Проводились три реакции расщепления: i) FVIIIFc ii) FVIII169^B057 (фиг. 11), и iii) FVIII 169/ФВ059 (фиг. 12). Образцы для испытаний обрабатывались человеческим а-тромбином при молярном соотношении, если FVIII:tpom6uh приблизительно 22:1. Каждая реакция инкубировалась в водяной бане при 37°С. В каждый указанный момент времени (t=5, 15, 30, 45, 60 мин), изымался образец 22,5 мкл, останавливался с 22,5 мкл 2хДСН красителя в невосстанавливающих условиях, и нагревался в течение 3-х мин. Расщепленный белок затем запускался на геле ДСН-ПААГ. Вестерн-блоттинг проводился с использованием антител против тяжелой цепи FVIII (GMA012) и антител против ФВ-D3 (Ат 96340) с использованием системы LICOR.Two heterodimeric FVIII proteins were tested in thrombin cleavage experiments and their levels of thrombin cleavage were also tested. The two heterodimer constructs used in this experiment were the FVIII169/FV057 heterodimer and the FVIIII69/FV059 heterodimer plus FVIIIFc. The heterodimers FVIIII69/FV057 and FVIIH69/OB059 are described above. Three cleavage reactions were carried out: i) FVIIIFc ii) FVIII169^B057 (Fig. 11), and iii) FVIII 169/FB059 (Fig. 12). Test samples were treated with human α-thrombin at a molar ratio of approximately 22:1 FVIII:tpom6uh. Each reaction was incubated in a water bath at 37°C. At each specified time point (t=5, 15, 30, 45, 60 min), a 22.5 µL sample was removed, stopped with 22.5 µL of 2xSDS dye under non-reducing conditions, and heated for 3 min. The digested protein was then run on an SDS-PAGE gel. Western blotting was performed using anti-FVIII heavy chain antibody (GMA012) and anti-VWF-D3 antibody (Ab 96340) using the LICOR system.

Как показано на фиг. 11, экспозиция FVШ169/ФВ057 с тромбином приводит к постепенному снижению детектируемого уровня D'D3-XTEN-Fc, коррелирующего с увеличением уровня D'D3-144 XTEN расщепленного продукта. После 15 мин остается нерасщепленный FVШ169/ФВ057. С другой стороны, фиг. 12 показывает, что FVIII 169/ФВ059 быстрее расщепляется тромбином, о чем свидетельствует практически не обнаруживаемый через 5 мин нерасщепленный FVIII 169/ФВ059. Соответственно, FVIII 169/ФВ059, по сравнению с FVIII 169/ФВ057, показывает лучшее высвобождение D'D3 из Fc при активации тромбина.As shown in FIG. 11, exposure of FVIII169/FV057 to thrombin results in a gradual decrease in the detectable level of D'D3-XTEN-Fc, correlating with an increase in the level of D'D3-144 XTEN cleaved product. After 15 minutes, uncleaved FVШ169/FV057 remains. On the other hand, FIG. 12 shows that FVIII 169/VWF059 is rapidly cleaved by thrombin, as evidenced by the virtually undetectable uncleaved FVIII 169/VWF059 after 5 minutes. Accordingly, FVIII 169/VWF059, compared to FVIII 169/VFW057, shows better release of D'D3 from Fc upon thrombin activation.

Для исследования расщепления тромбином проводились параллельные эксперименты с использованием масс-спектроскопии (МС). С использованием МС, FVIII 169/ФВ059, по сравнению с ФВ057, вновь показал лучшее высвобождение D'D3 из Fc.To investigate thrombin cleavage, parallel experiments were performed using mass spectroscopy (MS). Using MS, FVIII 169/VF059, compared to FV057, again showed better release of D'D3 from Fc.

Пример 13. In vivo определение FVШ169/ФВ059 в мышах HemA.Example 13: In vivo determination of FVIII169/FV059 in HemA mice.

Для дальнейшей оценки фармакокинетического профиля и in vivo эффективности FVШ169/ФВ059,To further evaluate the pharmacokinetic profile and in vivo efficacy of FVIII169/FV059,

- 111 044115 мыши HemA обрабатывались FVIII 169/ФВ059 путем внутривенного введения при дозе 150 МЕ/кг. Образцы плазмы собирались с помощью взятия крови полой вены через 5 мин, 24, 48, 72, 96 и 120 ч после инъекции. Активность FVIII в образцах плазмы измерялась с помощью хромогенного анализа FVIII, а параметры ФК рассчитывались с использованием программы Phoenix. Как проиллюстрировано в табл. 22, по сравнению с FVIII169/®B057, у FVIII 169/ФВ059 наблюдался аналогичный профиль ФК, это означает, что линкер расщепления тромбином а2 не оказывает отрицательного влияния на ФК профиль гетеродимера.- 111 044115 HemA mice were treated with FVIII 169/FV059 by intravenous administration at a dose of 150 IU/kg. Plasma samples were collected by vena cava blood draw at 5 min, 24, 48, 72, 96, and 120 h postinjection. FVIII activity in plasma samples was measured using the FVIII chromogenic assay, and PK parameters were calculated using Phoenix software. As illustrated in table. 22, compared to FVIII169/®B057, FVIII 169/®B059 exhibited a similar PK profile, indicating that the thrombin a2 cleavage linker does not negatively impact the PK profile of the heterodimer.

Таблица 22Table 22

Профиль ФК FVIII 169/ФВ057 и FVIII 169/ФВ059 у мышей HemAPK profile of FVIII 169/FV057 and FVIII 169/FV059 in HemA mice

Г етеродимер Heterodimer Tl/2 (ч) Tl/2 (h) AUC/D (ч*кг*мМЕ/мл/мМЕ) AUC/D (h*kg*mIU/ml/mIU) Cl (мл/ч/кг) Cl (ml/h/kg) MRT (ч) MRT (h) Vss (мл/кг) Vss (ml/kg) ΡνΐΙΙ169/ΦΒ057 ΡνΐΙΙ169/ΦΒ057 38,53 38.53 0,80 0.80 1,26 1.26 44,92 44.92 56,38 56.38 ΡνΐΙΙ169/ΦΒ059 ΡνΐΙΙ169/ΦΒ059 40,51 40.51 0,74 0.74 1,35 1.35 49,22 49.22 66,26 66.26

Мгновенная эффективность FVIII 169/ФВ059 оценивалась на модели хвоста мыши HemA (описана в примере 9), по сравнению с диким типом BDD-FVIII. Мыши HemA обрабатывались 75 МЕ/кг либо FVIII 169/ФВ059 либо BDD-FVIII, объем потери крови каждой экспериментальной мыши был отображен на графике на фиг. 13. По сравнению с BDD-FVIII, FVIII169/®B059 обеспечивал ту же степень защиты мышей HemA (р=0,9883), что свидетельствует о том, что ΡνΐΙΙ169/ΦΒ059 является полностью функциональным in vivo.The immediate efficacy of FVIII 169/FV059 was assessed in the HemA mouse tail model (described in Example 9), compared to wild type BDD-FVIII. HemA mice were treated with 75 IU/kg of either FVIII 169/FV059 or BDD-FVIII, and the amount of blood loss from each experimental mouse was plotted in FIG. 13. Compared with BDD-FVIII, FVIII169/®B059 provided the same degree of protection in HemA mice (p=0.9883), indicating that ΡνΐΙΙΙΙ169/ΦΒ059 is fully functional in vivo.

Плазмидная конструкция гетеродимеров FVIII-XTEN-Fc/D'D3-Fc.Plasmid construction of FVIII-XTEN-Fc/D'D3-Fc heterodimers.

Нуклеотидная последовательность ФВ031 (SEQ ID NO: 147).Nucleotide sequence of FB031 (SEQ ID NO: 147).

ATGAT TCCTG CCAGA TTTGC CGGGG TGCTG CTTGC TCTGG CCCTC ATTTTATGAT TCCTG CCAGA TTTGC CGGGG TGCTG CTTGC TCTGG CCCTC ATTTT

GCCAG GGACC CTTTG TGC AG AAGGA ACTCG CGGCA GGTC A TCC AC GGCCCGCCAG GGACC CTTTG TGC AG AAGGA ACTCG CGGCA GGTC A TCC AC GGCCC

101 GATGC AGCCT TTTCG GA AGT GACTT CGTC A AC ACC TTTGA TGGG A GC ATG101 GATGC AGCCT TTTCG GA AGT GACTT CGTC A AC ACC TTTGA TGGG A GC ATG

151 TACAG CTTTG CGGGA TACTG CAGTT ACCTC CTGGC AGGGG GCTGC CAGAA151 TACAG CTTTG CGGGA TACTG CAGTT ACCTC CTGGC AGGGG GCTGC CAGAA

201 ACGCT CCTTC TCGAT T ATTG GGGAC TTCC A GA ATG GCA AG AGAGT GAGCC201 ACGCT CCTTC TCGAT T ATTG GGGAC TTCC A GA ATG GCA AG AGAGT GAGCC

251 TCTCC GTGTA TCTTG GGGAA TTTTT TGACA TCCAT TTGTT TGTCA ATGGT251 TCTCC GTGTA TCTTG GGGAA TTTTT TGACA TCCAT TTGTT TGTCA ATGGT

301 ACCGT GACAC AGGGG GACCA AAGAG TCTCC ATGCC CTATG CCTCC AAAGG301 ACCGT GACAC AGGGG GACCA AAGAG TCTCC ATGCC CTATG CCTCC AAAGG

351 GCTGT ATCTA GAAAC TGAGG CTGGG TACTA CAAGC TGTCC GGTGA GGCCT351 GCTGT ATCTA GAAAC TGAGG CTGGG TACTA CAAGC TGTCC GGTGA GGCCT

401 ATGGC TTTGT GGCCA GGATC GATGG CAGCG GCA AC TTTCA AGTCC TGCTG401 ATGGC TTTGT GGCCA GGATC GATGG CAGCG GCA AC TTTCA AGTCC TGCTG

451 TCAGA CAGAT ACTTC AACAA GACCT GCGGG CTGTG TGGCA ACTTT AACAT451 TCAGA CAGAT ACTTC AACAA GACCT GCGGG CTGTG TGGCA ACTTT AACAT

501 CTTTG CTGAA GATGA CTTTA TGACC CAAGA AGGGA CCTTG ACCTC GGACC501 CTTTG CTGAA GATGA CTTTA TGACC CAAGA AGGGA CCTTG ACCTC GGACC

551 CTTAT GACTT TGCCA ACTCA TGGGC TCTGA GCAGT GGAGA ACAGT GGTGT551 CTTAT GACTT TGCCA ACTCA TGGGC TCTGA GCAGT GGAGA ACAGT GGTGT

601 GAACG GGCAT CTCCT CCCAG CAGCT CATGC A AC AT CTCCT CTGGG GA A AT601 GAACG GGCAT CTCCT CCCAG CAGCT CATGC A AC AT CTCCT CTGGG GA A AT

651 GCAGA AGGGC CTGTG GGAGC AGTGC CAGCT TCTGA AGAGC ACCTC GGTGT651 GCAGA AGGGC CTGTG GGAGC AGTGC CAGCT TCTGA AGAGC ACCTC GGTGT

701 TTGCC CGCTG CCACC CTCTG GTGGA CCCCG AGCCT TTTGT GGCCC TGTGT701 TTGCC CGCTG CCACC CTCTG GTGGA CCCCG AGCCT TTTGT GGCCC TGTGT

751 GAGAA GACTT TGTGT GAGTG TGCTG GGGGG CTGGA GTGCG CCTGC CCTGC751 GAGAA GACTT TGTGT GAGTG TGCTG GGGGG CTGGA GTGCG CCTGC CCTGC

801 CCTCC TGGAG TACGC CCGGA CCTGT GCCCA GGAGG GAATG GTGCT GTACG801 CCTCC TGGAG TACGC CCGGA CCTGT GCCCA GGAGG GAATG GTGCT GTACG

851 GCTGG ACCGA CCACA GCGCG TGC AG CCCAG TGTGC CCTGC TGGTA TGGAG851 GCTGG ACCGA CCACA GCGCG TGC AG CCCAG TGTGC CCTGC TGGTA TGGAG

901 TAT AG GCAGT GTGTG TCCCC TTGCG CC AGG ACCTG CCAGA GCCTG C AC AT901 TAT AG GCAGT GTGTG TCCCC TTGCG CC AGG ACCTG CCAGA GCCTG C AC AT

951 CAATG AAATG TGTCA GGAGC GATGC GTGGA TGGCT GCAGC TGCCC TGAGG951 CAATG AAATG TGTCA GGAGC GATGC GTGGA TGGCT GCAGC TGCCC TGAGG

1001 GACAG CTCCT GGATG AAGGC CTCTG CGTGG AGAGC ACCGA GTGTC CCTGC1001 GACAG CTCCT GGATG AAGGC CTCTG CGTGG AGAGC ACCGA GTGTC CCTGC

1051 GTGCA TTCCG GAAAG CGCTA CCCTC CCGGC ACCTC CCTCT CTCGA GACTG1051 GTGCA TTCCG GAAAG CGCTA CCCTC CCGGC ACCTC CCTCT CTCGA GACTG

1101 C A AC A CCTGC ATTTG CCGA A AC AGC C AGTG GATCT GCAGC A ATGA AGA AT1101 C A AC A CCTGC ATTTG CCGA A AC AGC C AGTG GATCT GCAGC A ATGA AGA AT

1151 GTCCA GGGGA GTGCC TTGTC ACTGG ТСААТ СССAC TTCAA GAGCT TTGAC1151 GTCCA GGGGA GTGCC TTGTC ACTGG TCAAT CCCAC TTCAA GAGCT TTGAC

- 112 044115- 112 044115

1201 A AC AG AT ACT TC ACC TTC AG TGGGA TCTGC C AGT A CCTGC TGGCC CGGGA1201 A AC AG AT ACT TC ACC TTC AG TGGGA TCTGC C AGT A CCTGC TGGCC CGGGA

1251 TTGCC AGGAC CACTC CTTCT CCATT GTCAT TGAGA CTGTC CAGTG TGCTG 1301 ATGAC CGCGA CGCTG TGTGC ACCCG CTCCG TCACC GTCCG GCTGC CTGGC 1351 CTGC A C A AC A GCCTT GTGA A ACTGA AGC AT GGGGC AGGAG TTGCC ATGGA 1401 TGGCC AGGAC ATCCA GCTCC CCCTC CTGAA AGGTG ACCTC CGCAT CCAGC 1451 АТАСА GTGAC GGCCT CCGTG CGCCT CAGCT ACGGG GAGGA CCTGC AGATG 1501 GACTG GGATG GCCGC GGGAG GCTGC TGGTG AAGCT GTCCC CCGTC TATGC1251 TTGCC AGGAC CACTC CTTCT CCATT GTCAT TGAGA CTGTC CAGTG TGCTG 1301 ATGAC CGCGA CGCTG TGTGC ACCCG CTCCG TCACC GTCCG GCTGC CTGGC 1351 CTGC A C A AC A GCCTT GTGA A ACTGA AGC AT GGGGC AGGAG TTGCC ATGGA 1401 TGGCC AGGAC ATCCA GCT CC CCCTC CTGAA AGGTG ACCTC CGCAT CCAGC 1451 ATASA GTGAC GGCCT CCGTG CGCCT CAGCT ACGGG GAGGA CCTGC AGATG 1501 GACTG GGATG GCCGC GGGAG GCTGC TGGTG AAGCT GTCCC CCGTC TATGC

1551 CGGGA AGACC TGCGG CCTGT GTGGG A ATT A C A ATG GCA AC C AGGG CGACG 1601 ACTTC CTTAC CCCCT CTGGG CTGGC GGAGC CCCGG GTGGA GGACT TCGGG 1651 AACGC CTGGA AGCTG CACGG GGACT GCCAG GACCT GCAGA AGCAG CACAG 1701 CGATC CCTGC GCCCT CAACC CGCGC ATGAC CAGGT TCTCC GAGGA GGCGT 1751 GCGCG GTCCT GACGT CCCCC ACATT CGAGG CCTGC CATCG TGCCG TCAGC 1801 CCGCT GCCCT ACCTG CGGAA CTGCC GCTAC GACGT GTGCT CCTGC TCGGA 1851 CGGCC GCGAG TGCCT GTGCG GCGCC CTGGC CAGCT ATGCC GCGGC CTGCG 1901 CGGGG AGAGG CGTGC GCGTC GCGTG GCGCG AGCCA GGCCG CTGTG AGCTG 1951 AACTG CCCGA AAGGC CAGGT GT ACC TGCAG TGCGG GACCC CCTGC AACCT 2001 GACCT GCCGC TCTCT CTCTT ACCCG GATGA GGAAT GCA AT GAGGC CTGCC 2051 TGGAG GGCTG CTTCT GCCCC CCAGG GCTCT ACATG GATGA GAGGG GGGAC 2101 TGCGT GCCCA AGGCC CAGTG CCCCT GTTAC TATGA CGGTG AGATC TTCCA 2151 GCCAG A AGAC ATCTT CTC AG АССАТ САС AC C ATGT GCTAC TGTGA GGATG 2201 GCTTC ATGCA CTGTA CCATG AGTGG AGTCC CCGGA AGCTT GCTGC CTGAC 2251 GCTGT CCTCA GCAGT CCCCT GTCTC ATCGC AGCAA AAGGA GCCTA TCCTG 2301 TCGGC CCCCC ATGGT CAAGC TGGTG TGTCC CGCTG ACAAC CTGCG GGCTG 2351 A AGGG CTCGA GTGT A CCA A A ACGTG CC AGA АСТАТ GACCT GGAGT GC ATG 2401 AGCAT GGGCT GTGTC TCTGG CTGCC TCTGC CCCCC GGGCA TGGTC CGGCA 2451 TGAGA ACAGA TGTGT GGCCC TGGAA AGGTG TCCCT GCTTC CATCA GGGCA 2501 AGGAG TATGC CCCTG GAGAA ACAGT GAAGA TTGGC TGCAA CACTT GTGTC 2551 TGTCG GGACC GGAAG TGGAA CTGCA CAGAC CATGT GTGTG ATGCC ACGTG 2601 CTCCA CGATC GGCAT GGCCC ACT AC CTCAC CTTCG ACGGG CTCAA AT ACC 2651 TGTTC CCCGG GGAGT GCCAG TACGT TCTGG TGCAG GATTA CTGCG GCAGT 2701 AACCC TGGGA CCTTT CGGAT CCTAG TGGGG AATAA GGGAT GCAGC CACCC 2751 CTCAG TGAAA TGCAA GAAAC GGGTC АССАТ CCTGG TGGAG GGAGG AGAGA 2801 TTGAG CTGTT TGACG GGGAG GTGAA TGTGA AGAGG CCCAT GAAGG ATGAG 2851 ACTCA CTTTG AGGTG GTGGA GTCTG GCCGG TACAT CATTC TGCTG CTGGG 2901 CAAAG CCCTC TCCGT GGTCT GGGAC CGCCA CCTGA GCATC TCCGT GGTCC 2951 TGAAG CAGAC AT ACC AGGAG AAAGT GTGTG GCCTG TGTGG GAATT TTGAT 3001 GGCAT CCAGA ACAAT GACCT САССА GCAGC AACCT CCAAG TGGAG GAAGA 3051 CCCTG TGGAC TTTGG GAACT CCTGG AAAGT GAGCT CGCAG TGTGC TGACA1551 CGGGA AGACC TGCGG CCTGT GTGGG A ATT A C A ATG GCA AC C AGGG CGACG 1601 ACTTC CTTAC CCCCT CTGGG CTGGC GGAGC CCCGG GTGGA GGACT TCGGG 1651 AACGC CTGGA AGCTG CACGG GGACT GCCAG GACCT GCAGA AGCAG CACAG 1701 CGATC CCTGC GCCCT CAACC CGCGC ATGAC CAGGT TCTCC GAGGA GGCGT 1751 GCGCG GTCCT GACGT CCCCC ACATT CGAGG CCTGC CATCG TGCCG TCAGC 1801 CCGCT GCCCT ACCTG CGGAA CTGCC GCTAC GACGT GTGCT CCTGC TCGGA 1851 CGGCC GCGAG TGCCT GTGCG GCGCC CTGGC CAGCT ATGCC GCGGC CTGCG 1901 CGGGG AGAGG CGTGC GCGTC GCGTG GCGCG AGCCA GGCCG CTGTG AGCTG 1951 AACTG CCCGA AAGGC CAGGT GT ACC TGCAG TGCGG GACCC CCTGC AACCT 2001 GACCT GCCGC TCTCT CTCTT ACCCG GATGA GGAAT GCA AT GAGGC CTGCC 2051 TGGAG GGCTG CTTCT GCCCC CCAGG GCTCT ACATG GATGA GAGGG GGGAC 2101 TGCGT GCCCA AGGCC CAGTG CCCCT GTTAC TATGA CGGTG AGATC TTCCA 2151 GCCAG A AGAC ATCTT CTC AG ASSAT CAC AC C ATGT GCTAC TGTGA GGATG 2201 GCTTC ATGCA CTGTA CCATG AGTGG AGTCC CCGGA AGCTT GCTGC CTGAC 2251 GCTGT CCTCA GCAGT CCCCT GTCTC ATCGC AGCAA AAGGA GCCTA TCCTG 2301 TCGGC CCCCC ATGGT CAAGC TGGTG TGTCC CGCTG ACAAC CTGCG GGCTG 2 351 A AGGG CTCGA GTGT A CCA A A ACGTG CC AGA ASTAT GACCT GGAGT GC ATG 2401 AGCAT GGGCT GTGTC TCTGG CTGCC TCTGC CCCCC GGGCA TGGTC CGGCA 2451 TGAGA ACAGA TGTGT GGCCC TGGAA AGGTG TCCCT GCTTC CATCA GGGCA 2501 AGGAG TATGC CCCTG GAGAA ACAGT GAAGA TTGGC TGCAA CACTT GTGTC 2551 TGTCG GGACC GGAAG TGGAA CTGCA CAGAC CATGT GTGTG ATGCC ACGTG 2601 CTCCA CGATC GGCAT GGCCC ACT AC CTCAC CTTCG ACGGG CTCAA AT ACC 2651 TGTTC CCCGG GGAGT GCCAG TACGT TCTGG TGCAG GATTA CTGCG GCAGT 2701 AACCC TGGGA CCTTT CGGAT CCTAG TGGGG AATAA GGGAT GCAGC CACCC 2751 CTCAG TGAAA TGCAA GAAAC GGGTC ACCAT CCTGG TGG AG GGAGG AGAGA 2801 TTGAG CTGTT TGACG GGGAG GTGAA TGTGA AGAGG CCCAT GAAGG ATGAG 2851 ACTCA CTTTG AGGTG GTGGA GTCTG GCCGG TACAT CATTC TGCTG CTGGG 2901 CAAAG CCCTC TCCGT GGTCT GGGAC CGCCA CCTGA GCATC TCCGT GGTCC 2951 TGAAG CAGAC AT ACC AGGAG AAAGT GTGTG GCCTG TGTGG GAATT TTGAT 300 1 GGCAT CCAGA ACAAT GACCT SASSA GCAGC AACCT CCAAG TGGAG GAAGA 3051 CCCTG TGGAC TTTGG GAACT CCTGG AAAGT GAGCT CGCAG TGTGC TGACA

- 113 044115- 113 044115

3101 CC AGA A A AGT GCCTC TGGAC ТС АТС CCCTG CC ACC TGCC А ТА AC A AC АТС3101 CC AGA A A AGT GCCTC TGGAC TS ATS CCCTG CC ACC TGCC A TA AC A AC ATS

3151 ATGAA GCAGA CGATG GTGGA TTCCT CCTGT AGAAT CCTTA CCAGT GACGT3151 ATGAA GCAGA CGATG GTGGA TTCCT CCTGT AGAAT CCTTA CCAGT GACGT

3201 CTTCC AGGAC TGCAA CAAGC TGGTG GACCC CGAGC CAT AT CTGGA TGTCT 3251 GCATT TACGA CACCT GCTCC TGTGA GTCCA TTGGG GACTG CGCCG CATTC 3301 TGCGA САССА TTGCT GCCTA TGCCC ACGTG TGTGC CCAGC ATGGC AAGGT 3351 GGTGA CCTGG AGGAC GGCCA CATTG TGCCC CCAGA GCTGC GAGGA GAGGA 3401 ATCTC CGGGA GAACG GGTAT GAGGC TGAGT GGCGC TATAA CAGCT GTGCA 3451 CCTGC CTGTC AAGTC ACGTG TCAGC ACCCT GAGCC ACTGG CCTGC CCTGT 3501 GCAGT GTGTG GAGGG CTGCC ATGCC CACTG CCCTC CAGGG AAAAT CCTGG 3551 ATGAG CTTTT GCAGA CCTGC GTTGA CCCTG AAGAC TGTCC AGTGT GTGAG 3601 GTGGC TGGCC GGCGT TTTGC CTCAG GAAAG AAAGT CACCT TGAAT CCCAG 3651 TGACC CTGAG CACTG CCAGA TTTGC CACTG TGATG TTGTC AACCT CACCT 3701 GTGAA GCCTG CCAGG AGCCG ATATC TGGCG GTGGA GGTTC CGGTG GCGGG 3751 GGATC CGGCG GTGGA GGTTC CGGCG GTGGA GGTTC CGGTG GCGGG GGATC 3801 CGGTG GCGGG GGATC CCTGG TCCCC CGGGG CAGCG GCGGT GGAGG TTCCG 3851 GTGGC GGGGG ATCCG AC A A A ACTC A C AC AT GCCC A CCGTG CCCAG CTCC A 3901 GAACT CCTGG GCGGA CCGTC AGTCT TCCTC TTCCC CCCAA AACCC AAGGA 3951 CACCC TCATG ATCTC CCGGA CCCCT GAGGT CACAT GCGTG GTGGT GGACG 4001 TGAGC CACGA AGACC CTGAG GTCAA GTTCA ACTGG TACGT GGACG GCGTG 4051 GAGGT GCATA ATGCC AAGAC AAAGC CGCGG GAGGA GCAGT ACAAC AGCAC 4101 GT ACC GTGTG GTC AG CGTCC TC ACC GTCCT GC ACC AGGAC TGGCT GA ATG 4151 GCA AG GAGT A C A AGT GCA AG GTCTC C A AC A A AGCC CTCCC AGCCC CC АТС 4201 GAGA A A ACC A TCTCC AAAGC C A A AG GGC AG CCCCG AG A AC C AC AG GTGT A 4251 CACCC TGCCC CCATC CCGCG ATGAG CTGAC CAAGA ACC AG GTC AG CCTGA 4301 CCTGC CTGGT CAAAG GCTTC TATCC CAGCG ACATC GCCGT GGAGT GGGAG 4351 AGC A A TGGGC AGCCG GAGA A C A ACT AC A AG ACC AC GCCTC CCGTG TTGGA 4401 CTCCG ACGGC TCCTT CTTCC TCT AC AGC A A GCTCA CCGTG GAC A A GAGCA 4451 GGTGG CAGCA GGGGA ACGTC TTCTC ATGCT CCGTG ATGCA TGAGG CTCTG 4501 CACAA CCACT ACACG CAGAA GAGCC TCTCC CTGTC TCCGG GTAAA TGA Последовательность белка ФВ031 (SEQ ID NO: 86).3201 CTTCC AGGAC TGCAA CAAGC TGGTG GACCC CGAGC CAT AT CTGGA TGTCT 3251 GCATT TACGA CACCT GCTCC TGTGA GTCCA TTGGG GACTG CGCCG CATTC 3301 TGCGA SASSA TTGCT GCCTA TGCCC ACGTG TGTGC CCAGC ATGGC AAGGT 3351 GGTGA CCTGG A GGAC GGCCA CATTG TGCCC CCAGA GCTGC GAGGA GAGGA 3401 ATCTC CGGGA GAACG GGTAT GAGGC TGAGT GGCGC TATAA CAGCT GTGCA 3451 CCTGC CTGTC AAGTC ACGTG TCAGC ACCCT GAGCC ACTGG CCTGC CCTGT 3501 GCAGT GTGTG GAGGG CTGCC ATGCC CACTG CCCTC CAGGG AAAAT CCTGG 3551 ATGAG CTTTT GCAGA CCTGC GTTGA CCCTG AAGAC TGTCC AGTG T GTGAG 3601 GTGGC TGGCC GGCGT TTTGC CTCAG GAAAG AAAGT CACCT TGAAT CCCAG 3651 TGACC CTGAG CACTG CCAGA TTTGC CACTG TGATG TTGTC AACCT CACCT 3701 GTGAA GCCTG CCAGG AGCCG ATATC TGGCG GTGGA GGTTC CGGTG GCGGG 3751 GGATC CGGCG GTGGA GGTTC CGGCG GTGGA GGTTC CGGTG GCGGG GGATC 3801 CGGTG GCGGG GGATC CCTGG TCCCC CGGGG CAGCG GCGGT GGAGG TTCCG 3851 GTGGC GGGGG ATCCG AC A A A ACTC A C AC AT GCCC A CCGTG CCCAG CTCC A 3901 GAACT CCTGG GCGGA CCGTC AGTCT TCCTC TTCCC CCCAA AACCC AAGGA 3951 CACCC TCATG ATCTC CCGGA CCCCT GAGGT CACAT GCGTG GTGGT GGACG 4001 TGAGC CACGA AGACC CTGAG GTCAA GTTCA ACTGG TACGT G GACG GCGTG 4051 GAGGT GCATA ATGCC AAGAC AAAGC CGCGG GAGGA GCAGT ACAAC AGCAC 4101 GT ACC GTGTG GTC AG CGTCC TC ACC GTCCT GC ACC AGGAC TGGCT GA ATG 4151 GCA AG GAGT A C A AGT GCA AG GTCTC C A AC A A AGCC CTCCC AGCCC CC ATC 4201 GAGA A A ACC A TCTCC AAAGC C A A AG GGC AG CCCCG A.G. A AC C AC AG GTGT A 4251 CACCC TGCCC CCATC CCGCG ATGAG CTGAC CAAGA ACC AG GTC AG CCTGA 4301 CCTGC CTGGT CAAAG GCTTC TATCC CAGCG ACATC GCCGT GGAGT GGGAG 4351 AGC A A TGGGC AGCCG GAGA A C A ACT AC A AG ACC AC GCCTC CCGTG TTGGA 4401 CTCCG ACGGC TCCTT CTTCC TCT AC AGC A A GCTCA CCGTG GAC A A GAGCA 4451 GGTGG CAGCA GGGGA ACGTC TTCTC ATGCT CCGTG ATGCA TGAGG CTCTG 4501 CACAA CCACT ACACG CAGAA GAGCC TCTCC CTGTC TCCGG GTAAA TGA VWF031 protein sequence (SEQ ID NO: 86).

MIPARFAGVL LALALILPGT LCAEGTRGRS STARCSLFGS DFVNTFDGSMMIPARFAGVL LALALILPGT LCAEGTRGRS STARCSLFGS DFVNTFDGSM

YSFAGYCSYL LAGGCQKRSF SIIGDFQNGK RVSLSVYLGE FFDIHLFVNGYSFAGYCSYL LAGGCQKRSF SIIGDFQNGK RVSLSVYLGE FFDIHLFVNG

101 TVTQGDQRVS MPYASKGLYL ETEAGYYKLS GEAYGFVARI DGSGNFQVLL101 TVTQGDQRVS MPYASKGLYL ETEAGYYKLS GEAYGFVARI DGSGNFQVLL

151 SDRYFNKTCG LCGNFNIFAE DDFMTQEGTL TSDPYDFANS WALSSGEQWC151 SDRYFNKTCG LCGNFNIFAE DDFMTQEGTL TSDPYDFANS WALSSGEQWC

201 ERASPPSSSC NISSGEMQKG LWEQCQLLKS TSVFARCHPL VDPEPFVALC201 ERASPPSSSC NISSGEMQKG LWEQCQLLKS TSVFARCHPL VDPEPFVALC

251 EKTLCECAGG LECACPALLE YARTCAQEGM VLYGWTDHSA CSPVCPAGME251 EKTLCECAGG LECACPALLE YARTCAQEGM VLYGWTDHSA CSPVCPAGME

301 YRQCVSPCAR TCQSLHINEM CQERCVDGCS CPEGQLLDEG LCVESTECPC301 YRQCVSPCAR TCQSLHINEM CQERCVDGCS CPEGQLLDEG LCVESTECPC

- 114 044115- 114 044115

351 VHSGKRYPPG TSLSRDCNTC ICRNSQWICS NEECPGECLV TGQSHFKSFD351 VHSGKRYPPG TSLSRDCNTC ICRNSQWICS NEECPGECLV TGQSHFKSFD

401 NRYFTFSGIC QYLLARDCQD HSFSIVIETV QCADDRDAVC TRSVTVRLPG 451 LHNSLVKLKH GAGVAMDGQD IQLPLLKGDL RIQHTVTASV RLSYGEDLQM401 NRYFTFSGIC QYLLARDCQD HSFSIVIETV QCADDRDAVC TRSVTVRLPG 451 LHNSLVKLKH GAGVAMDGQD IQLPLLKGDL RIQHTVTASV RLSYGEDLQM

501 DWDGRGRLLV KLSPVYAGKT CGLCGNYNGN QGDDFLTPSG LAEPRVEDFG 551 NAWKLHGDCQ DLQKQHSDPC ALNPRMTRFS EEACAVLTSP TFEACHRAVS501 DWDGRGRLLV KLSPVYAGKT CGLCGNYNGN QGDDFLTPSG LAEPRVEDFG 551 NAWKLHGDCQ DLQKQHSDPC ALNPRMTRFS EEACAVLTSP TFEACHRAVS

601 PLPYLRNCRY DVCSCSDGRE CLCGALASYA AACAGRGVRV AWREPGRCEL601 PLPYLRNCRY DVCSCSDGRE CLCGALASYA AACAGRGVRV AWREPGRCEL

651 NCPKGQVYLQ CGTPCNLTCR SLSYPDEECN EACLEGCFCP PGLYMDERGD651 NCPKGQVYLQ CGTPCNLTCR SLSYPDEECN EACLEGCFCP PGLYMDERGD

701 CVPKAQCPCY YDGEIFQPED IFSDHHTMCY CEDGFMHCTM SGVPGSLLPD 751 AVLSSPLSHR SKRSLSCRPP MVKLVCPADN LRAEGLECTK TCQNYDLECM701 CVPKAQCPCY YDGEIFQPED IFSDHHTMCY CEDGFMHCTM SGVPGSLLPD 751 AVLSSPLSHR SKRSLSCRPP MVKLVCPADN LRAEGLECTK TCQNYDLECM

801 SMGCVSGCLC PPGMVRHENR CVALERCPCF HQGKEYAPGE TVKIGCNTCV801 SMGCVSGCLC PPGMVRHENR CVALERCPCF HQGKEYAPGE TVKIGCNTCV

851 CRDRKWNCTD HVCDATCSTIGMAHYLTFDG LKYLFPGECQ YVLVQDYCGS851 CRDRKWNCTD HVCDATCSTIGMAHYLTFDG LKYLFPGECQ YVLVQDYCGS

901 NPGTFRILVG NKGCSHPSVK CKKRVTILVE GGEIELFDGE VNVKRPMKDE901 NPGTFRILVG NKGCSHPSVK CKKRVTILVE GGEIELFDGE VNVKRPMKDE

951 THFEVVESGR YIILLLGKAL SVVWDRHLSI SVVLKQTYQE KVCGLCGNFD951 THFEVVESGR YIILLLGKAL SVVWDRHLSI SVVLKQTYQE KVCGLCGNFD

1001 GIQNNDLTSS NLQVEEDPVD FGNSWKVSSQ CADTRKVPLD SSPATCHNNI 1051 MKQTMVDSSC RILTSDVFQD CNKLVDPEPY LDVCIYDTCS CESIGDCAAF1001 GIQNNDLTSS NLQVEEDPVD FGNSWKVSSQ CADTRKVPLD SSPATCHNNI 1051 MKQTMVDSSC RILTSDVFQD CNKLVDPEPY LDVCIYDTCS CESIGDCAAF

1101 CDTIAAYAHV CAQHGKVVTW RTATLCPQSC EERNLRENGY EAEWRYNSCA1101 CDTIAAYAHV CAQHGKVVTW RTATLCPQSC EERNLRENGY EAEWRYNSCA

1151 PACQVTCQHP EPLACPVQCV EGCHAHCPPG KILDELLQTC VDPEDCPVCE1151 PACQVTCQHP EPLACPVQCV EGCHAHCPPG KILDELLQTC VDPEDCPVCE

1201 VAGRRFASGK KVTLNPSDPE HCQICHCDVV NLTCEACQEPISGGGGSGGG1201 VAGRRFASGK KVTLNPSDPE HCQICHCDVV NLTCEACQEPISGGGGSGGG

1251 GSGGGGSGGG GSGGGGSGGG GSLVPRGSGG GGSGGGGSDK THTCPPCPAP1251 GSGGGGSGGG GSGGGGSGGG GSLVPRGSGG GGSGGGGSDK THTCPPCPAP

1301 ELLGGPSVFL FPPKPKDTLM ISRTPEVTCV VVDVSHEDPE VKFNWYVDGV1301 ELLGGPSVFL FPPKPKDTLM ISRTPEVTCV VVDVSHEDPE VKFNWYVDGV

1351 EVHNAKTKPR EEQYNSTYRV VSVLTVLHQD WLNGKEYKCK VSNKALPAPI 1401 EKTISKAKGQ PREPQVYTLP PSRDELTKNQ VSLTCLVKGF YPSDIAVEWE1351 EVHNAKTKPR EEQYNSTYRV VSVLTVLHQD WLNGKEYKCK VSNKALPAPI 1401 EKTISKAKGQ PREPQVYTLP PSRDELTKNQ VSLTCLVKGF YPSDIAVEWE

1451 SNGQPENNYK TTPPVLDSDG SFFLYSKLTV DKSRWQQGNV FSCSVMHEAL1451 SNGQPENNYK TTPPVLDSDG SFFLYSKLTV DKSRWQQGNV FSCSVMHEAL

1501 HNHYTQKSLS LSPGK*1501 HNHYTQKSLSLSPGK*

Нуклеотидная последовательность ФВ034 (SEQ ID NO: 148).Nucleotide sequence of FB034 (SEQ ID NO: 148).

ATGAT TCCTG CCAGA TTTGC CGGGG TGCTG CTTGC TCTGG CCCTC ATTTTATGAT TCCTG CCAGA TTTGC CGGGG TGCTG CTTGC TCTGG CCCTC ATTTT

GCCAG GGACC CTTTG TGC AG AAGGA ACTCG CGGCA GGTC A TCC AC GGCCC 101 GATGC AGCCT TTTCG GAAGT GACTT CGTCA AC ACC TTTGA TGGGA GCATG 151 TACAG CTTTG CGGGA TACTG CAGTT ACCTC CTGGC AGGGG GCTGC CAGAA 201 ACGCT CCTTC TCGAT TATTG GGGAC TTCCA GAATG GCAAG AGAGT GAGCC 251 TCTCC GTGTA TCTTG GGGAA TTTTT TGACA TCCAT TTGTT TGTCA ATGGTGCCAG GGACC CTTTG TGC AG AAGGA ACTCG CGGCA GGTC A TCC AC GGCCC 101 GATGC AGCCT TTTCG GAAGT GACTT CGTCA AC ACC TTTGA TGGGA GCATG 151 TACAG CTTTG CGGGA TACTG CAGTT ACCTC CTGGC AGGGG GCTGC CAGAA 201 ACGCT CCTTC TCGAT TATTG GGGAC TTCCA GAATG GCAAG AGAGT GAGCC 251 TCTCC GTGTA TCTTG GGGAA TTTTT TGACA TCCAT TTGTT TGTCA ATGGT

301 ACCGT GACAC AGGGG GACCA AAGAG TCTCC ATGCC CTATG CCTCC AAAGG 351 GCTGT ATCTA GAAAC TGAGG CTGGG TACTA CAAGC TGTCC GGTGA GGCCT 401 ATGGC TTTGT GGCCA GGATC GATGG CAGCG GCAAC TTTCA AGTCC TGCTG 451 TCAGA CAGAT ACTTC AACAA GACCT GCGGG CTGTG TGGCA ACTTT AACAT 501 CTTTG CTGAA GATGA CTTTA TGACC CAAGA AGGGA CCTTG ACCTC GGACC 551 CTTAT GACTT TGCCA ACTCA TGGGC TCTGA GCAGT GGAGA ACAGT GGTGT301 ACCGT GACAC AGGGG GACCA AAGAG TCTCC ATGCC CTATG CCTCC AAAGG 351 GCTGT ATCTA GAAAC TGAGG CTGGG TACTA CAAGC TGTCC GGTGA GGCCT 401 ATGGC TTTGT GGCCA GGATC GATGG CAGCG GCAAC TTTCA AGTCC TGCTG 451 TCAGA CAGAT ACTTC AAC AA GACCT GCGGG CTGTG TGGCA ACTTT AACAT 501 CTTTG CTGAA GATGA CTTTA TGACC CAAGA AGGGA CCTTG ACCTC GGACC 551 CTTAT GACTT TGCCA ACTCA TGGGC TCTGA GCAGT GGAGA ACAGT GGTGT

- 115 044115- 115 044115

601 GA ACG GGC AT CTCCT CCC AG C AGCT C ATGC A AC AT CTCCT CTGGG GA A AT601 GA ACG GGC AT CTCCT CCC AG C AGCT C ATGC A AC AT CTCCT CTGGG GA A AT

651 GCAGA AGGGC CTGTG GGAGC AGTGC CAGCT TCTGA AGAGC ACCTC GGTGT651 GCAGA AGGGC CTGTG GGAGC AGTGC CAGCT TCTGA AGAGC ACCTC GGTGT

701 TTGCC CGCTG CCACC CTCTG GTGGA CCCCG AGCCT TTTGT GGCCC TGTGT701 TTGCC CGCTG CCACC CTCTG GTGGA CCCCG AGCCT TTTGT GGCCC TGTGT

751 GAGAA GACTT TGTGT GAGTG TGCTG GGGGG CTGGA GTGCG CCTGC CCTGC 801 CCTCC TGGAG TACGC CCGGA CCTGT GCCCA GGAGG GAATG GTGCT GTACG751 GAGAA GACTT TGTGT GAGTG TGCTG GGGGG CTGGA GTGCG CCTGC CCTGC 801 CCTCC TGGAG TACGC CCGGA CCTGT GCCCA GGAGG GAATG GTGCT GTACG

851 GCTGG ACCGA CCACA GCGCG TGCAG CCCAG TGTGC CCTGC TGGTA TGGAG851 GCTGG ACCGA CCACA GCGCG TGCAG CCCAG TGTGC CCTGC TGGTA TGGAG

901 TAT AG GC AGT GTGTG TCCCC TTGCG CC AGG ACCTG CC AGA GCCTG C AC AT901 TAT AG GC AGT GTGTG TCCCC TTGCG CC AGG ACCTG CC AGA GCCTG C AC AT

951 CAATG AAATG TGTCA GGAGC GATGC GTGGA TGGCT GCAGC TGCCC TGAGG951 CAATG AAATG TGTCA GGAGC GATGC GTGGA TGGCT GCAGC TGCCC TGAGG

1001 GACAG CTCCT GGATG AAGGC CTCTG CGTGG AGAGC ACCGA GTGTC CCTGC 1051 GTGCA TTCCG GAAAG CGCTA CCCTC CCGGC ACCTC CCTCT CTCGA GACTG 1101 C A AC A CCTGC ATTTG CCGA A AC AGC C AGTG GATCT GCAGC A ATGA AGA AT 1151 GTCCA GGGGA GTGCC TTGTC ACTGG TCAAT CCCAC TTCAA GAGCT TTGAC 1201 A AC AG AT ACT TC ACC TTC AG TGGGA TCTGC C AGT A CCTGC TGGCC CGGGA 1251 TTGCC AGGAC CACTC CTTCT CCATT GTCAT TGAGA CTGTC CAGTG TGCTG 1301 ATGAC CGCGA CGCTG TGTGC ACCCG CTCCG TCACC GTCCG GCTGC CTGGC 1351 CTGC A C A AC A GCCTT GTGA A ACTGA AGC AT GGGGC AGGAG TTGCC ATGGA 1401 TGGCC AGGAC ATCCA GCTCC CCCTC CTGAA AGGTG ACCTC CGCAT CCAGC 1451 АТАСА GTGAC GGCCT CCGTG CGCCT CAGCT ACGGG GAGGA CCTGC AGATG 1501 GACTG GGATG GCCGC GGGAG GCTGC TGGTG AAGCT GTCCC CCGTC TATGC 1551 CGGGA AGACC TGCGG CCTGT GTGGG A ATT A CAATG GCA AC C AGGG CGACG 1601 ACTTC CTTAC CCCCT CTGGG CTGGC GGAGC CCCGG GTGGA GGACT TCGGG 1651 AACGC CTGGA AGCTG CACGG GGACT GCCAG GACCT GCAGA AGCAG CACAG 1701 CGATC CCTGC GCCCT CAACC CGCGC ATGAC CAGGT TCTCC GAGGA GGCGT 1751 GCGCG GTCCT GACGT CCCCC ACATT CGAGG CCTGC CATCG TGCCG TCAGC 1801 CCGCT GCCCT ACCTG CGGAA CTGCC GCTAC GACGT GTGCT CCTGC TCGGA 1851 CGGCC GCGAG TGCCT GTGCG GCGCC CTGGC CAGCT ATGCC GCGGC CTGCG 1901 CGGGG AGAGG CGTGC GCGTC GCGTG GCGCG AGCCA GGCCG CTGTG AGCTG 1951 AACTG CCCGA AAGGC CAGGT GT ACC TGCAG TGCGG GACCC CCTGC AACCT 2001 GACCT GCCGC TCTCT CTCTT ACCCG GATGA GGAAT GCA AT GAGGC CTGCC 2051 TGGAG GGCTG CTTCT GCCCC CCAGG GCTCT ACATG GATGA GAGGG GGGAC 2101 TGCGT GCCCA AGGCC CAGTG CCCCT GTTAC TATGA CGGTG AGATC TTCCA 2151 GCCAG A AGAC ATCTT CTC AG АССАТ САС AC C ATGT GCTAC TGTGA GGATG 2201 GCTTC ATGCA CTGTA CCATG AGTGG AGTCC CCGGA AGCTT GCTGC CTGAC 2251 GCTGT CCTCA GCAGT CCCCT GTCTC ATCGC AGCAA AAGGA GCCTA TCCTG 2301 TCGGC CCCCC ATGGT CAAGC TGGTG TGTCC CGCTG ACAAC CTGCG GGCTG 2351 A AGGG CTCGA GTGT A CCA A A ACGTG CC AGA АСТАТ GACCT GGAGT GC ATG 2401 AGCAT GGGCT GTGTC TCTGG CTGCC TCTGC CCCCC GGGCA TGGTC CGGCA 2451 TGAGA ACAGA TGTGT GGCCC TGGAA AGGTG TCCCT GCTTC CATCA GGGCA1001 GACAG CTCCT GGATG AAGGC CTCTG CGTGG AGAGC ACCGA GTGTC CCTGC 1051 GTGCA TTCCG GAAAG CGCTA CCCTC CCGGC ACCTC CCTCT CTCGA GACTG 1101 C A AC A CCTGC ATTTG CCGA A AC AGC C AGTG GATCT GCAGC A ATGA AGA AT 1151 GTCCA GGGGA GTGCC TTG TC ACTGG TCAAT CCCAC TTCAA GAGCT TTGAC 1201 A AC AG AT ACT TC ACC TTC AG TGGGA TCTGC C AGT A CCTGC TGGCC CGGGA 1251 TTGCC AGGAC CACTC CTTCT CCATT GTCAT TGAGA CTGTC CAGTG TGCTG 1301 ATGAC CGCGA CGCTG TGTGC ACCCG CTCCG TCACC GTCCG GCTGC CTGGC 1351 CTGC A C A AC A GCCTT GTGA A ACTGA AGC AT GGGGC AGGAG TTGCC ATGGA 1401 TGGCC AGGAC ATCCA GCTCC CCCTC CTGAA AGGTG ACCTC CGCAT CCAGC 1451 ATASA GTGAC GGCCT CCGTG CGCCT CAGCT ACGGG GAGGA CCTGC AGATG 1501 GACTG GGATG GCCGC GGGAG GCTGC TGGTG AAGCT GTCCC CCGTC TATGC 15 51 CGGGA AGACC TGCGG CCTGT GTGGG A ATT A CAATG GCA AC C AGGG CGACG 1601 ACTTC CTTAC CCCCT CTGGG CTGGC GGAGC CCCGG GTGGA GGACT TCGGG 1651 AACGC CTGGA AGCTG CACGG GGACT GCCAG GACCT GCAGA AGCAG CACAG 1701 CGATC CCTGC GCCCT CAACC CGCGC ATGAC CAGGT TCTCC GAGGA GGCGT 1751 GCGCG GTCCT GACGT CCCCC ACATT CGAGG CCTGC CATCG TGCCG TCAGC 1801 CCGCT GCCCT ACCTG CGGAA CTGCC GCTAC GACGT GTGCT CCTGC TCGGA 1851 CGGCC GCGAG TGCCT GTGCG GCGCC CTGGC CAGCT ATGCC GCGGC CTGCG 1901 CGGGG AGAGG CGTGC GCGTC GCGTG GCGCG AGCCA GGCCG CTGTG AGCTG 1951 AACTG CCCGA AAGGC CAGGT GT ACC TGCAG TGC GG GACCC CCTGC AACCT 2001 GACCT GCCGC TCTCT CTCTT ACCCG GATGA GGAAT GCA AT GAGGC CTGCC 2051 TGGAG GGCTG CTTCT GCCCC CCAGG GCTCT ACATG GATGA GAGGG GGGAC 2101 TGCGT GCCCA AGGCC CAGTG CCCCT GTTAC TATGA CGGTG AGATC TTCCA 2151 GCCAG A AGAC ATCTT CTC AG ACCAT CAC AC C ATGT GCTAC TGTGA GGATG 2201 GCTTC ATGCA CTGTA CCATG AGTGG AGTCC CCGGA AGCTT GCTGC CTGAC 2251 GCTGT CCTCA GCAGT CCCCT GTCTC ATCGC AGCAA AAGGA GCCTA TCCTG 2301 TCGGC CCCCC ATGGT CAAGC TGGTG TGTCC CGCTG ACAAC CTGCG GGCTG 2351 A AGGG CTCGA GTGT A CCA A A ACGTG CC AGA ASTAT GACCT GGAGT GC ATG 2401 AGCAT GGGCT GTGTC TCTGG CTGCC TCTGC CCCCC GGGCA TGGTC CGGCA 2451 TGAGA ACAGA TGTGT GGCCC TGGAA AGGTG TCCCT GCTTC CATCA GGGCA

- 116 044115- 116 044115

2501 AGGAG TATGC CCCTG GAGAA ACAGT GAAGA TTGGC TGCAA CACTT GTGTC2501 AGGAG TATGC CCCTG GAGAA ACAGT GAAGA TTGGC TGCAA CACTT GTGTC

2551 TGTCG GGACC GGAAG TGGAA CTGCA CAGAC CATGT GTGTG ATGCC ACGTG2551 TGTCG GGACC GGAAG TGGAA CTGCA CAGAC CATGT GTGTG ATGCC ACGTG

2601 CTCCA CGATC GGCAT GGCCC ACT AC CTCAC CTTCG ACGGG CTCAA AT ACC2601 CTCCA CGATC GGCAT GGCCC ACT AC CTCAC CTTCG ACGGG CTCAA AT ACC

2651 TGTTC CCCGG GGAGT GCCAG TACGT TCTGG TGCAG GATTA CTGCG GCAGT 2701 AACCC TGGGA CCTTT CGGAT CCTAG TGGGG AATAA GGGAT GCAGC CACCC 2751 CTCAG TGAAA TGCAA GAAAC GGGTC ACCAT CCTGG TGGAG GGAGG AGAGA 2801 TTGAG CTGTT TGACG GGGAG GTGAA TGTGA AGAGG CCCAT GAAGG ATGAG 2851 ACTCA CTTTG AGGTG GTGGA GTCTG GCCGG TACAT CATTC TGCTG CTGGG 2901 CAAAG CCCTC TCCGT GGTCT GGGAC CGCCA CCTGA GCATC TCCGT GGTCC 2951 TGAAG CAGAC AT ACC AGGAG AAAGT GTGTG GCCTG TGTGG GAATT TTGAT 3001 GGCAT CCAGA ACAAT GACCT САССА GCAGC AACCT CCAAG TGGAG GAAGA 3051 CCCTG TGGAC TTTGG GAACT CCTGG AAAGT GAGCT CGCAG TGTGC TGACA 3101 CCAGA AAAGT GCCTC TGGAC ТС АТС CCCTG CC ACC TGCC А ТА AC A AC АТС 3151 ATGAA GCAGA CGATG GTGGA TTCCT CCTGT AGAAT CCTTA CCAGT GACGT 3201 CTTCC AGGAC TGCAA CAAGC TGGTG GACCC CGAGC CAT AT CTGGA TGTCT 3251 GCATT TACGA CACCT GCTCC TGTGA GTCCA TTGGG GACTG CGCCG CATTC 3301 TGCGA САССА TTGCT GCCTA TGCCC ACGTG TGTGC CCAGC ATGGC AAGGT2651 TGTTC CCCGG GGAGT GCCAG TACGT TCTGG TGCAG GATTA CTGCG GCAGT 2701 AACCC TGGGA CCTTT CGGAT CCTAG TGGGG AATAA GGGAT GCAGC CACCC 2751 CTCAG TGAAA TGCAA GAAAC GGGTC ACCAT CCTGG TGGAG GGAGG AGAGA 2801 TTGAG CTGTT TGACG GGGAG GTGAA TGTGA AGAGG CCCAT GAAGG ATGAG 2851 ACTCA CTTTG AGGTG GTGGA GTCTG GCCGG TACAT CATTC TGCTG CTGGG 2901 CAAAG CCCTC TCCGT GGTCT GGGAC CGCCA CCTGA GCATC TCCGT GGTCC 2951 TGAAG CAGAC AT ACC AGGAG AAAGT GTGTG GCCTG TGTGG GAATT TTGAT 3001 GGCAT CCAGA ACAAT GACCT SASSA GCAGC AACCT CCAAG TGGAG GAAGA 3051 CCCTG TGGAC TTTGG GAACT CCTGG AAAGT GAGCT CGCAG TGTGC TGACA 3101 CCAGA AAAGT GCCTC TGGAC TS PBX CCCTG CC ACC TGCC A TA AC A AC PBX 3151 ATGAA GCAGA CGATG GTGGA TTCCT CCTGT AGAAT CCTTA CCAGT GACGT 3201 CTTCC AGGAC TGCAA CAAGC TGGTG GACCC CGAGC CAT AT CTGGA TGTCT 3251 GCATT TACGA C ACCT GCTCC TGTGA GTCCA TTGGG GACTG CGCCG CATTC 3301 TGCGA SASSA TTGCT GCCTA TGCCC ACGTG TGTGC CCAGC ATGGC AAGGT

3351 GGTGA CCTGG AGGAC GGCCA CATTG TGCCC CCAGA GCTGC GAGGA GAGGA 3401 ATCTC CGGGA GAACG GGTAT GAGGC TGAGT GGCGC TATAA CAGCT GTGCA 3451 CCTGC CTGTC AAGTC ACGTG TCAGC ACCCT GAGCC ACTGG CCTGC CCTGT 3501 GCAGT GTGTG GAGGG CTGCC ATGCC CACTG CCCTC CAGGG AAAAT CCTGG 3551 ATGAG CTTTT GCAGA CCTGC GTTGA CCCTG AAGAC TGTCC AGTGT GTGAG 3601 GTGGC TGGCC GGCGT TTTGC CTCAG GAAAG AAAGT CACCT TGAAT CCCAG 3651 TGACC CTGAG CACTG CCAGA TTTGC CACTG TGATG TTGTC AACCT CACCT 3701 GTGAA GCCTG CCAGG AGCCG ATATC GGGTA CCTCA GAGTC TGCTA CCCCC3351 GGTGA CCTGG AGGAC GGCCA CATTG TGCCC CCAGA GCTGC GAGGA GAGGA 3401 ATCTC CGGGA GAACG GGTAT GAGGC TGAGT GGCGC TATAA CAGCT GTGCA 3451 CCTGC CTGTC AAGTC ACGTG TCAGC ACCCT GAGCC ACTGG CCTGC CCTGT 3501 GCAGT GTGTG GAGGG CTGCC ATGCC CACTG CCCTC CAGGG AAAAT CCTGG 3551 ATGAG CTTTT GCAGA CCTGC GTTGA CCCTG AAGAC TGTCC AGTGT GTGAG 3601 GTGGC TGGCC GGCGT TTTGC CTCAG GAAAG AAAGT CACCT TGAAT CCCAG 3651 TGACC CTGAG CACTG CCAGA TTTGC CACTG TGATG TTGTC AACCT CACCT 3701 GTGAA GCCTG CCAGG AGCCG ATATC GGGTA CCTCA GAGTC TGCTA C CCCC

3751 GAGTC AGGGC CAGGA TCAGA GCCAG CCACC TCCGG GTCTG AGACA CCCGG 3801 GACTT CCGAG AGTGC CACCC CTGAG TCCGG ACCCG GGTCC GAGCC CGCCA 3851 CTTCC GGCTC CGAAA CTCCC GGCAC AAGCG AGAGC GCTAC CCCAG AGTCA 3901 GGACC AGGAA CATCT AC AGA GCCCT CTGAA GGCTC CGCTC CAGGG TCCCC 3951 AGCCG GCAGT CCCAC TAGCA CCGAG GAGGG AACCT CTGAA AGCGC CACAC 4001 CCGAA TCAGG GCCAG GGTCT GAGCC TGCTA CCAGC GGCAG CGAGA САССА 4051 GGCAC CTCTG AGTCC GCC AC ACC AG AGTCC GGACC CGGAT CTCCC GCTGG3751 GAGTC AGGGC CAGGA TCAGA GCCAG CCACC TCCGG GTCTG AGACA CCCGG 3801 GACTT CCGAG AGTGC CACCC CTGAG TCCGG ACCCG GGTCC GAGCC CGCCA 3851 CTTCC GGCTC CGAAA CTCCC GGCAC AAGCG AGAGC GCTAC CCCAG AGTCA 3901 GGACC AGGAA CATCT AC AGA GCCCT CTGAA GGCTC CGCTC CAGGG TCCCC 3951 AGCCG GCAGT CCCAC TAGCA CCGAG GAGGG AACCT CTGAA AGCGC CACAC 4001 CCGAA TCAGG GCCAG GGTCT GAGCC TGCTA CCAGC GGCAG CGAGA SASSA 4051 GGCAC CTCTG AGTCC GCC AC ACC AG AGTCC GGACC CGGAT CTCCC GCTGG

4101 GAGCC CCACC TCC AC TGAGG AGGGA TCTCC TGCTG GCTCT CCA AC ATCT A 4151 CTGAG GAAGG T ACCT C A ACC GAGCC ATCCG AGGGA TCAGC TCCCG GC ACC 4201 TCAGA GTCGG C A ACC CCGGA GTCTG GACCC GGA AC TTCCG AAAGT GCC AC 4251 ACC AG AGTCC GGTCC CGGGA CTTCA GAATC AGCAA CACCC GAGTC CGGCC 4301 CTGGG TCTGA ACCCG CCACA AGTGG TAGTG AGACA CCAGG ATCAG AACCT 4351 GCTAC CTCAG GGTCA GAGAC ACCCG GATCT CCGGC AGGCT САССА ACCTC4101 GAGCC CCACC TCC AC TGAGG AGGGA TCTCC TGCTG GCTCT CCA AC ATCT A 4151 CTGAG GAAGG T ACCT C A ACC GAGCC ATCCG AGGGA TCAGC TCCCG GC ACC 4201 TCAGA GTCGG C A ACC CCGGA GTCTG GACCC GGA AC TTCCG AAAGT GCC AC 4251 ACC AG AGTCC GGTCC CGGGA CTTCA GAATC AGCAA CACCC GAGTC CGGCC 4301 CTGGG TCTGA ACCCG CCACA AGTGG TAGTG AGACA CCAGG ATCAG AACCT 4351 GCTAC CTCAG GGTCA GAGAC ACCCG GATCT CCGGC AGGCT SASSA ACCTC

- 117 044115- 117 044115

4401 C ACTG AGGAG GGC AC C AGC A C AGA A CCA AG CGAGG GCTCC GC ACC CGGA A4401 C ACTG AGGAG GGC AC C AGC A C AGA A CCA AG CGAGG GCTCC GC ACC CGGA A

4451 CAAGC ACTGA ACCCA GTGAG GGTTC AGCAC CCGGC TCTGA GCCGG CCACA4451 CAAGC ACTGA ACCCA GTGAG GGTTC AGCAC CCGGC TCTGA GCCGG CCACA

4501 AGTGG CAGTG AGACA CCCGG CACTT CAGAG AGTGC CACCC CCGAG AGTGG 4551 CCCAG GCACT AGTAC CGAGC CCTCT GAAGG CAGTG CGCCA GATTC TGGCG4501 AGTGG CAGTG AGACA CCCGG CACTT CAGAG AGTGC CACCC CCGAG AGTGG 4551 CCCAG GCACT AGTAC CGAGC CCTCT GAAGG CAGTG CGCCA GATTC TGGCG

4601 GTGGA GGTTC CGGTG GCGGG GGATC CGGTG GCGGG GGATC CGGTG GCGGG4601 GTGGA GGTTC CGGTG GCGGG GGATC CGGTG GCGGG GGATC CGGTG GCGGG

4651 GGATC CGGTG GCGGG GGATC CCTGG TCCCC CGGGG CAGCG GAGGC GACAA4651 GGATC CGGTG GCGGG GGATC CCTGG TCCCC CGGGG CAGCG GAGGC GACAA

4701 AACTC ACACA TGCCC ACCGT GCCCA GCTCC AGAAC TCCTG GGCGG ACCGT4701 AACTC ACACA TGCCC ACCGT GCCCA GCTCC AGAAC TCCTG GGCGG ACCGT

4751 CAGTC TTCCT CTTCC CCCCA AAACC CAAGG ACACC CTCAT GATCT CCCGG4751 CAGTC TTCCT CTTCC CCCCA AAACC CAAGG ACACC CTCAT GATCT CCCGG

4801 ACCCC TGAGG TCACA TGCGT GGTGG TGGAC GTGAG CCACG AAGAC CCTGA4801 ACCCC TGAGG TCACA TGCGT GGTGG TGGAC GTGAG CCACG AAGAC CCTGA

4851 GGTC A AGTTC AACTG GT ACG TGGAC GGCGT GGAGG TGC AT AATGC C AAGA4851 GGTC A AGTTC AACTG GT ACG TGGAC GGCGT GGAGG TGC AT AATGC C AAGA

4901 CAAAG CCGCG GGAGG AGCAG TACAA CAGCA CGTAC CGTGT GGTCA GCGTC4901 CAAAG CCGCG GGAGG AGCAG TACAA CAGCA CGTAC CGTGT GGTCA GCGTC

4951 CTCAC CGTCC TGC AC CAGGA CTGGC TGAAT GGCAA GGAGT ACAAG TGCAA4951 CTCAC CGTCC TGC AC CAGGA CTGGC TGAAT GGCAA GGAGT ACAAG TGCAA

5001 GGTCT CCAAC AAAGC CCTCC CAGCC CCCAT CGAGA AAACC ATCTC CAAAG5001 GGTCT CCAAC AAAGC CCTCC CAGCC CCCAT CGAGA AAACC ATCTC CAAAG

5051 CCAAA GGGCA GCCCC GAGAA CCACA GGTGT ACACC CTGCC CCCAT CCCGG5051 CCAAA GGGCA GCCCC GAGAA CCACA GGTGT ACACC CTGCC CCCAT CCCGG

5101 GATGA GCTGA CCA AG A ACC A GGTCA GCCTG ACCTG CCTGG TC A A A GGCTT5101 GATGA GCTGA CCA AG A ACC A GGTCA GCCTG ACCTG CCTGG TC A A A GGCTT

5151 СТ АТС CC AGC GAC AT CGCCG TGGAG TGGGA GAGCA ATGGG CAGCC GGAGA5151 ST ATS CC AGC GAC AT CGCCG TGGAG TGGGA GAGCA ATGGG CAGCC GGAGA

5201 ACAAC TACAA GACCA CGCCT CCCGT GTTGG ACTCC GACGG CTCCT TCTTC5201 ACAAC TACAA GACCA CGCCT CCCGT GTTGG ACTCC GACGG CTCCT TCTTC

5251 CTCTA CAGCA AGCTC ACCGT GGACA AGAGC AGGTG GCAGC AGGGG AACGT5251 CTCTA CAGCA AGCTC ACCGT GGACA AGAGC AGGTG GCAGC AGGGG AACGT

5301 CTTCT CATGC TCCGT GATGC ATGAG GCTCT GCACA ACCAC TACAC GCAGA 5351 AGAGC CTCTC CCTGT CTCCG GGTAA ATGA Последовательность белка ФВ034 (SEQ ID NO: 87).5301 CTTCT CATGC TCCGT GATGC ATGAG GCTCT GCACA ACCAC TACAC GCAGA 5351 AGAGC CTCTC CCTGT CTCCG GGTAA ATGA VWF034 protein sequence (SEQ ID NO: 87).

MIPARFAGVL LALALILPGT LCAEGTRGRS STARCSLFGS DFVNTFDGSMMIPARFAGVL LALALILPGT LCAEGTRGRS STARCSLFGS DFVNTFDGSM

YSFAGYCSYL LAGGCQKRSF SIIGDFQNGK RVSLSVYLGE FFDIHLFVNGYSFAGYCSYL LAGGCQKRSF SIIGDFQNGK RVSLSVYLGE FFDIHLFVNG

101 TVTQGDQRVS MPYASKGLYL ETEAGYYKLS GEAYGFVARI DGSGNFQVLL101 TVTQGDQRVS MPYASKGLYL ETEAGYYKLS GEAYGFVARI DGSGNFQVLL

151 SDRYFNKTCG LCGNFNIFAE DDFMTQEGTL TSDPYDFANS WALSSGEQWC 201 ERASPPSSSC NISSGEMQKG LWEQCQLLKS TSVFARCHPL VDPEPFVALC151 SDRYFNKTCG LCGNFNIFAE DDFMTQEGTL TSDPYDFANS WALSSGEQWC 201 ERASPPSSSC NISSGEMQKG LWEQCQLLKS TSVFARCHPL VDPEPFVALC

251 EKTLCECAGG LECACPALLE YARTCAQEGM VLYGWTDHSA CSPVCPAGME 301 YRQCVSPCAR TCQSLHINEM CQERCVDGCS CPEGQLLDEG LCVESTECPC 351 VHSGKRYPPG TSLSRDCNTC ICRNSQWICS NEECPGECLV TGQSHFKSFD 401 NRYFTFSGIC QYLLARDCQD HSFSIVIETV QCADDRDAVC TRSVTVRLPG251 EKTLCECAGG LECACPALLE YARTCAQEGM VLYGWTDHSA CSPVCPAGME 301 YRQCVSPCAR TCQSLHINEM CQERCVDGCS CPEGQLLDEG LCVESTECPC 351 VHSGKRYPPG TSLSRDCNTC ICRNSQWICS NEECPGECLV TGQSHFKSFD 401 NRYFTFSGIC QYLLARDCQ D HSFSIVIETV QCADDRDAVC TRSVTVRLPG

451 LHNSLVKLKH GAGVAMDGQD IQLPLLKGDL RIQHTVTASV RLSYGEDLQM 501 DWDGRGRLLV KLSPVYAGKT CGLCGNYNGN QGDDFLTPSG LAEPRVEDFG 551 NAWKLHGDCQ DLQKQHSDPC ALNPRMTRFS EEACAVLTSP TFEACHRAVS 601 PLPYLRNCRY DVCSCSDGRE CLCGALASYA AACAGRGVRV AWREPGRCEL 651 NCPKGQVYLQ CGTPCNLTCR SLSYPDEECN EACLEGCFCP PGLYMDERGD451 LHNSLVKLKH GAGVAMDGQD IQLPLLKGDL RIQHTVTASV RLSYGEDLQM 501 DWDGRGRLLV KLSPVYAGKT CGLCGNYNGN QGDDFLTPSG LAEPRVEDFG 551 NAWKLHGDCQ DLQKQHSDPC ALNPRMTRFS EEACAVLTSP TFEACHRAVS 601 PLPYLRNCRY DVCSCSDGRE CLCGALASYA AACAGRGVRV AWREPGRCEL 651 NCPKGQVYLQ CGTPCNLTCR SLSYPDEECN EACLEGCFCP PGLYMDERGD

- 118 044115- 118 044115

701 CVPKAQCPCY YDGEIFQPED IFSDHHTMCY CEDGFMHCTM SGVPGSLLPD701 CVPKAQCPCY YDGEIFQPED IFSDHHTMCY CEDGFMHCTM SGVPGSLLPD

751 AVLSSPLSHR SKRSLSCRPP MVKLVCPADN LRAEGLECTK TCQNYDLECM751 AVLSSPLSHR SKRSLSCRPP MVKLVCPADN LRAEGLECTK TCQNYDLECM

801 SMGCVSGCLC PPGMVRHENR CVALERCPCF HQGKEYAPGE TVKIGCNTCV 851 CRDRKWNCTD HVCDATCSTIGMAHYLTFDG LKYLFPGECQ YVLVQDYCGS 901 NPGTFRILVG NKGCSHPSVK CKKRVTILVE GGEIELFDGE VNVKRPMKDE801 SMGCVSGCLC PPGMVRHENR CVALERCPCF HQGKEYAPGE TVKIGCNTCV 851 CRDRKWNCTD HVCDATCSTIGMAHYLTFDG LKYLFPGECQ YVLVQDYCGS 901 NPGTFRILVG NKGCSHPSVK CKKRVTILVE GGEIELFDGE VNVKRPMKDE

951 THFEVVESGR YIILLLGKAL SVVWDRHLSI SVVLKQTYQE KVCGLCGNFD951 THFEVVESGR YIILLLGKAL SVVWDRHLSI SVVLKQTYQE KVCGLCGNFD

1001 GIQNNDLTSS NLQVEEDPVD FGNSWKVSSQ CADTRKVPLD SSPATCHNNI 1051 MKQTMVDSSC RILTSDVFQD CNKLVDPEPY LDVCIYDTCS CESIGDCAAF1001 GIQNNDLTSS NLQVEEDPVD FGNSWKVSSQ CADTRKVPLD SSPATCHNNI 1051 MKQTMVDSSC RILTSDVFQD CNKLVDPEPY LDVCIYDTCS CESIGDCAAF

1101 CDTIAAYAHV CAQHGKVVTW RTATLCPQSC EERNLRENGY EAEWRYNSCA1101 CDTIAAYAHV CAQHGKVVTW RTATLCPQSC EERNLRENGY EAEWRYNSCA

1151 PACQVTCQHP EPLACPVQCV EGCHAHCPPG KILDELLQTC VDPEDCPVCE 1201 VAGRRFASGK KVTLNPSDPE HCQICHCDVV NLTCEACQEPISGTSESATP 1251 ESGPGSEPAT SGSETPGTSE SATPESGPGS EPATSGSETP GTSESATPES1151 PACQVTCQHP EPLACPVQCV EGCHAHCPPG KILDELLQTC VDPEDCPVCE 1201 VAGRRFASGK KVTLNPSDPE HCQICHCDVV NLTCEACQEPISGTSESATP 1251 ESGPGSEPAT SGSETPGTSE SATPESGPGS EPATSGSETP GTSESATPES

1301 GPGTSTEPSE GSAPGSPAGS PTSTEEGTSE SATPESGPGS EPATSGSETP 1351 GTSESATPES GPGSPAGSPT STEEGSPAGS PTSTEEGTST EPSEGSAPGT 1401 SESATPESGP GTSESATPES GPGTSESATP ESGPGSEPAT SGSETPGSEP 1451 ATSGSETPGS PAGSPTSTEE GTSTEPSEGS APGTSTEPSE GSAPGSEPAT1301 GPGTSTEPSE GSAPGSPAGS PTSTEEGTSE SATPESGPGS EPATSGSETP 1351 GTSESATPES GPGSPAGSPT STEEGSPAGS PTSTEEGTST EPSEGSAPGT 1401 SESATPESGP GTSESATPES GPGTSESATP ESGPGSEPAT SGSETPGSEP 1451 ATSGSETPGS PAGSPTSTEE GTSTEPSEGS APGTS TEPSE GSAPGSEPAT

1501 SGSETPGTSE SATPESGPGT STEPSEGSAP DIGGGGGSGG GGSLVPRGSG 1551 GDKTHTCPPC PAPELLGGPS VFLFPPKPKD TLMISRTPEV TCVVVDVSHE1501 SGSETPGTSE SATPESGPGT STEPSEGSAP DIGGGGGSGG GGSLVPRGSG 1551 GDKTHTCPPC PAPELLGGPS VFLFPPKPKD TLMISRTPEV TCVVVDVSHE

1601 DPEVKFNWYV DGVEVHNAKT KPREEQYNST YRVVSVLTVL HQDWLNGKEY1601 DPEVKFNWYV DGVEVHNAKT KPREEQYNST YRVVSVLTVL HQDWLNGKEY

1651 KCKVSNKALP APIEKTISKA KGQPREPQVY TLPPSRDELT KNQVSLTCLV1651 KCKVSNKALP APIEKTISKA KGQPREPQVY TLPPSRDELT KNQVSLTCLV

1701 KGFYPSDIAV EWESNGQPEN NYKTTPPVLD SDGSFFLYS К LTVDKSRWQQ1701 KGFYPSDIAV EWESNGQPEN NYKTTPPVLD SDGSFFLYS TO LTVDKSRWQQ

1751 GNVFSCSVMH EALHNHYTQK SLSLSPGK*1751 GNVFSCSVMH EALHNHYTQK SLSLSPGK*

Нуклеотидная последовательность ФВ050 (тройной мутант IHH) (SEQ ID NO: 149).Nucleotide sequence of FB050 (IHH triple mutant) (SEQ ID NO: 149).

ATGAT TCCTG CCAGA TTTGC CGGGG TGCTG CTTGC TCTGG CCCTC ATTTTATGAT TCCTG CCAGA TTTGC CGGGG TGCTG CTTGC TCTGG CCCTC ATTTT

GCCAG GGACC CTTTG TGC AG AAGGA ACTCG CGGCA GGTC A TCC AC GGCCC 101 GATGC AGCCT TTTCG GAAGT GACTT CGTC A AC ACC TTTGA TGGGA GCATG 151 TACAG CTTTG CGGGA TACTG CAGTT ACCTC CTGGC AGGGG GCTGC CAGAA 201 ACGCT CCTTC TCGAT T ATTG GGGAC TTCC A GA ATG GCA AG AGAGT GAGCC 251 TCTCC GTGTA TCTTG GGGAA TTTTT TGACA TCCAT TTGTT TGTCA ATGGTGCCAG GGACC CTTTG TGC AG AAGGA ACTCG CGGCA GGTC A TCC AC GGCCC 101 GATGC AGCCT TTTCG GAAGT GACTT CGTC A AC ACC TTTGA TGGGA GCATG 151 TACAG CTTTG CGGGA TACTG CAGTT ACCTC CTGGC AGGGG GCTGC CAGAA 201 ACGCT CCTTC TCGAT T ATTG GGGAC TTCC A GA ATG GCA AG AGAGT GAGCC 251 TCTCC GTGTA TCTTG GGGAA TTTTT TGACA TCCAT TTGTT TGTCA ATGGT

301 ACCGT GACAC AGGGG GACCA AAGAG TCTCC ATGCC CTATG CCTCC AAAGG 351 GCTGT ATCTA GAAAC TGAGG CTGGG TACTA CAAGC TGTCC GGTGA GGCCT 401 ATGGC TTTGT GGCCA GGATC GATGG CAGCG GCA AC TTTCA AGTCC TGCTG 451 TCAGA CAGAT ACTTC AACAA GACCT GCGGG CTGTG TGGCA ACTTT AACAT 501 CTTTG CTGAA GATGA CTTTA TGACC CAAGA AGGGA CCTTG ACCTC GGACC 551 CTTAT GACTT TGCCA ACTCA TGGGC TCTGA GCAGT GGAGA ACAGT GGTGT 601 GA ACG GGCAT CTCCT CCC AG C AGCT C ATGC A AC AT CTCCT CTGGG GA A AT301 ACCGT GACAC AGGGG GACCA AAGAG TCTCC ATGCC CTATG CCTCC AAAGG 351 GCTGT ATCTA GAAAC TGAGG CTGGG TACTA CAAGC TGTCC GGTGA GGCCT 401 ATGGC TTTGT GGCCA GGATC GATGG CAGCG GCA AC TTTCA AGTCC TGCTG 451 TCAGA CAGAT ACTTC AAC AA GACCT GCGGG CTGTG TGGCA ACTTT AACAT 501 CTTTG CTGAA GATGA CTTTA TGACC CAAGA AGGGA CCTTG ACCTC GGACC 551 CTTAT GACTT TGCCA ACTCA TGGGC TCTGA GCAGT GGAGA ACAGT GGTGT 601 GA ACG GGCAT CTCCT CCC AG C AGCT C ATGC A AC AT CTCCT CTGGG GA A AT

- 119 044115- 119 044115

651 GCAGA AGGGC CTGTG GGAGC AGTGC CAGCT TCTGA AGAGC ACCTC GGTGT651 GCAGA AGGGC CTGTG GGAGC AGTGC CAGCT TCTGA AGAGC ACCTC GGTGT

701 TTGCC CGCTG CCACC CTCTG GTGGA CCCCG AGCCT TTTGT GGCCC TGTGT 751 GAGAA GACTT TGTGT GAGTG TGCTG GGGGG CTGGA GTGCG CCTGC CCTGC 801 CCTCC TGGAG TACGC CCGGA CCTGT GCCCA GGAGG GAATG GTGCT GTACG701 TTGCC CGCTG CCACC CTCTG GTGGA CCCCG AGCCT TTTGT GGCCC TGTGT 751 GAGAA GACTT TGTGT GAGTG TGCTG GGGGG CTGGA GTGCG CCTGC CCTGC 801 CCTCC TGGAG TACGC CCGGA CCTGT GCCCA GGAGG GAATG GTGCT GTACG

851 GCTGG ACCGA CCACA GCGCG TGCAG CCCAG TGTGC CCTGC TGGTA TGGAG851 GCTGG ACCGA CCACA GCGCG TGCAG CCCAG TGTGC CCTGC TGGTA TGGAG

901 TAT AG GC AGT GTGTG TCCCC TTGCG CC AGG ACCTG CC AGA GCCTG C AC AT901 TAT AG GC AGT GTGTG TCCCC TTGCG CC AGG ACCTG CC AGA GCCTG C AC AT

951 CAATG AAATG TGTCA GGAGC GATGC GTGGA TGGCT GCAGC TGCCC TGAGG951 CAATG AAATG TGTCA GGAGC GATGC GTGGA TGGCT GCAGC TGCCC TGAGG

1001 GACAG CTCCT GGATG AAGGC CTCTG CGTGG AGAGC ACCGA GTGTC CCTGC 1051 GTGCA TTCCG GAAAG CGCTA CCCTC CCGGC ACCTC CCTCT CTCGA GACTG 1101 C A AC A CCTGC ATTTG CCGA A AC AGC C AGTG GATCT GCAGC A ATGA AGA AT 1151 GTCCA GGGGA GTGCC TTGTC ACTGG TCAAT CCCAC TTCAA GAGCT TTGAC 1201 A AC AG AT ACT TC ACC TTC AG TGGGA TCTGC C AGT A CCTGC TGGCC CGGGA 1251 TTGCC AGGAC CACTC CTTCT CCATT GTCAT TGAGA CTGTC CAGTG TGCTG 1301 ATGAC CGCGA CGCTG TGTGC ACCCG CTCCG TCACC GTCCG GCTGC CTGGC 1351 CTGC A C A AC A GCCTT GTGA A ACTGA AGC AT GGGGC AGGAG TTGCC ATGGA 1401 TGGCC AGGAC ATCCA GCTCC CCCTC CTGAA AGGTG ACCTC CGCAT CCAGC 1451 АТАСА GTGAC GGCCT CCGTG CGCCT CAGCT ACGGG GAGGA CCTGC AGATG 1501 GACTG GGATG GCCGC GGGAG GCTGC TGGTG AAGCT GTCCC CCGTC TATGC 1551 CGGGA AGACC TGCGG CCTGT GTGGG A ATT A CAATG GCA AC C AGGG CGACG 1601 ACTTC CTTAC CCCCT CTGGG CTGGC GGAGC CCCGG GTGGA GGACT TCGGG 1651 AACGC CTGGA AGCTG CACGG GGACT GCCAG GACCT GCAGA AGCAG CACAG 1701 CGATC CCTGC GCCCT CAACC CGCGC ATGAC CAGGT TCTCC GAGGA GGCGT 1751 GCGCG GTCCT GACGT CCCCC ACATT CGAGG CCTGC CATCG TGCCG TCAGC 1801 CCGCT GCCCT ACCTG CGGAA CTGCC GCTAC GACGT GTGCT CCTGC TCGGA 1851 CGGCC GCGAG TGCCT GTGCG GCGCC CTGGC CAGCT ATGCC GCGGC CTGCG 1901 CGGGG AGAGG CGTGC GCGTC GCGTG GCGCG AGCCA GGCCG CTGTG AGCTG 1951 AACTG CCCGA AAGGC CAGGT GT ACC TGCAG TGCGG GACCC CCTGC AACCT 2001 GACCT GCCGC TCTCT CTCTT ACCCG GATGA GGAAT GCA AT GAGGC CTGCC 2051 TGGAG GGCTG CTTCT GCCCC CCAGG GCTCT ACATG GATGA GAGGG GGGAC 2101 TGCGT GCCCA AGGCC CAGTG CCCCT GTTAC TATGA CGGTG AGATC TTCCA 2151 GCCAG A AGAC ATCTT CTC AG АССАТ САС AC C ATGT GCTAC TGTGA GGATG 2201 GCTTC ATGCA CTGTA CCATG AGTGG AGTCC CCGGA AGCTT GCTGC CTGAC 2251 GCTGT CCTCA GCAGT CCCCT GTCTC ATCGC AGCAA AAGGA GCCTA TCCTG 2301 TCGGC CCCCC ATGGT CAAGC TGGTG TGTCC CGCTG ACAAC CTGCG GGCTG 2351 A AGGG CTCGA GTGT A CCA A A ACGTG CC AGA АСТАТ GACCT GGAGT GC ATG 2401 AGCAT GGGCT GTGTC TCTGG CTGCC TCTGC CCCCC GGGCA TGGTC CGGCA 2451 TGAGA ACAGA TGTGT GGCCC TGGAA AGGTG TCCCT GCTTC CATCA GGGCA 2501 AGGAG TATGC CCCTG GAGAA ACAGT GAAGA TTGGC TGCAA CACTT GTGTC1001 GACAG CTCCT GGATG AAGGC CTCTG CGTGG AGAGC ACCGA GTGTC CCTGC 1051 GTGCA TTCCG GAAAG CGCTA CCCTC CCGGC ACCTC CCTCT CTCGA GACTG 1101 C A AC A CCTGC ATTTG CCGA A AC AGC C AGTG GATCT GCAGC A ATGA AGA AT 1151 GTCCA GGGGA GTGCC TTG TC ACTGG TCAAT CCCAC TTCAA GAGCT TTGAC 1201 A AC AG AT ACT TC ACC TTC AG TGGGA TCTGC C AGT A CCTGC TGGCC CGGGA 1251 TTGCC AGGAC CACTC CTTCT CCATT GTCAT TGAGA CTGTC CAGTG TGCTG 1301 ATGAC CGCGA CGCTG TGTGC ACCCG CTCCG TCACC GTCCG GCTGC CTGGC 1351 CTGC A C A AC A GCCTT GTGA A ACTGA AGC AT GGGGC AGGAG TTGCC ATGGA 1401 TGGCC AGGAC ATCCA GCTCC CCCTC CTGAA AGGTG ACCTC CGCAT CCAGC 1451 ATASA GTGAC GGCCT CCGTG CGCCT CAGCT ACGGG GAGGA CCTGC AGATG 1501 GACTG GGATG GCCGC GGGAG GCTGC TGGTG AAGCT GTCCC CCGTC TATGC 15 51 CGGGA AGACC TGCGG CCTGT GTGGG A ATT A CAATG GCA AC C AGGG CGACG 1601 ACTTC CTTAC CCCCT CTGGG CTGGC GGAGC CCCGG GTGGA GGACT TCGGG 1651 AACGC CTGGA AGCTG CACGG GGACT GCCAG GACCT GCAGA AGCAG CACAG 1701 CGATC CCTGC GCCCT CAACC CGCGC ATGAC CAGGT TCTCC GAGGA GGCGT 1751 GCGCG GTCCT GACGT CCCCC ACATT CGAGG CCTGC CATCG TGCCG TCAGC 1801 CCGCT GCCCT ACCTG CGGAA CTGCC GCTAC GACGT GTGCT CCTGC TCGGA 1851 CGGCC GCGAG TGCCT GTGCG GCGCC CTGGC CAGCT ATGCC GCGGC CTGCG 1901 CGGGG AGAGG CGTGC GCGTC GCGTG GCGCG AGCCA GGCCG CTGTG AGCTG 1951 AACTG CCCGA AAGGC CAGGT GT ACC TGCAG TGC GG GACCC CCTGC AACCT 2001 GACCT GCCGC TCTCT CTCTT ACCCG GATGA GGAAT GCA AT GAGGC CTGCC 2051 TGGAG GGCTG CTTCT GCCCC CCAGG GCTCT ACATG GATGA GAGGG GGGAC 2101 TGCGT GCCCA AGGCC CAGTG CCCCT GTTAC TATGA CGGTG AGATC TTCCA 2151 GCCAG A AGAC ATCTT CTC AG ACCAT CAC AC C ATGT GCTAC TGTGA GGATG 2201 GCTTC ATGCA CTGTA CCATG AGTGG AGTCC CCGGA AGCTT GCTGC CTGAC 2251 GCTGT CCTCA GCAGT CCCCT GTCTC ATCGC AGCAA AAGGA GCCTA TCCTG 2301 TCGGC CCCCC ATGGT CAAGC TGGTG TGTCC CGCTG ACAAC CTGCG GGCTG 2351 A AGGG CTCGA GTGT A CCA A A ACGTG CC AGA ASTAT GACCT GGAGT GC ATG 2401 AGCAT GGGCT GTGTC TCTGG CTGCC TCTGC CCCCC GGGCA TGGTC CGGCA 2451 TGAGA ACAGA TGTGT GGCCC TGGAA AGGTG TCCCT GCTTC CATCA GGGCA 2501 AGGAG TATGC CCCTG GAGAA ACAGT GAAGA TTGGC TGCAA CACTT GTGTC

- 120 044115- 120 044115

2551 TGTCG GGACC GGAAG TGGAA CTGCA CAGAC CATGT GTGTG ATGCC ACGTG 2601 CTCCA CGATC GGC AT GGCCC ACT AC CTCAC CTTCG ACGGG CTCAA AT ACC 2651 TGTTC CCCGG GGAGT GCCAG TACGT TCTGG TGCAG GATTA CTGCG GCAGT 2701 AACCC TGGGA CCTTT CGGAT CCTAG TGGGG AATAA GGGAT GCAGC CACCC 2751 CTCAG TGAAA TGCAA GAAAC GGGTC АССАТ CCTGG TGGAG GGAGG AGAGA 2801 TTGAG CTGTT TGACG GGGAG GTGAA TGTGA AGAGG CCCAT GAAGG ATGAG 2851 ACTCA CTTTG AGGTG GTGGA GTCTG GCCGG TACAT CATTC TGCTG CTGGG 2901 CAAAG CCCTC TCCGT GGTCT GGGAC CGCCA CCTGA GCATC TCCGT GGTCC 2951 TGAAG CAGAC AT ACC AGGAG AAAGT GTGTG GCCTG TGTGG GAATT TTGAT 3001 GGCAT CCAGA ACAAT GACCT САССА GCAGC AACCT CCAAG TGGAG GAAGA 3051 CCCTG TGGAC TTTGG GAACT CCTGG AAAGT GAGCT CGCAG TGTGC TGACA 3101 CCAGA AAAGT GCCTC TGGAC ТС АТС CCCTG CC ACC TGCC А ТА AC A AC АТС 3151 ATGAA GCAGA CGATG GTGGA TTCCT CCTGT AGAAT CCTTA CCAGT GACGT 3201 CTTCC AGGAC TGCAA CAAGC TGGTG GACCC CGAGC CAT AT CTGGA TGTCT 3251 GCATT TACGA CACCT GCTCC TGTGA GTCCA TTGGG GACTG CGCCG CATTC 3301 TGCGA САССА TTGCT GCCTA TGCCC ACGTG TGTGC CCAGC ATGGC AAGGT 3351 GGTGA CCTGG AGGAC GGCCA CATTG TGCCC CCAGA GCTGC GAGGA GAGGA 3401 ATCTC CGGGA GAACG GGTAT GAGGC TGAGT GGCGC TATAA CAGCT GTGCA 3451 CCTGC CTGTC AAGTC ACGTG TCAGC ACCCT GAGCC ACTGG CCTGC CCTGT 3501 GCAGT GTGTG GAGGG CTGCC ATGCC CACTG CCCTC CAGGG AAAAT CCTGG 3551 ATGAG CTTTT GCAGA CCTGC GTTGA CCCTG AAGAC TGTCC AGTGT GTGAG 3601 GTGGC TGGCC GGCGT TTTGC CTCAG GAAAG AAAGT CACCT TGAAT CCCAG 3651 TGACC CTGAG CACTG CCAGA TTTGC CACTG TGATG TTGTC AACCT CACCT 3701 GTGAA GCCTG CCAGG AGCCG ATATC TGGCG GTGGA GGTTC CGGTG GCGGG 3751 GGATC CGGCG GTGGA GGTTC CGGCG GTGGA GGTTC CGGTG GCGGG GGATC 3801 CGGTG GCGGG GGATC CCTGG TCCCC CGGGG CAGCG GCGGT GGAGG TTCCG 3851 GTGGC GGGGG ATCCG AC A A A ACTCA C AC AT GCCC A CCGTG CCCAG CTCCA 3901 GAACT CCTGG GCGGA CCGTC AGTCT TCCTC TTCCC CCCAA AACCC AAGGA 3951 CACCC TCATG GCCTC CCGGA CCCCT GAGGT CACAT GCGTG GTGGT GGACG 4001 TGAGC CACGA AGACC CTGAG GTC A A GTTCA ACTGG TACGT GGACG GCGTG 4051 GAGGT GCATA ATGCC AAGAC AAAGC CGCGG GAGGA GCAGT ACAAC AGCAC 4101 GT ACC GTGTG GTC AG CGTCC TC ACC GTCCT GGCCC AGGAC TGGCT GA ATG 4151 GCA AG GAGT A C A AGT GCA AG GTCTC C A AC A A AGCC CTCCC AGCCC CC АТС 4201 GAGA A A ACC A TCTCC AAAGC CAAAG GGC AG CCCCG AG A AC C AC AG GTGT A 4251 CACCC TGCCC CCATC CCGCG ATGAG CTGAC CAAGA ACC AG GTC AG CCTGA 4301 CCTGC CTGGT CAAAG GCTTC TATCC CAGCG ACATC GCCGT GGAGT GGGAG2551 TGTCG GGACC GGAAG TGGAA CTGCA CAGAC CATGT GTGTG ATGCC ACGTG 2601 CTCCA CGATC GGC AT GGCCC ACT AC CTCAC CTTCG ACGGG CTCAA AT ACC 2651 TGTTC CCCGG GGAGT GCCAG TACGT TCTGG TGCAG GATTA CTGCG GCAGT 2701 AACCC TGGGA CCT TT CGGAT CCTAG TGGGG AATAA GGGAT GCAGC CACCC 2751 CTCAG TGAAA TGCAA GAAAC GGGTC ASSAT CCTGG TGGAG GGAGG AGAGA 2801 TTGAG CTGTT TGACG GGGAG GTGAA TGTGA AGAGG CCCAT GAAGG ATGAG 2851 ACTCA CTTTG AGGTG GTGGA GTCTG GCCGG TACAT CATTC TGCTG CTGGG 2901 CAAAG CCCTC TCCGT GGTCT GGGAC CGCCA CCTGA GCATC TCCGT GGTCC 2951 TGAAG CAGAC AT ACC AGGAG AAAGT GTGTG GCCTG TGTGG GAATT TTGAT 3001 GGCAT CCAGA ACAAT GACCT SASSA GCAGC AACCT CCAAG TGGAG GAAGA 3051 CCCTG TGGAC TTTGG GAACT CCTGG AAAGT GAGCT CGCAG TGTGC TGACA 3101 CCAGA AAAGT GCCTC TGGAC TS ATS CCCTG CC ACC TGCC A TA AC A AC ATS 3 151 ATGAA GCAGA CGATG GTGGA TTCCT CCTGT AGAAT CCTTA CCAGT GACGT 3201 CTTCC AGGAC TGCAA CAAGC TGGTG GACCC CGAGC CAT AT CTGGA TGTCT 3251 GCATT TACGA CACCT GCTCC TGTGA GTCCA TTGGG GACTG CGCCG CATTC 3301 TGCGA SASSA TTGCT GCCTA TGCCC ACGTG TGTGC CCAGC ATGGC AAGGT 33 51 GGTGA CCTGG AGGAC GGCCA CATTG TGCCC CCAGA GCTGC GAGGA GAGGA 3401 ATCTC CGGGA GAACG GGTAT GAGGC TGAGT GGCGC TATAA CAGCT GTGCA 3451 CCTGC CTGTC AAGTC ACGTG TCAGC ACCCT GAGCC ACTGG CCTGC CCTGT 3501 GCAGT GTGTG GAGGG CTGCC ATGCC CACTG CCCTC CAGGG AAAAT CCTGG 3551 ATGAG CTTTT GCAGA CCTGC GTTGA CCCTG AAGAC TGTCC AGTGT GTGAG 3601 GTGGC TGGCC GGCGT TTTGC CTCAG GAAAG AAAGT CACCT TGAAT CCCAG 3651 TGACC CTGAG CACTG CCAGA TTTGC CACTG TGATG TTGTC AACCT CACCT 3701 GTGAA GCCTG CCAGG AGCCG ATATC TGGCG GTGGA GGTTC CGGTG GCGGG 3751 GGATC CGGCG GTGGA GGTTC CGGCG GTGGA GGTTC CGGTG GCGGG GGATC 3801 CGGTG GCGGG GGATC CCTGG TCCCC CGGGG CAGCG GCGGT GGAGG TTCCG 3851 GTGGC GGGGG ATCCG AC A A A ACTCA C AC AT GCCC A CCGTG CCCAG CTCCA 3901 GAACT CCTGG GCGGA CCGTC AGTCT TCCTC TTCCC CCCAA AACCC AAGGA 3951 CACCC TCATG GCCTC CCGGA CCCCT GAGGT CACAT GCGTG GTGGT GGACG 4001 TGAGC CACGA AGACC CTGAG GTC A A GTTCA ACTGG TACGT GGACG GCGTG 4051 GAGGT GCATA ATGCC AAGAC AAAGC CGCGG GAGGA GCAGT ACAAC AGCAC 4101 GT ACC GTGTG GTC AG CGTCC TC ACC GTCCT GGCCC AGGAC TGGCT GA ATG 4151 GCA AG GAGT A C A AGT GCA AG GTCTC C A AC A A AGCC CTCCC AGCCC CC ATC 4201 GAGA A A ACC A TCTCC AAAGC CAAAG GGC AG CCCCG AG A AC C AC AG GTGT A 4251 CACCC TGCCC CCATC CCGCG ATGAG CTGAC CAAGA ACC AG GTC AG CCTGA 4301 CCTGC CTGGT CAAAG GCTTC TATCC CAGCG ACATC GCCGT GGAGT GGGAG

4351 AGC A A TGGGC AGCCG GAGA A C A ACT AC A AG ACC AC GCCTC CCGTG TTGGA4351 AGC A A TGGGC AGCCG GAGA A C A ACT AC A AG ACC AC GCCTC CCGTG TTGGA

4401 CTCCG ACGGC TCCTT CTTCC TCT AC AGC A A GCTCA CCGTG GAC A A GAGCA 4451 GGTGG CAGCA GGGGA ACGTC TTCTC ATGCT CCGTG ATGCA TGAGG CTCTG4401 CTCCG ACGGC TCCTT CTTCC TCT AC AGC A A GCTCA CCGTG GAC A A GAGCA 4451 GGTGG CAGCA GGGGA ACGTC TTCTC ATGCT CCGTG ATGCA TGAGG CTCTG

4501 CACAA CGCCT ACACG CAGAA GAGCC TCTCC CTGTC TCCGG GTAAA TGA4501 CACAA CGCCT ACACG CAGAA GAGCC TCTCC CTGTC TCCGG GTAAA TGA

- 121 044115- 121 044115

Последовательность белка ФВ050 (тройной мутант IHH) (SEQ ID NO: 150).Protein sequence of FB050 (IHH triple mutant) (SEQ ID NO: 150).

MIPARFAGVL LALALILPGT LCAEGTRGRS STARCSLFGS DFVNTFDGSMMIPARFAGVL LALALILPGT LCAEGTRGRS STARCSLFGS DFVNTFDGSM

YSFAGYCSYL LAGGCQKRSF SIIGDFQNGK RVSLSVYLGE FFDIHLFVNGYSFAGYCSYL LAGGCQKRSF SIIGDFQNGK RVSLSVYLGE FFDIHLFVNG

101 TVTQGDQRVS MPYASKGLYL ETEAGYYKLS GEAYGFVARI DGSGNFQVLL101 TVTQGDQRVS MPYASKGLYL ETEAGYYKLS GEAYGFVARI DGSGNFQVLL

151 SDRYFNKTCG LCGNFNIFAE DDFMTQEGTL TSDPYDFANS WALSSGEQWC151 SDRYFNKTCG LCGNFNIFAE DDFMTQEGTL TSDPYDFANS WALSSGEQWC

201 ERASPPSSSC NISSGEMQKG LWEQCQLLKS TSVFARCHPL VDPEPFVALC201 ERASPPSSSC NISSGEMQKG LWEQCQLLKS TSVFARCHPL VDPEPFVALC

251 EKTLCECAGG LECACPALLE YARTCAQEGM VLYGWTDHSA CSPVCPAGME251 EKTLCECAGG LECACPALLE YARTCAQEGM VLYGWTDHSA CSPVCPAGME

301 YRQCVSPCAR TCQSLHINEM CQERCVDGCS CPEGQLLDEG LCVESTECPC301 YRQCVSPCAR TCQSLHINEM CQERCVDGCS CPEGQLLDEG LCVESTECPC

351 VHSGKRYPPG TSLSRDCNTC ICRNSQWICS NEECPGECLV TGQSHFKSFD 401 NRYFTFSGIC QYLLARDCQD HSFSIVIETV QCADDRDAVC TRSVTVRLPG 451 LHNSLVKLKH GAGVAMDGQD IQLPLLKGDL RIQHTVTASV RLSYGEDLQM 501 DWDGRGRLLV KLSPVYAGKT CGLCGNYNGN QGDDFLTPSG LAEPRVEDFG 551 NAWKLHGDCQ DLQKQHSDPC ALNPRMTRFS EEACAVLTSP TFEACHRAVS 601 PLPYLRNCRY DVCSCSDGRE CLCGALASYA AACAGRGVRV AWREPGRCEL351 VHSGKRYPPG TSLSRDCNTC ICRNSQWICS NEECPGECLV TGQSHFKSFD 401 NRYFTFSGIC QYLLARDCQD HSFSIVIETV QCADDRDAVC TRSVTVRLPG 451 LHNSLVKLKH GAGVAMDGQD IQLPLLKGDL RIQHTVTASV RLSYGEDLQM 501 DWDGRGRLLV KLSPVY AGKT CGLCGNYNGN QGDDFLTPSG LAEPRVEDFG 551 NAWKLHGDCQ DLQKQHSDPC ALNPRMTRFS EEACAVLTSP TFEACHRAVS 601 PLPYLRNCRY DVCSCSDGRE CLCGALASYA AACAGRGVRV AWREPGRCEL

651 NCPKGQVYLQ CGTPCNLTCR SLSYPDEECN EACLEGCFCP PGLYMDERGD 701 CVPKAQCPCY YDGEIFQPED IFSDHHTMCY CEDGFMHCTM SGVPGSLLPD 751 AVLSSPLSHR SKRSLSCRPP MVKLVCPADN LRAEGLECTK TCQNYDLECM651 NCPKGQVYLQ CGTPCNLTCR SLSYPDEECN EACLEGCFCP PGLYMDERGD 701 CVPKAQCPCY YDGEIFQPED IFSDHHTMCY CEDGFMHCTM SGVPGSLLPD 751 AVLSSPLSHR SKRSLSCRPP MVKLVCPADN LRAEGLECTK TCQNYDLECM

801 SMGCVSGCLC PPGMVRHENR CVALERCPCF HQGKEYAPGE TVKIGCNTCV801 SMGCVSGCLC PPGMVRHENR CVALERCPCF HQGKEYAPGE TVKIGCNTCV

851 CRDRKWNCTD HVCDATCSTI GMAHYLTFDG LKYLFPGECQ YVLVQDYCGS851 CRDRKWNCTD HVCDATCSTI GMAHYLTFDG LKYLFPGECQ YVLVQDYCGS

901 NPGTFRILVG NKGCSHPSVK CKKRVTILVE GGEIELFDGE VNVKRPMKDE 951 THFEVVESGR YIILLLGKAL SVVWDRHLSI SVVLKQTYQE KVCGLCGNFD901 NPGTFRILVG NKGCSHPSVK CKKRVTILVE GGEIELFDGE VNVKRPMKDE 951 THFEVVESGR YIILLLGKAL SVVWDRHLSI SVVLKQTYQE KVCGLCGNFD

1001 GIQNNDLTSS NLQVEEDPVD FGNSWKVSSQ CADTRKVPLD SSPATCHNNI 1051 MKQTMVDSSC RILTSDVFQD CNKLVDPEPY LDVCIYDTCS CESIGDCAAF1001 GIQNNDLTSS NLQVEEDPVD FGNSWKVSSQ CADTRKVPLD SSPATCHNNI 1051 MKQTMVDSSC RILTSDVFQD CNKLVDPEPY LDVCIYDTCS CESIGDCAAF

1101 CDTIAAYAHV CAQHGKVVTW RTATLCPQSC EERNLRENGY EAEWRYNSCA1101 CDTIAAYAHV CAQHGKVVTW RTATLCPQSC EERNLRENGY EAEWRYNSCA

1151 PACQVTCQHP EPLACPVQCV EGCHAHCPPG KILDELLQTC VDPEDCPVCE 1201 VAGRRFASGK KVTLNPSDPE HCQICHCDVV NLTCEACQEPISGGGGSGGG1151 PACQVTCQHP EPLACPVQCV EGCHAHCPPG KILDELLQTC VDPEDCPVCE 1201 VAGRRFASGK KVTLNPSDPE HCQICHCDVV NLTCEACQEPISGGGGSGGG

1251 GSGGGGSGGG GSGGGGSGGG GSLVPRGSGG GGSGGGGSDK THTCPPCPAP 1301 ELLGGPSVFL FPPKPKDTLM ASRTPEVTCV VVDVSHEDPE VKFNWYVDGV 1351 EVHNAKTKPR EEQYNSTYRV VSVLTVLAQD WLNGKEYKCK VSNKALPAPI1251 GSGGGGSGGG GSGGGGSGGG GSLVPRGSGG GGSGGGGSDK THTCPPCPAP 1301 ELLGGPSVFL FPPKPKDTLM ASRTPEVTCV VVDVSHEDPE VKFNWYVDGV 1351 EVHNAKTKPR EEQYNSTYRV VSVLTVLAQD WLNGKEYKCK VSNKALPAPI

1401 EKTISKAKGQ PREPQVYTLP PSRDELTKNQ VSLTCLVKGF YPSDIAVEWE1401 EKTISKAKGQ PREPQVYTLP PSRDELTKNQ VSLTCLVKGF YPSDIAVEWE

1451 SNGQPENNYK TTPPVLDSDG SFFLYSKLTV DKSRWQQGNV FSCSVMHEAL1451 SNGQPENNYK TTPPVLDSDG SFFLYSKLTV DKSRWQQGNV FSCSVMHEAL

1501 HNAYTQKSLS LSPGK*1501 HNAYTQKSLSLSPGK*

- 122 044115- 122 044115

Нуклеотидная последовательность ФВ057 (SEQ ID NO: 151).Nucleotide sequence of FB057 (SEQ ID NO: 151).

ATGAT TCCTG CCAGA TTTGC CGGGG TGCTG CTTGC TCTGG CCCTC ATTTTATGAT TCCTG CCAGA TTTGC CGGGG TGCTG CTTGC TCTGG CCCTC ATTTT

GCCAG GGACC CTTTG TGC AG AAGGA ACTCG CGGCA GGTC A TCC AC GGCCCGCCAG GGACC CTTTG TGC AG AAGGA ACTCG CGGCA GGTC A TCC AC GGCCC

101 GATGC AGCCT TTTCG GA AGT GACTT CGTC A AC ACC TTTGA TGGG A GC ATG101 GATGC AGCCT TTTCG GA AGT GACTT CGTC A AC ACC TTTGA TGGG A GC ATG

151 TACAG CTTTG CGGGA TACTG CAGTT ACCTC CTGGC AGGGG GCTGC CAGAA151 TACAG CTTTG CGGGA TACTG CAGTT ACCTC CTGGC AGGGG GCTGC CAGAA

201 ACGCT CCTTC TCGAT T ATTG GGGAC TTCC A GA ATG GCA AG AGAGT GAGCC201 ACGCT CCTTC TCGAT T ATTG GGGAC TTCC A GA ATG GCA AG AGAGT GAGCC

251 TCTCC GTGTA TCTTG GGGAA TTTTT TGACA TCCAT TTGTT TGTCA ATGGT251 TCTCC GTGTA TCTTG GGGAA TTTTT TGACA TCCAT TTGTT TGTCA ATGGT

301 ACCGT GACAC AGGGG GACCA AAGAG TCTCC ATGCC CTATG CCTCC AAAGG301 ACCGT GACAC AGGGG GACCA AAGAG TCTCC ATGCC CTATG CCTCC AAAGG

351 GCTGT ATCTA GAAAC TGAGG CTGGG TACTA CAAGC TGTCC GGTGA GGCCT351 GCTGT ATCTA GAAAC TGAGG CTGGG TACTA CAAGC TGTCC GGTGA GGCCT

401 ATGGC TTTGT GGCCA GGATC GATGG CAGCG GCA AC TTTCA AGTCC TGCTG401 ATGGC TTTGT GGCCA GGATC GATGG CAGCG GCA AC TTTCA AGTCC TGCTG

451 TCAGA CAGAT ACTTC AACAA GACCT GCGGG CTGTG TGGCA ACTTT AACAT451 TCAGA CAGAT ACTTC AACAA GACCT GCGGG CTGTG TGGCA ACTTT AACAT

501 CTTTG CTGAA GATGA CTTTA TGACC CAAGA AGGGA CCTTG ACCTC GGACC 551 CTTAT GACTT TGCCA ACTCA TGGGC TCTGA GCAGT GGAGA ACAGT GGTGT501 CTTTG CTGAA GATGA CTTTA TGACC CAAGA AGGGA CCTTG ACCTC GGACC 551 CTTAT GACTT TGCCA ACTCA TGGGC TCTGA GCAGT GGAGA ACAGT GGTGT

601 GAACG GGCAT CTCCT CCCAG CAGCT CATGC A AC AT CTCCT CTGGG GA A AT601 GAACG GGCAT CTCCT CCCAG CAGCT CATGC A AC AT CTCCT CTGGG GA A AT

651 GCAGA AGGGC CTGTG GGAGC AGTGC CAGCT TCTGA AGAGC ACCTC GGTGT651 GCAGA AGGGC CTGTG GGAGC AGTGC CAGCT TCTGA AGAGC ACCTC GGTGT

701 TTGCC CGCTG CCACC CTCTG GTGGA CCCCG AGCCT TTTGT GGCCC TGTGT701 TTGCC CGCTG CCACC CTCTG GTGGA CCCCG AGCCT TTTGT GGCCC TGTGT

751 GAGAA GACTT TGTGT GAGTG TGCTG GGGGG CTGGA GTGCG CCTGC CCTGC751 GAGAA GACTT TGTGT GAGTG TGCTG GGGGG CTGGA GTGCG CCTGC CCTGC

801 CCTCC TGGAG TACGC CCGGA CCTGT GCCCA GGAGG GAATG GTGCT GTACG801 CCTCC TGGAG TACGC CCGGA CCTGT GCCCA GGAGG GAATG GTGCT GTACG

851 GCTGG ACCGA CCACA GCGCG TGCAG CCCAG TGTGC CCTGC TGGTA TGGAG851 GCTGG ACCGA CCACA GCGCG TGCAG CCCAG TGTGC CCTGC TGGTA TGGAG

901 TAT AG GCAGT GTGTG TCCCC TTGCG CC AGG ACCTG CCAGA GCCTG C AC AT901 TAT AG GCAGT GTGTG TCCCC TTGCG CC AGG ACCTG CCAGA GCCTG C AC AT

951 CAATG AAATG TGTCA GGAGC GATGC GTGGA TGGCT GCAGC TGCCC TGAGG951 CAATG AAATG TGTCA GGAGC GATGC GTGGA TGGCT GCAGC TGCCC TGAGG

1001 GACAG CTCCT GGATG AAGGC CTCTG CGTGG AGAGC ACCGA GTGTC CCTGC1001 GACAG CTCCT GGATG AAGGC CTCTG CGTGG AGAGC ACCGA GTGTC CCTGC

1051 GTGCA TTCCG GAAAG CGCTA CCCTC CCGGC ACCTC CCTCT CTCGA GACTG1051 GTGCA TTCCG GAAAG CGCTA CCCTC CCGGC ACCTC CCTCT CTCGA GACTG

1101 C A AC A CCTGC ATTTG CCGA A AC AGC C AGTG GATCT GCAGC A ATGA AGA AT1101 C A AC A CCTGC ATTTG CCGA A AC AGC C AGTG GATCT GCAGC A ATGA AGA AT

1151 GTCCA GGGGA GTGCC TTGTC ACTGG TCAAT CCCAC TTCAA GAGCT TTGAC1151 GTCCA GGGGA GTGCC TTGTC ACTGG TCAAT CCCAC TTCAA GAGCT TTGAC

1201 A AC AG AT ACT TC ACC TTC AG TGGGA TCTGC C AGT A CCTGC TGGCC CGGGA1201 A AC AG AT ACT TC ACC TTC AG TGGGA TCTGC C AGT A CCTGC TGGCC CGGGA

1251 TTGCC AGGAC CACTC CTTCT CCATT GTCAT TGAGA CTGTC CAGTG TGCTG1251 TTGCC AGGAC CACTC CTTCT CCATT GTCAT TGAGA CTGTC CAGTG TGCTG

1301 ATGAC CGCGA CGCTG TGTGC ACCCG CTCCG TCACC GTCCG GCTGC CTGGC1301 ATGAC CGCGA CGCTG TGTGC ACCCG CTCCG TCACC GTCCG GCTGC CTGGC

1351 CTGC A C A AC A GCCTT GTGA A ACTGA AGC AT GGGGC AGGAG TTGCC ATGGA1351 CTGC A C A AC A GCCTT GTGA A ACTGA AGC AT GGGGC AGGAG TTGCC ATGGA

1401 TGGCC AGGAC ATCCA GCTCC CCCTC CTGAA AGGTG ACCTC CGCAT CCAGC1401 TGGCC AGGAC ATCCA GCTCC CCCTC CTGAA AGGTG ACCTC CGCAT CCAGC

1451 АТАСА GTGAC GGCCT CCGTG CGCCT CAGCT ACGGG GAGGA CCTGC AGATG1451 ATASA GTGAC GGCCT CCGTG CGCCT CAGCT ACGGG GAGGA CCTGC AGATG

1501 GACTG GGATG GCCGC GGGAG GCTGC TGGTG AAGCT GTCCC CCGTC TATGC1501 GACTG GGATG GCCGC GGGAG GCTGC TGGTG AAGCT GTCCC CCGTC TATGC

1551 CGGGA AGACC TGCGG CCTGT GTGGG A ATT A CAATG GCA AC C AGGG CGACG1551 CGGGA AGACC TGCGG CCTGT GTGGG A ATT A CAATG GCA AC C AGGG CGACG

1601 ACTTC CTTAC CCCCT CTGGG CTGGC GGAGC CCCGG GTGGA GGACT TCGGG 1651 AACGC CTGGA AGCTG CACGG GGACT GCCAG GACCT GCAGA AGCAG CACAG1601 ACTTC CTTAC CCCCT CTGGG CTGGC GGAGC CCCGG GTGGA GGACT TCGGG 1651 AACGC CTGGA AGCTG CACGG GGACT GCCAG GACCT GCAGA AGCAG CACAG

1701 CGATC CCTGC GCCCT CAACC CGCGC ATGAC CAGGT TCTCC GAGGA GGCGT 1751 GCGCG GTCCT GACGT CCCCC ACATT CGAGG CCTGC CATCG TGCCG TCAGC1701 CGATC CCTGC GCCCT CAACC CGCGC ATGAC CAGGT TCTCC GAGGA GGCGT 1751 GCGCG GTCCT GACGT CCCCC ACATT CGAGG CCTGC CATCG TGCCG TCAGC

1801 CCGCT GCCCT ACCTG CGGAA CTGCC GCTAC GACGT GTGCT CCTGC TCGGA1801 CCGCT GCCCT ACCTG CGGAA CTGCC GCTAC GACGT GTGCT CCTGC TCGGA

- 123 044115- 123 044115

1851 CGGCC GCGAG TGCCT GTGCG GCGCC CTGGC CAGCT ATGCC GCGGC CTGCG 1901 CGGGG AGAGG CGTGC GCGTC GCGTG GCGCG AGCCA GGCCG CTGTG AGCTG 1951 AACTG CCCGA AAGGC CAGGT GT ACC TGCAG TGCGG GACCC CCTGC AACCT 2001 GACCT GCCGC TCTCT CTCTT ACCCG GATGA GGAAT GCA AT GAGGC CTGCC 2051 TGGAG GGCTG CTTCT GCCCC CCAGG GCTCT ACATG GATGA GAGGG GGGAC 2101 TGCGT GCCCA AGGCC CAGTG CCCCT GTTAC TATGA CGGTG AGATC TTCCA 2151 GCC AG A AGAC ATCTT CTC AG АССАТ САС AC C ATGT GCT AC TGTGA GGATG 2201 GCTTC ATGCA CTGTA CCATG AGTGG AGTCC CCGGA AGCTT GCTGC CTGAC 2251 GCTGT CCTCA GCAGT CCCCT GTCTC ATCGC AGCAA AAGGA GCCTA TCCTG 2301 TCGGC CCCCC ATGGT CAAGC TGGTG TGTCC CGCTG ACAAC CTGCG GGCTG 2351 A AGGG CTCGA GTGT A CCA A A ACGTG CC AGA АСТАТ GACCT GGAGT GC ATG 2401 AGCAT GGGCT GTGTC TCTGG CTGCC TCTGC CCCCC GGGCA TGGTC CGGCA 2451 TGAGA ACAGA TGTGT GGCCC TGGAA AGGTG TCCCT GCTTC CATCA GGGCA 2501 AGGAG TATGC CCCTG GAGAA ACAGT GAAGA TTGGC TGCAA CACTT GTGTC 2551 TGTCG GGACC GGAAG TGGAA CTGCA CAGAC CATGT GTGTG ATGCC ACGTG 2601 CTCCA CGATC GGCAT GGCCC ACT AC CTCAC CTTCG ACGGG CTCAA AT ACC 2651 TGTTC CCCGG GGAGT GCCAG TACGT TCTGG TGCAG GATTA CTGCG GCAGT 2701 AACCC TGGGA CCTTT CGGAT CCTAG TGGGG AATAA GGGAT GCAGC CACCC 2751 CTCAG TGAAA TGCAA GAAAC GGGTC АССАТ CCTGG TGGAG GGAGG AGAGA 2801 TTGAG CTGTT TGACG GGGAG GTGAA TGTGA AGAGG CCCAT GAAGG ATGAG 2851 ACTCA CTTTG AGGTG GTGGA GTCTG GCCGG TACAT CATTC TGCTG CTGGG 2901 CAAAG CCCTC TCCGT GGTCT GGGAC CGCCA CCTGA GCATC TCCGT GGTCC 2951 TGAAG CAGAC AT ACC AGGAG AAAGT GTGTG GCCTG TGTGG GAATT TTGAT 3001 GGCAT CCAGA ACAAT GACCT САССА GCAGC AACCT CCAAG TGGAG GAAGA 3051 CCCTG TGGAC TTTGG GAACT CCTGG AAAGT GAGCT CGCAG TGTGC TGACA 3101 CCAGA AAAGT GCCTC TGGAC ТС АТС CCCTG CC ACC TGCC А ТА AC A AC АТС 3151 ATGAA GCAGA CGATG GTGGA TTCCT CCTGT AGAAT CCTTA CCAGT GACGT 3201 CTTCC AGGAC TGCAA CAAGC TGGTG GACCC CGAGC CAT AT CTGGA TGTCT 3251 GCATT TACGA CACCT GCTCC TGTGA GTCCA TTGGG GACTG CGCCG CATTC 3301 TGCGA САССА TTGCT GCCTA TGCCC ACGTG TGTGC CCAGC ATGGC AAGGT 3351 GGTGA CCTGG AGGAC GGCCA CATTG TGCCC CCAGA GCTGC GAGGA GAGGA 3401 ATCTC CGGGA GAACG GGTAT GAGGC TGAGT GGCGC TATAA CAGCT GTGCA 3451 CCTGC CTGTC AAGTC ACGTG TCAGC ACCCT GAGCC ACTGG CCTGC CCTGT 3501 GCAGT GTGTG GAGGG CTGCC ATGCC CACTG CCCTC CAGGG AAAAT CCTGG 3551 ATGAG CTTTT GCAGA CCTGC GTTGA CCCTG AAGAC TGTCC AGTGT GTGAG 3601 GTGGC TGGCC GGCGT TTTGC CTCAG GAAAG AAAGT CACCT TGAAT CCCAG 3651 TGACC CTGAG CACTG CCAGA TTTGC CACTG TGATG TTGTC AACCT CACCT 3701 GTGAA GCCTG CCAGG AGCCG ATATC GGGCG CGCCA AC АТС AGAGA GCGCC1851 CGGCC GCGAG TGCCT GTGCG GCGCC CTGGC CAGCT ATGCC GCGGC CTGCG 1901 CGGGG AGAGG CGTGC GCGTC GCGTG GCGCG AGCCA GGCCG CTGTG AGCTG 1951 AACTG CCCGA AAGGC CAGGT GT ACC TGCAG TGCGG GACCC CCTGC AACCT 2001 GACCT GCCGC TCTCT CTCTT ACCCG GATGA GGAAT GCA AT GAGGC CTGCC 2051 TGGAG GGCTG CTTCT GCCCC CCAGG GCTCT ACATG GATGA GAGGG GGGAC 2101 TGCGT GCCCA AGGCC CAGTG CCCCT GTTAC TATGA CGGTG AGATC TTCCA 2151 GCC AG A AGAC ATCTT CTC AG ASSAT CAC AC C ATGT GCT AC TGTGA GGATG 2201 GCTTC ATGCA CTGTA CCATG AGTGG AGTCC CCGGA AGCTT GCTGC CTGAC 2251 GCTGT CCTCA GCAGT CCCCT GTCTC ATCGC AGCAA AAGGA GCCTA TCCTG 2301 TCGGC CCCCC ATGGT CAAGC TGGTG TGTCC CGCTG ACAAC CTGCG GGCTG 2351 A AGGG CTCGA GTGT A CCA A A ACGTG CC AGA ASTAT GACCT GGAGT GC ATG 2401 AGCAT GGGCT GTGTC TCTGG CTGCC TCTGC CCC CC GGGCA TGGTC CGGCA 2451 TGAGA ACAGA TGTGT GGCCC TGGAA AGGTG TCCCT GCTTC CATCA GGGCA 2501 AGGAG TATGC CCCTG GAGAA ACAGT GAAGA TTGGC TGCAA CACTT GTGTC 2551 TGTCG GGACC GGAAG TGGAA CTGCA CAGAC CATGT GTGTG ATGCC ACGTG 2601 CTCCA CGATC GGCAT GGCCC ACT AC CTCAC CTTCG ACGGG CTCAA AT ACC 2651 TGTTC CCCGG GGAGT GCCAG TACGT TCTGG TGCAG GATTA CTGCG GCAGT 2701 AACCC TGGGA CCTTT CGGAT CCTAG TGGGG AATAA GGGAT GCAGC CACCC 2751 CTCAG TGAAA TGCAA GAAAC GGGTC ASSAT CCTGG TGGAG GGAGG AGAGA 2801 TTGAG CTGTT TGACG GGGAG GTGAA TGTGA AGAGG CCCAT GAAGG ATGAG 2851 ACTCA CTT TG AGGTG GTGGA GTCTG GCCGG TACAT CATTC TGCTG CTGGG 2901 CAAAG CCCTC TCCGT GGTCT GGGAC CGCCA CCTGA GCATC TCCGT GGTCC 2951 TGAAG CAGAC AT ACC AGGAG AAAGT GTGTG GCCTG TGTGG GAATT TTGAT 3001 GGCAT CCAGA ACAAT GACCT SASSA GCAGC AACCT CCAAG TGGAG GAAGA 3051 CCCTG TGGAC TTTGG GAACT CCTGG AAAGT GAGCT CGCAG TGTGC TGACA 3101 CCAGA AAAGT GCCTC TGGAC TS ATS CCCTG CC ACC TGCC A TA AC A AC ATC 3151 ATGAA GCAGA CGATG GTGGA TTCCT CCTGT AGAAT CCTTA CCAGT GACGT 3201 CTTCC AGGAC TGCAA CAAGC TGGTG GACCC CGAGC CAT AT CTGGA TGTCT 3251 GCATT TACGA CACCT GCTCC TGTGA GTCCA TTGGG GACTG CGCCG CATTC 3 301 TGCGA SASSA TTGCT GCCTA TGCCC ACGTG TGTGC CCAGC ATGGC AAGGT 3351 GGTGA CCTGG AGGAC GGCCA CATTG TGCCC CCAGA GCTGC GAGGA GAGGA 3401 ATCTC CGGGA GAACG GGTAT GAGGC TGAGT GGCGC TATAA CAGCT GTGCA 3451 CCTGC CTGTC AAGTC ACGTG TCAGC ACCCT GAGCC ACTGG CCTGC CCTGT 3501 GCAGT GTGTG GAGGG CTGCC ATGCC CACTG CCCTC CAGGG AAAAT CCTGG 3551 ATGAG CTTTT GCAGA CCTGC GTTGA CCCTG AAGAC TGTCC AGTGT GTGAG 3601 GTGGC TGGCC GGCGT TTTGC CTCAG GAAAG AAAGT CACCT TGAAT CCCAG 3651 TGACC CTGAG CACTG CCAGA TTTGC CACTG TGATG TTGTC AACCT CACCT 3701 GTGAA GCCTG CCAGG AGCCG ATATC GGGCG C GCCA AC automatic telephone exchange AGAGA GCGCC

- 124 044115- 124 044115

3751 ACCCC TGAAA GTGGT CCCGG GAGCG AGCCA GCCAC ATCTG GGTCG GAAAC3751 ACCCC TGAAA GTGGT CCCGG GAGCG AGCCA GCCAC ATCTG GGTCG GAAAC

3801 GCCAG GCACA AGTGA GTCTG CAACT CCCGA GTCCG GACCT GGCTC CGAGC3801 GCCAG GCACA AGTGA GTCTG CAACT CCCGA GTCCG GACCT GGCTC CGAGC

3851 CTGCC ACT AG CGGCT CCGAG ACTCC GGGA A CTTCC GAGAG CGCT A САССА3851 CTGCC ACT AG CGGCT CCGAG ACTCC GGGA A CTTCC GAGAG CGCT A SASSA

3901 GAAAG CGGAC CCGGA ACCAG TACCG AACCT AGCGA GGGCT CTGCT CCGGG3901 GAAAG CGGAC CCGGA ACCAG TACCG AACCT AGCGA GGGCT CTGCT CCGGG

3951 CAGCC CAGCC GGCTC TCCTA CATCC ACGGA GGAGG GCACT TCCGA ATCCG3951 CAGCC CAGCC GGCTC TCCTA CATCC ACGGA GGAGG GCACT TCCGA ATCCG

4001 CCACC CCGGA GTCAG GGCCA GGATC TGAAC CCGCT ACCTC AGGCA GTGAG4001 CCACC CCGGA GTCAG GGCCA GGATC TGAAC CCGCT ACCTC AGGCA GTGAG

4051 ACGCC AGGAA CGAGC GAGTC CGCTA CACCG GAGAG TGGGC CAGGG AGCCC4051 ACGCC AGGAA CGAGC GAGTC CGCTA CACCG GAGAG TGGGC CAGGG AGCCC

4101 TGCTG GATCT CCTAC GTCCA CTGAG GAAGG GTCAC CAGCG GGCTC GCCCA4101 TGCTG GATCT CCTAC GTCCA CTGAG GAAGG GTCAC CAGCG GGCTC GCCCA

4151 CC AGC ACTG A AGA AG GTGCC TCGAG CGGCG GTGGA GGTTC CGGTG GCGGG4151 CC AGC ACTG A AGA AG GTGCC TCGAG CGGCG GTGGA GGTTC CGGTG GCGGG

4201 GGATC CGGTG GCGGG GGATC CGGTG GCGGG GGATC CGGTG GCGGG GGATC 4251 CCTGG TCCCC CGGGG CAGCG GAGGC GACAA AACTC AC АСА TGCCC ACCGT4201 GGATC CGGTG GCGGG GGATC CGGTG GCGGG GGATC CGGTG GCGGG GGATC 4251 CCTGG TCCCC CGGGG CAGCG GAGGC GACAA AACTC AC ACA TGCCC ACCGT

4301 GCCCA GCTCC AGAAC TCCTG GGCGG ACCGT CAGTC TTCCT CTTCC CCCCA4301 GCCCA GCTCC AGAAC TCCTG GGCGG ACCGT CAGTC TTCCT CTTCC CCCCA

4351 A A ACC C A AGG AC ACC CTC AT GATCT CCCGG ACCCC TGAGG TC AC A TGCGT4351 A A ACC C A AGG AC ACC CTC AT GATCT CCCGG ACCCC TGAGG TC AC A TGCGT

4401 GGTGG TGGAC GTGAG CCACG AAGAC CCTGA GGTCA AGTTC AACTG GTACG4401 GGTGG TGGAC GTGAG CCACG AAGAC CCTGA GGTCA AGTTC AACTG GTACG

4451 TGGAC GGCGT GGAGG TGCAT AATGC CAAGA CAAAG CCGCG GGAGG AGCAG4451 TGGAC GGCGT GGAGG TGCAT AATGC CAAGA CAAAG CCGCG GGAGG AGCAG

4501 TACAA CAGCA CGTAC CGTGT GGTCA GCGTC CTCAC CGTCC TGCAC CAGGA4501 TACAA CAGCA CGTAC CGTGT GGTCA GCGTC CTCAC CGTCC TGCAC CAGGA

4551 CTGGC TGA AT GGC A A GGAGT AC A AG TGC A A GGTCT CCA AC A A AGC CCTCC4551 CTGGC TGA AT GGC A A GGAGT AC A AG TGC A A GGTCT CCA AC A A AGC CCTCC

4601 CAGCC CCCAT CGAGA AAACC ATCTC CAAAG CCAAA GGGCA GCCCC GAGAA4601 CAGCC CCCAT CGAGA AAACC ATCTC CAAAG CCAAA GGGCA GCCCC GAGAA

4651 CCACA GGTGT ACACC CTGCC CCCAT CCCGG GATGA GCTGA CCAAG AACCA4651 CCACA GGTGT ACACC CTGCC CCCAT CCCGG GATGA GCTGA CCAAG AACCA

4701 GGTCA GCCTG ACCTG CCTGG TCAAA GGCTT СТ АТС CCAGC GAC AT CGCCG4701 GGTCA GCCTG ACCTG CCTGG TCAAA GGCTT ST ATS CCAGC GAC AT CGCCG

4751 TGGAG TGGGA GAGCA ATGGG CAGCC GGAGA ACAAC TACAA GACCA CGCCT4751 TGGAG TGGGA GAGCA ATGGG CAGCC GGAGA ACAAC TACAA GACCA CGCCT

4801 CCCGT GTTGG ACTCC GACGG CTCCT TCTTC CTCTA CAGCA AGCTC ACCGT4801 CCCGT GTTGG ACTCC GACGG CTCCT TCTTC CTCTA CAGCA AGCTC ACCGT

4851 GGACA AGAGC AGGTG GCAGC AGGGG AACGT CTTCT CATGC TCCGT GATGC4851 GGACA AGAGC AGGTG GCAGC AGGGG AACGT CTTCT CATGC TCCGT GATGC

4901 ATGAG GCTCT GCACA ACC AC TAC AC GCAGA AGAGC CTCTC CCTGT CTCCG4901 ATGAG GCTCT GCACA ACC AC TAC AC GCAGA AGAGC CTCTC CCTGT CTCCG

4951 GGTAAATGA4951 GGTAAAATGA

Последовательность белка ФВ057 (SEQ ID NO: 152).Protein sequence of VF057 (SEQ ID NO: 152).

MIPARFAGVL LALALILPGT LCAEGTRGRS STARCSLFGS DFVNTFDGSMMIPARFAGVL LALALILPGT LCAEGTRGRS STARCSLFGS DFVNTFDGSM

YSFAGYCSYL LAGGCQKRSF SIIGDFQNGK RVSLSVYLGE FFDIHLFVNGYSFAGYCSYL LAGGCQKRSF SIIGDFQNGK RVSLSVYLGE FFDIHLFVNG

101 TVTQGDQRVS MPYASKGLYL ETEAGYYKLS GEAYGFVARIDGSGNFQVLL101 TVTQGDQRVS MPYASKGLYL ETEAGYYKLS GEAYGFVARIDGSGNFQVLL

151 SDRYFNKTCG LCGNFNIFAE DDFMTQEGTL TSDPYDFANS WALSSGEQWC151 SDRYFNKTCG LCGNFNIFAE DDFMTQEGTL TSDPYDFANS WALSSGEQWC

201 ERASPPSSSC NISSGEMQKG LWEQCQLLKS TSVFARCHPL VDPEPFVALC201 ERASPPSSSC NISSGEMQKG LWEQCQLLKS TSVFARCHPL VDPEPFVALC

251 EKTLCECAGG LECACPALLE YARTCAQEGM VLYGWTDHSA CSPVCPAGME251 EKTLCECAGG LECACPALLE YARTCAQEGM VLYGWTDHSA CSPVCPAGME

301 YRQCVSPCAR TCQSLHINEM CQERCVDGCS CPEGQLLDEG LCVESTECPC301 YRQCVSPCAR TCQSLHINEM CQERCVDGCS CPEGQLLDEG LCVESTECPC

351 VHSGKRYPPG TSLSRDCNTC ICRNSQWICS NEECPGECLV TGQSHFKSFD351 VHSGKRYPPG TSLSRDCNTC ICRNSQWICS NEECPGECLV TGQSHFKSFD

401 NRYFTFSGIC QYLLARDCQD HSFSIVIETV QCADDRDAVC TRSVTVRLPG401 NRYFTFSGIC QYLLARDCQD HSFSIVIETV QCADDRDAVC TRSVTVRLPG

451 LHNSLVKLKH GAGVAMDGQD IQLPLLKGDL RIQHTVTASV RLSYGEDLQM451 LHNSLVKLKH GAGVAMDGQD IQLPLLKGDL RIQHTVTASV RLSYGEDLQM

- 125 044115- 125 044115

501 DWDGRGRLLV KLSPVYAGKT CGLCGNYNGN QGDDFLTPSG LAEPRVEDFG501 DWDGRGRLLV KLSPVYAGKT CGLCGNYNGN QGDDFLTPSG LAEPRVEDFG

551 NAWKLHGDCQ DLQKQHSDPC ALNPRMTRFS EEACAVLTSP TFEACHRAVS551 NAWKLHGDCQ DLQKQHSDPC ALNPRMTRFS EEACAVLTSP TFEACHRAVS

601 PLPYLRNCRY DVCSCSDGRE CLCGALASYA AACAGRGVRV AWREPGRCEL601 PLPYLRNCRY DVCSCSDGRE CLCGALASYA AACAGRGVRV AWREPGRCEL

651 NCPKGQVYLQ CGTPCNLTCR SLSYPDEECN EACLEGCFCP PGLYMDERGD651 NCPKGQVYLQ CGTPCNLTCR SLSYPDEECN EACLEGCFCP PGLYMDERGD

701 CVPKAQCPCY YDGEIFQPED IFSDHHTMCY CEDGFMHCTM SGVPGSLLPD 751 AVLSSPLSHR SKRSLSCRPP MVKLVCPADN LRAEGLECTK TCQNYDLECM701 CVPKAQCPCY YDGEIFQPED IFSDHHTMCY CEDGFMHCTM SGVPGSLLPD 751 AVLSSPLSHR SKRSLSCRPP MVKLVCPADN LRAEGLECTK TCQNYDLECM

801 SMGCVSGCLC PPGMVRHENR CVALERCPCF HQGKEYAPGE TVKIGCNTCV801 SMGCVSGCLC PPGMVRHENR CVALERCPCF HQGKEYAPGE TVKIGCNTCV

851 CRDRKWNCTD HVCDATCSTIGMAHYLTFDG LKYLFPGECQ YVLVQDYCGS851 CRDRKWNCTD HVCDATCSTIGMAHYLTFDG LKYLFPGECQ YVLVQDYCGS

901 NPGTFRILVG NKGCSHPSVK CKKRVTILVE GGEIELFDGE VNVKRPMKDE901 NPGTFRILVG NKGCSHPSVK CKKRVTILVE GGEIELFDGE VNVKRPMKDE

951 THFEVVESGR YIILLLGKAL SVVWDRHLSI SVVLKQTYQE KVCGLCGNFD 1001 GIQNNDLTSS NLQVEEDPVD FGNSWKVSSQ CADTRKVPLD SSPATCHNNI 1051 MKQTMVDSSC RILTSDVFQD CNKLVDPEPY LDVCIYDTCS CESIGDCAAF951 THFEVVESGR YIILLLGKAL SVVWDRHLSI SVVLKQTYQE KVCGLCGNFD 1001 GIQNNDLTSS NLQVEEDPVD FGNSWKVSSQ CADTRKVPLD SSPATCHNNI 1051 MKQTMVDSSC RILTSDVFQD CNKLVDPEPY LDVCIYDTCS CESIGDCAAF

1101 CDTIAAYAHV CAQHGKVVTW RTATLCPQSC EERNLRENGY EAEWRYNSCA1101 CDTIAAYAHV CAQHGKVVTW RTATLCPQSC EERNLRENGY EAEWRYNSCA

1151 PACQVTCQHP EPLACPVQCV EGCHAHCPPG KILDELLQTC VDPEDCPVCE 1201 VAGRRFASGK KVTLNPSDPE HCQICHCDVV NLTCEACQEPISGAPTSESA1151 PACQVTCQHP EPLACPVQCV EGCHAHCPPG KILDELLQTC VDPEDCPVCE 1201 VAGRRFASGK KVTLNPSDPE HCQICHCDVV NLTCEACQEPISGAPTSESA

1251 TPESGPGSEP ATSGSETPGT SESATPESGP GSEPATSGSE TPGTSESATP 1301 ESGPGTSTEP SEGSAPGSPA GSPTSTEEGT SESATPESGP GSEPATSGSE 1351 TPGTSESATP ESGPGSPAGS PTSTEEGSPA GSPTSTEEGA SSGGGGSGGG1251 TPESGPGSEP ATSGSETPGT SESATPESGP GSEPATSGSE TPGTSESATP 1301 ESGPGTSTEP SEGSAPGSPA GSPTSTEEGT SESATPESGP GSEPATSGSE 1351 TPGTSESATP ESGPGSPAGS PSTEEGSPA GSPTSTEEGA SSGGGGSGGG

1401 GSGGGGSGGG GSGGGGSLVP RGSGGDKTHT CPPCPAPELL GGPSVFLFPP1401 GSGGGGSGGG GSGGGGSLVP RGSGGDKTHT CPPCPAPELL GGPSVFLFPP

1451 KPKDTLMISR TPEVTCVVVD VSHEDPEVKF NWYVDGVEVH NAKTKPREEQ 1501 YNSTYRVVSV LTVLHQDWLN GKEYKCKVSN KALPAPIEKT ISKAKGQPRE 1551 PQVYTLPPSR DELTKNQVSL TCLVKGFYPS DIAVEWESNG QPENNYKTTP1451 KPKDTLMISR TPEVTCVVVD VSHEDPEVKF NWYVDGVEVH NAKTKPREEQ 1501 YNSTYRVVSV LTVLHQDWLN GKEYKCKVSN KALPAPIEKT ISKAKGQPRE 1551 PQVYTLPPSR DELTKNQVSL TCLVKGFYPS DIAVEWESNG QPENNYK TTP

1601 PVLDSDGSFF LYSKLTVDKS RWQQGNVFSC SVMHEALHNH YTQKSLSLSP1601 PVLDSDGSFF LYSKLTVDKS RWQQGNVFSC SVMHEALHNH YTQKSLSLSP

1651 GK*1651 GK*

Нуклеотидная последовательность ФВ058 (ФВ034 с мутацией IHH)(SEQ ID NO: 153).Nucleotide sequence of VF058 (VF034 with IHH mutation) (SEQ ID NO: 153).

ATGAT TCCTG CCAGA TTTGC CGGGG TGCTG CTTGC TCTGG CCCTC ATTTTATGAT TCCTG CCAGA TTTGC CGGGG TGCTG CTTGC TCTGG CCCTC ATTTT

GCCAG GGACC CTTTG TGC AG AAGGA ACTCG CGGCA GGTC A TCC AC GGCCC 101 GATGC AGCCT TTTCG GA AGT GACTT CGTC A AC ACC TTTGA TGGG A GC ATGGCCAG GGACC CTTTG TGC AG AAGGA ACTCG CGGCA GGTC A TCC AC GGCCC 101 GATGC AGCCT TTTCG GA AGT GACTT CGTC A AC ACC TTTGA TGGG A GC ATG

151 TACAG CTTTG CGGGA TACTG CAGTT ACCTC CTGGC AGGGG GCTGC CAGAA151 TACAG CTTTG CGGGA TACTG CAGTT ACCTC CTGGC AGGGG GCTGC CAGAA

201 ACGCT CCTTC TCGAT T ATTG GGGAC TTCC A GA ATG GCA AG AGAGT GAGCC201 ACGCT CCTTC TCGAT T ATTG GGGAC TTCC A GA ATG GCA AG AGAGT GAGCC

251 TCTCC GTGTA TCTTG GGGAA TTTTT TGACA TCCAT TTGTT TGTCA ATGGT251 TCTCC GTGTA TCTTG GGGAA TTTTT TGACA TCCAT TTGTT TGTCA ATGGT

301 ACCGT GACAC AGGGG GACCA AAGAG TCTCC ATGCC CTATG CCTCC AAAGG301 ACCGT GACAC AGGGG GACCA AAGAG TCTCC ATGCC CTATG CCTCC AAAGG

351 GCTGT ATCTA GAAAC TGAGG CTGGG TACTA CAAGC TGTCC GGTGA GGCCT351 GCTGT ATCTA GAAAC TGAGG CTGGG TACTA CAAGC TGTCC GGTGA GGCCT

401 ATGGC TTTGT GGCCA GGATC GATGG CAGCG GCA AC TTTCA AGTCC TGCTG401 ATGGC TTTGT GGCCA GGATC GATGG CAGCG GCA AC TTTCA AGTCC TGCTG

451 TCAGA CAGAT ACTTC AACAA GACCT GCGGG CTGTG TGGCA ACTTT AACAT451 TCAGA CAGAT ACTTC AACAA GACCT GCGGG CTGTG TGGCA ACTTT AACAT

501 CTTTG CTGAA GATGA CTTTA TGACC CAAGA AGGGA CCTTG ACCTC GGACC501 CTTTG CTGAA GATGA CTTTA TGACC CAAGA AGGGA CCTTG ACCTC GGACC

- 126 044115- 126 044115

551 CTTAT GACTT TGCCA ACTCA TGGGC TCTGA GCAGT GGAGA ACAGT GGTGT551 CTTAT GACTT TGCCA ACTCA TGGGC TCTGA GCAGT GGAGA ACAGT GGTGT

601 GA ACG GGC AT CTCCT CCCAG C AGCT C ATGC A AC AT CTCCT CTGGG GA A AT601 GA ACG GGC AT CTCCT CCCAG C AGCT C ATGC A AC AT CTCCT CTGGG GA A AT

651 GCAGA AGGGC CTGTG GGAGC AGTGC CAGCT TCTGA AGAGC ACCTC GGTGT651 GCAGA AGGGC CTGTG GGAGC AGTGC CAGCT TCTGA AGAGC ACCTC GGTGT

701 TTGCC CGCTG CCACC CTCTG GTGGA CCCCG AGCCT TTTGT GGCCC TGTGT701 TTGCC CGCTG CCACC CTCTG GTGGA CCCCG AGCCT TTTGT GGCCC TGTGT

751 GAGAA GACTT TGTGT GAGTG TGCTG GGGGG CTGGA GTGCG CCTGC CCTGC 801 CCTCC TGGAG TACGC CCGGA CCTGT GCCCA GGAGG GAATG GTGCT GTACG751 GAGAA GACTT TGTGT GAGTG TGCTG GGGGG CTGGA GTGCG CCTGC CCTGC 801 CCTCC TGGAG TACGC CCGGA CCTGT GCCCA GGAGG GAATG GTGCT GTACG

851 GCTGG ACCGA CCACA GCGCG TGCAG CCCAG TGTGC CCTGC TGGTA TGGAG851 GCTGG ACCGA CCACA GCGCG TGCAG CCCAG TGTGC CCTGC TGGTA TGGAG

901 TAT AG GCAGT GTGTG TCCCC TTGCG CC AGG ACCTG CCAGA GCCTG C AC AT901 TAT AG GCAGT GTGTG TCCCC TTGCG CC AGG ACCTG CCAGA GCCTG C AC AT

951 CAATG AAATG TGTCA GGAGC GATGC GTGGA TGGCT GCAGC TGCCC TGAGG951 CAATG AAATG TGTCA GGAGC GATGC GTGGA TGGCT GCAGC TGCCC TGAGG

1001 GACAG CTCCT GGATG AAGGC CTCTG CGTGG AGAGC ACCGA GTGTC CCTGC 1051 GTGCA TTCCG GAAAG CGCTA CCCTC CCGGC ACCTC CCTCT CTCGA GACTG 1101 C A AC A CCTGC ATTTG CCGA A AC AGC C AGTG GATCT GCAGC A ATGA AGA AT 1151 GTCCA GGGGA GTGCC TTGTC ACTGG TCAAT CCCAC TTCAA GAGCT TTGAC 1201 A AC AG AT ACT TC ACC TTC AG TGGGA TCTGC C AGT A CCTGC TGGCC CGGGA 1251 TTGCC AGGAC CACTC CTTCT CCATT GTCAT TGAGA CTGTC CAGTG TGCTG 1301 ATGAC CGCGA CGCTG TGTGC ACCCG CTCCG TCACC GTCCG GCTGC CTGGC 1351 CTGC A C A AC A GCCTT GTGA A ACTGA AGC AT GGGGC AGGAG TTGCC ATGGA 1401 TGGCC AGGAC ATCCA GCTCC CCCTC CTGAA AGGTG ACCTC CGCAT CCAGC 1451 АТАСА GTGAC GGCCT CCGTG CGCCT CAGCT ACGGG GAGGA CCTGC AGATG 1501 GACTG GGATG GCCGC GGGAG GCTGC TGGTG AAGCT GTCCC CCGTC TATGC 1551 CGGGA AGACC TGCGG CCTGT GTGGG A ATT A CAATG GCA AC C AGGG CGACG 1601 ACTTC CTTAC CCCCT CTGGG CTGGC GGAGC CCCGG GTGGA GGACT TCGGG 1651 AACGC CTGGA AGCTG CACGG GGACT GCCAG GACCT GCAGA AGCAG CACAG 1701 CGATC CCTGC GCCCT СAACC CGCGC ATGAC CAGGT TCTCC GAGGA GGCGT 1751 GCGCG GTCCT GACGT CCCCC ACATT CGAGG CCTGC CATCG TGCCG TCAGC 1801 CCGCT GCCCT ACCTG CGGAA CTGCC GCTAC GACGT GTGCT CCTGC TCGGA 1851 CGGCC GCGAG TGCCT GTGCG GCGCC CTGGC CAGCT ATGCC GCGGC CTGCG 1901 CGGGG AGAGG CGTGC GCGTC GCGTG GCGCG AGCCA GGCCG CTGTG AGCTG 1951 AACTG CCCGA AAGGC CAGGT GT ACC TGCAG TGCGG GACCC CCTGC AACCT 2001 GACCT GCCGC TCTCT CTCTT ACCCG GATGA GGAAT GCA AT GAGGC CTGCC 2051 TGGAG GGCTG CTTCT GCCCC CCAGG GCTCT ACATG GATGA GAGGG GGGAC 2101 TGCGT GCCCA AGGCC CAGTG CCCCT GTTAC TATGA CGGTG AG АТС TTCCA 2151 GCCAG AAGAC ATCTT CTC AG АССАТ САС AC C ATGT GCTAC TGTGA GGATG 2201 GCTTC ATGCA CTGTA CCATG AGTGG AGTCC CCGGA AGCTT GCTGC CTGAC 2251 GCTGT CCTCA GCAGT CCCCT GTCTC ATCGC AGCAA AAGGA GCCTA TCCTG 2301 TCGGC CCCCC ATGGT CAAGC TGGTG TGTCC CGCTG ACAAC CTGCG GGCTG 2351 A AGGG CTCGA GTGT A CCA A A ACGTG CCAGA АСТАТ GACCT GGAGT GC ATG 2401 AGCAT GGGCT GTGTC TCTGG CTGCC TCTGC CCCCC GGGCA TGGTC CGGCA1001 GACAG CTCCT GGATG AAGGC CTCTG CGTGG AGAGC ACCGA GTGTC CCTGC 1051 GTGCA TTCCG GAAAG CGCTA CCCTC CCGGC ACCTC CCTCT CTCGA GACTG 1101 C A AC A CCTGC ATTTG CCGA A AC AGC C AGTG GATCT GCAGC A ATGA AGA AT 1151 GTCCA GGGGA GTGCC TTG TC ACTGG TCAAT CCCAC TTCAA GAGCT TTGAC 1201 A AC AG AT ACT TC ACC TTC AG TGGGA TCTGC C AGT A CCTGC TGGCC CGGGA 1251 TTGCC AGGAC CACTC CTTCT CCATT GTCAT TGAGA CTGTC CAGTG TGCTG 1301 ATGAC CGCGA CGCTG TGTGC ACCCG CTCCG TCACC GTCCG GCTGC CTGGC 1351 CTGC A C A AC A GCCTT GTGA A ACTGA AGC AT GGGGC AGGAG TTGCC ATGGA 1401 TGGCC AGGAC ATCCA GCTCC CCCTC CTGAA AGGTG ACCTC CGCAT CCAGC 1451 ATASA GTGAC GGCCT CCGTG CGCCT CAGCT ACGGG GAGGA CCTGC AGATG 1501 GACTG GGATG GCCGC GGGAG GCTGC TGGTG AAGCT GTCCC CCGTC TATGC 15 51 CGGGA AGACC TGCGG CCTGT GTGGG A ATT A CAATG GCA AC C AGGG CGACG 1601 ACTTC CTTAC CCCCT CTGGG CTGGC GGAGC CCCGG GTGGA GGACT TCGGG 1651 AACGC CTGGA AGCTG CACGG GGACT GCCAG GACCT GCAGA AGCAG CACAG 1701 CGATC CCTGC GCCCT CAACC CGCGC ATGAC CAGGT TCTCC GAGGA GGCGT 1751 GCGCG GTCCT GACGT CCCCC ACATT CGAGG CCTGC CATCG TGCCG TCAGC 1801 CCGCT GCCCT ACCTG CGGAA CTGCC GCTAC GACGT GTGCT CCTGC TCGGA 1851 CGGCC GCGAG TGCCT GTGCG GCGCC CTGGC CAGCT ATGCC GCGGC CTGCG 1901 CGGGG AGAGG CGTGC GCGTC GCGTG GCGCG AGCCA GGCCG CTGTG AGCTG 1951 AACTG CCCGA AAGGC CAGGT GT ACC TGCAG TGC GG GACCC CCTGC AACCT 2001 GACCT GCCGC TCTCT CTCTT ACCCG GATGA GGAAT GCA AT GAGGC CTGCC 2051 TGGAG GGCTG CTTCT GCCCC CCAGG GCTCT ACATG GATGA GAGGG GGGAC 2101 TGCGT GCCCA AGGCC CAGTG CCCCT GTTAC TATGA CGGTG AG ATC TTCCA 2151 GCCAG AAGAC ATCTT CTC AG ACCAT CAC AC C ATGT GCTAC TGTGA GGATG 2201 GCTTC ATGCA CTGTA CCATG AGTGG AGTCC CCGGA AGCTT GCTGC CTGAC 2251 GCTGT CCTCA GCAGT CCCCT GTCTC ATCGC AGCAA AAGGA GCCTA TCCTG 2301 TCGGC CCCCC ATGGT CAAGC TGGTG TGTCC CGCTG ACAAC CTGCG GGCTG 2351 A AGGG CTCGA GTGT A CCA A A ACGTG CCAGA ASTAT GACCT GGAGT GC ATG 2401 AGCAT GGGCT GTGTC TCTGG CTGCC TCTGC CCCCC GGGCA TGGTC CGGCA

- 127 044115- 127 044115

2451 TGAGA ACAGA TGTGT GGCCC TGGAA AGGTG TCCCT GCTTC CATCA GGGCA2451 TGAGA ACAGA TGTGT GGCCC TGGAA AGGTG TCCCT GCTTC CATCA GGGCA

2501 AGGAG TATGC CCCTG GAGAA ACAGT GAAGA TTGGC TGCAA CACTT GTGTC2501 AGGAG TATGC CCCTG GAGAA ACAGT GAAGA TTGGC TGCAA CACTT GTGTC

2551 TGTCG GGACC GGAAG TGGAA CTGCA CAGAC CATGT GTGTG ATGCC ACGTG2551 TGTCG GGACC GGAAG TGGAA CTGCA CAGAC CATGT GTGTG ATGCC ACGTG

2601 CTCCA CGATC GGC AT GGCCC ACT AC CTCAC CTTCG ACGGG CTCAA AT ACC 2651 TGTTC CCCGG GGAGT GCCAG TACGT TCTGG TGCAG GATTA CTGCG GCAGT 2701 AACCC TGGGA CCTTT CGGAT CCTAG TGGGG AATAA GGGAT GCAGC CACCC 2751 CTCAG TGAAA TGCAA GAAAC GGGTC ACCAT CCTGG TGGAG GGAGG AGAGA 2801 TTGAG CTGTT TGACG GGGAG GTGAA TGTGA AGAGG CCCAT GAAGG ATGAG 2851 ACTCA CTTTG AGGTG GTGGA GTCTG GCCGG TACAT CATTC TGCTG CTGGG 2901 CAAAG CCCTC TCCGT GGTCT GGGAC CGCCA CCTGA GCATC TCCGT GGTCC 2951 TGAAG CAGAC AT ACC AGGAG AAAGT GTGTG GCCTG TGTGG GAATT TTGAT 3001 GGCAT CCAGA ACAAT GACCT САССА GCAGC AACCT CCAAG TGGAG GAAGA 3051 CCCTG TGGAC TTTGG GAACT CCTGG AAAGT GAGCT CGCAG TGTGC TGACA 3101 CCAGA AAAGT GCCTC TGGAC ТС АТС CCCTG CC ACC TGCC А ТА AC A AC АТС 3151 ATGAA GCAGA CGATG GTGGA TTCCT CCTGT AGAAT CCTTA CCAGT GACGT 3201 CTTCC AGGAC TGCAA CAAGC TGGTG GACCC CGAGC CAT AT CTGGA TGTCT 3251 GCATT TACGA CACCT GCTCC TGTGA GTCCA TTGGG GACTG CGCCG CATTC 3301 TGCGA САССА TTGCT GCCTA TGCCC ACGTG TGTGC CCAGC ATGGC AAGGT2601 CTCCA CGATC GGC AT GGCCC ACT AC CTCAC CTTCG ACGGG CTCAA AT ACC 2651 TGTTC CCCGG GGAGT GCCAG TACGT TCTGG TGCAG GATTA CTGCG GCAGT 2701 AACCC TGGGA CCTTT CGGAT CCTAG TGGGG AATAA GGGAT GCAGC CACCC 2751 CTCAG TGAAA TGCAA GAAAC GGGTC ACCAT CCTGG TGGAG GGAGG AGAGA 2801 TTGAG CTGTT TGACG GGGAG GTGAA TGTGA AGAGG CCCAT GAAGG ATGAG 2851 ACTCA CTTTG AGGTG GTGGA GTCTG GCCGG TACAT CATTC TGCTG CTGGG 2901 CAAAG CCCTC TCCGT GGTCT GGGAC CGCCA CCTGA GCATC TCCGT GGTCC 2951 TGAAG CAGAC AT ACC AGGAG AAAGT GTGTG G CCTG TGTGG GAATT TTGAT 3001 GGCAT CCAGA ACAAT GACCT SASSA GCAGC AACCT CCAAG TGGAG GAAGA 3051 CCCTG TGGAC TTTGG GAACT CCTGG AAAGT GAGCT CGCAG TGTGC TGACA 3101 CCAGA AAAGT GCCTC TGGAC TS ATS CCCTG CC ACC TGCC A TA AC A AC ATS 3151 ATGAA GCAGA CGATG GTGGA TTCCT CCTGT AGAAT CCTTA CCAGT GACGT 3 201 CTTCC AGGAC TGCAA CAAGC TGGTG GACCC CGAGC CAT AT CTGGA TGTCT 3251 GCATT TACGA CACCT GCTCC TGTGA GTCCA TTGGG GACTG CGCCG CATTC 3301 TGCGA SASSA TTGCT GCCTA TGCCC ACGTG TGTGC CCAGC ATGGC AAGGT

3351 GGTGA CCTGG AGGAC GGCCA CATTG TGCCC CCAGA GCTGC GAGGA GAGGA 3401 ATCTC CGGGA GAACG GGTAT GAGGC TGAGT GGCGC TATAA CAGCT GTGCA 3451 CCTGC CTGTC AAGTC ACGTG TCAGC ACCCT GAGCC ACTGG CCTGC CCTGT 3501 GCAGT GTGTG GAGGG CTGCC ATGCC CACTG CCCTC CAGGG AAAAT CCTGG 3551 ATGAG CTTTT GCAGA CCTGC GTTGA CCCTG AAGAC TGTCC AGTGT GTGAG 3601 GTGGC TGGCC GGCGT TTTGC CTCAG GAAAG AAAGT CACCT TGAAT CCCAG 3651 TGACC CTGAG CACTG CCAGA TTTGC CACTG TGATG TTGTC AACCT CACCT 3701 GTGAA GCCTG CCAGG AGCCG ATATC GGGTA CCTCA GAGTC TGCTA CCCCC 3751 GAGTC AGGGC CAGGA TCAGA GCCAG CCACC TCCGG GTCTG AGACA CCCGG 3801 GACTT CCGAG AGTGC CACCC CTGAG TCCGG ACCCG GGTCC GAGCC CGCCA 3851 CTTCC GGCTC CGAAA CTCCC GGCAC AAGCG AGAGC GCTAC CCCAG AGTCA 3901 GGACC AGGAA CATCT ACAGA GCCCT CTGAA GGCTC CGCTC CAGGG TCCCC3351 GGTGA CCTGG AGGAC GGCCA CATTG TGCCC CCAGA GCTGC GAGGA GAGGA 3401 ATCTC CGGGA GAACG GGTAT GAGGC TGAGT GGCGC TATAA CAGCT GTGCA 3451 CCTGC CTGTC AAGTC ACGTG TCAGC ACCCT GAGCC ACTGG CCTGC CCTGT 3501 GCAGT GTGTG GAGGG CTGCC ATGCC CACTG CCCTC CAGGG AAAAT CCTGG 3551 ATGAG CTTTT GCAGA CCTGC GTTGA CCCTG AAGAC TGTCC AGTGT GTGAG 3601 GTGGC TGGCC GGCGT TTTGC CTCAG GAAAG AAAGT CACCT TGAAT CCCAG 3651 TGACC CTGAG CACTG CCAGA TTTGC CACTG TGATG TTGTC AACCT CACCT 3701 GTGAA GCCTG CCAGG AGCCG ATATC GGGTA CCTCA GAGTC TGCTA C CCCC 3751 GAGTC AGGGC CAGGA TCAGA GCCAG CCACC TCCGG GTCTG AGACA CCCGG 3801 GACTT CCGAG AGTGC CACCC CTGAG TCCGG ACCCG GGTCC GAGCC CGCCA 3851 CTTCC GGCTC CGAAA CTCCC GGCAC AAGCG AGAGC GCTAC CCCAG AGTCA 3901 GGACC AGGAA CATCT ACAGA GCCCT CTGAA GGCTC CGCTC CAGGG TCCCC

3951 AGCCG GCAGT CCCAC TAGCA CCGAG GAGGG AACCT CTGAA AGCGC CACAC 4001 CCGAA TCAGG GCCAG GGTCT GAGCC TGCTA CCAGC GGCAG CGAGA САССА 4051 GGCAC CTCTG AGTCC GCC AC ACC AG AGTCC GGACC CGGAT CTCCC GCTGG 4101 GAGCC CCACC TCC AC TGAGG AGGGA TCTCC TGCTG GCTCT CCA AC ATCT A 4151 CTGAG GAAGG T ACCT C A ACC GAGCC ATCCG AGGGA TCAGC TCCCG GC ACC 4201 TCAGA GTCGG C A ACC CCGGA GTCTG GACCC GGA AC TTCCG AAAGT GCC AC 4251 ACC AG AGTCC GGTCC CGGGA CTTCA GAATC AGCAA CACCC GAGTC CGGCC 4301 CTGGG TCTGA ACCCG CCACA AGTGG TAGTG AGACA CCAGG ATCAG AACCT3951 AGCCG GCAGT CCCAC TAGCA CCGAG GAGGG AACCT CTGAA AGCGC CACAC 4001 CCGAA TCAGG GCCAG GGTCT GAGCC TGCTA CCAGC GGCAG CGAGA SASSA 4051 GGCAC CTCTG AGTCC GCC AC ACC AG AGTCC GGACC CGGAT CTCCC GCTGG 4101 GAGCC CCACC TCC AC TGAGG AGGGA TCTCC TGCTG GCTCT CCA AC ATCT A 4151 CTGAG GAAGG T ACCT C A ACC GAGCC ATCCG AGGGA TCAGC TCCCG GC ACC 4201 TCAGA GTCGG C A ACC CCGGA GTCTG GACCC GGA AC TTCCG AAAGT GCC AC 4251 ACC AG AGTCC GGTCC CGGGA CTTCA GAATC AGCAA CACCC GAGTC CGGCC 4301 CTGGG TCTGA ACCCG CCACA AGTG G TAGTG AGACA CCAGG ATCAG AACCT

- 128 044115- 128 044115

4351 GCTAC СТС AG GGTC A GAGAC ACCCG GATCT CCGGC AGGCT САССА ACCTC4351 GCTAC STS AG GGTC A GAGAC ACCCG GATCT CCGGC AGGCT SASSA ACCTC

4401 C ACTG AGGAG GGC AC C AGC A C AGA A CCA AG CGAGG GCTCC GC ACC CGGA A4401 C ACTG AGGAG GGC AC C AGC A C AGA A CCA AG CGAGG GCTCC GC ACC CGGA A

4451 CAAGC ACTGA ACCCA GTGAG GGTTC AGCAC CCGGC TCTGA GCCGG CCACA4451 CAAGC ACTGA ACCCA GTGAG GGTTC AGCAC CCGGC TCTGA GCCGG CCACA

4501 AGTGG CAGTG AGACA CCCGG CACTT CAGAG AGTGC CACCC CCGAG AGTGG4501 AGTGG CAGTG AGACA CCCGG CACTT CAGAG AGTGC CACCC CCGAG AGTGG

4551 CCCAG GCACT AGTAC CGAGC CCTCT GAAGG CAGTG CGCCA GATTC TGGCG4551 CCCAG GCACT AGTAC CGAGC CCTCT GAAGG CAGTG CGCCA GATTC TGGCG

4601 GTGGA GGTTC CGGTG GCGGG GGATC CGGTG GCGGG GGATC CGGTG GCGGG4601 GTGGA GGTTC CGGTG GCGGG GGATC CGGTG GCGGG GGATC CGGTG GCGGG

4651 GGATC CGGTG GCGGG GGATC CCTGG TCCCC CGGGG CAGCG GAGGC GACAA4651 GGATC CGGTG GCGGG GGATC CCTGG TCCCC CGGGG CAGCG GAGGC GACAA

4701 AACTC ACACA TGCCC ACCGT GCCCA GCTCC AGAAC TCCTG GGCGG ACCGT4701 AACTC ACACA TGCCC ACCGT GCCCA GCTCC AGAAC TCCTG GGCGG ACCGT

4751 CAGTC TTCCT CTTCC CCCCA AAACC CAAGG ACACC CTCAT GGCCT CCCGG4751 CAGTC TTCCT CTTCC CCCCA AAACC CAAGG ACACC CTCAT GGCCT CCCGG

4801 ACCCC TGAGG TCACA TGCGT GGTGG TGGAC GTGAG CCACG AAGAC CCTGA4801 ACCCC TGAGG TCACA TGCGT GGTGG TGGAC GTGAG CCACG AAGAC CCTGA

4851 GGTC A AGTTC AACTG GT ACG TGGAC GGCGT GGAGG TGC AT AATGC C AAGA4851 GGTC A AGTTC AACTG GT ACG TGGAC GGCGT GGAGG TGC AT AATGC C AAGA

4901 CAAAG CCGCG GGAGG AGCAG TACAA CAGCA CGTAC CGTGT GGTCA GCGTC4901 CAAAG CCGCG GGAGG AGCAG TACAA CAGCA CGTAC CGTGT GGTCA GCGTC

4951 CTCAC CGTCC TGGCC CAGGA CTGGC TGAAT GGCAA GGAGT ACAAG TGCAA4951 CTCAC CGTCC TGGCC CAGGA CTGGC TGAAT GGCAA GGAGT ACAAG TGCAA

5001 GGTCT CCAAC AAAGC CCTCC CAGCC CCCAT CGAGA AAACC ATCTC CAAAG5001 GGTCT CCAAC AAAGC CCTCC CAGCC CCCAT CGAGA AAACC ATCTC CAAAG

5051 CCAAA GGGCA GCCCC GAGAA CCACA GGTGT ACACC CTGCC CCCAT CCCGC5051 CCAAA GGGCA GCCCC GAGAA CCACA GGTGT ACACC CTGCC CCCAT CCCGC

5101 GATGA GCTGA CCA AG A ACC A GGTCA GCCTG ACCTG CCTGG TC A A A GGCTT5101 GATGA GCTGA CCA AG A ACC A GGTCA GCCTG ACCTG CCTGG TC A A A GGCTT

5151 СТ АТС CC AGC GAC AT CGCCG TGGAG TGGGA GAGCA ATGGG CAGCC GGAGA5151 ST ATS CC AGC GAC AT CGCCG TGGAG TGGGA GAGCA ATGGG CAGCC GGAGA

5201 ACAAC TACAA GACCA CGCCT CCCGT GTTGG ACTCC GACGG CTCCT TCTTC5201 ACAAC TACAA GACCA CGCCT CCCGT GTTGG ACTCC GACGG CTCCT TCTTC

5251 CTCTA CAGCA AGCTC ACCGT GGACA AGAGC AGGTG GCAGC AGGGG AACGT5251 CTCTA CAGCA AGCTC ACCGT GGACA AGAGC AGGTG GCAGC AGGGG AACGT

5301 CTTCT CATGC TCCGT GATGC ATGAG GCTCT GCACA ACGCC TACAC GCAGA5301 CTTCT CATGC TCCGT GATGC ATGAG GCTCT GCACA ACGCC TACAC GCAGA

5351 AGAGC CTCTC CCTGT CTCCG GGTAA ATGA5351 AGAGC CTCTC CCTGT CTCCG GGTAA ATGA

Последовательность белка ФВ058 (ФВ034 с мутацией IHH) (SEQ ID NO: 154).Protein sequence of VWF058 (VWF034 with IHH mutation) (SEQ ID NO: 154).

MIPARFAGVL LALALILPGT LCAEGTRGRS STARCSLFGS DFVNTFDGSMMIPARFAGVL LALALILPGT LCAEGTRGRS STARCSLFGS DFVNTFDGSM

YSFAGYCSYL LAGGCQKRSF SIIGDFQNGK RVSLSVYLGE FFDIHLFVNGYSFAGYCSYL LAGGCQKRSF SIIGDFQNGK RVSLSVYLGE FFDIHLFVNG

101 TVTQGDQRVS MPYASKGLYL ETEAGYYKLS GEAYGFVARI DGSGNFQVLL101 TVTQGDQRVS MPYASKGLYL ETEAGYYKLS GEAYGFVARI DGSGNFQVLL

151 SDRYFNKTCG LCGNFNIFAE DDFMTQEGTL TSDPYDFANS WALSSGEQWC151 SDRYFNKTCG LCGNFNIFAE DDFMTQEGTL TSDPYDFANS WALSSGEQWC

201 ERASPPSSSC NISSGEMQKG LWEQCQLLKS TSVFARCHPL VDPEPFVALC201 ERASPPSSSC NISSGEMQKG LWEQCQLLKS TSVFARCHPL VDPEPFVALC

251 EKTLCECAGG LECACPALLE YARTCAQEGM VLYGWTDHSA CSPVCPAGME251 EKTLCECAGG LECACPALLE YARTCAQEGM VLYGWTDHSA CSPVCPAGME

301 YRQCVSPCAR TCQSLHINEM CQERCVDGCS CPEGQLLDEG LCVESTECPC 351 VHSGKRYPPG TSLSRDCNTC ICRNSQWICS NEECPGECLV TGQSHFKSFD301 YRQCVSPCAR TCQSLHINEM CQERCVDGCS CPEGQLLDEG LCVESTECPC 351 VHSGKRYPPG TSLSRDCNTC ICRNSQWICS NEECPGECLV TGQSHFKSFD

401 NRYFTFSGIC QYLLARDCQD HSFSIVIETV QCADDRDAVC TRSVTVRLPG401 NRYFTFSGIC QYLLARDCQD HSFSIVIETV QCADDRDAVC TRSVTVRLPG

451 LHNSLVKLKH GAGVAMDGQD IQLPLLKGDL RIQHTVTASV RLSYGEDLQM451 LHNSLVKLKH GAGVAMDGQD IQLPLLKGDL RIQHTVTASV RLSYGEDLQM

501 DWDGRGRLLV KLSPVYAGKT CGLCGNYNGN QGDDFLTPSG LAEPRVEDFG 5 51 NAWKLHGDCQ DLQKQHSDPC ALNPRMTRFS EEACAVLTSP TFEACHRAVS 601 PLPYLRNCRY DVCSCSDGRE CLCGALASYA AACAGRGVRV AWREPGRCEL501 DWDGRGRLLV KLSPVYAGKT CGLCGNYNGN QGDDFLTPSG LAEPRVEDFG 5 51 NAWKLHGDCQ DLQKQHSDPC ALNPRMTRFS EEACAVLTSP TFEACHRAVS 601 PLPYLRNCRY DVCSCSDGRE CLCGALASYA AACAGRGVRV AWREPGRCEL

- 129 044115- 129 044115

651 NCPKGQVYLQ CGTPCNLTCR SLSYPDEECN EACLEGCFCP PGLYMDERGD651 NCPKGQVYLQ CGTPCNLTCR SLSYPDEECN EACLEGCFCP PGLYMDERGD

701 CVPKAQCPCY YDGEIFQPED IFSDHHTMCY CEDGFMHCTM SGVPGSLLPD701 CVPKAQCPCY YDGEIFQPED IFSDHHTMCY CEDGFMHCTM SGVPGSLLPD

751 AVLSSPLSHR SKRSLSCRPP MVKLVCPADN LRAEGLECTK TCQNYDLECM751 AVLSSPLSHR SKRSLSCRPP MVKLVCPADN LRAEGLECTK TCQNYDLECM

801 SMGCVSGCLC PPGMVRHENR CVALERCPCF HQGKEYAPGE TVKIGCNTCV801 SMGCVSGCLC PPGMVRHENR CVALERCPCF HQGKEYAPGE TVKIGCNTCV

851 CRDRKWNCTD HVCDATCSTI GMAHYLTFDG LKYLFPGECQ YVLVQDYCGS851 CRDRKWNCTD HVCDATCSTI GMAHYLTFDG LKYLFPGECQ YVLVQDYCGS

901 NPGTFRILVG NKGCSHPSVK CKKRVTILVE GGEIELFDGE VNVKRPMKDE901 NPGTFRILVG NKGCSHPSVK CKKRVTILVE GGEIELFDGE VNVKRPMKDE

951 THFEVVESGR YIILLLGKAL SVVWDRHLSI SVVLKQTYQE KVCGLCGNFD951 THFEVVESGR YIILLLGKAL SVVWDRHLSI SVVLKQTYQE KVCGLCGNFD

1001 GIQNNDLTSS NLQVEEDPVD FGNSWKVSSQ CADTRKVPLD SSPATCHNNI 1051 MKQTMVDSSC RILTSDVFQD CNKLVDPEPY LDVCIYDTCS CESIGDCAAF 1101 CDTIAAYAHV CAQHGKVVTW RTATLCPQSC EERNLRENGY EAEWRYNSCA1001 GIQNNDLTSS NLQVEEDPVD FGNSWKVSSQ CADTRKVPLD SSPATCHNNI 1051 MKQTMVDSSC RILTSDVFQD CNKLVDPEPY LDVCIYDTCS CESIGDCAAF 1101 CDTIAAYAHV CAQHGKVVTW RTATLCPQSC EERNLRENGY EAEWRYNSCA

1151 PACQVTCQHP EPLACPVQCV EGCHAHCPPG KILDELLQTC VDPEDCPVCE 1201 VAGRRFASGK KVTLNPSDPE HCQICHCDVV NLTCEACQEPISGTSESATP 1251 ESGPGSEPAT SGSETPGTSE SATPESGPGS EPATSGSETP GTSESATPES1151 PACQVTCQHP EPLACPVQCV EGCHAHCPPG KILDELLQTC VDPEDCPVCE 1201 VAGRRFASGK KVTLNPSDPE HCQICHCDVV NLTCEACQEPISGTSESATP 1251 ESGPGSEPAT SGSETPGTSE SATPESGPGS EPATSGSETP GTSESATPES

1301 GPGTSTEPSE GSAPGSPAGS PTSTEEGTSE SATPESGPGS EPATSGSETP 1351 GTSESATPES GPGSPAGSPT STEEGSPAGS PTSTEEGTST EPSEGSAPGT1301 GPGTSTEPSE GSAPGSPAGS PTSTEEGTSE SATPESGPGS EPATSGSETP 1351 GTSESATPES GGPGSPAGSPT STEEGSPAGS PTSTEEGTST EPSEGSAPGT

1401 SESATPESGP GTSESATPES GPGTSESATP ESGPGSEPAT SGSETPGSEP 1451 ATSGSETPGS PAGSPTSTEE GTSTEPSEGS APGTSTEPSE GSAPGSEPAT1401 SESATPESGP GTSESATPES GPGTSESATP ESGPGSEPAT SGSETPGSEP 1451 ATSGSETPGS PAGSPTSTEE GTSTEPSEGS APGTSTEPSE GSAPGSEPAT

1501 SGSETPGTSE SATPESGPGT STEPSEGSAP DSGGGGSGGG GSGGGGSGGG 1551 GSGGGGSLVP RGSGGDKTHT CPPCPAPELL GGPSVFLFPP KPKDTLMASR1501 SGSETPGTSE SATPESGPGT STEPSEGSAP DSGGGGSGGG GSGGGGSGGG 1551 GSGGGGSLVP RGSGGDKTHT CPPCPAPELL GGPSVFLFPP KPKDTLMASR

1601 TPEVTCVVVD VSHEDPEVKF NWYVDGVEVH NAKTKPREEQ YNSTYRVVSV1601 TPEVTCVVVD VSHEDPEVKF NWYVDGVEVH NAKTKPREEQ YNSTYRVVSV

1651 LTVLAQDWLN GKEYKCKVSN KALPAPIEKT ISKAKGQPRE PQVYTLPPSR 1701 DELTKNQVSL TCLVKGFYPS DIAVEWESNG QPENNYKTTP PVLDSDGSFF1651 LTVLAQDWLN GKEYKCKVSN KALPAPIEKT ISKAKGQPRE PQVYTLPPSR 1701 DELTKNQVSL TCLVKGFYPS DIAVEWESNG QPENNYKTTP PVLDSDGSFF

1751 LYSKLTVDKS RWQQGNVFSC SVMHEALHNA YTQKSLSLSP GK* Нуклеотидная последовательность FVIII 169 (SEQ ID NO: 155).1751 LYSKLTVDKS RWQQGNVFSC SVMHEALHNA YTQKSLSLSP GK* Nucleotide sequence of FVIII 169 (SEQ ID NO: 155).

ATGCA AATAG AGCTC TCCAC CTGCT TCTTT CTGTG CCTTT TGCGA TTCTGATGCA AATAG AGCTC TCCAC CTGCT TCTTT CTGTG CCTTT TGCGA TTCTG

CTTTA GTGCC ACCAG AAGAT ACTAC CTGGG TGCAG TGGAA CTGTC ATGGGCTTTA GTGCC ACCAG AAGAT ACTAC CTGGG TGCAG TGGAA CTGTC ATGGG

101 АСТАТ ATGCA AAGTG ATCTC GGTGA GCTGC CTGTG GACGC AAGAT TTCCT101 ASTAT ATGCA AAGTG ATCTC GGTGA GCTGC CTGTG GACGC AAGAT TTCCT

151 CCTAG AGTGC CAAAA TCTTT TCCAT TCAAC ACCTC AGTCG TGTAC AAAAA151 CCTAG AGTGC CAAAA TCTTT TCCAT TCAAC ACCTC AGTCG TGTAC AAAAA

201 GACTC TGTTT GT AGA ATTCA CGGAT CACCT ТТТСА AC АТС GCT A A GCC A A201 GACTC TGTTT GT AGA ATTCA CGGAT CACCT TTTCA AC ATC GCT A A GCC A A

251 GGCCA CCCTG GATGG GTCTG CTAGG TCCTA CCАТС CAGGC TGAGG TTTAT251 GGCCA CCCTG GATGG GTCTG CTAGG TCCTA CCATS CAGGC TGAGG TTTAT

301 GAT AC AGTGG TCATT AC ACT TAAGA AC ATG GCTTC CCATC CTGTC AGTCT301 GAT AC AGTGG TCATT AC ACT TAAGA AC ATG GCTTC CCATC CTGTC AGTCT

351 TCATG CTGTT GGTGT ATCCT ACTGG AAAGC TTCTG AGGGA GCTGA ATATG351 TCATG CTGTT GGTGT ATCCT ACTGG AAAGC TTCTG AGGGA GCTGA ATATG

401 ATGAT CAGAC CAGTC A A AGG GAGA A AGA AG ATGAT AAAGT CTTCC CTGGT401 ATGAT CAGAC CAGTC A A AGG GAGA A AGA AG ATGAT AAAGT CTTCC CTGGT

451 GGAAG CCATA CAT AT GTCTG GCAGG TCCTG AAAGA GA ATG GTCCA ATGGC451 GGAAG CCATA CAT AT GTCTG GCAGG TCCTG AAAGA GA ATG GTCCA ATGGC

501 CTCTG ACCC A CTGTG CCTTA CCTAC TC AT A TCTTT CTCAT GTGGA CCTGG501 CTCTG ACCC A CTGTG CCTTA CCTAC TC AT A TCTTT CTCAT GTGGA CCTGG

- 130 044115- 130 044115

551 TAAAA GACTT GAATT CAGGC CTCAT TGGAG CCCTA CTAGT ATGTA GAGAA551 TAAAA GACTT GAATT CAGGC CTCAT TGGAG CCCTA CTAGT ATGTA GAGAA

601 GGGAG TCTGG CCA AG GAAAA GACAC AGACC TTGCA CAAAT TTATA CT ACT601 GGGAG TCTGG CCA AG GAAAA GACAC AGACC TTGCA CAAAT TTATA CT ACT

651 TTTTG CTGTA TTTGA TGAAG GGAAA AGTTG GCACT CAGAA AC AAA GAACT651 TTTTG CTGTA TTTGA TGAAG GGAAA AGTTG GCACT CAGAA AC AAA GAACT

701 CCTTG ATGC A GGAT A GGGAT GCTGC ATCTG CTCGG GCCTG GCCT A A A ATG701 CCTTG ATGC A GGAT A GGGAT GCTGC ATCTG CTCGG GCCTG GCCT A A A ATG

751 CACAC AGTCA ATGGT TATGT AAACA GGTCT CTGCC AGGTC TGATT GGATG751 CACAC AGTCA ATGGT TATGT AAACA GGTCT CTGCC AGGTC TGATT GGATG

801 CCACA GGAAA TCAGT CTATT GGCAT GTGAT TGGAA TGGGC ACCAC TCCTG801 CCACA GGAAA TCAGT CTATT GGCAT GTGAT TGGAA TGGGC ACCAC TCCTG

851 AAGTG CACTC AATAT TCCTC GAAGG TCACA CATTT CTTGT GAGGA АССАТ851 AAGTG CACTC AATAT TCCTC GAAGG TCACA CATTT CTTGT GAGGA ASSAT

901 CGCC A GGCT A GCTTG GA AAT CTCGC C A AT A ACTTT CCTT A CTGCT C A A AC901 CGCC A GGCT A GCTTG GA AAT CTCGC C A AT A ACTTT CCTT A CTGCT C A A AC

951 ACTCT TGATG GACCT TGGAC AGTTT CT ACT GTTTT GTCAT ATCTC TTCCC951 ACTCT TGATG GACCT TGGAC AGTTT CT ACT GTTTT GTCAT ATCTC TTCCC

1001 ACCAA CATGA TGGCA TGGAA GCTTA TGTCA AAGTA GACAG CTGTC CAGAG 1051 GAACC CCAAC TACGA ATGAA AAATA ATGAA GAAGC GGAAG АСТАТ GATGA 1101 TGATC TT ACT GATTC TGA A A TGGAT GTGGT C AGGT TTGAT GATGA C A ACT 1151 CTCCT TCCTT TATCC AAATT CGCTC AGTTG CCAAG AAGCA TCCTA AAACT 1201 TGGGT AC ATT AC ATT GCTGC TGAAG AGGAG GACTG GGACT ATGCT CCCTT 1251 AGTCC TCGCC CCCGA TGACA GAAGT TATAA AAGTC AATAT TTGAA CAATG 1301 GCCCT CAGCG GATTG GTAGG AAGTA CAAAA AAGTC CGATT TATGG CATAC 1351 AC AGA TGA A A CCTTT A AGAC TCGTG A AGCT ATTC A GC ATG А АТС A GGA AT 1401 CTTGG GACCT TT ACT TT ATG GGGA A GTTGG AGAC A C ACTG TTGAT TAT AT 1451 TTAAG А АТС A AGCA A GC AGA CC AT A T AACA TCT AC CCTC A CGGAA TCACT 1501 GATGT CCGTC CTTTG TATTC AAGGA GATTA CCAAA AGGTG TAAAA CATTT 1551 GAAGG ATTTT CCA AT TCTGC C AGGA GA A AT ATTC A AATAT A A ATG GAC AG 1601 TGACT GT AGA AGATG GGCCA ACT AA ATCAG ATCCT CGGTG CCTGA CCCGC 1651 ТАТТА CTCTA GTTTC GTTAA TATGG AGAGA GATCT AGCTT CAGGA CTCAT 1701 TGGCC CTCTC CTCAT CTGCT AC AAA GAATC TGT AG ATCAA AGAGG AAACC 1751 AGATA ATGTC AGACA AGAGG AATGT CATCC TGTTT TCTGT ATTTG ATGAG 1801 AACCG AAGCT GGTAC CTCAC AGAGA AT ATA CAACG CTTTC TCCCC AATCC 1851 AGCTG GAGTG C AGCT TGAGG ATCC A GAGTT CCA AG CCTCC AAC AT C ATGC 1901 ACAGC ATCAA TGGCT ATGTT TTTGA T AGTT TGC AG TTGTC AGTTT GTTTG 1951 CATGA GGTGG CATAC TGGTA CATTC TAAGC ATTGG AGCAC AGACT GACTT 2001 CCTTT CTGTC TTCTT CTCTG GAT AT ACCTT CAAAC AC AAA ATGGT CT ATG 2051 AAGAC AC ACT CACCC TATTC CCATT CTCAG GAGAA ACTGT CTTCA TGTCG 2101 ATGGA AAACC C AGGT CT ATG GATTC TGGGG TGCC A C A ACT C AGAC TTTCG 2151 GA AC A GAGGC ATGAC CGCCT T ACTG A AGGT TTCT A GTTGT GAC A A GA AC A 2201 CTGGT GATTA TT ACG AGGAC AGTT A TGAAG AT ATT TC AGC AT ACT TGCTG 2251 AGTAA AAACA ATGCC ATTGA ACCAA GAAGC TTCTC TCAAA ACGGC GCGCC 2301 AGGTA CCTCA GAGTC TGCTA CCCCC GAGTC AGGGC CAGGA TCAGA GCCAG 2351 CCACC TCCGG GTCTG AGACA CCCGG GACTT CCGAG AGTGC CACCC CTGAG 2401 TCCGG ACCCG GGTCC GAGCC CGCCA CTTCC GGCTC CGAAA CTCCC GGCAC1001 ACCAA CATGA TGGCA TGGAA GCTTA TGTCA AAGTA GACAG CTGTC CAGAG 1051 GAACC CCAAC TACGA ATGAA AAATA ATGAA GAAGC GGAAG ASTAT GATGA 1101 TGATC TT ACT GATTC TGA A A TGGAT GTGGT C AGGT TTGAT GATGA C A ACT 1151 CTCCT TCCTT TAT CC AAATT CGCTC AGTTG CCAAG AAGCA TCCTA AAACT 1201 TGGGT AC ATT AC ATT GCTGC TGAAG AGGAG GACTG GGACT ATGCT CCCTT 1251 AGTCC TCGCC CCCGA TGACA GAAGT TATAA AAGTC AATAT TTGAA CAATG 1301 GCCCT CAGCG GATTG GTAGG AAGTA CAAAA AAGTC CGATT TATGG CATAC 1351 AC AGA TGA A A CCTTT A AGAC TCGTG A AGCT ATTC A GC ATG A ATC A GGA AT 1401 CTTGG GACCT TT ACT TTH GGGA AGAC AGAC ACTG TTGAT TTAT AT 1451 TTAAG A AGCA AGCA AGA CC AACA TCTC ACTC ACTC TCACT 1501 GATGT CCGTC CTTTG TC ATTC AAGGA GATTA CCAAA AGGTG TAAAA CATTTTTTTTTH 1551 GAAGG ATTTT CCA AT TCTGC C AGGA GA A AT ATTC A AATAT A A ATG GAC AG 1601 TGACT GT AGA AGATG GGCCA ACT AA ATCAG ATCCT CGGTG CCTGA CCCGC 1651 TATTA CTCTA GTTTC GTTAA TATGG AGAGA GATCT AGCTT CAGGA CTCAT 1701 TGGCC CTCTC CTCAT CTGCT AC AAA GAATC TGT AG ATCAA AGAGG AAACC 1751 AGATA ATGTC AGACA AGAGG AATGT CATCC TGTTT TCTGT ATTTG ATGAG 1801 AACCG AAGCT GGTAC CTCAC AGAGA AT ATA CAACG CTTTC TCCCC AATCC 1851 AGCTG GAGTG C AGCT TGAGG ATCC A GAGTT CCA AG CCTCC AAC AT C ATGC 1901 ACAGC ATCAA TGGCT ATGTT TTTGA T AGTT TGC AG TTGTC AGTTTT GTTTG 1951 CATGA GGTGG CATAC TGGTA CATTC TAAGC ATTGG AGCAC AGACT GACTT 2001 CCTTT CTGTC TTCTT CTCTG GAT AT ACCTT CAAAC AC AAA ATGGT CT ATG 2051 AAGAC AC ACT CACCC TATTC CCATT CTCAG GAGAA ACTGT CTTCA TG TCG 2101 ATGGA AAACC C AGGT CT ATG GATTC TGGGG TGCC A C A ACT C AGAC TTTCG 2151 GA AC A GAGGC ATGAC CGCCT T ACTG A AGGT TTCT A GTTGT GAC A A GA AC A 2201 CTGGT GATTA TT ACG AGGAC AGTT A TGAAG AT ATT TC AGC AT ACT TGCTG 2251 AGTAA AAACA ATGCC ATTGA ACCAA GAA G.C. TTCTC TCAAA ACGGC GCGCC 2301 AGGTA CCTCA GAGTC TGCTA CCCCC GAGTC AGGGC CAGGA TCAGA GCCAG 2351 CCACC TCCGG GTCTG AGACA CCCGG GACTT CCGAG AGTGC CACCC CTGAG 2401 TCCGG ACCCG GGTCC GAGCC CGCCA CTTCC GGCTC CGAAA CTCCC GGCAC

- 131 044115- 131 044115

2451 AAGCG AGAGC GCT AC CCCAG AGTCA GGACC AGGAA CATCT AC AGA GCCCT 2501 CTGAA GGCTC CGCTC CAGGG TCCCC AGCCG GCAGT CCCAC TAGCA CCGAG 2551 GAGGG AACCT CTGAA AGCGC CACAC CCGAA TCAGG GCCAG GGTCT GAGCC 2601 TGCTA CCAGC GGC AG CGAGA САССА GGCAC CTCTG AGTCC GCCAC ACC AG 2651 AGTCC GGACC CGGAT CTCCC GCTGG GAGCC CCACC TCCAC TGAGG AGGGA 2701 TCTCC TGCTG GCTCT CCAAC ATCTA CTGAG GAAGG TACCT СAACC GAGCC2451 AAGCG AGAGC GCT AC CCCAG AGTCA GGACC AGGAA CATCT AC AGA GCCCT 2501 CTGAA GGCTC CGCTC CAGGG TCCCC AGCCG GCAGT CCCAC TAGCA CCGAG 2551 GAGGG AACCT CTGAA AGCGC CACAC CCGAA TCAGG GCCAG GGTCT GAGCC 2601 TGCTA CCAGC GGC AG CGAGA SASSA GGCAC CTCTG AGTCC GCCAC ACC AG 2651 AGTCC GGACC CGGAT CTCCC GCTGG GAGCC CCACC TCCAC TGAGG AGGGA 2701 TCTCC TGCTG GCTCT CCAAC ATCTA CTGAG GAAGG TACCT CAACC GAGCC

2751 ATCCG AGGGA TCAGC TCCCG GCACC TCAGA GTCGG CAACC CCGGA GTCTG 2801 GACCC GGAAC TTCCG AAAGT GCCAC ACCAG AGTCC GGTCC CGGGA CTTCA 2851 GAATC AGCAA CACCC GAGTC CGGCC CTGGG TCTGA ACCCG CCACA AGTGG 2901 TAGTG AGACA CCAGG ATCAG AACCT GCTAC CTCAG GGTCA GAGAC ACCCG 2951 GATCT CCGGC AGGCT САССА ACCTC CACTG AGGAG GGCAC CAGCA CAGAA 3001 CCAAG CGAGG GCTCC GCACC CGGAA CAAGC ACTGA ACCCA GTGAG GGTTC 3051 AGCAC CCGGC TCTGA GCCGG CCACA AGTGG CAGTG AGACA CCCGG CACTT 3101 CAGAG AGTGC CACCC CCGAG AGTGG CCCAG GCACT AGTAC CGAGC CCTCT 3151 GAAGG CAGTG CGCCA GCCTC GAGCC САССА GTCTT GAAAC GCCAT CAAGC 3201 TGAAA TAACT CGTAC TACTC TTCAG TCAGA TCAAG AGGAA ATCGA TTATG2751 ATCCG AGGGA TCAGC TCCCG GCACC TCAGA GTCGG CAACC CCGGA GTCTG 2801 GACCC GGAAC TTCCG AAAGT GCCAC ACCAG AGTCC GGTCC CGGGA CTTCA 2851 GAATC AGCAA CACCC GAGTC CGGCC CTGGG TCTGA ACCCG CCACA AGTGG 2901 TAGTG AGACA CCAGG A TCAG AACCT GCTAC CTCAG GGTCA GAGAC ACCCG 2951 GATCT CCGGC AGGCT SASSA ACCTC CACTG AGGAG GGCAC CAGCA CAGAA 3001 CCAAG CGAGG GCTCC GCACC CGGAA CAAGC ACTGA ACCCA GTGAG GGTTC 3051 AGCAC CCGGC TCTGA GCCGG CCACA AGTGG CAGTG AGACA CCCGG CACTT 3101 CAGAG AGTGC CACCC CCGAG AGTGG CCCAG GCACT AGTAC CGAGC C CTCT 3151 GAAGG CAGTG CGCCA GCCTC GAGCC SASSA GTCTT GAAAC GCCAT CAAGC 3201 TGAAA TAACT CGTAC TACTC TTCAG TCAGA TCAAG AGGAA ATCGA TTATG

3251 ATGAT ACCAT ATCAG TTGAA ATGAA GAAGG AAGAT TTTGA CATTT ATGAT 3301 GAGGA TGAAA ATCAG AGCCC CCGCA GCTTT CAAAA GAAAA CACGA CACTA 3351 TTTTA TTGCT GCAGT GGAGA GGCTC TGGGA TTATG GGATG AGTAG CTCCC 3401 CACAT GTTCT AAGAA ACAGG GCTCA GAGTG GCAGT GTCCC TCAGT TCAAG 3451 AAAGT TGTTT TCCAG GAATT TACTG ATGGC TCCTT TACTC AGCCC TTATA3251 ATGAT ACCAT ATCAG TTGAA ATGAA GAAGG AAGAT TTTGA CATTT ATGAT 3301 GAGGA TGAAA ATCAG AGCCC CCGCA GCTTT CAAAA GAAAA CACGA CACTA 3351 TTTTA TTGCT GCAGT GGAGA GGCTC TGGGA TTATG GGATG AGTAG CTCCC 3401 CACAT GTTCT AAGAA ACAGG G CTCA GAGTG GCAGT GTCCC TCAGT TCAAG 3451 AAAGT TGTTT TCCAG GAATT TACTG ATGGC TCCTT TACTC AGCCC TTATA

3501 CCGTG GAGAA СТАЛА TGAAC ATTTG GGACT CCTGG GGCCA TATAT AAGAG 3551 CAGAA GTTGA AGATA ATATC ATGGT AACTT TCAGA AATCA GGCCT CTCGT 3601 CCCTA TTCCT TCTAT TCTAG CCTTA TTTCT TATGA GGAAG ATCAG AGGCA 3651 AGGAG CAGAA CCTAG AAAAA ACTTT GTCAA GCCTA ATGAA ACCAA AACTT 3701 ACTTT TGGAA AGTGC AAC AT CAT AT GGCAC CCACT AAAGA TGAGT TTGAC 3751 TGCAA AGCCT GGGCT TATTT CTCTG ATGTT GACCT GGAAA AAGAT GTGCA 3801 CTCAG GCCTG ATTGG ACCCC TTCTG GTCTG CCACA CTAAC ACACT GAACC 3851 CTGCT CATGG GAGAC AAGTG ACAGT ACAGG AATTT GCTCT GTTTT TCACC 3901 ATCTT TGATG AGACC AAAAG CTGGT ACTTC ACTGA ΑΛΑΤΑ TGGAA AGAAA 3951 CTGCA GGGCT CCCTG CAATA TCCAG ATGGA AGATC CCACT TTTAA AGAGA3501 CCGTG GAGAA BECAME TGAAC ATTTG GGACT CCTGG GGCCA TATAT AAGAG 3551 CAGAA GTTGA AGATA ATATC ATGGT AACTT TCAGA AATCA GGCCT CTCGT 3601 CCCTA TTCCT TCTAT TCTAG CCTTA TTTCT TATGA GGAAG ATCAG AGGCA 3651 AGGAG CAGAA CCTAG AAA AA ACTTT GTCAA GCCTA ATGAA ACCAA AACTT 3701 ACTTT TGGAA AGTGC AAC AT CAT AT GGCAC CCACT AAAGA TGAGT TTGAC 3751 TGCAA AGCCT GGGCT TATTT CTCTG ATGTT GACCT GGAAA AAGAT GTGCA 3801 CTCAG GCCTG ATTGG ACCCC TTCTG GTCTG CCACA CTAAC ACACT GAACC 3851 CTGCT CATGG GAGAC AAGTG ACAGT ACAGG AATTT GCTCT GTTTT TCACC 3901 ATCTT TGATG AGACC AAAAG CTGGT ACTTC ACTGA ΑΛΑΤΑ TGGAA AGAAA 3951 CTGCA GGGCT CCCTG CAATA TCCAG ATGGA AGATC CCACT TTTAA AGAGA

4001 ATT AT CGCTT CCATG CAATC A ATGG СТАСА TAATG GAT AC ACT AC CTGGC 4051 TTAGT AATGG CTCAG GATCA AAGGA TTCGA TGGTA TCTGC TCAGC ATGGG 4101 CAGCA ATGAA A AC AT CC ATT CT ATT CATTT CAGTG GAC AT GTGTT CACTG 4151 TACGA AAAAA AGAGG AGT AT AAAAT GGCAC TGT AC A ATCT СТ АТС C AGGT 4201 GTTTT TGAGA CAGTG GAAAT GTTAC CATCC A A AGC TGGAA TTTGG CGGGT 4251 GGAAT GCCTT ATTGG CGAGC ATCTA CATGC TGGGA TGAGC ACACT TTTTC 4301 TGGTG TACAG CAATA AGTGT CAGAC TCCCC TGGGA ATGGC TTCTG GACAC4001 ATT AT CGCTT CCATG CAATC A ATGG STASA TAATG GAT AC ACT AC CTGGC 4051 TTAGT AATGG CTCAG GATCA AAGGA TTCGA TGGTA TCTGC TCAGC ATGGG 4101 CAGCA ATGAA A AC AT CC ATT CT ATT CATTT CAGTG GAC AT GTGTT CACTG 4151 TACGA AAAAA AGAGG AGT AT AAAAT GGCAC TGT AC A ATCT CT ATS C AGGT 4201 GTTTT TGAGA CAGTG GAAAT GTTAC CATCC A A AGC TGGAA TTTGG CGGGT 4251 GGAAT GCCTT ATTGG CGAGC ATCTA CATGC TGGGA TGAGC ACACT TTTTC 4301 TGGTG TACAG CAATA AGTGT CAGAC TCCCC TGGGA ATGGC TTCTG GACAC

- 132 044115- 132 044115

4351 ATT AG AGATT TTC AG ATT AC AGCTT C AGGA C A AT A TGGAC AGTGG GCCCC4351 ATT AG AGATT TTC AG ATT AC AGCTT C AGGA C A AT A TGGAC AGTGG GCCCC

4401 A A AGC TGGCC AGACT TCATT ATTCC GGATC А АТС A ATGCC TGGAG САССА4401 A A AGC TGGCC AGACT TCATT ATTCC GGATC A ATC A ATGCC TGGAG SASSA

4451 AGGAG CCCTT TTCTT GGATC AAGGT GGATC TGTTG GCACC AATGA TTATT 4501 CACGG CATCA AGACC CAGGG TGCCC GTCAG AAGTT CTCCA GCCTC TACAT4451 AGGAG CCCTT TTCTT GGATC AAGGT GGATC TGTTG GCACC AATGA TTATT 4501 CACGG CATCA AGACC CAGGG TGCCC GTCAG AAGTT CTCCA GCCTC TACAT

4551 CTCTC AGTTT АТС AT C ATGT AT AGT CTTGA TGGGA AGA AG TGGC A GACTT4551 CTCTC AGTTT ATS AT C ATGT AT AGT CTTGA TGGGA AGA AG TGGC A GACTT

4601 ATCGA GGAAA TTCCA CTGGA ACCTT AATGG TCTTC TTTGG CAATG TGGAT4601 ATCGA GGAAA TTCCA CTGGA ACCTT AATGG TCTTC TTTGG CAATG TGGAT

4651 TCATC TGGGA TAAAA CACAA TATTT TTAAC CCTCC AATTA TTGCT CGATA4651 TCATC TGGGA TAAAA CACAA TATTT TTAAC CCTCC AATTA TTGCT CGATA

4701 CATCC GTTTG CACCC AACTC ATT AT AGC AT TCGCA GCACT CTTCG CATGG4701 CATCC GTTTG CACCC AACTC ATT AT AGC AT TCGCA GCACT CTTCG CATGG

4751 AGTTG ATGGG CTGTG ATTTA AATAG TTGCA GCATG CCATT GGGAA TGGAG4751 AGTTG ATGGG CTGTG ATTTA AATAG TTGCA GCATG CCATT GGGAA TGGAG

4801 AGTAA AGCAA TATCA GATGC ACAGA TTACT GCTTC ATCCT ACTTT ACCAA4801 AGTAA AGCAA TATCA GATGC ACAGA TTACT GCTTC ATCCT ACTTT ACCAA

4851 TATGT TTGCC ACCTG GTCTC CTTCA AAAGC TCGAC TTCAC CTCCA AGGGA4851 TATGT TTGCC ACCTG GTCTC CTTCA AAAGC TCGAC TTCAC CTCCA AGGGA

4901 GGAGT AATGC CTGGA GACCT CAGGT GAATA ATCCA AAAGA GTGGC TGCAA4901 GGAGT AATGC CTGGA GACCT CAGGT GAATA ATCCA AAAGA GTGGC TGCAA

4951 GTGGA CTTCC AGAAG ACAAT GAAAG TCACA GGAGT AACTA CTCAG GGAGT4951 GTGGA CTTCC AGAAG ACAAT GAAAG TCACA GGAGT AACTA CTCAG GGAGT

5001 AAAAT CTCTG CTTAC CAGCA TGTAT GTGAA GGAGT TCCTC ATCTC CAGCA5001 AAAAT CTCTG CTTAC CAGCA TGTAT GTGAA GGAGT TCCTC ATCTC CAGCA

5051 GTCAA GATGG CCATC AGTGG ACTCT CTTTT TTCAG AATGG CAAAG TAAAG5051 GTCAA GATGG CCATC AGTGG ACTCT CTTTT TTCAG AATGG CAAAG TAAAG

5101 GTTTT TC AGG GA A AT C A AGA CTCCT TCACA CCTGT GGTGA ACTCT CT AGA5101 GTTTT TC AGG GA A AT C A AGA CTCCT TCACA CCTGT GGTGA ACTCT CT AGA

5151 CCCAC CGTTA CTGAC TCGCT ACCTT CGAAT TCACC CCCAG AGTTG GGTGC5151 CCCAC CGTTA CTGAC TCGCT ACCTT CGAAT TCACC CCCAG AGTTG GGTGC

5201 ACC AG ATTGC CCTGA GGATG GAGGT TCTGG GCTGC GAGGC AC AGG ACCTC5201 ACC AG ATTGC CCTGA GGATG GAGGT TCTGG GCTGC GAGGC AC AGG ACCTC

5251 TACGA CAAAA CTCAC ACATG CCCAC CGTGC CCAGC TCCAG AACTC CTGGG 5301 CGGAC CGTCA GTCTT CCTCT TCCCC CCAAA ACCCA AGGAC ACCCT CATGA 5351 TCTCC CGGAC CCCTG AGGTC ACATG CGTGG TGGTG GACGT GAGCC ACGAA5251 TACGA CAAAA CTCAC ACATG CCCAC CGTGC CCAGC TCCAG AACTC CTGGG 5301 CGGAC CGTCA GTCTT CCTCT TCCCC CCAAA ACCCA AGGAC ACCCT CATGA 5351 TCTCC CGGAC CCCTG AGGTC ACATG CGTGG TGGTG GACGT GAGCC ACGAA

5401 GACCC TGAGG TCAAG TTCAA CTGGT ACGTG GACGG CGTGG AGGTG CATAA5401 GACCC TGAGG TCAAG TTCAA CTGGT ACGTG GACGG CGTGG AGGTG CATAA

5451 TGCCA AGACA AAGCC GCGGG AGGAG CAGTA CAACA GCACG TACCG TGTGG5451 TGCCA AGACA AAGCC GCGGG AGGAG CAGTA CAACA GCACG TACCG TGTGG

5501 TCAGC GTCCT CACCG TCCTG САССА GGACT GGCTG AATGG CAAGG AGTAC5501 TCAGC GTCCT CACCG TCCTG SASSA GGACT GGCTG AATGG CAAGG AGTAC

5551 AAGTG CAAGG TCTCC AACAA AGCCC TCCCA GCCCC CATCG AGAAA АССАТ5551 AAGTG CAAGG TCTCC AACAA AGCCC TCCCA GCCCC CATCG AGAAA ASSAT

5601 CTCCA AAGCC AAAGG GCAGC CCCGA GAACC ACAGG TGTAC ACCCT GCCCC 5651 CATCC CGGGA TGAGC TGACC AAGAA CCAGG TCAGC CTGAC CTGCC TGGTC 5701 AAAGG CTTCT ATCCC AGCGA CATCG CCGTG GAGTG GGAGA GCA AT GGGCA 5751 GCCGG AGAAC AACTA CAAGA CCACG CCTCC CGTGT TGGAC TCCGA CGGCT5601 CTCCA AAGCC AAAGG GCAGC CCCGA GAACC ACAGG TGTAC ACCCT GCCCC 5651 CATCC CGGGA TGAGC TGACC AAGAA CCAGG TCAGC CTGAC CTGCC TGGTC 5701 AAAGG CTTCT ATCCC AGCGA CATCG CCGTG GAGTG GGAGA GCA AT GGGCA 5751 GCCGG AGAAC AACTA CAAGA CCACG CCTCC CGTGT TGGAC TCCGA CGGCT

5801 ССТТС TTCCT СТАСА GCAAG CTCAC CGTGG ACAAG AGCAG GTGGC AGCAG5801 STTTS TTCCT STASA GCAAG CTCAC CGTGG ACAAG AGCAG GTGGC AGCAG

5851 GGGAA CGTCT TCTC A TGCTC CGTGA TGC AT GAGGC TCTGC AC A AC C ACT A5851 GGGAA CGTCT TCTC A TGCTC CGTGA TGC AT GAGGC TCTGC AC A AC C ACT A

5901 CACGC AGAAG AGCCT CTCCC TGTCT CCGGG TAAAT GA5901 CACGC AGAAG AGCCT CTCCC TGTCT CCGGG TAAAT GA

Последовательность белка FVIII169 (SEQ ID NO: 70).FVIII169 protein sequence (SEQ ID NO: 70).

MQIELSTCFF LCLLRFCFSA TRRYYLGAVE LSWDYMQSDL GELPVDARFPMQIELSTCFF LCLLRFCFSA TRRYYLGAVE LSWDYMQSDL GELPVDARFP

PRVPKSFPFN TSVVYKKTLF VEFTDHLFNIAKPRPPWMGL LGPTIQAEVYPRVPKSFPFN TSVVYKKTLF VEFTDHLFNIAKPRPPWMGL LGPTIQAEVY

101 DTVVITLKNM ASHPVSLHAV GVSYWKASEG AEYDDQTSQR EKEDDKVFPG101 DTVVITLKNM ASHPVSLHAV GVSYWKASEG AEYDDQTSQR EKEDDKVFPG

- 133 044115- 133 044115

151 GSHTYVWQVL KENGPMASDP LCLTYSYLSH VDLVKDLNSG LIGALLVCRE151 GSHTYVWQVL KENGPMASDP LCLTYSYLSH VDLVKDLNSG LIGALLVCRE

201 GSLAKEKTQT LHKFILLFAV FDEGKSWHSE TKNSLMQDRD AASARAWPKM 251 HTVNGYVNRS LPGLIGCHRK SVYWHVIGMG TTPEVHSIFL EGHTFLVRNH 301 RQASLEISPI TFLTAQTLLM DLGQFLLFCH ISSHQHDGME AYVKVDSCPE 351 EPQLRMKNNE EAEDYDDDLT DSEMDVVRFD DDNSPSFIQI RSVAKKHPKT201 GSLAKEKTQT LHKFILLFAV FDEGKSWHSE TKNSLMQDRD AASARAWPKM 251 HTVNGYVNRS LPGLIGCHRK SVYWHVIGMG TTPEVHSIFL EGHTFLVRNH 301 RQASLEISPI TFLTAQTLLM DLGQFLLFCH ISSHQHDGME AYVKVDSCPE 351 EPQLRMKN NE EAEDYDDDLT DSEMDVVRFD DDNSPSFIQI RSVAKKHPKT

401 WVHYIAAEEE DWDYAPLVLA PDDRSYKSQY LNNGPQRIGR KYKKVRFMAY 451 TDETFKTREA IQHESGILGP LLYGEVGDTL LIIFKNQASR PYNIYPHGIT 501 DVRPLYSRRL PKGVKHLKDF PILPGEIFKY KWTVTVEDGP TKSDPRCLTR401 WVHYIAAEEE DWDYAPLVLA PDDRSYKSQY LNNGPQRIGR KYKKVRFMAY 451 TDETFKTREA IQHESGILGP LLYGEVGDTL LIIFKNQASR PYNIYPHGIT 501 DVRPLYSRRL PKGVKHLKDF PILPGEIFKY KWTVTVEDGP TKSDPRCLTR

551 YYSSFVNMER DLASGLIGPL LICYKESVDQ RGNQIMSDKR NVILFSVFDE551 YYSSFVNMER DLASGLIGPL LICYKESVDQ RGNQIMSDKR NVILFSVFDE

601 NRSWYLTENI QRFLPNPAGV QLEDPEFQAS NIMHSINGYV FDSLQLSVCL 651 HEVAYWYILS IGAQTDFLSV FFSGYTFKHK MVYEDTLTLF PFSGETVFMS601 NRSWYLTENI QRFLPNPAGV QLEDPEFQAS NIMHSINGYV FDSLQLSVCL 651 HEVAYWYILS IGAQTDFLSV FFSGYTFKHK MVYEDTLTLF PFSGETVFMS

701 MENPGLWILG CHNSDFRNRG MTALLKVSSC DKNTGDYYED SYEDISAYLL 751 SKNNAIEPRS FSQNGAPGTS ESATPESGPG SEPATSGSET PGTSESATPE 801 SGPGSEPATS GSETPGTSES ATPESGPGTS TEPSEGSAPG SPAGSPTSTE 851 EGTSESATPE SGPGSEPATS GSETPGTSES ATPESGPGSP AGSPTSTEEG701 MENPGLWILG CHNSDFRNRG MTALLKVSSC DKNTGDYYED SYEDISAYLL 751 SKNNAIEPRS FSQNGAPGTS ESATPESGPG SEPATSGSET PGTSESATPE 801 SGPGSEPATS GSETPGTSES ATPESGPGTS TEPSEGSAPG SPAGSPTSTE 851 EGTSESATPE SGPGSEPATS GSETPG TSES ATPESGPGSP AGSPTSTEEG

901 SPAGSPTSTE EGTSTEPSEG SAPGTSESAT PESGPGTSES ATPESGPGTS 951 ESATPESGPG SEPATSGSET PGSEPATSGS ETPGSPAGSP TSTEEGTSTE 1001 PSEGSAPGTS TEPSEGSAPG SEPATSGSET PGTSESATPE SGPGTSTEPS 1051 EGSAPASSPP VLKRHQAEIT RTTLQSDQEE IDYDDTISVE MKKEDFDIYD901 SPAGSPTSTE EGTSTEPSEG SAPGTSESAT PESGPGTSES ATPESGPGTS 951 ESATPESGPG SEPATSGSET PGSEPATSGS ETPGSPAGSP TSTEEGTSTE 1001 PSEGSAPGTS TEPSEGSAPG SEPATSGSET PGTSESATPE SGPGTSTEPS 1051 EGSAPASSPP VLKRHQAEIT RTTLQSDQEE IDYDDTISVE MKKEDFDIYD

1101 EDENQSPRSF QKKTRHYFIA AVERLWDYGM SSSPHVLRNR AQSGSVPQFK 1151 KVVFQEFTDG SFTQPLYRGE LNEHLGLLGP YIRAEVEDNI MVTFRNQASR1101 EDENQSPRSF QKKTRHYFIA AVERLWDYGM SSSPHVLRNR AQSGSVPQFK 1151 KVVFQEFTDG SFTQPLYRGE LNEHLGLLGP YIRAEVEDNI MVTFRNQASR

1201 PYSFYSSLIS YEEDQRQGAE PRKNFVKPNE TKTYFWKVQH HMAPTKDEFD1201 PYSFYSSLIS YEEDQRQGAE PRKNFVKPNE TKTYFWKVQH HMAPTKDEFD

1251 CKAWAYFSDV DLEKDVHSGL IGPLLVCHTN TLNPAHGRQV TVQEFALFFT1251 CKAWAYFSDV DLEKDVHSGL IGPLLVCHTN TLNPAHGRQV TVQEFALFFT

1301 IFDETKSWYF TENMERNCRA PCNIQMEDPT FKENYRFHAI NGYIMDTLPG1301 IFDETKSWYF TENMERNCRA PCNIQMEDPT FKENYRFHAI NGYIMDTLPG

1351 LVMAQDQRIR WYLLSMGSNE NIHSIHFSGH VFTVRKKEEY KMALYNLYPG1351 LVMAQDQRIR WYLLSMGSNE NIHSIHFSGH VFTVRKKEEY KMALYNLYPG

1401 VFETVEMLPS KAGIWRVECLIGEHLHAGMS TLFLVYSNKC QTPLGMASGH 1451 IRDFQITASG QYGQWAPKLA RLHYSGSINA WSTKEPFSWI KVDLLAPMII1401 VFETVEMLPS KAGIWRVECLIGEHLHAGMS TLFLVYSNKC QTPLGMASGH 1451 IRDFQITASG QYGQWAPKLA RLHYSGSINA WSTKEPFSWI KVDLLAPMII

1501 HGIKTQGARQ KFSSLYISQF IIMYSLDGKK WQTYRGNSTG TLMVFFGNVD1501 HGIKTQGARQ KFSSLYISQF IIMYSLDGKK WQTYRGNSTG TLMVFFGNVD

1551 SSGIKHNIFN PPIIARYIRL HPTHYSIRST LRMELMGCDL NSCSMPLGME 1601 SKAISDAQIT ASSYFTNMFA TWSPSKARLH LQGRSNAWRP QVNNPKEWLQ 1651 VDFQKTMKVT GVTTQGVKSL LTSMYVKEFL ISSSQDGHQW TLFFQNGKVK 1701 VFQGNQDSFT PVVNSLDPPL LTRYLRIHPQ SWVHQIALRM EVLGCEAQDL 1751 YDKTHTCPPC PAPELLGGPS VFLFPPKPKD TLMISRTPEV TCVVVDVSHE1551 SSGIKHNIFN PPIIARYIRL HPTHYSIRST LRMELMGCDL NSCSMPLGME 1601 SKAISDAQIT ASSYFTNMFA TWSPSKARLH LQGRSNAWRP QVNNPKEWLQ 1651 VDFQKTMKVT GVTTQGVKSL LTSMYVKEFL ISSSQDGHQW TLFFQNGKVK 1701 VF QGNQDSFT PVVNSLDPPL LTRYLRIHPQ SWVHQIALRM EVLGCEAQDL 1751 YDKTHTCPPC PAPELLGGPS VFLFPPKPKD TLMISRTPEV TCVVVDVSHE

1801 DPEVKFNWYV DGVEVHNAKT KPREEQYNST YRVVSVLTVL HQDWLNGKEY1801 DPEVKFNWYV DGVEVHNAKT KPREEQYNST YRVVSVLTVL HQDWLNGKEY

1851 KCKVSNKALP APIEKTIS KA KGQPREPQVY TLPPSRDELT KNQVSLTCLV1851 KCKVSNKALP APIEKTIS KA KGQPREPQVY TLPPSRDELT KNQVSLTCLV

1901 KGFYPSDIAV EWESNGQPEN NYKTTPPVLD SDGSFFLYSK LTVDKSRWQQ1901 KGFYPSDIAV EWESNGQPEN NYKTTPPVLD SDGSFFLYSK LTVDKSRWQQ

1951 GNVFSCSVMH EALHNHYTQK SLSLSPGK*1951 GNVFSCSVMH EALHNHYTQK SLSLSPGK*

- 134 044115- 134 044115

Нуклеотидная последовательность FVIII 263 (тройной мутант IHH) (SEQ ID NO: 156).Nucleotide sequence of FVIII 263 (IHH triple mutant) (SEQ ID NO: 156).

ATGCA AATAG AGCTC TCCAC CTGCT TCTTT CTGTG CCTTT TGCGA TTCTGATGCA AATAG AGCTC TCCAC CTGCT TCTTT CTGTG CCTTT TGCGA TTCTG

CTTTA GTGCC ACCAG AAGAT ACTAC CTGGG TGC AG TGGAA CTGTC ATGGGCTTTA GTGCC ACCAG AAGAT ACTAC CTGGG TGC AG TGGAA CTGTC ATGGG

101 АСТАТ ATGCA AGGCG CGCC A AC АТС AGAGA GCGCC ACCCC TGA A A GTGGT101 ASTAT ATGCA AGGCG CGCC A AC ATS AGAGA GCGCC ACCCC TGA A A GTGGT

151 CCCGG GAGCG AGCC A GCCAC ATCTG GGTCG GAAAC GCCAG GC AC A AGTGA151 CCCGG GAGCG AGCC A GCCAC ATCTG GGTCG GAAAC GCCAG GC AC A AGTGA

201 GTCTG CAACT CCCGA GTCCG GACCT GGCTC CGAGC CTGCC ACT AG CGGCT201 GTCTG CAACT CCCGA GTCCG GACCT GGCTC CGAGC CTGCC ACT AG CGGCT

251 CCGAG ACTCC GGGAA CTTCC GAGAG CGCTA САССА GAAAG CGGAC CCGGA251 CCGAG ACTCC GGGAA CTTCC GAGAG CGCTA SASSA GAAAG CGGAC CCGGA

301 ACCAG TACCG AACCT AGCGA GGGCT CTGCT CCGGG CAGCC CAGCC GGCTC301 ACCAG TACCG AACCT AGCGA GGGCT CTGCT CCGGG CAGCC CAGCC GGCTC

351 TCCTA CATCC ACGGA GGAGG GCACT TCCGA ATCCG CCACC CCGGA GTCAG351 TCCTA CATCC ACGGA GGAGG GCACT TCCGA ATCCG CCACC CCGGA GTCAG

401 GGCCA GGATC TGAAC CCGCT ACCTC AGGCA GTGAG ACGCC AGGAA CGAGC401 GGCCA GGATC TGAAC CCGCT ACCTC AGGCA GTGAG ACGCC AGGAA CGAGC

451 GAGTC CGCTA CACCG GAGAG TGGGC CAGGG AGCCC TGCTG GATCT CCTAC451 GAGTC CGCTA CACCG GAGAG TGGGC CAGGG AGCCC TGCTG GATCT CCTAC

501 GTCCA CTGAG GAAGG GTCAC CAGCG GGCTC GCCCA CCAGC ACTGA AGAAG501 GTCCA CTGAG GAAGG GTCAC CAGCG GGCTC GCCCA CCAGC ACTGA AGAAG

551 GTGCC TCGAG CAGTG ATCTC GGTGA GCTGC CTGTG GACGC AAGAT TTCCT 601 CCTAG AGTGC CAAAA TCTTT TCCAT TCAAC ACCTC AGTCG TGTAC AAAAA551 GTGCC TCGAG CAGTG ATCTC GGTGA GCTGC CTGTG GACGC AAGAT TTCCT 601 CCTAG AGTGC CAAAA TCTTT TCCAT TCAAC ACCTC AGTCG TGTAC AAAAA

651 GACTC TGTTT GT AGA ATTCA CGGAT CACCT TTTCA ACATC GCTAA GCCAA651 GACTC TGTTT GT AGA ATTCA CGGAT CACCT TTTCA ACATC GCTAA GCCAA

701 GGCCA CCCTG GATGG GTCTG CTAGG TCCTA CCАТС CAGGC TGAGG TTTAT701 GGCCA CCCTG GATGG GTCTG CTAGG TCCTA CCATS CAGGC TGAGG TTTAT

751 GAT AC AGTGG TCATT ACACT TAAGA ACATG GCTTC CCATC CTGTC AGTCT751 GAT AC AGTGG TCATT ACACT TAAGA ACATG GCTTC CCATC CTGTC AGTCT

801 TCATG CTGTT GGTGT ATCCT ACTGG AAAGC TTCTG AGGGA GCTGA ATATG801 TCATG CTGTT GGTGT ATCCT ACTGG AAAGC TTCTG AGGGA GCTGA ATATG

851 ATGAT CAGAC CAGTC AAAGG GAGAA AGAAG ATGAT AAAGT CTTCC CTGGT851 ATGAT CAGAC CAGTC AAAGG GAGAA AGAAG ATGAT AAAGT CTTCC CTGGT

901 GGA AG CC AT A CAT AT GTCTG GC AGG TCCTG A A AGA GA ATG GTCC A ATGGC901 GGA AG CC AT A CAT AT GTCTG GC AGG TCCTG A A AGA GA ATG GTCC A ATGGC

951 CTCTG ACCCA CTGTG CCTTA CCTAC TCATA TCTTT CTCAT GTGGA CCTGG951 CTCTG ACCCA CTGTG CCTTA CCTAC TCATA TCTTT CTCAT GTGGA CCTGG

1001 TAAAA GACTT GA ATT CAGGC CTCAT TGGAG CCCTA CT AGT ATGTA GAGAA1001 TAAAA GACTT GA ATT CAGGC CTCAT TGGAG CCCTA CT AGT ATGTA GAGAA

1051 GGGAG TCTGG CC AAG GAAAA GAC AC AGACC TTGC A C AAAT TT ATA CT ACT1051 GGGAG TCTGG CC AAG GAAAA GAC AC AGACC TTGC A C AAAT TT ATA CT ACT

1101 TTTTG CTGT A TTTGA TGA AG GGA A A AGTTG GCACT C AGA A AC A A A GA ACT1101 TTTTG CTGT A TTTGA TGA AG GGA A A AGTTG GCACT C AGA A AC A A A GA ACT

1151 CCTTG ATGCA GGATA GGGAT GCTGC ATCTG CTCGG GCCTG GCCTA AAATG1151 CCTTG ATGCA GGATA GGGAT GCTGC ATCTG CTCGG GCCTG GCCTA AAATG

1201 CACAC AGTCA ATGGT TATGT A A AC A GGTCT CTGCC AGGTC TGATT GGATG1201 CACAC AGTCA ATGGT TATGT A A AC A GGTCT CTGCC AGGTC TGATT GGATG

1251 CCACA GGAAA TCAGT CTATT GGCAT GTGAT TGGAA TGGGC ACCAC TCCTG1251 CCACA GGAAA TCAGT CTATT GGCAT GTGAT TGGAA TGGGC ACCAC TCCTG

1301 AAGTG CACTC AATAT TCCTC GAAGG TCACA CATTT CTTGT GAGGA АССАТ1301 AAGTG CACTC AATAT TCCTC GAAGG TCACA CATTT CTTGT GAGGA ASSAT

1351 CGCC A GGCT A GCTTG GA A AT CTCGC C A AT A ACTTT CCTTA CTGCT C A A AC1351 CGCC A GGCT A GCTTG GA A AT CTCGC C A AT A ACTTT CCTTA CTGCT C A A AC

1401 ACTCT TGATG GACCT TGGAC AGTTT CT ACT GTTTT GTCAT ATCTC TTCCC1401 ACTCT TGATG GACCT TGGAC AGTTT CT ACT GTTTT GTCAT ATCTC TTCCC

1451 ACCAA CATGA TGGCA TGGAA GCTTA TGTCA AAGTA GACAG CTGTC CAGAG1451 ACCAA CATGA TGGCA TGGAA GCTTA TGTCA AAGTA GACAG CTGTC CAGAG

1501 GAACC CCAAC TACGA ATGAA AAATA ATGAA GAAGC GGAAG АСТАТ GATGA 1551 TGATC TT ACT GATTC TGA A A TGGAT GTGGT C AGGT TTGAT GATGA CAACT1501 GAACC CCAAC TACGA ATGAA AAATA ATGAA GAAGC GGAAG ASTAT GATGA 1551 TGATC TT ACT GATTC TGA A A TGGAT GTGGT C AGGT TTGAT GATGA CAACT

1601 CTCCT TCCTT TATCC AAATT CGCTC AGTTG CCAAG AAGCA TCCTA AAACT1601 CTCCT TCCTT TATCC AAATT CGCTC AGTTG CCAAG AAGCA TCCTA AAACT

1651 TGGGT АСАТТ ACATT GCTGC TGAAG AGGAG GACTG GGACT ATGCT CCCTT1651 TGGGT ACATT ACATT GCTGC TGAAG AGGAG GACTG GGACT ATGCT CCCTT

1701 AGTCC TCGCC CCCGA TGACA GAAGT TATAA AAGTC AATAT TTGAA CAATG1701 AGTCC TCGCC CCCGA TGACA GAAGT TATAA AAGTC AATAT TTGAA CAATG

1751 GCCCT CAGCG GATTG GTAGG AAGTA CAAAA AAGTC CGATT TATGG CATAC1751 GCCCT CAGCG GATTG GTAGG AAGTA CAAAA AAGTC CGATT TATGG CATAC

- 135 044115- 135 044115

1801 ACAGA TGAAA CCTTT AAGAC TCGTG AAGCT ATTCA GCATG AATCA GGAAT1801 ACAGA TGAAA CCTTT AAGAC TCGTG AAGCT ATTCA GCATG AATCA GGAAT

1851 CTTGG GACCT TT ACT TT ATG GGGA A GTTGG AGAC A C ACTG TTGAT TAT AT1851 CTTGG GACCT TT ACT TT ATG GGGA A GTTGG AGAC A C ACTG TTGAT TAT AT

1901 TTAAG AATCA AGCA A GCAGA CC AT A T AACA ТСТ AC CCTC A CGGAA TCACT1901 TTAAG AATCA AGCA A GCAGA CC AT A T AACA TCT AC CCTC A CGGAA TCACT

1951 GATGT CCGTC CTTTG TATTC AAGGA GATTA CCAAA AGGTG TAAAA CATTT1951 GATGT CCGTC CTTTG TATTC AAGGA GATTA CCAAA AGGTG TAAAA CATTT

2001 GA AGG ATTTT CCA AT TCTGC CAGGA GA A AT ATTCA A AT AT A A ATG GAC AG2001 GA AGG ATTTT CCA AT TCTGC CAGGA GA A AT ATTCA A AT AT A A ATG GAC AG

2051 TGACT GT AGA AGATG GGCCA ACTAA ATCAG ATCCT CGGTG CCTGA CCCGC2051 TGACT GT AGA AGATG GGCCA ACTAA ATCAG ATCCT CGGTG CCTGA CCCGC

2101 ТАТТА CTCT A GTTTC GTT A A T ATGG AGAGA GATCT AGCTT CAGGA CTC AT2101 TATTA CTCT A GTTTC GTT A A T ATGG AGAGA GATCT AGCTT CAGGA CTC AT

2151 TGGCC CTCTC CTC AT CTGCT AC A A A GA ATC TGT AG ATC A A AGAGG A A ACC2151 TGGCC CTCTC CTC AT CTGCT AC A A A GA ATC TGT AG ATC A A AGAGG A A ACC

2201 AGATA ATGTC AGACA AGAGG AATGT CATCC TGTTT TCTGT ATTTG ATGAG2201 AGATA ATGTC AGACA AGAGG AATGT CATCC TGTTT TCTGT ATTTG ATGAG

2251 AACCG AAGCT GGT AC CTCAC AGAGA AT ATA CAACG CTTTC TCCCC AATCC2251 AACCG AAGCT GGT AC CTCAC AGAGA AT ATA CAACG CTTTC TCCCC AATCC

2301 AGCTG GAGTG CAGCT TGAGG ATCCA GAGTT CCAAG CCTCC AACAT CATGC2301 AGCTG GAGTG CAGCT TGAGG ATCCA GAGTT CCAAG CCTCC AACAT CATGC

2351 AC AGC ATC A A TGGCT ATGTT TTTGA T AGTT TGCAG TTGTC AGTTT GTTTG2351 AC AGC ATC A A TGGCT ATGTT TTTGA T AGTT TGCAG TTGTC AGTTT GTTTG

2401 CATGA GGTGG CAT AC TGGTA CATTC TA AGC ATTGG AGC AC AGACT GACTT2401 CATGA GGTGG CAT AC TGGTA CATTC TA AGC ATTGG AGC AC AGACT GACTT

2451 CCTTT CTGTC TTCTT CTCTG GAT AT ACCTT CAAAC AC AAA ATGGT CT ATG2451 CCTTT CTGTC TTCTT CTCTG GAT AT ACCTT CAAAC AC AAA ATGGT CT ATG

2501 AAGAC ACACT CACCC TATTC CCATT CTCAG GAGAA ACTGT CTTCA TGTCG2501 AAGAC ACACT CACCC TATTC CCATT CTCAG GAGAA ACTGT CTTCA TGTCG

2551 ATGGA A AACC CAGGT CT ATG GATTC TGGGG TGCC A C A ACT C AGAC TTTCG2551 ATGGA A AACC CAGGT CT ATG GATTC TGGGG TGCC A C A ACT C AGAC TTTCG

2601 GAACA GAGGC ATGAC CGCCT TACTG AAGGT TTCTA GTTGT GACAA GAACA2601 GAACA GAGGC ATGAC CGCCT TACTG AAGGT TTCTA GTTGT GACAA GAACA

2651 CTGGT GATTA TTACG AGGAC AGTTA TGAAG AT ATT TCAGC AT ACT TGCTG2651 CTGGT GATTA TTACG AGGAC AGTTA TGAAG AT ATT TCAGC AT ACT TGCTG

2701 AGTAA AAACA ATGCC ATTGA ACCAA GAAGC TTCTC TCAAA ACGGC GCGCC2701 AGTAA AAACA ATGCC ATTGA ACCAA GAAGC TTCTC TCAAA ACGGC GCGCC

2751 AGGTA CCTCA GAGTC TGCTA CCCCC GAGTC AGGGC CAGGA TCAGA GCCAG2751 AGGTA CCTCA GAGTC TGCTA CCCCC GAGTC AGGGC CAGGA TCAGA GCCAG

2801 CCACC TCCGG GTCTG AGACA CCCGG GACTT CCGAG AGTGC CACCC CTGAG2801 CCACC TCCGG GTCTG AGACA CCCGG GACTT CCGAG AGTGC CACCC CTGAG

2851 TCCGG ACCCG GGTCC GAGCC CGCCA CTTCC GGCTC CGAAA CTCCC GGCAC2851 TCCGG ACCCG GGTCC GAGCC CGCCA CTTCC GGCTC CGAAA CTCCC GGCAC

2901 AAGCG AGAGC GCTAC CCCAG AGTCA GGACC AGGAA CATCT ACAGA GCCCT2901 AAGCG AGAGC GCTAC CCCAG AGTCA GGACC AGGAA CATCT ACAGA GCCCT

2951 CTGAA GGCTC CGCTC CAGGG TCCCC AGCCG GCAGT CCCAC TAGCA CCGAG2951 CTGAA GGCTC CGCTC CAGGG TCCCC AGCCG GCAGT CCCAC TAGCA CCGAG

3001 GAGGG AACCT CTGAA AGCGC CACAC CCGAA TCAGG GCCAG GGTCT GAGCC3001 GAGGG AACCT CTGAA AGCGC CACAC CCGAA TCAGG GCCAG GGTCT GAGCC

3051 TGCTA CCAGC GGC AG CGAGA САССА GGC AC CTCTG AGTCC GCCAC ACC AG3051 TGCTA CCAGC GGC AG CGAGA SASSA GGC AC CTCTG AGTCC GCCAC ACC AG

3101 AGTCC GGACC CGGAT CTCCC GCTGG GAGCC CCACC TCCAC TGAGG AGGGA3101 AGTCC GGACC CGGAT CTCCC GCTGG GAGCC CCACC TCCAC TGAGG AGGGA

3151 TCTCC TGCTG GCTCT CCAAC ATCTA CTGAG GAAGG TACCT CAACC GAGCC3151 TCTCC TGCTG GCTCT CCAAC ATCTA CTGAG GAAGG TACCT CAACC GAGCC

3201 ATCCG AGGGA TCAGC TCCCG GCACC TCAGA GTCGG CAACC CCGGA GTCTG3201 ATCCG AGGGA TCAGC TCCCG GCACC TCAGA GTCGG CAACC CCGGA GTCTG

3251 GACCC GGAAC TTCCG AAAGT GCCAC ACC AG AGTCC GGTCC CGGGA CTTCA3251 GACCC GGAAC TTCCG AAAGT GCCAC ACC AG AGTCC GGTCC CGGGA CTTCA

3301 GAATC AGCAA CACCC GAGTC CGGCC CTGGG TCTGA ACCCG CCACA AGTGG3301 GAATC AGCAA CACCC GAGTC CGGCC CTGGG TCTGA ACCCG CCACA AGTGG

3351 TAGTG AGACA CCAGG ATCAG AACCT GCTAC CTCAG GGTCA GAGAC ACCCG3351 TAGTG AGACA CCAGG ATCAG AACCT GCTAC CTCAG GGTCA GAGAC ACCCG

3401 GATCT CCGGC AGGCT САССА ACCTC CACTG AGGAG GGCAC CAGCA CAGAA 3451 CCAAG CGAGG GCTCC GCACC CGGAA CAAGC ACTGA ACCCA GTGAG GGTTC 3501 AGCAC CCGGC TCTGA GCCGG CCACA AGTGG CAGTG AGACA CCCGG CACTT3401 GATCT CCGGC AGGCT SASSA ACCTC CACTG AGGAG GGCAC CAGCA CAGAA 3451 CCAAG CGAGG GCTCC GCACC CGGAA CAAGC ACTGA ACCCA GTGAG GGTTC 3501 AGCAC CCGGC TCTGA GCCGG CCACA AGTGG CAGTG AGACA CCCGG CACTT

3551 CAGAG AGTGC CACCC CCGAG AGTGG CCCAG GCACT AGTAC CGAGC CCTCT3551 CAGAG AGTGC CACCC CCGAG AGTGG CCCAG GCACT AGTAC CGAGC CCTCT

3601 GAAGG CAGTG CGCCA GCCTC GAGCC САССА GTCTT GAAAC GCCAT CAAGC3601 GAAGG CAGTG CGCCA GCCTC GAGCC SASSA GTCTT GAAAC GCCAT CAAGC

3651 TGAAA TAACT CGTAC TACTC TTCAG TCAGA TCAAG AGGAA ATCGA TTATG3651 TGAAA TAACT CGTAC TACTC TTCAG TCAGA TCAAG AGGAA ATCGA TTATG

- 136 044115- 136 044115

3701 ATGAT АССАТ АТС AG TTGAA ATGAA GAAGG AAGAT TTTGA CATTT ATGAT 3751 GAGGA TGAAA АТС AG AGCCC CCGCA GCTTT CAAAA GAAAA CACGA CACTA 3801 TTTTA TTGCT GCAGT GGAGA GGCTC TGGGA TTATG GGATG AGTAG CTCCC 3851 C AC AT GTTCT A AGA A AC AGG GCTC A GAGTG GCAGT GTCCC TC AGT TCA AG 3901 AAAGT TGTTT TCCAG GAATT T ACTG ATGGC TCCTT T ACTC AGCCC TT AT A 3951 CCGTG GAGAA CT AAA TGAAC ATTTG GGACT CCTGG GGCCA TAT AT AAGAG 4001 CAGAA GTTGA AGATA ATATC ATGGT AACTT TCAGA AATCA GGCCT CTCGT 4051 CCCTA TTCCT TCT AT TCTAG CCTTA TTTCT TATGA GGAAG АТС AG AGGCA3701 ATGAT ACCAT ATS AG TTGAA ATGAA GAAGG AAGAT TTTGA CATTT ATGAT 3751 GAGGA TGAAA ATS AG AGCCC CCGCA GCTTT CAAAA GAAAA CACGA CACTA 3801 TTTTA TTGCT GCAGT GGAGA GGCTC TGGGA TTATG GGATG AGTAG CTCCC 3851 C AC AT GTTCT A AGA A AC AGG GCTC A GAGTG GCAGT GTCCC TC AGT TCA AG 3901 AAAGT TGTTT TCCAG GAATT T ACTG ATGGC TCCTT T ACTC AGCCC TT AT A 3951 CCGTG GAGAA CT AAA TGAAC ATTTG GGACT CCTGG GGCCA TAT AT AAGAG 4001 CAGAA GTTGA AGATA ATATC ATGGT AACTT TCAGA AATCA GGCCT CTCGT 40 51 CCCTA TTCCT TCT AT TCTAG CCTTA TTTCT TATGA GGAAG ATS AG AGGCA

4101 AGGAG CAGAA CCT AG A A A A A ACTTT GTC A A GCCT A ATGAA ACC A A AACTT 4151 ACTTT TGGA A AGTGC A AC AT CAT AT GGC AC CC ACT A A AGA TGAGT TTGAC 4201 TGC A A AGCCT GGGCT TATTT CTCTG ATGTT GACCT GGA A A AAGAT GTGCA 4251 CTCAG GCCTG ATTGG ACCCC TTCTG GTCTG CCACA CTAAC ACACT GAACC 4301 CTGCT CATGG GAGAC AAGTG ACAGT ACAGG AATTT GCTCT GTTTT TCACC 4351 ATCTT TGATG AGACC A A AAG CTGGT ACTTC ACTGA A A AT A TGGA A AGA A A 4401 CTGCA GGGCT CCCTG CAATA TCCAG ATGGA AGATC CCACT TTT A A AGAGA 4451 ATT AT CGCTT CCATG CAATC AATGG СТАСА TAATG GAT AC ACTAC CTGGC 4501 TTAGT AATGG CTCAG GATCA AAGGA TTCGA TGGTA TCTGC TCAGC ATGGG 4551 C AGC A ATGAA A AC AT CC ATT CT ATT CATTT C AGTG GAC AT GTGTT C ACTG4101 AGGAG CAGAA CCT AG A A A A A ACTTT GTC A A GCCT A ATGAA ACC A A AACTT 4151 ACTTT TGGA A AGTGC A AC AT CAT AT GGC AC CC ACT A A AGA TGAGT TTGAC 4201 TGC A A AGCCT GGGCT TATTT CTCTG ATGTT GACCT GGA A A AAGAT GTGCA 4251 C TCAG GCCTG ATTGG ACCCC TTCTG GTCTG CCACA CTAAC ACACT GAACC 4301 CTGCT CATGG GAGAC AAGTG ACAGT ACAGG AATTT GCTCT GTTTT TCACC 4351 ATCTT TGATG AGACC A A AAG CTGGT ACTTC ACTGA A A AT A TGGA A AGA A A 4401 CTGCA GGGCT CCCTG CAATA TCCAG ATGGA AGATC CCACT T TT A A AGAGA 4451 ATT AT CGCTT CCATG CAATC AATGG STASA TAATG GAT AC ACTAC CTGGC 4501 TTAGT AATGG CTCAG GATCA AAGGA TTCGA TGGTA TCTGC TCAGC ATGGG 4551 C AGC A ATGAA A AC AT CC ATT CT ATT CATTT C AGTG GAC AT GTGTT C ACTG

4601 TACGA AAAAA AGAGG AGT AT AAAAT GGC AC TGT AC AATCT СТ АТС CAGGT 4651 GTTTT TGAGA CAGTG GAAAT GTTAC CATCC AAAGC TGGAA TTTGG CGGGT 4701 GGAAT GCCTT ATTGG CGAGC ATCTA CATGC TGGGA TGAGC ACACT TTTTC 4751 TGGTG TACAG CAATA AGTGT CAGAC TCCCC TGGGA ATGGC TTCTG GACAC 4801 ATTAG AGATT TTCAG ATTAC AGCTT CAGGA CAATA TGGAC AGTGG GCCCC 4851 AAAGC TGGCC AGACT TCATT ATTCC GGATC AATCA ATGCC TGGAG САССА 4901 AGGAG CCCTT TTCTT GGATC AAGGT GGATC TGTTG GCACC AATGA TTATT 4951 CACGG CATCA AGACC CAGGG TGCCC GTCAG AAGTT CTCCA GCCTC TACAT 5001 CTCTC AGTTT ATCAT CATGT ATAGT CTTGA TGGGA AGAAG TGGCA GACTT 5051 ATCGA GGAAA TTCCA CTGGA ACCTT AATGG TCTTC TTTGG CAATG TGGAT 5101 TC АТС TGGGA TA A A A C AC A A TATTT TTA AC CCTCC A ATT A TTGCT CGAT A 5151 CATCC GTTTG CACCC AACTC ATT AT AGC AT TCGC A GC ACT CTTCG CATGG 5201 AGTTG ATGGG CTGTG ATTTA AATAG TTGCA GCATG CCATT GGGAA TGGAG 5251 AGTAA AGCAA TATCA GATGC AC AGA TTACT GCTTC ATCCT ACTTT ACCAA 5301 TATGT TTGCC ACCTG GTCTC CTTCA AAAGC TCGAC TTCAC CTCCA AGGGA 5351 GGAGT AATGC CTGGA GACCT CAGGT GAATA ATCCA AAAGA GTGGC TGCAA 5401 GTGGA CTTCC AGAAG ACAAT GAAAG TCACA GGAGT AACTA CTCAG GGAGT 5451 AAAAT CTCTG CTTAC CAGCA TGTAT GTGAA GGAGT TCCTC ATCTC CAGCA 5501 GTCAA GATGG CCATC AGTGG ACTCT CTTTT TTCAG AATGG CAAAG TAAAG 5551 GTTTT TCAGG GAAAT CAAGA CTCCT TCACA CCTGT GGTGA ACTCT CTAGA4601 TACGA AAAAA AGAGG AGT AT AAAAT GGC AC TGT AC AATCT ST ATS CAGGT 4651 GTTTT TGAGA CAGTG GAAAT GTTAC CATCC AAAGC TGGAA TTTGG CGGGT 4701 GGAAT GCCTT ATTGG CGAGC ATCTA CATGC TGGGA TGAGC ACACT TTTTC 4751 TGGTG TACAG CAATA AGTGT CAGAC TCCCC TGGGA ATGGC TTCTG GACAC 4801 ATTAG AGATT TTCAG ATTAC AGCTT CAGGA CAATA TGGAC AGTGG GCCCC 4851 AAAGC TGGCC AGACT TCATT ATTCC GGATC AATCA ATGCC TGGAG SASSA 4901 AGGAG CCCTT TTCTT GGATC AAGGT GGATC TGTTG GCACC AATGA TTATT 4951 CACGG CATCA AGACC CAGGG TGCCC GTCAG AAGTT CTCCA GCCTC TACAT 5001 CTCTC AGTTT ATCAT CATGT ATAGT CTTGA TGGGA AGAAG TGGCA GACTT 5051 ATCGA GGAAA TTCCA CTGGA ACCTT AATGG TCTTC TTTGG CAATG TGGAT 5101 TC ATC TGGGA TA A A A C AC A A TATTT TTA AC CCTCC A ATT A TTGCT CGAT A 5151 CATCC GTTTG CACCC AACTC ATT AT AGC AT TCGC A GC ACT CTTCG CATGG 5201 AGTTG ATGGG CTGTG ATTTA AATAG TTGCA GCATG CCATT GGGAA TGGAG 5251 AGTAA AGCAA TATCA GATGC AC AGA TTACT GCTTC ATCCT ACTTT ACCAA 5301 TATGT TTGCC ACCTG GTCTC CTTCA AAAGC TCGAC TTCAC CTCCA AGGGA 5351 GGAGT AATGC CTGGA GACCT CAGGT GAATA ATCCA AAAGA GTGGC TGCAA 5401 GTGGA CTTCC AGAAG ACAAT GAAAG TCACA GGAGT AACTA CTCAG GGAGT 5451 AAAAT CTCTG CTTAC CAGCA TGTAT GTGAA GGAGT TCCTC ATCTC CAGCA 5501 GTCAA GATGG CCATC AGTGG ACTCT CTTTT TTCAG AATGG CAAAG TAAAG 5551 GTTTT TCAGG GAAAT CAAGA CTCCT TCACA CCTGT GGTGA ACTCT CTAGA

- 137 044115- 137 044115

5601 CCCAC CGTTA CTGAC TCGCT ACCTT CGAAT TCACC CCCAG AGTTG GGTGC5601 CCCAC CGTTA CTGAC TCGCT ACCTT CGAAT TCACC CCCAG AGTTG GGTGC

5651 ACC AG ATTGC CCTGA GGATG GAGGT TCTGG GCTGC GAGGC AC AGG ACCTC5651 ACC AG ATTGC CCTGA GGATG GAGGT TCTGG GCTGC GAGGC AC AGG ACCTC

5701 TACGA CAAAA CTCAC ACATG CCCAC CGTGC CCAGC TCCAG AACTC CTGGG5701 TACGA CAAAA CTCAC ACATG CCCAC CGTGC CCAGC TCCAG AACTC CTGGG

5751 CGGAC CGTCA GTCTT CCTCT TCCCC CCAAA ACCCA AGGAC ACCCT CATGG5751 CGGAC CGTCA GTCTT CCTCT TCCCC CCAAA ACCCA AGGAC ACCCT CATGG

5801 CCTCC CGGAC CCCTG AGGTC ACATG CGTGG TGGTG GACGT GAGCC ACGAA5801 CCTCC CGGAC CCCTG AGGTC ACATG CGTGG TGGTG GACGT GAGCC ACGAA

5851 GACCC TGAGG TC AAG TTC A A CTGGT ACGTG GACGG CGTGG AGGTG C AT AA5851 GACCC TGAGG TC AAG TTC A A CTGGT ACGTG GACGG CGTGG AGGTG C AT AA

5901 TGCCA AGACA AAGCC GCGGG AGGAG CAGTA CAACA GCACG TACCG TGTGG 5951 TCAGC GTCCT CACCG TCCTG GCCCA GGACT GGCTG AATGG CAAGG AGTAC5901 TGCCA AGACA AAGCC GCGGG AGGAG CAGTA CAACA GCACG TACCG TGTGG 5951 TCAGC GTCCT CACCG TCCTG GCCCA GGACT GGCTG AATGG CAAGG AGTAC

6001 AAGTG CAAGG TCTCC A AC A A AGCCC TCCCA GCCCC CATCG AGA A A АССАТ6001 AAGTG CAAGG TCTCC A AC A A AGCCC TCCCA GCCCC CATCG AGA A A ACCAT

6051 CTCCA AAGCC AAAGG GCAGC CCCGA GAACC ACAGG TGTAC ACCCT GCCCC6051 CTCCA AAGCC AAAGG GCAGC CCCGA GAACC ACAGG TGTAC ACCCT GCCCC

6101 C ATCC CGCGA TGAGC TGACC A AGA A CC AGG TCAGC CTGAC CTGCC TGGTC6101 C ATCC CGCGA TGAGC TGACC A AGA A CC AGG TCAGC CTGAC CTGCC TGGTC

6151 AAAGG CTTCT ATCCC AGCGA CATCG CCGTG GAGTG GGAGA GCA AT GGGCA6151 AAAGG CTTCT ATCCC AGCGA CATCG CCGTG GAGTG GGAGA GCA AT GGGCA

6201 GCCGG AGA AC A ACT A CAAGA CCACG CCTCC CGTGT TGGAC TCCGA CGGCT6201 GCCGG AGA AC A ACT A CAAGA CCACG CCTCC CGTGT TGGAC TCCGA CGGCT

6251 ССТТС TTCCT СТАСА GCAAG CTCAC CGTGG ACAAG AGCAG GTGGC AGCAG6251 CCTTS TTCCT STASA GCAAG CTCAC CGTGG ACAAG AGCAG GTGGC AGCAG

6301 GGGAA CGTCT TCTCA TGCTC CGTGA TGCAT GAGGC TCTGC ACAAC GCCTA6301 GGGAA CGTCT TCTCA TGCTC CGTGA TGCAT GAGGC TCTGC ACAAC GCCTA

6351 CACGC AGAAG AGCCT CTCCC TGTCT CCGGG TAAAT GA6351 CACGC AGAAG AGCCT CTCCC TGTCT CCGGG TAAAT GA

Последовательность белка FVIII 263 (тройной мутант IHH) (SEQ ID NO: 157).FVIII 263 protein sequence (IHH triple mutant) (SEQ ID NO: 157).

MQIELSTCFF LCLLRFCFSA TRRYYLGAVE LSWDYMQGAP TSESATPESGMQIELSTCFF LCLLRFCFSA TRRYYLGAVE LSWDYMQGAP TSESATPESG

PGSEPATSGS ETPGTSESAT PESGPGSEPA TSGSETPGTS ESATPESGPGPGSEPATSGS ETPGTSESAT PESGPGSEPA TSGSETPGTS ESATPESGPG

101 TSTEPSEGSA PGSPAGSPTS TEEGTSESAT PESGPGSEPA TSGSETPGTS101 TSTEPSEGSA PGSPAGSPTS TEEGTSESAT PESGPGSEPA TSGSETPGTS

151 ESATPESGPG SPAGSPTSTE EGSPAGSPTS TEEGASSSDL GELPVDARFP151 ESATPESGPG SPAGSPTSTE EGSPAGSPTS TEEGASSSDL GELPVDARFP

201 PRVPKSFPFN TSVVYKKTLF VEFTDHLFNI AKPRPPWMGL LGPTIQAEVY 251 DTVVITLKNM ASHPVSLHAV GVSYWKASEG AEYDDQTSQR EKEDDKVFPG201 PRVPKSFPFN TSVVYKKTLF VEFTDHLFNI AKPRPPWMGL LGPTIQAEVY 251 DTVVITLKNM ASHPVSLHAV GVSYWKASEG AEYDDQTSQR EKEDDKVFPG

301 GSHTYVWQVL KENGPMASDP LCLTYSYLSH VDLVKDLNSG LIGALLVCRE 351 GSLAKEKTQT LHKFILLFAV FDEGKSWHSE TKNSLMQDRD AASARAWPKM301 GSHTYVWQVL KENGPMASDP LCLTYSYLSH VDLVKDLNSG LIGALLVCRE 351 GSLAKEKTQT LHKFILLFAV FDEGKSWHSE TKNSLMQDRD AASARAWPKM

401 HTVNGYVNRS LPGLIGCHRK SVYWHVIGMG TTPEVHSIFL EGHTFLVRNH 451 RQASLEISPI TFLTAQTLLM DLGQFLLFCH ISSHQHDGME AYVKVDSCPE401 HTVNGYVNRS LPGLIGCHRK SVYWHVIGMG TTPEVHSIFL EGHTFLVRNH 451 RQASLEISPI TFLTAQTLLM DLGQFLLFCH ISSHQHDGME AYVKVDSCPE

501 EPQLRMKNNE EAEDYDDDLT DSEMDVVRFD DDNSPSFIQI RSVAKKHPKT 551 WVHYIAAEEE DWDYAPLVLA PDDRSYKSQY LNNGPQRIGR KYKKVRFMAY501 EPQLRMKNNE EAEDYDDDLT DSEMDVVRFD DDNSPSFIQI RSVAKKHPKT 551 WVHYIAAEEE DWDYAPLVLA PDDRSYKSQY LNNGPQRIGR KYKKVRFMAY

601 TDETFKTREA IQHESGILGP LLYGEVGDTL LIIFKNQASR PYNIYPHGIT601 TDETFKTREA IQHESGILGP LLYGEVGDTL LIIFKNQASR PYNIYPHGIT

651 DVRPLYSRRL PKGVKHLKDF PILPGEIFKY KWTVTVEDGP TKSDPRCLTR651 DVRPLYSRRL PKGVKHLKDF PILPGEIFKY KWTVTVEDGP TKSDPRCLTR

701 YYSSFVNMER DLASGLIGPL LICYKESVDQ RGNQIMSDKR NVILFSVFDE 751 NRSWYLTENI QRFLPNPAGV QLEDPEFQAS NIMHSINGYV FDSLQLSVCL701 YYSSFVNMER DLASGLIGPL LICYKESVDQ RGNQIMSDKR NVILFSVFDE 751 NRSWYLTENI QRFLPNPAGV QLEDPEFQAS NIMHSINGYV FDSLQLSVCL

801 HEVAYWYILS IGAQTDFLSV FFSGYTFKHK MVYEDTLTLF PFSGETVFMS 851 MENPGLWILG CHNSDFRNRG MTALLKVSSC DKNTGDYYED SYEDISAYLL801 HEVAYWYILS IGAQTDFLSV FFSGYTFKHK MVYEDTTLTLF PFSGETVFMS 851 MENPGLWILG CHNSDFRNRG MTALLKVSSC DKNTGDYYED SYEDISAYLL

901 SKNNAIEPRS FSQNGAPGTS ESATPESGPG SEPATSGSET PGTSESATPE901 SKNNAIEPRS FSQNGAPGTS ESATPESGPG SEPATSGSET PGTSESATPE

- 138 044115- 138 044115

951 SGPGSEPATS GSETPGTSES ATPESGPGTS TEPSEGSAPG SPAGSPTSTE951 SGPGSEPATS GSETPGTSES ATPESGPGTS TEPSEGSAPG SPAGSPTSTE

1001 EGTSESATPE SGPGSEPATS GSETPGTSES ATPESGPGSP AGSPTSTEEG1001 EGTSESATPE SGPGSEPATS GSETPGTSES ATPESGPGSP AGSPTSTEEG

1051 SPAGSPTSTE EGTSTEPSEG SAPGTSESAT PESGPGTSES ATPESGPGTS1051 SPAGSPTSTE EGTSTEPSEG SAPGTSESAT PESGPGTSES ATPESGPGTS

1101 ESATPESGPG SEPATSGSET PGSEPATSGS ETPGSPAGSP TSTEEGTSTE1101 ESATPESGPG SEPATSGSET PGSEPATSGS ETPGSPAGSP TSTEEGTSTE

1151 PSEGSAPGTS TEPSEGSAPG SEPATSGSET PGTSESATPE SGPGTSTEPS1151 PSEGSAPGTS TEPSEGSAPG SEPATSGSET PGTSESATPE SGPGTSTEPS

1201 EGSAPASSPP VLKRHQAEIT RTTLQSDQEE IDYDDTISVE MKKEDFDIYD1201 EGSAPASSPP VLKRHQAEIT RTTLQSDQEE IDYDDTISVE MKKEDFDIYD

1251 EDENQSPRSF QKKTRHYFIA AVERLWDYGM SSSPHVLRNR AQSGSVPQFK1251 EDENQSPRSF QKKTRHYFIA AVERLWDYGM SSSPHVLRNR AQSGSVPQFK

1301 KVVFQEFTDG SFTQPLYRGE LNEHLGLLGP YIRAEVEDNI MVTFRNQASR1301 KVVFQEFTDG SFTQPLYRGE LNEHLGLLGP YIRAEVEDNI MVTFRNQASR

1351 PYSFYSSLIS YEEDQRQGAE PRKNFVKPNE TKTYFWKVQH HMAPTKDEFD1351 PYSFYSSLIS YEEDQRQGAE PRKNFVKPNE TKTYFWKVQH HMAPTKDEFD

1401 CKAWAYFSDV DLEKDVHSGL IGPLLVCHTN TLNPAHGRQV TVQEFALFFT1401 CKAWAYFSDV DLEKDVHSGL IGPLLVCHTN TLNPAHGRQV TVQEFALFFT

1451 IFDETKSWYF TENMERNCRA PCNIQMEDPT FKENYRFHAI NGYIMDTLPG1451 IFDETKSWYF TENMERNCRA PCNIQMEDPT FKENYRFHAI NGYIMDTLPG

1501 LVMAQDQRIR WYLLSMGSNE NIHSIHFSGH VFTVRKKEEY KMALYNLYPG1501 LVMAQDQRIR WYLLSMGSNE NIHSIHFSGH VFTVRKKEEY KMALYNLYPG

1551 VFETVEMLPS KAGIWRVECL IGEHLHAGMS TLFLVYSNKC QTPLGMASGH1551 VFETVEMLPS KAGIWRVECL IGEHLHAGMS TLFLVYSNKC QTPLGMASGH

1601 IRDFQITASG QYGQWAPKLA RLHYSGSINA WSTKEPFSWI KVDLLAPMII1601 IRDFQITASG QYGQWAPKLA RLHYSGSINA WSTKEPFSWI KVDLLAPMII

1651 HGIKTQGARQ KFSSLYISQF IIMYSLDGKK WQTYRGNSTG TLMVFFGNVD1651 HGIKTQGARQ KFSSLYISQF IIMYSLDGKK WQTYRGNSTG TLMVFFGNVD

1701 SSGIKHNIFN PPIIARYIRL HPTHYSIRST LRMELMGCDL NSCSMPLGME1701 SSGIKHNIFN PPIIARYIRL HPTHYSIRST LRMELMGCDL NSSCSMPLGME

1751 SKAISDAQIT ASSYFTNMFA TWSPSKARLH LQGRSNAWRP QVNNPKEWLQ1751 SKAISDAQIT ASSYFTNMFA TWSPSKARLH LQGRSNAWRP QVNNPKEWLQ

1801 VDFQKTMKVT GVTTQGVKSL LTSMYVKEFL ISSSQDGHQW TLFFQNGKVK1801 VDFQKTMKVT GVTTQGVKSL LTSMYVKEFL ISSSQDGHQW TLFFQNGKVK

1851 VFQGNQDSFT PVVNSLDPPL LTRYLRIHPQ SWVHQIALRM EVLGCEAQDL1851 VFQGNQDSFT PVVNSLDPPL LTRYLRIHPQ SWVHQIALRM EVLGCEAQDL

1901 YDKTHTCPPC PAPELLGGPS VFLFPPKPKD TLMASRTPEV TCVVVDVSHE1901 YDKTHTCPPC PAPELLGGPS VFLFPPKPKD TLMASRTPEV TCVVVDVSHE

1951 DPEVKFNWYV DGVEVHNAKT KPREEQYNST YRVVSVLTVL AQDWLNGKEY1951 DPEVKFNWYV DGVEVHNAKT KPREEQYNST YRVVSVLTVL AQDWLNGKEY

2001 KCKVSNKALP APIEKTISKA KGQPREPQVY TLPPSRDELT KNQVSLTCLV2001 KCKVSNKALP APIEKTISKA KGQPREPQVY TLPPSRDELT KNQVSLTCLV

2051 KGFYPSDIAV EWESNGQPEN NYKTTPPVLD SDGSFFLYSK LTVDKSRWQQ2051 KGFYPSDIAV EWESNGQPEN NYKTTPPVLD SDGSFFLYSK LTVDKSRWQQ

2101 GNVFSCSVMH EALHNAYTQK SLSLSPGK*2101 GNVFSCSVMH EALHNAYTQK SLSLSPGK*

Нуклеотидная последовательность FVIII 282 (SEQ ID NO: 158).Nucleotide sequence of FVIII 282 (SEQ ID NO: 158).

ATGCA AATAG AGCTC TCCAC CTGCT TCTTT CTGTG CCTTT TGCGA TTCTGATGCA AATAG AGCTC TCCAC CTGCT TCTTT CTGTG CCTTT TGCGA TTCTG

CTTTA GTGCC ACCAG AAGAT ACTAC CTGGG TGCAG TGGAA CTGTC ATGGGCTTTA GTGCC ACCAG AAGAT ACTAC CTGGG TGCAG TGGAA CTGTC ATGGG

101 АСТАТ ATGCA AAGTG ATCTC GGTGA GCTGC CTGTG GACGC AAGAT TTCCT101 ASTAT ATGCA AAGTG ATCTC GGTGA GCTGC CTGTG GACGC AAGAT TTCCT

151 CCTAG AGTGC CAAAA TCTTT TCCAT TCAAC ACCTC AGTCG TGTAC AAAAA 201 GACTC TGTTT GT AGA ATTCA CGGAT CACCT TTTCA ACATC GCT A A GCC A A 251 GGCCA CCCTG GATGG GTCTG CTAGG TCCTA CCATC CAGGC TGAGG TTTAT 301 GATAC AGTGG TCATT ACACT TAAGA ACATG GCTTC CCATC CTGTC AGTCT151 CCTAG AGTGC CAAAA TCTTT TCCAT TCAAC ACCTC AGTCG TGTAC AAAAA 201 GACTC TGTTT GT AGA ATTCA CGGAT CACCT TTTCA ACATC GCT A A GCC A A 251 GGCCA CCCTG GATGG GTCTG CTAGG TCCTA CCATC CAGGC TGAGG TTTAT 301 GATAC AGTGG TCATT ACACT TAAGA ACATG GCTTC CCATC CTGTC AGTCT

51 TCATG CTGTT GGTGT ATCCT ACTGG AAAGC TTCTG AGGGA GCTGA ATATG51 TCATG CTGTT GGTGT ATCCT ACTGG AAAGC TTCTG AGGGA GCTGA ATATG

401 ATGAT CAGAC CAGTC A A AGG GAGA A AGA AG ATGAT AAAGT CTTCC CTGGT401 ATGAT CAGAC CAGTC A A AGG GAGA A AGA AG ATGAT AAAGT CTTCC CTGGT

451 GGAAG CCATA CAT AT GTCTG GCAGG TCCTG AAAGA GA ATG GTCCA ATGGC451 GGAAG CCATA CAT AT GTCTG GCAGG TCCTG AAAGA GA ATG GTCCA ATGGC

501 CTCTG ACCCA CTGTG CCTTA CCTAC TCATA TCTTT CTCAT GTGGA CCTGG501 CTCTG ACCCA CTGTG CCTTA CCTAC TCATA TCTTT CTCAT GTGGA CCTGG

- 139 044115- 139 044115

551 TAAAA GACTT GAATT CAGGC CTCAT TGGAG CCCTA CTAGT ATGTA GAGAA551 TAAAA GACTT GAATT CAGGC CTCAT TGGAG CCCTA CTAGT ATGTA GAGAA

601 GGGAG TCTGG CCA AG GAAAA GAC AC AGACC TTGCA CAAAT TTATA CT ACT601 GGGAG TCTGG CCA AG GAAAA GAC AC AGACC TTGCA CAAAT TTATA CT ACT

651 TTTTG CTGTA TTTGA TGAAG GGAAA AGTTG GCACT CAGAA AC AAA GAACT651 TTTTG CTGTA TTTGA TGAAG GGAAA AGTTG GCACT CAGAA AC AAA GAACT

701 CCTTG ATGC A GGAT A GGGAT GCTGC ATCTG CTCGG GCCTG GCCT A A A ATG701 CCTTG ATGC A GGAT A GGGAT GCTGC ATCTG CTCGG GCCTG GCCT A A A ATG

751 CACAC AGTCA ATGGT TATGT AAACA GGTCT CTGCC AGGTC TGATT GGATG751 CACAC AGTCA ATGGT TATGT AAACA GGTCT CTGCC AGGTC TGATT GGATG

801 CCACA GGAAA TCAGT CTATT GGCAT GTGAT TGGAA TGGGC ACCAC TCCTG801 CCACA GGAAA TCAGT CTATT GGCAT GTGAT TGGAA TGGGC ACCAC TCCTG

851 AAGTG CACTC AATAT TCCTC GAAGG TCACA CATTT CTTGT GAGGA ACCAT851 AAGTG CACTC AATAT TCCTC GAAGG TCACA CATTT CTTGT GAGGA ACCAT

901 CGCC A GGCT A GCTTG GA AAT CTCGC C A AT A ACTTT CCTT A CTGCT CAA AC901 CGCC A GGCT A GCTTG GA AAT CTCGC C A AT A ACTTT CCTT A CTGCT CAA AC

951 ACTCT TGATG GACCT TGGAC AGTTT CT ACT GTTTT GTC AT ATCTC TTCCC951 ACTCT TGATG GACCT TGGAC AGTTT CT ACT GTTTT GTC AT ATCTC TTCCC

1001 ACCAA CATGA TGGCA TGGAA GCTTA TGTCA AAGTA GACAG CTGTC CAGAG 1051 GAACC CCAAC TACGA ATGAA AAATA ATGAA GAAGC GGAAG АСТАТ GATGA 1101 TGATC TT ACT GATTC TGA A A TGGAT GTGGT C AGGT TTGAT GATGA C A ACT 1151 CTCCT TCCTT TATCC AAATT CGCTC AGTTG CCAAG AAGCA TCCTA AAACT 1201 TGGGT AC ATT AC ATT GCTGC TGAAG AGGAG GACTG GGACT ATGCT CCCTT 1251 AGTCC TCGCC CCCGA TGACA GAAGT TATAA AAGTC AATAT TTGAA CAATG 1301 GCCCT CAGCG GATTG GTAGG AAGTA CAAAA AAGTC CGATT TATGG CATAC 1351 AC AGA TGA A A CCTTT A AGAC TCGTG A AGCT ATTC A GC ATG А АТС A GGA AT 1401 CTTGG GACCT TT ACT TT ATG GGGA A GTTGG AGAC A C ACTG TTGAT TAT AT 1451 TTAAG А АТС A AGCA A GC AGA CC AT A T AACA TCT AC CCTC A CGGAA TCACT 1501 GATGT CCGTC CTTTG TATTC AAGGA GATTA CCAAA AGGTG TAAAA CATTT 1551 GAAGG ATTTT CCA AT TCTGC C AGGA GA A AT ATTC A A AT AT A A ATG GAC AG 1601 TGACT GT AGA AGATG GGCCA ACT AA ATCAG ATCCT CGGTG CCTGA CCCGC 1651 ТАТТА CTCTA GTTTC GTTAA TATGG AGAGA GATCT AGCTT CAGGA CTCAT 1701 TGGCC CTCTC CTCAT CTGCT AC AAA GAATC TGT AG ATCAA AGAGG AAACC 1751 AGATA ATGTC AGACA AGAGG AATGT CATCC TGTTT TCTGT ATTTG ATGAG 1801 AACCG AAGCT GGT AC CTCAC AGAGA AT ATA CAACG CTTTC TCCCC AATCC 1851 AGCTG GAGTG C AGCT TGAGG ATCC A GAGTT CCA AG CCTCC AAC AT C ATGC 1901 AC AGC ATCAA TGGCT ATGTT TTTGA T AGTT TGC AG TTGTC AGTTT GTTTG 1951 CATGA GGTGG CATAC TGGTA CATTC TAAGC ATTGG AGCAC AGACT GACTT 2001 CCTTT CTGTC TTCTT CTCTG GAT AT ACCTT CAAAC AC AAA ATGGT CT ATG 2051 AAGAC AC ACT CACCC TATTC CCATT CTC AG GAGAA ACTGT CTTCA TGTCG 2101 ATGGA AAACC C AGGT CT ATG GATTC TGGGG TGCC A C A ACT C AGAC TTTCG 2151 GA AC A GAGGC ATGAC CGCCT T ACTG A AGGT TTCT A GTTGT GAC A A GA AC A 2201 CTGGT GATTA TT ACG AGGAC AGTT A TGAAG AT ATT TC AGC AT ACT TGCTG 2251 AGTAA AAACA ATGCC ATTGA ACCAA GAAGC TTCTC TCAAA ACGGC GCGCC 2301 AACAT CAGAG AGCGC CACCC CTGAA AGTGG TCCCG GGAGC GAGCC AGCCA 2351 С ATCT GGGTC GGAAA CGCC A GGC AC AAGTG AGTCT GCA AC TCCCG AGTCC 2401 GGACC TGGCT CCGAG CCTGC CACTA GCGGC TCCGA GACTC CGGGA ACTTC1001 ACCAA CATGA TGGCA TGGAA GCTTA TGTCA AAGTA GACAG CTGTC CAGAG 1051 GAACC CCAAC TACGA ATGAA AAATA ATGAA GAAGC GGAAG ASTAT GATGA 1101 TGATC TT ACT GATTC TGA A A TGGAT GTGGT C AGGT TTGAT GATGA C A ACT 1151 CTCCT TCCTT TAT CC AAATT CGCTC AGTTG CCAAG AAGCA TCCTA AAACT 1201 TGGGT AC ATT AC ATT GCTGC TGAAG AGGAG GACTG GGACT ATGCT CCCTT 1251 AGTCC TCGCC CCCGA TGACA GAAGT TATAA AAGTC AATAT TTGAA CAATG 1301 GCCCT CAGCG GATTG GTAGG AAGTA CAAAA AAGTC CGATT TATGG CATAC 1351 AC AGA TGA A A CCTTT A AGAC TCGTG A AGCT ATTC A GC ATG A ATC A GGA AT 1401 CTTGG GACCT TT ACT TTH GGGA AGAC AGAC ACTG TTGAT TTAT AT 1451 TTAAG A AGCA AGCA AGA CC AACA TCTC ACTC ACTC TCACT 1501 GATGT CCGTC CTTTG TC ATTC AAGGA GATTA CCAAA AGGTG TAAAA CATTTTTTTTTH 1551 GAAGG ATTTT CCA AT TCTGC C AGGA GA A AT ATTC A A AT AT A A ATG GAC AG 1601 TGACT GT AGA AGATG GGCCA ACT AA ATCAG ATCCT CGGTG CCTGA CCCGC 1651 TATTA CTCTA GTTTC GTTAA TATGG AGAGA GATCT AGCTT CAGGA CTCAT 1701 TGGCC CTCTC CTCAT CTGCT AC AAA GAATC TGT AG ATCAA AGAGG AAACC 1751 AGATA ATGTC AGACA AGAGG AATGT CATCC TGTTT TCTGT ATTTG ATGAG 1801 AACCG AAGCT GGT AC CTCAC AGAGA AT ATA CAACG CTTTC TCCCC AATCC 1851 AGCTG GAGTG C AGCT TGAGG ATCC A GAGTT CCA AG CCTCC AAC AT C ATGC 1901 AC AGC ATCAA TGGCT ATGTT TTTGA T AGTT TGC AG TTGTC AGTTT GTTTG 1951 CATGA GGTGG CATAC TGGTA CATTC TAAGC ATTGG AGCAC AGACT GACTT 2001 CCTTT CTGTC TTCTT CTCTG GAT AT ACCTT CAAAC AC AAA ATGGT CT ATG 2051 AAGAC AC ACT CACCC TATTC CCATT CTC AG GAGAA ACTGT CTTCA TGTCG 2101 ATGGA AAACC C AGGT CT ATG GATTC TGGGG TGCC A C A ACT C AGAC TTTCG 2151 GA AC A GAGGC ATGAC CGCCT T ACTG A AGGT TTCT A GTTGT GAC A A GA AC A 2201 CTGGT GATTA TT ACG AGGAC AGTT A TGAAG AT ATT TC AGC AT ACT TGCTG 2251 AGTAA AAACA ATGCC ATTGA ACCAA GAAGC TTCTC TCAAA ACGGC GCGCC 2301 AACAT CAGAG AGCGC CACCC CTGAA AGTGG TCCCG GGAGC GAGCC AGCCA 2351 C ATCT GGGTC GGAAA CGCC A GGC AC AAGTG AGTCT GCA AC TCCCG AGTCC 2401 GGACC TGGCT CCGAG CCTGC CACTA GCGGC TCC GA GACTC CGGGA ACTTC

- 140 044115- 140 044115

2451 CGAGA GCGCT ACACC AGAAA GCGGA CCCGG AACCA GT ACC GAACC TAGCG2451 CGAGA GCGCT ACACC AGAAA GCGGA CCCGG AACCA GT ACC GAACC TAGCG

2501 AGGGC TCTGC TCCGG GCAGC CCAGC CGGCT CTCCT ACATC CACGG AGGAG2501 AGGGC TCTGC TCCGG GCAGC CCAGC CGGCT CTCCT ACATC CACGG AGGAG

2551 GGCAC TTCCG AATCC GCCAC CCCGG AGTCA GGGCC AGGAT CTGAA CCCGC2551 GGCAC TTCCG AATCC GCCAC CCCGG AGTCA GGGCC AGGAT CTGAA CCCGC

2601 TACCT CAGGC AGTGA GACGC CAGGA ACGAG CGAGT CCGCT ACACC GGAGA 2651 GTGGG CCAGG GAGCC CTGCT GGATC TCCTA CGTCC ACTGA GGAAG GGTCA 2701 CCAGC GGGCT CGCCC ACC AG CACTG AAGAA GGTGC CTCGA GCCCA CCAGT2601 TACCT CAGGC AGTGA GACGC CAGGA ACGAG CGAGT CCGCT ACACC GGAGA 2651 GTGGG CCAGG GAGCC CTGCT GGATC TCCTA CGTCC ACTGA GGAAG GGTCA 2701 CCAGC GGGCT CGCCC ACC AG CACTG AAGAA GGTGC CTCGA GCCCA CCAGT

2751 CTTGA AACGC CATCA AGCTG AAATA ACTCG TACTA CTCTT CAGTC AGATC2751 CTTGA AACGC CATCA AGCTG AAATA ACTCG TACTA CTCTT CAGTC AGATC

2801 AAGAG GAAAT CGATT ATGAT GATAC CATAT CAGTT GAAAT GAAGA AGGAA2801 AAGAG GAAAT CGATT ATGAT GATAC CATAT CAGTT GAAAT GAAGA AGGAA

2851 GATTT TGACA TTTAT GATGA GGATG AAAAT CAGAG CCCCC GCAGC TTTCA2851 GATTT TGACA TTTAT GATGA GGATG AAAAT CAGAG CCCCC GCAGC TTTCA

2901 AAAGA AAACA CGACA CT ATT TTATT GCTGC AGTGG AGAGG CTCTG GGATT2901 AAAGA AAACA CGACA CT ATT TTATT GCTGC AGTGG AGAGG CTCTG GGATT

2951 ATGGG ATGAG TAGCT CCCCA CATGT TCTAA GAAAC AGGGC TCAGA GTGGC2951 ATGGG ATGAG TAGCT CCCCA CATGT TCTAA GAAAC AGGGC TCAGA GTGGC

3001 AGTGT CCCTC AGTTC AAGAA AGTTG TTTTC CAGGA ATTTA CTGAT GGCTC3001 AGTGT CCCTC AGTTC AAGAA AGTTG TTTTC CAGGA ATTTA CTGAT GGCTC

3051 CTTTA CTCAG CCCTT AT ACC GTGGA GAACT AAATG AAC AT TTGGG ACTCC3051 CTTTA CTCAG CCCTT AT ACC GTGGA GAACT AAATG AAC AT TTGGG ACTCC

3101 TGGGG CC AT A TAT A A GAGC A GA AGT TGA AG AT A AT АТС AT GGT A A CTTTC3101 TGGGG CC AT A TAT A A GAGC A GA AGT TGA AG AT A AT ATC AT GGT A A CTTTC

3151 AGAAA TCAGG CCTCT CGTCC CTATT CCTTC TATTC TAGCC TTATT TCTTA3151 AGAAA TCAGG CCTCT CGTCC CTATT CCTTC TATTC TAGCC TTATT TCTTA

3201 TGAGG AAGAT CAGAG GCAAG GAGCA GAACC TAGAA AAAAC TTTGT CAAGC 3251 CTAAT GAAAC CAAAA CTTAC TTTTG GAAAG TGCAA CATCA TATGG CACCC 3301 ACTAA AGATG AGTTT GACTG CAAAG CCTGG GCTTA TTTCT CTGAT GTTGA 3351 CCTGG AAAAA GATGT GCACT CAGGC CTGAT TGGAC CCCTT CTGGT CTGCC3201 TGAGG AAGAT CAGAG GCAAG GAGCA GAACC TAGAA AAAAC TTTGT CAAGC 3251 CTAAT GAAAC CAAAA CTTAC TTTTG GAAAG TGCAA CATCA TATGG CACCC 3301 ACTAA AGATG AGTTT GACTG CAAAG CCTGG GCTTA TTTCT CTGAT GTTGA 3351 CCTGG AAAAA GATGT GCACT CAGGC CTGAT TGGAC CCCTT CTGGT CTGCC

3401 AC ACT AAC AC ACTGA ACCCT GCTCA TGGGA GACAA GTGAC AGTAC AGGAA3401 AC ACT AAC AC ACTGA ACCCT GCTCA TGGGA GACAA GTGAC AGTAC AGGAA

3451 TTTGC TCTGT TTTTC АССАТ CTTTG ATGAG ACCAA AAGCT GGTAC TTCAC3451 TTTGC TCTGT TTTTC ACCAT CTTTG ATGAG ACCAA AAGCT GGTAC TTCAC

3501 TGAAA ATATG GAAAG AAACT GCAGG GCTCC CTGCA ATATC CAGAT GGAAG3501 TGAAA ATATG GAAAG AAACT GCAGG GCTCC CTGCA ATATC CAGAT GGAAG

3551 ATCCC ACTTT TAAAG AGAAT TATCG CTTCC ATGCA ATCAA TGGCT ACATA3551 ATCCC ACTTT TAAAG AGAAT TATCG CTTCC ATGCA ATCAA TGGCT ACATA

3601 ATGGA TACAC TACCT GGCTT AGTAA TGGCT CAGGA TCAAA GGATT CGATG3601 ATGGA TACAC TACCT GGCTT AGTAA TGGCT CAGGA TCAAA GGATT CGATG

3651 GT АТС TGCTC AGC AT GGGCA GCAAT GAAAA CATCC ATTCT ATTCA TTTCA3651 GT ATC TGCTC AGC AT GGGCA GCAAT GAAAA CATCC ATTCT ATTCA TTTCA

3701 GTGGA CATGT GTTCA CTGTA CGAAA AAAAG AGGAG TATAA AATGG CACTG3701 GTGGA CATGT GTTCA CTGTA CGAAA AAAAG AGGAG TATAA AATGG CACTG

3751 TACAA TCTCT ATCCA GGTGT TTTTG AGACA GTGGA AATGT TACCA TCCAA3751 TACAA TCTCT ATCCA GGTGT TTTTG AGACA GTGGA AATGT TACCA TCCAA

3801 AGCTG GAATT TGGCG GGTGG AATGC CTTAT TGGCG AGCAT СТАСА TGCTG3801 AGCTG GAATT TGGCG GGTGG AATGC CTTAT TGGCG AGCAT STASA TGCTG

3851 GGATG AGC AC ACTTT TTCTG GTGT A C AGC A AT A AG TGTC A GACTC CCCTG3851 GGATG AGC AC ACTTT TTCTG GTGT A C AGC A AT A AG TGTC A GACTC CCCTG

3901 GGAAT GGCTT CTGGA CACAT TAGAG ATTTT CAGAT TACAG CTTCA GGACA3901 GGAAT GGCTT CTGGA CACAT TAGAG ATTTT CAGAT TACAG CTTCA GGACA

3951 ATATG GACAG TGGGC CCCAA AGCTG GCC AG ACTTC ATT AT TCCGG ATCAA3951 ATATG GACAG TGGGC CCCAA AGCTG GCC AG ACTTC ATT AT TCCGG ATCAA

4001 TCAAT GCCTG GAGCA CCAAG GAGCC CTTTT CTTGG ATCAA GGTGG ATCTG4001 TCAAT GCCTG GAGCA CCAAG GAGCC CTTTT CTTGG ATCAA GGTGG ATCTG

4051 TTGGC ACCAA TGATT ATTCA CGGCA TCAAG ACCCA GGGTG CCCGT CAGAA4051 TTGGC ACCAA TGATT ATTCA CGGCA TCAAG ACCCA GGGTG CCCGT CAGAA

4101 GTTCT CCAGC CTCTA СATCT CTCAG TTTAT CATCA TGTAT AGTCT TGATG4101 GTTCT CCAGC CTCTA СATCT CTCAG TTTAT CATCA TGTAT AGTCT TGATG

4151 GGAAG A AGTG GC AGA CTTAT CGAGG A A ATT CC ACT GGA AC CTT A A TGGTC4151 GGAAG A AGTG GC AGA CTTAT CGAGG A A ATT CC ACT GGA AC CTT A A TGGTC

4201 TTCTT TGGC A ATGTG GATTC ATCTG GGAT A AAACA C A AT A TTTTT A ACCC4201 TTCTT TGGC A ATGTG GATTC ATCTG GGAT A AAACA C A AT A TTTTT A ACCC

4251 TCCAA TTATT GCTCG АТАСА TCCGT TTGCA CCCAA CTCAT TAT AG CATTC 4301 GCAGC ACTCT TCGCA TGGAG TTGAT GGGCT GTGAT TTAAA TAGTT GCAGC4251 TCCAA TTATT GCTCG ATACA TCCGT TTGCA CCCAA CTCAT TAT AG CATTC 4301 GCAGC ACTCT TCGCA TGGAG TTGAT GGGCT GTGAT TTAAA TAGTT GCAGC

- 141 044115- 141 044115

4351 ATGCC ATTGG GA ATG GAGAG TA A AG C A AT A TC AGA TGC AC AGATT ACTGC4351 ATGCC ATTGG GA ATG GAGAG TA A AG C A AT A TC AGA TGC AC AGATT ACTGC

4401 TTCAT CCTAC TTTAC CAATA TGTTT GCCAC CTGGT CTCCT TCAAA AGCTC4401 TTCAT CCTAC TTTAC CAATA TGTTT GCCAC CTGGT CTCCT TCAAA AGCTC

4451 GACTT CACCT CCAAG GGAGG AGTAA TGCCT GGAGA CCTCA GGTGA ATAAT 4501 CCAAA AGAGT GGCTG CAAGT GGACT TCCAG AAGAC AATGA AAGTC ACAGG4451 GACTT CACCT CCAAG GGAGG AGTAA TGCCT GGAGA CCTCA GGTGA ATAAT 4501 CCAAA AGAGT GGCTG CAAGT GGACT TCCAG AAGAC AATGA AAGTC ACAGG

51 AGTAA CT ACT C AGGG AGTAA A ATCT CTGCT T ACC A GC ATG T ATGT GAAGG51 AGTAA CT ACT C AGGG AGTAA A ATCT CTGCT T ACC A GC ATG T ATGT GAAGG

4601 AGTTC CTCAT CTCCA GCAGT CAAGA TGGCC АТС AG TGGAC TCTCT TTTTT4601 AGTTC CTCAT CTCCA GCAGT CAAGA TGGCC ATS AG TGGAC TCTCT TTTTT

4651 CAGAA TGGCA AAGTA AAGGT TTTTC AGGGA AATCA AGACT CCTTC ACACC4651 CAGAA TGGCA AAGTA AAGGT TTTTC AGGGA AATCA AGACT CCTTC ACACC

4701 TGTGG TGAAC TCTCT AGACC CACCG TTACT GACTC GCTAC CTTCG AATTC4701 TGTGG TGAAC TCTCT AGACC CACCG TTACT GACTC GCTAC CTTCG AATTC

4751 ACCCC CAGAG TTGGG TGCAC CAGAT TGCCC TGAGG ATGGA GGTTC TGGGC4751 ACCCC CAGAG TTGGG TGCAC CAGAT TGCCC TGAGG ATGGA GGTTC TGGGC

4801 TGCGA GGCAC AGGAC CTCTA CGACA AAACT CACAC ATGCC CACCG TGCCC4801 TGCGA GGCAC AGGAC CTCTA CGACA AAACT CACAC ATGCC CACCG TGCCC

4851 AGCTC CAGAA CTCCT GGGCG GACCG TCAGT CTTCC TCTTC CCCCC AAAAC4851 AGCTC CAGAA CTCCT GGGCG GACCG TCAGT CTTCC TCTTC CCCCC AAAAC

4901 CCAAG GACAC CCTCA TGATC TCCCG GACCC CTGAG GTCAC ATGCG TGGTG4901 CCAAG GACAC CCTCA TGATC TCCCG GACCC CTGAG GTCAC ATGCG TGGTG

4951 GTGGA CGTGA GCCAC GAAGA CCCTG AGGTC AAGTT CAACT GGTAC GTGGA4951 GTGGA CGTGA GCCAC GAAGA CCCTG AGGTC AAGTT CAACT GGTAC GTGGA

5001 CGGCG TGGAG GTGC A T AATG CCAAG ACAA A GCCGC GGGAG GAGCA GT AC A5001 CGGCG TGGAG GTGC A T AATG CCAAG ACAA A GCCGC GGGAG GAGCA GT AC A

5051 ACAGC ACGTA CCGTG TGGTC AGCGT CCTCA CCGTC CTGCA CCAGG ACTGG5051 ACAGC ACGTA CCGTG TGGTC AGCGT CCTCA CCGTC CTGCA CCAGG ACTGG

5101 CTGAA TGGCA AGGAG TACA A GTGC A AGGTC TCC A A C A A AG CCCTC CC AGC 5151 CCCCA TCGAG AAAAC CATCT CCAAA GCCAA AGGGC AGCCC CGAGA ACC AC 5201 AGGTG TACAC CCTGC CCCCA TCCCG GGATG AGCTG ACCAA GAACC AGGTC 5251 AGCCT GACCT GCCTG GTCAA AGGCT TCTAT CCCAG CGACA TCGCC GTGGA5101 CTGAA TGGCA AGGAG TACA A GTGC A AGGTC TCC A A C A A AG CCCTC CC AGC 5151 CCCCA TCGAG AAAAC CATCT CCAAA GCCAA AGGGC AGCCC CGAGA ACC AC 5201 AGGTG TACAC CCTGC CCCCA TCCCG GGATG AGCTG ACCAA GAACC AGGTC 5251 AGCCT GACCT GCCTG GTC AA AGGCT TCTAT CCCAG CGACA TCGCC GTGGA

5301 GTGGG AGAGC AATGG GCAGC CGGAG AACAA СТАСА AGACC ACGCC TCCCG5301 GTGGG AGAGC AATGG GCAGC CGGAG AACAA STASA AGACC ACGCC TCCCG

5351 TGTTG GACTC CGACG GCTCC TTCTT CCTCT ACAGC AAGCT CACCG TGGAC 5401 AAGAG CAGGT GGCAG CAGGG GAACG TCTTC TCATG CTCCG TGATG CATGA5351 TGTTG GACTC CGACG GCTCC TTCTT CCTCT ACAGC AAGCT CACCG TGGAC 5401 AAGAG CAGGT GGCAG CAGGG GAACG TCTTC TCATG CTCCG TGATG CATGA

5451 GGCTC TGCAC AACCA СТАСА CGCAG AAGAG CCTCT CCCTG TCTCC GGGTA5451 GGCTC TGCAC AACCA STASA CGCAG AAGAG CCTCT CCCTG TCTCC GGGTA

5501 AATGA5501 AATGA

Последовательность белка FVIII 282 (SEO ID NO: 159).FVIII 282 protein sequence (SEO ID NO: 159).

MQIELSTCFF LCLLRFCFSA TRRYYLGAVE LSWDYMQSDL GELPVDARFPMQIELSTCFF LCLLRFCFSA TRRYYLGAVE LSWDYMQSDL GELPVDARFP

PRVPKSFPFN TSVVYKKTLF VEFTDHLFNI AKPRPPWMGL LGPTIQAEVYPRVPKSFPFN TSVVYKKTLF VEFTDHLFNI AKPRPPWMGL LGPTIQAEVY

101 DTVVITLKNM ASHPVSLHAV GVSYWKASEG AEYDDQTSQR EKEDDKVFPG101 DTVVITLKNM ASHPVSLHAV GVSYWKASEG AEYDDQTSQR EKEDDKVFPG

151 GSHTYVWQVL KENGPMASDP LCLTYSYLSH VDLVKDLNSG LIGALLVCRE151 GSHTYVWQVL KENGPMASDP LCLTYSYLSH VDLVKDLNSG LIGALLVCRE

201 GSLAKEKTQT LHKFILLFAV FDEGKSWHSE TKNSLMQDRD AASARAWPKM201 GSLAKEKTQT LHKFILLFAV FDEGKSWHSE TKNSLMQDRD AASARWPKM

251 HTVNGYVNRS LPGLIGCHRK SVYWHVIGMG TTPEVHSIFL EGHTFLVRNH251 HTVNGYVNRS LPGLIGCHRK SVYWHVIGMG TTPEVHSIFL EGHTFLVRNH

301 RQASLEISPI TFLTAQTLLM DLGQFLLFCH ISSHQHDGME AYVKVDSCPE301 RQASLEISPI TFLTAQTLLM DLGQFLLFCH ISSHQHDGME AYVKVDSCPE

351 EPQLRMKNNE EAEDYDDDLT DSEMDVVRFD DDNSPSFIQI RSVAKKHPKT351 EPQLRMKNNE EAEDYDDDLT DSEMDVVRFD DDNSPSFIQI RSVAKKHPKT

401 WVHYIAAEEE DWDYAPLVLA PDDRSYKSQY LNNGPQRIGR KYKKVRFMAY401 WVHYIAAEEE DWDYAPLVLA PDDRSYKSQY LNNGPQRIGR KYKKVRFMAY

451 TDETFKTREAIQHESGILGP LLYGEVGDTL LIIFKNQASR PYNIYPHGIT451 TDETFKTREAIQHESGILGP LLYGEVGDTL LIIFKNQASR PYNIYPHGIT

501 DVRPLYSRRL PKGVKHLKDF PILPGEIFKY KWTVTVEDGP TKSDPRCLTR501 DVRPLYSRRL PKGVKHLKDF PILPGEIFKY KWTVTVEDGP TKSDPRCLTR

- 142 044115- 142 044115

551 YYSSFVNMER DLASGLIGPL LICYKESVDQ RGNQIMSDKR NVILFSVFDE551 YYSSFVNMER DLASGLIGPL LICYKESVDQ RGNQIMSDKR NVILFSVFDE

601 NRSWYLTENI QRFLPNPAGV QLEDPEFQAS NIMHSINGYV FDSLQLSVCL601 NRSWYLTENI QRFLPNPAGV QLEDPEFQAS NIMHSINGYV FDSLQLSVCL

651 HEVAYWYILS IGAQTDFLSV FFSGYTFKHK MVYEDTLTLF PFSGETVFMS651 HEVAYWYILS IGAQTDFLSV FFSGYTFKHK MVYEDTLTLF PFSGETVFMS

701 MENPGLWILG CHNSDFRNRG MTALLKVSSC DKNTGDYYED SYEDISAYLL701 MENPGLWILG CHNSDFRNRG MTALLKVSSC DKNTGDYYED SYEDISAYLL

751 SKNNAIEPRS FSQNGAPTSE SATPESGPGS EPATSGSETP GTSESATPES751 SKNNAIEPRS FSQNGAPTSE SATPESGPGS EPATSGSETP GTSESATPES

801 GPGSEPATSG SETPGTSESA TPESGPGTST EPSEGSAPGS PAGSPTSTEE801 GPGSEPATSG SETPGTSESA TPESGPGTST EPSEGSAPGS PAGSPTSTEE

851 GTSESATPES GPGSEPATSG SETPGTSESA TPESGPGSPA GSPTSTEEGS851 GTSESATPES GPGSEPATSG SETPGTSESA TPESGPGSPA GSPTSTEEGS

901 PAGSPTSTEE GASSPPVLKR HQAEITRTTL QSDQEEIDYD DTISVEMKKE901 PAGSPTSTEE GASSPPVLKR HQAEITRTTL QSDQEEIDYD DTISVEMKKE

951 DFDIYDEDEN QSPRSFQKKT RHYFIAAVER LWDYGMSSSP HVLRNRAQSG951 DFDIYDEDEN QSPRSFQKKT RHYFIAAVER LWDYGMSSSP HVLRNRAQSG

1001 SVPQFKKVVF QEFTDGSFTQ PLYRGELNEH LGLLGPYIRA EVEDNIMVTF1001 SVPQFKKVVF QEFTDGSFTQ PLYRGELNEH LGLLGPYIRA EVEDNIMVTF

1051 RNQASRPYSF YSSLISYEED QRQGAEPRKN FVKPNETKTY FWKVQHHMAP1051 RNQASRPYSF YSSLISYEED QRQGAEPRKN FVKPNETKTY FWKVQHHMAP

1101 TKDEFDCKAW AYFSDVDLEK DVHSGLIGPL LVCHTNTLNP AHGRQVTVQE1101 TKDEFDCKAW AYFSDVDLEK DVHSGLIGPL LVCHTNTLNP AHGRQVTVQE

1151 FALFFTIFDE TKSWYFTENM ERNCRAPCNI QMEDPTFKEN YRFHAINGYI1151 FALFFTIFDE TKSWYFTENM ERNCRAPCNI QMEDPTFKEN YRFHAINGYI

1201 MDTLPGLVMA QDQRIRWYLL SMGSNENIHS IHFSGHVFTV RKKEEYKMAL1201 MDTLPGLVMA QDQRIRWYLL SMGSNENIHS IHFSGHVFTV RKKEEYKMAL

1251 YNLYPGVFET VEMLPSKAGIWRVECLIGEH LHAGMSTLFL VYSNKCQTPL1251 YNLYPGVFET VEMLPSKAGIWRVECLIGEH LHAGMSTLFL VYSNKCQTPL

1301 GMASGHIRDF QITASGQYGQ WAPKLARLHY SGSINAWSTK EPFSWIKVDL1301 GMASGHIRDF QITASGQYGQ WAPKLARLHY SGSINAWSTK EPFSWIKVDL

1351 LAPMIIHGIK TQGARQKFSS LYISQFIIMY SLDGKKWQTY RGNSTGTLMV1351 LAPMIIHGIK TQGARQKFSS LYISQFIIMY SLDGKKWQTY RGNSTGTLMV

1401 FFGNVDSSGI KHNIFNPPII ARYIRLHPTH YSIRSTLRME LMGCDLNSCS1401 FFGNVDSSGI KHNIFNPPII ARYIRLHPTH YSIRSTLRME LMGCDLNSCS

1451 MPLGMESKAI SDAQITASSY FTNMFATWSP SKARLHLQGR SNAWRPQVNN1451 MPLGMESKAI SDAQITASSY FTNMFATWSP SKARLHLQGR SNAWRPQVNN

1501 PKEWLQVDFQ KTMKVTGVTT QGVKSLLTSM YVKEFLISSS QDGHQWTLFF1501 PKEWLQVDFQ KTMKVTGVTT QGVKSLLTSM YVKEFLISSS QDGHQWTLFF

1551 QNGKVKVFQG NQDSFTPVVN SLDPPLLTRY LRIHPQSWVH QIALRMEVLG1551 QNGKVKVFQG NQDSFTPVVN SLDPPLLTRY LRIHPQSWVH QIALRMEVLG

1601 CEAQDLYDKT HTCPPCPAPE LLGGPSVFLF PPKPKDTLMI SRTPEVTCVV1601 CEAQDLYDKT HTCPPCPAPE LLGGPSVFLF PPKPKDTLMI SRTPEVTCVV

1651 VDVSHEDPEV KFNWYVDGVE VHNAKTKPRE EQYNSTYRVV SVLTVLHQDW1651 VDVSHEDPEV KFNWYVDGVE VHNAKTKPRE EQYNSTYRVV SVLTVLHQDW

1701 LNGKEYKCKV SNKALPAPIE KTISKAKGQP REPQVYTLPP SRDELTKNQV1701 LNGKEYKCKV SNKALPAPIE KTISKAKGQP REPQVYTLPP SRDELTKNQV

1751 SLTCLVKGFY PSDIAVEWES NGQPENNYKT TPPVLDSDGS FFLYSKLTVD1751 SLTCLVKGFY PSDIAVEWES NGQPENNYKT TPPVLDSDGS FFLYSKLTVD

1801 KSRWQQGNVF SCSVMHEALH NHYTQKSLSL SPGK* Нуклеотидная последовательность FVIII 283 (FVIII169 с тройной мутацией IHH) (SEQ ID NO: 160).1801 KSRWQQGNVF SCSVMHEALH NHYTQKSLSL SPGK* Nucleotide sequence of FVIII 283 (FVIII169 with triple IHH mutation) (SEQ ID NO: 160).

ATGCA AATAG AGCTC TCCAC CTGCT TCTTT CTGTG CCTTT TGCGA TTCTGATGCA AATAG AGCTC TCCAC CTGCT TCTTT CTGTG CCTTT TGCGA TTCTG

CTTTA GTGCC ACCAG AAGAT ACTAC CTGGG TGCAG TGGAA CTGTC ATGGGCTTTA GTGCC ACCAG AAGAT ACTAC CTGGG TGCAG TGGAA CTGTC ATGGG

101 АСТАТ ATGCA AAGTG ATCTC GGTGA GCTGC CTGTG GACGC AAGAT TTCCT101 ASTAT ATGCA AAGTG ATCTC GGTGA GCTGC CTGTG GACGC AAGAT TTCCT

151 CCTAG AGTGC CAAAA TCTTT TCCAT TCAAC ACCTC AGTCG TGTAC AAAAA151 CCTAG AGTGC CAAAA TCTTT TCCAT TCAAC ACCTC AGTCG TGTAC AAAAA

201 GACTC TGTTT GT AGA ATTCA CGGAT CACCT ТТТСА AC АТС GCTAA GCC A A201 GACTC TGTTT GT AGA ATTCA CGGAT CACCT TTTCA AC ATS GCTAA GCC A A

251 GGCCA CCCTG GATGG GTCTG CTAGG TCCTA CCАТС CAGGC TGAGG TTTAT251 GGCCA CCCTG GATGG GTCTG CTAGG TCCTA CCATS CAGGC TGAGG TTTAT

301 GAT AC AGTGG TCATT AC ACT TAAGA ACATG GCTTC CCATC CTGTC AGTCT301 GAT AC AGTGG TCATT AC ACT TAAGA ACATG GCTTC CCATC CTGTC AGTCT

- 143 044115- 143 044115

351 TCATG CTGTT GGTGT ATCCT ACTGG AAAGC TTCTG AGGGA GCTGA ATATG351 TCATG CTGTT GGTGT ATCCT ACTGG AAAGC TTCTG AGGGA GCTGA ATATG

401 ATGAT CAGAC CAGTC A A AGG GAGA A AGA AG ATGAT A A AGT CTTCC CTGGT401 ATGAT CAGAC CAGTC A A AGG GAGA A AGA AG ATGAT A A AGT CTTCC CTGGT

451 GGAAG CCATA CAT AT GTCTG GCAGG TCCTG AAAGA GA ATG GTCCA ATGGC451 GGAAG CCATA CAT AT GTCTG GCAGG TCCTG AAAGA GA ATG GTCCA ATGGC

501 CTCTG ACCC A CTGTG CCTTA CCTAC TC AT A TCTTT CTCAT GTGGA CCTGG501 CTCTG ACCC A CTGTG CCTTA CCTAC TC AT A TCTTT CTCAT GTGGA CCTGG

551 TAAAA GACTT GAATT CAGGC CTCAT TGGAG CCCTA CTAGT ATGTA GAGAA551 TAAAA GACTT GAATT CAGGC CTCAT TGGAG CCCTA CTAGT ATGTA GAGAA

601 GGGAG TCTGG CCA AG GAAAA GAC AC AGACC TTGCA CAAAT TTATA CT ACT601 GGGAG TCTGG CCA AG GAAAA GAC AC AGACC TTGCA CAAAT TTATA CT ACT

651 TTTTG CTGTA TTTGA TGAAG GGAAA AGTTG GCACT CAGAA AC AAA GAACT651 TTTTG CTGTA TTTGA TGAAG GGAAA AGTTG GCACT CAGAA AC AAA GAACT

701 CCTTG ATGC A GGAT A GGGAT GCTGC ATCTG CTCGG GCCTG GCCT A A A ATG701 CCTTG ATGC A GGAT A GGGAT GCTGC ATCTG CTCGG GCCTG GCCT A A A ATG

751 CACAC AGTCA ATGGT TATGT AAACA GGTCT CTGCC AGGTC TGATT GGATG751 CACAC AGTCA ATGGT TATGT AAACA GGTCT CTGCC AGGTC TGATT GGATG

801 CCACA GGAAA TCAGT CTATT GGCAT GTGAT TGGAA TGGGC ACCAC TCCTG801 CCACA GGAAA TCAGT CTATT GGCAT GTGAT TGGAA TGGGC ACCAC TCCTG

851 AAGTG CACTC AATAT TCCTC GAAGG TCACA CATTT CTTGT GAGGA АССАТ851 AAGTG CACTC AATAT TCCTC GAAGG TCACA CATTT CTTGT GAGGA ASSAT

901 CGCC A GGCT A GCTTG GA AAT CTCGC C A AT A ACTTT CCTTA CTGCT C A A AC901 CGCC A GGCT A GCTTG GA AAT CTCGC C A AT A ACTTT CCTTA CTGCT C A A AC

951 ACTCT TGATG GACCT TGGAC AGTTT CT ACT GTTTT GTC AT ATCTC TTCCC951 ACTCT TGATG GACCT TGGAC AGTTT CT ACT GTTTT GTC AT ATCTC TTCCC

1001 ACCAA CATGA TGGCA TGGAA GCTTA TGTCA AAGTA GACAG CTGTC CAGAG 1051 GAACC CCAAC TACGA ATGAA AAATA ATGAA GAAGC GGAAG АСТАТ GATGA 1101 TGATC TT ACT GATTC TGA A A TGGAT GTGGT C AGGT TTGAT GATGA C A ACT 1151 CTCCT TCCTT TATCC AAATT CGCTC AGTTG CCAAG AAGCA TCCTA AAACT 1201 TGGGT AC ATT AC ATT GCTGC TGAAG AGGAG GACTG GGACT ATGCT CCCTT 1251 AGTCC TCGCC CCCGA TGACA GAAGT TATAA AAGTC AATAT TTGAA CAATG 1301 GCCCT CAGCG GATTG GTAGG AAGTA CAAAA AAGTC CGATT TATGG CATAC 1351 AC AGA TGA A A CCTTT A AGAC TCGTG A AGCT ATTC A GC ATG А АТС A GGA AT 1401 CTTGG GACCT TT ACT TT ATG GGGA A GTTGG AGAC A C ACTG TTGAT TAT AT 1451 TTAAG А АТС A AGCA A GC AGA CCATA T AACA TCT AC CCTC A CGGAA TCACT 1501 GATGT CCGTC CTTTG TATTC AAGGA GATTA CCAAA AGGTG TAAAA CATTT 1551 GAAGG ATTTT CCA AT TCTGC C AGGA GA A AT ATTC A AATAT A A ATG GAC AG 1601 TGACT GT AGA AGATG GGCCA ACT AA ATCAG ATCCT CGGTG CCTGA CCCGC 1651 ТАТТА CTCTA GTTTC GTTAA TATGG AGAGA GATCT AGCTT CAGGA CTCAT 1701 TGGCC CTCTC CTCAT CTGCT AC AAA GAATC TGT AG ATCAA AGAGG AAACC 1751 AGATA ATGTC AGACA AGAGG AATGT CATCC TGTTT TCTGT ATTTG ATGAG 1801 AACCG AAGCT GGTAC CTCAC AGAGA AT ATA CAACG CTTTC TCCCC AATCC 1851 AGCTG GAGTG C AGCT TGAGG ATCC A GAGTT CCA AG CCTCC AAC AT C ATGC 1901 AC AGC ATCAA TGGCT ATGTT TTTGA T AGTT TGC AG TTGTC AGTTT GTTTG 1951 CATGA GGTGG CATAC TGGTA CATTC TAAGC ATTGG AGCAC AGACT GACTT 2001 CCTTT CTGTC TTCTT CTCTG GAT AT ACCTT CAAAC AC AAA ATGGT CT ATG 2051 AAGAC AC ACT CACCC TATTC CCATT CTC AG GAGAA ACTGT CTTCA TGTCG 2101 ATGGA AAACC C AGGT CT ATG GATTC TGGGG TGCC A C A ACT CAGAC TTTCG 2151 GA AC A GAGGC ATGAC CGCCT T ACTG A AGGT TTCT A GTTGT GAC A A GA AC A 2201 CTGGT GATTA TT ACG AGGAC AGTT A TGAAG AT ATT TC AGC AT ACT TGCTG1001 ACCAA CATGA TGGCA TGGAA GCTTA TGTCA AAGTA GACAG CTGTC CAGAG 1051 GAACC CCAAC TACGA ATGAA AAATA ATGAA GAAGC GGAAG ASTAT GATGA 1101 TGATC TT ACT GATTC TGA A A TGGAT GTGGT C AGGT TTGAT GATGA C A ACT 1151 CTCCT TCCTT TAT CC AAATT CGCTC AGTTG CCAAG AAGCA TCCTA AAACT 1201 TGGGT AC ATT AC ATT GCTGC TGAAG AGGAG GACTG GGACT ATGCT CCCTT 1251 AGTCC TCGCC CCCGA TGACA GAAGT TATAA AAGTC AATAT TTGAA CAATG 1301 GCCCT CAGCG GATTG GTAGG AAGTA CAAAA AAGTC CGATT TATGG CATAC 1351 AC AGA TGA A A CCTTT A AGAC TCGTG A AGCT ATTC A GC ATG A ATC A GGA AT 1401 CTTGG GACCT TT ACT TT ATG GGGA A GTTGG AGAC A C ACTG TTGAT TAT AT 1451 TTAAG A ATC A AGCA A GC AGA CCATA T AACA TCT AC CCTC A CGGAA TCACT 1501 GATGT CCGTC CTTTG TATTC AAGGA GATTA CCAAA AGGTG TAAAA CATTT 1551 G AAGG ATTTT CCA AT TCTGC C AGGA GA A AT ATTC A AATAT A A ATG GAC AG 1601 TGACT GT AGA AGATG GGCCA ACT AA ATCAG ATCCT CGGTG CCTGA CCCGC 1651 TATTA CTCTA GTTTC GTTAA TATGG AGAGA GATCT AGCTT CAGGA CTCAT 1701 TGGCC CTCTC CTCAT CTGCT AC AAA GAATC TGT AG ATCAA AGAGG AAACC 1751 AGATA ATGTC AGACA AGAGG AATGT CATCC TGTTT TCTGT ATTTG ATGAG 1801 AACCG AAGCT GGTAC CTCAC AGAGA AT ATA CAACG CTTTC TCCCC AATCC 1851 AGCTG GAGTG C AGCT TGAGG ATCC A GAGTT CCA AG CCTCC AAC AT C ATGC 1 901 AC AGC ATCAA TGGCT ATGTT TTTGA T AGTT TGC AG TTGTC AGTTTT GTTTG 1951 CATGA GGTGG CATAC TGGTA CATTC TAAGC ATTGG AGCAC AGACT GACTT 2001 CCTTT CTGTC TTCTT CTCTG GAT AT ACCTT CAAAC AC AAA ATGGT CT ATG 2051 AAGAC AC ACT CACCC TATTC CCATT CTC AG GAGAA ACTGT CTTCA TGTCG 2101 ATGGA AAACC C AGGT CT ATG GATTC TGGGG TGCC A C A ACT CAGAC TTTCG 2151 GA AC A GAGGC ATGAC CGCCT T ACTG A AGGT TTCT A GTTGT GAC A A GA AC A 2201 CTGGT GATTA TT ACG AGGAC AGTT A TGAAG AT ATT TC AGC AT ACT TGCTG

- 144 044115- 144 044115

2251 AGTAA AAACA ATGCC ATTGA ACCAA GAAGC TTCTC TCAAA ACGGC GCGCC2251 AGTAA AAACA ATGCC ATTGA ACCAA GAAGC TTCTC TCAAA ACGGC GCGCC

2301 AGGTA CCTCA GAGTC TGCTA CCCCC GAGTC AGGGC CAGGA TCAGA GCCAG2301 AGGTA CCTCA GAGTC TGCTA CCCCC GAGTC AGGGC CAGGA TCAGA GCCAG

51 CCACC TCCGG GTCTG AGACA CCCGG GACTT CCGAG AGTGC CACCC CTGAG51 CCACC TCCGG GTCTG AGACA CCCGG GACTT CCGAG AGTGC CACCC CTGAG

2401 TCCGG ACCCG GGTCC GAGCC CGCCA CTTCC GGCTC CGAAA CTCCC GGCAC2401 TCCGG ACCCG GGTCC GAGCC CGCCA CTTCC GGCTC CGAAA CTCCC GGCAC

2451 AAGCG AGAGC GCTAC CCCAG AGTCA GGACC AGGAA CATCT ACAGA GCCCT 2501 CTGAA GGCTC CGCTC CAGGG TCCCC AGCCG GCAGT CCCAC TAGCA CCGAG2451 AAGCG AGAGC GCTAC CCCAG AGTCA GGACC AGGAA CATCT ACAGA GCCCT 2501 CTGAA GGCTC CGCTC CAGGG TCCCC AGCCG GCAGT CCCAC TAGCA CCGAG

2551 GAGGG AACCT CTGAA AGCGC CACAC CCGAA TCAGG GCCAG GGTCT GAGCC 2601 TGCTA CCAGC GGC AG CGAGA САССА GGCAC CTCTG AGTCC GCCAC ACC AG 2651 AGTCC GGACC CGGAT CTCCC GCTGG GAGCC CCACC TCCAC TGAGG AGGGA2551 GAGGG AACCT CTGAA AGCGC CACAC CCGAA TCAGG GCCAG GGTCT GAGCC 2601 TGCTA CCAGC GGC AG CGAGA SASSA GGCAC CTCTG AGTCC GCCAC ACC AG 2651 AGTCC GGACC CGGAT CTCCC GCTGG GAGCC CCACC TCCAC TGAGG AGGGA

2701 TCTCC TGCTG GCTCT CCAAC ATCTA CTGAG GAAGG TACCT СAACC GAGCC2701 TCTCC TGCTG GCTCT CCAAC ATCTA CTGAG GAAGG TACCT CAACC GAGCC

2751 ATCCG AGGGA TCAGC TCCCG GCACC TCAGA GTCGG CAACC CCGGA GTCTG2751 ATCCG AGGGA TCAGC TCCCG GCACC TCAGA GTCGG CAACC CCGGA GTCTG

2801 GACCC GGAAC TTCCG AAAGT GCCAC ACCAG AGTCC GGTCC CGGGA CTTCA2801 GACCC GGAAC TTCCG AAAGT GCCAC ACCAG AGTCC GGTCC CGGGA CTTCA

2851 GAATC AGCAA CACCC GAGTC CGGCC CTGGG TCTGA ACCCG CCACA AGTGG2851 GAATC AGCAA CACCC GAGTC CGGCC CTGGG TCTGA ACCCG CCACA AGTGG

2901 TAGTG AGACA CCAGG ATCAG AACCT GCTAC CTCAG GGTCA GAGAC ACCCG 2951 GATCT CCGGC AGGCT САССА ACCTC CACTG AGGAG GGCAC CAGCA CAGAA 3001 CCAAG CGAGG GCTCC GCACC CGGAA CAAGC ACTGA ACCCA GTGAG GGTTC2901 TAGTG AGACA CCAGG ATCAG AACCT GCTAC CTCAG GGTCA GAGAC ACCCG 2951 GATCT CCGGC AGGCT SASSA ACCTC CACTG AGGAG GGCAC CAGCA CAGAA 3001 CCAAG CGAGG GCTCC GCACC CGGAA CAAGC ACTGA ACCCA GTGAG GGTTC

3051 AGCAC CCGGC TCTGA GCCGG CCACA AGTGG CAGTG AGACA CCCGG CACTT3051 AGCAC CCGGC TCTGA GCCGG CCACA AGTGG CAGTG AGACA CCCGG CACTT

3101 CAGAG AGTGC CACCC CCGAG AGTGG CCCAG GCACT AGTAC CGAGC CCTCT3101 CAGAG AGTGC CACCC CCGAG AGTGG CCCAG GCACT AGTAC CGAGC CCTCT

3151 GAAGG CAGTG CGCCA GCCTC GAGCC САССА GTCTT GAAAC GCCAT CAAGC3151 GAAGG CAGTG CGCCA GCCTC GAGCC SASSA GTCTT GAAAC GCCAT CAAGC

3201 TGAAA TAACT CGTAC TACTC TTCAG TCAGA TCAAG AGGAA ATCGA TTATG3201 TGAAA TAACT CGTAC TACTC TTCAG TCAGA TCAAG AGGAA ATCGA TTATG

3251 ATGAT ACCAT ATCAG TTGAA ATGAA GAAGG AAGAT TTTGA CATTT ATGAT3251 ATGAT ACCAT ATCAG TTGAA ATGAA GAAGG AAGAT TTTGA CATTT ATGAT

3301 GAGGA TGAAA ATCAG AGCCC CCGCA GCTTT CAAAA GAAAA CACGA CACTA3301 GAGGA TGAAA ATCAG AGCCC CCGCA GCTTT CAAAA GAAAA CACGA CACTA

3351 TTTTA TTGCT GCAGT GGAGA GGCTC TGGGA TTATG GGATG AGTAG CTCCC3351 TTTTA TTGCT GCAGT GGAGA GGCTC TGGGA TTATG GGATG AGTAG CTCCC

3401 CACAT GTTCT AAGAA ACAGG GCTCA GAGTG GCAGT GTCCC TCAGT TCAAG3401 CACAT GTTCT AAGAA ACAGG GCTCA GAGTG GCAGT GTCCC TCAGT TCAAG

3451 AAAGT TGTTT TCCAG GAATT TACTG ATGGC TCCTT TACTC AGCCC TTATA3451 AAAGT TGTTT TCCAG GAATT TACTG ATGGC TCCTT TACTC AGCCC TTATA

3501 CCGTG GAGAA CTAAA TGAAC ATTTG GGACT CCTGG GGCCA TATAT AAGAG3501 CCGTG GAGAA CTAAA TGAAC ATTTG GGACT CCTGG GGCCA TATAT AAGAG

3551 CAGAA GTTGA AGATA ATATC ATGGT AACTT TCAGA AATCA GGCCT CTCGT3551 CAGAA GTTGA AGATA ATATC ATGGT AACTT TCAGA AATCA GGCCT CTCGT

3601 CCCTA TTCCT TCTAT TCTAG CCTTA TTTCT TATGA GGAAG ATCAG AGGCA3601 CCCTA TTCCT TCTAT TCTAG CCTTA TTTCT TATGA GGAAG ATCAG AGGCA

3651 AGGAG CAGAA CCTAG AAAAA ACTTT GTCAA GCCTA ATGAA ACCAA AACTT3651 AGGAG CAGAA CCTAG AAAAA ACTTT GTCAA GCCTA ATGAA ACCAA AACTT

3701 ACTTT TGGAA AGTGC AAC AT CAT AT GGCAC CCACT AAAGA TGAGT TTGAC3701 ACTTT TGGAA AGTGC AAC AT CAT AT GGCAC CCACT AAAGA TGAGT TTGAC

3751 TGCAA AGCCT GGGCT TATTT CTCTG ATGTT GACCT GGAAA AAGAT GTGCA3751 TGCAA AGCCT GGGCT TATTT CTCTG ATGTT GACCT GGAAA AAGAT GTGCA

3801 CTCAG GCCTG ATTGG ACCCC TTCTG GTCTG CCACA CTAAC ACACT GAACC3801 CTCAG GCCTG ATTGG ACCCC TTCTG GTCTG CCACA CTAAC ACACT GAACC

3851 CTGCT CATGG GAGAC AAGTG ACAGT ACAGG AATTT GCTCT GTTTT TCACC3851 CTGCT CATGG GAGAC AAGTG ACAGT ACAGG AATTT GCTCT GTTTT TCACC

3901 ATCTT TGATG AGACC AAAAG CTGGT ACTTC ACTGA AAATA TGGAA AGAAA3901 ATCTT TGATG AGACC AAAAG CTGGT ACTTC ACTGA AAATA TGGAA AGAAA

3951 CTGCA GGGCT CCCTG CAATA TCCAG ATGGA AGATC CCACT TTTAA AGAGA 4001 ATT AT CGCTT CCATG CAATC AATGG СТАСА TAATG GAT AC ACTAC CTGGC 4051 TTAGT AATGG CTCAG GATCA AAGGA TTCGA TGGTA TCTGC TCAGC ATGGG 4101 CAGCA ATGAA A AC AT CC ATT CT ATT CATTT CAGTG GAC AT GTGTT CACTG3951 CTGCA GGGCT CCCTG CAATA TCCAG ATGGA AGATC CCACT TTTAA AGAGA 4001 ATT AT CGCTT CCATG CAATC AATGG STASA TAATG GAT AC ACTAC CTGGC 4051 TTAGT AATGG CTCAG GATCA AAGGA TTCGA TGGTA TCTGC TCAGC ATGGG 4101 CAGCA ATGAA A AC AT CC ATT CT ATT CATTT CAGTG GAC AT GTGTT CACTG

- 145 044115- 145 044115

4151 T ACGA A A A A A AGAGG AGT AT A A A AT GGC AC TGT AC A ATCT СТ АТС CAGGT 4201 GTTTT TGAGA CAGTG GAAAT GTTAC CATCC AAAGC TGGAA TTTGG CGGGT 4251 GGAAT GCCTT ATTGG CGAGC ATCTA CATGC TGGGA TGAGC AC ACT TTTTC 4301 TGGTG TACAG CAATA AGTGT CAGAC TCCCC TGGGA ATGGC TTCTG GACAC 4351 ATT AG AGATT TTC AG ATT AC AGCTT C AGGA CAATA TGGAC AGTGG GCCCC 4401 AAAGC TGGCC AGACT TCATT ATTCC GGATC А АТС A ATGCC TGGAG САССА 4451 AGGAG CCCTT TTCTT GGATC AAGGT GGATC TGTTG GCACC AATGA TTATT 4501 CACGG CATCA AGACC CAGGG TGCCC GTCAG AAGTT CTCCA GCCTC TACAT 4551 CTCTC AGTTT АТС AT C ATGT AT AGT CTTGA TGGGA AGA AG TGGC A GACTT 4601 ATCGA GGAAA TTCCA CTGGA ACCTT AATGG TCTTC TTTGG CAATG TGGAT 4651 TCATC TGGGA TAAAA CACAA TATTT TTAAC CCTCC AATTA TTGCT CGATA 4701 CATCC GTTTG CACCC AACTC ATT AT AGC AT TCGCA GCACT CTTCG CATGG 4751 AGTTG ATGGG CTGTG ATTTA AATAG TTGCA GCATG CCATT GGGAA TGGAG 4801 AGTAA AGCAA TATCA GATGC ACAGA TTACT GCTTC ATCCT ACTTT ACCAA 4851 TATGT TTGCC ACCTG GTCTC CTTCA AAAGC TCGAC TTCAC CTCCA AGGGA 4901 GGAGT AATGC CTGGA GACCT CAGGT GAATA ATCCA AAAGA GTGGC TGCAA 4951 GTGGA CTTCC AGAAG ACAAT GAAAG TCACA GGAGT AACTA CTCAG GGAGT 5001 AAAAT CTCTG CTTAC CAGCA TGTAT GTGAA GGAGT TCCTC ATCTC CAGCA 5051 GTCAA GATGG CCATC AGTGG ACTCT CTTTT TTCAG AATGG CAAAG TAAAG 5101 GTTTT TC AGG GAAAT C A AGA CTCCT TCACA CCTGT GGTGA ACTCT CT AGA 5151 CCCAC CGTTA CTGAC TCGCT ACCTT CGAAT TCACC CCCAG AGTTG GGTGC 5201 ACC AG ATTGC CCTGA GGATG GAGGT TCTGG GCTGC GAGGC AC AGG ACCTC 5251 TACGA CAAAA CTCAC ACATG CCCAC CGTGC CCAGC TCCAG AACTC CTGGG 5301 CGGAC CGTCA GTCTT CCTCT TCCCC CCAAA ACCCA AGGAC ACCCT CATGG 5351 CCTCC CGGAC CCCTG AGGTC ACATG CGTGG TGGTG GACGT GAGCC ACGAA 5401 GACCC TGAGG TCAAG TTCAA CTGGT ACGTG GACGG CGTGG AGGTG CATAA 5451 TGCCA AGACA AAGCC GCGGG AGGAG CAGTA CAACA GCACG TACCG TGTGG 5501 TCAGC GTCCT CACCG TCCTG GCCCA GGACT GGCTG AATGG CAAGG AGTAC 5551 AAGTG CAAGG TCTCC AACAA AGCCC TCCCA GCCCC CATCG AGAAA АССАТ 5601 CTCCA AAGCC AAAGG GCAGC CCCGA GAACC ACAGG TGTAC ACCCT GCCCC 5651 CATCC CGGGA TGAGC TGACC AAGAA CCAGG TCAGC CTGAC CTGCC TGGTC 5701 AAAGG CTTCT ATCCC AGCGA CATCG CCGTG GAGTG GGAGA GCA AT GGGCA 5751 GCCGG AGAAC AACTA CAAGA CCACG CCTCC CGTGT TGGAC TCCGA CGGCT 5801 ССТТС TTCCT СТАСА GCAAG CTCAC CGTGG ACAAG AGCAG GTGGC AGCAG 5851 GGGAA CGTCT TCTC A TGCTC CGTGA TGC AT GAGGC TCTGC AC A AC GCCT A 5901 CACGC AGAAG AGCCT CTCCC TGTCT CCGGG TAAAT GA4151 T ACGA A A A A A AGAGG AGT AT A A A AT GGC AC TGT AC A ATCT ST ATS CAGGT 4201 GTTTT TGAGA CAGTG GAAAT GTTAC CATCC AAAGC TGGAA TTTGG CGGGT 4251 GGAAT GCCTT ATTGG CGAGC ATCTA CATGC TGGGA TGAGC AC ACT TTTTC 4301 TGGTG TAC AG CAATA AGTGT CAGAC TCCCC TGGGA ATGGC TTCTG GACAC 4351 ATT AG AGATT TTC AG ATT AC AGCTT C AGGA CAATA TGGAC AGTGG GCCCC 4401 AAAGC TGGCC AGACT TCATT ATTCC GGATC A ATC A ATGCC TGGAG SASSA 4451 AGGAG CCCTT TTCTT GGATC AAGGT GGATC TGTTG GCACC AATGA TTATT 4501 CACGG CATCA AGACC CAGGG TGCCC GTCAG AAGTT CTCCA GCCTC TACAT 4551 CTCTC AGTTT ATC AT C ATGT AT AGT CTTGA TGGGA AGA AG TGGC A GACTT 4601 ATCGA GGAAA TTCCA CTGGA ACCTT AATGG TCTTC TTTGG CAATG TGGAT 4651 TCATC TGGGA TAAAA CACAA TATTT TTAAC CCTCC AATTA TTGCT CGATA 4701 CAT CC GTTTG CACCC AACTC ATT AT AGC AT TCGCA GCACT CTTCG CATGG 4751 AGTTG ATGGG CTGTG ATTTA AATAG TTGCA GCATG CCATT GGGAA TGGAG 4801 AGTAA AGCAA TATCA GATGC ACAGA TTACT GCTTC ATCCT ACTTT ACCAA 4851 TATGT TTGCC ACCTG GTCTC CTTCA AAAGC TCGAC TTCAC CTCCA AGGGA 4901 GG AGT AATGC CTGGA GACCT CAGGT GAATA ATCCA AAAGA GTGGC TGCAA 4951 GTGGA CTTCC AGAAG ACAAT GAAAG TCACA GGAGT AACTA CTCAG GGAGT 5001 AAAAT CTCTG CTTAC CAGCA TGTAT GTGAA GGAGT TCCTC ATCTC CAGCA 5051 GTCAA GATGG CCATC AGTGG ACTCT CTTTT TTCAG AATGG CAAAG TAAAG 5101 GTTTT TC AGG GAAAT C A AGA CTCCT T CACA CCTGT GGTGA ACTCT CT AGA 5151 CCCAC CGTTA CTGAC TCGCT ACCTT CGAAT TCACC CCCAG AGTTG GGTGC 5201 ACC AG ATTGC CCTGA GGATG GAGGT TCTGG GCTGC GAGGC AC AGG ACCTC 5251 TACGA CAAAA CTCAC ACATG CCCAC CGTGC CCAGC TCCAG AACTC CTGGG 5301 CGGAC CGTCA GTCTT CCTCT TCCCC CCAAA ACCCA AGGAC ACCCT CATGG 5 351 CCTCC CGGAC CCCTG AGGTC ACATG CGTGG TGGTG GACGT GAGCC ACGAA 5401 GACCC TGAGG TCAAG TTCAA CTGGT ACGTG GACGG CGTGG AGGTG CATAA 5451 TGCCA AGACA AAGCC GCGGG AGGAG CAGTA CAACA GCACG TACCG TGTGG 5501 TCAGC GTCCT CACCG TCCTG GCCCA GGACT GGCTG AATGG CAAGG AGTAC 5551 AAGTG CAAG G TCTCC AACAA AGCCC TCCCA GCCCC CATCG AGAAA ACCAT 5601 CTCCA AAGCC AAAGG GCAGC CCCGA GAACC ACAGG TGTAC ACCCT GCCCC 5651 CATCC CGGGA TGAGC TGACC AAGAA CCAGG TCAGC CTGAC CTGCC TGGTC 5701 AAAGG CTTCT ATCCC AGCGA CATCG CCGTG GAGTG GGAGA GCA AT GGGCA 5751 GCCGG AGAAC AACTA CAAGA CCACG CCTCC CGTGT TGGAC TCCGA C GGCT 5801 STTTS TTCCT STASA GCAAG CTCAC CGTGG ACAAG AGCAG GTGGC AGCAG 5851 GGGAA CGTCT TCTC A TGCTC CGTGA TGC AT GAGGC TCTGC AC A AC GCCT A 5901 CACGC AGAAG AGCCT CTCCC TGTCT CCGGG TAAAT GA

- 146 044115- 146 044115

Последовательность белка FVIII 283 (FVIII169 с тройной мутацией IHH)(SEQ ID NO: 161).FVIII 283 protein sequence (FVIII169 with triple IHH mutation) (SEQ ID NO: 161).

MQIELSTCFF LCLLRFCFSA TRRYYLGAVE LSWDYMQSDL GELPVDARFPMQIELSTCFF LCLLRFCFSA TRRYYLGAVE LSWDYMQSDL GELPVDARFP

PRVPKSFPFN TSVVYKKTLF VEFTDHLFNIAKPRPPWMGL LGPTIQAEVYPRVPKSFPFN TSVVYKKTLF VEFTDHLFNIAKPRPPWMGL LGPTIQAEVY

101 DTVVITLKNM ASHPVSLHAV GVSYWKASEG AEYDDQTSQR EKEDDKVFPG101 DTVVITLKNM ASHPVSLHAV GVSYWKASEG AEYDDQTSQR EKEDDKVFPG

151 GSHTYVWQVL KENGPMASDP LCLTYS YLSH VDLVKDLNSG LIGALLVCRE151 GSHTYVWQVL KENGPMASDP LCLTYS YLSH VDLVKDLNSG LIGALLVCRE

201 GSLAKEKTQT LHKFILLFAV FDEGKSWHSE TKNSLMQDRD AASARAWPKM201 GSLAKEKTQT LHKFILLFAV FDEGKSWHSE TKNSLMQDRD AASARWPKM

251 HTVNGYVNRS LPGLIGCHRK SVYWHVIGMG TTPEVHSIFL EGHTFLVRNH251 HTVNGYVNRS LPGLIGCHRK SVYWHVIGMG TTPEVHSIFL EGHTFLVRNH

301 RQASLEISPI TFLTAQTLLM DLGQFLLFCH ISSHQHDGME AYVKVDSCPE301 RQASLEISPI TFLTAQTLLM DLGQFLLFCH ISSHQHDGME AYVKVDSCPE

351 EPQLRMKNNE EAEDYDDDLT DSEMDVVRFD DDNSPSFIQI RSVAKKHPKT351 EPQLRMKNNE EAEDYDDDLT DSEMDVVRFD DDNSPSFIQI RSVAKKHPKT

401 WVHYIAAEEE DWDYAPLVLA PDDRSYKSQY LNNGPQRIGR KYKKVRFMAY401 WVHYIAAEEE DWDYAPLVLA PDDRSYKSQY LNNGPQRIGR KYKKVRFMAY

451 TDETFKTREAIQHESGILGP LLYGEVGDTL LIIFKNQASR PYNIYPHGIT451 TDETFKTREAIQHESGILGP LLYGEVGDTL LIIFKNQASR PYNIYPHGIT

501 DVRPLYSRRL PKGVKHLKDF PILPGEIFKY KWTVTVEDGP TKSDPRCLTR501 DVRPLYSRRL PKGVKHLKDF PILPGEIFKY KWTVTVEDGP TKSDPRCLTR

551 YYSSFVNMER DLASGLIGPL LICYKESVDQ RGNQIMSDKR NVILFSVFDE551 YYSSFVNMER DLASGLIGPL LICYKESVDQ RGNQIMSDKR NVILFSVFDE

601 NRSWYLTENI QRFLPNPAGV QLEDPEFQAS NIMHSINGYV FDSLQLSVCL601 NRSWYLTENI QRFLPNPAGV QLEDPEFQAS NIMHSINGYV FDSLQLSVCL

651 HEVAYWYILS IGAQTDFLSV FFSGYTFKHK MVYEDTLTLF PFSGETVFMS651 HEVAYWYILS IGAQTDFLSV FFSGYTFKHK MVYEDTLTLF PFSGETVFMS

701 MENPGLWILG CHNSDFRNRG MTALLKVSSC DKNTGDYYED SYEDISAYLL701 MENPGLWILG CHNSDFRNRG MTALLKVSSC DKNTGDYYED SYEDISAYLL

751 SKNNAIEPRS FSQNGAPGTS ESATPESGPG SEPATSGSET PGTSESATPE751 SKNNAIEPRS FSQNGAPGTS ESATPESGPG SEPATSGSET PGTSESATPE

801 SGPGSEPATS GSETPGTSES ATPESGPGTS TEPSEGSAPG SPAGSPTSTE801 SGPGSEPATS GSETPGTSES ATPESGPGTS TEPSEGSAPG SPAGSPTSTE

851 EGTSESATPE SGPGSEPATS GSETPGTSES ATPESGPGSP AGSPTSTEEG851 EGTSESATPE SGPGSEPATS GSETPGTSES ATPESGPGSP AGSPTSTEEG

901 SPAGSPTSTE EGTSTEPSEG SAPGTSESAT PESGPGTSES ATPESGPGTS901 SPAGSPTSTE EGTSTEPSEG SAPGTSESAT PESGPGTSES ATPESGPGTS

951 ESATPESGPG SEPATSGSET PGSEPATSGS ETPGSPAGSP TSTEEGTSTE951 ESATPESGPG SEPATSGSET PGSEPATSGS ETPGSPAGSP TSTEEGTSTE

1001 PSEGSAPGTS TEPSEGSAPG SEPATSGSET PGTSESATPE SGPGTSTEPS1001 PSEGSAPGTS TEPSEGSAPG SEPATSGSET PGTSESATPE SGPGTSTEPS

1051 EGSAPASSPP VLKRHQAEIT RTTLQSDQEE IDYDDTISVE MKKEDFDIYD1051 EGSAPASSPP VLKRHQAEIT RTTLQSDQEE IDYDDTISVE MKKEDFDIYD

1101 EDENQSPRSF QKKTRHYFIA AVERLWDYGM SSSPHVLRNR AQSGSVPQFK1101 EDENQSPRSF QKKTRHYFIA AVERLWDYGM SSSPHVLRNR AQSGSVPQFK

1151 KVVFQEFTDG SFTQPLYRGE LNEHLGLLGP YIRAEVEDNI MVTFRNQASR1151 KVVFQEFTDG SFTQPLYRGE LNEHLGLLGP YIRAEVEDNI MVTFRNQASR

1201 PYSFYSSLIS YEEDQRQGAE PRKNFVKPNE TKTYFWKVQH HMAPTKDEFD1201 PYSFYSSLIS YEEDQRQGAE PRKNFVKPNE TKTYFWKVQH HMAPTKDEFD

1251 CKAWAYFSDV DLEKDVHSGL IGPLLVCHTN TLNPAHGRQV TVQEFALFFT1251 CKAWAYFSDV DLEKDVHSGL IGPLLVCHTN TLNPAHGRQV TVQEFALFFT

1301 IFDETKSWYF TENMERNCRA PCNIQMEDPT FKENYRFHAI NGYIMDTLPG1301 IFDETKSWYF TENMERNCRA PCNIQMEDPT FKENYRFHAI NGYIMDTLPG

1351 LVMAQDQRIR WYLLSMGSNE NIHSIHFSGH VFTVRKKEEY KMALYNLYPG1351 LVMAQDQRIR WYLLSMGSNE NIHSIHFSGH VFTVRKKEEY KMALYNLYPG

1401 VFETVEMLPS KAGIWRVECLIGEHLHAGMS TLFLVYSNKC QTPLGMASGH1401 VFETVEMLPS KAGIWRVECLIGEHLHAGMS TLFLVYSNKC QTPLGMASGH

1451 IRDFQITASG QYGQWAPKLA RLHYSGSINA WSTKEPFSWI KVDLLAPMII1451 IRDFQITASG QYGQWAPKLA RLHYSGSINA WSTKEPFSWI KVDLLAPMII

1501 HGIKTQGARQ KFSSLYISQF IIMYSLDGKK WQTYRGNSTG TLMVFFGNVD1501 HGIKTQGARQ KFSSLYISQF IIMYSLDGKK WQTYRGNSTG TLMVFFGNVD

1551 SSGIKHNIFN PPIIARYIRL HPTHYSIRST LRMELMGCDL NSCSMPLGME1551 SSGIKHNIFN PPIIARYIRL HPTHYSIRST LRMELMGCDL NSSCSMPLGME

1601 SKAISDAQIT ASSYFTNMFA TWSPSKARLH LQGRSNAWRP QVNNPKEWLQ1601 SKAISDAQIT ASSYFTNMFA TWSPSKARLH LQGRSNAWRP QVNNPKEWLQ

1651 VDFQKTMKVT GVTTQGVKSL LTSMYVKEFLISSSQDGHQW TLFFQNGKVK1651 VDFQKTMKVT GVTTQGVKSL LTSMYVKEFLISSSQDGHQW TLFFQNGKVK

1701 VFQGNQDSFT PVVNSLDPPL LTRYLRIHPQ SWVHQIALRM EVLGCEAQDL1701 VFQGNQDSFT PVVNSLDPPL LTRYLRIHPQ SWVHQIALRM EVLGCEAQDL

1751 YDKTHTCPPC PAPELLGGPS VFLFPPKPKD TLMASRTPEV TCVVVDVSHE1751 YDKTHTCPPC PAPELLGGPS VFLFPPKPKD TLMASRTPEV TCVVVDVSHE

1801 DPEVKFNWYV DGVEVHNAKT KPREEQYNST YRVVSVLTVL AQDWLNGKEY1801 DPEVKFNWYV DGVEVHNAKT KPREEQYNST YRVVSVLTVL AQDWLNGKEY

1851 KCKVSNKALP APIEKTISKA KGQPREPQVY TLPPSRDELT KNQVSLTCLV1851 KCKVSNKALP APIEKTISKA KGQPREPQVY TLPPSRDELT KNQVSLTCLV

1901 KGFYPSDIAV EWESNGQPEN NYKTTPPVLD SDGSFFLYSK LTVDKSRWQQ1901 KGFYPSDIAV EWESNGQPEN NYKTTPPVLD SDGSFFLYSK LTVDKSRWQQ

1951 GNVFSCSVMH EALHNAYTQK SLSLSPGK*1951 GNVFSCSVMH EALHNAYTQK SLSLSPGK*

- 147 044115- 147 044115

Нуклеотидная последовательность pSYNFVIII 010-(двойная цепь FVIIIFc) (SEQ ID NO: 162).Nucleotide sequence of pSYNFVIII 010-(FVIIIFc double strand) (SEQ ID NO: 162).

ATGCAAATAG AGCTCTCCAC CTGCTTCTTT CTGTGCCTTT TGCGATTCTGATGCAAATAG AGCTCTCCAC CTGCTTCTTT CTGTGCCTTT TGCGATTCTG

CTTTAGTGCC ACCAGAAGAT ACTACCTGGG TGCAGTGGAA CTGTCATGGGCTTTAGTGCC ACCAGAAGAT ACTACCTGGG TGCAGTGGAA CTGTCATGGG

101 ACT AT ATGC A AAGTGATCTC GGTGAGCTGC CTGTGGACGC AAGATTTCCT101 ACT AT ATGC A AAGTGATCTC GGTGAGCTGC CTGTGGACGC AAGATTTCCT

151 CCTAGAGTGC СAAAATCTTT TCCATTCAAC ACCTCAGTCG TGTACAAAAA151 CCTAGAGTGC СAAAATCTTT TCCATTCAAC ACCTCAGTCG TGTACAAAAAA

201 GACTCTGTTT GT AGA ATTC A CGGATC ACCT ТТТС A AC АТС GCT A AGCC A A201 GACTCTGTTT GT AGA ATTC A CGGATC ACCT TTTC A AC ATC GCT A AGCC A A

251 GGCCACCCTG GATGGGTCTG CTAGGTCCTA CCATCCAGGC TGAGGTTTAT251 GGCCACCCTG GATGGGTCTG CTAGGTCCTA CCATCCAGGC TGAGGTTTAT

301 GAT AC AGTGG TC ATT AC ACT T AAGAACATG GCTTCCC АТС CTGTCAGTCT301 GAT AC AGTGG TC ATT AC ACT T AAGAACATG GCTTCCC ATC CTGTCAGTCT

351 TCATGCTGTT GGTGTATCCT ACTGGAAAGC TTCTGAGGGA GCTGAATATG351 TCATGCTGTT GGTGTATCCT ACTGGAAAGC TTCTGAGGGA GCTGAATATG

401 ATGATC AGAC C AGTC A A AGG GAGA A AGA AG ATGAT A A AGT CTTCCCTGGT401 ATGATC AGAC C AGTC A A AGG GAGA A AGA AG ATGAT A A AGT CTTCCCTGGT

451 GGAAGCCATA CATATGTCTG GCAGGTCCTG AAAGAGAATG GTCCAATGGC451 GGAAGCCATA CATATGTCTG GCAGGTCCTG AAAGAGAATG GTCCAATGGC

501 CTCTGACCCA CTGTGCCTTA CCTACTCATA TCTTTCTCAT GTGGACCTGG501 CTCTGACCCA CTGTGCCTTA CCTACTCATA TCTTTCTCAT GTGGACCTGG

551 TAAAAGACTT GAATTCAGGC CTCATTGGAG CCCTACTAGT ATGTAGAGAA551 TAAAAGACTT GAATTCAGGC CTCATTGGAG CCCTACTAGT ATGTAGAGAA

601 GGGAGTCTGG CC A AGGA A A A GAC AC AGACC TTGC AC A A AT TT AT ACT ACT601 GGGAGTCTGG CC A AGGA A A A GAC AC AGACC TTGC AC A A AT TT AT ACT ACT

651 TTTTGCTGTA TTTGATGAAG GGAAAAGTTG GCACTCAGAA ACAAAGAACT651 TTTTGCTGTA TTTGATGAAG GGAAAAGTTG GCACTCAGAA ACAAAGAACT

701 CCTTGATGCA GGATAGGGAT GCTGCATCTG CTCGGGCCTG GCCTAAAATG701 CCTTGATGCA GGATAGGGAT GCTGCATCTG CTCGGGCCTG GCCTAAAATG

751 CACACAGTCA ATGGTTATGT AAACAGGTCT CTGCCAGGTC TGATTGGATG751 CACACAGTCA ATGGTTATGT AAACAGGTCT CTGCCAGGTC TGATTGGATG

801 CCACAGGAAA TCAGTCTATT GGCATGTGAT TGGAATGGGC ACCACTCCTG801 CCACAGGAAA TCAGTCTATT GGCATGTGAT TGGAATGGGC ACCACTCCTG

851 AAGTGCACTC AATATTCCTC GAAGGTCACA CATTTCTTGT GAGGAACCAT851 AAGTGCACTC AATATTCCTC GAAGGTCACA CATTTCTTGT GAGGAACCAT

901 CGCC AGGCGT CCTTGGA A AT CTCGCC A AT A ACTTTCCTT A CTGCTC A A AC901 CGCC AGGCGT CCTTGGA A AT CTCGCC A AT A ACTTTCCTT A CTGCTC A A AC

951 ACTCTTGATG GACCTTGGAC AGTTTCTACT GTTTTGTCAT ATCTCTTCCC951 ACTCTTGATG GACCTTGGAC AGTTTCTACT GTTTTGTCAT ATCTCTTCCC

1001 ACCAACATGA TGGCATGGAA GCTTATGTCA AAGTAGACAG CTGTCCAGAG1001 ACCAACATGA TGGCATGGAA GCTTATGTCA AAGTAGACAG CTGTCCAGAG

1051 GAACCCCAAC TACGAATGAA AAATAATGAA GAAGCGGAAG ACTATGATGA1051 GAACCCCAAC TACGAATGAA AAATAATGAA GAAGCGGAAG ACTATGATGA

1101 TGATCTT ACT GATTCTGA A A TGGATGTGGT C AGGTTTGAT GATGAC A ACT1101 TGATCTT ACT GATTCTGA A A TGGATGTGGT C AGGTTTGAT GATGAC A ACT

1151 CTCCTTCCTT TATCC AAATT CGCTC AGTTG CCAAGAAGCA TCCT AAA ACT1151 CTCCTTCCTT TATCC AAATT CGCTC AGTTG CCAAGAAGCA TCCT AAA ACT

1201 TGGGT AC ATT AC ATTGCTGC TGA AGAGGAG G ACTGGGACT ATGCTCCCTT1201 TGGGT AC ATT AC ATTGCTGC TGA AGAGGAG G ACTGGGACT ATGCTCCCTT

1251 AGTCCTCGCC CCCGATGACA GAAGTTATAA AAGTCAATAT TTGAACAATG1251 AGTCCTCGCC CCCGATGACA GAAGTTATAA AAGTCAATAT TTGAACAATG

1301 GCCCTCAGCG GATTGGTAGG AAGTACAAAA AAGTCCGATT TATGGCATAC1301 GCCCTCAGCG GATTGGTAGG AAGTACAAAA AAGTCCGATT TATGGCATAC

1351 AC AGATGA AA CCTTT AAGAC TCGTGA AGCT ATTC AGC ATG А АТС AGGA AT1351 AC AGATGA AA CCTTT AAGAC TCGTGA AGCT ATTC AGC ATG A ATC AGGA AT

1401 CTTGGGACCT TT ACTTT ATG GGGA AGTTGG AGAC AC ACTG TTGATT AT AT1401 CTTGGGACCT TT ACTTT ATG GGGA AGTTGG AGAC AC ACTG TTGATT AT AT

- 148 044115- 148 044115

1451 TTAAGAATCA AGCAAGCAGA CCATATAACA ТСТACCCTCA CGGAATCACT1451 TTAAGAATCA AGCAAGCAGA CCATATAACA TСTACCCTCA CGGAATCACT

1501 GATGTCCGTC CTTTGTATTC AAGGAGATTA CCAAAAGGTG TAAAACATTT 1551 GA AGGATTTT CC A ATTCTGC C AGGAGA A AT ATTC A A AT AT A A ATGGAC AG1501 GATGTCCGTC CTTTGTATTC AAGGAGATTA CCAAAAGGTG TAAAACATTT 1551 GA AGGATTTT CC A ATTCTGC C AGGAGA A AT ATTC A A AT AT A A ATGGAC AG

1601 TGACTGTAGA AGATGGGCCA ACTAAATCAG ATCCTCGGTG CCTGACCCGC1601 TGACTGTAGA AGATGGGCCA ACTAAATCAG ATCCTCGGTG CCTGACCCGC

1651 TATTACTCTA GTTTCGTTAA TATGGAGAGA GATCTAGCTT CAGGACTCAT 1701 TGGCCCTCTC CTCATCTGCT ACAAAGAATC TGTAGATCAA AGAGGAAACC1651 TATTACTCTA GTTTCGTTAA TATGGAGAGA GATCTAGCTT CAGGACTCAT 1701 TGGCCCTCTC CTCATCTGCT ACAAAGAATC TGTAGATCAA AGAGGAAACC

1751 AGATAATGTC AGACAAGAGG AATGTCATCC TGTTTTCTGT ATTTGATGAG 1801 AACCGAAGCT GGTACCTCAC AGAGAATATA CAACGCTTTC TCCCCAATCC 1851 AGCTGG AGTG C AGCTTGAGG ATCC AGAGTT CC A AGCCTCC A AC АТС ATGC1751 AGATAATGTC AGACAAGAGG AATGTCATCC TGTTTTCTGT ATTTGATGAG 1801 AACCGAAGCT GGTACCTCAC AGAGAATATA CAACGCTTTC TCCCCAATCC 1851 AGCTGG AGTG C AGCTTGAGG ATCC AGAGTT CC A AGCCTCC A AC ATC ATGC

1901 ACAGCATCAA TGGCTATGTT TTTGATAGTT TGCAGTTGTC AGTTTGTTTG1901 ACAGCATCAA TGGCTATGTT TTTGATAGTT TGCAGTTGTC AGTTTGTTTG

1951 CATGAGGTGG CATACTGGTA CATTCTAAGC ATTGGAGCAC AGACTGACTT 2001 CCTTTCTGTC TTCTTCTCTG GAT AT ACCTT C A A AC AC A A A ATGGTCT ATG1951 CATGAGGTGG CATACTGGTA CATTCTAAGC ATTGGAGCAC AGACTGACTT 2001 CCTTTCTGTC TTCTTCTCTG GAT AT ACCTT C A A AC AC A A A ATGGTCT ATG

2051 AAGACACACT CACCCTATTC CCATTCTCAG GAGAAACTGT CTTCATGTCG 2101 ATGGA A A ACC C AGGTCT ATG GATTCTGGGG TGCC AC A ACT C AGACTTTCG2051 AAGACACACT CACCCTATTC CCATTCTCAG GAGAAACTGT CTTCATGTCG 2101 ATGGA A A ACC C AGGTCT ATG GATTCTGGGG TGCC AC A ACT C AGACTTTCG

2151 GA AC AGAGGC ATGACCGCCT T ACTGA AGGT TTCT AGTTGT GAC A AG A AC A2151 GA AC AGAGGC ATGACCGCCT T ACTGA AGGT TTCT AGTTGT GAC A AG A AC A

2201 CTGGTGATTA TTACGAGGAC AGTTATGAAG ATATTTCAGC ATACTTGCTG2201 CTGGTGATTA TTACGAGGAC AGTTATGAAG ATATTTCAGC ATACTTGCTG

2251 AGTAAAAACA ATGCCATTGA ACCAAGAAGC TTCTCTCAAA ACCCACCAGT2251 AGTAAAACA ATGCCATTGA ACCAAGAAGC TTCTCTCAAA ACCCACCAGT

2301 CTTGAAACGC CATCAACGGG AAATAACTCG TACTACTCTT CAGTCAGATC 2351 A AGAGGA A AT TGACTATGAT GAT ACC AT AT C AGTTGA A AT GA AGA AGGA A2301 CTTGAAACGC CATCAACGGG AAATAACTCG TACTACTCTT CAGTCAGATC 2351 A AGAGGA A AT TGACTATGAT GAT ACC AT AT C AGTTGA A AT GA AGA AGGA A

2401 GATTTTGACA TTTATGATGA GGATGAAAAT CAGAGCCCCC GCAGCTTTCA 2451 AAAGAAAACA CGACACTATT TTATTGCTGC AGTGGAGAGG CTCTGGGATT2401 GATTTTGACA TTTATGATGA GGATGAAAAT CAGAGCCCCC GCAGCTTTCA 2451 AAAGAAAACA CGACACTATT TTATTGCTGC AGTGGAGAGG CTCTGGGATT

2501 ATGGGATGAG TAGCTCCCCA CATGTTCTAA GAAACAGGGC TCAGAGTGGC2501 ATGGGATGAG TAGCTCCCCA CATGTTCTAA GAAACAGGGC TCAGAGTGGC

2551 AGTGTCCCTC AGTTC A AG AA AGTTGTTTTC C AGGA ATTT A CTGATGGCTC2551 AGTGTCCCTC AGTTC A AG AA AGTTGTTTTC C AGGA ATTT A CTGATGGCTC

2601 CTTTACTCAG CCCTTATACC GTGGAGAACT AAATGAACAT TTGGGACTCC 2651 TGGGGCCATA TATAAGAGCA GAAGTTGAAG ATAATATCAT GGTAACTTTC2601 CTTTACTCAG CCCTTATACC GTGGAGAACT AAATGAACAT TTGGGACTCC 2651 TGGGGCCATA TATAAGAGCA GAAGTTGAAG ATAATTCAT GGTAACTTTC

2701 AGAAATCAGG CCTCTCGTCC CTATTCCTTC TATTCTAGCC TTATTTCTTA2701 AGAAATCAGG CCTCTCGTCC CTATTCCTTC TATTCTAGCC TTATTTCTTA

2751 TGAGGAAGAT CAGAGGCAAG GAGCAGAACC TAGAAAAAAC TTTGTCAAGC 2801 CTAATGAAAC CAAAACTTAC TTTTGGAAAG TGCAACATCA TATGGCACCC 2851 ACTAAAGATG AGTTTGACTG CAAAGCCTGG GCTTATTTCT CTGATGTTGA 2901 CCTGGAAAAA GATGTGCACT CAGGCCTGAT TGGACCCCTT CTGGTCTGCC 2951 ACACTAACAC ACTGAACCCT GCTCATGGGA GACAAGTGAC AGTACAGGAA 3001 TTTGCTCTGT TTTTCACCAT CTTTGATGAG ACCAAAAGCT GGTACTTCAC2751 TGAGGAAGAT CAGAGGCAAG GAGCAGAACC TAGAAAAAAC TTTGTCAAGC 2801 CTAATGAAAC CAAAACTTAC TTTTGGAAAG TGCAACATCA TATGGCACCC 2851 ACTAAAGATG AGTTTGACTG CAAAGCCTGG GCTTATTTCT CTGATGTTGA 2901 CCTGGAAAAA GATGTGCACT CAGGCCTGAT TG GACCCCTT CTGGTCTGCC 2951 ACACTAACAC ACTGAACCCT GCTCATGGGA GACAAGTGAC AGTACAGGAA 3001 TTTGCTCTGT TTTTCACCAT CTTTGATGAG ACCAAAAGCT GGTACTTCAC

3051 TGAAAATATG GAAAGAAACT GCAGGGCTCC CTGCAATATC CAGATGGAAG3051 TGAAAATATG GAAAGAAACT GCAGGGCTCC CTGCAATATC CAGATGGAAG

3101 ATCCC ACTTT T A A AGAGA AT T ATCGCTTCC ATGC А АТС A A TGGCT AC AT A3101 ATCCC ACTTT T A A AGAGA AT T ATCGCTTCC ATGC A ATC A A TGGCT AC AT A

3151 ATGGAT AC AC T ACCTGGCTT AGT AATGGCT CAGGATCAAA GGATTCGATG3151 ATGGAT AC AC T ACCTGGCTT AGT AATGGCT CAGGATCAAA GGATTCGATG

3201 GTATCTGCTC AGCATGGGCA GCAATGAAAA CATCCATTCT ATTCATTTCA3201 GTATCTGCTC AGCATGGGCA GCAATGAAAA CATCCATTCT ATTCATTTCA

3251 GTGGACATGT GTTCACTGTA CGAAAAAAAG AGGAGTATAA AATGGCACTG 3301 TACAATCTCT ATCCAGGTGT TTTTGAGACA GTGGAAATGT TACCATCCAA3251 GTGGACATGT GTTCACTGTA CGAAAAAAAG AGGAGTATAA AATGGCACTG 3301 TACAATCTCT ATCCAGGTGT TTTTGAGACA GTGGAAATGT TACCATCCAA

- 149 044115- 149 044115

3351 AGCTGGAATT TGGCGGGTGG AATGCCTTAT TGGCGAGCAT CTACATGCTG 3401 GGATGAGCAC ACTTTTTCTG GTGTACAGCA ATAAGTGTCA GACTCCCCTG 3451 GGAATGGCTT CTGGACACAT TAGAGATTTT CAGATTACAG CTTCAGGACA 3501 ATATGGACAG TGGGCCCCAA AGCTGGCCAG ACTTCATTAT TCCGGATCAA 3551 TCAATGCCTG GAGCACCAAG GAGCCCTTTT CTTGGATCAA GGTGGATCTG 3601 TTGGCACCAA TGATTATTCA CGGCATCAAG ACCCAGGGTG CCCGTCAGAA 3651 GTTCTCCAGC CTCTACATCT CTCAGTTTAT CATCATGTAT AGTCTTGATG3351 AGCTGGAATT TGGCGGGTGG AATGCCTTAT TGGCGAGCAT CTACATGCTG 3401 GGATGAGCAC ACTTTTTCTG GTGTACAGCA ATAAGTGTCA GACTCCCCTG 3451 GGAATGGCTT CTGGACACAT TAGAGATTTT CAGATTACAG CTTCAGGACA 3501 ATATGGACAG TGGGCCCCAA AGCTGGCCAG AC TTCATTAT TCCGGATCAA 3551 TCAATGCCTG GAGCACCAAG GAGCCCTTTT CTTGGATCAA GGTGGATCTG 3601 TTGGCACCAA TGATTATTCA CGGCATCAAG ACCCAGGGTG CCCGTCAGAA 3651 GTTCTCCAGC CTCTACATCT CTCAGTTTAT CATCATGTAT AGTCTTGATG

3701 GGAAGAAGTG GCAGACTTAT CGAGGAAATT CCACTGGAAC CTTAATGGTC 3751 TTCTTTGGCA ATGTGGATTC ATCTGGGATA AAACACAATA TTTTTAACCC 3801 TCCAATTATT GCTCGATACA TCCGTTTGCA CCCAACTCAT TATAGCATTC 3851 GCAGC ACTCT TCGC ATGGAG TTGATGGGCT GTGATTT A A A T AGTTGC AGC 3901 ATGCCATTGG GAATGGAGAG TAAAGCAATA TCAGATGCAC AGATTACTGC3701 GGAAGAAGTG GCAGACTTAT CGAGGAAATT CCACTGGAAC CTTAATGGTC 3751 TTCTTTGGCA ATGTGGATTC ATCTGGGATA AAACACAATA TTTTTAACCC 3801 TCCAATTATT GCTCGATACA TCCGTTTGCA CCCAACTCAT TATAGCATTC 3851 GCAGC ACTCT TCGC ATGGAG TTGATGGGCT GTG ATTT A A A T AGTTGC AGC 3901 ATGCCATTGG GAATGGAGAG TAAAGCAATA TCAGATGCAC AGATTACTGC

3951 TTCATCCTAC TTTACCAATA TGTTTGCCAC CTGGTCTCCT TCAAAAGCTC3951 TTCATCCTAC TTTACCAATA TGTTTGCCAC CTGGTCTCCT TCAAAAGCTC

4001 GACTTC ACCT CC A AGGGAGG AGT A ATGCCT GGAGACCTC A GGTGA AT A AT 4051 CCAAAAGAGT GGCTGCAAGT GGACTTCCAG AAGACAATGA AAGTCACAGG4001 GACTTC ACCT CC A AGGGAGG AGT A ATGCCT GGAGACCTC A GGTGA AT A AT 4051 CCAAAAGAGT GGCTGCAAGT GGACTTCCAG AAGACAATGA AAGTCACAGG

4101 AGT A ACT ACT C AGGG AGT A A A ATCTCTGCT T ACC AGC ATG T ATGTGA AGG 4151 AGTTCCTCAT CTCCAGCAGT CAAGATGGCC АТСAGTGGAC TCTCTTTTTT4101 AGT A ACT ACT C AGGG AGT A A A ATCTCTGCT T ACC AGC ATG T ATGTGA AGG 4151 AGTTCCTCAT CTCCAGCAGT CAAGATGGCC ATCAGTGGAC TCTCTTTTTT

4201 C AGA ATGGC A AAGT A A AGGT TTTTC AGGGA А АТС A AGACT CCTTC AC ACC 4251 TGTGGTGAAC TCTCTAGACC CACCGTTACT GACTCGCTAC CTTCGAATTC 4301 ACCCCCAGAG TTGGGTGCAC CAGATTGCCC TGAGGATGGA GGTTCTGGGC4201 C AGA ATGGC A AAGT A A AGGT TTTTC AGGGA A ATC A AGACT CCTTC AC ACC 4251 TGTGGTGAAC TCTCTAGACC CACCGTTACT GACTCGCTAC CTTCGAATTC 4301 ACCCCCAGAG TTGGGTGCAC CAGATTGCCC TGAGGATGGA GGTTCTGGGC

51 TGCGAGGCAC AGGACCTCTA CGACAAAACT CACACATGCC CACCGTGCCC 4401 AGCTCC AGA A CTCCTGGGCG GACCGTC AGT CTTCCTCTTC CCCCC A A A AC 4451 CCAAGGACAC CCTCATGATC TCCCGGACCC CTGAGGTCAC ATGCGTGGTG 4501 GTGGACGTGA GCCACGAAGA CCCTGAGGTC AAGTTCAACT GGTACGTGGA51 TGCGAGGCAC AGGACCTCTA CGACAAAACT CACACATGCC CACCGTGCCC 4401 AGCTCC AGA A CTCCTGGGCG GACCGTC AGT CTTCCTCTTC CCCCC A A A AC 4451 CCAAGGACAC CCTCATGATC TCCCGGACCC CTGAGGTCAC ATGCGTGGTG 4501 GTGGACGTGA GCCACGAAGA CCCTGA GGTC AAGTTCAACT GGTACGTGGA

4551 CGGCGTGG AG GTGC AT A ATG CCA AGAC A A A GCCGCGGG AG GAGC AGT AC A 4601 ACAGCACGTA CCGTGTGGTC AGCGTCCTCA CCGTCCTGCA CCAGGACTGG 4651 CTGAATGGCA AGGAGTACAA GTGCAAGGTC TCCAACAAAG CCCTCCCAGC 4701 CCCCATCGAG AAAACCATCT CC AAAGCC AA AGGGCAGCCC CGAGA ACC AC 4751 AGGTGTACAC CCTGCCCCCA TCCCGGGATG AGCTGACCAA GAACCAGGTC 4801 AGCCTGACCT GCCTGGTCAA AGGCTTCTAT CCCAGCGACA TCGCCGTGGA 4851 GTGGGAGAGC AATGGGCAGC CGGAGAACAA CTACAAGACC ACGCCTCCCG 4901 TGTTGGACTC CGACGGCTCC TTCTTCCTCT ACAGCAAGCT CACCGTGGAC 4951 AAGAGCAGGT GGCAGCAGGG GAACGTCTTC TCATGCTCCG TGATGCATGA 5001 GGCTCTGCAC AACCACTACA CGCAGAAGAG CCTCTCCCTG TCTCCGGGTA 5051 AATGA4551 CGGCGTGG AG GTGC AT A ATG CCA AGAC A A A GCCGCGGG AG GAGC AGT AC A 4601 ACAGCACGTA CCGTGTGGTC AGCGTCCTCA CCGTCCTGCA CCAGGACTGG 4651 CTGAATGGCA AGGAGTACAA GTGCAAGGTC TCCAACAAAG CCCTCCCAGC 4701 CCCCATCGAG AAAACCATCT CC AAAGCC AA AGGGCAGCCC CGAGA ACC AC 4751 AGGTGTACAC CCTGCCCCCA TCCCGGGATG AGCTGACCAA GAACCAGGTC 4801 AGCCTGACCT GCCTGGTCAA AGGCTTCTAT CCCAGCGACA TCGCCGTGGA 4851 GTGGGAGAGC AATGGGCAGC CGGAGAACAA CTACAAGACC ACGCCTCCCG 4901 TGTTGGACTC CGACGGCTCC TTCTTCCTCT ACAGCAAGCT CACCGTGGAC 4951 AAGAGCAGGT GGCAGCAGGG GAACGTCTTC TCATGCTCCG TGATGCATGA 5001 GGCTCTGCAC AACCACTACA CGCAGAAG AG CCTCTCCCTG TCTCCGGGTA 5051 AATGA

- 150 044115- 150 044115

Последовательность белка pSYNFVIII 010-(двойная цепь FVIIIFc) (SEQ ID NO: 163).Protein sequence of pSYNFVIII 010-(FVIIIFc double strand) (SEQ ID NO: 163).

MQIELSTCFF LCLLRFCFSA TRRYYLGAVE LSWDYMQSDL GELPVDARFPMQIELSTCFF LCLLRFCFSA TRRYYLGAVE LSWDYMQSDL GELPVDARFP

PRVPKSFPFN TSVVYKKTLF VEFTDHLFNI AKPRPPWMGL LGPTIQAEVYPRVPKSFPFN TSVVYKKTLF VEFTDHLFNI AKPRPPWMGL LGPTIQAEVY

101 DTVVITLKNM ASHPVSLHAV GVSYWKASEG AEYDDQTSQR EKEDDKVFPG101 DTVVITLKNM ASHPVSLHAV GVSYWKASEG AEYDDQTSQR EKEDDKVFPG

151 GSHTYVWQVL KENGPMASDP LCLTYSYLSH VDLVKDLNSG LIGALLVCRE151 GSHTYVWQVL KENGPMASDP LCLTYSYLSH VDLVKDLNSG LIGALLVCRE

201 GSLAKEKTQT LHKFILLFAV FDEGKSWHSE TKNSLMQDRD AASARAWPKM201 GSLAKEKTQT LHKFILLFAV FDEGKSWHSE TKNSLMQDRD AASARWPKM

251 HTVNGYVNRS LPGLIGCHRK SVYWHVIGMG TTPEVHSIFL EGHTFLVRNH251 HTVNGYVNRS LPGLIGCHRK SVYWHVIGMG TTPEVHSIFL EGHTFLVRNH

301 RQASLEISPI TFLTAQTLLM DLGQFLLFCH ISSHQHDGME AYVKVDSCPE 351 EPQLRMKNNE EAEDYDDDLT DSEMDVVRFD DDNSPSFIQI RSVAKKHPKT 401 WVHYIAAEEE DWDYAPLVLA PDDRSYKSQY LNNGPQRIGR KYKKVRFMAY 451 TDETFKTREA IQHESGILGP LLYGEVGDTL LIIFKNQASR PYNIYPHGIT 501 DVRPLYSRRL PKGVKHLKDF PILPGEIFKY KWTVTVEDGP TKSDPRCLTR301 RQASLEISPI TFLTAQTLLM DLGQFLLFCH ISSHQHDGME AYVKVDSCPE 351 EPQLRMKNNE EAEDYDDDLT DSEMDVVRFD DDNSPSFIQI RSVAKKHPKT 401 WVHYIAAEEE DWDYAPLVLA PDDRSYKSQY LNNGPQRIGR KYKKVRFMAY 451 TDETF KTREA IQHESGILGP LLYGEVGDTL LIIFKNQASR PYNIYPHGIT 501 DVRPLYSRRL PKGVKHLKDF PILPGEIFKY KWTVTVEDGP TKSDPRCLTR

551 YYSSFVNMER DLASGLIGPL LICYKESVDQ RGNQIMSDKR NVILFSVFDE551 YYSSFVNMER DLASGLIGPL LICYKESVDQ RGNQIMSDKR NVILFSVFDE

601 NRSWYLTENI QRFLPNPAGV QLEDPEFQAS NIMHSINGYV FDSLQLSVCL601 NRSWYLTENI QRFLPNPAGV QLEDPEFQAS NIMHSINGYV FDSLQLSVCL

651 HEVAYWYILS IGAQTDFLSV FFSGYTFKHK MVYEDTLTLF PFSGETVFMS651 HEVAYWYILS IGAQTDFLSV FFSGYTFKHK MVYEDTLTLF PFSGETVFMS

701 MENPGLWILG CHNSDFRNRG MTALLKVSSC DKNTGDYYED SYEDISAYLL 751 SKNNAIEPRS FSQNPPVLKR HQREITRTTL QSDQEEIDYD DTISVEMKKE 801 DFDIYDEDEN QSPRSFQKKT RHYFIAAVER LWDYGMSSSP HVLRNRAQSG 851 SVPQFKKVVF QEFTDGSFTQ PLYRGELNEH LGLLGPYIRA EVEDNIMVTF701 MENPGLWILG CHNSDFRNRG MTALLKVSSC DKNTGDYYED SYEDISAYLL 751 SKNNAIEPRS FSQNPPVLKR HQREITRTTL QSDQEEIDYD DTISVEMKKE 801 DFDIYDEDEN QSPRSFQKKT RHYFIAAVER LWDYGMSSSP HVLRNRAQSG 851 SVPQFKK VVF QEFTDGSFTQ PLYRGELNEH LGLLGPYIRA EVEDNIMVTF

901 RNQASRPYSF YSSLISYEED QRQGAEPRKN FVKPNETKTY FWKVQHHMAP 951 TKDEFDCKAW AYFSDVDLEK DVHSGLIGPL LVCHTNTLNP AHGRQVTVQE 1001 FALFFTIFDE TKSWYFTENM ERNCRAPCNI QMEDPTFKEN YRFHAINGYI901 RNQASRPYSF YSSLISYEED QRQGAEPRKN FVKPNETKTY FWKVQHHMAP 951 TKDEFDCKAW AYFSDVDLEK DVHSGLIGPL LVCHTNTLNP AHGRQVTVQE 1001 FALFFTIFDE TKSWYFTENM ERNCRAPCNI QMEDPTFKEN YRFHAINGYI

1051 MDTLPGLVMA QDQRIRWYLL SMGSNENIHS IHFSGHVFTV RKKEEYKMAL 1101 YNLYPGVFET VEMLPSKAGIWRVECLIGEH LHAGMSTLFL VYSNKCQTPL1051 MDTLPGLVMA QDQRIRWYLL SMGSNENIHS IHFSGHVFTV RKKEEYKMAL 1101 YNLYPGVFET VEMLPSKAGIWRVECLIGEH LHAGMSTLFL VYSNKCQTPL

1151 GMASGHIRDF QITASGQYGQ WAPKLARLHY SGSINAWSTK EPFSWIKVDL1151 GMASGHIRDF QITASGQYGQ WAPKLARLHY SGSINAWSTK EPFSWIKVDL

1201 LAPMIIHGIK TQGARQKFSS LYISQFIIMY SLDGKKWQTY RGNSTGTLMV 1251 FFGNVDSSGI KHNIFNPPII ARYIRLHPTH YSIRSTLRME LMGCDLNSCS1201 LAPMIIHGIK TQGARQKFSS LYISQFIIMY SLDGKKWQTY RGNSTGTLMV 1251 FFGNVDSSGI KHNIFNPPII ARYIRLHPTH YSIRSTLRME LMGCDLNSCS

1301 MPLGMESKAI SDAQITASSY FTNMFATWSP SKARLHLQGR SNAWRPQVNN 1351 PKEWLQVDFQ KTMKVTGVTT QGVKSLLTSM YVKEFLISSS QDGHQWTLFF 1401 QNGKVKVFQG NQDSFTPVVN SLDPPLLTRY LRIHPQSWVH QIALRMEVLG1301 MPLGMESKAI SDAQITASSY FTNMFATWSP SKARLHLQGR SNAWRPQVNN 1351 PKEWLQVDFQ KTMKVTGVTT QGVKSLLTSM YVKEFLISSS QDGHQWTLFF 1401 QNGKVKVFQG NQDSFTPVVN SLDPPLLTRY LRIHPQSWVH QIALRMEVLG

1451 CEAQDLYDKT HTCPPCPAPE LLGGPSVFLF PPKPKDTLMI SRTPEVTCVV1451 CEAQDLYDKT HTCPPCPAPE LLGGPSVFLF PPKPKDTLMI SRTPEVTCVV

1501 VDVSHEDPEV KFNWYVDGVE VHNAKTKPRE EQYNSTYRVV SVLTVLHQDW 1551 LNGKEYKCKV SNKALPAPIE KTISKAKGQP REPQVYTLPP SRDELTKNQV 1601 SLTCLVKGFY PSDIAVEWES NGQPENNYKT TPPVLDSDGS FFLYSKLTVD1501 VDVSHEDPEV KFNWYVDGVE VHNAKTKPRE EQYNSTYRVV SVLTVLHQDW 1551 LNGKEYKCKV SNKALPAPIE KTISKAKGQP REPQVYTLPP SRDELTKNQV 1601 SLTCLVKGFY PSDIAVEWES NGQPENNYKT TPPVLDSDGS FFLYSK LTVD

1651 KSRWQQGNVF SCSVMHEALH NHYTQKSLSL SPGK*1651 KSRWQQGNVF SCSVMHEALH NHYTQKSLSL SPGK*

- 151 044115- 151 044115

Последовательность белка FVIII195 (двойная цепь FVIIIFc с двумя 144 АЕ XTENs в аминокислотеFVIII195 protein sequence (double chain FVIIIFc with two 144 AE XTENs per amino acid

1656 и 1900) (SEO ID NO: 73).1656 and 1900) (SEO ID NO: 73).

MQIELSTCFF LCLLRFCFSA TRRYYLGAVE LSWDYMQSDL GELPVDARFPMQIELSTCFF LCLLRFCFSA TRRYYLGAVE LSWDYMQSDL GELPVDARFP

PRVPKSFPFN TSVVYKKTLF VEFTDHLFNI AKPRPPWMGL LGPTIQAEVYPRVPKSFPFN TSVVYKKTLF VEFTDHLFNI AKPRPPWMGL LGPTIQAEVY

101 DTVVITLKNM ASHPVSLHAV GVSYWKASEG AEYDDQTSQR EKEDDKVFPG101 DTVVITLKNM ASHPVSLHAV GVSYWKASEG AEYDDQTSQR EKEDDKVFPG

151 GSHTYVWQVL KENGPMASDP LCLTYSYLSH VDLVKDLNSG LIGALLVCRE151 GSHTYVWQVL KENGPMASDP LCLTYSYLSH VDLVKDLNSG LIGALLVCRE

201 GSLAKEKTQT LHKFILLFAV FDEGKSWHSE TKNSLMQDRD AASARAWPKM201 GSLAKEKTQT LHKFILLFAV FDEGKSWHSE TKNSLMQDRD AASARWPKM

251 HTVNGYVNRS LPGLIGCHRK SVYWHVIGMG TTPEVHSIFL EGHTFLVRNH251 HTVNGYVNRS LPGLIGCHRK SVYWHVIGMG TTPEVHSIFL EGHTFLVRNH

301 RQASLEISPI TFLTAQTLLM DLGQFLLFCH ISSHQHDGME AYVKVDSCPE301 RQASLEISPI TFLTAQTLLM DLGQFLLFCH ISSHQHDGME AYVKVDSCPE

351 EPQLRMKNNE EAEDYDDDLT DSEMDVVRFD DDNSPSFIQI RSVAKKHPKT351 EPQLRMKNNE EAEDYDDDLT DSEMDVVRFD DDNSPSFIQI RSVAKKHPKT

401 WVHYIAAEEE DWDYAPLVLA PDDRSYKSQY LNNGPQRIGR KYKKVRFMAY401 WVHYIAAEEE DWDYAPLVLA PDDRSYKSQY LNNGPQRIGR KYKKVRFMAY

451 TDETFKTREA IQHESGILGP LLYGEVGDTL LIIFKNQASR PYNIYPHGIT451 TDETFKTREA IQHESGILGP LLYGEVGDTL LIIFKNQASR PYNIYPHGIT

501 DVRPLYSRRL PKGVKHLKDF PILPGEIFKY KWTVTVEDGP TKSDPRCLTR501 DVRPLYSRRL PKGVKHLKDF PILPGEIFKY KWTVTVEDGP TKSDPRCLTR

551 YYSSFVNMER DLASGLIGPL LICYKESVDQ RGNQIMSDKR NVILFSVFDE551 YYSSFVNMER DLASGLIGPL LICYKESVDQ RGNQIMSDKR NVILFSVFDE

601 NRSWYLTENI QRFLPNPAGV QLEDPEFQAS NIMHSINGYV FDSLQLSVCL601 NRSWYLTENI QRFLPNPAGV QLEDPEFQAS NIMHSINGYV FDSLQLSVCL

651 HEVAYWYILS IGAQTDFLSV FFSGYTFKHK MVYEDTLTLF PFSGETVFMS651 HEVAYWYILS IGAQTDFLSV FFSGYTFKHK MVYEDTLTLF PFSGETVFMS

701 MENPGLWILG CHNSDFRNRG MTALLKVSSC DKNTGDYYED SYEDISAYLL701 MENPGLWILG CHNSDFRNRG MTALLKVSSC DKNTGDYYED SYEDISAYLL

751 SKNNAIEPRS FSQNPPVLKR HQREITRTTL QGAPGTPGSG TASSSPGASP751 SKNNAIEPRS FSQNPPVLKR HQREITRTTL QGAPGTPGSG TASSSPGASP

801 GTSSTGSPGA SPGTSSTGSP GASPGTSSTG SPGSSPSAST GTGPGTPGSG801 GTSSTGSPGA SPGTSSTGSP GASPGTSSTG SPGSSPSAST GTGPGTPGSG

851 TASSSPGASP GTSSTGSPGA SPGTSSTGSP GASPGTSSTG SPGSSTPSGA851 TASSSPGASP GTSSTGSPGA SPGTSSTGSP GASPGTSSTG SPGSSTPSGA

901 TGSPGSSTPS GATGSPGASP GTSSTGSPAS SSDQEEIDYD DTISVEMKKE901 TGSPGSSTPS GATGSPGASP GTSSTGSPAS SSDQEEIDYD DTISVEMKKE

951 DFDIYDEDEN QSPRSFQKKT RHYFIAAVER LWDYGMSSSP HVLRNRAQSG951 DFDIYDEDEN QSPRSFQKKT RHYFIAAVER LWDYGMSSSP HVLRNRAQSG

1001 SVPQFKKVVF QEFTDGSFTQ PLYRGELNEH LGLLGPYIRA EVEDNIMVTF1001 SVPQFKKVVF QEFTDGSFTQ PLYRGELNEH LGLLGPYIRA EVEDNIMVTF

1051 RNQASRPYSF YSSLISYEED QRQGAEPRKN FVKPNETKTY FWKVQHHMAP1051 RNQASRPYSF YSSLISYEED QRQGAEPRKN FVKPNETKTY FWKVQHHMAP

1101 TKDEFDCKAW AYFSDVDLEK DVHSGLIGPL LVCHTNTLNP AHGRQVTVQE1101 TKDEFDCKAW AYFSDVDLEK DVHSGLIGPL LVCHTNTLNP AHGRQVTVQE

1151 FALFFTIFDE TKSWYFTENM ERNCRGAPTS ESATPESGPG SEPATSGSET1151 FALFFTIFDE TKSWYFTENM ERNCRGAPTS ESATPESGPG SEPATSGSET

1201 PGTSESATPE SGPGSEPATS GSETPGTSES ATPESGPGTS TEPSEGSAPG1201 PGTSESATPE SGPGSEPATS GSETPGTSES ATPESGPGTS TEPSEGSAPG

1251 TSESATPESG PGSPAGSPTS TEEGSPAGSP TSTEEGSPAG SPTSTEEGTS1251 TSESATPESG PGSPAGSPTS TEEGSPAGSP TSTEEGSPAG SPTSTEEGTS

1301 ESATPESGPG TSTEPSEGSA PGASSAPCNI QMEDPTFKEN YRFHAINGYI1301 ESATPESGPG TSTEPSEGSA PGASSAPCNI QMEDPTFKEN YRFHAINGYI

1351 MDTLPGLVMA QDQRIRWYLL SMGSNENIHS IHFSGHVFTV RKKEEYKMAL1351 MDTLPGLVMA QDQRIRWYLL SMGSNENIHS IHFSGHVFTV RKKEEYKMAL

1401 YNLYPGVFET VEMLPSKAGIWRVECLIGEH LHAGMSTLFL VYSNKCQTPL1401 YNLYPGVFET VEMLPSKAGIWRVECLIGEH LHAGMSTLFL VYSNKCQTPL

1451 GMASGHIRDF QITASGQYGQ WAPKLARLHY SGSINAWSTK EPFSWIKVDL1451 GMASGHIRDF QITASGQYGQ WAPKLARLHY SGSINAWSTK EPFSWIKVDL

1501 LAPMIIHGIK TQGARQKFSS LYISQFIIMY SLDGKKWQTY RGNSTGTLMV1501 LAPMIIHGIK TQGARQKFSS LYISQFIIMY SLDGKKWQTY RGNSTGTLMV

1551 FFGNVDSSGI KHNIFNPPII ARYIRLHPTH YSIRSTLRME LMGCDLNSCS1551 FFGNVDSSGI KHNIFNPPII ARYIRLHPTH YSIRSTLRME LMGCDLNSCS

1601 MPLGMESKAI SDAQITASSY FTNMFATWSP SKARLHLQGR SNAWRPQVNN1601 MPLGMESKAI SDAQITASSY FTNMFATWSP SKARLHLQGR SNAWRPQVNN

1651 PKEWLQVDFQ KTMKVTGVTT QGVKSLLTSM YVKEFLISSS QDGHQWTLFF1651 PKEWLQVDFQ KTMKVTGVTT QGVKSLLTSM YVKEFLISSS QDGHQWTLFF

1701 QNGKVKVFQG NQDSFTPVVN SLDPPLLTRY LRIHPQSWVH QIALRMEVLG1701 QNGKVKVFQG NQDSFTPVVN SLDPPLLTRY LRIHPQSWVH QIALRMEVLG

1751 CEAQDLYDKT HTCPPCPAPE LLGGPSVFLF PPKPKDTLMI SRTPEVTCVV1751 CEAQDLYDKT HTCPPCPAPE LLGGPSVFLF PPKPKDTLMI SRTPEVTCVV

1801 VDVSHEDPEV KFNWYVDGVE VHNAKTKPRE EQYNSTYRVV SVLTVLHQDW1801 VDVSHEDPEV KFNWYVDGVE VHNAKTKPRE EQYNSTYRVV SVLTVLHQDW

1851 LNGKEYKCKV SNKALPAPIE KTISKAKGQP REPQVYTLPP SRDELTKNQV1851 LNGKEYKCKV SNKALPAPIE KTISKAKGQP REPQVYTLPP SRDELTKNQV

1901 SLTCLVKGFY PSDIAVEWES NGQPENNYKT TPPVLDSDGS FFLYSKLTVD1901 SLTCLVKGFY PSDIAVEWES NGQPENNYKT TPPVLDSDGS FFLYSKLTVD

1951 KSRWQQGNVF SCSVMHEALH NHYTQKSLSL SPGK*1951 KSRWQQGNVF SCSVMHEALH NHYTQKSLSL SPGK*

- 152 044115- 152 044115

Последовательность зрелого белка pSYN-FVIII-173 (SEQ ID NO: 72).Sequence of the mature protein pSYN-FVIII-173 (SEQ ID NO: 72).

ATRRYYLGAV ELSWDYMQSD LGELPVDARF PPRVPKSFPF NTSVVYKKTLATRRYYLGAV ELSWDYMQSD LGELPVDARF PPRVPKSFPF NTSVVYKKTL

FVEFTDHLFN IAKPRPPWMG LLGPTIQAEV YDTVVITLKN MASHPVSLHAFVEFTDHLFN IAKPRPPWMG LLGPTIQAEV YDTVVITLKN MASHPVSLHA

101 VGVSYWKASE GAEYDDQTSQ REKEDDKVFP GGSHTYVWQV LKENGPMASD101 VGVSYWKASE GAEYDDQTSQ REKEDDKVFP GGSHTYVWQV LKENGPMASD

151 PLCLTYSYLS HVDLVKDLNS GLIGALLVCR EGSLAKEKTQ TLHKFILLFA151 PLCLTYSYLS HVDLVKDLNS GLIGALLVCR EGSLAKEKTQ TLHKFILLFA

201 VFDEGKSWHS ETKNSLMQDR DAASARAWPK MHTVNGYVNR SLPGLIGCHR201 VFDEGKSWHS ETKNSLMQDR DAASARAWPK MHTVNGYVNR SLPGLIGCHR

251 KSVYWHVIGM GTTPEVHSIF LEGHTFLVRN HRQASLEISP ITFLTAQTLL251 KSVYWHVIGM GTTPEVHSIF LEGHTFLVRN HRQASLEISP ITFLTAQTLL

301 MDLGQFLLFC HISSHQHDGM EAYVKVDSCP EEPQLRMKNN EEAEDYDDDL301 MDLGQFLLFC HISSHQHDGM EAYVKVDSCP EEPQLRMKNN EEAEDYDDDL

351 TDSEMDVVRF DDDNSPSFIQ IRSVAKKHPK TWVHYIAAEE EDWDYAPLVL351 TDSEMDVVRF DDDNSPSFIQ IRSVAKKHPK TWVHYIAAEE EDWDYAPLVL

401 APDDRSYKSQ YLNNGPQRIG RKYKKVRFMA YTDETFKTRE AIQHESGILG401 APDDRSYKSQ YLNNGPQRIG RKYKKVRFMA YTDETFKTRE AIQHESGILG

451 PLLYGEVGDT LLIIFKNQAS RPYNIYPHGI TDVRPLYSRR LPKGVKHLKD451 PLLYGEVGDT LLIIFKNQAS RPYNIYPHGI TDVRPLYSRR LPKGVKHLKD

501 FPILPGEIFK YKWTVTVEDG PTKSDPRCLT RYYSSFVNME RDLASGLIGP501 FPILPGEIFK YKWTVTVEDG PTKSDPRCLT RYYSSFVNME RDLASGLIGP

551 LLICYKESVD QRGNQIMSDK RNVILFSVFD ENRSWYLTEN IQRFLPNPAG551 LLICYKESVD QRGNQIMSDK RNVILFSVFD ENRSWYLTEN IQRFLPNPAG

601 VQLEDPEFQA SNIMHSINGY VFDSLQLSVC LHEVAYWYIL SIGAQTDFLS601 VQLEDPEFQA SNIMHSINGY VFDSLQLSVC LHEVAYWYIL SIGAQTDFLS

651 VFFSGYTFKH KMVYEDTLTL FPFSGETVFM SMENPGLWIL GCHNSDFRNR651 VFFSGYTFKH KMVYEDTLTL FPFSGETVFM SMENPGLWIL GCHNSDFRNR

701 GMTALLKVSS CDKNTGDYYE DSYEDISAYL LSKNNAIEPR SFSQNGAPGT701 GMTALLKVSS CDKNTGDYYE DSYEDISAYL LSKNNAIEPR SFSQNGAPGT

751 SESATPESGP GSEPATSGSE TPGTSESATP ESGPGSEPAT SGSETPGTSE751 SESATPESGP GSEPATSGSE TPGTSESATP ESGPGSEPAT SGSETPGTSE

801 SATPESGPGT STEPSEGSAP GSPAGSPTST EEGTSESATP ESGPGSEPAT801 SATPESGPGT STEPSEGSAP GSPAGSPTST EEGTSESATP ESGPGSEPAT

851 SGSETPGTSE SATPESGPGS PAGSPTSTEE GSPAGSPTST EEGTSTEPSE851 SGSETPGTSE SATPESGPGS PAGSPTSTEE GSPAGSPTST EEGTSTEPSE

901 GSAPGTSESA TPESGPGTSE SATPESGPGT SESATPESGP GSEPATSGSE901 GSAPGTSESA TPESGPGTSE SATPESGPGT SESATPESGP GSEPATSGSE

951 TPGSEPATSG SETPGSPAGS PTSTEEGTST EPSEGSAPGT STEPSEGSAP951 TPGSEPATSG SETPGSPAGS PTSTEEGTST EPSEGSAPGT STEPSEGSAP

1001 GSEPATSGSE TPGTSESATP ESGPGTSTEP SEGSAPASSP PVLKRHQREI1001 GSEPATSGSE TPGTSESATP ESGPGTSTEP SEGSAPASSP PVLKRHQREI

1051 TRTTLQSDQE EIDYDDTISV EMKKEDFDIY DEDENQSPRS FQKKTRHYFI1051 TRTTLQSDQE EIDYDDTISV EMKKEDFDIY DEDENQSPRS FQKKTRHYFI

1101 AAVERLWDYG MSSSPHVLRN RAQSGSVPQF KKVVFQEFTD GSFTQPLYRG1101 AAVERLWDYG MSSSPHVLRN RAQSGSVPQF KKVVFQEFTD GSFTQPLYRG

1151 ELNEHLGLLG PYIRAEVEDN IMVTFRNQAS RPYSFYSSLI SYEEDQRQGA1151 ELNEHLGLLG PYIRAEVEDN IMVTFRNQAS RPYSFYSSLI SYEEDQRQGA

1201 EPRKNFVKPN ETKTYFWKVQ HHMAPTKDEF DCKAWAYFSD VDLEKDVHSG1201 EPRKNFVKPN ETKTYFWKVQ HHMAPTKDEF DCKAWAYFSD VDLEKDVHSG

1251 LIGPLLVCHT NTLNPAHGRQ VTVQEFALFF TIFDETKSWY FTENMERNCR1251 LIGPLLVCHT NTLNPAHGRQ VTVQEFALFF TIFDETKSWY FTENMERNCR

1301 APCNIQMEDP TFKENYRFHA INGYIMDTLP GLVMAQDQRI RWYLLSMGSN1301 APCNIQMEDP TFKENYRFHA INGYIMDTLP GLVMAQDQRI RWYLLSMGSN

1351 ENIHSIHFSG HVFTVRKKEE YKMALYNLYP GVFETVEMLP SKAGIWRVEC1351 ENIHSIHFSG HVFTVRKKEE YKMALYNLYP GVFETVEMLP SKAGIWRVEC

1401 LIGEHLHAGM STLFLVYSNK CQTPLGMASG HIRDFQITAS GQYGQWAPKL1401 LIGEHLHAGM STLFLVYSNK CQTPLGMASG HIRDFQITAS GQYGQWAPKL

1451 ARLHYSGSIN AWSTKEPFSW IKVDLLAPMIIHGIKTQGAR QKFSSLYISQ1451 ARLHYSGSIN AWSTKEPFSW IKVDLLAPMIIHGIKTQGAR QKFSSLYISQ

1501 FIIMYSLDGK KWQTYRGNST GTLMVFFGNV DSSGIKHNIF NPPIIARYIR1501 FIIMYSLDGK KWQTYRGNST GTLMVFFGNV DSSGIKHNIF NPPIIARYIR

1551 LHPTHYSIRS TLRMELMGCD LNSCSMPLGM ESKAISDAQI TASSYFTNMF1551 LHPTHYSIRS TLRMELMGCD LNSCSMPLGM ESKAISDAQI TASSYFTNMF

1601 ATWSPSKARL HLQGRSNAWR PQVNNPKEWL QVDFQKTMKV TGVTTQGVKS1601 ATWSPSKARL HLQGRSNAWR PQVNNPKEWL QVDFQKTMKV TGVTTQGVKS

1651 LLTSMYVKEF LISSSQDGHQ WTLFFQNGKV KVFQGNQDSF TPVVNSLDPP1651 LLTSMYVKEF LISSSQDGHQ WTLFFQNGKV KVFQGNQDSF TPVVNSLDPP

1701 LLTRYLRIHP QSWVHQIALR MEVLGCEAQD LYDKTHTCPP CPAPELLGGP1701 LLTRYLRIHP QSWVHQIALR MEVLGCEAQD LYDKTHTCPP CPAPELLGGP

1751 SVFLFPPKPK DTLMISRTPE VTCVVVDVSH EDPEVKFNWY VDGVEVHNAK1751 SVFLFPPKPK DTLMISRTPE VTCVVVDVSH EDPEVKFNWY VDGVEVHNAK

1801 TKPREEQYNS TYRVVSVLTV LHQDWLNGKE YKCKVSNKAL PAPIEKTISK1801 TKPREEQYNS TYRVVSVLTV LHQDWLNGKE YKCKVSNKAL PAPIEKTISK

1851 AKGQPREPQV YTLPPSRDEL TKNQVSLTCL VKGFYPSDIA VEWESNGQPE1851 AKGQPREPQV YTLPPSRDEL TKNQVSLTCL VKGFYPSDIA VEWESNGQPE

1901 NNYKTTPPVL DSDGSFFLYS KLTVDKSRWQ QGNVFSCSVM HEALHNHYTQ1901 NNYKTTPPVL DSDGSFFLYS KLTVDKSRWQ QGNVFSCSVM HEALHNHYTQ

1951 KSLSLSPGK1951 KSLSLSPGK

- 153 044115- 153 044115

Последовательность белка FVIII196 (двойная цепь FVIIIFc с тремя 144 АЕ XTENs в аминокислотеFVIII196 protein sequence (double chain FVIIIFc with three 144 AU XTENs per amino acid

26, 1656 и 1900) (SEO ID NO: 74).26, 1656 and 1900) (SEO ID NO: 74).

MQIELSTCFF LCLLRFCFSA TRRYYLGAVE LSWDYMQSDL GELPVGAPGSMQIELSTCFF LCLLRFCFSA TRRYYLGAVE LSWDYMQSDL GELPVGAPGS

SPSASTGTGP GSSPSASTGT GPGASPGTSS TGSPGASPGT SSTGSPGSSTSPSASTGTGP GSSPSASTGT GPGASPGTSS TGSPGAPGT SSTGSPGSST

101 PSGATGSPGS SPSASTGTGP GASPGTSSTG SPGSSPSAST GTGPGTPGSG101 PSGATGSPGS SPSASTGTGP GASPGTSSTG SPGSSPSAST GTGPGTPGSG

151 TASSSPGSST PSGATGSPGS STPSGATGSP GASPGTSSTG SPASSDARFP151 TASSSPGSST PSGATGSPGS STPSGATGSP GASPGTSSTG SPASSDARFP

201 PRVPKSFPFN TSVVYKKTLF VEFTDHLFNI AKPRPPWMGL LGPTIQAEVY201 PRVPKSFPFN TSVVYKKTLF VEFTDHLFNI AKPRPPWMGL LGPTIQAEVY

251 DTVVITLKNM ASHPVSLHAV GVSYWKASEG AEYDDQTSQR EKEDDKVFPG251 DTVVITLKNM ASHPVSLHAV GVSYWKASEG AEYDDQTSQR EKEDDKVFPG

301 GSHTYVWQVL KENGPMASDP LCLTYSYLSH VDLVKDLNSG LIGALLVCRE301 GSHTYVWQVL KENGPMASDP LCLTYSYLSH VDLVKDLNSG LIGALLVCRE

351 GSLAKEKTQT LHKFILLFAV FDEGKSWHSE TKNSLMQDRD AASARAWPKM351 GSLAKEKTQT LHKFILLFAV FDEGKSWHSE TKNSLMQDRD AASARWPKM

401 HTVNGYVNRS LPGLIGCHRK SVYWHVIGMG TTPEVHSIFL EGHTFLVRNH401 HTVNGYVNRS LPGLIGCHRK SVYWHVIGMG TTPEVHSIFL EGHTFLVRNH

451 RQASLEISPI TFLTAQTLLM DLGQFLLFCH ISSHQHDGME AYVKVDSCPE451 RQASLEISPI TFLTAQTLLM DLGQFLLFCH ISSHQHDGME AYVKVDSCPE

501 EPQLRMKNNE EAEDYDDDLT DSEMDVVRFD DDNSPSFIQI RSVAKKHPKT501 EPQLRMKNNE EAEDYDDDLT DSEMDVVRFD DDNSPSFIQI RSVAKKHPKT

551 WVHYIAAEEE DWDYAPLVLA PDDRSYKSQY LNNGPQRIGR KYKKVRFMAY551 WVHYIAAEEE DWDYAPLVLA PDDRSYKSQY LNNGPQRIGR KYKKVRFMAY

601 TDETFKTREA IQHESGILGP LLYGEVGDTL LIIFKNQASR PYNIYPHGIT601 TDETFKTREA IQHESGILGP LLYGEVGDTL LIIFKNQASR PYNIYPHGIT

651 DVRPLYSRRL PKGVKHLKDF PILPGEIFKY KWTVTVEDGP TKSDPRCLTR651 DVRPLYSRRL PKGVKHLKDF PILPGEIFKY KWTVTVEDGP TKSDPRCLTR

701 YYSSFVNMER DLASGLIGPL LICYKESVDQ RGNQIMSDKR NVILFSVFDE701 YYSSFVNMER DLASGLIGPL LICYKESVDQ RGNQIMSDKR NVILFSVFDE

751 NRSWYLTENI QRFLPNPAGV QLEDPEFQAS NIMHSINGYV FDSLQLSVCL751 NRSWYLTENI QRFLPNPAGV QLEDPEFQAS NIMHSINGYV FDSLQLSVCL

801 HEVAYWYILS IGAQTDFLSV FFSGYTFKHK MVYEDTLTLF PFSGETVFMS801 HEVAYWYILS IGAQTDFLSV FFSGYTFKHK MVYEDTLTLF PFSGETVFMS

851 MENPGLWILG CHNSDFRNRG MTALLKVSSC DKNTGDYYED SYEDISAYLL851 MENPGLWILG CHNSDFRNRG MTALLKVSSC DKNTGDYYED SYEDISAYLL

901 SKNNAIEPRS FSQNPPVLKR HQREITRTTL QGAPGTPGSG TASSSPGASP901 SKNNAIEPRS FSQNPPVLKR HQREITRTTL QGAPGTPGSG TASSSPGASP

951 GTSSTGSPGA SPGTSSTGSP GASPGTSSTG SPGSSPSAST GTGPGTPGSG951 GTSSTGSPGA SPGTSSTGSP GASPGTSSTG SPGSSPSAST GTGPGTPGSG

1001 TASSSPGASP GTSSTGSPGA SPGTSSTGSP GASPGTSSTG SPGSSTPSGA1001 TASSSPGASP GTSSTGSPGA SPGTSSTGSP GASPGTSSTG SPGSSTPSGA

1051 TGSPGSSTPS GATGSPGASP GTSSTGSPAS SSDQEEIDYD DTISVEMKKE1051 TGSPGSSTPS GATGSPGASP GTSSTGSPAS SSDQEEIDYD DTISVEMKKE

1101 DFDIYDEDEN QSPRSFQKKT RHYFIAAVER LWDYGMSSSP HVLRNRAQSG1101 DFDIYDEDEN QSPRSFQKKT RHYFIAAVER LWDYGMSSSP HVLRNRAQSG

1151 SVPQFKKVVF QEFTDGSFTQ PLYRGELNEH LGLLGPYIRA EVEDNIMVTF1151 SVPQFKKVVF QEFTDGSFTQ PLYRGELNEH LGLLGPYIRA EVEDNIMVTF

1201 RNQASRPYSF YSSLISYEED QRQGAEPRKN FVKPNETKTY FWKVQHHMAP1201 RNQASRPYSF YSSLISYEED QRQGAEPRKN FVKPNETKTY FWKVQHHMAP

1251 TKDEFDCKAW AYFSDVDLEK DVHSGLIGPL LVCHTNTLNP AHGRQVTVQE1251 TKDEFDCKAW AYFSDVDLEK DVHSGLIGPL LVCHTNTLNP AHGRQVTVQE

1301 FALFFTIFDE TKSWYFTENM ERNCRGAPTS ESATPESGPG SEPATSGSET1301 FALFFTIFDE TKSWYFTENM ERNCRGAPTS ESATPESGPG SEPATSGSET

1351 PGTSESATPE SGPGSEPATS GSETPGTSES ATPESGPGTS TEPSEGSAPG1351 PGTSESATPE SGPGSEPATS GSETPGTSES ATPESGPGTS TEPSEGSAPG

1401 TSESATPESG PGSPAGSPTS TEEGSPAGSP TSTEEGSPAG SPTSTEEGTS1401 TSESATPESG PGSPAGSPTS TEEGSPAGSP TSTEEGSPAG SPTSTEEGTS

1451 ESATPESGPG TSTEPSEGSA PGASSAPCNI QMEDPTFKEN YRFHAINGYI1451 ESATPESGPG TSTEPSEGSA PGASSAPCNI QMEDPTFKEN YRFHAINGYI

1501 MDTLPGLVMA QDQRIRWYLL SMGSNENIHS IHFSGHVFTV RKKEEYKMAL1501 MDTLPGLVMA QDQRIRWYLL SMGSNENIHS IHFSGHVFTV RKKEEYKMAL

1551 YNLYPGVFET VEMLPSKAGIWRVECLIGEH LHAGMSTLFL VYSNKCQTPL1551 YNLYPGVFET VEMLPSKAGIWRVECLIGEH LHAGMSTLFL VYSNKCQTPL

1601 GMASGHIRDF QITASGQYGQ WAPKLARLHY SGSINAWSTK EPFSWIKVDL1601 GMASGHIRDF QITASGQYGQ WAPKLARLHY SGSINAWSTK EPFSWIKVDL

1651 LAPMIIHGIK TQGARQKFSS LYISQFIIMY SLDGKKWQTY RGNSTGTLMV1651 LAPMIIHGIK TQGARQKFSS LYISQFIIMY SLDGKKWQTY RGNSTGTLMV

1701 FFGNVDSSGI KHNIFNPPII ARYIRLHPTH YSIRSTLRME LMGCDLNSCS1701 FFGNVDSSGI KHNIFNPPII ARYIRLHPTH YSIRSTLRME LMGCDLNSCS

1751 MPLGMESKAI SDAQITASSY FTNMFATWSP SKARLHLQGR SNAWRPQVNN1751 MPLGMESKAI SDAQITASSY FTNMFATWSP SKARLHLQGR SNAWRPQVNN

1801 PKEWLQVDFQ KTMKVTGVTT QGVKSLLTSM YVKEFLISSS QDGHQWTLFF1801 PKEWLQVDFQ KTMKVTGVTT QGVKSLLTSM YVKEFLISSS QDGHQWTLFF

1851 QNGKVKVFQG NQDSFTPVVN SLDPPLLTRY LRIHPQSWVH QIALRMEVLG1851 QNGKVKVFQG NQDSFTPVVN SLDPPLLTRY LRIHPQSWVH QIALRMEVLG

1901 CEAQDLYDKT HTCPPCPAPE LLGGPSVFLF PPKPKDTLMI SRTPEVTCVV1901 CEAQDLYDKT HTCPPCPAPE LLGGPSVFLF PPKPKDTLMI SRTPEVTCVV

1951 VDVSHEDPEV KFNWYVDGVE VHNAKTKPRE EQYNSTYRVV SVLTVLHQDW1951 VDVSHEDPEV KFNWYVDGVE VHNAKTKPRE EQYNSTYRVV SVLTVLHQDW

2001 LNGKEYKCKV SNKALPAPIE KTISKAKGQP REPQVYTLPP SRDELTKNQV2001 LNGKEYKCKV SNKALPAPIE KTISKAKGQP REPQVYTLPP SRDELTKNQV

2051 SLTCLVKGFY PSDIAVEWES NGQPENNYKT TPPVLDSDGS FFLYSKLTVD2051 SLTCLVKGFY PSDIAVEWES NGQPENNYKT TPPVLDSDGS FFLYSKLTVD

2101 KSRWQQGNVF SCSVMHEALH NHYTQKSLSL SPGK*2101 KSRWQQGNVF SCSVMHEALH NHYTQKSLSL SPGK*

- 154 044115- 154 044115

Последовательность белка FVIII199 (одноцепочечный FVIIIFc с тремя 144 АЕ XTENs в аминокислоте 1656 и 1900) (SEQ ID NO: 75).FVIII199 protein sequence (single chain FVIIIFc with three 144 AU XTENs at amino acids 1656 and 1900) (SEQ ID NO: 75).

MQIELSTCFF LCLLRFCFSA TRRYYLGAVE LSWDYMQSDL GELPVDARFPMQIELSTCFF LCLLRFCFSA TRRYYLGAVE LSWDYMQSDL GELPVDARFP

PRVPKSFPFN TSVVYKKTLF VEFTDHLFNI AKPRPPWMGL LGPTIQAEVYPRVPKSFPFN TSVVYKKTLF VEFTDHLFNI AKPRPPWMGL LGPTIQAEVY

101 DTVVITLKNM ASHPVSLHAV GVSYWKASEG AEYDDQTSQR EKEDDKVFPG101 DTVVITLKNM ASHPVSLHAV GVSYWKASEG AEYDDQTSQR EKEDDKVFPG

151 GSHTYVWQVL KENGPMASDP LCLTYSYLSH VDLVKDLNSG LIGALLVCRE151 GSHTYVWQVL KENGPMASDP LCLTYSYLSH VDLVKDLNSG LIGALLVCRE

201 GSLAKEKTQT LHKFILLFAV FDEGKSWHSE TKNSLMQDRD AASARAWPKM201 GSLAKEKTQT LHKFILLFAV FDEGKSWHSE TKNSLMQDRD AASARWPKM

251 HTVNGYVNRS LPGLIGCHRK SVYWHVIGMG TTPEVHSIFL EGHTFLVRNH251 HTVNGYVNRS LPGLIGCHRK SVYWHVIGMG TTPEVHSIFL EGHTFLVRNH

301 RQASLEISPI TFLTAQTLLM DLGQFLLFCH ISSHQHDGME AYVKVDSCPE301 RQASLEISPI TFLTAQTLLM DLGQFLLFCH ISSHQHDGME AYVKVDSCPE

351 EPQLRMKNNE EAEDYDDDLT DSEMDVVRFD DDNSPSFIQI RSVAKKHPKT351 EPQLRMKNNE EAEDYDDDLT DSEMDVVRFD DDNSPSFIQI RSVAKKHPKT

401 WVHYIAAEEE DWDYAPLVLA PDDRSYKSQY LNNGPQRIGR KYKKVRFMAY401 WVHYIAAEEE DWDYAPLVLA PDDRSYKSQY LNNGPQRIGR KYKKVRFMAY

451 TDETFKTREA IQHESGILGP LLYGEVGDTL LIIFKNQASR PYNIYPHGIT451 TDETFKTREA IQHESGILGP LLYGEVGDTL LIIFKNQASR PYNIYPHGIT

501 DVRPLYSRRL PKGVKHLKDF PILPGEIFKY KWTVTVEDGP TKSDPRCLTR501 DVRPLYSRRL PKGVKHLKDF PILPGEIFKY KWTVTVEDGP TKSDPRCLTR

551 YYSSFVNMER DLASGLIGPL LICYKESVDQ RGNQIMSDKR NVILFSVFDE551 YYSSFVNMER DLASGLIGPL LICYKESVDQ RGNQIMSDKR NVILFSVFDE

601 NRSWYLTENI QRFLPNPAGV QLEDPEFQAS NIMHSINGYV FDSLQLSVCL601 NRSWYLTENI QRFLPNPAGV QLEDPEFQAS NIMHSINGYV FDSLQLSVCL

651 HEVAYWYILS IGAQTDFLSV FFSGYTFKHK MVYEDTLTLF PFSGETVFMS651 HEVAYWYILS IGAQTDFLSV FFSGYTFKHK MVYEDTLTLF PFSGETVFMS

701 MENPGLWILG CHNSDFRNRG MTALLKVSSC DKNTGDYYED SYEDISAYLL701 MENPGLWILG CHNSDFRNRG MTALLKVSSC DKNTGDYYED SYEDISAYLL

751 SKNNAIEPRS FSQNPPVLKR HQAEITRTTL QGAPGTPGSG TASSSPGASP751 SKNNAIEPRS FSQNPPVLKR HQAEITRTTL QGAPGTPGSG TASSSPGASP

801 GTSSTGSPGA SPGTSSTGSP GASPGTSSTG SPGSSPSAST GTGPGTPGSG801 GTSSTGSPGA SPGTSSTGSP GASPGTSSTG SPGSSPSAST GTGPGTPGSG

851 TASSSPGASP GTSSTGSPGA SPGTSSTGSP GASPGTSSTG SPGSSTPSGA851 TASSSPGASP GTSSTGSPGA SPGTSSTGSP GASPGTSSTG SPGSSTPSGA

901 TGSPGSSTPS GATGSPGASP GTSSTGSPAS SSDQEEIDYD DTISVEMKKE901 TGSPGSSTPS GATGSPGASP GTSSTGSPAS SSDQEEIDYD DTISVEMKKE

951 DFDIYDEDEN QSPRSFQKKT RHYFIAAVER LWDYGMSSSP HVLRNRAQSG951 DFDIYDEDEN QSPRSFQKKT RHYFIAAVER LWDYGMSSSP HVLRNRAQSG

1001 SVPQFKKVVF QEFTDGSFTQ PLYRGELNEH LGLLGPYIRA EVEDNIMVTF1001 SVPQFKKVVF QEFTDGSFTQ PLYRGELNEH LGLLGPYIRA EVEDNIMVTF

1051 RNQASRPYSF YSSLISYEED QRQGAEPRKN FVKPNETKTY FWKVQHHMAP1051 RNQASRPYSF YSSLISYEED QRQGAEPRKN FVKPNETKTY FWKVQHHMAP

1101 TKDEFDCKAW AYFSDVDLEK DVHSGLIGPL LVCHTNTLNP AHGRQVTVQE1101 TKDEFDCKAW AYFSDVDLEK DVHSGLIGPL LVCHTNTLNP AHGRQVTVQE

1151 FALFFTIFDE TKSWYFTENM ERNCRGAPTS ESATPESGPG SEPATSGSET1151 FALFFTIFDE TKSWYFTENM ERNCRGAPTS ESATPESGPG SEPATSGSET

1201 PGTSESATPE SGPGSEPATS GSETPGTSES ATPESGPGTS TEPSEGSAPG1201 PGTSESATPE SGPGSEPATS GSETPGTSES ATPESGPGTS TEPSEGSAPG

1251 TSESATPESG PGSPAGSPTS TEEGSPAGSP TSTEEGSPAG SPTSTEEGTS1251 TSESATPESG PGSPAGSPTS TEEGSPAGSP TSTEEGSPAG SPTSTEEGTS

1301 ESATPESGPG TSTEPSEGSA PGASSAPCNI QMEDPTFKEN YRFHAINGYI1301 ESATPESGPG TSTEPSEGSA PGASSAPCNI QMEDPTFKEN YRFHAINGYI

1351 MDTLPGLVMA QDQRIRWYLL SMGSNENIHS IHFSGHVFTV RKKEEYKMAL1351 MDTLPGLVMA QDQRIRWYLL SMGSNENIHS IHFSGHVFTV RKKEEYKMAL

1401 YNLYPGVFET VEMLPSKAGI WRVECLIGEH LHAGMSTLFL VYSNKCQTPL1401 YNLYPGVFET VEMLPSKAGI WRVECLIGEH LHAGMSTLFL VYSNKCQTPL

1451 GMASGHIRDF QITASGQYGQ WAPKLARLHY SGSINAWSTK EPFSWIKVDL1451 GMASGHIRDF QITASGQYGQ WAPKLARLHY SGSINAWSTK EPFSWIKVDL

1501 LAPMIIHGIK TQGARQKFSS LYISQFIIMY SLDGKKWQTY RGNSTGTLMV1501 LAPMIIHGIK TQGARQKFSS LYISQFIIMY SLDGKKWQTY RGNSTGTLMV

1551 FFGNVDSSGI KHNIFNPPII ARYIRLHPTH YSIRSTLRME LMGCDLNSCS1551 FFGNVDSSGI KHNIFNPPII ARYIRLHPTH YSIRSTLRME LMGCDLNSCS

1601 MPLGMESKAI SDAQITASSY FTNMFATWSP SKARLHLQGR SNAWRPQVNN1601 MPLGMESKAI SDAQITASSY FTNMFATWSP SKARLHLQGR SNAWRPQVNN

1651 PKEWLQVDFQ KTMKVTGVTT QGVKSLLTSM YVKEFLISSS QDGHQWTLFF1651 PKEWLQVDFQ KTMKVTGVTT QGVKSLLTSM YVKEFLISSS QDGHQWTLFF

1701 QNGKVKVFQG NQDSFTPVVN SLDPPLLTRY LRIHPQSWVH QIALRMEVLG1701 QNGKVKVFQG NQDSFTPVVN SLDPPLLTRY LRIHPQSWVH QIALRMEVLG

1751 CEAQDLYDKT HTCPPCPAPE LLGGPSVFLF PPKPKDTLMI SRTPEVTCVV1751 CEAQDLYDKT HTCPPCPAPE LLGGPSVFLF PPKPKDTLMI SRTPEVTCVV

1801 VDVSHEDPEV KFNWYVDGVE VHNAKTKPRE EQYNSTYRVV SVLTVLHQDW1801 VDVSHEDPEV KFNWYVDGVE VHNAKTKPRE EQYNSTYRVV SVLTVLHQDW

1851 LNGKEYKCKV SNKALPAPIE KTISKAKGQP REPQVYTLPP SRDELTKNQV1851 LNGKEYKCKV SNKALPAPIE KTISKAKGQP REPQVYTLPP SRDELTKNQV

1901 SLTCLVKGFY PSDIAVEWES NGQPENNYKT TPPVLDSDGS FFLYSKLTVD1901 SLTCLVKGFY PSDIAVEWES NGQPENNYKT TPPVLDSDGS FFLYSKLTVD

1951 KSRWQQGNVF SCSVMHEALH NHYTQKSLSL SPGK*1951 KSRWQQGNVF SCSVMHEALH NHYTQKSLSL SPGK*

- 155 044115- 155 044115

Последовательность белка FVIII 201 (одноцепочечный FVIIIFc с тремя 144 АЕ XTENs в аминокислоте 26, 1656 &1900) (SEO ID NO: 76).FVIII 201 protein sequence (single chain FVIIIFc with three 144 AE XTENs at amino acid 26, 1656 &1900) (SEO ID NO: 76).

MQIELSTCFF LCLLRFCFSA TRRYYLGAVE LSWDYMQSDL GELPVGAPGSMQIELSTCFF LCLLRFCFSA TRRYYLGAVE LSWDYMQSDL GELPVGAPGS

SPSASTGTGP GSSPSASTGT GPGASPGTSS TGSPGASPGT SSTGSPGSSTSPSASTGTGP GSSPSASTGT GPGASPGTSS TGSPGAPGT SSTGSPGSST

101 PSGATGSPGS SPSASTGTGP GASPGTSSTG SPGSSPSAST GTGPGTPGSG101 PSGATGSPGS SPSASTGTGP GASPGTSSTG SPGSSPSAST GTGPGTPGSG

151 TASSSPGSST PSGATGSPGS STPSGATGSP GASPGTSSTG SPASSDARFP151 TASSSPGSST PSGATGSPGS STPSGATGSP GASPGTSSTG SPASSDARFP

201 PRVPKSFPFN TSVVYKKTLF VEFTDHLFNI AKPRPPWMGL LGPTIQAEVY201 PRVPKSFPFN TSVVYKKTLF VEFTDHLFNI AKPRPPWMGL LGPTIQAEVY

251 DTVVITLKNM ASHPVSLHAV GVSYWKASEG AEYDDQTSQR EKEDDKVFPG251 DTVVITLKNM ASHPVSLHAV GVSYWKASEG AEYDDQTSQR EKEDDKVFPG

301 GSHTYVWQVL KENGPMASDP LCLTYSYLSH VDLVKDLNSG LIGALLVCRE301 GSHTYVWQVL KENGPMASDP LCLTYSYLSH VDLVKDLNSG LIGALLVCRE

351 GSLAKEKTQT LHKFILLFAV FDEGKSWHSE TKNSLMQDRD AASARAWPKM351 GSLAKEKTQT LHKFILLFAV FDEGKSWHSE TKNSLMQDRD AASARWPKM

401 HTVNGYVNRS LPGLIGCHRK SVYWHVIGMG TTPEVHSIFL EGHTFLVRNH401 HTVNGYVNRS LPGLIGCHRK SVYWHVIGMG TTPEVHSIFL EGHTFLVRNH

451 RQASLEISPI TFLTAQTLLM DLGQFLLFCH ISSHQHDGME AYVKVDSCPE451 RQASLEISPI TFLTAQTLLM DLGQFLLFCH ISSHQHDGME AYVKVDSCPE

501 EPQLRMKNNE EAEDYDDDLT DSEMDVVRFD DDNSPSFIQI RSVAKKHPKT501 EPQLRMKNNE EAEDYDDDLT DSEMDVVRFD DDNSPSFIQI RSVAKKHPKT

551 WVHYIAAEEE DWDYAPLVLA PDDRSYKSQY LNNGPQRIGR KYKKVRFMAY551 WVHYIAAEEE DWDYAPLVLA PDDRSYKSQY LNNGPQRIGR KYKKVRFMAY

601 TDETFKTREA IQHESGILGP LLYGEVGDTL LIIFKNQASR PYNIYPHGIT601 TDETFKTREA IQHESGILGP LLYGEVGDTL LIIFKNQASR PYNIYPHGIT

651 DVRPLYSRRL PKGVKHLKDF PILPGEIFKY KWTVTVEDGP TKSDPRCLTR651 DVRPLYSRRL PKGVKHLKDF PILPGEIFKY KWTVTVEDGP TKSDPRCLTR

701 YYSSFVNMER DLASGLIGPL LICYKESVDQ RGNQIMSDKR NVILFSVFDE701 YYSSFVNMER DLASGLIGPL LICYKESVDQ RGNQIMSDKR NVILFSVFDE

751 NRSWYLTENI QRFLPNPAGV QLEDPEFQAS NIMHSINGYV FDSLQLSVCL751 NRSWYLTENI QRFLPNPAGV QLEDPEFQAS NIMHSINGYV FDSLQLSVCL

801 HEVAYWYILS IGAQTDFLSV FFSGYTFKHK MVYEDTLTLF PFSGETVFMS801 HEVAYWYILS IGAQTDFLSV FFSGYTFKHK MVYEDTLTLF PFSGETVFMS

851 MENPGLWILG CHNSDFRNRG MTALLKVSSC DKNTGDYYED SYEDISAYLL851 MENPGLWILG CHNSDFRNRG MTALLKVSSC DKNTGDYYED SYEDISAYLL

901 SKNNAIEPRS FSQNPPVLKR HQAEITRTTL QGAPGTPGSG TASSSPGASP901 SKNNAIEPRS FSQNPPVLKR HQAEITRTTL QGAPGTPGSG TASSSPGASP

951 GTSSTGSPGA SPGTSSTGSP GASPGTSSTG SPGSSPSAST GTGPGTPGSG951 GTSSTGSPGA SPGTSSTGSP GASPGTSSTG SPGSSPSAST GTGPGTPGSG

1001 TASSSPGASP GTSSTGSPGA SPGTSSTGSP GASPGTSSTG SPGSSTPSGA1001 TASSSPGASP GTSSTGSPGA SPGTSSTGSP GASPGTSSTG SPGSSTPSGA

1051 TGSPGSSTPS GATGSPGASP GTSSTGSPAS SSDQEEIDYD DTISVEMKKE1051 TGSPGSSTPS GATGSPGASP GTSSTGSPAS SSDQEEIDYD DTISVEMKKE

1101 DFDIYDEDEN QSPRSFQKKT RHYFIAAVER LWDYGMSSSP HVLRNRAQSG1101 DFDIYDEDEN QSPRSFQKKT RHYFIAAVER LWDYGMSSSP HVLRNRAQSG

1151 SVPQFKKVVF QEFTDGSFTQ PLYRGELNEH LGLLGPYIRA EVEDNIMVTF1151 SVPQFKKVVF QEFTDGSFTQ PLYRGELNEH LGLLGPYIRA EVEDNIMVTF

1201 RNQASRPYSF YSSLISYEED QRQGAEPRKN FVKPNETKTY FWKVQHHMAP1201 RNQASRPYSF YSSLISYEED QRQGAEPRKN FVKPNETKTY FWKVQHHMAP

1251 TKDEFDCKAW AYFSDVDLEK DVHSGLIGPL LVCHTNTLNP AHGRQVTVQE1251 TKDEFDCKAW AYFSDVDLEK DVHSGLIGPL LVCHTNTLNP AHGRQVTVQE

1301 FALFFTIFDE TKSWYFTENM ERNCRGAPTS ESATPESGPG SEPATSGSET1301 FALFFTIFDE TKSWYFTENM ERNCRGAPTS ESATPESGPG SEPATSGSET

1351 PGTSESATPE SGPGSEPATS GSETPGTSES ATPESGPGTS TEPSEGSAPG1351 PGTSESATPE SGPGSEPATS GSETPGTSES ATPESGPGTS TEPSEGSAPG

1401 TSESATPESG PGSPAGSPTS TEEGSPAGSP TSTEEGSPAG SPTSTEEGTS1401 TSESATPESG PGSPAGSPTS TEEGSPAGSP TSTEEGSPAG SPTSTEEGTS

1451 ESATPESGPG TSTEPSEGSA PGASSAPCNI QMEDPTFKEN YRFHAINGYI1451 ESATPESGPG TSTEPSEGSA PGASSAPCNI QMEDPTFKEN YRFHAINGYI

1501 MDTLPGLVMA QDQRIRWYLL SMGSNENIHS IHFSGHVFTV RKKEEYKMAL1501 MDTLPGLVMA QDQRIRWYLL SMGSNENIHS IHFSGHVFTV RKKEEYKMAL

1551 YNLYPGVFET VEMLPSKAGIWRVECLIGEH LHAGMSTLFL VYSNKCQTPL1551 YNLYPGVFET VEMLPSKAGIWRVECLIGEH LHAGMSTLFL VYSNKCQTPL

1601 GMASGHIRDF QITASGQYGQ WAPKLARLHY SGSINAWSTK EPFSWIKVDL1601 GMASGHIRDF QITASGQYGQ WAPKLARLHY SGSINAWSTK EPFSWIKVDL

1651 LAPMIIHGIK TQGARQKFSS LYISQFIIMY SLDGKKWQTY RGNSTGTLMV1651 LAPMIIHGIK TQGARQKFSS LYISQFIIMY SLDGKKWQTY RGNSTGTLMV

1701 FFGNVDSSGI KHNIFNPPII ARYIRLHPTH YSIRSTLRME LMGCDLNSCS1701 FFGNVDSSGI KHNIFNPPII ARYIRLHPTH YSIRSTLRME LMGCDLNSCS

1751 MPLGMESKAI SDAQITASSY FTNMFATWSP SKARLHLQGR SNAWRPQVNN1751 MPLGMESKAI SDAQITASSY FTNMFATWSP SKARLHLQGR SNAWRPQVNN

1801 PKEWLQVDFQ KTMKVTGVTT QGVKSLLTSM YVKEFLISSS QDGHQWTLFF1801 PKEWLQVDFQ KTMKVTGVTT QGVKSLLTSM YVKEFLISSS QDGHQWTLFF

1851 QNGKVKVFQG NQDSFTPVVN SLDPPLLTRY LRIHPQSWVH QIALRMEVLG1851 QNGKVKVFQG NQDSFTPVVN SLDPPLLTRY LRIHPQSWVH QIALRMEVLG

1901 CEAQDLYDKT HTCPPCPAPE LLGGPSVFLF PPKPKDTLMI SRTPEVTCVV1901 CEAQDLYDKT HTCPPCPAPE LLGGPSVFLF PPKPKDTLMI SRTPEVTCVV

1951 VDVSHEDPEV KFNWYVDGVE VHNAKTKPRE EQYNSTYRVV SVLTVLHQDW1951 VDVSHEDPEV KFNWYVDGVE VHNAKTKPRE EQYNSTYRVV SVLTVLHQDW

2001 LNGKEYKCKV SNKALPAPIE KTISKAKGQP REPQVYTLPP SRDELTKNQV2001 LNGKEYKCKV SNKALPAPIE KTISKAKGQP REPQVYTLPP SRDELTKNQV

2051 SLTCLVKGFY PSDIAVEWES NGQPENNYKT TPPVLDSDGS FFLYSKLTVD2051 SLTCLVKGFY PSDIAVEWES NGQPENNYKT TPPVLDSDGS FFLYSKLTVD

2101 KSRWQQGNVF SCSVMHEALH NHYTQKSLSL SPGK*2101 KSRWQQGNVF SCSVMHEALH NHYTQKSLSL SPGK*

- 156 044115- 156 044115

Последовательность белка FVIII 203 (одноцепочечный FVIIIFc с двумя АЕ XTENs; одним 288АЕFVIII 203 protein sequence (single-chain FVIIIFc with two AE XTENs; one 288AE

XTEN в домене В и одним 144 AE XTEN в аминокислоте 1900) (SEQ ID NO: 77).XTEN in domain B and one 144 AE XTEN in amino acid 1900) (SEQ ID NO: 77).

MQIELSTCFF LCLLRFCFSA TRRYYLGAVE LSWDYMQSDL GELPVDARFPMQIELSTCFF LCLLRFCFSA TRRYYLGAVE LSWDYMQSDL GELPVDARFP

PRVPKSFPFN TSVVYKKTLF VEFTDHLFNI AKPRPPWMGL LGPTIQAEVYPRVPKSFPFN TSVVYKKTLF VEFTDHLFNI AKPRPPWMGL LGPTIQAEVY

101 DTVVITLKNM ASHPVSLHAV GVSYWKASEG AEYDDQTSQR EKEDDKVFPG101 DTVVITLKNM ASHPVSLHAV GVSYWKASEG AEYDDQTSQR EKEDDKVFPG

151 GSHTYVWQVL KENGPMASDP LCLTYSYLSH VDLVKDLNSG LIGALLVCRE151 GSHTYVWQVL KENGPMASDP LCLTYSYLSH VDLVKDLNSG LIGALLVCRE

201 GSLAKEKTQT LHKFILLFAV FDEGKSWHSE TKNSLMQDRD AASARAWPKM201 GSLAKEKTQT LHKFILLFAV FDEGKSWHSE TKNSLMQDRD AASARWPKM

251 HTVNGYVNRS LPGLIGCHRK SVYWHVIGMG TTPEVHSIFL EGHTFLVRNH251 HTVNGYVNRS LPGLIGCHRK SVYWHVIGMG TTPEVHSIFL EGHTFLVRNH

301 RQASLEISPI TFLTAQTLLM DLGQFLLFCH ISSHQHDGME AYVKVDSCPE301 RQASLEISPI TFLTAQTLLM DLGQFLLFCH ISSHQHDGME AYVKVDSCPE

351 EPQLRMKNNE EAEDYDDDLT DSEMDVVRFD DDNSPSFIQI RSVAKKHPKT351 EPQLRMKNNE EAEDYDDDLT DSEMDVVRFD DDNSPSFIQI RSVAKKHPKT

401 WVHYIAAEEE DWDYAPLVLA PDDRSYKSQY LNNGPQRIGR KYKKVRFMAY401 WVHYIAAEEE DWDYAPLVLA PDDRSYKSQY LNNGPQRIGR KYKKVRFMAY

451 TDETFKTREA IQHESGILGP LLYGEVGDTL LIIFKNQASR PYNIYPHGIT451 TDETFKTREA IQHESGILGP LLYGEVGDTL LIIFKNQASR PYNIYPHGIT

501 DVRPLYSRRL PKGVKHLKDF PILPGEIFKY KWTVTVEDGP TKSDPRCLTR501 DVRPLYSRRL PKGVKHLKDF PILPGEIFKY KWTVTVEDGP TKSDPRCLTR

551 YYSSFVNMER DLASGLIGPL LICYKESVDQ RGNQIMSDKR NVILFSVFDE551 YYSSFVNMER DLASGLIGPL LICYKESVDQ RGNQIMSDKR NVILFSVFDE

601 NRSWYLTENI QRFLPNPAGV QLEDPEFQAS NIMHSINGYV FDSLQLSVCL601 NRSWYLTENI QRFLPNPAGV QLEDPEFQAS NIMHSINGYV FDSLQLSVCL

651 HEVAYWYILS IGAQTDFLSV FFSGYTFKHK MVYEDTLTLF PFSGETVFMS651 HEVAYWYILS IGAQTDFLSV FFSGYTFKHK MVYEDTLTLF PFSGETVFMS

701 MENPGLWILG CHNSDFRNRG MTALLKVS SC DKNTGDYYED SYEDISAYLL701 MENPGLWILG CHNSDFRNRG MTALLKVS SC DKNTGDYYED SYEDISAYLL

751 SKNNAIEPRS FSQNGAPGTS ESATPESGPG SEPATSGSET PGTSESATPE751 SKNNAIEPRS FSQNGAPGTS ESATPESGPG SEPATSGSET PGTSESATPE

801 SGPGSEPATS GSETPGTSES ATPESGPGTS TEPSEGSAPG SPAGSPTSTE801 SGPGSEPATS GSETPGTSES ATPESGPGTS TEPSEGSAPG SPAGSPTSTE

851 EGTSESATPE SGPGSEPATS GSETPGTSES ATPESGPGSP AGSPTSTEEG851 EGTSESATPE SGPGSEPATS GSETPGTSES ATPESGPGSP AGSPTSTEEG

901 SPAGSPTSTE EGTSTEPSEG SAPGTSESAT PESGPGTSES ATPESGPGTS901 SPAGSPTSTE EGTSTEPSEG SAPGTSESAT PESGPGTSES ATPESGPGTS

951 ESATPESGPG SEPATSGSET PGSEPATSGS ETPGSPAGSP TSTEEGTSTE951 ESATPESGPG SEPATSGSET PGSEPATSGS ETPGSPAGSP TSTEEGTSTE

1001 PSEGSAPGTS TEPSEGSAPG SEPATSGSET PGTSESATPE SGPGTSTEPS1001 PSEGSAPGTS TEPSEGSAPG SEPATSGSET PGTSESATPE SGPGTSTEPS

1051 EGSAPASSPP VLKRHQAEIT RTTLQSDQEE IDYDDTISVE MKKEDFDIYD1051 EGSAPASSPP VLKRHQAEIT RTTLQSDQEE IDYDDTISVE MKKEDFDIYD

1101 EDENQSPRSF QKKTRHYFIA AVERLWDYGM SSSPHVLRNR AQSGSVPQFK1101 EDENQSPRSF QKKTRHYFIA AVERLWDYGM SSSPHVLRNR AQSGSVPQFK

1151 KVVFQEFTDG SFTQPLYRGE LNEHLGLLGP YIRAEVEDNI MVTFRNQASR1151 KVVFQEFTDG SFTQPLYRGE LNEHLGLLGP YIRAEVEDNI MVTFRNQASR

1201 PYSFYSSLIS YEEDQRQGAE PRKNFVKPNE TKTYFWKVQH HMAPTKDEFD1201 PYSFYSSLIS YEEDQRQGAE PRKNFVKPNE TKTYFWKVQH HMAPTKDEFD

1251 CKAWAYFSDV DLEKDVHSGL IGPLLVCHTN TLNPAHGRQV TVQEFALFFT1251 CKAWAYFSDV DLEKDVHSGL IGPLLVCHTN TLNPAHGRQV TVQEFALFFT

1301 ^iIFDETKSWYF TENMERNCRG APTSESATPE SGPGSEPATS GSETPGTSES1301 ^iIFDETKSWYF TENMERNCRG APTSESATPE SGPGSEPATS GSETPGTSES

1351 ATPESGPGSE PATSGSETPG TSESATPESG PGTSTEPSEG SAPGTSESAT1351 ATPESGPGSE PATSGSETPG TSESATPESG PGTSTEPSEG SAPGTSESAT

1401 PESGPGSPAG SPTSTEEGSP AGSPTSTEEG SPAGSPTSTE EGTSESATPE1401 PESGPGSPAG SPTSTEEGSP AGSPTSTEEG SPAGSPTSTE EGTSESATPE

1451 SGPGTSTEPS EGSAPGASSA PCNIQMEDPT FKENYRFHAINGYIMDTLPG1451 SGPGTSTEPS EGSAPGASSA PCNIQMEDPT FKENYRFHAINGYIMDTLPG

1501 LVMAQDQRIR WYLLSMGSNE NIHSIHFSGH VFTVRKKEEY KMALYNLYPG1501 LVMAQDQRIR WYLLSMGSNE NIHSIHFSGH VFTVRKKEEY KMALYNLYPG

1551 VFETVEMLPS KAGIWRVECLIGEHLHAGMS TLFLVYSNKC QTPLGMASGH1551 VFETVEMLPS KAGIWRVECLIGEHLHAGMS TLFLVYSNKC QTPLGMASGH

1601 IRDFQITASG QYGQWAPKLA RLHYSGSINA WSTKEPFSWI KVDLLAPMII1601 IRDFQITASG QYGQWAPKLA RLHYSGSINA WSTKEPFSWI KVDLLAPMII

1651 HGIKTQGARQ KFSSLYISQF IIMYSLDGKK WQTYRGNSTG TLMVFFGNVD1651 HGIKTQGARQ KFSSLYISQF IIMYSLDGKK WQTYRGNSTG TLMVFFGNVD

1701 SSGIKHNIFN PPIIARYIRL HPTHYSIRST LRMELMGCDL NSCSMPLGME1701 SSGIKHNIFN PPIIARYIRL HPTHYSIRST LRMELMGCDL NSSCSMPLGME

1751 SKAISDAQIT ASSYFTNMFA TWSPSKARLH LQGRSNAWRP QVNNPKEWLQ1751 SKAISDAQIT ASSYFTNMFA TWSPSKARLH LQGRSNAWRP QVNNPKEWLQ

1801 VDFQKTMKVT GVTTQGVKSL LTSMYVKEFL ISSSQDGHQW TLFFQNGKVK1801 VDFQKTMKVT GVTTQGVKSL LTSMYVKEFL ISSSQDGHQW TLFFQNGKVK

1851 VFQGNQDSFT PVVNSLDPPL LTRYLRIHPQ SWVHQIALRM EVLGCEAQDL1851 VFQGNQDSFT PVVNSLDPPL LTRYLRIHPQ SWVHQIALRM EVLGCEAQDL

1901 YDKTHTCPPC PAPELLGGPS VFLFPPKPKD TLMISRTPEV TCVVVDVSHE1901 YDKTHTCPPC PAPELLGGPS VFLFPPKPKD TLMISRTPEV TCVVVDVSHE

1951 DPEVKFNWYV DGVEVHNAKT KPREEQYNST YRVVSVLTVL HQDWLNGKEY1951 DPEVKFNWYV DGVEVHNAKT KPREEQYNST YRVVSVLTVL HQDWLNGKEY

2001 KCKVSNKALP APIEKTISKA KGQPREPQVY TLPPSRDELT KNQVSLTCLV2001 KCKVSNKALP APIEKTISKA KGQPREPQVY TLPPSRDELT KNQVSLTCLV

2051 KGFYPSDIAV EWESNGQPEN NYKTTPPVLD SDGSFFLYSK LTVDKSRWQQ2051 KGFYPSDIAV EWESNGQPEN NYKTTPPVLD SDGSFFLYSK LTVDKSRWQQ

2101 GNVFSCSVMH EALHNHYTQK SLSLSPGK*2101 GNVFSCSVMH EALHNHYTQK SLSLSPGK*

- 157 044115- 157 044115

Последовательность белка FVIII 204 (одноцепочечный FVIIIFc с двумя АЕ XTENs; одним 288АЕFVIII 204 protein sequence (single-chain FVIIIFc with two AE XTENs; one 288AE

XTEN в домене В и одним 144 АЕ XTEN в аминокислоте 403) (SEQ ID NO: 78).XTEN in domain B and one 144 AE of XTEN at amino acid 403) (SEQ ID NO: 78).

MQIELSTCFF LCLLRFCFSA TRRYYLGAVE LSWDYMQSDL GELPVDARFPMQIELSTCFF LCLLRFCFSA TRRYYLGAVE LSWDYMQSDL GELPVDARFP

PRVPKSFPFN TSVVYKKTLF VEFTDHLFNIAKPRPPWMGL LGPTIQAEVYPRVPKSFPFN TSVVYKKTLF VEFTDHLFNIAKPRPPWMGL LGPTIQAEVY

101 DTVVITLKNM ASHPVSLHAV GVSYWKASEG AEYDDQTSQR EKEDDKVFPG101 DTVVITLKNM ASHPVSLHAV GVSYWKASEG AEYDDQTSQR EKEDDKVFPG

151 GSHTYVWQVL KENGPMASDP LCLTYSYLSH VDLVKDLNSG LIGALLVCRE151 GSHTYVWQVL KENGPMASDP LCLTYSYLSH VDLVKDLNSG LIGALLVCRE

201 GSLAKEKTQT LHKFILLFAV FDEGKSWHSE TKNSLMQDRD AASARAWPKM201 GSLAKEKTQT LHKFILLFAV FDEGKSWHSE TKNSLMQDRD AASARWPKM

251 HTVNGYVNRS LPGLIGCHRK SVYWHVIGMG TTPEVHSIFL EGHTFLVRNH251 HTVNGYVNRS LPGLIGCHRK SVYWHVIGMG TTPEVHSIFL EGHTFLVRNH

301 RQASLEISPITFLTAQTLLM DLGQFLLFCH ISSHQHDGME AYVKVDSCPE301 RQASLEISPITFLTAQTLLM DLGQFLLFCH ISSHQHDGME AYVKVDSCPE

351 EPQLRMKNNE EAEDYDDDLT DSEMDVVRFD DDNSPSFIQI RSVAKKHPKT351 EPQLRMKNNE EAEDYDDDLT DSEMDVVRFD DDNSPSFIQI RSVAKKHPKT

401 WVHYIAAEEE DWDYAPLVLA PDGAPTSTEP SEGSAPGSPA GSPTSTEEGT401 WVHYIAAEEE DWDYAPLVLA PDGAPTSTEP SEGSAPGSPA GSPTSTEEGT

451 STEPSEGSAP GTSTEPSEGS APGTSESATP ESGPGTSTEP SEGSAPGTSE451 STEPSEGSAP GTSTEPSEGS APGTSESATP ESGPGTSTEP SEGSAPGTSE

501 SATPESGPGS EPATSGSETP GTSTEPSEGS APGTSTEPSE GSAPGTSESA501 SATPESGPGS EPATSGSETP GTSTEPSEGS APGTSTEPSE GSAPGTSESA

551 TPESGPGTSE SATPESGPGA SSDRSYKSQY LNNGPQRIGR KYKKVRFMAY551 TPESGPGTSE SATPESGPGA SSDRSYKSQY LNNGPQRIGR KYKKVRFMAY

601 TDETFKTREAIQHESGILGP LLYGEVGDTL LIIFKNQASR PYNIYPHGIT601 TDETFKTREAIQHESGILGP LLYGEVGDTL LIIFKNQASR PYNIYPHGIT

651 DVRPLYSRRL PKGVKHLKDF PILPGEIFKY KWTVTVEDGP TKSDPRCLTR651 DVRPLYSRRL PKGVKHLKDF PILPGEIFKY KWTVTVEDGP TKSDPRCLTR

701 YYSSFVNMER DLASGLIGPL LICYKESVDQ RGNQIMSDKR NVILFSVFDE701 YYSSFVNMER DLASGLIGPL LICYKESVDQ RGNQIMSDKR NVILFSVFDE

751 NRSWYLTENI QRFLPNPAGV QLEDPEFQAS NIMHSINGYV FDSLQLSVCL751 NRSWYLTENI QRFLPNPAGV QLEDPEFQAS NIMHSINGYV FDSLQLSVCL

801 HEVAYWYILS IGAQTDFLSV FFSGYTFKHK MVYEDTLTLF PFSGETVFMS801 HEVAYWYILS IGAQTDFLSV FFSGYTFKHK MVYEDTLTLF PFSGETVFMS

851 MENPGLWILG CHNSDFRNRG MTALLKVSSC DKNTGDYYED SYEDISAYLL851 MENPGLWILG CHNSDFRNRG MTALLKVSSC DKNTGDYYED SYEDISAYLL

901 SKNNAIEPRS FSQNGAPGTS ESATPESGPG SEPATSGSET PGTSESATPE901 SKNNAIEPRS FSQNGAPGTS ESATPESGPG SEPATSGSET PGTSESATPE

951 SGPGSEPATS GSETPGTSES ATPESGPGTS TEPSEGSAPG SPAGSPTSTE951 SGPGSEPATS GSETPGTSES ATPESGPGTS TEPSEGSAPG SPAGSPTSTE

1001 EGTSESATPE SGPGSEPATS GSETPGTSES ATPESGPGSP AGSPTSTEEG1001 EGTSESATPE SGPGSEPATS GSETPGTSES ATPESGPGSP AGSPTSTEEG

1051 SPAGSPTSTE EGTSTEPSEG SAPGTSESAT PESGPGTSES ATPESGPGTS1051 SPAGSPTSTE EGTSTEPSEG SAPGTSESAT PESGPGTSES ATPESGPGTS

1101 ESATPESGPG SEPATSGSET PGSEPATSGS ETPGSPAGSP TSTEEGTSTE1101 ESATPESGPG SEPATSGSET PGSEPATSGS ETPGSPAGSP TSTEEGTSTE

1151 PSEGSAPGTS TEPSEGSAPG SEPATSGSET PGTSESATPE SGPGTSTEPS1151 PSEGSAPGTS TEPSEGSAPG SEPATSGSET PGTSESATPE SGPGTSTEPS

1201 EGSAPASSPP VLKRHQAEIT RTTLQSDQEE IDYDDTISVE MKKEDFDIYD1201 EGSAPASSPP VLKRHQAEIT RTTLQSDQEE IDYDDTISVE MKKEDFDIYD

1251 EDENQSPRSF QKKTRHYFIA AVERLWDYGM SSSPHVLRNR AQSGSVPQFK1251 EDENQSPRSF QKKTRHYFIA AVERLWDYGM SSSPHVLRNR AQSGSVPQFK

1301 KVVFQEFTDG SFTQPLYRGE LNEHLGLLGP YIRAEVEDNI MVTFRNQASR1301 KVVFQEFTDG SFTQPLYRGE LNEHLGLLGP YIRAEVEDNI MVTFRNQASR

1351 PYSFYSSLIS YEEDQRQGAE PRKNFVKPNE TKTYFWKVQH HMAPTKDEFD1351 PYSFYSSLIS YEEDQRQGAE PRKNFVKPNE TKTYFWKVQH HMAPTKDEFD

1401 CKAWAYFSDV DLEKDVHSGL IGPLLVCHTN TLNPAHGRQV TVQEFALFFT1401 CKAWAYFSDV DLEKDVHSGL IGPLLVCHTN TLNPAHGRQV TVQEFALFFT

1451 IFDETKSWYF TENMERNCRA PCNIQMEDPT FKENYRFHAI NGYIMDTLPG1451 IFDETKSWYF TENMERNCRA PCNIQMEDPT FKENYRFHAI NGYIMDTLPG

1501 LVMAQDQRIR WYLLSMGSNE NIHSIHFSGH VFTVRKKEEY KMALYNLYPG1501 LVMAQDQRIR WYLLSMGSNE NIHSIHFSGH VFTVRKKEEY KMALYNLYPG

1551 VFETVEMLPS KAGIWRVECL IGEHLHAGMS TLFLVYSNKC QTPLGMASGH1551 VFETVEMLPS KAGIWRVECL IGEHLHAGMS TLFLVYSNKC QTPLGMASGH

1601 IRDFQITASG QYGQWAPKLA RLHYSGSINA WSTKEPFSWI KVDLLAPMII1601 IRDFQITASG QYGQWAPKLA RLHYSGSINA WSTKEPFSWI KVDLLAPMII

1651 HGIKTQGARQ KFSSLYISQF IIMYSLDGKK WQTYRGNSTG TLMVFFGNVD1651 HGIKTQGARQ KFSSLYISQF IIMYSLDGKK WQTYRGNSTG TLMVFFGNVD

1701 SSGIKHNIFN PPIIARYIRL HPTHYSIRST LRMELMGCDL NSCSMPLGME1701 SSGIKHNIFN PPIIARYIRL HPTHYSIRST LRMELMGCDL NSSCSMPLGME

1751 SKAISDAQIT ASSYFTNMFA TWSPSKARLH LQGRSNAWRP QVNNPKEWLQ1751 SKAISDAQIT ASSYFTNMFA TWSPSKARLH LQGRSNAWRP QVNNPKEWLQ

1801 VDFQKTMKVT GVTTQGVKSL LTSMYVKEFL ISSSQDGHQW TLFFQNGKVK1801 VDFQKTMKVT GVTTQGVKSL LTSMYVKEFL ISSSQDGHQW TLFFQNGKVK

1851 VFQGNQDSFT PVVNSLDPPL LTRYLRIHPQ SWVHQIALRM EVLGCEAQDL1851 VFQGNQDSFT PVVNSLDPPL LTRYLRIHPQ SWVHQIALRM EVLGCEAQDL

1901 YDKTHTCPPC PAPELLGGPS VFLFPPKPKD TLMISRTPEV TCVVVDVSHE1901 YDKTHTCPPC PAPELLGGPS VFLFPPKPKD TLMISRTPEV TCVVVDVSHE

1951 DPEVKFNWYV DGVEVHNAKT KPREEQYNST YRVVSVLTVL HQDWLNGKEY1951 DPEVKFNWYV DGVEVHNAKT KPREEQYNST YRVVSVLTVL HQDWLNGKEY

2001 KCKVSNKALP APIEKTISKA KGQPREPQVY TLPPSRDELT KNQVSLTCLV2001 KCKVSNKALP APIEKTISKA KGQPREPQVY TLPPSRDELT KNQVSLTCLV

2051 KGFYPSDIAV EWESNGQPEN NYKTTPPVLD SDGSFFLYSK LTVDKSRWQQ2051 KGFYPSDIAV EWESNGQPEN NYKTTPPVLD SDGSFFLYSK LTVDKSRWQQ

2101 GNVFSCSVMH EALHNHYTQK SLSLSPGK*2101 GNVFSCSVMH EALHNHYTQK SLSLSPGK*

- 158 044115- 158 044115

Последовательность белка FVIII 205 (одноцепочечный FVIIIFc с двумя AE XTENs; одним 288АЕFVIII 205 protein sequence (single chain FVIIIFc with two AE XTENs; one 288AE

XTEN в домене В и одним 144 AE XTEN в аминокислоте 18) (SEQ ID NO: 79).XTEN in domain B and one 144 AE XTEN in amino acid 18) (SEQ ID NO: 79).

MQIELSTCFF LCLLRFCFSA TRRYYLGAVE LSWDYMQGAP TSESATPESGMQIELSTCFF LCLLRFCFSA TRRYYLGAVE LSWDYMQGAP TSESATPESG

PGSEPATSGS ETPGTSESAT PESGPGSEPA TSGSETPGTS ESATPESGPGPGSEPATSGS ETPGTSESAT PESGPGSEPA TSGSETPGTS ESATPESGPG

101 TSTEPSEGSA PGSPAGSPTS TEEGTSESAT PESGPGSEPA TSGSETPGTS101 TSTEPSEGSA PGSPAGSPTS TEEGTSESAT PESGPGSEPA TSGSETPGTS

151 ESATPESGPG SPAGSPTSTE EGSPAGSPTS TEEGASSSDL GELPVDARFP151 ESATPESGPG SPAGSPTSTE EGSPAGSPTS TEEGASSSDL GELPVDARFP

201 PRVPKSFPFN TSVVYKKTLF VEFTDHLFNI AKPRPPWMGL LGPTIQAEVY201 PRVPKSFPFN TSVVYKKTLF VEFTDHLFNI AKPRPPWMGL LGPTIQAEVY

251 DTVVITLKNM ASHPVSLHAV GVSYWKASEG AEYDDQTSQR EKEDDKVFPG251 DTVVITLKNM ASHPVSLHAV GVSYWKASEG AEYDDQTSQR EKEDDKVFPG

301 GSHTYVWQVL KENGPMASDP LCLTYSYLSH VDLVKDLNSG LIGALLVCRE301 GSHTYVWQVL KENGPMASDP LCLTYSYLSH VDLVKDLNSG LIGALLVCRE

351 GSLAKEKTQT LHKFILLFAV FDEGKSWHSE TKNSLMQDRD AASARAWPKM351 GSLAKEKTQT LHKFILLFAV FDEGKSWHSE TKNSLMQDRD AASARWPKM

401 HTVNGYVNRS LPGLIGCHRK SVYWHVIGMG TTPEVHSIFL EGHTFLVRNH401 HTVNGYVNRS LPGLIGCHRK SVYWHVIGMG TTPEVHSIFL EGHTFLVRNH

451 RQASLEISPI TFLTAQTLLM DLGQFLLFCH ISSHQHDGME AYVKVDSCPE451 RQASLEISPI TFLTAQTLLM DLGQFLLFCH ISSHQHDGME AYVKVDSCPE

501 EPQLRMKNNE EAEDYDDDLT DSEMDVVRFD DDNSPSFIQI RSVAKKHPKT501 EPQLRMKNNE EAEDYDDDLT DSEMDVVRFD DDNSPSFIQI RSVAKKHPKT

551 WVHYIAAEEE DWDYAPLVLA PDDRSYKSQY LNNGPQRIGR KYKKVRFMAY551 WVHYIAAEEE DWDYAPLVLA PDDRSYKSQY LNNGPQRIGR KYKKVRFMAY

601 TDETFKTREA IQHESGILGP LLYGEVGDTL LIIFKNQASR PYNIYPHGIT601 TDETFKTREA IQHESGILGP LLYGEVGDTL LIIFKNQASR PYNIYPHGIT

651 DVRPLYSRRL PKGVKHLKDF PILPGEIFKY KWTVTVEDGP TKSDPRCLTR651 DVRPLYSRRL PKGVKHLKDF PILPGEIFKY KWTVTVEDGP TKSDPRCLTR

701 YYSSFVNMER DLASGLIGPL LICYKESVDQ RGNQIMSDKR NVILFSVFDE701 YYSSFVNMER DLASGLIGPL LICYKESVDQ RGNQIMSDKR NVILFSVFDE

751 NRSWYLTENI QRFLPNPAGV QLEDPEFQAS NIMHSINGYV FDSLQLSVCL751 NRSWYLTENI QRFLPNPAGV QLEDPEFQAS NIMHSINGYV FDSLQLSVCL

801 HEVAYWYILS IGAQTDFLSV FFSGYTFKHK MVYEDTLTLF PFSGETVFMS801 HEVAYWYILS IGAQTDFLSV FFSGYTFKHK MVYEDTLTLF PFSGETVFMS

851 MENPGLWILG CHNSDFRNRG MTALLKVSSC DKNTGDYYED SYEDISAYLL851 MENPGLWILG CHNSDFRNRG MTALLKVSSC DKNTGDYYED SYEDISAYLL

901 SKNNAIEPRS FSQNGAPGTS ESATPESGPG SEPATSGSET PGTSESATPE901 SKNNAIEPRS FSQNGAPGTS ESATPESGPG SEPATSGSET PGTSESATPE

951 SGPGSEPATS GSETPGTSES ATPESGPGTS TEPSEGSAPG SPAGSPTSTE951 SGPGSEPATS GSETPGTSES ATPESGPGTS TEPSEGSAPG SPAGSPTSTE

1001 EGTSESATPE SGPGSEPATS GSETPGTSES ATPESGPGSP AGSPTSTEEG1001 EGTSESATPE SGPGSEPATS GSETPGTSES ATPESGPGSP AGSPTSTEEG

1051 SPAGSPTSTE EGTSTEPSEG SAPGTSESAT PESGPGTSES ATPESGPGTS1051 SPAGSPTSTE EGTSTEPSEG SAPGTSESAT PESGPGTSES ATPESGPGTS

1101 ESATPESGPG SEPATSGSET PGSEPATSGS ETPGSPAGSP TSTEEGTSTE1101 ESATPESGPG SEPATSGSET PGSEPATSGS ETPGSPAGSP TSTEEGTSTE

1151 PSEGSAPGTS TEPSEGSAPG SEPATSGSET PGTSESATPE SGPGTSTEPS1151 PSEGSAPGTS TEPSEGSAPG SEPATSGSET PGTSESATPE SGPGTSTEPS

1201 EGSAPASSPP VLKRHQAEIT RTTLQSDQEE IDYDDTISVE MKKEDFDIYD1201 EGSAPASSPP VLKRHQAEIT RTTLQSDQEE IDYDDTISVE MKKEDFDIYD

1251 EDENQSPRSF QKKTRHYFIA AVERLWDYGM SSSPHVLRNR AQSGSVPQFK1251 EDENQSPRSF QKKTRHYFIA AVERLWDYGM SSSPHVLRNR AQSGSVPQFK

1301 KVVFQEFTDG SFTQPLYRGE LNEHLGLLGP YIRAEVEDNI MVTFRNQASR1301 KVVFQEFTDG SFTQPLYRGE LNEHLGLLGP YIRAEVEDNI MVTFRNQASR

1351 PYSFYSSLIS YEEDQRQGAE PRKNFVKPNE TKTYFWKVQH HMAPTKDEFD1351 PYSFYSSLIS YEEDQRQGAE PRKNFVKPNE TKTYFWKVQH HMAPTKDEFD

1401 CKAWAYFSDV DLEKDVHSGL IGPLLVCHTN TLNPAHGRQV TVQEFALFFT1401 CKAWAYFSDV DLEKDVHSGL IGPLLVCHTN TLNPAHGRQV TVQEFALFFT

1451 IFDETKSWYF TENMERNCRA PCNIQMEDPT FKENYRFHAI NGYIMDTLPG1451 IFDETKSWYF TENMERNCRA PCNIQMEDPT FKENYRFHAI NGYIMDTLPG

1501 LVMAQDQRIR WYLLSMGSNE NIHSIHFSGH VFTVRKKEEY KMALYNLYPG1501 LVMAQDQRIR WYLLSMGSNE NIHSIHFSGH VFTVRKKEEY KMALYNLYPG

1551 VFETVEMLPS KAGIWRVECL IGEHLHAGMS TLFLVYSNKC QTPLGMASGH1551 VFETVEMLPS KAGIWRVECL IGEHLHAGMS TLFLVYSNKC QTPLGMASGH

1601 IRDFQITASG QYGQWAPKLA RLHYSGSINA WSTKEPFSWI KVDLLAPMII1601 IRDFQITASG QYGQWAPKLA RLHYSGSINA WSTKEPFSWI KVDLLAPMII

1651 HGIKTQGARQ KFSSLYISQF IIMYSLDGKK WQTYRGNSTG TLMVFFGNVD1651 HGIKTQGARQ KFSSLYISQF IIMYSLDGKK WQTYRGNSTG TLMVFFGNVD

1701 SSGIKHNIFN PPIIARYIRL HPTHYSIRST LRMELMGCDL NSCSMPLGME1701 SSGIKHNIFN PPIIARYIRL HPTHYSIRST LRMELMGCDL NSSCSMPLGME

1751 SKAISDAQIT ASSYFTNMFA TWSPSKARLH LQGRSNAWRP QVNNPKEWLQ1751 SKAISDAQIT ASSYFTNMFA TWSPSKARLH LQGRSNAWRP QVNNPKEWLQ

1801 VDFQKTMKVT GVTTQGVKSL LTSMYVKEFL ISSSQDGHQW TLFFQNGKVK1801 VDFQKTMKVT GVTTQGVKSL LTSMYVKEFL ISSSQDGHQW TLFFQNGKVK

1851 VFQGNQDSFT PVVNSLDPPL LTRYLRIHPQ SWVHQIALRM EVLGCEAQDL1851 VFQGNQDSFT PVVNSLDPPL LTRYLRIHPQ SWVHQIALRM EVLGCEAQDL

1901 YDKTHTCPPC PAPELLGGPS VFLFPPKPKD TLMISRTPEV TCVVVDVSHE1901 YDKTHTCPPC PAPELLGGPS VFLFPPKPKD TLMISRTPEV TCVVVDVSHE

1951 DPEVKFNWYV DGVEVHNAKT KPREEQYNST YRVVSVLTVL HQDWLNGKEY1951 DPEVKFNWYV DGVEVHNAKT KPREEQYNST YRVVSVLTVL HQDWLNGKEY

2001 KCKVSNKALP APIEKTISKA KGQPREPQVY TLPPSRDELT KNQVSLTCLV2001 KCKVSNKALP APIEKTISKA KGQPREPQVY TLPPSRDELT KNQVSLTCLV

2051 KGFYPSDIAV EWESNGQPEN NYKTTPPVLD SDGSFFLYSK LTVDKSRWQQ2051 KGFYPSDIAV EWESNGQPEN NYKTTPPVLD SDGSFFLYSK LTVDKSRWQQ

2101 GNVFSCSVMH EALHNHYTQK SLSLSPGK*2101 GNVFSCSVMH EALHNHYTQK SLSLSPGK*

- 159 044115- 159 044115

Последовательность белка pSYN FVIII 266 (FVIII Fc с 42 AE-XTEN в аминокислоте 18 и 288 AEProtein sequence of pSYN FVIII 266 (FVIII Fc with 42 AE-XTEN at amino acid 18 and 288 AE

XTEN в домене В) SEO ID NO: 80).XTEN in domain B) SEO ID NO: 80).

MQIELSTCFF LCLLRFCFSA TRRYYLGAVE LSWDYMQGAP GSPAGSPTSTMQIELSTCFF LCLLRFCFSA TRRYYLGAVE LSWDYMQGAP GSPAGSPTST

EEGTSESATP ESGPGSEPAT SGSETPASSS DLGELPVDAR FPPRVPKSFPEEGTSESATP ESGPGSEPAT SGSETPASS DLGELPVDAR FPPRVPKSFP

101 FNTSVVYKKT LFVEFTDHLF NIAKPRPPWM GLLGPTIQAE VYDTVVITLK101 FNTSVVYKKT LFVEFTDHLF NIAKPRPPWM GLLGPTIQAE VYDTVVITLK

151 NMASHPVSLH AVGVSYWKAS EGAEYDDQTS QREKEDDKVF PGGSHTYVWQ151 NMASHPVSLH AVGVSYWKAS EGAEYDDQTS QREKEDDKVF PGGSHTYVWQ

201 VLKENGPMAS DPLCLTYSYL SHVDLVKDLN SGLIGALLVC REGSLAKEKT 251 QTLHKFILLF AVFDEGKSWH SETKNSLMQD RDAASARAWP KMHTVNGYVN201 VLKENGPMAS DPLCLTYSYL SHVDLVKDLN SGLIGALLVC REGSLAKEKT 251 QTLHKFILLF AVFDEGKSWH SETKNSLMQD RDAASARAWP KMHTVNGYVN

301 RSLPGLIGCH RKSVYWHVIG MGTTPEVHSI FLEGHTFLVR NHRQASLEIS301 RSLPGLIGCH RKSVYWHVIG MGTTPEVHSI FLEGHTFLVR NHRQASLEIS

351 PITFLTAQTL LMDLGQFLLF CHISSHQHDG MEAYVKVDSC PEEPQLRMKN351 PITFLTAQTL LMDLGQFLLF CHISSHQHDG MEAYVKVDSC PEEPQLRMKN

401 NEEAEDYDDD LTDSEMDVVR FDDDNSPSFI QIRSVAKKHP KTWVHYIAAE 451 EEDWDYAPLV LAPDDRSYKS QYLNNGPQRI GRKYKKVRFM AYTDETFKTR401 NEEAEDYDDD LTDSEMDVVR FDDDNSPSFI QIRSVAKKHP KTWVHYIAAE 451 EEDWDYAPLV LAPDDRSYKS QYLNNGPQRI GRKYKKVRFM AYTDETFKTR

501 EAIQHESGIL GPLLYGEVGD TLLIIFKNQA SRPYNIYPHG ITDVRPLYSR 551 RLPKGVKHLK DFPILPGEIF KYKWTVTVED GPTKSDPRCL TRYYSSFVNM501 EAIQHESGIL GPLLYGEVGD TLLIIFKNQA SRPYNIYPHG ITDVRPLYSR 551 RLPKGVKHLK DFPILPGEIF KYKWTVTVED GPTKSDPRCL TRYYSSFVNM

601 ERDLASGLIG PLLICYKESV DQRGNQIMSD KRNVILFSVF DENRSWYLTE 651 NIQRFLPNPA GVQLEDPEFQ ASNIMHSING YVFDSLQLSV CLHEVAYWYI 701 LSIGAQTDFL SVFFSGYTFK HKMVYEDTLT LFPFSGETVF MSMENPGLWI601 ERDLASGLIG PLLICYKESV DQRGNQIMSD KRNVILFSVF DENRSWYLTE 651 NIQRFLPNPA GVQLEDPEFQ ASNIMHSING YVFDSLQLSV CLHEVAYWYI 701 LSIGAQTDFL SVFFSGYTFK HKMVYEDTLT LFPFSGETVF MSMENPGLWI

751 LGCHNSDFRN RGMTALLKVS SCDKNTGDYY EDSYEDISAY LLSKNNAIEP751 LGCHNSDFRN RGMTALLKVS SCDKNTGDYY EDSYEDISAY LLSKNNAIEP

801 RSFSQNGAPG TSESATPESG PGSEPATSGS ETPGTSESAT PESGPGSEPA 851 TSGSETPGTS ESATPESGPG TSTEPSEGSA PGSPAGSPTS TEEGTSESAT801 RSFSQNGAPG TSESATPESG PGSEPATSGS ETPGTSESAT PESGPGSEPA 851 TSGSETPGTS ESATPESGPG TSTEPSEGSA PGSPAGSPTS TEEGTSESAT

901 PESGPGSEPA TSGSETPGTS ESATPESGPG SPAGSPTSTE EGSPAGSPTS901 PESGPGSEPA TSGSETPGTS ESATPESGPG SPAGSPTSTE EGSPAGSPTS

951 TEEGTSTEPS EGSAPGTSES ATPESGPGTS ESATPESGPG TSESATPESG951 TEEGTSTEPS EGSAPGTSES ATPESGPGTS ESATPESGPG TSESATPESG

1001 PGSEPATSGS ETPGSEPATS GSETPGSPAG SPTSTEEGTS TEPSEGSAPG 1051 TSTEPSEGSA PGSEPATSGS ETPGTSESAT PESGPGTSTE PSEGSAPASS1001 PGSEPATSGS ETPGSEPATS GSETPGSPAG SPTSTEEGTS TEPSEGSAPG 1051 TSTEPSEGSA PGSEPATSGS ETPGTSESAT PESGPGTSTE PSEGSAPASS

1101 PPVLKRHQAE ITRTTLQSDQ EEIDYDDTIS VEMKKEDFDI YDEDENQSPR1101 PPVLKRHQAE ITRTTLQSDQ EEIDYDDTIS VEMKKEDFDI YDEDENQSPR

1151 SFQKKTRHYF IAAVERLWDY GMSSSPHVLR NRAQSGSVPQ FKKVVFQEFT1151 SFQKKTRHYF IAAVERLWDY GMSSSPHVLR NRAQSGSVPQ FKKVVFQEFT

1201 DGSFTQPLYR GELNEHLGLL GPYIRAEVED NIMVTFRNQA SRPYSFYSSL1201 DGSFTQPLYR GELNEHLGLL GPYIRAEVED NIMVTFRNQA SRPYSFYSSL

1251 ISYEEDQRQG AEPRKNFVKP NETKTYFWKV QHHMAPTKDE FDCKAWAYFS 1301 DVDLEKDVHS GLIGPLLVCH TNTLNPAHGR QVTVQEFALF FTIFDETKSW 1351 YFTENMERNC RAPCNIQMED PTFKENYRFH AINGYIMDTL PGLVMAQDQR1251 ISYEEDQRQG AEPRKNFVKP NETKTYFWKV QHHMAPTKDE FDCKAWAYFS 1301 DVDLEKDVHS GLIGPLLVCH TNTLNPAHGR QVTVQEFALF FTIFDETKSW 1351 YFTENMERNC RAPCNIQMED PTFKENYRFH AINGYIMDTL PGLVMAQDQR

1401 IRWYLLSMGS NENIHSIHFS GHVFTVRKKE EYKMALYNLY PGVFETVEML1401 IRWYLLSMGS NENIHSIHFS GHVFTVRKKE EYKMALYNLY PGVFETVEML

1451 PSKAGIWRVE CLIGEHLHAG MSTLFLVYSN KCQTPLGMAS GHIRDFQITA 1501 SGQYGQWAPK LARLHYSGSI NAWSTKEPFS WIKVDLLAPM IIHGIKTQGA 1551 RQKFSSLYIS QFIIMYSLDG KKWQTYRGNS TGTLMVFFGN VDSSGIKHNI 1601 FNPPIIARYI RLHPTHYSIR STLRMELMGC DLNSCSMPLG MESKAISDAQ1451 PSKAGIWRVE CLIGEHLHAG MSTLFLVYSN KCQTPLGMAS GHIRDFQITA 1501 SGQYGQWAPK LARLHYSGSI NAWSTKEPFS WIKVDLLAPM IIHGIKTQGA 1551 RQKFSSLYIS QFIIMYSLDG KKWQTYRGNS TGTLMVFFGN VDSSGIKHNI 1601 F NPPIIARYI RLHPTHYSIR STLRMELMGC DLNSSCSMPLG MESKAISDAQ

1651 ITASSYFTNM FATWSPSKAR LHLQGRSNAW RPQVNNPKEW LQVDFQKTMK 1701 VTGVTTQGVK SLLTSMYVKE FLISSSQDGH QWTLFFQNGK VKVFQGNQDS 1751 FTPVVNSLDP PLLTRYLRIH PQSWVHQIAL RMEVLGCEAQ DLYDKTHTCP 1801 PCPAPELLGG PSVFLFPPKP KDTLMISRTP EVTCVVVDVS HEDPEVKFNW 1851 YVDGVEVHNA KTKPREEQYN STYRVVSVLT VLHQDWLNGK EYKCKVSNKA 1901 LPAPIEKTIS KAKGQPREPQ VYTLPPSRDE LTKNQVSLTC LVKGFYPSDI 1951 AVEWESNGQP ENNYKTTPPV LDSDGSFFLY SKLTVDKSRW QQGNVFSCSV1651 ITASSYFTNM FATWSPSKAR LHLQGRSNAW RPQVNNPKEW LQVDFQKTMK 1701 VTGVTTQGVK SLLTSMYVKE FLISSSQDGH QWTLFFQNGK VKVFQGNQDS 1751 FTPVVNSLDP PLLTRYLRIH PQSWVHQIAL RMEVLGCEAQ DLYDKTHTCP 1801 PCPAPELLGG PSVFLFPPKP KDTLMISRTP EVTCVVVDVS HEDPEVKFNW 1851 YVDGVEVHNA KTKPREEQYN STYRVVSVLT VLHQDWLNGK EYKCKVSNKA 1901 LPAPIEKTIS KAKGQPREPQ VYTLPPSRDE LTKNQVSLTC LVKGFYPSDI 1 951 AVEWESNGQP ENNYKTTPPV LDSDGSFFLY SKLTVDKSRW QQGNVFSCSV

2001 MHEALHNHYT QKSLSLSPGK *2001 MHEALHNHYT QKSLSLSPGK *

- 160 044115- 160 044115

Последовательность белка pSYN FVIII 267 (FVIII Fc с 72 AE-XTEN в аминокислоте 18 и 288 AEProtein sequence of pSYN FVIII 267 (FVIII Fc with 72 AE-XTEN at amino acid 18 and 288 AE

XTEN в домене В) SEQ ID NO: 81).XTEN in domain B) SEQ ID NO: 81).

MQIELSTCFF LCLLRFCFSA TRRYYLGAVE LSWDYMQGAP TSESATPESGMQIELSTCFF LCLLRFCFSA TRRYYLGAVE LSWDYMQGAP TSESATPESG

PGSEPATSGS ETPGTSESAT PESGPGSEPA TSGSETPGTS ESATPESGPGPGSEPATSGS ETPGTSESAT PESGPGSEPA TSGSETPGTS ESATPESGPG

101 TSTEPSEGSA PGASSSDLGE LPVDARFPPR VPKSFPFNTS VVYKKTLFVE101 TSTEPSEGSA PGASSSDLGE LPVDARFPPR VPKSFPFNTS VVYKKTLFVE

151 FTDHLFNIAK PRPPWMGLLG PTIQAEVYDT VVITLKNMAS HPVSLHAVGV151 FTDHLFNIAK PRPPWMGLLG PTIQAEVYDT VVITLKNMAS HPVSLHAVGV

201 SYWKASEGAE YDDQTSQREK EDDKVFPGGS HTYVWQVLKE NGPMASDPLC201 SYWKASEGAE YDDQTSQREK EDDKVFPPGGS HTYVWQVLKE NGPMASDPLC

251 LTYSYLSHVD LVKDLNSGLI GALLVCREGS LAKEKTQTLH KFILLFAVFD251 LTYSYLSHVD LVKDLNSGLI GALLVCREGS LAKEKTQTLH KFILLFAVFD

301 EGKSWHSETK NSLMQDRDAA SARAWPKMHT VNGYVNRSLP GLIGCHRKSV301 EGKSWHSETK NSLMQDRDAA SARAWPKMHT VNGYVNRSLP GLIGCHRKSV

351 YWHVIGMGTT PEVHSIFLEG HTFLVRNHRQ ASLEISPITF LTAQTLLMDL351 YWHVIGMGTT PEVHSIFLEG HTFLVRNHRQ ASLEISPITF LTAQTLLMDL

401 GQFLLFCHIS SHQHDGMEAY VKVDSCPEEP QLRMKNNEEA EDYDDDLTDS401 GQFLLFCHIS SHQHDGMEAY VKVDSCPEEP QLRMKNNEEA EDYDDDLTDS

451 EMDVVRFDDD NSPSFIQIRS VAKKHPKTWV HYIAAEEEDW DYAPLVLAPD451 EMDVVRFDDD NSPSFIQIRS VAKKHPKTWV HYIAAEEEDW DYAPLVLAPD

501 DRSYKSQYLN NGPQRIGRKY KKVRFMAYTD ETFKTREAIQ HESGILGPLL501 DRSYKSQYLN NGPQRIGRKY KKVRFMAYTD ETFKTREAIQ HESGILGPLL

551 YGEVGDTLLIIFKNQASRPY NIYPHGITDV RPLYSRRLPK GVKHLKDFPI551 YGEVGDTLLIIFKNQASRPY NIYPHGITDV RPLYSRRLPK GVKHLKDFPI

601 LPGEIFKYKW TVTVEDGPTK SDPRCLTRYY SSFVNMERDL ASGLIGPLLI601 LPGEIFKYKW TVTVEDGPTK SDPRCLTRYY SSFVNMERDL ASGLIGPLLI

651 CYKESVDQRG NQIMSDKRNV ILFSVFDENR SWYLTENIQR FLPNPAGVQL651 CYKESVDQRG NQIMSDKRNV ILFSVFDENR SWYLTENIQR FLPNPAGVQL

701 EDPEFQASNIMHSINGYVFD SLQLSVCLHE VAYWYILSIG AQTDFLSVFF701 EDPEFQASNIMHSINGYVFD SLQLSVCLHE VAYWYILSIG AQTDFLSVFF

751 SGYTFKHKMV YEDTLTLFPF SGETVFMSME NPGLWILGCH NSDFRNRGMT751 SGYTFKHKMV YEDTLTLFPF SGETVFMSME NPGLWILGCH NSDFRNRGMT

801 ALLKVSSCDK NTGDYYEDSY EDISAYLLSK NNAIEPRSFS QNGAPGTSES801 ALLKVSSCDK NTGDYYEDSY EDISAYLLSK NNAIEPRSFS QNGAPGTSES

851 ATPESGPGSE PATSGSETPG TSESATPESG PGSEPATSGS ETPGTSESAT851 ATPESGPGSE PATSGSETPG TSESATPESG PGSEPATSGS ETPGTSESAT

901 PESGPGTSTE PSEGSAPGSP AGSPTSTEEG TSESATPESG PGSEPATSGS901 PESGPGTSTE PSEGSAPGSP AGSPTSTEEG TSESATPESG PGSEPATSGS

951 ETPGTSESAT PESGPGSPAG SPTSTEEGSP AGSPTSTEEG TSTEPSEGSA951 ETPGTSESAT PESGPGSPAG SPTSTEEGSP AGSPTSTEEG TSTEPSEGSA

1001 PGTSESATPE SGPGTSESAT PESGPGTSES ATPESGPGSE PATSGSETPG1001 PGTSESATPE SGPGTSESAT PESGPGTSES ATPESGPGSE PATSGSETPG

1051 SEPATSGSET PGSPAGSPTS TEEGTSTEPS EGSAPGTSTE PSEGSAPGSE1051 SEPATSGSET PGSPAGSPTS TEEGTSTEPS EGSAPGTSTE PSEGSAPGSE

1101 PATSGSETPG TSESATPESG PGTSTEPSEG SAPASSPPVL KRHQAEITRT1101 PATSGSETPG TSESATPESG PGTSTEPSEG SAPASSPPVL KRHQAEITRT

1151 TLQSDQEEID YDDTISVEMK KEDFDIYDED ENQSPRSFQK KTRHYFIAAV1151 TLQSDQEEID YDDTISVEMK KEDFDIYDED ENQSPRSFQK KTRHYFIAAV

1201 ERLWDYGMSS SPHVLRNRAQ SGSVPQFKKV VFQEFTDGSF TQPLYRGELN1201 ERLWDYGMSS SPHVLRNRAQ SGSVPQFKKV VFQEFTDGSF TQPLYRGELN

1251 EHLGLLGPYIRAEVEDNIMV TFRNQASRPY SFYSSLISYE EDQRQGAEPR1251 EHLGLLGPYIRAEVEDNIMV TFRNQASRPY SFYSSLISYE EDQRQGAEPR

1301 KNFVKPNETK TYFWKVQHHM APTKDEFDCK AWAYFSDVDL EKDVHSGLIG1301 KNFVKPNETK TYFWKVQHHM APTKDEFDCK AWAYFSDVDL EKDVHSGLIG

1351 PLLVCHTNTL NPAHGRQVTV QEFALFFTIF DETKSWYFTE NMERNCRAPC1351 PLLVCHTNTL NPAHGRQVTV QEFALFFTIF DETKSWYFTE NMERNCRAPC

1401 NIQMEDPTFK ENYRFHAING YIMDTLPGLV MAQDQRIRWY LLSMGSNENI1401 NIQMEDPTFK ENYRFHAING YIMDTLPGLV MAQDQRIRWY LLSMGSNENI

1451 HSIHFSGHVF TVRKKEEYKM ALYNLYPGVF ETVEMLPSKA GIWRVECLIG1451 HSIHFSGHVF TVRKKEEYKM ALYNLYPGVF ETVEMLPSKA GIWRVECLIG

1501 EHLHAGMSTL FLVYSNKCQT PLGMASGHIR DFQITASGQY GQWAPKLARL1501 EHLHAGMSTL FLVYSNKCQT PLGMASGHIR DFQITASGQY GQWAPKLARL

1551 HYSGSINAWS TKEPFSWIKV DLLAPMIIHGIKTQGARQKF SSLYISQFII1551 HYSGSINAWS TKEPFSWIKV DLLAPMIIHGIKTQGARQKF SSLYISQFII

1601 MYSLDGKKWQ TYRGNSTGTL MVFFGNVDSS GIKHNIFNPP IIARYIRLHP1601 MYSLDGKKWQ TYRGNSTGTL MVFFGNVDSS GIKHNIFNPP IIARYIRLHP

1651 THYSIRSTLR MELMGCDLNS CSMPLGMESK AISDAQITAS SYFTNMFATW1651 THYSIRSTLR MELMGCDLNS CSMPLGMESK AISDAQITAS SYFTNMFATW

1701 SPSKARLHLQ GRSNAWRPQV NNPKEWLQVD FQKTMKVTGV TTQGVKSLLT1701 SPSKARLHLQ GRSNAWRPQV NNPKEWLQVD FQKTMKVTGV TTQGVKSLLT

1751 SMYVKEFLIS SSQDGHQWTL FFQNGKVKVF QGNQDSFTPV VNSLDPPLLT1751 SMYVKEFLIS SSQDGHQWTL FFQNGKVKVF QGNQDSFTPV VNSLDPPLLT

1801 RYLRIHPQSW VHQIALRMEV LGCEAQDLYD KTHTCPPCPA PELLGGPSVF1801 RYLRIHPQSW VHQIALRMEV LGCEAQDLYD KTHTCPPCPA PELLGGPSVF

1851 LFPPKPKDTL MISRTPEVTC VVVDVSHEDP EVKFNWYVDG VEVHNAKTKP1851 LFPPKPKDTL MISRTPEVTC VVVDVSHEDP EVKFNWYVDG VEVHNAKTKP

1901 REEQYNSTYR VVSVLTVLHQ DWLNGKEYKC KVSNKALPAPIEKTISKAKG1901 REEQYNSTYR VVSVLTVLHQ DWLNGKEYKC KVSNKALPAPIEKTISKAKG

1951 QPREPQVYTL PPSRDELTKN QVSLTCLVKG FYPSDIAVEW ESNGQPENNY1951 QPREPQVYTL PPSRDELTKN QVSLTCLVKG FYPSDIAVEW ESNGQPENNY

2001 KTTPPVLDSD GSFFLYSKLT VDKSRWQQGN VFSCSVMHEA LHNHYTQKSL2001 KTTPPVLDSD GSFFLYSKLT VDKSRWQQGN VFSCSVMHEA LHNHYTQKSL

2051 SLSPGK*2051 SLSPGK*

- 161 044115- 161 044115

Последовательность белка pSYN FVIII 268 (FVIII Fc с 144 AE-XTEN в аминокислоте 18) SEQProtein sequence of pSYN FVIII 268 (FVIII Fc with 144 AE-XTEN at amino acid 18) SEQ

ID NO: 82).ID NO: 82).

MQIELSTCFF LCLLRFCFSA TRRYYLGAVE LSWDYMQGAP TSESATPESGMQIELSTCFF LCLLRFCFSA TRRYYLGAVE LSWDYMQGAP TSESATPESG

PGSEPATSGS ETPGTSESAT PESGPGSEPA TSGSETPGTS ESATPESGPGPGSEPATSGS ETPGTSESAT PESGPGSEPA TSGSETPGTS ESATPESGPG

101 TSTEPSEGSA PGSPAGSPTS TEEGTSESAT PESGPGSEPA TSGSETPGTS101 TSTEPSEGSA PGSPAGSPTS TEEGTSESAT PESGPGSEPA TSGSETPGTS

151 ESATPESGPG SPAGSPTSTE EGSPAGSPTS TEEGASSSDL GELPVDARFP151 ESATPESGPG SPAGSPTSTE EGSPAGSPTS TEEGASSSDL GELPVDARFP

201 PRVPKSFPFN TSVVYKKTLF VEFTDHLFNI AKPRPPWMGL LGPTIQAEVY201 PRVPKSFPFN TSVVYKKTLF VEFTDHLFNI AKPRPPWMGL LGPTIQAEVY

251 DTVVITLKNM ASHPVSLHAV GVSYWKASEG AEYDDQTSQR EKEDDKVFPG251 DTVVITLKNM ASHPVSLHAV GVSYWKASEG AEYDDQTSQR EKEDDKVFPG

301 GSHTYVWQVL KENGPMASDP LCLTYSYLSH VDLVKDLNSG LIGALLVCRE301 GSHTYVWQVL KENGPMASDP LCLTYSYLSH VDLVKDLNSG LIGALLVCRE

351 GSLAKEKTQT LHKFILLFAV FDEGKSWHSE TKNSLMQDRD AASARAWPKM351 GSLAKEKTQT LHKFILLFAV FDEGKSWHSE TKNSLMQDRD AASARWPKM

401 HTVNGYVNRS LPGLIGCHRK SVYWHVIGMG TTPEVHSIFL EGHTFLVRNH401 HTVNGYVNRS LPGLIGCHRK SVYWHVIGMG TTPEVHSIFL EGHTFLVRNH

451 RQASLEISPI TFLTAQTLLM DLGQFLLFCH ISSHQHDGME AYVKVDSCPE451 RQASLEISPI TFLTAQTLLM DLGQFLLFCH ISSHQHDGME AYVKVDSCPE

501 EPQLRMKNNE EAEDYDDDLT DSEMDVVRFD DDNSPSFIQI RSVAKKHPKT501 EPQLRMKNNE EAEDYDDDLT DSEMDVVRFD DDNSPSFIQI RSVAKKHPKT

551 WVHYIAAEEE DWDYAPLVLA PDDRSYKSQY LNNGPQRIGR KYKKVRFMAY551 WVHYIAAEEE DWDYAPLVLA PDDRSYKSQY LNNGPQRIGR KYKKVRFMAY

601 TDETFKTREA IQHESGILGP LLYGEVGDTL LIIFKNQASR PYNIYPHGIT601 TDETFKTREA IQHESGILGP LLYGEVGDTL LIIFKNQASR PYNIYPHGIT

651 DVRPLYSRRL PKGVKHLKDF PILPGEIFKY KWTVTVEDGP TKSDPRCLTR651 DVRPLYSRRL PKGVKHLKDF PILPGEIFKY KWTVTVEDGP TKSDPRCLTR

701 YYSSFVNMER DLASGLIGPL LICYKESVDQ RGNQIMSDKR NVILFSVFDE701 YYSSFVNMER DLASGLIGPL LICYKESVDQ RGNQIMSDKR NVILFSVFDE

751 NRSWYLTENI QRFLPNPAGV QLEDPEFQAS NIMHSINGYV FDSLQLSVCL751 NRSWYLTENI QRFLPNPAGV QLEDPEFQAS NIMHSINGYV FDSLQLSVCL

801 HEVAYWYILS IGAQTDFLSV FFSGYTFKHK MVYEDTLTLF PFSGETVFMS801 HEVAYWYILS IGAQTDFLSV FFSGYTFKHK MVYEDTLTLF PFSGETVFMS

851 MENPGLWILG CHNSDFRNRG MTALLKVSSC DKNTGDYYED SYEDISAYLL851 MENPGLWILG CHNSDFRNRG MTALLKVSSC DKNTGDYYED SYEDISAYLL

901 SKNNAIEPRS FSQNPPVLKR HQAEITRTTL QSDQEEIDYD DTISVEMKKE901 SKNNAIEPRS FSQNPPVLKR HQAEITRTTL QSDQEEIDYD DTISVEMKKE

951 DFDIYDEDEN QSPRSFQKKT RHYFIAAVER LWDYGMSSSP HVLRNRAQSG951 DFDIYDEDEN QSPRSFQKKT RHYFIAAVER LWDYGMSSSP HVLRNRAQSG

1001 SVPQFKKVVF QEFTDGSFTQ PLYRGELNEH LGLLGPYIRA EVEDNIMVTF1001 SVPQFKKVVF QEFTDGSFTQ PLYRGELNEH LGLLGPYIRA EVEDNIMVTF

1051 RNQASRPYSF YSSLISYEED QRQGAEPRKN FVKPNETKTY FWKVQHHMAP1051 RNQASRPYSF YSSLISYEED QRQGAEPRKN FVKPNETKTY FWKVQHHMAP

1101 TKDEFDCKAW AYFSDVDLEK DVHSGLIGPL LVCHTNTLNP AHGRQVTVQE1101 TKDEFDCKAW AYFSDVDLEK DVHSGLIGPL LVCHTNTLNP AHGRQVTVQE

1151 FALFFTIFDE TKSWYFTENM ERNCRAPCNI QMEDPTFKEN YRFHAINGYI1151 FALFFTIFDE TKSWYFTENM ERNCRAPCNI QMEDPTFKEN YRFHAINGYI

1201 MDTLPGLVMA QDQRIRWYLL SMGSNENIHS IHFSGHVFTV RKKEEYKMAL1201 MDTLPGLVMA QDQRIRWYLL SMGSNENIHS IHFSGHVFTV RKKEEYKMAL

1251 YNLYPGVFET VEMLPSKAGIWRVECLIGEH LHAGMSTLFL VYSNKCQTPL1251 YNLYPGVFET VEMLPSKAGIWRVECLIGEH LHAGMSTLFL VYSNKCQTPL

1301 GMASGHIRDF QITASGQYGQ WAPKLARLHY SGSINAWSTK EPFSWIKVDL1301 GMASGHIRDF QITASGQYGQ WAPKLARLHY SGSINAWSTK EPFSWIKVDL

1351 LAPMIIHGIK TQGARQKFSS LYISQFIIMY SLDGKKWQTY RGNSTGTLMV1351 LAPMIIHGIK TQGARQKFSS LYISQFIIMY SLDGKKWQTY RGNSTGTLMV

1401 FFGNVDSSGI KHNIFNPPII ARYIRLHPTH YSIRSTLRME LMGCDLNSCS1401 FFGNVDSSGI KHNIFNPPII ARYIRLHPTH YSIRSTLRME LMGCDLNSCS

1451 MPLGMESKAI SDAQITASSY FTNMFATWSP SKARLHLQGR SNAWRPQVNN1451 MPLGMESKAI SDAQITASSY FTNMFATWSP SKARLHLQGR SNAWRPQVNN

1501 PKEWLQVDFQ KTMKVTGVTT QGVKSLLTSM YVKEFLISSS QDGHQWTLFF1501 PKEWLQVDFQ KTMKVTGVTT QGVKSLLTSM YVKEFLISSS QDGHQWTLFF

1551 QNGKVKVFQG NQDSFTPVVN SLDPPLLTRY LRIHPQSWVH QIALRMEVLG1551 QNGKVKVFQG NQDSFTPVVN SLDPPLLTRY LRIHPQSWVH QIALRMEVLG

1601 CEAQDLYDKT HTCPPCPAPE LLGGPSVFLF PPKPKDTLMI SRTPEVTCVV1601 CEAQDLYDKT HTCPPCPAPE LLGGPSVFLF PPKPKDTLMI SRTPEVTCVV

1651 VDVSHEDPEV KFNWYVDGVE VHNAKTKPRE EQYNSTYRVV SVLTVLHQDW1651 VDVSHEDPEV KFNWYVDGVE VHNAKTKPRE EQYNSTYRVV SVLTVLHQDW

1701 LNGKEYKCKV SNKALPAPIE KTISKAKGQP REPQVYTLPP SRDELTKNQV1701 LNGKEYKCKV SNKALPAPIE KTISKAKGQP REPQVYTLPP SRDELTKNQV

1751 SLTCLVKGFY PSDIAVEWES NGQPENNYKT TPPVLDSDGS FFLYSKLTVD1751 SLTCLVKGFY PSDIAVEWES NGQPENNYKT TPPVLDSDGS FFLYSKLTVD

1801 KSRWQQGNVF SCSVMHEALH NHYTQKSLSL SPGK*1801 KSRWQQGNVF SCSVMHEALH NHYTQKSLSL SPGK*

- 162 044115- 162 044115

Последовательность белка pSYN FVIII 269 (FVIII Fc с 72 AE-XTEN в аминокислоте 18) SEQ IDProtein sequence pSYN FVIII 269 (FVIII Fc with 72 AE-XTEN at amino acid 18) SEQ ID

NO: 83).NO: 83).

MQIELSTCFF LCLLRFCFSA TRRYYLGAVE LSWDYMQGAP TSESATPESGMQIELSTCFF LCLLRFCFSA TRRYYLGAVE LSWDYMQGAP TSESATPESG

PGSEPATSGS ETPGTSESAT PESGPGSEPA TSGSETPGTS ESATPESGPGPGSEPATSGS ETPGTSESAT PESGPGSEPA TSGSETPGTS ESATPESGPG

101 TSTEPSEGSA PGASSSDLGE LPVDARFPPR VPKSFPFNTS VVYKKTLFVE101 TSTEPSEGSA PGASSSDLGE LPVDARFPPR VPKSFPFNTS VVYKKTLFVE

151 FTDHLFNIAK PRPPWMGLLG PTIQAEVYDT VVITLKNMAS HPVSLHAVGV151 FTDHLFNIAK PRPPWMGLLG PTIQAEVYDT VVITLKNMAS HPVSLHAVGV

201 SYWKASEGAE YDDQTSQREK EDDKVFPGGS HTYVWQVLKE NGPMASDPLC201 SYWKASEGAE YDDQTSQREK EDDKVFPPGGS HTYVWQVLKE NGPMASDPLC

251 LTYSYLSHVD LVKDLNSGLIGALLVCREGS LAKEKTQTLH KFILLFAVFD251 LTYSYLSHVD LVKDLNSGLIGALLVCREGS LAKEKTQTLH KFILLFAVFD

301 EGKSWHSETK NSLMQDRDAA SARAWPKMHT VNGYVNRSLP GLIGCHRKSV301 EGKSWHSETK NSLMQDRDAA SARAWPKMHT VNGYVNRSLP GLIGCHRKSV

351 YWHVIGMGTT PEVHSIFLEG HTFLVRNHRQ ASLEISPITF LTAQTLLMDL351 YWHVIGMGTT PEVHSIFLEG HTFLVRNHRQ ASLEISPITF LTAQTLLMDL

401 GQFLLFCHIS SHQHDGMEAY VKVDSCPEEP QLRMKNNEEA EDYDDDLTDS401 GQFLLFCHIS SHQHDGMEAY VKVDSCPEEP QLRMKNNEEA EDYDDDLTDS

451 EMDVVRFDDD NSPSFIQIRS VAKKHPKTWV HYIAAEEEDW DYAPLVLAPD451 EMDVVRFDDD NSPSFIQIRS VAKKHPKTWV HYIAAEEEDW DYAPLVLAPD

501 DRSYKSQYLN NGPQRIGRKY KKVRFMAYTD ETFKTREAIQ HESGILGPLL501 DRSYKSQYLN NGPQRIGRKY KKVRFMAYTD ETFKTREAIQ HESGILGPLL

551 YGEVGDTLLIIFKNQASRPY NIYPHGITDV RPLYSRRLPK GVKHLKDFPI551 YGEVGDTLLIIFKNQASRPY NIYPHGITDV RPLYSRRLPK GVKHLKDFPI

601 LPGEIFKYKW TVTVEDGPTK SDPRCLTRYY SSFVNMERDL ASGLIGPLLI601 LPGEIFKYKW TVTVEDGPTK SDPRCLTRYY SSFVNMERDL ASGLIGPLLI

651 CYKESVDQRG NQIMSDKRNV ILFSVFDENR SWYLTENIQR FLPNPAGVQL651 CYKESVDQRG NQIMSDKRNV ILFSVFDENR SWYLTENIQR FLPNPAGVQL

701 EDPEFQASNI MHSINGYVFD SLQLSVCLHE VAYWYILSIG AQTDFLSVFF701 EDPEFQASNI MHSINGYVFD SLQLSVCLHE VAYWYILSIG AQTDFLSVFF

751 SGYTFKHKMV YEDTLTLFPF SGETVFMSME NPGLWILGCH NSDFRNRGMT751 SGYTFKHKMV YEDTLTLFPF SGETVFMSME NPGLWILGCH NSDFRNRGMT

801 ALLKVSSCDK NTGDYYEDSY EDISAYLLSK NNAIEPRSFS QNPPVLKRHQ801 ALLKVSSCDK NTGDYYEDSY EDISAYLLSK NNAIEPRSFS QNPPVLKRHQ

851 AEITRTTLQS DQEEIDYDDT ISVEMKKEDF DIYDEDENQS PRSFQKKTRH851 AEITRTTLQS DQEEIDYDDT ISVEMKKEDF DIYDEDENQS PRSFQKKTRH

901 YFIAAVERLW DYGMSSSPHV LRNRAQSGSV PQFKKVVFQE FTDGSFTQPL901 YFIAAVERLW DYGMSSSPHV LRNRAQSGSV PQFKKVVFQE FTDGSFTQPL

951 YRGELNEHLG LLGPYIRAEV EDNIMVTFRN QASRPYSFYS SLISYEEDQR951 YRGELNEHLG LLGPYIRAEV EDNIMVTFRN QASRPYSFYS SLISYEEDQR

1001 QGAEPRKNFV KPNETKTYFW KVQHHMAPTK DEFDCKAWAY FSDVDLEKDV1001 QGAEPRKNFV KPNETKTYFW KVQHHMAPTK DEFDCKAWAY FSDVDLEKDV

1051 HSGLIGPLLV CHTNTLNPAH GRQVTVQEFA LFFTIFDETK SWYFTENMER1051 HSGLIGPLLV CHTNTLNPAH GRQVTVQEFA LFTIFDETK SWYFTENMER

1101 NCRAPCNIQM EDPTFKENYR FHAINGYIMD TLPGLVMAQD QRIRWYLLSM1101 NCRAPCNIQM EDPTFKENYR FHAINGYIMD TLPGLVMAQD QRIRWYLLSM

1151 GSNENIHSIH FSGHVFTVRK KEEYKMALYN LYPGVFETVE MLPSKAGIWR1151 GSNENIHSIH FSGHVFTVRK KEEYKMALYN LYPGVFETVE MLPSKAGIWR

1201 VECLIGEHLH AGMSTLFLVY SNKCQTPLGM ASGHIRDFQI TASGQYGQWA1201 VECLIGEHLH AGMSTLFLVY SNKCQTPLGM ASGHIRDFQI TASGQYGQWA

1251 PKLARLHYSG SINAWSTKEP FSWIKVDLLA PMIIHGIKTQ GARQKFSSLY1251 PKLARLHYSG SINAWSTKEP FSWIKVDLLA PMIIHGIKTQ GARQKFSSLY

1301 ISQFIIMYSL DGKKWQTYRG NSTGTLMVFF GNVDSSGIKH NIFNPPIIAR1301 ISQFIIMYSL DGKKWQTYRG NSTGTLMVFF GNVDSSGIKH NIFNPPIIAR

1351 YIRLHPTHYS IRSTLRMELM GCDLNSCSMP LGMESKAISD AQITASSYFT1351 YIRLHPTHYS IRSTLRMELM GCDLNSCSMP LGMESKAISD AQITASSYFT

1401 NMFATWSPSK ARLHLQGRSN AWRPQVNNPK EWLQVDFQKT MKVTGVTTQG1401 NMFATWSPSK ARLHLQGRSN AWRPQVNNPK EWLQVDFQKT MKVTGVTTQG

1451 VKSLLTSMYV KEFLISSSQD GHQWTLFFQN GKVKVFQGNQ DSFTPVVNSL1451 VKSLLTSMYV KEFLISSSQD GHQWTLFFQN GKVKVFQGNQ DSFTPVVNSL

1501 DPPLLTRYLR IHPQSWVHQI ALRMEVLGCE AQDLYDKTHT CPPCPAPELL1501 DPPLLTRYLR IHPQSWVHQI ALRMEVLGCE AQDLYDKTHT CPPCPAPELL

1551 GGPS VFLFPP KPKDTLMISR TPEVTC VVVD VSHEDPEVKF NWYVDGVEVH1551 GGPS VFLFPP KPKDTLMISR TPEVTC VVVD VSHEDPEVKF NWYVDGVEVH

1601 NAKTKPREEQ YNSTYRVVSV LTVLHQDWLN GKEYKCKVSN KALPAPIEKT1601 NAKTKPREEQ YNSTYRVVSV LTVLHQDWLN GKEYKCKVSN KALPAPIEKT

1651 ISKAKGQPRE PQVYTLPPSR DELTKNQVSL TCLVKGFYPS DIAVEWESNG1651 ISKAKGQPRE PQVYTLPPSR DELTKNQVSL TCLVKGFYPS DIAVEWESNG

1701 QPENNYKTTP PVLDSDGSFF LYSKLTVDKS RWQQGNVFSC SVMHEALHNH1701 QPENNYKTTP PVLDSDGSFF LYSKLTVDKS RWQQGNVFSC SVMHEALHNH

1751 YTQKSLSLSP GK*1751 YTQKSLSLSP GK*

- 163 044115- 163 044115

Последовательность белка pSYN FVIII 271 (FVIII Fc с 42 AE-XTEN в аминокислоте 18) SEO IDProtein sequence of pSYN FVIII 271 (FVIII Fc with 42 AE-XTEN at amino acid 18) SEO ID

NO: 84).NO: 84).

MQIELSTCFF LCLLRFCFSA TRRYYLGAVE LSWDYMQGAP GSPAGSPTSTMQIELSTCFF LCLLRFCFSA TRRYYLGAVE LSWDYMQGAP GSPAGSPTST

EEGTSESATP ESGPGSEPAT SGSETPASSS DLGELPVDAR FPPRVPKSFPEEGTSESATP ESGPGSEPAT SGSETPASS DLGELPVDAR FPPRVPKSFP

101 FNTSVVYKKT LFVEFTDHLF NIAKPRPPWM GLLGPTIQAE VYDTVVITLK101 FNTSVVYKKT LFVEFTDHLF NIAKPRPPWM GLLGPTIQAE VYDTVVITLK

151 NMASHPVSLH AVGVSYWKAS EGAEYDDQTS QREKEDDKVF PGGSHTYVWQ151 NMASHPVSLH AVGVSYWKAS EGAEYDDQTS QREKEDDKVF PGGSHTYVWQ

201 VLKENGPMAS DPLCLTYSYL SHVDLVKDLN SGLIGALLVC REGSLAKEKT201 VLKENGPMAS DPLCLTYSYL SHVDLVKDLN SGLIGALLVC REGSLAKEKT

251 QTLHKFILLF AVFDEGKSWH SETKNSLMQD RDAASARAWP KMHTVNGYVN251 QTLHKFILLF AVFDEGKSWH SETKNSLMQD RDAASARAWP KMHTVNGYVN

301 RSLPGLIGCH RKSVYWHVIG MGTTPEVHSI FLEGHTFLVR NHRQASLEIS301 RSLPGLIGCH RKSVYWHVIG MGTTPEVHSI FLEGHTFLVR NHRQASLEIS

351 PITFLTAQTL LMDLGQFLLF CHISSHQHDG MEAYVKVDSC PEEPQLRMKN351 PITFLTAQTL LMDLGQFLLF CHISSHQHDG MEAYVKVDSC PEEPQLRMKN

401 NEEAEDYDDD LTDSEMDVVR FDDDNSPSFI QIRSVAKKHP KTWVHYIAAE401 NEEAEDYDDD LTDSEMDVVR FDDDNSPSFI QIRSVAKKHP KTWVHYIAAE

451 EEDWDYAPLV LAPDDRSYKS QYLNNGPQRI GRKYKKVRFM AYTDETFKTR451 EEDWDYAPLV LAPDDRSYKS QYLNNGPQRI GRKYKKVRFM AYTDETFKTR

501 EAIQHESGIL GPLLYGEVGD TLLIIFKNQA SRPYNIYPHG ITDVRPLYSR501 EAIQHESGIL GPLLYGEVGD TLLIIFKNQA SRPYNIYPHG ITDVRPLYSR

551 RLPKGVKHLK DFPILPGEIF KYKWTVTVED GPTKSDPRCL TRYYSSFVNM551 RLPKGVKHLK DFPILPGEIF KYKWTVTVED GPTKSDPRCL TRYYSSFVNM

601 ERDLASGLIG PLLICYKESV DQRGNQIMSD KRNVILFSVF DENRSWYLTE601 ERDLASGLIG PLLICYKESV DQRGNQIMSD KRNVILFSVF DENRSWYLTE

651 NIQRFLPNPA GVQLEDPEFQ ASNIMHSING YVFDSLQLSV CLHEVAYWYI651 NIQRFLPNPA GVQLEDPEFQ ASNIMHSING YVFDSLQLSV CLHEVAYWYI

701 LSIGAQTDFL SVFFSGYTFK HKMVYEDTLT LFPFSGETVF MSMENPGLWI701 LSIGAQTDFL SVFFSGYTFK HKMVYEDTLT LFPFSGETVF MSMENPGLWI

751 LGCHNSDFRN RGMTALLKVS SCDKNTGDYY EDSYEDISAY LLSKNNAIEP751 LGCHNSDFRN RGMTALLKVS SCDKNTGDYY EDSYEDISAY LLSKNNAIEP

801 RSFSQNPPVL KRHQAEITRT TLQSDQEEID YDDTISVEMK KEDFDIYDED801 RSFSQNPPVL KRHQAEITRT TLQSDQEEID YDDTISVEMK KEDFDIYDED

851 ENQSPRSFQK KTRHYFIAAV ERLWDYGMSS SPHVLRNRAQ SGSVPQFKKV851 ENQSPRSFQK KTRHYFIAAV ERLWDYGMSS SPHVLRNRAQ SGSVPQFKKV

901 VFQEFTDGSF TQPLYRGELN EHLGLLGPYI RAEVEDNIMV TFRNQASRPY901 VFQEFTDGSF TQPLYRGELN EHLGLLGPYI RAEVEDNIMV TFRNQASRPY

951 SFYSSLISYE EDQRQGAEPR KNFVKPNETK TYFWKVQHHM APTKDEFDCK951 SFYSSLISYE EDQRQGAEPR KNFVKPNETK TYFWKVQHHM APTKDEFDCK

1001 AWAYFSDVDL EKDVHSGLIG PLLVCHTNTL NPAHGRQVTV QEFALFFTIF1001 AWAYFSDVDL EKDVHSGLIG PLLVCHTNTL NPAHGRQVTV QEFALFFTIF

1051 DETKSWYFTE NMERNCRAPC NIQMEDPTFK ENYRFHAING YIMDTLPGLV1051 DETKSWYFTE NMERNCRAPC NIQMEDPTFK ENYRFHAING YIMDTLPGLV

1101 MAQDQRIRWY LLSMGSNENI HSIHFSGHVF TVRKKEEYKM ALYNLYPGVF1101 MAQDQRIRWY LLSMGSNENI HSIHFSGHVF TVRKKEEYKM ALYNLYPGVF

1151 ETVEMLPSKA GIWRVECLIG EHLHAGMSTL FLVYSNKCQT PLGMASGHIR1151 ETVEMLPSKA GIWRVECLIG EHLHAGMSTL FLVYSNKCQT PLGMASGHIR

1201 DFQITASGQY GQWAPKLARL HYSGSINAWS TKEPFSWIKV DLLAPMIIHG1201 DFQITASGQY GQWAPKLARL HYSGSINAWS TKEPFSWIKV DLLAPMIIHG

1251 IKTQGARQKF SSLYISQFII MYSLDGKKWQ TYRGNSTGTL MVFFGNVDSS1251 IKTQGARQKF SSLYISQFII MYSLDGKKWQ TYRGNSTGTL MVFFGNVDSS

1301 GIKHNIFNPP IIARYIRLHP THYSIRSTLR MELMGCDLNS CSMPLGMESK1301 GIKHNIFNPP IIARYIRLHP THYSIRSTLR MELMGCDLNS CSMPLGMESK

1351 AISDAQITAS SYFTNMFATW SPSKARLHLQ GRSNAWRPQV NNPKEWLQVD1351 AISDAQITAS SYFTNMFATW SPSKARLHLQ GRSNAWRPQV NNPKEWLQVD

1401 FQKTMKVTGV TTQGVKSLLT SMYVKEFLIS SSQDGHQWTL FFQNGKVKVF1401 FQKTMKVTGV TTQGVKSLLT SMYVKEFLIS SSQDGHQWTL FFQNGKVKVF

1451 QGNQDSFTPV VNSLDPPLLT RYLRIHPQSW VHQIALRMEV LGCEAQDLYD1451 QGNQDSFTPV VNSLDPPLLLT RYLRIHPQSW VHQIALRMEV LGCEAQDLYD

1501 KTHTCPPCPA PELLGGPSVF LFPPKPKDTL MISRTPEVTC VVVDVSHEDP1501 KTHTCPPCPA PELLGGPSVF LFPPKPKDTL MISRTPEVTC VVVDVSHEDP

1551 EVKFNWYVDG VEVHNAKTKP REEQYNSTYR VVSVLTVLHQ DWLNGKEYKC1551 EVKFNWYVDG VEVHNAKTKP REEQYNSTYR VVSVLTVLHQ DWLNGKEYKC

1601 KVSNKALPAP IEKTISKAKG QPREPQVYTL PPSRDELTKN QVSLTCLVKG1601 KVSNKALPAP IEKTISKAKG QPREPQVYTL PPSRDELTKN QVSLTCLVKG

1651 FYPSDIAVEW ESNGQPENNY KTTPPVLDSD GSFFLYSKLT VDKSRWQQGN1651 FYPSDIAVEW ESNGQPENNY KTTPPVLDSD GSFFLYSKLT VDKSRWQQGN

1701 VFSCSVMHEA LHNHYTQKSL SLSPGK*1701 VFSCSVMHEA LHNHYTQKSL SLSPGK*

- 164 044115- 164 044115

Последовательность белка pSYN FVIII 272 (FVIII с 144 AE XTEN в аминокислоте 18 и 244 AEProtein sequence of pSYN FVIII 272 (FVIII with 144 AE XTEN at amino acid 18 and 244 AE

XTEN в домене В без Fc) SEQ ID NO: 85).XTEN in domain B without Fc) SEQ ID NO: 85).

MQIELSTCFF LCLLRFCFSA TRRYYLGAVE LSWDYMQGAP TSESATPESGMQIELSTCFF LCLLRFCFSA TRRYYLGAVE LSWDYMQGAP TSESATPESG

PGSEPATSGS ETPGTSESAT PESGPGSEPA TSGSETPGTS ESATPESGPGPGSEPATSGS ETPGTSESAT PESGPGSEPA TSGSETPGTS ESATPESGPG

101 TSTEPSEGSA PGSPAGSPTS TEEGTSESAT PESGPGSEPA TSGSETPGTS101 TSTEPSEGSA PGSPAGSPTS TEEGTSESAT PESGPGSEPA TSGSETPGTS

151 ESATPESGPG SPAGSPTSTE EGSPAGSPTS TEEGASSSDL GELPVDARFP151 ESATPESGPG SPAGSPTSTE EGSPAGSPTS TEEGASSSDL GELPVDARFP

201 PRVPKSFPFN TSVVYKKTLF VEFTDHLFNI AKPRPPWMGL LGPTIQAEVY201 PRVPKSFPFN TSVVYKKTLF VEFTDHLFNI AKPRPPWMGL LGPTIQAEVY

251 DTVVITLKNM ASHPVSLHAV GVSYWKASEG AEYDDQTSQR EKEDDKVFPG251 DTVVITLKNM ASHPVSLHAV GVSYWKASEG AEYDDQTSQR EKEDDKVFPG

301 GSHTYVWQVL KENGPMASDP LCLTYSYLSH VDLVKDLNSG LIGALLVCRE301 GSHTYVWQVL KENGPMASDP LCLTYSYLSH VDLVKDLNSG LIGALLVCRE

351 GSLAKEKTQT LHKFILLFAV FDEGKSWHSE TKNSLMQDRD AASARAWPKM351 GSLAKEKTQT LHKFILLFAV FDEGKSWHSE TKNSLMQDRD AASARWPKM

401 HTVNGYVNRS LPGLIGCHRK SVYWHVIGMG TTPEVHSIFL EGHTFLVRNH401 HTVNGYVNRS LPGLIGCHRK SVYWHVIGMG TTPEVHSIFL EGHTFLVRNH

451 RQASLEISPI TFLTAQTLLM DLGQFLLFCH ISSHQHDGME AYVKVDSCPE451 RQASLEISPI TFLTAQTLLM DLGQFLLFCH ISSHQHDGME AYVKVDSCPE

501 EPQLRMKNNE EAEDYDDDLT DSEMDVVRFD DDNSPSFIQI RSVAKKHPKT501 EPQLRMKNNE EAEDYDDDLT DSEMDVVRFD DDNSPSFIQI RSVAKKHPKT

551 WVHYIAAEEE DWDYAPLVLA PDDRSYKSQY LNNGPQRIGR KYKKVRFMAY551 WVHYIAAEEE DWDYAPLVLA PDDRSYKSQY LNNGPQRIGR KYKKVRFMAY

601 TDETFKTREA IQHESGILGP LLYGEVGDTL LIIFKNQASR PYNIYPHGIT601 TDETFKTREA IQHESGILGP LLYGEVGDTL LIIFKNQASR PYNIYPHGIT

651 DVRPLYSRRL PKGVKHLKDF PILPGEIFKY KWTVTVEDGP TKSDPRCLTR651 DVRPLYSRRL PKGVKHLKDF PILPGEIFKY KWTVTVEDGP TKSDPRCLTR

701 YYSSFVNMER DLASGLIGPL LICYKESVDQ RGNQIMSDKR NVILFSVFDE701 YYSSFVNMER DLASGLIGPL LICYKESVDQ RGNQIMSDKR NVILFSVFDE

751 NRSWYLTENI QRFLPNPAGV QLEDPEFQAS NIMHSINGYV FDSLQLSVCL751 NRSWYLTENI QRFLPNPAGV QLEDPEFQAS NIMHSINGYV FDSLQLSVCL

801 HEVAYWYILS IGAQTDFLSV FFSGYTFKHK MVYEDTLTLF PFSGETVFMS801 HEVAYWYILS IGAQTDFLSV FFSGYTFKHK MVYEDTLTLF PFSGETVFMS

851 MENPGLWILG CHNSDFRNRG MTALLKVSSC DKNTGDYYED SYEDISAYLL851 MENPGLWILG CHNSDFRNRG MTALLKVSSC DKNTGDYYED SYEDISAYLL

901 SKNNAIEPRS FSQNGAPGTS ESATPESGPG SEPATSGSET PGTSESATPE901 SKNNAIEPRS FSQNGAPGTS ESATPESGPG SEPATSGSET PGTSESATPE

951 SGPGSEPATS GSETPGTSES ATPESGPGTS TEPSEGSAPG SPAGSPTSTE951 SGPGSEPATS GSETPGTSES ATPESGPGTS TEPSEGSAPG SPAGSPTSTE

1001 EGTSESATPE SGPGSEPATS GSETPGTSES ATPESGPGSP AGSPTSTEEG1001 EGTSESATPE SGPGSEPATS GSETPGTSES ATPESGPGSP AGSPTSTEEG

1051 SPAGSPTSTE EGTSTEPSEG SAPGTSESAT PESGPGTSES ATPESGPGTS1051 SPAGSPTSTE EGTSTEPSEG SAPGTSESAT PESGPGTSES ATPESGPGTS

1101 ESATPESGPG SEPATSGSET PGSEPATSGS ETPGSPAGSP TSTEEGTSTE1101 ESATPESGPG SEPATSGSET PGSEPATSGS ETPGSPAGSP TSTEEGTSTE

1151 PSEGSAPGTS TEPSEGSAPG SEPATSGSET PGTSESATPE SGPGTSTEPS1151 PSEGSAPGTS TEPSEGSAPG SEPATSGSET PGTSESATPE SGPGTSTEPS

1201 EGSAPASSPP VLKRHQAEIT RTTLQSDQEE IDYDDTISVE MKKEDFDIYD1201 EGSAPASSPP VLKRHQAEIT RTTLQSDQEE IDYDDTISVE MKKEDFDIYD

1251 EDENQSPRSF QKKTRHYFIA AVERLWDYGM SSSPHVLRNR AQSGSVPQFK1251 EDENQSPRSF QKKTRHYFIA AVERLWDYGM SSSPHVLRNR AQSGSVPQFK

1301 KVVFQEFTDG SFTQPLYRGE LNEHLGLLGP YIRAEVEDNI MVTFRNQASR1301 KVVFQEFTDG SFTQPLYRGE LNEHLGLLGP YIRAEVEDNI MVTFRNQASR

1351 PYSFYSSLIS YEEDQRQGAE PRKNFVKPNE TKTYFWKVQH HMAPTKDEFD1351 PYSFYSSLIS YEEDQRQGAE PRKNFVKPNE TKTYFWKVQH HMAPTKDEFD

1401 CKAWAYFSDV DLEKDVHSGL IGPLLVCHTN TLNPAHGRQV TVQEFALFFT1401 CKAWAYFSDV DLEKDVHSGL IGPLLVCHTN TLNPAHGRQV TVQEFALFFT

1451 IFDETKSWYF TENMERNCRA PCNIQMEDPT FKENYRFHAI NGYIMDTLPG1451 IFDETKSWYF TENMERNCRA PCNIQMEDPT FKENYRFHAI NGYIMDTLPG

1501 LVMAQDQRIR WYLLSMGSNE NIHSIHFSGH VFTVRKKEEY KMALYNLYPG1501 LVMAQDQRIR WYLLSMGSNE NIHSIHFSGH VFTVRKKEEY KMALYNLYPG

1551 VFETVEMLPS KAGIWRVECL IGEHLHAGMS TLFLVYSNKC QTPLGMASGH1551 VFETVEMLPS KAGIWRVECL IGEHLHAGMS TLFLVYSNKC QTPLGMASGH

1601 IRDFQITASG QYGQWAPKLA RLHYSGSINA WSTKEPFSWI KVDLLAPMII1601 IRDFQITASG QYGQWAPKLA RLHYSGSINA WSTKEPFSWI KVDLLAPMII

1651 HGIKTQGARQ KFSSLYISQF IIMYSLDGKK WQTYRGNSTG TLMVFFGNVD1651 HGIKTQGARQ KFSSLYISQF IIMYSLDGKK WQTYRGNSTG TLMVFFGNVD

1701 SSGIKHNIFN PPIIARYIRL HPTHYSIRST LRMELMGCDL NSCSMPLGME1701 SSGIKHNIFN PPIIARYIRL HPTHYSIRST LRMELMGCDL NSSCSMPLGME

1751 SKAISDAQIT ASSYFTNMFA TWSPSKARLH LQGRSNAWRP QVNNPKEWLQ1751 SKAISDAQIT ASSYFTNMFA TWSPSKARLH LQGRSNAWRP QVNNPKEWLQ

1801 VDFQKTMKVT GVTTQGVKSL LTSMYVKEFL ISSSQDGHQW TLFFQNGKVK1801 VDFQKTMKVT GVTTQGVKSL LTSMYVKEFL ISSSQDGHQW TLFFQNGKVK

1851 VFQGNQDSFT PVVNSLDPPL LTRYLRIHPQ SWVHQIALRM EVLGCEAQDL1851 VFQGNQDSFT PVVNSLDPPL LTRYLRIHPQ SWVHQIALRM EVLGCEAQDL

1901 Y*1901Y*

Последовательность белка pSYN-FVIII-161 (SEQ ID NO: 69) (1-1457 позиция аминокислотной последовательности FVIII; подчеркнутая область отображает регион Fc; подчеркивание изогнутой линией отображает расщепляемый линкер между первым Fc и фрагментом ФВ; область с двойным подчеркиванием отображает фрагмент ФВ; область жирным шрифтом отображает расщепляемый линкер между фрагментом ФВ и Fc).Protein sequence of pSYN-FVIII-161 (SEQ ID NO: 69) (1-1457 position of the FVIII amino acid sequence; underlined region represents the Fc region; curved underline represents the cleavable linker between the first Fc and the VWF fragment; double-underlined area represents the VWF fragment; The area in bold indicates the cleavable linker between the VWF moiety and Fc).

- 165 044115- 165 044115

MQIELSTCFF LCLLRFCFSA TRRYYLGAVE LSWDYMQSDL GELPVDARFPMQIELSTCFF LCLLRFCFSA TRRYYLGAVE LSWDYMQSDL GELPVDARFP

PRVPKSFPFN TSVVYKKTLF VEFTDHLFNIAKPRPPWMGL LGPTIQAEVYPRVPKSFPFN TSVVYKKTLF VEFTDHLFNIAKPRPPWMGL LGPTIQAEVY

101 DTVVITLKNM ASHPVSLHAV GVSYWKASEG AEYDDQTSQR EKEDDKVFPG101 DTVVITLKNM ASHPVSLHAV GVSYWKASEG AEYDDQTSQR EKEDDKVFPG

151 GSHTYVWQVL KENGPMASDP LCLTYSYLSH VDLVKDLNSG LIGALLVCRE151 GSHTYVWQVL KENGPMASDP LCLTYSYLSH VDLVKDLNSG LIGALLVCRE

201 GSLAKEKTQT LHKFILLFAV FDEGKSWHSE TKNSLMQDRD AASARAWPKM201 GSLAKEKTQT LHKFILLFAV FDEGKSWHSE TKNSLMQDRD AASARWPKM

251 HTVNGYVNRS LPGLIGCHRK SVYWHVIGMG TTPEVHSIFL EGHTFLVRNH251 HTVNGYVNRS LPGLIGCHRK SVYWHVIGMG TTPEVHSIFL EGHTFLVRNH

301 RQASLEISPI TFLTAQTLLM DLGQFLLFCH ISSHQHDGME AYVKVDSCPE301 RQASLEISPI TFLTAQTLLM DLGQFLLFCH ISSHQHDGME AYVKVDSCPE

351 EPQLRMKNNE EAEDYDDDLT DSEMDVVRFD DDNSPSFIQI RSVAKKHPKT351 EPQLRMKNNE EAEDYDDDLT DSEMDVVRFD DDNSPSFIQI RSVAKKHPKT

401 WVHYIAAEEE DWDYAPLVLA PDDRSYKSQY LNNGPQRIGR KYKKVRFMAY401 WVHYIAAEEE DWDYAPLVLA PDDRSYKSQY LNNGPQRIGR KYKKVRFMAY

451 TDETFKTREA IQHESGILGP LLYGEVGDTL LIIFKNQASR PYNIYPHGIT451 TDETFKTREA IQHESGILGP LLYGEVGDTL LIIFKNQASR PYNIYPHGIT

501 DVRPLYSRRL PKGVKHLKDF PILPGEIFKY KWTVTVEDGP TKSDPRCLTR501 DVRPLYSRRL PKGVKHLKDF PILPGEIFKY KWTVTVEDGP TKSDPRCLTR

551 YYSSFVNMER DLASGLIGPL LICYKESVDQ RGNQIMSDKR NVILFSVFDE551 YYSSFVNMER DLASGLIGPL LICYKESVDQ RGNQIMSDKR NVILFSVFDE

601 NRSWYLTENI QRFLPNPAGV QLEDPEFQAS NIMHSINGYV FDSLQLSVCL601 NRSWYLTENI QRFLPNPAGV QLEDPEFQAS NIMHSINGYV FDSLQLSVCL

- 166 044115- 166 044115

651 HEVAYWYILS IGAQTDFLSV FFSGYTFKHK MVYEDTLTLF PFSGETVFMS651 HEVAYWYILS IGAQTDFLSV FFSGYTFKHK MVYEDTLTLF PFSGETVFMS

701 MENPGLWILG CHNSDFRNRG MTALLKVSSC DKNTGDYYED SYEDISAYLL701 MENPGLWILG CHNSDFRNRG MTALLKVSSC DKNTGDYYED SYEDISAYLL

751 SKNNAIEPRS FSQNPPVLKR HQREITRTTL QSDQEEIDYD DTISVEMKKE751 SKNNAIEPRS FSQNPPVLKR HQREITRTTL QSDQEEIDYD DTISVEMKKE

801 DFDIYDEDEN QSPRSFQKKT RHYFIAAVER LWDYGMSSSP HVLRNRAQSG801 DFDIYDEDEN QSPRSFQKKT RHYFIAAVER LWDYGMSSSP HVLRNRAQSG

851 SVPQFKKVVF QEFTDGSFTQ PLYRGELNEH LGLLGPYIRA EVEDNIMVTF851 SVPQFKKVVF QEFTDGSFTQ PLYRGELNEH LGLLGPYIRA EVEDNIMVTF

901 RNQASRPYSF YSSLISYEED QRQGAEPRKN FVKPNETKTY FWKVQHHMAP901 RNQASRPYSF YSSLISYEED QRQGAEPRKN FVKPNETKTY FWKVQHHMAP

951 TKDEFDCKAW AYFSDVDLEK DVHSGLIGPL LVCHTNTLNP AHGRQVTVQE951 TKDEFDCKAW AYFSDVDLEK DVHSGLIGPL LVCHTNTLNP AHGRQVTVQE

1001 FALFFTIFDE TKSWYFTENM ERNCRAPCNI QMEDPTFKEN YRFHAINGYI1001 FALFFTIFDE TKSWYFTENM ERNCRAPCNI QMEDPTFKEN YRFHAINGYI

1051 MDTLPGLVMA QDQRIRWYLL SMGSNENIHS IHFSGHVFTV RKKEEYKMAL1051 MDTLPGLVMA QDQRIRWYLL SMGSNENIHS IHFSGHVFTV RKKEEYKMAL

1101 YNLYPGVFET VEMLPSKAGIWRVECLIGEH LH AGMSTLFL V YSNKCQTPL1101 YNLYPGVFET VEMLPSKAGIWRVECLIGEH LH AGMSTLFL V YSNKCQTPL

1151 GMASGHIRDF QITASGQYGQ WAPKLARLHY SGSINAWSTK EPFSWIKVDL1151 GMASGHIRDF QITASGQYGQ WAPKLARLHY SGSINAWSTK EPFSWIKVDL

1201 LAPMIIHGIK TQGARQKFSS LYISQFIIMY SLDGKKWQTY RGNSTGTLMV1201 LAPMIIHGIK TQGARQKFSS LYISQFIIMY SLDGKKWQTY RGNSTGTLMV

1251 FFGNVDSSGI KHNIFNPPII ARYIRLHPTH YSIRSTLRME LMGCDLNSCS1251 FFGNVDSSGI KHNIFNPPII ARYIRLHPTH YSIRSTLRME LMGCDLNSCS

1301 MPLGMESKAI SDAQITASSY FTNMFATWSP SKARLHLQGR SNAWRPQVNN1301 MPLGMESKAI SDAQITASSY FTNMFATWSP SKARLHLQGR SNAWRPQVNN

1351 PKEWLQVDFQ KTMKVTGVTT QGVKSLLTSM YVKEFLISSS QDGHQWTLFF 1401 QNGKVKVFQG NQDSFTPVVN SLDPPLLTRY LRIHPQSWVH QIALRMEVLG 1451 CEAQDLYDKT HTCPPCPAPE LLGGPSVFLF PPKPKDTLMI SRTPEVTCVV1351 PKEWLQVDFQ KTMKVTGVTT QGVKSLLTSM YVKEFLISSS QDGHQWTLFF 1401 QNGKVKVFQG NQDSFTPVVN SLDPPLLTRY LRIHPQSWVH QIALRMEVLG 1451 CEAQDLYDKT HTCPPCPAPE LLGGPSVFLF PPKPKDTLMI SRTPEVTCVV

1501 VDVSHEDPEV KFNWYVDGVE VHNAKTKPRE EQYNSTYRVV SVLTVLHQDW1501 VDVSHEDPEV KFNWYVDGVE VHNAKTKPRE EQYNSTYRVV SVLTVLHQDW

1551 LNGKEYKCKV SNKALPAPIE KTISKAKGQP REPQVYTLPP SRDELTKNQV1551 LNGKEYKCKV SNKALPAPIE KTISKAKGQP REPQVYTLPP SRDELTKNQV

1601 SLTCLVKGFY PSDIAVEWES NGQPENNYKT TPPVLDSDGS FFLYSKLTVD1601 SLTCLVKGFY PSDIAVEWES NGQPENNYKT TPPVLDSDGS FFLYSKLTVD

1651 KSRWOOGNVF SCSVMHEALH NHYTQKSLSL SPGKRRRRSG GGGSGGGGSG1651 KSRWOOGNVF SCSVMHEALH NHYTQKSLSL SPGKRRRRSG GGGSGGGGSG

1701 GGGSGGGGSG GGGSGGGGSR KRRKRSLSCR PPMVKLVCPA DNLRAEGLEC1701 GGGSGGGGSG GGGSGGGGSR KRRKRSLSCR PPMVKLVCPA DNLRAEGLEC

1751 TKTCONYDLE CMSMGCVSGC LCPPGMVRHE NRCVALERCP CFHOGKEYAP1751 TKTCONYDLE CMSMGCVSGC LCPPGMVRHE NRCVALERCP CFHOGKEYAP

1801 GETVKIGCNT CVCRDRKWNC TDHVCDATCS TIGMAHYLTF DGLKYLFPGE1801 GETVKIGCNT CVCRDRKWNC TDHVCDATCS TIGMAHYLTF DGLKYLFPGE

1851 COYVLVODYC GSNPGTFRIL VGNKGCSHPS VKCKKRVTIL VEGGEIELFD1851 COYVLVODYC GSNPGTFRIL VGNKGCSHPS VKCKKRVTIL VEGGEIELFD

1901 GEVNVKRPMK DETHFEVVES GRYIILLLGK ALSVVWDRHL SISVVLKOTY1901 GEVNVKRPMK DETHFEVVES GRYIILLLGK ALSVVWDRHL SISVVLKOTY

1951 OEKVCGLCGN FDGIONNDLT SSNLOVEEDP VDFGNSWKVS SOCADTRKVP1951 OEKVCGLCGN FDGIONNDLT SSNLOVEEDP VDFGNSWKVS SOCADTRKVP

2001 LDSSPATCHN NIMKOTMVDS SCR1LTSDVF ODCNKLVDPE PYLDVCIYDT2001 LDSPATCHN NIMKOTMVDS SCR1LTSDVF ODCNKLVDPE PYLDVCIYDT

2051 CSCESIGDCA AFCDTIAAYA HVCAOHGKVV TWRTATLCPO SCEERNLREN2051 CSCESIGDCA AFCDTIAAYA HVCAOHGKVV TWRTATLCPO SCEERNLREN

2101 GYEAEWRYNS CAPACOVTCO HPEPLACPVO CVEGCHAHCP PGKILDELLO2101 GYEAEWRYNS CAPACOVTCO HPEPLACPVO CVEGCHAHCP PGKILDELLO

2151 TCVDPEDCPV CEVAGRRFAS GKKVTLNPSD PEHCOICHCD VVNLTCEACO2151 TCVDPEDCPV CEVAGRRFAS GKKVTLNPSD PEHCOICHCD VVNLTCEACO

2201 EEISGTSESA TPESGPGSEP ATSGSETPGT SESATPESGP GSEPATSGSE2201 EEISGTSESA TPESGPGSEP ATSGSETPGT SESATPESGP GSEPATSGSE

2251 TPGTSESATP ESGPGTSTEP SEGSAPGSPA GSPTSTEEGT SESATPESGP2251 TPGTSESATP ESGPGTSTEP SEGSAPGSPA GSPTSTEEGT SESATPESGP

2301 GSEPATSGSE TPGTSESATP ESGPGSPAGS PTSTEEGSPA GSPTSTEEGT2301 GSEPATSGSE TPGTSESATP ESGPGSPAGS PTSTEEGSPA GSPTSTEEGT

2351 STEPSEGSAP GTSESATPES GPGTSESATP ESGPGTSESA TPESGPGSEP2351 STEPSEGSAP GTSESATPES GPGTSESATP ESGPGTSESA TPESGPGSEP

2401 ATSGSETPGS EPATSGSETP GSPAGSPTST EEGTSTEPSE GSAPGTSTEP2401 ATSGSETPGS EPATSGSETP GSPAGSPTST EEGTSTEPSE GSAPGTSTEP

2451 SEGSAPGSEP ATSGSETPGT SESATPESGP GTSTEPSEGS APDSGGGGSG2451 SEGSAPGSEP ATSGSETPGT SESATPESGP GTSTEPSEGS APDSGGGGSG

2501 GGGSGGGGSG GGGSGGGGSL VPRGSGGDKT HTCPPCPAPE LLGGPSVFLF2501 GGGSGGGGSG GGGSGGGGSL VPRGSGGDKT HTCPPCPAPE LLGGPSVFLF

2551 PPKPKDTLMI SRTPEVTCVV VDVSHEDPEV KFNWYVDGVE VHNAKTKPRE2551 PPKPKDTLMI SRTPEVTCVV VDVSHEDPEV KFNWYVDGVE VHNAKTKPRE

2601 EQYNSTYRVV SVLTVLHQDW LNGKEYKCKV SNKALPAPIE KTISKAKGQP 2651 REPQVYTLPP SRDELTKNQV SLTCLVKGFY PSDIAVEWES NGQPENNYKT 2701 TPPVLDSDGS FFLYSKLTVD KSRWOOGNVF SCSVMHEALH NHYTQKSLSL2601 EQYNSTYRVV SVLTVLHQDW LNGKEYKCKV SNKALPAPIE KTISKAKGQP 2651 REPQVYTLPP SRDELTKNQV SLTCLVKGFY PSDIAVEWES NGQPENNYKT 2701 TPPVLDSDGS FFLYSKLTVD KSRWOOGNVF SCSVMHEALH NHYTQKSL SL

SPGKSPGK

- 167 044115- 167 044115

Последовательность белка pSYN-FVIII-170 (SEO ID NO: 71).Protein sequence of pSYN-FVIII-170 (SEO ID NO: 71).

SLSCRPPMVK LVCPADNLRA EGLECTKTCQ NYDLECMSMG CVSGCLCPPGSLSCRPPMVK LVCPADNLRA EGLECTKTCQ NYDLECMSMG CVSGCLCPPG

MVRHENRCVA LERCPCFHQG KEYAPGETVK IGCNTCVCRD RKWNCTDHVC 101 DATCSTIGMA HYLTFDGLKY LFPGECQYVL VQDYCGSNPG TFRILVGNKG 151 CSHPSVKCKK RVTILVEGGE IELFDGEVNV KRPMKDETHF EVVESGRYIIMVRHENRCVA LERCPCFHQG KEYAPGETVK IGCNTCVCRD RKWNCTDHVC 101 DATCSTIGMA HYLTFDGLKY LFPGECQYVL VQDYCGSNPG TFRILVGNKG 151 CSHPSVKCKK RVTILVEGGE IELFDGEVNV KRPMKDETHF EVVESGRYII

201 LLLGKALSVV WDRHLSISVV LKQTYQEKVC GLCGNFDGIQ NNDLTSSNLQ 251 VEEDPVDFGN SWKVSSQCAD TRKVPLDSSP ATCHNNIMKQ TMVDSSCRIL 301 TSDVFQDCNK LVDPEPYLDV CIYDTCSCES IGDCAAFCDT IAAYAHVCAQ 351 HGKVVTWRTA TLCPQSCEER NLRENGYEAE WRYNSCAPAC QVTCQHPEPL 401 ACPVQCVEGC HAHCPPGKIL DELLQTCVDP EDCPVCEVAG RRFASGKKVT 451 LNPSDPEHCQ ICHCDVVNLT CEACQEPISG TSESATPESG PGSEPATSGS201 LLLGKALSVV WDRHLSISVV LKQTYQEKVC GLCGNFDGIQ NNDLTSSNLQ 251 VEEDPVDFGN SWKVSSQCAD TRKVPLDSSP ATCHNNIMKQ TMVDSSCRIL 301 TSDVFQDCNK LVDPEPYLDV CIYDTCSCES IGDCAAFCDT IAAYAHVCAQ 351 HGKVVTWRTA TLCPQSCEER NLRENGYEAE WRYNSCAPAC QVTCQHPEPL 401 ACPVQCVEGC HAHCPPGKIL DELLQTCVDP EDCPVCEVAG RRFASGKKVT 451 LNPSDPEHCQ ICHCDVVNLT CEACQEPISG TSESATPESG PGSEPATSGS

501 ETPGTSESAT PESGPGSEPA TSGSETPGTS ESATPESGPG TSTEPSEGSA501 ETPGTSESAT PESGPGSEPA TSGSETPGTS ESATPESGPG TSTEPSEGSA

551 PGSPAGSPTS TEEGTSESAT PESGPGSEPA TSGSETPGTS ESATPESGPG551 PGSPAGSPTS TEEGTSESAT PESGPGSEPA TSGSETPGTS ESATPESGPG

601 SPAGSPTSTE EGSPAGSPTS TEEGTSTEPS EGSAPGTSES ATPESGPGTS601 SPAGSPTSTE EGSPAGSPTS TEEGTSTEPS EGSAPGTSES ATPESGPGTS

651 ESATPESGPG TSESATPESG PGSEPATSGS ETPGSEPATS GSETPGSPAG651 ESATPESGPG TSESATPESG PGSEPATSGS ETPGSEPATS GSETPGSPAG

701 SPTSTEEGTS TEPSEGSAPG TSTEPSEGSA PGSEPATSGS ETPGTSESAT701 SPTSTEEGTS TEPSEGSAPG TSTEPSEGSA PGSEPATSGS ETPGTSESAT

751 PESGPGTSTE PSEGSAPDSG GGGSGGGGSG GGGSGGGGSG GGGSLVPRGS751 PESGPGTSTE PSEGSAPDSG GGGSGGGGSG GGGSGGGGSG GGGSLVPRGS

801 GGASATRRYY LGAVELSWDY MQSDLGELPV DARFPPRVPK SFPFNTSVVY 851 KKTLFVEFTD HLFNIAKPRP PWMGLLGPTI QAEVYDTVVI TLKNMASHPV 901 SLHAVGVSYW KASEGAEYDD QTSQREKEDD KVFPGGSHTY VWQVLKENGP 951 MASDPLCLTY SYLSHVDLVK DLNSGLIGAL LVCREGSLAK EKTQTLHKFI 1001 LLFAVFDEGK SWHSETKNSL MQDRDAASAR AWPKMHTVNG YVNRSLPGLI 1051 GCHRKSVYWH VIGMGTTPEV HSIFLEGHTF LVRNHRQASL EISPITFLTA 1101 QTLLMDLGQF LLFCHISSHQ HDGMEAYVKV DSCPEEPQLR MKNNEEAEDY 1151 DDDLTDSEMD VVRFDDDNSP SFIQIRSVAK KHPKTWVHYI AAEEEDWDYA 1201 PLVLAPDDRS YKSQYLNNGP QRIGRKYKKV RFMAYTDETF KTREAIQHES 1251 GILGPLLYGE VGDTLLIIFK NQASRPYNIY PHGITDVRPL YSRRLPKGVK 1301 HLKDFPILPG EIFKYKWTVT VEDGPTKSDP RCLTRYYSSF VNMERDLASG801 GGASATRRYY LGAVELSWDY MQSDLGELPV DARFPPRVPK SFPFNTSVVY 851 KKTLFVEFTD HLFNIAKPRP PWMGLLGPTI QAEVYDTVVI TLKNMASHPV 901 SLHAVGVSYW KASEGAEYDD QTSQREKEDD KVFPGGSHTY VWQVLKENGP 951 MASDPLCLTY SYLSHVDLVK DLNSGLIGAL LVCREGSLAK EKTQTLHKFI 1001 LLFAVFDEGK SWHSETKNSL MQDRDAASAR AWPKMHTVNG YVNRSLPGLI 1051 GCHRKSVYWH VIGMGTTPEV HSIFLEGHTF LVRNHRQASL EISPITFLTA 1101 QTLLMDLGQF LLFCHISSHQ HDGMEAYV KV DSCPEEPQLR MKNNEEAEDY 1151 DDDLTDSEMD VVRFDDDNSP SFIQIRSVAK KHPKTWVHYI AAEEEDWDYA 1201 PLVLAPDDRS YKSQYLNNGP QRIGRKYKKV RFMAYTDETF KTREAIQHES 1251 GILGPLLYGE VGDTLLIIFK NQASRPYNIY PHGITDVRPL YSRRLPKGVK 1301 HLKDFPILPG EIFKYKWTVT VEDGPTKSDP RCLTRYYSSF VNMERDLASG

1351 LIGPLLICYK ESVDQRGNQI MSDKRNVILF SVFDENRSWY LTENIQRFLP1351 LIGPLLICYK ESVDQRGNQI MSDKRNVILF SVFDENRSWY LTENIQRFLP

1401 NPAGVQLEDP EFQASNIMHS INGYVFDSLQ LSVCLHEVAY WYILSIGAQT 1451 DFLSVFFSGY TFKHKMVYED TLTLFPFSGE TVFMSMENPG LWILGCHNSD1401 NPAGVQLEDP EFQASNIMHS INGYVFDSLQ LSVCLHEVAY WYILSIGAQT 1451 DFLSVFFSGY TFKHKMVYED TLTLFPFSGE TVFMSMENPG LWILGCHNSD

- 168 044115- 168 044115

1501 FRNRGMTALL KVSSCDKNTG DYYEDSYEDI SAYLLSKNNA IEPRSFSQNP1501 FRNRGMTALL KVSSCDKNTG DYYEDSYEDI SAYLLSKNNA IEPRSFSQNP

1551 PVLKRHQREITRTTLQSDQE EIDYDDTISV EMKKEDFDIY DEDENQSPRS1551 PVLKRHQREITRTTLQSDQE EIDYDDTISV EMKKEDFDIY DEDENQSPRS

1601 FQKKTRHYFIAAVERLWDYG MSSSPHVLRN RAQSGSVPQF KKVVFQEFTD1601 FQKKTRHYFIAAVERLWDYG MSSSPHVLRN RAQSGSVPQF KKVVFQEFTD

1651 GSFTQPLYRG ELNEHLGLLG PYIRAEVEDN IMVTFRNQAS RPYSFYSSLI1651 GSFTQPLYRG ELNEHLGLLG PYIRAEVEDN IMVTFRNQAS RPYSFYSSLI

1701 SYEEDQRQGA EPRKNFVKPN ETKTYFWKVQ HHMAPTKDEF DCKAWAYFSD1701 SYEEDQRQGA EPRKNFVKPN ETKTYFWKVQ HHMAPTKDEF DCKAWAYFSD

1751 VDLEKDVHSG LIGPLLVCHT NTLNPAHGRQ VTVQEFALFF TIFDETKSWY1751 VDLEKDVHSG LIGPLLVCHT NTLNPAHGRQ VTVQEFALFF TIFDETKSWY

1801 FTENMERNCR APCNIQMEDP TFKENYRFHA INGYIMDTLP GLVMAQDQRI1801 FTENMERNCR APCNIQMEDP TFKENYRFHA INGYIMDTLP GLVMAQDQRI

1851 RWYLLSMGSN ENIHSIHFSG HVFTVRKKEE YKMALYNLYP GVFETVEMLP1851 RWYLLSMGSN ENIHSIHFSG HVFTVRKKEE YKMALYNLYP GVFETVEMLP

1901 SKAGIWRVEC LIGEHLHAGM STLFLVYSNK CQTPLGMASG HIRDFQITAS1901 SKAGIWRVEC LIGEHLHAGM STLFLVYSNK CQTPLGMASG HIRDFQITAS

1951 GQYGQWAPKL ARLHYSGSIN AWSTKEPFSW IKVDLLAPMIIHGIKTQGAR1951 GQYGQWAPKL ARLHYSGSIN AWSTKEPFSW IKVDLLAPMIIHGIKTQGAR

2001 QKFSSLYISQ FIIMYSLDGK KWQTYRGNST GTLMVFFGNV DSSGIKHNIF2001 QKFSSLYISQ FIIMYSLDGK KWQTYRGNST GTLMVFFGNV DSSGIKHNIF

2051 NPPIIARYIR LHPTHYSIRS TLRMELMGCD LNSCSMPLGM ESKAISDAQI2051 NPPIIARYIR LHPTHYSIRS TLRMELMGCD LNSCSMPLGM ESKAISDAQI

2101 TASSYFTNMF ATWSPSKARL HLQGRSNAWR PQVNNPKEWL QVDFQKTMKV2101 TASSYFTNMF ATWSPSKARL HLQGRSNAWR PQVNNPKEWL QVDFQKTMKV

2151 TGVTTQGVKS LLTSMYVKEF LISSSQDGHQ WTLFFQNGKV KVFQGNQDSF2151 TGVTTQGVKS LLTSMYVKEF LISSSQDGHQ WTLFFQNGKV KVFQGNQDSF

2201 TPVVNSLDPP LLTRYLRIHP QSWVHQIALR MEVLGCEAQD LY2201 TPVVNSLDPP LLTRYLRIHP QSWVHQIALR MEVLGCEAQD LY

Нуклеотидная последовательность pSYN FVIII 310 (кодирующая FVIII с полной делецией домена В, за исключением 2 аминокислотных остатков и 288 AE-XTEN, вставленного после 742 а.к.) (SEO ID NO: 170).Nucleotide sequence of pSYN FVIII 310 (encoding FVIII with complete deletion of domain B, except for 2 amino acid residues and 288 AE-XTEN inserted after 742 aa) (SEO ID NO: 170).

ATGCAAATAG AGCTCTCCAC CTGCTTCTTT CTGTGCCTTT TGCGATTCTGATGCAAATAG AGCTCTCCAC CTGCTTCTTT CTGTGCCTTT TGCGATTCTG

CTTTAGTGCC ACCAGAAGAT ACTACCTGGG TGCAGTGGAA CTGTCATGGGCTTTAGTGCC ACCAGAAGAT ACTACCTGGG TGCAGTGGAA CTGTCATGGG

101 ACTATATGCA AAGTGATCTC GGTGAGCTGC CTGTGGACGC AAGATTTCCT101 ACTATATGCA AAGTGATCTC GGTGAGCTGC CTGTGGACGC AAGATTTCCT

151 CCTAGAGTGC СAAAATCTTT TCCATTCAAC ACCTCAGTCG TGTACAAAAA151 CCTAGAGTGC СAAAATCTTT TCCATTCAAC ACCTCAGTCG TGTACAAAAAA

201 GACTCTGTTT GT AGA ATTC A CGGATC ACCT ТТТС A AC АТС GCT A AGCC A A201 GACTCTGTTT GT AGA ATTC A CGGATC ACCT TTTC A AC ATC GCT A AGCC A A

251 GGCCACCCTG GATGGGTCTG CTAGGTCCTA CCATCCAGGC TGAGGTTTAT251 GGCCACCCTG GATGGGTCTG CTAGGTCCTA CCATCCAGGC TGAGGTTTAT

301 GAT AC AGTGG TC ATT AC ACT T AAGAACATG GCTTCCC АТС CTGTCAGTCT301 GAT AC AGTGG TC ATT AC ACT T AAGAACATG GCTTCCC ATC CTGTCAGTCT

351 TCATGCTGTT GGTGTATCCT ACTGGAAAGC TTCTGAGGGA GCTGAATATG351 TCATGCTGTT GGTGTATCCT ACTGGAAAGC TTCTGAGGGA GCTGAATATG

401 ATGATC AGAC C AGTCA A AGG GAGA A AGA AG ATGAT A A AGT CTTCCCTGGT401 ATGATC AGAC C AGTCA A AGG GAGA A AGA AG ATGAT A A AGT CTTCCCTGGT

451 GGAAGCCATA CATATGTCTG GCAGGTCCTG AAAGAGAATG GTCCAATGGC451 GGAAGCCATA CATATGTCTG GCAGGTCCTG AAAGAGAATG GTCCAATGGC

501 CTCTGACCCA CTGTGCCTTA CCTACTCATA TCTTTCTCAT GTGGACCTGG501 CTCTGACCCA CTGTGCCTTA CCTACTCATA TCTTTCTCAT GTGGACCTGG

551 TAAAAGACTT GAATTCAGGC CTCATTGGAG CCCTACTAGT ATGTAGAGAA551 TAAAAGACTT GAATTCAGGC CTCATTGGAG CCCTACTAGT ATGTAGAGAA

601 GGGAGTCTGG CCA AGGAA A A GAC AC AGACC TTGC AC A A AT TT AT ACT ACT601 GGGAGTCTGG CCA AGGAA A A GAC AC AGACC TTGC AC A A AT TT AT ACT ACT

651 TTTTGCTGTA TTTGATGAAG GGAAAAGTTG GCACTCAGAA ACAAAGAACT651 TTTTGCTGTA TTTGATGAAG GGAAAAGTTG GCACTCAGAA ACAAAGAACT

701 CCTTGATGCA GGATAGGGAT GCTGCATCTG CTCGGGCCTG GCCTAAAATG701 CCTTGATGCA GGATAGGGAT GCTGCATCTG CTCGGGCCTG GCCTAAAATG

751 CACACAGTCA ATGGTTATGT AAACAGGTCT CTGCCAGGTC TGATTGGATG751 CACACAGTCA ATGGTTATGT AAACAGGTCT CTGCCAGGTC TGATTGGATG

801 CCACAGGAAA TCAGTCTATT GGCATGTGAT TGGAATGGGC ACCACTCCTG801 CCACAGGAAA TCAGTCTATT GGCATGTGAT TGGAATGGGC ACCACTCCTG

851 AAGTGCACTC AATATTCCTC GAAGGTCACA CATTTCTTGT GAGGAACCAT851 AAGTGCACTC AATATTCCTC GAAGGTCACA CATTTCTTGT GAGGAACCAT

- 169 044115- 169 044115

901 CGCC AGGCGT CCTTGGA A AT CTCGCC A AT A ACTTTCCTT A CTGCTC A A AC901 CGCC AGGCGT CCTTGGA A AT CTCGCC A AT A ACTTTCCTT A CTGCTC A A AC

951 ACTCTTGATG GACCTTGGAC AGTTTCTACT GTTTTGTCAT ATCTCTTCCC 1001 ACCAACATGA TGGCATGGAA GCTTATGTCA AAGTAGACAG CTGTCCAGAG 1051 GAACCCCAAC TACGAATGAA AAATAATGAA GAAGCGGAAG ACTATGATGA 1101 TGATCTT ACT GATTCTGA A A TGGATGTGGT C AGGTTTGAT GATGAC A ACT 1151 CTCCTTCCTT TATCC AAATT CGCTC AGTTG CCAAGAAGCA TCCT AAA ACT 1201 TGGGT AC ATT AC ATTGCTGC TGA AGAGGAG G ACTGGGACT ATGCTCCCTT 1251 AGTCCTCGCC CCCGATGACA GAAGTTATAA AAGTCAATAT TTGAACAATG 1301 GCCCTCAGCG GATTGGTAGG AAGTACAAAA AAGTCCGATT TATGGCATAC 1351 AC AGATGA AA CCTTT AAGAC TCGTGA AGCT ATTC AGC ATG А АТС AGGA AT 1401 CTTGGGACCT TT ACTTT ATG GGGA AGTTGG AGAC AC ACTG TTGATT AT AT 1451 TTAAGAATCA AGCAAGCAGA CCATATAACA TCTACCCTCA CGGAATCACT 1501 GATGTCCGTC CTTTGTATTC AAGGAGATTA CCAAAAGGTG TAAAACATTT 1551 GA AGGATTTT CC A ATTCTGC C AGGAGA A AT ATTC A A AT AT A A ATGGAC AG 1601 TGACTGTAGA AGATGGGCCA ACTAAATCAG ATCCTCGGTG CCTGACCCGC 1651 TATTACTCTA GTTTCGTTAA TATGGAGAGA GATCTAGCTT CAGGACTCAT 1701 TGGCCCTCTC CTCATCTGCT ACAAAGAATC TGTAGATCAA AGAGGAAACC 1751 AGATAATGTC AGACAAGAGG AATGTCATCC TGTTTTCTGT ATTTGATGAG 1801 AACCGAAGCT GGTACCTCAC AGAGAATATA CAACGCTTTC TCCCCAATCC 1851 AGCTGG AGTG C AGCTTGAGG ATCC AGAGTT CC A AGCCTCC A AC АТС ATGC 1901 ACAGCATCAA TGGCTATGTT TTTGATAGTT TGCAGTTGTC AGTTTGTTTG 1951 CATGAGGTGG CATACTGGTA CATTCTAAGC ATTGGAGCAC AGACTGACTT 2001 CCTTTCTGTC TTCTTCTCTG GAT AT ACCTT C A A AC AC A A A ATGGTCT ATG 2051 AAGACACACT CACCCTATTC CCATTCTCAG GAGAAACTGT CTTCATGTCG 2101 ATGGA A A ACC C AGGTCT ATG GATTCTGGGG TGCC AC A ACT C AGACTTTCG 2151 GA AC AGAGGC ATGACCGCCT T ACTGA AGGT TTCT AGTTGT GAC A AG A AC A 2201 CTGGTGATTA TTACGAGGAC AGTTATGAAG ATATTTCAGC ATACTTGCTG 2251 AGTAAAAACA ATGCCATTGA ACCAAGAAGC TTCGGTACCT CAGAGTCTGC 2301 TACCCCCGAG TCAGGGCCAG GATCAGAGCC AGCCACCTCC GGGTCTGAGA 2351 CACCCGGGAC TTCCGAGAGT GCCACCCCTG AGTCCGGACC CGGGTCCGAG 2401 CCCGCCACTT CCGGCTCCGA AACTCCCGGC ACAAGCGAGA GCGCTACCCC 2451 AGAGTCAGGA CCAGGAACAT CTACAGAGCC CTCTGAAGGC TCCGCTCCAG 2501 GGTCCCCAGC CGGCAGTCCC ACTAGCACCG AGGAGGGAAC CTCTGAAAGC 2551 GCC AC ACCCG AATC AGGGCC AGGGTCTGAG CCTGCT ACC A GCGGC AGCGA 2601 GACACCAGGC ACCTCTGAGT CCGCCACACC AGAGTCCGGA CCCGGATCTC 2651 CCGCTGGGAG CCCCACCTCC ACTGAGGAGG GATCTCCTGC TGGCTCTCCA 2701 ACATCTACTG AGGAAGGTAC CTCAACCGAG CCATCCGAGG GATCAGCTCC 2751 CGGCACCTCA GAGTCGGCAA CCCCGGAGTC TGGACCCGGA ACTTCCGAAA951 ACTCTTGATG GACCTTGGAC AGTTTCTACT GTTTTGTCAT ATCTCTTCCC 1001 ACCAACATGA TGGCATGGAA GCTTATGTCA AAGTAGACAG CTGTCCAGAG 1051 GAACCCCAAC TACGAATGAA AAATAATGAA GAAGCGGAAG ACTATGATGA 1101 TGATCTT ACT GATTCTGA A A TGGATGTGGT C AGGTTTGAT GATGAC A ACT 1151 CTCCTTCCTT TATCC AAATT CGCTC AGTTG CCAAGAAGCA TCCT AAA ACT 1201 TGGGT AC ATT AC ATTGCTGC TGA AGAGGAG G ACTGGGACT ATGCTCCCTT 1251 AGTCCTCGCC CCCGATGACA GAAGTTATAA AAGTCAATAT TTGAACAATG 1301 GCCCTCAGCG GATTGGTAGG AAGTACAAAA AAGTCCGATT TATGGCATAC 1351 AC AGATGA AA CCTTT AAGAC TCGTGA AGCT ATTC AGC ATG A ATC AGGA AT 1401 CTTGGGACCT TT ACTTT A TG GGGA AGTTGG AGAC AC ACTG TTGATT AT AT 1451 TTAAGAATCA AGCAAGCAGA CCATATAACA TCTACCCTCA CGGAATCACT 1501 GATGTCCGTC CTTTGTATTC AAGGAGATTA CCAAAAGGTG TAAAACATTT 1551 GA AGGATTTT CC A ATTCTGC C AGGAGA A AT ATTC A A AT AT A A ATGGAC AG 1601 TGACTGTAGA AGATGGGCCA ACTAAATCAG ATCCTCGGTG CCTGACCCGC 1651 TATTACTCTA GTTTCGTTAA TATGGAGAGA GATCTAGCTT CAGGACTCAT 1701 TGGCCCTC TC CTCATCTGCT ACAAAGAATC TGTAGATCAA AGAGGAAACC 1751 AGATAATGTC AGACAAGAGG AATGTCATCC TGTTTTCTGT ATTTGATGAG 1801 AACCGAAGCT GGTACCTCAC AGAGAATATA CAACGCTTTC TCCCCAATCC 1851 AGCTGG AGTG C AGCTTGAGG ATCC AGAGTT CC A AGCCTCC A AC ATC ATGC 1901 ACAGCATCAA TGGCTATGTT TTTGATAGTT TGCAGTTGTC AGTTTGTTTG 1951 CATGAGGTGG CATACTGGTA CATTCTAAGC ATTGGAGCAC AGACTGACTT 2001 CCTTTCTGTC TTCTTCTCTG GAT AT ACCTT C A A AC AC A A A ATGGTCT ATG 2051 AAGACACACT CACCCTATTC CCATTCTCAG GAGAAACTGT CTTCATGTCG 2101 ATGGA A A ACC C AGGTCT ATG GATTCTGGGG TGCC AC A ACT C AGACTTTCG 2151 GA AC AGAGGC ATGACCGCCT T ACTGA AGGT TTCT AGTTGT GAC A AG A AC A 2201 CTGGTGATTA TTACGAGGAC AGTTATGAAG ATATTTCAGC ATACTTGCTG 2251 AGTAAAACA ATGCCATTGA ACCAAGAAGC TTCGGTACCT CAGAG TCTGC 2301 TACCCCCGAG TCAGGGCCAG GATCAGAGCC AGCCACCTCC GGGTCTGAGA 2351 CACCCGGGAC TTCCGAGAGT GCCACCCCTG AGTCCGGACC CGGGTCCGAG 2401 CCCGCCACTT CCGGCTCCGA AACTCCCGGC ACAAGCGAGA GCGCTACCCC 2451 AGAGTCAGGA CCAGGAACAT CTACAGAGCC CTCTGAAGGC TCCGCTCCAG 2501 GGTCCCCAGC CGGCAGTCCC ACTAGCACCG AGGAGGGAAC CTCTGAAAGC 2551 GCC AC ACCCG AATC AGGGCC AGGGTCTGAG CCTGCT ACC A GCGGC AGCGA 2601 GACACCAGGC ACCTCTGAGT CCGCCACACC AGAGTCCGGA CCCGGATCTC 2651 CCGCTGGGAG CCCCACCTCC ACTGAGGAGG GATCTCCTGC TGGCTCTCCA 2701 ACATCTACTG AGGAAGGTAC CTCAACCGAG CCATCCGAGG GATCAGCTCC 2751 CGGCACCTCA GAGTCGGCAA CCCCGGAGTC TGGACCCGGA ACTTCCGAAA

- 170 044115- 170 044115

2801 GTGCCACACC AGAGTCCGGT CCCGGGACTT CAGAATCAGC AACACCCGAG 2851 TCCGGCCCTG GGTCTGAACC CGCCACAAGT GGTAGTGAGA CACCAGGATC 2901 AGAACCTGCT ACCTC AGGGT C AG AG AC ACC CGGATCTCCG GC AGGCTCAC 2951 CAACCTCCAC TGAGGAGGGC ACCAGCACAG AACCAAGCGA GGGCTCCGCA 3001 CCCGGAACAA GCACTGAACC CAGTGAGGGT TCAGCACCCG GCTCTGAGCC 3051 GGCCACAAGT GGCAGTGAGA CACCCGGCAC TTCAGAGAGT GCCACCCCCG 3101 AGAGTGGCCC AGGCACTAGT ACCGAGCCCT CTGAAGGCAG TGCGCCAGCC 3151 TCGAGCGAAA TAACTCGTAC TACTCTTCAG TCAGATCAAG AGGAAATCGA 3201 TTATGATGAT ACC AT АТС AG TTGAAATGAA GAAGGAAGAT TTTGACATTT 3251 ATGATGAGGA TGAAAATCAG AGCCCCCGCA GCTTTCAAAA GAAAACACGA 3301 CACTATTTTA TTGCTGCAGT GGAGAGGCTC TGGGATTATG GGATGAGTAG 3351 CTCCCCACAT GTTCTAAGAA ACAGGGCTCA GAGTGGCAGT GTCCCTCAGT 3401 TCAAGAAAGT TGTTTTCCAG GAATTTACTG ATGGCTCCTT TACTCAGCCC 3451 TTATACCGTG GAGAACTAAA TGAACATTTG GGACTCCTGG GGCCATATAT 3501 AAGAGCAGAA GTTGAAGATA ATATCATGGT AACTTTCAGA AATCAGGCCT 3551 CTCGTCCCTA TTCCTTCTAT TCTAGCCTTA TTTCTTATGA GGAAGATCAG2801 GTGCCACACC AGAGTCCGGT CCCGGGACTT CAGAATCAGC AACACCCGAG 2851 TCCGGCCCTG GGTCTGAACC CGCCACAAGT GGTAGTGAGA CACCAGGATC 2901 AGAACCTGCT ACCTC AGGGT C AG AG AC ACC CGGATCTCCG GC AGGCTCAC 2951 CAACCTCCAC TGAGGAGGGC ACC AGCACAG AACCAAGCGA GGGCTCCGCA 3001 CCCGGAACAA GCACTGAACC CAGTGAGGGT TCAGCACCCG GCTCTGAGCC 3051 GGCCACAAGT GGCAGTGAGA CACCCGGCAC TTCAGAGAGT GCCACCCCCG 3101 AGAGTGGCCC AGGCACTAGT ACCGAGCCCT CTGAAGGCAG TGCGCCAGCC 3151 TCGAGCGAAA TAACTCGTAC TACTCTTCAG TCAGATCAAG AGGAAATCGA 3201 TTATGATGAT ACC AT ATS AG TTGAAATGAA GAAGGAAGAT TTTGACATTT 3251 ATGATGAGGA TGAAAATCAG AGCCCCCGCA GCTTTCAAAA GAAAACACGA 3301 CACTATTTTA TTGCTGCAGT GGAGAGGCTC TGGGATTATG GGATGAGTAG 3 351 CTCCCCACAT GTTCTAAGAA ACAGGGCTCA GAGTGGCAGT GTCCCTCAGT 3401 TCAAGAAAGT TGTTTTCCAG GAATTTACTG ATGGCTCCTT TACTCAGCCC 3451 TTATACCGTG GAGAACTAAA TGAACATTTG GGACTCCTGG GGCCATATAT 3501 AAGAGCAGAA GTTGAAGATA ATATCATGGT AACTTTCAGA AATCAGGCCT 3551 CTCGTCCCTA TTCCTTCTAT TCTAGCCTTA TTTCTTATGA GGAAGATCAG

3601 AGGCAAGGAG CAGAACCTAG AAAAAACTTT GTCAAGCCTA ATGAAACCAA 3651 AACTTACTTT TGGAAAGTGC AACATCATAT GGCACCCACT AAAGATGAGT 3701 TTGACTGCAA AGCCTGGGCT TATTTCTCTG ATGTTGACCT GGAAAAAGAT 3751 GTGCACTCAG GCCTGATTGG ACCCCTTCTG GTCTGCCACA CTAACACACT 3801 GAACCCTGCT CATGGGAGAC AAGTGACAGT ACAGGAATTT GCTCTGTTTT 3851 TC ACC ATCTT TGATGAGACC A A AAGCTGGT ACTTC ACTGA A A AT ATGGA A 3901 AGAAACTGCA GGGCTCCCTG СAATATCCAG ATGGAAGATC CCACTTTTAA 3951 AGAGAATTAT CGCTTCCATG CAATCAATGG CTACATAATG GAT AC ACT AC 4001 CTGGCTT AGT A ATGGCTC AG GATC A A AGGA TTCGATGGT A TCTGCTC AGC 4051 ATGGGCAGCA ATGAAAACAT CCATTCTATT CATTTCAGTG GACATGTGTT 4101 C ACTGT ACGA AA AA AAGAGG AGT AT A A A AT GGC ACTGT AC A ATCTCT АТС 4151 C AGGTGTTTT TGAGAC AGTG GA A ATGTT AC CATCC A A AGC TGGA ATTTGG 4201 CGGGTGGA AT GCCTT ATTGG CGAGC ATCT A C ATGCTGGGA TGAGC AC ACT 4251 TTTTCTGGTG TACAGCAATA AGTGTCAGAC TCCCCTGGGA ATGGCTTCTG 4301 GACACATTAG AGATTTTCAG ATTACAGCTT CAGGACAATA TGGACAGTGG 4351 GCCCCAAAGC TGGCCAGACT TCATTATTCC GGATCAATCA ATGCCTGGAG 4401 САССА AGG AG CCCTTTTCTT GGATC A AGGT GGATCTGTTG GC ACC A ATGA 4451 TTATTCACGG CATCAAGACC CAGGGTGCCC GTCAGAAGTT CTCCAGCCTC 4501 TACATCTCTC AGTTTATCAT CATGTATAGT CTTGATGGGA AGAAGTGGCA 4551 GACTTATCGA GGAAATTCCA CTGGAACCTT AATGGTCTTC TTTGGCAATG 4601 TGGATTC АТС TGGGATAAAA С АСА ATATTT TTAACCCTCC AATT ATTGCT 4651 CGATACATCC GTTTGCACCC AACTCATTAT AGCATTCGCA GCACTCTTCG3601 AGGCAAGGAG CAGAACCTAG AAAAAACTTT GTCAAGCCTA ATGAAACCAA 3651 AACTTACTTT TGGAAAGTGC AACATCATAT GGCACCCACT AAAGATGAGT 3701 TTGACTGCAA AGCCTGGGCT TATTTCTCTG ATGTTGACCT GGAAAAAGAT 3751 GTGCACTCAG GCCTGATTGG ACCCCTTCTG GTCTGCCACA CTAACACACT 3801 GAACCCTGCT CATGGGAGAC AAGTGACAGT ACAGGAATTT GCTCTGTTTT 3851 TC ACC ATCTT TGATGAGACC A A AAGCTGGT ACTTC ACTGA A A AT ATGGA A 3901 AGAAACTGCA GGGCTCCCTG CAATATCCAG ATGGAAGATC CCACTTTTAA 3951 AGAGAATTAT CGCTTCCATG CAATCAATGG CTACATAATG GAT AC ACT AC 4001 CTGGCTT AGT A ATGGCTC AG GATC A A AGGA TTCGATGGT A TCTGCTC AGC 4051 ATGGGCAGCA ATGAAAACAT CCATTCTATT CATTTCAGTG GACATGTGTT 4101 C ACTGT ACGA AA AA AAGAGG AGT AT A A A AT GGC ACTGT AC A ATCTCT ATC 4151 C AGGTGTTTT TGAGAC AGTG GA A ATGTT AC CATCC A A AGC TGGA ATTTGG 4201 CGGGTGGA AT GCCTT ATTGG CGAGC ATCT A C ATGCTGGGA TGAGC AC ACT 4251 TTTTCTGGTG TACAGCAATA AGTGTCAGAC TCCCCTGGGA ATGGCTTCTG 4301 GACACATTAG AGATTTTCAG ATTACAGCTT CAGGACAATA TGGACAGTGG 43 51 GCCCCAAAGC TGGCCAGACT TCATTATTCC GGATCAATCA ATGCCTGGAG 4401 SASSA AGG AG CCCTTTTCTT GGATC A AGGT GGATCTGTTG GC ACC A ATGA 4451 TTATTCACGG CATCAAGACC CAGGGTGCCC GTCAGAAGTT CTCCAGCCTC 4501 TACATCTCTC AGTTTATCAT CATGTATAGT CTTGATGGGA AGAAGTGGCA 4551 GACTTATCGA GGAAATTCCA CTGGAACCTT AATGGTCTTC TTTGGCAATG 4601 TGGATTC ATC TGGGATAAAA C A CA ATATTT TTAACCCTCC AATT ATTGCT 4651 CGATACATCC GTTTGCACCC AACTCATTAT AGCATTCGCA GCACTCTTCG

- 171 044115- 171 044115

4701 CATGGAGTTG ATGGGCTGTG ATTTAAATAG TTGCAGCATG CCATTGGGAA4701 CATGGAGTTG ATGGGCTGTG ATTTAAATAG TTGCAGCATG CCATTGGGAA

4751 TGGAGAGTAA AGCAATATCA GATGCACAGA TTACTGCTTC ATCCTACTTT4751 TGGAGAGTAA AGCAATATCA GATGCACAGA TTACTGCTTC ATCCTACTTT

4801 ACCAATATGT TTGCCACCTG GTCTCCTTCA AAAGCTCGAC TTCACCTCCA4801 ACCAATATGT TTGCCACCTG GTCTCCTTCA AAAGCTCGAC TTCACCTCCA

4851 AGGGAGGAGT AATGCCTGGA GACCTCAGGT GAATAATCCA AAAGAGTGGC4851 AGGGAGGAGT AATGCCTGGA GACCTCAGGT GAATAATCCA AAAGAGTGGC

4901 TGCAAGTGGA CTTCCAGAAG ACAATGAAAG TCACAGGAGT AACTACTCAG4901 TGCAAGTGGA CTTCCAGAAG ACAATGAAAG TCACAGGAGT AACTACTCAG

4951 GGAGTAAAAT CTCTGCTTAC CAGCATGTAT GTGAAGGAGT TCCTCATCTC4951 GGAGTAAAAT CTCTGCTTAC CAGCATGTAT GTGAAGGAGT TCCTCATCTC

5001 CAGCAGTCAA GATGGCCАТС AGTGGACTCT CTTTTTTCAG AATGGCAAAG5001 CAGCAGTCAA GATGGCCATS AGTGGACTCT CTTTTTTCAG AATGGCAAAG

5051 TAAAGGTTTT TCAGGGAAAT CAAGACTCCT TCACACCTGT GGTGAACTCT5051 TAAAGGTTTT TCAGGGAAAT CAAGACTCCT TCACACCTGT GGTGAACTCT

5101 CTAGACCCAC CGTTACTGAC TCGCTACCTT CGAATTCACC CCCAGAGTTG5101 CTAGACCCAC CGTTACTGAC TCGCTACCTT CGAATTCACC CCCAGAGTTG

5151 GGTGCACCAG ATTGCCCTGA GGATGGAGGT TCTGGGCTGC GAGGCACAGG5151 GGTGCACCAG ATTGCCCTGA GGATGGAGGT TCTGGGCTGC GAGGCACAGG

5201 ACCTCTACGA СAAAACTCAC ACATGCCCAC CGTGCCCAGC TCCAGAACTC5201 ACCTCTACGA СAAAACTCAC ACATGCCCAC CGTGCCCAGC TCCAGAACTC

5251 CTGGGCGGAC CGTCAGTCTT CCTCTTCCCC CCAAAACCCA AGGACACCCT5251 CTGGGCGGAC CGTCAGTCTT CCTCTTCCCC CCAAAACCCA AGGACACCCT

5301 CATGATCTCC CGGACCCCTG AGGTCACATG CGTGGTGGTG GACGTGAGCC5301 CATGATCTCC CGGACCCCTG AGGTCACATG CGTGGTGGTG GACGTGAGCC

5351 ACGAAGACCC TGAGGTCAAG TTCAACTGGT ACGTGGACGG CGTGGAGGTG5351 ACGAAGACCC TGAGGTCAAG TTCAACTGGT ACGTGGACGG CGTGGAGGTG

5401 CATAATGCCA AGACAAAGCC GCGGGAGGAG CAGTACAACA GCACGTACCG5401 CATAATGCCA AGACAAAGCC GCGGGAGGAG CAGTACAACA GCACGTACCG

5451 TGTGGTCAGC GTCCTCACCG TCCTGCACCA GGACTGGCTG AATGGCAAGG5451 TGTGGTCAGC GTCCTCACCG TCCTGCACCA GGACTGGCTG AATGGCAAGG

5501 AGTACAAGTG CAAGGTCTCC AACAAAGCCC TCCCAGCCCC CATCGAGAAA5501 AGTACAAGTG CAAGGTCTCC AACAAAGCCC TCCCAGCCCC CATCGAGAAA

5551 ACCATCTCCA AAGCCAAAGG GCAGCCCCGA GAACCACAGG TGTACACCCT5551 ACCATTCCA AAGCCAAAGG GCAGCCCCGA GAACCACAGG TGTACACCCT

5601 GCCCCCATCC CGGGATGAGC TGACCAAGAA CCAGGTCAGC CTGACCTGCC5601 GCCCCCATCC CGGGATGAGC TGACCAAGAA CCAGGTCAGC CTGACCTGCC

5651 TGGTCAAAGG CTTCTATCCC AGCGACATCG CCGTGGAGTG GGAGAGCAAT5651 TGGTCAAAGG CTTCTATCCC AGCGACATCG CCGTGGAGTG GGAGAGCAAT

5701 GGGCAGCCGG AGAACAACTA CAAGACCACG CCTCCCGTGT TGGACTCCGA5701 GGGCAGCCGG AGAACAACTA CAAGACCACG CCTCCCGTGT TGGACTCCGA

5751 CGGCTCCTTC TTCCTCTACA GCAAGCTCAC CGTGGACAAG AGCAGGTGGC5751 CGGCTCCTTC TTCCTCTACA GCAAGCTCAC CGTGGACAAG AGCAGGTGGC

5801 AGCAGGGGAA CGTCTTCTCA TGCTCCGTGA TGCATGAGGC TCTGCACAAC5801 AGCAGGGGAA CGTCTTCTCA TGCTCCGTGA TGCATGAGGC TCTGCACAAC

5851 C ACT AC ACGC AGA AGAGCCT CTCCCTGTCT CCGGGT A A AT GA5851 C ACT AC ACGC AGA AGAGCCT CTCCCTGTCT CCGGGT A A AT GA

Последовательность белка pSYN FVIII 310 (FVIII с полной делецией домена В, за исключением 2 аминокислотных остатков и 288 AE-XTEN, вставленного после 742 а.к.) (SEQ ID NO: 171).Protein sequence of pSYN FVIII 310 (FVIII with complete deletion of domain B, except for 2 amino acid residues and 288 AE-XTEN inserted after 742 aa) (SEQ ID NO: 171).

ATRRYYLGAV ELSWDYMQSD LGELPVDARF PPRVPKSFPF NTSVVYKKTLATRRYYLGAV ELSWDYMQSD LGELPVDARF PPRVPKSFPF NTSVVYKKTL

FVEFTDHLFN IAKPRPPWMG LLGPTIQAEV YDTVVITLKN MASHPVSLHAFVEFTDHLFN IAKPRPPWMG LLGPTIQAEV YDTVVITLKN MASHPVSLHA

101 VGVSYWKASE GAEYDDQTSQ REKEDDKVFP GGSHTYVWQV LKENGPMASD101 VGVSYWKASE GAEYDDQTSQ REKEDDKVFP GGSHTYVWQV LKENGPMASD

151 PLCLTYSYLS HVDLVKDLNS GLIGALLVCR EGSLAKEKTQ TLHKFILLFA151 PLCLTYSYLS HVDLVKDLNS GLIGALLVCR EGSLAKEKTQ TLHKFILLFA

201 VFDEGKSWHS ETKNSLMQDR DAASARAWPK MHTVNGYVNR SLPGLIGCHR201 VFDEGKSWHS ETKNSLMQDR DAASARAWPK MHTVNGYVNR SLPGLIGCHR

251 KSVYWHVIGM GTTPEVHSIF LEGHTFLVRN HRQASLEISP ITFLTAQTLL251 KSVYWHVIGM GTTPEVHSIF LEGHTFLVRN HRQASLEISP ITFLTAQTLL

301 MDLGQFLLFC HISSHQHDGM EAYVKVDSCP EEPQLRMKNN EEAEDYDDDL301 MDLGQFLLFC HISSHQHDGM EAYVKVDSCP EEPQLRMKNN EEAEDYDDDL

351 TDSEMDVVRF DDDNSPSFIQ IRSVAKKHPK TWVHYIAAEE EDWDYAPLVL351 TDSEMDVVRF DDDNSPSFIQ IRSVAKKHPK TWVHYIAAEE EDWDYAPLVL

- 172 044115- 172 044115

401 APDDRSYKSQ YLNNGPQRIG RKYKKVRFMA YTDETFKTRE AIQHESGILG401 APDDRSYKSQ YLNNGPQRIG RKYKKVRFMA YTDETFKTRE AIQHESGILG

451 PLLYGEVGDT LLIIFKNQAS RPYNIYPHGI TDVRPLYSRR LPKGVKHLKD451 PLLYGEVGDT LLIIFKNQAS RPYNIYPHGI TDVRPLYSRR LPKGVKHLKD

501 FPILPGEIFK YKWTVTVEDG PTKSDPRCLT RYYSSFVNME RDLASGLIGP 551 LLICYKESVD QRGNQIMSDK RNVILFSVFD ENRSWYLTEN IQRFLPNPAG 601 VQLEDPEFQA SNIMHSINGY VFDSLQLSVC LHEVAYWYIL SIGAQTDFLS 651 VFFSGYTFKH KMVYEDTLTL FPFSGETVFM SMENPGLWIL GCHNSDFRNR 701 GMTALLKVSS CDKNTGDYYE DSYED1SAYL LSKNNA1EPR SFGTSESATP 751 ESGPGSEPAT SGSETPGTSE SATPESGPGS EPATSGSETP GTSESATPESK MVYEDTLTL FPFSGETVFM SMENPGLWIL GCHNSDFRNR 701 GMTALLKVSS CDKNTGDYYE DSYED1SAYL LSKNNA1EPR SFGTSESATP 751 ESGPGSEPAT SGSETPGTSE SATPESGPGS EPATSGSETP GTSESATPES

801 GPGTSTEPSE GSAPGSPAGS PTSTEEGTSE SATPESGPGS EPATSGSETP801 GPGTSTEPSE GSAPGPAGS PTSTEEGTSE SATPESGPGS EPATSGSETP

851 GTSESATPES GPGSPAGSPT STEEGSPAGS PTSTEEGTST EPSEGSAPGT 901 SESATPESGP GTSESATPES GPGTSESATP ESGPGSEPAT SGSETPGSEP 951 ATSGSETPGS PAGSPTSTEE GTSTEPSEGS APGTSTEPSE GSAPGSEPAT851 GTSESATPES GPGSPAGSPT STEEGSPAGS PTSTEEGTST EPSEGSAPGT 901 SESATPESGP GTSESATPES GPGTSESATP ESGPGSEPAT SGSETPGSEP 951 ATSGSETPGS PAGSPTSTEE GTSTEPSEGS APGTSTEPSE GSAPGSEPAT

1001 SGSETPGTSE SATPESGPGT STEPSEGSAP ASSEITRTTL QSDQEEIDYD1001 SGSETPGTSE SATPESGPGT STEPSEGSAP ASSEITRTTL QSDQEEIDYD

1051 DTISVEMKKE DFDIYDEDEN QSPRSFQKKT RHYFIAAVER LWDYGMSSSP 1101 HVLRNRAQSG SVPQFKKVVF QEFTDGSFTQ PLYRGELNEH LGLLGPYIRA 1151 EVEDNIMVTF RNQASRPYSF YSSLISYEED QRQGAEPRKN FVKPNETKTY1051 DTISVEMKKE DFDIYDEDEN QSPRSFQKKT RHYFIAAVER LWDYGMSSSP 1101 HVLRNRAQSG SVPQFKKVVF QEFTDGSFTQ PLYRGELNEH LGLLGPYIRA 1151 EVEDNIMVTF RNQASRPYSF YSSLISYEED QRQGAEPRKN FVKPNETKTY

1201 FWKVQHHMAP TKDEFDCKAW AYFSDVDLEK DVHSGLIGPL LVCHTNTLNP1201 FWKVQHHMAP TKDEFDCKAW AYFSDVDLEK DVHSGLIGPL LVCHTNTLNP

1251 AHGRQVTVQE FALFFTIFDE TKSWYFTENM ERNCRAPCNI QMEDPTFKEN1251 AHGRQVTVQE FALFFTIFDE TKSWYFTENM ERNCRAPCNI QMEDPTFKEN

1301 YRFHAINGYI MDTLPGLVMA QDQRIRWYLL SMGSNENIHS IHFSGHVFTV 1351 RKKEEYKMAL YNLYPGVFET VEMLPSKAGIWRVECLIGEH LHAGMSTLFL 1401 VYSNKCQTPL GMASGHIRDF QITASGQYGQ WAPKLARLHY SGSINAWSTK1301 YRFHAINGYI MDTLPGLVMA QDQRIRWYLL SMGSNENIHS IHFSGHVFTV 1351 RKKEEYKMAL YNLYPGVFET VEMLPSKAGIWRVECLIGEH LHAGMSTLFL 1401 VYSNKCQTPL GMASGHIRDF QITASGQYGQ WAPKLARLHY SGSINAWSTK

1451 EPFSWIKVDL LAPMIIHGIK TQGARQKFSS LYISQFIIMY SLDGKKWQTY 1501 RGNSTGTLMV FFGNVDSSGI KHNIFNPPII ARYIRLHPTH YSIRSTLRME1451 EPFSWIKVDL LAPMIIHGIK TQGARQKFSS LYISQFIIMY SLDGKKWQTY 1501 RGNSTGTLMV FFGNVDSSGI KHNIFNPPII ARYIRLHPTH YSIRSTLME

1551 LMGCDLNSCS MPLGMESKAI SDAQITASSY FTNMFATWSP SKARLHLQGR 1601 SNAWRPQVNN PKEWLQVDFQ KTMKVTGVTT QGVKSLLTSM YVKEFLISSS 1651 QDGHQWTLFF QNGKVKVFQG NQDSFTPVVN SLDPPLLTRY LRIHPQSWVH 1701 QIALRMEVLG CEAQDLYDKT HTCPPCPAPE LLGGPSVFLF PPKPKDTLMI1551 LMGCDLNSCS MPLGMESKAI SDAQITASSY FTNMFATWSP SKARLHLQGR 1601 SNAWRPQVNN PKEWLQVDFQ KTMKVTGVTT QGVKSLLTSM YVKEFLISSS 1651 QDGHQWTLFF QNGKVKVFQG NQDSFTPVVN SLDPPLLTRY LRIHPQSWVH 1701 QIALRMEVLG CEAQDLYDKT HTCPPCPAPE LLGGPSVFLF PPKPKDTLMI

1751 SRTPEVTCVV VDVSHEDPEV KFNWYVDGVE VHNAKTKPRE EQYNSTYRVV 1801 SVLTVLHQDW LNGKEYKCKV SNKALPAPIE KTISKAKGQP REPQVYTLPP1751 SRTPEVTCVV VDVSHEDPEV KFNWYVDGVE VHNAKTKPRE EQYNSTYRVV 1801 SVLTVLHQDW LNGKEYKCKV SNKALPAPIE KTISKAKGQP REPQVYTLPP

1851 SRDELTKNQV SLTCLVKGFY PSDIAVEWES NGQPENNYKT TPPVLDSDGS 1901 FFLYSKLTVD KSRWQQGNVF SCSVMHEALH NHYTQKSLSL SPGK*1851 SRDELTKNQV SLTCLVKGFY PSDIAVEWES NGQPENNYKT TPPVLDSDGS 1901 FFLYSKLTVD KSRWQQGNVF SCSVMHEALH NHYTQKSLSL SPGK*

- 173 044115- 173 044115

Нуклеотидная последовательность pSYN FVIII 312 (кодирующая FVIII с полной делецией доменаNucleotide sequence of pSYN FVIII 312 (encoding FVIII with complete deletion of the domain

В, за исключением 5 аминокислотных остатков и 288 AE-XTEN, вставленного после а.к. 745- В5 версия) (SEQ ID NO: 172).B, with the exception of 5 amino acid residues and 288 AE-XTEN, inserted after aa. 745-B5 version) (SEQ ID NO: 172).

ATGCAAATAG AGCTCTCCAC CTGCTTCTTT CTGTGCCTTT TGCGATTCTGATGCAAATAG AGCTCTCCAC CTGCTTCTTT CTGTGCCTTT TGCGATTCTG

CTTTAGTGCC ACCAGAAGAT ACTACCTGGG TGCAGTGGAA CTGTCATGGGCTTTAGTGCC ACCAGAAGAT ACTACCTGGG TGCAGTGGAA CTGTCATGGG

101 ACTATATGCA AAGTGATCTC GGTGAGCTGC CTGTGGACGC AAGATTTCCT101 ACTATATGCA AAGTGATCTC GGTGAGCTGC CTGTGGACGC AAGATTTCCT

151 CCT AGAGTGC С A AAATCTTT TCC ATTCA AC ACCTC AGTCG TGTAC A AAA A151 CCT AGAGTGC C A AAATCTTT TCC ATTCA AC ACCTC AGTCG TGTAC A AAA A

201 GACTCTGTTT GT AGA ATTCA CGGATC ACCT TTTC A AC ATC GCT A AGCC A A201 GACTCTGTTT GT AGA ATTCA CGGATC ACCT TTTC A AC ATC GCT A AGCC A A

251 GGCCACCCTG GATGGGTCTG CTAGGTCCTA CCATCCAGGC TGAGGTTTAT251 GGCCACCCTG GATGGGTCTG CTAGGTCCTA CCATCCAGGC TGAGGTTTAT

301 GAT AC AGTGG TC ATT AC ACT T AAG A AC ATG GCTTCCCATC CTGTCAGTCT301 GAT AC AGTGG TC ATT AC ACT T AAG A AC ATG GCTTCCCATC CTGTCAGTCT

351 TCATGCTGTT GGTGTATCCT ACTGGAAAGC TTCTGAGGGA GCTGAATATG351 TCATGCTGTT GGTGTATCCT ACTGGAAAGC TTCTGAGGGA GCTGAATATG

401 ATGATC AGAC C AGTC A A AGG GAGA A AGA AG ATGAT A A AGT CTTCCCTGGT401 ATGATC AGAC C AGTC A A AGG GAGA A AGA AG ATGAT A A AGT CTTCCCTGGT

451 GGAAGCCATA CATATGTCTG GCAGGTCCTG AAAGAGAATG GTCCAATGGC451 GGAAGCCATA CATATGTCTG GCAGGTCCTG AAAGAGAATG GTCCAATGGC

501 CTCTGACCCA CTGTGCCTTA CCTACTCATA TCTTTCTCAT GTGGACCTGG501 CTCTGACCCA CTGTGCCTTA CCTACTCATA TCTTTCTCAT GTGGACCTGG

551 TAAAAGACTT GAATTCAGGC CTCATTGGAG CCCTACTAGT ATGTAGAGAA551 TAAAAGACTT GAATTCAGGC CTCATTGGAG CCCTACTAGT ATGTAGAGAA

601 GGGAGTCTGG CCAAGGAAAA GAC AC AG ACC TTGCACAAAT TT AT ACT ACT601 GGGAGTCTGG CCAAGGAAAA GAC AC AG ACC TTGCACAAAT TT AT ACT ACT

651 TTTTGCTGTA TTTGATGAAG GGAAAAGTTG GCACTCAGAA ACAAAGAACT651 TTTTGCTGTA TTTGATGAAG GGAAAAGTTG GCACTCAGAA ACAAAGAACT

701 CCTTGATGC A GGAT AGGGAT GCTGC ATCTG CTCGGGCCTG GCCT A A A ATG701 CCTTGATGC A GGAT AGGGAT GCTGC ATCTG CTCGGGCCTG GCCT A A A ATG

751 СACACAGTCA ATGGTTATGT AAACAGGTCT CTGCCAGGTC TGATTGGATG751 CACACAGTCA ATGGTTATGT AAACAGGTCT CTGCCAGGTC TGATTGGATG

801 CCACAGGAAA TCAGTCTATT GGCATGTGAT TGGAATGGGC ACCACTCCTG801 CCACAGGAAA TCAGTCTATT GGCATGTGAT TGGAATGGGC ACCACTCCTG

851 AAGTGCACTC AATATTCCTC GAAGGTCACA CATTTCTTGT GAGGAACCAT851 AAGTGCACTC AATATTCCTC GAAGGTCACA CATTTCTTGT GAGGAACCAT

901 CGCC AGGCGT CCTTGGA A AT CTCGCC A AT A ACTTTCCTT A CTGCTC A A AC901 CGCC AGGCGT CCTTGGA A AT CTCGCC A AT A ACTTTCCTT A CTGCTC A A AC

951 ACTCTTGATG GACCTTGGAC AGTTTCTACT GTTTTGTCAT ATCTCTTCCC951 ACTCTTGATG GACCTTGGAC AGTTTCTACT GTTTTGTCAT ATCTCTTCCC

1001 ACC AAC ATG A TGGC ATGG A A GCTT ATGTC A A AGT AGAC AG CTGTCC AGAG1001 ACC AAC ATG A TGGC ATGG A A GCTT ATGTC A A AGT AGAC AG CTGTCC AGAG

1051 GAACCCC AAC T ACGA ATG AA A A ATA ATGAA GAAGCGGAAG ACTATGATGA1051 GAACCCC AAC T ACGA ATG AA A A ATA ATGAA GAAGCGGAAG ACTATGATGA

1101 TG ATCTT ACT G ATTCTGA A A TGGATGTGGT C AGGTTTGAT GATGAC A ACT1101 TG ATCTT ACT G ATTCTGA A A TGGATGTGGT C AGGTTTGAT GATGAC A ACT

1151 CTCCTTCCTT TATCC AA ATT CGCTC AGTTG CCA AGAAGC A TCCT AAA ACT1151 CTCCTTCCTT TATCC AA ATT CGCTC AGTTG CCA AGAAGC A TCCT AAA ACT

1201 TGGGT AC ATT AC ATTGCTGC TGA AGAGG AG G ACTGGGACT ATGCTCCCTT1201 TGGGT AC ATT AC ATTGCTGC TGA AGAGG AG G ACTGGGACT ATGCTCCCTT

1251 AGTCCTCGCC CCCGATGACA GAAGTT ATA A AAGTCAAT AT TTGAAC AATG1251 AGTCCTCGCC CCCGATGACA GAAGTT ATA A AAGTCAAT AT TTGAAC AATG

1301 GCCCTCAGCG GATTGGTAGG AAGTACAAAA AAGTCCGATT TATGGCATAC1301 GCCCTCAGCG GATTGGTAGG AAGTACAAAA AAGTCCGATT TATGGCATAC

1351 ACAGATGAAA CCTTTAAGAC TCGTGAAGCT ATTCAGCATG AATCAGGAAT1351 ACAGATGAAA CCTTTAAGAC TCGTGAAGCT ATTCAGCATG AATCAGGAT

1401 CTTGGGACCT TT ACTTT ATG GGGA AGTTGG AGAC AC ACTG TTGATT AT AT1401 CTTGGGACCT TT ACTTT ATG GGGA AGTTGG AGAC AC ACTG TTGATT AT AT

1451 TT A AGA ATCA AGCAAGC AGA CC AT AT A AC А ТСТ ACCCTC A CGGA ATC ACT1451 TT A AGA ATCA AGCAAGC AGA CC AT AT A AC A TCT ACCCTC A CGGA ATC ACT

1501 GATGTCCGTC CTTTGTATTC AAGGAGATTA CCAAAAGGTG TAAAACATTT1501 GATGTCCGTC CTTTGTATTC AAGGAGATTA CCAAAAGGTG TAAAACATTT

1551 GA AGGATTTT CC A ATTCTGC C AGGAG A A AT ATTC A A AT AT A A ATGGAC AG1551 GA AGGATTTT CC A ATTCTGC C AGGAG A A AT ATTC A A AT AT A A ATGGAC AG

1601 TGACTGTAGA AGATGGGCCA ACTAAATCAG ATCCTCGGTG CCTGACCCGC1601 TGACTGTAGA AGATGGGCCA ACTAAATCAG ATCCTCGGTG CCTGACCCGC

1651 TATTACTCTA GTTTCGTTAA TATGGAGAGA GATCTAGCTT CAGGACTCAT1651 TATTACTCTA GTTTCGTTAA TATGGAGAGA GATCTAGCTT CAGGACTCAT

1701 TGGCCCTCTC CTCATCTGCT ACAAAGAATC TGTAGATCAA AGAGGAAACC1701 TGGCCCTCTC CTCATCTGCT ACAAAGAATC TGTAGATCAA AGAGGAAACC

1751 AGATAATGTC AGACAAGAGG AATGTCATCC TGTTTTCTGT ATTTGATGAG1751 AGATAATGTC AGACAAGAGG AATGTCATCC TGTTTTCTGT ATTTGATGAG

1801 AACCGAAGCT GGTACCTCAC AGAGAATATA CAACGCTTTC TCCCCAATCC1801 AACCGAAGCT GGTACCTCAC AGAGAATATA CAACGCTTTC TCCCCAATCC

1851 AGCTGG AGTG C AGCTTGAGG ATCC AG AGTT CC A AGCCTCC A AC ATC ATGC1851 AGCTGG AGTG C AGCTTGAGG ATCC AG AGTT CC A AGCCTCC A AC ATC ATGC

1901 AC AGC ATC A A TGGCTATGTT TTTGATAGTT TGCAGTTGTC AGTTTGTTTG1901 AC AGC ATC A A TGGCTATGTT TTTGATAGTT TGCAGTTGTC AGTTTGTTTG

- 174 044115- 174 044115

1951 CATGAGGTGG CATACTGGTA CATTCTAAGC ATTGGAGCAC AGACTGACTT 2001 CCTTTCTGTC TTCTTCTCTG GAT AT ACCTT C A A AC AC A A A ATGGTCT ATG 2051 AAGACACACT CACCCTATTC CCATTCTCAG GAGAAACTGT CTTCATGTCG 2101 ATGGAAAACC CAGGTCTATG GATTCTGGGG TGCCACAACT CAGACTTTCG 2151 GA AC AGAGGC ATGACCGCCT T ACTGA AGGT TTCT AGTTGT GAC A AG A AC A 2201 CTGGTGATTA TTACGAGGAC AGTTATGAAG ATATTTCAGC ATACTTGCTG 2251 AGTAAAAACA ATGCCATTGA ACCAAGAAGC TTCTCTCAAA ACGGTACCTC 2301 AGAGTCTGCT ACCCCCGAGT CAGGGCCAGG ATCAGAGCCA GCCACCTCCG 2351 GGTCTGAGAC ACCCGGGACT TCCGAGAGTG CCACCCCTGA GTCCGGACCC 2401 GGGTCCGAGC CCGCCACTTC CGGCTCCGAA ACTCCCGGCA CAAGCGAGAG 2451 CGCTACCCCA GAGTCAGGAC CAGGAACATC TACAGAGCCC TCTGAAGGCT 2501 CCGCTCCAGG GTCCCCAGCC GGCAGTCCCA CTAGCACCGA GGAGGGAACC 2551 TCTGA AAGCG CC AC ACCCGA АТС AGGGCC A GGGTCTGAGC CTGCT ACC AG 2601 CGGCAGCGAG ACACC AGGC A CCTCTGAGTC CGCCAC ACC A GAGTCCGGAC 2651 CCGGATCTCC CGCTGGGAGC CCCACCTCCA CTGAGGAGGG ATCTCCTGCT 2701 GGCTCTCCAA CATCTACTGA GGAAGGTACC TCAACCGAGC CATCCGAGGG 2751 ATCAGCTCCC GGCACCTCAG AGTCGGCAAC CCCGGAGTCT GGACCCGGAA 2801 CTTCCGAAAG TGCCACACCA GAGTCCGGTC CCGGGACTTC AGAATCAGCA 2851 ACACCCGAGT CCGGCCCTGG GTCTGAACCC GCCACAAGTG GTAGTGAGAC 2901 ACCAGGATCA GAACCTGCTA CCTCAGGGTC AGAGACACCC GGATCTCCGG 2951 CAGGCTCACC AACCTCCACT GAGGAGGGCA CCAGCACAGA ACCAAGCGAG 3001 GGCTCCGCAC CCGGAACAAG CACTGAACCC AGTGAGGGTT CAGCACCCGG 3051 CTCTGAGCCG GCCACAAGTG GCAGTGAGAC ACCCGGCACT TCAGAGAGTG 3101 CCACCCCCGA GAGTGGCCCA GGCACTAGTA CCGAGCCCTC TGAAGGCAGT 3151 GCGCCAGCCT CGAGCGAAAT AACTCGTACT ACTCTTCAGT CAGATCAAGA 3201 GGAAATCGAT TATGATGATA CCATATCAGT TGAAATGAAG AAGGAAGATT 3251 TTGACATTTA TGATGAGGAT GAAAATCAGA GCCCCCGCAG CTTTCAAAAG 3301 AAAACACGAC ACTATTTTAT TGCTGCAGTG GAGAGGCTCT GGGATTATGG 3351 GATGAGTAGC TCCCCACATG TTCTAAGAAA CAGGGCTCAG AGTGGCAGTG 3401 TCCCTCAGTT CAAGAAAGTT GTTTTCCAGG AATTTACTGA TGGCTCCTTT 3451 ACTCAGCCCT TATACCGTGG AGAACTAAAT GAACATTTGG GACTCCTGGG 3501 GCCATATATA AGAGCAGAAG TTGAAGATAA TATCATGGTA ACTTTCAGAA 3551 ATCAGGCCTC TCGTCCCTAT TCCTTCTATT CTAGCCTTAT TTCTTATGAG1951 CATGAGGTGG CATACTGGTA CATTCTAAGC ATTGGAGCAC AGACTGACTT 2001 CCTTTCTGTC TTCTTCTCTG GAT AT ACCTT C A A AC AC A A A ATGGTCT ATG 2051 AAGACACACT CACCCTATTC CCATTCTCAG GAGAAACTGT CTTCATGTCG 2101 ATGGAAAACC CAGGTCTATG GATTCTGGGG TGC CACAACT CAGACTTTCG 2151 GA AC AGAGGC ATGACCGCCT T ACTGA AGGT TTCT AGTTGT GAC A AG A AC A 2201 CTGGTGATTA TTACGAGGAC AGTTATGAAG ATATTTCAGC ATACTTGCTG 2251 AGTAAAACA ATGCCATTGA ACCAAGAAGC TTCTCTCAAA ACGGTACCTC 2301 AGAGTCTGCT ACCCCCGAGT CAGGGCCAGG ATCAGAGCCA GCCACCTCCG 2351 GGTCTGAGAC ACCCGGGACT TCCGAGAGTG CCACCCCTGA GTCCGGACCC 2401 GGGTCCGAGC CCGCCACTTC CGG CTCCGAA ACTCCCGGCA CAAGCGAGAG 2451 CGCTACCCCA GAGTCAGGAC CAGGAACATC TACAGAGCCC TCTGAAGGCT 2501 CCGCTCCAGG GTCCCCAGCC GGCAGTCCCA CTAGCACCGA GGAGGGAACC 2551 TCTGA AAGCG CC AC ACCCGA ATC AGGGCC A GGGTCTGAGC CTGCT ACC AG 2601 CGGCAGCGAG ACACC AGGC A CCTCTGAGTC CGCCAC ACC A GAGTCCGGAC 2651 CCGGATCTCC CGCTGGGAGC CCCACCTCCA CTGAGGAGGG ATCTCCTGCT 2701 GGCTCTCCAA CATCTACTGA GGAAGGTACC TCAACCGAGC CATCCGAGG 2751 ATCAGCTCCC GGCACCTCAG AGTCGG CAAC CCCGGAGTCT GGACCCGGAA 2801 CTTCCGAAAG TGCCACACCA GAGTCCGGTC CCGGGACTTC AGAATCAGCA 2851 ACACCCGAGT CCGGCCCTGG GTCTGAACCC GCCACAAGTG GTAGTGAGAC 2901 ACCAGGATCA GAACCTGCTA CCTCAGGGTC AGAGACACCC GGATCTCCGG 2951 CAGGCTCACC AACCTCCACT GAGGAGGGCA CCAGCACAGA ACCAAGCGAG 3001 GGCTCCGCAC CCGGAACAAG CACTGAACCC AGTGAGGGTT CAGCACCCGG 3051 CTCTGAGCCG GCCACAAGTG GCAGTGAGAC ACCCGGCACT TCAGAGAGTG 3101 CCACCCCCGA GAGTGGCCCA GGCACTAGTA CCGAGCCCTC TGAAGGCAGT 3151 GCGCCA GCCT CGAGCGAAAT AACTCGTACT ACTCTTCAGT CAGATCAAGA 3201 GGAAATCGAT TATGATGATA CCATATCAGT TGAAATGAAG AAGGAAGATT 3251 TTGACATTTA TGATGAGGAT GAAAATCAGA GCCCCCGCAG CTTTCAAAAG 3301 AAAACACGAC ACTATTTTAT TGCTGCAGTG GAGAGGCTCT GGGATTATGG 3351 GATGAGTAGC TCCCCACATG TTCTAAGAAA CAGGGCTCAG AGTGGCAGTG 3401 TCCCTCAGTT CAAGAAAGTT GTTTTCCAGG AATTTACTGA TGGCTCCTTT 3451 ACTCAGCCCT TATACCGTGG AGAACTAAAT GAACATTTGG GACTCCTGGG 3501 GCCATATATA AGAGCAGAAG TTGAAGATAA TATCATGGTA ACTTTCAGAA 3551 ATCAGGCCTC TCGTCCCTAT TCCTTCTA TT CTAGCCTTAT TTCTTATGAG

3601 GAAGATCAGA GGCAAGGAGC AGAACCTAGA AAAAACTTTG TCAAGCCTAA 3651 TGAAACCAAA ACTTACTTTT GGAAAGTGCA AC АТС AT ATG GCACCCACTA 3701 AAGATGAGTT TGACTGCAAA GCCTGGGCTT ATTTCTCTGA TGTTGACCTG 3751 GAAAAAGATG TGCACTCAGG CCTGATTGGA CCCCTTCTGG TCTGCCACAC 3801 TAACACACTG AACCCTGCTC ATGGGAGACA AGTGACAGTA CAGGAATTTG3601 GAAGATCAGA GGCAAGGAGC AGAACCTAGA AAAAACTTTG TCAAGCCTAA 3651 TGAAACCAAA ACTTACTTTT GGAAAGTGCA AC ATC AT ATG GCACCCACTA 3701 AAGATGAGTT TGACTGCAAA GCCTGGGCTT ATTTCTCTGA TGTTGACCTG 3751 GAAAAAGATG TGCACTCAGG CCTGATTGGA CCCC TTCTGG TCTGCCACAC 3801 TAACACACTG AACCCTGCTC ATGGGAGACA AGTGACAGTA CAGGAATTTG

- 175 044115- 175 044115

3851 CTCTGTTTTT CACCATCTTT GATGAGACCA AAAGCTGGTA CTTCACTGAA 3901 AATATGGAAA GAAACTGCAG GGCTCCCTGC AATATCCAGA TGGAAGATCC 3951 CACTTTTAAA GAGAATTATC GCTTCCATGC AATCAATGGC TACATAATGG 4001 AT AC ACT ACC TGGCTTAGT A ATGGCTC AGG АТС A AAGG AT TCGATGGT AT 4051 CTGCTCAGCA TGGGCAGCAA TGAAAACATC CATTCTATTC ATTTCAGTGG 4101 AC ATGTGTTC ACTGT ACGA A A A A A AGAGGA GT AT A A A ATG GC ACTGT AC A 4151 ATCTCT ATCC AGGTGTTTTT GAGAC AGTGG A A ATGTT ACC ATCC A A AGCT 4201 GGAATTTGGC GGGTGGAATG CCTTATTGGC GAGCATCTAC ATGCTGGGAT 4251 GAGCACACTT TTTCTGGTGT ACAGCAATAA GTGTCAGACT CCCCTGGGAA 4301 TGGCTTCTGG ACACATTAGA GATTTTCAGA TTACAGCTTC AGGACAATAT 4351 GGAC AGTGGG CCCC A A AGCT GGCC AGACTT C ATT ATTCCG GATC А АТС A A 4401 TGCCTGGAGC ACC A AGG AGC CCTTTTCTTG GATC A AGGTG GATCTGTTGG 4451 CACCAATGAT TATTCACGGC ATCAAGACCC AGGGTGCCCG TCAGAAGTTC 4501 TCCAGCCTCT ACATCTCTCA GTTTATCATC ATGTATAGTC TTGATGGGAA 4551 GA AGTGGC AG ACTT ATCGAG GA A ATTCC AC TGGA ACCTT A ATGGTCTTCT 4601 TTGGCAATGT GGATTCATCT GGGATААААС ACAATATTTT TAACCCTCCA 4651 ATTATTGCTC GATACATCCG TTTGCACCCA ACTCATTATA GCATTCGCAG 4701 CACTCTTCGC ATGGAGTTGA TGGGCTGTGA TTTAAATAGT TGCAGCATGC 4751 CATTGGGAAT GGAGAGTAAA GCAATATCAG ATGCACAGAT TACTGCTTCA 4801 TCCTACTTTA CCAATATGTT TGCCACCTGG TCTCCTTCAA AAGCTCGACT 4851 TCACCTCCAA GGGAGGAGTA ATGCCTGGAG ACCTCAGGTG AATAATCCAA 4901 AAGAGTGGCT GCAAGTGGAC TTCCAGAAGA CAATGAAAGT CACAGGAGTA 4951 ACTACTCAGG GAGTAAAATC TCTGCTTACC AGCATGTATG TGAAGGAGTT 5001 CCTCATCTCC AGCAGTCAAG ATGGCCATCA GTGGACTCTC TTTTTTCAGA 5051 ATGGCAAAGT AAAGGTTTTT CAGGGAAATC AAGACTCCTT CACACCTGTG 5101 GTGAACTCTC TAGACCCACC GTTACTGACT CGCTACCTTC GAATTCACCC 5151 CCAGAGTTGG GTGCACCAGA TTGCCCTGAG GATGGAGGTT CTGGGCTGCG 5201 AGGCACAGGA CCTCTACGAC AAAACTCACA CATGCCCACC GTGCCCAGCT 5251 CCAGAACTCC TGGGCGGACC GTCAGTCTTC CTCTTCCCCC CAAAACCCAA 5301 GGACACCCTC ATGATCTCCC GGACCCCTGA GGTCACATGC GTGGTGGTGG 5351 ACGTGAGCCA CGAAGACCCT GAGGTCAAGT TCAACTGGTA CGTGGACGGC 5401 GTGGAGGTGC ATAATGCCAA GACAAAGCCG CGGGAGGAGC AGTACAACAG 5451 CACGTACCGT GTGGTCAGCG TCCTCACCGT CCTGCACCAG GACTGGCTGA 5501 ATGGCAAGGA GTACAAGTGC AAGGTCTCCA ACAAAGCCCT CCCAGCCCCC 5551 ATCGAGAAAA CCATCTCCAA AGCCAAAGGG CAGCCCCGAG AACCACAGGT 5601 GTACACCCTG CCCCCATCCC GGGATGAGCT GACCAAGAAC CAGGTCAGCC 5651 TGACCTGCCT GGTCAAAGGC TTCTATCCCA GCGACATCGC CGTGGAGTGG 5701 GAGAGCAATG GGCAGCCGGA GAACAACTAC AAGACCACGC CTCCCGTGTT 5751 GGACTCCGAC GGCTCCTTCT TCCTCTACAG CAAGCTCACC GTGGACAAGA3851 CTCTGTTTT CACCATCTTT GATGAGACCA AAAGCTGGTA CTTCACTGAA 3901 AATATGGAAA GAAACTGCAG GGCTCCCTGC AATATCCAGA TGGAAGATCC 3951 CACTTTTAAA GAGAATTATC GCTTCCATGC AATCAATGGC TACATAATGG 4001 AT AC ACT ACC TGGCTTAGT A ATGGCTC AGG A TC A AAGG AT TCGATGGT AT 4051 CTGCTCAGCA TGGGCAGCAA TGAAAACATC CATTCTATTC ATTTCAGTGG 4101 AC ATGTGTTC ACTGT ACGA A A A A A AGAGGA GT AT A A A ATG GC ACTGT AC A 4151 ATCTCT ATCC AGGTGTTTTTT GAGAC AGTGG A A ATGTT ACC ATCC A A AGCT 4201 GGAATTTGGC GGGTGGAATG CCTTATTGGC GAGCATCTAC ATGCTGGGAT 4251 GAGCACACTT TTTCTGGTGT ACAGCAATAA GTGTCAGACT CCCCTGGGAA 4301 TGGCTTCTGG ACACATTA GA GATTTTCAGA TTACAGCTTC AGGACAATAT 4351 GGAC AGTGGG CCCC A A AGCT GGCC AGACTT C ATT ATTCCG GATC A ATC A A 4401 TGCCTGGAGC ACC A AGG AGC CCTTTTCTTG GATC A AGGTG GATCTGTTGG 4451 CACCAATGAT TATTCACGGC ATCAAGACCC AGGGTGCCCG TCAGAAGTTC 4501 TCCAGCCTCT ACATCTCTCA GTTTATCATC ATGTATAGTC TTGATGGGAA 4551 GA AGTGGC AG ACTT ATCGAG GA A ATTCC AC TGGA ACCTT A ATGGTCTTCT 4601 TTGGCAATGT GGATTCATCT GGGATAAAAAC ACAATATTTT TAACCCTCCA 4651 ATTATTGCTC GATACATCCG TTTGCACCCA ACTCATTATA GCATTCGCAG 4701 CACTCTTCGC ATGGAGTTGA TGGGCTGTGA TTTAAATAGT TGCAGCATGC 4751 CATTGGGAAT GGAGAGTAAA GCAATATCAG ATGCACAGAT TACTGCTTCA 4801 TCCTACTTTA CCAATATGTT TGCCACCTGG TCTCCTTCAA AAGCTCGACT 4851 TCACCTCCAA GGGAGGAGTA ATGCCTGGAG ACCTCAGGTG AATAATCCAA 490 1 AAGAGTGGCT GCAAGTGGAC TTCCAGAAGA CAATGAAAGT CACAGGAGTA 4951 ACTACTCAGG GAGTAAAATC TCTGCTTACC AGCATGTATG TGAAGGAGTT 5001 CCTCATCTCC AGCAGTCAAG ATGGCCATCA GTGGACTCTC TTTTTTCAGA 5051 ATGGCAAAGT AAAGGTTTT CAGGGAAATC AAGACTCCTT CA CACCTGTG 5101 GTGAACTCTC TAGACCCACC GTTACTGACT CGCTACCTTC GAATTCACCC 5151 CCAGAGTTGG GTGCACCAGA TTGCCCTGAG GATGGAGGTT CTGGGCTGCG 5201 AGGCACAGGA CCTCTACGAC AAAACTCACA CATGCCCACC GTGCCCAGCT 5251 CCAGAACTCC TGGGCGGACC GTCAGTCTTC CTCTTCCCCC CAAAACCCAA 5301 GGACACCCTC ATGA TCTCCC GGACCCCTGA GGTCACATGC GTGGTGGTGG 5351 ACGTGAGCCA CGAAGACCCT GAGGTCAAGT TCAACTGGTA CGTGGACGGC 5401 GTGGAGGTGC ATAATGCCAA GACAAAGCCG CGGGAGGAGC AGTACAACAG 5451 CACGTACCGT GTGGTCAGCG TCCTCACCGT CCTGCACCAG GACTGGCTGA 5 501 ATGGCAAGGA GTACAAGTGC AAGGTCTCCA ACAAAGCCCT CCCAGCCCCC 5551 ATCGAGAAAA CCATCTCCAA AGCCAAAGGG CAGCCCCGAG AACCACAGGT 5601 GTACACCCTG CCCCCATCCC GGGATGAGCT GACCAAGAAC CAGGTCAGCC 5651 TGACCTGCCT GGTCAAAGGC TTCTATCCCA GCGACATCGC CGTGGAGTGG 5701 GAGAGCAATG GGCAGCCGGA GAACAACTAC AAGACCACGC CTCCCGTGTT 5751 GGACTCCGAC GGCTCCTTCT TCCTCTACAG CAAGCTCACC GTGGACAAGA

5801 GCAGGTGGCA GCAGGGGAAC GTCTTCTCAT GCTCCGTGAT GCATGAGGCT 5851 CTGC AC A ACC ACT AC ACGC A GA AGAGCCTC TCCCTGTCTC CGGGT A A ATG5801 GCAGGTGGCA GCAGGGGAAC GTCTTCTCAT GCTCCGTGAT GCATGAGGCT 5851 CTGC AC A ACC ACT AC ACGC A GA AGAGCCTC TCCCTGTCTC CGGGT A A ATG

- 176 044115- 176 044115

Последовательность белка pSYN FVIII 312 (FVIII с полной делецией домена В, за исключением 5 аминокислотных остатков и 288 AE-XTEN, вставленного после а.к. 745- В5 версия) (SEO ID NO: 173).Protein sequence of pSYN FVIII 312 (FVIII with complete deletion of domain B, except for 5 amino acid residues and 288 AE-XTEN inserted after aa 745-B5 version) (SEO ID NO: 173).

ATRRYYLGAV ELSWDYMQSD LGELPVDARF PPRVPKSFPF NTSVVYKKTLATRRYYLGAV ELSWDYMQSD LGELPVDARF PPRVPKSFPF NTSVVYKKTL

FVEFTDHLFN IAKPRPPWMG LLGPTIQAEV YDTVVITLKN MASHPVSLHAFVEFTDHLFN IAKPRPPWMG LLGPTIQAEV YDTVVITLKN MASHPVSLHA

101 VGVSYWKASE GAEYDDQTSQ REKEDDKVFP GGSHTYVWQV LKENGPMASD101 VGVSYWKASE GAEYDDQTSQ REKEDDKVFP GGSHTYVWQV LKENGPMASD

151 PLCLTYSYLS HVDLVKDLNS GLIGALLVCR EGSLAKEKTQ TLHKFILLFA151 PLCLTYSYLS HVDLVKDLNS GLIGALLVCR EGSLAKEKTQ TLHKFILLFA

201 VFDEGKS WHS ETKNSLMQDR D A AS AR AWPK MHT VNGY VNR SLPGLIGCHR201 VFDEGKS WHS ETKNSLMQDR D A AS AR AWPK MHT VNGY VNR SLPGLIGCHR

251 KSVYWHVIGM GTTPEVHSIF LEGHTFLVRN HRQASLEISP ITFLTAQTLL251 KSVYWHVIGM GTTPEVHSIF LEGHTFLVRN HRQASLEISP ITFLTAQTLL

301 MDLGQFLLFC HISSHQHDGM EAYVKVDSCP EEPQLRMKNN EEAEDYDDDL301 MDLGQFLLFC HISSHQHDGM EAYVKVDSCP EEPQLRMKNN EEAEDYDDDL

351 TDSEMDVVRF DDDNSPSFIQ IRSVAKKHPK TWVHYIAAEE EDWDYAPLVL351 TDSEMDVVRF DDDNSPSFIQ IRSVAKKHPK TWVHYIAAEE EDWDYAPLVL

401 APDDRSYKSQ YLNNGPQRIG RKYKKVRFMA YTDETFKTRE AIQHESGILG401 APDDRSYKSQ YLNNGPQRIG RKYKKVRFMA YTDETFKTRE AIQHESGILG

451 PLLYGEVGDT LLIIFKNQAS RPYNIYPHGI TDVRPLYSRR LPKGVKHLKD451 PLLYGEVGDT LLIIFKNQAS RPYNIYPHGI TDVRPLYSRR LPKGVKHLKD

501 FPILPGEIFK YKWTVTVEDG PTKSDPRCLT RYYSSFVNME RDLASGLIGP501 FPILPGEIFK YKWTVTVEDG PTKSDPRCLT RYYSSFVNME RDLASGLIGP

551 LLICYKESVD QRGNQIMSDK RNVILFSVFD ENRSWYLTEN IQRFLPNPAG551 LLICYKESVD QRGNQIMSDK RNVILFSVFD ENRSWYLTEN IQRFLPNPAG

601 VQLEDPEFQA SNIMHSINGY VFDSLQLSVC LHEVAYWYIL SIGAQTDFLS601 VQLEDPEFQA SNIMHSINGY VFDSLQLSVC LHEVAYWYIL SIGAQTDFLS

651 VFFSGYTFKH KMVYEDTLTL FPFSGETVFM SMENPGLWIL GCHNSDFRNR651 VFFSGYTFKH KMVYEDTLTL FPFSGETVFM SMENPGLWIL GCHNSDFRNR

701 GMTALLKVSS CDKNTGDYYE DSYEDISAYL LSKNNAIEPR SFSQNGTSES701 GMTALLKVSS CDKNTGDYYE DSYEDISAYL LSKNNAIEPR SFSQNGTSES

751 ATPESGPGSE PATSGSETPG TSESATPESG PGSEPATSGS ETPGTSESAT751 ATPESGPGSE PATSGSETPG TSESATPESG PGSEPATSGS ETPGTSESAT

801 PESGPGTSTE PSEGSAPGSP AGSPTSTEEG TSESATPESG PGSEPATSGS801 PESGPGTSTE PSEGSAPGSP AGSPTSTEEG TSESATPESG PGSEPATSGS

851 ETPGTSESAT PESGPGSPAG SPTSTEEGSP AGSPTSTEEG TSTEPSEGSA851 ETPGTSESAT PESGPGSPAG SPTSTEEGSP AGSPTSTEEG TSTEPSEGSA

901 PGTSESATPE SGPGTSESAT PESGPGTSES ATPESGPGSE PATSGSETPG901 PGTSESATPE SGPGTSESAT PESGPGTSES ATPESGPGSE PATSGSETPG

951 SEPATSGSET PGSPAGSPTS TEEGTSTEPS EGSAPGTSTE PSEGSAPGSE951 SEPATSGSET PGSPAGSPTS TEEGTSTEPS EGSAPGTSTE PSEGSAPGSE

1001 PATSGSETPG TSESATPESG PGTSTEPSEG SAPASSEITR TTLQSDQEEI1001 PATSGSETPG TSESATPESG PGTSTEPSEG SAPASSEITR TTLQSDQEEI

1051 DYDDTISVEM KKEDFDIYDE DENQSPRSFQ KKTRHYFIAA VERLWDYGMS1051 DYDDTISVEM KKEDFDIYDE DENQSPRSFQ KKTRHYFIAA VERLWDYGMS

1101 SSPHVLRNRA QSGSVPQFKK VVFQEFTDGS FTQPLYRGEL NEHLGLLGPY1101 SSPHVLRNRA QSGSVPQFKK VVFQEFTDGS FTQPLYRGEL NEHLGLLGPY

1151 IRAEVEDNIM VTFRNQASRP YSFYSSLISY EEDQRQGAEP RKNFVKPNET1151 IRAEVEDNIM VTFRNQASRP YSFYSSLISY EEDQRQGAEP RKNFVKPNET

1201 KT YFWK VQHH MAPTKDEFDC К AWA YFSD VD LEKD VHSGLI GPLL VCHTNT1201 KT YFWK VQHH MAPTKDEFDC TO AWA YFSD VD LEKD VHSGLI GPLL VCHTNT

1251 LNPAHGRQVT VQEFALFFTI FDETKSWYFT ENMERNCRAP CNIQMEDPTF1251 LNPAHGRQVT VQEFALFFTI FDETKSWYFT ENMERNCRAP CNIQMEDPTF

1301 KENYRFHAIN GYIMDTLPGL VMAQDQRIRW YLLSMGSNEN IHSIHFSGHV1301 KENYRFHAIN GYIMDTLPGL VMAQDQRIRW YLLSMGSNEN IHSIHFSGHV

1351 FTVRKKEEYK MALYNLYPGV FETVEMLPSK AGIWRVECLI GEHLHAGMST1351 FTVRKKEEYK MALYNLYPGV FETVEMLPSK AGIWRVECLI GEHLHAGMST

1401 LFLVYSNKCQ TPLGMASGHI RDFQITASGQ YGQWAPKLAR LHYSGSINAW1401 LFLVYSNKCQ TPLGMASGHHI RDFQITASGQ YGQWAPKLAR LHYSGSINAW

1451 STKEPFSWIK VDLLAPMIIH GIKTQGARQK FSSLYISQFI IMYSLDGKKW1451 STKEPFSWIK VDLLAPMIIH GIKTQGARQK FSSLYISQFI IMYSLDGKKW

1501 QTYRGNSTGT LMVFFGNVDS SGIKHNIFNP PIIARYIRLH PTHYSIRSTL1501 QTYRGNSTGT LMVFFGNVDS SGIKHNIFNP PIIARYIRLH PTHYSIRSTL

1551 RMELMGCDLN SCSMPLGMES KAISDAQITA SSYFTNMFAT WSPSKARLHL1551 RMELMGCDLN SCSMPLGMES KAISDAQITA SSYFTNMFAT WSPSKARLHL

1601 QGRSNAWRPQ VNNPKEWLQV DFQKTMKVTG VTTQGVKSLL TSMYVKEFLI1601 QGRSNAWRPQ VNNPKEWLQV DFQKTMKVTG VTTQGVKSLL TSMYVKEFLI

1651 SSSQDGHQWT LFFQNGKVKV FQGNQDSFTP VVNSLDPPLL TRYLRIHPQS1651 SSSQDGHQWT LFFQNGKVKV FQGNQDSFTP VVNSLDPPLL TRYLRIHPQS

1701 WVHQIALRME VLGCEAQDLY DKTHTCPPCP APELLGGPSV FLFPPKPKDT1701 WVHQIALRME VLGCEAQDLY DKTHTCPPCP APELLGGPSV FLFPPKPKDT

1751 LMISRTPEVT CVVVDVSHED PEVKFNWYVD GVEVHNAKTK PREEQYNSTY1751 LMISRTPEVT CVVVDVSHED PEVKFNWYVD GVEVHNAKTK PREEQYNSTY

1801 RVVSVLTVLH QDWLNGKEYK CKVSNKALPA PIEKTISKAK GQPREPQVYT1801 RVVSVLTVLH QDWLNGKEYK CKVSNKALPA PIEKTISKAK GQPREPQVYT

1851 LPPSRDELTK NQVSLTCLVK GFYPSDIAVE WESNGQPENN YKTTPPVLDS1851 LPPSRDELTK NQVSLTCLVK GFYPSDIAVE WESNGQPENN YKTTPPVLDS

1901 DGSFFLYSKL TVDKSRWQQG NVFSCSVMHE ALHNHYTQKS LSLSPGK*1901 DGSFFLYSKL TVDKSRWQQG NVFSCSVMHE ALHNHYTQKS LSLSPGK*

- 177 044115- 177 044115

Нуклеотидная последовательность pSYN ФВ059 (кодирующая ФВ D'D3-Fc с кислотным участком 2 (а2) сайта тромбина в линкере) (SEQ ID NO: 196).Nucleotide sequence of pSYN VWF059 (encoding VWF D'D3-Fc with thrombin site acidic site 2 (a2) in the linker) (SEQ ID NO: 196).

ATGATTCCTG CCAGATTTGC CGGGGTGCTG CTTGCTCTGG CCCTCATTTTATGATTCCTG CCAGATTTGC CGGGGTGCTG CTTGCTCTGG CCCTCATTTT

GCCAGGGACC CTTTGTGCAG AAGGAACTCG CGGCAGGTCA TCCACGGCCCGCCAGGGACC CTTTGTGCAG AAGGAACTCG CGGCAGGTCA TCCACGGCCC

101 GATGCAGCCT TTTCGGAAGT GACTTCGTCA ACACCTTTGA TGGGAGCATG101 GATGCAGCCT TTTCGGAAGT GACTTCGTCA ACACCTTTGA TGGGAGCATG

151 TACAGCTTTG CGGGATACTG CAGTTACCTC CTGGCAGGGG GCTGCCAGAA151 TACAGCTTTG CGGGATACTG CAGTTACCTC CTGGCAGGGG GCTGCCAGAA

201 ACGCTCCTTC TCGATT ATTG GGGACTTCC A GA ATGGC A AG AGAGTG AGCC201 ACGCTCCTTC TCGATT ATTG GGGACTTCC A GA ATGGC A AG AGAGTG AGCC

251 TCTCCGTGTA TCTTGGGGAA TTTTTTGACA TCCATTTGTT TGTCAATGGT251 TCTCCGTGTA TCTTGGGGAA TTTTTTGACA TCCATTTGTT TGTCAATGGT

301 ACCGTGACAC AGGGGGACCA AAGAGTCTCC ATGCCCTATG CCTCCAAAGG301 ACCGTGACAC AGGGGGACCA AAGAGTCTCC ATGCCCTATG CCTCCAAAGG

351 GCTGTATCTA GAAACTGAGG CTGGGTACTA CAAGCTGTCC GGTGAGGCCT351 GCTGTATCTA GAAACTGAGG CTGGGTACTA CAAGCTGTCC GGTGAGGCCT

401 ATGGCTTTGT GGCCAGGATC GATGGCAGCG GCAACTTTCA AGTCCTGCTG401 ATGGCTTTGT GGCCAGGATC GATGGCAGCG GCAACTTTCA AGTCCTGCTG

451 TCAGACAGAT ACTTCAACAA GACCTGCGGG CTGTGTGGCA ACTTTAACAT451 TCAGACAGAT ACTTCAACAA GACCTGCGGG CTGTGTGGCA ACTTTAACAT

501 CTTTGCTGAA GATGACTTT A TGACCC AAGA AGGGACCTTG ACCTCGGACC501 CTTTGCTGAA GATGACTTT A TGACCC AAGA AGGGACCTTG ACCTCGGACC

551 CTTATGACTT TGCCAACTCA TGGGCTCTGA GCAGTGGAGA ACAGTGGTGT551 CTTATGACTT TGCCAACTCA TGGGCTCTGA GCAGTGGAGA ACAGTGGTGT

601 GA ACGGGC AT CTCCTCCC AG C AGCTC ATGC A AC ATCTCCT CTGGGGA A AT601 GA ACGGGC AT CTCCTCCC AG C AGCTC ATGC A AC ATCTCCT CTGGGGA A AT

651 GCAGAAGGGC CTGTGGGAGC AGTGCCAGCT TCTGAAGAGC ACCTCGGTGT651 GCAGAAGGGC CTGTGGGAGC AGTGCCAGCT TCTGAAGAGC ACCTCGGTGT

701 TTGCCCGCTG CCACCCTCTG GTGGACCCCG AGCCTTTTGT GGCCCTGTGT701 TTGCCCGCTG CCACCCTCTG GTGGACCCCG AGCCTTTTGT GGCCCTGTGT

751 GAGAAGACTT TGTGTGAGTG TGCTGGGGGG CTGGAGTGCG CCTGCCCTGC751 GAGAAGACTT TGTGTGAGTG TGCTGGGGGG CTGGAGTGCG CCTGCCCTGC

801 CCTCCTGGAG T ACGCCCGGA CCTGTGCCC A GGAGGGAATG GTGCTGT ACG801 CCTCCTGGAG T ACGCCCGGA CCTGTGCCC A GGAGGGAATG GTGCTGT ACG

851 GCTGGACCGA CCACAGCGCG TGCAGCCCAG TGTGCCCTGC TGGTATGGAG851 GCTGGACCGA CCACAGCGCG TGCAGCCCAG TGTGCCCTGC TGGTATGGAG

901 T AT AGGC AGT GTGTGTCCCC TTGCGCC AGG ACCTGCC AGA GCCTGC AC AT901 T AT AGGC AGT GTGTGTCCCC TTGCGCC AGG ACCTGCC AGA GCCTGC AC AT

951 CAATGAAATG TGTCAGGAGC GATGCGTGGA TGGCTGCAGC TGCCCTGAGG951 CAATGAAATG TGTCAGGAGC GATGCGTGGA TGGCTGCAGC TGCCCTGAGG

1001 GACAGCTCCT GGATGAAGGC CTCTGCGTGG AGAGCACCGA GTGTCCCTGC1001 GACAGCTCCT GGATGAAGGC CTCTGCGTGG AGAGCACCGA GTGTCCCTGC

1051 GTGCATTCCG GAAAGCGCTA CCCTCCCGGC ACCTCCCTCT CTCGAGACTG1051 GTGCATTCCG GAAAGCGCTA CCCTCCCGGC ACCTCCCTCT CTCGAGACTG

1101 C A AC ACCTGC ATTTGCCGA A AC AGCC AGTG GATCTGC AGC A ATGA AGA AT1101 C A AC ACCTGC ATTTGCCGA A AC AGCC AGTG GATCTGC AGC A ATGA AGA AT

- 178 044115- 178 044115

1151 GTCCAGGGGA GTGCCTTGTC ACTGGTCAAT CCCACTTCAA GAGCTTTGAC1151 GTCCAGGGGA GTGCCTTGTC ACTGGTCAAT CCCACTTCAA GAGCTTTGAC

1201 A AC AGAT ACT TC ACCTTC AG TGGGATCTGC C AGT ACCTGC TGGCCCGGGA 1251 TTGCCAGGAC СACTCCTTCT CCATTGTCAT TGAGACTGTC CAGTGTGCTG 1301 ATGACCGCGA CGCTGTGTGC ACCCGCTCCG TCACCGTCCG GCTGCCTGGC 1351 CTGC AC A AC A GCCTTGTGA A ACTGA AGC AT GGGGC AGG AG TTGCC ATGGA 1401 TGGCCAGGAC ATCCAGCTCC CCCTCCTGAA AGGTGACCTC CGCATCCAGC 1451 ATACAGTGAC GGCCTCCGTG CGCCTCAGCT ACGGGGAGGA CCTGCAGATG 1501 GACTGGGATG GCCGCGGGAG GCTGCTGGTG AAGCTGTCCC CCGTCTATGC 1551 CGGGA AGACC TGCGGCCTGT GTGGGA ATT A C A ATGGC A AC C AGGGCGACG 1601 ACTTCCTTAC CCCCTCTGGG CTGGCGGAGC CCCGGGTGGA GGACTTCGGG 1651 AACGCCTGGA AGCTGCACGG GGACTGCCAG GACCTGCAGA AGCAGCACAG 1701 CGATCCCTGC GCCCTCAACC CGCGCATGAC CAGGTTCTCC GAGGAGGCGT 1751 GCGCGGTCCT GACGTCCCCC ACATTCGAGG CCTGCCATCG TGCCGTCAGC 1801 CCGCTGCCCT ACCTGCGGAA CTGCCGCTAC GACGTGTGCT CCTGCTCGGA 1851 CGGCCGCGAG TGCCTGTGCG GCGCCCTGGC CAGCTATGCC GCGGCCTGCG 1901 CGGGGAGAGG CGTGCGCGTC GCGTGGCGCG AGCCAGGCCG CTGTGAGCTG 1951 AACTGCCCGA AAGGCCAGGT GTACCTGCAG TGCGGGACCC CCTGCAACCT 2001 GACCTGCCGC TCTCTCTCTT ACCCGGATGA GGA ATGC A AT GAGGCCTGCC 2051 TGGAGGGCTG CTTCTGCCCC CCAGGGCTCT ACATGGATGA GAGGGGGGAC 2101 TGCGTGCCCA AGGCCCAGTG CCCCTGTTAC TATGACGGTG AGATCTTCCA 2151 GCCAG AAGAC ATCTTCTC AG ACC АТС AC AC C ATGTGCT AC TGTGAGGATG 2201 GCTTCATGCA CTGTACCATG AGTGGAGTCC CCGGAAGCTT GCTGCCTGAC 2251 GCTGTCCTCA GCAGTCCCCT GTCTCATCGC AGCAAAAGGA GCCTATCCTG 2301 TCGGCCCCCC ATGGTCAAGC TGGTGTGTCC CGCTGACAAC CTGCGGGCTG 2351 A AGGGCTCGA GTGT ACC A A A ACGTGCC AGA ACT ATGACCT GGAGTGC ATG 2401 AGCATGGGCT GTGTCTCTGG CTGCCTCTGC CCCCCGGGCA TGGTCCGGCA 2451 TGAGAACAGA TGTGTGGCCC TGGAAAGGTG TCCCTGCTTC CATCAGGGCA 2501 AGGAGTATGC CCCTGGAGAA ACAGTGAAGA TTGGCTGCAA CACTTGTGTC 2551 TGTCGGGACC GGAAGTGGAA CTGCACAGAC CATGTGTGTG ATGCCACGTG 2601 CTCCACGATC GGCATGGCCC ACTACCTCAC CTTCGACGGG СТСAAATACC 2651 TGTTCCCCGG GGAGTGCCAG TACGTTCTGG TGCAGGATTA CTGCGGCAGT 2701 AACCCTGGGA CCTTTCGGAT CCTAGTGGGG AATAAGGGAT GCAGCCACCC 2751 CTCAGTGAAA TGCAAGAAAC GGGTCACCAT CCTGGTGGAG GGAGGAGAGA 2801 TTGAGCTGTT TGACGGGGAG GTGAATGTGA AGAGGCCCAT GAAGGATGAG 2851 ACTCACTTTG AGGTGGTGGA GTCTGGCCGG TACATCATTC TGCTGCTGGG 2901 CAAAGCCCTC TCCGTGGTCT GGGACCGCCA CCTGAGCАТС TCCGTGGTCC 2951 TGAAGCAGAC ATACCAGGAG AAAGTGTGTG GCCTGTGTGG GAATTTTGAT 3001 GGCATCCAGA АСАATGACCT CACCAGCAGC AACCTCCAAG TGGAGGAAGA1201 A AC AGAT ACT TC ACCTTC AG TGGGATCTGC C AGT ACCTGC TGGCCCGGGA 1251 TTGCCAGGAC СACTCCTTCT CCATTGTCAT TGAGACTGTC CAGTGTGCTG 1301 ATGACCGCGA CGCTGTGTGC ACCCGCTCCG TCACCGTCCG GCTGCCTGGC 1351 CTGC AC A AC A GCCTTGTGA A ACTGA AGC AT GGGGC AGG AG TTGCC ATGGA 1401 TGGCCAGGAC ATCCAGCTCC CCCTCCTGAA AGGTGACCTC CGCATCCAGC 1451 ATACAGTGAC GGCCTCCGTG CGCCTCAGCT ACGGGGAGGA CCTGCAGATG 1501 GACTGGGATG GCCGCGGGAG GCTGCTGGTG AAGCTGTCCC CCGTCTATGC 1551 CGGGA AGACC TGCGGCCTGT GTGGGA ATT A C A ATGGC A AC C AGGGCGACG 1601 ACTTCCTTAC CCCCTCTGGG CTGGCGGAGC CCCGGGTGGA GGACTTCGGG 165 1 AACGCCTGGA AGCTGCACGG GGACTGCCAG GACCTGCAGA AGCAGCACAG 1701 CGATCCCTGC GCCCTCAACC CGCGCATGAC CAGGTTCTCC GAGGAGGCGT 1751 GCGCGGTCCT GACGTCCCCC ACATTCGAGG CCTGCCATCG TGCCGTCAGC 1801 CCGCTGCCCT ACCTGCGGAA CTGCCGCTAC GACGTG TGCT CCTGCTCGGA 1851 CGGCCGCGAG TGCCTGTGCG GCGCCCTGGC CAGCTATGCC GCGGCCTGCG 1901 CGGGGAGAGG CGTGCGCGTC GCGTGGCGCG AGCCAGGCCG CTGTGAGCTG 1951 AACTGCCCGA AAGGCCAGGT GTACCTGCAG TGCGGGACCC CCTGCAACCT 2001 GACCTGCCGC TCTCTCTC TT ACCCGGATGA GGA ATGC A AT GAGGCCTGCC 2051 TGGAGGGCTG CTTCTGCCCC CCAGGGCTCT ACATGGATGA GAGGGGGGAC 2101 TGCGTGCCCA AGGCCCAGTG CCCCTGTTAC TATGACGGTG AGATCTTCCA 2151 GCCAG AAGAC ATCTTCTC AG ACC ATC AC AC C ATGTGCT AC TGTGAGGATG 2201 GCTTCATGCA CTGTACCATG AGTGGAGTCC CCGGAAGCTT GCTGCCTGAC 2251 GCTGTCCTCA GCAGTCCCCT GTCTCATCGC AGCAAAAGGA GCCTATCCTG 2301 TCGGCCCCCC ATGGTCAAGC TGGTGTGTCC CGCTGACAAC CTGCGGGCTG 2351 A AGGGC TCGA GTGT ACC A A A ACGTGCC AGA ACT ATGACCT GGAGTGC ATG 2401 AGCATGGGCT GTGTCTCTGG CTGCCTCTGC CCCCCGGGCA TGGTCCGGCA 2451 TGAGAACAGA TGTGTGGCCC TGGAAAGGTG TCCCTGCTTC CATCAGGGCA 2501 AGGAGTATGC CCCTGGAGAA ACAGTGAAGA TTGGCTGCAA CACTTGTGTC 2551 TGTCGGGACC GGAAGTGGAA CTGCACAGAC CATGTGTGTG ATGCCACGTG 2601 CTCCACGATC GGCATGGCCC ACTACCTCAC CTTCGACGGG CTCAAAATACC 2651 TGTTCCCCGG GGAGTGCCAG TACGTTCTGG TGCAGGATTA CTGCGGCAGT 2701 AACCCTGGGA CCTTTCGGAT CCTAGTGGGG AATAAGGGAT GCAGCCACCC 2751 CTCAGTGAAA TGCAAGAAAC GGGTCACCAT CCTGGTGGAG GGAGGAGAGA 2801 TTGAGCTGTT TGACGGGGAG GTGAATGTGA AGAGGCCCAT GAAGGATGAG 2851 ACTCACTTTG AGGTGGTGGA GTCTGGCCGG TACATCATTC TGCTGCTGGG 2901 CAAA GCCCTC TCCGTGGTCT GGGACCGCCA CCTGAGCATAC TCCGTGGTCC 2951 TGAAGCAGAC ATACCAGGAG AAAGTGTGTG GCCTGTGTGG GAATTTTGAT 3001 GGCATCCAGA ACAATGACCT CACCAGCAGC AACCTCCAAG TGGAGGAAGA

- 179 044115- 179 044115

3051 CCCTGTGGAC TTTGGGAACT CCTGGAAAGT GAGCTCGCAG TGTGCTGACA 3101 CCAGA AAAGT GCCTCTGGAC TC ATCCCCTG CC ACCTGCC А ТА AC A AC АТС 3151 ATGAAGCAGA CGATGGTGGA TTCCTCCTGT AGAATCCTTA CCAGTGACGT 3201 CTTCCAGGAC TGCAACAAGC TGGTGGACCC CGAGCCATAT CTGGATGTCT 3251 GCATTTACGA CACCTGCTCC TGTGAGTCCA TTGGGGACTG CGCCGCATTC 3301 TGCGACACCA TTGCTGCCTA TGCCCACGTG TGTGCCCAGC ATGGCAAGGT 3351 GGTGACCTGG AGGACGGCCA CATTGTGCCC CCAGAGCTGC GAGGAGAGGA 3401 ATCTCCGGGA GAACGGGTAT GAGGCTGAGT GGCGCTATAA CAGCTGTGCA 3451 CCTGCCTGTC AAGTCACGTG TCAGCACCCT GAGCCACTGG CCTGCCCTGT 3501 GCAGTGTGTG GAGGGCTGCC ATGCCCACTG CCCTCCAGGG AAAATCCTGG 3551 ATGAGCTTTT GCAGACCTGC GTTGACCCTG AAGACTGTCC AGTGTGTGAG 3601 GTGGCTGGCC GGCGTTTTGC CTCAGGAAAG AAAGTCACCT TGAATCCCAG 3651 TGACCCTGAG CACTGCCAGA TTTGCCACTG TGATGTTGTC AACCTCACCT 3701 GTGAAGCCTG CCAGGAGCCG ATATCGGGCG CGCCAACАТС AGAGAGCGCC 3751 ACCCCTGAAA GTGGTCCCGG GAGCGAGCCA GCCACATCTG GGTCGGAAAC 3801 GCCAGGCACA AGTGAGTCTG CAACTCCCGA GTCCGGACCT GGCTCCGAGC 3851 CTGCC ACT AG CGGCTCCGAG ACTCCGGGA A CTTCCGAGAG CGCT AC ACC A 3901 GAAAGCGGAC CCGGA ACC AG T ACCGAACCT AGCGAGGGCT CTGCTCCGGG 3951 CAGCCCAGCC GGCTCTCCTA CATCCACGGA GGAGGGCACT TCCGAATCCG 4001 CCACCCCGGA GTCAGGGCCA GGATCTGAAC CCGCTACCTC AGGCAGTGAG 4051 ACGCCAGGAA CGAGCGAGTC CGCTACACCG GAGAGTGGGC CAGGGAGCCC 4101 TGCTGGATCT CCTACGTCCA CTGAGGAAGG GTCACCAGCG GGCTCGCCCA 4151 CCAGC ACTGA AGA AGGTGCC TCGAT ATCTG AC A AGA AC AC TGGTGATT AT 4201 T ACGAGGAC A GTT ATGA AGA T ATTTC AGC A T ACTTGCTGA GT A A A A AC A A 4251 TGCCATTGAA CCAAGAAGCT TCTCTGACAA AACTCACACA TGCCCACCGT 4301 GCCCAGCTCC AGAACTCCTG GGCGGACCGT CAGTCTTCCT CTTCCCCCCA 4351 A A ACCC A AGG AC ACCCTC AT GATCTCCCGG ACCCCTGAGG TC AC ATGCGT 4401 GGTGGTGGAC GTGAGCCACG AAGACCCTGA GGTCAAGTTC AACTGGTACG 4451 TGGACGGCGT GGAGGTGCAT AATGCCAAGA CAAAGCCGCG GGAGGAGCAG 4501 TACAACAGCA CGTACCGTGT GGTCAGCGTC CTCACCGTCC TGCACCAGGA 4551 CTGGCTG A AT GGC AAGG AGT AC A AGTGC A A GGTCTCC A AC A A AGCCCTCC 4601 CAGCCCCCAT CGAGAAAACC ATCTCCAAAG CCAAAGGGCA GCCCCGAGAA 4651 CCACAGGTGT ACACCCTGCC CCCATCCCGG GATGAGCTGA CCAAGAACCA 4701 GGTCAGCCTG ACCTGCCTGG TCAAAGGCTT CTATCCCAGC GACATCGCCG 4751 TGGAGTGGGA GAGCAATGGG CAGCCGGAGA ACAACTACAA GACCACGCCT 4801 CCCGTGTTGG ACTCCGACGG CTCCTTCTTC CTCTACAGCA AGCTCACCGT 4851 GGACAAGAGC AGGTGGCAGC AGGGGAACGT CTTCTCATGC TCCGTGATGC 4901 ATGAGGCTCT GCACAACCAC TACACGCAGA AGAGCCTCTC CCTGTCTCCG 4951 GGTAAATGA3051 CCCTGTGGAC TTTGGGAACT CCTGGAAAGT GAGCTCGCAG TGTGCTGACA 3101 CCAGA AAAGT GCCTCTGGAC TC ATCCCCTG CC ACCTGCC A TA AC A AC ATS 3151 ATGAAGCAGA CGATGGTGGA TTCCTCCTGT AGAATCCTTA CCAGTGACGT 3201 CTTCCAGGAC TGCAACAAGC T GGTGGACCC CGAGCCATAT CTGGATGTCT 3251 GCATTTACGA CACCTGCTCC TGTGAGTCCA TTGGGGACTG CGCCGCATTC 3301 TGCGACACCA TTGCTGCCTA TGCCCACGTG TGTGCCCAGC ATGGCAAGGT 3351 GGTGACCTGG AGGACGGCCA CATTGTGCCC CCAGAGCTGC GAGGAGAGGA 3401 ATCTCCGGGA GAACGGGTAT GAGGCTGAGT GGCGCTATAA CAGCTGTGCA 3451 CCTGCCTGTC AAGTCACGTG TCAGCACCCT GAGCCACTGG CCTGCCCTGT 3501 GCAGTGTGTG GAGGGCTGCC ATGCCCACTG CCCTCCAGGG AAAATCCTGG 3551 ATGAGCTTTT GCAGACCTGC GTTGACCCTG AAGACT GTCC AGTGTGTGAG 3601 GTGGCTGGCC GGCGTTTTGC CTCAGGAAAG AAAGTCACCT TGAATCCCAG 3651 TGACCCTGAG CACTGCCAGA TTTGCCACTG TGATGTTGTC AACCTCACCT 3701 GTGAAGCCTG CCAGGAGCCG ATATCGGGCG CGCCAACTC AGAGAGCGCC 3751 ACCCCTGAAA GTGGTCCCGG GAGCGAGCCA GCCACATCTG GGTCGGAAAC 3801 GCCAGGCACA AGTGAGTCTG CAACTCCCGA GTCCGGACCT GGCTCCGAGC 3851 CTGCC ACT AG CGGCTCCGAG ACTCCGGGA A CTTCCGAGAG CGCT AC ACC A 3901 GAAAGCGGAC CCGGA ACC AG T ACCGAACCT AGCGAGGGCT CTGCTCCGGG 3951 CAGCCCAGCC GGCTCTCCTA CATCCACGGA GGAGGGCACT TCCGAATCC G 4001 CCACCCCGGA GTCAGGGCCA GGATCTGAAC CCGCTACCTC AGGCAGTGAG 4051 ACGCCAGGAA CGAGCGAGTC CGCTACACCG GAGAGTGGGC CAGGGAGCCC 4101 TGCTGGATCT CCTACGTCCA CTGAGGAAGG GTCACCAGCG GGCTCGCCCA 4151 CCAGC ACTGA AGA AGGTGCC TCGAT ATCTG AC A AGA AC AC TGGTGATT AT 4201 T ACGAGGAC A GTT ATGA AGA T ATTTC AGC A T ACTTGCTGA GT A A A A AC A A 4251 TGCCATTGAA CCAAGAAGCT TCTCTGACAA AACTCACACA TGCCCACCGT 4301 GCCCAGCTCC AGAACTCCTG GGCGGACCGT CAGTCTTCCT CTTCCCCCCA 4351 A A ACCC A AGG AC ACCCTC AT GATCTCCCGG ACCCCTGAGG TC AC ATGCGT 4401 GGTGGTGGAC GTGAGCCACG AAGACCCTGA GGTCAAGTTC AACTGGTACG 4451 TGGACGGCGT GGAGGTGCAT AATGCCAAGA CAAAGCCGCG GGAGGAGCAG 4501 TACAACAGCA CGTACCGTGT GGTCAGCGTC CTCACCGTCC TGCACCAGGA 4551 C TGGCTG A AT GGC AAGG AGT AC A AGTGC A A GGTCTCC A AC A A AGCCCTCC 4601 CAGCCCCCAT CGAGAAAACC ATCTCCAAAG CCAAAGGGCA GCCCCGAGAA 4651 CCACAGGTGT ACACCCTGCC CCCATCCCGG GATGAGCTGA CCAAGAACCA 4701 GGTCAGCCTG ACCTGCCTGG TCAAAGGCTT CTATCCCAGC GACATCGCCG 4751 TGGAGTGGGA GAGCAATGGG CAGCCGGAGA ACAACTACAA GACCACGCCT 4801 CCCGTGTTGG ACTCCGACGG CTCCTTCTTC CTCTACAGCA AGCTCACCGT 4851 GGACAAGAGC AGGTGGCAGC AGGGGAACG T CTTCTCATGC TCCGTGATGC 4901 ATGAGGCTCT GCACAACCAC TACACGCAGA AGAGCCTCTC CCTGTCTCCG 4951 GGTAAATGA

- 180 044115- 180 044115

Последовательность белка pSYN ФВ059 (ФВ D'D3-Fc с а2 участком сайта тромбина FVIII в линкере) - подчеркнутая область жирным шрифтом отображает а2 участок (SEQ ID NO: 197).Protein sequence of pSYN VF059 (VWF D'D3-Fc with the a2 region of the FVIII thrombin site in the linker) - the underlined region in bold represents the a2 region (SEQ ID NO: 197).

MIPARFAGVL LALALILPGT LCAEGTRGRS STARCSLFGS DFVNTFDGSMMIPARFAGVL LALALILPGT LCAEGTRGRS STARCSLFGS DFVNTFDGSM

YSFAGYCSYL LAGGCQKRSF SIIGDFQNGK RVSLSVYLGE FFDIHLFVNGYSFAGYCSYL LAGGCQKRSF SIIGDFQNGK RVSLSVYLGE FFDIHLFVNG

101 TVTQGDQRVS MPYASKGLYL ETEAGYYKLS GEAYGFVARI DGSGNFQVLL101 TVTQGDQRVS MPYASKGLYL ETEAGYYKLS GEAYGFVARI DGSGNFQVLL

151 SDRYFNKTCG LCGNFNIFAE DDFMTQEGTL TSDPYDFANS WALSSGEQWC151 SDRYFNKTCG LCGNFNIFAE DDFMTQEGTL TSDPYDFANS WALSSGEQWC

201 ERASPPSSSC NISSGEMQKG LWEQCQLLKS TSVFARCHPL VDPEPFVALC201 ERASPPSSSC NISSGEMQKG LWEQCQLLKS TSVFARCHPL VDPEPFVALC

251 EKTLCECAGG LECACPALLE YARTCAQEGM VLYGWTDHSA CSPVCPAGME251 EKTLCECAGG LECACPALLE YARTCAQEGM VLYGWTDHSA CSPVCPAGME

301 YRQCVSPCAR TCQSLHINEM CQERCVDGCS CPEGQLLDEG LCVESTECPC301 YRQCVSPCAR TCQSLHINEM CQERCVDGCS CPEGQLLDEG LCVESTECPC

351 VHSGKRYPPG TSLSRDCNTC ICRNSQWICS NEECPGECLV TGQSHFKSFD351 VHSGKRYPPG TSLSRDCNTC ICRNSQWICS NEECPGECLV TGQSHFKSFD

401 NRYFTFSGIC QYLLARDCQD HSFSIVIETV QCADDRDAVC TRSVTVRLPG401 NRYFTFSGIC QYLLARDCQD HSFSIVIETV QCADDRDAVC TRSVTVRLPG

451 LHNSLVKLKH GAGVAMDGQD IQLPLLKGDL RIQHTVTASV RLSYGEDLQM451 LHNSLVKLKH GAGVAMDGQD IQLPLLKGDL RIQHTVTASV RLSYGEDLQM

501 DWDGRGRLLV KLSPVYAGKT CGLCGNYNGN QGDDFLTPSG LAEPRVEDFG501 DWDGRGRLLV KLSPVYAGKT CGLCGNYNGN QGDDFLTPSG LAEPRVEDFG

551 NAWKLHGDCQ DLQKQHSDPC ALNPRMTRFS EEACAVLTSP TFEACHRAVS551 NAWKLHGDCQ DLQKQHSDPC ALNPRMTRFS EEACAVLTSP TFEACHRAVS

601 PLPYLRNCRY DVCSCSDGRE CLCGALASYA AACAGRGVRV AWREPGRCEL601 PLPYLRNCRY DVCSCSDGRE CLCGALASYA AACAGRGVRV AWREPGRCEL

651 NCPKGQVYLQ CGTPCNLTCR SLSYPDEECN EACLEGCFCP PGLYMDERGD651 NCPKGQVYLQ CGTPCNLTCR SLSYPDEECN EACLEGCFCP PGLYMDERGD

701 CVPKAQCPCY YDGEIFQPED IFSDHHTMCY CEDGFMHCTM SGVPGSLLPD701 CVPKAQCPCY YDGEIFQPED IFSDHHTMCY CEDGFMHCTM SGVPGSLLPD

751 AVLSSPLSHR SKRSLSCRPP MVKLVCPADN LRAEGLECTK TCQNYDLECM751 AVLSSPLSHR SKRSLSCRPP MVKLVCPADN LRAEGLECTK TCQNYDLECM

801 SMGCVSGCLC PPGMVRHENR CVALERCPCF HQGKEYAPGE TVKIGCNTCV801 SMGCVSGCLC PPGMVRHENR CVALERCPCF HQGKEYAPGE TVKIGCNTCV

851 CRDRKWNCTD HVCDATCSTI GMAHYLTFDG LKYLFPGECQ YVLVQDYCGS851 CRDRKWNCTD HVCDATCSTI GMAHYLTFDG LKYLFPGECQ YVLVQDYCGS

901 NPGTFRILVG NKGCSHPSVK CKKRVTILVE GGEIELFDGE VNVKRPMKDE901 NPGTFRILVG NKGCSHPSVK CKKRVTILVE GGEIELFDGE VNVKRPMKDE

951 THFEVVESGR YIILLLGKAL SVVWDRHLSI SVVLKQTYQE KVCGLCGNFD951 THFEVVESGR YIILLLGKAL SVVWDRHLSI SVVLKQTYQE KVCGLCGNFD

1001 GIQNNDLTSS NLQVEEDPVD FGNSWKVSSQ CADTRKVPLD SSPATCHNNI1001 GIQNNDLTSS NLQVEEDPVD FGNSWKVSSQ CADTRKVPLD SSPATCHNNI

1051 MKQTMVDSSC RILTSDVFQD CNKLVDPEPY LDVCIYDTCS CESIGDCAAF1051 MKQTMVDSSC RILTSDVFQD CNKLVDPEPY LDVCIYDTCS CESIGDCAAF

1101 CDTIAAYAHV CAQHGKVVTW RTATLCPQSC EERNLRENGY EAEWRYNSCA1101 CDTIAAYAHV CAQHGKVVTW RTATLCPQSC EERNLRENGY EAEWRYNSCA

1151 PACQVTCQHP EPLACPVQCV EGCHAHCPPG KILDELLQTC VDPEDCPVCE1151 PACQVTCQHP EPLACPVQCV EGCHAHCPPG KILDELLQTC VDPEDCPVCE

1201 VAGRRFASGK KVTLNPSDPE HCQICHCDVV NLTCEACQEPISGAPTSESA1201 VAGRRFASGK KVTLNPSDPE HCQICHCDVV NLTCEACQEPISGAPTSESA

1251 TPESGPGSEP ATSGSETPGT SESATPESGP GSEPATSGSE TPGTSESATP1251 TPESGPGSEP ATSGSETPGT SESATPESGP GSEPATSGSE TPGTSESATP

1301 ESGPGTSTEP SEGSAPGSPA GSPTSTEEGT SESATPESGP GSEPATSGSE1301 ESGPGTSTEP SEGSAPGSPA GSPTSTEEGT SESATPESGP GSEPATSGSE

1351 TPGTSESATP ESGPGSPAGS PTSTEEGSPA GSPTSTEEGA SISDKNTGDY1351 TPGTSESATP ESGPGSPAGS PTSTEEGSPA GSPTSTEEGA SISDKNTGDY

1401 YEDSYEDISA YLLSKNNAIE PRSFSDKTHT CPPCPAPELL GGPSVFLFPP1401 YEDSYEDISA YLLSKNNAIE PRSFSDKTHT CPPCPAPELL GGPSVFLFPP

1451 KPKDTLMISR TPEVTCVVVD VSHEDPEVKF NWYVDGVEVH NAKTKPREEQ1451 KPKDTLMISR TPEVTCVVVD VSHEDPEVKF NWYVDGVEVH NAKTKPREEQ

1501 YNSTYRVVSV LTVLHQDWLN GKEYKCKVSN KALPAPIEKT ISKAKGQPRE1501 YNSTYRVVSV LTVLHQDWLN GKEYKCKVSN KALPAPIEKT ISKAKGQPRE

1551 PQVYTLPPSR DELTKNQVSL TCLVKGFYPS DIAVEWESNG QPENNYKTTP1551 PQVYTLPPSR DELTKNQVSL TCLVKGFYPS DIAVEWESNG QPENNYKTTP

1601 PVLDSDGSFF LYSKLTVDKS RWQQGNVFSC SVMHEALHNH YTQKSLSLSP1601 PVLDSDGSFF LYSKLTVDKS RWQQGNVFSC SVMHEALHNH YTQKSLSLSP

1651 GK*1651 GK*

- 181 044115- 181 044115

Нуклеотидная последовательность pSYN ФВ062 (кодирующая ФВ D'D3-Fc без сайта тромбина в линкере) (SEQ ID NO: 198).Nucleotide sequence of pSYN VWF062 (encoding VWF D'D3-Fc without thrombin site in the linker) (SEQ ID NO: 198).

ATGATTCCTG CCAGATTTGC CGGGGTGCTG CTTGCTCTGG CCCTCATTTTATGATTCCTG CCAGATTTGC CGGGGTGCTG CTTGCTCTGG CCCTCATTTT

GCCAGGGACC CTTTGTGCAG AAGGAACTCG CGGCAGGTCA TCCACGGCCCGCCAGGGACC CTTTGTGCAG AAGGAACTCG CGGCAGGTCA TCCACGGCCC

101 GATGCAGCCT TTTCGGAAGT GACTTCGTCA ACACCTTTGA TGGGAGCATG101 GATGCAGCCT TTTCGGAAGT GACTTCGTCA ACACCTTTGA TGGGAGCATG

151 TACAGCTTTG CGGGATACTG CAGTTACCTC CTGGCAGGGG GCTGCCAGAA151 TACAGCTTTG CGGGATACTG CAGTTACCTC CTGGCAGGGG GCTGCCAGAA

201 ACGCTCCTTC TCGATT ATTG GGGACTTCC A GA ATGGC A AG AGAGTG AGCC201 ACGCTCCTTC TCGATT ATTG GGGACTTCC A GA ATGGC A AG AGAGTG AGCC

251 TCTCCGTGTA TCTTGGGGAA TTTTTTGACA TCCATTTGTT TGTCAATGGT251 TCTCCGTGTA TCTTGGGGAA TTTTTTGACA TCCATTTGTT TGTCAATGGT

301 ACCGTGACAC AGGGGGACCA AAGAGTCTCC ATGCCCTATG CCTCCAAAGG301 ACCGTGACAC AGGGGGACCA AAGAGTCTCC ATGCCCTATG CCTCCAAAGG

351 GCTGTATCTA GAAACTGAGG CTGGGTACTA CAAGCTGTCC GGTGAGGCCT351 GCTGTATCTA GAAACTGAGG CTGGGTACTA CAAGCTGTCC GGTGAGGCCT

401 ATGGCTTTGT GGCCAGGATC GATGGCAGCG GCAACTTTCA AGTCCTGCTG401 ATGGCTTTGT GGCCAGGATC GATGGCAGCG GCAACTTTCA AGTCCTGCTG

451 TCAGACAGAT ACTTCAACAA GACCTGCGGG CTGTGTGGCA ACTTTAACAT451 TCAGACAGAT ACTTCAACAA GACCTGCGGG CTGTGTGGCA ACTTTAACAT

501 CTTTGCTGAA GATGACTTT A TGACCC AAGA AGGGACCTTG ACCTCGGACC501 CTTTGCTGAA GATGACTTT A TGACCC AAGA AGGGACCTTG ACCTCGGACC

551 CTTATGACTT TGCCAACTCA TGGGCTCTGA GCAGTGGAGA ACAGTGGTGT551 CTTATGACTT TGCCAACTCA TGGGCTCTGA GCAGTGGAGA ACAGTGGTGT

601 GA ACGGGC AT CTCCTCCC AG C AGCTC ATGC A AC ATCTCCT CTGGGGA A AT601 GA ACGGGC AT CTCCTCCC AG C AGCTC ATGC A AC ATCTCCT CTGGGGA A AT

651 GCAGAAGGGC CTGTGGGAGC AGTGCCAGCT TCTGAAGAGC ACCTCGGTGT651 GCAGAAGGGC CTGTGGGAGC AGTGCCAGCT TCTGAAGAGC ACCTCGGTGT

701 TTGCCCGCTG CCACCCTCTG GTGGACCCCG AGCCTTTTGT GGCCCTGTGT701 TTGCCCGCTG CCACCCTCTG GTGGACCCCG AGCCTTTTGT GGCCCTGTGT

751 GAGAAGACTT TGTGTGAGTG TGCTGGGGGG CTGGAGTGCG CCTGCCCTGC751 GAGAAGACTT TGTGTGAGTG TGCTGGGGGG CTGGAGTGCG CCTGCCCTGC

801 CCTCCTGGAG T ACGCCCGGA CCTGTGCCC A GGAGGGAATG GTGCTGT ACG801 CCTCCTGGAG T ACGCCCGGA CCTGTGCCC A GGAGGGAATG GTGCTGT ACG

851 GCTGGACCGA CCACAGCGCG TGCAGCCCAG TGTGCCCTGC TGGTATGGAG851 GCTGGACCGA CCACAGCGCG TGCAGCCCAG TGTGCCCTGC TGGTATGGAG

901 T AT AGGC AGT GTGTGTCCCC TTGCGCC AGG ACCTGCC AGA GCCTGC AC AT901 T AT AGGC AGT GTGTGTCCCC TTGCGCC AGG ACCTGCC AGA GCCTGC AC AT

951 CAATGAAATG TGTCAGGAGC GATGCGTGGA TGGCTGCAGC TGCCCTGAGG951 CAATGAAATG TGTCAGGAGC GATGCGTGGA TGGCTGCAGC TGCCCTGAGG

1001 GACAGCTCCT GGATGAAGGC CTCTGCGTGG AGAGCACCGA GTGTCCCTGC1001 GACAGCTCCT GGATGAAGGC CTCTGCGTGG AGAGCACCGA GTGTCCCTGC

1051 GTGCATTCCG GAAAGCGCTA CCCTCCCGGC ACCTCCCTCT CTCGAGACTG1051 GTGCATTCCG GAAAGCGCTA CCCTCCCGGC ACCTCCCTCT CTCGAGACTG

1101 C A AC ACCTGC ATTTGCCGA A AC AGCC AGTG GATCTGC AGC A ATGA AGA AT1101 C A AC ACCTGC ATTTGCCGA A AC AGCC AGTG GATCTGC AGC A ATGA AGA AT

1151 GTCCAGGGGA GTGCCTTGTC ACTGGTCAAT CCCACTTCAA GAGCTTTGAC1151 GTCCAGGGGA GTGCCTTGTC ACTGGTCAAT CCCACTTCAA GAGCTTTGAC

1201 A AC AGAT ACT TC ACCTTC AG TGGGATCTGC C AGT ACCTGC TGGCCCGGGA1201 A AC AGAT ACT TC ACCTTC AG TGGGATCTGC C AGT ACCTGC TGGCCCGGGA

1251 TTGCCAGGAC СACTCCTTCT CCATTGTCAT TGAGACTGTC CAGTGTGCTG1251 TTGCCAGGAC СACTCCTTCT CCATTGTCAT TGAGACTGTC CAGTGTGCTG

1301 ATGACCGCGA CGCTGTGTGC ACCCGCTCCG TCACCGTCCG GCTGCCTGGC1301 ATGACCGCGA CGCTGTGTGC ACCCGCTCCG TCACCGTCCG GCTGCCTGGC

1351 CTGC AC A AC A GCCTTGTGA A ACTGA AGC AT GGGGC AGG AG TTGCC ATGGA1351 CTGC AC A AC A GCCTTGTGA A ACTGA AGC AT GGGGC AGG AG TTGCC ATGGA

1401 TGGCCAGGAC ATCCAGCTCC CCCTCCTGAA AGGTGACCTC CGCATCCAGC1401 TGGCCAGGAC ATCCAGCTCC CCCTCCTGAA AGGTGACCTC CGCATCCAGC

1451 ATACAGTGAC GGCCTCCGTG CGCCTCAGCT ACGGGGAGGA CCTGCAGATG1451 ATACAGTGAC GGCCTCCGTG CGCCTCAGCT ACGGGGAGGA CCTGCAGATG

1501 GACTGGGATG GCCGCGGGAG GCTGCTGGTG AAGCTGTCCC CCGTCTATGC1501 GACTGGGATG GCCGCGGGAG GCTGCTGGTG AAGCTGTCCC CCGTCTATGC

1551 CGGGA AGACC TGCGGCCTGT GTGGGA ATT A C A ATGGC A AC C AGGGCGACG1551 CGGGA AGACC TGCGGCCTGT GTGGGA ATT A C A ATGGC A AC C AGGGCGACG

1601 ACTTCCTTAC CCCCTCTGGG CTGGCGGAGC CCCGGGTGGA GGACTTCGGG1601 ACTTCCTTAC CCCCTCTGGG CTGGCGGAGC CCCGGGTGGA GGACTTCGGG

- 182 044115- 182 044115

1651 AACGCCTGGA AGCTGCACGG GGACTGCCAG GACCTGCAGA AGCAGCACAG 1701 CGATCCCTGC GCCCTCAACC CGCGCATGAC CAGGTTCTCC GAGGAGGCGT 1751 GCGCGGTCCT GACGTCCCCC ACATTCGAGG CCTGCCATCG TGCCGTCAGC 1801 CCGCTGCCCT ACCTGCGGAA CTGCCGCTAC GACGTGTGCT CCTGCTCGGA 1851 CGGCCGCGAG TGCCTGTGCG GCGCCCTGGC CAGCTATGCC GCGGCCTGCG 1901 CGGGGAGAGG CGTGCGCGTC GCGTGGCGCG AGCCAGGCCG CTGTGAGCTG 1951 AACTGCCCGA AAGGCCAGGT GTACCTGCAG TGCGGGACCC CCTGCAACCT 2001 GACCTGCCGC TCTCTCTCTT ACCCGGATGA GGA ATGC A AT GAGGCCTGCC 2051 TGGAGGGCTG CTTCTGCCCC CCAGGGCTCT ACATGGATGA GAGGGGGGAC 2101 TGCGTGCCCA AGGCCCAGTG CCCCTGTTAC TATGACGGTG AGATCTTCCA 2151 GCCAG AAGAC ATCTTCTC AG ACC АТС AC AC C ATGTGCT AC TGTGAGGATG 2201 GCTTCATGCA CTGTACCATG AGTGGAGTCC CCGGAAGCTT GCTGCCTGAC 2251 GCTGTCCTCA GCAGTCCCCT GTCTCATCGC AGCAAAAGGA GCCTATCCTG 2301 TCGGCCCCCC ATGGTCAAGC TGGTGTGTCC CGCTGACAAC CTGCGGGCTG 2351 A AGGGCTCGA GTGT ACC A A A ACGTGCC AGA ACT ATGACCT GGAGTGC ATG 2401 AGCATGGGCT GTGTCTCTGG CTGCCTCTGC CCCCCGGGCA TGGTCCGGCA 2451 TGAGAACAGA TGTGTGGCCC TGGAAAGGTG TCCCTGCTTC CATCAGGGCA 2501 AGGAGTATGC CCCTGGAGAA ACAGTGAAGA TTGGCTGCAA CACTTGTGTC 2551 TGTCGGGACC GGAAGTGGAA CTGCACAGAC CATGTGTGTG ATGCCACGTG 2601 CTCCACGATC GGCATGGCCC ACTACCTCAC CTTCGACGGG CTCAAATACC 2651 TGTTCCCCGG GGAGTGCCAG TACGTTCTGG TGCAGGATTA CTGCGGCAGT 2701 AACCCTGGGA CCTTTCGGAT CCTAGTGGGG AATAAGGGAT GCAGCCACCC 2751 CTCAGTGAAA TGCAAGAAAC GGGTCACCAT CCTGGTGGAG GGAGGAGAGA 2801 TTGAGCTGTT TGACGGGGAG GTGAATGTGA AGAGGCCCAT GAAGGATGAG 2851 ACTCACTTTG AGGTGGTGGA GTCTGGCCGG TACATCATTC TGCTGCTGGG 2901 CAAAGCCCTC TCCGTGGTCT GGGACCGCCA CCTGAGCАТС TCCGTGGTCC 2951 TGAAGCAGAC ATACCAGGAG AAAGTGTGTG GCCTGTGTGG GAATTTTGAT 3001 GGCATCCAGA АСАATGACCT CACCAGCAGC AACCTCCAAG TGGAGGAAGA 3051 CCCTGTGGAC TTTGGGAACT CCTGGAAAGT GAGCTCGCAG TGTGCTGACA 3101 CC AGA AA AGT GCCTCTGGAC TC ATCCCCTG CC ACCTGCC А ТА AC A AC АТС 3151 ATGAAGCAGA CGATGGTGGA TTCCTCCTGT AGAATCCTTA CCAGTGACGT 3201 CTTCCAGGAC TGCAACAAGC TGGTGGACCC CGAGCCATAT CTGGATGTCT 3251 GCATTTACGA CACCTGCTCC TGTGAGTCCA TTGGGGACTG CGCCGCATTC 3301 TGCGACACCA TTGCTGCCTA TGCCCACGTG TGTGCCCAGC ATGGCAAGGT 3351 GGTGACCTGG AGGACGGCCA CATTGTGCCC CCAGAGCTGC GAGGAGAGGA 3401 ATCTCCGGGA GAACGGGTAT GAGGCTGAGT GGCGCTATAA CAGCTGTGCA 3451 CCTGCCTGTC AAGTCACGTG TCAGCACCCT GAGCCACTGG CCTGCCCTGT 3501 GCAGTGTGTG GAGGGCTGCC ATGCCCACTG CCCTCCAGGG AAAATCCTGG1651 AACGCCTGGA AGCTGCACGG GGACTGCCAG GACCTGCAGA AGCAGCACAG 1701 CGATCCCTGC GCCCTCAACC CGCGCATGAC CAGGTTCTCC GAGGAGGCGT 1751 GCGCGGTCCT GACGTCCCCC ACATTCGAGG CCTGCCATCG TGCCGTCAGC 1801 CCGCTGCCCT ACCTGCGGAA CTGCCGCT AC GACGTGTGCT CCTGCTCGGA 1851 CGGCCGCGAG TGCCTGTGCG GCGCCCTGGC CAGCTATGCC GCGGCCTGCG 1901 CGGGGAGAGG CGTGCGCGTC GCGTGGCGCG AGCCAGGCCG CTGTGAGCTG 1951 AACTGCCCGA AAGGCCAGGT GTACCTGCAG TGCGGGACCC CCTGCAACCT 2001 GACCTGCC GC TCTCTCTCTT ACCCGGATGA GGA ATGC A AT GAGGCCTGCC 2051 TGGAGGGCTG CTTCTGCCCC CCAGGGCTCT ACATGGATGA GAGGGGGGAC 2101 TGCGTGCCCA AGGCCCAGTG CCCCTGTTAC TATGACGGTG AGATCTTCCA 2151 GCCAG AAGAC ATCTTCTC AG ACC ATC AC AC C ATGTGCT AC TGTGAGGATG 2201 GCTTCATGCA CTGTAC CATG AGTGGAGTCC CCGGAAGCTT GCTGCCTGAC 2251 GCTGTCCTCA GCAGTCCCCT GTCTCATCGC AGCAAAAGGA GCCTATCCTG 2301 TCGGCCCCCC ATGGTCAAGC TGGTGTGTCC CGCTGACAAC CTGCGGGCTG 2351 A AGGGCTCGA GTGT ACC A A A ACGTGCC AGA ACT ATGACCT GGAGTGC ATG 2401 AGCATGGGCT GTGTCTCTGG CTGCCTCTGC CCCCCGGGCA TGGTCCGGCA 2451 TGAGAACAGA TGTGTGGCCC TGGAAAGGTG TCCCTGCTTC CATCAGGGCA 2501 AGGAGTATGC CCCTGGAGAA ACAGTGAAGA TTGGCTGCAA CACTTGTGTC 255 1 TGTCGGGACC GGAAGTGGAA CTGCACAGAC CATGTGTGTG ATGCCACGTG 2601 CTCCACGATC GGCATGGCCC ACTACCTCAC CTTCGACGGG CTCAAATACC 2651 TGTTCCCCGG GGAGTGCCAG TACGTTCTGG TGCAGGATTA CTGCGGCAGT 2701 AACCCTGGGA CCTTTCGGAT CCTAGTGGGG AATAAGGG AT GCAGCCACCC 2751 CTCAGTGAAA TGCAAGAAAC GGGTCACCAT CCTGGTGGAG GGAGGAGAGA 2801 TTGAGCTGTT TGACGGGGAG GTGAATGTGA AGAGGCCCAT GAAGGATGAG 2851 ACTCACTTTG AGGTGGTGGA GTCTGGCCGG TACATCATTC TGCTGCTGGG 2901 CAAAGCCCTC TCCGTGGTCT GGGACCGCCA CCTGAGCATTC TCCGTG GTCC 2951 TGAAGCAGAC ATACCAGGAG AAAGTGTGTG GCCTGTGTGG GAATTTTGAT 3001 GGCATCCAGA ACAATGACCT CACCAGCAGC AACCTCCAAG TGGAGGAAGA 3051 CCCTGTGGAC TTTGGGAACT CCTGGAAAGT GAGCTCGCAG TGTGCTGACA 3101 CC AGA AA AGT GCCTCTGG AC TC ATCCCCTG CC ACCTGCC A TA AC A AC ATS 3151 ATGAAGCAGA CGATGGTGGA TTCCTCCTGT AGAATCCTTA CCAGTGACGT 3201 CTTCCAGGAC TGCAACAAGC TGGTGGACCC CGAGCCATAT CTGGATGTCT 3251 GCATTTACGA CACCTGCTCC TGTGAGTCCA TTGGGGACTG CGCCGCATTC 3301 TGCGACACCA TTGC TGCCTA TGCCCACGTG TGTGCCCAGC ATGGCAAGGT 3351 GGTGACCTGG AGGACGGCCA CATTGTGCCC CCAGAGCTGC GAGGAGAGGA 3401 ATCTCCGGGA GAACGGGTAT GAGGCTGAGT GGCGCTATAA CAGCTGTGCA 3451 CCTGCCTGTC AAGTCACGTG TCAGCACCCT GAGCCACTGG CCTGCCCTGT 3 501 GCAGTGTGTG GAGGGCTGCC ATGCCCACTG CCCTCCAGGG AAAATCCTGG

- 183 044115- 183 044115

3551 ATGAGCTTTT GCAGACCTGC GTTGACCCTG AAGACTGTCC AGTGTGTGAG3551 ATGAGCTTTT GCAGACCTGC GTTGACCCTG AAGACTGTCC AGTGTGTGAG

3601 GTGGCTGGCC GGCGTTTTGC CTCAGGAAAG AAAGTCACCT TGAATCCCAG3601 GTGGCTGGCC GGCGTTTTGC CTCAGGAAAG AAAGTCACCT TGAATCCCAG

3651 TGACCCTGAG CACTGCCAGA TTTGCCACTG TGATGTTGTC AACCTCACCT3651 TGACCCTGAG CACTGCCAGA TTTGCCACTG TGATGTTGTC AACCTCACCT

3701 GTGAAGCCTG CCAGGAGCCG ATATCGGGCG CGCCAACАТС AGAGAGCGCC3701 GTGAAGCCTG CCAGGAGCCG ATATCGGGCG CGCCAACATS AGAGAGCGCC

3751 ACCCCTGAAA GTGGTCCCGG GAGCGAGCCA GCCACATCTG GGTCGGAAAC3751 ACCCCTGAAA GTGGTCCCGG GAGCGAGCCA GCCACATCTG GGTCGGAAAC

3801 GCCAGGCACA AGTGAGTCTG CAACTCCCGA GTCCGGACCT GGCTCCGAGC3801 GCCAGGCACA AGTGAGTCTG CAACTCCCGA GTCCGGACCT GGCTCCGAGC

3851 CTGCC ACT AG CGGCTCCGAG ACTCCGGGA A CTTCCGAGAG CGCT AC ACC A3851 CTGCC ACT AG CGGCTCCGAG ACTCCGGGA A CTTCCGAGAG CGCT AC ACC A

3901 GAAAGCGGAC CCGGA ACC AG T ACCGAACCT AGCGAGGGCT CTGCTCCGGG3901 GAAAGCGGAC CCGGA ACC AG T ACCGAACCT AGCGAGGGCT CTGCTCCGGG

3951 CAGCCCAGCC GGCTCTCCTA CATCCACGGA GGAGGGCACT TCCGAATCCG3951 CAGCCCAGCC GGCTCTCCTA CATCCACGGA GGAGGGCACT TCCGAATCCG

4001 CCACCCCGGA GTCAGGGCCA GGATCTGAAC CCGCTACCTC AGGCAGTGAG4001 CCACCCCGGA GTCAGGGCCA GGATCTGAAC CCGCTACCTC AGGCAGTGAG

4051 ACGCCAGGAA CGAGCGAGTC CGCTACACCG GAGAGTGGGC CAGGGAGCCC4051 ACGCCAGGAA CGAGCGAGTC CGCTACACCG GAGAGTGGGC CAGGGAGCCC

4101 TGCTGGATCT CCTACGTCCA CTGAGGAAGG GTCACCAGCG GGCTCGCCCA4101 TGCTGGATCT CCTACGTCCA CTGAGGAAGG GTCACCAGCG GGCTCGCCCA

4151 CC AGC ACTGA AGA AGGTGCC TCGAGCGAC A A A ACTC AC AC ATGCCC ACCG4151 CC AGC ACTGA AGA AGGTGCC TCGAGCGAC A A A ACTC AC AC ATGCCC ACCG

4201 TGCCCAGCTC CAGAACTCCT GGGCGGACCG TCAGTCTTCC TCTTCCCCCC4201 TGCCCAGCTC CAGAACTCCT GGGCGGACCG TCAGTCTTCC TCTTCCCCCC

4251 AAAACCCAAG GACACCCTCA TGATCTCCCG GACCCCTGAG GTCACATGCG4251 AAAACCCAAG GACACCCTCA TGATCTCCCG GACCCTGAG GTCACATGCG

4301 TGGTGGTGGA CGTGAGCCAC GAAGACCCTG AGGTCAAGTT CAACTGGTAC4301 TGGTGGTGGA CGTGAGCCAC GAAGACCCTG AGGTCAAGTT CAACTGGTAC

4351 GTGGACGGCG TGGAGGTGC A T A ATGCC A AG AC A A AGCCGC GGGAGGAGC A4351 GTGGACGGCG TGGAGGTGC A T A ATGCC A AG AC A A AGCCGC GGGAGGAGC A

4401 GT AC AAC AGC ACGT ACCGTG TGGTC AGCGT CCTC ACCGTC CTGC ACC AGG4401 GT AC AAC AGC ACGT ACCGTG TGGTC AGCGT CCTC ACCGTC CTGC ACC AGG

4451 ACTGGCTGAA TGGCAAGGAG TACAAGTGCA AGGTCTCCAA CAAAGCCCTC4451 ACTGGCTGAA TGGCAAGGAG TACAAGTGCA AGGTCTCCAA CAAAGCCCTC

4501 CCAGCCCCCA TCGAGAAAAC CATCTCCAAA GCCAAAGGGC AGCCCCGAGA4501 CCAGCCCCCA TCGAGAAAAC CATCTCCAAA GCCAAAGGGC AGCCCCGAGA

4551 ACC AC AGGTG T AC ACCCTGC CCCC ATCCCG GGATGAGCTG ACC A AGA ACC4551 ACC AC AGGTG T AC ACCCTGC CCCC ATCCCG GGATGAGCTG ACC A AGA ACC

4601 AGGTCAGCCT GACCTGCCTG GTCAAAGGCT TCTATCCCAG CGACATCGCC4601 AGGTCAGCCT GACCTGCCTG GTCAAAGGCT TCTATCCCAG CGACATCGCC

4651 GTGGAGTGGG AGAGCAATGG GCAGCCGGAG AACAACTACA AGACCACGCC4651 GTGGAGTGGG AGAGCAATGG GCAGCCGGAG AACAACTACA AGACCACGCC

4701 TCCCGTGTTG GACTCCGACG GCTCCTTCTT CCTCTACAGC AAGCTCACCG4701 TCCCGTGTTG GACTCCGACG GCTCCTTCTT CCTCTACAGC AAGCTCACCG

4751 TGGACAAGAG CAGGTGGCAG CAGGGGAACG TCTTCTCATG CTCCGTGATG4751 TGGACAAGAG CAGGTGGCAG CAGGGGAACG TCTTCTCATG CTCCGTGATG

4801 CATGAGGCTC TGCACAACCA CTACACGCAG AAGAGCCTCT CCCTGTCTCC4801 CATGAGGCTC TGCACAACCA CTACACGCAG AAGAGCCTCT CCCTGTCTCC

4851 GGGTAAATGA4851 GGGTAAAATGA

Последовательность белка pSYN ФВ062 (ФВ D'D3-Fc без сайта тромбина в линкере) (SEQ ID NO: 199).Protein sequence of pSYN VWF062 (VWF D'D3-Fc without thrombin site in linker) (SEQ ID NO: 199).

MIPARFAGVL LALALILPGT LCAEGTRGRS STARCSLFGS DFVNTFDGSMMIPARFAGVL LALALILPGT LCAEGTRGRS STARCSLFGS DFVNTFDGSM

YSFAGYCSYL LAGGCQKRSF SIIGDFQNGK RVSLSVYLGE FFDIHLFVNGYSFAGYCSYL LAGGCQKRSF SIIGDFQNGK RVSLSVYLGE FFDIHLFVNG

101 TVTQGDQRVS MPYASKGLYL ETEAGYYKLS GEAYGFVARI DGSGNFQVLL101 TVTQGDQRVS MPYASKGLYL ETEAGYYKLS GEAYGFVARI DGSGNFQVLL

151 SDRYFNKTCG LCGNFNIFAE DDFMTQEGTL TSDPYDFANS WALSSGEQWC151 SDRYFNKTCG LCGNFNIFAE DDFMTQEGTL TSDPYDFANS WALSSGEQWC

201 ERASPPSSSC NISSGEMQKG LWEQCQLLKS TSVFARCHPL VDPEPFVALC201 ERASPPSSSC NISSGEMQKG LWEQCQLLKS TSVFARCHPL VDPEPFVALC

251 EKTLCECAGG LECACPALLE YARTCAQEGM VLYGWTDHSA CSPVCPAGME251 EKTLCECAGG LECACPALLE YARTCAQEGM VLYGWTDHSA CSPVCPAGME

- 184 044115- 184 044115

301 YRQCVSPCAR TCQSLHINEM CQERCVDGCS CPEGQLLDEG LCVESTECPC301 YRQCVSPCAR TCQSLHINEM CQERCVDGCS CPEGQLLDEG LCVESTECPC

351 VHSGKRYPPG TSLSRDCNTC ICRNSQWICS NEECPGECLV TGQSHFKSFD351 VHSGKRYPPG TSLSRDCNTC ICRNSQWICS NEECPGECLV TGQSHFKSFD

401 NRYFTFSGIC QYLLARDCQD HSFSIVIETV QCADDRDAVC TRSVTVRLPG401 NRYFTFSGIC QYLLARDCQD HSFSIVIETV QCADDRDAVC TRSVTVRLPG

451 LHNSLVKLKH GAGVAMDGQD IQLPLLKGDL RIQHTVTASV RLSYGEDLQM451 LHNSLVKLKH GAGVAMDGQD IQLPLLKGDL RIQHTVTASV RLSYGEDLQM

501 DWDGRGRLLV KLSPVYAGKT CGLCGNYNGN QGDDFLTPSG LAEPRVEDFG501 DWDGRGRLLV KLSPVYAGKT CGLCGNYNGN QGDDFLTPSG LAEPRVEDFG

551 NAWKLHGDCQ DLQKQHSDPC ALNPRMTRFS EEACAVLTSP TFEACHRAVS551 NAWKLHGDCQ DLQKQHSDPC ALNPRMTRFS EEACAVLTSP TFEACHRAVS

601 PLPYLRNCRY DVCSCSDGRE CLCGALASYA AACAGRGVRV AWREPGRCEL601 PLPYLRNCRY DVCSCSDGRE CLCGALASYA AACAGRGVRV AWREPGRCEL

651 NCPKGQVYLQ CGTPCNLTCR SLSYPDEECN EACLEGCFCP PGLYMDERGD651 NCPKGQVYLQ CGTPCNLTCR SLSYPDEECN EACLEGCFCP PGLYMDERGD

701 CVPKAQCPCY YDGEIFQPED IFSDHHTMCY CEDGFMHCTM SGVPGSLLPD701 CVPKAQCPCY YDGEIFQPED IFSDHHTMCY CEDGFMHCTM SGVPGSLLPD

751 AVLSSPLSHR SKRSLSCRPP MVKLVCPADN LRAEGLECTK TCQNYDLECM751 AVLSSPLSHR SKRSLSCRPP MVKLVCPADN LRAEGLECTK TCQNYDLECM

801 SMGCVSGCLC PPGMVRHENR CVALERCPCF HQGKEYAPGE TVKIGCNTCV801 SMGCVSGCLC PPGMVRHENR CVALERCPCF HQGKEYAPGE TVKIGCNTCV

851 CRDRKWNCTD HVCDATCSTI GMAHYLTFDG LKYLFPGECQ YVLVQDYCGS851 CRDRKWNCTD HVCDATCSTI GMAHYLTFDG LKYLFPGECQ YVLVQDYCGS

901 NPGTFRILVG NKGCSHPS VK CKKRVTILVE GGEIELFDGE VNVKRPMKDE901 NPGTFRILVG NKGCSHPS VK CKKRVTILVE GGEIELFDGE VNVKRPMKDE

951 THFEVVESGR YIILLLGKAL SVVWDRHLSI SVVLKQTYQE KVCGLCGNFD951 THFEVVESGR YIILLLGKAL SVVWDRHLSI SVVLKQTYQE KVCGLCGNFD

1001 GIQNNDLTSS NLQVEEDPVD FGNSWKVSSQ CADTRKVPLD SSPATCHNNI1001 GIQNNDLTSS NLQVEEDPVD FGNSWKVSSQ CADTRKVPLD SSPATCHNNI

1051 MKQTMVDSSC RILTSDVFQD CNKLVDPEPY LDVCIYDTCS CESIGDCAAF1051 MKQTMVDSSC RILTSDVFQD CNKLVDPEPY LDVCIYDTCS CESIGDCAAF

1101 CDTIAAYAHV CAQHGKVVTW RTATLCPQSC EERNLRENGY EAEWRYNSCA1101 CDTIAAYAHV CAQHGKVVTW RTATLCPQSC EERNLRENGY EAEWRYNSCA

1151 PACQVTCQHP EPLACPVQCV EGCHAHCPPG KILDELLQTC VDPEDCPVCE1151 PACQVTCQHP EPLACPVQCV EGCHAHCPPG KILDELLQTC VDPEDCPVCE

1201 VAGRRFASGK KVTLNPSDPE HCQICHCDVV NLTCEACQEPISGAPTSESA1201 VAGRRFASGK KVTLNPSDPE HCQICHCDVV NLTCEACQEPISGAPTSESA

1251 TPESGPGSEP ATSGSETPGT SESATPESGP GSEPATSGSE TPGTSESATP1251 TPESGPGSEP ATSGSETPGT SESATPESGP GSEPATSGSE TPGTSESATP

1301 ESGPGTSTEP SEGSAPGSPA GSPTSTEEGT SESATPESGP GSEPATSGSE1301 ESGPGTSTEP SEGSAPGSPA GSPTSTEEGT SESATPESGP GSEPATSGSE

1351 TPGTSESATP ESGPGSPAGS PTSTEEGSPA GSPTSTEEGA SSDKTHTCPP1351 TPGTSESATP ESGPGSPAGS PTSTEEGSPA GSPTSTEEGA SSDKTHTCPP

1401 CPAPELLGGP SVFLFPPKPK DTLMISRTPE VTCVVVDVSH EDPEVKFNWY1401 CPAPELLGGP SVFLFPPKPK DTLMISRTPE VTCVVVDVSH EDPEVKFNWY

1451 VDGVEVHNAK TKPREEQYNS TYRVVSVLTV LHQDWLNGKE YKCKVSNKAL1451 VDGVEVHNAK TKPREEQYNS TYRVVSVLTV LHQDWLNGKE YKCKVSNKAL

1501 PAPIEKTISK AKGQPREPQV YTLPPSRDEL TKNQVSLTCL VKGFYPSDIA1501 PAPIEKTISK AKGQPREPQV YTLPPSRDEL TKNQVSLTCL VKGFYPSDIA

1551 VEWESNGQPE NNYKTTPPVL DSDGSFFLYS KLTVDKSRWQ QGNVFSCSVM1551 VEWESNGQPE NNYKTTPPVL DSDGSFFLYS KLTVDKSRWQ QGNVFSCSVM

1601 HEALHNHYTQ KSLSLSPGK*1601 HEALHNHYTQ KSLSLSPGK*

Нуклеотидная последовательность pSYN ФВ073 (кодирующая ФВ D1D2D'D3 - 144 AE XTENукороченный а2 сайта тромбина FVIII-Fc) (SEQ ID NO: 174).Nucleotide sequence of pSYN VWF073 (encoding VWF D1D2D'D3 - 144 AE XTEN shortened a2 thrombin site FVIII-Fc) (SEQ ID NO: 174).

ATGATTCCTG CCAGATTTGC CGGGGTGCTG CTTGCTCTGG CCCTCATTTTATGATTCCTG CCAGATTTGC CGGGGTGCTG CTTGCTCTGG CCCTCATTTT

151 GCCAGGGACC CTTTGTGCAG AAGGAACTCG CGGCAGGTCA TCCACGGCCC151 GCCAGGGACC CTTTGTGCAG AAGGAACTCG CGGCAGGTCA TCCACGGCCC

101 GATGCAGCCT TTTCGGAAGT GACTTCGTCA ACACCTTTGA TGGGAGCATG101 GATGCAGCCT TTTCGGAAGT GACTTCGTCA ACACCTTTGA TGGGAGCATG

151 TACAGCTTTG CGGGATACTG CAGTTACCTC CTGGCAGGGG GCTGCCAGAA151 TACAGCTTTG CGGGATACTG CAGTTACCTC CTGGCAGGGG GCTGCCAGAA

201 ACGCTCCTTC TCGATT ATTG GGGACTTCC A GA ATGGC A AG AGAGTG AGCC201 ACGCTCCTTC TCGATT ATTG GGGACTTCC A GA ATGGC A AG AGAGTG AGCC

251 TCTCCGTGTA TCTTGGGGAA TTTTTTGACA TCCATTTGTT TGTCAATGGT251 TCTCCGTGTA TCTTGGGGAA TTTTTTGACA TCCATTTGTT TGTCAATGGT

- 185 044115- 185 044115

301 ACCGTGACAC AGGGGGACCA AAGAGTCTCC ATGCCCTATG CCTCCAAAGG301 ACCGTGACAC AGGGGGACCA AAGAGTCTCC ATGCCCTATG CCTCCAAAGG

351 GCTGTATCTA GAAACTGAGG CTGGGTACTA CAAGCTGTCC GGTGAGGCCT351 GCTGTATCTA GAAACTGAGG CTGGGTACTA CAAGCTGTCC GGTGAGGCCT

401 ATGGCTTTGT GGCCAGGATC GATGGCAGCG GCAACTTTCA AGTCCTGCTG401 ATGGCTTTGT GGCCAGGATC GATGGCAGCG GCAACTTTCA AGTCCTGCTG

451 TCAGACAGAT ACTTCAACAA GACCTGCGGG CTGTGTGGCA ACTTTAACAT451 TCAGACAGAT ACTTCAACAA GACCTGCGGG CTGTGTGGCA ACTTTAACAT

501 CTTTGCTGAA GATGACTTT A TGACCC AAGA AGGGACCTTG ACCTCGGACC501 CTTTGCTGAA GATGACTTT A TGACCC AAGA AGGGACCTTG ACCTCGGACC

551 CTTATGACTT TGCCAACTCA TGGGCTCTGA GCAGTGGAGA ACAGTGGTGT 601 GA ACGGGC AT CTCCTCCC AG C AGCTC ATGC A AC ATCTCCT CTGGGGA A AT551 CTTATGACTT TGCCAACTCA TGGGCTCTGA GCAGTGGAGA ACAGTGGTGT 601 GA ACGGGC AT CTCCTCCC AG C AGCTC ATGC A AC ATCTCCT CTGGGGA A AT

651 GCAGAAGGGC CTGTGGGAGC AGTGCCAGCT TCTGAAGAGC ACCTCGGTGT 701 TTGCCCGCTG CCACCCTCTG GTGGACCCCG AGCCTTTTGT GGCCCTGTGT651 GCAGAAGGGC CTGTGGGAGC AGTGCCAGCT TCTGAAGAGC ACCTCGGTGT 701 TTGCCCGCTG CCACCCTCTG GTGGACCCCG AGCCTTTTGT GGCCCTGTGT

751 GAGAAGACTT TGTGTGAGTG TGCTGGGGGG CTGGAGTGCG CCTGCCCTGC751 GAGAAGACTT TGTGTGAGTG TGCTGGGGGG CTGGAGTGCG CCTGCCCTGC

801 CCTCCTGGAG T ACGCCCGGA CCTGTGCCC A GGAGGGAATG GTGCTGT ACG801 CCTCCTGGAG T ACGCCCGGA CCTGTGCCC A GGAGGGAATG GTGCTGT ACG

851 GCTGGACCGA CCACAGCGCG TGCAGCCCAG TGTGCCCTGC TGGTATGGAG 901 T AT AGGC AGT GTGTGTCCCC TTGCGCC AGG ACCTGCC AGA GCCTGC AC AT851 GCTGGACCGA CCACAGCGCG TGCAGCCCAG TGTGCCCTGC TGGTATGGAG 901 T AT AGGC AGT GTGTGTCCCC TTGCGCC AGG ACCTGCC AGA GCCTGC AC AT

951 CAATGAAATG TGTCAGGAGC GATGCGTGGA TGGCTGCAGC TGCCCTGAGG 1001 GACAGCTCCT GGATGAAGGC CTCTGCGTGG AGAGCACCGA GTGTCCCTGC 1051 GTGCATTCCG GAAAGCGCTA CCCTCCCGGC ACCTCCCTCT CTCGAGACTG 1101 C A AC ACCTGC ATTTGCCGA A AC AGCC AGTG GATCTGC AGC A ATGA AGA AT 1151 GTCCAGGGGA GTGCCTTGTC ACTGGTCAAT CCCACTTCAA GAGCTTTGAC 1201 A AC AGAT ACT TC ACCTTC AG TGGGATCTGC C AGT ACCTGC TGGCCCGGGA 1251 TTGCCAGGAC СACTCCTTCT CCATTGTCAT TGAGACTGTC CAGTGTGCTG 1301 ATGACCGCGA CGCTGTGTGC ACCCGCTCCG TCACCGTCCG GCTGCCTGGC 1351 CTGC AC A AC A GCCTTGTGA A ACTGA AGC AT GGGGC AGG AG TTGCC ATGGA 1401 TGGCCAGGAC ATCCAGCTCC CCCTCCTGAA AGGTGACCTC CGCATCCAGC 1451 ATACAGTGAC GGCCTCCGTG CGCCTCAGCT ACGGGGAGGA CCTGCAGATG 1501 GACTGGGATG GCCGCGGGAG GCTGCTGGTG AAGCTGTCCC CCGTCTATGC 1551 CGGGA AGACC TGCGGCCTGT GTGGGA ATT A C A ATGGC A AC C AGGGCGACG 1601 ACTTCCTTAC CCCCTCTGGG CTGGCGGAGC CCCGGGTGGA GGACTTCGGG 1651 AACGCCTGGA AGCTGCACGG GGACTGCCAG GACCTGCAGA AGCAGCACAG 1701 CGATCCCTGC GCCCTCAACC CGCGCATGAC CAGGTTCTCC GAGGAGGCGT 1751 GCGCGGTCCT GACGTCCCCC ACATTCGAGG CCTGCCATCG TGCCGTCAGC 1801 CCGCTGCCCT ACCTGCGGAA CTGCCGCTAC GACGTGTGCT CCTGCTCGGA 1851 CGGCCGCGAG TGCCTGTGCG GCGCCCTGGC CAGCTATGCC GCGGCCTGCG 1901 CGGGGAGAGG CGTGCGCGTC GCGTGGCGCG AGCCAGGCCG CTGTGAGCTG 1951 AACTGCCCGA AAGGCCAGGT GTACCTGCAG TGCGGGACCC CCTGCAACCT 2001 GACCTGCCGC TCTCTCTCTT ACCCGGATGA GGA ATGC A AT GAGGCCTGCC 2051 TGGAGGGCTG CTTCTGCCCC CCAGGGCTCT ACATGGATGA GAGGGGGGAC 2101 TGCGTGCCCA AGGCCCAGTG CCCCTGTTAC TATGACGGTG AGATCTTCCA 2151 GCC AG AAGAC ATCTTCTC AG ACC АТС AC AC C ATGTGCT AC TGTGAGGATG951 CAATGAAATG TGTCAGGAGC GATGCGTGGA TGGCTGCAGC TGCCCTGAGG 1001 GACAGCTCCT GGATGAAGGC CTCTGCGTGG AGAGCACCGA GTGTCCCTGC 1051 GTGCATTCCG GAAAGCGCTA CCCTCCCGGC ACCTCCCTCT CTCGAGACTG 1101 C A AC ACCTGC ATTTGCCGA A AC AGCC AG TG GATCTGC AGC A ATGA AGA AT 1151 GTCCAGGGGA GTGCCTTGTC ACTGGTCAAT CCCACTTCAA GAGCTTTGAC 1201 A AC AGAT ACT TC ACCTTC AG TGGGATCTGC C AGT ACCTGC TGGCCCGGGA 1251 TTGCCAGGAC СACTCCTTCT CCATTGTCAT TGAGACTGTC CAGTGTGCTG 1301 ATGACCGCGA CGCTGTGTGC ACCCGCTCCG TCACCGTCCG GCTGCCTGGC 1351 CTGC AC A AC A GCCTTGTGA A ACTGA AGC AT GGGGC AGG AG TTGCC ATGGA 1401 TGGCCA GGAC ATCCAGCTCC CCCTCCTGAA AGGTGACCTC CGCATCCAGC 1451 ATACAGTGAC GGCCTCCGTG CGCCTCAGCT ACGGGGAGGA CCTGCAGATG 1501 GACTGGGATG GCCGCGGGAG GCTGCTGGTG AAGCTGTCCC CCGTCTATGC 1551 CGGGA AGACC TGCGGCCTGT GTGGGA ATT A C A ATGGC A AC C AGGGCGACG 1601 ACTTCCTTAC CCCCTCTGGG CTGGCGGAGC CCCGGGTGGA GGACTTCGGG 1651 AACGCCTGGA AGCTGCACGG GGACTGCCAG GACCTGCAGA AGCAGCACAG 1701 CGATCCCTGC GCCCTCAACC CGCGCATGAC CAGGTTCT CC GAGGAGGCGT 1751 GCGCGGTCCT GACGTCCCCC ACATTCGAGG CCTGCCATCG TGCCGTCAGC 1801 CCGCTGCCCT ACCTGCGGAA CTGCCGCTAC GACGTGTGCT CCTGCTCGGA 1851 CGGCCGCGAG TGCCTGTGCG GCGCCCTGGC CAGCTATGCC GCGGCCTGCG 1901 CGGGGAGAGG CGTGCGCGTC GCGTGGCGCG AGCCAGGCCG CTGTGAGCTG 1951 AACTGCCCGA AAGGCCAGGT GTACCTGCAG TGCGGGACCC CCTGCAACCT 2001 GACCTGCCGC TCTCTCTCTT ACCCGGATGA GGA ATGC A AT GAGGCCTGCC 2051 TGGAGGGCTG CTTCTGCCCC CCAGGGCTCT ACATGGATGA GAGGGGGGAC 2101 TGCGTGCCCA AGGCCCAGTG CCCCTGTTAC TATGACGGTG AGATCTTCCA 2151 GCC AG AAGAC ATCTTCTC AG ACC ATC AC AC C ATGTGCT AC TGTGAGGATG

- 186 044115- 186 044115

2201 GCTTCATGCA CTGTACCATG AGTGGAGTCC CCGGAAGCTT GCTGCCTGAC 2251 GCTGTCCTCA GCAGTCCCCT GTCTCATCGC AGCAAAAGGA GCCTATCCTG 2301 TCGGCCCCCC ATGGTCAAGC TGGTGTGTCC CGCTGACAAC CTGCGGGCTG 23 51 AAGGGCTCGA GTGT ACC AAA ACGTGCCAGA ACTATGACCT GGAGTGC ATG 2401 AGCATGGGCT GTGTCTCTGG CTGCCTCTGC CCCCCGGGCA TGGTCCGGCA 2451 TGAGAACAGA TGTGTGGCCC TGGAAAGGTG TCCCTGCTTC CATCAGGGCA 2501 AGGAGTATGC CCCTGGAGAA ACAGTGAAGA TTGGCTGCAA CACTTGTGTC2201 GCTTCATGCA CTGTACCATG AGTGGAGTCC CCGGAAGCTT GCTGCCTGAC 2251 GCTGTCCTCA GCAGTCCCCT GTCTCATCGC AGCAAAAGGA GCCTATCCTG 2301 TCGGCCCCCC ATGGTCAAGC TGGTGTGTCC CGCTGACAAC CTGCGGGCTG 23 51 AAGGGCTCGA GTGT ACC AAA ACG TGCCAGA ACTATGACCT GGAGTGC ATG 2401 AGCATGGGCT GTGTCTCTGG CTGCCTCTGC CCCCCGGGCA TGGTCCGGCA 2451 TGAGACAGA TGTGTGGCCC TGGAAAGGTG TCCCTGCTTC CATCAGGGCA 2501 AGGAGTATGC CCCTGGAGAA ACAGTGAAGA TTGGCTGCAA CACTTGTGTC

2551 TGTCGGGACC GGAAGTGGAA CTGCACAGAC CATGTGTGTG ATGCCACGTG 2601 CTCCACGATC GGCATGGCCC ACTACCTCAC CTTCGACGGG CTCAAATACC 2651 TGTTCCCCGG GGAGTGCCAG TACGTTCTGG TGCAGGATTA CTGCGGCAGT 2701 AACCCTGGGA CCTTTCGGAT CCTAGTGGGG AATAAGGGAT GCAGCCACCC 2751 CTCAGTGAAA TGCAAGAAAC GGGTCACCAT CCTGGTGGAG GGAGGAGAGA 2801 TTGAGCTGTT TGACGGGGAG GTGAATGTGA AGAGGCCCAT GAAGGATGAG 2851 ACTCACTTTG AGGTGGTGGA GTCTGGCCGG TACATCATTC TGCTGCTGGG 2901 CAAAGCCCTC TCCGTGGTCT GGGACCGCCA CCTGAGCATC TCCGTGGTCC 2951 TGAAGCAGAC ATACCAGGAG AAAGTGTGTG GCCTGTGTGG GAATTTTGAT2551 TGTCGGGACC GGAAGTGGAA CTGCACAGAC CATGTGTG ATGCCACGTG 2601 CTCCACGATC GGCATGGCCC ACTACCTCAC CTTCGACGGG CTCAAATACC 2651 TGTTCCCCGG GGAGTGCCAG TACGTTCTGG TGCAGGATTA CTGCGGCAGT 2701 AACCCTGGGA CCTTTCGGAT CCTAGTGG GG AATAAGGGAT GCAGCCACCC 2751 CTCAGTGAAA TGCAAGAAAC GGGTCACCAT CCTGGTGGAG GGAGGAGAGA 2801 TTGAGCTGTT TGACGGGGAG GTGAATGTGA AGAGGCCCAT GAAGGATGAG 2851 ACTCACTTTG AGGTGGTGGA GTCTGGCCGG TACATCATTC TGCTGCTGGG 2901 CAAAGCCCTC TC CGTGGTCT GGGACCGCCA CCTGAGCATC TCCGTGGTCC 2951 TGAAGCAGAC ATACCAGGAG AAAGTGTGTG GCCTGTGTGG GAATTTTGAT

3001 GGCATCCAGA АСАATGACCT CACCAGCAGC AACCTCCAAG TGGAGGAAGA 3051 CCCTGTGGAC TTTGGGAACT CCTGGAAAGT GAGCTCGCAG TGTGCTGACA3001 GGCATCCAGA ACAATGACCT CACCAGCAGC AACCTCCAAG TGGAGGAAGA 3051 CCCTGTGGAC TTTGGGAACT CCTGGAAAGT GAGCTCGCAG TGTGCTGACA

3101 CCAGA AAAGT GCCTCTGGAC TC ATCCCCTG CC ACCTGCC А ТА AC A AC АТС 3151 ATGAAGCAGA CGATGGTGGA TTCCTCCTGT AGAATCCTTA CCAGTGACGT 3201 CTTCCAGGAC TGCAACAAGC TGGTGGACCC CGAGCCATAT CTGGATGTCT3101 CCAGA AAAGT GCCTCTGGAC TC ATCCCCTG CC ACCTGCC A TA AC A AC ATS 3151 ATGAAGCAGA CGATGGTGGA TTCCTCCTGT AGAATCCTTA CCAGTGACGT 3201 CTTCCAGGAC TGCAACAAGC TGGTGGACCC CGAGCCATAT CTGGATGTCT

3251 GCATTTACGA CACCTGCTCC TGTGAGTCCA TTGGGGACTG CGCCGCATTC 3301 TGCGACACCA TTGCTGCCTA TGCCCACGTG TGTGCCCAGC ATGGCAAGGT3251 GCATTTACGA CACCTGCTCC TGTGAGTCCA TTGGGGACTG CGCCGCATTC 3301 TGCGACACCA TTGCTGCCTA TGCCCACGTG TGTGCCCAGC ATGGCAAGGT

3351 GGTGACCTGG AGGACGGCCA CATTGTGCCC CCAGAGCTGC GAGGAGAGGA 3401 ATCTCCGGGA GAACGGGTAT GAGGCTGAGT GGCGCTATAA CAGCTGTGCA 3451 CCTGCCTGTC AAGTCACGTG TCAGCACCCT GAGCCACTGG CCTGCCCTGT 3501 GCAGTGTGTG GAGGGCTGCC ATGCCCACTG CCCTCCAGGG AAAATCCTGG 3551 ATGAGCTTTT GCAGACCTGC GTTGACCCTG AAGACTGTCC AGTGTGTGAG 3601 GTGGCTGGCC GGCGTTTTGC CTCAGGAAAG AAAGTCACCT TGAATCCCAG 3651 TGACCCTGAG CACTGCCAGA TTTGCCACTG TGATGTTGTC AACCTCACCT3351 GGTGACCTGG AGGACGGCCA CATTGTGCCC CCAGAGCTGC GAGGAGAGGA 3401 ATCTCCGGGA GAACGGGTAT GAGGCTGAGT GGCGCTATAA CAGCTGTGCA 3451 CCTGCCTGTC AAGTCACGTG TCAGCACCCT GAGCCACTGG CCTGCCCTGT 3501 GCAGTGTGTG GAGGGCTGCC ATGCCCACTG CCCTCCAGGG AAAATCCTGG 3551 ATGAGCTTTT GCAGACCCTGC GTTGACCCTG AAGACTGTCC AGTGTGTGAG 3601 GTGGCTGGCC GGCGTTTTGC CTCAGGAAAG AAAGTCACCT TGAATCCCAG 3651 TGACCCTGAG CACTGCCAGA TTTGCCACTG TGATGTTGTC AACCTCACCT

3701 GTGAAGCCTG CC AGGAGCCG GGCGCGCC AA С АТС AGAGAG CGCC ACCCCT 3751 GAAAGTGGTC CCGGGAGCGA GCCAGCCACA TCTGGGTCGG AAACGCCAGG3701 GTGAAGCCTG CC AGGAGCCG GGCGCGCC AA WITH ATC AGAGAG CGCC ACCCCT 3751 GAAAGTGGTC CCGGGAGCGA GCCAGCCACA TCTGGGTCGG AAACGCCAGG

3801 CACAAGTGAG TCTGCAACTC CCGAGTCCGG ACCTGGCTCC GAGCCTGCCA 3851 CT AGCGGCTC CGAGACTCCG GGA ACTTCCG AGAGCGCT AC ACC AG AA AGC 3901 GGACCCGGAA CCAGTACCGA ACCTAGCGAG GGCTCTGCTC CGGGCAGCCC 3951 AGCCGGCTCT CCTACATCCA CGGAGGAGGG CACTTCCGAA TCCGCCACCC 4001 CGGAGTCAGG GCCAGGATCT GAACCCGCTA CCTCAGGCAG TGAGACGCCA 4051 GGAACGAGCG AGTCCGCTAC ACCGGAGAGT GGGCCAGGGA GCCCTGCTGG3801 CACAAGTGAG TCTGCAACTC CCGAGTCCGG ACCTGGCTCC GAGCCTGCCA 3851 CT AGCGGCTC CGAGACTCCG GGA ACTTCCG AGAGCGCT AC ACC AG AA AGC 3901 GGACCCGGAA CCAGTACCGA ACCTAGCGAG GGCTCTGCTC CGGGCAGCCC 3951 AGCCGGCTCT CCTACATCCA CGGA GGAGGG CACTTCCGAA TCCGCCACCC 4001 CGGAGTCAGG GCCAGGATCT GAACCCGCTA CCTCAGGCAG TGAGACGCCA 4051 GGAACGAGCG AGTCCGCTAC ACCGGAGAGT GGGCCAGGGA GCCCTGCTGG

- 187 044115- 187 044115

4101 ATCTCCTACG TCCACTGAGG AAGGGTCACC AGCGGGCTCG CCCACCAGCA4101 ATCTCCTACG TCCACTGAGG AAGGGTCACC AGCGGGCTCG CCCACCAGCA

4151 CTG A AG AAGG TGCCTCGAGC GGCGGTGGAG GATCCGGTGG CGGGGGATCC4151 CTG A AG AAGG TGCCTCGAGC GGCGGTGGAG GATCCGGTGG CGGGGGATCC

4201 GGTGGCGGGG GATCCGGTGG CGGGGGATCC GGTGGCGGGG GATCCGGTGG4201 GGTGGCGGGG GATCCGGTGG CGGGGGATCC GGTGGCGGGG GATCCGGTGG

4251 CGGGGGATCC ATTGAACCAA GAAGCTTCTC TGGCAGCGGA GGCGACAAAA4251 CGGGGGATCC ATTGAACCAA GAAGCTTCTC TGGCAGCGGA GGCGACAAAA

4301 CTCACACATG CCCACCGTGC CCAGCTCCAG AACTCCTGGG CGGACCGTCA4301 CTCACACATG CCCACCGTGC CCAGCTCCAG AACTCCTGGG CGGACCGTCA

4351 GTCTTCCTCT TCCCCCC A A A ACCC A AGGAC ACCCTC ATGA TCTCCCGG AC4351 GTCTTCCTCT TCCCCCC A A A ACCC A AGGAC ACCCTC ATGA TCTCCCGG AC

4401 CCCTGAGGTC ACATGCGTGG TGGTGGACGT GAGCCACGAA GACCCTGAGG4401 CCCTGAGGTC ACATGCGTGG TGGTGGACGT GAGCCACGAA GACCCTGAGG

4451 TCAAGTTCAA CTGGTACGTG GACGGCGTGG AGGTGCATAA TGCCAAGACA4451 TCAAGTTCAA CTGGTACGTG GACGGCGTGG AGGTGCATAA TGCCAAGACA

4501 AAGCCGCGGG AGGAGCAGTA CAACAGCACG TACCGTGTGG TCAGCGTCCT4501 AAGCCGCGGG AGGAGCAGTA CAACAGCACG TACCGTGTGG TCAGCGTCCT

4551 CACCGTCCTG CACCAGGACT GGCTGAATGG CAAGGAGTAC AAGTGCAAGG4551 CACCGTCCTG CACCAGGACT GGCTGAATGG CAAGGAGTAC AAGTGCAAGG

4601 TCTCCAACAA AGCCCTCCCA GCCCCCATCG AGAAAACCAT CTCCAAAGCC4601 TCTCCAACAA AGCCCTCCCA GCCCCCATCG AGAAAACCAT CTCCAAAGCC

4651 AAAGGGCAGC CCCGAGAACC ACAGGTGTAC ACCCTGCCCC CATCCCGGGA4651 AAAGGGCAGC CCCGAGAACC ACAGGTGTAC ACCCTGCCCC CATCCCGGGA

4701 TGAGCTGACC AAGAACCAGG TCAGCCTGAC CTGCCTGGTC AAAGGCTTCT4701 TGAGCTGACC AAGAACCAGG TCAGCCTGAC CTGCCTGGTC AAAGGCTTCT

4751 ATCCCAGCGA CATCGCCGTG GAGTGGGAGA GCAATGGGCA GCCGGAGAAC4751 ATCCCAGCGA CATCGCCGTG GAGTGGGAGA GCAATGGGCA GCCGGAGAAC

4801 AACTACAAGA CCACGCCTCC CGTGTTGGAC TCCGACGGCT CCTTCTTCCT4801 AACTACAAGA CCACGCCTCC CGTGTTGGAC TCCGACGGCT CCTTCTTCCT

4851 CTACAGC AAG CTC ACCGTGG AC AAGAGCAG GTGGC AGCAG GGGAACGTCT4851 CTACAGC AAG CTC ACCGTGG AC AAGAGCAG GTGGC AGCAG GGGAACGTCT

4901 TCTCATGCTC CGTGATGC AT GAGGCTCTGC AC AACC ACT A C ACGC AGAAG4901 TCTCATGCTC CGTGATGC AT GAGGCTCTGC AC AACC ACT A C ACGC AGAAG

4951 AGCCTCTCCC TGTCTCCGGG TAAATGA4951 AGCCTCTCCC TGTCTCCGGG TAAATGA

Последовательность белка pSYN ФВ073 (ФВ D1D2D'D3- 144 AE XTEN- укороченный а2 сайта тромбина-Fc) (SEO ID NO:175).Protein sequence pSYN VWF073 (VWF D1D2D'D3- 144 AE XTEN- shortened a2 thrombin-Fc site) (SEO ID NO: 175).

MIPARFAGVL LALALILPGT LCAEGTRGRS STARCSLFGS DFVNTFDGSMMIPARFAGVL LALALILPGT LCAEGTRGRS STARCSLFGS DFVNTFDGSM

YSFAGYCSYL LAGGCQKRSF SIIGDFQNGK RVSLSVYLGE FFDIHLFVNGYSFAGYCSYL LAGGCQKRSF SIIGDFQNGK RVSLSVYLGE FFDIHLFVNG

101 TVTQGDQRVS MPYASKGLYL ETEAGYYKLS GEAYGFVARIDGSGNFQVLL101 TVTQGDQRVS MPYASKGLYL ETEAGYYKLS GEAYGFVARIDGSGNFQVLL

151 SDRYFNKTCG LCGNFNIFAE DDFMTQEGTL TSDPYDFANS WALSSGEQWC151 SDRYFNKTCG LCGNFNIFAE DDFMTQEGTL TSDPYDFANS WALSSGEQWC

201 ERASPPSSSC NISSGEMQKG LWEQCQLLKS TSVFARCHPL VDPEPFVALC201 ERASPPSSSC NISSGEMQKG LWEQCQLLKS TSVFARCHPL VDPEPFVALC

251 EKTLCECAGG LECACPALLE YARTCAQEGM VLYGWTDHSA CSPVCPAGME251 EKTLCECAGG LECACPALLE YARTCAQEGM VLYGWTDHSA CSPVCPAGME

301 YRQCVSPCAR TCQSLHINEM CQERCVDGCS CPEGQLLDEG LCVESTECPC301 YRQCVSPCAR TCQSLHINEM CQERCVDGCS CPEGQLLDEG LCVESTECPC

351 VHSGKRYPPG TSLSRDCNTC ICRNSQWICS NEECPGECLV TGQSHFKSFD351 VHSGKRYPPG TSLSRDCNTC ICRNSQWICS NEECPGECLV TGQSHFKSFD

401 NRYFTFSGIC QYLLARDCQD HSFSIVIETV QCADDRDAVC TRSVTVRLPG401 NRYFTFSGIC QYLLARDCQD HSFSIVIETV QCADDRDAVC TRSVTVRLPG

451 LHNSLVKLKH GAGVAMDGQD IQLPLLKGDL RIQHTVTASV RLSYGEDLQM451 LHNSLVKLKH GAGVAMDGQD IQLPLLKGDL RIQHTVTASV RLSYGEDLQM

501 DWDGRGRLLV KLSPVYAGKT CGLCGNYNGN QGDDFLTPSG LAEPRVEDFG501 DWDGRGRLLV KLSPVYAGKT CGLCGNYNGN QGDDFLTPSG LAEPRVEDFG

51 NAWKLHGDCQ DLQKQHSDPC ALNPRMTRFS EEACAVLTSP TFEACHRAVS51 NAWKLHGDCQ DLQKQHSDPC ALNPRMTRFS EEACAVLTSP TFEACHRAVS

601 PLPYLRNCRY DVCSCSDGRE CLCGALASYA AACAGRGVRV AWREPGRCEL601 PLPYLRNCRY DVCSCSDGRE CLCGALASYA AACAGRGVRV AWREPGRCEL

651 NCPKGQVYLQ CGTPCNLTCR SLSYPDEECN EACLEGCFCP PGLYMDERGD651 NCPKGQVYLQ CGTPCNLTCR SLSYPDEECN EACLEGCFCP PGLYMDERGD

701 CVPKAQCPCY YDGEIFQPED IFSDHHTMCY CEDGFMHCTM SGVPGSLLPD701 CVPKAQCPCY YDGEIFQPED IFSDHHTMCY CEDGFMHCTM SGVPGSLLPD

- 188 -- 188 -

Claims (22)

751 AVLSSPLSHR SKRSLSCRPP MVKLVCPADN LRAEGLECTK TCQNYDLECM751 AVLSSPLSHR SKRSLSCRPP MVKLVCPADN LRAEGLECTK TCQNYDLECM 801 SMGCVSGCLC PPGMVRHENR CVALERCPCF HQGKEYAPGE TVKIGCNTCV801 SMGCVSGCLC PPGMVRHENR CVALERCPCF HQGKEYAPGE TVKIGCNTCV 851 CRDRKWNCTD HVCDATCSTI GMAHYLTFDG LKYLFPGECQ YVLVQDYCGS851 CRDRKWNCTD HVCDATCSTI GMAHYLTFDG LKYLFPGECQ YVLVQDYCGS 901 NPGTFRILVG NKGCSHPSVK CKKRVTILVE GGEIELFDGE VNVKRPMKDE901 NPGTFRILVG NKGCSHPSVK CKKRVTILVE GGEIELFDGE VNVKRPMKDE 951 THFEVVESGR YIILLLGKAL SVVWDRHLSI SVVLKQTYQE KVCGLCGNFD951 THFEVVESGR YIILLLGKAL SVVWDRHLSI SVVLKQTYQE KVCGLCGNFD 1001 GIQNNDLTSS NLQVEEDPVD FGNSWKVSSQ CADTRKVPLD SSPATCHNNI1001 GIQNNDLTSS NLQVEEDPVD FGNSWKVSSQ CADTRKVPLD SSPATCHNNI 1051 MKQTMVDSSC RILTSDVFQD CNKLVDPEPY LDVCIYDTCS CESIGDCAAF1051 MKQTMVDSSC RILTSDVFQD CNKLVDPEPY LDVCIYDTCS CESIGDCAAF 1101 CDTIAAYAHV CAQHGKVVTW RTATLCPQSC EERNLRENGY EAEWRYNSCA1101 CDTIAAYAHV CAQHGKVVTW RTATLCPQSC EERNLRENGY EAEWRYNSCA 1151 PACQVTCQHP EPLACPVQCV EGCHAHCPPG KILDELLQTC VDPEDCPVCE1151 PACQVTCQHP EPLACPVQCV EGCHAHCPPG KILDELLQTC VDPEDCPVCE 1201 VAGRRFASGK KVTLNPSDPE HCQICHCDVV NLTCEACQEP GAPTSESATP1201 VAGRRFASGK KVTLNPSDPE HCQICHCDVV NLTCEACQEP GAPTSESATP 1251 ESGPGSEPAT SGSETPGTSE SATPESGPGS EPATSGSETP GTSESATPES1251 ESGPGSEPAT SGSETPGTSE SATPESGPGS EPATSGSETP GTSESATPES 1301 GPGTSTEPSE GSAPGSPAGS PTSTEEGTSE SATPESGPGS EPATSGSETP1301 GPGTSTEPSE GSAPGSPAGS PTSTEEGTSE SATPESGPGS EPATSGSETP 1351 GTSESATPES GPGSPAGSPT STEEGSPAGS PTSTEEGASS GGGGSGGGGS1351 GTSESATPES GPGSPAGSPT STEEGSPAGS PTSTEEGASS GGGGSGGGGS 1401 GGGGSGGGGS GGGGSGGGGS IEPRSFSGSG GDKTHTCPPC PAPELLGGPS1401 GGGGSGGGGS GGGGSGGGGS IEPRSFSGSG GDKTHTCPPC PAPELLGGPS 1451 VFLFPPKPKD TLMISRTPEV TCVVVDVSHE DPEVKFNWYV DGVEVHNAKT1451 VFLFPPKPKD TLMISRTPEV TCVVVDVSHE DPEVKFNWYV DGVEVHNAKT 1501 KPREEQYNST YRVVSVLTVL HQDWLNGKEY KCKVSNKALP APIEKTISKA1501 KPREEQYNST YRVVSVLTVL HQDWLNGKEY KCKVSNKALP APIEKTISKA 1551 KGQPREPQVY TLPPSRDELT KNQVSLTCLV KGFYPSDIAV EWESNGQPEN1551 KGQPREPQVY TLPPSRDELT KNQVSLTCLV KGFYPSDIAV EWESNGQPEN 1601 NYKTTPPVLD SDGSFFLYSK LTVDKSRWQQ GNVFSCSVMH EALHNHYTQK1601 NYKTTPPVLD SDGSFFLYSK LTVDKSRWQQ GNVFSCSVMH EALHNHYTQK 1651 SLSLSPGK*1651 SLSLSPGK* Предшествующее описание конкретных вариантов реализации изобретения настолько полно раскрывает общий характер изобретения, что другие могут, применяя знания в данной области техники, легко модифицировать и/или адаптировать для различных применений такие конкретные варианты реализации изобретения, без излишнего экспериментирования, не отступая от общей концепции настоящего изобретения. Таким образом, такие адаптации и модификации предназначены для того, чтобы находиться в пределах смысла и диапазона эквивалентов раскрытых вариантов реализации изобретения, основанных на обучении и руководстве, представленном в данном документе. Следует иметь в виду, что фразеология и терминология используется здесь в целях описания, а не ограничения, таким образом, терминология или фразеология настоящего описания должна интерпретироваться специалистами в данной области техники с учетом представленных указаний и руководства.The foregoing description of specific embodiments of the invention so fully discloses the general nature of the invention that others can, by applying knowledge in the art, easily modify and/or adapt for various applications such specific embodiments of the invention, without undue experimentation, without departing from the general concept of the present invention . Thus, such adaptations and modifications are intended to be within the meaning and range of equivalents of the disclosed embodiments based on the teaching and guidance provided herein. It should be understood that the phraseology and terminology used herein are for purposes of description and not limitation, so the terminology or phraseology of this specification should be interpreted by those skilled in the art in light of the instructions and guidance provided. Другие варианты реализации настоящего изобретения понятны специалистам в данной области с учетом настоящего описания и практического осуществления настоящего изобретения, описанного в настоящем документе. Предполагается, что описание и примеры следует рассматривать только как иллюстративные, причем истинный объем и сущность настоящего изобретения указаны в следующей формуле изобретения.Other embodiments of the present invention will be apparent to those skilled in the art in view of the present description and the practice of the present invention described herein. It is intended that the description and examples be considered as illustrative only, with the true scope and spirit of the present invention set forth in the following claims. Все патенты и публикации, цитируемые в данном описании в полном объеме, включены в текст путем ссылки.All patents and publications cited in their entirety herein are incorporated by reference. ФОРМУЛА ИЗОБРЕТЕНИЯCLAIM 1. Химерный белок, содержащий (i) первую полипептидную цепь, которая содержит в направлении от ее N-конца до ее С-конца (a) белок фактора VIII (FVIII), содержащий N-концевую часть и С-концевую часть;1. A chimeric protein comprising (i) a first polypeptide chain that contains, from its N-terminus to its C-terminus, (a) a factor VIII (FVIII) protein comprising an N-terminal portion and a C-terminal portion; причем N-концевая часть белка FVIII содержит домен А1, домен А2 и часть домена В полноразмерного зрелого FVIII (SEQ ID NO: 65);wherein the N-terminal portion of the FVIII protein contains an A1 domain, an A2 domain, and a portion of the B domain of full-length mature FVIII (SEQ ID NO: 65); причем N-концевая часть содержит аминокислотную последовательность из остатков 1-745 из SEQ ID NO: 65, слитую с первой последовательностью XTEN, встроенной непосредственно ниже аминокислоты 745 из SEQ ID NO: 65; и причем С-концевая часть содержит домен A3, домен С1 и домен С2 таким образом, чтобы Сконцевая часть содержала остатки 1690-2332 из SEQ ID NO: 65;wherein the N-terminal portion contains the amino acid sequence of residues 1-745 of SEQ ID NO: 65 fused to the first XTEN sequence inserted immediately downstream of amino acid 745 of SEQ ID NO: 65; and wherein the C-terminal portion comprises an A3 domain, a C1 domain, and a C2 domain such that the C-terminal portion comprises residues 1690-2332 of SEQ ID NO: 65; (b) первый фрагмент Fc, причем первая последовательность XTEN содержит аминокислотную последовательность SEQ ID NO: 8; и (ii ) вторую полипептидную цепь, которая содержит в направлении от ее N-конца до ее С-конца (a) белок фактора фон Виллебранда (ФВ), содержащий домен D' и домен D3 из ФВ, причем белок ФВ содержит аланиновую замену в остатках, соответствующих остаткам 1099 и 1142 из SEQ ID NO: 21;(b) a first Fc fragment, wherein the first XTEN sequence comprises the amino acid sequence of SEQ ID NO: 8; and (ii) a second polypeptide chain that contains, from its N-terminus to its C-terminus, (a) a von Willebrand factor (VWF) protein containing a D' domain and a D3 domain of VWF, wherein the VWF protein contains an alanine substitution at residues corresponding to residues 1099 and 1142 of SEQ ID NO: 21; (b) вторую последовательность XTEN, содержащую аминокислотную последовательность SEQ ID NO: 58, причем вторая последовательность XTEN содержит менее 288 аминокислотных остатков;(b) a second XTEN sequence comprising the amino acid sequence of SEQ ID NO: 58, wherein the second XTEN sequence contains less than 288 amino acid residues; (c) расщепляемый линкер, содержащий область а2 FVIII, которая содержит аминокислотную после-(c) a cleavable linker containing the a2 region of FVIII, which contains the amino acid post- - 189 044115 довательность от Glu720 до Arg740, соответствующую SEQ ID NO: 65, причем область а2 поддается расщеплению тромбином; и (d) второй фрагмент Fc, причем первая полипептидная цепь соединена со второй полипептидной цепью через первый фрагмент Fc и второй фрагмент Fc.- 189 044115 the sequence from Glu720 to Arg740 corresponding to SEQ ID NO: 65, wherein the a2 region is cleavable by thrombin; and (d) a second Fc fragment, the first polypeptide chain being connected to the second polypeptide chain through the first Fc fragment and the second Fc fragment. 2. Химерный белок по п.1, отличающийся тем, что С-концевая часть белка FVIII содержит аминокислотную последовательность по меньшей мере на 95% идентичную остаткам 1641-2332 из SEQ ID NO: 65.2. The chimeric protein according to claim 1, characterized in that the C-terminal part of the FVIII protein contains an amino acid sequence that is at least 95% identical to residues 1641-2332 from SEQ ID NO: 65. 3. Химерный белок по п.2, отличающийся тем, что вторая последовательность XTEN имеет длину около 144 аминокислотных остатков.3. The chimeric protein according to claim 2, characterized in that the second XTEN sequence has a length of about 144 amino acid residues. 4. Химерный белок по п.3, отличающийся тем, что вторая последовательность XTEN состоит из аминокислотной последовательности, имеющей длину от 144 аминокислотных остатков до 287 аминокислотных остатков.4. The chimeric protein according to claim 3, characterized in that the second XTEN sequence consists of an amino acid sequence having a length of from 144 amino acid residues to 287 amino acid residues. 5. Химерный белок по п.3, отличающийся тем, что первый фрагмент Fc соединен со вторым фрагментом Fc ковалентной связью.5. Chimeric protein according to claim 3, characterized in that the first Fc fragment is connected to the second Fc fragment by a covalent bond. 6. Химерный белок по п.5, отличающийся тем, что первый фрагмент Fc соединен со вторым фрагментом Fc дисульфидной связью.6. Chimeric protein according to claim 5, characterized in that the first Fc fragment is connected to the second Fc fragment by a disulfide bond. 7. Химерный белок по п.1, отличающийся тем, что первый фрагмент Fc и второй фрагмент Fc являются одинаковыми.7. Chimeric protein according to claim 1, characterized in that the first Fc fragment and the second Fc fragment are the same. 8. Химерный белок по п.7, отличающийся тем, что первый фрагмент Fc и второй фрагмент Fc являются производными от IgG1 человека.8. The chimeric protein according to claim 7, characterized in that the first Fc fragment and the second Fc fragment are derived from human IgG1. 9. Химерный белок по п.8, отличающийся тем, что белок ФВ состоит из домена D' и домена D3.9. Chimeric protein according to claim 8, characterized in that the VWF protein consists of a D' domain and a D3 domain. 10. Химерный белок по п.8, отличающийся тем, что белок ФВ дополнительно содержит домен D1 и D2 из ФВ.10. The chimeric protein according to claim 8, characterized in that the VWF protein additionally contains domain D1 and D2 from VWF. 11. Химерный белок по п.10, отличающийся тем, что белок ФВ дополнительно содержит сигнальный пептид ФВ.11. The chimeric protein according to claim 10, characterized in that the VWF protein additionally contains a VWF signal peptide. 12. Химерный белок по п.11, отличающийся тем, что белок FVIII дополнительно содержит сигнальный пептид FVIII.12. The chimeric protein according to claim 11, characterized in that the FVIII protein additionally contains an FVIII signal peptide. 13. Химерный белок по п.7, отличающийся тем, что первый фрагмент Fc соединен со вторым фрагментом Fc двумя дисульфидными связями.13. Chimeric protein according to claim 7, characterized in that the first Fc fragment is connected to the second Fc fragment by two disulfide bonds. 14. Химерный белок по п.1, отличающийся тем, что расщепляемый линкер содержит область а2 FVIII, содержащую аминокислотную последовательность, по меньшей мере на 90% идентичную с SEQ ID NO: 106.14. The chimeric protein of claim 1, wherein the cleavable linker comprises a FVIII a2 region containing an amino acid sequence at least 90% identical to SEQ ID NO: 106. 15. Фармацевтическая композиция, содержащая химерный белок по любому из пп.1-14 и фармацевтически приемлемый носитель.15. A pharmaceutical composition containing the chimeric protein according to any one of claims 1 to 14 and a pharmaceutically acceptable carrier. 16. Химерный белок, содержащий (i) первую полипептидную цепь, которая содержит в направлении от ее N-конца до ее С-конца (a) белок фактора VIII (FVIII), содержащий аминокислотную последовательность, которая по меньшей мере на 99% идентична с SEQ ID NO: 67, с первой последовательностью XTEN, встроенной непосредственно ниже остатка, соответствующего остатку 745 из SEQ ID NO: 67; и (b) первый фрагмент Fc;16. A chimeric protein comprising (i) a first polypeptide chain that contains, from its N-terminus to its C-terminus, (a) a factor VIII (FVIII) protein containing an amino acid sequence that is at least 99% identical to SEQ ID NO: 67, with the first XTEN sequence inserted immediately downstream of the residue corresponding to residue 745 of SEQ ID NO: 67; and (b) a first Fc fragment; причем первая последовательность XTEN содержит аминокислотную последовательность SEQ ID NO: 8; и (ii) вторую полипептидную цепь, которая содержит в направлении от ее N-конца до ее С-конца (a) белок фактора фон Виллебранда (ФВ), содержащий домен D' и домен D3 из ФВ, причем белок ФВ содержит аланиновую замену в остатках, соответствующих остаткам 1099 и 1142 из SEQ ID NO: 21;wherein the first XTEN sequence comprises the amino acid sequence of SEQ ID NO: 8; and (ii) a second polypeptide chain that contains, from its N-terminus to its C-terminus, (a) a von Willebrand factor (VWF) protein containing a D' domain and a D3 domain of VWF, wherein the VWF protein contains an alanine substitution at residues corresponding to residues 1099 and 1142 of SEQ ID NO: 21; (b) вторую последовательность XTEN, содержащую аминокислотную последовательность SEQ ID NO: 58, причем вторая последовательность XTEN содержит менее 288 аминокислотных остатков;(b) a second XTEN sequence comprising the amino acid sequence of SEQ ID NO: 58, wherein the second XTEN sequence contains less than 288 amino acid residues; (c) расщепляемый линкер, содержащий область а2 FVIII, которая содержит аминокислотную последовательность от Glu720 до Arg740, соответствующую SEQ ID NO: 65, причем область а2 поддается расщеплению тромбином; и (d) второй фрагмент Fc, причем первый фрагмент Fc соединен со вторым фрагментом Fc дисульфидной связью.(c) a cleavable linker containing the a2 region of FVIII, which contains the amino acid sequence from Glu720 to Arg740 corresponding to SEQ ID NO: 65, and the a2 region is amenable to thrombin cleavage; and (d) a second Fc moiety, wherein the first Fc moiety is linked to the second Fc moiety by a disulfide bond. 17. Химерный белок по п.16, отличающийся тем, что вторая последовательность XTEN имеет длину около 144 аминокислотных остатков.17. The chimeric protein according to claim 16, characterized in that the second sequence XTEN has a length of about 144 amino acid residues. 18. Химерный белок по п.16, отличающийся тем, что вторая последовательность XTEN состоит из аминокислотной последовательности, имеющей длину от 144 аминокислотных остатков до 287 аминокислотных остатков.18. The chimeric protein according to claim 16, characterized in that the second XTEN sequence consists of an amino acid sequence having a length of from 144 amino acid residues to 287 amino acid residues. 19. Химерный белок по п.16, отличающийся тем, что первый фрагмент Fc и второй фрагмент Fc являются одинаковыми.19. The chimeric protein according to claim 16, characterized in that the first Fc fragment and the second Fc fragment are the same. 20. Химерный белок по п.19, отличающийся тем, что первый фрагмент Fc и второй фрагмент Fc являются производными от IgG1 человека.20. The chimeric protein according to claim 19, characterized in that the first Fc fragment and the second Fc fragment are derived from human IgG1. 21. Химерный белок по п.20, отличающийся тем, что белок ФВ состоит из домена D' и домена D3.21. The chimeric protein according to claim 20, characterized in that the VWF protein consists of a D' domain and a D3 domain. 22. Химерный белок по п.20, отличающийся тем, что белок ФВ дополнительно содержит домен D122. Chimeric protein according to claim 20, characterized in that the VWF protein additionally contains a D1 domain - 190 -- 190 -
EA201691111 2014-01-10 2015-01-09 CHIMERIC FACTOR VIII PROTEINS AND THEIR APPLICATION EA044115B1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US61/926,226 2014-01-10
US61/988,104 2014-05-02

Publications (1)

Publication Number Publication Date
EA044115B1 true EA044115B1 (en) 2023-07-24

Family

ID=

Similar Documents

Publication Publication Date Title
US20220275057A1 (en) Factor viii chimeric proteins and uses thereof
AU2020203063B2 (en) Thrombin cleavable linker with XTEN and its uses thereof
AU2018203206B2 (en) Factor VIII Complex With XTEN and Von Willebrand Factor Protein, and Uses Thereof
AU2011274423B2 (en) Chimeric clotting factors
US20190375822A1 (en) Methods of treating hemophilia a
US20210261607A1 (en) Purification of chimeric fviii molecules
KR101682496B1 (en) Fusion protein for antagonizing angiogenesis inducible factors and uses thereof
RU2812863C2 (en) Treatment methods for hemophilia a
EA044115B1 (en) CHIMERIC FACTOR VIII PROTEINS AND THEIR APPLICATION
EA041588B1 (en) THROMBIN CLEAVABLE LINKER CONTAINING XTEN AND ITS USE