EA041588B1 - THROMBIN CLEAVABLE LINKER CONTAINING XTEN AND ITS USE - Google Patents

THROMBIN CLEAVABLE LINKER CONTAINING XTEN AND ITS USE Download PDF

Info

Publication number
EA041588B1
EA041588B1 EA201592022 EA041588B1 EA 041588 B1 EA041588 B1 EA 041588B1 EA 201592022 EA201592022 EA 201592022 EA 041588 B1 EA041588 B1 EA 041588B1
Authority
EA
Eurasian Patent Office
Prior art keywords
vwf
amino acids
fviii
protein
domain
Prior art date
Application number
EA201592022
Other languages
Russian (ru)
Inventor
Экта Сет Чхабра
Джон Кулман
Тунгуао Лю
Original Assignee
Биовератив Терапьютикс Инк.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Биовератив Терапьютикс Инк. filed Critical Биовератив Терапьютикс Инк.
Publication of EA041588B1 publication Critical patent/EA041588B1/en

Links

Description

Уровень техникиState of the art

Гемофилия А представляет собой нарушение, сопровождающееся повышенной кровоточивостью, вызываемое дефектами кодирования гена коагулирующего фактора VIII (FVIII), и поражает 1-2 из 10000 родившихся мальчиков. Graw et al., Nat. Rev. Genet. 6(6): 488-501 (2005). Пациентов, страдающих гемофилией А, можно лечить инфузией очищенного или рекомбинантно полученного FVIII. Однако известно, что все коммерчески доступные продукты FVIII имеют период полувыведения, равный около 8-12 часов, что требует частого внутривенного введения пациентам. См. Weiner M.A. and Cairo, M.S., Pediatric Hematology Secrets, Lee, M.T., 12. Disorders of Coagulation, Elsevier Health Sciences, 2001; Lillicrap, D. Thromb. Res. 122 Suppl 4:S2-8 (2008). Кроме того, был опробован ряд подходов, направленных на увеличение периода полувыведения FVIII. Например, подходы, используемые для увеличения периода полувыведения факторов свертывания крови, включают пегилирование, гликопегилирование и конъюгацию с альбумином. See Dumont et al., Blood. 119(13): 3024-3030 (интернет-публикация 13 января 2012 г.). Независимо от используемой белковой инженерии, однако, разрабатываемые в настоящее время продукты FVIII пролонгированного действия имеют улучшенные значения периода полувыведения, но величины периодов полувыведения, как сообщается, ограничены всего лишь около 1,5-2-кратным увеличением в доклинических животных моделях. См. там же. Непротиворечивые результаты были продемонстрированы на людях, например, сообщалось, что rFVIIIFc улучшает период полувыведения до около 1,7-кратной величины по сравнению с ADVATE® у пациентов с гемофилией А. См. там же. Таким образом, увеличение периода полувыведения, несмотря на незначительные улучшения, может указывать на существование других факторов, ограничивающих t1/2.Hemophilia A is a bleeding disorder caused by defects in the coding of the coagulation factor VIII (FVIII) gene and affects 1-2 in 10,000 male births. Graw et al., Nat. Rev. Genet. 6(6): 488-501 (2005). Patients suffering from hemophilia A can be treated with an infusion of purified or recombinantly produced FVIII. However, all commercially available FVIII products are known to have a half-life of about 8-12 hours, requiring frequent intravenous administration to patients. See Weiner MA and Cairo, MS, Pediatric Hematology Secrets, Lee, MT, 12. Disorders of Coagulation, Elsevier Health Sciences, 2001; Lillicrap, D. Thromb. Res. 122 Suppl 4:S2-8 (2008). In addition, a number of approaches have been tried to increase the half-life of FVIII. For example, approaches used to increase the half-life of coagulation factors include pegylation, glycopegylation, and albumin conjugation. See Dumont et al., Blood. 119(13): 3024-3030 (online published January 13, 2012). Regardless of the protein engineering used, however, sustained-release FVIII products currently under development have improved half-lives, but half-lives are reported to be limited to only about 1.5- to 2-fold increases in preclinical animal models. See ibid. Consistent results have been demonstrated in humans, for example, rFVIIIFc has been reported to improve half-life by about 1.7-fold compared to ADVATE® in patients with hemophilia A. See ibid. Thus, an increase in the half-life, despite minor improvements, may indicate the existence of other factors that limit t 1/2 .

Вследствие частого введения доз и неудобств, причиняемых графиком введения, существует потребность в разработке продуктов FVIII, требующих меньшей частоты введения, т.е. продукта FVIII, имеющего период полувыведения, превышающий 1,5-2-кратный предел периода полувыведения.Due to frequent dosing and the inconvenience caused by the administration schedule, there is a need to develop FVIII products requiring less frequency of administration, ie. an FVIII product having a half-life greater than 1.5-2 times the half-life limit.

Сущность изобретенияThe essence of the invention

Настоящее изобретение касается химерной молекулы, содержащей белок фактора фон Виллебранда (VWF), гетерологичный фрагмент (H1), последовательность XTEN и линкер VWF, соединяющий белок VWF с гетерологичным фрагментом, при этом линкер VWF содержит полипептид, выбранный из: (i) области а2 из фактора VIII (FVIII); (ii) области a1 из FVIII; (iii) области а3 из FVIII; (iv) сайта расщепления тромбином, содержащего X-V-P-R (SEQ ID NO: 3) и мотив экзосайта взаимодействия PAR1, где X представляет собой алифатическую аминокислоту; или (v) любой их комбинации, и при этом последовательность XTEN соединена с белком VWF, гетерологичным фрагментом (H1), линкером VWF или любой их комбинацией. В одном варианте реализации изобретения последовательность XTEN соединяет белок VWF с линкером VWF или линкер VWF с гетерологичным фрагментом. В другом варианте реализации изобретения химерная молекула дополнительно включает вторую полипептидную цепь, которая содержит белок FVIII, при этом первая полипептидная цепь и вторая полипептидная цепь ассоциированы друг с другом. В других вариантах реализации изобретения белок FVIII в химерной молекуле дополнительно содержит дополнительную последовательность XTEN. Дополнительная последовательность XTEN может быть связана с N-концом или С-концом белка FVIII или вставлена между двумя соседними аминокислотами FVIII. В еще одних вариантах реализации изобретения вторая полипептидная цепь дополнительно содержит второй гетерологичный фрагмент (Н2).The present invention relates to a chimeric molecule containing a von Willebrand factor (VWF) protein, a heterologous fragment (H1), an XTEN sequence, and a VWF linker connecting the VWF protein to the heterologous fragment, wherein the VWF linker contains a polypeptide selected from: (i) the a2 region of factor VIII (FVIII); (ii) regions a1 of FVIII; (iii) a3 regions from FVIII; (iv) a thrombin cleavage site containing X-V-P-R (SEQ ID NO: 3) and a PAR1 interaction exosite motif, where X is an aliphatic amino acid; or (v) any combination thereof, wherein the XTEN sequence is linked to a VWF protein, a heterologous fragment (H1), a VWF linker, or any combination thereof. In one embodiment, the XTEN sequence connects a VWF protein to a VWF linker, or a VWF linker to a heterologous fragment. In another embodiment, the chimeric molecule further comprises a second polypeptide chain that contains the FVIII protein, wherein the first polypeptide chain and the second polypeptide chain are associated with each other. In other embodiments, the FVIII protein in the chimeric molecule further comprises an additional XTEN sequence. An additional XTEN sequence may be linked to the N-terminus or C-terminus of the FVIII protein, or inserted between two adjacent FVIII amino acids. In still other embodiments of the invention, the second polypeptide chain further comprises a second heterologous fragment (H2).

Настоящее описание также включает химерную молекулу, содержащую первую полипептидную цепь, которая содержит белок VWF, гетерологичный фрагмент (H1) и линкер VWF, соединяющий белок VWF и гетерологичный фрагмент (H1), и вторую полипептидную цепь, содержащую белок FVIII и последовательность XTEN, при этом линкер VWF в первой полипептидной цепи содержит: (i) область а2 из FVIII; (ii) область a1 из FVIII; (iii) область а3 из FVIII; (iv) сайт расщепления тромбином, содержащий XV-P-R (SEQ ID NO: 3) и мотив экзосайта взаимодействия PAR1, где X представляет собой алифатическую аминокислоту; или (v) любую их комбинацию, и при этом первая полипептидная цепь и вторая полипептидная цепь ассоциированы друг с другом. В одном варианте реализации изобретения последовательность XTEN присоединена к N-концу или С-концу белка FVIII или вставлена между двумя соседними аминокислотами FVIII. В другом варианте реализации изобретения химерная молекула дополнительно содержит дополнительную последовательность XTEN, которая связана с белком VWF, гетерологичным фрагментом, линкером VWF или любой их комбинацией. В других вариантах реализации изобретения химерная молекула дополнительно содержит второй гетерологичный фрагмент (Н2). В еще одних вариантах реализации изобретения второй гетерологичный фрагмент соединен с белком FVIII, последовательностью XTEN или обоими.The present description also includes a chimeric molecule containing a first polypeptide chain that contains a VWF protein, a heterologous fragment (H1) and a VWF linker connecting the VWF protein and a heterologous fragment (H1), and a second polypeptide chain containing the FVIII protein and the XTEN sequence, while the VWF linker in the first polypeptide chain contains: (i) the a2 region of FVIII; (ii) region a1 from FVIII; (iii) region a3 from FVIII; (iv) a thrombin cleavage site containing XV-P-R (SEQ ID NO: 3) and a PAR1 interaction exosite motif, where X is an aliphatic amino acid; or (v) any combination thereof, wherein the first polypeptide chain and the second polypeptide chain are associated with each other. In one embodiment, the XTEN sequence is fused to the N-terminus or C-terminus of the FVIII protein, or inserted between two adjacent FVIII amino acids. In another embodiment, the chimeric molecule further comprises an additional XTEN sequence that is linked to a VWF protein, a heterologous fragment, a VWF linker, or any combination thereof. In other embodiments of the invention, the chimeric molecule further comprises a second heterologous fragment (H2). In yet other embodiments of the invention, the second heterologous fragment is connected to the FVIII protein, the XTEN sequence, or both.

Для химерных молекул, в соответствии с настоящим изобретением, последовательность XTEN, соединенная с белком VWF, линкером VWF, белком FVIII или любыми другими компонентами в химерных молекулах, содержит около 42 аминокислот, около 72 аминокислот, около 108 аминокислот, около 144 аминокислот, около 180 аминокислот, около 216 аминокислот, около 252 аминокислот, около 288 аминокислот, около 324 аминокислот, около 360 аминокислот, около 396 аминокислот, около 432 аминокислот, около 468 аминокислот, около 504 аминокислот, около 540 аминокислот, около 576 аминокислот, около 612 аминокислот, около 624 аминокислот, около 648 аминокислот, около 684 аминокислот, около 720 амиFor chimeric molecules according to the present invention, the XTEN sequence linked to the VWF protein, VWF linker, FVIII protein, or any other components in the chimeric molecules contains about 42 amino acids, about 72 amino acids, about 108 amino acids, about 144 amino acids, about 180 about 216 amino acids, about 252 amino acids, about 288 amino acids, about 324 amino acids, about 360 amino acids, about 396 amino acids, about 432 amino acids, about 468 amino acids, about 504 amino acids, about 540 amino acids, about 576 amino acids, about 612 amino acids, about 624 amino acids, about 648 amino acids, about 684 amino acids, about 720 amino acids

- 1 041588 нокислот, около 756 аминокислот, около 792 аминокислот, около 828 аминокислот, около 836 аминокислот, около 864 аминокислот, около 875 аминокислот, около 912 аминокислот, около 923 аминокислот, около 948 аминокислот, около 1044 аминокислот, около 1140 аминокислот, около 1236 аминокислот, около 1318 аминокислот, около 1332 аминокислот, около 1428 аминокислот, около 1524 аминокислот, около 1620 аминокислот, около 1716 аминокислот, около 1812 аминокислот, около 1908 аминокислот или около 2004 аминокислот. В некоторых вариантах реализации изобретения полипептид XTEN выбирают из АЕ42, АЕ72, АЕ864, АЕ576, АЕ288, АЕ144, AG864, AG576, AG288 или AG144. В других вариантах реализации изобретения полипептид XTEN выбирают из SEQ ID NO: 39; SEQ ID NO: 40; SEQ ID NO: 47; SEQ ID NO: 45; SEQ ID NO: 44; SEQ ID NO: 41; SEQ ID NO: 48; SEQ ID NO: 46, SEQ ID NO: 44 или SEQ ID NO: 42.- 1,041,588 no acids, about 756 amino acids, about 792 amino acids, about 828 amino acids, about 836 amino acids, about 864 amino acids, about 875 amino acids, about 912 amino acids, about 923 amino acids, about 948 amino acids, about 1044 amino acids, about 1140 amino acids, about 1236 amino acids, about 1318 amino acids, about 1332 amino acids, about 1428 amino acids, about 1524 amino acids, about 1620 amino acids, about 1716 amino acids, about 1812 amino acids, about 1908 amino acids, or about 2004 amino acids. In some embodiments, the XTEN polypeptide is selected from AE42, AE72, AE864, AE576, AE288, AE144, AG864, AG576, AG288, or AG144. In other embodiments, the XTEN polypeptide is selected from SEQ ID NO: 39; SEQ ID NO: 40; SEQ ID NO: 47; SEQ ID NO: 45; SEQ ID NO: 44; SEQ ID NO: 41; SEQ ID NO: 48; SEQ ID NO: 46, SEQ ID NO: 44, or SEQ ID NO: 42.

В других аспектах дополнительная последовательность XTEN в химерных молекулах содержит около 42 аминокислот, около 72 аминокислот, около 108 аминокислот, около 144 аминокислот, около 180 аминокислот, около 216 аминокислот, около 252 аминокислот, около 288 аминокислот, около 324 аминокислот, около 360 аминокислот, около 396 аминокислот, около 432 аминокислоты, около 468 аминокислот, около 504 аминокислоты, около 540 аминокислот, около 576 аминокислот, около 612 аминокислот, около 624 аминокислот, около 648 аминокислот, около 684 аминокислот, около 720 аминокислот, около 756 аминокислот, около 792 аминокислот, около 828 аминокислот, около 836 аминокислот, около 864 аминокислоты, около 875 аминокислот, около 912 аминокислот, около 923 аминокислот, около 948 аминокислот, около 1044 аминокислот, около 1140 аминокислот, около 1236 аминокислот, около 1318 аминокислот, около 1332 аминокислот, около 1428 аминокислот, около 1524 аминокислот, около 1620 аминокислот, около 1716 аминокислот, около 1812 аминокислот, около 1908 аминокислот или около 2004 аминокислот. В некоторых вариантах реализации изобретения дополнительный полипептид XTEN выбирают из АЕ42, АЕ72, АЕ864, АЕ576, АЕ288, АЕ144, AG864, AG576, AG288, или AG144. В определенных вариантах реализации изобретения дополнительный полипептид XTEN выбирают из SEQ ID NO: 39; SEQ ID NO: 40; SEQ ID NO: 47; SEQ ID NO: 45; SEQ ID NO: 43; SEQ ID NO: 41; SEQ ID NO: 48; SEQ ID NO: 46, SEQ ID NO: 44 или SEQ ID NO: 42.In other aspects, the additional XTEN sequence in the chimeric molecules is about 42 amino acids, about 72 amino acids, about 108 amino acids, about 144 amino acids, about 180 amino acids, about 216 amino acids, about 252 amino acids, about 288 amino acids, about 324 amino acids, about 360 amino acids, about 396 amino acids, about 432 amino acids, about 468 amino acids, about 504 amino acids, about 540 amino acids, about 576 amino acids, about 612 amino acids, about 624 amino acids, about 648 amino acids, about 684 amino acids, about 720 amino acids, about 756 amino acids, about 792 about 828 amino acids, about 836 amino acids, about 864 amino acids, about 875 amino acids, about 912 amino acids, about 923 amino acids, about 948 amino acids, about 1044 amino acids, about 1140 amino acids, about 1236 amino acids, about 1318 amino acids, about 1332 amino acids, about 1428 amino acids, about 1524 amino acids, about 1620 amino acids, about 1716 amino acids, about 1812 amino acids, about 1908 amino acids or about 2004 amino acids. In some embodiments, the additional XTEN polypeptide is selected from AE42, AE72, AE864, AE576, AE288, AE144, AG864, AG576, AG288, or AG144. In certain embodiments, the additional XTEN polypeptide is selected from SEQ ID NO: 39; SEQ ID NO: 40; SEQ ID NO: 47; SEQ ID NO: 45; SEQ ID NO: 43; SEQ ID NO: 41; SEQ ID NO: 48; SEQ ID NO: 46, SEQ ID NO: 44, or SEQ ID NO: 42.

В одном варианте реализации изобретения линкер VWF, пригодный для соединяющего белка VWF и гетерологичного фрагмента в химерных молекулах, содержит область а2, которая содержит аминокислотную последовательность, по меньшей мере на около 80, около 85, около 90, около 95 или 100% идентичную участку от Glu720 до Arg740, соответствующему полноразмерному FVIII, при этом область а2 способна расщепляться тромбином. В конкретном варианте реализации изобретения область а2 содержит ISDKNTGDYYEDSYEDISAYLLSKNNAIEPRSFS (SEQ ID NO: 4). В другом варианте реализации изобретения линкер VWF, пригодный для соединяющего белка VWF и гетерологичного фрагмента, содержит область a1, которая содержит аминокислотную последовательность, по меньшей мере на около 80, около 85, около 90, около 95 или 100% идентичную участку от Met337 до Arg372, соответствующему полноразмерному FVIII, при этом область a1 способна расщепляться тромбином. В некоторых вариантах реализации изобретения область a1 содержит ISMKNNEEAEDYDDDLTDSEMDVVRFDDDNSPSFIQIRSV (SEQ ID NO: 5). В других вариантах реализации изобретения линкер VWF, пригодный для соединяющего белка VWF и гетерологичного фрагмента, содержит область а3, которая содержит аминокислотную последовательность, по меньшей мере на около 80, около 85, около 90, около 95 или 100% идентичную участку от Glu1649 до Arg1689, соответствующему полноразмерному FVIII, при этом область а3 способна расщепляться тромбином. В конкретном варианте реализации изобретения область а3 содержит ISEITRTTLQSDQEEroYDDTISVEMKKEDFDIYDEDENQSPRSFQ (SEQ ID NO: 6). В еще одних вариантах реализации изобретения линкер VWF, пригодный для соединяющего белка VWF и гетерологичного фрагмента, содержит сайт расщепления тромбином, содержащий X-V-P-R (SEQ ID NO: 3) и мотив экзосайта взаимодействия PAR1, при этом мотив экзосайта взаимодействия PAR1 содержит S-F-LL-R-N (SEQ ID NO: 7). В одном варианте реализации изобретения мотив экзосайта взаимодействия PAR1 дополнительно содержит последовательность, выбранную из Р, P-N, P-N-D, P-N-D-K (SEQ ID NO: 8), PN-D-K-Y (SEQ ID NO: 9), P-N-D-K-Y-E (SEQ ID NO: 10), P-N-D-K-Y-E-P (SEQ ID NO: 11), P-N-D-K-Y-EP-F (SEQ ID NO: 12), P-N-D-K-Y-E-P-F-W (SEQ ID NO: 13), P-N-D-K-Y-E-P-F-W-E (SEQ ID NO: 14), PN-D-K-Y-E-P-F-W-E-D (SEQ ID NO: 20), P-N-D-K-Y-E-P-F-W-E-D-E (SEQ ID NO: 21), P-N-D-K-Y-E-P-FW-E-D-E-E (SEQ ID NO: 22), P-N-D-K-Y-E-P-F-W-E-D-E-E-S (SEQ ID NO: 23) или любой их комбинации. В другом варианте реализации изобретения алифатическую аминокислоту выбирают из глицина, аланина, валина, лейцина или изолейцина. В конкретном варианте реализации изобретения линкер VWF содержит GGLVPRSFLLRNPNDKYEPFWEDEES (SEQ ID NO: 24). В определенных вариантах реализации изобретения тромбин расщепляет линкер VWF быстрее, чем тромбин расщеплял бы сайт расщепления тромбином, если бы сайт расщепления тромбином замещал линкер VWF в химерной молекуле. В других вариантах реализации изобретения тромбин расщепляет линкер VWF по меньшей мере в около 10 раз, по меньшей мере в около 20 раз, по меньшей мере в около 30 раз, по меньшей мере в около 40 раз, по меньшей мере в около 50 раз, по меньшей мере в около 60 раз, по меньшей мере в около 70 раз, по меньшей мере в около 80 раз, по меньшей мере в около 90 раз или по меньшей мере в около 100 раз быстрее, чем тромбин расщеплял бы сайт расщепления тромбином, если бы сайт расщепления тромбином замещал линкер VWF в химерной молекуле.In one embodiment of the invention, a VWF linker suitable for connecting a VWF protein and a heterologous fragment in chimeric molecules contains an a2 region that contains an amino acid sequence that is at least about 80, about 85, about 90, about 95, or 100% identical to the region from Glu720 to Arg740 corresponding to full-length FVIII, while the a2 region is capable of being cleaved by thrombin. In a particular embodiment, region a2 contains ISDKNTGDYYEDSYEDISAYLLSKNNAIEPRSFS (SEQ ID NO: 4). In another embodiment, a VWF linker suitable for connecting the VWF protein and the heterologous fragment contains an al region that contains an amino acid sequence that is at least about 80%, about 85%, about 90%, about 95%, or 100% identical to the Met337 to Arg372 region. corresponding to full-length FVIII, while the a1 region is capable of being cleaved by thrombin. In some embodiments, region a1 contains ISMKNNEEAEDYDDDLTDSEMDVVRFDDDNSPSFIQIRSV (SEQ ID NO: 5). In other embodiments, a VWF linker suitable for connecting the VWF protein and the heterologous fragment contains an a3 region that contains an amino acid sequence that is at least about 80%, about 85%, about 90%, about 95%, or 100% identical to the Glu1649 to Arg1689 region. corresponding to full-length FVIII, while the a3 region is capable of being cleaved by thrombin. In a specific embodiment, the a3 region contains ISEITRTTLQSDQEEroYDDTISVEMKKEDFDIYDEDENQSPRSFQ (SEQ ID NO: 6). In still other embodiments, a VWF linker suitable for connecting the VWF protein and the heterologous fragment comprises a thrombin cleavage site containing X-V-P-R (SEQ ID NO: 3) and a PAR1 interaction exosite motif, wherein the PAR1 interaction exosite motif contains S-F-LL-R-N (SEQ ID NO: 7). In one embodiment, the PAR1 interaction exosite motif further comprises a sequence selected from P, P-N, P-N-D, P-N-D-K (SEQ ID NO: 8), PN-D-K-Y (SEQ ID NO: 9), P-N-D-K-Y-E (SEQ ID NO: 10), P-N-D-K-Y-E-P (SEQ ID NO: 11), P-N-D-K-Y-EP-F (SEQ ID NO: 12), P-N-D-K-Y-E-P-F-W (SEQ ID NO: 13), P-N-D-K-Y-E-P-F-W-E (SEQ ID NO: 14) or any combination thereof. In another embodiment, the aliphatic amino acid is selected from glycine, alanine, valine, leucine, or isoleucine. In a particular embodiment, the VWF linker contains GGLVPRSFLLRNPNDKYEPFWEDEES (SEQ ID NO: 24). In certain embodiments, thrombin cleaves the VWF linker faster than thrombin would cleave the thrombin cleavage site if the thrombin cleavage site replaced the VWF linker in the chimeric molecule. In other embodiments, thrombin cleaves the VWF linker at least about 10-fold, at least about 20-fold, at least about 30-fold, at least about 40-fold, at least about 50-fold, at least about 60 times, at least about 70 times, at least about 80 times, at least about 90 times, or at least about 100 times faster than thrombin would cleave the thrombin cleavage site if the thrombin cleavage site replaced the VWF linker in the chimeric molecule.

- 2 041588- 2 041588

В некоторых вариантах реализации изобретения линкер VWF дополнительно содержит одну или более аминокислот и имеет длину по меньшей мере около 5, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 210, 220, 230, 240, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1200, 1400, 1600, 1800 или 2000 аминокислот. В одном примере одна или более аминокислот содержат пептид gly. В другом примере одна или более аминокислот содержат GlyGly. В других примерах одна или более аминокислот содержат пептид gly/ser. В некоторых примерах пептид gly/ser имеет формулу (Gly4Ser)n или S(Gly4Ser)n, где n обозначает положительное целое число, выбранное из 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 30, 40, 50, 60, 70, 80 или 100. В определенных примерах линкер (Gly4Ser)n представляет собой (Gly4Ser)3 (SEQ ID NO: 89) или (Gly4Ser)4 (SEQ ID NO: 90).In some embodiments, the VWF linker further comprises one or more amino acids and is at least about 5, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140 in length, 150 160 170 180 190 200 210 220 230 240 250 300 350 400 450 500 550 600 650 700 750 800 850 900 950 1000, 1200, 1400, 1600, 1800 or 2000 amino acids. In one example, one or more amino acids comprise a gly peptide. In another example, one or more amino acids contain GlyGly. In other examples, one or more amino acids comprise the gly/ser peptide. In some examples, the gly/ser peptide has the formula (Gly 4 Ser)n or S(Gly 4 Ser)n, where n is a positive integer selected from 1, 2, 3, 4, 5, 6, 7, 8, 9 , 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 30, 40, 50, 60, 70, 80, or 100. In certain examples, the (Gly4Ser)n linker is (Gly 4 Ser) 3 (SEQ ID NO: 89) or (Gly 4 Ser) 4 (SEQ ID NO: 90).

Белок VWF, пригодный для химерной молекулы по изобретению, может содержать домен D' и домен D3 VWF, где домен D' и домен D3 способны связываться с белком FVIII. В одном варианте реализации изобретения домен D' белка VWF содержит аминокислотную последовательность, по меньшей мере на около 90, 95, 96, 97, 98, 99 или 100% идентичную аминокислотам 764-866 SEQ ID NO: 2. В другом варианте реализации изобретения домен D3 белка VWF содержит аминокислотную последовательность, по меньшей мере на около 90, 95, 96, 97, 98, 99 или 100% идентичную аминокислотам 867-1240 SEQ ID NO: 2. В других вариантах реализации изобретения белок VWF содержит по меньшей мере одно аминокислотное замещение в остатке, соответствующем остатку 1099, остатку 1142, или обоим остаткам 1099 и 1142 SEQ ID NO: 2. В еще одних вариантах реализации изобретения в последовательности белка VWF, аминокислота, отличная от цистеина, замещает остаток, соответствующий остатку 1099, остатку 1142 или обоим остаткам 1099 и 1142 SEQ ID NO: 2. В других вариантах реализации изобретения последовательность белка VWF содержит аминокислоты 764-1240 SEQ ID NO: 2. В определенных вариантах реализации изобретения белок VWF дополнительно содержит домен D1, домен D2, или домены D1 и D2 VWF. В некоторых вариантах реализации изобретения белок VWF дополнительно содержит домен VWF, выбранный из домена А1, домена А2, домена A3, домена D4, домена В1, домена В2, домена В3, домена С1, домена С2, домена CK, одного или более их фрагментов, или любых их комбинаций. В других вариантах реализации изобретения белок VWF состоит, по существу, из или состоит из: (1) доменов D' и D3 VWF или их фрагментов; (2) доменов D1, D' и D3 VWF или их фрагментов; (3) доменов D2, D' и D3 VWF или их фрагментов; (4) доменов D1, D2, D' и D3 VWF или их фрагментов; или (5) доменов D1, D2, D', D3 и A1 VWF или их фрагментов. В еще одних вариантах реализации изобретения белок VWF дополнительно содержит сигнальный пептид VWF. В других вариантах реализации изобретения белок VWF является пегилированным, гликозилированным, гэкилированным (гидроксиэтилкрохмалконъюгированным) или полисиалилированным. Термин пегилированный относится к наличию полиэтиленгликоля (ПЭГ), присоединенного к белку; термин гликозилированный относится к наличию гликозилирования белка; термин гэкилированный относится к наличию гидроксиэтилкрахмала (ГЭК), присоединенного к белку; и термин полисиалилированный относится к наличию полисиаловой кислоты (ПСК), присоединенной к белку. Примеры ПЭГ, ГЭК и ПСК приведены в других разделах данного документа.A VWF protein suitable for a chimeric molecule of the invention may comprise a D' domain and a VWF D3 domain, wherein the D' domain and D3 domain are capable of binding to the FVIII protein. In one embodiment, the D' domain of the VWF protein contains an amino acid sequence at least about 90%, 95%, 96%, 97%, 98%, 99%, or 100% identical to amino acids 764-866 of SEQ ID NO: 2. In another embodiment, the domain D3 of the VWF protein contains an amino acid sequence that is at least about 90%, 95%, 96%, 97%, 98%, 99%, or 100% identical to amino acids 867-1240 of SEQ ID NO: 2. In other embodiments, the VWF protein contains at least one amino acid a substitution at residue corresponding to residue 1099, residue 1142, or both residues 1099 and 1142 of SEQ ID NO: 2. In still other embodiments, in the VWF protein sequence, an amino acid other than cysteine replaces the residue corresponding to residue 1099, residue 1142, or both residues 1099 and 1142 of SEQ ID NO: 2. In other embodiments, the VWF protein sequence contains amino acids 764-1240 of SEQ ID NO: 2. In certain embodiments, the invention ie, the VWF protein additionally contains a D1 domain, a D2 domain, or the D1 and D2 domains of the VWF. In some embodiments, the VWF protein further comprises a VWF domain selected from an A1 domain, an A2 domain, an A3 domain, a D4 domain, a B1 domain, a B2 domain, a B3 domain, a C1 domain, a C2 domain, a CK domain, one or more fragments thereof, or any combination of them. In other embodiments, the VWF protein consists essentially of or consists of: (1) VWF D' and D3 domains or fragments thereof; (2) VWF D1, D' and D3 domains or fragments thereof; (3) VWF D2, D' and D3 domains or fragments thereof; (4) VWF D1, D2, D' and D3 domains or fragments thereof; or (5) VWF D1, D2, D', D3 and A1 domains or fragments thereof. In still other embodiments, the VWF protein further comprises a VWF signal peptide. In other embodiments, the VWF protein is pegylated, glycosylated, gekylated (hydroxyethyl starch conjugated), or polysialylated. The term pegylated refers to the presence of polyethylene glycol (PEG) attached to a protein; the term glycosylated refers to the presence of protein glycosylation; the term gekylated refers to the presence of hydroxyethyl starch (HES) attached to a protein; and the term polysialylated refers to the presence of polysialic acid (PSA) attached to a protein. Examples of PEG, HES and PSA are given elsewhere in this document.

В некоторых аспектах гетерологичный фрагмент (H1), соединенный с белком VWF с помощью линкера VWF, способен увеличивать период полувыведения химерной молекулы. В одном варианте реализации изобретения гетерологичный фрагмент (H1) содержит константную область иммуноглобулина или ее участок, альбумин, альбуминсвязывающий фрагмент, PAS, HAP, трансферрин или его фрагмент, полиэтиленгликоль (ПЭГ), гидроксиэтилкрахмал (ГЭК), ПСК, С-концевой пептид (СТР) β-субъединицы хорионического гонадотропина человека, или любую их комбинацию. В другом варианте реализации изобретения гетерологичный фрагмент содержит партнера связывания FcRn. В других вариантах реализации изобретения гетерологичный фрагмент содержит Fc-область. В других вариантах реализации изобретения гетерологичный фрагмент (H1) содержит клиренс-рецептор, или его фрагмент, причем клиренс-рецептор блокирует связывание белка FVIII с клиренс-рецепторами FVIII. В некоторых вариантах реализации изобретения клиренс-рецептор представляет собой рецептор липоппротеинов низкой плотности - связанный белок 1 (LRP1) или его FVШ-связывающий фрагмент. В некоторых аспектах второй гетерологичный фрагмент, соединенный с белком FVIII через необязательный линкер FVIII, содержит константную область иммуноглобулина или ее участок, альбумин, альбумин-связывающий полипептид, PAS, C-концевой пептид (СТР) β-субъединицы хорионического гонадотропина человека, полиэтиленгликоль (ПЭГ), гидроксиэтилкрахмал (ГЭК), альбумин-связывающие малые молекулы, или любые их комбинации. В одном варианте реализации изобретения второй гетерологичный фрагмент (Н2) способен увеличивать период полувыведения белка FVIII. В другом варианте реализации изобретения второй гетерологичный фрагмент (Н2) содержит полипептид, неполипептидный фрагмент, или оба. В другом варианте реализации изобретения второй гетерологичный фрагмент (Н2) содержит константную область иммуноглобулина или ее участок. В еще одних вариантах реализации изобретения второй гетерологичный фрагмент содержит партнер связывания FcRn. В других вариантах реализации изобретения второй гетерологичный фрагмент содержит вторую Fc-область. В некоторых вариантах реализации изобретенияIn some aspects, a heterologous fragment (H1) coupled to a VWF protein via a VWF linker is capable of increasing the half-life of the chimeric molecule. In one embodiment, the heterologous fragment (H1) comprises an immunoglobulin constant region or portion thereof, albumin, albumin-binding fragment, PAS, HAP, transferrin or fragment thereof, polyethylene glycol (PEG), hydroxyethyl starch (HES), PSK, C-terminal peptide (STR ) β-subunit of human chorionic gonadotropin, or any combination thereof. In another embodiment, the heterologous fragment contains an FcRn binding partner. In other embodiments of the invention, the heterologous fragment contains an Fc region. In other embodiments of the invention, the heterologous fragment (H1) contains a clearance receptor, or a fragment thereof, and the clearance receptor blocks the binding of the FVIII protein to the clearance FVIII receptors. In some embodiments, the clearance receptor is a low density lipoprotein receptor associated protein 1 (LRP1) or a FVIII binding fragment thereof. In some aspects, the second heterologous fragment linked to the FVIII protein via an optional FVIII linker comprises an immunoglobulin constant region or region, albumin, albumin-binding polypeptide, PAS, human chorionic gonadotropin β-subunit C-terminal peptide (TPP), polyethylene glycol (PEG ), hydroxyethyl starch (HES), albumin-binding small molecules, or any combination thereof. In one embodiment, the second heterologous fragment (H2) is capable of increasing the half-life of the FVIII protein. In another embodiment, the second heterologous fragment (H2) contains a polypeptide, a non-polypeptide fragment, or both. In another embodiment, the second heterologous fragment (H2) contains an immunoglobulin constant region or portion thereof. In still other embodiments of the invention, the second heterologous fragment contains an FcRn binding partner. In other embodiments of the invention, the second heterologous fragment contains a second Fc region. In some embodiments of the invention

- 3 041588 первый гетерологичный фрагмент, соединенный с белком VWF с помощью линкера VWF, и второй гетерологичный фрагмент, соединенный с белком FVIII с помощью необязательного линкера, в котором последовательность XTEN связана с любым из компонентов, ассоциированы друг с другом. В одном варианте реализации изобретения ассоциация между первой полипептидной цепью и вторым полипептидом обозначает ковалентную связь. В другом варианте реализации изобретения ассоциация между первым гетерологичным фрагментом и вторым гетерологичным фрагментом представляет собой дисульфидную связь. В других вариантах реализации изобретения первый гетерологичный фрагмент является партнером связывания FcRn и второй гетерологичный фрагмент является партнером связывания FcRn. В еще одних вариантах реализации изобретения первый гетерологичный фрагмент является Fc-областью и второй гетерологичный фрагмент является Fc-областью.- 3 041588 the first heterologous fragment connected to the VWF protein using a VWF linker, and the second heterologous fragment connected to the FVIII protein using an optional linker, in which the XTEN sequence is linked to any of the components, are associated with each other. In one embodiment, the association between the first polypeptide chain and the second polypeptide denotes a covalent bond. In another embodiment of the invention, the association between the first heterologous fragment and the second heterologous fragment is a disulfide bond. In other embodiments, the first heterologous fragment is an FcRn binding partner and the second heterologous fragment is an FcRn binding partner. In still other embodiments, the first heterologous fragment is an Fc region and the second heterologous fragment is an Fc region.

В определенных вариантах реализации изобретения белок FVIII соединен со вторым гетерологичным фрагментом с помощью линкера FVIII. В одном варианте реализации изобретения второй линкер представляет собой расщепляемый линкер. В другом варианте реализации изобретения линкер FVIII идентичен линкеру VWF. В других вариантах реализации изобретения линкер FVIII отличается от линкера VWF. В некоторых аспектах химерная молекула по изобретению имеет формулу, выбранную из: (a) V-L1-X1-H1:H2-L2-X2-C; (b) V-X1-L1-H1:H2-L2-X2-C; (с) V-L1-X1-H1:H2-X2-L2-C; (d) V-X1-L1-H1:H2X2-L2-C; (e) V-L1-X1-H1: H2-L2-C(X2); (f) V-X1-L1-H1:H2-L2-C(X2); (g) C-X2-L2-H2:H1-X1-L1-V; (h) C-X2-L2-H2:H1-L1-X1-V; (i) C-L2-X2-H2:H1-L1-X1-V; (j) C-L2-X2-H2:H1-L1-X1-V; (k) C(X2)-L2-H2:H1X1-L1-V; или (1) C(X2)-L2-H2:H1-L1-X1-V; где V обозначает белок VWF; L1 обозначает линкер VWF; L2 обозначает необязательный линкер FVIII; H1 представляет собой первый гетерологичный фрагмент; Н2 обозначает второй гетерологичный фрагмент; X1 обозначает последовательность XTEN; X2 обозначает необязательную последовательность XTEN; С обозначает белок FVIII; С(Х2) обозначает белок FVIII, слитый с последовательностью XTEN, причем последовательность XTEN вставлена между двумя соседними аминокислотами FVIII; (-) обозначает пептидную связь или одну или более аминокислот; и (:) обозначает ковалентную связь между H1 и Н2.In certain embodiments of the invention, the FVIII protein is connected to the second heterologous fragment using a FVIII linker. In one embodiment of the invention, the second linker is a cleavable linker. In another embodiment, the FVIII linker is identical to the VWF linker. In other embodiments, the FVIII linker is different from the VWF linker. In some aspects, the chimeric molecule of the invention has the formula selected from: (a) V-L1-X1-H1:H2-L2-X2-C; (b) V-X1-L1-H1:H2-L2-X2-C; (c) V-L1-X1-H1:H2-X2-L2-C; (d) V-X1-L1-H1:H2X2-L2-C; (e) V-L1-X1-H1: H2-L2-C(X2); (f) V-X1-L1-H1:H2-L2-C(X2); (g) C-X2-L2-H2:H1-X1-L1-V; (h) C-X2-L2-H2:H1-L1-X1-V; (i) C-L2-X2-H2:H1-L1-X1-V; (j) C-L2-X2-H2:H1-L1-X1-V; (k) C(X2)-L2-H2:H1X1-L1-V; or (1) C(X2)-L2-H2:H1-L1-X1-V; where V is a VWF protein; L1 is a VWF linker; L2 is an optional FVIII linker; H1 is the first heterologous fragment; H2 denotes the second heterologous fragment; X1 denotes the sequence XTEN; X2 denotes an optional XTEN sequence; C is FVIII protein; C(X2) is a FVIII protein fused to an XTEN sequence, with the XTEN sequence inserted between two adjacent FVIII amino acids; (-) denotes a peptide bond or one or more amino acids; and (:) denotes a covalent bond between H1 and H2.

В других аспектах химерная молекула имеет формулу, выбранную из: (а) V-L1-X1-H1: H2-L2-X2-C; (b) V-X1-L1-H1: H2-L2-X2-C; (с) V-L1-X1-H1: H2-X2-L2-C; (d) V-X1-L1-H1: H2-X2-L2-C; (е) V-L1-X1H1: H2-L2-C(X2); (f) V-X1-L1-H1: H2-L2-C(X2); (g) C-X2-L2-H2: H1-X1-L1-V; (h) C-X2-L2-H2: H1-L1X1-V; (i) C-L2-X2-H2:H1-L1-X1-V; (j) C-L2-X2-H2:H1-L1-X1-V; (k) C(X2)-L2-H2:H1-X1-L1-V; или (1) C(X2)-L2-H2:H1-L1-X1-V; где V обозначает белок VWF; L1 обозначает линкер VWF; L2 обозначает необязательный линкер FVIII; H1 обозначает первый гетерологичный фрагмент; Н2 обозначает второй гетерологичный фрагмент; X1 обозначает необязательную последовательность XTEN; X2 обозначает последовательность XTEN; С обозначает белок FVIII; C(X2) обозначает белок FVIII, слитый с последовательностью XTEN, причем последовательность XTEN вставлена между двумя соседними аминокислотами FVIII; (-) обозначает пептидную связь или одну или более аминокислот; и (:) обозначает ковалентную связь между H1 и Н2. В химерных молекулах по изобретению белок VWF может ингибировать или предотвращать связывание эндогенного VWF с белком FVIII.In other aspects, the chimeric molecule has the formula selected from: (a) V-L1-X1-H1: H2-L2-X2-C; (b) V-X1-L1-H1: H2-L2-X2-C; (c) V-L1-X1-H1: H2-X2-L2-C; (d) V-X1-L1-H1: H2-X2-L2-C; (e) V-L1-X1H1: H2-L2-C(X2); (f) V-X1-L1-H1: H2-L2-C(X2); (g) C-X2-L2-H2: H1-X1-L1-V; (h) C-X2-L2-H2: H1-L1X1-V; (i) C-L2-X2-H2:H1-L1-X1-V; (j) C-L2-X2-H2:H1-L1-X1-V; (k) C(X2)-L2-H2:H1-X1-L1-V; or (1) C(X2)-L2-H2:H1-L1-X1-V; where V is a VWF protein; L1 is a VWF linker; L2 is an optional FVIII linker; H1 denotes the first heterologous fragment; H2 denotes the second heterologous fragment; X1 denotes an optional XTEN sequence; X2 denotes the sequence XTEN; C is FVIII protein; C(X2) is a FVIII protein fused to an XTEN sequence, with the XTEN sequence inserted between two adjacent FVIII amino acids; (-) denotes a peptide bond or one or more amino acids; and (:) denotes a covalent bond between H1 and H2. In the chimeric molecules of the invention, the VWF protein can inhibit or prevent endogenous VWF from binding to the FVIII protein.

В определенных аспектах белок FVIII в химерных молекулах может содержать третий гетерологичный фрагмент (Н3). Третий гетерологичный фрагмент (Н3) может быть последовательностью XTEN. В других аспектах белок FVIII содержит четвертый гетерологичный фрагмент (Н4). Четвертый гетерологичный фрагмент (Н4) может быть последовательностью XTEN. В некоторых аспектах, белок FVIII содержит пятый гетерологичный фрагмент (Н5). Пятый гетерологичный фрагмент может быть последовательностью XTEN. В других аспектах, белок FVIII содержит шестой гетерологичный фрагмент (Н6). Шестой гетерологичный фрагмент может быть последовательностью XTEN. В определенных аспектах, один или более из третьего гетерологичного фрагмента (Н3), четвертого гетерологичного фрагмента (Н4), пятого гетерологичного фрагмента (Н5) и шестого гетерологичного фрагмента (Н6) способны увеличивать период полувыведения химерной молекулы. В других аспектах, третий гетерологичный фрагмент (Н3), четвертый гетерологичный фрагмент (Н4), пятый гетерологичный фрагмент (Н5) и шестой гетерологичный фрагмент (Н6) присоединены к С-концу или N-концу FVIII или вставлены между двумя аминокислотами белка FVIII. В других аспектах один или более из третьего гетерологичного фрагмента, четвертого гетерологичного фрагмента, пятого гетерологичного фрагмента и шестого гетерологичного фрагмента содержат отрезок, выбранный из одного или более из около 42 аминокислот, около 72 аминокислот, около 108 аминокислот, около 144 аминокислот, около 180 аминокислот, около 216 аминокислот, около 252 аминокислот, около 288 аминокислот, около 324 аминокислот, около 360 аминокислот, около 396 аминокислот, около 432 аминокислот, около 468 аминокислот, около 504 аминокислот, около 540 аминокислот, около 576 аминокислот, около 612 аминокислот, около 624 аминокислот, около 648 аминокислот, около 684 аминокислот, около 720 аминокислот, около 756 аминокислот, около 792 аминокислот, около 828 аминокислот, около 836 аминокислот, около 864 аминокислот, около 875 аминокислот, около 912 аминокислот, около 923 аминокислот, около 948 аминокислот, около 1044 аминокислот, около 1140 аминокислот, около 1236 аминокислот, около 1318 аминокислот, около 1332 аминокислот, около 1428 аминокислот, около 1524 аминокислот, около 1620 аминокислот, около 1716 аминокислот, около 1812 аминокислот, около 1908 аминокислот или около 2004 аминокислот. Например, последовательностьIn certain aspects, the FVIII protein in the chimeric molecules may contain a third heterologous fragment (H3). The third heterologous fragment (H3) may be the XTEN sequence. In other aspects, the FVIII protein contains a fourth heterologous fragment (H4). The fourth heterologous fragment (H4) may be the XTEN sequence. In some aspects, the FVIII protein contains a fifth heterologous fragment (H5). The fifth heterologous fragment may be the XTEN sequence. In other aspects, the FVIII protein contains a sixth heterologous fragment (H6). The sixth heterologous fragment may be the XTEN sequence. In certain aspects, one or more of the third heterologous moiety (H3), the fourth heterologous moiety (H4), the fifth heterologous moiety (H5), and the sixth heterologous moiety (H6) are capable of increasing the half-life of the chimeric molecule. In other aspects, the third heterologous fragment (H3), the fourth heterologous fragment (H4), the fifth heterologous fragment (H5) and the sixth heterologous fragment (H6) are attached to the C-terminus or N-terminus of FVIII or are inserted between two amino acids of the FVIII protein. In other aspects, one or more of the third heterologous fragment, the fourth heterologous fragment, the fifth heterologous fragment, and the sixth heterologous fragment contain a segment selected from one or more of about 42 amino acids, about 72 amino acids, about 108 amino acids, about 144 amino acids, about 180 amino acids , about 216 amino acids, about 252 amino acids, about 288 amino acids, about 324 amino acids, about 360 amino acids, about 396 amino acids, about 432 amino acids, about 468 amino acids, about 504 amino acids, about 540 amino acids, about 576 amino acids, about 612 amino acids, about 624 amino acids, about 648 amino acids, about 684 amino acids, about 720 amino acids, about 756 amino acids, about 792 amino acids, about 828 amino acids, about 836 amino acids, about 864 amino acids, about 875 amino acids, about 912 amino acids, about 923 amino acids, about 948 amino acids , about 1044 amino acids, about 1140 amino acids, about 1236 amino acids, about 1318 amino acids, about 1332 amino acids, about 1428 amino acids, about 1524 amino acids, about 1620 amino acids, about 1716 amino acids, about 1812 amino acids, about 1908 amino acids, or about 2004 amino acids. For example, the sequence

- 4 041588- 4 041588

XTEN третьего гетерологичного фрагмента, четвертого гетерологичного фрагмента, пятого гетерологичного фрагмента или шестого гетерологичного фрагмента может быть выбрана из АЕ42, АЕ72, АЕ864, АЕ576, АЕ288, АЕ144, AG864, AG576, AG288 или AG144. В частности последовательность XTEN может быть выбрана из SEQ ID NO: 39; SEQ ID NO: 40; SEQ ID NO: 47; SEQ ID NO: 45; SEQ ID NO: 43; SEQ ID NO: 41; SEQ ID NO: 48; SEQ ID NO: 46, SEQ ID NO: 44 или SEQ ID NO: 42. В определенных вариантах реализации изобретения период полувыведения химерной молекулы увеличивается по меньшей мере в около 1,5 раза, по меньшей мере в около 2 раза, по меньшей мере в около 2,5 раза, по меньшей мере в около 3 раза, по меньшей мере в около 4 раза, по меньшей мере в около 5 раз, по меньшей мере в около 6 раз, по меньшей мере в около 7 раз, по меньшей мере в около 8 раз, по меньшей мере в около 9 раз, по меньшей мере в около 10 раз, по меньшей мере в около 11 раз или по меньшей мере в около 12 раз по сравнению с FVIII дикого типа.The XTEN of the third heterologous moiety, the fourth heterologous moiety, the fifth heterologous moiety, or the sixth heterologous moiety may be selected from AE42, AE72, AE864, AE576, AE288, AE144, AG864, AG576, AG288, or AG144. In particular, the sequence XTEN can be selected from SEQ ID NO: 39; SEQ ID NO: 40; SEQ ID NO: 47; SEQ ID NO: 45; SEQ ID NO: 43; SEQ ID NO: 41; SEQ ID NO: 48; SEQ ID NO: 46, SEQ ID NO: 44, or SEQ ID NO: 42. In certain embodiments, the half-life of the chimeric molecule is increased by at least about 1.5-fold, at least about 2-fold, at least about 2.5 times, at least about 3 times, at least about 4 times, at least about 5 times, at least about 6 times, at least about 7 times, at least about 8 times, at least about 9 times, at least about 10 times, at least about 11 times, or at least about 12 times compared to wild-type FVIII.

Настоящее описание также предусматривает полинуклеотид или набор полинуклеотидов, кодирующих химерную молекулу или ее комплементарную последовательность. Полинуклеотид или набор полинуклеотидов может дополнительно содержать полинуклеотидную цепь, которая кодирует РС5 или РС7.The present disclosure also provides for a polynucleotide or set of polynucleotides encoding a chimeric molecule or its complementary sequence. The polynucleotide or set of polynucleotides may further comprise a polynucleotide chain that encodes for PC5 or PC7.

Также включен вектор или набор векторов, содержащих полинуклеотид или набор полинуклеотидов и один или более промоторов, функционально связанных с полинуклеотидом или набором полинуклеотидов. В некоторых вариантах реализации изобретения вектор или набор векторов могут дополнительно содержать дополнительную полинуклеотидную цепь, кодирующую РС5 или РС7.Also included is a vector or set of vectors containing a polynucleotide or set of polynucleotides and one or more promoters operably linked to the polynucleotide or set of polynucleotides. In some embodiments of the invention, the vector or set of vectors may additionally contain an additional polynucleotide chain encoding PC5 or PC7.

Настоящее изобретение также включает клетку-хозяина, содержащую полинуклеотид или набор полинуклеотидов или вектор или набор векторов. В одном варианте реализации изобретения клеткахозяин представляет собой клетку млекопитающего. В другом варианте реализации изобретения клеткухозяина выбирают из клетки HEK293, клетки СНО или клетки ВНК.The present invention also includes a host cell containing a polynucleotide or set of polynucleotides or a vector or set of vectors. In one embodiment, the host cell is a mammalian cell. In another embodiment, the host cell is selected from a HEK293 cell, a CHO cell, or a BHK cell.

В некоторых аспектах изобретение включает фармацевтическую композицию, содержащую химерную молекулу, раскрытую в данном документе, полинуклеотид или набор полинуклеотидов, кодирующих химерную молекулу, вектор или набор векторов, содержащих полинуклеотид или набор полинуклеотидов, или клетку-хозяина, раскрытую в данном документе, и фармацевтически приемлемый носитель. В одном варианте реализации изобретения химерная молекула в композиции имеет увеличенный период полувыведения по сравнению с белком FVIII дикого типа. В другом варианте реализации изобретения период полувыведения химерной молекулы в композиции увеличен по меньшей мере в около 1,5 раза, по меньшей мере в около 2 раза, по меньшей мере в около 2,5 раза, по меньшей мере в около 3 раза, по меньшей мере в около 4 раза, по меньшей мере в около 5 раз, по меньшей мере в около 6 раз, по меньшей мере в около 7 раз, по меньшей мере в около 8 раз, по меньшей мере в около 9 раз, по меньшей мере в около 10 раз, по меньшей мере в около 11 раз или по меньшей мере в около 12 раз по сравнению с FVIII дикого типа.In some aspects, the invention includes a pharmaceutical composition comprising a chimeric molecule as disclosed herein, a polynucleotide or set of polynucleotides encoding a chimeric molecule, a vector or set of vectors containing a polynucleotide or set of polynucleotides, or a host cell as disclosed herein, and a pharmaceutically acceptable carrier. In one embodiment, the chimeric molecule in the composition has an increased half-life compared to the wild-type FVIII protein. In another embodiment, the half-life of the chimeric molecule in the composition is increased by at least about 1.5-fold, at least about 2-fold, at least about 2.5-fold, at least about 3-fold, at least at least about 4 times, at least about 5 times, at least about 6 times, at least about 7 times, at least about 8 times, at least about 9 times, at least about 10 times, at least about 11 times, or at least about 12 times, compared to wild-type FVIII.

Также включен способ снижения частоты или тяжести эпизода кровотечения у субъекта, нуждающегося в этом, включающий введение эффективного количества химерной молекулы, раскрытой в данном документе, полинуклеотида или набора полинуклеотидов, кодирующих химерную молекулу, вектора или набора векторов, раскрытых в данном документе, клетки-хозяина, раскрытой в данном документе, или композиции, раскрытой в данном документе. Изобретение также включает способ предотвращения возникновения эпизода кровотечения у субъекта, нуждающегося в этом, включающий введение эффективного количества химерной молекулы, раскрытой в данном документе, полинуклеотида или набора полинуклеотидов, кодирующих химерную молекулу, вектора или набора векторов, раскрытых в данном документе, клетки-хозяина, раскрытой в данном документе, или композиции, раскрытой в данном документе. В одном варианте реализации изобретения эпизод кровотечения выбирают из нарушения свертываемости крови, гемартроза, мышечного кровотечения, кровотечения в ротовой полости, кровоизлияния, кровоизлияния в мышцы, кровоизлияния в полости рта, травмы, повреждения черепа (trauma capitis), желудочно-кишечного кровотечения, внутричерепного кровоизлияния, внутрибрюшного кровоизлияния, внутригрудного кровоизлияния, перелома кости, кровотечения в центральной нервной системе, кровотечения в заглоточном пространстве, кровотечения в забрюшинном пространстве, кровоизлияния во влагалище подвздошно-поясничной мышцы, или любых их комбинаций. В другом варианте реализации изобретения химерная молекула, раскрытая в данном документе, полинуклеотид или набор полинуклеотидов, кодирующих химерную молекулу, вектор или набор векторов, раскрытых в данном документе, клетка-хозяин, раскрытая в данном документе, или композиция, раскрытая в данном документе, могут быть введены путем, выбранным из местного введения, внутриглазного введения, парентерального введения, интратекального введения, субдурального введения, перорального введения или любых их комбинаций.Also included is a method for reducing the frequency or severity of a bleeding episode in a subject in need thereof, comprising administering an effective amount of a chimeric molecule disclosed herein, a polynucleotide or set of polynucleotides encoding a chimeric molecule, a vector or set of vectors disclosed herein, to a host cell disclosed in this document, or the composition disclosed in this document. The invention also includes a method for preventing a bleeding episode from occurring in a subject in need thereof, comprising administering an effective amount of a chimeric molecule disclosed herein, a polynucleotide or set of polynucleotides encoding a chimeric molecule, a vector or set of vectors disclosed herein, to a host cell, disclosed in this document, or the composition disclosed in this document. In one embodiment of the invention, the bleeding episode is selected from a bleeding disorder, hemarthrosis, muscle bleeding, oral bleeding, hemorrhage, muscle hemorrhage, oral hemorrhage, trauma, skull injury (trauma capitis), gastrointestinal bleeding, intracranial hemorrhage , intra-abdominal hemorrhage, intrathoracic hemorrhage, bone fracture, central nervous system hemorrhage, pharyngeal hemorrhage, retroperitoneal hemorrhage, iliopsoas sheath hemorrhage, or any combination thereof. In another embodiment, a chimeric molecule disclosed herein, a polynucleotide or set of polynucleotides encoding a chimeric molecule, a vector or set of vectors disclosed herein, a host cell disclosed herein, or a composition disclosed herein may be administered by a route selected from topical administration, intraocular administration, parenteral administration, intrathecal administration, subdural administration, oral administration, or any combination thereof.

Настоящее описание также включает способ получения химерной молекулы, включающий трансфекцию одной или более клеток-хозяев полинуклеотидом, раскрытым в данном документе, или вектором, раскрытым в данном документе, и экспрессию химерной молекулы в клетке-хозяине. Способ дополнительно включает выделение химерной молекулы. В некоторых вариантах реализации изобретения активность химерной молекулы по отношению к FVIII может быть измерена путем анализа активированного частичного тромбопластинового времени (АЧТВ) или методом ротационной тромбоэластометрии (ROTEM).The present disclosure also includes a method for producing a chimeric molecule, comprising transfecting one or more host cells with a polynucleotide disclosed herein or a vector disclosed herein, and expressing the chimeric molecule in the host cell. The method further includes isolating the chimeric molecule. In some embodiments, the FVIII activity of the chimeric molecule can be measured by activated partial thromboplastin time (APTT) analysis or by rotational thromboelastometry (ROTEM).

- 5 041588- 5 041588

Краткое описание графических материаловBrief description of graphic materials

Фиг. 1 иллюстрирует примерную схему химерной молекулы (FVIII-XTEN/remepoguMep VWF), содержащей две полипептидные цепи - первую цепь, содержащую белок VWF (например, домен D' и домен D3 VWF) соединенный с Fc-областью с помощью расщепляемого тромбином линкера VWF, и вторую цепь, содержащую белок FVIII, соединенный со второй Fc-областью с помощью линкера FVIII. Белок FVIII содержит один или более XTEN в разных доменах FVIII.Fig. 1 illustrates an exemplary scheme of a chimeric molecule (FVIII-XTEN/remepoguMep VWF) containing two polypeptide chains - the first chain containing a VWF protein (e.g., the D' domain and the D3 domain of the VWF) linked to an Fc region via a thrombin-cleavable VWF linker, and a second chain containing the FVIII protein linked to the second Fc region via an FVIII linker. The FVIII protein contains one or more XTENs in different FVIII domains.

Фиг. 2 иллюстрирует разные конструкты VWF, причем каждый конструкт содержит домен D' и домен D3, соединенные с Fc-областью с помощью расщепляемого тромбином линкера VWF, за исключением контроля (т.е. VWF-052). VWF-031 содержит линкер из 48 аминокислот, включающий сайт расщепления тромбином L-V-P-R (SEQ ID NO: 25). VWF-034 содержит последовательность XTEN, состоящую из 288 аминокислот, и линкер из 35 аминокислот, включающий сайт расщепления тромбином L-V-P-R (SEQ ID NO: 25). VWF-035 содержит линкер из 73 аминокислот, включающий сайт расщепления тромбином L-V-P-R (SEQ ID NO: 25). VWF-036 содержит линкер из 98 аминокислот, включающий сайт расщепления тромбином L-V-P-R (SEQ ID NO: 25). VWF-039 содержит линкер VWF из 26 аминокислот, включающий сайт расщепления тромбином L-V-P-R (SEQ ID NO: 25) и мотив экзосайта взаимодействия PAR1. VWF-051 содержит линкер из 54 аминокислот, включающий сайт расщепления тромбином A-L-RP-R-V-V (SEQ ID NO: 26). VWF-052 содержит линкер из 48 аминокислоты без какого-либо сайта расщепления тромбином (контроль). VWF-054 содержит линкер VWF из 40 аминокислот, включающий область a1 FVIII. VWF-055 содержит линкер VWF из 34 аминокислот, включающий область а2 FVIII. VWF-056 содержит линкер VWF из 46 аминокислот, включающий область а3 FVIII.Fig. 2 illustrates different VWF constructs, with each construct containing a D' domain and a D3 domain linked to an Fc region via a thrombin-cleavable VWF linker, except for the control (ie, VWF-052). VWF-031 contains a 48 amino acid linker including the L-V-P-R thrombin cleavage site (SEQ ID NO: 25). VWF-034 contains a 288 amino acid XTEN sequence and a 35 amino acid linker including the L-V-P-R thrombin cleavage site (SEQ ID NO: 25). VWF-035 contains a 73 amino acid linker including the L-V-P-R thrombin cleavage site (SEQ ID NO: 25). VWF-036 contains a 98 amino acid linker including the L-V-P-R thrombin cleavage site (SEQ ID NO: 25). VWF-039 contains a 26 amino acid VWF linker comprising an L-V-P-R thrombin cleavage site (SEQ ID NO: 25) and a PAR1 interaction exosite motif. VWF-051 contains a 54 amino acid linker comprising the A-L-RP-R-V-V thrombin cleavage site (SEQ ID NO: 26). VWF-052 contains a 48 amino acid linker without any thrombin cleavage site (control). VWF-054 contains a 40 amino acid VWF linker including the a1 region of FVIII. VWF-055 contains a 34 amino acid VWF linker including the a2 region of FVIII. VWF-056 contains a 46 amino acid VWF linker including the a3 region of FVIII.

Фиг. 3А иллюстрирует скорость тромбин-медиируемого расщепления в единицах сдвига положения резонанса за секунду (RU/s) как функцию плотности захвата в единицах RU для слитых конструктов VWF-Fc, т.е. VWF-031, VWF-034, VWF-036, VWF-039, VWF-051 и VWF-052.Fig. 3A illustrates the rate of thrombin-mediated cleavage in units of resonance position shift per second (RU/s) as a function of capture density in units of RU for VWF-Fc fusion constructs, ie. VWF-031, VWF-034, VWF-036, VWF-039, VWF-051 and VWF-052.

Фиг. 3В иллюстрирует скорость тромбин-медиируемого расщепления в единицах сдвига положения резонанса за секунду (RU/s) как функцию плотности захвата в единицах RU для слитых конструктов VWF-Fc, т.е. VWF-031, VWF-034, VWF-036, VWF-051 и VWF-052. В этих экспериментах, каждый слитый конструкт VWF-Fc захватывался при разных плотностях и затем подвергался воздействию фиксированной концентрации альфа-тромбина человека. Наклон каждой кривой на фиг. 3A и 3В непосредственно отображает восприимчивость каждого конструкта к расщеплению тромбином.Fig. 3B illustrates the rate of thrombin-mediated cleavage in units of resonance position shift per second (RU/s) as a function of capture density in units of RU for VWF-Fc fusion constructs, ie. VWF-031, VWF-034, VWF-036, VWF-051 and VWF-052. In these experiments, each VWF-Fc fusion construct was captured at different densities and then exposed to a fixed concentration of human alpha thrombin. The slope of each curve in FIG. 3A and 3B directly depict the susceptibility of each construct to thrombin cleavage.

Фиг. 4А иллюстрирует скорость тромбин-медиируемого расщепления в единицах сдвига положения резонанса за секунду (RU/s) как функцию плотности захвата в единицах RU для слитых конструктов VWF-Fc, т.е. VWF-054, VWF-055 и VWF-056.Fig. 4A illustrates the rate of thrombin-mediated cleavage in units of resonance position shift per second (RU/s) as a function of capture density in units of RU for VWF-Fc fusion constructs, ie. VWF-054, VWF-055 and VWF-056.

Фиг. 4В иллюстрирует скорость тромбин-медиируемого расщепления в единицах сдвига положения резонанса за секунду (RU/s) как функцию плотности захвата в единицах RU для слитых конструктов VWF-Fc, т.е. VWF-031, VWF-039, VWF-054, VWF-055 и VWF-056. В этих экспериментах каждый слитый конструкт VWF-Fc захватывался при разных плотностях и затем подвергался воздействию фиксированной концентрации альфа-тромбина человека. Наклон каждой кривой на фиг. 4А и 4В непосредственно отображает восприимчивость каждого конструкта к расщеплению тромбином.Fig. 4B illustrates the rate of thrombin-mediated cleavage in units of resonance position shift per second (RU/s) as a function of capture density in units of RU for VWF-Fc fusion constructs, ie. VWF-031, VWF-039, VWF-054, VWF-055 and VWF-056. In these experiments, each VWF-Fc fusion construct was captured at different densities and then exposed to a fixed concentration of human alpha thrombin. The slope of each curve in FIG. 4A and 4B directly depict the susceptibility of each construct to thrombin cleavage.

Фиг. 5 иллюстрирует результаты линейного регрессионного анализа с целью определения восприимчивости различных конструктов VWF-Fc - VWF-031, VWF-034, VWF-036, VWF-039, VWF-051, VWF052, VWF-054, VWF-055 и VWF-056 - к тромбин-медиируемому расщеплению. Значения величин выражены в обратных секундах и отображают наклоны кривых, проиллюстрированных на фиг. 3 и 4. Относительную восприимчивость двух разных конструктов определяют как частное от деления значений их соответствующих наклонов. Отношение наклонvwF-039/наклонvwF-031 равно 71, указывая на то, что слитый конструкт VWF-Fc VWF-039 является в 71 раз более чувствительным к тромбин-медиируемому расщеплению, чем VWF-031. Отношение наклонvwF-055/наклонvwF-031 равно 65, и отношение наклонvwF-051/наклонvwF-031 равно 1,8.Fig. 5 illustrates the results of a linear regression analysis to determine the susceptibility of various VWF-Fc constructs - VWF-031, VWF-034, VWF-036, VWF-039, VWF-051, VWF052, VWF-054, VWF-055 and VWF-056 - to thrombin-mediated cleavage. Values are expressed in reciprocal seconds and represent the slopes of the curves illustrated in FIG. 3 and 4. The relative susceptibility of two different constructs is determined as the quotient of dividing the values of their respective slopes. The slopevwF - 039 / slopevwF - 031 ratio is 71, indicating that the VWF-Fc fusion construct VWF-039 is 71 times more sensitive to thrombin-mediated cleavage than VWF-031. The ratio vw F - 0 55/slope vw F - 031 is 65, and the ratio vw F - 0 5 1 /slope vw F - 031 is 1.8.

Фиг. 6 иллюстрирует время свертывания для различных химерных молекул у HemA-пациента, измеренное путем анализа цельной крови методом ROTEM. FVII155/VWF-031 содержит две полипептидные цепи - первую цепь, содержащую BDD FVIII, соединенный с Fc-областью, и вторую цепь, содержащую домен D' и домен D3 VWF, соединенные с Fc-областью через минимальный сайт расщепления тромбином (т.е. L-V-P-R (SEQ ID NO: 25)). FVII155/VWF-039 содержит две полипептидные цепи - первую цепь, содержащую BDD FVIII, соединенный с Fc-областью, и вторую цепь, содержащую домен D' и домен D3 VWF, соединенные с Fc-областью с помощью линкера VWF, содержащего L-V-P-R (SEQ ID NO: 25) и мотив экзосайта взаимодействия PAR1. FVII155/VWF-055 содержит две полипептидные цепи первую цепь, содержащую BDD FVIII, соединенный с Fc-областью, и вторую цепь, содержащую домен D' и домен D3 VWF, соединенные с Fc-областью с помощью линкера VWF, содержащего область а2 из FVIII.Fig. 6 illustrates the clotting time for various chimeric molecules in a HemA patient measured by whole blood assay by ROTEM. FVII155/VWF-031 contains two polypeptide chains - the first chain containing the BDD of FVIII connected to the Fc region, and the second chain containing the D' domain and the D3 domain of VWF connected to the Fc region through a minimal thrombin cleavage site (i.e. .L-V-P-R (SEQ ID NO: 25)). FVII155/VWF-039 contains two polypeptide chains - the first chain containing the BDD of FVIII connected to the Fc region, and the second chain containing the D' domain and the D3 domain of the VWF connected to the Fc region using a VWF linker containing L-V-P-R (SEQ ID NO: 25) and the PAR1 interaction exosite motif. FVII155/VWF-055 contains two polypeptide chains, the first chain containing the BDD of FVIII connected to the Fc region, and the second chain containing the D' domain and the D3 domain of the VWF connected to the Fc region using a VWF linker containing the a2 region from FVIII .

Фиг. 7 иллюстрирует схему типичного гетеродимера FVIII-VWF и конструктов FVIII169, FVIII286, VWF057, VWF059 и VWF062. Например, конструкт FVIII169 содержит белок FVIII с делецией В-домена с замещением R1648A, соединенный с Fc-областью, в котором последовательность XTEN (например, АЕ288) вставлена в положении аминокислоты 745, что соответствует зрелому полноразмерному FVIIIFig. 7 illustrates a schematic of a typical FVIII-VWF heterodimer and constructs FVIII169, FVIII286, VWF057, VWF059, and VWF062. For example, the FVIII169 construct contains a FVIII protein with a B domain deletion with an R1648A substitution fused to an Fc region in which the XTEN sequence (e.g., AE288) is inserted at amino acid position 745, which corresponds to mature full-length FVIII

- 6 041588 (A1-a1-A2-a2-288XTEN-a3-A3-C1-C2-Fc). Конструкт FVIII286 содержит белок FVIII с делецией Вдомена с замещением R1648, соединенный с Fc-областью, в котором последовательность XTEN (например, АЕ288) вставлена в положении аминокислоты 745, что соответствует зрелому полноразмерному FVIII, с дополнительной областью а2 между FVIII и Fc (A1-a1-A2-a2-288XTEN-a3-A3-C1-C2-a2-Fc). VWF057 представляет собой слитый конструкт VWF-Fc, содержащий домен D'D3 белка VWF (с двумя аминокислотными замещениями в домене D'D3, т.е. C336A и С379А), связанный с Fc-областью с помощью линкера VWF, который содержит тромбиновый сайт LVPR (LVPR) и GS-линкер (GS), при этом последовательность XTEN (т.е. 144XTEN) вставлена между доменом D'D3 и линкером VWF (D'D3144XTEN-GS+LVPR-Fc). VWF059 представляет собой слитый конструкт VWF-Fc, содержащий домен D'D3 белка VWF (с двумя аминокислотными замещениями в домене D'D3, т.е. С336А и С379А), связанный с Fc-областью с помощью участка кислотной области 2 (а2) в качестве линкера VWF, при этом последовательность XTEN вставлена между доменом D'D3 и линкером VWF. VWF062 представляет собой слитый конструкт VWF-Fc, содержащий содержит домен D'D3 белка VWF (с двумя аминокислотными замещениями в домене D'D3, т.е. С336А и С379А), связанный с Fc-областью, при этом последовательность XTEN вставлена между доменом D'D3 и Fc-областью (D'D3-144XTEN-Fc).- 6 041588 (A1-a1-A2-a2-288XTEN-a3-A3-C1-C2-Fc). The FVIII286 construct contains a B domain deleted FVIII protein with an R1648 substitution fused to an Fc region in which the XTEN sequence (e.g., AE288) is inserted at amino acid position 745, corresponding to mature full-length FVIII, with an additional a2 region between FVIII and Fc (A1- a1-A2-a2-288XTEN-a3-A3-C1-C2-a2-Fc). VWF057 is a VWF-Fc fusion construct containing the D'D3 domain of the VWF protein (with two amino acid substitutions in the D'D3 domain, i.e. C336A and C379A) linked to the Fc region via a VWF linker that contains a thrombin site LVPR (LVPR) and GS linker (GS), with an XTEN sequence (ie 144XTEN) inserted between the D'D3 domain and the VWF linker (D'D3144XTEN-GS+LVPR-Fc). VWF059 is a VWF-Fc fusion construct containing the D'D3 domain of the VWF protein (with two amino acid substitutions in the D'D3 domain, i.e. C336A and C379A) linked to the Fc region via an acid region region 2 (a2) as a VWF linker, with an XTEN sequence inserted between the D'D3 domain and the VWF linker. VWF062 is a VWF-Fc fusion construct containing the D'D3 domain of the VWF protein (with two amino acid substitutions in the D'D3 domain, i.e. C336A and C379A) linked to the Fc region, with the XTEN sequence inserted between the domain D'D3 and Fc region (D'D3-144XTEN-Fc).

Фиг. 8 иллюстрирует острую эффективность гетеродимеров FVШ-XTEN-Fc/D'D3-линкер-Fc (т.е. FVIII169/VWF034, FVIII169/VWF059 и FVIII169/VWF057), по сравнению с FVIII с делецией В-домена (SQ BDD FVIII или BDD-rFVIII) или контрольным носителем в модели HemA-мышей со срезанным кончиком хвоста. BDD-rFVIII обозначен кружками, и FVIII169/VWF034 обозначен квадратами, FVIII169/VWF059 обозначен треугольниками, FVIII169/VWF057 обозначен незакрашенными кружками, и носитель обозначен перевернутыми треугольниками. VWF034 представляет собой слитый конструкт VWF-Fc, который содержит Fc-область, соединенную с доменом D' и доменом D3 VWF с помощью линкера VWF, содержащий LVPR, при этом последовательность XTEN (т.е. 288XTEN) вставлена между доменом D'D3 и линкером VWF (D'D3-288XTEN-LVPR-Fc). Подробное описание конструктов FVIII169, VWF059 и VWF057 приведено в других разделах данного документа. Медианная потеря крови (мкл) у мышей после введения дозы 75 МЕ/кг конструкта в каждой экспериментальной группе показана горизонтальными линиями.Fig. 8 illustrates the acute potency of FVIII-XTEN-Fc/D'D3-linker-Fc heterodimers (i.e., FVIII169/VWF034, FVIII169/VWF059, and FVIII169/VWF057) compared to B-domain-deleted FVIII (SQ BDD FVIII or BDD-rFVIII) or vehicle control in a clipped-tail HemA mouse model. BDD-rFVIII is indicated by circles and FVIII169/VWF034 is indicated by squares, FVIII169/VWF059 is indicated by triangles, FVIII169/VWF057 is indicated by open circles, and the carrier is indicated by inverted triangles. VWF034 is a VWF-Fc fusion construct that contains an Fc region connected to the D' domain and the D3 domain of the VWF via a VWF linker containing LVPR, with an XTEN sequence (i.e., 288XTEN) inserted between the D'D3 domain and VWF linker (D'D3-288XTEN-LVPR-Fc). Detailed descriptions of constructs FVIII169, VWF059 and VWF057 are provided elsewhere in this document. Median blood loss (µl) in mice after administration of a dose of 75 IU/kg of the construct in each experimental group is shown by horizontal lines.

Подробное описание изобретенияDetailed description of the invention

Настоящее изобретение касается химерной молекулы, содержащей последовательность XTEN и расщепляемый тромбином линкер, соединяющий белок VWF или белок FVIII с гетерологичным фрагментом, например фрагментом, увеличивающим период полувыведения. Изобретение также предусматривает химерную молекулу, содержащую две полипептидные цепи - первую цепь, содержащую белок VWF, связанный с гетерологичным фрагментом, и вторую цепь, содержащую белок FVIII и второй гетерологичный фрагмент, причем химерная молекула содержит последовательность XTEN в первой или второй полипептидных цепях, и или белок VWF, или белок FVIII (или оба) связанны с гетерологичным фрагментом с помощью линкера VWF или линкера FVIII (или обоих). Расщепляемый тромбином линкер (линкер VWF или линкер FVIII) может эффективно расщепляться тромбином в месте повреждения, где тромбин является легкодоступным. Типичные примеры химерных молекул проиллюстрированы в настоящем описании и фигурах. В некоторых вариантах реализации изобретения изобретение относится к химерным молекулам, имеющим структуры, представленные, например, на фиг. 1-7. В других вариантах реализации изобретения изобретение относится к полинуклеотиду, кодирующему конструкты химерных молекул, раскрытые в данном документе.The present invention relates to a chimeric molecule containing an XTEN sequence and a thrombin-cleavable linker that connects a VWF protein or FVIII protein to a heterologous moiety, such as a half-life prolonging moiety. The invention also provides a chimeric molecule containing two polypeptide chains - the first chain containing the VWF protein associated with a heterologous fragment, and the second chain containing the FVIII protein and the second heterologous fragment, and the chimeric molecule contains the XTEN sequence in the first or second polypeptide chains, and or the VWF protein or the FVIII protein (or both) is linked to the heterologous moiety via a VWF linker or an FVIII linker (or both). A thrombin-cleavable linker (VWF linker or FVIII linker) can be efficiently cleaved by thrombin at the site of injury where thrombin is readily available. Typical examples of chimeric molecules are illustrated in the present description and figures. In some embodiments, the invention relates to chimeric molecules having the structures shown, for example, in FIG. 1-7. In other embodiments, the invention provides a polynucleotide encoding the chimeric molecule constructs disclosed herein.

Для обеспечения четкого понимания описания и формулы изобретения, ниже приводятся следующие определения.To ensure a clear understanding of the description and claims, the following definitions are provided.

I. Определения.I. Definitions.

Следует отметить, что объекты, описываемые в единственном числе, относятся к одному или более указанным объектам; например, подразумевается, что нуклеотидная последовательность обозначает одну или более нуклеотидных последовательностей. По существу, термины в единственном числе, один или более, и по меньшей мере один могут использоваться в данном документе взаимозаменяемо. Термин около используется в данном документе в значениях приблизительно, ориентировочно, около или близко к. Когда термин около используется в сочетании с диапазоном числовых значений, он модифицирует этот диапазон путем расширения его границ до значений выше и ниже указанных числовых величин. В общем, термин около используется в данном документе для модификации числовой величины за счет отклонения ее на 10 процентов от указанного значения в большую или меньшую сторону (выше или ниже).It should be noted that objects described in the singular refer to one or more of the specified objects; for example, a nucleotide sequence is meant to refer to one or more nucleotide sequences. As such, the terms singular, one or more, and at least one may be used interchangeably herein. The term about is used herein with the meanings of approximately, roughly, about, or close to. When the term about is used in conjunction with a range of numerical values, it modifies that range by extending its boundaries to values above and below the specified numerical values. In general, the term about is used in this document to modify a numerical value by deviating by 10 percent from the specified value up or down (above or below).

Термин полинуклеотид или нуклеотид рассматривается как охватывающий отдельно взятую нуклеиновую кислоту, а также множество нуклеиновых кислот, и относится к выделенной молекуле или конструкту нуклеиновой кислоты, например матричной РНК (мРПК) или плазмидной ДНК (пДНК). В определенных вариантах реализации изобретения полинуклеотид содержит обычную фосфодиэфирную связь или необычную связь (например, амидную связь, такую как присутствующую в пептидных нуклеиновых кислотах (ПНК)). Термин нуклеиновая кислота относится к любому одному или более сегментам нуклеиновой кислоты, например фрагментам ДНК или РНК, присутствующим в полинуклеотиде.The term polynucleotide or nucleotide is considered to encompass a single nucleic acid as well as a plurality of nucleic acids, and refers to an isolated nucleic acid molecule or construct, such as messenger RNA (mRPK) or plasmid DNA (pDNA). In certain embodiments of the invention, the polynucleotide contains a conventional phosphodiester bond or an unusual bond (eg, an amide bond, such as that present in peptide nucleic acids (PNA)). The term nucleic acid refers to any one or more nucleic acid segments, such as DNA or RNA fragments, present in a polynucleotide.

- 7 041588- 7 041588

Под выделенной нуклеиновой кислотой или полинуклеотидом подразумевается молекула нуклеиновой кислоты, ДНК или РНК, извлеченная из ее естественного окружения. Например, рекомбинантный полинуклеотид, кодирующий полипептид фактора VIII, содержащийся в векторе, считается выделенным в целях настоящего изобретения. Дополнительные примеры выделенного полинуклеотида включают рекомбинантные полинуклеотиды, поддерживаемые в гетерологичных клетках-хозяевах или очищенные (частично или в значительной степени) от других полинуклеотидов в растворе. Выделенные молекулы РНК включают in vivo или in vitro РНК-транскрипты полинуклеотидов по настоящему изобретению. Выделенные полинуклеотиды или нуклеиновые кислоты в соответствии с настоящим изобретением дополнительно включают такие молекулы, полученные путем синтеза. Кроме того, полинуклеотид или нуклеиновая кислота могут включать регуляторные элементы, такие как промоторы, энхансеры, сайты связывания рибосом или сигналы терминации транскрипции.By isolated nucleic acid or polynucleotide is meant a nucleic acid, DNA or RNA molecule extracted from its natural environment. For example, a recombinant polynucleotide encoding a factor VIII polypeptide contained in a vector is considered to be isolated for the purposes of the present invention. Additional examples of an isolated polynucleotide include recombinant polynucleotides maintained in heterologous host cells or purified (partly or to a large extent) of other polynucleotides in solution. Isolated RNA molecules include in vivo or in vitro RNA transcripts of the polynucleotides of the present invention. The isolated polynucleotides or nucleic acids in accordance with the present invention further include such molecules obtained by synthesis. In addition, the polynucleotide or nucleic acid may include regulatory elements such as promoters, enhancers, ribosome binding sites, or transcription termination signals.

В используемом в данном документе значении кодирующая область или кодирующая последовательность представляет собой участок полинуклеотида, который состоит из кодонов, транслируемых в аминокислоты. Хотя стоп-кодон (TAG, TGA или ТАА) типично не транслируется в аминокислоту, он может считаться частью кодирующей области, но любые фланкирующие последовательности, например промоторы, сайты связывания рибосом, терминаторы транскрипции, интроны и т.п., не являются частью кодирующей области. Границы кодирующей области типично определяются старт-кодоном на 5'-конце, кодирующим амино-конец образующегося полипептида, и кодоном терминации трансляции на 3'-конце, кодирующим карбоксильный конец образующегося полипептида. Две или больше кодирующих областей по настоящему изобретению может присутствовать в одном полинуклеотидном конструкте, например в одном векторе или в отдельных полинуклеотидных конструктах, например в отдельных (разных) векторах. Отсюда следует, что один вектор может содержать только одну кодирующую область, или могут содержать две или больше кодирующих областей, например один вектор может отдельно кодировать первую полипептидную цепь и вторую полипептидную цепь химерной молекулы, как описано ниже. Кроме того, вектор, полинуклеотид, или нуклеиновая кислота по изобретению могут кодировать гетерологичные кодирующие области, слитые или неслитые с нуклеиновой кислотой, кодирующей химерную молекулу по изобретению. Гетерологичные кодирующие области включают, без ограничений, специализированные элементы или мотивы, такие как секреторный сигнальный пептид или гетерологичный функциональный домен.As used herein, a coding region or coding sequence is a portion of a polynucleotide that consists of codons translated into amino acids. Although a stop codon (TAG, TGA, or TAA) is not typically translated into an amino acid, it may be considered part of the coding region, but any flanking sequences, such as promoters, ribosome binding sites, transcription terminators, introns, etc., are not part of the coding region. areas. The boundaries of the coding region are typically defined by a start codon at the 5' end, encoding the amino end of the nascent polypeptide, and a translation termination codon at the 3' end, encoding the carboxyl end of the nascent polypeptide. Two or more coding regions of the present invention may be present in a single polynucleotide construct, eg in a single vector, or in separate polynucleotide constructs, eg in separate (different) vectors. It follows that one vector may contain only one coding region, or may contain two or more coding regions, for example, one vector may separately encode the first polypeptide chain and the second polypeptide chain of the chimeric molecule, as described below. In addition, the vector, polynucleotide, or nucleic acid of the invention may encode heterologous coding regions fused or non-fused to the nucleic acid encoding the chimeric molecule of the invention. Heterologous coding regions include, without limitation, specialized elements or motifs such as a secretory signal peptide or a heterologous functional domain.

Определенные белки, секретируемые клетками млекопитающего, ассоциированы с секреторным сигнальным пептидом, который отщепляется от зрелого белка после инициации экспорта растущей белковой цепи через шероховатую эндоплазматическую сеть. Рядовые специалисты в данной области техники знают, что сигнальные пептиды обычно присоединены к N-концу полипептида и отщепляются от полного или полноразмерного полипептида с образованием секретируемой или зрелой формы полипептида. В определенных вариантах реализации используется нативный сигнальный пептид, например сигнальный пептид FVIII или сигнальный пептид VWF, или функциональное производное такой последовательности, которое сохраняет способность направлять секрецию полипептида, функционально ассоциированного с ним. Альтернативно, может быть использован гетерологичный сигнальный пептид млекопитающего, например тканевый активатор плазминогена (ТРА) человека или сигнальный пептид βглюкуронидазы мыши, или их функциональное производное. Термин ниже по ходу транскрипции относится к нуклеотидной последовательности, которая расположена по направлению к 3'-концу от референтной нуклеотидной последовательности. В определенных вариантах реализации изобретения ниже по ходу транскрипции нуклеотидной последовательности относится к последовательности, следующей за точкой начала транскрипции. Например, кодон инициации трансляции гена расположен ниже по ходу транскрипции от сайта начала транскрипции.Certain proteins secreted by mammalian cells are associated with a secretory signal peptide that is cleaved from the mature protein upon initiation of export of the growing protein chain through the rough endoplasmic reticulum. Those of ordinary skill in the art are aware that signal peptides are typically attached to the N-terminus of a polypeptide and are cleaved from the full or full length polypeptide to form the secreted or mature form of the polypeptide. In certain embodiments, a native signal peptide is used, such as a FVIII signal peptide or a VWF signal peptide, or a functional derivative of such a sequence that retains the ability to direct the secretion of a polypeptide operably associated therewith. Alternatively, a heterologous mammalian signal peptide, such as human tissue plasminogen activator (TPA) or mouse β-glucuronidase signal peptide, or a functional derivative thereof, may be used. The term downstream of transcription refers to a nucleotide sequence that is located 3' to the end of a reference nucleotide sequence. In certain embodiments of the invention, downstream of the transcription of a nucleotide sequence refers to the sequence following the start of transcription. For example, the translation initiation codon of a gene is located downstream of the transcription start site.

Термин против хода транскрипции относится к нуклеотидной последовательности, которая расположена по направлению к 5'-концу от референтной нуклеотидной последовательности. В определенных вариантах реализации изобретения расположенные против хода транскрипции нуклеотидные последовательности относятся к последовательностям, находящимся со стороны 5'-конца от кодирующей области или точки начала транскрипции. Например, большинство промоторов расположены в направлении против хода транскрипции от сайта начала транскрипции.The term upstream refers to a nucleotide sequence that is located 5' to the end of a reference nucleotide sequence. In certain embodiments of the invention, upstream nucleotide sequences refer to sequences located 5' to the coding region or transcription start point. For example, most promoters are located upstream of the transcription start site.

В используемом в данном документе значении термин регуляторная область относится к нуклеотидным последовательностям, которые расположены в направлении против хода транскрипции (5'некодирующие последовательности), внутри, или ниже по ходу транскрипции (3'-некодирующие последовательности) от кодирующей области, и которые оказывают влияние на транскрипцию, процессинг РНК, стабильность, или трансляция ассоциированной кодирующей области. Регуляторные области могут включать промоторы, лидерные последовательности трансляции, интроны, последовательности распознавания полиаденилирования, сайты процессинга РНК, эффекторные сайты связывания и структуры стебель-петля. Если кодирующая область предназначена для экспрессии в эукариотической клетке, то сигнал полиаденилирования и последовательность терминации транскрипции будут обычно расположены по направлению к 3'-концу от кодирующей последовательности.As used herein, the term regulatory region refers to nucleotide sequences that are located upstream of transcription (5' non-coding sequences), within or downstream of transcription (3' non-coding sequences) of the coding region, and which have an effect on transcription, RNA processing, stability, or translation of the associated coding region. Regulatory regions may include promoters, translation leader sequences, introns, polyadenylation recognition sequences, RNA processing sites, effector binding sites, and stem-loop structures. If the coding region is intended to be expressed in a eukaryotic cell, then the polyadenylation signal and transcription termination sequence will typically be located 3' to the coding sequence.

Полинуклеотид, который кодирует генный продукт, например полипептид, может включать промоA polynucleotide that encodes for a gene product, such as a polypeptide, may include a promo

- 8 041588 тор и/или другие контрольные элементы транскрипции или трансляции, функционально ассоциированные с одной или более кодирующими областями. При функциональной ассоциации кодирующая область генного продукта, например полипептида, ассоциирована с одной или более регуляторными областями таким образом, чтобы поставить экспрессию генного продукта под влияние или контроль регуляторной области (областей). Например, кодирующая область и промотор являются функционально ассоциированными, если индуцирование функции промотора приводит к транскрипции мРНК, кодирующей генный продукт, кодируемый кодирующей областью, и если природа связи между промотором и кодирующей областью не препятствует способности промотора направлять экспрессию генного продукта или не препятствует способности к транскрипции ДНК-матрицы. Другие контрольные элементы транскрипции, кроме промотора, например энхансеры, операторы, репрессоры и сигналы терминации транскрипции, также могут быть функционально ассоциированы с кодирующей областью для направления экспрессии генного продукта.- 8 041588 torus and/or other transcription or translation control elements operably associated with one or more coding regions. In functional association, the coding region of a gene product, eg a polypeptide, is associated with one or more regulatory regions in such a manner as to bring expression of the gene product under the influence or control of the regulatory region(s). For example, a coding region and a promoter are operably associated if induction of promoter function results in transcription of an mRNA encoding the gene product encoded by the coding region, and if the nature of the association between the promoter and the coding region does not interfere with the promoter's ability to direct expression of the gene product or interfere with transcriptional ability. DNA matrices. Transcriptional control elements other than the promoter, such as enhancers, operators, repressors, and transcription termination signals, may also be operably associated with the coding region to direct expression of the gene product.

Различные контрольные области транскрипции известны квалифицированным специалистам в данной области техники. Они включают, без ограничений, контрольные области транскрипции, которые функционируют в клетках позвоночных, такие как, без ограничений, промоторные и энхансерные сегменты цитомегаловирусов (непосредственный ранний промотор, в сочетании с интроном-А), вирус обезьян 40 (ранний промотор) и ретровирусы (такие как вирус саркомы Рауса). Другие контрольные области транскрипции включают области, выделенные из генов позвоночных, такие как актин, белок теплового шока, бычий гормон роста и β-глобин кролика, а также другие последовательности, способные контролировать экспрессию генов в эукариотических клетках. Дополнительне пригодные контрольные области транскрипции включают тканеспецифичные промоторы и энхансеры, а также лимфокин-индуцируемые промоторы (например, промоторы, индуцируемые интерферонами или интерлейкинами). Аналогично, различные контрольные элементы трансляции известны рядовым специалистам в данной области техники. Они включают, без ограничений, сайты связывания рибосом, кодоны инициации и терминации трансляции и элементы, выделенные из пикорнавирусов (в частности, внутренний рибосомосвязывающий сайт, или IRES, также называемый последовательностью CITE).Various transcriptional control regions are known to those skilled in the art. These include, without limitation, transcriptional control regions that function in vertebrate cells, such as, but not limited to, cytomegalovirus promoter and enhancer segments (immediate early promoter, in combination with intron-A), simian virus 40 (early promoter), and retroviruses ( such as Rous sarcoma virus). Other transcriptional control regions include those isolated from vertebrate genes such as actin, heat shock protein, bovine growth hormone and rabbit β-globin, as well as other sequences capable of controlling gene expression in eukaryotic cells. Additional suitable transcriptional control regions include tissue-specific promoters and enhancers, as well as lymphokine-inducible promoters (eg, promoters induced by interferons or interleukins). Likewise, various translational control elements are known to those of ordinary skill in the art. These include, without limitation, ribosome binding sites, translation initiation and termination codons, and elements isolated from picornaviruses (specifically, the internal ribosome binding site, or IRES, also referred to as the CITE sequence).

Термин экспрессия в используемом в данном документе значении относится к процессу, в котором полинуклеотид продуцирует генный продукт, например РНК или полипептид. Он включает, без ограничений, транскрипцию полинуклеотида в матричную РНК (мРНК), транспортную РНК (тРНК), малую шпилечную РНК (shPHK), малую интерферирующую РНК (siPHK) или любой другой РНК-продукт, и трансляцию мРНК в полипептид. Экспрессия дает генный продукт. В используемом в данном документе значении генный продукт может быть или нуклеиновой кислотой, например матричной РНК, полученной в результате транскрипции гена или полипептида, который транслируется из транскрипта. Генные продукты, описанные в данном документе, дополнительно включают нуклеиновые кислоты с посттранскрипционными модификациями, например полиаденилированием или сплайсингом, или полипептиды с посттрансляционными модификациями, например метилированием, гликозилированием, добавлением липидов, ассоциацией с другими белковыми субъединицами или протеолитическим расщеплением.The term expression as used herein refers to the process in which a polynucleotide produces a gene product, such as an RNA or a polypeptide. It includes, without limitation, transcription of a polynucleotide into messenger RNA (mRNA), transfer RNA (tRNA), small hairpin RNA (shRNA), small interfering RNA (siRNA) or any other RNA product, and translation of the mRNA into a polypeptide. Expression produces a gene product. As used herein, a gene product may either be a nucleic acid, such as messenger RNA, resulting from the transcription of a gene or a polypeptide that is translated from a transcript. The gene products described herein further include nucleic acids with post-transcriptional modifications, such as polyadenylation or splicing, or polypeptides with post-translational modifications, such as methylation, glycosylation, lipid addition, association with other protein subunits, or proteolytic cleavage.

Вектор относится к любому носителю для клонирования и/или переноса нуклеиновой кислоты в клетку-хозяина. Вектор может быть репликоном, к которому может быть присоединен другой сегмент нуклеиновой кислоты для осуществления репликации присоединенного сегмента. Репликон относится к любому генетическому элементу (например, плазмиде, фагу, космиде, хромосоме, вирусу), который функционирует в качестве автономной единицы репликации in vivo, т.е. способной к репликации под своим собственным контролем. Термин вектор включает как вирусные, так и невирусные носители для введения нуклеиновой кислоты в клетку in vitro, ex vivo или in vivo. В данной области техники известно и используется большое число векторов, включая, например, плазмиды, модифицированные эукариотические вирусы, или модифицированные бактериальные вирусы. Вставка полинуклеотида в пригодный вектор может быть осуществлена путем лигирования соответствующих полинуклеотидных фрагментов в выбранный вектор, имеющий комплементарные липкие концы.A vector refers to any vehicle for cloning and/or transferring a nucleic acid into a host cell. The vector may be a replicon to which another nucleic acid segment may be attached to effect replication of the attached segment. Replicon refers to any genetic element (eg, plasmid, phage, cosmid, chromosome, virus) that functions as an autonomous unit of replication in vivo, ie. able to replicate under its own control. The term vector includes both viral and non-viral carriers for introducing a nucleic acid into a cell in vitro, ex vivo or in vivo. A large number of vectors are known and used in the art, including, for example, plasmids, modified eukaryotic viruses, or modified bacterial viruses. Insertion of a polynucleotide into a suitable vector can be accomplished by ligating the appropriate polynucleotide fragments into a vector of choice having complementary sticky ends.

Векторы могут быть подвергнуты генетическим модификациям с целью кодирования селектируемых маркеров или репортеров, которые обеспечивают селекцию или идентификацию клеток со включенным вектором. Экспрессия селектируемых маркеров или репортеров обеспечивает возможность идентификации и/или селекции клеток-хозяев, которые включают и экспрессируют другие кодирующие области, содержащиеся в векторе. Примеры генов селектируемых маркеров, известных и используемых в данной области техники, включают: гены, обеспечивающие стойкость к ампициллину, стрептомицину, гентамицину, канамицин, гигромицин, гербициду биалафосу, сульфонамиду и т.п.; и гены, которые используют в качестве фенотипических маркеров, т.е. регуляторные гены антоцианина, ген изопентанилтрансферазы и т.п. Примеры репортеров, известных и используемых в данной области техники, включают: люциферазу (Luc), зеленый флуоресцентный белок (GFP), хлорамфениколацетилтрансферазу (CAT), -галактозидазу (LacZ), -глюкуронидазу (Gus) и т.п. Селектируемые маркеры могут также считаться репортерами.Vectors can be genetically modified to encode selectable markers or reporters that allow selection or identification of cells with the included vector. Expression of selectable markers or reporters allows the identification and/or selection of host cells that include and express other coding regions contained in the vector. Examples of selectable marker genes known and used in the art include: genes conferring resistance to ampicillin, streptomycin, gentamicin, kanamycin, hygromycin, bialaphos herbicide, sulfonamide, and the like; and genes that are used as phenotypic markers, ie. anthocyanin regulatory genes, isopentanyl transferase gene, and the like. Examples of reporters known and used in the art include: luciferase (Luc), green fluorescent protein (GFP), chloramphenicol acetyltransferase (CAT), α-galactosidase (LacZ), α-glucuronidase (Gus), and the like. Selectable markers can also be considered reporters.

Термин плазмида относится к внехромосомальному элементу, часто несущему ген, не являющийThe term plasmid refers to an extrachromosomal element, often carrying a gene that is not

- 9 041588 ся частью центрального метаболизма клетки и обычно имеющий форму кольцевой двухцепочечной молекулы ДНК. Такие элементы могут быть автономно реплицирующими последовательностями, геноминтегрирующими последовательностями, фагом или нуклеотидными последовательностями, линейной, кольцевой или сверхспиральной, одно- или двухцепочечной ДНК или РНК, выделенными из любого источника, в котором ряд нуклеотидных последовательностей был соединен или рекомбинирован в уникальную конструкцию, способную вводить промоторный фрагмент и последовательность ДНК выбранного генного продукта вместе с соответствующей 3'-нетранслированной последовательностью в клетку.- 9 041588 being part of the central metabolism of the cell and usually in the form of a circular double-stranded DNA molecule. Such elements may be autonomously replicating sequences, genointegrating sequences, phage or nucleotide sequences, linear, circular or supercoiled, single or double stranded DNA or RNA, isolated from any source in which a number of nucleotide sequences have been linked or recombined into a unique construct capable of introducing the promoter fragment and the DNA sequence of the selected gene product, together with the corresponding 3' untranslated sequence, into the cell.

Эукариотические вирусные векторы, которые могут быть использованы, включают, без ограничений, аденовирусные векторы, ретровирусные векторы, адено-ассоциированные вирусные векторы, поксвирус, например векторы на основе вируса коровьей оспы, бакуловирусные векторы или векторы на основе вируса герпеса. Невирусные векторы включают плазмиды, липосомы, электрически заряженные липиды (цитофектины), комплексы ДНК-белок и биополимеры.Eukaryotic viral vectors that can be used include, without limitation, adenovirus vectors, retroviral vectors, adeno-associated viral vectors, poxvirus, such as vaccinia vectors, baculovirus vectors, or herpes virus vectors. Non-viral vectors include plasmids, liposomes, electrically charged lipids (cytofectins), DNA-protein complexes, and biopolymers.

Клонирующий вектор относится к репликону, представляющему собой единичный отрезок нуклеиновой кислоты, который реплицируется последовательно, и который содержит точку начала репликации, такой как плазмида, фаг или космида, к которому может быть присоединен другой сегмент нуклеиновой кислоты для осуществления репликации присоединенного сегмента. Определенные клонирующие векторы способны к репликации в одном типе клеток, например бактериях, и экспрессии в другом, например эукариотических клетках. Клонирующие векторы типично содержат одну или более последовательностей, которые могут быть использованы для селекции клеток, содержащих вектор, и/или один или более множественных сайтов клонирования для вставки последовательностей нуклеиновой кислоты, представляющих интерес.A cloning vector refers to a replicon, which is a single stretch of nucleic acid that replicates sequentially and which contains an origin of replication, such as a plasmid, phage, or cosmid, to which another nucleic acid segment can be attached to replicate the attached segment. Certain cloning vectors are capable of replication in one type of cell, such as bacteria, and expression in another, such as eukaryotic cells. Cloning vectors typically contain one or more sequences that can be used to select cells containing the vector and/or one or more multiple cloning sites to insert nucleic acid sequences of interest.

Термин экспрессионный вектор относится к носителю, сконструированному для обеспечения возможности экспрессии вставленной последовательности нуклеиновой кислоты после введения в клетку-хозяина. Вставленная последовательность нуклеиновой кислоты функционально ассоциируется с регуляторными областями, как описано выше.The term expression vector refers to a carrier designed to allow expression of the inserted nucleic acid sequence after introduction into a host cell. The inserted nucleic acid sequence is operably associated with regulatory regions as described above.

Векторы вводятся в клетки-хозяева способами, хорошо известными в данной области техники, например трансфекцией, электропорацией, микроинъекцией, трансдукцией, слиянием клеток, с помощью DEAE-декстрана, осаждением фосфата кальция, липофекцией (слияние с лизосомами), с использованием генной пушки или вектора-переносчика ДНК.Vectors are introduced into host cells by methods well known in the art, e.g., transfection, electroporation, microinjection, transduction, cell fusion, DEAE-dextran, calcium phosphate precipitation, lipofection (fusion with lysosomes), gene gun, or vector - DNA carrier.

Культура, культивировать и культивация, в используемом в данном документе значении, означают инкубирование клеток в условиях in vitro, обеспечивающих возможность роста или деления клеток или поддержание клеток в жизнеспособном состоянии. Культивируемые клетки, в используемом в данном документе значении, означает клетки, размножающиеся in vitro.Culture, culture and cultivation, as used herein, means the incubation of cells under in vitro conditions that allow cells to grow or divide or maintain cells in a viable state. Cultured cells, as used herein, means cells that propagate in vitro.

В используемом в данном документе значении, термин полипептид рассматривается как охватывающий форму единственного числа полипептид, а также форму множественного числа полипептиды, и относится к молекуле, состоящей из мономеров (аминокислоы), линейно соединенных амидными связями (также известными как пептидные связи). Термин полипептид относится к любой цепи или цепям, состоящим из двух или более аминокислот, и не указывает на определенную длину продукта. Таким образом, пептиды, дипептиды, трипептиды, олигопептиды, белок, аминокислотная цепь или любой другой термин, используемый для обозначения цепи или цепей, состоящих из двух или больше аминокислот, включены в определение полипептида, и термин полипептид может быть использован вместо или взаимозаменяемо с любым из этих терминов. Также предусматривается, что термин полипептид относится к продуктам постэкспрессионной модификации полипептида, включая, без ограничений гликозилирование, ацетилирование, фосфорилирование, амидирование, дериватизацию с помощью известных защитных/блокирующих групп, протеолитическое расщепление, или модификация неприродными аминокислотами. Полипептид может быть выделен из природного биологического источника или получен с использованием рекомбинантной технологии, но не обязательно транслирован из указанной последовательности нуклеиновой кислоты. Он может быть получен любым способом, включая химический синтез.As used herein, the term polypeptide is considered to encompass the singular form of a polypeptide as well as the plural form of a polypeptide, and refers to a molecule composed of monomers (amino acids) linked linearly by amide bonds (also known as peptide bonds). The term polypeptide refers to any chain or chains of two or more amino acids and does not indicate a specific product length. Thus, peptides, dipeptides, tripeptides, oligopeptides, protein, amino acid chain, or any other term used to refer to a chain or chains of two or more amino acids are included in the definition of a polypeptide, and the term polypeptide may be used instead of or interchangeably with any from these terms. The term polypeptide is also intended to refer to products of post-expression modification of a polypeptide, including, without limitation, glycosylation, acetylation, phosphorylation, amidation, derivatization with known protecting/blocking groups, proteolytic cleavage, or modification with unnatural amino acids. The polypeptide may be isolated from a natural biological source or obtained using recombinant technology, but not necessarily translated from the specified nucleic acid sequence. It can be obtained by any method, including chemical synthesis.

Выделенный полипептид или его фрагмент, вариант или производное относится к полипептиду, не находящемуся в его природном окружении. Никакой конкретной степени очистки не требуется. Например, выделенный полипептид может быть просто извлечен из его нативного или природного окружения. Рекомбинантно полученные полипептиды и белки, экспрессируемые в клетках-хозяевах, считаются выделенными в целях изобретения, так же, как и нативные или рекомбинантные полипептиды, которые были отделены, фракционированы, или частично или в значительной степени очищены любым пригодным методом.An isolated polypeptide or fragment, variant or derivative thereof refers to a polypeptide not found in its natural environment. No particular degree of purification is required. For example, an isolated polypeptide may simply be recovered from its native or natural environment. Recombinantly produced polypeptides and proteins expressed in host cells are considered isolated for the purposes of the invention, as are native or recombinant polypeptides that have been separated, fractionated, or partially or substantially purified by any suitable method.

Настоящее изобретение также включает фрагменты или варианты полипептидов и любую их комбинацию. Термины фрагмент или вариант по отношению к полипептид-связывающим доменам или связывающим молекулам по настоящему изобретению включают любые полипептиды, которые сохраняют, по меньшей мере, некоторые свойства (например, аффинность связывания FcRn по отношению к FcRn-связывающему домену или варианту Fc, коагулирующую активность по отношению к варианту FVIII, или активность связывания FVIII по отношению к белку VWF) референтного полипептид. ФрагThe present invention also includes fragments or variants of polypeptides and any combination thereof. The terms fragment or variant with respect to the polypeptide binding domains or binding molecules of the present invention include any polypeptides that retain at least some properties (e.g., FcRn binding affinity for an FcRn binding domain or Fc variant, coagulating activity at with respect to the FVIII variant, or FVIII binding activity with respect to the VWF protein) of the reference polypeptide. Frag

- 10 041588 менты полипептидов включают протеолитические фрагменты, а также фрагменты с делециями, в дополнение к специфическим фрагментам антител, описанным в других разделах данного документа, но не включают природный полноразмерный полипептид (или зрелый полипептид). Варианты полипептидсвязывающих доменов или связывающих молекул по настоящему изобретению включают фрагменты, как описано выше, а также полипептиды с измененными аминокислотными последовательностями в результате аминокислотных замещений, делеций или вставок. Варианты могут встречаться или не встречаться в природных условиях. Неприродные варианты могут быть получены с использованием известных в данной области техники методов мутагенеза. Варианты полипептидов могут содержать консервативные или неконсервативные аминокислотные замещения, делеций или добавления. Термин фрагмент VWF или фрагменты VWF, используемый в данном документе, означает любые фрагменты VWF, которые взаимодействуют с FVIII и сохраняют по меньшей мере одно или более свойств, нормально обеспечиваемых для FVIII полноразмерным VWF, например предотвращение преждевременной активации к FVIIIa, предотвращение преждевременного протеолиза, предотвращение ассоциации с фосфолипидными мембранами, что может приводить к преждевременному клиренсу, предотвращение связывания с клиренс-рецепторами FVIII, которые могут свяывать голый FVIII, но не связанный с VWF FVIII, и/или стабилизацию взаимодействий тяжелой цепи и легкой цепи FVIII. В конкретном варианте реализации изобретения фрагмент VWF, в используемом в данном документе значении, содержит домен D' и домен D3 белка VWF, но не включает домен А1, домен А2, домен A3, домен D4, домен В1, домен В2, домен В3, домен С1, домен С2 и домен CK белка VWF.- 10 041588 polypeptides include proteolytic fragments, as well as fragments with deletions, in addition to specific antibody fragments described elsewhere in this document, but do not include natural full-length polypeptide (or mature polypeptide). Variants of the polypeptide-binding domains or binding molecules of the present invention include fragments as described above, as well as polypeptides with altered amino acid sequences as a result of amino acid substitutions, deletions or insertions. Variants may or may not occur naturally. Non-natural variants can be obtained using mutagenesis methods known in the art. Polypeptide variants may contain conservative or non-conservative amino acid substitutions, deletions or additions. The term VWF fragment or VWF fragments as used herein means any VWF fragments that interact with FVIII and retain at least one or more of the properties normally provided to FVIII by full-length VWF, such as preventing premature activation to FVIIIa, preventing premature proteolysis, preventing association with phospholipid membranes, which can lead to premature clearance, prevention of binding to FVIII clearance receptors that can bind naked FVIII but not VWF bound FVIII, and/or stabilization of FVIII heavy chain and light chain interactions. In a specific embodiment of the invention, the VWF fragment, as used herein, contains the D' domain and the D3 domain of the VWF protein, but does not include the A1 domain, A2 domain, A3 domain, D4 domain, B1 domain, B2 domain, B3 domain, domain C1, C2 domain, and CK domain of the VWF protein.

Термин фактор, ограничивающий период полувыведения или фактор, ограничивающий период полувыведения FVIII, в используемом в данном документе значении, обозначает фактор, который препятствует увеличению период полувыведения белка FVIII более чем в 1,5 или в 2 раза по сравнению с FVIII дикого типа (например, ADVATE® или REFACTO®). Например, полноразмерный или зрелый VWF может действовать как фактор, ограничивающий период полувыведения FVIII, путем индуцирования выведения комплекса FVIII и VWF из системы по одному или более путям клиренса VWF. В одном примере эндогенный VWF представляет собой фактор, ограничивающий период полувыведения FVIII. В другом примере полноразмерная рекомбинантная молекула VWF, нековалентно связанная с белком FVIII, представляет собой фактор, ограничивающий период полувыведения FVIII.The term half-life limiting factor or FVIII half-life limiting factor, as used herein, means a factor that prevents the half-life of the FVIII protein from being increased by more than 1.5 or 2-fold compared to wild-type FVIII (e.g., ADVATE® or REFACTO®). For example, full-length or mature VWF may act as a FVIII half-life limiting factor by inducing clearance of the FVIII and VWF complex from the system via one or more VWF clearance pathways. In one example, endogenous VWF is a FVIII half-life limiting factor. In another example, a full-length recombinant VWF molecule non-covalently linked to the FVIII protein is a FVIII half-life limiting factor.

Термин эндогенный VWF, в используемом в данном документе значении, обозначает молекулы VWF, в природных условиях присутствующие в плазме. Эндогенная молекула VWF может быть мультимером, но может быть мономером или димером. Эндогенный VWF в плазме связывается с FVIII и образует нековалентный комплекс с FVIII. Консервативное аминокислотное замещение представляет собой замещение, при котором аминокислотный остаток замещается на аминокислотный остаток, имеющий схожую боковую цепь. Семейства аминокислотных остатков, имеющих схожие боковые цепи, были определены в данной области техники, включая основные боковые цепи (например, лизин, аргинин, гистидин), кислотные боковые цепи (например, аспарагиновая кислота, глутаминовая кислота), незаряженные полярные боковые цепи (например, глицин, аспарагин, глутамин, серии, треонин, тирозин, цистеин), неполярные боковые цепи (например, аланин, валин, лейцин, изолейцин, пролин, фенилаланин, метионин, триптофан), бета-разветвленные боковые цепи (например, треонин, валин, изолейцин) и ароматические боковые цепи (например, тирозин, фенилаланин, триптофан, гистидин). Таким образом, если аминокислота в полипептиде замещена на другую аминокислоту из того же семейства боковых цепей, такое замещение считается консервативным. В другом варианте реализации изобретения цепочка аминокислот может быть консервативно замещена на структурно схожую цепочку, отличающуюся по порядку и/или по составу членов семейств боковых цепей.The term endogenous VWF, as used herein, refers to VWF molecules naturally present in plasma. The endogenous VWF molecule may be a multimer, but may be a monomer or a dimer. Endogenous VWF in plasma binds to FVIII and forms a non-covalent complex with FVIII. A conservative amino acid substitution is a substitution in which an amino acid residue is replaced with an amino acid residue having a similar side chain. Families of amino acid residues having similar side chains have been defined in the art, including basic side chains (e.g., lysine, arginine, histidine), acidic side chains (e.g., aspartic acid, glutamic acid), uncharged polar side chains (e.g., glycine, asparagine, glutamine, serine, threonine, tyrosine, cysteine), non-polar side chains (e.g. alanine, valine, leucine, isoleucine, proline, phenylalanine, methionine, tryptophan), beta-branched side chains (e.g. threonine, valine, isoleucine) and aromatic side chains (eg tyrosine, phenylalanine, tryptophan, histidine). Thus, if an amino acid in a polypeptide is substituted for another amino acid from the same side chain family, that substitution is considered conservative. In another embodiment of the invention, an amino acid chain may be conservatively substituted for a structurally similar chain that differs in order and/or composition of the members of the side chain families.

Как известно в данной области техники, идентичность последовательностей между двумя полипептидами определяется путем сравнения аминокислотной последовательности одного полипептида с последовательностью второго полипептида. При обсуждении в данном документе, вопрос о том, является ли какой-либо конкретный полипептид на по меньшей мере около 50, 60, 70, 75, 80, 85, 90, 95, 99 или 100% идентичным другому полипептиду, может быть определен с использованием способов и компьютерных программ/прикладного программного обеспечения, известных в данной области техники, таких как, без ограничений, программа BESTFIT (Wisconsin Sequence Analysis Package (программный пакет для анализа последовательностей, Университет Висконсина), версия 8 для операционной системы Unix, Genetics Computer Group, University Research Park, 575 Science Drive, Madison, WI 53711). BESTFIT использует алгоритм локальной гомологии Смита и Уотермана (Smith and Waterman, Advances in Applied Mathematics 2:482-489 (1981)), для нахождения сегмента с наилучшей гомологией между двумя последовательностями. При использовании BESTFIT или любой другой программы для выравнивания последовательностей с целью определения того, является ли определенная последовательность, например, идентичной на 95% референтной последовательности в соответствии с настоящим изобретением, параметры задаются, конечно, таким образом, чтобы процент идентичности рассчитывался по полной длине референтной полипептидной последовательности, и чтобы были дозволены пробелы в гомологии, составляющие до 5% от общего числа аминокислот в референтной последовательности.As known in the art, sequence identity between two polypeptides is determined by comparing the amino acid sequence of one polypeptide with that of a second polypeptide. As discussed herein, whether a particular polypeptide is at least about 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 99%, or 100% identical to another polypeptide can be determined with using methods and computer programs/applications known in the art, such as, without limitation, the BESTFIT program (Wisconsin Sequence Analysis Package (software package for sequence analysis, University of Wisconsin), version 8 for the Unix operating system, Genetics Computer Group , University Research Park, 575 Science Drive, Madison, WI 53711). BESTFIT uses Smith and Waterman's local homology algorithm (Smith and Waterman, Advances in Applied Mathematics 2:482-489 (1981)), to find the segment with the best homology between two sequences. When using BESTFIT or any other program to align sequences to determine if a certain sequence is, for example, 95% identical to the reference sequence according to the present invention, the parameters are set, of course, such that the percent identity is calculated from the full length of the reference sequence. polypeptide sequence, and that homology gaps of up to 5% of the total number of amino acids in the reference sequence are allowed.

В используемом в данном документе значении аминокислота, соответствующая или эквивалентAs used herein, the amino acid corresponding to or equivalent to

- 11 041588 ная аминокислота в последовательности VWF или последовательности белка FVIII определяентся путем выравнивания для максимального увеличения идентичности или подобия между первой последовательностью VWF или FVIII и второй последовательностью VWF или FVIII. Число, используемое для идентификации эквивалентной аминокислоты во второй последовательности VWF или FVIII, основано на числе, используемом для идентификации соответствующей аминокислоты в первой последовательности VWF или FVIII.- 11 041588 th amino acid in a VWF or FVIII protein sequence is determined by aligning to maximize identity or similarity between a first VWF or FVIII sequence and a second VWF or FVIII sequence. The number used to identify the equivalent amino acid in the second VWF or FVIII sequence is based on the number used to identify the corresponding amino acid in the first VWF or FVIII sequence.

Слитая или химерная молекула содержит первую аминокислотную последовательность, связанную со второй аминокислотной последовательностью, с которой она обычно не соединена в природных условиях. Аминокислотные последовательности, нормально присутствующие в разных белках, могут быть объединены в слитом полипептиде, или аминокислотные последовательности, нормально присутствующие в одном и том же белке, могут быть размещены в другом порядке в слитом полипептиде, например, в результате слияния домена фактора VIII по изобретению с доменом иммуноглобулина Fc. Слитый белок получают, например, путем химического синтеза, или путем создания и трансляции полинуклеотида, в котором пептидные области кодируются с желательным взаимным расположением. Химерный белок может дополнительно содержать вторую аминокислотную последовательность, ассоциированную с первой аминокислотной последовательностью с помощью ковалентной непептидной связи или нековалентной связи.The fusion or chimeric molecule contains a first amino acid sequence linked to a second amino acid sequence to which it is not normally fused in nature. Amino acid sequences normally present in different proteins may be combined in a fusion polypeptide, or amino acid sequences normally present in the same protein may be placed in a different order in a fusion polypeptide, for example, by fusion of the factor VIII domain of the invention with domain of immunoglobulin Fc. The fusion protein is obtained, for example, by chemical synthesis, or by creating and translating a polynucleotide in which the peptide regions are encoded in the desired mutual arrangement. The chimeric protein may further comprise a second amino acid sequence associated with the first amino acid sequence via a covalent non-peptide bond or a non-covalent bond.

В используемом в данном документе значении термин период полувыведения относится к биологическому периоду полувыведения конкретного полипептида in vivo. Период полувыведения может быть представлен как время, необходимое для выведения половины количества, введенного субъекту, из циркуляции и/или других тканей животного. Если кривая клиренса для данного полипептида строится как функция времени, то эта кривая обычно является двухфазной, с быстрой а-фазой и более длительной Рфазой. а-Фаза типично соответствует равновесию введенного полипептида между внутри- и внесосудистым пространством и, частично, определяется размером полипептида. β-Фаза типично соответствует катаболизму полипептида во внутрисосудистом пространстве. В некоторых вариантах реализации изобретения химерная молекула по изобретению является монофазной и, таким образом, не имеет альфафазы, а только одну бета-фазу. Таким образом, в определенных вариантах реализации изобретения термин период полувыведения в используемом в данном документе значении относится к периоду полувыведения полипептида в β-фазе. Типичный β-фазовый период полувыведения человеческого антитела у людей составляет 21 день.As used herein, the term half-life refers to the biological half-life of a particular polypeptide in vivo. The half-life can be represented as the time required to remove half of the amount administered to the subject from the circulation and/or other tissues of the animal. If a clearance curve for a given polypeptide is plotted as a function of time, then the curve is usually biphasic, with a fast a-phase and a longer P-phase. a-Phase typically corresponds to the balance of the administered polypeptide between the intra- and extravascular space and is determined in part by the size of the polypeptide. The β-phase typically corresponds to the catabolism of the polypeptide in the intravascular space. In some embodiments of the invention, the chimeric molecule of the invention is monophasic and thus has no alpha phase but only one beta phase. Thus, in certain embodiments of the invention, the term half-life as used herein refers to the half-life of the polypeptide in the β-phase. The typical β-phase half-life of a human antibody in humans is 21 days.

Термин гетерологичный по отношению к полинуклеотиду или полипептиду означает, что полинуклеотид или полипептид выделены из объекта, отличного от того объекта, с которым он сравнивается. Таким образом, гетерологичный полипептид, связанный с белком VWF, означает полипептидную цепь, которая соединена с белком VWF и не является встречающейся в природе частью белка VWF. Например, гетерологичный полинуклеотид или антиген может быть получен от разных видов, из разных типов клеток индивидуума, или из одних и тех же или разных типов клеток разных индивидуумов. Термин связанный, слитый или соединенный в используемом в данном документе значении, относится к первой аминокислотной последовательности или нуклеотидной последовательности, присоединенной ко второй аминокислотной последовательности или нуклеотидной последовательности (например, с помощью пептидной связи или фосфодиэфирной связи, соответственно). Термин ковалентно связанный или ковалентное соединение относится к ковалентной связи, например дисульфидной связи, пептидной связи, или к одной или более аминокислотам, например линкеру, между двумя фрагментами, связанными вместе. Первая аминокислота или нуклеотидная последовательность может быть непосредственно присоединена ко второй аминокислотной или нуклеотидной последовательности, или, альтернативно, промежуточная последовательность может связывать первую последовательность со второй последовательностью. Термин связанный, слитый, или соединенный означает не только слияние первой аминокислотной последовательности со второй аминокислотной последовательностью на С-конце или Nконце, но также включает вставку целой первой аминокислотной последовательности (или второй аминокислотной последовательности) между любыми двумя аминокислотами второй аминокислотной последовательности (или первой аминокислотной последовательности, соответственно). В одном варианте реализации изобретения первая аминокислотная последовательность может быть присоединена ко второй аминокислотной последовательности с помощью пептидной связи или линкера. Первая нуклеотидная последовательность может быть присоединена ко второй нуклеотидной последовательности с помощью фосфодиэфирной связи или линкера. Линкер может быть пептидом или полипептидом (для полипептидных цепей) или нуклеотидом или нуклеотидной цепью (для нуклеотидных цепей) или любым химическим фрагментом (как для полипептидных, так и для полинуклеотидных цепей). Ковалентная связь иногда обозначается как (-) или черточка.The term heterologous with respect to a polynucleotide or polypeptide means that the polynucleotide or polypeptide is isolated from an entity other than the entity to which it is being compared. Thus, a heterologous polypeptide linked to a VWF protein means a polypeptide chain that is linked to a VWF protein and is not a naturally occurring part of the VWF protein. For example, a heterologous polynucleotide or antigen may be derived from different species, from different cell types of an individual, or from the same or different cell types from different individuals. The term bonded, fused, or joined as used herein refers to a first amino acid sequence or nucleotide sequence attached to a second amino acid sequence or nucleotide sequence (eg, via a peptide bond or a phosphodiester bond, respectively). The term covalently linked or covalent compound refers to a covalent bond, such as a disulfide bond, a peptide bond, or one or more amino acids, such as a linker, between two moieties linked together. The first amino acid or nucleotide sequence may be directly attached to the second amino acid or nucleotide sequence, or alternatively, an intermediate sequence may link the first sequence to the second sequence. The term linked, fused, or connected means not only the fusion of a first amino acid sequence with a second amino acid sequence at the C-terminus or N-terminus, but also includes the insertion of the entire first amino acid sequence (or second amino acid sequence) between any two amino acids of the second amino acid sequence (or first amino acid sequences, respectively). In one embodiment of the invention, the first amino acid sequence can be attached to the second amino acid sequence using a peptide bond or a linker. The first nucleotide sequence may be attached to the second nucleotide sequence using a phosphodiester bond or a linker. The linker can be a peptide or polypeptide (for polypeptide chains) or a nucleotide or nucleotide chain (for nucleotide chains) or any chemical moiety (for both polypeptide and polynucleotide chains). A covalent bond is sometimes denoted as (-) or a dash.

В используемом в данном документе значении термин ассоциированный с относится к ковалентной или нековалентной связи, образованной между первой аминокислотной цепью и второй аминокислотной цепью. В одном варианте реализации изобретения термин ассоциированный с означает ковалентную непептидную связь или нековалентную связь. В некоторых вариантах реализации такая связьAs used herein, the term associated with refers to a covalent or non-covalent bond formed between a first amino acid chain and a second amino acid chain. In one embodiment of the invention, the term associated with means a covalent non-peptide bond or a non-covalent bond. In some embodiments, such a relationship

- 12 041588 обозначается двоеточием, т.е. (:). В другом варианте реализации изобретения он означает ковалентную связь, за исключением пептидной связи. В других вариантах реализации изобретения термин ковалентно ассоциированный, в используемом в данном документе значении, означает ассоциацию между двумя фрагментами с помощью ковалентной связи, например дисульфидной связи, пептидной связи, или одной или более аминокислот (например, линкера). Например, аминокислота цистеин содержит тиольную группу, которая может образовывать дисульфидную связь или мостик с тиольной группой второго цистеинового остатка. У большинства природных молекул IgG, области СН1 и CL соединены дисульфидной связью, и две тяжелые цепи соединены двумя дисульфидными связями в положениях, соответствующих 239 и 242 по системе нумерации Кабат (положения 226 или 229, система нумерации EU). Примеры ковалентных связей включают, без ограничений, пептидную связь, металлическую связь, водородную связь, дисульфидную связь, сигма-связь, пи-связь, дельта-связь, гликозидную связь, агностическую связь, изогнутую связь, диполярную связь, пи-дативное взаимодействие, двойную связь, тройную связь, четверную связь, пятикратную связь, шестикратную связь, конъюгацию, гиперконъюгацию, ароматичность, гаптность или антисвязывание. Неограничивающие примеры нековалентных связей включают ионную связь (например, катион-пи-связь или солевую связь), металлическую связь, водородную связь (например, диводородную связь, диводородный комплекс, низкобарьерную водородную связь, или симметричную водородную связь), вандерваальсовы силы, лондоновские дисперсионные силы, механическую связь, галогенную связь, аурофильность, интеркаляцию, стекинг (stacking), энтропийные силы или химическую полярность.- 12 041588 is denoted by a colon, i.e. (:). In another embodiment of the invention, it means a covalent bond, with the exception of the peptide bond. In other embodiments, the term covalently associated, as used herein, means an association between two moieties via a covalent bond, such as a disulfide bond, a peptide bond, or one or more amino acids (eg, a linker). For example, the amino acid cysteine contains a thiol group that can form a disulfide bond or bridge with the thiol group of the second cysteine residue. In most natural IgG molecules, the CH1 and CL regions are linked by a disulfide bond, and the two heavy chains are linked by two disulfide bonds at positions corresponding to 239 and 242 in the Kabat numbering system (positions 226 or 229, EU numbering system). Examples of covalent bonds include, without limitation, peptide bond, metal bond, hydrogen bond, disulfide bond, sigma bond, pi bond, delta bond, glycosidic bond, agnostic bond, crooked bond, dipolar bond, pi-dative bond, double bond, triple bond, quadruple bond, five-fold bond, six-fold bond, conjugation, hyperconjugation, aromaticity, hapticity, or anti-bonding. Non-limiting examples of non-covalent bonds include ionic bond (e.g., cation-pi-bond or salt bond), metal bond, hydrogen bond (e.g., dihydrogen bond, dihydrogen complex, low barrier hydrogen bond, or symmetrical hydrogen bond), van der Waals forces, London dispersion forces , mechanical bonding, halogen bonding, aurophilicity, intercalation, stacking, entropy forces, or chemical polarity.

В используемом в данном документе значении, термин сайт расщепления или сайт ферментативного расщепления относится к сайту, распознаваемому ферментом. В одном варианте реализации изобретения полипептид имеет сайт ферментативного расщепления, расщепляемый ферментом, который активируется в каскаде свертывания, так, чтобы расщепление таких сайтов происходило в месте образования сгустка. В другом варианте реализации изобретения линкер FVIII соединяющий белок FVIII и второй гетерологичный фрагмент, может содержать сайт расщепления. Типичные примеры таких сайтов включают, например, сайты, распознаваемые тромбином, фактором XIa или фактором Ха. Типичные примеры сайтов расщепления FXIa включают, например, TQSFNDFTR (SEQ ID NO: 27) и SVSQTSKLTR (SEQ ID NO: 28). Типичные примеры сайтов расщепления тромбином включают, например, DFLAEGGGVR (SEQ ID NO: 29), TTKTKPR (SEQ ID NO: 30), LVPRG (SEQ ID NO: 31) и ALRPR (аминокислоты 1-5 SEQ ID NO: 26). Другие сайты ферментативного расщепления известны в данной области техники. Сайт расщепления, который может расщепляться тромбином, называется в данном документе сайт расщепления тромбином.As used herein, the term cleavage site or enzymatic cleavage site refers to a site recognized by an enzyme. In one embodiment, the polypeptide has an enzymatic cleavage site that is cleaved by an enzyme that is activated in the coagulation cascade, such that cleavage of such sites occurs at the site of clot formation. In another embodiment, the FVIII linker connecting the FVIII protein and the second heterologous fragment may contain a cleavage site. Typical examples of such sites include, for example, sites recognized by thrombin, factor XIa or factor Xa. Typical examples of FXIa cleavage sites include, for example, TQSFNDFTR (SEQ ID NO: 27) and SVSQTSKLTR (SEQ ID NO: 28). Typical examples of thrombin cleavage sites include, for example, DFLAEGGGVR (SEQ ID NO: 29), TTKTKPR (SEQ ID NO: 30), LVPRG (SEQ ID NO: 31) and ALRPR (amino acids 1-5 of SEQ ID NO: 26). Other enzymatic cleavage sites are known in the art. A cleavage site that can be cleaved by thrombin is referred to herein as a thrombin cleavage site.

В используемом в данном документе значении, термин сайт процессинга или внутриклеточный сайт процессинга относится к типу сайта ферментативного расщепления в полипептиде, являющегося мишенью для ферментов, которые функционируют после трансляции полипептида. В одном варианте реализации изобретения такие ферменты функционируют во время транспортировки из полости Гольджи в транс-Гольджи компартмент. Ферменты внутриклеточного процессинга расщепляют полипептиды перед секрецией белка из клетки. Примеры таких сайтов процессинга включают, например, сайты, являющиеся мишенями для семейства эндопептидаз РАСЕ/фурин (где РАСЕ является акронимом от Paired basic Amino acid Cleaving Enzyme (фермент, расщепляющий спаренные основные аминокислоты)). Эти ферменты локализованы в мембране Гольджи и расщепляют белки со стороны карбоксильного конца от мотива последовательности Arg-[любой остаток]-(Lys или Arg)-Arg. В используемом в данном документе значении семейство фуриновых ферментов включает, например, PCSK1 (также известен как РС1/РсЗ), PCSK2 (также известен как РС2), PCSK3 (также известен как фурин или РАСЕ), PCSK4 (также известен как РС4), PCSK5 (также известен как РС5 или РС6), PCSK6 (также известен как РАСЕ4) или PCSK7 (также известен как PC7/LPC, РС8 или SPC7). Другие сайты процессинга известны в данной области техники. Термин процессируемый линкер, упоминаемый в данном документе, означает линкер, содержащий сайт внутриклеточного процессинга.As used herein, the term processing site or intracellular processing site refers to a type of enzymatic cleavage site in a polypeptide that is targeted by enzymes that function after translation of the polypeptide. In one embodiment of the invention, such enzymes function during transport from the Golgi cavity to the trans-Golgi compartment. Intracellular processing enzymes cleave polypeptides before secreting the protein from the cell. Examples of such processing sites include, for example, sites targeted by the PACE/furin family of endopeptidases (where PACE is an acronym for Paired basic Amino Acid Cleaving Enzyme). These enzymes are localized in the Golgi membrane and cleave proteins from the carboxyl end of the Arg-[any residue]-(Lys or Arg)-Arg sequence motif. As used herein, the furin enzyme family includes, for example, PCSK1 (also known as PC1/Pc3), PCSK2 (also known as PC2), PCSK3 (also known as furin or PACE), PCSK4 (also known as PC4), PCSK5 (also known as PC5 or PC6), PCSK6 (also known as PACE4) or PCSK7 (also known as PC7/LPC, PC8 or SPC7). Other processing sites are known in the art. The term processable linker as used herein means a linker containing an intracellular processing site.

Термин фурин относится к ферментам, классифицированным в соответствии с ЕС (классификация ферментов) как № 3.4.21.75. Фурин представляет собой субтилизин-подобную пропротеинконвертазу, которая также известна как РАСЕ (Paired basic Amino acid Cleaving Enzyme (фермент, расщепляющий спаренные основные аминокислоты)). Фурин делетирует участки неактивных прекурсорных белков, превращая их в биологически активные белки. Во время внутриклеточной транспортировки, пропептид отщепляется от зрелой молекулы VWF ферментом фурином в (аппарате) Гольджи.The term furin refers to enzymes classified according to EC (Enzyme Classification) No. 3.4.21.75. Furin is a subtilisin-like proprotein convertase, also known as PACE (Paired basic Amino acid Cleaving Enzyme). Furin deletes regions of inactive precursor proteins, turning them into biologically active proteins. During intracellular transport, the propeptide is cleaved from the mature VWF molecule by the enzyme furin in the Golgi apparatus.

Следует понимать, что в конструктах, содержащих несколько сайтов процессинга или расщепления, такие сайты могут быть одинаковыми или разными. Нарушение гемостаза, в используемом в данном документе значении, означает генетически унаследованное или приобретенное состояние, характеризующееся склонностью к кровоизлиянию, спонтанно или в результате травмы, вследствие нарушенной способности или неспособности образовывать фибриновый сгусток. Примеры таких расстройств включают гемофилии. Тремя основными формами являются гемофилия А (дефицит фактора VIII), гемофилия В (дефицит фактора IX или болезнь Кристмаса) и гемофилия С (дефицит фактора XI, слабая склонность к кровотечению). Другие расстройства гемостаза включают, например, болезнь фон Виллебранда, дефицитIt should be understood that in constructs containing multiple processing or cleavage sites, such sites may be the same or different. Violation of hemostasis, as used herein, means a genetically inherited or acquired condition characterized by a tendency to hemorrhage, spontaneously or as a result of trauma, due to an impaired ability or inability to form a fibrin clot. Examples of such disorders include hemophilia. The three main forms are hemophilia A (factor VIII deficiency), hemophilia B (factor IX deficiency or Christmas disease), and hemophilia C (factor XI deficiency, low bleeding tendency). Other disorders of hemostasis include, for example, von Willebrand disease, deficiency

- 13 041588 фактора XI (дефицит РТА), дефицит фактора XII, недостаточности или структурные аномалии фибриногена, протромбина, фактора V, фактора VII, фактора X или фактора XIII, синдром Бернара-Сулье, который представляет собой дефект или дефицит GPIb. GPIb, представляющий собой рецептор VWF, может быть дефектным и приводить к недостаточности первичного образования сгустка (первичный гемостаз) и повышенной склонности к кровотечениям) и тромбастении Гланцманна-Негели (тромбастения Гланцманна). При печеночной недостаточности (острая и хроническая формы) наблюдается недостаточное продуцирование коагулирующих факторов печенью; это может увеличивать риск кровотечения.- 13 041588 factor XI (PTA deficiency), factor XII deficiency, deficiencies or structural abnormalities of fibrinogen, prothrombin, factor V, factor VII, factor X or factor XIII, Bernard-Soulier syndrome, which is a defect or deficiency of GPIb. GPIb, which is a VWF receptor, can be defective and lead to failure of primary clot formation (primary hemostasis) and an increased tendency to bleed) and Glanzmann-Negeli thrombasthenia (Glanzmann thrombasthenia). In liver failure (acute and chronic forms), insufficient production of coagulating factors by the liver is observed; this may increase the risk of bleeding.

Химерные молекулы по изобретению могут быть использованы профилактично. В используемом в данном документе значении термин профилактическое лечение относится к введению молекулы до эпизода кровотечения. В одном варианте реализации изобретения субъект, нуждающийся в гемостатическом средстве общего действия, подвергается, или должен быть подвергнут, хирургии. Химерный белок по изобретению может быть введен до или после хирургии в качестве профилактики. Химерный белок по изобретению может быть введен во время или после хирургии для остановки острого эпизода кровотечения. Хирургия может включать, без ограничений, трансплантацию печени, резекцию печени, зубоврачебные процедуры или трансплантацию стволовых клеток.The chimeric molecules of the invention can be used prophylactically. As used herein, the term prophylactic treatment refers to administration of the molecule prior to a bleeding episode. In one embodiment, the subject in need of a general hemostatic agent is, or is to be, undergoing surgery. The chimeric protein of the invention may be administered before or after surgery as a prophylactic. The chimeric protein of the invention may be administered during or after surgery to arrest an acute bleeding episode. Surgery may include, without limitation, liver transplantation, liver resection, dental procedures, or stem cell transplantation.

Химерная молекула по изобретению также используется для лечения по требованию (также называемого эпизодическим). Термин лечение по требованию или эпизодическое лечение относится к введению химерной молекулы в ответ на симптомы эпизода кровотечения или перед активностью, которая может вызвать кровотечение. В одном аспекте лечение по требованию (эпизодическое) может быть предоставлено субъекту при начале кровотечения, например после травмы, или при ожидаемом кровотечении, например перед хирургией. В другом аспекте лечение по требованию может быть предоставлено до активностей, которые увеличивают риск кровотечения, таких как контактные виды спорта.The chimeric molecule of the invention is also used for on-demand (also referred to as episodic) treatment. The term on-demand or episodic treatment refers to the administration of a chimeric molecule in response to the symptoms of a bleeding episode or prior to an activity that may cause bleeding. In one aspect, on-demand (episodic) treatment may be provided to a subject at the onset of bleeding, such as after an injury, or when bleeding is expected, such as prior to surgery. In another aspect, on-demand treatment may be provided prior to activities that increase the risk of bleeding, such as contact sports.

В используемом в данном документе значении термин острое кровотечение относится к эпизоду кровотечения независимо от вызвавшей его причины. Например, субъект может иметь травму, уремию, наследственное нарушение, сопровождающееся повышенной кровоточивостью (например, дефицит фактора VII), тромбоцитарное расстройство или резистентность вследствие выработки антител к факторам свертывания крови.As used herein, the term acute bleeding refers to an episode of bleeding, regardless of the underlying cause. For example, the subject may have an injury, uremia, an inherited bleeding disorder (eg, factor VII deficiency), a platelet disorder, or resistance due to the production of antibodies to blood clotting factors.

Лечить, лечение, лечащий, в используемом в данном документе значении, относятся, например, к снижению тяжести болезни или состояния; уменьшению продолжительности течения болезни; облегчению одного или более симптомов, ассоциированных с болезнью или состоянием; обеспечению полезных эффектов для субъекта с болезнью или состоянием, без обязательного исцеления болезни или состояния, или профилактике одного или более симптомов, ассоциированных с болезнью или состоянием. В одном варианте реализации изобретения термин лечить или лечение означает поддержание у субъекта минимального уровня перед введением очередной дозы FVIII, равного по меньшей мере около 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 или 20 МЕ/дл путем введения химерной молекулы по изобретению. В другом варианте реализации изобретения лечить или лечение означает поддержание минимального уровня FVIII перед введением очередной дозы, имеющего значение между около 1 и около 20 МЕ/дл, около 2 и около 20 МЕ/дл, около 3 и около 20 МЕ/дл, около 4 и около 20 МЕ/дл, около 5 и около 20 МЕ/дл, около 6 и около 20 МЕ/дл, около 7 и около 20 МЕ/дл, около 8 и около 20 МЕ/дл, около 9 и около 20 МЕ/дл или около 10 и около 20 МЕ/дл. Лечение или терапия болезни или состояния может также включать поддержание у субъекта активности FVIII на уровне, сопоставимом с по меньшей мере около 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 или 20% активности FVIII у субъекта без гемофилии. Минимальный уровень перед введением очередной дозы, необходимый для лечения, может быть измерен одним или более известными способами и может быть отрегулирован (увеличен или уменьшен) для каждого субъекта.Treat, treatment, treating, as used herein, refer to, for example, reducing the severity of a disease or condition; reducing the duration of the course of the disease; alleviate one or more symptoms associated with the disease or condition; providing beneficial effects to a subject with a disease or condition, without necessarily curing the disease or condition, or preventing one or more symptoms associated with the disease or condition. In one embodiment, the term "treat" or "treatment" refers to maintaining a subject at a minimum level of FVIII prior to administration of the next dose of at least about 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 or 20 IU/dl by administering a chimeric molecule of the invention. In another embodiment, treating or treating means maintaining a minimum level of FVIII prior to administration of the next dose, having a value between about 1 and about 20 IU/dL, about 2 and about 20 IU/dL, about 3 and about 20 IU/dL, about 4 and about 20 IU/dL, about 5 and about 20 IU/dL, about 6 and about 20 IU/dL, about 7 and about 20 IU/dL, about 8 and about 20 IU/dL, about 9 and about 20 IU/dL dl or about 10 and about 20 IU/dl. Treatment or therapy for a disease or condition may also include maintaining a subject's FVIII activity at a level comparable to at least about 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 , 15, 16, 17, 18, 19, or 20% FVIII activity in a subject without hemophilia. The minimum pre-dose level required for treatment can be measured by one or more known methods and can be adjusted (increased or decreased) for each subject.

II. Химерные молекулы.II. chimeric molecules.

Химерные молекулы по изобретению предназначены для улучшения высвобождения белка VWF или белка FVIII от другого фрагмента, с которым связан белок VWF или белок FVIII. Изобретение обеспечивает расщепляемый тромбином линкер, который может быстро и эффективно расщепляться в месте повреждения. В одном аспекте изобретения химерная молекула может содержать белок фактора фон Виллебранда (VWF), гетерологичный фрагмент (H1), последовательность XTEN и линкер VWF, соединяющий белок VWF с гетерологичным фрагментом, причем линкер VWF содержит полипептид, выбранный из: (i) области а2 из фактора VIII (FVIII); (ii) области a1 из FVIII; (iii) области а3 из FVIII; (iv) сайта расщепления тромбином, содержащего X-V-P-R (SEQ ID NO: 3) и мотив экзосайта взаимодействия PAR1, где X представляет собой алифатическую аминокислоту; или (v) любую их комбинацию, и последовательность XTEN соединена с белком VWF, гетерологичным фрагментом (H1), линкером VWF или любой их комбинацией. В другом аспекте изобретения химерная молекула может содержать первую полипептидную цепь, которая содержит белок VWF, гетерологичный фрагмент (H1) и линкер VWF, соединяющий белок VWF и гетерологичный фрагмент (H1), и вторую полипептидную цепь, содержащую белок FVIII и последовательность XTEN, причем линкер VWF в первой полипептидной цепи содержит: (i) область а2 из FVIII; (ii) область a1 из FVIII; (iii) область а3 из FVIII; (iv) сайт расщепления тромбином, содержащий X-V-P-R (SEQ ID NO: 3) и мотив экзосайта взаимодействия PAR1, где X представляет собойThe chimeric molecules of the invention are designed to enhance the release of a VWF protein or FVIII protein from another moiety to which the VWF protein or FVIII protein is bound. The invention provides a thrombin-cleavable linker that can be rapidly and efficiently cleaved at the site of injury. In one aspect of the invention, the chimeric molecule may comprise a von Willebrand factor (VWF) protein, a heterologous fragment (H1), an XTEN sequence, and a VWF linker connecting the VWF protein to the heterologous fragment, the VWF linker comprising a polypeptide selected from: (i) the a2 region of factor VIII (FVIII); (ii) regions a1 of FVIII; (iii) a3 regions from FVIII; (iv) a thrombin cleavage site containing X-V-P-R (SEQ ID NO: 3) and a PAR1 interaction exosite motif, where X is an aliphatic amino acid; or (v) any combination thereof, and the XTEN sequence is linked to a VWF protein, a heterologous fragment (H1), a VWF linker, or any combination thereof. In another aspect of the invention, the chimeric molecule may contain a first polypeptide chain that contains a VWF protein, a heterologous fragment (H1) and a VWF linker connecting the VWF protein and a heterologous fragment (H1), and a second polypeptide chain containing the FVIII protein and the XTEN sequence, and the linker The VWF in the first polypeptide chain contains: (i) the a2 region of FVIII; (ii) region a1 from FVIII; (iii) region a3 from FVIII; (iv) a thrombin cleavage site containing X-V-P-R (SEQ ID NO: 3) and a PAR1 interaction exosite motif, where X is

- 14 041588 алифатическую аминокислоту; или (v) любую их комбинацию, и первая полипептидная цепь и вторая полипептидная цепь ассоциированы друг с другом.- 14 041588 aliphatic amino acid; or (v) any combination thereof, and the first polypeptide chain and the second polypeptide chain are associated with each other.

В других аспектах изобретения химерная молекула содержит полипептидную цепь, содержащую белок FVIII, соединенный с гетерологичным фрагментом с помощью линкера FVIII, причем линкер FVIII содержит: (i) область а2 из FVIII; (ii) область a1 из FVIII; (iii) область а3 из FVIII; (iv) сайт расщепления тромбином, содержащий X-V-P-R (SEQ ID NO: 3) и мотив экзосайта взаимодействия PAR1, где X представляет собой алифатическую аминокислоту; или (v) любую их комбинацию.In other aspects of the invention, the chimeric molecule comprises a polypeptide chain containing a FVIII protein connected to a heterologous fragment via an FVIII linker, the FVIII linker comprising: (i) the a2 region of FVIII; (ii) region a1 from FVIII; (iii) region a3 from FVIII; (iv) a thrombin cleavage site containing X-V-P-R (SEQ ID NO: 3) and a PAR1 interaction exosite motif, where X is an aliphatic amino acid; or (v) any combination of them.

П.А. Химерные молекулы с VWF, XTEN, линкером VWF.P.A. Chimeric molecules with VWF, XTEN, VWF linker.

Настоящее изобретение предусматривает химерную молекулу, содержащую белок VWF, слитый с последовательностью XTEN с помощью линкера VWF, причем линкер VWF содержит полипептид, выбранный из: (i) области а2 из FVIII; (ii) области a1 из FVIII; (iii) области а3 из FVIII; (iv) сайта расщепления тромбином, содержащего X-V-P-R (SEQ ID NO: 3) и мотива экзосайта взаимодействия PAR1, где X представляет собой алифатическую аминокислоту; или (v) любой их комбинации.The present invention provides a chimeric molecule comprising a VWF protein fused to an XTEN sequence via a VWF linker, the VWF linker comprising a polypeptide selected from: (i) the a2 region of FVIII; (ii) a1 regions from FVIII; (iii) a3 regions from FVIII; (iv) a thrombin cleavage site containing X-V-P-R (SEQ ID NO: 3) and a PAR1 interaction exosite motif, where X is an aliphatic amino acid; or (v) any combination thereof.

В одном варианте реализации изобретения химерная молекула содержит белок VWF, гетерологичный фрагмент (H1), последовательность XTEN и линкер VWF, соединяющий белок VWF с гетерологичным фрагментом, причем последовательность XTEN расположена между белком VWF и линкером VWF, и линкер VWF содержит полипептид, выбранный из: (i) области а2 из фактора VIII (FVIII); (ii) области a1 из FVIII; (iii) области а3 из FVIII; (iv) сайта расщепления тромбином, содержащего X-V-P-R (SEQ ID NO: 3) и мотив экзосайта взаимодействия PAR1, где X представляет собой алифатическую аминокислоту; или (v) любой их комбинации. В другом варианте реализации изобретения химерная молекула содержит белок VWF, гетерологичный фрагмент (H1), последовательность XTEN и линкер VWF, соединяющий белок VWF с гетерологичным фрагментом, причем последовательность XTEN расположена между линкером VWF и гетерологичным фрагментом, и линкер VWF содержит полипептид, выбранный из: (i) области а2 из FVIII; (ii) области a1 из FVIII; (iii) области а3 из FVIII; (iv) сайта расщепления тромбином, содержащего X-V-P-R (SEQ ID NO: 3) и мотив экзосайта взаимодействия PAR1, где X представляет собой алифатическую аминокислоту; или (v) любой их комбинации. В других вариантах реализации изобретения химерная молекула дополнительно содержит полипептидную цепь, содержащую белок FVIII, причем первая цепь, содержащая белок VWF, и вторая цепь, содержащая белок FVIII, ассоциированы друг с другом. В одном примере ассоциация может быть ковалентной ассоциацией, например, дисульфидной связью. В еще одних вариантах реализации изобретения полипептидная цепь, содержащая белок FVIII дополнительно содержит дополнительную последовательность XTEN. Дополнительная последовательность XTEN может быть связана с N-концом или С-концом белка FVIII или вставлена между двумя соседними аминокислотами FVIII. В других вариантах реализации изобретения цепь, содержащая белок FVIII, дополнительно содержит второй гетерологичный фрагмент (Н2). В некоторых вариантах реализации изобретения белок FVIII соединен со вторым гетерологичным фрагментом с помощью линкера FVIII. В определенных вариантах реализации изобретения линкер FVIII идентичен линкеру VWF, соединяющему белок VWF и гетерологичный фрагмент. В других вариантах реализации изобретения линкер FVIII отличается от линкера VWF, соединяющего белок VWF и гетерологичный фрагмент.In one embodiment, the chimeric molecule comprises a VWF protein, a heterologous fragment (H1), an XTEN sequence, and a VWF linker connecting the VWF protein to the heterologous fragment, wherein the XTEN sequence is located between the VWF protein and the VWF linker, and the VWF linker contains a polypeptide selected from: (i) a2 regions from factor VIII (FVIII); (ii) a1 regions from FVIII; (iii) a3 regions from FVIII; (iv) a thrombin cleavage site containing X-V-P-R (SEQ ID NO: 3) and a PAR1 interaction exosite motif, where X is an aliphatic amino acid; or (v) any combination thereof. In another embodiment, the chimeric molecule contains a VWF protein, a heterologous fragment (H1), an XTEN sequence, and a VWF linker connecting the VWF protein to the heterologous fragment, wherein the XTEN sequence is located between the VWF linker and the heterologous fragment, and the VWF linker contains a polypeptide selected from: (i) a2 regions from FVIII; (ii) a1 regions from FVIII; (iii) a3 regions from FVIII; (iv) a thrombin cleavage site containing X-V-P-R (SEQ ID NO: 3) and a PAR1 interaction exosite motif, where X is an aliphatic amino acid; or (v) any combination thereof. In other embodiments of the invention, the chimeric molecule further comprises a polypeptide chain containing the FVIII protein, wherein the first chain containing the VWF protein and the second chain containing the FVIII protein are associated with each other. In one example, the association may be a covalent association, such as a disulfide bond. In still other embodiments of the invention, the polypeptide chain containing the FVIII protein further comprises an additional XTEN sequence. An additional XTEN sequence may be linked to the N-terminus or C-terminus of the FVIII protein, or inserted between two adjacent FVIII amino acids. In other embodiments of the invention, the chain containing the FVIII protein additionally contains a second heterologous fragment (H2). In some embodiments of the invention, the FVIII protein is connected to the second heterologous fragment using a FVIII linker. In certain embodiments of the invention, the FVIII linker is identical to the VWF linker connecting the VWF protein and the heterologous fragment. In other embodiments, the FVIII linker is different from the VWF linker connecting the VWF protein and the heterologous fragment.

В определенных вариантах реализации изобретения химерная молекула имеет формулу, выбранную из: (i) V-L1-X1-H1:H2-L2-X2-C; (ii) V-X1-L1-H1:H2-L2-X2-C; (iii) V-L1-X1-H1:H2-X2-L2-C; (iv) V-X1L1-H1:H2-X2-L2-C; (v) V-L1-X1-H1:H2-L2-C(X2); (vi) V-X1-L1-H1:H2-L2-C(X2); (vii) C-X2-L2-H2:H1X1-L1-V; (viii) C-X2-L2-H2:H1-L1-X1-V; (ix) C-L2-X2-H2:H1-L1-X1-V; (x) C-L2-X2-H2:H1-L1-X1-V; (xi) C(X2)-L2-H2:H1-X1-L1-V; или (xii) C(X2)-L2-H2:H1-L1-X1-V; где V обозначает белок VWF; L1 обозначает линкер VWF; L2 обозначает необязательный линкер FVIII; H1 представляет собой первый гетерологичный фрагмент; Н2 обозначает второй гетерологичный фрагмент; X1 обозначает последовательность XTEN; X2 обозначает необязательную последовательность XTEN; С обозначает белок FVIII; C(X2) обозначает белок FVIII, слитый с последовательностью XTEN, причем последовательность XTEN вставлена между двумя соседними аминокислотами FVIII; (-) обозначает пептидную связь или одну или более аминокислот; и (:) обозначает ковалентную связь между H1 и Н2.In certain embodiments of the invention, the chimeric molecule has the formula selected from: (i) V-L1-X1-H1:H2-L2-X2-C; (ii) V-X1-L1-H1:H2-L2-X2-C; (iii) V-L1-X1-H1:H2-X2-L2-C; (iv) V-X1L1-H1:H2-X2-L2-C; (v) V-L1-X1-H1:H2-L2-C(X2); (vi) V-X1-L1-H1:H2-L2-C(X2); (vii) C-X2-L2-H2:H1X1-L1-V; (viii) C-X2-L2-H2:H1-L1-X1-V; (ix) C-L2-X2-H2:H1-L1-X1-V; (x) C-L2-X2-H2:H1-L1-X1-V; (xi) C(X2)-L2-H2:H1-X1-L1-V; or (xii) C(X2)-L2-H2:H1-L1-X1-V; where V is a VWF protein; L1 is a VWF linker; L2 is an optional FVIII linker; H1 is the first heterologous fragment; H2 denotes the second heterologous fragment; X1 denotes the sequence XTEN; X2 denotes an optional XTEN sequence; C is FVIII protein; C(X2) is a FVIII protein fused to an XTEN sequence, with the XTEN sequence inserted between two adjacent FVIII amino acids; (-) denotes a peptide bond or one or more amino acids; and (:) denotes a covalent bond between H1 and H2.

В некоторых вариантах реализации изобретения белок FVIII в химерной молекуле содержит третий гетерологичный фрагмент (Н3), который может быть последовательностью XTEN. В других вариантах реализации изобретения белок FVIII химерной молекулы содержит четвертый гетерологичный фрагмент (Н4), который может быть последовательностью XTEN. В еще одних вариантах реализации изобретения белок FVIII химерной молекулы содержит пятый гетерологичный фрагмент (Н5), который может быть последовательностью XTEN. В других вариантах реализации изобретения белок FVIII химерной молекулы содержит шестой гетерологичный фрагмент (Н6), который может быть последовательностью XTEN. В определенных вариантах реализации изобретения один или более из третьего гетерологичного фрагмента (Н3), четвертого гетерологичного фрагмента (Н4), пятого гетерологичного фрагмента (Н5) и шестого гетерологичного фрагмента (Н6) способны увеличивать период полувыведения химерной молекулы. В некоторых вариантах реализации изобретения третий гетерологичный фрагмент (Н3), четвертый гетерологичный фрагмент (Н4), пятый гетерологичный фрагмент (Н5) и шестой гетерологичный фрагмент (Н6) присоединены к С-концу или N-концу FVIII или вставлены между двумя аминокислотами белка FVIII.In some embodiments, the FVIII protein in the chimeric molecule contains a third heterologous fragment (H3), which may be the XTEN sequence. In other embodiments, the FVIII protein of the chimeric molecule contains a fourth heterologous fragment (H4), which may be the XTEN sequence. In still other embodiments, the FVIII protein of the chimeric molecule contains a fifth heterologous fragment (H5), which may be an XTEN sequence. In other embodiments, the FVIII protein of the chimeric molecule contains a sixth heterologous fragment (H6), which may be the XTEN sequence. In certain embodiments of the invention, one or more of the third heterologous fragment (H3), the fourth heterologous fragment (H4), the fifth heterologous fragment (H5) and the sixth heterologous fragment (H6) are capable of increasing the half-life of the chimeric molecule. In some embodiments, a third heterologous fragment (H3), a fourth heterologous fragment (H4), a fifth heterologous fragment (H5), and a sixth heterologous fragment (H6) are attached to the C-terminus or N-terminus of FVIII, or inserted between two amino acids of the FVIII protein.

- 15 041588- 15 041588

II.B. Химерные молекулы с FVIII, XTEN, белком VWF, линкером VWF.II.B. Chimeric molecules with FVIII, XTEN, VWF protein, VWF linker.

Настоящее изобретение также предусматривает химерную молекулу, содержащую первую полипептидную цепь, которая содержит белок VWF, гетерологичный фрагмент (H1) и линкер VWF, соединяющий белок VWF и гетерологичный фрагмент (H1), и вторую полипептидную цепь, содержащую белок FVIII и последовательность XTEN, причем линкер VWF в первой полипептидной цепи содержит: (i) область а2 из FVIII; (ii) область a1 из FVIII; (iii) область а3 из FVIII; (iv) сайт расщепления тромбином, содержащий X-V-P-R (SEQ ID NO: 3) и мотив экзосайта взаимодействия PAR1, где X представляет собой алифатическую аминокислоту; или (v) любую их комбинацию, и первая полипептидная цепь и вторая полипептидная цепь ассоциированы друг с другом. В одном варианте реализации последовательность XTEN присоединена к N-концу или С-концу белка FVIII или вставлена между двумя соседними аминокислотами FVIII. В другом варианте реализации изобретения химерная молекула дополнительно содержит дополнительную последовательность XTEN, которая связана с белком VWF, гетерологичным фрагментом, линкером VWF, или любой их комбинацией. В других вариантах реализации изобретения химерная молекула дополнительно содержит второй гетерологичный фрагмент (Н2). В других вариантах реализации изобретения второй гетерологичный фрагмент химерной молекулы соединен с белком FVIII, последовательностью XTEN или обоими. В других вариантах реализации изобретения второй гетерологичный фрагмент химерной молекулы соединен с белком FVIII или последовательностью XTEN с помощью линкера FVIII. В других вариантах реализации изобретения линкер FVIII идентичен линкеру VWF. В некоторых вариантах реализации изобретения линкер FVIII отличается от линкера VWF. В определенных вариантах реализации изобретения химерная молекула имеет формулу, выбранную из: (i) V-L1-X1H1:H2-L2-X2-C; (ii) V-X1-L1-H1:H2-L2-X2-C; (iii) V-L1-X1-H1:H2-X2-L2-C; (iv) V-X1-L1-H1:H2-X2-L2C; (v) V-L1-X1-H1:H2-L2-C(X2); (vi) V-X1-L1-H1:H2-L2-C(X2); (vii) C-X2-L2-H2:H1-X1-L1-V; (viii) CX2-L2-H2:H1-L1-X1-V; (ix) C-L2-X2-H2:H1-L1-X1-V; (x) C-L2-X2-H2:H1-L1-X1-V; (xi) C(X2)-L2-H2:H1X1-L1-V; или (xii) C(X2)-L2-H2:H1-L1-X1-V; где V обозначает белок VWF; L1 обозначает линкер VWF; L2 обозначает необязательный линкер FVIII; H1 представляет собой первый гетерологичный фрагмент; Н2 обозначает второй гетерологичный фрагмент; X1 обозначает необязательную последовательность XTEN; X2 обозначает последовательность XTEN; С обозначает белок FVIII; С(Х2) обозначает белок FVIII, слитый с последовательностью XTEN, причем последовательность XTEN вставлена между двумя соседними аминокислотами FVIII; (-) обозначает пептидную связь или одну или более аминокислот; и (:) обозначает ковалентную связь между H1 и Н2. В одном варианте реализации изобретения линкер VWF и линкер FVIII могут быть одинаковыми. В другом варианте реализации изобретения линкер VWF и линкер FVIII являются разными. В определенных вариантах реализации изобретения белок FVIII химерной молекулы содержит третий гетерологичный фрагмент (Н3), который может быть последовательностью XTEN. В других вариантах реализации изобретения белок FVIII химерной молекулы содержит четвертый гетерологичный фрагмент (Н4), который является последовательностью XTEN. В еще одних вариантах реализации изобретения белок FVIII химерной молекулы содержит пятый гетерологичный фрагмент (Н5), который может быть последовательностью XTEN. В других вариантах реализации изобретения белок FVIII содержит шестой гетерологичный фрагмент (Н6), который может быть последовательностью XTEN. В определенных вариантах реализации изобретения один или более из третьего гетерологичного фрагмента (Н3), четвертого гетерологичного фрагмента (Н4), пятого гетерологичного фрагмента (Н5) и шестого гетерологичного фрагмента (Н6) способны увеличивать период полувыведения химерной молекулы. В некоторых вариантах реализации изобретения третий гетерологичный фрагмент (Н3), четвертый гетерологичный фрагмент (Н4), пятый гетерологичный фрагмент (Н5) и/или шестой гетерологичный фрагмент (Н6) присоединены к С-концу или N-концу FVIII или вставлены между двумя аминокислотами белка FVIII.The present invention also provides a chimeric molecule containing a first polypeptide chain that contains a VWF protein, a heterologous fragment (H1) and a VWF linker connecting the VWF protein and a heterologous fragment (H1), and a second polypeptide chain containing the FVIII protein and the XTEN sequence, and the linker The VWF in the first polypeptide chain contains: (i) the a2 region of FVIII; (ii) region a1 from FVIII; (iii) region a3 from FVIII; (iv) a thrombin cleavage site containing X-V-P-R (SEQ ID NO: 3) and a PAR1 interaction exosite motif, where X is an aliphatic amino acid; or (v) any combination thereof, and the first polypeptide chain and the second polypeptide chain are associated with each other. In one embodiment, the XTEN sequence is fused to the N-terminus or C-terminus of the FVIII protein, or inserted between two adjacent FVIII amino acids. In another embodiment, the chimeric molecule further comprises an additional XTEN sequence that is linked to a VWF protein, a heterologous fragment, a VWF linker, or any combination thereof. In other embodiments of the invention, the chimeric molecule further comprises a second heterologous fragment (H2). In other embodiments of the invention, the second heterologous fragment of the chimeric molecule is connected to the FVIII protein, the XTEN sequence, or both. In other embodiments, the second heterologous fragment of the chimeric molecule is linked to the FVIII protein or XTEN sequence via an FVIII linker. In other embodiments, the FVIII linker is identical to the VWF linker. In some embodiments, the FVIII linker is different from the VWF linker. In certain embodiments of the invention, the chimeric molecule has the formula selected from: (i) V-L1-X1H1:H2-L2-X2-C; (ii) V-X1-L1-H1:H2-L2-X2-C; (iii) V-L1-X1-H1:H2-X2-L2-C; (iv) V-X1-L1-H1:H2-X2-L2C; (v) V-L1-X1-H1:H2-L2-C(X2); (vi) V-X1-L1-H1:H2-L2-C(X2); (vii) C-X2-L2-H2:H1-X1-L1-V; (viii) CX2-L2-H2:H1-L1-X1-V; (ix) C-L2-X2-H2:H1-L1-X1-V; (x) C-L2-X2-H2:H1-L1-X1-V; (xi) C(X2)-L2-H2:H1X1-L1-V; or (xii) C(X2)-L2-H2:H1-L1-X1-V; where V is a VWF protein; L1 is a VWF linker; L2 is an optional FVIII linker; H1 is the first heterologous fragment; H2 denotes the second heterologous fragment; X1 denotes an optional XTEN sequence; X2 denotes the sequence XTEN; C is FVIII protein; C(X2) is a FVIII protein fused to an XTEN sequence, with the XTEN sequence inserted between two adjacent FVIII amino acids; (-) denotes a peptide bond or one or more amino acids; and (:) denotes a covalent bond between H1 and H2. In one embodiment, the VWF linker and the FVIII linker may be the same. In another embodiment, the VWF linker and the FVIII linker are different. In certain embodiments, the FVIII protein of the chimeric molecule contains a third heterologous fragment (H3), which may be an XTEN sequence. In other embodiments, the FVIII protein of the chimeric molecule contains a fourth heterologous fragment (H4) which is the XTEN sequence. In still other embodiments, the FVIII protein of the chimeric molecule contains a fifth heterologous fragment (H5), which may be an XTEN sequence. In other embodiments, the FVIII protein contains a sixth heterologous fragment (H6), which may be an XTEN sequence. In certain embodiments of the invention, one or more of the third heterologous fragment (H3), the fourth heterologous fragment (H4), the fifth heterologous fragment (H5) and the sixth heterologous fragment (H6) are capable of increasing the half-life of the chimeric molecule. In some embodiments, a third heterologous fragment (H3), a fourth heterologous fragment (H4), a fifth heterologous fragment (H5), and/or a sixth heterologous fragment (H6) are attached to the C-terminus or N-terminus of FVIII or inserted between two amino acids of the protein FVIII.

П.С. Химерные молекулы с FVIII, XTEN и линкером FVIII.P.S. Chimeric molecules with FVIII, XTEN and FVIII linker.

Химерная молекула по изобретению может содержать белок FVIII, последовательность XTEN и гетерологичный фрагмент, присоединенный с помощью линкера FVIII, который содержит (i) область а2 из FVIII; (ii) область a1 из FVIII; (iii) область а3 из FVIII; (iv) сайт расщепления тромбином, содержащий XV-P-R (SEQ ID NO: 3) и мотив экзосайта взаимодействия PAR1, где X представляет собой алифатическую аминокислоту; или (v) любую их комбинацию. В определенных вариантах реализации изобретения химерная молекула содержит две полипептидные цепи - первую цепь, содержащую белок FVIII, соединенный с первой Fc-областью с помощью линкера FVIII, и вторую цепь, содержащую белок VWF (например, домен D' и домен D3 VWF), соединенную с Fc-областью, причем линкер FVIII в первой полипептидной цепи содержит: (i) область а2 из FVIII; (ii) область a1 из FVIII; (iii) область а3 из FVIII; (iv) сайт расщепления тромбином, содержащий X-V-P-R (SEQ ID NO: 3) и мотив экзосайта взаимодействия PAR1, где X представляет собой алифатическую аминокислоту; или (v) любую их комбинацию, и первая полипептидная цепь и вторая полипептидная цепь ассоциированы друг с другом, и последовательность XTEN присоединена к первому полипептиду (например, к N-концу или С-концу белка FVIII, линкеру или первой Fc-области или внутри белка FVIII), ко второму полипептиду (например, к N-концу или Сконцу белка VWF или Fc-области или внутри белка FVIII) или к обоим. В конкретном варианте реализации линкер в первой полипептидной цепи содержит область а2 из FVIII.A chimeric molecule of the invention may contain a FVIII protein, an XTEN sequence, and a heterologous fragment attached via an FVIII linker that contains (i) an a2 region from FVIII; (ii) region a1 from FVIII; (iii) region a3 from FVIII; (iv) a thrombin cleavage site containing XV-P-R (SEQ ID NO: 3) and a PAR1 interaction exosite motif, where X is an aliphatic amino acid; or (v) any combination of them. In certain embodiments of the invention, the chimeric molecule contains two polypeptide chains - the first chain containing the FVIII protein connected to the first Fc region using an FVIII linker, and the second chain containing the VWF protein (for example, the D' domain and the D3 domain of the VWF) connected with an Fc region, and the FVIII linker in the first polypeptide chain contains: (i) the a2 region of FVIII; (ii) region a1 from FVIII; (iii) region a3 from FVIII; (iv) a thrombin cleavage site containing X-V-P-R (SEQ ID NO: 3) and a PAR1 interaction exosite motif, where X is an aliphatic amino acid; or (v) any combination thereof, and the first polypeptide chain and the second polypeptide chain are associated with each other, and the XTEN sequence is attached to the first polypeptide (for example, to the N-terminus or C-terminus of the FVIII protein, the linker or the first Fc region, or within FVIII protein), to a second polypeptide (eg, to the N-terminus or C-terminus of the VWF protein or Fc region, or within the FVIII protein), or both. In a particular embodiment, the linker in the first polypeptide chain contains the a2 region of FVIII.

- 16 041588- 16 041588

В определенных вариантах реализации изобретения химерная молекула имеет формулу, выбранную из: (i) V-L2-X2-H2: H1-L1-X1-C; (ii) V-X2-L2-H2: H1-L1-X1-C; (iii) V-L2-X2-H2: H1-X1-L1-C; (iv) V-X2L2-H2: H1-X1-L1-C; (v) V-L2-X2-H2: H1-L1-C(X1); (vi) V-X2-L2-H2: Hl-Ll-C(X1); (vii) C-X1-L1-H1: H2X2-L2-V; (viii) C-X1-L1-H1: H2-L2-X2-V; (ix) C-L1-X1-H1:H2-L2-X2-V; (x) C-L1-X1-H1:H2-L2-X2-V; (xi) C(X1)-L1-H1:H2-X2-L2-V; или (xii) C(X1)-L1-H1:H2-L2-X2-V, где V обозначает белок VWF; L1 представляет собой линкер FVIII; L2 обозначает необязательный линкер VWF; H1 представляет собой первый гетерологичный фрагмент; Н2 обозначает второй гетерологичный фрагмент; X1 обозначает необязательную последовательность XTEN; X2 обозначает необязательную последовательность XTEN; С обозначает белок FVIII; C(X1) обозначает белок FVIII, слитый с последовательностью XTEN, причем последовательность XTEN вставлена между двумя соседними аминокислотами FVIII; (-) обозначает пептидную связь или одну или более аминокислот; и (:) обозначает ковалентную связь между H1 и Н2, и где в химерной молекуле присутствует по меньшей мере одна последовательность XTEN. В одном варианте реализации изобретения линкер VWF и линкер FVIII являются одинаковыми. В другом варианте реализации изобретения линкер VWF и линкер FVIII являются разными.In certain embodiments of the invention, the chimeric molecule has the formula selected from: (i) V-L2-X2-H2: H1-L1-X1-C; (ii) V-X2-L2-H2: H1-L1-X1-C; (iii) V-L2-X2-H2: H1-X1-L1-C; (iv) V-X2L2-H2: H1-X1-L1-C; (v) V-L2-X2-H2: H1-L1-C(X1); (vi) V-X2-L2-H2: Hl-Ll-C(X1); (vii) C-X1-L1-H1: H2X2-L2-V; (viii) C-X1-L1-H1: H2-L2-X2-V; (ix) C-L1-X1-H1:H2-L2-X2-V; (x) C-L1-X1-H1:H2-L2-X2-V; (xi) C(X1)-L1-H1:H2-X2-L2-V; or (xii) C(X1)-L1-H1:H2-L2-X2-V, where V is a VWF protein; L1 is an FVIII linker; L2 denotes an optional VWF linker; H1 is the first heterologous fragment; H2 denotes the second heterologous fragment; X1 denotes an optional XTEN sequence; X2 denotes an optional XTEN sequence; C is FVIII protein; C(X1) is a FVIII protein fused to an XTEN sequence, with the XTEN sequence inserted between two adjacent FVIII amino acids; (-) denotes a peptide bond or one or more amino acids; and (:) denotes a covalent bond between H1 and H2, and wherein at least one XTEN sequence is present in the chimeric molecule. In one embodiment, the VWF linker and the FVIII linker are the same. In another embodiment, the VWF linker and the FVIII linker are different.

II.D. Компоненты химерных молекул.II.D. Components of chimeric molecules.

П.С.1. Линкер VWF или линкер FVIII.P.S.1. VWF linker or FVIII linker.

Линкер VWF или линкер FVIII, пригодный для химерной молекулы по изобретению, представляет собой расщепляемый тромбином линкер, соединяющий белок VWF с гетерологичным фрагментом или белок FVIII с гетерологичным фрагментом. В одном варианте реализации изобретения линкер VWF или линкер FVIII содержит область a1 FVIII. В другом варианте реализации изобретения линкер VWF или линкер FVIII содержит область а2 FVIII. В других вариантах реализации изобретения линкер VWF или линкер FVIII содержит область а3 FVIII. В других вариантах реализации изобретения линкер VWF или линкер FVIII содержит сайт расщепления тромбином, содержащий X-V-P-R (SEQ ID NO: 3) и мотив экзосайта взаимодействия PAR1, где X представляет собой алифатическую аминокислоту.A VWF linker or FVIII linker suitable for a chimeric molecule of the invention is a thrombin-cleavable linker connecting a VWF protein to a heterologous moiety or a FVIII protein to a heterologous moiety. In one embodiment, the VWF linker or FVIII linker contains the a1 region of FVIII. In another embodiment, the VWF linker or FVIII linker contains the a2 region of FVIII. In other embodiments, the VWF linker or FVIII linker contains the a3 region of FVIII. In other embodiments, the VWF linker or FVIII linker comprises a thrombin cleavage site containing X-V-P-R (SEQ ID NO: 3) and a PAR1 interaction exosite motif, where X is an aliphatic amino acid.

В одном варианте реализации изобретения линкер VWF или линкер FVIII содержит область a1, которая содержит аминокислотную последовательность, по меньшей мере на около 80, около 85, около 90, около 95, около 96, около 97, около 98, около 99 или 100% идентичную участку от Met337 до Arg372, соответствующему полноразмерному зрелому FVIII, где область a1 способна расщепляться тромбином. В другом варианте реализации изобретения линкер VWF или линкер FVIII содержит область a1, которая содержит аминокислотную последовательность, по меньшей мере на около 80, около 85, около 90, около 95, около 96, около 97, около 98, около 99 или 100% идентичную аминокислотам 337-374, соответствующим полноразмерному зрелому FVIII, где область a1 способна расщепляться тромбином. В других вариантах реализации изобретения линкер VWF или линкер FVIII дополнительно содержит дополнительные аминокислоты, например одну, две, три, четыре, пять, десять или больше. В конкретном варианте реализации изобретения линкер VWF или линкер FVIII содержит ISMKNNEEAEDYDDDLTDSEMDVVRFDDDNSPSFIQIRSV (SEQ ID NO: 5). В некоторых вариантах реализации изобретения линкер VWF или линкер FVIII содержит область а2, которая содержит аминокислотную последовательность, по меньшей мере на около 80, около 85, около 90, около 95, около 96, около 97, около 98, около 99 или 100% идентичную участку от Glu720 до Arg740, соответствующему полноразмерному зрелому FVIII, где область а2 способна расщепляться тромбином. В других вариантах реализации изобретения линкер VWF или линкер FVIII содержит область а2, которая содержит аминокислотную последовательность, по меньшей мере на около 80, около 85, около 90, около 95, около 96, около 97, около 98, около 99% или 100% идентичную аминокислотам 712-743, соответствующим полноразмерному зрелому FVIII. В еще одних вариантах реализации изобретения линкер VWF или линкер FVIII дополнительно содержит дополнительные аминокислоты, например одну, две, три, четыре, пять, десять или больше. В конкретном варианте реализации изобретения линкер VWF содержит ISDKNTGDYYEDSYEDISAYLLSKNNAIEPRSFS (SEQ ID NO: 4).In one embodiment, the VWF linker or FVIII linker comprises an al region that contains an amino acid sequence that is at least about 80, about 85, about 90, about 95, about 96, about 97, about 98, about 99, or 100% identical to a region from Met337 to Arg372, corresponding to a full-length mature FVIII, where the a1 region is capable of being cleaved by thrombin. In another embodiment, the VWF linker or FVIII linker comprises an al region that contains an amino acid sequence that is at least about 80, about 85, about 90, about 95, about 96, about 97, about 98, about 99, or 100% identical to amino acids 337-374, corresponding to full-length mature FVIII, where the a1 region is capable of being cleaved by thrombin. In other embodiments, the VWF linker or FVIII linker further comprises additional amino acids, such as one, two, three, four, five, ten or more. In a particular embodiment, the VWF linker or FVIII linker comprises ISMKNNEEAEDYDDDLTDSEMDVVRFDDDNSPSFIQIRSV (SEQ ID NO: 5). In some embodiments, the VWF linker or FVIII linker comprises an a2 region that contains an amino acid sequence that is at least about 80, about 85, about 90, about 95, about 96, about 97, about 98, about 99, or 100% identical to a region from Glu720 to Arg740 corresponding to a full-length mature FVIII, where the a2 region is capable of being cleaved by thrombin. In other embodiments, the VWF linker or FVIII linker comprises an a2 region that contains an amino acid sequence of at least about 80, about 85, about 90, about 95, about 96, about 97, about 98, about 99%, or 100% identical to amino acids 712-743 corresponding to full-length mature FVIII. In still other embodiments, the VWF linker or FVIII linker further comprises additional amino acids, such as one, two, three, four, five, ten or more. In a specific embodiment, the VWF linker contains ISDKNTGDYYEDSYEDISAYLLSKNNAIEPRSFS (SEQ ID NO: 4).

В определенных вариантах реализации изобретения линкер VWF или линкер FVIII содержит область а3, которая содержит аминокислотную последовательность, по меньшей мере на около 80, около 85, около 90, около 95, около 96, около 97, около 98, около 99 или 100% идентичную участку от Glu1649 до Arg1689, соответствующему полноразмерному зрелому FVIII, где область а3 способна расщепляться тромбином. В некоторых вариантах реализации изобретения линкер VWF или линкер FVIII содержит область а3, которая содержит аминокислотную последовательность, по меньшей мере на около 80%, около 85, около 90, около 95, около 96, около 97, около 98, около 99 или 100% идентичную аминокислотам 1649-1692, соответствующим полноразмерному зрелому FVIII, где область а3 способна расщепляться тромбином. В других вариантах реализации изобретения линкер VWF или линкер FVIII дополнительно содержит дополнительные аминокислоты, например одну, две, три, четыре, пять, десять или больше. В конкретном варианте реализации изобретения линкер VWF или линкер FVIII содержит ISEITRTTLQSDQEEIDYDDTISVEMKKEDFDIYDEDENQSPRSFQ (SEQ ID NO: 6).In certain embodiments, the VWF linker or FVIII linker comprises an a3 region that contains an amino acid sequence that is at least about 80, about 85, about 90, about 95, about 96, about 97, about 98, about 99, or 100% identical to a region from Glu1649 to Arg1689, corresponding to full-length mature FVIII, where the a3 region is capable of being cleaved by thrombin. In some embodiments, the VWF linker or FVIII linker comprises an a3 region that contains an amino acid sequence of at least about 80%, about 85%, about 90%, about 95%, about 96%, about 97%, about 98%, about 99%, or 100% identical to amino acids 1649-1692 corresponding to full-length mature FVIII, where the a3 region is capable of being cleaved by thrombin. In other embodiments, the VWF linker or FVIII linker further comprises additional amino acids, such as one, two, three, four, five, ten or more. In a particular embodiment, the VWF linker or FVIII linker comprises ISEITRTTLQSDQEEIDYDDTISVEMKKEDFDIYDEDENQSPRSFQ (SEQ ID NO: 6).

В других вариантах реализации изобретения линкер VWF или линкер FVIII содержит сайт расщепления тромбином, содержащий X-V-P-R (SEQ ID NO: 3) и мотив экзосайта взаимодействия PAR1, где мотив экзосайта взаимодействия PAR1 содержит S-F-L-L-R-N (SEQ ID NO: 7). В некоторых вариантахIn other embodiments, the VWF linker or FVIII linker comprises a thrombin cleavage site containing X-V-P-R (SEQ ID NO: 3) and a PAR1 interaction exosite motif, wherein the PAR1 interaction exosite motif contains S-F-L-L-R-N (SEQ ID NO: 7). In some variants

- 17 041588 реализации изобретения мотив экзосайта взаимодействия PAR1 дополнительно содержит аминокислотную последовательность, выбранную из Р, P-N, P-N-D, P-N-D-K (SEQ ID NO: 8), P-N-D-K-Y (SEQ ID NO: 9), P-N-D-K-Y-E (SEQ ID NO: 10), P-N-D-K-Y-E-P (SEQ ID NO: 11), P-N-D-K-Y-E-P-F (SEQ ID NO: 12), P-N-D-K-Y-E-P-F-W (SEQ ID NO: 13), P-N-D-K-Y-E-P-F-W-E (SEQ ID NO: 14), P-N-D-K-Y-E-P-F-W-E-D (SEQ ID NO: 20), P-N-D-K-Y-E-P-F-W-E-D-E (SEQ ID NO: 21), P-N-D-K-Y-E-P-F-W-E-D-E-E (SEQ ID NO: 22), P-N-D-K-Y-E-P-F-W-E-D-E-E-S (SEQ ID NO: 23) или любой их комбинации. В других вариантах реализации изобретения алифатическую аминокислоту для сайта расщепления тромбином, содержащего X-V-P-R, выбирают из глицина, аланина, валина, лейцина или изолейцина. В конкретном варианте реализации изобретения сайт расщепления тромбином содержит L-V-P-R. В некоторых вариантах реализации изобретения тромбин расщепляет линкер VWF или линкер FVIII быстрее, чем тромбин расщеплял бы сайт расщепления тромбином (например, L-V-P-R), если бы сайт расщепления тромбином (L-V-P-R) замещал линкер VWF или линкер FVIII, соответственно (т.е. без мотива экзосайта взаимодействия PAR1). В некоторых вариантах реализации изобретения тромбин расщепляет линкер VWF или линкер FVIII по меньшей мере в около 10 раз, по меньшей мере в около 20 раз, по меньшей мере в около 30 раз, по меньшей мере в около 40 раз, по меньшей мере в около 50 раз, по меньшей мере в около 60 раз, по меньшей мере в около 70 раз, по меньшей мере в около 80 раз, по меньшей мере в около 90 раз или по меньшей мере в около 100 раз быстрее, чем тромбин расщеплял бы сайт расщепления тромбином (например, L-V-P-R), если бы сайт расщепления тромбином (например, L-V-P-R) замещал линкер VWF или линкер FVIII.The PAR1 interaction exosite motif further comprises an amino acid sequence selected from P, P-N, P-N-D, P-N-D-K (SEQ ID NO: 8), P-N-D-K-Y (SEQ ID NO: 9), P-N-D-K-Y-E (SEQ ID NO: 10), P-N-D-K-Y-E-P (SEQ ID NO: 11), P-N-D-K-Y-E-P-F (SEQ ID NO: 12), P-N-D-K-Y-E-P-F-W (SEQ ID NO: 13), P-N-D-K-Y-E-P-F-W-E (SEQ ID NO: 14), P-N-D-K-Y-E-P-F-W-E-D (SEQ ID NO: 20), P-N-D-K-Y-E-P-F-W-E-D-E (SEQ ID NO: 21), P-N-D-K-Y-E-P-F-W-E-D-E-E (SEQ ID NO: 22), P-N-D-K-Y-E-P-F-W-E-D-E-E-S (SEQ ID NO: 23), or any combination thereof. In other embodiments, the aliphatic amino acid for the X-V-P-R thrombin cleavage site is selected from glycine, alanine, valine, leucine, or isoleucine. In a particular embodiment, the thrombin cleavage site contains L-V-P-R. In some embodiments, thrombin cleaves the VWF linker or FVIII linker faster than thrombin would cleave the thrombin cleavage site (e.g., L-V-P-R) if the thrombin cleavage site (L-V-P-R) replaced the VWF linker or FVIII linker, respectively (i.e., no motif exosite of PAR1 interaction). In some embodiments, thrombin cleaves the VWF linker or FVIII linker at least about 10-fold, at least about 20-fold, at least about 30-fold, at least about 40-fold, at least about 50-fold. times, at least about 60 times, at least about 70 times, at least about 80 times, at least about 90 times, or at least about 100 times faster than thrombin would cleave the thrombin cleavage site (eg, L-V-P-R) if the thrombin cleavage site (eg, L-V-P-R) replaced the VWF linker or the FVIII linker.

В некоторых вариантах реализации изобретения линкер VWF или линкер FVIII, содержащий (i) область a1, (ii) область а2, (iii) область а3 или (iv) сайт расщепления тромбином X-V-P-R и мотив экзосайта взаимодействия PAR1, дополнительно содержит одну или более аминокислот, имеющих длину по меньшей мере около 2, 5, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 210, 220, 230, 240, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1200, 1400, 1600, 1800 или 2000 аминокислот. В одном варианте реализации изобретения одна или более аминокислот содержат пептид gly. В другом варианте реализации изобретения одна или более аминокислот содержат GlyGly. В других вариантах реализации изобретения одна или более аминокислот содержат IleSer. В еще одних вариантах реализации изобретения одна или более аминокислот содержат пептид gly/ser. В других вариантах реализации изобретения одна или более аминокислот содержат пептид gly/ser, имеющий формулу (Gly4Ser)n или S(Gly4Ser)n, где n обозначает положительное целое число, выбранное из 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 30, 40, 50, 60, 70, 80 или 100. В некоторых вариантах реализации изобретения одна или более аминокислот содержат (Gly4Ser)3 (SEQ ID NO: 89) или (Gly4Ser)4 (SEQ ID NO: 90).In some embodiments, a VWF linker or FVIII linker comprising (i) an a1 region, (ii) an a2 region, (iii) an a3 region, or (iv) an XVPR thrombin cleavage site and a PAR1 interaction exosite motif further comprises one or more amino acids, having a length of at least about 2, 5, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 210, 220, 230, 240, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1200, 1400, 1600, 1800 or 2000 amino acids . In one embodiment, one or more amino acids comprise a gly peptide. In another embodiment of the invention, one or more amino acids contain GlyGly. In other embodiments of the invention, one or more amino acids contain IleSer. In still other embodiments, one or more amino acids comprise a gly/ser peptide. In other embodiments, one or more amino acids comprise a gly/ser peptide having the formula (Gly4Ser)n or S(Gly4Ser)n, where n is a positive integer selected from 1, 2, 3, 4, 5, 6, 7 , 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 30, 40, 50, 60, 70, 80, or 100. In some embodiments, one or more amino acids contain (Gly 4 Ser) 3 (SEQ ID NO: 89) or (Gly 4 Ser) 4 (SEQ ID NO: 90).

И.С.2. Белок VWF.I.S.2. VWF protein.

VWF (также известен как F8VWF) представляет собой большой мультимерный гликопротеин, присутствующий в плазме крови и продуцируемый конститутивно в эндотелии (в тельцах Вейбеля-Паладе), мегакариоцитах (а-гранулах тромбоцитов) и субэндотелиальной соединительной ткани. Основной мономер VWF представляет собой белок, состоящий из 2813 аминокислот. Каждый мономер содержит ряд специфических доменов со специфическими функциями - домен D'/D3 (который связывается с фактором VIII), домен А1 (который связывается с рецептором GPIb тромбоцитов, гепарином, и/или возможно коллагеном), домен A3 (который связывается с коллагеном), домен С1 (в котором домен RGD связывается с интегрином тромбоцитов aIIbe3 при его активации) и домен цистеинового узла на С-конце белка (который VWF делит с фактором роста тромбоцитов (PDGF), трансформирующим фактором роста-β (TGFe) и β-хорионическим гонадотропином человека (eHCG)).VWF (also known as F8VWF) is a large multimeric glycoprotein present in plasma and produced constitutively in endothelium (Weibel-Palade bodies), megakaryocytes (platelet a-granules), and subendothelial connective tissue. The basic VWF monomer is a 2813 amino acid protein. Each monomer contains a number of specific domains with specific functions - the D'/D3 domain (which binds to factor VIII), the A1 domain (which binds to the platelet GPIb receptor, heparin, and/or possibly collagen), the A3 domain (which binds to collagen) , the C1 domain (in which the RGD domain binds to platelet integrin aIIbe3 when activated), and the cysteine knot domain at the C-terminus of the protein (which VWF shares with platelet growth factor (PDGF), transforming growth factor-β (TGFe), and β-chorionic human gonadotropin (eHCG)).

Термин белок VWF в используемом в данном документе значении включает, без ограничений, полноразмерный белок VWF или функциональные фрагменты VWF, содержащие домен D' и домен D3, способные ингибировать связывание эндогенного VWF с FVIII. В одном варианте реализации изобретения белок VWF связывается с FVIII. В другом варианте реализации изобретения белок VWF блокирует сайт связывания VWF на FVIII, тем самым ингибируя взаимодействие FVIII с эндогенным VWF. В других вариантах реализации изобретения белок VWF не выводится путями клиренса VWF. Белки VWF включают производные, варианты, мутанты или аналоги, сохраняющие такие активности VWF.The term VWF protein as used herein includes, without limitation, full-length VWF protein or functional VWF fragments containing a D' domain and a D3 domain capable of inhibiting the binding of endogenous VWF to FVIII. In one embodiment, the VWF protein binds to FVIII. In another embodiment, the VWF protein blocks the VWF binding site on FVIII, thereby inhibiting the interaction of FVIII with endogenous VWF. In other embodiments, the VWF protein is not cleared by VWF clearance pathways. VWF proteins include derivatives, variants, mutants, or analogs that retain such VWF activities.

Мономерная последовательность человеческого VWF из 2813 аминокислот депонирована в Genbank под номером доступа _NP_000543.2__. Нуклеотидная последовательность, кодирующая человеческий VWF, депонирована в Genbank под номером доступа_NM_000552.3_. Нуклеотидная последовательность человеческого VWF обозначена как SEQ ID NO: 1. SEQ ID NO: 2 представляет собой аминокислотную последовательность, кодируемую SEQ ID NO: 1. Все домены VWF перечислены в табл. 1.The 2813 amino acid monomeric sequence of human VWF has been deposited with Genbank under accession number _NP_000543.2__. The nucleotide sequence encoding the human VWF has been deposited with Genbank under accession number _NM_000552.3_. The nucleotide sequence of the human VWF is designated as SEQ ID NO: 1. SEQ ID NO: 2 is the amino acid sequence encoded by SEQ ID NO: 1. All VWF domains are listed in Table. 1.

- 18 041588- 18 041588

Таблица 1. Последовательности VWFTable 1. VWF sequences

Домены VWF VWF domains Аминокислотная последовательность Amino acid sequence Сигнальный пептид VWF (аминокислоты 1-22 SEQ ГО NO: 2) Signal peptide VWF (amino acids 1-22 SEQ GO NO: 2) 1 MIPARFAGVL LALALILPGT LC 22 1 MIPARFAGVL LALALILPGT LC 22 Область D1D2 VWF (аминокислоты 23-763 SEQ ГО NO: 2) VWF D1D2 region (amino acids 23-763 SEQ ID NO: 2) 23 AEGTRGRS STARCSLFGS DFVNTFDGSM 51 YSFAGYCSYL LAGGCQKRSF SIIGDFQNGK RVSLSVYLGE FFDIHLFVNG 101 TVTQGDQRVS MPYASKGLYL ETEAGYYKLS GEAYGFVARI DGSGNFQVLL 151 SDRYFNKTCG LCGNFNIFAE DDFMTQEGTL TSDPYDFANS WALSSGEQWC 201 ERASPPSSSC NISSGEMQKG LWEQCQLLKS TSVFARCHPL VDPEPFVALC 251 EKTLCECAGG LECACPALLE YARTCAQEGM VLYGWTDHSA CSPVCPAGME 301 YRQCVSPCAR TCQSLHINEM CQERCVDGCS CPEGQLLDEG LCVESTECPC 351 VHSGKRYPPG TSLSRDCNTC ICRNSQWICS NEECPGECLV TGQSHFKSFD 401 NRYFTFSGIC QYLLARDCQD HSFSIVIETV QCADDRDAVC TRSVTVRLPG 451 LHNSLVKLKH GAGVAMDGQD IQLPLLKGDL RIQHTVTASV RLSYGEDLQM 501 DWDGRGRLLV KLSPVYAGKT CGLCGNYNGN QGDDFLTPSG LAEPRVEDFG 23 AEGTRGRS STARCSLFGS DFVNTFDGSM 51 YSFAGYCSYL LAGGCQKRSF SIIGDFQNGK RVSLSVYLGE FFDIHLFVNG 101 TVTQGDQRVS MPYASKGLYL ETEAGYYKLS GEAYGFVARI DGSGNFQVLL 151 SDRYFNKTCG LCGNFNIFAE DDFMTQEGTL TSDPYDFANS WALSSGEQWC 201 ERASPPSSSC NISSGEMQKG LWEQCQLLKS TSVFARCHPL VDPEPFVALC 251 EKTLCECAGG LECACPALLE YARTCAQEGM VLYGWTDHSA CSPVCPAGME 301 YRQCVSPCAR TCQSLHINEM CQERCVDGCS CPEGQLLDEG LCVESTECPC 351 VHSGKRYPPG TSLSRDCNTC ICRNSQWICS NEECPGECLV TGQSHFKSFD 401 NRYFTFSGIC QYLLARDCQD HSFSIVIETV QCADDRDAVC TRSVTVRLPG 451 LHNSLVKLKH GAGVAMDGQD IQLPLLKGDL RIQHTVTASV RLSYGEDLQM 501 DWDGRGRLLV KLSPVYAGKT CGLCGNYNGN QGDDFLTPSG LAEPRVEDFG

- 19 041588- 19 041588

551 NAWKLHGDCQ DLQKQHSDPC ALNPRMTRFS EEACAVLTSP TFEACHRAVS 601 PLPYLRNCRY DVCSCSDGRE CLCGALASYA AACAGRGVRV AWREPGRCEL 651 NCPKGQVYLQ CGTPCNLTCR SLSYPDEECN EACLEGCFCP PGLYMDERGD 701 CVPKAQCPCY YDGEIFQPED IFSDHHTMCY CEDGFMHCTM SGVPGSLLPD 751 AVLSSPLSHR SKR 763 551 NAWKLHGDCQ DLQKQHSDPC ALNPRMTRFS EEACAVLTSP TFEACHRAVS 601 PLPYLRNCRY DVCSCSDGRE CLCGALASYA AACAGRGVRV AWREPGRCEL 651 NCPKGQVYLQ CGTPCNLTCR SLSYPDEECN EACLEGCFCP PGLYMDERGD 701 CVPKAQCPCY YDGEIFQPED IFSDHHTMCY CEDGFMHCTM SGVPGSLLPD 751 AVLSSPLSHR SKR 763 Домен D’ VWF Domain D'VWF 764 SLSCRPP MVKLVCPADN LRAEGLECTK TCQNYDLECM 801 SMGCVSGCLC PPGMVRHENR CVALERCPCF HQGKEYAPGE TVKIGCNTCV 851 CRDRKWNCTD HVCDAT 866 764 SLSCRPP MVKLVCPADN LRAEGLECTK TCQNYDLECM 801 SMGCVSGCLC PPGMVRHENR CVALERCPCF HQGKEYAPGE TVKIGCNTCV 851 CRDRKWNCTD HVCDAT 866 Домен D3 VWF D3 VWF domain 867 C S T I_ GMAH YL T_F_D_G_ ДДХДДДДЕ CQ YyLyQDYCGS 901 NPGT FRI LVG_ Д KGCJ HJ_S VK ДАKRVTILVE _GGEI ELFDGE VNVKRPMKDE 951 thfevvesgr_ ууудддбКАД ДДУУршуд7 vvlkqt yqe KVCGLCGNFp 10 01 GIQNNDLT S S_ ДД QVEEDyДД AN_SWKVS SQ _CADT RKVP LD ЗЗРАТСНДД! 1051 MKQTMVDSS C_ ДДДT_S_DVF_Q_D _CNKLVD PE PY _LDVC IYDT C S CESIGDCACF 1101 GDTIAAYAHy_ CAQHGJVVTW ATATLCPQSC _EERNLRENGY ECEWRYNSCA 1151 PACQyTCQHP_ АРДАСААС_УАУДНАНСР PG _KILDELLQTC ypPEDCPyCE 12 01 VAGRRFASGK_ КуТДДРЗДРД_HCQ АДСруу_NLTCEACQEP 1240 867 CST I_ GMAH YL T_F_D_G_ ДДХДДДДЕ CQ YyLyQDYCGS 901 NPGT FRI LVG_ Д KGCJ HJ_S VK ДАKRVTILVE _GGEI ELFDGE VNVKRPMKDE 951 thfevvesgr_ ууудддбКАД ДДУУршуд 7 vvlkqt yqe KVCGLCGNFp 10 01 GIQNNDLT S S_ ДД QVEEDyДД A N _SWKVS SQ _CADT RKVP LD ЗЗРАТСНДД! 1051 MKQTMVDSS C_ ДДДT_S_DVF_Q_D _CNKLVD PE PY _LDVC IYDT CS CESIGDCACF 1101 GDTIAAYAHy_ CAQHGJVVTW ATATLCPQSC _EERNLRENGY ECEWRYNSCA 1151 PACQyTCQHP_ А Р ДА С АА С _УАУДНАНСР PG _KILDELLQTC ypPEDCPyCE 12 01 VAGRRFASGK_ КуТДДРЗДРД_HCQ АДСруу_NLTCEACQEP 1240 Домен Al VWF Al VWF domain 12 41 GGLWPPTDA 1251 PVSPTTLYVE DISEPPLHDF YCSRLLDLVF LLDGSSRLSE AEFEVLKAFV 1301 VDMMERLRIS QKWVRVAWE YHDGSHAYIG LKDRKRPSEL RRIASQVKYA 1351 GSQVASTSEV LKYTLFQIFS KIDRPEASRI ALLLMASQEP QRMSRNFVRY 1401 VQGLKKKKVI VIPVGIGPHA NLKQIRLIEK QAPENKAFVL SSVDELEQQR 1451 DEIVSYLCDL APEAPPPTLP PDMAQVTVG 1479 12 41 GGLWPPTDA 1251 PVSPTTLYVE DISEPPLHDF YCSRLLDLVF LLDGSSRLSE AEFEVLKAFV 1301 VDMMERLRIS QKWVRVAWE YHDGSHAYIG LKDRKRPSEL RRIASQVKYA 1351 GSQVASTSEV LKYTLFQIFS KIDRPEASRI ALLLMASQEP QRMSRNFVRY 1401 VQGLKKKKVI VIPVGIGPHA NLKQIRLIEK QAPENKAFVL SSVDELEQQR 1451 DEIVSYLCDL APEAPPPTLP PDMAQVTVG 1479 Нуклеотидная последовательность (SEQ ID NO: 1) Nucleotide sequence (SEQ ID NO: 1) Полноразмерный VWF Full size VWF 1 ATGATTCCTG CCAGATTTGC CGGGGTGCTG CTTGCTCTGG CCCTCATTTT 51 GCCAGGGACC CTTTGTGCAG AAGGAACTCG CGGCAGGTCA TCCACGGCCC 101 GATGCAGCCT TTTCGGAAGT GACTTCGTCA ACACCTTTGA TGGGAGCATG 151 TACAGCTTTG CGGGATACTG CAGTTACCTC CTGGCAGGGG GCTGCCAGAA 201 ACGCTCCTTC TCGATTATTG GGGACTTCCA GAATGGCAAG AGAGTGAGCC 251 TCTCCGTGTA TCTTGGGGAA TTTTTTGACA TCCATTTGTT TGTCAATGGT 301 ACCGTGACAC AGGGGGACCA AAGAGTCTCC ATGCCCTATG CCTCCAAAGG 351 GCTGTATCTA GAAACTGAGG CTGGGTACTA CAAGCTGTCC GGTGAGGCCT 401 ATGGCTTTGT GGCCAGGATC GATGGCAGCG GCAACTTTCA AGTCCTGCTG 1 ATGATTCCTG CCAGATTTGC CGGGGTGCTG CTTGCTTGG CCCTCATTTTT 51 GCCAGGGACC CTTTGTGCAG AAGGAACTCG CGGCAGGTCA TCCACGGCCC 101 GATGCAGCCT TTTCGGAAGT GACTTCGTCA ACACCTTTGA TGGGAGCATG 151 TACAGCTTTG CGGGATACTG CAGTTACCTC CTGGCAGGGG GCTGCCAGAA 201 ACGCTCCTTCTCGATTATTGGGGACTTCCA GAATGGCAAGAGAGTGAGCC 251 TCTCCGTGTA TCTTGGGGAA TTTTTTGACA TCCATTTGTT TGTCAATGGT 301 ACCGTGACAC AGGGGGACCA AAGAGTCTCC ATGCCCTATG CCTCCAAAGG 351 GCTGTATCTA GAAACTGAGG CTGGGTACTA CAAGTGTCC GGTGAGGCCT 401 ATGGCTTTGT GGCCAGGATC GATGGCAGCG GCAACTTTCA AGTCCTGCTG

- 20 041588- 20 041588

451 TCAGACAGAT ACTTCAACAA GACCTGCGGG CTGTGTGGCA ACTTTAACAT 501 CTTTGCTGAA GATGACTTTA TGACCCAAGA AGGGACCTTG ACCTCGGACC 551 CTTATGACTT TGCCAACTCA TGGGCTCTGA GCAGTGGAGA ACAGTGGTGT 601 GAACGGGCAT CTCCTCCCAG CAGCTCATGC AACATCTCCT CTGGGGAAAT 651 GCAGAAGGGC CTGTGGGAGC AGTGCCAGCT TCTGAAGAGC ACCTCGGTGT 701 TTGCCCGCTG CCACCCTCTG GTGGACCCCG AGCCTTTTGT GGCCCTGTGT 751 GAGAAGACTT TGTGTGAGTG TGCTGGGGGG CTGGAGTGCG CCTGCCCTGC 801 CCTCCTGGAG TACGCCCGGA CCTGTGCCCA GGAGGGAATG GTGCTGTACG 851 GCTGGACCGA CCACAGCGCG TGCAGCCCAG TGTGCCCTGC TGGTATGGAG 901 TATAGGCAGT GTGTGTCCCC TTGCGCCAGG ACCTGCCAGA GCCTGCACAT 951 CAATGAAATG TGTCAGGAGC GATGCGTGGA TGGCTGCAGC TGCCCTGAGG 1001 GACAGCTCCT GGATGAAGGC CTCTGCGTGG AGAGCACCGA GTGTCCCTGC 1051 GTGCATTCCG GAAAGCGCTA CCCTCCCGGC ACCTCCCTCT CTCGAGACTG 1101 CAACACCTGC ATTTGCCGAA ACAGCCAGTG GATCTGCAGC AATGAAGAAT 1151 GTCCAGGGGA GTGCCTTGTC ACTGGTCAAT CCCACTTCAA GAGCTTTGAC 1201 AACAGATACT TCACCTTCAG TGGGATCTGC CAGTACCTGC TGGCCCGGGA 1251 TTGCCAGGAC CACTCCTTCT CCATTGTCAT TGAGACTGTC CAGTGTGCTG 1301 ATGACCGCGA CGCTGTGTGC ACCCGCTCCG TCACCGTCCG GCTGCCTGGC 1351 CTGCACAACA GCCTTGTGAA ACTGAAGCAT GGGGCAGGAG TTGCCATGGA 1401 TGGCCAGGAC ATCCAGCTCC CCCTCCTGAA AGGTGACCTC CGCATCCAGC 1451 ATACAGTGAC GGCCTCCGTG CGCCTCAGCT ACGGGGAGGA CCTGCAGATG 1501 GACTGGGATG GCCGCGGGAG GCTGCTGGTG AAGCTGTCCC CCGTCTATGC 1551 CGGGAAGACC TGCGGCCTGT GTGGGAATTA CAATGGCAAC CAGGGCGACG 1601 ACTTCCTTAC CCCCTCTGGG CTGGCRGAGC CCCGGGTGGA GGACTTCGGG 1651 AACGCCTGGA AGCTGCACGG GGACTGCCAG GACCTGCAGA AGCAGCACAG 1701 CGATCCCTGC GCCCTCAACC CGCGCATGAC CAGGTTCTCC GAGGAGGCGT 1751 GCGCGGTCCT GACGTCCCCC ACATTCGAGG CCTGCCATCG TGCCGTCAGC 1801 CCGCTGCCCT ACCTGCGGAA CTGCCGCTAC GACGTGTGCT CCTGCTCGGA 1851 CGGCCGCGAG TGCCTGTGCG GCGCCCTGGC CAGCTATGCC GCGGCCTGCG 1901 CGGGGAGAGG CGTGCGCGTC GCGTGGCGCG AGCCAGGCCG CTGTGAGCTG 1951 AACTGCCCGA AAGGCCAGGT GTACCTGCAG TGCGGGACCC CCTGCAACCT 2001 GACCTGCCGC TCTCTCTCTT ACCCGGATGA GGAATGCAAT GAGGCCTGCC 451 TCAGACAGAT ACTTCAACAA GACCTGCGGG CTGTGTGGCA ACTTTAACAT 501 CTTTGCTGAA GATGACTTTA TGACCCAAGA AGGGACCTTGACCTCGGACC 551 CTTATGACTT TGCCAACTCA TGGGCTCTGA GCAGTGGAGA ACAGTGGTGT 601 GAACGGGCAT CTCCTCCCAG CAGCTCATGC AACATCTCCT CTGGGGAAAT 651 GCAGAAGGGC CTGTGGGAGC AGTGCCAGCT TCTGAAGAGCACCTCGGTGT 701 TTGCCCGCTG CCACCCTCTG GTGGACCCCG AGCCTTTTGT GGCCCTGTGT 751 GAGAAGACTT TGTGTGAGTG TGCTGGGGGG CTGGAGTGCG CCTGCCCTGC 801 CCTCCTGGAG TACGCCCGGA CCTGTGCCCA GGAGGGAATG GTGCTGTACG 851 GCTGGACCGA CCACAGCGCG TGCAGCCCAG TGTGCCCTGC TGGTATGGAG 901 TATAGGCAGT GTGTGTCCCC TTGCGCCAGG ACCTGCCAGA GCCTGCACAT 951 CAATGAAATG TGTCAGGAGC GATGCGTGGA TGGCTGCAGC TGCCCTGAGG 1001 GACAGCTCCT GGATGAAGGC CTCTGCGTGG AGAGCACCGA GTGTCCCCTGC 1051 GTGCATTCCG GAAAGCGCTA CCCTCCCGGC ACCTCCCTCTCTCGAGACTG 1101 CAACACCTGC ATTTGCCGAA ACAGCCAGTG GATCTGCAGC AATGAAGAAT 1151 GTCCAGGGGA GTGCCTTGTC ACTGGTCAAT CCCACTTCAAGAGCTTTGAC 1201 AACAGATACT TCACCTTCAG TGGGATCTGC CAGTACCTGGCTGGCCCGGGA 1251 TTGCCAGGAC CACTCCTTCT CCATTGTCAT TGAGACTGTC CAGTGTGCTG 1301 ATGACCGCGA CGCTGTGTGC ACCCGCTCCG TCACCGTCCG GCTGCCTGGC 1351 CTGCACAACA GCCTTGTGAA ACTGAAGCAT GGGGCAGGAG TTGCCATGGA 1401 TGGCCAGGAC ATCCAGCTCC CCCTCCTGAA AGGTGACCTC CGCATCCAGC 1451 ATACAGTGAC GGCCTCCGTG CGCCTCAGCT ACGGGGAGGA CCTGCAGATG 1501 GACTGGGATG GCCGCGGGAG GCTGCGTGGTG AAGCTGTCCC CCGTCTATGC 1551 CGGGAAGAC TGCGGCCTGT GTGGGAATTA CAATGGCAAC CAGGGCGACG 1601 ACTTCCTTAC CCCCTCTGGG CTGGCRGAGC CCCGGGTGGA GGACTTCGGG 1651 AACGCCTGGA AGCTGCACGG GGACTGCCAG GACCTGCAGAAGCAGCACAG 1701 CGATCCCTGC GCCCTCAACC CGCGCATGAC CAGGTTCTCC GAGGAGGCGT 1751 GCGCGGTCCT GACGTCCCCC ACATTCGAGG CCTGCCATCG TGCCGTCAGC 1801 CCGCTGCCCT ACCTGCGGAA CTGCCGCTAC GACGTGTGCT CCTGCTCGGA 1851 CGGCCGCGAG TGCCTGTGCG GCGCCCTGGC CAGCTATGCC GCGGCCTGCG 1901 CGGGGAGAGG CGTGCGCGTC GCGTGGCGCG AGCCAGGCCG CTGTGAGCTG 1951 AACTGCCCGA AAGGCCAGGT GTACCTGGAG TGCGGGACCCC CCTGCAACCT 2001 GACCTGCCGC TCTCTCTCTT ACCCGGATGA GGAATGCAAT GAGGCCTGCC

- 21 041588- 21 041588

2051 TGGAGGGCTG CTTCTGCCCC CCAGGGCTCT ACATGGATGA GAGGGGGGAC 2101 TGCGTGCCCA AGGCCCAGTG CCCCTGTTAC TATGACGGTG AGATCTTCCA 2151 GCCAGAAGAC ATCTTCTCAG ACCATCACAC CATGTGCTAC TGTGAGGATG 2201 GCTTCATGCA CTGTACCATG AGTGGAGTCC CCGGAAGCTT GCTGCCTGAC 2251 GCTGTCCTCA GCAGTCCCCT GTCTCATCGC AGCAAAAGGA GCCTATCCTG 2301 TCGGCCCCCC ATGGTCAAGC TGGTGTGTCC CGCTGACAAC CTGCGGGCTG 2351 AAGGGCTCGA GTGTACCAAA ACGTGCCAGA ACTATGACCT GGAGTGCATG 2401 AGCATGGGCT GTGTCTCTGG CTGCCTCTGC CCCCCGGGCA TGGTCCGGCA 2451 TGAGAACAGA TGTGTGGCCC TGGAAAGGTG TCCCTGCTTC CATCAGGGCA 2501 AGGAGTATGC CCCTGGAGAA ACAGTGAAGA TTGGCTGCAA CACTTGTGTC 2551 TGTCGGGACC GGAAGTGGAA CTGCACAGAC CATGTGTGTG ATGCCACGTG 2601 CTCCACGATC GGCATGGCCC ACTACCTCAC CTTCGACGGG CTCAAATACC 2651 TGTTCCCCGG GGAGTGCCAG TACGTTCTGG TGCAGGATTA CTGCGGCAGT 2701 AACCCTGGGA CCTTTCGGAT CCTAGTGGGG AATAAGGGAT GCAGCCACCC 2751 CTCAGTGAAA TGCAAGAAAC GGGTCACCAT CCTGGTGGAG GGAGGAGAGA 2801 TTGAGCTGTT TGACGGGGAG GTGAATGTGA AGAGGCCCAT GAAGGATGAG 2851 ACTCACTTTG AGGTGGTGGA GTCTGGCCGG TACATCATTC TGCTGCTGGG 2901 CAAAGCCCTC TCCGTGGTCT GGGACCGCCA CCTGAGCATC TCCGTGGTCC 2951 TGAAGCAGAC ATACCAGGAG AAAGTGTGTG GCCTGTGTGG GAATTTTGAT 3001 GGCATCCAGA ACAATGACCT CACCAGCAGC AACCTCCAAG TGGAGGAAGA 3051 CCCTGTGGAC TTTGGGAACT CCTGGAAAGT GAGCTCGCAG TGTGCTGACA 3101 CCAGAAAAGT GCCTCTGGAC TCATCCCCTG CCACCTGCCA TAACAACATC 3151 ATGAAGCAGA CGATGGTGGA TTCCTCCTGT AGAATCCTTA CCAGTGACGT 3201 CTTCCAGGAC TGCAACAAGC TGGTGGACCC CGAGCCATAT CTGGATGTCT 3251 GCATTTACGA CACCTGCTCC TGTGAGTCCA TTGGGGACTG CGCCTGCTTC 3301 TGCGACACCA TTGCTGCCTA TGCCCACGTG TGTGCCCAGC ATGGCAAGGT 3351 GGTGACCTGG AGGACGGCCA CATTGTGCCC CCAGAGCTGC GAGGAGAGGA 3401 ATCTCCGGGA GAACGGGTAT GAGTGTGAGT GGCGCTATAA CAGCTGTGCA 3451 CCTGCCTGTC AAGTCACGTG TCAGCACCCT GAGCCACTGG CCTGCCCTGT 3501 GCAGTGTGTG GAGGGCTGCC ATGCCCACTG CCCTCCAGGG AAAATCCTGG 3551 ATGAGCTTTT GCAGACCTGC GTTGACCCTG AAGACTGTCC AGTGTGTGAG 3601 GTGGCTGGCC GGCGTTTTGC CTCAGGAAAG AAAGTCACCT TGAATCCCAG 2051 TGGAGGGCTG CTTCTGCCCC CCAGGGCTCT ACATGGATGA GAGGGGGGAC 2101 TGCGTGCCCA AGGCCCAGTG CCCCTGTTAC TATGACGGTG AGATCTTCCA 2151 GCCAGAAGAC ATCTTCTCAG ACCATCAACAC CATGTGCTAC TGTGAGGATG 2201 GCTTCATGCA CTGTACCATG AGTGGAGTCC CCGGAAGCTTT GCTGCCTGAC 2251 GCTGTCCTCA GCAGTCCCCT GTCTCATCGC AGCAAAAGGA GCCTATCCTG 2301 TCGGCCCCCC ATGGTCAAGC TGGTGTGTCC CGCTGACAAC CTGCGGGCTG 2351 AAGGGCTCGA GTGTACCAAAA ACGTGCCAGA ACTATGACCT GGAGTGCATG 2401 AGCATGGGCT GTGTCTCTGG CTGCCTCTGC CCCCCGGGCA TGGTCCGGCA 2451 TGAGAACAGA TGTGTGGCCC TGGAAAGGTG TCCCTGCTTCCATCAGGGCA 2501 AGGAGTATGCCCCTGGAGAA ACAGTGAAGA TTGGCTGCAA CACTTGTGTC 2551 TGTCGGGACC GGAAGTGGAA CTGCACAGAC CATGTGTGTG ATGCCACGTG 2601 CTCCACGATC GGCATGGCCC ACTACCTCAC CTTCGACGGG CTCAAATACC 2651 TGTTCCCCGGGGAGTGCCAGTACGTTCTGG TGCAGGATTA CTGCGGCAGT 2701 AACCCTGGGA CCTTTCGGAT CCTAGTGGGG AATAAGGGAT GCAGCCACCC 2751 CTCAGTGAAA TGCAAGAAAC GGGTCACCAT CCTGGTGGAG GGAGGAGAGA 2801 TTGAGCTGTT TGACGGGGAG GTGAATGTGA AGAGGCCCAT GAAGGATGAG 2851 ACTCACTTTG AGGTGGTGGA GCTTGGCCGG TACATCATTCTGCTGCTGGG 2901 CAAAGCCCTC TCCGTGGTCT GGGACCGCCA CCTGAGCATC TCCGTGGTCC 2951 TGAAGCAGAC ATACCAGGAG AAAGTGTGTG GCCTGTGTGG GAATTTTGAT 3001 GGCATCCAGA ACAATGACCT CACCAGCAGC AACCTCCAAG TGGAGGAAGA 3051 CCTGTGGAC TTTGGGAACT CCTGGAAAGT GAGCTCGCAG TGTGCTGACA 3101 CCAGAAAAGT GCCTCTGGAC TCATCCCCTG CCACCTGCCA TAACAACATC 3151 ATGAAGCAGA CGATGGTGGA TTCCTCCTGT AGAATCCTTA CCAGTGACGT 3201 CTTCCAGGAC TGCAACAAGC TGGTGGACCCC CGAGCCATAT CTGGATGTCT 3251 GCATTTACGA CACCTGCTCC TGTGAGTCCA TTGGGGACTG CGCCTGCTTC 3301 TGCGACACCA TTGCTGCCTA TGCCCACGTG TGTGCCCAGCATGGCAAGGT 3351 GGTGACTGG AGGACGGCCA CATTGTGCCC CCAGAGCTGC GAGGAGAGGA 3401 ATCTCCGGGA GAACGGGTAT GAGTGTGAGT GGCCGCTATAA CAGCTGTGCA 3451 CCTGCCTGTC AAGTCACGTG TCAGCACCCT GAGCCACTGG CCTGCCCTGT 3501 GCAGTGTGTG GAGGGCTGCC ATGCCCACTG CCCTCCAGGG AAAATCCTGG 3551 ATGAGCTTTT GCAGACCTGC GTTGACCCTG AAGACTGTCCAGTGTGTGAG 3601 GTGGCTGGCC GGCGTTTTGC CTCAGGAAAG AAAGTCACCT TGAATCCCAG

- 22 041588- 22 041588

3651 TGACCCTGAG CACTGCCAGA TTTGCCACTG TGATGTTGTC AACCTCACCT 3701 GTGAAGCCTG CCAGGAGCCG GGAGGCCTGG TGGTGCCTCC CACAGATGCC 3751 CCGGTGAGCC CCACCACTCT GTATGTGGAG GACATCTCGG AACCGCCGTT 3801 GCACGATTTC TACTGCAGCA GGCTACTGGA CCTGGTCTTC CTGCTGGATG 3851 GCTCCTCCAG GCTGTCCGAG GCTGAGTTTG AAGTGCTGAA GGCCTTTGTG 3901 GTGGACATGA TGGAGCGGCT GCGCATCTCC CAGAAGTGGG TCCGCGTGGC 3951 CGTGGTGGAG TACCACGACG GCTCCCACGC CTACATCGGG CTCAAGGACC 4001 GGAAGCGACC GTCAGAGCTG CGGCGCATTG CCAGCCAGGT GAAGTATGCG 4051 GGCAGCCAGG TGGCCTCCAC CAGCGAGGTC TTGAAATACA CACTGTTCCA 4101 AATCTTCAGC AAGATCGACC GCCCTGAAGC CTCCCGCATC GCCCTGCTCC 4151 TGATGGCCAG CCAGGAGCCG CAACGGATGT CCCGGAACTT TGTCCGCTAC 4201 GTCCAGGGCC TGAAGAAGAA GAAGGTCATT GTGATCCCGG TGGGCATTGG 4251 GCCCCATGCC AACCTCAAGC AGATCCGCCT CATCGAGAAG CAGGCCCCTG 4301 AGAACAAGGC CTTCGTGCTG AGCAGTGTGG ATGAGCTGGA GCAGCAAAGG 4351 GACGAGATCG TTAGCTACCT CTGTGACCTT GCCCCTGAAG CCCCTCCTCC 4401 TACTCTGCCC CCCGACATGG CACAAGTCAC TGTGGGCCCG GGGCTCTTGG 4451 GGGTTTCGAC CCTGGGGCCC AAGAGGAACT CCATGGTTCT GGATGTGGCG 4501 TTCGTCCTGG AAGGATCGGA CAAAATTGGT GAAGCCGACT TCAACAGGAG 4551 CAAGGAGTTC ATGGAGGAGG TGATTCAGCG GATGGATGTG GGCCAGGACA 4601 GCATCCACGT CACGGTGCTG CAGTACTCCT ACATGGTGAC CGTGGAGTAC 4651 CCCTTCAGCG AGGCACAGTC CAAAGGGGAC ATCCTGCAGC GGGTGCGAGA 4701 GATCCGCTAC CAGGGCGGCA ACAGGACCAA CACTGGGCTG GCCCTGCGGT 4751 ACCTCTCTGA CCACAGCTTC TTGGTCAGCC AGGGTGACCG GGAGCAGGCG 4801 CCCAACCTGG TCTACATGGT CACCGGAAAT CCTGCCTCTG ATGAGATCAA 4851 GAGGCTGCCT GGAGACATCC AGGTGGTGCC CATTGGAGTG GGCCCTAATG 4901 CCAACGTGCA GGAGCTGGAG AGGATTGGCT GGCCCAATGC CCCTATCCTC 4951 ATCCAGGACT TTGAGACGCT CCCCCGAGAG GCTCCTGACC TGGTGCTGCA 5001 GAGGTGCTGC TCCGGAGAGG GGCTGCAGAT CCCCACCCTC TCCCCTGCAC 5051 CTGACTGCAG CCAGCCCCTG GACGTGATCC TTCTCCTGGA TGGCTCCTCC 5101 AGTTTCCCAG CTTCTTATTT TGATGAAATG AAGAGTTTCG CCAAGGCTTT 5151 CATTTCAAAA GCCAATATAG GGCCTCGTCT CACTCAGGTG TCAGTGCTGC 5201 AGTATGGAAG CATCACCACC ATTGACGTGC CATGGAACGT GGTCCCGGAG 3651 TGACCCTGAG CACTGCCAGA TTTGCCACTG TGATGTTGTCAACCTCACCT 3701 GTGAAGCCTG CCAGGAGCCG GGAGGCCTGG TGGTGCCTCCCACAGATGCC 3751 CCGGTGAGCC CCACCACTCT GTATGTGGAG GACATCTCGG AACCGCCGTT 3801 GCACGATTTC TACTGCAGCA GGCTACTGGA CCTGGTCTTC CTGCTGGATG 3851 GCTCCTCCAG GCTGTCCGAG GCTGAGTTTG AAGTGCTGAA GGCCTTTGTG 3901 GTGGACATGA TGGAGCGGCT GCGCATCTCC CAGAAGTGGG TCCGCGTGGC 3951 CGTGGTGGAG TACCACGACG GCTCCCACGC CTACATCGGG CTCAAGGACC 4001 GGAAGCGACC GTCAGAGCTG CGGCCGCATTG CCAGCCAGGT GAAGTATGCG 4051 GGCAGCCAGG TGGCCTCCAC CAGCGAGGTC TTGAAATACA CACTGTTCCA 4101 AATCTTCAGC AAGATCGACC GCCCTGAAGC CTCCCGCATC GCCCTGCTCC 4151 TGATGGCCAG CCAGGAGCCG CAACGGATGT CCCGGAACTT TGTCCGCTAC 4201 GTCCAGGGCC TGAAGAAGAA GAAGGTCATT GTGATCCCGG TGGGCATTGG 4251 GCCCCATGCC AACCTCAAGC AGATCCGCCT CATCGAGAAG CAGGCCCCTG 4301 AGAACAAGGC CTTCGTGCTG AGCAGTGTGG ATGAGCTGGA GCAGCAAAGG 4351 GACGAGATCG TTAGCTACCT CTGTGACCTT GCCCCTGAAG CCCCTCCTCC 4401 TACTCTGCCC CCCGACATGG CACAAGTCAC TGTGGGCCCG GGGCTCTTGG 4451 GGGTTTCGAC CCTGGGGCCC AAGAGGAACT CCATGGTTCT GGATGTGGCG 4501 TTCGTCCTGG AAGGATCGGA CAAAATTGGT GAAGCCGACT TCAACAGGAG 4551 CAAGGAGTTC ATGGAGGAGG TGATTCAGCG GATGGATGTG GGCCAGGACA 4601 GCATCCACGT CACGGTGCTG CAGTACTCCT ACATGGTGAC CGTGGAGTAC 4651 CCCTTCAGCG AGGCACAGTC CAAAGGGGAC ATCCTGCAGC GGGTGCGAGA 4701 GATCCGCTAC CAGGGCGGCA ACAGGACCAA CACTGGGCTG GCCCTGCGGT 4751 ACCTCTCTGA CCACAGCTTC TTGGTCAGCC AGGGTGACCG GGAGCAGGCG 4801 CCCAACCTGG TCTACATGGT CACCGGAAAT CCTGCCTCTGATGAGATCAA 4851 GAGGCCTGCCT GGAGACATCC AGGTGGTGCC CATTGGAGTG GGCCCTAATG 4901 CCAACGTGCA GGAGCTGGAG AGGATTGGCT GGCCCAATGCCCCTATCCTC 4951 ATCCAGGACT TTGAGACGCT CCCCCGAGAG GCTCCTGACC TGGTGCTGCA 5001 GAGGTGCTGC TCCGGAGAGG GGCTGCAGAT CCCCACCCTC TCCCCTGCAC 5051 CTGACTGCAG CCAGCCCCTG GACGTGATCC TTCTCCTGGA TGGCTCCTCC 5101 AGTTTCCCAG CTTCTTATTT TGATGAAATG AAGAGTTTCG CCAAGGCTTT 5151 CATTTCAAAAA GCCAATATAG GGCCTCGTCT CACTCAGGTG TCAGTGCTGC 5201 AGTATGGAAG CATCACCACC ATTGACGTGC CATGGAACGT GGTCCCGGAG

- 23 041588- 23 041588

5251 AAAGCCCATT TGCTGAGCCT TGTGGACGTC ATGCAGCGGG AGGGAGGCCC 5301 CAGCCAAATC GGGGATGCCT TGGGCTTTGC TGTGCGATAC TTGACTTCAG 5351 AAATGCATGG TGCCAGGCCG GGAGCCTCAA AGGCGGTGGT CATCCTGGTC 5401 ACGGACGTCT CTGTGGATTC AGTGGATGCA GCAGCTGATG CCGCCAGGTC 5451 CAACAGAGTG ACAGTGTTCC CTATTGGAAT TGGAGATCGC TACGATGCAG 5501 CCCAGCTACG GATCTTGGCA GGCCCAGCAG GCGACTCCAA CGTGGTGAAG 5551 CTCCAGCGAA TCGAAGACCT CCCTACCATG GTCACCTTGG GCAATTCCTT 5601 CCTCCACAAA CTGTGCTCTG GATTTGTTAG GATTTGCATG GATGAGGATG 5651 GGAATGAGAA GAGGCCCGGG GACGTCTGGA CCTTGCCAGA CCAGTGCCAC 5701 ACCGTGACTT GCCAGCCAGA TGGCCAGACC TTGCTGAAGA GTCATCGGGT 5751 CAACTGTGAC CGGGGGCTGA GGCCTTCGTG CCCTAACAGC CAGTCCCCTG 5801 TTAAAGTGGA AGAGACCTGT GGCTGCCGCT GGACCTGCCC CTGYGTGTGC 5851 ACAGGCAGCT CCACTCGGCA CATCGTGACC TTTGATGGGC AGAATTTCAA 5901 GCTGACTGGC AGCTGTTCTT ATGTCCTATT TCAAAACAAG GAGCAGGACC 5951 TGGAGGTGAT TCTCCATAAT GGTGCCTGCA GCCCTGGAGC AAGGCAGGGC 6001 TGCATGAAAT CCATCGAGGT GAAGCACAGT GCCCTCTCCG TCGAGSTGCA 6051 CAGTGACATG GAGGTGACGG TGAATGGGAG ACTGGTCTCT GTTCCTTACG 6101 TGGGTGGGAA CATGGAAGTC AACGTTTATG GTGCCATCAT GCATGAGGTC 6151 AGATTCAATC ACCTTGGTCA CATCTTCACA TTCACTCCAC AAAACAATGA 6201 GTTCCAACTG CAGCTCAGCC CCAAGACTTT TGCTTCAAAG ACGTATGGTC 6251 TGTGTGGGAT CTGTGATGAG AACGGAGCCA ATGACTTCAT GCTGAGGGAT 6301 GGCACAGTCA CCACAGACTG GAAAACACTT GTTCAGGAAT GGACTGTGCA 6351 GCGGCCAGGG CAGACGTGCC AGCCCATCCT GGAGGAGCAG TGTCTTGTCC 6401 CCGACAGCTC CCACTGCCAG GTCCTCCTCT TACCACTGTT TGCTGAATGC 6451 CACAAGGTCC TGGCTCCAGC CACATTCTAT GCCATCTGCC AGCAGGACAG 6501 TTGCCACCAG GAGCAAGTGT GTGAGGTGAT CGCCTCTTAT GCCCACCTCT 6551 GTCGGACCAA CGGGGTCTGC GTTGACTGGA GGACACCTGA TTTCTGTGCT 6601 ATGTCATGCC CACCATCTCT GGTCTACAAC CACTGTGAGC ATGGCTGTCC 6651 CCGGCACTGT GATGGCAACG TGAGCTCCTG TGGGGACCAT CCCTCCGAAG 6701 GCTGTTTCTG CCCTCCAGAT AAAGTCATGT TGGAAGGCAG CTGTGTCCCT 6751 GAAGAGGCCT GCACTCAGTG CATTGGTGAG GATGGAGTCC AGCACCAGTT 6801 CCTGGAAGCC TGGGTCCCGG ACCACCAGCC CTGTCAGATC TGCACATGCC 5251 AAAGCCCATT TGCTGAGCCT TGTGGACGTC ATGCAGCGGG AGGGAGGCCC 5301 CAGCCAAATC GGGGATTGCCT TGGGCTTTGC TGTGCGATAC TTGACTTCAG 5351 AAATGCATGG TGCCAGGCCG GGAGCCTCAA AGGCGGTGGT CATCCTGGTC 5401 ACGGACGTCT CTGTGGATTC AGTGGATGCA GCAGCTGATG CCGCCAGGTC 5451 CAACAGAGTG ACAGTGTTCC CTATTGGAAT TGGAGATCGC TACGATGCAG 5501 CCCAGCTACG GATCTTGGCA GGCCCAGCAG GCGACTCCAA CGTGGTGAAG 5551 CTCCAGCGAA TCGAAGACCT CCCTACCATG GTCACCTTGGGCAATTCCTT 5601 CCTCCACAAA CTGTGCTCTG GATTTGTTAG GATTTGCATG GATGAGGATG 5651 GGAATGAGAA GAGGCCCGGG GACGTCTGGA CCTTGCCAGA CCAGTGCCAC 5701 ACCGTGACTT GCCAGCCAGA TGGCCAGACC TTGCTGAAGA GTCATCGGGT 5751 CAACTGTGAC CGGGGGCTGA GGCCTTCGTG CCCTAACAGC CAGTCCCCTG 5801 TTAAAGTGGAAGAGACTGT GGCTGCCGCT GGACCCTGCCC CTGYGTGTGC 5851 ACAGGCAGCT CCACTCGGCA CATCGTGACC TTTGATGGGC AGAATTTCAA 5901 GCTGACTGGC AGCTGTTTCTT ATGTCCTATTT TCAAAACAAGGAGCAGGACC 5951 TGGAGGTGAT TCTCCATAAT GGTGCCTGCA GCCCTGGAGC AAGGCAGGGC 6001 TGCATGAAAT CCATCGAGGT GAAGCACAGT GCCCTCTCCG TCGAGSTGCA 6051 CAGTGACATG GAGGTGACGG TGAATGGGAG ACTGGTCTCGTTCCTTTACG 6101 TGGGTGGGAA CATGGAAGTC AACGTTTATG GTGCCATCAT GCATGAGGTC 6151 AGATTCAATCACCTTGGTCACATCTTCACA TTCACTCCAC AAAACAATGA 6201 GTTCCAACTG CAGCTCAGCC CCAAGACTTT TGCTTCAAAG ACGTATGGTC 6251 TGTGTGGGAT CTGTGATGAG AACGGAGCCA ATGACTTCAT GCTGAGGGAT 6301 GGCACAGTCA CCACAGACTG GAAAACACTT GTTCAGGAAT GGACTGTGCA 6351 GCGGCCAGGG CAGACGTGCC AGCCCATCCT GGAGGAGCAG TGTCTTGTCC 6401 CCGACAGCTC CCACTGCCAG GTCCTCCTCT TACCACTGTT TGCTGAATGC 6451 CACAAGGTCC TGGCTCCAGC CACATTCTAT GCCATCTGCC AGCAGGACAG 6501 TTGCCACCAG GAGCAAGTGT GTGAGGTGAT CGCCTCTTAT GCCCACCTCT 6551 GTCGGACCAA CGGGGTCTGC GTTGACTGGA GGACACCTGA TTTCTGTGCT 6601 ATGTCATGCC CACCATCTCT GGTCTACAAC CACTGTGAGCATGGCTGTCC 6651 CCGGCACTGT GATGGCAACG TGAGCTCCTG TGGGGACCAT CCCTCCGAAG 6701 GCTGTTTCTG CCCTCCAGAT AAAGTCATGT TGGAAGGCAG CTGTGTCCCT 6751 GAAGAGGCCT GCACTCAGTG CATTGGTGAG GATGGAGTCC AGCACCAGTT 6801 CCTGGAAGCC TGGGTCCCGG ACCACCAGCC CTGTCAGATC TGCACATGCC

- 24 041588- 24 041588

6851 TCAGCGGGCG GAAGGTCAAC TGCACAACGC AGCCCTGCCC CACGGCCAAA 6901 GCTCCCACGT GTGGCCTGTG TGAAGTAGCC CGCCTCCGCC AGAATGCAGA 6951 CCAGTGCTGC CCCGAGTATG AGTGTGTGTG TGACCCAGTG AGCTGTGACC 7001 TGCCCCCAGT GCCTCACTGT GAACGTGGCC TCCAGCCCAC ACTGACCAAC 7051 CCTGGCGAGT GCAGACCCAA CTTCACCTGC GCCTGCAGGA AGGAGGAGTG 7101 CAAAAGAGTG ТССССАСССТ CCTGCCCCCC GCACCGTTTG СССАСССТТС 7151 GGAAGACCCA GTGCTGTGAT GAGTATGAGT GTGCCTGCAA CTGTGTCAAC 7201 TCCACAGTGA GCTGTCCCCT TGGGTACTTG GCCTCAACCG CCACCAATGA 7251 CTGTGGCTGT АССАСААССА CCTGCCTTCC CGACAAGGTG TGTGTCCACC 7301 GAAGCACCAT CTACCCTGTG GGCCAGTTCT GGGAGGAGGG CTGCGATGTG 7351 TGCACCTGCA CCGACATGGA GGATGCCGTG ATGGGCCTCC GCGTGGCCCA 7401 GTGCTCCCAG AAGCCCTGTG AGGACAGCTG TCGGTCGGGC TTCACTTACG 7451 TTCTGCATGA AGGCGAGTGC TGTGGAAGGT GCCTGCCATC TGCCTGTGAG 7501 GTGGTGACTG GCTCACCGCG GGGGGACTCC CAGTCTTCCT GGAAGAGTGT 7551 CGGCTCCCAG TGGGCCTCCC CGGAGAACCC CTGCCTCATC AATGAGTGTG 7601 TCCGAGTGAA GGAGGAGGTC ТТТАТАСААС AAAGGAACGT CTCCTGCCCC 7651 CAGCTGGAGG TCCCTGTCTG CCCCTCGGGC TTTCAGCTGA GCTGTAAGAC 7701 CTCAGCGTGC TGCCCAAGCT GTCGCTGTGA GCGCATGGAG GCCTGCATGC 7751 TCAATGGCAC TGTCATTGGG CCCGGGAAGA CTGTGATGAT CGATGTGTGC 7801 ACGACCTGCC GCTGCATGGT GCAGGTGGGG GTCATCTCTG GATTCAAGCT 7851 GGAGTGCAGG AAGACCACCT GCAACCCCTG CCCCCTGGGT TACAAGGAAG 7901 ААААТААСАС AGGTGAATGT TGTGGGAGAT GTTTGCCTAC GGCTTGCACC 7951 ATTCAGCTAA GAGGAGGACA GATCATGACA CTGAAGCGTG ATGAGACGCT 8001 CCAGGATGGC TGTGATACTC ACTTCTGCAA GGTCAATGAG AGAGGAGAGT 8051 ACTTCTGGGA GAAGAGGGTC ACAGGCTGCC CACCCTTTGA TGAACACAAG 8101 TGTCTTGCTG AGGGAGGTAA AATTATGAAA ATTCCAGGCA CCTGCTGTGA 8151 CACATGTGAG GAGCCTGAGT GCAACGACAT CACTGCCAGG CTGCAGTATG 8201 TCAAGGTGGG AAGCTGTAAG TCTGAAGTAG AGGTGGATAT CCACTACTGC 8251 CAGGGCAAAT GTGCCAGCAA AGCCATGTAC TCCATTGACA TCAACGATGT 8301 GCAGGACCAG TGCTCCTGCT GCTCTCCGAC ACGGACGGAG CCCATGCAGG 8351 TGGCCCTGCA CTGCACCAAT GGCTCTGTTG TGTACCATGA GGTTCTCAAT 8401 GCCATGGAGT GCAAATGCTC CCCCAGGAAG TGCAGCAAGT GA 6851 TCAGCGGGCG GAAGGTCAAC TGCACAACGC AGCCCTGCCC CACGGCCAAA 6901 GCTCCCCACGT GTGGCCTGTG TGAAGTAGCC CGCCTCCGCC AGAATGCAGA 6951 CCAGTGCTGC CCCGAGTATG AGTGTGTGTG TGACCCAGTG AGCTGTGACC 7001 TGCCCCCAGT GCCTCACTGT GAACGTGGCC TCCAGCCCAC ACTGACCACAC 7051 CCTGGCGAGT GCAGACCCAA CTTCACCTGC GCCTGCAGGA AGGAGGAGTG 7101 CAAAAGAGTG TSSSCCCCST CCTGCCCCCC GCACCGTTTG SSCASSSTTS 7151 GGAAGACCCA GTGCTGTGAT GAGTATGAGT GTGCCTGCAA CTGTGTCAAAC 7201 TCCACAGTGA GCTGTCCCCT TGGGTACTTG GCCTCAACCG CCACCAATGA 7251 CTGTGGCTGT ACCACAACCA CCTGCCTTCC CGACAAGGTG TGTGTCCACC 7301 GAAGCACCAT CTACCCTGTG GGCCAGTTCT GGGAGGAGGG CTGCGATGTG 7351 TGCACCTGCA CCGACATGGA GGATGCCGTG ATGGGCCTCC GCGTGGCCCA 7401 GTGCTCCCAG AAGCCCTGTG AGGACAGCTG TCGGTCGGGC TTCACTTACG 7451 TTTCTGCATGA AGGCGAGTGC TGTGGAAGGT GCCTGCCATC TGCCTGTGAG 7501 GTGGTGACTG GCTCACCGCG GGGGGACTCC CAGTCTTTCCT GGAAGAGTGT 7551 CGGCTCCCAG TGGGCCTCCC CGGAGAACCC CTGCCTCATC AATGAGTGTG 7601 TCCGAGTGAA GGAGGAGGTC TTTATASAAS AAAGGAACGT CTCCTGCCCC 7651 CAGCTGGAGG TCCCTGTCTG CCCCTCGGGC TTTCAGCTGA GCTGTAAGAC 7701 CTCAGCGTGC TGCCCAAGCT GTCGCTGTGA GCGCATGGAG GCCTGCATGC 7751 TCAATGGCAC TGTCATTGGG CCCGGGAAGA CTGTGATGAT CGATGTGTGC 7801 ACGACCTGCC GCTGCATGGT GCAGGTGGGG GTCATCTCTG GATTCAAGCT 7851 GGAGTGCAGG AAGACCACCT GCAACCCCTG CCCCCTGGGT TACAAGGAAG 7901 AAAATAACAC AGGTGAATGT TGTGGGAGAT GTTTGCCTAC GGCTTGCACC 7951 ATTCAGCTAA GAGGAGGACA GATCATGACA CTGAAGCGTG ATGAGACGCT 8001 CCAGGATGGC TGTGATACTC ACTTCTGCAA GGTCAATGAG AGAGGAGAGT 8051 ACTTCTGGGA GAAGAGGGTC ACAGGCTGCC CACCCTTTGA TGAACACAAG 8101 TGTCTTGCTG AGGGAGGTAA AATTATGAAA ATTCCAGGCA CCTGCTGTGA 8151 CACATGTGAG GAGCCTGAGT GCAACGACAT CACTGCCAGG CTGCAGTATG 8201 TCAAGGTGGG AAGCTGTAAG TCTGAAGTAG AGGTGGATAT CCACTACTGC 8251 CAGGGCAAAT GTGCCAGCAA AGCCATGTAC TCCATTGACA TCAACGATGT 8301 GCAGGACCAG TGCTCCTGCT GCTCTCCGAC ACGGACGGAG CCCATGCAGG 8351 TGGCCCTGCA CTGCACCAAT GGCTCTGTTG TGTACCATGA GGTTCTCAAT 8401 GCCATGGAGT GCAAATGCTC CCCCAGGAAG TGCAGCAAGT GA

Белок VWF, в используемом в данном документе значении, может содержать домен D' и домен D3 VWF, причем белок VWF связывается с FVIII и ингибирует связывание эндогенного VWF (полноразмерного VWF) с FVIII. Белок VWF, содержащий домен D' и домен D3, может дополнительно содержать домен VWF, выбранный из домена А1, домена А2, домена A3, домена D1, домена D2, домена D4, домена В1, домена В2, домена В3, домена С1, домена С2, домена CK, одного или более их фрагментов, или любую их комбинацию. В одном варианте реализации изобретения белок VWF содержит, состоит, по существу, из, или состоит из: (1) доменов D' и D3 VWF или их фрагментов; (2) доменов D1, D' и D3 VWF или их фрагментов; (3) доменов D2, D' и D3 VWF или их фрагментов; (4) доменов D1, D2, D' и D3 VWF или их фрагментов; или (5) доменов D1, D2, D', D3 или А1 VWF или их фрагментов. Белок VWF, описанный в данном документе, не содержит сайта связывания рецептора клиренса VWF. Белок VWF по настоящему изобретению может содержать любые другие последовательности, связанные с или слитые с белком VWF. Например, белок VWF, описанный в данном документе, может дополнительно содержать сигнальный пептид.A VWF protein, as used herein, may comprise a D' domain and a VWF D3 domain, wherein the VWF protein binds to FVIII and inhibits binding of endogenous VWF (full length VWF) to FVIII. The VWF protein comprising a D' domain and a D3 domain may further comprise a VWF domain selected from an A1 domain, an A2 domain, an A3 domain, a D1 domain, a D2 domain, a D4 domain, a B1 domain, a B2 domain, a B3 domain, a C1 domain, a C2, CK domain, one or more fragments thereof, or any combination thereof. In one embodiment, the VWF protein comprises, consists essentially of, or consists of: (1) VWF D' and D3 domains or fragments thereof; (2) VWF D1, D' and D3 domains or fragments thereof; (3) VWF D2, D' and D3 domains or fragments thereof; (4) VWF D1, D2, D' and D3 domains or fragments thereof; or (5) VWF D1, D2, D', D3 or A1 domains or fragments thereof. The VWF protein described herein does not contain a VWF clearance receptor binding site. The VWF protein of the present invention may contain any other sequence associated with or fused to the VWF protein. For example, the VWF protein described herein may further comprise a signal peptide.

В одном варианте реализации изобретения белок VWF связывается с или ассоциирован с белком FVIII. Благодаря связыванию с или ассоциации с белком FVIII, белок VWF по изобретению может защищать FVIII от расщепления протеазами и активации FVIII, стабилизирует тяжелую цепь и легкуюIn one embodiment, the VWF protein binds to or is associated with the FVIII protein. Through binding to or association with the FVIII protein, the VWF protein of the invention can protect FVIII from protease cleavage and FVIII activation, stabilize the heavy chain and light chain.

- 25 041588 цепь FVIII и предотвращает клиренс FVIII фагоцитарными рецепторами. В другом варианте реализации изобретения белок VWF связывается с или ассоциирует с белком FVIII и блокирует или предотвращает связывание белка FVIII с фосфолипидом и активированным белком С. В результате предотвращения или ингибирования связывания белка FVIII с эндогенным полноразмерным VWF, белок VWF по изобретению уменьшает клиренс FVIII рецепторами клиренса эндогенного VWF и, таким образом, увеличивает период полувыведения белка FVIII. Увеличение периода полувыведения белка FVIII, таким образом, вызвано ассоциацией белка FVIII с белком VWF с отсутствующим сайтом связывания рецептора клиренса VWF и, тем самым, экранирования и/или защиты белка FVIII от эндогенного VWF, который содержит сайт связывания рецептора клиренса VWF. Белок FVIII, связанный с или защищенный белком VWF, может также обеспечить возможность рециркуляции белка FVIII. Благодаря устранению сайтов связывания рецепторов пути клиренса VWF в полноразмерной молекуле VWF, гетеродимеры FVIII/VWF по изобретению защищены от пути клиренса VWF, что дополнительно увеличиает период полувыведения FVIII.- 25 041588 FVIII chain and prevents clearance of FVIII by phagocytic receptors. In another embodiment, the VWF protein binds to or associates with the FVIII protein and blocks or prevents the binding of the FVIII protein to the phospholipid and activated protein C. By preventing or inhibiting the binding of the FVIII protein to endogenous full-length VWF, the VWF protein of the invention reduces the clearance of FVIII by clearance receptors. endogenous VWF and thus increases the half-life of the FVIII protein. The increase in the half-life of the FVIII protein is thus caused by the association of the FVIII protein with the VWF protein with the missing VWF clearance receptor binding site and thereby shielding and/or protecting the FVIII protein from endogenous VWF which contains the VWF clearance receptor binding site. The FVIII protein associated with or protected by the VWF protein may also allow the FVIII protein to be recycled. By eliminating the receptor binding sites of the VWF clearance pathway in the full-length VWF molecule, the FVIII/VWF heterodimers of the invention are protected from the VWF clearance pathway, further increasing the half-life of FVIII.

В одном варианте реализации изобретения белок VWF по настоящему изобретению содержит домен D' и домен D3 VWF, причем домен D' является по меньшей мере на около 60, 70, 80, 85, 90, 95, 96, 97, 98, 99 или 100% идентичным аминокислотам 764-866 SEQ ID NO: 2, и белок VWF предотвращает связывание эндогенного VWF с FVIII. В другом варианте реализации изобретения белок VWF содержит домен D' и домен D3 VWF, причем домен D3 является по меньшей мере на 60, 70, 80, 85, 90, 95, 96, 97, 98, 99 или 100% идентичным аминокислотам 867-1240 SEQ ID NO: 2, и белок VWF предотвращает связывание эндогенного VWF с FVIII. В некоторых вариантах реализации изобретения белок VWF, описанный в данном документе, содержит, состоит по существу из, или состоит из домена D' и домена D3 VWF, которые являются по меньшей мере на 60, 70, 80, 85, 90, 95, 96, 97, 98, 99 или 100% идентичными аминокислотам 764-1240 SEQ ID NO: 2, и белок VWF предотвращает связывание эндогенного VWF с FVIII. В других вариантах реализации изобретения белок VWF содержит, состоит, по существу, из, или состоит из доменов D1, D2, D' и D3, по меньшей мере на 60, 70, 80, 85, 90, 95, 96, 97, 98, 99 или 100% идентичных аминокислотам 23-1240 SEQ ID NO: 2, и белок VWF предотвращает связывание эндогенного VWF с FVIII. В еще одних вариантах реализации изобретения белок VWF дополнительно содержит функционально связанный с ним сигнальный пептид. В некоторых вариантах реализации изобретения белок VWF по изобретению состоит, по существу, из или состоит из (1) домена D'D3, домена D1D'D3, домена D2D'D3 или домена D1D2D'D3, и (2) дополнительной последовательности VWF, содержащей до около 10 аминокислот (например, любых последовательностей от аминокислоты 764-1240 SEQ ID NO: 2 до аминокислоты 764-1250 SEQ ID NO: 2), до около 15 аминокислот (например, любых последовательностей от аминокислоты 764-1240 SEQ ID NO: 2 до аминокислоты 764-1255 SEQ ID NO: 2), до около 20 аминокислот (например, любых последовательностей от аминокислоты 764-1240 SEQ ID NO: 2 до аминокислоты 764-1260 SEQ ID NO: 2), до около 25 аминокислот (например, любых последовательностей от аминокислоты 764-1240 SEQ ID NO: 2 до аминокислоты 764-1265 SEQ ID NO: 2), или до около 30 аминокислот (например, любых последовательностей от аминокислоты 764-1240 SEQ ID NO: 2 до аминокислоты 764-1260 SEQ ID NO: 2). В конкретном варианте реализации изобретения белок VWF, содержащий или состоящий по существу из домена D' и домена D3, не является аминокислотами 764-1274 SEQ ID NO: 2 или полноразмерным зрелым VWF. В некоторых вариантах реализации изобретения домен D1D2 экспрессируется в транс-конфигурации с доменом D'D3. В некоторых вариантах реализации изобретения домен D1D2 экспрессируется в цис-конфигурации с доменом D'D3.In one embodiment, the VWF protein of the present invention comprises a D' domain and a VWF D3 domain, wherein the D' domain is at least about 60, 70, 80, 85, 90, 95, 96, 97, 98, 99, or 100 % identical to amino acids 764-866 of SEQ ID NO: 2, and the VWF protein prevents endogenous VWF from binding to FVIII. In another embodiment, the VWF protein comprises a D' domain and a VWF D3 domain, wherein the D3 domain is at least 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, or 100% identical to amino acids 867- 1240 SEQ ID NO: 2, and the VWF protein prevents endogenous VWF from binding to FVIII. In some embodiments, a VWF protein described herein comprises, consists essentially of, or consists of a D' domain and a VWF D3 domain that are at least 60, 70, 80, 85, 90, 95, 96 , 97, 98, 99, or 100% identical to amino acids 764-1240 of SEQ ID NO: 2, and the VWF protein prevents endogenous VWF from binding to FVIII. In other embodiments, the VWF protein contains, consists essentially of, or consists of at least 60, 70, 80, 85, 90, 95, 96, 97, 98 D1, D2, D', and D3 domains. , 99 or 100% identical to amino acids 23-1240 of SEQ ID NO: 2, and the VWF protein prevents endogenous VWF from binding to FVIII. In still other embodiments, the VWF protein further comprises an operably linked signal peptide. In some embodiments, a VWF protein of the invention consists essentially of or consists of (1) a D'D3 domain, a D1D'D3 domain, a D2D'D3 domain, or a D1D2D'D3 domain, and (2) an additional VWF sequence comprising up to about 10 amino acids (for example, any sequence from amino acid 764-1240 of SEQ ID NO: 2 to amino acid 764-1250 of SEQ ID NO: 2), up to about 15 amino acids (for example, any sequence from amino acid 764-1240 of SEQ ID NO: 2 up to amino acid 764-1255 of SEQ ID NO: 2), up to about 20 amino acids (for example, any sequence from amino acid 764-1240 of SEQ ID NO: 2 to amino acid 764-1260 of SEQ ID NO: 2), up to about 25 amino acids (for example, any sequence from amino acid 764-1240 of SEQ ID NO: 2 to amino acid 764-1265 of SEQ ID NO: 2), or up to about 30 amino acids (e.g., any sequence from amino acid 764-1240 of SEQ ID NO: 2 to amino acid 764-1260 of SEQ ID NO: 2). In a particular embodiment, a VWF protein containing or consisting essentially of a D' domain and a D3 domain is not amino acids 764-1274 of SEQ ID NO: 2 or a full-length mature VWF. In some embodiments, the D1D2 domain is expressed in a trans configuration with the D'D3 domain. In some embodiments, the D1D2 domain is expressed in a cis configuration with the D'D3 domain.

В других вариантах реализации изобретения белок VWF, содержащий домены D'D3, связанные с доменами D1D2, дополнительно содержит внутриклеточный сайт процессинга, например, (сайт процессинга РАСЕ (фурина) или РС5), что обеспечивает возможность отщепления доменов D1D2 от доменов D'D3 после экспрессии. Неограничивающие примеры внутриклеточных сайтов процессинга раскрыты в других разделах данного документа.In other embodiments, the VWF protein containing D'D3 domains associated with D1D2 domains further comprises an intracellular processing site, e.g. expression. Non-limiting examples of intracellular processing sites are disclosed elsewhere in this document.

В других вариантах реализации изобретения белок VWF содержит домен D' и домен D3, но не содержит аминокислотной последовательности, выбранной из (1) аминокислот 1241-2813 SEQ ID NO: 2, (2) от аминокислоты 1270 до аминокислоты 2813 SEQ ID NO: 2, (3) от аминокислоты 1271 до аминокислоты 2813 SEQ ID NO: 2, (4) от аминокислоты 1272 до аминокислоты 2813 SEQ ID NO: 2, (5) от аминокислоты 1273 до аминокислоты 2813 SEQ ID NO: 2, (6) от аминокислоты 1274 до аминокислоты 2813 SEQ ID NO: 2, или любую их комбинацию.In other embodiments, the VWF protein contains a D' domain and a D3 domain, but does not contain an amino acid sequence selected from (1) amino acids 1241-2813 of SEQ ID NO: 2, (2) amino acids 1270 to amino acids 2813 of SEQ ID NO: 2 , (3) from amino acid 1271 to amino acid 2813 of SEQ ID NO: 2, (4) from amino acid 1272 to amino acid 2813 of SEQ ID NO: 2, (5) from amino acid 1273 to amino acid 2813 of SEQ ID NO: 2, (6) from amino acids 1274 to amino acids 2813 of SEQ ID NO: 2, or any combination thereof.

В еще одних вариантах реализации изобретения белок VWF по настоящему изобретению содержит, состоит, по существу, из, или состоит из аминокислотной последовательности, соответствующей домену D', домену D3 и домену А1, причем аминокислотная последовательность является по меньшей мере на 60, 70, 75, 80, 85, 90, 95, 96, 97, 98, 99 или 100% идентичной аминокислотам 764-1479 SEQ ID NO: 2, и белок VWF предотвращает связывание эндогенного VWF с FVIII. В конкретном варианте реализации изобретения белок VWF не является аминокислотами 764-1274 SEQ ID NO: 2.In still other embodiments, the VWF protein of the present invention comprises, consists essentially of, or consists of an amino acid sequence corresponding to a D' domain, a D3 domain, and an A1 domain, wherein the amino acid sequence is at least 60, 70, 75 , 80, 85, 90, 95, 96, 97, 98, 99, or 100% identical to amino acids 764-1479 of SEQ ID NO: 2, and the VWF protein prevents endogenous VWF from binding to FVIII. In a specific embodiment, the VWF protein is not amino acids 764-1274 of SEQ ID NO: 2.

В некоторых вариантах реализации изобретения белок VWF по изобретению содержит домен D' и домен D3, но не содержит по меньшей мере одного домена VWF, выбранного из (1) домена А1, (2) домена А2, (3) домена A3, (4) домена D4, (5) домена В1, (6) домена В2, (7) домена В3, (8) домена С1, (9) домена С2, (10) домена CK, (11) домена CK и домена С2, (12) домена CK, домена С2 и домена С1, (13) доIn some embodiments, the VWF protein of the invention contains a D' domain and a D3 domain, but does not contain at least one VWF domain selected from (1) an A1 domain, (2) an A2 domain, (3) an A3 domain, (4) D4 domain, (5) B1 domain, (6) B2 domain, (7) B3 domain, (8) C1 domain, (9) C2 domain, (10) CK domain, (11) CK domain and C2 domain, (12 ) CK domain, C2 domain and C1 domain, (13) to

- 26 041588 мена CK, домена С2, домена С1, домена В3, (14) домена CK, домена С2, домена С1, домена В3, домена В2, (15) домена CK, домена С2, домена С1, домена В3, домена В2 и домена В1, (16) домена CK, домена С2, домена С1, домена В3, домена В2, домена В1 и домена D4, (17) домена CK, домена С2, домена С1, домена В3, домена В2, домена В1, домена D4 и домена A3, (18) домена CK, домена С2, домена С1, домена В3, домена В2, домена В1, домена D4, домена A3 и домена А2, (19) домена CK, домена С2, домена С1, домена В3, домена В2, домена В1, домена D4, домена A3, домена А2 и домена А1, или (20) любую их комбинацию.- 26 041588 CK domain, C2 domain, C1 domain, B3 domain, (14) CK domain, C2 domain, C1 domain, B3 domain, B2 domain, (15) CK domain, C2 domain, C1 domain, B3 domain, B2 domain and B1 domain, (16) CK domain, C2 domain, C1 domain, B3 domain, B2 domain, B1 domain and D4 domain, (17) CK domain, C2 domain, C1 domain, B3 domain, B2 domain, B1 domain, domain D4 and A3 domain, (18) CK domain, C2 domain, C1 domain, B3 domain, B2 domain, B1 domain, D4 domain, A3 domain and A2 domain, (19) CK domain, C2 domain, C1 domain, B3 domain, B2 domain, B1 domain, D4 domain, A3 domain, A2 domain and A1 domain, or (20) any combination thereof.

В других вариантах реализации изобретения белок VWF содержит домены D'D3 и один или более доменов или модулей. Примеры таких доменов или модулей включают, без ограничений, домены и модули, раскрытые в Zhour et al., Blood, интернет-публикация 6 апреля 2012 г: DOI 10.1182/blood-2012-01405134. Например, белок VWF, может содержать домен D'D3 и один или более доменов или модулей, выбранных из домена А1, домена А2, домена A3, модуля D4N, модуля VWD4, модуля С8-4, модуля TIL4, модуля С1, модуля С2, модуля С3, модуля С4, модуля С5, модуля С5, модуля С6 или любую их комбинацию.In other embodiments, the VWF protein contains D'D3 domains and one or more domains or modules. Examples of such domains or modules include, without limitation, the domains and modules disclosed in Zhour et al., Blood, April 6, 2012 Web Publication: DOI 10.1182/blood-2012-01405134. For example, a VWF protein may comprise a D'D3 domain and one or more domains or modules selected from A1 domain, A2 domain, A3 domain, D4N module, VWD4 module, C8-4 module, TIL4 module, C1 module, C2 module, C3 module, C4 module, C5 module, C5 module, C6 module, or any combination thereof.

В определенных вариантах реализации изобретения белок VWF по изобретению образует мультимер, например димер, тример, тетрамер, пентамер, гексамер, гептамер или мультимеры более высокого порядка. В других вариантах реализации изобретения белок VWF представляет собой мономер, содержащий только один белок VWF. В некоторых вариантах реализации изобретения белок VWF по настоящему изобретению может иметь одно или более аминокислотных замещений, делеций, добавлений или модификаций. В одном варианте реализации изобретения белок VWF может включать аминокислотные замещения, делеций, добавления или модификации, так чтобы белок VWF был неспособен образовывать дисульфидную связь или образовывать димер или мультимер. В другом варианте реализации изобретения аминокислотное замещение находится внутри домена D' и домена D3. В конкретном варианте реализации изобретения белок VWF по изобретению содержит по меньшей мере одно аминокислотное замещение в остатке, соответствующем остатку 1099, остатку 1142, или обоим остаткам 1099 и 1142 SEQ ID NO: 2. По меньшей мере одно аминокислотное замещение может быть любыми аминокислотами, которые не встречаются в природных условиях в VWF дикого типа. Например, аминокислотное замещение может быть любыми аминокислотами, отличными от цистеина, например изолейцином, аланином, лейцином, аспарагином, лизином, аспарагиновой кислотой, метионином, фенилаланином, глутаминовой кислотой, треонином, глутамином, триптофаном, глицином, валином, пролином, серином, тирозином, аргинином или гистидином. В другом примере, аминокислотное замещение содержит одну или более аминокислот, препятствующих или ингибирующих образование мультимеров белками VWF.In certain embodiments, the VWF protein of the invention forms a multimer, such as a dimer, trimer, tetramer, pentamer, hexamer, heptamer, or higher order multimers. In other embodiments, the VWF protein is a monomer containing only one VWF protein. In some embodiments, the VWF protein of the present invention may have one or more amino acid substitutions, deletions, additions, or modifications. In one embodiment, the VWF protein may include amino acid substitutions, deletions, additions, or modifications such that the VWF protein is unable to form a disulfide bond or form a dimer or multimer. In another embodiment, the amino acid substitution is within the D' domain and the D3 domain. In a specific embodiment, the VWF protein of the invention contains at least one amino acid substitution at residue corresponding to residue 1099, residue 1142, or both residues 1099 and 1142 of SEQ ID NO: 2. The at least one amino acid substitution can be any amino acids that do not occur naturally in wild-type VWFs. For example, the amino acid substitution may be any amino acid other than cysteine, such as isoleucine, alanine, leucine, asparagine, lysine, aspartic acid, methionine, phenylalanine, glutamic acid, threonine, glutamine, tryptophan, glycine, valine, proline, serine, tyrosine, arginine or histidine. In another example, the amino acid substitution contains one or more amino acids that prevent or inhibit the formation of multimers by VWF proteins.

В некоторых вариантах реализации изобретения белок VWF содержит аминокислотное замещение цистеина на аланин в положении остатка 336, соответствующего домену D'D3 VWF (остаток 1099 SEQ ID NO: 2) и аминокислотное замещение цистеина на аланин в положении остатка 379, соответствующего домену D'D3 VWF (остаток 1142 SEQ ID NO: 2), или оба.In some embodiments, the VWF protein comprises a cysteine to alanine amino acid substitution at residue position 336 corresponding to the VWF D'D3 domain (residue 1099 of SEQ ID NO: 2) and a cysteine to alanine amino acid substitution at residue position 379 corresponding to the VWF D'D3 domain. (residue 1142 of SEQ ID NO: 2), or both.

В определенных вариантах реализации изобретения белок VWF, пригодный для использования по данному документу, может быть дополнительно модифицирован с целью улучшения его взаимодействия с FVIII, например для улучшения аффинности связывания с FVIII. В качестве неограничивающего примера, белок VWF содержит остаток серина в положении остатка, соответствующего аминокислоте 764 SEQ ID NO: 2 и остаток лизина в положении остатка, соответствующего аминокислоте 773 SEQ ID NO: 2. Остатки 764 и/или 773 могут вносить свой вклад в аффинность связывания белков VWF с FVIII. В других вариантах реализации изобретения белок VWF, пригодный для использования по изобретению, может иметь другие модификации, например белок может быть пегилированным, гликозилированным, гэкилированным или полисиалилированным.In certain embodiments of the invention, the VWF protein suitable for use herein can be further modified to improve its interaction with FVIII, for example, to improve the binding affinity for FVIII. As a non-limiting example, the VWF protein contains a serine residue at residue position corresponding to amino acid 764 of SEQ ID NO: 2 and a lysine residue at residue position corresponding to amino acid 773 of SEQ ID NO: 2. Residues 764 and/or 773 may contribute to affinity binding of VWF proteins to FVIII. In other embodiments of the invention, the VWF protein suitable for use according to the invention may have other modifications, for example, the protein may be pegylated, glycosylated, gekylated, or polysialylated.

П.С.3. Гетерологичный фрагмент.P.S.3. heterologous fragment.

Гетерологичный фрагмент, который может быть связан с белком VWF с помощью линкера VWF или с белком FVIII с помощью линкера FVIII, может быть гетерологичным полипептидом или гетерологичным неполипептидным фрагментом. В определенных вариантах реализации изобретения гетерологичный фрагмент представляет собой молекулу, увеличивающую период полувыведения, которая известна в данной области техники и содержит полипептид, неполипептидный фрагмент, или комбинацию их обоих. Гетерологичный полипептидный фрагмент может содержать белок FVIII, константную область иммуноглобулина или ее участок, альбумин или его фрагмент, альбуминсвязывающий фрагмент, трансферрин или его фрагмент, последовательность PAS, последовательность НАР, их производное или вариант, С-концевой пептид (СТР) β-субъединицы хорионического гонадотропина человека, или любую их комбинацию. В некоторых вариантах реализации изобретения неполипептидный связывающий фрагмент содержит полиэтиленгликоль (ПЭГ), полисиаловую кислоту, гидроксиэтилкрахмал (ГЭК), их производное, или любую их комбинацию. В определенных вариантах реализации изобретения могут присутствовать один, два, три или больше гетерологичных фрагментов, которые могут быть все одинаковыми или разными молекулами.The heterologous fragment that can be linked to the VWF protein via a VWF linker or to the FVIII protein via an FVIII linker can be a heterologous polypeptide or a heterologous non-polypeptide fragment. In certain embodiments of the invention, the heterologous fragment is a molecule that increases the half-life, which is known in the art and contains a polypeptide, a non-polypeptide fragment, or a combination of both. A heterologous polypeptide fragment may contain a FVIII protein, an immunoglobulin constant region or a portion thereof, albumin or a fragment thereof, an albumin-binding fragment, transferrin or a fragment thereof, a PAS sequence, a HAP sequence, a derivative or variant thereof, a C-terminal peptide (CTP) of the β-subunit of the chorionic human gonadotropin, or any combination thereof. In some embodiments, the non-polypeptide binding moiety comprises polyethylene glycol (PEG), polysialic acid, hydroxyethyl starch (HES), a derivative thereof, or any combination thereof. In certain embodiments of the invention, one, two, three, or more heterologous moieties may be present, which may all be the same or different molecules.

П.С.3.а Константная область иммуноглобулина или ее часть.P.S.3.a Immunoglobulin constant region or part of it.

Константная область иммуноглобулина состоит из доменов, обозначенных как домены СН (Con- 27 041588 stant Heavy - константные тяжелые) (CH1, CH2 и т.д.). В зависимости от изотипа, (т.е. IgG, IgM, IgA IgD или IgE), константная область может состоять из трех или четырех доменов СН. Константные области некоторых изотипов (например, IgG) также содержат шарнирную область. См. Janeway et al. 2001, Immunobiology, Garland Publishing, N.Y., N.Y.The constant region of an immunoglobulin consists of domains designated as CH domains (Constant Heavy) (CH1, CH2, etc.). Depending on the isotype, (ie, IgG, IgM, IgA, IgD, or IgE), the constant region may consist of three or four CH domains. The constant regions of some isotypes (eg, IgG) also contain a hinge region. See Janeway et al. 2001, Immunobiology, Garland Publishing, N.Y., N.Y.

Константная область иммуноглобулина или ее участок для получения химерного белка по настоящему изобретению могут быть получены из ряда разных источников. В некоторых вариантах реализации изобретения константную область иммуноглобулина или ее участок выделяют из человеческого иммуноглобулина. Следует понимать, однако, что константная область иммуноглобулина или ее часть может быть выделены из иммуноглобулина другого вида млекопитающих, включая, например, грызуна (например, мышь, крысу, кролика, морскую свинку) или вида не являющегося человеком примата (например, шимпанзе, макак). Кроме того, константная область иммуноглобулина или ее часть могут быть выделены из иммуноглобулина любого класса, включая IgM, IgG, IgD, IgA и IgE, и любого изотипа иммуноглобулина, включая IgG1, IgG2, IgG3 и IgG4. В одном варианте реализации изобретения используется человеческий изотип IgG1. Различные генные последовательности константной области иммуноглобулина (например, генные последовательности человеческой константной области) являются доступными в форме публично доступных депозитариев. Могут быть выбраны последовательности доменов константной области, имеющие конкретную эффекторную функцию (или с отсутствующей конкретной эффекторной функцией), или с конкретной модификацией для снижения иммуногенности. Было опубликовано большое количество последовательностей антител и антитело-кодирующих генов, и пригодные последовательности константной области Ig (например, последовательности шарнира, СН2 и/или СН3, или их частей) могут быть выделены из таких последовательностей с использованием общепризнанных в данной области техники методов. Генетический материал, полученный с использованием любых из вышеописанных способов, может быть затем изменен или синтезирован для получения полипептидов по настоящему изобретению. Дополнительно следует понимать, что объем данного изобретения охватывает аллели, варианты и мутации последовательностей ДНК константной области. Последовательности константной области иммуноглобулина или ее части могут быть клонированы, например, с использованием полимеразной цепной реакции (ПЦР) и праймеров, выбранных для амплификации домена, представляющего интерес. Для клонирования последовательности константной области иммуноглобулина или ее части из антитела, мРНК может быть выделена из гибридомы, селезенки или лимфатических клеток, подвергнута обратной транскрипции в ДНК, и гены антитела могут быть амплифицированы методом ПНР. Способы амплификации с использованием ПЦР описаны подробно в патентах США № 4683195; 4683202; 4800159; 4965188; и, например, в PCR Protocols: A Guide to Methods and Applications Innis et al. eds., Academic Press, San Diego, CA (1990); Ho et al. 1989. Gene 77:51; Horton et al. 1993. Methods Enzymol. 217:270). Константная область иммуноглобулина, используемая в данном документе, может включать все домены и шарнирную область или их части. В одном варианте реализации изобретения константная область иммуноглобулина или ее часть содержит домен СН2, домен СН3 и шарнирную область, т.е. Fcобласть или партнер связывания FcRn. В используемом в данном документе значении термин Fcобласть определен как часть полипептида, соответствующая Fc-области нативного иммуноглобулина, т.е. образующаяся в результате димерной ассоциации соответствующих Fc-доменов ее двух тяжелых цепей. Нативная Fc-область образует гомодимер с другой Fc- областью. В одном варианте реализации изобретения Fc-область относится к части одной тяжелой цепи иммуноглобулина, начинающейся в шарнирной области сразу за сайтом расщепления папаином против хода транскрипции (т.е. остатком 216 в IgG, считая 114 первым остатком константной области тяжелой цепи), и заканчивающейся на С-конце антитела. Соответственно, полный домен Fc содержит, по меньшей мере, шарнирный домен, домен СН2 и домен СН3. Fc-область константной области иммуноглобулина, в зависимости от изотипа иммуноглобулина, может включать домены СН2, СН3 и СН4, а также шарнирную область. Химерные белки, содержащие Fc-область иммуноглобулина, обладают несколькими желательными для химерных белков свойствами, включая повышенную стабильность, увеличенный период полувыведения из сыворотки (см. Capon et al., 1989, Nature 337:525), а также связывание с Fc-рецепторами, такими как неонатальный Fcрецептор (FcRn) (патенты США № 6086875, 6485726, 6030613; WO 03/077834; US2003-0235536A1), которые включены в данный документ в качестве ссылок в полном объеме. Константная область иммуноглобулина или ее часть может быть партнером связывания FcRn. FcRn является активным в эпителиальных тканях взрослых и экспрессируется в полости кишечника, дыхательных путях легких, на носовых поверхностях, влагалищных поверхностях, поверхностях ободочной и прямой кишки (патент США № 6485726). Партнер связывания FcRn представляет собой часть иммуноглобулина, которая связывается с FcRn. Рецептор FcRn был выделен у нескольких видов млекопитающих, включая человека. Последовательности FcRn человека, FcRn обезьяны, FcRn крысы и FcRn мыщи являются известными (Story et al. 1994, J. Exp. Med. 180:2377). Рецептор FcRn связывает IgG (но не другие классы иммуноглобулина, такие как IgA, IgM, IgD и IgE) при относительно низких рН, активно транспортирует IgG трансцеллюлярно в направлении от полости к сыворотке и затем высвобождает IgG при относительно более высоком рН, наблюдающемся во внутритканевых жидкостях. Он экспрессируется в эпителиальной ткани взрослых особей (патенты США № 6485726, 6030613, 6086875; WO 03/077834; US2003-0235536A1), включая эпи- 28 041588 телий легкого и кишечника (Israel et al. 1997, Immunology 92:69), эпителий проксимальных почечных канальцев (Kobayashi et al. 2002, Am. J. Physiol. Renal Physiol. 282:F358), а также назальный эпителий, вагинальные поверхности и поверхности желчных протоков.The immunoglobulin constant region or portion thereof for producing the chimeric protein of the present invention can be obtained from a number of different sources. In some embodiments, the immunoglobulin constant region or portion thereof is isolated from human immunoglobulin. It should be understood, however, that an immunoglobulin constant region or portion thereof may be isolated from an immunoglobulin of another mammalian species, including, for example, a rodent (e.g., mouse, rat, rabbit, guinea pig) or non-human primate species (e.g., chimpanzee, macaque). ). In addition, the immunoglobulin constant region, or a portion thereof, can be isolated from any class of immunoglobulin, including IgM, IgG, IgD, IgA, and IgE, and any immunoglobulin isotype, including IgG1, IgG2, IgG3, and IgG4. In one embodiment of the invention, the human IgG1 isotype is used. Various immunoglobulin constant region gene sequences (eg, human constant region gene sequences) are available in the form of publicly available depositories. Constant region domain sequences can be selected to have a particular effector function (or lack a particular effector function), or with a particular modification to reduce immunogenicity. A large number of antibody sequences and antibody-coding genes have been published, and useful Ig constant region sequences (eg, hinge, CH2 and/or CH3 sequences, or portions thereof) can be isolated from such sequences using methods generally recognized in the art. Genetic material obtained using any of the methods described above can then be modified or synthesized to obtain the polypeptides of the present invention. Additionally, it should be understood that the scope of this invention covers alleles, variants and mutations of constant region DNA sequences. Immunoglobulin constant region sequences or portions thereof can be cloned, for example, using polymerase chain reaction (PCR) and primers selected to amplify the domain of interest. To clone an immunoglobulin constant region sequence or portion thereof from an antibody, mRNA can be isolated from hybridoma, spleen, or lymphatic cells, reverse transcribed into DNA, and antibody genes can be amplified by CR. PCR amplification methods are described in detail in US Pat. Nos. 4,683,195; 4683202; 4800159; 4965188; and, for example, in PCR Protocols: A Guide to Methods and Applications Innis et al. eds., Academic Press, San Diego, CA (1990); Ho et al. 1989 Gene 77:51; Horton et al. 1993 Methods Enzymol. 217:270). An immunoglobulin constant region as used herein may include all of the domains and the hinge region, or portions thereof. In one embodiment, the immunoglobulin constant region, or portion thereof, comprises a CH2 domain, a CH3 domain, and a hinge region, i.e. Fc region or FcRn binding partner. As used herein, the term Fc region is defined as the portion of a polypeptide corresponding to the Fc region of native immunoglobulin, i. resulting from the dimeric association of the corresponding Fc domains of its two heavy chains. The native Fc region forms a homodimer with another Fc region. In one embodiment, the Fc region refers to the portion of a single immunoglobulin heavy chain starting at the hinge region just downstream of the upstream papain cleavage site (i.e., residue 216 in IgG, counting 114 as the first residue of the heavy chain constant region) and ending at the C-terminus of the antibody. Accordingly, a complete Fc domain contains at least a hinge domain, a CH2 domain, and a CH3 domain. The Fc region of an immunoglobulin constant region, depending on the immunoglobulin isotype, may include CH2, CH3, and CH4 domains, as well as a hinge region. Chimeric proteins containing the immunoglobulin Fc region have several desirable properties for chimeric proteins, including increased stability, increased serum half-life (see Capon et al., 1989, Nature 337:525), and binding to Fc receptors, such as neonatal Fc receptor (FcRn) (US Pat. Nos. 6,086,875; 6,485,726; The immunoglobulin constant region, or a portion thereof, may be a FcRn binding partner. FcRn is active in adult epithelial tissues and is expressed in the intestinal cavity, lung airways, nasal surfaces, vaginal surfaces, colonic and rectal surfaces (US Pat. No. 6,485,726). The FcRn binding partner is the part of the immunoglobulin that binds to the FcRn. The FcRn receptor has been isolated from several mammalian species, including humans. The sequences of human FcRn, monkey FcRn, rat FcRn and mouse FcRn are known (Story et al. 1994, J. Exp. Med. 180:2377). The FcRn receptor binds IgG (but not other immunoglobulin classes such as IgA, IgM, IgD, and IgE) at relatively low pH, actively transports IgG transcellularly from the cavity to serum, and then releases IgG at the relatively higher pH found in interstitial fluids . It is expressed in adult epithelial tissue (US Pat. Nos. 6,485,726, 6,030,613, 6,086,875; WO 03/077834; US2003-0235536A1), including lung and intestinal epithelium (Israel et al. 1997, Immunology 92:69), epithelium proximal renal tubules (Kobayashi et al. 2002, Am. J. Physiol. Renal Physiol. 282:F358), as well as nasal epithelium, vaginal surfaces, and bile duct surfaces.

Партнеры связывания FcRn, пригодные для использования по настоящему изобретению, охватывают молекулы, которые могут специфически связываться FcRn-рецептором, включая цельный IgG, Fcфрагмент IgG и другие фрагменты, которые включают полную область связывания рецептора FcRn. Область Fc-участка IgG, которая связывается с FcRn-рецептором, была описана на основе данных рентгеновской кристаллографии (Burmeister et al. 1994, Nature 372:379). Основной участок контакта Fc с FcRn находится возле места соединения доменов СН2 и СН3. Все контакты Fc-FcRn находятся на одной тяжелой цепи Ig. Партнеры связывания FcRn включают цельный IgG, Fc-фрагмент IgG и другие фрагменты IgG, которые включают полную область связывания FcRn. Основные контактные сайты включают аминокислотные остатки 248, 250-257, 272, 285, 288, 290-291, 308-311 и 314 домена СН2 и аминокислотные остатки 385-387, 428 и 433-436 домена СН3. Все приведенные указания нумерации аминокислот иммуноглобулинов или фрагментов или областей иммуноглобулинов основаны на системе Kabat et al. 1991, Sequences of Proteins of Immunological Interest, U.S. Department of Public Health, Bethesda, Md.FcRn binding partners suitable for use in the present invention encompass molecules that can specifically bind to the FcRn receptor, including whole IgG, IgG Fc fragment, and other fragments that include the entire binding region of the FcRn receptor. The IgG Fc region that binds to the FcRn receptor has been described based on X-ray crystallography (Burmeister et al. 1994, Nature 372:379). The main site of contact between Fc and FcRn is located near the junction of the CH2 and CH3 domains. All Fc-FcRn contacts are on the same Ig heavy chain. FcRn binding partners include whole IgG, an IgG Fc fragment, and other IgG fragments that include the entire FcRn binding region. The main contact sites include amino acid residues 248, 250-257, 272, 285, 288, 290-291, 308-311 and 314 of the CH2 domain and amino acid residues 385-387, 428 and 433-436 of the CH3 domain. All references to the amino acid numbering of immunoglobulins or immunoglobulin fragments or regions are based on the system of Kabat et al. 1991, Sequences of Proteins of Immunological Interest, U.S. Department of Public Health, Bethesda, Md.

Fc-области или партнеры связывания FcRn, связанные с FcRn, могут быть эффективно перемещены через эпителиальные барьеры с помощью FcRn, тем самым обеспечивая неинвазивные средства для системного введения желательной терапевтической молекулы. Дополнительно, слитые белки, содержащие Fc-область или партнера связывания FcRn, подвергаются эндоцитозу клетками, экспрессирующими FcRn. Но вместо того, чтобы служить метками для деградации, такие слитые белки снова высвобождаются в циркуляцию, тем самым увеличивая in vivo период полувыведения таких белков. В определенных вариантах реализации изобретения частями константной области иммуноглобулинов являются Fcобласть или партнер связывания FcRn, которые типично ассоциируются, с помощью дисульфидных связей и других неспецифических взаимодействий, с другой Fc-областью или другим партнером связывания FcRn с образованием димеров и мультимеров более высокого порядка.Fc regions or FcRn binding partners associated with FcRn can be efficiently moved across epithelial barriers by FcRn, thereby providing a non-invasive means for systemically administering the desired therapeutic molecule. Additionally, fusion proteins containing an Fc region or an FcRn binding partner are endocytosed by FcRn expressing cells. But instead of serving as markers for degradation, such fusion proteins are released back into circulation, thereby increasing the in vivo half-life of such proteins. In certain embodiments, parts of the immunoglobulin constant region are an Fc region or FcRn binding partner that typically associate, via disulfide bonds and other non-specific interactions, with another Fc region or other FcRn binding partner to form higher order dimers and multimers.

Область партнера связывания FcRn представляет собой молекулу или ее часть, которая может специфически связываться рецептором FcRn с последующим активным транспортом рецептором FcRn Fcобласти. Специфически связанный относится к двум молекулам, образующим комплекс, являющийся относительно стабильным в физиологических условиях. Специфическое связывание характеризуется высокой аффинностью и от низкой до умеренной емкостью, в отличие от неспецифического связывания, которое обычно имеет низкую аффинность с емкостью от умеренной до высокой. Типично, связывание считается специфическим, если консстанта аффинности KA имеет значение выше 106 М-1, или выше 108 М-1. При необходимости, неспецифическое связывание может быть снижено без существенного влияния на специфическое связывание путем изменения условий связывания. Соответствующие условия связывания, такие как концентрация молекул, ионная сила раствора, температура, время связывания, концентрация блокирующего агента (например, сывороточный альбумин, казеин молока) и т.д., могут быть оптимизированы квалифицированным специалистом с использованием обычных методик.An FcRn binding partner region is a molecule, or portion thereof, that can be specifically bound by the FcRn receptor, followed by active transport by the FcRn Fco region. Specifically bound refers to two molecules forming a complex that is relatively stable under physiological conditions. Specific binding is characterized by high affinity and low to moderate capacity, in contrast to non-specific binding, which generally has low affinity with moderate to high capacity. Typically, binding is considered specific if the affinity constant KA is greater than 106 M -1 , or greater than 108 M -1 . If necessary, non-specific binding can be reduced without significantly affecting specific binding by changing the binding conditions. Appropriate binding conditions such as molecular concentration, solution ionic strength, temperature, binding time, blocking agent concentration (eg, serum albumin, milk casein), etc., can be optimized by the skilled artisan using conventional techniques.

Множество мутантов, фрагментов, вариантов и производных описаны, например, в публикациях РСТ № WO 2011/069164 А2, WO 2012/006623 А2, WO 2012/006635 А2 или WO 2012/006633 А2, которые все включены в данный документ в качестве ссылок в полном объеме.A variety of mutants, fragments, variants and derivatives are described, for example, in PCT Publication Nos. WO 2011/069164 A2, WO 2012/006623 A2, WO 2012/006635 A2 or WO 2012/006633 A2, all of which are incorporated herein by reference in in full.

II.C.3.b. Альбумин или его фрагмент или вариант.II.C.3.b. Albumin or fragment or variant thereof.

В определенных вариантах реализации изобретения гетерологичный фрагмент, связанный с белком VWF с помощью линкера VWF или связанный с белком FVIII с помощью линкера FVIII, представляет собой альбумин или его функциональный фрагмент. В некоторых вариантах реализации изобретения альбумин, слитый с белком VWF, ковалентно ассоциирован с альбумином, слитым с белком FVIII. Человеческий сывороточный альбумин (HSA или НА), белок, состоящий из 609 аминокислот в его полноразмерной форме, отвечает за значительную часть осмотического давления сыворотки, а также выполняет функции носителя эндогенных и экзогенных лигандов. Термин альбумин, в используемом в данном документе значении, включает полноразмерный альбумин или его функциональный фрагмент, вариант, производное или аналог. Примеры альбумина или его фрагментов или вариантов раскрыты в публикациях патентов США № 2008/0194481 А1, 2008/0004206 А1, 2008/0161243 А1, 2008/0261877 А1 или 2008/0153751 A1 или публикациях заявок РСТ № 2008/033413 А2, 2009/058322 А1 или 2007/021494 А2, которые включены в данный документ в качестве ссылок в полном объеме.In certain embodiments, the heterologous fragment linked to the VWF protein via a VWF linker or linked to the FVIII protein via an FVIII linker is albumin or a functional fragment thereof. In some embodiments, the albumin fused to the VWF protein is covalently associated with the albumin fused to the FVIII protein. Human serum albumin (HSA or HA), a 609 amino acid protein in its full-length form, is responsible for a significant portion of serum osmotic pressure and also acts as a carrier for endogenous and exogenous ligands. The term albumin, as used herein, includes full length albumin, or a functional fragment, variant, derivative, or analog thereof. Examples of albumin or fragments or variants thereof are disclosed in U.S. Patent Publication No. 2008/0194481 A1, 2008/0004206 A1, 2008/0161243 A1, 2008/0261877 A1 or 2008/0153751 A1 or PCT Application Publication No. 2008/033413 A2, 20092 A1 or 2007/021494 A2, which are incorporated herein by reference in their entirety.

П.С.3.с. Альбуминсвязывающий фрагмент.P.S.3.s. Albumin binding fragment.

В определенных вариантах реализации изобретения гетерологичный фрагмент, связанный с белком VWF с помощью линкера VWF или с белком FVIII с помощью линкера FVIII, представляет собой альбуминсвязывающий фрагмент, который содержит альбуминсвязывающий пептид, бактериальный альбуминсвязывающий домен, альбуминсвязывающий фрагмент антитела, или любую их комбинацию. Например, альбуминсвязывающий белок может быть бактериальным альбуминсвязывающим белком, антителом или фрагментом антитела, включая домен антитела (см. патент США № 6696245). Альбуминсвязывающий белок, например, может быть бактериальным альбуминсвязывающим доменом, таким как принадлежащий стрептококковому белку G (Konig, Т. and Skerra, A. (1998) J. Immunol. Methods 218, 73- 29 041588In certain embodiments, the heterologous fragment linked to the VWF protein via a VWF linker or to the FVIII protein via an FVIII linker is an albumin-binding fragment that contains an albumin-binding peptide, a bacterial albumin-binding domain, an albumin-binding antibody fragment, or any combination thereof. For example, the albumin-binding protein can be a bacterial albumin-binding protein, an antibody, or an antibody fragment including an antibody domain (see US Pat. No. 6,696,245). The albumin-binding protein, for example, may be a bacterial albumin-binding domain, such as that of streptococcal protein G (Konig, T. and Skerra, A. (1998) J. Immunol. Methods 218, 73-29 041588

83) . Другими примерами альбуминсвязывающих пептидов, которые могут быть использованы в качестве партнера конъюгации, являются, например, пептиды, имеющие консенсусную последовательность CysXaa1 -Хаа2 -Хаа3 -Хаа4 -Cys, где Xaa1 обозначает Asp, Asn, Ser, Thr или Trp; Xaa2 обозначает Asn, Gln, His, Ile, Leu или Lys; Хаа3 обозначает Ala, Asp, Phe, Trp или Tyr; и Хаа4 обозначает Asp, Gly, Leu, Phe, Ser или Thr, как описано в патентной заявке США 2003/0069395 или Dennis et al. (Dennis et al. (2002) J. Biol. Chem. 277, 35035-35043).83). Other examples of albumin-binding peptides that can be used as a conjugation partner are, for example, peptides having the consensus sequence CysXaa1-Xaa2-Xaa 3 -Xaa 4 -Cys, where Xaa1 is Asp, Asn, Ser, Thr or Trp; Xaa2 is Asn, Gln, His, Ile, Leu or Lys; Xaa3 is Ala, Asp, Phe, Trp or Tyr; and Xaa4 is Asp, Gly, Leu, Phe, Ser, or Thr as described in US 2003/0069395 or Dennis et al. (Dennis et al. (2002) J. Biol. Chem. 277, 35035-35043).

II.C.3.d. Последовательность PAS.II.C.3.d. PAS sequence.

В других вариантах реализации изобретения гетерологичный фрагмент, связанный с белком VWF с помощью линкера VWF или с белком FVIII с помощью линкера FVIII, представляет собой последовательность PAS. В одном варианте реализации изобретения химерная молекула содержит белок VWF, описанный в данном документе, слитый с последовательностью PAS с помощью линкера VWF. В другом варианте реализации изобретения химерная молекула по изобретению содержит первую цепь, содержащую белок VWF, слитый с последовательностью PAS с помощью линкера VWF, и вторую цепь, содержащую белок FVIII и дополнительную необязательную последовательность PAS, причем последовательность PAS экранирует или зашишает сайт связывания VWF белка FVIII, тем самым ингибируя или предотвращение взаимодействие белка FVIII с эндогенным VWF. Две последовательности PAS могут быть ковалентно ассоциированы друг с другом.In other embodiments, the heterologous fragment linked to the VWF protein via a VWF linker or to the FVIII protein via an FVIII linker is a PAS sequence. In one embodiment, the chimeric molecule comprises the VWF protein described herein fused to a PAS sequence via a VWF linker. In another embodiment, the chimeric molecule of the invention comprises a first strand containing a VWF protein fused to a PAS sequence via a VWF linker and a second strand containing a FVIII protein and an additional optional PAS sequence, wherein the PAS sequence shields or constricts the VWF binding site of the FVIII protein. , thereby inhibiting or preventing the interaction of the FVIII protein with endogenous VWF. The two PAS sequences can be covalently associated with each other.

Последовательность PAS, в используемом в данном документе значении, означает аминокислотную последовательность, содержащую преимущественно остатки аланина и серина, или содержащую преимущественно остатки аланина, серина и пролина, причем аминокислотная последовательность имеет в физиологических условиях конформацию случайного клубка. Соответственно, последовательность PAS представляет собой функциональный блок, аминокислотный полимер, или кассету последовательностей, содержащие, состоящие по существу из, или состоящие из аланина, серина и пролина, которые могут быть использованы как часть гетерологичного фрагмента в химерном белке. При этом, квалифицированный специалист понимает, что аминокислотный полимер также может принимать конформацию случайного клубка, если в последовательность PAS добавить остатки, отличные от аланина, серина и пролина в качестве неосновного компонента. Термин неосновной компонент, в используемом в данном документе значении, означает, что аминокислоты, отличные от аланина, серина и пролина, могут быть добавлены в последовательность PAS до определенной степени, например до около 12%, т.е. около 12 из 100 аминокислот последовательности PAS, до около 10%, т.е. около 10 из 100 аминокислот последовательности PAS, до около 9%, т.е. около 9 из 100 аминокислот, до около 8%, т.е. около 8 из 100 аминокислот, около 6%, т.е. около 6 из 100 аминокислот, около 5%, т.е. около 5 из 100 аминокислот, около 4%, т.е. около 4 из 100 аминокислот, около 3%, т.е. около 3 из 100 аминокислот, около 2%, т.е. около 2 из 100 аминокислот, около 1%, т.е. около 1 из 100 аминокислот. Аминокислоты, отличные от аланина, серина и пролина, могут быть выбраны из группы, состоящей из Arg, Asn, Asp, Cys, Gln, Glu, Gly, His, Ile, Leu, Lys, Met, Phe, Thr, Trp, Tyr и Val.The PAS sequence, as used herein, means an amino acid sequence containing predominantly alanine and serine residues, or containing predominantly alanine, serine and proline residues, and the amino acid sequence has a random coil conformation under physiological conditions. Accordingly, a PAS sequence is a functional block, amino acid polymer, or cassette of sequences containing, consisting essentially of, or consisting of alanine, serine and proline, which can be used as part of a heterologous fragment in a chimeric protein. That said, the skilled artisan will appreciate that the amino acid polymer can also assume a random coil conformation if residues other than alanine, serine, and proline are added to the PAS sequence as a minor component. The term minor component, as used herein, means that amino acids other than alanine, serine and proline can be added to the PAS sequence up to a certain extent, for example up to about 12%, i. about 12 of the 100 amino acids of the PAS sequence, up to about 10%, i. e. about 10 of the 100 amino acids of the PAS sequence, up to about 9%, i.e. about 9 out of 100 amino acids, up to about 8%, i.e. about 8 out of 100 amino acids, about 6%, i.e. about 6 out of 100 amino acids, about 5%, i.e. about 5 out of 100 amino acids, about 4%, i.e. about 4 out of 100 amino acids, about 3%, i.e. about 3 out of 100 amino acids, about 2%, i.e. about 2 out of 100 amino acids, about 1%, i.e. about 1 in 100 amino acids. The amino acids other than alanine, serine and proline may be selected from the group consisting of Arg, Asn, Asp, Cys, Gln, Glu, Gly, His, Ile, Leu, Lys, Met, Phe, Thr, Trp, Tyr and Val.

В физиологических условиях, отрезок последовательности PAS образует конформацию случайного клубка и, тем самым, может медиировать повышенную in vivo и/или in vitro стабильность VWF фактора или белка, проявляющего активность при коагуляции. Поскольку домен случайного клубка сам по себе не образует стабильной структуры или не проявляет функции, то биологическая активность, медиируемая белком VWF или белком FVIII, с которым он связан, в значительной степени сохраняется. В других вариантах реализации изобретения последовательности PAS, которые образуют домен случайного клубка, являются биологически инертными, особенно по отношению к протеолизу в плазме крови, иммуногенности, изоэлектрической точке/электростатическим свойствам, связыванию с рецепторами клеточной поверхности или интернализации изобретения, но остаются биодеградируемыми, что обеспечивает явные преимущества по сравнению с синтетическими полимерами, такими как ПЭГ.Under physiological conditions, a stretch of the PAS sequence forms a random coil conformation and thus may mediate increased in vivo and/or in vitro stability of the VWF factor or coagulation activity protein. Since the random coil domain itself does not form a stable structure or function, the biological activity mediated by the VWF protein or the FVIII protein to which it is associated is largely preserved. In other embodiments, the PAS sequences that form the random coil domain are biologically inert, especially with respect to plasma proteolysis, immunogenicity, isoelectric point/electrostatic properties, cell surface receptor binding, or internalization of the invention, but remain biodegradable, allowing clear advantages over synthetic polymers such as PEG.

Неограничивающи примеры последовательностей PAS, образующих конформацию случайного клубка, включают аминокислотные последовательности, выбранные из группы, состоящей из ASPAAPAPASPAAPAPSAPA (SEQ ID NO: 32), AAPASPAPAAPSAPAPAAPS (SEQ ID NO: 33), APSSPSPSAPSSPSPASPSS (SEQ ID NO: 34), APSSPSPSAPSSPSPASPS (SEQ ID NO: 35), SSPSAPSPSSPASPSPSSPA (SEQ ID NO: 36), AASPAAPSAPPAAASPAAPSAPPA (SEQ ID NO: 37) и ASAAAPAAASAAASAPSAAA (SEQ ID NO: 38) или любую их комбинацию. Дополнительные примеры последовательностей PAS известны, например, из публикации патента США № 2010/0292130 А1 и публикации заявки РСТ № WO 2008/155134 А1.Non-limiting examples of random coil conformation PAS sequences include amino acid sequences selected from the group consisting of ASPAAPAPASPAAPAPSAPA (SEQ ID NO: 32), AAPASPAPAAPSAPAPAAPS (SEQ ID NO: 33), APSSPSPSAPSSPSPASPSS (SEQ ID NO: 34), APSSPSPSAPSSPSPASPS (SEQ ID NO: 35), SSPSAPSPSSPASPSPSSPA (SEQ ID NO: 36), AASPAAPSAPPAAASPAAPSAPPA (SEQ ID NO: 37), and ASAAAPAAASAAASAPSAAA (SEQ ID NO: 38), or any combination thereof. Additional examples of PAS sequences are known, for example, from US Patent Publication No. 2010/0292130 A1 and PCT Application Publication No. WO 2008/155134 A1.

П.С.3.е. Последовательность НАР.P.S.3.e. NAR sequence.

В определенных вариантах реализации изобретения гетерологичный фрагмент, связанный с белком VWF с помощью линкера VWF или с белком FVIII с помощью линкера FVIII, представляет собой глицин-богатый гомоаминокислотный полимер (НАР). Последовательность НАР может содержать повторяющуюся последовательность глицина, имеющую длину по меньшей мере 50 аминокислот, по меньшей мере 100 аминокислот, 120 аминокислот, 140 аминокислот, 160 аминокислот, 180 аминокислот, 200 аминокислот, 250 аминокислот, 300 аминокислот, 350 аминокислот, 400 аминокислот, 450 аминокислот или 500 аминокислот. В одном варианте реализации изобретения последовательность НАР способна увелиIn certain embodiments, the heterologous moiety linked to the VWF protein via a VWF linker or to the FVIII protein via an FVIII linker is a glycine-rich homoamino acid polymer (HAP). The HAP sequence may comprise a repeating glycine sequence having a length of at least 50 amino acids, at least 100 amino acids, 120 amino acids, 140 amino acids, 160 amino acids, 180 amino acids, 200 amino acids, 250 amino acids, 300 amino acids, 350 amino acids, 400 amino acids, 450 amino acids or 500 amino acids. In one embodiment of the invention, the HAP sequence is capable of increasing

- 30 041588 чивать период полувыведения фрагмента, слитого с или связанного с последовательностью НАР. Неограничивающие примеры последовательности НАР включают, без ограничений, (Gly)n, (Gly4Ser)n или S(Gly4Ser)n, где n равен 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 или 20. В одном варианте реализации изобретения n равен 20, 21, 22, 23, 24, 25, 26, 26, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39 или 40. В другом варианте реализации изобретения n равен 50, 60, 70, 80, 90, 100, 11, 120, 130, 140, 150, 160, 170, 180, 190 или 200. См., например, Schlapschy M et al, Protein Eng. Design Selection, 20: 273-284 (2007).- 30 041588 to calculate the half-life of the fragment fused to or associated with the HAP sequence. Non-limiting examples of a HAP sequence include, without limitation, (Gly)n, (Gly 4 Ser) n , or S(Gly 4 Ser)n, where n is 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, or 20. In one embodiment, n is 20, 21, 22, 23, 24, 25, 26, 26, 28, 29, 30 , 31, 32, 33, 34, 35, 36, 37, 38, 39, or 40. In another embodiment, n is 50, 60, 70, 80, 90, 100, 11, 120, 130, 140, 150, 160, 170, 180, 190 or 200. See, for example, Schlapschy M et al, Protein Eng. Design Selection, 20: 273-284 (2007).

II.C.3.f. Трансферрин или его фрагмент.II.C.3.f. Transferrin or its fragment.

В определенных вариантах реализации изобретения гетерологичный фрагмент, связанный с белком VWF с помощью линкера VWF или с белком FVIII с помощью линкера FVIII, представляет собой трансферрин или его фрагмент. Любой трансферрин может быть использован для получения химерных молекул по изобретению. В качестве примера, человеческий Tf (Tf) дикого типа представляет собой белок из 679 аминокислот, около 75 кДа (без учета гликозилирования), с двумя основными доменами - N (около 330 аминокислот) и С (около 340 аминокислот), который, по-видимому, образуется в результате дупликации гена. См. GenBank, номера доступа NM001063, ХМ002793, М12530, ХМ039845, ХМ 039847 и S95936 (www.ncbi.nlm.nih.gov/), которые все включены в данный документ в качестве ссылок в полном объеме. Трансферрин содержит два домена - N-домен и С-домен. N-домен содержит два субдомена - домен N1 и домен N2, и С-домен содержит два субдомена - домен С1 и домен С2.In certain embodiments, the heterologous moiety linked to the VWF protein via a VWF linker or to the FVIII protein via an FVIII linker is transferrin or a fragment thereof. Any transferrin may be used to prepare the chimeric molecules of the invention. As an example, wild-type human Tf (Tf) is a 679 amino acid, about 75 kDa (excluding glycosylation) protein with two major domains, N (about 330 amino acids) and C (about 340 amino acids), which apparently formed as a result of gene duplication. See GenBank accession numbers NM001063, XM002793, M12530, XM039845, XM 039847, and S95936 (www.ncbi.nlm.nih.gov/), which are all incorporated herein by reference in their entirety. Transferrin contains two domains, the N-domain and the C-domain. The N domain contains two subdomains, the N1 domain and the N2 domain, and the C domain contains two subdomains, the C1 domain and the C2 domain.

В одном варианте реализации изобретения трансферриновая часть химерной молекулы включает сплайсинговый вариант трансферрина. В одном примере, сплайсинговый вариант трансферрина может быть сплайсинговым вариантом человеческого трансферрина, например Genbank, номер доступа ААА61140. В другом варианте реализации изобретения трансферриновая часть химерной молекулы включает один или более доменов последовательности трансферрина, например N-домен, С-домен, домен N1, домен N2, домен С1, домен С2 или любую их комбинацию.In one embodiment, the transferrin moiety of the chimeric molecule includes a spliced transferrin variant. In one example, the spliced transferrin variant may be a human transferrin splicing variant, such as Genbank accession number AAA61140. In another embodiment, the transferrin portion of the chimeric molecule comprises one or more transferrin sequence domains, such as an N domain, a C domain, an N1 domain, an N2 domain, a C1 domain, a C2 domain, or any combination thereof.

II.C.3.g. Полимер, например полиэтиленгликоль (ПЭГ).II.C.3.g. A polymer such as polyethylene glycol (PEG).

В других вариантах реализации изобретения гетерологичный фрагмент, соединенный с белком VWF с помощью линкера VWF или с белком FVIII с помощью линкера FVIII, представляет собой растворимый полимер, известный в данной области техники, включая, без ограничений, полиэтиленгликоль, сополимеры этиленгликоль/пропиленгликоль, карбоксиметилцеллюлозу, декстран или поливиниловый спирт. Гетерологичный фрагмент, такой как растворимый полимер, может быть присоединен к любому положению в химерной молекуле.In other embodiments, the heterologous moiety linked to the VWF protein via a VWF linker or to the FVIII protein via an FVIII linker is a soluble polymer known in the art, including, but not limited to, polyethylene glycol, ethylene glycol/propylene glycol copolymers, carboxymethyl cellulose, dextran or polyvinyl alcohol. A heterologous moiety, such as a soluble polymer, may be attached to any position in the chimeric molecule.

В определенных вариантах реализации изобретения химерная молекула содержит белок VWF, связанный с гетерологичным фрагментом (например, Fc-областью) с помощью линкера VWF, причем белок VWF дополнительно связан с ПЭГ. В другом варианте реализации изобретения химерная молекула содержит белок VWF, соединенный с Fc-областью с помощью линкера VWF, и белок FVIII, которые ассоциированы друг с другом, причем белок FVIII соединен с ПЭГ.In certain embodiments, the chimeric molecule comprises a VWF protein linked to a heterologous moiety (eg, Fc region) via a VWF linker, the VWF protein being further linked to a PEG. In another embodiment of the invention, the chimeric molecule contains a VWF protein connected to the Fc region using a VWF linker and a FVIII protein that are associated with each other, and the FVIII protein is connected to PEG.

Изобретение также предусматривает химически модифицированные производные химерной молекулы по изобретению, которые могут обеспечивать дополнительные преимущества, такие как повышенная растворимость, стабильность и время циркуляции полипептида, или пониженная иммуногенность (см. патент США № 4179337). Химические фрагменты для модификации могут быть выбраны из водорастворимых полимеров, включая, без ограничений, полиэтиленгликоль, сополимеры этиленгликоля/пропиленгликоля, карбоксиметилцеллюлозу, декстран или поливиниловый спирт. Химерная молекула может быть модифицирована в случайных положениях внутри молекулы или на N- или С-конце, или в предварительно определенных положениях внутри молекулы, и могут включать один, два, три или больше присоединенных химических фрагментов.The invention also provides chemically modified derivatives of the chimeric molecule of the invention, which may provide additional benefits such as increased solubility, stability and circulation time of the polypeptide, or reduced immunogenicity (see US Pat. No. 4,179,337). The chemical moieties for modification may be selected from water-soluble polymers, including, without limitation, polyethylene glycol, ethylene glycol/propylene glycol copolymers, carboxymethyl cellulose, dextran, or polyvinyl alcohol. The chimeric molecule may be modified at random positions within the molecule or at the N- or C-terminus, or at predetermined positions within the molecule, and may include one, two, three or more chemical moieties attached.

Полимер может иметь любой молекулярный вес и могут быть разветвленным или неразветвленным. Для полиэтиленгликоля, в одном варианте реализации изобретения молекулярный вес имеет значение между около 1 кДа и около 100 кДа для простоты обращения и производства. Могут быть использованы другие размеры, в зависимости от желательного профиля (например, продолжительности желательного пролонгированного высвобождения, влияния, если оно наблюдается, на биологическую активность, простоты обращения, степени антигенности или ее отсутствия и других известных эффектов воздействия полиэтиленгликоля на белок или аналог). Например, полиэтиленгликоль может иметь средний молекулярный вес около 200, 500, 1000, 1500, 2000, 2500, 3000, 3500, 4000, 4500, 5000, 5500, 6000, 6500, 7000, 7500, 8000, 8500, 9000, 9500, 10000, 10500, 11000, 11500, 12000, 12500, 13000, 13500, 14000, 14500, 15000, 15500, 16000, 16500, 17000, 17500, 18000, 18500, 19000, 19500, 20000, 25000, 30000, 35000, 40000, 45000, 50000, 55000, 60000, 65000, 70000, 75000, 80000, 85000, 90000, 95000 или 100000 кДа.The polymer may be of any molecular weight and may be branched or unbranched. For polyethylene glycol, in one embodiment of the invention, the molecular weight is between about 1 kDa and about 100 kDa for ease of handling and manufacturing. Other sizes may be used, depending on the desired profile (e.g., duration of desired sustained release, effect, if any, on biological activity, ease of handling, degree of antigenicity or lack thereof, and other known effects of polyethylene glycol exposure to the protein or analogue). For example, polyethylene glycol may have an average molecular weight of about 200, 500, 1000, 1500, 2000, 2500, 3000, 3500, 4000, 4500, 5000, 5500, 6000, 6500, 7000, 7500, 8000, 8500, 90000, 10000, 10000. 10500, 11000, 11500, 12000, 12500, 13000, 13500, 14000, 14500, 15000, 15500, 16000, 16500, 17000, 17500, 18000, 18500, 19000, 19500, 20,000, 25000, 30000, 35000, 40000, 45000, 45000, 45000, 45000 , 50000, 55000, 60000, 65000, 70000, 75000, 80000, 85000, 90000, 95000 or 100000 kDa.

В некоторых вариантах реализации изобретения полиэтиленгликоль может иметь разветвленное строение. Разветвленные полиэтиленгликоли описаны, например, в патенте США № 5643575; Morpurgo et al, Appl. Biochem. Biotechnol. 56:59-72 (1996); Vorobjev et al., Nucleosides Nucleotides 18:2745-2750 (1999); и Caliceti et al, Bioconjug. Chem. 10:638-646 (1999), которые все включены в данный документ в качестве ссылок в полном объеме.In some embodiments of the invention, the polyethylene glycol may have a branched structure. Branched polyethylene glycols are described, for example, in US patent No. 5643575; Morpurgo et al, Appl. Biochem. Biotechnol. 56:59-72 (1996); Vorobjev et al., Nucleosides Nucleotides 18:2745-2750 (1999); and Caliceti et al, Bioconjug. Chem. 10:638-646 (1999), which are all incorporated herein by reference in their entirety.

Число фрагментов полиэтиленгликоля, присоединенных к каждой химерной молекуле (т.е. степеньThe number of polyethylene glycol fragments attached to each chimeric molecule (i.e. the degree

- 31 041588 замещения) также может меняться. Например, пегилированные белки по изобретению могут быть связаны в среднем с 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 15, 17, 20 или больше молекулами полиэтиленгликоля. Аналогично, средняя степень замещения (может иметь значение) в диапазоне, таком как 1-3, 2-4, 3-5, 4-6, 57, 6-8, 7-9, 8-10, 9-11, 10-12, 11-13, 12-14, 13-15, 14-16, 15-17, 16-18, 17-19, или 18-20 фрагментов полиэтиленгликоль на молекулу белка. Способы определения степени замещения описаны, например, в Delgado et al, Crit. Rev. Them. Drug Carrier Sys. 9:249-304 (1992).- 31 041588 substitutions) may also vary. For example, the pegylated proteins of the invention can be associated with an average of 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 15, 17, 20 or more polyethylene glycol molecules. Likewise, the average degree of substitution (may matter) in a range such as 1-3, 2-4, 3-5, 4-6, 57, 6-8, 7-9, 8-10, 9-11, 10 -12, 11-13, 12-14, 13-15, 14-16, 15-17, 16-18, 17-19, or 18-20 polyethylene glycol fragments per protein molecule. Methods for determining the degree of substitution are described, for example, in Delgado et al, Crit. Rev. Them. Drug Carrier Sys. 9:249-304 (1992).

В других вариантах реализации изобретения белок FVIII, используемый в изобретении, конъюгирован с одним или более полимерами. Полимер может быть водорастворимым и ковалентно или нековалентно присоединенным к фактору VIII или другим фрагментам, конъюгированным с фактором VIII. Неограничивающими примерами полимера могут быть полиалкиленоксид, поливинилпирролидон, поливиниловый спирт, полиоксазолин или полиакрилоилморфолин. Дополнительные типы полимерконъюгированного FVIII раскрыты в патенте США № 7199223.In other embodiments, the FVIII protein used in the invention is conjugated to one or more polymers. The polymer may be water soluble and covalently or non-covalently attached to Factor VIII or other Factor VIII conjugated moieties. Non-limiting examples of the polymer may be polyalkylene oxide, polyvinylpyrrolidone, polyvinyl alcohol, polyoxazoline, or polyacryloylmorpholine. Additional types of polymer-conjugated FVIII are disclosed in US Pat. No. 7,199,223.

П.С.3.К Гидроксиэтилкрахмал (ГЭК).P.S.3.K Hydroxyethyl starch (HES).

В определенных вариантах реализации изобретения гетерологичный фрагмент, связанный с белком VWF с помощью линкера VWF или с белком FVIII с помощью линкера FVIII, представляет собой полимер, например гидроксиэтилкрахмал (ГЭК) или его производное.In certain embodiments, the heterologous moiety linked to the VWF protein via a VWF linker or to the FVIII protein via an FVIII linker is a polymer, such as hydroxyethyl starch (HES) or a derivative thereof.

Гидроксиэтилкрахмал (ГЭК) представляет собой производное природного амилопектина и деградируется в организме альфа-амилазой. ГЭК представляет собой замещенное производное углеводного полимера амилопектина, который присутствует в кукурузном крахмале в концентрации до 95 мас.%. ГЭК проявляет полезные биологические свойства и используется как объемный кровезаменитель и в гемодилюционной терапии в клинических условиях (Sommermeyer et al., Krankenhauspharmazie, 8(8), 271-278 (1987); и Weidler et al., Arzneim.-Forschung/Drug Res., 41, 494-498 (1991)).Hydroxyethyl starch (HES) is a derivative of natural amylopectin and is degraded in the body by alpha-amylase. HES is a substituted derivative of the carbohydrate polymer amylopectin, which is present in corn starch at a concentration of up to 95% by weight. HES exhibits beneficial biological properties and is used as a bulk blood substitute and in clinical hemodilution therapy (Sommermeyer et al., Krankenhauspharmazie, 8(8), 271-278 (1987); and Weidler et al., Arzneim.-Forschung/Drug Res ., 41, 494-498 (1991)).

Амилопектин содержит фрагменты глюкозы, причем в основной цепи присутствуют альфа-1,4гликозидные связи, а в узлах ветвления находятся альфа-1,6-гликозидные связи. Физико-химические свойства этой молекулы преимущественно определяются типом гликозидных связей. Вследствие одноцепочечных разрывов альфа-1,4-гликозидных связей образуются спиральные структуры с около шестью глюкозными мономерами на виток. Физико-химические, а также биохимические свойства полимера могут быть модифицированы путем замещения. Введение гидроксиэтильной группы может быть осуществлено путем щелочного гидроксиэтилирования. Изменяя реакционные условия, можно использовать разную реакционную способность соответствующей гидроксильной группы в незамещенном глюкозном мономере по отношению к гидроксиэтилированию. Благодаря этому, квалифицированный специалист способен, в ограниченной степени, влиять на характер замещения.Amylopectin contains glucose fragments, with alpha-1,4 glycosidic bonds present in the main chain, and alpha-1,6 glycosidic bonds at the branch nodes. The physicochemical properties of this molecule are predominantly determined by the type of glycosidic bonds. Due to single-strand breaks of alpha-1,4-glycosidic bonds, helical structures are formed with about six glucose monomers per turn. Physico-chemical as well as biochemical properties of the polymer can be modified by substitution. The introduction of the hydroxyethyl group can be carried out by alkaline hydroxyethylation. By varying the reaction conditions, one can exploit the different reactivity of the corresponding hydroxyl group in the unsubstituted glucose monomer towards hydroxyethylation. Due to this, a qualified specialist is able, to a limited extent, to influence the nature of the substitution.

ГЭК преимущественно характеризуется распределением молекулярного веса и степенью замещения. Степень замещения, обозначаемая как DS, относится к молярному замещению, как известно квалифицированным специалистам. См. Sommermeyer et al., Krankenhauspharmazie, 8(8), 271-278 (1987), указанный выше, особенно на с. 273. В одном варианте реализации изобретения гидроксиэтилкрахмал имеет средний молекулярный вес (средневзвешенный) от 1 до 300 кДа, от 2 до 200 кДа, от 3 до 100 кДа, или от 4 до 70 кДа. Гидроксиэтилкрахмал может дополнительно обладать молярной степенью замещения от 0,1 до 3, предпочтительно от 0,1 до 2, более предпочтительно от 0,1 до 0,9, предпочтительно от 0,1 до 0,8, и соотношением между С2:С6 замещением в диапазоне значений от 2 до 20 по отношению к гидроксиэтильным группам. Неограничивающим примером ГЭК, имеющего средний молекулярный вес около 130 кДа, является ГЭК со степенью замещения от 0,2 до 0,8, такой как 0,2, 0,3, 0,4, 0,5, 0,6, 0,7 или 0,8, предпочтительно от 0,4 до 0,7, такой как 0,4, 0,5, 0,6 или 0,7. В конкретном варианте реализации изобретения ГЭК со средним молекулярным весом около 130 кДа является продуктом VOLUVEN® фирмы Fresenius. VOLUVEN® представляет собой искусственный коллоид, применяемый, например, для объемного замещения, используемый по терапевтическим показаниям в терапии и профилактике гиповолемии. VOLUVEN характеризуется средним молекулярным весом 130000+/-20000 Да, молярным замещением 0,4 и соотношением С2:С6, равным около 9:1. В других вариантах реализации изобретения диапазоны значений среднего молекулярного веса гидроксиэтилкрахмала составляют, например, от 4 до 70 кДа, или от 10 до 70 кДа, или от 12 до 70 кДа, или от 18 до 70 кДа, или от 50 до 70 кДа, или от 4 до 50 кДа, или от 10 до 50 кДа, или от 12 до 50 кДа, или от 18 до 50 кДа, или от 4 до 18 кДа, или от 10 до 18 кДа, или от 12 до 18 кДа, или от 4 до 12 кДа, или от 10 до 12 кДа, или от 4 до 10 кДа. В еще одних вариантах реализации изобретения средний молекулярный вес используемого гидроксиэтилкрахмала находится в диапазоне значений от более чем 4 кДа до менее чем 70 кДа, например около 10 кДа, или в диапазоне значений от 9 до 10 кДа или от 10 до 11 кДа или от 9 до 11 кДа, или около 12 кДа, или в диапазоне значений от 11 до 12 кДа) или от 12 до 13 кДа или от 11 до 13 кДа, или около 18 кДа, или в диапазоне значений от 17 до 18 кДа или от 18 до 19 кДа или от 17 до 19 кДа, или около 30 кДа, или в диапазоне значений от 29 до 30 или от 30 до 31 кДа, или около 50 кДа, или в диапазоне значений от 49 до 50 кДа или от 50 до 51 кДа или от 49 до 51 кДа. В определенных вариантах реализации изобретения гетерологичный фрагмент может быть смесями гидроксиэтилкрахмалов, имеющих разные средние молекулярные веса и/или разные степени замещения и/или разные соотношения С2:С6 замещения. Таким образом, могут быть использованы смеHES is predominantly characterized by molecular weight distribution and degree of substitution. The degree of substitution, referred to as DS, refers to molar substitution as known to those skilled in the art. See Sommermeyer et al., Krankenhauspharmazie, 8(8), 271-278 (1987), cited above, especially p. 273. In one embodiment, the hydroxyethyl starch has an average molecular weight (weight average) of 1 to 300 kDa, 2 to 200 kDa, 3 to 100 kDa, or 4 to 70 kDa. The hydroxyethyl starch may further have a molar degree of substitution from 0.1 to 3, preferably from 0.1 to 2, more preferably from 0.1 to 0.9, preferably from 0.1 to 0.8, and a ratio between C2:C6 substitution in the range of values from 2 to 20 with respect to hydroxyethyl groups. A non-limiting example of HES having an average molecular weight of about 130 kDa is HES with a degree of substitution from 0.2 to 0.8, such as 0.2, 0.3, 0.4, 0.5, 0.6, 0, 7 or 0.8, preferably 0.4 to 0.7, such as 0.4, 0.5, 0.6 or 0.7. In a specific embodiment, the HES with an average molecular weight of about 130 kDa is a VOLUVEN® product from Fresenius. VOLUVEN® is an artificial colloid used, for example, for volumetric replacement, used for therapeutic indications in the treatment and prevention of hypovolemia. VOLUVEN has an average molecular weight of 130,000+/-20,000 Da, a molar substitution of 0.4, and a C2:C6 ratio of about 9:1. In other embodiments, the hydroxyethyl starch average molecular weight ranges are, for example, 4 to 70 kDa, or 10 to 70 kDa, or 12 to 70 kDa, or 18 to 70 kDa, or 50 to 70 kDa, or 4 to 50 kDa, or 10 to 50 kDa, or 12 to 50 kDa, or 18 to 50 kDa, or 4 to 18 kDa, or 10 to 18 kDa, or 12 to 18 kDa, or 4 to 12 kDa, or 10 to 12 kDa, or 4 to 10 kDa. In yet other embodiments, the average molecular weight of the hydroxyethyl starch used is in the range of greater than 4 kDa to less than 70 kDa, such as about 10 kDa, or in the range of 9 to 10 kDa, or 10 to 11 kDa, or 9 to 11 kDa or about 12 kDa or in the range of 11 to 12 kDa) or 12 to 13 kDa or 11 to 13 kDa or about 18 kDa or in the range of 17 to 18 kDa or 18 to 19 kDa, or 17 to 19 kDa, or about 30 kDa, or in the range of 29 to 30 or 30 to 31 kDa, or about 50 kDa, or in the range of 49 to 50 kDa, or 50 to 51 kDa, or from 49 to 51 kDa. In certain embodiments, the heterologous fragment may be mixtures of hydroxyethyl starches having different average molecular weights and/or different degrees of substitution and/or different C2:C6 substitution ratios. Thus, it can be used

- 32 041588 си гидроксиэтилкрахмалов, имеющих разные средние молекулярные веса и разные степени замещения и разные соотношения С2:С6 замещения, или имеющих имеющих разные средние молекулярные веса и разные степени замещения и одинаковые или примерно одинаковые соотношения С2:С6 замещения, или имеющих разные средние молекулярные веса и одинаковые или примерно одинаковые степени замещения и разные соотношения С2:С6 замещения, или имеющих одинаковый или примерно одинаковый средний молекулярный вес и разные степени замещения и разные соотношения С2:С6 замещения, или имеющих разные средние молекулярные веса и одинаковые или примерно одинаковые степени замещения и одинаковые или примерно одинаковые соотношения С2:С6 замещения, или имеющих одинаковые или примерно одинаковые средние молекулярные веса и разные степени замещения и одинаковые или примерно одинаковые соотношения С2:С6 замещения, или имеющих одинаковый или примерно одинаковый средний молекулярный вес и одинаковые или примерно одинаковые степени замещения и разные соотношения С2:С6 замещения, или имеющих примерно одинаковый средний молекулярный вес и примерно одинаковую степень замещения и примерно одинаковое соотношение С2:С6 замещения.- 32 041588 c hydroxyethyl starches having different average molecular weights and different degrees of substitution and different ratios of C2:C6 substitution, or having different average molecular weights and different degrees of substitution and the same or approximately the same ratios of C2:C6 substitution, or having different average molecular weights weight and the same or approximately the same degree of substitution and different ratios of C2:C6 substitution, or having the same or approximately the same average molecular weight and different degrees of substitution and different ratios of C2:C6 substitution, or having different average molecular weights and the same or approximately the same degrees of substitution and the same or about the same C2:C6 substitution ratios, or having the same or about the same average molecular weights and different degrees of substitution, and the same or about the same C2:C6 substitution ratios, or having the same or about the same average molecular weight and the same or about one equal degrees of substitution and different ratios of C2:C6 substitution, or having approximately the same average molecular weight and approximately the same degree of substitution and approximately the same ratio of C2:C6 substitution.

ILC3.i. Полисиаловые кислоты (ПСК).ILC3.i. Polysialic acids (PSA).

В определенных вариантах реализации изобретения неполипептидный гетерологичный фрагмент, связанный с белком VWF с помощью линкера VWF или с белком FVIII с помощью линкера FVIII, представляет собой полимер, например полисиаловые кислоты (ПСК) или их производное. Полисиаловые кислоты (ПСК) являются природными неразветвленными полимерами сиаловой кислоты, продуцируемыми определенными бактериальными штаммами и у млекопитающих в определенных клетках. Roth J., et al. (1993) in Polysialic Acid: From Microbes to Man, eds. Roth J., Rutishauser U., Troy F. A. (Birkhauser Verlag, Basel, Switzerland), pp 335-348. Они могут быть получены с различными степенями полимеризации от п=около 80 или больше остатков сиаловой кислоты и в меньшую сторону до n=2, путем ограниченного кислотного гидролиза, или путем ферментативного разложения нейраминидазами, или фракционированием природных бактериально вырабатываемых форм полимера. Композиция разных полисиаловых кислот также меняется таким образом, что существуют гомополимерные формы, т.е. альфа-2,8связанная полисиаловая кислота, содержащая капсульный полисахарид штамма K1 E. coli и менингококков группы В, который также присутствует в эмбриональной форме молекулы адгезии нервных клеток (N-CAM). Существуют также гетерополимерные формы - такие как чередующаяся альфа-2,8 альфа-2,9 полисиаловая кислота штамма K92 Е. coli и полисахариды группы С N. meningitidis. Сиаловая кислота может также присутствовать в чередующихся сополимерах с мономерами, отличными от сиаловой кислоты, такими как группа W135 или группа Y N. meningitidis. Полисиаловые кислоты обладают важными биологическими функциями, включая избежание воздействия иммунной системы и системы комплемента патогенными бактериями и регуляцию глиальной адгезивности незрелых нейронов во время развития плода (в которой полимер выполняет антиадгезивную функцию) Cho and Troy, P.N.A.S., USA, 91 (1994) 11427-11431, хотя рецепторы полисиаловой кислоты у млекопитающих неизвестны. Альфа-2,8-связанная полисиаловая кислота штамма K1 E. coli также известна как коломиновая кислота и используется (с различными длинами) для иллюстрации настоящего изобретения. Были описаны различные способы присоединения или конъюгации полисиаловых кислот к полипептиду (например, см. патент США № 5846951; WO-A-0187922 и US 2007/0191597 А1, которые включены в данный документ в качестве ссылок в полном объеме.In certain embodiments, the non-polypeptide heterologous fragment linked to the VWF protein via a VWF linker or to the FVIII protein via an FVIII linker is a polymer, such as polysialic acids (PSAs) or a derivative thereof. Polysialic acids (PSAs) are natural, straight-chain polymers of sialic acid produced by certain bacterial strains and in mammals in certain cells. Roth J., et al. (1993) in Polysialic Acid: From Microbes to Man, eds. Roth J., Rutishauser U., Troy F. A. (Birkhauser Verlag, Basel, Switzerland), pp 335-348. They can be obtained in various degrees of polymerization from n=about 80 or more sialic acid residues down to n=2, by limited acid hydrolysis, or by enzymatic degradation with neuraminidase, or by fractionation of natural bacterially produced forms of the polymer. The composition of different polysialic acids also varies in such a way that there are homopolymeric forms, i.e. alpha-2,8 linked polysialic acid containing capsular polysaccharide of E. coli strain K1 and group B meningococci, which is also present in the embryonic form of the neural cell adhesion molecule (N-CAM). There are also heteropolymeric forms such as the alternating alpha-2,8 alpha-2,9 polysialic acid of E. coli strain K92 and the group C polysaccharides of N. meningitidis. Sialic acid may also be present in alternating copolymers with monomers other than sialic acid, such as the W135 group or the Y group of N. meningitidis. Polysialic acids have important biological functions including avoiding immune and complement system attack by pathogenic bacteria and regulation of glial adhesiveness of immature neurons during fetal development (in which the polymer has an anti-adhesive function) Cho and Troy, P.N.A.S., USA, 91 (1994) 11427-11431 , although polysialic acid receptors are not known in mammals. Alpha-2,8-linked polysialic acid of E. coli strain K1 is also known as colominic acid and is used (in various lengths) to illustrate the present invention. Various methods for attaching or conjugating polysialic acids to a polypeptide have been described (for example, see US Pat.

И.С.4. Последовательность XTEN.I.S.4. XTEN sequence.

В используемом в данном документе значении, последовательность XTEN относится к полипептидам увеличенной длины с неприродными, по существу неповторяющимися последовательностями, которые состоят преимущественно из малых гидрофильных аминокислот, с последовательностью, имеющей низкую степень или не имеющей вторичной или третичной структуры в физиологических условиях. В качестве партнера химерного белка, XTEN может служить носителем, обеспечивая определенные желательные фармакокинетические, физико-химические и фармацевтические свойства при связывании с белком VWF или белком FVIII по изобретению для получения химерного белка. Такие желательные свойства включают, без ограничений, улучшенные фармакокинетические параметры и характеристики растворимости. В используемом в данном документе значении, XTEN определенно исключает антитела или фрагменты антител, такие как одноцепочечные антитела или Fc-фрагменты легкой цепи или тяжелой цепи.As used herein, the XTEN sequence refers to extended length polypeptides with non-natural, substantially non-repetitive sequences that consist predominantly of small hydrophilic amino acids, with a sequence that has little or no secondary or tertiary structure under physiological conditions. As a partner of the chimeric protein, XTEN can serve as a carrier providing certain desirable pharmacokinetic, physicochemical and pharmaceutical properties when coupled to the VWF protein or FVIII protein of the invention to produce the chimeric protein. Such desirable properties include, without limitation, improved pharmacokinetic parameters and solubility characteristics. As used herein, XTEN specifically excludes antibodies or antibody fragments such as single chain antibodies or light chain or heavy chain Fc fragments.

В некоторых вариантах реализации изобретения последовательность XTEN по изобретению представляет собой пептид или полипептид, содержащий более чем около 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1200, 1400, 1600, 1800 или 2000 аминокислотных остатков. В определенных вариантах реализации изобретения XTEN представляет собой пептид или полипептид, содержащий от более чем около 20 до около 3000 аминокислотных остатков, от более чем 30 до около 2500 остатков, от более чем 40 до около 2000 остатков, от более чем 50 до около 1500 остатков, от более чем 60 до около 1000 остатков, от более чем 70 до около 900 остатков, от более чем 80 до около 800 остатков, от более чем 90 до около 700 остатков, от более чем 100 до около 600 остатков, от более чем 110 до около 500 остатки, или от более чем 120 до около 400 остатков.In some embodiments, the XTEN sequence of the invention is a peptide or polypeptide containing more than about 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450 , 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1200, 1400, 1600, 1800 or 2000 amino acid residues. In certain embodiments of the invention, XTEN is a peptide or polypeptide containing from more than about 20 to about 3000 amino acid residues, from more than 30 to about 2500 residues, from more than 40 to about 2000 residues, from more than 50 to about 1500 residues , from more than 60 to about 1000 residues, from more than 70 to about 900 residues, from more than 80 to about 800 residues, from more than 90 to about 700 residues, from more than 100 to about 600 residues, from more than 110 up to about 500 residues, or more than 120 to about 400 residues.

- 33 041588- 33 041588

Последовательность XTEN по изобретению, может содержать один или более мотивов последовательности, состоящих из от 9 до 14 аминокислотных остатков, или аминокислотную последовательность, по меньшей мере на 80, 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% идентичную мотиву последовательности, причем мотив содержит, состоит, по существу, из, или состоит из 4-6 типов аминокислот, выбранных из группы, состоящей из глицина (G), аланина (А), серина (S), треонина (Т), глутамата (Е) и пролина (Р). См. US 2010-0239554 А1.The XTEN sequence of the invention may comprise one or more sequence motifs of 9 to 14 amino acid residues, or an amino acid sequence of at least 80, 90, 91, 92, 93, 94, 95, 96, 97, 98 or 99% sequence identity to the motif, wherein the motif contains, consists essentially of, or consists of 4-6 types of amino acids selected from the group consisting of glycine (G), alanine (A), serine (S), threonine (T ), glutamate (E), and proline (P). See US 2010-0239554 A1.

В некоторых вариантах реализации изобретения XTEN содержит неперекрывающиеся мотивы последовательности, в которых около 80%, или по меньшей мере около 85%, или по меньшей мере около 90, или около 91, или около 92, или около 93, или около 94, или около 95, или около 96, или около 97, или около 98, или около 99 или около 100% последовательности состоит из множества звеньев неперекрывающихся последовательностей, выбранных из одного семейства мотивов, выбранных из табл. 2А, с образованием последовательности семейства. В используемом в данном документе значении, семейство означает, что XTEN имеет мотивы, выбранные только из одной категории мотивов из табл. 2А; т.е. XTEN AD, AE, AF, AG, AM, AQ, ВС или BD, и что любые другие аминокислоты в XTEN, не принадлежащие к мотивам семейства, выбирают для достижения требуемого свойства, такого как обеспечение возможности включение сайта рестрикции с помощью кодирующих нуклеотидов, включения расщепляемой последовательности, или достижение лучшей связи с FVIII или VWF. В некоторых вариантах реализации семейств XTEN, последовательность XTEN содержит множество звеньев неперекрывающиеся мотивов последовательности семейства мотивов AD, или семейства мотивов АЕ, или семейства мотивов AF, или семейства мотивов AG, или семейства мотивов AM, или семейства мотивов AQ, или семейства ВС, или семейства BD, причем полученный XTEN демонстрирует диапазон значений гомологии, описанный выше. В других вариантах реализации изобретения XTEN содержит множество звеньев последовательностей мотива из двух или больше семейств мотивов из табл. 2А. Такие последовательности могут быть выбраны для достижения желательных физических/химических характеристик, включая такие свойства, как суммарный заряд, гидрофильность, отсутствие вторичной структуры, или отсутствие повторяемости, которые обеспечиваются аминокислотным составом мотивов, описанных более подробно ниже. В вариантах реализации изобретения описанных выше в данном абзаце, мотивы, включенные в XTEN, могут быть выбраны и собраны с использованием способов, описанных в данном документе, для получения XTEN, состоящего из от около 36 до около 3000 аминокислотных остатков.In some embodiments, the XTEN contains non-overlapping sequence motifs in which about 80%, or at least about 85%, or at least about 90, or about 91, or about 92, or about 93, or about 94, or about 95, or about 96, or about 97, or about 98, or about 99, or about 100% of the sequence consists of multiple units of non-overlapping sequences selected from the same family of motifs selected from Table. 2A to form a family sequence. As used herein, family means that an XTEN has motifs selected from only one of the motif categories in Table 1. 2A; those. XTEN AD, AE, AF, AG, AM, AQ, BC, or BD, and that any other amino acids in XTEN that do not belong to family motifs are chosen to achieve the desired property, such as allowing restriction site incorporation by coding nucleotides, incorporation cleavable sequence, or achieving a better association with FVIII or VWF. In some embodiments of the XTEN families, the XTEN sequence contains a plurality of units of non-overlapping motif sequences of the AD motif family, or the AE motif family, or the AF motif family, or the AG motif family, or the AM motif family, or the AQ motif family, or the BC family, or the BD, and the resulting XTEN shows the range of homology values described above. In other embodiments of the invention, XTEN contains a plurality of motif sequence units from two or more motif families from Table. 2A. Such sequences can be selected to achieve the desired physical/chemical characteristics, including properties such as net charge, hydrophilicity, lack of secondary structure, or lack of repeatability, which are provided by the amino acid composition of the motifs described in more detail below. In the embodiments of the invention described above in this paragraph, the motifs included in the XTEN can be selected and assembled using the methods described herein to obtain an XTEN consisting of from about 36 to about 3000 amino acid residues.

Таблица 2А. Мотивы последовательностиTable 2A. Sequence motifs

XTEN, состоящие из 12 аминокислот, и семейства мотивовXTEN, consisting of 12 amino acids, and a family of motifs

Семейство мотива* Motif family* Последовательность мотива Motif Sequence AD AD GESPGGSSGSES (SEQ Ш NO: 49) GESPGGSSGSES (SEQ W NO: 49) AD AD GSEGSSGPGESS (SEQ Ш NO: 50) GSEGSSGPGESS (SEQ W NO: 50) AD AD GSSESGSSEGGP (SEQ Ш NO: 51) GSSESGSSEGGP (SEQ W NO: 51) AD AD GSGGEPSESGSS (SEQ Ш NO: 52) GSGGEPSESGSS (SEQ W NO: 52) АЕ, АМ AE, AM GSPAGSPTSTEE (SEQ Ш NO: 53) GSPAGSPTSTEE (SEQ W NO: 53) AE, AM, AQ AE, AM, AQ GSEPATSGSETP (SEQ Ш NO: 54) GSEPATSGSETP (SEQ W NO: 54) АЕ, AM, AQ AE, AM, AQ GTSESATPESGP (SEQ Ш NO: 55) GTSESATPESGP (SEQ W NO: 55) AE, AM, AQ AE, AM, AQ GTSTEPSEGSAP (SEQ Ш NO: 56) GTSTEPSEGSAP (SEQ W NO: 56) AF, АМ AF, AM GSTSESPSGTAP (SEQ ГО NO: 57) GSTSESPSGTAP (SEQ ID NO: 57) AF, АМ AF, AM GTSTPESGSASP (SEQ ГО NO: 58) GTSTPESGSASP (SEQ GO NO: 58) AF, АМ AF, AM GTSPSGESSTAP (SEQ ГО NO: 59) GTSPSGESTAP (SEQ GO NO: 59) AF, АМ AF, AM GSTSSTAESPGP (SEQ ГО NO: 60) GSTSSTAESPGP (SEQ GO NO: 60) AG, АМ AG, AM GTPGSGTASSSP (SEQ ГО NO: 61) GTPGSGTASSSP (SEQ GO NO: 61) AG, АМ AG, AM GSSTPSGATGSP (SEQ ГО NO: 62) GSSTPSGATGSP (SEQ GD NO: 62) AG, АМ AG, AM GSSPSASTGTGP (SEQ ГО NO: 63) GSSPSASTGTGP (SEQ GO NO: 63) AG, АМ AG, AM GASPGTSSTGSP (SEQ ГО NO: 64) GASPGTSSTGSP (SEQ GO NO: 64) AQ AQ GEPAGSPTSTSE (SEQ ГО NO: 65) GEPAGSPTSTSE (SEQ GO NO: 65) AQ AQ GTGEPSSTPASE (SEQ ГО NO: 66) GTGEPSSTPASE (SEQ ID NO: 66) AQ AQ GSGPSTESAPTE (SEQ ГО NO: 67) GSGPSTESAPTE (SEQ GO NO: 67) AQ AQ GSETPSGPSETA (SEQ ГО NO: 68) GSETPSGPSETA (SEQ GO NO: 68) AQ AQ GPSETSTSEPGA (SEQ ГО NO: 69) GPSETSTSEPGA (SEQ ID NO: 69) AQ AQ GSPSEPTEGTSA (SEQ ГО NO: 70) GSPSEPTEGTSA (SEQ ID NO: 70) ВС sun GSGASEPTSTEP (SEQ ГО NO: 71) GSGASEPTSTEP (SEQ ID NO: 71) ВС sun GSEPATSGTEPS (SEQ ГО NO: 72) GSEPATSGTEPS (SEQ GD NO: 72) ВС sun GTSEPSTSEPGA (SEQ ГО NO: 73) GTSEPSTSEPGA (SEQ ID NO: 73) ВС sun GTSTEPSEPGSA (SEQ ГО NO: 74) GTSTEPSEPGSA (SEQ ID NO: 74) BD BD GSTAGSETSTEA (SEQ ГО NO: 75) GSTAGSETSTEA (SEQ GO NO: 75) BD BD GSETATSGSETA (SEQ ГО NO: 76) GSETATSGSETA (SEQ GO NO: 76) BD BD GTSESATSESGA (SEQ ГО NO: 77) GTSESATSESGA (SEQ GO NO: 77) BD BD GTSTEASEGSAS (SEQ ГО NO: 78) GTSTEASEGSAS (SEQ GO NO: 78)

- 34 041588- 34 041588

Обозначает последовательности индивидуальных мотивов, которые, при использовании вместе с различными перестановками, приводят к последовательности семейства XTEN могут также иметь различную длину для вставки в или связывания с FVIII или VWF, или любыми другими компонентами химерной молекулы. В одном варианте реализации изобретения длину последовательности (последовательностей) XTEN выбирают на основании свойства или функции, которые должны быть достигнуты у слитого белка. В зависимости от предполагаемого свойства или функции, XTEN может быть последовательностью короткой или промежуточной длины или более длинной последовательностью, которые могут служить носителями. В определенных вариантах реализации изобретения XTEN включает короткие сегменты, состоящие из от около 6 до около 99 аминокислотных остатков, с промежуточной длиной от около 100 до около 399 аминокислотных остатков, и с еще большими длинами от около 400 до около 1000 и до около 3000 аминокислотных остатков. Таким образом, XTEN, вставленный в или связанный с FVIII или VWF, может иметь длину около 6, около 12, около 36, около 40, около 42, около 72, около 96, около 144, около 288, около 400, около 500, около 576, около 600, около 700, около 800, около 864, около 900, около 1000, около 1500, около 2000, около 2500 или до около 3000 аминокислотных остатков. В других вариантах реализации изобретения последовательности XTEN имеют длину от около 6 до около 50, около от 50 до 100, около от 100 до 150, около от 150 до 250, около от 250 до 400, от около 400 до около 500, от около 500 до около 900, около от 900 до 1500, около от 1500 до 2000 или от около 2000 до около 3000 аминокислотных остатков. Точная длина XTEN, вставленного в или связанного с FVIII или VWF, может меняться без нежелательного влияния на активность FVIII или VWF. В одном варианте реализации изобретения один или более из XTEN, используемых в данном документе, имеет длину 36 аминокислот, 42 аминокислоты, 72 аминокислоты, 144 аминокислоты, 288 аминокислот, 576 аминокислот или 864 аминокислоты, и может быть выбран из одной или более из последовательностей семейства XTEN; т.е. AD, AE, AF, AG, AM, AQ, ВС или BD.Denotes individual motif sequences which, when used together with various permutations, result in XTEN family sequences may also be of various lengths for insertion into or association with FVIII or VWF, or any other components of the chimeric molecule. In one embodiment, the length of the XTEN sequence(s) is chosen based on the property or function to be achieved in the fusion protein. Depending on the intended property or function, XTEN may be a short or intermediate length sequence, or a longer sequence that can serve as carriers. In certain embodiments, XTEN includes short segments of about 6 to about 99 amino acid residues, with intermediate lengths of about 100 to about 399 amino acid residues, and even longer lengths of about 400 to about 1000 and up to about 3000 amino acid residues. . Thus, an XTEN inserted into or associated with a FVIII or VWF may be about 6, about 12, about 36, about 40, about 42, about 72, about 96, about 144, about 288, about 400, about 500, about 576, about 600, about 700, about 800, about 864, about 900, about 1000, about 1500, about 2000, about 2500 or up to about 3000 amino acid residues. In other embodiments, the XTEN sequences are about 6 to about 50, about 50 to 100, about 100 to 150, about 150 to 250, about 250 to 400, about 400 to about 500, about 500 up to about 900, about 900 to 1500, about 1500 to 2000, or about 2000 to about 3000 amino acid residues. The exact length of the XTEN inserted into or associated with the FVIII or VWF may vary without undesirably affecting the activity of the FVIII or VWF. In one embodiment, one or more of the XTENs used herein are 36 amino acids, 42 amino acids, 72 amino acids, 144 amino acids, 288 amino acids, 576 amino acids, or 864 amino acids in length, and may be selected from one or more of the sequences in the family XTEN; those. AD, AE, AF, AG, AM, AQ, BC or BD.

В некоторых вариантах реализации изобретения последовательность XTEN, используемая в изобретении, является по меньшей мере на 60, 70, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 или 100% идентичной последовательности, выбранной из группы, состоящей из АЕ42, AG42, АЕ48, АМ48, АЕ72, AG72, АЕ108, AG108, АЕ144, AF144, AG144, АЕ180, AG180, АЕ216, AG216, АЕ252, AG252, АЕ288, AG288,In some embodiments, the XTEN sequence used in the invention is at least 60%, 70%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% or 100% sequence identical, selected from the group consisting of AE42, AG42, AE48, AM48, AE72, AG72, AE108, AG108, AE144, AF144, AG144, AE180, AG180, AE216, AG216, AE252, AG252, AE288, AG288,

АЕ324, AG324, АЕ360, AG360, АЕ396, AG396, АЕ432, AG432, АЕ468, AG468, АЕ504, AG504, AF504,AE324, AG324, AE360, AG360, AE396, AG396, AE432, AG432, AE468, AG468, AE504, AG504, AF504,

АЕ540, AG540, AF540, AD576, АЕ576, AF576, AG576, АЕ612, AG612, АЕ624, АЕ648, AG648, AG684,AE540, AG540, AF540, AD576, AE576, AF576, AG576, AE612, AG612, AE624, AE648, AG648, AG684,

АЕ720, AG720, АЕ756, AG756, АЕ792, AG792, АЕ828, AG828, AD836, АЕ864, AF864, AG864, АМ875,AE720, AG720, AE756, AG756, AE792, AG792, AE828, AG828, AD836, AE864, AF864, AG864, AM875,

АЕ912, АМ923, АМ1318, ВС864, BD864, АЕ948, АЕ1044, АЕ1140, АЕ1236, АЕ1332, АЕ1428, АЕ1524, АЕ1620, АЕ1716, АЕ1812, АЕ1908, АЕ2004А, AG948, AG1044, AG1140, AG1236, AG1332, AG1428, AG1524, AG1620, AG1716, AG1812, AG1908 и AG2004. См. US 2010-0239554 А1. В одном варианте реализации изобретения последовательность XTEN является по меньшей мере на 60, 70, 80, 90, 95, 96, 97, 98, 99 или 100% идентичной аминокислотной последовательности, выбранной из группы, состоящей из АЕ42, АЕ864, АЕ576, АЕ288, АЕ144, AG864, AG576, AG288, AG144 и любых их комбинаций. В другом варианте реализации изобретения последовательность XTEN выбирают из группы, состоящей из АЕ42, АЕ864, АЕ576, АЕ288, АЕ144, AG864, AG576, AG288, AG144 и любых их комбинаций. В конкретном варианте реализации изобретения последовательность XTEN представляет собой АЕ288. Аминокислотные последовательности для определенных последовательностей XTEN по изобретению приведены в табл. 2В.АЕ912, АМ923, АМ1318, ВС864, BD864, АЕ948, АЕ1044, АЕ1140, АЕ1236, АЕ1332, АЕ1428, АЕ1524, АЕ1620, АЕ1716, АЕ1812, АЕ1908, АЕ2004А, AG948, AG1044, AG1140, AG1236, AG1332, AG1428, AG1524, AG1620, AG1716, AG1812, AG1908 and AG2004. See US 2010-0239554 A1. In one embodiment, the XTEN sequence is at least 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99%, or 100% identical to an amino acid sequence selected from the group consisting of AE42, AE864, AE576, AE288, AE144, AG864, AG576, AG288, AG144 and any combination thereof. In another embodiment, the XTEN sequence is selected from the group consisting of AE42, AE864, AE576, AE288, AE144, AG864, AG576, AG288, AG144, and any combinations thereof. In a particular embodiment, the XTEN sequence is AE288. Amino acid sequences for certain XTEN sequences according to the invention are given in table. 2B.

- 35 041588- 35 041588

Таблица 2В. Последовательности XTENTable 2B. XTEN sequences

XTEN XTEN Аминокислотная последовательность Amino acid sequence АЕ42 SEQ ID NO: 39 AE42 SEQ ID NO: 39 GAPGSPAGSPTSTEEGTSESATPESGPGSEPATSGSETPASS GAPGSPAGSPTSTEEGTSESATPESGPGSEPATSGSETPASS АЕ72 SEQ ID NO: 40 AE72 SEQ ID NO: 40 GAP TSESATPESG PGSEPATSGS ETPGTSESAT PESGPGSEPA TSGSETPGTS ESATPESGPG TSTEPSEGSA PGASS GAP TSESATPESG PGSEPATSGS ETPGTSESAT PESGPGSEPA TSGSETPGTS ESATPESGPG TSTEPSEGSA PGASS AE144 SEQ ID NO: 41 AE144 SEQ ID NO: 41 GSEPATSGSETPGTSESATPESGPGSEPATSGSETPGSPAGSPTSTEEGTSTEPSEG SAPGSEPATSGSETPGSEPATSGSETPGSEPATSGSETPGTSTEPSEGSAPGTSESA PESGPGSEPATSGSETPGTSTEPSEGSAP GSEPATSGSETPGTSESATPESGPGSEPATSGSETPGSPAGSPTSTEEGTSTEPSEG SAPGSEPATSGSETPGSEPATSGSETPGSEPATSGSETPGTSTEPSEGSAPGTSESA PESGPGSEPATSGSETPGTSTEPSEGSAP AG144 SEQ ID NO: 42 AG144 SEQ ID NO: 42 GTPGSGTASSSPGSSTPSGATGSPGSSPSASTGTGPGSSPSASTGTGPGASPGTSST GSPGASPGTSSTGSPGSSTPSGATGSPGSSPSASTGTGPGASPGTSSTGSPGSSPSA STGTGPGTPGSGTASSSPGSSTPSGATGSP GTPGSGTASSSPGSSTPSGATGSPGSSPSASTGTGPGSSPSASTGTGPGASPGTSST GSPGASPGTSSTGSPGSSTPSGATGSPGSSPSASTGTGPGASPGTSSTGSPGSSPSA STGTGPGTPGSGTASSSPGSSTPSGATGSP AE288 SEQ ID NO: 43 AE288 SEQ ID NO: 43 GTSESATPESGPGSEPATSGSETPGTSESATPESGPGSEPATSGSETPGTSESATPESG PGTSTEPSEGSAPGSPAGSPTSTEEGTSESATPESGPGSEPATSGSETPGTSESATPES GPGSPAGSPTSTEEGSPAGSPTSTEEGTSTEPSEGSAPGTSESATPESGPGTSESATPE SGPGTSESATPESGPGSEPATSGSETPGSEPATSGSETPGSPAGSPTSTEEGTSTEPSE GSAPGTSTEPSEGSAPGSEPATSGSETPGTSESATPESGPGTSTEPSEGSAP GTSESATPESGPGSEPATSGSETPGTSESATPESGPGSEPATSGSETPGTSESATPESG PGTSTEPSEGSAPGSPAGSPTSTEEGTSESATPESGPGSEPATSGSETPGTSESATPES GPGSPAGSPTSTEEGSPAGSPTSTEEGTSTEPSEGSAPGTSESATPESGPGTSESATPE SGPGTSESATPESGPGSEPATSGSETPGSEPATSGSETPGSPAGSPTSTEEGTSTEPSE GSAPGTSTEPSEGSAPGSEPATSGSETPGTSESATPESGPGTSTEPSEGSAP AG288 SEQ ID NO: 44 AG288 SEQ ID NO: 44 PGASPGTSSTGSPGASPGTSSTGSPGTPGSGTASSSPGSSTPSGATGSPGTPGSGTASS SPGSSTPSGATGSPGTPGSGTASSSPGSSTPSGATGSPGSSTPSGATGSPGSSPSASTG TGPGSSPSASTGTGPGASPGTSSTGSPGTPGSGTASSSPGSSTPSGATGSPGSSPSAST GTGPGSSPSASTGTGPGASPGTSSTGSPGASPGTSSTGSPGSSTPSGATGSPGSSPSAS TGTGPGASPGTSSTGSPGSSPSASTGTGPGTPGSGTASSSPGSSTPSGATGS PGASPGTSSTGSPGASPGTSSTGSPGTPGSGTASSSPGSSTPSGATGSPGTPGSGTASS SPGSSTPSGATGSPGTPGSGTASSSPGSSTPSGATGSPGSSTPSGATGSPGSSPSASTG TGPGSSPSASTGTGPGASPGTSSTGSPGTPGSGTASSSPGSSTPSGATGSPGSSPSAST GTGPGSSPSASTGTGPGASPGTSSTGSPGASPGTSSTGSPGSSTPSGATGSPGSSPSAS TGTGPGASPGTSSTGSPGSSPSASTGTGPGTPGSGTASSSPGSSTPSGATGS AE576 SEQ ID NO: 45 AE576 SEQ ID NO: 45 GSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSA PGTSTEPSEGSAPGTSESATPESGPGSEPATSGSETPGSEPATSGSETPGSPAGSPTST EEGTSESATPESGPGTSTEPSEGSAPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEG SAPGTSTEPSEGSAPGTSESATPESGPGTSTEPSEGSAPGTSESATPESGPGSEPATSG SETPGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGTSESATPESGPGSPAGSP TSTEEGTSESATPESGPGSEPATSGSETPGTSESATPESGPGTSTEPSEGSAPGTSTEP SEGSAPGTSTEPSEGSAPGTSTEPSEGSAPGTSTEPSEGSAPGTSTEPSEGSAPGSPAG SPTSTEEGTSTEPSEGSAPGTSESATPESGPGSEPATSGSETPGTSESATPESGPGSEP ATSGSETPGTSESATPESGPGTSTEPSEGSAPGTSESATPESGPGSPAGSPTSTEEGSP AGSPTSTEEGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAP GSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSA PGTSTEPSEGSAPGTSESATPESGPGSEPATSGSETPGSEPATSGSETPGSPAGSPTST EEGTSESATPESGPGTSTEPSEGSAPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEG SAPGTSTEPSEGSAPGTSESATPESGPGTSTEPSEGSAPGTSESATPESGPGSEPATSG SETPGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGTSESATPESGPGSPAGSP TSTEEGTSESATPESGPGSEPATSGSETPGTSESATPESGPGTSTEPSEGSAPGTSTEP SEGSAPGTSTEPSEGSAPGTSTEPSEGSAPGTSTEPSEGSAPGTSTEPSEGSAPGSPAG SPTSTEEGTSTEPSEGSAPGTSESATPESGPGSEPATSGSETPGTSESATPESGPGSEP ATSGSETPGTSESATPESGPGTSTEPSEGSAPGTSESATPESGPGSPAGSPTSTEEGSP AGSPTSTEEGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAP AG576 SEQ ID NO: 46 AG576 SEQ ID NO: 46 PGTPGSGTASSSPGSSTPSGATGSPGSSPSASTGTGPGSSPSASTGTGPGSSTPSGATG SPGSSTPSGATGSPGASPGTSSTGSPGASPGTSSTGSPGASPGTSSTGSPGTPGSGTAS SSPGASPGTSSTGSPGASPGTSSTGSPGASPGTSSTGSPGSSPSASTGTGPGTPGSGTA SSSPGASPGTSSTGSPGASPGTSSTGSPGASPGTSSTGSPGSSTPSGATGSPGSSTPSG ATGSPGASPGTSSTGSPGTPGSGTASSSPGSSTPSGATGSPGSSTPSGATGSPGSSTPS GATGSPGSSPSASTGTGPGASPGTSSTGSPGASPGTSSTGSPGTPGSGTASSSPGASPG TSSTGSPGASPGTSSTGSPGASPGTSSTGSPGASPGTSSTGSPGTPGSGTASSSPGSST PSGATGSPGTPGSGTASSSPGSSTPSGATGSPGTPGSGTASSSPGSSTPSGATGSPGSS TPSGATGSPGSSPSASTGTGPGSSPSASTGTGPGASPGTSSTGSPGTPGSGTASSSPGS PGTPGSGTASSSPGSSTPSGATGSPGSSPSASTGTGPGSSPSASTGTGPGSSTPSGATG SPGSSTPSGATGSPGASPGTSSTGSPGASPGTSSTGSPGASPGTSSTGSPGTPGSGTAS SSPGASPGTSSTGSPGASPGTSSTGSPGASPGTSSTGSPGSSPSASTGTGPGTPGSGTA SSSPGASPGTSSTGSPGASPGTSSTGSPGASPGTSSTGSPGSSTPSGATGSPGSSTPSG ATGSPGASPGTSSTGSPGTPGSGTASSSPGSSTPSGATGSPGSSTPSGATGSPGSSTPS GATGSPGSSPSASTGTGPGASPGTSSTGSPGASPGTSSTGSPGTPGSGTASSSPGASPG TSSTGSPGASPGTSSTGSPGASPGTSSTGSPGASPGTSSTGSPGTPGSGTASSSPGSST PSGATGSPGTPGSGTASSSPGSSTPSGATGSPGTPGSGTASSSPGSSTPSGATGSPGSS TPSGATGSPGSSPSASTGTGPGSSPSASTGTGPGASPGTSSTGSPGTPGSGTASSSPGS STPSGATGSPGSSPSASTGTGPGSSPSASTGTGPGASPGTSSTGS STPSGATGSPGSSPSASTGTGPGSSPSASTGTGPGASPGTSSTGS AE864 SEQ ID NO: 47 AE864 SEQ ID NO: 47 GSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSA PGTSTEPSEGSAPGTSESATPESGPGSEPATSGSETPGSEPATSGSETPGSPAGSPTST EEGTSESATPESGPGTSTEPSEGSAPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEG SAPGTSTEPSEGSAPGTSESATPESGPGTSTEPSEGSAPGTSESATPESGPGSEPATSG SETPGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGTSESATPESGPGSPAGSP TSTEEGTSESATPESGPGSEPATSGSETPGTSESATPESGPGTSTEPSEGSAPGTSTEP SEGSAPGTSTEPSEGSAPGTSTEPSEGSAPGTSTEPSEGSAPGTSTEPSEGSAPGSPAG SPTSTEEGTSTEPSEGSAPGTSESATPESGPGSEPATSGSETPGTSESATPESGPGSEP ATSGSETPGTSESATPESGPGTSTEPSEGSAPGTSESATPESGPGSPAGSPTSTEEGSP AGSPTSTEEGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGTSESATPESGPGS EPATSGSETPGTSESATPESGPGSEPATSGSETPGTSESATPESGPGTSTEPSEGSAPG SPAGSPTSTEEGTSESATPESGPGSEPATSGSETPGTSESATPESGPGSPAGSPTSTEE GSPAGSPTSTEEGTSTEPSEGSAPGTSESATPESGPGTSESATPESGPGTSESATPESG PGSEPATSGSETPGSEPATSGSETPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGS APGSEPATSGSETPGTSESATPESGPGTSTEPSEGSAP GSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSA PGTSTEPSEGSAPGTSESATPESGPGSEPATSGSETPGSEPATSGSETPGSPAGSPTST EEGTSESATPESGPGTSTEPSEGSAPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEG SAPGTSTEPSEGSAPGTSESATPESGPGTSTEPSEGSAPGTSESATPESGPGSEPATSG SETPGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGTSESATPESGPGSPAGSP TSTEEGTSESATPESGPGSEPATSGSETPGTSESATPESGPGTSTEPSEGSAPGTSTEP SEGSAPGTSTEPSEGSAPGTSTEPSEGSAPGTSTEPSEGSAPGTSTEPSEGSAPGSPAG SPTSTEEGTSTEPSEGSAPGTSESATPESGPGSEPATSGSETPGTSESATPESGPGSEP ATSGSETPGTSESATPESGPGTSTEPSEGSAPGTSESATPESGPGSPAGSPTSTEEGSP AGSPTSTEEGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGTSESATPESGPGS EPATSGSETPGTSESATPESGPGSEPATSGSETPGTSESATPESGPGTSTEPSEGSAPG SPAGSPTSTEEGTSESATPESGPGSEPATSGSETPGTSESATPESGPGSPAGSPTSTEE GSPAGSPTSTEEGTSTEPSEGSAPGTSESATPESGPGTSESATPESGPGTSESATPESG PGSEPATSGSETPGSEPATSGSETPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGS APGSEPATSGSETPGTSESATPESGPGTSTEPSEGSAP AG864 SEQ ID NO: 48 AG864 SEQ ID NO: 48 GASPGTSSTGSPGSSPSASTGTGPGSSPSASTGTGPGTPGSGTASSSPGSSTPSGATGS PGSSPSASTGTGPGASPGTSSTGSPGTPGSGTASSSPGSSTPSGATGSPGTPGSGTASS SPGASPGTSSTGSPGASPGTSSTGSPGTPGSGTASSSPGSSTPSGATGSPGASPGTSST GSPGTPGSGTASSSPGSSTPSGATGSPGSSPSASTGTGPGSSPSASTGTGPGSSTPSGA TGSPGSSTPSGATGSPGASPGTSSTGSPGASPGTSSTGSPGASPGTSSTGSPGTPGSGT ASSSPGASPGTSSTGSPGASPGTSSTGSPGASPGTSSTGSPGSSPSASTGTGPGTPGSG TASSSPGASPGTSSTGSPGASPGTSSTGSPGASPGTSSTGSPGSSTPSGATGSPGSSTP SGATGSPGASPGTSSTGSPGTPGSGTASSSPGSSTPSGATGSPGSSTPSGATGSPGSST PSGATGSPGSSPSASTGTGPGASPGTSSTGSPGASPGTSSTGSPGTPGSGTASSSPGAS PGTSSTGSPGASPGTSSTGSPGASPGTSSTGSPGASPGTSSTGSPGTPGSGTASSSPGS STPSGATGSPGTPGSGTASSSPGSSTPSGATGSPGTPGSGTASSSPGSSTPSGATGSPG SSTPSGATGSPGSSPSASTGTGPGSSPSASTGTGPGASPGTSSTGSPGTPGSGTASSSP GSSTPSGATGSPGSSPSASTGTGPGSSPSASTGTGPGASPGTSSTGSPGASPGTSSTGS PGSSTPSGATGSPGSSPSASTGTGPGASPGTSSTGSPGSSPSASTGTGPGTPGSGTASS SPGSSTPSGATGSPGSSTPSGATGSPGASPGTSSTGSP GASPGTSSTGSPGSSPSASTGTGPGSSPSASTGTGPGTPGSGTASSSPGSSTPSGATGS PGSSPSASTGTGPGASPGTSSTGSPGTPGSGTASSSPGSSTPSGATGSPGTPGSGTASS SPGASPGTSSTGSPGASPGTSSTGSPGTPGSGTASSSPGSSTPSGATGSPGASPGTSST GSPGTPGSGTASSSPGSSTPSGATGSPGSSPSASTGTGPGSSPSASTGTGPGSSTPSGA TGSPGSSTPSGATGSPGASPGTSSTGSPGASPGTSSTGSPGASPGTSSTGSPGTPGSGT ASSSPGASPGTSSTGSPGASPGTSSTGSPGASPGTSSTGSPGSSPSASTGTGPGTPGSG TASSSPGASPGTSSTGSPGASPGTSSTGSPGASPGTSSTGSPGSSTPSGATGSPGSSTP SGATGSPGASPGTSSTGSPGTPGSGTASSSPGSSTPSGATGSPGSSTPSGATGSPGSST PSGATGSPGSSPSASTGTGPGASPGTSSTGSPGASPGTSSTGSPGTPGSGTASSSPGAS PGTSSTGSPGASPGTSSTGSPGASPGTSSTGSPGASPGTSSTGSPGTPGSGTASSSPGS STPSGATGSPGTPGSGTASSSPGSSTPSGATGSPGTPGSGTASSSPGSSTPSGATGSPG SSTPSGATGSPGSSPSASTGTGPGSSPSASTGTGPGASPGTSSTGSPGTPGSGTASSSP GSSTPSGATGSPGSSPSASTGTGPGSSPSASTGTGPGASPGTSSTGSPGASPGTSSTGS PGSSTPSGATGSPGSSPSASTGTGPGASPGTSSTGSPGSSPSASTGTGPGTPGSGTASS SPGSSTPSGATGSPGSSTPSGATGSPGASPGTSSTGSP

- 36 041588- 36 041588

В тех вариантах реализации изобретения, где в используемом компоненте XTEN менее 100% аминокислот состоит из 4, 5 или 6 типов аминокислот, выбранных из глицина (G), аланина (А), серина (S), треонина (Т), глутамата (Е) и пролина (Р), или менее 100% последовательностей, состоящих из последовательностей мотивов из табл. 2А или последовательностей XTEN табл. 2В, а другие аминокислотные остатки XTEN выбраны из любых других 14 природных L-аминокислот, но предпочтительно выбраны из гидрофильных аминокислот таким образом, чтобы последовательность XTEN содержала по меньшей мере около 90, 91, 92, 93, 94, 95, 96, 97, 98% или по меньшей мере около 99% гидрофильных аминокислот. Аминокислоты XTEN, не являющиеся глицином (G), аланином (А), серином (S), треонином (Т), глутаматом (Е) и пролином (Р) или разбросаны по последовательности XTEN, или расположены внутри или между мотивами последовательностей, или сконцентрированы в одном или более коротких отрезках последовательности XTEN, например, для создания линкера между XTEN и другими компонентами; например белком VWF. В тех случаях, когда компонент XTEN содержит аминокислоты, отличные от глицина (G), аланина (А), серина (S), треонина (Т), глутамата (Е) и пролина (Р), предпочтительно менее чем около 2% или менее около 1% аминокислот являются гидрофобными остатками так, чтобы полученные последовательности в общем не имели вторичной структуры, например имели не более 2% альфаспиралей или 2% бета-листов, при определении способами, раскрытыми в данном документе. Гидрофобные остатки, являющиеся менее благоприятными для конструирования XTEN, включают триптофан, фенилаланин, тирозин, лейцин, изолейцин, валин и метионин. Дополнительно, можно спроектировать последовательности XTEN, которая содержит менее 5, или менее 4, или менее 3, или менее 2, или менее 1%, или вообще не содержит следующие аминокислоты: цистеин (чтобы избежать образования дисульфидных связей и окисления), метионин (во избежание окисления), аспарагин и глутамин (во избежание дезамидирования). Таким образом, в некоторых вариантах реализации изобретения XTEN, содержащий другие аминокислоты помимо глицина (G), аланина (А), серина (S), треонина (Т), глутамата (Е) и пролина (Р), имеет последовательность с менее чем 5% остатков, участвующих в образовании альфа-спиралей и бета-листов, при измерении по алгоритму Чоу-Фасмана, и на по меньшей мере 90%, или по меньшей мере около 95% или больше образуют случайный клубок, при измерении по алгоритму GOR.In those embodiments of the invention where less than 100% of the amino acids in the XTEN component used consist of 4, 5 or 6 types of amino acids selected from glycine (G), alanine (A), serine (S), threonine (T), glutamate (E ) and proline (P), or less than 100% of sequences consisting of sequences of motifs from the table. 2A or sequences XTEN table. 2B, and the other amino acid residues of XTEN are selected from any of the other 14 natural L-amino acids, but are preferably selected from hydrophilic amino acids such that the XTEN sequence contains at least about 90, 91, 92, 93, 94, 95, 96, 97, 98% or at least about 99% hydrophilic amino acids. XTEN amino acids other than glycine (G), alanine (A), serine (S), threonine (T), glutamate (E), and proline (P) are either scattered throughout the XTEN sequence, or located within or between sequence motifs, or concentrated in one or more short stretches of the XTEN sequence, for example, to create a linker between XTEN and other components; for example, the VWF protein. Where the XTEN component contains amino acids other than glycine (G), alanine (A), serine (S), threonine (T), glutamate (E), and proline (P), preferably less than about 2% or less about 1% of the amino acids are hydrophobic residues such that the resulting sequences generally have no secondary structure, eg, no more than 2% alpha helices or 2% beta sheets, as determined by the methods disclosed herein. Hydrophobic residues that are less favorable for XTEN construction include tryptophan, phenylalanine, tyrosine, leucine, isoleucine, valine, and methionine. Additionally, it is possible to design XTEN sequences that contain less than 5, or less than 4, or less than 3, or less than 2, or less than 1%, or none of the following amino acids: cysteine (to avoid disulfide bonding and oxidation), methionine (in to avoid oxidation), asparagine and glutamine (to avoid deamidation). Thus, in some embodiments, an XTEN containing amino acids other than glycine (G), alanine (A), serine (S), threonine (T), glutamate (E), and proline (P) has a sequence with less than 5 % of residues involved in the formation of alpha helices and beta sheets, when measured by the Chow-Fasman algorithm, and at least 90%, or at least about 95% or more form a random coil, when measured by the GOR algorithm.

В дополнительных вариантах реализации изобретения последовательность XTEN, используемая в изобретении, влияет на физическое или химическое свойство, например фармакокинетическу, химерного белка по настоящему изобретению. Последовательность XTEN, используемая в настоящем изобретении, может проявлять одно или более из следующих предпочтительных свойств: конформационная гибкость, повышенная растворимость в воде, высокая степень стойкости к протеазе, низкая иммуногенность, низкое связывание с рецепторами млекопитающего, или увеличенные гидродинамические (или стоксовы) радиусы. В конкретном варианте реализации изобретения последовательность XTEN, связанная с белком FVIII в данном изобретении улучшает фармакокинетические свойства, такие как более длительный период полувыведения в конечной фазе или увеличенная площадь под кривой (AUC), так чтобы химерный белок, описанный в данном документе, оставался in vivo в течение более длительного периода времени по сравнению с FVIII дикого типа. В дополнительных вариантах реализации изобретения последовательность XTEN, используемая в данном изобретении, улучшает фармакокинетические свойства, такие как более длительный период полувыведения в конечной фазе или увеличенная площадь под кривой (AUC), так чтобы белок FVIII оставался in vivo в течение более длительного периода времени по сравнению с FVIII дикого типа.In additional embodiments of the invention, the XTEN sequence used in the invention affects the physical or chemical property, for example pharmacokinetic, of the chimeric protein of the present invention. The XTEN sequence used in the present invention may exhibit one or more of the following preferred properties: conformational flexibility, increased water solubility, a high degree of protease resistance, low immunogenicity, low binding to mammalian receptors, or increased hydrodynamic (or Stokes) radii. In a particular embodiment, the XTEN sequence associated with the FVIII protein of this invention improves pharmacokinetic properties, such as longer terminal phase half-life or increased area under the curve (AUC), so that the chimeric protein described herein remains in vivo. over a longer period of time compared to wild-type FVIII. In additional embodiments, the XTEN sequence used in this invention improves pharmacokinetic properties, such as a longer terminal phase half-life or increased area under the curve (AUC), so that the FVIII protein remains in vivo for a longer period of time compared to with wild-type FVIII.

Различные способы и методы анализа могут применяться для определения физических/химических свойств белков, содержащих последовательность XTEN. Такие способы включают, без ограничений, аналитическое центрифугирование, ЭПР, ВЭЖХ-ионный обмен, ВЭЖХ-эксклюзионную хроматографию, ВЭЖХ-обращенная фаза, светорассеяние, капиллярный электрофорез, круговой дихроизм, дифференциальную сканирующую калориметрию, флуоресценцию, ВЭЖХ-ионный обмен, ВЭЖХ-эксклюзионную хроматографию, ИК, ЯМР, рамановскую спектроскопию, рефрактометрию и УФ/видимую спектроскопию. Дополнительные способы раскрыты в Amau et al, Prot Expr and Purif 48, 1-13 (2006).Various methods and methods of analysis can be used to determine the physical/chemical properties of proteins containing the XTEN sequence. Such methods include, without limitation, analytical centrifugation, EPR, HPLC ion exchange, HPLC size exclusion chromatography, HPLC reverse phase, light scattering, capillary electrophoresis, circular dichroism, differential scanning calorimetry, fluorescence, HPLC ion exchange, HPLC size exclusion chromatography. , IR, NMR, Raman spectroscopy, Refractometry and UV/Visible spectroscopy. Additional methods are disclosed in Amau et al, Prot Expr and Purif 48, 1-13 (2006).

Дополнительные примеры последовательностей XTEN, которые могут быть использованы в соответствии с настоящим изобретением, раскрыты в публикациях патентов США № 2010/0239554 А1, 2010/0323956 А1, 2011/0046060 А1, 2011/0046061 А1, 2011/0077199 А1 или 2011/0172146 А1, или международных патентных публикациях № WO 2010091122 Al, WO 2010144502 А2, WO 2010144508 Al, WO 2011028228 Al, WO 2011028229 Al, WO 2011028344 А2 или WO2013123457 А1, или международных заявках № PCT/US2013/049989.Additional examples of XTEN sequences that can be used in accordance with the present invention are disclosed in US Patent Publication Nos. , or international patent publications No. WO 2010091122 Al, WO 2010144502 A2, WO 2010144508 Al, WO 2011028228 Al, WO 2011028229 Al, WO 2011028344 A2 or WO2013123457 A1, or international applications No. PCT / US24913 / US24913.

И.С.5. Белок FVIII.I.S.5. FVIII protein.

Белок FVIII, в используемом в данном документе значении, означает функциональный полипептид FVIII в его нормальной роли в коагуляции, если не указано иное. Термин белок FVIII включает его функциональный фрагмент, вариант, аналог или производное, которые сохраняют функцию полноразмерного фактора VIII дикого типа в пути коагуляции. Белок FVIII используется взаимозаменяемо с полипептидом (или протеином) FVIII или FVIII. Примеры функций FVIII включают, без ограничений, способность активировать коагуляцию, способность выступать в роли кофактора для фактора IX, или способность образовывать теназный комплекс с фактором IX в присутствии Са2+ и фосфолипидов, кото- 37 041588 рый затем превращает фактор X в активированную форму Ха. Белок FVIII может быть человеческим, свиным, собачьим, крысиным или мышиным белком FVIII. Кроме того, сравнения между FVIII, полученным от людей и от других видов, позволили идентифицировать консервативные остатки, которые вероятно необходимы для обеспечения его функции (Cameron et al., Thromb. Haemost. 79:317-22 (1998);FVIII protein, as used herein, means a functional FVIII polypeptide in its normal role in coagulation, unless otherwise indicated. The term FVIII protein includes a functional fragment, variant, analog, or derivative thereof that retains the function of the full-length wild-type factor VIII in the coagulation pathway. The FVIII protein is used interchangeably with a FVIII or FVIII polypeptide (or protein). Examples of FVIII functions include, without limitation, the ability to activate coagulation, the ability to act as a cofactor for factor IX, or the ability to form a tenase complex with factor IX in the presence of Ca 2+ and phospholipids, which then converts factor X to the activated form Xa. . The FVIII protein can be human, porcine, canine, rat or mouse FVIII protein. In addition, comparisons between FVIII derived from humans and from other species have identified conserved residues that are likely required for its function (Cameron et al., Thromb. Haemost. 79:317-22 (1998);

US 6251632).US 6251632).

Имеется ряд тестов для оценки функции системы коагуляции: тест на активированное частичное тромбопластиновое время (АЧТВ), хромогенный анализ, анализ методом ротационной тромбоэластометрии (ROTEM), тест на протромбиновое время (РТ) (также используемый для определения INR), тестирование на фибриноген (часто по методу Клауса), подсчет тромбоцитов, тестирование функции тромбоцитов (часто методом PFA-100), ТСТ, время кровотечения, тест на смешение (исправляется ли аномалия, если плазму пациента смешивают с нормальной плазмой), анализы коагулирующего фактора, антифосфолипидные антитела, D-димер, генетические тесты (например, фактор V Лейдена, мутация протромбина G20210A), время разбавленного яда гадюки Рассела (dRWT), различные тесты функции тромбоцитов, тромбоэластография (ТЭГ или Sonoclot), тромбоэластометрия (ТЭМ®, например, ROTEM®), или эуглобулиновое время лизиса (ELT).A number of tests are available to evaluate the function of the coagulation system: activated partial thromboplastin time (APTT) test, chromogenic test, rotational thromboelastometry (ROTEM) test, prothrombin time (PT) test (also used to determine INR), fibrinogen test (often Claus method), platelet count, platelet function testing (often PFA-100), TCT, bleeding time, mixing test (is the abnormality corrected if the patient's plasma is mixed with normal plasma), coagulation factor tests, antiphospholipid antibodies, D- dimer, genetic tests (eg, factor V Leiden, prothrombin G20210A mutation), dilute Russell's viper venom time (dRWT), various platelet function tests, thromboelastography (TEG or Sonoclot), thromboelastometry (TEM®, such as ROTEM®), or euglobulin lysis time (ELT).

Тест АЧТВ представляет собой показатель эффективности, измеряющий эффективность как внутреннего (также называемого контактным путем активации), так и общего путей коагуляции. Этот тест обычно используется для измерения активности свертывания коммерчески доступных рекомбинантных факторов свертывания крови, например FVIII или FIX. Он используется в сочетании с протромбиновым временем (РТ), которое измеряет внешний путь.The APTT test is a performance indicator that measures the effectiveness of both the intrinsic (also called contact activation pathway) and general coagulation pathways. This test is commonly used to measure the clotting activity of commercially available recombinant blood clotting factors such as FVIII or FIX. It is used in conjunction with prothrombin time (PT), which measures the extrinsic pathway.

Анализ ROTEM дает информацию о кинетике гемостаза в целом: время свертывания, образование сгустка, стабильность сгустка и лизис. Разные параметры в тромбоэластометрии зависят от активности системы плазматической коагуляции, функции тромбоцитов, фибринолиза или большого количества факторов, влияющих на эти взаимодействия. Этот анализ может обеспечить целостную картину вторичного гемостаза. Полипептид FVIII и полинуклеотидные последовательности известны, как и многие функциональные фрагменты, мутанты и модифицированные варианты. Примеры человеческих последовательностей FVIII (полноразмерных) приведены как субпоследовательности в SEQ ID NO: 16 или 18.The ROTEM analysis provides information on the kinetics of hemostasis in general: clotting time, clot formation, clot stability and lysis. Various parameters in thromboelastometry depend on the activity of the plasma coagulation system, platelet function, fibrinolysis, or a large number of factors that influence these interactions. This analysis can provide a holistic picture of secondary hemostasis. The FVIII polypeptide and polynucleotide sequences are known, as are many functional fragments, mutants and modified variants. Examples of human FVIII sequences (full length) are shown as subsequences in SEQ ID NO: 16 or 18.

Таблица 3. Полноразмерный FVIII (сигнальный пептид FVIII подчеркнут;Table 3 Full-length FVIII (FVIII signal peptide underlined;

тяжелая цепь FVIII подчеркнута двойной линией; В-домен выделен наклонным шрифтом; и легкая цепь FVIII представлена обычным шрифтом) Сигнальный пептид: (SEQ ID NO: 15) MQIELSTCFFLCLLRFCFSthe heavy chain of FVIII is underlined with a double line; The B-domain is shown in italics; and FVIII light chain are shown in normal font) Signal peptide: (SEQ ID NO: 15) MQIELSTCFFLCLLRFCFS

Зрелый фактор VIII (SEQ ID NO: 16)*Mature factor VIII (SEQ ID NO: 16)*

ATRRYYLGAVELSWDYMQSDLGELPVDARFPPRVPKSFPFNTSWYKKTLFVEFTDHLFNIAKPRPPWMGLLGPTIQ AEVYDTWITLKNMASHPVSLHAVGVSYWKASEGAEYDDOTSOREKEDDKVFPGGSHTYVWQVLKENGPMASDPLCL TYSYLSHVDLVKDLNSGLIGALLVCREGSLAKEKTOTLHKFILLFAVFDEGKSWHSETKNSLMQDRDAASARAWPKM HTWGYWRSLPGLIGCHRKSVYWHVIGMGTTPEVHSIFLEGHTFLVRNHROASLEISPITFLTAOTLLMDLGQFLL FCHISSHQHDGMEAYVKVDSCPEEPQLRMKNNEEAEDYDDDLTDSEMDWRFDDDNSPSFIQIRSVAKKHPKTWVHY IAAEEEDWDYAPLVLAPDDRSYKSQYLNNGPQRIGRKYKKVRFMAYTDETFKTREAIQHESGILGPLLYGEVGDTLL IIFKNQASRPYNIYPHGITDVRPLYSRRLPKGVKHLKDFPILPGEIFKYKWTVTVEDGPTKSDPRCLTRYYSSFVNM ERDLASGLIGPLLICYKESVDORGNOIMSDKRNVILFSVFDENRSWYLTENIORFLPNPAGVOLEDPEFQASNIMHSATRRYYLGAVELSWDYMQSDLGELPVDARFPPRVPKSFPFNTSWYKKTLFVEFTDHLFNIAKPRPPWMGLLGPTIQ AEVYDTWITLKNMASHPVSLHAVGVSYWKASEGAEYDDOTSOREKEDDKVFPGGSHTYVWQVLKENGPMASDPLCL TYSYLSHVDLVKDLNSGLIGALLVCREGSLAKEKTOTLHKFILLFAVFDEGKSWHSETKNSLMQDRDAASARAWPKM HTWGYWRSLPGLIGCHRKSVYWHVIGMGTTPEVHSIFLEGHTFLVRNHROASLEISPITFLTAOTLLMDLGQFLL FCHISSHQHDGMEAYVKVDSCPEEPQLRMKNNEEAEDYDDDLTDSEMDWRFDDDNSPSFIQIRSVAKKHPKTWVHY IAAEEEDWDYAPLVLAPDDRSYKSQYLNNGPQRIGRKYKKVRFMAYTDETFKTREAIQHESGILGPLLYGEVGDTLL IIFKNQASRPYNIYPHGITDVRPLYSRRLPKGVKHLKDFPILPGEIFKYKWTVTVEDGPTKSDPRCLTRYYSSFVNM ERDLASGLIGPLLICYKESVDORGNOIMSDKRNVILFSVFDENRSWYLTENIORFLPNPAGVOLEDPEFQASNIMHS

- 38 041588- 38 041588

INGYVFDSLQLSVCLHEVAYWYILSIGAQTDFLSVFFSGYTFKHKMVYEDTLTLFPFSGETVFMSMENPGLWILGCH NSDFRNRGMTALLKVSSCDKNTGDYYEDSYEDISAYLLSKNNAIEPRSFSQTVSRHPSTRQKQFNATTIPENDIEKTD PWFAHRTPMPKIQNVSSSDLLMLLRQSPTPHGLSLSDLQEAKYETFSDDPSPGAIDSNNSLSEMTHFRPQLHHSGDM VFTPESGLQLRLNEKLGTTAATELKKLDFKVSSTSNNLISTIPSDNLAAGTDNTSSLGPPSMPVHYDSQLDTTLFGK KSSPLTESGGPLSLSEENNDSKLLESGLMNSQESSWGKNVSSTESGRLFKGKRAHGPALLTKDNALFKVSISLLKTN KTSNNSATNRKTHIDGPSLLIENSPSVWQNILESDTEFKKVTPLIHDRMLMDKNATALRLNHMSNKTTSSKNMEMVQ QKKEGPIPPDAQNPDMSFFKMLFLPESARWIQRTHGKNSLNSGQGPSPKQLVSLGPEKSVEGQNFLSEKNKWVGKG EFTKDVGLKEMVFPSSRNLFLTNLDNLHENNTHNQEKKIQEEIEKKETLIQENWLPQIHTVTGTKNFMKNLFLLST RQNVEGSYDGAYAPVLQDFRSLNDSTNRTKKHTAHFSKKGEEENLEGLGNQTKQIVEKYACTTRISPNTSQQNFVTQ RSKRALKQFRLPLEETELEKRIIVDDTSTQWSKNMKHLTPSTLTQIDYNEKEKGAITQSPLSDCLTRSHSIPQANRS PLPIAKVSSFPSIRPIYLTRVLFQDNSSHLPAASYRKKDSGVQESSHFLQGAKKNNLSLAILTLEMTGDQREVGSLG TSATNSVTYKKVENTVLPKPDLPKTSGKVELLPKVHIYQKDLFPTETSNGSPGHLDLVEGSLLQGTEGAIKWNEANR PGKVPFLRVATESSAKTPSKLLDPLAWDNHYGTQIPKEEWKSQEKSPEKTAFKKKDTILSLNACESNHAIAAINEGQ WRETEVWAA0GRFERI,CS0WPVI,ARH0REITRTTLQSDQEEIDYDDTISVEMKKEDFDIYDEDENQSPRSFQKK TRHYFIAAVERLWDYGMSSSPHVLRNRAQSGSVPQFKKWFQEFTDGSFTQPLYRGELNEHLGLLGPYIRAEVEDNI MVTFRNQASRPYSFYSSLISYEEDQRQGAEPRKNFVKPNETKTYFWKVQHHMAPTKDEFDCKAWAYFSDVDLEKDVH SGLIGPLLVCHTNTLNPAHGRQVTVQEFALFFTIFDETKSWYFTENMERNCRAPCNIQMEDPTFKENYRFHAINGYI MDTLPGLVMAQDQRIRWYLLSMGSNENIHSIHFSGHVFTVRKKEEYKMALYNLYPGVFETVEMLPSKAGIWRVECLI GEHLHAGMSTLFLVYSNKCQTPLGMASGHIRDFQITASGQYGQWAPKLARLHYSGSINAWSTKEPFSWIKVDLLAPM IIHGIKTQGARQKFSSLYISQFIIMYSLDGKKWQTYRGNSTGTLMVFFGNVDSSGIKHNIFNPPIIARYIRLHPTHY SIRSTLRMELMGCDLNSCSMPLGMESKAISDAQITASSYFTNMFATWSPSKARLHLQGRSNAWRPQVNNPKEWLQVD FQKTMKVTGVTTQGVKSLLTSMYVKEFLISSSQDGHQWTLFFQNGKVKVFQGNQDSFTPWNSLDPPLLTRYLRIHP QSWVHQIALRMEVLGCEAQDLYINGYVFDSLQLSVCLHEVAYWYILSIGAQTDFLSVFFSGYTFKHKMVYEDTLTLFPFSGETVFMSMENPGLWILGCH NSDFRNRGMTALLKVSSCDKNTGDYYEDSYEDISAYLLSKNNAIEPRSFSQTVSRHPSTRQKQFNATTIPENDIEKTD PWFAHRTPMPKIQNVSSSDLLMLLRQSPTPHGLSLSDLQEAKYETFSDDPSPGAIDSNNSLSEMTHFRPQLHHSGDM VFTPESGLQLRLNEKLGTTAATELKKLDFKVSSTSNNLISTIPSDNLAAGTDNTSSLGPPSMPVHYDSQLDTTLFGK KSSPLTESGGPLSLSEENNDSKLLESGLMNSQESSWGKNVSSTESGRLFKGKRAHGPALLTKDNALFKVSISLLKTN KTSNNSATNRKTHIDGPSLLIENSPSVWQNILESDTEFKKVTPLIHDRMLMDKNATALRLNHMSNKTTSSKNMEMVQ QKKEGPIPPDAQNPDMSFFKMLFLPESARWIQRTHGKNSLNSGQGPSPKQLVSLGPEKSVEGQNFLSEKNKWVGKG EFTKDVGLKEMVFPSSRNLFLTNLDNLHENNTHNQEKKIQEEIEKKETLIQENWLPQIHTVTGTKNFMKNLFLLST RQNVEGSYDGAYAPVLQDFRSLNDSTNRTKKHTAHFSKKGEEENLEGLGNQTKQIVEKYACTTRISPNTSQQNFVTQ RSKRALKQFRLPLEETELEKRIIVDDTSTQWSKNMKHLTPSTLTQIDYNEKEKGAITQSPLSDCLTRSHSIPQANRS PLPIAKVSSFPSIRPIYLTRVLFQDNSSHLPAASYRKKDSGVQESSHFLQGAKKNNLSLAILTLEMTGDQREVGSLG TSATNSVTYKKVENTVLPKPDLPKTSGKVELLPKVHIYQKDLFPTETSNGSPGHLDLVEGSLLQGTEGAIKWNEANR PGKVPFLRVATESSAKTPSKLLDPLAWDNHYGTQIPKEEWKSQEKSPEKTAFKKKDTILSLNACE SNHAIAAINEGQ WRETEVWAA0GRFERI,CS0WPVI,ARH0REITRTTLQSDQEEIDYDDTISVEMKKEDFDIYDEDENQSPRSFQKK TRHYFIAAVERLWDYGMSSSPHVLRNRAQSGSVPQFKKWFQEFTDGSFTQPLYRGELNEHLGLLGPYIRAEVEDNI MVTFRNQASRPYSFYSSLISYEEDQRQGAEPRKNFVKPNETKTYFWKVQHHMAPTKDEFDCKAWAYFSDVDLEKDVH SGLIGPLLVCHTNTLNPAHGRQVTVQEFALFFTIFDETKSWYFTENMERNCRAPCNIQMEDPTFKENYRFHAINGYI MDTLPGLVMAQDQRIRWYLLSMGSNENIHSIHFSGHVFTVRKKEEYKMALYNLYPGVFETVEMLPSKAGIWRVECLI GEHLHAGMSTLFLVYSNKCQTPLGMASGHIRDFQITASGQYGQWAPKLARLHYSGSINAWSTKEPFSWIKVDLLAPM IIHGIKTQGARQKFSSLYISQFIIMYSLDGKKWQTYRGNSTGTLMVFFGNVDSSGIKHNIFNPPIIARYIRLHPTHY SIRSTLRMELMGCDLNSCSMPLGMESKAISDAQITASSYFTNMFATWSPSKARLHLQGRSNAWRPQVNNPKEWLQVD FQKTMKVTGVTTQGVKSLLTSMYVKEFLISSSQDGHQWTLFFQNGKVKVFQGNQDSFTPWNSLDPPLLTRYLRIHP QSWVHQIALRMEVLGCEAQDLY

Таблица 4. Нуклеотидная последовательность, кодирующая полноразмерный FVIII (SEQ ID NO: 17)*Table 4. Nucleotide sequence encoding full-length FVIII (SEQ ID NO: 17)*

661 ATG CAAATAGAGC TCTCCACCTG661 ATG CAAATAGAGC TCTCCACCTG

721 CTTCTTTCTG TGCCTTTTGC GATTCTGCTT TAGTGCCACC AGAAGATACT ACCTGGGTGC721 CTTTCTTTCTG TGCCTTTTGC GATTCTGCTT TAGTGCCACC AGAAGATACT ACCTGGGTGC

781 AGTGGAACTG TCATGGGACT ATATGCAAAG TGATCTCGGT GAGCTGCCTG TGGACGCAAG781 AGTGGAACTG TCATGGGACT ATATGCAAAG TGATCTCGGT GAGCTGCCTG TGGACGCAAG

841 ATTTCCTCCT AGAGTGCCAA AATCTTTTCC ATTCAACACC TCAGTCGTGT ACAAAAAGAC841 ATTTCCTCCT AGAGTGCCAA AATCTTTTCC ATTCAACACC TCAGTCGTGT ACAAAAAGAC

901 TCTGTTTGTA GAATTCACGG ATCACCTTTT CAACATCGCT AAGCCAAGGC CACCCTGGAT901 TCTGTTTGTA GAATTCACGG ATCACCTTTT CAACATCGCT AAGCCAAGGC CACCCTGGAT

961 GGGTCTGCTA GGTCCTACCA TCCAGGCTGA GGTTTATGAT ACAGTGGTCA TTACACTTAA961 GGGTCTGCTA GGTCCTACCA TCCAGGCTGA GGTTTATGAT ACAGTGGTCA TTACACTTAA

1021 GAACATGGCT TCCCATCCTG TCAGTCTTCA TGCTGTTGGT GTATCCTACT GGAAAGCTTC1021 GAACATGGCT TCCCATCCTG TCAGTCTTCA TGCTGTTGGT GTATCCTACT GGAAAGCTTC

1081 TGAGGGAGCT GAATATGATG ATCAGACCAG TCAAAGGGAG AAAGAAGATG ATAAAGTCTT1081 TGAGGGAGCT GAATATGATG ATCAGACCAG TCAAAGGGAG AAAGAAGATG ATAAAGTCTT

1141 CCCTGGTGGA AGCCATACAT ATGTCTGGCA GGTCCTGAAA GAGAATGGTC CAATGGCCTC1141 CCCTGGTGGA AGCCATACAT ATGTCTGGCA GGTCCTGAAA GAGAATGGTC CAATGGCCTC

1201 TGACCCACTG TGCCTTACCT ACTCATATCT TTCTCATGTG GACCTGGTAA AAGACTTGAA1201 TGACCCACTG TGCCTTACCT ACTCATATCT TTCTCATGTG GACCTGGTAA AAGACTTGAA

1261 TTCAGGCCTC ATTGGAGCCC TACTAGTATG TAGAGAAGGG AGTCTGGCCA AGGAAAAGAC1261 TTCAGGCCTC ATTGGAGCCC TACTAGTATG TAGAGAAGGG AGTCTGGCCA AGGAAAAGAC

1321 ACAGACCTTG CACAAATTTA TACTACTTTT TGCTGTATTT GATGAAGGGA AAAGTTGGCA1321 ACAGACCTTG CACAAATTTA TACTACTTTTT TGCTGTATTT GATGAAGGGA AAAGTTGGCA

1381 CTCAGAAACA AAGAACTCCT TGATGCAGGA TAGGGATGCT GCATCTGCTC GGGCCTGGCC1381 CTCAGAAACA AAGAACTCCT TGATGCAGGA TAGGGATGCT GCATCTGCTC GGGCCTGGCC

1441 TAAAATGCAC ACAGTCAATG GTTATGTAAA CAGGTCTCTG CCAGGTCTGA TTGGATGCCA1441 TAAAATGCAC ACAGTCAATG GTTATGTAAA CAGGTCTCTG CCAGGTCTGA TTGGATTGCCA

1501 CAGGAAATCA GTCTATTGGC ATGTGATTGG AATGGGCACC ACTCCTGAAG TGCACTCAAT1501 CAGGAAATCA GTCTATTGGC ATGTGATTGG AATGGGCACC ACTCCTGAAG TGCACTCAAT

1561 ATTCCTCGAA GGTCACACAT TTCTTGTGAG GAACCATCGC CAGGCGTCCT TGGAAATCTC1561 ATTCCTCGAA GGTCACACAT TTCTTGTGAG GAACCATCGC CAGGCGTCCT TGGAAATCTC

1621 GCCAATAACT TTCCTTACTG CTCAAACACT CTTGATGGAC CTTGGACAGT TTCTACTGTT1621 GCCAATAACT TTCCTTACTG CTCAAACACT CTTGATGGAC CTTGGACAGT TTCTACTGTT

1681 TTGTCATATC TCTTCCCACC AACATGATGG CATGGAAGCT TATGTCAAAG TAGACAGCTG1681 TTGTCATATC TCTTCCCACC AACATGATGG CATGGAAGCT TATGTCAAAG TAGACAGCTG

1741 TCCAGAGGAA CCCCAACTAC GAATGAAAAA TAATGAAGAA GCGGAAGACT ATGATGATGA1741 TCCAGAGGAA CCCCAACTAC GAATGAAAAA TAATGAAGAA GCGGAAGACT ATGATGATGA

1801 TCTTACTGAT TCTGAAATGG ATGTGGTCAG GTTTGATGAT GACAACTCTC CTTCCTTTAT1801 TCTTACTGAT TCTGAAATGG ATGTGGTCAG GTTTGATGAT GACAACTCTC CTTCCTTTAT

1861 CCAAATTCGC TCAGTTGCCA AGAAGCATCC TAAAACTTGG GTACATTACA TTGCTGCTGA1861 CCAAATTCGC TCAGTTGCCA AGAAGCATCC TAAAACTTGG GTACATTACA TTGCTGCTGA

1921 AGAGGAGGAC TGGGACTATG CTCCCTTAGT CCTCGCCCCC GATGACAGAA GTTATAAAAG1921 AGAGGAGGAC TGGGACTATG CTCCCTTAGT CCTCGCCCCC GATGACAGAA GTTATAAAAG

1981 TCAATATTTG AACAATGGCC CTCAGCGGAT TGGTAGGAAG TACAAAAAAG TCCGATTTAT1981 TCAATATTTG AACAATGGCC CTCAGCGGAT TGGTAGGAAG TACAAAAAAG TCCGATTTAT

2041 GGCATACACA GATGAAACCT TTAAGACTCG TGAAGCTATT CAGCATGAAT CAGGAATCTT2041 GGCATACACA GATGAAACCT TTAAGACTCG TGAAGCTATT CAGCATGAAT CAGGAATCTT

2101 GGGACCTTTA CTTTATGGGG AAGTTGGAGA CACACTGTTG ATTATATTTA AGAATCAAGC2101 GGGACCTTTA CTTTATGGGG AAGTTGGAGA CACACTGTTG ATTATATTTA AGAATCAAGC

2161 AAGCAGACCA TATAACATCT ACCCTCACGG AATCACTGAT GTCCGTCCTT TGTATTCAAG2161 AAGCAGACCA TATAACATCT ACCCTCACGG AATCACTGAT GTCCGTCCTT TGTATTCAAG

- 39 041588- 39 041588

2221 GAGATTACCA AAAGGTGTAA AACATTTGAA GGATTTTCCA ATTCTGCCAG GAGAAATATT 2281 CAAATATAAA TGGACAGTGA CTGTAGAAGA TGGGCCAACT AAATCAGATC CTCGGTGCCT 2341 GACCCGCTAT TACTCTAGTT TCGTTAATAT GGAGAGAGAT CTAGCTTCAG GACTCATTGG 2401 CCCTCTCCTC ATCTGCTACA AAGAATCTGT AGATCAAAGA GGAAACCAGA TAATGTCAGA 2461 CAAGAGGAAT GTCATCCTGT TTTCTGTATT TGATGAGAAC CGAAGCTGGT ACCTCACAGA 2521 GAATATACAA CGCTTTCTCC CCAATCCAGC TGGAGTGCAG CTTGAGGATC CAGAGTTCCA 2581 AGCCTCCAAC ATCATGCACA GCATCAATGG CTATGTTTTT GATAGTTTGC AGTTGTCAGT 2641 TTGTTTGCAT GAGGTGGCAT ACTGGTACAT TCTAAGCATT GGAGCACAGA CTGACTTCCT 2701 TTCTGTCTTC TTCTCTGGAT ATACCTTCAA ACACAAAATG GTCTATGAAG ACACACTCAC 2761 CCTATTCCCA TTCTCAGGAG AAACTGTCTT CATGTCGATG GAAAACCCAG GTCTATGGAT 2821 TCTGGGGTGC CACAACTCAG ACTTTCGGAA CAGAGGCATG ACCGCCTTAC TGAAGGTTTC 2881 TAGTTGTGAC AAGAACACTG GTGATTATTA CGAGGACAGT TATGAAGATA TTTCAGCATA 2941 CTTGCTGAGT AAAAACAATG CCATTGAACC AAGAAGCTTC TCCCAGAATT CAAGACACCC 3001 TAGCACTAGG CAAAAGCAAT TTAATGCCAC CACAATTCCA GAAAATGACA TAGAGAAGAC 3061 TGACCCTTGG TTTGCACACA GAACACCTAT GCCTAAAATA CAAAATGTCT CCTCTAGTGA 3121 TTTGTTGATG CTCTTGCGAC AGAGTCCTAC TCCACATGGG CTATCCTTAT CTGATCTCCA 3181 AGAAGCCAAA TATGAGACTT TTTCTGATGA TCCATCACCT GGAGCAATAG ACAGTAATAA 3241 CAGCCTGTCT GAAATGACAC ACTTCAGGCC ACAGCTCCAT CACAGTGGGG ACATGGTATT 3301 TACCCCTGAG TCAGGCCTCC AATTAAGATT AAATGAGAAA CTGGGGACAA CTGCAGCAAC 3361 AGAGTTGAAG AAACTTGATT TCAAAGTTTC TAGTACATCA AATAATCTGA TTTCAACAAT 3421 TCCATCAGAC AATTTGGCAG CAGGTACTGA TAATACAAGT TCCTTAGGAC CCCCAAGTAT 3481 GCCAGTTCAT TATGATAGTC AATTAGATAC CACTCTATTT GGCAAAAAGT CATCTCCCCT 3541 TACTGAGTCT GGTGGACCTC TGAGCTTGAG TGAAGAAAAT AATGATTCAA AGTTGTTAGA 3601 ATCAGGTTTA ATGAATAGCC AAGAAAGTTC ATGGGGAAAA AATGTATCGT CAACAGAGAG 3661 TGGTAGGTTA TTTAAAGGGA AAAGAGCTCA TGGACCTGCT TTGTTGACTA AAGATAATGC 3721 CTTATTCAAA GTTAGCATCT CTTTGTTAAA GACAAACAAA ACTTCCAATA ATTCAGCAAC 3781 TAATAGAAAG ACTCACATTG ATGGCCCATC ATTATTAATT GAGAATAGTC CATCAGTCTG 3841 GCAAAATATA TTAGAAAGTG ACACTGAGTT TAAAAAAGTG ACACCTTTGA TTCATGACAG 3901 AATGCTTATG GACAAAAATG CTACAGCTTT GAGGCTAAAT CATATGTCAA ATAAAACTAC 3961 TTCATCAAAA AACATGGAAA TGGTCCAACA GAAAAAAGAG GGCCCCATTC CACCAGATGC 4021 ACAAAATCCA GATATGTCGT TCTTTAAGAT GCTATTCTTG CCAGAATCAG CAAGGTGGAT 4081 ACAAAGGACT CATGGAAAGA ACTCTCTGAA CTCTGGGCAA GGCCCCAGTC CAAAGCAATT 4141 AGTATCCTTA GGACCAGAAA AATCTGTGGA AGGTCAGAAT TTCTTGTCTG AGAAAAACAA 4201 AGTGGTAGTA GGAAAGGGTG AATTTACAAA GGACGTAGGA CTCAAAGAGA TGGTTTTTCC 4261 AAGCAGCAGA AACCTATTTC TTACTAACTT GGATAATTTA CATGAAAATA ATACACACAA 4321 TCAAGAAAAA AAAATTCAGG AAGAAATAGA AAAGAAGGAA ACATTAATCC AAGAGAATGT 4381 AGTTTTGCCT CAGATACATA CAGTGACTGG CACTAAGAAT TTCATGAAGA ACCTTTTCTT 4441 ACTGAGCACT AGGCAAAATG TAGAAGGTTC ATATGACGGG GCATATGCTC CAGTACTTCA 4501 AGATTTTAGG TCATTAAATG ATTCAACAAA TAGAACAAAG AAACACACAG CTCATTTCTC 4561 AAAAAAAGGG GAGGAAGAAA ACTTGGAAGG CTTGGGAAAT CAAACCAAGC AAATTGTAGA 4621 GAAATATGCA TGCACCACAA GGATATCTCC TAATACAAGC CAGCAGAATT TTGTCACGCA 4681 ACGTAGTAAG AGAGCTTTGA AACAATTCAG ACTCCCACTA GAAGAAACAG AACTTGAAAA 4741 AAGGATAATT GTGGATGACA CCTCAACCCA GTGGTCCAAA AACATGAAAC ATTTGACCCC 4801 GAGCACCCTC ACACAGATAG ACTACAATGA GAAGGAGAAA GGGGCCATTA CTCAGTCTCC 4861 CTTATCAGAT TGCCTTACGA GGAGTCATAG CATCCCTCAA GCAAATAGAT CTCCATTACC 4921 CATTGCAAAG GTATCATCAT TTCCATCTAT TAGACCTATA TATCTGACCA GGGTCCTATT 4981 CCAAGACAAC TCTTCTCATC TTCCAGCAGC ATCTTATAGA AAGAAAGATT CTGGGGTCCA 5041 AGAAAGCAGT CATTTCTTAC AAGGAGCCAA AAAAAATAAC CTTTCTTTAG CCATTCTAAC 5101 CTTGGAGATG ACTGGTGATC AAAGAGAGGT TGGCTCCCTG GGGACAAGTG CCACAAATTC 5161 AGTCACATAC AAGAAAGTTG AGAACACTGT TCTCCCGAAA CCAGACTTGC CCAAAACATC 5221 TGGCAAAGTT GAATTGCTTC CAAAAGTTCA CATTTATCAG AAGGACCTAT TCCCTACGGA 5281 AACTAGCAAT GGGTCTCCTG GCCATCTGGA TCTCGTGGAA GGGAGCCTTC TTCAGGGAAC 5341 AGAGGGAGCG ATTAAGTGGA ATGAAGCAAA CAGACCTGGA AAAGTTCCCT TTCTGAGAGT 5401 AGCAACAGAA AGCTCTGCAA AGACTCCCTC CAAGCTATTG GATCCTCTTG CTTGGGATAA 5461 CCACTATGGT ACTCAGATAC CAAAAGAAGA GTGGAAATCC CAAGAGAAGT CACCAGAAAA 5521 AACAGCTTTT AAGAAAAAGG ATACCATTTT GTCCCTGAAC GCTTGTGAAA GCAATCATGC 5581 AATAGCAGCA ATAAATGAGG GACAAAATAA GCCCGAAATA GAAGTCACCT GGGCAAAGCA 5641 AGGTAGGACT GAAAGGCTGT GCTCTCAAAA CCCACCAGTC TTGAAACGCC ATCAACGGGA 5701 AATAACTCGT ACTACTCTTC AGTCAGATCA AGAGGAAATT GACTATGATG ATACCATATC 5761 AGTTGAAATG AAGAAGGAAG ATTTTGACAT TTATGATGAG GATGAAAATC AGAGCCCCCG 5821 CAGCTTTCAA AAGAAAACAC GACACTATTT TATTGCTGCA GTGGAGAGGC TCTGGGATTA 5881 TGGGATGAGT AGCTCCCCAC ATGTTCTAAG AAACAGGGCT CAGAGTGGCA GTGTCCCTCA 5941 GTTCAAGAAA GTTGTTTTCC AGGAATTTAC TGATGGCTCC TTTACTCAGC CCTTATACCG 6001 TGGAGAACTA AATGAACATT TGGGACTCCT GGGGCCATAT ATAAGAGCAG AAGTTGAAGA2221 GAGATTACCA AAAGGTGTAA AACATTTGAA GGATTTTCCA ATTCTGCCAG GAGAAATATT 2281 CAAATATAAA TGGACAGTGA CTGTAGAAGA TGGGCCAACT AAATCAGATC CTCGGTGCCT 2341 GACCCGCTAT TACTCTAGTT TCGTTAATAT GGAGAGAGAT CTAGCTTCAG GACTCATTGG 2401 CCCTCTCCTC ATCTGCTACA AAGAATCTGT AGATCAAAGA GGAAACCAGA TAATGTCAGA 2461 CAAGAGGAAT GTCATCCTGT TTTCTGTATT TGATGAGAAC CGAAGCTGGT ACCTCACAGA 2521 GAATATACAA CGCTTTCTCC CCAATCCAGC TGGAGTGCAG CTTGAGGATC CAGAGTTCCA 2581 AGCCTCCAAC ATCATGCACA GCATCAATGG CTATGTTTTT GATAGTTTGC AGTTGTCAGT 2641 TTGTTTGCAT GAGGTGGCAT ACTGGTACAT TCTAAGCATT GGAGCACAGA CTGACTTCCT 2701 TTCTGTCTTC TTCTCTGGAT ATACCTTCAA ACACAAAATG GTCTATGAAG ACACACTCAC 2761 CCTATTCCCA TTCTCAGGAG AAACTGTCTT CATGTCGATG GAAAACCCAG GTCTATGGAT 2821 TCTGGGGTGC CACAACTCAG ACTTTCGGAA CAGAGGCATG ACCGCCTTAC TGAAGGTTTC 2881 TAGTTGTGAC AAGAACACTG GTGATTATTA CGAGGACAGT TATGAAGATA TTTCAGCATA 2941 CTTGCTGAGT AAAAACAATG CCATTGAACC AAGAAGCTTC TCCCAGAATT CAAGACACCC 3001 TAGCACTAGG CAAAAGCAAT TTAATGCCAC CACAATTCCA GAAAATGACA TAGAGAAGAC 3061 T GACCCTTGG TTTGCACACA GAACACCTAT GCCTAAAATA CAAAATGTCT CCTCTAGTGA 3121 TTTGTTGATG CTCTTGCGAC AGAGTCCTAC TCCACATGGG CTATCCTTAT CTGATCTCCA 3181 AGAAGCCAAA TATGAGACTT TTTCTGATGA TCCATCACCT GGAGCAATAG ACAGTAATAA 3241 CAGCCTGTCT GAAATGACAC ACTTCAGGCC ACAGCTCCAT CACAGTGGGG ACATGGTATT 3301 TACCCCTGAG TCAGGCCTCC AATTAAGATT AAATGAGAAA CTGGGGACAA CTGCAGCAAC 3361 AGAGTTGAAG AAACTTGATT TCAAAGTTTC TAGTACATCA AATAATCTGA TTTCAACAAT 3421 TCCATCAGAC AATTTGGCAG CAGGTACTGA TAATACAAGT TCCTTAGGAC CCCCAAGTAT 3481 GCCAGTTCAT TATGATAGTC AATTAGATAC CACTCTATTT GGCAAAAAGT CATCTCCCCT 3541 TACTGAGTCT GGTGGACCTC TGAGCTTGAG TGAAGAAAAT AATGATTCAA AGTTGTTAGA 3601 ATCAGGTTTA ATGAATAGCC AAGAAAGTTC ATGGGGAAAA AATGTATCGT CAACAGAGAG 3661 TGGTAGGTTA TTTAAAGGGA AAAGAGCTCA TGGACCTGCT TTGTTGACTA AAGATAATGC 3721 CTTATTCAAA GTTAGCATCT CTTTGTTAAA GACAAACAAA ACTTCCAATA ATTCAGCAAC 3781 TAATAGAAAG ACTCACATTG ATGGCCCATC ATTATTAATT GAGAATAGTC CATCAGTCTG 3841 GCAAAATATA TTAGAAAGTG ACACTGAGTT TAAAAAAGTG ACACCTTTGA TTCATGACAG 3901 AATGCTT ATG GACAAAAATG CTACAGCTTT GAGGCTAAAT CATATGTCAA ATAAAACTAC 3961 TTCATCAAAA AACATGGAAA TGGTCCAACA GAAAAAAGAG GGCCCCATTC CACCAGATGC 4021 ACAAAATCCA GATATGTCGT TCTTTAAGAT GCTATTCTTG CCAGAATCAG CAAGGTGGAT 4081 ACAAAGGACT CATGGAAAGA ACTCTCTGAA CTCTGGGCAA GGCCCCAGTC CAAAGCAATT 4141 AGTATCCTTA GGACCAGAAA AATCTGTGGA AGGTCAGAAT TTCTTGTCTG AGAAAAACAA 4201 AGTGGTAGTA GGAAAGGGTG AATTTACAAA GGACGTAGGA CTCAAAGAGA TGGTTTTTCC 4261 AAGCAGCAGA AACCTATTTC TTACTAACTT GGATAATTTA CATGAAAATA ATACACACAA 4321 TCAAGAAAAA AAAATTCAGG AAGAAATAGA AAAGAAGGAA ACATTAATCC AAGAGAATGT 4381 AGTTTTGCCT CAGATACATA CAGTGACTGG CACTAAGAAT TTCATGAAGA ACCTTTTCTT 4441 ACTGAGCACT AGGCAAAATG TAGAAGGTTC ATATGACGGG GCATATGCTC CAGTACTTCA 4501 AGATTTTAGG TCATTAAATG ATTCAACAAA TAGAACAAAG AAACACACAG CTCATTTCTC 4561 AAAAAAAGGG GAGGAAGAAA ACTTGGAAGG CTTGGGAAAT CAAACCAAGC AAATTGTAGA 4621 GAAATATGCA TGCACCACAA GGATATCTCC TAATACAAGC CAGCAGAATT TTGTCACGCA 4681 ACGTAGTAAG AGAGCTTTGA AACAATTCAG ACTCCCACTA GAAGAAACAG AACTTGAAAA 4741 AAGGATAATT GT GGATGACA CCTCAACCCA GTGGTCCAAA AACATGAAAC ATTTGACCCC 4801 GAGCACCCTC ACACAGATAG ACTACAATGA GAAGGAGAAA GGGGCCATTA CTCAGTCTCC 4861 CTTATCAGAT TGCCTTACGA GGAGTCATAG CATCCCTCAA GCAAATAGAT CTCCATTACC 4921 CATTGCAAAG GTATCATCAT TTCCATCTAT TAGACCTATA TATCTGACCA GGGTCCTATT 4981 CCAAGACAAC TCTTCTCATC TTCCAGCAGC ATCTTATAGA AAGAAAGATT CTGGGGTCCA 5041 AGAAAGCAGT CATTTCTTAC AAGGAGCCAA AAAAAATAAC CTTTCTTTAG CCATTCTAAC 5101 CTTGGAGATG ACTGGTGATC AAAGAGAGGT TGGCTCCCTG GGGACAAGTG CCACAAATTC 5161 AGTCACATAC AAGAAAGTTG AGAACACTGT TCTCCCGAAA CCAGACTTGC CCAAAACATC 5221 TGGCAAAGTT GAATTGCTTC CAAAAGTTCA CATTTATCAG AAGGACCTAT TCCCTACGGA 5281 AACTAGCAAT GGGTCTCCTG GCCATCTGGA TCTCGTGGAA GGGAGCCTTC TTCAGGGAAC 5341 AGAGGGAGCG ATTAAGTGGA ATGAAGCAAA CAGACCTGGA AAAGTTCCCT TTCTGAGAGT 5401 AGCAACAGAA AGCTCTGCAA AGACTCCCTC CAAGCTATTG GATCCTCTTG CTTGGGATAA 5461 CCACTATGGT ACTCAGATAC CAAAAGAAGA GTGGAAATCC CAAGAGAAGT CACCAGAAAA 5521 AACAGCTTTT AAGAAAAAGG ATACCATTTT GTCCCTGAAC GCTTGTGAAA GCAATCATGC 5581 AATAGCAGCA ATAAATGA GG GACAAAATAA GCCCGAAATA GAAGTCACCT GGGCAAAGCA 5641 AGGTAGGACT GAAAGGCTGT GCTCTCAAAA CCCACCAGTC TTGAAACGCC ATCAACGGGA 5701 AATAACTCGT ACTACTCTTC AGTCAGATCA AGAGGAAATT GACTATGATG ATACCATATC 5761 AGTTGAAATG AAGAAGGAAG ATTTTGACAT TTATGATGAG GATGAAAATC AGAGCCCCCG 5821 CAGCTTTCAA AAGAAAACAC GACACTATTT TATTGCTGCA GTGGAGAGGC TCTGGGATTA 5881 TGGGATGAGT AGCTCCCCAC ATGTTCTAAG AAACAGGGCT CAGAGTGGCA GTGTCCCTCA 5941 GTTCAAGAAA GTTGTTTTCC AGGAATTTAC TGATGGCTCC TTTACTCAGC CCTTATACCG 6001 TGGAGAACTA AATGAACATT TGGGACTCCT GGGGCCATAT ATAAGAGCAG AAGTTGAAGA

- 40 041588- 40 041588

6061 TAATATCATG GTAACTTTCA GAAATCAGGC CTCTCGTCCC TATTCCTTCT ATTCTAGCCT6061 TAATATCATG GTAACTTTCA GAAATCAGGC CTCTCGTCCC TATTCCTTCT ATTCTAGCCT

6121 TATTTCTTAT GAGGAAGATC AGAGGCAAGG AGCAGAACCT AGAAAAAACT TTGTCAAGCC6121 TATTTCTTAT GAGGAAGATC AGAGGCAAGG AGCAGAACCT AGAAAAAACT TTGTCAAGCC

6181 TAATGAAACC AAAACTTACT TTTGGAAAGT GCAACATCAT ATGGCACCCA CTAAAGATGA6181 TAATGAAACC AAAACTTACT TTTGGAAAGT GCAACATCAT ATGGCACCCA CTAAAGATGA

6241 GTTTGACTGC AAAGCCTGGG CTTATTTCTC TGATGTTGAC CTGGAAAAAG ATGTGCACTC6241 GTTTGACTGC AAAGCCTGGG CTTATTTCTC TGATGTTGAC CTGGAAAAAG ATGTGCACTC

6301 AGGCCTGATT GGACCCCTTC TGGTCTGCCA CACTAACACA CTGAACCCTG CTCATGGGAG6301 AGGCCTGATT GGACCCCCTTC TGGTCTGCCA CACTAACACA CTGAACCCTG CTCATGGGAG

6361 ACAAGTGACA GTACAGGAAT TTGCTCTGTT TTTCACCATC TTTGATGAGA CCAAAAGCTG6361 ACAAGTGACA GTACAGGAAT TTGCTCTGTT TTTCACCATC TTTGATGAGA CCAAAAGCTG

6421 GTACTTCACT GAAAATATGG AAAGAAACTG CAGGGCTCCC TGCAATATCC AGATGGAAGA6421 GTACTTCACT GAAAATATGG AAAGAAACTG CAGGGCTCCC TGCAATATCC AGATGGAAGA

6481 TCCCACTTTT AAAGAGAATT ATCGCTTCCA TGCAATCAAT GGCTACATAA TGGATACACT6481 TCCCACTTTT AAAGAGAATT ATCGCTTCCA TGCAATCAAT GGCTACATAA TGGATACACT

6541 ACCTGGCTTA GTAATGGCTC AGGATCAAAG GATTCGATGG TATCTGCTCA GCATGGGCAG6541 ACCTGGCTTA GTAATGGCTC AGGATCAAAG GATTCGATGG TATCTGCTCA GCATGGGCAG

6601 CAATGAAAAC ATCCATTCTA TTCATTTCAG TGGACATGTG TTCACTGTAC GAAAAAAAGA6601 CAATGAAAAC ATCCATTCTA TTCATTTCAG TGGACATGTG TTCACTGTAC GAAAAAAAGA

6661 GGAGTATAAA ATGGCACTGT ACAATCTCTA TCCAGGTGTT TTTGAGACAG TGGAAATGTT6661 GGAGTATAAA ATGGCACTGT ACAATCTCTA TCCAGGTGTT TTTGAGACAG TGGAAATGTT

6721 ACCATCCAAA GCTGGAATTT GGCGGGTGGA ATGCCTTATT GGCGAGCATC TACATGCTGG6721 ACCATCCAAA GCTGGAATTT GGCGGGTGGA ATGCCTTATT GGCGAGCATC TACATGCTGG

6781 GATGAGCACA CTTTTTCTGG TGTACAGCAA TAAGTGTCAG ACTCCCCTGG GAATGGCTTC6781 GATGAGCACA CTTTTTCTGG TGTACAGCAA TAAGTGTCAG ACTCCCCTGG GAATGGCTTC

6841 TGGACACATT AGAGATTTTC AGATTACAGC TTCAGGACAA TATGGACAGT GGGCCCCAAA6841 TGGACACATT AGAGATTTTC AGATTACAGC TTCAGGACAA TATGGACAGT GGGCCCCAAA

6901 GCTGGCCAGA CTTCATTATT CCGGATCAAT CAATGCCTGG AGCACCAAGG AGCCCTTTTC6901 GCTGGCCAGA CTTCATTATT CCGGATCAAT CAATGCCTGG AGCACCAAGG AGCCCTTTTC

6961 TTGGATCAAG GTGGATCTGT TGGCACCAAT GATTATTCAC GGCATCAAGA CCCAGGGTGC6961 TTGGATCAAG GTGGATCTGT TGGCACCAAT GATTATTCAC GGCATCAAGA CCCAGGGTGC

7021 CCGTCAGAAG TTCTCCAGCC TCTACATCTC TCAGTTTATC ATCATGTATA GTCTTGATGG7021 CCGTCAGAAG TTCTCCAGCC TCTACATCTC TCAGTTTATC ATCATGTATA GTCTTGATGG

7081 GAAGAAGTGG CAGACTTATC GAGGAAATTC CACTGGAACC TTAATGGTCT TCTTTGGCAA7081 GAAGAAGTGG CAGACTTATC GAGGAAATTC CACTGGAACC TTAATGGTCT TCTTTGGCAA

7141 TGTGGATTCA TCTGGGATAA AACACAATAT TTTTAACCCT CCAATTATTG CTCGATACAT7141 TGTGGATTCA TCTGGGATAA AACACAATAT TTTTAACCCT CCAATTATTG CTCGATACAT

7201 CCGTTTGCAC CCAACTCATT ATAGCATTCG CAGCACTCTT CGCATGGAGT TGATGGGCTG7201 CCGTTTGCAC CCAACTCATT ATAGCATTCG CAGCACTCTT CGCATGGAGT TGATGGGCTG

7261 TGATTTAAAT AGTTGCAGCA TGCCATTGGG AATGGAGAGT AAAGCAATAT CAGATGCACA7261 TGATTTAAAT AGTTGCAGCA TGCCATTGGG AATGGAGAGT AAAGCAATAT CAGATGCACA

7321 GATTACTGCT TCATCCTACT TTACCAATAT GTTTGCCACC TGGTCTCCTT CAAAAGCTCG7321 GATTACTGCT TCATCCTACT TTACCAATAT GTTTGCCACC TGGTCTCCTT CAAAAGCTCG

7381 ACTTCACCTC CAAGGGAGGA GTAATGCCTG GAGACCTCAG GTGAATAATC CAAAAGAGTG7381 ACTTCACCTC CAAGGGAGGA GTAATGCCTG GAGACCTCAG GTGAATAATC CAAAAGAGTG

7441 GCTGCAAGTG GACTTCCAGA AGACAATGAA AGTCACAGGA GTAACTACTC AGGGAGTAAA7441 GCTGCAAGTG GACTTCCAGA AGACAATGAA AGTCACAGGA GTAACTACTC AGGGAGTAAA

7501 ATCTCTGCTT ACCAGCATGT ATGTGAAGGA GTTCCTCATC TCCAGCAGTC AAGATGGCCA7501 ATCTCTGCTT ACCAGCATGT ATGTGAAGGA GTTCCTCATC TCCAGCAGTC AAGATGGCCA

7561 TCAGTGGACT CTCTTTTTTC AGAATGGCAA AGTAAAGGTT TTTCAGGGAA ATCAAGACTC7561 TCAGTGGACT CTCTTTTTTC AGAAATGGCAA AGTAAAGGTT TTTCAGGGAA ATCAAGACTC

7621 CTTCACACCT GTGGTGAACT CTCTAGACCC ACCGTTACTG ACTCGCTACC TTCGAATTCA7621 CTTCACACCT GTGGTGAACT CTCTAGACCC ACCGTTACTG ACTCGCTACC TTCGAATTCA

7681 CCCCCAGAGT TGGGTGCACC AGATTGCCCT GAGGATGGAG GTTCTGGGCT GCGAGGCACA7681 CCCCCAGAGT TGGGTGCACC AGATTGCCCT GAGGATGGAG GTTCTGGGCT GCGAGGCACA

7741 GGACCTCTAC * подчеркнутые нуклеиновые кислоты кодируют сигнальный пептид.7741 GGACCTCTAC * Underlined nucleic acids encode a signal peptide.

Полипептиды FVIII включают полноразмерный FVIII, полноразмерный FVIII минус Met на Nконце, зрелый FVIII (минус сигнальная последовательность), зрелый FVIII с дополнительным Met на Nконце и/или FVIII с полной или частичной делецией В-домена. В определенных вариантах реализации изобретения варианты FVIII включают делеции В-домена, которые могут быть частичными или полными делециями.FVIII polypeptides include full-length FVIII, full-length FVIII minus the Met at the N-terminus, mature FVIII (minus the signal sequence), mature FVIII with an additional Met at the N-terminus, and/or FVIII with a complete or partial deletion of the B domain. In certain embodiments of the invention, FVIII variants include deletions of the B domain, which may be partial or complete deletions.

Человеческий ген FVIII был выделен и экспрессирован в клетках млекопитающих (Toole, J. J., et al., Nature 312:342-347 (1984); Gitschier, J., et al, Nature 312:326-330 (1984); Wood, W. I, et al, Nature 312:330337 (1984); Vehar, G. A., et al, Nature 312:337-342 (1984); WO 87/04187; WO 88/08035; WO 88/03558; и патент США № 4757006). Аминокислотная последовательность FVIII была определена по кДНК, как показано в патенте США № 4965199. Кроме того, FVIII с частичной или полной делецией В-домена представлена в патентах США № 4994371 и 4868112. В некоторых вариантах реализации изобретения Вдомен человеческого FVIII замещен на В-домен человеческого фактора V, как описано в патенте США № 5004803. Последовательность кДНК, кодирующая человеческий фактор VIII, и его аминокислотная последовательность приведены в SEQ ID NO: 1 и 2, соответственно, в патенте США № 7211559.The human FVIII gene has been isolated and expressed in mammalian cells (Toole, J. J., et al., Nature 312:342-347 (1984); Gitschier, J., et al, Nature 312:326-330 (1984); Wood, W I, et al, Nature 312:330337 (1984), Vehar, G. A., et al, Nature 312:337-342 (1984), WO 87/04187, WO 88/08035, WO 88/03558, and U.S. Patent No. 4757006). The amino acid sequence of FVIII was determined from cDNA as shown in US Pat. human factor V as described in US Pat.

Свинная последовательность FVIII опубликована в Toole, J. J., et al, Proc.Natl. Acad. Sci. USA 83:5939-5942 (1986). Дополнительно, полная последовательность свиной кДНК, полученной в результате ПЦР-амплификации последовательности FVIII из библиотеки кДНК свиной селезенки была описана у Healey, J. F., et al, Blood 88:4209-4214 (1996). Гибридный человеческий/свиной FVIII, имеющий замещения во всех доменах, всех субъединицах, и специфические аминокислотные последовательности были раскрыты в патенте США № 5364771, на имя Lollar и Runge, и в WO 93/20093. Недавно, нуклеотидные и соответствующие аминокислотные последовательности доменов А1 и А2 свиного FVIII и химерного FVIII со свинными доменами А1 и/или А2, замещающими соответствующие человеческие домены, были описаны в WO 94/11503. Патент США № 5859204, на имя Lollar, J. S., также раскрывает свиную кДНК и расшифрованные аминокислотные последовательности. Патент США № 6458563 раскрывает свиной FVIII с делецией В-домена.The porcine FVIII sequence is published in Toole, J. J., et al, Proc. Natl. Acad. sci. USA 83:5939-5942 (1986). Additionally, the complete sequence of porcine cDNA resulting from PCR amplification of the FVIII sequence from a porcine spleen cDNA library has been described in Healey, J. F., et al, Blood 88:4209-4214 (1996). Hybrid human/porcine FVIII having substitutions in all domains, all subunits, and specific amino acid sequences have been disclosed in US Pat. No. 5,364,771 to Lollar and Runge and in WO 93/20093. Recently, the nucleotide and corresponding amino acid sequences of the A1 and A2 domains of porcine FVIII and chimeric FVIII with porcine A1 and/or A2 domains replacing the corresponding human domains have been described in WO 94/11503. US Pat. No. 5,859,204 to Lollar, J. S. also discloses porcine cDNA and deduced amino acid sequences. US Pat. No. 6,458,563 discloses a porcine FVIII with a B domain deletion.

Патент США № 5859204, на имя Lollar, J. S., описывает функциональные мутанты FVIII, имеющие пониженную антигенность и пониженную иммунореактивность. Патент США № 6376463, на имя Lollar, J. S., также описывает мутанты FVIII, имеющие пониженную иммунореактивность. Публикация заявки США № 2005/0100990, на имя Saenko et al., описывает функциональные мутации в домене А2 FVIII. В одном варианте реализации изобретения белок FVIII (или относящаяся к FVIII часть химерного белка) может быть по меньшей мере на 50, 60, 70, 80, 90, 95, 96, 97, 98, 99 или 100% идентичным аминокислотной последовательности FVIII, представленной аминокислотами 1-1438 SEQ ID NO: 18 или аминокислотами 1-2332 SEQ ID NO: 16 (без сигнальной последовательности), причем FVIII обладает свертывающей активностью, например активирует фактор IX в качестве кофактора для превращения фактора X в активированный фактор X. FVIII (или относящаяся к FVIII часть химерного белка) может быть идентичным аминокислотной последовательности FVIII, представленной аминокислотами 1-1438 SEQ ID NO: 18 или аминокислотами 1-2332 SEQ ID NO: 16 (без сигнальной последовательности). Белок FVIII может дополнительно содержать сигнальную последовательность.US Pat. No. 5,859,204 to Lollar, J. S. describes functional FVIII mutants having reduced antigenicity and reduced immunoreactivity. US Pat. No. 6,376,463 to Lollar, J. S. also describes FVIII mutants having reduced immunoreactivity. US Publication No. 2005/0100990, to Saenko et al., describes functional mutations in the A2 domain of FVIII. In one embodiment, the FVIII protein (or FVIII-related portion of a chimeric protein) may be at least 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99%, or 100% identical to the FVIII amino acid sequence represented by amino acids 1-1438 of SEQ ID NO: 18 or amino acids 1-2332 of SEQ ID NO: 16 (no signal sequence), wherein FVIII has clotting activity, e.g., activates factor IX as a cofactor to convert factor X to activated factor X. FVIII (or the FVIII portion of the chimeric protein) may be identical to the FVIII amino acid sequence represented by amino acids 1-1438 of SEQ ID NO: 18 or amino acids 1-2332 of SEQ ID NO: 16 (no signal sequence). The FVIII protein may further comprise a signal sequence.

- 41 041588- 41 041588

В-домен FVIII, в используемом в данном документе значении, является таким же, как и В-домен, известный в данной области техники, определенный по идентичности внутренних аминокислотных последовательностей и сайтов протеолитического расщепления, например остатков Ser741-Arg1648 полноразмерного человеческого FVIII. Другие домены человеческого FVIII определяются по следующим аминокислотным остаткам: А1 - остатки Ala1-Arg372; A2 - остатки Ser373-Arg740; A3-остαтки Ser1690Asn2019; C1 - остатки Lys2020-Asn2172; C2 - остатки Ser2173-Tyr2332. Последовательность А3-С1-С2 включает остатки Ser1690-Tyr2332. Оставшаяся часть последовательности, остатки Glu1649-Arg1689, обычно называется кислотной областью а3. Положения границ всех доменов, включая В-домены, для свиной, мышиной и собачьей FVIII также известны в данной области техники. В одном варианте реализации изобретения В-домен FVIII делетирован (фактор VIII с делецией В-домена или BDD FVIII). Примером BDD FVIII является REFACTO® (рекомбинантный BDD FVIII), имеющий такую же последовательность, как и относящаяся к фактору VIII часть последовательности в табл. 5. (тяжелая цепь BDD FVIII подчеркнута двойной линией; В-домен выделен наклонным шрифтом; и легкая цепь BDD FVIII представлена обычным шрифтом).The B domain of FVIII, as used herein, is the same as the B domain known in the art, defined by the identity of internal amino acid sequences and proteolytic cleavage sites, eg Ser741-Arg1648 residues of full-length human FVIII. Other domains of human FVIII are defined by the following amino acid residues: A1 - Ala1-Arg372 residues; A2 - Ser373-Arg740 residues; A3 residues Ser1690Asn2019; C1 - Lys2020-Asn2172 residues; C2 - Ser2173-Tyr2332 residues. The A3-C1-C2 sequence includes Ser1690-Tyr2332 residues. The remainder of the sequence, residues Glu1649-Arg1689, is commonly referred to as the a3 acid region. The boundary positions of all domains, including B domains, for porcine, murine and canine FVIII are also known in the art. In one embodiment, the B domain of FVIII is deleted (factor VIII with deletion of the B domain or BDD of FVIII). An example of BDD FVIII is REFACTO® (recombinant BDD FVIII) having the same sequence as the factor VIII portion of the sequence in Table 1. 5. (BDD FVIII heavy chain underlined with a double line; B-domain in italics; and BDD FVIII light chain in regular type).

Таблица 5. BDD FVIII (SEQ ID NO: 18)Table 5. BDD FVIII (SEQ ID NO: 18)

ATRRYYLGAVELSWDYMQSDLGELPVDARFPPRVPKSFPFNTSWYKKTLFVEFTDHLFNIAKPRPPWMGLLGPTIQ AEVYDTWITL·KNMΆSHPVSL·HAVGVSYWKASEGAEYDDQTSQREKEDDKVFPGGSHTYVWQVL·KENGPMASDPL·CL· TYSYLSHVDLVKDLNSGLIGALLVCREGSLAKEKTOTLHKFILLFAVFDEGKSWHSETKNSLMQDRDAASARAWPKM HTVNGYVNRLHjPGLIGCHRKYjyYW^ FCHISSHQHDGMEAYVKVDSCPEEPQLRMKNNEEAEDYDDDLTDSEMDWRFDDDNSPSFIQIRSVAKKHPKTWVHY lAAEEEDWDYAPLVLAPDDRSYKSQYLNNGPQRIGRKYKKVRFMAYTDETFKTREAIQHESGILGPLLYGEVGDTLL IIFKNQASRPYNIYPHGITDVRPLYSRRLPKGVKHLKDFPILPGEIFKYKWTVTVEDGPTKSDPRCLTRYYSSFVNM ERDLASGLIGPLLICYKESVDORGNOIMSDKRNVILFSVFDENRSWYLTENIORFLPNPAGVOLEDPEFQASNIMHS INGYVFDSLOLSVCLHEVAYWYILSIGAQTDFLSVFFSGYTFKHKMVYEDTLTLFPFSGETVFMSMENPGLWILGCH NaDFRNRGMITU^LKySSCDKNTGDYYEDimLD^^ DDTISVEMKKEDFDIYDEDENQSPRSFQKKTRHYFIAAVERLWDYGMSSSPHVLRNRAQSGSVPQFKKWFQEFTDG SFTQPLYRGELNEHLGLLGPYIRAEVEDNIMVTFRNQASRPYSFYSSLISYEEDQRQGAEPRKNFVKPNETKTYFWK VQHHMAPTKDEFDCKAWAYFSDVDLEKDVHSGLIGPLLVCHTNTLNPAHGRQVTVQEFALFFTIFDETKSWYFTENM ERNCRAPCNIQMEDPTFKENYRFHAINGYIMDTLPGLVMAQDQRIRWYLLSMGSNENIHSIHFSGHVFTVRKKEEYK MALYNLYPGVFETVEMLPSKAGIWRVECLIGEHLHAGMSTLFLVYSNKCQTPLGMASGHIRDFQITASGQYGQWAPK LARLHYSGSINAWSTKEPFSWIKVDLLAPMIIHGIKTQGARQKFSSLYISQFIIMYSLDGKKWQTYRGNSTGTLMVF FGNVDSSGIKHNIFNPPIIARYIRLHPTHYSIRSTLRMELMGCDLNSCSMPLGMESKAISDAQITASSYFTNMFATW SPSKARLHLQGRSNAWRPQWNPKEWLQVDFQKTMKVTGVTTQGVKSLLTSMYVKEFLISSSQDGHQWTLFFQNGKV KVFQGNQDSFTPWNSLDPPLLTRYLRIHPQSWVHQIALRMEVLGCEAQDLYATRRYYLGAVELSWDYMQSDLGELPVDARFPPRVPKSFPFNTSWYKKTLFVEFTDHLFNIAKPRPPWMGLLGPTIQ AEVYDTWITL·KNMΆSHPVSL·HAVGVSYWKASEGAEYDDQTSQREKEDDKVFPGGSHTYVWQVL·KENGPMASDPL·CL· TYSYLSHVDLVKDLNSGLIGALLVCREGSLAKEKTOTLHKFILLFAVFDEGKSWHSETKNSLMQDRDAASARAWPKM HTVNGYVNRLHjPGLIGCHRKYjyYW^ FCHISSHQHDGMEAYVKVDSCPEEPQLRMKNNEEAEDYDDDLTDSEMDWRFDDDNSPSFIQIRSVAKKHPKTWVHY lAAEEEDWDYAPLVLAPDDRSYKSQYLNNGPQRIGRKYKKVRFMAYTDETFKTREAIQHESGILGPLLYGEVGDTLL IIFKNQASRPYNIYPHGITDVRPLYSRRLPKGVKHLKDFPILPGEIFKYKWTVTVEDGPTKSDPRCLTRYYSSFVNM ERDLASGLIGPLLICYKESVDORGNOIMSDKRNVILFSVFDENRSWYLTENIORFLPNPAGVOLEDPEFQASNIMHS INGYVFDSLOLSVCLHEVAYWYILSIGAQTDFLSVFFSGYTFKHKMVYEDTLTLFPFSGETVFMSMENPGLWILGCH NaDFRNRGMITU^LKySSCDKNTGDYYEDimLD^^ DDTISVEMKKEDFDIYDEDENQSPRSFQKKTRHYFIAAVERLWDYGMSSSPHVLRNRAQSGSVPQFKKWFQEFTDG SFTQPLYRGELNEHLGLLGPYIRAEVEDNIMVTFRNQASRPYSFYSSLISYEEDQRQGAEPRKNFVKPNETKTYFWK VQHHMAPTKDEFDCKAWAYFSDVDLEKDVHSGLIGPLLVCHTNTLNPAHGRQVTVQEFALFFTIFDETKSWYFTENM ERNCRAPCNIQMEDPTFKENYRFHAINGYIMDTLPGLVMAQDQRIRWYLLSMGSNENIHSIHFSGHVFTVRKKEEYK MALYNLYPGVFETVEMLPSKAGIWRVECLIGEHLHAGMSTLFLVYSNKCQTPLGMASGHIRDFQITASGQYGQWAPK LARLHYSGSINAWSTKEPFSWIKVDLLAPMIIHGIKTQGARQKFSSLYISQFIIMYSLDGKKWQTYRGNSTGTLMVF FGNVDSSGIKHNIFNPPIIARYIRLHPTHYSIRSTLRMELMGCDLNSCSMPLGMESKAISDAQITASSYFTNMFATW SPSKARLHLQGRSNAWRPQWNPKEWLQVDFQKTMKVTGVTTQGVKSLLTSMYVKEFLISSSQDGHQWTLFFQNGKV KVFQGNQDSFTPWNSLDPPLLTRYLRIHPQSWVHQIALRMEVLGCEAQDLY

Таблица 6. Нуклеотидная последовательность, кодирующая BDD FVIII (SEQ ID NO: 19)*Table 6. Nucleotide sequence encoding BDD FVIII (SEQ ID NO: 19)*

661 A TGCAAATAGA GCTCTCCACC TGCTTCTTTC661 A TGCAAATAGA GCTCTCCACC TGCTTCTTTC

721 TGTGCCTTTT GCGATTCTGC TTTAGTGCCA CCAGAAGATA CTACCTGGGT GCAGTGGAAC721 TGTGCCTTTT GCGATTCTGC TTTAGTGCCA CCAGAAGATA CTACCTGGGT GCAGTGGAAC

781 TGTCATGGGA CTATATGCAA AGTGATCTCG GTGAGCTGCC TGTGGACGCA AGATTTCCTC781 TGTCATGGGA CTATATGCAA AGTGATCTCG GTGAGCTGCC TGTGGACGCA AGATTTCCTC

841 CTAGAGTGCC AAAATCTTTT CCATTCAACA CCTCAGTCGT GTACAAAAAG ACTCTGTTTG841 CTAGAGTGCC AAAATCTTTT CCATTCAACA CCTCAGTCGT GTACAAAAAAG ACTCTGTTTG

901 TAGAATTCAC GGATCACCTT TTCAACATCG CTAAGCCAAG GCCACCCTGG ATGGGTCTGC901 TAGAATTCAC GGATCACCTT TTCAACATCG CTAAGCCAAG GCCACCCTGG ATGGGTCTGC

961 TAGGTCCTAC CATCCAGGCT GAGGTTTATG ATACAGTGGT CATTACACTT AAGAACATGG961 TAGGTCCTAC CATCCAGGCT GAGGTTTATG ATACAGTGGT CATTACACTT AAGAACATGG

1021 CTTCCCATCC TGTCAGTCTT CATGCTGTTG GTGTATCCTA CTGGAAAGCT TCTGAGGGAG1021 CTTCCCATCC TGTCAGTCTT CATGCTGTTG GTGTATCCTA CTGGAAAGCT TCTGAGGGAG

1081 CTGAATATGA TGATCAGACC AGTCAAAGGG AGAAAGAAGA TGATAAAGTC TTCCCTGGTG1081 CTGAATATGA TGATCAGACC AGTCAAAGGG AGAAAGAAGA TGATAAAGTC TTCCCTGGTG

1141 GAAGCCATAC ATATGTCTGG CAGGTCCTGA AAGAGAATGG TCCAATGGCC TCTGACCCAC1141 GAAGCCATAC ATATGTCTGG CAGGTCCTGA AAGAGAATGG TCCAATGGCC TCTGACCCAC

1201 TGTGCCTTAC CTACTCATAT CTTTCTCATG TGGACCTGGT AAAAGACTTG AATTCAGGCC1201 TGTGCCTTAC CTACTCATAT CTTTCTCATG TGGACCTGGT AAAAGACTTG AATTCAGGCC

1261 TCATTGGAGC CCTACTAGTA TGTAGAGAAG GGAGTCTGGC CAAGGAAAAG ACACAGACCT1261 TCATTGGAGC CCTACTAGTA TGTAGAGAAG GGAGTCTGGC CAAGGAAAAG ACACAGACCT

1321 TGCACAAATT TATACTACTT TTTGCTGTAT TTGATGAAGG GAAAAGTTGG CACTCAGAAA1321 TGCACAAATT TATACTACTT TTTGCTGTAT TTGATGAAGG GAAAAGTTGG CACTCAGAAA

- 42 041588- 42 041588

1381 CAAAGAACTC CTTGATGCAG GATAGGGATG CTGCATCTGC TCGGGCCTGG CCTAAAATGC 1441 ACACAGTCAA TGGTTATGTA AACAGGTCTC TGCCAGGTCT GATTGGATGC CACAGGAAAT 1501 CAGTCTATTG GCATGTGATT GGAATGGGCA CCACTCCTGA AGTGCACTCA ATATTCCTCG 1561 AAGGTCACAC ATTTCTTGTG AGGAACCATC GCCAGGCGTC CTTGGAAATC TCGCCAATAA 1621 CTTTCCTTAC TGCTCAAACA CTCTTGATGG ACCTTGGACA GTTTCTACTG TTTTGTCATA 1681 TCTCTTCCCA CCAACATGAT GGCATGGAAG CTTATGTCAA AGTAGACAGC TGTCCAGAGG 1741 AACCCCAACT ACGAATGAAA AATAATGAAG AAGCGGAAGA CTATGATGAT GATCTTACTG 1801 ATTCTGAAAT GGATGTGGTC AGGTTTGATG ATGACAACTC TCCTTCCTTT ATCCAAATTC 1861 GCTCAGTTGC CAAGAAGCAT CCTAAAACTT GGGTACATTA CATTGCTGCT GAAGAGGAGG 1921 ACTGGGACTA TGCTCCCTTA GTCCTCGCCC CCGATGACAG AAGTTATAAA AGTCAATATT 1981 TGAACAATGG CCCTCAGCGG ATTGGTAGGA AGTACAAAAA AGTCCGATTT ATGGCATACA 2041 CAGATGAAAC CTTTAAGACT CGTGAAGCTA TTCAGCATGA ATCAGGAATC TTGGGACCTT 2101 TACTTTATGG GGAAGTTGGA GACACACTGT TGATTATATT TAAGAATCAA GCAAGCAGAC 2161 CATATAACAT CTACCCTCAC GGAATCACTG ATGTCCGTCC TTTGTATTCA AGGAGATTAC 2221 CAAAAGGTGT AAAACATTTG AAGGATTTTC CAATTCTGCC AGGAGAAATA TTCAAATATA 2281 AATGGACAGT GACTGTAGAA GATGGGCCAA CTAAATCAGA TCCTCGGTGC CTGACCCGCT 2341 ATTACTCTAG TTTCGTTAAT ATGGAGAGAG ATCTAGCTTC AGGACTCATT GGCCCTCTCC 2401 TCATCTGCTA CAAAGAATCT GTAGATCAAA GAGGAAACCA GATAATGTCA GACAAGAGGA 2461 ATGTCATCCT GTTTTCTGTA TTTGATGAGA ACCGAAGCTG GTACCTCACA GAGAATATAC 2521 AACGCTTTCT CCCCAATCCA GCTGGAGTGC AGCTTGAGGA TCCAGAGTTC CAAGCCTCCA 2581 ACATCATGCA CAGCATCAAT GGCTATGTTT TTGATAGTTT GCAGTTGTCA GTTTGTTTGC 2641 ATGAGGTGGC ATACTGGTAC ATTCTAAGCA TTGGAGCACA GACTGACTTC CTTTCTGTCT 2701 TCTTCTCTGG ATATACCTTC AAACACAAAA TGGTCTATGA AGACACACTC ACCCTATTCC 2761 CATTCTCAGG AGAAACTGTC TTCATGTCGA TGGAAAACCC AGGTCTATGG ATTCTGGGGT 2821 GCCACAACTC AGACTTTCGG AACAGAGGCA TGACCGCCTT ACTGAAGGTT TCTAGTTGTG 2881 ACAAGAACAC TGGTGATTAT TACGAGGACA GTTATGAAGA TATTTCAGCA TACTTGCTGA 2941 GTAAAAACAA TGCCATTGAA CCAAGAAGCT TCTCTCAAAA CCCACCAGTC TTGAAACGCC 3001 ATCAACGGGA AATAACTCGT ACTACTCTTC AGTCAGATCA AGAGGAAATT GACTATGATG 3061 ATACCATATC AGTTGAAATG AAGAAGGAAG ATTTTGACAT TTATGATGAG GATGAAAATC 3121 AGAGCCCCCG CAGCTTTCAA AAGAAAACAC GACACTATTT TATTGCTGCA GTGGAGAGGC 3181 TCTGGGATTA TGGGATGAGT AGCTCCCCAC ATGTTCTAAG AAACAGGGCT CAGAGTGGCA 3241 GTGTCCCTCA GTTCAAGAAA GTTGTTTTCC AGGAATTTAC TGATGGCTCC TTTACTCAGC 3301 CCTTATACCG TGGAGAACTA AATGAACATT TGGGACTCCT GGGGCCATAT ATAAGAGCAG 3361 AAGTTGAAGA TAATATCATG GTAACTTTCA GAAATCAGGC CTCTCGTCCC TATTCCTTCT 3421 ATTCTAGCCT TATTTCTTAT GAGGAAGATC AGAGGCAAGG AGCAGAACCT AGAAAAAACT 3481 TTGTCAAGCC TAATGAAACC AAAACTTACT TTTGGAAAGT GCAACATCAT ATGGCACCCA 3541 CTAAAGATGA GTTTGACTGC AAAGCCTGGG CTTATTTCTC TGATGTTGAC CTGGAAAAAG 3601 ATGTGCACTC AGGCCTGATT GGACCCCTTC TGGTCTGCCA CACTAACACA CTGAACCCTG 3661 CTCATGGGAG ACAAGTGACA GTACAGGAAT TTGCTCTGTT TTTCACCATC TTTGATGAGA 3721 CCAAAAGCTG GTACTTCACT GAAAATATGG AAAGAAACTG CAGGGCTCCC TGCAATATCC 3781 AGATGGAAGA TCCCACTTTT AAAGAGAATT ATCGCTTCCA TGCAATCAAT GGCTACATAA 3841 TGGATACACT ACCTGGCTTA GTAATGGCTC AGGATCAAAG GATTCGATGG TATCTGCTCA 3901 GCATGGGCAG CAATGAAAAC ATCCATTCTA TTCATTTCAG TGGACATGTG TTCACTGTAC 3961 GAAAAAAAGA GGAGTATAAA ATGGCACTGT ACAATCTCTA TCCAGGTGTT TTTGAGACAG 4021 TGGAAATGTT ACCATCCAAA GCTGGAATTT GGCGGGTGGA ATGCCTTATT GGCGAGCATC 4081 TACATGCTGG GATGAGCACA CTTTTTCTGG TGTACAGCAA TAAGTGTCAG ACTCCCCTGG 4141 GAATGGCTTC TGGACACATT AGAGATTTTC AGATTACAGC TTCAGGACAA TATGGACAGT 4201 GGGCCCCAAA GCTGGCCAGA CTTCATTATT CCGGATCAAT CAATGCCTGG AGCACCAAGG 4261 AGCCCTTTTC TTGGATCAAG GTGGATCTGT TGGCACCAAT GATTATTCAC GGCATCAAGA 4321 CCCAGGGTGC CCGTCAGAAG TTCTCCAGCC TCTACATCTC TCAGTTTATC ATCATGTATA 4381 GTCTTGATGG GAAGAAGTGG CAGACTTATC GAGGAAATTC CACTGGAACC TTAATGGTCT 4441 TCTTTGGCAA TGTGGATTCA TCTGGGATAA AACACAATAT TTTTAACCCT CCAATTATTG 4501 CTCGATACAT CCGTTTGCAC CCAACTCATT ATAGCATTCG CAGCACTCTT CGCATGGAGT 4561 TGATGGGCTG TGATTTAAAT AGTTGCAGCA TGCCATTGGG AATGGAGAGT AAAGCAATAT 4621 CAGATGCACA GATTACTGCT TCATCCTACT TTACCAATAT GTTTGCCACC TGGTCTCCTT 4681 CAAAAGCTCG ACTTCACCTC CAAGGGAGGA GTAATGCCTG GAGACCTCAG GTGAATAATC 4741 CAAAAGAGTG GCTGCAAGTG GACTTCCAGA AGACAATGAA AGTCACAGGA GTAACTACTC 4801 AGGGAGTAAA ATCTCTGCTT ACCAGCATGT ATGTGAAGGA GTTCCTCATC TCCAGCAGTC 4861 AAGATGGCCA TCAGTGGACT CTCTTTTTTC AGAATGGCAA AGTAAAGGTT TTTCAGGGAA 4921 ATCAAGACTC CTTCACACCT GTGGTGAACT CTCTAGACCC ACCGTTACTG ACTCGCTACC 4981 TTCGAATTCA CCCCCAGAGT TGGGTGCACC AGATTGCCCT GAGGATGGAG GTTCTGGGCT 5041 GCGAGGCACA GGACCTCTAC * подчеркнутые нуклеиновые кислоты кодируют сигнальный пептид.1381 CAAAGAACTC CTTGATGCAG GATAGGGATG CTGCATCTGC TCGGGCCTGG CCTAAAATGC 1441 ACACAGTCAA TGGTTATGTA AACAGGTCTC TGCCAGGTCT GATTGGATGC CACAGGAAAT 1501 CAGTCTATTG GCATGTGATT GGAATGGGCA CCACTCCTGA AGTGCACTCA ATATTCCTCG 1561 AAGGTCACAC ATTTCTTGTG AGGAACCATC GCCAGGCGTC CTTGGAAATC TCGCCAATAA 1621 CTTTCCTTAC TGCTCAAACA CTCTTGATGG ACCTTGGACA GTTTCTACTG TTTTGTCATA 1681 TCTCTTCCCA CCAACATGAT GGCATGGAAG CTTATGTCAA AGTAGACAGC TGTCCAGAGG 1741 AACCCCAACT ACGAATGAAA AATAATGAAG AAGCGGAAGA CTATGATGAT GATCTTACTG 1801 ATTCTGAAAT GGATGTGGTC AGGTTTGATG ATGACAACTC TCCTTCCTTT ATCCAAATTC 1861 GCTCAGTTGC CAAGAAGCAT CCTAAAACTT GGGTACATTA CATTGCTGCT GAAGAGGAGG 1921 ACTGGGACTA TGCTCCCTTA GTCCTCGCCC CCGATGACAG AAGTTATAAA AGTCAATATT 1981 TGAACAATGG CCCTCAGCGG ATTGGTAGGA AGTACAAAAA AGTCCGATTT ATGGCATACA 2041 CAGATGAAAC CTTTAAGACT CGTGAAGCTA TTCAGCATGA ATCAGGAATC TTGGGACCTT 2101 TACTTTATGG GGAAGTTGGA GACACACTGT TGATTATATT TAAGAATCAA GCAAGCAGAC 2161 CATATAACAT CTACCCTCAC GGAATCACTG ATGTCCGTCC TTTGTATTCA AGGAGATTAC 2221 C AAAAGGTGT AAAACATTTG AAGGATTTTC CAATTCTGCC AGGAGAAATA TTCAAATATA 2281 AATGGACAGT GACTGTAGAA GATGGGCCAA CTAAATCAGA TCCTCGGTGC CTGACCCGCT 2341 ATTACTCTAG TTTCGTTAAT ATGGAGAGAG ATCTAGCTTC AGGACTCATT GGCCCTCTCC 2401 TCATCTGCTA CAAAGAATCT GTAGATCAAA GAGGAAACCA GATAATGTCA GACAAGAGGA 2461 ATGTCATCCT GTTTTCTGTA TTTGATGAGA ACCGAAGCTG GTACCTCACA GAGAATATAC 2521 AACGCTTTCT CCCCAATCCA GCTGGAGTGC AGCTTGAGGA TCCAGAGTTC CAAGCCTCCA 2581 ACATCATGCA CAGCATCAAT GGCTATGTTT TTGATAGTTT GCAGTTGTCA GTTTGTTTGC 2641 ATGAGGTGGC ATACTGGTAC ATTCTAAGCA TTGGAGCACA GACTGACTTC CTTTCTGTCT 2701 TCTTCTCTGG ATATACCTTC AAACACAAAA TGGTCTATGA AGACACACTC ACCCTATTCC 2761 CATTCTCAGG AGAAACTGTC TTCATGTCGA TGGAAAACCC AGGTCTATGG ATTCTGGGGT 2821 GCCACAACTC AGACTTTCGG AACAGAGGCA TGACCGCCTT ACTGAAGGTT TCTAGTTGTG 2881 ACAAGAACAC TGGTGATTAT TACGAGGACA GTTATGAAGA TATTTCAGCA TACTTGCTGA 2941 GTAAAAACAA TGCCATTGAA CCAAGAAGCT TCTCTCAAAA CCCACCAGTC TTGAAACGCC 3001 ATCAACGGGA AATAACTCGT ACTACTCTTC AGTCAGATCA AGAGGAAATT GACTATGATG 3061 ATACCAT ATC AGTTGAAATG AAGAAGGAAG ATTTTGACAT TTATGATGAG GATGAAAATC 3121 AGAGCCCCCG CAGCTTTCAA AAGAAAACAC GACACTATTT TATTGCTGCA GTGGAGAGGC 3181 TCTGGGATTA TGGGATGAGT AGCTCCCCAC ATGTTCTAAG AAACAGGGCT CAGAGTGGCA 3241 GTGTCCCTCA GTTCAAGAAA GTTGTTTTCC AGGAATTTAC TGATGGCTCC TTTACTCAGC 3301 CCTTATACCG TGGAGAACTA AATGAACATT TGGGACTCCT GGGGCCATAT ATAAGAGCAG 3361 AAGTTGAAGA TAATATCATG GTAACTTTCA GAAATCAGGC CTCTCGTCCC TATTCCTTCT 3421 ATTCTAGCCT TATTTCTTAT GAGGAAGATC AGAGGCAAGG AGCAGAACCT AGAAAAAACT 3481 TTGTCAAGCC TAATGAAACC AAAACTTACT TTTGGAAAGT GCAACATCAT ATGGCACCCA 3541 CTAAAGATGA GTTTGACTGC AAAGCCTGGG CTTATTTCTC TGATGTTGAC CTGGAAAAAG 3601 ATGTGCACTC AGGCCTGATT GGACCCCTTC TGGTCTGCCA CACTAACACA CTGAACCCTG 3661 CTCATGGGAG ACAAGTGACA GTACAGGAAT TTGCTCTGTT TTTCACCATC TTTGATGAGA 3721 CCAAAAGCTG GTACTTCACT GAAAATATGG AAAGAAACTG CAGGGCTCCC TGCAATATCC 3781 AGATGGAAGA TCCCACTTTT AAAGAGAATT ATCGCTTCCA TGCAATCAAT GGCTACATAA 3841 TGGATACACT ACCTGGCTTA GTAATGGCTC AGGATCAAAG GATTCGATGG TATCTGCTCA 3901 GCATGGGCAG CA ATGAAAAC ATCCATTCTA TTCATTTCAG TGGACATGTG TTCACTGTAC 3961 GAAAAAAAGA GGAGTATAAA ATGGCACTGT ACAATCTCTA TCCAGGTGTT TTTGAGACAG 4021 TGGAAATGTT ACCATCCAAA GCTGGAATTT GGCGGGTGGA ATGCCTTATT GGCGAGCATC 4081 TACATGCTGG GATGAGCACA CTTTTTCTGG TGTACAGCAA TAAGTGTCAG ACTCCCCTGG 4141 GAATGGCTTC TGGACACATT AGAGATTTTC AGATTACAGC TTCAGGACAA TATGGACAGT 4201 GGGCCCCAAA GCTGGCCAGA CTTCATTATT CCGGATCAAT CAATGCCTGG AGCACCAAGG 4261 AGCCCTTTTC TTGGATCAAG GTGGATCTGT TGGCACCAAT GATTATTCAC GGCATCAAGA 4321 CCCAGGGTGC CCGTCAGAAG TTCTCCAGCC TCTACATCTC TCAGTTTATC ATCATGTATA 4381 GTCTTGATGG GAAGAAGTGG CAGACTTATC GAGGAAATTC CACTGGAACC TTAATGGTCT 4441 TCTTTGGCAA TGTGGATTCA TCTGGGATAA AACACAATAT TTTTAACCCT CCAATTATTG 4501 CTCGATACAT CCGTTTGCAC CCAACTCATT ATAGCATTCG CAGCACTCTT CGCATGGAGT 4561 TGATGGGCTG TGATTTAAAT AGTTGCAGCA TGCCATTGGG AATGGAGAGT AAAGCAATAT 4621 CAGATGCACA GATTACTGCT TCATCCTACT TTACCAATAT GTTTGCCACC TGGTCTCCTT 4681 CAAAAGCTCG ACTTCACCTC CAAGGGAGGA GTAATGCCTG GAGACCTCAG GTGAATAATC 4741 CAAAAGAGTG GCTGCAAG TG GACTTCCAGA AGACAATGAA AGTCACAGGA GTAACTACTC 4801 AGGGAGTAAA ATCTCTGCTT ACCAGCATGT ATGTGAAGGA GTTCCTCATC TCCAGCAGTC 4861 AAGATGGCCA TCAGTGGACT CTCTTTTTTC AGAATGGCAA AGTAAAGGTT TTTCAGGGAA 4921 ATCAAGACTC CTTCACACCT GTGGTGAACT CTCTAGACCC ACCGTTACTG ACTCGCTACC 4981 TTCGAATTCA CCCCCAGAGT TGGGTGCACC AGATTGCCCT GAGGATGGAG GTTCTGGGCT 5041 GCGAGGCACA GGACCTCTAC * подчеркнутые нуклеиновые кислоты кодируют сигнальный пептид.

FVIII с делецией В-домена может иметь полные или частичные делеции, раскрытые в патентах США № 6316226, 6346513, 7041635, 5789203, 6060447, 5595886, 6228620, 5972885, 6048720, 5543502, 5610278, 5171844, 5112950, 4868112 и 6458563. В некоторых вариантах реализации изобретения последовательность FVIII с делецией В-домена по настоящему изобретению содержит любую из делеций, раскрытых от колонки 4, строка 4, до колонки 5, строка 28, и в примерах 1-5 патента США № 6316226 (также в US 6346513). В другом варианте реализации изобретения фактор VIII с делецией В-домена представляет собой фактор VIII с делецией В-домена S743/Q1638 (SQ BDD FVIII) (например, фактор VIII, имеющий делецию от аминокислоты 744 до аминокислоты 1637, например, фактор VIII, содержащий аминокислоты 1-743 и аминокислоты 1638-2332 SEQ ID NO: 16, т.е. SEQ ID NO: 18). В некоторых вариантах реализации изобретения FVIII с делецией В-домена по настоящему изобретению имеет делецию, раскрытую в колонке 2, строки 26-51, и примерах 5-8 патента США № 5789203 (также US 6060447, US 5595886 и US 6228620). В некоторых вариантах реализации изобретения фактор VIII с делецией Вдомена имеет делецию, описанную от колонки 1, строка 25, до колонки 2, строка 40 патента США № 5972885; в колонке 6, строки 1-22, и примере 1 патента США № 6048720; в колонке 2, строки 17-46,FVIII с делецией В-домена может иметь полные или частичные делеции, раскрытые в патентах США № 6316226, 6346513, 7041635, 5789203, 6060447, 5595886, 6228620, 5972885, 6048720, 5543502, 5610278, 5171844, 5112950, 4868112 и 6458563. В некоторых embodiments, the FVIII sequence with the B domain deletion of the present invention contains any of the deletions disclosed from column 4, line 4 to column 5, line 28, and in examples 1-5 of US patent No. 6316226 (also in US 6346513). In another embodiment, Factor VIII with a B domain deletion is Factor VIII with a B domain deletion of S743/Q1638 (SQ BDD FVIII) (e.g., Factor VIII having a deletion from amino acid 744 to amino acid 1637, e.g. amino acids 1-743 and amino acids 1638-2332 of SEQ ID NO: 16, i.e. SEQ ID NO: 18). In some embodiments, the B domain deletion FVIII of the present invention has the deletion disclosed in column 2, lines 26-51, and examples 5-8 of US Pat. In some embodiments, factor VIII with a B domain deletion has the deletion described from column 1, line 25 to column 2, line 40 of US Pat. No. 5,972,885; in column 6, lines 1-22, and example 1 of US patent No. 6048720; in column 2, lines 17-46,

- 43 041588 патента США № 5543502; от колонки 4, строка 22, до колонки 5, строка 36, патента США № 5171844; в колонке 2, строки 55-68, на фигуре 2 и в примере 1 патента США № 5112950; от колонки 2, строка 2, до колонки 19, строка 21, и в таблице 2 патента США № 4868112; от колонки 2, строка 1, до колонки 3, строка 19, от колонки 3, строка 40, до колонки 4, строка 67, от колонки 7, строка 43, до колонки 8, строка 26, и от колонки 11, строка 5, до колонки 13, строка 39, патента США № 7041635; или в колонке 4, строки 25-53, патента США № 6458563.- 43 041588 US patent No. 5543502; from column 4, line 22, to column 5, line 36, US patent No. 5171844; in column 2, lines 55-68, figure 2 and example 1 of US patent No. 5112950; from column 2, line 2, to column 19, line 21, and in table 2 of US patent No. 4868112; from column 2, line 1, to column 3, line 19, from column 3, line 40, to column 4, line 67, from column 7, line 43, to column 8, line 26, and from column 11, line 5, to column 13, line 39, US Pat. No. 7,041,635; or in column 4, lines 25-53, US Pat. No. 6,458,563.

В некоторых вариантах реализации изобретения FVIII с делецией В-домена имеет делецию большей части В-домена, но при этом содержит аминоконцевые последовательности В-домена, являющиеся существенными для in vivo протеолитического процессинга первичного продукта трансляции в две полипептидные цепи, как раскрыто в WO 91/09122. В некоторых вариантах реализации изобретения FVIII с делецией В-домена сконструирован с делецией аминокислот 747-1638, т.е. по существу, с полной делецией В-домена. Hoeben R.C., et al. J. Biol. Chem. 265 (13): 7318-7323 (1990). Фактор VIII с делецией Вдомена может также содержать делецию аминокислот 771-1666 или аминокислот 868-1562 FVIII. Meulien P., et al. Protein Eng. 2(4): 301-6 (1988). Дополнительные делеции В-домена, являющиеся частью изобретения, включают: делеция аминокислот 982-1562 или 760-1639 (Toole et al, Proc. Natl. Acad. Sci. U.S.A. (1986) 83, 5939-5942)), 797-1562 (Eaton, et al. Biochemistry (1986) 25:8343-8347)), 741-1646 (Kaufman (опубликованная заявка РСТ № WO 87/04187)), 747-1560 (Sarver, et al, DNA (1987) 6:553-564)), 741-1648 (Pasek (заявка РСТ № 88/00831)), или 816-1598 или 741-1648 (Lagner (Behring Inst. Mitt. (1988) No 82:1625, EP 295597)). В других вариантах реализации изобретения BDD FVIII включает полипептид FVIII, содержащий фрагменты В-домена, сохраняющие один или более N-связанных сайтов гликозилирования, например остатки 757, 784, 828, 900, 963 или, необязательно, 943, которые соответствуют аминокислотной последовательности полноразмерной последовательности FVIII. Примеры фрагментов В-домена включают 226 аминокислот или 163 аминокислоты В-домена, как раскрыто в Miao, H.Z., et al, Blood 103(a): 3412-3419 (2004), Kasuda, A, et al, J. Thromb. Haemost. 6: 1352-1359 (2008) и Pipe, S.W., et al., J. Thromb. Haemost. 9: 2235-2242 (2011) (т.е. сохраняются первые 226 аминокислот или 163 аминокислоты В-домена). В некоторых вариантах реализации изобретения FVIII с частичным В-доменом представляет собой FVIII198. FVIII198 представляет собой одноцепочечную молекулу FVIIIFc-226N6, содержащую частичный В-домен. 226 обозначает N-концевую аминокислоту 226 В-домена FVIII, и N6 обозначает шесть сайтов N-гликозилирования в В-домене. В еще одних вариантах реализации изобретения BDD FVIII дополнительно содержит точковую мутацию в положении остатка 309 (от Phe до Ser) для улучшения экспрессии BDD-белка FVIII. См. Miao, H.Z., et al., Blood 103(a): 3412-3419 (2004). В еще одних вариантах реализации изобретения BDD FVIII включает полипептид FVIII, содержащий часть В-домена, но не содержащий одного или более фуриновых сайтов расщепления (например, Arg1313 и Arg 1648). См. Pipe, S.W., et al., J. Thromb. Haemost. 9: 2235-2242 (2011). Каждая из вышеупомянутых делеций может быть выполнена в любой последовательности FVIII.In some embodiments, FVIII with a B domain deletion has a deletion of most of the B domain, but contains amino-terminal B domain sequences that are essential for in vivo proteolytic processing of the primary translation product into two polypeptide chains, as disclosed in WO 91/ 09122. In some embodiments, the FVIII with the B domain deletion is constructed with a deletion of amino acids 747-1638, i. e. essentially, with a complete deletion of the B-domain. Hoeben R.C., et al. J Biol. Chem. 265 (13): 7318-7323 (1990). Factor VIII with a B domain deletion may also contain a deletion of FVIII amino acids 771-1666 or amino acids 868-1562. Meulien P., et al. ProteinEng. 2(4): 301-6 (1988). Additional B domain deletions that are part of the invention include: deletion of amino acids 982-1562 or 760-1639 (Toole et al, Proc. Natl. Acad. Sci. U.S.A. (1986) 83, 5939-5942)), 797-1562 ( Eaton, et al Biochemistry (1986) 25:8343-8347)), 741-1646 (Kaufman (PCT Publication No. WO 87/04187)), 747-1560 (Sarver, et al, DNA (1987) 6:553 -564)), 741-1648 (Pasek (PCT Application No. 88/00831)), or 816-1598 or 741-1648 (Lagner (Behring Inst. Mitt. (1988) No 82:1625, EP 295597)). In other embodiments, the FVIII BDD comprises a FVIII polypeptide comprising B-domain fragments retaining one or more N-linked glycosylation sites, e.g., residues 757, 784, 828, 900, 963, or optionally 943, which correspond to the amino acid sequence of the full-length sequence FVIII. Examples of B domain fragments include 226 amino acids or 163 amino acids of the B domain as disclosed in Miao, H.Z., et al, Blood 103(a): 3412-3419 (2004), Kasuda, A, et al, J. Thromb. haemost. 6: 1352-1359 (2008) and Pipe, S.W., et al., J. Thromb. haemost. 9: 2235-2242 (2011) (i.e., the first 226 amino acids or 163 amino acids of the B domain are retained). In some embodiments, the partial B domain FVIII is FVIII198. FVIII198 is a single chain FVIIIFc-226N6 molecule containing a partial B domain. 226 denotes the N-terminal amino acid 226 of the B domain of FVIII, and N6 denotes the six N-glycosylation sites in the B domain. In still other embodiments, the FVIII BDD further comprises a point mutation at residue position 309 (Phe to Ser) to improve expression of the FVIII BDD protein. See Miao, H.Z., et al., Blood 103(a): 3412-3419 (2004). In still other embodiments, the FVIII BDD comprises a FVIII polypeptide containing a portion of the B domain but lacking one or more furin cleavage sites (eg, Arg1313 and Arg 1648). See Pipe, S.W., et al., J. Thromb. haemost. 9:2235-2242 (2011). Each of the above deletions can be made in any sequence of FVIII.

Белок FVIII, пригодный для использования по настоящему изобретению, может включать FVIII, имеющий одну или более дополнительных гетерологичных последовательностей или химических или физических модификаций в нем, которые не влияют на коагулирующую активность FVIII. Такие гетерологичные последовательности или химические или физические модификации могут быть слиты с Сконцом или N-концом белка FVIII или вставлены между одной или более парами аминокислотных остатков в белке FVIII. Такие вставки в белке FVIII не влияют на коагулирующую активность FVIII или функцию FVIII. В одном варианте реализации изобретения вставки улучшают фармакокинетические свойства белка FVIII (например, период полувыведения). В другом варианте реализации изобретения вставки могут быть сделаны в более чем двух, трех, четырех, пяти или шести сайтах.A FVIII protein suitable for use in the present invention may include FVIII having one or more additional heterologous sequences or chemical or physical modifications therein that do not affect the coagulative activity of FVIII. Such heterologous sequences or chemical or physical modifications may be fused to the C-terminus or N-terminus of the FVIII protein, or inserted between one or more pairs of amino acid residues in the FVIII protein. Such inserts in the FVIII protein do not affect the clotting activity of FVIII or the function of FVIII. In one embodiment, the insert improves the pharmacokinetic properties of the FVIII protein (eg, half-life). In another embodiment, insertions may be made at more than two, three, four, five, or six sites.

В одном варианте реализации изобретения FVIII расщепляется сразу за аргинином в положении аминокислоты 1648 (в полноразмерном факторе VIII или SEQ ID NO: 16), аминокислоты 754 (в факторе VIII с делецией В-домена S743/Q1638 или SEQ ID NO: 16), или соответствующим аргининовым остатком (в других вариантах), с образованием в результате тяжелой цепи и легкой цепи. В другом варианте реализации изобретения FVIII содержит тяжелую цепь и легкую цепь, которые связаны или ассоциированы с помощью медиируемой ионом металла нековалентной связи. В других вариантах реализации изобретения FVIII представляет собой одноцепочечный FVIII, который не был расщеплен сразу за аргинином в положении аминокислоты 1648 (в полноразмерном FVIII или SEQ ID NO: 16), аминокислоты 754 (в FVIII с делецией В-домена S743/Q1638 или SEQ ID NO: 18), или соответствующим аргининовым остатком (в других вариантах). Одноцепочечный FVIII может содержать одно или более аминокислотных замещений. В одном варианте реализации изобретения аминокислотное замещение находится в остатке, соответствующем остатку 1648, остатку 1645, или обоим, полноразмерного зрелого полипептида фактора VIII (SEQ ID NO: 16) или остатку 754, остатку 751, или обоим, SQ BDD фактора VIII (SEQ ID NO: 18). Аминокислотное замещение может быть любыми аминокислотами, отличными от аргинина, например изолейцином, лейцином, лизином, метионином, фенилаланином, треонином, триптофаном, валином, аланином, аспарагином, аспарагиновой кислотой, цистеином, глутаминовой кислотой, глутамином, глицином, пролином, селеноцистеином, серином, тирозином, гистидином, орнитином, пирролизином или таурином. FVIII дополнительно может быть расщеплен тромбином и затем активирован как FVIIIa, слуIn one embodiment, FVIII is cleaved immediately after arginine at amino acid position 1648 (in full-length factor VIII or SEQ ID NO: 16), amino acid 754 (in factor VIII with a B domain deletion of S743/Q1638 or SEQ ID NO: 16), or the corresponding arginine residue (in other embodiments), resulting in a heavy chain and a light chain. In another embodiment, the FVIII comprises a heavy chain and a light chain that are linked or associated via a metal ion mediated non-covalent bond. In other embodiments, FVIII is a single chain FVIII that has not been cleaved immediately after arginine at amino acid 1648 (in full length FVIII or SEQ ID NO: 16), amino acid 754 (in FVIII with the S743/Q1638 B domain deletion or SEQ ID NO: 18), or the corresponding arginine residue (in other embodiments). Single chain FVIII may contain one or more amino acid substitutions. In one embodiment, the amino acid substitution is at residue 1648, residue 1645, or both, of the full-length mature Factor VIII polypeptide (SEQ ID NO: 16) or residue 754, residue 751, or both, of Factor VIII SQ BDD (SEQ ID NO: 18). The amino acid substitution may be any amino acid other than arginine, such as isoleucine, leucine, lysine, methionine, phenylalanine, threonine, tryptophan, valine, alanine, asparagine, aspartic acid, cysteine, glutamic acid, glutamine, glycine, proline, selenocysteine, serine, tyrosine, histidine, ornithine, pyrrolysine or taurine. FVIII can additionally be cleaved by thrombin and then activated as FVIIIa, serving

- 44 041588 жащий кофактором для активированного фактора IX (FIXa). Активированный FIX вместе с активированным FVIII образует комплекс Xase и превращает фактор X в активированный фактор X (FXa). Для активации, FVIII расщепляется тромбином после трех аргининовых остатков, в положениях аминокислот 372, 740 и 1689 (соответствующих аминокислотам 372, 740 и 795 в последовательности FVIII с делецией Вдомена), образуя в результате расщепления FVIIIa, имеющий цепи 50 кДа А1, 43 кДа А2 и 73 кДа А3-С1С2. В одном варианте реализации изобретения белок FVIII, пригодный для использования в настоящем изобретении, представляет собой неактивный FVIII. В другом варианте реализации изобретения белок FVIII представляет собой активированный FVIII. Белок, имеющий полипептид FVIII, связанный с или ассоциированный с белком VWF, может содержать последовательность, по меньшей мере на 50, 60, 70, 80, 90, 95, 96, 97, 98, 99 или 100% идентичную SEQ ID NO: 16 или 18, причем последовательность обладает свертывающей активностью FVIII, например, активирует фактор IX в качестве кофактора для превращения фактора X в активированный фактор X (FXa).- 44 041588 cofactor for activated factor IX (FIXa). Activated FIX together with activated FVIII forms the Xase complex and converts factor X to activated factor X (FXa). For activation, FVIII is cleaved by thrombin after three arginine residues, at amino acid positions 372, 740, and 1689 (corresponding to amino acids 372, 740, and 795 in the FVIII sequence with a B domain deletion), resulting in cleavage of FVIIIa, which has 50 kDa A1, 43 kDa A2 chains. and 73 kDa A3-C1C2. In one embodiment, the FVIII protein suitable for use in the present invention is an inactive FVIII. In another embodiment, the FVIII protein is an activated FVIII. A protein having a FVIII polypeptide associated with or associated with a VWF protein may contain a sequence at least 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% or 100% identical to SEQ ID NO: 16 or 18, wherein the sequence has FVIII clotting activity, eg, activates factor IX as a cofactor to convert factor X to activated factor X (FXa).

В некоторых вариантах реализации изобретения белок FVIII дополнительно содержит один или более гетерологичных фрагментов, слитых с С-концом или N-концом белка FVIII или вставленных между двумя соседними аминокислотами в белок FVIII. В других вариантах реализации изобретения гетерологичные фрагменты содержат аминокислотную последовательность, состоящую из по меньшей мере около 50 аминокислот, по меньшей мере около 100 аминокислот, по меньшей мере около 150 аминокислот, по меньшей мере около 200 аминокислот, по меньшей мере около 250 аминокислот, по меньшей мере около 300 аминокислот, по меньшей мере около 350 аминокислот, по меньшей мере около 400 аминокислот, по меньшей мере около 450 аминокислот, по меньшей мере около 500 аминокислот, по меньшей мере около 550 аминокислот, по меньшей мере около 600 аминокислот, по меньшей мере около 650 аминокислот, по меньшей мере около 700 аминокислот, по меньшей мере около 750 аминокислот, по меньшей мере около 800 аминокислот, по меньшей мере около 850 аминокислот, по меньшей мере около 900 аминокислот, по меньшей мере около 950 аминокислот или по меньшей мере около 1000 аминокислот. В некоторых вариантах реализации изобретения период полувыведения химерной молекулы увеличивается по меньшей мере в около 1,5 раза, по меньшей мере в около 2 раз, по меньшей мере в около 2,5 раза, по меньшей мере в около 3 раз, по меньшей мере в около 4 раз, по меньшей мере в около 5 раз, по меньшей мере в около 6 раз, по меньшей мере в около 7 раз, по меньшей мере в около 8 раз, по меньшей мере в около 9 раз, по меньшей мере в около 10 раз, по меньшей мере в около 11 раз или по меньшей мере в около 12 раз, по сравнению с FVIII дикого типа.In some embodiments, the FVIII protein further comprises one or more heterologous fragments fused to the C-terminus or N-terminus of the FVIII protein or inserted between two adjacent amino acids in the FVIII protein. In other embodiments, the heterologous fragments comprise an amino acid sequence of at least about 50 amino acids, at least about 100 amino acids, at least about 150 amino acids, at least about 200 amino acids, at least about 250 amino acids, at least at least about 300 amino acids, at least about 350 amino acids, at least about 400 amino acids, at least about 450 amino acids, at least about 500 amino acids, at least about 550 amino acids, at least about 600 amino acids, at least about 650 amino acids, at least about 700 amino acids, at least about 750 amino acids, at least about 800 amino acids, at least about 850 amino acids, at least about 900 amino acids, at least about 950 amino acids, or at least about 1000 amino acids. In some embodiments, the half-life of the chimeric molecule is increased by at least about 1.5-fold, at least about 2-fold, at least about 2.5-fold, at least about 3-fold, at least about 4 times, at least about 5 times, at least about 6 times, at least about 7 times, at least about 8 times, at least about 9 times, at least about 10 times times, at least about 11 times, or at least about 12 times, compared to wild-type FVIII.

Другие типичные примеры вариантов FVIII также раскрыты в публикации США № US2013/0017997, опубликованной 17 января 2013 г., международной публикации № WO 2013/122617, опубликованной 22 августа 2013 г., или международной публикации № WO 2014/011819, опубликованной 16 января 2014 г., или международной публикации № WO2013123457 А1, или международной заявке № PCT/US2013/049989.Other exemplary FVIII variants are also disclosed in US Publication No. US2013/0017997 published January 17, 2013, International Publication No. WO 2013/122617 published August 22, 2013, or International Publication No. WO 2014/011819 published January 16, 2014 or International Publication No. WO2013123457 A1, or International Application No. PCT/US2013/049989.

III. Полинуклеотиды, векторы и способы получения.III. Polynucleotides, vectors and methods of preparation.

Изобретение также предусматривает полинуклеотид, кодирующий химерную молекулу, описанную в данном документе. В тех случаях, когда белок VWF соединен с гетерологичным фрагментом с помощью линкера VWF и с белком FVIII и последовательностью XTEN в химерном белке в виде одной полипептидной цепи, изобретение относится к одному полинуклеотиду, кодирующему одну полипептидную цепь. В тех случаях, когда химерный белок содержит первую и вторую полипептидные цепи, первая полипептидная цепь, содержащая белок VWF, последовательность XTEN и первый гетерологичный фрагмент (например, первую Fc-область), присоединенный с помощью линкера VWF, и вторая полипептидная цепь, содержащая белок FVIII и второй гетерологичный фрагмент (например, вторую Fc-область), полинуклеотид может содержать первую нуклеотидную область и вторую нуклеотидную область. В одном варианте реализации изобретения первая нуклеотидная область и вторая нуклеотидная область находятся в одном и том же полинуклеотиде. В другом варианте реализации изобретения первая нуклеотидная область и вторая нуклеотидная область находятся в двух разных полинуклеотидах (например, разных векторах). В определенных вариантах реализации изобретения настоящее изобретение касается набора полинуклеотидов, содержащих первую нуклеотидную цепь и вторую нуклеотидную цепь, причем первая нуклеотидная цепь кодирует белок VWF, последовательность XTEN, линкер VWF и гетерологичный фрагмент химерного белка, и вторая нуклеотидная цепь кодирует белок FVIII и второй гетерологичный фрагмент. В некоторых вариантах реализации изобретения настоящее изобретение касается набора полинуклеотидов, содержащих первую нуклеотидную цепь и вторую нуклеотидную цепь, причем первая нуклеотидная цепь кодирует белок VWF и гетерологичный фрагмент химерного белка, и вторая нуклеотидная цепь кодирует белок FVIII, соединенный со вторым гетерологичным фрагментом с помощью линкера FVIII, причем по меньшей мере одна последовательность XTEN слита с химерным белком. В других вариантах реализации изобретения настоящее изобретение касается набора полинуклеотидов, содержащих первую нуклеотидную цепь и вторую нуклеотидную цепь, причем первая нуклеотидная цепь кодирует белок VWF, линкер VWF и гетерологичный фрагмент химерного белка, и вторая нуклеотидная цепь кодирует белок FVIII, линкер FVIII и второй гетерологичный фрагмент, причем по меньшей мере одна последовательность XTEN слита с химерным белком.The invention also provides a polynucleotide encoding the chimeric molecule described herein. Where the VWF protein is connected to the heterologous fragment via a VWF linker and to the FVIII protein and the XTEN sequence in the chimeric protein as a single polypeptide chain, the invention relates to a single polynucleotide encoding a single polypeptide chain. In cases where the chimeric protein contains first and second polypeptide chains, the first polypeptide chain containing the VWF protein, the XTEN sequence and the first heterologous fragment (for example, the first Fc region) attached using the VWF linker, and the second polypeptide chain containing the protein FVIII and a second heterologous fragment (eg, a second Fc region), the polynucleotide may comprise a first nucleotide region and a second nucleotide region. In one embodiment of the invention, the first nucleotide region and the second nucleotide region are in the same polynucleotide. In another embodiment of the invention, the first nucleotide region and the second nucleotide region are in two different polynucleotides (eg, different vectors). In certain embodiments, the invention relates to a set of polynucleotides comprising a first nucleotide strand and a second nucleotide strand, wherein the first nucleotide strand encodes a VWF protein, an XTEN sequence, a VWF linker, and a heterologous fragment of a chimeric protein, and the second nucleotide strand encodes a FVIII protein and a second heterologous fragment. . In some embodiments, the present invention relates to a set of polynucleotides comprising a first nucleotide strand and a second nucleotide strand, wherein the first nucleotide strand encodes a VWF protein and a heterologous fragment of a chimeric protein, and the second nucleotide strand encodes an FVIII protein connected to the second heterologous fragment using an FVIII linker. , wherein at least one XTEN sequence is fused to the chimeric protein. In other embodiments, the invention relates to a set of polynucleotides comprising a first nucleotide strand and a second nucleotide strand, wherein the first nucleotide strand encodes a VWF protein, a VWF linker, and a heterologous fragment of a chimeric protein, and the second nucleotide strand encodes a FVIII protein, a FVIII linker, and a second heterologous fragment. , wherein at least one XTEN sequence is fused to the chimeric protein.

- 45 041588- 45 041588

В других вариантах реализации изобретения набор полинуклеотидов дополнительно содержит дополнительную нуклеотидную цепь (например, вторую нуклеотидную цепь, когда химерный полипептид кодируется одной полинуклеотидной цепью, или третью нуклеотидную цепь, когда химерный белок кодируется двумя полинуклеотидными цепями), которые кодируют протеинконвертазу. Протеинконвертаза может быть выбрана из пропротеинконвертазы субтилизин/кексин типа 5 (PCSK5 или РС5), пропротеинконвертазы субтилизин/кексин типа 7 (PCSK7 или РС5), Kex 2 дрожжей, пропротеинконвертазы субтилизин/кексин типа 3 (РАСЕ или PCSK3), или комбинаций двух или больше из них. В некоторых вариантах реализации изобретения протеинконвертаза представляет собой РАСЕ, РС5 или РС7. В конкретном варианте реализации изобретения протеинконвертаза представляет собой РС5 или РС7. См. международную заявку № PCT/US2011/043568, которая включена в данный документ в качестве ссылки. В другом варианте реализации изобретения протеинконвертаза представляет собой РАСЕ/фурин.In other embodiments, the set of polynucleotides further comprises an additional nucleotide strand (e.g., a second nucleotide strand when the chimeric polypeptide is encoded by a single polynucleotide strand, or a third nucleotide strand when the chimeric protein is encoded by two polynucleotide strands) that encode a protein convertase. The protein convertase can be selected from subtilisin/kexin type 5 proprotein convertase (PCSK5 or PC5), subtilisin/kexin type 7 proprotein convertase (PCSK7 or PC5), yeast Kex 2, subtilisin/kexin type 3 proprotein convertase (PACE or PCSK3), or combinations of two or more. of them. In some embodiments, the protein convertase is PACE, PC5, or PC7. In a particular embodiment, the protein convertase is PC5 or PC7. See International Application No. PCT/US2011/043568, which is incorporated herein by reference. In another embodiment, the protein convertase is PACE/furin.

В определенных вариантах реализации изобретения изобретение включает набор полинуклеотидов, содержащий первую нуклеотидную последовательность, кодирующую белок VWF, содержащий домен D' и домен D3 VWF, слитый с первым гетерологичным фрагментом с помощью линкера VWF, вторую нуклеотидную последовательность, кодирующую белок FVIII и второй гетерологичный фрагмент, и третью нуклеотидную последовательность, кодирующую домен D1 и домен D2 VWF, где последовательность XTEN присутствует в первой цепи или во второй цепи. В этом варианте реализации изобретения домен D1 и домен D2 экспрессируются раздельно (не связаны с доменом D'D3 белка VWF) для обеспечения надлежащего образования дисульфидной связи и укладки доменов D'D3. Экспрессия домена D1D2 может происходить в цис- или трансконфигурации.In certain embodiments of the invention, the invention includes a set of polynucleotides comprising a first nucleotide sequence encoding a VWF protein containing a D' domain and a VWF D3 domain fused to a first heterologous fragment using a VWF linker, a second nucleotide sequence encoding an FVIII protein, and a second heterologous fragment, and a third nucleotide sequence encoding a D1 domain and a D2 domain of a VWF, wherein the XTEN sequence is present in the first strand or in the second strand. In this embodiment, the D1 domain and the D2 domain are expressed separately (not associated with the D'D3 domain of the VWF protein) to ensure proper disulfide bond formation and folding of the D'D3 domains. Expression of the D1D2 domain can occur in the cis or trans configuration.

В используемом в данном документе значении экспрессионный вектор относится к любому конструкту нуклеиновой кислоты, который содержит элементы, необходимые для транскрипции и трансляции вставленной кодирующей последовательности или, в случае вирусного РНК-вектора, необходимые элементы для репликации и трансляции, при введении в пригодную клетку-хозяина. Экспрессионные векторы могут включать плазмиды, фагмиды, вирусы и их производные.As used herein, an expression vector refers to any nucleic acid construct that contains the elements necessary for transcription and translation of the inserted coding sequence or, in the case of a viral RNA vector, the necessary elements for replication and translation, when introduced into a suitable host cell. . Expression vectors may include plasmids, phagemids, viruses and their derivatives.

Экспрессионные векторы по изобретению будут включать полинуклеотиды, кодирующие химерную молекулу.Expression vectors of the invention will include polynucleotides encoding the chimeric molecule.

В одном варианте реализации изобретения кодирующая последовательность химерной молекулы функционально связана с контрольной последовательностью экспрессии. В используемом в данном документе значении, две последовательности нуклеиновой кислоты функционально связаны, когда они ковалентно связаны таким образом, чтобы позволить каждой составляющей последовательности нуклеиновой кислоты сохранять свою функциональность. Говорят, что кодирующая последовательность и контрольная последовательность генной экспрессии функционально связаны, когда они ковалентно связаны таким образом, чтобы поместить экспрессию или транскрипцию и/или трансляцию кодирующей последовательности под влияние или контроль контрольной последовательности генной экспрессии. Говорят, что две ДНК-последовательности функционально связаны, если индукция промотора в 5'-последовательности генной экспрессии приводит к транскрипции кодирующей последовательности, и если природа связи между двумя последовательностями ДНК (1) не приводит к введению мутации со сдвигом рамки, (2) не влияет на способность промоторной области направлять транскрипцию кодирующей последовательности, или (3) не влияет на способность соответствующего РНК-транскрипта транслироваться в белок. Таким образом, последовательность генной экспрессии будет функционально связана с кодирующей последовательностью нуклеиновой кислоты, если последовательность генной экспрессии будет способна вызывать транскрипцию этой кодирующей последовательности нуклеиновой кислоты таким образом, чтобы полученный транскрипт транслировался в желательный белок или полипептид.In one embodiment of the invention, the coding sequence of the chimeric molecule is operably linked to an expression control sequence. As used herein, two nucleic acid sequences are operably linked when they are covalently linked in such a manner as to allow each constituent nucleic acid sequence to retain its functionality. A coding sequence and a gene expression control sequence are said to be operably linked when they are covalently linked in such a manner as to place the expression or transcription and/or translation of the coding sequence under the influence or control of the gene expression control sequence. Two DNA sequences are said to be operably linked if induction of a promoter in the 5' sequence of gene expression results in transcription of the coding sequence, and if the nature of the linkage between the two DNA sequences (1) does not introduce a frameshift mutation, (2) does not affects the ability of the promoter region to direct transcription of the coding sequence, or (3) does not affect the ability of the corresponding RNA transcript to be translated into a protein. Thus, a gene expression sequence will be operably linked to a nucleic acid coding sequence if the gene expression sequence is capable of causing transcription of that nucleic acid coding sequence such that the resulting transcript is translated into the desired protein or polypeptide.

Контрольная последовательность генной экспрессии, в используемом в данном документе значении, представляет собой любую регуляторную нуклеотидную последовательность, такую как промоторная последовательность или комбинация промотор-энхансер, которая способствует эффективной транскрипции и трансляции кодирующей нуклеиновой кислоты, с которой она функционально связана. Контрольная последовательность генной экспрессии может, например, быть промотором млекопитающего или вирусным промотором, таким как конститутивный или индуцируемый промотор. Конститутивные промоторы млекопитающих включают, без ограничений, промоторы следующих генов: гипоксантинфосфорибозилтрансфераза (HPRT), аденозиндеаминаза, пируваткиназа, промотор бета-актина и другие конститутивные промоторы. Типичные примеры вирусных промоторов, которые конститутивно функционируют в эукариотических клетках, включают, например, промоторы цитомегаловируса (CMV), обезьяньего вируса (например, SV40), папилломавируса, аденовируса, вируса иммунодефицита человека (ВИЧ), вируса саркомы Рауса, цитомегаловируса, длинные концевые повторы (LTR) вируса лейкоза Молони и других ретровирусов, и промотор тимидинкиназы вируса простого герпеса. Другие конститутивные промоторы известны рядовым специалистам в данной области техники. Промоторы, пригодные для использования в качестве последовательностей генной экспрессии по изобретению, также включают индуцируемые промоторы. Индуцируемые промоторы экспрессируются в присутствии индуцирующего агента. Например, промотор металлотионеина индуцируется для промотирования транскрипции и транс- 46 041588 ляции в присутствии определенных ионов металлов. Другие индуцируемые промоторы известны рядовым специалистам в данной области техники.A gene expression control sequence, as used herein, is any regulatory nucleotide sequence, such as a promoter sequence or promoter-enhancer combination, that promotes efficient transcription and translation of the coding nucleic acid to which it is operably linked. The gene expression control sequence may, for example, be a mammalian promoter or a viral promoter such as a constitutive or inducible promoter. Mammalian constitutive promoters include, without limitation, the promoters of the following genes: hypoxanthine phosphoribosyltransferase (HPRT), adenosine deaminase, pyruvate kinase, beta-actin promoter, and other constitutive promoters. Typical examples of viral promoters that function constitutively in eukaryotic cells include, for example, promoters of cytomegalovirus (CMV), simian virus (e.g., SV40), papillomavirus, adenovirus, human immunodeficiency virus (HIV), Rous sarcoma virus, cytomegalovirus, long terminal repeats (LTR) of the Moloney leukemia virus and other retroviruses, and the herpes simplex virus thymidine kinase promoter. Other constitutive promoters are known to those of ordinary skill in the art. Promoters suitable for use as gene expression sequences of the invention also include inducible promoters. Inducible promoters are expressed in the presence of an inducing agent. For example, the metallothionein promoter is induced to promote transcription and translation in the presence of certain metal ions. Other inducible promoters are known to those of ordinary skill in the art.

В общем, контрольная последовательность генной экспрессии будет включать, по мере необходимости, 5'-нетранскрибируемые и 5'-нетранслируемые последовательности, принимающие участие в инициации транскрипции и трансляции, соответственно, такие как ТАТА-бокс, кэпирующая последовательность, последовательность СААТ и т.п. В частности, такие 5' нетранскрибируемые последовательности будут включать промоторную область, которая включает промоторную последовательность для контроля транскрипции функционально присоединенной кодирующей нуклеиновой кислоты. Последовательности генной экспрессии необязательно включают энхансерные последовательности или, при необходимости, расположенную против хода транскрипции активаторные последовательности.In general, a gene expression control sequence will include, as appropriate, 5'-non-transcribed and 5'-non-translated sequences involved in the initiation of transcription and translation, respectively, such as a TATA box, a capping sequence, a CAAT sequence, and the like. . In particular, such 5' non-transcribed sequences will include a promoter region that includes a promoter sequence to control transcription of the operably linked coding nucleic acid. Gene expression sequences optionally include enhancer sequences or, if necessary, upstream activator sequences.

Вирусные векторы включают, без ограничений, нуклеиновые последовательности следующих вирусов: ретровируса, такого как вирус мышиного лейкоза Молони, вирус мышиной саркомы Харви, мышиный фактор опухоли молочных желез и вирус саркомы Рауса; аденовируса, аденоассоциированного вируса; вирусов типа SV40; полиомавирусов; вирусов Эпштейна-Барр; папилломавирусов; вируса герпеса; вируса коровьей оспы; вируса полиомиелита; и РНК-вируса, такого как ретровирус. Могут быть легко использованы другие векторы, хорошо известные в данной области техники. Определенные вирусные векторы основаны на нецитопатических эукариотических вирусах, в которых несущественные гены были замещены на ген, представляющий интерес. Нецитопатические вирусы включают ретровирусы, жизненный цикл которых включает обратную транскрипцию геномной вирусной РНК в ДНК с последующей провирусной интеграцией в ДНК клетки-хозяина. Ретровирусы были разрешены для проведения испытаний генной терапии человека. Наиболее пригодными являются ретровирусы, дефицитные по репликации (т.е. способные направлять синтез желательных белков, но неспособные производить инфекционные частицы). Такие генетически измененные ретровирусные экспрессионные векторы находят широкое применение в высокоэффективной трансдукции генов in vivo. Стандартные протоколы получения дефицитных по репликации ретровирусов (включая стадии включения экзогенного генетического материала в плазмиду, трансфекции упаковывающей клеточной линии плазмидой, продуцирования рекомбинантных ретровирусов упаковывающей клеточной линией, сбор вирусных частиц из среды тканевой культуры и инфицирование клеток-мишеней вирусными частицами) приведены в Kriegler, M., Gene Transfer and Expression, A Laboratory Manual, W.H. Freeman Co., New York (1990) и Murry, E. J., Methods in Molecular Biology, Vol. 7, Humana Press, Inc., Cliffton, N.J. (1991).Viral vectors include, without limitation, the nucleic sequences of the following viruses: a retrovirus such as Moloney murine leukemia virus, Harvey murine sarcoma virus, murine mammary tumor factor, and Rous sarcoma virus; adenovirus, adeno-associated virus; viruses of the SV40 type; polyomaviruses; Epstein-Barr viruses; papillomaviruses; herpes virus; vaccinia virus; poliomyelitis virus; and an RNA virus such as a retrovirus. Other vectors well known in the art can easily be used. Certain viral vectors are based on non-cytopathic eukaryotic viruses in which non-essential genes have been replaced with a gene of interest. Non-cytopathic viruses include retroviruses whose life cycle involves reverse transcription of viral genomic RNA into DNA followed by proviral integration into host cell DNA. Retroviruses have been approved for human gene therapy trials. Most useful are replication-deficient retroviruses (ie, capable of directing the synthesis of desired proteins but unable to produce infectious particles). Such genetically modified retroviral expression vectors are widely used in highly efficient in vivo gene transduction. Standard protocols for the production of replication-deficient retroviruses (including the steps of incorporating exogenous genetic material into a plasmid, transfecting a packaging cell line with a plasmid, producing recombinant retroviruses with a packaging cell line, harvesting viral particles from tissue culture media, and infecting target cells with viral particles) are given in Kriegler, M ., Gene Transfer and Expression, A Laboratory Manual, W.H. Freeman Co., New York (1990) and Murry, E. J., Methods in Molecular Biology, Vol. 7, Humana Press, Inc., Cliffton, N.J. (1991).

В одном варианте реализации изобретения вирус представляет собой аденоассоциированный вирус, являющийся двухцепочечным ДНК-вирусом. Аденоассоциированный вирус может быть методами генной инженерии сделан дефицитным по репликации и способен инфицировать широкий спектр клеточных типов и видов. Дополнительно, он обладает такими преимуществами, как теплостойкость и стойкость к действию липидного растворителя; высокая частота трансдукции в клетках различной генеалогии, включая гемопоэтические клетки; и отсутствие ингибирования суперинфекции, тем самым обеспечивая возможность множественных серий трансдукции. Как сообщается, аденоассоциированный вирус может сайт-специфически интегрироваться в клеточную ДНК человека, тем самым минимизируя возможность инсерционного мутагенеза и вариабельность характеристик экспрессии вставленных генов ретровирусной инфекции. Кроме того, инфекции аденоассоциированных вирусов дикого типа прослеживались в тканевых культурах на протяжении более чем 100 пассажей в отсутствие давления отбора, что говорит о том, что геномнная интеграция аденоассоциированного вируса представляет собой относительно стабильное явление. Аденоассоциированный вирус может также функционировать внехромосомально.In one embodiment of the invention, the virus is an adeno-associated virus, which is a double-stranded DNA virus. Adeno-associated virus can be genetically engineered to be replication-deficient and capable of infecting a wide range of cell types and species. Additionally, it has the advantages of heat resistance and lipid solvent resistance; high frequency of transduction in cells of different genealogy, including hematopoietic cells; and no inhibition of superinfection, thereby allowing for multiple series of transduction. As reported, adeno-associated virus can integrate site-specifically into human cellular DNA, thereby minimizing the possibility of insertional mutagenesis and variability in expression patterns of inserted retroviral infection genes. In addition, wild-type adeno-associated virus infections have been traced in tissue cultures for more than 100 passages in the absence of selection pressure, suggesting that adeno-associated virus genomic integration is a relatively stable phenomenon. The adeno-associated virus can also function extrachromosomally.

Другие векторы включают плазмидные векторы. Плазмидные векторы подробно описаны в данной области техники и хорошо известны квалифицированным специалистам в данной области техники. См., например, Sambrook et al., Molecular Cloning: A Laboratory Manual, Second Edition, Cold Spring Harbor Laboratory Press, 1989. В последние несколько лет было обнаружено, что плазмидные векторы являются особенно предпочтительными для доставки генов в клетки in vivo благодаря их неспособности к репликации внутри хозяина и интеграции в его геном. Такие плазмиды, однако, имеющие промотор, совместимый с клеткой-хозяином, могут экспрессировать пептид из гена, функционально кодируемого в плазмиде. Некоторые широко используемые плазмиды, доступные от коммерческих поставщиков, включают pBR322, pUC18, pUC19, различные pcDNA-плазмиды, pRC/CMV, различные pCMV-плазмиды, pSV40 и pBlueScript. Дополнительные примеры конкретных плазмид включают pcDNA3.1, номер по каталогу V79020; pcDNA3.1/hygro, номер по каталогу V87020; pcDNA4/myc-His, номер по каталогу V86320; и pBudCE4.1, номер по каталогу V53220, все от фирмы Invitrogen (Carlsbad, CA.). Другие плазмиды хорошо известны рядовым специалистам в данной области техники. Дополнительно, плазмиды могут быть сконструированы на заказ с использованием стандартных методов молекулярной биологии для удаления и/или добавления конкретных фрагментов ДНК.Other vectors include plasmid vectors. Plasmid vectors are described in detail in the art and are well known to those skilled in the art. See, for example, Sambrook et al., Molecular Cloning: A Laboratory Manual, Second Edition, Cold Spring Harbor Laboratory Press, 1989. In the past few years, plasmid vectors have been found to be particularly preferred for delivering genes to cells in vivo due to their inability to replicate within the host and integrate into its genome. Such plasmids, however, having a promoter compatible with the host cell, can express a peptide from a gene operably encoded in the plasmid. Some commonly used plasmids available from commercial vendors include pBR322, pUC18, pUC19, various pcDNA plasmids, pRC/CMV, various pCMV plasmids, pSV40 and pBlueScript. Additional examples of specific plasmids include pcDNA3.1, catalog number V79020; pcDNA3.1/hygro, part number V87020; pcDNA4/myc-His, part number V86320; and pBudCE4.1, part number V53220, all from Invitrogen (Carlsbad, CA.). Other plasmids are well known to those of ordinary skill in the art. Additionally, plasmids can be custom designed using standard molecular biology techniques to remove and/or add specific DNA fragments.

В одной системе экспрессии на основе насекомых, которая может быть использована для получения белков по изобретению, вирус ядерного полиэдроза (polyhidrosis) Autographa californica (AcNPV) используется в качестве вектора для экспрессии чужеродных генов. Вирус выращивается в клетках Spodoptera frugiperda.In one insect-based expression system that can be used to produce proteins of the invention, Autographa californica polyhidrosis virus (AcNPV) is used as a vector for expression of foreign genes. The virus is grown in Spodoptera frugiperda cells.

- 47 041588- 47 041588

Кодирующая последовательность может быть клонирована в несущественные области (например, ген полиэдрона) вируса и помещен под контроль промотора ACNPV (например, промотор полиэдрона). Успешная вставка кодирующей последовательности будет приводить к инактивации гена полиэдрона и продуцированию неокклюдированного рекомбинантного вируса (т.е. вируса, не имеющего белковой оболочки, кодируемой геном полиэдрона). Такие рекомбинантные вирусы затем используются для инфицирования клеток Spodoptera frugiperda, в которых экспрессируется вставленный ген. (см., например, Smith et al. (1983) J Virol 46:584; патент США № 4215051). Дополнительные примеры этой системы экспрессии можно найти в Ausubel et al., eds. (1989) Current Protocols in Molecular Biology, Vol. 2, Greene Publish. Assoc. & Wiley Interscience.The coding sequence can be cloned into non-essential regions (eg polyhedron gene) of the virus and placed under the control of the ACNPV promoter (eg polyhedron promoter). Successful insertion of a coding sequence will result in the inactivation of the polyhedron gene and the production of a non-occluded recombinant virus (ie, a virus lacking the protein coat encoded by the polyhedron gene). These recombinant viruses are then used to infect Spodoptera frugiperda cells that express the inserted gene. (See, for example, Smith et al. (1983) J Virol 46:584; US Pat. No. 4,215,051). Additional examples of this expression system can be found in Ausubel et al., eds. (1989) Current Protocols in Molecular Biology, Vol. 2, Greene Publishing. Assoc. & Wiley Interscience.

Другая система, которая может быть использована для экспрессии белков по изобретению, представляет собой систему экспрессии гена глутаминсинтетазы, также называемую экспрессионной системой GS (Lonza Biologies PLC, Berkshire UK). Эта система экспрессии описана подробно в патенте США № 5981216.Another system that can be used to express the proteins of the invention is the glutamine synthetase gene expression system, also referred to as the GS expression system (Lonza Biologies PLC, Berkshire UK). This expression system is described in detail in US Pat. No. 5,981,216.

В клетках-хозяевах млекопитающих может быть использован ряд систем экспрессии на основе вирусов. В тех случаях, когда в качестве экспрессионного вектора используется аденовирус, кодирующая последовательность может быть лигирована с комплексом контроля транскрипции/трансляции аденовируса, например поздним промотором и тройственной лидерной последовательностью. Этот химерный ген может быть затем вставлен в геном аденовируса путем in vitro или in vivo рекомбинации. Вставка в несущественную область вирусного генома (например, область Е1 или Е3) будет приводить к получению рекомбинантного вируса, который является жизнеспособным и способен экспрессировать пептид в инфицированных хозяевах. См., например, Logan & Shenk (1984) Proc Natl Acad Sci USA 81:3655). Альтернативно, может быть использован промотор 7,5 K коровьей оспы. См., например, Mackett et al. (1982) Proc Natl Acad Sci USA 79:7415; Mackett et al. (1984) J Virol 49:857; Panicali et al. (1982) Proc Natl Acad Sci USA 79:4927.A number of virus-based expression systems can be used in mammalian host cells. Where an adenovirus is used as the expression vector, the coding sequence may be ligated to an adenovirus transcription/translation control complex, such as a late promoter and a tri-leader sequence. This chimeric gene can then be inserted into the adenovirus genome by in vitro or in vivo recombination. Insertion into a non-essential region of the viral genome (eg, the E1 or E3 region) will result in a recombinant virus that is viable and capable of expressing the peptide in infected hosts. See, for example, Logan & Shenk (1984) Proc Natl Acad Sci USA 81:3655). Alternatively, the vaccinia 7.5 K promoter can be used. See, for example, Mackett et al. (1982) Proc Natl Acad Sci USA 79:7415; Mackett et al. (1984) J Virol 49:857; Panicali et al. (1982) Proc Natl Acad Sci USA 79:4927.

Для повышения эффективности продуцирования, полинуклеотиды могут быть сконструированы таким образом, чтобы они кодировали множество звеньев белка по изобретению, разделенных сайтами ферментативного расщепления. Полученный полипептид может быть расщеплен (например, путем обработки пригодным ферментом) для выделения полипептидных звеньев. Это может увеличивать выход полипептидов, управляемый одним промотором. В случае использования в пригодных системах вирусной экспрессии, управление трансляцией каждого полипептида, кодируемого мРНК, осуществляется внутри транскрипта; например, внутренним рибосомо-связывающим сайтом, IRES. Таким образом, полицистронный конструкт направляет транскрипцию отдельной большой полицистронной мРНК, которая, в свою очередь, управляет трансляцией множества индивидуальных полипептидов. Этот подход устраняет продуцирование и ферментативный процессинг полипротеинов и может значительно увеличить выход полипептидов, управляемый одним промотором.To improve production efficiency, polynucleotides can be designed to encode multiple protein units of the invention separated by enzymatic cleavage sites. The resulting polypeptide can be cleaved (eg, by treatment with a suitable enzyme) to isolate the polypeptide units. This can increase the yield of polypeptides driven by a single promoter. When used in suitable viral expression systems, translational control of each mRNA-encoded polypeptide occurs within the transcript; for example, an internal ribosome binding site, IRES. Thus, the polycistronic construct directs the transcription of a single large polycistronic mRNA, which in turn directs the translation of multiple individual polypeptides. This approach eliminates the production and enzymatic processing of polyproteins and can significantly increase the yield of polypeptides driven by a single promoter.

Векторы, используемые для трансформации, будут обычно содержать селектируемый маркер, используемый для идентификации трансформантов. В бактериальных системах, они могут включать ген резистентности к антибиотику, такому как ампициллин или канамицин. Селектируемые маркеры для использования в культивируемых клетках млекопитающего включают гены, придающие резистентность к лекарственным средствам, таким как неомицин, гигромицин и метотрексат. Селектируемый маркер может быть амплифициуемым селектируемым маркером. Одним из амплифициуемых селектируемых маркеров является ген дигидрофолатредуктазы (DHFR). Simonsen С С et al. (1983) Proc Natl Acad Sci USA 80:2495-9. Обзор селектируемых маркеров выполнен Thilly (1986) Mammalian Cell Technology, Butterworth Publishers, Stoneham, Mass, и выбор селектируемых маркеров легко доступен рядовому специалисту в данной области техники.Vectors used for transformation will typically contain a selectable marker used to identify transformants. In bacterial systems, they may include a gene for resistance to an antibiotic such as ampicillin or kanamycin. Selectable markers for use in cultured mammalian cells include genes conferring drug resistance such as neomycin, hygromycin and methotrexate. The selectable marker may be an amplifiable selectable marker. One amplifiable selectable marker is the dihydrofolate reductase (DHFR) gene. Simonsen C C et al. (1983) Proc Natl Acad Sci USA 80:2495-9. A review of selectable markers is by Thilly (1986) Mammalian Cell Technology, Butterworth Publishers, Stoneham, Mass, and selection of selectable markers is readily available to one of ordinary skill in the art.

Селектируемые маркеры могут быть введены в клетку на отдельной плазмиде в то же время, что и ген, представляющий интерес, или они могут быть введены на той же самой плазмиде. При использовании одной и той же самой плазмиды, селектируемый маркер и ген, представляющий интерес, могут находиться под контролем разных промоторов или одного и того же промотора, причем в последнем случае продуцируется дицистронная мРНК. Конструкты этого типа известны в данной области техники (например, патент США № 4713339).Selectable markers can be introduced into the cell on a separate plasmid at the same time as the gene of interest, or they can be introduced on the same plasmid. When using the same plasmid, the selectable marker and the gene of interest may be under the control of different promoters or the same promoter, in which case a dicistronic mRNA is produced. Constructs of this type are known in the art (eg US Pat. No. 4,713,339).

Экспрессионные векторы могут кодировать метки, позволяющие легко очищать рекомбинантно полученный белок. Примеры включают, без ограничений, вектор pUR278 (Ruther et al. (1983) EMBO J 2:1791), в котором кодирующие последовательности белка, который должен экспрессироваться, могут быть лигированы в вектор в рамке с кодирующей областью lac z, так чтобы был получен меченый слитый белок; векторы pGEX могут быть использованы для экспрессии белков по изобретению с меткой глутатион-Sтрансферазы (GST). Такие белки обычно являются растворимыми и могут быть легко очищены от клеток путем адсорбции на глутатион-агарозных бусинах с последующей элюцией в присутствии свободного глутатиона. Векторы включают сайты расщепления (тромбином или протеазой фактора Ха или PRESCISSION PRONEASE™ (Pharmacia, Peapack, N. J.)) для простоты удаления метки после очистки.Expression vectors can encode labels that allow easy purification of the recombinantly produced protein. Examples include, without limitation, the pUR278 vector (Ruther et al. (1983) EMBO J 2:1791) in which the coding sequences for the protein to be expressed can be ligated into a vector in frame with the lac z coding region such that a labeled fusion protein; pGEX vectors can be used to express the proteins of the invention tagged with glutathione S transferase (GST). Such proteins are usually soluble and can be easily purified from cells by adsorption to glutathione-agarose beads followed by elution in the presence of free glutathione. The vectors include cleavage sites (by thrombin or factor Xa protease or PRESCISSION PRONEASE™ (Pharmacia, Peapack, N. J.)) for ease of label removal after purification.

Экспрессионный вектор или векторы затем трансфицируют или котрансфицируют в пригодную клетку-мишень, которая экспрессирует полипептиды. Методы трансфекции, известные в данной областиThe expression vector or vectors are then transfected or co-transfected into a suitable target cell that expresses the polypeptides. Transfection methods known in the art

- 48 041588 техники, включают, без ограничений, осаждение фосфата кальция (Wigler et al. (1978) Cell 14:725), электропорацию (Neumann et al. (1982) EMBO J 1:841) и использование реагентов на основе липосом. Различные системы хозяин-экспрессионный вектор могут быть использованы для экспрессии белков, описанных в данном документе, включая как прокариотические, так и эукариотические клетки. Они включают, без ограничений, микроорганизмы, такие как бактерии (например, Е. coli), трансформированные экспрессионными векторами на основе ДНК рекомбинантного бактериофага или плазмидной ДНК, содержащими пригодную кодирующую последовательность; дрожжи или нитчатые грибы, трансформированные экспрессионными векторами рекомбинантных дрожжей или грибов, содержащими пригодную кодирующую последовательность; системы на основе клеток насекомых, инфицированных экспрессионными векторами на основе рекомбинантного вируса (например, бакуловируса) содержащими пригодную кодирующую последовательность; системы растительных клеток, инфицированных экспрессионными векторами на основе рекомбинантного вируса (например, вируса мозаики цветной капусты или вируса мозаики табака), или трансформированных экспрессионными векторами на основе рекомбинантной плазмиды (например, Ti-плазмиды), содержащими пригодную кодирующую последовательность; или системы клеток животных, включая клетки млекопитающего (например, клетки HEK 293, СНО, Cos, HeLa, HKB11 и BHK).- 48 041588 techniques include, without limitation, calcium phosphate precipitation (Wigler et al. (1978) Cell 14:725), electroporation (Neumann et al. (1982) EMBO J 1:841) and the use of liposome-based reagents. Various host-expression vector systems can be used to express the proteins described herein, including both prokaryotic and eukaryotic cells. These include, without limitation, microorganisms such as bacteria (eg, E. coli) transformed with recombinant bacteriophage or plasmid DNA expression vectors containing a suitable coding sequence; yeast or filamentous fungi transformed with recombinant yeast or fungal expression vectors containing a suitable coding sequence; insect cell systems infected with recombinant virus (eg, baculovirus) expression vectors containing a suitable coding sequence; plant cell systems infected with recombinant virus expression vectors (eg cauliflower mosaic virus or tobacco mosaic virus) or transformed with recombinant plasmid expression vectors (eg Ti plasmids) containing a suitable coding sequence; or animal cell systems, including mammalian cells (eg, HEK 293, CHO, Cos, HeLa, HKB11 and BHK cells).

В одном варианте реализации изобретения клетка-хозяин представляет собой эукариотическую клетку. В используемом в данном документе значении, эукариотическая клетка относится к любой животной или растительной клетке, имеющей определенное ядро. Эукариотические клетки животных включают клетки позвоночных, например млекопитающих и клетки беспозвоночных, например насекомых. Эукариотически клетки растений могут включать, в частности, без ограничений, дрожжевые клетки. Эукариотическая клетка отличается от прокариотической клетки, например, бактерий. В определенных вариантах реализации изобретения эукариотическая клетка представляет собой клетку млекопитающего. Клетка млекопитающего является любой клеткой, полученной от млекопитающего. Клетки млекопитающего конкретно включают, без ограничений, клеточные линии млекопитающих. В одном варианте реализации изобретения клетка млекопитающего представляет собой человеческую клетку. В другом варианте реализации изобретения клетка млекопитающего представляет собой клетку HEK 293, которая является клеточной линией почки эмбриона человека. Клетки HEK 293 доступны как CRL-1533 из Американской коллекции типовых культур (American Type Culture Collection, Manassas, VA) и как клетки 293-Н, № кат. 11631-017, или клетки 293-F, № кат. 11625-019, от фирмы Invitrogen (Carlsbad, Calif.). В некоторых вариантах реализации изобретения клетка млекопитающего представляет собой клетку PER.C6 , которая является человеческую клеточную линию, выделенную из сетчатки. Клетки PER.C6 доступны от фирмы Crucell (Leiden, Netherlands). В других вариантах реализации изобретения клетка млекопитающего представляет собой клетку яичника китайского хомячка (СНО). Клетки СНО доступны от Американской коллекции типовых культур (Manassas, VA) (например, СНО-Ki; CCL-61). В еще одних вариантах реализации изобретения клетка млекопитающего представляет собой клетку почки детеныша хомяка (BHK). Клетки BHK доступны от Американской коллекции типовых культур (Manassas, Va.) (например, CRL-1632). В некоторых вариантах реализации изобретения клетка млекопитающего представляет собой клетку HKB11, которая является гибридной клеточной линией клетки HEK293 и человеческой В-клеточной линии. Mei et al, Mol. Biotechnol. 34(2): 165-78 (2006). В одном варианте реализации изобретения плазмида, кодирующая белок VWF, линкер VWF, гетерологичный фрагмент или химерный белок по изобретению, дополнительно включает селектируемый маркер, например, резистентности к зеоцину, и трансфицируется в клетки HEK 293 для продуцирования химерного белка. В еще одних вариантах реализации изобретения трансфицированные клетки являются стабильно трансфицированными. Такие клетки могут быть селектированы и поддерживаться в виде стабильной клеточной лини с использованием обычных методик, известных квалифицированным специалистам в данной области техники. Клетки-хозяева, содержаще ДНК-конструкты белка, выращивают в пригодной питательной среде. В используемом в данном документе значении, термин пригодная питательная среда означает среду, содержащую питательные вещества, требующиеся для роста клеток. Питательные вещества, необходимые для роста клеток, могут включать источник углерода, источник азота, незаменимые аминокислоты, витамины, минеральные вещества и факторы роста. Необязательно, среды могут содержать один или более факторов селекции. Необязательно, среды могут содержать сыворотку теленка или сыворотку плода коровы (FCS). В одном варианте реализации изобретения среды по существу не содержат IgG. Питательную среду обычно подвергают селектированию на клетки, содержащие ДНК-конструкт, например, с помощью лекарственного средства или дефицита необходимого питательного вещества, которые дополняются селектируемым маркером на ДНК-конструкте, или ко-трансфицированные ДНКконструктом. Культивируемые клетки млекопитающих обычно выращивают в коммерчески доступных содержащих сыворотку или бессывороточных средах (например, MEM, DMEM, DMEM/F12). В одном варианте реализации изобретения среда представляет собой CD293 (Invitrogen, Carlsbad, CA.). В другом варианте реализации изобретения среда представляет собой CD17 (Invitrogen, Carlsbad, CA.). Выбор среды, пригодной для конкретной используемой клеточной линии, легко доступен рядовым специалистам в данной области техники.In one embodiment, the host cell is a eukaryotic cell. As used herein, a eukaryotic cell refers to any animal or plant cell having a defined nucleus. Animal eukaryotic cells include cells from vertebrates, such as mammals, and cells from invertebrates, such as insects. Eukaryotic plant cells may include, in particular, without limitation, yeast cells. A eukaryotic cell is different from a prokaryotic cell such as bacteria. In certain embodiments of the invention, the eukaryotic cell is a mammalian cell. A mammalian cell is any cell derived from a mammal. Mammalian cells specifically include, without limitation, mammalian cell lines. In one embodiment, the mammalian cell is a human cell. In another embodiment, the mammalian cell is a HEK 293 cell, which is a human embryonic kidney cell line. HEK 293 cells are available as CRL-1533 from the American Type Culture Collection (Manassas, VA) and as 293-H cells, cat no. 11631-017, or cages 293-F, cat. no. 11625-019, from Invitrogen (Carlsbad, Calif.). In some embodiments, the mammalian cell is a PER.C6 cell, which is a human cell line isolated from the retina. PER.C6 cells are available from Crucell (Leiden, Netherlands). In other embodiments, the mammalian cell is a Chinese Hamster Ovary (CHO) cell. CHO cells are available from the American Type Culture Collection (Manassas, VA) (eg, CHO-Ki; CCL-61). In still other embodiments, the mammalian cell is a baby hamster kidney (BHK) cell. BHK cells are available from the American Type Culture Collection (Manassas, Va.) (eg CRL-1632). In some embodiments, the mammalian cell is an HKB11 cell, which is a hybrid cell line of a HEK293 cell and a human B cell line. Mei et al, Mol. Biotechnol. 34(2): 165-78 (2006). In one embodiment, a plasmid encoding a VWF protein, VWF linker, heterologous fragment, or chimeric protein of the invention further includes a selectable marker, such as zeocin resistance, and is transfected into HEK 293 cells to produce the chimeric protein. In still other embodiments of the invention, the transfected cells are stably transfected. Such cells can be selected and maintained as a stable cell line using conventional techniques known to those skilled in the art. Host cells containing the DNA constructs of the protein are grown in a suitable nutrient medium. As used herein, the term suitable growth medium means a medium containing nutrients required for cell growth. Nutrients required for cell growth may include a carbon source, a nitrogen source, essential amino acids, vitamins, minerals, and growth factors. Optionally, the media may contain one or more selection factors. Optionally, the media may contain calf serum or fetal bovine serum (FCS). In one embodiment, the media are substantially free of IgG. The culture medium is typically selected for cells containing the DNA construct, for example by drug or essential nutrient deficiency supplemented with a selectable marker on the DNA construct, or co-transfected with the DNA construct. Cultured mammalian cells are usually grown in commercially available serum-containing or serum-free media (eg, MEM, DMEM, DMEM/F12). In one embodiment, the medium is CD293 (Invitrogen, Carlsbad, CA.). In another embodiment, the medium is CD17 (Invitrogen, Carlsbad, CA.). The choice of medium suitable for the particular cell line used is readily available to those of ordinary skill in the art.

- 49 041588- 49 041588

Для коэкспрессии двух полипептидных цепей химерной молекулы, как описано в данном документе, клетки-хозяева культивируют в условиях, обеспечивающих возможность экспрессии обоих цепей. В используемом в данном документе значении, культивация относится к поддержанию жизнеспособности клеток in vitro в течение, по меньшей мере, определенного времени. Поддержание может необязательно включать увеличение популяции живых клеток. Например, клетки, поддерживаемые в культуре, могут быть статичными по популяции, но при этом жизнеспособными и способными продуцировать желательный продукт, например рекомбинантный белок или рекомбинантный слитый белок. Пригодные условия для культивации эукариотических клеток хорошо известны в данной области техники и включают надлежащий выбор культуральных сред, добавок для сред, температуры, рН, кислородного насыщения и т.п. Для коммерческих целей, культивация может включать использование любой из различных типов систем масштабирования, включая встряхиваемые колбы, роллер-флаконы, биореакторы на основе полых волокон, биореакторы с перемешиваемой емкостью, эрлифтные биореакторы, биореакторы Wave и другие.To co-express the two polypeptide chains of a chimeric molecule as described herein, host cells are cultured under conditions that allow both chains to be expressed. As used herein, cultivation refers to maintaining the viability of cells in vitro for at least a certain amount of time. Maintenance may optionally include an increase in the population of living cells. For example, cells maintained in culture may be population static, yet viable and capable of producing the desired product, such as a recombinant protein or recombinant fusion protein. Suitable conditions for culturing eukaryotic cells are well known in the art and include proper selection of culture media, media additives, temperature, pH, oxygen saturation, and the like. For commercial purposes, cultivation may involve the use of any of various types of scaling systems, including shake flasks, roller bottles, hollow fiber bioreactors, stirred tank bioreactors, airlift bioreactors, wave bioreactors, and others.

Условия клеточных культур также выбирают таким образом, чтобы обеспечить возможность ассоциации первой цепи и второй цепи химерной молекулы. Условия, позволяющие осуществлять экспрессию химерной молекулы, могут включать присутствие источника витамина K. Например, в одном варианте реализации изобретения стабильно трансфицированные клетки HEK 293 культивируют в среде CD293 (Invitrogen, Carlsbad, CA) или среде OptiCHO (Invitrogen, Carlsbad, CA) с добавкой 4 мМ глутамина. В одном аспекте настоящее изобретение касается способа экспрессии, получения или продуцирования химерного белка, включающего: а) трансфекцию клетки-хозяина полинуклеотидом, кодирующим химерную молекулу, и b) культивацию клетки-хозяина в культуральной среде в условиях, пригодных для экспрессии химерной молекулы, в котором осуществляется экспрессия химерной молекулы.Cell culture conditions are also chosen to allow association of the first strand and second strand of the chimeric molecule. Conditions to allow expression of the chimeric molecule may include the presence of a vitamin K source. For example, in one embodiment, stably transfected HEK 293 cells are cultured in CD293 medium (Invitrogen, Carlsbad, CA) or OptiCHO medium (Invitrogen, Carlsbad, CA) supplemented with 4 mM glutamine. In one aspect, the present invention relates to a method for expressing, obtaining or producing a chimeric protein, comprising: a) transfecting a host cell with a polynucleotide encoding a chimeric molecule, and b) culturing the host cell in a culture medium under conditions suitable for expressing the chimeric molecule, in which the chimeric molecule is expressed.

В дополнительных вариантах реализации изобретения белковый продукт, содержащий химерную молекулу, секретируется в среду. Среда отделяется от клеток, концентрируется, фильтруется и затем пропускается через две или три колонки для аффинной хроматографии, например колонку с белком А и одну или две анионнообменные колонки.In additional embodiments of the invention, the protein product containing the chimeric molecule is secreted into the medium. The medium is separated from the cells, concentrated, filtered and then passed through two or three affinity chromatography columns, such as a protein A column and one or two anion exchange columns.

В определенных аспектах настоящее изобретение относится к химерному полипептиду, полученному способами, описанными в данном документе.In certain aspects, the present invention relates to a chimeric polypeptide obtained by the methods described in this document.

In vitro продуцирование позволяет осуществлять масштабирование для получения больших количеств желательных измененных полипептидов по изобретению. Методики культивации клеток млекопитающих в условиях для тканевых культур известны в данной области техники и включают гомогенную суспензионную культуру, например, в эрлифтном реакторе или в реакторе с непрерывным перемешиванием, или иммобилизованную или удерживаемую клеточную культуру, например, в пустотелых волокнах, микрокапсулах, на агарозных микробусинах или керамических картриджах. При необходимости и/или желании, растворы полипептидов могут быть очищены обычными хроматографическими способами, например гель-фильтрацией, ионообменной хроматографией, хроматографией гидрофобных взаимодействий (HIC), хроматографией на DEAE-целлюлозе или аффинной хроматографией.In vitro production allows scaling up to produce large amounts of the desired modified polypeptides of the invention. Techniques for cultivating mammalian cells under tissue culture conditions are known in the art and include homogeneous suspension culture, e.g., in an airlift or continuously stirred reactor, or immobilized or retained cell culture, e.g., in hollow fibers, microcapsules, on agarose microbeads. or ceramic cartridges. If necessary and/or desired, polypeptide solutions can be purified by conventional chromatographic techniques, for example gel filtration, ion exchange chromatography, hydrophobic interaction chromatography (HIC), DEAE-cellulose chromatography, or affinity chromatography.

Изобретение также включает способ улучшения F VШ-активности химерного белка FVIII, содержащего белок VWF, слитый с первым гетерологичным фрагментом и последовательностью XTEN, и белок FVIII, соединенный со вторым гетерологичным фрагментом, включающий вставку линкера VWF между белком VWF и первым гетерологичным фрагментом, причем линкер VWF содержит полипептид, выбранный из: (i) области а2 из фактора VIII (FVIII); (ii) области a1 из FVIII; (iii) области а3 из FVIII; (iv) сайта расщепления тромбином, содержащего X-V-P-R (SEQ ID NO: 3) и мотив экзосайта взаимодействия PAR1, где X представляет собой алифатическую аминокислоту; или (v) любой их комбинации. В некоторых вариантах реализации изобретения FVIII-активность измеряют путем анализа активированного частичного тромбопластинового времени (АЧТВ) или методом ротационной тромбозластометрии (ROTEM).The invention also includes a method for improving the FVIII activity of a chimeric FVIII protein containing a VWF protein fused to a first heterologous fragment and an XTEN sequence and an FVIII protein fused to a second heterologous fragment, comprising inserting a VWF linker between the VWF protein and the first heterologous fragment, wherein the linker The VWF contains a polypeptide selected from: (i) the a2 region of factor VIII (FVIII); (ii) regions a1 of FVIII; (iii) a3 regions from FVIII; (iv) a thrombin cleavage site containing X-V-P-R (SEQ ID NO: 3) and a PAR1 interaction exosite motif, where X is an aliphatic amino acid; or (v) any combination thereof. In some embodiments, FVIII activity is measured by activated partial thromboplastin time (APTT) analysis or by rotational thromboclastometry (ROTEM).

IV. Фармацевтическая композиция.IV. Pharmaceutical composition.

Композиции, содержащие химерную молекулу по настоящему изобретению, могут содержать пригодный фармацевтически приемлемый носитель. Например, они могут содержать эксципиенты и/или вспомогательные вещества, облегчающие переработку активных соединений в препараты, предназначенные для доставки к месту действия.Compositions containing a chimeric molecule of the present invention may contain a suitable pharmaceutically acceptable carrier. For example, they may contain excipients and/or excipients to facilitate the processing of the active compounds into preparations intended for delivery to the site of action.

Фармацевтическая композиция может быть составлена для парентерального введения (т.е. внутривенного, подкожного, или внутримышечного) путем болюсной инъекции. Композиции для инъекций могут быть представлены в дозированных лекарственных формах, например в ампулах или в многодозовых контейнерах с добавленным консервантом. Композиции могут иметь такие формы, как суспензии, растворы или эмульсии в масляных или водных носителях, и содержать вспомогательные вещества, такие как суспендирующие, стабилизирующие и/или диспергирующие агенты. Альтернативно, активный ингредиент может находиться в форме порошка для восстановления пригодным носителем, например апирогенной водой.The pharmaceutical composition may be formulated for parenteral administration (ie intravenous, subcutaneous, or intramuscular) by bolus injection. Compositions for injection may be presented in unit dosage forms, for example in ampoules or in multi-dose containers with an added preservative. The compositions may take such forms as suspensions, solutions or emulsions in oily or aqueous vehicles and may contain adjuvants such as suspending, stabilizing and/or dispersing agents. Alternatively, the active ingredient may be in the form of a powder for reconstitution with a suitable vehicle, such as pyrogen-free water.

Пригодные композиции для парентерального введения также включают водные растворы активных соединений в водорастворимой форме, например, водорастворимых солей. Кроме того, суспензии активных соединений могут быть введены в виде соответствующих масляных суспензий для инъекции. Пригодные липофильные растворители или носители включают жирные масла, например кунжутное масло,Suitable compositions for parenteral administration also include aqueous solutions of the active compounds in water-soluble form, for example water-soluble salts. In addition, suspensions of the active compounds may be administered as appropriate oily injection suspensions. Suitable lipophilic solvents or carriers include fatty oils such as sesame oil,

- 50 041588 или сложные эфиры синтетических жирных кислот, например этилолеат или триглицериды. Водные суспензии для инъекции могут содержать вещества, которые увеличивают вязкость суспензии, включая, например, натрия карбоксиметилцеллюлозу, сорбит и декстран. Необязательно, суспензия может также содержать стабилизаторы. Липосомы также могут быть использованы для инкапсулирования молекул по изобретению для доставки в клетки или интерстициальное пространство. Типичными примерами фармацевтически приемлемых носителей являются физиологически совместимые растворители, дисперсионные среды, покрытия, антибактериальные и противогрибковые агенты, изотонические и замедляющие всасывание агенты, вода, солевой раствор, фосфатно-солевой буфер, декстроза, глицерин, этанол и т.п. В некоторых вариантах реализации изобретения композиция содержит изотонические агенты, например сахара, многоатомные спирты, такие как маннит, сорбит, или хлорид натрия. В других вариантах реализации изобретения композиции содержат фармацевтически приемлемые вещества, такие как смачивающие агенты или небольшие количества вспомогательных веществ, таких как смачивающие или эмульгирующие агенты, консерванты или буферы, которые увеличивают срок хранения или эффективность активных ингредиентов.- 50 041588 or esters of synthetic fatty acids, such as ethyl oleate or triglycerides. Aqueous suspensions for injection may contain substances that increase the viscosity of the suspension, including, for example, sodium carboxymethylcellulose, sorbitol, and dextran. Optionally, the suspension may also contain stabilizers. Liposomes can also be used to encapsulate molecules of the invention for delivery to cells or the interstitial space. Typical examples of pharmaceutically acceptable carriers are physiologically compatible solvents, dispersion media, coatings, antibacterial and antifungal agents, isotonic and retarding agents, water, saline, phosphate buffered saline, dextrose, glycerol, ethanol, and the like. In some embodiments of the invention, the composition contains isotonic agents, such as sugars, polyhydric alcohols such as mannitol, sorbitol, or sodium chloride. In other embodiments of the invention, the compositions contain pharmaceutically acceptable substances, such as wetting agents or small amounts of auxiliary substances, such as wetting or emulsifying agents, preservatives or buffers, which increase the shelf life or effectiveness of the active ingredients.

Композиции по изобретению могут находиться в различных формах, включая, например, жидкости (например, растворы для инъекций и инфузий), дисперсии, суспензии, полутвердые и твердые лекарственные формы. Предпочтительная форма зависит от способа введения и терапевтического применения.Compositions of the invention may be in various forms, including, for example, liquids (eg solutions for injection and infusion), dispersions, suspensions, semi-solid and solid dosage forms. The preferred form depends on the route of administration and therapeutic application.

Композиция может быть составлена в виде раствора, микроэмульсии, дисперсии, липосом или других упорядоченных структур, пригодных для обеспечения высоких концентраций лекарственного средства. Стерильные растворы для инъекций могут быть приготовлены путем включения активного ингредиента в требуемом количестве в пригодный растворитель с одним из или комбинацией ингредиентов, перечисленных выше, в зависимости от потребности, с последующей стерилизацией фильтрованием. В общем, дисперсии готовят путем включения активного ингредиента в стерильный носитель, содержащий основную дисперсионную среду и другие необходимые ингредиенты из перечисленных выше. В случае стерильных порошков для приготовления стерильных растворов для инъекций, предпочтительными способами получения являются вакуумная сушка и лиофилизация, позволяющие получить порошок активного ингредиента плюс любой дополнительный желательный ингредиент из предварительно стерильно профильтрованного раствора. Надлежащая текучесть раствора может поддерживаться, например, путем использования покрытия, такого как лецитин, путем поддержания требуемого размера частиц в случае дисперсии, и путем использования поверхностно-активных веществ. Пролонгированное всасывание композиций для инъекций может быть обеспечено путем включения в композиции агента, замедляющего всасывание, например моностеаратных солей и желатина.The composition may be formulated as a solution, microemulsion, dispersion, liposomes, or other ordered structures suitable for providing high drug concentrations. Sterile injectable solutions can be prepared by incorporating the active ingredient in the required amount in a suitable diluent with one or a combination of the ingredients listed above, as appropriate, followed by filtered sterilization. In general, dispersions are prepared by incorporating the active ingredient into a sterile vehicle containing a basic dispersion medium and the other necessary ingredients listed above. In the case of sterile powders for the preparation of sterile injectable solutions, the preferred methods of preparation are vacuum drying and lyophilization to obtain a powder of the active ingredient plus any additional desired ingredient from a pre-sterile filtered solution. Proper fluidity of the solution can be maintained, for example, by using a coating such as lecithin, by maintaining the desired particle size in the case of a dispersion, and by using surfactants. Prolonged absorption of injectable compositions can be achieved by including an absorption delaying agent, such as monostearate salts and gelatin, in the compositions.

Композиция активного ингредиента может быть приготовлена с использованием рецептуры композиции или устройства с пролонгированным высвобождением. Примеры таких композиций и устройств включают имплантаты, трансдермальные пластыри и микроинкапсулированные системы доставки. Могут быть использованы биодеградируемые биосовместимые полимеры, например этилен-винилацетат, полиангидриды, полигликолевая кислота, коллаген, полиортоэфиры и полимолочная кислота. Способы получения таких композиций и устройств известны в данной области техники. См., например, Sustained and Controlled Release Drug Delivery Systems, J. R. Robinson, ed., Marcel Dekker, Inc., New York, 1978.The composition of the active ingredient may be formulated using a formulation or sustained release device. Examples of such compositions and devices include implants, transdermal patches, and microencapsulated delivery systems. Biodegradable biocompatible polymers can be used, for example ethylene-vinyl acetate, polyanhydrides, polyglycolic acid, collagen, polyorthoesters and polylactic acid. Methods for preparing such compositions and devices are known in the art. See, for example, Sustained and Controlled Release Drug Delivery Systems, J. R. Robinson, ed., Marcel Dekker, Inc., New York, 1978.

Композиции депо для инъекций могут быть изготовлены путем формирования микроинкапсулированных матриц лекарственного средства в биодеградируемых полимерах, таких как полилактидполигликолид. В зависимости от соотношения лекарственного средства и полимера, и природы используемого полимера, можно контролировать скорость высвобождения лекарственного средства. Другими типичными примерами биодеградируемых полимеров являются полиортоэфиры и полиангидриды. Композиции депо для инъекций также могут быть приготовлены путем захвата лекарственного средства в липосомы или микроэмульсии.Depot formulations for injection can be made by forming microencapsulated drug matrices in biodegradable polymers such as polylactide polyglycolide. Depending on the ratio of drug to polymer, and the nature of the polymer used, the rate of drug release can be controlled. Other typical examples of biodegradable polymers are polyorthoesters and polyanhydrides. Depot formulations for injection can also be prepared by entrapping the drug in liposomes or microemulsions.

В композиции могут быть включены дополнительные активные соединения. В одном варианте реализации изобретения составляется композиция химерной молекулы по изобретению с другим фактором свертывания крови, или его вариантом, фрагментом, аналогом или производным. Например, фактор свертывания крови включает, без ограничений, фактор V, фактор VII, фактор VIII, фактор IX, фактор X, фактор XI, фактор XII, фактор XIII, протромбин, фибриноген, фактор фон Виллебранда или рекомбинантный растворимый тканевый фактор (rsTF) или активированные формы любых вышеперечисленных материалов. Фактор свертывания крови гемостатического средства может также включать антифибринолитические лекарственные средства, например эпсилон-аминокапроновую кислоту, транексамовую кислоту.Additional active compounds may be included in the compositions. In one embodiment, a chimeric molecule of the invention is formulated with another coagulation factor, or variant, fragment, analog, or derivative thereof. For example, clotting factor includes, without limitation, factor V, factor VII, factor VIII, factor IX, factor X, factor XI, factor XII, factor XIII, prothrombin, fibrinogen, von Willebrand factor, or recombinant soluble tissue factor (rsTF), or activated forms of any of the above materials. The hemostatic clotting factor may also include antifibrinolytic drugs, eg epsilon aminocaproic acid, tranexamic acid.

Схемы дозирования могут быть отрегулированы для обеспечения оптимальных желательных ответов. Например, может быть введен разовый болюс, может быть введено несколько дробных доз на протяжении определенного периода времени, или доза может быть пропорционально снижена или увеличена в зависимости от требований терапевтической ситуации. Композиции для парентерального введения предпочтительно составляют в виде дозированных лекарственных форм для простоты введения и равномерности дозировки. См., например, Remington's Pharmaceutical Sciences (Mack Pub. Co., Easton, Pa. 1980).Dosing regimens can be adjusted to provide optimal desired responses. For example, a single bolus may be administered, several divided doses may be administered over a period of time, or the dose may be proportionally reduced or increased depending on the requirements of the therapeutic situation. Compositions for parenteral administration are preferably formulated as unit dosage forms for ease of administration and dosage uniformity. See, for example, Remington's Pharmaceutical Sciences (Mack Pub. Co., Easton, Pa. 1980).

- 51 041588- 51 041588

Помимо активного соединения, жидкая лекарственная форма может содержать инертные ингредиенты, такие как вода, этиловый спирт, этилкарбонат, этилацетат, бензиловый спирт, бензилбензоат, пропиленгликоль, 1,3-бутиленгликоль, диметилформамид, масла, глицерин, тетрагидрофурфуриловый спирт, полиэтиленгликоли и сложные эфиры жирных кислот и сорбитана.In addition to the active compound, the liquid dosage form may contain inert ingredients such as water, ethyl alcohol, ethyl carbonate, ethyl acetate, benzyl alcohol, benzyl benzoate, propylene glycol, 1,3-butylene glycol, dimethylformamide, oils, glycerin, tetrahydrofurfuryl alcohol, polyethylene glycols, and fatty esters. acids and sorbitan.

Неограничивающие примеры пригодных фармацевтических носителей также описаны в Remington's Pharmaceutical Sciences by E. W. Martin. Некоторые примеры эксципиентов включают крахмал, глюкозу, лактозу, сахарозу, желатин, солод, рис, муку, мел, силикагель, стеарат натрия, глицеринмоностеарат, тальк, хлорид натрия, сухое снятое молоко, глицерин, пропиленгликоль, воду, этанол и т.п. Композиция может также содержать буферные реагенты для регулирования рН и смачивающие или эмульгирующие агенты.Non-limiting examples of suitable pharmaceutical carriers are also described in Remington's Pharmaceutical Sciences by E. W. Martin. Some examples of excipients include starch, glucose, lactose, sucrose, gelatin, malt, rice, flour, chalk, silica gel, sodium stearate, glycerol monostearate, talc, sodium chloride, skimmed milk powder, glycerin, propylene glycol, water, ethanol, and the like. The composition may also contain pH buffering agents and wetting or emulsifying agents.

Для перорального введения фармацевтическая композиция может находиться в форме таблеток или капсул, приготовленных обычными способами. Композиция также может быть приготовлена в виде жидкости, например сиропа или суспензии. Жидкость может включать суспендирующие агенты (например, сироп сорбит, производные целлюлозы или гидрированные пищевые жиры), эмульгирующие агенты (лецитин или гуммиарабик), неводные носители (например, миндальное масло, масляные сложные эфиры, этиловый спирт или фракционированные растительные масла) и консерванты (например, метил- или пропил-п-гидроксибензоаты или сорбиновую кислоту). Препараты могут также включать вкусовые вещества, красящие вещества и подсластители.For oral administration, the pharmaceutical composition may be in the form of tablets or capsules prepared by conventional methods. The composition may also be prepared as a liquid, such as a syrup or suspension. The liquid may include suspending agents (eg, sorbitol syrup, cellulose derivatives, or hydrogenated edible fats), emulsifying agents (eg, lecithin or gum arabic), non-aqueous vehicles (eg, almond oil, butyric esters, ethyl alcohol, or fractionated vegetable oils), and preservatives (eg. , methyl or propyl p-hydroxybenzoates or sorbic acid). Formulations may also include flavoring agents, coloring agents and sweeteners.

Альтернативно, композиция может представлять собой сухой продукт для восстановления водой или другим пригодным носителем.Alternatively, the composition may be a dry product for reconstitution with water or other suitable vehicle.

Для буккального введения композиция может иметь форму таблеток или пастилок в соответствии с обычными протоколами.For buccal administration, the composition may be in the form of tablets or lozenges according to conventional protocols.

Для введения путем ингаляции соединения для использования в соответствии с настоящим изобретением обычно доставляются в виде распыленного аэрозоля с эксципиентами или без них, или в виде распыляемого аэрозоля из упаковки под давлением или небулайзера, необязательно, с пропеллентом, например дихлордифторметаном, трихлорфторметаном, дихлортетрафторметаном, двуокисью углерода или другим пригодным газом. В случае аэрозоля под давлением дозтрующее устройство может быть получено путем обеспечения клапана для доставки дозируемого количества. Могут быть изготовлены композиции для капсул и картриджей, например, изготовленных из желатина, для использования ингаляторе или инсуфляторе, содержащие порошкообразную смесь соединения и пригодной порошкообразной основы, такой как лактоза или крахмал. Фармацевтическая композиция также может быть приготовлена для ректального введения в виде суппозитория или удерживающей клизмы, например, содержащих обычные основы для суппозиториев, такие как какао-масло или другие глицериды.For administration by inhalation, compounds for use in accordance with the present invention are typically delivered as a nebulized aerosol with or without excipients, or as a nebulized aerosol from a pressurized pack or nebulizer, optionally with a propellant, e.g., dichlorodifluoromethane, trichlorofluoromethane, dichlorotetrafluoromethane, carbon dioxide or other suitable gas. In the case of a pressurized aerosol, a metering device can be obtained by providing a valve to deliver a metered amount. Capsule and cartridge formulations, for example made from gelatin, for use in an inhaler or insufflator can be formulated containing a powder mixture of the compound and a suitable powder base such as lactose or starch. The pharmaceutical composition may also be formulated for rectal administration as a suppository or retention enema, for example containing conventional suppository bases such as cocoa butter or other glycerides.

V. Генная терапия.V. Gene therapy.

Химерная молекула по изобретению может быть получена in vivo у млекопитающего, например пациента, (для которого) использование генно-терапевтического подхода к лечению связанной с кровотечением болезни или расстройства, выбранных из нарушения свертываемости крови, гемартроза, мышечного кровотечения, кровотечения в ротовой полости, кровоизлияния, кровоизлияния в мышцы, кровоизлияния в полости рта, травмы, повреждения черепа, желудочно-кишечного кровотечения, внутричерепного кровоизлияния, внутрибрюшного кровоизлияния, внутригрудного кровоизлияния, перелома кости, кровотечения в центральной нервной системе, кровотечения в заглоточном пространстве, кровотечения в забрюшинном пространстве, или кровоизлияния во влагалище подвздошно-поясничной мышцы будет терапевтически полезным. В одном варианте реализации изобретения связанная с кровотечением болезнь или расстройство представляют собой гемофилию. В другом варианте реализации изобретения связанная с кровотечением болезнь или расстройство представляют собой гемофилию А. При этом предусматривается введение пригодной химерной молекулы, кодирующей нуклеиновую кислоту, функционально связанную с пригодными контрольными последовательностями экспрессии. В определенных вариантах реализации изобретения такие последовательности включены в вирусный вектор. Пригодные вирусные векторы для такой генной терапии включают аденовирусные векторы, лентивирусные векторы, бакуловирусные векторы, векторы на основе вируса Эпштейна-Барр, паповавирусные векторы, векторы на основе вируса коровьей оспы, векторы на основе вируса простого герпеса и аденоассоциированные вирусные (AAV) векторы. Вирусный вектор может быть вирусным вектором с дефектом репликации. В других вариантах реализации изобретения аденовирусный вектор имеет делецию в его гене Е1 ген или гене Е3. В тех случаях, когда используется аденовирусный вектор, млекопитающее может не подвергаться воздействию нуклеиновой кислоты, кодирующей ген селектируемого маркера. В других вариантах реализации изобретения последовательности включены в невирусный вектор, известный квалифицированным специалистам в данной области техники.The chimeric molecule of the invention can be produced in vivo in a mammal, such as a patient, (for whom) the use of a gene therapy approach to treat a bleeding disease or disorder selected from a bleeding disorder, hemarthrosis, muscle bleeding, oral bleeding, hemorrhage , muscle hemorrhage, oral hemorrhage, trauma, skull injury, gastrointestinal hemorrhage, intracranial hemorrhage, intra-abdominal hemorrhage, intrathoracic hemorrhage, bone fracture, central nervous system hemorrhage, pharyngeal hemorrhage, retroperitoneal hemorrhage, or hemorrhage into the sheath of the iliopsoas muscle will be therapeutically useful. In one embodiment, the bleeding-related disease or disorder is hemophilia. In another embodiment, the bleeding disease or disorder is hemophilia A. This provides for the introduction of a suitable chimeric molecule encoding a nucleic acid operably linked to suitable expression control sequences. In certain embodiments of the invention, such sequences are included in a viral vector. Suitable viral vectors for such gene therapy include adenovirus vectors, lentiviral vectors, baculovirus vectors, Epstein-Barr virus vectors, papovavirus vectors, vaccinia vectors, herpes simplex virus vectors, and adeno-associated viral (AAV) vectors. The viral vector may be a replication defective viral vector. In other embodiments, the adenoviral vector has a deletion in its E1 gene or E3 gene. Where an adenoviral vector is used, the mammal may not be exposed to the nucleic acid encoding the selectable marker gene. In other embodiments, the sequences are included in a non-viral vector known to those skilled in the art.

VI. Способы применения химерного белка.VI. Methods of using the chimeric protein.

Настоящее изобретение дополнительно предусматривает способ снижения частоты или тяжести эпизода кровотечения у субъекта, нуждающегося в этом, с использованием химерной молекулы по изобретению. Типичный способ включает введение субъекту, нуждающемуся в этом, терапевтически эффективного количества химерной молекулы по изобретению. В других аспектах изобретение включаетThe present invention further provides a method for reducing the frequency or severity of a bleeding episode in a subject in need thereof using a chimeric molecule of the invention. A typical method includes administering to a subject in need thereof a therapeutically effective amount of a chimeric molecule of the invention. In other aspects, the invention includes

- 52 041588 способ предотвращения возникновения эпизода кровотечения у субъекта, нуждающегося в этом, с использованием химерной молекулы по изобретению. В других аспектах композиция, содержащая ДНК, кодирующую рекомбинантный белок по изобретению, может быть введена субъекту, нуждающемуся в этом. В определенных аспектах изобретения, клетка, экспрессирующая химерную молекулу по изобретению, может быть введена субъекту, нуждающемуся в этом. В определенных аспектах изобретения фармацевтическая композиция содержит (i) химерную молекулу, (ii) выделенную нуклеиновую кислоту, кодирующую химерную молекулу, (iii) вектор, содержащий нуклеиновую кислоту, кодирующую химерную молекулу, (iv) клетку, содержащую выделенную нуклеиновую кислоту, кодирующую химерную молекулу и/или вектор, содержащий нуклеиновую (кислоту), кодирующую химерную молекулу, или (v) их комбинацию, и фармацевтические композиции дополнительно содержат приемлемый эксципиент или носитель. Эпизод кровотечения может быть вызван или возникнуть вследствие расстройства свертывания крови. Расстройство свертывания крови также может быть названо коагулопатией. В одном примере, расстройство свертывания крови, которое можно лечить фармацевтической композицией в соответствии с данным описанием, представляет собой гемофилию или болезнь фон Виллебранда (vWD). В другом примере, расстройство свертывания крови, которое можно лечить фармацевтической композицией в соответствии с настоящим изобретением, представляет собой гемофилию А. В некоторых вариантах реализации изобретения тип кровотечения, ассоциированного с состоянием кровотечения, выбирают из гемартроза, мышечного кровотечения, кровотечения в ротовой полости, кровоизлияния, кровоизлияния в мышцы, кровоизлияния в полости рта, травмы, повреждения черепа, желудочно-кишечного кровотечения, внутричерепного кровоизлияния, внутрибрюшного кровоизлияния, внутригрудного кровоизлияния, перелома кости, кровотечения в центральной нервной системе, кровотечения в заглоточном пространстве, кровотечения в забрюшинном пространстве, кровоизлияния во влагалище подвздошно-поясничной мышцы или любой их комбинации. В других вариантах реализации изобретения субъект, страдающий от состояния кровотечения, нуждается в хирургическом лечении, включая, например, хирургическую профилактику или периоперационную медицинскую помощь. В одном примере, хирургию выбирают из малого хирургического вмешательства и обширного хирургического вмешательства. Типичные примеры хирургических процедур включают удаление зуба, тонзиллэктомию, паховое грыжесечение, синовэктомию, краниотомию, остеосинтез, травматологическую хирургию, интракраниальную хирургию, интраабдоминальную хирургию, интраторакальную хирургию, хирургию замены суставов (например, полное протезирование коленного сустава, протезирование тазобедренного сустава и т.п.), сердечную хирургию и кесарево сечение. В другом примере субъект получает сопутствующее лечение фактором IX. Поскольку соединения по изобретению способны активировать FIXa, они могут быть использованы для предварительной активации полипептида FIXa перед введением FIXa субъекту. Способы по изобретению могут практиковаться на субъекте, нуждающемся в профилактическом лечении или лечении по требованию. Фармацевтические композиции, содержащие химерную молекулу по изобретению, могут быть составлены для любого пригодного способа введения, включая, например, местное (например, трансдермальное или глазное), пероральное, буккальное, назальное, вагинальное, ректальное или парентеральное введение. Термин парентеральный, в используемом в данном документе значении, включает подкожную, интрадермальную, интраваскулярную (например, внутривенную), внутримышечную, спинальную, внутричерепную, интратекальную, внутриглазную, периокулярную, интраорбитальную, интрасиновиальную и интраперитонеальную инъекцию, а также любую подобную методику инъекции или инфузии. Композиция может быть также, например, суспензией, эмульсией, композицией с пролонгированным высвобождением, кремом, гелем или порошком. Композиция может быть составлена в виде суппозитория, с традиционными связующими и носителями, такими как триглицериды. После подробного описания настоящего изобретения его можно будет лучше понять со ссылкой на приведенные далее примеры, приведенные в данном документе только для иллюстрации и не ограничивающие изобретение. Все патенты и публикации, указанные в данном документе, положительным образом включены в данный документ в качестве ссылок.- 52 041588 a method for preventing the occurrence of a bleeding episode in a subject in need thereof, using a chimeric molecule according to the invention. In other aspects, a composition containing DNA encoding a recombinant protein of the invention may be administered to a subject in need thereof. In certain aspects of the invention, a cell expressing a chimeric molecule of the invention may be administered to a subject in need thereof. In certain aspects of the invention, the pharmaceutical composition comprises (i) a chimeric molecule, (ii) an isolated nucleic acid encoding a chimeric molecule, (iii) a vector containing a nucleic acid encoding a chimeric molecule, (iv) a cell containing an isolated nucleic acid encoding a chimeric molecule and/or a vector containing a nucleic acid encoding a chimeric molecule, or (v) a combination thereof, and the pharmaceutical compositions additionally contain an acceptable excipient or carrier. A bleeding episode may be caused by or result from a clotting disorder. A blood clotting disorder can also be called a coagulopathy. In one example, a blood clotting disorder that can be treated with a pharmaceutical composition as described herein is hemophilia or von Willebrand's disease (vWD). In another example, a blood coagulation disorder that can be treated with a pharmaceutical composition according to the present invention is hemophilia A. In some embodiments, the type of bleeding associated with the bleeding condition is selected from hemarthrosis, muscle bleeding, oral bleeding, hemorrhage , hemorrhages in the muscles, hemorrhages in the oral cavity, trauma, damage to the skull, gastrointestinal bleeding, intracranial hemorrhage, intra-abdominal hemorrhage, intrathoracic hemorrhage, bone fracture, bleeding in the central nervous system, bleeding in the pharynx, bleeding in the retroperitoneal space, hemorrhage in sheath of the iliopsoas muscle, or any combination thereof. In other embodiments of the invention, a subject suffering from a bleeding condition is in need of surgical treatment, including, for example, surgical prophylaxis or perioperative medical care. In one example, surgery is selected from minor surgery and major surgery. Typical examples of surgical procedures include tooth extraction, tonsillectomy, inguinal hernia repair, synovectomy, craniotomy, osteosynthesis, trauma surgery, intracranial surgery, intra-abdominal surgery, intrathoracic surgery, joint replacement surgery (e.g. total knee replacement, hip replacement, etc.). ), cardiac surgery and caesarean section. In another example, the subject is receiving concomitant treatment with factor IX. Because the compounds of the invention are capable of activating FIXa, they can be used to pre-activate a FIXa polypeptide prior to administering FIXa to a subject. The methods of the invention may be practiced on a subject in need of prophylactic or on-demand treatment. Pharmaceutical compositions containing a chimeric molecule of the invention may be formulated for any suitable route of administration, including, for example, topical (eg, transdermal or ocular), oral, buccal, nasal, vaginal, rectal, or parenteral administration. The term parenteral, as used herein, includes subcutaneous, intradermal, intravascular (e.g., intravenous), intramuscular, spinal, intracranial, intrathecal, intraocular, periocular, intraorbital, intrasynovial, and intraperitoneal injection, as well as any similar injection or infusion technique. The composition may also be, for example, a suspension, emulsion, sustained release formulation, cream, gel or powder. The composition may be formulated as a suppository, with conventional binders and carriers such as triglycerides. After a detailed description of the present invention, it can be better understood with reference to the following examples, given in this document by way of illustration only and not limiting the invention. All patents and publications cited in this document are expressly incorporated herein by reference.

ПримерыExamples

В примерах были использованы следующие материалы и способы, если не указано иное. Материалы и способы.The following materials and methods were used in the examples, unless otherwise indicated. Materials and methods.

В общем, в практике настоящего изобретения используются, если не указано иное, обычные методики химии, биофизики, молекулярной биологии, технологии рекомбинантных ДНК, иммунологии (особенно, например, технологии антител) и стандартные методы электрофореза. См., например, Sambrook, Fritsch and Maniatis, Molecular Cloning: Cold Spring Harbor Laboratory Press (1989); Antibody Engineering Protocols (Methods in Molecular Biology), 510, Paul, S., Humana Pr (1996); Antibody Engineering: A Practical Approach (Practical Approach Series, 169), McCafferty, Ed., Irl Pr (1996); Antibodies: A Laboratory Manual, Harlow et al., CS.H.L. Press, Pub. (1999); и Current Protocols in Molecular Biology, eds. Ausubel et al., John Wiley & Sons (1992).In general, the practice of the present invention uses, unless otherwise indicated, conventional techniques in chemistry, biophysics, molecular biology, recombinant DNA technology, immunology (especially, for example, antibody technology), and standard electrophoresis techniques. See, for example, Sambrook, Fritsch and Maniatis, Molecular Cloning: Cold Spring Harbor Laboratory Press (1989); Antibody Engineering Protocols (Methods in Molecular Biology), 510, Paul, S., Humana Pr (1996); Antibody Engineering: A Practical Approach (Practical Approach Series, 169), McCafferty, Ed., Irl Pr (1996); Antibodies: A Laboratory Manual, Harlow et al., CS.H.L. Press, Pub. (1999); and Current Protocols in Molecular Biology, eds. Ausubel et al., John Wiley & Sons (1992).

Пример 1. Оценка тромбин-медиируемого высвобождения D'D3 различными конструктами VWF.Example 1 Evaluation of Thrombin-Mediated D'D3 Release by Various VWF Constructs.

Этот пример оценивает кинетику тромбин-медиируемого высвобождения D'D3 при 37°С различными конструктами VWF, проиллюстрированными на фиг. 2. Эксперименты Biocore проводились с конThis example evaluates the kinetics of thrombin-mediated D'D3 release at 37°C with various VWF constructs illustrated in FIG. 2. Biocore experiments were carried out with con

- 53 041588 структами VWF-Fc, содержащими разные расщепляемые тромбином линкеры между доменом D'D3 VWF и Fc. Конечной целью является использование информации, полученной при гидролизе тромбином VWF-Fc, по отношению к гетеродимерам FVIII-VWF, описанным в данном документе. Все конструкты VWF-D'D3 пропускались над чипом для достижения плотностей связывания белка в диапазоне значений 100-700 RU. После связывания конструкта VWF с чипом, 5 ед./мл тромбина вводят в объем нал поверхностью на 5 мин. Fc остается связанным с чипом, в то время как D'D3 в расщепляемых конструктах высвобождается. Строили график зависимости скорости (RU/c) от плотности захвата (RU), как проиллюстрировано на фиг. 3 и 4. Скорость расщепления пропорциональна начальной плотности захвата, а наклон кривой является мерой восприимчивости каждого конструкта к расщеплению тромбином.- 53 041588 VWF-Fc structures containing different thrombin-cleavable linkers between the D'D3 domain of VWF and Fc. The ultimate goal is to use the information obtained from thrombin hydrolysis of VWF-Fc in relation to the FVIII-VWF heterodimers described herein. All VWF-D'D3 constructs were passed over the chip to achieve protein binding densities in the range of 100-700 RU. After binding the VWF construct to the chip, 5 units/ml of thrombin are injected into the volume on the surface for 5 minutes. The Fc remains bound to the chip while the D'D3 in the cleavable constructs is released. The rate (RU/c) versus capture density (RU) was plotted as illustrated in FIG. 3 and 4. The rate of cleavage is proportional to the initial capture density, and the slope of the curve is a measure of the susceptibility of each construct to cleavage by thrombin.

Фиг. 3 иллюстрирует, что VWF-052 (не имеющий сайта расщепления тромбином в линкерной области), как ожидалось, не расщепляется тромбином. Величина скорости для VWF-039 (LVPR с сайтом PAR1) сопоставима со скоростью расщепления FVIII (данные не приведены). Таким образом, VWF-039 служит точкой отсчета для полного высвобождения D'D3 от Fc. Соотношения величин наклона для различных конструктов VWF-Fc по отношению к VWF-039 использовали для определения эффективности расщепления тромбином. VWF-039 (LVPR с сайтом PAR1) расщепляется тромбин в около 70-80 раз быстрее, чем VWF-031 (LVPR). VWF-51 (ALRPRVV) расщепляется в 1,8 раза быстрее, чем VWF-031 (LVPR). VWF-034, содержащий 288 XTEN рядом с (along) сайтом LVPR, демонстрировал более медленное расщепление по сравнению с VWF-031. Были также получены конструкты VWF-Fc путем введения разных кислотных областей (a1, a2 и а3) белка FVIII в линкерную область. VWF-055, содержащий область а2 между D'D3 и областью Fc, демонстрирует расщепление тромбином, близкое к конструкту VWF-039. Как проиллюстрировано на фиг. 4, VWF-054 (область a1) и VWF-056 (область а3) продемонстрировали в около 5 раз более медленное расщепление тромбином.Fig. 3 illustrates that VWF-052 (having no thrombin cleavage site in the linker region) is not cleaved by thrombin as expected. The rate for VWF-039 (LVPR with PAR1 site) is comparable to the rate of FVIII cleavage (data not shown). Thus, VWF-039 serves as a reference point for the complete release of D'D3 from Fc. Slope ratios for the various VWF-Fc constructs versus VWF-039 were used to determine the efficiency of thrombin digestion. VWF-039 (LVPR with PAR1 site) cleaves thrombin about 70-80 times faster than VWF-031 (LVPR). VWF-51 (ALRPRVV) breaks down 1.8 times faster than VWF-031 (LVPR). VWF-034 containing 288 XTEN near (along) the LVPR site showed slower cleavage compared to VWF-031. VWF-Fc constructs were also generated by introducing different acidic regions (a1, a2 and a3) of the FVIII protein into the linker region. VWF-055, containing an a2 region between D'D3 and the Fc region, exhibits thrombin cleavage similar to construct VWF-039. As illustrated in FIG. 4, VWF-054 (a1 region) and VWF-056 (a3 region) showed about 5 times slower thrombin cleavage.

Фиг. 5 иллюстрирует величины наклона кривых расщепления тромбином для разных конструктов VWF. Из этих результатов следует, что кислотная область 2 (а2) FVIII является высокоэффективным сайтом расщепления тромбином, и она была включена в гетеродимеры FVIII-VWF, как описано в данном документе.Fig. 5 illustrates the slopes of the thrombin cleavage curves for different VWF constructs. From these results, the acidic region 2(a2) of FVIII is a highly efficient thrombin cleavage site and was incorporated into FVIII-VWF heterodimers as described herein.

Пример 2. Оценка гемостатической способности гетеродимеров FVIII/VWFD'D3 с помощью анализа методом ROTEM цельной крови пациента с гемофилией А (HemA).Example 2 Evaluation of the haemostatic capacity of FVIII/VWFD'D3 heterodimers by ROTEM analysis of whole blood from a patient with hemophilia A (HemA).

Гетеродимеры FVIII/VWFD'D3, содержащие разные расщепляемые тромбином линкеры, оценивали с помощью анализа методом ROTEM (ротационной тромбоэластометрии) цельной крови донора с гемофилией А (HemA) на их способность влиять на гемостаз. Образец цельной крови брали у донора с тяжелой гемофилией А, сопровождающейся повышенной кровоточивостью, с использованием цитрата натрия в качестве антикоагулянта. Через 40 мин после взятия образца крови, варианты гетеродимера FVIII/VWFD'D3, содержащие разные расщепляемые тромбином линкеры -FVIII155/VWF031 (48 аминокислот, сайт LVPR), FVIII155/VWF039 (26 аминокислот, сайт LVPR+PAR1), FVIII155/VWF055 (34 аминокислоты, а2 из FVIII) разводили в образце цельной крови до конечной концентрации, составляющей 100, 30, 10 и 3% от нормальной, при измерении методом хромогенного анализа FVIII. Немедленно после прибавления гетеродимеров FVIII/VWFD'D3, реакцию ROTEM запускали путем прибавления CaCl2. Время свертывания (время до достижения амплитуды 2 мм от начала теста) регистрировали с помощью инструмента и строили график зависимости от концентрации FVIII в образцах (фиг. 6). Было выдвинуто предположение, что более сильнодействующий гетеродимер FVIII/VWFD'D3 будет индуцировать более быстрый процесс свертывания, приводя, таким образом, к более коротким временам свертывания по сравнению с менее активным гетеродимером FVIII/VWFD'D3. Как показано на фиг. 6, образцы с добавлением гетеродимера FVIII/VWF039 имели самое коротикое время свертывания при всех протестированных концентрациях, а образцы с добавлением гетеродимера FVIII/VWF031 имели самое большое время свертывания при всех концентрациях. Время свертывания образцов с добавлением гетеродимера FVIII155/VWF055 имеет промежуточные значения. Таким образом, гемостатическая способность изменяется в порядке FVIII155/VWF039>FVIII155/VWF055>FVIII155/VWF031. Поскольку единственным отличием между этими тремя молекулами являются расщепляемые тромбином линкеры между белком VWF и Fc-областью, результаты указывают, что линкер, содержащий сайт LVPR и мотив экзосайта взаимодействия PAR1 и область а2 FVIII, функционирует лучше, чем один лишь сайт LVPR.FVIII/VWFD'D3 heterodimers containing various thrombin-cleavable linkers were evaluated by ROTEM (rotational thromboelastometry) analysis of whole blood from a hemophilia A (HemA) donor for their ability to influence hemostasis. A whole blood sample was taken from a donor with severe bleeding hemophilia A, using sodium citrate as an anticoagulant. 40 min after blood sampling, FVIII/VWFD'D3 heterodimer variants containing different thrombin-cleavable linkers - FVIII155/VWF031 (48 amino acids, LVPR site), FVIII155/VWF039 (26 amino acids, LVPR+PAR1 site), FVIII155/VWF055 ( 34 amino acids, a2 from FVIII) were diluted in a whole blood sample to a final concentration of 100%, 30%, 10% and 3% of normal as measured by FVIII chromogenic assay. Immediately after the addition of the FVIII/VWFD'D3 heterodimers, the ROTEM reaction was started by adding CaCl 2 . Clotting time (time to reach 2 mm amplitude from the start of the test) was recorded with the instrument and plotted against FVIII concentration in the samples (FIG. 6). It has been hypothesized that the more potent FVIII/VWFD'D3 heterodimer will induce a faster clotting process, thus resulting in shorter clotting times compared to the less potent FVIII/VWFD'D3 heterodimer. As shown in FIG. 6, samples supplemented with the FVIII/VWF039 heterodimer had the shortest clotting time at all concentrations tested, and samples supplemented with the FVIII/VWF031 heterodimer had the longest clotting time at all concentrations. The clotting time of samples with the addition of the FVIII155/VWF055 heterodimer has intermediate values. Thus, hemostatic capacity changes in the order FVIII155/VWF039>FVIII155/VWF055>FVIII155/VWF031. Since the only difference between these three molecules is the thrombin-cleavable linkers between the VWF protein and the Fc region, the results indicate that the linker containing the LVPR site and the PAR1 interaction exosite motif and FVIII a2 region functions better than the LVPR site alone.

Пример 3. Оценка активности гетеродимеров FVIII/VWF.Example 3 Evaluation of the activity of FVIII/VWF heterodimers.

Гетеродимерные конструкты FVIII-XTEN/VWF трансфицировали в клетки HEK293F с использованием трех плазмид: первая экспрессировала FVIII-XTEN-Fc, вторая экспрессировала VWF-XTEN-Fc и третья экспрессировала РАСЕ. Для трансфекции использовали стандартный протокол с полиэтиленимином (PEI) и после 5 дней трансфекции собирали среду тканевых культур. Из сред были выделены различные комбинации гетеродимеров FVIII-VWF. Активность очищенного белка тестировали с использованием как хромогенного (двухстадийный), так и АЧТВ (одностадийный) анализов свертывания с использованием стандартных протоколов. Введение кислотной области 2 (а2) FVIII или между FVIII и Fc, или между D'D3 и Fc (как указано в табл. 7А и на фиг. 7) улучшает АЧТВ-активность гетеродимера FVIII-VWF, как показано в табл. 7С. Например, гетеродимер FVIII169/VWF059 имеет сайт расщепления тромбином а2 в линкерной области D'D3-Fc и имеет лучшую АЧТВ-активность, чем FVIII169/VWF057,FVIII-XTEN/VWF heterodimeric constructs were transfected into HEK293F cells using three plasmids: the first expressed FVIII-XTEN-Fc, the second expressed VWF-XTEN-Fc, and the third expressed PACE. For transfection, a standard polyethyleneimine (PEI) protocol was used, and after 5 days of transfection, tissue culture medium was harvested. Various combinations of FVIII-VWF heterodimers were isolated from the media. Purified protein activity was tested using both chromogenic (two-step) and APTT (one-step) coagulation assays using standard protocols. Introduction of acidic region 2(a2) of FVIII either between FVIII and Fc or between D'D3 and Fc (as shown in Table 7A and Figure 7) improves the APTT activity of the FVIII-VWF heterodimer as shown in Table 7A. 7C. For example, the FVIII169/VWF059 heterodimer has an a2 thrombin cleavage site in the D'D3-Fc linker region and has better APTT activity than FVIII169/VWF057,

- 54 041588 который содержит тромбиновый сайт LVPR в линкере D'D3Fc, как показано в табл. 7С. Аналогично, включение области а2 между FVIII и Fc увеличивает одностадийную свертывающую активность гетеродимера, как видно по улучшенному соотношению результатов хромогенного и АЧТВ-анализов для- 54 041588 which contains the thrombin site LVPR in the linker D'D3Fc, as shown in table. 7C. Similarly, inclusion of the a2 region between FVIII and Fc increases the one-step clotting activity of the heterodimer as seen in the improved ratio of chromogenic and APTT assay results for

FVIII286/VWF059 и FVIII286/VWF062, как показано в табл. 7В.FVIII286 / VWF059 and FVIII286 / VWF062, as shown in table. 7B.

Таблица 7АTable 7A

Последовательность № Sequence No. Конструкт construct Длина линкера между FVIII и Fc (аминокислот) Linker length between FVIII and Fc (amino acids) Тромбиновый сайт в линкере Thrombin site in the linker 1 1 FVIII169 FVIII169 - - отсутствует absent 2 2 FVIII286 FVIII286 32 32 FVin-a2 FVin-a2 Последовательность № Sequence No. Конструкт construct Длина линкера между D'D3 и Fc (аминокислот) Linker length between D'D3 and Fc (amino acids) Тромбиновый сайт в линкере Thrombin site in the linker 1 1 VWF057 VWF057 144АЕ XTEN+ 35+ LVPR 144AE XTEN+ 35+ LVPR LVPR LVPR 2 2 VWF059 VWF059 144АЕ XTEN+ 32 144AE XTEN+ 32 FVin-a2 FVin-a2 3 3 VWF062 VWF062 144АЕ XTEN 144AE XTEN отсутствует absent

Таблица 7ВTable 7B

Конструкты Constructs Отношение хромогенный/АЧТВ Chromogenic/APTT ratio FVIII169/VWF057 FVIII169/VWF057 2,51 2.51 FVIII169/VWF059 FVIII169/VWF059 1,67 1.67 FVIII169/VWF062 FVIII169/VWF062 2,7 2.7 FVIII286/VWF059 FVIII286/VWF059 0,69 0.69 FVIII286/VWF062 FVIII286/VWF062 0,83 0.83

Таблица 7СTable 7C

Конструкты Constructs Хромо-специфическая активность (МЕ/пмоль) Chromo-specific activity (IU/pmol) АЧТВ-специфическая активность (МЕ/пмоль) APTT-specific activity (IU/pmol) FVIII169/VWF057 FVIII169/VWF057 1,60 1.60 0,65 0.65 FVIII169/VWF059 FVIII169/VWF059 1,60 1.60 0,90 0.90 FVIII169/VWF062 FVIII169/VWF062 0,87 0.87 0,32 0.32 FVIII286/VWF059 FVIII286/VWF059 1,35 1.35 1,96 1.96 FVIII286/VWF062 FVIII286/VWF062 1,08 1.08 1,33 1.33

Пример 4. Острая эффективность гетеродимеров FVIII-XTEN-Fc/D'D3-XTEN-Fc в модели кровотечения HemA-мышей с обрезанным кончиком хвоста.Example 4 Acute Efficacy of FVIII-XTEN-Fc/D'D3-XTEN-Fc Heterodimers in a HemA Mice Bleeding Model with Tail Clipping.

Острую эффективность гетеродимеров, содержащих разные расщепляемые тромбином линкеры, оценивали с использованием модели кровотечения HemA-мышей с обрезанным кончиком хвоста.The acute efficacy of heterodimers containing different thrombin-cleavable linkers was assessed using a tail-tipped HemA mouse bleeding model.

Самцов HemA-мышей в возрасте 8-12 недель рандомизировали на 5 экспериментальных групп и проводили им однократное внутривенное введение SQ BDD-FVIII, rFVIII169/VWF034, rFVIII169/VWF057, rFVIII169/VWF059 или раствора носителя, соответственно. Для имитации эпизодического лечения с помощью FVIII (для восстановления до 50-100% нормального уровня FVIII в плазме), выбранная лечебная доза FVIII составляла 75 МЕ/кг при измерении по АЧТВ-активности FVIII. При таком уровне дозировки, все тестируемые варианты FVIII будут восстанавливать ок. 70% от нормальной FVIII-активности в плазме мышей через 5 мин после введения дозы.Male HemA mice aged 8-12 weeks were randomized into 5 experimental groups and received a single intravenous injection of SQ BDD-FVIII, rFVIII169/VWF034, rFVIII169/VWF057, rFVIII169/VWF059, or vehicle solution, respectively. To mimic episodic treatment with FVIII (to restore to 50-100% normal plasma FVIII levels), the selected treatment dose of FVIII was 75 IU/kg as measured by FVIII APTT activity. At this dosage level, all FVIII variants tested will restore approx. 70% of normal plasma FVIII activity in mice 5 minutes post-dose.

Процедуру обрезания кончика хвоста проводили следующим образом. Вкратце, мышей анестезировали коктейлем 50 мг/кг кетамина/0,5 мг/кг дексмедетомидина до травмы хвоста и помещали на грелкуподушку при 37°С для поддержания температуры тела. Хвосты мышей затем погружали в нагретый до 37°С солевой раствор на 10 мин для расширения латеральной вены. После расширения вены, варианты FVIII или раствор носителя вводили инъекцией через хвостовую вену и кончик хвоста затем отрезали на расстоянии 5 мм от конца с помощью скальпеля № 11 с прямым лезвием через 5 мин после введения дозы. Вытекающую кровь собирали в 13 мл солевого раствора с температурой 37 С в течение 30 мин, и объем потери крови определяли по изменению веса пробирки с собранной кровью: объем потери крови=(вес пробирки в конце определения-начальный вес+0,10) мл. Проводят статистический анализ с использованием t-критерия (тест Колмогорова-Смирнова) и однофакторный дисперсионный анализ (тест Крускал-Уоллис, апостериорный анализ: критерий Данна с многократным сравнением). Строили график объема потери крови для каждого индивидуального животного в исследованиях, приведенный на фиг. 8. Значительное снижение объема потери крови наблюдалось для всех экспериментальных групп FVIII по сравнению с животными, получавшими носитель (р<0,05, табл. 8). Аналогичное снижение потери крови наблюдалось для всех экспериментальных групп гетеродимеров по сравнению с введением BDD-FVIII (р>0,5, табл. 8), что позволяет предположить, что молекулы гетеродимера могут потенциально быть такими же эффективными, как и SQ BDD-FVIII при лечении по необходимости.The procedure for trimming the tip of the tail was carried out as follows. Briefly, mice were anesthetized with a 50 mg/kg ketamine/0.5 mg/kg dexmedetomidine cocktail prior to tail injury and placed on a heating pad at 37° C. to maintain body temperature. The tails of mice were then immersed in saline heated to 37° C. for 10 minutes to expand the lateral vein. After vein dilatation, FVIII variants or vehicle solution were injected through the tail vein and the tip of the tail was then cut 5 mm from the tip using a No. 11 straight blade scalpel 5 min post dose. The outflowing blood was collected in 13 ml of saline at 37°C for 30 minutes, and the volume of blood loss was determined by the change in the weight of the collected blood tube: volume of blood lost = (tube weight at the end of the determination - initial weight + 0.10) ml. Statistical analysis is carried out using the t-test (Kolmogorov-Smirnov test) and one-way analysis of variance (Kruskal-Wallis test, post hoc analysis: Dunn's test with multiple comparisons). The blood loss volume for each individual animal in the studies was plotted as shown in FIG. 8. Significant reduction in blood loss volume was observed for all FVIII experimental groups compared to vehicle treated animals (p<0.05, Table 8). A similar reduction in blood loss was observed for all experimental heterodimer groups compared with BDD-FVIII administration (p > 0.5, Table 8), suggesting that heterodimer molecules could potentially be as effective as SQ BDD-FVIII in treatment as needed.

- 55 041588- 55 041588

Таблица 8. β-значение для теста Колмогорова-СмирноваTable 8. β-value for the Kolmogorov-Smirnov test

FVIII169/VWF034 FVIII169/VWF034 FVIII169/VWF057 FVIII169/VWF057 FVIII169/VWF059 FVIII169/VWF059 BDD-FVIII BDD-FVIII 0,7591 0.7591 0,9883 0.9883 0,5176 0.5176 Носитель Carrier 0,0006 0.0006 0,0006 0.0006 0,0266 0.0266

Нуклеотидная последовательность pSYN VWF057 (D’D3-Fc VWF с тромбиновым сайтом LVPR в линкере) (SEQ ID NO: 79)Nucleotide sequence of pSYN VWF057 (D'D3-Fc VWF with LVPR thrombin site in linker) (SEQ ID NO: 79)

1 1 ATGATTCCTG ATGATTCCTG CCAGATTTGC CCAGATTTGC CGGGGTGCTG CGGGGTGCTG CTTGCTCTGG CTTGCTCTGG CCCTCATTTT CCCTCATTTTT 51 51 GCCAGGGACC GCCAGGGACC CTTTGTGCAG CTTTGTGCAG AAGGAACTCG AAGGAACTCG CGGCAGGTCA CGGCAGGTCA TCCACGGCCC TCCACGGCCC 101 101 GATGCAGCCT GATGCAGCCT TTTCGGAAGT TTTCGGAAGT GACTTCGTCA GACTTCGTCA ACACCTTTGA ACACCTTTGA TGGGAGCATG TGGGAGCATG 151 151 TACAGCTTTG TACAGCTTTG CGGGATACTG CGGGATACTG CAGTTACCTC CAGTTACTCTC CTGGCAGGGG CTGGCAGGGG GCTGCCAGAA GCTGCCAGAA 201 201 ACGCTCCTTC ACGCTCCTTC TCGATTATTG TCGATTATTG GGGACTTCCA GGGACTTCCA GAATGGCAAG GAATGGCAAG AGAGTGAGCC AGAGTGAGCC 251 251 TCTCCGTGTA TCTCCGTGTA TCTTGGGGAA TCTTGGGGAA TTTTTTGACA TTTTTTGACA TCCATTTGTT TCCATTTGTT TGTCAATGGT TGTCAATGGT 301 301 ACCGTGACAC ACCGTGACAC AGGGGGACCA AGGGGGACCA AAGAGTCTCC AAGAGTCTCC ATGCCCTATG ATGCCCTATG CCTCCAAAGG CCTCCAAAGG 351 351 GOTGTATСТА GOTGTATSTA GAAACTGAGG GAAACTGAGG CTGGGTACTA CTGGGTACTA CAAGCTGTCC CAAGCGTGTCC GGTGAGGCCT GGTGAGGCCT 401 401 ATGGCTTTGT ATGGCTTTGT GGCCAGGATC GGCCAGGATC GATGGCAGCG GATGGCAGCG GCAACTTTCA GCAACTTTCA AGTCCTGCTG AGTCCTGCTG 451 451 TCAGACAGAT TCAGACAGAT ACTTCAACAA ACTTCAACAA GACCTGCGGG GACCTGCGGG CTGTGTGGCA CTGTGTGGCA ACTTTAACAT ACTTTAACAT 501 501 CTTTGCTGAA CTTTGCTGAA GATGACTTTA GATGACTTTA TGACCCAAGA TGACCCAAGA AGGGACCTTG AGGGACCTTG ACCTCGGACC ACCTCGGACC 551 551 CTTATGACTT CTTATGACTT TGCCAACTCA TGCCAACTCA TGGGCTCTGA TGGGCTCTGA GCAGTGGAGA GCAGTGGAGA ACAGTGGTGT ACAGTGGTGT 601 601 GAACGGGCAT GAACGGGCAT CTCCTCCCAG CTCCTCCCAG CAGCTCATGC CAGCTCATGC AACATCTCCT AACATCTTCCT CTGGGGAAAT CTGGGGAAAT 651 651 GCAGAAGGGC GCAGAAGGGC CTGTGGGAGC CTGTGGGAGC AGTGCCAGCT AGTGCCAGCT TCTGAAGAGC TCTGAAGAGC ACCTCGGTGT ACCTCGGTGT 701 701 TTGCCCGCTG TTGCCCGCTG CCACCCTCTG CCACCCTCTG GTGGACCCCG GTGGACCCCG AGCCTTTTGT AGCCTTTTGT GGCCCTGTGT GGCCCTGTGT 751 751 GAGAAGACTT GAGAAGACTT TGTGTGAGTG TGTGTGAGTG TGCTGGGGGG TGCTGGGGGG CTGGAGTGCG CTGGAGTGCG CCTGCCCTGC CCTGCCCTGC 801 801 CCTCCTGGAG CCTCCTGGAG TACGCCCGGA TACGCCCGGA CCTGTGCCCA CCTGTGCCCA GGAGGGAATG GGAGGGAATG GTGCTGTACG GTGCTGTACG 851 851 GCTGGACCGA GCTGGACCGA CCACAGCGCG CCACAGCGCG TGCAGCCCAG TGCAGCCCAG TGTGCCCTGC TGTGCCCTGC TGGTATGGAG TGGTATGGAG 901 901 TATAGGCAGT TATAGGCAGT GTGTGTCCCC GTGTGTCCC TTGCGCCAGG TTGCGCCAGG ACCTGCCAGA ACCTGCCAGA GCCTGCACAT GCCTGCACAT 951 951 CAATGAAATG CAATGAAATG TGTCAGGAGC TGTCAGGAGC GATGCGTGGA GATGCGTGGA TGGCTGCAGC TGGCTGCAGC TGCCCTGAGG TGCCCTGAGG 1001 1001 GACAGCTCCT GACAGCTCCT GGATGAAGGC GGATGAAGGC CTCTGCGTGG CTCTGCGTGG AGAGCACCGA AGAGCACCGA GTGTCCCTGC GTGTCCCCTGC 1051 1051 GTGCATTCCG GTGCATTCCG GAAAGCGCTA GAAAGCGCTA CCCTCCCGGC CCCTCCCGGC ACCTCCCTCT ACCTCCCTCT CTCGAGACTG CTCGAGACTG 1101 1101 CAACACCTGC CAACACCTGC ATTTGCCGAA ATTTGCCGAA ACAGCCAGTG ACAGCCAGTG GATCTGCAGC GATCTGCAGC AATGAAGAAT AATGAAGAAT 1151 1151 GTCCAGGGGA GTCCAGGGGA GTGCCTTGTC GTGCCTTGTC ACTGGTCAAT ACTGGTCAAT CCCACTTCAA CCCACTTCAA GAGCTTTGAC GAGCTTTGAC 1201 1201 AACAGATACT AACAGATACT TCACCTTCAG TCACCTTCAG TGGGATCTGC TGGGATCGC CAGTACCTGC CAGTACCCTGC TGGCCCGGGA TGGCCCGGGA 1251 1251 TTGCCAGGAC TTGCCAGGAC CACTCCTTCT CACTCCTTCT C CATT GT CAT C CAT GT CAT TGAGACTGTC TGAGACTGTC CAGTGTGCTG CAGTGTGCTG 1301 1301 ATGACCGCGA ATGACCGCGA CGCTGTGTGC CGCTGTGTGC ACCCGCTCCG ACCCGCTCCG TCACCGTCCG TCACCGTCCG GCTGCCTGGC GCTGCCTGGC 1351 1351 CTGCACAACA CTGCACAACA GCCTTGTGAA GCCTTGTGAA ACTGAAGCAT ACTGAAGCAT GGGGCAGGAG GGGGCAGGAG TTGCCATGGA TTGCCATGGA 1401 1401 TGGCCAGGAC TGGCCAGGAC ATCCAGCTCC ATCCAGCTCC CCCTCCTGAA CCCTCCTGAA AGGTGACCTC AGGTGACCTC CGCATCCAGC CGCATCCAGC 1451 1451 ATACAGTGAC ATACAGTGAC GGCCTCCGTG GGCCTCCGTG CGCCTCAGCT CGCCTCAGCT ACGGGGAGGA ACGGGGAGGA CCTGCAGATG CCTGCAGATG 1501 1501 GACTGGGATG GACTGGGATG GCCGCGGGAG GCCGCGGGAG GCTGCTGGTG GCTGCTGGTG AAGCTGTCCC AAGCTGTCCC CCGTCTATGC CCGTCTATGC 1551 1551 CGGGAAGACC CGGGAAGAC TGCGGCCTGT TGCGGCCTGT GTGGGAATTA GTGGGAATTA CAATGGCAAC CAATGGCAAC CAGGGCGACG CAGGGCGACG 1601 1601 ACTTCCTTAG ACTTCCTTAG CCCCTCTGGG CCCCTCTGGG CTGGCGGAGC CTGGCGGAGC CCCGGGTGGA CCCGGGTGGA GGACTTCGGG GGACTTCGGG 1651 1651 AACGCCTGGA AACGCCTGGA AGCTGCACGG AGCTGCACGG GGACTGCCAG GGACTGCCAG GACCTGCAGA GACCTGCAGA AGCAGCACAG AGCAGCACAG 1701 1701 CGATCCCTGC CGATCCCTGC GCCCTCAACC GCCCTCAACC CGCGCATGAC CGCGCATGAC CAGGTTCTCC CAGGTTCTCC GAGGAGGCGT GAGGAGGCGT 1751 1751 GCGCGGTCCT GCGCGGTCCT GACGTCCCCC GACGTCCCCC ACATTCGAGG ACATTCGAGG CCTGCCATCG CCTGCCATCG TGCCGTCAGC TGCCGTCAGC 1801 1801 CCGCTGCCCT CCGCTGCCCT ACCTGCGGAA ACTGCGGAA CTGCCGCTAC CTGCCGCTAC GACGTGTGCT GACGTGTGCT CCTGCTCGGA CCTGCTCGGA 1851 1851 CGGCCGCGAG CGGCCGCGAG TGCCTGTGCG TGCCTGTGCG GCGCCCTGGC GCGCCCTGGC CAGCTATGCC CAGCTATGCC GCGGCCTGCG GCGGCCTGCG

- 56 041588- 56 041588

1901 1901 CGGGGAGAGG CGGGGAGAGG CGTGCGCGTC CGTGCGCGTC GCGTGGCGCG GCGTGGCGCG AGCCAGGCCG AGCCAGGCCG CTGTGAGCTG CTGTGAGCTG 1951 1951 AACTGCCCGA AACTGCCCGA AAGGCCAGGT AAGGCCAGGT GTACCTGCAG GTACCTGAG TGCGGGACCC TGCGGGACC CCTGCAACCT CCTGCAACCT 2001 2001 GACCTGCCGC GACCTGCCGC TCTCTCTCTT TCTCTCTCTT ACCCGGATGA ACCCGGATGA GGAATGCAAT GGAATGCAAT GAGGGCTGCC GAGGGCTGCC 2051 2051 TGGAGGGCTG TGGAGGGCTG CTTCTGCCCC CTTCTGCCCC CCAGGGCTCT CCAGGGCTCT ACATGGATGA ACATGGATGA GAGGGGGGAC GAGGGGGGAC 2101 2101 TGCGTGCCCA TGCGTGCCCA AGGCCCAGTG AGGCCCAGTG CCCCTGTTAC CCCCTGTTAC TATGACGGTG TATGACGGTG AGATCTTCCA AGATCTTCCA 2151 2151 GCCAGAAGAC GCCAGAAGAC ATCTTCTCAG ATCTTCTCAG ACCATCACAC ACCATCACAC CATGTGCTAC CATGTGCTAC TGTGAGGATG TGTGAGGATG 2201 2201 GCTTCATGCA GCTTCATGCA CTGTACCATG CTGTACCATG AGTGGAGTCC AGTGGAGTCC CCGGAAGCTT CCGGAAGCT GCTGCCTGAC GCTGCCTGAC 2251 2251 GCTGTCCTCA GCTGTCCTCA GCAGTCCCCT GCAGTCCCCT GTCTCATCGC GTCTCATCGC AGCAAAAGGA AGCAAAAGGA GCCTATCCTG GCCTATCCTG 2301 2301 TCGGCCCCCC TCGGCCCCCC ATGGTCAAGC ATGGTCAAGC TGGTGTGTCC TGGTGTGTCC CGCTGACAAC CGCTGACAAC CTGCGGGCTG CTGCGGGCTG 2351 2351 AAGGGCTCGA AAGGGCTCGA GTGTACCAAA GTGTACCAAAA ACGTGCCAGA ACTGTCCAGA ACTATGACCT ACTATGACCT GGAGTGCATG GGAGTGCATG 2401 2401 AGCATGGGCT AGCATGGGCT GTGTCTCTGG GTGTCTCTGG CTGCCTCTGC CTGCCTCTGC CCCCCGGGCA CCCCCGGGCA TGGTCCGGCA TGGTCCGGCA 2451 2451 TGAGAACAGA TGAGAACAGA TGTGTGGCCC TGTGTGGCCC TGGAAAGGTG TGGAAAGGTG TCCCTGCTTC TCCCTGCTTC CATCAGGGCA CATCAGGGCA 2501 2501 AGGAGTATGC AGGAGTATGC CCCTGGAGAA CCCTGGAGAA ACAGTGAAGA ACAGTGAAGA TTGGCTGCAA TTGGCTGCA CACTTGTGTC CACTTGTGTC 2551 2551 TGTCGGGACC TGTCGGGACC GGAAGTGGAA GGAAGTGGAA CTGCACAGAC CTGCACAGAC CAT GT GT GT G CAT GT GT GT G ATGCCACGTG ATGCCACGTG 2601 2601 CTCCACGATC CTCCACGATC GGCATGGCCC GGCATGGCCC ACTACCTCAC ACTACCTCAC CTTCGACGGG CTTCGACGGG CTCAAATACC CTCAAATACC 2651 2651 TGTTCCCCGG TGTTCCCCGG GGAGTGCCAG GGAGTGCCAG TACGTTCTGG TACGTTCTGG TGCAGGATTA TGCAGGATTA CTGCGGCAGT CTGCGGCAGT 2701 2701 AACCCTGGGA AACCCTGGGA CCTTTCGGAT CCTTTCGGAT CCTAGTGGGG CCTAGTGGGG AATAAGGGAT AATAAGGGAT GCAGCCACCC GCAGCCACCC 2751 2751 CTCAGTGAAA CTCAGTGAAA TGCAAGAAAC TGCAAGAAAC GGGTCACCAT GGGTCACCAT CCTGGTGGAG CCTGGTGGAG GGAGGAGAGA GGAGGAGAGA 2801 2801 TTGAGCTGTT TTGAGCTGTT TGACGGGGAG TGACGGGGAG GTGAATGTGA GTGAATGTGA AGAGGCCCAT AGAGGCCCAT GAAGGATGAG GAAGGATGAG 2851 2851 ACTCACTTTG ACTCACTTTG AGGTGGTGGA AGGTGGTGGA GTCTGGCCGG GCTTGGCCGG TACATCATTC TACATCATTC TGCTGCTGGG TGCTGCTGGG 2901 2901 CAAAGCCCTC CAAAGCCCTC TCCGTGGTCT TCCGTGGTCT GGGACCGCCA GGGACCGCCA CCTGAGCATC CCTGAGCATC TCCGTGGTCC TCCGTGGTCC 2951 2951 TGAAGCAGAC TGAAGCAGAC ATACCAGGAG ATACCAGGAG AAAGTGTGTG AAAGTGTGTG GCCTGTGTGG GCCTGTGTGG GAATTTTGAT GAATTTTGAT 3001 3001 GGCATCCAGA GGCATCCAGA ACAATGACCT ACAATGACCT CACCAGCAGC CACCAGCAGC AACCTCCAAG AACCTCCAAG TGGAGGAAGA TGGAGGAAGA 3051 3051 CCCTGTGGAC CCCTGTGGAC TTTGGGAACT TTTGGGAACT CCTGGAAAGT CCTGGAAAGT GAGCTCGCAG GAGCTCGCAG TGTGCTGACA TGTGCTGACA 3101 3101 CCAGAAAAGT CCAGAAAAGT GCCTCTGGAC GCCTCTGGAC TCATCCCCTG TCATCCCCTG CCACCTGCCA CCACCTGCCA TAACAACATC TAACAACATC 3151 3151 ATGAAGCAGA ATGAAGCAGA CGATGGTGGA CGATGGTGGA TTCCTCCTGT TTCCTCCTGT AGAATCCTTA AGAATCCTTA CCAGTGACGT CCAGTGACGT 3201 3201 CTTCCAGGAC CTTCCAGGAC TGCAACAAGC TGCAACAAGC TGGTGGACCC TGGTGGACC CGAGCCATAT CGAGCCATAT CTGGATGTCT CTGGATGTCT 3251 3251 GCATTTACGA GCATTTACGA CACCTGCTCC CACCTGCTCC TGTGAGTCCA TGTGAGTCCA TTGGGGACTG TTGGGGACTG CGCCGCATTC CGCCGCATTC 3301 3301 TGCGACACCA TGCGACACCA TTGCTGCCTA TTGCTGCCTA TGCCCACGTG TGCCCACGTG TGTGCCCAGC TGTGCCCAGC ATGGCAAGGT ATGGCAAGGT 3351 3351 GGTGACCTGG GGTGACTGG AGGACGGCCA AGGACGGCCA CATTGTGCCC CATTGTGCCCC CCAGAGCTGC CCAGAGCTGC GAGGAGAGGA GAGGAGAGGA 3401 3401 ATCTCCGGGA ATCTCCGGGA GAACGGGTAT GAACGGGTAT GAGGCTGAGT GAGGCTGAGT GGCGCTATAA GGCCGCTATAA CAGCTGTGCA CAGCTGTGCA 3451 3451 CCTGCCTGTC CCTGCCTGTC AAGTCACGTG AAGTCACGTG TCAGCACCCT TCAGCACCCT GAGCCACTGG GAGCCACTGG CCTGCCCTGT CCTGCCCTGT 3501 3501 GCAGTGTGTG GCAGTGTGTG GAGGGCTGCC GAGGGCTGCC ATGCCCACTG ATGCCCACTG CCCTCCAGGG CCCTCCAGGG AAAATCCTGG AAAATCCTGG 3551 3551 ATGAGCTTTT ATGAGCTTTT GCAGACCTGC GCAGACCTGC GTTGACCCTG GTTGACCCTG AAGACTGTCC AAGACTGTCC AGTGTGTGAG AGTGTGTGAG 3601 3601 GTGGCTGGCC GTGGCTGGCC GGCGTTTTGC GGCGTTTTGC CTCAGGAAAG CTCAGGAAAG AAAGTCACCT AAAGTCACCT TGAATCCCAG TGAATCCCAG 3651 3651 TGACCCTGAG TGACCCTGAG CACTGCCAGA CACTGCCAGA TTTGCCACTG TTTGCCACTG TGATGTTGTC TGATGTTGTC AACCTCACCT AACCTCACCT 3701 3701 GTGAAGCCTG GTGAAGCCTG CCAGGAGCCG CCAGGAGCCG ATATCGGGCG ATATCGGGCG CGCCAACATC CGCCAACATC AGAGAGCGCC AGAGAGCGCC 3751 3751 ACCCCTGAAA ACCCCTGAAA GTGGTCCCGG GTGGTCCCGG GAGCGAGCCA GAGCGAGCCA GCCACATCTG GCCACATCTG GGTCGGAAAC GGTCGGAAAC 3801 3801 GCCAGGCACA GCCAGGCACA AGTGAGTCTG AGTGAGTCTG CAACTCCCGA CAACTCCCGA GTCCGGACCT GTCCGGACCT GGCTCCGAGC GGCTCCGAGC 3851 3851 CTGCCACTAG CTGCCACTAG CGGCTCCGAG CGGCTCCGAG ACTCCGGGAA ACTCCGGGAA CTTCCGAGAG CTTCCGAGAG CGCTACACCA CGCTACACCA 3901 3901 GAAAGCGGAC GAAAGCGGAC CCGGAACCAG CCGGAACCAG TACCGAACCT TACCGAACCT AGCGAGGGCT AGCGAGGGCT CTGCTCCGGG CTGCTCCGGG 3951 3951 CAGCCCAGCC CAGCCCAGCC GGCTCTCCTA GGCTCTCCCTA CATCCACGGA CATCCACGGA GGAGGGCACT GGAGGGCACT TCCGAATCCG TCCGAATCCG 4001 4001 CCACCCCGGA CCACCCCGGA GTCAGGGCCA GTCAGGGCCA GGATCTGAAC GGATCTGAAC CCGCTACCTC CCGCTACCTC AGGCAGTGAG AGGCAGTGAG 4051 4051 ACGCCAGGAA ACGCCAGGAA CGAGCGAGTC CGAGCGAGTC CGCTACACCG CGCTACACCG GAGAGTGGGC GAGAGTGGGC CAGGGAGCCC CAGGGAGCCC 4101 4101 TGCTGGATCT TGCTGGATCT CCTACGTCCA CCTACGTCCA CTGAGGAAGG CTGAGGAAGG GTCACCAGCG GTCACCAGCG GGCTCGCCCA GGCTCGCCCA 4151 4151 CCAGCACTGA CCAGCACTGA AGAAGGTGCC AGAAGGTGCC TCGAGCGGCG TCGAGCGGCG GTGGAGGATC GTGGAGGATC CGGTGGCGGG CGGTGGCGGG 4201 4201 GGATCCGGTG GGATCCGGTG GCGGGGGATC GCGGGGGATC CGGTGGCGGG CGGTGGCGGG GGATCCGGTG GGATCCGGTG GCGGGGGATC GCGGGGGATC 4251 4251 CGGTGGCGGG CGGTGGCGGG GGATCCCTGG GGATCCCTGG TCCCCCGGGG TCCCCCGGGG CAGCGGAGGC CAGCGGAGGC GACAAAACTC GACAAAACTC 4301 4301 ACACATGCCC ACACATGCCC ACCGTGCCCA ACCGTGCCCA GCTCCAGAAC GCTCCAGAAC TCCTGGGCGG TCCTGGGCGG ACCGTCAGTC ACCGTCAGTC 4351 4351 TTCCTCTTCC TTCCTCTTCC CCCCAAAACC CCCCAAAACC CAAGGACACC CAAGGACACC CTCATGATCT CTCATGATCT CCCGGACCCC CCCGGACCCC 4401 4401 TGAGGTCACA TGAGGTCACA TGCGTGGTGG TGCGTGGTGG TGGACGTGAG TGGACGTGAG CCACGAAGAC CCACGAAGAC CCTGAGGTCA CCTGAGGTCA 4451 4451 AGTTCAACTG AGTTCAACTG GTACGTGGAC GTACGTGGAC GGCGTGGAGG GGCGTGGAGG TGCATAATGC TGCATAATGC CAAGACAAAG CAAGACAAAG 4501 4501 CCGCGGGAGG CCGCGGGAGG AGCAGTACAA AGCAGTACAAA CAGCACGTAC CAGCACGTAC CGTGTGGTCA CGTGTGGTCA GCGTCCTCAC GCGTCCTAC 4551 4551 CGTCCTGCAC CGTCCTGCAC CAGGACTGGC CAGGACTGGC TGAATGGCAA TGAATGGCAA GGAGTACAAG GGAGTACAAG TGCAAGGTCT TGCAAGGTCT 4601 4601 CCAACAAAGC CCAACAAAGC CCTCCCAGCC CCTCCCAGCC CCCATCGAGA CCCATCGAGA AAACCATCTC AAACCATCTC CAAAGCCAAA CAAAGCCAAA 4651 4651 GGGCAGCCCC GGGCAGCCCC GAGAACCACA GAGAACCACA GGTGTACACC GGTGTACACC CTGCCCCCAT CTGCCCCCAT CCCGGGATGA CCCGGGATGA 4701 4701 GCTGACCAAG GCTGACCAAG AACCAGGTCA AACCAGGTCA GCCTGACCTG GCCTGACCTG CCTGGTCAAA CCTGGTCAA GGCTTCTATC GGCTTTCTATC 4751 4751 CCAGCGACAT CCAGCGACAT CGCCGTGGAG CGCCGTGGAG TGGGAGAGCA TGGGAGAGCA ATGGGCAGCC ATGGGCAGCC GGAGAACAAC GGAGAACAC 4801 4801 TACAAGACCA TACAAGACCA CGCCTCCCGT CGCCTCCCGT GTTGGACTCC GTTGGACTCC GACGGCTCCT GACGGCTCCT TCTTCCTCTA TCTTCCTCTA 4851 4851 CAGCAAGCTC CAGCAAGCTC ACCGTGGACA ACCGTGGACA AGAGCAGGTG AGAGCAGGTG GCAGCAGGGG GCAGCAGGGG AACGTCTTCT AACGTCTTCT 4901 4951 4901 4951 CATGCTCCGT CTCTCCCTGT CATGCTCCGT CTCTCCCTGT GATGCATGAG CTCCGGGTAA GATGCATGAG CTCCGGGTAA GCTCTGCACA AT GA GCTCTGCACA AT GA ACCACTACAC ACCACTACAC GCAGAAGAGC GCAGAAGAGC

- 57 041588- 57 041588

Белковая последовательность pSYN VWF057 (D’D3-Fc VWF с тромбиновым сайтом LVPR в линкере): подчеркнутый жирной линией участок показывает линкерную область, содержащую расщепляемый тромбином LVPR (SEP ID NO: 80)Protein sequence of pSYN VWF057 (D'D3-Fc VWF with LVPR thrombin site in linker): the underlined region shows the linker region containing thrombin-cleaved LVPR (SEP ID NO: 80)

1 51 1 51 MIPARFAGVL YSFAGYCSYL MIPARFAGVL YSFAGYCSYL LALALILPGT LAGGCQKRSF LALALILPGT LAGGCQKRSF LCAEGTRGRS SIIGDFQNGK LCAEGTRGRS SIIGDFQNGK STARCSLFGS RVSLSVYLGE STARCSLFGS RVSLSVYLGE DFVNTFDGSM FFDIHLFVNG DFVNTFDGSM FFDIHLFVNG 101 101 TVTQGDQRVS TVTQGDQRVS MPYASKGLYL MPYASKGLYL ETEAGYYKLS ETEAGYYKLS GEAYGFVARI GEAYGFVARI DGSGNFQVLL DGSGNFQVLL 151 151 SDRYFNKTCG SDRYFNKTCG LCGNFNIFAE LCGNFNIFAE DDFMTQEGTL DDFMTQEGTL TSDPYDFANS TSDPYDFANS WALSSGEQWC WALSSGEQWC 201 201 ERASPPSSSC ERASPPSSSC NISSGEMQKG NISSGEMQKG LWEQCQLLKS LWEQCQLLKS TSVFARCHPL TSVFARCHPL VDPEPFVALC VDPEPFVALC 251 251 EKTLCECAGG EKTLCECAGG LECACPALLE LECACPALLE YARTCAQEGM YARTCAQEGM VLYGWTDHSA VLYGWTDHSA CSPVCPAGME CSPVCPAGME 301 301 YRQCVSPCAR YRQCVSPCAR TCQSLHINEM TCQSLHINEM CQERCVDGCS CQERCVDGCS CPEGQLLDEG CPEGQLLDEG LCVESTECPC LCVESTECPC 351 351 VHSGKRYPPG VHSGKRYPPG TSLSRDCNTC TSLSRDCNTC ICRNSQWICS ICRNSQWICS NEECPGECLV NEECPGECLV TGQSHFKSFD TGQSHFKSFD 401 401 NRYFTFSGIC NRYFTFSGIC QYLLARDCQD QYLLARDCQD HSFSIVIETV HSFSIVIETV QCADDRDAVC QCADDRDAVC TRSVTVRLPG TRSVTVRLPG 451 451 LHNSLVKLKH LHNSLVKLKH GAGVAMDGQD GAGVAMDGQD IQLPLLKGDL IQLPLLKGDL RIQHTVTASV RIQHTVTASV RLSYGEDLQM RLSYGEDLQM 501 501 DWDGRGRLLV DWDGRGRLLV KLSPVYAGKT KLSPVYAGKT CGLCGNYNGN CGLCGNYNGN QGDDFLTPSG QGDDFLTPSG LAEPRVEDFG LAEPRVEDFG 551 551 NAWKLHGDCQ NAWKLHGDCQ DLQKQHSDPC DLQKQHSDPC ALNPRMTRFS ALNPRMTRFS EEACAVLTSP EEACAVLTSP TFEACHRAVS TFEACHRAVS 601 601 PLPYLRNCRY PLPYLRNCRY DVCSCSDGRE DVCSCSDGRE CLCGALASYA CLCGALASYA AACAGRGVRV AACAGRGVRV AWREPGRCEL AWREPGRCEL 651 651 NCPKGQVYLQ NCPKGQVYLQ CGTPCNLTCR CGTPCNLTCR SLSYPDEECN SLSYPDEECN EACLEGCFCP EACLEGCFCP PGLYMDERGD PGLYMDERGD 701 701 CVPKAQCPCY CVPKAQCPCY YDGEIFQPED YDGEIFQPED IFSDHHTMCY IFSDHHTMCY CEDGFMHCTM CEDGFMHCTM SGVPGSLLPD SGVPGSLLPD 751 751 AVLSSPLSHR AVLSSPLSHR SKRSLSCRPP SKRSLSCRPP MVKLVCPADN MVKLVCPADN LRAEGLECTK LRAEGLECTK TCQNYDLECM TCQNYDLECM 801 801 SMGCVSGCLC SMGCVSGCLC PPGMVRHENR PPGMVRHENR CVALERCPCF CVALERCPCF HQGKEYAPGE HQGKEYAPGE TVKIGCNTCV TVKIGCNTCV 851 851 CRDRKWNCTD CRDRKWNCTD HVCDATCSTI HVCDATCSTI GMAHYLTFDG GMAHYLTFDG LKYLFPGECQ LKYLFPGECQ YVLVQDYCGS YVLVQDYCGGS 901 901 NPGTFRILVG NPGTFRILVG NKGCSHPSVK NKGCSHPSVK CKKRVTILVE CKKRVTILVE GGEIELFDGE GGEIELFGE VNVKRPMKDE VNVKRPMKDE 951 951 THFEWESGR THFEWESGR YIILLLGKAL YIILLLGKAL SWWDRHLSI SWWDRHLSI SWLKQTYQE SWLKQTYQE KVCGLCGNFD KVCGLCGNFD 1001 1001 GIQNNDLTSS GIQNNDLTSS NLQVEEDPVD NLQVEEDPVD FGNSWKVSSQ FGNSWKVSSQ CADTRKVPLD CADTRKVPLD SSPATCHNNI SSPATCHNNI 1051 1051 MKQTMVDSSC MKQTMVDSSC RILTSDVFQD RILTSDVFQD CNKLVDPEPY CNKLVDPEPY LDVCIYDTCS LDVCIYDTCS CESIGDCAAF CESIGDCAAF 1101 1101 CDTIAAYAHV CDTIAAYAHV CAQHGKWTW CAQHGKWTW RTATLCPQSC RTATLCPQSC EERNLRENGY EERNLRENGY EAEWRYNSCA EAEWRYNSCA 1151 1151 PACQVTCQHP PACQVTCQHP EPLACPVQCV EPLACPVQCV EGCHAHCPPG EGCHAHCPPG KILDELLQTC KILDELLQTC VDPEDCPVCE VDPEDCPVCE 1201 1201 VAGRRFASGK VAGRRFASGK KVTLNPSDPE KVTLNPSDPE HCQICHCDW HCQICHCDW NLTCEACQEP NLTCEACQEP ISGAPTSESA ISGAPTSESA 1251 1251 TPESGPGSEP TPESGPGSEP ATSGSETPGT ATSGSETPGT SESATPESGP SESATPESGP GSEPATSGSE GSEPATSGSE TPGTSESATP TPGTSESATP 1301 1301 ESGPGTSTEP ESGPGTSTEP SEGSAPGSPA SEGSAPGSPA GSPTSTEEGT GSPTSTEEGT SESATPESGP SESATPESGP GSEPATSGSE GSEPATSGSE 1351 1351 TPGTSESATP TPGTSESATP ESGPGSPAGS ESGPGSPAGS PTSTEEGSPA PTSTEEGSPA GSPTSTEEGA GSPTSTEEGA SSGGGGSGGG SSGGGGSGGG 1401 1401 GSGGGGSGGG GSGGGGSGGG GSGGGGSGGG GSGGGGSGGG GSGGGGSLVP GSGGGGSLVVP RGSGGDKTHT RGSGGDKTHT CPPCPAPELL CPPCPAPELL 1451 1451 GGPSVFLFPP GGPSVFLFPP KPKDTLMISR KPKDTLMISR TPEVTCVWD TPEVTCVWD VSHEDPEVKF VSHEDPEVKF NWYVDGVEVH NWYVDGVEVH 1501 1501 NAKTKPREEQ NAKTKPREEQ YNSTYRWSV YNSTYRWSV LTVLHQDWLN LTVLHQDWLN GKEYKCKVSN GKEYKCKVSN KALPAPIEKT KALPAPIEKT 1551 1551 ISKAKGQPRE ISKAKGQPRE PQVYTLPPSR PQVYTLPPSR DELTKNQVSL DELTKNQVSL TCLVKGFYPS TCLVKGFYPS DIAVEWESNG DIAVEWESNG 1601 1601 QPENNYKTTP QPENNYKTTP PVLDSDGSFF PVLDSDGSFF LYSKLTVDKS LYSKLTVDKS RWQQGNVFSC RWQQGNVFSC SVMHEALHNH SVMHEALHNH 1651 1651 YTQKSLSLSP YTQKSLSLSP GK* GK*

Нуклеотидная последовательность pSYN VWF059 (D’D3-Fc VWF с кислотной областью 2 (а2) тромбиновый сайт в линкере) (SEQ ID NO: 81)Nucleotide sequence of pSYN VWF059 (D'D3-Fc VWF with acid region 2 (a2) thrombin site in linker) (SEQ ID NO: 81)

ATGATTCCTG CCAGATTTGC CGGGGTGCTG CTTGCTCTGG CCCTCATTTTATGATTCCTG CCAGATTTGC CGGGGTGCTG CTTGTCTGG CCCTCATTTT

GCCAGGGACC CTTTGTGCAG AAGGAACTCG CGGCAGGTCA TCCACGGCCCGCCAGGGACC CTTTGTGCAG AAGGAACTCG CGGCAGGTCA TCCACGGCCC

101 GATGCAGCCT TTTCGGAAGT GACTTCGTCA ACACCTTTGA TGGGAGCATG101 GATGCAGCCT TTTCGGAAGT GACTTCGTCA ACACCTTTGA TGGGAGCATG

151 TACAGCTTTG CGGGATACTG CAGTTACCTC CTGGCAGGGG GCTGCCAGAA151 TACAGCTTTG CGGGATACTG CAGTTACCTC CTGGCAGGGG GCTGCCAGAA

201 ACGCTCCTTC TCGATTATTG GGGACTTCCA GAATGGCAAG AGAGTGAGCC201 ACGCTCCTTC TCGATTATTG GGGACTTCCA GAATGGCAAG AGAGTGAGCC

251 TCTCCGTGTA TCTTGGGGAA TTTTTTGACA TCCATTTGTT TGTCAATGGT251 TCTCCGTGTA TCTGGGGAA TTTTTTGACA TCCATTTGTT TGTCAATGGT

301 ACCGTGACAC AGGGGGACCA AAGAGTCTCC ATGCCCTATG CCTCCAAAGG301 ACCGTGACAC AGGGGGACCA AAGAGTCTCC ATGCCCTATG CCTCCAAAGG

351 GCTGTATCTA GAAACTGAGG CTGGGTACTA CAAGCTGTCC GGTGAGGCCT351 GCTGTATCTA GAAACTGAGG CTGGGTACTA CAAGCGTGTCC GGTGAGGCCT

401 ATGGCTTTGT GGCCAGGATC GATGGCAGCG GCAACTTTCA AGTCCTGCTG401 ATGGCTTTGT GGCCAGGATC GATGGCAGCG GCAACTTTCA AGTCCTGCTG

451 TCAGACAGAT ACTTCAACAA GACCTGCGGG CTGTGTGGCA ACTTTAACAT451 TCAGACAGAT ACTTCAACAA GACCTGCGGG CTGTGTGGCA ACTTTAACAT

501 CTTTGCTGAA GATGACTTTA TGACCCAAGA AGGGACCTTG ACCTCGGACC501 CTTTGCTGAA GATGACTTTA TGACCCAAGA AGGGACCTTG ACCTCGGACC

551 CTTATGACTT TGCCAACTCA TGGGCTCTGA GCAGTGGAGA ACAGTGGTGT551 CTTATGACTT TGCCAACTCA TGGGCTCTGA GCAGTGGAGA ACAGTGGTGT

601 GAACGGGCAT CTCCTCCCAG CAGCTCATGC AACATCTCCT CTGGGGAAAT601 GAACGGGCAT CTCCTCCCAG CAGCTCATGC AACATCTCCT CTGGGGAAAT

651 GCAGAAGGGC CTGTGGGAGC AGTGCCAGCT TCTGAAGAGC ACCTCGGTGT651 GCAGAAGGGC CTGTGGGAGC AGTGCCAGCT TCTGAAGAGC ACCTCGGTGT

701 TTGCCCGCTG CCACCCTCTG GTGGACCCCG AGCCTTTTGT GGCCCTGTGT701 TTGCCCGCTG CCACCCTCTG GTGGACCCCG AGCCTTTTTGT GGCCCTGTGT

751 GAGAAGACTT TGTGTGAGTG TGCTGGGGGG CTGGAGTGCG CCTGCCCTGC751 GAGAAGACTT TGTGTGAGTG TGCTGGGGGG CTGGAGTGCG CCTGCCCTGC

801 CCTCCTGGAG TACGCCCGGA CCTGTGCCCA GGAGGGAATG GTGCTGTACG801 CCTCTGGAG TACGCCCGGA CCTGTGCCCA GGAGGGAATG GTGCTGTACG

851 GCTGGACCGA CCACAGCGCG TGCAGCCCAG TGTGCCCTGC TGGTATGGAG851 GCTGGACCGA CCACAGCGCG TGCAGCCCAG TGTGCCCTGC TGGTATGGAG

901 TATAGGCAGT GTGTGTCCCC TTGCGCCAGG ACCTGCCAGA GCCTGCACAT901 TATAGGCAGT GTGTGTCCCC TTGCGCCAGG ACCTGCCAGA GCCTGCACAT

951 CAATGAAATG TGTCAGGAGC GATGCGTGGA TGGCTGCAGC TGCCCTGAGG951 CAATGAAATG TGTCAGGAGC GATGCGTGGA TGGCTGCAGC TGCCCTGAGG

1001 GACAGCTCCT GGATGAAGGC CTCTGCGTGG AGAGCACCGA GTGTCCCTGC1001 GACAGCTCCT GGATGAAGGC CTCTGCGTGG AGAGCACCGA GTGTCCCCTGC

1051 GTGCATTCCG GAAAGCGCTA CCCTCCCGGC ACCTCCCTCT CTCGAGACTG1051 GTGCATTCCG GAAAGCGCTA CCCTCCCGGC ACCTCCCTCT CTCGAGACTG

- 58 041588- 58 041588

1101 CAACACCTGC ATTTGCCGAA ACAGCCAGTG GATCTGCAGC AATGAAGAAT 1151 GTCCAGGGGA GTGCCTTGTC ACTGGTCAAT CCCACTTCAA GAGCTTTGAC 1201 AACAGATACT TCACCTTCAG TGGGATCTGC CAGTACCTGC TGGCCCGGGA 1251 TTGCCAGGAC CACTCCTTCT CCATTGTCAT TGAGACTGTC CAGTGTGCTG 1301 ATGACCGCGA CGCTGTGTGC ACCCGCTCCG TCACCGTCCG GCTGCCTGGC 1351 CTGCACAACA GCCTTGTGAA ACTGAAGCAT GGGGCAGGAG TTGCCATGGA 1401 TGGCCAGGAC ATCCAGCTCC CCCTCCTGAA AGGTGACCTC CGCATCCAGC 1451 ATACAGTGAC GGCCTCCGTG CGCCTCAGCT ACGGGGAGGA CCTGCAGATG 1501 GACTGGGATG GCCGCGGGAG GCTGCTGGTG AAGCTGTCCC CCGTCTATGC 1551 CGGGAAGACC TGCGGCCTGT GTGGGAATTA CAATGGCAAC CAGGGCGACG 1601 ACTTCCTTAC CCCCTCTGGG CTGGCGGAGC CCCGGGTGGA GGACTTCGGG 1651 AACGCCTGGA AGCTGCACGG GGACTGCCAG GACCTGCAGA AGCAGCACAG 1701 CGATCCCTGC GCCCTCAACC CGCGCATGAC CAGGTTCTCC GAGGAGGCGT 1751 GCGCGGTCCT GACGTCCCCC ACATTCGAGG CCTGCCATCG TGCCGTCAGC 1801 CCGCTGCCCT ACCTGCGGAA CTGCCGCTAC GACGTGTGCT CCTGCTCGGA 1851 CGGCCGCGAG TGCCTGTGCG GCGCCCTGGC CAGCTATGCC GCGGCCTGCG 1901 CGGGGAGAGG CGTGCGCGTC GCGTGGCGCG AGCCAGGCCG CTGTGAGCTG 1951 AACTGCCCGA AAGGCCAGGT GTACCTGCAG TGCGGGACCC CCTGCAACCT 2001 GACCTGCCGC TCTCTCTCTT ACCCGGATGA GGAATGCAAT GAGGCCTGCC 2051 TGGAGGGCTG CTTCTGCCCC CCAGGGCTCT ACATGGATGA GAGGGGGGAC 2101 TGCGTGCCCA AGGCCCAGTG CCCCTGTTAC TATGACGGTG AGATCTTCCA 2151 GCCAGAAGAC ATCTTCTCAG ACCATCACAC CATGTGCTAC TGTGAGGATG 2201 GCTTCATGCA CTGTACCATG AGTGGAGTCC CCGGAAGCTT GCTGCCTGAC 2251 GCTGTCCTCA GCAGTCCCCT GTCTCATCGC AGCAAAAGGA GCCTATCCTG 2301 TCGGCCCCCC ATGGTCAAGC TGGTGTGTCC CGCTGACAAC CTGCGGGCTG 2351 AAGGGCTCGA GTGTACCAAA ACGTGCCAGA ACTATGACCT GGAGTGCATG 2401 AGCATGGGCT GTGTCTCTGG CTGCCTCTGC CCCCCGGGCA TGGTCCGGCA 2451 TGAGAACAGA TGTGTGGCCC TGGAAAGGTG TCCCTGCTTC CATCAGGGCA 2501 AGGAGTATGC CCCTGGAGAA ACAGTGAAGA TTGGCTGCAA CACTTGTGTC 2551 TGTCGGGACC GGAAGTGGAA CTGCACAGAC CATGTGTGTG ATGCCACGTG 2601 CTCCACGATC GGCATGGCCC ACTACCTCAC CTTCGACGGG CTCAAATACC 2651 TGTTCCCCGG GGAGTGCCAG TACGTTCTGG TGCAGGATTA CTGCGGCAGT 2701 AACCCTGGGA CCTTTCGGAT CCTAGTGGGG AATAAGGGAT GCAGCCACCC 2751 CTCAGTGAAA TGCAAGAAAC GGGTCACCAT CCTGGTGGAG GGAGGAGAGA 2801 TTGAGCTGTT TGACGGGGAG GTGAATGTGA AGAGGCCCAT GAAGGATGAG 2851 ACTCACTTTG AGGTGGTGGA GTCTGGCCGG TACATCATTC TGCTGCTGGG 2901 CAAAGCCCTC TCCGTGGTCT GGGACCGCCA CCTGAGCATC TCCGTGGTCC 2951 TGAAGCAGAC ATACCAGGAG AAAGTGTGTG GCCTGTGTGG GAATTTTGAT 3001 GGCATCCAGA ACAATGACCT CACCAGCAGC AACCTCCAAG TGGAGGAAGA 3051 CCCTGTGGAC TTTGGGAACT CCTGGAAAGT GAGCTCGCAG TGTGCTGACA 3101 CCAGAAAAGT GCCTCTGGAC TCATCCCCTG CCACCTGCCA TAACAACATC 3151 ATGAAGCAGA CGATGGTGGA TTCCTCCTGT AGAATCCTTA CCAGTGACGT 3201 CTTCCAGGAC TGCAACAAGC TGGTGGACCC CGAGCCATAT CTGGATGTCT 3251 GCATTTACGA CACCTGCTCC TGTGAGTCCA TTGGGGACTG CGCCGCATTC 3301 TGCGACACCA TTGCTGCCTA TGCCCACGTG TGTGCCCAGC ATGGCAAGGT 3351 GGTGACCTGG AGGACGGCCA CATTGTGCCC CCAGAGCTGC GAGGAGAGGA 3401 ATCTCCGGGA GAACGGGTAT GAGGCTGAGT GGCGCTATAA CAGCTGTGCA 3451 CCTGCCTGTC AAGTCACGTG TCAGCACCCT GAGCCACTGG CCTGCCCTGT 3501 GCAGTGTGTG GAGGGCTGCC ATGCCCACTG CCCTCCAGGG AAAATCCTGG 3551 ATGAGCTTTT GCAGACCTGC GTTGACCCTG AAGACTGTCC AGTGTGTGAG 3601 GTGGCTGGCC GGCGTTTTGC CTCAGGAAAG AAAGTCACCT TGAATCCCAG 3651 TGACCCTGAG CACTGCCAGA TTTGCCACTG TGATGTTGTC AACCTCACCT 3701 GTGAAGCCTG CCAGGAGCCG ATATCGGGCG CGCCAACATC AGAGAGCGCC 3751 ACCCCTGAAA GTGGTCCCGG GAGCGAGCCA GCCACATCTG GGTCGGAAAC 3801 GCCAGGCACA AGTGAGTCTG CAACTCCCGA GTCCGGACCT GGCTCCGAGC 3851 CTGCCACTAG CGGCTCCGAG ACTCCGGGAA CTTCCGAGAG CGCTACACCA 3901 GAAAGCGGAC CCGGAACCAG TACCGAACCT AGCGAGGGCT CTGCTCCGGG 3951 CAGCCCAGCC GGCTCTCCTA CATCCACGGA GGAGGGCACT TCCGAATCCG 4001 CCACCCCGGA GTCAGGGCCA GGATCTGAAC CCGCTACCTC AGGCAGTGAG 4051 ACGCCAGGAA CGAGCGAGTC CGCTACACCG GAGAGTGGGC CAGGGAGCCC 4101 TGCTGGATCT CCTACGTCCA CTGAGGAAGG GTCACCAGCG GGCTCGCCCA 4151 CCAGCACTGA AGAAGGTGCC TCGATATCTG ACAAGAACAC TGGTGATTAT 4201 TACGAGGACA GTTATGAAGA TATTTCAGCA TACTTGCTGA GTAAAAACAA 4251 TGCCATTGAA CCAAGAAGCT TCTCTGACAA AACTCACACA TGCCCACCGT1101 CAACACCTGC ATTTGCCGAA ACAGCCAGTG GATCTGCAGC AATGAAGAAT 1151 GTCCAGGGGA GTGCCTTGTC ACTGGTCAAT CCCACTTCAA GAGCTTTGAC 1201 AACAGATACT TCACCTTCAG TGGGATCTGC CAGTACCTGC TGGCCCGGGA 1251 TTGCCAGGAC CACTCCTTCT CCATTGTCAT TGAGACTGTC CAGTGTGCTG 1301 ATGACCGCGA CGCTGTGTGC ACCCGCTCCG TCACCGTCCG GCTGCCTGGC 1351 CTGCACAACA GCCTTGTGAA ACTGAAGCAT GGGGCAGGAG TTGCCATGGA 1401 TGGCCAGGAC ATCCAGCTCC CCCTCCTGAA AGGTGACCTC CGCATCCAGC 1451 ATACAGTGAC GGCCTCCGTG CGCCTCAGCT ACGGGGAGGA CCTGCAGATG 1501 GACTGGGATG GCCGCGGGAG GCTGCTGGTG AAGCTGTCCC CCGTCTATGC 1551 CGGGAAGACC TGCGGCCTGT GTGGGAATTA CAATGGCAAC CAGGGCGACG 1601 ACTTCCTTAC CCCCTCTGGG CTGGCGGAGC CCCGGGTGGA GGACTTCGGG 1651 AACGCCTGGA AGCTGCACGG GGACTGCCAG GACCTGCAGA AGCAGCACAG 1701 CGATCCCTGC GCCCTCAACC CGCGCATGAC CAGGTTCTCC GAGGAGGCGT 1751 GCGCGGTCCT GACGTCCCCC ACATTCGAGG CCTGCCATCG TGCCGTCAGC 1801 CCGCTGCCCT ACCTGCGGAA CTGCCGCTAC GACGTGTGCT CCTGCTCGGA 1851 CGGCCGCGAG TGCCTGTGCG GCGCCCTGGC CAGCTATGCC GCGGCCTGCG 1901 CGGGGAGAGG CGTGCGCGTC GCGTGGCGCG AG CCAGGCCG CTGTGAGCTG 1951 AACTGCCCGA AAGGCCAGGT GTACCTGCAG TGCGGGACCC CCTGCAACCT 2001 GACCTGCCGC TCTCTCTCTT ACCCGGATGA GGAATGCAAT GAGGCCTGCC 2051 TGGAGGGCTG CTTCTGCCCC CCAGGGCTCT ACATGGATGA GAGGGGGGAC 2101 TGCGTGCCCA AGGCCCAGTG CCCCTGTTAC TATGACGGTG AGATCTTCCA 2151 GCCAGAAGAC ATCTTCTCAG ACCATCACAC CATGTGCTAC TGTGAGGATG 2201 GCTTCATGCA CTGTACCATG AGTGGAGTCC CCGGAAGCTT GCTGCCTGAC 2251 GCTGTCCTCA GCAGTCCCCT GTCTCATCGC AGCAAAAGGA GCCTATCCTG 2301 TCGGCCCCCC ATGGTCAAGC TGGTGTGTCC CGCTGACAAC CTGCGGGCTG 2351 AAGGGCTCGA GTGTACCAAA ACGTGCCAGA ACTATGACCT GGAGTGCATG 2401 AGCATGGGCT GTGTCTCTGG CTGCCTCTGC CCCCCGGGCA TGGTCCGGCA 2451 TGAGAACAGA TGTGTGGCCC TGGAAAGGTG TCCCTGCTTC CATCAGGGCA 2501 AGGAGTATGC CCCTGGAGAA ACAGTGAAGA TTGGCTGCAA CACTTGTGTC 2551 TGTCGGGACC GGAAGTGGAA CTGCACAGAC CATGTGTGTG ATGCCACGTG 2601 CTCCACGATC GGCATGGCCC ACTACCTCAC CTTCGACGGG CTCAAATACC 2651 TGTTCCCCGG GGAGTGCCAG TACGTTCTGG TGCAGGATTA CTGCGGCAGT 2701 AACCCTGGGA CCTTTCGGAT CCTAGTGGGG AATAAGGGAT GCAGCCACCC 2751 CTCAGTGAAA TGCA AGAAAC GGGTCACCAT CCTGGTGGAG GGAGGAGAGA 2801 TTGAGCTGTT TGACGGGGAG GTGAATGTGA AGAGGCCCAT GAAGGATGAG 2851 ACTCACTTTG AGGTGGTGGA GTCTGGCCGG TACATCATTC TGCTGCTGGG 2901 CAAAGCCCTC TCCGTGGTCT GGGACCGCCA CCTGAGCATC TCCGTGGTCC 2951 TGAAGCAGAC ATACCAGGAG AAAGTGTGTG GCCTGTGTGG GAATTTTGAT 3001 GGCATCCAGA ACAATGACCT CACCAGCAGC AACCTCCAAG TGGAGGAAGA 3051 CCCTGTGGAC TTTGGGAACT CCTGGAAAGT GAGCTCGCAG TGTGCTGACA 3101 CCAGAAAAGT GCCTCTGGAC TCATCCCCTG CCACCTGCCA TAACAACATC 3151 ATGAAGCAGA CGATGGTGGA TTCCTCCTGT AGAATCCTTA CCAGTGACGT 3201 CTTCCAGGAC TGCAACAAGC TGGTGGACCC CGAGCCATAT CTGGATGTCT 3251 GCATTTACGA CACCTGCTCC TGTGAGTCCA TTGGGGACTG CGCCGCATTC 3301 TGCGACACCA TTGCTGCCTA TGCCCACGTG TGTGCCCAGC ATGGCAAGGT 3351 GGTGACCTGG AGGACGGCCA CATTGTGCCC CCAGAGCTGC GAGGAGAGGA 3401 ATCTCCGGGA GAACGGGTAT GAGGCTGAGT GGCGCTATAA CAGCTGTGCA 3451 CCTGCCTGTC AAGTCACGTG TCAGCACCCT GAGCCACTGG CCTGCCCTGT 3501 GCAGTGTGTG GAGGGCTGCC ATGCCCACTG CCCTCCAGGG AAAATCCTGG 3551 ATGAGCTTTT GCAGACCTGC GTTGACCCTG AAGACTGTCC AGTGTGTGAG3601 GTGGCTGGCC GGCGTTTTGC CTCAGGAAAG AAAGTCACCT TGAATCCCAG 3651 TGACCCTGAG CACTGCCAGA TTTGCCACTG TGATGTTGTC AACCTCACCT 3701 GTGAAGCCTG CCAGGAGCCG ATATCGGGCG CGCCAACATC AGAGAGCGCC 3751 ACCCCTGAAA GTGGTCCCGG GAGCGAGCCA GCCACATCTG GGTCGGAAAC 3801 GCCAGGCACA AGTGAGTCTG CAACTCCCGA GTCCGGACCT GGCTCCGAGC 3851 CTGCCACTAG CGGCTCCGAG ACTCCGGGAA CTTCCGAGAG CGCTACACCA 3901 GAAAGCGGAC CCGGAACCAG TACCGAACCT AGCGAGGGCT CTGCTCCGGG 3951 CAGCCCAGCC GGCTCTCCTA CATCCACGGA GGAGGGCACT TCCGAATCCG 4001 CCACCCCGGA GTCAGGGCCA GGATCTGAAC CCGCTACCTC AGGCAGTGAG 4051 ACGCCAGGAA CGAGCGAGTC CGCTACACCG GAGAGTGGGC CAGGGAGCCC 4101 TGCTGGATCT CCTACGTCCA CTGAGGAAGG GTCACCAGCG GGCTCGCCCA 4151 CCAGCACTGA AGAAGGTGCC TCGATATCTG ACAAGAACAC TGGTGATTAT 4201 TACGAGGACA GTTATGAAGA TATTTCAGCA TACTTGCTGA GTAAAAACAA 4251 TGCCATTGAA CCAAGAAGCT TCTCTGACAA AACTCACACA TGCCCACCGT

- 59 041588- 59 041588

4301 GCCCAGCTCC AGAACTCCTG GGCGGACCGT CAGTCTTCCT CTTCCCCCCA4301 GCCCAGCTCC AGAACTCCTG GGCGGACCGT CAGTCTTCCT CTTCCCCCCA

4351 AAACCCAAGG ACACCCTCAT GATCTCCCGG ACCCCTGAGG TCACATGCGT4351 AAACCCAAGG ACACCCTCAT GATCTCCCGG ACCCCTGAGG TCACATGCGT

4401 GGTGGTGGAC GTGAGCCACG AAGACCCTGA GGTCAAGTTC AACTGGTACG4401 GGTGGTGGAC GTGAGCCACG AAGACCCTGA GGTCAAGTTC AACTGGTACG

4451 TGGACGGCGT GGAGGTGCAT AATGCCAAGA CAAAGCCGCG GGAGGAGCAG4451 TGGACGGCGT GGAGGTGCAT AATGCCAAGA CAAAGCCGCG GGAGGAGCAG

4501 TACAACAGCA CGTACCGTGT GGTCAGCGTC CTCACCGTCC TGCACCAGGA4501 TACAACAGCA CGTACCGTGT GGTCAGCGTC CTCACCGTCC TGCACCAGGA

4551 CTGGCTGAAT GGCAAGGAGT ACAAGTGCAA GGTCTCCAAC AAAGCCCTCC4551 CTGGCTGAAT GGCAAGGAGT ACAAGTGCAA GGTCTCCAAC AAAGCCCTCC

4601 CAGCCCCCAT CGAGAAAACC ATCTCCAAAG CCAAAGGGCA GCCCCGAGAA4601 CAGCCCCCAT CGAGAAAACC ATCTCCAAAG CCAAAGGGCA GCCCCGAGAA

4651 CCACAGGTGT ACACCCTGCC CCCATCCCGG GATGAGCTGA CCAAGAACCA4651 CCACAGGTGT ACACCCTGCC CCCATCCCGG GATGAGCTGA CCAAGAACCA

4701 GGTCAGCCTG ACCTGCCTGG TCAAAGGCTT CTATCCCAGC GACATCGCCG4701 GGTCAGCCTG ACTGCCTGG TCAAAGGCTT CTATCCCAGC GACATCGCCG

4751 TGGAGTGGGA GAGCAATGGG CAGCCGGAGA ACAACTACAA GACCACGCCT4751 TGGAGTGGGA GAGCAATGGG CAGCCGGAGA ACAACTACAA GACCACGCCT

4801 CCCGTGTTGG ACTCCGACGG CTCCTTCTTC CTCTACAGCA AGCTCACCGT4801 CCCGTGTTGG ACTCCGACGG CTCCTTCTTC CTCTACAGCA AGCTCACCGT

4851 GGACAAGAGC AGGTGGCAGC AGGGGAACGT CTTCTCATGC TCCGTGATGC4851 GGACAAGAGC AGGTGGCAGC AGGGGAACGT CTTCTCATGC TCCGTGATGC

4901 ATGAGGCTCT GCACAACCAC TACACGCAGA AGAGCCTCTC CCTGTCTCCG4901 ATGAGGCTCT GCACAACCAC TACACGCAGA AGAGCCTCTC CCTGTCTCCG

4951 GGTAAATGA4951 ggtaaatga

Белковая последовательность pSYN VWF059 (D’D3-Fc VWF с тромбиновым сайтом LVPR в линкере) - подчеркнутый жирной линией участок показывает область а2 (SEQ ID NO: 82)Protein sequence pSYN VWF059 (D'D3-Fc VWF with LVPR thrombin site in linker) - the underlined region shows the a2 region (SEQ ID NO: 82)

1 51 1 51 MIPARFAGVL YSFAGYCSYL MIPARFAGVL YSFAGYCSYL LALALILPGT LAGGCQKRSF LALALILPGT LAGGCQKRSF LCAEGTRGRS SIIGDFQNGK LCAEGTRGRS SIIGDFQNGK STARCSLFGS RVSLSVYLGE STARCSLFGS RVSLSVYLGE DFVNTFDGSM FFDIHLFVNG DFVNTFDGSM FFDIHLFVNG 101 101 TVTQGDQRVS TVTQGDQRVS MPYASKGLYL MPYASKGLYL ETEAGYYKLS ETEAGYYKLS GEAYGFVARI GEAYGFVARI DGSGNFQVLL DGSGNFQVLL 151 151 SDRYFNKTCG SDRYFNKTCG LCGNFNIFAE LCGNFNIFAE DDFMTQEGTL DDFMTQEGTL TSDPYDFANS TSDPYDFANS WALSSGEQWC WALSSGEQWC 201 201 ERASPPSSSC ERASPPSSSC NISSGEMQKG NISSGEMQKG LWEQCQLLKS LWEQCQLLKS TSVFARCHPL TSVFARCHPL VDPEPFVALC VDPEPFVALC 251 251 EKTLCECAGG EKTLCECAGG LECACPALLE LECACPALLE YARTCAQEGM YARTCAQEGM VLYGWTDHSA VLYGWTDHSA CSPVCPAGME CSPVCPAGME 301 301 YRQCVSPCAR YRQCVSPCAR TCQSLHINEM TCQSLHINEM CQERCVDGCS CQERCVDGCS CPEGQLLDEG CPEGQLLDEG LCVESTECPC LCVESTECPC 351 351 VHSGKRYPPG VHSGKRYPPG TSLSRDCNTC TSLSRDCNTC ICRNSQWICS ICRNSQWICS NEECPGECLV NEECPGECLV TGQSHFKSFD TGQSHFKSFD 401 401 NRYFTFSGIC NRYFTFSGIC QYLLARDCQD QYLLARDCQD HSFSIVIETV HSFSIVIETV QCADDRDAVC QCADDRDAVC TRSVTVRLPG TRSVTVRLPG 451 451 LHNSLVKLKH LHNSLVKLKH GAGVAMDGQD GAGVAMDGQD IQLPLLKGDL IQLPLLKGDL RIQHTVTASV RIQHTVTASV RLSYGEDLQM RLSYGEDLQM 501 501 DWDGRGRLLV DWDGRGRLLV KLSPVYAGKT KLSPVYAGKT CGLCGNYNGN CGLCGNYNGN QGDDFLTPSG QGDDFLTPSG LAEPRVEDFG LAEPRVEDFG 551 551 NAWKLHGDCQ NAWKLHGDCQ DLQKQHSDPC DLQKQHSDPC ALNPRMTRFS ALNPRMTRFS EEACAVLTSP EEACAVLTSP TFEACHRAVS TFEACHRAVS 601 601 PLPYLRNCRY PLPYLRNCRY DVCSCSDGRE DVCSCSDGRE CLCGALASYA CLCGALASYA AACAGRGVRV AACAGRGVRV AWREPGRCEL AWREPGRCEL 651 651 NCPKGQVYLQ NCPKGQVYLQ CGTPCNLTCR CGTPCNLTCR SLSYPDEECN SLSYPDEECN EACLEGCFCP EACLEGCFCP PGLYMDERGD PGLYMDERGD 701 701 CVPKAQCPCY CVPKAQCPCY YDGEIFQPED YDGEIFQPED IFSDHHTMCY IFSDHHTMCY CEDGFMHCTM CEDGFMHCTM SGVPGSLLPD SGVPGSLLPD 751 751 AVLSSPLSHR AVLSSPLSHR SKRSLSCRPP SKRSLSCRPP MVKLVCPADN MVKLVCPADN LRAEGLECTK LRAEGLECTK TCQNYDLECM TCQNYDLECM 801 801 SMGCVSGCLC SMGCVSGCLC PPGMVRHENR PPGMVRHENR CVALERCPCF CVALERCPCF HQGKEYAPGE HQGKEYAPGE TVKIGCNTCV TVKIGCNTCV 851 851 CRDRKWNCTD CRDRKWNCTD HVCDATCSTI HVCDATCSTI GMAHYLTFDG GMAHYLTFDG LKYLFPGECQ LKYLFPGECQ YVLVQDYCGS YVLVQDYCGGS 901 901 NPGTFRILVG NPGTFRILVG NKGCSHPSVK NKGCSHPSVK CKKRVTILVE CKKRVTILVE GGEIELFDGE GGEIELFGE VNVKRPMKDE VNVKRPMKDE 951 951 THFEWESGR THFEWESGR YIILLLGKAL YIILLLGKAL SWWDRHLSI SWWDRHLSI SWLKQTYQE SWLKQTYQE KVCGLCGNFD KVCGLCGNFD 1001 1001 GIQNNDLTSS GIQNNDLTSS NLQVEEDPVD NLQVEEDPVD FGNSWKVSSQ FGNSWKVSSQ CADTRKVPLD CADTRKVPLD SSPATCHNNI SSPATCHNNI 1051 1051 MKQTMVDSSC MKQTMVDSSC RILTSDVFQD RILTSDVFQD CNKLVDPEPY CNKLVDPEPY LDVCIYDTCS LDVCIYDTCS CESIGDCAAF CESIGDCAAF 1101 1101 CDTIAAYAHV CDTIAAYAHV CAQHGKWTW CAQHGKWTW RTATLCPQSC RTATLCPQSC EERNLRENGY EERNLRENGY EAEWRYNSCA EAEWRYNSCA 1151 1151 PACQVTCQHP PACQVTCQHP EPLACPVQCV EPLACPVQCV EGCHAHCPPG EGCHAHCPPG KILDELLQTC KILDELLQTC VDPEDCPVCE VDPEDCPVCE 1201 1201 VAGRRFASGK VAGRRFASGK KVTLNPSDPE KVTLNPSDPE HCQICHCDW HCQICHCDW NLTCEACQEP NLTCEACQEP ISGAPTSESA ISGAPTSESA 1251 1251 TPESGPGSEP TPESGPGSEP ATSGSETPGT ATSGSETPGT SESATPESGP SESATPESGP GSEPATSGSE GSEPATSGSE TPGTSESATP TPGTSESATP 1301 1301 ESGPGTSTEP ESGPGTSTEP SEGSAPGSPA SEGSAPGSPA GSPTSTEEGT GSPTSTEEGT SESATPESGP SESATPESGP GSEPATSGSE GSEPATSGSE 1351 1351 TPGTSESATP TPGTSESATP ESGPGSPAGS ESGPGSPAGS PTSTEEGSPA PTSTEEGSPA GSPTSTEEGA GSPTSTEEGA SISDKNTGDY SISDKNTGDY 1401 1401 YEDSYEDISA YEDSYEDISA YLLSKNNAIE YLLSKNNAIE PRSFSDKTHT PRSFSDKTHT CPPCPAPELL CPPCPAPELL GGPSVFLFPP GGPSVFLFPP 1451 1451 KPKDTLMISR KPKDTLMISR TPEVTCVWD TPEVTCVWD VSHEDPEVKF VSHEDPEVKF NWYVDGVEVH NWYVDGVEVH NAKTKPREEQ NAKTKPREEQ 1501 1501 YNSTYRWSV YNSTYRWSV LTVLHQDWLN LTVLHQDWLN GKEYKCKVSN GKEYKCKVSN KALPAPIEKT KALPAPIEKT ISKAKGQPRE ISKAKGQPRE 1551 1551 PQVYTLPPSR PQVYTLPPSR DELTKNQVSL DELTKNQVSL TCLVKGFYPS TCLVKGFYPS DIAVEWESNG DIAVEWESNG QPENNYKTTP QPENNYKTTP 1601 1601 PVLDSDGSFF PVLDSDGSFF LYSKLTVDKS LYSKLTVDKS RWQQGNVFSC RWQQGNVFSC SVMHEALHNH SVMHEALHNH YTQKSLSLSP YTQKSLSLSP 1651 1651 GK* GK*

Нуклеотидная последовательность pSYN VWF062 (D’D3-Fc VWF без тромбинового сайта в линкере) (SEQ ID NO: 83)Nucleotide sequence of pSYN VWF062 (D'D3-Fc VWF without thrombin site in linker) (SEQ ID NO: 83)

ATGATTCCTG CCAGATTTGC CGGGGTGCTG CTTGCTCTGG CCCTCATTTTATGATTCCTG CCAGATTTGC CGGGGTGCTG CTTGTCTGG CCCTCATTTT

GCCAGGGACC CTTTGTGCAG AAGGAACTCG CGGCAGGTCA TCCACGGCCCGCCAGGGACC CTTTGTGCAG AAGGAACTCG CGGCAGGTCA TCCACGGCCC

101 GATGCAGCCT TTTCGGAAGT GACTTCGTCA ACACCTTTGA TGGGAGCATG101 GATGCAGCCT TTTCGGAAGT GACTTCGTCA ACACCTTTGA TGGGAGCATG

151 TACAGCTTTG CGGGATACTG CAGTTACCTC CTGGCAGGGG GCTGCCAGAA151 TACAGCTTTG CGGGATACTG CAGTTACCTC CTGGCAGGGG GCTGCCAGAA

201 ACGCTCCTTC TCGATTATTG GGGACTTCCA GAATGGCAAG AGAGTGAGCC201 ACGCTCCTTC TCGATTATTG GGGACTTCCA GAATGGCAAG AGAGTGAGCC

251 TCTCCGTGTA TCTTGGGGAA TTTTTTGACA TCCATTTGTT TGTCAATGGT251 TCTCCGTGTA TCTGGGGAA TTTTTTGACA TCCATTTGTT TGTCAATGGT

301 ACCGTGACAC AGGGGGACCA AAGAGTCTCC ATGCCCTATG CCTCCAAAGG301 ACCGTGACAC AGGGGGACCA AAGAGTCTCC ATGCCCTATG CCTCCAAAGG

- 60 041588- 60 041588

351 351 GCTGTATCTA GCTGTATCTA GAAACTGAGG GAAACTGAGG CTGGGTACTA CTGGGTACTA CAAGCTGTCC CAAGCGTGTCC GGTGAGGCCT GGTGAGGCCT 401 401 ATGGCTTTGT ATGGCTTTGT GGCCAGGATC GGCCAGGATC GATGGCAGCG GATGGCAGCG GCAACTTTCA GCAACTTTCA AGTCCTGCTG AGTCCTGCTG 451 451 TCAGACAGAT TCAGACAGAT ACTTCAACAA ACTTCAACAA GACCTGCGGG GACCTGCGGG CTGTGTGGCA CTGTGTGGCA ACTTTAACAT ACTTTAACAT 501 501 CTTTGCTGAA CTTTGCTGAA GATGACTTTA GATGACTTTA TGACCCAAGA TGACCCAAGA AGGGACCTTG AGGGACCTTG ACCTCGGACC ACCTCGGACC 551 551 CTTATGACTT CTTATGACTT TGCCAACTCA TGCCAACTCA TGGGCTCTGA TGGGCTCTGA GCAGTGGAGA GCAGTGGAGA ACAGTGGTGT ACAGTGGTGT 601 601 GAACGGGCAT GAACGGGCAT CTCCTCCCAG CTCCTCCCAG CAGCTCATGC CAGCTCATGC AACATCTCCT AACATCTTCCT CTGGGGAAAT CTGGGGAAAT 651 651 GCAGAAGGGC GCAGAAGGGC CTGTGGGAGC CTGTGGGAGC AGTGCCAGCT AGTGCCAGCT TCTGAAGAGC TCTGAAGAGC ACCTCGGTGT ACCTCGGTGT 701 701 TTGCCCGCTG TTGCCCGCTG CCACCCTCTG CCACCCTCTG GTGGACCCCG GTGGACCCCG AGCCTTTTGT AGCCTTTTGT GGCCCTGTGT GGCCCTGTGT 751 751 GAGAAGACTT GAGAAGACTT TGTGTGAGTG TGTGTGAGTG TGCTGGGGGG TGCTGGGGGG CTGGAGTGCG CTGGAGTGCG CCTGCCCTGC CCTGCCCTGC 801 801 CCTCCTGGAG CCTCCTGGAG TACGCCCGGA TACGCCCGGA CCTGTGCCCA CCTGTGCCCA GGAGGGAATG GGAGGGAATG GTGCTGTACG GTGCTGTACG 851 851 GCTGGACCGA GCTGGACCGA CCACAGCGCG CCACAGCGCG TGCAGCCCAG TGCAGCCCAG TGTGCCCTGC TGTGCCCTGC TGGTATGGAG TGGTATGGAG 901 901 TATAGGCAGT TATAGGCAGT GTGTGTCCCC GTGTGTCCC TTGCGCCAGG TTGCGCCAGG ACGTGCCAGA ACTGTCCAGA GCCTGCACAT GCCTGCACAT 951 951 CAATGAAATG CAATGAAATG TGTCAGGAGC TGTCAGGAGC GATGCGTGGA GATGCGTGGA TGGCTGCAGC TGGCTGCAGC TGCCCTGAGG TGCCCTGAGG 1001 1001 GACAGCTCCT GACAGCTCCT GGATGAAGGC GGATGAAGGC CTCTGCGTGG CTCTGCGTGG AGAGCACCGA AGAGCACCGA GTGTCCCTGC GTGTCCCCTGC 1051 1051 GTGCATTCCG GTGCATTCCG GAAAGCGCTA GAAAGCGCTA CCCTCCCGGC CCCTCCCGGC ACCTCCCTCT ACCTCCCTCT CTCGAGACTG CTCGAGACTG 1101 1101 CAACACCTGC CAACACCTGC ATTTGCCGAA ATTTGCCGAA ACAGCCAGTG ACAGCCAGTG GATCTGCAGC GATCTGCAGC AATGAAGAAT AATGAAGAAT 1151 1151 GTCCAGGGGA GTCCAGGGGA GTGCCTTGTC GTGCCTTGTC ACTGGTCAAT ACTGGTCAAT CCCACTTCAA CCCACTTCAA GAGCTTTGAC GAGCTTTGAC 1201 1201 AACAGATACT AACAGATACT TCACCTTCAG TCACCTTCAG TGGGATCTGC TGGGATCGC CAGTACCTGC CAGTACCCTGC TGGCCCGGGA TGGCCCGGGA 1251 1251 TTGCCAGGAC TTGCCAGGAC CACTCCTTCT CACTCCTTCT CCATT GT CAT CCATT GT CAT TGAGACTGTC TGAGACTGTC CAGTGTGCTG CAGTGTGCTG 1301 1301 ATGACCGCGA ATGACCGCGA CGCTGTGTGC CGCTGTGTGC ACCCGCTCCG ACCCGCTCCG TCACCGTCCG TCACCGTCCG GCTGCCTGGC GCTGCCTGGC 1351 1351 CTGCACAACA CTGCACAACA GCCTTGTGAA GCCTTGTGAA ACTGAAGCAT ACTGAAGCAT GGGGCAGGAG GGGGCAGGAG TTGCCATGGA TTGCCATGGA 1401 1401 TGGCCAGGAC TGGCCAGGAC ATCCAGCTCC ATCCAGCTCC CCCTCCTGAA CCCTCCTGAA AGGTGACCTC AGGTGACCTC CGCATCCAGC CGCATCCAGC 1451 1451 ATACAGTGAC ATACAGTGAC GGCCTCCGTG GGCCTCCGTG CGCCTCAGCT CGCCTCAGCT ACGGGGAGGA ACGGGGAGGA CCTGCAGATG CCTGCAGATG 1501 1501 GACTGGGATG GACTGGGATG GCCGCGGGAG GCCGCGGGAG GCTGCTGGTG GCTGCTGGTG AAGCTGTCCC AAGCTGTCCC CCGTCTATGC CCGTCTATGC 1551 1551 CGGGAAGACC CGGGAAGAC TGCGGCCTGT TGCGGCCTGT GTGGGAATTA GTGGGAATTA CAATGGCAAC CAATGGCAAC CAGGGCGACG CAGGGCGACG 1601 1601 ACTTCCTTAC ACTTCCTTAC CCCCTCTGGG CCCCTCTGGG CTGGCGGAGC CTGGCGGAGC CCCGGGTGGA CCCGGGTGGA GGACTTCGGG GGACTTCGGG 1651 1651 AACGCCTGGA AACGCCTGGA AGCTGCACGG AGCTGCACGG GGAGTGCCAG GGAGTGCCAG GACCTGCAGA GACCTGCAGA AGCAGCACAG AGCAGCACAG 1701 1701 CGATCCCTGC CGATCCCTGC GCCCTCAACC GCCCTCAACC CGCGCATGAC CGCGCATGAC CAGGTTCTCC CAGGTTCTCC GAGGAGGCGT GAGGAGGCGT 1751 1751 GCGCGGTCCT GCGCGGTCCT GACGTCCCCC GACGTCCCCC ACATTCGAGG ACATTCGAGG CCTGCCATCG CCTGCCATCG TGCCGTCAGC TGCCGTCAGC 1801 1801 CCGCTGCCCT CCGCTGCCCT ACCTGCGGAA ACTGCGGAA CTGCCGCTAC CTGCCGCTAC GACGTGTGCT GACGTGTGCT CCTGCTCGGA CCTGCTCGGA 1851 1851 CGGCCGCGAG CGGCCGCGAG TGCCTGTGCG TGCCTGTGCG GCGCCCTGGC GCGCCCTGGC CAGCTATGCC CAGCTATGCC GCGGCCTGCG GCGGCCTGCG 1901 1901 CGGGGAGAGG CGGGGAGAGG CGTGCGCGTC CGTGCGCGTC GCGTGGCGCG GCGTGGCGCG AGCCAGGCCG AGCCAGGCCG CTGTGAGCTG CTGTGAGCTG 1951 1951 AACTGCCCGA AACTGCCCGA AAGGCCAGGT AAGGCCAGGT GTACCTGCAG GTACCTGAG TGCGGGACCC TGCGGGACC CCTGCAACCT CCTGCAACCT 2001 2001 GACCTGCCGC GACCTGCCGC TCTCTCTCTT TCTCTCTCTT ACCCGGATGA ACCCGGATGA GGAATGCAAT GGAATGCAAT GAGGGCTGCC GAGGGCTGCC 2051 2051 TGGAGGGCTG TGGAGGGCTG CTTCTGCCCC CTTCTGCCCC CCAGGGCTCT CCAGGGCTCT ACATGGATGA ACATGGATGA GAGGGGGGAC GAGGGGGGAC 2101 2101 TGCGTGCCCA TGCGTGCCCA AGGCCCAGTG AGGCCCAGTG CCCCTGTTAC CCCCTGTTAC TATGACGGTG TATGACGGTG AGATCTTCCA AGATCTTCCA 2151 2151 GCCAGAAGAC GCCAGAAGAC ATCTTCTCAG ATCTTCTCAG ACCATCACAC ACCATCACAC CATGTGCTAC CATGTGCTAC TGTGAGGATG TGTGAGGATG 2201 2201 GCTTCATGCA GCTTCATGCA CTGTACCATG CTGTACCATG AGTGGAGTCC AGTGGAGTCC CCGGAAGCTT CCGGAAGCT GCTGCCTGAC GCTGCCTGAC 2251 2251 GCTGTCCTCA GCTGTCCTCA GCAGTCCCCT GCAGTCCCCT GTCTCATCGC GTCTCATCGC AGCAAAAGGA AGCAAAAGGA GCCTATCCTG GCCTATCCTG 2301 2301 TCGGCCCCCC TCGGCCCCCC ATGGTCAAGC ATGGTCAAGC TGGTGTGTCC TGGTGTGTCC CGCTGACAAC CGCTGACAAC CTGCGGGCTG CTGCGGGCTG 2351 2351 AAGGGCTCGA AAGGGCTCGA GTGTACCAAA GTGTACCAAAA ACGTGCCAGA ACTGTCCAGA ACTATGACCT ACTATGACCT GGAGTGCATG GGAGTGCATG 2401 2401 AGCATGGGCT AGCATGGGCT GTGTCTCTGG GTGTCTCTGG CTGCCTCTGC CTGCCTCTGC CCCCCGGGCA CCCCCGGGCA TGGTCCGGCA TGGTCCGGCA 2451 2451 TGAGAACAGA TGAGAACAGA TGTGTGGCCC TGTGTGGCCC TGGAAAGGTG TGGAAAGGTG TCCCTGCTTC TCCCTGCTTC CATCAGGGCA CATCAGGGCA 2501 2501 AGGAGTATGC AGGAGTATGC CCCTGGAGAA CCCTGGAGAA ACAGTGAAGA ACAGTGAAGA TTGGCTGCAA TTGGCTGCA CACTTGTGTC CACTTGTGTC 2551 2551 TGTCGGGACC TGTCGGGACC GGAAGTGGAA GGAAGTGGAA CTGCACAGAC CTGCACAGAC CAT GT GT GT G CAT GT GT GT G ATGCCACGTG ATGCCACGTG 2601 2601 CTCCACGATC CTCCACGATC GGCATGGCCC GGCATGGCCC ACTACCTCAC ACTACCTCAC CTTCGACGGG CTTCGACGGG CTCAAATACC CTCAAATACC 2651 2651 TGTTCCCCGG TGTTCCCCGG GGAGTGCCAG GGAGTGCCAG TACGTTCTGG TACGTTCTGG TGCAGGATTA TGCAGGATTA CTGCGGCAGT CTGCGGCAGT 2701 2701 AACCCTGGGA AACCCTGGGA CCTTTCGGAT CCTTTCGGAT CCTAGTGGGG CCTAGTGGGG AATAAGGGAT AATAAGGGAT GCAGCCACCC GCAGCCACCC 2751 2751 CTCAGTGAAA CTCAGTGAAA TGCAAGAAAC TGCAAGAAAC GGGTCACCAT GGGTCACCAT CCTGGTGGAG CCTGGTGGAG GGAGGAGAGA GGAGGAGAGA 2801 2801 TTGAGCTGTT TTGAGCTGTT TGACGGGGAG TGACGGGGAG GTGAATGTGA GTGAATGTGA AGAGGCCCAT AGAGGCCCAT GAAGGATGAG GAAGGATGAG 2851 2851 ACTCACTTTG ACTCACTTTG AGGTGGTGGA AGGTGGTGGA GTCTGGCCGG GCTTGGCCGG TACATCATTC TACATCATTC TGCTGCTGGG TGCTGCTGGG 2901 2901 CAAAGCCCTC CAAAGCCCTC TCCGTGGTCT TCCGTGGTCT GGGACCGCCA GGGACCGCCA CCTGAGCATC CCTGAGCATC TCCGTGGTCC TCCGTGGTCC 2951 2951 TGAAGCAGAC TGAAGCAGAC ATACCAGGAG ATACCAGGAG AAAGTGTGTG AAAGTGTGTG GCCTGTGTGG GCCTGTGTGG GAATTTTGAT GAATTTTGAT 3001 3001 GGCATCCAGA GGCATCCAGA ACAATGACCT ACAATGACCT CACCAGCAGC CACCAGCAGC AACCTCCAAG AACCTCCAAG TGGAGGAAGA TGGAGGAAGA 3051 3051 CCCTGTGGAC CCCTGTGGAC TTTGGGAACT TTTGGGAACT CCTGGAAAGT CCTGGAAAGT GAGCTCGCAG GAGCTCGCAG TGTGCTGACA TGTGCTGACA 3101 3101 CCAGAAAAGT CCAGAAAAGT GCCTCTGGAC GCCTCTGGAC TCATCCCCTG TCATCCCCTG CCACCTGCCA CCACCTGCCA TAACAACATC TAACAACATC 3151 3151 ATGAAGCAGA ATGAAGCAGA CGATGGTGGA CGATGGTGGA TTCCTCCTGT TTCCTCCTGT AGAATCCTTA AGAATCCTTA CCAGTGACGT CCAGTGACGT 3201 3201 CTTCCAGGAC CTTCCAGGAC TGCAACAAGC TGCAACAAGC TGGTGGACCC TGGTGGACC CGAGCCATAT CGAGCCATAT CTGGATGTCT CTGGATGTCT 3251 3251 GCATTTACGA GCATTTACGA CACCTGCTCC CACCTGCTCC TGTGAGTCCA TGTGAGTCCA TTGGGGACTG TTGGGGACTG CGCCGCATTC CGCCGCATTC 3301 3301 TGCGACACCA TGCGACACCA TTGCTGCCTA TTGCTGCCTA TGCCCACGTG TGCCCACGTG TGTGCCCAGC TGTGCCCAGC ATGGCAAGGT ATGGCAAGGT 3351 3351 GGTGACCTGG GGTGACTGG AGGACGGCCA AGGACGGCCA CATTGTGCCC CATTGTGCCCC CCAGAGCTGC CCAGAGCTGC GAGGAGAGGA GAGGAGAGGA 3401 3401 ATCTCCGGGA ATCTCCGGGA GAACGGGTAT GAACGGGTAT GAGGCTGAGT GAGGCTGAGT GGCGCTATAA GGCCGCTATAA CAGCTGTGCA CAGCTGTGCA 3451 3451 CCTGCCTGTC CCTGCCTGTC AAGTCACGTG AAGTCACGTG TCAGCACCCT TCAGCACCCT GAGCCACTGG GAGCCACTGG CCTGCCCTGT CCTGCCCTGT 3501 3501 GCAGTGTGTG GCAGTGTGTG GAGGGCTGCC GAGGGCTGCC ATGCCCACTG ATGCCCACTG CCCTCCAGGG CCCTCCAGGG AAAATCCTGG AAAATCCTGG

- 61 041588- 61 041588

3551 3551 ATGAGCTTTT ATGAGCTTTT GCAGACCTGC GCAGACCTGC GTTGACCCTG GTTGACCCTG AAGACTGTCC AAGACTGTCC AGTGTGTGAG AGTGTGTGAG 3601 3601 GTGGCTGGCC GTGGCTGGCC GGCGTTTTGC GGCGTTTTGC CTCAGGAAAG CTCAGGAAAG AAAGTCACCT AAAGTCACCT TGAATCCCAG TGAATCCCAG 3651 3651 TGACCCTGAG TGACCCTGAG CACTGCCAGA CACTGCCAGA TTTGCCACTG TTTGCCACTG TGATGTTGTC TGATGTTGTC AACCTCACCT AACCTCACCT 3701 3701 GTGAAGCCTG GTGAAGCCTG CCAGGAGCCG CCAGGAGCCG ATATCGGGCG ATATCGGGCG CGCCAACATC CGCCAACATC AGAGAGCGCC AGAGAGCGCC 3751 3751 ACCCCTGAAA ACCCCTGAAA GTGGTCCCGG GTGGTCCCGG GAGCGAGCCA GAGCGAGCCA GCCACATCTG GCCACATCTG GGTCGGAAAC GGTCGGAAAC 3801 3801 GCCAGGCACA GCCAGGCACA AGTGAGTCTG AGTGAGTCTG CAACTCCCGA CAACTCCCGA GTCCGGACCT GTCCGGACCT GGCTCCGAGC GGCTCCGAGC 3851 3851 CTGCCACTAG CTGCCACTAG CGGCTCCGAG CGGCTCCGAG ACTCCGGGAA ACTCCGGGAA CTTCCGAGAG CTTCCGAGAG CGCTACACCA CGCTACACCA 3901 3901 GAAAGCGGAC GAAAGCGGAC CCGGAACCAG CCGGAACCAG TACCGAACCT TACCGAACCT AGCGAGGGCT AGCGAGGGCT CTGCTCCGGG CTGCTCCGGG 3951 3951 CAGCCCAGCC CAGCCCAGCC GGCTCTCCTA GGCTCTCCCTA CATCCACGGA CATCCACGGA GGAGGGCACT GGAGGGCACT TCCGAATCCG TCCGAATCCG 4001 4001 CCACCCCGGA CCACCCCGGA GTCAGGGCCA GTCAGGGCCA GGATCTGAAC GGATCTGAAC CCGCTACCTC CCGCTACCTC AGGCAGTGAG AGGCAGTGAG 4051 4051 ACGCCAGGAA ACGCCAGGAA CGAGCGAGTC CGAGCGAGTC CGCTACACCG CGCTACACCG GAGAGTGGGC GAGAGTGGGC CAGGGAGCCC CAGGGAGCCC 4101 4101 TGCTGGATCT TGCTGGATCT CCTACGTCCA CCTACGTCCA CTGAGGAAGG CTGAGGAAGG GTCACCAGCG GTCACCAGCG GGCTCGCCCA GGCTCGCCCA 4151 4151 CCAGCACTGA CCAGCACTGA AGAAGGTGCC AGAAGGTGCC TCGAGCGACA TCGAGCGACA AAACTCACAC AAACTCACAC ATGCCCACCG ATGCCCACCG 4201 4201 TGCCCAGCTC TGCCCAGCTC CAGAACTCCT CAGAACTCCT GGGCGGACCG GGGCGGACCG TCAGTCTTCC TCAGTCTTCC TCTTCCCCCC TCTTCCCCCC 4251 4251 AAAACCCAAG AAAACCCAAG GACACCCTCA GACACCCTCA TGATCTCCCG TGATCTCCCG GACCCCTGAG GACCCCTGAG GTCACATGCG GTCACATGCG 4301 4301 TGGTGGTGGA TGGTGGTGGA CGTGAGCCAC CGTGAGCCAC GAAGACCCTG GAAGACCCTG AGGTCAAGTT AGGTCAAGTT CAACTGGTAC CAACTGGTAC 4351 4351 GTGGACGGCG GTGGACGGCG TGGAGGTGCA TGGAGGTGCA TAATGCCAAG TAATGCCAAG ACAAAGCCGC ACAAAGCCGC GGGAGGAGCA GGGAGGAGCA 4401 4401 GTACAACAGC GTACAACAGC ACGTACCGTG ACGTACCGTG TGGTCAGCGT TGGTCAGCGT CCTCACCGTC CCTCACCGTC CTGCACCAGG CTGCACCAGG 4451 4451 ACTGGCTGAA ACTGGCTGAA TGGCAAGGAG TGGCAAGGAG TACAAGTGCA TACAAGTGCA AGGTCTCCAA AGGTCTCCAAA CAAAGCCCTC CAAAGCCCTC 4501 4501 CCAGCCCCCA CCAGCCCCCA TCGAGAAAAC TCGAGAAAAC CATCTCCAAA CATCTCCAAA GCCAAAGGGC GCCAAAGGGC AGCCCCGAGA AGCCCCGAGA 4551 4551 ACCACAGGTG ACCACAGGTG TACACCCTGC TACACCCTGC CCCCATCCCG CCCCATCCCG GGATGAGCTG GGATGAGCTG ACCAAGAACC ACCAAGAACC 4601 4601 AGGTCAGCCT AGGTCAGCCCT GACCTGCCTG GACCTGCCTG GTCAAAGGCT GTCAAAAGGCT TCTATCCCAG TCTATCCCAG CGACATCGCC CGACATCGCC 4651 4651 GTGGAGTGGG GTGGAGTGGG AGAGCAATGG AGAGCAATGG GCAGCCGGAG GCAGCGGAG AACAACTACA AACAACTACA AGACCACGCC AGACCACGCC 4701 4701 TCCCGTGTTG TCCCGTGTTG GACTCCGACG GACTCCGACG GCTCCTTCTT GCTCCTTCTT CCTCTACAGC CCTCTACAGC AAGCTCACCG AAGCTCACCG 4751 4751 TGGACAAGAG TGGACAAGAG CAGGTGGCAG CAGGTGGCAG CAGGGGAACG CAGGGGAACG TCTTCTCATG TCTTCTCATG CTCCGTGATG CTCCGTGATG 4801 4801 CATGAGGCTC CATGAGGCTC TGCACAACCA TGCACAACCA CTACACGCAG CTACACGCAG AAGAGCCTCT AAGAGCCTCT CCCTGTCTCC CCCTGTCTCC 4851 4851 GGGTAAATGA GGGTAAATGA

Белковая последовательность pSYN VWF062 (D’D3-Fc VWF без тромбинового сайта в линкере) (SEQ ID NO: 84)Protein sequence pSYN VWF062 (D'D3-Fc VWF without thrombin site in linker) (SEQ ID NO: 84)

1 1 MIPARFAGVL MIPARFAGVL LALALILPGT LALALILPGT LCAEGTRGRS LCAEGTRGRS STARCSLFGS STARCSLFGS DFVNTFDGSM DFVNTFDGSM 51 51 YSFAGYCSYL YSFAGYCSYL LAGGCQKRSF LAGGCQKRSF SIIGDFQNGK SIIGDFQNGK RVSLSVYLGE RVSLSVYLGE FFDIHLFVNG FFDIHLFVNG 101 101 TVTQGDQRVS TVTQGDQRVS MPYASKGLYL MPYASKGLYL ETEAGYYKLS ETEAGYYKLS GEAYGFVARI GEAYGFVARI DGSGNFQVLL DGSGNFQVLL 151 151 SDRYFNKTCG SDRYFNKTCG LCGNFNIFAE LCGNFNIFAE DDFMTQEGTL DDFMTQEGTL TSDPYDFANS TSDPYDFANS WALSSGEQWC WALSSGEQWC 201 201 ERASPPSSSC ERASPPSSSC NISSGEMQKG NISSGEMQKG LWEQCQLLKS LWEQCQLLKS TSVFARCHPL TSVFARCHPL VDPEPFVALC VDPEPFVALC 251 251 EKTLCECAGG EKTLCECAGG LECACPALLE LECACPALLE YARTCAQEGM YARTCAQEGM VLYGWTDHSA VLYGWTDHSA CSPVCPAGME CSPVCPAGME 301 301 YRQCVSPCAR YRQCVSPCAR TCQSLHINEM TCQSLHINEM CQERCVDGCS CQERCVDGCS CPEGQLLDEG CPEGQLLDEG LCVESTECPC LCVESTECPC 351 351 VHSGKRYPPG VHSGKRYPPG TSLSRDCNTC TSLSRDCNTC ICRNSQWICS ICRNSQWICS NEECPGECLV NEECPGECLV TGQSHFKSFD TGQSHFKSFD 401 401 NRYFTFSGIC NRYFTFSGIC QYLLARDCQD QYLLARDCQD HSFSIVIETV HSFSIVIETV QCADDRDAVC QCADDRDAVC TRSVTVRLPG TRSVTVRLPG 451 451 LHNSLVKLKH LHNSLVKLKH GAGVAMDGQD GAGVAMDGQD IQLPLLKGDL IQLPLLKGDL RIQHTVTASV RIQHTVTASV RLSYGEDLQM RLSYGEDLQM 501 501 DWDGRGRLLV DWDGRGRLLV KLSPVYAGKT KLSPVYAGKT CGLCGNYNGN CGLCGNYNGN QGDDFLTPSG QGDDFLTPSG LAEPRVEDFG LAEPRVEDFG 551 551 NAWKLHGDCQ NAWKLHGDCQ DLQKQHSDPC DLQKQHSDPC ALNPRMTRFS ALNPRMTRFS EEACAVLTSP EEACAVLTSP TFEACHRAVS TFEACHRAVS 601 601 PLPYLRNCRY PLPYLRNCRY DVCSCSDGRE DVCSCSDGRE CLCGALASYA CLCGALASYA AACAGRGVRV AACAGRGVRV AWREPGRCEL AWREPGRCEL 651 651 NCPKGQVYLQ NCPKGQVYLQ CGTPCNLTCR CGTPCNLTCR SLSYPDEECN SLSYPDEECN EACLEGCFCP EACLEGCFCP PGLYMDERGD PGLYMDERGD 701 701 CVPKAQCPCY CVPKAQCPCY YDGEIFQPED YDGEIFQPED IFSDHHTMCY IFSDHHTMCY CEDGFMHCTM CEDGFMHCTM SGVPGSLLPD SGVPGSLLPD 751 751 AVLSSPLSHR AVLSSPLSHR SKRSLSCRPP SKRSLSCRPP MVKLVCPADN MVKLVCPADN LRAEGLECTK LRAEGLECTK TCQNYDLECM TCQNYDLECM 801 801 SMGCVSGCLC SMGCVSGCLC PPGMVRHENR PPGMVRHENR CVALERCPCF CVALERCPCF HQGKEYAPGE HQGKEYAPGE TVKIGCNTCV TVKIGCNTCV 851 851 CRDRKWNCTD CRDRKWNCTD HVCDATCSTI HVCDATCSTI GMAHYLTFDG GMAHYLTFDG LKYLFPGECQ LKYLFPGECQ YVLVQDYCGS YVLVQDYCGGS 901 901 NPGTFRILVG NPGTFRILVG NKGCSHPSVK NKGCSHPSVK CKKRVTILVE CKKRVTILVE GGEIELFDGE GGEIELFGE VNVKRPMKDE VNVKRPMKDE 951 951 THFEWESGR THFEWESGR YIILLLGKAL YIILLLGKAL SWWDRHLSI SWWDRHLSI SWLKQTYQE SWLKQTYQE KVCGLCGNFD KVCGLCGNFD 1001 1001 GIQNNDLTSS GIQNNDLTSS NLQVEEDPVD NLQVEEDPVD FGNSWKVSSQ FGNSWKVSSQ CADTRKVPLD CADTRKVPLD SSPATCHNNI SSPATCHNNI 1051 1051 MKQTMVDSSC MKQTMVDSSC RILTSDVFQD RILTSDVFQD CNKLVDPEPY CNKLVDPEPY LDVCIYDTCS LDVCIYDTCS CESIGDCAAF CESIGDCAAF 1101 1101 CDTIAAYAHV CDTIAAYAHV CAQHGKWTW CAQHGKWTW RTATLCPQSC RTATLCPQSC EERNLRENGY EERNLRENGY EAEWRYNSCA EAEWRYNSCA 1151 1151 PACQVTCQHP PACQVTCQHP EPLACPVQCV EPLACPVQCV EGCHAHCPPG EGCHAHCPPG KILDELLQTC KILDELLQTC VDPEDCPVCE VDPEDCPVCE 1201 1201 VAGRRFASGK VAGRRFASGK KVTLNPSDPE KVTLNPSDPE HCQICHCDW HCQICHCDW NLTCEACQEP NLTCEACQEP ISGAPTSESA ISGAPTSESA 1251 1251 TPESGPGSEP TPESGPGSEP ATSGSETPGT ATSGSETPGT SESATPESGP SESATPESGP GSEPATSGSE GSEPATSGSE TPGTSESATP TPGTSESATP 1301 1301 ESGPGTSTEP ESGPGTSTEP SEGSAPGSPA SEGSAPGSPA GSPTSTEEGT GSPTSTEEGT SESATPESGP SESATPESGP GSEPATSGSE GSEPATSGSE 1351 1351 TPGTSESATP TPGTSESATP ESGPGSPAGS ESGPGSPAGS PTSTEEGSPA PTSTEEGSPA GSPTSTEEGA GSPTSTEEGA SSDKTHTCPP SSDKTHTCPP 1401 1401 CPAPELLGGP CPAPELLGGP SVFLFPPKPK SVFLFPPKPK DTLMISRTPE DTLMISRTPE VTCVWDVSH VTCVWDVSH EDPEVKFNWY EDPEVKFNWY 1451 1451 VDGVEVHNAK VDGVEVHNAK TKPREEQYNS TKPREEQYNS TYRWSVLTV TYRWSVLTV LHQDWLNGKE LHQDWLNGKE YKCKVSNKAL YKCKVSNKAL 1501 1501 PAPIEKTISK PAPIEKTISK AKGQPREPQV AKGQPREPQV YTLPPSRDEL YTLPPSRDEL TKNQVSLTCL TKNQVSLTCL VKGFYPSDIA VKGFYPSDIA 1551 1551 VEWESNGQPE VEWESNGQPE NNYKTTPPVL NNYKTTPPVL DSDGSFFLYS DSDGSFFLYS KLTVDKSRWQ KLTVDKSRWQ QGNVFSCSVM QGNVFSCSVM

- 62 041588- 62 041588

1601 HEALHNHYTQ KSLSLSPGK*1601 HEALHNHYTQ KSLSLSPGK*

Нуклеотидная последовательность pSYN FVIII 286 (FVIII-Fc с дополнительной областью a2 между FVIII и Fc) (SEQ ID NO: 85)Nucleotide sequence of pSYN FVIII 286 (FVIII-Fc with additional a2 region between FVIII and Fc) (SEQ ID NO: 85)

ATGCAAATAG AGCTCTCCAC CTGCTTCTTT CTGTGCCTTT TGCGATTCTGATGCAAATAG AGCTCTCCAC CTGCTTCTTT CTGTGCCTTT TGCGATTCTG

CTTTAGTGCC ACCAGAAGAT ACTACCTGGG TGCAGTGGAA CTGTCATGGGCTTTAGTGCC ACCAGAAGAT ACTACCTGGG TGCAGTGGAA CTGTCATGGG

101 ACTATATGCA AAGTGATCTC GGTGAGCTGC CTGTGGACGC AAGATTTCCT101 ACTATATGCA AAGTGATCTC GGTGAGCTGC CTGTGGACGC AAGATTTCCT

151 CCTAGAGTGC CAAAATCTTT TCCATTCAAC ACCTCAGTCG TGTACAAAAA151 CCTAGAGTGC CAAAATCTTT TCCATTCAAC ACTCAGTCG TGTACAAAAA

201 GACTCTGTTT GTAGAATTCA CGGATCACCT TTTCAACATC GCTAAGCCAA201 GACTCTGTTT GTAGAATTCA CGGATCACCT TTTCAACATC GCTAAGCCAA

251 GGCCACCCTG GATGGGTCTG CTAGGTCCTA CCATCCAGGC TGAGGTTTAT251 GGCCACCTG GATGGGTCTG CTAGGTCCTA CCATCCAGGC TGAGGTTTAT

301 GATACAGTGG TCATTACACT TAAGAACATG GCTTCCCATC CTGTCAGTCT301 GATACAGTGG TCATTACACT TAAGAACATG GCTTCCCATC CTGTCAGTCT

351 TCATGCTGTT GGTGTATCCT ACTGGAAAGC TTCTGAGGGA GCTGAATATG351 TCATGCTGTT GGTGTATCCT ACTGGAAAGC TTCTGAGGGA GCTGAATATG

401 ATGATCAGAC CAGTCAAAGG GAGAAAGAAG ATGATAAAGT CTTCCCTGGT401 ATGATCAGAC CAGTCAAAGG GAGAAAGAAG ATGATAAAGT CTTCCCTGGT

451 GGAAGCCATA CATATGTCTG GCAGGTCCTG AAAGAGAATG GTCCAATGGC451 GGAAGCCATA CATATGTCTG GCAGGTCCTG AAAGAGAATG GTCCAATGGC

501 CTCTGACCCA CTGTGCCTTA CCTACTCATA TCTTTCTCAT GTGGACCTGG501 CTCTGACCCA CTGTGCCTTA CCTACTCATA TCTTTCTCAT GTGGACCTGG

551 TAAAAGACTT GAATTCAGGC CTCATTGGAG CCCTACTAGT ATGTAGAGAA551 TAAAAGACTT GAATTCAGGC CTCATTGGAG CCCTACTAGT ATGTAGAGAA

601 GGGAGTCTGG CCAAGGAAAA GACACAGACC TTGCACAAAT TTATACTACT601 GGGAGTCTGG CCAAGGAAAA GACACAGACC TTGCACAAAT TTATACTACT

651 TTTTGCTGTA TTTGATGAAG GGAAAAGTTG GCACTCAGAA ACAAAGAACT651 TTTTGCTGTA TTTGATGAAG GGAAAAGTTG GCACTCAGAA ACAAAGAACT

701 CCTTGATGCA GGATAGGGAT GCTGCATCTG CTCGGGCCTG GCCTAAAATG701 CCTTGATGCA GGATAGGGAT GCTGCATCTG CTCGGGCCTG GCCTAAAATG

751 CACACAGTCA ATGGTTATGT AAACAGGTCT CTGCCAGGTC TGATTGGATG751 CACACAGTCA ATGGTTATGT AAACAGGTCT CTGCCAGGTC TGATTGGATG

801 CCACAGGAAA TCAGTCTATT GGCATGTGAT TGGAATGGGC ACCACTCCTG801 CCACAGGAAA TCAGTCTATT GGCATGTGAT TGGAATGGGC ACCACTCCTG

851 AAGTGCACTC AATATTCCTC GAAGGTCACA CATTTCTTGT GAGGAACCAT851 AAGTGCACTC AATATTCCTC GAAGGTCACA CATTTCTTGT GAGGAACCAT

901 CGCCAGGCTA GCTTGGAAAT CTCGCCAATA ACTTTCCTTA CTGCTCAAAC901 CGCCAGGCTA GCTTGGAAAT CTCGCCAATA ACTTTCCTTA CTGCTCAAAC

951 ACTCTTGATG GACCTTGGAC AGTTTCTACT GTTTTGTCAT ATCTCTTCCC951 ACTCTTGATG GACCTTTGGAC AGTTTCCTACT GTTTTGTCAT ATCTCTTCCC

1001 ACCAACATGA TGGCATGGAA GCTTATGTCA AAGTAGACAG CTGTCCAGAG1001 ACCAACATGA TGGCATGGAA GCTTATTGTCA AAGTAGACAG CTGTCCAGAG

1051 GAACCCCAAC TACGAATGAA ΑΑΑΎΑΆΎΰΑΆ GAAGCGGAAG ACTATGATGA1051 GAACCCCAAC TACGATGAA ΑΑΑΎΑΆΎΰΑΆ GAAGCGGAAG ACTATGATGA

1101 TGATCTTACT GATTCTGAAA TGGATGTGGT CAGGTTTGAT GATGACAACT1101 TGATCTTACT GATTCTGAAA TGGATGTGGT CAGGTTTGAT GATGACAACT

1151 CTCCTTCCTT TATCCAAATT CGCTCAGTTG CCAAGAAGCA TCCTAAAACT1151 CTCCTTCCTT TATCCAAATT CGCTCAGTTG CCAAGAAGCA TCCTAAAACT

1201 TGGGTACATT ACATTGCTGC TGAAGAGGAG GACTGGGACT ATGCTCCCTT1201 TGGGTACATT ACATTGCTGC TGAAGAGGAG GACTGGGACT ATGCTCCCTT

1251 AGTCCTCGCC CCCGATGACA GAAGTTATAA AAGTCAATAT TTGAACAATG1251 AGTCCTCGCC CCCGATGACA GAAGTTATAA AAGTCAATAT TTGAACAATG

1301 GCCCTCAGCG GATTGGTAGG AAGTACAAAA AAGTCCGATT TATGGCATAC1301 GCCCTCAGCG GATTGGTAGG AAGTACAAAAA AAGTCCGATT TATGGCATAC

1351 ACAGATGAAA CCTTTAAGAC TCGTGAAGCT ATTCAGCATG AATCAGGAAT1351 ACAGATGAAA CCTTTAAGAC TCGTGAAGCT ATTCAGCATG AATCAGGAAT

1401 CTTGGGACCT TTACTTTATG GGGAAGTTGG AGACACACTG TTGATTATAT1401 CTTGGGACCCT TTACTTTATG GGGAAGTTGG AGACACACTG TTGATTATAT

1451 TTAAGAATCA AGCAAGCAGA CCATATAACA TCTACCCTCA CGGAATCACT1451 TTAAGAATCA AGCAAGCAGA CCATATAACA TCTACCCTCA CGGAATCACT

1501 GATGTCCGTC CTTTGTATTC AAGGAGATTA CCAAAAGGTG TAAAACATTT1501 GATGTCCGTC CTTTGTATTC AAGGAGATTA CCAAAAGGTG TAAAACATTT

1551 GAAGGATTTT CCAATTCTGC CAGGAGAAAT ATTCAAATAT AAATGGACAG1551 GAAGGATTTT CCAATTCTGC CAGGAGAAAT ATTCAAATAT AATGGACAG

1601 TGACTGTAGA AGATGGGCCA ACTAAATCAG ATCCTCGGTG CCTGACCCGC1601 TGACTGTAGA AGATGGGCCA ACTAAATCAG ATCCTCGGTG CCTGACCCGC

1651 TATTACTCTA GTTTCGTTAA TATGGAGAGA GATCTAGCTT CAGGACTCAT1651 TATTACTCTA GTTTCGTTAA TATGGAGAGA GATCTAGCTT CAGGACTCAT

1701 TGGCCCTCTC CTCATCTGCT ACAAAGAATC TGTAGATCAA AGAGGAAACC1701 TGGCCCTCTC CTCATCTGCT ACAAAGAATC TGTAGATCAA AGAGGAAACC

1751 AGATAATGTC AGACAAGAGG AATGTCATCC TGTTTTCTGT ATTTGATGAG1751 AGATAATGTC AGACAAGAGG AATGTCATCC TGTTTTCTGT ATTTGATGAG

1801 AACCGAAGCT GGTACCTCAC AGAGAATATA CAACGCTTTC TCCCCAATCC1801 AACCGAAGCT GGTACCTCAC AGAGAATATA CAACGCTTTC TCCCCAATCC

1851 AGCTGGAGTG CAGCTTGAGG ATCCAGAGTT CCAAGCCTCC AACATCATGC1851 AGCTGGAGTG CAGCTTGAGG ATCCAGAGTT CCAAGCCTCC AACATCATGC

1901 ACAGCATCAA TGGCTATGTT TTTGATAGTT TGCAGTTGTC AGTTTGTTTG1901 ACAGCATCAA TGGCTATGTT TTTGATAGTT TGCAGTTGTC AGTTTGTTTG

1951 CATGAGGTGG CATACTGGTA CATTCTAAGC ATTGGAGCAC AGACTGACTT1951 CATGAGGTGG CATACTGGTA CATTCTAAGC ATTGGAGCAC AGACTGACTT

2001 CCTTTCTGTC TTCTTCTCTG GATATACCTT CAAACACAAA ATGGTCTATG2001 CCTTTCTGTC TTCTTCTCTG GATATACCTT CAAACACAAA ATGGTCTATG

2051 AAGACACACT CACCCTATTC CCATTCTCAG GAGAAACTGT CTTCATGTCG2051 AAGACACACT CACCCTATTC CCATTCTCAG GAGAAACTGT CTTCATGTCG

2101 ATGGAAAACC CAGGTCTATG GATTCTGGGG TGCCACAACT CAGACTTTCG2101 ATGGAAAACC CAGGTCTATG GATTCTGGGG TGCCACAACT CAGACTTTCG

2151 GAACAGAGGC ATGACCGCCT TACTGAAGGT TTCTAGTTGT GACAAGAACA2151 GAACAGAGGC ATGACCGCCT TACTGAAGGT TTCTAGTTGT GACAAGAACA

2201 CTGGTGATTA TTACGAGGAC AGTTATGAAG ATATTTCAGC ATACTTGCTG2201 CTGGTGATTA TTACGAGGAC AGTTATGAAG ATATTTCAGC ATACTTGCTG

2251 AGTAAAAACA ATGCCATTGA ACCAAGAAGC TTCTCTCAAA ACGGCGCGCC2251 AGTAAAAACA ATGCCATTGA ACCAAGAAGC TTCTCTCAAA ACGGCGCGCC

2301 AGGTACCTCA GAGTCTGCTA CCCCCGAGTC AGGGCCAGGA TCAGAGCCAG2301 AGGTACCTCA GAGTCTGCTA CCCCCGAGTC AGGGCCAGGA TCAGAGCCAG

2351 CCACCTCCGG GTCTGAGACA CCCGGGACTT CCGAGAGTGC CACCCCTGAG2351 CCACCTCCGG GTCTGAGACA CCCGGGACTT CCGAGAGTGC CACCCCTGAG

2401 TCCGGACCCG GGTCCGAGCC CGCCACTTCC GGCTCCGAAA CTCCCGGCAC2401 TCCGGACCCG GGTCCGAGCC CGCCACTTCC GGCTCCGAAA CTCCCGGCAC

2451 AAGCGAGAGC GCTACCCCAG AGTCAGGACC AGGAACATCT ACAGAGCCCT2451 AAGCGAGAGC GCTACCCCAG AGTCAGGACC AGGAACATCT ACAGAGCCCT

2501 CTGAAGGCTC CGCTCCAGGG TCCCCAGCCG GCAGTCCCAC TAGCACCGAG2501 CTGAAGGCTC CGCTCCAGGG TCCCCAGCCG GCAGTCCCAC TAGCACCGAG

2551 GAGGGAACCT CTGAAAGCGC CACACCCGAA TCAGGGCCAG GGTCTGAGCC2551 GAGGGAACCT CTGAAAGCGC CACACCCGAA TCAGGGCCAG GGTCTGAGCC

2601 TGCTACCAGC GGCAGCGAGA CACCAGGCAC CTCTGAGTCC GCCACACCAG2601 TGCTACCAGC GGCAGCGAGA CACCAGGCAC CTCTGAGTCC GCCACACCAG

2651 AGTCCGGACC CGGATCTCCC GCTGGGAGCC CCACCTCCAC TGAGGAGGGA2651 AGTCCGGACC CGGATCTCCC GCTGGGAGCC CCACCTCCAC TGAGGAGGGA

2701 TCTCCTGCTG GCTCTCCAAC ATCTACTGAG GAAGGTACCT CAACCGAGCC2701 TCTCCTGCTG GCTCTCCAAC ATCTACTGAG GAAGGTACCT CAACCGAGCC

2751 ATCCGAGGGA TCAGCTCCCG GCACCTCAGA GTCGGCAACC CCGGAGTCTG2751 ATCCGAGGGA TCAGCTCCCG GCACCTCAGA GTCGGCAACC CCGGAGTCTG

2801 GACCCGGAAC TTCCGAAAGT GCCACACCAG AGTCCGGTCC CGGGACTTCA2801 GACCCGGAAC TTCCGAAAGT GCCACACCAG AGTCCGGTCC CGGGACTTCA

2851 GAATCAGCAA CACCCGAGTC CGGCCCTGGG TCTGAACCCG CCACAAGTGG2851 GAATCAGCAA CACCCGAGTC CGGCCCTGGG TCTGAACCCG CCACAAGTGG

- 63 041588- 63 041588

2901 TAGTGAGACA CCAGGATCAG AACCTGCTAC CTCAGGGTCA GAGACACCCG 2951 GATCTCCGGC AGGCTCACCA ACCTCCACTG AGGAGGGCAC CAGCACAGAA 3001 CCAAGCGAGG GCTCCGCACC CGGAACAAGC ACTGAACCCA GTGAGGGTTC 3051 AGCACCCGGC TCTGAGCCGG CCACAAGTGG CAGTGAGACA CCCGGCACTT 3101 CAGAGAGTGC CACCCCCGAG AGTGGCCCAG GCACTAGTAC CGAGCCCTCT 3151 GAAGGCAGTG CGCCAGCCTC GAGCCCACCA GTCTTGAAAC GCCATCAAGC 3201 TGAAATAACT CGTACTACTC TTCAGTCAGA TCAAGAGGAA ATCGATTATG 3251 ATGATACCAT ATCAGTTGAA ATGAAGAAGG AAGATTTTGA CATTTATGAT 3301 GAGGATGAAA ATCAGAGCCC CCGCAGCTTT CAAAAGAAAA CACGACACTA 3351 TTTTATTGCT GCAGTGGAGA GGCTCTGGGA TTATGGGATG AGTAGCTCCC 3401 CACATGTTCT AAGAAACAGG GCTCAGAGTG GCAGTGTCCC TCAGTTCAAG 3451 AAAGTTGTTT TCCAGGAATT TACTGATGGC TCCTTTACTC AGCCCTTATA 3501 CCGTGGAGAA CTAAATGAAC ATTTGGGACT CCTGGGGCCA TATATAAGAG 3551 CAGAAGTTGA AGATAATATC ATGGTAACTT TCAGAAATCA GGCCTCTCGT 3601 CCCTATTCCT TCTATTCTAG CCTTATTTCT TATGAGGAAG ATCAGAGGCA 3651 AGGAGCAGAA CCTAGAAAAA ACTTTGTCAA GCCTAATGAA ACCAAAACTT 3701 ACTTTTGGAA AGTGCAACAT CATATGGCAC CCACTAAAGA TGAGTTTGAC 3751 TGCAAAGCCT GGGCTTATTT CTCTGATGTT GACCTGGAAA AAGATGTGCA 3801 CTCAGGCCTG ATTGGACCCC TTCTGGTCTG CCACACTAAC ACACTGAACC 3851 CTGCTCATGG GAGACAAGTG ACAGTACAGG AATTTGCTCT GTTTTTCACC 3901 ATCTTTGATG AGACCAAAAG CTGGTACTTC ACTGAAAATA TGGAAAGAAA 3951 CTGCAGGGCT CCCTGCAATA TCCAGATGGA AGATCCCACT TTTAAAGAGA 4001 ATTATCGCTT CCATGCAATC AATGGCTACA TAATGGATAC ACTACCTGGC 4051 TTAGTAATGG CTCAGGATCA AAGGATTCGA TGGTATCTGC TCAGCATGGG 4101 CAGCAATGAA AACATCCATT CTATTCATTT CAGTGGACAT GTGTTCACTG 4151 TACGAAAAAA AGAGGAGTAT AAAATGGCAC TGTACAATCT CTATCCAGGT 4201 GTTTTTGAGA CAGTGGAAAT GTTACCATCC AAAGCTGGAA TTTGGCGGGT 4251 GGAATGCCTT ATTGGCGAGC ATCTACATGC TGGGATGAGC ACACTTTTTC 4301 TGGTGTACAG CAATAAGTGT CAGACTCCCC TGGGAATGGC TTCTGGACAC 4351 ATTAGAGATT TTCAGATTAC AGCTTCAGGA CAATATGGAC AGTGGGCCCC 4401 AAAGCTGGCC AGACTTCATT ATTCCGGATC AATCAATGCC TGGAGCACCA 4451 AGGAGCCCTT TTCTTGGATC AAGGTGGATC TGTTGGCACC AATGATTATT 4501 CACGGCATCA AGACCCAGGG TGCCCGTCAG AAGTTCTCCA GCCTCTACAT 4551 CTCTCAGTTT ATCATCATGT ATAGTCTTGA TGGGAAGAAG TGGCAGACTT 4601 ATCGAGGAAA TTCCACTGGA ACCTTAATGG TCTTCTTTGG CAATGTGGAT 4651 TCATCTGGGA TAAAACACAA TATTTTTAAC CCTCCAATTA TTGCTCGATA 4701 CATCCGTTTG CACCCAACTC ATTATAGCAT TCGCAGCACT CTTCGCATGG 4751 AGTTGATGGG CTGTGATTTA AATAGTTGCA GCATGCCATT GGGAATGGAG 4801 AGTAAAGCAA TATCAGATGC ACAGATTACT GCTTCATCCT ACTTTACCAA 4851 TATGTTTGCC ACCTGGTCTC CTTCAAAAGC TCGACTTCAC CTCCAAGGGA 4901 GGAGTAATGC CTGGAGACCT CAGGTGAATA ATCCAAAAGA GTGGCTGCAA 4951 GTGGACTTCC AGAAGACAAT GAAAGTCACA GGAGTAACTA CTCAGGGAGT 5001 AAAATCTCTG CTTACCAGCA TGTATGTGAA GGAGTTCCTC ATCTCCAGCA 5051 GTCAAGATGG CCATCAGTGG ACTCTCTTTT TTCAGAATGG CAAAGTAAAG 5101 GTTTTTCAGG GAAATCAAGA CTCCTTCACA CCTGTGGTGA ACTCTCTAGA 5151 CCCACCGTTA CTGACTCGCT ACCTTCGAAT TCACCCCCAG AGTTGGGTGC 5201 ACCAGATTGC CCTGAGGATG GAGGTTCTGG GCTGCGAGGC ACAGGACCTC 5251 TACGACAAGA ACACTGGTGA TTATTACGAG GACAGTTATG AAGATATTTC 5301 AGCATACTTG CTGAGTAAAA ACAATGCCAT TGAACCAAGA AGCTTCTCTG 5351 ACAAAACTCA CACATGCCCA CCGTGCCCAG CTCCAGAACT CCTGGGCGGA 5401 CCGTCAGTCT TCCTCTTCCC CCCAAAACCC AAGGACACCC TCATGATCTC 5451 CCGGACCCCT GAGGTCACAT GCGTGGTGGT GGACGTGAGC CACGAAGACC 5501 CTGAGGTCAA GTTCAACTGG TACGTGGACG GCGTGGAGGT GCATAATGCC 5551 AAGACAAAGC CGCGGGAGGA GCAGTACAAC AGCACGTACC GTGTGGTCAG 5601 CGTCCTCACC GTCCTGCACC AGGACTGGCT GAATGGCAAG GAGTACAAGT 5651 GCAAGGTCTC CAACAAAGCC CTCCCAGCCC CCATCGAGAA AACCATCTCC 5701 AAAGCCAAAG GGCAGCCCCG AGAACCACAG GTGTACACCC TGCCCCCATC 5751 CCGGGATGAG CTGACCAAGA ACCAGGTCAG CCTGACCTGC CTGGTCAAAG 5801 GCTTCTATCC CAGCGACATC GCCGTGGAGT GGGAGAGCAA TGGGCAGCCG 5851 GAGAACAACT ACAAGACCAC GCCTCCCGTG TTGGACTCCG ACGGCTCCTT 5901 CTTCCTCTAC AGCAAGCTCA CCGTGGAGAA GAGCAGGTGG CAGCAGGGGA 5951 ACGTCTTCTC ATGCTCCGTG ATGCATGAGG CTCTGCACAA CCACTACACG 6001 CAGAAGAGCC TCTCCCTGTC TCCGGGTAAA TGA2901 TAGTGAGACA CCAGGATCAG AACCTGCTAC CTCAGGGTCA GAGACACCCG 2951 GATCTCCGGC AGGCTCACCA ACCTCCACTG AGGAGGGCAC CAGCACAGAA 3001 CCAAGCGAGG GCTCCGCACC CGGAACAAGC ACTGAACCCA GTGAGGGTTC 3051 AGCACCCGGC TCTGAGCCGG CCACAAGTGG CAGTGAGACA CCCGGCACTT 3101 CAGAGAGTGC CACCCCCGAG AGTGGCCCAG GCACTAGTAC CGAGCCCTCT 3151 GAAGGCAGTG CGCCAGCCTC GAGCCCACCA GTCTTGAAAC GCCATCAAGC 3201 TGAAATAACT CGTACTACTC TTCAGTCAGA TCAAGAGGAA ATCGATTATG 3251 ATGATACCAT ATCAGTTGAA ATGAAGAAGG AAGATTTTGA CATTTATGAT 3301 GAGGATGAAA ATCAGAGCCC CCGCAGCTTT CAAAAGAAAA CACGACACTA 3351 TTTTATTGCT GCAGTGGAGA GGCTCTGGGA TTATGGGATG AGTAGCTCCC 3401 CACATGTTCT AAGAAACAGG GCTCAGAGTG GCAGTGTCCC TCAGTTCAAG 3451 AAAGTTGTTT TCCAGGAATT TACTGATGGC TCCTTTACTC AGCCCTTATA 3501 CCGTGGAGAA CTAAATGAAC ATTTGGGACT CCTGGGGCCA TATATAAGAG 3551 CAGAAGTTGA AGATAATATC ATGGTAACTT TCAGAAATCA GGCCTCTCGT 3601 CCCTATTCCT TCTATTCTAG CCTTATTTCT TATGAGGAAG ATCAGAGGCA 3651 AGGAGCAGAA CCTAGAAAAA ACTTTGTCAA GCCTAATGAA ACCAAAACTT 3701 ACTTTTGGAA AGTGCAACAT CATATGGCAC CC ACTAAAGA TGAGTTTGAC 3751 TGCAAAGCCT GGGCTTATTT CTCTGATGTT GACCTGGAAA AAGATGTGCA 3801 CTCAGGCCTG ATTGGACCCC TTCTGGTCTG CCACACTAAC ACACTGAACC 3851 CTGCTCATGG GAGACAAGTG ACAGTACAGG AATTTGCTCT GTTTTTCACC 3901 ATCTTTGATG AGACCAAAAG CTGGTACTTC ACTGAAAATA TGGAAAGAAA 3951 CTGCAGGGCT CCCTGCAATA TCCAGATGGA AGATCCCACT TTTAAAGAGA 4001 ATTATCGCTT CCATGCAATC AATGGCTACA TAATGGATAC ACTACCTGGC 4051 TTAGTAATGG CTCAGGATCA AAGGATTCGA TGGTATCTGC TCAGCATGGG 4101 CAGCAATGAA AACATCCATT CTATTCATTT CAGTGGACAT GTGTTCACTG 4151 TACGAAAAAA AGAGGAGTAT AAAATGGCAC TGTACAATCT CTATCCAGGT 4201 GTTTTTGAGA CAGTGGAAAT GTTACCATCC AAAGCTGGAA TTTGGCGGGT 4251 GGAATGCCTT ATTGGCGAGC ATCTACATGC TGGGATGAGC ACACTTTTTC 4301 TGGTGTACAG CAATAAGTGT CAGACTCCCC TGGGAATGGC TTCTGGACAC 4351 ATTAGAGATT TTCAGATTAC AGCTTCAGGA CAATATGGAC AGTGGGCCCC 4401 AAAGCTGGCC AGACTTCATT ATTCCGGATC AATCAATGCC TGGAGCACCA 4451 AGGAGCCCTT TTCTTGGATC AAGGTGGATC TGTTGGCACC AATGATTATT 4501 CACGGCATCA AGACCCAGGG TGCCCGTCAG AAGTTCTCCA GCCTCTACAT 4551 CTCTCAGTTT ATCA TCATGT ATAGTCTTGA TGGGAAGAAG TGGCAGACTT 4601 ATCGAGGAAA TTCCACTGGA ACCTTAATGG TCTTCTTTGG CAATGTGGAT 4651 TCATCTGGGA TAAAACACAA TATTTTTAAC CCTCCAATTA TTGCTCGATA 4701 CATCCGTTTG CACCCAACTC ATTATAGCAT TCGCAGCACT CTTCGCATGG 4751 AGTTGATGGG CTGTGATTTA AATAGTTGCA GCATGCCATT GGGAATGGAG 4801 AGTAAAGCAA TATCAGATGC ACAGATTACT GCTTCATCCT ACTTTACCAA 4851 TATGTTTGCC ACCTGGTCTC CTTCAAAAGC TCGACTTCAC CTCCAAGGGA 4901 GGAGTAATGC CTGGAGACCT CAGGTGAATA ATCCAAAAGA GTGGCTGCAA 4951 GTGGACTTCC AGAAGACAAT GAAAGTCACA GGAGTAACTA CTCAGGGAGT 5001 AAAATCTCTG CTTACCAGCA TGTATGTGAA GGAGTTCCTC ATCTCCAGCA 5051 GTCAAGATGG CCATCAGTGG ACTCTCTTTT TTCAGAATGG CAAAGTAAAG 5101 GTTTTTCAGG GAAATCAAGA CTCCTTCACA CCTGTGGTGA ACTCTCTAGA 5151 CCCACCGTTA CTGACTCGCT ACCTTCGAAT TCACCCCCAG AGTTGGGTGC 5201 ACCAGATTGC CCTGAGGATG GAGGTTCTGG GCTGCGAGGC ACAGGACCTC 5251 TACGACAAGA ACACTGGTGA TTATTACGAG GACAGTTATG AAGATATTTC 5301 AGCATACTTG CTGAGTAAAA ACAATGCCAT TGAACCAAGA AGCTTCTCTG 5351 ACAAAACTCA CACATGCCCA CCGTGCCCAG CTCCAGAACT CCTGGGCGGA5401 CCGTCAGTCT TCCTCTTCCC CCCAAAACCC AAGGACACCC TCATGATCTC 5451 CCGGACCCCT GAGGTCACAT GCGTGGTGGT GGACGTGAGC CACGAAGACC 5501 CTGAGGTCAA GTTCAACTGG TACGTGGACG GCGTGGAGGT GCATAATGCC 5551 AAGACAAAGC CGCGGGAGGA GCAGTACAAC AGCACGTACC GTGTGGTCAG 5601 CGTCCTCACC GTCCTGCACC AGGACTGGCT GAATGGCAAG GAGTACAAGT 5651 GCAAGGTCTC CAACAAAGCC CTCCCAGCCC CCATCGAGAA AACCATCTCC 5701 AAAGCCAAAG GGCAGCCCCG AGAACCACAG GTGTACACCC TGCCCCCATC 5751 CCGGGATGAG CTGACCAAGA ACCAGGTCAG CCTGACCTGC CTGGTCAAAG 5801 GCTTCTATCC CAGCGACATC GCCGTGGAGT GGGAGAGCAA TGGGCAGCCG 5851 GAGAACAACT ACAAGACCAC GCCTCCCGTG TTGGACTCCG ACGGCTCCTT 5901 CTTCCTCTAC AGCAAGCTCA CCGTGGAGAA GAGCAGGTGG CAGCAGGGGA 5951 ACGTCTTCTC ATGCTCCGTG ATGCATGAGG CTCTGCACAA CCACTACACG 6001 CAGAAGAGCC TCTCCCTGTC TCCGGGTAAA TGA

- 64 041588- 64 041588

Белковая последовательность pSYN FVIII 286 (FVIII-Fc с дополнительной областью а2 между FVIII и Fc; выделена жирным шрифтом и подчеркиванием) (SEQ ID NO: 86)Protein sequence pSYN FVIII 286 (FVIII-Fc with additional a2 region between FVIII and Fc; in bold and underline) (SEQ ID NO: 86)

ATRRYYLGAV ELSWDYMQSD LGELPVDARF PPRVPKSFPF NTSWYKKTLATRRYYLGAV ELSWDYMQSD LGELPVDARF PPRVPKSFPF NTSWYKKTL

FVEFTDHLFN IAKPRPPWMG LLGPTIQAEV YDTWITLKN MASHPVSLHAFVEFTDHLFN IAKPRPPWMG LLGPTIQAEV YDTWITLKN MASHPVSLHA

101 VGVSYWKASE GAEYDDQTSQ REKEDDKVFP GGSHTYVWQV LKENGPMASD101 VGVSYWKASE GAEYDDQTSQ REKEDDKVFP GGSHTYVWQV LKENGPMASD

151 PLCLTYSYLS HVDLVKDLNS GLIGALLVCR EGSLAKEKTQ TLHKFILLFA151 PLCLTYSYLS HVDLVKDLNS GLIGALLVCR EGSLAKEKTQ TLHKFILLFA

201 VFDEGKSWHS ETKNSLMQDR DAASARAWPK MHTVNGYVNR SLPGLIGCHR201 VFDEGKSWHS ETKNSLMQDR DAASARAWPK MHTVNGYVNR SLPGLIGCHR

251 KSVYWHVIGM GTTPEVHSIF LEGHTFLVRN HRQASLEISP ITFLTAQTLL251 KSVYWHVIGM GTTPEVHSIF LEGHTFLVRN HRQASLEISP ITFLTAQTLL

301 MDLGQFLLFC HISSHQHDGM EAYVKVDSCP EEPQLRMKNN EEAEDYDDDL301 MDLGQFLLFC HISSHQHDGM EAYVKVDSCP EEPQLRMKNN EEAEDYDDDL

351 TDSEMDWRF DDDNSPSFIQ IRSVAKKHPK TWVHYIAAEE EDWDYAPLVL351 TDSEMDWRF DDDNSPSFIQ IRSVAKKHPK TWVHYIAAEE EDWDYAPLVL

401 APDDRSYKSQ YLNNGPQRIG RKYKKVRFMA YTDETFKTRE AIQHESGILG401 APDDRSYKSQ YLNNGPQRIG RKYKKVRFMA YTDETFKTRE AIQHESGILG

451 PLLYGEVGDT LLIIFKNQAS RPYNIYPHGI TDVRPLYSRR LPKGVKHLKD451 PLLYGEVGDT LLIIFKNQAS RPYNIYPHGI TDVRPLYSRR LPKGVKHLKD

501 FPILPGEIFK YKWTVTVEDG PTKSDPRCLT RYYSSFVNME RDLASGLIGP501 FPILPGEIFK YKWTVTVEDG PTKSDPRCLT RYYSSFVNME RDLASGLIGP

551 LLICYKESVD QRGNQIMSDK RNVILFSVFD ENRSWYLTEN IQRFLPNPAG551 LLICYKESVD QRGNQIMSDK RNVILFSVFD ENRSWYLTEN IQRFLPNPAG

601 VQLEDPEFQA SNIMHSINGY VFDSLQLSVC LHEVAYWYIL SIGAQTDFLS601 VQLEDPEFQA SNIMHSINGY VFDSLQLSVC LHEVAYWYIL SIGAQTDFLS

651 VFFSGYTFKH KMVYEDTLTL FPFSGETVFM SMENPGLWIL GCHNSDFRNR651 VFFSGYTFKH KMVYEDTLTL FPFSGETVFM SMENPGLWIL GCHNSDFRNR

701 GMTALLKVSS CDKNTGDYYE DSYEDISAYL LSKNNAIEPR SFSQNGAPGT701 GMTALLKVSS CDKNTGDYYE DSYEDISAYL LSKNNAIEPR SFSQNGAPGT

751 SESATPESGP GSEPATSGSE TPGTSESATP ESGPGSEPAT SGSETPGTSE751 SESATPESGP GSEPATSGSE TPGTSESATP ESGPGSEPAT SGSETPGTSE

801 SATPESGPGT STEPSEGSAP GSPAGSPTST EEGTSESATP ESGPGSEPAT801 SATPESGPGT STEPSEGSAP GSPAGSPTST EEGTSESATP ESGPGSEPAT

851 SGSETPGTSE SATPESGPGS PAGSPTSTEE GSPAGSPTST EEGTSTEPSE851 SGSETPGTSE SATPESGPGS PAGSPTSTEE GSPAGSPTST EEGTSTEPSE

901 GSAPGTSESA TPESGPGTSE SATPESGPGT SESATPESGP GSEPATSGSE901 GSAPGTSESA TPESGPGTSE SATPESGPGT SESATPESGP GSEPATSGSE

951 TPGSEPATSG SETPGSPAGS PTSTEEGTST EPSEGSAPGT STEPSEGSAP951 TPGSEPATSG SETPGSPAGS PTSTEEGTST EPSEGSAPGT STEPSEGSAP

1001 GSEPATSGSE TPGTSESATP ESGPGTSTEP SEGSAPASSP PVLKRHQAEI1001 GSEPATSGSE TPGTSESATP ESGPGTSTEP SEGSAPASSP PVLKRHQAEI

1051 TRTTLQSDQE EIDYDDTISV EMKKEDFDIY DEDENQSPRS FQKKTRHYFI1051 TRTTLQSDQE EIDYDDTISV EMKKEDFDIY DEDENQSPRS FQKKTRHYFI

1101 AAVERLWDYG MSSSPHVLRN RAQSGSVPQF KKWFQEFTD GSFTQPLYRG1101 AAVERLWDYG MSSSPHVLRN RAQSGSVPQF KKWFQEFTD GSFTQPLYRG

1151 ELNEHLGLLG PYIRAEVEDN IMVTFRNQAS RPYSFYSSLI SYEEDQRQGA1151 ELNEHLGLLG PYIRAEVEDN IMVTFRNQAS RPYSFYSSLI SYEEDQRQGA

1201 EPRKNFVKPN ETKTYFWKVQ HHMAPTKDEF DCKAWAYFSD VDLEKDVHSG1201 EPRKNFVKPN ETKTYFWKVQ HHMAPTKDEF DCKAWAYFSD VDLEKDVHSG

1251 LIGPLLVCHT NTLNPAHGRQ VTVQEFALFF TIFDETKSWY FTENMERNCR1251 LIGPLLVCHT NTLNPAHGRQ VTVQEFALFF TIFDETKSWY FTENMERNCR

1301 APCNIQMEDP TFKENYRFHA INGYIMDTLP GLVMAQDQRI RWYLLSMGSN1301 APCNIQMEDP TFKENYRFHA INGYIMDTLP GLVMAQDQRI RWYLLSMGSN

1351 ENIHSIHFSG HVFTVRKKEE YKMALYNLYP GVFETVEMLP SKAGIWRVEC1351 ENIHSIHFSG HVFTVRKKEE YKMALYNLYP GVFETVEMLP SKAGIWRVEC

1401 LIGEHLHAGM STLFLVYSNK CQTPLGMASG HIRDFQITAS GQYGQWAPKL1401 LIGEHLHAGM STLFLVYSNK CQTPLGMASG HIRDFQITAS GQYGQWAPKL

1451 ARLHYSGSIN AWSTKEPFSW IKVDLLAPMI IHGIKTQGAR QKFSSLYISQ1451 ARLHYSGSIN AWSTKEPFSW IKVDLLAPMI IHGIKTQGAR QKFSSLYISQ

1501 FIIMYSLDGK KWQTYRGNST GTLMVFFGNV DSSGIKHNIF NPPIIARYIR1501 FIIMYSLDGK KWQTYRGNST GTLMVFFGNV DSSGIKHNIF NPPIIARYIR

1551 LHPTHYSIRS TLRMELMGCD LNSCSMPLGM ESKAISDAQI TASSYFTNMF1551 LHPTHYSIRS TLRMELMGCD LNSCSMPLGM ESKAISDAQI TASSYFTNMF

1601 ATWSPSKARL HLQGRSNAWR PQVNNPKEWL QVDFQKTMKV TGVTTQGVKS1601 ATWSPSKARL HLQGRSNAWR PQVNNPKEWL QVDFQKTMKV TGVTTQGVKS

1651 LLTSMYVKEF LISSSQDGHQ WTLFFQNGKV KVFQGNQDSF TPWNSLDPP1651 LLTSMYVKEF LISSSQDGHQ WTLFFQNGKV KVFQGNQDSF TPWNSLDPP

1701 LLTRYLRIHP QSWVHQIALR MEVLGCEAQD LYDKNTGDYY EDSYEDISAY1701 LLTRYLRIHP QSWVHQIALR MEVLGCEAQD LYDKNTGDYY EDSYEDISAY

1751 LLSKNNAIEP RSFSDKTHTC PPCPAPELLG GPSVFLFPPK PKDTLMISRT1751 LLSKNNAIEP RSFSDKTHTC PPCPAPELLG GPSVFLFPPK PKDTLMISRT

01 PEVTCVWDV SHEDPEVKFN WYVDGVEVHN AKTKPREEQY NSTYRWSVL01 PEVTCVWDV SHEDPEVKFN WYVDGVEVHN AKTKPREEQY NSTYRWSVL

1851 TVLHQDWLNG KEYKCKVSNK ALPAPIEKTI SKAKGQPREP QVYTLPPSRD1851 TVLHQDWLNG KEYKCKVSNK ALPAPIEKTI SKAKGQPREP QVYTLPPSRD

1901 ELTKNQVSLT CLVKGFYPSD IAVEWESNGQ PENNYKTTPP VLDSDGSFFL1901 ELTKNQVSLT CLVKGFYPSD IAVEWESNGQ PENNYKTTPP VLDSDGSFFL

1951 YSKLTVDKSR WQQGNVFSCS VMHEALHNHY TQKSLSLSPG K*1951 YSKLTVDKSR WQQGNVFSCS VMHEALHNHY TQKSLSLSPG K*

Нуклеотидная последовательность FVIII 169 (SEQ ID NO: 87)Nucleotide sequence of FVIII 169 (SEQ ID NO: 87)

ATGCA AATAG AGCTC TCCAC CTGCT TCTTT CTGTG CCTTT TGCGA TTCTGATGCA AATAG AGCTC TCCAC CTGCT TCTTT CTGTG CCTTT TGCGA TTCTG

CTTTA GTGCC ACCAG AAGAT ACTAC CTGGG TGCAG TGGAA CTGTG ATGGGCTTTA GTGCC ACCAG AAGAT ACTAC CTGGG TGCAG TGGAA CTGTG ATGGG

101 АСТАТ ATGCA AAGTG ATCTC GGTGA GCTGC CTGTG GACGC AAGAT TTCCT101 ASTAT ATGCA AAGTG ATCTC GGTGA GCTGC CTGTG GACGC AAGAT TTCCT

151 CCTAG AGTGC CAAAA TCTTT TCCAT TCAAC ACCTC AGTCG TGTAC AAAAA151 CCTAG AGTGC CAAAA TCTTT TCCAT TCAAC ACCTC AGTCG TGTAC AAAAA

201 GACTC TGTTT GTAGA ATTCA CGGAT CACCT TTTCA ACATC GCTAA GCCAA201 GACTC TGTTT GTAGA ATTCA CGGAT CACCT TTTCA ACATC GCTAA GCCAA

251 GGCCA CCCTG GATGG GTCTG CTAGG TCCTA CCATC CAGGC TGAGG TTTAT251 GGCCA CCCTG GATGG GTCTG CTAGG TCCTA CCATC CAGGC TGAGG TTTAT

301 GATAC AGTGG TCATT ACACT TAAGA ACATG GCTTC CCATC CTGTC AGTCT301 GATAC AGTGG TCATT ACACT TAAGA ACATG GCTTC CCATC CTGTC AGTCT

351 TCATG CTGTT GGTGT ATCCT ACTGG AAAGC TTCTG AGGGA GCTGA ATATG351 TCATG CTGTT GGTGT ATCCT ACTGG AAAGC TTCTG AGGGA GCTGA ATATG

401 ATGAT CAGAC CAGTC AAAGG GAGAA AGAAG ATGAT AAAGT CTTCC CTGGT401 ATGAT CAGAC CAGTC AAAGG GAGAA AGAAG ATGAT AAAGT CTTCC CTGGT

451 GGAAG CCATA CATAT GTCTG GCAGG TCCTG AAAGA GAATG GTCCA ATGGC451 GGAAG CCATA CATAT GTCTG GCAGG TCCTG AAAGA GAATG GTCCA ATGGC

501 CTCTG ACCCA CTGTG CCTTA CCTAC TCATA TCTTT CTCAT GTGGA CCTGG501 CTCTG ACCCA CTGTG CCTTA CCTAC TCATA TCTTT CTCAT GTGGA CCTGG

551 TAAAA GACTT GAATT CAGGC CTCAT TGGAG CCCTA CTAGT ATGTA GAGAA551 TAAAA GACTT GAATT CAGGC CTCAT TGGAG CCCTA CTAGT ATGTA GAGAA

601 GGGAG TCTGG CCAAG GAAAA GACAC AGACC TTGCA CAAAT TTATA CTACT601 GGGAG TCTGG CCAAG GAAAA GACAC AGACC TTGCA CAAAT TTATA CTACT

651 TTTTG CTGTA TTTGA TGAAG GGAAA AGTTG GCACT CAGAA ACAAA GAACT651 TTTTG CTGTA TTTGA TGAAG GGAAA AGTTG GCACT CAGAA ACAAA GAACT

701 CCTTG ATGCA GGATA GGGAT GCTGC ATCTG CTCGG GCCTG GCCTA AAATG701 CCTTG ATGCA GGATA GGGAT GCTGC ATCTG CTCGG GCCTG GCCTA AAATG

751 CACAC AGTCA ATGGT TATGT AAACA GGTCT CTGCC AGGTC TGATT GGATG751 CACAC AGTCA ATGGT TATGT AAACA GGTCT CTGCC AGGTC TGATT GGATG

801 CCACA GGAAA TCAGT CTATT GGCAT GTGAT TGGAA TGGGC ACCAC TCCTG801 CCACA GGAAA TCAGT CTATT GGCAT GTGAT TGGAA TGGGC ACCAC TCCTG

851 AAGTG CACTC AATAT TCCTC GAAGG TCACA CATTT CTTGT GAGGA АССАТ851 AAGTG CACTC AATAT TCCTC GAAGG TCACA CATTT CTTGT GAGGA ASSAT

- 65 041588- 65 041588

901 CGCCA GGCTA GCTTG GAAAT CTCGC CAATA ACTTT CCTTA CTGCT CAAAC901 CGCCA GGCTA GCTTG GAAAT CTCGC CAATA ACTTT CCTTA CTGCT CAAAC

951 ACTCT TGATG GACCT TGGAC AGTTT CTACT GTTTT GTCAT ATCTC TTCCC951 ACTCT TGATG GACCT TGGAC AGTTT CTACT GTTTT GTCAT ATCTC TTCCC

1001 ACCAA CATGA TGGCA TGGAA GCTTA TGTCA AAGTA GACAG CTGTC CAGAG1001 ACCAA CATGA TGGCA TGGAA GCTTA TGTCA AAGTA GACAG CTGTC CAGAG

1051 GAACC CCAAC TACGA ATGAA AAATA ATGAA GAAGC GGAAG АСТАТ GATGA1051 GAACC CCAAC TACGA ATGAA AAATA ATGAA GAAGC GGAAG ASTAT GATGA

1101 TGATC TTACT GATTC TGAAA TGGAT GTGGT CAGGT TTGAT GATGA CAACT1101 TGATC TTACT GATTC TGAAA TGGAT GTGGT CAGGT TTGAT GATGA CAACT

1151 CTCCT TCCTT TATCC AAATT CGCTC AGTTG CCAAG AAGCA TCCTA AAACT1151 CTCCT TCCTT TATCC AAATT CGCTC AGTTG CCAAG AAGCA TCCTA AAACT

1201 TGGGT АСАТТ ACATT GCTGC TGAAG AGGAG GACTG GGACT ATGCT CCCTT1201 TGGGT ACATT ACATT GCTGC TGAAG AGGAG GACTG GGACT ATGCT CCCTT

1251 AGTCC TCGCC CCCGA TGACA GAAGT TATAA AAGTC AATAT TTGAA CAATG1251 AGTCC TCGCC CCCGA TGACA GAAGT TATAA AAGTC AATAT TTGAA CAATG

1301 GCCCT CAGCG GATTG GTAGG AAGTA CAAAA AAGTC CGATT TATGG CATAC1301 GCCCT CAGCG GATTG GTAGG AAGTA CAAAA AAGTC CGATT TATGG CATAC

1351 ACAGA TGAAA CCTTT AAGAC TCGTG AAGCT ATTCA GCATG AATCA GGAAT1351 ACAGA TGAAA CCTTT AAGAC TCGTG AAGCT ATTCA GCATG AATCA GGAAT

1401 CTTGG GACCT TTACT TTATG GGGAA GTTGG AGACA CACTG TTGAT TATAT1401 CTTGG GACCT TTACT TTATG GGGAA GTTGG AGACA CACTG TTGAT TATAT

1451 TTAAG AATCA AGCAA GCAGA CCATA TAACA TCTAC CCTCA CGGAA TCACT1451 TTAAG AATCA AGCAA GCAGA CCATA TAACA TCTAC CCTCA CGGAA TCACT

1501 GATGT CCGTC CTTTG TATTC AAGGA GATTA CCAAA AGGTG TAAAA CATTT1501 GATGT CCGTC CTTTG TATTC AAGGA GATTA CCAAA AGGTG TAAAA CATTT

1551 GAAGG ATTTT CCAAT TCTGC CAGGA GAAAT ATTCA AATAT AAATG GACAG1551 GAAGG ATTTT CCAAT TCTGC CAGGA GAAAT ATTCA AATAT AAATG GACAG

1601 TGACT GTAGA AGATG GGCCA ACTAA ATCAG ATCCT CGGTG CCTGA CCCGC1601 TGACT GTAGA AGATG GGCCA ACTAA ATCAG ATCCT CGGTG CCTGA CCCGC

1651 ТАТТА CTCTA GTTTC GTTAA TATGG AGAGA GATCT AGCTT CAGGA CTCAT1651 TATTA CTCTA GTTTC GTTAA TATGG AGAGA GATCT AGCTT CAGGA CTCAT

1701 TGGCC CTCTC CTCAT CTGCT ACAAA GAATC TGTAG ATCAA AGAGG AAACC1701 TGGCC CTCTC CTCAT CTGCT ACAAA GAATC TGTAG ATCAA AGAGG AAACC

1751 AGATA ATGTC AGACA AGAGG AATGT CATCC TGTTT TCTGT ATTTG ATGAG1751 AGATA ATGTC AGACA AGAGG AATGT CATCC TGTTT TCTGT ATTTG ATGAG

1801 AACCG AAGCT GGTAC CTCAC AGAGA ATATA CAACG CTTTC TCCCC AATCC1801 AACCG AAGCT GGTAC CTCAC AGAGA ATATA CAACG CTTTC TCCCC AATCC

1851 AGCTG GAGTG CAGCT TGAGG ATCCA GAGTT CCAAG CCTCC AACAT CATGC1851 AGCTG GAGTG CAGCT TGAGG ATCCA GAGTT CCAAG CCTCC AACAT CATGC

1901 ACAGC ATCAA TGGCT ATGTT TTTGA TAGTT TGCAG TTGTC AGTTT GTTTG1901 ACAGC ATCAA TGGCT ATGTT TTTGA TAGTT TGCAG TTGTC AGTTT GTTTG

1951 CATGA GGTGG CATAC TGGTA CATTC TAAGC ATTGG AGCAC AGACT GACTT1951 CATGA GGTGG CATAC TGGTA CATTC TAAGC ATTGG AGCAC AGACT GACTT

2001 CCTTT CTGTC TTCTT CTCTG GATAT ACCTT CAAAC ACAAA ATGGT CTATG2001 CCTTT CTGTC TTCTT CTCTG GATAT ACCTT CAAAC ACAAA ATGGT CTATG

2051 AAGAC ACACT CACCC TATTC CCATT CTCAG GAGAA ACTGT CTTCA TGTCG2051 AAGAC ACACT CACCC TATTC CCATT CTCAG GAGAA ACTGT CTTCA TGTCG

2101 ATGGA AAACC CAGGT CTATG GATTC TGGGG TGCCA CAACT CAGAC TTTCG2101 ATGGA AAACC CAGGT CTATG GATTC TGGGG TGCCA CAACT CAGAC TTTCG

2151 GAACA GAGGC ATGAC CGCCT TACTG AAGGT TTCTA GTTGT GACAA GAACA2151 GAACA GAGGC ATGAC CGCCT TACTG AAGGT TTCTA GTTGT GACAA GAACA

2201 CTGGT GATTA TTACG AGGAC AGTTA TGAAG ATATT TCAGC ATACT TGCTG2201 CTGGT GATTA TTACG AGGAC AGTTA TGAAG ATATT TCAGC ATACT TGCTG

2251 AGTAA AAACA ATGCC ATTGA ACCAA GAAGC TTCTC TCAAA ACGGC GCGCC2251 AGTAA AAACA ATGCC ATTGA ACCAA GAAGC TTCTC TCAAA ACGGC GCGCC

2301 AGGTA CCTCA GAGTC TGCTA CCCCC GAGTC AGGGC CAGGA TCAGA GCCAG2301 AGGTA CCTCA GAGTC TGCTA CCCCC GAGTC AGGGC CAGGA TCAGA GCCAG

2351 CCACC TCCGG GTCTG AGACA CCCGG GACTT CCGAG AGTGC CACCC CTGAG2351 CCACC TCCGG GCTTG AGACA CCCGG GACTT CCGAG AGTGC CACCC CTGAG

2401 TCCGG ACCCG GGTCC GAGCC CGCCA CTTCC GGCTC CGAAA CTCCC GGCAC2401 TCCGG ACCCG GGTCC GAGCC CGCCA CTTCC GGCTC CGAAA CTCCC GGCAC

2451 AAGCG AGAGC GCTAC CCCAG AGTCA GGACC AGGAA CATCT ACAGA GCCCT2451 AAGCG AGAGC GCTAC CCCAG AGTCA GGACC AGGAA CATCT ACAGA GCCCT

2501 CTGAA GGCTC CGCTC CAGGG TCCCC AGCCG GCAGT CCCAC TAGCA CCGAG2501 CTGAA GGCTC CGCTC CAGGG TCCCC AGCCG GCAGT CCCAC TAGCA CCGAG

2551 GAGGG AACCT CTGAA AGCGC CACAC CCGAA TCAGG GCCAG GGTCT GAGCC2551 GAGGG AACCT CTGAA AGCGC CACAC CCGAA TCAGG GCCAG GGTCT GAGCC

2601 TGCTA CCAGC GGCAG CGAGA САССА GGCAC CTCTG AGTCC GCCAC ACCAG2601 TGCTA CCAGC GGCAG CGAGA CACCA GGCAC CTCTG AGTCC GCCAC ACCAG

2651 AGTCC GGACC CGGAT CTCCC GCTGG GAGCC CCACC TCCAC TGAGG AGGGA2651 AGTCC GGACC CGGAT CTCCC GCTGG GAGCC CCACC TCCAC TGAGG AGGGA

2701 TCTCC TGCTG GCTCT CCAAC ATCTA CTGAG GAAGG TACCT CAACC GAGCC2701 TCTCC TGCTG GCTCT CCAAC ATCTA CTGAG GAAGG TACCT CAACC GAGCC

2751 ATCCG AGGGA TCAGC TCCCG GCACC TCAGA GTCGG CAACC CCGGA GTCTG2751 ATCCG AGGGA TCAGC TCCCG GCACC TCAGA GTCGG CAACC CCGGA GTCTG

2801 GACCC GGAAC TTCCG AAAGT GCCAC ACCAG AGTCC GGTCC CGGGA CTTCA2801 GACCC GGAAC TTCCG AAAGT GCCAC ACCAG AGTCC GGTCC CGGGA CTTCA

2851 GAATC AGCAA CACCC GAGTC CGGCC CTGGG TCTGA ACCCG CCACA AGTGG2851 GAATC AGCAA CACCC GAGTC CGGCC CTGGG TCTGA ACCCG CCACA AGTGG

2901 TAGTG AGACA CCAGG ATCAG AACCT GCTAC CTCAG GGTCA GAGAC ACCCG2901 TAGTG AGACA CCAGG ATCAG AACCT GCTAC CTCAG GGTCA GAGAC ACCCG

2951 GATCT CCGGC AGGCT САССА ACCTC CACTG AGGAG GGCAC CAGCA CAGAA2951 GATCT CCGGC AGGCT CACCA ACCTC CACTG AGGAG GGCAC CAGCA CAGAA

3001 CCAAG CGAGG GCTCC GCACC CGGAA CAAGC ACTGA ACCCA GTGAG GGTTC3001 CCAAG CGAGG GCTCC GCACC CGGAA CAAGC ACTGA ACCCA GTGAG GGTTC

3051 AGCAC CCGGC TCTGA GCCGG CCACA AGTGG CAGTG AGACA CCCGG CACTT3051 AGCAC CCGGC TCTGA GCCGG CCACA AGTGG CAGTG AGACA CCCGG CACTT

3101 CAGAG AGTGC CACCC CCGAG AGTGG CCCAG GCACT AGTAC CGAGC CCTCT3101 CAGAG AGTGC CACCC CCGAG AGTGG CCCAG GCACT AGTAC CGAGC CCTCT

3151 GAAGG CAGTG CGCCA GCCTC GAGCC САССА GTCTT GAAAC GCCAT CAAGC3151 GAAGG CAGTG CGCCA GCCTC GAGCC CACCA GTCTT GAAAC GCCAT CAAGC

3201 TGAAA TAACT CGTAC TACTC TTCAG TCAGA TCAAG AGGAA ATCGA TTATG3201 TGAAA TAACT CGTAC TACTC TTCAG TCAGA TCAAG AGGAA ATCGA TTATG

3251 ATGAT АССАТ ATCAG TTGAA ATGAA GAAGG AAGAT TTTGA CATTT ATGAT3251 ATGAT ASSAT ATCAG TTGAA ATGAA GAAGG AAGAT TTTGA CATTT ATGAT

3301 GAGGA TGAAA ATCAG AGCCC CCGCA GCTTT CAAAA GAAAA CACGA CACTA3301 GAGGA TGAAA ATCAG AGCCC CCGCA GCTTT CAAAA GAAAA CACGA CACTA

3351 TTTTA TTGCT GCAGT GGAGA GGCTC TGGGA TTATG GGATG AGTAG CTCCC3351 TTTTA TTGCT GCAGT GGAGA GGCTC TGGGA TTATG GGATG AGTAG CTCCC

3401 CACAT GTTCT AAGAA ACAGG GCTCA GAGTG GCAGT GTCCC TCAGT TCAAG3401 CACAT GTTCT AAGAA ACAGG GCTCA GAGTG GCAGT GTCCC TCAGT TCAAG

3451 AAAGT TGTTT TCCAG GAATT TACTG ATGGC TCCTT TACTC AGCCC TTATA3451 AAAGT TGTTT TCCAG GAATT TACTG ATGGC TCCTT TACTC AGCCC TTATA

3501 CCGTG GAGAA CTAAA TGAAC ATTTG GGACT CCTGG GGCCA TATAT AAGAG3501 CCGTG GAGAA CTAAA TGAAC ATTTG GGACT CCTGG GGCCA TATAT AAGAG

3551 CAGAA GTTGA AGATA ATATC ATGGT AACTT TCAGA AATCA GGCCT CTCGT3551 CAGAA GTTGA AGATA ATATC ATGGT AACTT TCAGA AATCA GGCCT CTCGT

3601 CCCTA TTCCT TCTAT TCTAG CCTTA TTTCT TATGA GGAAG ATCAG AGGCA3601 CCCTA TTCCT TCTAT TCTAG CCTTA TTTCT TATGA GGAAG ATCAG AGGCA

3651 AGGAG CAGAA CCTAG AAAAA ACTTT GTCAA GCCTA ATGAA ACCAA AACTT3651 AGGAG CAGAA CCTAG AAAAA ACTTT GTCAA GCCTA ATGAA ACCAA AACTT

3701 ACTTT TGGAA AGTGC AACAT CATAT GGCAC CCACT AAAGA TGAGT TTGAC3701 ACTTT TGGAA AGTGC AACAT CATAT GGCAC CCACT AAAGA TGAGT TTGAC

3751 TGCAA AGCCT GGGCT TATTT CTCTG ATGTT GACCT GGAAA AAGAT GTGCA3751 TGCAA AGCCT GGGCT TATTT CTCTG ATGTT GACCT GGAAA AAGAT GTGCA

3801 CTCAG GCCTG ATTGG ACCCC TTCTG GTCTG CCACA CTAAC ACACT GAACC3801 CTCAG GCCTG ATTGG ACCCC TTCTG GCTTG CCACA CTAAC ACACT GAACC

3851 CTGCT CATGG GAGAC AAGTG ACAGT ACAGG AATTT GCTCT GTTTT TCACC3851 CTGCT CATGG GAGAC AAGTG ACAGT ACAGG AATTT GCTCT GTTTT TCACC

3901 ATCTT TGATG AGACC AAAAG CTGGT ACTTC ACTGA AAATA TGGAA AGAAA3901 ATCTT TGATG AGACC AAAAG CTGGT ACTTC ACTGA AAATA TGGAA AGAAA

3951 CTGCA GGGCT CCCTG CAATA TCCAG ATGGA AGATC CCACT TTTAA AGAGA3951 CTGCA GGGCT CCCTG CAATA TCCAG ATGGA AGATC CCACT TTTAA AGAGA

4001 ATTAT CGCTT CCATG CAATC AATGG СТАСА TAATG GATAC ACTAC CTGGC4001 ATTAT CGCTT CCATG CAATC AATGG STAS TAATG GATAC ACTAC CTGGC

4051 TTAGT AATGG CTCAG GATCA AAGGA TTCGA TGGTA TCTGC TCAGC ATGGG4051 TTAGT AATGG CTCAG GATCA AAGGA TTCGA TGGTA TCTGC TCAGC ATGGG

- 66 041588- 66 041588

4101 4101 CAGCA CAGCA ATGAA ATGAA AACAT AACAT CCATT CCATT CTATT CTATT CATTT CATTT CAGTG CAGTG GACAT GACAT GTGTT GTGTT CACTG CACTG 4151 4151 TAG GA TAG GA AAAAA AAAAA AGAGG AGAGG AGTAT AGTAT AAAAT AAAAT GGCAC GGCAC TGTAC TGTAC AATCT AATCT CTATC CTATC CAGGT CAGGT 4201 4201 GTTTT GTTT TGAGA TGAGA CAGTG CAGTG GAAAT GAAAT GT TAG GT-TAG CATCC CATCC AAAGC AAAGC TGGAA TGGAA TTTGG TTTGG CGGGT CGGGT 4251 4251 GGAAT GGAAT GCCTT GCCTT ATTGG ATTGG CGAGC CGAGC AT СТА AT STA CATGC CATGC TGGGA TGGGA TGAGC TGAGC ACACT ACACT TTTTC TTTTC 4301 4301 TGGTG TGGTG TACAG TACAG CAATA CAATA AGTGT AGTGT CAGAC CAGAC TCCCC TCCCC TGGGA TGGGA ATGGC ATGGC TTCTG TTCTG GACAC GACAC 4351 4351 AT TAG AT TAG AGATT AGATT TTCAG TTCAG AT TAG AT TAG AGCTT AGCTT CAGGA CAGGA CAATA CAATA TGGAC TGGAC AGTGG AGTGG GCCCC GCCCC 4401 4401 AAAGC AAAGC TGGCC TGGCC AGACT AGACT TCATT TCATT ATTCC ATTCC GGATC GGATC AATCA AATCA ATGCC ATGCC TGGAG TGGAG САССА SASS 4451 4451 AGGAG AGGAG CCCTT CCCTT TTCTT TTCTT GGATC GGATC AAGGT AAGGT GGATC GGATC TGTTG TGTTG GCACC GCACC AATGA AATGA TTATT TTATT 4501 4501 CACGG CACGG CATC A CATC A AGACC AGACC CAGGG CAGGG TGCCC TGCCC GTCAG GTCAG AAGTT AAGTT CTCCA CTCCA GCCTC GCCTC TACAT TACAT 4551 4551 CTCTC CTCTC AGTTT AGTTT AT CAT AT CAT CAT GT CAT GT ATAGT ATAGT CTTGA CTTGA TGGGA TGGGA AGAAG AGAAG TGGCA TGGCA GACTT GACTT 4601 4601 АТС GA PBX GA GGAAA GGAAA TTCCA TTCCA CTGGA CTGGA ACCTT ACCTT AATGG AATGG TCTTC TCTTC TTTGG TTTGG CAATG CAATG TGGAT TGGAT 4651 4651 TCATC TCATC TGGGA TGGGA TAAAA TAAAA CACAA CACAA TATTT TATTT TTAAC TTAAC CCTCC CCTCC AATTA AATTA TTGCT TTGCT CGATA CGATA 4701 4701 CATCC CATCC GTTTG GTTTG CACCC CACCC AACTC AACTC AT TAT AT TAT AGCAT AGCAT TCGCA TCGCA GCACT GCACT CTTCG CTTCG CATGG CATGG 4751 4751 AGTTG AGTTG ATGGG ATGGG CTGTG CTGTG ATTTA ATTTA AATAG AATAG TTGCA TTGCA GCATG GCATG CCATT CCATT GGGAA GGGAA TGGAG TGGAG 4801 4801 AGTAA AGTAA AGCAA AGCAA TATCA TATCA GATGC GATGC ACAGA ACAGA TTACT TTACT GCTTC GCTTC ATCCT ATCCT ACTTT ACTTT ACCAA ACCAA 4851 4851 TAT GT TAT GT TTGCC TTGCC ACCTG ACCTG GTCTC GTCTC CTTCA CTTCA AAAGC AAAGC TCGAC TCGAC TTCAC TTCAC CTCCA CTCCA AGGGA AGGGA 4901 4901 GGAGT GGAGT AATGC AATGC CTGGA CTGGA GACCT GACCT CAGGT CAGGT GAATA GAATA AT CCA AT CCA AAAGA AAAGA GTGGC GTGGC TGCAA TGCAA 4951 4951 GTGGA GTGGA CTTCC CTTCC AGAAG AGAAG ACAAT ACAAT GAAAG GAAAG TCACA TCACA GGAGT GGAGT AACTA AACTA CTCAG CTCAG GGAGT GGAGT 5001 5001 AAAAT AAAAT CTCTG CTCTG CTTAC CTTAC CAGCA CAGCA TGTAT TGTAT GTGAA GTGAA GGAGT GGAGT TCCTC TCCTC ATCTC ATCTC CAGCA CAGCA 5051 5051 GTCAA GTCA GATGG GATGG CCATC CCATC AGTGG AGTGG ACTCT ACTCT CTTTT CTTTT TTCAG TTCAG AATGG AATGG CAAAG CAAAG TAAAG TAAAG 5101 5101 GTTTT GTTT TCAGG TCAGG GAAAT GAAAT CAAGA CAAGA CTCCT CTCCT TCACA TCACA CCTGT CCTGT GGTGA GGTGA ACTCT ACTCT CTAGA CTAGA 5151 5151 CCCAC CCCAC CGTTA CGTTA CTGAC CTGAC TCGCT TCGCT ACCTT ACCTT CGAAT CGAAT TCACC TCACC CCCAG CCCAG AGTTG AGTTG GGTGC GGTGC 5201 5201 ACC AG ACC AG ATTGC ATTGC CCTGA CCTGA GGATG GGATG GAGGT GAGGT TCTGG TCTGG GCTGC GCTGC GAGGC GAGGC ACAGG ACAGG ACCTC ACCTC 5251 5251 TAG GA TAG GA CAAAA CAAAA CTCAC CTCAC ACATG ACATG CCCAC CCCAC CGTGC CGTGC CCAGC CCAGC TCCAG TCCAG AACTC AACTC CTGGG CTGGG 5301 5301 CGGAC CGGAC CGTCA CGTCA GTCTT GTCTT CCTCT CCTCT TCCCC TCCCC CCAAA CCAAA AC CCA AC CCA AGGAC AGGAC ACCCT ACCCT CAT GA CAT GA 5351 5351 TCTCC TCTCC CGGAC CGGAC CCCTG CCCTG AGGTC AGGTC ACATG ACATG CGTGG CGTGG TGGTG TGGTG GACGT GACGT GAGCC GAGCC ACGAA ACGAA 5401 5401 GACCC GACCC TGAGG TGAGG TCAAG TCAAG TTCAA TTCAA CTGGT CTGGT ACGTG ACGTG GACGG GACGG CGTGG CGTGG AGGTG AGGTG CATAA CATAA 5451 5451 TGCCA TGCCA AGACA AGACA AAGCC AAGCC GCGGG GCGGG AGGAG AGGAG CAGTA CAGTA CAACA CAACA GCACG GCACG TACCG TACCG TGTGG TGTGG 5501 5501 TCAGC TCAGC GTCCT GTCCT CACCG CACCG TCCTG TCCTG САССА SASS GGACT GGACT GGCTG GGCTG AATGG AATGG CAAGG CAAGG AGTAC AGTAC 5551 5551 AAGTG AAGTG CAAGG CAAGG TCTCC TCTCC AACAA AACAA AGCCC AGCCC TCCCA TCCCA GCCCC GCCCC CATCG CATCG AGAAA AGAAA АССАТ ASCAT 5601 5601 CTCCA CTCCA AAGCC AAGCC AAAGG AAAGG GCAGC GCAGC CCCGA CCCGA GAACC GAACC ACAGG ACAGG TGTAC TGTAC ACCCT ACCCT GCCCC GCCCC 5651 5651 CATCC CATCC CGGGA CGGGA TGAGC TGAGC TGACC TGACC AAGAA AAGAA CCAGG CCAGG TCAGC TCAGC CTGAC CTGAC CTGCC CTGCC TGGTC TGGTC 5701 5701 AAAGG AAAGG CTTCT CTTCT ATCCC ATCCC AGCGA AGCGA CATCG CATCG CCGTG CCGTG GAGTG GAGTG GGAGA GGAGA GCAAT GCAAT GGGCA GGGCA 5751 5751 GCCGG GCCGG AGAAC AGAAC AACTA AACTA CAAGA CAAGA CCACG CCACG CCTCC CCTCC CGTGT CGTGT TGGAC TGGAC TCCGA TCCGA CGGCT CGGCT 5801 5801 CCTTC CCTTC TTCCT TTCCT СТАСА STAS GCAAG GCAAG CTCAC CTCAC CGTGG CGTGG ACAAG ACAAG AGCAG AGCAG GTGGC GTGGC AGCAG AGCAG 5851 5901 5851 5901 GGGAA CACGC GGGAA CACGC CGTCT AGAAG CGTCT AGAAG TCTCA AGCCT TCTCA AGCCT TGCTC CTCCC TGCTC CTCCC CGTGA TGTCT CGTGA TGTCT TGCAT CCGGG TGCAT CCGGG GAGGC TAAAT GAGGC TAAAT TCTGC GA TCTGC GA ACAAC ACAAC CACTA CACTA

Белковая последовательность FVIII 169 (SEQ ID NO: 88)Protein sequence of FVIII 169 (SEQ ID NO: 88)

101101

151151

201201

251251

301301

351351

401401

451451

501501

551551

601601

651651

701701

751751

801801

851851

901901

951951

10011001

10511051

MQIELSTCFF PRVPKSFPFN DTWITLKNM GSHTYVWQVL GSLAKEKTQT HTVNGYVNRS RQASLEISPI EPQLRMKNNE WVHYIAAEEE TDETFKTREA DVRPLYSRRL YYSSFVNMER NRSWYLTENI HEVAYWYILS MENPGLWILG SKNNAIEPRS SGPGSEPATS EGTSESATPE SPAGSPTSTE ESATPESGPG PSEGSAPGTS EGSAPASSPPMQIELSTCFF PRVPKSFPFN DTWITLKNM GSHTYVWQVL GSLAKEKTQT HTVNGYVNRS RQASLEISPI EPQLRMKNNE WVHYIAAEEE TDETFKTREA DVRPLYSRRL YYSSFVNMER NRSWYLTENI HEVAYWYILS MENPGLWILG SKNNAIEPRS SGPGSEPATS EGTSESATPE SPAGSPGTSPGSA

LCLLRFCFSA TSWYKKTLF ASHPVSLHAV KENGPMASDP LHKFILLFAV LPGLIGCHRK TFLTAQTLLM EAEDYDDDLT DWDYAPLVLA IQHESGILGP PKGVKHLKDF DLASGLIGPL QRFLPNPAGV IGAQTDFLSV CHNSDFRNRG FSQNGAPGTS GSETPGTSES SGPGSEPATS EGTSTEPSEG SEPATSGSET TEPSEGSAPG VLKRHQAEITLCLLRFCFSA TSWYKKTLF ASHPVSLHAV KENGPMASDP LHKFILLFAV LPGLIGCHRK TFLTAQTLLM EAEDYDDDLT DWDYAPLVLA IQHESGILGP PKGVKHLKDF DLASGLIGPL QRFLPNPAGV IGAQTDFLSV CHNSDFRNRG FSQNGAPGTS GSETPGTSES SGPGSEPATS EGTSTEPSEG SEPATSGSET VAEDLIT

TRRYYLGAVE VEFTDHLFNI GVSYWKASEG LCLTYSYLSH FDEGKSWHSE SVYWHVIGMG DLGQFLLFCH DSEMDWRFD PDDRSYKSQY LLYGEVGDTL PILPGEIFKY LICYKESVDQ QLEDPEFQAS FFSGYTFKHK MTALLKVSSC ESATPESGPG ATPESGPGTS GSETPGTSES SAPGTSESAT PGSEPATSGS SEPATSGSET RTTLQSDQEETRRYYLGAVE VEFTDHLFNI GVSYWKASEG LCLTYSYLSH FDEGKSWHSE SVYWHVIGMG DLGQFLLFCH DSEMDWRFD PDDRSYKSQY LLYGEVGDTL PILPGEIFKY LICYKESVDQ QLEDPEFQAS FFSGYTFKHK MTALLKVSSC ESATPESGPG ATPESGPGEE SETPGTSSDPA SAPGTSESAT PGSEPATS

LSWDYMQSDL AKPRPPWMGL AEYDDQTSQR VDLVKDLNSG TKNSLMQDRD TTPEVHSIFL ISSHQHDGME DDNSPSFIQI LNNGPQRIGR LIIFKNQASR KWTVTVEDGP RGNQIMSDKR NIMHSINGYV MVYEDTLTLF DKNTGDYYED SEPATSGSET TEPSEGSAPG ATPESGPGSP PESGPGTSES ETPGSPAGSP PGTSESATPE IDYDDTISVELSWDYMQSDL AKPRPPWMGL AEYDDQTSQR VDLVKDLNSG TKNSLMQDRD TTPEVHSIFL ISSHQHDGME DDNSPSFIQI LNNGPQRIGR LIIFKNQASR KWTVTVEDGP RGNQIMSDKR NIMHSINGYV MVYEDTLTLF DKNTGDYYYED SEPATSGDYYED SEPATSGDYYED TEPSEGSAPG ATPESGPGSPDTSP PETSPGPGTSPE ID

GELPVDARFP LGPTIQAEVY EKEDDKVFPG LIGALLVCRE AASARAWPKM EGHTFLVRNH AYVKVDSCPE RSVAKKHPKT KYKKVRFMAY PYNIYPHGIT TKSDPRCLTR NVILFSVFDE FDSLQLSVCL PFSGETVFMS SYEDISAYLL PGTSESATPE SPAGSPTSTE AGSPTSTEEG ATPESGPGTS TSTEEGTSTE SGPGTSTEPS MKKEDFDIYDGELPVDARFP LGPTIQAEVY EKEDDKVFPG LIGALLVCRE AASARAWPKM EGHTFLVRNH AYVKVDSCPE RSVAKKHPKT KYKKVRFMAY PYNIYPHGIT TKSDPRCLTR NVILFSVFDE FDSLQLSVCL PFSGETVFMS SYEDISAYLL PGTSESATPE SPAGSPTSTE AGDISPTSTEEG ATPESGTSPGTS SGTEMKTEDFTSKE

- 67 041588- 67 041588

1101 EDENQSPRSF QKKTRHYFIA AVERLWDYGM SSSPHVLRNR AQSGSVPQFK1101 EDENQSPRSF QKKTRHYFIA AVERLWDYGM SSSPHVLRNR AQSGSVPQFK

1151 KWFQEFTDG SFTQPLYRGE LNEHLGLLGP YIRAEVEDNI MVTFRNQASR1151 KWFQEFTDG SFTQPLYRGE LNEHLGLLGP YIRAEVEDNI MVTFRNQASR

1201 PYSFYSSLIS YEEDQRQGAE PRKNFVKPNE TKTYFWKVQH HMAPTKDEFD1201 PYSFYSSLIS YEEDQRQGAE PRKNFVKPNE TKTYFWKVQH HMAPTKDEFD

1251 CKAWAYFSDV DLEKDVHSGL IGPLLVCHTN TLNPAHGRQV TVQEFALFFT1251 CKAWAYFSDV DLEKDVHSGL IGPLLVCHTN TLNPAHGRQV TVQEFALFFT

1301 IFDETKSWYF TENMERNCRA PCNIQMEDPT FKENYRFHAI NGYIMDTLPG1301 IFDEKSWYF TENMERNCRA PCNIQMEDPT FKENYRFHAI NGYIMDTLPG

1351 LVMAQDQRIR WYLLSMGSNE NIHSIHFSGH VFTVRKKEEY KMALYNLYPG1351 LVMAQDQRIR WYLLSMGSNE NIHSIHFSGH VFTVRKKEEY KMALYNLYPG

1401 VFETVEMLPS KAGIWRVECL IGEHLHAGMS TLFLVYSNKC QTPLGMASGH1401 VFETVEMLPS KAGIWRVECL IGEHLHAGMS TLFLVYSNKC QTPLGMASGH

1451 IRDFQITASG QYGQWAPKLA RLHYSGSINA WSTKEPFSWI KVDLLAPMII1451 IRDFQITASG QYGQWAPKLA RLHYSGSINA WSTKEPFSWI KVDLLAPMII

1501 HGIKTQGARQ KFSSLYISQF IIMYSLDGKK WQTYRGNSTG TLMVFFGNVD1501 HGIKTQGARQ KFSSLYISQF IIMYSLDGKK WQTYRGNSTG TLMVFFGNVD

1551 SSGIKHNIFN PPIIARYIRL HPTHYSIRST LRMELMGCDL NSCSMPLGME1551 SSGIKHNIFN PPIIARYIRL HPTHYSIRST LRMELMGCDL NSCSMPLGME

1601 SKAISDAQIT ASSYFTNMFA TWSPSKARLH LQGRSNAWRP QVNNPKEWLQ1601 SKAISDAQIT ASSYFTNMFA TWSPSKARLH LQGRSNAWRP QVNNPKEWLQ

1651 VDFQKTMKVT GVTTQGVKSL LTSMYVKEFL ISSSQDGHQW TLFFQNGKVK1651 VDFQKTMKVT GVTTQGVKSL LTSMYVKEFL ISSSQDGHQW TLFFQNGKVK

1701 VFQGNQDSFT PWNSLDPPL LTRYLRIHPQ SWVHQIALRM EVLGCEAQDL1701 VFQGNQDSFT PWNSLDPPL LTRYLRIHPQ SWVHQIALRM EVLGCEAQDL

1751 YDKTHTCPPC PAPELLGGPS VFLFPPKPKD TLMISRTPEV TCVWDVSHE1751 YDKTHTCPPC PAPELLGGPS VFLFPPKPKD TLMISRTPEV TCVWDVSHE

1801 DPEVKFNWYV DGVEVHNAKT KPREEQYNST YRWSVLTVL HQDWLNGKEY1801 DPEVKFNWYV DGVEVHNAKT KPREEQYNST YRWSVLTVL HQDWLNGKEY

1851 KCKVSNKALP APIEKTISKA KGQPREPQVY TLPPSRDELT KNQVSLTCLV1851 KCKVSNKALP APIEKTISKA KGQPREPQVY TLPPSRDELT KNQVSLTCLV

1901 KGFYPSDIAV EWESNGQPEN NYKTTPPVLD SDGSFFLYSK LTVDKSRWQQ1901 KGFYPSDIAV EWESNGQPEN NYKTTPPVLD SDGSFFLYSK LTVDKSRWQQ

1951 GNVFSCSVMH EALHNHYTQK SLSLSPGK*1951 GNVFSCSVMH EALHNHYTQK SLSLSPGK*

Нуклеотидная последовательность VWF034 (SEQ ID NO: 91)Nucleotide sequence of VWF034 (SEQ ID NO: 91)

ATGAT TCCTG CCAGA TTTGC CGGGG TGCTG CTTGC TCTGG CCCTC ATTTTATGAT TCCTG CCAGA TTTGC CGGGG TGCTG CTTGC TCTGG CCCTC ATTTT

GCCAG GGACC CTTTG TGCAG AAGGA ACTCG CGGCA GGTCA TCCAC GGCCCGCCAG GGACC CTTTG TGCAG AAGGA ACTCG CGGCA GGTCA TCCAC GGCCC

101 GATGC AGCCT TTTCG GAAGT GACTT CGTCA ACACC TTTGA TGGGA GCATG101 GATGC AGCCT TTTCG GAAGT GACTT CGTCA ACACC TTTGA TGGGA GCATG

151 TACAG CTTTG CGGGA TACTG CAGTT ACCTC CTGGC AGGGG GCTGC CAGAA151 TACAG CTTTG CGGGA TACTG CAGTT ACCTC CTGGC AGGGG GCTGC CAGAA

201 ACGCT CCTTC TCGAT TATTG GGGAC TTCCA GAATG GCAAG AGAGT GAGCC201 ACGCT CCTTC TCGAT TATTG GGGAC TTCCA GAATG GCAAG AGAGT GAGCC

251 TCTCC GTGTA TCTTG GGGAA TTTTT TGACA TCGAT TTGTT TGTCA ATGGT251 TCTCC GTGTA TCTTG GGGAA TTTTT TGACA TCGAT TTGTT TGTCA ATGGT

301 ACCGT GACAC AGGGG GACCA AAGAG TCTCC ATGCC CTATG CCTCC AAAGG301 ACCGT GACAC AGGGG GACCA AAGAG TCTCC ATGCC CTATG CCTCC AAAGG

351 GCTGT ATCTA GAAAC TGAGG CTGGG TACTA CAAGC TGTCC GGTGA GGCCT351 GCTGT ATCTA GAAAC TGAGG CTGGG TACTA CAAGC TGTCC GGTGA GGCCT

401 ATGGC TTTGT GGCCA GGATC GATGG CAGCG GCAAC TTTCA AGTCC TGCTG401 ATGGC TTTGT GGCCA GGATC GATGG CAGCG GCAAC TTTCA AGTCC TGCTG

451 TCAGA CAGAT ACTTC AACAA GACCT GCGGG CTGTG TGGCA ACTTT AACAT451 TCAGA CAGAT ACTTC AACAA GACCT GCGGG CTGTG TGGCA ACTTT AACAT

501 CTTTG CTGAA GATGA CTTTA TGACC CAAGA AGGGA CCTTG ACCTC GGACC501 CTTTG CTGAA GATGA CTTTA TGACC CAAGA AGGGA CCTTG ACCTC GGACC

551 CTTAT GACTT TGCCA ACTCA TGGGC TCTGA GCAGT GGAGA ACAGT GGTGT551 CTTAT GACTT TGCCA ACTCA TGGGC TCTGA GCAGT GGAGA ACAGT GGTGT

601 GAACG GGCAT CTCCT CCCAG CAGCT CATGC AACAT CTCCT CTGGG GAAAT601 GAACG GGCAT CTCCT CCCAG CAGCT CATGC AACAT CTCCT CTGGG GAAAT

651 GCAGA AGGGC CTGTG GGAGC AGTGC CAGCT TCTGA AGAGC ACCTC GGTGT651 GCAGA AGGGC CTGTG GGAGC AGTGC CAGCT TCTGA AGAGC ACCTC GGTGT

701 TTGCC CGCTG CCACC CTCTG GTGGA CCCCG AGCCT TTTGT GGCCC TGTGT701 TTGCC CGCTG CCACC CTCTG GTGGA CCCCG AGCCT TTTGT GGCCC TGTGT

751 GAGAA GACTT TGTGT GAGTG TGCTG GGGGG CTGGA GTGCG CCTGC CCTGC751 GAGAA GACTT TGTGT GAGTG TGCTG GGGGG CTGGA GTGCG CCTGC CCTGC

801 CCTCC TGGAG TACGC CCGGA CCTGT GCCCA GGAGG GAATG GTGCT GTACG801 CCTCC TGGAG TACGC CCGGA CCTGT GCCCA GGAGG GAATG GTGCT GTACG

851 GCTGG ACCGA CCACA GCGCG TGCAG CCCAG TGTGC CCTGC TGGTA TGGAG851 GCTGG ACCGA CCACA GCGCG TGCAG CCCAG TGTGC CCTGC TGGTA TGGAG

901 TATAG GCAGT GTGTG TCCCC TTGCG CCAGG ACCTG CCAGA GCCTG CACAT901 TATAG GCAGT GTGTG TCCCC TTGCG CCAGG ACCTG CCAGA GCCTG CACAT

951 CAATG AAATG TGTCA GGAGC GATGC GTGGA TGGCT GCAGC TGCCC TGAGG951 CAATG AAATG TGTCA GGAGC GATGC GTGGA TGGCT GCAGC TGCCC TGAGG

1001 GACAG CTCCT GGATG AAGGC CTCTG CGTGG AGAGC ACCGA GTGTC CCTGC1001 GACAG CTCCT GGATG AAGGC CTCTG CGTGG AGAGC ACCGA GTGTC CCTGC

1051 GTGCA TTCCG GAAAG CGCTA CCCTC CCGGC ACCTC CCTCT CTCGA GACTG1051 GTGCA TTCCG GAAAG CGCTA CCCTC CCGGC ACCTC CCTCT CTCGA GACTG

1101 CAACA CCTGC ATTTG CCGAA ACAGC CAGTG GATCT GCAGC AATGA AGAAT1101 CAACA CCTGC ATTTG CCGAA ACAGC CAGTG GATCT GCAGC AATGA AGAAT

1151 GTCCA GGGGA GTGCC TTGTC ACTGG TCAAT CCCAC TTCAA GAGCT TTGAC1151 GTCCA GGGGA GTGCC TTGTC ACTGG TCAAT CCCAC TTCAA GAGCT TTGAC

1201 AACAG ATACT TCACC TTCAG TGGGA TCTGC CAGTA CCTGC TGGCC CGGGA1201 AACAG ATACT TCACC TTCAG TGGGA TCTGC CAGTA CCTGC TGGCC CGGGA

1251 TTGCC AGGAC CACTC CTTCT CCATT GTCAT TGAGA CTGTC CAGTG TGCTG1251 TTGCC AGGAC CACTC CTTCT CCATT GTCAT TGAGA CTGTC CAGTG TGCTG

1301 ATGAC CGCGA CGCTG TGTGC ACCCG CTCCG TCACC GTCCG GCTGC CTGGC1301 ATGAC CGCGA CGCTG TGTGC ACCCG CTCCG TCACC GTCCG GCTGC CTGGC

1351 CTGCA CAACA GCCTT GTGAA ACTGA AGCAT GGGGC AGGAG TTGCC ATGGA1351 CTGCA CAACA GCCTT GTGAA ACTGA AGCAT GGGGC AGGAG TTGCC ATGGA

1401 TGGCC AGGAC ATCCA GCTCC CCCTC CTGAA AGGTG ACCTC CGCAT CCAGC1401 TGGCC AGGAC ATCCA GCTCC CCCTC CTGAA AGGTG ACCTC CGCAT CCAGC

1451 АТАСА GTGAC GGCCT CCGTG CGCCT CAGCT ACGGG GAGGA CCTGC AGATG1451 ATASA GTGAC GGCCT CCGTG CGCCT CAGCT ACGGG GAGGA CCTGC AGATG

1501 GACTG GGATG GCCGC GGGAG GCTGC TGGTG AAGCT GTCCC CCGTC TATGC1501 GACTG GGATG GCCGC GGGAG GCTGC TGGTG AAGCT GTCCC CCGTC TATGC

1551 CGGGA AGACC TGCGG CCTGT GTGGG AATTA CAATG GCAAC CAGGG CGACG1551 CGGGA AGACC TGCGG CCTGT GTGGG AATTA CAATG GCAAC CAGGG CGACG

1601 ACTTC CTTAC CCCCT CTGGG CTGGC GGAGC CCCGG GTGGA GGACT TCGGG1601 ACTTC CTTAC CCCCT CTGGG CTGGC GGAGC CCCGG GTGGA GGACT TCGGG

1651 AACGC CTGGA AGCTG CACGG GGACT GCCAG GACCT GCAGA AGCAG CACAG1651 AACGC CTGGA AGCTG CACGG GGACT GCCAG GACCT GCAGA AGCAG CACAG

1701 CGATC CCTGC GCCCT CAACC CGCGC ATGAC CAGGT TCTCC GAGGA GGCGT1701 CGATC CCTGC GCCCT CAACC CGCGC ATGAC CAGGT TCTCC GAGGA GGCGT

1751 GCGCG GTCCT GACGT CCCCC ACATT CGAGG CCTGC CATCG TGCCG TCAGC1751 GCGCG GTCCT GACGT CCCCC ACATT CGAGG CCTGC CATCG TGCCG TCAGC

1801 CCGCT GCCCT ACCTG CGGAA CTGCC GCTAC GACGT GTGCT CCTGC TCGGA1801 CCGCT GCCCT ACCTG CGGAA CTGCC GCTAC GACGT GTGCT CCTGC TCGGA

1851 CGGCC GCGAG TGCCT GTGCG GCGCC CTGGC CAGCT ATGCC GCGGC CTGCG1851 CGGCC GCGAG TGCCT GTGCG GCGCC CTGGC CAGCT ATGCC GCGGC CTGCG

1901 CGGGG AGAGG CGTGC GCGTC GCGTG GCGCG AGCCA GGCCG CTGTG AGCTG1901 CGGGG AGAGG CGTGC GCGTC GCGTG GCGCG AGCCA GGCCG CTGTG AGCTG

1951 AACTG CCCGA AAGGC CAGGT GTACC TGCAG TGCGG GACCC CCTGC AACCT1951 AACTG CCCGA AAGGC CAGGT GTACC TGCAG TGCGG GACCC CCTGC AACCT

2001 GACCT GCCGC TCTCT CTCTT ACCCG GATGA GGAAT GCAAT GAGGC CTGCC2001 GACCT GCCGC TCTCT CTCTT ACCCG GATGA GGAAT GCAAT GAGGC CTGCC

2051 TGGAG GGCTG CTTCT GCCCC CCAGG GCTCT ACATG GATGA GAGGG GGGAC2051 TGGAG GGCTG CTTCT GCCCC CCAGG GCTCT ACATG GATGA GAGGG GGGAC

2101 TGCGT GCCCA AGGCC CAGTG CCCCT GTTAC TATGA CGGTG AGATC TTCCA2101 TGCGT GCCCA AGGCC CAGTG CCCCT GTTAC TATGA CGGTG AGATC TTCCA

- 68 041588- 68 041588

2151 GCCAG AAGAC ATCTT CTCAG АССАТ CACAC CATGT GCTAC TGTGA GGATG 2201 GCTTC ATGCA CTGTA GGATG AGTGG AGTCC CCGGA AGCTT GCTGC CTGAC 2251 GCTGT CCTCA GCAGT CCCCT GTCTC ATCGC AGCAA AAGGA GCCTA TCCTG 2301 TCGGC CCCCC ATGGT CAAGC TGGTG TGTCC CGCTG ACAAC CTGCG GGCTG 2351 AAGGG CTCGA GTGTA CCAAA ACGTG CCAGA АСТАТ GACCT GGAGT GGATG 2401 AGCAT GGGCT GTGTC TCTGG CTGCG TCTGC CCCCC GGGCA TGGTG CGGCA 2451 TGAGA ACAGA TGTGT GGCCC TGGAA AGGTG TCCCT GCTTC CATCA GGGCA 2501 AGGAG TATGC CGCTG GAGAA ACAGT GAAGA TTGGC TGGAA CACTT GTGTC 2551 TGTCG GGACC GGAAG TGGAA CTGCA CAGAC CATGT GTGTG ATGCC ACGTG 2601 CTCGA GGATG GGCAT GGCCC ACTAC CTGAC CTTCG ACGGG CTCAA ATACC 2651 TGTTC CCCGG GGAGT GCCAG TACGT TCTGG TGCAG GATTA CTGCG GCAGT 2701 AACCC TGGGA CCTTT CGGAT CCTAG TGGGG AATAA GGGAT GCAGC CACCC 2751 CTCAG TGAAA TGCAA GAAAC GGGTC АССАТ CCTGG TGGAG GGAGG AGAGA 2801 TTGAG CTGTT TGACG GGGAG GTGAA TGTGA AGAGG CCCAT GAAGG ATGAG 2851 ACTCA CTTTG AGGTG GTGGA GTCTG GCCGG TACAT CATTC TGCTG CTGGG 2901 CAAAG CCCTC TCCGT GGTCT GGGAC CGCCA CCTGA GCATC TCCGT GGTCC 2951 TGAAG CAGAC ATACC AGGAG AAAGT GTGTG GCCTG TGTGG GAATT TTGAT 3001 GGCAT CCAGA ACAAT GACCT САССА GCAGC AACCT CCAAG TGGAG GAAGA 3051 CGCTG TGGAG TTTGG GAACT CCTGG AAAGT GAGCT CGCAG TGTGG TGAGA 3101 CCAGA AAAGT GCCTC TGGAC TCATC CCCTG CCACC TGCCA TAACA ACATC 3151 ATGAA GCAGA CGATG GTGGA TTCCT CCTGT AGAAT CCTTA CCAGT GACGT 3201 CTTCC AGGAC TGCAA CAAGC TGGTG GACCC CGAGC CATAT CTGGA TGTCT 3251 GCATT TACGA CACCT GCTCC TGTGA GTCCA TTGGG GACTG CGCCG CATTC 3301 TGCGA САССА TTGCT GCCTA TGCCC ACGTG TGTGC CCAGC ATGGC AAGGT 3351 GGTGA CCTGG AGGAC GGCCA CATTG TGCCC CCAGA GCTGC GAGGA GAGGA 3401 ATCTC CGGGA GAACG GGTAT GAGGC TGAGT GGCGC TATAA CAGCT GTGCA 3451 CCTGC CTGTC AAGTC ACGTG TCAGC ACCCT GAGCC ACTGG CCTGC CCTGT 3501 GCAGT GTGTG GAGGG CTGCC ATGCC CACTG CCCTC CAGGG AAAAT CCTGG 3551 ATGAG CTTTT GCAGA CCTGC GTTGA CCCTG AAGAC TGTCC AGTGT GTGAG 3601 GTGGC TGGCC GGCGT TTTGC CTCAG GAAAG AAAGT CACCT TGAAT CCCAG 3651 TGACC CTGAG CACTG CCAGA TTTGC CACTG TGATG TTGTC AACCT CACCT 3701 GTGAA GCCTG CCAGG AGCCG ATATC GGGTA CCTCA GAGTC TGCTA CCCCC 3751 GAGTC AGGGC CAGGA TCAGA GCCAG CCACC TCCGG GTCTG AGACA CCCGG 3801 GACTT CCGAG AGTGC CACCC CTGAG TCCGG ACCCG GGTCC GAGCC CGCCA 3851 CTTCC GGCTC CGAAA CTCCC GGCAC AAGCG AGAGC GCTAC CCCAG AGTCA 3901 GGACC AGGAA CATCT ACAGA GCCCT CTGAA GGCTC CGCTC CAGGG TCCCC 3951 AGCCG GCAGT CCCAC TAGCA CCGAG GAGGG AACCT CTGAA AGCGC CACAC 4001 CCGAA TCAGG GCCAG GGTCT GAGCC TGCTA CCAGC GGCAG CGAGA САССА 4051 GGCAC CTCTG AGTCC GCCAC ACCAG AGTCC GGACC CGGAT CTCCC GCTGG 4101 GAGCC CCACC TCCAC TGAGG AGGGA TCTCC TGCTG GCTCT CCAAC ATCTA 4151 CTGAG GAAGG TACCT CAACC GAGCC ATCCG AGGGA TCAGC TCCCG GCACC 4201 TCAGA GTCGG CAACC CCGGA GTCTG GACCC GGAAC TTCCG AAAGT GCCAC 4251 ACCAG AGTCC GGTCC CGGGA CTTCA GAATC AGCAA CACCC GAGTC CGGCC 4301 CTGGG TCTGA ACCCG CCACA AGTGG TAGTG AGACA CCAGG ATCAG AACCT 4351 GCTAC CTCAG GGTCA GAGAC ACCCG GATCT CCGGC AGGCT САССА ACCTC 4401 CACTG AGGAG GGCAC GAGGA GAGAA CCAAG GGAGG GCTCC GCACC CGGAA 4451 CAAGC ACTGA ACCCA GTGAG GGTTC AGCAC CCGGC TCTGA GCCGG CCACA 4501 AGTGG CAGTG AGACA CCCGG CACTT CAGAG AGTGC CACCC CCGAG AGTGG 4551 CCCAG GCACT AGTAC CGAGC CCTCT GAAGG CAGTG CGCCA GATTC TGGCG 4601 GTGGA GGTTC CGGTG GCGGG GGATC CGGTG GCGGG GGATC CGGTG GCGGG 4651 GGATC CGGTG GCGGG GGATC CCTGG TCCCC CGGGG CAGCG GAGGC GACAA 4701 AACTC ACACA TGCCC ACCGT GCCCA GCTCC AGAAC TCCTG GGCGG ACCGT 4751 CAGTC TTCCT CTTCC CCCCA AAACC CAAGG ACACC CTCAT GATCT CCCGG 4801 ACCCC TGAGG TCACA TGCGT GGTGG TGGAC GTGAG CCACG AAGAC CCTGA 4851 GGTCA AGTTC AACTG GTACG TGGAC GGCGT GGAGG TGCAT AATGC CAAGA 4901 CAAAG CCGCG GGAGG AGCAG TACAA CAGCA CGTAC CGTGT GGTCA GCGTC 4951 CTCAC CGTCC TGCAC CAGGA CTGGC TGAAT GGCAA GGAGT ACAAG TGCAA 5001 GGTCT CCAAC AAAGC CCTCC CAGCC CCCAT CGAGA AAACC ATCTC CAAAG 5051 CCAAA GGGCA GCCCC GAGAA CCACA GGTGT ACACC CTGCC CCCAT CCCGG 5101 GATGA GCTGA CCAAG AACCA GGTCA GCCTG ACCTG CCTGG TCAAA GGCTT 5151 CTATC CCAGC GACAT CGCCG TGGAG TGGGA GAGCA ATGGG CAGCC GGAGA 5201 ACAAC TACAA GACCA CGCCT CCCGT GTTGG ACTCC GACGG CTCCT TCTTC 5251 CTCTA CAGCA AGCTC ACCGT GGACA AGAGC AGGTG GCAGC AGGGG AACGT 5301 CTTCT CATGC TCCGT GATGC ATGAG GCTCT GCACA ACCAC TACAC GCAGA2151 GCCAG AAGAC ATCTT CTCAG АССАТ CACAC CATGT GCTAC TGTGA GGATG 2201 GCTTC ATGCA CTGTA GGATG AGTGG AGTCC CCGGA AGCTT GCTGC CTGAC 2251 GCTGT CCTCA GCAGT CCCCT GTCTC ATCGC AGCAA AAGGA GCCTA TCCTG 2301 TCGGC CCCCC ATGGT CAAGC TGGTG TGTCC CGCTG ACAAC CTGCG GGCTG 2351 AAGGG CTCGA GTGTA CCAAA ACGTG CCAGA АСТАТ GACCT GGAGT GGATG 2401 AGCAT GGGCT GTGTC TCTGG CTGCG TCTGC CCCCC GGGCA TGGTG CGGCA 2451 TGAGA ACAGA TGTGT GGCCC TGGAA AGGTG TCCCT GCTTC CATCA GGGCA 2501 AGGAG TATGC CGCTG GAGAA ACAGT GAAGA TTGGC TGGAA CACTT GTGTC 2551 TGTCG GGACC GGAAG TGGAA CTGCA CAGAC CATGT GTGTG ATGCC ACGTG 2601 CTCGA GGATG GGCAT GGCCC ACTAC CTGAC CTTCG ACGGG CTCAA ATACC 2651 TGTTC CCCGG GGAGT GCCAG TACGT TCTGG TGCAG GATTA CTGCG GCAGT 2701 AACCC TGGGA CCTTT CGGAT CCTAG TGGGG AATAA GGGAT GCAGC CACCC 2751 CTCAG TGAAA TGCAA GAAAC GGGTC АССАТ CCTGG TGGAG GGAGG AGAGA 2801 TTGAG CTGTT TGACG GGGAG GTGAA TGTGA AGAGG CCCAT GAAGG ATGAG 2851 ACTCA CTTTG AGGTG GTGGA GTCTG GCCGG TACAT CATTC TGCTG CTGGG 2901 CAAAG CCCTC TCCGT GG TCT GGGAC CGCCA CCTGA GCATC TCCGT GGTCC 2951 TGAAG CAGAC ATACC AGGAG AAAGT GTGTG GCCTG TGTGG GAATT TTGAT 3001 GGCAT CCAGA ACAAT GACCT САССА GCAGC AACCT CCAAG TGGAG GAAGA 3051 CGCTG TGGAG TTTGG GAACT CCTGG AAAGT GAGCT CGCAG TGTGG TGAGA 3101 CCAGA AAAGT GCCTC TGGAC TCATC CCCTG CCACC TGCCA TAACA ACATC 3151 ATGAA GCAGA CGATG GTGGA TTCCT CCTGT AGAAT CCTTA CCAGT GACGT 3201 CTTCC AGGAC TGCAA CAAGC TGGTG GACCC CGAGC CATAT CTGGA TGTCT 3251 GCATT TACGA CACCT GCTCC TGTGA GTCCA TTGGG GACTG CGCCG CATTC 3301 TGCGA САССА TTGCT GCCTA TGCCC ACGTG TGTGC CCAGC ATGGC AAGGT 3351 GGTGA CCTGG AGGAC GGCCA CATTG TGCCC CCAGA GCTGC GAGGA GAGGA 3401 ATCTC CGGGA GAACG GGTAT GAGGC TGAGT GGCGC TATAA CAGCT GTGCA 3451 CCTGC CTGTC AAGTC ACGTG TCAGC ACCCT GAGCC ACTGG CCTGC CCTGT 3501 GCAGT GTGTG GAGGG CTGCC ATGCC CACTG CCCTC CAGGG AAAAT CCTGG 3551 ATGAG CTTTT GCAGA CCTGC GTTGA CCCTG AAGAC TGTCC AGTGT GTGAG 3601 GTGGC TGGCC GGCGT TTTGC CTCAG GAAAG AAAGT CACCT TGAAT CCCAG 3651 TGACC CTGAG CACTG CCAGA TTTGC CACTG TGATG TTG TC AACCT CACCT 3701 GTGAA GCCTG CCAGG AGCCG ATATC GGGTA CCTCA GAGTC TGCTA CCCCC 3751 GAGTC AGGGC CAGGA TCAGA GCCAG CCACC TCCGG GTCTG AGACA CCCGG 3801 GACTT CCGAG AGTGC CACCC CTGAG TCCGG ACCCG GGTCC GAGCC CGCCA 3851 CTTCC GGCTC CGAAA CTCCC GGCAC AAGCG AGAGC GCTAC CCCAG AGTCA 3901 GGACC AGGAA CATCT ACAGA GCCCT CTGAA GGCTC CGCTC CAGGG TCCCC 3951 AGCCG GCAGT CCCAC TAGCA CCGAG GAGGG AACCT CTGAA AGCGC CACAC 4001 CCGAA TCAGG GCCAG GGTCT GAGCC TGCTA CCAGC GGCAG CGAGA САССА 4051 GGCAC CTCTG AGTCC GCCAC ACCAG AGTCC GGACC CGGAT CTCCC GCTGG 4101 GAGCC CCACC TCCAC TGAGG AGGGA TCTCC TGCTG GCTCT CCAAC ATCTA 4151 CTGAG GAAGG TACCT CAACC GAGCC ATCCG AGGGA TCAGC TCCCG GCACC 4201 TCAGA GTCGG CAACC CCGGA GTCTG GACCC GGAAC TTCCG AAAGT GCCAC 4251 ACCAG AGTCC GGTCC CGGGA CTTCA GAATC AGCAA CACCC GAGTC CGGCC 4301 CTGGG TCTGA ACCCG CCACA AGTGG TAGTG AGACA CCAGG ATCAG AACCT 4351 GCTAC CTCAG GGTCA GAGAC ACCCG GATCT CCGGC AGGCT CACCA ACCTC 4401 CACTG AGGAG GGCAC GAGGA GAGAA CCAAG GGAGG GCTCC GCACC CGGAA 4451 CAAGC ACTGA ACCCA GTGAG GGTTC AGCAC CCGGC TCTGA GCCGG CCACA 4501 AGTGG CAGTG AGACA CCCGG CACTT CAGAG AGTGC CACCC CCGAG AGTGG 4551 CCCAG GCACT AGTAC CGAGC CCTCT GAAGG CAGTG CGCCA GATTC TGGCG 4601 GTGGA GGTTC CGGTG GCGGG GGATC CGGTG GCGGG GGATC CGGTG GCGGG 4651 GGATC CGGTG GCGGG GGATC CCTGG TCCCC CGGGG CAGCG GAGGC GACAA 4701 AACTC ACACA TGCCC ACCGT GCCCA GCTCC AGAAC TCCTG GGCGG ACCGT 4751 CAGTC TTCCT CTTCC CCCCA AAACC CAAGG ACACC CTCAT GATCT CCCGG 4801 ACCCC TGAGG TCACA TGCGT GGTGG TGGAC GTGAG CCACG AAGAC CCTGA 4851 GGTCA AGTTC AACTG GTACG TGGAC GGCGT GGAGG TGCAT AATGC CAAGA 4901 CAAAG CCGCG GGAGG AGCAG TACAA CAGCA CGTAC CGTGT GGTCA GCGTC 4951 CTCAC CGTCC TGCAC CAGGA CTGGC TGAAT GGCAA GGAGT ACAAG TGCAA 5001 GGTCT CCAAC AAAGC CCTCC CAGCC CCCAT CGAGA AAACC ATCTC CAAAG 5051 CCAAA GGGCA GCCCC GAGAA CCACA GGTGT ACACC CTGCC CCCAT CCCGG 5101 GATGA GCTGA CCAAG AACCA GGTCA GCCTG ACCTG CCTGG TCAAA GGCTT 5151 CTATC CCAGC GACAT CGCCG TGGAG TGGGA GAGCA ATGGG CAGCC GGAGA 5201 ACAAC TACAA GACCA CGCCT CCCGT GTTGG ACTCC GACGG CTCCT TCTTC 5251 CTCTA CAGCA AGCTC ACCGT GGACA AGAGC AGGTG GCAGC AGGGG AACGT 5301 CTTCT CATGC TCCGT GATGC ATGAG GCTCT GCACA ACCAC TACAC GCAGA

--

Claims (20)

5351 AGAGC CTCTC CCTGT CTCCG GGTAA ATGA5351 AGAGC CTCTC CCTGT CTCCG GGTAA ATGA Белковая последовательность VWF034 (SEQ ID NO: 92)Protein sequence VWF034 (SEQ ID NO: 92) 1 MIPARFAGVL LALALILPGT LCAEGTRGRS STARCSLFGS DFVNTFDGSM1 MIPARFAGVL LALALILPGT LCAEGTRGRS STARCSLFGS DFVNTFDGSM 51 YSFAGYCSYL LAGGCQKRSF SIIGDFQNGK RVSLSVYLGE FFDIHLFVNG51 YSFAGYCSYL LAGGCQKRSF SIIGDFQNGK RVSLSVYLGE FFDIHLFVNG 101 TVTQGDQRVS MPYASKGLYL ETEAGYYKLS GEAYGFVARI DGSGNFQVLL101 TVTQGDQRVS MPYASKGLYL ETEAGYYKLS GEAYGFVARI DGSGNFQVLL 151 SDRYFNKTCG LCGNFNIFAE DDFMTQEGTL TSDPYDFANS WALSSGEQWC151 SDRYFNKTCG LCGNFNIFAE DDFMTQEGTL TSDPYDFANS WALSSGEQWC 201 ERASPPSSSC NISSGEMQKG LWEQCQLLKS TSVFARCHPL VDPEPFVALC201 ERASPPSSSC NISSGEMQKG LWEQCQLLKS TSVFARCHPL VDPEPFVALC 251 EKTLCECAGG LECACPALLE YARTCAQEGM VLYGWTDHSA CSPVCPAGME251 EKTLCECAGG LECACPALLE YARTCAQEGM VLYGWTDHSA CSPVCPAGME 301 YRQCVSPCAR TCQSLHINEM CQERCVDGCS CPEGQLLDEG LCVESTECPC301 YRQCVSPCAR TCQSLHINEM CQERCVDGCS CPEGQLLDEG LCVESTECPC 351 VHSGKRYPPG TSLSRDCNTC ICRNSQWICS NEECPGECLV TGQSHFKSFD351 VHSGKRYPPG TSLSRDCNTC ICRNSQWICS NEECPGECLV TGQSHFKSFD 401 NRYFTFSGIC QYLLARDCQD HSFSIVIETV QCADDRDAVC TRSVTVRLPG401 NRYFTFSGIC QYLLARDCQD HSFSIVIETV QCADDRDAVC TRSVTVRLPG 451 LHNSLVKLKH GAGVAMDGQD IQLPLLKGDL RIQHTVTASV RLSYGEDLQM451 LHNSLVKLKH GAGVAMDGQD IQLPLLKGDL RIQHTVTASV RLSYGEDLQM 501 DWDGRGRLLV KLSPVYAGKT CGLCGNYNGN QGDDFLTPSG LAEPRVEDFG501 DWDGRGRLLV KLSPVYAGKT CGLCGNYNGN QGDDFLTPSG LAEPRVEDFG 551 NAWKLHGDCQ DLQKQHSDPC ALNPRMTRFS EEACAVLTSP TFEACHRAVS551 NAWKLHGDCQ DLQKQHSDPC ALNPRMTRFS EEACAVLTSP TFEACHRAVS 601 PLPYLRNCRY DVCSCSDGRE CLCGALASYA AACAGRGVRV AWREPGRCEL601 PLPYLRNCRY DVCSCSDGRE CLCGALASYA AACAGRGVRV AWREPGRCEL 651 NCPKGQVYLQ CGTPCNLTCR SLSYPDEECN EACLEGCFCP PGLYMDERGD651 NCPKGQVYLQ CGTPCNLTCR SLSYPDEECN EACLEGCFCP PGLYMDERGD 701 CVPKAQCPCY YDGEIFQPED IFSDHHTMCY CEDGFMHCTM SGVPGSLLPD701 CVPKAQCPCY YDGEIFQPED IFSDHHTMCY CEDGFMHCTM SGVPGSLLPD 751 AVLSSPLSHR SKRSLSCRPP MVKLVCPADN LRAEGLECTK TCQNYDLECM751 AVLSSPLSHR SKRSLSCRPP MVKLVCPADN LRAEGLECTK TCQNYDLECM 801 SMGCVSGCLC PPGMVRHENR CVALERCPCF HQGKEYAPGE TVKIGCNTCV801 SMGCVSGCLC PPGMVRHENR CVALERCPCF HQGKEYAPGE TVKIGCNTCV 851 CRDRKWNCTD HVCDATCSTI GMAHYLTFDG LKYLFPGECQ YVLVQDYCGS851 CRDRKWNCTD HVCDATCSTI GMAHYLTFDG LKYLFPGECQ YVLVQDYCGGS 901 NPGTFRILVG NKGCSHPSVK CKKRVTILVE GGEIELFDGE VNVKRPMKDE901 NPGTFRILVG NKGCSHPSVK CKKRVTILVE GGEIELFGE VNVKRPMKDE 951 THFEWESGR YIILLLGKAL SWWDRHLSI SWLKQTYQE KVCGLCGNFD951 THFEWESGR YIILLLGKAL SWWDRHLSI SWLKQTYQE KVCGLCGNFD 1001 GIQNNDLTSS NLQVEEDPVD FGNSWKVSSQ CADTRKVPLD SSPATCHNNI1001 GIQNNDLTSS NLQVEEDPVD FGNSWKVSSQ CADTRKVPLD SSPATCHNNI 1051 MKQTMVDSSC RILTSDVFQD CNKLVDPEPY LDVCIYDTCS CESIGDCAAF1051 MKQTMVDSSC RILTSDVFQD CNKLVDPEPY LDVCIYDTCS CESIGDCAAF 1101 CDTIAAYAHV CAQHGKWTW RTATLCPQSC EERNLRENGY EAEWRYNSCA1101 CDTIAAYAHV CAQHGKWTW RTATLCPQSC EERNLRENGY EAEWRYNSCA 1151 PACQVTCQHP EPLACPVQCV EGCHAHCPPG KILDELLQTC VDPEDCPVCE1151 PACQVTCQHP EPLACPVQCV EGCHAHCPPG KILDELLQTC VDPEDCPVCE 1201 VAGRRFASGK KVTLNPSDPE HCQICHCDW NLTCEACQEP ISGTSESATP1201 VAGRRFASGK KVTLNPSDPE HCQICHCDW NLTCEACQEP ISGTSESATP 1251 ESGPGSEPAT SGSETPGTSE SATPESGPGS EPATSGSETP GTSESATPES1251 ESGPGSEPAT SGSETPGTSE SATPESGPGS EPATSGSETP GTSESATPES 1301 GPGTSTEPSE GSAPGSPAGS PTSTEEGTSE SATPESGPGS EPATSGSETP1301 GPGTSTEPSE GSAPGSPAGS PTSTEEGTSE SATPESGPGS EPATSGSETP 1351 GTSESATPES GPGSPAGSPT STEEGSPAGS PTSTEEGTST EPSEGSAPGT1351 GTSESATPES GPGSPAGSPT STEEGSPAGS PTSTEEGTST EPSEGSAPGT 1401 SESATPESGP GTSESATPES GPGTSESATP ESGPGSEPAT SGSETPGSEP1401 SESATPESGP GTSESATPES GPGTSESATP ESGPGSEPAT SGSETPGSEP 1451 ATSGSETPGS PAGSPTSTEE GTSTEPSEGS APGTSTEPSE GSAPGSEPAT1451 ATSGSETPGS PAGSPTSTEE GTSTEPSEGS APGTSTEPS GSAPGSEPAT 1501 SGSETPGTSE SATPESGPGT STEPSEGSAP DIGGGGGSGG GGSLVPRGSG1501 SGSETPGTSE SATPESGPGT STEPSEGSAP DIGGGGGSGG GGSLVPRGSG 1551 GDKTHTCPPC PAPELLGGPS VFLFPPKPKD TLMISRTPEV TCVWDVSHE1551 GDKTHTCPPC PAPELLGGPS VFLFPPKPKD TLMISRTPEV TCVWDVSHE 1601 DPEVKFNWYV DGVEVHNAKT KPREEQYNST YRWSVLTVL HQDWLNGKEY1601 DPEVKFNWYV DGVEVHNAKT KPREEQYNST YRWSVLTVL HQDWLNGKEY 1651 KCKVSNKALP APIEKTISKA KGQPREPQVY TLPPSRDELT KNQVSLTCLV1651 KCKVSNKALP APIEKTISKA KGQPREPQVY TLPPSRDELT KNQVSLTCLV 1701 KGFYPSDIAV EWESNGQPEN NYKTTPPVLD SDGSFFLYSK LTVDKSRWQQ1701 KGFYPSDIAV EWESNGQPEN NYKTTPPVLD SDGSFFLYSK LTVDKSRWQQ 1751 GNVFSCSVMH EALHNHYTQK SLSLSPGK*1751 GNVFSCSVMH EALHNHYTQK SLSLSPGK* Приведенное выше описание конкретных вариантов реализации настолько полно раскрывает общий смысл изобретения, что посторонние лица смогут, используя знания, доступные специалистам в данной области техники, легко модифицировать и/или адаптировать для различных применений такие конкретные варианты реализации изобретения без ненадлежащего экспериментирования, не отходя от общей идеи настоящего изобретения. Таким образом, такие адаптации и модификации рассматриваются как не выходящие за пределы значений и объема эквивалентов раскрытых вариантов реализации изобретения на основании описания и рекомендаций, приведенных в данном документе. Следует понимать, что фразеология или терминология в данном документе используются в целях описания, а не ограничения, так что терминология или фразеология данного описания заявки должны рассматриваться квалифицированным специалистом в свете описания и рекомендаций.The foregoing description of the specific embodiments discloses the general meaning of the invention so fully that outsiders will be able, using the knowledge available to those skilled in the art, to easily modify and/or adapt for various applications such specific embodiments of the invention without undue experimentation, without deviating from the general ideas of the present invention. Thus, such adaptations and modifications are considered to be within the meaning and scope of the equivalents of the disclosed embodiments based on the description and guidance provided herein. It should be understood that the phraseology or terminology in this document is used for purposes of description and not limitation, so that the terminology or phraseology of this application specification should be considered by the skilled artisan in light of the description and guidance. Другие варианты реализации изобретения будут очевидны квалифицированным специалистам в данной области техники из описания заявки и практики изобретения, раскрытых в данном документе. Следует понимать, что описание заявки и примеры должны рассматриваться только как иллюстративные, а действительные объем и сущность изобретения определяются приведенной далее формулой изобретения. Все патенты и публикации, приведенный в данном документе, включены в него в качестве ссылок в полном объеме.Other embodiments of the invention will be apparent to those skilled in the art from the description of the application and the practice of the invention disclosed herein. It should be understood that the description of the application and the examples are to be considered as illustrative only, and the actual scope and essence of the invention is defined by the following claims. All patents and publications cited in this document are incorporated herein by reference in their entirety. Данная заявка заявляет приоритет по предварительной заявке на патент США № 61/840872, поданной 28 июня 2013 г. Содержание вышеуказанной заявки включено в данный документ в качестве ссылки в полном объеме.This application claims priority over U.S. Provisional Application No. 61/840872, filed June 28, 2013. The contents of the above application are incorporated herein by reference in their entirety. ФОРМУЛА ИЗОБРЕТЕНИЯCLAIM 1. Химерная молекула, способная связываться с белком FVIII и содержащая белок фактора фон Виллебранда (VWF), гетерологичный фрагмент (H1), последовательность удлиненного рекомбинантного полипептида (XTEN) и линкер VWF, соединяющий белок VWF с гетерологичным фрагментом, причем белок VWF содержит домен D' и домен D3 VWF; причем линкер VWF содержит область а2 из фактора VIII (FVIII); причем последовательность XTEN соединена с белком VWF, гетерологичным фрагментом (H1), линкером VWF или любой их комбинацией.1. A chimeric molecule capable of binding to the FVIII protein and containing a von Willebrand factor (VWF) protein, a heterologous fragment (H1), an extended recombinant polypeptide sequence (XTEN) and a VWF linker connecting the VWF protein to the heterologous fragment, the VWF protein containing the D domain ' and D3 VWF domain; wherein the VWF linker contains the a2 region of factor VIII (FVIII); wherein the XTEN sequence is linked to a VWF protein, a heterologous fragment (H1), a VWF linker, or any combination thereof. 2. Химерная молекула по п.1, отличающаяся тем, что последовательность XTEN соединяет белок VWF с линкером VWF или линкер VWF с гетерологичным фрагментом.2. A chimeric molecule according to claim 1, characterized in that the XTEN sequence connects the VWF protein to a VWF linker or the VWF linker to a heterologous fragment. 3. Химерная молекула по п.1 или 2, дополнительно содержащая вторую полипептидную цепь, которая содержит белок FVIII, причем первая полипептидная цепь представляет собой химерную молекулу, состоящую из белка VWF, гетерологичного фрагмента (H1), и обе цепи ассоциированы друг с другом.3. A chimeric molecule according to claim 1 or 2, further comprising a second polypeptide chain that contains the FVIII protein, wherein the first polypeptide chain is a chimeric molecule consisting of a VWF protein, a heterologous fragment (H1), and both chains are associated with each other. 4. Химерная молекула по п.3, отличающаяся тем, что белок FVIII дополнительно содержит дополнительную последовательность XTEN.4. Chimeric molecule according to claim 3, characterized in that the FVIII protein additionally contains an additional XTEN sequence. - 70 041588- 70 041588 5. Химерная молекула по п.3 или 4, отличающаяся тем, что вторая полипептидная цепь дополнительно содержит второй гетерологичный фрагмент (Н2).5. Chimeric molecule according to claim 3 or 4, characterized in that the second polypeptide chain additionally contains a second heterologous fragment (H2). 6. Химерная молекула, способная связываться с белком FVIII и содержащая первую полипептидную цепь, которая содержит белок VWF, гетерологичный фрагмент (H1) и линкер VWF, соединяющий белок VWF и гетерологичный фрагмент (H1), и вторую полипептидную цепь, содержащую белок FVIII и последовательность XTEN, причем белок VWF содержит домен D' и домен D3 VWF;6. A chimeric molecule capable of binding to the FVIII protein and containing a first polypeptide chain that contains the VWF protein, a heterologous fragment (H1) and a VWF linker connecting the VWF protein and a heterologous fragment (H1), and a second polypeptide chain containing the FVIII protein and the sequence XTEN, wherein the VWF protein contains a D' domain and a VWF D3 domain; причем линкер VWF в первой полипептидной цепи содержит область а2 из фактора VIII (FVIII); причем первая полипептидная цепь и вторая полипептидная цепь ассоциированы друг с другом.moreover, the VWF linker in the first polypeptide chain contains the a2 region of factor VIII (FVIII); wherein the first polypeptide chain and the second polypeptide chain are associated with each other. 7. Химерная молекула по п.6, содержащая дополнительную последовательность XTEN, которая соединена с белком VWF, гетерологичным фрагментом, линкером VWF или любой их комбинацией.7. A chimeric molecule according to claim 6 containing an additional XTEN sequence that is fused to a VWF protein, a heterologous fragment, a VWF linker, or any combination thereof. 8. Химерная молекула по п.6 или 7, содержащая второй гетерологичный фрагмент (Н2), соединенный с белком FVIII, последовательностью XTEN или обоими.8. A chimeric molecule according to claim 6 or 7, containing a second heterologous fragment (H2) linked to the FVIII protein, the XTEN sequence, or both. 9. Химерная молекула по любому из пп.1-8, отличающаяся тем, что по меньшей одна из последовательностей XTEN содержит около 42 аминокислот, около 72 аминокислот, около 108 аминокислот, около 144 аминокислот, около 180 аминокислот, около 216 аминокислот, около 252 аминокислот, около 288 аминокислот, около 324 аминокислот, около 360 аминокислот, около 396 аминокислот, около 432 аминокислот, около 468 аминокислот, около 504 аминокислот, около 540 аминокислот, около 576 аминокислот, около 612 аминокислот, около 624 аминокислот, около 648 аминокислот, около 684 аминокислот, около 720 аминокислот, около 756 аминокислот, около 792 аминокислот, около 828 аминокислот, около 836 аминокислот, около 864 аминокислот, около 875 аминокислот, около 912 аминокислот, около 923 аминокислот, около 948 аминокислот, около 1044 аминокислот, около 1140 аминокислот, около 1236 аминокислот, около 1318 аминокислот, около 1332 аминокислоты, около 1428 аминокислот, около 1524 аминокислот, около 1620 аминокислот, около 1716 аминокислот, около 1812 аминокислот, около 1908 аминокислот или около 2004 аминокислот.9. A chimeric molecule according to any one of claims 1 to 8, characterized in that at least one of the XTEN sequences contains about 42 amino acids, about 72 amino acids, about 108 amino acids, about 144 amino acids, about 180 amino acids, about 216 amino acids, about 252 amino acids, about 288 amino acids, about 324 amino acids, about 360 amino acids, about 396 amino acids, about 432 amino acids, about 468 amino acids, about 504 amino acids, about 540 amino acids, about 576 amino acids, about 612 amino acids, about 624 amino acids, about 648 amino acids, about 684 amino acids, about 720 amino acids, about 756 amino acids, about 792 amino acids, about 828 amino acids, about 836 amino acids, about 864 amino acids, about 875 amino acids, about 912 amino acids, about 923 amino acids, about 948 amino acids, about 1044 amino acids, about 1140 amino acids, about 1236 amino acids, about 1318 amino acids, about 1332 amino acids, about 1428 amino acids, about 1524 amino acids, about 1620 amino acids, approx. about 1716 amino acids, about 1812 amino acids, about 1908 amino acids, or about 2004 amino acids. 10. Химерная молекула по любому из пп.1-9, отличающаяся тем, что по меньшей мере одна последовательность XTEN выбрана из АЕ42, АЕ72, АЕ864, АЕ576, АЕ288, АЕ144, AG864, AG576, AG288, AG144, SEQ ID NO: 39; SEQ ID NO: 40; SEQ ID NO: 47; SEQ ID NO: 45; SEQ ID NO: 44; SEQ ID NO: 41; SEQ ID NO: 48; SEQ ID NO: 46, SEQ ID NO: 44 и SEQ ID NO: 42.10. Chimeric molecule according to any one of claims 1 to 9, characterized in that at least one XTEN sequence is selected from AE42, AE72, AE864, AE576, AE288, AE144, AG864, AG576, AG288, AG144, SEQ ID NO: 39 ; SEQ ID NO: 40; SEQ ID NO: 47; SEQ ID NO: 45; SEQ ID NO: 44; SEQ ID NO: 41; SEQ ID NO: 48; SEQ ID NO: 46, SEQ ID NO: 44 and SEQ ID NO: 42. 11. Химерная молекула по любому из пп.1-10, отличающаяся тем, что линкер VWF содержит указанную область а2, которая содержит аминокислотную последовательность, по меньшей мере на около 90, около 95 или на 100% идентичную участку от Glu720 по Arg740, соответствующим полноразмерному FVIII, причем область а2 способна расщепляться тромбином.11. Chimeric molecule according to any one of claims 1 to 10, characterized in that the VWF linker contains the specified a2 region, which contains an amino acid sequence of at least about 90, about 95 or 100% identical to the section from Glu720 to Arg740 corresponding to full-length FVIII, and the a2 region is able to be cleaved by thrombin. 12. Химерная молекула по п.11, отличающаяся тем, что линкер VWF содержит область а2, содержащую SEQ ID NO: 4.12. A chimeric molecule according to claim 11, characterized in that the VWF linker contains an a2 region containing SEQ ID NO: 4. 13. Химерная молекула по любому из пп.1-12, отличающаяся тем, что (а) домен D' белка VWF содержит аминокислотную последовательность, по меньшей мере на около 90, около 95, около 96, около 97, около 98, около 99 или на 100% идентичную аминокислотам 764-866 последовательности SEQ ID NO: 2; (b) домен D3 белка VWF содержит аминокислотную последовательность, по меньшей мере на около 90, около 95, около 96, около 97, около 98, около 99 или на 100% идентичную аминокислотам 8671240 последовательности SEQ ID NO: 2; или как (а), так и (b).13. A chimeric molecule according to any one of claims 1 to 12, characterized in that (a) the D' domain of the VWF protein contains an amino acid sequence of at least about 90, about 95, about 96, about 97, about 98, about 99 or 100% identical to amino acids 764-866 of the sequence of SEQ ID NO: 2; (b) the D3 domain of the VWF protein contains an amino acid sequence that is at least about 90, about 95, about 96, about 97, about 98, about 99, or 100% identical to amino acids 8671240 of SEQ ID NO: 2; or both (a) and (b). 14. Химерная молекула по любому из пп.1-13, отличающаяся тем, что последовательность белка VWF содержит аминокислоты 764-1240 последовательности SEQ ID NO: 2.14. A chimeric molecule according to any one of claims 1-13, characterized in that the VWF protein sequence contains amino acids 764-1240 of SEQ ID NO: 2. 15. Химерная молекула по п.14, отличающаяся тем, что белок VWF дополнительно содержит домен VWF, выбранный из группы, состоящей из домена D1, домена D2, доменов D1 и D2, домена А1, домена А2, домена A3, домена D4, домена В1, домена В2, домена В3, домена С1, домена С2, домена CK, одного или более их фрагментов и любых их комбинаций.15. Chimeric molecule according to claim 14, characterized in that the VWF protein further comprises a VWF domain selected from the group consisting of a D1 domain, a D2 domain, D1 and D2 domains, an A1 domain, an A2 domain, an A3 domain, a D4 domain, a domain B1, B2 domain, B3 domain, C1 domain, C2 domain, CK domain, one or more fragments thereof, and any combination thereof. 16. Химерная молекула по любому из пп.1-15, отличающаяся тем, что белок VWF состоит из: (1) доменов D' и D3 VWF или их фрагментов; (2) доменов D1, D' и D3 VWF или их фрагментов; (3) доменов D2, D' и D3 VWF или их фрагментов; (4) доменов D1, D2, D' и D3 VWF или их фрагментов; или (5) доменов D1, D2, D', D3 и A1 VWF или их фрагментов.16. A chimeric molecule according to any one of claims 1 to 15, characterized in that the VWF protein consists of: (1) VWF D' and D3 domains or fragments thereof; (2) VWF D1, D' and D3 domains or fragments thereof; (3) VWF D2, D' and D3 domains or fragments thereof; (4) VWF D1, D2, D' and D3 domains or fragments thereof; or (5) VWF D1, D2, D', D3 and A1 domains or fragments thereof. 17. Химерная молекула по любому из пп.1-16, отличающаяся тем, что гетерологичный фрагмент (H1) содержит константную область иммуноглобулина или ее участок; тем, что второй гетерологичный фрагмент (Н2) содержит константную область иммуноглобулина или ее участок; или тем, что H1 и Н2 оба содержат константную область иммуноглобулина.17. A chimeric molecule according to any one of claims 1 to 16, characterized in that the heterologous fragment (H1) contains an immunoglobulin constant region or a portion thereof; the fact that the second heterologous fragment (H2) contains the constant region of the immunoglobulin or its plot; or that H1 and H2 both contain an immunoglobulin constant region. 18. Химерная молекула по п.16, отличающаяся тем, что первый гетерологичный фрагмент (H1) содержит Fc-область; тем, что второй гетерологичный фрагмент (Н2) содержит Fc-область; или тем, что H1 и Н2 оба содержат Fc-область.18. A chimeric molecule according to claim 16, characterized in that the first heterologous fragment (H1) contains an Fc region; in that the second heterologous fragment (H2) contains an Fc region; or that H1 and H2 both contain an Fc region. 19. Химерная молекула по любому из пп.5 и 8-18, отличающаяся тем, что первый гетерологичный фрагмент (H1) представляет собой Fc-область и второй гетерологичный фрагмент (Н2) представляет собой Fc-область, причем H1 и Н2 ассоциированы друг с другом с помощью ковалентной связи.19. A chimeric molecule according to any one of claims 5 and 8-18, characterized in that the first heterologous fragment (H1) is an Fc region and the second heterologous fragment (H2) is an Fc region, wherein H1 and H2 are associated with each other. another through a covalent bond. 20. Полинуклеотид, кодирующий химерную молекулу по любому из пп.1-19 или комплементарную ей последовательность.20. A polynucleotide encoding a chimeric molecule according to any one of claims 1 to 19 or its complementary sequence. --
EA201592022 2013-06-28 2014-06-27 THROMBIN CLEAVABLE LINKER CONTAINING XTEN AND ITS USE EA041588B1 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US61/840,872 2013-06-28

Publications (1)

Publication Number Publication Date
EA041588B1 true EA041588B1 (en) 2022-11-09

Family

ID=

Similar Documents

Publication Publication Date Title
US20240083975A1 (en) Thrombin cleavable linker with xten and its uses thereof
US20220275057A1 (en) Factor viii chimeric proteins and uses thereof
US20210261607A1 (en) Purification of chimeric fviii molecules
US20190375822A1 (en) Methods of treating hemophilia a
WO2014210547A1 (en) Thrombin cleavable linker
KR102175878B1 (en) Chimeric proteins containing FVIII and VWF factors and uses thereof
RU2812863C2 (en) Treatment methods for hemophilia a
EA041588B1 (en) THROMBIN CLEAVABLE LINKER CONTAINING XTEN AND ITS USE
EA044115B1 (en) CHIMERIC FACTOR VIII PROTEINS AND THEIR APPLICATION