EA046419B1 - MINIATURIZED DYSTROPHINS AND THEIR APPLICATIONS - Google Patents

MINIATURIZED DYSTROPHINS AND THEIR APPLICATIONS Download PDF

Info

Publication number
EA046419B1
EA046419B1 EA202191123 EA046419B1 EA 046419 B1 EA046419 B1 EA 046419B1 EA 202191123 EA202191123 EA 202191123 EA 046419 B1 EA046419 B1 EA 046419B1
Authority
EA
Eurasian Patent Office
Prior art keywords
domain
seq
dystrophin
spectrin repeat
polypeptide
Prior art date
Application number
EA202191123
Other languages
Russian (ru)
Inventor
Глен Бэнкс
Джонатан Гарри Дэвис
Пол Чарлз Левескью
Original Assignee
Бристол-Майерс Сквибб Компани
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Бристол-Майерс Сквибб Компани filed Critical Бристол-Майерс Сквибб Компани
Publication of EA046419B1 publication Critical patent/EA046419B1/en

Links

Description

Ссылка на родственные заявкиLink to related applications

В данном изобретении испрашивается приоритет по предварительной заявке США № 62/749982, поданной 24 октября 2018 г., которая полностью включена в настоящий документ посредством ссылки.This invention claims benefit to U.S. Provisional Application No. 62/749982, filed October 24, 2018, which is incorporated herein by reference in its entirety.

1. Область техники изобретения1. Technical field of the invention

Раскрытый в данном документе предмет изобретения в целом относится к полинуклеотидам, полипептидам, клеткам, векторам, применениям и наборам, относящимся к миниатюризированному дистрофину.The subject matter disclosed herein generally relates to polynucleotides, polypeptides, cells, vectors, applications and kits related to miniaturized dystrophin.

2. Уровень техники2. State of the art

Мышечная дистрофия Дюшенна (DMD) является рецессивно-наследственным, приводящим к атрофии мышц заболеванием, которое поражает приблизительно 1 из 3500 мужчин. DMD вызывается мутациями в гене дистрофина, который расположен на Х-хромосоме. Мутации в данном гене приводят к аберрантной или отсутствующей экспрессии белка дистрофина.Duchenne muscular dystrophy (DMD) is a recessively inherited muscle-wasting disorder that affects approximately 1 in 3,500 men. DMD is caused by mutations in the dystrophin gene, which is located on the X chromosome. Mutations in this gene result in aberrant or absent expression of the dystrophin protein.

Дистрофин представляет собой ключевой компонент белкового комплекса, который отвечает за регулирование целостности и функции мышечных клеток. Пациенты с DMD обычно в детстве теряют способность физически поддерживать себя и со временем становятся все слабее. Такое прогрессивное истощение скелетных мышц и сердечной дисфункции обычно приводят к потере возможности передвигаться и преждевременной смерти, в первую очередь, из-за сердечной или дыхательной недостаточности. В прошлом предпринимались попытки лечения DMD. Однако, доступные варианты лечения были значительно ограничены из-за большого размера комплементарной ДНК (кДНК) (приблизительно 13,9 тысяч пар нуклеотидов (т.п.н.)) дистрофина дикого типа, которую нельзя вводить пациентам с DMD и экспрессировать у них с использованием стандартных вирусных векторов, включая аденоассоциированный вирус (AAV), который не может переносить более 4,9 т.п.н. гетерологичной ДНК. Следовательно, существует потребность в разработке рекомбинантного гена дистрофина, который можно было бы эффективно упаковать в вектор для генной терапии. Было показано, что векторы аденоассоциированного вируса (AAV) применимы в подходах генной терапии, направленных на исправление генетических недостатков, приводящих к понижению уровней экспрессии белка или ее отсутствию (Nathwani et al. - A.M. Keeler et al.), и потенциально применимы для нокдауна генов, редактирования или модификации генома и модуляции некодирующей РНК (Valdmanis et al., 2017). Упаковка всей кДНК мышечно-специфической изоформы дистрофина в один капсид rAAV не может быть легко обеспечена из-за большого размера кДНК дистрофина. Предыдущие исследования были сосредоточены на разработке небольших генетических конструкций, которые экспрессируют только определенные домены дистрофина. См. патенты США №№ 6869777 и 8501920, каждый из которых включен посредством ссылки. Однако данные подходы имели лишь ограниченный успех. Остается потребность в более точных и эффективных инструментах генной терапии для лечения пациентов с мутациями в гене дистрофина, и, в частности, потребность в разработке рекомбинантного гена дистрофина, который может быть эффективно упакован в вектор для генной терапии.Dystrophin is a key component of a protein complex that is responsible for regulating the integrity and function of muscle cells. Patients with DMD typically lose the ability to physically support themselves during childhood and become increasingly weaker over time. This progressive skeletal muscle wasting and cardiac dysfunction usually lead to loss of ambulation and premature death, primarily due to cardiac or respiratory failure. Treatments for DMD have been attempted in the past. However, available treatment options have been significantly limited due to the large size of the complementary DNA (cDNA) (approximately 13.9 kilobase pairs (kb)) of wild-type dystrophin, which cannot be administered to patients with DMD and cannot be expressed in them with using standard viral vectors, including adeno-associated virus (AAV), which cannot transport more than 4.9 kb. heterologous DNA. Therefore, there is a need to develop a recombinant dystrophin gene that can be efficiently packaged into a gene therapy vector. Adeno-associated virus (AAV) vectors have been shown to be useful in gene therapy approaches aimed at correcting genetic deficiencies resulting in reduced or absent protein expression levels (Nathwani et al. - A.M. Keeler et al.), and are potentially useful for gene knockdown , genome editing or modification, and modulation of non-coding RNA (Valdmanis et al., 2017). Packaging of the entire muscle-specific dystrophin isoform cDNA into a single rAAV capsid cannot be easily achieved due to the large size of the dystrophin cDNA. Previous studies have focused on developing small genetic constructs that express only specific domains of dystrophin. See US Patent Nos. 6,869,777 and 8,501,920, each of which is incorporated by reference. However, these approaches have had only limited success. There remains a need for more precise and effective gene therapy tools to treat patients with mutations in the dystrophin gene, and in particular the need to develop a recombinant dystrophin gene that can be efficiently packaged into a gene therapy vector.

3. Сущность изобретения3. Essence of the invention

В настоящем изобретении обеспечивается молекула нуклеиновой кислоты, содержащая нуклеотидную последовательность, которая кодирует полипептид миниатюризированного дистрофина, содержащий, от N-конца к С-концу, шарнирный 1 (hinge 1 (H1)) домен, домен спектринового повтора 1 (repeat 1 (R1)), домен спектринового повтора 3 (R3), шарнирный 2 (Н2) домен, домен спектринового повтора 16 (R16), домен спектринового повтора 17 (R17), домен спектринового повтора 24 (R24) и шарнирный 4 (Н4) домен дистрофина, где полипептид миниатюризированного дистрофина не содержит спектринового повтора 2 дистрофина.The present invention provides a nucleic acid molecule comprising a nucleotide sequence that encodes a miniaturized dystrophin polypeptide comprising, from N-terminus to C-terminus, a hinge 1 (H1) domain, a spectrin repeat 1 (R1) domain ), spectrin repeat domain 3 (R3), hinge 2 (H2) domain, spectrin repeat domain 16 (R16), spectrin repeat domain 17 (R17), spectrin repeat domain 24 (R24), and dystrophin hinge 4 (H4) domain, where The miniaturized dystrophin polypeptide does not contain dystrophin spectrin repeat 2.

В некоторых вариантах осуществления полипептид миниатюризированного дистрофина не содержит домен спектринового повтора 2 (R2), домен спектринового повтора 4 (R4), домен спектринового повтора 5 (R5), домен спектринового повтора 6 (R6), домен спектринового повтора 7 (R7), домен спектринового повтора 8 (R8), домен спектринового повтора 9 (R9), домен спектринового повтора 10 (R10), домен спектринового повтора 11 (R11), домен спектринового повтора 12 (R12), домен спектринового повтора 13 (R13), домен спектринового повтора 14 (R14), домен спектринового повтора 15 (R15), домен спектринового повтора 18 (R18), домен спектринового повтора 19 (R19), домен спектринового повтора 20 (R20), домен спектринового повтора 21 (R21), домен спектринового повтора 22 (R22), домен спектринового повтора 23 (R23) или любую их комбинацию. В некоторых вариантах осуществления домен R1 непосредственно слит с доменом R3 посредством пептидной связи. В некоторых вариантах осуществления домен R1 и домен R3 слиты посредством аминокислот аргинин-валин (ARG-VAL, RV). В некоторых вариантах осуществления домен Н2 и домен R16 слиты посредством линкера.In some embodiments, the miniaturized dystrophin polypeptide does not comprise a spectrin repeat 2 (R2) domain, a spectrin repeat 4 (R4) domain, a spectrin repeat 5 (R5) domain, a spectrin repeat 6 (R6) domain, a spectrin repeat 7 (R7) domain spectrin repeat 8 (R8), spectrin repeat domain 9 (R9), spectrin repeat domain 10 (R10), spectrin repeat domain 11 (R11), spectrin repeat domain 12 (R12), spectrin repeat domain 13 (R13), spectrin repeat domain 14 (R14), spectrin repeat domain 15 (R15), spectrin repeat domain 18 (R18), spectrin repeat domain 19 (R19), spectrin repeat domain 20 (R20), spectrin repeat domain 21 (R21), spectrin repeat domain 22 ( R22), spectrin repeat domain 23 (R23), or any combination thereof. In some embodiments, the R1 domain is directly fused to the R3 domain via a peptide bond. In some embodiments, the R1 domain and the R3 domain are fused through the amino acids arginine-valine (ARG-VAL, RV). In some embodiments, the H2 domain and the R16 domain are fused via a linker.

В некоторых вариантах осуществления линкер содержит аминокислотную последовательность, которая по меньшей мере на около 80%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 75 (IHTVREE TMMVMTEDMP LEI), причем аминокислотная последовательность способна улучшать передачу сигнала нейрональной синтазы оксида азота (Neuronal Nitric Oxide Synthase, nNOS). В некоторых вариан- 1 046419 тах осуществления в данном документе раскрыта молекула нуклеиновой кислоты, содержащая нуклеотидную последовательность, которая кодирует аминокислотную последовательность, содержащую последовательность SEQ ID NO: 75 (IHTVREE TMMVMTEDMP LEI), где молекула нуклеиновой кислоты по меньшей мере на около 80%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 100 (ATCCACACCGTGCGGGAAGAGACAATGATGGTCATGACAGAGGAC ATGCCCCTGGAAATC), причем аминокислотная последовательность способна улучшать передачу сигнала nNOS. В некоторых вариантах осуществления аминокислотная последовательность представляет собой линкер, соединяющий первый домен дистрофина со вторым доменом дистрофина. В некоторых вариантах осуществления первый домен дистрофина представляет собой домен Н2 и второй домен дистрофина представляет собой домен R16. В некоторых вариантах осуществления аминокислотная последовательность дополнительно содержит последовательность, приведенную в SEQ ID NO: 74, на N-конце.In some embodiments, the linker comprises an amino acid sequence that is at least about 80%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, is at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 75 (IHTVREE TMMVMTEDMP LEI), and the amino acid sequence is capable of improving neuronal Nitric Oxide Synthase signal transduction. nNOS). In some embodiments, disclosed herein is a nucleic acid molecule comprising a nucleotide sequence that encodes an amino acid sequence comprising the sequence of SEQ ID NO: 75 (IHTVREE TMMVMTEDMP LEI), wherein the nucleic acid molecule is at least about 80% at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99% or about 100% identical to the sequence of SEQ ID NO: 100 (ATCCACACCGTGCGGGAAGAGACAATGATGGTCATGACAGAGGAC ATGCCCCTGGAAATC), and the amino acid sequence is capable of improving nNOS signal transmission. In some embodiments, the amino acid sequence is a linker connecting the first dystrophin domain to the second dystrophin domain. In some embodiments, the first dystrophin domain is an H2 domain and the second dystrophin domain is an R16 domain. In some embodiments, the amino acid sequence further comprises the sequence set forth in SEQ ID NO: 74 at the N-terminus.

В некоторых вариантах осуществления молекула нуклеиновой кислоты кодирует полипептид миниатюризированного дистрофина. В некоторых вариантах осуществления полипептид миниатюризированного дистрофина содержит, от N-конца к С-концу, шарнирный 1 (H1) домен, домен спектринового повтора 1 (R1), домен спектринового повтора 3 (R3), шарнирный 2 (Н2) домен, домен спектринового повтора 16 (R16), домен спектринового повтора 17 (R17), домен спектринового повтора 24 (R24) и шарнирный 4 (Н4) домен дистрофина. В некоторых вариантах осуществления домен R1 и домен R3 слиты посредством аминокислот ARG-VAL (RV), и где домен Н2 и домен R16 слиты посредством аминокислотной последовательности, приведенной в SEQ ID NO: 74-75, в комбинации. В некоторых вариантах осуществления (i) домен H1 и домен R1 слиты непосредственно, (ii) домен R3 и домен Н2 слиты непосредственно, (iii) домены R16 и R17 слиты непосредственно, (iv) домены R17 и R24 слиты непосредственно, или (v) домены R24 и Н4 слиты непосредственно, или (vi) любая их комбинация. В некоторых вариантах осуществления полипептид миниатюризированного дистрофина дополнительно содержит домен ABD1 и/или домен CR. В некоторых вариантах осуществления полипептид миниатюризированного дистрофина состоит по существу из или состоит из, от N-конца до С-конца, домена ABD1, домена H1, домена R1, аминокислот RV, домена R3, домена Н2, аминокислотной последовательности, приведенной в SEQ ID NO: 74-75, домена R16, домена R17, домена R24, домена Н4 и домена CR дистрофина.In some embodiments, the nucleic acid molecule encodes a miniaturized dystrophin polypeptide. In some embodiments, the miniaturized dystrophin polypeptide comprises, from N-terminus to C-terminus, a hinge 1 (H1) domain, a spectrin repeat 1 (R1) domain, a spectrin repeat 3 (R3) domain, a hinge 2 (H2) domain, a spectrin domain repeat 16 (R16), spectrin repeat domain 17 (R17), spectrin repeat domain 24 (R24), and dystrophin hinge 4 (H4) domain. In some embodiments, the R1 domain and the R3 domain are fused through the amino acids ARG-VAL (RV), and wherein the H2 domain and the R16 domain are fused through the amino acid sequence set forth in SEQ ID NOs: 74-75, in combination. In some embodiments, (i) the H1 domain and the R1 domain are directly fused, (ii) the R3 domain and the H2 domain are directly fused, (iii) the R16 and R17 domains are directly fused, (iv) the R17 and R24 domains are directly fused, or (v) the R24 and H4 domains are fused directly, or (vi) any combination thereof. In some embodiments, the miniaturized dystrophin polypeptide further comprises an ABD1 domain and/or a CR domain. In some embodiments, the miniaturized dystrophin polypeptide consists essentially of or consists of, from N-terminus to C-terminus, an ABD1 domain, an H1 domain, an R1 domain, RV amino acids, an R3 domain, an H2 domain, the amino acid sequence set forth in SEQ ID NO : 74-75, R16 domain, R17 domain, R24 domain, H4 domain and CR domain of dystrophin.

В некоторых вариантах осуществления домен H1 представляет собой аминокислотную последовательность, которая по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 69. В некоторых вариантах осуществления домен R1 представляет собой аминокислотную последовательность, которая по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 70. В некоторых вариантах осуществления домен R3 представляет собой аминокислотную последовательность, которая по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 72. В некоторых вариантах осуществления домен Н2 представляет собой аминокислотную последовательность, которая по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 73. В некоторых вариантах осуществления домен R16 представляет собой аминокислотную последовательность, которая по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 76. В некоторых вариантах осуществления домен R17 представляет собой аминокислотную последовательность, которая по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 77. В некоторых вариантах осуществления домен R24 представляет собой аминокислотную последовательность, которая по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 78. В некоторых вариантах осуществления домен Н4 представляет собой аминокислотную последовательность, которая по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшейIn some embodiments, the H1 domain is an amino acid sequence that is at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96 % is at least about 97%, at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 69. In some embodiments, the R1 domain is an amino acid sequence that at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least is at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 70. In some embodiments, the R3 domain is an amino acid sequence that is at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99 % or about 100% identical to the sequence of SEQ ID NO: 72. In some embodiments, the H2 domain is an amino acid sequence that is at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 73. In some embodiments, the R16 domain is an amino acid sequence that is at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 76. In some embodiments, the R17 domain is an amino acid sequence , which is at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, is at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 77. In some embodiments, the R24 domain is an amino acid sequence that is at least about 80% identical to at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about about 99% or about 100% identical to the sequence of SEQ ID NO: 78. In some embodiments, the H4 domain is an amino acid sequence that is at least about 80%, at least about 85%, at least about 90 %, at least about 95%, at least about 96%, at least

- 2 046419 мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 79. В некоторых вариантах осуществления полипептид миниатюризированного дистрофина дополнительно содержит на N-конце аминокислотную последовательность, которая по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 68. В некоторых вариантах осуществления полипептид миниатюризированного дистрофина дополнительно содержит на С-конце аминокислотную последовательность, которая по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 80. В некоторых вариантах осуществления полипептид миниатюризированного дистрофина содержит аминокислотную последовательность, которая по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 118. В некоторых вариантах осуществления нуклеотидная последовательность содержит последовательность, которая по меньшей мере на около 60%, по меньшей мере на около 65%, по меньшей мере на около 70%, по меньшей мере на около 75%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична нуклеотидной последовательности SEQ ID NO: 133.- 2046419 is at least about 97%, at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 79. In some embodiments, the miniaturized dystrophin polypeptide further comprises at the N-terminus an amino acid sequence that is at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97 % is at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 68. In some embodiments, the miniaturized dystrophin polypeptide further comprises, at its C terminus, an amino acid sequence that is at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 80. In some embodiments, the miniaturized dystrophin polypeptide contains an amino acid sequence that is at least about 80%, at least about 85% identical , at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99% or is about 100% identical to the sequence of SEQ ID NO: 118. In some embodiments, the nucleotide sequence comprises a sequence that is at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97% , is at least about 98%, at least about 99%, or about 100% identical to the nucleotide sequence of SEQ ID NO: 133.

В некоторых вариантах осуществления полипептид миниатюризированного дистрофина проявляет одно или несколько свойств, выбранных из группы, состоящей из (i) более низкой пролиферации CD4 по сравнению с ВХА-027741, (ii) более низкой пролиферации CD8 по сравнению с ВХА-027741, (iii) более высокой экспрессии полипептида миниатюризированного дистрофина, чем ВХА-027741, и (iv) любой их комбинации. В некоторых вариантах осуществления молекула нуклеиновой кислоты содержит нуклеотидную последовательность, которая кодирует полипептид миниатюризированного дистрофина, содержащий домен спектринового повтора 1 (R1) и домен спектринового повтора 16 (R16), где домен R1 и домен R16 слиты посредством линкера, содержащего аминокислотную последовательность, приведенную в SEQ ID NO: 84 (IHTVREETMMVMTEDMPLEI). В некоторых вариантах осуществления молекула нуклеиновой кислоты содержит нуклеотидную последовательность, которая кодирует полипептид миниатюризированного дистрофина, содержащий, от N-конца к С-концу, шарнирный 1 (H1) домен, домен спектринового повтора 1 (R1), домен спектринового повтора 16 (R16), домен спектринового повтора 17 (R17), шарнирный 3 (H3) домен, домен спектринового повтора 23 (R23), домен спектринового повтора 24 (R24) и шарнирный 4 (Н4) домен дистрофина, где домен R1 и домен R16 слиты посредством аминокислотной последовательности, приведенной в SEQ ID NO: 84 (IHTVREETMMVMTEDMPLEI). В некоторых вариантах осуществления (i) домен H1 и домен R1 слиты непосредственно, (ii) домены R16 и R17 слиты непосредственно, (iii) домены R17 и H3 слиты непосредственно, (iv) R23 и R24 домены слиты непосредственно, или (v) домены R24 и Н4 слиты непосредственно, или (vi) любая их комбинация.In some embodiments, the miniaturized dystrophin polypeptide exhibits one or more properties selected from the group consisting of (i) lower CD4 proliferation compared to BXA-027741, (ii) lower CD8 proliferation compared to BXA-027741, (iii) higher expression of miniaturized dystrophin polypeptide than BXA-027741, and (iv) any combination thereof. In some embodiments, the nucleic acid molecule comprises a nucleotide sequence that encodes a miniaturized dystrophin polypeptide comprising a spectrin repeat 1 (R1) domain and a spectrin repeat 16 (R16) domain, wherein the R1 domain and the R16 domain are fused through a linker comprising the amino acid sequence set forth in SEQ ID NO: 84 (IHTVREETMMVMTEDMPLEI). In some embodiments, the nucleic acid molecule comprises a nucleotide sequence that encodes a miniaturized dystrophin polypeptide comprising, from N-terminus to C-terminus, a hinge 1 (H1) domain, a spectrin repeat 1 (R1) domain, a spectrin repeat 16 (R16) domain , spectrin repeat domain 17 (R17), hinge 3 (H3) domain, spectrin repeat domain 23 (R23), spectrin repeat domain 24 (R24), and dystrophin hinge 4 (H4) domain, where the R1 domain and the R16 domain are fused by amino acid sequence given in SEQ ID NO: 84 (IHTVREETMMVMTEDMPLEI). In some embodiments, (i) the H1 domain and the R1 domain are directly fused, (ii) the R16 and R17 domains are directly fused, (iii) the R17 and H3 domains are directly fused, (iv) the R23 and R24 domains are directly fused, or (v) the R24 and H4 fused directly, or (vi) any combination thereof.

В некоторых вариантах осуществления полипептид миниатюризированного дистрофина не содержит домен спектринового повтора 2 (R2), домен спектринового повтора 3 (R3), домен спектринового повтора 4 (R4), домен спектринового повтора 5 (R5), домен спектринового повтора 6 (R6), домен спектринового повтора 7 (R7), домен спектринового повтора 8 (R8), домен спектринового повтора 9 (R9), домен спектринового повтора 10 (R10), домен спектринового повтора 11 (R11), домен спектринового повтора 12 (R12), домен спектринового повтора 13 (R13), домен спектринового повтора 14 (R14), домен спектринового повтора 15 (R15), домен спектринового повтора 18 (R18), домен спектринового повтора 19 (R19), домен спектринового повтора 20 (R20), домен спектринового повтора 21 (R21) и/или домен спектринового повтора 22 (R22).In some embodiments, the miniaturized dystrophin polypeptide does not comprise a spectrin repeat 2 (R2) domain, a spectrin repeat 3 (R3) domain, a spectrin repeat 4 (R4) domain, a spectrin repeat 5 (R5) domain, a spectrin repeat 6 (R6) domain spectrin repeat 7 (R7), spectrin repeat domain 8 (R8), spectrin repeat domain 9 (R9), spectrin repeat domain 10 (R10), spectrin repeat domain 11 (R11), spectrin repeat domain 12 (R12), spectrin repeat domain 13 (R13), spectrin repeat domain 14 (R14), spectrin repeat domain 15 (R15), spectrin repeat domain 18 (R18), spectrin repeat domain 19 (R19), spectrin repeat domain 20 (R20), spectrin repeat domain 21 ( R21) and/or spectrin repeat domain 22 (R22).

В некоторых вариантах осуществления полипептид миниатюризированного дистрофина дополнительно содержит домен ABD1 и/или домен CR. В некоторых вариантах осуществления полипептид миниатюризированного дистрофина состоит по существу из или состоит из, от N-конца до С-конца, домена ABD1, домена H1, домена R1, аминокислотной последовательности, приведенной в SEQ ID NO: 84, домена R16, домена R17, домена Н3, домена R23, домена R24, домена Н4 и домена CR дистрофина. В некоторых вариантах осуществления домен H1 представляет собой аминокислотную последовательность, которая по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 82. В некоторых вариантах осуществления домен R1 представляет собой аминокислотную последовательность, которая по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на окоIn some embodiments, the miniaturized dystrophin polypeptide further comprises an ABD1 domain and/or a CR domain. In some embodiments, the miniaturized dystrophin polypeptide consists essentially of or consists of, from the N-terminus to the C-terminus, an ABD1 domain, an H1 domain, an R1 domain, the amino acid sequence set forth in SEQ ID NO: 84, an R16 domain, an R17 domain, H3 domain, R23 domain, R24 domain, H4 domain and CR domain of dystrophin. In some embodiments, the H1 domain is an amino acid sequence that is at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96 % is at least about 97%, at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 82. In some embodiments, the R1 domain is an amino acid sequence that at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least at least about 98%, at least about 99% or about

- 3 046419 ло 100% идентична последовательности SEQ ID NO: 83. В некоторых вариантах осуществления домен R16 представляет собой аминокислотную последовательность, которая по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 85. В некоторых вариантах осуществления домен R17 представляет собой аминокислотную последовательность, которая по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 86. В некоторых вариантах осуществления домен Н3 представляет собой аминокислотную последовательность, которая по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 87. В некоторых вариантах осуществления домен R23 представляет собой аминокислотную последовательность, которая по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 88. В некоторых вариантах осуществления домен R24 представляет собой аминокислотную последовательность, которая по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 89. В некоторых вариантах осуществления домен Н4 представляет собой аминокислотную последовательность, которая по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 90.- 3 046419 is 100% identical to the sequence of SEQ ID NO: 83. In some embodiments, the R16 domain is an amino acid sequence that is at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 85. In some embodiments, the R17 domain is an amino acid sequence that is at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 86. In some embodiments, the H3 domain is an amino acid sequence , which is at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, is at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 87. In some embodiments, the R23 domain is an amino acid sequence that is at least about 80% identical to at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about about 99% or about 100% identical to the sequence of SEQ ID NO: 88. In some embodiments, the R24 domain is an amino acid sequence that is at least about 80%, at least about 85%, at least about 90 %, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 89. In some embodiments, the H4 domain is an amino acid sequence that is at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least at least about 96%, at least about 97%, at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 90.

В некоторых вариантах осуществления полипептид миниатюризированного дистрофина дополнительно содержит на N-конце аминокислотную последовательность, которая по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 81. В некоторых вариантах осуществления полипептид миниатюризированного дистрофина дополнительно содержит на С-конце аминокислотную последовательность, которая по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 91. В некоторых вариантах осуществления полипептид миниатюризированного дистрофина содержит аминокислотную последовательность, которая по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 132 или SEQ ID NO: 132, где С-концевой домен удален. В некоторых вариантах осуществления нуклеотидная последовательность содержит последовательность, которая по меньшей мере на около 60%, по меньшей мере на около 65%, по меньшей мере на около 70%, по меньшей мере на около 75%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична нуклеотидной последовательности SEQ ID NO: 147 или SEQ ID NO: 148 или SEQ ID NO: 149.In some embodiments, the miniaturized dystrophin polypeptide further comprises, at its N-terminus, an amino acid sequence that is at least about 80%, at least about 85%, at least about 90%, at least about 95%, is at least about 96%, at least about 97%, at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 81. In some embodiments, the miniaturized dystrophin polypeptide further comprises at the C-terminus an amino acid sequence that is at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, is at least about 97%, at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 91. In some embodiments, the miniaturized dystrophin polypeptide comprises an amino acid sequence that is at least at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 132 or SEQ ID NO: 132, where the C-terminal domain is deleted. In some embodiments, the nucleotide sequence comprises a sequence that is at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least is at least about 99% or about 100% identical to the nucleotide sequence of SEQ ID NO: 147 or SEQ ID NO: 148 or SEQ ID NO: 149.

В некоторых вариантах осуществления полипептид миниатюризированного дистрофина демонстрирует более высокую экспрессию полипептида миниатюризированного дистрофина, чем ВХА-196481.In some embodiments, the miniaturized dystrophin polypeptide exhibits higher expression of the miniaturized dystrophin polypeptide than BXA-196481.

В некоторых вариантах осуществления экспрессия полипептида миниатюризированного дистрофина по меньшей мере в около 1,5 раза, по меньшей мере в около 1,6 раза, по меньшей мере в около 1,7 раза, по меньшей мере в около 1,8 раза, по меньшей мере в около 1,9 раза, по меньшей мере в около 2 раза, по меньшей мере в около 2,1 раза, по меньшей мере в около 2,2 раза, по меньшей мере в около 2,3 раза, по меньшей мере в около 2,4 раза, по меньшей мере в около 2,5 раза, по меньшей мере в около 2,6 раза, по меньшей мере в около 2,7 раза, по меньшей мере в около 2,8 раза, по меньшей мере в около 2,9 раза или по меньшей мере в около 3 раза выше, чем экспрессия полипептида ВХА-196481.In some embodiments, expression of the miniaturized dystrophin polypeptide is at least about 1.5-fold, at least about 1.6-fold, at least about 1.7-fold, at least about 1.8-fold, at least at least about 1.9 times, at least about 2 times, at least about 2.1 times, at least about 2.2 times, at least about 2.3 times, at least about 2.4 times, at least about 2.5 times, at least about 2.6 times, at least about 2.7 times, at least about 2.8 times, at least about about 2.9-fold or at least about 3-fold higher than the expression of the BXA-196481 polypeptide.

В некоторых вариантах осуществления молекула нуклеиновой кислоты дополнительно содержит промотор. В некоторых вариантах осуществления промотор представляет собой тканеспецифический промотор. В некоторых вариантах осуществления промотор управляет экспрессией терапевтического белка в гепатоцитах, мышечных клетках, эндотелиальных клетках, нейрональных клетках, синусоидальных клетках или в любой их комбинации. В некоторых вариантах осуществления промотор выбран изIn some embodiments, the nucleic acid molecule further comprises a promoter. In some embodiments, the promoter is a tissue-specific promoter. In some embodiments, the promoter drives expression of the therapeutic protein in hepatocytes, muscle cells, endothelial cells, neuronal cells, sinusoidal cells, or any combination thereof. In some embodiments, the promoter is selected from

- 4 046419 группы, состоящей из промотора тиретина мыши (mTTR), промотора эндогенного фактора VIII человека (F8), промотора альфа-1-антитрипсина человека (hAAT), минимального промотора альбумина человека, промотора альбумина мыши, промотора тристетрапролина (ТТР), промотора CASI, промотора гена синапсина 1, промотора CAG, промотора цитомегаловируса (CMV), а1-антитрипсина (ААТ), мышечной креатинкиназы (MCK), тяжелой цепи альфа-миозина (аМНС), миоглобина (MB), десмина (DES), SPc512, 2R5Sc5-12, dMCK, tMCK и промотора фосфоглицераткиназы (PGK).- 4 046419 group consisting of mouse thyretin promoter (mTTR), human endogenous factor VIII promoter (F8), human alpha-1 antitrypsin promoter (hAAT), human minimal albumin promoter, mouse albumin promoter, tristetraproline (TTP) promoter, CASI, synapsin 1 gene promoter, CAG promoter, cytomegalovirus (CMV) promoter, α1-antitrypsin (AAT), muscle creatine kinase (MCK), alpha-myosin heavy chain (aMHC), myoglobin (MB), desmin (DES), SPc512, 2R5Sc5-12, dMCK, tMCK and phosphoglycerate kinase (PGK) promoter.

В некоторых вариантах осуществления молекула нуклеиновой кислоты дополнительно содержит интронную последовательность. В некоторых вариантах осуществления интронная последовательность расположена в направлении 5' от нуклеотидной последовательности, кодирующей полипептид миниатюризированного дистрофина. В некоторых вариантах осуществления интронная последовательность расположена в направлении 3' от промотора. В некоторых вариантах осуществления интронная последовательность включает синтетическую интронную последовательность. В некоторых вариантах осуществления молекула нуклеиновой кислоты дополнительно содержит посттранскрипционный регуляторный элемент. В некоторых вариантах осуществления посттранскрипционный регуляторный элемент расположен в направлении 3' от нуклеотидной последовательности, кодирующей полипептид миниатюризированного дистрофина. В некоторых вариантах осуществления посттранскрипционный регуляторный элемент содержит мутантный посттранскрипционный регуляторный элемент вируса гепатита сурка (WPRE), сайт связывания микроРНК или целевую последовательность ядерной ДНК, или любую их комбинацию.In some embodiments, the nucleic acid molecule further comprises an intronic sequence. In some embodiments, the intronic sequence is located 5' from the nucleotide sequence encoding the miniaturized dystrophin polypeptide. In some embodiments, the intronic sequence is located 3' from the promoter. In some embodiments, the intronic sequence includes a synthetic intronic sequence. In some embodiments, the nucleic acid molecule further comprises a post-transcriptional regulatory element. In some embodiments, the post-transcriptional regulatory element is located 3' of the nucleotide sequence encoding the miniaturized dystrophin polypeptide. In some embodiments, the post-transcriptional regulatory element comprises a mutant hepatitis virus post-transcriptional regulatory element (WPRE), a miRNA binding site, or a target nuclear DNA sequence, or any combination thereof.

В некоторых вариантах осуществления молекула нуклеиновой кислоты дополнительно содержит 3rUTR-поли(А) хвостовую последовательность. В некоторых вариантах осуществления 3rUTR-поли(А) хвостовая последовательность выбрана из группы, состоящей из поли(А) bGH, поли(А) актина, поли(А) гемоглобина, и любой их комбинации. В некоторых вариантах осуществления 3UTR-поли(А) хвостовая последовательность включает поли(А) bGH.In some embodiments, the nucleic acid molecule further comprises a 3 r UTR poly(A) tail sequence. In some embodiments, the 3 r UTR poly(A) tail sequence is selected from the group consisting of bGH poly(A), actin poly(A), hemoglobin poly(A), and any combination thereof. In some embodiments, the 3UTR poly(A) tail sequence includes a bGH poly(A).

В некоторых вариантах осуществления молекула нуклеиновой кислоты дополнительно содержит энхансерную последовательность.In some embodiments, the nucleic acid molecule further comprises an enhancer sequence.

В некоторых вариантах осуществления молекула нуклеиновой кислоты дополнительно содержит первый ITR и/или второй ITR. В некоторых вариантах осуществления первый ITR и второй ITR идентичны. В некоторых вариантах осуществления первый ITR и/или второй ITR получены из аденоассоциированного вируса.In some embodiments, the nucleic acid molecule further comprises a first ITR and/or a second ITR. In some embodiments, the first ITR and the second ITR are identical. In some embodiments, the first ITR and/or the second ITR are derived from an adeno-associated virus.

В некоторых вариантах осуществления молекула нуклеиновой кислоты содержит гетерологичный фрагмент. В некоторых вариантах осуществления гетерологичный фрагмент выбран из группы, состоящей из альбумина или его фрагмента, Fc-области иммуноглобулина, С-концевого пептида (СТР) βсубъединицы хорионического гонадотропина человека, последовательности PAS, последовательности НАР, трансферрина или его фрагмента, альбумин-связывающего фрагмента или его производного и любой их комбинации.In some embodiments, the nucleic acid molecule comprises a heterologous fragment. In some embodiments, the heterologous fragment is selected from the group consisting of albumin or a fragment thereof, an immunoglobulin Fc region, a human chorionic gonadotropin β-subunit C-terminal peptide (CTP), a PAS sequence, a HAP sequence, transferrin or a fragment thereof, an albumin-binding fragment, or its derivative and any combination thereof.

В некоторых вариантах осуществления обеспечивается вектор, содержащий молекулу нуклеиновой кислоты, раскрытую в данном документе. В некоторых вариантах осуществления вектор выбран из группы, состоящей из аденовирусного вектора, ретровирусного вектора, поксвирусного вектора, бакуловирусного вектора, вектора на основе вируса герпеса. В некоторых вариантах осуществления вектор представляет собой вектор аденоассоциированного вируса (AAV). В некоторых вариантах осуществления вектор AAV выбран из AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10 и AAV11. В некоторых вариантах осуществления вектором AAV является AAV9.In some embodiments, a vector is provided containing a nucleic acid molecule disclosed herein. In some embodiments, the vector is selected from the group consisting of an adenoviral vector, a retroviral vector, a poxvirus vector, a baculovirus vector, and a herpes virus-based vector. In some embodiments, the vector is an adeno-associated virus (AAV) vector. In some embodiments, the AAV vector is selected from AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, and AAV11. In some embodiments, the AAV vector is AAV9.

В некоторых вариантах осуществления молекула нуклеиновой кислоты или вектор, раскрытые в данном документе, приготовлены со средством доставки. В некоторых вариантах осуществления средство доставки включает липидную наночастицу. В некоторых вариантах осуществления средство доставки выбрано из группы, состоящей из липосом, нелипидных полимерных молекул, эндосом и любой их комбинации. В некоторых вариантах осуществления молекула нуклеиновой кислоты или вектор, раскрытые в данном документе, приготовлены для внутривенной, чрескожной, внутрикожной, подкожной, легочной или пероральной доставки или любой их комбинации. В некоторых вариантах осуществления молекула нуклеиновой кислоты или вектор, раскрытые в данном документе, приготовлены для внутривенной доставки. В некоторых вариантах осуществления обеспечивается полипептид, кодируемый молекулой нуклеиновой кислоты или вектором, раскрытым в данном документе. В некоторых вариантах осуществления обеспечивается клетка-хозяин, содержащая описанную в данном документе молекулу нуклеиновой кислоты. В некоторых вариантах осуществления клетка представляет собой клетку СНО, клетку HEK293, клетку HBK, клетку COS, клетку NSO или клетку НТ1080.In some embodiments, a nucleic acid molecule or vector disclosed herein is formulated with a delivery vehicle. In some embodiments, the delivery vehicle includes a lipid nanoparticle. In some embodiments, the delivery vehicle is selected from the group consisting of liposomes, non-lipid polymer molecules, endosomes, and any combination thereof. In some embodiments, the nucleic acid molecule or vector disclosed herein is formulated for intravenous, transdermal, intradermal, subcutaneous, pulmonary or oral delivery, or any combination thereof. In some embodiments, the nucleic acid molecule or vector disclosed herein is formulated for intravenous delivery. In some embodiments, a polypeptide encoded by a nucleic acid molecule or vector disclosed herein is provided. In some embodiments, a host cell is provided containing a nucleic acid molecule described herein. In some embodiments, the cell is a CHO cell, HEK293 cell, HBK cell, COS cell, NSO cell, or HT1080 cell.

В некоторых вариантах осуществления обеспечивается фармацевтическая композиция, содержащая (а) нуклеиновую кислоту, раскрытую в данном документе, вектор, раскрытый в данном документе, полипептид, раскрытый в данном документе, или клетку-хозяина, раскрытую в данном документе; и (b) фармацевтически приемлемое вспомогательное вещество.In some embodiments, a pharmaceutical composition is provided comprising (a) a nucleic acid disclosed herein, a vector disclosed herein, a polypeptide disclosed herein, or a host cell disclosed herein; and (b) a pharmaceutically acceptable excipient.

В некоторых вариантах осуществления обеспечивается набор, содержащий нуклеиновую кислоту, раскрытую в данном документе, вектор, раскрытый в данном документе, полипептид, раскрытый в данIn some embodiments, a kit is provided comprising a nucleic acid disclosed herein, a vector disclosed herein, a polypeptide disclosed herein

- 5 046419 ном документе, клетку-хозяина, раскрытую в данном документе, или фармацевтическую композицию, раскрытую в данном документе, и инструкции по введению молекулы нуклеиновой кислоты субъекту, нуждающемуся в этом.- 5 046419 document, a host cell disclosed herein or a pharmaceutical composition disclosed herein, and instructions for administering the nucleic acid molecule to a subject in need thereof.

В некоторых вариантах осуществления обеспечивается способ получения полипептида миниатюризированного дистрофина, включающий: культивирование клетки-хозяина, раскрытой в данном документе, в подходящих условиях и выделение полипептида миниатюризированного дистрофина.In some embodiments, a method of producing a miniaturized dystrophin polypeptide is provided, comprising: culturing a host cell as disclosed herein under suitable conditions and isolating the miniaturized dystrophin polypeptide.

В некоторых вариантах осуществления обеспечивается способ экспрессии полипептида миниатюризированного дистрофина у субъекта, нуждающегося в этом, включающий введение субъекту нуклеиновой кислоты, раскрытой в данном документе, вектора, раскрытого в данном документе, клеткихозяина, раскрытой в данном документе, или фармацевтической композиции, раскрытой в данном документе.In some embodiments, a method of expressing a miniaturized dystrophin polypeptide in a subject in need thereof is provided, comprising administering to the subject a nucleic acid disclosed herein, a vector disclosed herein, a host cell disclosed herein, or a pharmaceutical composition disclosed herein. .

В некоторых вариантах осуществления обеспечивается способ лечения субъекта, страдающего заболеванием или состоянием, включающий введение субъекту нуклеиновой кислоты, раскрытой в данном документе, вектора, раскрытого в данном документе, полипептида, раскрытого в данном документе, клетки-хозяина, раскрытой в данном документе, или фармацевтической композиции, раскрытой в данном документе. В некоторых вариантах осуществления заболевание или состояние представляет собой заболевание, вызванное дефицитом дистрофина. В некоторых вариантах осуществления заболевание представляет собой саркопению, болезнь сердца, кахексию, мышечную дистрофию Дюшенна (DMD), мышечную дистрофию Беккера (BMD), Х-сцепленную дилатационную кардиомиопатию (XLDC), фациоскапуло-плечевую мышечную дистрофию, миотоническую мышечную дистрофию, конечностнопоясничную дистрофию, окулофарингеальную мышечную дистрофию, мышечную дистрофиюIn some embodiments, a method of treating a subject suffering from a disease or condition is provided, comprising administering to the subject a nucleic acid disclosed herein, a vector disclosed herein, a polypeptide disclosed herein, a host cell disclosed herein, or a pharmaceutical composition disclosed herein. In some embodiments, the disease or condition is a disease caused by dystrophin deficiency. In some embodiments, the disease is sarcopenia, heart disease, cachexia, Duchenne muscular dystrophy (DMD), Becker muscular dystrophy (BMD), X-linked dilated cardiomyopathy (XLDC), facioscapulohumeral muscular dystrophy, myotonic muscular dystrophy, limb-lumbar dystrophy, oculopharyngeal muscular dystrophy, muscular dystrophy

Эмери-Дрейфуса, дистальную мышечную дистрофию и/или врожденную мышечную дистрофию. В некоторых вариантах осуществления способ по любому из пп.86-89, отличающийся тем, что молекулу нуклеиновой кислоты, вектор, полипептид, клетку-хозяина или фармацевтическую композицию вводят внутривенно, чрескожно, внутрикожно, подкожно, перорально или легочно, или любую их комбинацию. В некоторых вариантах осуществления молекулу нуклеиновой кислоты, вектор, полипептид, клеткухозяина или фармацевтическую композицию вводят внутривенно, чрескожно, внутрикожно, подкожно, перорально или через легкие или посредством любой их комбинации.Emery-Dreyfus, distal muscular dystrophy and/or congenital muscular dystrophy. In some embodiments, the method of any one of claims 86 to 89, wherein the nucleic acid molecule, vector, polypeptide, host cell or pharmaceutical composition is administered intravenously, transdermally, intradermally, subcutaneously, orally or pulmonaryly, or any combination thereof. In some embodiments, the nucleic acid molecule, vector, polypeptide, host cell, or pharmaceutical composition is administered intravenously, transdermally, intradermally, subcutaneously, orally, or pulmonaryly, or any combination thereof.

В некоторых вариантах осуществления способ дополнительно включает введение субъекту второго средства.In some embodiments, the method further includes administering a second agent to the subject.

В некоторых вариантах осуществления субъектом является человек. В некоторых вариантах осуществления введение субъекту молекулы нуклеиновой кислоты, вектора, полипептида, клетки-хозяина или фармацевтической композиции приводит к повышенной экспрессии белка дистрофина по сравнению с экспрессией белка дистрофина у субъекта до введения, причем экспрессия белка дистрофина увеличивается по меньшей мере в около 2 раза, по меньшей мере в около 3 раза, по меньшей мере в около 4 раза, по меньшей мере в около 5 раз, по меньшей мере в около 6 раз, по меньшей мере в около 7 раз, по меньшей мере в около 8 раз, по меньшей мере в около 9 раз, по меньшей мере в около 10 раз, по меньшей мере в около 11 раз, по меньшей мере в около 12 раз, по меньшей мере в около 13 раз, по меньшей мере в около 14 раз, по меньшей мере в около 15 раз, по меньшей мере в около 20 раз, по меньшей мере в около 25 раз, по меньшей мере в около 30 раз, по меньшей мере в около 35 раз, по меньшей мере в около 40 раз, по меньшей мере в около 50 раз, по меньшей мере в около 60 раз, по меньшей мере в около 70 раз, по меньшей мере в около 80 раз, по меньшей мере в около 90 раз или по меньшей мере в около 100 раз.In some embodiments, the subject is a human. In some embodiments, administration of a nucleic acid molecule, vector, polypeptide, host cell, or pharmaceutical composition to a subject results in increased dystrophin protein expression compared to dystrophin protein expression in the subject prior to administration, wherein dystrophin protein expression is increased by at least about 2-fold, at least about 3 times, at least about 4 times, at least about 5 times, at least about 6 times, at least about 7 times, at least about 8 times, at least at least about 9 times, at least about 10 times, at least about 11 times, at least about 12 times, at least about 13 times, at least about 14 times, at least about about 15 times, at least about 20 times, at least about 25 times, at least about 30 times, at least about 35 times, at least about 40 times, at least about 50 times, at least about 60 times, at least about 70 times, at least about 80 times, at least about 90 times, or at least about 100 times.

В некоторых вариантах осуществления в данном документе раскрыта молекула нуклеиновой кислоты, содержащая нуклеотидную последовательность, которая кодирует полипептид миниатюризированного дистрофина, содержащий шарнирный 2 (Н2) домен и домен спектринового повтора 16 (R16), где домен Н2 и домен R16 слиты посредством линкера, содержащего аминокислотную последовательность, приведенную в SEQ ID NO: 84 (IHTVREETMMVMTEDMPLEI).In some embodiments, disclosed herein is a nucleic acid molecule comprising a nucleotide sequence that encodes a miniaturized dystrophin polypeptide comprising a hinge 2 (H2) domain and a spectrin repeat 16 (R16) domain, wherein the H2 domain and the R16 domain are fused through a linker containing an amino acid the sequence given in SEQ ID NO: 84 (IHTVREETMMVMTEDMPLEI).

4. Краткое описание чертежей4. Brief description of drawings

Фиг. 1 показывает схематическое изображение полноразмерного человеческого белка дистрофина. ABD1: актин-связывающий домен-1; Н# (например, H1): шарнирная область; R# (например, R1): домены спектрин-подобных повторов; ABD2: актин-связывающий домен-2; CR: богатый цистеином домен; Сконц: С-концевой домен белка.Fig. 1 shows a schematic representation of the full-length human dystrophin protein. ABD1: actin binding domain-1; H# (eg H1): hinge area; R# (eg R1): spectrin-like repeat domains; ABD2: actin binding domain-2; CR: cysteine-rich domain; Conc: C-terminal domain of a protein.

Фиг. 2 показывает схематические изображения полипептидов миниатюризированного дистрофина ВХА-027741, ВХА-027742, ВХА-027743, ВХА-027744, ВХА-196480 и ВХА-196481, а также, в качестве ориентира, полноразмерный человеческий белок дистрофин из фиг. 1.Fig. 2 shows schematic representations of the miniaturized dystrophin polypeptides BXA-027741, BXA-027742, BXA-027743, BXA-027744, BXA-196480, and BXA-196481, and, by way of reference, the full-length human dystrophin protein of FIG. 1.

Фиг. 3 показывает соотношение экспрессии полипептида миниатюризированного дистрофина и экспрессии мРНК миниатюризированного дистрофина в полученных из изогенных индуцированных плюрипотентных стволовых клеток (iPSC) человеческих сердечных миоцитах (iCM) (несущих преждевременный стоп-кодон Е2035Х в гене дистрофина, который предотвращает эндогенную экспрессию дистрофина) после трансфекции плазмид, экспрессирующих указанные полипептиды миниатюризированного дистрофина.Fig. 3 shows the ratio of miniaturized dystrophin polypeptide expression to miniaturized dystrophin mRNA expression in isogenic induced pluripotent stem cell (iPSC)-derived human cardiac myocytes (iCM) (carrying a premature stop codon E2035X in the dystrophin gene, which prevents endogenous dystrophin expression) after plasmid transfection. expressing said miniaturized dystrophin polypeptides.

Фиг. 4 показывает схематическое изображение полипептида миниатюризированного дистрофинаFig. 4 shows a schematic representation of a miniaturized dystrophin polypeptide

- 6 046419- 6 046419

ВХА-027743 (SEQ ID NO: 132), а также аминокислотную последовательность его соединительных участков J1 и J7, которые, как указано, обладают относительно низкой иммуногенностью.BXA-027743 (SEQ ID NO: 132), as well as the amino acid sequence of its J1 and J7 junction regions, which are said to have relatively low immunogenicity.

Фиг. 5 показывает схематическое изображение полипептида миниатюризированного дистрофина ВХА-027741 (SEQ ID NO: 129) со стрелками, указывающими на его соединительные участки J10, J11 и J9.Fig. 5 shows a schematic representation of the miniaturized dystrophin polypeptide BXA-027741 (SEQ ID NO: 129) with arrows pointing to its junction regions J10, J11 and J9.

Фиг. 6А представляет гистограмму, показывающую долю образцов, среди протестированной панели клеток из 40 образцов, которые были обработаны различными соединительными пептидами, как указано, и имели пролиферирующие клетки CD4+ (каждый цветной квадрат представляет образец от одного пациента). Фиг. 6В представляет гистограмму, показывающую долю образцов, среди протестированной панели клеток из 40 образцов, которые были обработаны различными соединительными пептидами, как указано, и имели пролиферирующие клетки CD8+ (каждый цветной квадрат представляет образец от одного пациента).Fig. 6A is a histogram showing the proportion of samples, among the 40 sample cell panel tested, that were treated with the various junction peptides as indicated and had proliferating CD4+ cells (each colored square represents a sample from one patient). Fig. 6B is a histogram showing the proportion of samples, among the 40 sample cell panel tested, that were treated with the various junction peptides as indicated and had proliferating CD8+ cells (each colored square represents a sample from one patient).

Фиг. 7 показывает схематическое изображение полипептида миниатюризированного дистрофина ВХА-196473 (SEQ ID NO: 119).Fig. 7 shows a schematic representation of the miniaturized dystrophin polypeptide BXA-196473 (SEQ ID NO: 119).

Фиг. 8А показывает схематическое изображение полипептида миниатюризированного дистрофина ВХА-196477 (SEQ ID NO: 118). RV: дипептид аргинин-валин между R1 и R3; SEAQ: пептид серинглутаминовая кислота-аланин-глутамин. Фиг. 8В показывает трехмерный фолд вокруг первоначального соединительного участка 10 между R1 и R3 полипептида миниатюризированного дистрофина ВХА027741 (SEQ ID NO: 129) (слева) и трехмерный фолд вокруг версии 3 соединительного участка 10 полипептида миниатюризированного дистрофина ВХА-196477 (SEQ ID NO: 118) (справа).Fig. 8A shows a schematic representation of the miniaturized dystrophin polypeptide BXA-196477 (SEQ ID NO: 118). RV: arginine-valine dipeptide between R1 and R3; SEAQ: serine glutamic acid-alanine-glutamine peptide. Fig. 8B shows the three-dimensional fold around the original junction region 10 between R1 and R3 of the miniaturized dystrophin polypeptide BXA027741 (SEQ ID NO: 129) (left) and the three-dimensional fold around the version 3 junction region 10 of the miniaturized dystrophin polypeptide BXA-196477 (SEQ ID NO: 118) ( on right).

Фиг. 9 показывает соотношение экспрессии полипептида миниатюризированного дистрофина и мРНК миниатюризированного дистрофина в полученных из изогенных индуцированных плюрипотентных стволовых клеток человека (iPSC) сердечных миоцитах (iCM), (несущих преждевременный стопкодон Е2035Х в гене дистрофина, который предотвращает эндогенную экспрессию дистрофина) после трансфекции плазмид, экспрессирующих указанные полипептиды миниатюризированного дистрофина.Fig. 9 shows the ratio of expression of miniaturized dystrophin polypeptide and miniaturized dystrophin mRNA in human isogenic induced pluripotent stem cell (iPSC)-derived cardiac myocytes (iCM), (carrying the premature stop codon E2035X in the dystrophin gene, which prevents endogenous expression of dystrophin) after transfection of plasmids expressing the indicated miniaturized dystrophin polypeptides.

Фиг. 10 показывает схематическое изображение полипептида миниатюризированного дистрофина ВХА-196474 (SEQ ID NO: 120).Fig. 10 shows a schematic representation of the miniaturized dystrophin polypeptide BXA-196474 (SEQ ID NO: 120).

Фиг. 11 показывает схематическое изображение полипептида миниатюризированного дистрофина ВХА-196475 (SEQ ID NO: 121).Fig. 11 shows a schematic representation of the miniaturized dystrophin polypeptide BXA-196475 (SEQ ID NO: 121).

Фиг. 12 показывает схематическое изображение полипептида миниатюризированного дистрофина ВХА-196476 (SEQ ID NO: 122).Fig. 12 shows a schematic representation of the miniaturized dystrophin polypeptide BXA-196476 (SEQ ID NO: 122).

Фиг. 13 показывает схематическое изображение полипептида миниатюризированного дистрофина ВХА-196478 (SEQ ID NO: 124).Fig. 13 shows a schematic representation of the miniaturized dystrophin polypeptide BXA-196478 (SEQ ID NO: 124).

Фиг. 14 показывает схематическое изображение полипептида миниатюризированного дистрофина ВХА-196479 (SEQ ID NO: 125).Fig. 14 shows a schematic representation of the miniaturized dystrophin polypeptide BXA-196479 (SEQ ID NO: 125).

Фиг. 15. Скорость проведения в человеческих DMD hiPSC-CM, инфицированных AAV9- конструкциями, экспрессирующими полипептиды миниатюризированного дистрофина ВХА-196477 и ВХА213788. Фиг. 15А показывает фотографию многоэлектродной матрицы (МЕА), использованной в экспериментах (слева), и фотографию отдельных электродов МЕА (справа). Фиг. 15В показывает сигнал от 28 электродов МЕА в условиях эксперимента. Фиг. 15С показывает график, иллюстрирующий проведение импульса через матрицу. Фиг. 15D показывает схематические изображения полипептидов миниатюризированного дистрофина ВХА-196477 (SEQ ID NO: 118) и ВХА-213788 (SEQ ID NO: 152). Фиг. 15Е показывает график, на котором скорость проведения человеческими DMD hiPSC-CM, экспрессирующими полипептиды миниатюризированного дистрофина ВХА-196477 (SEQ ID NO: 118) и ВХА-213788, представлена в виде зависимости от времени после трансфекции. Фиг. 15F показывает гистограмму, показывающую экспрессию полипептидов миниатюризированного дистрофина в клетках, в которых была изме рена скорость проведения.Fig. 15. Conduction rates in human DMD hiPSC-CMs infected with AAV9 constructs expressing the miniaturized dystrophin polypeptides BXA-196477 and BXA213788. Fig. 15A shows a photograph of the multielectrode array (MEA) used in the experiments (left) and a photograph of individual MEA electrodes (right). Fig. 15B shows the signal from 28 MEA electrodes under experimental conditions. Fig. 15C shows a graph illustrating the conduction of a pulse through the matrix. Fig. 15D shows schematic drawings of the miniaturized dystrophin polypeptides BXA-196477 (SEQ ID NO: 118) and BXA-213788 (SEQ ID NO: 152). Fig. 15E shows a graph plotting the conduction rate of human DMD hiPSC-CMs expressing the miniaturized dystrophin polypeptides BXA-196477 (SEQ ID NO: 118) and BXA-213788 as a function of time after transfection. Fig. 15F shows a histogram showing the expression of miniaturized dystrophin polypeptides in cells in which conduction velocity was measured.

Фиг. 16 показывает схему, обобщающую постановку экспериментов при выполнении исследований in vivo.Fig. 16 shows a diagram summarizing the experimental setup when performing in vivo studies.

Фиг. 17. Целевое взаимодействие AAV9-BXA-196477 или AAV9-BXA-213788. Фиг. 17В показывает иммунофлуоресцентную визуализацию экспрессии полипептидов миниатюризированного дистрофина и агглютинина зародышей пшеницы (WGA) в мышечной ткани мышей, обработанных AAV9-BXA-196477 или AAV9-BXA-213788. Фиг. 17А представляет гистограммы, показывающие относительное количество клеток в различных мышцах, положительных в отношении миниатюризированного дистрофина. Столбики с диагональным рисунком = % ВХА-196477 клеток, положительных по миниатюризированному дистрофину, как доля WGA-положительных клеток; столбики с продольным рисунком = % миниатюризированного дистрофина ВХА-213788 как доля WGA-положительных клеток.Fig. 17. Target interaction of AAV9-BXA-196477 or AAV9-BXA-213788. Fig. 17B shows immunofluorescence imaging of the expression of miniaturized dystrophin and wheat germ agglutinin (WGA) polypeptides in muscle tissue of mice treated with AAV9-BXA-196477 or AAV9-BXA-213788. Fig. 17A presents histograms showing the relative number of cells in various muscles that are positive for miniaturized dystrophin. Diagonal bars = % BXA-196477 cells positive for miniaturized dystrophin as a proportion of WGA-positive cells; Longitudinal bars = % miniaturized dystrophin BXA-213788 as the proportion of WGA-positive cells.

Фиг. 18. Целевое взаимодействие AAV9-BXA-196477 или AAV9-BXA-213788, определенное у mdx4cv мышей 4-недельного возраста. Фиг. 18А показывает схематические изображения полипептидов миниатюризированного дистрофина ВХА-196477 (SEQ ID NO: 118) и ВХА-213788 (SEQ ID NO: 152). Фиг. 18В представляет гистограмму, показывающую относительное количество вирусных геномов в мышечной ткани mdx4cv мышей, обработанных AAV9-BXA-196477 или AAV9-BXA-213788. Фиг. 18СFig. 18. Target interaction of AAV9-BXA-196477 or AAV9-BXA-213788 determined in 4-week-old mdx 4cv mice. Fig. 18A shows schematic drawings of miniaturized dystrophin polypeptides BXA-196477 (SEQ ID NO: 118) and BXA-213788 (SEQ ID NO: 152). Fig. 18B is a histogram showing the relative abundance of viral genomes in muscle tissue of mdx 4cv mice treated with AAV9-BXA-196477 or AAV9-BXA-213788. Fig. 18C

- 7 046419 представляет гистограмму, показывающую относительное количество мРНК миниатюризированного дистрофина в сердце у mdx4cv мышей, обработанных AAV9-BXA-196477 или AAV9-BXA-213788. Фиг. 18D представляет гистограмму, показывающую относительное количество миниатюризированного белка дистрофина в мышечной ткани мышей, обработанных AAV9-BXA-196477 или AAV9-BXA-213788. Dia = диафрагма; Gas = икроножная мышца; ТА = передняя большеберцовая мышца. Обработанные мыши сравнивались с диким типом и необработанными mdx4cv мышами.- 7 046419 presents a histogram showing the relative amount of miniaturized dystrophin mRNA in the heart of mdx 4cv mice treated with AAV9-BXA-196477 or AAV9-BXA-213788. Fig. 18D is a bar graph showing the relative amount of miniaturized dystrophin protein in muscle tissue of mice treated with AAV9-BXA-196477 or AAV9-BXA-213788. Dia = aperture; Gas = gastrocnemius muscle; TA = tibialis anterior muscle. Treated mice were compared with wild type and untreated mdx 4cv mice.

Фиг. 19А представляет гистограмму, показывающую количество креатинкиназы в сыворотке mdx4cv мышей (4-х недельных), обработанных AAV9-BXA-196477 или AAV9-BXA-213788. Фиг. 19В представляет гистограмму, показывающую количество креатинкиназы в сыворотке mdx4cv мышей (12-недельных), обработанных AAV9-BXA- 196477 или AAV9-BXA-213788. Обработанные мыши сравнивались с диким типом и необработанными mdx4cv мышами.Fig. 19A is a bar graph showing the amount of creatine kinase in the serum of mdx 4cv mice (4 weeks old) treated with AAV9-BXA-196477 or AAV9-BXA-213788. Fig. 19B is a bar graph showing the amount of creatine kinase in the serum of mdx 4cv mice (12 weeks old) treated with AAV9-BXA-196477 or AAV9-BXA-213788. Treated mice were compared with wild type and untreated mdx 4cv mice.

Фиг. 20. Пик тетанического сокращения в 2-месячном возрасте. Фиг. 20А представляет график, показывающий сократительные свойства (сила в Ньютон-метрах; Нм) у mdx4cv мышей, которых обрабатывали AAV9-BXA-196477 или AAV9-BXA-213788. Фиг. 20В представляет гистограмму, показывающую пик тетанического сокращения у обработанных мышей. Фиг. 20С представляет гистограмму, показывающую массу ТА у обработанных мышей. Фиг. 20D представляет гистограмму, показывающую соотношение сила/масса ТА у обработанных мышей. Обработанные мыши сравнивались с диким типом и необработанными mdx4cv мышами.Fig. 20. Peak tetanic contraction at 2 months of age. Fig. 20A is a graph showing contractile properties (force in Newton meters; Nm) of mdx 4cv mice treated with AAV9-BXA-196477 or AAV9-BXA-213788. Fig. 20B is a histogram showing the peak of tetanic contraction in treated mice. Fig. 20C is a bar graph showing TA mass in treated mice. Fig. 20D is a bar graph showing the TA strength/mass ratio in treated mice. Treated mice were compared with wild type and untreated mdx 4cv mice.

Фиг. 21. Защита от повреждения, вызванного сокращениями. Фиг. 21А показывает графическое изображение экспериментальной установки. Фиг. 21В представляет график, показывающий сократительные свойства (максимальный изометрический крутящий момент) мышц у мышей, обработанных AAV9BXA-196477 или AAV9-BXA- 213788. Обработанные мыши сравнивались с диким типом и необработанными mdx4cv мышами.Fig. 21. Protection against damage caused by contractions. Fig. 21A shows a graphical representation of the experimental setup. Fig. 21B is a graph showing contractile properties (maximum isometric torque) of muscles in mice treated with AAV9BXA-196477 or AAV9-BXA-213788. Treated mice were compared with wild type and untreated mdx 4cv mice.

Фиг. 22А показывает схематическое изображение полипептидов миниатюризированного дистрофина ВХА-027741 (SEQ ID NO: SEQ ID NO: 129). Фиг. 22В представляет гистограмму, показывающую иммуногенность соединительных пептидов от 1 до 12.Fig. 22A shows a schematic representation of miniaturized dystrophin polypeptides BXA-027741 (SEQ ID NO: SEQ ID NO: 129). Fig. 22B is a bar graph showing the immunogenicity of connecting peptides 1 to 12.

Фиг. 23А представляет гистограмму, показывающую иммунный ответ МНС I/CD8+ на соединительные пептиды. Пептид J11v3 здесь представляет собой тот же пептид, что и пептид № 3 на фиг. 22В.Fig. 23A is a bar graph showing the MHC I/CD8+ immune response to junctional peptides. Peptide J11v3 here is the same peptide as peptide #3 in FIG. 22V.

Фиг. 23В представляет гистограмму, показывающую иммунный ответ МНС II/CD4+ на соединительные пептиды. Пептид J11v3 здесь представляет собой тот же пептид, что и пептид № 3 на фиг. 22В.Fig. 23B is a bar graph showing the MHC II/CD4+ immune response to junctional peptides. Peptide J11v3 here is the same peptide as peptide #3 in FIG. 22V.

5. Подробное описание изобретения.5. Detailed description of the invention.

5.1 Обзор5.1 Overview

Настоящее описание относится к новым миниатюризированным дистрофинам или генам, кодирующим их. Миниатюризированные дистрофины могут быть функционально связаны с регуляторной кассетой. Настоящее изобретение также относится к способам лечения субъекта, страдающего мышечной дистрофией, саркопенией, сердечной недостаточностью или кахексией. Кроме того, настоящее изобретение относится к способам профилактического лечения субъекта с риском развития мышечной дистрофии, саркопении, сердечной недостаточности или кахексии. Способы лечения субъекта, имеющего или имеющего риск развития мышечной дистрофин, саркопении, сердечной недостаточности или кахексии, могут включать введение субъекту фармацевтической композиции, включающей ген миниатюризированного дистрофина и носитель для доставки.The present description relates to new miniaturized dystrophins or genes encoding them. Miniaturized dystrophins can be functionally linked to the regulatory cassette. The present invention also provides methods for treating a subject suffering from muscular dystrophy, sarcopenia, heart failure or cachexia. In addition, the present invention provides methods for the prophylactic treatment of a subject at risk of developing muscular dystrophy, sarcopenia, heart failure, or cachexia. Methods of treating a subject who has or is at risk for developing muscular dystrophin, sarcopenia, heart failure, or cachexia may involve administering to the subject a pharmaceutical composition comprising the miniaturized dystrophin gene and a delivery vehicle.

5.2. Определения5.2. Definitions

Для более легкого понимания настоящего изобретения сначала даны определения некоторых терминов. Каждый из следующих терминов, используемых в данном изобретении, если иное явно не предусмотрено в данном документе, имеет значение, изложенное ниже. Дополнительные определения приводятся в приложении.For easier understanding of the present invention, definitions of certain terms are first given. Each of the following terms used in this invention, unless otherwise expressly provided herein, has the meaning set forth below. Additional definitions are provided in the appendix.

Термин и/или, используемый в данном документе, следует понимать как конкретное раскрытие каждого из двух указанных признаков или компонентов с другим или без другого. Таким образом, термин и/или, используемый в данном документе во фразе, такой как А и/или В, предназначен для включения А и В, А или В, А (только) и В (только). Аналогичным образом, термин и/или, используемый во фразе, такой как А, В и/или С, предназначен для охвата каждого из следующих аспектов: А, В и С; А, В или С; А или С; А или В; В или С; А и С; А и В; В и С; А (только); В (только); и С (только).The term and/or, as used herein, is to be understood as specifically disclosing each of the two specified features or components, with or without the other. Thus, the term and/or, as used herein in a phrase such as A and/or B, is intended to include A and B, A or B, A (only) and B (only). Likewise, the term and/or, when used in a phrase such as A, B and/or C, is intended to cover each of the following: A, B and C; A, B or C; A or C; A or B; B or C; A and C; A and B; B and C; A (only); B (only); and C (only).

Понятно, что везде, где аспекты описаны в данном документе с выражением содержащий, также предусмотрены аналогичные аспекты, описанные в терминах состоящий из и/или состоящий по существу из.It is understood that wherever aspects are described herein by the expression comprising, similar aspects described by the terms consisting of and/or consisting essentially of are also provided.

Если не указано иное, все технические и научные термины, используемые в данном документе, имеют то же значение, которое обычно понимается специалистом в данной области техники, к которой относится данное изобретение. Например, Concise Dictionary of Biomedicine and Molecular Biology, Juo, Pei-Show, 2nd ed., 2002, CRC Press; The Dictionary of Cell and Molecular Biology, 3rd ed., 1999, Academic Press; and the Oxford Dictionary Of Biochemistry And Molecular Biology, Revised, 2000, Oxford University Press, предоставляют специалистам общий словарь многих терминов, используемых в данном изобретеUnless otherwise specified, all technical and scientific terms used herein have the same meaning as commonly understood by one skilled in the art to which this invention relates. For example, Concise Dictionary of Biomedicine and Molecular Biology, Juo, Pei-Show, 2nd ed., 2002, CRC Press; The Dictionary of Cell and Molecular Biology, 3rd ed., 1999, Academic Press; and the Oxford Dictionary Of Biochemistry And Molecular Biology, Revised, 2000, Oxford University Press, provide those skilled in the art with a common dictionary of many of the terms used in this invention.

- 8 046419 нии.- 8 046419 ni.

Единицы, префиксы и символы обозначаются в их принятой Systeme International de Unites (SI) форме. Числовые диапазоны включают числа, определяющие диапазон. Заголовки, представленные в данном документе, не являются ограничениями различных аспектов изобретения, которые могут быть получены путем ссылки на описание в целом.Units, prefixes and symbols are designated in their accepted Systeme International de Unites (SI) form. Numeric ranges include numbers that define a range. The headings presented herein are not intended to limit the various aspects of the invention, which may be derived by reference to the description as a whole.

Соответственно, термины, определенные непосредственно ниже, более полно определены со ссылкой на спецификацию в целом.Accordingly, the terms defined immediately below are more fully defined by reference to the specification as a whole.

Дистрофин (DMD) представляет собой большой, связанный с Х-хромосомой ген человека, кодирующий дистрофин. Белок дистрофин представляет собой цитоскелетный белок с молекулярной массой 427 кДа, который локализуется на цитоплазматической стороне сарколеммы и обогащен костамерами в мышечных волокнах. Белок дистрофин имеет четыре основных функциональных домена: аминоконцевой актин-связывающий домен (ABD1); центральный, имеющий стержнеобразную форму домен, содержащий ряд участков стержнеобразной формы, называемых доменами спектриновых повторов, и шарнирных участков; богатый цистеином домен; и карбоксильный концевой домен.Dystrophin (DMD) is a large, X-linked human gene encoding dystrophin. The dystrophin protein is a cytoskeletal protein with a molecular mass of 427 kDa, which is localized on the cytoplasmic side of the sarcolemma and is enriched in costameres in muscle fibers. The dystrophin protein has four main functional domains: the amino-terminal actin-binding domain (ABD1); a central rod-shaped domain containing a number of rod-shaped regions called spectrin repeat domains and hinge regions; cysteine-rich domain; and a carboxyl-terminal domain.

Как использовано в данном описании, термин полипептид миниатюризированного дистрофина или пептид миниатюризированного дистрофина относится к полипептиду, который меньше по размеру, чем полноразмерный полипептид дистрофина дикого типа. В некоторых вариантах осуществления полипептид миниатюризированного дистрофина способен к изменению (увеличению или уменьшению, в зависимости от обстоятельств) измеримого показателя физиологии и анатомии мышц в модели животного с диагнозом DMD по меньшей мере приблизительно на 10 или 20% от показателя у дикого типа, так что показатель приближается к показателю у дикого типа (например, мышь mdx имеет измеримый показатель физиологии или анатомии мышц, который составляет 50% от показателя у дикого типа, и данный показатель увеличивается по меньшей мере на 60% от показателя у дикого типа; или мышь mdx имеет измеримый показатель физиологии или анатомии мышц, который составляет 150% от показателя у дикого типа, и данный показатель уменьшается максимально до 140% от показателя у дикого типа). В некоторых вариантах осуществления полипептид миниатюризированного дистрофина способен изменять измеримый показатель мышечной физиологии и анатомии в модели животного с DMD по меньшей мере приблизительно на 30% от показателя у дикого типа. В некоторых вариантах осуществления полипептид миниатюризированного дистрофина способен изменять измеримый показатель физиологии или анатомии мышц в модели животного с DMD до уровня, близкого к показателю у дикого типа (например, ЙЙЙ 4%). Как использовано в данном описании, термин спектриновые повторы или спектрин-подобные повторы относится к пептидам, состоящим из приблизительно 100 аминокислот, которые ответственны за стержнеобразную форму многих структурных белков, включая, но не ограничиваясь этим, дистрофин, причем спектриновые повторы обычно присутствуют в нескольких копиях. Спектриновые повторы могут включать в себя мутации последовательностей природных пептидов, такие как консервативные и/или неконсервативные изменения в аминокислотной последовательности, а также добавление или удаление вплоть до 1, 2, 3, 4, 5, 6, 7, 8, 9 или 10 аминокислот до/от конца спектринового повтора или внутри спектринового повтора. В некоторых вариантах осуществления каждый спектриновый повтор (каждый из от R1 до R24) имеет по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98%, по меньшей мере 99%, или 100% идентичности последовательности с природным спектриновым повтором (каждым из природных R1 до R24).As used herein, the term miniaturized dystrophin polypeptide or miniaturized dystrophin peptide refers to a polypeptide that is smaller in size than the full-length wild-type dystrophin polypeptide. In some embodiments, the miniaturized dystrophin polypeptide is capable of altering (increasing or decreasing, as appropriate) a measurable measure of muscle physiology and anatomy in a DMD animal model by at least about 10 or 20% of that of the wild type, such that the score approaches that of the wild type (e.g., the mdx mouse has a measurable measure of muscle physiology or anatomy that is 50% of that of the wild type, and this measure increases by at least 60% of that of the wild type; or the mdx mouse has measurable a measure of muscle physiology or anatomy that is 150% of that of the wild type, and this score is reduced to a maximum of 140% of that of the wild type). In some embodiments, the miniaturized dystrophin polypeptide is capable of altering a measurable measure of muscle physiology and anatomy in a DMD animal model by at least about 30% of that of the wild type. In some embodiments, the miniaturized dystrophin polypeptide is capable of altering a measurable measure of muscle physiology or anatomy in a DMD animal model to a level similar to that of the wild type (eg, YYY 4%). As used herein, the term spectrin repeats or spectrin-like repeats refers to peptides of approximately 100 amino acids that are responsible for the rod-like shape of many structural proteins, including, but not limited to, dystrophin, with spectrin repeats typically present in multiple copies . Spectrin repeats can include mutations of natural peptide sequences, such as conservative and/or non-conservative changes in amino acid sequence, as well as additions or deletions of up to 1, 2, 3, 4, 5, 6, 7, 8, 9 or 10 amino acids to/from the end of a spectrin repeat or within a spectrin repeat. In some embodiments, each spectrin repeat (each of R1 to R24) has at least 70%, at least 75%, at least 80%, at least 85%, at least 90%, at least 95 %, at least 96%, at least 97%, at least 98%, at least 99%, or 100% sequence identity with a natural spectrin repeat (each of natural R1 to R24).

Используемый в данном документе термин последовательности, кодирующие спектриновые повторы относится к последовательностям нуклеиновой кислоты, кодирующим пептиды спектриновых повторов. Данный термин включает в себя природные и синтетические последовательности нуклеиновых кислот, кодирующих спектриновые повторы (например, как встречающиеся в природе, так и мутированные пептиды спектриновых повторов).As used herein, the term spectrin repeat encoding sequences refers to nucleic acid sequences encoding spectrin repeat peptides. The term includes natural and synthetic nucleic acid sequences encoding spectrin repeats (eg, both naturally occurring and mutated spectrin repeat peptides).

Как использовано в данном описании, термин домен спектринового повтора относится к области в полипептиде миниатюризированного дистрофина, которая содержит спектриновые повторы полипептида миниатюризированного дистрофина. Термин слитый относится к первой аминокислотной последовательности, которая связана в рамке считывания со второй аминокислотной последовательностью, с которой она обычно не связана в природе, образуя слитый белок/полипептид. Данные слитые аминокислотные последовательности, которые обычно существуют в виде отдельных белков, могут быть объединены в слитом полипептиде, или аминокислотные последовательности, которые обычно существуют в том же белке, могут быть размещены в новом порядке в слитом полипептиде. Слитый белок создают, например, путем химического синтеза пептидов или с помощью технологии рекомбинантной ДНК, посредством которой создается и затем транслируется полинуклеотид, при этом участки пептида кодируются в желаемой взаимосвязи. Слитый белок также может содержать вторую аминокислотную последовательность, связанную с первой аминокислотной последовательностью ковалентной непептидной связью или нековалентной связью. В некоторых вариантах осуществления слияние двух полипептидов достигается посредством линкера. Линкеры могут быть аминокислотами или другими химическими структурами. В некоторых вариантах осуществления линкеры могут быть синтетическими.As used herein, the term spectrin repeat domain refers to a region in a miniaturized dystrophin polypeptide that contains spectrin repeats of a miniaturized dystrophin polypeptide. The term fusion refers to a first amino acid sequence that is linked in frame to a second amino acid sequence to which it is not normally associated in nature, forming a fusion protein/polypeptide. These fusion amino acid sequences, which typically exist as separate proteins, can be combined in a fusion polypeptide, or amino acid sequences that typically exist in the same protein can be arranged in a new arrangement in a fusion polypeptide. The fusion protein is created, for example, by chemical synthesis of peptides or by recombinant DNA technology, by which a polynucleotide is created and then translated, with sections of the peptide being encoded in the desired relationship. The fusion protein may also comprise a second amino acid sequence linked to the first amino acid sequence by a covalent non-peptide bond or non-covalent bond. In some embodiments, the fusion of two polypeptides is achieved through a linker. Linkers can be amino acids or other chemical structures. In some embodiments, the linkers may be synthetic.

- 9 046419- 9 046419

В некоторых вариантах осуществления слияние между двумя полипептидами представляет собой прямое слияние, то есть без промежуточного линкера. Термин слитый непосредственно или прямое слияние относится к связи между двумя полипептидными цепями посредством пептидной связи. Например, первая аминокислота непосредственно слита со второй аминокислотой, когда первая аминокислота слита со второй аминокислотой посредством пептидной связи. Гетерологичный и гетерологичный фрагмент применительно к полипептидному фрагменту или полинуклеотидному фрагменту, который является частью более крупного полипептида или полинуклеотида, соответственно, описывает полипептид или полинуклеотид, который происходит от полипептида или полинуклеотида, отличного от остальной части полипептида или полинуклеотидной молекулы. Дополнительный гетерологичный компонент полипептида или полинуклеотида может происходить из того же организма, что и остальная часть полипептида или полинуклеотида, соответственно, описанная в данном документе, или дополнительные компоненты могут быть из другого организма. Например, гетерологичный полипептид может быть синтетическим или полученным от другого вида, другого типа клеток индивидуума или одного и того же или другого типа клеток различных индивидуумов. В одном аспекте гетерологичный фрагмент представляет собой полипептид, слитый с другим полипептидом с образованием полипептида. В другом аспекте гетерологичный фрагмент представляет собой неполипептид, такой как ПЭГ, конъюгированный с полипептидом или белком.In some embodiments, the fusion between two polypeptides is a direct fusion, that is, without an intermediate linker. The term directly fused or direct fused refers to the connection between two polypeptide chains via a peptide bond. For example, a first amino acid is directly fused to a second amino acid when the first amino acid is fused to a second amino acid via a peptide bond. Heterologous and heterologous fragment, when referring to a polypeptide fragment or polynucleotide fragment that is part of a larger polypeptide or polynucleotide, respectively, describes a polypeptide or polynucleotide that is derived from a polypeptide or polynucleotide different from the rest of the polypeptide or polynucleotide molecule. The additional heterologous component of the polypeptide or polynucleotide may be from the same organism as the remainder of the polypeptide or polynucleotide, respectively, described herein, or the additional components may be from a different organism. For example, a heterologous polypeptide may be synthetic or derived from a different species, a different cell type of an individual, or the same or a different cell type of different individuals. In one aspect, a heterologous fragment is a polypeptide fused to another polypeptide to form a polypeptide. In another aspect, the heterologous fragment is a non-polypeptide, such as a PEG, conjugated to a polypeptide or protein.

Используемый в данном документе термин мышечная клетка относится к клетке, полученной из мышечной ткани, включая, но без ограничения, клетки, полученные из скелетной мышцы, гладкой мышцы (например, из пищеварительного тракта, мочевого пузыря и кровеносных сосудов) и сердечной мышцы. Термин включает мышечные клетки in vitro, ex vivo и in vivo. Таким образом, например, выделенный кардиомиоцит будет представлять ту же мышечную клетку, что и клетка в том виде, в котором она существует в мышечной ткани, присутствующей у субъекта in vivo. Данный термин также включает как окончательно дифференцированные, так и недифференцированные мышечные клетки, такие как миоциты, мышечные трубки, миобласты, кардиомиоциты и кардиомиобласты.As used herein, the term muscle cell refers to a cell derived from muscle tissue, including, but not limited to, cells derived from skeletal muscle, smooth muscle (eg, from the digestive tract, bladder and blood vessels), and cardiac muscle. The term includes muscle cells in vitro, ex vivo and in vivo. Thus, for example, an isolated cardiomyocyte will represent the same muscle cell as the cell as it exists in muscle tissue present in a subject in vivo. The term also includes both terminally differentiated and undifferentiated muscle cells such as myocytes, myotubes, myoblasts, cardiomyocytes and cardiomyoblasts.

Как использовано в данном описании, термин мышечно-специфический в отношении регуляторного элемента гена (например, энхансерной последовательности, промоторной последовательности) означает, что регуляторный элемент управляет транскрипционной активностью, прежде всего, в мышечных клетках или тканях (например, 20:1) по сравнению с транскрипционной активностью, управляемой регуляторным элементом в других тканях. Анализы для определения мышечной специфичности регуляторного элемента известны в данной области техники (например, анализ in vitro с использованием мышиных мышечных клеток и клеток печени, трансфицированных вектором экспрессии, содержащим проверяемый регуляторный элемент, управляющий экспрессией репортера бета-галактозида).As used herein, the term muscle-specific with respect to a gene regulatory element (eg, enhancer sequence, promoter sequence) means that the regulatory element controls transcriptional activity primarily in muscle cells or tissues (eg, 20:1) versus with transcriptional activity controlled by a regulatory element in other tissues. Assays to determine muscle specificity of a regulatory element are known in the art (eg, in vitro assays using murine muscle and liver cells transfected with an expression vector containing the regulatory element of interest driving beta-galactoside reporter expression).

Используемый в данном документе термин аденоассоциированный вирус или AAV включает, но не ограничивается ими, AAV тип 1, AAV тип 2, AAV тип 3 (включая типы 3А и 3В), AAV тип 4, AAV тип 5, AAV тип 6, AAV тип 7, AAV тип 8, AAV тип 9, AAV тип 10, AAV тип 11, AAV тип 12, AAV тип 13, змеиный AAV, птичий AAV, бычий AAV, собачий AAV, конский AAV, овечий AAV, козий AAV, креветочный AAV, AAV примата, AAV не примата и овечий AAV, серотипы и клады AAV, раскрытые Gao et al. (J. Virol. 78: 6381 (2004)) и Moris et al. (Virol. 33: 375 (2004)) и любой другой AAV, известный в настоящее время или обнаруженный позже. См., например, Fields et al. VIROLOGY, volume 2, chapter 69 (4th ed., Lippincott-Raven Publishers). AAV относится к Dependoparvovirus в семействе вирусов Parvoviridae. Например, AAV может быть AAV, полученным из природного вируса дикого типа, AAV, полученным из генома рекомбинантного AAV (rAAV), упакованного в капсид, полученный из капсидных белков, кодируемых встречающимся в природе геном cap, и/или генома rAAV, упакованного в капсид, полученный из капсидных белков, кодируемых не встречающимся в природе геном cap. Используемый в данном документе термин AAV может использоваться для обозначения самого вируса или его производных. Термин охватывает все подтипы и как встречающиеся в природе, так и рекомбинантные формы, если явно не указано иное. AAV примата относится к AAV, который заражает приматов, AAV не примата относится к AAV, который который заражает млекопитающих, не относящихся к приматам, бычий AAV относится к AAV, которые заражают млекопитающих, относящихся к крупному рогатому скоту и т.д. См., например, BERNARD N. FIELDS et al., VIROLOGY, volume 2, chapter 69 (3 d ed., Lippincott-Raven Publishers).As used herein, the term adeno-associated virus or AAV includes, but is not limited to, AAV type 1, AAV type 2, AAV type 3 (including types 3A and 3B), AAV type 4, AAV type 5, AAV type 6, AAV type 7 , AAV type 8, AAV type 9, AAV type 10, AAV type 11, AAV type 12, AAV type 13, snake AAV, avian AAV, bovine AAV, canine AAV, equine AAV, ovine AAV, goat AAV, shrimp AAV, AAV primate, non-primate AAV and ovine AAV, AAV serotypes and clades disclosed by Gao et al. (J. Virol. 78: 6381 (2004)) and Moris et al. (Virol. 33: 375 (2004)) and any other AAV currently known or discovered later. See, for example, Fields et al. VIROLOGY, volume 2, chapter 69 (4th ed., Lippincott-Raven Publishers). AAV belongs to the Dependoparvovirus in the Parvoviridae family of viruses. For example, the AAV may be AAV derived from a naturally occurring wild-type virus, AAV derived from a recombinant AAV (rAAV) genome packaged in a capsid derived from capsid proteins encoded by a naturally occurring cap gene, and/or an rAAV genome packaged in a capsid , derived from capsid proteins encoded by the non-naturally occurring cap gene. As used herein, the term AAV may be used to refer to the virus itself or its derivatives. The term covers all subtypes and both naturally occurring and recombinant forms, unless explicitly stated otherwise. Primate AAV refers to AAV that infects primates, non-primate AAV refers to AAV that infects non-primate mammals, bovine AAV refers to AAVs that infect bovine mammals, etc. See, for example, BERNARD N. FIELDS et al., VIROLOGY, volume 2, chapter 69 (3rd ed., Lippincott-Raven Publishers).

Термин rAAV относится к рекомбинантному AAV. В некоторых вариантах осуществления рекомбинантный AAV имеет геном AAV, в котором часть или все гены rep и cap заменены гетерологичными полинуклеотидными последовательностями. Используемый в данном документе термин вектор AAV или вектор аденоассоциированного вируса относится к rAAV, содержащему полинуклеотидную последовательность, не происходящую от AAV (т.е. полинуклеотид, гетерологичный по отношению к AAV), обычно последовательность, представляющую интерес для генетической трансформации клетки. В общем, гетерологичный полинуклеотид фланкирован по меньшей мере одной и, как правило, двумя последовательностями инвертированных концевых повторов (ITR) AAV.The term rAAV refers to recombinant AAV. In some embodiments, the recombinant AAV has an AAV genome in which some or all of the rep and cap genes are replaced with heterologous polynucleotide sequences. As used herein, the term AAV vector or adeno-associated virus vector refers to an rAAV containing a polynucleotide sequence not derived from AAV (ie, a polynucleotide heterologous to AAV), typically a sequence of interest for the genetic transformation of a cell. In general, a heterologous polynucleotide is flanked by at least one and typically two AAV inverted terminal repeat (ITR) sequences.

Без капсида или безкапсидный (или их варианты) вирусный (например, AAV) геном или молекула нуклеиновой кислоты относится к геному или молекуле нуклеиновой кислоты, свободной от капсиCapsidless or capsidless (or variants thereof) viral (e.g., AAV) genome or nucleic acid molecule refers to a genome or nucleic acid molecule free of capsid

- 10 046419 да. В некоторых вариантах осуществления безкапсидный геном или молекула нуклеиновой кислоты не содержит последовательностей, кодирующих, например, белок Rep AAV.- 10 046419 yes. In some embodiments, the capsidless genome or nucleic acid molecule does not contain sequences encoding, for example, the AAV Rep protein.

AAV, или AAV вирусная частица, или AAV вектор, или rAAV векторная частица относится к вирусной частице, состоящей по меньшей мере из одного капсидного белка AAV (обычно из всех капсидных белков AAV дикого типа) и инкапсидированного полинуклеотида. Если частица содержит гетерологичный полинуклеотид (то есть полинуклеотид, отличный от генома AAV дикого типа, например, трансген, который должен быть доставлен в клетку млекопитающего), ее обычно называют векторной частицей rAAV или просто вектором AAV Термин вирус-помощник для AAV относится к вирусу, который позволяет AAV (например, AAV дикого типа) реплицироваться и упаковываться с помощью клетки млекопитающего. В данной области техники известно множество таких вирусов-помощников для AAV, включая аденовирусы, герпесвирусы и поксвирусы, такие как вирус коровьей оспы. Аденовирусы охватывают ряд различных подгрупп, однако наиболее широко применяется аденовирус типа 5 подгруппы С. Многочисленные аденовирусы человека, млекопитающих, отличных от человека, и птичьего происхождения известны и доступны из депозитариев, таких как АТСС. Вирусы семейства герпесвирусов включают, например, вирусы простого герпеса (HSV) и вирусы Эпштейна-Барра (EBV), а также цитомегаловирусы (CMV) и вирусы псевдобешенства (PRV); которые также доступны из депозитариев, таких как АТСС.AAV, or AAV viral particle, or AAV vector, or rAAV vector particle refers to a viral particle consisting of at least one AAV capsid protein (typically all wild-type AAV capsid proteins) and an encapsidated polynucleotide. If the particle contains a heterologous polynucleotide (that is, a polynucleotide different from the wild-type AAV genome, such as a transgene that is to be delivered into a mammalian cell), it is usually called an rAAV vector particle or simply an AAV vector. The term helper virus for AAV refers to the virus that which allows AAV (eg, wild-type AAV) to replicate and be packaged by a mammalian cell. There are many such AAV helper viruses known in the art, including adenoviruses, herpesviruses, and poxviruses such as vaccinia virus. Adenoviruses span a number of different subgroups, but the most widely used adenovirus is type 5 subgroup C. Numerous adenoviruses of human, non-human mammalian, and avian origin are known and are available from repositories such as ATCC. Viruses of the herpesvirus family include, for example, herpes simplex viruses (HSV) and Epstein-Barr viruses (EBV), as well as cytomegaloviruses (CMV) and pseudorabies viruses (PRV); which are also available from depositories such as ATCC.

Используемый в данном документе термин инвертированный концевой повтор (inverted terminal repeat или ITR) относится к одноцепочечной последовательности нуклеотидов с последующей за ней по направлению транскрипции обратно-комплементарной последовательностью. Промежуточная последовательность нуклеотидов между начальной последовательностью и обратно-комплементарной последовательностью может иметь любую длину, включая ноль. Геном AAV обычно содержит инвертированные концевые повторы (ITR) на обоих концах, причем каждый конец обычно является палиндромным и может образовывать шпильку. Термины полинуклеотид и нуклеиновая кислота используются в данном документе взаимозаменяемо и относятся к биополимеру, состоящему из множества нуклеотидных мономеров, ковалентно связанных в цепь.As used herein, the term inverted terminal repeat (ITR) refers to a single-stranded sequence of nucleotides followed by a reverse complementary sequence in the direction of transcription. The intermediate nucleotide sequence between the initial sequence and the reverse complementary sequence can be of any length, including zero. The AAV genome typically contains inverted terminal repeats (ITRs) at both ends, with each end typically being palindromic and capable of forming a hairpin. The terms polynucleotide and nucleic acid are used interchangeably herein and refer to a biopolymer consisting of multiple nucleotide monomers covalently linked into a chain.

Используемый в данном документе термин тропизм относится к способности вируса (например, AAV) инфицировать только один или несколько конкретных типов клеток и его способности взаимодействовать только с конкретными фрагментами клеточной поверхности для достижения входа в клетку, необязательно и предпочтительно с последующей экспрессией (например, транскрипция и, при необходимости, трансляция) последовательностей, переносимых вирусом (например, AAV) в клетку (например, для рекомбинантного вируса, экспрессия гетерологичной нуклеотидной последовательности (последовательностей)).As used herein, the term tropism refers to the ability of a virus (e.g., AAV) to infect only one or a few specific cell types and its ability to interact only with specific cell surface fragments to achieve cell entry, optionally and preferably followed by expression (e.g., transcription and , if necessary, translation) of sequences carried by a virus (eg, AAV) into the cell (eg, for a recombinant virus, expression of heterologous nucleotide sequence(s)).

Как использовано в данном описании, термин трансдукция относится к проникновению вируса (например, AAV) в клетку и переносу генетического материала, содержащегося внутри вируса в клетку, с тем чтобы получить экспрессию из вирусного генома. Обычно вирус (например, AAV) проникает в клетки в соответствии со своим тропизмом.As used herein, the term transduction refers to the entry of a virus (eg, AAV) into a cell and the transfer of genetic material contained within the virus into the cell to obtain expression from the viral genome. Typically, a virus (eg AAV) enters cells according to its tropism.

Введение относится к физическому введению терапевтического средства субъекту с использованием любого из различных способов и систем доставки, известных специалистам в данной области техники. Примеры способов введения, например, для терапии AAV, включают внутривенное, внутримышечное, внутриартериальное, интратекальное, внутрилимфатическое, внутриочаговое, интракапсулярное, внутриглазничное, внутрисердечное, внутрикожное, внутрибрюшинное, транстрахеальное, подкожное, субтикулярное, внутрисуставное, субкапсулярное, субарахноидальное, внутриспинальное, эпидуральное, интрастернальное, пероральное, ректальное, местное, эпидермальное, через слизистую оболочку, интраназальное, вагинальное, ректальное и сублингвальное введение. Введение также может выполняться, например, один раз, множество раз и/или в течение одного или нескольких продолжительных периодов.Administration refers to the physical administration of a therapeutic agent to a subject using any of the various delivery methods and systems known to those skilled in the art. Examples of routes of administration, for example, for AAV therapy include intravenous, intramuscular, intraarterial, intrathecal, intralymphatic, intralesional, intracapsular, intraorbital, intracardiac, intradermal, intraperitoneal, transtracheal, subcutaneous, subticular, intraarticular, subcapsular, subarachnoid, intraspinal, epidural, intrasternal , oral, rectal, topical, epidermal, transmucosal, intranasal, vaginal, rectal and sublingual administration. Administration may also be performed, for example, once, multiple times and/or over one or more extended periods.

Термин лечение или терапия субъекта относится к любому типу вмешательства или процесса, выполняемого на субъекте, или введение активного средства субъекту с целью обращения, облегчения, ослабления, ингибирования, замедления или предотвращения начала, прогрессирования, развития, тяжести или рецидива симптома, осложнения, состояния или биохимических показателей, связанных с заболеванием. Терапевтически эффективное количество, терапевтическая доза, эффективная доза или эффективная дозировка, как используется в данном документе, означает количество или дозу, которая достигает терапевтической цели, как описано в данном документе. Специалист в данной области техники также поймет, что терапевтически эффективное количество и т.д. может быть введено в виде одноразовой дозы или может быть достигнуто путем введения нескольких доз (т.е. 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более доз). Способность терапевтического средства способствовать регрессу заболевания или ингибировать развитие или рецидив заболевания может быть оценена с использованием различных способов, известных квалифицированному практикующему врачу, например, у людей во время клинических испытаний, в модельных системах на животных, которые позволяют прогнозировать эффективность лечения больных, или путем анализа активности средства в анализах in vitro.The term treatment or therapy of a subject refers to any type of intervention or process performed on a subject, or the administration of an active agent to a subject, for the purpose of reversing, ameliorating, attenuating, inhibiting, delaying or preventing the onset, progression, development, severity or recurrence of a symptom, complication, condition or biochemical parameters associated with the disease. A therapeutically effective amount, therapeutic dose, effective dose or effective dosage as used herein means an amount or dose that achieves a therapeutic goal as described herein. One skilled in the art will also appreciate that a therapeutically effective amount, etc. may be administered as a single dose or may be achieved by administering multiple doses (ie, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 or more doses). The ability of a therapeutic agent to promote disease regression or inhibit the development or relapse of disease can be assessed using various methods known to the skilled practitioner, for example, in humans during clinical trials, in animal model systems that predict the effectiveness of treatment in patients, or by analysis activity of the drug in in vitro assays.

Субъект включает любого человека или животное, не относящееся к человеку. Термин не отноSubject includes any person or non-human animal. The term does not refer

- 11 046419 сящееся к человеку животное включает, без ограничения, позвоночных, таких как не относящиеся к человеку приматы, овцы, собаки и грызуны, такие как мыши, крысы и морские свинки. В некоторых вариантах осуществления субъектом является человек. Термины субъект и пациент используются в данном документе взаимозаменяемо.- 11 046419 human-related animals include, but are not limited to, vertebrates such as non-human primates, sheep, dogs and rodents such as mice, rats and guinea pigs. In some embodiments, the subject is a human. The terms subject and patient are used interchangeably throughout this document.

Используемые в данном документе термины мкг и мкМ используются взаимозаменяемо с μί и μМ, соответственно.As used herein, the terms μg and μM are used interchangeably with μί and μM, respectively.

Использование альтернативы (например, или) следует понимать как означающее одну, обе или любую их комбинацию из альтернатив. Используемые в данном документе неопределенные артикли а или an следует понимать как относящиеся к одному или нескольким из любого перечисленного или перенумерованного компонента или объекта.The use of an alternative (for example, or) should be understood to mean one, both, or any combination of the alternatives. When used herein, the indefinite articles a or an are to be understood as referring to one or more of any listed or renumbered component or entity.

Приблизительно или около: Используемый в данном документе термин приблизительно или около применительно к одному или нескольким интересующим значениям относится к значению, которое аналогично заявленному эталонному значению и находится в диапазоне значений, которые попадают в пределы 25, 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 1% или менее в любом направлении (более чем или менее чем) от заявленного эталонного значения, если иное не указано или иное не очевидно из контекста (за исключением случаев, когда такое количество превышает 100% от возможного значения). Когда термин приблизительно или около применяется в данном документе к конкретному значению, значение без термина приблизительно или около также раскрывается в данном документе.About or About: As used herein, the term about or about when applied to one or more values of interest refers to a value that is similar to the stated reference value and is within the range of values that fall within the limits of 25, 20, 19, 18, 17, 16. 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 1% or less in any direction (more than or less than) of the stated reference value, unless otherwise stated or otherwise not obvious from the context (unless such amount exceeds 100% of the possible value). When the term about or about is applied herein to a specific meaning, a meaning without the term about or about is also disclosed herein.

Как описано в данном документе, любой диапазон концентраций, процентный диапазон, диапазон соотношений или целочисленный диапазон следует понимать как включающий значение любого целого числа в указанном диапазоне и, при необходимости, его доли (например, одну десятую и одну сотую целого числа), если не указано иное. Различные аспекты изобретения более подробно описаны в следующих подразделах.As described herein, any concentration range, percentage range, ratio range, or integer range should be understood to include the value of any integer within the specified range and, as appropriate, fractions thereof (e.g., one tenth and one hundredth of an integer), unless otherwise stated. Various aspects of the invention are described in more detail in the following subsections.

5.3. Полинуклеотиды и полипептиды.5.3. Polynucleotides and polypeptides.

5.3.1. Миниатюризированный дистрофин5.3.1. Miniaturized dystrophin

Настоящее изобретение относится к молекуле нуклеиновой кислоты, содержащей нуклеотидную последовательность, которая кодирует полипептид миниатюризированного дистрофина. В некоторых вариантах осуществления полипептид миниатюризированного дистрофина содержит по меньшей мере три шарнирных домена дистрофина и по меньшей мере пять доменов спектриновых повторов. Дистрофин представляет собой палочковидный цитоплазматический белок, который соединяет цитоскелет мышечного волокна с окружающим внеклеточным матриксом через клеточную мембрану. Данный белок находится, в основном, в мышцах, используемых для движения (скелетные мышцы), и в сердечной (кардио) мышце. В нервных клетках головного мозга присутствует небольшое количество дистрофина. В скелетных и сердечных мышцах дистрофин является частью группы белков (белкового комплекса), которые работают вместе, чтобы укрепить мышечные волокна и защитить их от травм при сокращении и расслаблении мышц. Комплекс дистрофина действует как якорь, соединяя структурный каркас каждой мышечной клетки (цитоскелет) с сетью белков и других молекул вне клетки (внеклеточный матрикс). Комплекс дистрофина также может играть роль в передаче клеточных сигналов, взаимодействуя с белками, которые отправляют и получают химические сигналы.The present invention relates to a nucleic acid molecule containing a nucleotide sequence that encodes a miniaturized dystrophin polypeptide. In some embodiments, the miniaturized dystrophin polypeptide comprises at least three dystrophin hinge domains and at least five spectrin repeat domains. Dystrophin is a rod-shaped cytoplasmic protein that connects the muscle fiber cytoskeleton to the surrounding extracellular matrix through the cell membrane. This protein is found mainly in the muscles used for movement (skeletal muscle) and in the heart (cardio) muscle. Nerve cells in the brain contain small amounts of dystrophin. In skeletal and cardiac muscle, dystrophin is part of a group of proteins (protein complex) that work together to strengthen muscle fibers and protect them from injury during muscle contraction and relaxation. The dystrophin complex acts as an anchor, connecting the structural framework of each muscle cell (cytoskeleton) to the network of proteins and other molecules outside the cell (extracellular matrix). The dystrophin complex may also play a role in cell signaling by interacting with proteins that send and receive chemical signals.

Ген DMD, кодирующий полноразмерный белок дистрофина, является одним из самых длинных известных генов человека, охватывая 2,3 млн. пар нуклеотидов (0,08% генома человека) в локусе Хр21. Первичный транскрипт в мышцах имеет размер около 2100 тыс. пар нуклеотидов, и его транскрипция занимает 16 ч; зрелая мРНК имеет размер 14,0 тыс. пар нуклеотидов. Мышечный транскрипт из 79 экзонов кодирует белок из 3685 аминокислотных остатков.The DMD gene, encoding the full-length dystrophin protein, is one of the longest known human genes, spanning 2.3 million base pairs (0.08% of the human genome) at the Xp21 locus. The primary transcript in muscle is approximately 2100 kb in size and takes 16 h to transcribe; mature mRNA is 14.0 kb in size. The muscle transcript of 79 exons encodes a protein of 3685 amino acid residues.

Настоящее описание раскрывает аминокислоты и нуклеотидные последовательности для дистрофина. Аминокислотная последовательность, составляющая человеческий дистрофин дикого типа, изоформа Dp427m, известна как UniProt идентификатор № NP_003997.1 и показана в табл. 1.The present description discloses the amino acid and nucleotide sequences for dystrophin. The amino acid sequence constituting wild-type human dystrophin, isoform Dp427m, is known as UniProt identifier No. NP_003997.1 and is shown in Table. 1.

- 12 046419- 12 046419

Таблица 1Table 1

Аминокислотная последовательность полноразмерного белка дистрофина (NP 003997.1) SEQ ID NO: 1Amino acid sequence of full-length dystrophin protein (NP 003997.1) SEQ ID NO: 1

MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIENLFSDLQDGRRLLDL LEGLTGQKLPKEKGSTRVHALNNVNKALRVLQNNNVDLVNIGSTDIVDGNHKLT LGLIWNIILHWQVKNVMKNIMAGLQQTNSEKILLSWVRQSTRNYPQVNVINFTTS WSDGLALNALIHSHRPDLFDWNSVVCQQSATQRLEHAFNIARYQLGIEKLLDPED VDTTYPDKKSILMYITSLFQVLPQQVSIEAIQEVEMLPRPPKVTKEEHFQLHHQMH YSQQITVSLAQGYERTSSPKPRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSFMLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIENLFSDLQDGRRLLDL LEGLTGQKLPKEKGSTRVHALNNVNKALRVLQNNNVDLVNIGSTDIVDGNHKLT LGLIWNIILHWQVKNVMKNIMAGLQQTNSEKILLSWVRQSTRNYPQVNVINFTTS WSDGLALNALIHSHRPDLFDWNS VVCQQSATQRLEHAFNIARYQLGIEKLLDPED VDTTYPDKKSILMYITSLFQVLPQQVSIEAIQEVEMLPRPPKVTKEEHFQLHHQMH YSQQITVSLAQGYERTSSPKPRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSF

IGS SLMESEVNLDRYQTALEEVLSWLLS AEDTLQ AQGEISNDVEVVKDQFHTHEGY MMDLTAHQGRVGNILQLGSKLIGTGKLSEDEETEVQEQMNLLNSRWECLRVASM EKQSNLHRVLMDLQNQKLKELNDWLTKTEERTRKMEEEPLGPDLEDLKRQVQQ HKVLQEDLEQEQVRVNSLTHMVVVVDESSGDHATAALEEQLKVLGDRWANICR WTEDRWVLLQDILLKWQRLTEEQCLF S AWLSEKED A VNKIHTTGFKDQNEMLS S LQKLAVLKADLEKKKQSMGKLYSLKQDLLSTLKNKSVTQKTEAWLDNFARCWD NLVQKLEKSTAQISQAVTTTQPSLTQTTVMETVTTVTTREQILVKHAQEELPPPPP QKKRQITVDSEIRKRLDVDITELHSWITRSEAVLQSPEFAIFRKEGNFSDLKEKVNA IEREKAEKFRKLQDASRSAQALVEQMVNEGVNADSIKQASEQLNSRWIEFCQLLS ERLNWLEYQNNIIAFYNQLQQLEQMTTTAENWLKIQPTTPSEPTAIKSQLKICKDE VNRLSGLQPQIERLKIQSIALKEKGQGPMFLDADFVAFTNHFKQVFSDVQAREKEL QTIFDTLPPMRYQETMSAIRTWVQQSETKLSIPQLSVTDYEIMEQRLGELQALQSSL QEQQSGLYYLSTTVKEMSKKAPSEISRKYQSEFEEIEGRWKKLSSQLVEHCQKLEE QMNKLRKIQNHIQTLKKWMAEVDVFLKEEWPALGDSEILKKQLKQCRLLVSDIQ TIQPSLNSVNEGGQKIKNEAEPEFASRLETELKELNTQWDHMCQQVYARKEALKG GLEKTVSLQKDLSEMHEWMTQAEEEYLERDFEYKTPDELQKAVEEMKRAKEEA QQKEAKVKLLTESVNSVIAQAPPVAQEALKKELETLTTNYQWLCTRLNGKCKTLE EVWACWHELLSYLEKANKWLNEVEFKLKTTENIPGGAEEISEVLDSLENLMRHSE DNPNQIRILAQTLTDGGVMDELINEELETFNSRWRELHEEAVRRQKLLEQSIQSAQ ETEI<SLHLIQESLTFIDI<QLAAYIADI<VDAAQMPQEAQI<IQSDLTSHEISLEEMI<I< HNQGKEAAQRVLSQIDVAQKKLQDVSMKFRLFQKPANFEQRLQESKMILDEVKM HLPALETKSVEQEVVQSQLNHCVNLYKSLSEVKSEVEMVIKTGRQIVQKKQTENP KELDERVTALKLHYNELGAKVTERKQQLEKCLKLSRKMRKEMNVLTEWLAATD MELTKRSAVEGMPSNLDSEVAWGKATQKEIEKQKVHLKSITEVGEALKTVLGKK ETLVEDKLSLLNSNWIAVTSRAEEWLNLLLEYQKHMETFDQNVDHITKWIIQADTIGS SLMESEVNLDRYQTALEEVLSWLLS AEDTLQ AQGEISNDVEVVKDQFHTHEGY MMDLTAHQGRVGNILQLGSKLIGTGKLSEDEETEVQEQMNLLNSRWECLRVASM EKQSNLHRVLMDLQNQKLKELNDWLTKTEERTRKMEEEPLGPDLEDLKRQVQQ HKVLQEDLEQEQVRVNSLTH MVVVVDESSGDHATAALEEQLKVLGDRWANICR WTEDRWVLLQDILLKWQRLTEEQCLF S AWLSEKED A VNKIHTTGFKDQNEMLS S LQKLAVLKADLEKKKQSMGKLYSLKQDLLSTLKNKSVTQKTEAWLDNFARCWD NLVQKLEKSTAQISQAVTTTQPSLTQTTVMETVTTVTTREQILVKHAQ EELPPPPP QKKRQITVDSEIRKRLDVDITELHSWITRSEAVLQSPEFAIFRKEGNFSDLKEKVNA IEREKAEKFRKLQDASRSAQALVEQMVNEGVNADSIKQASEQLNSRWIEFCQLLS ERLNWLEYQNNIIAFYNQLQQLEQMTTTAENWLKIQPTTPSEPTAIKSQLKICKDE VNRLSGLQPQIERL KIQSIALKEKGQGPMFLDADFVAFTNHFKQVFSDVQAREKEL QTIFDTLPPMRYQETMSAIRTWVQQSETKLSIPQLSVTDYEIMEQRLGELQALQSSL QEQQSGLYYLSTTVKEMSKKAPSEISRKYQSEFEEIEGRWKKLSSQLVEHCQKLEE QMNKLRKIQNHIQTLKKWMAEVDVFLKEEWPAL GDSEILKKQLKQCRLLVSDIQ TIQPSLNSVNEGGQKIKNEAEPEFASRLETELKELNTQWDHMCQQVYARKEALKG GLEKTVSLQKDLSEMHEWMTQAEEEYLERDFEYKTPDELQKAVEEMKRAKEEA QQKEAKVKLLTESVNSVIAQAPPVAQEALKKELETLTTNYQWLCTRLNGKCKTLE EVW ACWHELLSYLEKANKWLNEVEFKLKTTENIPGGAEEISEVLDSLENLMRHSE DNPNQIRILAQTLTDGGVMDELINEELETFNSRWRELHEEAVRRQKLLEQSIQSAQ ETEI<SLHLIQESLTFIDI<QLAAYIADI<VDAAQMPQEAQI<IQSDLTSHEISLEEMI<I< HNQGKEAAQRVLSQIDVAQKKL QDVSMKFRLFQKPANFEQRLQESKMILDEVKM HLPALETKSVEQEVVQSQLNHCVNLYKSLSEVKSEVEMVIKTGRQIVQKKQTENP KELDERVTALKLHYNELGAKVTERKQQLEKCLKLSRKMRKEMNVLTEWLAATD MELTKRSAVEGMPSNLDSEVAWGKATQKEIEKQKVHLKSITEVGEALKTVLGKK ET LVEDKLSLLNSNWIAVTSRAEEWLNLLLEYQKHMETFDQNVDHITKWIIQADT

- 13 046419- 13 046419

LLDESEKKKPQQKEDVLKRLKAELNDIRPKVDSTRDQAANLMANRGDHCRKLVE PQISELNHRFAAISHRIKTGKASIPLKELEQFNSDIQKLLEPLEAEIQQGVNLKEEDF NKDMNEDNEGTVKELLQRGDNLQQRITDERKREEIKIKQQLLQTKHNALKDLRSQ RRKKALEISHQWYQYKRQADDLLKCLDDIEKKLASLPEPRDERKIKEIDRELQKK KEELNAVRRQAEGLSEDGAAMAVEPTQIQLSKRWREIESKFAQFRRLNFAQIHTV REETMMVMTEDMPLEISYVPSTYLTEITHVSQALLEVEQLLNAPDLCAKDFEDLF KQEESLKNIKDSLQQSSGRIDIIHSKKTAALQSATPVERVKLQEALSQLDFQWEKV NKMYKDRQGRFDRSVEKWRRFHYDIKIFNQWLTEAEQFLRKTQIPENWEHAKYK WYLKELQDGIGQRQTVVRTLNATGEEIIQQSSKTDASILQEKLGSLNLRWQEVCK QLSDRKKRLEEQKNILSEFQRDLNEFVLWLEEADNIASIPLEPGKEQQLKEKLEQV KLLVEELPLRQGILKQLNETGGPVLVSAPISPEEQDKLENKLKQTNLQWIKVSRAL PEKQGEIEAQIKDLGQLEKKLEDLEEQLNHLLLWLSPIRNQLEIYNQPNQEGPFDV QETEIAVQAKQPDVEEILSKGQHLYKEKPATQPVKRKLEDLSSEWKAVNRLLQEL RAKQPDLAPGLTTIGASPTQTVTLVTQPVVTKETAISKLEMPSSLMLEVPALADFN RAWTELTDWLSLLDQVIKSQRVMVGDLEDINEMIIKQKATMQDLEQRRPQLEELI TAAQNLKNKTSNQEARTIITDRIERIQNQWDEVQEHLQNRRQQLNEMLKDSTQWL EAKEEAEQVLGQARAKLESWKEGPYTVDAIQKKITETKQLAKDLRQWQTNVDV ANDLALKLLRDYSADDTRKVHMITENINASWRSIHKRVSEREAALEETHRLLQQF PLDLEKFLAWLTEAETTANVLQDATRKERLLEDSKGVKELMKQWQDLQGEIEAH TDVYHNLDENSQKILRSLEGSDDAVLLQRRLDNMNFKWSELRKKSLNIRSHLEAS SDQWKRLHLSLQELLVWLQLKDDELSRQAPIGGDFPAVQKQNDVHRAFKRELKT KEPVIMSTLETVRIFLTEQPLEGLEKLYQEPRELPPEERAQNVTRLLRKQAEEVNTE WEKLNLHSADWQRKIDETLERLQELQEATDELDLKLRQAEVIKGSWQPVGDLLID SLQDHLEKVKALRGEIAPLKENVSHVNDLARQLTTLGIQLSPYNLSTLEDLNTRW KLLQVAVEDRVRQLHEAHRDFGPASQHFLSTSVQGPWERAISPNKVPYYINHETQ TTCWDHPKMTELYQ SLADLNN VRF S AYRTAMKLRRLQKALCLDLLSLS AACD AL DQHNLKQNDQPMDILQIINCLTTIYDRLEQEHNNLVNVPLCVDMCLNWLLNVYD TGRTGRIRVLSFKTGIISLCKAHLEDKYRYLFKQVASSTGFCDQRRLGLLLHDSIQI PRQLGEVASFGGSNIEPSVRSCFQFANNKPEIEAALFLDWMRLEPQSMVWLPVLH RVAAAETAKHQAKCNICKECPIIGFRYRSLKHFNYDICQSCFFSGRVAKGHKMHY PMVEYCTPTTSGEDVRDFAKVLKNKFRTKRYFAKHPRMGYLPVQTVLEGDNMET PVTLINFWPVDSAPASSPQLSHDDTHSRIEHYASRLAEMENSNGSYLNDSISPNESI DDEHLLIQHYCQSLNQDSPLSQPRSPAQILISLESEERGELERILADLEEENRNLQAE YDRLKQQHEHKGLSPLPSPPEMMPTSPQSPRDAELIAEAKLLRQHKGRLEARMQI LEDHNKQLESQLHRLRQLLEQPQAEAKVNGTTVSSPSTSLQRSDSSQPMLLRVVG SQTSDSMGEEDLLSPPQDTSTGLEEVMEQLNNSFPSSRGRNTPGKPMREDTMLLDESEKKKPQQKEDVLKRLKAELNDIRPKVDSTRDQAANLMANRGDHCRKLVE PQISELNHRFAAISHRIKTGKASIPLKELEQFNSDIQKLLEPLEAEIQQGVNLKEEDF NKDMNEDNEGTVKELLQRGDNLQQRITDERKREEIKIKQQLLQTKHNALKDLRSQ RRKKALEISHQWYQYK RQADDLLKCLDDIEKKLASLPEPRDERKIKEIDRELQKK KEELNAVRRQAEGLSEDGAAMAVEPTQIQLSKRWREIESKFAQFRRLNFAQIHTV REETMMVMTEDMPLEISYVPSTYLTEITHVSQALLEVEQLLNAPDLCAKDFEDLF KQEESLKNIKDSLQQSSGRIDIIHSKKTAALQSATPVERVKLQEALSQLDFQW EKV NKMYKDRQGRFDRSVEKWRRFHYDIKIFNQWLTEAEQFLRKTQIPENWEHAKYK WYLKELQDGIGQRQTVVRTLNATGEEIIQQSSKTDASILQEKLGSLNLRWQEVCK QLSDRKKRLEEQKNILSEFQRDLNEFVLWLEEADNIASIPLEPGKEQQLKEKLEQV KLLVEELPLRQ GILKQLNETGGPVLVSAPISPEEQDKLENKLKQTNLQWIKVSRAL PEKQGEIEAQIKDLGQLEKKLEDLEEQLNHLLLWLSPIRNQLEIYNQPNQEGPFDV QETEIAVQAKQPDVEEILSKGQHLYKEKPATQPVKRKLEDLSSEWKAVNRLLQEL RAKQPDLAPGLTTIGASPTQTVTLVTQPV VTKETAISKLEMPSSLMLEVPALADFN RAWTELTDWLSLLDQVIKSQRVMVGDLEDINEMIIKQKATMQDLEQRRPQLEELI TAAQNLKNKTSNQEARTIITDRIERIQNQWDEVQEHLQNRRQQLNEMLKDSTQWL EAKEEAEQVLGQARAKLESWKEGPYTVDAIQKKITETKQLAKDLRQWQT NVDV ANDLALKLLRDYSADDTRKVHMITENINASWRSIHKRVSEREAALEETHRLLQQF PLDLEKFLAWLTEAETTANVLQDATRKERLLEDSKGVKELMKQWQDLQGEIEAH TDVYHNLDENSQKILRSLEGSDDAVLLQRRLDNMNFKWSELRKKSLNIRSHLEAS SDQWKRLHLSLQELLVWLQLKDDELSRQAPIGG DFPAVQKQNDVHRAFKRELKT KEPVIMSTLETVRIFLTEQPLEGLEKLYQEPRELPPEERAQNVTRLLRKQAEEVNTE WEKLNLHSADWQRKIDETLERLQELQEATDELDLKLRQAEVIKGSWQPVGDLLID SLQDHLEKVKALRGEIAPLKENVSHVNDLARQLTTLGIQLSPYNLSTLEDLNTRW KLLQV AVEDRVRQLHEAHRDFGPASQHFLSTSVQGPWERAISPNKVPYYINHETQ TTCWDHPKMTELYQ SLADLNN VRF S AYRTAMKLRRLQKALCLDLLSLS AACD AL DQHNLKQNDQPMDILQIINCLTTIYDRLEQEHNNLVNVPLCVDMCLNWLLNVYD TGRTGRIRVLSFKTGIISLCKAHLEDKYRYLFKQVASSTGFCD QRRLGLLLHDSIQI PRQLGEVASFGGSNIEPSVRSCFQFANNKPEIEAALFLDWMRLEPQSMVWLPVLH RVAAAETAKHQAKCNICKECPIIGFRYRSLKHFNYDICQSCFFSGRVAKGHKMHY PMVEYCTPTTSGEDVRDFAKVLKNKFRTKRYFAKHPRMGYLPVQTVLEGDNMET PVTLINFWPVDSAPASSPQLS HDDTHSRIEHYASRLAEMENSNGSYLNDSISPNESI DDEHLLIQHYCQSLNQDSPLSQPRSPAQILISLESEERGELERILADLEEENRNLQAE YDRLKQQHEHKGLSPLPSPPEMMPTSPQSPRDAELIAEAKLLRQHKGRLEARMQI LEDHNKQLESQLHRLRQLLEQPQAEAKVNGTTVSSPSTSLQRSDSSQPMLLR VVG SQTSDSMGEEDLLSPPQDTSTGLEEVMEQLNNSFPSSRGRNTPGKPMREDTM

В данной области техники известны различные другие изоформы дистрофина, образующиеся в ре зультате альтернативного сплайсинга. В некоторых вариантах осуществления конструкции содержат нуклеотидные последовательности, представленные в табл. 2.Various other dystrophin isoforms resulting from alternative splicing are known in the art. In some embodiments, the constructs contain the nucleotide sequences presented in table. 2.

Кроме того, в данном документе раскрыта нуклеотидная последовательность, кодирующая полноразмерной белок дистрофин.In addition, this document discloses the nucleotide sequence encoding the full-length dystrophin protein.

- 14 046419- 14 046419

Таблица 2table 2

Нуклеотидная последовательность полноразмерного белка дистрофина (изоформа Dp427m) SEQ ID NO: 2 GGGATTCCCTCACTTTCCCCCTACAGGACTCAGATCTGGGAGGCAATTACCTTC GGAGAAAAACGAATAGGAAAAACTGAAGTGTTACTTTTTTTAAAGCTGCTGAA GTTTGTTGGTTTCTCATTGTTTTTAAGCCTACTGGAGCAATAAAGTTTGAAGAA CTTTTACCAGGTTTTTTTTATCGCTGCCTTGATATACACTTTTCAAAATGCTTTG GTGGGAAGAAGTAGAGGACTGTTATGAAAGAGAAGATGTTCAAAAGAAAACA TTCACAAAATGGGTAAATGCACAATTTTCTAAGTTTGGGAAGCAGCATATTGA GAACCTCTTCAGTGACCTACAGGATGGGAGGCGCCTCCTAGACCTCCTCGAAG GCCTGACAGGGCAAAAACTGCCAAAAGAAAAAGGATCCACAAGAGTTCATGC CCTGAACAATGTCAACAAGGCACTGCGGGTTTTGCAGAACAATAATGTTGATT TAGTGAATATTGGAAGTACTGACATCGTAGATGGAAATCATAAACTGACTCTT GGTTTGATTTGGAATATAATCCTCCACTGGCAGGTCAAAAATGTAATGAAAAA TATCATGGCTGGATTGCAACAAACCAACAGTGAAAAGATTCTCCTGAGCTGGG TCCGACAATCAACTCGTAATTATCCACAGGTTAATGTAATCAACTTCACCACC AGCTGGTCTGATGGCCTGGCTTTGAATGCTCTCATCCATAGTCATAGGCCAGA CCTATTTGACTGGAATAGTGTGGTTTGCCAGCAGTCAGCCACACAACGACTGG AACATGCATTCAACATCGCCAGATATCAATTAGGCATAGAGAAACTACTCGAT CCTGAAGATGTTGATACCACCTATCCAGATAAGAAGTCCATCTTAATGTACAT CACATCACTCTTCCAAGTTTTGCCTCAACAAGTG AGCATTGAAGCCATCCAGGAAGT GGAAATGTTGCCAAGGCCACCTAAAGTGACTAAAGAAGAACATTTTCAGTTAC ATCATCA AATGCACTATTCTCAACAGATCACGGTCAGTCTAGCACAGGGATATGAGAGAA CTTCTTC CCCTAAGCCTCGATTCAAGAGCTATGCCTACACACAGGCTGCTTATGTCACCA CCTCTGA CCCTACACGGAGCCCATTTCCTTCACAGCATTTGGAAGCTCCTGAAGACAAGT CATTTGG CAGTTCATTGATGGAGAGTGAAGTAAACCTGGACCGTTATCAAACAGCTTTAG AAGAAGT ATTATCGTGGCTTCTTTCTGCTGAGGACACATTGCAAGCACAAGGAGAGATTT CTAATGA TGTGGAAGTGGTGAAAGACCAGTTTCATACTCATGAGGGGTACATGATGGATT TGACAGC CCATCAGGGCCGGGTTGGTAATATTCTACAATTGGGAAGTAAGCTGATTGGAA CAGGAAA ATTATCAGAAGATGAAGAAACTGAAGTACAAGAGCAGATGAATCTCCTAAAT TCAAGATG GGAATGCCTCAGGGTAGCTAGCATGGAAAAACAAAGCAATTTACATAGAGTTT TAATGGA TCTCCAGAATCAGAAACTGAAAGAGTTGAATGACTGGCTAACAAAAACAGAA GAAAGAAC AAGGAAAATGGAGGAAGAGCCTCTTGGACCTGATCTTGAAGACCTAAAACGC CAAGTACA ACAACATAAGGTGCTTCAAGAAGATCTAGAACAAGAACAAGTCAGGGTCAAT TCTCTCAC TCACATGGTGGTGGTAGTTGATGAATCTAGTGGAGATCACGCAACTGCTGCTT TGGAAGA ACAACTTAAGGTATTGGGAGATCGATGGGCAAACATCTGTAGATGGACAGAA GACCGCTGNucleotide sequence of full-length dystrophin protein (isoform Dp427m) SEQ ID NO: 2 GGGATTCCCTCACTTTCCCCCTACAGGACTCAGATCTGGGAGGCAATTACCTTC GGAGAAAAACGAATAGGAAAAACTGAAGTGTTACTTTTTTTAAAGCTGCTGAA GTTTGTTGGTTTCTCATTGTTTTTAAGCCTACTGGAGCAATAAAGTTTGAAGAA CTTTTACCAGGTTTTTTTTAT CGCTGCCTTGATATACACTTTTCAAAATGCTTTG GTGGGAAGAAGTAGAGGACTGTTATGAAAGAGAAGATGTTCAAAAGAAAACA TTCACAAAATGGGTAAATGCACAATTTTCTAAGTTTGGGAAGCAGCATATTGA GAACCTCTTCAGTGACCTACAGGATGGGAGGCGCCTCCTAGACCTCCTCGAAG GCCTGACAGGGCAAAAACTGCCAAAAGAAAAAGGATCCACAAGGTTCATGC CCTGAAC AATGTCAACAAGGCACTGCGGGTTTTGCAGAACAATAATGTTGATT TAGTGAATATTGGAAGTACTGACATCGTAGATGGAAATCATAAACTGACTCTT GGTTTGATTTGGAATATAATCCTCCACTGGCAGGTCAAAAATGTAATGAAAAA TATCATGGCTGGATTGCAACAAACCAACAGTGAAAAGATTCTCCTGAGCTGGG TCCGACAATCAACTCGTAATTATCCACAGGTTAATGTAATCAACT TCACCACC AGCTGGTCTGATGGCCTGGCTTTGAATGCTCTCATCCATAGTCATAGGCCAGA CCTATTTGACTGGAATAGTGTGGTTTGCCAGCAGTCAGCCACACAACGACTGG AACATGCATTCAACATCGCCAGATATCAATTAGGCATAGAGAAACTACTCGAT CCTGAAGATGTTGATACCACCTATCCAGATAAGAAGTCCATCTTAATGTACAT CACATCACTCTTCCAAGTTTTGCCTCAACAAG TG AGCATTGAAGCCATCCAGGAAGT GGAAATGTTGCCAAGGCCACCTAAAGTGACTAAAGAAGAACATTTTCAGTTAC ATCATCA AATGCACTATTCTCAACAGATCACGGTCAGTCTAGCACAGGGATATGAGAGAA CTTCTTC CCCTAAGCCTCGATTCAAGAGCTATGCCTACACACAGGCTGCTTATGTCACCA CCTCTGA CCCTACACGGAGCCCATTTCCTTCACAGCATTTGGAAGCTCCTG AAGACAAGT CATTTGG CAGTTCATTGATGGAGAGTGAAGTAAACCTGGACCGTTATCAAACAGCTTTAG AAGAAGT ATTATCGTGGCTTCTTTCTGCTGAGGACACATTGCAAGCACAAGGAGAGATTT CTAATGA TGTGGAAGTGGTGAAAGACCAGTTTCATACTCATGAGGGGTACATGATGGATT TGACAGC CCATCAGGGCCGGGTTGGTAATATTCTACAATTGGGAAGTAAGCT GATTGGAA CAGGAAA ATTATCAGAAGATGAAGAAACTGAAGTACAAGAGCAGATGAATCTCCTAAAT TCAAGATG GGAATGCCTCAGGGTAGCTAGCATGGAAAAACAAAGCAATTTACATAGAGTTT TAATGGA TCTCCAGAATCAGAAACTGAAAGAGTTGAATGACTGGCTAACAAAAACAGAA GAAAGAAC AAGGAAAATGGAGGAAGAGCCTCTTGGACCTGATCTTGAAGACCTAAAACGC CAAGTACA ACAACATAAGGTGCTTCAAGAAGATCTAGAACAAGAACAAGTCAGGGTCAAT TC TCTCAC TCACATGGTGGTGGTAGTTGATGAATCTAGTGGAGATCACGCAACTGCTGCTT TGGAAGA ACAACTTAAGGTATTGGGAGATCGATGGGCAAACATCTGTAGATGGACAGAA GACCGCTG

- 15 046419- 15 046419

GGTTCTTTTACAAGACATCCTTCTCAAATGGCAACGTCTTACTGAAGAACAGT GCCTTTTGGTTCTTTTACAAGACATCCTTCTCAAATGGCAACGTCTTACTGAAGAACAGT GCCTTTT

TAGTGCATGGCTTTCAGAAAAAGAAGATGCAGTGAACAAGATTCACACAACT GGCTTTAATAGTGCATGGCTTTCAGAAAAGAAGATGCAGTGAACAAGATTCACACAACT GGCTTTAA

AGATCAAAATGAAATGTTATCAAGTCTTCAAAAACTGGCCGTTTTAAAAGCGG ATCTAGAAGATCAAAATGAAATGTTATCAAGTCTTCAAAAACTGGCCGTTTTAAAAGCGG ATCTAGA

AAAGAAAAAGCAATCCATGGGCAAACTGTATTCACTCAAACAAGATCTTCTTT CAACACTAAAGAAAAAGCAATCCATGGGCAAACTGTATTCACTCAAACAAGATCTTTCTTT CAACACT

GAAGAATAAGTCAGTGACCCAGAAGACGGAAGCATGGCTGGATAACTTTGCC CGGTGTTGGAAGAATAAGTCAGTGACCCAGAAGACGGAAGCATGGCTGGATAACTTTGCC CGGTGTTG

GGATAATTTAGTCCAAAAACTTGAAAAGAGTACAGCACAGATTTCACAGGCTG TCACCACGGATAATTTAGTCCAAAAACTTGAAAAGAGTACAGCACAGATTTCACAGGCTG TCACCAC

CACTCAGCCATCACTAACACAGACAACTGTAATGGAAACAGTAACTACGGTG ACCACAAGCACTCAGCCATCACTAACACAGACAACTGTAATGGAAACAGTAACTACGGTG ACCACAAG

GGAACAGATCCTGGTAAAGCATGCTCAAGAGGAACTTCCACCACCACCTCCCC AAAAGAAGGAACAGATCCTGGTAAAGCATGCTCAAGAGGAACTTCCACCACCACCTCCCCC AAAAGAA

GAGGCAGATTACTGTGGATTCTGAAATTAGGAAAAGGTTGGATGTTGATATAA CTGAACTGAGGCAGATTACTGTGGATTCTGAAATTAGGAAAAGGTTGGATGTTGATATAA CTGAACT

TCACAGCTGGATTACTCGCTCAGAAGCTGTGTTGCAGAGTCCTGAATTTGCAATCACAGCTGGATTACTCGCTCAGAAGCTGTGTTGCAGAGTCCTGAATTTGCAA

TCTTTCGTCTTTCG

GAAGGAAGGCAACTTCTCAGACTTAAAAGAAAAAGTCAATGCCATAGAGCGA GAAAAAGCGAAGGAAGGCAACTTCTCAGACTTAAAAGAAAAAGTCAATGCCATAGAGCGA GAAAAAGC

TGAGAAGTTCAGAAAACTGCAAGATGCCAGCAGATCAGCTCAGGCCCTGGTGTGAGAAGTTCAGAAAACTGCAAGATGCCCAGCAGATCAGCTCAGGCCCTGGTG

GAACAGATGAACAGAT

GGTGAATGAGGGTGTTAATGCAGATAGCATCAAACAAGCCTCAGAACAACTG AACAGCCGGGTGAATGAGGGTGTTAATGCAGATAGCATCAAACAAGCCTCAGAACAACTG AACAGCCG

GTGGATCGAATTCTGCCAGTTGCTAAGTGAGAGACTTAACTGGCTGGAGTATC AGAACAAGTGGATCGAATTCTGCCAGTTGCTAAGTGAGAGACTTAACTGGCTGGAGTATC AGAACAA

CATCATCGCTTTCTATAATCAGCTACAACAATTGGAGCAGATGACAACTACTGCATCATCGCTTTCTATAATCAGCTACAACAATTGGAGCAGATGACAACTACTG

CTGAAAACTGAAAA

CTGGTTGAAAATCCAACCCACCACCCCATCAGAGCCAACAGCAATTAAAAGTC AGTTAAACTGGTTGAAAATCCAACCCACCACCCCATCAGAGCCAACAGCAATTAAAAGTC AGTTAAA

AATTTGTAAGGATGAAGTCAACCGGCTATCAGGTCTTCAACCTCAAATTGAAC GATT AAAAATTTGTAAGGATGAAGTCAACCGGCTATCAGGTCTTCAACCTCAAATTGAAC GATT AAA

AATTCAAAGCATAGCCCTGAAAGAGAAAGGACAAGGACCCATGTTCCTGGAT GCAGACTTAATTCAAAGCATAGCCCTGAAAGAGAAAGGACAAGGACCCATGTTCCTGGAT GCAGACTT

TGTGGCCTTTACAAATCATTTTAAGCAAGTCTTTTCTGATGTGCAGGCCAGAGA GAGAAAGATGTGGCCTTTACAAATCATTTTAAGCAAGTCTTTTCTGATGTGCAGGCCAGAGA GAGAAAGA

GCTACAGACAATTTTTGACACTTTGCCACCAATGCGCTATCAGGAGACCATGAGCTACAGACAATTTTTGACACTTTGCCACCAATGCGCTATCAGGAGACCATGA

GTGCCATGTGCCAT

CAGGACATGGGTCCAGCAGTCAGAAACCAAACTCTCCATACCTCAACTTAGTG TCACCGACAGGACATGGGTCCAGCAGTCAGAAACCAAACTCTCCATACCTCAACTTAGTG TCACCGA

CTATGAAATCATGGAGCAGAGACTCGGGGAATTGCAGGCTTTACAAAGTTCTC TGCAAGACTATGAAATCATGGAGCAGAGACTCGGGGAATTGCAGGCTTTACAAAGTTCTC TGCAAGA

GCAACAAAGTGGCCTATACTATCTCAGCACCACTGTGAAAGAGATGTCGAAGA AAGCGCCGCAACAAAGTGGCCTATACTATCTCAGCACCACTGTGAAAGAGATGTCGAAGA AAGCGCC

CTCTGAAATTAGCCGGAAATATCAATCAGAATTTGAAGAAATTGAGGGACGCT GGAAGAACTCTGAAATTAGCCGGAAATATCAATCAGAATTTGAAGAAATTGAGGGACGCT GGAAGAA

GCTCTCCTCCCAGCTGGTTGAGCATTGTCAAAAGCTAGAGGAGCAAATGAATA AACTCCGGCTCTCCTCCCAGCTGGTTGAGCATTGTCAAAAGCTAGAGGAGCAAATGAATA AACTCCG

- 16 046419- 16 046419

AAAAATTCAGAATCACATACAAACCCTGAAGAAATGGATGGCTGAAGTTGAT GTTTTTCTAAAAATTCAGAATCACATACAAACCCTGAAGAAATGGATGGCTGAAGTTGAT GTTTTTCT

GAAGGAGGAATGGCCTGCCCTTGGGGATTCAGAAATTCTAAAAAAGCAGCTG AAACAGTGGAAGGAGGAATGGCCTGCCCTTGGGGATTCAGAAATTCTAAAAAAGCAGCTG AAACAGTG

CAGACTTTTAGTCAGTGATATTCAGACAATTCAGCCCAGTCTAAACAGTGTCA ATGAAGGCAGACTTTTAGTCAGTGATATTCAGACAATTCAGCCCAGTCTAAACAGTGTCA ATGAAGG

TGGGCAGAAGATAAAGAATGAAGCAGAGCCAGAGTTTGCTTCGAGACTTGAG ACAGAACTTGGGCAGAAGATAAAGAATGAAGCAGAGCCAGAGTTTGCTTCGAGACTTGAG ACAGAACT

CAAAGAACTTAACACTCAGTGGGATCACATGTGCCAACAGGTCTATGCCAGAA AGGAGGCCAAAGAACTTAACACTCAGTGGGATCACATGTGCCAACAGGTCTATGCCAGAA AGGAGGC

CTTGAAGGGAGGTTTGGAGAAAACTGTAAGCCTCCAGAAAGATCTATCAGAG ATGCACGACTTGAAGGGAGGTTTGGAGAAAACTGTAAGCCTCCAGAAAGATCTATCAGAG ATGCACGA

ATGGATGACACAAGCTGAAGAAGAGTATCTTGAGAGAGATTTTGAATATAAA ACTCCAGAATGGATGACACAAGCTGAAGAAGAGTATCTTGAGAGAGATTTTGAATATAAA ACTCCAGA

TGAATTACAGAAAGCAGTTGAAGAGATGAAGAGAGCTAAAGAAGAGGCCCAA CAAAAAGATGAATTACAGAAAGCAGTTGAAGAGATGAAGAGAGCTAAAGAAGAGGCCCAA CAAAAAGA

AGCGAAAGTGAAACTCCTTACTGAGTCTGTAAATAGTGTCATAGCTCAAGCTC CACCTGTAGCGAAAGTGAAACTCCTTACTGAGTCTGTAAATAGTGTCATAGCTCAAGCTC CACCTGT

AGCACAAGAGGCCTTAAAAAAAGGAACTTGAAACTCTAACCACCAACTACCA GTGGCTCTGAGCACAAGAGCCTTAAAAAAAGGAACTTGAAACTCTAACCACCAACTACCA GTGGCTCTG

CACTAGGCTGAATGGGAAATGCAAGACTTTGGAAGAAGTTTGGGCATGTTGGC ATGAGTTCACTAGGCTGAATGGGAAATGCAAGACTTTGGAAGAAGTTTGGGCATGTTGGC ATGAGTT

ATTGTCATACTTGGAGAAAGCAAACAAGTGGCTAAATGAAGTAGAATTTAAAC TTAAAACATTGTCATACTTGGAGAAAGCAAACAAGTGGCTAAATGAAGTAGAATTTAAAC TTAAAAC

CACTGAAAACATTCCTGGCGGAGCTGAGGAAATCTCTGAGGTGCTAGATTCAC TTGAAAACACTGAAAACATTCCTGGCGGAGCTGAGGAAATCTCTGAGGTGCTAGATTCAC TTGAAAA

TTTGATGCGACATTCAGAGGATAACCCAAATCAGATTCGCATATTGGCACAGA CCCTAACTTTGATGCGACATTCAGAGGATAACCCAAATCAGATTCGCATATTGGCACAGA CCCTAAC

AGATGGCGGAGTCATGGATGAGCTAATCAATGAGGAACTTGAGACATTTAATT CTCGTTGAGATGGCGGAGTCATGGATGAGCTAATCAATGAGGAACTTGAGACATTTAATT CTCGTTG

GAGGGAACTACATGAAGAGGCTGTAAGGAGGCAAAAGTTGCTTGAACAGAGC ATCCAGTCGAGGGAACTACATGAAGAGGCTGTAAGGAGGCAAAAGTTGCTTGAACAGAGC ATCCAGTC

TGCCCAGGAGACTGAAAAATCCTTACACTTAATCCAGGAGTCCCTCACATTCA TTGACAATGCCCAGGAGACTGAAAAATCCTTACACTTAATCCAGGAGTCCCCTCACATTCA TTGACAA

GCAGTTGGCAGCTTATATTGCAGACAAGGTGGACGCAGCTCAAATGCCTCAGG AAGCCCAGCAGTTGGCAGCTTATATTGCAGACAAGGTGGACGCAGCTCAAATGCCTCAGG AAGCCCA

GAAAATCCAATCTGATTTGACAAGTCATGAGATCAGTTTAGAAGAAATGAAGA AACATAAGAAAATCCAATCTGATTTGACAAGTCATGAGATCAGTTTAGAAGAAATGAAGA AACATAA

TCAGGGGAAGGAGGCTGCCCAAAGAGTCCTGTCTCAGATTGATGTTGCACAGA AAAAATTTCAGGGGAAGGAGGCTGCCCAAAGAGTCCTGTCTCAGATTGATGTTGCACAGA AAAAAATT

ACAAGATGTCTCCATGAAGTTTCGATTATTCCAGAAACCAGCCAATTTTGAGC TGCGTCTACAAGATGTCTCCATGAAGTTTCGATTATTCCAGAAACCAGCCAATTTTGAGC TGCGTCT

ACAAGAAAGTAAGATGATTTTAGATGAAGTGAAGATGCACTTGCCTGCATTGG AAACAAAACAAGAAAGTAAGATGATTTTAGATGAAGTGAAGATGCACTTGCCTGCATTGG AAACAAA

GAGTGTGGAACAGGAAGTAGTACAGTCACAGCTAAATCATTGTGTGAACTTGT ATAAAAGGAGTGTGGAACAGGAAGTAGTACAGTCACAGCTAAATCATTGTGTGAACTTGT ATAAAAG

TCTGAGTGAAGTGAAGTCTGAAGTGGAAATGGTGATAAAGACTGGACGTCAG ATTGTACATCTGAGTGAAGTGAAGTCTGAAGTGGAAATGGTGATAAAGACTGGACGTCAG ATTGTACA

GAAAAAGCAGACGGAAAATCCCAAAGAACTTGATGAAAGAGTAACAGCTTTG AAATTGCAGAAAAAGCAGACGGAAAATCCCAAAGAACTTGATGAAAGAGTAACAGCTTTG AAATTGCA

- 17 046419- 17 046419

TTATAATGAGCTGGGAGCAAAGGTAACAGAAAGAAAGCAACAGTTGGAGAAA TGCTTGAATTATAATGAGCTGGGAGCAAAGGTAACAGAAAGAAAGCAACAGTTGGAGAAA TGCTTGAA

ATTGTCCCGTAAGATGCGAAAGGAAATGAATGTCTTGACAGAATGGCTGGCAG CTACAGAATTGTCCCGTAAGATGCGAAAGGAAATGAATGTCTTGACAGAATGGCTGGCAG CTACAGA

TATGGAATTGACAAAGAGATCAGCAGTTGAAGGAATGCCTAGTAATTTGGATT CTGAAGTTATGGAATTGACAAAGAGATCAGCAGTTGAAGGAATGCCTAGTAATTTGGATT CTGAAGT

TGCCTGGGGAAAGGCTACTCAAAAAGAGATTGAGAAACAGAAGGTGCACCTG AAGAGTATTGCCTGGGGAAAGGCTACTCAAAAAGAGATTGAGAAACAGAAGGTGCACCTG AAGAGTAT

CACAGAGGTAGGAGAGGCCTTGAAAACAGTTTTGGGCAAGAAGGAGACGTTG GTGGAAGACACAGAGGTAGGAGAGGCCTTGAAAACAGTTTTGGGCAAGAAGGAGACGTTG GTGGAAGA

TAAACTCAGTCTTCTGAATAGTAACTGGATAGCTGTCACCTCCCGAGCAGAAG AGTGGTTTAAACTCAGTCTTCTGAATAGTAACTGGATAGCTGTCACCTCCCGAGCAGAAG AGTGGTT

AAATCTTTTGTTGGAATACCAGAAACACATGGAAACTTTTGACCAGAATGTGG ACCACATAAATCTTTTGTTGGAATACCAGAAACACATGGAAACTTTTGACCAGAATGTGG ACCACAT

CACAAAGTGGATCATTCAGGCTGACACACTTTTGGATGAATCAGAGAAAAAG AAACCCCACACAAAGTGGATCATTCAGGCTGACACACTTTTGGATGAATCAGAGAAAAAG AAACCCCA

GCAAAAAGAAGACGTGCTTAAGCGTTTAAAGGCAGAACTGAATGACATACGC CCAAAGGTGCAAAAAGAAGACGTGCTTAAGCGTTTAAAAGGCAGAACTGAATGACATACGC CCAAAGGT

GGACTCTACACGTGACCAAGCAGCAAACTTGATGGCAAACCGCGGTGACCAC TGCAGGAAGGACTCTACACGTGACCAAGCAGCAAACTTGATGGCAAACCGCGGTGACCAC TGCAGGAA

ATTAGTAGAGCCCCAAATCTCAGAGCTCAACCATCGATTTGCAGCCATTTCAC ACAGAATATTAGTAGAGCCCCAAATCTCAGAGCTCAACCATCGATTTGCAGCCATTTCAC ACAGAAT

TAAGACTGGAAAGGCCTCCATTCCTTTGAAGGAATTGGAGCAGTTTAACTCAG ATATACATAAGACTGGAAAGGCCTCCATTCCTTTGAAGGAATTGGAGCAGTTTAACTCAG ATATACA

AAAATTGCTTGAACCACTGGAGGCTGAAATTCAGCAGGGGGTGAATCTGAAA GAGGAAGAAAAATTGCTTGAACCACTGGAGGCTGAAATTCAGCAGGGGGTGAATCTGAAA GAGGAAGA

CTTCAATAAAGATATGAATGAAGACAATGAGGGTACTGTAAAAGAATTGTTGC AAAGAGGCTTCAATAAAGATATGAATGAAGACAATGAGGGTACTGTAAAAGAATTGTTGC AAAGAGG

AGACAACTTACAACAAAGAATCACAGATGAGAGAAAGAGAGAGGAAATAAA GATAAAACAAGACAACTTACAACAAAGAATCACAGATGAGAGAAAGAGAGAGGAAATAAA GATAAAACA

GCAGCTGTTACAGACAAAACATAATGCTCTCAAGGATTTGAGGTCTCAAAGAA GAAAAAAGCAGCTGTTACAGACAAAACATAATGCTCTCAAGGATTTGAGGTCTCAAAGAA GAAAAAA

GGCTCTAGAAATTTCTCATCAGTGGTATCAGTACAAGAGGCAGGCTGATGATC TCCTGAAGGCTCTAGAAATTTCTCATCAGTGGTATCAGTACAAGAGGCAGGCTGATGATC TCCTGAA

ATGCTTGGATGACATTGAAAAAAAATTAGCCAGCCTACCTGAGCCCAGAGATG AAAGGAAATGCTTGGATGACATTGAAAAAAAATTAGCCAGCCTACCTGAGCCCAGAGATG AAAGGAA

AATAAAGGAAATTGATCGGGAATTGCAGAAGAAGAAAGAGGAGCTGAATGCA GTGCGTAGAATAAAGGAAATTGATCGGGAATTGCAGAAGAAGAAAGAGGAGCTGAATGCA GTGCGTAG

GCAAGCTGAGGGCTTGTCTGAGGATGGGGCCGCAATGGCAGTGGAGCCAACT CAGATCCAGCAAGCTGAGGGCTTGTCTGAGGATGGGGCCGCAATGGCAGTGGAGCCAACT CAGATCCA

GCTCAGCAAGCGCTGGCGGGAAATTGAGAGCAAATTTGCTCAGTTTCGAAGAC TCAACTTGCTCAGCAAGCGCTGGCGGGAAATTGAGAGCAAATTTGCTCAGTTTCGAAGAC TCAACTT

TGCACAAATTCACACTGTCCGTGAAGAAACGATGATGGTGATGACTGAAGACA TGCCTTTTGCACAAATTCACACTGTCCGTGAAGAAACGATGATGGTGATGACTGAAGACA TGCCTTT

GGAAATTTCTTATGTGCCTTCTACTTATTTGACTGAAATCACTCATGTCTCACA AGCCCTGGAAATTTCTTATGTGCCTTCTACTTATTTGACTGAAATCACTCATGTCTCACA AGCCCT

ATTAGAAGTGGAACAACTTCTCAATGCTCCTGACCTCTGTGCTAAGGACTTTG AAGATCTATTAGAAGTGGAACAACTTCTCAATGCTCCTGACCTCTGTGCTAAGGACTTTG AAGATCT

CTTTAAGCAAGAGGAGTCTCTGAAGAATATAAAAGATAGTCTACAACAAAGCT CAGGTCGCTTTAAGCAAGAGGAGTCTCTGAAGAATATAAAAGATAGTCTACAACAAAGCT CAGGTCG

- 18 046419- 18 046419

GATTGACATTATTCATAGCAAGAAGACAGCAGCATTGCAAAGTGCAACGCCTG TGGAAAGGATTGACATTATTCATAGCAAGAAGACAGCAGCATTGCAAAGTGCAACGCCTG TGGAAAG

GGTGAAGCTACAGGAAGCTCTCTCCCAGCTTGATTTCCAATGGGAAAAAGTTA ACAAAATGGTGAAGCTACAGGAAGCTCTCTCCCAGCTTGATTTCCAATGGGAAAAAGTTA ACAAAAT

GTACAAGGACCGACAAGGGCGATTTGACAGATCTGTTGAGAAATGGCGGCGT TTTCATTAGTACAAGGACCGACAAGGGCGATTTGACAGATCTGTTGAGAAATGGCGGCGT TTTCATTA

TGATATAAAGATATTTAATCAGTGGCTAACAGAAGCTGAACAGTTTCTCAGAA AGACACATGATATAAAAGATATTTAATCAGTGGCTAACAGAAGCTGAACAGTTTCTCAGAA AGACACA

AATTCCTGAGAATTGGGAACATGCTAAATACAAATGGTATCTTAAGGAACTCC AGGATGGAATTCCTGAGAATTGGGAACATGCTAAATACAAATGGTATCTTAAGGAACTCC AGGATGG

CATTGGGCAGCGGCAAACTGTTGTCAGAACATTGAATGCAACTGGGGAAGAA ATAATTCACATTGGGCAGCGGCAAACTGTTGTCAGAACATTGAATGCAACTGGGGAAGAA ATAATTCA

GCAATCCTCAAAAACAGATGCCAGTATTCTACAGGAAAAATTGGGAAGCCTG AATCTGCGGCAATCCTCAAAAACAGATGCCAGTATTCTACAGGAAAAATTGGGAAGCCTG AATCTGCG

GTGGCAGGAGGTCTGCAAACAGCTGTCAGACAGAAAAAAGAGGCTAGAAGAA CAAAAGAAGTGGCAGGAGGGTCTGCAAACAGCTGTCAGACAGAAAAAAGAGGCTAGAAGAA CAAAAGAA

TATCTTGTCAGAATTTCAAAGAGATTTAAATGAATTTGTTTTATGGTTGGAGGA AGCAGATATCTTGTCAGAATTTCAAAGAGATTTAAATGAATTTGTTTTATGGTTGGAGGA AGCAGA

TAACATTGCTAGTATCCCACTTGAACCTGGAAAAGAGCAGCAACTAAAAGAA AAGCTTGATAACATTGCTAGTATCCCACTTGAACCTGGAAAAGAGCAGCAACTAAAAGAA AAGCTTGA

GCAAGTCAAGTTACTGGTGGAAGAGTTGCCCCTGCGCCAGGGAATTCTCAAAC AATTAAAGCAAGTCAAGTTACTGGTGGAAGAGTTGCCCCTGCGCCAGGGAATTCTCAAAC AATTAAA

TGAAACTGGAGGACCCGTGCTTGTAAGTGCTCCCATAAGCCCAGAAGAGCAA GATAAACTTGAAACTGGAGGACCCGTGCTTGTAAGTGCTCCCATAAGCCCAGAAGAGCAA GATAAACT

TGAAAATAAGCTCAAGCAGACAAATCTCCAGTGGATAAAGGTTTCCAGAGCTT TACCTGATGAAAATAAGCTCAAGCAGACAAATCTCCAGTGGATAAAGGTTTCCAGAGCTT TACCTGA

GAAACAAGGAGAAATTGAAGCTCAAATAAAAGACCTTGGGCAGCTTGAAAAA AAGCTTGAGAAACAAGGAGAAATTGAAGCTCAAATAAAAGACCTTGGGCAGCTTGAAAAA AAGCTTGA

AGACCTTGAAGAGCAGTTAAATCATCTGCTGCTGTGGTTATCTCCTATTAGGA ATCAGTTAGACCTTGAAGAGCAGTTAAATCATCTGCTGCTGTGGTTATCTCCTATTAGGA ATCAGTT

GGAAATTTATAACCAACCAAACCAAGAAGGACCATTTGACGTTCAGGAAACT GAAATAGCGGAAATTTATAACCAACCAAACCAAGAAGGACCATTTGACGTTCAGGAAACT GAAATAGC

AGTTCAAGCTAAACAACCGGATGTGGAAGAGATTTTGTCTAAAGGGCAGCATT TGTACAAAGTTCAAGCTAAACAACCGGATGTGGAAGAGATTTTGTCTAAAGGGCAGCATT TGTACAA

GGAAAAACCAGCCACTCAGCCAGTGAAGAGGAAGTTAGAAGATCTGAGCTCT GAGTGGAAGGAAAAACCAGCCACTCAGCCAGTGAAGAGGAAGTTAGAAGATCTGAGCTCT GAGTGGAA

GGCGGTAAACCGTTTACTTCAAGAGCTGAGGGCAAAGCAGCCTGACCTAGCTC CTGGACTGGCGGTAAACCGTTTACTTCAAGAGCTGAGGGCAAAGCAGCCTGACCTAGCTC CTGGACT

GACCACTATTGGAGCCTCTCCTACTCAGACTGTTACTCTGGTGACACAACCTGT GGTTACGACCACTATTGGAGCCTCTCCTACTCAGACTGTTACTCTGGTGACACAACCTGT GGTTAC

TAAGGAAACTGCCATCTCCAAACTAGAAATGCCATCTTCCTTGATGTTGGAGG TACCTGCTAAGGAAACTGCCATCTCCAAACTAGAAATGCCATCTTCCTTGATGTTGGAGG TACCTGC

TCTGGCAGATTTCAACCGGGCTTGGACAGAACTTACCGACTGGCTTTCTCTGCT TGATCATTCTGGCAGATTTCAACCGGGCTTGGACAGAACTTACCGACTGGCTTTCTCTGCT TGATCA

AGTTATAAAATCACAGAGGGTGATGGTGGGTGACCTTGAGGATATCAACGAG ATGATCATAGTTATAAAATCACAGAGGGTGATGGTGGGTGACCTTGAGGATATCAACGAG ATGATCAT

CAAGCAGAAGGCAACAATGCAGGATTTGGAACAGAGGCGTCCCCAGTTGGAA GAACTCATCAAGCAGAAGGCAACAATGCAGGATTTGGAACAGAGGCGTCCCCAGTTGGAA GAACTCAT

TACCGCTGCCCAAAATTTGAAAAACAAGACCAGCAATCAAGAGGCTAGAACA ATCATTACTACCGCTGCCCAAAATTTGAAAAACAAGACCAGCAATCAAGAGGCTAGAACA ATCATTAC

- 19 046419- 19 046419

GGATCGAATTGAAAGAATTCAGAATCAGTGGGATGAAGTACAAGAACACCTT CAGAACCGGGATCGAATTGAAAGAATTCAGAATCAGTGGGATGAAGTACAAGAACACCTT CAGAACCG

GAGGCAACAGTTGAATGAAATGTTAAAGGATTCAACACAATGGCTGGAAGCT AAGGAAGAGAGGCAACAGTTGAATGAAATGTTAAAGGATTCAACACAATGGCTGGAAGCT AAGGAAGA

AGCTGAGCAGGTCTTAGGACAGGCCAGAGCCAAGCTTGAGTCATGGAAGGAG GGTCCCTAAGCTGAGCAGGTCTTAGGACAGGCCAGAGCCAAGCTTGAGTCATGGAAGGAG GGTCCCTA

TACAGTAGATGCAATCCAAAAGAAAATCACAGAAACCAAGCAGTTGGCCAAA GACCTCCGTACAGTAGATGCAATCCAAAAGAAAATCACAGAAACCAAGCAGTTGGCCAAA GACCTCCG

CCAGTGGCAGACAAATGTAGATGTGGCAAATGACTTGGCCCTGAAACTTCTCC GGGATTACCAGTGGCAGACAAATGTAGATGTGGCAAATGACTTGGCCCTGAAACTTCTCC GGGATTA

TTCTGCAGATGATACCAGAAAAGTCCACATGATAACAGAGAATATCAATGCCT CTTGGAGTTCTGCAGATGATACCAGAAAAGTCCACATGATAACAGAGAATATCAATGCCT CTTGGAG

AAGCATTCATAAAAGGGTGAGTGAGCGAGAGGCTGCTTTGGAAGAAACTCAT AGATTACTAAGCATTCATAAAAGGGTGAGTGAGCGAGAGGCTGCTTTGGAAGAAACTCAT AGATTACT

GCAACAGTTCCCCCTGGACCTGGAAAAGTTTCTTGCCTGGCTTACAGAAGCTG AAACAACGCAACAGTTCCCCCTGGACCTGGAAAAGTTTCTTGCCTGGCTTACAGAAGCTG AAACAAC

TGCCAATGTCCTACAGGATGCTACCCGTAAGGAAAGGCTCCTAGAAGACTCCA AGGGAGTTGCCAATGTCCTACAGGATGCTACCCGTAAGGAAAGGCTCCTAGAAGACTCCA AGGGAGT

AAAAGAGCTGATGAAACAATGGCAAGACCTCCAAGGTGAAATTGAAGCTCAC ACAGATGTAAAAGAGCTGATGAAACAATGGCAAGACCTCCAAGGTGAAATTGAAGCTCAC ACAGATGT

TTATCACAACCTGGATGAAAACAGCCAAAAAATCCTGAGATCCCTGGAAGGTT CCGATGATTATCACAACCTGGATGAAAACAGCCAAAAAATCCTGAGATCCCTGGAAGGTT CCGATGA

TGCAGTCCTGTTACAAAGACGTTTGGATAACATGAACTTCAAGTGGAGTGAAC TTCGGAATGCAGTCCTGTTACAAAGACGTTTGGATAACATGAACTTCAAGTGGAGTGAAC TTCGGAA

AAAGTCTCTCAACATTAGGTCCCATTTGGAAGCCAGTTCTGACCAGTGGAAGC GTCTGCAAAAGTCTCTCAACATTAGGTCCCATTTGGAAGCCAGTTCTGACCAGTGGAAGC GTCTGCA

CCTTTCTCTGCAGGAACTTCTGGTGTGGCTACAGCTGAAAGATGATGAATTAA GCCGGCACCTTTCTCTGCAGGAACTTCTGGTGTGGCTACAGCTGAAAGATGATGAATTAA GCCGGCA

GGCACCTATTGGAGGCGACTTTCCAGCAGTTCAGAAGCAGAACGATGTACATA GGGCCTTGGCACCTATGGAGGCGACTTTCCAGCAGTTCAGAAGCAGAACGATGTACATA GGGCCTT

CAAGAGGGAATTGAAAACTAAAGAACCTGTAATCATGAGTACTCTTGAGACTG TACGAATCAAGAGGGAATTGAAAACTAAAGAACCTGTAATCATGAGTACTCTTGAGACTG TACGAAT

ATTTCTGACAGAGCAGCCTTTGGAAGGACTAGAGAAACTCTACCAGGAGCCCA GAGAGCTATTTCTGACAGAGCAGCCTTTGGAAGGACTAGAGAAACTCTACCAGGAGCCCA GAGAGCT

GCCTCCTGAGGAGAGAGCCCAGAATGTCACTCGGCTTCTACGAAAGCAGGCTG AGGAGGTGCCTCCTGAGGAGAGAGCCCAGAATGTCACTCGGCTTCTACGAAAGCAGGCTG AGGAGGT

CAATACTGAGTGGGAAAAATTGAACCTGCACTCCGCTGACTGGCAGAGAAAA ATAGATGACAATACTGAGTGGGAAAAATTGAACCTGCACTCCGCTGACTGGCAGAGAAAA ATAGATGA

GACCCTTGAAAGACTCCAGGAACTTCAAGAGGCCACGGATGAGCTGGACCTC AAGCTGCGGACCCTTGAAAGACTCCAGGAACTTCAAGAGGCCACGGATGAGCTGGACCTC AAGCTGCG

CCAAGCTGAGGTGATCAAGGGATCCTGGCAGCCCGTGGGCGATCTCCTCATTG ACTCTCTCCAAGCTGAGGTGATCAAGGGATCCTGGCAGCCCGTGGGCGATCTCCTCATTG ACTCTCT

CCAAGATCACCTCGAGAAAGTCAAGGCACTTCGAGGAGAAATTGCGCCTCTG AAAGAGAACCAAGATCACCTCGAGAAAGTCAAGGCACTTCGAGGAGAAATTGCGCCTCTG AAAGAGAA

CGTGAGCCACGTCAATGACCTTGCTCGCCAGCTTACCACTTTGGGCATTCAGCT CTCACCCGTGAGCCACGTCAATGACCTTGCTCGCCAGCTTACCACTTTGGGCATTCAGCT CTCACC

GTATAACCTCAGCACTCTGGAAGACCTGAACACCAGATGGAAGCTTCTGCAGG TGGCCGTGTATAACCTCAGCACTCTGGAAGACCTGAACACCAGATGGAAGCTTCTGCAGG TGGCCGT

CGAGGACCGAGTCAGGCAGCTGCATGAAGCCCACAGGGACTTTGGTCCAGCA TCTCAGCACGAGGACCGAGTCAGGCAGCTGCATGAAGCCCACAGGGACTTTGGTCCAGCA TCTCAGCA

- 20 046419- 20 046419

CTTTCTTTCCACGTCTGTCCAGGGTCCCTGGGAGAGAGCCATCTCGCCAAACA AAGTGCCCTTTCTTTCCACGTCTGTCCAGGGTCCCTGGGAGAGAGCCATCTCGCCAAACA AAGTGCC

CTACTATATCAACCACGAGACTCAAACAACTTGCTGGGACCATCCCAAAATGA CAGAGCTCTACTATATCAACCACGAGACTCAAACAACTTGCTGGGACCATCCCAAAAATGA CAGAGCT

CTACCAGTCTTTAGCTGACCTGAATAATGTCAGATTCTCAGCTTATAGGACTGC CATGAACTACCAGTCTTTAGCTGACCTGAATAATGTCAGATTCTCAGCTTATAGGACTGC CATGAA

ACTCCGAAGACTGCAGAAGGCCCTTTGCTTGGATCTCTTTGAGCCTGTCAGCTG CATGTGAACTCCGAAGACTGCAGAAGGCCCTTTGCTTGGATCTCTTTGAGCCTGTCAGCTG CATGTGA

TGCCTTGGACCAGCACAACCTCAAGCAAAATGACCAGCCCATGGATATCCTGC AGATTATTGCCTTGGACCAGCACAACCTCAAGCAAAATGACCAGCCCATGGATATCCTGC AGATTAT

TAATTGTTTGACCACTATTTATGACCGCCTGGAGCAAGAGCACAACAATTTGG TCAACGTTAATTGTTTGACCACTATTTATGACCGCCTGGAGCAAGAGCACAACAATTTGG TCAACGT

CCCTCTCTGCGTGGATATGTGTCTGAACTGGCTGCTGAATGTTTATGATACGGG ACGAACCCCTCTCTGCGTGGATATGTGTCTGAACTGGCTGCTGAATGTTTATGATACGGG ACGAAC

AGGGAGGATCCGTGTCCTGTCTTTTAAAACTGGCATCATTTCCCTGTGTAAAGC ACATTTAGGGAGGATCCGTGTCCTGTCTTTTAAAACTGGCATCATTTCCCTGTGTAAAGC ACATTT

GGAAGACAAGTACAGATACCTTTTCAAGCAAGTGGCAAGTTCAACAGGATTTT GTGACCAGGAAAGACAAGTACAGATACCTTTTCAAGCAAGTGGCAAGTTCAACAGGATTTT GTGACCA

GCGCAGGCTGGGCCTCCTTCTGCATGATTCTATCCAAATTCCAAGACAGTTGG GTGAAGTGCGCAGGCTGGGCCTCCTTCTGCATGATTCTATCCAAATTCCAAGACAGTTGG GTGAAGT

TGCATCCTTTGGGGGCAGTAACATTGAGCCAAGTGTCCGGAGCTGCTTCCAATTGCATCCTTTGGGGGCAGTAACATTGAGCCAAGTGTCCGGAGCTGCTTCCAAT

TTGCTAATTGCTAA

TAATAAGCCAGAGATCGAAGCGGCCCTCTTCCTAGACTGGATGAGACTGGAAC CCCAGTCTAATAAGCCAGAGATCGAAGCGGCCCTCTTCCTAGACTGGATGAGACTGGAAC CCCAGTC

CATGGTGTGGCTGCCCGTCCTGCACAGAGTGGCTGCTGCAGAAACTGCCAAGC ATCAGGCCATGGTGTGGCTGCCCGTCCTGCACAGAGTGGCTGCTGCAGAAACTGCCAAGC ATCAGGC

CAAATGTAACATCTGCAAAGAGTGTCCAATCATTGGATTCAGGTACAGGAGTC TAAAGCACAAATGTAACATCTGCAAAGAGTGTCCAATCATTGGATTCAGGTACAGGAGTC TAAAGCA

CTTTAATTATGACATCTGCCAAAGCTGCTTTTTTTCTGGTCGAGTTGCAAAAGG CCATAACTTTAATTATGACATCTGCCAAAGCTGCTTTTTTTCTGGTCGAGTTGCAAAAGG CCATAA

AATGCACTATCCCATGGTGGAATATTGCACTCCGACTACATCAGGAGAAGATG TTCGAGAAATGCACTATCCCATGGTGGAATATTGCACTCCGACTACATCAGGAGAAGATG TTCGAGA

CTTTGCCAAGGTACTAAAAAACAAATTTCGAACCAAAAGGTATTTTGCGAAGC ATCCCCGCTTTGCCAAGGTACTAAAAAACAAATTTCGAACCAAAAGGTATTTTGCGAAGC ATCCCCG

AATGGGCTACCTGCCAGTGCAGACTGTCTTAGAGGGGGACAACATGGAAACTC CCGTTACAATGGGCTACCTGCCAGTGCAGACTGTCTTAGAGGGGGACAACATGGAAACTC CCGTTAC

TCTGATCAACTTCTGGCCAGTAGATTCTGCGCCTGCCTCGTCCCCTCAGCTTTC ACACGATCTGATCAACTTCTGGCCAGTAGATTCTGCGCCTGCCTCGTCCCCTCAGCTTTC ACACGA

TGATACTCATTCACGCATTGAACATTATGCTAGCAGGCTAGCAGAAATGGAAA ACAGCAATGATACTCATTCACGCATTGAACATTATGCTAGCAGGCTAGCAGAAATGGAAA ACAGCAA

TGGATCTTATCTAAATGATAGCATCTCTCCTAATGAGAGCATAGATGATGAAC ATTTGTTTGGATCTTATCTAAATGATAGCATCTCTCCTAATGAGAGCATAGATGATGAAC ATTTGTT

AATCCAGCATTACTGCCAAAGTTTGAACCAGGACTCCCCCCTGAGCCAGCCTC GTAGTCCAATCCAGCATTACTGCCAAAGTTTGAACCAGGACTCCCCCCTGAGCCAGCCTC GTAGTCC

TGCCCAGATCTTGATTTCCTTAGAGAGTGAGGAAAGAGGGGAGCTAGAGAGA ATCCTAGCTGCCCAGATCTTGATTTCCTTAGAGAGTGAGGAAAGAGGGGAGCTAGAGAGA ATCCTAGC

AGATCTTGAGGAAGAAAACAGGAATCTGCAAGCAGAATATGACCGTCTAAAG CAGCAGCAAGATCTTGAGGAAGAAAACAGGAATCTGCAAGCAGAATATGACCGTCTAAAG CAGCAGCA

CGAACATAAAGGCCTGTCCCCACTGCCGTCCCCTCCTGAAATGATGCCCACCT CTCCCCACGAACATAAAGGCCTGTCCCCACTGCCGTCCCCTCCTGAAATGATGCCCACCT CTCCCCA

- 21 046419- 21 046419

GAGTCCCCGGGATGCTGAGCTCATTGCTGAGGCCAAGCTACTGCGTCAACACA AAGGCCGGAGTCCCCGGGATGCTGAGCTCATTGCTGAGGCCAAGCTACTGCGTCAACACA AAGGCCG

CCTGGAAGCCAGGATGCAAATCCTGGAAGACCACAATAAACAGCTGGAGTCA CAGTTACACCTGGAAGCCAGGATGCAAATCCTGGAAGACCACAATAAACAGCTGGAGTCA CAGTTACA

CAGGCTAAGGCAGCTGCTGGAGCAACCCCAGGCAGAGGCCAAAGTGAATGGC ACAACGGTCAGGCTAAGGCAGCTGCTGGAGCAACCCCAGGCAGAGGCCAAAGTGAATGGC ACAACGGT

GTCCTCTCCTTCTACCTCTCTACAGAGGTCCGACAGCAGTCAGCCTATGCTGCT CCGAGTGTCCTCTCCTTCTACCTCTCTACAGAGGTCCGACAGCAGTCAGCCTATGCTGCT CCGAGT

GGTTGGCAGTCAAACTTCGGACTCCATGGGTGAGGAAGATCTTCTCAGTCCTC CCCAGGAGGTTGGCAGTCAAACTTCGGACTCCATGGGTGAGGAAGATCTTCTCAGTCCTC CCCAGGA

CACAAGCACAGGGTTAGAGGAGGTGATGGAGCAACTCAACAACTCCTTCCCT AGTTCAAGCACAAGCACAGGGTTAGAGGAGGTGATGGAGCAACTCAACAACTCCTTCCCT AGTTCAAG

AGGAAGAAATACCCCTGGAAAGCCAATGAGAGAGGACACAATGTAGGAAGTC TTTTCCACAGGAAGAAATACCCCTGGAAAGCCAATGAGAGAGGACACAATGTAGGAAGTC TTTTCCAC

ATGGCAGATGATTTGGGCAGAGCGATGGAGTCCTTAGTATCAGTCATGACAGA TGAAGAAATGGCAGATGATTTGGGCAGAGCGATGGAGTCCTTAGTATCAGTCATGACAGA TGAAGAA

GGAGCAGAATAAATGTTTTACAACTCCTGATTCCCGCATGGTTTTTATAATATT CATACAGGAGCAGAATAAATGTTTTACAACTCCTGATTCCCGCATGGTTTTTATAATATT CATACA

ACAAAGAGGATTAGACAGTAAGAGTTTACAAGAAATAAATCTATATTTTTGTG AAGGGTAACAAAGAGGATTAGACAGTAAGAGTTTACAAGAAATAAATCTATTTTTGTG AAGGGTA

GTGGTATTATACTGTAGATTTCAGTAGTTTCTAAGTCTGTTATTGTTTTGTTAAC AATGGGTGGTATTATACTGTAGATTTCAGTAGTTTCTAAGTCTGTTATTGTTTTGTTAAC AATGG

CAGGTTTTACACGTCTATGCAATTGTACAAAAAAAGTTATAAGAAAACTACAT GTAAAATCCAGGTTTTACACGTCTATGCAATTGTACAAAAAAAGTTATAAGAAAACTACAT GTAAAATC

TTGATAGCTAAATAACTTGCCATTTCTTTATATGGAACGCATTTTGGGTTGTTT AAAAATTTGATAGCTAAATAACTTGCCATTTCTTTATATGGAACGCATTTTGGGTTGTTT AAAAAT

TTATAACAGTTATAAAGAAAGATTGTAAACTAAAGTGTGCTTTATAAAAAAAA GTTGTTTTTATAACAGTTATAAAGAAAGATTGTAAACTAAAGTGTGCTTTATAAAAAAAA GTTGTTT

ATAAAAACCCCTAAAAACAAAACAAACACACACACACACACATACACACACA CACACAAAATAAAAACCCCTAAAAACAAAACAAACACACACACACACATACACACACA CACACAAA

ACTTTGAGGCAGCGCATTGTTTTGCATCCTTTTGGCGTGATATCCATATGAAAT TCATGGACTTTGAGGCAGCGCATTGTTTTGCATCCTTTTGGCGTGATATCCATATGAAAT TCATGG

CTTTTTCTTTTTTTGCATATTAAAGATAAGACTTCCTCTACCACCACACCAAAT GACTACCTTTTTCTTTTTTTGCATATTAAAGATAAGACTTCCTCTACCACCACACCAAAT GACTAC

TACACACTGCTCATTTGAGAACTGTCAGCTGAGTGGGGCAGGCTTGAGTTTTC ATTTCATTACACACTGCTCATTTGAGAACTGTCAGCTGAGTGGGGCAGGCTTGAGTTTTC ATTTCAT

ATATCTATATGTCTATAAGTATATAAATACTATAGTTATATAGATAAAGAGAT ACGAATTATATCTATATGTCTATAAGTATATAAATACTATAGTTATATAGATAAAGAGAT ACGAATT

TCTATAGACTGACTTTTTCCATTTTTTAAATGTTCATGTCACATCCTAATAGAA AGAAATTCTATAGACTGACTTTTTCCATTTTTTTAAATGTTCATGTCACATCCTAATAGAA AGAAAT

TACTTCTAGTCAGTCATCCAGGCTTACCTGCTTGGTCTAGAATGGATTTTTCCC GGAGCCTACTTCTAGTCAGTCATCCAGGCTTACCTGCTTGGTCTAGAATGGATTTTTCCC GGAGCC

GGAAGCCAGGAGGAAACTACACCACACTAAAACATTGTCTACAGCTCCAGAT GTTTCTCAGGAAGCCAGGAGGAAACTACACCACACTAAAACATTGTCTACAGCTCCAGAT GTTTCTCA

TTTTAAACAACTTTCCACTGACAACGAAAGTAAAGTAAAGTATTGGATTTTTTT AAAGGGTTTTAAACAACTTTCCACTGACAACGAAAGTAAAGTAAAGTATTGGATTTTTTT AAAGGG

AACATGTGAATGAATACACAGGACTTATTATATCAGAGTGAGTAATCGGTTGG TTGGTTGAACATGTGAATGAATACACAGGACTTATTATATCAGAGTGAGTAATCGGTTGG TTGGTTG

ATTGATTGATTGATTGATACATTCAGCTTCCTGCTGCTAGCAATGCCACGATTT AGATTTATTGATTGATTGATTGATACATTCAGCTTCCTGCTGCTAGCAATGCCACGATTT AGATTT

- 22 046419- 22 046419

AATGATGCTTCAGTGGAAATCAATCAGAAGGTATTCTGACCTTGTGAACATCA GAAGGTAAATGATGCTTCAGTGGAAATCAATCAGAAGGTATTCTGACCTTGTGAACATCA GAAGGTA

TTTTTTAACTCCCAAGCAGTAGCAGGACGATGATAGGGCTGGAGGGCTATGGA TTCCCAGTTTTTTAACTCCCAAGCAGTAGCAGGACGATGATAGGGCTGGAGGGCTATGGA TTCCCAG

CCCATCCCTGTGAAGGAGTAGGCCACTCTTTAAGTGAAGGATTGGATGATTGT TCATAATCCCATCCCTGTGAAGGAGTAGGCCACTCTTTAAGTGAAGGATTGGATGATTGT TCATAAT

ACATAAAGTTCTCTGTAATTACAACTAAATTATTATGCCCTCTTCTCACAGTCA AAAGGAACATAAAGTTCTCTGTAATTACAACTAAATTATTATGCCCTCTTCTCACAGTCA AAAGGA

ACTGGGTGGTTTGGTTTTGTTGCTTTTTTAGATTTATTGTCCCATGTGGGATGA GTTTTACTGGGTGGTTTGGTTTTGTTGCTTTTTTAGATTTATTGTCCCATGTGGGATGA GTTTT

TAAATGCCACAAGACATAATTTAAAATAAATAAACTTTGGGAAAAGGTGTAA GACAGTAGTAAATGCCACAAGACATAATTTAAAATAAATAAACTTTGGGAAAAGGTGTAA GACAGTAG

CCCACATTTGTGATACTGACAGGTATCAACCCAGAAGCCCATGAACTGTGTTT CCACCCACATTTGTGATACTGACAGGTATCAACCCAGAAGCCCATGAACTGTGTTT CCA

TCCTTTGCATTTCTCTGCGAGTAGTTCCACACAGGTTTGTAAGTAAGTAAGAAA GAAGGCTCCTTTGCATTTCTCTGCGAGTAGTTCCACACAGGTTTGTAAGTAAGTAAGAAA GAAGGC

AAATTGATTCAAATGTTACAAAAAAACCCTTCTTTGGTGGATTAGACAGGTTA AATATATAAAATTGATTCAAATGTTACAAAAAAACCCTTCTTTGGTGGATTAGACAGGTTA AATATATA

AACAAACAAACAAAAATTGCTCAAAAAAGAGGAGAAAAGCTCAAGAGGAAA AGCTAAGGAAACAAACAAACAAAATTGCTCAAAAAAGAGGAGAAAAGCTCAAGAGGAAA AGCTAAGGA

CTGGTAGGAAAAAGCTTTACTCTTTCATGCCATTTTATTTCTTTTTGATTTTTAA ATCATCTGGTAGGAAAAGCTTTACTCTTTCATGCCATTTTATTTCTTTTTGATTTTTAA ATCAT

TCATTCAATAGATACCACCGTGTGACCTATAATTTTGCAAATCTGTTACCTCTG ACATCATCATTCAATAGATACCACCGTGTGACCTATAATTTTGCAAATCTGTTACCTCTG ACATCA

AGTGTAATTAGCTTTTGGAGAGTGGGCTGACATCAAGTGTAATTAGCTTTTGG AGAGTGGAGTGTAATTAGCTTTTGGAGAGTGGGCTGACATCAAGTGTAATTAGCTTTTGG AGAGTGG

GTTTTGTCCATTATTAATAATTAATTAATTAACATCAAACACGGCTTCTCATGC TATTTCGTTTTGTCCATTATTAATAATTAATTAATTAACATCAAACACGGCTTCTCATGC TATTTC

TACCTCACTTTGGTTTTGGGGTGTTCCTGATAATTGTGCACACCTGAGTTCACATACCTCACTTTGGTTTTGGGGTGTTCCTGATAATTGTGCACACCTGAGTTCACA

GCTTCAGCTTCA

CCACTTGTCCATTGCGTTATTTTCTTTTTCCTTTATAATTCTTTCTTTTTCCTTCACCACTTGTCCATTGCGTTATTTTCTTTTTCCTTTATAATTCTTTCTTTTTCCTTCA

TAATTAAT

TTTCAAAAGAAAACCCAAAGCTCTAAGGTAACAAATTACCAAATTACATGAAGTTTCAAAAGAAAACCCAAAGCTCTAAGGTAACAAATTACCAAATTTACATGAAG

ATTTGGTATTTGGT

TTTTGTCTTGCATTTTTTTCCTTTATGTGACGCTGGACCTTTTCTTTACCCAAGGTTTTGTCTTGCATTTTTTTCCTTTATGTGACGCTGGACCTTTTCTTTACCCAAGG

ATTTTATTTT

TAAAACTCAGATTTAAAACAAGGGGTTACTTTACATCCTACTAAGAAGTTTAA GTAAGTATAAAACTCAGATTTAAAACAAGGGTTACTTTACATCCTACTAAGAAGTTTAA GTAAGTA

AGTTTCATTCTAAAATCAGAGGTAAATAGAGTGCATAAATAATTTTGTTTTAATAGTTTCATTCTAAAATCAGAGGTAAATAGAGTGCATAAATAATTTTGTTTTAAT

CTTTTTCTTTTT

GTTTTTCTTTTAGACACATTAGCTCTGGAGTGAGTCTGTCATAATATTTGAACAGTTTTTCTTTTAGACACATTAGCTCTGGAGTGAGTCTGTCATAATATTTGAACA

AAAATTAAAATT

GAGAGCTTTATTGCTGCATTTTAAGCATAATTAATTTGGACATTATTTCGTGTT GTGTTCGAGAGCTTTATTGCTGCATTTTAAGCATAATTAATTTGGACATTATTTCGTGTT GTGTTC

TTTATAACCACCGAGTATTAAACTGTAAATCATAATGTAACTGAAGCATAAAC ATCACATTTTATAACCACCGAGTATTAAACTGTAAATCATAATGTAACTGAAGCATAAAC ATCACAT

GGCATGTTTTGTCATTGTTTTCAGGTACTGAGTTCTTACTTGAGTATCATAATA TATTGTGGCATGTTTTGTCATTGTTTTCAGGTACTGAGTTCTTACTTGAGTATCATAATA TATTGT

GTTTT AACACCAACACTGTAACATTTACGAATTATTTTTTTTAAACTTCAGTTTTGTTTT AACACCAACACTGTAACATTTACGAATTATTTTTTTTAAACTTCAGTTTT

ACTGCAACTGCA

TTTTCACAACATATCAGACTTCACCAAATATATGCCTTACTATTGTATTATAGT ACTGCTTTTTCACAACATATCAGACTTCACCAAATATATGCCTTACTATTGTATTATAGT ACTGCT

TTACTGTGTATCTCAATAAAGCACGCAGTTATGTTAC_________________TTACTGTGTATCTCAATAAAGCACGCAGTTATGTTAC_________________

Полноразмерный белок дистрофин дикого типа (изоформа Dp427m) содержит 24 спектринподобных повтора, по меньшей мере четыре шарнирных участка, актин-связывающий домен (ABD1), богатый цистеином домен (CR) и С-концевой домен (С-конц.). Полипептидная последовательность каждого домена показана в табл. 3 и нуклеотидная последовательность каждого домена показана в табл. 4.The full-length wild-type dystrophin protein (isoform Dp427m) contains 24 spectrin-like repeats, at least four hinge regions, an actin-binding domain (ABD1), a cysteine-rich domain (CR), and a C-terminal domain (C-conc). The polypeptide sequence of each domain is shown in Table. 3 and the nucleotide sequence of each domain is shown in Table. 4.

- 23 046419- 23 046419

Таблица 3Table 3

Аминокислотные последовательности доменов дистрофинаAmino acid sequences of dystrophin domains

Описание и идентификатор последовательности Description and sequence ID Последовательность Subsequence ABD I (SEQ ID NO: 3) ABD I (SEQ ID NO: 3) MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIENLFSDLQDG RRLLDLLEGLTGQKLPKEKGSTR VHALNNVNKALRVLQNNNVDLVNIGSTDIVDGNHKLTLGLIWNIILHW QVKNVMKNIMAGLQQTNSEKIL LSWVRQSTRNYPQVNVINFTTSWSDGLALNALIHSHRPDLFDWNSVVC QQSATQRLEHAFNIARYQLGIE KLLDPEDVDTTYPDKKSILMYITSLFQVLPQQVSIEAIQEVE MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIENLFSDLQDG RRLLDLLEGLTGQKLPKEKGSTR VHALNNVNKALRVLQNNNVDLVNIGSTDIVDGNHKLTLGLIWNIILHW QVKNVMKNIMAGLQQTNSEKIL LSWVRQSTRNYPQVNVINFTTSWSDGLALNALIHSHRPDLFDWNSVVC QQSATQRLEHAFNIARYQLGIE KLLDPEDVDTTYPDKKSILMYITSLFQVLPQQVSIEAIQEVE Шарнир 1 (SEQ ID NO: 4) Hinge 1 (SEQ ID NO: 4) MLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERTSSPKPRFKSYAY TQAAYVTTSDPTRSPFPSQHL EAPEDKSFGSSLMES MLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERTSSPKPRFKSYAY TQAAYVTTSDPTRSPFPSQHL EAPEDKSFGSSLMES Спектриновый повтор 1 (SEQ ID NO: 5) Spectrin repeat 1 (SEQ ID NO: 5) EVNLDRYQTALEEVLSWLLSAEDTLQAQGEISNDVEVVKDQFHTHEGY MMDLTAHQGRVGNILQLGSKLI GTGKLSEDEETEVQEQMNLLNSRWECLRVASMEKQSNLH EVNLDRYQTALEEVLSWLLSAEDTLQAQGEISNDVEVVKDQFHTHEGY MMDLTAHQGRVGNILQLGSKLI GTGKLSEDEETEVQEQMNLLNSRWECLRVASMEKQSNLH Спектриновый повтор 2 (SEQ ID NO: 6) Spectrin repeat 2 (SEQ ID NO: 6) RVLMDLQNQKLKELNDWLTKTEERTRKMEEEPLGPDLEDLKRQVQQH KVLQEDLEQEQVRVNSLTHMVVV VDESSGDHATAALEEQLKVLGDRWANICRWTEDRWVLLQDI RVLMDLQNQKLKELNDWLTKTEERTRKMEEEPLGPDLEDLKRQVQQH KVLQEDLEQEQVRVNSLTHMVVV VDESSGDHATAALEEQLKVLGDRWANICRWTEDRWVLLQDI Спектриновый повтор 3 (SEQ ID NO: 7) Spectrin repeat 3 (SEQ ID NO: 7) LLKWQRLTEEQCLFSAWLSEKEDAVNKIHTTGFKDQNEMLSSLQKLAV LKADLEKKKQSMGKLYSLKQDL LSTLKNKSVTQKTEAWLDNFARCWDNLVQKLEKSTAQISQA LLKWQRLTEEQCLFSAWLSEKEDAVNKIHTTGFKDQNEMLSSLQKLAV LKADLEKKKQSMGKLYSLKQDL LSTLKNKSVTQKTEAWLDNFARCWDNLVQKLEKSTAQISQA Шарнир 2 (SEQ ID NO: 8) Hinge 2 (SEQ ID NO: 8) VTTTQPSLTQTTVMETVTTVTTREQILVKHAQEELPPPPPQKKRQITVD VTTTQPSLTQTTVMETVTTVTTREQILVKHAQEELPPPPPQKKRQITVD Спектриновый повтор 4 (SEQ ID NO: 9) Spectrin repeat 4 (SEQ ID NO: 9) SEIRKRLDVDITELHSWITRSEAVLQSPEFAIFRKEGNFSDLKEKVNAIER EKAEKFRKLQDASRSAQAL VEQMVNEGVNADSIKQASEQLNSRWIEFCQLLSERLNWLEY SEIRKRLDVDITELHSWITRSEAVLQSPEFAIFRKEGNFSDLKEKVNAIER EKAEKFRKLQDASRSAQAL VEQMVNEGVNADSIKQASEQLNSRWIEFCQLLSERLNWLEY Спектриновый повтор 5 (SEQ ID NO: 10) Spectrin repeat 5 (SEQ ID NO: 10) QNNIIAFYNQLQQLEQMTTTAENWLKIQPTTPSEPTAIKSQLKICKDEVN RLSGLQPQIERLKIQSIALK EKGQGPMFLDADFVAFTNHFKQVFSDVQAREKELQTIFD QNNIIAFYNQLQQLEQMTTTAENWLKIQPTTPSEPTAIKSQLKICKDEVN RLSGLQPQIERLKIQSIALK EKGQGPMFLDADFVAFTNHFKQVFSDVQAREKELQTIFD Спектриновый повтор 6 (SEQ ID NO: 11) Spectrin repeat 6 (SEQ ID NO: 11) TLPPMRYQETMSAIRTWVQQSETKLSIPQLSVTDYEIMEQRLGELQALQ SSLQEQQSGLYYLSTTVKEMS KKAPSEISRKYQSEFEEIEGRWKKLSSQLVEHCQKLEEQ TLPPMRYQETMSAIRTWVQQSETKLSIPQLSVTDYEIMEQRLGELQALQ SSLQEQQSGLYYLSTTVKEMS KKAPSEISRKYQSEFEEIEGRWKKLSSQLVEHCQKLEEQ Спектриновый повтор 7 (SEQ ID NO: 12) Spectrin repeat 7 (SEQ ID NO: 12) MNKLRKIQNHIQTLKKWMAEVDVFLKEEWPALGDSEILKKQLKQCRLL VSDIQTIQPSLNSVNEGGQKIK NEAEPEFASRLETELKELNTQWDHMCQQVYARKEALKGG MNKLRKIQNHIQTLKKWMAEVDVFLKEEWPALGDSEILKKQLKQCRLL VSDIQTIQPSLNSVNEGGQKIK NEAEPEFASRLETELKELNTQWDHMCQQVYARKEALKGG

- 24 046419- 24 046419

Спектриновый повтор 8 (SEQ IDNO: 13) Spectrin repeat 8 (SEQ IDNO: 13) LEKTVSLQKDLSEMHEWMTQAEEEYLERDFEYKTPDELQKAVEEMKR AKEEAQQKEAKVKLLTESVNSVI AQAPPVAQEALKKELETLTTNYQWLCTRLNGKCKTLEEV LEKTVSLQKDLSEMHEWMTQAEEEYLERDFEYKTPDELQKAVEEMKR AKEEAQQKEAKVKLLTESVNSVI AQAPPVAQEALKKELETLTTNYQWLCTRLNGKCKTLEEV Спектриновый повтор 9 (SEQ IDNO: 14) Spectrin repeat 9 (SEQ IDNO: 14) WACWHELLSYLEKANKWLNEVEFKLKTTENIPGGAEEISEVLDSLENL MRHSEDNPNQIRILAQTLTDGG VMDELINEELETFNSRWRELHEEAVRRQKLLEQS WACWHELLSYLEKANKWLNEVEFKLKTTENIPGGAEEISEVLDSLENL MRHSEDNPNQIRILAQTLTDGG VMDELINEELETFNSRWRELHEEAVRRQKLLEQS Спектриновый повтор 10 (SEQ IDNO: 15) Spectrin repeat 10 (SEQ IDNO: 15) IQSAQETEI<SLHLIQESLTFIDI<QLAAYIADI<VDAAQMPQEAQI<IQSDLT SHEISLEEMKKHNQGKEAAQ RVLSQIDVAQI<I<LQDVSMI<FRL IQSAQETEI<SLHLIQESLTFIDI<QLAAYIADI<VDAAQMPQEAQI<IQSDLT SHEISLEEMKKHNQGKEAAQ RVLSQIDVAQI<I<LQDVSMI<FRL Спектриновый повтор И (SEQ IDNO: 16) Spectrin repeat AND (SEQ IDNO: 16) FQKPANFE Q RLQESKMILDEVKMHLPALETKSVEQEVVQSQLNHCVNLYKSLSEVKS EVEMVIKTGRQIV QKKQTENPKELDERVTALKLHYNELGAKVTERKQQLEKC FQKPANFE Q RLQESKMILDEVKMHLPALETKSVEQEVVQSQLNHCVNLYKSLSEVKS EVEMVIKTGRQIV QKKQTENPKELDERVTALKLHYNELGAKVTERKQQLEKC Спектриновый повтор 12 (SEQ IDNO: 17) Spectrin repeat 12 (SEQ IDNO: 17) LKLSRKMRKEMNVLTEWLAATDMELTKRSAVEGMPSNLDSEVAWGK ATQKEIEKQKVHLKSITEVGEALK TVLGKKETLVEDKLSLLNSNWIAVTSRAEEWLNLLLEY LKLSRKMRKEMNVLTEWLAATDMELTKRSAVEGMPSNLDSEVAWGK ATQKEIEKQKVHLKSITEVGEALK TVLGKKETLVEDKLSLLNSNWIAVTSRAEEWLNLLLEY Спектриновый повтор 13 (SEQ IDNO: 18) Spectrin repeat 13 (SEQ IDNO: 18) QKHMETFDQNVDHITKWIIQADTLLDESEKKKPQQKEDVLKRLKAELN DIRPKVDSTRDQAANLMANRGD HCRKLVEPQISELNHRFAAISHRIKTGKASIPLK QKHMETFDQNVDHITKWIIQADTLLDESEKKKPQQKEDVLKRLKAELN DIRPKVDSTRDQAANLMANRGD HCRKLVEPQISELNHRFAAISHRIKTGKASIPLK Спектриновый повтор 14 (SEQ IDNO: 19) Spectrin repeat 14 (SEQ IDNO: 19) ELEQFNSDIQKLLEPLEAEIQQGVNLKEEDFNKDMNEDNEGTVKELLQR GDNLQQRITDERKREEIKIKQ QLLQTKHNALKDLRSQRRKKALEI ELEQFNSDIQKLLEPLEAEIQQGVNLKEEDFNKDMNEDNEGTVKELLQR GDNLQQRITDERKREEIKIKQ QLLQTKHNALKDLRSQRRKKALEI Спектриновый повтор 15 (SEQ Ш NO: 20) Spectrin repeat 15 (SEQ Ш NO: 20) SHQWYQYI<RQADDLLI<CLDDIEI<I<LASLPEPRDERI< H<EIDRELQI<I<I<E ELNAVRRQAEGLSEDGAAMAV EPTQIQLSKRWREIESKFAQFRRLNFAQ SHQWYQYI<RQADDLLI<CLDDIEI<I<LASLPEPRDERI< H<EIDRELQI<I<I<E ELNAVRRQAEGLSEDGAAMAV EPTQIQLSKRWREIESKFAQFRRLNFAQ L3 (20-мерный линкер) (SEQ IDNO: 21) L3 (20-mer linker) (SEQ IDNO: 21) IHTVREETMMVMTEDMPLEI IHTVREETMMVMTEDMPLEI Спектриновый повтор 16 (SEQ Ш NO: 22) Spectrin repeat 16 (SEQ Ш NO: 22) SYVPSTYLTEITHVSQALLEVEQLLNAPDLCAKDFEDLFKQEESLKNIKD SLQQSSGRIDIIHSKKTAAL QSATPVERVKLQEALSQLDFQWEKVNKMYKDRQGRFDRS SYVPSTYLTEITHVSQALLEVEQLLNAPDLCAKDFEDLFKQEESLKNIKD SLQQSSGRIDIIHSKKTAAL QSATPVERVKLQEALSQLDFQWEKVNKMYKDRQGRFDRS Спектриновый повтор 17 (SEQ IDNO: 23) Spectrin repeat 17 (SEQ IDNO: 23) VEKWRRFHYDIKIFNQWLTEAEQFLRKTQIPENWEHAKYKWYLKELQ DGIGQRQTVVRTLNATGEEIIQQ SSKTDASILQEKLGSLNLRWQEVCKQLSDRKKRLEEQ VEKWRRFHYDIKIFNQWLTEAEQFLRKTQIPENWEHAKYKWYLKELQ DGIGQRQTVVRTLNATGEEIIQQ SSKTDASILQEKLGSLNLRWQEVCKQLSDRKKRLEEQ Спектриновый повтор 18 (SEQ Ш NO: 24) Spectrin repeat 18 (SEQ Ш NO: 24) KNILSEFQRDLNEFVLWLEEADNIASIPLEPGKEQQLKEKLEQVKLLVEE LPLRQGILKQLNETGGPVLV SAPISPEEQDKLENKLKQTNLQWIKVSRALPEKQGEIEAQIKDLGQL KNILSEFQRDLNEFVLWLEEADNIASIPLEPGKEQQLKEKLEQVKLLVEE LPLRQGILKQLNETGGPVLV SAPISPEEQDKLENKLKQTNLQWIKVSRALPEKQGEIEAQIKDLGQL Спектриновый повтор 19 (SEQ IDNO: 25) Spectrin repeat 19 (SEQ IDNO: 25) EKKLEDLEEQLNHLLLWLSPIRNQLEIYNQPNQEGPFDVQETEIAVQAK QPDVEEILSKGQHLYKEKPAT QPVKRKLEDLS SEWKAVNRLLQELRAKQPDL EKKLEDLEEQLNHLLLWLSPIRNQLEIYNQPNQEGPFDVQETEIAVQAK QPDVEEILSKGQHLYKEKPAT QPVKRKLEDLS SEWKAVNRLLQELRAKQPDL Шарнир 3 (SEQ Ш NO: 26) Hinge 3 (SEQ Ш NO: 26) APGLTTIGASPTQT VTL VTQP VVTKET AISKLEMP S SLMLE APGLTTIGASPTQT VTL VTQP VVTKET AISKLEMP S SLMLE Спектриновый повтор 20 (SEQ Ш NO: 27) Spectrin repeat 20 (SEQ Ш NO: 27) VPALADFNRAWTELTDWLSLLDQVIKSQRVMVGDLEDINEMIIKQKAT MQDLEQRRPQLEELITAAQNLK NKTSNQEARTIITDRIERIQNQWDEVQEHLQNRRQQLNEM VPALADFNRAWTELTDWLSLLDQVIKSQRVMVGDLEDINEMIIKQKAT MQDLEQRRPQLEELITAAQNLK NKTSNQEARTIITDRIERIQNQWDEVQEHLQNRRQQLNEM Спектриновый повтор 21 (SEQ Ш NO: 28) Spectrin repeat 21 (SEQ Ш NO: 28) LKDSTQWLEAKEEAEQVLGQARAKLESWKEGPYTVDAIQKKITETKQL AKDLRQWQTNVDVANDLALKLL RDYSADDTRKVHMITENINASWRSIHKRVSEREAALEET LKDSTQWLEAKEEAEQVLGQARAKLESWKEGPYTVDAIQKKITETKQL AKDLRQWQTNVDVANDLALKLL RDYSADDTRKVHMITENINASWRSIHKRVSEREAALEET

- 25 046419- 25 046419

Спектриновый повтор 22 (SEQ Ш NO: 29) Spectrin repeat 22 (SEQ Ш NO: 29) HRLLQQFPLDLEKFLAWLTEAETTANVLQDATRKERLLEDSKGVKELM KQWQDLQGEIEAHTDVYHNLDE NSQKILRSLEGSDDAVLLQRRLDNMNFKWSELRKKSLNIRSHLEAS HRLLQQFPLDLEKFLAWLTEAETTANVLQDATRKERLLEDSKGVKELM KQWQDLQGEIEAHTDVYHNLDE NSQKILRSLEGSDDAVLLQRRLDNMNFKWSELRKKSLNIRSHLEAS Спектриновый повтор 23 (SEQ IDNO: 30) Spectrin repeat 23 (SEQ IDNO: 30) SDQWKRLHLSLQELLVWLQLKDDELSRQAPIGGDFPAVQKQNDVHRA FKRELKTKEPVIMSTLETVRIFL TEQPLEGLEKLYQEPRELPPEERAQNVTRLLRKQAEEVNTEWEKLNLHS ADWQRKIDET SDQWKRLHLSLQELLVWLQLKDDELSRQAPIGGDFPAVQKQNDVHRA FKRELKTKEPVIMSTLETVRIFL TEQPLEGLEKLYQEPRELPPEERAQNVTRLLRKQAEEVNTEWEKLNLHS ADWQRKIDET Спектриновый повтор 24 (SEQ IDNO: 31) Spectrin repeat 24 (SEQ IDNO: 31) LERLQELQEATDELDLKLRQAEVIKGSWQPVGDLLIDSLQDHLEKVKA LRGEIAPLKENVSHVNDLARQL TTLGIQLSPYNLSTLEDLNTRWKLLQVAVEDRVRQLHE LERLQELQEATDELDLKLRQAEVIKGSWQPVGDLLIDSLQDHLEKVKA LRGEIAPLKENVSHVNDLARQL TTLGIQLSPYNLSTLEDLNTRWKLLQVAVEDRVRQLHE Шарнир 4 (SEQ Ш NO: 32) Hinge 4 (SEQ Ш NO: 32) AHRDFGPASQHFLSTSVQGPWERAISPNKVPYYINHETQTTCWDHPKM TELYQSLADLNN VRF S AYRTAM KL AHRDFGPASQHFLSTSVQGPWERAISPNKVPYYINHETQTTCWDHPKM TELYQSLADLNN VRF S AYRTAM KL CR (SEQ Ш NO: 33) CR (SEQ Ш NO: 33) RRLQKALCLDLLSLSAACDALDQHNLKQNDQPMDILQIINCLTTIYDRL EQEHNNLVNVPLCVDMCLNWL LNVYDTGRTGRIRVL SFKTGIISLCKAHLEDKYRYLFKQ VAS STGFCDQ RRLGLLLHDSIQIPRQLGEVA SFGGSNIEPSVRSCFQFANNKPEIEAALFLDWMRLEPQSMVWLPVLHRV AAAETAKHQAKCNICKECPII GFRYRSLKHFNYDICQSCFFSGRVAKGHKMHYPMVEYCTPTTSGEDVR DFAKVLKNKFRTKRYFAKHPRM GYLPVQTVLEGDNMET RRLQKALCLDLLSLSAACDALDQHNLKQNDQPMDILQIINCLTTIYDRL EQEHNNLVNVPLCVDMCLNWL LNVYDTGRTGRIRVL SFKTGIISLCKAHLEDKYRYLFKQ VAS STGFCDQ RRLGLLLHDSIQIPRQLGEVA SFGGSNIEPSVRSCFQFANNKPEIEAALFLDWMRLEPQSMVWLPVLHRV AAAETAKHQAKCNICKECPII GFRYRSLKHFNYDICQSCFFSGRVAKGHKMHYPMVEYCTPTTSGEDVR DFAKVLKNKFRTKRYFAKHPRM GYLPVQTVLEGDNMET С-конц. (SEQ Ш NO: 34) C-conc. (SEQ Ш NO: 34) PVTLINFWPVDSAPASSPQLSHDDTHSRIEHYASRLAEMENSNGSYLND SISPNESIDDEHLLIQHYCQS LNQDSPLSQPRSPAQILISLESEERGELERILADLEEENRNLQAEYDRLKQ QHEHKGLSPLPSPPEMMPT SPQSPRDAELIAEAKLLRQHKGRLEARMQILEDHNKQLESQLHRLRQLL EQPQAEAKVNGTTVSSPSTSL QRSDSSQPMLLRVVGSQTSDSMGEEDLLSPPQDTSTGLEEVMEQLNNSF PSSRGRNTPGKPMREDTM PVTLINFWPVDSAPASSPQLSHDDTHSRIEHYASRLAEMENSNGSYLND SISPNESIDDEHLLIQHYCQS LNQDSPLSQPRSPAQILISLESEERGELERILADLEEENRNLQAEYDRLKQ QHEHKGLSPLPSPPEMMPT SPQSPRDAELIAEAKLLRQHKGRLEARMQILEDHNKQLESQLHRLRQLL EQPQAEAKVNGTTVSSPSTSL QRSDSSQPMLLLRVVGSQTSDSMGEEDLLSPPQDTSTGLEEVMEQLNNSF PSSRGRNTPGKPMREDTM

Таблица 4Table 4

Нуклеотидные последовательности доменов дистрофинаNucleotide sequences of dystrophin domains

Описание и идентификатор последовательности Description and sequence ID Последовательность Subsequence 5' нетранслируемая область (SEQIDNO:35) 5' untranslated region (SEQIDNO:35) gggattccct cactttcccc ctacaggact cagatctggg aggcaattac cttcggagaa 60 aaacgaatag gaaaaactga agtgttactt tttttaaagc tgctgaagtt tgttggtttcl20 tcattgtttt taagcctact ggagcaataa agtttgaaga acttttacca ggttttttttl 80 atcgctgcct tgatatacac ttttcaaa 208 gggattccct cactttcccc ctacaggact cagatctggg aggcaattac cttcggagaa 60 aaacgaatag gaaaaactga agtgttactt tttttaaagc tgctgaagtt tgttggtttcl20 tcattgtttt taagcctact ggagcaataa agtttgaaga acttttacca ggtttttt ttl 80 atcgctgcct tgatatacac ttttcaaa 208 ABDI (SEQ ID NO:36) ABDI (SEQ ID NO:36) atgctttggt gggaagaagt agaggactgt tatgaaagag aagatgttca aaagaaaaca 60 ttcacaaaat gggtaaatgc acaattttct aagtttggga agcagcatat tgagaacctcl20 ttcagtgacc tacaggatgg gaggcgcctc ctagacctcc tcgaaggcct gacagggcaal80 aaactgccaa aagaaaaagg atccacaaga gttcatgccc tgaacaatgt caacaaggca240 ctgcgggttt tgcagaacaa taatgttgat ttagtgaata ttggaagtac tgacatcgta300 gatggaaatc ataaactgac tcttggtttg atttggaata taatcctcca ctggcaggtc360 aaaaatgtaa tgaaaaatat catggctgga ttgcaacaaa ccaacagtga aaagattctc420 ctgagctggg tccgacaatc aactcgtaat tatccacagg ttaatgtaat caacttcacc480 accagctggt ctgatggcct ggctttgaat gctctcatcc atagtcatag gccagaccta540 atgctttggt gggaagaagt agaggactgt tatgaaagag aagatgttca aaagaaaaca 60 ttcacaaaat gggtaaatgc acaattttct aagtttggga agcagcatat tgagaacctcl20 ttcagtgacc tacaggatgg gaggcgcctc ctagacctcc tcgaaggcct gacagggcaal80 aaactgccaa aagaaaaagg atccacaaga gttcatgccc tgaacaatgt caacaaggca240 ctgcgggttt tgcagaacaa taatgttgat ttagtgaata ttggaagtac tgacatcgta300 gatggaaatc ataaactgac tcttggtttg atttggaata taatcctcca ctggcaggtc 360 aaaaatgtaa tgaaaaatat catggctgga ttgcaacaaa ccaacagtga aaagattctc420 ctgagctggg tccgacaatc aactcgtaat tatccacagg ttaatgtaat caacttcacc480 accagctggt ctgatggcct ggctttgaat gctctcatcc atagtcatag gccagaccta540

- 26 046419- 26 046419

tttgactgga atagtgtggt ttgccagcag tcagccacac aacgactgga acatgcattc600 aacatcgcca gatatcaatt aggcatagag aaactactcg atcctgaaga tgttgatacc660 acctatccag ataagaagtc catcttaatg tacatcacat cactcttcca agttttgcct720 caacaagtga gcattgaagc catccaggaa gtggaa756 tttgactgga atagtgtggt ttgccagcag tcagccacac aacgactgga acatgcattc600 aacatcgcca gatatcaatt aggcatagag aaactactcg atcctgaaga tgttgatacc660 acctatccag ataagaagtc catcttaatg tacatcacat cactcttcca agttttgcct720 caacaagtga gcattgaagc catccaggaa gtggaa756 Шарнир 1 (SEQ IDNO:37) Hinge 1 (SEQ IDNO:37) atgttgccaa ggccacctaa agtgactaaa gaagaacatt ttcagttaca tcatcaaatg 60 cactattctc aacagatcac ggtcagtcta gcacagggat atgagagaac ttcttcccctl20 aagcctcgat tcaagagcta tgcctacaca caggctgctt atgtcaccac ctctgaccctl80 acacggagcc catttccttc acagcatttg gaagctcctg aagacaagtc atttggcagt240 tcattgatgg agagt 255 atgttgccaa ggccacctaa agtgactaaa gaagaacatt ttcagttaca tcatcaaatg 60 cactattctc aacagatcac ggtcagtcta gcacagggat atgagagaac ttcttcccctl20 aagcctcgat tcaagagcta tgcctacaca caggctgctt atgtcaccac ctctgaccctl80 acac ggagcc catttccttc acagcatttg gaagctcctg aagacaagtc atttggcagt240 tcattgatgg agagt 255 Спектриновый повтор 1 (SEQ IDNO:38) Spectrin repeat 1 (SEQ IDNO:38) gaagtaaacc tggaccgtta tcaaacagct ttagaagaag tattatcgtg gcttctttct 60 gctgaggaca cattgcaagc acaaggagag atttctaatg atgtggaagt ggtgaaagacl20 cagtttcata ctcatgaggg gtacatgatg gatttgacag cccatcaggg ccgggttggtl80 aatattctac aattgggaag taagctgatt ggaacaggaa aattatcaga agatgaagaa240 actgaagtac aagagcagat gaatctccta aattcaagat gggaatgcct cagggtagct300 agcatggaaa aacaaagcaa tttacat327 gaagtaaacc tggaccgtta tcaaacagct ttagaagaag tattatcgtg gcttctttct 60 gctgaggaca cattgcaagc acaaggag atttctaatg atgtggaagt ggtgaaagacl20 cagtttcata ctcatgaggg gtacatgatg gatttgacag cccatcaggg ccgggttggtl80 a atattctac aattgggaag taagctgatt ggaacaggaa aattatcaga agatgaagaa240 actgaagtac aagagcagat gaatctccta aattcaagat gggaatgcct cagggtagct300 agcatggaaa aacaaagcaa tttacat327 Спектриновый повтор 2 (SEQ ID 140:3 9) Spectrin repeat 2 (SEQ ID 140:3 9) agagttttaa tggatctcca gaatcagaaa ctgaaagagt tgaatgactg gctaacaaaa 60 acagaagaaa gaacaaggaa aatggaggaa gagcctcttg gacctgatct tgaagacctal20 aaacgccaag tacaacaaca taaggtgctt caagaagatc tagaacaaga acaagtcaggl80 gtcaattctc tcactcacat ggtggtggta gttgatgaat ctagtggaga tcacgcaact240 gctgctttgg aagaacaact taaggtattg ggagatcgat gggcaaacat ctgtagatgg300 acagaagacc gctgggttct tttacaagac ate 333 agagttttaa tggatctcca gaatcagaaa ctgaaagagt tgaatgactg gctaacaaaa 60 acagaagaaa gaacaaggaa aatggaggaa gagcctcttg gacctgatct tgaagacctal20 aaacgccaag tacaacaaca taaggtgctt caagaagatc tagaacaaga acaagtcaggl80 gt caattctc tcactcacat ggtggtggta gttgatgaat ctagtggaga tcacgcaact240 gctgctttgg aagaacaact taaggtattg ggagatcgat gggcaaacat ctgtagatgg300 acagaagacc gctgggttct tttacaagac ate 333 Спектриновый повтор 3 (SEQ Ш NO:40) Spectrin repeat 3 (SEQ Ш NO:40) cttctcaaat ggcaacgtctactgaagaa cagtgccttt ttagtgcatg gctttcagaa 60 aaagaagatg cagtgaacaa gattcacaca actggcttta aagatcaaaa tgaaatgttal20 teaagtette aaaaactggc cgttttaaaa geggatetag aaaagaaaaa gcaatccatgl80 ggcaaactgt attcactcaa acaagatctt ctttcaacac tgaagaataa gtcagtgacc240 cagaagacgg aagcatggct ggataacttt gcccggtgtt gggataattt agtccaaaaa300 ettgaaaaga gtacagcaca gatttcacag get 333 cttctcaaat ggcaacgtctactgaagaa cagtgccttt ttagtgcatg gctttcagaa 60 aaagaagatg cagtgaacaa gattcacaca actggcttta aagatcaaaa tgaaatgttal20 teaagtette aaaaactggc cgttttaaaa geggatetag aaaagaaaaa gcaatccatgl80 gg caaactgt attcactcaa acaagatctt ctttcaacac tgaagaataa gtcagtgacc240 cagaagacgg aagcatggct ggataacttt gcccggtgtt gggataattt agtccaaaaa300 ettgaaaaga gtacagcaca gatttcacag get 333 Шарнир 2 (SEQ IDNO:41) Hinge 2 (SEQ IDNO:41) gtcaccacca ctcagccatc actaacacag acaactgtaa tggaaacagt aactacggtg 60 accacaaggg aacagatcct ggtaaagcat gctcaagagg aacttccacc accacctcccl20 caaaagaaga ggcagattac tgtggatl47 gtcaccacca ctcagccatc actaacacag acaactgtaa tggaaacagt aactacggtg 60 accacaaggg aacagatcct ggtaaagcat gctcaagagg aacttccacc accacctcccl20 caaaagaaga ggcagattac tgtggatl47 Спектриновый повтор 4 (SEQ Ш NO:42) Spectrin repeat 4 (SEQ Ш NO:42) tetgaaatta ggaaaaggtt ggatgttgat ataactgaac ttcacagctg gattactcgc 60 teagaagetg tgttgcagag teetgaattt gcaatctttc ggaaggaagg caacttctcal20 gaettaaaag aaaaagtcaa tgccatagag egagaaaaag etgagaagtt cagaaaactgl80 caagatgcca gcagatcagc tcaggccctg gtggaacaga tggtgaatga gggtgttaat240 gcagatagca tcaaacaagc ctcagaacaa ctgaacagcc ggtggatcga attctgccag300 ttgctaagtg agagaettaa ctggctggag tat 333 tetgaaatta ggaaaaggtt ggatgttgat ataactgaac ttcacagctg gattactcgc 60 teagaagetg tgttgcagag teetgaattt gcaatctttc ggaaggaagg caacttctcal20 gaettaaaag aaaaagtcaa tgccatagag egagaaaaag etgagaagtt cagaaaactgl80 ca agatgcca gcagatcagc tcaggccctg gtggaacaga tggtgaatga gggtgttaat240 gcagatagca tcaaacaagc ctcagaacaa ctgaacagcc ggtggatcga attctgccag300 ttgctaagtg agagaettaa ctggctggag tat 333 Спектриновый повтор 5 (SEQ IDNO:43) Spectrin repeat 5 (SEQ IDNO:43) cagaacaaca teategettt ctataatcag ctacaacaat tggagcagat gacaactact 60 gctgaaaact ggttgaaaat ccaacccacc accccatcag agccaacagc aattaaaagtl20 cagttaaaaa tttgtaagga tgaagtcaac cggctatcag gtcttcaacc tcaaattgaal80 egattaaaaa ttcaaagcat agccctgaaa gagaaaggac aaggacccat gttcctggat240 gcagactttg tggcctttac aaatcatttt aagcaagtct tttctgatgt gcaggccaga300 gagaaagagc tacagacaat ttttgac327 cagaacaaca teategettt ctataatcag ctacaacaat tggagcagat gacaactact 60 gctgaaaact ggttgaaaat ccaacccacc accccatcag agccaacagc aattaaaagtl20 cagttaaaaa tttgtaagga tgaagtcaac cggctatcag gtcttcaacc tcaaattgaal80 egattaaa aa ttcaaagcat agccctgaaa gagaaaggac aaggacccat gttcctggat240 gcagactttg tggcctttac aaatcatttt aagcaagtct tttctgatgt gcaggccaga300 gagaaagagc tacagacaat ttttgac327

- 27 046419- 27 046419

Спектриновый повтор 6 (SEQ Ш NO:44) Spectrin repeat 6 (SEQ Ш NO:44) actttgccac caatgcgcta tcaggagacc atgagtgcca tcaggacatg ggtccagcag 60 tcagaaacca aactctccat acctcaactt agtgtcaccg actatgaaat catggagcagl20 agactcgggg aattgcaggc tttacaaagt tctctgcaag agcaacaaag tggcctatacl80 tatctcagca ccactgtgaa agagatgtcg aagaaagcgc cctctgaaat tagccggaaa240 tatcaatcag aatttgaaga aattgaggga cgctggaaga agctctcctc ccagctggtt300 gagcattgtc aaaagctaga ggagcaa327 actttgccac caatgcgcta tcaggagacc atgagtgcca tcaggacatg ggtccagcag 60 tcagaaacca aactctccat acctcaactt agtgtcaccg actatgaaat catggagcagl20 agactcgggg aattgcaggc tttacaaagt tctctgcaag agcaacaaag tggcctatacl80 tatctcagca ccactgtgaa agagatgtcg aagaaagcgc cctctgaaat tagccggaaa240 tatcaatcag aatttgaaga aattgaggga cgctggaaga agctctcctc ccagctggtt300 gagcattgtc aaaagctaga ggagcaa327 Спектриновый повтор 7 (SEQ ZDNO:45) Spectrin repeat 7 (SEQ ZDNO:45) atgaataaac tccgaaaaat tcagaatcac atacaaaccc tgaagaaatg gatggctgaa 60 gttgatgttt ttctgaagga ggaatggcct gcccttgggg attcagaaat tctaaaaaagl20 cagctgaaac agtgcagact tttagtcagt gatattcaga caattcagcc cagtctaaacl80 agtgtcaatg aaggtgggca gaagataaag aatgaagcag agccagagtt tgcttcgaga240 cttgagacag aactcaaaga acttaacact cagtgggatc acatgtgcca acaggtctat300 gccagaaagg aggccttgaa gggaggt327 atgaataaac tccgaaaaat tcagaatcac atacaaaccc tgaagaaatg gatggctgaa 60 gttgatgttt ttctgaagga ggaatggcct gcccttgggg attcagaaat tctaaaaaagl20 cagctgaaac agtgcagact tttagtcagt gatattcaga caattcagcc cagtctaaacl80 a gtgtcaatg aaggtgggca gaagataaag aatgaagcag agccagagtt tgcttcgaga240 cttgagacag aactcaaaga acttaacact cagtgggatc acatgtgcca acaggtctat300 gccagaaagg aggccttgaa gggaggt327 Спектриновый повтор 8 (SEQ Ш NO:46) Spectrin repeat 8 (SEQ Ш NO:46) ttggagaaaa ctgtaagcct ccagaaagat ctatcagaga tgcacgaatg gatgacacaa 60 gctgaagaag agtatcttga gagagatttt gaatataaaa ctccagatga attacagaaal20 gcagttgaag agatgaagag agctaaagaa gaggcccaac aaaaagaagc gaaagtgaaal80 ctccttactg agtctgtaaa tagtgtcata gctcaagctc cacctgtagc acaagaggcc240 ttaaaaaagg aacttgaaac tctaaccacc aactaccagt ggctctgcac taggctgaat300 gggaaatgca agactttgga agaagtt327 ttggagaaaa ctgtaagcct ccagaaagat ctatcagaga tgcacgaatg gatgacacaa 60 gctgaagaag agtatcttga gagagatttt gaatataaaa ctccagatga attacagaaal20 gcagttgaag agatgaagag agctaaagaa gaggcccaac aaaaagaagc gaaagtgaaal80 ctccttactg agtctgtaaa tagtgtcata gctcaagctc cacctgtagc acaagaggcc240 ttaaaaaagg aacttgaaac tctaaccacc aactaccagt ggctctgcac taggctgaat300 gggaaatgca agactttgga agaagtt327 Спектриновый повтор 9 (SEQ Ш NO:47) Spectrin repeat 9 (SEQ Ш NO:47) tgggcatgtt ggcatgagtt attgtcatac ttggagaaag caaacaagtg gctaaatgaa 60 gtagaattta aacttaaaac cactgaaaac attcctggcg gagctgagga aatctctgagl20 gtgctagatt cacttgaaaa tttgatgcga cattcagagg ataacccaaa tcagattcgcl80 atattggcac agaccctaac agatggcgga gtcatggatg agctaatcaa tgaggaactt240 gagacattta attctcgttg gagggaacta catgaagagg ctgtaaggag gcaaaagttg300 cttgaacaga gc312 tgggcatgtt ggcatgagtt attgtcatac ttggagaaag caaacaagtg gctaaatgaa 60 gtagaattta aacttaaaac cactgaaaac attcctggcg gagctgagga aatctctgagl20 gtgctagatt cacttgaaaa tttgatgcga cattcagagg ataacccaaa tcagattcgcl80 at attggcac agaccctaac agatggcgga gtcatggatg agctaatcaa tgaggaactt240 gagacattta attctcgttg gagggaacta catgaagagg ctgtaaggag gcaaaagttg300 cttgaacaga gc312 Спектриновый повтор 10 (SEQ IDNO:48) Spectrin repeat 10 (SEQ IDNO:48) atccagtctg cccaggagac tgaaaaatcc ttacacttaa tccaggagtc cctcacattc 60 attgacaagc agttggcagc ttatattgca gacaaggtgg acgcagctca aatgcctcagl20 gaagcccaga aaatccaatc tgatttgaca agtcatgaga tcagtttaga agaaatgaagl80 aaacataatc aggggaagga ggctgcccaa agagtcctgt ctcagattga tgttgcacag240 aaaaaattac aagatgtctc catgaagttt cgatta276 atccagtctg cccaggagac tgaaaaatcc ttacacttaa tccaggagtc cctcacattc 60 attgacaagc agttggcagc ttatattgca gacaaggtgg acgcagctca aatgcctcagl20 gaagcccaga aaatccaatc tgatttgaca agtcatgaga tcagtttaga agaaatgaagl80 aa acataatc aggggaagga ggctgcccaa agagtcctgt ctcagattga tgttgcacag240 aaaaaattac aagatgtctc catgaagttt cgatta276 Спектриновый повтор И (SEQ Ш NO:49) Spectrin repeat I (SEQ Ш NO:49) ttccagaaac cagccaattt tgagctgcgt ctacaagaaa gtaagatgat tttagatgaa 60 gtgaagatgc acttgcctgc attggaaaca aagagtgtgg aacaggaagt agtacagtcal20 cagctaaatc attgtgtgaa cttgtataaa agtctgagtg aagtgaagtc tgaagtggaal80 atggtgataa agactggacg tcagattgta cagaaaaagc agacggaaaa tcccaaagaa240 cttgatgaaa gagtaacagc tttgaaattg cattataatg agctgggagc aaaggtaaca300 gaaagaaagc aacagttgga gaaatgc327 ttccagaaac cagccaattt tgagctgcgt ctacaagaaa gtaagatgat tttagatgaa 60 gtgaagatgc acttgcctgc attggaaaca aagagtgtgg aacaggaagt agtacagtcal20 cagctaaatc attgtgtgaa cttgtataaa agtctgagtg aagtgaagtc tgaag tggaal80 atggtgataa agactggacg tcagattgta cagaaaaagc agacggaaaa tcccaaagaa240 cttgatgaaa gagtaacagc tttgaaattg cattataatg agctgggagc aaaggtaaca300 gaaagaaagc aacagttgga gaaatgc327 Спектриновый повтор 12 (SEQ ZDNO:50) Spectrin repeat 12 (SEQ ZDNO:50) ttgaaattgt cccgtaagat gcgaaaggaa atgaatgtct tgacagaatg gctggcagct 60 acagatatgg aattgacaaa gagatcagca gttgaaggaa tgcctagtaa tttggattctl20 gaagttgcct ggggaaaggcactcaaaaa gagattgaga aacagaaggt gcacctgaagl80 agtatcacag agtaggaga ggccttgaaa acagttttgg gcaagaagga gacgttggtg240 gaagataaac tcagtcttct gaatagtaac tggatagctg tcacctcccg agcagaagag300 tggttaaatc ttttgttgga atac 324 ttgaaattgt cccgtaagat gcgaaaggaa atgaatgtct tgacagaatg gctggcagct 60 acagatatgg aattgacaaa gagatcagca gttgaaggaa tgcctagtaa tttggattctl20 gaagttgcct ggggaaaggcactcaaaaa gagattgaga aacagaaggt gcacctgaagl80 agt atcacag agtaggaga ggccttgaaa acagttttgg gcaagaagga gacgttggtg240 gaagataaac tcagtcttct gaatagtaac tggatagctg tcacctcccg agcagaagag300 tggttaaatc ttttgttgga atac 324

- 28 046419- 28 046419

Спектриновый повтор 13 (SEQ IDNO:51) Spectrin repeat 13 (SEQ IDNO:51) cagaaacaca tggaaacttt tgaccagaat gtggaccaca tcacaaagtg gatcattcag 60 gctgacacac ttttggatga atcagagaaa aagaaacccc agcaaaaaga agacgtgcttl20 aagcgtttaa aggcagaact gaatgacata cgcccaaagg tggactctac acgtgaccaal80 gcagcaaact tgatggcaaa ccgcggtgac cactgcagga aattagtaga gccccaaatc240 tcagagctca accatcgatt tgcagccatt tcacacagaa ttaagactgg aaaggcctcc300 attcctttga ag312 cagaaacaca tggaaacttt tgaccagaat gtggaccaca tcacaaagtg gatcattcag 60 gctgacacac ttttggatga atcagagaaa aagaaacccc agcaaaaaga agacgtgcttl20 aagcgtttaa aggcagaact gaatgacata cgcccaaagg tggactctac acgtgaccaal80 gcag caaact tgatggcaaa ccgcggtgac cactgcagga aattagtaga gccccaaatc240 tcagagctca accatcgatt tgcagccatt tcacacagaa ttaagactgg aaaggcctcc300 attcctttga ag312 Спектриновый повтор 14 (SEQ IDNO:52) Spectrin repeat 14 (SEQ IDNO:52) gaattggagc agtttaactc agatatacaa aaattgcttg aaccactgga ggctgaaatt 60 cagcaggggg tgaatctgaa agaggaagac ttcaataaag atatgaatga agacaatgagl20 ggtactgtaa aagaattgtt gcaaagagga gacaacttac aacaaagaat cacagatgagl80 agaaagagag aggaaataaa gataaaacag cagctgttac agacaaaaca taatgctctc240 aaggatttga ggtctcaaag aagaaaaaag gctagaaa tt 282 gaattggagc agtttaactc agatatacaa aaattgcttg aaccactgga ggctgaaatt 60 cagcaggggg tgaatctgaa agaggaagac ttcaataaag atatgaatga agacaatgagl20 ggtactgtaa aagaattgtt gcaaagagga gacaacttac aacaaagaat cacagatgagl80 agaaagagag aggaaataaa gataaaacag cagctgttac agacaaaaca taatgctctc240 aaggatttga ggtctcaaag aagaaaaaag gctagaaa tt 282 Спектриновый повтор 15 (SEQ IDNO:53) Spectrin repeat 15 (SEQ IDNO:53) tctcatcagt ggtatcagta caagaggcag gctgatgatc tcctgaaatg cttggatgac 60 attgaaaaaa aattagccag cctacctgag cccagagatg aaaggaaaat aaaggaaattl20 gatcgggaat tgcagaagaa gaaagaggag ctgaatgcag tgcgtaggca agctgagggcl80 ttgtctgagg atggggccgc aatggcagtg gagccaactc agatccagct cagcaagcgc240 tggcgggaaa ttgagagcaa atttgctcag tttcgaagac tcaactttgc acaa294 tctcatcagt ggtatcagta caagaggcag gctgatgatc tcctgaaatg cttggatgac 60 attgaaaaaa aattagccag cctacctgag cccagagatg aaaggaaaat aaaggaaattl20 gatcgggaat tgcagaagaa gaaagaggag ctgaatgcag tgcgtaggca agctgaggcl80 ttgtctgagg atggggccgc aatggcagtg gagccaactc agatccagct cagcaagcgc240 tggcgggaaa ttgagagcaa atttgctcag tttcgaagac tcaactttgc acaa294 L3 (20-мерный линкер) (SEQ IDNO:54) L3 (20-mer linker) (SEQ IDNO:54) attcacactg tccgtgaaga aacgatgatg gtgatgactg aagacatgcc tttggaaatt 60 attcacactg tccgtgaaga aacgatgatg gtgatgactg aagacatgcc tttggaaatt 60 Спектриновый повтор 16 (SEQ IDNO:55) Spectrin repeat 16 (SEQ IDNO:55) tcttatgtgc cttctactta tttgactgaa atcactcatg tctcacaagc cctattagaa 60 gtggaacaac ttctcaatgc tcctgacctc tgtgctaagg actttgaaga tctctttaagl20 caagaggagt ctctgaagaa tataaaagat agtctacaac aaagctcagg tcggattgacl80 attattcata gcaagaagac agcagcattg caaagtgcaa cgcctgtgga aagggtgaag240 ctacaggaag ctctctccca gcttgatttc caatgggaaa aagttaacaa aatgtacaag300 gaccgacaag ggcgatttga cagatct327 tcttatgtgc cttctactta tttgactgaa atcactcatg tctcacaagc cctattagaa 60 gtggaacaac ttctcaatgc tcctgacctc tgtgctaagg actttgaaga tctctttaagl20 caagaggagt ctctgaagaa tataaaagat agtctacaac aaagctcagg tcggattgacl80 attatt cata gcaagaagac agcagcattg caaagtgcaa cgcctgtgga aagggtgaag240 ctacaggaag ctctctccca gcttgatttc caatgggaaa aagttaacaa aatgtacaag300 gaccgacaag ggcgatttga cagatct327 Спектриновый повтор 17 (SEQ IDNO:56) Spectrin repeat 17 (SEQ IDNO:56) gttgagaaat ggcggcgttt tcattatgat ataaagatat ttaatcagtg gctaacagaa 60 gctgaacagt ttctcagaaa gacacaaatt cctgagaatt gggaacatgc taaatacaaal20 tggtatctta aggaactcca ggatggcatt gggcagcggc aaactgttgt cagaacattgl80 aatgcaactg gggaagaaat aattcagcaa tcctcaaaaa cagatgccag tattctacag240 gaaaaattgg gaagcctgaa tctgcggtgg caggaggtct gcaaacagct gtcagacaga300 aaaaagaggc tagaagaaca a321 gttgagaaat ggcggcgttt tcattatgat ataaagatat ttaatcagtg gctaacagaa 60 gctgaacagt ttctcagaaa gacacaaatt cctgagaatt gggaacatgc taaatacaaal20 tggtatctta aggaactcca ggatggcatt gggcagcggc aaactgttgt cagaacattgl80 aatgcaactg gggaagaaat aattcagcaa tcctcaaaaa cagatgccag tattctacag240 gaaaaattgg gaagcctgaa tctgcggtgg caggaggtct gcaaacagct gtcagacaga300 aaaaagaggc tagaagaaca a321 Спектриновый повтор 18 (SEQ IDNO:57) Spectrin repeat 18 (SEQ IDNO:57) aagaatatct tgtcagaatt tcaaagagat ttaaatgaat ttgttttatg gttggaggaa 60 gcagataaca ttgctagtat cccacttgaa cctggaaaag agcagcaact aaaagaaaagl20 cttgagcaag tcaagttact ggtggaagag ttgcccctgc gccagggaat tctcaaacaal80 ttaaatgaaa ctggaggacc cgtgcttgta agtgctccca taagcccaga agagcaagat240 aaacttgaaa ataagctcaa gcagacaaat ctccagtgga taaaggtttc cagagcttta300 cctgagaaac aaggagaaat tgaagctcaa ataaaagacc ttgggcagct 1351 AAGAATAATTCT TGTCAGAATT TCAAAAGAGAGAT TTGTTTATG GTTGGAGAA 60 Gcagataaca ttgctagta CCCCACTGAAAG AGCAAGCAAGAAAGAAAGEAGEAG20 AGTTACT GGTGGAAGAGAG TTGCCCCCTGC GCCAGGGAAT TCTCAACAACAAL80 TTAAATGAAA CGGCCCCCA TAAGCCAAGCAAGAT240 AAACTTGAAA ATAAGCTCAA GCAGACAAAT CTCCAGTGGA TAAAGGGTTTC CAGAGCTTA300 CCTGAGAAAC AAGGAAAT TGAAGCTCAA ATAAAAGGGGGGCAGCT 1351 Спектриновый повтор 19 (SEQ IDNO:58) Spectrin repeat 19 (SEQ IDNO:58) gaaaaaaagc ttgaagacct tgaagagcag ttaaatcatc tgctgctgtg gttatctcct 60 attaggaatc agttggaaat ttataaccaa ccaaaccaag aaggaccatt tgacgttcagl20 gaaactgaaa tagcagttca agctaaacaa ccggatgtgg aagagatttt gtctaaagggl80 cagcatttgt acaaggaaaa accagccact cagccagtga agaggaagtt agaagatctg240 agctctgagt ggaaggcggt aaaccgttta cttcaagagc tgagggcaaa gcagcctgac300 cta303 gaaaaaaagc ttgaagacct tgaagagcag ttaaatcatc tgctgctgtg gttatctcct 60 attaggaatc agttggaaat ttataaccaa ccaaaccaag aaggaccatt tgacgttcagl20 gaaactgaaa tagcagttca agctaaacaa ccggatgtgg aagagatttt gtcta aagggl80 cagcatttgt acaaggaaaa accagccact cagccagtga agaggaagtt agaagatctg240 agctctgagt ggaaggcggt aaaccgttta cttcaagagc tgaggcaaa gcagcctgac300 cta303

- 29 046419- 29 046419

Шарнир 3 (SEQ IDNO:59) Hinge 3 (SEQ IDNO:59) gctcctggac tgaccactat tggagcctct cctactcaga ctgttactct ggtgacacaa 60 cctgtggtta ctaaggaaac tgccatctcc aaactagaaa tgccatcttc cttgatgttgl20 кляп123 gctcctggac tgaccactat tggagcctct cctactcaga ctgttactct ggtgacacaa 60 cctgtggtta ctaaggaaac tgccatctcc aaactagaaa tgccatcttc cttgatgttgl20 gag123 Спектриновый повтор 20 (SEQ Ш NO :60) Spectrin repeat 20 (SEQ Ш NO :60) gtacctgctc tggcagattt caaccgggct tggacagaac ttaccgactg gctttctctg 60 cttgatcaag ttataaaatc acagagggtg atggtgggtg accttgagga tatcaacgagl20 atgatcatca agcagaaggc aacaatgcag gatttggaac agaggcgtcc ccagttggaal80 gaactcatta ccgctgccca aaatttgaaa aacaagacca gcaatcaaga ggctagaaca240 atcattacgg atcgaattga aagaattcag aatcagtggg atgaagtaca agaacacctt300 cagaaccgga ggcaacagtt gaatgaaatg 330 gtacctgctc tggcagattt caaccgggct tggacagaac ttaccgactg gctttctctg 60 cttgatcaag ttataaaatc acagaggtg atggtgggtg accttgagga tatcaacgagl20 atgatcatca agcagaaggc aacaatgcag gatttggaac agaggcgtcc ccagttggaal80 gaactcatta ccgctgccca aaatttgaaa aacaagacca gcaatcaaga ggctagaaca240 atcattacgg atcgaattga aagaattcag aatcagtggg atgaagtaca agaacacctt300 cagaaccgga ggcaacagtt gaatgaaatg 330 Спектриновый повтор 21 (SEQ IDNO:61) Spectrin repeat 21 (SEQ IDNO:61) ttaaaggatt caacacaatg gctggaagct aaggaagaag ctgagcaggt cttaggacag 60 gccagagcca agcttgagtc atggaaggag ggtccctata cagtagatgc aatccaaaagl20 aaaatcacag aaaccaagca gttggccaaa gacctccgcc agtggcagac aaatgtagatl80 gtggcaaatg acttggccct gaaacttctc cgggattatt ctgcagatga taccagaaaa240 gtccacatga taacagagaa tatcaatgcc tcttggagaa gcattcataa aagggtgagt300 gagcgagagg ctgctttgga agaaact327 ttaaaggatt caacacaatg gctggaagct aaggaagaag ctgagcaggt cttaggacag 60 gccagagcca agcttgagtc atggaaggag ggtccctata cagtagatgc aatccaaaagl20 aaaatcacag aaaccaagca gttggccaaa gacctccgcc agtggcagac aaatgtagatl80 gtgg caaatg acttggccct gaaacttctc cgggattatt ctgcagatga taccagaaaa240 gtccacatga taacagagaa tatcaatgcc tcttggagaa gcattcataa aagggtgagt300 gagcgagagg ctgctttgga agaaact327 Спектриновый повтор 22 (SEQ Ш NO :62) Spectrin repeat 22 (SEQ Ш NO:62) catagattac tgcaacagtt ccccctggac ctggaaaagt ttcttgcctg gcttacagaa 60 gctgaaacaa ctgccaatgt cctacaggat gctacccgta aggaaaggct cctagaagacl20 tccaagggag taaaagagct gatgaaacaa tggcaagacc tccaaggtga aattgaagctl80 cacacagatg tttatcacaa cctggatgaa aacagccaaa aaatcctgag atccctggaa240 ggttccgatg atgcagtcct gttacaaaga cgtttggata acatgaactt caagtggagt300 gaacttcgga aaaagtctct caacattagg tcccatttgg aagccagt 348 catagattac tgcaacagtt ccccctggac ctggaaaagt ttcttgcctg gcttacagaa 60 gctgaaacaa ctgccaatgt cctacaggat gctacccgta aggaaaggct cctagaagacl20 tccaagggag taaaagagct gatgaaacaa tggcaagacc tccaaggtga aattgaagctl80 cacacaga tg tttatcacaa cctggatgaa aacagccaaa aaatcctgag atccctggaa240 ggttccgatg atgcagtcct gttacaaaga cgtttggata acatgaactt caagtggagt300 gaacttcgga aaaagtctct caacattagg tcccatttgg aagccagt 348 Спектриновый повтор 23 (SEQ IDNO:63) Spectrin repeat 23 (SEQ IDNO:63) tctgaccagt ggaagcgtct gcacctttct ctgcaggaac ttctggtgtg gctacagctg 60 aaagatgatg aattaagccg gcaggcacct attggaggcg actttccagc agttcagaagl20 cagaacgatg tacatagggc cttcaagagg gaattgaaaa ctaaagaacc tgtaatcatgl80 agtactcttg agactgtacg aatatttctg acagagcagc ctttggaagg actagagaaa240 ctctaccagg agcccagaga gctgcctcct gaggagagag cccagaatgt cactcggctt300 ctacgaaagc aggctgagga ggtcaatact gagtgggaaa aattgaacct gcactccgct360 gactggcaga gaaaaataga tgagacc387 tctgaccagt ggaagcgtct gcacctttct ctgcaggaac ttctggtgtg gctacagctg 60 aaagatgatg aattaagccg gcaggcacct attggaggcg actttccagc agttcagaagl20 cagaacgatg tacatagggc cttcaagagg gaattgaaaa ctaaagaacc tgtaatcatgl8 0 agtactcttg agactgtacg aatatttctg acagagcagc ctttggaagg actagagaaa240 ctctaccagg agcccagaga gctgcctcct gaggagagag cccagaatgt cactcggctt300 ctacgaaagc aggctgagga ggtcaatact gagtgggaaa aattgaacct gcactccgct360 gact ggcaga gaaaaataga tgagacc387 Спектриновый повтор 24 (SEQ Ш NO: 64) Spectrin repeat 24 (SEQ Ш NO: 64) cttgaaagac tccaggaact tcaagaggcc acggatgagc tggacctcaa gctgcgccaa 60 gctgaggtga tcaagggatc ctggcagccc gtgggcgatc tcctcattga ctctctccaal20 gatcacctcg agaaagtcaa ggcacttcga ggagaaattg cgcctctgaa agagaacgtgl80 agccacgtca atgaccttgc tcgccagctt accactttgg gcattcagct ctcaccgtat240 aacctcagca ctctggaaga cctgaacacc agatggaagc ttctgcaggt ggccgtcgag300 gaccgagtca ggcagctgca tgaa 324 cttgaaagac tccaggaact tcaagaggcc acggatgagc tggacctcaa gctgcgccaa 60 gctgaggtga tcaagggatc ctggcagccc gtgggcgatc tcctcattga ctctctccaal20 gatcacctcg agaaagtcaa ggcacttcga ggagaaattg cgcctctgaa agagaacgtgl80 agccacgtca atgaccttgc tcgccagctt accactttgg gcattcagct ctcaccgtat240 aacctcagca ctctggaaga cctgaacacc agatggaagc ttctgcaggt ggccgtcgag300 gaccgagtca ggcagctgca tgaa 324 Шарнир 4 (SEQ Π)ΝΟ:6 5) Hinge 4 (SEQ Π)ΝΟ:6 5) gcccacaggg actttggtcc agcatctcag cactttcttt ccacgtctgt ccagggtccc 60 tgggagagag ccatctcgcc aaacaaagtg ccctactata tcaaccacga gactcaaacal20 acttgctggg accatcccaa aatgacagag ctctaccagt ctttagctga cctgaataatl80 gtcagattct cagcttatag gactgccatg aaactc216 gcccacaggg actttggtcc agcatctcag cactttcttt ccacgtctgt ccaggtccc 60 tgggagagag ccatctcgcc aaacaaagtg ccctactata tcaaccacga gactcaaacal20 acttgctggg accatcccaa aatgacagag ctctaccagt ctttagctga cctgaataatl80 gtcagattct cagcttatag gactgccatg aaactc216 CR (SEQ Ш NO :66) CR (SEQ Ш NO:66) cgaagactgc agaaggccct ttgcttggat ctcttgagcc tgtcagctgc atgtgatgcc 60 ttggaccagc acaacctcaa gcaaaatgac cagcccatgg atatcctgca gattattaatl20 tgtttgacca ctatttatga ccgcctggag caagagcaca acaatttggt caacgtccctl80 ctctgcgtgg atatgtgtct gaactggctg ctgaatgttt atgatacggg acgaacaggg240 agatccgtg tcctgtcttt taaaactggc atcatttccc tgtgtaaagc acatttggaa300 cgaagactgc agaaggccct ttgcttggat ctcttgagcc tgtcagctgc atgtgatgcc 60 ttggaccagc acaacctcaa gcaaaatgac cagcccatgg atatcctgca gattattaatl20 tgtttgacca ctatttatga ccgcctggag caagagcaca acaatttggt caacgtccctl80 ct ctgcgtgg atatgtgtct gaactggctg ctgaatgttt atgatacggg acgaacaggg240 agatccgtg tcctgtcttt taaaactggc atcatttccc tgtgtaaagc acatttggaa300

- 30 046419- 30 046419

gacaagtaca gatacctttt caagcaagtg gcaagttcaa caggattttg tgaccagcgc360 agctgggcc tccttctgca tgattctatc caaattccaa gacagttggg tgaagttgca420 tcctttgggg gcagtaacat tgagccaagt gtccggagct gcttccaatt tgctaataat480 aagccagaga tcgaagcggc cctcttccta gactggatga gactggaacc ccagtccatg540 gtgtggctgc ccgtcctgca cagagtggct gctgcagaaa ctgccaagca tcaggccaaa600 tgtaacatct gcaaagagtg tccaatcatt ggattcaggt acaggagtct aaagcacttt660 aattatgaca tctgccaaag ctgctttttt tctggtcgag ttgcaaaagg ccataaaatg720 cactatccca tggtggaata ttgcactccg actacatcag gagaagatgt tcgagacttt780 gccaaggtac taaaaaacaa atttcgaacc aaaaggtatt ttgcgaagca tccccgaatg840 ggctacctgc cagtgcagac tgtcttagag ggggacaaca tggaaact gacaagtaca gatacctttt caagcaagtg gcaagttcaa caggattttg tgaccagcgc360 agctgggcc tccttctgca tgattctatc caaattccaa gacagttggg tgaagttgca420 tcctttgggg gcagtaacat tgagccaagt gtccggagct gcttccaatt tgctaataat480 aag ccagaga tcgaagcggc cctcttccta gactggatga gactggaacc ccagtccatg540 gtgtggctgc ccgtcctgca cagagtggct gctgcagaaa ctgccaagca tcaggccaaa600 tgtaacatct gcaaagagtg tccaatcatt ggattcaggt acaggagtct aaagcacttt660 aattatgaca tctgccaaag ctgctttttt tctggtcgag ttgcaaaagg ccataaaatg720 cactatccca tggtggaata ttgcactccg actacatcag gagaagatgt tcgagacttt780 gccaaggtac taaaaaacaa atttcgaacc aaaaggtatt ttgcgaagca tccccgaatg840 ggctacctgc cagtgcagac tgtcttagag ggggacaaca tggaaact С-конц. (SEQ Ш NO:67) C-conc. (SEQ Ш NO:67) cccgttactc tgatcaactt ctggccagta gattctgcgc ctgcctcgtc ccctcagctt 60 tcacacgatg atactcattc acgcattgaa cattatgcta gcaggctagc agaaatggaal20 aacagcaatg gatcttatct aaatgatagc atctctccta atgagagcat agatgatgaal80 catttgttaa tccagcatta ctgccaaagt ttgaaccagg actcccccct gagccagcct240 cgtagtcctg cccagatctt gatttcctta gagagtgagg aaagagggga gctagagaga300 atcctagcag atcttgagga agaaaacagg aatctgcaag cagaatatga ccgtctaaag360 cagcagcacg aacataaagg cctgtcccca ctgccgtccc ctcctgaaat gatgcccacc420 tctccccaga gtccccggga tgctgagctc attgctgagg ccaagctact gcgtcaacac480 aaaggccgcc tggaagccag gatgcaaatc ctggaagacc acaataaaca gctggagtca540 cagttacaca ggctaaggca gctgctggag caaccccagg cagaggccaa agtgaatggc600 acaacggtgt cctctccttc tacctctcta cagaggtccg acagcagtca gcctatgctg660 ctccgagtgg ttggcagtca aacttcggac tccatgggtg aggaagatct tctcagtcct720 ccccaggaca caagcacagg gttagaggag gtgatggagc aactcaacaa ctccttccct780 agttcaagag gaagaaatac ccctggaaag ccaatgagag aggacacaat gtag cccgttactc tgatcaactt ctggccagta gattctgcgc ctgcctcgtc ccctcagctt 60 tcacacgatg atactcattc acgcattgaa cattatgcta gcaggctagc agaaatggaal20 aacagcaatg gatcttatct aaatgatagc atctctccta atgagagcat agatgatgaal80 cattt gttaa tccagcatta ctgccaaagt ttgaaccagg actcccccct gagccagcct240 cgtagtcctg cccagatctt gatttcctta gagagtgagg aaagagggga gctagagaga300 atcctagcag atcttgagga agaaaacagg aatctgcaag cagaatatga ccgtctaaag360 cagcagcacg aacata aagg cctgtcccca ctgccgtccc ctcctgaaat gatgcccacc420 tctccccaga gtccccggga tgctgagctc attgctgagg ccaagctact gcgtcaacac480 aaaggccgcc tggaagccag gatgcaaatc ctggaagacc acaataaaca gctggagtca540 cagttacaca ggctaaggca gctgctggag caaccccagg cagaggccaa agtgaatggc600 acaacggtgt cctctccttc tacctctcta cagaggtccg acagcagtca gcctatgctg660 ctccgagtgg ttgg cagtca aacttcggac tccatgggtg aggaagatct tctcagtcct720 ccccaggaca caagcacagg gttagaggag gtgatggagc aactcaacaa ctccttccct780 agttcaagag gaagaaatac ccctggaaag ccaatgagag aggacacaat gtag

Настоящее изобретение относится к полипептиду миниатюризированного дистрофина, который меньше, чем полноразмерный белок дистрофина, т.е. изоформа Dp427m, и который не идентичен встречающимся в природе изоформам белка дистрофина, или к молекуле нуклеиновой кислоты, содержащей нуклеотидную последовательность, кодирующую полипептид миниатюризированного дистрофина. Когда настоящее описание раскрывает полипептиды миниатюризированного дистрофина, настоящее описание также раскрывает молекулу нуклеиновой кислоты, содержащую нуклеотидную последовательность, кодирующую соответствующий раскрытый полипептид миниатюризированного дистрофина, и наоборот. В некоторых вариантах осуществления молекула нуклеиновой кислоты, кодирующая полипептид миниатюризированного дистрофина, является подходящей для генной терапии. Соответственно, молекула нуклеиновой кислоты, кодирующая полипептид миниатюризированного дистрофина, сконструирована не только для того, чтобы соответствовать вектору генной терапии, например, вектору AAV, или быть подходящей для рекомбинантной экспрессии, но также для снижения любого нежелательного иммунного ответа (например, гуморального иммунного ответа и/или клеточного иммунного ответа, например, CD4 и/или CD8), направленного против полипептида миниатюризированного дистрофина при введении или экспрессии in vivo. В некоторых вариантах осуществления полипептид миниатюризированного дистрофина по настоящему изобретению содержит, от N-конца к С-концу, шарнирный 1 (H1) домен, домен спектринового повтора 1 (R1), домен спектринового повтора 3 (R3), шарнирный 2 (Н2) домен, домен спектринового повтора 16 (R16), домен спектринового повтора 17 (R17), домен спектринового повтора 24 (R24) и шарнирный 4 (Н4) домен дистрофина. В некоторых вариантах осуществления полипептид миниатюризированного дистрофина не содержит домена спектринового повтора 2 (R2) дистрофина. В других вариантах осуществления полипептид миниатюризированного дистрофина не содержит домен спектринового повтора 2 (R2) и (1) домен спектринового повтора 4 (R4), (2) домен спектринового повтора 5 (R5), (3) домен спектринового повтора 6 (R6), (4) домен спектринового повтора 7 (R7), (5) домен спектринового повтора 8 (R8), (6) домен спектринового повтора 9 (R9), (7) домен спектринового повтора 10 (R10), (8) домен спектринового повтора 11 (R11), (9) домен спектринового повтора 12 (R12), (10) домен спектринового повтора 13 (R13), (11) домен спектринового повтора 14 (R14), (12) домен спектринового повтора 15 (R15), (13) домен спектринового повтора 18 (R18), (14) домен спектринового повтора 19 (R19), (15) домен спектринового повтора 20 (R20), (16) домен спектринового повтора 21 (R21), (17) домен спектринового повтора 22 (R22) или (18) домен спектринового повтора 23 (R23), или (19) любую их комбинацию. В некоторых вариантах осуществления полипептид миниатюризированного дистрофина не содержит домен спектринового повтора 2 (R2), домен спектринового повтора 4 (R4), домен спектринового повтора 5 (R5), домен спектринового повтора 6 (R6), домен спектринового повтора 7 (R7), домен спектринового повтора 8 (R8), домен спектринового повтора 9 (R9), домен спектринового повтора 10 (R10), домен спектринового повтора 11 (R11), домен спектринового повтора 12 (R12), домен спектринового повтора 13 (R13), домен спектринового повтора 14 (R14), домен спектринового повтора 15 (R15), домен спектринового повтора 18 (R18), домен спектринового повтора 19 (R19), домен спектринового повтора 20 (R20), домен спектринового повтора 21 (R21), домен спектринового повтора 22 (R22) и домен спектринового повтора 23 (R23).The present invention relates to a miniaturized dystrophin polypeptide that is smaller than the full-length dystrophin protein, i.e. isoform Dp427m, and which is not identical to naturally occurring dystrophin protein isoforms, or to a nucleic acid molecule containing a nucleotide sequence encoding a miniaturized dystrophin polypeptide. Where the present disclosure discloses miniaturized dystrophin polypeptides, the present disclosure also discloses a nucleic acid molecule comprising a nucleotide sequence encoding the corresponding disclosed miniaturized dystrophin polypeptide, and vice versa. In some embodiments, a nucleic acid molecule encoding a miniaturized dystrophin polypeptide is suitable for gene therapy. Accordingly, a nucleic acid molecule encoding a miniaturized dystrophin polypeptide is designed not only to conform to a gene therapy vector, e.g., an AAV vector, or to be suitable for recombinant expression, but also to reduce any unwanted immune response (e.g., humoral immune response and /or cellular immune response, for example, CD4 and/or CD8) directed against the miniaturized dystrophin polypeptide when administered or expressed in vivo. In some embodiments, the miniaturized dystrophin polypeptide of the present invention comprises, from N-terminus to C-terminus, a hinge 1 (H1) domain, a spectrin repeat 1 (R1) domain, a spectrin repeat 3 (R3) domain, a hinge 2 (H2) domain , spectrin repeat domain 16 (R16), spectrin repeat domain 17 (R17), spectrin repeat domain 24 (R24), and dystrophin hinge 4 (H4) domain. In some embodiments, the miniaturized dystrophin polypeptide does not contain a dystrophin spectrin repeat 2 (R2) domain. In other embodiments, the miniaturized dystrophin polypeptide does not contain a spectrin repeat domain 2 (R2) and (1) a spectrin repeat domain 4 (R4), (2) a spectrin repeat domain 5 (R5), (3) a spectrin repeat domain 6 (R6), (4) spectrin repeat domain 7 (R7), (5) spectrin repeat domain 8 (R8), (6) spectrin repeat domain 9 (R9), (7) spectrin repeat domain 10 (R10), (8) spectrin repeat domain 11 (R11), (9) spectrin repeat domain 12 (R12), (10) spectrin repeat domain 13 (R13), (11) spectrin repeat domain 14 (R14), (12) spectrin repeat domain 15 (R15), ( 13) spectrin repeat domain 18 (R18), (14) spectrin repeat domain 19 (R19), (15) spectrin repeat domain 20 (R20), (16) spectrin repeat domain 21 (R21), (17) spectrin repeat domain 22 (R22) or (18) spectrin repeat domain 23 (R23), or (19) any combination thereof. In some embodiments, the miniaturized dystrophin polypeptide does not comprise a spectrin repeat 2 (R2) domain, a spectrin repeat 4 (R4) domain, a spectrin repeat 5 (R5) domain, a spectrin repeat 6 (R6) domain, a spectrin repeat 7 (R7) domain spectrin repeat 8 (R8), spectrin repeat domain 9 (R9), spectrin repeat domain 10 (R10), spectrin repeat domain 11 (R11), spectrin repeat domain 12 (R12), spectrin repeat domain 13 (R13), spectrin repeat domain 14 (R14), spectrin repeat domain 15 (R15), spectrin repeat domain 18 (R18), spectrin repeat domain 19 (R19), spectrin repeat domain 20 (R20), spectrin repeat domain 21 (R21), spectrin repeat domain 22 ( R22) and spectrin repeat domain 23 (R23).

В некоторых вариантах осуществления полипептид миниатюризированного дистрофина согласно настоящему изобретению содержит, от N-конца до С-конца, шарнирный 1 (H1) домен, домен спектриноIn some embodiments, the miniaturized dystrophin polypeptide of the present invention comprises, from N-terminus to C-terminus, a hinge 1 (H1) domain, a spectrin domain

- 31 046419 вого повтора 1 (R1), домен спектринового повтора 3 (R3), шарнирный 2 (Н2), домен спектринового повтора 16 (R16), домен спектринового повтора 17 (R17), домен спектринового повтора 24 (R24) и шарнирный 4 (Н4) домен дистрофина, где домен R1 непосредственно слит с доменом R3 посредством пептидной связи, например, см. полипептид миниатюризированного дистрофина ВХА-027741. В некоторых вариантах осуществления полипептид миниатюризированного дистрофина по настоящему изобретению содержит, от N-конца до С-конца, шарнирный 1 (H1) домен, домен спектринового повтора 1 (R1), домен спектринового повтора 3 (R3), шарнирный 2 (Н2), домен спектринового повтора 16 (R16), домен спектринового повтора 17 (R17), домен спектринового повтора 24 (R24) и шарнирный 4 (Н4) домен дистрофина, где домен R1 и домен R3 слиты посредством аминокислот ARG-VAL (RV).- 31 046419 repeat 1 (R1), spectrin repeat domain 3 (R3), hinge 2 (H2), spectrin repeat domain 16 (R16), spectrin repeat domain 17 (R17), spectrin repeat domain 24 (R24) and hinge 4 (H4) dystrophin domain, where the R1 domain is directly fused to the R3 domain via a peptide bond, for example, see miniaturized dystrophin polypeptide BXA-027741. In some embodiments, the miniaturized dystrophin polypeptide of the present invention comprises, from N-terminus to C-terminus, hinge 1 (H1) domain, spectrin repeat 1 (R1) domain, spectrin repeat 3 (R3) domain, hinge 2 (H2), spectrin repeat domain 16 (R16), spectrin repeat domain 17 (R17), spectrin repeat domain 24 (R24), and dystrophin hinge 4 (H4) domain, where the R1 domain and the R3 domain are fused through the amino acids ARG-VAL (RV).

В некоторых вариантах осуществления полипептид миниатюризированного дистрофина по настоящему изобретению содержит, от N-конца до С-конца, шарнирный 1 (H1) домен, домен спектринового повтора 1 (R1), домен спектринового повтора 3 (R3), шарнирный 2 (Н2), домен спектринового повтора 16 (R16), домен спектринового повтора 17 (R17), домен спектринового повтора 24 (R24) и шарнирный 4 (Н4) домен дистрофина, где домен Н2 и домен R16 слиты посредством линкера. Линкер может быть любым линкером, известным в данной области техники. В других вариантах осуществления линкер может быть выбран из любого линкера, раскрытого в данном документе. В других вариантах осуществления линкер может быть линкером из раздела 5.3.2. В некоторых вариантах осуществления линкер может содержать аминокислотную последовательность, которая по меньшей мере на около 80%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности, приведенной в SEQ ID NO: 75 (IHTVREE TMMVMTEDMP LEI). В некоторых вариантах осуществления полипептид миниатюризированного дистрофина по настоящему изобретению содержит, от N-конца до С-конца, шарнирный 1 (H1) домен, домен спектринового повтора 1 (R1), домен спектринового повтора 3 (R3), шарнирный 2 (Н2), домен спектринового повтора 16 (R16), домен спектринового повтора 17 (R17), домен спектринового повтора 24 (R24) и шарнирный 4 (Н4) домен дистрофина, где домен Н2 и домен R16 слиты посредством линкера. В некоторых вариантах осуществления линкер может содержать аминокислотную последовательность, которая по меньшей мере на около 80%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательностям, приведенным в SEQ ID NO: 74-75, в комбинации (SEAQ IHTVREE TMMVMTEDMP LEI).In some embodiments, the miniaturized dystrophin polypeptide of the present invention comprises, from N-terminus to C-terminus, hinge 1 (H1) domain, spectrin repeat 1 (R1) domain, spectrin repeat 3 (R3) domain, hinge 2 (H2), spectrin repeat domain 16 (R16), spectrin repeat domain 17 (R17), spectrin repeat domain 24 (R24), and dystrophin hinge 4 (H4) domain, where the H2 domain and the R16 domain are fused by a linker. The linker can be any linker known in the art. In other embodiments, the linker may be selected from any of the linkers disclosed herein. In other embodiments, the linker may be the linker from section 5.3.2. In some embodiments, the linker may comprise an amino acid sequence that is at least about 80%, at least about 90%, at least about 95%, at least about 96%, at least about 97% , is at least about 98%, at least about 99%, or about 100% identical to the sequence shown in SEQ ID NO: 75 (IHTVREE TMMVMTEDMP LEI). In some embodiments, the miniaturized dystrophin polypeptide of the present invention comprises, from N-terminus to C-terminus, hinge 1 (H1) domain, spectrin repeat 1 (R1) domain, spectrin repeat 3 (R3) domain, hinge 2 (H2), spectrin repeat domain 16 (R16), spectrin repeat domain 17 (R17), spectrin repeat domain 24 (R24), and dystrophin hinge 4 (H4) domain, where the H2 domain and the R16 domain are fused by a linker. In some embodiments, the linker may comprise an amino acid sequence that is at least about 80%, at least about 90%, at least about 95%, at least about 96%, at least about 97% , is at least about 98%, at least about 99%, or about 100% identical to the sequences shown in SEQ ID NO: 74-75, in combination (SEAQ IHTVREE TMMVMTEDMP LEI).

В некоторых вариантах осуществления полипептид миниатюризированного дистрофина по настоящему изобретению содержит, от N-конца до С-конца, шарнирный 1 (H1) домен, домен спектринового повтора 1 (R1), домен спектринового повтора 3 (R3), шарнирный 2 (Н2), домен спектринового повтора 16 (R16), домен спектринового повтора 17 (R17), домен спектринового повтора 24 (R24) и шарнирный 4 (Н4) домен дистрофина, где домен Н2 и домен R16 слиты посредством линкера. В некоторых вариантах осуществления линкер может содержать аминокислотную последовательность, которая по меньшей мере на около 80%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 74 (SEAQ).In some embodiments, the miniaturized dystrophin polypeptide of the present invention comprises, from N-terminus to C-terminus, hinge 1 (H1) domain, spectrin repeat 1 (R1) domain, spectrin repeat 3 (R3) domain, hinge 2 (H2), spectrin repeat domain 16 (R16), spectrin repeat domain 17 (R17), spectrin repeat domain 24 (R24), and dystrophin hinge 4 (H4) domain, where the H2 domain and the R16 domain are fused by a linker. In some embodiments, the linker may comprise an amino acid sequence that is at least about 80%, at least about 90%, at least about 95%, at least about 96%, at least about 97% , is at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 74 (SEAQ).

В других вариантах осуществление полипептид миниатюризированного дистрофина по настоящему изобретению содержит, от N-конца до С-конца, шарнирный 1 (H1) домен, домен спектринового повтора 1 (R1), домен спектринового повтора 3 (R3), шарнирный 2 (Н2), домен спектринового повтора 16 (R16), домен спектринового повтора 17 (R17), домен спектринового повтора 24 (R24) и шарнирный 4 (Н4) домен дистрофина, где домен R1 и домен R3 слиты посредством аминокислот ARG-VAL и где домен Н2 и домен R16 слиты посредством линкера, например, SEQ ID NO: 74-75 в комбинации. В некоторых вариантах осуществления полипептид миниатюризированного дистрофина по настоящему изобретению содержит, от N-конца до С-конца, шарнирный 1 (H1) домен, домен спектринового повтора 1 (R1), домен спектринового повтора 3 (R3), шарнирный 2 (Н2), домен спектринового повтора 16 (R16), домен спектринового повтора 17 (R17), домен спектринового повтора 24 (R24) и шарнирный 4 (Н4) домен дистрофина, где домен R1 и домен R3 слиты посредством аминокислот ARG-VAL, где домен Н2 и домен R16 слиты посредством линкера, например, SEQ ID NO: 74-75 в комбинации, и где (i) домен H1 и домен R1 слиты непосредственно, (ii) домен R3 и домен Н2 слиты непосредственно, (iii) домены R16 и R17 слиты непосредственно, (iv) домены R17 и R24 слиты непосредственно или (v) домены R24 и Н4 слиты непосредственно, или (vi) любую их комбинацию. В некоторых вариантах осуществления полипептид миниатюризированного дистрофина, применимый для настоящего изобретения содержит, от N-конца до Сконца, шарнирный 1 (H1) домен, домен спектринового повтора 1 (R1), домен спектринового повтора 3 (R3), шарнирный 2 (Н2), домен спектринового повтора 16 (R16), домен спектринового повтора 17 (R17), домен спектринового повтора 24 (R24) и шарнирный 4 (Н4) домен дистрофина, где домен R1 и домен R3 слиты посредством аминокислот ARG-VAL, где домен Н2 и домен R16 слиты посредством линкера, например, SEQ ID NO: 74-75 в комбинации, и где (i) домен H1 и домен R1 слиты непосредственно, (ii) домен R3 и домен Н2 слиты непосредственно, (iii) домены R16 и R17 слиты непосредственно, (iv) доменыIn other embodiments, the miniaturized dystrophin polypeptide of the present invention comprises, from N-terminus to C-terminus, hinge 1 (H1) domain, spectrin repeat 1 (R1) domain, spectrin repeat 3 (R3) domain, hinge 2 (H2), spectrin repeat domain 16 (R16), spectrin repeat domain 17 (R17), spectrin repeat domain 24 (R24), and hinge 4 (H4) domain of dystrophin, where the R1 domain and the R3 domain are fused through the ARG-VAL amino acids and where the H2 domain and the domain R16 are fused through a linker, for example, SEQ ID NO: 74-75 in combination. In some embodiments, the miniaturized dystrophin polypeptide of the present invention comprises, from N-terminus to C-terminus, hinge 1 (H1) domain, spectrin repeat 1 (R1) domain, spectrin repeat 3 (R3) domain, hinge 2 (H2), spectrin repeat domain 16 (R16), spectrin repeat domain 17 (R17), spectrin repeat domain 24 (R24) and hinge 4 (H4) domain of dystrophin, where the R1 domain and the R3 domain are fused through the amino acids ARG-VAL, where the H2 domain and the R16 are fused through a linker, for example, SEQ ID NO: 74-75 in combination, and wherein (i) the H1 domain and the R1 domain are directly fused, (ii) the R3 domain and the H2 domain are directly fused, (iii) the R16 and R17 domains are directly fused , (iv) the R17 and R24 domains are directly fused, or (v) the R24 and H4 domains are directly fused, or (vi) any combination thereof. In some embodiments, a miniaturized dystrophin polypeptide useful for the present invention comprises, from N-terminus to C-terminus, hinge 1 (H1) domain, spectrin repeat 1 (R1) domain, spectrin repeat 3 (R3) domain, hinge 2 (H2), spectrin repeat domain 16 (R16), spectrin repeat domain 17 (R17), spectrin repeat domain 24 (R24) and hinge 4 (H4) domain of dystrophin, where the R1 domain and the R3 domain are fused through the amino acids ARG-VAL, where the H2 domain and the R16 are fused through a linker, for example, SEQ ID NO: 74-75 in combination, and wherein (i) the H1 domain and the R1 domain are directly fused, (ii) the R3 domain and the H2 domain are directly fused, (iii) the R16 and R17 domains are directly fused , (iv) domains

- 32 046419- 32 046419

R17 и R24 слиты непосредственно, и (v) домены R24 и Н4 слиты непосредственно. В некоторых вариантах осуществления полипептид миниатюризированного дистрофина, применимый для настоящего изобретения, дополнительно содержит домен ABD1 (необязательно на N-конце) и/или домен CR (необязательно на N-конце). В некоторых вариантах осуществления полипептид миниатюризированного дистрофина состоит по существу из или состоит из, от N-конца до С-конца, домена ABD1, домена H1, домена R1, аминокислот RV, домена R3, домена Н2, аминокислотной последовательности, как указано в SEQ ID NO: 74-75 в комбинации, домена R16, домена R17, домена R24, домена Н4, домена CR дистрофина. Каждый домен в полипептидах миниатюризированного дистрофина может иметь одно или несколько изменений по сравнению с соответствующим доменом дикого типа.R17 and R24 are directly fused, and (v) the R24 and H4 domains are directly fused. In some embodiments, a miniaturized dystrophin polypeptide useful for the present invention further comprises an ABD1 domain (optionally at the N-terminus) and/or a CR domain (optionally at the N-terminus). In some embodiments, the miniaturized dystrophin polypeptide consists essentially of or consists of, from N-terminus to C-terminus, an ABD1 domain, an H1 domain, an R1 domain, RV amino acids, an R3 domain, an H2 domain, an amino acid sequence as set forth in SEQ ID NO: 74-75 in combination, R16 domain, R17 domain, R24 domain, H4 domain, CR domain of dystrophin. Each domain in miniaturized dystrophin polypeptides may have one or more changes compared to the corresponding wild-type domain.

Например, миниатюризированный дистрофин ВХА-196477 состоит из следующих белковых доменов по порядку.For example, miniaturized dystrophin BXA-196477 consists of the following protein domains in order.

Таблица 5Table 5

Аминокислотная последовательность и доменная структура полипептида миниатюризированного дистрофина ВХА-196477Amino acid sequence and domain structure of the miniaturized dystrophin polypeptide BXA-196477

SEQ ID NO: SEQ ID NO: Описание Description Последовательность Subsequence 68 68 ABDI ABDI MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIEN LFSDLQDGRRLLDLLEGLTGQKLPKEKGSTRVHALNNVNK ALRVLQNNNVDLVNIGSTDIVDGNHKLTLGLIWNIILHWQV KNVMKNIMAGLQQTNSEKILLSWVRQSTRNYPQVNVINFT TSWSDGLALNALIHSHRPDLFDWNSVVCQQSATQRLEHAF NIARYQLGIEKLLDPEDVDTTYPDKKSILMYITSLFQVLPQQ VSIEAIQEVE MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIEN LFSDLQDGRRLLDLLEGLTGQKLPKEKGSTRVHALNNVNK ALRVLQNNNVDLVNIGSTDIVDGNHKLTLGLIWNIILHWQV KNVMKNIMAGLQQTNSEKILLSWVRQSTRNYPQVNVINFT TSWSDGLALNALIHSHRPDLFDWNSV VCQQSATQRLEHAF NIARYQLGIEKLLDPEDVDTTYPDKKSILMYITSLFQVLPQQ VSIEAIQEVE 69 69 Шарнир 1 Hinge 1 MLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERTSSP KPRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSFGSSL MES MLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERTSSP KPRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSFGSSL MES 70 70 Спектрин-1 Spectrin-1 EVNLDRYQTALEEVLSWLLSAEDTLQAQGEISNDVEVVKD QFHTHEGYMMDLTAHQGRVGNILQLGSKLIGTGKLSEDEE TEVQEQMNLLNSRWECLRVASMEKQSNLH EVNLDRYQTALEEVLSWLLSAEDTLQAQGEISNDVEVVKD QFHTHEGYMMDLTAHQGRVGNILQLGSKLIGTGKLSEDEE TEVQEQMNLLNSRWECLRVASMEKQSNLH 71 71 LI (RVлинкер) LI (RV linker) RV RV 72 72 Спектрин-3 Spectrin-3 LLKWQRLTEEQCLFSAWLSEKEDAVNKIHTTGFKDQNEML SSLQKLAVLKADLEKKKQSMGKLYSLKQDLLSTLKNKSVT QKTEAWLDNFARCWDNLVQKLEKSTAQISQA LLKWQRLTEEQCLFSAWLSEKEDAVNKIHTTGFKDQNEML SSLQKLAVLKADLEKKKQSMGKLYSLKQDLLSTLKNKSVT QKTEAWLDNFARCWDNLVQKLEKSTAQISQA 73 73 Шарнир 2 Hinge 2 VTTTQPSLTQTTVMETVTTVTTREQILVKHAQEELPPPPPQK KRQITVD VTTTQPSLTQTTVMETVTTVTTREQILVKHAQEELPPPPPQK KRQITVD 74 74 L2 (линкер SEAQ) L2 (SEAQ linker) SEAQ SEAQ 75 75 L3 (20мерный линкер) L3 (20-dimensional linker) IHTVREETMMVMTEDMPLEI IHTVREETMMVMTEDMPLEI 76 76 Спектрин-16 Spectrin-16 SYVPSTYLTEITHVSQALLEVEQLLNAPDLCAKDFEDLFKQ EESLKNIKDSLQQSSGRIDIIHSKKTAALQSATPVERVKLQE ALSQLDFQWEKVNKMYKDRQGRFDRS SYVPSTYLTEITHVSQALLEVEQLLNAPDLCAKDFEDLFKQ EESLKNIKDSLQQSSGRIDIIHSKKTAALQSATPVERVKLQE ALSQLDFQWEKVNKMYKDRQGRFDRS 77 77 Спектрин-17 Spectrin-17 VEI<WRRFHYDII<IFNQWLTEAEQFLRI<TQIPENWEHAI<YI< WYLKELQDGIGQRQTVVRTLNATGEEIIQQSSKTDASILQE KLGSLNLRWQEVCKQLSDRKKRLEEQ VEI<WRRFHYDII<IFNQWLTEAEQFLRI<TQIPENWEHAI<YI< WYLKELQDGIGQRQTVVRTLNATGEEIIQQSSKTDASILQE KLGSLNLRWQEVCKQLSDRKKRLEEQ 78 78 Спектрин-24 Spectrin-24 LERLQELQEATDELDLKLRQAEVIKGSWQPVGDLLIDSLQD HLEKVKALRGEIAPLKENVSHVNDLARQLTTLGIQLSPYNL STLEDLNTRWKLLQVAVEDRVRQLHE LERLQELQEATDELDLKLRQAEVIKGSWQPVGDLLIDSLQD HLEKVKALRGEIAPLKENVSHVNDLARQLTTLGIQLSPYNL STLEDLNTRWKLLQVAVEDRVRQLHE 79 79 Шарнир 4 Hinge 4 AHRDFGPASQHFLSTSVQGPWERAISPNKVPYYINHETQTT CWDHPKMTELYQSLADLNNVRFSAYRTAMKL AHRDFGPASQHFLSTSVQGPWERAISPNKVPYYINHETQTT CWDHPKMTELYQSLADLNNVRFSAYRTAMKL 80 80 CR CR RRLQKALCLDLLSLSAACDALDQHNLKQNDQPMDILQIINC LTTIYDRLEQEHNNLVNVPLCVDMCLNWLLNVYDTGRTG RIRVLSFKTGIISLCKAHLEDKYRYLFKQVASSTGFCDQRRL GLLLHDSIQIPRQLGEVASFGGSNIEPSVRSCFQFANNKPEIE AALFLDWMRLEPQSMVWLPVLHRVAAAETAKHQAKCNIC KECPIIGFRYRSLKHFNYDICQSCFFSGRVAKGHKMHYPMV EYCTPTTSGEDVRDFAKVLKNKFRTKRYFAKHPRMGYLPV QTVLEGDNMETDTM RRLQKALCLDLLSLSAACDALDQHNLKQNDQPMDILQIINC LTTIYDRLEQEHNNLVNVPLCVDMCLNWLLNVYDTGRTG RIRVLSFKTGIISLCKAHLEDKYRYLFKQVASSTGFCDQRRL GLLLHDSIQIPRQLGEVASFGGSNIEPSVRSCFQFANNKPEIE AALFLDWMRLEPQSMVWLPVLHRVAAAETAKHQ AKCNIC KECPIIGFRYRSLKHFNYDICQSCFFSGRVAKGHKMHYPMV EYCTPTTSGEDVRDFAKVLKNKFRTKRYFAKHPRMGYLPV QTVLEGDNMETDTM

В некоторых вариантах осуществления домен H1 в полипептиде миниатюризированного дистрофина представляет собой аминокислотную последовательность, которая по меньшей мере на около 70%, по меньшей мере на около 75%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшейIn some embodiments, the H1 domain of a miniaturized dystrophin polypeptide is an amino acid sequence that is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least at least about 90%, at least about 95%, at least about 96%, at least

- 33 046419 мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 69. В некоторых вариантах осуществления домен R1 представляет собой аминокислотную последовательность, которая по меньшей мере на около 70%, по меньшей мере на около 75%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 70. В некоторых вариантах осуществления домен R3 представляет собой аминокислотную последовательность, которая по меньшей мере на около 70%, по меньшей мере на около 75%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 72. В некоторых вариантах осуществления домен Н2 представляет собой аминокислотную последовательность, которая по меньшей мере на около 70%, по меньшей мере на около 75%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 73. В некоторых вариантах осуществления домен R16 представляет собой аминокислотную последовательность, которая по меньшей мере на около 70%, по меньшей мере на около 75%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 76. В некоторых вариантах осуществления домен R17 представляет собой аминокислотную последовательность, которая по меньшей мере на около 70%, по меньшей мере на около 75%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 77. В некоторых вариантах осуществления домен R24 представляет собой аминокислотную последовательность, которая по меньшей мере на около 70%, по меньшей мере на около 75%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 78. В некоторых вариантах осуществления домен Н4 представляет собой аминокислотную последовательность, которая по меньшей мере на около 70%, по меньшей мере на около 75%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 79. В некоторых вариантах осуществления полипептид миниатюризированного дистрофина дополнительно содержит на N-конце полипептидную последовательность, которая по меньшей мере на около 70%, по меньшей мере на около 75%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или около 100% идентична последовательности SEQ ID NO: 68. В некоторых вариантах осуществления полипептид миниатюризированного дистрофина дополнительно содержит на С-конце полипептидную последовательность, которая по меньшей мере на около 70%, по меньшей мере на около 75%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или около 100% идентична последовательности SEQ ID NO: 80.- 33046419 is at least about 97%, at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 69. In some embodiments, the R1 domain is an amino acid sequence that at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least is about 96%, at least about 97%, at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 70. In some embodiments, the R3 domain is an amino acid a sequence that is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95% , is at least about 96%, at least about 97%, at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 72. In some embodiments, the domain H2 is an amino acid sequence that is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least is at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 73. B In some embodiments, the R16 domain is an amino acid sequence that is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90% , at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO : 76. In some embodiments, the R17 domain is an amino acid sequence that is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99% or about 100% identical sequence SEQ ID NO: 77. In some embodiments, the R24 domain is an amino acid sequence that is at least about 70%, at least about 75%, at least about 80%, at least about 85% , at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99% or is about 100% identical to the sequence of SEQ ID NO: 78. In some embodiments, the H4 domain is an amino acid sequence that is at least about 70%, at least about 75%, at least about 80%, at least by about 85%, by at least about 90%, by at least about 95%, by at least about 96%, by at least about 97%, by at least about 98%, by at least about 99% or about 100% identical to the sequence of SEQ ID NO: 79. In some embodiments, the miniaturized dystrophin polypeptide further comprises at the N-terminus a polypeptide sequence that is at least about 70%, at least about 75%, at least at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 68. In some embodiments, the miniaturized dystrophin polypeptide further comprises, at its C-terminus, a polypeptide sequence that is at least about 70% identical to at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about about 97%, at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 80.

- 34 046419- 34 046419

Таблица 5ВTable 5B

Аминокислотная последовательность и доменная структура полипептида миниатюризированного дистрофина ВХА-027743Amino acid sequence and domain structure of the miniaturized dystrophin polypeptide BXA-027743

SEQ Ш NO: SEQ Ш NO: Описание Description Последовательность Subsequence 81 81 ABDI ABDI MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIEN LFSDLQDGRRLLDLLEGLTGQKLPKEKGSTRVHALNNVNK ALRVLQNNNVDLVNIGSTDIVDGNHKLTLGLIWNIILHWQ VKNVMKNIMAGLQQTNSEKILLSWVRQSTRNYPQVNVINF TTSWSDGLALNALIHSHRPDLFDWNSVVCQQSATQRLEHA FNIARYQLGIEKLLDPEDVDTTYPDKKSILMYITSLFQVLPQ QVSIEAIQEVE MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIEN LFSDLQDGRRLLDLLEGLTGQKLPKEKGSTRVHALNNVNK ALRVLQNNNVDLVNIGSTDIVDGNHKLTLGLIWNIILHWQ VKNVMKNIMAGLQQTNSEKILLSWVRQSTRNYPQVNVINF TTSWSDGLALNALIHSHRPDLFDWNS VVCQQSATQRLEHA FNIARYQLGIEKLLDPEDVDTTYPDKKSILMYITSLFQVLPQ QVSIEAIQEVE 82 82 Шарнир 1 Hinge 1 MLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERTSSP KPRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSFGSSL MES MLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERTSSP KPRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSFGSSL MES 83 83 Спектрин-1 Spectrin-1 EVNLDRYQTALEEVLSWLLSAEDTLQAQGEISNDVEVVKD QFHTHEGYMMDLTAHQGRVGNILQLGSKLIGTGKLSEDEE TEVQEQMNLLNSRWECLRVASMEKQSNLH EVNLDRYQTALEEVLSWLLSAEDTLQAQGEISNDVEVVKD QFHTHEGYMMDLTAHQGRVGNILQLGSKLIGTGKLSEDEE TEVQEQMNLLNSRWECLRVASMEKQSNLH 84 84 L1 L1 IHTVREETMMVMTEDMPLEI IHTVREETMMVMTEDMPLEI 85 85 Спектрин16 Spectrin16 SYVPSTYLTEITHVSQALLEVEQLLNAPDLCAKDFEDLFKQ EESLKNIKDSLQQSSGRIDIIHSKKTAALQSATPVERVKLQE ALSQLDFQWEKVNKMYKDRQGRFDRS SYVPSTYLTEITHVSQALLEVEQLLNAPDLCAKDFEDLFKQ EESLKNIKDSLQQSSGRIDIIHSKKTAALQSATPVERVKLQE ALSQLDFQWEKVNKMYKDRQGRFDRS 86 86 Спектрин17 Spectrin17 VEKWRRFHYDIKIFNQWLTEAEQFLRKTQIPENWEHAKYK WYLKELQDGIGQRQTVVRTLNATGEEIIQQSSKTDASILQE KLGSLNLRWQEVCKQLSDRKKRLEEQ VEKWRRFHYDIKIFNQWLTEAEQFLRKTQIPENWEHAKYK WYLKELQDGIGQRQTVVRTLNATGEEIIQQSSKTDASILQE KLGSLNLRWQEVCKQLSDRKKRLEEQ 87 87 Шарнир 3 Hinge 3 APGLTTIGASPTQTVTLVTQPVVTKETAISKLEMPSSLMLE APGLTTIGASPTQTVTLVTQPVVTKETAISKLEMPSSLMLE 88 88 Спектрин23 Spectrin23 SDQWKRLHLSLQELLVWLQLKDDELSRQAPIGGDFPAVQK QNDVHRAFKRELKTKEPVIMSTLETVRIFLTEQPLEGLEKL YQEPRELPPEERAQNVTRLLRKQAEEVNTEWEKLNLHSAD WQRKIDET SDQWKRLHLSLQELLVWLQLKDDELSRQAPIGGDFPAVQK QNDVHRAFKRELKTKEPVIMSTLETVRIFLTEQPLEGLEKL YQEPRELPPEERAQNVTRLLRKQAEEVNTEWEKLNLHSAD WQRKIDET 89 89 Спектрин24 Spectrin24 LERLQELQEATDELDLKLRQAEVIKGSWQPVGDLLIDSLQD HLEKVKALRGEIAPLKENVSHVNDLARQLTTLGIQLSPYNL STLEDLNTRWKLLQVAVEDRVRQLHE LERLQELQEATDELDLKLRQAEVIKGSWQPVGDLLIDSLQD HLEKVKALRGEIAPLKENVSHVNDLARQLTTLGIQLSPYNL STLEDLNTRWKLLQVAVEDRVRQLHE 90 90 Шарнир 4 Hinge 4 AHRDFGPASQHFLSTSVQGPWERAISPNKVPYYINHETQTT CWDHPKMTELYQSLADLNNVRFSAYRTAMKL AHRDFGPASQHFLSTSVQGPWERAISPNKVPYYINHETQTT CWDHPKMTELYQSLADLNNVRFSAYRTAMKL 91 91 CR/C-конц CR/C-conc RRLQKALCLDLLSLSAACDALDQHNLKQNDQPMDILQIINC LTTIYDRLEQEHNNLVNVPLCVDMCLNWLLNVYDTGRTG RIRVLSFKTGIISLCKAHLEDKYRYLFKQVASSTGFCDQRRL GLLLHDSIQIPRQLGEVASFGGSNIEPSVRSCFQFANNKPEIE AALFLDWMRLEPQSMVWLPVLHRVAAAETAKHQAKCNIC KECPIIGFRYRSLKHFNYDICQSCFFSGRVAKGHKMHYPMV EYCTPTTSGEDVRDFAKVLKNKFRTKRYFAKHPRMGYLPV QTVLEGDNMETPAQILISLESEERGELERILADLEEENRNLQ AEYDRLKQQHEHKGLSPLPSPPDTM RRLQKALCLDLLSLSAACDALDQHNLKQNDQPMDILQIINC LTTIYDRLEQEHNNLVNVPLCVDMCLNWLLNVYDTGRTG RIRVLSFKTGIISLCKAHLEDKYRYLFKQVASSTGFCDQRRL GLLLHDSIQIPRQLGEVASFGGSNIEPSVRSCFQFANNKPEIE AALFLDWMRLEPQSMVWLPVLHRVAAAETAKHQ AKCNIC KECPIIGFRYRSLKHFNYDICQSCFFSGRVAKGHKMHYPMV EYCTPTTSGEDVRDFAKVLKNKFRTKRYFAKHPRMGYLPV QTVLEGDNMETPAQILISLESEERGELERILADLEEENRNLQ AEYDRLKQQHEHKGLSPLPSPPDTM

В некоторых вариантах осуществления настоящее изобретение обеспечивает полипептид миниатюризированного дистрофина, содержащий домен спектринового повтора 1 (R1) и домен спектринового повтора 16 (R16), где домен R1 и домен R16 слиты посредством линкера, содержащего аминокислотную последовательность, приведенную в SEQ ID NO: 84 (IHTVREETMMVMTEDMPLEI). В некоторых вариантах осуществления настоящее изобретение обеспечивает полипептид миниатюризированного дистрофина, содержащий, от N-конца к С-концу, шарнирный 1 (H1) домен, домен спектринового повтора 1 (R1), домен спектринового повтора 16 (R16), домен спектринового повтора 17 (R17), шарнирный 3 (H3) домен, домен спектринового повтора 23 (R23), домен спектринового повтора 24 (R24) и шарнирный 4 (Н4) домен дистрофина, где домен R1 и домен R16 слиты посредством аминокислотной последовательности, приведенной в SEQ ID NO: 84 (IHTVREETMMVMTEDMPLEI). В некоторых вариантах осуществления настоящее изобретение включает молекулу нуклеиновой кислоты, содержащую нуклеотидную последовательность, которая кодирует полипептид миниатюризированного дистрофина, содержащий домен спектринового повтора 1 (R1) и домен спектринового повтора 16 (R16), где домен R1 и домен R16 слиты посредством линкера, содержащего аминокислотную последовательность, приведенную в SEQ ID NO: 84 (IHTVREETMMVMTEDMPLEI). В некоторых вариантах осуществления настоящего изобретения обеспечивается молекула нуклеиновой кислоты, содержащая нуклеотидную последовательность, которая кодирует полипептид миниатюризированного дистрофина, содержащий от N-конца до С-конца шарнирный 1 (H1) домен, домен спектринового повтора 1 (R1), домен спектринового повтора 16 (R16), домен спектринового повтора 17 (R17), шарнирный 3 (H3) домен, домен спектринового повтора 23 (R23), домен спектринового повтора 24 (R24) и шарнирный 4 (Н4) домен дистрофина, где домен R1 и домен R16 слиIn some embodiments, the present invention provides a miniaturized dystrophin polypeptide comprising a spectrin repeat 1 (R1) domain and a spectrin repeat 16 (R16) domain, wherein the R1 domain and the R16 domain are fused through a linker comprising the amino acid sequence set forth in SEQ ID NO: 84 ( IHTVREETMMVMTEDMPLEI). In some embodiments, the present invention provides a miniaturized dystrophin polypeptide comprising, from N-terminus to C-terminus, hinge 1 (H1) domain, spectrin repeat 1 (R1) domain, spectrin repeat 16 (R16) domain, spectrin repeat 17 domain ( R17), hinge 3 (H3) domain, spectrin repeat domain 23 (R23), spectrin repeat domain 24 (R24), and dystrophin hinge 4 (H4) domain, wherein the R1 domain and the R16 domain are fused by the amino acid sequence set forth in SEQ ID NO : 84 (IHTVREETMMVMTEDMPLEI). In some embodiments, the present invention includes a nucleic acid molecule comprising a nucleotide sequence that encodes a miniaturized dystrophin polypeptide comprising a spectrin repeat 1 (R1) domain and a spectrin repeat 16 (R16) domain, wherein the R1 domain and the R16 domain are fused through a linker containing an amino acid the sequence given in SEQ ID NO: 84 (IHTVREETMMVMTEDMPLEI). In some embodiments, the present invention provides a nucleic acid molecule comprising a nucleotide sequence that encodes a miniaturized dystrophin polypeptide comprising an N-terminal to C-terminal hinge 1 (H1) domain, a spectrin repeat 1 (R1) domain, a spectrin repeat 16 domain ( R16), spectrin repeat domain 17 (R17), hinge 3 (H3) domain, spectrin repeat domain 23 (R23), spectrin repeat domain 24 (R24), and dystrophin hinge 4 (H4) domain, where the R1 domain and the R16 domain are merged

- 35 046419 ты посредством аминокислотной последовательности, приведенной в SEQ ID NO: 84 (IHTVREETMMVMTEDMPLEI).- 35 046419 you through the amino acid sequence given in SEQ ID NO: 84 (IHTVREETMMVMTEDMPLEI).

В некоторых вариантах осуществления полипептид миниатюризированного дистрофина согласно настоящему изобретению имеет следующие характеристики: (i) домен H1 и домен R1 слиты непосредственно, (ii) домены R16 и R17 слиты непосредственно, (iii) домены R17 и Н3 слиты непосредственно, (iv) домены R23 и R24 слиты непосредственно, или (v) домены R24 и Н4 слиты непосредственно, или (vi) любая их комбинация. В некоторых вариантах осуществления полипептид миниатюризированного дистрофина согласно настоящему изобретению не содержит домен спектринового повтора 2 (R2), домен спектринового повтора 3 (R3), домен спектринового повтора 4 (R4), домен спектринового повтора 5 (R5), домен спектринового повтора 6 (R6), домен спектринового повтора 7 (R7), домен спектринового повтора 8 (R8), домен спектринового повтора 9 (R9), домен спектринового повтора 10 (R10), домен спектринового повтора 11 (R11), домен спектринового повтора 12 (R12), домен спектринового повтора 13 (R13), домен спектринового повтора 14 (R14), домен спектринового повтора 15 (R15), домен спектринового повтора 18 (R18), домен спектринового повтора 19 (R19), домен спектринового повтора 20 (R20), домен спектринового повтора 21 (R21) и/или домен спектринового повтора 22 (R22). В некоторых вариантах осуществления полипептид миниатюризированного дистрофина дополнительно содержит домен ABD1 и/или домен CR.In some embodiments, the miniaturized dystrophin polypeptide of the present invention has the following characteristics: (i) the H1 domain and the R1 domain are directly fused, (ii) the R16 and R17 domains are directly fused, (iii) the R17 and H3 domains are directly fused, (iv) the R23 domains and R24 are directly fused, or (v) the R24 and H4 domains are directly fused, or (vi) any combination thereof. In some embodiments, the miniaturized dystrophin polypeptide of the present invention does not contain spectrin repeat domain 2 (R2), spectrin repeat domain 3 (R3), spectrin repeat domain 4 (R4), spectrin repeat domain 5 (R5), spectrin repeat domain 6 (R6 ), spectrin repeat domain 7 (R7), spectrin repeat domain 8 (R8), spectrin repeat domain 9 (R9), spectrin repeat domain 10 (R10), spectrin repeat domain 11 (R11), spectrin repeat domain 12 (R12), spectrin repeat domain 13 (R13), spectrin repeat domain 14 (R14), spectrin repeat domain 15 (R15), spectrin repeat domain 18 (R18), spectrin repeat domain 19 (R19), spectrin repeat domain 20 (R20), spectrin domain repeat 21 (R21) and/or spectrin repeat 22 (R22) domain. In some embodiments, the miniaturized dystrophin polypeptide further comprises an ABD1 domain and/or a CR domain.

В некоторых вариантах осуществления полипептид миниатюризированного дистрофина содержит, состоит по существу из или состоит из, от N-конца к С-концу, домена ABD1, домена H1, домена R1, аминокислотной последовательности, приведенной в SEQ ID NO: 84 (IHTVREETMMVMTEDMPLEI), домена R16, домена R17, домена Н3, домена R23, домена R24, домена Н4 и домена CR дистрофина.In some embodiments, the miniaturized dystrophin polypeptide comprises, consists essentially of, or consists of, from N-terminus to C-terminus, an ABD1 domain, an H1 domain, an R1 domain, the amino acid sequence set forth in SEQ ID NO: 84 (IHTVREETMMVMTEDMPLEI), a domain R16 domain, R17 domain, H3 domain, R23 domain, R24 domain, H4 domain and CR domain of dystrophin.

В некоторых вариантах осуществления домен H1, применимый для полипептида миниатюризированного дистрофина, содержит аминокислотную последовательность, которая по меньшей мере на около 70%, по меньшей мере на около 75%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 82. В других вариантах осуществления домен R1, применимый для полипептида миниатюризированного дистрофина, содержит аминокислотную последовательность, которая по меньшей мере на около 70%, по меньшей мере на около 75%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 83.In some embodiments, the H1 domain useful for a miniaturized dystrophin polypeptide comprises an amino acid sequence that is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99% or about 100% identical to the sequence of SEQ ID NO: 82. In other embodiments, the R1 domain useful for a miniaturized dystrophin polypeptide comprises an amino acid sequence that is at least about 70%, at least about 75%, at least about 80 %, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, is at least about 99% or about 100% identical to the sequence of SEQ ID NO: 83.

В некоторых вариантах осуществления домен R16, применимый для полипептида миниатюризированного дистрофина, содержит аминокислотную последовательность, которая по меньшей мере на около 70%, по меньшей мере на около 75%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 85.In some embodiments, the R16 domain useful for a miniaturized dystrophin polypeptide comprises an amino acid sequence that is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99% or about 100% identical to SEQ ID NO: 85.

В некоторых вариантах осуществления домен R17, применимый для полипептида миниатюризированного дистрофина, содержит аминокислотную последовательность, которая по меньшей мере на около 70%, по меньшей мере на около 75%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 86.In some embodiments, the R17 domain useful for a miniaturized dystrophin polypeptide comprises an amino acid sequence that is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99% or about 100% identical to SEQ ID NO: 86.

В других вариантах осуществления домен Н3, применимый для полипептида миниатюризированного дистрофина, содержит аминокислотную последовательность, которая по меньшей мере на около 70%, по меньшей мере на около 75%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 87.In other embodiments, the H3 domain useful for a miniaturized dystrophin polypeptide comprises an amino acid sequence that is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99% or about 100% identical to SEQ ID NO: 87.

В некоторых вариантах осуществления домен R23, применимый для полипептида миниатюризированного дистрофина, содержит аминокислотную последовательность, которая по меньшей мере на около 70%, по меньшей мере на около 75%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 88.In some embodiments, the R23 domain useful for a miniaturized dystrophin polypeptide comprises an amino acid sequence that is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99% or about 100% identical to SEQ ID NO: 88.

В других вариантах осуществления домен R24, применимый для полипептида миниатюризированного дистрофина, содержит аминокислотную последовательность, которая по меньшей мере на около 70%, по меньшей мере на около 75%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 89.In other embodiments, the R24 domain useful for a miniaturized dystrophin polypeptide comprises an amino acid sequence that is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99% or about 100% identical to SEQ ID NO: 89.

- 36 046419- 36 046419

В некоторых вариантах осуществления домен Н4, применимый для полипептида миниатюризированного дистрофина, содержит аминокислотную последовательность, которая по меньшей мере на около 70%, по меньшей мере на около 75%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 90.In some embodiments, the H4 domain useful for a miniaturized dystrophin polypeptide comprises an amino acid sequence that is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99% or about 100% identical to SEQ ID NO: 90.

В некоторых вариантах осуществления полипептид миниатюризированного дистрофина дополнительно содержит на N-конце аминокислотную последовательность, которая по меньшей мере на около 70%, по меньшей мере на около 75%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 81. В некоторых вариантах осуществления полипептид миниатюризированного дистрофина дополнительно содержит на С-конце аминокислотную последовательность, которая по меньшей мере на около 70%, по меньшей мере на около 75%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 91.In some embodiments, the miniaturized dystrophin polypeptide further comprises, at its N-terminus, an amino acid sequence that is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99% or about 100 % identical to the sequence of SEQ ID NO: 81. In some embodiments, the miniaturized dystrophin polypeptide further comprises, at its C-terminus, an amino acid sequence that is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least at least about 99% or about 100% identical to the sequence of SEQ ID NO: 91.

В некоторых вариантах осуществления последовательность нуклеиновой кислоты, кодирующая каждый домен, может быть следующей.In some embodiments, the nucleic acid sequence encoding each domain may be as follows.

Таблица 6АTable 6A

Нуклеотидная последовательность (и структура доменов), кодирующая полипептид миниатюризированного дистрофина ВХА-196477Nucleotide sequence (and domain structure) encoding the miniaturized dystrophin polypeptide BXA-196477

SEQ ID NO: SEQ ID NO: Описание Description Нуклеотидная последовательность Nucleotide sequence 92 92 5'UTR 5'UTR CCGCCTTCGGCACCATTCCTCACGACACCCAAATATGGCACG GGTGAGGAATGGTGGGGAGTTATTTTAGAGCGGTGAGGAAGG TGGGCAGGCAGCAGGTGTTGGCGCTCTAAAAATAACTCCCGG GAGTTATTTTAGAGCGGAGGAATGGTGGACACCCAAATAGGC GACGGTTCCTCACCCGTCGCCATATTTGGGTGTCCGCCCTCGG CCGGGGCCGCATTCCTGGGGCCGGGCGGTGCTCCCGCCCGCC TCGATAAAAGGCTCCGGGGCCGGCGGCGGCCCACGAGCTACC CGGAGGAGCGGGAGGCTCTAGACCACC CCGCCTTCGGCACCATTCCTCACGACACCCAAATATGGCACG GGTGAGGAATGGTGGGGAGTTATTTTAGAGCGGTGAGGAAGG TGGGCAGGCAGCAGGTGTTGGCGCTCTAAAAATAACTCCCGG GAGTTATTTTAGAGCGGAGGAATGGTGGACACCCAAATAGGC GACGGTTCCTCACCCGTCGCCATATTTGGGTGTCCGCCCTCGG CCGGGGCCGCATTCCTGGGGCCGGGCGG TGCTCCCGCCCGCC TCGATAAAAGGCTCCGGGGCCGGCGGCGGCCCACGAGCTACC CGGAGGAGCGGGAGGCTCTAGACCACC 93 93 ABDI ABDI ATGCTGTGGTGGGAGGAAGTGGAAGATTGCTACGAGCGCGAG GACGTGCAGAAGAAAACCTTCACCAAATGGGTGAACGCCCAG TTCAGCAAGTTCGGCAAGCAGCACATCGAGAACCTGTTCAGC GACCTGCAGGACGGCAGACGGCTGCTGGACCTGCTGGAAGGC CTGACCGGCCAGAAGCTGCCCAAAGAGAAGGGCAGCACCAG AGTGCACGCCCTGAACAACGTGAACAAGGCCCTGCGGGTGCT GCAGAACAACAACGTGGACCTGGTGAACATCGGCAGCACCGA CATCGTGGACGGCAACCACAAGCTGACCCTGGGCCTGATCTG GAACATCATCCTGCACTGGCAGGTCAAAAACGTGATGAAGAA CATCATGGCCGGCCTGCAGCAGACCAACAGCGAGAAGATCCT GCTGAGCTGGGTGCGCCAGAGCACCCGGAACTACCCCCAGGT CAACGTGATCAACTTCACCACCTCTTGGAGCGACGGCCTGGC CCTGAACGCCCTGATCCACAGCCACCGGCCCGACCTGTTCGA CTGGAACAGCGTGGTCTGCCAGCAGAGCGCCACCCAGCGGCT GGAACACGCCTTCAATATCGCCAGATACCAGCTGGGCATCGA GAAGCTGCTGGATCCCGAGGACGTGGACACCACCTACCCCGA CAAGAAATCCATCCTGATGTATATCACCAGCCTGTTCCAGGTG CTGCCCCAGCAGGTGTCCATCGAGGCCATCCAGGAAGTGGAA ATGCTGTGGTGGGAGGAAGTGGAAGATTGCTACGAGCGCGAG GACGTGCAGAAGAAAACCTTCACCAAATGGGTGAACGCCCAG TTCAGCAAGTTCGGCAAGCAGCACATCGAGAACCTGTTCAGC GACCTGCAGGACGGCAGACGGCTGCTGGACCTGCTGGAAGGC CTGACCGGCCAGAAGCTGCCCAAAGAAGGGCAGCACCAG AGTGCACGCCCTGAACAACGTGAACAAGGC CCTGCGGGTGCT GCAGAACAACAACGTGGACCTGGTGAACATCGGCAGCACCGA CATCGTGGACGGCAACCACAAGCTGACCCTGGGCCTGATCTG GAACATCATCCTGCACTGGCAGGTCAAAACGTGATGAAGAA CATCATGGCCGGCCTGCAGCAGACCAACAGCGAGAAGATCCT GCTGAGCTGGGTGCGCCAGAGCACCCGGAACTACCCCCAGGT CAACGTGATCAACTTCACCACCTC TTGGAGCGACGGCCTGGC CCTGAACGCCCTGATCCACAGCCACCGGCCCGACCTGTTCGA CTGGAACAGCGTGGTCTGCCAGCAGAGCGCCACCCAGCGGCT GGAACACGCCTTCAATATCGCCAGATACCAGCTGGGCATCGA GAAGCTGCTGGATCCCGAGGACGTGGACACCACCTACCCCGA CAAGAAATCCATCCTGATGTATATCACCAGCCTGTTCCAGGTG GGTGTCCATCGAGGCCATCCAGGAAGTGGAA 94 94 Шарнир 1 Hinge 1 ATGCTGCCCAGACCCCCCAAAGTGACCAAAGAGGAACACTTC CAGCTGCACCACCAGATGCACTACAGCCAGCAGATCACCGTG TCCCTGGCCCAGGGCTACGAGAGAACCAGCAGCCCCAAGCCC CGGTTCAAGAGCTACGCCTATACCCAGGCCGCCTACGTGACC ACCAGCGACCCTACCAGAAGCCCATTCCCCAGCCAGCATCTG GAAGCCCCCGAGGACAAGAGCTTCGGCAGCAGCCTGATGGAA AGC ATGCTGCCCAGACCCCCCAAAGTGACCAAAGAGGAACACTTC CAGCTGCACCACCAGATGCACTACAGCCAGCAGATCACCGTG TCCCTGGCCCAGGGCTACGAGAGAACCAGCAGCCCCAAGCCC CGGTTCAAGAGCTACGCCTATACCCAGGCCGCCTACGTGACC ACCAGCGACCCTACCAGAAGCCCATTCCCCAGCCAGCATCTG GAAGCCCCCGAGGACAAGAGCTTCGGCAGCAG CCTGATGGAA AGC 95 95 Спектрин-1 Spectrin-1 GAAGTGAACCTGGACAGATACCAGACCGCCCTGGAAGAGGTG CTGAGCTGGCTGCTGAGCGCCGAGGATACACTGCAGGCTCAG GGCGAGATCAGCAACGACGTGGAAGTCGTGAAGGACCAGTTC CACACCCACGAGGGCTACATGATGGACCTGACAGCCCACCAG GGCAGAGTGGGCAACATCCTGCAGCTGGGCTCCAAGCTGATC GGCACCGGCAAGCTGAGCGAGGACGAAGAGACAGAGGTGCA GAAGTGAACCTGGACAGATACCAGACCGCCCTGGAAGAGGTG CTGAGCTGGCTGCTGAGCGCCGAGGATACACTGCAGGCTCAG GGCGAGATCAGCAACGACGTGGAAGTCGTGAAGGACCAGTTC CACACCCACGAGGGCTACATGATGGACCTGACAGCCCACCAG GGCAGAGTGGGCAACATCCTGCAGCTGGGCTCCAAGCTGATC GGCACCGGCAAGCTGAGCGAGGACGAAGA GACAGAGGTGCA

- 37 046419- 37 046419

GGAACAGATGAACCTGCTGAACAGCAGATGGGAGTGCCTGCG GGTGGCCAGCATGGAAAAGCAGAGCAACCTGCAT GGAACAGATGAACCTGCTGAACAGCAGATGGGAGTGCCTGCG GGTGGCCAGCATGGAAAAGCAGAGCAACCTGCAT 96 96 LI (RVлинкер) LI (RV linker) AGGGTC AGGGTC 97 97 Спектрин-3 Spectrin-3 CTGCTGAAGTGGCAGCGGCTGACCGAGGAACAGTGCCTGTTT AGCGCCTGGCTGTCCGAGAAAGAGGACGCCGTGAACAAGATC CACACCACCGGCTTCAAGGACCAGAACGAGATGCTGAGCAGC CTGCAGAAACTGGCCGTGCTGAAGGCCGACCTGGAAAAGAAA AAGCAGTCCATGGGCAAGCTGTACTCCCTGAAGCAGGACCTG CTGTCCACCCTGAAGAACAAGAGCGTGACCCAGAAAACCGAG GCCTGGCTGGACAACTTCGCCCGGTGCTGGGACAACCTGGTG CAGAAGCTGGAAAAGTCCACCGCCCAGATCTCCCAGGCC CTGCTGAAGTGGCAGCGGCTGACCGAGGAACAGTGCCTGTTT AGCGCCTGGCTGTCCGAGAAAGAGGACGCCGTGAACAAGATC CACACCACCGGCTTCAAGGACCAGAACGAGATGCTGAGCAGC CTGCAGAAACTGGCCGTGCTGAAGGCCGACCTGGAAAAGAAA AAGCAGTCCATGGGCAAGCTGTACTCCCTGAAGCAGGACCTG CTGTCCACCCTGAAGAACAAGAGCGTGACCC AGAAAACCGAG GCCTGGCTGGACAACTTCGCCCGGTGCTGGGACAACCTGGTG CAGAAGCTGGAAAAGTCCACCGCCCAGATCTCCCAGGCC 98 98 Шарнир 2 Hinge 2 GTGACCACAACACAGCCCAGCCTGACCCAGACCACCGTGATG GAAACCGTGACAACAGTGACCACCCGGGAACAGATCCTCGTG AAGCACGCCCAGGAAGAACTGCCCCCTCCACCCCCCCAGAAG AAACGGCAGATCACAGTGGAC GTGACCACAACACAGCCCAGCCTGACCCAGACCACCGTGATG GAAACCGTGACAACAGTGACCACCCGGGAACAGATCCTCGTG AAGCACGCCCAGGAAGAACTGCCCCCTCCACCCCCCCAGAAG AAACGGCAGATCACAGTGGAC 99 99 L2 (линкер SEAQ) L2 (SEAQ linker) AGTGAAGCTCAG AGTGAAGCTCAG 100 100 L3 (20мерный линкер) L3 (20-dimensional linker) ATCCACACCGTGCGGGAAGAGACAATGATGGTCATGACAGAG GACATGCCCCTGGAAATC ATCCACACCGTGCGGGAAGAGACAATGATGGTCATGACAGAG GACATGCCCCTGGAAATC 101 101 Спектрин16 Spectrin16 AGCTACGTGCCCAGCACCTACCTGACCGAGATCACCCATGTG TCCCAGGCCCTGCTGGAAGTGGAACAGCTGCTGAACGCCCCC GACCTGTGCGCCAAGGATTTCGAGGACCTGTTCAAGCAGGAA GAGAGCCTGAAGAATATCAAGGATAGCCTGCAGCAGAGCAG CGGCCGGATCGACATCATCCACAGCAAGAAAACAGCCGCCCT GCAGAGCGCCACCCCCGTGGAAAGAGTGAAACTGCAGGAAG CCCTGTCCCAGCTGGACTTCCAGTGGGAGAAAGTGAACAAAA TGTACAAGGACCGGCAGGGCAGATTCGACCGCAGC AGCTACGTGCCCAGCACCTACCTGACCGAGATCACCCATGTG TCCCAGGCCCTGCTGGAAGTGGAACAGCTGCTGAACGCCCCC GACCTGTGCGCCAAGGATTTCGAGGACCTGTTCAAGCAGGAA GAGAGCCTGAAGAATATCAAGGATAGCCTGCAGCAGAGCAG CGGCCGGATCGACATCATCCACAGCAAGAAAACAGCCGCCCT GCAGAGCGCCACCCCCGTGGAAAGAGTGAAACT GCAGGAAG CCCTGTCCCAGCTGGACTTCCAGTGGGAGAAAGTGAACAAAA TGTACAAGGACCGGCAGGGCAGATTCGACCGCAGC 102 102 Спектрин17 Spectrin17 GTGGAAAAGTGGCGGCGGTTCCACTACGACATCAAGATCTTC AACCAGTGGCTGACAGAGGCCGAGCAGTTCCTGAGAAAGACC CAGATCCCCGAGAACTGGGAGCACGCCAAGTACAAGTGGTAT CTGAAAGAGCTGCAGGACGGCATCGGCCAGAGACAGACAGT CGTGCGGACCCTGAATGCCACCGGCGAGGAAATCATCCAGCA GTCCAGCAAGACCGACGCCAGCATTCTGCAGGAAAAGCTGGG CAGCCTGAACCTGCGGTGGCAGGAAGTGTGCAAGCAGCTGTC CGACCGGAAGAAGCGGCTGGAAGAACAG GTGGAAAAGTGGCGGCGGTTCCACTACGACATCAAGATCTTC AACCAGTGGCTGACAGAGGCCGAGCAGTTCCTGAGAAAGACC CAGATCCCCGAGAACTGGGAGCACGCCAAGTACAAGTGGTAT CTGAAAGAGCTGCAGGACGGCATCGGCCAGAGACAGACAGT CGTGCGGACCCTGAATGCCACCGGCGAGGAAATCATCCAGCA GTCCAGCAAGACCGACGCCAGCATTCTGCAGGAAA AGCTGGG CAGCCTGAACCTGCGGTGGCAGGAAGTGTGCAAGCAGCTGTC CGACCGGAAGAAGCGGCTGGAAGAACAG 103 103 Спектрин24 Spectrin24 CTGGAACGGCTGCAGGAACTGCAGGAGGCCACCGACGAGCTG GACCTGAAACTGAGACAGGCCGAAGTGATCAAGGGCAGCTG GCAGCCAGTGGGCGACCTGCTGATCGACTCCCTGCAGGACCA TCTGGAAAAAGTGAAGGCCCTGAGAGGCGAGATCGCCCCCCT GAAAGAAAACGTGTCCCACGTGAACGACCTGGCCCGGCAGCT GACAACACTGGGCATTCAGCTGAGCCCCTACAACCTGAGCAC ACTGGAAGATCTGAACACCCGGTGGAAGCTGCTGCAGGTGGC CGTGGAAGATAGAGTGCGGCAGCTGCACGAG CTGGAACGGCTGCAGGAACTGCAGGAGGCCACCGACGAGCTG GACCTGAAACTGAGACAGGCCGAAGTGATCAAGGGCAGCTG GCAGCCAGTGGGCGACCTGCTGATCGACTCCCTGCAGGACCA TCTGGAAAAAGTGAAGGCCCTGAGAGGCGAGATCGCCCCCCT GAAAGAAAACGTGTCCCACGTGAACGACCTGGCCCGGCAGCT GACAACACTGGGCATTCAGCTGAGCCCCTACA ACCTGAGCAC ACTGGAAGATCTGAACACCCGGTGGAAGCTGCTGCAGGTGGC CGTGGAAGATAGAGTGCGGCAGCTGCACGAG 104 104 Шарнир 4 Hinge 4 GCCCACAGAGATTTTGGCCCTGCCTCCCAGCACTTCCTGAGCA CCAGTGTGCAGGGCCCTTGGGAGAGAGCCATCTCCCCTAACA AGGTGCCCTACTACATCAACCACGAGACACAGACCACCTGAC TGAACTGGGACCACCCCAAGCTGACCGACGACCTGACCACCT GCCCACAGAGATTTTGGCCCTGCCTCCCAGCACTTCCTGAGCA CCAGTGTGCAGGGCCCTTGGGAGAGAGCCATCTCCCCTAACA AGGTGCCCTACTACATCAACCACGAGACACAGACCACCTGAC TGAACTGGGACCACCCCAAGCTGACCGACGACCTGACCACCT

- 38 046419- 38 046419

CAGCTGACCGACGACGACGACCTGACGACGACGACGACGAC GACGACGACGACGAC CAGCTGACCGACGACGACGACCTGACGACGACGACGACGAC GACGACGACGACGAC 105 105 CR/C-конц CR/C-conc CGGAGACTGCAGAAAGCTCTGTGCCTGGATCTGCTGTCCCTGT CCGCCGCCTGTGATGCCCTGGACCAGCACAATCTGAAGCAGA ACGACCAGCCCATGGATATCCTGCAGATCATCAACTGCCTGA CCACCATCTACGACCGGCTGGAACAGGAACACAACAATCTCG TGAACGTGCCCCTGTGCGTGGACATGTGCCTGAATTGGCTGCT GAATGTGTACGACACCGGCCGGACAGGCCGGATCAGAGTGCT GTCCTTCAAGACCGGCATCATCAGCCTGTGCAAAGCCCACCT GGAAGATAAGTACCGGTATCTGTTCAAACAGGTGGCCTCTAG CACCGGCTTTTGCGACCAGAGAAGGCTGGGCCTGCTGCTGCA CGACAGCATCCAGATCCCTAGACAGCTGGGCGAAGTGGCCAG CTTTGGCGGCAGCAACATCGAGCCTAGCGTGCGGAGCTGCTT CCAGTTCGCCAACAACAAGCCCGAGATCGAGGCCGCCCTGTT CCTGGACTGGATGAGACTGGAACCCCAGAGCATGGTGTGGCT GCCCGTGCTGCATAGAGTGGCCGCTGCCGAGACAGCCAAGCA CCAGGCCAAGTGCAACATCTGCAAAGAGTGCCCCATCATCGG CTTCCGGTACAGAAGCCTGAAGCACTTCAACTACGATATCTGC CAGAGCTGTTTCTTCAGCGGCAGGGTGGCCAAGGGCCACAAA ATGCACTACCCCATGGTGGAATACTGCACCCCCACCACAAGC GGCGAGGATGTGCGGGATTTCGCCAAGGTGCTGAAAAACAAG TTCCGGACCAAGCGGTACTTCGCCAAACACCCCCGGATGGGC TACCTGCCTGTGCAGACAGTGCTGGAAGGCGACAACATGGAA ACCGACACCATGTGATGATGATTTGGGCAGAGCGATGGAGTC CTTAGTATCAGTCATGACAGATGAAGAAGGAGCAGAATAAAT GTTTTACAACTCCTGATTCCCGCATGCGGCCAGCTTATCGATA CCGTCGAAATAAAAGATCCTTATTTTCATTGGATCTGTGTGTT GGTTTTTTGTGTG CGGAGACTGCAGAAAGCTCTGTGCCTGGATCTGCTGTCCCTGT CCGCCGCCTGTGATGCCCTGGACCAGCACAATCTGAAGCAGA ACGACCAGCCCATGGATATCCTGCAGATCATCAACTGCCTGA CCACCATCTACGACCGGCTGGAACAGGAACACAACAATCTCG TGAACGTGCCCCTGTGCGTGGACATGTGCCTGAATTGGCTGCT GAATGTGTACGACACCGGCCGGACAGGCCGGATC AGAGTGCT GTCCTTCAAGACCGGCATCATCAGCCTGTGCAAAGCCCACCT GGAAGATAAGTACCGGTATCTGTTCAAACAGGTGGCCTCTAG CACCGGCTTTTGCGACCAGAAGGCTGGGCCTGCTGCTGCA CGACAGCATCCAGATCCCTAGACAGCTGGGCGAAGTGGCCAG CTTTGGCGGCAGCAACATCGAGCCTAGCGTGCGGAGCTGCTT CCAGTTCGCCAACAACAAGCCCGAGATC GAGGCCGCCCTGTT CCTGGACTGGATGAGACTGGAACCCCAGAGCATGGTGTGGCT GCCCGTGCTGCATAGAGTGGCCGCTGCCGAGACAGCCAAGCA CCAGGCCAAGTGCAACATCTGCAAAGAGTGCCCCATCATCGG CTTCCGGTACAGAAGCCTGAAGCACTTCAACTACGATATCTGC CAGAGCTGTTTCTTCAGCGGCAGGGTGGCCAAGGGCCACAAA ATGCACTACCCCATGGTGGAATACT GCACCCCCACCACAAGC GGCGAGGATGTGCGGGATTTCGCCAAGGTGCTGAAAAACAAG TTCCGGACCAAGCGGTACTTCGCCAAACACCCCCGGATGGGC TACCTGCCTGTGCAGACAGTGCTGGAAGGCGACAACATGGAA ACCGACACCATGTGATGATGATTTGGGCAGAGCGATGGAGTC CTTAGTATCAGTCATGACAGATGAAGAAGGAGCAGAATAAAT GTTTTACAACTCCTG ATTCCCGCATGCGGCCAGCTTATCGATA CCGTCGAAATAAAAGATCCTTATTTTCATTGGATCTGTGTGTT GGTTTTTTGTGTG

В некоторых вариантах осуществления последовательность нуклеиновой кислоты, кодирующая домен H1 в полипептиде миниатюризированного дистрофина, представляет собой последовательность, которая по меньшей мере на около 60%, по меньшей мере на около 70%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 94. В некоторых вариантах осуществления последовательность нуклеиновой кислоты, кодирующая домен R1, представляет собой последовательность, которая по меньшей мере на около 60%, по меньшей мере на около 70%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 95. В некоторых вариантах осуществления последовательность нуклеиновой кислоты, кодирующая домен R3, представляет собой последовательность, которая по меньшей мере на около 60%, по меньшей мере на около 70%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 97. В некоторых вариантах осуществления последовательность нуклеиновой кислоты, кодирующая домен Н2, представляет собой последовательность, которая по меньшей мере на около 60%, по меньшей мере на около 70%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 98. В некоторых вариантах осуществления последовательность нуклеиновой кислоты, кодирующая домен R16, представляет собой последовательность, которая по меньшей мере на около 60%, по меньшей мере на около 70%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 101. В некоторых вариантах осуществления последовательность нуклеиновой кислоты, кодирующая домен R17, представляет собой последовательность, которая по меньшей мере на около 60%, по меньшей мере на около 70%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 102. В некоторых вариантах осуществления последовательность нуклеиновой кислоты, кодирующая домен R24, представляет собой последовательность, которая по меньшей мере на около 60%, по меньшей мере на около 70%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, поIn some embodiments, the nucleic acid sequence encoding the H1 domain of the miniaturized dystrophin polypeptide is a sequence that is at least about 60%, at least about 70%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99% or about 100% identical to the sequence of SEQ ID NO: 94. In some embodiments, the nucleic acid sequence encoding the R1 domain is a sequence that is at least about 60%, at least about 70%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98 % is at least about 99% or about 100% identical to the sequence of SEQ ID NO: 95. In some embodiments, the nucleic acid sequence encoding the R3 domain is a sequence that is at least about 60% identical to by about 70%, by at least about 80%, by at least about 85%, by at least about 90%, by at least about 95%, by at least about 96%, by at least about 97%, at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 97. In some embodiments, the nucleic acid sequence encoding the H2 domain is a sequence that is at least at least about 60%, at least about 70%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about about 96%, at least about 97%, at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 98. In some embodiments, the nucleic acid sequence encoding the domain R16 is a sequence that is at least about 60%, at least about 70%, at least about 80%, at least about 85%, at least about 90%, at least is at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 101. B In some embodiments, the nucleic acid sequence encoding the R17 domain is a sequence that is at least about 60%, at least about 70%, at least about 80%, at least about 85%, at least at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99% or about 100% identical to the sequence of SEQ ID NO: 102. In some embodiments, the nucleic acid sequence encoding the R24 domain is a sequence that is at least about 60%, at least about 70%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, according to

- 39 046419 меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 103. В некоторых вариантах осуществления последовательность нуклеиновой кислоты, кодирующая домен Н4, представляет собой последовательность, которая по меньшей мере на около 60%, по меньшей мере на около 70%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 104. В некоторых вариантах осуществления последовательность нуклеиновой кислоты, кодирующая домен ABD1 в полипептиде миниатюризированного дистрофина, представляет собой последовательность, которая по меньшей мере на около 60%, по меньшей мере на около 70%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 93. В некоторых вариантах осуществления последовательность нуклеиновой кислоты, кодирующая CR/Cконцевой полипептид, представляет собой последовательность, которая по меньшей мере на около 60%, по меньшей мере на около 70%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 105.- 39046419 is at least about 96%, at least about 97%, at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 103. In some embodiments, the nucleic acid sequence encoding the H4 domain is a sequence that is at least about 60%, at least about 70%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 104. In some embodiments, the nucleic acid sequence encoding the ABD1 domain of the miniaturized dystrophin polypeptide is a sequence that is at least about 60%, at least about 70%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least is at least about 99% or about 100% identical to the sequence of SEQ ID NO: 93. In some embodiments, the nucleic acid sequence encoding the CR/C-terminal polypeptide is a sequence that is at least about 60%, at least about 70%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97% , is at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 105.

Т аблица 6ВTable 6B

Нуклеотидная последовательность (и структура доменов), кодирующая полипептид миниатюризированного дистрофина ВХА-027743Nucleotide sequence (and domain structure) encoding the miniaturized dystrophin polypeptide BXA-027743

SEQ ID NO: SEQ ID NO: Описание Description Нуклеотидная последовательность Nucleotide sequence 106 106 5'UTR 5'UTR CCTGCGGCCGCCTTCGGCACCATTCCTCACGACACCCAAATAT GGCGACGGGTGAGGAATGGTGGGGAGTTATTTTTAGAGCGGT GAGGAAGGTGGGCAGGCAGCAGGTGTTGGCGCTCTAAAAATA ACTCCCGGGAGTTATTTTTAGAGCGGAGGAATGGTGGACACC CAAATATGGCGACGGTTCCTCACCCGTCGCCATATTTGGGTGT CCGCCCTCGGCCGGGGCCGCATTCCTGGGGGCCGGGCGGTGC TCCCGCCCGCCTCGATAAAAGGCTCCGGGGCCGGCGGCGGCC CACGAGCTACCCGGAGGAGCGGGAGGCTCTAGACCACC CCTGCGGCCGCCTTCGGCACCATTCCTCACGACACCCAAATAT GGCGACGGGTGAGGAATGGTGGGGAGTTATTTTTTAGAGCGGT GAGGAAGGTGGGCAGGCAGCAGGTGTTGGCGCTCTAAAAATA ACTCCCGGGAGTTATTTTTAGAGCGGAGGAATGGTGGACACC CAAATATGGCGACGGTTCCTCACCCGTCGCCATATTTGGGTGT CCGCCCTCGGCCGGGGCCGCATTCCT GGGGGCCGGGCGGTGC TCCCGCCCGCCTCGATAAAAGGCTCCGGGGCCGGCGGCGGCC CACGAGCTACCCGGAGGAGCGGGAGGCTCTAGACCACC 107 107 ABDI ABDI ATGCTGTGGTGGGAGGAAGTGGAAGATTGCTACGAGCGCGAG GACGTGCAGAAGAAAACCTTCACCAAATGGGTGAACGCCCAG TTCAGCAAGTTCGGCAAGCAGCACATCGAGAACCTGTTCAGC GACCTGCAGGACGGCAGACGGCTGCTGGACCTGCTGGAAGGC CTGACCGGCCAGAAGCTGCCCAAAGAGAAGGGCAGCACCAG AGTGCACGCCCTGAACAACGTGAACAAGGCCCTGCGGGTGCT GCAGAACAACAACGTGGACCTGGTGAACATCGGCAGCACCG ACATCGTGGACGGCAACCACAAGCTGACCCTGGGCCTGATCT GGAACATCATCCTGCACTGGCAGGTCAAAAACGTGATGAAGA ATGCTGTGGTGGGAGGAAGTGGAAGATTGCTACGAGCGCGAG GACGTGCAGAAGAAAACCTTCACCAAATGGGTGAACGCCCAG TTCAGCAAGTTCGGCAAGCAGCACATCGAGAACCTGTTCAGC GACCTGCAGGACGGCAGACGGCTGCTGGACCTGCTGGAAGGC CTGACCGGCCAGAAGCTGCCCAAAGAAGGGCAGCACCAG AGTGCACGCCCTGAACAACGTGAACAAGGC CCTGCGGGTGCT GCAGAACAACACGTGGACCTGGTGAACATCGGCAGCACCG ACATCGTGGACGGCAACCACAAGCTGACCCTGGGCCTGATCT GGAACATCATCCTGCACTGGCAGGTCAAAAACGTGATGAAGA

- 40 046419- 40 046419

ACATCATGGCCGGCCTGCAGCAGACCAACAGCGAGAAGATCC TGCTGAGCTGGGTGCGCCAGAGCACCCGGAACTACCCCCAGG TCAACGTGATCAACTTCACCACCTCTTGGAGCGACGGCCTGG CCCTGAACGCCCTGATCCACAGCCACCGGCCCGACCTGTTCG ACTGGAACAGCGTGGTCTGCCAGCAGAGCGCCACCCAGCGGC TGGAACACGCCTTCAATATCGCCAGATACCAGCTGGGCATCG AGAAGCTGCTGGATCCCGAGGACGTGGACACCACCTACCCCG ACAAGAAATCCATCCTGATGTATATCACCAGCCTGTTCCAGGT GCTGCCCCAGCAGGTGTCCATCGAGGCCATCCAGGAAGTGGA А ACATCATGGCCGGCCTGCAGCAGACCAACAGCGAGAAGATCC TGCTGAGCTGGGTGCGCCAGAGCACCCGGAACTACCCCCAGG TCAACGTGATCAACTTCACCACCTCTTGGAGCGACGGCCTGG CCCTGAACGCCCTGATCCACAGCCACCGGCCCGACCTGTTCG ACTGGAACAGCGTGGTCTGCCAGCAGAGCGCCACCCAGCGGC TGGAACACGCCTTCAATATCGCCAGATACCAG CTGGGCATCG AGAAGCTGCTGGATCCCGAGGACGTGGACACCACCTACCCCG ACAAGAAATCCATCCTGATGTATATCACCAGCCTGTTCCAGGT GCTGCCCCAGGTGTCCATCGAGGCCATCCAGGAAGTGGA A 108 108 Шарнир 1 Hinge 1 ATGCTGCCCAGACCCCCCAAAGTGACCAAAGAGGAACACTTC CAGCTGCACCACCAGATGCACTACAGCCAGCAGATCACCGTG TCCCTGGCTCAGGGCTACGAGCGGACCAGCAGCCCCAAGCCC CGGTTCAAGAGCTACGCCTACACCCAGGCCGCCTACGTGACC ACCAGCGACCCCACCAGAAGCCCATTCCCCAGCCAGCATCTG GAAGCCCCCGAGGACAAGAGCTTCGGCAGCAGCCTGATGGA AAGC ATGCTGCCCAGACCCCCCAAAGTGACCAAAGAGGAACACTTC CAGCTGCACCACCAGATGCACTACAGCCAGCAGATCACCGTG TCCCTGGCTCAGGGCTACGAGCGGACCAGCAGCCCCAAGCCC CGGTTCAAGAGCTACGCCTACACCCAGGCCGCCTACGTGACC ACCAGCGACCCCACCAGAAGCCCATTCCCCAGCCAGCATCTG GAAGCCCCCGAGGACAAGAGCTTCGGCAGCAGC CTGATGGA AAGC 108 108 Спектрин -1 Spectrin -1 GAAGTGAACCTGGACAGATACCAGACCGCCCTGGAAGAGGT GCTGTCCTGGCTGCTGAGCGCCGAGGATACACTGCAGGCCCA GGGCGAGATCAGCAACGACGTGGAAGTGGTGAAAGACCAGT TCCACACCCACGAGGGCTACATGATGGACCTGACCGCCCACC AGGGCAGAGTGGGCAACATCCTGCAGCTGGGCAGCAAGCTG ATCGGCACCGGCAAGCTGAGCGAGGACGAAGAGACAGAGGT GCAGGAACAGATGAACCTGCTGAACAGCAGATGGGAGTGCCT GCGGGTGGCCAGCATGGAAAAGCAGAGCAACCTGCAC GAAGTGAACCTGGACAGATACCAGACCGCCCTGGAAGAGGT GCTGTCCTGGCTGCTGAGCGCCGAGGATACACTGCAGGCCCA GGGCGAGATCAGCAACGACGTGGAAGTGGTGAAAGACCAGT TCCACACCCACGAGGGCTACATGATGGACCTGACCGCCCACC AGGGCAGAGTGGGCAACATCCTGCAGCTGGGCAGCAAGCTG ATCGGCACCGGCAAGCTGAGCGAGGACGAA GAGACAGAGGT GCAGGAACAGATGAACCTGCTGAACAGCAGATGGGAGTGCCT GCGGGTGGCCAGCATGGAAAAGCAGAGCAACCTGCAC 110 110 LI LI ATCCACACCGTGCGGGAAGAGACAATGATGGTGATGACCGAG GACATGCCCCTGGAAATC ATCCACACCGTGCGGGAAGAGACAATGATGGTGATGACCGAG GACATGCCCCTGGAAATC 111 111 Спектрин -16 Spectrin -16 AGCTACGTGCCCAGCACCTACCTGACCGAGATCACCCACGTG TCCCAGGCTCTGCTGGAAGTGGAACAGCTGCTGAACGCCCCC GACCTGTGCGCCAAGGACTTCGAGGATCTGTTCAAGCAGGAA GAGAGCCTGAAGAATATCAAGGACTCCCTGCAGCAGTCCAGC GGCCGGATCGACATCATCCACAGCAAGAAAACAGCCGCCCTG CAGTCCGCCACCCCCGTGGAAAGAGTGAAGCTGCAGGAAGCC CTGAGCCAGCTGGACTTCCAGTGGGAGAAAGTGAACAAGATG TACAAGGACCGGCAGGGCAGATTCGACCGCAGC AGCTACGTGCCCAGCACCTACCTGACCGAGATCACCCACGTG TCCCAGGCTCTGCTGGAAGTGGAACAGCTGCTGAACGCCCCC GACCTGTGCGCCAAGGACTTCGAGGATCTGTTCAAGCAGGAA GAGAGCCTGAAGAATATCAAGGACTCCCTGCAGCAGTCCAGC GGCCGGATCGACATCATCCACAGCAAGAAAACAGCCGCCCTG CAGTCCGCCACCCCCGTGGAAAGAGTGAAG CTGCAGGAGCC CTGAGCCAGCTGGACTTCCAGTGGGAGAAAGTGAACAAGATG TACAAGGACCGGCAGGGCAGATTCGACCGCAGC 112 112 Спектрин -17 Spectrin -17 GTGGAAAAGTGGCGGCGGTTCCACTACGACATCAAGATCTTC AACCAGTGGCTGACCGAGGCCGAGCAGTTCCTGAGAAAGACC CAGATCCCCGAGAACTGGGAGCACGCCAAGTACAAGTGGTAT CTGAAAGAACTGCAGGATGGCATCGGCCAGCGGCAGACCGTG GTGCGCACACTGAATGCCACCGGCGAGGAAATCATCCAGCAG AGCAGCAAGACCGACGCCAGCATCCTGCAGGAAAAGCTGGG CTCCCTGAACCTGCGGTGGCAGGAAGTGTGCAAGCAGCTGAG CGACCGGAAGAAGAGGCTGGAAGAACAG GTGGAAAAGTGGCGGCGGTTCCACTACGACATCAAGATCTTC AACCAGTGGCTGACCGAGGCCGAGCAGTTCCTGAGAAAGACC CAGATCCCCGAGAACTGGGAGCACGCCAAGTACAAGTGGTAT CTGAAAGAACTGCAGGATGGCATCGGCCAGCGGCAGACCGTG GTGCGCACACTGAATGCCACCGGCGAGGAAATCATCCAGCAG AGCAGCAAGACCGACGCCAGCATCCTGCAGGAAAAG CTGGG CTCCCTGAACCTGCGGTGGCAGGAAGTGTGCAAGCAGCTGAG CGACCGGAAGAAGAGGCTGGAAGAACAG

- 41 046419- 41 046419

ИЗ FROM Шарнир 3 Hinge 3 GCCCCTGGCCTGACCACCATCGGCGCCAGCCCTACCCAGACC GTGACCCTGGTGACACAGCCCGTGGTGACAAAAGAGACAGCC ATCTCCAAGCTGGAAATGCCCAGCTCCCTGATGCTGGAA GCCCCTGGCCTGACCACCATCGGCGCCAGCCCTACCCAGACC GTGACCCTGGTGACACAGCCCGTGGTGACAAAAGAGACAGCC ATCTCCAAGCTGGAAATGCCCAGCTCCCTGATGCTGGAA 114 114 Спектрин -23 Spectrin -23 TCTGACCAGTGGAAGCGTCTGCACCTTTCTCTGCAGGAACTTC TGGTGTGGCTACAGCTGAAAGATGATGAATTAAGCCGGCAGG CACCTATTGGAGGCGACTTTCCAGCAGTTCAGAAGCAGAACG ATGTACATAGGGCCTTCAAGAGGGAATTGAAAACTAAAGAAC CTGTAATCATGAGTACTCTTGAGACTGTACGAATATTTCTGAC AGAGCAGCCTTTGGAAGGACTAGAGAAACTCTACCAGGAGCC CAGAGAGCTGCCTCCTGAGGAGAGAGCCCAGAATGTCACTCG GCTTCTACGAAAGCAGGCTGAGGAGGTCAATACTGAGTGGGA AAAATTGAACCTGCACTCCGCTGACTGGCAGAGAAAAATAGA TGAGACC TCTGACCAGTGGAAGCGTCTGCACCTTTCTCTGCAGGAACTTC TGGTGTGGCTACAGCTGAAAGATGATGAATTAAGCCGGCAGG CACCTATTGGAGGCGACTTTCCAGCAGTTCAGAAGCAGAACG ATGTACATAGGGCCTTCAAGAGGGAATTGAAAACTAAAGAAC CTGTAATCATGAGTACTCTTGAGACTGTACGAATATTTCTGAC AGAGCAGCCTTTGGAAGGACTAGAGAAACTCTAC CAGGAGCC CAGAGAGCTGCCTCCTGAGGAGAGAGCCCAGAATGTCACTCG GCTTCTACGAAAGCAGGCTGAGGAGGTCAATACTGAGTGGGA AAAATTGAACCTGCACTCCGCTGACTGGCAGAGAAAAATAGA TGAGACC 115 115 Спектрин -24 Spectrin -24 CTGGAAAGGCTGCAGGAACTGCAGGAGGCCACCGACGAGCT GGACCTGAAGCTGCGGCAGGCCGAAGTGATCAAGGGCAGCT GGCAGCCCGTGGGCGACCTGCTGATCGACAGCCTGCAGGACC ACCTGGAAAAAGTGAAGGCCCTGAGAGGCGAGATCGCCCCCC TGAAAGAAAACGTGTCCCACGTGAACGACCTGGCCCGGCAGC TGACCACCCTGGGCATCCAGCTGAGCCCCTACAACCTGAGCA CCCTGGAAGATCTGAACACCCGGTGGAAGCTGCTGCAGGTGG CCGTGGAAGATAGAGTGCGGCAGCTGCACGAG CTGGAAAGGCTGCAGGAACTGCAGGAGGCCACCGACGAGCT GGACCTGAAGCTGCGGCAGGCCGAAGTGATCAAGGGCAGCT GGCAGCCCGTGGGCGACCTGCTGATCGACAGCCTGCAGGACC ACCTGGAAAAAGTGAAGGCCCTGAGAGGCGAGATCGCCCCCC TGAAAGAAAACGTGTCCCACGTGAACGACCTGGCCCGGCAGC TGACCACCCTGGGCATCCAGCTGAGCCCCTACAA CCTGAGCA CCCTGGAAGATCTGAACACCCGGTGGAAGCTGCTGCAGGTGG CCGTGGAAGATAGAGTGCGGCAGCTGCACGAG 116 116 Шарнир 4 Hinge 4 GCCCACAGAGACTTTGGCCCTGCCAGCCAGCACTTCCTGAGC ACCTCTGTGCAGGGACCCTGGGAGAGAGCCATCAGCCCCAAC AAGGTGCCCTACTACATCAACCACGAGACACAGACCACCTGT GATGGTGACCACCCCAGCTACGACCGACGACCACCCCAGCTG ACGACCGACGACCACCCCAGCTGACGACCGAC GCCCACAGAGACTTTGGCCCTGCCAGCCAGCACTTCCTGAGC ACCTCTGTGCAGGGACCCTGGGAGAGAGCCATCAGCCCCAAC AAGGTGCCCTACTACATCAACCACGAGACACAGACCACCTGT GATGGTGACCACCCCAGCTACGACCGACGACCACCCCAGCTG ACGACCGACGACCACCCCAGCTGACGACCGAC 117 117 CR/Cконц CR/Cconc AGGCGGCTGCAGAAAGCTCTGTGCCTGGATCTGCTGAGCCTG AGCGCCGCCTGCGACGCCCTGGACCAGCACAACCTGAAGCAG AACGACCAGCCCATGGATATCCTGCAGATCATCAACTGCCTG ACCACAATCTACGACAGGCTGGAACAGGAACACAACAATCTG GTCAACGTGCCCCTGTGCGTGGACATGTGCCTGAATTGGCTGC TGAATGTGTACGACACCGGCCGGACCGGCAGAATCCGGGTGC TGAGCTTCAAGACCGGCATCATCAGCCTGTGCAAGGCCCACC TGGAAGATAAGTACCGCTACCTGTTCAAACAGGTGGCCAGCT CCACCGGCTTTTGCGACCAGCGGAGACTGGGCCTGCTGCTGC ACGACAGCATCCAGATCCCCAGACAGCTGGGCGAGGTGGCCT CCTTCGGCGGCAGCAACATTGAGCCCAGCGTGCGGAGCTGCT TCCAGTTCGCCAACAACAAGCCCGAGATCGAGGCCGCCCTGT TCCTGGACTGGATGAGACTGGAACCCCAGAGCATGGTGTGGC TGCCCGTGCTGCATCGGGTGGCCGCTGCCGAGACAGCCAAGC ACCAGGCCAAGTGCAACATCTGCAAAGAGTGCCCCATCATCG GCTTCCGGTACAGAAGCCTGAAGCACTTCAACTACGATATCT GCCAGAGCTGCTTCTTCAGCGGCAGAGTGGCCAAGGGCCACA AAATGCACTACCCCATGGTGGAATACTGCACCCCCACCACCA GCGGCGAGGATGTGCGGGACTTCGCCAAGGTGCTGAAAAACA AGTTCCGGACCAAGCGGTACTTTGCCAAGCACCCCCGGATGG GCTACCTGCCCGTGCAGACAGTGCTGGAAGGCGACAACATGG AGGCGGCTGCAGAAAGCTCTGTGCCTGGATCTGCTGAGCCTG AGCGCCGCCTGCGACGCCCTGGACCAGCACAACCTGAAGCAG AACGACCAGCCCATGGATATCCTGCAGATCATCAACTGCCTG ACCACAATCTACGACAGGCTGGAACAGGAACACAACAATCTG GTCAACGTGCCCCTGTGCGTGGACATGTGCCTGAATTGGCTGC TGAATGTGTACGACACCGGCCGGACCGGCAGA ATCCGGGTGC TGAGCTTCAAGACCGGCATCATCAGCCTGTGCAAGGCCCACC TGGAAGATAAGTACCGCTACCTGTTCAAACAGGTGGCCAGCT CCACCGGCTTTTGCGACCAGCGGAGACTGGGCCTGCTGCTGC ACGACAGCATCCAGATCCCCAGACAGCTGGGCGAGGTGGCCT CCTTCGGCGGCAGCAACATTGAGCCCAGCGTGCGGAGCTGCT TCCAGTTCGCCAACAACAAGCCC GAGATCGAGGCCGCCCTGT TCCTGGACTGGATGAGACTGGAACCCCAGAGCATGGTGTGGC TGCCCGTGCTGCATCGGGTGGCCGCTGCCGAGACAGCCAAGC ACCAGGCCAAGTGCAACATCTGCAAAGAGTGCCCCATCATCG GCTTCCGGTACAGAAGCCTGAAGCACTTCAACTACGATATCT GCCAGAGCTGCTTCTTCAGCGGCAGAGTGGCCAAGGGCCACA AAATGCACTACCCCAT GGTGGAATACTGCACCCCCACCACCA GCGGCGAGGATGTGCGGGACTTCGCCAAGGTGCTGAAAAACA AGTTCCGGACCAAGCGGTACTTTGCCAAGCACCCCCGGATGG GCTACCTGCCCGTGCAGACAGTGCTGGAAGGCGACAACATGG AAACCCCTGCCCAGATCCTGATCAGCCTGGAAAGCGAGGAAC GGGGCGAGCTGGAACGGATCCTGGCCGATCTGGAAGAGGAA AACCGGAACCTGCAGGCCGAGTACGACCGGCTGAAGCAGCA GCACGAGCACAAGGGCCTGAGCCCCCTGCCTAGCCCCCCTGA CACCATGTGA AAACCCCTGCCCAGATCCTGATCAGCCTGGAAAGCGAGGAAC GGGGCGAGCTGGAACGGATCCTGGCCGATCTGGAAGAGGAA AACCGGAACCTGCAGGCCGAGTACGACCGGCTGAAGCAGCA GCACGAGCACAAGGGCCTGAGCCCCCTGCCTAGCCCCCCTGA CACCATGTGA

Различные полипептиды миниатюризированного дистрофина по настоящему изобретению показаны в табл. 7.Various miniaturized dystrophin polypeptides of the present invention are shown in table. 7.

Таблица 7Table 7

Аминокислотные последовательности миниатюризированных конструкций дистрофинаAmino acid sequences of miniaturized dystrophin constructs

- 42 046419- 42 046419

SEQ ID NO и описание SEQ ID NO and description Последовательность Subsequence SEQ ID NO:118 - BXA- 196477 SEQ ID NO:118 - BXA- 196477 MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIENLFSDLQDG RRLLDLLEGLTGQKLPKEKGSTRVHALNNVNKALRVLQNNNVDLVNIG STDIVDGNHKLTLGLIWNIILHWQVKNVMKNIMAGLQQTNSEKILLSW VRQSTRNYPQVNVINFTTSWSDGLALNALIHSHRPDLFDWNSVVCQQS ATQRLEHAFNIARYQLGIEKLLDPEDVDTTYPDKKSILMYITSLFQVLPQ QVSIEAIQEVEMLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERTS SPKPRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSFGSSLMESEVN LDRYQTALEEVLSWLLSAEDTLQAQGEISNDVEVVKDQFHTHEGYMM DLTAHQGRVGNILQLGSKLIGTGKLSEDEETEVQEQMNLLNSRWECLR VASMEKQSNLHRVLLKWQRLTEEQCLFSAWLSEKEDAVNKIHTTGFKD QNEMLSSLQKLAVLKADLEKKKQSMGKLYSLKQDLLSTLKNKSVTQK TEAWLDNFARCWDNLVQKLEKSTAQISQAVTTTQPSLTQTTVMETVTT VTTREQILVKHAQEELPPPPPQKKRQITVDSEAQIHTVREETMMVMTED MPLEISYVPSTYLTEITHVSQALLEVEQLLNAPDLCAKDFEDLFKQEESL I<NII<DSLQQSSGRIDIIHSI<I<TAALQSATPVERVI<LQEALSQLDFQWEI< VNI<MYI<DRQGRFDRSVEI<WRRFHYDII<IFNQWLTEAEQFLRI<TQIPEN WEHAKYKWYLKELQDGIGQRQTVVRTLNATGEEIIQQSSKTDASILQE KLGSLNLRWQEVCKQLSDRKKRLEEQLERLQELQEATDELDLKLRQAE VII<GSWQPVGDLLIDSLQDHLEI<VI<ALRGEIAPLI<ENVSHVNDLARQLT TLGIQLSPYNLSTLEDLNTRWKLLQVAVEDRVRQLHEAHRDFGPASQH FLSTSVQGPWERAISPNKVPYYINHETQTTCWDHPKMTELYQSLADLN NVRFSAYRTAMKLRRLQKALCLDLLSLSAACDALDQHNLKQNDQPMD ILQIINCLTTIYDRLEQEHNNLVNVPLCVDMCLNWLLNVYDTGRTGRIR VLSFKTGIISLCKAHLEDKYRYLFKQVASSTGFCDQRRLGLLLHDSIQIP RQLGEVASFGGSNIEPSVRSCFQFANNKPEIEAALFLDWMRLEPQSMVW LPVLHRVAAAETAKHQAKCNICKECPIIGFRYRSLKHFNYDICQSCFFSG RVAKGHKMHYPMVEYCTPTTSGEDVRDFAKVLKNKFRTKRYFAKHPR MGYLPVQTVLEGDNMETDTM MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIENLFSDLQDG RRLLDLLEGLTGQKLPKEKGSTRVHALNNVNKALRVLQNNNVDLVNIG STDIVDGNHKLTLGLIWNIILHWQVKNVMKNIMAGLQQTNSEKILLSW VRQSTRNYPQVNVINFTTSWSDGLALNALIHSHRPDLFD WNSVVCQQS ATQRLEHAFNIARYQLGIEKLLDPEDVDTTYPDKKSILMYITSLFQVLPQ QVSIEAIQEVEMLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERTS SPKPRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSFGSSLMESEVN LDRYQTALEEVLSWLLSAEDTLQAQGEISNDVE VVKDQFHTHEGYMM DLTAHQGRVGNILQLGSKLIGTGKLSEDEETEVQEQMNLLNSRWECLR VASMEKQSNLHRVLLKWQRLTEEQCLFSAWLSEKEDAVNKIHTTGFKD QNEMLSSLQKLAVLKADLEKKKQSMGKLYSLKQDLLSTLKNKSVTQK TEAWLDNFARCWDNLVQKLEKSTAQIS QAVTTTQPSLTQTTVMETVTT VTTREQILVKHAQEELPPPPPQKKRQITVDSEAQIHTVREETMMVMTED MPLEISYVPSTYLTEITHVSQALLEVEQLLNAPDLCAKDFEDLFKQEESL I<NII<DSLQQSSGRIDIIHSI<I<TAALQSATPVERVI<LQEALSQLDFQWEI< VNI<MYI<DRQGRFDRSVEI <WRRFHYDII<IFNQWLTEAEQFLRI<TQIPEN WEHAKYKWYLKELQDGIGQRQTVVRTLNATGEEIIQQSSKTDASILQE KLGSLNLRWQEVCKQLSDRKKRLEEQLERLQELQEATDELDLKLRQAE VII<GSWQPVGDLLIDSLQDHLEI<VI<ALRGEIAPLI<ENVSHVNDLARQLT TLGI QLSPYNLSTLEDLNTRWKLLQVAVEDRVRQLHEAHRDFGPASQH FLSTSVQGPWERAISPNKVPYYINHETQTTCWDHPKMTELYQSLADLN NVRFSAYRTAMKLRRLQKALCLDLLSLSAACDALDQHNLKQNDQPMD ILQIINCLTTIYDRLEQEHNNLVNVPLCVDMCLNWLLNVYDTGRTGRIR VLSFKTGIISLCKAHLEDKYRYLFKQVASSTGFCDQRRLGLLLHDSIQIP RQLGEVASFGGSNIEPSVRSCFQFANNKPEIEAALFLDWMRLEPQSMVW LPVLHRVAAAET AKHQAKCNICKECPIIGFRYRSLKHFNYDICQSCFFSG RVAKGHKMHYPMVEYCTPTTSGEDVRDFAKVLKNKFRTKRYFAKHPR MGYLPVQTVLEGDNMETDTM SEQ ID NO:119 - SEQ ID NO:119 - MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIENLFSDLQDG RRLLDLLEGLTGQKLPKEKGSTRVHALNNVNKALRVLQNNNVDLVNIG STDIVDGNHKLTLGLIWNIILHWQVKNVMKNIMAGLQQTNSEKILLSW VRQSTRNYPQVNVINFTTSWSDGLALNALIHSHRPDLFDWNSVVCQQS ATQRLEHAFNIARYQLGIEKLLDPEDVDTTYPDKKSILMYITSLFQVLPQ MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIENLFSDLQDG RRLLDLLEGLTGQKLPKEKGSTRVHALNNVNKALRVLQNNNVDLVNIG STDIVDGNHKLTLGLIWNIILHWQVKNVMKNIMAGLQQTNSEKILLSW VRQSTRNYPQVNVINFTTSWSDGLALNALIHSHRPDLFD WNSVVCQQS ATQRLEHAFNIARYQLGIEKLLDPEDVDTTYPDKKSILMYITSLFQVLPQ

- 43 046419- 43 046419

BXA- 196473 BXA- 196473 QVSIEAIQEVEMLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERTS SPKPRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSFGSSLMESEVN LDRYQTALEEVLSWLLSAEDTLQAQGEISNDVEVVKDQFHTHEGYMM DLTAHQGRVGNILQLGSKLIGTGKLSEDEETEVQEQMNLLNSRWECLR VASMEKQSNLHLLKWQRLTEEQCLFSAWLSEKEDAVNKIHTTGFKDQ NEMLSSLQKLAVLKADLEKKKQSMGKLYSLKQDLLSTLKNKSVTQKT EAWLDNFARCWDNLVQKLEKSTAQISQAVTTTQPSLTQTTVMETVTTV TTREQILVKHAQEELPPPPPQKKRQITVDIHTVREETMMVMTEDMPLEIS YVPSTYLTEITHVSQALLEVEQLLNAPDLCAKDFEDLFKQEESLKNIKDS LQQSSGRIDIIHSKKTAALQSATPVERVKLQEALSQLDFQWEKVNKMY KDRQGRFDRSVEKWRRFHYDIKIFNQWLTEAEQFLRKTQIPENWEHAK YKWYLKELQDGIGQRQTVVRTLNATGEEIIQQSSKTDASILQEKLGSLN LRWQEVCKQLSDRKKRLEEQLERLQELQEATDELDLKLRQAEVIKGSW QPVGDLLIDSLQDHLEI<VI<ALRGEIAPLI<ENVSHVNDLARQLTTLGIQL SPYNLSTLEDLNTRWKLLQVAVEDRVRQLHEAHRDFGPASQHFLSTSV QGPWERAISPNKVPYYINHETQTTCWDHPKMTELYQSLADLNNVRFSA YRTAMKLRRLQKALCLDLLSLSAACDALDQHNLKQNDQPMDILQIINC LTTIYDRLEQEHNNLVNVPLCVDMCLNWLLNVYDTGRTGRIRVLSFKT GIISLCKAHLEDKYRYLFKQVASSTGFCDQRRLGLLLHDSIQIPRQLGEV ASFGGSNIEPSVRSCFQFANNKPEIEAALFLDWMRLEPQSMVWLPVLHR VAAAETAKHQAKCNICKECPIIGFRYRSLKHFNYDICQSCFFSGRVAKG HI<MHYPMVEYCTPTTSGEDVRDFAI<VLI<NI<FRTI<RYFAI<HPRMGYLP VQTVLEGDNMETDTM QVSIEAIQEVEMLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERTS SPKPRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSFGSSLMESEVN LDRYQTALEEVLSWLLSAEDTLQAQGEISNDVEVVKDQFHTHEGYMM DLTAHQGRVGNILQLGSKLIGTGKLSEDEETEVQEQMNLL NSRWECLR VASMEKQSNLHLLKWQRLTEEQCLFSAWLSEKEDAVNKIHTTGFKDQ NEMLSSLQKLAVLKADLEKKKQSMGKLYSLKQDLLSTLKNKSVTQKT EAWLDNFARCWDNLVQKLEKSTAQISQAVTTTQPSLTQTTVMETVTTV TTREQILVKHAQEELPPPPPQKKRQITVDIHTVREETMM VMTEDMPLEIS YVPSTYLTEITHVSQALLEVEQLLNAPDLCAKDFEDLFKQEESLKNIKDS LQQSSGRIDIIHSKKTAALQSATPVERVKLQEALSQLDFQWEKVNKMY KDRQGRFDRSVEKWRRFHYDIKIFNQWLTEAEQFLRKTQIPENWEHAK YKWYLKELQDGIGQRQTVVRTLNATGEEIIQQSS KTDASILQEKLGSLN LRWQEVCKQLSDRKKRLEEQLERLQELQEATDELDLKLRQAEVIKGSW QPVGDLLIDSLQDHLEI<VI<ALRGEIAPLI<ENVSHVNDLARQLTTLGIQL SPYNLSTLEDLNTRWKLLQVAVEDRVRQLHEAHRDFGPASQHFLSTSV QGPWERAISPNKVPYYINHETQTTCWDHPK MTELYQSLADLNNVRFSA YRTAMKLRRLQKALCLDLLSLSAACDALDQHNLKQNDQPMDILQIINC LTTIYDRLEQEHNNLVNVPLCVDMCLNWLLNVYDTGRTGRIRVLSFKT GIISLCKAHLEDKYRYLFKQVASSTGFCDQRRLGLLLHDSIQIPRQLGEV ASFGGSNIEPSVRSCFQFANNKPEIEAALFLDWMRLEPQ SMVWLPVLHR VAAAETAKHQAKCNICKECPIIGFRYRSLKHFNYDICQSCFFSGRVAKG HI<MHYPMVEYCTPTTSGEDVRDFAI<VLI<NI<FRTI<RYFAI<HPRMGYLP VQTVLEGDNMETDTM SEQ ID NO: 120 - BXA- 196474 SEQ ID NO: 120 - BXA- 196474 MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIENLFSDLQDG RRLLDLLEGLTGQKLPKEKGSTRVHALNNVNKALRVLQNNNVDLVNIG STDIVDGNHKLTLGLIWNIILHWQVKNVMKNIMAGLQQTNSEKILLSW VRQSTRNYPQVNVINFTTSWSDGLALNALIHSHRPDLFDWNSVVCQQS ATQRLEHAFNIARYQLGIEKLLDPEDVDTTYPDKKSILMYITSLFQVLPQ QVSIEAIQEVEMLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERTS SPKPRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSFGSSLMESEVN LDRYQTALEEVLSWLLSAEDTLQAQGEISNDVEVVKDQFHTHEGYMM DLTAHQGRVGNILQLGSKLIGTGKLSEDEETEVQEQMNLLNSRWECLR VASMEKQSNLHLLKWQRLTEEQCLFSAWLSEKEDAVNKIHTTGFKDQ NEMLSSLQKLAVLKADLEKKKQSMGKLYSLKQDLLSTLKNKSVTQKT EAWLDNFARCWDNLVQKLEKSTAQISQAVTTTQPSLTQTTVMETVTTV TTREQILVKHAQEELPPPPPQKKRQITVDSEAQIHTVREETMMVMTEDM PLEISYVPSTYLTEITHVSQALLEVEQLLNAPDLCAKDFEDLFKQEESLK NIKDSLQQSSGRroilHSKKTAALQSATPVERVKLQEALSQLDFQWEKV NKMYKDRQGRFDRSVEKWRRFHYDIKIFNQWLTEAEQFLRKTQIPENW EHAKYKWYLKELQDGIGQRQTVVRTLNATGEEIIQQSSKTDASILQEKL GSLNLRWQEVCKQLSDRKKRLEEQKNILQELQEATDELDLKLRQAEVI I<GSWQPVGDLLIDSLQDHLEI<VI<ALRGEIAPLI<ENVSHVNDLARQLTT LGIQLSPYNLSTLEDLNTRWKLLQVAVEDRVRQLHEAHRDFGPASQHF LSTSVQGPWERAISPNKVPYYINHETQTTCWDHPKMTELYQSLADLNN VRFSAYRTAMKLRRLQKALCLDLLSLSAACDALDQHNLKQNDQPMDI LQIINCLTTIYDRLEQEHNNLVNVPLCVDMCLNWLLNVYDTGRTGRIRV LSFKTGIISLCKAHLEDKYRYLFKQVASSTGFCDQRRLGLLLHDSIQIPR QLGEVASFGGSNIEPSVRSCFQFANNKPEIEAALFLDWMRLEPQSMVWL PVLHRVAAAETAKHQAKCNICKECPIIGFRYRSLKHFNYDICQSCFFSGR VAI<GHI<MHYPMVEYCTPTTSGEDVRDFAI<VLI<NI<FRTI<RYFAI<HPR MGYLPVQTVLEGDNMETTPCDDDLGRAMESLVSVMTDEEGAE MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIENLFSDLQDG RRLLDLLEGLTGQKLPKEKGSTRVHALNNVNKALRVLQNNNVDLVNIG STDIVDGNHKLTLGLIWNIILHWQVKNVMKNIMAGLQQTNSEKILLSW VRQSTRNYPQVNVINFTTSWSDGLALNALIHSHRPDLFD WNSVVCQQS ATQRLEHAFNIARYQLGIEKLLDPEDVDTTYPDKKSILMYITSLFQVLPQ QVSIEAIQEVEMLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERTS SPKPRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSFGSSLMESEVN LDRYQTALEEVLSWLLSAEDTLQAQGEISNDVE VVKDQFHTHEGYMM DLTAHQGRVGNILQLGSKLIGTGKLSEDEETEVQEQMNLLNSRWECLR VASMEKQSNLHLLKWQRLTEEQCLFSAWLSEKEDAVNKIHTTGFKDQ NEMLSSLQKLAVLKADLEKKKQSMGKLYSLKQDLLSTLKNKSVTQKT EAWLDNFARCWDNLVQKLEKSTAQISQ AVTTTQPSLTQTTVMETVTTV TTREQILVKHAQEELPPPPPQKKRQITVDSEAQIHTVREETMMVMTEDM PLEISYVPSTYLTEITHVSQALLEVEQLLNAPDLCAKDFEDLFKQEESLK NIKDSLQQSSGRroilHSKKTAALQSATPVERVKLQEALSQLDFQWEKV NKMYKDRQGRFDRSVEKWRRFHYDI KIFNQWLTEAEQFLRKTQIPENW EHAKYKWYLKELQDGIGQRQTVVRTLNATGEEIIQQSSKTDASILQEKL GSLNLRWQEVCKQLSDRKKRLEEQKNILQELQEATDELDLKLRQAEVI I<GSWQPVGDLLIDSLQDHLEI<VI<ALRGEIAPLI<ENVSHVNDLARQLTT LGIQLSPY NLSTLEDLNTRWKLLQVAVEDRVRQLHEAHRDFGPASQHF LSTSVQGPWERAISPNKVPYYINHETQTTCWDHPKMTELYQSLADLNN VRFSAYRTAMKLRRLQKALCLDLLSLSAACDALDQHNLKQNDQPMDI LQIINCLTTIYDRLEQEHNNLVNVPLCVDMCLNWLLNVYDTGRTGRIRV LSFKTGIISLCKAHLEDKYRYLF KQVASSTGFCDQRRLGLLLHDSIQIPR QLGEVASFGGSNIEPSVRSCFQFANNKPEIEAALFLDWMRLEPQSMVWL PVLHRVAAAETAKHQAKCNICKECPIIGFRYRSLKHFNYDICQSCFFSGR VAI<GHI<MHYPMVEYCTPTTSGEDVRDFAI<VLI<NI<FRTI<RYFAI<HPR MGYLPVQTVLEGDNME TTPCDDDLGRAMESLVSVMTDEEGAE

- 44 046419- 44 046419

SEQ ID NO:121 - BXA- 196475 SEQ ID NO:121 - BXA- 196475 MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIENLFSDLQDG RRLLDLLEGLTGQKLPKEKGSTRVHALNNVNKALRVLQNNNVDLVNIG STDIVDGNHKLTLGLIWNIILHWQVKNVMKNIMAGLQQTNSEKILLSW VRQSTRNYPQVNVINFTTSWSDGLALNALIHSHRPDLFDWNSVVCQQS ATQRLEHAFNIARYQLGIEKLLDPEDVDTTYPDKKSILMYITSLFQVLPQ QVSIEAIQEVEMLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERTS SPKPRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSFGSSLMESEVN LDRYQTALEEVLSWLLSAEDTLQAQGEISNDVEVVKDQFHTHEGYMM DLTAHQGRVGNILQLGSKLIGTGKLSEDEETEVQEQMNLLNSRWECLR VASMEKQSNLHLLKWQRLTEEQCLFSAWLSEKEDAVNKIHTTGFKDQ NEMLSSLQKLAVLKADLEKKKQSMGKLYSLKQDLLSTLKNKSVTQKT EAWLDNFARCWDNLVQKLEKSTAQISQAVTTTQPSLTQTTVMETVTTV TTREQILVKHAQEELPPPPPQKKRQITVDSEAQIHTVREETMMVMTEDM PLEISYVPSTYLTEITHVSQALLEVEQLLNAPDLCAKDFEDLFKQEESLK NII<DSLQQSSGRIDIIHSI<I<TAALQSATPVERVI<LQEALSQLDFQWEI<V NI<MYI<DRQGRFDRSVEI<WRRFHYDII<IFNQWLTEAEQFLRI<TQIPENW EHAKYKWYLKELQDGIGQRQTVVRTLNATGEEIIQQSSKTDASILQEKL GSLNLRWQEVCKQLSDRKKRLEEQKLERLQELQEATDELDLKLRQAEV II<GSWQPVGDLLIDSLQDHLEI<VI<ALRGEIAPLI<ENVSHVNDLARQLTT LGIQLSPYNLSTLEDLNTRWKLLQVAVEDRVRQLHEAHRDFGPASQHF LSTSVQGPWERAISPNKVPYYINHETQTTCWDHPKMTELYQSLADLNN VRFSAYRTAMKLRRLQKALCLDLLSLSAACDALDQHNLKQNDQPMDI LQIINCLTTIYDRLEQEHNNLVNVPLCVDMCLNWLLNVYDTGRTGRIRV LSFKTGIISLCKAHLEDKYRYLFKQVASSTGFCDQRRLGLLLHDSIQIPR QLGEVASFGGSNIEPSVRSCFQFANNKPEIEAALFLDWMRLEPQSMVWL PVLHRVAAAETAKHQAKCNICKECPIIGFRYRSLKHFNYDICQSCFFSGR VAI<GHI<MHYPMVEYCTPTTSGEDVRDFAI<VLI<NI<FRTI<RYFAI<HPR MGYLPVQTVLEGDNMETDTM MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIENLFSDLQDG RRLLDLLEGLTGQKLPKEKGSTRVHALNNVNKALRVLQNNNVDLVNIG STDIVDGNHKLTLGLIWNIILHWQVKNVMKNIMAGLQQTNSEKILLSW VRQSTRNYPQVNVINFTTSWSDGLALNALIHSHRPDLFD WNSVVCQQS ATQRLEHAFNIARYQLGIEKLLDPEDVDTTYPDKKSILMYITSLFQVLPQ QVSIEAIQEVEMLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERTS SPKPRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSFGSSLMESEVN LDRYQTALEEVLSWLLSAEDTLQAQGEISNDVE VVKDQFHTHEGYMM DLTAHQGRVGNILQLGSKLIGTGKLSEDEETEVQEQMNLLNSRWECLR VASMEKQSNLHLLKWQRLTEEQCLFSAWLSEKEDAVNKIHTTGFKDQ NEMLSSLQKLAVLKADLEKKKQSMGKLYSLKQDLLSTLKNKSVTQKT EAWLDNFARCWDNLVQKLEKSTAQISQ AVTTTQPSLTQTTVMETVTTV TTREQILVKHAQEELPPPPPQKKRQITVDSEAQIHTVREETMMVMTEDM PLEISYVPSTYLTEITHVSQALLEVEQLLNAPDLCAKDFEDLFKQEESLK NII<DSLQQSSGRIDIIHSI<I<TAALQSATPVERVI<LQEALSQLDFQWEI<V NI<MYI<DRQGRFDRSVEI <WRRFHYDII<IFNQWLTEAEQFLRI<TQIPENW EHAKYKWYLKELQDGIGQRQTVVRTLNATGEEIIQQSSKTDASILQEKL GSLNLRWQEVCKQLSDRKKRLEEQKLERLQELQEATDELDLKLRQAEV II<GSWQPVGDLLIDSLQDHLEI<VI<ALRGEIAPLI<ENVSHVNDLARQLTT LGIQLSPYNLSTLEDLNTRWKLLQVAVEDRVRQLHEAHRDFGPASQHF LSTSVQGPWERAISPNKVPYYINHETQTTCWDHPKMTELYQSLADLNN VRFSAYRTAMKLRRLQKALCLDLLSLSAACDALDQHNLKQNDQPMDI V AI<GHI<MHYPMVEYCTPTTSGEDVRDFAI<VLI<NI<FRTI<RYFAI<HPR MGYLPVQTVLEGDNMETDTM SEQ ID NO: 122 - BXA- 196476 SEQ ID NO: 122 - BXA- 196476 MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIENLFSDLQDG RRLLDLLEGLTGQKLPKEKGSTRVHALNNVNKALRVLQNNNVDLVNIG STDIVDGNHKLTLGLIWNIILHWQVKNVMKNIMAGLQQTNSEKILLSW VRQSTRNYPQVNVINFTTSWSDGLALNALIHSHRPDLFDWNSVVCQQS ATQRLEHAFNIARYQLGIEKLLDPEDVDTTYPDKKSILMYITSLFQVLPQ QVSIEAIQEVEMLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERTS SPKPRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSFGSSLMESEVN LDRYQTALEEVLSWLLSAEDTLQAQGEISNDVEVVKDQFHTHEGYMM DLTAHQGRVGNILQLGSKLIGTGKLSEDEETEVQEQMNLLNSRWECLR VASMEKQSNLHLLKWQRLTEEQCLFSAWLSEKEDAVNKIHTTGFKDQ NEMLSSLQKLAVLKADLEKKKQSMGKLYSLKQDLLSTLKNKSVTQKT EAWLDNFARCWDNLVQKLEKSTAQISQAVTTTQPSLTQTTVMETVTTV TTREQILVKHAQEELPPPPPQKKRQITVDSEAQIHTVREETMMVMTEDM PLEISYVPSTYLTEITHVSQALLEVEQLLNAPDLCAKDFEDLFKQEESLK NII<DSLQQSSGRIDIIHSI<I<TAALQSATPVERVI<LQEALSQLDFQWEI<V NI<MYI<DRQGRFDRSVEI<WRRFHYDII<IFNQWLTEAEQFLRI<TQIPENW EHAKYKWYLKELQDGIGQRQTVVRTLNATGEEIIQQSSKTDASILQEKL GSLNLRWQEVCKQLSDRKKRLEEQKNILERLQELQEATDELDLKLRQA EVII<GSWQPVGDLLIDSLQDHLEI<VI<ALRGEIAPLI<ENVSHVNDLARQL TTLGIQLSPYNLSTLEDLNTRWKLLQVAVEDRVRQLHEAHRDFGPASQ HFLSTSVQGPWERAISPNKVPYYINHETQTTCWDHPKMTELYQSLADL NNVRFSAYRTAMKLRRLQKALCLDLLSLSAACDALDQHNLKQNDQPM DILQIINCLTTIYDRLEQEHNNLVNVPLCVDMCLNWLLNVYDTGRTGRI MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIENLFSDLQDG RRLLDLLEGLTGQKLPKEKGSTRVHALNNVNKALRVLQNNNVDLVNIG STDIVDGNHKLTLGLIWNIILHWQVKNVMKNIMAGLQQTNSEKILLSW VRQSTRNYPQVNVINFTTSWSDGLALNALIHSHRPDLFD WNSVVCQQS ATQRLEHAFNIARYQLGIEKLLDPEDVDTTYPDKKSILMYITSLFQVLPQ QVSIEAIQEVEMLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERTS SPKPRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSFGSSLMESEVN LDRYQTALEEVLSWLLSAEDTLQAQGEISNDVE VVKDQFHTHEGYMM DLTAHQGRVGNILQLGSKLIGTGKLSEDEETEVQEQMNLLNSRWECLR VASMEKQSNLHLLKWQRLTEEQCLFSAWLSEKEDAVNKIHTTGFKDQ NEMLSSLQKLAVLKADLEKKKQSMGKLYSLKQDLLSTLKNKSVTQKT EAWLDNFARCWDNLVQKLEKSTAQISQ AVTTTQPSLTQTTVMETVTTV TTREQILVKHAQEELPPPPPQKKRQITVDSEAQIHTVREETMMVMTEDM PLEISYVPSTYLTEITHVSQALLEVEQLLNAPDLCAKDFEDLFKQEESLK NII<DSLQQSSGRIDIIHSI<I<TAALQSATPVERVI<LQEALSQLDFQWEI<V NI<MYI<DRQGRFDRSVEI <WRRFHYDII<IFNQWLTEAEQFLRI<TQIPENW EHAKYKWYLKELQDGIGQRQTVVRTLNATGEEIIQQSSKTDASILQEKL GSLNLRWQEVCKQLSDRKKRLEEQKNILERLQELQEATDELDLKLRQA EVII<GSWQPVGDLLIDSLQDHLEI<VI<ALRGEIAPLI<ENVSHVNDLARQL TTLGIQLSPYNLSTLEDLNTRWKLLQVAVEDRVRQLHEAHRDFGPASQ HFLSTSVQGPWERAISPNKVPYYINHETQTTCWDHPKMTELYQSLADL NNVRFSAYRTAMKLRRLQKALCLDLLSLSAACDALDQHNLKQNDQPM DILQIINCLTTIYDRLEQEHNNLVNVPLCVDMCLNWLLNVYDTGRTGRI

- 45 046419- 45 046419

RVLSFKTGIISLCKAHLEDKYRYLFKQVASSTGFCDQRRLGLLLHDSIQI PRQLGEVASFGGSNIEPSVRSCFQFANNKPEIEAALFLDWMRLEPQSMV WLPVLHRVAAAETAKHQAKCNICKECPIIGFRYRSLKHFNYDICQSCFFS GRVAKGHKMHYPMVEYCTPTTSGEDVRDFAKVLKNKFRTKRYFAKHP RMGYLPVQTVLEGDNMETDTM RVLSFKTGIISLCKAHLEDKYRYLFKQVASSTGFCDQRRLGLLLHDSIQI PRQLGEVASFGGSNIEPSVRSCFQFANNKPEIEAALFLDWMRLEPQSMV WLPVLHRVAAAETAKHQAKCNICKECPIIGFRYRSLKHFNYDICQSCFFS GRVAKGHKMHYPMVEYCTPTTSGEDVRDFAKVLKNKFRTKRYFAKHP R MGYLPVQTVLEGDNMETDTM SEQ ID NO: 123 - BXA196477-Q SEQ ID NO: 123 - BXA196477-Q MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIENLFSDLQDG RRLLDLLEGLTGQKLPKEKGSTRVHALNNVNKALRVLQNNNVDLVNIG STDIVDGNHKLTLGLIWNIILHWQVKNVMKNIMAGLQQTNSEKILLSW VRQSTRNYPQVNVINFTTSWSDGLALNALIHSHRPDLFDWNSVVCQQS ATQRLEHAFNIARYQLGIEKLLDPEDVDTTYPDKKSILMYITSLFQVLPQ QVSIEAIQEVEMLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERTS SPKPRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSFGSSLMESEVN LDRYQTALEEVLSWLLSAEDTLQAQGEISNDVEVVKDQFHTHEGYMM DLTAHQGRVGNILQLGSKLIGTGKLSEDEETEVQEQMNLLNSRWECLR VASMEKQSNLHRVLLKWQRLTEEQCLFSAWLSEKEDAVNKIHTTGFKD QNEMLSSLQKLAVLKADLEKKKQSMGKLYSLKQDLLSTLKNKSVTQK TEAWLDNFARCWDNLVQKLEKSTAQISQAVTTTQPSLTQTTVMETVTT VTTREQILVKHAQEELPPPPPQKKRQITVDSEAQIHTVREETMMVMTED MPLEISYVPSTYLTEITHVSQALLEVEQLLNAPDLCAKDFEDLFKQEESL I<NII<DSLQQSSGRIDIIHSI<I<TAALQSATPVERVI<LQEALSQLDFQWEI< VNI<MYI<DRQGRFDRSVEI<WRRFHYDII<IFNQWLTEAEQFLRI<TQIPEN WEHAKYKWYLKELQDGIGQRQTVVRTLNATGEEIIQQSSKTDASILQE KLGSLNLRWQEVCKQLSDRKKRLEEQLERLQELQEATDELDLKLRQAE VII<GSWQPVGDLLIDSLQDHLEI<VI<ALRGEIAPLI<ENVSHVNDLARQLT TLGIQLSPYNLSTLEDLNTRWKLLQVAVEDRVRQLHEAHRDFGPASQH FLSTSVQGPWERAISPNKVPYYINHETQTTCWDHPKMTELYQSLADLN NVRFSAYRTAMKLRRLQKALCLDLLSLSAACDALDQHNLKQNDQPMD ILQIINCLTTIYDRLEQEHNNLVNVPLCVDMCLNWLLNVYDTGRTGRIR VLSFKTGIISLCKAHLEDKYRYLFKQVASSTGFCDQRRLGLLLHDSIQIP RQLGEVASFGGSNIEPSVRSCFQFANNKPEIEAALFLDWMRLEPQSMVW LPVLHRVAAAETAKHQAKCNICKECPIIGFRYRSLKHFNYDICQSCFFSG RVAKGHKMHYPMVEYCTPTTSGEDVRDFAKVLKNKFRTKRYFAKHPR MGYLPVQTVLEGDNMETDTM MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIENLFSDLQDG RRLLDLLEGLTGQKLPKEKGSTRVHALNNVNKALRVLQNNNVDLVNIG STDIVDGNHKLTLGLIWNIILHWQVKNVMKNIMAGLQQTNSEKILLSW VRQSTRNYPQVNVINFTTSWSDGLALNALIHSHRPDLFD WNSVVCQQS ATQRLEHAFNIARYQLGIEKLLDPEDVDTTYPDKKSILMYITSLFQVLPQ QVSIEAIQEVEMLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERTS SPKPRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSFGSSLMESEVN LDRYQTALEEVLSWLLSAEDTLQAQGEISNDVE VVKDQFHTHEGYMM DLTAHQGRVGNILQLGSKLIGTGKLSEDEETEVQEQMNLLNSRWECLR VASMEKQSNLHRVLLKWQRLTEEQCLFSAWLSEKEDAVNKIHTTGFKD QNEMLSSLQKLAVLKADLEKKKQSMGKLYSLKQDLLSTLKNKSVTQK TEAWLDNFARCWDNLVQKLEKSTAQIS QAVTTTQPSLTQTTVMETVTT VTTREQILVKHAQEELPPPPPQKKRQITVDSEAQIHTVREETMMVMTED MPLEISYVPSTYLTEITHVSQALLEVEQLLNAPDLCAKDFEDLFKQEESL I<NII<DSLQQSSGRIDIIHSI<I<TAALQSATPVERVI<LQEALSQLDFQWEI< VNI<MYI<DRQGRFDRSVEI <WRRFHYDII<IFNQWLTEAEQFLRI<TQIPEN WEHAKYKWYLKELQDGIGQRQTVVRTLNATGEEIIQQSSKTDASILQE KLGSLNLRWQEVCKQLSDRKKRLEEQLERLQELQEATDELDLKLRQAE VII<GSWQPVGDLLIDSLQDHLEI<VI<ALRGEIAPLI<ENVSHVNDLARQLT TLGI QLSPYNLSTLEDLNTRWKLLQVAVEDRVRQLHEAHRDFGPASQH FLSTSVQGPWERAISPNKVPYYINHETQTTCWDHPKMTELYQSLADLN NVRFSAYRTAMKLRRLQKALCLDLLSLSAACDALDQHNLKQNDQPMD ILQIINCLTTIYDRLEQEHNNLVNVPLCVDMCLNWLLNVYDTGRTGRIR VLSFKTGIISLCKAHLEDKYRYLFKQVASSTGFCDQRRLGLLLHDSIQIP RQLGEVASFGGSNIEPSVRSCFQFANNKPEIEAALFLDWMRLEPQSMVW LPVLHRVAAAET AKHQAKCNICKECPIIGFRYRSLKHFNYDICQSCFFSG RVAKGHKMHYPMVEYCTPTTSGEDVRDFAKVLKNKFRTKRYFAKHPR MGYLPVQTVLEGDNMETDTM SEQ ID NO: 124 - BXA- 196478 SEQ ID NO: 124 - BXA- 196478 MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIENLFSDLQDG RRLLDLLEGLTGQKLPKEKGSTRVHALNNVNKALRVLQNNNVDLVNIG STDIVDGNHKLTLGLIWNIILHWQVKNVMKNIMAGLQQTNSEKILLSW VRQSTRNYPQVNVINFTTSWSDGLALNALIHSHRPDLFDWNSVVCQQS ATQRLEHAFNIARYQLGIEKLLDPEDVDTTYPDKKSILMYITSLFQVLPQ QVSIEAIQEVEMLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERTS SPKPRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSFGSSLMESEVN LDRYQTALEEVLSWLLSAEDTLQAQGEISNDVEVVKDQFHTHEGYMM DLTAHQGRVGNILQLGSKLIGTGKLSEDEETEVQEQMNLLNSRWECLR VASMEKQSNLHRVLLQDILLKWQRLTEEQCLFSAWLSEKEDAVNKIHT TGFKDQNEMLSSLQKLAVLKADLEKKKQSMGKLYSLKQDLLSTLKNK SVTQKTEAWLDNFARCWDNLVQKLEKSTAQISQAVTTTQPSLTQTTVM ETVTTVTTREQILVKHAQEELPPPPPQKKRQITVDSEAQIHTVREETMM VMTEDMPLEISYVPSTYLTEITHVSQALLEVEQLLNAPDLCAKDFEDLF I<QEESLI<NII<DSLOQSSGRIDIIHSI<I<TAALOSATPVERVI<LQEALSQLD FQWEI<VNI<MYI<DRQGRFDRSVEI<WRRFHYDII<IFNQWLTEAEQFLRI< TQIPENWEHAKYKWYLKELQDGIGQRQTVVRTLNATGEEIIQQSSKTD ASILQEKLGSLNLRWQEVCKQLSDRKKRLEEQLERLQELQEATDELDL MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIENLFSDLQDG RRLLDLLEGLTGQKLPKEKGSTRVHALNNVNKALRVLQNNNVDLVNIG STDIVDGNHKLTLGLIWNIILHWQVKNVMKNIMAGLQQTNSEKILLSW VRQSTRNYPQVNVINFTTSWSDGLALNALIHSHRPDLFD WNSVVCQQS ATQRLEHAFNIARYQLGIEKLLDPEDVDTTYPDKKSILMYITSLFQVLPQ QVSIEAIQEVEMLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERTS SPKPRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSFGSSLMESEVN LDRYQTALEEVLSWLLSAEDTLQAQGEISNDVE VVKDQFHTHEGYMM DLTAHQGRVGNILQLGSKLIGTGKLSEDEETEVQEQMNLLNSRWECLR VASMEKQSNLHRVLLQDILLKWQRLTEEQCLFSAWLSEKEDAVNKIHT TGFKDQNEMLSSLQKLAVLKADLEKKKQSMGKLYSLKQDLLSTLKNK SVTQKTEAWLDNFARCWDNLVQKLEKSTA QISQAVTTTQPSLTQTTVM ETVTTVTTREQILVKHAQEELPPPPPQKKRQITVDSEAQIHTVREETMM VMTEDMPLEISYVPSTYLTEITHVSQALLEVEQLLNAPDLCAKDFEDLF I<QEESLI<NII<DSLOQSSGRIDIIHSI<I<TAALOSATPVERVI<LQEALSQLD FQWEI<VNI<MYI<DRQGR FDRSVEI<WRRFHYDII<IFNQWLTEAEQFLRI< TQIPENWEHAKYKWYLKELQDGIGQRQTVVRTLNATGEEIIQQSSKTD ASILQEKLGSLNLRWQEVCKQLSDRKKRLEEQLERLQELQEATDELDL

- 46 046419- 46 046419

I<LRQAEVII<GSWQPVGDLLIDSLQDHLEI<VI<ALRGEIAPLI<ENVSHVN DLARQLTTLGIQLSPYNLSTLEDLNTRWKLLQVAVEDRVRQLHEAHRD FGPASQHFLSTSVQGPWERAISPNKVPYYINHETQTTCWDHPKMTELYQ SLADLNNVRFSAYRTAMKLRRLQKALCLDLLSLSAACDALDQHNLKQ NDQPMDILQIINCLTTIYDRLEQEHNNLVNVPLCVDMCLNWLLNVYDT GRTGRIRVLSFKTGIISLCKAHLEDKYRYLFKQVASSTGFCDQRRLGLLL HDSIQIPRQLGEVASFGGSNIEPSVRSCFQFANNKPEIEAALFLDWMRLE PQSMVWLPVLHRVAAAETAKHQAKCNICKECPIIGFRYRSLKHFNYDIC QSCFFSGRVAKGHKMHYPMVEYCTPTTSGEDVRDFAKVLKNKFRTKR YFAKHPRMGYLPVQTVLEGDNMETDTM I<LRQAEVII<GSWQPVGDLLIDSLQDHLEI<VI<ALRGEIAPLI<ENVSHVN DLARQLTTLGIQLSPYNLSTLEDLNTRWKLLQVAVEDRVRQLHEAHRD FGPASQHFLSTSVQGPWERAISPNKVPYYINHETQTTCWDHPKMTELYQ SLADLNNVRFSAYRTAMKLRRLQKALCLDLLSLSAACDALDQHNLKQ NDQPMDILQIINCLTTIYDRLEQEHNNLVNVPLCVDMCLNWLLNVYDT GRTGRIRVLSFKTGIISLCKAHLEDKYRYLFKQVASSTGFCDQRRLGLLL HDSIQIPRQLGEVASFGGSNIEPSVRSCFQFANNKPEIEAALFLDWMRLE PQSMVWLPVLHRVAAAETAKHQAKCNICKECPIIGFRYRSLKHFNYDIC QSCFF SGRVAKGHKMHYPMVEYCTPTTSGEDVRDFAKVLKNKFRTKR YFAKHPRMGYLPVQTVLEGDNMETDTM SEQ ID NO: 125 - BXA- 196479 SEQ ID NO: 125 - BXA- 196479 MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIENLFSDLQDG RRLLDLLEGLTGQKLPKEKGSTRVHALNNVNKALRVLQNNNVDLVNIG STDIVDGNHKLTLGLIWNIILHWQVKNVMKNIMAGLQQTNSEKILLSW VRQSTRNYPQVNVINFTTSWSDGLALNALIHSHRPDLFDWNSVVCQQS ATQRLEHAFNIARYQLGIEKLLDPEDVDTTYPDKKSILMYITSLFQVLPQ QVSIEAIQEVEMLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERTS SPKPRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSFGSSLMESEVN LDRYQTALEEVLSWLLSAEDTLQAQGEISNDVEVVKDQFHTHEGYMM DLTAHQGRVGNILQLGSKLIGTGKLSEDEETEVQEQMNLLNSRWECLR VASMEKQSNLHLLKWQRLTEEQCLFSAWLSEKEDAVNKIHTTGFKDQ NEMLSSLQKLAVLKADLEKKKQSMGKLYSLKQDLLSTLKNKSVTQKT EAWLDNFARCWDNLVQKLEKSTAQISQAVTTTQPSLTQTTVMETVTTV TTREQILVKHAQEELPPPPPQKKRQITVDSEAQIHTVREETMMVMTEDM PLEISYVPSTYLTEITHVSQALLEVEQLLNAPDLCAKDFEDLFKQEESLK NII<DSLQQSSGRIDIIHSI<I<TAALQSATPVERVI<LQEALSQLDFQWEI<V NI<MYI<DRQGRFDRSVEI<WRRFHYDII<IFNQWLTEAEQFLRI<TQIPENW EHAKYKWYLKELQDGIGQRQTVVRTLNATGEEIIQQSSKTDASILQEKL GSLNLRWQEVCKQLSDRKKRLEEQLERLQELQEATDELDLKLRQAEVI I<GSWQPVGDLLIDSLQDHLEI<VI<ALRGEIAPLI<ENVSHVNDLARQLTT LGIQLSPYNLSTLEDLNTRWKLLQVAVEDRVRQLHEAHRDFGPASQHF LSTSVQGPWERAISPNKVPYYINHETQTTCWDHPKMTELYQSLADLNN VRFSAYRTAMKLRRLQKALCLDLLSLSAACDALDQHNLKQNDQPMDI LQIINCLTTIYDRLEQEHNNLVNVPLCVDMCLNWLLNVYDTGRTGRIRV LSFKTGIISLCKAHLEDKYRYLFKQVASSTGFCDQRRLGLLLHDSIQIPR QLGEVASFGGSNIEPSVRSCFQFANNKPEIEAALFLDWMRLEPQSMVWL PVLHRVAAAETAKHQAKCNICKECPIIGFRYRSLKHFNYDICQSCFFSGR VAI<GHI<MHYPMVEYCTPTTSGEDVRDFAI<VL1<NI<FRTI<RYFAI<HPR MGYLPVQTVLEGDNMETDTM MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIENLFSDLQDG RRLLDLLEGLTGQKLPKEKGSTRVHALNNVNKALRVLQNNNVDLVNIG STDIVDGNHKLTLGLIWNIILHWQVKNVMKNIMAGLQQTNSEKILLSW VRQSTRNYPQVNVINFTTSWSDGLALNALIHSHRPDLFD WNSVVCQQS ATQRLEHAFNIARYQLGIEKLLDPEDVDTTYPDKKSILMYITSLFQVLPQ QVSIEAIQEVEMLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERTS SPKPRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSFGSSLMESEVN LDRYQTALEEVLSWLLSAEDTLQAQGEISNDVE VVKDQFHTHEGYMM DLTAHQGRVGNILQLGSKLIGTGKLSEDEETEVQEQMNLLNSRWECLR VASMEKQSNLHLLKWQRLTEEQCLFSAWLSEKEDAVNKIHTTGFKDQ NEMLSSLQKLAVLKADLEKKKQSMGKLYSLKQDLLSTLKNKSVTQKT EAWLDNFARCWDNLVQKLEKSTAQISQ AVTTTQPSLTQTTVMETVTTV TTREQILVKHAQEELPPPPPQKKRQITVDSEAQIHTVREETMMVMTEDM PLEISYVPSTYLTEITHVSQALLEVEQLLNAPDLCAKDFEDLFKQEESLK NII<DSLQQSSGRIDIIHSI<I<TAALQSATPVERVI<LQEALSQLDFQWEI<V NI<MYI<DRQGRFDRSVEI <WRRFHYDII<IFNQWLTEAEQFLRI<TQIPENW EHAKYKWYLKELQDGIGQRQTVVRTLNATGEEIIQQSSKTDASILQEKL GSLNLRWQEVCKQLSDRKKRLEEQLERLQELQEATDELDLKLRQAEVI I<GSWQPVGDLLIDSLQDHLEI<VI<ALRGEIAPLI<ENVSHVNDLARQLTT LGIQLSPYNLSTLEDLNTRWKLLQVAVEDRVRQLHEAHRDFGPASQHF LSTSVQGPWERAISPNKVPYYINHETQTTCWDHPKMTELYQSLADLNN VRFSAYRTAMKLRRLQKALCLDLLSLSAACDALDQHNLKQNDQPMDI V AI<GHI<MHYPMVEYCTPTTSGEDVRDFAI<VL1<NI<FRTI<RYFAI<HPR MGYLPVQTVLEGDNMETDTM SEQ ID NO: 126 - BXA- 196480 SEQ ID NO: 126 - BXA- 196480 MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIENLFSDLQDG RRLLDLLEGLTGQKLPKEKGSTRVHALNNVNKALRVLQNNNVDLVNIG STDIVDGNHKLTLGLIWNIILHWQVKNVMKNIMAGLQQTNSEKILLSW VRQSTRNYPQVNVINFTTSWSDGLALNALIHSHRPDLFDWNSVVCQQS ATQRLEHAFNIARYQLGIEKLLDPEDVDTTYPDKKSILMYITSLFQVLPQ QVSIEAIQEVEMLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERTS SPKPRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSFGSSLMESEVN LDRYQTALEEVLSWLLSAEDTLQAQGEISNDVEVVKDQFHTHEGYMM DLTAHQGRVGNILQLGSKLIGTGKLSEDEETEVQEQMNLLNSRWECLR VASMEKQSNLHIHTVREETMMVMTEDMPLEISYVPSTYLTEITHVSQAL LEVEQLLNAPDLCAI<DFEDLFI<QEESLI<NII<DSLQQSSGRIDIIHSI<I<TA ALQSATPVERVKLQEALSQLDFQWEKVNKMYKDRQGRFDRSVEKWR RFHYDIKIFNQWLTEAEQFLRKTQIPENWEHAKYKWYLKELQDGIGQR MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIENLFSDLQDG RRLLDLLEGLTGQKLPKEKGSTRVHALNNVNKALRVLQNNNVDLVNIG STDIVDGNHKLTLGLIWNIILHWQVKNVMKNIMAGLQQTNSEKILLSW VRQSTRNYPQVNVINFTTSWSDGLALNALIHSHRPDLFD WNSVVCQQS ATQRLEHAFNIARYQLGIEKLLDPEDVDTTYPDKKSILMYITSLFQVLPQ QVSIEAIQEVEMLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERTS SPKPRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSFGSSLMESEVN LDRYQTALEEVLSWLLSAEDTLQAQGEISNDVE VVKDQFHTHEGYMM DLTAHQGRVGNILQLGSKLIGTGKLSEDEETEVQEQMNLLNSRWECLR VASMEKQSNLHIHTVREETMMVMTEDMPLEISYVPSTYLTEITHVSQAL LEVEQLLNAPDLCAI<DFEDLFI<QEESLI<NII<DSLQQSSGRIDIIHSI<I<TA ALQSATPVERVKLQEALSQLDFQW EKVNKMYKDRQGRFDRSVEKWR RFHYDIKIFNQWLTEAEQFLRKTQIPENWEHAKYKWYLKELQDGIGQR

- 47 046419- 47 046419

QTVVRTLNATGEEIIQQSSKTDASILQEKLGSLNLRWQEVCKQLSDRKK RLEEQAPGLTTIGASPTQTVTLVTQPVVTKETAISKLEMPSSLMLELERL QELQEATDELDL1<LRQAEVII<GSWQPVGDLLIDSLQDHLEI<VI<ALRGEI APLKENVSHVNDLARQLTTLGIQLSPYNLSTLEDLNTRWKLLQVAVED RVRQLHEAHRDFGPASQHFLSTSVQGPWERAISPNKVPYYINHETQTTC WDHPKMTELYQSLADLNNVRFSAYRTAMKLRRLQKALCLDLLSLSAA CDALDQHNLKQNDQPMDILQIINCLTTIYDRLEQEHNNLVNVPLCVDM CLNWLLNVYDTGRTGRIRVLSFKTGIISLCKAHLEDKYRYLFKQVASST GFCDQRRLGLLLHDSIQIPRQLGEVASFGGSNIEPSVRSCFQFANNKPEIE AALFLDWMRLEPQSMVWLPVLHRVAAAETAKHQAKCNICKECPIIGFR YRSLKHFNYDICQSCFFSGRVAKGHKMHYPMVEYCTPTTSGEDVRDFA KVLKNKFRTKRYFAKHPRMGYLPVQTVLEGDNMETPAQILISLESEERG ELERILADLEEENRNLQAEYDRLKQQHEHKGLSPLPSPPDTM QTVVRTLNATGEEIIQQSSKTDASILQEKLGSLNLRWQEVCKQLSDRKK RLEEQAPGLTTIGASPTQTVTLVTQPVVTKETAISKLEMPSSLMLELERL QELQEATDELDL1<LRQAEVII<GSWQPVGDLLIDSLQDHLEI<VI<ALRGEI APLKENVSHVNDLARQLTTLGIQLSPYNLSTLEDLNTRWKLLQ VAVED RVRQLHEAHRDFGPASQHFLSTSVQGPWERAISPNKVPYYINHETQTTC WDHPKMTELYQSLADLNNVRFSAYRTAMKLRRLQKALCLDLLSLSAA CDALDQHNLKQNDQPMDILQIINCLTTIYDRLEQEHNNLVNVPLCVDM CLNWLLNVYDTGRTGRIRVLSFKTGIISLCKAHLEDKYRYLFKQVASST GF CDQRRLGLLLHDSIQIPRQLGEVASFGGSNIEPSVRSCFQFANNKPEIE AALFLDWMRLEPQSMVWLPVLHRVAAAETAKHQAKCNICKECPIIGFR YRSLKHFNYDICQSCFFSGRVAKGHKMHYPMVEYCTPTTSGEDVRDFA KVLKNKFRTKRYFAKHPRMGYLPVQTVLEGDNMETPAQILISLESEERG ELERIL ADLEEENRNLQAEYDRLKQQHEHKGLSPLPSPPDTM SEQ ID NO: 127 BXA- 196480- вариант SEQ ID NO: 127 BXA- 196480- option MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIENLFSDLQDG RRLLDLLEGLTGQKLPKEKGSTRVHALNNVNKALRVLQNNNVDLVNIG STDIVDGNHKLTLGLIWNIILHWQVKNVMKNIMAGLQQTNSEKILLSW VRQSTRNYPQVNVINFTTSWSDGLALNALIHSHRPDLFDWNSVVCQQS ATQRLEHAFNIARYQLGIEKLLDPEDVDTTYPDKKSILMYITSLFQVLPQ QVSLEAIQEVEMLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERTS SPKPRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSFGSSLMESEVN LDRYQTALEEVLSWLLSAEDTLQAQGEISNDVEVVKDQFHTHEGYMM DLTAHQGRVGNILQLGSKLIGTGKLSEDEETEVQEQMNLLNSRWECLR VASMEKQSNLHRVLIHTVREETMMVMTEDMPLEISYVPSTYLTEITHVS QALLEVEQLLNAPDLCAI<DFEDLFI<QEESLI<NII<DSLQQSSGRIDIIHSI< KTAALQSATPVERVKLQEALSQLDFQWEKVNKMYKDRQGRFDRSVEK WRRFHYDII<IFNQWLTEAEQFLRI<TQIPENWEHAI<YI<WYLI<ELQDGIG QRQTVVRTLNATGEEIIQQSSKTDASILQEKLGSLNLRWQEVCKQLSDR KKRLEEQKNDLAPGLTTIGASPTQTVTLVTQPVVTKETAISKLEMPSSL MLEVERLQELQEATDELDL1<LRQAEVII<GSWQPVGDLLIDSLQDHLEI< VKALRGEIAPLKENVSHVNDLARQLTTLGIQLSPYNLSTLEDLNTRWKL LQVAVEDRVRQLHEAHRDFGPASQHFLSTSVQGPWERAISPNKVPYYIN HETQTTCWDHPKMTELYQSLADLNNVRFSAYRTAMKLRRLQKALCLD LLSLSAACDALDQHNLKQNDQPMDILQIINCLTTIYDRLEQEHNNLVNV PLCVDMCLNWLLNVYDTGRTGRIRVLSFKTGIISLCKAHLEDKYRYLFK QVASSTGFCDQRRLGLLLHDSIQIPRQLGEVASFGGSNIEPSVRSCFQFA NNKPEIEAALFLDWMRLEPQSMVWLPVLHRVAAAETAKHQAKCNICK ECPIIGFRYRSLKHFNYDICQSCFFSGRVAKGHKMHYPMVEYCTPTTSG EDVRDFAKVLKNKFRTKRYFAKHPRMGYLPVQTVLEGDNMETPAQILI SLESEERGELERILADLEEENRNLQAEYDRLKQQHEHKGLSPLPSPPDT M MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIENLFSDLQDG RRLLDLLEGLTGQKLPKEKGSTRVHALNNVNKALRVLQNNNVDLVNIG STDIVDGNHKLTLGLIWNIILHWQVKNVMKNIMAGLQQTNSEKILLSW VRQSTRNYPQVNVINFTTSWSDGLALNALIHSHRPDLFD WNSVVCQQS ATQRLEHAFNIARYQLGIEKLLDPEDVDTTYPDKKSILMYITSLFQVLPQ QVSLEAIQEVEMLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERTS SPKPRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSFGSSLMESEVN LDRYQTALEEVLSWLLSAEDTLQAQGEISNDVE VVKDQFHTHEGYMM DLTAHQGRVGNILQLGSKLIGTGKLSEDEETEVQEQMNLLNSRWECLR VASMEKQSNLHRVLIHTVREETMMVMTEDMPLEISYVPSTYLTEITHVS QALLEVEQLLNAPDLCAI<DFEDLFI<QEESLI<NII<DSLQQSSGRIDIIHSI< KTAALQSATPVERVKLQEALSQLDFQW EKVNKMYKDRQGRFDRSVEK WRRFHYDII<IFNQWLTEAEQFLRI<TQIPENWEHAI<YI<WYLI<ELQDGIG QRQTVVRTLNATGEEIIQQSSKTDASILQEKLGSLNLRWQEVCKQLSDR KKRLEEQKNDLAPGLTTIGASPTQTVTLVTQPVVTKETAISKLEMPSSL MLEVERLQELQEATDEL DL1<LRQAEVII<GSWQPVGDLLIDSLQDHLEI< VKALRGEIAPLKENVSHVNDLARQLTTLGIQLSPYNLSTLEDLNTRWKL LQVAVEDRVRQLHEAHRDFGPASQHFLSTSVQGPWERAISPNKVPYYIN HETQTTCWDHPKMTELYQSLADLNNVRFSAYRTAMKLRRLQKALCLD LLSLSAACDALDQHNLKQND QPMDILQIINCLTTIYDRLEQEHNNLVNV PLCVDMCLNWLLNVYDTGRTGRIRVLSFKTGIISLCKAHLEDKYRYLFK QVASSTGFCDQRRLGLLLHDSIQIPRQLGEVASFGGSNIEPSVRSCFQFA NNKPEIEAALFLDWMRLEPQSMVWLPVLHRVAAAETAKHQAKCNICK ECPIIGFRYRSLKHFNYDICQSCFFS GRVAKGHKMHYPMVEYCTPTTSG EDVRDFAKVLKNKFRTKRYFAKHPRMGYLPVQTVLEGDNMETPAQILI SLESEERGELERILADLEEENRNLQAEYDRLKQQHEHKGLSPLPSPPDT M SEQ ID NO: 128 - BXA- 196481 SEQ ID NO: 128 - BXA- 196481 MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIENLFSDLQDG RRLLDLLEGLTGQKLPKEKGSTRVHALNNVNKALRVLQNNNVDLVNIG STDIVDGNHKLTLGLIWNIILHWQVKNVMKNIMAGLQQTNSEKILLSW VRQSTRNYPQVNVINFTTSWSDGLALNALIHSHRPDLFDWNSVVCQQS ATQRLEHAFNIARYQLGIEKLLDPEDVDTTYPDKKSILMYITSLFQVLPQ QVSLEAIQEVEMLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERTS SPKPRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSFGSSLMESEVN LDRYQTALEEVLSWLLSAEDTLQAQGEISNDVEVVKDQFHTHEGYMM DLTAHQGRVGNILQLGSKLIGTGKLSEDEETEVQEQMNLLNSRWECLR VASMEKQSNLHSYVPSTYLTEITHVSQALLEVEQLLNAPDLCAKDFEDL FKQEESLKNIKDSLQQSSGRIDIIHSKKTAALQSATPVERVKLQEALSQL MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIENLFSDLQDG RRLLDLLEGLTGQKLPKEKGSTRVHALNNVNKALRVLQNNNVDLVNIG STDIVDGNHKLTLGLIWNIILHWQVKNVMKNIMAGLQQTNSEKILLSW VRQSTRNYPQVNVINFTTSWSDGLALNALIHSHRPDLFD WNSVVCQQS ATQRLEHAFNIARYQLGIEKLLDPEDVDTTYPDKKSILMYITSLFQVLPQ QVSLEAIQEVEMLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERTS SPKPRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSFGSSLMESEVN LDRYQTALEEVLSWLLSAEDTLQAQGEISNDVE VVKDQFHTHEGYMM DLTAHQGRVGNILQLGSKLIGTGKLSEDEETEVQEQMNLLNSRWECLR VASMEKQSNLHSYVPSTYLTEITHVSQALLEVEQLLNAPDLCAKDFEDL FKQEESLKNIKDSLQQSSGRIDIIHSKKTAALQSATPVERVKLQEALSQL

- 48 046419- 48 046419

DFQWEKVNKMYKDRQGRFDRSVEKWRRFHYDIKIFNQWLTEAEQFLR KTQIPENWEHAKYKWYLKELQDGIGQRQTVVRTLNATGEEIIQQSSKT DASILQEKLGSLNLRWQEVCKQLSDRKKRLEEQLEGLEKLYQEPRELPP EERAQNVTRLLRKQAEEVNTEWEKLNLHSADWQRKIDETLERLQELQE ATDELDLKLRQAEVIKGSWQPVGDLLIDSLQDHLEKVKALRGEIAPLKE NVSHVNDLARQLTTLGIQLSPYNLSTLEDLNTRWKLLQVAVEDRVRQL HEAHRDFGPASQHFLSTSVQGPWERAISPNKVPYYINHETQTTCWDHPK MTELYQSLADLNNVRFSAYRTAMKLRRLQKALCLDLLSLSAACDALD QHNLKQNDQPMDILQIINCLTTIYDRLEQEHNNLVNVPLCVDMCLNWL LNVYDTGRTGRIRVLSFKTGIISLCKAHLEDKYRYLFKQVASSTGFCDQ RRLGLLLHDSIQIPRQLGEVASFGGSNIEPSVRSCFQFANNKPEIEAALFL DWMRLEPQSMVWLPVLHRVAAAETAKHQAKCNICKECPIIGFRYRSLK HFNYDICQSCFFSGRVAKGHKMHYPMVEYCTPTTSGEDVRDFAKVLKN KFRTKRYFAKHPRMGYLPVQTVLEGDNMETPAQILISLESEERGELERIL ADLEEENRNLQ AE YDRLKQQHEHKGLSPLP SPPDTM DFQWEKVNKMYKDRQGRFDRSVEKWRRFHYDIKIFNQWLTEAEQFLR KTQIPENWEHAKYKWYLKELQDGIGQRQTVVRTLNATGEEIIQQSSKT DASILQEKLGSLNLRWQEVCKQLSDRKKRLEEQLEGLEKLYQEPRELPP EERAQNVTRLLRKQAEEVNTEWEKLNLHSADWQ RKIDETLERLQELQE ATDELDLKLRQAEVIKGSWQPVGDLLIDSLQDHLEKVKALRGEIAPLKE NVSHVNDLARQLTTLGIQLSPYNLSTLEDLNTRWKLLQVAVEDRVRQL HEAHRDFGPASQHFLSTSVQGPWERAISPNKVPYYINHETQTTCWDHPK MTELYQSLADLNNVRFSAYRTAMKLRRLQKALCLDLLSL SAACDALD QHNLKQNDQPMDILQIINCLTTIYDRLEQEHNNLVNVPLCVDMCLNWL LNVYDTGRTGRIRVLSFKTGIISLCKAHLEDKYRYLFKQVASSTGFCDQ RRLGLLLHDSIQIPRQLGEVASFGGSNIEPSVRSCFQFANNKPEIEAALFL DWMRLEPQSMVWLPVLHRVAAAETAKHQAKCNICKECPIIGFRY RSLK HFNYDICQSCFFSGRVAKGHKMHYPMVEYCTPTTSGEDVRDFAKVLKN KFRTKRYFAKHPRMGYLPVQTVLEGDNMETPAQILISLESEERGELERIL ADLEEENRNLQ AE YDRLKQQHEHKGLSPLP SPPDTM SEQ ГО NO: 129 - BXA- 027741 SEQ GO NO: 129 - BXA- 027741 MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIENLFSDLQDG RRLLDLLEGLTGQKLPKEKGSTRVHALNNVNKALRVLQNNNVDLVNIG STDIVDGNHKLTLGLIWNIILHWQVKNVMKNIMAGLQQTNSEKILLSW VRQSTRNYPQVNVINFTTSWSDGLALNALIHSHRPDLFDWNSVVCQQS ATQRLEHAFNIARYQLGIEKLLDPEDVDTTYPDKKSILMYITSLFQVLPQ QVSIEAIQEVEMLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERTS SPKPRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSFGSSLMESEVN LDRYQTALEEVLSWLLSAEDTLQAQGEISNDVEVVKDQFHTHEGYMM DLTAHQGRVGNILQLGSKLIGTGKLSEDEETEVQEQMNLLNSRWECLR VASMEKQSNLHLLKWQRLTEEQCLFSAWLSEKEDAVNKIHTTGFKDQ NEMLSSLQKLAVLKADLEKKKQSMGKLYSLKQDLLSTLKNKSVTQKT EAWLDNFARCWDNLVQKLEKSTAQISQAVTTTQPSLTQTTVMETVTTV TTREQILVKHAQEELPPPPPQKKRQITVDIHTVREETMMVMTEDMPLEIS YVPSTYLTEITHVSQALLEVEQLLNAPDLCAKDFEDLFKQEESLKNIKDS LQQSSGRIDIIHSKKTAALQSATPVERVKLQEALSQLDFQWEKVNKMY KDRQGRFDRSVEKWRRFHYDIKIFNQWLTEAEQFLRKTQIPENWEHAK YKWYLKELQDGIGQRQTVVRTLNATGEEIIQQSSKTDASILQEKLGSLN LRWQEVCKQLSDRKKRLEEQLERLQELQEATDELDLKLRQAEVIKGSW QPVGDLLIDSLQDHLEKVKALRGEIAPLKENVSHVNDLARQLTTLGIQL SPYNLSTLEDLNTRWKLLQVAVEDRVRQLHEAHRDFGPASQHFLSTSV QGPWERAISPNKVPYYINHETQTTCWDHPKMTELYQSLADLNNVRFSA YRTAMKLRRLQKALCLDLLSLSAACDALDQHNLKQNDQPMDILQIINC LTTIYDRLEQEHNNLVNVPLCVDMCLNWLLNVYDTGRTGRIRVLSFKT GIISLCKAHLEDKYRYLFKQVASSTGFCDQRRLGLLLHDSIQIPRQLGEV ASFGGSNIEPSVRSCFQFANNKPEIEAALFLDWMRLEPQSMVWLPVLHR VAAAETAKHQAKCNICKECPIIGFRYRSLKHFNYDICQSCFFSGRVAKG HI<MHYPMVEYCTPTTSGEDVRDFAI<VL1<NI<FRTI<RYFAI<HPRMGYLP VQTVLEGDNMETPAQILISLESEERGELERIL ADLEEENRNLQ AEYDRLK QQHEHKGLSPLPSPPDTM MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIENLFSDLQDG RRLLDLLEGLTGQKLPKEKGSTRVHALNNVNKALRVLQNNNVDLVNIG STDIVDGNHKLTLGLIWNIILHWQVKNVMKNIMAGLQQTNSEKILLSW VRQSTRNYPQVNVINFTTSWSDGLALNALIHSHRPDLFD WNSVVCQQS ATQRLEHAFNIARYQLGIEKLLDPEDVDTTYPDKKSILMYITSLFQVLPQ QVSIEAIQEVEMLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERTS SPKPRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSFGSSLMESEVN LDRYQTALEEVLSWLLSAEDTLQAQGEISNDVE VVKDQFHTHEGYMM DLTAHQGRVGNILQLGSKLIGTGKLSEDEETEVQEQMNLLNSRWECLR VASMEKQSNLHLLKWQRLTEEQCLFSAWLSEKEDAVNKIHTTGFKDQ NEMLSSLQKLAVLKADLEKKKQSMGKLYSLKQDLLSTLKNKSVTQKT EAWLDNFARCWDNLVQKLEKSTAQISQ AVTTTQPSLTQTTVMETVTTV TTREQILVKHAQEELPPPPPQKKRQITVDIHTVREETMMVMTEDMPLEIS YVPSTYLTEITHVSQALLEVEQLLNAPDLCAKDFEDLFKQEESLKNIKDS LQQSSGRIDIIHSKKTAALQSATPVERVKLQEALSQLDFQWEKVNKMY KDRQGRFDRSVEKWRRFHYDIKIFNQWLT EAEQFLRKTQIPENWEHAK YKWYLKELQDGIGQRQTVVRTLNATGEEIIQQSSKTDASILQEKLGSLN LRWQEVCKQLSDRKKRLEEQLERLQELQEATDELDLKLRQAEVIKGSW QPVGDLLIDSLQDHLEKVKALRGEIAPLKENVSHVNDLARQLTTLGIQL SPYNLSTLEDLNTRWKLLQV AVEDRVRQLHEAHRDFGPASQHFLSTSV QGPWERAISPNKVPYYINHETQTTCWDHPKMTELYQSLADLNNVRFSA YRTAMKLRRLQKALCLDLLSLSAACDALDQHNLKQNDQPMDILQIINC LTTIYDRLEQEHNNLVNVPLCVDMCLNWLLNVYDTGRTGRIRVLSFKT GIISLCKAHLEDKYRYLFKQVASSTGFCDQRR LGLLLHDSIQIPRQLGEV ASFGGSNIEPSVRSCFQFANNKPEIEAALFLDWMRLEPQSMVWLPVLHR VAAAETAKHQAKCNICKECPIIGFRYRSLKHFNYDICQSCFFSGRVAKG HI<MHYPMVEYCTPTTSGEDVRDFAI<VL1<NI<FRTI<RYFAI<HPRMGYLP VQTVLEGDNMETPAQILISLESEERGEL ERIL ADLEEENRNLQ AEYDRLK QQHEHKGLSPLPSPPDTM SEQ ID NO:130 - BXA- 027744 SEQ ID NO:130 - BXA- 027744 MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIENLFSDLQDG RRLLDLLEGLTGQKLPKEKGSTRVHALNNVNKALRVLQNNNVDLVNIG STDIVDGNHKLTLGLIWNIILHWQVKNVMKNIMAGLQQTNSEKILLSW VRQSTRNYPQVNVINFTTSWSDGLALNALIHSHRPDLFDWNSVVCQQS ATQRLEHAFNIARYQLGIEKLLDPEDVDTTYPDKKSILMYITSLFQVLPQ QVSIEAIQEVEMLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERTS SPKPRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSFGSSLMESEVN MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIENLFSDLQDG RRLLDLLEGLTGQKLPKEKGSTRVHALNNVNKALRVLQNNNVDLVNIG STDIVDGNHKLTLGLIWNIILHWQVKNVMKNIMAGLQQTNSEKILLSW VRQSTRNYPQVNVINFTTSWSDGLALNALIHSHRPDLFD WNSVVCQQS ATQRLEHAFNIARYQLGIEKLLDPEDVDTTYPDKKSILMYITSLFQVLPQ QVSIEAIQEVEMLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERTS SPKPRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSFGSSLMESEVN

- 49 046419- 49 046419

LDRYQTALEEVLSWLLSAEDTLQAQGEISNDVEVVKDQFHTHEGYMM DLTAHQGRVGNILQLGSKLIGTGKLSEDEETEVQEQMNLLNSRWECLR VASMEKQSNLHIHTVREETMMVMTEDMPLEISYVPSTYLTEITHVSQAL LEVEQLLNAPDLCAKDFEDLFKQEESLKNIKDSLQQSSGRIDIIHSKKTA ALQSATPVERVKLQEALSQLDFQWEKVNKMYKDRQGRFDRSVEKWR RFHYDIKIFNQWLTEAEQFLRKTQIPENWEHAKYKWYLKELQDGIGQR QTVVRTLNATGEEIIQQSSKTDASILQEKLGSLNLRWQEVCKQLSDRKK RLEEQAPGLTTIGASPTQTVTLVTQPVVTKETAISKLEMPSSLMLEVPAL ADFNRAWTELTDWLSLLDQVIKSQRVMVGDLEDINEMIIKQKATMQDL EQRRPQLEELITAAQNLKNKTSNQEARTIITDRIERIQNQWDEVQEHLQN RRQQLNEMLERLQELQEATDELDLKLRQAEVIKGSWQPVGDLLIDSLQ DHLEKVKALRGEIAPLKENVSHVNDLARQLTTLGIQLSPYNLSTLEDLN TRWKLLQVAVEDRVRQLHEAHRDFGPASQHFLSTSVQGPWERAISPNK VPYYINHETQTTCWDHPKMTELYQSLADLNNVRFSAYRTAMKLRRLQ KALCLDLLSLSAACDALDQHNLKQNDQPMDILQIINCLTTIYDRLEQEH NNLVNVPLCVDMCLNWLLNVYDTGRTGRIRVLSFKTGIISLCKAHLED KYRYLFKQ VAS STGFCDQRRLGLLLHD SIQIPRQLGEVASFGGSNIEPS V RSCFQFANNKPEIEAALFLDWMRLEPQSMVWLPVLHRVAAAETAKHQ AKCNICKECPIIGFRYRSLKHFNYDICQSCFFSGRVAKGHKMHYPMVEY CTPTTSGEDVRDFAKVLKNKFRTKRYFAKHPRMGYLPVQTVLEGDNM ETPAQILISLESEERGELERILADLEEENRNLQAEYDRLKQQHEHKGLSP LPSPPDTM LDRYQTALEEVLSWLLSAEDTLQAQGEISNDVEVVKDQFHTHEGYMM DLTAHQGRVGNILQLGSKLIGTGKLSEDEETEVQEQMNLLNSRWECLR VASMEKQSNLHIHTVREETMMVMTEDMPLEISYVPSTYLTEITHVSQAL LEVEQLLNAPDLCAKDFEDLFKQEESLKNIKDSLQQSSGRIDIIHSKK TA ALQSATPVERVKLQEALSQLDFQWEKVNKMYKDRQGRFDRSVEKWR RFHYDIKIFNQWLTEAEQFLRKTQIPENWEHAKYKWYLKELQDGIGQR QTVVRTLNATGEEIIQQSSKTDASILQEKLGSLNLRWQEVCKQLSDRKK RLEEQAPGLTTIGASPTQTVTLVTQPVVTKETAISKLEMPSS LMLEVPAL ADFNRAWTELTDWLSLLDQVIKSQRVMVGDLEDINEMIIKQKATMQDL EQRRPQLEELITAAQNLKNKTSNQEARTIITDRIERIQNQWDEVQEHLQN RRQQLNEMLERLQELQEATDELDLKLRQAEVIKGSWQPVGDLLIDSLQ DHLEKVKALRGEIAPLKENVSHVNDLARQLTTLGIQLSPY NLSTLEDLN TRWKLLQVAVEDRVRQLHEAHRDFGPASQHFLSTSVQGPWERAISPNK VPYYINHETQTTCWDHPKMTELYQSLADLNNVRFSAYRTAMKLRRLQ KALCLDLLLSSAACDALDQHNLKQNDQPMDILQIINCLTTIYDRLEQEH NNLVNVPLCVDMCLNWLLNVYDTGRTGRIRVLSFKTGIISLCKAHLED KY RYLFKQ VAS STGFCDQRRLGLLLHD SIQIPRQLGEVASFGGSNIEPS V RSCFQFANNKPEIEAALFLDWMRLEPQSMVWLPVLHRVAAAETAKHQ AKCNICKECPIIGFRYRSLKHFNYDICQSCFFSGRVAKGHKMHYPMVEY CTPTTSGEDVRDFAKVLKNKFRTKRYFAKHPRMGYLPVQTVLEGDNM ET PAQILISLESEERGELERILADLEEENRNLQAEYDRLKQQHEHKGLSP LPSPPDTM SEQ ID NO:131 - BXA- 027742 SEQ ID NO:131 - BXA- 027742 MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIENLFSDLQDG RRLLDLLEGLTGQKLPKEKGSTRVHALNNVNKALRVLQNNNVDLVNIG STDIVDGNHKLTLGLIWNIILHWQVKNVMKNIMAGLQQTNSEKILLSW VRQSTRNYPQVNVINFTTSWSDGLALNALIHSHRPDLFDWNSVVCQQS ATQRLEHAFNIARYQLGIEKLLDPEDVDTTYPDKKSILMYITSLFQVLPQ QVSIEAIQEVEMLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERTS SPKPRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSFGSSLMESEVN LDRYQTALEEVLSWLLSAEDTLQAQGEISNDVEVVKDQFHTHEGYMM DLTAHQGRVGNILQLGSKLIGTGKLSEDEETEVQEQMNLLNSRWECLR VASMEKQSNLHRVLMDLQNQKLKELNDWLTKTEERTRKMEEEPLGPD LEDLKRQVQQHKVLQEDLEQEQVRVNSLTHMVVVVDESSGDHATAAL EEQLKVLGDRWANICRWTEDRWVLLQDILLKWQRLTEEQCLFSAWLS EKEDAVNKIHTTGFKDQNEMLSSLQKLAVLKADLEKKKQSMGKLYSL KQDLLSTLKNKSVTQKTEAWLDNFARCWDNLVQKLEKSTAQISQAIHT VREETMMVMTEDMPLEISYVPSTYLTEITHVSQALLEVEQLLNAPDLCA KDFEDLFKQEESLKNIKDSLQQSSGRIDIIHSKKTAALQSATPVERVKLQ EALSQLDFQWEKVNKMYKDRQGRFDRSVEKWRRFHYDIKIFNQWLTE AEQFLRKTQIPENWEHAKYKWYLKELQDGIGQRQTVVRTLNATGEEII QQSSKTDASILQEKLGSLNLRWQEVCKQLSDRKKRLEEQLERLQELQE ATDELDLKLRQAEVIKGSWQPVGDLLIDSLQDHLEKVKALRGEIAPLKE NVSHVNDLARQLTTLGIQLSPYNLSTLEDLNTRWKLLQVAVEDRVRQL HEAHRDFGPASQHFLSTSVQGPWERAISPNKVPYYINHETQTTCWDHPK MTELYQSLADLNNVRFSAYRTAMKLRRLQKALCLDLLSLSAACDALD QHNLKQNDQPMDILQIINCLTTIYDRLEQEHNNLVNVPLCVDMCLNWL LNVYDTGRTGRIRVLSFKTGIISLCKAHLEDKYRYLFKQVASSTGFCDQ RRLGLLLHDSIQIPRQLGEVASFGGSNIEPSVRSCFQFANNKPEIEAALFL DWMRLEPQSMVWLPVLHRVAAAETAKHQAKCNICKECPIIGFRYRSLK HFNYDICQSCFFSGRVAKGHKMHYPMVEYCTPTTSGEDVRDFAKVLKN KFRTKRYFAKHPRMGYLPVQTVLEGDNMETDTM MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIENLFSDLQDG RRLLDLLEGLTGQKLPKEKGSTRVHALNNVNKALRVLQNNNVDLVNIG STDIVDGNHKLTLGLIWNIILHWQVKNVMKNIMAGLQQTNSEKILLSW VRQSTRNYPQVNVINFTTSWSDGLALNALIHSHRPDLFD WNSVVCQQS ATQRLEHAFNIARYQLGIEKLLDPEDVDTTYPDKKSILMYITSLFQVLPQ QVSIEAIQEVEMLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERTS SPKPRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSFGSSLMESEVN LDRYQTALEEVLSWLLSAEDTLQAQGEISNDVE VVKDQFHTHEGYMM DLTAHQGRVGNILQLGSKLIGTGKLSEDEETEVQEQMNLLNSRWECLR VASMEKQSNLHRVLMDLQNQKLKELNDWLTKTEERTRKMEEEPLGPD LEDLKRQVQQHKVLQEDLEQEQVRVNSLTHMVVVVDESSGDHATAAL EEQLKVLGDRWANICRWTEDRWVLLQ DILLKWQRLTEEQCLFSAWLS EKEDAVNKIHTTGFKDQNEMLSSLQKLAVLKADLEKKKQSMGKLYSL KQDLLSTLKNKSVTQKTEAWLDNFARCWDNLVQKLEKSTAQISQAIHT VREETMMVMTEDMPLEISYVPSTYLTEITHVSQALLEVEQLLNAPDLCA KDFEDLFKQEESLKNIKDSLQQSSGRIDIIHS KKTAALQSATPVERVKLQ EALSQLDFQWEKVNKMYKDRQGRFDRSVEKWRRFHYDIKIFNQWLTE AEQFLRKTQIPENWEHAKYKWYLKELQDGIGQRQTVVRTLNATGEEII QQSSKTDASILQEKLGSLNLRWQEVCKQLSDRKKRLEEQLERLQELQE ATDELDLKLRQAEVIKGSWQ PVGDLLIDSLQDHLEKVKALRGEIAPLKE NVSHVNDLARQLTTLGIQLSPYNLSTLEDLNTRWKLLQVAVEDRVRQL HEAHRDFGPASQHFLSTSVQGPWERAISPNKVPYYINHETQTTCWDHPK MTELYQSLADLNNVRFSAYRTAMKLRRLQKALCLDLLSLSAACDALD QHNLKQNDQPMDILQIINCLTTIYDRLEQE HNNLVNVPLCVDMCLNWL LNVYDTGRTGRIRVLSFKTGIISLCKAHLEDKYRYLFKQVASSTGFCDQ RRLGLLLHDSIQIPRQLGEVASFGGSNIEPSVRSCFQFANNKPEIEAALFL DWMRLEPQSMVWLPVLHRVAAAETAKHQAKCNICKECPIIGFRYRSLK HFNYDICQSCFFSGRVAKGHKMHYPMVEYCTPT TSGEDVRDFAKVLKN KFRTKRYFAKHPRMGYLPVQTVLEGDNMETDTM

- 50 046419- 50 046419

SEQ IDSEQ ID

NO:132 BXA027743NO:132 BXA027743

MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIENLFSDLQDG RRLLDLLEGLTGQKLPKEKGSTRVHALNNVNKALRVLQNNNVDLVNIG STDIVDGNHKLTLGLIWNIILHWQVKNVMKNIMAGLQQTNSEKILLSW VRQSTRNYPQVNVINFTTSWSDGLALNALIHSHRPDLFDWNSVVCQQS ATQRLEHAFNIARYQLGIEKLLDPEDVDTTYPDKKSILMYITSLFQVLPQ QVSIEAIQEVEMLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERTS SPKPRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSFGSSLMESEVN LDRYQTALEEVLSWLLSAEDTLQAQGEISNDVEVVKDQFHTHEGYMM DLTAHQGRVGNILQLGSKLIGTGKLSEDEETEVQEQMNLLNSRWECLR VASMEKQSNLHIHTVREETMMVMTEDMPLEISYVPSTYLTEITHVSQAL LEVEQLLNAPDLCAKDFEDLFKQEESLKNIKDSLQQSSGRIDIIHSKKTA ALQSATPVERVKLQEALSQLDFQWEKVNKMYKDRQGRFDRSVEKWR RFHYDIKIFNQWLTEAEQFLRKTQIPENWEHAKYKWYLKELQDGIGQR QTVVRTLNATGEEIIQQSSKTDASILQEKLGSLNLRWQEVCKQLSDRKK RLEEQAPGLTTIGASPTQTVTLVTQPVVTKETAISKLEMPSSLMLESDQ WKRLHLSLQELLVWLQLKDDELSRQAPIGGDFPAVQKQNDVHRAFKR ELKTKEPVIMSTLETVRIFLTEQPLEGLEKLYQEPRELPPEERAQNVTRLL RI<QAEEVNTEWEI<LNLHSADWQRI<IDETLERLQELQEATDELDLI<LRQ AEVIKGSWQPVGDLLIDSLQDHLEKVKALRGEIAPLKENVSHVNDLAR QLTTLGIQLSPYNLSTLEDLNTRWKLLQVAVEDRVRQLHEAHRDFGPA SQHFLSTSVQGPWERAISPNKVPYYINHETQTTCWDHPKMTELYQSLA DLNNVRFSAYRTAMKLRRLQKALCLDLLSLSAACDALDQHNLKQNDQ PMDILQIINCLTTIYDRLEQEHNNLVNVPLCVDMCLNWLLNVYDTGRT GRIRVLSFKTGIISLCKAHLEDKYRYLFKQVASSTGFCDQRRLGLLLHDS IQIPRQLGEVASFGGSNIEPSVRSCFQFANNKPEIEAALFLDWMRLEPQS MVWLPVLHRVAAAETAKHQAKCNICKECPIIGFRYRSLKHFNYDICQSC FFSGRVAKGHKMHYPMVEYCTPTTSGEDVRDFAKVLKNKFRTKRYFA KHPRMGYLPVQTVLEGDNMETPAQILISLESEERGELERILADLEEENRN LQAEYDRLKQQHEHKGLSPLPSPPDTMMLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIENLFSDLQDG RRLLDLLEGLTGQKLPKEKGSTRVHALNNVNKALRVLQNNNVDLVNIG STDIVDGNHKLTLGLIWNIILHWQVKNVMKNIMAGLQQTNSEKILLSW VRQSTRNYPQVNVINFTTSWSDGLALNALIHSHRPDLFD WNSVVCQQS ATQRLEHAFNIARYQLGIEKLLDPEDVDTTYPDKKSILMYITSLFQVLPQ QVSIEAIQEVEMLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERTS SPKPRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSFGSSLMESEVN LDRYQTALEEVLSWLLSAEDTLQAQGEISNDVE VVKDQFHTHEGYMM DLTAHQGRVGNILQLGSKLIGTGKLSEDEETEVQEQMNLLNSRWECLR VASMEKQSNLHIHTVREETMMVMTEDMPLEISYVPSTYLTEITHVSQAL LEVEQLLNAPDLCAKDFEDLFKQEESLKNIKDSLQQSSGRIDIIHSKKTA ALQSATPVERVKLQEALSQLDFQWEKVNKMY KDRQGRFDRSVEKWR RFHYDIKIFNQWLTEAEQFLRKTQIPENWEHAKYKWYLKELQDGIGQR QTVVRTLNATGEEIIQQSSKTDASILQEKLGSLNLRWQEVCKQLSDRKK RLEEQAPGLTTIGASPTQTVTLVTQPVVTKETAISKLEMPSSLMLESDQ WKRLHLSLQELLVWLQLKDDELSRQ APIGGDFPAVQKQNDVHRAFKR ELKTKEPVIMSTLETVRIFLTEQPLEGLEKLYQEPRELPPEERAQNVTRLL RI<QAEEVNTEWEI<LNLHSADWQRI<IDETLERLQELQEATDELDLI<LRQ AEVIKGSWQPVGDLLIDSLQDHLEKVKALRGEIAPLKENVSHVNDLAR QLTTLGIQLSPYNLSTLEDLNTR WKLLQVAVEDRVRQLHEAHRDFGPA SQHFLSTSVQGPWERAISPNKVPYYINHETQTTCWDHPKMTELYQSLA DLNNVRFSAYRTAMKLRRLQKALCLDLLSLSAACDALDQHNLKQNDQ PMDILQIINCLTTIYDRLEQEHNNLVNVPLCVDMCLNWLLNVYDTGRT GRIRVLSFKTGIISLCKAHLEDKYRYLFKQVAS STGFCDQRRLGLLLHDS IQIPRQLGEVASFGGSNIEPSVRSCFQFANNKPEIEAALFLDWMRLEPQS MVWLPVLHRVAAAETAKHQAKCNICKECPIIGFRYRSLKHFNYDICQSC FFSGRVAKGHKMHYPMVEYCTPTTSGEDVRDFAKVLKNKFRTKRYFA KHPRMGYLPVQTVLEGDNMETPAQILISLESEERGE LERILADLEEENRN LQAEYDRLKQQHEHKGLSPLPSPPDTM

В некоторых вариантах осуществления полипептид миниатюризированного дистрофина содержит аминокислотную последовательность, которая по меньшей мере на около 70%, по меньшей мере на около 75%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 118-132, где аминокислотная последовательность при экспрессии обладает по меньшей мере одной дистрофиновой активностью. В некоторых вариантах осуществления полипептид миниатюризированного дистрофина содержит аминокислотную последовательность, которая по меньшей мере на около 70%, по меньшей мере на около 75%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична одной из последовательностей, приведенных в SEQ ID NO: 118 (ВХА-196477), SEQ ID NO: 119 (ВХА-196473), SEQ ID NO: 120 (ВХА-196474), SEQ ID NO: 121 (BXA196475), SEQ ID NO: 122 (ВХА-196476), SEQ ID NO: 124 (ВХА-196478) или SEQ ID NO: 125 (BXA196479). В некоторых вариантах осуществления полипептид миниатюризированного дистрофина содержит аминокислотную последовательность, которая по меньшей мере на около 70%, по меньшей мере на около 75%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 118, где аминокислотная последовательность при экспрессии обладает по меньшей мере одной дистрофиновой активностью. В некоторых вариантах осуществления полипептид миниатюризированного дистрофина содержит аминокислотную последовательность, которая по меньшей мере на около 60%, по меньшей мере на около 70%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 119, где аминокислотная последователь ность при экспрессии обладает по меньшей мере одной дистрофиновой активностью. В некоторых вариантах осуществления полипептид миниатюризированного дистрофина содержит аминокислотную последовательность, которая по меньшей мере на около 60%, по меньшей мере на около 70%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 120, где аминокислотная последовательность при экспрессии обладает по меньшей мере одной дистрофиновой активностью. В некоторых вариантах осуществления полипептид миниатюризированного дистрофина содержит аминокислотную последовательность, которая по меньшей мере на около 60%, по меньшейIn some embodiments, the miniaturized dystrophin polypeptide comprises an amino acid sequence that is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90 %, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 118-132, wherein the amino acid sequence, when expressed, has at least one dystrophin activity. In some embodiments, the miniaturized dystrophin polypeptide comprises an amino acid sequence that is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90 %, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%, or about 100% identical to one of the sequences , given in SEQ ID NO: 118 (ВХА-196477), SEQ ID NO: 119 (ВХА-196473), SEQ ID NO: 120 (ВХА-196474), SEQ ID NO: 121 (BXA196475), SEQ ID NO: 122 (BXA-196476), SEQ ID NO: 124 (BXA-196478) or SEQ ID NO: 125 (BXA196479). In some embodiments, the miniaturized dystrophin polypeptide comprises an amino acid sequence that is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90 %, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 118, wherein the amino acid sequence, when expressed, has at least one dystrophin activity. In some embodiments, the miniaturized dystrophin polypeptide comprises an amino acid sequence that is at least about 60%, at least about 70%, at least about 80%, at least about 85%, at least about 90 %, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 119, where the amino acid sequence, when expressed, has at least one dystrophin activity. In some embodiments, the miniaturized dystrophin polypeptide comprises an amino acid sequence that is at least about 60%, at least about 70%, at least about 80%, at least about 85%, at least about 90 %, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 120, wherein the amino acid sequence, when expressed, has at least one dystrophin activity. In some embodiments, the miniaturized dystrophin polypeptide comprises an amino acid sequence that is at least about 60%

- 51 046419 мере на около 70%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 121, где аминокислотная последовательность при экспрессии обладает по меньшей мере одной дистрофиновой активностью. В некоторых вариантах осуществления полипептид миниатюризированного дистрофина содержит аминокислотную последовательность, которая по меньшей мере на около 60%, по меньшей мере на около 70%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 122, где аминокислотная последовательность при экспрессии обладает по меньшей мере одной дистрофиновой активностью. В некоторых вариантах осуществления полипептид миниатюризированного дистрофина содержит аминокислотную последовательность, которая по меньшей мере на около 60%, по меньшей мере на около 70%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 123, где аминокислотная последовательность при экспрессии обладает по меньшей мере одной дистрофиновой активностью. В некоторых вариантах осуществления полипептид миниатюризированного дистрофина содержит аминокислотную последовательность, которая по меньшей мере на около 60%, по меньшей мере на около 70%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 124, где аминокислотная последовательность при экспрессии обладает по меньшей мере одной дистрофиновой активностью. В некоторых вариантах осуществления полипептид миниатюризированного дистрофина содержит аминокислотную последовательность, которая по меньшей мере на около 60%, по меньшей мере на около 70%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 125, где аминокислотная последовательность при экспрессии обладает по меньшей мере одной дистрофиновой активностью.- 51 046419 by at least about 70%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, according to is at least about 97%, at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 121, wherein the amino acid sequence, when expressed, has at least one dystrophin activity. In some embodiments, the miniaturized dystrophin polypeptide comprises an amino acid sequence that is at least about 60%, at least about 70%, at least about 80%, at least about 85%, at least about 90 %, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 122, wherein the amino acid sequence, when expressed, has at least one dystrophin activity. In some embodiments, the miniaturized dystrophin polypeptide comprises an amino acid sequence that is at least about 60%, at least about 70%, at least about 80%, at least about 85%, at least about 90 %, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 123, wherein the amino acid sequence, when expressed, has at least one dystrophin activity. In some embodiments, the miniaturized dystrophin polypeptide comprises an amino acid sequence that is at least about 60%, at least about 70%, at least about 80%, at least about 85%, at least about 90 %, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 124, wherein the amino acid sequence, when expressed, has at least one dystrophin activity. In some embodiments, the miniaturized dystrophin polypeptide comprises an amino acid sequence that is at least about 60%, at least about 70%, at least about 80%, at least about 85%, at least about 90 %, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 125, wherein the amino acid sequence, when expressed, has at least one dystrophin activity.

В определенных вариантах осуществления полипептид миниатюризированного дистрофина содержит аминокислотную последовательность, которая по меньшей мере на около 60%, по меньшей мере на около 70%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 126, где аминокислотная последовательность при экспрессии обладает по меньшей мере одной дистрофиновой активностью. В определенных вариантах осуществления полипептид миниатюризированного дистрофина содержит аминокислотную последовательность, которая по меньшей мере на около 60%, по меньшей мере на около 70%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 127, где аминокислотная последовательность при экспрессии обладает по меньшей мере одной дистрофиновой активностью. В определенных вариантах осуществления полипептид миниатюризированного дистрофина содержит аминокислотную последовательность, которая по меньшей мере на около 60%, по меньшей мере на около 70%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 128, где аминокислотная последовательность при экспрессии обладает по меньшей мере одной дистрофиновой активностью. В определенных вариантах осуществления полипептид миниатюризированного дистрофина содержит аминокислотную последовательность, которая по меньшей мере на около 60%, по меньшей мере на около 70%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 129, где аминокислотная последовательность при экспрессии обладает по меньшей мере одной дистрофиновой активностью. В определенных вариантах осуществления полипептид миниатюризированного дистрофина содержит аминокислотную последовательность, которая по меньшей мере на около 60%, по меньшей мере на около 70%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 130, гдеIn certain embodiments, the miniaturized dystrophin polypeptide comprises an amino acid sequence that is at least about 60%, at least about 70%, at least about 80%, at least about 85%, at least about 90 %, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 126, wherein the amino acid sequence, when expressed, has at least one dystrophin activity. In certain embodiments, the miniaturized dystrophin polypeptide comprises an amino acid sequence that is at least about 60%, at least about 70%, at least about 80%, at least about 85%, at least about 90 %, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 127, wherein the amino acid sequence, when expressed, has at least one dystrophin activity. In certain embodiments, the miniaturized dystrophin polypeptide comprises an amino acid sequence that is at least about 60%, at least about 70%, at least about 80%, at least about 85%, at least about 90 %, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 128, wherein the amino acid sequence, when expressed, has at least one dystrophin activity. In certain embodiments, the miniaturized dystrophin polypeptide comprises an amino acid sequence that is at least about 60%, at least about 70%, at least about 80%, at least about 85%, at least about 90 %, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 129, wherein the amino acid sequence, when expressed, has at least one dystrophin activity. In certain embodiments, the miniaturized dystrophin polypeptide comprises an amino acid sequence that is at least about 60%, at least about 70%, at least about 80%, at least about 85%, at least about 90 %, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 130, where

- 52 046419 аминокислотная последовательность при экспрессии обладает по меньшей мере одной дистрофиновой активностью. В определенных вариантах осуществления полипептид миниатюризированного дистрофина содержит аминокислотную последовательность, которая по меньшей мере на около 60%, по меньшей мере на около 70%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 131, где аминокислотная последовательность при экспрессии обладает по меньшей мере одной дистрофиновой активностью. В определенных вариантах осуществления полипептид миниатюризированного дистрофина содержит аминокислотную последовательность, которая по меньшей мере на около 60%, по меньшей мере на около 70%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 132, где аминокислотная последовательность при экспрессии обладает по меньшей мере одной дистрофиновой активностью. В некоторых вариантах осуществления полипептид миниатюризированного дистрофина, кодируемый молекулой нуклеиновой кислоты, имеет формулу (I):- 52 046419 amino acid sequence, when expressed, has at least one dystrophin activity. In certain embodiments, the miniaturized dystrophin polypeptide comprises an amino acid sequence that is at least about 60%, at least about 70%, at least about 80%, at least about 85%, at least about 90 %, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 131, wherein the amino acid sequence, when expressed, has at least one dystrophin activity. In certain embodiments, the miniaturized dystrophin polypeptide comprises an amino acid sequence that is at least about 60%, at least about 70%, at least about 80%, at least about 85%, at least about 90 %, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 132, wherein the amino acid sequence, when expressed, has at least one dystrophin activity. In some embodiments, the miniaturized dystrophin polypeptide encoded by the nucleic acid molecule has formula (I):

Н1-R1-L1-R3 -H2-L2-L3 -RI 6-R17-R24-H4 (I) где H1 представляет собой шарнирный 1 домен дистрофина; R1 представляет собой домен спектринового повтора 1 дистрофина; L1 представляет собой аминокислоты Arg-Val (RV); R3 представляет собой домен спектринового повтора 3; Н2 представляет собой шарнирный 2 домен дистрофина; L2 представляет собой аминокислотную последовательность, приведенную в SEQ ID NO: 74 (SEAQ); L3 представляет собой аминокислотную последовательность, приведенную в SEQ ID NO: 75 (IHTVREE TMMVMTEDMP LEI); R16 представляет собой спектриновый повтор 16 дистрофина; R17 представляет собой спектриновый повтор 17 дистрофина; R24 представляет собой спектриновый повтор 24 дистрофина; Н4 представляет собой шарнирный 4 домен дистрофина; и (-) представляет собой пептидную связь.H1-R1-L1-R3 -H2-L2-L3 -RI 6-R17-R24-H4 (I) where H1 is dystrophin hinge 1 domain; R1 is dystrophin spectrin repeat domain 1; L1 is Arg-Val (RV) amino acids; R3 is spectrin repeat domain 3; H2 is dystrophin hinge 2 domain; L2 is the amino acid sequence shown in SEQ ID NO: 74 (SEAQ); L3 is the amino acid sequence shown in SEQ ID NO: 75 (IHTVREE TMMVMTEDMP LEI); R16 is dystrophin spectrin repeat 16; R17 is dystrophin spectrin repeat 17; R24 is dystrophin spectrin repeat 24; H4 is dystrophin hinge 4 domain; and (-) represents a peptide bond.

В некоторых вариантах осуществления полипептид миниатюризированного дистрофина, кодируемый молекулой нуклеиновой кислоты, проявляет одно или несколько свойств, выбранных из группы, состоящей из (i) более низкой пролиферации CD4 по сравнению с ВХА-027741, (ii) более низкой пролиферации CD8 по сравнению с ВХА-027741, и (iv) любой их комбинации.In some embodiments, the miniaturized dystrophin polypeptide encoded by the nucleic acid molecule exhibits one or more properties selected from the group consisting of (i) lower CD4 proliferation compared to BXA-027741, (ii) lower CD8 proliferation compared to BXA -027741, and (iv) any combination thereof.

В некоторых вариантах осуществления полипептид миниатюризированного дистрофина, кодируемый молекулой нуклеиновой кислоты, имеет формулу (II):In some embodiments, the miniaturized dystrophin polypeptide encoded by the nucleic acid molecule has formula (II):

H1-R1-L-R16-R17-H3-R23-R24-H4 (II) где: H1 представляет собой шарнирный 1 домен дистрофина; R1 представляет собой домен спектринового повтора 1 дистрофина; L представляет собой аминокислоты SEQ ID NO: 84 (IHTVREETMMVMTEDMPLEI); R16 представляет собой спектриновый повтор 16 дистрофина; R17 представляет собой спектриновый повтор 17 дистрофина; Н3 представляет собой шарнирный 3 домен дистрофина; R23 представляет собой спектриновый повтор 23 дистрофина; R24 представляет собой спектриновый повтор 24 дистрофина; Н4 представляет собой шарнирный 4 домен дистрофина; и (-) представляет собой пептидную связь.H1-R1-L-R16-R17-H3-R23-R24-H4 (II) where: H1 is dystrophin hinge 1 domain; R1 is dystrophin spectrin repeat domain 1; L represents amino acids SEQ ID NO: 84 (IHTVREETMMVMTEDMPLEI); R16 is dystrophin spectrin repeat 16; R17 is dystrophin spectrin repeat 17; H3 is dystrophin hinge 3 domain; R23 is dystrophin spectrin repeat 23; R24 is dystrophin spectrin repeat 24; H4 is dystrophin hinge 4 domain; and (-) represents a peptide bond.

В некоторых вариантах осуществления полипептид миниатюризированного дистрофина, кодируемый молекулой нуклеиновой кислоты, содержит аминокислотную последовательность, которая по меньшей мере на около 60%, по меньшей мере на около 70%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 132. В некоторых вариантах осуществления нуклеотидная последовательность включает последовательность, которая по меньшей мере на около 60%, по меньшей мере на около 65%, по меньшей мере на около 70%, по меньшей мере на около 75%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична нуклеотидной последовательности SEQ ID NO: 147.In some embodiments, the miniaturized dystrophin polypeptide encoded by the nucleic acid molecule comprises an amino acid sequence that is at least about 60%, at least about 70%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99% or about 100% identical to the sequence of SEQ ID NO: 132. In some embodiments, the nucleotide sequence includes a sequence that is at least about 60%, at least about 65%, at least about 70%, at least about 75 %, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, is at least about 98%, at least about 99%, or about 100% identical to the nucleotide sequence of SEQ ID NO: 147.

В некоторых вариантах осуществления полипептид миниатюризированного дистрофина демонстрирует более высокий уровень экспрессии полипептида миниатюризированного дистрофина, чем ВХА196481. В некоторых других вариантах осуществления уровень экспрессии полипептида миниатюризированного дистрофина по меньшей мере около в 1,5 раза, по меньшей мере около в 1,6 раза, по меньшей мере около в 1,7 раза, по меньшей мере около в 1,8 раза, по меньшей мере около в 1,9 раза, по меньшей мере около в 2 раза, по меньшей мере около в 2,1 раза, по меньшей мере около в 2,2 раза, по меньшей мере около в 2,3 раза, по меньшей мере около в 2,4 раза, по меньшей мере около в 2,5 раза, по меньшей мере около в 2,6 раза, по меньшей мере около в 2,7 раза, по меньшей мере около в 2,8 раза, по меньшейIn some embodiments, the miniaturized dystrophin polypeptide exhibits a higher level of expression of the miniaturized dystrophin polypeptide than BXA196481. In some other embodiments, the expression level of the miniaturized dystrophin polypeptide is at least about 1.5-fold, at least about 1.6-fold, at least about 1.7-fold, at least about 1.8-fold, at least about 1.9 times, at least about 2 times, at least about 2.1 times, at least about 2.2 times, at least about 2.3 times, at least at least about 2.4 times, at least about 2.5 times, at least about 2.6 times, at least about 2.7 times, at least about 2.8 times, at least

- 53 046419 мере около в 2,9 раза или по меньшей мере около в 3 раза выше, чем уровень экспрессии полипептида ВХА-196481.- 53 046419 at least about 2.9 times or at least about 3 times higher than the expression level of the BXA-196481 polypeptide.

В некоторых вариантах осуществления полипептиды миниатюризированного дистрофина могут кодироваться нуклеотидными последовательностями. Некоторые примеры нуклеотидных последовательностей представлены в табл. 8.In some embodiments, miniaturized dystrophin polypeptides may be encoded by nucleotide sequences. Some examples of nucleotide sequences are presented in table. 8.

Таблица 8Table 8

Нуклеотидные последовательности конструкций дистрофинаNucleotide sequences of dystrophin constructs

SEQ Ш NO и описание SEQ Ш NO and description Последовательность Subsequence SEQ Ш NO: 133 - ВХА- 196477 SEQ Ш NO: 133 - VHA- 196477 ATGCTGTGGTGGGAGGAAGTGGAAGATTGCTACGAGCGCGAGGACG TGCAGAAGAAAACCTTCACCAAATGGGTGAACGCCCAGTTCAGCAA GTTCGGCAAGCAGCACATCGAGAACCTGTTCAGCGACCTGCAGGAC GGCAGACGGCTGCTGGACCTGCTGGAAGGCCTGACCGGCCAGAAGC TGCCCAAAGAGAAGGGCAGCACCAGAGTGCACGCCCTGAACAACGT GAACAAGGCCCTGCGGGTGCTGCAGAACAACAACGTGGACCTGGTG AACATCGGCAGCACCGACATCGTGGACGGCAACCACAAGCTGACCC TGGGCCTGATCTGGAACATCATCCTGCACTGGCAGGTCAAAAACGTG ATGAAGAACATCATGGCCGGCCTGCAGCAGACCAACAGCGAGAAGA TCCTGCTGAGCTGGGTGCGCCAGAGCACCCGGAACTACCCCCAGGTC AACGTGATCAACTTCACCACCTCTTGGAGCGACGGCCTGGCCCTGAA CGCCCTGATCCACAGCCACCGGCCCGACCTGTTCGACTGGAACAGCG TGGTCTGCCAGCAGAGCGCCACCCAGCGGCTGGAACACGCCTTCAA TATCGCCAGATACCAGCTGGGCATCGAGAAGCTGCTGGATCCCGAG GACGTGGACACCACCTACCCCGACAAGAAATCCATCCTGATGTATAT CACCAGCCTGTTCCAGGTGCTGCCCCAGCAGGTGTCCATCGAGGCCA TCCAGGAAGTGGAAATGCTGCCCAGACCCCCCAAAGTGACCAAAGA GGAACACTTCCAGCTGCACCACCAGATGCACTACAGCCAGCAGATC ACCGTGTCCCTGGCCCAGGGCTACGAGAGAACCAGCAGCCCCAAGC CCCGGTTCAAGAGCTACGCCTATACCCAGGCCGCCTACGTGACCACC AGCGACCCTACCAGAAGCCCATTCCCCAGCCAGCATCTGGAAGCCC CCGAGGACAAGAGCTTCGGCAGCAGCCTGATGGAAAGCGAAGTGAA CCTGGACAGATACCAGACCGCCCTGGAAGAGGTGCTGAGCTGGCTG CTGAGCGCCGAGGATACACTGCAGGCTCAGGGCGAGATCAGCAACG ATGCTGTGGTGGGAGGAAGTGGAAGATTGCTACGAGCGCGAGGACG TGCAGAAGAAAACCTTCACCAAATGGGTGAACGCCCAGTTCAGCAA GTTCGGCAAGCAGCACATCGAGAACCTGTTCAGCGACCTGCAGGAC GGCAGACGGCTGCTGGACCTGCTGGAAGGCCTGACCGGCCAGAAGC TGCCCAAAGAAGGGCAGCACCAGAGTGCACGCCCTGAACAACGT GAACAAGGCCC TGCGGGTGCTGCAGAACAACAACGTGGACCTGGTG AACATCGGCAGCACCGACATCGTGGACGGCAACCACAAGCTGACCC TGGGCCTGATCTGGAACATCATCCTGCACTGGCAGGTCAAAAACGTG ATGAAGAACATCATGGCCGGCCTGCAGCAGACCAACAGCGAGAAGA TCCTGCTGAGCTGGGTGCGCCAGAGCACCCGGAACTACCCCCAGGTC AACGTGATCAACTTCACCACCTCTTAG CGACGGCCTGGCCCTGAA CGCCCTGATCCACAGCCACCGGCCCGACCTGTTCGACTGGAACAGCG TGGTCTGCCAGCAGAGCGCCACCCAGCGGCTGGAACACGCCTTCAA TATCGCCAGATACCAGCTGGGCATCGAGAAGCTGCTGGATCCCGAG GACGTGGACACCACCTACCCCGACAAGAAATCCATCCTGATGTATAT CACCAGCCTGTTCCAGGTGCTGCCCCAGGTGTCCAT CGAGGCCA TCCAGGAAGTGGAAATGCTGCCCAGACCCCCCAAAGTGACCAAAGA GGAACACTTCCAGCTGCACCACCAGATGCACTACAGCCAGCAGATC ACCGTGTCCCTGGCCCAGGGCTACGAGAGAACCAGCAGCCCCAAGC CCCGGTTCAAGAGCTACGCCTATACCCAGGCCGCCTACGTGACCACC AGCGACCCTACCAGAAGCCCATTCCCCAGCCAGCATCTGGAAGCCC CCGAGGA CAAGAGCTTCGGCAGCAGCCTGATGGAAAGCGAAGTGAA CCTGGACAGATACCAGACCGCCCTGGAAGAGGTGCTGAGCTGGCTG CTGAGCGCCGAGGATACACTGCAGGCTCAGGGCGAGATCAGCAACG

- 54 046419- 54 046419

ACGTGGAAGTCGTGAAGGACCAGTTCCACACCCACGAGGGCTACAT GATGGACCTGACAGCCCACCAGGGCAGAGTGGGCAACATCCTGCAG CTGGGCTCCAAGCTGATCGGCACCGGCAAGCTGAGCGAGGACGAAG AGACAGAGGTGCAGGAACAGATGAACCTGCTGAACAGCAGATGGG AGTGCCTGCGGGTGGCCAGCATGGAAAAGCAGAGCAACCTGCATAG GGTCCTGCTGAAGTGGCAGCGGCTGACCGAGGAACAGTGCCTGTTT AGCGCCTGGCTGTCCGAGAAAGAGGACGCCGTGAACAAGATCCACA CCACCGGCTTCAAGGACCAGAACGAGATGCTGAGCAGCCTGCAGAA ACTGGCCGTGCTGAAGGCCGACCTGGAAAAGAAAAAGCAGTCCATG GGCAAGCTGTACTCCCTGAAGCAGGACCTGCTGTCCACCCTGAAGA ACAAGAGCGTGACCCAGAAAACCGAGGCCTGGCTGGACAACTTCGC CCGGTGCTGGGACAACCTGGTGCAGAAGCTGGAAAAGTCCACCGCC CAGATCTCCCAGGCCGTGACCACAACACAGCCCAGCCTGACCCAGA CCACCGTGATGGAAACCGTGACAACAGTGACCACCCGGGAACAGAT CCTCGTGAAGCACGCCCAGGAAGAACTGCCCCCTCCACCCCCCCAG AAGAAACGGCAGATCACAGTGGACAGTGAAGCTCAGATCCACACCG TGCGGGAAGAGACAATGATGGTCATGACAGAGGACATGCCCCTGGA AATCAGCTACGTGCCCAGCACCTACCTGACCGAGATCACCCATGTGT CCCAGGCCCTGCTGGAAGTGGAACAGCTGCTGAACGCCCCCGACCT GTGCGCCAAGGATTTCGAGGACCTGTTCAAGCAGGAAGAGAGCCTG AAGAATATCAAGGATAGCCTGCAGCAGAGCAGCGGCCGGATCGACA TCATCCACAGCAAGAAAACAGCCGCCCTGCAGAGCGCCACCCCCGT GGAAAGAGTGAAACTGCAGGAAGCCCTGTCCCAGCTGGACTTCCAG TGGGAGAAAGTGAACAAAATGTACAAGGACCGGCAGGGCAGATTCG ACCGCAGCGTGGAAAAGTGGCGGCGGTTCCACTACGACATCAAGAT CTTCAACCAGTGGCTGACAGAGGCCGAGCAGTTCCTGAGAAAGACC CAGATCCCCGAGAACTGGGAGCACGCCAAGTACAAGTGGTATCTGA AAGAGCTGCAGGACGGCATCGGCCAGAGACAGACAGTCGTGCGGAC CCTGAATGCCACCGGCGAGGAAATCATCCAGCAGTCCAGCAAGACC GACGCCAGCATTCTGCAGGAAAAGCTGGGCAGCCTGAACCTGCGGT GGCAGGAAGTGTGCAAGCAGCTGTCCGACCGGAAGAAGCGGCTGGA AGAACAGCTGGAACGGCTGCAGGAACTGCAGGAGGCCACCGACGA GCTGGACCTGAAACTGAGACAGGCCGAAGTGATCAAGGGCAGCTGG CAGCCAGTGGGCGACCTGCTGATCGACTCCCTGCAGGACCATCTGGA AAAAGTGAAGGCCCTGAGAGGCGAGATCGCCCCCCTGAAAGAAAAC GTGTCCCACGTGAACGACCTGGCCCGGCAGCTGACAACACTGGGCA TTCAGCTGAGCCCCTACAACCTGAGCACACTGGAAGATCTGAACACC CGGTGGAAGCTGCTGCAGGTGGCCGTGGAAGATAGAGTGCGGCAGC TGCACGAGGCCCACAGAGATTTTGGCCCTGCCTCCCAGCACTTCCTG AGCACCAGTGTGCAGGGCCCTTGGGAGAGAGCCATCTCCCCTAACA AGGTGCCCTACTACATCAACCACGAGACACAGACCACCTGTTGGGA CCACCCCAAGATGACCGAGCTGTACCAGAGCCTGGCTGACCTGAAC AACGTGCGGTTCAGCGCCTACCGGACCGCCATGAAGCTGCGGAGAC TGCAGAAAGCTCTGTGCCTGGATCTGCTGTCCCTGTCCGCCGCCTGT GATGCCCTGGACCAGCACAATCTGAAGCAGAACGACCAGCCCATGG ATATCCTGCAGATCATCAACTGCCTGACCACCATCTACGACCGGCTG GAACAGGAACACAACAATCTCGTGAACGTGCCCCTGTGCGTGGACA TGTGCCTGAATTGGCTGCTGAATGTGTACGACACCGGCCGGACAGGCACGTGGAAGTCGTGAAGGACCAGTTCCACACCCACGAGGGCTACAT GATGGACCTGACAGCCCACCAGGGCAGAGTGGGCAACATCCTGCAG CTGGGCTCCAAGCTGATCGGCACCGGCAAGCTGAGCGAGGACGAAG AGACAGAGGTGCAGGAACAGATGAACCTGCTGAACAGCAGATGGG AGTGCCTGCGGGTGGCCAGCATGGAAAAGCAGAGCAACCTGCATAG GGTCCTGCT GAAGTGGCAGCGGCTGACCGAGGAACAGTGCCTGTTT AGCGCCTGGCTGTCCGAGAAAGAGGACGCCGTGAACAAGATCCACA CCACCGGCTTCAAGGACCAGAACGATGCTGAGCAGCCTGCAGAA ACTGGCCGTGCTGAAGGCCGACCTGGAAAAGAAAAAGCAGTCCATG GGCAAGCTGTACTCCCTGAAGCAGGACCTGCTGTCCACCCTGAAGA ACAAGAGCGTGACCCAGAAAACCGA GGCCTGGCTGGACAACTTCGC CCGGTGCTGGGACAACCTGGTGCAGAAGCTGGAAAAGTCCACCGCC CAGATCTCCCAGGCCGTGACCACAACACAGCCCAGCCTGACCCAGA CCACCGTGATGGAAACCGTGACAACAGTGACCACCCGGGAACAGAT CCTCGTGAAGCACGCCCAGGAAGAACTGCCCCCTCCACCCCCCCAG AAGAAACGGCAGATCACAGTGGACAGTGAAGCTCAGATCC ACACCG TGCGGGAAGAGACAATGATGGTCATGACAGAGGACATGCCCCTGGA AATCAGCTACGTGCCCAGCACCTACCTGACCGAGATCACCCATGTGT CCCAGGCCCTGCTGGAAGTGGAACAGCTGCTGAACGCCCCCGACCT GTGCGCCAAGGATTTCGAGGACCTGTTCAAGCAGGAAGAGAGCCTG AAGAATATCAAGGATAGCCTGCAGCAGAGCAGCGGCCGGATCGACA TCATCC ACAGCAAGAAAACAGCCGCCCTGCAGAGCGCCACCCCCGT GGAAAGAGTGAAACTGCAGGAAGCCCTGTCCCAGCTGGACTTCCAG TGGGAGAAAGTGAACAAAATGTACAAGGACCGGCAGGGCAGATTCG ACCGCAGCGTGGAAAAGTGGCGGCGGTTCCACTACGACATCAAGAT CTTCAACCAGTGGCTGACAGAGGCCGAGCAGTTCCTGAGAAAGACC CAGATCCCCGAGAACTGGGAGC ACGCCAAGTACAAGTGGTATCTGA AAGAGCTGCAGGACGGCATCGGCCAGAGACAGACAGTCGTGCGGAC CCTGAATGCCACCGGCGAGGAAATCATCCAGCAGTCCAGCAAGACC GACGCCAGCATTCTGCAGGAAAAGCTGGGCAGCCTGAACCTGCGGT GGCAGGAAGTGTGCAAGCAGCTGTCCGACCGGAAGAAGCGGCTGGA AGAACAGCTGGAACGGCTGCAGGAACTGCAG GAGGCCACCGACGA GCTGGACCTGAAACTGAGACAGGCCGAAGTGATCAAGGGCAGCTGG CAGCCAGTGGGCGACCTGCTGATCGACTCCCTGCAGGACCATCTGGA AAAAGTGAAGGCCCTGAGAGGCGAGATCGCCCCTGAAAGAAAC GTGTCCCACGTGAACGACCTGGCCCGGCAGCTGACAACACTGGGCA TTCAGCTGAGCCCCTACAACCTGAGCACACTGGAAGATCTGAACA CC CGGTGGAAGCTGCTGCAGGTGGCCGTGGAAGATAGAGTGCGGCAGC TGCACGAGGCCCACAGAGATTTTGGCCCTGCCTCCCAGCACTTCCTG AGCACCAGTGTGCAGGGCCCTTGGGAGAGAGCCATCTCCCCTAACA AGGTGCCCTACTACATCAACCACGAGACACAGACCACCTGTTGGGA CCACCCCAAGATGACCGAGCTGTACCAGAGCCTGGCTGACCTGAAC AACGTGCGG TTCAGCGCCTACCGGACCGCCATGAAGCTGCGGAGAC TGCAGAAAGCTCTGTGCCTGGATCTGCTGTCCCTGTCCGCCGCCTGT GATGCCCTGGACCAGCACAATCTGAAGCAGAACGACCAGCCCATGG ATATCCTGCAGATCATCAACTGCCTGACCACCATCTACGACCGGCTG GAACAGGAACACAACAATCTCGTGAACGTGCCCCTGTGCGTGGACA TGTGCCTGAATTGGCTGCTGAA TGTGTACGACACCGGCCGGACAGGC

- 55 046419- 55 046419

CGGATCAGAGTGCTGTCCTTCAAGACCGGCATCATCAGCCTGTGCAA AGCCCACCTGGAAGATAAGTACCGGTATCTGTTCAAACAGGTGGCCT CTAGCACCGGCTTTTGCGACCAGAGAAGGCTGGGCCTGCTGCTGCAC GACAGCATCCAGATCCCTAGACAGCTGGGCGAAGTGGCCAGCTTTG GCGGCAGCAACATCGAGCCTAGCGTGCGGAGCTGCTTCCAGTTCGCC AACAACAAGCCCGAGATCGAGGCCGCCCTGTTCCTGGACTGGATGA GACTGGAACCCCAGAGCATGGTGTGGCTGCCCGTGCTGCATAGAGT GGCCGCTGCCGAGACAGCCAAGCACCAGGCCAAGTGCAACATCTGC AAAGAGTGCCCCATCATCGGCTTCCGGTACAGAAGCCTGAAGCACTT CAACTACGATATCTGCCAGAGCTGTTTCTTCAGCGGCAGGGTGGCCA AGGGCCACAAAATGCACTACCCCATGGTGGAATACTGCACCCCCAC CACAAGCGGCGAGGATGTGCGGGATTTCGCCAAGGTGCTGAAAAAC AAGTTCCGGACCAAGCGGTACTTCGCCAAACACCCCCGGATGGGCT ACCTGCCTGTGCAGACAGTGCTGGAAGGCGACAACATGGAAACCGA CACCATGTGATGATGATTTGGGCAGAGCGATGGAGTCCTTAGTATCA GTCATGACAGATGAAGAAGGAGCAGAATAAATGTTTTACAACTCCT GATTCCCGCATGCGGCCAGCTTATCGATACCGTCGAAATAAAAGATC CTTATTTTCATTGGATCTGTGTGTTGGTTTTTTGTGTG CGGATCAGAGTGCTGTCCTTCAAGACCGGCATCATCAGCCTGTGCAA AGCCCACCTGGAAGATAAGTACCGGTATCTGTTCAAACAGGTGGCCT CTAGCACCGGCTTTTGCGACCAGAGAAGGCTGGGCCTGCTGCTGCAC GACAGCATCCAGATCCCTAGACAGCTGGGCGAAGTGGCCAGCTTTG GCGGCAGCAACATCGAGCCTAGCGTGCGGAGCTGCTTCCAGTTCGCC AACA ACAAGCCCGAGATCGAGGCCGCCCTGTTCCTGGACTGGATGA GACTGGAACCCCAGAGCATGGTGTGGCTGCCCGTGCTGCATAGAGT GGCCGCTGCCGAGACAGCCAAGCACCAGGCCAAGTGCAACATCTGC AAAGAGTGCCCCATCATCGGCTTCCGGTACAGAAGCCTGAAGCACTT CAACTACGATATCTGCCAGAGCTGTTTCTTCAGCGGCAGGGTGGCCA AGGGCCACAAAATGCACT ACCCCATGGTGGAATACTGCACCCCCAC CACAAGCGGCGAGGATGTGCGGGATTTCGCCAAGGTGCTGAAAAAC AAGTTCCGGACCAAGCGGTACTTCGCCAAACACCCCCGGATGGGCT ACCTGCCTGTGCAGACAGTGCTGGAAGGCGACAACATGGAAACCGA CACCATGTGATGATGATTTGGGCAGAGCGATGGAGTCCTTAGTATCA GTCATGACAGATGAAGAAGGAGCAGAATAAATGTTT TACAACTCCT GATTCCCGCATGCGGCCAGCTTATCGATACCGTCGAAATAAAAGATC CTTATTTTCATTGGATCTGTGTGTTGGTTTTTTGTGTG SEQ ID NO: 134 - BXA- 196473 SEQ ID NO: 134 - BXA- 196473 ATGCTGTGGTGGGAGGAAGTGGAAGATTGCTACGAGCGCGAGGACG TGCAGAAGAAAACCTTCACCAAATGGGTGAACGCCCAGTTCAGCAA GTTCGGCAAGCAGCACATCGAGAACCTGTTCAGCGACCTGCAGGAC GGCAGACGGCTGCTGGACCTGCTGGAAGGCCTGACCGGCCAGAAGC TGCCCAAAGAGAAGGGCAGCACCAGAGTGCACGCCCTGAACAACGT GAACAAGGCCCTGCGGGTGCTGCAGAACAACAACGTGGACCTGGTG AACATCGGCAGCACCGACATCGTGGACGGCAACCACAAGCTGACCC TGGGCCTGATCTGGAACATCATCCTGCACTGGCAGGTCAAAAACGTG ATGAAGAACATCATGGCCGGCCTGCAGCAGACCAACAGCGAGAAGA TCCTGCTGAGCTGGGTGCGCCAGAGCACCCGGAACTACCCCCAGGTC AACGTGATCAACTTCACCACCTCTTGGAGCGACGGCCTGGCCCTGAA CGCCCTGATCCACAGCCACCGGCCCGACCTGTTCGACTGGAACAGCG TGGTCTGCCAGCAGAGCGCCACCCAGCGGCTGGAACACGCCTTCAA TATCGCCAGATACCAGCTGGGCATCGAGAAGCTGCTGGATCCCGAG GACGTGGACACCACCTACCCCGACAAGAAATCCATCCTGATGTATAT CACCAGCCTGTTCCAGGTGCTGCCCCAGCAGGTGTCCATCGAGGCCA TCCAGGAAGTGGAAATGCTGCCCAGACCCCCCAAAGTGACCAAAGA GGAACACTTCCAGCTGCACCACCAGATGCACTACAGCCAGCAGATC ACCGTGTCCCTGGCCCAGGGCTACGAGAGAACCAGCAGCCCCAAGC CCCGGTTCAAGAGCTACGCCTATACCCAGGCCGCCTACGTGACCACC AGCGACCCTACCAGAAGCCCATTCCCCAGCCAGCATCTGGAAGCCC CCGAGGACAAGAGCTTCGGCAGCAGCCTGATGGAAAGCGAAGTGAA CCTGGACAGATACCAGACCGCCCTGGAAGAGGTGCTGAGCTGGCTG CTGAGCGCCGAGGATACACTGCAGGCTCAGGGCGAGATCAGCAACG ACGTGGAAGTCGTGAAGGACCAGTTCCACACCCACGAGGGCTACAT GATGGACCTGACAGCCCACCAGGGCAGAGTGGGCAACATCCTGCAG CTGGGCTCCAAGCTGATCGGCACCGGCAAGCTGAGCGAGGACGAAG AGACAGAGGTGCAGGAACAGATGAACCTGCTGAACAGCAGATGGG AGTGCCTGCGGGTGGCCAGCATGGAAAAGCAGAGCAACCTGCATCT GCTGAAGTGGCAGCGGCTGACCGAGGAACAGTGCCTGTTTAGCGCC ATGCTGTGGTGGGAGGAAGTGGAAGATTGCTACGAGCGCGAGGACG TGCAGAAGAAAACCTTCACCAAATGGGTGAACGCCCAGTTCAGCAA GTTCGGCAAGCAGCACATCGAGAACCTGTTCAGCGACCTGCAGGAC GGCAGACGGCTGCTGGACCTGCTGGAAGGCCTGACCGGCCAGAAGC TGCCCAAAGAAGGGCAGCACCAGAGTGCACGCCCTGAACAACGT GAACAAGGCCC TGCGGGTGCTGCAGAACAACAACGTGGACCTGGTG AACATCGGCAGCACCGACATCGTGGACGGCAACCACAAGCTGACCC TGGGCCTGATCTGGAACATCATCCTGCACTGGCAGGTCAAAAACGTG ATGAAGAACATCATGGCCGGCCTGCAGCAGACCAACAGCGAGAAGA TCCTGCTGAGCTGGGTGCGCCAGAGCACCCGGAACTACCCCCAGGTC AACGTGATCAACTTCACCACCTCTTAG CGACGGCCTGGCCCTGAA CGCCCTGATCCACAGCCACCGGCCCGACCTGTTCGACTGGAACAGCG TGGTCTGCCAGCAGAGCGCCACCCAGCGGCTGGAACACGCCTTCAA TATCGCCAGATACCAGCTGGGCATCGAGAAGCTGCTGGATCCCGAG GACGTGGACACCACCTACCCCGACAAGAAATCCATCCTGATGTATAT CACCAGCCTGTTCCAGGTGCTGCCCCAGGTGTCCAT CGAGGCCA TCCAGGAAGTGGAAATGCTGCCCAGACCCCCCAAAGTGACCAAAGA GGAACACTTCCAGCTGCACCACCAGATGCACTACAGCCAGCAGATC ACCGTGTCCCTGGCCCAGGGCTACGAGAGAACCAGCAGCCCCAAGC CCCGGTTCAAGAGCTACGCCTATACCCAGGCCGCCTACGTGACCACC AGCGACCCTACCAGAAGCCCATTCCCCAGCCAGCATCTGGAAGCCC CCGAGGA CAAGAGCTTCGGCAGCAGCCTGATGGAAAGCGAAGTGAA CCTGGACAGATACCAGACCGCCCTGGAAGAGGTGCTGAGCTGGCTG CTGAGCGCCGAGGATACACTGCAGGCTCAGGGCGAGATCAGCAACG ACGTGGAAGTCGTGAAGGACCAGTTCCACACCCACGAGGGCTACAT GATGGACCTGACAGCCCACCAGGGCAGAGTGGGCAACATCCTGCAG CTGGGCTCCAAGCTGATCGGCA CCGGCAAGCTGAGCGAGGACGAAG AGACAGAGGTGCAGGAACAGATGAACCTGCTGAACAGCAGATGGG AGTGCCTGCGGGTGGCCAGCATGGAAAAGCAGAGCAACCTGCATCT GCTGAAGTGGCAGCGGCTGACCGAGGAACAGTGCCTGTTTAGCGCC

- 56 046419- 56 046419

TGGCTGTCCGAGAAAGAGGACGCCGTGAACAAGATCCACACCACCG GCTTCAAGGACCAGAACGAGATGCTGAGCAGCCTGCAGAAACTGGC CGTGCTGAAGGCCGACCTGGAAAAGAAAAAGCAGTCCATGGGCAAG CTGTACTCCCTGAAGCAGGACCTGCTGTCCACCCTGAAGAACAAGA GCGTGACCCAGAAAACCGAGGCCTGGCTGGACAACTTCGCCCGGTG CTGGGACAACCTGGTGCAGAAGCTGGAAAAGTCCACCGCCCAGATC TCCCAGGCCGTGACCACAACACAGCCCAGCCTGACCCAGACCACCG TGATGGAAACCGTGACAACAGTGACCACCCGGGAACAGATCCTCGT GAAGCACGCCCAGGAAGAACTGCCCCCTCCACCCCCCCAGAAGAAA CGGCAGATCACAGTGGACATCCACACCGTGCGGGAAGAGACAATGA TGGTCATGACAGAGGACATGCCCCTGGAAATCAGCTACGTGCCCAG CACCTACCTGACCGAGATCACCCATGTGTCCCAGGCCCTGCTGGAAG TGGAACAGCTGCTGAACGCCCCCGACCTGTGCGCCAAGGATTTCGA GGACCTGTTCAAGCAGGAAGAGAGCCTGAAGAATATCAAGGATAGC CTGCAGCAGAGCAGCGGCCGGATCGACATCATCCACAGCAAGAAAA CAGCCGCCCTGCAGAGCGCCACCCCCGTGGAAAGAGTGAAACTGCA GGAAGCCCTGTCCCAGCTGGACTTCCAGTGGGAGAAAGTGAACAAA ATGTACAAGGACCGGCAGGGCAGATTCGACCGCAGCGTGGAAAAGT GGCGGCGGTTCCACTACGACATCAAGATCTTCAACCAGTGGCTGACA GAGGCCGAGCAGTTCCTGAGAAAGACCCAGATCCCCGAGAACTGGG AGCACGCCAAGTACAAGTGGTATCTGAAAGAGCTGCAGGACGGCAT CGGCCAGAGACAGACAGTCGTGCGGACCCTGAATGCCACCGGCGAG GAAATCATCCAGCAGTCCAGCAAGACCGACGCCAGCATTCTGCAGG AAAAGCTGGGCAGCCTGAACCTGCGGTGGCAGGAAGTGTGCAAGCA GCTGTCCGACCGGAAGAAGCGGCTGGAAGAACAGCTGGAACGGCTG CAGGAACTGCAGGAGGCCACCGACGAGCTGGACCTGAAACTGAGAC AGGCCGAAGTGATCAAGGGCAGCTGGCAGCCAGTGGGCGACCTGCT GATCGACTCCCTGCAGGACCATCTGGAAAAAGTGAAGGCCCTGAGA GGCGAGATCGCCCCCCTGAAAGAAAACGTGTCCCACGTGAACGACC TGGCCCGGCAGCTGACAACACTGGGCATTCAGCTGAGCCCCTACAA CCTGAGCACACTGGAAGATCTGAACACCCGGTGGAAGCTGCTGCAG GTGGCCGTGGAAGATAGAGTGCGGCAGCTGCACGAGGCCCACAGAG ATTTTGGCCCTGCCTCCCAGCACTTCCTGAGCACCAGTGTGCAGGGC CCTTGGGAGAGAGCCATCTCCCCTAACAAGGTGCCCTACTACATCAA CCACGAGACACAGACCACCTGTTGGGACCACCCCAAGATGACCGAG CTGTACCAGAGCCTGGCTGACCTGAACAACGTGCGGTTCAGCGCCTA CCGGACCGCCATGAAGCTGCGGAGACTGCAGAAAGCTCTGTGCCTG GATCTGCTGTCCCTGTCCGCCGCCTGTGATGCCCTGGACCAGCACAA TCTGAAGCAGAACGACCAGCCCATGGATATCCTGCAGATCATCAACT GCCTGACCACCATCTACGACCGGCTGGAACAGGAACACAACAATCT CGTGAACGTGCCCCTGTGCGTGGACATGTGCCTGAATTGGCTGCTGA ATGTGTACGACACCGGCCGGACAGGCCGGATCAGAGTGCTGTCCTTC AAGACCGGCATCATCAGCCTGTGCAAAGCCCACCTGGAAGATAAGT ACCGGTATCTGTTCAAACAGGTGGCCTCTAGCACCGGCTTTTGCGAC CAGAGAAGGCTGGGCCTGCTGCTGCACGACAGCATCCAGATCCCTA GACAGCTGGGCGAAGTGGCCAGCTTTGGCGGCAGCAACATCGAGCC TAGCGTGCGGAGCTGCTTCCAGTTCGCCAACAACAAGCCCGAGATC GAGGCCGCCCTGTTCCTGGACTGGATGAGACTGGAACCCCAGAGCATGGCTGTCCGAGAAAGAGGACGCCGTGAACAAGATCCACACCACG GCTTCAAGGACCAGAACGAGATGCTGAGCAGCCTGCAGAAACTGGC CGTGCTGAAGGCCGACCTGGAAAAGAAAAAGCAGTCCATGGGCAAG CTGTACTCCCTGAAGCAGGACCTGCTGTCCACCCTGAAGAACAAGA GCGTGACCCAGAAAACCGAGGCCTGGCTGGACAACTTCGCCCGGTG CTGGGACAAC CTGGTGCAGAAGCTGGAAAAGTCCACCGCCCAGATC TCCCAGGCCGTGACCACAACACAGCCCAGCCTGACCCAGACCACG TGATGGAAACCGTGACAACAGTGACCACCCGGGAACAGATCCTCGT GAAGCACGCCCAGGAAACTGCCCCCTCCACCCCCCCAGAAGAAA CGGCAGATCACAGTGGACATCCACACCGTGCGGGAAGAGACAATGA TGGTCATGACAGAGGACATGCCC CTGGAAATCAGCTACGTGCCCAG CACCTACCTGACCGAGATCACCCATGTGTCCCAGGCCCTGCTGGAAG TGGAACAGCTGCTGAACGCCCCCGACCTGTGCGCCAAGGATTTCGA GGACCTGTTCAAGCAGGAAGAGCCTGAAGAATATCAAGGATAGC CTGCAGCAGAGCAGCGGCCGGATCGACATCATCCACAGCAAGAAAA CAGCCGCCCTGCAGAGCGCCACCCCCGTGGAAAGAG C GGCCAGAGACAGACAGTCGTGCGGACCCTGAATGCCACCGGCGAG GAAATCATCCAGCAGTCCAGCAACCGACGCCAGCATTCTGCAGG AAAAGCTGGGCAGCCTGAACCTGCGGTGGCAGGAAGTGTGCAAGCA GCTGTCCGACCGGAAGAAGCGGCTGGAAGAACAGCTGGAACGGCTG CAGGAACTGCAGGAGGCCACCGACGAGCTGGACCTGAAACTGAGAC AGGCCGAAGTGATCAAG GGCAGCTGGCAGCCAGTGGGCGACCTGCT GATCGACTCCCTGCAGGACCATCTGGAAAAAGTGAAGGCCCTGAGA GGCGAGATCGCCCCCCTGAAAGAAAACGTGTCCCACGTGAACGACC TGGCCCGGCAGCTGACAACACTGGGCATTCAGCTGAGCCCCTACAA CCTGAGCACACTGGAAGATCTGAACACCCGGTGGAAGCTGCTGCAG GTGGCCGTGGAAGATAGAGTGCGGCAGCTGC ACGAGGCCCACAGAG ATTTTGGCCCTGCCTCCCAGCACTTCCTGAGCACCAGTGTGCAGGGC CCTTGGGAGAGAGCCATCTCCCCTAACAAGGTGCCCTACTACATCAA CCACGAGACACAGACCACCTGTTGGGACCACCCCAAGATGACCGAG CTGTACCAGAGCCTGGCTGACCTGAACAACGTGCGGTTCAGCGCCTA CCGGACCGCCATGAAGCTGCGGAGACTGCAGAAAGCTCTGTGCC TG GATCTGCTGTCCCTGTCCGCCGCCTGTGATGCCCTGGACCAGCACAA TCTGAAGCAGAACGACCAGCCCATGGATATCCTGCAGATCATCAACT GCCTGACCACCATCTACGACCGGCTGGAACAGGAACACAACAATCT CGTGAACGTGCCCCTGTGCGTGGACATGTGCCTGAATTGGCTGCTGA ATGTGTACGACACCGGCCGGACAGGCCGGATCAGAGTGCTGTCCTTC AAGA CCGGCATCATCAGCCTGTGCAAAGCCCACCTGGAAGATAAGT ACCGGTATCTGTTCAAACAGGTGGCCTCTAGCACCGGCTTTTGCGAC CAGAGAAGGCTGGGCCTGCTGCTGCACGACAGCATCCAGATCCCTA GACAGCTGGGCGAAGTGGCCAGCTTTGGCGGCAGCAACATCGAGCC TAGCGTGCGGAGCTGCTTCCAGTTCGCCAACAACAAGCCCGAGATC GAGGCCGCCCTGTTCCTG ACTGGATGAGACTGGAACCCCAGAGCA

- 57 046419- 57 046419

TGGTGTGGCTGCCCGTGCTGCATAGAGTGGCCGCTGCCGAGACAGCC AAGCACCAGGCCAAGTGCAACATCTGCAAAGAGTGCCCCATCATCG GCTTCCGGTACAGAAGCCTGAAGCACTTCAACTACGATATCTGCCAG AGCTGTTTCTTCAGCGGCAGGGTGGCCAAGGGCCACAAAATGCACT ACCCCATGGTGGAATACTGCACCCCCACCACAAGCGGCGAGGATGT GCGGGATTTCGCCAAGGTGCTGAAAAACAAGTTCCGGACCAAGCGG TACTTCGCCAAACACCCCCGGATGGGCTACCTGCCTGTGCAGACAGT GCTGGAAGGCGACAACATGGAAACCGACACCATGTGATGATGATTT GGGCAGAGCGATGGAGTCCTTAGTATCAGTCATGACAGATGAAGAA GGAGCAGAATAAATGTTTTACAACTCCTGATTCCCGCATGCGGCCAG CTTATCGATACCGTCGAAATAAAAGATCCTTATTTTCATTGGATCTGT GTGTTGGTTTTTTGTGTG TGGTGTGGCTGCCCGTGCTGCATAGAGTGGCCGCTGCCGAGACAGCC AAGCACCAGGCCAAGTGCAACATCTGCAAAGAGTGCCCCATCATCG GCTTCCGGTACAGAAGCCTGAAGCACTTCAACTACGATATCTGCCAG AGCTGTTTCTTCAGCGGCAGGGTGGCCAAGGGCCACAAAATGCACT ACCCCATGGTGGAATACTGCACCCCCACCACAAGCGGCGAGGATGT GCGGGATTTCGCC AAGGTGCTGAAAAACAAGTTCCGGACCAAGCGG TACTTCGCCAAACACCCCCGGATGGGCTACCTGCCTGTGCAGACAGT GCTGGAAGGCGACAACATGGAAACCGACACCATGTGATGATGATTT GGGCAGAGCGATGGAGTCCTTAGTATCAGTCATGACAGATGAAGAA GGAGCAGAATAAATGTTTTACAACTCCTGATTCCCGCATGCGGCCAG CTTATCGATACCGTCGAAATA AAAGATCCTTATTTTCATTGGATCTGT GTGTTGGTTTTTTGTGTG SEQ ID NO: 135 - BXA- 196474 SEQ ID NO: 135 - BXA- 196474 ATGCTGTGGTGGGAGGAAGTGGAAGATTGCTACGAGCGCGAGGACG TGCAGAAGAAAACCTTCACCAAATGGGTGAACGCCCAGTTCAGCAA GTTCGGCAAGCAGCACATCGAGAACCTGTTCAGCGACCTGCAGGAC GGCAGACGGCTGCTGGACCTGCTGGAAGGCCTGACCGGCCAGAAGC TGCCCAAAGAGAAGGGCAGCACCAGAGTGCACGCCCTGAACAACGT GAACAAGGCCCTGCGGGTGCTGCAGAACAACAACGTGGACCTGGTG AACATCGGCAGCACCGACATCGTGGACGGCAACCACAAGCTGACCC TGGGCCTGATCTGGAACATCATCCTGCACTGGCAGGTCAAAAACGTG ATGAAGAACATCATGGCCGGCCTGCAGCAGACCAACAGCGAGAAGA TCCTGCTGAGCTGGGTGCGCCAGAGCACCCGGAACTACCCCCAGGTC AACGTGATCAACTTCACCACCTCTTGGAGCGACGGCCTGGCCCTGAA CGCCCTGATCCACAGCCACCGGCCCGACCTGTTCGACTGGAACAGCG TGGTCTGCCAGCAGAGCGCCACCCAGCGGCTGGAACACGCCTTCAA TATCGCCAGATACCAGCTGGGCATCGAGAAGCTGCTGGATCCCGAG GACGTGGACACCACCTACCCCGACAAGAAATCCATCCTGATGTATAT CACCAGCCTGTTCCAGGTGCTGCCCCAGCAGGTGTCCATCGAGGCCA TCCAGGAAGTGGAAATGCTGCCCAGACCCCCCAAAGTGACCAAAGA GGAACACTTCCAGCTGCACCACCAGATGCACTACAGCCAGCAGATC ACCGTGTCCCTGGCCCAGGGCTACGAGAGAACCAGCAGCCCCAAGC CCCGGTTCAAGAGCTACGCCTATACCCAGGCCGCCTACGTGACCACC AGCGACCCTACCAGAAGCCCATTCCCCAGCCAGCATCTGGAAGCCC CCGAGGACAAGAGCTTCGGCAGCAGCCTGATGGAAAGCGAAGTGAA CCTGGACAGATACCAGACCGCCCTGGAAGAGGTGCTGAGCTGGCTG CTGAGCGCCGAGGATACACTGCAGGCTCAGGGCGAGATCAGCAACG ACGTGGAAGTCGTGAAGGACCAGTTCCACACCCACGAGGGCTACAT GATGGACCTGACAGCCCACCAGGGCAGAGTGGGCAACATCCTGCAG CTGGGCTCCAAGCTGATCGGCACCGGCAAGCTGAGCGAGGACGAAG AGACAGAGGTGCAGGAACAGATGAACCTGCTGAACAGCAGATGGG AGTGCCTGCGGGTGGCCAGCATGGAAAAGCAGAGCAACCTGCATCT GCTGAAGTGGCAGCGGCTGACCGAGGAACAGTGCCTGTTTAGCGCC TGGCTGTCCGAGAAAGAGGACGCCGTGAACAAGATCCACACCACCG GCTTCAAGGACCAGAACGAGATGCTGAGCAGCCTGCAGAAACTGGC CGTGCTGAAGGCCGACCTGGAAAAGAAAAAGCAGTCCATGGGCAAG CTGTACTCCCTGAAGCAGGACCTGCTGTCCACCCTGAAGAACAAGA GCGTGACCCAGAAAACCGAGGCCTGGCTGGACAACTTCGCCCGGTG CTGGGACAACCTGGTGCAGAAGCTGGAAAAGTCCACCGCCCAGATC ATGCTGTGGTGGGAGGAAGTGGAAGATTGCTACGAGCGCGAGGACG TGCAGAAGAAAACCTTCACCAAATGGGTGAACGCCCAGTTCAGCAA GTTCGGCAAGCAGCACATCGAGAACCTGTTCAGCGACCTGCAGGAC GGCAGACGGCTGCTGGACCTGCTGGAAGGCCTGACCGGCCAGAAGC TGCCCAAAGAAGGGCAGCACCAGAGTGCACGCCCTGAACAACGT GAACAAGGCCC TGCGGGTGCTGCAGAACAACAACGTGGACCTGGTG AACATCGGCAGCACCGACATCGTGGACGGCAACCACAAGCTGACCC TGGGCCTGATCTGGAACATCATCCTGCACTGGCAGGTCAAAAACGTG ATGAAGAACATCATGGCCGGCCTGCAGCAGACCAACAGCGAGAAGA TCCTGCTGAGCTGGGTGCGCCAGAGCACCCGGAACTACCCCCAGGTC AACGTGATCAACTTCACCACCTCTTAG CGACGGCCTGGCCCTGAA CGCCCTGATCCACAGCCACCGGCCCGACCTGTTCGACTGGAACAGCG TGGTCTGCCAGCAGAGCGCCACCCAGCGGCTGGAACACGCCTTCAA TATCGCCAGATACCAGCTGGGCATCGAGAAGCTGCTGGATCCCGAG GACGTGGACACCACCTACCCCGACAAGAAATCCATCCTGATGTATAT CACCAGCCTGTTCCAGGTGCTGCCCCAGGTGTCCAT CGAGGCCA TCCAGGAAGTGGAAATGCTGCCCAGACCCCCCAAAGTGACCAAAGA GGAACACTTCCAGCTGCACCACCAGATGCACTACAGCCAGCAGATC ACCGTGTCCCTGGCCCAGGGCTACGAGAGAACCAGCAGCCCCAAGC CCCGGTTCAAGAGCTACGCCTATACCCAGGCCGCCTACGTGACCACC AGCGACCCTACCAGAAGCCCATTCCCCAGCCAGCATCTGGAAGCCC CCGAGGA CAAGAGCTTCGGCAGCAGCCTGATGGAAAGCGAAGTGAA CCTGGACAGATACCAGACCGCCCTGGAAGAGGTGCTGAGCTGGCTG CTGAGCGCCGAGGATACACTGCAGGCTCAGGGCGAGATCAGCAACG ACGTGGAAGTCGTGAAGGACCAGTTCCACACCCACGAGGGCTACAT GATGGACCTGACAGCCCACCAGGGCAGAGTGGGCAACATCCTGCAG CTGGGCTCCAAGCTGATCGGCA CCGGCAAGCTGAGCGAGGACGAAG AGACAGAGGTGCAGGAACAGATGAACCTGCTGAACAGCAGATGGG AGTGCCTGCGGGTGGCCAGCATGGAAAAGCAGAGCAACCTGCATCT GCTGAAGTGGCAGCGGCTGACCGAGGAACAGTGCCTGTTTAGCGCC TGGCTGTCCGAGAAAGAGGACGCCGTGAACAAGATCCACACCACCG GCTTCAAGGACCAGAACGAGATGCTGAGCAGCCTGCA GAAACTGGC CGTGCTGAAGGCCGACCTGGAAAAGAAAAAGCAGTCCATGGGCAAG CTGTACTCCCTGAAGCAGGACCTGCTGTCCACCCTGAAGAACAAGA GCGTGACCCAGAAAACCGAGGCCTGGCTGGACAACTTCGCCCGGTG CTGGGACAACCTGGTGCAGAAGCTGGAAAAGTCCACCGCCCAGATC

- 58 046419- 58 046419

TCCCAGGCCGTGACCACAACACAGCCCAGCCTGACCCAGACCACCG TGATGGAAACCGTGACAACAGTGACCACCCGGGAACAGATCCTCGT GAAGCACGCCCAGGAAGAACTGCCCCCTCCACCCCCCCAGAAGAAA CGGCAGATCACAGTGGACAGTGAAGCTCAGATCCACACCGTGCGGG AAGAGACAATGATGGTCATGACAGAGGACATGCCCCTGGAAATCAG CTACGTGCCCAGCACCTACCTGACCGAGATCACCCATGTGTCCCAGG CCCTGCTGGAAGTGGAACAGCTGCTGAACGCCCCCGACCTGTGCGCC AAGGATTTCGAGGACCTGTTCAAGCAGGAAGAGAGCCTGAAGAATA TCAAGGATAGCCTGCAGCAGAGCAGCGGCCGGATCGACATCATCCA CAGCAAGAAAACAGCCGCCCTGCAGAGCGCCACCCCCGTGGAAAGA GTGAAACTGCAGGAAGCCCTGTCCCAGCTGGACTTCCAGTGGGAGA AAGTGAACAAAATGTACAAGGACCGGCAGGGCAGATTCGACCGCAG CGTGGAAAAGTGGCGGCGGTTCCACTACGACATCAAGATCTTCAAC CAGTGGCTGACAGAGGCCGAGCAGTTCCTGAGAAAGACCCAGATCC CCGAGAACTGGGAGCACGCCAAGTACAAGTGGTATCTGAAAGAGCT GCAGGACGGCATCGGCCAGAGACAGACAGTCGTGCGGACCCTGAAT GCCACCGGCGAGGAAATCATCCAGCAGTCCAGCAAGACCGACGCCA GCATTCTGCAGGAAAAGCTGGGCAGCCTGAACCTGCGGTGGCAGGA AGTGTGCAAGCAGCTGTCCGACCGGAAGAAGCGGCTGGAAGAACAG AAGAACATCCTGCAGGAACTGCAGGAGGCCACCGACGAGCTGGACC TGAAACTGAGACAGGCCGAAGTGATCAAGGGCAGCTGGCAGCCAGT GGGCGACCTGCTGATCGACTCCCTGCAGGACCATCTGGAAAAAGTG AAGGCCCTGAGAGGCGAGATCGCCCCCCTGAAAGAAAACGTGTCCC ACGTGAACGACCTGGCCCGGCAGCTGACAACACTGGGCATTCAGCT GAGCCCCTACAACCTGAGCACACTGGAAGATCTGAACACCCGGTGG AAGCTGCTGCAGGTGGCCGTGGAAGATAGAGTGCGGCAGCTGCACG AGGCCCACAGAGATTTTGGCCCTGCCTCCCAGCACTTCCTGAGCACC AGTGTGCAGGGCCCTTGGGAGAGAGCCATCTCCCCTAACAAGGTGC CCTACTACATCAACCACGAGACACAGACCACCTGTTGGGACCACCCC AAGATGACCGAGCTGTACCAGAGCCTGGCTGACCTGAACAACGTGC GGTTCAGCGCCTACCGGACCGCCATGAAGCTGCGGAGACTGCAGAA AGCTCTGTGCCTGGATCTGCTGTCCCTGTCCGCCGCCTGTGATGCCCT GGACCAGCACAATCTGAAGCAGAACGACCAGCCCATGGATATCCTG CAGATCATCAACTGCCTGACCACCATCTACGACCGGCTGGAACAGG AACACAACAATCTCGTGAACGTGCCCCTGTGCGTGGACATGTGCCTG AATTGGCTGCTGAATGTGTACGACACCGGCCGGACAGGCCGGATCA GAGTGCTGTCCTTCAAGACCGGCATCATCAGCCTGTGCAAAGCCCAC CTGGAAGATAAGTACCGGTATCTGTTCAAACAGGTGGCCTCTAGCAC CGGCTTTTGCGACCAGAGAAGGCTGGGCCTGCTGCTGCACGACAGC ATCCAGATCCCTAGACAGCTGGGCGAAGTGGCCAGCTTTGGCGGCA GCAACATCGAGCCTAGCGTGCGGAGCTGCTTCCAGTTCGCCAACAAC AAGCCCGAGATCGAGGCCGCCCTGTTCCTGGACTGGATGAGACTGG AACCCCAGAGCATGGTGTGGCTGCCCGTGCTGCATAGAGTGGCCGCT GCCGAGACAGCCAAGCACCAGGCCAAGTGCAACATCTGCAAAGAGT GCCCCATCATCGGCTTCCGGTACAGAAGCCTGAAGCACTTCAACTAC GATATCTGCCAGAGCTGTTTCTTCAGCGGCAGGGTGGCCAAGGGCCA CAAAATGCACTACCCCATGGTGGAATACTGCACCCCCACCACAAGC GGCGAGGATGTGCGGGATTTCGCCAAGGTGCTGAAAAACAAGTTCCTCCCAGGCCGTGACCACAACACAGCCCAGCCTGACCCAGACCACG TGATGGAAACCGTGACAACAGTGACCACCCGGGAACAGATCCTCGT GAAGCACGCCCAGGAAGAACTGCCCCCTCCACCCCCCCAGAAGAAA CGGCAGATCACAGTGGACAGTGAAGCTCAGATCCACACCGTGCGGG AAGACAAATGATGGTCATGACAGAGGACATGCCCCTGGAAATCAG CTACGTGCC CAGCACCTACCTGACCGAGATCACCCATGTGTCCCAGG CCCTGCTGGAAGTGGAACAGCTGCTGAACGCCCCCGACCTGTGCGCC AAGGATTTCGAGGACCTGTTCAAGCAGGAAGAGAGCCTGAAGAATA TCAAGGATAGCCTGCAGCAGAGCAGCGGCCGGATCGACATCATCCA CAGCAAGAAAACAGCCGCCCTGCAGAGCGCCACCCCCGTGGAAAGA GTGAAACTGCAGGAAGCCCTG TCCCAGCTGGACTTCCAGTGGGAGA AAGTGAACAAAATGTACAAGGACCGGCAGGGCAGATTCGACCGCAG CGTGGAAAAGTGGCGGCGGTTCCACTACGACATCAAGATCTTCAAC CAGTGGCTGACAGAGGCCGAGCAGTTCCTGAGAAAGACCCAGATCC CCGAGAACTGGGAGCACGCCAAGTACAAGTGGTATCTGAAAGAGCT GCAGGACGGCATCGGCCAGACAGACAGTCGTG CGGACCCTGAAT GCCACCGGCGAGGAAATCATCCAGCAGTCCAGCAAGACCGACGCCA GCATTCTGCAGGAAAAGCTGGGCAGCCTGAACCTGCGGTGGCAGGA AGTGTGCAAGCAGCTGTCCGACCGGAAGAAGCGGCTGGAAGAACAG AAGAACATCCTGCAGGAACTGCAGGAGGCCACCGACGAGCTGGACC TGAAACTGAGACAGGCCGAAGTGATCAAGGGCAGCTGGCAGCCAGT G GGCGACCTGCTGATCGACTCCCTGCAGGACCATCTGGAAAAAGTG AAGGCCCTGAGAGGCGAGATCGCCCCCCTGAAAGAAAACGTGTCCC ACGTGAACGACCTGGCCCGGCAGCTGACAACACTGGGCATTCAGCT GAGCCCCTACAACCTGAGCACACTGGAAGATCTGAACACCCGGTGG AAGCTGCTGCAGGTGGCCGTGGAAGATAGAGTGCGGCAGCTGCACG AGGCCCACAGAGATTTT GGCCCTGCCTCCCAGCACTTCCTGAGCACC AGTGTGCAGGGCCCTTGGGAGAGAGCCATCTCCCCTAACAAGGTGC CCTACTACATCAACCACGAGACACAGACCACCTGTTGGGAACCACCCC AAGATGACCGAGCTGTACCAGAGCCTGGCTGACCTGAACAACGTGC GGTTCAGCGCCTACCGGACCGCCATGAAGCTGCGGAGACTGCAGAA AGCTCTGTGCCTGGATCTGCTGTCCCTG TCCGCCGCCTGTGATGCCCT GGACCAGCACAATCTGAAGCAGAACGACCAGCCCATGGATATCCTG CAGATCATCAACTGCCTGACCACCATCTACGACCGGCTGGAACAGG AACACAACAATCTCGTGAACGTGCCCCTGTGCGTGGACATGTGCCTG AATTGGCTGCTGAATGTGTACGACACCGGCCGGACAGGCCGGATCA GAGTGCTGTCCTTCAAGACCGGCATCATCAGCCTGTGCAAA AAC CCCAGAGCATGGTGTGGCTGCCCGTGCTGCATAGAGTGGCCGCT GCCGAGACAGCCAAGCACCAGGCCAAGTGCAACATCTGCAAAGAGT GCCCCATCATCGGCTTCCGGTACAGAAGCCTGAAGCACTTCAACTAC GATATCTGCCAGAGCTGTTTCTTCAGCGGCAGGGTGGCCAAGGGCCA CAAAATGCACTACCCCATGGTGGAATACTGCACCCCCACCACAAGC GGCGAGGATGTGCG ATTTCGCCAAGGTGCTGAAAACAAGTTCC

- 59 046419- 59 046419

GGACCAAGCGGTACTTCGCCAAACACCCCCGGATGGGCTACCTGCCT GTGCAGACAGTGCTGGAAGGCGACAACATGGAAACCACACCATGTG ATGATGATTTGGGCAGAGCGATGGAGTCCTTAGTATCAGTCATGACA GATGAAGAAGGAGCAGAATAAATGTTTTACAACTCCTGATTCCCGC ATGCGGCCAGCTTATCGATACCGTCGAAATAAAAGATCCTTATTTTC ATTGGATCTGTGTGTTGGTTTTTTGTGTG GGACCAAGCGGTACTTCGCCAAACACCCCCGGATGGGCTACCTGCCT GTGCAGACAGTGCTGGAAGGCGACAACATGGAAACCACACCATGTG ATGATGATTTGGGCAGAGCGATGGAGTCCTTAGTATCAGTCATGACA GATGAAGAAGGAGCAGAATAAATGTTTTACAACTCCTGATTCCCGC ATGCGGCCAGCTTATCGATACCGTCGAAATAAAAGATCCTTATTTTTC ATTGGATCTGTGTG TTGGTTTTTTTGTGTG SEQ ID NO: 136 - BXA- 196475 SEQ ID NO: 136 - BXA- 196475 ATGCTGTGGTGGGAGGAAGTGGAAGATTGCTACGAGCGCGAGGACG TGCAGAAGAAAACCTTCACCAAATGGGTGAACGCCCAGTTCAGCAA GTTCGGCAAGCAGCACATCGAGAACCTGTTCAGCGACCTGCAGGAC GGCAGACGGCTGCTGGACCTGCTGGAAGGCCTGACCGGCCAGAAGC TGCCCAAAGAGAAGGGCAGCACCAGAGTGCACGCCCTGAACAACGT GAACAAGGCCCTGCGGGTGCTGCAGAACAACAACGTGGACCTGGTG AACATCGGCAGCACCGACATCGTGGACGGCAACCACAAGCTGACCC TGGGCCTGATCTGGAACATCATCCTGCACTGGCAGGTCAAAAACGTG ATGAAGAACATCATGGCCGGCCTGCAGCAGACCAACAGCGAGAAGA TCCTGCTGAGCTGGGTGCGCCAGAGCACCCGGAACTACCCCCAGGTC AACGTGATCAACTTCACCACCTCTTGGAGCGACGGCCTGGCCCTGAA CGCCCTGATCCACAGCCACCGGCCCGACCTGTTCGACTGGAACAGCG TGGTCTGCCAGCAGAGCGCCACCCAGCGGCTGGAACACGCCTTCAA TATCGCCAGATACCAGCTGGGCATCGAGAAGCTGCTGGATCCCGAG GACGTGGACACCACCTACCCCGACAAGAAATCCATCCTGATGTATAT CACCAGCCTGTTCCAGGTGCTGCCCCAGCAGGTGTCCATCGAGGCCA TCCAGGAAGTGGAAATGCTGCCCAGACCCCCCAAAGTGACCAAAGA GGAACACTTCCAGCTGCACCACCAGATGCACTACAGCCAGCAGATC ACCGTGTCCCTGGCCCAGGGCTACGAGAGAACCAGCAGCCCCAAGC CCCGGTTCAAGAGCTACGCCTATACCCAGGCCGCCTACGTGACCACC AGCGACCCTACCAGAAGCCCATTCCCCAGCCAGCATCTGGAAGCCC CCGAGGACAAGAGCTTCGGCAGCAGCCTGATGGAAAGCGAAGTGAA CCTGGACAGATACCAGACCGCCCTGGAAGAGGTGCTGAGCTGGCTG CTGAGCGCCGAGGATACACTGCAGGCTCAGGGCGAGATCAGCAACG ACGTGGAAGTCGTGAAGGACCAGTTCCACACCCACGAGGGCTACAT GATGGACCTGACAGCCCACCAGGGCAGAGTGGGCAACATCCTGCAG CTGGGCTCCAAGCTGATCGGCACCGGCAAGCTGAGCGAGGACGAAG AGACAGAGGTGCAGGAACAGATGAACCTGCTGAACAGCAGATGGG AGTGCCTGCGGGTGGCCAGCATGGAAAAGCAGAGCAACCTGCATCT GCTGAAGTGGCAGCGGCTGACCGAGGAACAGTGCCTGTTTAGCGCC TGGCTGTCCGAGAAAGAGGACGCCGTGAACAAGATCCACACCACCG GCTTCAAGGACCAGAACGAGATGCTGAGCAGCCTGCAGAAACTGGC CGTGCTGAAGGCCGACCTGGAAAAGAAAAAGCAGTCCATGGGCAAG CTGTACTCCCTGAAGCAGGACCTGCTGTCCACCCTGAAGAACAAGA GCGTGACCCAGAAAACCGAGGCCTGGCTGGACAACTTCGCCCGGTG CTGGGACAACCTGGTGCAGAAGCTGGAAAAGTCCACCGCCCAGATC TCCCAGGCCGTGACCACAACACAGCCCAGCCTGACCCAGACCACCG TGATGGAAACCGTGACAACAGTGACCACCCGGGAACAGATCCTCGT GAAGCACGCCCAGGAAGAACTGCCCCCTCCACCCCCCCAGAAGAAA CGGCAGATCACAGTGGACAGTGAAGCTCAGATCCACACCGTGCGGG AAGAGACAATGATGGTCATGACAGAGGACATGCCCCTGGAAATCAG CTACGTGCCCAGCACCTACCTGACCGAGATCACCCATGTGTCCCAGG ATGCTGTGGTGGGAGGAAGTGGAAGATTGCTACGAGCGCGAGGACG TGCAGAAGAAAACCTTCACCAAATGGGTGAACGCCCAGTTCAGCAA GTTCGGCAAGCAGCACATCGAGAACCTGTTCAGCGACCTGCAGGAC GGCAGACGGCTGCTGGACCTGCTGGAAGGCCTGACCGGCCAGAAGC TGCCCAAAGAAGGGCAGCACCAGAGTGCACGCCCTGAACAACGT GAACAAGGCCC TGCGGGTGCTGCAGAACAACAACGTGGACCTGGTG AACATCGGCAGCACCGACATCGTGGACGGCAACCACAAGCTGACCC TGGGCCTGATCTGGAACATCATCCTGCACTGGCAGGTCAAAAACGTG ATGAAGAACATCATGGCCGGCCTGCAGCAGACCAACAGCGAGAAGA TCCTGCTGAGCTGGGTGCGCCAGAGCACCCGGAACTACCCCCAGGTC AACGTGATCAACTTCACCACCTCTTAG CGACGGCCTGGCCCTGAA CGCCCTGATCCACAGCCACCGGCCCGACCTGTTCGACTGGAACAGCG TGGTCTGCCAGCAGAGCGCCACCCAGCGGCTGGAACACGCCTTCAA TATCGCCAGATACCAGCTGGGCATCGAGAAGCTGCTGGATCCCGAG GACGTGGACACCACCTACCCCGACAAGAAATCCATCCTGATGTATAT CACCAGCCTGTTCCAGGTGCTGCCCCAGGTGTCCAT CGAGGCCA TCCAGGAAGTGGAAATGCTGCCCAGACCCCCCAAAGTGACCAAAGA GGAACACTTCCAGCTGCACCACCAGATGCACTACAGCCAGCAGATC ACCGTGTCCCTGGCCCAGGGCTACGAGAGAACCAGCAGCCCCAAGC CCCGGTTCAAGAGCTACGCCTATACCCAGGCCGCCTACGTGACCACC AGCGACCCTACCAGAAGCCCATTCCCCAGCCAGCATCTGGAAGCCC CCGAGGA CAAGAGCTTCGGCAGCAGCCTGATGGAAAGCGAAGTGAA CCTGGACAGATACCAGACCGCCCTGGAAGAGGTGCTGAGCTGGCTG CTGAGCGCCGAGGATACACTGCAGGCTCAGGGCGAGATCAGCAACG ACGTGGAAGTCGTGAAGGACCAGTTCCACACCCACGAGGGCTACAT GATGGACCTGACAGCCCACCAGGGCAGAGTGGGCAACATCCTGCAG CTGGGCTCCAAGCTGATCGGCA CCGGCAAGCTGAGCGAGGACGAAG AGACAGAGGTGCAGGAACAGATGAACCTGCTGAACAGCAGATGGG AGTGCCTGCGGGTGGCCAGCATGGAAAAGCAGAGCAACCTGCATCT GCTGAAGTGGCAGCGGCTGACCGAGGAACAGTGCCTGTTTAGCGCC TGGCTGTCCGAGAAAGAGGACGCCGTGAACAAGATCCACACCACCG GCTTCAAGGACCAGAACGAGATGCTGAGCAGCCTGCA GAAACTGGC CGTGCTGAAGGCCGACCTGGAAAAGAAAAAGCAGTCCATGGGCAAG CTGTACTCCCTGAAGCAGGACCTGCTGTCCACCCTGAAGAACAAGA GCGTGACCCAGAAAACCGAGGCCTGGCTGGACAACTTCGCCCGGTG CTGGGACAACCTGGTGCAGAAGCTGGAAAAGTCCACCGCCCAGATC TCCCAGGCCGTGACCACAACACAGCCCAGCCTGACCCAGACCACG TG ATGGAAACCGTGACAACAGTGACCACCCGGGAACAGATCCTCGT GAAGCACGCCCAGGAAGAACTGCCCCCTCCACCCCCCCAGAAGAAA CGGCAGATCACAGTGGACAGTGAAGCTCAGATCCACACCGTGCGGG AAGACAAATGATGGTCATGACAGAGGACATGCCCCTGGAAATCAG CTACGTGCCCAGCACCTACCTGACCGAGATCACCCCATGTGTCCCAGG

- 60 046419- 60 046419

CCCTGCTGGAAGTGGAACAGCTGCTGAACGCCCCCGACCTGTGCGCC AAGGATTTCGAGGACCTGTTCAAGCAGGAAGAGAGCCTGAAGAATA TCAAGGATAGCCTGCAGCAGAGCAGCGGCCGGATCGACATCATCCA CAGCAAGAAAACAGCCGCCCTGCAGAGCGCCACCCCCGTGGAAAGA GTGAAACTGCAGGAAGCCCTGTCCCAGCTGGACTTCCAGTGGGAGA AAGTGAACAAAATGTACAAGGACCGGCAGGGCAGATTCGACCGCAG CGTGGAAAAGTGGCGGCGGTTCCACTACGACATCAAGATCTTCAAC CAGTGGCTGACAGAGGCCGAGCAGTTCCTGAGAAAGACCCAGATCC CCGAGAACTGGGAGCACGCCAAGTACAAGTGGTATCTGAAAGAGCT GCAGGACGGCATCGGCCAGAGACAGACAGTCGTGCGGACCCTGAAT GCCACCGGCGAGGAAATCATCCAGCAGTCCAGCAAGACCGACGCCA GCATTCTGCAGGAAAAGCTGGGCAGCCTGAACCTGCGGTGGCAGGA AGTGTGCAAGCAGCTGTCCGACCGGAAGAAGCGGCTGGAAGAACAG AAGCTGGAACGGCTGCAGGAACTGCAGGAGGCCACCGACGAGCTGG ACCTGAAACTGAGACAGGCCGAAGTGATCAAGGGCAGCTGGCAGCC AGTGGGCGACCTGCTGATCGACTCCCTGCAGGACCATCTGGAAAAA GTGAAGGCCCTGAGAGGCGAGATCGCCCCCCTGAAAGAAAACGTGT CCCACGTGAACGACCTGGCCCGGCAGCTGACAACACTGGGCATTCA GCTGAGCCCCTACAACCTGAGCACACTGGAAGATCTGAACACCCGG TGGAAGCTGCTGCAGGTGGCCGTGGAAGATAGAGTGCGGCAGCTGC ACGAGGCCCACAGAGATTTTGGCCCTGCCTCCCAGCACTTCCTGAGC ACCAGTGTGCAGGGCCCTTGGGAGAGAGCCATCTCCCCTAACAAGG TGCCCTACTACATCAACCACGAGACACAGACCACCTGTTGGGACCAC CCCAAGATGACCGAGCTGTACCAGAGCCTGGCTGACCTGAACAACG TGCGGTTCAGCGCCTACCGGACCGCCATGAAGCTGCGGAGACTGCA GAAAGCTCTGTGCCTGGATCTGCTGTCCCTGTCCGCCGCCTGTGATG CCCTGGACCAGCACAATCTGAAGCAGAACGACCAGCCCATGGATAT CCTGCAGATCATCAACTGCCTGACCACCATCTACGACCGGCTGGAAC AGGAACACAACAATCTCGTGAACGTGCCCCTGTGCGTGGACATGTG CCTGAATTGGCTGCTGAATGTGTACGACACCGGCCGGACAGGCCGG ATCAGAGTGCTGTCCTTCAAGACCGGCATCATCAGCCTGTGCAAAGC CCACCTGGAAGATAAGTACCGGTATCTGTTCAAACAGGTGGCCTCTA GCACCGGCTTTTGCGACCAGAGAAGGCTGGGCCTGCTGCTGCACGA CAGCATCCAGATCCCTAGACAGCTGGGCGAAGTGGCCAGCTTTGGC GGCAGCAACATCGAGCCTAGCGTGCGGAGCTGCTTCCAGTTCGCCA ACAACAAGCCCGAGATCGAGGCCGCCCTGTTCCTGGACTGGATGAG ACTGGAACCCCAGAGCATGGTGTGGCTGCCCGTGCTGCATAGAGTG GCCGCTGCCGAGACAGCCAAGCACCAGGCCAAGTGCAACATCTGCA AAGAGTGCCCCATCATCGGCTTCCGGTACAGAAGCCTGAAGCACTTC AACTACGATATCTGCCAGAGCTGTTTCTTCAGCGGCAGGGTGGCCAA GGGCCACAAAATGCACTACCCCATGGTGGAATACTGCACCCCCACC ACAAGCGGCGAGGATGTGCGGGATTTCGCCAAGGTGCTGAAAAACA AGTTCCGGACCAAGCGGTACTTCGCCAAACACCCCCGGATGGGCTA CCTGCCTGTGCAGACAGTGCTGGAAGGCGACAACATGGAAACCGAC ACCATGTGATGATGATTTGGGCAGAGCGATGGAGTCCTTAGTATCAG TCATGACAGATGAAGAAGGAGCAGAATAAATGTTTTACAACTCCTG ATTCCCGCATGCGGCCAGCTTATCGATACCGTCGAAATAAAAGATCC TTATTTTCATTGGATCTGTGTGTTGGTTTTTTGTGTGCCCTGCTGGAAGTGGAACAGCTGCTGAACGCCCCCGACCTGTGCGCC AAGGATTTCGAGGACCTGTTCAAGCAGGAAGAGAGCCTGAAGAATA TCAAGGATAGCCTGCAGCAGAGCAGCGGCCGGATCGACATCATCCA CAGCAAGAAAACAGCCGCCCTGCAGAGCGCCACCCCCGTGGAAAGA GTGAAACTGCAGGAAGCCCTGTCCCAGCTGGACTTCCAGTGGGAGA AAGTGAACAAAA TGTACAAGGACCGGCAGGGCAGATTCGACCGCAG CGTGGAAAAGTGGCGGCGGTTCCACTACGACATCAAGATCTTCAAC CAGTGGCTGACAGAGGCCGAGCAGTTCCTGAGAAAGACCCAGATCC CCGAGAACTGGGAGCACGCCAAGTACAAGTGGTATCTGAAAGAGCT GCAGGACGGCATCGGCCAGACAGACAGTCGTGCGGACCCTGAAT GCCACCGGCGAGGAAATCATCCAGCA GTCCAGCAAGACCGACGCCA GCATTCTGCAGGAAAAGCTGGGCAGCCTGAACCTGCGGTGGCAGGA AGTGTGCAAGCAGCTGTCCGACCGGAAGAAGCGGCTGGAAGAACAG AAGCTGGAACGGCTGCAGGAACTGCAGGAGGCCACCGACGAGCTGG ACCTGAAACTGAGACAGGCCGAAGTGATCAAGGGCAGCTGGCAGCC AGTGGGCGACCTGCTGATCGACTCCCTGCAGGACCATCTGG AAAAA GTGAAGGCCCTGAGAGGCGAGATCGCCCCCCTGAAAGAAAACGTGT CCCACGTGAACGACCTGGCCCGGCAGCTGACAACACTGGGCATTCA GCTGAGCCCCTACAACCTGAGCACACTGGAAGATCTGAACACCCGG TGGAAGCTGCTGCAGGTGGCCGTGGAAGATAGAGTGCGGCAGCTGC ACGAGGCCCACAGAGATTTTGGCCCTGCCTCCCAGCACTTCCTGAGC ACCAGTGTGCAGG GCCCTTGGGAGAGAGCCATCTCCCCTAACAAGG TGCCCTACTACATCAACCACGAGACACAGACCACCTGTTGGGACCAC CCCAAGATGACCGAGCTGTACCAGAGCCTGGCTGACCTGAACAACG TGCGGTTCAGCGCCTACCGGACCGCCATGAAGCTGCGGAGACTGCA GAAAGCTCTGTGCCTGGATCTGCTGTCCCTGTCCGCCGCCTGTGATG CCCTGGACCAGCACAATCTGAAGCAGA ACGACCAGCCCATGGATAT CCTGCAGATCATCAACTGCCTGACCACCATCTACGACCGGCTGGAAC AGGAACACAACAATCTCGTGAACGTGCCCCTGTGCGTGGACATGTG CCTGAATTGGCTGCTGAATGTGTACGACACCGGCCGGACAGGCCGG ATCAGAGTGCTGTCCTTCAAGACCGGCATCATCAGCCTGTGCAAAGC CCACCTGGAAGATAAGTACCGGTATCTGTTCAAACAGGTGGCC TCTA GCACCGGCTTTTGCGACCAGAGAAGGCTGGGCCTGCTGCTGCACGA CAGCATCCAGATCCCTAGACAGCTGGGCGAAGTGGCCAGCTTTGGC GGCAGCAACATCGAGCCTAGCGTGCGGAGCTGCTTCCAGTTCGCCA ACAACAAGCCCGAGATCGAGGCCGCCCTGTTCCTGGACTGGATGAG ACTGGAACCCCAGAGCATGGTGTGGCTGCCCGTGCTGCATAGAGTG GCCGCTG CCGAGACAGCCAAGCACCAGGCCAAGTGCAACATCTGCA AAGAGTGCCCCATCATCGGCTTCCGGTACAGAAGCCTGAAGCACTTC AACTACGATATCTGCCAGAGCTGTTTCTTCAGCGGCAGGGTGGCCAA GGGCCACAAAATGCACTACCCCATGGTGGAATACTGCACCCCCACC ACAAGCGGCGAGGATGTGCGGGATTTCGCCAAGGTGCTGAAAAACA AGTTCCGGACCAAGCGGTACT TCGCCAAACACCCCCGATGGGCTA CCTGCCTGTGCAGACAGTGCTGGAAGGCGACAACATGGAAACCGAC ACCATGTGATGATGATTTGGGCAGAGCGATGGAGTCCTTAGTATCAG TCATGACAGATGAAGAAGGAGCAGAATAAATGTTTTTACAACTCCTG ATTCCCGCATGCGGCCAGCTTATCGATACCGTCGAAATAAAAGATCC TTATTTTCATTGGATCTGTGTGTTGGTTTTTTGTG TG

- 61 046419- 61 046419

SEQ IDSEQ ID

NO: 137 BXA196476NO: 137 BXA196476

ATGCTGTGGTGGGAGGAAGTGGAAGATTGCTACGAGCGCGAGGACG TGCAGAAGAAAACCTTCACCAAATGGGTGAACGCCCAGTTCAGCAA GTTCGGCAAGCAGCACATCGAGAACCTGTTCAGCGACCTGCAGGAC GGCAGACGGCTGCTGGACCTGCTGGAAGGCCTGACCGGCCAGAAGC TGCCCAAAGAGAAGGGCAGCACCAGAGTGCACGCCCTGAACAACGT GAACAAGGCCCTGCGGGTGCTGCAGAACAACAACGTGGACCTGGTG AACATCGGCAGCACCGACATCGTGGACGGCAACCACAAGCTGACCC TGGGCCTGATCTGGAACATCATCCTGCACTGGCAGGTCAAAAACGTG ATGAAGAACATCATGGCCGGCCTGCAGCAGACCAACAGCGAGAAGA TCCTGCTGAGCTGGGTGCGCCAGAGCACCCGGAACTACCCCCAGGTC AACGTGATCAACTTCACCACCTCTTGGAGCGACGGCCTGGCCCTGAA CGCCCTGATCCACAGCCACCGGCCCGACCTGTTCGACTGGAACAGCG TGGTCTGCCAGCAGAGCGCCACCCAGCGGCTGGAACACGCCTTCAA TATCGCCAGATACCAGCTGGGCATCGAGAAGCTGCTGGATCCCGAG GACGTGGACACCACCTACCCCGACAAGAAATCCATCCTGATGTATAT CACCAGCCTGTTCCAGGTGCTGCCCCAGCAGGTGTCCATCGAGGCCA TCCAGGAAGTGGAAATGCTGCCCAGACCCCCCAAAGTGACCAAAGA GGAACACTTCCAGCTGCACCACCAGATGCACTACAGCCAGCAGATC ACCGTGTCCCTGGCCCAGGGCTACGAGAGAACCAGCAGCCCCAAGC CCCGGTTCAAGAGCTACGCCTATACCCAGGCCGCCTACGTGACCACC AGCGACCCTACCAGAAGCCCATTCCCCAGCCAGCATCTGGAAGCCC CCGAGGACAAGAGCTTCGGCAGCAGCCTGATGGAAAGCGAAGTGAA CCTGGACAGATACCAGACCGCCCTGGAAGAGGTGCTGAGCTGGCTG CTGAGCGCCGAGGATACACTGCAGGCTCAGGGCGAGATCAGCAACG ACGTGGAAGTCGTGAAGGACCAGTTCCACACCCACGAGGGCTACAT GATGGACCTGACAGCCCACCAGGGCAGAGTGGGCAACATCCTGCAG CTGGGCTCCAAGCTGATCGGCACCGGCAAGCTGAGCGAGGACGAAG AGACAGAGGTGCAGGAACAGATGAACCTGCTGAACAGCAGATGGG AGTGCCTGCGGGTGGCCAGCATGGAAAAGCAGAGCAACCTGCATCT GCTGAAGTGGCAGCGGCTGACCGAGGAACAGTGCCTGTTTAGCGCC TGGCTGTCCGAGAAAGAGGACGCCGTGAACAAGATCCACACCACCG GCTTCAAGGACCAGAACGAGATGCTGAGCAGCCTGCAGAAACTGGC CGTGCTGAAGGCCGACCTGGAAAAGAAAAAGCAGTCCATGGGCAAG CTGTACTCCCTGAAGCAGGACCTGCTGTCCACCCTGAAGAACAAGA GCGTGACCCAGAAAACCGAGGCCTGGCTGGACAACTTCGCCCGGTG CTGGGACAACCTGGTGCAGAAGCTGGAAAAGTCCACCGCCCAGATC TCCCAGGCCGTGACCACAACACAGCCCAGCCTGACCCAGACCACCG TGATGGAAACCGTGACAACAGTGACCACCCGGGAACAGATCCTCGT GAAGCACGCCCAGGAAGAACTGCCCCCTCCACCCCCCCAGAAGAAA CGGCAGATCACAGTGGACAGTGAAGCTCAGATCCACACCGTGCGGG AAGAGACAATGATGGTCATGACAGAGGACATGCCCCTGGAAATCAG CTACGTGCCCAGCACCTACCTGACCGAGATCACCCATGTGTCCCAGG CCCTGCTGGAAGTGGAACAGCTGCTGAACGCCCCCGACCTGTGCGCC AAGGATTTCGAGGACCTGTTCAAGCAGGAAGAGAGCCTGAAGAATA TCAAGGATAGCCTGCAGCAGAGCAGCGGCCGGATCGACATCATCCA CAGCAAGAAAACAGCCGCCCTGCAGAGCGCCACCCCCGTGGAAAGA GTGAAACTGCAGGAAGCCCTGTCCCAGCTGGACTTCCAGTGGGAGA AAGTGAACAAAATGTACAAGGACCGGCAGGGCAGATTCGACCGCAGATGCTGTGGTGGGAGGAAGTGGAAGATTGCTACGAGCGCGAGGACG TGCAGAAGAAAACCTTCACCAAATGGGTGAACGCCCAGTTCAGCAA GTTCGGCAAGCAGCACATCGAGAACCTGTTCAGCGACCTGCAGGAC GGCAGACGGCTGCTGGACCTGCTGGAAGGCCTGACCGGCCAGAAGC TGCCCAAAGAAGGGCAGCACCAGAGTGCACGCCCTGAACAACGT GAACAAGGCCC TGCGGGTGCTGCAGAACAACAACGTGGACCTGGTG AACATCGGCAGCACCGACATCGTGGACGGCAACCACAAGCTGACCC TGGGCCTGATCTGGAACATCATCCTGCACTGGCAGGTCAAAAACGTG ATGAAGAACATCATGGCCGGCCTGCAGCAGACCAACAGCGAGAAGA TCCTGCTGAGCTGGGTGCGCCAGAGCACCCGGAACTACCCCCAGGTC AACGTGATCAACTTCACCACCTCTTAG CGACGGCCTGGCCCTGAA CGCCCTGATCCACAGCCACCGGCCCGACCTGTTCGACTGGAACAGCG TGGTCTGCCAGCAGAGCGCCACCCAGCGGCTGGAACACGCCTTCAA TATCGCCAGATACCAGCTGGGCATCGAGAAGCTGCTGGATCCCGAG GACGTGGACACCACCTACCCCGACAAGAAATCCATCCTGATGTATAT CACCAGCCTGTTCCAGGTGCTGCCCCAGGTGTCCAT CGAGGCCA TCCAGGAAGTGGAAATGCTGCCCAGACCCCCCAAAGTGACCAAAGA GGAACACTTCCAGCTGCACCACCAGATGCACTACAGCCAGCAGATC ACCGTGTCCCTGGCCCAGGGCTACGAGAGAACCAGCAGCCCCAAGC CCCGGTTCAAGAGCTACGCCTATACCCAGGCCGCCTACGTGACCACC AGCGACCCTACCAGAAGCCCATTCCCCAGCCAGCATCTGGAAGCCC CCGAGGA CAAGAGCTTCGGCAGCAGCCTGATGGAAAGCGAAGTGAA CCTGGACAGATACCAGACCGCCCTGGAAGAGGTGCTGAGCTGGCTG CTGAGCGCCGAGGATACACTGCAGGCTCAGGGCGAGATCAGCAACG ACGTGGAAGTCGTGAAGGACCAGTTCCACACCCACGAGGGCTACAT GATGGACCTGACAGCCCACCAGGGCAGAGTGGGCAACATCCTGCAG CTGGGCTCCAAGCTGATCGGCA CCGGCAAGCTGAGCGAGGACGAAG AGACAGAGGTGCAGGAACAGATGAACCTGCTGAACAGCAGATGGG AGTGCCTGCGGGTGGCCAGCATGGAAAAGCAGAGCAACCTGCATCT GCTGAAGTGGCAGCGGCTGACCGAGGAACAGTGCCTGTTTAGCGCC TGGCTGTCCGAGAAAGAGGACGCCGTGAACAAGATCCACACCACCG GCTTCAAGGACCAGAACGAGATGCTGAGCAGCCTGCA GAAACTGGC CGTGCTGAAGGCCGACCTGGAAAAGAAAAAGCAGTCCATGGGCAAG CTGTACTCCCTGAAGCAGGACCTGCTGTCCACCCTGAAGAACAAGA GCGTGACCCAGAAAACCGAGGCCTGGCTGGACAACTTCGCCCGGTG CTGGGACAACCTGGTGCAGAAGCTGGAAAAGTCCACCGCCCAGATC TCCCAGGCCGTGACCACAACACAGCCCAGCCTGACCCAGACCACG TG ATGGAAACCGTGACAACAGTGACCACCCGGGAACAGATCCTCGT GAAGCACGCCCAGGAAGAACTGCCCCCTCCACCCCCCCAGAAGAAA CGGCAGATCACAGTGGACAGTGAAGCTCAGATCCACACCGTGCGGG AAGACAAATGATGGTCATGACAGAGGACATGCCCCTGGAAATCAG CTACGTGCCCAGCACCTACCTGACCGAGATCACCATGTGTCCCAGG CCCTGCTGGAAGTG GAACAGCTGCTGAACGCCCCCGACCTGTGCGCC AAGGATTTCGAGGACCTGTTCAAGCAGGAAGAGAGCCTGAAGAATA TCAAGGATAGCCTGCAGCAGAGCAGCGGCCGGATCGACATCATCCA CAGCAAGAAAACAGCCGCCCTGCAGAGCGCCACCCCCGTGGAAAGA GTGAAACTGCAGGAAGCCCTGTCCCAGCTGGACTTCCAGTGGGAGA AAGTGAACAAAATGTACAAGGACCGGCA GGGCAGATTCGACCGCAG

- 62 046419- 62 046419

CGTGGAAAAGTGGCGGCGGTTCCACTACGACATCAAGATCTTCAAC CAGTGGCTGACAGAGGCCGAGCAGTTCCTGAGAAAGACCCAGATCC CCGAGAACTGGGAGCACGCCAAGTACAAGTGGTATCTGAAAGAGCT GCAGGACGGCATCGGCCAGAGACAGACAGTCGTGCGGACCCTGAAT GCCACCGGCGAGGAAATCATCCAGCAGTCCAGCAAGACCGACGCCA GCATTCTGCAGGAAAAGCTGGGCAGCCTGAACCTGCGGTGGCAGGA AGTGTGCAAGCAGCTGTCCGACCGGAAGAAGCGGCTGGAAGAACAG AAGAACATCCTGGAACGGCTGCAGGAACTGCAGGAGGCCACCGACG AGCTGGACCTGAAACTGAGACAGGCCGAAGTGATCAAGGGCAGCTG GCAGCCAGTGGGCGACCTGCTGATCGACTCCCTGCAGGACCATCTGG AAAAAGTGAAGGCCCTGAGAGGCGAGATCGCCCCCCTGAAAGAAAA CGTGTCCCACGTGAACGACCTGGCCCGGCAGCTGACAACACTGGGC ATTCAGCTGAGCCCCTACAACCTGAGCACACTGGAAGATCTGAACA CCCGGTGGAAGCTGCTGCAGGTGGCCGTGGAAGATAGAGTGCGGCA GCTGCACGAGGCCCACAGAGATTTTGGCCCTGCCTCCCAGCACTTCC TGAGCACCAGTGTGCAGGGCCCTTGGGAGAGAGCCATCTCCCCTAA CAAGGTGCCCTACTACATCAACCACGAGACACAGACCACCTGTTGG GACCACCCCAAGATGACCGAGCTGTACCAGAGCCTGGCTGACCTGA ACAACGTGCGGTTCAGCGCCTACCGGACCGCCATGAAGCTGCGGAG ACTGCAGAAAGCTCTGTGCCTGGATCTGCTGTCCCTGTCCGCCGCCT GTGATGCCCTGGACCAGCACAATCTGAAGCAGAACGACCAGCCCAT GGATATCCTGCAGATCATCAACTGCCTGACCACCATCTACGACCGGC TGGAACAGGAACACAACAATCTCGTGAACGTGCCCCTGTGCGTGGA CATGTGCCTGAATTGGCTGCTGAATGTGTACGACACCGGCCGGACAG GCCGGATCAGAGTGCTGTCCTTCAAGACCGGCATCATCAGCCTGTGC AAAGCCCACCTGGAAGATAAGTACCGGTATCTGTTCAAACAGGTGG CCTCTAGCACCGGCTTTTGCGACCAGAGAAGGCTGGGCCTGCTGCTG CACGACAGCATCCAGATCCCTAGACAGCTGGGCGAAGTGGCCAGCT TTGGCGGCAGCAACATCGAGCCTAGCGTGCGGAGCTGCTTCCAGTTC GCCAACAACAAGCCCGAGATCGAGGCCGCCCTGTTCCTGGACTGGA TGAGACTGGAACCCCAGAGCATGGTGTGGCTGCCCGTGCTGCATAG AGTGGCCGCTGCCGAGACAGCCAAGCACCAGGCCAAGTGCAACATC TGCAAAGAGTGCCCCATCATCGGCTTCCGGTACAGAAGCCTGAAGC ACTTCAACTACGATATCTGCCAGAGCTGTTTCTTCAGCGGCAGGGTG GCCAAGGGCCACAAAATGCACTACCCCATGGTGGAATACTGCACCC CCACCACAAGCGGCGAGGATGTGCGGGATTTCGCCAAGGTGCTGAA AAACAAGTTCCGGACCAAGCGGTACTTCGCCAAACACCCCCGGATG GGCTACCTGCCTGTGCAGACAGTGCTGGAAGGCGACAACATGGAAA CCGACACCATGTGATGATGATTTGGGCAGAGCGATGGAGTCCTTAGT ATCAGTCATGACAGATGAAGAAGGAGCAGAATAAATGTTTTACAAC TCCTGATTCCCGCATGCGGCCAGCTTATCGATACCGTCGAAATAAAA __GATCCTTATTTTCATTGGATCTGTGTGTTGGTTTTTTGTGTG_______ ATGCTGTGGTGGGAGGAAGTGGAAGATTGCTACGAGCGCGAGGACG SEQ Ш TGCAGAAGAAAACCTTCACCAAATGGGTGAACGCCCAGTTCAGCAA NO 138 - GTTCGGCAAGCAGCACATCGAGAACCTGTTCAGCGACCTGCAGGACCGTGGAAAAGTGGCGGCGGTTCCACTACGACATCAAGATCTTCAAC CAGTGGCTGACAGAGGCCGAGCAGTTCCTGAGAAAGACCCAGATCC CCGAGAACTGGGAGCACGCCAAGTACAAGTGGTATCTGAAAGAGCT GCAGGACGGCATCGGCCAGAGACAGACAGTCGTGCGGACCCTGAAT GCCACCGGCGAGGAAATCATCCAGCAGTCCAGCAAGACCGACGCCA GCATTCTGCA GGAAAAGCTGGGCAGCCTGAACCTGCGGTGGCAGGA AGTGTGCAAGCAGCTGTCCGACCGGAAGAAGCGGCTGGAAGAACAG AAGAACATCCTGGAACGGCTGCAGGAACTGCAGGAGGCCACCGACG AGCTGGACCTGAAACTGAGACAGGCCGAAGTGATCAAGGGCAGCTG GCAGCCAGTGGGCGACCTGCTGATCGACTCCCTGCAGGACCATCTGG AAAAAGTGAAGGCCCTGAGAGGCGAG ATCGCCCCCCTGAAAGAAAA CGTGTCCCACGTGAACGACCTGGCCCGGCAGCTGACAACACTGGGC ATTCAGCTGAGCCCCTACAACCTGAGCACACTGGAAGATCTGAACA CCCGGTGGAAGCTGCTGCAGGTGGCCGTGGAAGATAGAGTGCGGCA GCTGCACGAGGCCCACAGATTTTGGCCCTGCCTCCCAGCACTTCC TGAGCACCAGTGTGCAGGGCCCTTGGGAGAGAGCCATCTCC CCTAA CAAGGTGCCCTACTACATCAACCACGAGACACAGACCACCTGTTGG GACCACCCCAAGATGACCGAGCTGTACCAGAGCCTGGCTGACCTGA ACAACGTGCGGTTCAGCGCCTACCGGACCGCCATGAAGCTGCGGAG ACTGCAGAAAGCTCTGTGCCTGGATCTGCTGTCCCTGTCCGCCGCCT GTGATGCCCTGGACCAGCACAATCTGAAGCAGAACGACCAGCCCAT GGATATCCT GCAGATCATCAACTGCCTGACCACCATCTACGACCGGC TGGAACAGGAACACAACAATCTCGTGAACGTGCCCCTGTGCGTGGA CATGTGCCTGAATTGGCTGCTGAATGTGTACGACACCGGCCGGACAG GCCGGATCAGAGTGCTGTCCTTCAAGACCGGCATCATCAGCCTGTGC AAAGCCCACCTGGAAGATAAGTACCGGTATCTGTTCAAACAGGTGG CCTCTAGCACCGGCTTTG CGACCAGAGAAGGCTGGGCCTGCTGCTG CACGACAGCATCCAGATCCCTAGACAGCTGGGCGAAGTGGCCAGCT TTGGCGGCAGCAACATCGAGCCTAGCGTGCGGAGCTGCTTCCAGTTC GCCAACAACAAGCCCGAGATCGAGGCCGCCCTGTTCCTGGACTGGA TGAGACTGGAACCCCAGAGCATGGTGTGGCTGCCCGTGCTGCATAG AGTGGCCGCTGCCGAGACAGCCAAGCACC AGGCCAAGTGCAACATC TGCAAAGAGTGCCCCATCATCGGCTTCCGGTACAGAAGCCTGAAGC ACTTCAACTACGATATCTGCCAGAGCTGTTTCTTCAGCGGCAGGGTG GCCAAGGGCCACAAAATGCACTACCCCATGGTGGAATACTGCACCC CCACCACAAGCGGCGAGGATGTGCGGGATTTCGCCAAGGTGCTGAA AAACAAGTTCCGGACCAAGCGGTACTTCGCCAAACACCCCCGGA TG GGCTACCTGCCTGTGCAGACAGTGCTGGAAGGCGACAACATGGAAA CCGACACCATGTGATGATGATTTGGGCAGAGCGATGGAGTCCTTAGT ATCAGTCATGACAGATGAAGAAGGAGCAGAATAAATGTTTTACAAC TCCTGATTCCCGCATGCGGCCAGCTTATCGATACCGTCGAAATAAAA __GATCCTTATTTTCATTGGATCTGTGTGTTGGTTTTTTGTGTG_______ ATGCTGTG GTGGGAGGAAGTGGAAGATTGCTACGAGCGCGAGGACG SEQ Ш TGCAGAAGAAAACCTTCACCAAATGGGTGAACGCCCAGTTCAGCAA NO 138 - GTTCGGCAAGCAGCACATCGAGAACCTGTTCAGCGACCTGCAGGAC

GGCAGACGGCTGCTGGACCTGCTGGAAGGCCTGACCGGCCAGAAGC БХА- TGCCCAAAGAGAAGGGCAGCACCAGAGTGCACGCCCTGAACAACGTGGCAGACGGCTGCTGGACCTGCTGGAAGGCCTGACCGGCCAGAAGC BHA- TGCCCAAAGAGAAGGGCAGCACCAGAGTGCACGCCCTGAACAACGT

GAACAAGGCCCTGCGGGTGCTGCAGAACAACAACGTGGACCTGGTGGAACAAGGCCCTGCGGGTGCTGCAGAACAACAACGTGGACCTGGTG

- 63 046419- 63 046419

196477Q196477Q

AACATCGGCAGCACCGACATCGTGGACGGCAACCACAAGCTGACCC TGGGCCTGATCTGGAACATCATCCTGCACTGGCAGGTCAAAAACGTG ATGAAGAACATCATGGCCGGCCTGCAGCAGACCAACAGCGAGAAGA TCCTGCTGAGCTGGGTGCGCCAGAGCACCCGGAACTACCCCCAGGTC AACGTGATCAACTTCACCACCTCTTGGAGCGACGGCCTGGCCCTGAA CGCCCTGATCCACAGCCACCGGCCCGACCTGTTCGACTGGAACAGCG TGGTCTGCCAGCAGAGCGCCACCCAGCGGCTGGAACACGCCTTCAA TATCGCCAGATACCAGCTGGGCATCGAGAAGCTGCTGGATCCCGAG GACGTGGACACCACCTACCCCGACAAGAAATCCATCCTGATGTATAT CACCAGCCTGTTCCAGGTGCTGCCCCAGCAGGTGTCCATCGAGGCCA TCCAGGAAGTGGAAATGCTGCCCAGACCCCCCAAAGTGACCAAAGA GGAACACTTCCAGCTGCACCACCAGATGCACTACAGCCAGCAGATC ACCGTGTCCCTGGCCCAGGGCTACGAGAGAACCAGCAGCCCCAAGC CCCGGTTCAAGAGCTACGCCTATACCCAGGCCGCCTACGTGACCACC AGCGACCCTACCAGAAGCCCATTCCCCAGCCAGCATCTGGAAGCCC CCGAGGACAAGAGCTTCGGCAGCAGCCTGATGGAAAGCGAAGTGAA CCTGGACAGATACCAGACCGCCCTGGAAGAGGTGCTGAGCTGGCTG CTGAGCGCCGAGGATACACTGCAGGCTCAGGGCGAGATCAGCAACG ACGTGGAAGTCGTGAAGGACCAGTTCCACACCCACGAGGGCTACAT GATGGACCTGACAGCCCACCAGGGCAGAGTGGGCAACATCCTGCAG CTGGGCTCCAAGCTGATCGGCACCGGCAAGCTGAGCGAGGACGAAG AGACAGAGGTGCAGGAACAGATGAACCTGCTGAACAGCAGATGGG AGTGCCTGCGGGTGGCCAGCATGGAAAAGCAGAGCAACCTGCATAG GGTCCTGCTGAAGTGGCAGCGGCTGACCGAGGAACAGTGCCTGTTT AGCGCCTGGCTGTCCGAGAAAGAGGACGCCGTGAACAAGATCCACA CCACCGGCTTCAAGGACCAGAACGAGATGCTGAGCAGCCTGCAGAA ACTGGCCGTGCTGAAGGCCGACCTGGAAAAGAAAAAGCAGTCCATG GGCAAGCTGTACTCCCTGAAGCAGGACCTGCTGTCCACCCTGAAGA ACAAGAGCGTGACCCAGAAAACCGAGGCCTGGCTGGACAACTTCGC CCGGTGCTGGGACAACCTGGTGCAGAAGCTGGAAAAGTCCACCGCC CAGATCTCCCAGGCCGTGACCACAACACAGCCCAGCCTGACCCAGA CCACCGTGATGGAAACCGTGACAACAGTGACCACCCGGGAACAGAT CCTCGTGAAGCACGCCCAGGAAGAACTGCCCCCTCCACCCCCCCAG AAGAAACGGCAGATCACAGTGGACAGTGAAGCTCAGATCCACACCG TGCGGGAAGAGACAATGATGGTCATGACAGAGGACATGCCCCTGGA AATCAGCTACGTGCCCAGCACCTACCTGACCGAGATCACCCATGTGT CCCAGGCCCTGCTGGAAGTGGAACAGCTGCTGAACGCCCCCGACCT GTGCGCCAAGGATTTCGAGGACCTGTTCAAGCAGGAAGAGAGCCTG AAGAATATCAAGGATAGCCTGCAGCAGAGCAGCGGCCGGATCGACA TCATCCACAGCAAGAAAACAGCCGCCCTGCAGAGCGCCACCCCCGT GGAAAGAGTGAAACTGCAGGAAGCCCTGTCCCAGCTGGACTTCCAG TGGGAGAAAGTGAACAAAATGTACAAGGACCGGCAGGGCAGATTCG ACCGCAGCGTGGAAAAGTGGCGGCGGTTCCACTACGACATCAAGAT CTTCAACCAGTGGCTGACAGAGGCCGAGCAGTTCCTGAGAAAGACC CAGATCCCCGAGAACTGGGAGCACGCCAAGTACAAGTGGTATCTGA AAGAGCTGCAGGACGGCATCGGCCAGAGACAGACAGTCGTGCGGAC CCTGAATGCCACCGGCGAGGAAATCATCCAGCAGTCCAGCAAGACC GACGCCAGCATTCTGCAGGAAAAGCTGGGCAGCCTGAACCTGCGGTAACATCGGCAGCACCGACATCGTGGACGGCAACCACAAGCTGACCC TGGGCCTGATCTGGAACATCATCCTGCACTGGCAGGTCAAAAACGTG ATGAAGAACATCATGGCCGGCCTGCAGCAGACCAACAGCGAGAAGA TCCTGCTGAGCTGGGTGCGCCAGAGCACCCGGAACTACCCCCAGGTC AACGTGATCAACTTCACCACCTCTTGGAGCGACGGCCTGGCCCTGAA CGCCCTGATCCACAG CCACCGGCCCGACCTGTTCGACTGGAACAGCG TGGTCTGCCAGCAGAGCGCCACCCAGCGGCTGGAACACGCCTTCAA TATCGCCAGATACCAGCTGGGCATCGAGAAGCTGCTGGATCCCGAG GACGTGGACACCACCTACCCCGACAAGAAATCCATCCTGATGTATAT CACCAGCCTGTTCCAGGTGCTGCCCCAGCAGGTGTCCATCGAGGCCA TCCAGGAAGTGGAAATGCTGCCCA GACCCCCCAAAGTGACCAAAGA GGAACACTTCCAGCTGCACCACCAGATGCACTACAGCCAGCAGATC ACCGTGTCCCTGGCCCAGGGCTACGAGAGAACCAGCAGCCCCAAGC CCCGGTTCAAGAGCTACGCCTATACCCAGGCCGCCTACGTGACCACC AGCGACCCTACCAGAAGCCCATTCCCCAGCCAGCATCTGGAAGCCC CCGAGGACAAGAGCTTCGGCAGCAGCCTGATGGAAAGCGAAG TGAA CCTGGACAGATACCAGACCGCCCTGGAAGAGGTGCTGAGCTGGCTG CTGAGCGCCGAGGATACACTGCAGGCTCAGGGCGAGATCAGCAACG ACGTGGAAGTCGTGAAGGACCAGTTCCACACCCACGAGGGCTACAT GATGGACCTGACAGCCCACCAGGGCAGAGTGGGCAACATCCTGCAG CTGGGCTCCAAGCTGATCGGCACCGGCAAGCTGAGCGAGGACGAAG AGACAGAGG TGCAGGAACAGATGAACCTGCTGAACAGCAGATGGG AGTGCCTGCGGGTGGCCAGCATGGAAAAGCAGAGCAACCTGCATAG GGTCCTGCTGAAGTGGCAGCGGCTGACCGAGGAACAGTGCCTGTTT AGCGCCTGGCTGTCCGAGAAAGAGGACGCCGTGAACAAGATCCACA CCACCGGCTTCAAGGACCAGAACGAGATGCTGAGCAGCCTGCAGAA ACTGGCCGTGCTGAAGGCCGACCT GGAAAAGAAAAAGCAGTCCATG GGCAAGCTGTACTCCCTGAAGCAGGACCTGCTGTCCACCCTGAAGA ACAAGAGCGTGACCCAGAAAACCGAGGCCTGGCTGGACAACTTCGC CCGGTGCTGGGACAACCTGGTGCAGAAGCTGGAAAAGTCCACCGCC CAGATCTCCCAGGCCGTGACCACAACACAGCCCAGCCTGACCCAGA CCACCGTGATGGAAACCGTGACAACAGTGACCACCCGGGAAC AGAT CCTCGTGAAGCACGCCCAGGAAACTGCCCCCTCCACCCCCCCAG AAGAAACGGCAGATCACAGTGGACAGTGAAGCTCAGATCCACACCG TGCGGGAAGACAATGATGGTCATGACAGAGGACATGCCCCTGGA AATCAGCTACGTGCCCAGCACCTACCTGACCGAGATCACCCATGTGT CCCAGGCCCTGCTGGAAGTGGAACAGCTGCTGAACGCCCCCGACCT GTGCGC CAAGGATTTCGAGGACCTGTTCAAGCAGGAAGAGAGCCTG AAGAATATCAAGGATAGCCTGCAGCAGAGCAGCGGCCGGATCGACA TCATCCACAGCAAGAAAACAGCCGCCCTGCAGAGCGCCACCCCCGT GGAAAGAGTGAAACTGCAGGAAGCCCTGTCCCAGCTGGACTTCCAG TGGGAGAAAGTGAACAAAATGTACAAGGACCGGCAGGGCAGATTCG ACCGCAGCGTGGAAAAGTGGC GGCGGTTCCACTACGACATCAAGAT CTTCAACCAGTGGCTGACAGAGGCCGAGCAGTTCCTGAGAAAGACC CAGATCCCCGAGAACTGGGAGCACGCCAAGTACAAGTGGTATCTGA AAGAGCTGCAGGACGCATCGGCCAGAGACAGACAGTCGTGCGGAC CCTGAATGCCACCGGCGAGGAAATCATCCAGCAGTCCAGCAAGACC GACGCCAGCCATTCTGCAGGAAAAGCTGGGCAGC CTGAACCTGCGGT

- 64 046419- 64 046419

GGCAGGAAGTGTGCAAGCAGCTGTCCGACCGGAAGAAGCGGCTGGA AGAACAGCTGGAACGGCTGCAGGAACTGCAGGAGGCCACCGACGA GCTGGACCTGAAACTGAGACAGGCCGAAGTGATCAAGGGCAGCTGG CAGCCAGTGGGCGACCTGCTGATCGACTCCCTGCAGGACCATCTGGA AAAAGTGAAGGCCCTGAGAGGCGAGATCGCCCCCCTGAAAGAAAAC GTGTCCCACGTGAACGACCTGGCCCGGCAGCTGACAACACTGGGCA TTCAGCTGAGCCCCTACAACCTGAGCACACTGGAAGATCTGAACACC CGGTGGAAGCTGCTGCAGGTGGCCGTGGAAGATAGAGTGCGGCAGC TGCACGAGGCCCACAGAGATTTTGGCCCTGCCTCCCAGCACTTCCTG AGCACCAGTGTGCAGGGCCCTTGGGAGAGAGCCATCTCCCCTAACA AGGTGCCCTACTACATCAACCACGAGACACAGACCACCTGTTGGGA CCACCCCAAGATGACCGAGCTGTACCAGAGCCTGGCTGACCTGAAC AACGTGCGGTTCAGCGCCTACCGGACCGCCATGAAGCTGCGGAGAC TGCAGAAAGCTCTGTGCCTGGATCTGCTGTCCCTGTCCGCCGCCTGT GATGCCCTGGACCAGCACAATCTGAAGCAGAACGACCAGCCCATGG ATATCCTGCAGATCATCAACTGCCTGACCACCATCTACGACCGGCTG GAACAGGAACACAACAATCTCGTGAACGTGCCCCTGTGCGTGGACA TGTGCCTGAATTGGCTGCTGAATGTGTACGACACCGGCCGGACAGGC CGGATCAGAGTGCTGTCCTTCAAGACCGGCATCATCAGCCTGTGCAA AGCCCACCTGGAAGATAAGTACCGGTATCTGTTCAAACAGGTGGCCT CTAGCACCGGCTTTTGCGACCAGAGAAGGCTGGGCCTGCTGCTGCAC GACAGCATCCAGATCCCTAGACAGCTGGGCGAAGTGGCCAGCTTTG GCGGCAGCAACATCGAGCCTAGCGTGCGGAGCTGCTTCCAGTTCGCC AACAACAAGCCCGAGATCGAGGCCGCCCTGTTCCTGGACTGGATGA GACTGGAACCCCAGAGCATGGTGTGGCTGCCCGTGCTGCATAGAGT GGCCGCTGCCGAGACAGCCAAGCACCAGGCCAAGTGCAACATCTGC AAAGAGTGCCCCATCATCGGCTTCCGGTACAGAAGCCTGAAGCACTT CAACTACGATATCTGCCAGAGCTGTTTCTTCAGCGGCAGGGTGGCCA AGGGCCACAAAATGCACTACCCCATGGTGGAATACTGCACCCCCAC CACAAGCGGCGAGGATGTGCGGGATTTCGCCAAGGTGCTGAAAAAC AAGTTCCGGACCAAGCGGTACTTCGCCAAACACCCCCGGATGGGCT ACCTGCCTGTGCAGACAGTGCTGGAAGGCGACAACATGGAAACCGA CACCATGTGATGATGATTTGGGCAGAGCGATGGAGTCCTTAGTATCA GTCATGACAGATGAAGAAGGAGCAGAATAAATGTTTTACAACTCCT GATTCCCGCATGCGGCCAGCTTATCGATACCGTCGAAATAAAAGATC CTTATTTTCATTGGATCTGTGTGTTGGTTTTTTGTGTG GGCAGGAAGTGTGCAAGCAGCTGTCCGACCGGAAGAAGCGGCTGGA AGAACAGCTGGAACGGCTGCAGGAACTGCAGGAGGCCACCGACGA GCTGGACCTGAAACTGAGACAGGCCGAAGTGATCAAGGGCAGCTGG CAGCCAGTGGGCGACCTGCTGATCGACTCCCTGCAGGACCATCTGGA AAAAGTGAAGGCCCTGAGAGGCGAGATCGCCCCCCTGAAAGAAAAC GTGTCCCACG TGAACGACCTGGCCCGGCAGCTGACAACACTGGGCA TTCAGCTGAGCCCCTACAACCTGAGCACACTGGAAGATCTGAACACC CGGTGGAAGCTGCTGCAGGTGGCCGTGGAAGATAGAGTGCGGCAGC TGCACGAGGCCCACAGAGATTTTGGCCCTGCCTCCCAGCACTTCCTG AGCACCAGTGTGCAGGGCCCTTGGGAGAGAGCCATCTCCCCTAACA AGGTGCCCTACTACATCAACCA CGAGACACAGACCACCTGTTGGGA CCACCCCAAGATGACCGAGCTGTACCAGAGCCTGGCTGACCTGAAC AACGTGCGGTTCAGCGCCTACCGGACCGCCATGAAGCTGCGGAGAC TGCAGAAAGCTCTGTGCCTGGATCTGCTGTCCCTGTCCGCCGCCTGT GATGCCCTGGACCAGCACAATCTGAAGCAGAACGACCAGCCCATGG ATATCCTGCAGATCATCAACTGCCTGACCACCATCTAC GACCGGCTG GAACAGGAACACAACAATCTCGTGAACGTGCCCCTGTGCGTGGACA TGTGCCTGAATTGGCTGCTGAATGTGTACGACACCGGCCGGACAGGC CGGATCAGAGTGCTGTCCTTCAAGACCGGCATCATCAGCCTGTGCAA AGCCCACCTGGAAGATAAGTACCGGTATCTGTTCAAACAGGTGGCCT CTAGCACCGGCTTTTGCGACCAGAAGGCTGGGCCTGCTGCT GCAC GACAGCATCCAGATCCCTAGACAGCTGGGCGAAGTGGCCAGCTTTG GCGGCAGCAACATCGAGCCTAGCGTGCGGAGCTGCTTCCAGTTCGCC AACAACAAGCCCGAGATCGAGGCCGCCCTGTTCCTGGACTGGATGA GACTGGAACCCCAGAGCATGGTGTGGCTGCCCGTGCTGCATAGAGT GGCCGCTGCCGAGACAGCCAAGCACCAGGCCAAGTGCAACATCTGC AAAGAG TGCCCCATCATCGGCTTCCGGTACAGAAGCCTGAAGCACTT CAACTACGATATCTGCCAGAGCTGTTTCTTCAGCGGCAGGGTGGCCA AGGGCCACAAAATGCACTACCCCATGGTGGAATACTGCACCCCCAC CACAAGCGGCGAGGATGTGCGGGATTTCGCCAAGGTGCTGAAAAAC AAGTTCCGGACCAAGCGGTACTTCGCCAAACACCCCCGGATGGGCT ACCTGCCTGGGCAGACAGTGCT AAGGCGACAACATGGAAACCGA CACCATGTGATGATGATTTGGGCAGAGCGATGGAGTCCTTAGTATCA GTCATGACAGATGAAGAAGGAGCAGAATAAATGTTTTTACAACTCCT GATTCCCGCATGCGGCCAGCTTATCGATACCGTCGAAATAAAAGATC CTTATTTTCATTGGATCTGTGTGTTGGTTTTTTGTGTG SEQ ID NO: 139 - BXA- 196478 SEQ ID NO: 139 - BXA- 196478 ATGCTGTGGTGGGAGGAAGTGGAAGATTGCTACGAGCGCGAGGACG TGCAGAAGAAAACCTTCACCAAATGGGTGAACGCCCAGTTCAGCAA GTTCGGCAAGCAGCACATCGAGAACCTGTTCAGCGACCTGCAGGAC GGCAGACGGCTGCTGGACCTGCTGGAAGGCCTGACCGGCCAGAAGC TGCCCAAAGAGAAGGGCAGCACCAGAGTGCACGCCCTGAACAACGT GAACAAGGCCCTGCGGGTGCTGCAGAACAACAACGTGGACCTGGTG AACATCGGCAGCACCGACATCGTGGACGGCAACCACAAGCTGACCC TGGGCCTGATCTGGAACATCATCCTGCACTGGCAGGTCAAAAACGTG ATGAAGAACATCATGGCCGGCCTGCAGCAGACCAACAGCGAGAAGA TCCTGCTGAGCTGGGTGCGCCAGAGCACCCGGAACTACCCCCAGGTC AACGTGATCAACTTCACCACCTCTTGGAGCGACGGCCTGGCCCTGAA ATGCTGTGGTGGGAGGAAGTGGAAGATTGCTACGAGCGCGAGGACG TGCAGAAGAAAACCTTCACCAAATGGGTGAACGCCCAGTTCAGCAA GTTCGGCAAGCAGCACATCGAGAACCTGTTCAGCGACCTGCAGGAC GGCAGACGGCTGCTGGACCTGCTGGAAGGCCTGACCGGCCAGAAGC TGCCCAAAGAAGGGCAGCACCAGAGTGCACGCCCTGAACAACGT GAACAAGGCCC TGCGGGTGCTGCAGAACAACAACGTGGACCTGGTG AACATCGGCAGCACCGACATCGTGGACGGCAACCACAAGCTGACCC TGGGCCTGATCTGGAACATCATCCTGCACTGGCAGGTCAAAAACGTG ATGAAGAACATCATGGCCGGCCTGCAGCAGACCAACAGCGAGAAGA TCCTGCTGAGCTGGGTGCGCCAGAGCACCCGGAACTACCCCCAGGTC AACGTGATCAACTTCACCACCTCTTAG CGACGGCCTGGCCCTGAA

- 65 046419- 65 046419

CGCCCTGATCCACAGCCACCGGCCCGACCTGTTCGACTGGAACAGCG TGGTCTGCCAGCAGAGCGCCACCCAGCGGCTGGAACACGCCTTCAA TATCGCCAGATACCAGCTGGGCATCGAGAAGCTGCTGGATCCCGAG GACGTGGACACCACCTACCCCGACAAGAAATCCATCCTGATGTATAT CACCAGCCTGTTCCAGGTGCTGCCCCAGCAGGTGTCCATCGAGGCCA TCCAGGAAGTGGAAATGCTGCCCAGACCCCCCAAAGTGACCAAAGA GGAACACTTCCAGCTGCACCACCAGATGCACTACAGCCAGCAGATC ACCGTGTCCCTGGCCCAGGGCTACGAGAGAACCAGCAGCCCCAAGC CCCGGTTCAAGAGCTACGCCTATACCCAGGCCGCCTACGTGACCACC AGCGACCCTACCAGAAGCCCATTCCCCAGCCAGCATCTGGAAGCCC CCGAGGACAAGAGCTTCGGCAGCAGCCTGATGGAAAGCGAAGTGAA CCTGGACAGATACCAGACCGCCCTGGAAGAGGTGCTGAGCTGGCTG CTGAGCGCCGAGGATACACTGCAGGCTCAGGGCGAGATCAGCAACG ACGTGGAAGTCGTGAAGGACCAGTTCCACACCCACGAGGGCTACAT GATGGACCTGACAGCCCACCAGGGCAGAGTGGGCAACATCCTGCAG CTGGGCTCCAAGCTGATCGGCACCGGCAAGCTGAGCGAGGACGAAG AGACAGAGGTGCAGGAACAGATGAACCTGCTGAACAGCAGATGGG AGTGCCTGCGGGTGGCCAGCATGGAAAAGCAGAGCAACCTGCATAG AGTACTGCTCCAAGACATCCTGCTGAAGTGGCAGCGGCTGACCGAG GAACAGTGCCTGTTTAGCGCCTGGCTGTCCGAGAAAGAGGACGCCG TGAACAAGATCCACACCACCGGCTTCAAGGACCAGAACGAGATGCT GAGCAGCCTGCAGAAACTGGCCGTGCTGAAGGCCGACCTGGAAAAG AAAAAGCAGTCCATGGGCAAGCTGTACTCCCTGAAGCAGGACCTGC TGTCCACCCTGAAGAACAAGAGCGTGACCCAGAAAACCGAGGCCTG GCTGGACAACTTCGCCCGGTGCTGGGACAACCTGGTGCAGAAGCTG GAAAAGTCCACCGCCCAGATCTCCCAGGCCGTGACCACAACACAGC CCAGCCTGACCCAGACCACCGTGATGGAAACCGTGACAACAGTGAC CACCCGGGAACAGATCCTCGTGAAGCACGCCCAGGAAGAACTGCCC CCTCCACCCCCCCAGAAGAAACGGCAGATCACAGTGGACAGTGAAG CTCAGATCCACACCGTGCGGGAAGAGACAATGATGGTCATGACAGA GGACATGCCCCTGGAAATCAGCTACGTGCCCAGCACCTACCTGACCG AGATCACCCATGTGTCCCAGGCCCTGCTGGAAGTGGAACAGCTGCTG AACGCCCCCGACCTGTGCGCCAAGGATTTCGAGGACCTGTTCAAGCA GGAAGAGAGCCTGAAGAATATCAAGGATAGCCTGCAGCAGAGCAGC GGCCGGATCGACATCATCCACAGCAAGAAAACAGCCGCCCTGCAGA GCGCCACCCCCGTGGAAAGAGTGAAACTGCAGGAAGCCCTGTCCCA GCTGGACTTCCAGTGGGAGAAAGTGAACAAAATGTACAAGGACCGG CAGGGCAGATTCGACCGCAGCGTGGAAAAGTGGCGGCGGTTCCACT ACGACATCAAGATCTTCAACCAGTGGCTGACAGAGGCCGAGCAGTT CCTGAGAAAGACCCAGATCCCCGAGAACTGGGAGCACGCCAAGTAC AAGTGGTATCTGAAAGAGCTGCAGGACGGCATCGGCCAGAGACAGA CAGTCGTGCGGACCCTGAATGCCACCGGCGAGGAAATCATCCAGCA GTCCAGCAAGACCGACGCCAGCATTCTGCAGGAAAAGCTGGGCAGC CTGAACCTGCGGTGGCAGGAAGTGTGCAAGCAGCTGTCCGACCGGA AGAAGCGGCTGGAAGAACAGCTGGAACGGCTGCAGGAACTGCAGG AGGCCACCGACGAGCTGGACCTGAAACTGAGACAGGCCGAAGTGAT CAAGGGCAGCTGGCAGCCAGTGGGCGACCTGCTGATCGACTCCCTG CAGGACCATCTGGAAAAAGTGAAGGCCCTGAGAGGCGAGATCGCCCCGCCCTGATCCACAGCCACCGGCCCGACCTGTTCGACTGGAACAGCG TGGTCTGCCAGCAGAGCGCCACCCAGCGGCTGGAACACGCCTTCAA TATCGCCAGATACCAGCTGGGCATCGAGAAGCTGCTGGATCCCGAG GACGTGGACACCACCTACCCCGACAAGAAATCCATCCTGATGTATAT CACCAGCCTGTTCCAGGTGCTGCCCCAGGTGTCCATCGAGGCCA TCCAGGA AGTGGAAATGCTGCCCAGACCCCCCAAAGTGACCAAAGA GGAACACTTCCAGCTGCACCACCAGATGCACTACAGCCAGCAGATC ACCGTGTCCCTGGCCCAGGGCTACGAGAGAACCAGCAGCCCCAAGC CCCGGTTCAAGAGCTACGCCTATACCCAGGCCGCCTACGTGACCACC AGCGACCCTACCAGAAGCCCATTCCCCAGCCAGCATCTGGAAGCCC CCGAGGACAAGAGCTTCGGCAGC AGCCTGATGGAAAGCGAAGTGAA CCTGGACAGATACCAGACCGCCCTGGAAGAGGTGCTGAGCTGGCTG CTGAGCGCCGAGGATACACTGCAGGCTCAGGGCGAGATCAGCAACG ACGTGGAAGTCGTGAAGGACCAGTTCCACACCCACGAGGGCTACAT GATGGACCTGACAGCCCACCAGGGCAGAGTGGGCAACATCCTGCAG CTGGGCTCCAAGCTGATCGGCACCGGCAAGCTGAGCGA GGACGAAG AGACAGAGGTGCAGGAACAGATGAACCTGCTGAACAGCAGATGGG AGTGCCTGCGGGTGGCCAGCATGGAAAAGCAGAGCAACCTGCATAG AGTACTGCTCCAAGACATCCTGCTGAAGTGGCAGCGGCTGACCGAG GAACAGTGCCTGTTTAGCGCCTGGCTGTCCGAGAAAGAGGACGCCG TGAACAAGATCCACACCACCGGCTTCAAGGACCAGAACGAGATGCT GAGCA GCCTGCAGAAACTGGCCGTGCTGAAGGCCGACCTGGAAAAG AAAAAGCAGTCCATGGGCAAGCTGTACTCCCTGAAGCAGGACCTGC TGTCCACCCTGAAGAACAAGAGCGTGACCCAGAAAACCGAGGCCTG GCTGGACAACTTCGCCCGGTGCTGGGACAACCTGGTGCAGAAGCTG GAAAAGTCCACCGCCCAGATCTCCCAGGCCGTGACCACAACACAGC CCAGCCTGACCCAGACCAC CGTGATGGAAACCGTGACAACAGTGAC CACCCGGGAACAGATCCTCGTGAAGCACGCCCAGGAAGAACTGCCC CCTCCACCCCCCCAGAAGAAACGGCAGATCACAGTGGACAGTGAAG CTCAGATCCACACCGTGCGGGAAGAGACAATGATGGTCATGACAGA GGACATGCCCCTGGAAATCAGCTACGTGCCCAGCACCTACCTGACCG AGATCACCCATGTGTCCCAGCCCTGCTG GAAGTGGAACAGCTGCTG AACGCCCCCGACCTGTGCGCCAAGGATTTCGAGGACCTGTTCAAGCA GGAAGAGAGCCTGAAGAATATCAAGGATAGCCTGCAGCAGAGCAGC GGCCGGATCGACATCATCCACAGCAAGAAAACAGCCGCCCTGCAGA GCGCCACCCCCGTGGAAAGAGTGAAACTGCAGGAAGCCCTGTCCCA GCTGGACTTCCAGTGGGAGAAAGTGAACAAAATGTACAAGGACC GG CAGGGCAGATTCGACCGCAGCGTGGAAAAGTGGCGGCGGTTCCACT ACGACATCAAGATCTTCAACCAGTGGCTGACAGAGGCCGAGCAGTT CCTGAGAAAGACCCAGATCCCCGAGAACTGGGAGCACGCCAAGTAC AAGTGGTATCTGAAAGAGCTGCAGGACGGCATCGGCCAGAGACAGA CAGTCGTGCGGACCCTGAATGCCACCGGCGAGGAAATCATCCAGCA GTCCAGCAAGACCGA CGCCAGCATTCTGCAGGAAAAGCTGGGCAGC CTGAACCTGCGGTGGCAGGAAGTGTGCAAGCAGCTGTCCGACCGGA AGAAGCGGCTGGAAGAACAGCTGGAACGGCTGCAGGAACTGCAGG AGGCCACCGACGAGCTGGACCTGAAACTGAGACAGGCCGAAGTGAT CAAGGGCAGCTGGCAGCCAGTGGGCGACCTGCTGATCGACTCCCTG CAGGACCATCTGGAAAAAGTGAAGGCCCTGAGAG GCGAGATCGCCC

- 66 046419- 66 046419

CCCTGAAAGAAAACGTGTCCCACGTGAACGACCTGGCCCGGCAGCT GACAACACTGGGCATTCAGCTGAGCCCCTACAACCTGAGCACACTG GAAGATCTGAACACCCGGTGGAAGCTGCTGCAGGTGGCCGTGGAAG ATAGAGTGCGGCAGCTGCACGAGGCCCACAGAGATTTTGGCCCTGC CTCCCAGCACTTCCTGAGCACCAGTGTGCAGGGCCCTTGGGAGAGA GCCATCTCCCCTAACAAGGTGCCCTACTACATCAACCACGAGACACA GACCACCTGTTGGGACCACCCCAAGATGACCGAGCTGTACCAGAGC CTGGCTGACCTGAACAACGTGCGGTTCAGCGCCTACCGGACCGCCAT GAAGCTGCGGAGACTGCAGAAAGCTCTGTGCCTGGATCTGCTGTCCC TGTCCGCCGCCTGTGATGCCCTGGACCAGCACAATCTGAAGCAGAAC GACCAGCCCATGGATATCCTGCAGATCATCAACTGCCTGACCACCAT CTACGACCGGCTGGAACAGGAACACAACAATCTCGTGAACGTGCCC CTGTGCGTGGACATGTGCCTGAATTGGCTGCTGAATGTGTACGACAC CGGCCGGACAGGCCGGATCAGAGTGCTGTCCTTCAAGACCGGCATC ATCAGCCTGTGCAAAGCCCACCTGGAAGATAAGTACCGGTATCTGTT CAAACAGGTGGCCTCTAGCACCGGCTTTTGCGACCAGAGAAGGCTG GGCCTGCTGCTGCACGACAGCATCCAGATCCCTAGACAGCTGGGCG AAGTGGCCAGCTTTGGCGGCAGCAACATCGAGCCTAGCGTGCGGAG CTGCTTCCAGTTCGCCAACAACAAGCCCGAGATCGAGGCCGCCCTGT TCCTGGACTGGATGAGACTGGAACCCCAGAGCATGGTGTGGCTGCC CGTGCTGCATAGAGTGGCCGCTGCCGAGACAGCCAAGCACCAGGCC AAGTGCAACATCTGCAAAGAGTGCCCCATCATCGGCTTCCGGTACAG AAGCCTGAAGCACTTCAACTACGATATCTGCCAGAGCTGTTTCTTCA GCGGCAGGGTGGCCAAGGGCCACAAAATGCACTACCCCATGGTGGA ATACTGCACCCCCACCACAAGCGGCGAGGATGTGCGGGATTTCGCC AAGGTGCTGAAAAACAAGTTCCGGACCAAGCGGTACTTCGCCAAAC ACCCCCGGATGGGCTACCTGCCTGTGCAGACAGTGCTGGAAGGCGA CAACATGGAAACCGACACCATGTGATGATGATTTGGGCAGAGCGAT GGAGTCCTTAGTATCAGTCATGACAGATGAAGAAGGAGCAGAATAA ATGTTTTACAACTCCTGATTCCCGCATGCGGCCAGCTTATCGATACC GTCGAAATAAAAGATCCTTATTTTCATTGGATCTGTGTGTTGGTTTTT TGTGTG CCCTGAAAGAAAACGTGTCCCACGTGAACGACCTGGCCCGGCAGCT GACAACACTGGGCATTCAGCTGAGCCCCTACAACCTGAGCACACTG GAAGATCTGAACACCCGGTGGAAGCTGCTGCAGGTGGCCGTGGAAG ATAGAGTGCGGCAGCTGCACGAGGCCCACAGAGATTTTGGCCCTGC CTCCCAGCACTTCCTGAGCACCAGTGTGCAGGGCCCTTGGGAGAGA GCCATCTCCCC TAACAAGGTGCCCTACTACATCAACCACGAGACACA GACCACCTGTTGGGACCACCCCAAGATGACCGAGCTGTACCAGAGC CTGGCTGACCTGAACAACGTGCGGTTCAGCGCCTACCGGACCGCCAT GAAGCTGCGGAGACTGCAGAAAGCTCTGTGCCTGGATCTGCTGTCCC TGTCCGCCGCCTGTGATGCCCTGGACCAGCACAATCTGAAGCAGAAC GACCAGCCCATGGATATCCT GCAGATCATCAACTGCCTGACCACCAT CTACGACCGGCTGGAACAGGAACACAACAATCTCGTGAACGTGCCC CTGTGCGTGGACATGTGCCTGAATTGGCTGCTGAATGTGTACGACAC CGGCCGGACAGGCCGGATCAGAGTGCTGTCCTTCAAGACCGGCATC ATCAGCCTGTGCAAAGCCCACCTGGAAGATAAGTACCGGTATCTGTT CAAACAGGTGGCCTCTAGCACCGGCTTTTGCGAC CAGAGAAGGCTG GGCCTGCTGCTGCACGACAGCATCCAGATCCCTAGACAGCTGGGCG AAGTGGCCAGCTTTGGCGGCAGCAACATCGAGCCTAGCGTGCGGAG CTGCTTCCAGTTCGCCAACAACAAGCCCGAGATCGAGGCCGCCCTGT TCCTGGACTGGATGAGACTGGAACCCCAGAGCATGGTGTGGCTGCC CGTGCTGCATAGAGTGGCCGCTGCCGAGACAGCCAAGCACCAGG CC AAGTGCAACATCTGCAAAGAGTGCCCCATCATCGGCTTCCGGTACAG AAGCCTGAAGCACTTCAACTACGATATCTGCCAGAGCTGTTTCTTCA GCGGCAGGGTGGCCAAGGGCCACAAAATGCACTACCCCATGGTGGA ATACTGCACCCCCACCAAGCGGCGAGGATGTGCGGGATTTCGCC AAGGTGCTGAAAAACAAGTTCCGGACCAAGCGGTACTTCGCCAAAC ACCCCCGGATG CTACCTGCCTGTGCAGACAGTGCTGGAAGGCGA CAACATGGAAACCGACACCATGTGATGATGATTTGGGCAGAGCGAT GGAGTCCTTAGTATCAGTCATGACAGATGAAGAAGGAGCAGAATAA ATGTTTTTACAACTCCTGATTCCCGCATGCGGCCAGCTTATCGATACC GTCGAAATAAAAGATCCTTATTTTCATTGGATCTGTGTGTTGGTTTTTT TGTGTG SEQ ID NO: 140 - BXA- 196479 SEQ ID NO: 140 - BXA- 196479 ATGCTGTGGTGGGAGGAAGTGGAAGATTGCTACGAGCGCGAGGACG TGCAGAAGAAAACCTTCACCAAATGGGTGAACGCCCAGTTCAGCAA GTTCGGCAAGCAGCACATCGAGAACCTGTTCAGCGACCTGCAGGAC GGCAGACGGCTGCTGGACCTGCTGGAAGGCCTGACCGGCCAGAAGC TGCCCAAAGAGAAGGGCAGCACCAGAGTGCACGCCCTGAACAACGT GAACAAGGCCCTGCGGGTGCTGCAGAACAACAACGTGGACCTGGTG AACATCGGCAGCACCGACATCGTGGACGGCAACCACAAGCTGACCC TGGGCCTGATCTGGAACATCATCCTGCACTGGCAGGTCAAAAACGTG ATGAAGAACATCATGGCCGGCCTGCAGCAGACCAACAGCGAGAAGA TCCTGCTGAGCTGGGTGCGCCAGAGCACCCGGAACTACCCCCAGGTC AACGTGATCAACTTCACCACCTCTTGGAGCGACGGCCTGGCCCTGAA CGCCCTGATCCACAGCCACCGGCCCGACCTGTTCGACTGGAACAGCG TGGTCTGCCAGCAGAGCGCCACCCAGCGGCTGGAACACGCCTTCAA TATCGCCAGATACCAGCTGGGCATCGAGAAGCTGCTGGATCCCGAG GACGTGGACACCACCTACCCCGACAAGAAATCCATCCTGATGTATAT CACCAGCCTGTTCCAGGTGCTGCCCCAGCAGGTGTCCATCGAGGCCA ATGCTGTGGTGGGAGGAAGTGGAAGATTGCTACGAGCGCGAGGACG TGCAGAAGAAAACCTTCACCAAATGGGTGAACGCCCAGTTCAGCAA GTTCGGCAAGCAGCACATCGAGAACCTGTTCAGCGACCTGCAGGAC GGCAGACGGCTGCTGGACCTGCTGGAAGGCCTGACCGGCCAGAAGC TGCCCAAAGAAGGGCAGCACCAGAGTGCACGCCCTGAACAACGT GAACAAGGCCC TGCGGGTGCTGCAGAACAACAACGTGGACCTGGTG AACATCGGCAGCACCGACATCGTGGACGGCAACCACAAGCTGACCC TGGGCCTGATCTGGAACATCATCCTGCACTGGCAGGTCAAAAACGTG ATGAAGAACATCATGGCCGGCCTGCAGCAGACCAACAGCGAGAAGA TCCTGCTGAGCTGGGTGCGCCAGAGCACCCGGAACTACCCCCAGGTC AACGTGATCAACTTCACCACCTCTTAG CGACGGCCTGGCCCTGAA CGCCCTGATCCACAGCCACCGGCCCGACCTGTTCGACTGGAACAGCG TGGTCTGCCAGCAGAGCGCCACCCAGCGGCTGGAACACGCCTTCAA TATCGCCAGATACCAGCTGGGCATCGAGAAGCTGCTGGATCCCGAG GACGTGGACACCACCTACCCCGACAAGAAATCCATCCTGATGTATAT CACCAGCCTGTTCCAGGTGCTGCCCCAGGTGTCCAT CGAGGCCA

- 67 046419- 67 046419

TCCAGGAAGTGGAAATGCTGCCCAGACCCCCCAAAGTGACCAAAGA GGAACACTTCCAGCTGCACCACCAGATGCACTACAGCCAGCAGATC ACCGTGTCCCTGGCCCAGGGCTACGAGAGAACCAGCAGCCCCAAGC CCCGGTTCAAGAGCTACGCCTATACCCAGGCCGCCTACGTGACCACC AGCGACCCTACCAGAAGCCCATTCCCCAGCCAGCATCTGGAAGCCC CCGAGGACAAGAGCTTCGGCAGCAGCCTGATGGAAAGCGAAGTGAA CCTGGACAGATACCAGACCGCCCTGGAAGAGGTGCTGAGCTGGCTG CTGAGCGCCGAGGATACACTGCAGGCTCAGGGCGAGATCAGCAACG ACGTGGAAGTCGTGAAGGACCAGTTCCACACCCACGAGGGCTACAT GATGGACCTGACAGCCCACCAGGGCAGAGTGGGCAACATCCTGCAG CTGGGCTCCAAGCTGATCGGCACCGGCAAGCTGAGCGAGGACGAAG AGACAGAGGTGCAGGAACAGATGAACCTGCTGAACAGCAGATGGG AGTGCCTGCGGGTGGCCAGCATGGAAAAGCAGAGCAACCTGCATCT GCTGAAGTGGCAGCGGCTGACCGAGGAACAGTGCCTGTTTAGCGCC TGGCTGTCCGAGAAAGAGGACGCCGTGAACAAGATCCACACCACCG GCTTCAAGGACCAGAACGAGATGCTGAGCAGCCTGCAGAAACTGGC CGTGCTGAAGGCCGACCTGGAAAAGAAAAAGCAGTCCATGGGCAAG CTGTACTCCCTGAAGCAGGACCTGCTGTCCACCCTGAAGAACAAGA GCGTGACCCAGAAAACCGAGGCCTGGCTGGACAACTTCGCCCGGTG CTGGGACAACCTGGTGCAGAAGCTGGAAAAGTCCACCGCCCAGATC TCCCAGGCCGTGACCACAACACAGCCCAGCCTGACCCAGACCACCG TGATGGAAACCGTGACAACAGTGACCACCCGGGAACAGATCCTCGT GAAGCACGCCCAGGAAGAACTGCCCCCTCCACCCCCCCAGAAGAAA CGGCAGATCACAGTGGACAGTGAAGCTCAGATCCACACCGTGCGGG AAGAGACAATGATGGTCATGACAGAGGACATGCCCCTGGAAATCAG CTACGTGCCCAGCACCTACCTGACCGAGATCACCCATGTGTCCCAGG CCCTGCTGGAAGTGGAACAGCTGCTGAACGCCCCCGACCTGTGCGCC AAGGATTTCGAGGACCTGTTCAAGCAGGAAGAGAGCCTGAAGAATA TCAAGGATAGCCTGCAGCAGAGCAGCGGCCGGATCGACATCATCCA CAGCAAGAAAACAGCCGCCCTGCAGAGCGCCACCCCCGTGGAAAGA GTGAAACTGCAGGAAGCCCTGTCCCAGCTGGACTTCCAGTGGGAGA AAGTGAACAAAATGTACAAGGACCGGCAGGGCAGATTCGACCGCAG CGTGGAAAAGTGGCGGCGGTTCCACTACGACATCAAGATCTTCAAC CAGTGGCTGACAGAGGCCGAGCAGTTCCTGAGAAAGACCCAGATCC CCGAGAACTGGGAGCACGCCAAGTACAAGTGGTATCTGAAAGAGCT GCAGGACGGCATCGGCCAGAGACAGACAGTCGTGCGGACCCTGAAT GCCACCGGCGAGGAAATCATCCAGCAGTCCAGCAAGACCGACGCCA GCATTCTGCAGGAAAAGCTGGGCAGCCTGAACCTGCGGTGGCAGGA AGTGTGCAAGCAGCTGTCCGACCGGAAGAAGCGGCTGGAAGAACAG CTGGAACGGCTGCAGGAACTGCAGGAGGCCACCGACGAGCTGGACC TGAAACTGAGACAGGCCGAAGTGATCAAGGGCAGCTGGCAGCCAGT GGGCGACCTGCTGATCGACTCCCTGCAGGACCATCTGGAAAAAGTG AAGGCCCTGAGAGGCGAGATCGCCCCCCTGAAAGAAAACGTGTCCC ACGTGAACGACCTGGCCCGGCAGCTGACAACACTGGGCATTCAGCT GAGCCCCTACAACCTGAGCACACTGGAAGATCTGAACACCCGGTGG AAGCTGCTGCAGGTGGCCGTGGAAGATAGAGTGCGGCAGCTGCACG AGGCCCACAGAGATTTTGGCCCTGCCTCCCAGCACTTCCTGAGCACC AGTGTGCAGGGCCCTTGGGAGAGAGCCATCTCCCCTAACAAGGTGCTCCAGGAAGTGGAAATGCTGCCCAGACCCCCCAAAGTGACCAAAGA GGAACACTTCCAGCTGCACCACCAGATGCACTACAGCCAGCAGATC ACCGTGTCCCTGGCCCAGGGCTACGAGAGAACCAGCAGCCCCAAGC CCCGGTTCAAGAGCTACGCCTATACCCAGGCCGCCTACGTGACCACC AGCGACCCTACCAGAAGCCCATTCCCCAGCCAGCATCTGGAAGCCC CCGAGGACAAGAG CTTCGGCAGCAGCCTGATGGAAAGCGAAGTGAA CCTGGACAGATACCAGACCGCCCTGGAAGAGGTGCTGAGCTGGCTG CTGAGCGCCGAGGATACACTGCAGGCTCAGGGCGAGATCAGCAACG ACGTGGAAGTCGTGAAGGACCAGTTCCACACCCACGAGGGCTACAT GATGGACCTGACAGCCCACCAGGGCAGAGTGGGCAACATCCTGCAG CTGGGCTCCAAGCTGATCGGCACCCA AGCTGAGCGAGGACGAAG AGACAGAGGTGCAGGAACAGATGAACCTGCTGAACAGCAGATGGG AGTGCCTGCGGGTGGCCAGCATGGAAAAGCAGAGCAACCTGCATCT GCTGAAGTGGCAGCGGCTGACCGAGGAACAGTGCCTGTTTAGCGCC TGGCTGTCCGAGAAAGAGGACGCCGTGAACAAGATCCACACCACCG GCTTCAAGGACCAGAACGAGATGCTGAGCAGCCTGCAGAAACT GGC CGTGCTGAAGGCCGACCTGGAAAAGAAAAAGCAGTCCATGGGCAAG CTGTACTCCCTGAAGCAGGACCTGCTGTCCACCCTGAAGAACAAGA GCGTGACCCAGAAAACCGAGGCCTGGCTGGACAACTTCGCCCGGTG CTGGGACAACCTGGTGCAGAAGCTGGAAAAGTCCACCGCCCAGATC TCCCAGGCCGTGACCACAACACAGCCCAGCCTGACCCAGACCACG TGATGGAAA CCGTGACAACAGTGACCACCCGGGAACAGATCCTCGT GAAGCACGCCCAGGAAGAACTGCCCCCTCCACCCCCCCAGAAGAAA CGGCAGATCACAGTGGACAGTGAAGCTCAGATCCACACCGTGCGGG AAGACAAATGATGGTCATGACAGAGGACATGCCCCTGGAAATCAG CTACGTGCCCAGCACCTACCTGACCGAGATCACCCATGTGTCCCAGG CCCTGCTGGAAGTGGAACAG CTGCTGAACGCCCCCGACCTGTGCGCC AAGGATTTCGAGGACCTGTTCAAGCAGGAAGAGAGCCTGAAGAATA TCAAGGATAGCCTGCAGCAGAGCAGCGGCCGGATCGACATCATCCA CAGCAAGAAAACAGCCGCCCTGCAGAGCGCCACCCCCGTGGAAAGA GTGAAACTGCAGGAAGCCCTGTCCCAGCTGGACTTCCAGTGGGAGA AAGTGAACAAAATGTACAAGGACCGGCAGGGCAG ATTCGACCGCAG CGTGGAAAAGTGGCGGCGGTTCCACTACGACATCAAGATCTTCAAC CAGTGGCTGACAGAGGCCGAGCAGTTCCTGAGAAAGACCCAGATCC CCGAGAACTGGGAGCACGCCAAGTACAAGTGGTATCTGAAAGAGCT GCAGGACGGCATCGGCCAGAGACAGACAGTCGTGCGGACCCTGAAT GCCACCGGCGAGGAAATCCATCCAGCAGTCCAGCAAGACCGACGCCA GCATTCTGCAGGAAAAGCTGGCAGCCTGAACCTGCGGTGGCAGGA AGTGTGCAAGCAGCTGTCCGACCGGAAGAAGCGGCTGGAAGAACAG CTGGAACGGCTGCAGGAACTGCAGGAGGCCACCGACGAGCTGGACC TGAAACTGAGACAGGCCGAAGTGATCAAGGGCAGCTGGCAGCCAGT GGGCGACCTGCTGATCGACTCCCTGCAGGACCATCTGGAAAAAGTG AAGGCCCTGAGAGGC GAGATCGCCCCCCTGAAAGAAAACGTGTCCC ACGTGAACGACCTGGCCCGGCAGCTGACAACACTGGGCATTCAGCT GAGCCCCTACAACCTGAGCACACTGGAAGATCTGAACACCCGGTGG AAGCTGCTGCAGGTGGCCGTGGAAGATAGAGTGCGGCAGCTGCACG AGGCCCACAGATTTTGGCCCTGCCTCCCAGCACTTCCTGAGCACC AGTGTGCAGGGCCCTTGGGAGAGAGCCAT CTCCCCTAACAAGGTGC

- 68 046419- 68 046419

CCTACTACATCAACCACGAGACACAGACCACCTGTTGGGACCACCCC AAGATGACCGAGCTGTACCAGAGCCTGGCTGACCTGAACAACGTGC GGTTCAGCGCCTACCGGACCGCCATGAAGCTGCGGAGACTGCAGAA AGCTCTGTGCCTGGATCTGCTGTCCCTGTCCGCCGCCTGTGATGCCCT GGACCAGCACAATCTGAAGCAGAACGACCAGCCCATGGATATCCTG CAGATCATCAACTGCCTGACCACCATCTACGACCGGCTGGAACAGG AACACAACAATCTCGTGAACGTGCCCCTGTGCGTGGACATGTGCCTG AATTGGCTGCTGAATGTGTACGACACCGGCCGGACAGGCCGGATCA GAGTGCTGTCCTTCAAGACCGGCATCATCAGCCTGTGCAAAGCCCAC CTGGAAGATAAGTACCGGTATCTGTTCAAACAGGTGGCCTCTAGCAC CGGCTTTTGCGACCAGAGAAGGCTGGGCCTGCTGCTGCACGACAGC ATCCAGATCCCTAGACAGCTGGGCGAAGTGGCCAGCTTTGGCGGCA GCAACATCGAGCCTAGCGTGCGGAGCTGCTTCCAGTTCGCCAACAAC AAGCCCGAGATCGAGGCCGCCCTGTTCCTGGACTGGATGAGACTGG AACCCCAGAGCATGGTGTGGCTGCCCGTGCTGCATAGAGTGGCCGCT GCCGAGACAGCCAAGCACCAGGCCAAGTGCAACATCTGCAAAGAGT GCCCCATCATCGGCTTCCGGTACAGAAGCCTGAAGCACTTCAACTAC GATATCTGCCAGAGCTGTTTCTTCAGCGGCAGGGTGGCCAAGGGCCA CAAAATGCACTACCCCATGGTGGAATACTGCACCCCCACCACAAGC GGCGAGGATGTGCGGGATTTCGCCAAGGTGCTGAAAAACAAGTTCC GGACCAAGCGGTACTTCGCCAAACACCCCCGGATGGGCTACCTGCCT GTGCAGACAGTGCTGGAAGGCGACAACATGGAAACCGACACCATGT GATGATGATTTGGGCAGAGCGATGGAGTCCTTAGTATCAGTCATGAC AGATGAAGAAGGAGCAGAATAAATGTTTTACAACTCCTGATTCCCG CATGCGGCCAGCTTATCGATACCGTCGAAATAAAAGATCCTTATTTT CATTGGATCTGTGTGTTGGTTTTTTGTGTG CCTACTACATCAACCACGAGACACAGACCACCTGTTGGGACCACCCCC AAGATGACCGAGCTGTACCAGAGCCTGGCTGACCTGAACAACGTGC GGTTCAGCGCCTACCGGACCGCCATGAAGCTGCGGAGACTGCAGAA AGCTCTGTGCCTGGATCTGCTGTCCCTGTCCGCCGCCTGTGATGCCCT GGACCAGCACAATCTGAAGCAGAACGACCAGCCCATGGATATCCTG CAGATCAT CAACTGCCTGACCACCATCTACGACCGGCTGGAACAGG AACACAACAATCTCGTGAACGTGCCCCTGTGCGTGGACATGTGCCTG AATTGGCTGCTGAATGTGTACGACACCGGCCGGACAGGCCGGATCA GAGTGCTGTCCTTCAAGACCGGCATCATCAGCCTGTGCAAAGCCCAC CTGGAAGATAAGTACCGGTATCTGTTCAAACAGGTGGCCTCTAGCAC CGGCTTTTGCGACCAGAGAA GGCTGGGCCTGCTGCTGCACGACAGC ATCCAGATCCCTAGACAGCTGGGCGAAGTGGCCAGCTTTGGCGGCA GCAACATCGAGCCTAGCGTGCGGAGCTGCTTCCAGTTCGCCAACAAC AAGCCCGAGATCGAGGCCGCCCTGTTCCTGGACTGGATGAGACTGG AACCCCAGAGCATGGTGTGGCTGCCCGTGCTGCATAGAGTGGCCGCT GCCGAGACAGCCAAGCACCAGGCCAAGTGCA ACATCTGCAAAGAGT GCCCCATCATCGGCTTCCGGTACAGAAGCCTGAAGCACTTCAACTAC GATATCTGCCAGAGCTGTTTCTTCAGCGGCAGGGTGGCCAAGGGCCA CAAAATGCACTACCCCATGGTGGAATACTGCACCCCCACCACAAGC GGCGAGGATGTGCGGGATTTCGCCAAGGTGCTGAAAAACAAGTTCC GGACCAAGCGGTACTTCGCCAAACACCCCCGGATGGGCTACCTGC CT GTGCAGACAGTGCTGGAAGGCGACAACATGGAAACCGACACCATGT GATGATGATTTGGGCAGAGCGATGGAGTCCTTAGTATCAGTCATGAC AGATGAAGAAGGAGCAGAATAAATGTTTTACAACTCCTGATTCCCG CATGCGGCCAGCTTATCGATACCGTCGAAATAAAAGATCCTTATTTT CATTGGATCTGTGTGTTGGTTTTTTGTGTG SEQ ID NO: 141 - BXA- 196480 SEQ ID NO: 141 - BXA- 196480 ATGCTGTGGTGGGAGGAAGTGGAAGATTGCTACGAGCGCGAGGACG TGCAGAAGAAAACCTTCACCAAATGGGTGAACGCCCAGTTCAGCAA GTTCGGCAAGCAGCACATCGAGAACCTGTTCAGCGACCTGCAGGAC GGCAGACGGCTGCTGGACCTGCTGGAAGGCCTGACCGGCCAGAAGC TGCCCAAAGAGAAGGGCAGCACCAGAGTGCACGCCCTGAACAACGT GAACAAGGCCCTGCGGGTGCTGCAGAACAACAACGTGGACCTGGTG AACATCGGCAGCACCGACATCGTGGACGGCAACCACAAGCTGACCC TGGGCCTGATCTGGAACATCATCCTGCACTGGCAGGTCAAAAACGTG ATGAAGAACATCATGGCCGGCCTGCAGCAGACCAACAGCGAGAAGA TCCTGCTGAGCTGGGTGCGCCAGAGCACCCGGAACTACCCCCAGGTC AACGTGATCAACTTCACCACCTCTTGGAGCGACGGCCTGGCCCTGAA CGCCCTGATCCACAGCCACCGGCCCGACCTGTTCGACTGGAACAGCG TGGTCTGCCAGCAGAGCGCCACCCAGCGGCTGGAACACGCCTTCAA TATCGCCAGATACCAGCTGGGCATCGAGAAGCTGCTGGATCCCGAG GACGTGGACACCACCTACCCCGACAAGAAATCCATCCTGATGTATAT CACCAGCCTGTTCCAGGTGCTGCCCCAGCAGGTGTCCATCGAGGCCA TCCAGGAAGTGGAAATGCTGCCCAGACCCCCCAAAGTGACCAAAGA GGAACACTTCCAGCTGCACCACCAGATGCACTACAGCCAGCAGATC ACCGTGTCCCTGGCTCAGGGCTACGAGCGGACCAGCAGCCCCAAGC CCCGGTTCAAGAGCTACGCCTACACCCAGGCCGCCTACGTGACCACC AGCGACCCCACCAGAAGCCCATTCCCCAGCCAGCATCTGGAAGCCC CCGAGGACAAGAGCTTCGGCAGCAGCCTGATGGAAAGCGAAGTGAA ATGCTGTGGTGGGAGGAAGTGGAAGATTGCTACGAGCGCGAGGACG TGCAGAAGAAAACCTTCACCAAATGGGTGAACGCCCAGTTCAGCAA GTTCGGCAAGCAGCACATCGAGAACCTGTTCAGCGACCTGCAGGAC GGCAGACGGCTGCTGGACCTGCTGGAAGGCCTGACCGGCCAGAAGC TGCCCAAAGAAGGGCAGCACCAGAGTGCACGCCCTGAACAACGT GAACAAGGCCC TGCGGGTGCTGCAGAACAACAACGTGGACCTGGTG AACATCGGCAGCACCGACATCGTGGACGGCAACCACAAGCTGACCC TGGGCCTGATCTGGAACATCATCCTGCACTGGCAGGTCAAAAACGTG ATGAAGAACATCATGGCCGGCCTGCAGCAGACCAACAGCGAGAAGA TCCTGCTGAGCTGGGTGCGCCAGAGCACCCGGAACTACCCCCAGGTC AACGTGATCAACTTCACCACCTCTTAG CGACGGCCTGGCCCTGAA CGCCCTGATCCACAGCCACCGGCCCGACCTGTTCGACTGGAACAGCG TGGTCTGCCAGCAGAGCGCCACCCAGCGGCTGGAACACGCCTTCAA TATCGCCAGATACCAGCTGGGCATCGAGAAGCTGCTGGATCCCGAG GACGTGGACACCACCTACCCCGACAAGAAATCCATCCTGATGTATAT CACCAGCCTGTTCCAGGTGCTGCCCCAGGTGTCCAT CGAGGCCA TCCAGGAAGTGGAAATGCTGCCCAGACCCCCCAAAGTGACCAAAGA GGAACACTTCCAGCTGCACCACCAGATGCACTACAGCCAGCAGATC ACCGTGTCCCTGGCTCAGGGCTACGAGCGGACCAGCAGCCCCAAGC CCCGGTTCAAGAGCTACGCCTACACCCAGGCCGCCTACGTGACCACC AGCGACCCCACCAGAAGCCCATTCCCCAGCCAGCATCTGGAAGCCC CCGAGGA CAAGAGCTTCGGCAGCAGCCTGATGGAAAGCGAAGTGAA

- 69 046419- 69 046419

CCTGGACAGATACCAGACCGCCCTGGAAGAGGTGCTGTCCTGGCTG CTGAGCGCCGAGGATACACTGCAGGCCCAGGGCGAGATCAGCAACG ACGTGGAAGTGGTGAAAGACCAGTTCCACACCCACGAGGGCTACAT GATGGACCTGACCGCCCACCAGGGCAGAGTGGGCAACATCCTGCAG CTGGGCAGCAAGCTGATCGGCACCGGCAAGCTGAGCGAGGACGAAG AGACAGAGGTGCAGGAACAGATGAACCTGCTGAACAGCAGATGGG AGTGCCTGCGGGTGGCCAGCATGGAAAAGCAGAGCAACCTGCACAT CCACACCGTGCGGGAAGAGACAATGATGGTGATGACCGAGGACATG CCCCTGGAAATCAGCTACGTGCCCAGCACCTACCTGACCGAGATCAC CCACGTGTCCCAGGCTCTGCTGGAAGTGGAACAGCTGCTGAACGCCC CCGACCTGTGCGCCAAGGACTTCGAGGATCTGTTCAAGCAGGAAGA GAGCCTGAAGAATATCAAGGACTCCCTGCAGCAGTCCAGCGGCCGG ATCGACATCATCCACAGCAAGAAAACAGCCGCCCTGCAGTCCGCCA CCCCCGTGGAAAGAGTGAAGCTGCAGGAAGCCCTGAGCCAGCTGGA CTTCCAGTGGGAGAAAGTGAACAAGATGTACAAGGACCGGCAGGGC AGATTCGACCGCAGCGTGGAAAAGTGGCGGCGGTTCCACTACGACA TCAAGATCTTCAACCAGTGGCTGACCGAGGCCGAGCAGTTCCTGAG AAAGACCCAGATCCCCGAGAACTGGGAGCACGCCAAGTACAAGTGG TATCTGAAAGAACTGCAGGATGGCATCGGCCAGCGGCAGACCGTGG TGCGCACACTGAATGCCACCGGCGAGGAAATCATCCAGCAGAGCAG CAAGACCGACGCCAGCATCCTGCAGGAAAAGCTGGGCTCCCTGAAC CTGCGGTGGCAGGAAGTGTGCAAGCAGCTGAGCGACCGGAAGAAGA GGCTGGAAGAACAGGCCCCTGGCCTGACCACCATCGGCGCCAGCCC TACCCAGACCGTGACCCTGGTGACACAGCCCGTGGTGACAAAAGAG ACAGCCATCTCCAAGCTGGAAATGCCCAGCTCCCTGATGCTGGAACT GGAAAGGCTGCAGGAACTGCAGGAGGCCACCGACGAGCTGGACCTG AAGCTGCGGCAGGCCGAAGTGATCAAGGGCAGCTGGCAGCCCGTGG GCGACCTGCTGATCGACAGCCTGCAGGACCACCTGGAAAAAGTGAA GGCCCTGAGAGGCGAGATCGCCCCCCTGAAAGAAAACGTGTCCCAC GTGAACGACCTGGCCCGGCAGCTGACCACCCTGGGCATCCAGCTGA GCCCCTACAACCTGAGCACCCTGGAAGATCTGAACACCCGGTGGAA GCTGCTGCAGGTGGCCGTGGAAGATAGAGTGCGGCAGCTGCACGAG GCCCACAGAGACTTTGGCCCTGCCAGCCAGCACTTCCTGAGCACCTC TGTGCAGGGACCCTGGGAGAGAGCCATCAGCCCCAACAAGGTGCCC TACTACATCAACCACGAGACACAGACCACCTGTTGGGACCACCCCA AGATGACCGAGCTGTACCAGAGCCTGGCCGACCTGAACAATGTGCG GTTCAGCGCCTACCGGACCGCCATGAAGCTGAGGCGGCTGCAGAAA GCTCTGTGCCTGGATCTGCTGAGCCTGAGCGCCGCCTGCGACGCCCT GGACCAGCACAACCTGAAGCAGAACGACCAGCCCATGGATATCCTG CAGATCATCAACTGCCTGACCACAATCTACGACAGGCTGGAACAGG AACACAACAATCTGGTCAACGTGCCCCTGTGCGTGGACATGTGCCTG AATTGGCTGCTGAATGTGTACGACACCGGCCGGACCGGCAGAATCC GGGTGCTGAGCTTCAAGACCGGCATCATCAGCCTGTGCAAGGCCCA CCTGGAAGATAAGTACCGCTACCTGTTCAAACAGGTGGCCAGCTCCA CCGGCTTTTGCGACCAGCGGAGACTGGGCCTGCTGCTGCACGACAGC ATCCAGATCCCCAGACAGCTGGGCGAGGTGGCCTCCTTCGGCGGCA GCAACATTGAGCCCAGCGTGCGGAGCTGCTTCCAGTTCGCCAACAAC AAGCCCGAGATCGAGGCCGCCCTGTTCCTGGACTGGATGAGACTGGCCTGGACAGATACCAGACCGCCCTGGAAGAGGTGCTGTCCTGGCTG CTGAGCGCCGAGGATACACTGCAGGCCCAGGGCGAGATCAGCAACG ACGTGGAAGTGGTGAAAGACCAGTTCCACACCCACGAGGGCTACAT GATGGACCTGACCGCCCACCAGGGCAGAGTGGGCAACATCCTGCAG CTGGGCAGCAAGCTGATCGGCACCGGCAAGCTGAGCGAGGACGAAG AGACAGAGGTG CAGGAACAGATGAACCTGCTGAACAGCAGATGGG AGTGCCTGCGGGTGGCCAGCATGGAAAAGCAGAGCAACCTGCACAT CCACACCGTGCGGGAAGAGACAATGATGGTGATGACCGAGGACATG CCCCTGGAAATCAGCTACGTGCCCAGCACCTACCTGACCGAGATCAC CCACGTGTCCCAGGCTCTGCTGGAAGTGGAACAGCTGCTGAACGCCC CCGACCTGTGCGCCAAGGACTTCGA GGATCTGTTCAAGCAGGAAGA GAGCCTGAAGAATATCAAGGACTCCCTGCAGCAGTCCAGCGGCCGG ATCGACATCATCCACAGCAAGAAAACAGCCGCCCTGCAGTCCGCCA CCCCCGTGGAAAGAGTGAAGCTGCAGGAAGCCCTGAGCCAGCTGGA CTTCCAGTGGGAGAAAGTGAACAAGATGTACAAGGACCGGCAGGGC AGATTCGACCGCAGCGTGGAAAAGTGGCGGCGGTTCC ACTACGACA TCAAGATCTTCAACCAGTGGCTGACCGAGGCCGAGCAGTTCCTGAG AAAGACCCAGATCCCCGAGAACTGGGAGCACGCCAAGTACAAGTGG TATCTGAAAGAACTGCAGGATGGCATCGGCCAGCGGCAGACCGTGG TGCGCACACTGAATGCCACCGGCGAGGAAATCATCCAGCAGAGCAG CAAGACCGACGCCAGCATCCTGCAGGAAAAGCTGGGCTCCCTGAAC CTGC GGTGGCAGGAAGTGTGCAAGCAGCTGAGCGACCGGAAGAAGA GGCTGGAAGAACAGGCCCCTGGCCTGACCACCATCGGCGCCAGCCC TACCCAGACCGTGACCCTGGTGACACAGCCCGTGGTGACAAAAGAG ACAGCCATCTCAAGCTGGAAATGCCCAGCTCCCTGATGCTGGAACT GGAAAGGCTGCAGGAACTGCAGGAGGCCACCGACGAGCTGGACCTG AAGCTGCGGCAGGCCGAAGTG ATCAAGGGCAGCTGGCAGCCCGTGG GCGACCTGCTGATCGACAGCCTGCAGGACCACCTGGAAAAAGTGAA GGCCCTGAGAGGCGAGATCGCCCCCCTGAAAGAAAACGTGTCCCAC GTGAACGACCTGGCCCGGCAGCTGACCACCCTGGGCATCCAGCTGA GCCCCTACAACCTGAGCACCCTGGAAGATCTGAACACCCGGTGGAA GCTGCTGCAGGTGGCCGTGGAAGATAGAGTGCGGCAG CTGCACGAG GCCCACAGAGACTTTGGCCCTGCCAGCCAGCACTTCCTGAGCACCTC TGTGCAGGGACCCTGGGAGAGAGCCATCAGCCCCAACAAGGTGCCC TACTACATCAACCACGAGACACAGACCACCTGTTGGGACCACCCCA AGATGACCGAGCTGTACCAGAGCCTGGCCGACCTGAACAATGTGCG GTTCAGCGCCTACCGGACCGCCATGAAGCTGAGGCGGCTGCAGAAA GC TCTGTGCCTGGATCTGCTGAGCCTGAGCGCCGCCTGCGACGCCCT GGACCAGCACAACCTGAAGCAGAACGACCAGCCCATGGATATCCTG CAGATCATCAACTGCCTGACCACAATCTACGACAGGCTGGAACAGG AACAAACAATCTGGTCAACGTGCCCCTGTGCGTGGACATGTGCCTG AATTGGCTGCTGAATGTGTACGACACCGGCCGGACCGGCAGAATCC GGGTGCTGAGCTTC AAGACCGGCATCATCAGCCTGTGCAAGGCCCA CCTGGAAGATAAGTACCGCTACCTGTTCAAACAGGTGGCCAGCTCCA CCGGCTTTTGCGACCAGCGGAGACTGGGCCTGCTGCTGCACGACAGC ATCCAGATCCCCAGACAGCTGGGCGAGGTGGCCTCCTTCGGCGGCA GCAACATTGAGCCCAGCGTGCGGAGCTGCTTCCAGTTCGCCAACAAC AAGCCCGAGATCGAGGCCGCCCTGTTC CTGGACTGGATGAGACTGG

- 70 046419- 70 046419

AACCCCAGAGCATGGTGTGGCTGCCCGTGCTGCATCGGGTGGCCGCT GCCGAGACAGCCAAGCACCAGGCCAAGTGCAACATCTGCAAAGAGT GCCCCATCATCGGCTTCCGGTACAGAAGCCTGAAGCACTTCAACTAC GATATCTGCCAGAGCTGCTTCTTCAGCGGCAGAGTGGCCAAGGGCC ACAAAATGCACTACCCCATGGTGGAATACTGCACCCCCACCACCAG CGGCGAGGATGTGCGGGACTTCGCCAAGGTGCTGAAAAACAAGTTC CGGACCAAGCGGTACTTTGCCAAGCACCCCCGGATGGGCTACCTGCC CGTGCAGACAGTGCTGGAAGGCGACAACATGGAAACCCCTGCCCAG ATCCTGATCAGCCTGGAAAGCGAGGAACGGGGCGAGCTGGAACGGA TCCTGGCCGATCTGGAAGAGGAAAACCGGAACCTGCAGGCCGAGTA CGACCGGCTGAAGCAGCAGCACGAGCACAAGGGCCTGAGCCCCCTG CCTAGCCCCCCTGACACCATGTGATGATGATTTGGGCAGAGCGATGG AGTCCTTAGTATCAGTCATGACAGATGAAGAAGGAGCAGAATAAAT GTTTTACAACTCCTGATTCCCGCATGCGGCCAGCTTATCGATACCGT CGAAATAAAAGATCCTTATTTTCATTGGATCTGTGTGTTGGTTTTTTG TGTG AACCCCAGAGCATGGTGTGGCTGCCCGTGCTGCATCGGGTGGCCGCT GCCGACAGCCAAGCACCAGGCCAAGTGCAACATCTGCAAAGAGT GCCCCATCATCGGCTTCCGGTACAGAAGCCTGAAGCACTTCAACTAC GATATCTGCCAGAGCTGCTTCTTCAGCGGCAGAGTGGCCAAGGGCC ACAAAATGCACTACCCCATGGTGGAATACTGCACCCCCACCACCAG CGGCGAGGATGTGCGGG ACTTCGCCAAGGTGCTGAAAAACAAGTTC CGGACCAAGCGGTACTTTGCCAAGCACCCCCGGATGGGCTACCTGCC CGTGCAGACAGTGCTGGAAGGCGACAACATGGAAACCCCTGCCCAG ATCCTGATCAGCCTGGAAAGCGAGGAACGGGGCGAGCTGGAACGGA TCCTGGCCGATCTGGAAGAGGAAAACCGGAACCTGCAGGCCGAGTA CGACCGGCTGAAGCAGCAGCACGAGCACA AGGGCCTGAGCCCCCTG CCTAGCCCCCCTGACACCATGTGATGATGATTTGGGCAGAGCGATGG AGTCCTTAGTATCAGTCATGACAGATGAAGAAGGAGCAGAATAAAT GTTTTACAACTCCTGATTCCCGCATGCGGCCAGCTTATCGATACCGT CGAAATAAAAGATCCTTATTTTCATTGGATCTGTGTGTTGGTTTTTTG TGTG SEQ ID NO: 142 BXA- 196480- вариант SEQ ID NO: 142 BXA- 196480- option ATGCTGTGGTGGGAGGAAGTGGAAGATTGCTACGAGCGCGAGGACG TGCAGAAGAAAACCTTCACCAAATGGGTGAACGCCCAGTTCAGCAA GTTCGGCAAGCAGCACATCGAGAACCTGTTCAGCGACCTGCAGGAC GGCAGACGGCTGCTGGACCTGCTGGAAGGCCTGACCGGCCAGAAGC TGCCCAAAGAGAAGGGCAGCACCAGAGTGCACGCCCTGAACAACGT GAACAAGGCCCTGCGGGTGCTGCAGAACAACAACGTGGACCTGGTG AACATCGGCAGCACCGACATCGTGGACGGCAACCACAAGCTGACCC TGGGCCTGATCTGGAACATCATCCTGCACTGGCAGGTCAAAAACGTG ATGAAGAACATCATGGCCGGCCTGCAGCAGACCAACAGCGAGAAGA TCCTGCTGAGCTGGGTGCGCCAGAGCACCCGGAACTACCCCCAGGTC AACGTGATCAACTTCACCACCTCTTGGAGCGACGGCCTGGCCCTGAA CGCCCTGATCCACAGCCACCGGCCCGACCTGTTCGACTGGAACAGCG TGGTCTGCCAGCAGAGCGCCACCCAGCGGCTGGAACACGCCTTCAA TATCGCCAGATACCAGCTGGGCATCGAGAAGCTGCTGGATCCCGAG GACGTGGACACCACCTACCCCGACAAGAAATCCATCCTGATGTATAT CACCAGCCTGTTCCAGGTGCTGCCCCAGCAGGTGTCCATCGAGGCCA TCCAGGAAGTGGAAATGCTGCCCAGACCCCCCAAAGTGACCAAAGA GGAACACTTCCAGCTGCACCACCAGATGCACTACAGCCAGCAGATC ACCGTGTCCCTGGCTCAGGGCTACGAGCGGACCAGCAGCCCCAAGC CCCGGTTCAAGAGCTACGCCTACACCCAGGCCGCCTACGTGACCACC AGCGACCCCACCAGAAGCCCATTCCCCAGCCAGCATCTGGAAGCCC CCGAGGACAAGAGCTTCGGCAGCAGCCTGATGGAAAGCGAAGTGAA CCTGGACAGATACCAGACCGCCCTGGAAGAGGTGCTGTCCTGGCTG CTGAGCGCCGAGGATACACTGCAGGCCCAGGGCGAGATCAGCAACG ACGTGGAAGTGGTGAAAGACCAGTTCCACACCCACGAGGGCTACAT GATGGACCTGACCGCCCACCAGGGCAGAGTGGGCAACATCCTGCAG CTGGGCAGCAAGCTGATCGGCACCGGCAAGCTGAGCGAGGACGAAG AGACAGAGGTGCAGGAACAGATGAACCTGCTGAACAGCAGATGGG AGTGCCTGCGGGTGGCCAGCATGGAAAAGCAGAGCAACCTGCACCG GGTGCTGATCCACACCGTGCGGGAAGAGACAATGATGGTGATGACC GAGGACATGCCCCTGGAAATCAGCTACGTGCCCAGCACCTACCTGA CCGAGATCACCCACGTGTCCCAGGCTCTGCTGGAAGTGGAACAGCT ATGCTGTGGTGGGAGGAAGTGGAAGATTGCTACGAGCGCGAGGACG TGCAGAAGAAAACCTTCACCAAATGGGTGAACGCCCAGTTCAGCAA GTTCGGCAAGCAGCACATCGAGAACCTGTTCAGCGACCTGCAGGAC GGCAGACGGCTGCTGGACCTGCTGGAAGGCCTGACCGGCCAGAAGC TGCCCAAAGAAGGGCAGCACCAGAGTGCACGCCCTGAACAACGT GAACAAGGCCC TGCGGGTGCTGCAGAACAACAACGTGGACCTGGTG AACATCGGCAGCACCGACATCGTGGACGGCAACCACAAGCTGACCC TGGGCCTGATCTGGAACATCATCCTGCACTGGCAGGTCAAAAACGTG ATGAAGAACATCATGGCCGGCCTGCAGCAGACCAACAGCGAGAAGA TCCTGCTGAGCTGGGTGCGCCAGAGCACCCGGAACTACCCCCAGGTC AACGTGATCAACTTCACCACCTCTTAG CGACGGCCTGGCCCTGAA CGCCCTGATCCACAGCCACCGGCCCGACCTGTTCGACTGGAACAGCG TGGTCTGCCAGCAGAGCGCCACCCAGCGGCTGGAACACGCCTTCAA TATCGCCAGATACCAGCTGGGCATCGAGAAGCTGCTGGATCCCGAG GACGTGGACACCACCTACCCCGACAAGAAATCCATCCTGATGTATAT CACCAGCCTGTTCCAGGTGCTGCCCCAGGTGTCCAT CGAGGCCA TCCAGGAAGTGGAAATGCTGCCCAGACCCCCCAAAGTGACCAAAGA GGAACACTTCCAGCTGCACCACCAGATGCACTACAGCCAGCAGATC ACCGTGTCCCTGGCTCAGGGCTACGAGCGGACCAGCAGCCCCAAGC CCCGGTTCAAGAGCTACGCCTACACCCAGGCCGCCTACGTGACCACC AGCGACCCCACCAGAAGCCCATTCCCCAGCCAGCATCTGGAAGCCC CCGAGGA CAAGAGCTTCGGCAGCAGCCTGATGGAAAGCGAAGTGAA CCTGGACAGATACCAGACCGCCCTGGAAGAGGTGCTGTCCTGGCTG CTGAGCGCCGAGGATACACTGCAGGCCCAGGGCGAGATCAGCAACG ACGTGGAAGTGGTGAAAGACCAGTTCCACACCCACGAGGGCTACAT GATGGACCTGACCGCCCACCAGGGCAGAGTGGGCAACATCCTGCAG CTGGGCAGCAAGCTGATCGGCA CCGGCAAGCTGAGCGAGGACGAAG AGACAGAGGTGCAGGAACAGATGAACCTGCTGAACAGCAGATGGG AGTGCCTGCGGGTGGCCAGCATGGAAAAGCAGAGCAACCTGCACCG GGTGCTGATCCACACCGTGCGGGAAGAGACAATGATGGTGATGACC GAGGACATGCCCCTGGAAATCAGCTACGTGCCCAGCACCTACCTGA CCGAGATCACCCACGTGTCCCAGGCTCTGCTGGA AGTGGAACAGCT

- 71 046419- 71 046419

GCTGAACGCCCCCGACCTGTGCGCCAAGGACTTCGAGGATCTGTTCA AGCAGGAAGAGAGCCTGAAGAATATCAAGGACTCCCTGCAGCAGTC CAGCGGCCGGATCGACATCATCCACAGCAAGAAAACAGCCGCCCTG CAGTCCGCCACCCCCGTGGAAAGAGTGAAGCTGCAGGAAGCCCTGA GCCAGCTGGACTTCCAGTGGGAGAAAGTGAACAAGATGTACAAGGA CCGGCAGGGCAGATTCGACCGCAGCGTGGAAAAGTGGCGGCGGTTC CACTACGACATCAAGATCTTCAACCAGTGGCTGACCGAGGCCGAGC AGTTCCTGAGAAAGACCCAGATCCCCGAGAACTGGGAGCACGCCAA GTACAAGTGGTATCTGAAAGAACTGCAGGATGGCATCGGCCAGCGG CAGACCGTGGTGCGCACACTGAATGCCACCGGCGAGGAAATCATCC AGCAGAGCAGCAAGACCGACGCCAGCATCCTGCAGGAAAAGCTGGG CTCCCTGAACCTGCGGTGGCAGGAAGTGTGCAAGCAGCTGAGCGAC CGGAAGAAGAGGCTGGAAGAACAGAAGAACGACCTGGCCCCTGGC CTGACCACCATCGGCGCCAGCCCTACCCAGACCGTGACCCTGGTGAC ACAGCCCGTGGTGACAAAAGAGACAGCCATCTCCAAGCTGGAAATG CCCAGCTCCCTGATGCTGGAAGTGGAAAGGCTGCAGGAACTGCAGG AGGCCACCGACGAGCTGGACCTGAAGCTGCGGCAGGCCGAAGTGAT CAAGGGCAGCTGGCAGCCCGTGGGCGACCTGCTGATCGACAGCCTG CAGGACCACCTGGAAAAAGTGAAGGCCCTGAGAGGCGAGATCGCCC CCCTGAAAGAAAACGTGTCCCACGTGAACGACCTGGCCCGGCAGCT GACCACCCTGGGCATCCAGCTGAGCCCCTACAACCTGAGCACCCTGG AAGATCTGAACACCCGGTGGAAGCTGCTGCAGGTGGCCGTGGAAGA TAGAGTGCGGCAGCTGCACGAGGCCCACAGAGACTTTGGCCCTGCC AGCCAGCACTTCCTGAGCACCTCTGTGCAGGGACCCTGGGAGAGAG CCATCAGCCCCAACAAGGTGCCCTACTACATCAACCACGAGACACA GACCACCTGTTGGGACCACCCCAAGATGACCGAGCTGTACCAGAGC CTGGCCGACCTGAACAATGTGCGGTTCAGCGCCTACCGGACCGCCAT GAAGCTGAGGCGGCTGCAGAAAGCTCTGTGCCTGGATCTGCTGAGC CTGAGCGCCGCCTGCGACGCCCTGGACCAGCACAACCTGAAGCAGA ACGACCAGCCCATGGATATCCTGCAGATCATCAACTGCCTGACCACA ATCTACGACAGGCTGGAACAGGAACACAACAATCTGGTCAACGTGC CCCTGTGCGTGGACATGTGCCTGAATTGGCTGCTGAATGTGTACGAC ACCGGCCGGACCGGCAGAATCCGGGTGCTGAGCTTCAAGACCGGCA TCATCAGCCTGTGCAAGGCCCACCTGGAAGATAAGTACCGCTACCTG TTCAAACAGGTGGCCAGCTCCACCGGCTTTTGCGACCAGCGGAGACT GGGCCTGCTGCTGCACGACAGCATCCAGATCCCCAGACAGCTGGGC GAGGTGGCCTCCTTCGGCGGCAGCAACATTGAGCCCAGCGTGCGGA GCTGCTTCCAGTTCGCCAACAACAAGCCCGAGATCGAGGCCGCCCTG TTCCTGGACTGGATGAGACTGGAACCCCAGAGCATGGTGTGGCTGCC CGTGCTGCATCGGGTGGCCGCTGCCGAGACAGCCAAGCACCAGGCC AAGTGCAACATCTGCAAAGAGTGCCCCATCATCGGCTTCCGGTACAG AAGCCTGAAGCACTTCAACTACGATATCTGCCAGAGCTGCTTCTTCA GCGGCAGAGTGGCCAAGGGCCACAAAATGCACTACCCCATGGTGGA ATACTGCACCCCCACCACCAGCGGCGAGGATGTGCGGGACTTCGCC AAGGTGCTGAAAAACAAGTTCCGGACCAAGCGGTACTTTGCCAAGC ACCCCCGGATGGGCTACCTGCCCGTGCAGACAGTGCTGGAAGGCGA CAACATGGAAACCCCTGCCCAGATCCTGATCAGCCTGGAAAGCGAG GAACGGGGCGAGCTGGAACGGATCCTGGCCGATCTGGAAGAGGAAAGCTGAACGCCCCCGACCTGTGCGCCAAGGACTTCGAGGATCTGTTCA AGCAGGAAGAGAGCCTGAAGAATATCAAGGACTCCCTGCAGCAGTC CAGCGGCCGGATCGACATCATCCACAGCAAGAAAACAGCCGCCCTG CAGTCCGCCACCCCCGTGGAAAGAGTGAAGCTGCAGGAAGCCCTGA GCCAGCTGGACTTCCAGTGGGAGAAAGTGAACAAGATGTACAAGGA CCGGCAGGGCAG ATTCGACCGCAGCGTGGAAAAGTGGCGGCGGTTC CACTACGACATCAAGATCTTCAACCAGTGGCTGACCGAGGCCGAGC AGTTCCTGAGAAAGACCCAGATCCCCGAGAACTGGGAGCACGCCCAA GTACAAGTGGTATCTGAAAGAACTGCAGGATGGCATCGGCCAGCGG CAGACCGTGGTGCGCACACTGAATGCCACCGGCGAGGAAATCATCC AGCAGAGCAGCAAGACCGACGCCAG CATCCTGCAGGAAAAGCTGGG CTCCCTGAACCTGCGGTGGCAGGAAGTGTGCAAGCAGCTGAGCGAC CGGAAGAAGAGGCTGGAAGAACAGAAGAACGACCTGGCCCCTGGC CTGACCACCATCGGCGCCAGCCCTACCCAGACCGTGACCCTGGTGAC ACAGCCCGTGGTGACAAAAGAGACAGCCATCTCCAAAGCTGGAAATG CCCAGCTCCCTGATGCTGGAAGTGGAAAGGCTGCAGGAACT GCAGG AGGCCACCGACGAGCTGGACCTGAAGCTGCGGCAGGCCGAAGTGAT CAAGGGCAGCTGGCAGCCCGTGGGCGACCTGCTGATCGACAGCCTG CAGGACCACCTGGAAAAAGTGAAGGCCCTGAGAGGCGAGATCGCCC CCCTGAAAGAAAACGTGTCCCACGTGAACGACCTGGCCCGGCAGCT GACCACCCTGGGCATCCAGCTGAGCCCCTACAACCTGAGCACCCTGG AAGATCTGA ACACCCGGTGGAAGCTGCTGCAGGTGGCCGTGGAAGA TAGAGTGCGGCAGCTGCACGAGGCCCACAGAGACTTTGGCCCTGCC AGCCAGCACTTCCTGAGCACCCTGTGCAGGGACCCTGGGAGAGAG CCATCAGCCCCAACAAGGTGCCCTACTACATCAACCACGAGACACA GACCACCTGTTGGGACCACCCCAAGATGACCGAGCTGTACCAGAGC CTGGCCGACCTGAACAATGTG CGGTTCAGCGCCTACCGGACCGCCAT GAAGCTGAGGCGGCTGCAGAAAGCTCTGTGCCTGGATCTGCTGAGC CTGAGCGCCGCCTGCGACGCCCTGGACCAGCACAACCTGAAGCAGA ACGACCAGCCCATGGATATCCTGCAGATCATCAACTGCCTGACCACA ATCTACGACAGGCTGGAACAGGAACACAACAATCTGGTCAACGTGC CCCTGTGCGTGGACATGTGCCTGAATTGGCTGCTGAA TGTGTACGAC ACCGGCCGGACCGGCAGAATCCGGGTGCTGAGCTTCAAGACCGGCA TCATCAGCCTGTGCAAGGCCCACCTGGAAGATAAGTACCGCTACCTG TTCAAACAGGTGGCCAGCTCCACCGGCTTTTGCGACCAGCGGAGACT GGGCCTGCTGCTGCACGACAGCATCCAGATCCCCAGACAGCTGGGC GAGGTGGCCTCCTTCGGCGGCAGCAACATTGAGCCCAGCTGCGGA GCTGC TTCCAGTTCGCCAACAACAAGCCCGAGATCGAGGCCGCCCTG TTCCTGGACTGGATGAGACTGGAACCCCAGAGCATGGTGTGGCTGCC CGTGCTGCATCGGGTGGCCGCTGCCGAGACAGCCAAGCACCAGGCC AAGTGCAACATCTGCAAAGAGTGCCCCATCATCGGCTTCCGGTACAG AAGCCTGAAGCACTTCAACTACGATATCTGCCAGCTGCTTCTTCA GCGGCAGAGTGGCCAAG GGCCACAAAATGCACTACCCCATGGTGGA ATACTGCACCCCCACCACCAGCGGCGAGGATGTGCGGGACTTCGCC AAGGTGCTGAAAAACAAGTTCCGGACCAAGCGGTACTTTGCCAAGC ACCCCCGGATGGGCTACCTGCCCGTGCAGACAGTGCTGGAAGGCGA CAACATGGAAACCCCTGCCCAGATCCTGATCAGCCTGGAAAGCGAG GAACGGGGCGAGCTGGAACGGATCCTGGCCGAT CTGGAAGAGGAAA

- 72 046419- 72 046419

ACCGGAACCTGCAGGCCGAGTACGACCGGCTGAAGCAGCAGCACGA GCACAAGGGCCTGAGCCCCCTGCCTAGCCCCCCTGACACCATGTGAT GATGATTTGGGCAGAGCGATGGAGTCCTTAGTATCAGTCATGACAG ATGAAGAAGGAGCAGAATAAATGTTTTACAACTCCTGATTCCCGCAT GCGGCCAGCTTATCGATACCGTCGAAATAAAAGATCCTTATTTTCAT TGGATCTGTGTGTTGGTTTTTTGTGTG ACCGGAACCTGCAGGCCGAGTACGACCGGCTGAAGCAGCAGCACGA GCACAAGGGCCTGAGCCCCCTGCCTAGCCCCCCTGACACCATGTGAT GATGATTTGGGCAGAGCGATGGAGTCCTTAGTATCAGTCATGACAG ATGAAGAAGGAGCAGAATAAATGTTTTACAACTCCTGATTCCCGCAT GCGGCCAGCTTATCGATACCGTCGAAATAAAAGATCCTTATTTTCAT TGGATCTGTG TGTTGGTTTTTTTGTGTG SEQ ID NO: 143 - BXA- 196481 SEQ ID NO: 143 - BXA- 196481 ATGCTGTGGTGGGAGGAAGTGGAAGATTGCTACGAGCGCGAGGACG TGCAGAAGAAAACCTTCACCAAATGGGTGAACGCCCAGTTCAGCAA GTTCGGCAAGCAGCACATCGAGAACCTGTTCAGCGACCTGCAGGAC GGCAGACGGCTGCTGGACCTGCTGGAAGGCCTGACCGGCCAGAAGC TGCCCAAAGAGAAGGGCAGCACCAGAGTGCACGCCCTGAACAACGT GAACAAGGCCCTGCGGGTGCTGCAGAACAACAACGTGGACCTGGTG AACATCGGCAGCACCGACATCGTGGACGGCAACCACAAGCTGACCC TGGGCCTGATCTGGAACATCATCCTGCACTGGCAGGTCAAAAACGTG ATGAAGAACATCATGGCCGGCCTGCAGCAGACCAACAGCGAGAAGA TCCTGCTGAGCTGGGTGCGCCAGAGCACCCGGAACTACCCCCAGGTC AACGTGATCAACTTCACCACCTCTTGGAGCGACGGCCTGGCCCTGAA CGCCCTGATCCACAGCCACCGGCCCGACCTGTTCGACTGGAACAGCG TGGTCTGCCAGCAGAGCGCCACCCAGCGGCTGGAACACGCCTTCAA TATCGCCAGATACCAGCTGGGCATCGAGAAGCTGCTGGATCCCGAG GACGTGGACACCACCTACCCCGACAAGAAATCCATCCTGATGTATAT CACCAGCCTGTTCCAGGTGCTGCCCCAGCAGGTGTCCATCGAGGCCA TCCAGGAAGTGGAAATGCTGCCCAGACCCCCCAAAGTGACCAAAGA GGAACACTTCCAGCTGCACCACCAGATGCACTACAGCCAGCAGATC ACCGTGTCCCTGGCTCAGGGCTACGAGCGGACCAGCAGCCCCAAGC CCCGGTTCAAGAGCTACGCCTACACCCAGGCCGCCTACGTGACCACC AGCGACCCCACCAGAAGCCCATTCCCCAGCCAGCATCTGGAAGCCC CCGAGGACAAGAGCTTCGGCAGCAGCCTGATGGAAAGCGAAGTGAA CCTGGACAGATACCAGACCGCCCTGGAAGAGGTGCTGTCCTGGCTG CTGAGCGCCGAGGATACACTGCAGGCCCAGGGCGAGATCAGCAACG ACGTGGAAGTGGTGAAAGACCAGTTCCACACCCACGAGGGCTACAT GATGGACCTGACCGCCCACCAGGGCAGAGTGGGCAACATCCTGCAG CTGGGCAGCAAGCTGATCGGCACCGGCAAGCTGAGCGAGGACGAAG AGACAGAGGTGCAGGAACAGATGAACCTGCTGAACAGCAGATGGG AGTGCCTGCGGGTGGCCAGCATGGAAAAGCAGAGCAACCTGCACAG CTACGTGCCCAGCACCTACCTGACCGAGATCACCCACGTGTCCCAGG CTCTGCTGGAAGTGGAACAGCTGCTGAACGCCCCCGACCTGTGCGCC AAGGACTTCGAGGATCTGTTCAAGCAGGAAGAGAGCCTGAAGAATA TCAAGGACTCCCTGCAGCAGTCCAGCGGCCGGATCGACATCATCCAC AGCAAGAAAACAGCCGCCCTGCAGTCCGCCACCCCCGTGGAAAGAG TGAAGCTGCAGGAAGCCCTGAGCCAGCTGGACTTCCAGTGGGAGAA AGTGAACAAGATGTACAAGGACCGGCAGGGCAGATTCGACCGCAGC GTGGAAAAGTGGCGGCGGTTCCACTACGACATCAAGATCTTCAACC AGTGGCTGACCGAGGCCGAGCAGTTCCTGAGAAAGACCCAGATCCC CGAGAACTGGGAGCACGCCAAGTACAAGTGGTATCTGAAAGAACTG CAGGATGGCATCGGCCAGCGGCAGACCGTGGTGCGCACACTGAATG CCACCGGCGAGGAAATCATCCAGCAGAGCAGCAAGACCGACGCCAG CATCCTGCAGGAAAAGCTGGGCTCCCTGAACCTGCGGTGGCAGGAA ATGCTGTGGTGGGAGGAAGTGGAAGATTGCTACGAGCGCGAGGACG TGCAGAAGAAAACCTTCACCAAATGGGTGAACGCCCAGTTCAGCAA GTTCGGCAAGCAGCACATCGAGAACCTGTTCAGCGACCTGCAGGAC GGCAGACGGCTGCTGGACCTGCTGGAAGGCCTGACCGGCCAGAAGC TGCCCAAAGAAGGGCAGCACCAGAGTGCACGCCCTGAACAACGT GAACAAGGCCC TGCGGGTGCTGCAGAACAACAACGTGGACCTGGTG AACATCGGCAGCACCGACATCGTGGACGGCAACCACAAGCTGACCC TGGGCCTGATCTGGAACATCATCCTGCACTGGCAGGTCAAAAACGTG ATGAAGAACATCATGGCCGGCCTGCAGCAGACCAACAGCGAGAAGA TCCTGCTGAGCTGGGTGCGCCAGAGCACCCGGAACTACCCCCAGGTC AACGTGATCAACTTCACCACCTCTTAG CGACGGCCTGGCCCTGAA CGCCCTGATCCACAGCCACCGGCCCGACCTGTTCGACTGGAACAGCG TGGTCTGCCAGCAGAGCGCCACCCAGCGGCTGGAACACGCCTTCAA TATCGCCAGATACCAGCTGGGCATCGAGAAGCTGCTGGATCCCGAG GACGTGGACACCACCTACCCCGACAAGAAATCCATCCTGATGTATAT CACCAGCCTGTTCCAGGTGCTGCCCCAGGTGTCCAT CGAGGCCA TCCAGGAAGTGGAAATGCTGCCCAGACCCCCCAAAGTGACCAAAGA GGAACACTTCCAGCTGCACCACCAGATGCACTACAGCCAGCAGATC ACCGTGTCCCTGGCTCAGGGCTACGAGCGGACCAGCAGCCCCAAGC CCCGGTTCAAGAGCTACGCCTACACCCAGGCCGCCTACGTGACCACC AGCGACCCCACCAGAAGCCCATTCCCCAGCCAGCATCTGGAAGCCC CCGAGGA CAAGAGCTTCGGCAGCAGCCTGATGGAAAGCGAAGTGAA CCTGGACAGATACCAGACCGCCCTGGAAGAGGTGCTGTCCTGGCTG CTGAGCGCCGAGGATACACTGCAGGCCCAGGGCGAGATCAGCAACG ACGTGGAAGTGGTGAAAGACCAGTTCCACACCCACGAGGGCTACAT GATGGACCTGACCGCCCACCAGGGCAGAGTGGGCAACATCCTGCAG CTGGGCAGCAAGCTGATCGGCA CCGGCAAGCTGAGCGAGGACGAAG AGACAGAGGTGCAGGAACAGATGAACCTGCTGAACAGCAGATGGG AGTGCCTGCGGGTGGCCAGCATGGAAAAGCAGAGCAACCTGCACAG CTACGTGCCCAGCACCTACCTGACCGAGATCACCCACGTGTCCCAGG CTCTGCTGGAAGTGGAACAGCTGCTGAACGCCCCCGACCTGTGCGCC AAGGACTTCGAGGATCTGTTCAAGCAGGAA GAGAGCCTGAAGAATA TCAAGGACTCCCTGCAGCAGTCCAGCGGCCGGATCGACATCATCCAC AGCAAGAAAACAGCCGCCCTGCAGTCCGCCACCCCCGTGGAAAGAG TGAAGCTGCAGGAAGCCCTGAGCCAGCTGGACTTCCAGTGGGAGAA AGTGAACAAGATGTACAAGGACCGGCAGGGCAGATTCGACCGCAGC GTGGAAAAGTGGCGGCGGTTCCACTACGACATCAAGATCTTC AACC AGTGGCTGACCGAGGCCGAGCAGTTCCTGAGAAAGACCCAGATCCC CGAGAACTGGGAGCACGCCAAGTACAAGTGGTATCTGAAAGAACTG CAGGATGGCATCGGCCAGCGGCAGACCGTGGTGCGCACACTGAATG CCACCGGCGAGGAAATCATCCAGCAGAGCAGCAAGACCGACGCCAG CATCCTGCAGGAAAAGCTGGGCTCCCTGAACCTGCGGTGGCAGGAA

- 73 046419- 73 046419

GTGTGCAAGCAGCTGAGCGACCGGAAGAAGAGGCTGGAAGAACAG CTGGAAGGACTGGAAAAGCTGTACCAGGAACCCAGAGAGCTGCCCC CCGAGGAACGGGCCCAGAACGTGACCCGGCTGCTGCGGAAACAGGC CGAAGAGGTGAACACCGAGTGGGAGAAGCTGAACCTGCACTCCGCC GACTGGCAGCGGAAGATCGACGAGACACTGGAAAGGCTGCAGGAA CTGCAGGAGGCCACCGACGAGCTGGACCTGAAGCTGCGGCAGGCCG AAGTGATCAAGGGCAGCTGGCAGCCCGTGGGCGACCTGCTGATCGA CAGCCTGCAGGACCACCTGGAAAAAGTGAAGGCCCTGAGAGGCGAG ATCGCCCCCCTGAAAGAAAACGTGTCCCACGTGAACGACCTGGCCC GGCAGCTGACCACCCTGGGCATCCAGCTGAGCCCCTACAACCTGAG CACCCTGGAAGATCTGAACACCCGGTGGAAGCTGCTGCAGGTGGCC GTGGAAGATAGAGTGCGGCAGCTGCACGAGGCCCACAGAGACTTTG GCCCTGCCAGCCAGCACTTCCTGAGCACCTCTGTGCAGGGACCCTGG GAGAGAGCCATCAGCCCCAACAAGGTGCCCTACTACATCAACCACG AGACACAGACCACCTGTTGGGACCACCCCAAGATGACCGAGCTGTA CCAGAGCCTGGCCGACCTGAACAATGTGCGGTTCAGCGCCTACCGG ACCGCCATGAAGCTGAGGCGGCTGCAGAAAGCTCTGTGCCTGGATC TGCTGAGCCTGAGCGCCGCCTGCGACGCCCTGGACCAGCACAACCT GAAGCAGAACGACCAGCCCATGGATATCCTGCAGATCATCAACTGC CTGACCACAATCTACGACAGGCTGGAACAGGAACACAACAATCTGG TCAACGTGCCCCTGTGCGTGGACATGTGCCTGAATTGGCTGCTGAAT GTGTACGACACCGGCCGGACCGGCAGAATCCGGGTGCTGAGCTTCA AGACCGGCATCATCAGCCTGTGCAAGGCCCACCTGGAAGATAAGTA CCGCTACCTGTTCAAACAGGTGGCCAGCTCCACCGGCTTTTGCGACC AGCGGAGACTGGGCCTGCTGCTGCACGACAGCATCCAGATCCCCAG ACAGCTGGGCGAGGTGGCCTCCTTCGGCGGCAGCAACATTGAGCCC AGCGTGCGGAGCTGCTTCCAGTTCGCCAACAACAAGCCCGAGATCG AGGCCGCCCTGTTCCTGGACTGGATGAGACTGGAACCCCAGAGCAT GGTGTGGCTGCCCGTGCTGCATCGGGTGGCCGCTGCCGAGACAGCC AAGCACCAGGCCAAGTGCAACATCTGCAAAGAGTGCCCCATCATCG GCTTCCGGTACAGAAGCCTGAAGCACTTCAACTACGATATCTGCCAG AGCTGCTTCTTCAGCGGCAGAGTGGCCAAGGGCCACAAAATGCACT ACCCCATGGTGGAATACTGCACCCCCACCACCAGCGGCGAGGATGT GCGGGACTTCGCCAAGGTGCTGAAAAACAAGTTCCGGACCAAGCGG TACTTTGCCAAGCACCCCCGGATGGGCTACCTGCCCGTGCAGACAGT GCTGGAAGGCGACAACATGGAAACCCCTGCCCAGATCCTGATCAGC CTGGAAAGCGAGGAACGGGGCGAGCTGGAACGGATCCTGGCCGATC TGGAAGAGGAAAACCGGAACCTGCAGGCCGAGTACGACCGGCTGAA GCAGCAGCACGAGCACAAGGGCCTGAGCCCCCTGCCTAGCCCCCCT GACACCATGTGATGATGATTTGGGCAGAGCGATGGAGTCCTTAGTAT CAGTCATGACAGATGAAGAAGGAGCAGAATAAATGTTTTACAACTC CTGATTCCCGCATGCGGCCAGCTTATCGATACCGTCGAAATAAAAGA TCCTTATTTTCATTGGATCTGTGTGTTGGTTTTTTGTGTG GTGTGCAAGCAGCTGAGCGACCGGAAGAAGAGGCTGGAAGAACAG CTGGAAGGACTGGAAAAGCTGTACCAGGAACCCAGAGAGCTGCCCC CCGAGGAACGGGCCCAGAACGTGACCCGGCTGCTGCGGAAACAGGC CGAAGAGGTGAACACCGAGTGGGAGAAGCTGAACCTGCACTCCGCC GACTGGCAGCGGAAGATCGACGAGACACTGGAAAGGCTGCAGGAA CTGCAGGAGGC CACCGACGAGCTGGACCTGAAGCTGCGGCAGGCCG AAGTGATCAAGGGCAGCTGGCAGCCCGTGGGCGACCTGCTGATCGA CAGCCTGCAGGACCACCTGGAAAAAGTGAAGGCCCTGAGAGGCGAG ATCGCCCCCCTGAAAGAAAACGTGTCCCACGTGAACGACCTGGCCC GGCAGCTGACCACCCTGGGCATCCAGCTGAGCCCCTACAACCTGAG CACCCTGGAAGATCTGAACACCCGGTG GAAGCTGCTGCAGGTGGCC GTGGAAGATAGAGTGCGGCAGCTGCACGAGGCCCACAGAGACTTTG GCCCTGCCAGCCAGCACTTCCTGAGCACCTCTGTGCAGGGACCCTGG GAGAGAGCCATCAGCCCCAACAAGGTGCCCTACTACATCAACCACG AGACACAGACCACCTGTTGGGACCACCCCAAGATGACCGAGCTGTA CCAGAGCCTGGCCGACCTGAACAATGTGCGGTTCAGCG CCTACCGG ACCGCCATGAAGCTGAGGCGGCTGCAGAAAGCTCTGTGCCTGGATC TGCTGAGCCTGAGCGCCGCCTGCGACGCCCTGGACCAGCACAACCT GAAGCAGAACGACCAGCCCATGGATATCCTGCAGATCATCAACTGC CTGACCACAATCTACGACAGGCTGGAACAGGAACACAACAATCTGG TCAACGTGCCCCTGTGCGTGGACATGTGCCTGAATTGGCTGCTGAAT GTGTACG ACACCGGCCGGACCGGCAGAATCCGGGTGCTGAGCTTCA AGACCGGCATCATCAGCCTGTGCAAGGCCCACCTGGAAGATAAGTA CCGCTACCTGTTCAAACAGGTGGCCAGCTCCACCGGCTTTTGCGACC AGCGGAGACTGGGCCTGCTGCTGCACGACAGCATCCAGATCCCCAG ACAGCTGGGCGAGGTGGCCTCCTTCGGCGGCAGCAACATTGAGCCC AGCGTGCGGAGCTGCTTCCAG TTCGCCAACAACAAGCCCGAGATCG AGGCCGCCCTGTTCCTGGACTGGATGAGACTGGAACCCCAGAGCAT GGTGTGGCTGCCCGTGCTGCATCGGGTGGCCGCTGCCGAGACAGCC AAGCACCAGGCCAAGTGCAACATCTGCAAAGAGTGCCCCATCATCG GCTTCCGGTACAGAAGCCTGAAGCACTTCAACTACGATATCTGCCAG AGCTGCTTCTTCAGCGGCAGAGTGGCCAAGGGCC ACAAAATGCACT ACCCCATGGTGGAATACTGCACCCCCACCACCAGCGGCGAGGATGT GCGGGACTTCGCCAAGGTGCTGAAAACAAGTTCCGGACCAAGCGG TACTTTGCCAAGCACCCCCGGATGGGCTACCTGCCCGTGCAGACAGT GCTGGAAGGCGACAACATGGAAACCCCTGCCCAGATCCTGATCAGC CTGGAAAGCGAGGAACGGGGCGAGCTGGAACGGATCCTGGCCGATC T GGAAGAGGAAAACCGGAACCTGCAGGCCGAGTACGACCGGCTGAA GCAGCAGCACGAGCACAAGGGCCTGAGCCCCCTGCCTAGCCCCCCT GACACCATGTGATGATGATTTGGGCAGAGCGATGGAGTCCTTAGTAT CAGTCATGACAGATGAAGAAGGAGCAGAATAAATGTTTTACAACTC CTGATTCCCGCATGCGGCCAGCTTATCGATACCGTCGAAATAAAAGA TCCTTATTTT CATTGGATCTGTGTGTTGGTTTTTTGTGTG SEQ ID NO: 144 - SEQ ID NO: 144 - ATGCTGTGGTGGGAGGAAGTGGAAGATTGCTACGAGCGCGAGGACG TGCAGAAGAAAACCTTCACCAAATGGGTGAACGCCCAGTTCAGCAA GTTCGGCAAGCAGCACATCGAGAACCTGTTCAGCGACCTGCAGGAC GGCAGACGGCTGCTGGACCTGCTGGAAGGCCTGACCGGCCAGAAGC TGCCCAAAGAGAAGGGCAGCACCAGAGTGCACGCCCTGAACAACGT ATGCTGTGGTGGGAGGAAGTGGAAGATTGCTACGAGCGCGAGGACG TGCAGAAGAAAACCTTCACCAAATGGGTGAACGCCCAGTTCAGCAA GTTCGGCAAGCAGCACATCGAGAACCTGTTCAGCGACCTGCAGGAC GGCAGACGGCTGCTGGACCTGCTGGAAGGCCTGACCGGCCAGAAGC TGCCCAAAGAGAAGGGCAGCACCAGAGTGCACGCCCTGAACAACGT

- 74 046419- 74 046419

ВХА027741VHA027741

GAACAAGGCCCTGCGGGTGCTGCAGAACAACAACGTGGACCTGGTG AACATCGGCAGCACCGACATCGTGGACGGCAACCACAAGCTGACCC TGGGCCTGATCTGGAACATCATCCTGCACTGGCAGGTCAAAAACGTG ATGAAGAACATCATGGCCGGCCTGCAGCAGACCAACAGCGAGAAGA TCCTGCTGAGCTGGGTGCGCCAGAGCACCCGGAACTACCCCCAGGTC AACGTGATCAACTTCACCACCTCTTGGAGCGACGGCCTGGCCCTGAA CGCCCTGATCCACAGCCACCGGCCCGACCTGTTCGACTGGAACAGCG TGGTCTGCCAGCAGAGCGCCACCCAGCGGCTGGAACACGCCTTCAA TATCGCCAGATACCAGCTGGGCATCGAGAAGCTGCTGGATCCCGAG GACGTGGACACCACCTACCCCGACAAGAAATCCATCCTGATGTATAT CACCAGCCTGTTCCAGGTGCTGCCCCAGCAGGTGTCCATCGAGGCCA TCCAGGAAGTGGAAATGCTGCCCAGACCCCCCAAAGTGACCAAAGA GGAACACTTCCAGCTGCACCACCAGATGCACTACAGCCAGCAGATC ACCGTGTCCCTGGCCCAGGGCTACGAGAGAACCAGCAGCCCCAAGC CCCGGTTCAAGAGCTACGCCTATACCCAGGCCGCCTACGTGACCACC AGCGACCCTACCAGAAGCCCATTCCCCAGCCAGCATCTGGAAGCCC CCGAGGACAAGAGCTTCGGCAGCAGCCTGATGGAAAGCGAAGTGAA CCTGGACAGATACCAGACCGCCCTGGAAGAGGTGCTGAGCTGGCTG CTGAGCGCCGAGGATACACTGCAGGCTCAGGGCGAGATCAGCAACG ACGTGGAAGTCGTGAAGGACCAGTTCCACACCCACGAGGGCTACAT GATGGACCTGACAGCCCACCAGGGCAGAGTGGGCAACATCCTGCAG CTGGGCTCCAAGCTGATCGGCACCGGCAAGCTGAGCGAGGACGAAG AGACAGAGGTGCAGGAACAGATGAACCTGCTGAACAGCAGATGGG AGTGCCTGCGGGTGGCCAGCATGGAAAAGCAGAGCAACCTGCATCT GCTGAAGTGGCAGCGGCTGACCGAGGAACAGTGCCTGTTTAGCGCC TGGCTGTCCGAGAAAGAGGACGCCGTGAACAAGATCCACACCACCG GCTTCAAGGACCAGAACGAGATGCTGAGCAGCCTGCAGAAACTGGC CGTGCTGAAGGCCGACCTGGAAAAGAAAAAGCAGTCCATGGGCAAG CTGTACTCCCTGAAGCAGGACCTGCTGTCCACCCTGAAGAACAAGA GCGTGACCCAGAAAACCGAGGCCTGGCTGGACAACTTCGCCCGGTG CTGGGACAACCTGGTGCAGAAGCTGGAAAAGTCCACCGCCCAGATC TCCCAGGCCGTGACCACAACACAGCCCAGCCTGACCCAGACCACCG TGATGGAAACCGTGACAACAGTGACCACCCGGGAACAGATCCTCGT GAAGCACGCCCAGGAAGAACTGCCCCCTCCACCCCCCCAGAAGAAA CGGCAGATCACAGTGGACATCCACACCGTGCGGGAAGAGACAATGA TGGTCATGACAGAGGACATGCCCCTGGAAATCAGCTACGTGCCCAG CACCTACCTGACCGAGATCACCCATGTGTCCCAGGCCCTGCTGGAAG TGGAACAGCTGCTGAACGCCCCCGACCTGTGCGCCAAGGATTTCGA GGACCTGTTCAAGCAGGAAGAGAGCCTGAAGAATATCAAGGATAGC CTGCAGCAGAGCAGCGGCCGGATCGACATCATCCACAGCAAGAAAA CAGCCGCCCTGCAGAGCGCCACCCCCGTGGAAAGAGTGAAACTGCA GGAAGCCCTGTCCCAGCTGGACTTCCAGTGGGAGAAAGTGAACAAA ATGTACAAGGACCGGCAGGGCAGATTCGACCGCAGCGTGGAAAAGT GGCGGCGGTTCCACTACGACATCAAGATCTTCAACCAGTGGCTGACA GAGGCCGAGCAGTTCCTGAGAAAGACCCAGATCCCCGAGAACTGGG AGCACGCCAAGTACAAGTGGTATCTGAAAGAGCTGCAGGACGGCAT CGGCCAGAGACAGACAGTCGTGCGGACCCTGAATGCCACCGGCGAG GAAATCATCCAGCAGTCCAGCAAGACCGACGCCAGCATTCTGCAGGGAACAAGGCCCTGCGGGTGCTGCAGAACAACAACGTGGACCTGGTG AACATCGGCAGCACCGACATCGTGGACGGCAACCACAAGCTGACCC TGGGCCTGATCTGGAACATCATCCTGCACTGGCAGGTCAAAACGTG ATGAAGAACATCATGGCCGGCCTGCAGCAGACCAACAGCGAGAAGA TCCTGCTGAGCTGGGTGCGCCAGAGCACCCGGAACTACCCCCAGGTC AACGTGATCAACTTC ACCACCTCTTGGAGCGACGGCCTGGCCCTGAA CGCCCTGATCCACAGCCACCGGCCCGACCTGTTCGACTGGAACAGCG TGGTCTGCCAGCAGAGCGCCACCCAGCGGCTGGAACACGCCTTCAA TATCGCCAGATACCAGCTGGGCATCGAGAAGCTGCTGGATCCCGAG GACGTGGACACCACCTACCCCGACAAGAAATCCATCCTGATGTATAT CACCAGCCTGTTCCAGGTGCTGCC CCAGCAGGTGTCCATCGAGGCCA TCCAGGAAGTGGAAATGCTGCCCAGACCCCCCAAAGTGACCAAAGA GGAACACTTCCAGCTGCACCACCAGATGCACTACAGCCAGCAGATC ACCGTGTCCCTGGCCCAGGGCTACGAGAACCAGCAGCCCCAAGC CCCGGTTCAAGAGCTACGCCTATACCCAGGCCGCTACGTGACCACC AGCGACCCTACCAGAAGCCCATTCCCCAGCCAGCATCT AAGCCC CCGAGGACAAGAGCTTCGGCAGCAGCCTGATGGAAAGCGAAGTGAA CCTGGACAGATACCAGACCGCCCTGGAAGAGGTGCTGAGCTGGCTG CTGAGCGCCGAGGATACACTGCAGGCTCAGGGCGAGATCAGCAACG ACGTGGAAGTCGTGAAGGACCAGTTCCACACCCACGAGGGCTACAT GATGGACCTGACAGCCCACCAGGGCAGAGTGGGCAACATCCTGCAG CTGGGCTC CAAGCTGATCGGCACCGGCAAGCTGAGCGAGGACGAAG AGACAGAGGTGCAGGAACAGATGAACCTGCTGAACAGCAGATGGG AGTGCCTGCGGGTGGCCAGCATGGAAAAGCAGAGCAACCTGCATCT GCTGAAGTGGCAGCGGCTGACCGAGGAACAGTGCCTGTTTAGCGCC TGGCTGTCCGAGAAAGAGGACGCCGTGAACAAGATCCACACCACG GCTTCAAGGACCAGAACGAGATG CTGAGCAGCCTGCAGAAACTGGC CGTGCTGAAGGCCGACCTGGAAAAGAAAAAGCAGTCCATGGGCAAG CTGTACTCCCTGAAGCAGGACCTGCTGTCCACCCTGAAGAACAAGA GCGTGACCCAGAAAACCGAGGCCTGGCTGGACAACTTCGCCCGGTG CTGGGACAACCTGGTGCAGAAGCTGGAAAAGTCCACCGCCCAGATC TCCCAGGCCGTGACCACAACACAGCCCAGCCTGACC T GGAACAGCTGCTGAACGCCCCCGACCTGTGCGCCAAGGATTTCGA GGACCTGTTCAAGCAGGAAGAGAGCCTGAAGAATATCAAGGATAGC CTGCAGCAGAGCAGCGGCCGGATCGACATCATCCACAGCAAGAAAA CAGCCGCCCTGCAGAGCGCCACCCCCGTGGAAAGAGTGAAACTGCA GGAAGCCCTGTCCCAGCTGGACTTCCAGTGGGAGAAAGTGAACAAA ATGTACAAGGACCGG CAGGGCAGATTCGACCGCAGCGTGGAAAAGT GGCGGCGGTTCCACTACGACATCAAGATCTTCAACCAGTGGCTGACA GAGGCCGAGCAGTTCCTGAGAAAGACCCAGATCCCCGAGAACTGGG AGCACGCCAAGTACAAGTGGTATCTGAAAGAGCTGCAGGACGGCAT CGGCCAGAGACAGACAGTCGTGCGGACCCTGAATGCCACCGGCGAG GAAATCATCCAGCAGTCCAGCAAGACC GACGCCAGCATTCTGCAGG

- 75 046419- 75 046419

AAAAGCTGGGCAGCCTGAACCTGCGGTGGCAGGAAGTGTGCAAGCA GCTGTCCGACCGGAAGAAGCGGCTGGAAGAACAGCTGGAACGGCTG CAGGAACTGCAGGAGGCCACCGACGAGCTGGACCTGAAACTGAGAC AGGCCGAAGTGATCAAGGGCAGCTGGCAGCCAGTGGGCGACCTGCT GATCGACTCCCTGCAGGACCATCTGGAAAAAGTGAAGGCCCTGAGA GGCGAGATCGCCCCCCTGAAAGAAAACGTGTCCCACGTGAACGACC TGGCCCGGCAGCTGACAACACTGGGCATTCAGCTGAGCCCCTACAA CCTGAGCACACTGGAAGATCTGAACACCCGGTGGAAGCTGCTGCAG GTGGCCGTGGAAGATAGAGTGCGGCAGCTGCACGAGGCCCACAGAG ATTTTGGCCCTGCCTCCCAGCACTTCCTGAGCACCAGTGTGCAGGGC CCTTGGGAGAGAGCCATCTCCCCTAACAAGGTGCCCTACTACATCAA CCACGAGACACAGACCACCTGTTGGGACCACCCCAAGATGACCGAG CTGTACCAGAGCCTGGCTGACCTGAACAACGTGCGGTTCAGCGCCTA CCGGACCGCCATGAAGCTGCGGAGACTGCAGAAAGCTCTGTGCCTG GATCTGCTGTCCCTGTCCGCCGCCTGTGATGCCCTGGACCAGCACAA TCTGAAGCAGAACGACCAGCCCATGGATATCCTGCAGATCATCAACT GCCTGACCACCATCTACGACCGGCTGGAACAGGAACACAACAATCT CGTGAACGTGCCCCTGTGCGTGGACATGTGCCTGAATTGGCTGCTGA ATGTGTACGACACCGGCCGGACAGGCCGGATCAGAGTGCTGTCCTTC AAGACCGGCATCATCAGCCTGTGCAAAGCCCACCTGGAAGATAAGT ACCGGTATCTGTTCAAACAGGTGGCCTCTAGCACCGGCTTTTGCGAC CAGAGAAGGCTGGGCCTGCTGCTGCACGACAGCATCCAGATCCCTA GACAGCTGGGCGAAGTGGCCAGCTTTGGCGGCAGCAACATCGAGCC TAGCGTGCGGAGCTGCTTCCAGTTCGCCAACAACAAGCCCGAGATC GAGGCCGCCCTGTTCCTGGACTGGATGAGACTGGAACCCCAGAGCA TGGTGTGGCTGCCCGTGCTGCATAGAGTGGCCGCTGCCGAGACAGCC AAGCACCAGGCCAAGTGCAACATCTGCAAAGAGTGCCCCATCATCG GCTTCCGGTACAGAAGCCTGAAGCACTTCAACTACGATATCTGCCAG AGCTGTTTCTTCAGCGGCAGGGTGGCCAAGGGCCACAAAATGCACT ACCCCATGGTGGAATACTGCACCCCCACCACAAGCGGCGAGGATGT GCGGGATTTCGCCAAGGTGCTGAAAAACAAGTTCCGGACCAAGCGG TACTTCGCCAAACACCCCCGGATGGGCTACCTGCCTGTGCAGACAGT GCTGGAAGGCGACAACATGGAAACCCCTGCCCAGATCCTGATCAGC CTGGAATCCGAGGAACGGGGCGAGCTGGAACGGATCCTGGCCGATC TGGAAGAGGAAAACCGGAACCTGCAGGCCGAGTACGACCGGCTGAA GCAGCAGCACGAGCACAAGGGCCTGAGCCCCCTGCCTAGCCCCCCT GACACCATGTGATGATGATTTGGGCAGAGCGATGGAGTCCTTAGTAT CAGTCATGACAGATGAAGAAGGAGCAGAATAAATGTTTTACAACTC CTGATTCCCGCATGCGGCCAGCTTATCGATACCGTCGA AAAAGCTGGGCAGCCTGAACCTGCGGTGGCAGGAAGTGTGCAAGCA GCTGTCCGACCGGAAGAAGCGGCTGGAAGAACAGCTGGAACGGCTG CAGGAACTGCAGGAGGCCACCGACGAGCTGGACCTGAAACTGAGAC AGGCCGAAGTGATCAAGGGCAGCTGGCAGCCAGTGGGCGACCTGCT GATCGACTCCCTGCAGGACCATCTGGAAAAAGTGAAGGCCCTGAGA GGCGAGATCGCCC CCCTGAAAGAAAACGTGTCCCACGTGAACGACC TGGCCCGGCAGCTGACAACACTGGGCATTCAGCTGAGCCCCTACAA CCTGAGCACACTGGAAGATCTGAACACCCGGTGGAAGCTGCTGCAG GTGGCCGTGGAAGATAGAGTGCGGCAGCTGCACGAGGCCCACAGAG ATTTTGGCCCTGCCTCCCAGCACTTCCTGAGCACCAGTGTGCAGGGC CCTTGGGAGAGCCATCTCCCCTAAC AAGGTGCCCTACTACATCAA CCACGAGACACAGACCACCTGTTGGGACCACCCCAAGATGACCGAG CTGTACCAGAGCCTGGCTGACCTGAACAACGTGCGGTTCAGCGCCTA CCGGACCGCCATGAAGCTGCGGAGACTGCAGAAAGCTCTGTGCCTG GATCTGCTGTCCCTGTCCGCCGCCTGTGATGCCCTGGACCAGCACAA TCTGAAGCAGAACGACCAGCCCATGGATATCCTGCAGAT CA GAGAAGGCTGGGCCTGCTGCTGCACGACAGCATCCAGATCCCTA GACAGCTGGGCGAAGTGGCCAGCTTTGGCGGCAGCAACATCGAGCC TAGCGTGCGGAGCTGCTTCCAGTTCGCCAACAACAAGCCCGAGATC GAGGCCGCCCTGTTCCTGGACTGGATGAGACTGGAACCCCAGAGCA TGGTGTGGCTGCCCGTGCTGCATAGAGTGGCCGCTGCCGAGACAGCC AAGCACCAGGCCAAG TGCAACATCTGCAAAGAGTGCCCCATCATCG GCTTCCGGTACAGAAGCCTGAAGCACTTCAACTACGATATCTGCCAG AGCTGTTTCTTCAGCGGCAGGGTGGCCAAGGGCCACAAAATGCACT ACCCCATGGTGGAATACTGCACCCCCACCACAAGCGGCGAGGATGT GCGGGATTTCGCCAAGGTGCTGAAAAACAAGTTCCGGACCAAGCGG TACTTCGCCAAACACCCCCGGATGGGCTACCT GCCTGTGCAGACAGT GCTGGAAGGCGACAACATGGAAACCCCTGCCCAGATCCTGATCAGC CTGGAATCCGAGGAACGGGGCGAGCTGGAACGGATCCTGGCCGATC TGGAAGAGGAAAACCGGAACCTGCAGGCCGAGTACGACCGGCTGAA GCAGCAGCACGAGCACAAGGGCCTGAGCCCCCTGCCTAGCCCCCCT GACACCATGTGATGATGATTTGGGCAGAGCGATGGAGTCCTTA GTAT CAGTCATGACAGATGAAGAAGGAGCAGAATAAATGTTTTACAACTC CTGATTCCCGCATGCGGCCAGCTTATCGATACCGTCGA SEQ ID NO: 145 - BXA- 027744 SEQ ID NO: 145 - BXA- 027744 ATGCTGTGGTGGGAGGAAGTGGAAGATTGCTACGAGCGCGAGGACG TGCAGAAGAAAACCTTCACCAAATGGGTGAACGCCCAGTTCAGCAA GTTCGGCAAGCAGCACATCGAGAACCTGTTCAGCGACCTGCAGGAC GGCAGACGGCTGCTGGACCTGCTGGAAGGCCTGACCGGCCAGAAGC TGCCCAAAGAGAAGGGCAGCACCAGAGTGCACGCCCTGAACAACGT GAACAAGGCCCTGCGGGTGCTGCAGAACAACAACGTGGACCTGGTG AACATCGGCAGCACCGACATCGTGGACGGCAACCACAAGCTGACCC TGGGCCTGATCTGGAACATCATCCTGCACTGGCAGGTCAAAAACGTG ATGAAGAACATCATGGCCGGCCTGCAGCAGACCAACAGCGAGAAGA ATGCTGTGGTGGGAGGAAGTGGAAGATTGCTACGAGCGCGAGGACG TGCAGAAGAAAACCTTCACCAAATGGGTGAACGCCCAGTTCAGCAA GTTCGGCAAGCAGCACATCGAGAACCTGTTCAGCGACCTGCAGGAC GGCAGACGGCTGCTGGACCTGCTGGAAGGCCTGACCGGCCAGAAGC TGCCCAAAGAAGGGCAGCACCAGAGTGCACGCCCTGAACAACGT GAACAAGGCCC TGCGGGTGCTGCAGAACAACAACGTGGACCTGGTG AACATCGGCAGCACCGACATCGTGGACGGCAACCACAAGCTGACCC TGGGCCTGATCTGGAACATCATCCTGCACTGGCAGGTCAAAAACGTG ATGAAGAACATCATGGCCGGCCTGCAGCAGACCAACAGCGAGAAGA

- 76 046419- 76 046419

TCCTGCTGAGCTGGGTGCGCCAGAGCACCCGGAACTACCCCCAGGTC AACGTGATCAACTTCACCACCTCTTGGAGCGACGGCCTGGCCCTGAA CGCCCTGATCCACAGCCACCGGCCCGACCTGTTCGACTGGAACAGCG TGGTCTGCCAGCAGAGCGCCACCCAGCGGCTGGAACACGCCTTCAA TATCGCCAGATACCAGCTGGGCATCGAGAAGCTGCTGGATCCCGAG GACGTGGACACCACCTACCCCGACAAGAAATCCATCCTGATGTATAT CACCAGCCTGTTCCAGGTGCTGCCCCAGCAGGTGTCCATCGAGGCCA TCCAGGAAGTGGAAATGCTGCCCAGACCCCCCAAAGTGACCAAAGA GGAACACTTCCAGCTGCACCACCAGATGCACTACAGCCAGCAGATC ACCGTGTCCCTGGCTCAGGGCTACGAGCGGACCAGCAGCCCCAAGC CCCGGTTCAAGAGCTACGCCTACACCCAGGCCGCCTACGTGACCACC AGCGACCCCACCAGAAGCCCATTCCCCAGCCAGCATCTGGAAGCCC CCGAGGACAAGAGCTTCGGCAGCAGCCTGATGGAAAGCGAAGTGAA CCTGGACAGATACCAGACCGCCCTGGAAGAGGTGCTGTCCTGGCTG CTGAGCGCCGAGGATACACTGCAGGCCCAGGGCGAGATCAGCAACG ACGTGGAAGTGGTGAAAGACCAGTTCCACACCCACGAGGGCTACAT GATGGACCTGACCGCCCACCAGGGCAGAGTGGGCAACATCCTGCAG CTGGGCAGCAAGCTGATCGGCACCGGCAAGCTGAGCGAGGACGAAG AGACAGAGGTGCAGGAACAGATGAACCTGCTGAACAGCAGATGGG AGTGCCTGCGGGTGGCCAGCATGGAAAAGCAGAGCAACCTGCACAT CCACACCGTGCGGGAAGAGACAATGATGGTGATGACCGAGGACATG CCCCTGGAAATCAGCTACGTGCCCAGCACCTACCTGACCGAGATCAC CCACGTGTCCCAGGCTCTGCTGGAAGTGGAACAGCTGCTGAACGCCC CCGACCTGTGCGCCAAGGACTTCGAGGATCTGTTCAAGCAGGAAGA GAGCCTGAAGAATATCAAGGACTCCCTGCAGCAGTCCAGCGGCCGG ATCGACATCATCCACAGCAAGAAAACAGCCGCCCTGCAGTCCGCCA CCCCCGTGGAAAGAGTGAAGCTGCAGGAAGCCCTGAGCCAGCTGGA CTTCCAGTGGGAGAAAGTGAACAAGATGTACAAGGACCGGCAGGGC AGATTCGACCGCAGCGTGGAAAAGTGGCGGCGGTTCCACTACGACA TCAAGATCTTCAACCAGTGGCTGACCGAGGCCGAGCAGTTCCTGAG AAAGACCCAGATCCCCGAGAACTGGGAGCACGCCAAGTACAAGTGG TATCTGAAAGAACTGCAGGATGGCATCGGCCAGCGGCAGACCGTGG TGCGCACACTGAATGCCACCGGCGAGGAAATCATCCAGCAGAGCAG CAAGACCGACGCCAGCATCCTGCAGGAAAAGCTGGGCTCCCTGAAC CTGCGGTGGCAGGAAGTGTGCAAGCAGCTGAGCGACCGGAAGAAGA GGCTGGAAGAACAGGCCCCTGGCCTGACCACCATCGGCGCCAGCCC TACCCAGACCGTGACCCTGGTGACACAGCCCGTGGTGACAAAAGAG ACAGCCATCTCCAAGCTGGAAATGCCCAGCTCCCTGATGCTGGAAGT ACCTGCTCTGGCAGATTTCAACCGGGCTTGGACAGAACTTACCGACT GGCTTTCTCTGCTTGATCAAGTTATAAAATCACAGAGGGTGATGGTG GGTGACCTTGAGGATATCAACGAGATGATCATCAAGCAGAAGGCAA CAATGCAGGATTTGGAACAGAGGCGTCCCCAGTTGGAAGAACTCAT TACCGCTGCCCAAAATTTGAAAAACAAGACCAGCAATCAAGAGGCT AGAACAATCATTACGGATCGAATTGAAAGAATTCAGAATCAGTGGG ATGAAGTACAAGAACACCTTCAGAACCGGAGGCAACAGTTGAATGA AATGCTGGAAAGGCTGCAGGAACTGCAGGAGGCCACCGACGAGCTG GACCTGAAGCTGCGGCAGGCCGAAGTGATCAAGGGCAGCTGGCAGC CCGTGGGCGACCTGCTGATCGACAGCCTGCAGGACCACCTGGAAAATCCTGCTGAGCTGGGTGCGCCAGAGCACCCGGAACTACCCCCAGGTC AACGTGATCAACTTCACCACCTCTTGGAGCGACGGCCTGGCCCTGAA CGCCCTGATCCACAGCCACCGGCCCGACCTGTTCGACTGGAACAGCG TGGTCTGCCAGCAGAGCGCCACCCAGCGGCTGGAACACGCCTTCAA TATCGCCAGATACCAGCTGGGCATCGAGAAGCTGCTGGATCCCGAG GACGTGGA CACCACCTACCCCGACAAGAAATCCATCCTGATGTATAT CACCAGCCTGTTCCAGGTGCTGCCCCAGCAGGTGTCCATCGAGGCCA TCCAGGAAGTGGAAATGCTGCCCAGACCCCCCAAAGTGACCAAAGA GGAACACTTCCAGCTGCACCACCAGATGCACTACAGCCAGCAGATC ACCGTGTCCCTGGCTCAGGGCTACGAGCGGACCAGCAGCCCCAAGC CCCGGTTCAAGAGCTACGCCT ACACCCAGGCCGCCTACGTGACCACC AGCGACCCCACCAGAAGCCCATTCCCCAGCCAGCATCTGGAAGCCC CCGAGGACAAGAGCTTCGGCAGCAGCCTGATGGAAAGCGAAGTGAA CCTGGACAGATACCAGACCGCCCTGGAAGAGGTGCTGTCCTGGCTG CTGAGCGCCGAGGATACACTGCAGGCCCAGGGCGAGATCAGCAACG ACGTGGAAGTGGTGAAAGACCAGTTCCACACCCACGA GGGCTACAT GATGGACCTGACCGCCCACCAGGGCAGAGTGGGCAACATCCTGCAG CTGGGCAGCAAGCTGATCGGCACCGGCAAGCTGAGCGAGGACGAAG AGACAGAGGTGCAGGAACAGATGAACCTGCTGAACAGCAGATGGG AGTGCCTGCGGGTGGCCAGCATGGAAAAGCAGAGCAACCTGCACAT CCACACCGTGCGGGAAGACAATGATGGTGATGACCGAGGACATG CCCCT GGAAATCAGCTACGTGCCCAGCACCTACCTGACCGAGATCAC CCACGTGTCCCAGGCTCTGCTGGAAGTGGAACAGCTGCTGAACGCCC CCGACCTGTGCGCCAAGGACTTCGAGGATCTGTTCAAGCAGGAAGA GAGCCTGAAGAATATCAAGGACTCCCTGCAGCAGTCCAGCGGCCGG ATCGACATCATCCACAGCAAGAAAACAGCCGCCCTGCAGTCCGCCA CCCCCGTGGAAAGAGTGA AGCTGCAGGAAGCCCTGAGCCAGCTGGA CTTCCAGTGGGAGAAAGTGAACAAGATGTACAAGGACCGGCAGGGC AGATTCGACCGCAGCGTGGAAAAGTGGCGGCGGTTCCACTACGACA TCAAGATCTTCAACCAGTGGCTGACCGAGGCCGAGCAGTTCCTGAG AAAGACCCAGATCCCCGAGAACTGGGAGCACGCCAAGTACAAGTGG TATCTGAAAGAACTGCAGGATGGCATCGGC CAGCGGCAGACCGTGG TGCGCACACTGAATGCCACCGGCGAGGAAATCATCCAGCAGAGCAG CAAGACCGACGCCAGCATCCTGCAGGAAAAGCTGGGCTCCCTGAAC CTGCGGTGGCAGGAAGTGTGCAAGCAGCTGAGCGACCGGAAGAAGA GGCTGGAAGAACAGGCCCCTGGCCTGACCACCATCGGCGCCAGCCC TACCCAGACCGTGACCCTGGTGACACAGCCCGTGGTGACAAAAG AG ACAGCCATCTCCAAGCTGGAAATGCCCAGCTCCCTGATGCTGGAAGT ACCTGCTCTGGCAGATTTCAACCGGGCTTGGACAGAACTTACCGACT GGCTTTCTCTGCTTGATCAAGTTATAAAATCACAGAGGGTGATGGTG GGTGACCTTGAGGATATCAACGAGATGATCATCAAGCAGAAGGCAA CAATGCAGGATTTGGAACAGAGGCGTCCCCAGTTGGAAGAACTCAT TACCGCTGCCCAAA ATTTGAAAAACAAGACCAGCAATCAAGAGGCT AGAACAATCATTACGGATCGAATTGAAAGAATTCAGAATCAGTGGG ATGAAGTACAAGAACACCTTCAGAACCGGAGGCAACAGTTGAATGA AATGCTGGAAAGGCTGCAGGAACTGCAGGAGGCCACCGACGAGCTG GACCTGAAGCTGCGGCAGGCCGAAGTGATCAAGGGCAGCTGGCAGC CCGTGGGCGACCTGCTGATCGACAGCCTGCA GGACCACCTGGAAAA

- 77 046419- 77 046419

AGTGAAGGCCCTGAGAGGCGAGATCGCCCCCCTGAAAGAAAACGTG TCCCACGTGAACGACCTGGCCCGGCAGCTGACCACCCTGGGCATCCA GCTGAGCCCCTACAACCTGAGCACCCTGGAAGATCTGAACACCCGG TGGAAGCTGCTGCAGGTGGCCGTGGAAGATAGAGTGCGGCAGCTGC ACGAGGCCCACAGAGACTTTGGCCCTGCCAGCCAGCACTTCCTGAGC ACCTCTGTGCAGGGACCCTGGGAGAGAGCCATCAGCCCCAACAAGG TGCCCTACTACATCAACCACGAGACACAGACCACCTGTTGGGACCAC CCCAAGATGACCGAGCTGTACCAGAGCCTGGCCGACCTGAACAATG TGCGGTTCAGCGCCTACCGGACCGCCATGAAGCTGAGGCGGCTGCA GAAAGCTCTGTGCCTGGATCTGCTGAGCCTGAGCGCCGCCTGCGACG CCCTGGACCAGCACAACCTGAAGCAGAACGACCAGCCCATGGATAT CCTGCAGATCATCAACTGCCTGACCACAATCTACGACAGGCTGGAAC AGGAACACAACAATCTGGTCAACGTGCCCCTGTGCGTGGACATGTG CCTGAATTGGCTGCTGAATGTGTACGACACCGGCCGGACCGGCAGA ATCCGGGTGCTGAGCTTCAAGACCGGCATCATCAGCCTGTGCAAGGC CCACCTGGAAGATAAGTACCGCTACCTGTTCAAACAGGTGGCCAGCT CCACCGGCTTTTGCGACCAGCGGAGACTGGGCCTGCTGCTGCACGAC AGCATCCAGATCCCCAGACAGCTGGGCGAGGTGGCCTCCTTCGGCG GCAGCAACATTGAGCCCAGCGTGCGGAGCTGCTTCCAGTTCGCCAAC AACAAGCCCGAGATCGAGGCCGCCCTGTTCCTGGACTGGATGAGAC TGGAACCCCAGAGCATGGTGTGGCTGCCCGTGCTGCATCGGGTGGCC GCTGCCGAGACAGCCAAGCACCAGGCCAAGTGCAACATCTGCAAAG AGTGCCCCATCATCGGCTTCCGGTACAGAAGCCTGAAGCACTTCAAC TACGATATCTGCCAGAGCTGCTTCTTCAGCGGCAGAGTGGCCAAGGG CCACAAAATGCACTACCCCATGGTGGAATACTGCACCCCCACCACCA GCGGCGAGGATGTGCGGGACTTCGCCAAGGTGCTGAAAAACAAGTT CCGGACCAAGCGGTACTTTGCCAAGCACCCCCGGATGGGCTACCTGC CCGTGCAGACAGTGCTGGAAGGCGACAACATGGAAACCCCTGCCCA GATCCTGATCAGCCTGGAAAGCGAGGAACGGGGCGAGCTGGAACGG ATCCTGGCCGATCTGGAAGAGGAAAACCGGAACCTGCAGGCCGAGT ACGACCGGCTGAAGCAGCAGCACGAGCACAAGGGCCTGAGCCCCCT GCCTAGCCCCCCTGACACCATGTGATGATGATTTGGGCAGAGCGATG GAGTCCTTAGTATCAGTCATGACAGATGAAGAAGGAGCAGAATAAA TGTTTTACAACTCCTGATTCCCGCATGCGGCCAGCTTATCGATACCGT CGAAATAAAAGATCCTTATTTTCATTGGATCTGTGTGTTGGTTTTTTG TGTG AGTGAAGGCCCTGAGAGGCGAGATCGCCCCCCTGAAAGAAAACGTG TCCCACGTGAACGACCTGGCCCGGCAGCTGACCACCCTGGGCATCCA GCTGAGCCCCTACAACCTGAGCACCCTGGAAGATCTGAACACCCGG TGGAAGCTGCTGCAGGTGGCCGTGGAAGATAGAGTGCGGCAGCTGC ACGAGGCCCACAGAGACTTTGGCCCTGCCAGCCAGCACTTCCTGAGC ACCTCTGTGCAGG GACCCTGGGAGAGAGCCATCAGCCCCAACAAGG TGCCCTACTACATCAACCACGAGACACAGACCACCTGTTGGGACCAC CCCAAGATGACCGAGCTGTACCAGAGCCTGGCCGACCTGAACAATG TGCGGTTCAGCGCCTACCGGACCGCCATGAAGCTGAGGCGGCTGCA GAAAGCTCTGTGCCTGGATCTGCTGAGCCTGAGCGCCGCCTGCGACG CCCTGGACCAGCACAACCTGAAGCAGAAC GACCAGCCCATGGATAT CCTGCAGATCATCAACTGCCTGACCACAATCTACGACAGGCTGGAAC AGGAACACAACAATCTGGTCAACGTGCCCCTGTGCGTGGACATGTG CCTGAATTGGCTGCTGAATGTGTACGACACCGGCCGGACCGGCAGA ATCCGGGTGCTGAGCTTCAAGACCGGCATCATCAGCCTGTGCAAGGC CCACCTGGAAGATAAGTACCGCTACCTGTTCAAACAGGTGGCCAG CT CCACCGGCTTTTGCGACCAGCGGAGACTGGGCCTGCTGCTGCACGAC AGCATCCAGATCCCCAGACAGCTGGGCGAGGTGGCCTCCTTCGGCG GCAGCAACATTGAGCCCAGCGTGCGGAGCTGCTTCCAGTTCGCCAAC AACAAGCCCGAGATCGAGGCCGCCCTGTTCCTGGACTGGATGAGAC TGGAACCCCAGAGCATGGTGTGGCTGCCCGTGCTGCATCGGGTGGCC GCTG CCGAGACAGCCAAGCACCAGGCCAAGTGCAACATCTGCAAAG AGTGCCCCATCATCGGCTTCCGGTACAGAAGCCTGAAGCACTTCAAC TACGATATCTGCCAGAGCTGCTTCTTCAGCGGCAGAGTGGCCAAGGG CCACAAAATGCACTACCCCATGGTGGAATACTGCACCCCCACCACCA GCGGCGAGGATGTGCGGGACTTCGCCAAGGTGCTGAAAAACAAGTT CCGGACCAAGCGGTACTTT GCCAAGCACCCCCGGATGGGCTACCTGC CCGTGCAGACAGTGCTGGAAGGCGACAACATGGAAACCCCTGCCCA GATCCTGATCAGCCTGGAAAGCGAGGAACGGGGCGAGCTGGAACGG ATCCTGGCCGATCTGGAAGAGGAAAACCGGAACCTGCAGGCCGAGT ACGACCGGCTGAAGCAGCAGCACGAGCACAAGGGCCTGAGCCCCCT GCCTAGCCCCCCTGACACCATGTGATGATGATTTG GGCAGAGCGATG GAGTCCTTAGTATCAGTCATGACAGATGAAGAAGGAGCAGAATAAA TGTTTTACAACTCCTGATTCCCGCATGCGGCCAGCTTATCGATACCGT CGAAATAAAAGATCCTTATTTTCATTGGATCTGTGTGTTGGTTTTTTG TGTG SEQ ID NO: 146 - BXA- 027742 SEQ ID NO: 146 - BXA- 027742 ATGCTGTGGTGGGAGGAAGTGGAAGATTGCTACGAGCGCGAGGACG TGCAGAAGAAAACCTTCACCAAATGGGTCAACGCCCAGTTCAGCAA GTTCGGCAAGCAGCACATCGAGAACCTGTTCAGCGACCTGCAGGAC GGCAGACGGCTGCTGGATCTGCTGGAAGGCCTGACCGGACAGAAGC TGCCCAAAGAGAAGGGCAGCACCAGAGTGCACGCCCTGAACAACGT GAACAAGGCCCTGCGGGTGCTGCAGAACAACAACGTGGACCTCGTG AACATCGGCAGCACCGACATCGTGGACGGCAACCACAAGCTGACCC TGGGCCTGATCTGGAACATCATCCTGCACTGGCAAGTGAAGAACGT GATGAAGAACATCATGGCCGGCCTGCAGCAGACCAACAGCGAGAAG ATCCTGCTGAGCTGGGTGCGCCAGAGCACCAGAAACTACCCCCAAG TGAACGTGATCAACTTCACCACCTCTTGGAGCGACGGCCTGGCCCTG ATGCTGTGGTGGGAGGAAGTGGAAGATTGCTACGAGCGCGAGGACG TGCAGAAGAAAACCTTCACCAAATGGGTCAACGCCCAGTTCAGCAA GTTCGGCAAGCAGCACATCGAGAACCTGTTCAGCGACCTGCAGGAC GGCAGACGGCTGCTGGATCTGCTGGAAGGCCTGACCGGACAGAAGC TGCCCAAAGAAGGGCAGCACCAGAGTGCACGCCCTGAACAACGT GAACAAGGCCC TGCGGGTGCTGCAGAACAACAACGTGGACCTCGTG AACATCGGCAGCACCGACATCGTGGACGGCAACCACAAGCTGACCC TGGGCCTGATCTGGAACATCATCCTGCACTGGCAAGTGAAGAACGT GATGAAGAACATCATGGCCGGCCTGCAGCAGACCAACAGCGAGAAG ATCCTGCTGAGCTGGGTGCGCCAGAGCACCAGAAACTACCCCCCAAG TGAACGTGATCAACTTCACCACCTCTT GGAGCGACGGCCTGGCCCTG

- 78 046419- 78 046419

AATGCCCTGATCCACAGCCACAGACCCGACCTGTTCGACTGGAACA GCGTCGTGTGTCAGCAGAGCGCCACCCAGAGGCTGGAACACGCCTT CAATATCGCCAGATACCAGCTGGGCATCGAGAAGCTGCTGGACCCC GAGGATGTGGACACCACCTACCCCGACAAGAAATCCATCCTGATGT ATATCACCAGCCTGTTCCAGGTGCTGCCTCAGCAGGTGTCCATCGAG GCCATCCAGGAAGTGGAAATGCTGCCCAGACCCCCCAAAGTGACCA AAGAGGAACACTTCCAGCTGCACCACCAGATGCACTACTCTCAGCA GATCACCGTGTCCCTGGCCCAGGGCTACGAGAGAACCAGCAGCCCC AAGCCCCGGTTCAAGAGCTACGCCTATACCCAGGCCGCCTACGTGAC CACCAGCGACCCTACCAGAAGCCCATTCCCCAGCCAGCATCTGGAA GCCCCCGAGGACAAGAGCTTCGGCAGCAGCCTGATGGAAAGCGAAG TGAACCTGGATAGATACCAGACCGCCCTGGAAGAGGTGCTGTCCTG GCTGCTGAGCGCCGAGGATACACTGCAGGCTCAGGGCGAGATCAGC AACGACGTGGAAGTCGTGAAGGACCAGTTCCACACCCACGAGGGCT ACATGATGGACCTGACAGCCCACCAGGGCAGAGTGGGCAACATTCT GCAGCTGGGCTCCAAGCTGATCGGCACCGGCAAGCTGAGCGAGGAC GAAGAGACAGAGGTGCAGGAACAGATGAACCTGCTGAACAGCAGA TGGGAGTGCCTGAGAGTGGCCAGCATGGAAAAGCAGAGCAACCTGC ACCGGGTGCTGATGGATCTGCAGAACCAGAAGCTGAAAGAGCTGAA CGACTGGCTGACCAAGACCGAGGAACGGACCCGGAAGATGGAAGA GGAACCCCTGGGACCAGACCTGGAAGATCTGAAAAGACAGGTGCAG CAGCACAAAGTGCTGCAGGAAGATCTGGAACAGGAACAGGTGCGCG TGAACAGCCTGACCCACATGGTCGTGGTGGTGGACGAGAGCAGCGG CGATCATGCCACAGCCGCTCTGGAAGAACAGCTGAAGGTGCTGGGC GACAGATGGGCCAACATCTGCCGGTGGACCGAGGATAGATGGGTGC TGCTGCAGGACATCCTGCTGAAGTGGCAGCGGCTGACAGAGGAACA GTGCCTGTTCTCCGCCTGGCTGTCCGAGAAAGAGGACGCCGTGAACA AAATCCACACCACCGGCTTCAAGGACCAGAACGAGATGCTGAGCAG CCTGCAGAAACTGGCCGTGCTGAAGGCCGACCTGGAAAAGAAAAAG CAGTCCATGGGCAAGCTGTACTCCCTGAAGCAGGACCTGCTGTCCAC CCTGAAGAACAAGAGCGTGACCCAGAAAACCGAGGCCTGGCTGGAC AACTTCGCCCGGTGCTGGGACAACCTGGTGCAGAAGCTGGAAAAGT CCACCGCCCAGATCTCCCAGGCCATTCACACCGTGCGGGAAGAGAC AATGATGGTCATGACTGAGGACATGCCCCTGGAAATCAGCTACGTG CCCTCCACCTACCTGACCGAGATCACCCATGTGTCCCAGGCCCTGCT GGAAGTGGAACAGCTGCTGAACGCCCCCGATCTGTGCGCCAAGGAC TTCGAGGATCTGTTCAAGCAGGAAGAGAGCCTGAAGAATATCAAGG ACTCTCTGCAGCAGTCCAGCGGCAGAATCGACATCATCCACAGCAA GAAAACAGCCGCCCTGCAGTCCGCCACCCCCGTGGAAAGAGTGAAA CTGCAGGAAGCCCTGTCCCAGCTGGACTTCCAGTGGGAGAAAGTGA ACAAGATGTACAAGGACCGGCAGGGCAGATTCGACCGCAGCGTGGA AAAGTGGCGGCGGTTCCACTACGACATCAAGATCTTCAACCAGTGG CTGACCGAGGCCGAACAGTTCCTGAGAAAGACCCAGATCCCCGAGA ACTGGGAGCACGCCAAGTACAAGTGGTATCTGAAAGAACTGCAGGA TGGCATCGGCCAGAGACAGACCGTCGTGCGGACACTGAATGCCACC GGCGAGGAAATCATCCAGCAGAGCAGCAAGACCGACGCCAGCATCC TGCAGGAAAAGCTGGGCAGCCTGAACCTGAGATGGCAGGAAGTGTG CAAGCAGCTGTCCGACCGGAAGAAGCGGCTGGAAGAACAGCTGGAAAATGCCCTGATCCACAGCCACAGACCCGACCTGTTCGACTGGAACA GCGTCGTGTGTCAGCAGAGCGCCACCCAGAGGCTGGAACACGCCTT CAATATCGCCAGATACCAGCTGGGCATCGAGAAGCTGCTGGACCCC GAGGATGTGGACACCTACCCCGACAAGAAATCCATCCTGATGT ATATCACCAGCCTGTTCCAGGTGCTGCTCAGCAGGTGTCCATCGAG GCCATCCAGGA AGTGGAAATGCTGCCCAGACCCCCCAAAGTGACCA AAGAGGAACACTTCCAGCTGCACCACCAGATGCACTACTCTCAGCA GATCACCGTGTCCCTGGCCCAGGGCTACGAGAGAACCAGCAGCCCC AAGCCCCGGTTCAAGAGCTACGCCTATACCCAGGCCGCCTACGTGAC CACCAGCGACCCTACCAGAAGCCCATTCCCCAGCCAGCATCTGGAA GCCCCCGAGGACAAGAGCTTCGGCA GCAGCCTGATGGAAAGCGAAG TGAACCTGGATAGATACCAGACCGCCCTGGAAGAGGTGCTGTCCTG GCTGCTGAGCGCCGAGGATACACTGCAGGCTCAGGGCGAGATCAGC AACGACGTGGAAGTCGTGAAGGACCAGTTCCACACCCACGAGGGCT ACATGATGGACCTGACAGCCCACCAGGGCAGAGTGGGCAACATTCT GCAGCTGGGCTCCAAGCTGATCGGCACCGGCAAGCT GAGCGAGGAC GAAGAGACAGAGGTGCAGGAACAGATGAACCTGCTGAACAGCAGA TGGGAGTGCCTGAGAGTGGCCAGCATGGAAAAGCAGAGCAACCTGC ACCGGGTGCTGATGGATCTGCAGAACCAGAAGCTGAAAGAGCTGAA CGACTGGCTGACCAAGACCGAGGAACGGACCCGGAAGATGGAAGA GGAACCCCTGGGACCAGACCTGGAAGATCTGAAAAGACAGGTGCAG CAGCAC AAAGTGCTGCAGGAAGATCTGGAACAGGAACAGGTGCGCG TGAACAGCCTGACCCACATGGTCGTGGTGGTGGACGAGAGCAGCGG CGATCATGCCACAGCCGCTCTGGAAGAACAGCTGAAGGTGCTGGGC GACAGATGGGCCAACATCTGCCGGTGGACCGAGGATAGATGGGTGC TGCTGCAGGACATCCTGCTGAAGTGGCAGCGGCTGACAGAGGAACA GTCCTGTTCTCCGC CTGGCTGTCCGAGAAAGAGGACGCCGTGAACA AAATCCACACCACCGGCTTCAAGGACCAGAACGAGATGCTGAGCAG CCTGCAGAAACTGGCCGTGCTGAAGGCCGACCTGGAAAAGAAAAAG CAGTCCATGGGCAAGCTGTACTCCCTGAAGCAGGACCTGCTGTCCAC CCTGAAGAACAAGAGCGTGACCCAGAAAACCGAGGCCTGGCTGGAC AACTTCGCCCGGTGCTGGGACAACCTGG CAGAAGCTGGAAAAGT CCACCGCCCAGATCTCCCAGGCCATTCACACCGTGCGGGAAGAGAC AATGATGGTCATGACTGAGGACATGCCCCTGGAAATCAGCTACGTG CCCTCCACCTACCTGACCGAGATCACCCATGTGTCCCAGGCCCTGCT GGAAGTGGAACAGCTGCTGAACGCCCCCGATCTGTGCGCCAAGGAC TTCGAGGATCTGTTCAAGCAGGAAGAGCCTGAAGAATATC AAGG ACTCTCTGCAGCAGTCCAGCGGCAGAATCGACATCATCCACAGCAA GAAAACAGCCGCCCTGCAGTCCGCCACCCCCGTGGAAAGAGTGAAA CTGCAGGAAGCCCTGTCCCAGCTGGACTTCCAGTGGGAGAAAGTGA ACAAGATGTACAAGGACCGGCAGGGCAGATTCGACCGCAGCGTGGA AAAGTGGCGGCGGTTCCACTACGACATCAAGATCTTCAACCAGTGG CTGACCGA GGCCGAACAGTTCCTGAGAAAGACCCAGATCCCCGAGA ACTGGGAGCACGCCAAGTACAAGTGGTATCTGAAAGAACTGCAGGA TGGCATCGGCCAGAGACAGACCGTCGTGCGGACACTGAATGCCACC GGCGAGGAAATCATCCAGCAGAGCAGCAAGACCGACGCCAGCATCC TGCAGGAAAAGCTGGGCAGCCTGAACCTGAGATGGCAGGAAGTGTG CAAGCAGCTGTCCGACCGGAAGAAGC GGCTGGAAGAACAGCTGGAA

- 79 046419- 79 046419

CGGCTGCAGGAACTGCAGGAGGCCACCGACGAGCTGGACCTGAAAC TGAGACAGGCCGAAGTGATCAAGGGCAGCTGGCAGCCAGTGGGCGA CCTGCTGATCGATTCTCTGCAGGACCACCTGGAAAAAGTGAAGGCCC TGAGAGGCGAGATCGCCCCCCTGAAAGAAAACGTGTCCCACGTGAA CGACCTGGCCCGGCAGCTGACAACACTGGGCATCCAGCTGAGCCCC TACAACCTGAGCACACTGGAAGATCTGAACACCCGGTGGAAGCTGC TGCAGGTGGCCGTGGAAGATAGAGTGCGGCAGCTGCACGAGGCCCA CAGAGATTTTGGCCCTGCCTCCCAGCACTTCCTGAGCACCTCAGTGC AGGGCCCTTGGGAGAGAGCCATCTCCCCTAACAAGGTGCCCTACTAC ATCAACCACGAGACACAGACCACCTGTTGGGACCACCCCAAGATGA CCGAGCTGTACCAGAGCCTGGCCGACCTGAACAATGTGCGGTTCAG CGCCTACCGGACCGCCATGAAGCTGCGGAGACTGCAGAAAGCTCTG TGCCTGGATCTGCTGTCCCTGAGCGCCGCCTGTGATGCCCTGGACCA GCACAATCTGAAGCAGAACGACCAGCCCATGGATATCCTGCAGATC ATTAACTGCCTGACCACCATCTACGACCGGCTGGAACAGGAACACA ACAACCTCGTGAACGTGCCCCTGTGCGTGGACATGTGCCTGAATTGG CTGCTGAATGTGTACGACACCGGCCGGACAGGCCGGATCAGAGTGC TGAGCTTCAAGACCGGCATCATCAGCCTGTGCAAAGCCCATCTGGAA GATAAGTACCGCTACCTGTTCAAACAGGTGGCCAGCTCTACCGGCTT CTGCGATCAGAGAAGGCTGGGCCTGCTGCTGCATGACTCCATCCAGA TCCCCAGACAGCTGGGCGAGGTGGCCTCTTTCGGCGGCAGCAATATC GAGCCTAGCGTGCGGAGCTGCTTCCAGTTCGCCAACAACAAGCCCG AGATCGAGGCCGCCCTGTTTCTGGACTGGATGAGACTGGAACCCCA GAGCATGGTGTGGCTGCCCGTGCTGCATAGAGTGGCCGCTGCCGAG ACAGCCAAGCACCAGGCCAAGTGCAATATCTGCAAAGAGTGCCCCA TCATCGGCTTCCGGTACAGAAGCCTGAAGCACTTCAACTACGATATC TGCCAGAGCTGTTTCTTCAGCGGCAGGGTGGCCAAGGGCCACAAAA TGCACTACCCCATGGTGGAATACTGCACCCCCACCACAAGCGGAGA GGATGTGCGGGACTTCGCCAAGGTGCTGAAAAACAAGTTCCGGACC AAGCGGTATTTCGCCAAACACCCCCGGATGGGCTACCTGCCTGTGCA GACAGTGCTGGAAGGCGACAACATGGAAACCGACACCATGTGATGA TGATTTGGGCAGAGCGATGGAGTCCTTAGTATCAGTCATGACAGATG AAGAAGGAGCAGAATAAATGTTTTACAACTCCTGATTCCCGCATGCG GCCAGCTTATCGATACCGTCGAAATAAAAGATCCTTATTTTCATTGG ATCTGTGTGTTGGTTTTTTGTGTG CGGCTGCAGGAACTGCAGGAGGCCACCGACGAGCTGGACCTGAAAC TGAGACAGGCCGAAGTGATCAAGGGCAGCTGGCAGCCAGTGGGCGA CCTGCTGATCGATTCTCTGCAGGACCACCTGGAAAAAGTGAAGGCCC TGAGAGGCGAGATCGCCCCCCTGAAAGAAAACGTGTCCCACGTGAA CGACCTGGCCCGGCAGCTGACAACACTGGGCATCCAGCTGAGCCCC TACAACCTGA GCACACTGGAAGATCTGAACACCCGGTGGAAGCTGC TGCAGGTGGCCGTGGAAGATAGAGTGCGGCAGCTGCACGAGGCCCA CAGAGATTTTGGCCCTGCCTCCCAGCACTTCCTGAGCACCTCAGTGC AGGGCCCTTGGGAGAGAGCCATCTCCCCTAACAAGGTGCCCTACTAC ATCAACCACGAGACACAGACCACCTGTTGGGACCACCCCAAGATGA CCGAGCTGTACCAGAGCCTGGCCGAC CTGAACAATGTGCGGTTCAG CGCCTACCGGACCGCCATGAAGCTGCGGAGACTGCAGAAAGCTCTG TGCCTGGATCTGCTGTCCCTGAGCGCCGCCTGTGATGCCCTGGACCA GCACAATCTGAAGCAGAACGACCAGCCCATGGATATCCTGCAGATC ATTAACTGCCTGACCACCATCTACGACCGGCTGGAACAGGAACACA ACAACCTCGTGAACGTGCCCCTGTGCGTGGACATGTGCCTGAA TTGG CTGCTGAATGTGTACGACACCGGCCGGACAGGCCGGATCAGAGTGC TGAGCTTCAAGACCGGCATCAGCCTGTGCAAAGCCCATCTGGAA GATAAGTACCGCTACCTGTTCAAACAGGTGGCCAGCTCTACCGGCTT CTGCGATCAGAGAAGGCTGGGCCTGCTGCTGCATGACTCCATCCAGA TCCCCAGACAGCTGGGCGAGGTGGCCTCTTTCGGCGGCAGCAATATC GA GCCTAGCGTGCGGAGCTGCTTCCAGTTTCGCCAACAACAAGCCCG AGATCGAGGCCGCCCTGTTTCTGGACTGGATGAGACTGGAACCCCA GAGCATGGTGTGGCTGCCCGTGCTGCATAGAGTGGCCGCTGCCGAG ACAGCCAAGCACCAGGCCAAGTGCAATATCTGCAAAGAGTGCCCCA TCATCGGCTTCCGGTACAGAAGCCTGAAGCACTTCAACTACGATATC TGCCAGAGCTGTTTC TTCAGCGGCAGGGTGGCCAAGGGCCACAAAA TGCACTACCCCATGGTGGAATACTGCACCCCCACCACAAGCGGAGA GGATGTGCGGGACTTCGCCAAGGTGCTGAAAAACAAGTTCCGGACC AAGCGGTATTTCGCCAAACACCCCCGGATGGGCTACCTGCCTGTGCA GACAGTGCTGGAAGGCGACAACATGGAAACCGACACCATGTGATGA TGATTTGGGCAGAGCGATGGAGTCCTTA GTATCAGTCATGACAGATG AAGAAGGAGCAGAATAAATGTTTTACAACTCCTGATTCCCGCATGCG GCCAGCTTATCGATACCGTCGAAATAAAAGATCCTTATTTTCATTGG ATCTGTGTGTTGGTTTTTTGTGTG SEQ ID NO: 147 - BXA- 027743 SEQ ID NO: 147 - BXA- 027743 ATGCTGTGGTGGGAGGAAGTGGAAGATTGCTACGAGCGCGAGGACG TGCAGAAGAAAACCTTCACCAAATGGGTGAACGCCCAGTTCAGCAA GTTCGGCAAGCAGCACATCGAGAACCTGTTCAGCGACCTGCAGGAC GGCAGACGGCTGCTGGACCTGCTGGAAGGCCTGACCGGCCAGAAGC TGCCCAAAGAGAAGGGCAGCACCAGAGTGCACGCCCTGAACAACGT GAACAAGGC CCTGCGGGTGCTGCAGAACAACAACGTGGACCTGGTGAACATCGGC AGCACCGACATCGTGGACGGCAAC CACAAGCTGACCCTGGGCCTGATCTGGAACATCATCCTGCACTGGCA GGTCAAAAACGTGATGAAGAACA TCATGGCCGGCCTGCAGCAGACCAACAGCGAGAAGATCCTGCTGAG CTGGGTGCGCCAGAGCACCCGGAA ATGCTGTGGTGGGAGGAAGTGGAAGATTGCTACGAGCGCGAGGACG TGCAGAAGAAAACCTTCACCAAATGGGTGAACGCCCAGTTCAGCAA GTTCGGCAAGCAGCACATCGAGAACCTGTTCAGCGACCTGCAGGAC GGCAGACGGCTGCTGGACCTGCTGGAAGGCCTGACCGGCCAGAAGC TGCCCAAAGAAGGGCAGCACCAGAGTGCACGCCCTGAACAACGT GAACAAGGC CCTGCGGGTGCTGCAGAACAACAACGTGGACCTGGTGAACATCGGC AGCACCGACATCGTGGACGGCAAC CACAAGCTGACCCTGGGCCTGATCTGGAACATCATCCTGCACTGGCA GGTCAAAAACGTGATGAAGAACA TCATGGCCGGCCTGCAGCAGACCAACAGCGAGAAGATCCTGCTGAG CTGGGTGCGCCAGAGCACCCGGAA

- 80 046419- 80 046419

CTACCCCCAGGTCAACGTGATCAACTTCACCACCTCTTGGAGCGACG GCCTGGCCCTGAACGCCCTGATC CACAGCCACCGGCCCGACCTGTTCGACTGGAACAGCGTGGTCTGCCA GCAGAGCGCCACCCAGCGGCTGG AACACGCCTTCAATATCGCCAGATACCAGCTGGGCATCGAGAAGCT GCTGGATCCCGAGGACGTGGACAC CACCTACCCCGACAAGAAATCCATCCTGATGTATATCACCAGCCTGT TCCAGGTGCTGCCCCAGCAGGTG TCCATCGAGGCCATCCAGGAAGTGGAAATGCTGCCCAGACCCCCCA AAGTGACCAAAGAGGAACACTTCC AGCTGCACCACCAGATGCACTACAGCCAGCAGATCACCGTGTCCCTG GCTCAGGGCTACGAGCGGACCAG CAGCCCCAAGCCCCGGTTCAAGAGCTACGCCTACACCCAGGCCGCCT ACGTGACCACCAGCGACCCCACC AGAAGCCCATTCCCCAGCCAGCATCTGGAAGCCCCCGAGGACAAGA GCTTCGGCAGCAGCCTGATGGAAA GCGAAGTGAACCTGGACAGATACCAGACCGCCCTGGAAGAGGTGCT GTCCTGGCTGCTGAGCGCCGAGGA TACACTGCAGGCCCAGGGCGAGATCAGCAACGACGTGGAAGTGGTG AAAGACCAGTTCCACACCCACGAG GGCTACATGATGGACCTGACCGCCCACCAGGGCAGAGTGGGCAACA TCCTGCAGCTGGGCAGCAAGCTGA TCGGCACCGGCAAGCTGAGCGAGGACGAAGAGACAGAGGTGCAGG AACAGATGAACCTGCTGAACAGCAG ATGGGAGTGCCTGCGGGTGGCCAGCATGGAAAAGCAGAGCAACCTG CACATCCACACCGTGCGGGAAGAG ACAATGATGGTGATGACCGAGGACATGCCCCTGGAAATCAGCTACG TGCCCAGCACCTACCTGACCGAGA TCACCCACGTGTCCCAGGCTCTGCTGGAAGTGGAACAGCTGCTGAAC GCCCCCGACCTGTGCGCCAAGGA CTTCGAGGATCTGTTCAAGCAGGAAGAGAGCCTGAAGAATATCAAG GACTCCCTGCAGCAGTCCAGCGGC CGGATCGACATCATCCACAGCAAGAAAACAGCCGCCCTGCAGTCCG CCACCCCCGTGGAAAGAGTGAAGC TGCAGGAAGCCCTGAGCCAGCTGGACTTCCAGTGGGAGAAAGTGAA CAAGATGTACAAGGACCGGCAGGG CAGATTCGACCGCAGCGTGGAAAAGTGGCGGCGGTTCCACTACGAC ATCAAGATCTTCAACCAGTGGCTG ACCGAGGCCGAGCAGTTCCTGAGAAAGACCCAGATCCCCGAGAACT GGGAGCACGCCAAGTACAAGTGGT ATCTGAAAGAACTGCAGGATGGCATCGGCCAGCGGCAGACCGTGGT GCGCACACTGAATGCCACCGGCGA GGAAATCATCCAGCAGAGCAGCAAGACCGACGCCAGCATCCTGCAG GAAAAGCTGGGCTCCCTGAACCTG CGGTGGCAGGAAGTGTGCAAGCAGCTGAGCGACCGGAAGAAGAGG CTGGAAGAACAGGCCCCTGGCCTGA CCACCATCGGCGCCAGCCCTACCCAGACCGTGACCCTGGTGACACA GCCCGTGGTGACAAAAGAGACAGC CTACCCCCAGGTCAACGTGATCAACTTCACCACCTCTTGGAGCGACG GCCTGGCCCTGAACGCCCTGATC CACAGCCACCGGCCCGACCTGTTCGACTGGAACAGCGTGGTCTGCCA GCAGAGCGCCACCCAGCGGCTGG AACACGCCTTCAATATCGCCAGATACCAGCTGGGCATCGAGAAGCT GCTGGATCCCGAGGACGTGGACAC CACCTACCCCGACAAGAAATCCATCCTGATGTATATCACCAGCCTGT TCCAGGTGCTGCCCCAGCAGGTG TCCATCGAGGCCATCCAGGAAGTGGAAATGCTGCCCAGACCCCCCA AAGTGACCAAAGAGGAACACTTCC AGCTGCACCACCAGATGCACTACAGCCAGCAGATCACGTGTCCCTG GCTCAGGGCTACGAGCGGACCAG CAGCCCCAAGCCCCGGTTCAAGAGCTACGCCTACACCCAGGCCGCCT ACGTGACCACCAGCGACCCCACC AGAAGCCCATTCCCCAGCCAGCATCTGGAAGCCCCCGAGGACAAGA GCTTCGGCAGCAGCCTGATGGAAA GCGAAGTGAACCTGGACAGATACCAGACCGCCCTGGAAGAGGTGCT GTCCTGGCTGCTGAGCGCCGAGGA TACACTGCAGGCCCAGGGCGAGATCAGCAACGACGTGGAAGTGGTG AAAGACCAGTTCCACACCCACGAG GGCTACATGATGGACCTGACCGCCCACCAGGGCAGAGTGGGCAACA TCCTGCAGCTGGGCAGCAAGCTGA TCGGCACCGGCAAGCTGAGCGAGGACGAAGAGACAGAGGTGCAGG AACAGATGAACCTGCTGAACAGCAG ATGGGAGTGCCTGCGGGTGGCCAGCATGGAAAAGCAGAGCAACCTG CACATCCACACCGTGCGGGAAGAG ACAATGATGGTGATGACCGAGGACATGCCCCTGGAAATCAGCTACG TGCCCAGCACCTACCTGACCGAGA TCACCCACGTGTCCCAGGCTCTGCTGGAAGTGGAACAGCTGCTGAAC GCCCCCGACCTGTGCGCCAAGGA CTTCGAGGATCTGTTCAAGCAGGAAGAGAGCCTGAAGAATATCAAG GACTCCCTGCAGCAGTCCAGCGGC CGGATCGACATCATCCACAGCAAGAAAACAGCCGCCCTGCAGTCCG CCACCCCCGTGGAAAGAGTGAAGC TGCAGGAAGCCCTGAGCCAGCTGGACTTCCAGTGGGAGAAAGTGAA CAAGATGTACAAGGACCGGCAGGG CAGATTCGACCGCAGCGTGGAAAAGTGGCGGCGGTTCCACTACGAC ATCAAGATCTTCAACCAGTGGCTG ACCGAGGCCGAGCAGTTCCTGAGAAAGACCCAGATCCCCGAGAACT GGGAGCACGCCAAGTACAAGTGGT ATCTGAAAGAACTGCAGGATGGCATCGGCCAGCGGCAGACCGTGGT GCGCACACTGAATGCCACCGGCGA GGAAATCATCCAGCAGAGCAGCAAGACCGACGCCAGCATCCTGCAG GAAAAGCTGGGCTCCCTGAACCTG CGGTGGCAGGAAGTGTGCAAGCAGCTGAGCGACCGGAAGAAGAGG CTGGAAGAACAGGCCCCTGGCCTGA CCACCATCGGCGCCAGCCCTACCCAGACCGTGACCCTGGTGACACA GCCCGTGGTGACAAAAGAGACAGC

- 81 046419- 81 046419

CATCTCCAAGCTGGAAATGCCCAGCTCCCTGATGCTGGAATCTGACC AGTGGAAGCGTCTGCACCTTTCT CTGCAGGAACTTCTGGTGTGGCTACAGCTGAAAGATGATGAATTAA GCCGGCAGGCACCTATTGGAGGCG ACTTTCCAGCAGTTCAGAAGCAGAACGATGTACATAGGGCCTTCAA GAGGGAATTGAAAACTAAAGAACC TGTAATCATGAGTACTCTTGAGACTGTACGAATATTTCTGACAGAGC AGCCTTTGGAAGGACTAGAGAAA CTCTACCAGGAGCCCAGAGAGCTGCCTCCTGAGGAGAGAGCCCAGA ATGTCACTCGGCTTCTACGAAAGC AGGCTGAGGAGGTCAATACTGAGTGGGAAAAATTGAACCTGCACTC CGCTGACTGGCAGAGAAAAATAGA TGAGACCCTGGAAAGGCTGCAGGAACTGCAGGAGGCCACCGACGAG CTGGACCTGAAGCTGCGGCAGGCC GAAGTGATCAAGGGCAGCTGGCAGCCCGTGGGCGACCTGCTGATCG ACAGCCTGCAGGACCACCTGGAAA AAGTGAAGGCCCTGAGAGGCGAGATCGCCCCCCTGAAAGAAAACGT GTCCCACGTGAACGACCTGGCCCG GCAGCTGACCACCCTGGGCATCCAGCTGAGCCCCTACAACCTGAGC ACCCTGGAAGATCTGAACACCCGG TGGAAGCTGCTGCAGGTGGCCGTGGAAGATAGAGTGCGGCAGCTGC ACGAGGCCCACAGAGACTTTGGCC CTGCCAGCCAGCACTTCCTGAGCACCTCTGTGCAGGGACCCTGGGAG AGAGCCATCAGCCCCAACAAGGT GCCCTACTACATCAACCACGAGACACAGACCACCTGTTGGGACCAC CCCAAGATGACCGAGCTGTACCAG AGCCTGGCCGACCTGAACAATGTGCGGTTCAGCGCCTACCGGACCG CCATGAAGCTGAGGCGGCTGCAGA AAGCTCTGTGCCTGGATCTGCTGAGCCTGAGCGCCGCCTGCGACGCC CTGGACCAGCACAACCTGAAGCA GAACGACCAGCCCATGGATATCCTGCAGATCATCAACTGCCTGACCA CAATCTACGACAGGCTGGAACAG GAACACAACAATCTGGTCAACGTGCCCCTGTGCGTGGACATGTGCCT GAATTGGCTGCTGAATGTGTACG ACACCGGCCGGACCGGCAGAATCCGGGTGCTGAGCTTCAAGACCGG CATCATCAGCCTGTGCAAGGCCCA CCTGGAAGATAAGTACCGCTACCTGTTCAAACAGGTGGCCAGCTCCA CCGGCTTTTGCGACCAGCGGAGA CTGGGCCTGCTGCTGCACGACAGCATCCAGATCCCCAGACAGCTGG GCGAGGTGGCCTCCTTCGGCGGCA GCAACATTGAGCCCAGCGTGCGGAGCTGCTTCCAGTTCGCCAACAAC AAGCCCGAGATCGAGGCCGCCCT GTTCCTGGACTGGATGAGACTGGAACCCCAGAGCATGGTGTGGCTG CCCGTGCTGCATCGGGTGGCCGCT GCCGAGACAGCCAAGCACCAGGCCAAGTGCAACATCTGCAAAGAGT GCCCCATCATCGGCTTCCGGTACA GAAGCCTGAAGCACTTCAACTACGATATCTGCCAGAGCTGCTTCTTC AGCGGCAGAGTGGCCAAGGGCCA CATCTCCAAGCTGGAAATGCCCAGCTCCCTGATGCTGGAATCTGACC AGTGGAAGCGTCTGCACCTTTCT CTGCAGGAACTTCTGGTGTGGCTACAGCTGAAAGATGATGAATTAA GCCGGCAGGCACCTATTGGAGGCG ACTTTCCAGCAGTTCAGAAGCAGAACGATGTACATAGGGCCTTCAA GAGGGAATTGAAAACTAAAGAACC TGTAATCATGAGTACTCTTGAGACTGTACGAATATTTCTGACAGAGC AGCCTTTGGAAGGACTAGAGAAA CTCTACCAGGAGCCCAGAGAGCTGCCTCCTGAGGAGAGAGCCCAGA ATGTCACTCGGCTTCTACGAAAGC AGGCTGAGGAGGTCAATACTGAGTGGGAAAAATTGAACCTGCACTC CGCTGACTGGCAGAGAAAAATAGA TGAGACCCTGGAAAGGCTGCAGGAACTGCAGGAGGCCACCGACGAG CTGGACCTGAAGCTGCGGCAGGCC GAAGTGATCAAGGGCAGCTGGCAGCCCGTGGGCGACCTGCTGATCG ACAGCCTGCAGGACCACCTGGAAA AAGTGAAGGCCCTGAGAGGCGAGATCGCCCCCCTGAAAGAAAACGT GTCCCACGTGAACGACCTGGCCCG GCAGCTGACCACCCTGGGCATCCAGCTGAGCCCCTACAACCTGAGC ACCCTGGAAGATCTGAACACCCGG TGGAAGCTGCTGCAGGTGGCCGTGGAAGATAGAGTGCGGCAGCTGC ACGAGGCCCACAGAGACTTTGGCC CTGCCAGCCAGCACTTCCTGAGCACCTCTGTGCAGGGACCCTGGGAG AGAGCCATCAGCCCCAACAAGGT GCCCTACTACATCAACCACGAGACACAGACCACCTGTTGGGACCAC CCCAAGATGACCGAGCTGTACCAG AGCCTGGCCGACCTGAACAATGTGCGGTTCAGCGCCTACCGGACCG CCATGAAGCTGAGGCGGCTGCAGA AAGCTCTGTGCCTGGATCTGCTGAGCCTGAGCGCCGCCTGCGACGCC CTGGACCAGCACAACCTGAAGCA GAACGACCAGCCCATGGATATCCTGCAGATCATCAACTGCCTGACCA CAATCTACGACAGGCTGGAACAG GAACACACAATCTGGTCAACGTGCCCCTGTGCGTGGACATGTGCCT GAATTGGCTGCTGAATGTGTACG ACACCGGCCGGACCGGCAGAATCCGGGTGCTGAGCTTCAAGACCGG CATCATCAGCCTGTGCAAGGCCCA CCTGGAAGATAAGTACCGCTACCTGTTCAAACAGGTGGCCAGCTCCA CCGGCTTTTGCGACCAGCGGAGA CTGGGCCTGCTGCTGCACGACAGCATCCAGATCCCCAGACAGCTGG GCGAGGTGGCCTCCTTCGGCGGCA GCAACATTGAGCCCAGCGTGCGGAGCTGCTTCCAGTTCGCCAACAAC AAGCCCGAGATCGAGGCCGCCCT GTTCCTGGACTGGATGAGACTGGAACCCCAGAGCATGGTGTGGCTG CCCGTGCTGCATCGGGTGGCCGCT GCCGAGACAGCCAAGCACCAGGCCAAGTGCAACATCTGCAAAGAGT GCCCCATCATCGGCTTCCGGTACA GAAGCCTGAAGCACTTCAACTACGATATCTGCCAGAGCTGCTTCTTC AGCGGCAGAGTGGCCAAGGGCCA

- 82 046419- 82 046419

CAAAATGCACTACCCCATGGTGGAATACTGCACCCCCACCACCAGC GGCGAGGATGTGCGGGACTTCGCC AAGGTGCTGAAAAACAAGTTCCGGACCAAGCGGTACTTTGCCAAGC ACCCCCGGATGGGCTACCTGCCCG TGCAGACAGTGCTGGAAGGCGACAACATGGAAACCCCTGCCCAGAT CCTGATCAGCCTGGAAAGCGAGGA ACGGGGCGAGCTGGAACGGATCCTGGCCGATCTGGAAGAGGAAAAC CGGAACCTGCAGGCCGAGTACGAC CGGCTGAAGCAGCAGCACGAGCACAAGGGCCTGAGCCCCCTGCCTA GCCCCCCTGACACCATGTGATGAT GATTTGGGCAGAGCGATGGAGTCCTTAGTATCAGTCATGACAGATG AAGAAGGAGCAGAATAAATGTTTT ACAACTCCTGATTCCCGCATGCGGCCAGCTTATCGATACCGTCGAAA TAAAAGATCCTTATTTTCATTGG ATCTGTGTGTTGGTTTTTTGTGTG CAAAATGCACTACCCCATGGTGGAATACTGCACCCCCACCACCAGC GGCGAGGATGTGCGGGACTTCGCC AAGGTGCTGAAAAACAAGTTCCGGACCAAGCGGTACTTTGCCAAGC ACCCCCGGATGGGCTACCTGCCCG TGCAGACAGTGCTGGAAGGCGACAACATGGAAACCCCTGCCCAGAT CCTGATCAGCCTGGAAAGCGAGGA ACGGGGCGAGCTGGAACGGATCCTGGCCGATCTGGAAGAGGAAAAC CGGAACCTGCAGGCCGAGTACGAC CGGCTGAAGCAGCAGCACGAGCACAAGGGCCTGAGCCCCCTGCCTA GCCCCCCTGACACCATGTGATGAT GATTTGGGCAGAGCGATGGAGTCCTTAGTATCAGTCATGACAGATG AAGAAGGAGCAGAATAAATGTTTT ACAACTCCTGATTCCCGCATGCGGCCAGCTTATCGATACCGTCGAAA TAAAAGATCCTTATTTTCATTGG ATCTGTGTGTTGGTTTTTTTGTGTG SEQ ID NO: 148 - BXA- 212371 SEQ ID NO: 148 - BXA- 212371 ATGCTGTGGTGGGAGGAAGTGGAAGATTGCTACGAGCGCGAGGACG TGCAGAAGAAAACCTTCACCAAATGGGTGAACGCCCAGTTCAGCAA GTTCGGCAAGCAGCACATCGAGAACCTGTTCAGCGACCTGCAGGAC GGCAGACGGCTGCTGGACCTGCTGGAAGGCCTGACCGGCCAGAAGC TGCCCAAAGAGAAGGGCAGCACCAGAGTGCACGCCCTGAACAACGT GAACAAGGCCCTGCGGGTGCTGCAGAACAACAACGTGGACCTGGTG AACATCGGCAGCACCGACATCGTGGACGGCAACCACAAGCTGACCC TGGGCCTGATCTGGAACATCATCCTGCACTGGCAGGTCAAAAACGTG ATGAAGAACATCATGGCCGGCCTGCAGCAGACCAACAGCGAGAAGA TCCTGCTGAGCTGGGTGCGCCAGAGCACCCGGAACTACCCCCAGGTC AACGTGATCAACTTCACCACCTCTTGGAGCGACGGCCTGGCCCTGAA CGCCCTGATCCACAGCCACCGGCCCGACCTGTTCGACTGGAACAGCG TGGTCTGCCAGCAGAGCGCCACCCAGCGGCTGGAACACGCCTTCAA TATCGCCAGATACCAGCTGGGCATCGAGAAGCTGCTGGATCCCGAG GACGTGGACACCACCTACCCCGACAAGAAATCCATCCTGATGTATAT CACCAGCCTGTTCCAGGTGCTGCCCCAGCAGGTGTCCATCGAGGCCA TCCAGGAAGTGGAAATGCTGCCCAGACCCCCCAAAGTGACCAAAGA GGAACACTTCCAGCTGCACCACCAGATGCACTACAGCCAGCAGATC ACCGTGTCCCTGGCTCAGGGCTACGAGCGGACCAGCAGCCCCAAGC CCCGGTTCAAGAGCTACGCCTACACCCAGGCCGCCTACGTGACCACC AGCGACCCCACCAGAAGCCCATTCCCCAGCCAGCATCTGGAAGCCC CCGAGGACAAGAGCTTCGGCAGCAGCCTGATGGAAAGCGAAGTGAA CCTGGACAGATACCAGACCGCCCTGGAAGAGGTGCTGTCCTGGCTG CTGAGCGCCGAGGATACACTGCAGGCCCAGGGCGAGATCAGCAACG ACGTGGAAGTGGTGAAAGACCAGTTCCACACCCACGAGGGCTACAT GATGGACCTGACCGCCCACCAGGGCAGAGTGGGCAACATCCTGCAG CTGGGCAGCAAGCTGATCGGCACCGGCAAGCTGAGCGAGGACGAAG AGACAGAGGTGCAGGAACAGATGAACCTGCTGAACAGCAGATGGG AGTGCCTGCGGGTGGCCAGCATGGAAAAGCAGAGCAACCTGCACAT CCACACCGTGCGGGAAGAGACAATGATGGTGATGACCGAGGACATG CCCCTGGAAATCAGCTACGTGCCCAGCACCTACCTGACCGAGATCAC CCACGTGTCCCAGGCTCTGCTGGAAGTGGAACAGCTGCTGAACGCCC ATGCTGTGGTGGGAGGAAGTGGAAGATTGCTACGAGCGCGAGGACG TGCAGAAGAAAACCTTCACCAAATGGGTGAACGCCCAGTTCAGCAA GTTCGGCAAGCAGCACATCGAGAACCTGTTCAGCGACCTGCAGGAC GGCAGACGGCTGCTGGACCTGCTGGAAGGCCTGACCGGCCAGAAGC TGCCCAAAGAAGGGCAGCACCAGAGTGCACGCCCTGAACAACGT GAACAAGGCCC TGCGGGTGCTGCAGAACAACAACGTGGACCTGGTG AACATCGGCAGCACCGACATCGTGGACGGCAACCACAAGCTGACCC TGGGCCTGATCTGGAACATCATCCTGCACTGGCAGGTCAAAAACGTG ATGAAGAACATCATGGCCGGCCTGCAGCAGACCAACAGCGAGAAGA TCCTGCTGAGCTGGGTGCGCCAGAGCACCCGGAACTACCCCCAGGTC AACGTGATCAACTTCACCACCTCTTAG CGACGGCCTGGCCCTGAA CGCCCTGATCCACAGCCACCGGCCCGACCTGTTCGACTGGAACAGCG TGGTCTGCCAGCAGAGCGCCACCCAGCGGCTGGAACACGCCTTCAA TATCGCCAGATACCAGCTGGGCATCGAGAAGCTGCTGGATCCCGAG GACGTGGACACCACCTACCCCGACAAGAAATCCATCCTGATGTATAT CACCAGCCTGTTCCAGGTGCTGCCCCAGGTGTCCAT CGAGGCCA TCCAGGAAGTGGAAATGCTGCCCAGACCCCCCAAAGTGACCAAAGA GGAACACTTCCAGCTGCACCACCAGATGCACTACAGCCAGCAGATC ACCGTGTCCCTGGCTCAGGGCTACGAGCGGACCAGCAGCCCCAAGC CCCGGTTCAAGAGCTACGCCTACACCCAGGCCGCCTACGTGACCACC AGCGACCCCACCAGAAGCCCATTCCCCAGCCAGCATCTGGAAGCCC CCGAGGA CAAGAGCTTCGGCAGCAGCCTGATGGAAAGCGAAGTGAA CCTGGACAGATACCAGACCGCCCTGGAAGAGGTGCTGTCCTGGCTG CTGAGCGCCGAGGATACACTGCAGGCCCAGGGCGAGATCAGCAACG ACGTGGAAGTGGTGAAAGACCAGTTCCACACCCACGAGGGCTACAT GATGGACCTGACCGCCCACCAGGGCAGAGTGGGCAACATCCTGCAG CTGGGCAGCAAGCTGATCGGCA CCGGCAAGCTGAGCGAGGACGAAG AGACAGAGGTGCAGGAACAGATGAACCTGCTGAACAGCAGATGGG AGTGCCTGCGGGTGGCCAGCATGGAAAAGCAGAGCAACCTGCACAT CCACACCGTGCGGGAAGAGACAATGATGGTGATGACCGAGGACATG CCCCTGGAAATCAGCTACGTGCCCAGCACCTACCTGACCGAGATCAC CCACGTGTCCCAGGCTCTGCTGGAAGTGGAACAGCT GCTGAACGCCC

- 83 046419- 83 046419

CCGACCTGTGCGCCAAGGACTTCGAGGATCTGTTCAAGCAGGAAGA GAGCCTGAAGAATATCAAGGACTCCCTGCAGCAGTCCAGCGGCCGG ATCGACATCATCCACAGCAAGAAAACAGCCGCCCTGCAGTCCGCCA CCCCCGTGGAAAGAGTGAAGCTGCAGGAAGCCCTGAGCCAGCTGGA CTTCCAGTGGGAGAAAGTGAACAAGATGTACAAGGACCGGCAGGGC AGATTCGACCGCAGCGTGGAAAAGTGGCGGCGGTTCCACTACGACA TCAAGATCTTCAACCAGTGGCTGACCGAGGCCGAGCAGTTCCTGAG AAAGACCCAGATCCCCGAGAACTGGGAGCACGCCAAGTACAAGTGG TATCTGAAAGAGCTGCAGGACGGCATCGGCCAGCGGCAGACAGTGG TCCGCACCCTGAATGCCACCGGCGAGGAAATCATCCAGCAGAGCAG CAAGACCGACGCCAGCATCCTGCAGGAAAAGCTGGGCAGCCTGAAC CTGCGGTGGCAGGAAGTGTGCAAGCAGCTGAGCGACCGGAAGAAGC GGCTGGAAGAACAGGCCCCTGGCCTGACCACAATCGGCGCCAGCCC TACCCAGACCGTGACCCTGGTGACACAGCCCGTGGTGACAAAAGAG ACAGCCATCAGCAAGCTGGAAATGCCCAGCAGCCTGATGCTGGAAA GCGACCAGTGGAAGCGGCTGCACCTGAGCCTGCAGGAACTGCTGGT CTGGCTGCAGCTGAAGGACGACGAGCTGAGCAGACAGGCCCCCATC GGCGGCGATTTCCCCGCCGTGCAGAAACAGAACGACGTGCACCGGG CCTTCAAGCGCGAGCTGAAAACAAAAGAACCCGTGATCATGAGCAC CCTGGAAACCGTGCGGATCTTCCTGACCGAGCAGCCCCTGGAAGGC CTGGAAAAGCTGTACCAGGAACCCAGAGAGCTGCCCCCCGAGGAAC GGGCCCAGAACGTGACCAGACTGCTGCGGAAGCAGGCCGAAGAGGT CAACACCGAGTGGGAGAAGCTGAACCTGCACAGCGCCGACTGGCAG CGGAAGATCGACGAGACACTGGAACGGCTGCAGGAACTGCAGGAG GCCACCGACGAGCTGGACCTGAAGCTGAGACAGGCCGAAGTGATCA AGGGCAGCTGGCAGCCCGTGGGCGACCTGCTGATCGACTCCCTGCA GGACCACCTGGAAAAAGTGAAGGCCCTGCGGGGCGAGATCGCCCCC CTGAAAGAAAACGTGTCCCACGTGAACGACCTGGCCCGGCAGCTGA CCACCCTGGGCATCCAGCTGAGCCCCTACAACCTGTCCACCCTGGAA GATCTGAACACCCGGTGGAAGCTGCTGCAGGTGGCCGTGGAAGATA GAGTGCGGCAGCTGCACGAGGCCCACAGAGACTTTGGCCCTGCCAG CCAGCACTTCCTGAGCACCTCTGTGCAGGGACCCTGGGAGAGAGCC ATCAGCCCCAACAAGGTGCCCTACTACATCAACCACGAGACACAGA CCACCTGTTGGGACCACCCCAAGATGACCGAGCTGTACCAGAGCCT GGCCGACCTGAACAATGTGCGGTTCAGCGCCTACCGGACCGCCATG AAGCTGAGGCGGCTGCAGAAAGCTCTGTGCCTGGATCTGCTGAGCCT GAGCGCCGCCTGCGACGCCCTGGACCAGCACAACCTGAAGCAGAAC GACCAGCCCATGGATATCCTGCAGATCATCAACTGCCTGACCACAAT CTACGACAGGCTGGAACAGGAACACAACAATCTGGTCAACGTGCCC CTGTGCGTGGACATGTGCCTGAATTGGCTGCTGAATGTGTACGACAC CGGCCGGACCGGCAGAATCCGGGTGCTGAGCTTCAAGACCGGCATC ATCAGCCTGTGCAAGGCCCACCTGGAAGATAAGTACCGCTACCTGTT CAAACAGGTGGCCAGCTCCACCGGCTTTTGCGACCAGCGGAGACTG GGCCTGCTGCTGCACGACAGCATCCAGATCCCCAGACAGCTGGGCG AGGTGGCCTCCTTCGGCGGCAGCAACATTGAGCCCAGCGTGCGGAG CTGCTTCCAGTTCGCCAACAACAAGCCCGAGATCGAGGCCGCCCTGT TCCTGGACTGGATGAGACTGGAACCCCAGAGCATGGTGTGGCTGCC CGTGCTGCATCGGGTGGCCGCTGCCGAGACAGCCAAGCACCAGGCCCCGACCTGTGCGCCAAGGACTTCGAGGATCTGTTCAAGCAGGAAGA GAGCCTGAAGAATATCAAGGACTCCCTGCAGCAGTCCAGCGGCCGG ATCGACATCATCCACAGCAAGAAAACAGCCGCCCTGCAGTCCGCCA CCCCCGTGGAAAGAGTGAAGCTGCAGGAAGCCCTGAGCCAGCTGGA CTTCCAGTGGGAGAAAGTGAACAAGATGTACAAGGACCGGCAGGGC AGATTCGACCGC AGCGTGGAAAAGTGGCGGCGGTTCCACTACGACA TCAAGATCTTCAACCAGTGGCTGACCGAGGCCGAGCAGTTCCTGAG AAAGACCCAGATCCCCGAGAACTGGGAGCACGCCAAGTACAAGTGG TATCTGAAAGAGCTGCAGGACGGCATCGGCCAGCGGCAGACAGTGG TCCGCACCCTGAATGCCACCGGCGAGGAAATCATCCAGCAGAGCAG CAAGACCGACGCCAGCATCCTGCAGG AAAAGCTGGGCAGCCTGAAC CTGCGGTGGCAGGAAGTGTGCAAGCAGCTGAGCGACCGGAAGAAGC GGCTGGAAGAACAGGCCCCTGGCCTGACCACAATCGGCGCCAGCCC TACCCAGACCGTGACCCTGGTGACACAGCCCGTGGTGACAAAAGAG ACAGCCATCAGCAAGCTGGAAATGCCCAGCAGCCTGATGCTGGAAA GCGACCAGTGGAAGCGGCTGCACCTGAGCCTGCAGGA ACTGCTGGT CTGGCTGCAGCTGAAGGACGACGAGCTGAGCAGACAGGCCCCCATC GGCGGCGATTTCCCCGCCGTGCAGAAACAGAACGACGTGCACCGGG CCTTCAAGCGCGAGCTGAAAACAAAAGAACCCGTGATCATGAGCAC CCTGGAAACCGTGCGGATCTTCCTGACCGAGCAGCCCCTGGAAGGC CTGGAAAAGCTGTACCAGGAACCCAGAGAGCTGCCCCCCGAGGAAC GGGCC CAGAACGTGACCAGACTGCTGCGGAAGCAGGCCGAAGAGGT CAACACCGAGTGGGAAGCTGAACCTGCACAGCGCCGACTGGCAG CGGAAGATCGACGACACTGGAACGGCTGCAGGAACTGCAGGAG GCCACCGACGAGCTGGACCTGAAGCTGAGACAGGCCGAAGTGATCA AGGGCAGCTGGCAGCCCGTGGGCGACCTGCTGATCGACTCCCTGCA GGACCACCTGGAAAAAG TGAAGGCCCTGCGGGGCGAGATCGCCCCC CTGAAAGAAAACGTGTCCCACGTGAACGACCTGGCCCGGCAGCTGA CCACCCTGGGCATCCAGCTGAGCCCCTACAACCTGTCCACCCTGGAA GATCTGAACACCCGGTGGAAGCTGCTGCAGGTGGCCGTGGAAGATA GAGTGCGGCAGCTGCACGAGGCCCACAGAGACTTTGGCCCTGCCAG CCAGCACTTCCTGAGCACCCTGTGCAGGGACC CTGGGAGAGAGCC ATCAGCCCCAACAAGGTGCCCTACTACATCAACCACGACACAGA CCACCTGTTGGGACCACCCCAAGATGACCGAGCTGTACCAGAGCCT GGCCGACCTGAACAATGTGCGGTTCAGCGCCTACCGGACCGCCATG AAGCTGAGGCGGCTGCAGAAAGCTCTGTGCCTGGATCTGCTGAGCCT GAGCGCCGCCTGCGACGCCCTGGACCAGCACAACCTGAAGCAGA AC GACCAGCCCATGGATATCCTGCAGATCATCAACTGCCTGACCACAAT CTACGACAGGCTGGAACAGGAACACAACAATCTGGTCAACGTGCCC CTGTGCGTGGACATGTGCCTGAATTGGCTGCTGAATGTGTACGACAC CGGCCGGACCGGCAGAATCCGGGTGCTGAGCTTCAAGACCGGCATC ATCAGCCTGTGCAAGGCCCACCTGGAAGATAAGTACCGCTACCTGTT CAAACAGGTG GCCAGCTCCACCGGCTTTTGCGACCAGCGGAGACTG GGCCTGCTGCTGCACGACAGCATCCAGATCCCCAGACAGCTGGGCG AGGTGGCCTCCTTCGGCGGCAGCAACATTGAGCCCAGCGTGCGGAG CTGCTTCCAGTTCGCCAACAACAAGCCCGAGATCGAGGCCGCCCTGT TCCTGGACTGGATGAGACTGGAACCCCAGAGCATGGTGTGGCTGCC CGTGCTGCATCGGGTGGCCG CTGCCGAGACAGCCAAGCACCAGCC

- 84 046419- 84 046419

AAGTGCAACATCTGCAAAGAGTGCCCCATCATCGGCTTCCGGTACAG AAGCCTGAAGCACTTCAACTACGATATCTGCCAGAGCTGCTTCTTCA GCGGCAGAGTGGCCAAGGGCCACAAAATGCACTACCCCATGGTGGA ATACTGCACCCCCACCACCAGCGGCGAGGATGTGCGGGACTTCGCC AAGGTGCTGAAAAACAAGTTCCGGACCAAGCGGTACTTTGCCAAGC ACCCCCGGATGGGCTACCTGCCCGTGCAGACAGTGCTGGAAGGCGA CAACATGGAAACCGACACCATGTGATGATGATTTGGGCAGAGCGAT GGAGTCCTTAGTATCAGTCATGACAGATGAAGAAGGAGCAGAATAA ATGTTTTACAACTCCTGATTCCCGCATGCGGCCAGCTTATCGATACC GTCGAAATAAAAGATCCTTATTTTCATTGGATCTGTGTGTTGGTTTTT TGTGTG AAGTGCAACATCTGCAAAGAGTGCCCCATCATCGGCTTCCGGTACAG AAGCCTGAAGCACTTCAACTACGATATCTGCCAGAGCTGCTTCTTCA GCGGCAGAGTGGCCAAGGGCCACAAAATGCACTACCCCATGGTGGA ATACTGCACCCCCACCACCAGGCGAGGATGTGCGGGACTTCGCC AAGGTGCTGAAAAACAAGTTCCGGACCAAGCGGTACTTTGCCAAGC ACCCCCGGATGGG CTACCTGCCCGTGCAGACAGTGCTGGAAGGCGA CAACATGGAAACCGACACCATGTGATGATGATTTGGGCAGAGCGAT GGAGTCCTTAGTATCAGTCATGACAGATGAAGAAGGAGCAGAATAA ATGTTTTTACAACTCCTGATTCCCGCATGCGGCCAGCTTATCGATACC GTCGAAATAAAAGATCCTTATTTTCATTGGATCTGTGTGTTGGTTTTTT TGTGTG SEQ ID NO: 149 - BXA- 212372 SEQ ID NO: 149 - BXA- 212372 ATGCTGTGGTGGGAGGAAGTGGAAGATTGCTACGAGCGCGAGGACG TGCAGAAGAAAACCTTCACCAAATGGGTGAACGCCCAGTTCAGCAA GTTCGGCAAGCAGCACATCGAGAACCTGTTCAGCGACCTGCAGGAC GGCAGACGGCTGCTGGACCTGCTGGAAGGCCTGACCGGCCAGAAGC TGCCCAAAGAGAAGGGCAGCACCAGAGTGCACGCCCTGAACAACGT GAACAAGGCCCTGCGGGTGCTGCAGAACAACAACGTGGACCTGGTG AACATCGGCAGCACCGACATCGTGGACGGCAACCACAAGCTGACCC TGGGCCTGATCTGGAACATCATCCTGCACTGGCAGGTCAAAAACGTG ATGAAGAACATCATGGCCGGCCTGCAGCAGACCAACAGCGAGAAGA TCCTGCTGAGCTGGGTGCGCCAGAGCACCCGGAACTACCCCCAGGTC AACGTGATCAACTTCACCACCTCTTGGAGCGACGGCCTGGCCCTGAA CGCCCTGATCCACAGCCACCGGCCCGACCTGTTCGACTGGAACAGCG TGGTCTGCCAGCAGAGCGCCACCCAGCGGCTGGAACACGCCTTCAA TATCGCCAGATACCAGCTGGGCATCGAGAAGCTGCTGGATCCCGAG GACGTGGACACCACCTACCCCGACAAGAAATCCATCCTGATGTATAT CACCAGCCTGTTCCAGGTGCTGCCCCAGCAGGTGTCCATCGAGGCCA TCCAGGAAGTGGAAATGCTGCCCAGACCCCCCAAAGTGACCAAAGA GGAACACTTCCAGCTGCACCACCAGATGCACTACAGCCAGCAGATC ACCGTGTCCCTGGCTCAGGGCTACGAGCGGACCAGCAGCCCCAAGC CCCGGTTCAAGAGCTACGCCTACACCCAGGCCGCCTACGTGACCACC AGCGACCCCACCAGAAGCCCATTCCCCAGCCAGCATCTGGAAGCCC CCGAGGACAAGAGCTTCGGCAGCAGCCTGATGGAAAGCGAAGTGAA CCTGGACAGATACCAGACCGCCCTGGAAGAGGTGCTGTCCTGGCTG CTGAGCGCCGAGGATACACTGCAGGCCCAGGGCGAGATCAGCAACG ACGTGGAAGTGGTGAAAGACCAGTTCCACACCCACGAGGGCTACAT GATGGACCTGACCGCCCACCAGGGCAGAGTGGGCAACATCCTGCAG CTGGGCAGCAAGCTGATCGGCACCGGCAAGCTGAGCGAGGACGAAG AGACAGAGGTGCAGGAACAGATGAACCTGCTGAACAGCAGATGGG AGTGCCTGCGGGTGGCCAGCATGGAAAAGCAGAGCAACCTGCACAT CCACACCGTGCGGGAAGAGACAATGATGGTGATGACCGAGGACATG CCCCTGGAAATCAGCTACGTGCCCAGCACCTACCTGACCGAGATCAC CCACGTGTCCCAGGCTCTGCTGGAAGTGGAACAGCTGCTGAACGCCC CCGACCTGTGCGCCAAGGACTTCGAGGATCTGTTCAAGCAGGAAGA GAGCCTGAAGAATATCAAGGACTCCCTGCAGCAGTCCAGCGGCCGG ATCGACATCATCCACAGCAAGAAAACAGCCGCCCTGCAGTCCGCCA CCCCCGTGGAAAGAGTGAAGCTGCAGGAAGCCCTGAGCCAGCTGGA ATGCTGTGGTGGGAGGAAGTGGAAGATTGCTACGAGCGCGAGGACG TGCAGAAGAAAACCTTCACCAAATGGGTGAACGCCCAGTTCAGCAA GTTCGGCAAGCAGCACATCGAGAACCTGTTCAGCGACCTGCAGGAC GGCAGACGGCTGCTGGACCTGCTGGAAGGCCTGACCGGCCAGAAGC TGCCCAAAGAAGGGCAGCACCAGAGTGCACGCCCTGAACAACGT GAACAAGGCCC TGCGGGTGCTGCAGAACAACAACGTGGACCTGGTG AACATCGGCAGCACCGACATCGTGGACGGCAACCACAAGCTGACCC TGGGCCTGATCTGGAACATCATCCTGCACTGGCAGGTCAAAAACGTG ATGAAGAACATCATGGCCGGCCTGCAGCAGACCAACAGCGAGAAGA TCCTGCTGAGCTGGGTGCGCCAGAGCACCCGGAACTACCCCCAGGTC AACGTGATCAACTTCACCACCTCTTAG CGACGGCCTGGCCCTGAA CGCCCTGATCCACAGCCACCGGCCCGACCTGTTCGACTGGAACAGCG TGGTCTGCCAGCAGAGCGCCACCCAGCGGCTGGAACACGCCTTCAA TATCGCCAGATACCAGCTGGGCATCGAGAAGCTGCTGGATCCCGAG GACGTGGACACCACCTACCCCGACAAGAAATCCATCCTGATGTATAT CACCAGCCTGTTCCAGGTGCTGCCCCAGGTGTCCAT CGAGGCCA TCCAGGAAGTGGAAATGCTGCCCAGACCCCCCAAAGTGACCAAAGA GGAACACTTCCAGCTGCACCACCAGATGCACTACAGCCAGCAGATC ACCGTGTCCCTGGCTCAGGGCTACGAGCGGACCAGCAGCCCCAAGC CCCGGTTCAAGAGCTACGCCTACACCCAGGCCGCCTACGTGACCACC AGCGACCCCACCAGAAGCCCATTCCCCAGCCAGCATCTGGAAGCCC CCGAGGA CAAGAGCTTCGGCAGCAGCCTGATGGAAAGCGAAGTGAA CCTGGACAGATACCAGACCGCCCTGGAAGAGGTGCTGTCCTGGCTG CTGAGCGCCGAGGATACACTGCAGGCCCAGGGCGAGATCAGCAACG ACGTGGAAGTGGTGAAAGACCAGTTCCACACCCACGAGGGCTACAT GATGGACCTGACCGCCCACCAGGGCAGAGTGGGCAACATCCTGCAG CTGGGCAGCAAGCTGATCGGCA CCGGCAAGCTGAGCGAGGACGAAG AGACAGAGGTGCAGGAACAGATGAACCTGCTGAACAGCAGATGGG AGTGCCTGCGGGTGGCCAGCATGGAAAAGCAGAGCAACCTGCACAT CCACACCGTGCGGGAAGAGACAATGATGGTGATGACCGAGGACATG CCCCTGGAAATCAGCTACGTGCCCAGCACCTACCTGACCGAGATCAC CCACGTGTCCCAGGCTCTGCTGGAAGTGGAACAGCT GCTGAACGCCC CCGACCTGTGCGCCAAGGACTTCGAGGATCTGTTCAAGCAGGAAGA GAGCCTGAAGAATATCAAGGACTCCCTGCAGCAGTCCAGCGGCCGG ATCGACATCATCCACAGCAAGAAAACAGCCGCCCTGCAGTCCGCCA CCCCCGTGGAAAGAGTGAAGCTGCAGGAAGCCCTGAGCCAGCTGGA

- 85 046419- 85 046419

CTTCCAGTGGGAGAAAGTGAACAAGATGTACAAGGACCGGCAGGGC AGATTCGACCGCAGCGTGGAAAAGTGGCGGCGGTTCCACTACGACA TCAAGATCTTCAACCAGTGGCTGACCGAGGCCGAGCAGTTCCTGAG AAAGACCCAGATCCCCGAGAACTGGGAGCACGCCAAGTACAAGTGG TATCTGAAAGAGCTGCAGGACGGCATCGGCCAGCGGCAGACAGTGG TCCGCACCCTGAATGCCACCGGCGAGGAAATCATCCAGCAGAGCAG CAAGACCGACGCCAGCATCCTGCAGGAAAAGCTGGGCAGCCTGAAC CTGCGGTGGCAGGAAGTGTGCAAGCAGCTGAGCGACCGGAAGAAGC GGCTGGAAGAACAGGCCCCTGGCCTGACCACAATCGGCGCCAGCCC TACCCAGACCGTGACCCTGGTGACACAGCCCGTGGTGACAAAAGAG ACAGCCATCAGCAAGCTGGAAATGCCCAGCAGCCTGATGCTGGAAA GCGACCAGTGGAAGCGGCTGCACCTGAGCCTGCAGGAACTGCTGGT CTGGCTGCAGCTGAAGGACGACGAGCTGAGCAGACAGGCCCCCATC GGCGGCGATTTCCCCGCCGTGCAGAAACAGAACGACGTGCACCGGG CCTTCAAGCGCGAGCTGAAAACAAAAGAACCCGTGATCATGAGCAC CCTGGAAACCGTGCGGATCTTCCTGACCGAGCAGCCCCTGGAAGGC CTGGAAAAGCTGTACCAGGAACCCAGAGAGCTGCCCCCCGAGGAAC GGGCCCAGAACGTGACCAGACTGCTGCGGAAGCAGGCCGAAGAGGT CAACACCGAGTGGGAGAAGCTGAACCTGCACAGCGCCGACTGGCAG CGGAAGATCGACGAGACACTGGAACGGCTGCAGGAACTGCAGGAG GCCACCGACGAGCTGGACCTGAAGCTGAGACAGGCCGAAGTGATCA AGGGCAGCTGGCAGCCCGTGGGCGACCTGCTGATCGACTCCCTGCA GGACCACCTGGAAAAAGTGAAGGCCCTGCGGGGCGAGATCGCCCCC CTGAAAGAAAACGTGTCCCACGTGAACGACCTGGCCCGGCAGCTGA CCACCCTGGGCATCCAGCTGAGCCCCTACAACCTGTCCACCCTGGAA GATCTGAACACCCGGTGGAAGCTGCTGCAGGTGGCCGTGGAAGATA GAGTGCGGCAGCTGCACGAGGCCCACAGAGACTTTGGCCCTGCCAG CCAGCACTTCCTGAGCACCTCTGTGCAGGGACCCTGGGAGAGAGCC ATCAGCCCCAACAAGGTGCCCTACTACATCAACCACGAGACACAGA CCACCTGTTGGGACCACCCCAAGATGACCGAGCTGTACCAGAGCCT GGCCGACCTGAACAATGTGCGGTTCAGCGCCTACCGGACCGCCATG AAGCTGAGGCGGCTGCAGAAAGCTCTGTGCCTGGATCTGCTGAGCCT GAGCGCCGCCTGCGACGCCCTGGACCAGCACAACCTGAAGCAGAAC GACCAGCCCATGGATATCCTGCAGATCATCAACTGCCTGACCACAAT CTACGACAGGCTGGAACAGGAACACAACAATCTGGTCAACGTGCCC CTGTGCGTGGACATGTGCCTGAATTGGCTGCTGAATGTGTACGACAC CGGCCGGACCGGCAGAATCCGGGTGCTGAGCTTCAAGACCGGCATC ATCAGCCTGTGCAAGGCCCACCTGGAAGATAAGTACCGCTACCTGTT CAAACAGGTGGCCAGCTCCACCGGCTTTTGCGACCAGCGGAGACTG GGCCTGCTGCTGCACGACAGCATCCAGATCCCCAGACAGCTGGGCG AGGTGGCCTCCTTCGGCGGCAGCAACATTGAGCCCAGCGTGCGGAG CTGCTTCCAGTTCGCCAACAACAAGCCCGAGATCGAGGCCGCCCTGT TCCTGGACTGGATGAGACTGGAACCCCAGAGCATGGTGTGGCTGCC CGTGCTGCATCGGGTGGCCGCTGCCGAGACAGCCAAGCACCAGGCC AAGTGCAACATCTGCAAAGAGTGCCCCATCATCGGCTTCCGGTACAG AAGCCTGAAGCACTTCAACTACGATATCTGCCAGAGCTGCTTCTTCA GCGGCAGAGTGGCCAAGGGCCACAAAATGCACTACCCCATGGTGGA ATACTGCACCCCCACCACCAGCGGCGAGGATGTGCGGGACTTCGCC CTTCCAGTGGGAGAAAGTGAACAAGATGTACAAGGACCGGCAGGGC AGATTCGACCGCAGCGTGGAAAAGTGGCGGCGGTTCCACTACGACA TCAAGATCTTCAACCAGTGGCTGACCGAGGCCGAGCAGTTCCTGAG AAAGACCCAGATCCCCGAGAACTGGGAGCACGCCAAGTACAAGTGG TATCTGAAAGAGCTGCAGGACGGCATCGGCCAGCGGCAGACAGTGG TCCGCAC CCTGAATGCCACCGGCGAGGAAATCATCCAGCAGAGCAG CAAGACCGACGCCAGCATCCTGCAGGAAAAGCTGGGCAGCCTGAAC CTGCGGTGGCAGGAAGTGTGCAAGCAGCTGAGCGACCGGAAGAAGC GGCTGGAAGAACAGGCCCCTGGCCTGACCACAATCGGCGCCAGCCC TACCCAGACCGTGACCCTGGTGACACAGCCCGTGGTGACAAAAGAG ACAGCCATCAGCAAGCTGGAAA TGCCCAGCAGCCTGATGCTGGAAA GCGACCAGTGGAAGCGGCTGCACCTGAGCCTGCAGGAACTGCTGGT CTGGCTGCAGCTGAAGGACGACGAGCTGAGCAGACAGGCCCCCATC GGCGGCGATTTCCCCGCCGTGCAGAAACAGAACGACGTGCACCGGG CCTTCAAGCGCGAGCTGAAAACAAAAGAACCCGTGATCATGAGCAC CCTGGAAACCGTGCGGATCTCCTGACCGAGCAG CCCCTGGAAGGC CTGGAAAAGCTGTACCAGGAACCCAGAGAGCTGCCCCCCGAGGAAC GGGCCCAGAACGTGACCAGACTGCTGCGGAAGCAGGCCGAAGAGGT CAACACCGAGTGGGAGAAGCTGAACCTGCACAGCGCCGACTGGCAG CGGAAGATCGACGAGACACTGGAACGGCTGCAGGAACTGCAGGAG GCCACCGACGAGCTGGACCTGAAGCTGAGACAGGCCGAAGTGATCA AGGGCAGCTGGCAGCCCGTGGGCGACCTGCTGATCGACTCCCTGCA GGACCACCTGGAAAAAGTGAAGGCCCTGCGGGGCGAGATCGCCCCC CTGAAAGAAAACGTGTCCCACGTGAACGACCTGGCCCGGCAGCTGA CCACCCTGGGCATCCAGCTGAGCCCCTACAACCTGTCCACCCTGGAA GATCTGAACACCCGGTGGAAGCTGCTGCAGGTGGCCGTGGAAGATA GAGTGCGGCAGCTGCAC GAGGCCCACAGAGACTTTGGCCCTGCCAG CCAGCACTTCCTGAGCACCTCTGTGCAGGGACCCTGGGAGAGAGCC ATCAGCCCCAACAAGGTGCCCTACTACATCAACCAGGAGACACAGA CCACCTGTTGGGACCACCCCAAGATGACCGAGCTGTACCAGAGGCCT GGCCGACCTGAACAATGTGCGGTTCAGCGCCTACCGGACCGCCATG AAGCTGAGGCGGCTGCAGAAAGCTCTGTG CCTGGATCTGCTGAGCCT GAGCGCCGCCTGCGACGCCCTGGACCAGCACAACCTGAAGCAGAAC GACCAGCCCATGGATATCCTGCAGATCATCAACTGCCTGACCACAAT CTACGACAGGCTGGAACAGGAACACAACAATCTGGTCAACGTGCCC CTGTGCGTGGACATGTGCCTGAATTGGCTGCTGAATGTGTACGACAC CGGCCGGACCGGCAGAATCCGGGTGCTGAGCTTCAAGACC GGCATC ATCAGCCTGTGCAAGGCCCACCTGGAAGATAAGTACCGCTACCTGTT CAAACAGGTGGCCAGCTCCACCGGCTTTTGCGACCAGCGGAGACTG GGCCTGCTGCTGCACGACAGCATCCAGATCCCCAGACAGCTGGGCG AGGTGGCCTCCTTCGGCGGCAGCAACATTGAGCCCAGCGTGCGGAG CTGCTTCCAGTTCGCCAACAACAAGCCCGAGATCGAGGCCGCCCTGT TC CTGGACTGGATGAGACTGGAACCCCAGAGCATGGTGTGGCTGCC CGTGCTGCATCGGGTGGCCGCTGCCGAGACAGCCAAGCACCAGGCC AAGTGCAACATCTGCAAAGAGTGCCCCATCATCGGCTTCCGGTACAG AAGCCTGAAGCACTTCAACTACGATATCTGCCAGAGCTGCTTCTTCA GCGGCAGAGTGGCCAAGGGCCACAAAATGCACTACCCCATGGTGGA ATACTGCACCCCCACCACCAG CGGCGAGGATGTGCGGGACTTCGCC AAGGTGCTGAAAAACAAGTTCCGGACCAAGCGGTACTTTGCCAAGC ACCCCCGGATGGGCTACCTGCCCGTGCAGACAGTGCTGGAAGGCGA CAACATGGAAACCGACACCATGTGATGATGAGAAGTCTTTTCCACAT GGCAGATGAAATAAAAGATCCTTATTTTCATTGGATCTGTGTGTTGG TTTTTTGTGTG AAGGTGCTGAAAAACAAGTTCCGGACCAAGCGGTACTTTGCCAAGC ACCCCCGGATGGGCTACCTGCCCGTGCAGACAGTGCTGGAAGGCGA CAACATGGAAACCGACACCATGTGATGATGAGAAGTCTTTTTCCACAT GGCAGATGAAATAAAAGATCCTTATTTTCATTGGATCTGTGTGTTGG TTTTTTGTGTG

SEQ ID NO: 148 кодирует конструкцию ВХА-212371, которая аналогична конструкции ВХА027743, за исключением того, что С-конец удален.SEQ ID NO: 148 encodes construct BXA-212371, which is similar to construct BXA027743 except that the C-terminus is deleted.

SEQ ID NO: 149 кодирует конструкцию ВХА-212372, которая аналогична ВХА-212371, но с более коротким 3'UTR.SEQ ID NO: 149 encodes the construct BXA-212372, which is similar to BXA-212371 but with a shorter 3'UTR.

В некоторых вариантах осуществления полипептид миниатюризированного дистрофина содержит или представляет собой конструкцию, показанную в табл. 9.In some embodiments, the miniaturized dystrophin polypeptide comprises or is a construct shown in Table. 9.

- 86 046419- 86 046419

Таблица 9Table 9

Аминокислотная последовательность полипептида миниатюризированного дистрофина ВХА-213788Amino acid sequence of the miniaturized dystrophin polypeptide BXA-213788

SEQ Ш NO: SEQ Ш NO: Последовательность Subsequence 152 152 MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIENLFSDLQDG RRLLDLLEGLTGQKLPKEKGSTRVHALNNVNKALRVLQNNNVDLVNI GSTDIVDGNHKLTLGLIWNIILHWQVKNVMKNIMAGLQQTNSEKILLS WVRQSTRNYPQVNVINFTTSWSDGLALNALIHSHRPDLFDWNSVVCQQ SATQRLEHAFNIARYQLGIEKLLDPEDVDTTYPDKKSILMYITSLFQVLP QQVSIEAIQEVEMLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERT SSPKPRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSFGSSLMESEV NLDRYQTALEEVLSWLLSAEDTLQAQGEISNDVEVVKDQFHTHEGYM MDLTAHQGRVGNILQLGSKLIGTGKLSEDEETEVQEQMNLLNSRWECL RVASMEKQSNLHIHTVREETMMVMTEDMPLEISYVPSTYLTEITHVSQA LLEVEQLLNAPDLCAKDFEDLFKQEESLKNIKDSLQQSSGRIDIIHSKKT AALQSATPVERVKLQEALSQLDFQWEKVNKMYKDRQGRFDRSVEKW RRFHYDIKIFNQWLTEAEQFLRKTQIPENWEHAKYKWYLKELQDGIGQ RQTVVRTLNATGEEIIQQSSKTDASILQEKLGSLNLRWQEVCKQLSDRK KRLEEQKNDLAPGLTTIGASPTQTVTLVTQPVVTKETAISKLEMPSSLM LESDQWKRLHLSLQELLVWLQLKDDELSRQAPIGGDFPAVQKQNDVH RAFKRELKTKEPVIMSTLETVRIFLTEQPLEGLEKLYQEPRELPPEERAQ NVTRLLRI<QAEEVNTEWEI<LNLHSADWQRI<IDETLERLQELQEATDEL DLKLRQAEVIKGSWQPVGDLLIDSLQDHLEKVKALRGEIAPLKENVSH VNDLARQLTTLGIQLSPYNLSTLEDLNTRWKLLQVAVEDRVRQLHEAH RDFGPASQHFLSTSVQGPWERAISPNKVPYYINHETQTTCWDHPKMTEL YQSLADLNNVRFSAYRTAMKLRRLQKALCLDLLSLSAACDALDQHNL KQNDQPMDILQIINCLTTIYDRLEQEHNNLVNVPLCVDMCLNWLLNVY DTGRTGRIRVLSFKTGIISLCKAHLEDKYRYLFKQVASSTGFCDQRRLGL LLHDSIQIPRQLGEVASFGGSNIEPSVRSCFQFANNKPEIEAALFLDWMR LEPQSMVWLPVLHRVAAAETAKHQAKCNICKECPIIGFRYRSLKHFNY MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIENLFSDLQDG RRLLDLLEGLTGQKLPKEKGSTRVHALNNVNKALRVLQNNNVDLVNI GSTDIVDGNHKLTLGLIWNIILHWQVKNVMKNIMAGLQQTNSEKILLS WVRQSTRNYPQVNVINFTTSWSDGLALNALIHSHRPDLFD WNSVVCQQ SATQRLEHAFNIARYQLGIEKLLDPEDVDTTYPDKKSILMYITSLFQVLP QQVSIEAIQEVEMLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERT SSPKPRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSFGSSLMESEV NLDRYQTALEEVLSWLLSAEDTLQAQGEISNDVE VVKDQFHTHEGYM MDLTAHQGRVGNILQLGSKLIGTGKLSEDEETEVQEQMNLLNSRWECL RVASMEKQSNLHIHTVREETMMVMTEDMPLEISYVPSTYLTEITHVSQA LLEVEQLLNAPDLCAKDFEDLFKQEESLKNIKDSLQQSSGRIDIIHSKKT AALQSATPVERVKLQEALSQLDFQWEKVNK MYKDRQGRFDRSVEKW RRFHYDIKIFNQWLTEAEQFLRKTQIPENWEHAKYKWYLKELQDGIGQ RQTVVRTLNATGEEIIQQSSKTDASILQEKLGSLNLRWQEVCKQLSDRK KRLEEQKNDLAPGLTTIGASPTQTVTLVTQPVVTKETAISKLEMPSSLM LESDQWKRLHLSLQELLVWLQLK DDELSRQAPIGGDFPAVQKQNDVH RAFKRELKTKEPVIMSTLETVRIFLTEQPLEGLEKLYQEPRELPPEERAQ NVTRLLRI<QAEEVNTEWEI<LNLHSADWQRI<IDETLERLQELQEATDEL DLKLRQAEVIKGSWQPVGDLLIDSLQDHLEKVKALRGEIAPLKENVSH VNDLARQLTTLGIQLSPYNL STLEDLNTRWKLLQVAVEDRVRQLHEAH RDFGPASQHFLSTSVQGPWERAISPNKVPYYINHETQTTCWDHPKMTEL YQSLADLNNVRFSAYRTAMKLRRLQKALCLDLLSLSAACDALDQHNL KQNDQPMDILQIINCLTTIYDRLEQEHNNLVNVPLCVDMCLNWLLNVY DTGRTGRIRVLSFKTGIISLCKAHLEDKYRYLFKQ VASSTGFCDQRRLGL LLHDSIQIPRQLGEVASFGGSNIEPSVRSCFQFANNKPEIEAALFLDWMR LEPQSMVWLPVLHRVAAAETAKHQAKCNICKECPIIGFRYRSLKHFNY DICQSCFFSGRVAKGHKMHYPMVEYCTPTTSGEDVRDFAKVLKNKFRT KRYFAKHPRMGYLPVQTVLEGDNMET DICQSCFFSGRVAKGHKMHYPMVEYCTPTTSGEDVRDFAKVLKNKFRT KRYFAKHPRMGYLPVQTVLEGDNMET

В некоторых вариантах осуществления полипептид миниатюризированного дистрофина содержит аминокислотную последовательность, которая по меньшей мере на около 70%, по меньшей мере на около 75%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 152, где аминокислотная последовательность при экспрессии обладает по меньшей мере одной дистрофиновой активностью.In some embodiments, the miniaturized dystrophin polypeptide comprises an amino acid sequence that is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90 %, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 152, wherein the amino acid sequence, when expressed, has at least one dystrophin activity.

В некоторых вариантах осуществления полипептид миниатюризированного дистрофина содержит или представляет собой конструкцию, показанную в табл. 10.In some embodiments, the miniaturized dystrophin polypeptide comprises or is a construct shown in Table. 10.

- 87 046419- 87 046419

Таблица 10Table 10

Аминокислотная последовательность полипептида миниатюризированного дистрофина ВХА-213780 J11V3Amino acid sequence of the miniaturized dystrophin polypeptide BXA-213780 J11V3

SEQ Ш NO: SEQ Ш NO: Последовательность Subsequence 153 153 MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIENLFSDLQDG RRLLDLLEGLTGQKLPKEKGSTRVHALNNVNKALRVLQNNNVDLVNI GSTDIVDGNHKLTLGLIWNIILHWQVKNVMKNIMAGLQQTNSEKILLS WVRQSTRNYPQVNVINFTTSWSDGLALNALIHSHRPDLFDWNSVVCQQ SATQRLEHAFNIARYQLGIEKLLDPEDVDTTYPDKKSILMYITSLFQVLP QQVSIEAIQEVEMLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERT SSPKPRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSFGSSLMESEV NLDRYQTALEEVLSWLLSAEDTLQAQGEISNDVEVVKDQFHTHEGYM MDLTAHQGRVGNILQLGSKLIGTGKLSEDEETEVQEQMNLLNSRWECL RVASMEKQSNLHRVLLKWQRLTEEQCLFSAWLSEKEDAVNKIHTTGFK DQNEMLSSLQKLAVLKADLEKKKQSMGKLYSLKQDLLSTLKNKSVTQ KTEAWLDNFARCWDNLVQKLEKSTAQISQAVTTTQPSLTQTTVMETVT TVTTREQILVKHAQEELPPPPPQKKRQITVDSEIHTVREETMMVMTEDM PLEISYVPSTYLTEITHVSQALLEVEQLLNAPDLCAKDFEDLFKQEESLK NIKDSLQQSSGRIDIIHSKKTAALQSATPVERVKLQEALSQLDFQWEKV NKMYKDRQGRFDRSVEKWRRFHYDIKIFNQWLTEAEQFLRKTQIPENW EHAKYKWYLKELQDGIGQRQTVVRTLNATGEEIIQQSSKTDASILQEKL GSLNLRWQEVCKQLSDRKKRLEEQLERLQELQEATDELDLKLRQAEVI I<GSWQPVGDLLIDSLQDHLEI<VI<ALRGEIAPLI<ENVSHVNDLARQLTT LGIQLSPYNLSTLEDLNTRWKLLQVAVEDRVRQLHEAHRDFGPASQHF LSTSVQGPWERAISPNKVPYYINHETQTTCWDHPKMTELYQSLADLNN VRFSAYRTAMKLRRLQKALCLDLLSLSAACDALDQHNLKQNDQPMDI LQIINCLTTIYDRLEQEHNNLVNVPLCVDMCLNWLLNVYDTGRTGRIRV LSFKTGIISLCKAHLEDKYRYLFKQVASSTGFCDQRRLGLLLHDSIQIPR QLGEVASFGGSNIEPSVRSCFQFANNKPEIEAALFLDWMRLEPQSMVWL PVLHRVAAAETAKHQAKCNICKECPIIGFRYRSLKHFNYDICQSCFFSGR MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIENLFSDLQDG RRLLDLLEGLTGQKLPKEKGSTRVHALNNVNKALRVLQNNNVDLVNI GSTDIVDGNHKLTLGLIWNIILHWQVKNVMKNIMAGLQQTNSEKILLS WVRQSTRNYPQVNVINFTTSWSDGLALNALIHSHRPDLFD WNSVVCQQ SATQRLEHAFNIARYQLGIEKLLDPEDVDTTYPDKKSILMYITSLFQVLP QQVSIEAIQEVEMLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERT SSPKPRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSFGSSLMESEV NLDRYQTALEEVLSWLLSAEDTLQAQGEISNDVE VVKDQFHTHEGYM MDLTAHQGRVGNILQLGSKLIGTGKLSEDEETEVQEQMNLLNSRWECL RVASMEKQSNLHRVLLKWQRLTEEQCLFSAWLSEKEDAVNKIHTTGFK DQNEMLSSLQKLAVLKADLEKKKQSMGKLYSLKQDLLSTLKNKSVTQ KTEAWLDNFARCWDNLVQKLEKSTAQISQ AVTTTQPSLTQTTVMETVT TVTTREQILVKHAQEELPPPPPQKKRQITVDSEIHTVREETMMVMTEDM PLEISYVPSTYLTEITHVSQALLEVEQLLNAPDLCAKDFEDLFKQEESLK NIKDSLQQSSGRIDIIHSKKTAALQSATPVERVKLQEALSQLDFQWEKV NKMYKDRQGRFDRSVEKWRRFHYDIKIF NQWLTEAEQFLRKTQIPENW EHAKYKWYLKELQDGIGQRQTVVRTLNATGEEIIQQSSKTDASILQEKL GSLNLRWQEVCKQLSDRKKRLEEQLERLQELQEATDELDLKLRQAEVI I<GSWQPVGDLLIDSLQDHLEI<VI<ALRGEIAPLI<ENVSHVNDLARQLTT LGIQLSPYNLSTLED LNTRWKLLQVAVEDRVRQLHEAHRDFGPASQHF LSTSVQGPWERAISPNKVPYYINHETQTTCWDHPKMTELYQSLADLNN VRFSAYRTAMKLRRLQKALCLDLLSLSAACDALDQHNLKQNDQPMDI LQIINCLTTIYDRLEQEHNNLVNVPLCVDMCLNWLLNVYDTGRTGRIRV LSFKTGIISLCKAHLEDKYRYLFKQVA SSTGFCDQRRLGLLLHDSIQIPR QLGEVASFGGSNIEPSVRSCFQFANNKPEIEAALFLDWMRLEPQSMVWL PVLHRVAAAETAKHQAKCNICKECPIIGFRYRSLKHFNYDICQSCFFSGR VAI<GHI<MHYPMVEYCTPTTSGEDVRDFAI<VLI<NI<FRTI<RYFAI<HPR MGYLPVQTVLEGDNMET VAI<GHI<MHYPMVEYCTPTTSGEDVRDFAI<VLI<NI<FRTI<RYFAI<HPR MGYLPVQTVLEGDNMET

SEQ ID NO: 153 кодирует конструкцию BXA-213780J11V3, которая аналогична конструкции ВХА196477, за исключением того, что аминокислоты А и Q внутреннего линкера SEAQ (SEQ ID NO: 74), а также последние три аминокислоты на С-конце удалены в BXA-21378OJ11V3.SEQ ID NO: 153 encodes construct BXA-213780J11V3, which is similar to construct BXA196477 except that amino acids A and Q of the internal SEAQ linker (SEQ ID NO: 74), as well as the last three amino acids at the C-terminus, are deleted in BXA-21378OJ11V3 .

В некоторых вариантах осуществления полипептид миниатюризированного дистрофина содержит аминокислотную последовательность, которая по меньшей мере на около 70%, по меньшей мере на около 75%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 153, где аминокислотная последовательность при экспрессии обладает по меньшей мере одной дистрофиновой активностью.In some embodiments, the miniaturized dystrophin polypeptide comprises an amino acid sequence that is at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90 %, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 153, wherein the amino acid sequence, when expressed, has at least one dystrophin activity.

В некоторых вариантах осуществления миниатюризированный дистрофин ВХА-213780 J11V3 может кодироваться нуклеотидной последовательностью, показанной в табл. 11.In some embodiments, the miniaturized dystrophin BXA-213780 J11V3 may be encoded by the nucleotide sequence shown in table. eleven.

- 88 046419- 88 046419

Таблица 11Table 11

Нуклеотидная последовательность полипептида миниатюризированного _________________дистрофина BXA-21378OJ11V3___________________Nucleotide sequence of the miniaturized _________________dystrophin polypeptide BXA-21378OJ11V3___________________

SEQ ID NO: SEQ ID NO: Последовательность Subsequence 154 154 atgctgtggtgggaggaagtggaagattgctacgagcgcgaggacgtgcagaagaaaaccttcaccaaatggg tgaacgcccagttcagcaagttcggcaagcagcacatcgagaacctgttcagcgacctgcaggacggcagacg gctgctggacctgctggaaggcctgaccggccagaagctgcccaaagagaagggcagcaccagagtgcacg ccctgaacaacgtgaacaaggccctgcgggtgctgcagaacaacaacgtggacctggtgaacatcggcagcac cgacatcgtggacggcaaccacaagctgaccctgggcctgatctggaacatcatcctgcactggcaggtcaaaa acgtgatgaagaacatcatggccggcctgcagcagaccaacagcgagaagatcctgctgagctgggtgcgcca gagcacccggaactacccccaggtcaacgtgatcaacttcaccacctcttggagcgacggcctggccctgaacg ccctgatccacagccaccggcccgacctgttcgactggaacagcgtggtctgccagcagagcgccacccagcg gctggaacacgccttcaatatcgccagataccagctgggcatcgagaagctgctggatcccgaggacgtggaca ccacctaccccgacaagaaatccatcctgatgtatatcaccagcctgttccaggtgctgccccagcaggtgtccat cgaggccatccaggaagtggaaatgctgcccagaccccccaaagtgaccaaagaggaacacttccagctgcac caccagatgcactacagccagcagatcaccgtgtccctggcccagggctacgagagaaccagcagccccaag ccccggttcaagagctacgcctatacccaggccgcctacgtgaccaccagcgaccctaccagaagcccattccc cagccagcatctggaagcccccgaggacaagagcttcggcagcagcctgatggaaagcgaagtgaacctgga cagataccagaccgccctggaagaggtgctgagctggctgctgagcgccgaggatacactgcaggctcaggg cgagatcagcaacgacgtggaagtcgtgaaggaccagttccacacccacgagggctacatgatggacctgaca gcccaccagggcagagtgggcaacatcctgcagctgggctccaagctgatcggcaccggcaagctgagcgag gacgaagagacagaggtgcaggaacagatgaacctgctgaacagcagatgggagtgcctgcgggtggccag catggaaaagcagagcaacctgcatagggtcctgctgaagtggcagcggctgaccgaggaacagtgcctgttta gcgcctggctgtccgagaaagaggacgccgtgaacaagatccacaccaccggcttcaaggaccagaacgaga atgctgtggtgggaggaagtggaagattgctacgagcgcgaggacgtgcagaagaaaaccttcaccaaatggg tgaacgcccagttcagcaagttcggcaagcagcacatcgagaacctgttcagcgacctgcaggacggcagacg gctgctggacctgctggaaggcctgaccggccaagagctgcccaaagagaagggcagc accagagtgcacg ccctgaacaacgtgaacaaggccctgcgggtgctgcagaacaacaacgtggacctggtgaacatcggcagcac cgacatcgtggacggcaaccacaagctgaccctgggcctgatctggaacatcatcctgcactggcaggtcaaaa acgtgatgaagaacatcatggccggcctgcagcagaccaacagcgagaaga tcctgctgagctgggtgcgcca gagcacccggaactacccccaggtcaacgtgatcaacttcaccacctcttggagcgacggcctggccctgaacg ccctgatccacagccaccggcccgacctgttcgactggaacagcgtggtctgccagcagagcgccacccagcg gctggaacacgccttcaatatcgccagataccagctg ggcatcgagaagctgctggatcccgaggacgtggaca ccacctaccccgacaagaaatccatcctgatgtatatcaccagcctgttccaggtgctgccccagcaggtgtccat cgaggccatccaggaagtggaaatgctgcccagaccccccaaagtgaccaaagaggaacacttccagctgcac caccagatgcactacagccagcagatcaccgt gtccctggcccagggctacgagagaaccagcagccccaag ccccggttcaagagctacgcctatacccaggccgcctacgtgaccaccagcgaccctaccagaagcccattccc cagccagcatctggaagcccccgaggacaagagcttcggcagcagcctgatggaaagcgaagtgaacctgga cagataccagaccgccctggaagaggtgctgagctgg ect gctgaacagcagatgggagtgcctgcgggtggccag catggaaaagcagagcaacctgcatagggtcctgctgaagtggcagcggctgaccgaggaacagtgcctgttta gcgcctggctgtccgagaaagaggacgccgtgaacaagatccacaccaccggcttcaaggaccagaacgaga tgctgagcagcctgcagaaactggccgtgctgaaggccgacctggaaaagaaaaagcagtccatgggcaagct gtactccctgaagcaggacctgctgtccaccctgaagaacaagagcgtgacccagaaaaccgaggcctggctg gacaacttcgcccggtgctgggacaacctggtgcagaagctggaaaagtccaccgcccagatctcccaggccg tgaccacaacacagcccagcctgacccagaccaccgtgatggaaaccgtgacaacagtgaccacccgggaac agatcctcgtgaagcacgcccaggaagaactgccccctccacccccccagaagaaacggcagatcacagtgg acagtgaaatccacaccgtgcgggaagagacaatgatggtcatgacagaggacatgcccctggaaatcagctac gtgcccagcacctacctgaccgagatcacccatgtgtcccaggccctgctggaagtggaacagctgctgaacgc ccccgacctgtgcgccaaggatttcgaggacctgttcaagcaggaagagagcctgaagaatatcaaggatagcc tgcagcagagcagcggccggatcgacatcatccacagcaagaaaacagccgccctgcagagcgccaccccc gtggaaagagtgaaactgcaggaagccctgtcccagctggacttccagtgggagaaagtgaacaaaatgtacaa ggaccggcagggcagattcgaccgcagcgtggaaaagtggcggcggttccactacgacatcaagatcttcaac cagtggctgacagaggccgagcagttcctgagaaagacccagatccccgagaactgggagcacgccaagtac aagtggtatctgaaagagctgcaggacggcatcggccagagacagacagtcgtgcggaccctgaatgccaccg gcgaggaaatcatccagcagtccagcaagaccgacgccagcattctgcaggaaaagctgggcagcctgaacct gcggtggcaggaagtgtgcaagcagctgtccgaccggaagaagcggctggaagaacagctggaacggctgc aggaactgcaggaggccaccgacgagctggacctgaaactgagacaggccgaagtgatcaagggcagctgg cagccagtgggcgacctgctgatcgactccctgcaggaccatctggaaaaagtgaaggccctgagaggcgaga tcgcccccctgaaagaaaacgtgtcccacgtgaacgacctggcccggcagctgacaacactgggcattcagctg agcccctacaacctgagcacactggaagatctgaacacccggtggaagctgctgcaggtggccgtggaagata gagtgcggcagctgcacgaggcccacagagattttggccctgcctcccagcacttcctgagcaccagtgtgcag ggcccttgggagagagccatctcccctaacaaggtgccctactacatcaaccacgagacacagaccacctgttg ggaccaccccaagatgaccgagctgtaccagagcctggctgacctgaacaacgtgcggttcagcgcctaccgg accgccatgaagctgcggagactgcagaaagctctgtgcctggatctgctgtccctgtccgccgcctgtgatgcc ctggaccagcacaatctgaagcagaacgaccagcccatggatatcctgcagatcatcaactgcctgaccaccatc tacgaccggctggaacaggaacacaacaatctcgtgaacgtgcccctgtgcgtggacatgtgcctgaattggctg ctgaatgtgtacgacaccggccggacaggccggatcagagtgctgtccttcaagaccggcatcatcagcctgtg caaagcccacctggaagataagtaccggtatctgttcaaacaggtggcctctagcaccggcttttgcgaccagag aaggctgggcctgctgctgcacgacagcatccagatccctagacagctgggcgaagtggccagctttggcggc agcaacatcgagcctagcgtgcggagctgcttccagttcgccaacaacaagcccgagatcgaggccgccctgtt cctggactggatgagactggaaccccagagcatggtgtggctgcccgtgctgcatagagtggccgctgccgag acagccaagcaccaggccaagtgcaacatctgcaaagagtgccccatcatcggcttccggtacagaagcctgaa gcacttcaactacgatatctgccagagctgtttcttcagcggcagggtggccaagggccacaaaatgcactaccc catggtggaatactgcacccccaccacaagcggcgaggatgtgcgggatttcgccaaggtgctgaaaaacaagt tccggaccaagcggtacttcgccaaacacccccggatgggctacctgcctgtgcagacagtgctggaaggcga caacatggaaacctgaGAAGTCTTTTCCACATGGCAGATGAAATAAAAGATC CTTATTTTCATTGGATCTGTGTGTTGGTTTTTGTGTG tgctgagcagcctgcagaaactggccgtgctgaaggccgacctggaaaagaaaaagcagtccatgggcaagct gtactccctgaagcaggacctgctgtccaccctgaagaacaagagcgtgacccagaaaaccgaggcctggctg gacaacttcgcccggtgctgggacaacctggtgcagaagctggaaaagtccaccgcccaga tctcccaggccg tgaccacaacacagcccagcctgacccagaccaccgtgatggaaaccgtgacaacagtgaccacccgggaac agatcctcgtgaagcacgcccaggaagaactgccccctccacccccccagaagaaacggcagatcacagtgg acagtgaaatccacaccgtgcgggaagagacaatgatggtcatgacagaggacatgcccctggaa atcagctac gtgcccagcacctacctgaccgagatcacccatgtgtcccaggccctgctggaagtggaacagctgctgaacgc ccccgacctgtgcgccaaggatttcgaggacctgttcaagcaggaagagagcctgaagaatatcaaggatagcc tgcagcagagcagcggccggatcgacatcatccacagcaagaaaacagccgccctg cagagcgccaccccc gtggaaagagtgaaactgcaggaagccctgtcccagctggacttccagtgggagaaagtgaacaaaatgtacaa ggaccggcagggcagattcgaccgcagcgtggaaaagtggcggcggttccactacgacatcaagatcttcaac cagtggctgacagaggccgagcagttcctgagaaagacccagat ccccgagaactgggagcacgccaagtac aagtggtatctgaaagagctgcaggacggcatcggccagagacagacagtcgtgcggaccctgaatgccaccg gcgaggaaatcatccagcagtccagcaagaccgacgccagcattctgcaggaaaagctgggcagcctgaacct gcggtggcaggaagtgtgcaagcagctgtccgaccgga agaagcggctggaagaacagctggaacggctgc aggaactgcaggaggccaccgacgagctggacctgaaactgagacaggccgaagtgatcaagggcagctgg cagccagtgggcgacctgctgatcgactccctgcaggaccatctggaaaaagtgaaggccctgagaggcgaga tcgcccccctgaaagaaaacgtgtcccacgtgaac gacctggcccggcagctgacaacactgggcattcagctg agcccctacaacctgagcacactggaagatctgaacacccggtggaagctgctgcaggtggccgtggaagata gagtgcggcagctgcacgaggcccacagagattttggccctgcctcccagcacttcctgagcaccagtgtgcag ggcccttggagagagccatctcc cctaacaaggtgccctactacatcaaccacgagacacagaccacctgttg ggaccaccccaagatgaccgagctgtaccagagcctggctgacctgaacaacgtgcggttcagcgcctaccgg accgccatgaagctgcggagactgcagaaagctctgtgcctggatctgctgtccctgtccgccgcctgtgatgcc ctggaccagca caatctgaagcagaacgaccagcccatggatatcctgcagatcatcaactgcctgaccaccatc tacgaccggctggaacaggaacacaacaatctcgtgaacgtgcccctgtgcgtggacatgtgcctgaattggctg ctgaatgtgtacgacaccggccggacaggccggatcagagtgctgtccttcaagaccggcatcatcagcctgt g caaagcccacctggaagataagtaccggtatctgttcaaacaggtggcctctagcaccggcttttgcgaccagag aaggctgggcctgctgctgcacgacagcatccagatccctagacagctgggcgaagtggccagctttggcggc agcaacatcgagcctagcgtgcggagctgcttccagttcgccaacaacaagccc gagatcgaggccgccctgtt cctggactggatgagactggaaccccagagcatggtgtggctgcccgtgctgcatagagtggccgctgccgag acagccaagcaccaggccaagtgcaacatctgcaaagagtgccccatcatcggcttccggtacagaagcctgaa gcacttcaactacgatatctgccagagctgtttcttcagcggcagggt ggccaagggccacaaaatgcactaccc catggtggaatactgcacccccaccacaagcggcgaggatgtgcgggatttcgccaaggtgctgaaaaacaagt tccggaccaagcggtacttcgccaaacacccccggatgggctacctgcctgtgcagacagtgctggaaggcga caacatggaaacctgaGAAGTCTTTTCACATGGCAGATG AAATAAAAGATC CTTATTTTCATTGGATCTGTGTGTTGGTTTTTGTGTG

В некоторых вариантах осуществления полипептид миниатюризированного дистрофина имеет соединительный участок между шарнирным 2 (Н2) доменом и доменом спектринового повтора 16 R16 (R16), который содержит аминокислотную последовательность, указанную в табл. 12.In some embodiments, the miniaturized dystrophin polypeptide has a connecting region between a hinge 2 (H2) domain and a spectrin repeat 16 R16 (R16) domain that contains the amino acid sequence set forth in Table 1. 12.

- 89 046419- 89 046419

Таблица 12Table 12

Аминокислотные последовательности соединительных участковAmino acid sequences of connecting regions

SEQ Ш NO SEQ Ш NO Последовательность Subsequence SEQ Ш NO: 155 SEQ Ш NO: 155 LPPPPPQKKRQITVDIHTVREETMMVMTEDMPLEI LPPPPPQKKRQITVDIHTVREETMMVMTEDMPLEI SEQ Ш NO: 156 SEQ Ш NO: 156 LPPPPPQKKRQITVDSIHTVREETMMVMTEDMPLEI LPPPPPQKKRQITVDSIHTVREETMMVMTEDMPLEI SEQ Ш NO: 157 SEQ Ш NO: 157 LPPPPPQKKRQITVDSEIHTVREETMMVMTEDMPLEI LPPPPPQKKRQITVDSEIHTVREETMMVMTEDMPLEI SEQ Ш NO: 158 SEQ Ш NO: 158 LPPPPPQKKRQITVDQIHTVREETMMVMTEDMPLEI LPPPPPQKKRQITVDQIHTVREETMMVMTEDMPLEI SEQ Ш NO: 159 SEQ Ш NO: 159 LPPPPPQKKRQITVDAQIHTVREETMMVMTEDMPLEI LPPPPPQKKRQITVDAQIHTVREETMMVMTEDMPLEI SEQ Ш NO: 160 SEQ Ш NO: 160 LPPPPPQKKRQITVIHTVREETMMVMTEDMPLEI LPPPPPQKKRQITVIHTVREETMMVMTEDMPLEI SEQ Ш NO: 161 SEQ Ш NO: 161 LPPPPPQKKRQITVDHTVREETMMVMTEDMPLEI LPPPPPQKKRQITVDHTVREETMMVMTEDMPLEI SEQ ID NO: 162 SEQ ID NO: 162 LPPPPPQKKRQITVHTVREETMMVMTEDMPLEI LPPPPPQKKRQITVHTVREETMMVMTEDMPLEI SEQ ID NO: 163 SEQ ID NO: 163 LPPPPPQKKRQITVDSQIHTVREETMMVMTEDMPLEI LPPPPPQKKRQITVDSQIHTVREETMMVMTEDMPLEI SEQ ID NO: 164 SEQ ID NO: 164 LPPPPPQKKRQITVDSHTVREETMMVMTEDMPLEI LPPPPPQKKRQITVDSHTVREETMMVMTEDMPLEI SEQ ID NO: 165 SEQ ID NO: 165 LPPPPPQKKRQITVQIHTVREETMMVMTEDMPLEI LPPPPPQKKRQITVQIHTVREETMMVMTEDMPLEI SEQ ID NO: 166 SEQ ID NO: 166 QKKRQITVDSEAQIHTVREETMMV QKKRQITVDSEAQIHTVREETMMV

В других вариантах осуществления нуклеотидная последовательность, кодирующая полипептид миниатюризированного дистрофина, включает последовательность нуклеиновой кислоты, которая по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательностям, приведенным в SEQ ID NO: 133-149, где полипептид миниатюризированного дистрофина при экспрессии нуклеотидной последовательности обладает по меньшей мере одной дистрофиновой активностью. В других вариантах осуществления нуклеотидная последовательность, кодирующая полипептид миниатюризированного дистрофина, включает последовательность нуклеиновой кислоты, которая по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательностям, приведенным в SEQ ID NO: 133 (ВХА-196477), SEQ ID NO: 134 (ВХА-196473), SEQ ID NO: 135 (ВХА -196474), SEQ ID NO: 136 (ВХА-196475), SEQ ID NO: 137 (ВХА-196476), SEQ ID NO: 139 (ВХА-196478), SEQ ID NO: 140 (ВХА-196479), SEQ ID NO: 148 (ВХА-212371) или SEQ ID NO: 149 (ВХА-212372). В некоторых вариантах осуществления нуклеотидная последовательность, кодирующая полипептид миниатюризированного дистрофина, включает последовательность нуклеиновой кислоты, которая по меньшей мере на около 60%, по меньшей мере на около 70%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 133, где полипептид миниатюризированного дистрофина при экспрессии нуклеотидной последовательности обладает по меньшей мере одной дистрофиновой активностью. В некоторых вариантах осуществления нуклеотидная последовательность, кодирующая полипептид миниатюризированного дистрофина, включает последовательность нуклеиновой кислоIn other embodiments, the nucleotide sequence encoding the miniaturized dystrophin polypeptide includes a nucleic acid sequence that is at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%, or about 100% identical to the sequences set forth in SEQ ID NO: 133-149, where the miniaturized dystrophin polypeptide, when expressed as a nucleotide sequence, has at least one dystrophin activity. In other embodiments, the nucleotide sequence encoding the miniaturized dystrophin polypeptide includes a nucleic acid sequence that is at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%, or about 100% identical to the sequences set forth in SEQ ID NO: 133 (BXA-196477 ), SEQ ID NO: 134 (VHA-196473), SEQ ID NO: 135 (VHA -196474), SEQ ID NO: 136 (VHA-196475), SEQ ID NO: 137 (VHA-196476), SEQ ID NO: 139 (ВХА-196478), SEQ ID NO: 140 (ВХА-196479), SEQ ID NO: 148 (ВХА-212371) or SEQ ID NO: 149 (ВХА-212372). In some embodiments, the nucleotide sequence encoding the miniaturized dystrophin polypeptide includes a nucleic acid sequence that is at least about 60%, at least about 70%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99% or about 100% identical to the sequence of SEQ ID NO: 133, wherein the miniaturized dystrophin polypeptide, when expressed as a nucleotide sequence, has at least one dystrophin activity. In some embodiments, the nucleotide sequence encoding the miniaturized dystrophin polypeptide includes a nucleic acid sequence

- 90 046419 ты, которая по меньшей мере на около 60%, по меньшей мере на около 70%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 134, где полипептид миниатюризированного дистрофина при экспрессии нуклеотидной последовательности обладает по меньшей мере одной дистрофиновой активностью. В некоторых вариантах осуществления нуклеотидная последовательность, кодирующая полипептид миниатюризированного дистрофина, включает последовательность нуклеиновой кислоты, которая по меньшей мере на около 60%, по меньшей мере на около 70%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 135. В некоторых вариантах осуществления нуклеотидная последовательность, кодирующая полипептид миниатюризированного дистрофина, включает последовательность нуклеиновой кислоты, которая по меньшей мере на около 60%, по меньшей мере на около 70%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 136. В некоторых вариантах осуществления нуклеотидная последовательность, кодирующая полипептид миниатюризированного дистрофина, включает последовательность нуклеиновой кислоты, которая по меньшей мере на около 60%, по меньшей мере на около 70%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 137. В некоторых вариантах осуществления нуклеотидная последовательность, кодирующая полипептид миниатюризированного дистрофина, включает последовательность нуклеиновой кислоты, которая по меньшей мере на около 60%, по меньшей мере на около 70%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 138, где полипептид миниатюризированного дистрофина при экспрессии нуклеотидной последовательности обладает по меньшей мере одной дистрофиновой активностью. В некоторых вариантах осуществления нуклеотидная последовательность, кодирующая полипептид миниатюризированного дистрофина, включает последовательность нуклеиновой кислоты, которая по меньшей мере на около 60%, по меньшей мере на около 70%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 139, где полипептид миниатюризированного дистрофина при экспрессии нуклеотидной последовательности обладает по меньшей мере одной дистрофиновой активностью. В некоторых вариантах осуществления нуклеотидная последовательность, кодирующая полипептид миниатюризированного дистрофина, включает последовательность нуклеиновой кислоты, которая по меньшей мере на около 60%, по меньшей мере на около 70%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 140, где полипептид миниатюризированного дистрофина при экспрессии нуклеотидной последовательности обладает по меньшей мере одной дистрофиновой активностью. В некоторых вариантах осуществления нуклеотидная последовательность, кодирующая полипептид миниатюризированного дистрофина, включает последовательность нуклеиновой кислоты, которая по меньшей мере на около 60%, по меньшей мере на около 70%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 141, где полипептид миниатюризированного дистрофина при экспрессии нуклеотидной последовательности обладает по меньшей мере одной дистрофиновой активностью. В некоторых вариантах осуществления нуклеотидная последовательность, кодирующая полипептид миниатюризированного дистрофина, включает последовательность нуклеиновой кислоты, которая по меньшей мере на около 60%, по меньшей мере на около 70%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 142, где полипептид миниатюризированного дистрофина при экспрессии нуклеотидной последовательности обладает по меньшей мере одной дистрофиновой активностью. В некоторых вариантах осуществления нуклеотидная последовательность, кодирующая полипептид миниатюризированного дистрофина, включает последовательность нуклеиновой кислоты, которая по меньшей мере на около 60%, по меньшей мере на около- 90 046419 you, which is at least about 60%, at least about 70%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 134, where the polypeptide miniaturized dystrophin, when expressed as a nucleotide sequence, has at least one dystrophin activity. In some embodiments, the nucleotide sequence encoding the miniaturized dystrophin polypeptide includes a nucleic acid sequence that is at least about 60%, at least about 70%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99% or about 100% identical to the sequence of SEQ ID NO: 135. In some embodiments, the nucleotide sequence encoding a miniaturized dystrophin polypeptide includes a nucleic acid sequence that is at least about 60%, at least about 70%, at least about 80% identical to SEQ ID NO: 135. %, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, is at least about 99% or about 100% identical to the sequence of SEQ ID NO: 136. In some embodiments, the nucleotide sequence encoding a miniaturized dystrophin polypeptide includes a nucleic acid sequence that is at least about 60% identical to about 70%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97 % is at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 137. In some embodiments, the nucleotide sequence encoding a miniaturized dystrophin polypeptide includes a nucleic acid sequence that is at least at least about 60%, at least about 70%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about about 96%, at least about 97%, at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 138, wherein the miniaturized dystrophin polypeptide, when expressed in nucleotide sequence, has at least one dystrophin activity. In some embodiments, the nucleotide sequence encoding the miniaturized dystrophin polypeptide includes a nucleic acid sequence that is at least about 60%, at least about 70%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99% or about 100% identical to the sequence of SEQ ID NO: 139, wherein the miniaturized dystrophin polypeptide, when expressed as a nucleotide sequence, has at least one dystrophin activity. In some embodiments, the nucleotide sequence encoding the miniaturized dystrophin polypeptide includes a nucleic acid sequence that is at least about 60%, at least about 70%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99% or about 100% identical to the sequence of SEQ ID NO: 140, wherein the miniaturized dystrophin polypeptide, when expressed as a nucleotide sequence, has at least one dystrophin activity. In some embodiments, the nucleotide sequence encoding the miniaturized dystrophin polypeptide includes a nucleic acid sequence that is at least about 60%, at least about 70%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99% or about 100% identical to the sequence of SEQ ID NO: 141, wherein the miniaturized dystrophin polypeptide, when expressed as a nucleotide sequence, has at least one dystrophin activity. In some embodiments, the nucleotide sequence encoding the miniaturized dystrophin polypeptide includes a nucleic acid sequence that is at least about 60%, at least about 70%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99% or about 100% identical to the sequence of SEQ ID NO: 142, wherein the miniaturized dystrophin polypeptide, when expressed as a nucleotide sequence, has at least one dystrophin activity. In some embodiments, the nucleotide sequence encoding the miniaturized dystrophin polypeptide includes a nucleic acid sequence that is at least about 60%, at least about

- 91 046419- 91 046419

70%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 143, где полипептид миниатюризированного дистрофина при экспрессии нуклеотидной последовательности обладает по меньшей мере одной дистрофиновой активностью. В некоторых вариантах осуществления нуклеотидная последовательность, кодирующая полипептид миниатюризированного дистрофина, включает последовательность нуклеиновой кислоты, которая по меньшей мере на около 60%, по меньшей мере на около 70%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 144, где полипептид миниатюризированного дистрофина при экспрессии нуклеотидной последовательности обладает по меньшей мере одной дистрофиновой активностью. В некоторых вариантах осуществления нуклеотидная последовательность, кодирующая полипептид миниатюризированного дистрофина, включает последовательность нуклеиновой кислоты, которая по меньшей мере на около 60%, по меньшей мере на около 70%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 145, где полипептид миниатюризированного дистрофина при экспрессии нуклеотидной последовательности обладает по меньшей мере одной дистрофиновой активностью. В некоторых вариантах осуществления нуклеотидная последовательность, кодирующая полипептид миниатюризированного дистрофина, включает последовательность нуклеиновой кислоты, которая по меньшей мере на около 60%, по меньшей мере на около 70%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 146, где полипептид миниатюризированного дистрофина при экспрессии нуклеотидной последовательности обладает по меньшей мере одной дистрофиновой активностью. В некоторых вариантах осуществления нуклеотидная последовательность, кодирующая полипептид миниатюризированного дистрофина, включает последовательность нуклеиновой кислоты, которая по меньшей мере на около 60%, по меньшей мере на около 70%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 147, где полипептид миниатюризированного дистрофина при экспрессии нуклеотидной последовательности обладает по меньшей мере одной дистрофиновой активностью. В некоторых вариантах осуществления нуклеотидная последовательность, кодирующая полипептид миниатюризированного дистрофина, включает последовательность нуклеиновой кислоты, которая по меньшей мере на около 60%, по меньшей мере на около 70%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 148, где полипептид миниатюризированного дистрофина при экспрессии нуклеотидной последовательности обладает по меньшей мере одной дистрофиновой активностью. В некоторых вариантах осуществления нуклеотидная последовательность, кодирующая полипептид миниатюризированного дистрофина, включает последовательность нуклеиновой кислоты, которая по меньшей мере на около 60%, по меньшей мере на около 70%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 149, где полипептид миниатюризированного дистрофина при экспрессии нуклеотидной последовательности обладает по меньшей мере одной дистрофиновой активностью.70%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97% is at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 143, wherein the miniaturized dystrophin polypeptide, when expressed as a nucleotide sequence, has at least one dystrophin activity. In some embodiments, the nucleotide sequence encoding the miniaturized dystrophin polypeptide includes a nucleic acid sequence that is at least about 60%, at least about 70%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99% or about 100% identical to the sequence of SEQ ID NO: 144, wherein the miniaturized dystrophin polypeptide, when expressed as a nucleotide sequence, has at least one dystrophin activity. In some embodiments, the nucleotide sequence encoding the miniaturized dystrophin polypeptide includes a nucleic acid sequence that is at least about 60%, at least about 70%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99% or about 100% identical to the sequence of SEQ ID NO: 145, wherein the miniaturized dystrophin polypeptide, when expressed as a nucleotide sequence, has at least one dystrophin activity. In some embodiments, the nucleotide sequence encoding the miniaturized dystrophin polypeptide includes a nucleic acid sequence that is at least about 60%, at least about 70%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99% or about 100% identical to the sequence of SEQ ID NO: 146, wherein the miniaturized dystrophin polypeptide, when expressed as a nucleotide sequence, has at least one dystrophin activity. In some embodiments, the nucleotide sequence encoding the miniaturized dystrophin polypeptide includes a nucleic acid sequence that is at least about 60%, at least about 70%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99% or about 100% identical to the sequence of SEQ ID NO: 147, wherein the miniaturized dystrophin polypeptide, when expressed as a nucleotide sequence, has at least one dystrophin activity. In some embodiments, the nucleotide sequence encoding the miniaturized dystrophin polypeptide includes a nucleic acid sequence that is at least about 60%, at least about 70%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99% or about 100% identical to the sequence of SEQ ID NO: 148, wherein the miniaturized dystrophin polypeptide, when expressed as a nucleotide sequence, has at least one dystrophin activity. In some embodiments, the nucleotide sequence encoding the miniaturized dystrophin polypeptide includes a nucleic acid sequence that is at least about 60%, at least about 70%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99% or about 100% identical to the sequence of SEQ ID NO: 149, wherein the miniaturized dystrophin polypeptide, when expressed as a nucleotide sequence, has at least one dystrophin activity.

5.3.2. Линкер5.3.2. Linker

В данном документе также обеспечена аминокислотная последовательность или нуклеотидная последовательность, кодирующая аминокислотную последовательность. В некоторых вариантах осуществления настоящее изобретение относится к аминокислотной последовательности, кодируемой нуклеотидной последовательностью, которая по меньшей мере на около 60%, по меньшей мере на около 70%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 100, где аминокислотная последовательность включает SEQ ID NO: 75 (IHTVREE TMMVMTEDMP LEI). В некоторых вариантах осуществления настоящее изобретение относится к аминокислотной последовательности, кодируемой нуклеотидной последовательностью, которая по меньшей мере на около 60%, по меньшей мере на около 70%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на околоAlso provided herein is an amino acid sequence or a nucleotide sequence encoding an amino acid sequence. In some embodiments, the present invention provides an amino acid sequence encoded by a nucleotide sequence that is at least about 60%, at least about 70%, at least about 80%, at least about 85%, at least at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99% or about 100% identical to the sequence of SEQ ID NO: 100, where the amino acid sequence includes SEQ ID NO: 75 (IHTVREE TMMVMTEDMP LEI). In some embodiments, the present invention provides an amino acid sequence encoded by a nucleotide sequence that is at least about 60%, at least about 70%, at least about 80%, at least about 85%, at least at least about 90%, at least about 95%, at least about

- 92 046419- 92 046419

96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 99-100 в комбинации, где аминокислотная последовательность включает SEQ ID NO: 74-75 в комбинации (SEAQIHTVREE TMMVMTEDMP LEI).96%, at least about 97%, at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 99-100 in combination, wherein the amino acid sequence includes SEQ ID NO : 74-75 in combination (SEAQIHTVREE TMMVMTEDMP LEI).

В некоторых вариантах осуществления молекула нуклеиновой кислоты содержит нуклеотидную последовательность, которая кодирует аминокислотную последовательность, содержащую последовательность SEQ ID NO: 75 (IHTVREE TMMVMTEDMP LEI), где молекула нуклеиновой кислоты по меньшей мере на около 80%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 100 (ATCCACCGTGCGGGAAGAGACAATGATGGTCATGACAGAGGACATGCCCCTGGA ААТС).In some embodiments, the nucleic acid molecule comprises a nucleotide sequence that encodes an amino acid sequence comprising the sequence of SEQ ID NO: 75 (IHTVREE TMMVMTEDMP LEI), wherein the nucleic acid molecule is at least about 80%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 100 (ATCCACCGTGCGGGAAGAGACAATGATGGTCATGACAGAGGACATGCCCCTGGA AATC).

В некоторых вариантах осуществления аминокислотная последовательность может использоваться в качестве линкера, соединяющего один или несколько доменов дистрофина. В некоторых вариантах осуществления линкер соединяет первый домен дистрофина и второй домен дистрофина. В некоторых вариантах осуществления первый и второй домен дистрофина, которые могут быть соединены, представляют собой домен R1 и домен R16. В других вариантах осуществления первый и второй домен дистрофина, которые могут быть соединены, представляют собой домен R3 и домен R16. В других вариантах осуществления первый и второй домен дистрофина, которые могут быть соединены, представляют собой домен Н2 и домен R16.In some embodiments, the amino acid sequence may be used as a linker connecting one or more dystrophin domains. In some embodiments, the linker connects the first dystrophin domain and the second dystrophin domain. In some embodiments, the first and second dystrophin domains that can be joined are an R1 domain and an R16 domain. In other embodiments, the first and second dystrophin domains that may be joined are an R3 domain and an R16 domain. In other embodiments, the first and second dystrophin domains that may be joined are an H2 domain and an R16 domain.

В некоторых вариантах осуществления изобретение включает молекулу нуклеиновой кислоты, содержащую нуклеотидную последовательность, которая по меньшей мере на около 60%, по меньшей мере на около 70%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 99 (AGTGAAGCTCAG).In some embodiments, the invention includes a nucleic acid molecule comprising a nucleotide sequence that is at least about 60%, at least about 70%, at least about 80%, at least about 85%, at least at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99% or about 100% identical sequence SEQ ID NO: 99 (AGTGAAGCTCAG).

В некоторых вариантах осуществления изобретение включает молекулу нуклеиновой кислоты, содержащую нуклеотидную последовательность, которая по меньшей мере на около 60%, по меньшей мере на около 70%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 100 (ATCCACACCGTGCGGGAAGAGACAATGATGGTCATGACAGAGGACATGCCCCTG GAAATC).In some embodiments, the invention includes a nucleic acid molecule comprising a nucleotide sequence that is at least about 60%, at least about 70%, at least about 80%, at least about 85%, at least at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99% or about 100% identical sequence SEQ ID NO: 100 (ATCCACACCGTGCGGGAAGAGACAATGATGGTCATGACAGAGGACATGCCCCTG GAAATC).

В некоторых вариантах осуществления изобретение включает молекулу нуклеиновой кислоты, содержащую нуклеотидную последовательность, которая кодирует аминокислотную нуклеотидную последовательность, которая по меньшей мере на около 70%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности SEQ ID NO: 99 и 100 в комбинации, (AGTGAAGCTCAGATCCACACCGTGCGGGAAGAGACAATGATGGTCATGACAGA ACATGCCCCTGGAAATC).In some embodiments, the invention includes a nucleic acid molecule comprising a nucleotide sequence that encodes an amino acid nucleotide sequence that is at least about 70%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%, or about 100% identical to the sequence of SEQ ID NO: 99 and 100 in combination, (AGTGAAGCTCAGATCCACACCGTGCGGGAAGAGACAATGATGGTCATGACAGA ACATGCCCCTGGAAATC).

В некоторых вариантах осуществления линкер помещен в полипептид миниатюризированного дистрофина, описанный в данном документе, путем соединения двух доменов полипептида миниатюризированного дистрофина (например, доменов Н2 и R16). В некоторых вариантах осуществления линкер расположен между доменами Н2 и R16 в полипептиде миниатюризированного дистрофина, содержащем ABD1-H1-R1-R3-H2-L-R16-R17-R24-H4-CR-C конц, где ABD1 представляет собой актин-связывающий домен 1, H1 представляет собой шарнирный 1 домен, R1 представляет собой домен спектринового повтора 1, R3 представляет собой домен спектринового повтора 3, Н2 представляет собой шарнирный 2 домен, L представляет собой линкер, например, SEQ ID NO: 74 или SEQ ID NO: 75 (или оба в комбинации) (или последовательность, которая по меньшей мере на около 60%, по меньшей мере на около 70%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична данным последовательностям), R16 представляет собой домен спектринового повтора 16, R17 представляет собой домен спектринового повтора 17, R24 представляет собой домен спектрина 24, Н4 представляет собой шарнирный 4 домен, CR представляет собой богатый цистеином домен и С-конц представляет собой необязательный С-концевой домен (или его часть). Настоящее изобретение также обеспечивает линкер, содержащий IHTVREETMMVMTEDMPLEI (SEQ ID NO: 84). В некоторых вариантах осуществления линкер, содержащий последовательность, приведенную в SEQ ID NO: 75 (IHTVREETMMVMTEDMPLEI) (или последовательность, которая по меньшей мере на около 60%, по меньшей мере на около 70%, по меньшей мере на около 80%, по меньшей мере на около 85%, по меньшей мере на около 90%, по меньшей мере на около 95%, по меньшей мере на около 96%, по меньшей мере на около 97%, по меньшей мере на около 98%, по меньшей мере на около 99% или на около 100% идентична последовательности, приведенной в SEQ ID NO: 84 (IHTVREETMMVMTEDMPLEI)), помещают в описанный в данном документеIn some embodiments, a linker is placed into the miniaturized dystrophin polypeptide described herein by connecting two domains of the miniaturized dystrophin polypeptide (eg, the H2 and R16 domains). In some embodiments, the linker is located between the H2 and R16 domains in a miniaturized dystrophin polypeptide comprising ABD1-H1-R1-R3-H2-L-R16-R17-R24-H4-CR-C conc, where ABD1 is an actin binding domain 1, H1 is a hinge 1 domain, R1 is a spectrin repeat domain 1, R3 is a spectrin repeat domain 3, H2 is a hinge 2 domain, L is a linker, e.g., SEQ ID NO: 74 or SEQ ID NO: 75 (or both in combination) (or a sequence that is at least about 60%, at least about 70%, at least about 80%, at least about 85%, at least about 90% , at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99%, or about 100% identical to these sequences), R16 is the spectrin repeat domain 16, R17 is the spectrin repeat domain 17, R24 is the spectrin domain 24, H4 is the hinge 4 domain, CR is the cysteine-rich domain, and C-terminal is the optional C-terminal domain (or its Part). The present invention also provides a linker containing IHTVREETMMVMTEDMPLEI (SEQ ID NO: 84). In some embodiments, a linker comprising the sequence set forth in SEQ ID NO: 75 (IHTVREETMMVMTEDMPLEI) (or a sequence that is at least about 60%, at least about 70%, at least about 80%, at least at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about about 99% or about 100% identical to the sequence shown in SEQ ID NO: 84 (IHTVREETMMVMTEDMPLEI)), placed in the described herein

- 93 046419 полипептид миниатюризированного дистрофина путем соединения двух доменов полипептида миниатюризированного дистрофина (например, доменов R1 и R16). В некоторых вариантах осуществления линкер расположен между доменами R1 и R16 в полипептиде миниатюризированного дистрофина, содержащем ABD1-H1-R1-L-R16-R17-H3-R23-R24-H4-CR-C конц, где ABD1 представляет собой актинсвязывающий домен 1, H1 представляет собой шарнирный 1 домен, R1 представляет собой домен спектринового повтора 1, L представляет собой линкер, например, SEQ ID NO: 84, R16 представляет собой домен спектринового повтора 16, R17 представляет собой домен спектринового повтора 17, Н3 представляет собой шарнирный 3 домен, R23 представляет собой домен спектрина 23, R24 представляет собой домен спектрина 24, Н4 представляет собой шарнирный домен 4, CR представляет собой богатый цистеином домен и С-конц представляет собой С-концевой домен (или его часть).- 93 046419 miniaturized dystrophin polypeptide by joining two miniaturized dystrophin polypeptide domains (eg, R1 and R16 domains). In some embodiments, the linker is located between the R1 and R16 domains in a miniaturized dystrophin polypeptide comprising ABD1-H1-R1-L-R16-R17-H3-R23-R24-H4-CR-C conc, where ABD1 is actin binding domain 1, H1 is hinge 1 domain, R1 is spectrin repeat domain 1, L is linker, e.g. SEQ ID NO: 84, R16 is spectrin repeat domain 16, R17 is spectrin repeat domain 17, H3 is hinge 3 domain , R23 is the spectrin domain 23, R24 is the spectrin domain 24, H4 is the hinge domain 4, CR is the cysteine-rich domain, and C-terminal is the C-terminal domain (or part thereof).

5.3.3. Некодирующие полинуклеотиды5.3.3. Non-coding polynucleotides

В некоторых аспектах в данном документе обеспечены молекулы нуклеиновой кислоты, например, ДНК или РНК, содержащие нуклеотидную последовательность, кодирующую полипептид миниатюризированного дистрофина.In some aspects, provided herein are nucleic acid molecules, such as DNA or RNA, comprising a nucleotide sequence encoding a miniaturized dystrophin polypeptide.

В некоторых вариантах осуществления описанные в данном документе молекулы нуклеиновой кислоты содержат некодирующие компоненты. В некоторых вариантах осуществления описанные в данном документе молекулы нуклеиновой кислоты содержат промоторы. Некоторые служащие примерами регуляторные последовательности для экспрессии в клетках-хозяевах млекопитающих включают вирусные элементы, которые обеспечивают высокие уровни экспрессии белков в клетках млекопитающих, такие как промоторы и/или энхансеры, полученные от цитомегаловируса (CMV), вакуолизирующего обезьяньего вируса 40 (SV40), аденовируса (например, аденовирусный основной поздний промотор (AdMLP)) и вируса полиомы. В качестве альтернативы, могут применяться невирусные регуляторные последовательности, такие как промотор убиквитина или промотор бета-глобина. Дополнительно, регуляторные элементы, состоящие из последовательностей из других источников, такие как промоторная система SRa, которая содержит последовательности из раннего промотора SV40 и длинного концевого повтора вируса Т-клеточной лейкемии 1 типа (Takebe, Y. et al. (1988) Mol. Cell. Biol. 8: 466-472). В некоторых вариантах осуществления регуляторная последовательность содержит тканеспецифический промотор. В некоторых вариантах осуществления тканеспецифический промотор управляет экспрессией интересующего гена в ткани, выбранной из группы, состоящей из сердца, печени, легких, глаз, нервной системы, лимфатической системы, центральной н нервной системы, нервных клеток, мышечных и стволовых клеток. В некоторых вариантах осуществления промоторы, раскрытые в данном документе, представляют собой тканеспецифические промоторы. В некоторых вариантах осуществления промотор управляет экспрессией терапевтического белка в гепатоцитах, мышечных клетках, эндотелиальных клетках, синусоидальных клетках или нейрональных клетках или любой их комбинации. В некоторых вариантах осуществления промотор выбран из группы, состоящей из промотора гена синапсина 1, промотора тиретина мыши (mTTR), промотора эндогенного фактора VIII человека (F8), промотора альфа-1антитрипсина человека (hAAT), минимального промотора человеческого альбумина, промотора мышиного альбумина, промотора тристетрапролина (ТТР), промотора CASI, промотора CAG, промотора цитомегаловируса (CMV), промотора а1-антитрипсина (ААТ), промотора мышечной креатинкиназы (MCK), промотора тяжелой цепи миозина альфа (аМНС), промотора миоглобина (MB), промотора десмина (DES), промотора SPc5-12, промотора 2R5Sc5-12, промотора dMCK, промотора tMCK, промотора а-синуклеина и промотора фосфоглицераткиназы (PGK).In some embodiments, the nucleic acid molecules described herein contain non-coding components. In some embodiments, the nucleic acid molecules described herein comprise promoters. Some exemplary regulatory sequences for expression in mammalian host cells include viral elements that mediate high levels of protein expression in mammalian cells, such as promoters and/or enhancers derived from cytomegalovirus (CMV), simian vacuolating virus 40 (SV40), adenovirus (eg, adenoviral major late promoter (AdMLP)) and polyoma virus. Alternatively, non-viral regulatory sequences such as the ubiquitin promoter or the beta globin promoter may be used. Additionally, regulatory elements consisting of sequences from other sources, such as the SRa promoter system, which contains sequences from the SV40 early promoter and T-cell leukemia virus type 1 long terminal repeat (Takebe, Y. et al. (1988) Mol. Cell Biol 8: 466-472). In some embodiments, the regulatory sequence comprises a tissue-specific promoter. In some embodiments, a tissue-specific promoter drives expression of a gene of interest in a tissue selected from the group consisting of heart, liver, lung, eye, nervous system, lymphatic system, central nervous system, nerve cells, muscle and stem cells. In some embodiments, the promoters disclosed herein are tissue-specific promoters. In some embodiments, the promoter drives expression of the therapeutic protein in hepatocytes, muscle cells, endothelial cells, sinusoidal cells or neuronal cells, or any combination thereof. In some embodiments, the promoter is selected from the group consisting of a synapsin 1 gene promoter, a mouse thyretin promoter (mTTR), a human endogenous factor VIII (F8) promoter, a human alpha-1 antitrypsin (hAAT) promoter, a minimal human albumin promoter, a murine albumin promoter, tristetraproline (TTP) promoter, CASI promoter, CAG promoter, cytomegalovirus (CMV) promoter, α1-antitrypsin (AAT) promoter, muscle creatine kinase (MCK) promoter, alpha myosin heavy chain (aMHC) promoter, myoglobin (MB) promoter, desmin promoter (DES), SPc5-12 promoter, 2R5Sc5-12 promoter, dMCK promoter, tMCK promoter, α-synuclein promoter and phosphoglycerate kinase (PGK) promoter.

В некоторых вариантах осуществления описанные в данном документе молекулы нуклеиновой кислоты содержат интронную последовательность. В некоторых вариантах осуществления интронная последовательность расположена в направлении 5' от нуклеотидной последовательности, кодирующей полипептид миниатюризированного дистрофина. В некоторых вариантах осуществления интронная последовательность расположена в направлении 3' от промотора. В некоторых вариантах осуществления интронная последовательность включает синтетическую интронную последовательность.In some embodiments, the nucleic acid molecules described herein contain an intronic sequence. In some embodiments, the intronic sequence is located 5' from the nucleotide sequence encoding the miniaturized dystrophin polypeptide. In some embodiments, the intronic sequence is located 3' from the promoter. In some embodiments, the intronic sequence includes a synthetic intronic sequence.

В некоторых вариантах осуществления описанные в данном документе молекулы нуклеиновой кислоты содержат посттранскрипционный регуляторный элемент. В некоторых вариантах осуществления посттранскрипционный регуляторный элемент расположен в направлении 3' от нуклеотидной последовательности, кодирующей полипептид миниатюризированного дистрофина. В некоторых вариантах осуществления посттранскрипционный регуляторный элемент содержит мутантный посттранскрипционный регуляторный элемент вируса гепатита сурка (WPRE), сайт связывания микроРНК или целевую последовательность ядерной ДНК, или любую их комбинацию.In some embodiments, the nucleic acid molecules described herein comprise a post-transcriptional regulatory element. In some embodiments, the post-transcriptional regulatory element is located 3' of the nucleotide sequence encoding the miniaturized dystrophin polypeptide. In some embodiments, the post-transcriptional regulatory element comprises a mutant hepatitis virus post-transcriptional regulatory element (WPRE), a miRNA binding site, or a target nuclear DNA sequence, or any combination thereof.

В некоторых вариантах осуществления молекулы нуклеиновой кислоты, раскрытые в данном документе, содержат 3rUTR-поли(А) хвостовую последовательность. В некоторых вариантах осуществления 3UTR-поли(А) хвостовая последовательность выбрана из группы, состоящей из поли(А) bGH, поли(А) актина, поли(А) гемоглобина и любой их комбинации. В некоторых вариантах осуществления 3'UTRполи(А) хвостовая последовательность включает поли(А) bGH.In some embodiments, the nucleic acid molecules disclosed herein contain a 3 r UTR poly(A) tail sequence. In some embodiments, the 3UTR poly(A) tail sequence is selected from the group consisting of bGH poly(A), actin poly(A), hemoglobin poly(A), and any combination thereof. In some embodiments, the 3'UTR poly(A) tail sequence includes a bGH poly(A).

В некоторых вариантах осуществления описанные в данном документе молекулы нуклеиновой киIn some embodiments, the nucleic acid molecules described herein

- 94 046419 слоты содержат энхансерную последовательность. В некоторых вариантах осуществления описанные в данном документе молекулы нуклеиновой кислоты содержат первый инвертированный концевой повтор (ITR) и/или второй ITR. В некоторых вариантах осуществления первый ITR и второй ITR идентичны. В некоторых вариантах осуществления первый ITR и/или второй ITR получены из аденоассоциированного вируса. В некоторых вариантах осуществления первый ITR получен из аденоассоциированного вируса и второй ITR получен из аденоассоциированного вируса.- 94 046419 slots contain an enhancer sequence. In some embodiments, the nucleic acid molecules described herein comprise a first inverted terminal repeat (ITR) and/or a second ITR. In some embodiments, the first ITR and the second ITR are identical. In some embodiments, the first ITR and/or the second ITR are derived from an adeno-associated virus. In some embodiments, the first ITR is derived from an adeno-associated virus and the second ITR is derived from an adeno-associated virus.

Далее признается, что молекула нуклеиновой кислоты может содержать дополнительные элементы, которые способствуют трансляции полипептида. Такие последовательности включают, например, последовательности Козак (Kozak), присоединенные к 5'-концу полипептида, кодирующего полинуклеотид. Консенсусная последовательность Козак представляет собой последовательность, которая встречается на эукариотической мРНК, которая играет роль в инициации процесса трансляции и имеет консенсус (gee)gccRccAUGG (SEQ ID NO: 150); где (1) строчная буква обозначает наиболее распространенное основание в позиции, где основание, тем не менее, может изменяться; (2) заглавные буквы указывают на высококонсервативные основания, то есть последовательность AUGG является постоянной или редко, если вообще, изменяется, за исключением кода неоднозначности IUPAC 'R', который указывает, что в данной позиции обычно наблюдается пурин (аденин или гуанин); и (3) последовательность в скобках ((gee)) имеет неопределенное значение.It is further recognized that the nucleic acid molecule may contain additional elements that facilitate translation of the polypeptide. Such sequences include, for example, Kozak sequences attached to the 5' end of a polypeptide encoding a polynucleotide. The Kozak consensus sequence is a sequence that occurs on eukaryotic mRNA that plays a role in initiating the translation process and has the consensus (gee)gccRccAUGG (SEQ ID NO: 150); where (1) a lowercase letter denotes the most common base in a position where the base may, however, vary; (2) capital letters indicate highly conserved bases, that is, the AUGG sequence is constant or rarely, if at all, changes, except for the IUPAC ambiguity code 'R', which indicates that a purine (adenine or guanine) is commonly observed at that position; and (3) the sequence in parentheses ((gee)) has an undefined meaning.

В одном неограничивающем варианте осуществления молекула нуклеиновой кислоты включает функциональный вариант последовательности Козак или его фрагмент. Функциональный вариант последовательности Козак или его фрагмент сохранит способность увеличивать трансляцию белка по сравнению с уровнем трансляции с последовательности, лишенной лидерной последовательности. Такой функциональный фрагмент может содержать по меньшей мере 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 30, 40 непрерывных нуклеотидов последовательности Козак или последовательность, приведенную в SEQ ID NO: 150 или SEQ ID NO: 151 (gccaccATGG). Альтернативно, функциональный вариант может включать по меньшей мере 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99% идентичности последовательности с последовательностью Козак или последовательностью, приведенной в SEQ ID NO: 150 или SEQ ID NO: 151.In one non-limiting embodiment, the nucleic acid molecule includes a functional variant of the Kozak sequence or fragment thereof. A functional variant of the Kozak sequence or fragment thereof will retain the ability to increase protein translation relative to the level of translation from the sequence lacking the leader sequence. Such a functional fragment may contain at least 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 30, 40 contiguous Kozak sequence nucleotides or a sequence given in SEQ ID NO: 150 or SEQ ID NO: 151 (gccaccATGG). Alternatively, the functional variant may include at least 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, or 99% sequence identity to the Kozak sequence or sequence given in SEQ ID NO: 150 or SEQ ID NO: 151.

5.3.4. Гетерологичные фрагменты5.3.4. Heterologous fragments

В некоторых вариантах осуществления полипептиды по настоящему изобретению могут дополнительно содержать дополнительный элемент, например, гетерологичный фрагмент. Такие элементы могут способствовать экспрессии полипептида, способствовать секреции полипептида, улучшать стабильность полипептида, обеспечивать более эффективную очистку полипептида и/или модулировать активность полипептида. В некоторых вариантах осуществления гетерологичный фрагмент представляет собой фрагмент полипептида. В других вариантах осуществления гетерологичный фрагмент представляет собой неполипептидный фрагмент. В некоторых вариантах осуществления полипептид содержит гетерологичный фрагмент, слитый с полипептидом.In some embodiments, the polypeptides of the present invention may further comprise an additional element, such as a heterologous fragment. Such elements may promote expression of the polypeptide, promote secretion of the polypeptide, improve stability of the polypeptide, provide more efficient purification of the polypeptide, and/or modulate the activity of the polypeptide. In some embodiments, the heterologous fragment is a polypeptide fragment. In other embodiments, the heterologous fragment is a non-polypeptide fragment. In some embodiments, the polypeptide contains a heterologous fragment fused to the polypeptide.

В некоторых вариантах осуществления настоящего изобретения полипептид, описанный в данном документе, включает один или несколько дополнительных гетерологичных фрагментов. В некоторых вариантах осуществления гетерологичные фрагменты представляют собой фрагменты, увеличивающие период полужизни. В некоторых вариантах осуществления гетерологичный фрагмент включает альбумин или его фрагмент, Fc-область иммуноглобулина, С-концевой пептид (СТР) β-субъединицы хорионического гонадотропина человека, последовательность PAS, последовательность НАР, трансферрин или его фрагмент, или альбумин-связывающий фрагмент, или его производное, или любую их комбинацию.In some embodiments of the present invention, the polypeptide described herein includes one or more additional heterologous fragments. In some embodiments, the heterologous fragments are half-life extending fragments. In some embodiments, the heterologous fragment includes albumin or a fragment thereof, an immunoglobulin Fc region, a human chorionic gonadotropin β-subunit C-terminal peptide (CTP), a PAS sequence, a HAP sequence, transferrin or a fragment thereof, or an albumin-binding fragment, or derivative, or any combination thereof.

В некоторых вариантах осуществления полипептиды, раскрытые в данном документе, содержат один или несколько дополнительных гетерологичных фрагментов. В некоторых вариантах осуществления гетерологичные фрагменты представляют собой фрагменты, увеличивающие период полужизни. В некоторых вариантах осуществления гетерологичный фрагмент включает альбумин, константную область иммуноглобулина или ее часть, иммуноглобулин-связывающий полипептид, иммуноглобулин G (IgG), альбумин-связывающий полипептид (АВР), фрагмент PASилирования, фрагмент HESилирования, XTEN, фрагмент ПЭГилирования или область Fc, или любую их комбинацию.In some embodiments, the polypeptides disclosed herein contain one or more additional heterologous fragments. In some embodiments, the heterologous fragments are half-life extending fragments. In some embodiments, the heterologous fragment includes albumin, an immunoglobulin constant region or a portion thereof, an immunoglobulin binding polypeptide, immunoglobulin G (IgG), an albumin binding polypeptide (ABP), a PASylation fragment, a HESylation fragment, XTEN, a PEGylation fragment or an Fc region, or any combination of them.

5.4. Клетки5.4. Cells

В определенных аспектах в данном документе обеспечены клетки (например, клетки-хозяева), экспрессирующие (например, рекомбинантно) белки, описанные в данном документе, и векторы экспрессии, содержащие нуклеотиды, кодирующие белки, описанные в данном документе.In certain aspects, provided herein are cells (eg, host cells) expressing (eg, recombinantly) the proteins described herein, and expression vectors containing nucleotides encoding the proteins described herein.

В некоторых вариантах осуществления клетка-хозяин содержит молекулы нуклеиновой кислоты, описанные в данном документе. В некоторых вариантах осуществления клетка-хозяин содержит векторы, описанные в данном документе.In some embodiments, the host cell contains nucleic acid molecules described herein. In some embodiments, the host cell contains the vectors described herein.

В некоторых вариантах осуществления клетка-хозяин представляет собой эукариотическую клетку. В некоторых вариантах осуществления клетка-хозяин выбрана из группы, состоящей из клетки млекопитающего, клетки насекомого, дрожжевой клетки, трансгенной клетки млекопитающего и клетки растения. В некоторых вариантах осуществления клетка-хозяин представляет собой прокариотическую клетку. В некоторых вариантах осуществления прокариотическая клетка представляет собой бактериальнуюIn some embodiments, the host cell is a eukaryotic cell. In some embodiments, the host cell is selected from the group consisting of a mammalian cell, an insect cell, a yeast cell, a transgenic mammalian cell, and a plant cell. In some embodiments, the host cell is a prokaryotic cell. In some embodiments, the prokaryotic cell is a bacterial

- 95 046419 клетку.- 95 046419 cell.

В некоторых вариантах осуществления клетка-хозяин представляет собой клетку млекопитающего. Такие клетки-хозяева млекопитающих включают, но не ограничиваются ими, клетки СНО, VERO, BHK, Hela, MDCK, HEK293, NIH 3Т3, W138, ВТ483, Hs578T, HTB2, ВТ2О и T47D, NS0 (линия клеток миеломы мыши, которая не продуцирует эндогенно цепи иммуноглобулина), CRL7O3O, COS (например, COS1 или COS), PER.C6, VERO, HsS78Bst, HEK-293T, HepG2, SP210, R1.1, BW, LM, BSC1, BSC40, YB/20, BMT10, HBK, NSO, HT1080 и HsS78Bst.In some embodiments, the host cell is a mammalian cell. Such mammalian host cells include, but are not limited to, CHO, VERO, BHK, Hela, MDCK, HEK293, NIH 3T3, W138, BT483, Hs578T, HTB2, BT2O and T47D, NS0 cells (a mouse myeloma cell line that does not produce endogenous immunoglobulin chains), CRL7O3O, COS (eg COS1 or COS), PER.C6, VERO, HsS78Bst, HEK-293T, HepG2, SP210, R1.1, BW, LM, BSC1, BSC40, YB/20, BMT10, HBK, NSO, HT1080 and HsS78Bst.

5.5. Векторы.5.5. Vectors.

5.5.1. Аденоассоциированный вирус (AAV).5.5.1. Adeno-associated virus (AAV).

5.5.1.1. Обзор5.5.1.1. Review

В данном документе обеспечиваются векторы (например, векторы экспрессии), содержащие молекулы нуклеиновых кислот, содержащие нуклеотидные последовательности, кодирующие миниатюризированный белок дистрофина, для рекомбинантной экспрессии в клетках-хозяевах и клетках, представляющих собой цель терапевтического вмешательства. Используемый в данном документе термин вектор предназначен для обозначения молекулы нуклеиновой кислоты, способной переносить другую нуклеиновую кислоту, с которой она связана; или объекта, содержащего такую молекулу нуклеиновой кислоты, способную переносить другую нуклеиновую кислоту. Одним типом вектора является плазмида, которая обозначает кольцевую петлю двухцепочечной ДНК, в которую можно лигировать дополнительные сегменты ДНК. Другим типом вектора является вирусный вектор, в котором дополнительные сегменты ДНК можно лигировать в вирусный геном. Конкретные векторы или полинуклеотиды, которые являются частью векторов, являются способными к автономной репликации в клетке-хозяине, в которую они введены (например, бактериальные векторы, обладающие бактериальной точкой начала репликации, и эписомальные векторы млекопитающих). Другие векторы (например, не эписомальные векторы млекопитающих) можно интегрировать в геном клетки-хозяина при введении в клетку-хозяина и, таким образом, они реплицируются вместе с геномом хозяина. Кроме того, конкретные векторы способны управлять экспрессией генов, с которыми они функционально связаны. Такие векторы обозначены в данном документе как рекомбинантные экспрессионные векторы (или просто экспрессионные векторы). Как правило, экспрессионные векторы для использования в способах рекомбинантной ДНК часто присутствуют в форме плазмид. В настоящем описании термины плазмида и вектор можно иногда использовать как взаимозаменяемые, в зависимости от контекста, так как плазмида является наиболее общепринятой формой вектора. Однако в данном документе также раскрыты другие формы экспрессионных векторов, такие как вирусные векторы (например, дефектные по репликации ретровирусы, аденовирусы и аденоассоциированные вирусы), которые выполняют эквивалентные функции. В некоторых вариантах осуществления раскрытые в данном документе полинуклеотиды экспрессируются с помощью аденоассоциированного вируса (AAV). AAV представляет собой одноцепочечный ДНК-вирус без оболочки, относящийся к семейству Parvoviridae. В отличие от большинства других членов семейства Parvoviridae, AAV является дефектным по репликации и способен эффективно реплицироваться только в присутствии вируса-помощника, такого как аденовирус или вирус герпеса. Впервые AAV был обнаружен в середине 1960-х годов как контаминант вирусных препаратов аденовируса. См. Atchison R W, Casto В С, HAMMON W M. Science. 149(3685), 754-756 (1965). С тех пор были разработаны более безопасные и более эффективные способы использования AAV в качестве вектора рекомбинантной ДНК. См., например, Hermonat P.L. and Muzyczka N. Proc Natl Acad Sci USA. 81(20), 6466-6470 (1984). 3. Laughlin C.A., et al. Gene, 23(1), 65-73 (1983). Matsushita Т., et al. Gene Ther. 5(7), 938-945 (1998). Xiao X., et al. Journal of Virology. 72(3), 2224-2232 (1998). Было показано, что небольшое количество геномов AAV интегрируется в хромосому хозяина. См. Cheung AK, Hoggan MD, Hauswirth WW, et al. Integration of the adeno-associated vims genome into cellular DNA in latently infected human detroit 6 cells. J Virol 1980; 33:739-748. AAV иммунологически отличается от любого известного аденовирусного антигена. Капсид AAV содержит геном одноцепочечной ДНК (оцДНК). См. Rose JA, Berns KI, Hoggan MD, et al. Proc Natl Acad Sci USA 1969;64:863-869.Provided herein are vectors (eg, expression vectors) containing nucleic acid molecules containing nucleotide sequences encoding miniaturized dystrophin protein for recombinant expression in host cells and cells that are the target of therapeutic intervention. As used herein, the term vector is intended to mean a nucleic acid molecule capable of carrying another nucleic acid to which it is linked; or an object containing such a nucleic acid molecule capable of carrying another nucleic acid. One type of vector is a plasmid, which designates a circular loop of double-stranded DNA into which additional DNA segments can be ligated. Another type of vector is a viral vector, in which additional DNA segments can be ligated into the viral genome. Particular vectors or polynucleotides that are part of vectors are capable of autonomous replication in the host cell into which they are introduced (eg, bacterial vectors having a bacterial origin of replication and mammalian episomal vectors). Other vectors (eg, non-episomal mammalian vectors) can be integrated into the host cell genome upon introduction into the host cell and thus replicate along with the host genome. In addition, specific vectors are capable of controlling the expression of genes to which they are functionally linked. Such vectors are referred to herein as recombinant expression vectors (or simply expression vectors). Typically, expression vectors for use in recombinant DNA techniques are often present in the form of plasmids. As used herein, the terms plasmid and vector may sometimes be used interchangeably, depending on the context, since plasmid is the most common form of vector. However, other forms of expression vectors are also disclosed herein, such as viral vectors (eg, replication-defective retroviruses, adenoviruses, and adeno-associated viruses) that perform equivalent functions. In some embodiments, polynucleotides disclosed herein are expressed by an adeno-associated virus (AAV). AAV is a non-enveloped, single-stranded DNA virus belonging to the family Parvoviridae. Unlike most other members of the Parvoviridae family, AAV is replication defective and is only able to replicate efficiently in the presence of a helper virus such as an adenovirus or herpes virus. AAV was first discovered in the mid-1960s as a contaminant of adenovirus viral preparations. See Atchison R W, Casto V S, HAMMON W M. Science. 149(3685), 754-756 (1965). Since then, safer and more efficient ways to use AAV as a recombinant DNA vector have been developed. See, for example, Hermonat P.L. and Muzyczka N. Proc Natl Acad Sci USA. 81(20), 6466-6470 (1984). 3. Laughlin C.A., et al. Gene, 23(1), 65-73 (1983). Matsushita T., et al. Gene Ther. 5(7), 938-945 (1998). Xiao X., et al. Journal of Virology. 72(3), 2224-2232 (1998). A small number of AAV genomes have been shown to integrate into the host chromosome. See Cheung AK, Hoggan MD, Hauswirth WW, et al. Integration of the adeno-associated vims genome into cellular DNA in latently infected human Detroit 6 cells. J Virol 1980; 33:739-748. AAV is immunologically distinct from any known adenoviral antigen. The AAV capsid contains a single-stranded DNA (ssDNA) genome. See Rose JA, Berns KI, Hoggan MD, et al. Proc Natl Acad Sci USA 1969;64:863-869.

AAV имеет одноцепочечный ДНК-геном размером 4,7 т.п.н., кодирующий ген репликации (rep) и гены капсидирующих белков (cap), фланкированные двумя инвертированными концевыми повторами (ITR). Он преимущественно не интегрируется и образует стабильные эписомы в неделящейся ткани. Несмотря на высокую распространенность серотипа среди взрослого населения, AAV не был связан с какими-либо заболеваниями у человека. См. Goncalves, M. Virol. J. 2, 43 (2005). Стабильная экспрессия AAV в тканях, отсутствие патогенности и простота получения высоких титров сделали его очень привлекательным вектором и популярной платформой для переноса генов.AAV has a 4.7-kb single-stranded DNA genome encoding the replication gene (rep) and encapsidation protein (cap) genes flanked by two inverted terminal repeats (ITRs). It predominantly does not integrate and forms stable episomes in nondividing tissue. Despite its high seroprevalence in the adult population, AAV has not been associated with any disease in humans. See Gonçalves, M. Virol. J. 2, 43 (2005). AAV's stable tissue expression, lack of pathogenicity, and ease of obtaining high titers have made it a very attractive vector and popular platform for gene transfer.

Рекомбинантный AAV (rAAV) представляет собой генетически модифицированный AAV, в котором обычно часть генов rep и cap или все гены rep и cap заменены гетерологичными трансгенными последовательностями. Рекомбинантные AAV также могут запускать долговременную экспрессию трансгенов в постмитотических клетках, скорее всего, потому, что геном рекомбинантного AAV сохраняется в значительной степени в виде кольцевых эписом в ядре. Единственным цис-действующим элементом ДНК у rAAV, необходимым для продукции rAAV, являются инвертированные концевые повторы (ITR)Recombinant AAV (rAAV) is a genetically modified AAV in which typically part or all of the rep and cap genes are replaced with heterologous transgenic sequences. Recombinant AAVs can also drive long-term transgene expression in postmitotic cells, most likely because the recombinant AAV genome is retained largely as circular episomes in the nucleus. The only cis-acting DNA element in rAAV required for rAAV production is the inverted terminal repeats (ITRs).

- 96 046419- 96 046419

AAV, тогда как гены rep, cap и аденовирусные гены-помощники могут быть обеспечены в трансположении. Таким образом, в некоторых вариантах осуществления, раскрытых в данном документе, rAAV содержат только гетерологичную трансгенную ДНК, фланкированную ITR-последовательностями, и данный геном инкапсидирован внутри серотип-специфичного капсида AAV.AAV, while the rep, cap and adenoviral helper genes can be provided in transposition. Thus, in some embodiments disclosed herein, rAAVs contain only heterologous transgenic DNA flanked by ITR sequences and the genome is encapsidated within a serotype-specific AAV capsid.

AAV обладает уникальными признаками, которые делают его привлекательным в качестве векторной системы для доставки чужеродной ДНК в клетки. Инфекция клеток в культуре AAV, как правило, не является цитопатической, и естественное инфицирование людей и других животных протекает незаметно и бессимптомно. Более того, AAV инфицирует множество различных типов клеток млекопитающих, что дает возможность воздействовать на многие различные ткани in vivo. AAV также обладает дополнительными преимуществами, которые делают его особенно привлекательной вирусной системой для доставки генов, включая стимулирование иммунного ответа, который является относительно мягким по сравнению с другими формами доставки генов, и постоянную экспрессию как в делящихся, так и в покоящихся клетках на основе неинтегрирующейся, эписомальной векторной ДНК. Кроме того, AAV выдерживает условия, используемые для инактивации аденовируса (от 56 до 65°С в течение нескольких часов), что делает холодную консервацию вакцин на основе rAAV менее критичной.AAV has unique features that make it attractive as a vector system for delivering foreign DNA into cells. Infection of cells in culture by AAV is generally not cytopathic, and natural infection in humans and other animals is silent and asymptomatic. Moreover, AAV infects many different mammalian cell types, allowing it to target many different tissues in vivo. AAV also has additional advantages that make it a particularly attractive viral gene delivery system, including stimulation of an immune response that is relatively mild compared to other forms of gene delivery, and persistent expression in both dividing and quiescent cells on a nonintegrating, nonintegrating basis. episomal vector DNA. In addition, AAV withstands the conditions used to inactivate adenovirus (56 to 65°C for several hours), making cold preservation of rAAV vaccines less critical.

Репликация вирусной ДНК не требуется для интеграции в геном клетки-хозяина, и, следовательно, для данного процесса не требуется вирус-помощник. Провирусный геном AAV является инфекционным подобно клонированной ДНК в плазмидах, что делает возможным создание рекомбинантных геномов. Более того, поскольку сигналы, управляющие репликацией, инкапсидацией и интеграцией генома AAV, содержатся в ITR генома AAV, внутренние приблизительно 4,7 т.п.н. генома (кодирующие белки репликации и структурные белки капсида, rep-cap) могут быть заменены чужеродной ДНК, такой как кассета экспрессии гена, содержащая промотор, представляющую интерес ДНК и сигнал полиаденилирования.Viral DNA replication is not required for integration into the host cell genome and therefore does not require a helper virus for this process. The AAV proviral genome is infectious like cloned DNA in plasmids, making the creation of recombinant genomes possible. Moreover, since the signals that control AAV genome replication, encapsidation, and integration are contained in the ITR of the AAV genome, the internal approximately 4.7 kb. genome (encoding replication proteins and structural capsid proteins, rep-cap) can be replaced by foreign DNA, such as a gene expression cassette containing a promoter, DNA of interest and a polyadenylation signal.

Векторы AAV могут включать дополнительные элементы, которые функционируют в цис- или транс-положении. В конкретных вариантах осуществления вектор AAV, который включает векторный геном, также имеет одну или несколько последовательностей инвертированных концевых повторов (ITR), которые фланкируют 5'- или 3'-конец донорной последовательности; элемент контроля экспрессии, который управляет транскрипцией (например, промотор или энхансер) донорной последовательности, такой как конститутивный или регулируемый элемент управления, или элемент контроля тканеспецифической экспрессии; последовательность интрона, полинуклеотидная последовательностьнаполнитель; и/или полиадениновая последовательность, расположенная на 3' конце донорной последовательности. В некоторых вариантах осуществления AAV реплицируется с помощью вируса-помощника. Ряд таких вирусов-помощников для AAV известны из уровня техники, включая аденовирусы, герпевирусы и поксвирусы, такие как вирус коровьей оспы. Аденовирусы охватывают много различных подгрупп, хотя обычно используется аденовирус типа 5, подгруппы С. Многочисленные аденовирусы человека, не относящихся к человеку млекопитающих и птиц известны и доступны из депозитариев, таких как АТСС. Вирусы семейства герпеса включают, например, вирусы герпеса простого (HSV) и вирусы ЭпштейнБарра (EBV), а также цитомегаловирусы (CMV) и вирусы псевдобешенства (PRV); которые также доступны из депозитариев, таких как АТСС.AAV vectors may include additional elements that function in cis or trans. In specific embodiments, the AAV vector that includes the vector genome also has one or more inverted terminal repeat (ITR) sequences that flank the 5' or 3' end of the donor sequence; an expression control element that controls transcription (eg, a promoter or enhancer) of the donor sequence, such as a constitutive or regulated control element, or a tissue-specific expression control element; intron sequence, filler polynucleotide sequence; and/or a polyadenine sequence located at the 3' end of the donor sequence. In some embodiments, the AAV is replicated by a helper virus. A number of such AAV helper viruses are known in the art, including adenoviruses, herpeviruses, and poxviruses such as vaccinia virus. Adenoviruses span many different subgroups, although adenovirus type 5, subgroup C is commonly used. Numerous human, non-human mammalian and avian adenoviruses are known and available from repositories such as ATCC. Viruses of the herpes family include, for example, herpes simplex viruses (HSV) and Epstein Barr viruses (EBV), as well as cytomegaloviruses (CMV) and pseudorabies viruses (PRV); which are also available from depositories such as ATCC.

Типичные векторы AAV включают последовательности капсидных белков любого из AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, RH10, Rh74 или AAV-2i8, или варианта капсидного белка AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, Rh10, Rh74 или AAV-2i8. Рекомбинантные векторы AAV по изобретению также включают AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, Rh10, Rh74 или AAV2i8 и их варианты. Конкретные варианты капсидных белков включают варианты капсидных белков AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, Rh10, Rh74 или AAV2i8, такие как последовательность капсидного белка с аминокислотной заменой, делецией или вставкой/добавлением. В одном варианте осуществления вектором AAV является AAV9.Typical AAV vectors include capsid protein sequences from any of AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, RH10, Rh74, or AAV-2i8, or a variant capsid protein of AAV1, AAV2, AAV3, AAV4 , AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, Rh10, Rh74 or AAV-2i8. Recombinant AAV vectors of the invention also include AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, Rh10, Rh74 or AAV2i8 and variants thereof. Specific capsid protein variants include AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, Rh10, Rh74, or AAV2i8 capsid protein variants, such as a capsid protein sequence with an amino acid substitution, deletion, or insertion/addition . In one embodiment, the AAV vector is AAV9.

В некоторых аспектах изобретение относится к AAV, обладающим различными способностями в отношении поражения тканей (например, тканевыми тропизмами). В некоторых вариантах осуществления капсидные полипептиды вариантов AAV дополнительно проявляют повышенную трансдукцию или тропизм в одном или нескольких типах стволовых клеток человека по сравнению с невариантными родительскими капсидными полипептидами. В некоторых вариантах осуществления типы стволовых клеток человека включают, но не ограничиваются ими, эмбриональные стволовые клетки, стволовые клетки взрослой ткани (т.е. соматические стволовые клетки), стволовые клетки костного мозга, клеткипредшественники, индуцированные плюрипотентные стволовые клетки и репрограммированные стволовые клетки. В некоторых вариантах осуществления взрослые стволовые клетки могут включать органоидные стволовые клетки (т.е. стволовые клетки, полученные из любого интересующего органа или системы органов в организме). В некоторых вариантах осуществления целевая ткань AAV представляет собой гонаду, диафрагму, сердце, желудок, печень, селезенку, поджелудочную железу, мышцы или почки. В некоторых вариантах осуществления AAV нацелен на органы тела, которые включают, но без ограничения, кожу, волосы, ногти, сенсорные рецепторы, потовую железу, сальные железы, кости, мышцы, головной мозг, спинной мозг, нерв, гипофиз, шишковидную железу, гипоталамус, щитовидную железу,In some aspects, the invention relates to AAVs having different tissue-infecting abilities (eg, tissue tropisms). In some embodiments, the AAV variant capsid polypeptides further exhibit increased transduction or tropism in one or more human stem cell types compared to the non-variant parental capsid polypeptides. In some embodiments, human stem cell types include, but are not limited to, embryonic stem cells, adult tissue stem cells (i.e., somatic stem cells), bone marrow stem cells, progenitor cells, induced pluripotent stem cells, and reprogrammed stem cells. In some embodiments, adult stem cells may include organoid stem cells (ie, stem cells derived from any organ or organ system of interest in the body). In some embodiments, the target AAV tissue is the gonad, diaphragm, heart, stomach, liver, spleen, pancreas, muscle, or kidney. In some embodiments, the AAV targets organs of the body, which include, but are not limited to, skin, hair, nails, sensory receptors, sweat gland, sebaceous glands, bone, muscle, brain, spinal cord, nerve, pituitary gland, pineal gland, hypothalamus , thyroid gland,

- 97 046419 паращитовидную железу, тимус, надпочечники, поджелудочную железу (островковую ткань), сердце, кровеносные сосуды, лимфатические узлы, лимфатические сосуды, тимус, селезенку, миндалины, нос, глотку, гортань, трахею, бронхи, легкие, рот, глотку, пищевод, желудок, тонкий кишечник, толстый кишечник, прямую кишку, анальный канал, зубы, слюнные железы, язык, печень, желчный пузырь, поджелудочную железу, аппендикс, почки, мочеточники, мочевой пузырь, уретру, яички, семявыносящий проток, мочеиспускательный канал, простату, половой член, мошонку, яичники, матку, маточные (фаллопиевы) трубы, влагалище, вульу и молочные железы (груди). Системы органов тела включают, но не ограничиваются ими, покровную систему, скелетную систему, мышечную систему, нервную систему, эндокринную систему, сердечно-сосудистую систему, лимфатическую систему, дыхательную систему, пищеварительную систему, мочевыделительную систему и репродуктивную систему. В некоторых вариантах осуществления трансдукция и/или тропизм AAV с вариантными полипептидами капсида увеличивается на около 5, около 10, около 15, около 20, около 25, около 30, около 35, около 40, около 45, около 50, около 55, около 60, 65, около 70, около 75, около 80, около 85, около 90, около 95, около 99 или около 100% по сравнению с AAV, имеющим невариантные полипептиды капсида. В некоторых вариантах осуществления трансдукция и/или тропизм увеличиваются от около 5 до около 80%, от около 10 до около 70%, от около 20 до около 60% или от около 30 до около 60%.- 97 046419 parathyroid gland, thymus, adrenal glands, pancreas (islet tissue), heart, blood vessels, lymph nodes, lymphatic vessels, thymus, spleen, tonsils, nose, pharynx, larynx, trachea, bronchi, lungs, mouth, pharynx, esophagus, stomach, small intestine, large intestine, rectum, anal canal, teeth, salivary glands, tongue, liver, gall bladder, pancreas, appendix, kidneys, ureters, bladder, urethra, testicles, vas deferens, urethra, prostate, penis, scrotum, ovaries, uterus, fallopian tubes, vagina, vulva and mammary glands (breasts). Organ systems of the body include, but are not limited to, the integumentary system, skeletal system, muscular system, nervous system, endocrine system, cardiovascular system, lymphatic system, respiratory system, digestive system, urinary system and reproductive system. In some embodiments, transduction and/or tropism of AAV with variant capsid polypeptides is increased by about 5, about 10, about 15, about 20, about 25, about 30, about 35, about 40, about 45, about 50, about 55, about 60, 65, about 70, about 75, about 80, about 85, about 90, about 95, about 99, or about 100% compared to AAV having non-variant capsid polypeptides. In some embodiments, transduction and/or tropism is increased from about 5 to about 80%, from about 10 to about 70%, from about 20 to about 60%, or from about 30 to about 60%.

5.5.1.2. Гены репликации, капсида и сборки AAV5.5.1.2. AAV replication, capsid and assembly genes

Одноцепочечный геном AAV включает три гена: rep (репликация, от слова Replication), cap (капсид, от слова Capsid) и аар (сборка, от слова Assembly). Данные три гена дают начало по меньшей мере девяти генным продуктам за счет использования трех промоторов, альтернативных сайтов старта трансляции и дифференциального сплайсинга.The single-stranded AAV genome includes three genes: rep (replication), cap (capsid), and aap (assembly). These three genes give rise to at least nine gene products through the use of three promoters, alternative translation start sites, and differential splicing.

Ген rep кодирует четыре белка (Rep78, Rep68, Rep52 и Rep40), которые необходимы для репликации и упаковки вирусного генома.The rep gene encodes four proteins (Rep78, Rep68, Rep52, and Rep40) that are required for replication and packaging of the viral genome.

Экспрессия гена cap приводит к образованию белков вирусного капсида (VP1; VP2; VP3), которые образуют внешнюю оболочку капсида, которая защищает вирусный геном, а также активно участвует в связывании клеток и интернализации. Подсчитано, что вирусная оболочка состоит из 60 белков, образующих икосаэдрическую структуру. Ген аар кодирует активирующий сборку белок (ААР) в альтернативной рамке считывания, перекрывающей ген cap. Считается, что данный ядерный белок обеспечивает функцию каркаса для сборки капсида и играет роль в ядрышковой локализации белков VP в некоторых серотипах AAV.Expression of the cap gene results in the formation of viral capsid proteins (VP1; VP2; VP3), which form the outer capsid shell that protects the viral genome and is also actively involved in cell binding and internalization. It is estimated that the viral envelope consists of 60 proteins that form an icosahedral structure. The aap gene encodes assembly-activating protein (AAP) in an alternative reading frame overlapping the cap gene. This nuclear protein is thought to provide a scaffolding function for capsid assembly and to play a role in the nucleolar localization of VP proteins in some AAV serotypes.

В некоторых вариантах осуществления один или более из генов rep, cap или аар встречаются в природе, например, гены rep, cap или аар включают в себя все или часть генов rep, cap или аар парвовируса. В некоторых вариантах осуществления один или несколько генов rep, cap или аар содержат синтетическую последовательность. В одном варианте осуществления ген rep содержит синтетическую последовательность. В одном варианте осуществления ген cap содержит синтетическую последовательность. В одном варианте осуществления ген аар содержит синтетическую последовательность. В одном варианте гены rep и cap содержат синтетическую последовательность. В одном варианте осуществления гены rep и аар содержат синтетическую последовательность. В одном варианте осуществления гены cap и аар содержат синтетическую последовательность. В одном варианте осуществления гены rep, cap и аар содержат синтетическую последовательность.In some embodiments, one or more of the rep, cap, or aap genes are naturally occurring, e.g., the rep, cap, or aap genes include all or a portion of the parvovirus rep, cap, or aap genes. In some embodiments, one or more rep, cap, or aap genes comprise a synthetic sequence. In one embodiment, the rep gene contains a synthetic sequence. In one embodiment, the cap gene contains a synthetic sequence. In one embodiment, the aap gene comprises a synthetic sequence. In one embodiment, the rep and cap genes contain a synthetic sequence. In one embodiment, the rep and aap genes comprise a synthetic sequence. In one embodiment, the cap and aap genes comprise a synthetic sequence. In one embodiment, the rep, cap, and aap genes comprise a synthetic sequence.

В некоторых вариантах осуществления rep происходит из генома AAV, выбранного из AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11 и любой их комбинации. В конкретном варианте осуществления rep происходит из генома AAV1. В конкретном варианте осуществления rep происходит из генома AAV2. В конкретном варианте осуществления rep происходит из генома AAV3. В конкретном варианте осуществления rep происходит из генома AAV4. В конкретном варианте осуществления rep происходит из генома AAV5. В конкретном варианте осуществления rep происходит из генома AAV6. В конкретном варианте осуществления rep происходит из генома AAV7. В конкретном варианте осуществления rep происходит из генома AAV8. В конкретном варианте осуществления rep происходит из генома AAV9. В конкретном варианте осуществления rep происходит из генома AAV10. В конкретном варианте осуществления rep происходит из генома AAV11.In some embodiments, rep is derived from an AAV genome selected from AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, and any combination thereof. In a specific embodiment, rep is derived from the AAV1 genome. In a specific embodiment, rep is derived from the AAV2 genome. In a specific embodiment, rep is derived from the AAV3 genome. In a specific embodiment, rep is derived from the AAV4 genome. In a specific embodiment, rep is derived from the AAV5 genome. In a specific embodiment, rep is derived from the AAV6 genome. In a specific embodiment, rep is derived from the AAV7 genome. In a specific embodiment, rep is derived from the AAV8 genome. In a specific embodiment, rep is derived from the AAV9 genome. In a specific embodiment, rep is derived from the AAV10 genome. In a specific embodiment, rep is derived from the AAV11 genome.

В некоторых вариантах осуществления cap происходит из генома AAV, выбранного из AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11 и любой их комбинации. В конкретном варианте осуществления cap происходит из генома AAV1. В конкретном варианте осуществления cap происходит из генома AAV2. В конкретном варианте осуществления cap происходит из генома AAV3. В конкретном варианте осуществления cap происходит из генома AAV4. В конкретном варианте осуществления cap происходит из генома AAV5. В конкретном варианте осуществления cap происходит из генома AAV6. В конкретном варианте осуществления cap происходит из генома AAV7. В конкретном варианте осуществления cap происходит из генома AAV8. В конкретном варианте осуществления cap происходит из генома AAV9. В конкретном варианте осуществления cap происходит из генома AAV10. В конкретном варианте осуществления cap происходит из генома AAV11.In some embodiments, cap is derived from an AAV genome selected from AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, and any combination thereof. In a specific embodiment, cap is derived from the AAV1 genome. In a specific embodiment, cap is derived from the AAV2 genome. In a specific embodiment, cap is derived from the AAV3 genome. In a specific embodiment, cap is derived from the AAV4 genome. In a specific embodiment, cap is derived from the AAV5 genome. In a specific embodiment, cap is derived from the AAV6 genome. In a specific embodiment, cap is derived from the AAV7 genome. In a specific embodiment, cap is derived from the AAV8 genome. In a specific embodiment, cap is derived from the AAV9 genome. In a specific embodiment, cap is derived from the AAV10 genome. In a specific embodiment, cap is derived from the AAV11 genome.

В некоторых вариантах осуществления аар происходит из генома AAV, выбранного из AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11 и любой их комбинации. ВIn some embodiments, the aap is derived from an AAV genome selected from AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, and any combination thereof. IN

- 98 046419 конкретном варианте осуществления аар происходит из генома AAV1. В конкретном варианте осуществления аар происходит из генома AAV2. В конкретном варианте осуществления аар происходит из генома AAV3. В конкретном варианте осуществления аар происходит из генома AAV4. В конкретном варианте осуществления аар происходит из генома AAV5. В конкретном варианте осуществления аар происходит из генома AAV6. В конкретном варианте осуществления аар происходит из генома AAV7. В конкретном варианте осуществления аар происходит из генома AAV8. В конкретном варианте осуществления аар происходит из генома AAV9. В конкретном варианте осуществления аар происходит из генома AAV10. В конкретном варианте осуществления аар происходит из генома AAV11.- 98 046419 in a specific embodiment, aap is derived from the AAV1 genome. In a specific embodiment, aap is derived from the AAV2 genome. In a specific embodiment, aap is derived from the AAV3 genome. In a specific embodiment, aap is derived from the AAV4 genome. In a specific embodiment, aap is derived from the AAV5 genome. In a specific embodiment, aap is derived from the AAV6 genome. In a specific embodiment, aap is derived from the AAV7 genome. In a specific embodiment, aap is derived from the AAV8 genome. In a specific embodiment, aap is derived from the AAV9 genome. In a specific embodiment, aap is derived from the AAV10 genome. In a specific embodiment, aap is derived from the AAV11 genome.

Следует понимать, что конкретный описанный в данном документе геном AAV может иметь гены, происходящие из разных геномов AAV (например, геномы из AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10 и AAV11). Таким образом, в данном документе описаны AAV, которые содержат любую возможную перестановку/комбинацию из rep, cap или аар.It should be understood that a particular AAV genome described herein may have genes derived from different AAV genomes (eg, genomes from AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10 and AAV11). Thus, AAVs are described herein that contain any possible permutation/combination of rep, cap, or aap.

В некоторых вариантах осуществления, раскрытых в данном документе, AAV представляет собой рекомбинантный AAV (rAAV). В некоторых вариантах осуществления в rAAV отсутствует один или более из гена rep, гена cap и гена аар. В некоторых вариантах осуществления в rAAV отсутствует ген rep. В некоторых вариантах осуществления в rAAV отсутствует ген cap. В некоторых вариантах осуществления в rAAV отсутствует ген аар. В некоторых вариантах осуществления в rAAV отсутствует ген rep и отсутствует ген cap. В некоторых вариантах осуществления в rAAV отсутствует ген rep и отсутствует ген аар. В некоторых вариантах осуществления в rAAV отсутствует ген cap и отсутствует ген аар. В некоторых вариантах осуществления в rAAV отсутствует ген rep, ген cap и ген аар.In some embodiments disclosed herein, the AAV is recombinant AAV (rAAV). In some embodiments, rAAV lacks one or more of the rep gene, the cap gene, and the aap gene. In some embodiments, rAAV lacks the rep gene. In some embodiments, rAAV lacks the cap gene. In some embodiments, rAAV lacks the aap gene. In some embodiments, rAAV lacks the rep gene and lacks the cap gene. In some embodiments, rAAV lacks the rep gene and lacks the aap gene. In some embodiments, rAAV lacks the cap gene and lacks the aap gene. In some embodiments, rAAV lacks the rep gene, the cap gene, and the aap gene.

В некоторых вариантах осуществления, раскрытых в данном документе, rAAV модифицируется таким образом, что один или более из гена rep, гена cap и гена аар мутирован так, что изменяется экспрессия одного или нескольких генов AAV. В некоторых вариантах осуществления мутирован ген rep. В некоторых вариантах осуществления мутирован ген cap. В некоторых вариантах осуществления мутирован ген аар. В некоторых вариантах осуществления мутированы ген rep и ген cap. В некоторых вариантах осуществления мутированы ген rep и ген аар. В некоторых вариантах осуществления мутированы ген cap и ген аар. В некоторых вариантах осуществления мутированы ген cap, ген rep и ген аар.In some embodiments disclosed herein, the rAAV is modified such that one or more of the rep gene, the cap gene, and the aap gene is mutated such that the expression of one or more AAV genes is altered. In some embodiments, the rep gene is mutated. In some embodiments, the cap gene is mutated. In some embodiments, the aap gene is mutated. In some embodiments, the rep gene and the cap gene are mutated. In some embodiments, the rep gene and the aap gene are mutated. In some embodiments, the cap gene and the aap gene are mutated. In some embodiments, the cap gene, the rep gene, and the aap gene are mutated.

5.5.1.3. Инвертированные концевые повторы5.5.1.3. Inverted terminal repeats

В некоторых вариантах осуществления AAV содержит первый ITR, например, 5' ITR, и второй ITR, например, 3' ITR. Как правило, ITR участвуют в репликации и спасении или вырезании из прокариотических плазмид ДНК парвовируса (например, AAV) (Samulski et al., 1983, 1987; Senapathy et al., 1984; Gottlieb and Muzyczka, 1988). Кроме того, сообщалось, что ITR являются минимальными последовательностями, необходимыми для интеграции провирусов AAV и для упаковки ДНК AAV в вирионы (McLaughlin et al., 1988; Samulski et al., 1989). Данные элементы необходимы для эффективного размножения генома парвовируса.In some embodiments, the AAV comprises a first ITR, such as a 5' ITR, and a second ITR, such as a 3' ITR. Typically, ITRs are involved in the replication and rescue or excision of parvovirus (e.g., AAV) DNA from prokaryotic plasmids (Samulski et al., 1983, 1987; Senapathy et al., 1984; Gottlieb and Muzyczka, 1988). In addition, ITRs have been reported to be the minimal sequences required for the integration of AAV proviruses and for the packaging of AAV DNA into virions (McLaughlin et al., 1988; Samulski et al., 1989). These elements are necessary for efficient propagation of the parvovirus genome.

В некоторых вариантах осуществления ITR содержит встречающийся в природе ITR, например, ITR содержит весь или часть ITR парвовируса. В некоторых вариантах осуществления ITR содержит синтетическую последовательность. В одном варианте осуществления первый ITR или второй ITR содержит синтетическую последовательность. В другом варианте осуществления каждый из первого ITR и второго ITR содержит синтетическую последовательность. В некоторых вариантах осуществления первый ITR или второй ITR содержит последовательность, встречающуюся в природе. В другом варианте осуществления каждый из первого ITR и второго ITR содержит встречающуюся в природе последовательность. В некоторых вариантах осуществления ITR включает ITR из генома AAV. В некоторых вариантах осуществления ITR представляет собой ITR генома AAV, выбранного из AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11 и любой их комбинации. В конкретном варианте осуществления ITR представляет собой ITR генома AAV2. В другом варианте осуществления ITR представляет собой синтетическую последовательность, созданную с помощью генной инженерии и содержащую на своих 5'- и 3'-концах ITR, полученные из одного или нескольких геномов AAV. В некоторых вариантах осуществления ITR получены из одного и того же генома, например, из генома одного и того же вируса, или из разных геномов, например, из геномов двух или более разных геномов AAV. В некоторых вариантах осуществления ITR получены из одного и того же генома AAV. В конкретном варианте осуществления два ITR, присутствующие в молекуле нуклеиновой кислоты по изобретению, являются одинаковыми и могут, в частности, быть ITR AAV2. В одном конкретном варианте осуществления первый ITR и второй ITR идентичны.In some embodiments, the ITR comprises a naturally occurring ITR, for example, the ITR comprises all or part of a parvovirus ITR. In some embodiments, the ITR comprises a synthetic sequence. In one embodiment, the first ITR or second ITR contains a synthetic sequence. In another embodiment, each of the first ITR and the second ITR contains a synthetic sequence. In some embodiments, the first ITR or the second ITR comprises a naturally occurring sequence. In another embodiment, each of the first ITR and the second ITR contains a naturally occurring sequence. In some embodiments, the ITR includes an ITR from the AAV genome. In some embodiments, the ITR is an AAV genome ITR selected from AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, and any combination thereof. In a specific embodiment, the ITR is the ITR of the AAV2 genome. In another embodiment, the ITR is a synthetic genetically engineered sequence containing at its 5' and 3' ends ITRs derived from one or more AAV genomes. In some embodiments, the ITRs are derived from the same genome, such as the genome of the same virus, or from different genomes, such as the genomes of two or more different AAV genomes. In some embodiments, the ITRs are derived from the same AAV genome. In a particular embodiment, the two ITRs present in the nucleic acid molecule of the invention are the same and may, in particular, be the AAV2 ITR. In one particular embodiment, the first ITR and the second ITR are identical.

В некоторых вариантах осуществления ITR образуют структуры шпилечной петли. В одном варианте осуществления первый ITR образует шпилечную структуру. В другом варианте второй ITR образует шпилечную структуру. Еще в другом варианте осуществления как первый ITR, так и второй ITR образуют шпилечные структуры. В некоторых вариантах осуществления ITR в молекуле нуклеиновой кислоты, раскрытой в данном документе, представляет собой транскрипционно активированный ITR. Транскрипционно активированный ITR может включать весь или часть ITR дикого типа, который был транскрипционно активирован путем включения по меньшей мере одного транскрипционно активного элемента. В данном контексте подходят различные типы транскрипционно активных элементов. В некоторых вариIn some embodiments, the ITRs form hairpin loop structures. In one embodiment, the first ITR forms a hairpin structure. In another embodiment, the second ITR forms a hairpin structure. In yet another embodiment, both the first ITR and the second ITR form hairpin structures. In some embodiments, the ITR in a nucleic acid molecule disclosed herein is a transcriptionally activated ITR. A transcriptionally activated ITR may include all or a portion of a wild-type ITR that has been transcriptionally activated by inclusion of at least one transcriptionally active element. Various types of transcriptionally active elements are suitable in this context. In some countries

- 99 046419 антах осуществления транскрипционно активный элемент является конститутивным транскрипционно активным элементом. Конститутивные транскрипционно активные элементы обеспечивают постоянный уровень транскрипции гена и могут использоваться, когда желательно, чтобы трансген экспрессировался на постоянной основе. В других вариантах осуществления транскрипционно активный элемент представляет собой индуцируемый транскрипционно активный элемент. Индуцируемые транскрипционно активные элементы обычно проявляют низкую активность в отсутствие индуктора (или индуцирующего состояния) и активируются в присутствии индуктора (или переключаются в индуцирующее состояние). Индуцируемые транскрипционно активные элементы могут быть использованы, когда экспрессия требуется только в определенное время или в определенных местах, или когда желательно титрование уровня экспрессии с использованием индуцирующего агента. Транскрипционно активные элементы также могут быть тканеспецифичными; то есть они проявляют активность только в определенных тканях или типах клеток.- 99 046419 ant implementation of the transcriptionally active element is a constitutive transcriptionally active element. Constitutive transcriptionally active elements provide a constant level of gene transcription and can be used when it is desired that the transgene be expressed on a continuous basis. In other embodiments, the transcriptionally active element is an inducible transcriptionally active element. Inducible transcriptionally active elements typically exhibit low activity in the absence of an inducer (or inducing state) and are activated in the presence of an inducer (or switch to an inducing state). Inducible transcriptionally active elements can be used when expression is required only at certain times or in certain locations, or when titration of the level of expression using an inducing agent is desired. Transcriptionally active elements can also be tissue specific; that is, they are active only in certain tissues or cell types.

Транскрипционно активные элементы могут быть включены в ITR различными способами. В некоторых вариантах осуществления транскрипционно активный элемент включен с 5' конца в любую часть ITR или с 3' конца в любую часть ITR. В других вариантах осуществления транскрипционно активный элемент транскрипционно активированного ITR находится между двумя последовательностями ITR. Если транскрипционно активный элемент включает два или более элемента, которые должны быть разнесены, данные элементы могут чередоваться с частями ITR. В некоторых вариантах осуществления шпилечная структура ITR удаляется и заменяется инвертированными повторами транскрипционного элемента. Данная последняя компоновка создаст шпильку, имитирующую удаленную часть в структуре. Множественные тандемные транскрипционно активные элементы также могут присутствовать в транскрипционно активированном ITR, и они могут быть смежными или разнесенными. Кроме того, сайты связывания белков (например, сайты связывания Rep) могут быть введены в транскрипционно активные элементы транскрипционно активированных ITR. Транскрипционно активный элемент может включать любую последовательность, обеспечивающую контролируемую транскрипцию ДНК с помощью РНКполимеразы с образованием РНК, и может содержать, например, транскрипционно активный элемент, как определено ниже.Transcriptionally active elements can be incorporated into the ITR in a variety of ways. In some embodiments, the transcriptionally active element is included at the 5' end of any portion of the ITR or at the 3' end of any portion of the ITR. In other embodiments, the transcriptionally active element of the transcriptionally activated ITR is located between two ITR sequences. If a transcriptionally active element includes two or more elements that must be separated, these elements may alternate with parts of the ITR. In some embodiments, the ITR hairpin structure is removed and replaced with inverted repeats of the transcription element. This last arrangement will create a stud that simulates the removed part in the structure. Multiple tandem transcriptionally active elements may also be present in a transcriptionally activated ITR, and they may be contiguous or spaced apart. In addition, protein binding sites (eg, Rep binding sites) can be introduced into transcriptionally active elements of transcriptionally activated ITRs. The transcriptionally active element may include any sequence that allows controlled transcription of DNA by RNA polymerase to produce RNA, and may comprise, for example, a transcriptionally active element as defined below.

Транскрипционно активированные ITR обеспечивают как активацию транскрипции, так и функции ITR для молекулы нуклеиновой кислоты в нуклеотидной последовательности относительно ограниченной длины, которая эффективно максимизирует длину трансгена, который может переноситься и экспрессироваться из молекулы нуклеиновой кислоты. Включение транскрипционно активного элемента в ITR может быть выполнено множеством способов. Сравнение последовательности ITR и требований к последовательности транскрипционно активного элемента может дать представление о способах кодирования элемента в ITR. Например, транскрипционная активность может быть добавлена к ITR посредством внесения определенных изменений в последовательность ITR, которая реплицирует функциональные элементы транскрипционно активного элемента. В данной области техники существует ряд способов эффективного добавления, удаления и/или изменения конкретных нуклеотидных последовательностей в определенных сайтах (см., например, Deng and Nickoloff (1992) Anal. Biochem. 200: 81-88). Другой способ создания транскрипционно активированных ITR включает введение сайта рестрикции в желаемое место в ITR. Кроме того, несколько транскрипционно активных элементов могут быть включены в транскрипционно активированный ITR с использованием способов, известных в данной области техники.Transcriptionally activated ITRs provide both transcriptional activation and ITR function to a nucleic acid molecule in a nucleotide sequence of relatively limited length, which effectively maximizes the length of the transgene that can be transferred to and expressed from the nucleic acid molecule. Incorporation of a transcriptionally active element into an ITR can be accomplished in a variety of ways. Comparison of the ITR sequence and the sequence requirements of the transcriptionally active element can provide insight into the way the element is encoded in the ITR. For example, transcriptional activity can be added to the ITR by making certain changes to the ITR sequence that replicate functional elements of the transcriptionally active element. There are a number of techniques in the art to effectively add, remove and/or change specific nucleotide sequences at specific sites (see, for example, Deng and Nickoloff (1992) Anal. Biochem. 200: 81-88). Another method for creating transcriptionally activated ITRs involves introducing a restriction site at the desired location in the ITR. In addition, several transcriptionally active elements can be included in a transcriptionally activated ITR using methods known in the art.

В качестве иллюстрации, транскрипционно активированные ITR могут быть сгенерированы включением одного или нескольких транскрипционно активных элементов, таких как: ТАТА-бокс, GC-бокс, ССААТ-бокс, сайт Sp1, область Inr, сайт CRE (регуляторный элемент цАМФ), сайт ATF-1/CRE, АРВвбокс, АРВа-бокс, CArG-бокс, ССАС-бокс или любой другой элемент, участвующий в транскрипции, как известно в данной области техники.By way of illustration, transcriptionally activated ITRs can be generated by the inclusion of one or more transcriptionally active elements, such as: TATA box, GC box, CCAAT box, Sp1 site, Inr region, CRE (cAMP regulatory element) site, ATF- site 1/CRE, APBbox, APBa-box, CArG-box, CCAC-box, or any other element involved in transcription, as known in the art.

5.5.1.4. Представляющий интерес ген и другие последовательности5.5.1.4. Gene of interest and other sequences

Некоторые аспекты настоящего изобретения относятся к способам введения AAV-терапии субъекту. В некоторых вариантах осуществления AAV содержит представляющий интерес ген (gene of interest (GOI)). В некоторых вариантах осуществления GOI является молекулой нуклеиновой кислоты, содержащей нуклеотидную последовательность, описанную в данном документе, которая кодирует полипептид миниатюризированного дистрофина, описанный в данном документе.Some aspects of the present invention relate to methods of administering AAV therapy to a subject. In some embodiments, the AAV contains a gene of interest (GOI). In some embodiments, the GOI is a nucleic acid molecule comprising a nucleotide sequence described herein that encodes a miniaturized dystrophin polypeptide described herein.

Экспрессируемый GOI может быть либо сегментом ДНК, кодирующим белок, с любыми необходимыми элементами управления (например, промоторами, операторами), желаемыми пользователем, либо некодирующим сегментом ДНК, транскрипция которого производит всю или часть некоторой РНКсодержащей молекулы, такой как рибозим или антисмысловая молекула.The expressed GOI can be either a protein-coding DNA segment with any necessary control elements (e.g., promoters, operators) desired by the user, or a non-coding DNA segment whose transcription produces all or part of some RNA-containing molecule, such as a ribozyme or antisense molecule.

В некоторых вариантах осуществления AAV содержит более одного GOI. В AAV с более чем одним GOI некоторые варианты осуществления включают такие элементы, как IRES или 2А, для совместной экспрессии их с одного промотора. В некоторых вариантах осуществления AAV содержит два представляющих интерес гена, разделенных элементом IRES. В некоторых вариантах осуществления AAV содержит два представляющих интерес гена, разделенных элементом 2А. В некоторых вариантах осущеIn some embodiments, the AAV contains more than one GOI. In AAVs with more than one GOI, some embodiments include elements such as IRES or 2A to co-express them from a single promoter. In some embodiments, AAV contains two genes of interest separated by an IRES element. In some embodiments, AAV contains two genes of interest separated by a 2A element. In some embodiments it is possible to

- 100 046419 ствления AAV содержит три представляющих интерес гена, разделенных элементом IRES между представляющими интерес генами (например, GOI-IRES-GOI-IRES-GOI). В некоторых вариантах осуществления AAV содержит три представляющих интерес гена, разделенных элементами 2А между интересующими генами. В некоторых вариантах осуществления AAV содержит регуляторную последовательность. В некоторых вариантах осуществления AAV содержит некодирующую регуляторную ДНК. В некоторых вариантах осуществления геном AAV содержит регуляторные последовательности, которые контролируют экспрессию генов цепей антитела в клетке-хозяине. Термин регуляторная последовательность включает промоторы, энхансеры и другие элементы контроля экспрессии (например, сигналы полиаденилирования), которые контролируют транскрипцию или трансляцию генов цепей антитела. Такие регуляторные последовательности описаны, например, в Goeddel (Gene Expression Technology. Methods in Enzymology 185, Academic Press, San Diego, CA (1990)). Специалистам в данной области техники будет понятно, что конструкция AAV, включая выбор регуляторных последовательностей, может зависеть от таких факторов, как выбор клетки-хозяина, подлежащей трансформации, желаемый уровень экспрессии белка и т.д. В некоторых вариантах осуществления геном AAV содержит донорные/акцепторные сайты сплайсинга мРНК. Некоторые регуляторные последовательности для экспрессии в клеткаххозяевах млекопитающих включают вирусные элементы, которые обеспечивают высокие уровни экспрессии белка в клетках млекопитающих, такие как промоторы и/или энхансеры, полученные из цитомегаловируса (CMV), обезьяньего вируса 40 (SV40), аденовируса (например, аденовирусный основной поздний промотор (AdMLP) и вируса полиомы. В качестве альтернативы, можно использовать невирусные регуляторные последовательности, такие как промотор убиквитина или промотор β-глобина. Кроме того, регуляторные элементы, состоящие из последовательностей из различных источников, таких как промоторная система SRa, которая содержит последовательности из раннего промотора SV40 и длинного концевого повтора вируса лейкемии Т-клеток человека типа 1 (Takebe, Y. et al. (1988) Mol. Cell. Biol. 8:466-472). В некоторых вариантах осуществления регуляторная последовательность содержит тканеспецифический промотор. В некоторых вариантах осуществления тканеспецифический промотор управляет экспрессией представляющего интерес гена в ткани, выбранной из группы, состоящей из сердца, печени, легких, глаз, нервной системы, лимфатической системы, мышечных и стволовых клеток.- 100 046419 The AAV stem contains three genes of interest separated by an IRES element between the genes of interest (eg, GOI-IRES-GOI-IRES-GOI). In some embodiments, the AAV contains three genes of interest separated by 2A elements between the genes of interest. In some embodiments, AAV comprises a regulatory sequence. In some embodiments, AAV comprises non-coding regulatory DNA. In some embodiments, the AAV genome contains regulatory sequences that control the expression of antibody chain genes in the host cell. The term regulatory sequence includes promoters, enhancers, and other expression control elements (eg, polyadenylation signals) that control transcription or translation of antibody chain genes. Such regulatory sequences are described, for example, in Goeddel (Gene Expression Technology. Methods in Enzymology 185, Academic Press, San Diego, CA (1990)). Those skilled in the art will appreciate that the design of AAV, including the choice of regulatory sequences, may depend on factors such as the choice of host cell to be transformed, the desired level of protein expression, etc. In some embodiments, the AAV genome contains mRNA splice donor/acceptor sites. Some regulatory sequences for expression in mammalian host cells include viral elements that mediate high levels of protein expression in mammalian cells, such as promoters and/or enhancers derived from cytomegalovirus (CMV), simian virus 40 (SV40), adenovirus (eg, adenovirus core late promoter (AdMLP) and polyoma virus. Alternatively, non-viral regulatory sequences such as the ubiquitin promoter or β-globin promoter can be used. In addition, regulatory elements consisting of sequences from various sources, such as the SRa promoter system, which contains sequences from the SV40 early promoter and human T cell leukemia virus type 1 long terminal repeat (Takebe, Y. et al. (1988) Mol. Cell. Biol. 8:466-472). In some embodiments, the regulatory sequence comprises a tissue-specific promoter In some embodiments, a tissue-specific promoter drives expression of a gene of interest in a tissue selected from the group consisting of heart, liver, lung, eye, nervous system, lymphatic system, muscle and stem cells.

5.5.1.5. AAV-препараты5.5.1.5. AAV drugs

В некоторых вариантах осуществления AAV вектор приготовлен со средством доставки. В некоторых вариантах осуществления средство доставки включает липидную наночастицу. В некоторых вариантах осуществления средство доставки выбрано из группы, состоящей из липосом, нелипидных полимерных молекул, эндосом и любой их комбинации.In some embodiments, the AAV vector is formulated with a delivery vehicle. In some embodiments, the delivery vehicle includes a lipid nanoparticle. In some embodiments, the delivery vehicle is selected from the group consisting of liposomes, non-lipid polymer molecules, endosomes, and any combination thereof.

5.5.2. Векторы, не относящиеся к AAV5.5.2. Non-AAV vectors

В данном документе также обеспечен вектор, который содержит описанные выше полинуклеотиды, функционально связанные с промотором. Нуклеотидная последовательность функционально связана с последовательностью контроля экспрессии (например, промотором), когда последовательность контроля экспрессии контролирует и регулирует транскрипцию и трансляцию данной последовательности. Термин функционально связанный применительно к нуклеотидной последовательности включает наличие соответствующего стартового сигнала (например, ATG) перед нуклеотидной последовательностью, которая должна быть экспрессирована, и поддержание правильной рамки считывания для обеспечения экспрессии последовательности под контролем последовательности контроля экспрессии и продукции желаемого продукта, кодируемого последовательностью. Если ген, который желательно вставить в молекулу рекомбинантной нуклеиновой кислоты, не содержит соответствующего стартового сигнала, такой стартовый сигнал может быть вставлен перед геном. Вектор представляет собой репликон, такой как плазмида, фаг или космида, к которому может быть присоединен другой сегмент нуклеиновой кислоты, чтобы вызвать репликацию присоединенного сегмента. Промотор может быть или является идентичным промотору бактерий, дрожжей, насекомых или млекопитающих. В некоторых вариантах осуществления вектор может быть плазмидой, космидой, дрожжевой искусственной хромосомой (YAC), бактериофагом или вирусной ДНК эукариот. Могут быть использованы другие многочисленные векторные остовы, известные в данной области техники как применимые для экспрессии белка. Такие векторы включают, но без ограничения: аденовирусный вектор, ретровирусный вектор, поксвирусный вектор, бакуловирусный вектор, вирусный вектор герпеса, обезьяний вирус 40 (SV40), цитомегаловирус (CMV), вирус опухоли молочной железы мыши (MMTV) и вирус мышиного лейкоза Молони. Кроме того, один класс векторов содержит элементы ДНК, полученные из вирусов, таких как вирус папилломы крупного рогатого скота, вирус полиомы, бакуловирус, ретровирусы, или вирус леса Семлики. Такие векторы можно получить коммерчески или собрать из последовательностей, описанных способами, хорошо известными в данной области техники.Also provided herein is a vector that contains the polynucleotides described above operably linked to a promoter. A nucleotide sequence is operably linked to an expression control sequence (eg, a promoter) where the expression control sequence controls and regulates transcription and translation of the sequence. The term operably linked, as applied to a nucleotide sequence, includes the presence of an appropriate start signal (eg, ATG) before the nucleotide sequence to be expressed, and maintenance of the correct reading frame to ensure expression of the sequence under the control of the expression control sequence and production of the desired product encoded by the sequence. If the gene that is desired to be inserted into the recombinant nucleic acid molecule does not contain a corresponding start signal, such a start signal may be inserted before the gene. A vector is a replicon, such as a plasmid, phage or cosmid, to which another nucleic acid segment can be attached to cause replication of the attached segment. The promoter may be or is identical to that of bacteria, yeast, insects or mammals. In some embodiments, the vector may be a plasmid, cosmid, yeast artificial chromosome (YAC), bacteriophage, or eukaryotic viral DNA. Numerous other vector backbones known in the art to be useful for protein expression may be used. Such vectors include, but are not limited to: adenoviral vector, retroviral vector, poxviral vector, baculovirus vector, herpes viral vector, simian virus 40 (SV40), cytomegalovirus (CMV), mouse mammary tumor virus (MMTV), and Moloney murine leukemia virus. In addition, one class of vectors contains DNA elements derived from viruses, such as bovine papillomavirus, polyoma virus, baculovirus, retroviruses, or Semliki Forest virus. Such vectors can be obtained commercially or assembled from sequences described by methods well known in the art.

В некоторых вариантах осуществления описанный в данном документе вектор приготовлен со средством доставки. В некоторых вариантах осуществления средство доставки включает липидную наночастицу. В некоторых вариантах осуществления средство доставки выбрано из группы, состоящей из липосом, нелипидных полимерных молекул, эндосом и любой их комбинации.In some embodiments, a vector described herein is formulated with a delivery vehicle. In some embodiments, the delivery vehicle includes a lipid nanoparticle. In some embodiments, the delivery vehicle is selected from the group consisting of liposomes, non-lipid polymer molecules, endosomes, and any combination thereof.

- 101 046419- 101 046419

5.6. Фармацевтические композиции5.6. Pharmaceutical compositions

Различные полипептиды и полинуклеотиды, раскрытые в данном документе (также называемые в данном документе активными соединениями), могут быть включены в фармацевтические композиции, подходящие для введения. Такие композиции обычно содержат полипептид или полинуклеотиды и фармацевтически приемлемый носитель. Используемый в данном документе термин фармацевтически приемлемый носитель предназначен для включения любых без исключения растворителей, дисперсионных сред, покрытий, антибактериальных и противогрибковых средств, изотонических средств и средств, замедляющих всасывание, и т.п., совместимых с фармацевтическим введением. Применение таких сред и средств для фармацевтически активных соединений хорошо известно в данной области техники. За исключением случаев, когда любая обычная среда или средство несовместимы с активным соединением, предполагается их применение в композициях. В композиции также могут быть включены дополнительные активные соединения.The various polypeptides and polynucleotides disclosed herein (also referred to herein as active compounds) may be included in pharmaceutical compositions suitable for administration. Such compositions typically contain a polypeptide or polynucleotides and a pharmaceutically acceptable carrier. As used herein, the term pharmaceutically acceptable carrier is intended to include any and all solvents, dispersion media, coatings, antibacterial and antifungal agents, isotonic and absorption delaying agents, and the like, compatible with pharmaceutical administration. The use of such media and agents for pharmaceutically active compounds is well known in the art. Unless any conventional medium or agent is incompatible with the active compound, it is intended for use in the compositions. Additional active compounds may also be included in the compositions.

В некоторых вариантах осуществления раскрыта фармацевтическая композиция, содержащая (а) полипептид, как описано в данном документе, и (b) фармацевтически приемлемое вспомогательное вещество.In some embodiments, a pharmaceutical composition is disclosed comprising (a) a polypeptide as described herein and (b) a pharmaceutically acceptable excipient.

В некоторых вариантах осуществления раскрыта фармацевтическая композиция, содержащая (а) композицию, содержащую полипептид, как описано в данном документе, и (b) фармацевтически приемлемое вспомогательное вещество.In some embodiments, a pharmaceutical composition is disclosed, comprising (a) a composition comprising a polypeptide as described herein, and (b) a pharmaceutically acceptable excipient.

В некоторых вариантах осуществления раскрыта фармацевтическая композиция, содержащая (а) полинуклеотид, как описано в данном документе, и (b) фармацевтически приемлемое вспомогательное вещество.In some embodiments, a pharmaceutical composition is disclosed comprising (a) a polynucleotide as described herein and (b) a pharmaceutically acceptable excipient.

В некоторых вариантах осуществления раскрыта фармацевтическая композиция, содержащая (а) вектор (например, rAAV), как описано в данном документе, и (b) фармацевтически приемлемое вспомогательное вещество.In some embodiments, a pharmaceutical composition is disclosed comprising (a) a vector (eg, rAAV) as described herein, and (b) a pharmaceutically acceptable excipient.

В некоторых вариантах осуществления раскрыта фармацевтическая композиция, содержащая (а) клетку-хозяин, как описано в данном документе, и (b) фармацевтически приемлемое вспомогательное вещество.In some embodiments, a pharmaceutical composition is disclosed comprising (a) a host cell, as described herein, and (b) a pharmaceutically acceptable excipient.

Фармацевтическая композиция по настоящему описанию приготовлена таким образом, чтобы быть совместимой с предполагаемым путем введения. Примеры способов введения включают парентеральный, например, внутривенный, внутрикожный, подкожный, пероральный, трансдермальный (местный) и трансмукозальный, и любую их комбинацию. Другой путь введения включает легочное введение. Кроме того, может быть желательно введение терапевтически эффективного количества фармацевтической композиции локально в область, нуждающуюся в лечении. Это может быть достигнуто, например, с помощью местной или региональной инфузии или перфузии во время операции, местного применения, инъекции, катетера, суппозитория или имплантата (например, имплантатов, сформированных из пористых, непористых или гелеобразных материалов, включая мембраны, такие как в виде сиалластических мембран или волокон) и тому подобного. В другом варианте осуществления терапевтически эффективное количество фармацевтической композиции доставляется в везикулах, таких как липосомы (см., например, Langer, Science 249: 1527-33, 1990 и Treat et al., in Liposomes in Therapy of Infective Disease, and Cancer, Lopez Berestein and Fidler (eds.), Liss, NY, pp. 353-65, 1989).The pharmaceutical composition herein is formulated to be compatible with the intended route of administration. Examples of routes of administration include parenteral, eg, intravenous, intradermal, subcutaneous, oral, transdermal (topical), and transmucosal, and any combination thereof. Another route of administration involves pulmonary administration. In addition, it may be desirable to administer a therapeutically effective amount of the pharmaceutical composition locally to the area in need of treatment. This can be achieved, for example, by local or regional infusion or perfusion during surgery, topical application, injection, catheter, suppository or implant (for example, implants formed from porous, non-porous or gel-like materials, including membranes such as siallastic membranes or fibers) and the like. In another embodiment, a therapeutically effective amount of the pharmaceutical composition is delivered in vesicles, such as liposomes (see, for example, Langer, Science 249: 1527-33, 1990 and Treat et al., in Liposomes in Therapy of Infectious Disease, and Cancer, Lopez Berestein and Fidler (eds.), Liss, NY, pp. 353-65, 1989).

В еще одном варианте осуществления терапевтически эффективное количество фармацевтической композиции может быть доставлено в системе с контролируемым высвобождением. В одном примере можно использовать насос (см., например, Langer, Science 249: 1527-33, 1990; Sefton, Crit. Rev. Biomed. Eng. 14: 201-40, 1987; Buchwald et al., Surgery 88: 507-16, 1980; Saudek et al., N Engl. J. Med. 321: 574-79, 1989). В другом примере можно использовать полимерные материалы (см., например, Levy et al., Science 228: 190-92, 1985; During et al., Ann. Neural. 25: 351-56, 1989; Howard et al., J. Neurosurg. 71: 105-12, 1989). Также можно использовать другие системы с контролируемым высвобождением, такие как те, которые обсуждались у Langer (Science 249: 1527-33, 1990).In yet another embodiment, a therapeutically effective amount of the pharmaceutical composition may be delivered in a controlled release system. In one example, a pump may be used (see, for example, Langer, Science 249: 1527-33, 1990; Sefton, Crit. Rev. Biomed. Eng. 14: 201-40, 1987; Buchwald et al., Surgery 88: 507 -16, 1980; Saudek et al., N Engl J Med 321: 574-79, 1989). In another example, polymeric materials can be used (see, for example, Levy et al., Science 228: 190-92, 1985; During et al., Ann. Neural. 25: 351-56, 1989; Howard et al., J Neurosurg 71: 105-12, 1989). Other controlled release systems such as those discussed by Langer (Science 249: 1527-33, 1990) may also be used.

Приемлемые носители, вспомогательные вещества или стабилизаторы нетоксичны для реципиентов в используемых дозировках и концентрациях и включают буферы, такие как фосфат, цитрат и другие органические кислоты; антиоксиданты, включая аскорбиновую кислоту и метионин; консерванты (такие как хлорид октадецилдиметилбензиламмония; хлорид гексаметония; хлорид бензалкония, хлорид бензетония; фенол, бутиловый или бензиловый спирт; алкилпарабены, такие как метил-или пропилпарабен; катехол; резорцин; циклогексанол; 3-пентанол и м-крезол); полипептиды с низкой молекулярной массой (менее чем около 10 остатков); белки, такие как сывороточный альбумин, желатин или иммуноглобулины; гидрофильные полимеры, такие как поливинилпирролидон; аминокислоты, такие как глицин, глутамин, аспарагин, гистидин, аргинин или лизин; моносахариды, дисахариды и другие углеводы, включая глюкозу, маннозу или декстрины; хелатирующие агенты, такие как EDTA; сахара, такие как сахароза, маннит, трегалоза или сорбитол; солеобразующие противоионы, такие как натрий; комплексы металлов (например, комплексы Zn-белок); и/или неионные поверхностно-активные вещества, такие как TWEEN™, PLURONICS™ или полиэтиленгликоль (PEG).Acceptable carriers, excipients or stabilizers are non-toxic to recipients at the dosages and concentrations used and include buffers such as phosphate, citrate and other organic acids; antioxidants including ascorbic acid and methionine; preservatives (such as octadecyldimethylbenzylammonium chloride; hexamethonium chloride; benzalkonium chloride, benzethonium chloride; phenol, butyl or benzyl alcohol; alkylparabens such as methyl or propylparaben; catechol; resorcinol; cyclohexanol; 3-pentanol and m-cresol); low molecular weight polypeptides (less than about 10 residues); proteins such as serum albumin, gelatin or immunoglobulins; hydrophilic polymers such as polyvinylpyrrolidone; amino acids such as glycine, glutamine, asparagine, histidine, arginine or lysine; monosaccharides, disaccharides and other carbohydrates, including glucose, mannose or dextrins; chelating agents such as EDTA; sugars such as sucrose, mannitol, trehalose or sorbitol; salt-forming counterions such as sodium; metal complexes (eg Zn-protein complexes); and/or non-ionic surfactants such as TWEEN™, PLURONICS™ or polyethylene glycol (PEG).

Фармацевтически приемлемые носители, используемые в парентеральных препаратах, включаютPharmaceutically acceptable carriers used in parenteral formulations include

- 102 046419 водные носители, неводные носители, антимикробные средства, изотонические средства, буферы, антиоксиданты, местные анестетики, суспендирующие и диспергирующие средства, эмульгирующие средства, связывающие или хелатирующие средства и другие фармацевтически приемлемые вещества. Примеры водных носителей включают инъекцию хлорида натрия, инъекцию Рингера, инъекцию изотонической декстрозы, инъекцию стерильной воды, инъекцию декстрозы и инъекцию лактата Рингера. Неводные парентеральные носители включают жирные масла растительного происхождения, хлопковое масло, кукурузное масло, кунжутное масло и арахисовое масло. Противомикробные средства в бактериостатических или фунгистатических концентрациях могут быть добавлены к парентеральным препаратам, упакованным в многодозовые контейнеры, которые включают фенолы или крезолы, ртути, бензиловый спирт, хлорбутанол, сложные эфиры метил и пропил-пара-гидроксибензойной кислоты, тимеросал, хлорид бензалкония и хлорид бензетония. Изотонические средства включают хлорид натрия и декстрозу. Буферы включают фосфат и цитрат. Антиоксиданты включают бисульфат натрия. Местные анестетики включают гидрохлорид прокаина. Суспендирующие и диспергирующие средства включают карбоксиметилцеллюлозу натрия, гидроксипропилметилцеллюлозу и поливинилпирролидон. Эмульгирующие средства включают Полисорбат 80 (TWEEN® 80). Средства, связывающие ионы металлов, или хелатирующие средства, включают ЭДТА. Фармацевтические носители также включают этиловый спирт, полиэтиленгликоль и пропиленгликоль для смешивающихся с водой носителей; и гидроксид натрия, соляную кислоту, лимонную кислоту или молочную кислоту для регулирования рН.- 102 046419 aqueous vehicles, non-aqueous vehicles, antimicrobial agents, isotonic agents, buffers, antioxidants, local anesthetics, suspending and dispersing agents, emulsifying agents, binding or chelating agents and other pharmaceutically acceptable substances. Examples of aqueous vehicles include sodium chloride injection, Ringer's injection, isotonic dextrose injection, sterile water injection, dextrose injection, and lactated Ringer's injection. Non-aqueous parenteral vehicles include vegetable fatty oils, cottonseed oil, corn oil, sesame oil and peanut oil. Antimicrobials at bacteriostatic or fungistatic concentrations may be added to parenteral products packaged in multi-dose containers that include phenols or cresols, mercuries, benzyl alcohol, chlorobutanol, methyl and propyl p-hydroxybenzoic acid esters, thimerosal, benzalkonium chloride and benzethonium chloride . Isotonic agents include sodium chloride and dextrose. Buffers include phosphate and citrate. Antioxidants include sodium bisulfate. Local anesthetics include procaine hydrochloride. Suspending and dispersing agents include sodium carboxymethylcellulose, hydroxypropylmethylcellulose and polyvinylpyrrolidone. Emulsifying agents include Polysorbate 80 (TWEEN® 80). Metal ion binders, or chelating agents, include EDTA. Pharmaceutical carriers also include ethyl alcohol, polyethylene glycol, and propylene glycol for water-miscible carriers; and sodium hydroxide, hydrochloric acid, citric acid or lactic acid to adjust the pH.

Растворы или суспензии, используемые для парентерального, внутрикожного или подкожного применения, могут включать следующие компоненты: стерильный разбавитель, такой как вода для инъекций, физиологический раствор, жирные масла, полиэтиленгликоли, глицерин, пропиленгликоль или другие синтетические растворители; антибактериальные средства, такие как бензиловый спирт или метилпарабены; антиоксиданты, такие как аскорбиновая кислота или бисульфит натрия; хелатирующие средства, такие как этилендиаминтетрауксусная кислота; буферы, такие как ацетаты, цитраты или фосфаты, и средства для регулирования тоничности, такие как хлорид натрия или декстроза. рН можно регулировать с помощью кислот или оснований, таких как соляная кислота или гидроксид натрия. Препарат для парентерального введения может быть заключен в ампулы, одноразовые шприцы или флаконы для многократных доз, изготовленные из стекла или пластика.Solutions or suspensions used for parenteral, intradermal or subcutaneous use may include the following components: a sterile diluent such as water for injection, saline, fatty oils, polyethylene glycols, glycerin, propylene glycol or other synthetic solvents; antibacterial agents such as benzyl alcohol or methylparabens; antioxidants such as ascorbic acid or sodium bisulfite; chelating agents such as ethylenediaminetetraacetic acid; buffers such as acetates, citrates or phosphates; and tonicity agents such as sodium chloride or dextrose. The pH can be adjusted using acids or bases such as hydrochloric acid or sodium hydroxide. The drug for parenteral administration may be contained in ampoules, disposable syringes, or multiple-dose vials made of glass or plastic.

Фармацевтические композиции, подходящие для инъекционного применения, включают стерильные водные растворы (если они водорастворимы) или дисперсии и стерильные порошки для немедленного приготовления стерильных инъекционных растворов или дисперсий. Для внутривенного введения подходящие носители включают физиологический раствор, бактериостатическую воду, Cremophor ELS (BASF; Parsippany, NJ) или физиологический раствор с фосфатным буфером (PBS). Во всех случаях композиция должна быть стерильной и жидкой до такой степени, чтобы ее можно было легко набрать с помощью шприца. Она должна быть стабильной в условиях производства и хранения и должна быть защищена от загрязняющего действия микроорганизмов, таких как бактерии и грибки. Носитель может быть растворителем или дисперсионной средой, содержащей, например, воду, этанол, полиол (например, глицерин, пропиленгликоль, жидкий полиэтиленгликоль и т.п.) и их подходящие смеси. Подходящую текучесть можно поддерживать, например, за счет использования покрытия, такого как лецитин, путем поддержания необходимого размера частиц в случае дисперсии и за счет использования поверхностноактивных веществ. Предотвращение действия микроорганизмов может быть достигнуто с помощью различных антибактериальных и противогрибковых средств, например, парабенов, хлорбутанола, фенола, аскорбиновой кислоты, тимеросала и т.п. Во многих случаях будет предпочтительно включать в композицию изотонические средства, например, сахара, многоатомные спирты, такие как маннит, сорбит, хлорид натрия. Пролонгированное всасывание композиций для инъекций может быть достигнуто путем включения в композицию средства, замедляющего абсорбцию, например, моностеарата алюминия и желатина.Pharmaceutical compositions suitable for injectable use include sterile aqueous solutions (if water-soluble) or dispersions and sterile powders for the immediate preparation of sterile injectable solutions or dispersions. For intravenous administration, suitable vehicles include saline, bacteriostatic water, Cremophor ELS (BASF; Parsippany, NJ), or phosphate-buffered saline (PBS). In all cases, the composition must be sterile and liquid to the extent that it can be easily drawn up using a syringe. It must be stable under the conditions of production and storage and must be protected from the contaminating action of microorganisms such as bacteria and fungi. The carrier may be a solvent or dispersion medium containing, for example, water, ethanol, polyol (eg, glycerin, propylene glycol, liquid polyethylene glycol, etc.) and suitable mixtures thereof. Suitable fluidity can be maintained, for example, by the use of a coating such as lecithin, by maintaining the required particle size in the case of a dispersion, and by the use of surfactants. Prevention of the action of microorganisms can be achieved using various antibacterial and antifungal agents, for example, parabens, chlorobutanol, phenol, ascorbic acid, thimerosal, etc. In many cases it will be preferable to include in the composition isotonic agents, for example, sugars, polyhydric alcohols such as mannitol, sorbitol, sodium chloride. Prolonged absorption of injectable compositions can be achieved by including an absorption delaying agent in the composition, for example aluminum monostearate and gelatin.

Стерильные растворы для инъекций могут быть приготовлены путем включения активного соединения в необходимом количестве в соответствующий растворитель с одним или комбинацией ингредиентов, перечисленных выше, при необходимости, с последующей стерилизацией фильтрованием. Обычно дисперсии готовят путем включения активного соединения в стерильный носитель, который содержит основную дисперсионную среду и другие необходимые ингредиенты из перечисленных выше. В случае стерильных порошков для приготовления стерильных растворов для инъекций способами приготовления могут быть вакуумная сушка и сублимационная сушка, которые дают порошок активного ингредиента плюс любой дополнительный желаемый ингредиент из его раствора, предварительно стерилизованного фильтрованием. Для введения путем ингаляции соединения доставляются в форме аэрозольного спрея из находящегося под давлением контейнера или дозатора, который содержит подходящий пропеллент, например, газ, такой как диоксид углерода, или распылитель. Системное введение также может осуществляться через слизистые оболочки или через кожу. Для трансмукозального или чрескожного введения в составе используются пенетранты, подходящие для проницаемого барьера. Такие пенетранты обычно известны в данной области техники и включают, например, средства для трансмукозального введения, детергенты, соли желчных кислот и производные фузидовой кислоты. Трансмукозальное введение можетSterile injection solutions can be prepared by incorporating the active compound in the required amount into an appropriate diluent with one or a combination of the ingredients listed above, if necessary, followed by sterilization by filtration. Typically, dispersions are prepared by incorporating the active compound into a sterile vehicle that contains the basic dispersion medium and other necessary ingredients listed above. In the case of sterile powders for the preparation of sterile injection solutions, the preparation methods may be vacuum drying and freeze drying, which yield a powder of the active ingredient plus any additional desired ingredient from its solution, previously sterilized by filtration. For administration by inhalation, the compounds are delivered in the form of an aerosol spray from a pressurized container or dispenser that contains a suitable propellant, for example a gas such as carbon dioxide, or a nebulizer. Systemic administration can also be through mucous membranes or through the skin. For transmucosal or percutaneous administration, the formulation uses penetrants suitable for the permeable barrier. Such penetrants are generally known in the art and include, for example, transmucosal agents, detergents, bile salts and fusidic acid derivatives. Transmucosal administration can

- 103 046419 осуществляться с помощью назальных спреев или суппозиториев. Для чрескожного введения активные соединения включают в состав мазей, мазей, гелей или кремов, как это обычно известно в данной области техники. Соединения также могут быть приготовлены в форме суппозиториев (например, с обычными суппозиториевыми основами, такими как масло какао и другие глицериды) или удерживающих клизм для ректальной доставки.- 103 046419 carried out using nasal sprays or suppositories. For transdermal administration, the active compounds are formulated into ointments, ointments, gels or creams as is generally known in the art. The compounds may also be formulated as suppositories (eg, with conventional suppository bases such as cocoa butter and other glycerides) or retention enemas for rectal delivery.

В одном варианте осуществления активные соединения получают с носителями, которые будут защищать соединение от быстрого выведения из организма, например, состав с контролируемым высвобождением, включая имплантаты и микрокапсулированные системы доставки. Могут использоваться биоразлагаемые, биосовместимые полимеры, такие как этиленвинилацетат, полиангидриды, полигликолевая кислота, коллаген, полиортоэфиры и полимолочная кислота. Способы приготовления таких составов будут очевидны специалистам в данной области техники. Материалы также можно коммерчески получить от Alza Corporation и Nova Pharmaceuticals, Inc. Липосомные суспензии также можно использовать в качестве фармацевтически приемлемых носителей. Их можно приготовить способами, известными специалистам в данной области техники, например, как описано в патенте США № 4522811. Особенно предпочтительно составлять композиции для перорального или парентерального введения в виде единичной дозированной формы для простоты введения и единообразия дозировки. Единичная дозированная форма, как используется в данном документе, относится к физически дискретным единицам, подходящим в качестве единичных доз для субъекта, подлежащего лечению, с каждой единицей дозирования, содержащей заранее определенное количество активного соединения, рассчитанное для получения желаемого терапевтического эффекта в сочетании с необходимым фармацевтическим носителем. Спецификация стандартных дозированных форм по настоящему описанию продиктована и напрямую зависит от уникальных характеристик активного соединения и конкретного терапевтического эффекта, который должен быть достигнут, а также ограничений, присущих области создания такого функционального соединения для лечения индивидуумов. Фармацевтические композиции могут быть включены в контейнер, упаковку или дозатор вместе с инструкциями по применению.In one embodiment, the active compounds are formulated with carriers that will protect the compound from rapid elimination from the body, such as a controlled release formulation, including implants and microencapsulated delivery systems. Biodegradable, biocompatible polymers such as ethylene vinyl acetate, polyanhydrides, polyglycolic acid, collagen, polyorthoesters and polylactic acid can be used. Methods for preparing such compositions will be apparent to those skilled in the art. Materials are also available commercially from Alza Corporation and Nova Pharmaceuticals, Inc. Liposomal suspensions can also be used as pharmaceutically acceptable carriers. They can be prepared by methods known to those skilled in the art, for example, as described in US Pat. No. 4,522,811. It is particularly preferable to formulate compositions for oral or parenteral administration in unit dosage form for ease of administration and uniformity of dosage. Unit dosage form, as used herein, refers to physically discrete units suitable as unitary dosages for a subject to be treated, with each dosage unit containing a predetermined amount of active compound calculated to produce the desired therapeutic effect in combination with the required pharmaceutical carrier. The specification of unit dosage forms herein is dictated by and is directly dependent on the unique characteristics of the active compound and the particular therapeutic effect to be achieved, as well as the limitations inherent in the art of creating such a functional compound for the treatment of individuals. The pharmaceutical compositions may be included in a container, package or dispenser along with instructions for use.

5.7. Применение и способы.5.7. Application and methods.

5.7.1. Способы производства миниатюризированного дистрофина5.7.1. Methods for producing miniaturized dystrophin

В настоящем изобретении также раскрыты способы получения полипептида миниатюризированного дистрофина, включающие: культивирование клетки-хозяина, раскрытой в данном документе, в подходящих условиях и выделение полипептида миниатюризированного дистрофина.The present invention also discloses methods for producing a miniaturized dystrophin polypeptide, comprising: culturing a host cell as disclosed herein under suitable conditions and isolating the miniaturized dystrophin polypeptide.

Используемый в данном документе термин выделенный полинуклеотид или молекула нуклеиновой кислоты означает молекулу, которая отделена от других молекул нуклеиновой кислоты, которые присутствуют в природном источнике (например, у мыши или человека) молекулы нуклеиновой кислоты. Более того, выделенная молекула нуклеиновой кислоты, такая как молекула кДНК, может быть по существу свободной от другого клеточного материала или культуральной среды при получении рекомбинантными способами или практически не содержать химических предшественников или других химических соединений при химическом синтезе. Например, выражение по существу свободна включает препараты полинуклеотида или молекулы нуклеиновой кислоты, содержащие менее, чем около 15, 10, 5, 2, 1, 0,5 или 0,1% (в частности, менее, чем около 10%) другого материала, например, клеточного материала, питательной среды, других молекул нуклеиновых кислот, химических предшественников и/или других химикатов. В конкретном варианте осуществления молекула(ы) нуклеиновой кислоты, кодирующая полипептид, описанный в данном документе, выделена или очищена.As used herein, the term isolated polynucleotide or nucleic acid molecule means a molecule that is separated from other nucleic acid molecules that are present in a natural source (eg, mouse or human) of the nucleic acid molecule. Moreover, an isolated nucleic acid molecule, such as a cDNA molecule, may be substantially free of other cellular material or culture medium when produced by recombinant methods, or substantially free of chemical precursors or other chemical compounds when chemically synthesized. For example, the expression essentially free includes preparations of polynucleotide or nucleic acid molecules containing less than about 15, 10, 5, 2, 1, 0.5 or 0.1% (especially less than about 10%) of other material , for example, cellular material, culture medium, other nucleic acid molecules, chemical precursors and/or other chemicals. In a specific embodiment, the nucleic acid molecule(s) encoding a polypeptide described herein is isolated or purified.

Полинуклеотиды могут быть получены и нуклеотидная последовательность полинуклеотидов может быть определена любым способом, известным в данной области техники. Нуклеотидные последовательности, кодирующие полипептиды, описанные в данном документе, например, полипептиды, описанные в табл. 3 и 4, и модифицированные версии данных полипептидов могут быть определены с использованием способов, хорошо известных в данной области техники, то есть, нуклеотидные кодоны, которые, как известно, кодируют определенные аминокислоты, собираются таким образом, чтобы генерировать нуклеиновую кислоту, кодирующую полипептиды. Такой полинуклеотид, кодирующий полипептид, может быть собран из химически синтезированных олигонуклеотидов (например, как описано в Kutmeier G et al., (1994), BioTechniques 17: 242-6), что, вкратце, включает синтез перекрывающихся олигонуклеотидов, содержащих части последовательности, кодирующей полипептид, отжиг и лигирование данных олигонуклеотидов и затем амплификацию лигированных олигонуклеотидов с помощью ПЦР.Polynucleotides can be prepared and the nucleotide sequence of the polynucleotides can be determined by any method known in the art. Nucleotide sequences encoding the polypeptides described herein, for example, the polypeptides described in table. 3 and 4, and modified versions of these polypeptides can be determined using methods well known in the art, that is, nucleotide codons that are known to encode specific amino acids are assembled so as to generate nucleic acid encoding the polypeptides. Such a polynucleotide encoding a polypeptide can be assembled from chemically synthesized oligonucleotides (for example, as described in Kutmeier G et al., (1994), BioTechniques 17: 242-6), which, in brief, involves the synthesis of overlapping oligonucleotides containing portions of the sequence encoding a polypeptide, annealing and ligating these oligonucleotides, and then amplifying the ligated oligonucleotides using PCR.

В качестве альтернативы, полинуклеотид, кодирующий полипептид, описанный в данном документе, может быть получен из нуклеиновой кислоты из подходящего источника (например, гибридомы) с использованием способов, хорошо известных в данной области техники (например, ПЦР и других способов молекулярного клонирования). Например, ПЦР-амплификация с использованием синтетических праймеров, гибридизируемых с 3'- и 5'-концами известной последовательности, может выполняться с использованием геномной ДНК, полученной из клеток гибридомы, продуцирующих интересующий полипептид. Такие способы ПЦР-амплификации можно использовать для получения нуклеиновых кислот, содержащих последовательность, кодирующую, например, IL2, линкерную последовательность или IL2Ra. Амплифицированные нуклеиновые кислоты можно клонировать в векторы для экспрессии в клеткахAlternatively, a polynucleotide encoding a polypeptide described herein can be obtained from nucleic acid from a suitable source (eg, a hybridoma) using methods well known in the art (eg, PCR and other molecular cloning methods). For example, PCR amplification using synthetic primers hybridizing to the 3' and 5' ends of a known sequence can be performed using genomic DNA obtained from hybridoma cells producing the polypeptide of interest. Such PCR amplification methods can be used to produce nucleic acids containing a sequence encoding, for example, IL2, a linker sequence, or IL2Ra. Amplified nucleic acids can be cloned into vectors for expression in cells

- 104 046419 хозяевах и для дальнейшего клонирования, например, для получения полипептидов.- 104 046419 hosts and for further cloning, for example, to obtain polypeptides.

Если клон, содержащий нуклеиновую кислоту, кодирующую конкретный полипептид, недоступен, но последовательность молекулы полипептида известна, нуклеиновая кислота, кодирующая полипептид, может быть химически синтезирована или получена из подходящего источника (например, библиотека кДНК или библиотека кДНК, полученная из нуклеиновой кислоты, предпочтительно поли А+РНК, выделенной из любой ткани или клеток, экспрессирующих представляющие интерес белки, например, из гибридомных клеток, выбранных для экспрессии полипептида, описанного в данном документе) путем ПЦР-амплификации с использованием синтетических праймеров, гибридизируемых с 3' и 5'-концами последовательности, или путем клонирования с использованием олигонуклеотидного зонда, специфичного для конкретной последовательности гена, для идентификации, например, клона кДНК из библиотеки кДНК, кодирующей полипептиды. Амплифицированные нуклеиновые кислоты, полученные с помощью ПЦР, затем можно клонировать в реплицируемые клонирующие векторы с использованием любого способа, хорошо известного в данной области техники.If a clone containing the nucleic acid encoding a particular polypeptide is not available, but the sequence of the polypeptide molecule is known, the nucleic acid encoding the polypeptide can be chemically synthesized or obtained from a suitable source (for example, a cDNA library or a cDNA library derived from a nucleic acid, preferably a polypeptide A+RNA isolated from any tissue or cells expressing proteins of interest, for example, from hybridoma cells selected to express a polypeptide described herein) by PCR amplification using synthetic primers hybridized to the 3' and 5' ends sequence, or by cloning using an oligonucleotide probe specific for a particular gene sequence to identify, for example, a cDNA clone from a cDNA library encoding polypeptides. The amplified nucleic acids obtained by PCR can then be cloned into replicable cloning vectors using any method well known in the art.

ДНК, кодирующая полипептиды, описанные в данном документе, может быть легко выделена и секвенирована с использованием обычных процедур (например, с использованием олигонуклеотидных зондов, которые способны специфически связываться с генами, кодирующими полипептиды, раскрытые в данном документе). Гибридомные клетки могут служить источником такой ДНК. После выделения ДНК может быть помещена в векторы экспрессии, которые затем трансфицируются в клетки-хозяева, такие как клетки E.coli, клетки COS обезьян, клетки яичника китайского хомячка (СНО) (например, клетки СНО из системы СНО GS SYSTEM™ (Lonza)) или миеломные клетки, которые иначе не продуцируют белок иммуноглобулина, для получения синтеза полипептидов в рекомбинантных клеткаххозяевах.DNA encoding the polypeptides disclosed herein can be readily isolated and sequenced using conventional procedures (eg, using oligonucleotide probes that are capable of specifically binding to the genes encoding the polypeptides disclosed herein). Hybridoma cells can serve as a source of such DNA. Once isolated, the DNA can be placed into expression vectors which are then transfected into host cells such as E. coli cells, monkey COS cells, Chinese Hamster Ovary (CHO) cells (e.g. CHO cells from the CHO GS SYSTEM™ (Lonza) ) or myeloma cells that do not otherwise produce immunoglobulin protein, to produce polypeptide synthesis in recombinant host cells.

5.7.1. Терапевтические применения и способы5.7.1. Therapeutic uses and methods

Миниатюризированные полипептиды дистрофина, полинуклеотиды, кодирующие миниатюризированные полипептиды дистрофина, векторы (например, rAAV), несущие полинуклеотиды, кодирующие миниатюризированные полипептиды дистрофина, и способы, описанные в данном документе, имеют множество применений in vitro и in vivo. Так, например, нуклеотидную последовательность, кодирующую полипептид миниатюризированного дистрофина, например, вектор, например, вектор AAV, или полипептиды, описанные в данном документе, можно вводить в клетки в культуре, in vitro или ex vivo или человеческим субъектам, например, in vivo, для лечения болезней. Соответственно, в данном документе раскрыты терапевтические способы с применением любой из молекул нуклеиновой кислоты миниатюризированного дистрофина, раскрытых в данном документе, полипептидов, раскрытых в данном документе, клеток-хозяев, раскрытых в данном документе, векторов, раскрытых в данном документе, или фармацевтических композиций, раскрытых в данном документе, или любой их комбинации.Miniaturized dystrophin polypeptides, polynucleotides encoding miniaturized dystrophin polypeptides, vectors (eg, rAAV) carrying polynucleotides encoding miniaturized dystrophin polypeptides, and the methods described herein have a variety of in vitro and in vivo applications. Thus, for example, a nucleotide sequence encoding a miniaturized dystrophin polypeptide, e.g., a vector, e.g., an AAV vector, or polypeptides described herein, can be introduced into cells in culture, in vitro or ex vivo, or into human subjects, e.g., in vivo, for the treatment of diseases. Accordingly, disclosed herein are therapeutic methods using any of the miniaturized dystrophin nucleic acid molecules disclosed herein, polypeptides disclosed herein, host cells disclosed herein, vectors disclosed herein, or pharmaceutical compositions, disclosed herein, or any combination thereof.

В некоторых вариантах осуществления в данном документе раскрыт способ экспрессии полипептида миниатюризированного дистрофина у субъекта, нуждающегося в этом, включающий введение субъекту нуклеиновой кислоты, раскрытой в данном документе, вектора, раскрытого в данном документе, клетки-хозяина, раскрытой в данном документе, или фармацевтической композиции, раскрытой в данном документе. В некоторых вариантах осуществления в данном документе раскрыт способ лечения субъекта, страдающего заболеванием или состоянием, включающий введение субъекту нуклеиновой кислоты, раскрытой в данном документе, вектора, раскрытого в данном документе, полипептида, раскрытого в данном документе, клетки-хозяина, раскрытой в данном документе, или фармацевтической композиции, раскрытой в данном документе. В некоторых вариантах осуществления заболевание представляет собой мышечную дистрофию Дюшена (DMD), мышечную дистрофию Беккера (BMD), Х-сцепленную дилатационную кардиомиопатию (XLDC), фациально-лопаточно-плечевую мышечную дистрофию, миотоническую мышечную дистрофию, онечностно-поясную мышечную дистрофию, окулофарингеальную мышечную дистрофию, мышечную дистрофию Эмери-Дрейфуса, дистальную мышечную дистрофию и/или врожденную мышечную дистрофию. В других вариантах осуществления заболевание, которое необходимо лечить, представляет собой саркопению, болезнь сердца, кахексию.In some embodiments, disclosed herein is a method for expressing a miniaturized dystrophin polypeptide in a subject in need thereof, comprising administering to the subject a nucleic acid disclosed herein, a vector disclosed herein, a host cell disclosed herein, or a pharmaceutical composition. disclosed in this document. In some embodiments, disclosed herein is a method of treating a subject suffering from a disease or condition, comprising administering to the subject a nucleic acid disclosed herein, a vector disclosed herein, a polypeptide disclosed herein, a host cell disclosed herein , or a pharmaceutical composition disclosed herein. In some embodiments, the disease is Duchenne muscular dystrophy (DMD), Becker muscular dystrophy (BMD), X-linked dilated cardiomyopathy (XLDC), facioscapulohumeral muscular dystrophy, myotonic muscular dystrophy, limb-girdle muscular dystrophy, oculopharyngeal muscular dystrophy dystrophy, Emery-Dreyfus muscular dystrophy, distal muscular dystrophy and/or congenital muscular dystrophy. In other embodiments, the disease to be treated is sarcopenia, heart disease, cachexia.

В некоторых вариантах осуществления молекула нуклеиновой кислоты, раскрытая в данном документе, полипептид, раскрытый в данном документе, вектор (например, rAAV), раскрытый в данном документе, клетка-хозяин, раскрытая в данном документе, или фармацевтическая композиция, раскрытая в данном документе, вводится внутривенно, чрескожно, внутрикожно, подкожно, перорально или легочно, или любая их комбинацию. В некоторых вариантах осуществления молекула нуклеиновой кислоты, раскрытая в данном документе, полипептид, раскрытый в данном документе, вектор, раскрытый в данном документе, клетка-хозяин, раскрытая в данном документе, или фармацевтическая композиция, раскрытая в данном документе, вводится топикально, через слизистую оболочку эпидермиса, интраназальным, пероральным, вагинальным, ректальным, сублингвальным, местным, внутривенным, внутрибрюшинным, внутримышечным, внутриартериальным, интратекальным, внутрилимфатическим, внутриочаговым, интракапсульным, внутриглазничным, внутрисердечным, внутрикожным, транстрахеальным, подкожным, субкутикулярным, внутрисуставным, субкапсулярным, субарахноидальным, интраспинальным, эпидуральным или внутригрудинным путем. В некоторых вариантах осуществления молекулу нуклеиновойIn some embodiments, a nucleic acid molecule disclosed herein, a polypeptide disclosed herein, a vector (e.g., rAAV) disclosed herein, a host cell disclosed herein, or a pharmaceutical composition disclosed herein, administered intravenously, transdermally, intradermally, subcutaneously, orally or pulmonaryly, or any combination thereof. In some embodiments, a nucleic acid molecule disclosed herein, a polypeptide disclosed herein, a vector disclosed herein, a host cell disclosed herein, or a pharmaceutical composition disclosed herein is administered topically, transmucosally. membrane of the epidermis, intranasal, oral, vaginal, rectal, sublingual, local, intravenous, intraperitoneal, intramuscular, intraarterial, intrathecal, intralymphatic, intralesional, intracapsular, intraorbital, intracardiac, intradermal, transtracheal, subcutaneous, subcuticular, intraarticular, subcapsular, subarachnoid, intraspinal , epidural or intrathoracic route. In some embodiments, the nucleic acid molecule

- 105 046419 кислоты, вектор (например, rAAV), клетку-хозяина, как описано в данном документе, или полипептид вводят внутривенно.- 105 046419 acid, vector (eg, rAAV), host cell as described herein, or polypeptide is administered intravenously.

В некоторых вариантах осуществления способ лечения дополнительно включает введение субъекту второго средства.In some embodiments, the method of treatment further includes administering a second agent to the subject.

Используемый в данном документе термин субъект включает любого человека или животное, не относящееся к человеку. Например, способы и композиции, описанные в данном документе, можно применять для лечения субъекта, болеющего раком. Термин животное, не относящееся к человеку включает всех позвоночных, например, млекопитающих и не млекопитающих, таких как не относящиеся к человеку приматы, овцы, собаки, коровы, куры, земноводные, рептилии и т.д. В некоторых вариантах осуществления субъектом является человек.As used herein, the term subject includes any human or non-human animal. For example, the methods and compositions described herein can be used to treat a subject with cancer. The term non-human animal includes all vertebrates, such as mammals and non-mammals, such as non-human primates, sheep, dogs, cows, chickens, amphibians, reptiles, etc. In some embodiments, the subject is a human.

В некоторых вариантах осуществления введение субъекту молекулы нуклеиновой кислоты, вектора (например, rAAV), полипептида, клетки-хозяина или фармацевтической композиции приводит к повышению экспрессии белка дистрофина по сравнению с экспрессией белка дистрофина у субъекта до введения, причем экспрессия белка дистрофина увеличивается по меньшей мере около в 2 раза, по меньшей мере около в 3 раза, по меньшей мере около в 4 раза, по меньшей мере около в 5 раз, по меньшей мере около в 6 раз, по меньшей мере около в 7 раз, по меньшей мере около в 8 раз, по меньшей мере около в 9 раз, по меньшей мере около в 10 раз, по меньшей мере около в 11 раз, по меньшей мере около в 12 раз, по меньшей мере около в 13 раз, по меньшей мере около в 14 раз, по меньшей мере около в 15 раз, по меньшей мере около в 20 раз, по меньшей мере около в 25 раз, по меньшей мере около в 30 раз, по меньшей мере около в 35 раз, по меньшей мере около в 40 раз, по меньшей мере около в 50 раз, по меньшей мере около в 60 раз, по меньшей мере около в 70 раз, по меньшей мере около в 80 раз, по меньшей мере около в 90 раз или по меньшей мере около в 100 раз. В некоторых аспектах настоящего изобретения способ содержит или дополнительно содержит введение терапии AAV субъекту. В некоторых вариантах осуществления терапия AAV включает введение рекомбинантного AAV. Любой рекомбинантный AAV, известный в данной области техники и/или описанный в данном документе, можно применять в способах по настоящему изобретению. В некоторых вариантах осуществления изобретения терапия AAV включает введение AAV, выбранного из группы, состоящей из AAV типа 1, AAV типа 2, AAV типа 3 (включая типы 3А и 3В), AAV типа 4, AAV типа 5, AAV типа 6, AAV типа 7, AAV типа 8, AAV типа 9, AAV типа 10, AAV типа 11, AAV типа 12, AAV типа 13, змеиного AAV, птичьего AAV, бычьего AAV, собачьего AAV, лошадиного AAV, овечьего AAV, козьего AAV, креветочного AAV и любой их комбинации. В некоторых вариантах осуществления терапия AAV включает введение AAV типа 1. В некоторых вариантах осуществления терапия AAV включает введение AAV типа 2. В некоторых вариантах осуществления терапия AAV включает введение AAV типа 3. В некоторых вариантах осуществления терапия AAV включает введение AAV типа 4. В некоторых вариантах осуществления терапия AAV включает введение AAV типа 5. В некоторых вариантах осуществления терапия AAV включает введение AAV типа 6. В некоторых вариантах осуществления терапия AAV включает введение AAV типа 7. В некоторых вариантах осуществления В некоторых вариантах осуществления терапия AAV включает введение AAV типа 8. В некоторых вариантах осуществления терапия AAV включает введение AAV типа 9. В некоторых вариантах осуществления терапия AAV включает введение AAV типа 10. В некоторых вариантах осуществления терапия AAV включает введение AAV типа 11. В некоторых вариантах осуществления терапия AAV включает введение AAV типа 12. В некоторых вариантах осуществления терапия AAV включает введение AAV типа 13. В некоторых вариантах осуществления лечение субъекта молекулами нуклеиновой кислоты миниатюризированного дистрофина, раскрытыми в данном документе, полипептидами, раскрытыми в данном документе, клетками-хозяевами, раскрытыми в данном документе, векторами, раскрытыми в данном документе, или фармацевтическими композициями, раскрытыми в данном документе, или любой их комбинацией не вызывает значительные воспалительные реакции, например, иммуноопосредованный пневмонит, иммуноопосредованный колит, иммуноопосредованный гепатит, иммуноопосредованный нефрит или почечную дисфункцию, иммуноопосредованный гипофизит, иммуноопосредованный гипотиреоз и гипертиреоз или другие иммуноопосредованные побочные реакции. В некоторых вариантах осуществления лечение субъекта молекулами нуклеиновой кислоты миниатюризированного дистрофина, раскрытыми в данном документе, полипептидами, раскрытыми в данном документе, клетками-хозяевами, раскрытыми в данном документе, векторами, раскрытыми в данном документе, фармацевтическими композициями, раскрытыми в данном документе, или любой их комбинацией не вызывает значительных сердечных расстройств, например, желудочковой аритмии; глазных заболеваний, например, иридоциклит; реакций, связанные с инфузией; повышения уровня амилазы, повышения уровня липазы; расстройств нервной системы, например, головокружение, периферическая и сенсорная невропатия; заболеваний кожи и подкожной ткани, например, сыпь, зуд, эксфолиативный дерматит, многоформная эритема, витилиго или псориаз; респираторных, торакальных и средостенных заболеваний, например, кашель; усталость; тошноту; снижение аппетита; запор; артралгию; или понос.In some embodiments, administration of a nucleic acid molecule, vector (e.g., rAAV), polypeptide, host cell, or pharmaceutical composition to a subject results in increased dystrophin protein expression compared to dystrophin protein expression in the subject prior to administration, wherein dystrophin protein expression is increased by at least about 2 times, at least about 3 times, at least about 4 times, at least about 5 times, at least about 6 times, at least about 7 times, at least about 100% 8 times, at least about 9 times, at least about 10 times, at least about 11 times, at least about 12 times, at least about 13 times, at least about 14 times , at least about 15 times, at least about 20 times, at least about 25 times, at least about 30 times, at least about 35 times, at least about 40 times, according to at least about 50 times, at least about 60 times, at least about 70 times, at least about 80 times, at least about 90 times, or at least about 100 times. In some aspects of the present invention, the method comprises or further comprises administering AAV therapy to a subject. In some embodiments, AAV therapy includes administration of recombinant AAV. Any recombinant AAV known in the art and/or described herein can be used in the methods of the present invention. In some embodiments, AAV therapy comprises administering an AAV selected from the group consisting of AAV type 1, AAV type 2, AAV type 3 (including types 3A and 3B), AAV type 4, AAV type 5, AAV type 6, AAV type 7, AAV type 8, AAV type 9, AAV type 10, AAV type 11, AAV type 12, AAV type 13, snake AAV, avian AAV, bovine AAV, canine AAV, equine AAV, ovine AAV, goat AAV, shrimp AAV and any combination of them. In some embodiments, the AAV therapy includes administration of AAV type 1. In some embodiments, the AAV therapy includes administration of AAV type 2. In some embodiments, the AAV therapy includes administration of AAV type 3. In some embodiments, the AAV therapy includes administration of AAV type 4. In some embodiments, the AAV therapy includes administration of AAV type 3. In some embodiments, the AAV therapy includes administration of AAV type 4. in embodiments, the AAV therapy includes administration of AAV type 5. In some embodiments, the AAV therapy includes administration of AAV type 6. In some embodiments, the AAV therapy includes administration of AAV type 7. In some embodiments, the AAV therapy includes administration of AAV type 8. In some embodiments, the AAV therapy includes administration of AAV type 9. In some embodiments, the AAV therapy includes administration of AAV type 10. In some embodiments, the AAV therapy includes administration of AAV type 11. In some embodiments, the AAV therapy includes administration of AAV type 12. In some embodiments, the AAV therapy includes administration of AAV type 11. In some embodiments, the AAV therapy includes administration of AAV type 12. in embodiments, therapy for AAV includes administration of AAV type 13. In some embodiments, treating the subject with miniaturized dystrophin nucleic acid molecules disclosed herein, polypeptides disclosed herein, host cells disclosed herein, vectors disclosed herein, or the pharmaceutical compositions disclosed herein, or any combination thereof, does not cause significant inflammatory reactions, for example, immune-mediated pneumonitis, immune-mediated colitis, immune-mediated hepatitis, immune-mediated nephritis or renal dysfunction, immune-mediated hypophysitis, immune-mediated hypothyroidism and hyperthyroidism, or other immune-mediated adverse reactions. In some embodiments, treating a subject with miniaturized dystrophin nucleic acid molecules disclosed herein, polypeptides disclosed herein, host cells disclosed herein, vectors disclosed herein, pharmaceutical compositions disclosed herein, or any their combination does not cause significant cardiac disorders, for example, ventricular arrhythmia; eye diseases, for example, iridocyclitis; infusion-related reactions; increasing amylase levels, increasing lipase levels; nervous system disorders, such as dizziness, peripheral and sensory neuropathy; diseases of the skin and subcutaneous tissue, for example, rash, itching, exfoliative dermatitis, erythema multiforme, vitiligo or psoriasis; respiratory, thoracic and mediastinal diseases, such as cough; fatigue; nausea; decreased appetite; constipation; arthralgia; or diarrhea.

5.8. Наборы5.8. Sets

В настоящем изобретении также раскрыты наборы, содержащие одну или несколько молекул нуклеиновых кислот, как раскрыто в данном документе, один или несколько векторов (например, rAAV), какThe present invention also discloses kits containing one or more nucleic acid molecules, as disclosed herein, one or more vectors (eg, rAAV), such as

- 106 046419 раскрыто в данном документе, один или несколько полипептидов, как раскрыто в данном документе, или одну или несколько клеток-хозяев, как раскрыто в данном документе, или любую их комбинацию. В некоторых вариантах осуществления набор также содержит инструкции по введению любого из вышеперечисленного или их комбинации субъекту, нуждающемуся в этом. Термины набор и система, используемые в данном документе, предназначены для обозначения по меньшей мере одной или нескольких молекул нуклеиновой кислоты, как раскрыто в данном документе, одного или нескольких векторов (например, rAAV), как раскрыто в данном документе, одного или нескольких полипептидов, как раскрыто в данном документе, или одной или нескольких клеток-хозяев, как раскрыто в данном документе, или любой их комбинации, которые в конкретных вариантах осуществления находятся в комбинации с одним или несколькими другими типами элементов или компонентов (например, с другими типами биохимических реагентов, контейнеров, упаковок, таких как упаковка, предназначенная для коммерческой продажи, инструкции по применению и тому подобное).- 106 046419 disclosed herein, one or more polypeptides as disclosed herein, or one or more host cells as disclosed herein, or any combination thereof. In some embodiments, the kit also contains instructions for administering any of the above, or a combination thereof, to a subject in need thereof. The terms set and system as used herein are intended to refer to at least one or more nucleic acid molecules as disclosed herein, one or more vectors (e.g., rAAV) as disclosed herein, one or more polypeptides, as disclosed herein, or one or more host cells as disclosed herein, or any combination thereof, which in particular embodiments are in combination with one or more other types of elements or components (e.g., other types of biochemical reagents , containers, packaging such as packaging intended for commercial sale, instructions for use and the like).

В некоторых вариантах осуществления раскрыт набор, содержащий (а) один или несколько полипептидов миниатюризированного дистрофина, как описано в данном документе, композицию, содержащую полипептид миниатюризированного дистрофина, как описано в данном документе, нуклеиновую кислоту, кодирующую полипептид миниатюризированного дистрофина, как описано в данном документе, вектор (например, rAAV) и/или клетку-хозяин; и (b) и инструкции по введению любого из вышеперечисленного субъекту, нуждающемуся в этом. В некоторых вариантах осуществления раскрыт набор, содержащий (а) полипептид миниатюризированного дистрофина, как описано в данном документе, и (b) и инструкции по введению полипептида миниатюризированного дистрофина субъекту, нуждающемуся в этом. В некоторых вариантах осуществления раскрывается набор, содержащий (а) композицию, содержащую полипептид миниатюризированного дистрофина, как описано в данном документе, и (b) и инструкции по введению композиции субъекту, нуждающемуся в этом. В некоторых вариантах осуществления раскрыт набор, содержащий (а) нуклеиновую кислоту, кодирующую полипептид миниатюризированного дистрофина, как описано в данном документе, и (b) и инструкции по введению нуклеиновой кислоты субъекту, нуждающемуся в этом. В некоторых вариантах осуществления раскрыт набор, содержащий (а) вектор, как описано в данном документе, и (b) и инструкции по введению вектора субъекту, нуждающемуся в этом. В некоторых вариантах осуществления раскрыт набор, содержащий (а) вектор AAV, как описано в данном документе, и (b) и инструкции по введению вектора субъекту, нуждающемуся в этом. В некоторых вариантах осуществления раскрыт набор, содержащий (а) клетку-хозяин, как описано в данном документе, и (b) и инструкции по введению клетки-хозяина субъекту, нуждающемуся в этом.In some embodiments, a kit is disclosed comprising (a) one or more miniaturized dystrophin polypeptides as described herein, a composition comprising a miniaturized dystrophin polypeptide as described herein, a nucleic acid encoding a miniaturized dystrophin polypeptide as described herein , vector (eg, rAAV) and/or host cell; and (b) and instructions for administering any of the foregoing to a subject in need thereof. In some embodiments, a kit is disclosed comprising (a) a miniaturized dystrophin polypeptide as described herein, and (b) and instructions for administering the miniaturized dystrophin polypeptide to a subject in need thereof. In some embodiments, a kit is disclosed comprising (a) a composition comprising a miniaturized dystrophin polypeptide as described herein, and (b) and instructions for administering the composition to a subject in need thereof. In some embodiments, a kit is disclosed comprising (a) a nucleic acid encoding a miniaturized dystrophin polypeptide as described herein, and (b) and instructions for administering the nucleic acid to a subject in need thereof. In some embodiments, a kit is disclosed comprising (a) a vector as described herein, and (b) and instructions for administering the vector to a subject in need thereof. In some embodiments, a kit is disclosed comprising (a) an AAV vector as described herein, and (b) and instructions for administering the vector to a subject in need thereof. In some embodiments, a kit is disclosed comprising (a) a host cell, as described herein, and (b) and instructions for administering the host cell to a subject in need thereof.

В конкретном варианте осуществления в данном документе обеспечивается фармацевтическая упаковка или набор, включающий один или несколько контейнеров, заполненных одним или несколькими ингредиентами фармацевтических композиций, описанных в данном документе, такими как один или несколько миниатюризированных пептидов дистрофина, обеспеченных в данном документе. В некоторых вариантах осуществления наборы содержат фармацевтическую композицию, описанную в данном документе, и любое профилактическое или терапевтическое средство, такое как те, которые описаны в данном документе. В некоторых вариантах осуществления наборы могут содержать Т-клеточный митоген, такой как, например, фитогемагглютинин (РНА) и/или форболмиристат ацетат (РМА), или антитело, стимулирующее комплекс TCR, такое как антитело против CD3 и антитело против CD28. С таким контейнером (контейнерами) необязательно может быть связано уведомление в форме, предписанной государственным агентством, регулирующим производство, применение или продажу фармацевтических или биологических продуктов, причем уведомление отражает одобрение агентством производства, применения или продажи для введения человеку. В данном документе также обеспечиваются наборы, которые можно применять в вышеупомянутых способах. В одном варианте осуществления набор включает полипептид миниатюризированного дистрофина, описанный в данном документе, предпочтительно очищенный полипептид миниатюризированного дистрофина, в одном или нескольких контейнерах. В конкретном варианте осуществления описанные в данном документе наборы содержат по существу выделенный полипептид миниатюризированного дистрофина в качестве контроля. В другом конкретном варианте осуществления описанные в данном документе наборы дополнительно содержат контрольный белок, который не реагирует с антигеном полипептида миниатюризированного дистрофина. В другом конкретном варианте осуществления наборы, описанные в данном документе, содержат один или более элементы для определения связывания полипептида миниатюризированного дистрофина с антигеном дистрофина (например, полипептид миниатюризированного дистрофина может быть конъюгирован с обнаруживаемым субстратом, таким как флуоресцентное соединение, ферментативный субстрат, радиоактивное соединение или люминесцентное соединение, или второе антитело, которое распознает первое антитело, может быть конъюгировано с детектируемым субстратом). В конкретных вариантах осуществления набор, обеспеченный в данном документе, может включать рекомбинантно полученный или химически синтезированный полипептид миниатюризированного дистрофина. Антиген к полипептиду миниатюризированного дистрофина, раскрытому в данном документе, как это предусмотрено в наборе, также может быть прикреплен к твердой подложке. В более конкретном варианте осуществления средство обнаружеIn a specific embodiment, provided herein is a pharmaceutical package or kit including one or more containers filled with one or more ingredients of the pharmaceutical compositions described herein, such as one or more miniaturized dystrophin peptides provided herein. In some embodiments, the kits contain a pharmaceutical composition described herein and any prophylactic or therapeutic agent, such as those described herein. In some embodiments, the kits may contain a T cell mitogen, such as, for example, phytohemagglutinin (PHA) and/or phorbol myristate acetate (PMA), or a TCR complex stimulating antibody, such as an anti-CD3 antibody and an anti-CD28 antibody. Such container(s) may not necessarily be accompanied by a notice in a form prescribed by a government agency regulating the manufacture, use, or sale of pharmaceutical or biological products, the notice reflecting the agency's approval of the manufacture, use, or sale for administration to humans. Also provided herein are kits that can be used in the above methods. In one embodiment, the kit includes a miniaturized dystrophin polypeptide described herein, preferably a purified miniaturized dystrophin polypeptide, in one or more containers. In a specific embodiment, the kits described herein contain a substantially isolated miniaturized dystrophin polypeptide as a control. In another specific embodiment, the kits described herein further contain a control protein that does not react with the miniaturized dystrophin polypeptide antigen. In another specific embodiment, the kits described herein contain one or more elements for determining the binding of a miniaturized dystrophin polypeptide to a dystrophin antigen (e.g., the miniaturized dystrophin polypeptide may be conjugated to a detectable substrate, such as a fluorescent compound, an enzymatic substrate, a radioactive compound, or a luminescent compound or second antibody that recognizes the first antibody may be conjugated to the detectable substrate). In specific embodiments, the kit provided herein may include a recombinantly produced or chemically synthesized miniaturized dystrophin polypeptide. The antigen to the miniaturized dystrophin polypeptide disclosed herein, as provided in the kit, can also be attached to a solid support. In a more specific embodiment, the means detects

- 107 046419 ния описанного выше набора включает твердую подложку, к которой прикреплен антиген полипептида миниатюризированного дистрофина. Такой набор может также включать несвязанное меченное репортером антитело против человека или антитело против мыши/крысы. В данном варианте осуществления связывание полипептида миниатюризированного дистрофина с антигеном может быть обнаружено путем связывания указанного меченного репортером антитела.- 107 046419 A variation of the kit described above includes a solid support to which a miniaturized dystrophin polypeptide antigen is attached. Such a kit may also include an unbound reporter-labeled anti-human antibody or an anti-mouse/rat antibody. In this embodiment, binding of the miniaturized dystrophin polypeptide to an antigen can be detected by binding of said reporter-labeled antibody.

Практика настоящего изобретения будет использовать, если не указано иное, обычные способы клеточной биологии, культуры клеток, молекулярной биологии, трансгенной биологии, микробиологии, рекомбинантной ДНК и иммунологии, которые находятся в пределах компетенции специалистов в данной области техники. Такие способы полностью объяснены в литературе. См., например, Sambrook et al., ed. (1989) Molecular Cloning A Laboratory Manual (2nd ed.; Cold Spring Harbor Laboratory Press); Sambrook et al., ed. (1992) Molecular Cloning: A Laboratory Manual, (Cold Springs Harbor Laboratory, NY); D. N. Glover ed., (1985) DNA Cloning, Volumes I and II; Gait, ed. (1984) Oligonucleotide Synthesis; Mullis et al. U.S. Pat. No. 4,683,195; Hames and Higgins, eds. (1984) Nucleic Acid Hybridization; Hames and Higgins, eds. (1984) Transcription And Translation; Freshney (1987) Culture Of Animal Cells (Alan R. Liss, Inc.); Immobilized Cells And Enzymes (IRL Press) (1986); Perbal (1984) A Practical Guide To Molecular Cloning; the treatise, Methods In Enzymology (Academic Press, Inc., N.Y.); Miller and Calos eds. (1987) Gene Transfer Vectors For Mammalian Cells, (Cold Spring Harbor Laboratory); Wu et al., eds., Methods In Enzymology, Vols. 154 and 155; Mayer and Walker, eds. (1987) Immunochemical Methods In Cell And Molecular Biology (Academic Press, London); Weir and Blackwell, eds., (1986) Handbook Of Experimental Immunology, Volumes I-IV; Manipulating the Mouse Embryo, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., (1986); Crooks, Antisense drug Technology: Principles, strategies and applications, 2nd Ed. CRC Press (2007) и в Ausubel et al. (1989) Current Protocols in Molecular Biology (John Wiley and Sons, Baltimore, Md.).The practice of the present invention will utilize, unless otherwise indicated, conventional methods of cell biology, cell culture, molecular biology, transgenic biology, microbiology, recombinant DNA and immunology, which are within the competence of those skilled in the art. Such methods are fully explained in the literature. See, for example, Sambrook et al., ed. (1989) Molecular Cloning A Laboratory Manual (2nd ed.; Cold Spring Harbor Laboratory Press); Sambrook et al., ed. (1992) Molecular Cloning: A Laboratory Manual, (Cold Springs Harbor Laboratory, NY); D. N. Glover ed., (1985) DNA Cloning, Volumes I and II; Gait, ed. (1984) Oligonucleotide Synthesis; Mullis et al. US Pat. No. 4,683,195; Hames and Higgins, eds. (1984) Nucleic Acid Hybridization; Hames and Higgins, eds. (1984) Transcription And Translation; Freshney (1987) Culture Of Animal Cells (Alan R. Liss, Inc.); Immobilized Cells And Enzymes (IRL Press) (1986); Perbal (1984) A Practical Guide To Molecular Cloning; the treatise, Methods In Enzymology (Academic Press, Inc., NY); Miller and Calos eds. (1987) Gene Transfer Vectors For Mammalian Cells, (Cold Spring Harbor Laboratory); Wu et al., eds., Methods In Enzymology, Vols. 154 and 155; Mayer and Walker, eds. (1987) Immunochemical Methods In Cell And Molecular Biology (Academic Press, London); Weir and Blackwell, eds., (1986) Handbook of Experimental Immunology, Volumes I-IV; Manipulating the Mouse Embryo, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, (1986); Crooks, Antisense drug technology: Principles, strategies and applications, 2 nd Ed. CRC Press (2007) and in Ausubel et al. (1989) Current Protocols in Molecular Biology (John Wiley and Sons, Baltimore, Md.).

Все ссылки, процитированные выше, а также все ссылки, процитированные здесь, и аминокислотные или нуклеотидные последовательности (например, номера GenBank и/или номера Uniprot), полностью включены в настоящий документ посредством ссылки. Следующие примеры предлагаются в качестве иллюстрации, а не в качестве ограничения.All references cited above, as well as all references cited herein, and amino acid or nucleotide sequences (eg, GenBank numbers and/or Uniprot numbers) are incorporated herein by reference in their entirety. The following examples are offered as illustrations and not as limitations.

6. Примеры.6. Examples.

6.1. Новые миниатюризированные дистрофины с пониженной иммуногенностью и повышенной стабильностью6.1. New miniaturized dystrophins with reduced immunogenicity and increased stability

Мутации в гене дистрофина часто приводят к нарушению стабильности соответствующего белка дистрофина, что, в свою очередь, приводит к протеосомной деградации нестабильного белка дистрофина и дистрофической патофизиологии. Точно так же миниатюризация кодирующей дистрофин ДНК для приведения ее в соответствие с ограниченной упаковочной емкостью AAV может ухудшить стабильность соответствующего миниатюризированного белка дистрофина.Mutations in the dystrophin gene often lead to disruption of the stability of the corresponding dystrophin protein, which in turn leads to proteasomal degradation of the unstable dystrophin protein and dystrophic pathophysiology. Likewise, miniaturization of dystrophin-encoding DNA to accommodate the limited packaging capacity of AAV may impair the stability of the corresponding miniaturized dystrophin protein.

Стабильность различных миниатюризированных белков-дистрофинов исследовали путем сравнения соотношений белок дистрофин :мРНК в клетках, трансфицированных соответствующими векторами экспрессии дистрофина. Были генерированы мужские сердечные миоциты (cardiac myocytes (iCM)), которые происходили от изогенных индуцированных плюрипотентных стволовых клеток человека (induced-pluripotent stem cell (iPSC)), которые несут преждевременный стоп-кодон Е2035Х в гене дистрофина, который предотвращает экспрессию эндогенного дистрофина. Данные клетки трансфицировали различными кассетами, экспрессирующими миниатюризированные белки дистрофина, и соотношения белок дистрофин: мРНК исследовали после того, как трансфицированные клетки культивировали in vitro в течение 24 дней. Уровни белка исследовали с помощью анализа ELISA Meso Scale Discovery (MSD) и уровни мРНК исследовали с помощью qrtPCR.The stability of various miniaturized dystrophin proteins was examined by comparing dystrophin protein:mRNA ratios in cells transfected with the corresponding dystrophin expression vectors. Male cardiac myocytes (iCM) were generated that were derived from human isogenic induced-pluripotent stem cells (iPSCs) that carry a premature stop codon E2035X in the dystrophin gene, which prevents the expression of endogenous dystrophin. These cells were transfected with various cassettes expressing miniaturized dystrophin proteins, and dystrophin protein:mRNA ratios were examined after the transfected cells were cultured in vitro for 24 days. Protein levels were examined using Meso Scale Discovery (MSD) ELISA assay and mRNA levels were examined using qrtPCR.

Протестированные миниатюризированные дистрофины и результаты испытаний представлены на фиг. 2 и 3, соответственно. Данные показали, что миниатюризированные пептиды дистрофина ВХА027741 (SEQ ID NO: 129) и ВХА-027743 (SEQ ID NO: 132) обеспечивают наилучшую стабильность белка.The miniaturized dystrophins tested and the test results are presented in FIG. 2 and 3, respectively. Data showed that miniaturized dystrophin peptides BXA027741 (SEQ ID NO: 129) and BXA-027743 (SEQ ID NO: 132) provided the best protein stability.

Впоследствии иммуногенность новых соединений, созданных в рамках данных двух наиболее стабильных конструкций, была протестирована с использованием инструмента прогнозирования иммуногенности in silico. Было установлено, что новые соединительные участки конструкции ВХА-027743 (М/линкер R16 (соединительный участок J1), R17/H3 и H3/R23 (соединительный участок J7)) (см. фиг. 4 и не показано) имеют минимальный иммуногенный риск, исходя из вышеупомянутого подхода in silico. Новые соединительные участки в конструкции ВХА-027741 (R1/R3 (соединительный участок J10), Н2/линкер R16 (соединительный участок J11) и R17/R24 (соединительный участок J9)) (см. фиг. 5) были проанализированы аналогичным образом. Было установлено, что соединительный участок J9 имеет минимальный иммуногенный риск, в то время как соединительные участки J10 и J11 могут быть улучшены.Subsequently, the immunogenicity of new compounds generated within these two most stable designs was tested using an in silico immunogenicity prediction tool. The new junction regions of the BXA-027743 construct (M/linker R16 (J1 junction), R17/H3 and H3/R23 (J7 junction)) (see FIG. 4 and not shown) were found to have minimal immunogenic risk, based on the above in silico approach. The new connecting regions in the BXA-027741 construct (R1/R3 (J10 connecting region), H2/linker R16 (J11 connecting region) and R17/R24 (J9 connecting region)) (see Fig. 5) were analyzed in a similar way. The J9 junction was found to have minimal immunogenic risk, while the J10 and J11 junctions could be improved.

Иммуногенный потенциал вышеупомянутых соединительных участков конструкции ВХА-027741 и вариантов соединительных участков в ней был протестирован с использованием анализа пролиферации Т-клеток in vitro, как описано ниже. Вкратце, образцы мононуклеарных клеток периферической крови (peripheral blood mononuclear cells (PBMC)) были выделены от здоровых добровольцев-людей с помощью центрифугирования в градиенте Ficoll (GE Healthcare) и охарактеризованы в отношении экспрессии чеThe immunogenic potential of the above junction regions of the BXA-027741 construct and variant junction regions therein was tested using an in vitro T cell proliferation assay as described below. Briefly, samples of peripheral blood mononuclear cells (PBMC) were isolated from healthy human volunteers by Ficoll gradient centrifugation (GE Healthcare) and characterized for their expression.

- 108 046419 ловеческого лимфоцитарного антигена (HLA) класса I и II с использованием комбинации полимеразной цепной реакции (ПЦР) амплификации и гибридизации с олигонуклеотидными зондами (Prolmmune, Сарасота, Флорида). Панель образцов РВМС от 40 доноров, имеющих профиль экспрессии HLA, близко совпадающий с частотами мировой популяции, использовали для дальнейшего анализа. Образцы РВМС были помечены CFSE (Invitrogen, Carlsbad, CA) для мониторинга пролиферации и помещены в 96луночные планшеты в шести повторах по 200000 клеток на лунку в RPMI (Lonza, Базель, Швейцария), содержащей 10% человеческого АВ (Bioreclamation, Westbury, NY.), заменимые аминокислоты и пенициллин-стрептомицин (оба Gibco/Fisher Scientific).- 108 046419 human lymphocyte antigen (HLA) class I and II using a combination of polymerase chain reaction (PCR) amplification and hybridization with oligonucleotide probes (Prolmmune, Sarasota, FL). A panel of PBMC samples from 40 donors having an HLA expression profile closely matching those of the global population was used for further analysis. PBMC samples were labeled with CFSE (Invitrogen, Carlsbad, CA) to monitor proliferation and plated in six replicates of 200,000 cells per well in 96-well plates in RPMI (Lonza, Basel, Switzerland) containing 10% human AB (Bioreclamation, Westbury, NY. ), nonessential amino acids, and penicillin-streptomycin (both Gibco/Fisher Scientific).

Соединительные пептиды ВХА-027741, их варианты и контрольные пептиды культивировали с панелью из 40 образцов РВМС при концентрации 1 мкМ в течение 7 дней, после чего среду смывали и клетки метили анти-CD4 и анти-CD8 АРС моноклональным антителом (BD Biosciences, Franklin Lake, NJ). После удаления промыванием несвязавшихся антител клетки фиксировали 3,7% формалином (Sigma, St. Louis, МО) в PBS и анализировали проточной цитометрией для определения процента пролиферирующих CD4+ клеток или CD8+ клеток.BXA-027741 junction peptides, variants, and control peptides were cultured with a panel of 40 PBMC samples at a concentration of 1 μM for 7 days, after which the medium was washed off and cells were labeled with anti-CD4 and anti-CD8 APC monoclonal antibody (BD Biosciences, Franklin Lake , NJ). After removing unbound antibodies by washing, cells were fixed with 3.7% formaldehyde (Sigma, St. Louis, MO) in PBS and analyzed by flow cytometry to determine the percentage of proliferating CD4+ cells or CD8+ cells.

Процент образцов (среди 40 донорских образцов), которые показали положительный ответ после семи дней культивирования с различными соединительными пептидами ВХА-027741 и их вариантами, определяемый как значительное увеличение количества пролиферирующих CD4+ или CD8+ Т клеток по сравнению с РВМС, инкубированными в среде без пептидов с соединительными участками или контрольных пептидов, показано на фиг. 6А (CD4+) и фиг. 6В (CD8+). В качестве контрольных пептидов использовали: (1) каркасный пептид авастина; (2) пептид VL6-VL CDR3; и (3) пептид PADRE-61309.Percentage of samples (among 40 donor samples) that showed a positive response after seven days of culture with various BXA-027741 junction peptides and their variants, defined as a significant increase in the number of proliferating CD4+ or CD8+ T cells compared to PBMC incubated in medium without peptides with connecting regions or control peptides is shown in FIG. 6A (CD4+) and FIG. 6B (CD8+). The following peptides were used as control: (1) Avastin scaffold peptide; (2) VL6-VL CDR3 peptide; and (3) peptide PADRE-61309.

Было обнаружено, что версия 3 соединительного участка J10 (J10v3) превосходит соединительный участок J10 и другие протестированные его версии, и что версия 12 соединительного участка J11 (J11v12) в целом превосходит в отношении иммуногенного риска соединительный участок J11.J10 junction version 3 (J10v3) was found to be superior to J10 junction and other versions tested, and that J11 junction version 12 (J11v12) was found to be generally superior to J11 junction in terms of immunogenic risk.

Затем С-концевой домен миниатюризированного дистрофина ВХА-027741 был удален с образованием миниатюризированного дистрофина ВХА-196473 (SEQ ID NO: 119) (фиг. 7), чтобы лучше приспособиться к ограниченной способности упаковки AAV. Затем J10v3 использовали для замены J10 и J11v12 использовали для замены J11 в миниатюризированном дистрофине ВХА-196473, что привело к миниатюризированному дистрофину ВХА-196477 (SEQ ID NO: 118) (фиг. 8А и 8В). Для создания J10v3 и J11v12 аминокислоты RV были вставлены между аминокислотами 446 и 447, и аминокислоты SEAQ были вставлены между аминокислотами 606 и 607, соответственно, в ВХА-196473 (SEQ ID NO: 1 19) (фиг. 8А и 8В).The C-terminal domain of miniaturized dystrophin BXA-027741 was then removed to generate miniaturized dystrophin BXA-196473 (SEQ ID NO: 119) (Fig. 7) to better accommodate the limited packaging capacity of AAV. J10v3 was then used to replace J10 and J11v12 was used to replace J11 in miniaturized dystrophin BXA-196473, resulting in miniaturized dystrophin BXA-196477 (SEQ ID NO: 118) (FIGS. 8A and 8B). To create J10v3 and J11v12, RV amino acids were inserted between amino acids 446 and 447, and SEAQ amino acids were inserted between amino acids 606 and 607, respectively, in BXA-196473 (SEQ ID NO: 1 19) (Fig. 8A and 8B).

ВХА-196473 (SEQ ID NO: 119) был дополнительно модифицирован другими версиями соединительных участков, протестированными следующим образом:BHA-196473 (SEQ ID NO: 119) was further modified with other versions of the connecting sections tested as follows:

ВХА-196474 (SEQ ID NO: 120): соединительный участок 9, версия 2 (J9v2) и соединительный участок 11, версия 12 (J11v12).BHA-196474 (SEQ ID NO: 120): Joint 9 Version 2 (J9v2) and Joint 11 Version 12 (J11v12).

ВХА-196475 (SEQ ID NO: 121): соединительный участок 9, версия 5 (J9v5) и соединительный участок 11, версия 12 (J11v12).BHA-196475 (SEQ ID NO: 121): Joint 9 Version 5 (J9v5) and Joint 11 Version 12 (J11v12).

ВХА-196476 (SEQ ID NO: 122): соединительный участок 9, версия 6 (J9v6) и соединительный участок 11, версия 12 (J11v12).BHA-196476 (SEQ ID NO: 122): Joint 9 Version 6 (J9v6) and Joint 11 Version 12 (J11v12).

ВХА-196478 (SEQ ID NO: 124): соединительный участок 10, версия 6 (J10v6) и соединительный участок 11, версия 12 (J11v12).BHA-196478 (SEQ ID NO: 124): Joint 10 Version 6 (J10v6) and Joint 11 Rev 12 (J11v12).

ВХА-196479 (SEQ ID NO: 125): соединительный участок 11, версия 12 (J11v12).BHA-196479 (SEQ ID NO: 125): Joint Section 11, Version 12 (J11v12).

J9v2 представляет собой замену аминокислот LER на KNI между доменом R17 и доменом R24, то есть аминокислот от 843 до 845 в ВХА-196473.J9v2 is a LER to KNI amino acid change between the R17 domain and the R24 domain, that is, amino acids 843 to 845 in BXA-196473.

J9v5 представляет собой вставку K между доменом R17 и доменом R24, то есть между аминокислотами 842 и 843 в ВХА-196473.J9v5 is a K insertion between the R17 domain and the R24 domain, that is, between amino acids 842 and 843 in BXA-196473.

J9v6 представляет собой вставку KNI между доменом R17 и доменом R24, то есть между аминокислотами 842 и 843 в ВХА-196473.J9v6 is a KNI insertion between the R17 domain and the R24 domain, that is, between amino acids 842 and 843 in BXA-196473.

J10v3 представляет собой вставку RV между доменами R1 и R3, то есть между аминокислотами 446 и 447 в ВХА-196473.J10v3 is an RV insertion between the R1 and R3 domains, that is, between amino acids 446 and 447 in BXA-196473.

J10v6 представляет собой вставку RVLLQDI между доменами R1 и R3, то есть между аминокислотами 446 и 447 в ВХА-196473.J10v6 is an RVLLQDI insertion between the R1 and R3 domains, that is, between amino acids 446 and 447 in BXA-196473.

J11v12 представляет собой вставку SEAQ между доменом Н2 и линкером перед доменом R16, то есть между аминокислотами 606 и 607 в ВХА-196473.J11v12 is a SEAQ insertion between the H2 domain and the linker upstream of the R16 domain, that is, between amino acids 606 and 607 in BXA-196473.

Полученные в результате миниатюризированные дистрофины затем тестировали на стабильность, как описано ранее (фиг. 9). Результаты показали, что конструкция ВХА-196477 миниатюризированного дистрофина (которая содержала J10V3 и J11V12) имела не только самый низкий иммуногенный риск, но также была наиболее стабильной. В дополнение, конструкция ВХА-212371 полипептида миниатюризированного дистрофина была модифицирована путем удаления последних трех С-концевых аминокислот и вставки последовательности варианта аминокислотного соединительного участка KNDL (J2V10; между доменом спектринового повтора 17 (R17) и шарнирным 3 (H3) доменом) после аминокислотной позиции 682 в ВХА-212371 (что приводит к миниатюризированному дистрофину ВХА-213788, SEQ ID NO: 152),The resulting miniaturized dystrophins were then tested for stability as described previously (Fig. 9). The results showed that the miniaturized dystrophin construct BXA-196477 (which contained J10V3 and J11V12) not only had the lowest immunogenic risk, but was also the most stable. In addition, the BXA-212371 miniaturized dystrophin polypeptide construct was modified by removing the last three C-terminal amino acids and inserting a KNDL variant junction amino acid sequence (J2V10; between spectrin repeat domain 17 (R17) and hinge 3 (H3) domain) after the amino acid position 682 in BXA-212371 (resulting in miniaturized dystrophin BXA-213788, SEQ ID NO: 152),

- 109 046419 которая, как было обнаружено, имеет более низкий иммуногенный риск.- 109 046419 which has been found to have a lower immunogenic risk.

6.2. Физиология in vitro6.2. Physiology in vitro

DMD iCM имеют более низкую амплитуду №1+-каналов. удлиненный cFPD (интервал Q-Т) и большую вариабельность частоты сердечных сокращений при сравнении с изогенными iCM дикого типа при использовании многоэлектродных матриц. DMD iCM также имеют более высокую трансдукцию Са2+ и более низкий импеданс, чем iCM дикого типа, при этом каждый способ подтверждает вариабельность частоты сердечных сокращений в нестимулированных клетках.DMD iCMs have lower amplitude of #1+ channels. prolonged cFPD (Q-T interval) and greater heart rate variability when compared with isogenic wild-type iCM when using multielectrode arrays. DMD iCMs also have higher Ca2+ transduction and lower impedance than wild-type iCMs, with each method confirming heart rate variability in unstimulated cells.

Исследовано, может ли экспрессия миниатюризированного дистрофина ВХА-196477 в DMD iCM, несущих мутацию Е2035Х, смягчить фенотип DMD и улучшить физиологические характеристики клеток. Мультиэлектродная регистрация, импедансный анализ сокращения и Са2+ транзиенты используются для измерения эффекта экспрессии миниатюризированного дистрофина. Авторы изобретения также удалили С-концевой домен ВХА-027743, чтобы получить ВХА-212371, чтобы лучше соответствовать ограниченной упаковочной емкости AAV. Функциональная способность ВХА-212371 ослаблять фенотип DMD и улучшать физиологические характеристики тех же клеток исследуется с использованием тех же аналитических процедур, что были предложены для ВХА196477.We investigated whether expression of miniaturized dystrophin BXA-196477 in DMD iCMs harboring the E2035X mutation could mitigate the DMD phenotype and improve the physiological characteristics of the cells. Multielectrode recording, contraction impedance analysis, and Ca2+ transients are used to measure the effect of miniaturized dystrophin expression. We also removed the C-terminal domain of BXA-027743 to generate BXA-212371 to better fit the limited packaging capacity of AAV. The functional ability of BXA-212371 to attenuate the DMD phenotype and improve the physiological characteristics of the same cells is examined using the same analytical procedures as proposed for BXA196477.

hiPSC-CM, использованные в данном исследовании, представляли собой DMD (E2035X) iCell, приобретенные у Cellular Dynamics International, Madison, Wisconsin. Фибробласты желудочков человека были приобретены у фирмы Lonza, Walkersville, Maryland. Сообщалось, что iCell hiPSC-CM обладают электрофизиологическими свойствами, близкими к первичным взрослым кардиомиоцитам, и аналогичным образом реагируют на ряд ингибиторов сердечных ионных каналов, а также на агонисты и антагонисты адренергических и мускариновых рецепторов. Собственная работа авторов изобретения показала, что совместное культивирование hiPSC-CM с фибробластами обеспечивает более стабильную подготовку к электрофизиологическим исследованиям с использованием многоэлектродных матриц (multielectrode arrays (MEA)). hiPSC-CM культивируют с 7% СО2 на 6-луночных культуральных планшетах, обработанных 0,1% желатином, в течение 7 дней, затем обрабатывают трипсином и разбавляют сердечными фибробластами взрослого человека в соотношении около 5:1. Суспензии hiPSC-CM и фибробластов затем совместно культивировали на покрытых ламинином 9-луночных планшетах с многоэлектродными матрицами (MEA) (256-9wellMEA300/30iR-ITO-mq; Multichannel Systems). hiPSC CM инфицировали экспрессионными конструкциями AAV9-mDys (экспрессирующими миниатюризированные дистрофины ВХА-196477 и ВХА-213788, фиг. 15D) при MOI 1 х 106 втечение 48 ч, и затем hiPSC-CM оценивали по воздействию на потенциалы внеклеточного поля (field potential (FP)) через 7 дней и 9 дней после заражения. Как ВХА-196477, так и ВХА-213788 значительно улучшили скорость проведения на ~ 80% по сравнению с DMD СМ (двусторонний дисперсионный анализ ***Р < 0,001 с последующим тестом Тьюки n = 6) (фиг. 15Е). Анализ ELISA на дистрофин подтвердил экспрессию дистрофина в клетках (фиг. 15F). Технология МЕА позволяет проводить пространственно-временной анализ возбудимых клеток или тканей с помощью матрицы встроенных в подложку внеклеточных электродов, на которой можно культивировать клетки или помещать ткани. Потенциалы внеклеточного поля (FP) регистрируются каждым электродом и соответствуют потенциалам клеточного действия. Оценка морфологии, продолжительности и скорости проводимости FP дает картину активности ионных каналов после обработки, а также влияния на реполяризацию и проводимость. После 7 дней культивирования hiPSC-CM на МЕА-планшетах клетки образовывали спонтанно сокращающийся монослой над записывающими электродами, вставленными в каждую лунку. Спонтанные FP регистрировались от 28 электродов на лунку (диаметр 30 мкм, расстояние от центра до центра 300 мкм) при частоте дискретизации 10 кГц с использованием программного обеспечения USB-MEA256-System и МС Rack для сбора данных (многоканальные системы). После 20-минутного периода уравновешивания в увлажненной среде при 37°С с постоянной подачей 5% CO2 и 95% O2 каждую лунку трансфицировали экспрессионными конструкциями AAV9-mDys в 300 мкл поддерживающей среды.The hiPSC-CMs used in this study were iCell DMDs (E2035X) purchased from Cellular Dynamics International, Madison, Wisconsin. Human ventricular fibroblasts were purchased from Lonza, Walkersville, Maryland. iCell hiPSC-CMs have been reported to have electrophysiological properties similar to primary adult cardiomyocytes and respond similarly to a range of cardiac ion channel inhibitors as well as adrenergic and muscarinic receptor agonists and antagonists. The inventors' own work has shown that co-culturing hiPSC-CM with fibroblasts provides a more consistent preparation for electrophysiological studies using multielectrode arrays (MEA). hiPSC-CMs were cultured with 7% CO 2 in 6-well culture plates treated with 0.1% gelatin for 7 days, then trypsinized and diluted with adult cardiac fibroblasts at a ratio of approximately 5:1. Suspensions of hiPSC-CMs and fibroblasts were then cocultured on laminin-coated 9-well multielectrode array (MEA) plates (256-9wellMEA300/30iR-ITO-mq; Multichannel Systems). hiPSC CMs were infected with AAV9-mDys expression constructs (expressing miniaturized dystrophins BXA-196477 and BXA-213788, Figure 15D) at an MOI of 1 x 10 6 for 48 h, and hiPSC-CMs were then assessed for effects on extracellular field potentials ( FP)) 7 days and 9 days after infection. Both BXA-196477 and BXA-213788 significantly improved conduction velocity by ~80% compared to DMD SM (two-way ANOVA ***P < 0.001 followed by Tukey's test n = 6) (Figure 15E). Dystrophin ELISA confirmed dystrophin expression in the cells (Figure 15F). MEA technology allows spatiotemporal analysis of excitable cells or tissues using an array of extracellular electrodes embedded in a substrate on which cells can be cultured or tissues placed. Extracellular field potentials (FPs) are recorded by each electrode and correspond to cellular action potentials. Assessing FP morphology, duration, and conduction velocity provides a picture of ion channel activity following treatment, as well as the effects on repolarization and conductance. After 7 days of culturing hiPSC-CMs on MEA plates, cells formed a spontaneously contracting monolayer over recording electrodes inserted into each well. Spontaneous FPs were recorded from 28 electrodes per well (diameter 30 μm, center-to-center distance 300 μm) at a sampling rate of 10 kHz using USB-MEA256-System software and MS Rack for data acquisition (multi-channel systems). After a 20-minute equilibration period in humidified medium at 37°C with a constant supply of 5% CO2 and 95% O2, each well was transfected with AAV9-mDys expression constructs in 300 μl of maintenance medium.

Эффекты экспрессии миниатюризированных дистрофинов на интервалы между импульсами (interpulse intervals (IPI)) FP контролировали и записывали. Данные были проанализированы с помощью специального программного обеспечения, написанного в MatLab (Mathworks). Частоту ударов (удары в минуту), служащую суррогатом частоты сердечных сокращений, рассчитывали с использованием BR = 60000/IPI, где IPI представляет собой усредненные IPI (мс) 100-секундной записи в установившемся режиме при каждом условии. Измеряемыми электрофизиологическими параметрами являются длительность потенциала поля, суррогат реполяризации, и скорость проведения потенциала поля. Длительность потенциала поля корректировалась с учетом изменений частоты ударов (beat rate changes (FPD)). Все обработки выполнялись не менее чем в 3-х повторностях.The effects of miniaturized dystrophin expression on FP interpulse intervals (IPI) were monitored and recorded. Data were analyzed using custom software written in MatLab (Mathworks). Beat rate (bpm), serving as a surrogate for heart rate, was calculated using BR = 60,000/IPI, where IPI is the averaged IPI (ms) of the 100-second steady-state recording in each condition. The electrophysiological parameters measured are field potential duration, repolarization surrogate, and field potential conduction velocity. The field potential duration was adjusted to account for beat rate changes (FPD). All treatments were performed in at least 3 replicates.

Скорость проведения определяли количественно путем измерения времени активации потенциала поля для каждого электрода, вставленного в лунку МЕА во время синхронизированного единичного распространяемого биения. Оцифрованные записи потенциалов поля от каждого электрода сглаживались по методу наименьших квадратов с использованием полинома сглаживания по 21 точке (Savitsky & Golay, 1964), с временным окном 2,1 мс. Время активации представляет собой значение пика отрицательной производной каждого волнового сигнала потенциала поля. Время между временем самой ранней активаConduction velocity was quantified by measuring the activation time of the field potential for each electrode inserted into the MEA well during a synchronized single propagated beat. Digitized field potential recordings from each electrode were smoothed by least squares using a 21-point smoothing polynomial ( Savitsky & Golay, 1964 ), with a time window of 2.1 ms. The activation time is the peak value of the negative derivative of each field potential waveform. Time between the time of the earliest asset

- 110 046419 ции и временем самой поздней активации представляет собой время проведения для распространения потенциала поля через монослой кардиомиоцитов, и расстояние между двумя соответствующими электродами представляет собой расстояние проведения. Время проведения потенциала, деленное на расстояние проведения, для каждого случая распространения потенциала представляет собой скорость проведения для каждого сокращения монослойных кардиомиоцитов в лунке МЕА (фиг. 15).- 110 046419 tion and the time of the latest activation represents the conduction time for propagation of the field potential through the monolayer of cardiomyocytes, and the distance between the two corresponding electrodes represents the conduction distance. The conduction time of the potential divided by the conduction distance for each potential propagation event represents the conduction velocity for each contraction of monolayer cardiomyocytes in the MEA well (Fig. 15).

Данные показывают, что обе конструкции миниатюризированных дистрофинов значительно улучшили скорость проведения (фиг. 15).The data show that both miniaturized dystrophin designs significantly improved conduction velocity (Figure 15).

6.3. In vivo восстановление физиологии скелетных мышц6.3. In vivo restoration of skeletal muscle physiology

Скелетные мышцы с дефицитом дистрофина производят меньшую удельную силу (силу на единицу площади) и очень восприимчивы к повреждениям, вызванным сокращением. Восстановление экспрессии дистрофина может смягчить данные нарушения. Дистрофических мышей mdx в возрасте 2 недель систематически лечат с помощью ретроорбитальной инъекции либо 2е14 vg/кг AAV9-C5-12-BXA-196477, либо AAV9-C5-12-BXA-212371. Физиологию мышц конечностей исследуют в 8-недельном возрасте. Вкратце, колено мыши зажимается, ступня помещается в стремя, и стремя перемещается, в то время как мышцы максимально сокращаются с помощью игольчатого электрода. Данный анализ измеряет пиковое подергивание и величину тетанической силы мышцы, а также повреждение, вызванное сокращением.Dystrophin-deficient skeletal muscles produce less specific force (force per unit area) and are very susceptible to contraction-induced damage. Restoring dystrophin expression may alleviate these disorders. Dystrophic mdx mice at 2 weeks of age are systemically treated with retroorbital injection of either 2e14 vg/kg AAV9-C5-12-BXA-196477 or AAV9-C5-12-BXA-212371. The physiology of the limb muscles is examined at 8 weeks of age. Briefly, the mouse's knee is clamped, the foot is placed in the stirrup, and the stirrup is moved while the muscles are maximally contracted using a needle electrode. This test measures the peak twitch and the magnitude of the muscle's tetanic force, as well as the damage caused by the contraction.

6.4. In vivo профилактика дистрофической патологии6.4. In vivo prevention of dystrophic pathology

Скелетные мышцы в модели DMD у мышей mdx обычно подвергаются некрозу и регенерации в возрасте, начиная приблизительно с 3-4 недель. Регенерированные мышцы обычно более разнообразны по размеру и содержат ядра, расположенные в центре на замороженных поперечных срезах. Кроме того, фиброз становится более распространенным в регенерированных мышцах. Измеряют размер мышечных волокон, долю центрально расположенных ядер и фиброз в необработанных мышцах mdx и мышцах mdx, обработанных либо AAV9-C5-12-BXA-196477, либо AAV9-C5-12-BXA-212371. Также количественно определяется доля мышечных волокон, экспрессирующих миниатюризированные дистрофины. Диафрагма, икроножная, передняя большеберцовая мышца и сердечные мышцы исследуются с помощью компьютерных программ визуализации HALO и Columbus.Skeletal muscle in the mdx mouse model of DMD typically undergoes necrosis and regeneration beginning at approximately 3–4 weeks of age. Regenerated muscles tend to be more variable in size and contain nuclei that are centrally located in frozen cross-sections. Additionally, fibrosis becomes more prevalent in regenerated muscles. Myofiber size, proportion of centrally located nuclei, and fibrosis were measured in untreated mdx muscle and mdx muscle treated with either AAV9-C5-12-BXA-196477 or AAV9-C5-12-BXA-212371. The proportion of muscle fibers expressing miniaturized dystrophins is also quantified. The diaphragm, gastrocnemius, tibialis anterior and cardiac muscles are examined using the HALO and Columbus computer imaging programs.

6.5. Исследование in vivo6.5. In vivo study

План исследования.Research plan.

Мышей mdx4cv в возрасте 2 недель обрабатывали 2e14vg/кг AAV9-BXA-196477 или AAV9-BXA213788. Через две недели после введения n=3 мышей умерщвляли для изучения целевого воздействия миниатюризированного дистрофина (биораспределение и уровни экспрессии). В возрасте 2 месяцев была исследована правая передняя большеберцовая мышца на прочность и устойчивость к повреждению, вызванному сокращением (n=10), аналогично ранее описанному (Khairallah et. al., 2012). Мышей умерщвляли в возрасте 3 месяцев и исследовали на предмет целевого воздействия и предотвращения дистрофин (фиг. 16).2-week-old mdx 4cv mice were treated with 2e14vg/kg AAV9-BXA-196477 or AAV9-BXA213788. Two weeks after administration, n=3 mice were sacrificed to study the target effects of miniaturized dystrophin (biodistribution and expression levels). At 2 months of age, the right tibialis anterior muscle was examined for strength and resistance to contraction-induced injury (n=10), similar to that previously described (Khairallah et. al., 2012). Mice were sacrificed at 3 months of age and examined for dystrophin targeting and prevention (FIG. 16).

Целевое воздействие.Target impact.

Иммунофлуоресценция. Мышцы замораживали в ОСТ в 2-метилбутаине в жидком N2. 10 мкм замороженных срезов иммуноокрашивали антителами к дистрофину (Mandys106; DSHB; 1:200) и агглютинину зародышей пшеницы, конъюгированному с Alexa-647. Антитело Alexa-488 IgG2a использовали для мечения первичного антитела к дистрофину. Срезы получали с помощью конфокального скринингового микроскопа Phoenix Opera High Content (Perkin-Elmer) и количественно оценивали с помощью программного обеспечения Columbus. Вкратце, изображения Alexa-647 были инвертированы, М-режим использовали для поиска клеток и расчета морфологии в выбранной популяции клеток в поперечных срезах <2000 мкм2. Далее рассчитывали интенсивность Alexa-488 и отбирали популяцию с интенсивностью больше, чем у контрольных mdx4cv мышц. Более 90% мышц у 4-недельных и 12-недельных мышей были положительными на миниатюризированный дистрофин (фиг. 17). мРНК - Для выделения суммарной РНК ткань гомогенизировали с помощью Qiagen Tissuelyzer и РНК выделяли с использованием набора Qiagen RNeasy 96 Universal tissue kit (номер в каталоге Qiagen 74881). Ткань (~ 15) помещали в микропробирки для сбора из набора RNeasy, содержащие 750 мкл реагента Qiazol и один стальной шарик размером 5 мм, гомогенизировали с использованием Tissuelyzer при 30 Гц в течение 2 мин и повторяли данный шаг до завершения гомогенизации с последующим центрифугированием при 6000xg в течение 1 мин при 4°С. В каждую пробирку добавляли 150 мл хлороформа и образцы интенсивно встряхивали в течение 15 с. После 3-минутной инкубации при комнатной температуре образцы центрифугировали при 6000xg в течение 15 мин при 4°С. Водную фазу отбирали (~360 мкл) и переносили в новую пробирку, содержащую 1 объем 70% EtOH, свободного от РНКазы. Все образцы переносили в 96-луночный планшет RNeasy 96, планшеты закрывали лентой AirPore и центрифугировали при 5600xg в течение 4 мин при комнатной температуре. 400 мкл буфера RW1 добавляли в каждую лунку, планшет снова закрывали и центрифугировали в течение 4 мин при 5600xg. Во время центрифугирования готовили исходный раствор ДНКазы, добавляя 550 мкл воды, свободной от РНКазы, на один флакон с ДНКазой. 670 мкл исходного раствора ДНКазы I разбавляли 7,3 мл буфера RDD, перемешивали и хранили при 4°С. Когда центрифугирование было завершено, проток отбрасывали и 80 мкл смеси ДНКазы I добавляли непосредстImmunofluorescence. Muscles were frozen in OCT in 2-methylbutane in liquid N2 . 10 μm frozen sections were immunostained with antibodies to dystrophin (Mandys106; DSHB; 1:200) and Alexa-647-conjugated wheat germ agglutinin. Alexa-488 IgG2a antibody was used to label the primary anti-dystrophin antibody. Sections were acquired using a Phoenix Opera High Content confocal screening microscope (Perkin-Elmer) and quantified using Columbus software. Briefly, Alexa-647 images were inverted and M-mode was used to search for cells and calculate morphology in a selected population of cells in <2000 μm 2 cross sections. Next, the intensity of Alexa-488 was calculated and a population with an intensity greater than that of control mdx 4cv muscles was selected. More than 90% of the muscles from 4-week and 12-week mice were positive for miniaturized dystrophin (Figure 17). mRNA - To isolate total RNA, tissue was homogenized using a Qiagen Tissuelyzer and RNA was isolated using the Qiagen RNeasy 96 Universal tissue kit (Qiagen catalog number 74881). Tissue (~15) was placed into microcollection tubes from the RNeasy kit containing 750 μl of Qiazol reagent and one 5 mm steel bead, homogenized using a Tissuelyzer at 30 Hz for 2 min and repeated until homogenization was complete, followed by centrifugation at 6000xg for 1 min at 4°C. 150 ml of chloroform was added to each tube and the samples were shaken vigorously for 15 s. After a 3-min incubation at room temperature, samples were centrifuged at 6000xg for 15 min at 4°C. The aqueous phase was withdrawn (~360 μl) and transferred to a new tube containing 1 volume of 70% RNase-free EtOH. All samples were transferred to an RNeasy 96 96-well plate, the plates were sealed with AirPore tape and centrifuged at 5600xg for 4 min at room temperature. 400 μl of buffer RW1 was added to each well, the plate was resealed and centrifuged for 4 min at 5600xg. During centrifugation, a DNase stock solution was prepared by adding 550 μL of RNase-free water per DNase vial. 670 μl of DNase I stock solution was diluted with 7.3 ml of RDD buffer, mixed and stored at 4°C. When centrifugation was completed, the flow was discarded and 80 μl of DNase I mixture was added directly.

- 111 046419 венно в центр каждой лунки, и планшет инкубировали при комнатной температуре в течение 15 мин. После инкубации в каждую лунку добавляли 400 мкл RW1 и планшет герметично закрывали и центрифугировали в течение 4 мин при 5600xg. Проток отбрасывали и добавляли 800 мкл буфера RPE к каждой лунке. Планшет снова герметично закрывали и центрифугировали в течение 4 мин при 5600xg. Данный процесс повторяли, и планшет центрифугировали в течение 10 мин при 5600xg. Затем каждый образец элюировали в неиспользованную пробирку путем добавления 60 мкл воды, свободной от РНКазы, в центр каждой лунки и центрифугирования в течение 4 мин при 5600xg. Для улучшения восстановления 60 мкл повторно наносили на планшет и центрифугировали еще 4 мин при 5600xg. Выход РНК количественно определяли с помощью прибора nanodrop 8000. ОТ-ПЦР - Для синтеза кДНК и последующей ПЦР 1 мкг РНК добавляли в 1 лунку 96-луночного планшета в 10 мкл H2O (Plate-Axygen, PCR-96-CS). В каждую лунку добавляли 10 мкл мастер-микса (High Capacity cDNA Reverse Transcription kit, Applied Biosystem) и центрифугировали планшет при 1000 об/мин. Синтез кДНК проводили при 25°С в течение 10 мин, 37°С в течение 120 мин, 85°С в течение 5 мин с последующей выдержкой при 4°С. Для кПЦР каждый образец анализировали в двух повторах с наборами праймеров/зондов (прямой праймер 5'TGGAAGATTGCTACGAGCGC-3'; обратный праймер 5'-CAGGTCGCTGAACAGGTTCT-3'; зонд^АМGCAAGTTCGGCAAGCAGCACA-MGBNFG) в 384-луночных прозрачных реакционных планшетах (applied biosystem; каталожный номер 4483285). К каждой реакционной смеси добавляли 2 мкл к ДНК и 8 мкл мастер-микса (5 мкл быстрого улучшенного мастер-микса, 0,5 мкл смеси 20Х FAM зонда/праймеров и 2,5 мкл воды) и планшеты центрифугировали в течение 1 мин при 1000 об/мин. Образцы инкубировали при 95°С в течение 20 с с последующими 40 циклами при 95°С в течение 1 с и 60°С в течение 20 с с использованием системы ViiA7 и программного обеспечения для ПЦР в реальном времени Quant Studio для анализа данных (Applied Biosystem).- 111 046419 in the center of each well, and the plate was incubated at room temperature for 15 minutes. After incubation, 400 μl of RW1 was added to each well and the plate was sealed and centrifuged for 4 min at 5600xg. The flow was discarded and 800 μl of RPE buffer was added to each well. The plate was sealed again and centrifuged for 4 min at 5600xg. This process was repeated and the plate was centrifuged for 10 min at 5600xg. Each sample was then eluted into an unused tube by adding 60 μl of RNase-free water to the center of each well and centrifuging for 4 min at 5600xg. To improve recovery, 60 μl was reapplied to the plate and centrifuged for an additional 4 min at 5600xg. RNA yield was quantified using a nanodrop 8000 instrument. RT-PCR - For cDNA synthesis and subsequent PCR, 1 μg of RNA was added to 1 well of a 96-well plate in 10 μl of H2O (Plate-Axygen, PCR-96-CS). 10 μl of master mix (High Capacity cDNA Reverse Transcription kit, Applied Biosystem) was added to each well and the plate was centrifuged at 1000 rpm. cDNA synthesis was carried out at 25°C for 10 min, 37°C for 120 min, 85°C for 5 min, followed by holding at 4°C. For qPCR, each sample was analyzed in duplicate with primer/probe sets (forward primer 5'TGGAAGATTGCTACGAGCGC-3'; reverse primer 5'-CAGGTCGCTGAACAGGTTCT-3'; probe^AMGCAAGTTCGGCAAGCAGCACA-MGBNFG) in 384-well transparent reaction plates (applied biosystem; catalog number 4483285). To each reaction mixture, 2 µl of DNA and 8 µl of master mix (5 µl of rapid improved master mix, 0.5 µl of 20X FAM probe/primer mix and 2.5 µl of water) were added and the plates were centrifuged for 1 min at 1000 rpm Samples were incubated at 95°C for 20 s followed by 40 cycles of 95°C for 1 s and 60°C for 20 s using the ViiA7 system and Quant Studio real-time PCR software for data analysis (Applied Biosystem ).

Выделение векторного генома/геномной ДНК и кПЦР - для выделения геномной ДНК ткань гомогенизировали с помощью Qiagen Tissuelyzer и геномную ДНК выделяли с использованием набора для крови и тканей Qiagen DNeasy 96 (номер в каталоге Qiagen 69581). Ткань (~10 мг) помещали в 96луночный планшет (costar assay block 1 мл, каталожный номер 3958), содержащий 200 мкл буфера ATL с протеиназой K и одну 5-миллиметровую стальную бусину, гомогенизировали с использованием Tissuelyzer 30 Гц, 2 мин, повторяли до завершения гомогенизации. Выделение геномной ДНК проводили с соблюдением инструкций производителя. Для кПЦР каждый образец анализировали в двух экземплярах с наборами праймеров/зондов (прямой праймер 5'-TGGAAGATTGCTACGAGCGC-3'; обратный праймер 5'-CAGGTCGCTGAACAGGTTCT-3'; зонд-6FAM-GCAAGTTCGGCAAGCAGCACA-MGBNFG) в 384луночных прозрачных реакционных планшетах (applied biosystem; каталожный номер 4483285). К каждой реакционной смеси добавляли 2 мкл геномной ДНК и 8 мкл мастер-микса (5 мкл быстрого улучшенного мастер-микса, 0,5 мкл смеси 20Х FAM зонда/праймеров и 2,5 мкл воды) и планшеты центрифугировали в течение 1 мин при 1000 об/мин. Образцы инкубировали при 95°С в течение 20 с с последующими 40 циклами при 95°С в течение 1 с и 60°С в течение 20 с с использованием системы ViiA7 и программного обеспечения для ПЦР в реальном времени Quant Studio для анализа данных (Applied Biosystem).Vector genome/genomic DNA isolation and qPCR - For genomic DNA isolation, tissue was homogenized using a Qiagen Tissuelyzer and genomic DNA was isolated using the Qiagen DNeasy 96 Blood and Tissue Kit (Qiagen catalog number 69581). Tissue (~10 mg) was placed in a 96-well plate (costar assay block 1 ml, catalog number 3958) containing 200 µl ATL buffer with proteinase K and one 5 mm steel bead, homogenized using a Tissuelyzer 30 Hz, 2 min, repeat until completion of homogenization. Genomic DNA extraction was carried out in accordance with the manufacturer's instructions. For qPCR, each sample was analyzed in duplicate with sets of primers/probes (forward primer 5'-TGGAAGATTGCTACGAGCGC-3'; reverse primer 5'-CAGGTCGCTGAACAGGTTCT-3'; probe-6FAM-GCAAGTTCGGCAAGCAGCACA-MGBNFG) in 384-well transparent reaction plates (applied biosystem ; catalog number 4483285). To each reaction mixture, 2 μl of genomic DNA and 8 μl of master mix (5 μl of rapid improved master mix, 0.5 μl of 20X FAM probe/primer mix and 2.5 μl of water) were added and the plates were centrifuged for 1 min at 1000 rpm Samples were incubated at 95°C for 20 s followed by 40 cycles of 95°C for 1 s and 60°C for 20 s using the ViiA7 system and Quant Studio real-time PCR software for data analysis (Applied Biosystem ).

MSD-ELISA - экспрессию белка определяли с помощью анализа ELISA. 384-луночные планшеты для мультианализа (Meso Scale Discovery, каталожный номер L21XB-4) были предварительно покрыты моноклональным антителом Manex 1011b в концентрации 2 мкг/мл в бикарбонатном буфере в течение ночи. Затем планшеты блокировали блокирующим буфером (5% BSA в PBS) в течение 4 часов при встряхивании при комнатной температуре. Ткань (~20 мг) гомогенизировали в буфере ripa при концентрации 1 мг ткани/10 мкл лизирующего буфера (Sigma, каталожный номер R0278) с коктейльной таблеткой ингибиторов протеазы (Roche, каталожный номер 04 693 159001) с использованием Qiagen Tissuelyzer при 30 Гц в течение 5 мин и повторяли данный шаг до завершения гомогенизации. Лизат ткани в ripa разводили от 1 до 3 в связывающем буфере (1% BSA, 0,05% твин 20, 20 мМ Tris pH 7,5 в PBS). Лизаты тканей и сульфоконъюгированный Mandys 106 (0,2 мкг/мл) добавляли в предварительно покрытые 384-луночные планшеты и инкубировали при 40°С при встряхивании в течение ночи. Планшеты промывали PBS с 0,05% твина 20 и добавляли 40 мкл буфера Т для считывания MSD с поверхностно-активным веществом (каталожный номер R92TC-1). Затем планшеты считывали на машине MSD Sector 6000.MSD-ELISA - Protein expression was determined using an ELISA assay. 384-well multi-assay plates (Meso Scale Discovery, catalog number L21XB-4) were precoated with Manex 1011b monoclonal antibody at 2 μg/mL in bicarbonate buffer overnight. The plates were then blocked with blocking buffer (5% BSA in PBS) for 4 hours with shaking at room temperature. Tissue (~20 mg) was homogenized in ripa buffer at a concentration of 1 mg tissue/10 μl lysis buffer (Sigma, catalog number R0278) with protease inhibitor cocktail tablet (Roche, catalog number 04 693 159001) using a Qiagen Tissuelyzer at 30 Hz for 5 min and repeat this step until homogenization is complete. Tissue lysate in ripa was diluted 1 to 3 in binding buffer (1% BSA, 0.05% Tween 20, 20 mM Tris pH 7.5 in PBS). Tissue lysates and sulfo-conjugated Mandys 106 (0.2 μg/ml) were added to precoated 384-well plates and incubated at 40°C with shaking overnight. The plates were washed with PBS with 0.05% Tween 20 and 40 μl of MSD Reading Buffer T with surfactant (cat. no. R92TC-1) was added. The plates were then read on an MSD Sector 6000 machine.

Данные показали, что вводили достаточно вируса для достижения экспрессии (мРНК и белок) в > 90% поперечнополосатых мышечных клеток в возрасте 4 недель (фиг. 18). Креатинкиназа. - Уровень креатинкиназы (СК) как индикатора повреждения мышц измеряли в сыворотке с использованием имеющихся в продаже наборов. СК измеряли в возрасте 4 недель (через 2 недели после доставки). Кроме того, СК измеряли в возрасте 3 месяцев, то есть через 1 месяц после протокола травмы, вызванной сокращением (см. ниже). ****Р<0,001 однофакторного дисперсионного анализа с последующим тестом Тьюки, n=10 по сравнению с mdx4cv. Данные показали, что у мышей, получавших ВХА-196477 или ВХА-213788, уровни креатинкиназы и, следовательно, повреждение мышц были значительно снижены (фиг. 19). Функциональные исследования.The data showed that enough virus was administered to achieve expression (mRNA and protein) in >90% of striated muscle cells at 4 weeks of age (Fig. 18). Creatine kinase. - Creatine kinase (CK) levels as an indicator of muscle damage were measured in serum using commercially available kits. SC was measured at 4 weeks of age (2 weeks after delivery). In addition, SC was measured at 3 months of age, i.e., 1 month after the contraction injury protocol (see below). ****P<0.001 one-way ANOVA followed by Tukey's test, n=10 versus mdx 4cv . The data showed that in mice treated with BXA-196477 or BXA-213788, creatine kinase levels and therefore muscle damage were significantly reduced (Fig. 19). Functional studies.

Сократительные свойства передней болыпеберцовой (tibialis anterior (ТА)) мышцы тестировали с помощью установки in vivo (подставка, башмак, foot plate) в соответствии с инструкциями произвоThe contractile properties of the tibialis anterior (TA) muscle were tested using an in vivo setup (foot plate) according to the manufacturer's instructions.

- 112 -- 112 -

Claims (4)

дителя (Aurora Scientific). Вкратце, пик тетанического сокращения был достигнут на кривой силы на частоте 150 Гц (сила измеряется в крутящем моменте в ньютон-метрах). Пик тетанического сокращения был одинаковым у мышей дикого типа, мышей mdx4cv и мышей mdx4cv, получавших ВХА-196477 или ВХА213788. Однако мышечная масса ТА больше у мышей mdx4cv (****P <0,001 односторонний дисперсионный анализ с последующим тестом Тьюки, n=10), так что нормализация пиковой тетанической силы к массе ТА снижалась у мышей mdx4cv и оставалась на уровне мышей дикого типа у обработанных мышей (***P<0,001 по сравнению с mdx4cv; односторонний дисперсионный анализ с последующим тестом Тьюки, n=10) (фиг. 20).diator (Aurora Scientific). Briefly, the peak of tetanic contraction was reached in the force curve at 150 Hz (force measured in torque in newton meters). Peak tetanic contraction was similar in wild-type mice, mdx 4cv mice, and mdx 4cv mice treated with BXA-196477 or BXA213788. However, TA muscle mass is greater in mdx 4cv mice (****P < 0.001 one-way ANOVA followed by Tukey's test, n = 10), such that the normalization of peak tetanic force to TA mass decreased in mdx 4cv mice and remained at the level of wild-type mice type in treated mice (***P<0.001 vs. mdx 4cv ; one-way ANOVA followed by Tukey's test, n=10) (Fig. 20). Повреждение передней большеберцовой (ТА) мышцы измеряли с помощью прибора in vivo (подставка) в соответствии с инструкциями производителя (Aurora Scientific). Во время пика тетанического сокращения при частоте 150 Гц (максимальный изометрический крутящий момент) подставка поворачивалась от 90до 135° для напряжения мышц. Данное сокращение повторялось каждую минуту для 20 сокращений, как описано ранее (Khairallah et. al., 2012). Максимальный изометрический крутящий момент непосредственно перед напряжением мышц значительно уменьшался с каждым сокращением у мышей mdx4cv (P<0,0001 по сравнению с мышами дикого типа; двухсторонний дисперсионный анализ; n=9-10). Напротив, как ВХА-196477, так и ВХА-213788 предотвращали повреждение, вызванное сокращением, аналогично уровням дикого типа (****P<0,0001 ВХА-213788 и **Р<0,01 ВХА-196477 по сравнению с mdx4cv с последующим тестом Тьюки n=9-10). Данные показывают, что обе конструкции миниатюризированных дистрофинов защищают ТА-мышцы от повреждения, вызванного сокращением (фиг. 21).Tibialis anterior (TA) muscle damage was measured using an in vivo instrument (stand) according to the manufacturer's instructions (Aurora Scientific). During peak tetanic contraction at 150 Hz (maximum isometric torque), the stand was rotated from 90 to 135° to exert muscle tension. This contraction was repeated every minute for 20 contractions as previously described (Khairallah et. al., 2012). Maximum isometric torque immediately before muscle contraction decreased significantly with each contraction in mdx 4cv mice (P<0.0001 vs. wild-type; two-way ANOVA; n=9-10). In contrast, both BXA-196477 and BXA-213788 prevented contraction-induced injury similar to wild-type levels (****P<0.0001 BXA-213788 and **P<0.01 BXA-196477 versus mdx 4cv followed by Tukey's test n=9-10). Data show that both miniaturized dystrophin constructs protect TA muscles from contraction-induced damage (Figure 21). In vitro и in vivo экспрессия миниатюризированных дистрофиновых конструкций, описанных в приведенных в данном документе примерах, находилась под контролем промотора С5-12 (см. US 2004/0175727), из которого были удалены первые семь и последние тринадцать нуклеотидов. Используемый AAV был AAV9, где ITR были из AAV2.In vitro and in vivo expression of the miniaturized dystrophin constructs described in the examples herein was under the control of the C5-12 promoter (see US 2004/0175727), from which the first seven and last thirteen nucleotides were deleted. The AAV used was AAV9, where the ITRs were from AAV2. 6.6. Дополнительные исследования иммуногенности6.6. Additional immunogenicity studies Иммуногенность новых соединительных участков (см. табл. 12: SEQ ID NO: от 156 до 166; SEQ ID NO: 155 была исходной последовательностью), созданных между шарнирным 2 (Н2) доменом и R16 спектриновым повтором 16 (R16) в полипептиде ВХА-027741 миниатюризированного дистрофина тестировали с использованием инструмента для прогнозирования иммуногенности in silico. Было определено, что новый соединительный участок SEQ ID NO: 157 (см. фиг. 22) имеет минимальный иммуногенный риск на основании вышеупомянутого подхода in silico. Тестируемые последовательности соединительных участков пронумерованы следующим образом: SEQ ID NO: 155 (1), SEQ ID NO: 156 (2), SEQ ID NO: 157 (3), SEQ ID NO: 158 (4), SEQ ID NO: 159 (5), SEQ ID NO: 160 (6), SEQ ID NO: 161 (7), SEQ ID NO: 162 (8), SEQ ID NO: 163 (9), SEQ ID NO: 164 (10), SEQ ID NO: 165 (11), SEQ ID NO: 166 (12) (см. фиг. 22В). Иммуногенной потенциал вышеперечисленных соединительных участков конструкции ВХА027741 и варианты соединительных участков в ней были испытаны с использованием in vitro анализа пролиферации Т-клеток, как описано выше. Данные показывают, что соединительный участок J11v3 (SEQ ID NO: 157, № 3 на фиг. 22В) вызывал значительно меньшую пролиферацию CD8+ (фиг. 23А) и CD4+ Т-клеток (фиг. 23В) по сравнению с другими протестированными соединениями и поэтому является лучшим (фиг. 23). Полипептид ВХА-196477 миниатюризированного дистрофина был модифицирован, чтобы нести соединительный участок J11v3, последние три аминокислоты на С-конце были удалены и 3'UTR был укорочен, что дало полипептид ВХА-213780 (SEQ ID NO: 153) миниатюризированного дистрофина и нуклеотидную последовательность SEQ ID NO: 154.Immunogenicity of new junction regions (see Table 12: SEQ ID NO: 156 to 166; SEQ ID NO: 155 was the original sequence) created between the hinge 2 (H2) domain and R16 spectrin repeat 16 (R16) in the BXA- polypeptide 027741 miniaturized dystrophin was tested using an in silico immunogenicity prediction tool. The novel junction region of SEQ ID NO: 157 (see FIG. 22) was determined to have minimal immunogenic risk based on the above in silico approach. The junction sequences tested are numbered as follows: SEQ ID NO: 155 (1), SEQ ID NO: 156 (2), SEQ ID NO: 157 (3), SEQ ID NO: 158 (4), SEQ ID NO: 159 ( 5), SEQ ID NO: 160 (6), SEQ ID NO: 161 (7), SEQ ID NO: 162 (8), SEQ ID NO: 163 (9), SEQ ID NO: 164 (10), SEQ ID NO: 165 (11), SEQ ID NO: 166 (12) (See FIG. 22B). The immunogenic potential of the above junctions of construct BXA027741 and variant junctions therein were tested using an in vitro T cell proliferation assay as described above. The data show that the junction region J11v3 (SEQ ID NO: 157, No. 3 in Fig. 22B) caused significantly less proliferation of CD8+ (Fig. 23A) and CD4+ T cells (Fig. 23B) compared to other compounds tested and is therefore the best (Fig. 23). The miniaturized dystrophin polypeptide BXA-196477 was modified to carry the J11v3 junction, the last three amino acids at the C-terminus were removed and the 3'UTR was truncated, resulting in the miniaturized dystrophin polypeptide BXA-213780 (SEQ ID NO: 153) and the nucleotide sequence SEQ ID NO: 154. ФОРМУЛА ИЗОБРЕТЕНИЯCLAIM 1. Молекула нуклеиновой кислоты, содержащая нуклеотидную последовательность, которая кодирует полипептид миниатюризированного дистрофина, содержащий, от N-конца до С-конца, шарнирный 1 (H1) домен, домен спектринового повтора 1 (R1), домен спектринового повтора 3 (R3), шарнирный 2 (Н2) домен, домен спектринового повтора 16 (R16), домен спектринового повтора 17 (R17), домен спектринового повтора 24 (R24) и шарнирный 4 (Н4) домен дистрофина, где полипептид миниатюризированного дистрофина не содержит спектриновый повтор 2 дистрофина, где домен R1 и домен R3 слиты посредством аминокислот ARG-VAL (RV), и где домен Н2 и домен R16 слиты посредством аминокислотной последовательности, приведенной в SEQ ID NO: 74-75, и где (i) домен H1 и домен R1 слиты непосредственно, (ii) домен R3 и домен Н2 слиты непосредственно, (iii) домены R16 и R17 слиты непосредственно, (iv) домены R17 и R24 слиты непосредственно или (v) домены R24 и Н4 слиты непосредственно.1. A nucleic acid molecule containing a nucleotide sequence that encodes a miniaturized dystrophin polypeptide containing, from N-terminus to C-terminus, hinge 1 (H1) domain, spectrin repeat domain 1 (R1), spectrin repeat domain 3 (R3), hinge 2 (H2) domain, spectrin repeat 16 (R16) domain, spectrin repeat 17 (R17) domain, spectrin repeat 24 (R24) domain, and dystrophin hinge 4 (H4) domain, wherein the miniaturized dystrophin polypeptide does not contain dystrophin spectrin repeat 2, wherein the R1 domain and the R3 domain are fused through ARG-VAL (RV) amino acids, and where the H2 domain and the R16 domain are fused through the amino acid sequence set forth in SEQ ID NO: 74-75, and where (i) the H1 domain and the R1 domain are directly fused , (ii) the R3 domain and the H2 domain are directly fused, (iii) the R16 and R17 domains are directly fused, (iv) the R17 and R24 domains are directly fused, or (v) the R24 and H4 domains are directly fused. 2. Молекула нуклеиновой кислоты по п.1, где полипептид миниатюризированного дистрофина дополнительно содержит домен ABD1 и/или домен CR.2. The nucleic acid molecule according to claim 1, wherein the miniaturized dystrophin polypeptide further comprises an ABD1 domain and/or a CR domain. 3. Молекула нуклеиновой кислоты по п.1 или 2, где полипептид миниатюризированного дистрофина состоит из, от N-конца до С-конца, домена ABD1, домена H1, домена R1, аминокислот RV, домена R3, домена Н2, аминокислотной последовательности, приведенной в SEQ ID NO: 74-75, домена R16, домена R17, домена R24, домена Н4 и домена CR дистрофина.3. The nucleic acid molecule according to claim 1 or 2, wherein the miniaturized dystrophin polypeptide consists of, from the N-terminus to the C-terminus, an ABD1 domain, an H1 domain, an R1 domain, RV amino acids, an R3 domain, an H2 domain, the amino acid sequence given in SEQ ID NO: 74-75, R16 domain, R17 domain, R24 domain, H4 domain and CR domain of dystrophin. 4. Молекула нуклеиновой кислоты по любому из пп.1-3, где полипептид миниатюризированного 4. Nucleic acid molecule according to any one of claims 1-3, where the polypeptide is miniaturized - 113 -- 113 -
EA202191123 2018-10-24 2019-10-24 MINIATURIZED DYSTROPHINS AND THEIR APPLICATIONS EA046419B1 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US62/749,982 2018-10-24

Publications (1)

Publication Number Publication Date
EA046419B1 true EA046419B1 (en) 2024-03-13

Family

ID=

Similar Documents

Publication Publication Date Title
EP3717636B1 (en) Adeno-associated virus variant capsids and use for inhibiting angiogenesis
US20210403947A1 (en) Miniaturized dystrophins and uses thereof
US11072803B2 (en) Hybrid dual recombinant AAV vector systems for gene therapy
JP2022549380A (en) Adeno-associated virus (AAV) system for the treatment of hereditary deafness
US20240091383A1 (en) Synergistic effect of smn1 and mir-23a in treating spinal muscular atrophy
AU2021337530B2 (en) Codon Optimized RPGRorf 15 Genes And Uses Thereof
US20230407331A1 (en) Miniaturized dystrophins having spectrin fusion domains and uses thereof
CA3181288A1 (en) Codon-optimized nucleic acid encoding smn1 protein
EA046419B1 (en) MINIATURIZED DYSTROPHINS AND THEIR APPLICATIONS
JP2005507927A (en) Methods and compositions for treating Parkinson&#39;s disease
OA21075A (en) Codon-optimized nucleic acid that encodes SMN1 protein, and use thereof
OA21365A (en) Synergistic effect of SMN1 and MIR-23A in treating spinal muscular atrophy.
EA045749B1 (en) CODON-OPTIMIZED NUCLEIC ACID ENCODING THE SMN1 PROTEIN AND ITS APPLICATION
US20160237141A1 (en) Methods of treating alzheimer&#39;s disease with apo a-1 milano